Вы находитесь на странице: 1из 1254

arXiv:1010.0824v8 [math.

CA] 25 Aug 2021

МАТЕМАТИЧЕСКИЙ АНАЛИЗ
без пробелов

С.С.Акбаров

26 августа 2021 г.
2
i

Если задаться целью проследить, во что превратятся курсы математики, читаемые на техни-
ческих факультетах нынешних университетов, при условии, что изложение в них будет вестись на
современном уровне строгости, с нуля и без пробелов, то можно быть уверенным, что большинству
преподавателей и студентов открывшаяся картина покажется неожиданной. Главным сюрпризом
наверняка будет то, что такое изложение вообще возможно. Вторым по неожиданности — его де-
тали. И третьим — что такая подача материала будет все же доступна для понимания. Настоящий
учебник — попытка такой систематизации. Автор строит курс математики, включающий в себя
основные факты математического анализа и лежащих в его основе дисциплин — математической
логики и линейной алгебры — с расчетом на формально нулевую подготовку читателя. Последнее,
разумеется, не означает обещания, что изложение будет понятно первокласснику, но подразумевает
возможность для человека, способного абстрагироваться от части своих знаний, проверить детали
внушаемого ему со школы убеждения, что математика — строгая наука, где все аккуратно выстра-
ивается чисто логическими средствами, без ссылок на интуицию, причем сами логические средства
также ясно формализуются и никак не связаны с человеческой биологией.
Предисловие

Эта книга представляет собой учебник по математическому анализу и тем областям математики,
на которые он опирается: математической логике и линейной алгебре (в объеме, с точностью до
некоторых отклонений по ходу изложения, необходимом для доказательства утверждений мате-
матического анализа). Идея, руководившая автором при ее создании, состояла в том, чтобы дать
возможность студентам и преподавателям проследить цепочки рассуждений, ведущие от самых
элементарных понятий теории множеств к главным результатам университетской математики. При
этом первостепенными требованиями к этим цепочкам выставлялись их ясность и непрерывность,
и, поскольку по опыту автора, это требует объяснения, настоящее Предисловие предназначено глав-
ным образом для него.

Что не так? Если задуматься, что теоретически может мешать человеку понимать предмет, из-
ложенный в учебнике, то в голову придут два главных возможных препятствия:
1) Темные места. Плохо объясненные, плохо проработанные, неоправданно сложные, непо-
нятные, запутанные детали в каких-то частях изложения, — причем таковыми могут быть
даже целые темы, — понятно, составляют проблему.
2) Пробелы. Они бывают двух типов: пробелы со ссылками и пробелы без ссылок.
a) Первые отсылают читателя за подробностями к другим источникам, и, хотя в
таких случаях считается, что человек сам может восстановить недостающие де-
тали, надо понимать, что это далеко не всегда бывает легко. Негарантированная
доступность источника, рассогласованность в терминологии и обозначениях, в
стиле, необязательно внятное освещение этой темы в самом источнике, всегда
представляют дополнительные сложности, иногда небольшие, но часто очень
существенные, вплоть до непреодолимых.
b) Помимо пробелов со ссылками бывают еще пробелы без ссылок. Это происходит,
когда какие-то вещи автору текста кажутся очевидными, или общеизвестными,
или незаслуживающими детального обсуждения. Во всех случаях это может
быть причиной непонимания или вовсе отторжения материала.
В математическом анализе эти трудности представлены полным списком. Вот, в частности, из-
вестные автору темные места и пробелы без ссылок (пробелы со ссылками мы перечислим чуть
ниже, на странице v).
1. Элементарные функции. Почти во всех учебниках они вводятся “описательно”, без строгих
определений. Если бы так было везде, это был бы пробел без ссылок, однако автору известна одна
книга, а именно, учебник Г. Грауэрта, И. Либа и В. Фишера [3], где экспонента, логарифм, степень и
тригонометрические функции определены аккуратно [3, Глава VI, § 4]. Можно было бы поэтому не
видеть здесь проблемы, но неприятность в том, что в [3] определения элементарных функций даются
только после темы “Разложение Тейлора”. Естественно, это делает их формально непригодными в
предыдущих темах, то есть, фактически во всем первом семестре изучения матанализа. Поскольку
в матанализе элементарные функции принято использовать сразу, проблема остается, и ее можно
классифицировать как темное место.
2. Кривые и поверхности. Эта тема выглядит недоработанным введением в геометрическую тео-
рию меры, в котором, вопреки ожиданиям зрителя, создатели не захотели или не смогли избавиться
от параметризации. То есть, например, кривая в Rn определяется не как множество в Rn , а как
отображение
γ : [a, b] → Rn
с подходящими свойствами (гладкость, липшицевость, спрямляемость, на вкус автора). Все после-
дующие конструкции — длина (или площадь, в случае с поверхностями), интегралы двух типов и

ii
iii

подобное — производят впечатление (как и положено им быть) величин, не зависящих от парамет-


ризации, но как это формализуется, то есть как следует определить класс кривых (поверхностей),
чтобы независимость от параметризации (с естественно вытекающими следствиями) можно было
аккуратно доказать, — остается непонятно. Это влечет за собой другие проблемы: неразработан-
ность аппарата теории, странную узость класса рассматриваемых примеров, а при попытках его
расширить — фантастическую дремучесть определений, формулировок и доказательств. В отличие
от предыдущего примера, это можно считать пробелом без ссылок, потому что ни в каких учебниках
эти детали не проясняются.
3. Calculus (Исчисление). К этой теме также логично относиться как к пробелу без ссылок, однако
здесь объяснение должно быть более подробным. Рассмотрим следующий пример. Представим, что
нам захотелось сосчитать производную функции1

h(x) = sin(x2 ).

Если использовать стандартное определение производной через предел2 ,

h(z) − h(x)
h(x) = lim , (1)
z→x z−x
то для этого нам необходимо будет ввести две вспомогательные функции

g(y) = sin y, f (x) = x2 ,

после чего по известной формуле производной композиции функций3 мы получим:

h′ (x) = (g ◦ f )′ (x) = g ′ (f (x)) · f ′ (x) = cos(x2 ) · 2x.

Этот способ намного менее удобен (особенно когда функция устроена сложно, с большим числом
композиций и/или алгебраических операций), чем школьный, в виде цепочки преобразований, ко-
торая в данном случае принимает вид
 ′  ′

sin(x2 ) = sin y 2 = (sin y)′ 2 · (x2 )′ = cos y 2 · 2x = cos x2 · 2x
y=x y=x y=x

(здесь штрих ′ означает взятие производной по единственной свободной переменной в скобках, а


запись y = x2 в качестве индекса у вертикальной черты, означает подстановку; удобство такой
записи в том, что в ней нет необходимости вводить обозначения для промежуточных функций, f
и g). Чтобы этот “школьный способ” здесь работал, нужны следующие “школьные тождества для
производной”:
(sin y)′ = cos y, (x2 )′ = 2x. (2)
Проблема в том, что они не могут считаться частными случаями формулы (1): в (1) x является
свободной переменной, то есть вместо нее можно подставлять разные значения, и формула все равно
будет верна. Например, можно подставить вместо x символ 1, и мы получим верное равенство

h(z) − h(1)
h(1) = lim .
z→1 z−1
Если же то же самое проделать с формулами (2), подставив, например, y = 1 и x = 1 (что есте-
ственно, когда считаешь значение производной функции h(x) = sin(x2 ) в точке 1), то мы получим
формально ложные равенства:

(sin 1)′ = cos 1, (12 )′ = 2 · 1.

(потому что производная от константы должна быть нулевой). Это означает, что если мы хотим
сохранить школьные приемы вычисления производной, мы должны помимо (1) иметь другое опре-
деление производной, предназначенное специально для вычислений.
Естественный способ приписать точный смысл тождествам (2) — относиться к операции взятия
производной в них как к формальной операции τ 7→ τ ′ на термах подходящей теории 1 порядка4 .
1 Ниже это упражнение приведено как пример 6.1.27.
2В тексте формула (6.1.4).
3 Ниже формула (6.1.56).
4 Понятие теории 1 порядка, или формальной теории, описывается ниже в тексте на с.105.
iv

Если представлять Calculus как такую теорию, то его сигнатуру логично было бы считать состоящей
из констант
0, 1, e, π
(e – число Непера, π – число Архимеда), одноместных функциональных символов

sin, cos, arctg, arcctg,

двуместных функциональных символов


+, ·,
а также, для функций, определенных не везде, двуместных и трехместных предикатных символов,
формализующих схемы высказываний
x
tg x = y, ctg x = y, arcsin x = y, arccos x = y, = z, xy = z, logx y = z.
y

В такой теории производную и интеграл можно было бы определять как операции на термах (или
как подходящие преобразования формул5 ), а возникающие конструкции на множестве R веществен-
ных чисел были бы просто моделью6 Calculus, как теории 1 порядка. Поскольку решение школьных
уравнений и неравенств также представляет собой систему операций над выражениями, постро-
енными из тех же символов, эту часть математики также можно было бы считать компонентой
Calculus.
Но Calculus как теория 1 порядка к настоящему времени не разработан7. Со времен Коши и
Вейерштрасса, когда, как считается, в Анализе был наведен порядок, эта тема так и осталась белым
пятном, и как следствие, традиционно объясняется путано, ссылок на специальные дисциплины не
имеет, а времени на обучение требует пропорционально своей непроходимости: последние несколько
лет школы и первые годы университета.

Делить или объединять? Примеры предыдущего пункта призваны проиллюстировать тезис,


что университетской математике есть куда развиваться. Следующий вопрос можно поставить так:
нужно ли ей продолжать дробиться на все более мелкие дисциплины, или наоборот искать воз-
можности для их объединения?
Автору очевидно, что приоритетом здесь должно быть второе. Понятно, что учебный процесс
ограничен во времени, и если пытаться расположить дисциплины в виде дерева с идеей исключить
ссылки на непройденные темы, это удлиннит обучение так, что в традиционные (для большинства
учебных заведений) сроки, вполне вероятно, уложиться будет невозможно. Но, во-первых, эта про-
блема не кажется непреодолимой: при подходящей перестройке курсов можно добиться хотя бы,
чтобы линейные участки этого дерева излагались параллельно, и если курс A содержит ссылку на
курс B, но ко времени экзамена по A курс B будет пройден, это выглядит приемлемым компромис-
сом.
А, во-вторых, на уровне учебников эта проблема ведь исчезает. Ничто не мешает человеку от-
крывать одну и ту же книгу в разных местах, когда это ему понадобится. При этом общая картина
будет у него всегда перед глазами.
Помимо возможности поглядеть на науку сверху, плюс такой интеграции состоит в том, что она
структурирует знание, давая возможность человеку оценить важность тех или иных тем. Следя
за ссылками читатель может понять, что из предыдущего материала важно для данной темы, а без
чего можно обойтись. При дроблении эта опция исчезает.

С чего начать и где остановиться? Автор счел разумным (и возможным, правда, с точностью
до проблем, описываемых ниже на с.vii) изложить основные факты математического анализа с
элиминацией темных мест и пробелов, причем не только пробелов без ссылок, но и со ссылками.
Последнее условие в этой программе понимается максимально широко: изложение ведется прямо от
оснований математики, что позволяет сделать его полностью независимым от других источников (в
частности, избавиться в теоретическом материале от традиционных ссылок на так называемую “базу
школьных знаний”, которыми всегда злоупотребляют в учебниках по университетской математике).
Для перечисленных выше трех трудных мест в тексте предложены следующие решения.
5 См.формулы на с.383 и 459.
6 Понятие модели теории 1 порядка определяется на с.135.
7 Очевидно, из-за проблемы с определением равенства термов, о которой мы говорим ниже на с.351.
v

1. Элементарные функции: здесь проблема решается введением двух избыточных аксиом (по-
дробности на с.327). В нашем учебнике эта тема описывается в главе 5, после темы “Пределы”.
Такое расположение материала связано с тем, что при доказательстве свойств элементарных функ-
ций, в частности, тождеств, приходится активно использовать классические теоремы о непрерыв-
ных функциях (а именно, теорему Коши о промежуточном значении 4.3.22 и теорему об обратной
функции 4.3.34), которые, как следствие, к этому моменту желательно иметь в своем распоряже-
нии. Однако если формальная сторона дела не стоит в приоритете, ничто не мешает на занятиях
описать аксиомы степеней и тригонометрии сразу в теме “числовые функции”, перечислив глав-
ные следствия из них без доказательств (или пообещав доказать это позже). Тогда пользоваться
элементарными функциями можно будет с первых занятий.
2. Кривые и поверхности: здесь предложенное решение состоит в том, чтобы ввести класс глад-
ких отображений на измеримых по Жордану компактах, которые характеризуются инъективностью
почти всюду и невырожденностью почти всюду дифференциала (в тексте такие отображения назы-
ваются полурегулярными, см. определение на с.1034). Это позволяет доказать теорему о существо-
вании (подходящим образом понимаемой) функции перехода от одной параметризации к другой
(теорема 16.3.17), что в свою очередь дает решение упомянутой выше проблемы независимости
нужных конструкций от параметризации.
3. Calculus: здесь автор должен признаться, что не смог (пока) найти идею, позволяющую эле-
гантно обойти упомянутые выше трудности. Последовательно разрабатывать Calculus, как теорию 1
порядка, — задача, по-видимому, слишком громоздкая (см. подробности на с.351), а можно ли (с со-
блюдением строгости) описать эту теорию проще — автору неизвестно. В тексте Дифференциальное
исчисление описывается как язык 1 порядка с набором функциональных символов, включающим
обозначения всех элементарных функций (в том числе функций, определенных не везде на R)8 с
дополнительной операцией взятия частной производной над термами. Обсуждение этой темы мы
начинаем со страницы 351, а детали решения приводим на страницах 382 (для функций одной пе-
ременной) и на с.893 (для функций нескольких переменных). Интегральное исчисление, наоборот,
описывается как конструкция внутри Анализа на с.458, без выхода в теорию формальных языков,
потому что неопределенный интеграл удобнее считать операцией на классах функций со значения-
ми в классах функций (а не на классе термов со значениями в классе термов, где он будет не везде
определен).
В соответствии с общей философской установкой, в текст включены также темы, которые по
описанной выше классификации можно считать пробелами со ссылками. Вот их список в сторону
удлинения цепочки связей с матанализом:
4. Линейная алгебра. Многомерный вещественный анализ базируется на линейной алгебре9 , по-
этому если задаваться целью ликвидировать не только пробелы без ссылок, но и со ссылками, то
соответствующий материал из линейной алгебры в такой текст нужно включать. Мы это делаем в
главе 13.
5. Комбинаторика. Линейная алгебра в свою очередь использует результаты комбинаторики10 .
Этот материал мы излагаем в начале главы 13.
6. Теория вещественного числа. Вещественный анализ и линейная алгебра, строятся как дефи-
нициальные расширения теории вещественных чисел. Мы излагаем эту теорию в главе 3.
7. Теория множеств и логика. Теория вещественных чисел в свою очередь представляет собой
дефинициальное расширение аксиоматической теории множеств. Мы описываем ее в главе 0, а в
главе 2 мы приводим материал из математической логики, необходимый для понимания логической
структуры всего курса (в частности, определение самого дефинициального расширения дается на
с.121).
О логике нужно сказать несколько слов отдельно, поскольку ее можно считать одновременно и
пробелом со ссылками, и темным местом, и, при определенном уровне требовательности, пробелом
без ссылок. Речь идет вот о чем. После знаменитого кризиса начала 20 века эта наука пришла к со-
стоянию, когда ее описание удобнее всего представлять как некую игру с символами. И, хотя в этом
8 То есть, помимо алгебраических операций, включающих деление и возведение в степень, в этой сигнатуре функ-

циональными символами считаются также

sin, cos, tg, ctg, arcsin, arccos, arctg, arcctg, log .

9 В качестве иллюстрации можно привести, например, теорему о локальном экстремуме 15.1.81, или теоремы

Лагранжа 15.3.24 и 15.3.25, или теорему об искажении меры при линейном преобразовании 16.1.34, и другие, где
содержатся ссылки на действия с матрицами и полилинейными формами на конечномерном вещественном векторном
пространстве.
10 Например, в конструкции определителя.
vi

и заключался главный итог исследований первой половины 20 века в этой области, — превращение
всей математики в игру с символами, — правила этой игры и главные ее результаты объясняются
на сегодняшний день очень плохо. Неспециалиста эти объяснения поражают своей сложностью и
требуют от него усилий, несоразмерных с целями ознакомления с предметом.
Автору очевидно, что причиной здесь является утвердившийся среди логиков после работ Гёделя
язык платоновских идей, проявляющийся в традиции использовать понятия множества и функции
вне их аксиоматического описания, а понятия истинности и ложности вне их связи с выводимо-
стью из аксиом теории множеств. На самом элементарном уровне понимания предмета это видно
в том, что в современной логике понятия множества и функции используются до того, как тео-
рия множеств построена как формальная теория11 . Это приводит к странной неоднозначности в
понимании этих терминов: с одной стороны, они используются как термины формальной теории,
но одновременно (и очень часто, почти всегда, невозможно уловить разницу) как просто слова в
повседневной речи, значение которых не требует уточнений (но тем не менее выводы, к которым
приводит их употребление, остаются на удивление глубокими и неочевидными12 ).
Человек с улицы (даже математик, но не специалист в этой области) понять эту игру намеков,
конечно, не в состоянии, и остается удивляться, как получилось, что до сих пор никто не пытался
навести в этой области “линейный порядок” (принятый во всей остальной математике). То есть
такое положение дел, при котором ссылки на конструкции, не описанные формально на момент
использования, считаются недопустимыми.
В первой части нашего учебника, посвященной основаниям математики (главы 0—2) мы по-
стараемся исправить это недоразумение и даем “линейное” изложение главных результатов этой
науки. Неспециалисту это прояснит картину, а специалисту позволит взглянуть на нее по-новому
(что всегда полезно). Автор, помимо прочего, считает, что такой “линейный” способ объяснять этот
материал представляет собой естественное развитие гильбертовской философии формализма (ко-
торой только обстоятельства помешали превратиться в описываемую здесь систему).
С теорией множеств и логикой мы доходим до основ, дальше которых уже ничего нет, и у нас
получается курс университетской математики с нуля.
Объем охвата тем 4-7 в этом списке диктуется потребностями математического анализа, но
иногда, когда затрагиваемый круг вопросов важен для математики в целом, как, например, в случае
с рангом множества (см. определение на с.74), мы отступаем от этого правила и даем немного
больше информации.

Структура учебника. В тексте доказываются все формулируемые утверждения, за исключени-


ем
1) совсем элементарных, доказательство которых проводится по аналогии с соседними утвер-
ждениями (и которые поэтому иногда оформляются в виде упражнений, как, например,
свойства чисел в упражнении 3.1.12),
2) нескольких фактов общематематического значения (таких, как парадокс Банаха-Тарского13),
приводимых в тексте только для прояснения мотивировок, и никак не проявляющих себя
в логической структуре курса.
3) двух технических результатов Геделя о теориях с нумерацией (теоремы 2.2.11 и 2.2.12) и
теоремы 2.2.21 Геделя о непротиворечивости в форме Россера,
4) теоремы 19.2.30 об ацикличных областях в конце книги14 .
По способу подачи материал делится на основной, излагаемый текстом в одну колонку, и иллю-
стративный, представленный двумя колонками. Разница между тем и другим состоит в том, что
основной материал задуман, как логически последовательное изложение основных утверждений
теории, в котором, в частности, не допускаются ссылки на утверждения, не доказанные на момент
цитирования.
В иллюстративном материале, наоборот, приоритетом считается обеспечение читателя достаточ-
ным количеством примеров и упражнений для скорейшего привыкания к используемым в основном
11 См., например, упомянутые в списке литературы учебники Э. Мендельсона [8] и Дж. Шенфилда [17] по матема-

тической логике.
12 Такова, например, теорема Гёделя о полноте, формулируемая ниже в виде двух теорем 2.3.6 и 2.3.18 (отдельно

для теорий с конечной и бесконечной системой аксиом).


13 Теорема 16.1.11.
14 Мотивы, по которым результаты пунктов 3) и 4) в этом списке приводятся без доказательств или с неполнями

доказательствами мы объясняем ниже на с.vii.


vii

тексте понятиям и приемам, и, как следствие, уровень логической строгости здесь снижается. Одна-
ко, не намного, а только до той планки, на которой некоторые понятия позволяется упоминать суще-
ственно раньше, чем они будут формально определены (например, понятие длины кривой впервые
упоминается на с.527, хотя определяется только на с.1076), а некоторым утверждениям позволяется
быть сформулированными задолго до того, как они будут аккуратно доказаны в тексте (таковы,
например, формулы для простейших геометрических величин в главе 8 – площади правильной об-
ласти на плоскости, объема тела вращения и т.п. – которые мы по традиции приводим раньше, чем
эти величины формально будут определены, и как следствие, доказательство этих формул перено-
сится на несколько глав вперед). При таком подходе, в частности, все, что связано с Исчислением,
включая определения элементарных (/стандартных) функций, описание формальных операций над
ними и доказательство связи этих операций с дифференцированием и интегрированием, попадает
в двухколоночный текст, поскольку идеологически превращается в иллюстративный материал.
При работе над текстом автор использовал многие идеи доказательств, а также некоторые за-
дачи и упражнения из учебников и пособий, выходивших в разные годы в России. Эти руководства
приведены в списке литературы на странице viii.

Остающиеся пробелы и темное место. В предлагаемом варианте текста все еще остаются
несколько пробелов (со ссылками) и одно темное место. Пробелами (мы уже упоминали их на с.vi)
являются
— несколько утверждений главы 2 о логике а именно, два технических результата Геделя о
теориях с нумерацией (теоремы 2.2.11 и 2.2.12) и теорема 2.2.21 Геделя о непротиворечи-
вости в форме Россера, а также
— теорема 19.2.30 об ацикличных областях в главе 19 про Гаусса и Стокса.
Результаты Геделя мы приводим без доказательства из-за громоздскости традиционных рас-
суждений в этой части логики. Поскольку эта область (рекурсивные функции и их применение)
формально не связана с математическим анализом, мы считаем разумным оставить этот блок ин-
формации читателю для самостоятельно изучения. Что касается теоремы об ацикличных областях,
мы приводим ее как иллюстрацию к теоремам Гаусса и Стокса, и доказываем лишь частично, потому
что аккуратное доказательство требует отдельного (и не входящего в наши планы) повествования
о теории гомологий.
Наконец, темным местом остается Calculus. Как уже говорил автор, найти идею, позволяющую
изложить этот материал одновременно строго и просто, ему не удалось. Предлагаемое решение15
можно считать строгим, но простым его не назовешь. В руководствах по матанализу эта тема тради-
ционно замалчивается именно про причине отмечаемых здесь трудностей, однако автора удержива-
ет от искушения пойти по этому пути соображение, что где-то все-таки эта методичесская проблема
должна быть обозначена. Естественно, автор будет благодарен читателям за любые предложения
и ссылки, которые могли бы помочь упростить этот материал.

Благодарности. Автор выражает благодарность коллегам за консультации: С. А. Абрамову,


Л. Д. Беклемишеву, В. А. Душскому, Н. М. Зобину, С. В. Иванову, Д. П. Скворцову, С. В. Со-
ловьеву, А. Г. Федотову, Д. С. Шамканову, Н. Швеберу. Автор благодарит также своих друзей за
моральную поддержку в этом проекте: Ю. Л. Беккера и А. С. Касюкова.

15 В учебнике этот материал разбросан по нескольким главам, в качестве ссылок удобно указать страницы 351, 382,

446 и 893.
Литература

[1] Г. И. Архипов, В. А. Садовничий, В. Н. Чубариков. Лекции по математическому анализу, М.:


Высшая школа, 1999.
[2] Э. Б. Винберг. Курс алгебры. М.: Факториал-пресс, 2001.
[3] Г. Грауэрт, И. Либ, В. Фишер. Дифференциальное и интегральное исчисление. М.: Мир, 1971.
[4] В. А. Зорич. Математический анализ, М.: Фазис, Т.1-2, 1997.
[5] Дж. Л. Келли. Общая топология, М.: Наука, 1981.
[6] Л. Д. Кудрявцев. Курс математического анализа, М.: Высшая школа, Т.1-2, 1981, Т.3, 1989.
[7] Л. Д. Кудрявцев, А. Д. Кутасов, В. И. Чехлов, М. И. Шабунин. Сборник задач по математи-
ческому анализу, М.: Физматлит, Т.1-3, 2003.
[8] Э. Мендельсон. Введение в математическую логику, М.: Наука, 1984.
[9] Л. С. Понтрягин. Основы комбинаторной топологии. М.: URSS, 2019.
[10] В.В. Прасолов. Элементы теории гомологий. М.: МЦНМО, 2006.
[11] У. Рудин. Основы математического анализа. М.: Мир, 1976.
[12] М. Спивак. Математический анализ на многообразиях. М.: Мир, 1968.
[13] Г. Такеути. Теория доказательств. М.: Мир, 1978.
[14] Е. Титчмарш. Теория функций. М.: Наука, 1980.
[15] Х. Уитни. Геометрическая теория интегрирования. М.: ИЛ, 1960.
[16] Ф. Уорнер. Основы теории гладких многообразий и групп Ли. М.: Мир, 1987.
[17] Дж. Шенфилд. Математическая логика. М.: Наука, 1975.

viii
Оглавление

Предисловие ii
Что не так? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
Делить или объединять? . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
С чего начать и где остановиться? . . . . . . . . . . . . . . . . . . . . . . iv
Структура учебника. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Остающиеся пробелы и темное место. . . . . . . . . . . . . . . . . . . . . vii
Благодарности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii

I ОСНОВАНИЯ МАТЕМАТИКИ 1
0 ТЕОРИЯ МНОЖЕСТВ 2
§ 1 Наивная теория множеств . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
(a) Формулы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Элементарные высказывания. . . . . . . . . . . . . . . . . . . . . . . . . . 2
Логические операции и кванторы. . . . . . . . . . . . . . . . . . . . . . . 3
Высказывания (формулы). . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Сокращения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Подстановка. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
(b) Аксиомы, теоремы и антиномии. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Аксиомы наивной теории множеств. . . . . . . . . . . . . . . . . . . . . . 4
Обозначение {X : ϕ}. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Теоремы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Антиномия Рассела. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Программа Гильберта. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
§ 2 Логика предикатов для теории множеств . . . . . . . . . . . . . . . . . . . . . . . . . . 7
(a) Язык теории множеств . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Сигнатура теории множеств. . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Формулы теории множеств. . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Квантор ∃! существования и единственности. . . . . . . . . . . . . . . . . 9
(b) Логика предикатов в аксиоматизации Генцена . . . . . . . . . . . . . . . . . . . 9
Секвенции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Аксиома и правила вывода в LK. . . . . . . . . . . . . . . . . . . . . . . . 11
Дерево Генцена и выводимость секвенций в LK. . . . . . . . . . . . . . . 12
Отношение выводимости между секвенциями. . . . . . . . . . . . . . . . 18
Почему антецедент можно понимать как конъюнкцию, а сукцедент как
дизъюнкцию входящих в них формул. . . . . . . . . . . . . . . 18
Выводимые формулы в LK. . . . . . . . . . . . . . . . . . . . . . . . . . . 21
(c) Отношения между формулами в LK . . . . . . . . . . . . . . . . . . . . . . . . . 22
Отношение следования между формулами. . . . . . . . . . . . . . . . . . 22
Отношение выводимости между формулами в LK. . . . . . . . . . . . . . 23
§ 3 Теория множеств Морса-Келли . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
(a) Аксиомы равенства, невырожденности, объемности и выделения . . . . . . . . 27
Аксиомы равенства. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Аксиома невырожденности. . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Аксиома объемности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Схема аксиом выделения. . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

ix
x Оглавление

(b) Аксиомы подмножеств, объединения и регулярности . . . . . . . . . . . . . . . 30


Отношение включения ⊆ и аксиома подмножеств. . . . . . . . . . . . . . 30
Экспонента 2X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Объединение и пересечение двух классов. Аксиома попарного объедине-
ния. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Объединение и пересечение элементов класса. Аксиома поэлементного
объединения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Дополнение и разность. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Аксиома регулярности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
(c) Отношения, отображения и аксиома подстановки . . . . . . . . . . . . . . . . . 36
Одночленные классы и пары. . . . . . . . . . . . . . . . . . . . . . . . . . 36
Декартово произведение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Отношения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Отображения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Схема аксиом подстановки. . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Ограничение и продолжение отображения. . . . . . . . . . . . . . . . . . 43
Отношение эквивалентности. . . . . . . . . . . . . . . . . . . . . . . . . . 43
(d) Определения по индукции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Наполненные классы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Теоремы об определении по индукции. . . . . . . . . . . . . . . . . . . . . 45
(e) Ординалы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Отношение полного порядка. . . . . . . . . . . . . . . . . . . . . . . . . . 48
Определение и свойства ординалов. . . . . . . . . . . . . . . . . . . . . . . 49
Класс Ord порядковых чисел. . . . . . . . . . . . . . . . . . . . . . . . . . 53
Операция X 7→ S(X). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Изолированные и предельные ординалы. . . . . . . . . . . . . . . . . . . 57
Определения по индукции на ординалах. . . . . . . . . . . . . . . . . . . 57
Доказательства по индукции. . . . . . . . . . . . . . . . . . . . . . . . . . 59
Натуральные числа и аксиома бесконечности. . . . . . . . . . . . . . . . 60
Операция наполнения X 7→ fill X. . . . . . . . . . . . . . . . . . . . . . . 62
(f) Кардиналы и аксиома выбора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Аксиома выбора. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Кардинальные числа. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Биекции Ord ≃ Card и Ord ≃ Card \N. . . . . . . . . . . . . . . . . . . . . . 68
Конечные и бесконечные множества. . . . . . . . . . . . . . . . . . . . . . 69
Последовательности и их декартовы произведения. . . . . . . . . . . . . 73
(g) Ранг множества, полное упорядочение Set и теорема о выборе . . . . . . . . . 74
Ранг множества. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Кумулятивная иерархия. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Полное упорядочение Set. . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Теорема о выборе. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

1 ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ 81


§ 1 Явные конструкции числовых множеств . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
(a) Натуральные числа N. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Отношение порядка и алгебраические операции в N. . . . . . . . . . . . . 81
Связь с конечными множествами. . . . . . . . . . . . . . . . . . . . . . . . 85
(b) Целые числа Z. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Отношение порядка и алгебраические операции в Z. . . . . . . . . . . . . 87
Вложение N в Z. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
(c) Рациональные числа Q. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Отношение порядка и алгебраические операции в Q. . . . . . . . . . . . 89
Вложение Z в Q. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
(d) Вещественные числа R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Отношение порядка и алгебраические операции в R. . . . . . . . . . . . . 91
Вложение Q в R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
(e) Комплексные числа C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Алгебраические операции в C. . . . . . . . . . . . . . . . . . . . . . . . . . 102
Вложение R в C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Оглавление xi

Мнимая единица и алгебраическая запись комплексного числа. . . . . . 104

2 МАТЕМАТИЧЕСКАЯ ЛОГИКА 105


§ 1 Формальные теории . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
(a) Определение формальной теории . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Язык формальной теории. . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Переименования и подстановки. . . . . . . . . . . . . . . . . . . . . . . . . 107
Метаформулы, схемы формул и системы аксиом формальной теории. . 110
Логическое исчисление формальной теории. . . . . . . . . . . . . . . . . 111
(b) Выводимость в формальных теориях . . . . . . . . . . . . . . . . . . . . . . . . . 114
Связь между выводимостью секвенций. . . . . . . . . . . . . . . . . . . . 115
Отношения следования и эквивалентности между формулами. . . . . . . 116
Цепочки импликаций и цепочки равносильностей. . . . . . . . . . . . . . 118
Отношение выводимости между формулами. . . . . . . . . . . . . . . . . 119
Эквивалентные теории. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Замыкание всеобщности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
(c) Дефинициальные расширения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Определение дефинициального расширения и примеры. . . . . . . . . . . 121
Перевод формул в дефинициальном расширении. . . . . . . . . . . . . . 122
(d) Интерпретации и модели . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Определение интерпретации и примеры. . . . . . . . . . . . . . . . . . . . 128
Действие интерпретации на выводимые формулы и секвенции. . . . . . 130
Модели. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
§ 2 Непротиворечивость и арифметизация . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
(a) Непротиворечивость и ω-непротиворечивость . . . . . . . . . . . . . . . . . . . . 137
Непротиворечивые теории. . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
ω-непротиворечивые теории. . . . . . . . . . . . . . . . . . . . . . . . . . . 140
(b) Арифметизация . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Геделевы номера. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Суждения о выводимости как формулы в PA. . . . . . . . . . . . . . . . . 142
Теории с нумерацией, интерпретирующие арифметику PA. . . . . . . . . 143
Геделево предложение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
(c) Теоремы Геделя о непротиворечивости и контрмодели . . . . . . . . . . . . . . 149
Теоремы Гёделя о непротиворечивости. . . . . . . . . . . . . . . . . . . . 149
Умолчание о непротиворечивости. . . . . . . . . . . . . . . . . . . . . . . 150
Контрмодели. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
§ 3 Выразимость средствами теории множеств и семантизация . . . . . . . . . . . . . . . . 152
Семантизация теории с конечной системой аксиом. . . . . . . . . . . . . 153
(a) Алгебраические теории в MK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Алгебраические языки в теории MK. . . . . . . . . . . . . . . . . . . . . . 155
Алгебраические теории в теории MK. . . . . . . . . . . . . . . . . . . . . . 156
Расширение алгебраической теории и лемма Линденбаума. . . . . . . . . 158
Истинность в алгебраической теории и теорема Геделя—Генкина. . . . . 159
Теорема Гильберта—Бернайса. . . . . . . . . . . . . . . . . . . . . . . . . 165
(b) Кодировка формальной теории в MK . . . . . . . . . . . . . . . . . . . . . . . . 166
Алгебраическая теория, порожденная кодировкой. . . . . . . . . . . . . . 166
Семантизация произвольной формальной теории. . . . . . . . . . . . . . 167
(c) Семантические теории и аксиоматизация . . . . . . . . . . . . . . . . . . . . . . 168
Аксиоматизации физических теорий. . . . . . . . . . . . . . . . . . . . . . 169
§ 4 Другие логические системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
(a) Другие аксиоматизации логики предикатов . . . . . . . . . . . . . . . . . . . . . 170
Гильбертовское исчисление предикатов CQC. . . . . . . . . . . . . . . . . 170
Исчисление Кетонена G3c. . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
О невыводимых секвенциях. . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Контрпример к теореме дедукции. . . . . . . . . . . . . . . . . . . . . . . 174
(b) Логика высказываний . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Различные аксиоматизации логики высказываний. . . . . . . . . . . . . . 175
Эквивалетность исчислений высказываний. . . . . . . . . . . . . . . . . . 177
Выводимость в логике высказываний. . . . . . . . . . . . . . . . . . . . . 177
xii Оглавление

Теорема о семантизации для логики высказываний. . . . . . . . . . . . . 178


(c) Интуиционистская логика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
Интуиционистская логика предикатов. . . . . . . . . . . . . . . . . . . . . 180
Интуиционистская логика высказываний. . . . . . . . . . . . . . . . . . . 182
Выводимость в интуиционистской логике высказываний. . . . . . . . . . 183

II ФУНКЦИИ ОДНОЙ ВЕЩЕСТВЕННОЙ ПЕРЕМЕННОЙ 185


3 ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ 186
§ 1 Вещественные числа и числовые множества . . . . . . . . . . . . . . . . . . . . . . . . . 187
(a) Вещественные числа R как семантическая теория . . . . . . . . . . . . . . . . . 187
Аксиомы теории вещественных чисел. . . . . . . . . . . . . . . . . . . . . 187
(b) Числовые множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
Алгебраические операции над числовыми множествами и неравенства
между ними. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
Минимум и максимум числового множества. . . . . . . . . . . . . . . . . 193
Минимум и максимум двух чисел. . . . . . . . . . . . . . . . . . . . . . . 195
Нижняя и верхняя грани числового множества. . . . . . . . . . . . . . . 196
§ 2 Натуральные, целые и рациональные числа . . . . . . . . . . . . . . . . . . . . . . . . . 198
(a) Натуральные числа N и положительные натуральные числа N∗ . . . . . . . . . 198
Определение натуральных чисел N. . . . . . . . . . . . . . . . . . . . . . . 198
Принцип математической индукции. . . . . . . . . . . . . . . . . . . . . . 199
Свойства натуральных чисел. . . . . . . . . . . . . . . . . . . . . . . . . . 200
Определения по индукции. . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
Положительные натуральные
Pn числа N∗ . . . . . . . . . . . . Q . . . . . . . . 206
n
Индуктивная сумма k=0 ak и индуктивное произведение k=0 ak . . . 207
Доказательство формул по индукции. . . . . . . . . . . . . . . . . . . . . 208
Принцип Архимеда. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
Конечные множества в R и N. . . . . . . . . . . . . . . . . . . . . . . . . . 211
(b) Целые числа Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
Определение множества целых чисел. . . . . . . . . . . . . . . . . . . . . 213
Степени с целым показателем. . . . . . . . . . . . . . . . . . . . . . . . . . 215
Целая и дробная части числа. . . . . . . . . . . . . . . . . . . . . . . . . . 218
Десятичная запись целых чисел. . . . . . . . . . . . . . . . . . . . . . . . 220
(c) Деление с остатком и делимость . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
Деление с остатком. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
Делимость в множестве N∗ положительных натуральных чисел. . . . . . 223
Наибольший общий делитель и наименьшее общее кратное. . . . . . . . 223
Основная теорема арифметики. . . . . . . . . . . . . . . . . . . . . . . . . 227
(d) Рациональные числа Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
Определение и свойства рациональных чисел. . . . . . . . . . . . . . . . 229
Несократимые дроби. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
Существование иррациональных чисел. . . . . . . . . . . . . . . . . . . . 231
Рациональные числа с нечетным знаменателем 2N∗Z−1 . . . . . . . . . . . . 232

4 ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ 235


§ 1 Числовые функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
(a) Определение функции и примеры . . . . . . . . . . . . . . . . . . . . . . . . . . 235
(b) Модуль . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
Алгебраические тождества с модулем. . . . . . . . . . . . . . . . . . . . . 237
Алгебраические неравенства с модулем. . . . . . . . . . . . . . . . . . . . 238
Решение неравенств с модулем. . . . . . . . . . . . . . . . . . . . . . . . . 239
(c) Функции с симметриями . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
Четные и нечетные функции. . . . . . . . . . . . . . . . . . . . . . . . . . 240
Периодические функции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
(d) Свойства функций, связанные с отношением порядка . . . . . . . . . . . . . . . 244
Ограниченные функции и точная грань функции на множестве. . . . . . 244
Монотонные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
Оглавление xiii

§2 Предел последовательности . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250


Способы описания числовой последовательности. . . . . . . . . . . . . . 250
Способы изображения числовой последовательности. . . . . . . . . . . . 251
(a) Предел числовой последовательности . . . . . . . . . . . . . . . . . . . . . . . . 252
“Почти все n ∈ N∗ ”. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
Окрестность точки. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
Конечный предел последовательности. . . . . . . . . . . . . . . . . . . . . 256
Бесконечный предел последовательности. . . . . . . . . . . . . . . . . . . 259
Бесконечно малые и бесконечно большие последовательности. . . . . . . 260
Арифметические операции с пределами. . . . . . . . . . . . . . . . . . . . 264
Ограниченные последовательности. . . . . . . . . . . . . . . . . . . . . . . 267
Вычисление пределов простейших последовательностей. . . . . . . . . . 268
(b) Теоремы о последовательностях . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
Предельный переход в неравенствах. . . . . . . . . . . . . . . . . . . . . . 271
Монотонные последовательности и теорема Вейерштрасса. . . . . . . . . 272
Теорема о вложенных отрезках. . . . . . . . . . . . . . . . . . . . . . . . . 275
Подпоследовательности и теорема Больцано-Вейерштрасса. . . . . . . . 276
Критерий Коши сходимости последовательности. . . . . . . . . . . . . . 281
Теорема Штольца—Чезаро. . . . . . . . . . . . . . . . . . . . . . . . . . . 283
(c) Приложения предела последовательности . . . . . . . . . . . . . . . . . . . . . . 285
Десятичная запись вещественных чисел. . . . . . . . . . . . . . . . . . . . 285
Число Непера e. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
§3 Непрерывные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
(a) Что такое непрерывная функция? . . . . . . . . . . . . . . . . . . . . . . . . . . 290
(b) Непрерывность и монотонные последовательности . . . . . . . . . . . . . . . . . 293
(c) Операции над непрерывными функциями . . . . . . . . . . . . . . . . . . . . . . 294
Арифметические операции с непрерывными функциями. . . . . . . . . . 295
Непрерывность композиции. . . . . . . . . . . . . . . . . . . . . . . . . . . 295
(d) Теоремы о непрерывных функциях . . . . . . . . . . . . . . . . . . . . . . . . . . 296
Теорема о сохранении знака . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
Теорема Коши о промежуточном значении. . . . . . . . . . . . . . . . . . . . . . 297
Теоремы Вейерштрасса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
Теорема Вейерштрасса об ограниченности. . . . . . . . . . . . . . . . . . 298
Теорема Вейерштрасса об экстремумах. . . . . . . . . . . . . . . . . . . . 299
Теорема Кантора о равномерной непрерывности . . . . . . . . . . . . . . . . . . 302
Теоремы о монотонных функциях. . . . . . . . . . . . . . . . . . . . . . . . . . . 303
Монотонные функции на отрезке. . . . . . . . . . . . . . . . . . . . . . . . 303
Монотонные функции на интервале. . . . . . . . . . . . . . . . . . . . . . 306
§4 Предел функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
(a) Определение и свойства предела функции . . . . . . . . . . . . . . . . . . . . . . 310
Нахождение предела функции по определению. . . . . . . . . . . . . . . 313
Связь между нулевым и бесконечным пределом. . . . . . . . . . . . . . . 315
Связь между односторонними и двусторонними пределами. . . . . . . . 316
Связь предела функции с монотонными последовательностыми. . . . . . 318
Предел монотонной функции. . . . . . . . . . . . . . . . . . . . . . . . . . 319
(b) Теоремы о пределах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
Связь между понятием предела и непрерывностью. . . . . . . . . . . . . 319
Теорема о замене переменной под знаком предела. . . . . . . . . . . . . . 321
Арифметические операции над пределами. . . . . . . . . . . . . . . . . . 321
Критерий Коши существования предела функции. . . . . . . . . . . . . . 322
(c) Язык ε-δ Коши . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
Определение предела функции по Коши. . . . . . . . . . . . . . . . . . . 323
Равномерная непрерывность функции по Коши. . . . . . . . . . . . . . . 326
xiv Оглавление

5 СТАНДАРТНЫЕ ФУНКЦИИ 327


§ 1 Элементарные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
(a) Степени с нецелым показателем и логарифмы . . . . . . . . . . . . . . . . . . . 328
Аксиома степеней. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
Корни. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
Степенная функция. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
Показательная функция. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
Логарифм. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
Формулы, связывающие показательные функции и логарифмы. . . . . . 340
Экспонента ex и натуральный логарифм ln x. . . . . . . . . . . . . . . . . 340
Перестановочность предела с возведением в степень. . . . . . . . . . . . 341
(b) Тригонометрические функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
Аксиома тригонометрии. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
Число Архимеда π. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
Синус и косинус. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
Тангенс и котангенс. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
Обратные тригонометрические функции. . . . . . . . . . . . . . . . . . . 350
(c) Непрерывные элементарные функции . . . . . . . . . . . . . . . . . . . . . . . . 350
§ 2 Стандартные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
(a) Числовые выражения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
Числовые выражения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
Подстановка. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
(b) Стандартные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
Упорядочение переменных. . . . . . . . . . . . . . . . . . . . . . . . . . . 353
Семейство стандартных функций, определяемое числовым выражением. 354
Равенство числовых выражений. . . . . . . . . . . . . . . . . . . . . . . . 359
Приведенные числовые выражения и приведенные стандартные функции.359
(c) Стандартные функции в пройденных темах . . . . . . . . . . . . . . . . . . . . . 360
Предел последовательности. . . . . . . . . . . . . . . . . . . . . . . . . . . 360
Последовательности, заданные рекуррентно. . . . . . . . . . . . . . . . . 360
Подпоследовательности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361
Функции, заданные как пределы последовательностей. . . . . . . . . . . 361
(d) Вычисление пределов со стандартными функциями . . . . . . . . . . . . . . . . 362
Существование предела. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
Принцип подстановки. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
Вычисление упрощением. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
Замена переменной под знаком предела. . . . . . . . . . . . . . . . . . . . 364
Первый замечательный предел. . . . . . . . . . . . . . . . . . . . . . . . . 365
Второй замечательный предел. . . . . . . . . . . . . . . . . . . . . . . . . 366

6 ПРОИЗВОДНАЯ 369
§ 1 Производная . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
(a) Производная и дифференцируемость . . . . . . . . . . . . . . . . . . . . . . . . . 370
Геометрический смысл производной. . . . . . . . . . . . . . . . . . . . . . 371
Наглядный смысл дифферецируемости. . . . . . . . . . . . . . . . . . . . 372
Производные элементарных функций. . . . . . . . . . . . . . . . . . . . . 373
(b) Правила вычисления производных . . . . . . . . . . . . . . . . . . . . . . . . . . 375
Арифметические действия с производными. . . . . . . . . . . . . . . . . . 375
Производная композиции. . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
(c) Теоремы о дифференцируемых функциях . . . . . . . . . . . . . . . . . . . . . . 379
Теорема Ферма. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
Теорема Ролля. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
Теорема Лагранжа. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
Теорема Коши об отношении приращений. . . . . . . . . . . . . . . . . . 382
(d) Дифференциальное исчисление: производная, как формальная операция . . . 382
Частная производная числового выражения. . . . . . . . . . . . . . . . . 383
Производная одноместного числового выражения. . . . . . . . . . . . . . 384
Производная стандартной функции. . . . . . . . . . . . . . . . . . . . . . 386
§ 2 Приложения производной . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388
Оглавление xv

(a) Правило Лопиталя . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388


Раскрытие неопределенностей типа 00 . . . . . . . . . . . . . . . . . . . . . 388
Раскрытие неопределенностей типа ∞ ∞. . . . . . . . . . . . . . . . . . . . . 390
Раскрытие неопределенностей 0 · ∞, ∞ − ∞, 00 , 1∞ , ∞0 . . . . . . . . . . 392
(b) Построение графика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
Монотонность и экстремум. . . . . . . . . . . . . . . . . . . . . . . . . . . 393
Выпуклость и перегиб. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
Асимптоты. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
Общая схема построения графика функции. . . . . . . . . . . . . . . . . . . . . 403
График стандартной функции без симметрий. . . . . . . . . . . . . . . . 403
Четные и нечетные функции. . . . . . . . . . . . . . . . . . . . . . . . . . 406
Периодические функции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
Экстремум функции одной переменной. . . . . . . . . . . . . . . . . . . . 408

7 АСИМПТОТИЧЕСКИЕ МЕТОДЫ 411


§ 1 Асимптотические отношения и формулы . . . . . . . . . . . . . . . . . . . . . . . . . . 413
(a) Асимптотические отношения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
Асимптотическая эквивалентность функций (символ ∼) . . . . . . . . . 413
Асимптотическое сравнение функций (символы ≪ и o) . . . . . . . . . . 416
Принцип выделения главного слагаемого. . . . . . . . . . . . . . . . . . . 418
Эквивалентность модулей, степеней и логарифмов. . . . . . . . . . . . . 420
(b) Асимптотические формулы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422
Связь между символами ∼ и o . . . . . . . . . . . . . . . . . . . . . . . . 423
Равенство асимптотических выражений и свойства символа o. . . . . . . 423
Упрощение асимптотических многочленов. . . . . . . . . . . . . . . . . . 426
Вычисление пределов с помощью асимптотических формул . . . . . . . 431
§ 2 Формулы Пеано и асимптотика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
(a) Формулы Пеано . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
Формула Тейлора-Пеано. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
Формулы Маклорена-Пеано. . . . . . . . . . . . . . . . . . . . . . . . . . . 435
(b) Асимптотика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
Степенная последовательность в нуле. . . . . . . . . . . . . . . . . . . . . 443
Степенная последовательность на бесконечности. . . . . . . . . . . . . . 443
Другие асимптотические последовательности. . . . . . . . . . . . . . . . 444

8 ИНТЕГРАЛ 446
§ 1 Неопределенный интеграл . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446
(a) Классы функций, тождественные на отрезках . . . . . . . . . . . . . . . . . . . 447
Равенство классов функций. . . . . . . . . . . . . . . . . . . . . . . . . . . 447
Классы функций с общей областью определения. . . . . . . . . . . . . . 449
Ограничение класса функций. . . . . . . . . . . . . . . . . . . . . . . . . . 449
Тождественность на отрезках. . . . . . . . . . . . . . . . . . . . . . . . . . 450
Алгебраические операции с классами функций. . . . . . . . . . . . . . . . 451
Композиция с функцией, непрерывной на отрезках. . . . . . . . . . . . . 453
(b) Определение и свойства неопределенного интеграла . . . . . . . . . . . . . . . . 454
Дифференцируемые функции и первообразная на отрезке. . . . . . . . . 454
Интегральные множества и функции, дифференцируемые на отрезках. 456
Неопределенный интеграл. . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
Таблица интегралов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
Свойства неопределенных интегралов. . . . . . . . . . . . . . . . . . . . . 460
(c) Вычисление неопределенных интегралов . . . . . . . . . . . . . . . . . . . . . . 462
Применение формулы линейности. . . . . . . . . . . . . . . . . . . . . . . 462
Внесение под знак дифференциала и применение формулы замены пе-
ременной. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
Интегрирование по частям. . . . . . . . . . . . . . . . . . . . . . . . . . . 463
Рекуррентные формулы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
Интегрирование рациональных функций . . . . . . . . . . . . . . . . . . . . . . 466
Интегрирование простейших дробей . . . . . . . . . . . . . . . . . . . . . 466
Интегрирование правильных дробей . . . . . . . . . . . . . . . . . . . . . 468
xvi Оглавление

Интегрирование неправильных дробей. . . . . . . . . . . . . . . . . . . . 472


Интегрирование рациональных тригонометрических функций . . . . . . . . . . 473
Универсальная тригонометрическая подстановка . . . . . . . . . . . . . . 474
Частные тригонометрические подстановки. . . . . . . . . . . . . . . . . . 474
Интегрирование тригонометрических произведений . . . . . . . . . . . . . . . . 475
Интегрирование функций sin ax · cos bx, sin ax · sin bx, cos ax · cos bx . . . . 475
Интегрирование функций sinα x · cosβ x . . . . . . . . . . . . . . . . . . . 475
Интегрирование некоторых алгебраических иррациональностей. . . . . . . . . 476

Интегрирование функций R(x, n x), n ∈ N. . . . . . . . . . . . . . . . . . 476
 q 
ax+b
Интегрирование функций R x, n cx+d , n ∈ N. . . . . . . . . . . . . . . 477
1
Интегрирование функций √ . . . . . . . . . . . . . . . . . . . . .
ax2 +bx+c
477
√ 
Интегрирование функций R x, ax2+ bx + c . . . . . . . . . . . . . . . 477
Интегрирование функций xm · (a + bxn )p , m, n, p ∈ Q. . . . . . . . . . . . 478
§2 Определенный интеграл . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479
(a) Определение определенного интеграла . . . . . . . . . . . . . . . . . . . . . . . . 480
Разбиения отрезка. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
Определение определенного интеграла. . . . . . . . . . . . . . . . . . . . 481
(b) Когда существует определенный интеграл? . . . . . . . . . . . . . . . . . . . . . 484
Суммы Дарбу. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
Критерий интегрируемости. . . . . . . . . . . . . . . . . . . . . . . . . . . 487
Ограниченность интегрируемой функции. . . . . . . . . . . . . . . . . . . 489
Интегрируемость монотонной функции. . . . . . . . . . . . . . . . . . . . 490
Интегрируемость непрерывной функции. . . . . . . . . . . . . . . . . . . 490
(c) Свойства определенного интеграла . . . . . . . . . . . . . . . . . . . . . . . . . . 492
Гладкие функции на отрезке и замена переменной в определенном ин-
теграле. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497
(d) Формула Бонне . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499
Преобразование Абеля. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499
Формула Бонне. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501
§3 Формула Ньютона-Лейбница . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
(a) Основные результаты . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
Интеграл с переменным верхним пределом. . . . . . . . . . . . . . . . . . 504
Формула Ньютона-Лейбница. . . . . . . . . . . . . . . . . . . . . . . . . . 505
(b) Интеграл по ориентированному отрезку и вычисления . . . . . . . . . . . . . . 506
Ориентированные отрезки в R. . . . . . . . . . . . . . . . . . . . . . . . . 507
Интеграл по ориентированному отрезку. . . . . . . . . . . . . . . . . . . . 508
Интегрирование вдоль гладкой функции. . . . . . . . . . . . . . . . . . . 510
Теорема о замене переменной в определенном интеграле по ориентиро-
ванному отрезку. . . . . . . . . . . . . . . . . . . . . . . . . . . 512
Интегрирование по частям. . . . . . . . . . . . . . . . . . . . . . . . . . . 513
(c) Интегрирование кусочно-непрерывных и кусочно-гладких функций . . . . . . . 515
Кусочно-непрерывные функции. . . . . . . . . . . . . . . . . . . . . . . . 515
Кусочно-гладкие функции. . . . . . . . . . . . . . . . . . . . . . . . . . . . 517
(d) Некоторые следствия формулы Ньютона-Лейбница . . . . . . . . . . . . . . . . 520
Первообразная на интервале. . . . . . . . . . . . . . . . . . . . . . . . . . 520
Лемма Адамара для функций одной переменной. . . . . . . . . . . . . . 521
(e) Приложения определенного интеграла . . . . . . . . . . . . . . . . . . . . . . . . 522
Площадь правильной области на плоскости. . . . . . . . . . . . . . . . . . 522
Площадь области, ограниченной параметризованной кривой. . . . . . . . 522
Площадь области в полярных координатах. . . . . . . . . . . . . . . . . . 525
Длина кривой. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
Объем тела вращения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529
Площадь поверхности вращения. . . . . . . . . . . . . . . . . . . . . . . . 531
Формула Стирлинга. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
Оглавление xvii

9 НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ 534


§ 1 Несобственные интегралы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534
(a) Определение несобственного интеграла и его свойства . . . . . . . . . . . . . . 535
Несобственный интеграл по конечному промежутку. . . . . . . . . . . . . 535
Несобственный интеграл по бесконечному промежутку. . . . . . . . . . . 537
(b) Несобственные интегралы от степенной и показательной функций . . . . . . . 538
(c) Замена переменной в несобственном интеграле . . . . . . . . . . . . . . . . . . . 539
(d) Признаки сходимости несобственных интегралов . . . . . . . . . . . . . . . . . . 540
Признаки сходимости знакопостоянных интегралов . . . . . . . . . . . . . . . . 540
Критерий сходимости знакоположительного интеграла. . . . . . . . . . . 541
Признак сравнения интегралов. . . . . . . . . . . . . . . . . . . . . . . . . 541
Критерий Коши сходимости несобственного интеграла . . . . . . . . . . . . . . 543
Признак абсолютной сходимости . . . . . . . . . . . . . . . . . . . . . . . . . . . 544
Признаки Дирихле и Абеля для интегралов. . . . . . . . . . . . . . . . . . . . . 545
(e) Асимптотика интегралов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 547
Асимптотическая эквивалентность интегралов . . . . . . . . . . . . . . . 547
Асимптотическое сравнение интегралов . . . . . . . . . . . . . . . . . . . 551
Интегрирование асимптотических формул. . . . . . . . . . . . . . . . . . 554
Нахождение асимптотики интегрированием по частям . . . . . . . . . . . 556
§ 2 Числовые ряды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 557
(a) Определение числового ряда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558
(b) Арифметические свойства числовых рядов . . . . . . . . . . . . . . . . . . . . . 559
(c) Признаки сходимости рядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
Общие признаки сходимости рядов . . . . . . . . . . . . . . . . . . . . . . . . . . 561
Необходимое условие сходимости. . . . . . . . . . . . . . . . . . . . . . . . 561
Критерий Коши сходимости ряда. . . . . . . . . . . . . . . . . . . . . . . 561
Сходимость знакопостоянных рядов . . . . . . . . . . . . . . . . . . . . . . . . . 562
Критерий сходимости знакоположительного ряда. . . . . . . . . . . . . . 563
Интегральный признак Коши и постоянная Эйлера. . . . . . . . . . . . . 563
Признак сравнения рядов. . . . . . . . . . . . . . . . . . . . . . . . . . . . 566
Признак Даламбера. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 568
Радикальный признак Коши. . . . . . . . . . . . . . . . . . . . . . . . . . 570
Признак абсолютной сходимости. . . . . . . . . . . . . . . . . . . . . . . . 571
Специальные признаки сходимости рядов . . . . . . . . . . . . . . . . . . . . . . 572
Признак Лейбница. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572
Признаки Дирихле и Абеля для рядов. . . . . . . . . . . . . . . . . . . . 574
(d) Асимптотика сумм и рядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577
Асимптотическая эквивалентность рядов. . . . . . . . . . . . . . . . . . . 578
Асимптотическое сравнение рядов. . . . . . . . . . . . . . . . . . . . . . . 581
Связь с несобственными интегралами и формула суммирования Эйлера. 584
Точное вычисление сумм. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590

10 ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АП-


ПРОКСИМАЦИЯ 592
§ 1 Функциональные последовательности и функциональные ряды . . . . . . . . . . . . . 592
(a) Поточечная сходимость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592
Область сходимости функциональной последовательности . . . . . . . . . . . . 592
Область сходимости функционального ряда . . . . . . . . . . . . . . . . . . . . . 595
(b) Равномерная сходимость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597
Равномерная сходимость функциональной последовательности . . . . . . . . . 598
Критерий Коши равномерной сходимости последовательности. . . . . . 603
Равномерная сходимость функционального ряда . . . . . . . . . . . . . . . . . . 605
Критерий Коши равномерной сходимости ряда. . . . . . . . . . . . . . . 609
Необходимое условие равномерной сходимости ряда. . . . . . . . . . . . . 610
Признак Вейерштрасса равномерной сходимости. . . . . . . . . . . . . . 611
Признак Лейбница равномерной сходимости. . . . . . . . . . . . . . . . . 611
Признаки Дирихле и Абеля равномерной сходимости. . . . . . . . . . . . 612
Всюду непрерывная, но нигде не дифференцируемая функция. . . . . . 614
(c) Равномерная по производным сходимость . . . . . . . . . . . . . . . . . . . . . . 616
xviii Оглавление

Равномерная по производным сходимость последовательности . . . . . . . . . . 618


Равномерная по производным сходимость ряда . . . . . . . . . . . . . . . . . . . 618
Контрпримеры в классе гладких функций. . . . . . . . . . . . . . . . . . 619
(d) Интегральная сходимость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 622
Интегральная сходимость последовательности . . . . . . . . . . . . . . . . . . . 623
Интегральная сходимость ряда . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623
§2 Аппроксимация . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624
(a) Приближение интегрируемых функций . . . . . . . . . . . . . . . . . . . . . . . 624
Приближение интегрируемой функции кусочно постоянными. . . . . . . 624
Приближение интегрируемой функции непрерывными. . . . . . . . . . . 625
(b) Свертка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627
(c) Приближение непрерывных функций . . . . . . . . . . . . . . . . . . . . . . . . 633
Аппроксимативная единица. . . . . . . . . . . . . . . . . . . . . . . . . . . 633
Аппроксимация гладкими функциями. . . . . . . . . . . . . . . . . . . . . 635
Аппроксимация алгебраическими многочленами. . . . . . . . . . . . . . . 636
Аппроксимация тригонометрическими многочленами. . . . . . . . . . . . 637

11 СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ 639


§ 1 Степенные ряды, аналитические последовательности и производящие функции . . . . 639
(a) Степенные ряды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 639
Область сходимости степенного ряда. . . . . . . . . . . . . . . . . . . . . 639
Равномерная сходимость степенного ряда. . . . . . . . . . . . . . . . . . . 643
Непрерывность суммы степенного ряда. . . . . . . . . . . . . . . . . . . . 645
Дифференцирование и интегрирование степенных рядов. . . . . . . . . . 645
Вычисление суммы степенного ряда. . . . . . . . . . . . . . . . . . . . . . 648
(b) Аналитические последовательности и производящие функции . . . . . . . . . . 649
Алгебраические операции с аналитическими последовательностями. . . 650
Порядок аналитической последовательности. . . . . . . . . . . . . . . . . 653
Сравнение аналитических последовательностей. . . . . . . . . . . . . . . 654
Модуль аналитической последовательности. . . . . . . . . . . . . . . . . . 654
Степень аналитической последовательности. . . . . . . . . . . . . . . . . 656
Композиция аналитических последовательностей. . . . . . . . . . . . . . 656
§ 2 Ряд Тейлора и аналитические функции . . . . . . . . . . . . . . . . . . . . . . . . . . . 659
(a) Формулы Тейлора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 659
Теорема об остатке. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 659
Формула Тейлора с остаточным членом в форме Лагранжа. . . . . . . . 661
Формула Тейлора с остаточным членом в форме Коши. . . . . . . . . . . 662
Дифференциал функции и запись формулы Тейлора с его помощью. . . 662
(b) Ряд Тейлора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662
Контрпримеры. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663
Всякий сходящийся степенной ряд есть ряд Тейлора своей суммы. . . . 663
Сходимость ряда Тейлора. . . . . . . . . . . . . . . . . . . . . . . . . . . . 664
Стандартные разложения Маклорена. . . . . . . . . . . . . . . . . . . . . 664
(c) Аналитические и целые функции . . . . . . . . . . . . . . . . . . . . . . . . . . . 666
Аналитические функции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 666
Целые функции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669
§ 3 Приложения степенных рядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 671
(a) Доказательство зависимости Аксиомы степеней. . . . . . . . . . . . . . . . . . . 671
Функция exp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 671
Функция ln. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672
Определение степеней ab и доказательство Аксиомы степеней. . . . . . . 673
(b) Доказательство зависимости Аксиомы тригонометрии. . . . . . . . . . . . . . . 676
(c) Значение числа π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 681
(d) Числа Фибоначчи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682
Оглавление xix

12 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ 684


§ 1 Сходимость ряда Фурье в среднем квадратичном . . . . . . . . . . . . . . . . . . . . . 685
(a) Основная теорема . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 685
Скалярное произведение функций. . . . . . . . . . . . . . . . . . . . . . . 686
Ортогональность тригонометрической системы и связь скалярного про-
изведения с коэффициентами Фурье. . . . . . . . . . . . . . . 688
Минимальное свойство многочленов Фурье. . . . . . . . . . . . . . . . . . 690
Полнота тригонометрической системы. . . . . . . . . . . . . . . . . . . . . 691
Неравенство Бесселя. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 692
Равенство Парсеваля. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 693
Доказательство основной теоремы. . . . . . . . . . . . . . . . . . . . . . . 694
§ 2 Поточечная и равномерная сходимость ряда Фурье . . . . . . . . . . . . . . . . . . . . 694
(a) Кусочно-непрерывные и кусочно-гладкие функции на R . . . . . . . . . . . . . 695
(b) Суммирование ряда Фурье обычным способом . . . . . . . . . . . . . . . . . . . 697
Лемма Римана. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697
Ядро Дирихле. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698
Интегралы Дирихле. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699
Поточечная сходимость ряда Фурье. . . . . . . . . . . . . . . . . . . . . . 700
Дифференцирование ряда Фурье. . . . . . . . . . . . . . . . . . . . . . . . 701
Равномерная сходимость ряда Фурье непрерывной кусочно-гладкой функ-
ции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 702
Равномерная по производным сходимость ряда Фурье непрерывной кусочно-
гладкой функции. . . . . . . . . . . . . . . . . . . . . . . . . . . 703
(c) Суммирование ряда Фурье методом арифметических средних . . . . . . . . . . 704
Ядро Фейера. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 704
Интеграл Фейера. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705
Поточечная сходимость многочленов Фейера. . . . . . . . . . . . . . . . . 706
Равномерная сходимость многочленов Фейера. . . . . . . . . . . . . . . . 707
Равномерная по производным сходимость многочленов Фейера. . . . . . 708
(d) Примеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709
Разложение Фурье произвольной 2π-периодической функции. . . . . . . 709
Разложение Фурье четных и нечетных 2π-периодических функций. . . . 710
Ряды Фурье функций с произвольным периодом. . . . . . . . . . . . . . 713

III ФУНКЦИИ НЕСКОЛЬКИХ ВЕЩЕСТВЕННЫХ ПЕРЕМЕННЫХ


714
13 ЛИНЕЙНАЯ АЛГЕБРА 715
§ 1 Комбинаторика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 716
(a) Основные понятия комбинаторики . . . . . . . . . . . . . . . . . . . . . . . . . . 716
Правило комбинаторного умножения. . . . . . . . . . . . . . . . . . . . . 716
Инъективные последовательности (размещения). . . . . . . . . . . . . . . 718
Подмножества (сочетания). . . . . . . . . . . . . . . . . . . . . . . . . . . 720
Мультииндексы (выборки). . . . . . . . . . . . . . . . . . . . . . . . . . . . 721
Разбиения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723
(b) Перестановки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728
Число перестановок. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728
Группа перестановок Sn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 729
Циклы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 729
Транспозиции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 730
Знак перестановки и четность. . . . . . . . . . . . . . . . . . . . . . . . . 731
Перестановка, как смена порядка. . . . . . . . . . . . . . . . . . . . . . . 733
§ 2 Векторные пространства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738
(a) Векторные пространства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738
Определение векторного пространства и примеры. . . . . . . . . . . . . . 738
Линейно независимые системы. . . . . . . . . . . . . . . . . . . . . . . . . 739
Базис и размерность. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 740
Подпространства. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 744
xx Оглавление

(b) Линейные функционалы и сопряженное пространство . . . . . . . . . . . . . . . 746


Столбец коэффициентов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747
Линейные операции над функционалами и сопряженное пространство X ∗ .749
(c) Линейные операторы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 749
Ядро и образ оператора. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 749
Линейные операции над операторами. . . . . . . . . . . . . . . . . . . . . 750
Произведение операторов и обратимые операторы. . . . . . . . . . . . . . 751
Сопряженные операторы. . . . . . . . . . . . . . . . . . . . . . . . . . . . 752
Алгебраические дополнения и проекторы. . . . . . . . . . . . . . . . . . . 752
(d) Полилинейные отображения, полилинейные формы и тензоры . . . . . . . . . . 754
Полилинейные формы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 755
Тензоры. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 756
Изоморфизм X1 ⊗ ... ⊗ Xk ∼ = L X1∗ , ..., Xk∗ . . . . . . . . . . . . . . . . . . 758
Универсальность пространства тензоров. . . . . . . . . . . . . . . . . . . 758
§3 Матрицы и определители . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 759
(a) Матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 759
Алгебраические операции над матрицами. . . . . . . . . . . . . . . . . . . 760
Действие матрицы на строку векторов и разложение по базису. . . . . . 760
Действие матрицы на столбец векторов и разложение по базису. . . . . . 761
Матрица перехода к новому базису. . . . . . . . . . . . . . . . . . . . . . . 761
Исчисление матричных представлений. . . . . . . . . . . . . . . . . . . . 762
Переход к новому базису. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 765
Матрица билинейной формы . . . . . . . . . . . . . . . . . . . . . . . . . . 766
(b) Определитель . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 768
Определитель матрицы, как полилинейная кососимметрическая форма. 768
Правило Крамера. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 770
Свойства определителей матриц. . . . . . . . . . . . . . . . . . . . . . . . 773
Определитель оператора. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 775
(c) Собственные числа и собственные векторы . . . . . . . . . . . . . . . . . . . . . 775
Характеристический многочлен. . . . . . . . . . . . . . . . . . . . . . . . 776
Базис из собственных векторов. . . . . . . . . . . . . . . . . . . . . . . . . 776
§4 Симметрические формы и однородные многочлены . . . . . . . . . . . . . . . . . . . . 778
(a) Общие симметрические формы и однородные многочлены . . . . . . . . . . . . 778
Симметрические формы Σm (X). . . . . . . . . . . . . . . . . . . . . . . . 778
Симметрическое произведение функционалов. . . . . . . . . . . . . . . . 778
Симметризация. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779
Базис в пространстве симметрических форм Σm (X). . . . . . . . . . . . 779
(b) Однородные многочлены Pm (X) . . . . . . . . . . . . . . . . . . . . . . . . . . . 782
Базис в пространстве однородных многочленов. . . . . . . . . . . . . . . 782
Изоморфизм Pm (X ∗ ) ∼ = Σm (X)∗ . . . . . . . . . . . . . . . . . . . . . . . . 783
Симметрическая поляризация Pm (X) ∼ = Σm (X). . . . . . . . . . . . . . . 785
Универсальность пространства однородных многочленов. . . . . . . . . . 786
(c) Симметрические билинейные формы и критерий Сильвестра . . . . . . . . . . 788
Симметрические билинейные формы. . . . . . . . . . . . . . . . . . . . . 788
Квадратичные формы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 788
Ортогональное дополнение и невырожденные формы. . . . . . . . . . . . 790
Ортогональный базис. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 793
Ортогонализация Грама-Шмидта. . . . . . . . . . . . . . . . . . . . . . . 796
Знакоопределенные квадратичные формы и критерий Сильвестра. . . . 798
§5 Кососимметрические (внешние) формы и поливекторы . . . . . . . . . . . . . . . . . . 799
(a) Внешние формы Λm [X] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 799
Конкатенация функционалов. . . . . . . . . . . . . . . . . . . . . . . . . . 801
Альтернация. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802
Базис в пространстве внешних форм Λm [X]. . . . . . . . . . . . . . . . . 804
Внешние формы максимальной степени. . . . . . . . . . . . . . . . . . . . 807
Конкатенация внешних форм. . . . . . . . . . . . . . . . . . . . . . . . . . 807
(b) Поливекторы Vm [X] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 810
Конкатенация векторов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 810
Базис в пространстве поливекторов. . . . . . . . . . . . . . . . . . . . . . 812
Оглавление xxi

Поливекторы максимальной степени. . . . . . . . . . . . . . . . . . . . . . 813


Кососимметрическая поляризация Vm [X] ∼ = Λm (X ∗ ). . . . . . . . . . . . . 813
Конкатенация поливекторов. . . . . . . . . . . . . . . . . . . . . . . . . . 814
Универсальность пространства поливекторов. . . . . . . . . . . . . . . . 815
(c) Действие матрицы и оператора на внешнюю форму и поливектор . . . . . . . . 815
Действие оператора на внешнюю форму и поливектор. . . . . . . . . . . 815
Действие матрицы на форму и на поливектор. . . . . . . . . . . . . . . . 816
(d) Ориентация . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 817
Векторный порядок. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 817
Ориентация, как порядок на пространстве поливекторов Vn [X]. . . . . . 819
Сторона ориентированной гиперплоскости. . . . . . . . . . . . . . . . . . 821

14 ЕВКЛИДОВЫ ПРОСТРАНСТВА 822


§ 1 Евклидовы пространства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822
(a) Модуль вектора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822
(b) Ортогональность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825
Ортогональные векторы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825
Ортонормированный базис. . . . . . . . . . . . . . . . . . . . . . . . . . . 825
Ортогональное проектирование. . . . . . . . . . . . . . . . . . . . . . . . . 825
Ортогонализация Грама-Шмидта в евклидовом пространстве. . . . . . . 827
(c) Евклидова структура на пространстве функционалов X ∗ . . . . . . . . . . . . . 828
Скалярное произведение в X ∗ . . . . . . . . . . . . . . . . . . . . . . . . . 828
Градиент линейного функционала. . . . . . . . . . . . . . . . . . . . . . . 829
(d) Евклидова структура на пространстве операторов L(X, Y ) . . . . . . . . . . . . 830
Скалярное произведение в L(X, Y ). . . . . . . . . . . . . . . . . . . . . . . 830
Модуль и норма оператора. . . . . . . . . . . . . . . . . . . . . . . . . . . 831
(e) Евклидова структура на пространстве поливекторов Vk [X] . . . . . . . . . . . . 833
Определитель Грама. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 833
Скалярное произведение поливекторов. . . . . . . . . . . . . . . . . . . . 837
(f) Изометрии и движения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 839
Изометрии и теорема о представлении. . . . . . . . . . . . . . . . . . . . . 839
Классификация евклидовых пространств. . . . . . . . . . . . . . . . . . . 840
Движения в евклидовом пространстве. . . . . . . . . . . . . . . . . . . . . 841
§ 2 Топология евклидова пространства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 842
(a) Сходимость последовательности в евклидовом пространстве . . . . . . . . . . . 842
(b) Внутренность и открытые множества в евклидовом пространстве . . . . . . . . 844
Внутренние точки. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 844
Внутренность множества. . . . . . . . . . . . . . . . . . . . . . . . . . . . 845
Открытые множества. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845
(c) Замыкание и замкнутые множества . . . . . . . . . . . . . . . . . . . . . . . . . 847
Точки прикосновения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 847
Замыкание множества. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 848
Замкнутые множества. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 848
(d) Двойственность между открытыми и замкнутыми множествами . . . . . . . . 850
Дополнения открытых и замкнутых множеств. . . . . . . . . . . . . . . . 850
Разность открытых и замкнутых множеств. . . . . . . . . . . . . . . . . . 851
Двойственность между замыканием и внутренностью. . . . . . . . . . . . 851
(e) Некоторые дополнительные понятия из топологии . . . . . . . . . . . . . . . . . 852
Граница множества. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852
Ядро и нарост. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852
Всюду плотные множества. . . . . . . . . . . . . . . . . . . . . . . . . . . 852
Связные множества. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853
§ 3 Компактность и паракомпактность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853
(a) Ограниченные множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853
Ограниченные последовательности и теорема Больцано-Вейерштрасса. . 853
(b) Компактные множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 856
Определение компакта и примеры . . . . . . . . . . . . . . . . . . . . . . 856
Критерий компактности . . . . . . . . . . . . . . . . . . . . . . . . . . . . 856
Отделимость компакта. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 858
xxii Оглавление

Стягивание к компакту. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 859


Исчерпывание компактами. . . . . . . . . . . . . . . . . . . . . . . . . . . 861
(c) Открытые покрытия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 861
Открытые покрытия компакта. . . . . . . . . . . . . . . . . . . . . . . . . 862
Счетные подпокрытия. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 864
Локально конечные семейства множеств. . . . . . . . . . . . . . . . . . . 864
Вписанные покрытия и паракомпактность. . . . . . . . . . . . . . . . . . 865

15 ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 868


§ 1 Гладкие функции на евклидовых пространствах . . . . . . . . . . . . . . . . . . . . . . 868
(a) Непрерывность, предел и асимптотические формулы . . . . . . . . . . . . . . . 869
Непрерывные функции на евклидовом пространстве. . . . . . . . . . . . 869
Предел функции на евклидовом пространстве. . . . . . . . . . . . . . . . 872
Асимптотические формулы на евклидовых пространствах. . . . . . . . . 874
(b) Дифференцируемые функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 876
Основная теорема и основные определения: дифференцируемость, гра-
диент, производная по направлению, частная производная. . 876
Критерий дифференцируемости. . . . . . . . . . . . . . . . . . . . . . . . 878
Свойства градиента. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 881
(c) Непрерывно дифференцируемые функции . . . . . . . . . . . . . . . . . . . . . 882
Непрерывно дифференцируемые функции порядка 1. . . . . . . . . . . . 882
Непрерывная дифференцируемость порядка 2 и теорема Шварца. . . . . 883
Непрерывная дифференцируемость порядка m и частная производная
по мультииндексу. . . . . . . . . . . . . . . . . . . . . . . . . . 884
(d) Дифференциалы и формула Тейлора . . . . . . . . . . . . . . . . . . . . . . . . . 885
Дифференциал 1 порядка. . . . . . . . . . . . . . . . . . . . . . . . . . . . 885
Дифференциалы порядка m. . . . . . . . . . . . . . . . . . . . . . . . . . . 886
Формула Тейлора. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 887
(e) Дифференциальные выражения и формальный дифференциал . . . . . . . . . 889
Тождественное равенство дифференциальных выражений. . . . . . . . . 889
Дифференциалы числового выражения. . . . . . . . . . . . . . . . . . . . 891
Разложение по мультистепеням элементарных дифференциалов. . . . . 891
Однородные дифференциальные выражения. . . . . . . . . . . . . . . . . 892
Область допустимых значений переменной в дифференциальном выра-
жении. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 892
Связь с дифференциалом функции от одной переменной. . . . . . . . . . 892
Связь с дифференциалом функции многих переменных. . . . . . . . . . 893
(f) Локальный экстремум на евклидовом пространстве . . . . . . . . . . . . . . . . 894
Условия локального экстремума в терминах свойств дифференциалов. . 894
Условия локального экстремума в терминах свойств частных производных902
Локальный экстремум функции двух переменных. . . . . . . . . . . . . . 904
(g) Гладкие функции на евклидовых пространствах . . . . . . . . . . . . . . . . . . 907
Отделение компакта гладкой функцией. . . . . . . . . . . . . . . . . . . . 907
Локально конечные семейства функций. . . . . . . . . . . . . . . . . . . . 908
Разбиение единицы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 909
Лемма Адамара для функций нескольких переменных. . . . . . . . . . . 912
§ 2 Гладкие отображения евклидовых пространств . . . . . . . . . . . . . . . . . . . . . . . 913
(a) Непрерывность и гладкость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 913
Непрерывные отображения. . . . . . . . . . . . . . . . . . . . . . . . . . . 913
Вложения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 914
Непрерывно дифференцируемые и гладкие отображения. . . . . . . . . . 917
(b) Формула Тейлора для непрерывно дифференцируемых отображений и ее след-
ствия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 919
Формулы Тейлора для гладких отображений. . . . . . . . . . . . . . . . . 919
Композиция отображений. . . . . . . . . . . . . . . . . . . . . . . . . . . . 919
Якобиан. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 921
(c) Теорема об обратном отображении и ее следствия . . . . . . . . . . . . . . . . . 923
Точки нестабильности и критические точки. . . . . . . . . . . . . . . . . 923
Диффеоморфизмы и теорема об обратном отображении. . . . . . . . . . 924
Оглавление xxiii

Ретракции и коретракции. . . . . . . . . . . . . . . . . . . . . . . . . . . . 930


§3 Многообразия и условный экстремум . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 933
(a) Многообразия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 933
Множества уровня. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 933
Параметризованные многообразия. . . . . . . . . . . . . . . . . . . . . . . 934
Многообразия. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 938
(b) Касательное пространство к многообразию . . . . . . . . . . . . . . . . . . . . . 940
Касательная прямая и касательный вектор к параметризованной кривой. 940
Касательное пространство к многообразию произвольной размерности. 941
(c) Условный экстремум функции многих переменных . . . . . . . . . . . . . . . . 943
Теоремы Лагранжа. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944
Задачи на глобальный условный экстремум. . . . . . . . . . . . . . . . . 950
Задачи на локальный условный экстремум. . . . . . . . . . . . . . . . . . 953
Вторая теорема Лагранжа в матричной форме. . . . . . . . . . . . . . . . 959

16 МЕРА ЖОРДАНА И КРАТНЫЕ ИНТЕГРАЛЫ 960


§ 1 Мера Жордана . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 960
(a) Площадь и объем в школьной геометрии . . . . . . . . . . . . . . . . . . . . . . 960
Площадь многоугольника. . . . . . . . . . . . . . . . . . . . . . . . . . . . 960
Объем геометрической фигуры. . . . . . . . . . . . . . . . . . . . . . . . . 966
(b) Теории меры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 969
Парадокс Банаха-Тарского. . . . . . . . . . . . . . . . . . . . . . . . . . . 970
Понятие меры. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 971
(c) Определение меры Жордана в Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 971
Мера Жордана в R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 972
Двоичная сетка, клеточные множества и клеточная мера в R2 . . . . . . 972
Внутреннее, граничное и инцидентное клеточные множества в R2 . . . . 974
Измеримые множества и мера Жордана в R2 . . . . . . . . . . . . . . . . 977
Мера Жордана в Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 978
(d) Множества нулевой меры Жордана в Rn и критерий измеримости . . . . . . . 979
Свойства внешней меры. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 979
Множества нулевой меры и их свойства. . . . . . . . . . . . . . . . . . . . 980
Критерий измеримости. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 981
Измеримость параллелепипеда. . . . . . . . . . . . . . . . . . . . . . . . . 982
Измеримость шара. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 983
(e) Проверка аксиом меры в Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984
Аксиома кольца. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984
Аксиома нормировки. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 985
Аксиома аддитивности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 985
Следствия из аксиом кольца и аддитивности. . . . . . . . . . . . . . . . . 985
Инвариантность измеримых множеств и меры Жордана относительно
движений. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 986
(f) Мера Жордана в произвольном евклидовом пространстве . . . . . . . . . . . . 991
Определение меры Жордана в евклидовом пространстве. . . . . . . . . . 991
Измеримость многогранников: мера, как продолжение объема. . . . . . . 991
Искажение меры при линейном преобразовании. . . . . . . . . . . . . . . 992
Инвариантность меры Жордана при переходе к внутренности и замы-
канию. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 994
Компакты нулевой меры и теорема об исчерпывании. . . . . . . . . . . . 994
Открытые множества полной меры и теорема о стягивании. . . . . . . . 996
§ 2 Кратные интегралы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 997
(a) Определение и свойства кратного интеграла . . . . . . . . . . . . . . . . . . . . 997
Измеримое разбиение измеримого множества. . . . . . . . . . . . . . . . . 997
Последовательности измельчающихся разбиений. . . . . . . . . . . . . . . 998
Разбиения, подчиненные покрытию. . . . . . . . . . . . . . . . . . . . . . 998
Определение кратного интеграла. . . . . . . . . . . . . . . . . . . . . . . . 999
Интегрируемость непрерывной функции на измеримом компакте. . . . . 1000
Свойства кратного интеграла. . . . . . . . . . . . . . . . . . . . . . . . . . 1000
Интеграл, как функционал на множествах. . . . . . . . . . . . . . . . . . 1002
xxiv Оглавление

(b) Вычисление кратных интегралов . . . . . . . . . . . . . . . . . . . . . . . . . . . 1004


Правильные области в Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1005
Площадь правильной области в R2 . . . . . . . . . . . . . . . . . . . . . . . 1005
Объем правильной области в R3 . . . . . . . . . . . . . . . . . . . . . . . . 1006
Доказательство теоремы о мере правильной области. . . . . . . . . . . . 1009
Переход от двойного интеграла к повторному. . . . . . . . . . . . . . . . 1012
Переход от тройного интеграла к повторному. . . . . . . . . . . . . . . . 1018
(c) Интегралы со значениями в евклидовом пространстве . . . . . . . . . . . . . . 1019
§3 Гладкие, регулярные и полурегулярные отображения компакта . . . . . . . . . . . . . 1022
(a) Гладкие отображения компакта и условие Липшица . . . . . . . . . . . . . . . . 1022
(b) Теоремы Сарда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1022
Условие Липшица и его следствия. . . . . . . . . . . . . . . . . . . . . . . 1022
Условие Гельдера и его следствия. . . . . . . . . . . . . . . . . . . . . . . 1024
Малая теорема Сарда. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1025
Критические точки и критические значения. . . . . . . . . . . . . . . . . 1026
Большая теорема Сарда. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1027
(c) Регулярные и полурегулярные отображения . . . . . . . . . . . . . . . . . . . . 1030
Гладкие отображения компакта. . . . . . . . . . . . . . . . . . . . . . . . . 1030
Регулярная и сингулярная части отображения. . . . . . . . . . . . . . . . 1030
Регулярные и полурегулярные отображения. . . . . . . . . . . . . . . . . 1034
Композиция полурегулярных отображений. . . . . . . . . . . . . . . . . . 1036
След отображения в другом отображении. . . . . . . . . . . . . . . . . . 1037
(d) Подчиненность, эквивалентность и функция перехода . . . . . . . . . . . . . . . 1038
Функция перехода. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1038
Регулярно подчиненные отображения. . . . . . . . . . . . . . . . . . . . . 1040
Вырожденные полурегулярные отображения. . . . . . . . . . . . . . . . . 1041
Подчиненные полурегулярные отображения. . . . . . . . . . . . . . . . . 1043
Эквивалентные полурегулярные отображения. . . . . . . . . . . . . . . . 1045
§4 Замена переменных в кратном интеграле . . . . . . . . . . . . . . . . . . . . . . . . . . 1045
(a) Теорема о замене переменных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1045
Формулировка теоремы о замене переменных в кратном интеграле. . . . 1045
Мера внутренних компактов при полурегулярной замене переменных. . 1045
Мера произвольных компактов при полурегулярной замене переменных. 1050
Доказательство теоремы о замене переменных. . . . . . . . . . . . . . . . 1051
(b) Применение теоремы о замене переменных . . . . . . . . . . . . . . . . . . . . . 1052
Разные замены. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1052
Доказательство теоремы 8.3.52. . . . . . . . . . . . . . . . . . . . . . . . . 1054
Доказательство теоремы 8.3.75. . . . . . . . . . . . . . . . . . . . . . . . . 1055
Доказательство теоремы 8.3.78. . . . . . . . . . . . . . . . . . . . . . . . . 1055
Полярные координаты. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1056
Цилиндрические координаты. . . . . . . . . . . . . . . . . . . . . . . . . . 1058
Сферические координаты. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1059

17 КРИВАЯ, ЕЕ ДЛИНА И ИНТЕГРАЛЫ ПО КРИВОЙ 1062


§ 1 Параметризованная кривая . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1062
(a) Подчиненность, эквивалентность и функция перехода . . . . . . . . . . . . . . . 1063
Скалярная подчиненность и скалярная эквивалентность. . . . . . . . . . 1063
Ориентированная подчиненность и ориентированная эквивалентность . 1066
(b) Разбиения параметризованных кривых . . . . . . . . . . . . . . . . . . . . . . . 1067
Кривые, пересекающиеся несущественно . . . . . . . . . . . . . . . . . . . 1067
Разбиение параметризованной кривой. . . . . . . . . . . . . . . . . . . . . 1068
§ 2 Скалярная кривая, ее длина и изотропный интеграл по кривой . . . . . . . . . . . . . 1071
(a) Скалярная кривая . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1071
Определение скалярной кривой и примеры. . . . . . . . . . . . . . . . . . 1071
След подчиненной кривой в области параметров объемлющей кривой. . 1074
Разбиение скалярной кривой. . . . . . . . . . . . . . . . . . . . . . . . . . 1074
(b) Длина кривой . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1075
Определение длины и формула для ее вычисления. . . . . . . . . . . . . 1075
Длина вырожденной кривой. . . . . . . . . . . . . . . . . . . . . . . . . . 1077
Оглавление xxv

Аддитивность длины. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1078


Длины стягивающихся кривых. . . . . . . . . . . . . . . . . . . . . . . . . 1078
Регулярная аппроксимация скалярной кривой. . . . . . . . . . . . . . . . 1079
Длина кривой, подчиненной регулярной кривой . . . . . . . . . . . . . . 1079
Доказательство формул длины главы 8. . . . . . . . . . . . . . . . . . . . 1080
(c) Изотропный интеграл по кривой . . . . . . . . . . . . . . . . . . . . . . . . . . . 1081
Определение и формула для вычисления изотропного интеграла по кри-
вой. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1081
Изотропный интеграл, как функционал на кривых. . . . . . . . . . . . . 1084
§3 Ориентированная кривая, ее векторная длина и анизотропный интеграл по кривой . 1087
(a) Ориентированная кривая . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1087
Определение ориентированной кривой. . . . . . . . . . . . . . . . . . . . . 1087
Ориентированно подчиненная кривая. . . . . . . . . . . . . . . . . . . . . 1088
Разбиение ориентированной кривой. . . . . . . . . . . . . . . . . . . . . . 1088
Измельчающиеся разбиения ориентированных кривых. . . . . . . . . . . 1090
(b) Векторная длина ориентированной кривой . . . . . . . . . . . . . . . . . . . . . 1092
Определение векторной длины и ее свойства. . . . . . . . . . . . . . . . . 1092
Аддитивность векторной длины. . . . . . . . . . . . . . . . . . . . . . . . 1093
Связь между скалярной и векторной длиной. . . . . . . . . . . . . . . . . 1094
(c) Анизотропный интеграл по кривой и дифференциальные формы степени 1 . . 1096
Дифференциальные формы степени 1. . . . . . . . . . . . . . . . . . . . . 1096
Интеграл от дифференциальной формы степени 1 вдоль кривой. . . . . 1097
Анизотропный интеграл, как функционал на кривых. . . . . . . . . . . . 1101

18 ПОВЕРХНОСТЬ, ЕЕ ПЛОЩАДЬ И ИНТЕГРАЛЫ ПО ПОВЕРХНОСТИ 1105


§ 1 Параметризованная поверхность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1105
(a) Подчиненность, эквивалентность и функция перехода . . . . . . . . . . . . . . . 1106
Якобиан параметризованной поверхности. . . . . . . . . . . . . . . . . . . 1106
Скалярная подчиненность и скалярная эквивалентность. . . . . . . . . . 1107
Ориентированная подчиненность и ориентированная эквивалентность. . 1108
(b) Разбиения параметризованных поверхностей . . . . . . . . . . . . . . . . . . . . 1108
Поверхности, пересекающиеся несущественно. . . . . . . . . . . . . . . . 1108
Разбиение параметризованной поверхности. . . . . . . . . . . . . . . . . . 1109
§ 2 Поверхность, ее скалярная площадь и изотропный интеграл по поверхности . . . . . . 1111
(a) Поверхность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1111
Определение поверхности и примеры. . . . . . . . . . . . . . . . . . . . . 1111
След подчиненной поверхности в области параметров объемлющей по-
верхности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1111
Разбиение скалярной поверхности. . . . . . . . . . . . . . . . . . . . . . . 1111
(b) Площадь поверхности . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1112
Определение площади поверхности и формула для ее вычисления. . . . 1112
Площадь вырожденной поверхности. . . . . . . . . . . . . . . . . . . . . . 1119
Аддитивность площади. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1119
Площади стягивающихся поверхностей. . . . . . . . . . . . . . . . . . . . 1120
Регулярная аппроксимация скалярной поверхности. . . . . . . . . . . . . 1120
Площадь поверхности, подчиненной регулярной поверхности . . . . . . . 1121
Доказательство формул площади главы 8. . . . . . . . . . . . . . . . . . . 1121
(c) Изотропный интеграл по поверхности . . . . . . . . . . . . . . . . . . . . . . . . 1123
Определение и формула вычисления изотропного интеграла по поверх-
ности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1123
Изотропный интеграл, как функционал на поверхностях. . . . . . . . . . 1126
§ 3 Ориентированная поверхность, ее векторная площадь и анизотропный интеграл по
поверхности . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1129
(a) Ориентированная поверхность . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1129
Определение ориентированной поверхности. . . . . . . . . . . . . . . . . . 1129
Ориентированно подчиненная поверхность. . . . . . . . . . . . . . . . . . 1130
Разбиение ориентированной поверхности. . . . . . . . . . . . . . . . . . . 1131
Измельчающиеся разбиения ориентированных поверхностей. . . . . . . . 1132
(b) Векторная площадь ориентированной поверхности . . . . . . . . . . . . . . . . . 1134
xxvi Оглавление

Определение векторной площади и ее свойства. . . . . . . . . . . . . . . 1134


Аддитивность векторной площади. . . . . . . . . . . . . . . . . . . . . . . 1135
Связь между скалярной и векторной площадью. . . . . . . . . . . . . . . 1136
(c) Анизотропный интеграл по поверхности и дифференциальные формы степени 21138
Дифференциальные формы степени 2. . . . . . . . . . . . . . . . . . . . . 1138
Интеграл от дифференциальной формы степени 2 вдоль поверхности. . 1139
Анизотропный интеграл, как функционал на поверхностях. . . . . . . . 1143

19 ТЕОРЕМЫ ГАУССА И СТОКСА 1147


§ 1 Дифференциальные формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1147
(a) Дифференциальные формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1147
Дифференциальные формы как поля внешних форм. . . . . . . . . . . . 1147
Дифференциальные формы как внешние формы на векторных полях. . 1148
(b) Алгебраические свойства дифференциальных форм . . . . . . . . . . . . . . . . 1150
Конкатенация дифференциальных форм. . . . . . . . . . . . . . . . . . . 1150
Разложение дифференциальной формы по базису. . . . . . . . . . . . . . 1151
Внешний дифференциал. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1152
Действие гладкого отображения на дифференциальную форму. . . . . . 1155
(c) Гиперповерхности и интегрирование дифференциальных форм . . . . . . . . . 1158
Гиперповерхности, их объем и ориентированный объем. . . . . . . . . . . 1158
Разбиение гиперповерхности. . . . . . . . . . . . . . . . . . . . . . . . . . 1161
Интеграл от дифференциальной формы. . . . . . . . . . . . . . . . . . . . 1163
Алгебраические операции над гиперповерхностями. . . . . . . . . . . . . 1164
Ориентированные области. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1166
(d) Преобразование гиперповерхностей . . . . . . . . . . . . . . . . . . . . . . . . . . 1169
Составные гиперповерхности. . . . . . . . . . . . . . . . . . . . . . . . . . 1169
Преобразования гиперповерхностей. . . . . . . . . . . . . . . . . . . . . . 1171
§ 2 Теоремы Гаусса и Стокса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1174
(a) Области с краем и теорема Гаусса . . . . . . . . . . . . . . . . . . . . . . . . . . 1174
Скалярные области с краем. . . . . . . . . . . . . . . . . . . . . . . . . . . 1174
Положительный и отрицательный обход края скалярной области. . . . . 1176
Край ориентированной области. . . . . . . . . . . . . . . . . . . . . . . . . 1178
Теорема Гаусса. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1181
(b) Гиперповерхности с краем и теорема Стокса . . . . . . . . . . . . . . . . . . . . 1187
Край гиперповерхности и формула Стокса. . . . . . . . . . . . . . . . . . 1187
Гомотопии. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1189
Ацикличные области. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1192
(c) Теории поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1194
Теория поля в двумерном евклидовом пространстве. . . . . . . . . . . . . 1194
Теория поля в трехмерном евклидовом пространстве. . . . . . . . . . . . 1197
(d) Функции комплексного переменного как аналитические векторные поля . . . . 1200
Сопряжение и симметрия в R2 . . . . . . . . . . . . . . . . . . . . . . . . . 1200
Аналитические и гармонические векторные поля. . . . . . . . . . . . . . 1200
Аналитический интеграл по кривой. . . . . . . . . . . . . . . . . . . . . . 1202
Аналитическая производная и аналитическая первообразная. . . . . . . 1204
Интеграл с переменным верхним пределом от аналитического поля. . . 1205
Формула Ньютона—Лейбница для аналитических полей. . . . . . . . . . 1207
Часть I

ОСНОВАНИЯ МАТЕМАТИКИ

1
Глава 0

ТЕОРИЯ МНОЖЕСТВ

Вся современная математика (за исключением некоторых разделов логики) строится на теории
множеств (понимаемой ныне как система аксиоматических теорий, различающихся некоторыми
деталями). Поэтому если задаваться целью излагать какую-то часть математики (в нашем случае,
Анализ) без пробелов, начинать нужно все-таки с теории множеств.
В этой главе мы опишем одну из аксиоматических теорий множеств, теорию Морса-Келли, и
при этом постараемся сделать это описание максимально формализованным, чтобы дать читателю
представление об игре с символами, о которой мы говорили в Предисловии на с.v.

§1 Наивная теория множеств


Изучение теории множеств удобно начать с ее наивной версии, которая, будучи сформулирована на
современном языке, экономно вводит в курс дела и иллюстрирует проблемы. Эту теорию мы будем
обозначать буквосочетанием NST (“naive set theory”).

(a) Формулы Естественно, кроме A и B в этих высказывани-


ях1 допускается использование других букв из
Элементарные высказывания. Взгляд тео-
заранее выбранного алфавита. Мы будем счи-
рии множеств (не только наивной, но вообще лю-
тать таким алфавитом латинский с прописными
бой) на мир заключается в том, что его объекты
символами2 :
находятся друг с другом в отношении принад-
лежности: если мы рассматриваем произвольные
два объекта A и B, то должно быть истинным
или ложным (или независимым от используемой
нами системы аксиом) утверждение, звучащее
так: A, B, C, D, E, F, G, H, I, J, K, L, M, N,
«A принадлежит B» O, P, Q, R, S, T, U, V, W, X, Y, Z.
или, в эквивалентных формулировках,
«A является элементом B»
«B содержит A в качестве элемента».
Эти символы называются переменными.
Коротко это записывают формулой
A ∈ B.
Помимо этого объекты могут быть одинаковыми
или различаться. Если A и B совпадают, то это • Высказывания вида3 A ∈ B и A = B (где
записывают формулой вместо A и B могут стоять любые другие пе-
ременные) называются атомарными форму-
A = B. лами теории множеств.
1 Точнее, в схемах высказываний, потому что если формула содержит свободные переменные, то это не одно,
семейство высказываний.
2 Логики обычно делают алфавит бесконечным, объявляя допустимым применение индексов или штриха, но на

этом этапе нам будет достаточно конечного набора букв.


3 См. подстрочное примечание 1.

2
§ 1. Наивная теория множеств 3

Логические операции и кванторы. Из ато- • Формула ϕ в формулах (0.1.1) называется об-


марных формул (“простейших высказываний” ластью действия квантора (∀ или ∃, в зави-
этого языка) строятся более сложные с помощью симости от символа перед переменной X).
логических операций и кванторов, список кото-
рых удобно привести в следующей таблице: Приведем некоторые примеры.

символ его смысл название ⋄ 0.1.1. Следующие строки являются формула-


ми теории множеств:
¬ «не» отрицание
& «и» конъюнкция ¬(A = B)
∨ «или» дизъюнкция
(A ∈ B) & (X = Y )
⇒ «влечет за собой» импликация
⇔ «эквивалентно» эквивалентность (A ∈ B) ∨ (B ∈ A)
∀ «для любого» квантор ∀X ∃Y X ∈ Y
всеобщности
⋄ 0.1.2. Следующие строки, наоборот, не явля-
∃ «существует» квантор ются формулами теории множеств:
существования
(A = B)¬
У этих значков имеется формальное описание с
точными правилами употребления (и мы приво- (A ∈ B) (X = Y )
дим его ниже на с.11), однако на этом этапе удоб-
но о таких вещах не задумываться, и в логиче- (A ∈ B) & ∨ (B ∈ A)
ских рассуждениях руководствоваться интуици- ∀ ∃X Y X ∈ Y
ей, воспринимая эти символы просто как систему
сокращений в обыденной речи.
Сокращения.
Высказывания (формулы). Логические • Отрицания отношений = и ∈ имеют специ-
операции и кванторы позволяют строить из ато- альные обозначения:
марных формул (“простейших высказываний”
об объектах теории) более сложные, называемые X 6= Y (0.1.2)
просто формулами. Для их описания использует-
– эквивалентная запись отношения
ся следующее индуктивное определение (в кото-
ром греческие буквы обозначают высказывания, ¬(X = Y ),
то есть формулы, необязательно атомарные, а
возможно, новые, построеные по правилам, ко- а
торые здесь описываются). X∈
/Y (0.1.3)
• Формулой (или высказыванием) теории мно- – эквивалентная запись отношения
жеств объявляется произвольная строка
символов, состоящая из букв латинского ал- ¬(X ∈ Y ).
фавита, символов = и ∈, логических симво-
лов и скобок, построенная по следующим пра- Подстановка.
вилам:
• Вхождение переменной X в формулу ϕ назы-
— если X и Y – переменные, то X = Y явля- вается связанным, если в этом вхождении X
ется формулой, стоит сразу после какого-то квантора, или X
— если X и Y – переменные, то X ∈ Y явля- попадает в область действия какого-то кван-
ется формулой, тора по X. В противном случае это вхожде-
— если строка ϕ – формула, то строка ¬ (ϕ) ние называется свободным.
– тоже формула; • Переменная X в формуле ϕ называется свя-
— если строки ϕ и ψ – формулы, то следую- занной переменной в ϕ, если все ее вхождения
щие строки – тоже формулы: в ϕ связанны. В противном случае X называ-
ется свободной переменной.
(ϕ) & (ψ), (ϕ) ∨ (ψ),
⋄ 0.1.3. В формуле
(ϕ) ⇒ (ψ), (ϕ) ⇔ (ψ),
— если ϕ – формула, а X – переменная, то X = Y & ∃X X ∈ X
следующие строки – тоже формулы:
первое вхождение переменной X является сво-
∀X (ϕ), ∃X (ϕ). (0.1.1) бодным, а остальные – связанными.
4 Глава 0. ТЕОРИЯ МНОЖЕСТВ

⋄ 0.1.4. В следующих формулах X является сво- Чтобы строить теорию, нужны исходные поло-
бодной переменной: жения (называемые аксиомами), из которых за-
тем будут выводиться более сложные утвержде-
X = X, ния (называемые теоремами). В наивной теории
множеств аксиомами удобно считать следующие
X ∈ X, семь высказываний (точнее сказать, классифи-
∃Y X ∈ Y. кационный список высказываний).
Первые три аксиомы называют обычно акси-
А в следующих, наоборот, X – связанная пере- омами равенства:
менная:
∀X X = X, NST-1 Аксиома рефлексивности:
∃X X ∈ X, X = X. (0.1.5)
∀X ∃Y X ∈ Y. Это надо понимать так, что равенство X = X
считается верным для всех множеств X.
• Подстановкой переменной Y вместо перемен-
ной X в формулу ϕ называется формула, по- NST-2 Аксиома симметричности:
лучающаяся из ϕ заменой X на Y во всех сво-
бодных вхождениях переменной X в формуле X = Y ⇒ Y = X. (0.1.6)
ϕ. Мы обозначаем такую формулу символом На человеческом языке это означает, что равен-
ство X = Y формально не отличается от равен-

ϕ (0.1.4) ства Y = X.
X=Y
NST-3 Аксиома транзитивности:

• Подстановка ϕ называется корректной,
X=Y (X = Y & Y = Z) ⇒ X = Z. (0.1.7)
если при замене X на Y вторая переменная
не попадает в область действия квантора по То есть равенства X = Y и Y = Z влекут за
этой переменной. собой равенство X = Z.
Следующая аксиома устанавливает связь
⋄ 0.1.5. Подстановка Y вместо X в формулу
между равенством и отношением принадлежно-
X =Y сти:
NST-4 Аксиома инвариантности:
дает формулу
Y =Y (X = A & Y = B & X ∈ Y ) ⇒ A ∈ B
(0.1.8)
⋄ 0.1.6. Подстановка Y вместо X в формулу
Иными словами, в отношение X ∈ Y можно под-
A=B ставлять множества, равные X и Y , и при этом
будут получаться следсвия.
дает ту же формулу Три последние аксиомы описывают собствен-
но отношение принадлежности:
A=B
NST-5 Аксиома невырожденности:
⋄ 0.1.7. Подстановка Y вместо X в формулу
∃X ∃Y X ∈ Y. (0.1.9)
∃Y X ∈ Y
То есть существуют множества X и Y такие, что
дает формулу X ∈Y.
∃Y Y ∈ Y, NST-6 Аксиома объемности:
однако такая подстановка некорректна, потому X = Y ⇐⇒ ∀A (A ∈ X ⇐⇒ A ∈ Y )
что после замены Y попадает в область действия (0.1.10)
квантора ∃ по Y .
То есть два множества X и Y совпадают, если и
только если они «имеют одинаковый набор эле-
(b) Аксиомы, теоремы и антино-
ментов».
мии.
NST-7 Аксиома безусловного выделе-
Аксиомы наивной теории множеств. Если ния: пусть ϕ – формула теории мно-
не предполагать ничего о свойствах отношений жеств, не содержащая переменную Y в
= и ∈, которым удовлетворяют или не удовле- качестве свободной переменной, тогда
творяют различные множества, то и сказать о
множествах ничего внятного будет невозможно. ∃Y ∀X (X ∈ Y ⇐⇒ ϕ) (0.1.11)
§ 1. Наивная теория множеств 5

Иными словами, существует множество Y , эле- Теоремы. Из аксиом NST-1—NST-7 средства-


ментами которого являются в точности те X, для ми логики выводятся следствия, то есть теоремы
которых выполняется ϕ. этой науки.
Как мы уже говорили, наивная теория мно-
Обозначение {X : ϕ}. Отметим сразу одно жеств противоречива, и поэтому ссылки на ее ре-
важное следствие из аксиом NST-1—NST-7: ак- зультаты содержательного смысла не имеют. Ее
сиома NST-7 позволяет определять объекты: теоремы представляют интерес только как иллю-
страции к идее выводимости утверждений из ак-
• Объект Y в формуле (0.1.11) будет единствен- сиом (абстрактной) теории. Мы приведем лишь
ным по аксиоме NST-6, поэтому ему можно несколько простейших теорем теории NST, при-
приписать обозначение. Это обозначение вы- чем оформлять мы их будем в виде примеров,
глядит так: чтобы у читателя не возникало искушения цити-
{X : ϕ} ровать их в дальнейшем. Нас будет интересовать
цепочка, ведущая к антиномии Рассела.
и, если ϕ не содержит переменной T , харак-
теризуется оно высказыванием ⋄ 0.1.10. В наивной теории множеств множества
∅ и Set не совпадают:

T ∈ {X : ϕ} ⇐⇒ ϕ .
X=T
∅ 6= Set (0.1.15)
⋄ 0.1.8. Пустое множество ∅. В наивной тео-
рии множеств следующее равенство определяет Доказательство. По аксиоме объемности NST-
так называемое пустое множество: 6, чтобы доказать неравенство ∅ 6= Set, доста-
точно подобрать какое-нибудь множество X та-
∅ = {X : X 6= X}. (0.1.12) кое, что
X∈/ ∅ & X ∈ Set .
В соответствии с аксиомой выделения NST-7, Для этого воспользуемся аксиомой невырожден-
расшифровывается эта запись так: элементами ности NST-5 и рассмотрим какие-нибудь два
класса ∅ считаются те и только те множества множества X и Y такие, что
X, которые не равны самому себе. Поскольку
аксиоме NST-1 такое невозможно (высказывание X ∈ Y.
X = X считается верным всегда), множество ∅
вообще не содержит никаких элементов (отчего В силу (0.1.14), X ∈ Set. С другой стороны,
и называется пустым). X ∈/ ∅ (потому что Z ∈ ∅ невозможно ни для
какого Z).
⋄ 0.1.9. Множество Set всех множеств. Точ-
но так же из аксиомы выделения NST-7 следует, ⋄ 0.1.11. В наивной теории множеств всякое
что равенство множество X является элементом некоторого
другого множества Y :
Set = {X : X = X}. (0.1.13)
∀X ∃Y X ∈ Y (0.1.16)
тоже определяет некое множество. Его элемен-
тами считаются те и только те множества X, ко- Доказательство. В качестве Y можно выбрать
торые равны самому себе. Поскольку по аксиоме множество Set.
NST-1 это верно для любого X, получается, что
• Говорят, что множество A содержится в
множество Set должно содержать все на свете
множестве B, или что A является подмно-
множества, то есть
жеством множества B, и изображают это
X ∈ Set (0.1.14) записью
A⊆B
верно для любого объекта X наивной теории если всякий элемент T множества A является
множеств. также элементом множества B:
В том числе это верно и для X = Set, то есть
мы получаем, что истинно высказывание ∀T (T ∈ A ⇒ T ∈ B).

Set ∈ Set ⋄ 0.1.12. В наивной теории множеств для всяко-


го множества X существует множество Y такое,
Здесь важно отметить, что это верно только в что подмножествами в X являются в точности
наивной теории множеств (и это порождает па- те множества A, которые являются элементами
радоксы, о которых мы поговорим ниже). В со- множества Y :
временных аксиоматических теориях множеств
эта формула не будет верна. A ⊆ X ⇐⇒ A ∈ Y (0.1.17)
6 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Доказательство. Множество Y определяется по ⇓


аксиоме NST-7 формулой
n o обязательно или R ∈ R, или R ∈
/R
Y = A : ∀T T ∈A ⇒ T ∈X .

   
Антиномия Рассела. В 1902 году англий- если R ∈ R, то,  если R ∈
/ R, то 
ским математиком Бертраном Расселлом было в силу (0.1.20), в силу (0.1.20),
сделано следующее наблюдение.    
R∈ /R R∈R
⋄ 0.1.13. Антиномия Рассела. По аксиоме без-
условного выделения NST-7 в наивной теории ⇓
множеств определено множество

R = {X : X ∈
/ X}. (0.1.18) R∈R&R∈
/ R.

Оно называется множеством Рассела и состоит Отсюда уже следует, что в NST выводимы каж-
из всевозможных таких множеств X, для кото- дая из формул R ∈ R и R ∈/R
рых верно X ∈
/ X:

X ∈ R ⇐⇒ X ∈
/X (0.1.19) Программа Гильберта. Из антиномии Рассе-
ла (и не только из нее, потому что почти одно-
Зададимся вопросом, будет ли R элементом са-
временно с ней были обнаружены разные дру-
мого себя:
гие противоречия в тогдашней теории множеств)
R ∈ R или R ∈ /R? следует, ни много, ни мало, что в NST вообще лю-
бое утверждение ϕ можно доказать (вместе
Антиномия Рассела состоит в том, что эти с его отрицанием ¬ϕ) — на этот счет имеется
утверждения эквивалентны: специальная теорема логики о противоречивых
теориях, которую мы приводим ниже (теорема
вспоминаем 2.2.3).
определение R
(0.1.19) Понятно, что обнаружение таких противоре-
↓ чий означало, что построенная к тому време-
R∈R ⇐⇒ R – одно из тех X, для
 ни теория множеств, которую мы здесь описа-
которых выполняется X ∈ /X ⇐⇒ R∈/ R ли как аксиоматическую теорию NST, не может

упрощаем выполнять роль фундамента всей математики,
высказывание
для которой она была создана. По этой при-
То есть, чине сама эта теория и связанная с ней логи-
ка, определяющая общие принципы математиче-
R ∈ R ⇐⇒ R ∈ / R. (0.1.20) ских рассуждений — эти области тогда как раз
стали оформляться в специальный раздел мате-
Из этого наблюдения следует много странных матики, называемый основания математики —
утверждений, в частности, такое: были подвергнуты пересмотру. Немецким мате-
матиком Давидом Гильбертом в начале 20 ве-
! 0.1.14. В предположении непротиворечиво-
ка была предложена специальная программа, це-
сти теории NST, в ней оказывается выводима
лью которой объявлялось превращение основа-
формула4
ний математики в “универсальную” аксиомати-
R∈R &R∈ /R (0.1.21)
ческую теорию, где не только будут удалены су-
(из которой следует противоречивость NST), ществующие противоречия, но также будет до-
а также по отдельности каждая из формул казано, что
R∈RиR∈ / R.
1) никаких новых противоречий в дальнейшем
Доказательство. В предположении непротиво- возникнуть не может (это свойство теории на-
речивости теории NST, из закона исключенного зывается непротиворечивостью), и
третьего5 следует такая цепочка:
2) любое утверждение ϕ либо верно само, либо
невозможна ситуация, верно его отрицание ¬ϕ (это называется пол-
когда R ∈ R и одновременно R ∈ /R нотой).
4 На языке формальной логики выводимость формулы (0.1.21) и вытекающую из этого противоречивость теории

NST мы обсуждаем ниже в примере 2.2.2.


5 Ниже мы обсуждаем это правило в примере 0.2.30.
§ 2. Логика предикатов для теории множеств 7

Через некоторое время эта работа привела непротиворечивость любой такой теории (точ-
к определенным успехам: подходящим уточне- нее, любой теории, включающей арифметику,
нием определений и введением новых строгих без которой математику пока все-таки предста-
правил для построения новых объектов удалось вить невозможно). Параллельно обнаружилась
добиться устранения всех накопленных к то- несовместимость непротиворечивости с пол-
му времени в математике противоречий. Однако нотой. Эти результаты принадлежат австрий-
новым неприятным сюрпризом, ставшим одним скому математику Курту Гёделю, и мы о них по-
из главных итогов всей этой деятельности, яви- говорим на с.105 (см. теоремы 2.2.19 и 2.2.22).
лась принципиальная невозможность доказать

§2 Логика предикатов для теории множеств


В 20 веке математики, следуя первоначальному плану Гильберта, построили несколько аксиомати-
ческих теорий множеств, в которых накопленные к тому времени парадоксы (в частности, парадокс
Рассела) были устранены (однако, как мы уже говорили, без гарантий, что новые парадоксы не по-
явятся в будущем). Из них самыми известными являются теории Цермело-Френкеля ZF, Неймана-
Бернайса-Гёделя NBG и Морса-Келли MK. Для этих трех теорий, в силу их особенной популярности,
удобно выбрать общее название, и мы будем поэтому называть их в дальнейшем рабочими теори-
ями множеств. Самой мощной из них является теория Морса-Келли6 MK, и по этой причине мы
будем описывать ее.

(a) Язык теории множеств


Сигнатура теории множеств. В теории Морса-Келли MK, в отличие от наивной теории мно-
жеств NST, исходные объекты называются классами. Интуитивно под этим понимается более широ-
кое образование, чем множество, а сами множества определяются затем как частные случаи классов
(см. ниже определение на с.29). В остальном все детали языка повторяются: считается, что классы,
помимо того, что могут совпадать,
A = B,
еще могут находиться в отношении принадлежности

A∈B

– и в этом случае, как и в NST, говорят, что “A принадлежит B”, или что “A является элементом
B”, или что “B содержит A в качестве элемента”.

Формулы теории множеств. Формулы теории MK определяются так же как в теории NST, с
той разницей, что алфавит удобно расширить, включив строчные буквы латинского алфавита и еще
возможность добавлять к букве штрих. То есть, повторим с уточнениями, на интуитивном уровне,
формула в MK – это утверждение или, другой термин, высказывание о классах7 , которое можно
получить инструментами теории, то есть с помощью отношения принадлежности ∈, к которому
еще добавляется отношение равенства =, а также с помощью (некоторых) логических операций
и кванторов, список которых был приведен в таблице на с.3: ¬, &, ∨, ⇒, ∀, ∃ (символ ⇔ будет
определен позже формулой (0.2.25)). При этом, информация во втором столбце этой таблицы (о
смысле этих символов) приводится пока только для интуитивного понимания существа дела, и для
нашей ближайшей цели – описать понятие формулы в теории множеств – нам не нужна. Точный
смысл этих значков мы объясним на с.11.
Определение понятию формулы выглядит так:
• Переменной в теории множеств мы будем считать произвольную букву латинского ал-
фавита, прописную

A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z,
6 Энтони Морс, Джон Келли. В компактном виде эта теория описана в Добавлении к учебнику Дж. Л. Келли [5].

Об используемом логическом аппарате можно составить представление по книге Г. Такеути [13].


7 Правильнее сказать, “схема высказываний”, потому что, например, формула X ∈ Y — это не высказывание о

каких-то конкретных X и Y , а схема, включающая все высказывания вида “ X принадлежит Y ”.


8 Глава 0. ТЕОРИЯ МНОЖЕСТВ

или строчную,

a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,

либо такую же букву с добавленным (возможно, несколько раз) штрихом, то есть если α
– переменная, то α′ – тоже переменная, например

A′ , A′′ , ..., a′ , a′′ , ...

• Формулой (или высказыванием) теории множеств называется произвольная строка из


переменных, символов = и ∈, логических символов и скобок, построенная по следующим
правилам:
1) если X и Y – переменные, то запись

X =Y (0.2.22)

является формулой,
2) если X и Y – переменные, то запись

X∈Y (0.2.23)

является формулой,
3) если строка ϕ – формула, то строка ¬ (ϕ) – тоже формула;
4) если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:

(ϕ) & (ψ), (ϕ) ∨ (ψ), (ϕ) ⇒ (ψ),

Для обозначения формул мы будем использовать греческие буквы.


5) если ϕ – формула, а X – переменная, то следующие строки – тоже формулы:

∀X (ϕ), ∃X (ϕ). (0.2.24)

• Формула ϕ в формулах (0.2.24) называется областью действия квантора (∀ или ∃, в


зависимости от символа перед переменной α).
• Для любых переменных α и β формулы (0.2.22) и (0.2.23) называются атомарными (в
теории множеств).
• К списку логических символов выше добавляется символ эквивалентности ⇔, который
понимается так: запись (ϕ) ⇔ (ψ) является сокращением записи

((ϕ) ⇒ (ψ)) & ((ψ) ⇒ (ϕ)). (0.2.25)

• Вхождение переменной α в формулу ϕ называется связанным, если в этом вхождении


α стоит сразу после какого-то квантора, или α попадает в область действия какого-то
квантора по α. В противном случае это вхождение называется свободным.
• Переменная α в формуле ϕ называется связанной переменной в ϕ, если все ее вхождения
в ϕ связанны. В противном случае α называется свободной переменной.
• Если формула ϕ не содержит свободные переменные, то ϕ называется замкнутой. Если
же в ϕ имеются свободные переменные, то ϕ называется открытой формулой.
• Отрицания отношений = и ∈ имеют специальные обозначения:

X 6= Y (0.2.26)

– эквивалентная запись отношения

¬(X = Y ),

а
X∈
/Y (0.2.27)
– эквивалентная запись отношения
¬(X ∈ Y ).
§ 2. Логика предикатов для теории множеств 9

• Подстановкой переменной Y вместо переменной X в формулу ϕ называется формула,


получающаяся из ϕ заменой X на Y во всех свободных вхождениях переменной X в
формуле ϕ. Мы обозначаем такую формулу символом


ϕ (0.2.28)
X=Y


• Подстановка ϕ называется корректной, если при замене X на Y вторая переменная
X=Y
не попадает в область действия какого-нибудь квантора по этой переменной.

⋄⋄ 0.2.1. Следующие формулы замкнуты: следних двух примерах переменная Y – связан-


ная.)
1) ∀X (X = X); 4) ∀X (X ∈
/ X);
⋄⋄ 0.2.3. Примеры двуместных открытых фор-
2) ∀X (X 6= X); 5) ∀Y (∃X (X ∈ Y )); мул:
3) ∀X (X ∈ X); 6) ∃Y (∀X (X ∈ Y )).
1) X = Y ;
(Здесь всюду X и Y – связанные переменные.) 2) X 6= Y ;
3) X ∈ Y ;
⋄⋄ 0.2.2. Примеры одноместных открытых фор-
4) X ∈
/ Y;
мул:  
5) ∃Z X ∈ Z & Y ∈ Z ;
1) X = X; 4) X ∈
/ X;  
6) ∃Z X ∈ Z & Z ∈ Y .
2) X 6= X; 5) ∀Y X ∈ Y ;
3) X ∈ X; 6) ∃Y X ∈ Y . (Здесь всюду X и Y – свободные переменные, а
в последних двух примерах переменная Z – свя-
(Здесь всюду X – свободная переменная, а в по- занная.)

Квантор ∃! существования и единственности. Запись

∃!x α

представляет собой сокращение записи


 
(∃x α) & (α & α x=y ) ⇒ x = y (0.2.29)

(b) Логика предикатов в аксиоматизации Генцена


Для формализации логических рассуждений, с помощью которых из одних формул (высказываний)
выводятся другие, математики построили несколько аксиоматических систем логики, из которых
наиболее известны так называемое исчисление предикатов CQC, построенное самим Давидом Гиль-
бертом, и эквивалентное ему исчисление секвенций LK, предложенное другим немецким математи-
ком, Герхардом Генценом. Эти две системы описывают доминирующую ныне в математике систему
логики, называемую логикой предикатов. Из них двух более наглядна и удобна в вычислениях
система Генцена8 , поэтому для описания логики предикатов мы выбираем ее.

Секвенции. Формулы в языке связаны между собой тем, что одни следуют из других. Если нас
интересует вопрос, следует ли формула χ из формулы ϕ, то это принято записывать строчкой

ϕ ⊢ χ,

и называется такая запись секвенцией. В секвенции может быть несколько формул слева и справа
от знака секвенции ⊢, тогда эти формулы должны быть разделены запятыми, и при этом запятая
8 См. сравнение на с.171.
10 Глава 0. ТЕОРИЯ МНОЖЕСТВ

слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как сокращение
символа ∨.9 То есть, например, секвенция

ϕ, χ ⊢ ψ, ω

означает, что мы хотим понять, следует ли формула ψ ∨ ω из формулы ϕ &χ, и поэтому она экви-
валентна секвенции
ϕ &χ ⊢ ψ ∨ ω. (0.2.30)
Точно так же секвенция
α, β, γ ⊢ δ, η, θ, ι
эквивалентна секвенции
α &β &γ ⊢ δ ∨ η ∨ θ ∨ ι.
В секвенции формулы могут повторяться, например, так:

ϕ, ϕ ⊢ χ,

или так
ϕ ⊢ χ, χ, χ
(повторение может быть сколь угодно длинным, но конечным, потому что формул в секвенции
всегда конечный набор).
Заглавные греческие буквы, например, Γ , ∆, обозначают конечные наборы формул (возможно,
повторяющихся), связанных запятыми. В частности, запись

Γ ⊢∆

означает секвенцию, в которой под Γ и ∆ понимаются такие конечные наборы формул. Точно так
же запись
A, B ⊢ Γ, ∆
означает секвенцию, в которой A, B, Γ , ∆ тоже такие наобры формул, причем там, где кончается
A и начинается B тоже стоит запятая (и то же самое для Γ и ∆).
В секвенции
Γ ⊢∆
набор формул Γ (слева от знака ⊢) называется антецедентом (или посылкой), а набор формул ∆
(справа от знака ⊢) – сукцедентом (или следствием). Не всегда ∆ следует из Γ , но в тех случаях,
когда удается построить так называемый вывод для секвенции Γ ⊢ ∆ (что это такое мы объясним
на с.12), говорят, что эта секвеция выводима (а ∆ действительно следует из Γ ).
Наборы Γ или ∆ могут быть пустыми: секвенция

⊢ ∆,

если она выводима, означает, что дизъюнкция формул ∆ следует из пустого набора формул (это
можно понимать так, что ∆ следует из чего угодно)10 , а секвенция

Γ ⊢

– что из конъюнкции формул Γ следует все что угодно11 . Секвенция, пустая с обеих сторон

⊢,

если она выводима, означает, что в этом языке из любого набора формул Γ следует любой набор
формул ∆ (это понимается так, что рассматриваемый язык противоречив12).
9 Это правило, — “запятая слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как

сокращение символа ∨”, — формально не присутствует в правилах исчисления LK, оно выводится потом. В нашем
тексте оно доказывается ниже в теоремах 0.2.28 и 0.2.29.
10 См. ниже в качестве иллюстрации пример 0.2.30.
11 См. ниже в качестве иллюстрации пример 0.2.31.
12 См. по этому поводу теорему 2.2.5 ниже.
§ 2. Логика предикатов для теории множеств 11

Аксиома и правила вывода в LK. Следующий вариант исчисления LK модифицирован специ-


ально под язык теории множеств13 .
• Аксиома исчисления секвенций LK. Прежде всего, считается что для любой формулы ϕ
выводима секвенция

ϕ ⊢ ϕ. (LK-0)

Это соглашение называется аксиомой исчисления LK (и других аксиом в этом исчислении


нет).
• Правила вывода в исчислении секвенций LK. Далее вводятся следующие правила, в кото-
рых запись
Γ ⊢∆
Π ⊢Λ
означает, что если выводима верхняя секвенция, Γ ⊢ ∆, то выводима и нижняя, Π ⊢ Λ.
Если же вверху стоят две секвенции, разделенные широким пробелом
Γ ⊢∆ Π⊢Λ
,
Θ⊢Ω
то это означает, что из выводимости обеих верхних секвенций, Γ ⊢ ∆ и Π ⊢ Λ, следует
выводимость нижней, Θ ⊢ Ω.
Эти правила делятся на две группы.
a. Структурные правила:
— ослабление:
Γ ⊢∆ Γ ⊢∆
(LK-1)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
(LK-2)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
Γ, ϕ, χ, Π ⊢ ∆ Γ ⊢ ∆, ϕ, χ, Λ
(LK-3)
Γ, χ, ϕ, Π ⊢ ∆ Γ ⊢ ∆, χ, ϕ, Λ
— сечение:
Γ ⊢ ∆, ϕ ϕ, Π ⊢ Λ
(LK-4)
Γ, Π ⊢ ∆, Λ
b. Логические правила:
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
(LK-5)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— конъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
(LK-6)
Γ ⊢ ∆, ϕ&χ
— конъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
(LK-7)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
(LK-8)
ϕ ∨ χ, Γ ⊢ ∆
13 Ниже на с.106 мы опишем язык формальной теории в общем виде. В нем допускается наличие функциональных

символов (которых нет в языке теории множеств, из-за чего тот проще). Для языков с функциональными симво-
лами нижеприводимые правила вывода LK-12 и LK-15 усложняются тем, что вместо переменной y в них позволено
подставлять произвольный терм (понятие терма будет определено на с.106).
12 Глава 0. ТЕОРИЯ МНОЖЕСТВ

— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
(LK-9)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
(LK-10)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
(LK-11)
Γ ⊢ ∆, ϕ ⇒ χ

— добавление квантора всеобщности в антецедент: если подстановка ϕ x=y
корректна14 , то

ϕ x=y , Γ ⊢ ∆
(LK-12)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y не
входит (как свободная переменная) в нижнюю секвенцию (то есть в
наборы формул Γ , ∆, ∀x ϕ), то

Γ ⊢ ∆, ϕ x=y
(LK-13)
Γ ⊢ ∆, ∀x ϕ
— добавление квантора существования в антецедент: если переменная y
не входит (как свободная переменная) в нижнюю секвенцию (то есть
в наборы формул ∃x ϕ, Γ , ∆), то

ϕ x=y , Γ ⊢ ∆
(LK-14)
∃x ϕ, Γ ⊢ ∆
— добавление
квантора существования в сукцедент: если подстановка
ϕ x=y корректна15 , то

Γ ⊢ ∆, ϕ x=y
(LK-15)
Γ ⊢ ∆, ∃x ϕ

Дерево Генцена и выводимость секвенций в LK. Теперь объясним, как это работает. Если
нам даны какие-то два набора формул Γ и ∆ (то есть два набора высказываний в языке теории
множеств), то в этой науке имеет смысл высказывание

“выводима секвенция Γ ⊢ ∆”, (0.2.31)

интуитивно означающее, что16

“каждая из формул в наборе ∆ следует из всей системы формул Γ ” (0.2.32)

и для краткости оформляемая иногда в виде высказывания

“набор формул ∆ следует из набора формул Γ ”. (0.2.33)

Правила вывода (LK-0) — (LK-15) дают нам (в некоторых случаях) формальную возможность
понять, действительно ли выводима секвенция

Γ ⊢∆ (0.2.34)
14 Определение корректной подстановки дано на с. 9.
15 См.определение на с. 9.
16 Почему (0.2.31) эквивалентно (0.2.32) станет понятно только после теорем 0.2.28 и 0.2.29 ниже.
§ 2. Логика предикатов для теории множеств 13

(это не всегда просто и даже не всегда можно выяснить, но довольно часто все-таки получается, и
математика строится на этом). Для этого надо попытаться представить ее как результат применения
какого-нибудь правила вывода из (LK-1) — (LK-15), оформив это в виде картинки

Γ ′ ⊢ ∆′
Γ ⊢∆
или
Γ ′ ⊢ ∆′ Γ ′′ ⊢ ∆′′
Γ ⊢∆
′ ′′ ′ ′′
где Γ , Γ и ∆ и ∆ – некие новые наборы формул. После этого нужно попробовать достроить эту
картинку, проделав то же самое с новыми секвенциями Γ ′ ⊢ ∆′ и Γ ′′ ⊢ ∆′′ , и так далее. Картинка
которая у нас будет всякий раз получаться, например, что-нибудь в таком духе,
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
(0.2.35)
Γ ⊢∆
— называется деревом Генцена. В нем секвенция в самом низу (здесь это Γ ⊢ ∆) называется корнем,
а секвенции на самом верху (в данном случае Γ ′′′ ⊢ ∆′′′ и Γ ′′′′ ⊢ ∆′′′′ ) — вершинами.
Если (за конечное число шагов) нам удастся построить дерево Генцена, в котором на вершинах
стоят аксиомы исчисления LK, то есть секвенции вида (LK-0),

ϕ ⊢ ϕ,

(где антецедент не отличается от сукцедента), то


— такое дерево Генцена называется выводом секвенции Γ ⊢ ∆ в исчислении секвенций LK, а
— сама секвенция Γ ⊢ ∆ называется выводимой в исчислении секвенций LK.
Если же такой вывод построить невозможно (такое случается, см. ниже примеры на с.173), то
секвенция Γ ⊢ ∆ называется невыводимой, а про набор формул ∆ говорят, что он не следует из
набора формул Γ в исчислении секвенций LK.
Сформулируем сказанное в виде следующего резюме:
• Пусть
Γ ⊢ ∆, (0.2.36)
— произвольная секвенция (у которой антецедент и сукцедент состоят из произвольных
наборов формул).
1) Деревом Генцена для секвенции (0.2.36) называется произвольная запись вида
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
(0.2.37)
Γ ⊢∆
в которой в самом низу записана секвенция (0.2.36), и каждый переход снизу
вверх представляет собой применение одного из правил (LK-0) — (LK-15),
2) Если у какого-то дерева Генцена (0.2.37) на всех вершинах стоят аксиомы ис-
числения LK, то есть секвенции вида (LK-0),

ϕ ⊢ ϕ,

(где антецедент не отличается от сукцедента), то такое дерево Генцена называ-


ется выводом для секвенции (0.2.36) в исчислении секвенций LK,
3) Секвенция (0.2.36) назвается выводимой в исчислении секвенций LK, если у нее
существует вывод. При этом говорят, что в исчислении LK набор формул ∆
следует из набора формул Γ .

Рассмотрим примеры. мость секвенции


⋄ 0.2.4. Правило “modus ponens” в исчисле-
нии секвенций LK можно понимать как выводи- α, α ⇒ β ⊢ β (0.2.38)
14 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Ее выводом будет дерево Генцена Или, если подставить ее отрицание ∀x x ∈


/ x, по-
лучится также выводимая секвенция
α⊢α β⊢β
(LK-10)
α ⇒ β, α ⊢ β ⊢ ¬¬(∀x x ∈
/ x) ⇔ (∀x x ∈
/ x).
(LK-3)
α, α ⇒ β ⊢ β

(потому что на его вершинах стоят аксиомы). То же справедливо для всех остальных примеров
Это дерево Генцена означает, что секвенция ниже, и мы не будем дальше об этом напоминать.
(0.2.38) выводима независимо от того, какие
формулы языка теории множеств подставишь
вместо α и β. Например, подставив вместо α фор- ⋄ 0.2.7. Для секвенции
мулу x ∈ x, а вместо β формулу ∃y x ∈ y, мы
получим выводимую секвенцию
α&β⊢β &α (0.2.41)
x ∈ x, x ∈ x ⇒ (∃y x ∈ y) ⊢ ∃y x ∈ y.

⋄ 0.2.5. Для секвенции


вывод может быть таким:
α, β ⊢ α ⇒ β (0.2.39)

дерево Генцена может быть таким: β⊢β α⊢α


(LK-7) (LK-7)
β⊢β
α&β⊢β α&β⊢α
(LK-1)
(LK-6)
α, α, β ⊢ β
α&β⊢β &α
(LK-11)
α, β ⊢ α ⇒ β

Здесь на вершинах стоят аксиомы, поэтому это


⋄ 0.2.8. Для секвенции
дерево является выводом. То есть секвенция
(0.2.73) выводима. Опять это верно для любых
формул α и β, поэтому если, например, вместо α
α ⇒ β ⊢ ¬β ⇒ ¬α (0.2.42)
подставить формулу x ∈ x, а вместо β формулу
x ∈ y, мы получим выводимую секвенцию

x ∈ x, x ∈ y ⊢ x ∈ x ⇒ x ∈ y. вывод может быть таким:

⋄ 0.2.6. Для секвенции


α⊢α
⊢ ¬¬α ⇔ α (0.2.40) (LK-1)
¬β, α ⊢ α ¬β ⊢ ¬β
вывод содержит две ветви:
(LK-3) (LK-1)

α⊢α α⊢α α, ¬β ⊢ α ¬β ⊢ ¬β, ¬α


(LK-5) (LK-5) (LK-5) (LK-3)

⊢ α, ¬α ¬α, α ⊢ ¬β ⊢ α, ¬α ¬β ⊢ ¬α, ¬β
(LK-5) (LK-5) (LK-3) (LK-5)

¬¬α ⊢ α α ⊢ ¬¬α ¬β ⊢ ¬α, α β, ¬β ⊢ ¬α


(LK-11) (LK-11) (LK-10)

⊢ ¬¬α ⇒ α ⊢ α ⇒ ¬¬α α ⇒ β, ¬β ⊢ ¬α
(LK-6) (LK-3)

⊢ (¬¬α ⇒ α) & (α ⇒ ¬¬α) ¬β, α ⇒ β ⊢ ¬α


(0.2.25) (LK-11)

⊢ ¬¬α ⇔ α α ⇒ β ⊢ ¬β ⇒ ¬α

Как и в предыдущих примерах, здесь под α по-


нимается любая формула на языке теории мно-
жеств, например, можно подставить формулу ⋄ 0.2.9. Для секвенции
∃x x ∈ x, и мы получим выводимую секвенцию

⊢ ¬¬(∃x x ∈ x) ⇔ (∃x x ∈ x). α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ) (0.2.43)


§ 2. Логика предикатов для теории множеств 15

вывод такой: – не аксиома, поэтому это дерево не будет выво-


дом.
γ⊢γ Однако формально это не означает, что се-
(LK-1) квенция (0.2.45) невыводима в LK, потому что
α⊢α γ, β ⊢ γ, β γ, β ⊢ γ для нее можно строить разные другие деревья,
(LK-1) (LK-10) например, такое:
α ⊢ α, γ β ⇒ γ, β ⊢ γ
(LK-1) (LK-3) α, α, α ⊢
β ⇒ γ, α ⊢ α, γ β, β ⇒ γ ⊢ γ (LK-2)

(LK-3) (LK-1) α, α ⊢
β ⇒ γ, α ⊢ γ, α α, β, β ⇒ γ ⊢ γ (LK-5)

(LK-3) (LK-3) α ⊢ ¬α.


α, β ⇒ γ ⊢ γ, α β, α, β ⇒ γ ⊢ γ Или такое:
(LK-10)
α ⇒ β, α, β ⇒ γ ⊢ γ α⊢β β ⊢ ¬α
(LK-3) (LK-4)

α, α ⇒ β, β ⇒ γ ⊢ γ α ⊢ ¬α.
(LK-3)
(где вместо β можно вставлять разные другие
α, β ⇒ γ, α ⇒ β ⊢ γ формулы). Эти два дерева также не будут вы-
(LK-11)
водами (потому что на их вершинах снова стоят
β ⇒ γ, α ⇒ β ⊢ α ⇒ γ не аксиомы), но, поскольку таких деревьев мож-
(LK-11)
но получить бесконечно много, перебрать все ва-
α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ) рианты без специально разработанных для этого
технических средств не получится.
⋄ 0.2.10. Для секвенции
Забегая вперед, скажем, что для атомарных
17
¬(α ⇒ β) ⊢ α & ¬β (0.2.44) формул α секвенция (0.2.45) невыводима. Од-
нако доказать это мы сможем только на с.173 (в
вывод такой: примере 2.4.3).
⋄ 0.2.12. Для секвенции
α⊢α β⊢β
(LK-1) (LK-5) ∀x α ⊢ α (0.2.46)
α ⊢ α, β ⊢ β, ¬β
(LK-3) (LK-1) вывод такой:
α ⊢ β, α α ⊢ β, ¬β α⊢α
(LK-6) (LK-12)
α ⊢ β, α & ¬β ∀x α ⊢ α
(LK-3)
α ⊢ α & ¬β, β ⋄ 0.2.13. Для секвенции, противоположной
(LK-11) (0.2.46),
⊢ α & ¬β, α ⇒ β α ⊢ ∀x α (0.2.47)
(LK-5) вывод построить не удается. Для построения де-
¬(α ⇒ β) ⊢ α & ¬β рева Генцена выберем какую-нибудь перемен-
ную, отличную от x и не входящие в формулу
⋄ 0.2.11. До сих пор секвенции, которые мы рас- α. Пусть такой переменной будет y. Тогда дере-
сматривали, были выводимыми. Рассмотрим в во Генцена может быть таким:
качестве контрпримера следующую секвенцию:
α ⊢ α x=y
α ⊢ ¬α. (0.2.45) (LK-13)
α ⊢ ∀x α
Самое простое дерево Генцена, которое для нее
можно построить, выглядит так: Как и в примере 0.2.11, здесь секвенция, стоящая
на вершине
α, α ⊢ α ⊢ α x=y
(LK-5)
α ⊢ ¬α. — не аксиома. Поэтому такое дерево не будет вы-
водом для (0.2.47).
В нем секвенция на вершине, Но опять, как и в примере 0.2.11, из это-
го формально не следует, что секвенция (0.2.47)
α, α ⊢ невыводима, потому что дерево вывода для нее
17 Атомарные формулы в теории множеств были определены на с.8.
16 Глава 0. ТЕОРИЯ МНОЖЕСТВ

можно строить по-разному, и таких вариантов ⋄ 0.2.17. Для противоположной секвенции


имеется бесконечно много из-за неоднозначно-
сти при движении вверх в правилах сокращения ∃x α ⊢ ∀x α (0.2.51)
(LK-2) и сечения (LK-4). Скажем, если применить вывод построить не удается. Для построения де-
правило сокращения (LK-2) в самом начале (и рева Генцена выберем какие-нибудь две перемен-
выбрать больше переменных, отличных от x и ные, отличные от x и не входящие в формулу α.
не входящих в α, например, пусть такими пере- Пусть такими переменными будут a и b. Тогда
менными будут y и z), то можно получить дерево дерево Генцена может быть таким:

α ⊢ α x=y , α x=z α x=a ⊢ α x=b
(LK-13)
(LK-13)
α ⊢ α x=y , ∀x α α x=a ⊢ ∀x α
(LK-3) (LK-14)

α ⊢ ∀x α, α x=y ∃x α ⊢ ∀x α
(LK-13) Как и в примере 0.2.11, здесь секвенция, стоящая
α ⊢ ∀x α, ∀x α на вершине
(LK-2) α x=a ⊢ α x=b
α ⊢ ∀x α
— не аксиома. Поэтому такое дерево не будет вы-
– и оно опять не будет выводом, потому что се- водом для (0.2.51).
квенция на вершине Но опять, как и в примере 0.2.11, из это-
го формально не следует, что секвенция (0.2.51)

α ⊢ α x=y , α x=z невыводима, потому что дерево вывода для нее
можно строить по-разному, и таких вариантов
– не аксиома. имеется бесконечно много из-за неоднозначно-
Как и в примере 0.2.11, мы здесь ограничим- сти при движении вверх в правилах сокращения
ся заявлением, что для атомарных формул α со (LK-2) и сечения (LK-4). Скажем, если применить
свободной переменной x секвенция (0.2.51) невы- правило сокращения (LK-2) в самом начале (и
водима, но почему это так, мы покажем только выбрать больше переменных, отличных от x и не
на с.173 (в примере 2.4.4). входящих в α, например, пусть такими перемен-
ными будут a, b, c), то можно получить дерево
⋄ 0.2.14. Для секвенции
α x=a , α x=b ⊢ α x=c
α ⊢ ∃x α (0.2.48) (LK-13)

α x=a , α x=b ⊢ ∀x α
вывод такой: (LK-14)
∃x α, α x=b ⊢ ∀x α
α⊢α (LK-3)

(LK-15) α x=b , ∃x α ⊢ ∀x α
α ⊢ ∃x α (LK-14)
∃x α, ∃x α ⊢ ∀x α
⋄ 0.2.15. Для секвенции, противоположной (LK-2)
(0.2.48), ∃x α ⊢ ∀x α
∃x α ⊢ α, (0.2.49)
– и оно опять не будет выводом, потому что се-
вывод построить не удается (так же, как в приме- квенция на вершине
ре 0.2.13). Мы докажем, что эта секвенция невы-
водима для атомарных формул α со свободной α x=a , α x=b ⊢ α x=c
переменной x в примере 2.4.5. – не аксиома.
⋄ 0.2.16. Для секвенции Как и в примере 0.2.11, мы здесь ограничим-
ся заявлением, что для атомарных формул α со
∀x α ⊢ ∃x α (0.2.50) свободной переменной x секвенция (0.2.51) невы-
водима, но почему это так мы покажем только в
вывод такой: конце этого параграфа (в примере 2.4.6).
⋄ 0.2.18. Чтобы доказать выводимость секвен-
α⊢α
ции
(LK-15)
∀x ∀y α ⊢ ∀y ∀x α (0.2.52)
α ⊢ ∃x α
(LK-12) нужно выбрать какие-нибудь две переменные,
∀x α ⊢ ∃x α отличные от x и y, и не входящие в формулу α.
§ 2. Логика предикатов для теории множеств 17

Пусть это будут a и b. Тогда вывод может быть c, d. Тогда дерево Генцена может быть таким:
таким:
α|x=a,y=c ⊢ α|x=d,y=b
(LK-13)
α|x=a,y=b ⊢ α|x=a,y=b
(LK-12)
α|x=a,y=c ⊢ ∀x α|y=b
(LK-14)
∀y α|x=a ⊢ α|x=a,y=b
(LK-12)
∃y α|x=a ⊢ ∀x α|y=b
(LK-15)
∀x ∀y α ⊢ α|x=a,y=b
(LK-13)
∃y α|x=a ⊢ ∃y ∀x α
(LK-12)
∀x ∀y α ⊢ ∀x α|y=b
(LK-13)
∀x ∃y α ⊢ ∃y ∀x α
∀x ∀y α ⊢ ∀y ∀x α Снова, как и в примерах 0.2.11 и 0.2.51, мы ска-
жем здесь, что секвенция (0.2.55) невыводима,
⋄ 0.2.19. Точно так же чтобы доказать выводи- пообещав доказать это потом.
мость секвенции
⋄ 0.2.22. Для секвенции
∃x ∃y α ⊢ ∃y ∃x α, (0.2.53) ∀x ∀y α ⊢ ∀y ∀x α (0.2.56)
вывод такой:
нужно выбрать какие-нибудь две переменные,
отличные от x и y, и не входящие в формулу α. α⊢α
Пусть опять это будут a и b. Тогда вывод может (LK-15)
быть таким: α ⊢ ∃x α
(LK-12)
α|x=a,y=b ⊢ α|x=a,y=b ∀x α ⊢ ∃x α
(LK-15)
⋄ 0.2.23. Для секвенции
α|x=a,y=b ⊢ ∃x α|y=b
(LK-15) (∀x α) & (∀x β) ⊢ ∀x (α & β) (0.2.57)
α|x=a,y=b ⊢ ∃y ∃x α
вывод такой:
(LK-14)
∃y α|x=a ⊢ ∃y ∃x α α&β⊢α&β
(LK-14) (LK-12)
∃x ∃y α ⊢ ∃y ∃x α (∀x α) & (∀x β) ⊢ α & β
(LK-13)
⋄ 0.2.20. Тот же прием позволяет доказать вы- (∀x α) & (∀x β) ⊢ ∀x (α & β)
водимость секвенции И точно так же выводится секвенция

∃x ∀y α ⊢ ∀y ∃x α, (0.2.54) ∀x (α & β) ⊢ (∀x α) & (∀x β) (0.2.58)


⋄ 0.2.24. Выводимы следующие секвенции:
Пусть опять a и b – переменные, отличные от x
и y, и не входящие в формулу α. Тогда вывод α, β ⊢ α & β, (0.2.59)
может быть таким: α ∨ β ⊢ α, β. (0.2.60)

α|x=a,y=b ⊢ α|x=a,y=b Доказательство. 1. Вывод для (0.2.59) выгля-


(LK-15) дит так:
α|x=a,y=b ⊢ ∃x α|y=b α⊢α
(LK-12) (LK-1)
∀y α|x=a ⊢ ∃x α|y=b β, α ⊢ α β⊢β
(LK-13) (LK-3) (LK-1)
∀y α|x=a ⊢ ∀y ∃x α α, β ⊢ α α, β ⊢ α
(LK-14) (LK-6)
∃x ∀y α ⊢ ∀y ∃x α α, β ⊢ α & β

⋄ 0.2.21. Для секвенции, противоположной 2. А для (0.2.60) вывод такой:


(0.2.54), β⊢β
∀x ∃y α ⊢ ∃y ∀x α, (0.2.55) (LK-1)
α⊢α β ⊢ β, α
вывод построить не получается. В качестве при- (LK-1) (LK-3)
мера дерево Генцена можно построить так. Вы- α ⊢ α, β β ⊢ α, β
берем четыре переменных, отличных от x и y, и (LK-8)
не входящих в формулу α. Пусть это будут a, b, α ∨ β ⊢ α, β
18 Глава 0. ТЕОРИЯ МНОЖЕСТВ

∀x (α ⇒ ¬β) ⊢ ¬(∃x α & ∀x β)


⊲⊲ 0.2.25. Докажите выводимость секвенций в ∀x (α ⇒ ¬β) ⊢ ¬(∃x α & ∃x β)
LK:
¬∃x α ⊢ ¬∀x α

Отношение выводимости между секвенциями.


• Условимся говорить, что секвенция
Γ ⊢∆ (0.2.61)
выводится из секвенций
Γ1 ⊢ ∆1 , ... , Γn ⊢ ∆n (0.2.62)
если существует дерево Генцена у которого в корне стоит секвенция (0.2.61), а на вершинах
либо секвенции (0.2.62), либо какие-то выводимые секвенции:

Γ1 ⊢ ∆1 Γn ⊢ ∆n Λ1 ⊢ Ω1 Λm ⊢ Ωm

... ... ... ... ... ...


(0.2.63)
...

Γ ⊢∆

(где про секвенции Λi ⊢ Ωi известно, что они выводимы в LK).


! 0.2.26. Из этого условия следует, между прочим, что если в исчислении LK выводятся секвенции
(0.2.62), то в LK выводится и секвенция (0.2.61) (потому что мы можем подклеить выводы для
секвенций (0.2.62) и выводы для секвенций Λi ⊢ Ωi сверху к дереву (0.2.63), и мы получим вывод
(0.2.61)).

⋄ 0.2.27. Из секвенций 2. А для секвенции α ∨ β ⊢ α′ ∨ β ′ — из дерева


α ⊢ α′ β ⊢ β′, α ⊢ α′ β ⊢ β′
выводятся секвенции (LK-9) (LK-9)
′ ′ ′ ′ α ⊢ α′ ∨ β ′ β ⊢ α′ ∨ β ′
α&β⊢α &β α∨β ⊢α ∨β .
(LK-8)
Доказательство. 1. Для секвенции α & β ⊢ α ∨ β ⊢ α′ ∨ β ′
α′ & β ′ это видно из дерева
α ⊢ α′ β ⊢ β′
(LK-7) (LK-7)
α & β ⊢ α′ α & β ⊢ β′
(LK-6)
α & β ⊢ α′ & β ′

Почему антецедент можно понимать как конъюнкцию, а сукцедент как дизъюнкцию


входящих в них формул. Когда на странице 10 мы вводили понятие секвенции, мы сказали
там, между прочим, что ее антецедент нужно понимать как конъюнкцию входящих в него формул, а
сукцедент — как дизъюнкцию. Однако из перечисленных потом формальных правил (LK-0)—(LK-15)
пока не видно, почему это должно быть так. Мы это объясним в приводимых ниже теоремах 0.2.28
и 0.2.29:
Теорема 0.2.28 (об антецеденте). Пусть Γ — конечный набор формул в LK и γ — конъюнкция
этих формул. Тогда для всякого набора формул ∆ секвенции

Γ ⊢∆ (0.2.64)
§ 2. Логика предикатов для теории множеств 19

и
γ⊢∆ (0.2.65)
выводятся друг из друга в LK.
Доказательство. Здесь достаточно рассмотреть случай, когда Γ состоит из двух формул α и β,
потому что общий случай рассматривается по аналогии.
1. Выводимость (0.2.65) из (0.2.64) видна из дерева

α, β ⊢ ∆
(LK-7)
α & β, β ⊢ ∆
(LK-3)
β, α & β ⊢ ∆
(LK-7)
α & β, α & β ⊢ ∆
(LK-2)
α&β⊢∆

2. Наоборот, выводимость (0.2.64) из (0.2.65) видна из дерева

α, β ⊢ α & β α&β⊢∆
(LK-4)
α, β ⊢ ∆

в котором секвенция в левой вершине есть (0.2.59), и, как мы поняли выше, она выводима.
И вторая теорема, объясняющая, почему сукцедент можно понимать как дизъюнкцию:
Теорема 0.2.29 (о сукцеденте). Пусть ∆ — конечный набор формул в LK и δ — дизъюнкция этих
формул. Тогда для любого набора формул Γ секвенции

Γ ⊢∆ (0.2.66)

и
Γ ⊢δ (0.2.67)
выводятся друг из друга в LK.
Доказательство. Здесь достаточно рассмотреть случай, когда ∆ состоит из двух формул α и β,
потому что общий случай рассматривается по аналогии.
1. Выводимость (0.2.67) из (0.2.66) видна из дерева

Γ ⊢ α, β
(LK-9)
Γ ⊢ α, α ∨ β
(LK-3)
Γ ⊢ α ∨ β, α
(LK-9)
Γ ⊢ α ∨ β, α ∨ β
(LK-2)
Γ ⊢ α∨β

2. Наоборот, выводимость (0.2.66) из (0.2.67) видна из дерева

Γ ⊢α∨β α ∨ β ⊢ α, β
(LK-4)
Γ ⊢ α, β

в котором правая вершина есть секвенция (0.2.60), про которую мы уже знаем, что она выводима.
20 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Рассмотрим несколько иллюстраций к теоре- Ее выводимость означает, что (какой бы ни бы-


мам 0.2.28 и 0.2.29. ла формула α) из формулы α&¬α всегда следует
пустой набор следствий, а значит, любое вообще
⋄ 0.2.30. Закон исключенного третьего в ис- следствие, потому что по правилу (LK-1) в сук-
числении LK можно понимать как утверждение цедент можно добавлять что угодно:
о выводимости секвенции
α&¬α ⊢
⊢ α ∨ ¬α. (0.2.68) (LK-1)
α&¬α ⊢ β
Это в свою очередь означает, что (какой бы ни
была формула α) формула α ∨ ¬α следует из пу-
По теореме 0.2.28, выводимость секвенции
стого набора посылок, а значит, из любого набо-
(0.2.70) эквивалентна выводимость секвенции
ра посылок, потому что в силу правила (LK-1),
в посылки (антецедент) можно добавлять что α, ¬α ⊢ . (0.2.71)
угодно:
Для нее простейший вывод выглядит так:
⊢ α ∨ ¬α
(LK-1) α⊢α
β ⊢ α ∨ ¬α. (LK-5)
¬α, α ⊢
По теореме 0.2.29 выводимость секвенции
(LK-3)
(0.2.68) эквивалентна выводимости секвенции
α, ¬α ⊢
⊢ α, ¬α. (0.2.69)
Значит, секвенция (0.2.70) тоже выводима. Это
Простейший вывод для нее выглядит так: не зависит от того, какую формулу языка тео-
рии множеств подставишь вместо α, например,
α⊢α можно подставить формулу ∃x x ∈ x, и мы по-
(LK-5) лучим выводимую секвенцию
⊢ α, ¬α
∃x x ∈ x, ¬(∃x x ∈ x) ⊢ .
Таким образом, секвенция (0.2.68) тоже вы-
водима. И, как мы уже говорили, это не зависит ⋄ 0.2.32. Покажем, что выводимы секвенции
от того, какую формулу языка теории множеств
подставишь вместо α. Например, подставив вме- α ⊢ ¬(¬α), ¬(¬α) ⊢ α (0.2.72)
сто α формулу x ∈ y, мы получим выводимую
секвенцию Первая из них выводится деревом

⊢ (x ∈ y) ∨ ¬(x ∈ y). ¬α, α ⊢


(LK-5)
Или, если подставить x = y, то получится α ⊢ ¬(¬α).

⊢ (x = y) ∨ ¬(x = y). в котором вершина выводима, поскольку, как мы


уже поняли, выводима секвенция (0.2.71). А вто-
Понятно, что формулы можно подставлять ка- рая — деревом
кие угодно сложные, и все равно будут получать-
ся выводимые секвенции: ⊢ α, ¬α
(LK-5)

⊢ ((x = y & ¬(x = z)) ∨ (z = y))∨ ¬(¬α) ⊢ α.


∨ ¬((x = y & ¬(x = z)) ∨ (z = y)), в котором вершина выводима, поскольку выво-
дима секвенция (0.2.69).

⊢ ((x ∈ y & y ∈ z) ⇒ (x ∈ z))∨ ⋄ 0.2.33. Отметим, что секвенция (0.2.73)


∨ ¬((x ∈ y & y ∈ z) ⇒ (x ∈ z)),
α, β ⊢ α ⇒ β
и так далее.
выведенная нами выше, означает по теореме
⋄ 0.2.31. Рассмотрим секвенцию, симметричную 0.2.28, что выводима и секвенция
(0.2.68):
α&¬α ⊢ . (0.2.70) α & β ⊢ α ⇒ β. (0.2.73)
§ 2. Логика предикатов для теории множеств 21

Выводимые формулы в LK.


• Говорят, что формула α выводима в LK, или что α является теоремой теории LK, если в LK
выводима секвенция
⊢ α.

⋄ 0.2.34. Докажите выводимость формул18 (α ⇒ β) ⇔ ¬(α & ¬β)


(α & β) ⇔ ¬(α ⇒ ¬β)
¬(α & β) ⇔ (¬α) ∨ (¬β) (0.2.74)
(α ∨ β) ⇔ (¬α ⇒ β)
¬(α ∨ β) ⇔ (¬α) & (¬β) (0.2.75)
α ⇒ (β ⇒ α)
⊲ 0.2.35. Докажите выводимость формулы 19
(α ⇒ (β ⇒ γ)) ⇒ ((α ⇒ β) ⇒ (α ⇒ γ))
(α ⇒ β) ⇔ (¬α ∨ β) (0.2.76)
⊲⊲ 0.2.37. Докажите выводимость формул в LK:
⊲⊲ 0.2.36. Докажите выводимость формул в LK:
(α & β) ⇒ α
(α & β) & γ ⇔ α & (β & γ)
(α & β) ⇒ β
(α ∨ β) ∨ γ ⇔ α ∨ (β ∨ γ)
α ⇒ (β ⇒ (α ⇒ β))
α&β ⇔ β&α
α ⇒ (α ∨ β)
α∨β ⇔β ∨α
β ⇒ (α ∨ β)
α & (β ∨ γ) ⇔ (α & β) ∨ (α & γ)
(α ⇒ γ) ⇒ ((β ⇒ γ) ⇒ ((α ∨ β) ⇒ γ))
α ∨ (β & γ) ⇔ (α ∨ β) & (α ∨ γ)
(¬α) ⇒ (α ⇒ β)
α&α ⇔ α
(α ⇒ β) ⇒ ((α ⇒ (¬β)) ⇒ (¬α))
α∨α ⇔α
α & (α ∨ β) ⇔ α ⊲⊲ 0.2.38. Докажите выводимость формул в LK
α ∨ (α & β) ⇔ α в предположении, что β не содержит переменной
18 Вывод для формулы (0.2.74):

α⊢α
α&β⊢α&β (LK-7) β⊢β
теорема 0.2.28 α&β⊢α (LK-7)
α, β ⊢ α & β (LK-3), (LK-5) α&β⊢β
(LK-3), (LK-5) ¬α ⊢ ¬(α & β) (LK-3), (LK-5)
¬(α & β) ⊢ ¬α, ¬β ¬β ⊢ ¬(α & β)
теорема 0.2.29 (LK-8)
¬(α & β) ⊢ (¬α) ∨ (¬β) (¬α) ∨ (¬β) ⊢ ¬(α & β)
 (LK-11)  (LK-11)
⊢ ¬(α & β) ⇒ (¬α) ∨ (¬β) ⊢ (¬α) ∨ (¬β) ⇒ ¬(α & β)
 (LK-6)
   
⊢ ¬(α & β) ⇒ (¬α) ∨ (¬β) & (¬α) ∨ (¬β) ⇒ ¬(α & β)
(0.2.25)
⊢ ¬(α & β) ⇔ (¬α) ∨ (¬β)

19 Вывод для формулы (0.2.76):


α⊢α
(LK-1)
α⊢α α ⊢ β, α β⊢β
(LK-5) (LK-5) (LK-1)
⊢ α, ¬α ¬α, α ⊢ β β, α ⊢ β
(LK-9) (LK-8)
⊢ α, ¬α ∨ β β⊢β ¬α ∨ β, α ⊢ β
(LK-3) (LK-9) (LK-3)
⊢ ¬α ∨ β, α β ⊢ ¬α ∨ β α, ¬α ∨ β ⊢ β
(LK-10) (LK-11)
α ⇒ β ⊢ ¬α ∨ β ¬α ∨ β ⊢ α ⇒ β
(LK-11) (LK-11)
⊢ (α ⇒ β) ⇒ (¬α ∨ β) ⊢ (¬α ∨ β) ⇒ (α ⇒ β)
  (LK-6)
⊢ (α ⇒ β) ⇒ (¬α ∨ β) & (¬α ∨ β) ⇒ (α ⇒ β)
(0.2.25)
⊢ (α ⇒ β) ⇔ (¬α ∨ β)
22 Глава 0. ТЕОРИЯ МНОЖЕСТВ

x: β ⇒ (∀x α) ⇔ ∀x (β ⇒ α)
¬∀x α ⇔ ∃x ¬α ((∃x α) ⇒ β) ⇔ ∃x (α ⇒ β)
¬∃x α ⇔ ∀x ¬α β ⇒ (∃x α) ⇔ ∃x (β ⇒ α)
((∀x α) & β) ⇔ ∀x (α & β) ((∀x α) & (∀x γ)) ⇔ ∀x (α ⇒ γ)
β & (∀x α) ⇔ ∀x (β & α) ((∃x α) ∨ (∃x γ)) ⇔ ∃x (α ∨ γ)
((∃x α) & β) ⇔ ∃x (α & β) ∀y β ⇔ ∀x β|y=x
β & (∃x α) ⇔ ∃x (β & α) ∃y β ⇔ ∃x β|y=x
((∀x α) ∨ β) ⇔ ∀x (α ∨ β) ∀x β ⇔ β
β ∨ (∀x α) ⇔ ∀x (β ∨ α) ∃x β ⇔ β
((∃x α) ∨ β) ⇔ ∃x (α ∨ β)
⊲ 0.2.39. Докажите выводимость формулы 20
β ∨ (∃x α) ⇔ ∃x (β ∨ α)
((∀x α) ⇒ β) ⇔ ∀x (α ⇒ β) ¬(α ∨ β) ⇔ (¬α &¬β) (0.2.77)

(c) Отношения между формулами в LK


Отношение следования между формулами. На с.13 мы объяснили смысл фразы набор фор-
мул ∆ следует из набора формул Γ . В частном случае, когда эти наборы содержат по одной фор-
муле, получается некое отношение между формулами в LK:
• Говорят, что формула χ следует из формулы ϕ, если в LK выводима секвенция:
ϕ ⊢ χ. (0.2.78)
Имеется следующий полезный критерий:
Теорема 0.2.40. В LK секвенция
ϕ ⊢ χ, (0.2.79)
выводима тогда и только тогда, когда выводима секвенция
⊢ ϕ ⇒ χ. (0.2.80)
20 Вывод для формулы (0.2.77):
β⊢β
(LK-3)
α⊢α β ⊢ β, α
(LK-1) (LK-3)
α ⊢ α, β β ⊢ α, β
(LK-8)
α ∨ β ⊢ α, β
(LK-5)
⊢ α, β, ¬(α ∨ β)
(LK-3)
⊢ α, ¬(α ∨ β), β
(LK-3)
⊢ ¬(α ∨ β), α, β
(LK-5)
α⊢α β⊢β ¬β ⊢ ¬(α ∨ β), α
(LK-9) (LK-9) (LK-5)
α ⊢ α∨β β ⊢α∨β ¬α, ¬β ⊢ ¬(α ∨ β)
(LK-5) (LK-5) (LK-7)
¬(α ∨ β), α ⊢ ¬(α ∨ β), β ⊢ ¬α &¬β, ¬β ⊢ ¬(α ∨ β)
(LK-3) (LK-3) (LK-3)
α, ¬(α ∨ β) ⊢ β, ¬(α ∨ β) ⊢ ¬β, ¬α &¬β ⊢ ¬(α ∨ β)
(LK-5) (LK-5) (LK-7)
¬(α ∨ β) ⊢ ¬α ¬(α ∨ β) ⊢ ¬β ¬α &¬β, ¬α &¬β ⊢ ¬(α ∨ β)
(LK-10) (LK-2)
¬(α ∨ β) ⊢ ¬α &¬β ¬α &¬β ⊢ ¬(α ∨ β)
(LK-11) (LK-11)
⊢ ¬(α ∨ β) ⇒ (¬α &¬β) ⊢ (¬α &¬β) ⇒ ¬(α ∨ β)
  (LK-6)
⊢ ¬(α ∨ β) ⇒ (¬α &¬β) & (¬α &¬β) ⇒ ¬(α ∨ β)
(0.2.25)
⊢ ¬(α ∨ β) ⇔ (¬α &¬β)
§ 2. Логика предикатов для теории множеств 23

Доказательство. В прямую сторону это следует из правила (LK-11):

ϕ⊢χ
(LK-11)
⊢ ϕ ⇒ χ.

Это дерево Генцена надо понимать так, что если у его вершины — секвенции ϕ ⊢ χ — есть вывод,
то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом для
секвенции ⊢ ϕ ⇒ χ, а это и означает выводимость формулы ϕ ⇒ χ.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.38):

ϕ, ϕ ⇒ χ ⊢ χ
(LK-3)
⊢ϕ⇒χ ϕ ⇒ χ, ϕ ⊢ χ
(LK-4)
ϕ⊢χ

Опять это дерево надо понимать так, что если у его левой вершины — секвенции ⊢ ϕ ⇒ χ —
есть вывод (что эквивалентно выводимости формулы ϕ ⇒ χ), то его можно пристроить к этой
вершине сверху, затем к правой вершине — секвенции ϕ, ϕ ⇒ χ ⊢ χ — нужно будет присторить ее
вывод, который мы получили на с.13, и мы в результате получим дерево, являющееся выводом для
секвенции ϕ ⊢ χ.

Отношение выводимости между формулами в LK. Понятие выводимой формулы, описанное


на с.21, имеет важное обобщение, о котором мы сейчас поговорим.
• Говорят, что формула ω выводима из набора формул Σ в LK, если существует дерево Генцена, в
котором в корне стоит секвенция ⊢ ω, а на вершинах либо секвенции ⊢ σ, где σ — формулы из
Σ, либо аксиомы теории LK (то есть секвенции вида α ⊢ α):
α⊢α ⊢σ
... ...
. (0.2.81)
⊢ω
• В частном случае, если Σ состоит из одной формулы, α, говорят, что формула ω выводима из
формулы α в LK.
• Говорят, что формулы α и ω взаимно выводимы (в теории LK), если ω выводится из α и α
выводится из ω. Это обозначается записью
LK
ω ≈ σ. (0.2.82)

• В другом частном случае, если Σ совсем не содержит формул, мы получаем определение фор-
мулы ω выводимой в LK, данное на с.21.

⋄ 0.2.41. Для любых двух формул α и β из фор- Здесь видно, что если выводима формула α&β,
мулы α&β выводятся и α, и β. то есть секвенция ⊢ α&β, то ее вывод можно при-
Рассмотрим дерево клеить к левой вершине этого дерева, и мы по-
α⊢α лучим вывод для секвенции ⊢ α. Для формулы
(LK-7)
β нужно построить похожее дерево.
⊢ α&β α&β ⊢ α
(LK-4)
⊢α

Предложение 0.2.42. В LK формулы α и ∀x α выводятся друг из друга.


Доказательство. 1. Дерево Генцена

⊢α
(LK-13) (0.2.83)
⊢ ∀x α
24 Глава 0. ТЕОРИЯ МНОЖЕСТВ

показывает, что формула ∀x α выводится из α.


2. Рассмотрим дерево
⊢ ∀x α ∀x α ⊢ α
(LK-4) (0.2.84)
⊢α
Вспомним, что выше в примере 2.1.19 мы уже доказали, что правая вершина этого дерева выводима:

∀x α ⊢ α (0.2.85)

Если этот вывод из примера 2.1.19 приклеить к правой вершине дерева (0.2.84), то мы получим
дерево вида (0.2.81), означающее, что формула α выводится из формулы ∀x α.

Следующая лемма представляет собой аналог теоремы 0.2.28 для отношения выводимости фор-
мул:

Лемма 0.2.43. Пусть Σ — конечный набор формул в LK и σ — конъюнкция этих формул. Тогда
для формулы ω следующие условия эквивалентны:
(i) ω выводится из Σ в LK,
(ii) ω выводится из σ в LK.

Доказательство. Пусть для начала Σ состоит из двух формул: α и β. Тогда σ есть просто конъ-
юнкция α&β.
1. Рассмотрим дерево
⊢α ⊢β
(LK-6)
⊢ α&β

⊢ω
Если ω выводима из σ то есть из α&β, то, поскольку α&β выводима из α и β, то есть из Σ, мы
получаем, что ω выводима из Σ.
2. Для доказательства обратного рассмотрим дерево

⊢ α&β ⊢ α&β

⊢α ⊢β
(LK-6)
⊢ω

В нем верхние две ветви мы можем считать деревьями Генцена в силу примера 0.2.41. Поэтому если
последний переход — тоже дерево Генцена, то есть если ω выводится из α и β (или, иными словами,
из Σ), то ω должна выводиться и из α&β, то есть из σ.
Общий случай (с произвольным числом формул в Σ) рассматривается аналогично.

Напомним, что на странице 13 мы определили отношение следования из набора формул. Следую-


щая теорема показывает, что в случае, если формулы в посылке замкнуты, это отношение совпадает
с отношением выводимости. (Однако, если этого условия нет, то эти два понятия не совпадают, и
ниже мы покажем это в примере 2.4.7.)

Теорема 0.2.44 (о дедукции для LK). Пусть ω – формула и Σ — конечный набор формул в LK.
Рассмотрим два условия:
(a) ω следует из Σ в LK,
(b) ω выводится из Σ в LK.
Тогда:
(i) условие (a) влечет условие (b),
(ii) если формулы Σ замкнуты, то условие (b) влечет условие (a) (то есть в этом случае
(a) и (b) равносильны).
§ 2. Логика предикатов для теории множеств 25

Доказательство. Пусть σ — конъюнкция формул из Σ. По лемме 0.2.43 выводимость из Σ экви-


валентна выводимости из σ, поэтому всюду мы можем заменить Σ на σ.
1. Рассмотрим дерево
⊢σ σ⊢ω
(LK-4) (0.2.86)
⊢ω
Если ω следует из σ, то есть выводима секвенция σ ⊢ ω, то ее вывод можно подклеить к правой
вершине этого дерева, и тогда если вдобавок выводима секвенция ⊢ σ, то, подклеив ее вывод к
левой вершине, мы получим вывод для секвенции ⊢ ω. Это доказывает, что из (a) следует (b).
2. Предположим теперь, что формулы Σ замкнуты. Тогда их конъюнкция σ тоже замкнута.
Покажем, что в этом случае из (b) следует (a). Если выполнется (b), то есть ω выводится из σ, то
это означает, что существует некое дерево Генцена,
α⊢α ⊢σ
... ...
⊢ω
у которого в корне записана секвенция ⊢ ω, а на вершинах стоят либо секвенции вида α ⊢ α,
либо секвенция ⊢ σ. Впишем в каждый антецедент этого дерева формулу σ как дополнительную
формулу:
σ,α⊢α σ⊢σ
... ...
(0.2.87)
σ⊢ω
и покажем, что полученная картинка может быть дополнена до дерева Генцена с теми же вершинами
и корнем.
Для этого нужно проверить, что если в правилах (LK-1) — (LK-15) всюду в антецеденты вписать
формулу σ, то все они дополняются до деревьев Генцена с теми же вершинами и корнем. Для
правил (LK-1) — (LK-12), (LK-15) это верно без требования, чтобы формула σ была замкнутой:
если, например, в левое правило (LK-1) вписать таким образом σ, то мы получим картинку
σ, Γ ⊢ ∆
, (0.2.88)
σ, ϕ, Γ ⊢ ∆
которую можно дополнить до картинки

σ, Γ ⊢ ∆
(LK-1)
ϕ, σ, Γ ⊢ ∆,
(LK-3)
σ, ϕ, Γ ⊢ ∆,

а она будет деревом Генцена с теми же, что у (0.2.88) вершиной и корнем. Точно так же, например,
если в правиле (LK-12) вписать в антецедент формулы σ,

σ, ϕ x=y , Γ ⊢ ∆
, (0.2.89)
σ, ∀x ϕ, Γ ⊢ ∆
то эту картинку можно дополнить до картинки

σ, ϕ x=y , Γ ⊢ ∆
(LK-3)

ϕ x=y , σ, Γ ⊢ ∆,
(LK-12)
∀x ϕ, σ, Γ ⊢ ∆,
(LK-3)
σ, ∀x ϕ, Γ ⊢ ∆,

а она будет деревом Генцена с теми же, что у (0.2.89) вершиной и корнем.
Так будет со всеми правилами (LK-1) — (LK-12), (LK-15), но когда мы дойдем до правил (LK-13) и
(LK-14) нам понадобится все-таки требование, что формула σ замкнута. Например, если дополнить
правило (LK-13)
Γ ⊢ ∆, ϕ x=y
(0.2.90)
Γ ⊢ ∆, ∀x ϕ
26 Глава 0. ТЕОРИЯ МНОЖЕСТВ

как раньше, в антецедентах, формулой σ, то полученную картинку



σ, Γ ⊢ ∆, ϕ x=y
(0.2.91)
σ, Γ ⊢ ∆, ∀x ϕ
можно будет считать частным случаем правила (LK-13) только если выполнено ограничение на
переменную y в этом правиле: нужно, чтобы y не входил как свободная переменная в нижнюю се-
квенцию. Это условие будет выполнено, потому что в (0.2.90) y не входил как свободная переменная
в нижнюю секвенцию, а в σ он не входит, потому что σ — замкнутая формула.
И то же самое с правилом (LK-14). Это доказывает, что картинку (0.2.87) можно дополнить до
дерева Генцена с теми же вершинами и корнем. Теперь заметим, что там, где на вершинах стоят
секвенции σ, α ⊢ α, их можно продолжить вверх по правилу (LK-1),
Γ ⊢∆
σ, Γ ⊢ ∆
и мы получим дерево Генцена
α⊢α
σ,α⊢α σ⊢σ
... ...
,
σ⊢ω
у которого все вершины — аксиомы теории (LK-1), а корень — секвенция σ ⊢ ω. Иными словами,
это вывод секвенции σ ⊢ ω.

§3 Теория множеств Морса-Келли


Теория Морса-Келли MK, которую мы опишем в этом параграфе, представляет собой так называе-
мую формальную теорию21 над исчислением секвенций LK для языка теории множеств, описанным
выше. От теории LK в том виде, в котором мы ее к настоящему времени описали, теория MK отли-
чается только тем, что в ней понятие вывода несколько усложняется в соответствии с идеологией,
описанной на с.23: в MK вводится некая система формул, называемых аксиомами теории MK (ни-
же мы приводим их с обозначениями MK-1—MK-14), и объявляется, что формула ω выводима, если
она выводима из аксиом в смысле определения на с.23. Более подробно, определение вывода в MK
выглядит так:
• Дерево Генцена считается выводом в MK, если каждая его вершина является
— либо аксиомой исчисления секвенций LK, то есть секвенцией вида α ⊢ α,
— либо секвенцией вида ⊢ σ, где σ — какая-нибудь аксиома теории MK.
В соответствии с этим меняются и остальные связанные определения:
• Говорят, что секвенция Γ ⊢ ∆ выводима в теории MK (или что набор формул ∆ следует
из набора формул Γ в MK), если у этой секвенции есть вывод в теории MK.
• Говорят, что формула ψ следует из формулы χ в теории MK, если в MK выводима се-
квенция χ ⊢ ψ.
• Теоремой теории MK называется произвольная выводимая формула этой теории (то есть
такая формула ω, что секвенция ⊢ ω выводима в теории MK).
Понятно, что поскольку деревьев Генцена, признаваемых выводами, в MK больше, чем в LK, класс
выводимых секвенций22 в MK шире, чем в LK. То же самое происходит и с отношением следования
между формулами (которое в MK слабее, чем в LK23 ), и с классом теорем (которых в MK больше,
чем в LK24 ):
1) если секвенция Γ ⊢ ∆ выводима в теории LK, то она выводима и в теории MK, но не
наоборот,
2) если формула ψ следует из формулы χ в теории LK, то это верно и в теории MK, но не
наоборот,
3) если формула ω является теоремой теории LK, то она является теоремой и в теории
MK, но не наоборот.
21 Общее определение формальной теории (или теории 1 порядка) мы даем ниже на с.105.
22 Понятие выводимой секвенции в LK для языка теории множеств было определено на с.13.
23 Отношение следования между формулами в LK для языка теории множеств было определено на с.13.
24 Понятие теоремы (выводимой формулы) в LK для языка теории множеств было определено на с.21.
§ 3. Теория множеств Морса-Келли 27

(a) Аксиомы равенства, невырожденности, объемности и выделения


Мы перейдем к описанию аксиом теории MK. Некоторые из них, как аксиомы MK-1—MK-6 (на с.27
ниже), довольно просты, но большинство так громоздко, что среди математиков имеется традиция
описывать их последовательно, по одной, обсуждая сразу же выводы и вводя определения, которые
облегчают описание последующих аксиом. Мы поступим так же, начав список с аксиомы MK-1 на
этой странице и закончив его аксиомой MK-14 на с.63.
Мы постараемся сделать этот параграф автономным, чтобы, при желании, его можно было чи-
тать, не вникая в детали остального изложения этой главы, поэтому выводы из аксиом теории
Морса-Келли (теоремы теории MK) мы будем оформлять традиционными текстовыми рассужде-
ниями, без построения деревьев Генцена (мы дадим только один пример дерева Генцена на с.31),
однако читатель должен понимать, что отныне все наши математические утверждения (не только
в этой главе, но и вообще во всем учебнике, за исключением некоторых утверждений главы 2, где
мы возвращаемся к обсуждению оснований математики) формально могут быть доказаны именно
средствами исчисления секвенций LK, построением нужных деревьев (но, конечно, чем дальше мы
будем двигаться, тем сложнее эти деревья будут, если их в самом деле задаваться строить).
Первые шесть аксиом теории MK повторяют первые аксиомы теории NST.

Аксиомы равенства.
MK-1 Аксиома рефлексивности равенства:
X =X (0.3.92)
(равенство X = X верно для всех классов X).
MK-2 Аксиома симметричности равенства:
X=Y ⇒Y =X (0.3.93)
(равенство X = Y не отличается от равенства Y = X).
MK-3 Аксиома транзитивности равенства:
(X = Y & Y = Z) ⇒ X = Z (0.3.94)
(равенства X = Y и Y = Z влекут за собой равенство X = Z).
MK-4 Аксиома инвариантности символа принадлежности:
(X = A & Y = B & X ∈ Y ) ⇒ A ∈ B (0.3.95)
(в отношение X ∈ Y можно подставлять классы, равные X и Y , и при этом будут
получаться следствия).

Аксиома невырожденности.
MK-5 Аксиома невырожденности25 :
∃X ∃Y X ∈ Y. (0.3.96)
(существуют классы X и Y такие, что X ∈ Y ).

Аксиома объемности. Следующая аксиома объясняет, как отношение принадлежности ∈ свя-


зано с равенством объектов.
MK-6 Аксиома объемности:
X = Y ⇐⇒ ∀A (A ∈ X ⇐⇒ A ∈ Y ) (0.3.97)
(два класса X и Y совпадают, если и только если они «имеют одинаковый набор эле-
ментов»).
! 0.3.1. В одну сторону это утверждение следует из аксиомы инвариантности MK-4: если X = Y ,
то условие A ∈ X ⇔ A ∈ Y выполняется автоматически. Поэтому содержательный смысл MK-6
состоит в импликации в левую сторону:
X = Y ⇐= ∀A (A ∈ X ⇐⇒ A ∈ Y ) (0.3.98)
25 Аксиома MK-5 в действительности не очень важна, потому что избыточна: она является формальным следствием
аксиомы бесконечности MK-13 на с.62. Нам она нужна для методических целей: она дает возможность доказывать
результаты, важные для понимания предмета, раньше, чем это было бы возможным без нее.
28 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Схема аксиом выделения. Из аксиомы объемности MK-6 следует, что для описания объек-
та теории множеств (класса) достаточно (и необходимо) описать входящие в него элементы. Это
используется в следующей аксиоме, формализующей способ построения новых классов из уже име-
ющихся.

MK-7 Аксиома выделения: пусть ϕ – формула теории множеств, не содержащая пере-


менную Y в качестве свободной переменной, тогда

∃Y ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & ϕ). (0.3.99)

Иными словами, существует некий класс Y , элементами которого являются в точности


классы X, для которых истинны следующие два высказывания:
— во-первых, должен существовать класс Z, содержащий X в качестве своего эле-
мента,
∃Z X ∈ Z, (0.3.100)
— и, во-вторых, для X должно быть истинным само утверждение ϕ:

ϕ.

Как и в теории NST, аксиома MK-7 позволяет определять объекты: если формула ϕ не содержит
никаких свободных переменных, кроме X, X1 , ..., Xn (возможно, не все из этого списка, но всякая
свободная переменная из ϕ все-таки лежит в нем), то формула

Y = Φ(X1 , ..., Xn ) ⇐⇒ ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & ϕ) (0.3.101)

определяет некую операцию в теории MK, интуитивно понимаемую как сопоставление классам
X1 , ..., Xn класса Φ(X1 , ..., Xn ), состоящего из элементов X, удовлетворяющих условию

(∃Z X ∈ Z) & ϕ.

Однако это только интуитивное понимание сути дела, потому что формально операция Φ не являет-
ся отображением в том смысле, который вкладывается в этот термин в теории MK (см. определение
на с.39): у отображения и аргументы X1 , ..., Xn и значения Φ(X1 , ..., Xn ) обязаны быть множествами
(по определению множества на с.29 и по теореме 0.3.33), а у операции Φ это совсем не обязательно
так, здесь X1 , ..., Xn и Φ(X1 , ..., Xn ) вполне могут быть собственными классами (не множествами).
Как следствие, Φ следует понимать исключительно как операцию над символами (правильнее ска-
зать, термами, см. определение на с.106) языка.
Ниже на с.121 мы увидим, что такой тип рассуждений в логике используется для определе-
ния внешних функциональных символов, и в данном случае таким внешним символом будет как
раз буква Φ. Однако эта буква в формуле (0.3.101) выбрана случайно, потому что в теориях мно-
жеств, в том числе в MK, определяемую таким образом операцию не принято обозначать с помощью
какого-то функционального символа. Ее традиционно вообще никак не обозначают, а обозначение
используется только для ее значений на аргументах X1 , ..., Xn . И таким обозначением является
строка символов {X : ϕ}:
{X : ϕ} = Φ(X1 , ..., Xn ).
Аккуратное определение выглядит так:

• Если формула ϕ не содержит никаких свободных переменных, кроме X, X1 , ..., Xn , то при под-
разумеваемом в каких-то рассуждениях смысле обозначений X1 , ..., Xn обозначение

{X : ϕ}

используется в этих рассуждениях для объекта, описываемого формулой




T ∈ {X : ϕ} ⇐⇒ (∃Z T ∈ Z) & ϕ (0.3.102)
X=T

в которой T — произвольная переменная не из списка X, X1 , ..., Xn , для которой подстановка



ϕ корректна.
X=T
§ 3. Теория множеств Морса-Келли 29

В формуле (0.3.102) фрагмент


∃Z T ∈Z (0.3.103)
— удобно выделить в качестве отдельного свойства классов, чтобы потом, добавляя его к формулам
ϕ, строить новые классы. Термином, используемом для описания свойства (0.3.103), является слово
“множество”:
• Класс T называется множеством, если существует класс Z, содержащий T в качестве
элемента:
∃Z T ∈ Z
Если же такого Z не существует, то класс T называется собственным классом.
Это определение позволяет сформулировать следующий “интуитивный вариант аксиомы выде-
ления”:
MK-7′ Аксиома выделения: всякая формула ϕ и любая переменная X определяют объект

{X : ϕ},

элементами которого являются в точности множества X, для которых утверждение ϕ


справедливо в рассуждениях об объектах, описываемых входящими в ϕ свободными пе-
ременными, отличными от X.

⋄ 0.3.2. Пустой класс ∅. Следующее равенство Доказательство. Здесь почти слово в слово по-
определяет так называемый пустой класс: вторяются рассуждения примера 0.1.10. По ак-
сиоме объемности MK-6, чтобы доказать нера-
∅ := {X : X 6= X}. (0.3.104) венство ∅ 6= Set, достаточно подобрать какой-
нибудь класс X такой, чтобы
(символ := здесь означает, что это соотношение
следует понимать как определение, то есть как X∈ / ∅ & X ∈ Set .
декларацию, согласно которой символ слева от Для этого воспользуемся аксиомой MK-5 и рас-
:= будет использоваться в тексте всюду для обо- смотрим какие-нибудь два класса X и Y такие,
значения объекта, лежащего справа от этого зна- что
ка). X ∈ Y.
В соответствии с аксиомой выделения, рас-
шифровывается эта запись так: элементами Понятно, что X является множеством, поэтому
класса ∅ считаются те и только те множества X ∈ Set. С другой стороны, X ∈ / ∅ (потому что
X, которые не равны самому себе. Поскольку по Z ∈ ∅ невозможно ни для какого Z по определе-
аксиоме MK-1 таких X не бывает (высказывание нию ∅).
X = X считается верным всегда), класс ∅ во- ! 0.3.5. Объясним, почему в аксиоме MK-7 важ-
обще не содержит никаких элементов (отчего и но, чтобы Y не входил в формулу ϕ как свобод-
называется пустым). ная переменная. Действительно, если бы этого
условия не было, то мы могли бы рассмотреть,
⋄ 0.3.3. Класс Set всех множеств. Следую-
например, формулу
щее равенство определяет так называемый класс
всех множеств: X∈ /Y (0.3.107)

Set := {X : X = X}. (0.3.105) и, подставляя ее в (0.3.99) вместо ϕ, мы получи-


ли бы аксиому
 
Это расшифровывается так: элементами класса
∃Y ∀X X ∈ Y ⇐⇒ (∃Z X ∈ Z) & X ∈ /Y .
Set считаются те и только те множества X, ко-
торые равны самому себе. Поскольку по аксиоме (0.3.108)
MK-1 это верно для любого X, класс Set содер- Покажем, что она ведет к противоречиям в тео-
жит все на свете множества (и только их). рии MK. Для этого рассмотрим два случая.
1. Пусть Y = ∅. Тогда из (0.3.108) мы полу-
Как и в наивной теории множеств, в теории чим
Морса-Келли
X ∈ ∅ ⇐⇒ (∃Z X ∈ Z) & X ∈ / ∅.
! 0.3.4. Классы ∅ и Set не совпадают: В частности,
∅ 6= Set (0.3.106) X ∈ ∅ ⇐= (∃Z X ∈ Z) & X ∈
/ ∅,
30 Глава 0. ТЕОРИЯ МНОЖЕСТВ

и это можно переписать так: Утверждения (0.3.110) и (0.3.111) противоречат


друг другу.
X ∈ ∅ ⇐= X ∈ Set & X ∈ / ∅. (0.3.109) 2. Пусть наоборот, Y 6= ∅. Тогда существует
Содержательно это означает, что любой элемент объект X, принадлежащий Y ,
класса Set, не содержащийся в ∅, должен содер-
жаться в ∅. В частности, можно взять объект X ∈ Y. (0.3.112)
X = ∅, который в силу приводимого ниже свой-
ства (0.3.123), лежит в Set, Рассмотрев его, мы из (0.3.108) получим

X = ∅ ∈ Set, (∃Z X ∈ Z) & X ∈


/Y

а в силу свойства 1◦ еще ниже, на с.35, не при- в частности,


надлежит ∅: X∈/Y (0.3.113)
X∈ / X = ∅. (0.3.110)
По формуле (0.3.109) же он наоборот должен Теперь утверждения (0.3.112) и (0.3.113) проти-
принадлежать ∅: воречат друг другу.
Мы получили, что в ободих случаях, при Y =
X ∈ ∅. (0.3.111) ∅ и при Y 6= ∅ появляются противоречия.

(b) Аксиомы подмножеств, объединения и регулярности


Отношение включения ⊆ и аксиома подмножеств.
• Говорят, что класс X содержится в классе Y , или что X является подклассом класса Y ,
и изображают это записью
X⊆Y
или записью
Y ⊇ X,
если всякий элемент Z класса X является также элементом класса Y :

X⊆Y ⇔ ∀Z (Z ∈ X ⇒ Z ∈ Y ). (0.3.114)

Отношение ⊆ называется отношением включения. Запись

X ⊆Y ⊆Z

эквивалентна высказыванию
X ⊆ Y & Y ⊆ Z.
Отрицание отношения ⊆ записывается символом ⊆
6 :

X⊆
6 Y ⇐⇒ ¬(X ⊆ Y ).

• Полезно также ввести отношение строгого включения: говорят, что класс X строго со-
держится в классе Y , или что X является строгим подклассом класса Y , и изображают
это записью
X⊂Y
или записью
Y ⊃ X,
если
X ⊆ Y & X 6= Y.
Отрицание отношения ⊂ записывается символом ⊂
6 :

X⊂
6 Y ⇐⇒ ¬(X ⊂ Y ).

Свойства отношения включения ⊆:


§ 3. Теория множеств Морса-Келли 31

1◦ Всякий класс X содержит пустой класс ∅ и содержится в классе Set всех множеств:

∅ ⊆ X ⊆ Set . (0.3.115)

2◦ Рефлексивность: любой класс X является своим подклассом:

X ⊆ X. (0.3.116)

3◦ Антисимметричность: отношения X ⊆ Y и Y ⊆ X выполняются одновременно тогда


и только тогда, когда классы X и Y совпадают:

X⊆Y ⊆X ⇐⇒ X = Y. (0.3.117)

4◦ Транзитивность: если X ⊆ Y и Y ⊆ Z, то X ⊆ Z:

X⊆Y ⊆Z =⇒ X ⊆ Z. (0.3.118)

Доказательство. На странице 27 мы говорили, что все утверждения (теоремы) теории MK можно


доказать средствами исчисления секвенций LK (то есть построив вывод в теории MK, как мы его
определили на с.26). Это касается и свойств (0.3.115) – (0.3.118). Например, свойство (0.3.117), если
его сначала упростить
X ⊆ Y ⊆ X ⇒ X = Y. (0.3.119)
а затем переформулировать на языке теории MK,
  
∀A (A ∈ X ⇒ A ∈ Y ) & ∀A (A ∈ Y ⇒ A ∈ X) ⇒ X = Y, (0.3.120)

будет иметь такой вывод:

⊢ (∀A A ∈ X ⇔ A ∈ Y ) ⇒ X = Y (0.3.98)
теорема 0.2.40
∀A (A ∈ X ⇔ A ∈ Y ) ⊢ X = Y
(0.2.25)
(∀A α) & (∀A β) ⊢ ∀A (α & β) (0.2.57) ∀A (α & β) ⊢ X = Y
(LK-4)
(∀A A ∈ X ⇒ A ∈ Y ) & (∀A A ∈ Y ⇒ A ∈ X) ⊢ X = Y
(LK-11)
(∀A A ∈ X ⇒ A ∈ Y ) & (∀A A ∈ Y ⇒ A ∈ X) ⇒ X = Y

где α — формула A ∈ X ⇒ A ∈ Y , а β — формула A ∈ Y ⇒ A ∈ X. Мы оставляем читателю


проверку остальных свойств. Как мы говорили на с.27, в дальнейшем мы будем оформлять все
доказательства в виде обычных текстовых рассуждений, без деревьев Генцена.
MK-8 Аксиома подмножеств: для всякого множества X существует множество Y такое что

∀Z (Z ⊆ X ⇒ Z ∈ Y ). (0.3.121)

Теорема 0.3.6. Если X – множество, и Z ⊆ X, то Z – тоже множество.


Доказательство. По аксиоме MK-8, существует множество Y такое, что справедливо (0.3.121). По-
скольку наш класс Z содержится в X, Z ⊆ X, мы получаем Z ∈ Y , и значит, Z – множество.

⋄ 0.3.7. Пустой класс ∅ является множеством: пустой класс ∅. Мы получаем


∅ ⊆ X ∈ Set .
∅ ∈ Set . (0.3.122)
По теореме 0.3.6 из этого следует, что ∅ – мно-
жество.
Доказательство. Воспользуемся аксиомой MK-
5 и выберем классы X и Y так, чтобы X ∈ Y . ⋄ 0.3.8. Класс Set всех множеств не является
Понятно, что класс X будет множеством. С дру- множеством:
гой стороны, по свойству (0.3.115), X содержит Set ∈
/ Set . (0.3.123)
32 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Доказательство. Рассмотрим класс R = {X : Значит, R ∈ / Set, то есть R – не множество. С


X ∈/ X} (который можно назвать классом Рас- другой стороны, как любой класс, R содержится
села, имея в виду пример из антиномии на с.6). в Set в силу (0.3.115):
По определению (то есть по аксиоме выделения),
для всякого класса X R ⊆ Set .
X∈R ⇔ X ∈ Set & X ∈
/ X. Если бы при этом Set было множеством, мы по
В частности, для X = R получаем: теореме 0.3.6 получили бы, что R – тоже мно-
жество, и это было бы противоречием с тем, что
R∈R ⇔ R ∈ Set & R ∈
/ R.
мы уже доказали про R. Значит, Set – не мно-
Если бы было верно R ∈ Set, это привело бы к жество.
противоречию:
R∈R ⇔ R∈
/ R.

Экспонента 2X .
• Экспонентой произвольного класса X называется класс

2X = {Z : Z ⊆ X} (0.3.124)

⋄ 0.3.9. Экспонента класса всех множеств сов- быть множеством: Y ∈ Set. Мы получаем вклю-
падает с классом всех множеств: чение 2Set ⊆ Set. Наоборот, если Y ∈ Set, то,
поскольку Y является классом, в силу (0.3.115)
2Set = Set (0.3.125) мы получаем, что Y ⊆ Set. Таким образом, одно-
временно Y ∈ Set и Y ⊆ Set, и значит, Y ∈ 2Set .
Set
Доказательство. Если Y ∈ 2 = {Z : Z ⊆ Это доказывает включение Set ⊆ 2Set . Применяя
Set}, то по аксиоме выделения MK-7′ , Y должно (0.3.117), мы получаем 2Set = Set.

Теорема 0.3.10. Если X – множество, то 2X – тоже множество, и для всякого класса Z

Z ⊆X ⇔ Z ∈ 2X (0.3.126)

Доказательство. Пусть X – множество. Тогда по аксиоме MK-8 можно подобрать множество Y


такое, что справедливо (0.3.121): если Z ⊆ X, то Z ∈ Y . Отсюда следует, что 2X ⊆ Y . При этом Y
– множество, поэтому по теореме 0.3.6, 2X тоже должно быть множеством.

Объединение и пересечение двух классов. Аксиома попарного объединения.


• Пересечением классов X и Y называется класс

X ∩ Y = {Z : Z ∈ X & Z ∈ Y } (0.3.127)

• Объединением классов X и Y называется класс

X ∪ Y = {Z : Z ∈ X ∨ Z ∈ Y } (0.3.128)

Свойства операций пересечения и объединения двух классов:


1◦ Связь с пустым классом: для любого класса X

∅ ∩ X = ∅, ∅ ∪ X = X. (0.3.129)

2◦ Связь с классом всех множеств: для любого класса X

Set ∩X = X, Set ∪X = Set . (0.3.130)


§ 3. Теория множеств Морса-Келли 33

3◦ Связь с включением: для любых классов X и Y

X ∩ Y ⊆ X ⊆ X ∪ Y. (0.3.131)

4◦ Идемпотентность: всякий класс X, в объединении и в пересечении с самим собой не


меняется:
X ∩ X = X, X ∪ X = X. (0.3.132)
5◦ Коммутативность: для любых классов X и Y

X ∩ Y = Y ∩ X, X ∪ Y = Y ∪ X. (0.3.133)

6◦ Ассоциативность: для любых классов X, Y и Z

(X ∩ Y ) ∩ Z = X ∩ (Y ∩ Z), (X ∪ Y ) ∪ Z = X ∪ (Y ∪ Z) (0.3.134)

7◦ Дистрибутивность: для любых классов X, Y и Z

(X ∩ Y ) ∪ Z = (X ∪ Z) ∩ (Y ∪ Z), (X ∪ Y ) ∩ Z = (X ∩ Z) ∪ (Y ∩ Z) (0.3.135)

8◦ Связь с отношением включения: для любых классов X и Y

X∩Y =X ⇐⇒ X⊆Y ⇐⇒ X∪Y =Y (0.3.136)

Теорема 0.3.11. Если X или Y – множество, то пересечение X ∩ Y – тоже множество.

Доказательство. В силу (0.3.132), достаточно рассмотреть случай, когда множеством является


класс X. Тогда, применив (0.3.131), мы получим: X ∩ Y ⊆ X. То есть класс X ∩ Y содержится в
множестве X, и по теореме 0.3.6, X ∩ Y должен быть множеством.

Если бы мы задались целью доказать аналогичное утверждение с заменой операции ∩ на опера-


цию ∪ (и с естественной поправкой, чтобы оба класса X и Y были множествами), мы обнаружили
бы, что это утверждение невозможно вывести из перечисленных к настоящему моменту аксиом.
Поэтому оно вводится как отдельная аксиома:
MK-9 Аксиома попарного объединения: для любых двух множеств X и Y их объединение
X ∪ Y – тоже множество.

Объединение и пересечение элементов класса. Аксиома поэлементного объединения.


• Объединением элементов класса X называется класс

∪X = {Z : ∃Y (Y ∈ X & Z ∈ Y )} (0.3.137)

• Пересечением элементов класса X называется класс

∩X = {Z : ∀Y (Y ∈ X ⇒ Z ∈ Y )} (0.3.138)

Свойства операций объединения и пересечения элементов класса:


1◦ Действие на пустой класс:
∪∅ = ∅, ∩∅ = Set . (0.3.139)
2◦ Действие на класс всех множеств:

∪ Set = Set, ∩ Set = ∅. (0.3.140)

3◦ Монотонность относительно включения: для любых классов X и Y

X ⊆Y =⇒ ∩X ⊆ ∩Y & ∪ X ⊆ ∪Y. (0.3.141)

4◦ Монотонность относительно принадлежности: для любых классов X и Y

X ∈Y =⇒ ∩Y ⊆ X ⊆ ∪Y. (0.3.142)
34 Глава 0. ТЕОРИЯ МНОЖЕСТВ

5◦ Объединение элементов множества является множеством:


X ∈ Set =⇒ ∪X ∈ Set . (0.3.143)
6◦ Пересечение элементов непустого класса является множеством:
X 6= ∅ =⇒ ∩X ∈ Set . (0.3.144)
Следующее устверждение представляет собой аналог теоремы 0.3.11:
Теорема 0.3.12. Если X – множество, то пересечение его элементов ∩X – тоже множество.
Как и в случае с операциями попарного пересечения и объединения, аналогичное утверждение с
заменой операции ∩ на операцию ∪ невозможно вывести из перечисленных к настоящему моменту
аксиом. Поэтому оно вводится как отдельная аксиома:
MK-10 Аксиома поэлементного объединения: для любого множества X объединение его
элементов ∪X – тоже множество.

Дополнение и разность.
• Дополнением класса X называется класс
\X = {Y : Y ∈
/ X} (0.3.145)

Свойства дополнения:

1 Связь с пустым классом и классом всех множеств:
\∅ = Set, \ Set = ∅. (0.3.146)
2◦ Связь с пересечением и объединением: для любого класса X
X ∩ \X = ∅, X ∪ \X = Set . (0.3.147)
3◦ Связь с включением: для любых классов X и Y
X⊆Y =⇒ \Y ⊆ \X. (0.3.148)
4◦ Инволютивность: для любого класса X
\(\X) = X. (0.3.149)
5◦ Законы де Моргана: для любых классов X и Y
\(X ∩ Y ) = (\X) ∪ (\Y ), \(X ∪ Y ) = (\X) ∩ (\Y ). (0.3.150)
• Разностью классов X и Y называется класс
X \ Y = X ∩ (\Y ) (0.3.151)

Свойства разности:

1 Связь с пустым классом и классом всех множеств: для любого класса X
X \ ∅ = X, ∅ \ X = ∅. (0.3.152)

2 Связь с пересечением и объединением: для любых классов X, Y , Z
X ∩ (Y \ Z) = (X ∩ Y ) \ Z, (X ∪ Y ) \ Z = (X \ Z) ∪ (Y \ Z) (0.3.153)
3◦ Связь с включением: для любых классов X, Y , Z
X⊆Y =⇒ X \Z ⊆Y \Z & Z \ Y ⊆ Z \ X. (0.3.154)
4◦ Двойная разность: для любых классов X, Y , Z
X \ (Y \ Z) = (X \ Y ) ∪ (X ∩ Y ∩ Z). (0.3.155)
5◦ Законы де Моргана: для любых классов X, Y , Z
X \ (Y ∩ Z) = (X \ Y ) ∪ (X \ Z), X \ (Y ∪ Z) = (X \ Y ) ∩ (X \ Z). (0.3.156)
§ 3. Теория множеств Морса-Келли 35

⋄ 0.3.13. Докажем равенство ⇐⇒ x∈A&x∈


/B&x∈C ⇐⇒
⇐⇒ x∈ A∩C &x ∈
/B ⇐⇒ x ∈ (A ∩ C)\B
(A \ B) ∩ C = (A ∩ C) \ B (0.3.157)

Действительно, ⊲ 0.3.14. Докажите равенство:


h i
x ∈ (A\B) ∩ C ⇐⇒ x ∈ A\B & x ∈ C ⇐⇒ A ∪ (B \ C) = (A ∪ B) \ (B ∩ C) \ A (0.3.158)

Аксиома регулярности.
MK-11 Аксиома регулярности: если X – непустой класс, X 6= ∅, то в нем существует
элемент Y ∈ X, пересечение которого с X пусто:

X ∩ Y = ∅.

Следствия из аксиомы регулярности MK-11:

1◦ Не существует класса A такого, что A ∈ A.



2 Не существует классов A, B таких, что A ∈ B ∈ A.
3◦ Не существует классов A, B, C таких, что A ∈ B ∈ C ∈ A.

Доказательство. Эти утверждения доказываются одинаково, поэтому мы докажем только первые


два.
1. Пусть для какого-то A справедливо A ∈ A. Рассмотрим класс

X = {Z : Z = A}.

Из условия A ∈ A следует, что A – множество. Поэтому, по аксиоме выделения MK-7′ , у класса X


имеется только один элемент, а именно множество A

Z∈X ⇐⇒ Z ∈ Set & Z = A ⇐⇒ Z = A. (0.3.159)


Set

Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.159), Y = A, и поэтому мы получаем

A ∩ X = Y ∩ X = ∅.

Но с другой стороны, A ∈ A и A ∈ X, поэтому A ∈ A ∩ X = ∅, что невозможно.


2. Пусть для каких-то A и B справедливо A ∈ B ∈ A. Рассмотрим класс

X = {Z : Z = A ∨ Z = B}.

Из условия A ∈ B ∈ A следует, что A и B – множества. Поэтому, по аксиоме выделения MK-7′, у


класса X элементы совпадают либо с A, либо с B:

Z∈X ⇐⇒ Z ∈ Set & (Z = A ∨ Z = B ) ⇐⇒ Z = A ∨ Z = B. (0.3.160)


Set Set

Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.160), Y = A или Y = B. Если Y = A, то мы
получаем
A∩X =Z ∩X =∅

Но, с другой стороны, поскольку B ∈ A и B ∈ X, должно быть B ∈ A ∩ X = ∅, что невозможно. И


точно так же для случая Y = B.
36 Глава 0. ТЕОРИЯ МНОЖЕСТВ

(c) Отношения, отображения и аксиома подстановки


Одночленные классы и пары.
• Одночленным классом, порожденным классом X, называется класс

{X} = {Y : X ∈ Set ⇒ Y = X} (0.3.161)

Теорема 0.3.15. Если X – множество, то порожденный им одночленный класс {X} – тоже


множество, и
(i) для всякого класса Y
Y ∈ {X} ⇔ Y = X,
(ii) пересечение и объединением элементов {X} является X:

∩{X} = X = ∪{X}.

Теорема 0.3.16. Если X – собственный класс, то


(i) порожденный им одночленный класс {X} совпадает с Set,

{X} = Set;

(ii) пересечение и объединением элементов {X} описывается равенствами

∩{X} = ∅, ∪{X} = Set .

⋄ 0.3.17. Напомним, что согласно примеру 0.3.7, ⋄ 0.3.18. Наоборот, одночленный класс {Set},
пустой класс ∅ является множеством. Покажем, порожденный классом Set всех множеств, сов-
что одночленный класс {∅}, порожденный пу- падает с классом Set:
стым множеством ∅, не совпадает с пустым мно-
жеством:
{∅} 6= ∅ (0.3.162) {Set} = Set . (0.3.163)
Это следует из аксиомы объемности MK-6: ∅ ∈
{∅}, но ∅ 6= ∅. Это следует из теоремы 0.3.16.

• Неупорядоченной парой, порожденной классами X и Y называется класс

{X, Y } = {X} ∪ {Y } (0.3.164)

Теорема 0.3.19. Если X и Y – множества, то порожденная ими неупорядоченная пара {X, Y }


является множеством, и
(i) для всякого класса Z
Z ∈ {X, Y } ⇔ (Z = X ∨ Z = Y ), (0.3.165)
(ii) при перестановке компонент пара {X, Y } не меняется

{X, Y } = {Y, X}.

(iii) пересечение и объединение элементов неупорядоченной пары {X, Y } описываются фор-


мулами
∩{X, Y } = X ∩ Y, ∪{X, Y } = X ∪ Y.
Теорема 0.3.20. Если X или Y – собственный класс, то
(i) неупорядоченная пара {X, Y } совпадает с Set

{X, Y } = Set;

(ii) при перестановке компонент пара {X, Y } не меняется

{X, Y } = {Y, X}.


§ 3. Теория множеств Морса-Келли 37

(iii) пересечение и объединение элементов неупорядоченной пары {X, Y } описываются фор-


мулами
∩{X, Y } = ∅, ∪{X, Y } = Set .
Доказательство.
• Упорядоченной парой, порожденной классами X и Y называется класс

(X, Y ) = {{X}, {X, Y }} (0.3.166)

Теорема 0.3.21. Если X и Y – множества, то

(X, Y ) ∈ Set (0.3.167)

∩(X, Y ) = {X}, ∪(X, Y ) = {X, Y } (0.3.168)

∩ ∩ (X, Y ) = X, ∩ ∪ (X, Y ) = X ∩ Y, (0.3.169)

∪ ∩ (X, Y ) = X, ∪ ∪ (X, Y ) = X ∪ Y (0.3.170)

   
∪ ∩(X, Y ) ∪ ∪ ∪(X, Y ) \ ∪ ∩ (X, Y ) = Y (0.3.171)

Теорема 0.3.22. Если X или Y – собственный класс, то

(X, Y ) = Set, (0.3.172)

∩(X, Y ) = ∅, ∪(X, Y ) = Set, (0.3.173)

∩ ∩ (X, Y ) = Set, ∩ ∪ (X, Y ) = ∅, (0.3.174)

∪ ∩ (X, Y ) = ∅, ∪ ∪ (X, Y ) = Set (0.3.175)


Первая формула в (0.3.169) и формула (0.3.171) оправдывают следующие определения.
• Левой компонентой класса Z называется класс

left Z = ∩ ∩ Z (0.3.176)

• Правой компонентой класса Z называется класс


   
right Z = ∪ ∩(X, Y ) ∪ ∪ ∪(X, Y ) \ ∪ ∩ (X, Y ) (0.3.177)

Из теорем 0.3.21 и 0.3.22 следует


Теорема 0.3.23. Если X и Y – множества, то

left(X, Y ) = X, right(X, Y ) = Y. (0.3.178)

Если же X или Y – собственный класс, то

left(X, Y ) = Set = right(X, Y ). (0.3.179)

Теорема 0.3.24. Если X и Y – множества, то для любых классов U и V

(X, Y ) = (U, V ) ⇐⇒ X = U & Y = V. (0.3.180)

• Для всякой формулы ϕ условимся символ {(X, Y ) : ϕ} употреблять для обозначения


класса, определенного равенством

{(X, Y ) : ϕ} = {Z : ∃X ∃Y Z = (X, Y ) & ϕ} (0.3.181)


38 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Декартово произведение.
• Декартовым произведением классов X и Y называется класс

X × Y = {(A, B) : A ∈ X & B ∈ Y } (0.3.182)

• В случае, когда классы X и Y совпадают, X = Y , декартово произведение X × Y = X × X


называется декартовым квадратом класса X.
Теорема 0.3.25. Если X и Y – множества, то X × Y – тоже множество.
X∪Y
Доказательство. Заметим, что класс 22 является множеством:

аксиома MK-9 теорема 0.3.10


X ∈ Set & Y ∈ Set =⇒ X ∪ Y ∈ Set =⇒
теорема 0.3.10 X∪Y
=⇒ 2X∪Y ∈ Set =⇒ 22 ∈ Set

Отсюда следует, что нам достаточно доказать включение


X∪Y
X × Y ⊆ 22 (0.3.183)

– и тогда по теореме 0.3.6 это будет означать, что X × Y – тоже множество. Это делается так:

(0.3.126)
(A, B) ∈ X × Y =⇒ A∈X &B∈Y =⇒ A∈ X ∪Y & B ∈ X ∪Y =⇒
(0.3.126) X∪Y
=⇒ {A} ∈ 2X∪Y & {A, B} ∈ 2X∪Y =⇒ (A, B) = {{A}, {A, B}} ∈ 22 .

Отношения.
• Отношением называется произвольный класс r, элементами которого являются упорядо-
ченные пары:
C ∈ r =⇒ ∃A ∃B C = (A, B).
(Это автоматически означает, что компоненты A и B каждой такой пары (A, B) должны
быть множествами, потому что иначе пара (A, B) не могла бы быть элементом r.)
! 0.3.26. Всякое отношение r является подклассом в декартовом произведении X × Y некоторых
классов X и Y :
r ⊆X ×Y (0.3.184)
В качестве X и Y можно взять, например, класс Set всех множеств.

• Формула A ∈ B, рассматриваемая на классе но в дальнейшем мы все же будем пользовать-


множеств, то есть когда A, B ∈ Set, опреде- ся символом ∈ для его обозначения, чтобы не
ляет некоторое отношение, усложнять запись без необходимости. Мы наде-
емся, что это не вызовет недоразумений.
e = {(A, B) : A ∈ B}, (0.3.185)
Предложение 0.3.27. Класс e не является
которое естественно называть отношением множеством:
принадлежности. e∈/ Set (0.3.186)
При этом формально формула A ∈ B не бу- Доказательство. Предположим, что e ∈ Set.
дет эквивалентна формуле (A, B) ∈ e, Тогда {e} ∈ Set, то есть e и {e} – множества.
При этом e ∈ {e}, и значит, (e, {e}) ∈ e. Вспомнив
A ∈ B ⇐⇒ / (A, B) ∈ e, определение упорядоченной пары, мы получим
потому что если B – не множество, то в силу {{e}, {e, {e}}} = (e, {e}) ∈ e
(0.3.172), (A, B) = Set, и поэтому (A, B) ∈
/ e. По
С другой стороны, e ∈ {e} и {e} ∈ {{e}, {e, {e}}},
этой причине для обозначения этого отношения
и мы получаем цепочку
мы ввели здесь букву e вместо ожидаемого сим-
вола ∈. Это отношение понадобится нам ниже, e ∈ {e} ∈ {{e}, {e, {e}}} ∈ e,
§ 3. Теория множеств Морса-Келли 39

которая невозможна по свойству 3◦ на с.35. Предложение 0.3.28. Класс s не является


множеством:
• Точно так же формула A ⊆ B, рассматривае-
s∈
/ Set (0.3.188)
мая на классе множеств, A, B ∈ Set, опреде-
ляет некоторое отношение,
Доказательство. Предположим, что s ∈ Set.
s = {(A, B) : A ⊆ B}, (0.3.187) Поскольку s ⊆ s, мы получаем (s, s) ∈ s. Вспом-
нив определение упорядоченной пары, мы полу-
которое естественно называть отношением чим
включения.
{{s}} = {{s}, {s}} = {{s}, {s, s}} = (s, s) ∈ e
Как и в случае с ∈, формула A ⊆ B не будет
эквивалентна формуле (A, B) ∈ s,
Это дает цепочку
A⊆B ⇐⇒
/ (A, B) ∈ s,
s ∈ {s} ∈ {{s}} ∈ s,
потому что если B – не множество, то в силу
(0.3.172), (A, B) = Set, и (A, B) ∈
/ s. которая невозможна по свойству 3◦ на с.35.

• Если r и s – два отношения, то их композицией называется класс

r ◦ s = {U : ∃A ∃B ∃C U = (A, C) & (A, B) ∈ r & (B, C) ∈ s} (0.3.189)

• В дальнейшем для всякой формулы P от переменных A и C условимся употреблять обо-


значение {(A, C) : P } вместо {U : ∃A ∃C U = (A, C) & P }. Это позволяет сократить
формулы, например, (0.3.189) тогда можно будет записать так:

r ◦ s = {(A, B) : ∃B (A, B) ∈ r & (B, C) ∈ s} (0.3.190)

• Если r – отношение, то обратным отношением к нему называется отношение

r−1 = {(A, B) : (B, A) ∈ r} (0.3.191)

Теорема 0.3.29. Для любых отношений r, s, t

(r ◦ s) ◦ t = r ◦ (s ◦ t), (0.3.192)

r ◦ (s ∩ t) = (r ◦ s) ∩ (r ◦ t), (0.3.193)

r ◦ (s ∪ t) = (r ◦ s) ∪ (r ◦ t). (0.3.194)

(r−1 )−1 = r (0.3.195)

(r ◦ s)−1 = s−1 ◦ r−1 (0.3.196)

• Если r – отношение, то для любых классов X и Y запись XrY эквивалентна записи


(X, Y ) ∈ r:
XrY ⇐⇒ (X, Y ) ∈ r (0.3.197)
• Говорят, что r – отношение на классе X, если r ⊆ X × X.

Отображения.
• Класс f называется отображением, если он является отношением и удовлетворяет усло-
вию:   
∀X ∀Y ∀Z (X, Y ) ∈ f & (X, Z) ∈ f ⇒ Y = Z . (0.3.198)

• Областью определения класса (необязательно, отображения) f называется класс

D(f ) = {X : ∃Y (X, Y ) ∈ f }. (0.3.199)


40 Глава 0. ТЕОРИЯ МНОЖЕСТВ

• Областью значений (или образом) класса (необязательно, отображения) f называется


класс
R(f ) = {Y : ∃X (X, Y ) ∈ f }. (0.3.200)
• Значением класса (необязательно, отображения) f на классе X называется класс

f (X) = ∩{Y : (X, Y ) ∈ f }. (0.3.201)

• Запись
f :X→Y (0.3.202)
означает, что f является отображением, область определения которого совпадает с клас-
сом X, а область значений лежит в классе Y :

D(f ) = X & R(f ) ⊆ Y. (0.3.203)

• Полезно также зарезервировать какое-то обозначение для ситуации, когда условия (0.3.203)
ослаблены до условий
D(f ) ⊆ X & R(f ) ⊆ Y. (0.3.204)
Мы в таких случаях будем писать
f : X ֒→ Y. (0.3.205)

⋄ 0.3.30. Можно заметить, что пустое множе- Определение (0.3.201) позволяет также найти
ство ∅ является отображением, потому что фор- значение класса Set на произвольном классе X:
мулы (X, Y ) ∈ ∅ и (X, Z) ∈ ∅, ложны, и значит, (
из них следует что угодно, в частности Y = Z. ∅, X ∈ Set
Set(X) = . (0.3.208)
При этом, Set, X∈/ Set

D(∅) = ∅ = R(∅) (0.3.206) Действительно, если X ∈ Set, то

потому что из (X, Y ) ∈ ∅ следует X ∈ ∅ и Y ∈ ∅. Set(X) = ∩{Y : (X, Y ) ∈ Set} =


Для произвольного класса X значение на нем
отображения ∅ равно = (0.3.167) = ∩ Set = (0.3.140) = ∅.

Если же X ∈
/ Set, то
∅(X) = ∅ (0.3.207)

потому что Set(X) = ∩{Y : (X, Y ) ∈ Set} = (0.3.172) =


= ∩{Y : (X, Y ) ∈ Set} = ∩∅ = (0.3.139) = Set .
∅(X) = ∩{Y : (X, Y ) ∈ ∅} =
⋄ 0.3.32. Характеристическая функция
= ∩ Set = (0.3.140) = ∅. класса. Пусть X — произвольный класс. Класс
⋄ 0.3.31. Класс всех множеств Set, наоборот, не n  
является отображением, потому что если X, Y , f = z : ∃x ∈ X z = (x, {∅}) ∨
Z – множества, и Y 6= Z (такие множества Y и  o
Z существуют, например, в силу (0.3.162)), то по ∨ ∃x ∈
/ X z = (x, ∅) (0.3.209)
теореме 0.3.21, (X, Y ) ∈ Set и (X, Z) ∈ Set, но
Y 6= Z. Несмотря на это, можно найти область является отображением, удовлетворяющим усло-
определения и область значений класса Set: виям

D(Set) = Set = R(Set). D(f ) = Set & (f (x) = {∅} ⇔ x ∈ X) &


& (f (x) = ∅ ⇔ x ∈
/ X).
Действительно, для всякого X ∈ Set мы получа-
ем (X, ∅) ∈ Set, и значит X ∈ D(Set), а с другой Это отображение называется характеристиче-
стороны (∅, X) ∈ Set, и поэтому X ∈ R(Set). ской функцией класса X.

Теорема 0.3.33. Для всякого класса f

X ∈ D(f ) =⇒ f (X) ∈ Set (0.3.210)


X∈
/ D(f ) =⇒ f (X) = Set (0.3.211)
§ 3. Теория множеств Морса-Келли 41

Доказательство. Если X ∈ D(f ), то {Y : (X, Y ) ∈ Set} 6= ∅, и в силу (0.3.144) мы получаем

f (X) = ∩{Y : (X, Y ) ∈ D(f )} ∈ Set .

/ Set, то {Y : (X, Y ) ∈ Set} = ∅, и в силу (0.3.139) мы получаем


Если же X ∈

f (X) = ∩{Y : (X, Y ) ∈ D(f )} = ∩∅ = Set .

Теорема 0.3.34. Если f и g — отображения, то их композиция g ◦ f — тоже отображение, и


для него справедливы соотношения

D(g ◦ f ) = {X ∈ D(f ) : f (X) ∈ D(g)} ⊆ D(f ) (0.3.212)

R(g ◦ f ) = {Z ∈ D(g) : ∃Y ∈ R(f ) ∩ D(g) g(Y ) = Z} ⊆ R(g) (0.3.213)


и тождество
(g ◦ f )(x) = g(f (x)), x ∈ D(g ◦ f ) (0.3.214)
• Отображение f : X → Y называется биекцией между классами X и Y , если Y = R(f ) и

∀A ∀B (A, B ∈ D(f ) & A 6= B) ⇒ f (A) 6= f (B).

• Примером биекции является тождественное отображение idX : X → X, определенное на


любом классе X формулой
idX (A) = A, A ∈ X. (0.3.215)
• Два отображения f : X → Y и g : Y → X называются взаимно обратными, если

g ◦ f = idX & f ◦ g = idY .

В этом случае отображение g называют также обратным отображением для f (а f —


обратным отображением для g).
Теорема 0.3.35. Отображение f : X → Y тогда и только тогда будет биекцией между X и Y ,
когда существует обратное ему отображение g : Y → X

Схема аксиом подстановки. Следующая схема аксиом теории MK представляет собой утвер-
ждение, что если f – отображение, и его область определения D(f ) – множество, то и его область
значений R(f ) – тоже множество.
MK-12 Аксиома подстановки: пусть ϕ — формула теории множеств, не содержащая пе-
ременную B в качестве свободной переменной, тогда
    

∃A ∀X X ∈ A ⇒ ∃!Y ϕ ⇒ ∀A A ∈ Set ⇒ ∃B ∈ Set ∀X X ∈ A ⇒ ∃Y Y ∈ B & ϕ

  (0.3.216)
(здесь формула до первой импликации — ∃A ∀X X ∈ A ⇒ ∃!Y ϕ — означает, что ϕ
выражает функциональную зависимость между переменными X и Y , а формула после
первой импликации — что если X пробегает множество, то Y тоже пробегает множество).

Свойства отображений:
1◦ Если f и g – отображения, то f ◦ g – тоже отображение.
2◦ Если f – отображение, то
f = {(X, Y ) : Y = f (X)} (0.3.217)
3◦ Отображения f и g совпадают тогда и только тогда, когда они совпадают на всех
значениях:
f = g ⇐⇒ ∀X f (X) = g(X) (0.3.218)
4◦ Если f – отображение, у которого область определения D(f ) является множеством,
то f – множество.
42 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Доказательство. Мы докажем только пункт 4. Если f – отображение, и его область определения


D(f ) – множество, то по аксиоме MK-12 область значений R(f ) – тоже множество. Значит по теореме
0.3.25, декартово произведение D(f ) × R(f ) – тоже множество. Отсюда по теореме 0.3.6 класс f ⊆
D(f ) × R(f ) является множеством.

• Если X – множество, то для произвольного класса Y символом Y X обозначается класс,


состоящий из отображений f : X → Y :

f ∈YX ⇐⇒ f : X → Y. (0.3.219)

Теорема 0.3.36. Если X и Y – множества, то класс Y X – тоже множество.

Доказательство. Всякое отображение f : X → Y является отношением, поэтому элементом декар-


това произведения X × Y , поэтому справедлива цепочка

f ∈YX =⇒ f ⊆X ×Y =⇒ f ∈ 2X×Y ,

Иными словами,
Y X ⊆ 2X×Y . (0.3.220)
Если X и Y – множества, то по теореме 0.3.25, декартово произведение X ×Y – тоже множество. От-
сюда по теореме 0.3.10, 2X×Y – тоже множество. Таким образом, в (0.3.220) справа стоит множество,
и значит, по теореме 0.3.6, слева – тоже множество.

Теорема 0.3.37. Если X, Y , Z – множества, то правила

P (f )(B)(A) = f (B, A), A ∈ X, B ∈ Y, f ∈ Z Y ×X . (0.3.221)

и
Q(g)(B, A) = g(B)(A), A ∈ X, B ∈ Y, g ∈ (Z Y )X . (0.3.222)
определяют пару взаимно обратных биекций между Z Y ×X и (Z Y )X :

P : Z Y ×X → (Z Y )X , Q : (Z Y )X → Z Y ×X

Доказательство. По теореме 0.3.35 здесь достаточно проверить, что P и Q взаимно обратны:

Q ◦ P = idZ Y ×X , P ◦ Q = id(Z Y )X .

Это делается прямым вычислением:

Q(P (f ))(B, A) = (0.3.222) = P (f )(B)(A) = (0.3.221) = f (B, A), f ∈ Z Y ×X .

и
P (Q(g))(B)(A) = (0.3.221) = Q(g)(B, A) = (0.3.222) = g(B)(A), g ∈ (Z Y )X .

• Для всякого отображения f и любого класса X введем следующие обозначения:

[
f (Y ) = {Z : ∃Y Y ∈ X & Z ∈ f (Y )} (0.3.223)
Y ∈X
\
f (Y ) = {Z : ∀Y Y ∈ X ⇒ Z ∈ f (Y )} (0.3.224)
Y ∈X
S
Класс Y ∈XTf (Y ) при этом называется объединением значений отображения f на классе
X, а класс Y ∈X f (Y ) — пересечением значений отображения f на классе X.

Теорема
S 0.3.38. ЕслиT отображение f является множеством, то для любого множества X
классы Y ∈X f (Y ) и Y ∈X f (Y ) являются множествами.
§ 3. Теория множеств Морса-Келли 43

Ограничение и продолжение отображения.


• Для всякого отношения r и любого класса X ограничением r на X называется отношение

r X = r ∩ (X × Set) (0.3.225)

Отношение r при этом называется продолжением отношения r X .

Теорема 0.3.39. Для всякого отображения f его ограничение f X на произвольный класс X яв-
ляется отображением, причем его область определения описывается равенством

D(f X ) = D(f ) ∩ X (0.3.226)

а действие – правилом
f X (Y ) = f (Y ), Y ∈ D(f ) ∩ X. (0.3.227)

Отношение эквивалентности.
• Отношение r ⊆ X × X называется отношением эквивалентности на классе X, если оно
обладает следующими свойствами:
— рефлексивность:
ArA, (0.3.228)
— симметричность:
ArB ⇒ BrA, (0.3.229)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.230)
• Если r — отношение эквивалентности на классе X, то классом эквивалентности по от-
ношению r называется произвольный непустой класс Y ⊆ X такой, что

∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.231)

Лемма 0.3.40. Любые два класса эквивалентности Y и Z либо не пересекаются, либо совпадают.
Доказательство. Если существует A ∈ Y ∩ Z, то для всякого B ∈ X мы получим:

B∈Y ⇐⇒ ArB ⇐⇒ B∈Z

Теорема 0.3.41. Пусть r — отношение эквивалентности на непустом классе X такое что все
классы эквивалентности по нему являются множествами. Тогда
(i) существует класс X/r, элементами которого являются в точности классы эквива-
лентности по отношению r:
 
Y ∈ X/r ⇔ Y ⊆ X & ∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.232)

(ii) существует отображение p : X → X/r со свойством

∀A ∈ X A ∈ p(A) (0.3.233)

Отображение p : X → X/r сюръективно.


• Класс X/r называется фактор-классом класса X по отношению эквивалентности r, а отоб-
ражение p : X → X/r – фактор-отображением (класса X по отношению эквивалентности
r).
Доказательство. Определим класс X/r формулой

X/r = {Y : ∅ 6= Y ⊆ X & ∀A ∈ X ∀B ∈ Y A∈Y ⇔ ArB }

Поскольку каждый класс эквивалентности Y является множеством, X/r будет состоять в точности
из всех классов эквивалентности по r. С другой стороры, отображение p определяется формулой

p(A) = {B : B ∈ X & ArB}.


44 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Ясно, что A ∈ p(A), а с другой стороны, p(A) является классом эквивалентности. Отображение
p будет сюръективно, потому что если Y – класс эквивалентности, то по определению он непуст,
поэтому найдется A ∈ Y . Для него мы получим A ∈ X и A ∈ p(A). Значит, Y и p(A) – классы
эквивалентности, содержащие A, и по лемме 0.3.40 мы получаем, что Y = p(A).
Теорема 0.3.42. Если X – множество, то на нем любое отношение эквивалентности r удовле-
творяет условиям теоремы 0.3.41, а фактор-класс X/r является множеством.
Доказательство. По теореме 0.3.41, фактор-отображение p : X → X/r сюръективно, поэтому

R(p) = X/r,

и по аксиоме MK-12, этот класс должен быть множеством.

⋄ 0.3.43. Отношение равенства Y = {A}, A ∈ X. Поэтому фактор-отображение


p : X → X/r будет биекцией.
ArB ⇐⇒ A=B
⋄ 0.3.44. Теорему 0.3.41 можно в некотором
является отношением эквивалентности на любом смысле обратить: произвольное отображение f :
классе X (например, на классе Set всех мно- X → Z порождает отношение эквивалентности
жеств). на классе X по формуле
Классами эквивалентности по такому отно-
шению будут только одноэлементные классы: ArB ⇐⇒ f (A) = f (B).

(d) Определения по индукции


Наполненные классы.
• Класс X называется наполненным, если всякий его элемент является его подклассом:

∀A ∈ X A⊆X (0.3.234)

⋄ 0.3.45. Очевидно, пустой класс ∅ наполнен. ⋄ 0.3.51. Класс X = {{∅}} обладает тем свой-
ством, что на нем отношение принадлежности ∈
⋄ 0.3.46. Одночленный класс {∅} также напол-
транзитивно,
нен.
⋄ 0.3.47. Упорядоченная пара {∅, {∅}} являет- ∀A, B, C ∈ X A ∈ B ∈ C ⇒ A ∈ C (0.3.235)
ся наполненным классом. но при этом класс X не наполнен.
⋄ 0.3.48. Эту цепочку примеров можно продол- Доказательство. Цепочка A ∈ B ∈ C ∈ {{∅}}
жать, потому что если X – наполненное множе- невозможна: можно построить цепочку из двух
ство, то класс X ∪ {X} – тоже наполненное мно- знаков ∈
жество. В частности, наполнены классы ∅ ∈ {∅} ∈ {{∅}},
{∅, {∅}, {∅, {∅}}} := {∅, {∅}} ∪ {{∅, {∅}}}, но левее уже никаких классов не подпишешь.
Отсюда следует, что класс X = {{∅}} триви-
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} := ально удовлетворяет условию (0.3.235). Но он не
удовлетворяет условию (0.3.234), потому что для
= {∅, {∅}, {∅, {∅}}} ∪ {{∅, {∅}, {∅, {∅}}}}
него нужно было бы, чтобы из
и так далее.
{∅} ∈ {{∅}}
⋄ 0.3.49. Класс Set всех множеств, очевидно, на-
полнен. следовало
{∅} ⊆ {{∅}}
! 0.3.50. Следующие примеры показывают, что
условие наполненности класса (несмотря на то есть
внешнее сходство) не эквивалентно условию ∅ ∈ {{∅}},
транзитивности отношения ∈ на данном классе. а это неверно.
§ 3. Теория множеств Морса-Келли 45

⋄ 0.3.52. Класс наполнен, но на нем отношение принадлежности


∈ не транзитивно.
X = {∅, {∅}, {{∅}}, {∅, {∅}}}

Свойства наполненных классов:


1◦ Всякий непустой наполненный класс X содержит в качестве элемента пустое множе-
ство:
∅∈X
2◦ Пересечение X ∩Y и объединение X ∪Y любых двух наполненных классов X и Y являются
наполненными классами.
3◦ Если X – класс, элементы которого являются наполненными классами, то пересечение
∩X и объединение ∪X элементов класса X также являются наполненными классами.

Доказательство. 1. По аксиоме регулярности MK-11, существует элемент Y ∈ X такой, что Y ∩X =


∅. Но с другой стороы, поскольку класс X насыщен, Y ⊆ X, и поэтому

Y = Y ∩ X = ∅.

2. Если X и Y – наполненные классы, и A ∈ X ∩ Y , то A ∈ X и A ∈ Y , и, посольку X и Y


наполненны, A ⊆ X и A ⊆ Y , и отсюда A ⊆ X ∩ Y . Если же A ∈ X ∪ Y , то A ∈ X или A ∈ Y , и,
посольку X и Y наполненны, A ⊆ X или A ⊆ Y , и отсюда A ⊆ X ∩ Y .
3. Утверждение 3◦ доказывается аналогично.

Теоремы об определении по индукции.


• Говорят, что отображение h индуктивно (или рекурсивно) определяет отображение f ,
или что отображение f индуктивно (или рекурсивно) определено отображением h, если
(i) область определения D(f ) отображения f является наполненным классом:

∀X ∈ D(f ) X ⊆ D(f ) (0.3.236)

(ii) значение отображения f на всяком элементе X ∈ D(f ) определяется значениями


f на элементах Y ∈ X с помощью функции h по формуле

∀X ∈ D(f ) f (X) = h(f |X ); (0.3.237)

(iii) f продолжает любое другое отображение со свойствами (i) и (ii): если g – какое-
то другое отображение, удовлетворяющее (i) и (ii), то g ⊆ f .
Следующая теорема – один из из самых важных результатов этой науки:

Теорема 0.3.53 (об определении по индукции). Всякое отображение h индуктивно определяет


единственное отображение f .

Доказательство. Пусть F – класс отображений, являющихся множествами и удовлетворяющих


условиям (0.3.236) и (0.3.305):

F = {f : ∀X ∈ D(f ) X ⊆ D(f ) & f (X) = h(f |X )}.

Заметим, что класс F непуст, потому что содержит по крайней мере пустое множество:

∅ ∈ F.

Покажем далее, что любые два отображения из класса F совпадают на общей области определения:

∀f, g ∈ F f D(f )∩D(g) = g D(f )∩D(g) (0.3.238)

Действительно, пусть f, g ∈ F . Рассмотрим класс

A = {X : X ∈ D(f ) ∩ D(g) & f (X) 6= g(X)}, (0.3.239)


46 Глава 0. ТЕОРИЯ МНОЖЕСТВ

и предположим, что он непуст, A 6= ∅. Тогда по аксиоме регулярности MK-11 в нем существует


элемент B, пересечение которого с A пусто:

B∈A & B ∩ A = ∅.

Первое означает, что значения отображений f и g различаются на B, а второе – что их ограничения


на B совпадают:
f (B) 6= g(B) & f B = g B . (0.3.240)
Поскольку B ∈ A, в силу (0.3.239), мы получаем B ∈ D(f ) ∩ D(g). А с другой стороны, оба отобра-
жения f и g принадлежат F , и значит, удовлетворяют условию (0.3.305). Отсюда, используя второе
утверждение в (0.3.240), мы получаем:

f (B) = (0.3.305) = h(f B ) = (0.3.240) = h(g B ) = (0.3.305) = g(B),

и это противоречит первому утверждению в (0.3.240). Значит, наше предположение, что A непусто,
неверно. То есть A = ∅, и это доказывает (0.3.238).
После этого нужно положить
f = ∪F,
и это будет отображение, индуктивно порожденное отображением h.
Теорема 0.3.54. Если отображение h определено на классе Set, то определенное им индуктивно
отображение f также определено на классе Set:

D(h) = Set =⇒ D(f ) = Set .

Доказательство. Предположим, что порожденное им отображение f определено не всюду на Set:

D(f ) 6= Set . (0.3.241)

Тогда
Set \ D(f ) 6= ∅,
и к этому классу можно применить аксиому регулярности MK-11: существует класс Y ∈ Set \ D(f )
такой, что
Y ∩ (Set \ D(f )) = ∅.
Иными словами,
Y ∈ Set \ D(f ) & Y ⊆ D(f ). (0.3.242)
Рассмотрим класс
N = {Y } ∪ D(f ).
Он наполнен, потому что если Z ∈ N , то
— либо Z ∈ D(f ), и тогда, поскольку D(f ) наполнен, мы получаем

Z ⊆ D(f ) ⊆ N,

— либо Z ∈ {Y }, то есть Z = Y , и тогда, в силу (0.3.242), мы получаем

Z = Y ⊆ D(f ) ⊆ N.

Определим отображение g на N правилом


(
f (X), X ∈ D(f )
g(X) = , X ∈ N.
h(f ), X = Y

Оно будет принадлежать F и продолжать отображение f на более широкий, чем D(f ), класс N .
Это означает, что f не может удовлетворять условию (iii) в определении на с.57. Как следствие,
наше предположение (0.3.241) не может быть верно.
Теорема 0.3.55. Пусть отображение h и классы M и P удовлетворяют следующим условиям:
(i) класс M наполнен:
∀X ∈ M X ⊆ M, (0.3.243)
§ 3. Теория множеств Морса-Келли 47

(ii) для всякого элемента X ∈ M класс P X всех отображений f : X → P содержится в


области определения h:
∀X ∈ M P X ⊆ D(h), (0.3.244)
(iii) область значений h содержится в классе P :

R(h) ⊆ P. (0.3.245)

Тогда существует единственное отображение f : M → P , связанное с отображением h тожде-


ством (0.3.305):
∀X ∈ D(f ) = M f (X) = h(f |X ). (0.3.246)
Доказательство. Рассмотрим отображение H : Set → Set, определенное правилом:
( S
h(g), g ∈ X∈M P X
H(g) = S (0.3.247)
∅, g∈/ X∈M P X

Оно корректно определено в силу (0.3.244). По теореме 0.3.54, H индуктивно определяет некое
отображение F : Set → Set. В частности, F будет удовлетворять условию (0.3.305):

∀X ∈ Set F (X) = H(F |X ). (0.3.248)

Покажем, что
∀X ∈ M F X ∈ P X . (0.3.249)
Предположим, что это не так:
∃X ∈ M F X ∈
/ P X. (0.3.250)
Зафиксируем этот элемент X ∈ M . Условие (0.3.250) означает, что найдется Y ∈ X такой, что

F (Y ) ∈
/ P.

Из условия (0.3.243) следует, что Y ∈ M . Поэтому множество

N = {Y ∈ M : F (Y ) ∈
/ P}

непусто. Применим к нему аксиому регулярности MK-11: существует A такой, что

A∈N & A ∩ N = ∅.

Первое условие здесь означает, что

A∈M & F (A) ∈


/ P, (0.3.251)

а второе – что
∀Z ∈ A Z ∈
/ N = {Y ∈ M : F (Y ) ∈
/ P },
Опять применяя (0.3.243), можно это переформулировать так:

∀Z ∈ A Z∈M & Z∈
/ N = {Y ∈ M : F (Y ) ∈
/ P} .

Это в свою очередь, будет означать

∀Z ∈ A F (Z) ∈ P,

и, добавив к этому первую часть (0.3.251), мы можем записать это так:



A ∈ M & F A ∈ P A . (0.3.252)

Теперь мы получаем:

F (A) = (0.3.248) = H(F A ) = (0.3.252), (0.3.247) = h(F A ) ∈ R(h) ⊆ (0.3.245) ⊆ P

То есть F (A) ∈ P , и это противоречит (0.3.251). Значит, наше предположение (0.3.250) неверно, и
поэтому справедливо (0.3.249).
48 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Положим теперь
f = F M .
Для него будет выполняться тождество (0.3.246),

∀X ∈ M f (X) = F (X) = (0.3.248) = H(F X ) = (0.3.249), (0.3.247) = h(F X ),

из которого будет следовать, что f является отображением из M в P :



f (X) = h(F ) ∈ R(h) ⊆ (0.3.245) ⊆ P
X

Остается доказать единственность такого отображения f . Пусть g : M → P – какое-нибудь


другое отображение с тем же свойством:

∀X ∈ M g(X) = h(g|X ). (0.3.253)

Предположим, что f 6= g. Тогда класс

N = {X ∈ M : f (X) 6= g(X)}

непуст. Значит, к нему можно применить аксиому регулярности MK-11: существует класс A такой,
что
A ∈ N & A ∩ N = ∅.
Первое условие означает, что
A∈M & f (A) 6= g(A). (0.3.254)
А второе – что
∀X ∈ A f (X) = g(X),
то есть что
f A = g A .
Но отсюда, применяя первое условие из (0.3.254), A ∈ M , мы получаем

f (A) = (0.3.246) = h(f A ) = h(g A ) = (0.3.253) = g(A),

и это противоречит второму условию из (0.3.254): f (A) 6= g(A).

(e) Ординалы
Отношение полного порядка.
• Отношение r ⊆ X × X называется отношением строгого частичного порядка на классе
X, если оно обладает следующими свойствами:
— антисимметричность:
ArB ⇒ ¬(BrA), (0.3.255)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.256)
• Отношение r ⊆ X × X называется отношением строгого линейного порядка на классе
X, если оно является отношением строгого частичного порядка и обладает следующим
дополнительным свойством:
— линейность:
A 6= B ⇒ (ArB ∨ BrA), (0.3.257)
• Говорят, что в классе X элемент A ∈ X является
— минимальным для отношения r, если для любого другого элемента B ∈ X из
BrA следует, что B = A,
— максимальным для отношения r, если для любого другого элемента B ∈ X из
ArB следует, что B = A.
§ 3. Теория множеств Морса-Келли 49

Предложение 0.3.56. Если r – отношение строгого линейного порядка на классе X, и Y ⊆ X


– подкласс в X, то минимальный элемент A в Y , если он существует, единственен и обладает
свойством
∀B ∈ Y (A 6= B =⇒ A rB) (0.3.258)
Доказательство. Предположим, что A и A′ – два минимальных элемента в Y . Тогда если A 6=
A′ , то, поскольку отношение r линейно, либо ArA′ , либо A′ rA. Если ArA′ , то A′ не может быть
минимальным элементом в Y , а если A′ rA, то A не может быть минимальным элементом в Y .
Пусть далее A – минимальный элемент в Y , и пусть B ∈ Y , причем A 6= B. Поскольку отно-
шение r линейно, должно выполняться либо ArB, либо BrA. Второе невозможно, поскольку A –
минимальный элемент в Y .
• Отношение r ⊆ X × X называется отношением полного порядка на классе X, если оно
является отношением строгого линейного порядка и в любом непустом подклассе Y ⊆ X,
Y 6= ∅, имеется минимальный для r элемент.
• Если r — отношение полного порядка на классе X, то говорят также, что r вполне упоря-
дочивает X. Кроме того, если на классе X существует какое-нибудь отношение полного
порядка, то говорят, что класс X можно вполне упорядочить.
• Если r – отношение полного порядка на классе X, и ∅ 6= Y ⊆ X, то минимальный
элемент в Y , существование которого постулируется в определении полного порядка, а
единственность доказывается в предложении 0.3.56, обозначается символом

min Y. (0.3.259)

Определение и свойства ординалов.


• Класс X называется ординалом, если он наполнен, и любой его элемент Y ∈ X также
является наполненным классом.

⋄ 0.3.57 (конструкция фон Неймана). Матема- — класс {∅, {∅}, {∅, {∅}}} является ординалом
тику Джону фон Нейману принадлежит следую- и обозначается
щая остроумная идея строить ординалы “по ин-
дукции”. 3 := {∅, {∅}, {∅, {∅}}} = {0, 1, 2} = 2 ∪ {2}.
Прежде всего, пустое множество ∅ являет- (0.3.263)
ся ординалом. В дальнейшем нам будет удобно — следующий в этой цепочке класс 3 ∪ {3} тоже
использовать для него новый символ: является ординалом и обозначается

0 := ∅. (0.3.260) 4 := {0, 1, 2, 3} = 3 ∪ {3}. (0.3.264)

Далее, одночленный класс {∅} (единствен- — так же определяются классы 5, 6, 7, 8 и 9:


ным элементом которого является пустое мно-
жество) также является ординалом. Для него 5 := {0, 1, 2, 3, 4} = 4 ∪ {4}, (0.3.265)
мы также введем специальное обозначение 6 := {0, 1, 2, 3, 4, 5} = 5 ∪ {5}, (0.3.266)
1 := {∅} = {0} = 0 ∪ {0}. (0.3.261) 7 := {0, 1, 2, 3, 4, 5, 6} = 6 ∪ {6}, (0.3.267)
8 := {0, 1, 2, 3, 4, 5, 6, 7} = 7 ∪ {7}, (0.3.268)
Так же по аналогии определяются ординалы 9 := {0, 1, 2, 3, 4, 5, 6, 7, 8} = 8 ∪ {8}.(0.3.269)
2, 3, 4, 5, 6, 7, 8, 9 (и некоторые из этих обозначе-
ний будут нам полезны ниже, в частности, 0 и 1 ⋄ 0.3.58. Экспонента нуля равна единице:
встретятся при на с.160 в определении предиката
истинности, и это будет еще до обсуждения поня- 20 = 1 (0.3.270)
26
тия числа, которое начнется только со с.187 ):
Доказательство.
— класс {∅, {∅}} (с двумя элементами, ∅ и {∅}
) также является ординалом и обозначается X ∈ 20 = 2∅ ⇐⇒ X ⊆ ∅ ⇐⇒ X = ∅ = 0.

2 := {∅, {∅}} = {0, 1} = 1 ∪ {1}. (0.3.262)


26 Все же в обозначениях 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 читатель, конечно, должен увидеть связь с натуральными числа-
ми, потому что эти ординалы действительно входят как элементы в определяемый ниже класс N, формализующий
идею (расширенного) множества натуральных чисел (и значит, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 действительно являются
натуральными числами, см. (0.3.313)).
50 Глава 0. ТЕОРИЯ МНОЖЕСТВ

⋄ 0.3.59. Экспонента единицы равна двойке: X ∈ 21 = 2{∅} ⇐⇒ X ⊆ {∅} ⇐⇒


⇐⇒ X=∅ ∨ X = {∅} ⇐⇒
21 = 2 (0.3.271)
⇐⇒ X ∈ {∅; {∅}} = 2.
Доказательство.

Теорема 0.3.60. Если X – ординал и Y ⊆ X – наполненный подкласс в X, то Y – тоже ординал.

Доказательство. Поскольку X наполнен, любой элемент Z ∈ Y является также элементом орди-


нала X, и поэтому Z – наполненый класс. С другой стороны, Y сам наполнен, и вместе это значит,
что Y – ординал.

Теорема 0.3.61. Всякий элемент Y ∈ X произвольного ординала X сам является ординалом.

Доказательство. Для Y ∈ X мы получаем импликацию


X – ординал
Y ∈X =⇒ Y – наполненный класс,

а для любого его элемента Z ∈ Y – цепочку


X – наполненный
класс X – ординал
Z∈Y ∈X =⇒ Z∈X =⇒ Z – наполненный класс.

Таким образом, класс Y наполнен и любой его элемент Z ∈ Y – тоже наполненный класс. Значит,
Y – ординал.

Теорема 0.3.62 (об отношении ∈ на ординале). Пусть X – ординал. Тогда отношение принад-
лежности ∈ на X будет отношением полного порядка27 , то есть будет обладать следующими
свойствами:
(i) транзитивность:
∀A, B, C ∈ X A∈B∈C =⇒ A∈C (0.3.272)
(ii) линейность:
∀A, B ∈ X A ∈ B ∨ B ∈ A ∨ A = B. (0.3.273)
(iii) полная упорядоченность: если ∅ 6= Y ⊆ X — непустой подкласс в X, то найдется
элемент B ∈ Y , принадлежащий любому другому элементу C ∈ Y , отличному от B:

C ∈ Y & C 6= B ⇒ B ∈ C, (0.3.274)

причем таким элементом B будет пересечение класса Y :

B = ∩Y (0.3.275)

• Элемент B класса Y , описываемый в свойстве 3◦ , называется минимальным элементом


класса Y (по отношению принадлежности ∈) и обозначается

B = min Y (0.3.276)

Свойство 3◦ , таким образом, утверждает, что

min Y = ∩Y (0.3.277)

Доказательство. 1. Транзитивность следует напрямую из определения ординала: если A, B, C ∈ X


и A ∈ B ∈ C, то, поскольку C, как элемент ординала X, является наполненным классом, A ∈ C.
2. Линейность доказывается от противного (и довольно сложно). Предположим, что условие
(0.3.273) не выполняется. Тогда должен быть непустым класс

Y = {B ∈ X : ∃A ∈ X A∈
/ B & A 6= B & B ∈
/ A}. (0.3.278)
27 Отношение полного порядка было определено на с.49.
§ 3. Теория множеств Морса-Келли 51

По аксиоме регулярности MK-11 на с.35, это означает, что существует элемент y ∈ Y такой что
y ∩ Y = ∅. Зафиксируем этот класс y. Он один из тех B, для которых выполняется формула,
определяющая Y :
B ∈ X & (∃A ∈ X A ∈ / B & A 6= B & B ∈/ A)
То есть формула
y ∈ X & (∃A ∈ X A∈
/ y & A 6= y & y ∈
/ A).
Это означает, что класс
Z = {z ∈ X : z ∈
/ y & z 6= y & y ∈
/ z} (0.3.279)
– тоже непуст. Опять аксиоме регулярности MK-11 на с.35, существует элемент z ∈ Z такой что
z ∩ Z = ∅. Зафиксируем z тоже.
Заметим теперь, что y ∈
/ Z (потому что y 6= y неверно, и значит, формула y ∈ X & y ∈
/ y & y 6=
y &y ∈ / y, получаемая подстановкой y вместо z в фигурные скобки (0.3.279), тоже неверна). По-
скольку z ∈ Z, отсюда можно сделать вывод, что

y 6= z. (0.3.280)

Покажем, что тем не менее из наших построений следует, что

y = z. (0.3.281)

Это будет противоречием к исходному предположению, что (0.3.273) не выполняется.


Сначала покажем, что y ⊆ z. Пусть t ∈ y. Поскольку X – ординал, и значит наполненный класс,
из t ∈ y ∈ X следует t ∈ X. Мы получим такую цепочку:
 
y∩Y = ∅ =⇒ t ∈/Y =⇒ ¬ t ∈ X & ∃A ∈ X A ∈
/t&A=t&t∈A =⇒
 
=⇒ t∈
/ X ∨ ∀A ∈ X A ∈t∨A =t∨t ∈A =⇒ ∀A ∈ X A ∈ t ∨ A = t ∨ t ∈ A =⇒
=⇒ z ∈ t∨z = t∨t∈ z

Покажем, что в последней формуле первые два варианта невозможны:


— если z ∈ t, то поскольку t ∈ y, и z, t, y ∈ X, мы, по уже доказанному условию транзитив-
ности (0.3.272), получаем z ∈ y, и, по определению класса Z это означает, что z ∈ / Z (а
это противоречит выбору z ∈ Z),
— если же z = t, то, поскольку t ∈ y, мы получаем z ∈ y, и, опять по определению класса Z
это означает, что z ∈
/ Z (и это противоречит выбору z ∈ Z).
Итак, остается только вариант t ∈ z, и, поскольку это верно для любого t ∈ y, мы получаем y ⊆ z.
Теперь наоборот, покажем что z ⊆ y. Пусть t ∈ z. Поскольку X – ординал, и значит наполненный
класс, из t ∈ y ∈ X следует t ∈ X. С другой стороны, z ∩ Z = ∅, поэтому t ∈
/ Z. Вместе то и другое
дает цепочку
 
t∈
/Z =⇒ ¬ t∈X &t∈
/ y & t 6= y & y ∈
/t =⇒
 
=⇒ t ∈ / X ∨ t∈y∨t=y∨y ∈t =⇒ t∈y∨t=y∨y ∈t

Покажем, что в последней формуле последние два варианта невозможны:


— если y ∈ t, то поскольку t ∈ z, и y, t, z ∈ X, мы, по уже доказанному условию транзитив-
ности (0.3.272), получаем y ∈ z, и, по определению класса Z это означает, что z ∈ / Z (а
это противоречит выбору z ∈ Z),
— если же y = t, то, поскольку t ∈ z, мы получаем t ∈ y, и, опять по определению класса Z
это означает, что z ∈
/ Z (и это противоречит выбору z ∈ Z).
Остается только вариант t ∈ y, и, поскольку это верно для любого t ∈ z, мы получаем z ⊆ y.
Мы доказали равенство (0.3.281), противоречащее (0.3.280), и это нам и нужно было.
3. Пусть ∅ 6= Y ⊆ X. Пусть X – ординал, и ∅ 6= Y ⊆ X. По аксиоме регулярности MK-11 на с.35,
существует элемент B ∈ Y такой, что B ∩ Y = ∅. Это значит, что ни для какого элемента C ∈ Y не
выполняется C ∈ B:
∀C ∈ Y C ∈ / B. (0.3.282)
52 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Поскольку B и C – элементы ординала X, в силу свойства линейности (0.3.273), либо B ∈ C, либо


B = C, либо C ∈ B. Поэтому (0.3.282) эквивалентно условию (0.3.274). Мы доказали существование
элемента B.
Теперь покажем, что B = ∩Y . По теореме 0.3.61, всякий элемент C ∈ Y ⊆ X является ординалом,
поэтому он наполнен, и значит из (0.3.274) следует

C ∈ Y & C 6= B ⇒ B ⊆ C.

Поскольку B ⊆ B, условие C 6= B можно отбросить:

C∈Y ⇒ B ⊆ C.

Из этого можно сделать вывод, что B ⊆ ∩Y . С другой стороны, B ∈ Y , поэтому ∩Y ⊆ B. Вместе


это означает равенство (0.3.275).
Лемма 0.3.63. Пусть X и Y – ординалы. Тогда

Y ⊆X ⇐⇒ (Y ∈ X ∨ Y = X), (0.3.283)

причем если Y ⊆ X и Y 6= X, то
Y = min(X \ Y ) (0.3.284)
Доказательство. Пусть X – ординал, Y – наполненный класс и Y ⊆ X. В утверждении (0.3.283)
импликация в левую сторону очевидна:

Y ⊆X ⇐= (Y ∈ X ∨ Y = X).

Если Y = X, то Y ⊆ X тривиально. Если же Y ∈ X, то Y ⊆ X по формуле (0.3.234), поскольку


класс X насыщен.
Докажем обратную импликацию

Y ⊆X =⇒ (Y ∈ X ∨ Y = X).

Пусть Y ⊆ X и Y 6= X. Тогда X \ Y 6= ∅, и по уже доказанному свойству 2◦ , класс X \ Y обладает


минимальным элементом:
B = min(X \ Y ).
Нам нужно показать, что Y = B (это докажет формулу (0.3.284), из которой будет следовать, что
Y = B ∈ X).
a. Покажем сначала, что Y ⊆ B. Пусть A ∈ Y . Из свойства линейности (0.3.273) следует, что
либо A ∈ B, либо A = B, либо B ∈ A. Покажем, что последние два варианта невозможны.
Действительно, если A = B, то вместе с A ∈ Y это дает B ∈ Y , что невозможно, потому
что B = min(X \ Y ), откуда B ∈ X \ Y . Если же B ∈ A, то получается B ∈ A ∈ Y , и,
поскольку Y наполнен, B ∈ Y , что опять противоречит условию B ∈ X \ Y . Мы получаем,
что A ∈ B, и это доказывает импликацию A ∈ Y ⇒ A ∈ B.
b. Покажем, что наоборот, B ⊆ Y . Пусть A ∈ B. Поскольку A ∈ B ∈ X, а класс X наполнен,
мы получаем, что A ∈ X. Нам нужно показать, что A ∈ Y . Если предположить, что это
не так, то есть A ∈ X \ Y , то из-за условия B = min(X \ Y ) это будет означать, что
A∈/ B, а это противоречит выбору A как элемента B. Значит действительно A ∈ Y , и это
доказывает импликацию A ∈ B ⇒ A ∈ Y .

Свойства ординалов:

1 Всякий непустой ординал X содержит пустой класс ∅ в качестве элемента,

∅ ∈ X, (0.3.285)

и имеет пустое пересечение:


∩X = ∅ (0.3.286)
Поэтому, в частности, минимальным элементом в ординале X является пустой класс:

min X = ∅. (0.3.287)
§ 3. Теория множеств Морса-Келли 53

2◦ Пересечение X ∩ Y и объединение X ∪ Y любых двух ординалов X и Y являются ордина-


лами.
3◦ Если M – класс, элементами которого являются ординалы, то ∪M – ординал, и при
этом всякий ординал X ∈ M либо принадлежит ∪M , либо совпадает с ∪M :

X ∈M ⇒ X ∈ ∪M ∨ X = ∪M . (0.3.288)

4◦ Если M – непустой класс, элементами которого являются ординалы, то ∩M – ординал,


причем ∩M ∈ M , и всякий ординал X ∈ M либо содержит ∪M в качестве элемента,
либо совпадает с ∪M :

X∈M ⇒ ∩ M ∈ X ∨ ∩M = X . (0.3.289)

5◦ Если X и Y – ординалы, то либо X ⊆ Y , либо Y ⊆ X.


6◦ Если X и Y – ординалы, то либо X ∈ Y , либо Y ∈ X, либо X = Y .
Доказательство. 1. Первое утверждение следует из свойства 1◦ наполненных классов на с.45. Из
(0.3.285) мы получаем цепочку:

∅∈X =⇒ ∩X ⊆ ∅ =⇒ ∩X = ∅.

Формула (0.3.287) теперь следует из (0.3.277).


2. Если X и Y – ординалы, то они – наполненные классы, поэтому по свойству 2◦ на с.45 классы
X ∩ Y и X ∪ Y также наполнены. С другой стороны, элементами X ∩ Y и X ∪ Y являются элементы
X и Y , и эти элементы являются наполненными классами.
3. Пусть M – класс, элементами которого являются ординалы. По свойству 3◦ на с.45, класс
∪M наполнен. С другой стороны, из B ∈ ∪M следует, что B ∈ C для некоторого C ∈ M , который
является ординалом. Значит, его элемент B – наполненный класс. Это доказывает, что ∪M – орди-
нал. Теперь если X ∈ M , то в силу (0.3.142), X ⊆ ∩M , и поскольку X и ∪M – ординалы, по лемме
0.3.63, либо X ∈ ∪M , либо X = ∪M .
4. Пусть M – непустой класс, элементами которого являются ординалы. По уже доказанно-
му свойству 3◦ , всякий элемент X ∈ M либо принадлежит ординалу ∪M , либо совпадает с ним.
Рассмотрим два случая:
a. Если все элементы X ∈ M совпадают с ∪M , то есть M просто состоит из одного элемента,
X = ∪M , то ∩M = X = ∪M , и то, что утверждается, верно автоматически: ∩M = X ∈ M
и X = ∩M .
b. Если в M имеются элементы, отличные от ∪M , то положив N = M \ {∪M }, мы получим
∩N = ∩M . При этом по уже доказанному свойству 3◦ , N будет непустым классом в
ординале ∪M . По свойству 3◦ на с.50, ∩N = min N ∈ N ⊆ M , и отсюда ∩M = ∩N ∈ M .
Если теперь X ∈ M , то либо X ∈ N , и тогда в силу (0.3.274), ∩M = ∩N = min N ∈ X,
либо X ∈/ N , и тогда X = ∪M .
5. Пусть X и Y – ординалы. По уже доказанному свойству 2◦ , X ∩ Y – тоже ординал. С другой
стороны, X ∩ Y ⊆ X, поэтому по лемме 0.3.63, либо X ∩ Y ∈ X, либо X ∩ Y = X. Во втором случае
X ⊆ Y . Если же X ∩ Y ∈ X, то отсюда следует что X ∩ Y ∈ / Y , потому что иначе мы получили бы
X ∩ Y ∈ X ∩ Y , что невозможно по следствию 1◦ из аксиомы регулярности MK-11 на с.35. Таким
образом, X ∩ Y – ординал, X ∩ Y ⊆ Y и X ∩ Y ∈
/ Y . Опять по лемме 0.3.63, мы получаем X ∩ Y = Y ,
и значит, Y ⊆ X.
6. Пусть X и Y – ординалы, причем пусть X 6= Y . По уже доказанному свойству 5◦ , X ⊆ Y или
Y ⊆ X. Если Y ⊆ X, то по лемме 0.3.63, Y ∈ X (поскольку Y 6= X). Если же X ⊆ Y , то опять по
лемме 0.3.63, X ∈ Y (поскольку X 6= Y ).

Класс Ord порядковых чисел.


• Ординал X мы будем называть порядковым числом, если он является множеством.
• Символом Ord мы обозначаем класс всех порядковых чисел:

Ord = {X : X – порядковое число} = {X : X – ординал}. (0.3.290)

• На классе Ord удобно ввести отношение

A<B ⇐⇒ A ∈ B, A, B ∈ Ord, (0.3.291)


54 Глава 0. ТЕОРИЯ МНОЖЕСТВ

и отношение 
A6B ⇐⇒ A∈B ∨ A=B , A, B ∈ Ord . (0.3.292)

Из теоремы 0.3.62 следует

Теорема 0.3.64. Отношение < вполне упорядочивает класс Ord.

Свойства класса Ord:


1◦ Класс Ord – ординал, не являющийся множеством.
2◦ Не существует никаких других ординалов, кроме Ord и его элементов.
3◦ Класс X является ординалом тогда и только тогда, когда он наполнен и содержится в
Ord.
4◦ Если X ⊆ Ord, то ∪X – ординал.
5◦ Если ∅ =
6 X ⊆ Ord, то ∩X – ординал, причем ∩X ∈ X.
6◦ Если B, C ∈ Ord и ∀A < B A < C, то B ⊆ C.

Доказательство. 1. Пусть Y ∈ X ∈ Ord. Тогда, во-первых, Y – множество, а, во-вторых, по теореме


0.3.61, Y – ординал. Значит, Y ∈ Ord, и это доказывает наполненность Ord:

X ∈ Ord =⇒ X ⊆ Ord .

С другой стороны, всякий элемент X ∈ Ord является ординалом и значит, наполненным классом.
Вместо это означет, что Ord – ординал. Он не может быть множеством, потому что тогда мы полу-
чили бы Ord ∈ Ord, а это противоречит следствию 1◦ из аксиомы регулярности MK-11 на с.35.
2. Пусть X – ординал. По уже доказанному свойству 1◦ , Ord – тоже ординал. Поэтому по свойству

6 на с.53, либо X = Ord, либо X ∈ Ord, либо Ord ∈ X. Последнее – Ord ∈ X – невозможно, потому
что оно означало бы, что Ord – множество, а мы уже доказали в 1◦ , что это не так. Значит, остается
либо X = Ord, либо X ∈ Ord.
3. Если X – ординал, то по уже доказанному свойству 2◦ , либо X = Ord, либо X ∈ Ord. В первом
случае X тривиально содержится в Ord, а во втором это будет следствием того, что класс Ord,
будучи ординалом, наполнен:
X ∈ Ord ⇒ X ⊆ Ord .
Наоборот, если X – наполненный класс, содержащийся в ординале Ord, то по теореме 0.3.60, X
является ординалом.
4. Свойство 4◦ есть непосредственное следствие свойства 3◦ на с.53.
5. А свойство 5◦ сразу следует из свойства 4◦ на с.53.
6. Если B, C ∈ Ord, то условие ∀A < B A < C расшифровывается так: ∀A ∈ B A ∈ C. Это
как раз означает, что B ⊆ C.

Операция X 7→ S(X).
• Для всякого порядкового числа X класс X ∪ {X} называется следующим порядковым
числом после X и имеет специальное обозначение:

S(X) = X ∪ {X} (0.3.293)

Оправданием этому термину служат следующие


Свойства операции X 7→ S(X):
1◦ Если X ∈ Ord, то S(X) ∈ Ord.
2◦ Если X ∈ Ord, то ∅ 6= S(X) и X 6= S(X).
3◦ Если X ∈ Ord, то S(X) является ∈-минимальным элементом класса {Y : Y ∈ Ord & X ∈
Y },
S(X) = min{Y : Y ∈ Ord & X ∈ Y }, (0.3.294)
4◦ Если X ∈ Ord, то
∪ S(X) = X ∈ S(X) (0.3.295)
§ 3. Теория множеств Морса-Келли 55

5◦ Если X ∈ Ord, то
∪X ⊆ X ⊆ S(∪X), (0.3.296)
причем справедлива следующая альтернатива:
— либо в (0.3.296) выполняется равенство слева, эквивалентное неравенству спра-
ва:
∪X = X ⇔ X 6= S(∪X). (0.3.297)
— либо в (0.3.296) выполняется равенство справа, эквивалентное замене включе-
ния слева на символ принадлежности:

∪X ∈ X ⇔ X = S(∪X). (0.3.298)

6◦ Если X ∈ Ord, Y ∈ Ord и S(X) = S(Y ), то X = Y .


7◦ Если X ∈ Ord, Y ∈ Ord и S(X) ∈ S(Y ), то X ∈ Y .
8◦ Если X, Y ∈ Ord и X ∈ Y , то S(X) 6 Y .

Доказательство. 1. Пусть X ∈ Ord. Убедимся, что класс S(X) наполнен. Действительно, если
A ∈ B ∈ S(X) = X ∪ {X}, то либо A ∈ B = X, и значит, A ∈ X, либо A ∈ B ∈ X, и тогда A ∈ X,
в силу наполненности X. В любом случае, A ∈ X ⊆ S(X). С другой стороны, всякий элемент
B ∈ S(X) = X ∪ {X} либо совпадает с X, либо является элементом X. В обоих случаях B является
ординалом и значит, наполнен. Вместе это означает, что S(X) – ординал.
2. Если ∅ = S(X) = X ∪ {X}, то {X} ⊆ ∅, то есть X ∈ ∅, что невозможно. Если же X = S(X) =
X ∪ {X}, то {X} ⊆ X, то есть X ∈ X, что тоже невозможно.
3. Пусть X ∈ Ord. Обозначим Z = {Y : Y ∈ Ord & X ∈ Y }. В 1◦ мы уже доказали, что S(X) ∈
Ord. С другой стороны, X ∈ X ∪ {X} = S(X). Вместе эти два утверждения означают, что S(X) ∈ Z.
Покажем теперь, что это минимальный элемент в Z в смысле отношения ∈. Предположим, что
существует B ∈ Z такой, что B ∈ S(X) = X ∪ {X}. Тогда либо B = X, либо B ∈ X. В первом
случае, B = X, мы получаем
X ∈ B = X,

B∈Z

и это невозможно по следствию 1◦ из аксиомы регулярности MK-11 на с.35. А во втором случае,


B ∈ X, мы получим
X ∈ B ∈ X,

B∈Z

и это невозможно по следствию 2◦ на с.35. Это доказывает (0.3.294).


4. В формуле (0.3.295) второе равенство очевидно, X ∈ X ∪ {X} = S(X), а первое доказывается
цепочкой:

A ∈ ∪ S(X) ⇐⇒ ∃Y ∈ S(X) A ∈ Y ⇐⇒ ∈ X} ∨ ∃Y
|A {z | ∈X
{z A ∈ Y} ⇐⇒ A ∈ X.
| {z }
k Y ∈{X} ⇓
X ∪ {X} A∈Y ∈X

A∈X

5. В формуле (0.3.296) первое включение ∪X ⊆ X вытекает из наполненности класса X:

X – наполненный
класс
A ∈ ∪X ⇒ ∃B ∈ X A ∈ B ⇒ A∈B∈X ⇒ A ∈ X.

А второе, X ⊆ S(∪X), следует из (0.3.288):

(0.3.288)
A∈X ⇒ A ∈ ∪X ∨ A = ∪X ⇒ A ∈ (∪X) ∪ {∪X} = S(∪X).

Заметим далее, что поскольку X и S(∪X) – ординалы, по лемме 0.3.63, второе включение в (0.3.296),
X ⊆ S(∪X), эквивалентно условию

X ∈ S(∪X) ∨ X = S(∪X).
56 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Отсюда получается цепочка, доказывающая (0.3.297):

X 6= S(∪X) ⇔ X ∈ S(∪X) = (∪X) ∪ {∪X} ⇔ | ∈{z∪X} ∨ X = ∪X


X ⇔ X = ∪X

∃B ∈ X X ∈ B

X ∈B∈X

невозможно,
в силу 2◦ на с.35

А эквивалентность (0.3.298) доказывается цепочкой


(0.3.296)
∪X ∈ X ⇔ {∪X} ⊆ X ⇔ (∪X) ∪ {∪X} ⊆ X ⇔ S(∪X) = X
| {z }
k
S(∪X)


(0.3.296)
X

6. Пусть X ∈ Ord, Y ∈ Ord и S(X) = S(Y ). Тогда

X = (0.3.295) = ∪ S(X) = ∪ S(Y ) = (0.3.295) = Y.

7. Пусть X, Y ∈ Ord, тогда

S(X) ∈ S(Y ) =⇒ X ∪ {X} ∈ Y ∪ {Y } =⇒ X ∪ {X} ∈ Y ∨ X ∪ {X} ∈ {Y }


| {z } | {z } | {z } | {z }
k k ⇓ ⇓
X ∪ {X} Y ∪ {Y } {X} ⊆ Y X ∪ {X} = Y
⇓ ⇓
X ∈Y {X} ⊆ Y

X ∈Y

8. Для X, Y ∈ Ord мы получаем цепочку

X<Y ⇐⇒ X∈Y =⇒ X∈Y &X⊆Y =⇒ X ∪ {X} ⊆ Y =⇒ X 6 Y.


| {z } | {z }
⇑ k
Y – наполненный класс S(X)

Теорема 0.3.65. Класс M ⊆ Ord тогда и только тогда будет множеством, когда он содержится
в некотором порядковом числе A ∈ Ord:

M ⊆ Ord & M ∈ Set ⇔ ∃A ∈ Ord M ⊆ A. (0.3.299)

Доказательство. Если M содержится в некотором порядковом числе A, то поскольку A – множе-


ство, M тоже должен быть множеством.
Пусть наоборот, M ⊆ Ord и M ∈ Set. Предположим, что M не содержится ни в каком ординале:

∀A ∈ Ord ∃B ∈ M B∈
/ A.

Поскольку класс Ord линейно упорядочен по отношению ∈, это условие можно переписать так:

∀A ∈ Ord ∃B ∈ M A ∈ B ∨ A = B.

Если вместо B подставить S(B), то можно это упростить:

∀A ∈ Ord ∃B ∈ M A ∈ B.

Это в свою очередь упрощается так:


Ord ⊆ ∪M.
Здесь ∪M – множество (в силу (0.3.143)), поэтому мы получаем, что класс Ord тоже должен быть
множеством, а это не так.
§ 3. Теория множеств Морса-Келли 57

Изолированные и предельные ординалы.


• Порядковое число X ∈ Ord называется
— изолированным, если X = ∅ или существует порядковое число Y ∈ Ord такое
что X = S(Y );
— предельным, если он не является изолированным, или, иными словами, если
X 6= ∅ и не существует Y ∈ Ord такое что X = S(Y ).

Теорема 0.3.66. Непустое порядковое число X ∈ Ord изолировано тогда и только тогда, когда

∪X ∈ X (0.3.300)

или, что эквивалентно,


X = S(∪X) (0.3.301)

Доказательство. Эквивалентность условий (0.3.300) и (0.3.301) доказана выше формулой (0.3.298).


Пусть X 6= ∅ и X – изолированное порядковое число, то есть X = S(Y ) для некоторого Y ∈ Ord.
Тогда выполняется (0.3.300):

(0.3.295) (0.3.295)
∪X = ∪ S(Y ) = Y ∈ S(Y ) = X.

Наоборот, если выполняется (0.3.300), ∪X ∈ X, то положив Y = ∪X, мы получим

X = (0.3.298) = S(∪X) = S(Y ).

Теорема 0.3.67. Непустой ординал X ∈ Ord пределен тогда и только тогда, когда28

∪X = X, (0.3.302)

или, что эквивалентно, когда


X 6= S(∪X) (0.3.303)

Доказательство. Эквивалентность условий (0.3.302) и (0.3.303) доказана в формуле (0.3.297). Даль-


ше применяется цепочка:

X 6= ∅ – предельное порядковое число ⇔


теорема 0.3.66
⇔ X 6= ∅ – не изолированное порядковое число ⇔ X 6= S(∪X).

Определения по индукции на ординалах. Следующее определение представляет собой мо-


дификацию определения на с.45.
• Говорят, что отображение h индуктивно определяет отображение f на ординалах, или
что отображение f на ординалах индуктивно определено отображением h, если
(i) область определения D(f ) отображения f является ординалом:

D(f ) ∈ Ord ∨ D(f ) = Ord, (0.3.304)

(ii) значение отображения f на всяком классе X ∈ D(f ) описывается равенством


(0.3.305):
∀X ∈ D(f ) f (X) = h(f |X ). (0.3.305)
(iii) f продолжает любое другое отображение со свойствами (i) и (ii): если g – какое-
то другое отображение, удовлетворяющее (i) и (ii), то g ⊆ f .

Теорема 0.3.68. Всякое отображение h индуктивно определяет единственное отображение f


на ординалах.
28 Условие (0.3.302) можно переписать так: ∀A ∈ X ∃B ∈ X : A ∈ B.
58 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Доказательство. По теореме 0.3.53 h индуктивно определяет некое отображение, обозначим его F .


Пусть Y = D(F ) ∩ Ord и f – ограничение F на Y :

f = F Y .

Поскольку D(F ) и Ord – наполненные классы, их пересечение Y = D(F ) ∩ Ord – тоже наполненный
класс (по свойству 2◦ на с.45). При этом Y ⊆ Ord, поэтому по свойству 4◦ на с.54, Y – ординал.
Условие (0.3.305) выполняется для отображения f автоматически, и то же самое с условием (iii).
Из теоремы 0.3.55 сразу следует
Теорема 0.3.69. Пусть M – ординал, P – произвольный класс, и отображение h удовлетворяет
следующим условиям:
(i) для всякого ординала X ∈ M класс P X всех отображений f : X → P содержится в
области определения h:
∀X ∈ M P X ⊆ D(h), (0.3.306)
(ii) область значений h содержится в классе P :

R(h) ⊆ P. (0.3.307)

Тогда отображение h индуктивно определяет единственное отображение f : M → P .


Примером применения теоремы 0.3.68 является следующая теорема, которая понадобится нам
ниже при доказательстве леммы 0.3.87.
Теорема 0.3.70. Для всякого ординала X и любого его подкласса M ⊆ X найдется отображение
f : X ֒→ M со следующими свойствами:
(i) область определения D(f ) отображения f есть ординал (такой что D(f ) ⊆ X),
(ii) f является биекцией между D(f ) и M ,
(iii) f строго монотонно (сохраняет отношение принадлежности):

∀A, B ∈ D(f ) A∈B ⇐⇒ f (A) ∈ f (B). (0.3.308)

Доказательство. 1. Рассмотрим отображение


 
h(T ) = min M \ R(T )

(где R(T ) – область значений класса T , определенная формулой (0.3.200)). По теореме 0.3.68 оно
определяет некое отображение f , у которого область определения D(f ) является ординалом, и
 
∀Z ∈ D(f ) f (Z) = h(f |Z ) = min M \ R(f |Z ) .

2. Это отображение будет инъективно, потому что если A, B ∈ D(f ) и A 6= B, то либо A ∈ B,


либо B ∈ A. Будем считать, что A ∈ B. Тогда
 
f (A) ∈ R(f |B ) ⇒ f (A) ∈
/ M \ R(f |B ) ⇒ f (A) 6= min M \ R(f |B ) = f (B).

3. С другой стороны, f сюръективно, потому что если M \ R(f ) 6= ∅, то можно положить


(
g(A) =
f (A),
  A ∈ D(f ) ,
min M \ R(f ) , A = D(f )

и мы получим отображение g с областью определения D(g) = D(f ) ∪ {D(f )} = S(D(f )), более
широкой чем у f , но с теми же свойствами, что у f , и это будет означать, что g продолжает f ,
сохраняя его свойства, что невозможно по определению (на с.57) отображения, порожденного h.
4. Заметим далее, что отображение f нестрого монотонно:

A6B =⇒ f (A) 6 f (B) (0.3.309)

Это доказывается цепочкой


§ 3. Теория множеств Морса-Келли 59

A6B ⇐⇒ A⊆B =⇒ f |A ⊆ f B =⇒ R(f |A ) ⊆ R(fB ) =⇒


   
=⇒ M \ R(f |A ) ⊇ M \ R(fB ) =⇒ min M \ R(f |A ) 6 min M \ R(fB )
| {z } | {z }
k k
f (A) f (B)

5. Поскольку отображение f инъективно, из его нестрогой монотонности (0.3.309) следует стро-


гая монотонность в одну сторону,
A<B =⇒ f (A) < f (B), (0.3.310)
а из нее – строгая монотонность в обе стороны:
A<B ⇐⇒ f (A) < f (B).
Действительно, если f (A) < f (B), то это сразу означает, что A 6= B, а из (0.3.310) следует, что
вариант A > B тоже отпадает, и поэтому остается только вариант A < B. Это доказывает условие
(0.3.308).
6. Нам остается доказать включение D(f ) ⊆ X. Для этого сначала нужно заметить, что из
(0.3.308) следует неравенство
∀A ∈ D(f ) A 6 f (A) (0.3.311)
Если D(f ) = ∅, то это неравенство выполняется тривиально, если же D(f ) 6= ∅, то оно доказывается
индукцией с использованием теоремы 0.3.73. Во-первых, из D(f ) 6= ∅ и D(f ) ∈ Ord сразу следует
∅ ∈ D(f )
Во-вторых, если (0.3.311) верно для какого-то A ∈ D(f ), то для S(A) ∈ D(f ) мы получаем
свойство 7◦ на с.55
A 6 f (A) < f (S(A)) =⇒ S(A) 6 f (S(A)).
И, в-третьих, если (0.3.311) верно для всех A ∈ B, где B ∈ D(f ), то
свойство 7◦ на с.54
∀A ∈ B A 6 f (A) < f (B) =⇒ B 6 f (B).
7. Теперь из (0.3.311) следует цепочка:
 
∀A ∈ D(f ) A 6 f (A) = min M \ R(f |A ) ∈ X
| {z }


∀A ∈ D(f ) A ∈ X

D(f ) ⊆ X

Доказательства по индукции. Следующие два утверждения имеют общее название: принцип


трансфинитной индукции.
Теорема 0.3.71 (принцип полной трансфинитной индукции). Пусть X – ординал и класс Y ⊆ X
обладает следующим свойством:
CT: если для какого-то ординала A ∈ X выполняется A ⊆ Y , то A ∈ Y .
Тогда Y = X.
Доказательство. Предположим, что Y 6= X. Тогда Z = X \ Y 6= ∅. Значит, по свойству 2◦ на с.54
Z обладает минимальным элементом
A = min Z.
Всякий элемент B ∈ A (то есть всякий элемент B < A) не лежит в Z, поэтому лежит в Y :
∀B ∈ A B ∈ Y.
Иными словами, A ⊆ Y . Значит, по условию CT, A ∈ Y , и поэтому A ∈
/ Z, а это противоречит
выбору A.
60 Глава 0. ТЕОРИЯ МНОЖЕСТВ

! 0.3.72. Условие CT означает, между прочим, потому что ∅ ⊆ Y .


что
∅ ∈ Y,

Теорема 0.3.73 (принцип обыкновенной трансфинитной индукции). Пусть X – ординал и класс


Y ⊆ X обладает следующими свойствами:
OT-0: ∅ ∈ Y ;
OT-1: если B ∈ Y , то S(B) ∈ Y .
OT-2: если предельный ординал A ∈ X удовлетворяет условию

∀B < A B ∈ Y, (0.3.312)

то A ∈ Y .
Тогда Y = X.

Доказательство. Пусть A ∈ X и A ⊆ Y . Предположим сначала, что A – изолированный ординал,


то есть либо A = ∅, либо A = S(B) для некоторого B ∈ X. Тогда если A = ∅, то по условию OT-0,
A = ∅ ∈ Y . Если же A = S(B) для некоторого B ∈ X, то условие

Y ⊇ A = S(B) = B ∪ {B}

влечет за собой условие B ∈ Y , из которого в свою очередь в силу OT-1, мы получаем A = S(B) ∈ Y .
Если же A – предельный ординал, то для него условие

Y ⊇ A = {B : B ∈ A} = {B ∈ X : B < A}

эквивалентно условию (0.3.312), и по OT-2 мы снова получем, что A ∈ Y .


Вместе это означает выполнение условия CT теоремы (0.3.71), и значит, Y = X.

Натуральные числа и аксиома бесконечности. Определение натурального числа выглядит


усилением определения ординала на с.49.
• Класс X называется натуральным числом (или конечным ординалом), если он являет-
ся изолированным порядковым числом29 , и любой его элемент Y ∈ X также является
изолированным порядковым числом.
Следующая теорема аналогична теореме 0.3.61:

Теорема 0.3.74. Всякий элемент Y ∈ X произвольного натурального числа X сам является


натуральным числом.

Доказательство. Ординал Y изолированный, поскольку он является элементом натурального чис-


ла. Если же Z ∈ Y , то мы получаем цепочку
X – наполненный X – натуральное
класс число
Z∈Y ∈X =⇒ Z∈X =⇒ Z – изолированное порядковое число.

Таким образом, Y – изолированное порядковое число, и любой его элемент Z ∈ Y – тоже изолиро-
ванное порядковое число. Значит, Y – натуральное число.

• Класс всех натуральных чисел обозначается символом N.

Свойства класса N:
1◦ Ординалы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, определенные выше формулами (0.3.260) — (0.3.269),
являются натуральными числами:

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} ⊆ N (0.3.313)
29 Изолированные порядковые числа были определены на с.57.
§ 3. Теория множеств Морса-Келли 61

2◦ Если X ∈ N, то S(X) ∈ N.

3 Класс N является ординалом.
Доказательство. 1. Свойство 1◦ очевидно.
2. Пусть X ∈ N, то есть X – натуральное число. Если Y ∈ S(X) = X ∪{X}, то либо Y ∈ X, и тогда
Y – изолированное порядковое число, потому у X, как у натурального числа, все элементы должны
быть изолированными ординалами. Либо Y = X, и тогда Y – изолированный ординал, потому что
X, как натуральное число, должно быть изолированным ординалом. Итак, любой элемент Y ∈ S(X)
– изолированный ординал. С другой стороны, S(X) – тоже изолированный ординал (потому что
имеет вид S(Y ) для Y = X). Вместе это означает, что S(X) – натуральное число.
3. Если A ∈ B ∈ N, то B – натуральное число, и поэтому по теореме 0.3.74 A – тоже натуральное
число. Значит, A ∈ N, и это доказывает наполненность класса N. С другой стороны, всякий элемент
B ∈ N является натуральным числом, и значит, ординалом, и поэтому наполнен. Вместе это значит,
что N – ординал.
Из теоремы 0.3.69 следует
Теорема 0.3.75 (об определении индукцией на натуральных числах). Пусть P – класс, и h –
отображение со следующими свойствами:
(i) для любого натурального числа n ∈ N класс P n (состоящий из всевозможных отобра-
жений f : n → P ) содержится в области определения D(h),

P n ⊆ D(h)

(в частности, P ∅ = {∅} ⊆ D(h)).


(ii) область значений h содержится в классе P :

R(h) ⊆ P.

Тогда формула
f (n) = h(f n ), n∈N (0.3.314)
однозначно определяет отображение f : N → P .
Следующая модификация теоремы 0.3.75 очень полезна в приложениях.
Теорема 0.3.76 (об определении индукцией на натуральных числах). Пусть Q – класс, и H –
отображение, действующее из Q в Q:
H : Q → Q.
Тогда для всякого множества X ∈ Q правила

f (∅) = X, f (S(n)) = H(f (n)), n ∈ N, (0.3.315)

однозначно определяют отображение f : N → Q.


У теорем 0.3.71 и 0.3.73 имеются два важных аналога для случая, когда рассматриваемый класс
ординалов X содержится в множестве N. Эти аналоги называются принципами индукции (без эпи-
тета “трансфинитный”).
Теорема 0.3.77 (принцип полной индукции). Пусть класс Y ⊆ N обладает следующими свой-
ствами:
CI: если для какого-то числа n ∈ N выполняется n ⊆ Y , то n ∈ Y .
Тогда Y = N.
Доказательство. Это частный случай теоремы 0.3.71 с X = N.

! 0.3.78. Условие CI означает, между прочим, потому что ∅ ⊆ Y .


что
∅ ∈ Y,
62 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Теорема 0.3.79 (принцип обыкновенной индукции). Пусть класс Y ⊆ N обладает следующими


свойствами:
OI-0: ∅ ∈ Y ;
OI-1: если m ∈ Y , то S(m) ∈ Y .
Тогда Y = N.
Доказательство. Это частный случай теоремы 0.3.73 с X = N, только качественная разница в том,
что здесь условие OT-2 отпадает, потому что в N нет предельных ординалов (в силу определения
натурального числа).
MK-13 Аксиома бесконечности: существует множество30 Y со следующими свойствами:
(i) ∅∈ Y;
(ii) если X ∈ Y , то X ∪ {X} ∈ Y .
Из этой аксиомы следует
Теорема 0.3.80. N ∈ Ord.
Доказательство. По свойству 3◦ на с.61, N – ординал. Поэтому нам нужно только доказать, что
N является множеством. Рассмотриме множество Y из аксиомы MK-13 и покажем, что N ⊆ Y . По
теореме 0.3.6 это будет означать, что N – тоже множество. Обозначим X = Y ∩ N. Понятно, что
X ⊆ N. Заметим, что
1. ∅ ∈ X, потому что ∅ ∈ Y по условию (i) аксиомы MK-13, а с другой стороны, ∅ ∈ N в
силу свойства 1◦ на с.60.
2. Если A ∈ X, то A ∈ Y , поэтому по условию (i) аксиомы MK-13, S(A) ∈ Y , а с другой
стороны, A ∈ N, поэтому в силу свойства 2◦ на с.61, S(A) ∈ N. В результате, S(A) ∈ X.
Мы видим, что класс X удовлетворяет посылкам теоремы 0.3.79, значит X = Y ∩ N = N. Отсюда
N⊆Y.
Теорема 0.3.81. N является минимальным предельным ординалом.
Доказательство. Сначала покажем, что N – предельный ординал. По теореме 0.3.67 для этого
нужно убедиться, что
∪N = N.
Вложение ∪N ⊆ N следует из (0.3.296), нам нужно проверить обратное вложение, N ⊆ ∪N. Это
следует из свойства 2◦ на с.61: если X ∈ N, то X ∈ S(X) ∈ N, поэтому X ∈ ∪N.
Мы поняли, что N – предельный ординал. Показать, что это минимальный ординал с таким
свойством, можно просто заметив, что никакой меньший ординал не будет предельным. Действи-
тельно, если X < N, то есть X ∈ N, то X – натуральное число, и поэтому изолированный ординал,
то есть не предельный.

Операция наполнения X 7→ fill X. Полез- Если считать, что Q = Set, то Q и H будут удо-
ность теорем 0.3.76 и 0.3.79 можно проиллюсти- влетворять посылке теоремы 0.3.76, и поэтому
ровать конструкцией, сопоставляющей любому формула (0.3.315) определяет некое отображение
множеству X наименьшее содержащее его напол- f : N → Set. Обозначим
ненное31 множество, обозначаемое fill X и на-
зываемое наполнением X. filln X = f (n)
Зафиксируем произвольное множество X ∈
Set и определим отображение H : Set → Set и заметим, что
правилом
(
∪T, T 6= ∅ fill0 X = X, fillS(n) X = ∪ filln X,
H(T ) = n ∈ N.
X, T = ∅
30 В аксиоме MK-13 важно утверждение, что Y является множеством, а не просто классом.
31 В смысле определения на с.44.
§ 3. Теория множеств Морса-Келли 63

Действительно, во-первых, Доказательство. 1. Прежде всего,


[
fill0 X = f (0) = f (∅) = h(f ∅ ) = h(∅) = X. X = fill0 X ⊆ filln X = fill X.
n∈N
И, во-вторых, S
2. Если Y ∈ fill X = n∈N filln X, то
fillS(n) X = f (S(n)) = H(f (n)) = Y ∈ filln X для некоторого n ∈ N. Применяя
(0.3.142), получаем
= ∪f (n) = ∪ filln X.
Y ⊆ ∪ filln X = fillS(n) X ⊆ fill X.
Теперь наполнение fill X множества X опреде-
ляется равенством 3. Пусть Y – наполненый класс, и X ⊆ Y .
[ Чтобы доказать включение fill X ⊆ Y , мы при-
fill X = filln X. (0.3.316) меним теорему 0.3.79. Сначала заметим, что
n∈N
fill0 X = X ⊆ Y.
Свойства наполнения:
После этого предположим, что для некоторого
1◦ Всякое множество X содержится в своем n ∈ N выполняется
наполнении fill X:
filln X ⊆ Y.
X ⊆ fill X (0.3.317)
Тогда
2◦ Наполнение fill X любого множества X яв-
ляется наполненным множеством: fillS(n) X = ∪ filln X ⊆ (0.3.141) ⊆ ∪Y ⊆ Y.

Y ∈ fill X =⇒ Y ⊆ fill X (0.3.318) 4. Если множество X наполнено, то подстав-


ляя Y = X в (0.3.319), мы получим
3◦ Если множество X содержится в наполнен-
ном классе Y , то его наполнение fill X так- (X ⊆ X & ∪ X ⊆ X) =⇒ fill X ⊆ X,
же содержится в Y :
и вместе с (0.3.317) это дает (0.3.320). Наоборот,
если выполняется (0.3.320), то в силу (0.3.318),
(X ⊆ Y & ∪ Y ⊆ Y ) =⇒
множество X наполнено.
=⇒ fill X ⊆ Y. (0.3.319)
! 0.3.82. Свойства 1◦ , 2◦ и 3◦ вместе означают

4 Множество X наполнено тогда и только то, что мы говорили вначале: наполнение fill X
тогда, когда оно совпадает со своим напол- множества X является наименьшим наполнен-
нением: ным множеством (эквивалентно: классом), со-
X = fill X. (0.3.320) держащим X.

(f) Кардиналы и аксиома выбора


Аксиома выбора. Следующая аксиома — последняя в теории MK.
• Функцией выбора называется произвольное отображение c со следующими свойствами:
(i) областью определения c является класс Set \{∅} всех непустых множеств,
(ii) для всякого X ∈ Set \{∅} справедливо c(X) ∈ X,
MK-14 Аксиома выбора: существует функция выбора.
Теорема 0.3.83. Для любого множества X существует его биекция f : X → T на некоторое
порядковое число T ∈ Ord.
Доказательство. Напомним, что область значений R(M ) класса M была определена нами форму-
лой (0.3.200). Зафиксируем X и рассмотрим отображение

h(M ) = c (X \ R(M )), M ∈ Set,

где c – функция выбора, существование которой декларируется аксиомой MK-14. По теореме 0.3.68
отображение h определяет единственное отображение f , определенное на некотором ординале D(f )
64 Глава 0. ТЕОРИЯ МНОЖЕСТВ

по формуле

f (Y ) = h(f Y ) = c (X \ R(f Y )), Y ∈ D(f ) ⊆ Ord .
Приглядимся к этому отображению f .
1. Заметим сначала, что f должно быть биекцией (между своими областью определения D(f )
и множеством значений R(f )). Действительно, предположим, что для некоторых A 6= B ∈ D(f )
выполняется f (A) = f (B). По свойству
ординалов 6◦ на с.53 либо A ∈ B, либо B ∈ A. Будем

считать, что A ∈ B. Тогда f (A) ∈ R(f B ), и мы получаем такую импликацию:

f (B) = c (X \ R(f B )) ∈ X \ R(f B ) ⇒ f (A) 6= f (B).
| {z }


f (A)

2. Заметим далее, что всегда



f (Y ) = c (X \ R(f Y )) ∈ X \ R(f Y ) ⊆ X,

поэтому R(f ) ⊆ X. Отсюда по теореме 0.3.6 следует, что R(f ) – множество, а из этого по аксиоме
MK-12 на с.41 следует, что
 
D(f ) = f −1 R(f −1 ) = f −1 D(f )
– тоже множество, и значит,
D(f ) ∈ Ord .
3. Поскольку D(f ) ∈
/ D(f ), по теореме 0.3.33 мы получаем

f (D(f )) = Set
| {z }
 k 

c X \ R(f D(f ) )
k 
c X \ R(f )

То есть

c X \ R(f ) = Set .
/ D(c) = Set \{∅}. То есть должно быть X \ R(f ) = ∅, и,
Такое возможно только если X \ R(f ) ∈
поскольку R(f ) ⊆ X, мы получем
R(f ) = X.
Таким образом, f – биекция между D(f ) ∈ Ord и R(f ) = X.

Кардинальные числа.
• Говорят, что два множества X и Y равномощны, и обозначают это записью

X ≃ Y, (0.3.321)

если существует биекция f , областью определения которой является множество X, а об-


ластью значений – множество Y :

D(f ) = X & R(f ) = Y.

Если X ≃ Y ложно, то это обозначается записью

X≃
6 Y

Свойства отношения ≃:
1◦ Рефлексивность: всегда X ≃ X.
2◦ Симметричность: если X ≃ Y , то Y ≃ X.
3◦ Транзитивность: если X ≃ Y и Y ≃ Z, то X ≃ Z.
§ 3. Теория множеств Морса-Келли 65

• Кардинальным числом называется всякое порядковое число P ∈ Ord, не равномощное


никакому своему элементу:
T ∈P ⇒ T ≃ 6 P. (0.3.322)
(то есть никакому меньшему порядковому числу). Класс всех кардинальных чисел обо-
значается Card:
Card = {P : P – кардинальное число} (0.3.323)

Свойства класса Card:


1◦ Для всякого ординала T ∈ Ord найдется равномощный ему кардинал P ∈ Card.

2 На Card отношение равномощности ≃ эквивалентно равенству:

∀P, Q ∈ Card P ≃Q ⇔ P =Q (0.3.324)

Теорема 0.3.84. Существует отображение card : Set → Card со свойством

∀X ∈ Set card X ≃ X (0.3.325)

• Отображение card : Set → Card называется отображением мощности. Кардинал card X


называется мощностью множества X.

Доказательство. Определим отношение

card = {(X, P ) : X ≃ P & P ∈ Card} (0.3.326)

(то есть пара (X, P ) принадлежит классу card, если X равномощно P и P является кардиналом).
Если (X, P ) ∈ card и (X, Q) ∈ card, то X ≃ P и X ≃ Q, поэтому по свойствам 2◦ и 3◦ отношения
≃, P ≃ Q. С другой стороны, P, Q ∈ Card, поэтому в силу (0.3.324), P = Q, Поскольку это верно
для любых (X, P ) ∈ card и (X, Q) ∈ card, это означает, что отношение card – отображение. Условие
(0.3.325) следует из (0.3.326), и остается доказать, что card определено на всем классе Set. Это
следует из теоремы 0.3.83: всякое множество X ∈ Set равномощно некоторому ординалу T ∈ Ord,
который в свою очередь (по свойству 1◦ класса Card) равномощен некоторому кардиналу P ∈ Card,
поэтому (X, P ) ∈ card.

Теорема 0.3.85. Если X ∈ Ord, то

card X = min{Z ∈ Ord : Z ≃ X} (0.3.327)

Доказательство. Из card X ≃ X следует card X ∈ {Z ∈ Ord : Z ≃ X}, поэтому card X > min{Z ∈
Ord : Z ≃ X}. Если предположить, что неравенство строгое, card X > min{Z ∈ Ord : Z ≃ X}, то мы
получим
min{Z ∈ Ord : Z ≃ X} ≃ X ≃ card X,
то есть min{Z ∈ Ord : Z ≃ X} – ординал, равномощный card X, но меньший card X. Это означает,
что card X – не кардинал (потому что противоречит определению кардиналов).

Свойства мощности:
1◦ Если X, Y ∈ Set, то X ≃ Y тогда и только тогда, когда card X = card Y .
2◦ P ∈ Card тогда и только тогда, когда P ∈ Set и card P = P .
3◦ Если X ∈ Set, то card(card X) = card X.

Доказательство. 1. Если X ≃ Y , то
(0.3.325) (0.3.325) транзитивность ≃ (0.3.324)
card X ≃ X ≃Y ≃ card Y =⇒ card X ≃ card Y =⇒ card X = card Y.

Наоборот, если card X = card Y , то


(0.3.325) (0.3.325) транзитивность ≃
card X = card Y =⇒ X ≃ card X = card Y ≃ Y =⇒ X ≃ Y.
66 Глава 0. ТЕОРИЯ МНОЖЕСТВ

2. Если P ∈ Set и card P = P , то P = card P ∈ Card. Наоборот, если P ∈ Card, то


(0.3.324)
| {z P} ≃ |{z}
card P =⇒ card P = P.


Card Card

3. Если X ∈ Set, то обозначив P = card X ∈ Card, мы по уже доказанному свойству 2◦ , получим

card(card X) = card P = P = card X.

Теорема 0.3.86. Для множеств X 6= ∅ и Y следующие условия эквивалентны:


(i) card X 6 card Y ,
(ii) существует инъективное отображение f : X → Y ,
(iii) существует сюръективное отображение g : Y → X.
Для доказательства нам понадобится несколько лемм.
Лемма 0.3.87. Если32 X ⊆ Y ∈ Ord, то card X 6 Y .
Доказательство. 1. Сразу заметим, что если X ∈ Ord, то это верно:

X, Y ∈ Ord & X ⊆ Y =⇒ card X 6 Y (0.3.328)

Действительно, в этом случае

card X = (0.3.327) = min{Z ∈ Ord : Z ≃ X} 6 X 6 Y.

2. Пусть X ⊆ Y ∈ Ord. Тогда по теореме 0.3.70 найдется отображение f : Y ֒→ Y , у которого


область определения D(f ) ⊆ Y является ординалом, и которое является биекцией между D(f ) и X.
Значит,
(0.3.328)
X ≃ D(f ) ⊆ Y =⇒ card X = card D(f ) 6 Y.

Лемма 0.3.88. Если X ⊆ Y ∈ Set, то card X 6 card Y .


Доказательство. Пусть X ⊆ Y ∈ Set. Поскольку Y ≃ card Y , найдется биекция f : Y → card Y . Ее
ограничение f |X на множество X также будет биекцией, поэтому по уже доказанному свойству 1◦ ,

card X = card R(f |X ).

С другой стороны, R(f |X ) ⊆ card Y , поэтому по лемме 0.3.87

card R(f |X ) 6 card Y.

Лемма 0.3.89. Для всякого отображения f

card R(f ) 6 card D(f ) (0.3.329)

Доказательство. Рассмотрим отображение

g(B) = c({A : f (A) = B}), B ∈ R(f ).

где c – функция выбора из аксиомы MK-14 на с.63. Отображение g будет инъективно, и значит,
биективно между D(g) = R(f ) и R(g) ⊆ D(f ). Применяя свойство мощности 1◦ и лемму 0.3.88, мы
получаем

R(f ) = D(g) ≃ R(g) ⊆ D(f ) =⇒ card R(f ) = card D(g) = card R(g) 6 card D(f ).

32 В лемме 0.3.87 X – произвольное подмножество в Y , необязательно ординал.


§ 3. Теория множеств Морса-Келли 67

Доказательство теоремы 0.3.86. 1. Докажем сначала импликацию (i) ⇒ (ii). Пусть card X 6
card Y . Пусть p : X → card X и q : Y → card Y – биекции, и r : card X → card Y – естествен-
ное вложение
r(A) = A, A ∈ card X.
Тогда отображение f = q −1 ◦ r ◦ p : X → Y является инъекцией, как композиция инъекций.
2. Далее докажем (ii) ⇒ (iii). Пусть дана инъекция f : X → Y . Поскольку X 6= ∅, найдется
элемент A ∈ X. Зафиксируем его и определим отображение
(
f −1 (B), B ∈ R(f )
g(B) = , B ∈ Y.
A, B∈/ R(f )

Это отображение g будет сюръективно.


3. Наконец, убедимся, что (iii) ⇒ (i). Пусть g : Y → X – сюръективное отображение. Тогда

card X = card R(g) 6 (0.3.329) 6 card D(g) = card Y.

Теорема 0.3.90 (Кантор, Бернштейн). Если A, B, X, Y ∈ Set и

X ≃ B


(0.3.330)
A ≃ Y

то X ≃ Y .
Доказательство. Здесь применяются только что доказанные свойства 1◦ и 4◦ : с одной стороны,

X≃B⊆Y =⇒ card X = card B 6 card Y,

а, с другой стороны,
Y ≃A⊆X =⇒ card Y = card A 6 card X.

⋄ 0.3.91. Всякое натуральное число является Ясно, что отображение f можно переопределить
кардиналом: так, чтобы A переходило в B, а X в Y :
N ⊆ Card . (0.3.331)
A
❴ X

Для доказательства нам понадобится следу-
ющая  
B Y
Лемма 0.3.92. Если X, Y ∈ Ord и S(X) ≃ S(Y ),
то X ≃ Y . Это новое отображение g : S(X) → S(Y ) опреде-
ляется формулой
Доказательство. Покажем, что если существу-    
ет какая-то биекция f : S(X) → S(Y ), то суще- g = f \ (A, Y ), (X, B) ∪ (A, B), (X, Y )
ствует и биекция g : S(X) → S(Y ), переводя-
щая элемент X ∈ S(X) = X ∪ {X} в элемент и понятно, что оно также будет биекцией.
Y ∈ S(Y ) = Y ∪ {Y }. Для этого обозначим Доказательство примера 0.3.91. Проведем ин-
дукцию (то есть воспользуемся теоремой 0.3.79).
A = f −1 (Y ), B = f (X).
Во-первых, ∅ ∈ Card, потому что не существу-
Если переход от A к Y и от X к B под действием ет ординального числа, меньшего ∅. Во-вторых,
отображения f обозначить стрелками 7→, то мы пусть n ∈ N ∩ Card. Предположим, что S(n) ∈ /
можем изобразить это картинкой N ∩ Card, то есть существует k ∈ S(n) такой что
k ≃ S(n). Поскольку k ∈ S(n) ⊆ N, по теореме
A❅ X 0.3.81 мы получаем, что k – изолированный ор-
❅❅ ⑦⑦❃ динал. С другой стороны, отношение k ≃ S(n)
❅❅⑦
⑦ ❅❅
~⑦⑦ ❅ невозможно при k = ∅, поэтому k 6= ∅. Значит,
B Y k – непустой изолированный ординал. То есть
68 Глава 0. ТЕОРИЯ МНОЖЕСТВ

k = m + 1 для некоторого m ∈ N. Для него мы Доказательство. Если X ≃ N для некоторого


получаем X ∈ N, то
m + 1 = k ≃ S(n).
X ⊆ S(X) ⊆ N & N
| ≃
{z X}
Отсюда по лемме 0.3.92, | {z }
⇓ лемма 0.3.88 ⇓
m ≃ n. (0.3.332) card X 6 card S(X) 6 card N card N = card X

С другой стороны, из

m + 1 = k ∈ S(n)
card X 6 card S(X) 6 card N = card X

по свойству 7 на с.55 следует

m ∈ n. (0.3.333)
card S(X) = card X
Условия (0.3.332) и (0.3.333) вместе означают,
что n – не кардинал, а это противоречит нашему ⇓
предположению n ∈ N ∩ Card.
S(X) ≃ X.
⋄ 0.3.93. Множество N натуральных чисел яв-
Это противоречит примеру (0.3.92), согласно ко-
ляется кардиналом:
торому элемент S(X) ∈ N должен быть кардина-
N ∈ Card (0.3.334) лом.

Теорема 0.3.94. Для всякого множества X справедливо неравенство


card X < card 2X . (0.3.335)
Доказательство. Рассмотрим отображение


f : X → 2X f (Y ) = {Y }, Y ∈ X.

Оно инъективно, поэтому


card X 6 card 2X .
Предположим, что здесь выполняется точное равенство:
card X = card 2X . (0.3.336)
Тогда существует некая биекция g между X и 2X . Рассмотрим множество
Z = {Y : Y ∈ X & Y ∈
/ g(Y )}. (0.3.337)
Поскольку g : X → 2X – биекция, должен существовать элемент T ∈ X, который под действием g
переходит в множество Z:
g(T ) = Z. (0.3.338)
Для этого элемента T мы получим:
(0.3.337) (0.3.338)
T ∈ g(T ) ⇐⇒ T ∈
/Z = g(T ).
Это противоречие опровергает наше предположение (0.3.336).

Биекции Ord ≃ Card и Ord ≃ Card \N.


Теорема 0.3.95. Класс Card не является множеством.
Доказательство. Если предположить, что Card – множество, то мы получим цепочку, противоре-
чащую (0.3.335):
(0.3.143) теорема 0.3.10 теорема 0.3.84
Card ∈ Set =⇒ ∪ Card ∈ Set =⇒ 2∪ Card ∈ Set =⇒
(0.3.142)
=⇒ card 2∪ Card ∈ Card =⇒ card 2∪ Card ⊆ ∪ Card =⇒

свойство 3 , с.65 лемма 0.3.88  
=⇒ card 2∪ Card = card card 2∪ Card 6 card ∪ Card .
§ 3. Теория множеств Морса-Келли 69

Теорема 0.3.96. Существует отображение f : Ord → Card со следующими свойствами:


(i) f является биекцией между Ord и Card,
(ii) f строго монотонно (сохраняет отношение принадлежности):

∀A, B ∈ Ord A∈B ⇐⇒ f (A) ∈ f (B). (0.3.339)

Доказательство. По теореме 0.3.70, существует сюръекция f : Ord ֒→ Card со свойствами (i) и (ii),
у которой область определения D(f ) является ординалом. Если предположить, что D(f ) 6= Ord, то по
свойству 3◦ на с.54, D(f ) ∈ Ord, и значит D(f ) является множеством. Тогда по аксиоме подстановки
MK-12 на с.41, R(f ) = Card тоже должно быть множеством, а это противоречит теореме 0.3.95.

Теорема 0.3.97. Существует отображение ℵ : Ord → Card \N со следующими свойствами:


(i) ℵ является биекцией между Ord и Card \N,
(ii) ℵ строго монотонно (сохраняет отношение принадлежности):

∀A, B ∈ Ord A∈B ⇐⇒ ℵ(A) ∈ ℵ(B). (0.3.340)

Доказательство. Здесь с минимальными изменениями используется прием из теоремы 0.3.96: по


теореме 0.3.70, существует сюръекция ℵ : Ord ֒→ Card со свойствами (i) и (ii), у которой область
определения D(ℵ) является ординалом. Если предположить, что D(ℵ) 6= Ord, то по свойству 3◦ на
с.54, D(ℵ) ∈ Ord, и значит D(ℵ) является множеством. Тогда по аксиоме подстановки MK-12 на с.41,
R(ℵ) = Card \N тоже должно быть множеством, а это противоречит теореме 0.3.95.

Конечные и бесконечные множества.


• Множество X называется конечным, если у него мощность является натуральным числом:

card X ∈ N.

В противном случае X называется бесконечным множеством.


• Класс всех конечных множеств мы будем обозначать Fin.

Свойства конечных множеств:


1◦ . Если f : X → Y – инъективное отображение и Y – конечное множество, то X – тоже
конечное множество.
2◦ . Если f : Y → X – сюръективное отображение и Y – конечное множество, то X – тоже
конечное множество.
3◦ . Всякое подмножество X любого конечного множества Y также является конечным
множеством.
4◦ . Разность X \ Y любого конечного множества X и любого другого множества Y тоже
является конечным множеством.
5◦ . Пересечение X ∩ Y любого конечного множества X с любым другим множеством Y
тоже является конечным множеством.
6◦ . Объединение X ∪ Y любых двух конечных множеств X и Y тоже является конечным
множеством.
7◦ . Если X – конечное множество, и любой его элемент Y ∈ X – тоже конечное множе-
ство, то поэлементное объединение ∪X – тоже конечное множество.
8◦ . Декартово произведение X × Y любых двух конечных множеств X и Y тоже является
конечным множеством.
9◦ . Если X — конечное множество, то 2X — тоже конечное множество.

Доказательство. 1. Если f : X → Y – инъективное отображение и Y – конечное множество, то по


теореме 0.3.86 мы получаем:
card X 6 card Y ∈ N.
Если в первом знаке стоит равенство, то мы получаем card X = card Y ∈ N, а если строгое неравен-
ство, то мы получаем card X ∈ card Y ∈ N, и, в силу наполненности N, как ординала, card X ∈ N.
70 Глава 0. ТЕОРИЯ МНОЖЕСТВ

2. Если f : Y → X – сюръективное отображение и Y – конечное множество, то снова применяется


теорема 0.3.86.
3. Свойство 3◦ следует из леммы 0.3.88.
4. Если X – конечное множество, то для любого множества Y мы получаем X \ Y ⊆ X, и по уже
доказанному свойству 3◦ , X \ Y должно быть конечно.
5. Если X – конечное множество, то для любого множества Y мы получаем X ∩ Y ⊆ X, и по
уже доказанному свойству 3◦ , X ∩ Y должно быть конечно.
6. Пусть X и Y – конечные множества. Чтобы доказать, что их объединение X ∪ Y конечно, мы
рассмотрим несколько случаев.
a) Прежде всего, рассмотрим случай, когда множество Y состоит из одного элемента, Y = {y},
не лежащего в X: y ∈/ X. Рассмотрим кардинал n = card X и выберем биекцию f : X → n. Тогда
отображение (
f (T ), T ∈ X
g(T ) = ,
S(n), T = y

будет биекцией g : X ∪ Y → S(n). Поэтому card(X ∪ Y ) = S(n), и мы получаем, что множество X ∪ Y


конечно.
b) Следующий случай – когда X и Y не пересекаются. Здесь проводится индукция по мощности
множества Y . Если card Y = ∅, то

card Y = ∅ =⇒ Y =∅ =⇒ X ∪Y = X =⇒ card(X ∪ Y ) = card X ∈ N,

и X ∪ Y – конечное множество. Далее, предположим, что мы доказали это для всех множеств Y
мощности card Y = n. Пусть card Y = S(n). Выделим какой-нибудь элемент z ∈ Y и рассмотрим
множество Y \ {z}. Его мощность будет равна n,

card(Y \ {z}) = n,

поэтому по нашему предположению, множество X ∪ (Y \ {z}) конечно. Теперь если добавить к нему
не пересекающееся с ним одноэлементное множество {z}, то это будет в точности рассмотренный
случай a), и мы получаем, что множество

X ∪ (Y \ {z}) ∪ {z} = X ∪ Y

– тоже конечно. Это завершает индукцию.


с) Последний случай – когда X и Y могут пересекаться. Тогда мы можем рассмотреть множество
Y \ X, которое по уже доказанному свойству 4◦ будет конечным, и не будет пересекаться с X, и по
доказанному в пункте b), множество

X ∪ (Y \ X) = X ∪ Y

должно быть конечным.


7. Свойство 7◦ доказывается индукцией по мощности X. Если card X = ∅, то X = ∅, и ∪X = ∅
– конечное множество. Предположим, мы доказали, что ∪X – конечное множество для всех мно-
жеств X мощности n ∈ N. Пусть теперь X – множество мощности S(n). Зафиксируем какой-нибудь
элемент z ∈ X. Тогда множество X \ {z} будет иметь мощность n, и по нашему предположению, его
поэлементное объединение ∪(X \ {z}) также будет конечным. Отсюда по уже доказанному свойству
6◦ , множество  
∪ (X \ {z}) ∪ z = ∪X

также должно быть конечным.


8. Пусть X и Y – конечные множества. Представим их декартово произведение X × Y как
объединение классов X × {y}, где y ∈ Y :
[
X ×Y = X × {y}
y∈Y

Каждый класс X × {y} равномощен множеству X, поэтому он будет конечен. А множество таких
классов
{X × {y}; y ∈ Y }
§ 3. Теория множеств Морса-Келли 71

равномощно Y и поэтому тоже конечно. Значит, по уже доказанному свойству 7◦ , объединение этих
классов [
X ×Y = X × {y} = ∪{X × {y}; y ∈ Y }
y∈Y
— тоже конечное множество.
9. Здесь используется теорема 0.3.79 (принцип обыкновенной индукции). Рассмотрим класс
n o
Y = m : m ∈ N & ∀X card X = m ⇒ card 2X ∈ N .

Чтобы доказать, что Y = N, заметим сначала, что ∅ ∈ Y . Действительно, если X — множество


со свойством card X = ∅, то это означает, что X = ∅, поэтому 2X = 2∅ = {∅} = 1, откуда мы
получаем: card 2X = card 1 = 1 ∈ N.
Далее, зафиксируем m ∈ Y и покажем, что S(m) ∈ Y . Условие m ∈ Y означает, что для всякого
множества X со свойством card X = m выполняется включение card 2X ∈ N. Нам нужно показать,
что для всякого множества Z со свойством card Z = S(m) выполняется включение card 2Z ∈ N.
Зафиксируем такое множество Z со свойством card Z = S(m). Мы уже рассмотрели ситуацию, когда
card Z = ∅, и поняли, что в этом случае card 2Z ∈ N. Поэтому мы можем считать, что card Z 6= ∅.
Тогда можно выбрать какой-нибудь элемент p ∈ Z. Зафиксируем его. Обозначив X = Z \ {p}, мы
получим
card X = m & Z = X ∪ {p}.
Заметим, что
2Z = 2X∪{p} = 2X ∪ {Q : ∃T ⊆ X Q = T ∪ {p}}. (0.3.341)
X∪{p} X
Действительно, включение 2 ⊇ 2 ∪{P : ∃T ⊆ X P = T ∪{p}} очевидно. А обратное включение
2X∪{p} ⊇ 2X ∪ {P : ∃T ⊆ X P = T ∪ {p}} доказывается так: если Q ∈ 2X∪{p} , то это значит, что
Q ⊆ X ∪ {p}, и возможны два варианта:
— / Q, то Q ⊆ X, и тогда Q ∈ 2X ,
если p ∈
— если p ∈ Q, то Q = T ∪ {p} для некоторого T ⊆ X, и тогда Q ∈ {Q : ∃T ⊆ X Q = T ∪ {p}}.
Теперь (0.3.341) означает, что 2Z является объединением двух множеств:
— 2X — конечное множество, потому что card X = m ∈ Y (откуда по определению Y следует,
что card 2X ∈ N),
— {Q : ∃T ⊆ X Q = T ∪ {p}} — конечное множество, потому что оно равномощно конечному
множеству 2X :
card{Q : ∃T ⊆ X Q = T ∪ {p}} = card{T : T ⊆ X} = card 2X .
Мы получаем, что 2Z является объединением двух конечных множеств, поэтому, по уже дока-
занному свойству 6◦ , 2Z должно быть конечным множеством. Это в свою очередь означает, что
S(m) ∈ Y , что нам и нужно было.
Теорема 0.3.98. Если X – конечное множество, Y ⊆ X и card Y = card X, то Y = X.
Доказательство. Это утверждение удобно переформулировать так: если X – конечное множество,
Y ⊆ X и Y 6= X, то card Y 6= card X. Чтобы это доказать, заметим, что условия Y ⊆ X и Y 6= X
влекут за собой условие X \ Y 6= ∅. Зафиксируем какой-нибудь элемент x ∈ X \ Y и рассмотрим
произвольную биекцию f : card Y → Y . Правило
(
f (z), z ∈ card Y
g(z) =
x, z = card Y

определяет некую биекцию g : card S(Y ) = card Y ∪ {card Y } → Y ∪ {x}, поэтому


card(Y ∪ {x}) = card S(Y ).
С другой стороны, g можно рассматривать как инъекцию g : card S(Y ) → X, поэтому по теореме
0.3.86,
card S(Y ) = card(card S(Y )) 6 card X.
Вместе это дает цепочку
card Y < card S(Y ) 6 card X,
откуда и получается card Y 6= card X.
72 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Теорема 0.3.99. Множество X бесконечно тогда и только тогда, когда существует инъектив-
ное отображение f : N → X.

Доказательство. Множество X бесконечно, тогда и только тогда, когда его мощность card X боль-
ше любого конечного ординала n ∈ N, то есть не меньше кардинала N, или, что то же самое,
мощности N:
card X > N = card N.
По теореме 0.3.86, это эквивалентно существованию инъективного отображения f : N → X.

Теорема 0.3.100. Множество X бесконечно тогда и только тогда, когда оно имеет равномощное
себе подмножество, не совпадающее с X.

Для доказательства нам понадобится следующая

Лемма 0.3.101. Если N 6 A ∈ Card, то A ≃ A \ {∅}.

Доказательство. Формула (
S(n), n∈N
f (n) =
n, /N
n∈

определяет биекцию между A и A \ {∅}.

Доказательство теоремы 0.3.100. Если существует Y ⊆ X такое что Y 6= X и card Y = card X, то


по теореме 0.3.98 это несовместимо с условием конечности X. Значит, X будет бесконечным.
Наоборот, пусть X бесконечно. Тогда card X > N. Рассмотрим какую-нибудь биекцию g : card X →
X и положим

Y = R(g card X\{∅} ).

Тогда Y 6= X, и при этом


лемма 0.3.101
Y ≃ card X \ {∅} ≃ card X ≃ X.

Следующая теорема аналогична теореме 0.3.65:

Теорема 0.3.102. Множество M ⊆ N тогда и только тогда конечно, когда оно содержится в
некотором натуральном числе A ∈ N:

M ⊆ N & M ∈ Fin ⇔ ∃A ∈ N M ⊆ A. (0.3.342)

Доказательство. Если M содержится в некотором натуральном числе A, то, поскольку A – конеч-


ное множество, M тоже будет конечным множеством.
Пусть наоборот M ⊆ N и M ∈ Fin. Предположим, что M не содержится ни в каком натуральном
числе:
∀A ∈ N ∃B ∈ M B ∈ / A.
Поскольку класс N линейно упорядочен по отношению ∈, это условие можно переписать так:

∀A ∈ N ∃B ∈ M A ∈ B ∨ A = B.

Если вместо B подставить S(B), то можно это упростить:

∀A ∈ N ∃B ∈ M A ∈ B.

Это в свою очередь упрощается так:


N ⊆ ∪M.
Здесь ∪M – конечное множество (в силу свойства 7◦ на с.69), поэтому мы получаем, что класс N
тоже должен быть конечным множеством, а это не так.
§ 3. Теория множеств Морса-Келли 73

Последовательности и их декартовы произведения. После того, как определен класс N


натуральных чисел полезно определить понятие последовательности, встречающееся повсюду в ма-
тематике.
• Бесконечной последовательностью, или просто последовательностью называется произ-
вольное отображение x : N → Set (имеющее областью определения класс N всех нату-
ральных чисел). Значения такого отображения часто записывают с помощью нижнего
индекса
xn = x(n), n ∈ N.
а само отображение – в виде семейства {xn ; n ∈ N} или {xn }.
• Конечной последовательностью называется произвольное отображение x, имеющее обла-
стью определения натуральное число:

D(x) ∈ N.

Точно так же значения такого отображения часто записывают с помощью индексов

xk = x(k), k ∈ n = D(x).

а само это отображение – в виде семейства {xk ; k ∈ n}. Ординал n при этом называется
длиной последовательности {xk ; k ∈ n}.
• Конечная последовательность длины n называется также строкой длины n. При этом
строку длины 2 удобно называть парой, строку длины 3 — тройкой, строку длины 4 —
четверкой, строку длины 5 — пятеркой, строку длины 6 — шестеркой, и так до строки
длины 9, которую называют девяткой33 .

⋄ 0.3.103. Введенное здесь понятие пары как по- Set длины 2 естественным образом можно сопо-
следовательности длины 2 согласуется с поняти- ставить упорядоченную пару множеств (X, Y )
ем упорядоченной пары множеств (X, Y ), опре-
деленной выше формулой (0.3.166) X = a0 , Y = a2 ,

(X, Y ) = {{X}, {X, Y }}, и наоборот, любой упорядоченной паре множеств


(X, Y ) по тем же формулам можно поставить в
потому что всякой последовательности a : 2 → соответствие последовательность a : 2 → Set.

Напомним, что декартово произведение классов X × Y было определено нами выше формулой
(0.3.182):
X × Y = {(A, B) : A ∈ X & B ∈ Y }.
Обобщением этого понятия на случай большего числа множителей можно считать следующую кон-
струкцию.
• Заметим, что в соответствии с обозначением (0.3.219), множество всех последовательно-
стей длины n со значениями в множестве Y естественно обозначать символом Y n :

x∈Yn ⇐⇒ x:n→Y (0.3.343)

Множество Y n называется декартовой степенью множества Y .


• Пусть X0 , ...Xk конечная последовательность множеств. Их декартовым произведением
называется множество
k
Y
X0 × ... × Xk = Xi = {t ∈ {X0 , ..., Xk }k+1 : ∀i ∈ K ti ∈ Xi } (0.3.344)
i=0

Теорема 0.3.104. Пусть X0 , ..., Xn+1 – последовательность множеств. Тогда


Y
n  n+1
Y
Xi × Xn+1 ∼
= Xi (0.3.345)
i=0 i=0
33 Напомним, что ординалы от 0 до 9 были определены выше формулами (0.3.260)-(0.3.269).
74 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Доказательство. Отображение
Y
n  n+1
Y    

f: Xi × Xn+1 → Xi f (x0 , ..., xn ), xn+1 = x0 , ..., xn , xn+1
i=0 i=0

является биекцией.

(g) Ранг множества, полное упорядочение Set и теорема о выборе


Не только новичку, но и опытному математику класс Set всех множеств обычно кажется каким-то
необъятным образованием, у которого не может быть никакого внятного описания. В теории MK
этот стереотип чудесным образом удается преодолеть. Здесь мы опишем замечательную конструк-
цию, которая позволяет рассыпать класс Set на семейство подмножеств SetA , индексированных
порядковыми числами A ∈ Ord. Это позволяет доказать теоремы 0.3.115 о полном упорядочении
класса Set и о выборе 0.3.116, которые можно считать главными содержательными результатами
теории Морса-Келли.

Ранг множества. Напомним, что выше (0.3.201) мы определили значение g(X) любого класса g
на любом множестве X. Заметим, что если g – множество, то класс ординалов

{A ∈ Ord : ∀T (g(T ) ∈ Ord ⇒ g(T ) ∈ A)} = {A ∈ Ord : R(g) ∩ Ord ⊆ A}

непуст: поскольку g – множество, R(g) – тоже множество, значит R(g) ∩ Ord – тоже множество, и по
теореме 0.3.65, R(g) ∩ Ord ⊆ A для некоторого A ∈ Ord.
Рассмотрим отображение

h(g) = min{A ∈ Ord : ∀T (g(T ) ∈ Ord ⇒ g(T ) ∈ A)} = min{A ∈ Ord : R(g) ∩ Ord ⊆ A}, g ∈ Set

Оно определено всюду на Set и принимаeт значения в Ord, поэтому по теореме 0.3.54 h индуктивно
определяет некое отображение rank : Set → Ord формулой (0.3.305):

rank X = h(rank X ) = min{A ∈ Ord : R(rank X ) ∩ Ord ⊆ A} (0.3.346)

• Рангом множества X называется ординал rank X, определенный формулой (0.3.346).

Свойства ранга множеств:


1◦ rank X 6 B ∈ Ord тогда и только тогда, когда ∀T ∈ X rank T ∈ B (или, что эквивалент-
но, ∀T ∈ X rank T < B).
2◦ Если X ∈ Y , то rank X ∈ rank Y .
3◦ Если X ⊆ Y , то rank X 6 rank Y .

4 rank(X ∪ Y ) = rank X ∪ rank Y .
5◦ rank(∪X) = ∪{rank Y : Y ∈ X} 6 rank X.
6◦ Если A ∈ Ord, то rank{A} = rank S(A).
7◦ Если A ∈ Ord, то rank 2A = rank S(A).
8◦ Если A ∈ Ord, то rank A = A.

Доказательство. 1. Пусть B ∈ Ord. Тогда условие ∀T ∈ X rank T ∈ B эквивалентно условию



R(rank X ) ∩ Ord = {rank T ; T ∈ X} ∩ Ord = {rank T ; T ∈ X} ⊆ B.

которое в свою очередь эквивалентно условию



B ∈ {A ∈ Ord : R(rank X ) ∩ Ord ⊆ A}

и условию
B > min{A ∈ Ord : R(rank X ) ∩ Ord ⊆ A} = rank A.

2. Пусть X ∈ Y . Тогда, очевидно, rank X ∈ R(rank Y ), а с другой стороны, rank X ∈ Ord,
поэтому
rank X ∈ R(rank Y ) ∩ Ord. Поэтому если для какого-то ординала A справедливо R(rank Y ) ∩ Ord ⊆
§ 3. Теория множеств Морса-Келли 75

A, то автоматически справедливо и rank X ∈ A. Это можно переформулировать так, что rank X


принадлежит пересечению всех таких A, и поэтому мы получаем цепочку

rank X ∈ ∩{A ∈ Ord R(rank Y ) ∩ Ord ⊆ A} = (0.3.277) =

= min{A ∈ Ord R(rank Y ) ∩ Ord ⊆ A} = (0.3.346) = rank Y.

3. Пусть X ⊆ Y . Тогда по уже доказанному свойству 2◦ , если T ∈ X, то T ∈ Y , и значит


rank T ∈ rank Y . Это можно понимать
так, что rank Y – одно из тех множеств A ∈ Ord, для которых
справедливо включение R(rank X ) ∩ Ord ⊆ A:

rank Y ∈ {A ∈ Ord : R(rank X ) ∩ Ord ⊆ A}.

Как следствие,
rank Y > min{A ∈ Ord : R(rank X ) ∩ Ord ⊆ A} = rank X.
4. Прежде всего, из X ⊆ X ∪ Y следует, в силу уже доказанного свойства 3◦ , что rank X 6
rank(X ∪ Y ), и точно так же из Y ⊆ X ∪ Y следует, что rank Y 6 rank(X ∪ Y ). Это в свою очередь
означает в силу (0.3.283), что

rank X ⊆ rank(X ∪ Y ) & rank Y ⊆ rank(X ∪ Y ).

Поэтому
rank X ∪ rank Y ⊆ rank(X ∪ Y ). (0.3.347)
Докажем теперь обратное включение. Для этого заметим такую цепочку:

T ∈X ∪Y =⇒ T ∈ X ∨ T ∈ Y =⇒
=⇒ rank T ∈ rank X ∨ rank T ∈ rank Y =⇒ rank T ∈ rank X ∪ rank Y.

Это можно понимать так, что ординал rank X ∪ rank Y содержится в классе всех ординалов A, для
которых выполняется условие
R(rank X∪Y ) ∩ Ord ⊆ A.
Или, иными словами,

rank X ∪ rank Y ∈ {A ∈ Ord : R(rank X∪Y ) ∩ Ord ⊆ A}.

Понятно, что rank X ∪ rank Y должен быть не меньше минимума этого множества:

rank X ∪ rank Y > min{A ∈ Ord : R(rank X∪Y ) ∩ Ord ⊆ A} = (0.3.346) = rank(X ∪ Y ).

Опять в силу (0.3.283) мы получаем

rank X ∪ rank Y ⊇ rank(X ∪ Y ),

Вместе с (0.3.347) это дает 4◦ .


5. Во-первых, из цепочки

T ∈ ∪X =⇒ ∃Y ∈ X T ∈ Y =⇒ ∃Y ∈ X rank T ∈ rank Y =⇒ rank T ∈ ∪{rank Y ; Y ∈ X}

следует включение

∪{rank Y ; Y ∈ X} ∈ {A ∈ Ord : R(rank ∪X ) ∩ Ord ⊆ A}

а из него – неравенство

∪{rank Y ; Y ∈ X} > min{A ∈ Ord : R(rank ∪X ) ∩ Ord ⊆ A} = rank ∪X. (0.3.348)

Во-вторых, из цепочки

Y ∈X =⇒ Y ⊆ ∪X =⇒ rank Y 6 rank ∪X

следует неравенство
∪{rank Y ; Y ∈ X} 6 rank ∪X.
76 Глава 0. ТЕОРИЯ МНОЖЕСТВ

которое вместе с (0.3.348) это дает равенство в 5◦ :

∪{rank Y ; Y ∈ X} = rank ∪X.

В-третьих, из цепочки

Y ∈X =⇒ rank Y ∈ rank X =⇒ rank Y 6 rank X

мы получаем неравенство в 5◦ :
∪{rank Y ; Y ∈ X} 6 rank X.

6. Равенство 6◦ доказывается прямым вычислением:



rank{A} = min{B ∈ Ord : R(rank {A} ) ∩ Ord ⊆ B} =
= min{B ∈ Ord : {rank A} ⊆ B} = min{B ∈ Ord : rank A ∈ B} = rank S(A).

7. С одной стороны,

уже доказанное
A свойство 2◦
A⊆A =⇒ A∈2 =⇒ rank A ∈ rank 2A =⇒ rank S(A) 6 rank 2A .

А, с другой,

A ∈ S(A)
уже доказанное

свойство 2◦
уже доказанное rank Y ∈ rank S(A)
свойство 3◦ ⇓
Y ∈ 2A =⇒ Y ⊆A =⇒ rank Y 6 rank A < rank S(A) =⇒ rank Y < rank S(A).

Последнее верно для всякого Y ∈ 2A , поэтому, по уже доказанному свойству 1◦ ,

rank 2A 6 rank S(A).

Вместе то и другое дает 7◦ .


8. Последнее свойство доказывается индукцией по ординалу A. Пусть X – класс ординалов,
для которых верно равенство rank A = A. Рассмотрим произвольный ординал A ∈ Ord, такой, что
A ⊆ X, то есть удовлетворяющий условию34

∀B ∈ A rank B = B.

Тогда

R(rank A ) = R({rank B; B ∈ A}) = R({B; B ∈ A}) = A,

и

rank A = min{C ∈ Ord : R(rank A ) ∩ Ord ⊆ C} = min{C ∈ Ord : A ⊆ C} = A.

То есть A ∈ X. По теореме 0.3.71 это означет, что X = Ord.

Кумулятивная иерархия.

Теорема 0.3.105. Для всякого порядкового числа A ∈ Ord класс

SetA = {X : rank X ∈ A} (0.3.349)

является множеством, и удовлетворяет равенству


[
SetA = 2SetB (0.3.350)
B: B∈A
34 Можно заметить, хотя это не входит в формальное требование теоремы 0.3.71, которую мы собираемся применить,

что ∅ удовлетворяет этому условию, потому что rank ∅ = min{C ∈ Ord : ∅ ∩ Ord ⊆ C} = min Ord = ∅.
§ 3. Теория множеств Морса-Келли 77

Доказательство. Докажем сначала (0.3.350). Пусть X ∈ SetA , то есть rank X ∈ A. Положим B =


rank X ∈ A. Тогда для всякого T ∈ X мы в силу свойства 2◦ на с.74 получим rank T ∈ rank X = B,
следовательно, X ⊆ {T : rank T ∈ B} = SetB , то есть X ∈ 2SetB . Мы доказали вложение
[
SetA ⊆ 2SetB .
B: B∈A
S
Наоборот, пусть X ∈ B: B∈A 2SetB , то есть X ∈ 2SetB для некоторого B ∈ A. Это значит, что
X ⊆ SetB = {T : rank T ∈ B}, то есть для всякого T ∈ X выполняется rank T ∈ B. Из определения
rank формулой (0.3.346) мы получаем, что rank X 6 B ∈ A, и значит, X ∈ SetA . Таким образом,
доказано вложение [
SetA ⊇ 2SetB
B: B∈A

и вместе с ним, вся формула (0.3.350).


Теперь покажем, что для всякого порядкового числа A ∈ Ord класс SetA является множеством.
Это доказывается индукцией по теореме 0.3.71. При A = ∅ мы получаем

SetA = Set∅ = {X : rank X ∈ ∅} = ∅ ∈ Set .

Предположим, что при некотором A ∈ Ord это верно для всех B ∈ A:

∀B B∈A =⇒ SetB ∈ Set .

Тогда по теореме 0.3.10


∀B B∈A =⇒ 2SetB ∈ Set,
и поэтому [
SetA = (0.3.350) = 2SetB ∈ Set .
B: B∈A

Свойства SetA :
1◦ X ⊆ SetA тогда и только тогда, когда rank X 6 A.

2 rank SetA = A.
3◦ Наполненность: X ∈ SetA ⇒ X ⊆ SetA .
4◦ Если A ∈ B, то SetA ∈ SetB (и поэтому SetA ⊆ SetB ).
5◦ 2SetA = SetS(A) .
S
6◦ Если A – предельный ординал35 , то SetA = B: B∈A SetB .
Доказательство. 1. Первое свойство здесь эквивалентно свойству 1◦ на с.74:

X ⊆ SetA ⇐⇒ ∀Y ∈ X rank Y < A ⇐⇒ rank X 6 A.

2. Во-первых, ∀X ∈ SetA rank X ∈ A, поэтому по свойству 1◦ на с.74 rank SetA 6 A. Во-вторых,


∀B ∈ A rank B = B ∈ A (по свойству 8◦ на с.74), поэтому B ∈ SetA . Это означает включение
A ⊆ SetA , из которого по свойству 3◦ на с.74 следует A = rank A 6 rank SetA .
3. Если Y ∈ X ∈ SetA , то rank Y < rank X < A, поэтому rank Y < A и значит Y ∈ SetA .
4. Если A ∈ B, то в силу уже доказанного свойства 2◦ , rank SetA = A < B, поэтому SetA ∈ SetB .
5. Здесь применяется уже доказанное свойство 1◦ :

X ∈ 2SetA ⇐⇒ X ⊆ SetA ⇐⇒ rank X 6 A ⇐⇒ rank X < S(A) ⇐⇒ X ∈ SetS(A) .

6. Пусть A – предельный ординал. Тогда

X ∈ SetA ⇐⇒ rank X < A ⇐⇒ ∃B < A rank X < B ⇐⇒


[
⇐⇒ ∃B < A X ∈ SetB ⇐⇒ X∈ SetB .
B: B∈A

35 Предельные орлиналы были определены выше на с.57.


78 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Теперь обещанное в начале этого раздела описание класса Set:

Теорема 0.3.106. Класс Set всех множеств является объединением множеств SetA , A ∈ Ord:
[
Set = SetA (0.3.351)
A: A∈Ord
.
S
Доказательство. SВложение Set ⊇ A: A∈Ord SetA очевидно, поэтому нам нужно доказать обратное
вложение: Set ⊆ A: A∈Ord SetA . Пусть X ∈ Set. Тогда, по определению ранга (0.3.346), rank X ∈
Ord. Отсюда можно заключить, что существует ординал A ∈ Ord такой что rank X < A (например,
можно положить A = S(rank X)). SПо определению SetA (формулой (0.3.349)), это означает, что
X ∈ SetA . Мы получаем, что X ∈ A: A∈Ord SetA .
• Система множеств {SetA ; A ∈ Ord} называется кумулятивной иерархией множеств в
MK, а каждое множество SetA в ней — элементом кумулятивной иерархии в MK.

Первые несколько элементов кумулятивной ⋄ 0.3.111. Далее,


иерархии можно выписать в явном виде.
Set4 = {0, {0}, {1}, {{1}}, {2},
⋄ 0.3.107. Прежде всего,
{0, 1}, {0, {1}}, {0, 2}, {1, {1}}, {1, 2}, {2, {1}},
Set0 = 0. (0.3.352) {0, 1, {1}}, {0, 1, 2}, {0, {1}, 2}, {1, {1}, 2},
Это доказывается равносильностью {0, 1, {1}, 2}} (0.3.356)

(0.3.349) (всего 16 элементов). Это доказывается цепочкой


X ∈ Set0 ⇔ rank X ∈ 0 = ∅
свойство 5◦
(из которой следует, что такого X не существу- на с.77
ет). Set4 = SetS(3) = 2Set3 = (0.3.355) =
= 2{0,1,{1},2} =
⋄ 0.3.108. Далее,
= {0, {0}, {1}, {{1}}, {2},
Set1 = 1, (0.3.353) {0, 1}, {0, {1}}, {0, 2}, {1, {1}}, {1, 2}, {2, {1}},
что доказывается цепочкой {0, 1, {1}}, {0, 1, 2}, {0, {1}, 2}, {1, {1}, 2},
{0, 1, {1}, 2}}
свойство 5◦
на с.77
Set1 = SetS(0) = 2Set0 = (0.3.352) = Предложение 0.3.112. Если m — натуральное
число, то Setm — конечное множество:
= 20 = 2∅ = {∅} = 1.
m ∈ N ⇒ Setm ∈ Fin .
⋄ 0.3.109. Далее,
Доказательство. Рассмотрим класс
Set2 = 2, (0.3.354)
Y = {m : m ∈ N & card Setm < ∞}
что доказывается цепочкой
и покажем, что Y = N.
свойство 5◦ Сначала заметим, что 0 ∈ Y , потому что
на с.77
Set2 = SetS(1) = 2Set1 = (0.3.353) =
card Set0 = (0.3.352) = 0 < ∞.
= 21 = 2{∅} = {∅, {∅}} = 2.
Далее зафиксируем произвольный m ∈ Y .
⋄ 0.3.110. Далее Для него мы получим:
m∈Y
Set3 = {0, 1, {1}, 2}. (0.3.355) ⇓
свойство 5◦ card Setm < ∞
(и эта формула показывает, что уже Set3 не яв- на с.77 ⇓
свойство 9◦
↓ на с.69
ляется ординалом). Это доказывается цепочкой card SetS(m) = card 2 Setm
< ∞
свойство 5◦ ⇓
на с.77
Set3 = SetS(2) = 2Set2 = (0.3.354) = S(m) ∈ Y.
= 22 = 2{0,1} = {0, {0}, {1}, {0, 1}} = По теореме 0.3.79 (принцип обыкновенной ин-
= {0, 1, {1}, 2}. дукции), мы получаем Y = N.
§ 3. Теория множеств Морса-Келли 79

Предложение 0.3.113. Если X — конечное ограниченное множество в N


множество, содержащееся в элементе кумуля-
тивной иерархии SetN , то X является элемен- ⇓
том SetN : ∃B ∈ N ∀Y ∈ X rank Y ∈ B
Fin ∋ X ⊆ SetN ⇒ X ∈ SetN . (0.3.357) ⇓ (свойство 1◦ на с.74)

Доказательство. Поскольку X — конечное мно- ∃B ∈ N rank X 6 B


жество, отображение rank принимает на нем ко- ⇓ (свойство 1◦ на с.77)
нечное множество значений, и мы получаем та-
кую цепочку: ∃B ∈ N X ⊆ SetB

{rank Y ; Y ∈ X} ∈ Fin
свойство 5◦ S(B) ∈ N
свойство 4◦
⇓ на с.77 ⇓
на с.77

∃B ∈ N X∈2 Set
B
= SetS(B)∈SetN
{rank Y ; Y ∈ X} —

Полное упорядочение Set. Напомним, что понятие полного порядка было введено на с.49.

Теорема 0.3.114. На каждом множестве X можно ввести отношение полного порядка.

Доказательство. По теореме 0.3.83 существует биекция f : X → T на некоторое порядковое число


T ∈ Ord. Правило
A ≺ B ⇐⇒ f (A) ∈ f (B), A, B ∈ X,
определяет полный порядок на X.

Теорема 0.3.115. На классе Set всех множеств можно ввести отношение полного порядка.

Доказательство. Для каждого порядкового числа A ∈ Ord класс SetA является по теореме 0.3.105
множеством, поэтому по теореме 0.3.114 на SetA существует (хотя бы один) полный порядок. Если
обозначить через WA класс всевозможных полных порядков на SetA , то, во-первых, он будет непуст
(потому что, как мы уже говорили, существует хотя бы один полный порядок на SetA ), а, во-вторых,
он будет множеством (потому что каждый полный порядок на SetA содержится в SetA × SetA , и
значит WA содержится в множестве 2SetA × SetA ).
Мы получаем, что {WA ; A ∈ Ord} ⊆ Set \{∅}. Значит, к классам WA можно применить функцию
выбора c : Set \{∅} → Set (из аксиомы MK-14 на с.63), и для каждого A ∈ Ord мы получим некий
полный порядок ≺A = c(WA ) ∈ WA на SetA . Теперь определим отношение ≺ на Set правилом:
X ≺ Y , если
— либо rank X ∈ rank Y ,
— либо rank X = rank Y = A, и X ≺A Y .
Отношение ≺ будет полным порядком на Set.

Теорема о выборе. Одним из следствий теоремы 0.3.115 является утверждение, позволяющее


выделить на каждом классе X с заданным на нем отношением эквивалентности ∼ подкласс, содер-
жащий ровно по одному представителю из классов эквивалентности отношения ∼. Это похоже на
аксиому выбора MK-14 на с.63, но напрямую (без других важных аксиом теории MK, в частности,
без аксиомы регулярности MK-11) из нее не следует, потому что классы эквивалентности по от-
ношению эквивалентности ∼ не обязаны быть множествами, это могут быть (и обычно и бывают)
собственные классы (и, как следствие, их нельзя считать элементами области определения функции
выбора c : Set \{∅} → Set из аксиомы MK-14). Доказать это утверждение получается только после
предварительной работы по построению кумулятивной иерархии36 . Это очень важное утверждение,
в разных формулировках встречающееся в различных текстах по теории множеств и логике, и име-
ющее полезные приложения в разделе математики, именуемом теория категорий. Предлагаемую
36 Одним из приемов, используемых для этого, является так называемый трюк Скотта, применяемый в различных

вариантах теории множеств с кумулятивной иерархией (наше доказательство, впрочем, строится иначе).
80 Глава 0. ТЕОРИЯ МНОЖЕСТВ

здесь формулировку автор нигде не встречал (что, наверное, можно объяснить просто тем, что
вообще вся теория Морса—Келли описывается в учебниках очень скупо и фрагментарно), поэтому
ей желательно дать какое-то название. Мы назовем этот факт теоремой о выборе.
Теорема 0.3.116 (о выборе). Пусть ∼ — отношение эквивалентности37 на классе X. Тогда су-
ществует подкласс Y ⊆ X со следующими свойствами:
(i) у всякого элемента x ∈ X найдется эквивалентный ему в смысле отношения ∼ элемент
y ∈Y:
∀x ∈ X ∃y ∈ Y x ∼ y
(ii) эквивалентные элементы в классе Y совпадают:

∀y, z ∈ Y y∼z ⇒ y = z.

Доказательство. Рассмотрим отношение полного порядка ≺, устанавливаемое теоремой 0.3.115 на


классе Set. Понятно, что на классе X оно также будет отношением полного порядка. Рассмотрим
отображение
f (x) = min{t : t ∈ X & t ∼ x}.
Класс Y определяется как область значений38 отображения f :

Y = R(f ).

Поскольку для всякого x ∈ X f (x) = min{t : t ∈ X & t ∼ x} ∈ X, класс Y содержится в классе X.


1. Условие (i) выполняется потому что у всякого x ∈ X имеется некий образ y = f (x).
2. Заметим, что f (x) всегда эквивалентен x:

f (x) ∼ x, x∈X (0.3.358)

Отсюда следует цепочка

f (f (x)) = min{t : t ∈ X & t ∼ f (x)} = (0.3.358) = min{t : t ∈ X & t ∼ x} = f (x),

то есть тождество
f (f (x)) = f (x), x ∈ X. (0.3.359)
3. Из (0.3.359) следует цепочка

y∈Y ⇒ ∃x ∈ X y = f (x) ⇒ ∃x ∈ X y = f (x) = f (f (x)) = (0.3.359) = f (y).

то есть тождество
y = f (y), y ∈ Y. (0.3.360)
4. Теперь можно доказать утверждение (ii): если y, z ∈ Y и y ∼ z, то

y∼z

{t : t ∈ X & t ∼ y} = {t : t ∈ X & t ∼ z}

y = (0.3.360) = f (y) = min{t : t ∈ X & t ∼ y} = min{t : t ∈ X & t ∼ z} = f (z) = (0.3.360) = z.

37 Отношение эквивалентности было определено на с.43.


38 Область значений R(f ) отображения f определена выше формулой (0.3.200).
Глава 1

ЧИСЛА, КАК ЯВНАЯ


КОНСТРУКЦИЯ

После того, как построена формальная теория множеств, логично объяснить, как на ее основе стро-
ятся стандартные числовые множества, используемые в анализе. Строить числа можно по-разному,
и мы даем обзор стандартных подходов в главе 3 (на с.187), но независимо от того, какой подход ты
выбираешь, существование чисел (под которым понимается доказуемость утверждения, что числа
как объекты существуют внутри теории, используемой математиком в качестве фундамента сво-
ей науки) требует обоснования. Самый простой способ решить эту проблему — описать числа как
явную конструкцию в рабочей теории множеств, и мы это делаем в этой главе.

§1 Явные конструкции числовых множеств


(a) Натуральные числа N.
Напомним, что натуральное число было определено на с.60 как изолированное порядковое число,
каждый элемент которого также является изолированым порядковым числом. Символом N на с.60
мы условились обозначать множество всех натуральных чисел.

Отношение порядка и алгебраические операции в N.


Теорема 1.1.1. Существует единственное отображение (m, n) ∈ N × N 7→ m + n ∈ N со следую-
щими свойствами1 :
m+0=m m∈N (1.1.1)
m + S(n) = S(m + n) m, n ∈ N (1.1.2)

• Отображение (m, n) ∈ N × N 7→ m + n ∈ N называется операцией сложения на N.


Доказательство. Здесь используется теорема 0.3.76. Рассмотрим отображение H : NN → NN , дей-
ствующее по формуле
H(f )(m) = S(f (m)), f ∈ NN , m ∈ N. (1.1.3)
По теореме 0.3.76 оно однозначно определяет некое отображение K : N → NN со свойствами2

K(0) = idN , K(S(n)) = H(K(n)). (1.1.4)

Теперь надо воспользоваться теоремой 0.3.37: отображение K : N → NN является элементом множе-


ства (NN )N , и поэтому при биекции (NN )N → NN×N (заданной формулой (0.3.222)) ему соответствует
некий элемент L ∈ NN×N , то есть отображение L : N × N → N:

L(m, n) = K(n)(m). (1.1.5)

Если значение L(m, n) обозначить m + n, то мы, во-первых, получим (1.1.1):


m + 0 = L(m, 0) = (1.1.5) = K(0)(m) = (1.1.4) = idN (m) = (0.3.215) = m.
1 Отображение S было определено выше формулой (0.3.293).
2 Отображение idX было определено выше формулой (0.3.215).

81
82 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

И, во-вторых, (1.1.2):

m + S(n) = L(m, S(n)) = (1.1.5) = K(S(n))(m) = (1.1.4) =


= H(K(n))(m) = (1.1.3) = S(K(n)(m)) = S(L(m, n)) = S(m + n).

Осталось проверить единственность отображения +. Предположим, что ⊕ – другое отображение


с теми же свойствами:

m⊕0=m m∈N (1.1.6)


m ⊕ S(n) = S(m ⊕ n) m, n ∈ N (1.1.7)

Покажем, что
m + n = m ⊕ n. (1.1.8)
Зафиксируем m ∈ N и проведем индукциею по n ∈ N. При n = 0 мы получим

m + 0 = (1.1.1) = m = (1.1.6) = m ⊕ 0.

Предположим, что (1.1.8) верно при каком-то n ∈ N. Тогда для S(n) мы получим:

m + S(n) = (1.1.2) = S(m + n) = (1.1.8) = S(m ⊕ n) = (1.1.7) = m ⊕ S(n).

Свойства операции сложения на N:


S(n) = n + 1, n∈N (1.1.9)
0 + n = n = n + 0, n∈N (1.1.10)
m + n = n + m, m, n ∈ N (1.1.11)
l + (m + n) = (l + m) + n, l, m, n ∈ N (1.1.12)
l+m=l+n ⇒ m = n, l, m, n ∈ N (1.1.13)

Доказательство. 1. Свойство (1.1.9):

n + 1 = n + S(0) = (1.1.2) = S(n + 0) = (1.1.1) = S(n).

2. В (1.1.10) правая часть есть тождество (1.1.1), поэтому нужно доказать только левую. Это
делается индукцией по n. Для n = 0 мы получаем

0 + 0 = (1.1.1) = 0.

Если же (1.1.10) верно для какого-то n ∈ N,

0+n=n (1.1.14)

то для S(n) мы получаем:

0 + S(n) = (1.1.2) = S(0 + n) = (1.1.14) = S(n).

3. Свойство (1.1.11) доказывается двойной индукцией, внешей по m, и внутренней по n. При


m = 0 утверждение вытекает для всех n из (1.1.10) и (1.1.1):

∀n ∈ N 0 + n = (1.1.10) = n = (1.1.1) = n + 0.

Предположим, что (1.1.11) верно для некоторого m при всех n:

∀n ∈ N m+n=n+m (1.1.15)

Тогда для S(m) оно доказывается индукцией по n. При n = 0 мы получаем

S(m) + 0 = (1.1.1) = S(m) = (1.1.10) = 0 + S(m).

Если же это верно для какого-то n,

S(m) + n = n + S(m) (1.1.16)


§ 1. Явные конструкции числовых множеств 83

то для S(n) мы получаем:


  
S(m) + S(n) = (1.1.2) = S S(m) + n = (1.1.16) = S n + S(m) = (1.1.2) = S S(n + m) =
  
= (1.1.15) = S S(m + n) = (1.1.2) = S m + S(n) = (1.1.15) = S S(n) + m = (1.1.2) =
= S(n) + S(m).

4. Свойство (1.1.12) доказывается индукцией по n. При n = 0 мы получаем

l + (m + 0) = (1.1.1) = l + m = (1.1.1) = (l + m) + 0.

Если (1.1.12) верно для какого-то n ∈ N,

l + (m + n) = (l + m) + n, (1.1.17)

то для S(n) мы получим:



l + (m + S(n)) = (1.1.2) = l + S(m + n) = (1.1.2) = S l + (m + n) = (1.1.17) =

= S (l + m) + n = (1.1.17) = (l + m) + S(n).

5. Свойство (1.1.13) доказывается инукцией по l. При l = 0 получаем

0+m=0+n ⇒ m = n.

Если (1.1.13) верно для какого-то l,

l+m=l+n ⇒ m = n, (1.1.18)

то для S(l) мы получим:

(1.1.9) (1.1.12) (1.1.18)


S(l) + m = S(l) + n ⇒ (l + 1) + m = (l + 1) + n ⇒ l + (1 + m) = l + (1 + n) ⇒
(1.1.11) (1.1.9) ◦
свойство 7 на с.55
⇒ 1+m=1+n ⇒ m+1=n+1 ⇒ S(m) = S(n) ⇒ m = n.

⊲⊲ 1.1.2. Докажите следующие свойства опера- m < n ⇒ ∀l ∈ N l+m<l+n (1.1.20)


ции сложения в N (l, m, n ∈ N): m 6 m + n, (1.1.21)
m < n ⇔ ∃l > 0 l+m=n (1.1.19)

Теорема 1.1.3. Существует единственное отображение (m, n) ∈ N × N → m · n ∈ N со следую-


щими свойствами:

m·0 = 0 m∈N (1.1.22)


m · S(n) = m · n + m m, n ∈ N (1.1.23)

• Отображение (m, n) ∈ N × N 7→ m · n ∈ N называется операцией умножения на N.


Доказательство. Здесь, как и в доказательстве теоремы 1.1.1, используется теорема 0.3.76. Рас-
смотрим отображение H : NN → NN , действующее по формуле

H(f )(m) = f (m) + m, f ∈ NN , m ∈ N. (1.1.24)

По теореме 0.3.76 оно однозначно определяет некое отображение K : N → NN со свойствами

K(0)(m) = 0 (m ∈ N), K(S(n)) = H(K(n)). (1.1.25)

Теперь надо воспользоваться теоремой 0.3.37: отображение K : N → NN является элементом множе-


ства (NN )N , и поэтому при биекции (NN )N → NN×N (заданной формулой (0.3.222)) ему соответствует
некий элемент L ∈ NN×N , то есть отображение L : N × N → N:

L(m, n) = K(n)(m). (1.1.26)


84 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

Если значение L(m, n) обозначить m · n, то мы, во-первых, получим (1.1.22):

m · 0 = L(m, 0) = (1.1.26) = K(0)(m) = (1.1.25) = 0.

И, во-вторых, (1.1.23):

m · S(n) = L(m, S(n)) = (1.1.26) = K(S(n))(m) = (1.1.25) =


= H(K(n))(m) = (1.1.24) = K(n)(m) + m = L(m, n) + m = m · n + m.

Осталось проверить единственность отображения ·. Предположим, что ⊙ – другое отображение


с теми же свойствами:

m⊙0=0 m∈N (1.1.27)


m ⊙ S(n) = m ⊙ n + m m, n ∈ N (1.1.28)

Покажем, что
m · n = m ⊙ n. (1.1.29)
Зафиксируем m ∈ N и проведем индукциею по n ∈ N. При n = 0 мы получим

m · 0 = (1.1.22) = 0 = (1.1.27) = m ⊙ 0.

Предположим, что (1.1.29) верно при каком-то n ∈ N. Тогда для S(n) мы получим:

m · S(n) = (1.1.23) = m · n + m = (1.1.29) = m ⊙ n + m = (1.1.28) = m ⊙ S(n).

Свойства операции умножения на N:


0 · n = 0 = n · 0, n∈N (1.1.30)
1 · n = n = n · 1, n∈N (1.1.31)
m · n = ·m, m, n ∈ N (1.1.32)
l · (m · n) = (l · m) · n, l, m, n ∈ N (1.1.33)
l · (m + n) = l · m + l · n, l, m, n ∈ N (1.1.34)

Доказательство. 1. В (1.1.30) правая часть есть тождество (1.1.22), поэтому нужно доказать только
левую. Это делается индукцией по n. Для n = 0 мы получаем

0 · 0 = (1.1.22) = 0.

Если же левая часть (1.1.30) верна для какого-то n ∈ N,

0·n=n (1.1.35)

то для S(n) мы получаем:

0 · S(n) = (1.1.23) = 0 · n + 0 = (1.1.35) = 0 + 0 = (1.1.1) = 0.

2. В (1.1.31) правая часть выводится из (1.1.23):

n · 1 = n · S(0) = (1.1.23) = n · 0 + n = (1.1.30) = 0 + n = (1.1.10) = n.

А левая часть доказывается индукцией по n. При n = 0 мы получаем

1 · 0 = (1.1.22) = 0.

Если левая часть (1.1.31) верна для какого-то n ∈ N,

1·n=n (1.1.36)

то для S(n) мы получаем:

1 · S(n) = (1.1.23) = 1 · n + 1 = (1.1.36) = n + 1 = (1.1.9) = S(n).


§ 1. Явные конструкции числовых множеств 85

3. Свойство (1.1.32) доказывается двойной индукцией, внешей по m, и внутренней по n. При


m = 0 утверждение вытекает для всех n из (1.1.30):

∀n ∈ N 0 · n = (1.1.30) = 0 = (1.1.30) = n · 0.

Предположим, что (1.1.32) верно для некоторого m при всех n:

∀n ∈ N m · n = n · m. (1.1.37)

Тогда для S(m) оно доказывается индукцией по n. При n = 0 мы получаем

S(m) · 0 = (1.1.30) = 0 = (1.1.30) = 0 · S(m).

Если же это верно для какого-то n,


S(m) · n = n · S(m) (1.1.38)
то для S(n) мы получаем:

S(m) · S(n) = (1.1.23) = S(m) · n + S(m) = (1.1.38) = n · S(m) + S(m) = (1.1.23) = (n · m + n) + S(m) =
= (1.1.9) = (n · m + n) + (m + 1) = (1.1.12) = ((n · m + n) + m) + 1 = (1.1.12) = ((n · m + (n + m)) + 1 =
= (1.1.11) = ((n · m + (m + n)) + 1 = (1.1.12) = ((n · m + m) + n) + 1 = (1.1.37) = ((m · n + m) + n) + 1 =
= (1.1.23) = (m · S(n) + n) + 1 = (1.1.12) = m · S(n) + (n + 1) = (1.1.9) = m · S(n) + S(n) = (1.1.37) =
= S(n) · m + S(n) = (1.1.23) = S(n) · S(m).

4. После того, как доказано (1.1.32), свойство (1.1.34) можно переписать в виде

(m + n) · l = m · l + n · l, (1.1.39)

и доказать это индукцией по l. При l = 0 мы получим

(m + n) · 0 = (1.1.27) = 0 = (1.1.1) = 0 + 0 = (1.1.27) = m · 0 + n · 0.

Предположим, что (1.1.39) верно для некоторого l. Тогда для S(l) мы получим

(m + n) · S(l) = (1.1.23) = (m + n) · l + (m + n) = (1.1.39) = (m · l + n · l) + (m + n) =


= (1.1.12) = (m · l + m) + (n · l + n) = (1.1.23) = m · S(l) + n · S(l).

⊲⊲ 1.1.4. Докажите следующие свойства опера- m 6= n ⇒ l · m 6 l · n, (1.1.43)


ции умножения в N. 2 · n = n + n, (1.1.44)
06l ⇒ ∀n ∈ N n 6 l · n, (1.1.40) 1<m&1<n ⇒ m + n 6 m · n, (1.1.45)
1 < l ⇒ n < l · n, (1.1.41) m 6= 0 & n 6= 0 ⇒ m · n 6= 0, (1.1.46)
l 6= 0 & m < n ⇒ l · m < l · n, (1.1.42)

Связь с конечными множествами.


Теорема 1.1.5. Если X и Y – конечные непресекающиеся множества, то

card(X ∪ Y ) = card X + card Y (1.1.47)

Доказательство. Проведем индукцию по card Y .


0. Заметим, что при card Y = 0, то есть Y = ∅, (1.1.47) верно:

card(X ∪ Y ) = card(X ∪ ∅) = card X = (1.1.1) = card X + 0 = card X + card Y.

1. Покажем далее, что (1.1.47) верно при card Y = 1:


 
X ∩ Y = ∅ & card(Y ) = 1 =⇒ card(X ∪ Y ) = card X + card Y. (1.1.48)
86 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

Пусть f : X → card X – биекция. Обозначим буквой y единственный элемент Y . Поскольку y ∈


/ X,
отображение (
f (A), A∈X
g(A) =
{card X}, A = y
будет биекцией между X ∪ Y и S(card X) = card X ∪ {card X}. Поэтому

card(X ∪ Y ) = S(card X) = (1.1.9) = card X + 1 = card X + card Y.

2. Теперь предположим, что формула (1.1.47) доказана для всех Y мощности card Y = n:
 
X ∩ Y = ∅ & card(Y ) = n =⇒ card(X ∪ Y ) = card X + card Y. (1.1.49)

Покажем, что тогда она верна и для случая card Y = S(n). Пусть f : Y → S(n) – биекция. Рассмот-
рим элемент3
y = f −1 (n) ∈ Y.
Отображение f |Y \{y} будет биекцией между Y \ {y} и n, поэтому card(Y \ {y}) = n. Отсюда мы
получаем:
 
card(X ∪ Y ) = card (X ∪ {y}) ∪ ( Y \ {y} ) = (1.1.49) = card(X ∪ {y}) + card(Y \ {y}) =
| {z } | {z } | {z }
↑ k (1.1.48) k
card(Y \ {y}) = n card X + card{y} n
k
card X + 1

= (card X + 1) + n) = (1.1.12) = card X + (1 + n) = (1.1.11) = card X + (n + 1) = (1.1.9) =


= card X + S(n) = card X + card Y.

Теорема 1.1.6. Если X и Y – конечные множества, то

card(X × Y ) = card X · card Y. (1.1.50)

Доказательство. Нужно провести индукцию по мощности Y .


Если card Y = 0, то Y ∅, и поэтому X × Y = ∅, и мы получаем

card(X × Y ) = card ∅ = 0 = (1.1.30) = card X · 0 = card X · card Y.

Предположим, мы доказали (1.1.50) для случая card Y = n:

card Y = n =⇒ ∀X card(X × Y ) = card X · n. (1.1.51)

Рассмотрим случай card Y = S(n). Пусть f : Y → S(n) = n ∪ {n}. Обозначим y = f −1 (n). Тогда
f |Y \{y} : Y → n будет биекция, и поэтому card(Y \ {y}) = n. С другой стороны, отобюражение
A ∈ X 7→ (A, y) ∈ X × {y} также будет биекцией. Поэтому
   
card(X × Y ) = card X × (Y \ {y}) ∪ (X × {y}) = card X × (Y \ {y}) + card(X × {y}) =
| {z } | {z }
k (1.1.51) k
card X · n card X

= (1.1.47) = card X · n + card X = (1.1.23) = card X · S(n) = card X · card Y.

(b) Целые числа Z.


На странице 60 мы определили множество N натуральных чисел, а в теоремах 1.1.1 и 1.1.3 мы опи-
сали операции + и · на нем. Рассмотрим декартово произведение N × N и введем на нем следующее
отношение:
(n, m) ∼ (n′ , m′ ) ⇔ n + m′ = n′ + m. (1.1.52)
3 Напомним, что S(n) = n ∪ {n}, поэтому n ∈ S(n).
§ 1. Явные конструкции числовых множеств 87

Предложение 1.1.7. Отношение ∼ является отношением эквивалентности на множестве N ×


N.

Доказательство. Свойство рефлексивности очевидно:


(1.1.52)
(n, m) ∼ (n, m) ⇒ n+m=n+m

(последнее верно в силу тождества (0.3.92)). Симметричность:


(1.1.52) (0.3.93) (1.1.52)
(n, m) ∼ (n′ , m′ ) ⇒ n + m′ = n ′ + m ⇔ n ′ + m = n + m′ ⇒ (n′ , m′ ) ∼ (n, m).

Транзитивность:

(n, m) ∼ (n′ , m′ ) & (n′ , m′ ) ∼ (n′′ , m′′ ) ⇒ n + m′ = n′ + m & n′ + m′′ = n′′ + m′ ⇒


(1.1.12),(1.1.11)
⇒ (n + m′ ) + (n′ + m′′ ) = (n′ + m) + (n′′ + m′ ) ⇒
(1.1.13) (1.1.52)
⇒ (n′ +m′ )+(n+m′′ ) = (n′ +m′ )+(n′′ +m) ⇒ n+m′′ = n′′ +m ⇒ (n, m) ∼ (n′′ , m′′ ).

• Целым числом называется произвольный класс эквивалентности в N × N по отношению


эквивалентности ∼, определенному формулой (1.1.52). Если для произвольного элемента
(n, m) ∈ N × N обозначить символом [(n, m)] класс эквивалентности, которому принадле-
жит (n, m):  
(n, m) ∈ [(n, m)] ∈ N × N / ∼,
то этот класс эквивалентности естественно интерпретируется как разность с уменьшае-
мым n и вычитаемым m:
[(n, m)] = n − m.
Множество всех целых чисел (представляющее собой фактор-множество множества N×N
по отношению ∼) обозначается символом Z:

Z = (N × N)/ ∼ (1.1.53)

Отношение порядка и алгебраические операции в Z. На множестве Z естественно опреде-


ляются отношение порядка

[(n, m)] 6 [(n′ , m′ )] ⇐⇒ n + m′ 6 n ′ + m (1.1.54)

и операции сложения и умножения

[(n, m)] + [(n′ , m′ )] = [(n + n′ , m + m′ )] (1.1.55)


′ ′ ′ ′ ′ ′
[(n, m)] · [(n , m )] = [(n · n + m · m , n · m + m · n )] (1.1.56)

Свойства алгебраических операций на Z:

0 + p = p = p + 0, p∈Z (1.1.57)
p + q = q + p, p, q ∈ Z (1.1.58)
p + (q + r) = (p + q) + r, p, q, r ∈ Z (1.1.59)
0 · p = 0 = p · 0, p∈Z (1.1.60)
1 · p = p = p · 1, p∈Z (1.1.61)
p · q = q · p, p, q ∈ Z (1.1.62)
p · (q · r) = (p · q) · r, p, q, r ∈ Z (1.1.63)
p · (q + r) = p · q + p · r, p, q, r ∈ Z (1.1.64)
p · q = 0 ⇒ p = 0 ∨ q = 0, p, q ∈ Z (1.1.65)
(p 6= 0 & p · q = p · r) ⇒ q = r, p, q, r ∈ Z (1.1.66)
88 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

Вложение N в Z. Множество N естественно вкладывается в множество Z отображением

σ(n) = [(n, 0)], n ∈ N. (1.1.67)

Теорема 1.1.8. Отображение σ : N → Z инъективно

m 6= n ⇒ σ(m) 6= σ(n) (1.1.68)

сохраняет порядок
m6n ⇒ σ(m) 6 σ(n) (1.1.69)
нуль
σ(0) = 0 (1.1.70)
единицу
σ(1) = 1 (1.1.71)
сумму
σ(m + n) = σ(m) + σ(n) (1.1.72)
и умножение
σ(m · n) = σ(m) · σ(n) (1.1.73)

Теорема 1.1.8 позволяет отождествить N с подмножеством σ(N) множества Z, потому что с точки
зрения свойств операций +, · и отношения 6 между N и σ(N) разницы нет: все, что можно доказать
об этих операциях и об этом отношении в N, можно доказать о них и в σ(N), и наоборот.
Отождествление N и σ(N) естественно понимать просто как равенство

n = [(n, 0)], n ∈ N. (1.1.74)


| {z }

N

В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них натуральное, а другое целое:

n + [(n′ , m′ )] = [(n, 0)] + [(n′ , m′ )] = [(n + n′ , m′ )], n ∈ N, [(n′ , m′ )] ∈ Z (1.1.75)


n · [(n′ , m′ )] = [(n, 0)] · [(n′ , m′ )] = [(nn′ , nm′ )], n ∈ N, [(n′ , m′ )] ∈ Z. (1.1.76)

(c) Рациональные числа Q.


После того, как построено множество Z целых чисел, мы рассмотрим декартово произведение Z ×
(Z \ {0}) и определяем на нем отношение

(p, q) ∼ (p′ , q ′ ) ⇔ p · q ′ = p′ · q. (1.1.77)

Предложение 1.1.9. Отношение ∼ является отношением эквивалентности на множестве Z ×


(Z \ {0}).

Доказательство. Здесь (с очевидными поправками) повторяются те же рассуждения, что и в пред-


ложении 1.1.7. Рефлексивность:
(1.1.77)
(p, q) ∼ (p, q) ⇒ p+q =p+q

(последнее верно в силу тождества (0.3.92)). Симметричность:


(1.1.77) (0.3.93) (1.1.77)
(p, q) ∼ (p′ , q ′ ) ⇒ p · q ′ = p′ · q ⇔ p′ · q = p · q ′ ⇒ (p′ , q ′ ) ∼ (p, q).

Для доказательсва транзитивности нужно рассмотреть два случая. Пусть

(p, q) ∼ (p′ , q ′ ) & (p′ , q ′ ) ∼ (p′′ , q ′′ )

Сначала предположим, что p′ = 0. Тогда получается цепочка


§ 1. Явные конструкции числовых множеств 89

(1.1.77)
(p, q) ∼ (0, q ′ ) & (0, q ′ ) ∼ (p′′ , q ′′ ) ⇒ p · q ′ = 0 · q & 0 · q ′′ = p′′ · q ′ ⇒
|{z} | {z }
k k
0 0
(1.1.65) (1.1.77)
⇒ p = 0 & p′′ = 0 ⇒ p · q ′′ = 0 · q ′′ = 0 = 0 · q = p′′ · q ⇒ (p, q) ∼ (p′′ , q ′′ )

После этого предположим, что p′ 6= 0. Тогда

(p, q) ∼ (p′ , q ′ ) & (p′ , q ′ ) ∼ (p′′ , q ′′ ) ⇒ p · q ′ = p′ · q & p′ · q ′′ = p′′ · q ′ ⇒


′ ′ ′′ ′ ′′ ′ (1.1.63),(1.1.62)
⇒ (p · q ) · (p · q ) = (p · q) · (p · q ) ⇒
(1.1.66) (1.1.77)
⇒ (p′ · q ′ ) ·(p · q ′′ ) = (p′ · q ′ ) ·(p′′ · q) ⇒ p · q ′′ = p′′ · q ⇒ (p, q) ∼ (p′′ , q ′′ )
| {z } | {z }
6=

6=
0 0

• Рациональным числом называется произвольный класс эквивалентности в Z × (Z \ {0}) по


отношению эквивалентности ∼, определенному формулой (1.1.77). Если для произволь-
ного элемента (p, q) ∈ Z × (Z \ {0}) обозначить символом [(p, q)] класс эквивалентности,
которому принадлежит (p, q):
 
(p, q) ∈ [(p, q)] ∈ Z × (Z \ {0}) / ∼,

то этот класс эквиввалентности естественно интерпретируется как дробь с числителем p


и знаменателем q:
p
[(p, q)] = .
q
Множество всех рациональных чисел (представляющее собой фактор-множество множе-
ства Z × (Z \ {0}) по отношению ∼) обозначается символом Q:
 
Q = Z × (Z \ {0}) / ∼ (1.1.78)

Отношение порядка и алгебраические операции в Q. На множестве Q естественно опреде-


ляются отношение порядка,
   
[(p, q)] 6 [(p′ , q ′ )] ⇔ 0 < q · q ′ ⇒ p · q ′ 6 p′ · q & q · q ′ < 0 ⇒ p · q ′ > p′ · q (1.1.79)

и операции сложения и умножения:

[(p, q)] + [(p′ , q ′ )] = [(p · q ′ + p′ · q, q · q ′ )] (1.1.80)


[(p, q)] · [(p′ , q ′ )] = [(p · p′ , q · q ′ )] (1.1.81)

Свойства отношения порядка и алгебраических операций на Q:

0 + a = a = a + 0, a∈Q (1.1.82)
a + b = b + a, a, b ∈ Q (1.1.83)
a + (b + c) = (a + b) + c, a, b, c ∈ Q (1.1.84)
0 · a = 0 = a · 0, a∈Q (1.1.85)
1 · a = a = a · 1, a∈Q (1.1.86)
a · b = b · a, a, b ∈ Q (1.1.87)
a · (b · c) = (a · b) · c, a, b, c ∈ Q (1.1.88)
a · (b + c) = a · b + a · c, a, b, c ∈ Q (1.1.89)
a · b = 0 ⇒ a = 0 ∨ b = 0, a, b ∈ Q (1.1.90)
(a 6= 0 & a · b = a · c) ⇒ b = c, a, b, c ∈ Q (1.1.91)
a 6 a, a∈Q (1.1.92)
90 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

(a 6 b & b 6 a) ⇒ a = b, a, b ∈ Q (1.1.93)
(a 6 b & b 6 c) ⇒ a 6 c, a, b, c ∈ Q (1.1.94)
∀a ∀b (a 6 b ∨ b 6 a), a, b ∈ Q (1.1.95)
(a < x & b < y) ⇒ a + x < b + y, a, b, x, y ∈ Q (1.1.96)
(0 6 a & 0 6 b) ⇒ 0 6 a · b, a, b ∈ Q (1.1.97)
(0 < a & 0 < b) ⇒ 0 < a · b, a, b ∈ Q (1.1.98)
(0 < a < x & 0 < b < y) ⇒ 0 < a · b < x · y, a, b, x, y ∈ Q (1.1.99)
(0 < a & x < y) ⇒ a · x < a · y, a, x, y ∈ Q (1.1.100)
0 < a < 1 ⇒ a−1 > 1, a∈Q (1.1.101)
a < b ⇒ ∃x a < x < b, a, b, x ∈ Q (1.1.102)

Вложение Z в Q. Множество Z естественно вкладывается в множество Q отображением

τ (n) = [(n, 1)], n ∈ Z. (1.1.103)

Теорема 1.1.10. Отображение τ : Z → Q инъективно

m 6= n ⇒ τ (m) 6= τ (n) (1.1.104)

сохраняет порядок
m6n ⇒ τ (m) 6 τ (n) (1.1.105)
нуль
τ (0) = 0 (1.1.106)
единицу
τ (1) = 1 (1.1.107)
сумму
τ (m + n) = τ (m) + τ (n) (1.1.108)
и умножение
τ (m · n) = τ (m) · τ (n) (1.1.109)
Теорема 1.1.10 позволяет отождествить Z с подмножеством τ (Z) множества Q, потому что с
точки зрения свойств операций +, · и отношения 6 между Z и τ (Z) разницы нет: все, что можно
доказать об этих операциях и об этом отношении в Z, можно доказать о них и в τ (Z), и наоборот.
Отождествление Z и τ (Z) естественно понимать просто как равенство

n = [(n, 1)], n ∈ Z. (1.1.110)


| {z }

Z

В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них целое, а другое рациональное:

n + [(p, q)] = [(n, 1)] + [(p, q)] = [(nq + p, q)], n ∈ Z, [(p, q)] ∈ Q (1.1.111)
n · [(p, q)] = [(n, 1)] · [(p, q)] = [(np, q)], n ∈ Z, [(p, q)] ∈ Q. (1.1.112)

Теорема 1.1.11. Для любого x ∈ Q найдется число n ∈ Z такое что 0 < n и x < n.

(d) Вещественные числа R.


Дедекиндовым сечением множества Q рациональных чисел называется пара (A, A′ ) подмножеств Q
со следующими свойствами:
(i) A и A′ непусты:
A 6= ∅ 6= A′ . (1.1.113)
(ii) A и A′ образуют разбиение множества Q:

A ∩ A′ = ∅, A ∪ A′ = Q (1.1.114)
§ 1. Явные конструкции числовых множеств 91

(iii) A лежит левее A′ :


∀a ∈ A ∀x ∈ A′ a6x (1.1.115)
(iv) A не содержит максимального элемента:
  
∀x ∈ Q ∀a ∈ A a 6 x =⇒ x∈
/A (1.1.116)

• Вещественным числом называется произвольное дедекиндово сечение множества Q ра-


циональных чисел. Множество всех вещественных чисел обозначается символом R.

⋄ 1.1.12. Для всякого элемента a ∈ Q рассмот- ⋄ 1.1.13. Помимо сечений из примера 1.1.12 бы-
рим множества вают и другие. Например, можно рассмотреть
пару (A, A′ ), в которой
(a) = {x ∈ Q : x < a} (1.1.117)
A = {x ∈ Q : x < 0 ∨ x · x < 2}
и
(a)′ = {x ∈ Q : a 6 x} (1.1.118)
и
Тогда пара (A, A ), в которой A = (a), A′ = (a)′ ,

A′ = {x ∈ Q : 0 6 x & 2 6 x · x}
является является дедекиндовым сечением в Q.
Такое сечение назвывается сечением, порожден- и это будет дедекиндово сечение, не порожденное
ным элементом a ∈ Q. никаким элементом Q.

Из (1.1.114) следует, что в дедекиндовом сечении (A, A′ ) левый элемент, A полностью определяет
правый, A′ :
A′ = Q \ A.
Поэтому можно описывать дедекиндовы сечения свойствами левой компоненты:
Теорема 1.1.14. Множество A ⊆ Q тогда и только тогда является первой компонентой неко-
торого дедекиндова сечения, когда оно удовлетворяет следующим свойствам:
(i) A непусто и не совпадает с Q:
∅ 6= A 6= Q, (1.1.119)
(ii) A замкнуто относительно переходов влево:

∀x ∀a x6a∈A =⇒ x ∈ A, (1.1.120)

(iii) A не содержит максимального элемента:

∀x ∈ A ∃a ∈ A x<a (1.1.121)

• С этого момента условимся под дедекиндовым сечением понимать его левую компоненту,
то есть произвольное множество A ⊆ Q, удовлетворяющее условиям (i)—(iii) теоремы
1.1.14.
Теорема 1.1.15. Если A – дедекиндово сечение, то справедливо утверждение, двойственное (1.1.120):

∀z ∀y z>y∈
/A =⇒ z∈
/ A, (1.1.122)
Доказательство. Предположим, что z > y ∈ / A, но z ∈ A. Тогда мы получим y < z ∈ A, и
по условию (1.1.120) это означает, что y ∈ A. Это противоречит исходному предположению, что
y∈/ A.

Отношение порядка и алгебраические операции в R. Определим на R отношение порядка

A6B ⇐⇒ A⊆B (1.1.123)

и отношение строгого порядка


A<B ⇐⇒ A⊂B (1.1.124)
(отношения ⊆ и ⊂ были определены на с.30).
92 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

Теорема 1.1.16. Отношение < на множестве R дедекиндовых сечений множества Q обладает


следующими свойствами:
(i) линейность: для любых сечений A и B либо A = B, либо A < B, либо B < A.
(ii) транзитивность: для любых сечений A, B, C

A<B<C =⇒ A < C. (1.1.125)

Доказательство. 1. Свойство (i) можно проще записать формулой

A 6= B & A <
/ B =⇒ B < A,

которая доказывается цепочкой

A 6= B & A <
/ B =⇒ A 6= B & ¬(A 6= B & A ⊆ B) =⇒ A 6= B & (A = B ∨ A ⊆
/ B) =⇒
=⇒ A⊆
/ B =⇒ A \ B 6= ∅ =⇒ ∃a ∈ A |a ∈
/ B}
{z
⇓ (1.1.115)
∀b ∈ B b < a
| {z }
⇓ (1.1.120)
∀b ∈ B b ∈ A

B⊆A
| {z }

B⊂A

2. Свойство (ii) вытекает сразу из определения отношения <.

Лемма 1.1.17. Если A > (0), то найдется a ∈ A такой что a > 0.

Доказательство. Если A > (0), то (0) ⊆ A и (0) 6= A. Значит, найдется число x ∈ A \ (0). Условие
x∈/ (0) означает, что x > 0. Воспользуемся теперь условием (1.1.121) и подберем a ∈ A так, чтобы
x < a. Тогда мы получим 0 6 x < a ∈ A, и отсюда 0 < a ∈ A.

Лемма 1.1.18. Для всякого сечения A и любого числа q ∈ Q, q > 0, найдется такое число a ∈ A
и такое число r ∈ Q, r > 0, что
a∈ A & a+q−r ∈ /A (1.1.126)

Доказательство. Зафиксируем b ∈ A и рассмотрим последовательность

xn = b + q · n.

Предположим, что все элементы этой последовательности лежат в A:

∀n ∈ N∗ xn = b + q · n ∈ A. (1.1.127)

Тогда если взять какой-нибудь элемент y ∈


/ A, то мы получим

∀n ∈ N∗ xn = b + q · n 6 y.

То есть
y−b
∀n ∈ N∗ n6 .
q
Это противоречит теореме 1.1.11. Значит, наше предположение (1.1.127) неверно, и выполняется
обратное:
∃n ∈ N∗ xn = b + q · n ∈
/ A. (1.1.128)
Рассмотрим множество M = {n ∈ N∗ : b + q · n ∈
/ A} и пусть m – его минимальный элемент4 , то
есть
b+q·m−q ∈A & b+q·m∈ / A. (1.1.129)
Рассмотрим два случая.
4 Напомним, что минимальный элемент ординала был определен на с.50.
§ 1. Явные конструкции числовых множеств 93

1. Если b + q · m — не минимальный элемент множества Q \ A, то есть существует x ∈ / A такой


что x < b + q · m, то мы полагаем a = b + q · m − q, r = b + q · m − x и тогда у нас получается:

a= b+q·m−q ∈ A & a + q − r = b + q · m − (b + q · m − x) = x ∈
/ A.

2. Если же b + q · m — минимальный элемент множества Q \ A, то есть для любого x ∈ / A


выполняется b + q · m 6 x, то мы полагаем a = b + q · m − 2q , r = q2 и тогда у нас получается:
q q q
a=b+q·m− ∈A & a+q−r = b+q·m+ − =b+q·m∈
/ A.
2 2 2

• Сумма сечений определяется равенством

A + B = {a + b; a ∈ A, b ∈ B} (1.1.130)

Теорема 1.1.19. Если A и B – сечения, то A + B – тоже сечение.


Доказательство. Надо проверить условия (i)-(iii) теоремы 1.1.14.
1. Прежде всего, A + B 6= ∅, потому что

A 6= ∅ & B 6= ∅ =⇒ ∃a ∈ A & ∃b ∈ B =⇒ ∃a + b ∈ A + B.

С другой стороны, A + B 6= Q, потому что

A 6= Q & B 6= Q =⇒ ∃x ∈ / A & ∃y ∈
/ B =⇒
=⇒ ∃x ∈ Q (∀a ∈ A a < x) & ∃y ∈ Q (∀b ∈ B b < y) =⇒
=⇒ ∃x, y ∈ Q ∀a ∈ A ∀b ∈ B a+b<x+y =⇒ A + B 6= Q.

2. Пусть z < c ∈ A + B, то есть z < a + b, где a ∈ A и b ∈ B. Положим t = z − b. Тогда

t<a∈A =⇒ t∈A =⇒ z = t + b ∈A+B


A B

3. Если z ∈ A+B, то z = x+y для некоторых x ∈ A и y ∈ B. Для них, воспользовавшись (1.1.121),


можно подобрать a и b такие что x < a ∈ A и y < b ∈ B, и мы получим z = x + y < a + b ∈ A + B.
• Противоположное сечение к сечению A определяется равенством:

−A = {x ∈ Q : ∃y ∈ Q y > 0 & − x − y ∈
/ A} (1.1.131)

Теорема 1.1.20. Если A – сечение, то −A – тоже сечение.


Доказательство. Надо проверить условия (i)-(iii) теоремы 1.1.14.
1. Прежде всего, из A 6= Q следует, что существует z ∈
/ A. Положим x = −z − 1, тогда −x− 1 ∈
/ A.
Поскольку 0 < 1 ∈ Q, это означает, что x ∈ −A. Поэтому мы можем сделать вывод, что −A 6= ∅.
С другой стороны, A 6= ∅, потому существует a ∈ A. Положим x = −a, тогда −x = a ∈ A, и
поэтому для всякого y > 0 мы получим
(1.1.120)
−x − y = a − y < a ∈ A =⇒ −x − y ∈ A

/ −A. Мы можем таким образом заключить, что −A 6= Q.


Это верно для любого y > 0, поэтому x ∈
2. Пусть x < b ∈ −A. Условие b ∈ −A означает, что −b − y ∈
/ A для некоторого y > 0. Теперь мы
получаем:
(1.1.122)
−x > −b =⇒ −x − y > −b − y ∈
/A =⇒ −x − y ∈
/A =⇒ x ∈ −A.

/ A для некоторого y > 0. Тогда, положив b = x + y2 = x + y · 2−1 ,


3. Пусть x ∈ −A, то есть −x − y ∈
мы получим, с одной стороны,
y
x < x + = b,
2
а, с другой,
y
−b − = −x − y ∈ / A =⇒ b ∈ −A.
2
94 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

• Произведение сечений определяется сначала для неотрицательных сечений


(0) < A & (0) < B =⇒ A · B = {x ∈ Q : ∃a ∈ A ∃b ∈ B a > & b > 0 & x 6 a · b},
(1.1.132)
а после этого для остальных сечений:


 (−A) · (−B), A < (0) & B < (0)

 −((−A) · B), A < (0) < B
A·B = (1.1.133)

 −(A · (−B)), B < (0) < A


(0), A = (0) ∨ B = (0)
Теорема 1.1.21. Если A и B – сечения, то A · B – тоже сечение.
Доказательство. Здесь, как и раньше проверяются условия (i)-(iii) теоремы 1.1.14. В силу (1.1.133),
нам достаточно рассмотреть случай A > (0) и B > (0).
1. Из A > (0) по лемме 1.1.17 следует, что существует a ∈ A такой что a > 0. По той же причине
из B > (0) следует, что существует b ∈ B такой что b > 0. В силу (1.1.98), 0 < a · b. Значит, в силу
(1.1.132), 0 ∈ A · B. Из этого мы делаем вывод, что A · B 6= ∅.
Далее, из A 6= Q следует, что существует x ∈/ A. По той же причине, существует y ∈/ B. Покажем,
что
x·y ∈/ A · B. (1.1.134)
Предположим, что это не так:
x · y ∈ A · B. (1.1.135)
Тогда существуют a ∈ A и b ∈ B такие, что a > 0, b > 0 и
x·y 6a·b (1.1.136)
Но из a ∈ A и x ∈
/ A следует
a < x.
А из b ∈ B и y ∈
/ B следует
b < y.
Добавив условия a > 0, b > 0, мы получим
0 < a < x & 0 < b < y.
откуда, в силу (1.1.99),
0 < a · b < x · y.
Это противоречит условию (1.1.136), и значит, наше предположение (1.1.135) также неверно. То
есть верно (1.1.134), и поэтому A · B 6= Q.
2. Пусть z 6 c ∈ A · B. Из c ∈ A · B следует, что существуют a ∈ A и b ∈ B такие, что a > 0, b > 0
и c 6 a · b. Применяя (1.1.94), получаем z 6 a · b, что в силу (1.1.132) дает z ∈ A · B.
3. Пусть z ∈ A · B. В силу (1.1.132) это означает, что существуют x ∈ A и y ∈ B такие, что x > 0,
y > 0 и z 6 x · y. Воспользуемся (1.1.121) и подберем a и b так, чтобы x < a ∈ A и y < b ∈ B. Тогда
0<x<a&0<y<b =⇒ 0<x·y <a·b =⇒ z 6 x · y < a · b.
Положив c = a · b, мы в силу (1.1.132), получим z < c ∈ A · B.
• Обратное сечение A−1 определяется правилом
(
−1 {x ∈ Q : x 6 0 ∨ ∃y ∈ Q y > 0 & x−1 − y ∈
/ A}, A > (0)
A = −1
(1.1.137)
−((−A) ), A < (0)

Лемма 1.1.22. Если A > (0), то A−1 > (0).


Доказательство. По лемме 1.1.17 найдется a ∈ A такой, что a > 0. Выберем какой-ниюудь z ∈
/ A.
Поскольку 0 < a < z, мы получаем, что 0 < z. Положим c = (z + 1)−1 . Тогда
c−1 − 1 = (z + 1) − 1 = z ∈
/A =⇒ c ∈ A−1 .
При этом,
z>0 =⇒ c = (z + 1)−1 > 0.
§ 1. Явные конструкции числовых множеств 95

Теорема 1.1.23. Если A – сечение, то A−1 – тоже сечение.


Доказательство. Здесь, как и раньше проверяются условия (i)-(iii) теоремы 1.1.14. При этом до-
статочно рассмотреть случай A > (0).
/ A. Выберем произволный x ∈ Q так чтобы x−1 > p. Тогда мы
1. Из A 6= Q следует, что ∃p ∈
получим, что
(1.1.122) (1.1.137)
∃y > 0 x−1 − y > p ∈
/A =⇒ x−1 − y ∈
/A =⇒ x ∈ A−1 =⇒ A−1 6= ∅.

С другой стороны, из леммы 1.1.17 следует, что существует a ∈ A такой что a > 0. Воспользуемся
(1.1.102) м выберем x так, чтобы 0 < x1 < a. Тогда для всякого y > 0 мы получим

1 1
−y <a∈A =⇒ −y ∈A =⇒ / A−1
x∈ =⇒ A−1 6= ∅.
x x
2. Пусть x < b ∈ A−1 . Если x 6 0, то по формуле (1.1.137) мы сразу получаем, что x ∈ A−1 .
Поэтому для нас важен случай x > 0. Тогда возникает система импликаций

0 < x < b ∈ A−1 =⇒ 0 < b ∈ A−1 =⇒ ∃y > 0 b−1 − y ∈ /A


⇓ ⇓
0<x<b =⇒ x−1 > b−1 =⇒ ∃y > 0 x−1 − y > b−1 − y ∈/A
⇓ (1.1.122)
∃y > 0 x−1 − y ∈ /A
⇓ (1.1.137)
x ∈ A−1 .

3. Пусть x ∈ A−1 . Снова рассмотрим два случая. Если x 6 0, то, по лемме 1.1.22, A−1 > 0,
поэтому по лемме 1.1.17 существует c ∈ A−1 такой что c > 0, и мы получаем x 6 0 < c ∈ A−1 . Если
же x > 0, то условие x ∈ A−1 означает, что существует y > 0 такой что x−1 − y ∈/ A. Это число y
можно при необходимости уменьшить, чтобы 0 < y < x−1 . Зафиксируем такой y и выберем a так,
чтобы
y
a−1 = x−1 − .
2
Тогда
y (1.1.122)
a−1 − = x−1 − y ∈ /A =⇒ a ∈ A−1 .
2
С другой стороны,
y
a−1 = x−1 − =⇒ a−1 < x−1
2
и
y y
0 < y < x−1 =⇒ a−1 = x−1 − > > 0 =⇒ a−1 > 0
2 2
и поэтому
0 < a−1 < x−1 =⇒ 0 < x < a.

Теорема 1.1.24. Отношение 6 и операции + и · на множестве R дедекиндовых сечений множе-


ства Q обладают свойствами

A+B =B+A (1.1.138)


(A + B) + C = A + (B + C) (1.1.139)
A + (0) = A (1.1.140)
A + (−A) = (0) (1.1.141)
− (−A) = A (1.1.142)
− (A + B) = (−A) + (−B) (1.1.143)
A > (0) ⇐⇒ −A < (0) (1.1.144)
A < (0) ⇐⇒ −A > (0) (1.1.145)
A > (0) & B > (0) =⇒ A · B > (0) (1.1.146)
A < (0) < B =⇒ A · B < (0) (1.1.147)
A < (0) & B < (0) =⇒ A · B > (0) (1.1.148)
96 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

A6B =⇒ ∀C A+C 6B +C (1.1.149)


(−A) · B = −(A · B) (1.1.150)
A·B = B·A (1.1.151)
(A · B) · C = A · (B · C) (1.1.152)
A · (1) = A (1.1.153)
−1
A·A = (1), A 6= (0) (1.1.154)
(A + B) · C = A · C + B · C (1.1.155)

Доказательство. 1. Тождество (1.1.138):

A + B = (1.1.130) = {a + b; a ∈ A, b ∈ B} = {b + a; a ∈ A, b ∈ B} = (1.1.130) = B + A.

2. Тождество (1.1.139):

(A + B) + C = {a + b; a ∈ A, b ∈ B} + C = {(a + b) + c; a ∈ A, b ∈ B, c ∈ C} =
= {a + (b + c); a ∈ A, b ∈ B, c ∈ C} = A + {b + c; b ∈ B, c ∈ C} = A + (B + C).

3. Тождество (1.1.140):

A + (0) = {a + b; a ∈ A, b ∈ (0)} = {a + b; a ∈ A, b < 0} = A

4. Тождество (1.1.141) доказывается так. Пусть сначала z ∈ A + (−A). Это значит, что z = a + x
для некоторых a ∈ A и x ∈ −A. Второе означает, что −x − y ∈ / A для некоторого y > 0. Поскольку
a ∈ A и −x − y ∈
/ A, мы получаем цепочку

a < −x − y =⇒ a + x < −y < 0 =⇒ z = a + x ∈ (0).

Это доказывает включение A + (−A) ⊆ (0). Наоборот, пусть z ∈ (0), то есть z < 0. Воспользуемся
леммой 1.1.18 и выберем a ∈ A так, чтобы для некоторого r > 0 выполнялось

a−z−r ∈
/ A.

Тогда если взять x = z − a, то мы получим, во-первых,

−x − r = a − z − r ∈
/A =⇒ x ∈ −A,

и, во-вторых,
z = a + x ∈ A + (−A).
Это доказывает включение (0) ⊆ A + (−A).
5. Тождество (1.1.143). Сначала система импликаций

z ∈ (−A) + (−B) =⇒ ∃x ∈ −A ∃y ∈ −B z =x+y =⇒


=⇒ ∃x ∃y ∃p > 0 ∃q > 0 −x − p ∈
/A & −y − q ∈
/B & z =x+y
| {z } | {z }
⇓ ⇓
∀a ∈ A − x − p > a ∀b ∈ B − y − q > b
| {z }

∀a ∈ A ∀b ∈ B − z − p − q = −x − p − y − q > a + b

−z − p − q ∈/ A+B

z ∈ −(A + B)

– доказывает включение
(−A) + (−B) ⊆ −(A + B).
А затем обратное включение
−(A + B) ⊆ (−A) + (−B) (1.1.156)
– доказывается следующими рассуждениями. Пусть z ∈ −(A + B), то есть

−z − r ∈
/ A+B (1.1.157)
§ 1. Явные конструкции числовых множеств 97

для некоторого r > 0. Воспользуемся леммой 1.1.18 и подберем a′ ∈ A так, чтобы


r
a′ + −s∈
/ A, (1.1.158)
2
для некоторого s > 0. Положим
r
x = −a′ −
2
Тогда условие (1.1.158) будет означать, что

x ∈ −A.

Обозначим
y = −z − x.
Условие (1.1.157) можно переписать так:

∀a ∈ A ∀b ∈ B a + b < −z − r.

Если вместо a подставить a′ , то мы получим цепочку:


r r r
∀b ∈ B a′ + b < −z − r =⇒ ∀b ∈ B b < −z − a′ − r = −z −a′ − − = y − =⇒
2
| {z } 2 2
k
−x
r
=⇒ y− ∈
/B =⇒ y ∈ −B.
2
Это доказывает (1.1.156).
6. Тождество (1.1.142) доказывается цепочкой

x ∈ −(−A) ⇐⇒ ∃y > 0 −x−y ∈


/ −A ⇐⇒
(1.1.120),(1.1.121)
⇐⇒ ∃y > 0 ∀z > 0 x + y − z ∈ A ⇐⇒ x∈A

7. Свойство (1.1.144) доказывается цепочкой

− A < (0) ⇐⇒ ∃z < 0 z∈


/ −A ⇐⇒ ∃z < 0 ∀y > 0 − z − y ∈ A ⇐⇒
⇐⇒ ∃x > 0 ∀y > 0 x − y ∈ A ⇐⇒ ∃x > 0 x ∈ A ⇐⇒ A > (0).

8. Свойство (1.1.145) следует из (1.1.144) и (1.1.142).


9. Свойство (1.1.146):
   
A > (0) & B > (0) =⇒ ∃a ∈ A a > 0 & ∃b ∈ B b>0 ⇐⇒
⇐⇒ ∃a ∈ A ∃b ∈ B 0<a·b =⇒ 0∈A·B =⇒ A · B > (0)

10. Свойство (1.1.147):

(1.1.145) (1.1.146)
A < (0) < B =⇒ −A > (0) & B > (0) =⇒
(1.1.144)
=⇒ (−A) · B > (0) =⇒ A · B = (1.1.133) = −((−A) · B) < (0)

11. Свойство (1.1.148) доказывается по аналогии с (1.1.147).


12. Свойство (1.1.149):

(1.1.123) (1.1.146)
A6B =⇒ A⊆B =⇒
=⇒ A + C = {a + c; a ∈ A, c ∈ C} ⊆ {b + c; b ∈ B, c ∈ C} = B + C

13. Для доказательства (1.1.150) нужно рассмотреть несколько случаев. Если A > (0) и B > (0),
то
(−A) ·B = (1.1.133) = −((−(−A)) · B) = (1.1.142) = −(A · B).
| {z }
>

(1.1.144)
0
98 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

Если A < (0) и B < (0), то

(−A) ·B = (1.1.133) = −((−A) · (−B)) = (1.1.133) = −(A · B).


| {z }

>
0

<
(1.1.145)
0

И так же для остальных случаев.


14. Для (1.1.151) нужно рассмотреть несколько случаев. Если A > (0) и B > (0), то

A · B = (1.1.132) = {x ∈ Q : ∃a ∈ A ∃b ∈ B a > 0 & b > 0 & x 6 a · b} =


= {x ∈ Q : ∃a ∈ A ∃b ∈ B a > 0 & b > 0 & x 6 b · a} = (1.1.132) = B · A.

Если (0) > A и (0) > B, то

A · B = (1.1.133) = (−A) · (−B) = (уже доказано) = (−B) · (−A) = (1.1.133) = B · A.

Если A < (0) < B, то

A · B = (1.1.133) = −((−A) · B) = (уже доказано) = −(B · (−A)) = (1.1.133) = B · A.

Если B < (0) < A, то

A · B = (1.1.133) = −(A · (−B)) = (уже доказано) = −((−B) · A) = (1.1.133) = B · A.

Если A = (0) или B = (0), то

A · B = (1.1.133) = (0) = (1.1.133) = B · A.

15. Тем же приемом доказывается тождество (1.1.152). Если A > (0), B > (0) и C > (0), то

(A · B) · C = (1.1.132) = {x ∈ Q : ∃y ∈ A · B ∃c ∈ C y > 0 & c > 0 & x 6 y · c} =


= (1.1.132) = {x ∈ Q : ∃a ∈ A ∃b ∈ B ∃c ∈ C a > 0 & b > 0 & c > 0 & x 6 (a · b) · c} =
= {x ∈ Q : ∃a ∈ A ∃b ∈ B ∃c ∈ C a > 0 & b > 0 & c > 0 & x 6 a · (b · c)} = (1.1.132) =
= {x ∈ Q : ∃a ∈ A ∃z ∈ B · C a > 0 & z > 0 & x 6 a · z} = (1.1.132) = A · (B · C).

Остальные варианты рассматриваются так же как при доказательстве (1.1.151). Например, для
A < (0) < B и C > (0) получаем:

(A · B ) · C = (1.1.133) = (−((−A) · B)) · C = (1.1.150) = −(((−A) · B) · C) =


| {z }
>

<

0 0
>

(1.1.144),(1.1.146)
0

= (уже доказано) = −((−A) · (B · C)) = (1.1.133) = A · (B · C) .


| {z } | {z }
>

0
<

<

(1.1.146)
0 0

16. Тождество (1.1.153). Пусть сначала A > (0). Тогда, прежде всего,

x ∈ A · (1) =⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x < a · b =⇒


=⇒ ∃a ∈ A ∃b a > 0 & 0 < b < 1 & x < a · b < (1.1.99) < a · 1 = (1.1.86) = a =⇒
(1.1.120)
=⇒ ∃a ∈ A x<a =⇒ x ∈ A,

и это доказывает включение


A · (1) ⊆ A
Докажем далее обратное включение. Пусть x ∈ A. Если x 6 0, то выбрав произвольные a ∈ A, a > 0
и b ∈ (1), b > 0, мы получим
x 6 0 < a · b,
и это означает, что x ∈ A · (1). Поэтому важен более сложный случай, когда x > 0. Для него мы
получим:
§ 1. Явные конструкции числовых множеств 99

(1.1.100) (1.1.102)
x∈A =⇒ ∃a ∈ A a > 0 & x < a =⇒ ∃a ∈ A a > 0 & x · a−1 < a · a−1 = 1 =⇒
(1.1.102)
=⇒ ∃a ∈ A ∃b a>0& x a−1} < b < 1
| ·{z =⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x·a−1 < b =⇒

<
0

=⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x = x · a−1 · a < b · a = a · b =⇒


=⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x < a · b =⇒ x ∈ A · (1).

Это доказывает включение


A ⊆ A · (1),
и, вместе с ним, равенство (1.1.153) для случая A > (0). Теперь если A < (0), то мы получаем

A · (1) = (1.1.133) = −((−A) · (1)) = (уже доказано) = −(−A) = (1.1.142) = A.

А если A = (0), то
A · (1) = (0) · (1) = (1.1.133) = (0) = A.
17. Тождество (1.1.154). Пусть сначала A > (0). Тогда по лемме 1.1.22, A−1 > (0), и мы, прежде
всего, получаем цепочку

(1.1.137)
x ∈ A · A−1 =⇒ ∃a ∈ A ∃b ∈ A−1 a > 0 & b > 0 & x < a · b =⇒
=⇒ ∃a > 0 ∃b > 0 ∃y > 0 a ∈ A & b−1 − y ∈
/ A & x<a·b =⇒ x<1 =⇒ x ∈ (1),
| {z }

a < b−1 − y

a · b < (b−1 − y) · b = 1 − y · b < 1
| {z }

x<a·b<1

доказывающую включение
A · A−1 ⊆ (1).
Чтобы доказать обратное включение,
(1) ⊆ A · A−1 , (1.1.159)
зафиксируем x ∈ (1), то есть x < 1. Если x 6 0, то мы сразу можем выбрать a ∈ A, a > 0, и b ∈ A−1 ,
b > 0, для которых получится

x 60 <a·b =⇒ x ∈ x ∈ A · A−1 .

Поэтому важнен немного более сложный случай 0 < x < 1. Для него по формуле (1.1.101), x−1 > 1,
поэтому положив p = 1 − x−1 , мы получим

x−1 = 1 + p, p>0 (1.1.160)

Поскольку a · p > 0, по лемме 1.1.18 существуют r > 0 и a ∈ A такие, что

a∈ A & a+a·p−r ∈
/A

Положив c = x · a−1 , мы получим

c−1 − r = a · x−1 − r = a · (1 + p) − r = a + a · p − r ∈
/A =⇒ c ∈ A−1 .

Теперь если мы возьмем какое-нибудь b ∈ A−1 так, чтобы c < b, мы получим:

x = a · b < (1.1.100) < a · c =⇒ x ∈ A · A−1 .

Это доказывает включение (1.1.159), и вместе с ним, формулу (1.1.154) для случая A > (0). Случай
A < (0) будет его следствием:

A · A−1 = (1.1.133) = (−A) · (−(A−1 )) = (1.1.137) =


= (−A) · (−(−(−A)−1 )) = (1.1.142) = (−A) · (−A)−1 = (уже доказано) = (1).
100 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

18. В тождестве (1.1.155) сначала мы предполагаем, что A + B > (0) и C > (0). Тогда

x ∈ (A + B) · C ⇐⇒ ∃y ∈ A + B ∃c ∈ C x6y·c ⇐⇒
⇐⇒ ∃a ∈ A ∃b ∈ B ∃c ∈ C x 6 (a + b) · c = |{z} b·c ∈ A·C +B·C
a · c + |{z} ⇐⇒


A·C B·C

⇐⇒ x∈ A·C +B·C

После этого рассматриваются остальные случаи. Например, при A + B < (0) и C > (0) мы получаем

(A + B) · C = (1.1.133) = −((−(A + B)) · C) = (1.1.143) = −(((−A) + (−B)) · C) = (уже доказано) =


= −((−A) · C + (−B) · C) = (1.1.143) = (−(−A) · C) + (−(−B) · C) = (1.1.150) =
= (−(−A)) · C + (−(−B)) · C = (1.1.142) = A · C + B · C.

Случаи A + B > (0) & C < (0) и A + B < (0) & C < (0) рассматриваются так же. Случай C = (0)
тоже очевиден. Остается случай A + B = (0), то есть B = (−A). Для него мы получаем

(A+B)·C = (0)·C = (1.1.133) = (0) = A·C+(−(A·C)) = (1.1.150) = A·C+((−A)·C) = A·C+B·C.

Теорема 1.1.25 (Р. Дедекинд). Пусть X и Y – два непустых множества в R, причем

∀A ∈ X ∀B ∈ Y A 6 B. (1.1.161)

Тогда найдется сечение C ∈ R такое что

∀A ∈ X ∀B ∈ Y A 6 C 6 B. (1.1.162)

Доказательство. Положим [
C = ∪X = A.
A∈X

1. Проверим сначала, что C — сечение. Прежде всего, поскольку множество X непусто, найдется
A ∈ X, и поскольку A – сечение, это множество тоже должно быть непусто. Мы получаем, что

∅ 6= A ⊆ C =⇒ C 6= ∅.

С другой стороны, поскольку Y непусто, найдется B ∈ Y , и для него будет справедливо неравенство
A 6 B, при любом A ∈ X. Это означает, что все элементы A ∈ X содержатся в B, и мы получаем
цепочку5 [
∀A ∈ X A ⊆ B =⇒ C = A ⊆ B ⊂ Q =⇒ C 6= Q.
A∈X

Свойство (1.1.120) для C доказывается цепочкой


[ A∈R A⊆C
x<a∈C = A =⇒ ∃A ∈ X x<a∈A =⇒ ∃A ∈ X x∈A =⇒ x∈C
A∈X

А свойство (1.1.121) — цепочкой


[ A∈R A⊆C
x∈C = A =⇒ ∃A ∈ X x∈A =⇒ ∃A ∈ X ∃a ∈ A x < a ∈ A =⇒ x<a∈C
A∈X

2. После этого остается убедиться, что справедливо условие (1.1.162). Первое неравенство в нем,

∀A ∈ X A 6 C,

эквивалентно включению
∀A ∈ X A ⊆ C,
5 Напомним, что отношение M ⊂ N было определено на с.30 и означает, что M ⊆ N и M 6= N .
§ 1. Явные конструкции числовых множеств 101
S
справедливому, потому что C = A∈X A. А второе неравенство

∀B ∈ Y C 6 B,

эквивалентно включению
∀B ∈ Y C ⊆ B,

которое доказывается цепочкой


[
∀A ∈ X A6B =⇒ ∀A ∈ X A⊆B =⇒ C= A ⊆ B.
A∈X

Вложение Q в R. Напомним, что в примере 1.1.12 мы всякому рациональному числу a ∈ Q


поставили в соответствие два множества в Q

(a) = {x ∈ Q : x < a}, (a)′ = {x ∈ Q : a 6 x},

образующие в паре дедекиндово сечение ((a), (a)′ ). Возникающее отображение

υ(a) = (a), a ∈ Q. (1.1.163)

(в котором (a) есть левая компонента дедекиндова сечения, которую мы в соответствии с согла-
шением на с.91, отождествляем со всем дедекиндовым сечением ((a), (a)′ )) переводит множество
рациональных чисел Q в множество вещественных чисел R.

Теорема 1.1.26. Отображение υ : Q → R инъективно

a 6= b ⇒ υ(a) 6= υ(b) (1.1.164)

сохраняет порядок
a6b ⇒ υ(a) 6 υ(b) (1.1.165)

нуль
υ(0) = 0 (1.1.166)

единицу
υ(1) = 1 (1.1.167)

сумму
υ(a + b) = υ(a) + υ(b) (1.1.168)

и умножение
υ(a · b) = υ(a) · υ(b) (1.1.169)

Теорема 1.1.26 позволяет отождествить Q с подмножеством υ(Q) множества R, потому что с


точки зрения свойств операций +, · и отношения 6 между Q и υ(Q) разницы нет: все, что можно
доказать об этих операциях и об этом отношении в Q, можно доказать о них и в υ(Q), и наоборот.
Отождествление Q и υ(Q) естественно понимать просто как равенство

a = (a) , a ∈ Q. (1.1.170)
|{z}

Q

В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них рационально, а другое вещественно:

a + B = (a) + B, a ∈ Q, B ∈ R (1.1.171)
a · B = (a) · B, a ∈ Q, B ∈ R. (1.1.172)
102 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

(e) Комплексные числа C.


Для полноты картины в этих построениях желательно привести конструкцию комплексного числа.
Вот она.
• Комплексным числом называется произвольная упорядоченная пара6 (x, y) вещественных
чисел x, y ∈ R.
Из этого определения следует, что множество всех комплексных чисел представляет собой просто
декартов квадрат7 множества R вещественных чисел. Его принято обозначать символом C:

C = R × R. (1.1.173)

Для комплексного числа (x, y) ∈ C его первая компонента, то есть вещественное число x, называ-
ется вещесвенной частью, а вторая компонента, то есть вещественное число y, называется мнимой
частью (при этом оба числа x и y по-прежнему вещественные).

Алгебраические операции в C.
• Суммой комплексных чисел (x, y) и (x′ , y ′ ) называется комплексное число

(x, y) + (x′ , y ′ ) = (x + x′ , y + y ′ ). (1.1.174)

• Произведением комплексных чисел (a, b) и (x, y) называется комплексное число

(x, y) · (x′ , y ′ ) = (x · x′ − y · y ′ , x · y ′ + y · x′ ). (1.1.175)

Свойства алгебраических операций с комплексными числами


C1. Коммутативность сложения: для любых комплексных чисел a и b выполняется равен-
ство
a+b=b+a (1.1.176)
C2. Ассоциативность сложения: для любых комплексных чисел a, b и c выполняется ра-
венство
(a + b) + c = a + (b + c) (1.1.177)
C3. Коммутативность умножения: для любых комплексных чисел a и b выполняется ра-
венство
a·b=b·a (1.1.178)
C4. Ассоциативность умножения: для любых комплексных чисел a и b выполняется ра-
венство
(a · b) · c = a · (b · c) (1.1.179)
C5. Дистрибутивность: для любых комплексных чисел a, b, c выполняется равенство

(a + b) · c = a · c + b · c (1.1.180)

C6. Существование нуля: существует единственное комплексное число 0 такое, что

a + 0 = a. (1.1.181)

Таким числом будет


0 = (0, 0) (1.1.182)
C7. Существование противоположного числа: для любого комплексного числа a суще-
ствует единственное комплексное число −a (называемое противоположным числом к чис-
лу a), такое что
a + (−a) = 0 (1.1.183)
Для a = (x, y) противоположным числом будет

−a = −(x, y) = (−x, −y). (1.1.184)


6 Напомним, что понятие упорядоченной пары было введено нами на с.37.
7 Понятие декартова квадрата было определено на с.38.
§ 1. Явные конструкции числовых множеств 103

C8. Существование единицы: существует единственное комплексное число 1 6= 0 такое,


что для любого комплексного числа a 6= 0 справедливо равенство

a · 1 = a. (1.1.185)

Таким числом будет


1 = (1, 0) (1.1.186)

C9. Существование обратного числа: для любого комплексного числа a 6= 0 существует


единственное комплексное число a−1 (называемое обратным числом к числу a), такое что

a · a−1 = 1. (1.1.187)

Для a = (x, y) 6= 0 противоположным числом будет


 
−1 −1 x −y
a = (x, y) = , . (1.1.188)
x2 + y 2 x2 + y 2

Вложение R в C. Множество R вещественных чисел естественно вкладывается в множество C


комплексных чисел отображением
η(t) = (t, 0), t ∈ R. (1.1.189)

Теорема 1.1.27. Отображение η : R → C инъективно

s 6= t ⇒ υ(s) 6= υ(t) (1.1.190)

сохраняет нуль
υ(0) = 0 (1.1.191)

единицу
υ(1) = 1 (1.1.192)

сумму
υ(s + t) = υ(s) + υ(t) (1.1.193)

и умножение
υ(s · t) = υ(s) · υ(t) (1.1.194)

Теорема 1.1.27 позволяет отождествить R с подмножеством η(R) = {(t, 0); t ∈ R} ⊆ C множества


C, потому что с точки зрения свойств операций + и · между R и η(R) разницы нет: все, что можно
доказать об этих операциях в R, можно доказать о них и в η(R), и наоборот. Правда, еще один
важный структурный элемент теории вещественных чисел, отношение порядка 6, не переходит при
отображении η в какое-то естественное бинарное отношение в множестве C (просто потому что в C
не принято рассматривать какое-то отношение порядка 6). Однако эта проблема разрешается тем,
что η сохраняет естественную топологию между R и η(R) (более точно, является гомеоморфизмом
между R и η(R)), но обсуждение этих деталей нам придется отложить до примера 15.2.6 главы 15.
Отождествление R и η(R) = {(t, 0); t ∈ R} ⊆ C естественно понимать просто как равенство

t = (t, 0), t ∈ R. (1.1.195)


| {z }

R

В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них вещественно, а другое комплексно:

t + (x, y) = (t, 0) + (x, y) = (t + x, y), t ∈ R, (x, y) ∈ C (1.1.196)


t · (x, y) = (t, 0) · (x, y) = (t · x, t · y), t ∈ R, (x, y) ∈ C. (1.1.197)
104 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ

Мнимая единица и алгебраическая запись комплексного числа. Мнимой единицей назы-


вается комплексное число
i = (0, 1). (1.1.198)

Свойства мнимой единицы


i1. Мнимая единица i удовлетворяет равенству

i2 = −1. (1.1.199)

i2. Всякое комплексное число a ∈ C единственным образом представимо в виде линейной


комбинации единицы 1 = (1, 0) и мнимой единицы i = (0, 1) с вещественными коэффици-
ентами8 :
a = x · 1 + y · i, x, y ∈ R. (1.1.200)
Точнее, коэффициентами x и y в этом разложении будут вещественная и мнимая ча-
сти комплексного числа a:

(x, y) = x · 1 + y · i, x, y ∈ R. (1.1.201)

Доказательство. По определению умножения в C,

i2 = i·i = (0, 1)·(0, 1) = (1.1.175) = (0·0−1·1, 0·1+1·0) = (−1, 0) = (1.1.184) = −(1, 0) = (1.1.186) = −1.

В формуле (1.1.200) первое слагаемое интерпретируется как умножение вещественного числа


x ∈ R на комплексное число 1 = (1, 0) ∈ C, поэтому по правилам (1.1.197) и (1.1.195), оно совпадает
с x:
x · 1 = x · (1, 0) = (1.1.197) = (x · 1, x · 0) = (x, 0) = (1.1.195) = x.
Это позволяет переписать формулу (1.1.200) в виде, который обычно называется алгебраической
записью комплексного числа:
a = x + y · i, x, y ∈ R. (1.1.202)
Важное следствие всех этих наблюдений состоит в том, что формула (1.1.199) и тождество
(1.1.202) позволяют забыть об определении суммы и произведения в C в виде тождеств (1.1.174)
и (1.1.175), заменив их стандартными манипуляциям над алгебраическими выражениями. А имен-
но, для двух комплексных чисел

(x, y) = x + y · i, (x′ , y ′ ) = x′ + y ′ · i

их сумму можно вычислить как результат применения законов коммутативности, ассоциативности


и дистрибутивности (справедливых во всех числовых системах из рассматренных нами до сих пор),

(x, y)+(x′ , y ′ ) = (x+y·i)+(x′ +y ′ ·i) = x+(y·i+(x′ +y ′ ·i)) = x+((y·i+x′ )+y ′ ·i) = x+((x′ +y·i)+y ′ ·i) =
= x + (x′ + (y · i + y ′ · i)) = (x + x′ ) + (y · i + y ′ · i) = (x + x′ ) + (y + y ′ ) · i = (1.1.202) = (x + x′ , y + y ′ ).

И точно так же вычисляется произведение:

(x, y) · (x′ , y ′ ) = (x + y · i) · (x′ + y ′ · i) = (x + y · i) · x′ + (x + y · i) · (y ′ · i) = x′ · (x + y · i) + (y ′ · i) · (x + y · i) =


= x′ ·x+x′ ·(y·i)+(y ′ ·i)·x+(y ′ ·i)·(y·i) = x·x′ +(y·x′ )·i+(x·y ′ )·i+y·y ′ ·i2 = x·x′ +(y·x′ +x·y ′ )·i−y·y ′ =
= (x · x′ − y · y ′ ) + (y · x′ + x · y ′ ) · i = (1.1.202) = (x · x′ − y · y ′ , y · x′ + x · y ′ ).

8 Здесь умножение вещественного числа на комплексное определено формулой (1.1.197).


Глава 2

МАТЕМАТИЧЕСКАЯ ЛОГИКА

Глядя на шаги, по которым в главе 0 строилась теория множеств, нетрудно представить, как из-
менение каких-то элементов этой конструкции приводит к построению других подобных теорий.
Например, можно менять аксиомы самой теории (если варьировать аксиомы MK-1 – MK-14, оставив
все остальные элементы неизменными, то будут получаться различные варианты теории множеств,
каковых много в математике). Точно так же можно менять язык теории (алфавит и сигнатуру), и
даже аксиомы логики и правила вывода (LK-0) – (LK-15)1 . При этом будут получаться конструк-
ции, называемые формальными теориями (или формальными системами, или теориями первого
порядка, и, понятно, что они могут сильно отличаться друг от друга).
Изучением таких теорий, построенных по примеру уже описанной нами теории множеств, зани-
мается наука, называемая математической логикой. В этой главе мы опишем основные ее выво-
ды, увиденные глазами сторонника гильбертовской философии формализма (в том смысле как мы
описали это на с.v). Выбранная нами в Предисловии цель избавления от замкнутых кругов в опре-
делениях (вместе с выбором исчисления секвенций LK в качестве аксиоматической системы логики)
ведет к картине, детали которой, как может заметить читатель, отличаются от традиционных. В
частности, под семантикой формальной теории T мы понимаем всевозможные представления этой
теории в виде дефинициальных расширений рабочей теории множеств (см. ниже результаты § 3).
Мы постараемся дать замкнутое изложение этой темы, однако часть утверждений — в нашем
тексте это главные технические результаты Геделя об арифметизации формальных теорий (ниже
это теоремы 2.2.11 и 2.2.12) — приходится все-таки (по традиции) формулировать без доказательств,
в силу их громоздкости.
Понятия и результаты этой главы будут полезны в главе 5 о стандартных функциях при объяс-
нении трудностей построения Исчисления (Calculus, см. с.351).

§1 Формальные теории
(a) Определение формальной теории
Формальная теория T над логикой предикатов состоит из языка теории, ее системы аксиом и
логического исчисления. Эти компоненты удобно описать одно за другим, обсуждая попутно кон-
струкции, которые понадобятся в самих этих описаниях и в дальнейшем при доказательстве утвер-
ждений. Язык формальной теории мы описываем на с.106, систему аксиом на с.111, а логическое
исчисление на с.111.

! 2.1.1. Мы предупредим только читателя с са- ной стороны, все реально используемые матема-
мого начала, что наше определение формальной тиками формальные теории, такие как рабочие
теории будет отличаться от общепринятого теории множеств ZF, NBG, MK, или арифметика
тем, что в нем мы под системой аксиом по- Пеано PA, содержатся в этом классе, а с другой —
нимаем конечный список аксиом или конечный все теории из этого класса рекурсивно аксиома-
список схем аксиом. Это делается для того, что- тизируемы, что позволяет избавиться от необхо-
бы упростить формулировки без существенного димости обсуждать этот нюанс в формулировках
сужения класса рассматриваемых теорий: с од- утверждений.
1 В качестве примера читатель может поглядеть на правила интуиционистской логики, которые мы приводим на

с.180.

105
106 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Язык формальной теории. Язык формальной теории (над логикой предикатов) представляет
из себя алфавит, сигнатуру и правила построения формул.

1. Алфавит A формальной теории T описывается указанием символов, которые называются пере-


менными данного языка. Эта часть конструкции считается произвольной, и, поскольку в этой
науке нам понадобится много разных букв вне алфавита, мы для удобства условимся использо-
вать более узкий алфавит, чем тот, что описывался на с.7 для построенного там варианта теории
множеств:
• Переменной в формальной теории мы будем считать произвольную строку символов, состав-
ленную по следующим правилам:
— всякая строчная буква латинского алфавита

a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,

является переменной,
— если x – переменная, то добавляя к ней штрих ′ мы получаем новую переменную:

x′ , x′′ , ...

2. Сигнатура формальной теории представляет собой список используемых в ней специальных


символов, не входящих в алфавит, которые делятся на константы, функциональные символы и
предикатные символы.
a. Константы (которые иногда также называют функциональными символами валентности
0) интуитивно представляют собой обозначения для элементов теории с некими специальны-
ми свойствами (как 0 и 1 в арифметике).
b. Функциональные символы интуитивно представляют собой обозначения для элементарных
операций в данном языке (как + и · в арифметике). Каждому функциональному символу F
приписывается конечный ординал n 6= ∅, называемый валентностью символа F , интуитив-
ный смысл которого – число переменных, необходимых для операции F .
c. Предикатные символы интутитивно представляют собой обозначения для элементарных вы-
сказываний об объектах (как символы ∈ и = в теории множеств). Как и в случае с функцио-
нальными символами, каждому предикатному символу P приписывается конечный ординал
n, называемый валентностью предиката P , и его интуитивный смысл – число переменных,
необходимых для высказывания P .

3. Далее вводится понятие терма, под которым понимается фрагмент формулы, составленный
посредством функциональных символов, без предикатных. Точное определение выглядит так:
термом называется произвольная строка символов, построенная по следующим правилам
— всякая переменная является термом,
— всякая константа (функциональный символ валентности 0) является термом,
— если τ1 , ..., τn – термы, и F – функциональный символ валентности n, то строка

F (τ1 , ..., τn ) (2.1.1)

– также терм. В частном случае, когда валентность F равна 2, принято для краткости вместо
(2.1.1) писать
τ1 F τ2
(как это делается в теории групп с символом умножения ·, см. ниже пример 2.1.17).
4. После этого формулой данного языка объявляется произвольная строка символов, построенная
по следующим правилам:
— если τ1 , ..., τn – термы, и P – предикатный символ валентности n, то строка

P (τ1 , ..., τn ) (2.1.2)


§ 1. Формальные теории 107

— формула. В частном случае, когда валентность P равна 2, принято для краткости вместо
(2.1.2) писать
τ1 P τ2
(как это делается в теории множеств с символом принадлежности ∈, см. (0.2.23));
— если строка ϕ – формула, то строка ¬ (ϕ) – тоже формула;
— если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:

(ϕ) & (ψ), (ϕ) ∨ (ψ), (ϕ) ⇒ (ψ),

— если x – переменная, а ϕ – формула, то следующие строки – тоже формулы:

∀x (ϕ), ∃x (ϕ). (2.1.3)

Как и раньше, для обозначения формул мы используем греческие буквы.


• Мы будем говорить, что формулы α и β равны, и изображать это записью

α = β, (2.1.4)

если α и β совпадают как строчки символов.


Для дальнейших объяснений нам понадобятся определения, аналогичные тем, что давались на
с.8 и 9.
• Формулы вида (2.1.2) называются атомарными.
• Вхождение переменной x в формулу ϕ называется связанным, если в этом вхождении x стоит
сразу после какого-то квантора, или попадает в область действия какого-то квантора по x.
В противном случае это вхождение называется свободным.
• Переменная x в формуле ϕ называется связанной переменной в ϕ, если все ее вхождения в
ϕ связаны. В противном случае x называется свободной переменной формулы ϕ.
• Если формула ϕ не содержит свободные переменные, то ϕ называется замкнутой. Если же
в ϕ имеются свободные переменные, то ϕ называется открытой формулой.
• Формула ϕ называется формулой в переменных x1 , ..., xn , если любая свободная переменная
в ϕ содержится в списке x1 , ..., xn (но необязательно, чтобы все x1 , ..., xn были свободными
переменными в ϕ).
• Валентностью терма τ называется число входящих в него переменных. Термы валентности
0 (то есть не содержащие переменных) называются замкнутыми термами теории T .
• Валентностью формулы ϕ называется число входящих в нее свободных переменных. Оче-
видно, что замкнутые формулы имеют валентность 0.

Переименования и подстановки.
• Говорят, что формула ψ получена из кванторной формулы ϕ = (∀x α) или ϕ = (∃x α)
глобальным переименованием связанной переменной x, если ψ получена из ϕ заменой
всех вхождений переменной x (и свободных, и связанных)2 на какую-нибудь новую пе-
ременную y, не входящую в ϕ (ни свободно, ни связанно)3 . Это оформляется записью


ψ = ϕ . (2.1.5)
x=y

• Говорят, что формула ψ получена из формулы ϕ переименованием связанных переменных,


если ψ получена из ϕ глобальным переименованием переменных в некоторых (возможно,
всех) кванторных подформулах ϕ.
• Формулы ϕ и ψ называются конгруэнтными, и обозначается это записью

ϕ∼
= ψ,

если ψ получено из ϕ переименованием связанных переменных.


2 Это условие обеспечивает симметричность операции глобального переименования переменных.
3 Это условие обеспечивает эквивалентность получаемых формул.
108 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Свойства отношения конгруэнтности:


1◦ Рефлексивность: всегда ϕ ∼
= ϕ.
2◦ Симметричность: если ϕ ∼ = ψ, то ψ ∼
= ϕ.
3◦ Транзитивность: если ϕ = χ и χ = ψ, то ϕ ∼
∼ ∼ = ψ.
Доказательство. Эти свойства очевидны, кроме второго. Пусть ϕ ∼ = ψ. Нам достаточно рассмот-
реть случай, когда ϕ — кванторная формула, например ∀x α, а ψ получена из нее глобальным
переименованием переменной x на некую новую переменную y, не входящую в ϕ ни свободно, ни
связанно. В этом случае формула ψ имеет вид ∀y β, где β получена из α заменой x на y во всех
вхождениях x, как свободных, так и связанных, причем переменная y не входит в α ни свободно,
ни связанно. Это значит, между прочим, что ψ не содержит x ни в свободном, ни в связанном виде.
И поэтому можно точно таким же приемом, заменив y на x, превратить ψ в ϕ. И мы получим, что
ψ∼= ϕ.

⋄ 2.1.2 (переименование связанной переменной). требование актуально, если мы собираемся заме-


Рассмотрим формулу нить старую переменную на новую, но входящую
в формулу связанно. Например, в формуле
∃y x ∈ y. (2.1.6)
∃y ∃x (x ∈ y). (2.1.8)
Переменная z не входит в нее ни свободно, ни
связанно. Поэтому замена y = z будет переиме- если заменить y на x, то мы получим формулу
нованием связанной переменной y. Полученная
   
формула
∃y ∃x (x ∈ y) = ∃y ∃y (y ∈ y) ,
y=x

(∃y x ∈ y) = (∃z x ∈ z)
y=z не эквивалентную (2.1.8) (и понятно, такая под-
становка не будет переименованием).
будет конгруэнтна формуле (2.1.6).
⋄ 2.1.3 (важность перехода к новой переменной ⊲ 2.1.4. Проверьте, что формула
в глобальном переименовании). Опять рассмот-
рим формулу ∃y (x ∈ y) & ∀y (y ∈ z)
∃y x ∈ y. (2.1.7)
конгруэнтна формуле
Переменная x входит (свободно) в (2.1.7), поэто-
му замена y = x не считается переименованием, ∃z (x ∈ z) & ∀y (y ∈ z)
а полученная с помощью этой замены из (2.1.7)
формула и формуле

∃z (x ∈ z) & ∀x (x ∈ z).
(∃y x ∈ y) = (∃x x ∈ x),
y=x
⊲ 2.1.5. Проверьте, что формулы
— не считается конгруэнтной формуле (2.1.7).
Этот пример 2.1.3 показывает важность тре-
∃y (x ∈ y) & ∀y (y ∈ z)
бования, чтобы при переименовании новая пере-
менная не входила свободно в старую формулу: и
если этого не требовать, то может получиться, ∃z (x ∈ z) & ∀z (z ∈ z)
что новая формула не эквивалентна старой (в
смысле определения на с.117). Точно так же это не конгруэнтны.

• Подстановкой терма τ вместо переменной x в формулу ϕ называется формула, получаю-


щаяся из ϕ заменой всех свободных вхождений переменной x в формуле ϕ на терм τ . Мы
обозначаем такую формулу символом


ϕ (2.1.9)
x=τ

Очевидны следующие

Свойства подстановки:
§ 1. Формальные теории 109

1◦ Подстановка в конъюнкцию совпадает с конъюнкцией подстановок:



(ϕ & χ) x=τ = ϕ x=τ & χ x=τ (2.1.10)
2◦ Подстановка в дизъюнкцию совпадает с дизъюнкцией подстановок:

(ϕ ∨ χ) x=τ = ϕ x=τ ∨ χ x=τ (2.1.11)
3◦ Подстановка в импликацию совпадает с импликацией подстановок:

(ϕ ⇒ χ) x=τ = ϕ x=τ ⇒ χ x=τ (2.1.12)


• Подстановка ϕ называется корректной, если при замене x на τ никакая переменная,
x=τ
входящая в τ , не попадает в область действия квантора по этой переменной. Это экви-
валентно тому, что каждое свободное вхождение переменной x в формулу ϕ не должно
содержаться в области действия кванторов по переменным, входящим в терм τ .

⋄ 2.1.6 (корректная подстановка). Рассмотрим Здесь новая переменная y попадает в область


формулу в языке теории множеств действия квантора ∃ по этой переменной, поэто-
му такая подстановка не будет корректна.
x ∈ y. (2.1.13)
Подстановка x = y дает формулу ⋄ 2.1.8 (корректная подстановка). Снова рас-
смотрим формулу

(x ∈ y) = (y ∈ y).
x=y
∃y x ∈ y.
Поскольку в исходной формуле (2.1.13) кванто-
ров не было, эта подстановка корректна. Подстановка x = z дает формулу
⋄ 2.1.7 (некорректная подстановка). Рассмот-
рим формулу
(∃y x ∈ y) = (∃y z ∈ y).
x=z
∃y x ∈ y.
Та же подстановка x = y дает формулу Здесь новая переменная z не попадает в область
действия квантора по этой переменной, поэтому

(∃y x ∈ y) = (∃y y ∈ y). такая подстановка будет корректна.
x=y



Теорема 2.1.9. Всякую подстановку ϕ можно сделать корректной, если сначала переимено-
x=τ
вать связанные переменные в формуле ϕ.
• Групповой подстановкой термов τ1 , ..., τn вместо переменных x1 , ..., xn в формулу ϕ назы-
вается формула, получающаяся из ϕ одновременной заменой всех свободных вхождений
каждой переменной xk в формуле ϕ на терм τk . Мы обозначаем такую формулу символом


ϕ (2.1.14)
x1 =τ1 ,...,xn =τn

Групповую подстановку можно представить как последовательность “однократных” под-


становок, но не так, как это кажется поначалу (см. пример 2.1.10 ниже), а вот каким
образом: сначала нужно заменить переменные x1 , ..., xn на новые переменные p1 , ..., pn ,
которых нет ни в формуле ϕ, ни в термах τ1 , ..., τn , а уже потом последовательно заме-
нять каждый pi на τi :


ϕ = ϕ ... ... (2.1.15)
x1 =τ1 ,...,xn =τn x1 =p1 xn =pn p1 =τ1 pn =τn


Групповая подстановка ϕ называется корректной, если при представлении
x1 =τ1 ,...,xn =τn
ее в виде последовательности однократных подстановок (2.1.15) каждая однократная под-
становка pi = τi является корректной. (Это эквивалентно тому, что каждое свободное
вхождение переменной xi в формулу ϕ не должно содержаться в области действия кван-
торов по переменным, входящим в терм τi .)
110 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

⋄ 2.1.10 (важность введения новых перемен- Эту групповую подстановку можно представить
ных). Следующий пример показывает, что груп- как композицию однократных:
повую подстановку нельзя понимать как компо-
 
зицию “однократных” подстановок без введения
∃y (x ∈ y & y ∈ z) =
новых переменных. Рассмотрим формулу в язы- x=p1 z=p2 p1 =y p2 =x
 
ке теории множеств
= ∃y (p1 ∈ y & y ∈ p2 ) =
p1 =y p2 =z
x ∈ y. (2.1.16)  
= ∃y (y ∈ y & y ∈ x) .
Групповая подстановка x = y, y = z дает фор-
мулу Здесь видно, что при замене p1 = y переменная y
попадает в область действия квантора ∃ по этой

(x ∈ y) = (y ∈ z). (2.1.17) переменной, поэтому такая групповая подстанов-
x=y,y=z
ка будет некорректна.
Однако последовательная подстановка сначала
x = y, а потом y = z дает формулу ⋄ 2.1.12 (корректная групповая подстановка).
Рассмотрим ту же кванторную формулу, что и

(x ∈ y) = (y ∈ y) = (z ∈ z). (2.1.18) в предыдущем примере
x=y y=z y=z

Видно, что (2.1.18) и (2.1.18) — разные форму- ∃y (x ∈ y & y ∈ z).


лы. Однако если ввести новые переменные, p1 и
p2 , то нашу групповую подстановку можно будет Групповая подстановка x = z, z = x дает фор-
представить как композицию однократных: мулу

 
(x ∈ y) =
x=p1 y=p2 p1 =y p2 =z ∃y (x ∈ y & y ∈ z) =
x=z,z=x
 
= (p1 ∈ p2 ) = (y ∈ z).
p1 =y p2 =z = ∃y (z ∈ y & y ∈ x) .
Опять же, поскольку исходная формула (2.1.16)
не содержала кванторы, наша групповая подста- Эту групповую подстановку можно представить
новка для нее будет корректна. как композицию однократных:
 
⋄ 2.1.11 (некорректная групповая подстановка).
∃y (x ∈ y & y ∈ z) =
Рассмотрим теперь кванторную формулу в язы- x=p1 z=p2 p1 =z p2 =x
 
ке теории множеств
= ∃y (p1 ∈ y & y ∈ p2 ) =
p1 =z p2 =x
∃y (x ∈ y & y ∈ z). (2.1.19)  
= ∃y (z ∈ y & y ∈ x) .
Групповая подстановка x = y, z = x дает фор-
мулу Здесь видно, что при заменах p1 = z и p2 = x
  новые переменные, x и z, не попадают в область

∃y (x ∈ y & y ∈ z) = действия кванторов по этим репеменным, поэто-
x=y,z=x
  му такая групповая подстановка будет коррект-
= ∃y (y ∈ y & y ∈ x) . на.

Метаформулы, схемы формул и системы аксиом формальной теории. Для описания


системы аксиом формальной теории нам понадобятся понятие метаязыка. Под ним мы будем по-
нимать некий новый алфавит и систему формул в нем. Алфавит метаязыка формальной теории
T должен не пересекаться с алфавитом теории T , и мы условимся в качестве него использовать
строчные греческие буквы,

α, β, γ, δ, ι, κ, λ, µ, ν, ξ, σ, τ, υ, ϕ, χ, ψ, ω,

возможно со штрихами:
α′ , β ′ , ..., α′′ , β ′′ , ...
и т.д. Элементы этого алфавита мы будем называть метапеременными теории T . Далее, форму-
лы метаязыка теории T , или метаформулы теории T , определяются по следующим индуктивным
правилам:
§ 1. Формальные теории 111

1) всякая формула теории T является метаформулой этой теории,


2) всякая метапеременная теории T является метаформулой этой теории,
3) если ϕ – метаформула, то строка ¬ (ϕ) – тоже метаформула;
4) если ϕ и ψ – метаформулы, то следующие строки – тоже метаформулы:
(ϕ) & (ψ), (ϕ) ∨ (ψ), (ϕ) ⇒ (ψ), (ϕ) ⇔ (ψ),
5) если x – переменная теории T , а ϕ – ее метаформула, то следующие строки – тоже мета-
формулы:
∀x (ϕ), ∃x (ϕ). (2.1.20)
Метаформулы обладают тем свойством, что в них вместо метапеременных можно подставлять
обычные формулы. Если метаформула сопровождается указанием, какие переменные могут сво-
бодно входить в ее метапеременную ϕ, то это надо понимать так, что вместо ϕ можно подставлять
только формулы, удовлетворяющие этому условию.
Схемой формул теории T мы будем называть произвольную метаформулу этой теории с задан-
ными возможными ограничениями на переменные (не только свободные, но и связанные) для ее
метапеременных, то есть с указанием, какие переменные могут или не могут входить (в качестве
свободных или связанных) в определенные метапеременные этой метаформулы (понятно, что этих
ограничений может не быть вовсе).

⋄ 2.1.13. Руководящим примером для нас будет смысл которой — существование пустого класса
аксиома выделения MK-7 на с.28: ∅.
∃Y ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & ϕ) (2.1.21) Как контрпример, можно рассмотреть фор-
мулу (0.3.107), обсуждавшуюся в замечании
Она представляет собой схему формул теории 0.3.5:
MK, у которой на метапеременную ϕ наклады-
вается выписанное в этой теории ограничение: ϕ X∈ / Y. (2.1.22)
не должна содержать Y как свободную перемен-
ную. Здесь Y является свободной переменной, и поэто-
Как пример, вместо ϕ можно подставить фор- му эту формулу нельзя подставлять в качестве ϕ
мулу X = X, и мы получим аксиому теории MK: в схему формул (2.1.21). Мы говорили в замеча-
∃Y ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & X = X), нии 0.3.5, что если бы не было этого ограничения
на Y , и формулу (2.1.22) все-таки можно было
означающую существование класса Set всех мно-
бы подставлять в схему (2.1.21), это сразу при-
жеств. Другой пример: подстановка вместо ϕ вело бы к противоречиям в теории MK. Этот при-
формулы X 6= X дает аксиому
мер показывает, почему в схемах формул важны
∃Y ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & X 6= X) ограничения на переменные.

• Под системой аксиом формальной теории мы будем понимать4 конечный набор формул
и/или конечный набор схем формул этой теории. Всякая формула в этом списке называ-
ется аксиомой теории T , а всякая схема формул в этом списке называется схемой аксиом
теории T .

Логическое исчисление формальной теории. Логическое исчисление состоит из аксиом логи-


ки и правил вывода, описывающих логику предикатов для данного языка. Им может быть исчисле-
ние секвенций LK, описанное нами на с.11 для языка теории множеств (качественно отличающегося
от общего случая отсутствием функциональных символов), которое для языка общего вида (с функ-
циональными символами) должно быть усложнено соглашением что в правилах вывода (LK-12*)
и (LK-15*) вместо переменной y позволено подставлять произвольный терм. Весь список правил
удобно привести снова, несмотря на повторения (всюду, кроме (LK-12*) и (LK-15*)). Прежде всего,
аксиома для общего исчисления секвенций LK та же, что и в исчислении для теориий множеств:
для любой формулы ϕ выводима секвенция
ϕ ⊢ ϕ. (LK-0*)
Остальные правила следующие.
4 См. замечание 2.1.1 на с. 105.
112 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

a. Структурные правила:
— ослабление:
Γ ⊢∆ Γ ⊢∆
(LK-1*)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
(LK-2*)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
Γ, ϕ, χ, Π ⊢ ∆ Γ ⊢ ∆, ϕ, χ, Λ
(LK-3*)
Γ, χ, ϕ, Π ⊢ ∆ Γ ⊢ ∆, χ, ϕ, Λ
— сечение:
Γ ⊢ ∆, ϕ ϕ, Π ⊢ Λ
(LK-4*)
Γ, Π ⊢ ∆, Λ
b. Правила введения логических связок:
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
(LK-5*)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— конъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
(LK-6*)
Γ ⊢ ∆, ϕ&χ
— конъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
(LK-7*)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
(LK-8*)
ϕ ∨ χ, Γ ⊢ ∆
— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
(LK-9*)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
(LK-10*)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
(LK-11*)
Γ ⊢ ∆, ϕ ⇒ χ

— добавление квантора всеобщности в антецедент: если подстановка ϕ x=τ кор-
ректна5 (здесь x — переменная, а τ – терм), то

ϕ x=τ , Γ ⊢ ∆
(LK-12*)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y не входит
(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул Γ ,
∆, ∀x ϕ), то

Γ ⊢ ∆, ϕ x=y
(LK-13*)
Γ ⊢ ∆, ∀x ϕ
5 Определение корректной подстановки дано на с. 9.
§ 1. Формальные теории 113

— добавление квантора существования в антецедент: если переменная y не входит


(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул
∃x ϕ, Γ , ∆), то

ϕ x=y , Γ ⊢ ∆
(LK-14*)
∃x ϕ, Γ ⊢ ∆

— добавление квантора существования в сукцедент: если подстановка ϕ x=τ кор-
ректна6 (здесь x — переменная, а τ – терм), то

Γ ⊢ ∆, ϕ x=τ
(LK-15*)
Γ ⊢ ∆, ∃x ϕ
Подобно тому как это делалось на с.13 для теории MK, деревом Генцена в формальной теории
называется произвольная картинка
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
, (2.1.23)
χ⊢ψ
в которой внизу выписана какая-то одна секвенция, а каждый переход сверху вниз представляет
собой применение одного из правил вывода (LK-1*) — (LK-15*). При этом секвенция в самом низу
(здесь это χ ⊢ ψ) называется корнем, а секвенции на самом верху (в данном случае Γ ′′′ ⊢ ∆′′′ и
Γ ′′′′ ⊢ ∆′′′′ ) — вершинами этого дерева.
• Дерево Генцена считается выводом в формальной теории T , если каждая его вершина
является
— либо аксиомой исчисления секвенций LK, то есть секвенцией вида ϕ ⊢ ϕ, где ϕ
— какая-нибудь формула теории T ,
— либо секвенцией вида ⊢ α, где α — какая-нибудь аксиома теории T (то есть
формула из списка A аксиом этой теории).
• Секвенция Γ ⊢ ∆ называется выводимой в теории T , если у нее есть вывод в теории T .
• Формальная теория T называется теорией с равенством, если в ее сигнатуру включен специ-
альный символ =, а в систему аксиом – следующие аксиомы, называемые аксиомами равенства:
— аксиомы эквивалентности для равенства:

x=x (2.1.24)
x=y ⇒ y=x (2.1.25)
(x = y & y = z) ⇒ x=z (2.1.26)

— аксиомы инвариантности функциональных и предикатных символов:


a. Для любого функционального символа F валентности n и для любых двух строк пере-
менных x1 , ..., xn и y1 , ..., yn длины n задается аксиома7

(x1 = y1 & ... & xn = yn ) ⇒ F (x1 , ..., xn ) = F (y1 , ..., yn ). (2.1.27)

b. Для любого предикатного символа P валентности n и для любых двух строк переменных
x1 , ..., xn и y1 , ..., yn длины n задается аксиома8
 
(x1 = y1 & ... & xn = yn ) & P (x1 , ..., xn ) ⇒ P (y1 , ..., yn ). (2.1.28)

• Если T — формальная теория с равенством, то для ее аксиом, не являющихся аксиомами ра-


венства, полезно выделить специальное название. Мы условимся называть такие аксиомы содер-
жательными аксиомами теории T . Всюду далее мы будем под формальной теорией понимать
теорию с равенством.

6 См. определение на с. 9.
7В (2.1.27) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.60.
8 В (2.1.28) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.60.
114 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

⋄ 2.1.14. Теория множеств Морса-Келли MK, ного символа · (валентности 2) с содержательны-


построенная нами выше в § 2 и § 3, является ми аксиомами
примером формальной теории с равенством. Это
теория над логикой предикатов, ее сигнатура со- (x · y) · z = x · (y · z) (2.1.32)
стоит из единственного двуместного предикатно- x·1=x & 1·x=x (2.1.33)
го символа принадлежности ∈ (не считая дву- 
∀x ∃y x·y = 1 & y·x= 1 (2.1.34)
местного предикатного символа равенства =), а
аксиомы – утверждения MK-1 – MK-14, приве- ⋄ 2.1.18. Арифметика Пеано PA определяет-
денные в § 3. ся как формальная теория с равенством над
⋄ 2.1.15. Наивная теория множеств NST, по- логикой предикатов с сигнатурой, состоящей
строенная в § 1 этой главы, также является при- из функциональных символов 0 валентности 0
мером формальной теории с равенством. Это (нуль теории PA), S валентности 1 (функция сле-
также теория над логикой предикатов, у нее та- дования в теории PA), и символов + и · валент-
кая же сигнатура, как у MK, а система аксиом ности 2 (сложение и умножение в теории PA), и
NST-1—NST-7 описана на с.4. следующими содержательными аксиомами:

⋄ 2.1.16. Теорию частичного порядка, обозна- ¬(0 = S(x)) (2.1.35)


чим ее Poset (от словосочетания “partially ordered S(x) = S(y) ⇒ x=y (2.1.36)
set”), используемую в разных разделах алгебры
x+0=x (2.1.37)
и анализа, можно представить как формальную
теорию с равенством над логикой предикатов, у x + S(y) = S(x + y) (2.1.38)
которой сигнатура состоит из единственного дву- x·0=0 (2.1.39)
местного предикатного символа сравнения 6 (не x · S(y) = x · y + x (2.1.40)
считая двуместного предикатного символа ра-   

венства =), а содержательными аксиомами счи- ϕ x=0 & ∀y ϕ x=y ⇒ ϕ x=S(y) ⇒ ϕ
таются формулы
(2.1.41)
x6x (2.1.29)
где ϕ – произвольная формула, не содержа-
x6y &y6x ⇒ x=y (2.1.30)
щая переменную y ни свободно, ни связанно (в
x6y &y6z ⇒ x6z (2.1.31) этом случае, в частности, подстановки ϕ и

x=y
⋄ 2.1.17. Теорию групп Group, также часто ис- ϕ будут корректны, а подстановка ϕ
x=S(y) x=0
пользуемую в алгебре и анализе, можно предста- всегда корректна).
вить как формальную теорию с равенством. Ее Можно заметить, что в этом примере число
сигнатура, состоит (помимо двуместного преди- аксиом бесконечно: строка (2.1.41) описывает не
катного символа равенства =) из функциональ- одну формулу, а схему формул (понятие, описан-
ного символа 1 (валентности 0) и функциональ- ное нами на с.111).

(b) Выводимость в формальных теориях


В предыдущем пункте мы привели примеры формальных теорий, а теперь поговорим о выводи-
мости секвенций в произвольных формальных теориях. Прежде всего, нужно заметить, что все,
что выводимо в “пустом” исчислении секвенций LK, то есть без аксиом самой теории T , только
с аксиомами исчисления LK (под которыми понимаются секвенции вида ϕ ⊢ ϕ), выводимо в лю-
бой формальной теории. В частности, примеры, которые обсуждались нами на страницах 13-22,
справедливы везде, с той только разницей, что в главе 0 мы описывали исчисление LK для языка
теории множеств, и предполагали, что в рассматриваемые метаформулы мы будем подставлять в
качестве метапеременных формулы теории множеств, сейчас же мы собираемся подствлять форму-
лы произвольной формальной теории T . Но, естественно, кроме них будут выводимы разные другие
секвенции, в частности, те, которые не могли быть описаны языком теории множеств.

Вот первые несколько примеров, которые по- ной теории выводима секвенция (0.2.46):
надобятся нам в дальнейшем.
∀x α ⊢ α (2.1.42)

Ее также можно дополнить секвенциями, кото-


⋄ 2.1.19. Как и в MK, в произвольной формаль- рые в MK описать невозможно из-за того, что
§ 1. Формальные теории 115

там функциональных символов нет: если подста- а вторая получается из первой применением пра-
новка x = τ в формулу α корректна, то выводи- вил (LK-5*) и (LK-3*):
мы секвенции
∀x α ⊢ α x=τ

∀x α ⊢ α x=τ (2.1.43) (LK-5*)

¬α , ∀x α ⊢
и x=τ
¬α x=τ ⊢ ¬∀x α (2.1.44) (LK-3*)
∀x α, ¬α x=τ ⊢
Первая из них имеет такой вывод:
(LK-5*)

α
x=τ
⊢ α x=τ
¬α ⊢ ¬∀x α
x=τ
(LK-12*)

∀x α ⊢ α x=τ

Связь между выводимостью секвенций. Часто бывает, что из выводимости одних секвенций
следует выводимость других.

Предложение 2.1.20. Если выводима секвенция

ϕ⊢χ

то для любой формулы α выводимы секвенции

α & ϕ⊢α &χ (2.1.45)

и
α ∨ ϕ ⊢ α ∨ χ. (2.1.46)

Доказательство. 1. Рассмотрим дерево Генцена

α⊢α ϕ⊢χ
(LK-7*) (LK-7*)
α&ϕ⊢α α&ϕ⊢χ
(LK-6*)
α&ϕ⊢α&χ

В нем левая вершина — аксиома, и если вдобавок правая выводима, то ее вывод можно подклеить
к ней сверху, и мы получим вывод для корня, то есть для секвенции (2.1.45).
2. Рассмотрим дерево Генцена

α⊢α ϕ⊢χ
(LK-9*) (LK-9*)
α⊢α∨ϕ ϕ⊢ α∨χ
(LK-8*)
α∨ϕ ⊢ α∨χ

В нем левая вершина — аксиома, и если вдобавок правая выводима, то ее вывод можно подклеить
к ней сверху, и мы получим вывод для корня, то есть для секвенции (2.1.46).

Предложение 2.1.21. Если выводимы секвенции

α, β ⊢ γ (2.1.47)

и
ϕ, χ ⊢ ψ, (2.1.48)

то выводима и секвенция
α & ϕ, β & χ ⊢ γ & ψ (2.1.49)
116 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Доказательство. Здесь нужно рассмотреть дерево Генцена


α, β ⊢ γ ϕ, χ ⊢ ψ
(LK-7*) (LK-7*)
α & ϕ, β ⊢ γ α & ϕ, χ ⊢ ψ
(LK-3*) (LK-3*)
β, α & ϕ ⊢ γ χ, α & ϕ ⊢ ψ
(LK-7*) (LK-7*)
β & χ, α & ϕ ⊢ γ β & χ, α & ϕ ⊢ ψ
(LK-3*) (LK-3*)
α & ϕ, β & χ ⊢ γ α & ϕ, β & χ ⊢ ψ
(LK-6*)
α & ϕ, β & χ ⊢ γ & ψ

Если в нем выводимы вершины, то есть секвенции (2.1.47) и (2.1.48), то их выводы нужно поделеить
сверху к этим вершинам, и мы получим вывод для секвенции (2.1.49).

Отношения следования и эквивалентности между формулами.


Теорема 2.1.22 (о конъюнкции). Для двух формул α и β в теории T следующие условия эквива-
лентны:
(i) в T выводимы формулы α и β,
(ii) в T выводима формула α & β.
Доказательство. 1. (i)⇒(ii). Рассмотрим дерево
⊢α ⊢β
(LK-6*)
⊢α&β
Если в T выводимы формулы α и β, то подклеив их выводы к вершинам этого дерева, мы получим
вывод формулы α & β.
2. (ii)⇒(i). Рассмотрим дерево
α⊢α
(LK-7*)
⊢α&β α&β⊢α
(LK-4*)
⊢α
Если теперь выводима формула α & β, то подклеив ее вывод к левой вершине, мы получим вывод
формулы α.
Точно так же если рассмотреть дерево
β⊢β
(LK-7*)
⊢α&β α&β⊢β
(LK-4*)
⊢β
то если выводима формула α & β, можно подклеить ее вывод к левой вершине, и мы получим вывод
формулы β.
Теорема 2.1.23 (об импликации). Секвенция α, Γ ⊢ ∆, β выводима тогда и только тогда, когда
выводима секвенция Γ ⊢ ∆, α ⇒ β.
• Напомним9 , что про формулу β говорят, что она следует из формулы α в LK, если в
LK выводима секвенция α ⊢ β. Если в этом определении заменить LK на произвольную
формальную теорию T , то мы получим определение отношения следования для формул
в T : говорят, что формула β следует из формулы α в T , если в T выводима секвенция
α ⊢ β. Теорема 2.1.23, между прочим, показывает, что это эквивалентно выводимости в
T секвенции ⊢ α ⇒ β.
9 См. определение на с.22.
§ 1. Формальные теории 117

Доказательство. В прямую сторону это следует из правила (LK-11*):

α, Γ ⊢ ∆, β
(LK-11*)
Γ ⊢ ∆, α ⇒ β.

Это дерево Генцена надо понимать так, что если у его вершины — секвенции α, Γ ⊢ ∆, β — есть
вывод, то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом
для секвенции Γ ⊢ ∆, α ⇒ β.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.38):

α, α ⇒ β ⊢ β
(LK-3*)
Γ ⊢ ∆, α ⇒ β α ⇒ β, α ⊢ β
(LK-4*)
Γ, α ⊢ ∆, β
(LK-3*)
α, Γ ⊢ ∆, β

Опять это дерево надо понимать так, что если у его левой вершины — секвенции Γ ⊢ ∆, α ⇒ β —
есть вывод, то его можно пристроить к этой вершине сверху, затем к правой вершине — секвенции
α, α ⇒ β ⊢ β — нужно будет пристроить ее вывод, который мы получили на с.13, и мы в результате
получим дерево, являющееся выводом для секвенции α, Γ ⊢ ∆, β.
Теорема 2.1.24 (о транзитивности). Если выводимы секвенции Γ ⊢ α и α ⊢ ∆, то выводима и
секвенция Γ ⊢ ∆.
! 2.1.25. Если формулу α заменить здесь каким-нибудь набором (из более чем одной формулы)
Θ, то это утверждение утрачивает силу: из выводимости секвенций Γ ⊢ Θ и Θ ⊢ ∆ не следует
выводимость секвенции Γ ⊢ ∆.
Доказательство. Это частный случай правила сечения (LK-4*):

Γ ⊢α α⊢∆
(LK-4*)
Γ ⊢∆

Теорема 2.1.26. Если выводима секвенция α ⊢ β, то для любой формулы γ выводима секвенция
β ⇒ γ ⊢ α ⇒ γ.
Доказательство. Пусть выводима секвенция α ⊢ β. Тогда по теореме 2.1.23 выводима секвенция

⊢ α ⇒ β.

Вспомним секвенцию (0.2.43), которую мы вывели выше:

α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ).

Вместе эти две секвенции по теореме 2.1.24 дают выводимость секвенции

⊢ (β ⇒ γ) ⇒ (α ⇒ γ).

Снова применяя теорему 2.1.23, мы получаем выводимость секвенции

β ⇒ γ ⊢ α ⇒ γ.

• Если в теории T выводимы секвенции α ⊢ β и β ⊢ α, то говорят, что формулы α и


β эквивалентны в теории T . Из теорем 2.1.23 и 2.1.22 следует, что это эквивалентно
выводимости секвенции ⊢ α ⇔ β. Условимся эквивалентность формул α и β обозначать
записью
T
α ∼ β. (2.1.50)
118 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Теорема 2.1.27. Если α ∼ β, то


(i) выводимость секвенции Γ ⊢ ∆, α эквивалентна выводимости секвенции Γ ⊢ ∆, β.
(ii) выводимость секвенции α, Γ ⊢ ∆ эквивалентна выводимости секвенции β, Γ ⊢ ∆.

Доказательство. 1. Из выводимости секвенции α ⊢ β следует, что в дереве (получающемся приме-


нениям правила сечения (LK-4*))
Γ ⊢ ∆, α α ⊢ β
(LK-4*)
Γ ⊢ ∆, β
если левая вершина выводима, то и корень тоже выводим. И такой же вывод получается если
поменять местами α и β.
2. Точно так же, применением правила сечения (LK-4*), доказывается (ii).

Свойства эквивалентных формул:10


1◦ Всегда α ∼ α.
2◦ Если α ∼ β, то
¬α ∼ ¬β, (2.1.51)
и для всякой переменной x

∀x α ∼ ∀x β, ∃x α ∼ ∃x β. (2.1.52)

3◦ Если α1 ∼ β1 и α2 ∼ β2 , то

α1 & α2 ∼ β1 & β2 , α1 ∨ α2 ∼ β1 ∨ β2 , α1 ⇒ α2 ∼ β1 ⇒ β2 . (2.1.53)

Доказательство. Эти свойства можно считать очевидными.

Теорема 2.1.28. Если формулы α и β конгруэнтны (то есть одна получена из другой переимено-
ванием связанных переменных11), то α и β эквивалентны:

α∼
=β =⇒ α ∼ β.

⋄ 2.1.29. Справедливы следующие эквивалент- Теорема 2.1.30. Все логические формулы выра-
ности формул: жаются эквивалентностями через операции ¬,
¬(α & β) ∼ (¬α) ∨ (¬β), (2.1.54) ⇒ и квантор ∀. В частности,
¬(α ∨ β) ∼ (¬α) & (¬β), (2.1.55)
¬(α ⇒ β) ∼ α & ¬β, (2.1.56) α & β ∼ ¬(α ⇒ ¬β), (2.1.59)
¬(∀x α) ∼ ∃x ¬α, (2.1.57) α ∨ β ∼ (¬α) ⇒ β, (2.1.60)
¬(∃x α) ∼ ∀x ¬α. (2.1.58) ∃x α ∼ ¬(∀x ¬α). (2.1.61)

Цепочки импликаций и цепочки равносильностей. В логических рассуждениях часто бы-


вает полезна конструкция, называемая цепочкой импликаций. Под этим понимается конечная по-
следовательность формул,
α1 ⇒ α2 ⇒ α3 ⇒ ... ⇒ αn (2.1.62)
в которой любые две соседние αi и αi+1 связаны импликацией, означающей, что αi+1 следует из αi
в смысле определения на с.116, то есть что формула

αi ⇒ αi+1
10 Эти свойства не распространяются на отношение следствия между формулами. Например, если β следует из α,

то из этого нельзя заключить, что ¬β следует из ¬α. Все же применение логических операций & и ∨ и кванторов ∀
и ∃ сохраняет отношение следствия.
11 Процедура переименования связанных переменных была определена на с.??.
§ 1. Формальные теории 119

выводима в данной теории T . По теореме об импликации 2.1.23 это эквивалентно выводимости


секвенций
αi ⊢ αi+1 ,
откуда по теореме транзитивности 2.1.24 следует выводимость секвенции

αi ⊢ αj ,

(с произвольными индексами i < j). С помощью цепочек импликаций обычно доказываются отно-
шения следования между формулами: для вывода формулы

α1 ⇒ αn ,

достаточно построить цепочку 2.1.62, в которой соседние импликации уже выведены.


Точно так же бывают полезны так назваемые цепочки равносильностей. Под таковыми понима-
ются конечнын последовательности формул,

α1 ⇔ α2 ⇔ α3 ⇔ ... ⇔ αn (2.1.63)

в которой любые две соседние αi и αi+1 связаны знаком эквивалентности, который следует понимать
как эквивалентность αi и αi+1 в смысле определения на с.117, то есть выводимость формул

αi ⇒ αi+1 , αi+1 ⇒ αi

в данной теории T . По теореме об импликации 2.1.23 это эквивалентно выводимости секвенций

αi ⊢ αi+1 , αi+1 ⊢ αi

откуда по теореме транзитивности 2.1.24 следует выводимость секвенций

αi ⊢ αj , αj ⊢ αi

(с произвольными индексами i и j). С помощью цепочек равносильностей обычно доказываются


отношения эквивалентности между формулами: для вывода формулы

α1 ⇔ αn ,

достаточно построить цепочку 2.1.63, в которой соседние эквивалентности уже доказаны.12

Отношение выводимости между формулами. Как и в исчислении секвенций LK, в произ-


вольной формальной теории T помимо отношения следования между формулами имеется другое,
не эквивалентное ему, отношение выводимости13 . Для исчисления LK мы определили его с.23, а
для произвольной формальной теории T определение выглядит так.
• Говорят, что формула ω выводима из набора формул Σ в формальной теории T , если существует
дерево Генцена, в котором в корне стоит секвенция ⊢ ω, а на вершинах либо аксиомы теории
LK (то есть секвенции вида α ⊢ α, где α — произвольная формула теории T ), либо секвенции
вида ⊢ β, где β — произвольная аксиома теории T , либо секвенции ⊢ σ, где σ — произвольная
формула из Σ:
α⊢α ⊢β ⊢σ
... ... ...
. (2.1.64)
⊢ω
• В частном случае, если Σ состоит из одной формулы σ, говорят, что формула ω выводится из
формулы σ в теории T .
• Говорят, что формулы σ и ω взаимно выводимы в теории T , если ω выводится из σ в теории T
и σ выводится из ω в теории T . Это обозначается записью
T
ω ≈ σ. (2.1.65)
12 См.ниже в качестве примера вывод формулы (2.2.164).
13 То,
что эти отношения не эквивалентны в LK, показано в примере 2.4.7. Понятно, что отсюда следует, что в
формальных теориях T эти отношения также не обязаны быть эквивалентны.
120 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

• В другом частном случае, если Σ совсем не содержит формул, говорят, что формула ω выводится
в теории T , а дерево (2.1.64), принимающее вид
α⊢α ⊢β
... ...
, (2.1.66)
⊢ω
где α — произвольная формула теории T , а β — произвольная аксиома теории T , называется
выводом формулы ω в теории T . В этом случае говорят также, что формула ω выводима в
теории T (или является теоремой теории T );
• Формула ω называется опровержимой в теории T , если ее отрицание, ¬ω, выводимо в теории
T.
T
! 2.1.31. Из примера 2.4.7 видно, что отношение взаименой выводимости ≈ из (2.1.66), не эквива-
T
лентно отношению эквивалентности ∼ из (2.1.50).
Пусть T – формальная теория и σ – формула в ней. Условимся символом T + σ обозначать
формальную теорию, полученную из T присоединением формулы σ к списку аксиом. Следующее
утверждение очевидно:
Теорема 2.1.32. Для формул ω и σ в теории T следующие условия эквивалентны:
(a) ω выводится из σ в T ,
(b) ω выводится в T + σ.
По аналогии с теоремой о дедукции для LK 0.2.44 доказывается
Теорема 2.1.33 (о дедукции для произвольной теории T ). Пусть ω – формула и Σ — конечный
набор формул в формальной теории T . Рассмотрим два условия:
(a) ω следует из Σ в T ,
(b) ω выводится из Σ в T .
Тогда:
(i) условие (a) влечет условие (b),
(ii) если формулы Σ замкнуты, то условие (b) влечет условие (a) (то есть в этом случае
(a) и (b) равносильны).

Эквивалентные теории. Условимся говорить, что две формальные теории S и T эквивалент-


ны, если
1) у них один язык, и
2) формула ϕ выводима в теории S тогда и только тогда, когда она выводима в теории T .
Теорема 2.1.34. Если в теории S заменить аксиомы α на взаимно выводимые в LK формулы α′ ,
LK
α ≈ α′

то мы получим эквивалентную теорию S ′ .

Замыкание всеобщности.
• Пусть α — формула формальной теории T , и пусть x1 , ..., xn — ее свободные переменные.
Тогда замыканием всеобщности α формулы α называется формула

∀x1 ... ∀xn α.

• Пусть T — формальная теория с системой аксиом Σ. Если каждую формулу α в Σ за-


менить на ее замыкание всеобщности α, то мы получим систему аксиом некоторой новой
формальной теории T , которую мы будем называть замыканием формальной теории T .
По аналогии с предложением 0.2.42 доказывается
Предложение 2.1.35. В формальной теории T всякая формула α и ее замыкание всеобщности
α взаимно выводимы в LK:
LK
α≈α
§ 1. Формальные теории 121

Отсюда и из теоремы 2.1.34 сразу следует


Теорема 2.1.36. Выводимость формулы ω в формальной теории T эквивалентна ее выводимости
в замыкании T теории T .

(c) Дефинициальные расширения


Определение дефинициального расширения и примеры.
• Пусть нам дана формальная теория T с алфавитом A, сигнатурой Σ и аксиомами Γ .
1. Пусть P – какой-то новый символ, не входящий ни в алфавит A, ни в сигна-
туру Σ. Если мы хотим относиться к P , как к новому предикатному символу
некоторой валентности n, то необходимо задать некую новую аксиому, которая
называется определяющей аксиомой этого предикатного символа, и это должна
быть формула вида
P (x1 , ..., xn ) ⇐⇒ α, (2.1.67)
в которой α – какая-нибудь формула в переменных14 x1 , ..., xn . Если задана та-
кая определяющая аксиома, то P называется внешним предикатным символом
(валентности n) теории T , а формула α – определением символа P .
2. Пусть F – какой-то новый символ, не входящий ни в алфавит A, ни в сигнату-
ру Σ. Если мы хотим относиться к F , как к новому функциональному символу
некоторой валентности n, то необходимо задать некую новую аксиому, кото-
рая называется определяющей аксиомой этого функционального символа, и это
должна быть формула вида

y = F (x1 , ..., xn ) ⇐⇒ β, (2.1.68)

где β – какая-нибудь формула в x1 , ..., xn , y, причем в теории T выводима фор-


мула15
∀x1 , ..., xn ∃!y β (2.1.70)
Если задано такое определение, то F называется внешним функциональным
символом (валентности n) теории T , а формула β – определением символа F .
• Формальная теория R, полученная из теории T последовательным добавлением к ее сиг-
натуре Σ некоторого количества внешних предикатных или функциональных символов, с
одновременным добавлением к системе аксиом теории T соответствующих формул, опре-
деляющих эти символы (то есть формул вида (2.1.67) и/или (2.1.68)), называется дефин-
циальным расширением теории T .

⋄ 2.1.37. Символ Ord, обозначающий класс циального расширения теории MK.


малых ординалов, определенный формулой
(0.3.290), может считаться примером внешне- ⋄ 2.1.39. Символ ≃, обозначающий отноше-
го функционального символа валентности 0, ние равномощности, и определенный формулой
присоединенного к теории MK. А теория MK с (0.3.321), – пример внешнего предикатного сим-
присоединенным к ней символом, определенным вола валентности 2 для теории MK.
формулой (0.3.290), – пример дефинициального
расширения теории MK. ! 2.1.40. Глядя на эти примеры, можно заме-
⋄ 2.1.38. Символ S, обозначающий функцию тить, что в теории множеств Морса-Келли MK
следования, определенную формулой (0.3.293), – всякий присоединенный предикатный символ η
пример внешнего функционального символа ва- валентности n выделяет некий класс строк дли-
лентности 1 для теории MK. Точно так же теория ны n, а всякий присоединенный функциональ-
MK с присоединенным к ней символом S, опре- ный символ θ валентности n выделяет некое
деленным формулой (0.3.293), – пример дефини- отображение на строках длины n.
14 Понятие формулы в заданных переменных было определено на с.107.
15 Квантор ∃! был определен выше формулой (0.2.29). Формула (2.1.70), таким образом, эквивалентна формуле
 
(∀x1 , ..., xn ∃y β) & ∀x1 , ..., xn ∀y ∀z (β & β y=z ) =⇒ y = z (2.1.69)

в которой z – какая-нибудь переменная, не содержащаяся в β.


122 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Перевод формул в дефинициальном расширении. Всякой формуле ϕ дефинициального рас-


ширения R теории T можно неким стандартным образом поставить в соответствие некую формулу
b (точнее, класс формул, отличающихся друг от друга переименованием связанных переменных)
ϕ
теории T (без присоединенных символов) так, чтобы ϕ и ϕb были эквивалентны в R. Это удобно
описать, считая, что R получено из T присоединением какого-то одного внешнего символа (а в
общем случае нужно будет представить R как цепочку дефинициальных расширений, полученую
из T присоединением каждый раз по одному символу). Поэтому мы рассмотрим два случая.
1. Пусть R получено из T присоединением предикатного символа P , определенного форму-
лой α по правилу (2.1.67). Подберем формулу α′ , отличающуюся от α переименованием
связанных переменных, так, чтобы связанные переменные в формуле α′ не входили в ϕ
(ни свободно, ни связанно). Тогда чтобы получить ϕb мы в формуле ϕ заменяем каждое
вхождение символа P (τ1 , ..., τn ) в ϕ формулой


α′
x1 =τ1 ,...,xn =τn

(такая подстановка будет корректна, потому что переменные из τ1 , ..., τn не будут содер-
жаться в α′ как связанные переменные). Понятно, что формула ϕ b определяется неодно-
значно, а с точностью до переименования связанных переменных.
2. Пусть R получено из T присоединением функционального символа F , определенного фор-
b для атомарных формул ϕ:
мулой β по правилу (2.1.68). Построим сначала перевод ϕ
— b совпадает с ϕ,
если ϕ не содержит символа F , то мы считаем, что ϕ
— предположим, что мы построили формулы ϕ b для всех атомарных формул ϕ, в
которых символ F встречается k раз,
— пусть далее ϕ – атомарная формула, в которой символ F встречается k + 1 раз;
подберем формулу β ′ , отличающуюся от β в (2.1.68) переименованием связан-
ных переменных, так, чтобы связанные переменные в формуле β ′ не входили
в ϕ (ни свободно, ни связанно); среди всех вхождений символа F в ϕ рассмот-
рим такие, которые внутри себя уже не сожержат F (то есть входящие в терм
F (τ1 , ..., τn ), в котором “подтермы” τ1 , ..., τn не содержат символа F ); эти вхож-
дения F линейно упорядочены как элементы записи формулы ϕ; выберем среди
них самое первое вхождение, и заменим соответствующий терм F (τ1 , ..., τn ) на
какую-нибудь букву y, не входящую в ϕ ни свободно, ни связанно; обозначим
соответствующую формулу буквой χ, тогда ϕ будет результатом подстановки


ϕ = χ
y=F (τ1 ,...,τn )

(в которой термы τ1 , ..., τn символа F не содержат, а переменная y не встречается


ни в формуле χ, ни в τ1 , ..., τn ); в формуле χ символ F входит уже k раз (на 1
меньше, чем в формуле ϕ), поэтому для нее соответствующая формула χ b уже
b можно определить так:
построена; теперь ϕ
 

∀y β ′ ⇒χ b
x1 =τ1 ,...,xn=τn

(подстановка будет корректна, потому что переменные из термов τ1 , ..., τn не со-


держатся как связанные переменные в β ′ ); эквивалентный способ — определить
b формулой
ϕ  

∃y β ′ &χ b .
x1 =τ1 ,...,xn =τn

После того, как перевод ϕb построен для всех атомарных формул ϕ, мы, рассматривая
произвольную формулу ψ, заменяем в ней всякую атомарную подформулу ϕ на ее пере-
b В общем случае, когда присоединено несколько символов, мы занумеровываем их,
вод ϕ.
и, двигаясь от последнего к первому, устраиваем переводы формулы ϕ последовательно
устраняя в них один за другим присоединенные символы, пока не дойдем до ситуации,
когда присоединенных символов совсем не останется.
§ 1. Формальные теории 123

• Формула ϕ b (определяемая с точностью до переименования связанных переменных) назы-


вается переводом формулы ϕ на язык теории T .

Свойства операции перевода:


1◦ Если формула ϕ не содержит присоединенных символов, то16
b=ϕ
ϕ (2.1.71)
2◦ Если P — присоединенный предикатный символ валентности n, определенный формулой
(2.1.67), то 
P (x1 , ..., xn ) b = α, (2.1.72)
3◦ Если F — присоединенный функциональный символ валентности n, определенный фор-
мулой (2.1.68), то 
y = F (x1 , ..., xn ) b = β, (2.1.73)
4◦ В T справедливы следующие конгруэнтности формул
c ∼
¬ϕ = ¬ϕ,
b (ϕ ⇒ ψ)b ∼ b
b ⇒ ψ)
= (ϕ (2.1.74)
ϕ\&ψ∼=ϕb & ψ, \
b ϕ ∨ψ ∼
=ϕ b
b ∨ ψ, (2.1.75)
[
∀x ϕ∼
= ∀x ϕ,
b ∃x[ϕ∼= ∃x ϕ.
b (2.1.76)
5◦ Всякая формула ϕ в R эквивалентна (в R) любому своему переводу
R
ϕ ∼ ϕ.
b (2.1.77)
Доказательство. Здесь все свойства очевидны, кроме 5. Для атомарных формул ϕ это доказы-
вается индукцией по числу присоединенных символов в ϕ, а затем для произвольных формул
применяются свойства (2.1.74)—(2.1.76) и свойства 2◦ и 3◦ на с.118: всякая атомарная формула
bв T,
ϕ эквивалентна своему переводу ϕ
ϕ ∼ ϕ,
b
поэтому то же самое верно для любых формул, составленных из атомарных с помощью связок ¬,
&, ∨, ⇒, и кванторов ∀, ∃. То есть это верно для любых вообще формул.
Лемма 2.1.41. Если τ — терм теории T (без новых присоединенных символов), для
которого
подстановка ϕ x=τ корректна, то найдется перевод ϕ, b для которого подстановка b x=τ также
ϕ
будет корректна, и будет справедлива конгруэнтность формул
\
ϕ ∼
= b
ϕ . (2.1.78)
x=τ x=τ

Лемма 2.1.42. Пусть τ — терм в языке R и y — переменная, не входящая в τ . Тогда в теории


T выводима формула
∃!y y\
=τ (2.1.79)
Доказательство. Это доказывается индукцией по числу присоединенных символов в терме τ .
Лемма 2.1.43. Пусть τ — терм в языке R, y — переменная, не входящая в τ , и ϕ – формула в
R. Тогда в теории T справедливы следующие эквивалентности формул:
   
\
ϕ ∼ ∃y y\ \
=τ & ϕ ∼ ∀y y\
=τ ⇒ ϕ \ (2.1.80)
x=τ x=y x=y

Доказательство. Для атомарных формул ϕ это доказывается индукцией по числу присоединенных


символов в терме τ . После этого для произвольных формул это доказывается индукцией по числу
логических связок и кванторов с помощью свойств (2.1.74)—(2.1.76) и леммы 2.1.42.

Теорема 2.1.44. Если в теории R подстановка ϕ x=τ корректна (и τ — произвольный терм в R,
то есть, возможно, содержащий присоединенные к T символы), то в T выводимы секвенции
\
∀x ϕ
b⊢ϕ (2.1.81)
x=τ

\
ϕ ⊢ ∃x ϕ
b (2.1.82)
x=τ
16 Равенство формул было определено на с.107.
124 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Доказательство. Вывод секвенции (2.1.81):

\ \
ϕ ⊢ϕ
x=y x=y
(LK-1*)
\ \
y\
= τ, ϕ ⊢ϕ
b x=y ⊢ ϕ
ϕ b x=y x=y x=y
(LK-11*)
(LK-12*)
\ \
∀x ϕ b x=y
b⊢ϕ ϕ ⊢ y\
=τ ⇒ ϕ
x=y x=y
(LK-13*) (LK-12*)

∀x ϕ b x=y
b ⊢ ∀y ϕ \
∀y ϕ ⊢ y\ \
=τ ⇒ ϕ
x=y x=y
(2.1.78) (LK-13*)
 
∀x ϕ \
b ⊢ ∀y ϕ \ \
x=y ∀y ϕ x=y
⊢ ∀y \
y = τ ⇒ ϕ x=y
(LK-4*)
 
b ⊢ ∀y y\
∀x ϕ \
=τ ⇒ ϕ
x=y
(2.1.80)
\
∀x ϕ
b⊢ϕ
x=τ

Вывод секвенции (2.1.82):

\ \
ϕ ⊢ϕ
x=y x=y
b x=y ⊢ ϕ
ϕ b x=y
(LK-7*)
\ \ (LK-15*)
y\
=τ &ϕ ⊢ϕ
x=y x=y b x=y ⊢ ∃x ϕ
ϕ b
(LK-15*)
\ \ (LK-14*)
y\
=τ &ϕ ⊢ ∃y ϕ b x=y ⊢ ∃x ϕ
∃y ϕ b
x=y x=y
(LK-14*) (2.1.78)
 
∃y y\ \
=τ &ϕ \
⊢ ∃y ϕ \
x=y x=y ∃y ϕ x=y
⊢ ∃x ϕ
b
(LK-4*)
 
∃y y\ \
=τ &ϕ ⊢ ∃x ϕ
b
x=y
(2.1.80)
\
ϕ ⊢ ∃x ϕ
b
x=τ

 
⋄ 2.1.45. Напомним, что отношение включе- ∀A (A ∈ X ⇒ A ∈ Y )
ния ⊆ было определено в теории MK формулой 
(0.3.114) & ∀A (A ∈ Y ⇒ A ∈ X)

X ⊆Y ⇔ ∀A (A ∈ X ⇒ A ∈ Y ). ⇒ X = Y.

Понятно, что ⊆ можно понимать как внешний


двуместный предикатный символ в MK. Саму
теорию MK с присоединенным к ней предикат-
ным символом ⊆ можно поэтому рассматривать
как дефинициальное расширение теории MK.
Обозначим его MK+ ⊆. Рассмотрим в MK+ ⊆
какую-нибудь формулу ϕ с участием этого сим-
вола, например, (0.3.119):

X ⊆Y &Y ⊆X ⇒ X = Y.
b на язык теории MK, естественно,
Ее перевод ϕ
должен содержать только символы сигнатуры
теории MK (то есть = или ∈, без ⊆), и мы его
упоминали уже, — это формула (0.3.120):
b в MK,
На с.31 мы приводили вывод формулы ϕ
§ 1. Формальные теории 125

а формула ϕ, в свою очередь, выводится17 в MK+ ⊆.

Теорема 2.1.46. Пусть R — дефинициальное расширение теории T . Формула ϕ в R выводима в


R если и только если ее перевод ϕ
b выводим в T .
Доказательство. Заметим сразу, что в одну сторону это утверждение следует сразу из свойства
b выводима в T , то ϕ выводима в R. Действительно, свойство (2.1.77) означает вы-
(2.1.77): если ϕ
водимость в R секвенций
ϕ⊢ϕ b b⊢ϕ
ϕ
Мы можем подклеить вывод правой из них сверху к правой вершине дерева

⊢ϕ b⊢ϕ
b ϕ
(LK-4*)
⊢ϕ

b выводима (в T , а значит и в R), то ее вывод мы также можем подклеить к левой


и тогда, если ϕ
вершине этого дерева, и мы получим вывод в R для секвенции ⊢ ϕ.
Таким образом, задача сводится к проверке второй половины этого утверждения: если ϕ выво-
дима в R, то ϕb выводима в T .
Если ϕ выводима в R, то у нее есть вывод в R, то есть некое дерево Генцена,
α⊢α ⊢γ
Γ3 ⊢∆3 Γ4 ⊢∆4
Γ1 ⊢∆1 Γ2 ⊢∆2
... ...
(2.1.83)
⊢ϕ

у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
α ⊢ α), либо секвенции вида ⊢ γ, где γ — аксиомы теории T или теории R.
Преобразуем каждую формулу ψ в этом дереве в формулу ψb теории T (по правилам, описанным
на с.123). Мы получим некую картинку с секвенциями теории T :
α⊢
b αb ⊢b
γ
b ⊢∆
Γ c b ⊢∆
Γ c
3 3 4 4
b ⊢∆
Γ c b ⊢∆
Γ c
1 1 2 2
... ...
(2.1.84)
⊢ϕ
b

В вершинах этой картинки стоят либо секвенции вида α b⊢αb, то есть аксиомы исчисления преди-
катов LK, либо секвенции вида ⊢ γ
b, где γ — аксиомы теории T , либо секвенции вида ⊢ bγ , где γ —
аксиома теории R, то есть определение в T . Но всякое определение имеет вид (2.1.67)

η(x1 , ..., xn ) ⇐⇒ α,

и его перевод будет иметь вид


α ⇐⇒ α,
По теореме 0.2.40 выводимость такой формулы эквивалентна выводимости секвенции

α ⊢ α.
17 Формула ϕ имеет следующий вывод в MK+ ⊆:
⊢ (∀A A ∈ X ⇔ A ∈ Y )
⇒ X = Y (0.3.98)
теорема 0.2.40
∀A (A ∈ X ⇔ A ∈ Y )
⊢ X ⊆ Y ⇒ (∀A α) (0.3.114) ⊢ Y ⊆ X ⇒ (∀A β) (0.3.114) ⊢X =Y
теорема 0.2.40 теорема 0.2.40 (∀A α) & (∀A β) ⊢ (0.2.25)
X ⊆ Y ⊢ ∀A α Y ⊆ X ⊢ ∀A β ∀A (α & β) (0.2.57) ∀A (α & β) ⊢ X = Y
 пример 0.2.27 (LK-4*)
X ⊆ Y & Y ⊆ X ⊢ (∀A α) & (∀A β) (∀A α) & (∀A β) ⊢ X = Y
(LK-4*)
X ⊆Y &Y ⊆X ⊢X =Y
 (LK-11*)
⊢ X⊆Y &Y ⊆X ⇒ X=Y
где α — формула A ∈ X ⇒ A ∈ Y , а β — формула A ∈ Y ⇒ A ∈ X.
126 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

А это аксиома теории T .


Сказанное означает, что в дереве (2.1.84), получающемся переводом дерева (2.1.83), все вершины
— либо аксиомы теории T , либо выводимые секвенции в теории T . Поэтому если доказать, что в
(2.1.84) каждый переход вниз осуществляется по правилам вывода исчисления LK, то это будет
выводом секвенции
⊢ϕb
(что нам и нужно).
Таким образом, остается проверить только, что конструкция (2.1.84) — это либо само по себе
дерево Генцена, либо ее можно дополнить (с сохранением корня и возможным добавлением новых
вершин, которые также будут выводимыми секвенциями) до дерева Генцена.
Это делается вот как. Каждый переход в (2.1.84)

Γbp ⊢ ∆
bp
(2.1.85)
Γbq ⊢ ∆
bq

получен как преобразование по правилам (2.1.95)—(2.1.94) соответствующего перехода в (2.1.83)

Γp ⊢ ∆p
, (2.1.86)
Γq ⊢ ∆q

который в свою очередь получен применением какого-то из правил вывода (LK-1*) — (LK-15*).
Нужно перебрать все правила от (LK-1*) до (LK-15*) и убедиться, что всякий раз, когда в (2.1.86)
выводимость нижней секвенция следует из выводимости верхней применением этого правила, в
(2.1.85) выводимость нижней секвенции также получается из выводимости верхней применением
этого же правила, возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (2.1.86) получено применением первого правила в (LK-1*), то есть имеет вид

Γ ⊢∆
α, Γ ⊢ ∆

Тогда (2.1.85), получаемое преобразованием этого перехода, имеет вид

Γb ⊢ ∆
b
,
b
b, Γ ⊢ ∆
α b

и это тоже применение правила (LK-1*).


2. Следующие правила, от (LK-2*) до (LK-11*) включительно проверяются так же элементарно.
3. Сложности начинаются с правила (LK-12*). Пусть (2.1.86) получено применением этого пра-
вила, то есть имеет вид
α x=τ , Γ ⊢ ∆
∀x α, Γ ⊢ ∆
— где x — переменная, а τ – терм. Это преобразуется в переход

\
α , Γb ⊢ ∆b
x=τ
.
dα, Γb ⊢ ∆
∀x b

Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(LK-4*),

\ \
dα ⊢ α
∀x α , Γb ⊢ ∆
b
x=τ x=τ
,
dα, Γb ⊢ ∆
∀x b
и по правилу (2.1.76) это будет эквивалентно переходу

\ \
∀x α
b⊢α α , Γb ⊢ ∆
b
x=τ x=τ
.
b, Γb ⊢ ∆
∀x α b

Последний переход представляет собой применение правила сечения (LK-4*), а добавленная нами
\
вершина слева — ∀x α
b⊢α — выводимая секвенция в T , в силу (2.1.81).
x=τ
§ 1. Формальные теории 127

4. Пусть (2.1.86) получено применением правила (LK-13*), то есть имеет вид



Γ ⊢ ∆, α x=y
Γ ⊢ ∆, ∀x α

— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход

\
Γb ⊢ ∆,
b α
x=y

Γb ⊢ ∆,
b ∀x

который по формулам (2.1.78) и (2.1.76) эквивалентен переходу



Γb ⊢ ∆,
b αb x=y
Γb ⊢ ∆,
b ∀x α
b

При этом, y, по-прежнему, не входит (как свободная переменная) в нижнюю секвенцию, и мы


получаем, что это в точности применение правила (LK-13*) к верхней секвенции.
5. Пусть (2.1.86) получено применением правила (LK-14*), то есть имеет вид

α x=y , Γ ⊢ ∆
∃x α, Γ ⊢ ∆

— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход

\
α , Γb ⊢ ∆
b
x=y
dα, Γb ⊢ ∆
∃x b

который по формулам (2.1.78) и (2.1.76) эквивалентен переходу



b x=y , Γb ⊢ ∆
α b

b, Γb ⊢ ∆
∃x α b

Здесь y по-прежнему не входит (как свободная переменная) в нижнюю секвенцию, и мы получаем,


что это в точности применение правила (LK-14*) к верхней секвенции.
6. Пусть (2.1.86) получено применением правила (LK-15*), то есть имеет вид

Γ ⊢ ∆, α x=τ
Γ ⊢ ∆, ∃x α

— где x — переменная, а τ – терм. Это преобразуется в переход

\
Γb ⊢ ∆,
b α
x=τ
.
b b d
Γ ⊢ ∆, ∃x α

Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(LK-4*),

\ \
Γb ⊢ ∆,
b α α dα
⊢ ∃x
x=τ x=τ
,
Γb ⊢ ∆, dα
b ∃x

и по правилу (2.1.76) это будет эквивалентно переходу



\ \
Γb ⊢ ∆,
b α
x=τ
α
x=τ
⊢ ∃x α
b
,
b b
Γ ⊢ ∆, ∃x α
b

Последний переход представляет собой применение правила сечения (LK-4*), а добавленная нами
\
вершина справа — α ⊢ ∃x α
b — выводимая секвенция в T , в силу (2.1.82).
x=τ
128 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Если T — теория со схемами аксиом18 , и R — ее дефинициальное расширение, то схемы аксиом,


доставшиеся R по наследству из T , формально должны пониматься в смысле языка теории T . То
есть если в теории задана некая схема аксиом с метапеременной ϕ, то считается, что когда из этой
схемы ты формируешь конкретную формулу в качестве аксиомы, ты вместо ϕ должен подставлять
формулу языка теории T , без присоединенных символов (формирующих теорию R). Например, из
аксиомы выделения MK-7 теории MK (см. с.28),

∃Y (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & ϕ) (2.1.87)

ты можешь получить формулу

∃Y (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & ¬(X ∈ X))

(подставив вместо ϕ формулу ¬(X ∈ X)), но не можешь получить формулу

∃Y (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & card X = 1)

потому что card и 1 — присоединенные к MK символы. Следующая теорема показывает, что это
требование не существенно, и в схемах аксиом можно использовать формулы с новыми символами
тоже.

Теорема 2.1.47 (о схемах аксиом в дефинициальном расширении). Если T — теория со схемами


аксиом, то любое ее дефинициальное расширение R, в котором схемы аксиом понимаются в смыс-
ле языка теории T эквивалентно (как формальная теория19 ) теории R, в которой схемы аксиом
понимаются в смысле языка теории R.

(d) Интерпретации и модели


В логике существует стандартный способ погрузить одну формальную теорию S в другую формаль-
ную теорию T . Этот способ называется интерпретацией, и здесь мы опишем эту конструкцию. Она
полезна тем, что позволяет свести все формальные теории к дефинициальным расширениям теории
множеств (см. теоремы 2.3.6 и 2.3.18 ниже).

Определение интерпретации и примеры.


• Пусть нам даны:
1) две формальные теории S и T над логикой предикатов с одним алфавитом A и
сигнатурами Σ и T соответственно,
2) некий символ U , не входящий ни в алфавит A, ни в сигнатуру Σ, ни в сигнатуру
T,
И пусть каждому (константному, предикатному и функциональному) символу η из Σ по-
ставлен в соответствие некий внешний (константный, предикатный или функциональный,
в соответствии с тем, каким был η) символ η ′ теории T , той же валентности, что η (см.
определение на с.121). Пусть S ′ обозначает дефинициальное расширение теории T , полу-
чаемое присоединением к сигнатуре T символов η ′ , где η пробегает Σ, и символа U как
предикатного символа валентности 1. И пусть выполнены следующие два условия:
(i) требуется, чтобы в теории S ′ существовал хотя бы один объект, удовлетворяющий
условию U , то есть чтобы в S ′ была выводима секвенция

⊢ ∃x U (x), (2.1.88)

(ii) нужно чтобы для каждой константы η из сигнатуры Σ соответствующий символ кон-
станты η ′ в теории S ′ , обладал свойством U , то есть чтобы в S ′ была выводима секвен-
ция
⊢ U (η), (2.1.89)
18 Напомним, что понятие схемы формул было определено на с. 111.
19 Понятие эквивалентности теорий было определено на с.120.
§ 1. Формальные теории 129

(iii) нужно чтобы для каждого функционального символа F из сигнатуры Σ соответству-


ющий функциональный символ F ′ в теории S ′ , сохранял свойство U для своих аргу-
ментов, то есть чтобы в S ′ была выводима секвенция
 
U (x1 ), ..., U (xn ) ⊢ U F ′ (x1 , ..., xn ) (2.1.90)

(здесь n – валентность символа F ′ ).


• Преобразование термов и формул. При этих условиях каждому терму τ теории S можно
поставить в соответствие терм τ ′ в теории S ′ , заменив каждый функциональный символ
F в τ на соответствующий символ F ′ . И точно так же каждой формуле ϕ теории S можно
поставить в соответствие формулу ϕ′ в теории S ′ , которая, неформально выражаясь,
отличается от ϕ тем, что на входящие в нее переменные накладывается дополнительное
условие, что они должны удовлетворять формуле U (иначе говоря, должны лежать в
универсуме U ). Строго формула ϕ′ определяется так:
— каждый предикатный символ P в ϕ нужно заменить на соответствующий символ P ′ ,
— каждый функциональный символ F в ϕ нужно заменить на соответствующий символ
F ′ (при этом каждый терм τ преобразуется в новый терм τ ′ ),
— каждую подформулу
∀x (α) (2.1.91)
нужно заменить на подформулу
 
∀x U (x) ⇒ (α) (2.1.92)

— каждую подформулу
∃x α (2.1.93)
нужно заменить на подформулу
 
∃x U (x) & (α) (2.1.94)

— проделаем эти действия со всеми кванторными подформулами в ϕ и обозначим буквой


ψ полученную в результате формулу; если в ней есть свободные переменные x1 , ..., xn ,
то мы заменяем исходную формулу ϕ на формулу
 
U (x1 ) & ... & U (xn ) ⇒ (ψ). (2.1.95)

• Предположим далее, что выполняется следующее условие:


— для всякой формулы ϕ, являющейся аксиомой теории S, соответствующая ей
формула ϕ′ в теории S ′ выводима в этой теории.
Тогда теория S ′ называется интерпретацией теории S в теории T . Предикатный символ
U при этом называется универсумом этой интерпретации, термы τ ′ — переводами термов
τ , а формулы ϕ′ — переводами формул ϕ в этой интерпретации. При этом про теорию S го-
ворят, что она интерпретируется в теории T , а про теорию T что она интерпретирует
теорию S.
! 2.1.48. Заметим, что к теории S ′ (которую мы определили как дефинициальное расширение
теории T , получаемое присоединением к сигнатуре T символов η ′ , где η пробегает Σ, и символа U
как предикатного символа валентности 1) можно дополнительно присоединить в качестве аксиом
переводы ϕ′ всех аксиом ϕ теории S, и при этом получится эквивалентная S ′ формальная теория S ′′ ,
в том смысле, что все, что выводимо в S ′ будет выводимо в S ′′ , и наоборот. Это не вполне очевидный
факт, потому что здесь нужно проверить, что система аксиом получающейся теории будет снова
состоять из конечного набора формул и конечного набра схем формул. Чтобы это увидеть, нужно
заметить, что процедура перевода применима не только к формулам, но и к схемам формул, для
которых она описывается теми же правилами, только в формулировках слово “формула” нужно
заменять на слово “метаформула”. Затем применяется следующая очевидная
Лемма 2.1.49. Всякую схему формул Φ в теории S эта процедура переводит в некоторую схему
формул Φ′ в теории T ′ .
130 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Это наблюдение понадобится нам ниже при доказательстве теорем Геделя о непротиворечивости
(теоремы 2.2.19 и 2.2.22).

! 2.1.50. Конструкция интерпретации позволяет “погрузить” данную теорию S в построенное дефи-


нициальное расширение S ′ теории T . С другой стороны, по теореме 2.1.46 дефинициальное расшире-
ние S ′ само можно считать теорией, погруженной в T . Поэтому мы получаем “цепочку погружений”
(здесь символ ⊆ используется неформально, не как обозначение из теории множеств):

S ⊆ S′ ⊆ T .

Действие интерпретации на выводимые формулы и секвенции.

Теорема 2.1.51. Если формула ϕ теории S выводима (соответственно, опровержима) в S, то в


любой интерпретации S ′ теории S ее перевод ϕ′ также выводим (соответственно, опровержим).

Прежде, чем доказывать этот факт, мы приведем важное следствие из него:

Следствие 2.1.52. Если в теории S выводима секвенция

Γ ⊢∆

то в любой интерпретации S ′ теории S выводим перевод этой секвенции:

Γ ′ ⊢ ∆′

Доказательство. Здесь нужно сначала по теореме об антецеденте 0.2.28 заменить антецедент Γ на


конъюнкцию γ входящих в него формул
γ ⊢ ∆,
затем по теореме о сукцеденте 0.2.29 заменить сукцедент ∆ на дизъюнкцию δ входящих в него
формул
γ ⊢ δ,
Затем по теореме об импликации 2.1.23 выводимость этой секвенции становится равносильна выво-
димости секвенции
⊢ γ ⇒ δ,
Теперь применяя теорему 2.1.51, мы получаем, что в S ′ должна быть выводима секвенция

⊢ (γ ⇒ δ)′ ,

или, что то же самое, секвенция


⊢ γ ′ ⇒ δ′.
После этого снова применяя теорему об импликации 2.1.23, мы получаем, что в S ′ выводима се-
квенция
γ ′ ⊢ δ′.
И, опять применяя теоремы об антецеденте 0.2.28 и о сукцеденте 0.2.29, мы получаем, что в S ′
выводима секвенция
Γ ′ ⊢ ∆′ .

Для доказательства теоремы 2.1.51 нам понадобится следующая




Лемма 2.1.53. Если α — корректная подстановка, и y1 , ..., yn – переменные в терме τ , то
x=τ
 ′   

α ∼ U (y1 ) & ... & U (yn ) ⇒ α′ (2.1.96)
x=τ x=τ ′

Доказательство теоремы 2.1.51. Здесь схема рассуждений похожа на ту, что использовалась в
доказательстве второй части теоремы 2.1.46, только каждый шаг усложняется пропроционально
усложнению конструкции ϕ′ в сравнении с ϕ.
b
§ 1. Формальные теории 131

Нам достаточно рассмотреть случай, когда формула ϕ выводима в S. Тогда у нее есть вывод в
S, то есть некое дерево Генцена,
λ⊢λ ⊢γ
Γ3 ⊢∆3 Γ4 ⊢∆4
Γ1 ⊢∆1 Γ2 ⊢∆2
... ...
(2.1.97)
⊢ϕ
у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
λ ⊢ λ), либо секвенции вида ⊢ γ, где γ — аксиомы теории S.
Преобразуем каждую формулу ψ в этом дереве в формулу ψ ′ теории S ′ (по правилам, описанным
на с.129). Мы получим некую картинку с секвенциями теории S ′ :
λ′ ⊢λ′ ⊢γ ′
Γ ′ ⊢∆′ Γ ′ ⊢∆′
3 3 4 4
Γ1′ ⊢∆′ Γ2′ ⊢∆′
1 2
... ...
(2.1.98)
⊢ ϕ′
В вершинах этой картинки стоят либо секвенции вида λ′ ⊢ λ′ , то есть аксиомы исчисления предика-
тов LK, либо секвенции вида ⊢ γ ′ , где γ — аксиомы теории S, а это выводимые секвенции, поскольку
операция γ 7→ γ ′ есть интерпретация теории S.
Поэтому если доказать, что в (2.1.98) каждый переход вниз осуществляется по правилам вывода
исчисления LK, то это будет выводом секвенции

⊢ ϕ′

(что нам и нужно).


Таким образом, остается проверить только, что конструкция (2.1.98) — это либо само по себе
дерево Генцена, либо ее можно дополнить до дерева Генцена.
Это делается вот как. Каждый переход в (2.1.98)

Γp′ ⊢ ∆′p
(2.1.99)
Γq′ ⊢ ∆′q

получен как преобразование по правилам (2.1.95)—(2.1.94) соответствующего перехода в (2.1.97)


Γp ⊢ ∆p
, (2.1.100)
Γq ⊢ ∆q

который в свою очередь получен применением какого-то из правил вывода (LK-1*) — (LK-15*).
Нужно перебрать все правила от (LK-1*) до (LK-15*) и убедиться, что всякий раз, когда в (2.1.100)
выводимость нижней секвенция следует из выводимости верхней применением этого правила, в
(2.1.99) выводимость нижней секвенции также получается из выводимости верхней применением
этого же правила, возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (2.1.100) получено применением первого правила в (LK-1*), то есть имеет вид
Γ ⊢∆
α, Γ ⊢ ∆
Тогда (2.1.99), получаемое преобразованием этого перехода, имеет вид

Γ ′ ⊢ ∆′
,
α′ , Γ ′ ⊢ ∆′
и это тоже применение правила (LK-1*).
2. Следующие правила, от (LK-2*) до (LK-11*) включительно проверяются так же элементарно.
3. Сложности начинаются с правила (LK-12*). Пусть (2.1.100) получено применением этого пра-
вила, то есть имеет вид
α x=τ , Γ ⊢ ∆
∀x α, Γ ⊢ ∆
— где x — переменная, а τ – терм. Это преобразуется в переход

(α x=τ )′ , Γ ′ ⊢ ∆′
,
(∀x α)′ , Γ ′ ⊢ ∆′
132 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

По правилам преобразования (2.1.96) и (2.1.92) этот переход расшифровывается так:



U (y1 ) & ... & U (yn ) ⇒ α′ x=τ ′ (y ,...,y ) , Γ ′ ⊢ ∆′
1 n
, (2.1.101)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′

– здесь в числителе мы заменили формулу (α x=τ )′ на эквивалентную ей в (силу (2.1.96)) формулу

U (y1 ) & ... & U (yn ) ⇒ α′ x=τ ′ (y1 ,...,yn) , применяя теорему 2.1.27.
Дальше нам полезно будет ввести некое обозначение для упрощения формул. Условимся фор-
мулу U (y1 ) & ... & U (yn ) коротко записывать как U (y):

U (y) = U (y1 ) & ... & U (yn ) (2.1.102)

Тогда (2.1.101) можно переписать так:



U (y) ⇒ α′ x=τ ′ , Γ ′ ⊢ ∆′
, (2.1.103)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
Теперь чтобы доказать, что из верхней секвенции здесь выводится нижняя, заметим, что из
правила (2.1.90), записанного применительно к нашим условиям в виде

U (y1 ), ..., U (yn ) ⊢ U τ ′ (y1 , ..., yn ) ,

или, что эквивалентно, из выводимости



U (y1 ) & ... & U (yn ) ⊢ U τ ′ (y1 , ..., yn ) ,

по теореме 2.1.26 следует выводимость секвенции


 
U τ ′ (y1 , ..., yn ) ⇒ α′ x=τ ′ (y1 ,...,yn) ⊢ U (y1 ) & ... & U (yn ) ⇒ α′ x=τ ′ (y1 ,...,yn)

Если снова воспользоваться обозначением (2.1.102), то эту секвенцию можно будет коротко записать
так: 
U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′
Добавив ее слева к верхней секвенции в (2.1.103), мы получим дерево

U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′ U (y) ⇒ α′ x=τ ′ , Γ ′ ⊢ ∆′
(LK-4*)

U τ ′ (y) ⇒ α′ x=τ ′ (y) , Γ ′ ⊢ ∆′
(LK-12*)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
Здесь секвенция в левой вершине, как мы уже заметили, выводима. Поэтому из выводимости се-
квенции в правой вершине следует выводимость корня дерева.
4. Пусть (2.1.100) получено применением правила (LK-13*), то есть имеет вид

Γ ⊢ ∆, α x=y
Γ ⊢ ∆, ∀x α
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
 ′
Γ ′ ⊢ ∆′ , α x=y
 ′
Γ ′ ⊢ ∆′ , ∀x α

который по правилам преобразования (2.1.96) и (2.1.92) расшифровывается так:



Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=y
Γ ′ ⊢ ∆′ , ∀x U (x) ⇒ α′
(опять мы в числителе заменяем формулу на эквивалентную, применяя теорему 2.1.27), или, что
эквивалентно, так: 
Γ ′ ⊢ ∆′ , U (x) ⇒ α′ x=y
.
Γ ′ ⊢ ∆′ , ∀x U (x) ⇒ α′
§ 1. Формальные теории 133

При этом, y по-прежнему не входит (как свободная переменная) в нижнюю секвенцию. Но это в
точности применение правила (LK-13*) к верхней секвенции.
5. Пусть (2.1.100) получено применением правила (LK-14*), то есть имеет вид

α x=y , Γ ⊢ ∆
∃x α, Γ ⊢ ∆

— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
 ′
α x=y , Γ ′ ⊢ ∆′
 ′
∃x α , Γ ′ ⊢ ∆′

который по правилам преобразования (2.1.96) и (2.1.94) расшифровывается так:



U (y) ⇒ α′ x=y , Γ ′ ⊢ ∆′
(2.1.104)
∃x U (x) & α′ , Γ ′ ⊢ ∆′

Теперь чтобы доказать, что из верхней секвенции здесь выводится нижняя, заметим, что выведен-
ную нами выше секвенцию (0.2.73) можно записать применительно к нашим условиям в виде

U (y) & α′ ⊢ U (y) ⇒ α′
x=y x=y

или, что эквивалентно, в виде



U (x) & α′ x=y ⊢ U (y) ⇒ α′ x=y

Добавив эту секвенцию слева к верхней секвенции в (2.1.104), мы получим дерево Генцена

U (x) & α′ x=y ⊢ U (y) ⇒ α′ x=y U (y) ⇒ α′ x=y , Γ ′ ⊢ ∆′
(LK-4*)

U (x) & α′ x=y , Γ ′ ⊢ ∆′
(LK-14*)
∃x U (x) & α′ , Γ ′ ⊢ ∆′

Оно и есть нужное нам дополнение картинки (2.1.104).


6. Пусть (2.1.100) получено применением правила (LK-15*), то есть имеет вид

Γ ⊢ ∆, α x=τ
Γ ⊢ ∆, ∃x α

— где x — переменная, а τ – терм. Это преобразуется в переход


 ′
Γ ′ ⊢ ∆′ , α x=τ
 ′ .
Γ ′ ⊢ ∆′ , ∃x α

По правилам преобразования (2.1.96) и (2.1.94) этот переход расшифровывается так:



Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=τ ′
. (2.1.105)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′

— где как и раньше, в соответствии с соглашением (2.1.102), под U (y) понимается U (y1 ) & ... & U (yn ).
Заметим, что по теореме 2.1.23 секвенция

Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=τ ′

выводима если и только если выводима секвенция



U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
134 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Поэтому (2.1.105) можно переписать в виде



U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
. (2.1.106)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′

Теперь рассмотрим дерево Генцена

U (y) ⊢ U (τ ′ (y))
(LK-1*)
U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
(LK-6*)

U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) & α′ x=τ ′
(LK-15*)
U (y), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(2.1.102)
U (y1 ) & U (y2 ) & ... & U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
Теорема 0.2.28
U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-14*)
⊢ ∃y1 U (y1 ) ∃y1 U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-4*)
U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-4*)
...
(LK-4*)
⊢ ∃yn U (yn ) U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-4*)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)

Здесь самая правая вершина — секвенция U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′ — верхняя секвенция в (2.1.106).
Вершина на самом верху — секвенция U (y) ⊢ U (τ ′ ) — правило (2.1.90), записанное для терма τ ′ .
Остальные вершины — секвенции ⊢ ∃yi U (yi ) — представляют собой правило (2.1.88) непустоты уни-
версума, записанное для переменных yi . С их помощью мы последовательно избавляемся от формул
′ ′ ′
1 ), ..., U (yn ), Γ ⊢ ∆ , ∃x′ U (x)′ & α (x). Из этого
U (yi ) в антецеденте получающейся секвенции U (y

де-
′ ′
рева видно, что если выводится U (y), Γ ⊢ ∆ , α x=τ ′ , то выводится и Γ ⊢ ∆ , ∃x U (x) & α′ (x).

⋄ 2.1.54. Нетрудно заметить, что любая теория символ + определяется теоремой 1.1.1, а символ
S тривиальным образом интерпретируется в са- · – теоремой 1.1.3. Тогда
мой себе, если в качестве универсума U выбира- — условие (2.1.35) будет выполняться в силу
ется какая-нибудь выводимая формула, напри- свойства 20 на с.54,
мер, x = x.
— условие (2.1.36) будет выполняться в силу
⋄ 2.1.55. Интерпретация арифметики Пеано свойства 60 на с.55,
PA в теории множеств MK. Рассмотрим сигна-
— условие (2.1.37) будет выполняться в силу
туру теории PA, описанную в примере 2.1.18:
(1.1.1),
0, S, +, · — условие (2.1.38) будет выполняться в силу
Вспомним определения, которые мы давали этим (1.1.2),
символам в теории MK. Оставим эти определе- — условие (2.1.39) будет выполняться в силу
ния, подкорректировав только одно из них, для (1.1.22),
функции S, а именно: пусть символ 0 обозначает — условие (2.1.40) будет выполняться в силу
пустое множество ∅ (то есть определяется фор- (1.1.23),
мулой (0.3.260))
— условие (2.1.41) будет выполняться по теоре-
0 = ∅,
ме 0.3.79 (принцип обыкновенной индукции).
символ S – ограничение отображения S, опре-
деленного формулой (0.3.293), на множество Вместе все это означает, что такая система опре-
FinOrd конечных ординалов делений для символов 0, S, +, · в теории MK
будет интерпретацией теории PA в теории MK (с
S(X) = X ∪ {X}, универсумом x ∈ FinOrd).
§ 1. Формальные теории 135

Модели. Частным случаем понятия интерпретации является следующая конструкция.


• Пусть S – произвольная формальная теория с сигнатурой Σ, и пусть
— выделено некоторое непустое множество M как объект теории MK (это значит,
что задана некая формула U , описывающая множество M по аксиоме выделения
MK-7′ на с.29),
— всякому предикатному символу η валентности n из сигнатуры Σ поставлено в
соответствие некое множество η ′ ⊆ M n (это значит, что задана некая формула
Uη , описывающая некое множество η ′ ⊆ M n по аксиоме выделения MK-7′ на
с.29),
— всякому функциональному символу η валентности n из сигнатуры Σ постав-
лено в соответствие некое отображение η ′ : M n → M (это тоже значит, что
задана некая формула Uη , описывающая некое отображение η ′ : M n → M как
n
множество в M M по аксиоме выделения MK-7′ на с.29).
Если относиться к η ′ как к присоединенным предикатным и функциональным символам,
то мы получим некое дефинициальное расширение S ′ теории MK. По аналогии с тем, как
это делалось на с.129, каждой формуле ϕ теории S поставим в соответствие формулу ϕ′
теории S ′ по следующим правилам:
— каждый предикатный символ η, примененный к термам τ1 , ..., τn , в ϕ нужно заменить
на формулу (τ1 , ..., τn ) ∈ η ′ ,
— каждый функциональный символ η в ϕ нужно заменить на соответствующий символ
η ′ (при этом каждый терм τ заменится на некий терм τ ′ ),
— каждую подформулу
∀x α (2.1.107)
нужно заменить на подформулу
 
∀x x ∈ M ⇒ (α) (2.1.108)

— каждую подформулу
∃x α (2.1.109)
нужно заменить на подформулу
 
∃x x ∈ M & (α) (2.1.110)

— если в ϕ есть свободные переменные x1 , ..., xn , то заменяем ϕ на формулу

(x1 ∈ M & ... & xn ∈ M ) ⇒ (ϕ) (2.1.111)

Теория S ′ называется моделью теории S, если для всякой аксиомы ϕ теории S соответ-
ствующая формула ϕ′ выводима в S ′ (разумеется, это эквивалентно тому, что теория S ′
является интерпретацией S в смысле определения на с.128). Множество M при этом на-
зывается универсумом этой модели, а формула ϕ′ — переводом формулы ϕ в этой модели.

⋄ 2.1.56. Интерпретация арифметики Пеано PA 2.1.55, является моделью теории PA в MK с уни-


в теории множеств MK, описанная в примере версумом N = FinOrd.

Из теоремы 2.1.51 сразу следует


Теорема 2.1.57. Если формула ϕ теории S выводима (соответственно, опровержима) в S, то
в любой модели S ′ теории S ее перевод ϕ′ также выводим (соответственно, опровержим).
136 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Теорему 2.1.57 невозможно усилить до утвер- этого дерева еще не представлена в 2-чной запи-
ждения, что выводимость формулы ϕ в теории си. Но если ее представить,
S эквивалентна выводимости формулы ϕ′ в ее
21
модели S ′ . Вот типичная иллюстрация: 35 = 22 +1 + 21 + 20 ,

⋄ 2.1.58. Пусть S – теория групп, описанная в то мы получим наследственную запись числа 35


примере 2.1.17. Аддитивная группа Z целых чи- по базе 2.
сел является моделью этой теории, и в ней, меж- Далее вводится следующее определение. Для
ду прочим, выполняется тождество коммутатив- всякого натурального числа m его последова-
ности: тельностью Гудстейна называется последова-
 тельность {G(m)k ; k > 2}, определенная следу-
∀x ∀y x ∈ Z & y ∈ Z ⇒ x·y = y ·x . (2.1.112) ющими индуктивными правилами:

Эту формулу можно считать переводом в Z со- 0) G(m)2 = m,


ответствующей формулы в S, 1) если G(m)k−1 уже определено, то
 — если G(m)k−1 = 0, то мы полагаем
∀x ∀y x·y =y·x , (2.1.113) G(m)k = 0
однако (2.1.112) выводима в Z, но (2.1.113) невы- — если G(m)k−1 6= 0, то мы рассматриваем
водима в исходной теории S, потому что су- наследственную запись этого числа по ба-
ществуют некоммутативные группы (последнее, зе k−1, затем заменяем в этой записи всю-
впрочем, доказывается только в предположении ду k − 1 на k и вычитаем единицу; полу-
непротиворечивости MK, см. пример 2.2.2820 ). ченное число и будет G(m)k .
Например, для числа 3 получающаяся после-
Это был элементарный пример, однако даже довательность Гудстейна выглядит так:
в ситуациях, когда теория S интерпретируется в
рабочей теории множеств какой-то своей моде- G(3)2 = 21 + 1 = 3,
лью M настолько естественно, что выводимость
формул в S кажется “очевидно эквивалентной G(3)3 = (31 + 1) − 1 = 31 = 3,
выводимости в модели M ”, это как правило тоже
G(3)4 = 41 − 1 = 3,
оказывается неверно. В частности, это так для
стандартных моделей арифметики Пеано PA в G(3)5 = 3 − 1 = 2,
рабочих теориях множеств:
G(3)6 = 2 − 1 = 1,
⋄ 2.1.59 (теорема Гудстейна). Рассмотрим мо- G(3)7 = 1 − 1 = 0,
дель арифметики Пеано PA в теории множеств
MK, о которой мы говорили в примере 2.1.56. Ан- G(3)8 = 0,
глийским математиком Рубеном Гудстейном был ...
предложени пример невыводимой формулы ϕ в
PA, интепретация которой ϕ′ в модели N теории Здесь видно, что последовательность G(3)k об-
PA в MK тем не менее выводима. нуляется. Теорема Гудстейна состоит из двух
Чтобы объяснить этот результат, условимся утверждений:
под наследственной записью числа m ∈ N по ба- 1) в любой рабочей теории множеств, напри-
зе k ∈ N понимать запись числа m в k-чной си- мер, в MK, для любого натурального чис-
стеме, в которой все возникающие числа (вклю- ла m ∈ N последовательность Гудстейна
чая степени, а потом появляющиеся степени в G(m)k обнуляется, и
степенях и так далее) тоже записаны в k-чной 2) в арифметике Пеано PA это утверждение,
системе. Например, число 35 можно записать в хотя и формулируемо, но недоказуемо.
2-чной системе
Объясним теперь, почему это следует считать
35 = 32 + 2 + 1 = 25 + 21 + 20 , иллюстрацией к теореме 2.1.57. Пусть S = PA и
пусть ϕ обозначает формулу в этой теории, вы-
однако это еще не будет наследственная запись ражающую утверждение, что для любого нату-
по базе 2, потому что число 5 записано здесь не рального числа m последовательность Гудстейна
в двоичной системе. Если записать 5 в 2-чной си- G(m)k обнуляется. По теореме Гудстейна, фор-
стеме, мула ϕ невыводима в S = PA (это утверждается
35 = 2 22 +1 1
+2 +2 ,0 во второй части теоремы Гудстейна). Но ее ин-
терпретация ϕ′ выводима в теории MK (именно
то это также пока не будет наследственная за- это утверждает первая часть теоремы Гудстей-
пись по базе 2, потому что степень 2 на вершине на).
20 В данном случае, поскольку речь идет об элементарной теории (с конечной системой аксиом и без схем аксиом),

это утверждение можно доказать построением более простой, чем MK, теории множеств.
§ 2. Непротиворечивость и арифметизация 137

§2 Непротиворечивость и арифметизация
Помимо интерпретаций в логике имеется еще один способ погрузить одну формальную теорию в
другую, а именно, кодировка. Это процедура, превращающая формулы и деревья Генцена заданной
теории S в термы другой теории T . В зависимости от выразительности языка теории T это поз-
воляет в некоторых случаях превратить суждения о выводимости формул S в формулы теории T .
Среди таких процедур в логике имеется две главные, из которых получаются основные результаты
этой науки: кодировка средствами арифметики (арифметизация) и кодировка средствами теории
множеств (семантизация). Первая из них предлагает эффективный инструмент для исследования
вопросов непротиворечивости формальных теорий, а вторая позволяет в некотором смысле изба-
виться от самого понятия формальной теории, заменив его подходящим дефинициальным расши-
рением рабочей теорией множеств. В этом параграфе мы опишем первую процедуру.

(a) Непротиворечивость и ω-непротиворечивость


Непротиворечивые теории.
Теорема 2.2.1. Для формулы ϕ в теории T следующие условия эквивалентны:
(i) формула ϕ одновременно выводима и опровержима в теории T (то есть в T выводимы
формулы ϕ и ¬ϕ),
(ii) в T выводима формула ϕ & ¬ϕ,
(iii) в T выводима формула ϕ ⇔ ¬ϕ.
Доказательство. 1. Эквивалентность условий (i) и (ii) следует из теоремы 2.1.22, поэтому импли-
кацию (i)⇒(ii) можно не доказывать.
2. Докажем импликацию (ii)⇒(iii). Вспомним выведенную выше секвенцию (0.2.73),

α & β ⊢ α ⇒ β. (2.2.114)

Подставив ϕ вместо α, а ¬ϕ вместо β, мы получим секвенцию

ϕ & ¬ϕ ⊢ ϕ ⇒ ¬ϕ,

которая также выводима. Подклеим ее вывод к правой вершине дерева


⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ ϕ ⇒ ¬ϕ
(LK-4*)
⊢ ϕ ⇒ ¬ϕ

Если теперь выводима формула ϕ & ¬ϕ, то подклеив ее вывод к левой вершине, мы получим вывод
формулы ϕ ⇒ ¬ϕ.
Точно также заменив в (2.2.114) α на ¬ϕ, а β на ϕ, мы получим выводимую секвенцию

¬ϕ & ϕ ⊢ ¬ϕ ⇒ ϕ.

Подклеим ее вывод к правой вершине дерева


⊢ ¬ϕ & ϕ ¬ϕ & ϕ ⊢ ¬ϕ ⇒ ϕ
(LK-4*) (2.2.115)
⊢ ¬ϕ ⇒ ϕ

Теперь если выводима формула ϕ & ¬ϕ, то, в силу выводимости секвенции (0.2.41), выводима и
формула ¬ϕ & ϕ. Подклеив ее вывод к левой вершине дерева (2.2.115), мы получим вывод формулы
¬ϕ ⇒ ϕ.
Мы получили, что если выводима формула ϕ & ¬ϕ, то выводимы формулы ϕ ⇒ ¬ϕ и ¬ϕ ⇒ ϕ.
Значит, выводима формула ϕ ⇔ ¬ϕ.
3. Остается последняя импликация (iii)⇒(i). Пусть выводима некоторая формула ϕ ⇔ ¬ϕ, то
есть секвенция
⊢ ϕ ⇔ ¬ϕ.
138 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Это означает выводимость секвенций


⊢ ϕ ⇒ ¬ϕ
и
⊢ ¬ϕ ⇒ ϕ.
По теореме 0.2.40 это эквивалентно выводимости секвенций

ϕ ⊢ ¬ϕ

и
¬ϕ ⊢ ϕ.
Выводимость первой из них влечет выводимость формулы ¬ϕ в силу дерева

ϕ ⊢ ¬ϕ
(LK-5*)
⊢ ¬ϕ, ¬ϕ
(LK-2*)
⊢ ¬ϕ

А выводимость второй влечет выводимость формулы ϕ в силу дерева

¬ϕ ⊢ ϕ
(LK-5*)
⊢ ϕ, ¬(¬ϕ) ¬(¬ϕ) ⊢ ϕ (0.2.72)
(LK-4*)
⊢ ϕ, ϕ
(LK-2*)
⊢ϕ

(в котором секвенция в правой вершине была выведена раньше в (0.2.72)).


• Если в теории T существует формула ϕ, удовлетворяющая условиям теоремы 2.2.1, то тео-
рия T называется противоречивой. В противном случае (если формулы ϕ с описанными
в этой теореме свойствами не существует), теория T называется непротиворечивой.

⋄ 2.2.2. Наивная теория множеств NST, которую (где R — множество Рассела, определенное фор-
мы строили в § 1 главы 0, противоречива по тео- мулой (0.1.18)). По той же теореме 2.2.1 это, в
реме 2.2.1 как формальная теория, потому что частности, означает, что в NST выводима также
парадокс Рассела (0.1.20), обсуждавшийся нами формула
в примере 0.1.13, означает выводимость в этой R∈R&R∈ / R,
теории формулы
а также по отдельности каждая из формул R ∈ R
R∈R ⇔ R∈
/R иR∈ / R, о чем мы говорили в замечании 0.1.14.

Теорема 2.2.3 (о противоречивых теориях). Формальная теория T противоречива тогда и толь-


ко тогда, когда в ней любая формула одновременно выводима и опровержима.
Доказательство. 1. Достаточность: если в T выводима любая формула, то, в частности в T выво-
дима любая формула вида ϕ & ¬ϕ, и поэтому T будет противоречива.
2. При доказательстве необходимости нам понадобится секвенция (0.2.71), которую мы вывели
когда-то. Предположим, что T противоречива, то есть в ней выводима формула вида ϕ & ¬ϕ, то
есть секвенция
⊢ ϕ & ¬ϕ. (2.2.116)
Тогда для всякой формулы ψ мы можем рассмотреть дерево Генцена

⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ ψ (0.2.71)


(LK-4*)
⊢ψ
§ 2. Непротиворечивость и арифметизация 139

Если к его вершинам приклеить их выводы (к левой вершине вывод секвенции (2.2.116), а к правой
– вывод секвенции (0.2.71), который мы получили раньше), то это дерево превратится в вывод
формулы ψ в теории T .
То есть ψ выводима в теории T . Это верно для любой формулы ψ, поэтому если взять вместо
нее формулу ¬ψ, то для нее это тоже будет верно. Значит, обе формулы, ψ и ¬ψ выводимы в T .

Ниже нам будет полезна следующая

Лемма 2.2.4. Если в формальной теории T для каких-то формул ϕ и ψ выводится секвенция

ψ ⊢ ϕ & ¬ϕ, (2.2.117)

то в T выводится и секвенция
ψ⊢ (2.2.118)

Доказательство. Здесь снова используется секвенция (0.2.71). Если ее вывод подклеить к правой
вершине, а вывод секвенции (2.2.117) — к левой вершине дерева

ψ ⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ (0.2.71)


(LK-4*)
ψ⊢

то мы получим вывод секвенции (2.2.118).

Из теоремы 2.2.3 следует

Теорема 2.2.5 (о пустой секвенции). Формальная теория T противоречива тогда и только тогда,
когда в ней выводима пустая секвенция:
⊢ (2.2.119)

Доказательство. 1. Если в T выводима секвенция (2.2.119), то для любой формулы ψ мы получим


дерево Генцена

(LK-1*)
⊢ψ

к которому если сверху приклеить вывод секвенции (2.2.119), то оно превратится в вывод формулы
ψ. То есть любая формула выводима в T , и по теореме 2.2.3 это означает, что теория T противоре-
чива.
2. Наоборот, если T противоречива, то по теореме 2.2.3 в ней выводима любая формула ψ, то
есть любая секвенция
⊢ ψ.
В частности, это верно для пустой формулы, то есть выводима секвенция (2.2.119).21

Еще одно следствие теоремы 2.2.3:

Теорема 2.2.6. Если в формальной теории T существует невыводимая формула ϕ, то теория


T непротиворечива.

Справедлива также следующая

Теорема 2.2.7. Если замкнутая формула ϕ в теории T невыводима, то (не только теория T ,
но и) теория T + ¬ϕ непротиворечива.
21 Для привыкания к подобным трюкам полезно поглядеть на доказательство необходимости в теореме 2.2.3 с

подставленной в него вместо ψ пустой формулой. Дерево Генцена при этом получается таким:

⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ (0.2.71)


(LK-4*)

140 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Доказательство. Заметим, что аксиомы теории T тоже можно считать замкнутыми (как и форму-
лу ϕ), потому что по теореме 2.1.36 теория T и ее замыкание T дают один и тот же класс выводимых
формул.
Теперь предположим, что теория T + ¬ϕ противоречива. Тогда по теореме 2.2.5 в ней выводится
пустая секвенция
⊢ (2.2.120)
По определению вывода, это значит, что в теории T из формулы ¬ϕ выводится пустая формула.
Поскольку формула ¬ϕ замкнута (потому что ϕ замкнута), по теореме о дедукции 2.1.33 мы полу-
чаем, что пустая формула (не просто выводится, но и) следует из ¬ϕ в T . То есть в T выводится
секвенция
¬ϕ ⊢ . (2.2.121)
Рассмотрим дерево Генцена в T :
¬ϕ ⊢
(LK-5*)
⊢ ¬¬ϕ
теорема 2.1.27
⊢ϕ
Если к его вершине подклеить вывод секвенции (2.2.121), то мы получим вывод формулы ϕ. То
есть формула ϕ выводима в T . Но это невозможно, потому что по условиям теоремы ϕ выбрана
как невыводимая формула в T .
Теорема 2.2.8 (о наследовании противоречивости при интерпретациях). Пусть задана интерпре-
тация S ′ теории S в теории T . Тогда
— если теория S противоречива, то теория T тоже противоречива,
— если теория T непротиворечива, то теория S тоже непротиворечива,
Доказательство. Здесь достаточно проверить первое утверждение. Если ϕ – формула в теории
S, являющаяся одновременно выводимой и опровержимой, то по теореме 2.1.51 соответствующая
формула ϕ′ в теории T также будет одновременно выводимой и опровержимой.

ω-непротиворечивые теории. Пусть нам дана какая-нибудь интерпретация арифметики Пеано


PA в какой-нибудь теории T с универсумом U в переменной x. Говорят, что с этой интерпретацией
PA теория T ω-противоречива, если в T найдется формула ϕ в переменной x со следующими
свойствами:
1) в теории T выводима формула ∃x (U & ϕ), и
терма (то есть терма нулевой валентности) τ в PA в теории T
2) для всякого замкнутого
выводима формула ¬ϕ x=τ ′ (где τ ′ — перевод терма τ теории PA в теории T ).
Наоборот, теория T называется ω-непротиворечивой, если в T нет такой формулы. Иными сло-
вами, для всякой формулы ϕ в T в переменной x выводимость в T формулы
∃x (U & ϕ)
влечет за собой существование замкнутого терма τ в PA такого что в T выводима и формула

¬ϕ x=τ ′ .
Теорема 2.2.9. Если с заданной интерпретацией PA теория T ω-непротиворечива, то T непро-
тиворечива.
Доказательство. Покажем, что наоборот, если T противоречива, то T ω-противоречива. Пусть
T противоречива, тогда по теореме 2.2.3 в T любая формула выводима. В частности, если ϕ –
произвольная формула в переменной x, то выводимы будут формула
∃x (U (x) & ϕ)
и все формулы
¬ϕ x=τ ′ ,
где τ – произвольные замкнутые термы в PA. Значит, теория T ω-противоречива.
! 2.2.10. Ниже в примере 2.2.24 мы увидим, что непротиворечивоть и ω-непротиворечивость — не
эквивалентные понятия.
§ 2. Непротиворечивость и арифметизация 141

(b) Арифметизация
Геделевы номера. Пусть S — формальная теория. Нумерацию ее деревьев Генцена (или коди-
ровку средствами теории PA) можно организовывать по-разному, один из возможных вариантов
следующий.
1. С самого начала нужно присвоить номера символам секвенции ⊢ и перехода на следующий
уровень в дереве Генцена −. Пусть это будут числа 3 и5:

p⊢q = 3 (2.2.122)
p−q = 5 (2.2.123)

2. Затем нужно присвоить номера скобкам и логическим символам. Это можно сделать,
например, занумеровав эти элементы нечетными числами, следующимми за 5:

p(q = 7 (2.2.124)
p)q = 9 (2.2.125)
p, q = 11 (2.2.126)
p¬q = 13 (2.2.127)
p&q = 15 (2.2.128)
p∨q = 17 (2.2.129)
p⇒q = 19 (2.2.130)
p∀q = 21 (2.2.131)
p∃q = 23 (2.2.132)

3. После этого нужно присвоить номер каждому элементу η сигнатуры Σ теории S. Это
также можно сделать, занумеровав их нечетными числами, следующими за 23:

pηq = 2k + 1, k > 12. (2.2.133)

Поскольку символов в сигнатуре конечное число, это проделывается за конечное число


шагов, и мы остановимся на каком-то нечетном числе N , которое будет последним номе-
ром элементов сигнатуры.
4. Далее мы присваиваем остальные нечетные числа символам алфавита A теории S:

pαq = 2k + 1, 2k + 1 > N. (2.2.134)

(где N — нечетное число из предыдущего пункта).


5. После этого нумеруются формулы теории S. Каждую формулу α мы рассматриваем как
последовательность символов
α = α1 α2 ...αn
и приписываем ей номер

pαq = 2pα1 q · 3pα2 q · ... · pnpαn q (2.2.135)

где pk — простые числа, занумерованные в порядке возрастания.


6. Далее нумеруются секвенции. Каждой секвенции γ1 , ..., γk ⊢ δ1 , ..., δl присваивается номер
pγk q pδ1 q
pγ1 , ..., γk ⊢ δ1 , ..., δk q = 2pγ1 q 3p,q · ... · pp,q p⊢q pδl q
s · ps+1 · ps+2 · ps+2 · ... · pm . (2.2.136)

7. Наконец, нумеруются деревья Генцена. Это делается индукционным процессом. Простей-


шие деревья Генцена
Q P Q
,
R R
нумеруются правилами
 
Q
p q = 2pQq · 3pRq (2.2.137)
R
 
P Q
p q = 2pP q · 3pQq · 5p−q · 7pRq (2.2.138)
R
142 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Если же какое-то дерево Генцена получено из

Q P Q
,
R R
подстановкой вместо P и Q деревьев P или Q соответственно, номера которых уже опре-
делены, то его номером считается
 
Q
p q = 2pQq · 3pRq (2.2.139)
R
 
P Q
p q = 2pPq · 3pQq · 5p−q · 7pRq (2.2.140)
R

Суждения о выводимости как формулы в PA. Геделю принадлежит наблюдение, что нуме-
рация секвенций и выводов данной теории S позволяет выразить суждения о выводимости формул
и секвенций в S средствами теории PA. Смысл проделанного им в этой области можно описать
двумя утверждениями, которые удобно представлять как главные технические результаты, лежа-
щие в фундаменте геделевских теорем о непротиворечивости (или о неполноте) 2.2.21 и 2.2.22: это
теорема 2.2.11, которую мы формулируем здесь, и следующая за ней ниже теорема 2.2.12.

Теорема 2.2.11. В предположении непротиворечивости арифметики Пеано PA, для всякой тео-
рии S с заданной нумерацией p·q ее деревьев Генцена в теории PA существует формула, опреде-
ляющая предикатный символ Prf валентности 2 со следующими свойствами:
(i) для произвольной данной формулы ϕ в S и произвольного дерева Генцена K в S формула

Prf(pKq, pϕq)

выводима в PA тогда и только тогда, когда дерево K является выводом формулы ϕ (или,
что то же самое, секвенции ⊢ ϕ) в S.
(ii) всякое дерево Генцена K (из метаформул) в LK с языком теории S, выражающее выводи-
мость метаформулы ψ из метаформул ϕ1 ,...,ϕn (то есть с n вершинами ⊢ ϕ1 ,...,⊢ ϕn ,
а также, возможно с другими вершинами, являющимися аксиомами теории LK (с язы-
ком S), то есть имеющими вид α ⊢ α, и с корнем ⊢ ψ),

⊢ϕ1
... ... ⊢ϕ
...
n
...
K : ,
⊢ψ

порождает формулу в теории PA, определяющую некий внешний функциональный сим-


вол FK валентности n, для которого при каждом значении метапеременных в ϕ1 ,...,ϕn
и в ψ в PA выводима секвенция

Prf(y1 , pϕ1 q), ..., Prf(yn , pϕn q) ⊢ Prf(FK (y1 , ..., yn ), pψq) (2.2.141)

(иными словами, если при данных значениях метапеременных в ϕ1 ,...,ϕn и в ψ объекты


y1 , ..., yn есть номера выводов для формул ϕ1 ,...,ϕn , то FK (y1 , ..., yn ) — номер вывода для
формулы ψ).

Как и теорема 2.2.12 ниже, это утверждение представляет собой перевод на язык исчисления
секвенций части технических результатов Геделя. Традиционно эта область освещается в логике
скупо и туманно22 по причине громоздскости сформировавшейся в ней на сегодняшний день систе-
мы рассуждений23 . Поскольку эта часть математики (рекурсивные функции и их применение) не
связана с математическим анализом, мы считаем разумным оставить это место в качестве пробела
со ссылкой на книгу П. Смита (которая, во всяком случае, формально дает возможность отследить
дальнейшие детали).24 .
22 См.например, доказательтство Предложения 10.9 в книге Г.Такеути. Теория доказательств. М.: Мир, 1978.
23 См.также подстрочное примечание на с.234 в книге P. Smith, An introduction to Gödel’s incompleteness theorems.
Cambridge University Press, 2007.
24 Мы предупреждали об этом пробеле (и точно так же о доказательстве теоремы 2.2.12) в Предисловии на с.vii.
§ 2. Непротиворечивость и арифметизация 143

Теории с нумерацией, интерпретирующие арифметику PA. Пусть теперь в теории S, по-


мимо того, что задана нумерация p·q деревьев Генцена, задана еще и интерпретация арифметики
Пеано PA с неким универсумом U (то есть теория S интерпретирует арифметику Пеано PA с уни-
версумом U ). Тогда формула Prf имеет естественный перевод Prf S в теории S. Следующий факт,
вместе со сформулированной выше теоремой 2.2.11, представляет, как мы уже говорили, один из
главных технических результатов Геделя, ведущих к теоремам о непротиворечивости 2.2.21 и 2.2.22.
Теорема 2.2.12. Пусть в теории S задана нумерация p·q деревьев Генцена, и одновременно S
интерпретирует арифметику Пеано PA. Тогда существует формула в S, определяющая функци-
ональный символ Ded валентности 1, такой что в S выводима секвенция

Prf S (y, pϕq) ⊢ Prf S (Ded(y), pPrf S (y, pϕq)q) (2.2.142)

(иными словами, если y — номер вывода для формулы ϕ, то Ded(y) — номер вывода для формулы
Prf(y, pϕq)).
Этот результат, как и теорему 2.2.11 выше, мы приводим без доказательства со ссылкой книгу
П. Смита25 .
• Пусть в теории S задана нумерация p·q деревьев Генцена, и одновременно задана интер-
претация арифметики Пеано PA с неким универсумом U (то есть теория S интерпретирует
арифметику Пеано PA с универсумом U ), и пусть Prf S — естественный перевод формулы
Prf в теории S. Тогда формула

PrS (x) ⇔ ∃y U (y) & Prf S (y, x) (2.2.143)

определяет внешний предикатный символ PrS валентности 1 для S, который называется


предикатом выводимости в теории S. Эту формулу можно интерпретировать как утвер-
ждение, что формула ϕ с геделевым номером pϕq = x выводима в теории S, однако
формально это так только если теория S ω-непротиворечива (см. ниже теорему 2.2.13).
Следующую систему утверждений иногда называют “Условиями выводимости Гильберта—Бернайса”
(“Hilbert—Bernays derivability conditions”).26

Свойства предиката выводимости PrS :



1 Если формула ϕ выводима в теории S, то в S выводима формула PrS (pϕq).

2 Если в теории S выводима формула ϕ ⇒ ψ , то в S выводима формула PrS (pϕq) ⇒
PrS (pψq).
3◦ Если в теории S выводима формула ϕ ⇔ ψ, то в S выводима формула PrS (pϕq) ⇔
PrS (pψq).
4◦ Для всякой формулы ϕ в теории S выводима секвенция

PrS (pϕq) ⊢ PrS (pPrS (pϕq)q) (2.2.144)

5◦ Для любых формул ϕ и ψ в теории S выводима секвенция

PrS (pϕq) & PrS (pψq) ⊢ PrS (pϕ & ψq) (2.2.145)

6◦ Для любых формул ϕ и ψ в теории S выводима секвенция

PrS (pϕ & ¬ϕq) ⊢ PrS (pψq) (2.2.146)

Доказательство. 1. Пусть формула ϕ выводима в теории S. Это значит, что у нее есть некоторый
вывод P в S. Поэтому по теореме 2.2.11, в PA выводима формула Prf(pP q, pϕq). Отсюда по теореме
2.1.51 в S выводима формула Prf S (pP q, pϕq), а значит и формула PrS (pϕq).
2. Пусть ϕ и ψ — конкретные формулы теории S и оказалось, что в S выводима формула ϕ ⇒ ψ.
Это значит, что у нее имеется некий вывод Q. Зафиксируем эти значения метапеременных ϕ и ψ и
этот вывод Q.
25 См. выше подстрочные примечания 22 и 23. В Предисловии на с.vii мы говорили об этом пробеле.
26 В учебниках по логике эти утверждения обычно формулируются без доказательств или с набросками доказа-
тельств (см. напр. книгу Г.Такеути. Теория доказательств. М.: Мир, 1978 (Предложении 10.9), или книгу P.Smith,
An introduction to Gödel’s incompleteness theorems. Cambridge University Press, 2007 (Section 25.2)). Мы выводим эти
утверждения из сформулированых выше теорем 2.2.11 и 2.2.12.
144 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Заметим, что поскольку S интерпретирует PA, из условия (2.1.89) следует выводимость в S


секвенции
⊢ U (pQq) (2.2.147)
а из (данной по условию) выводимости формулы ϕ ⇒ ψ по уже доказанному свойству 1◦ следует
выводимость секвенции
⊢ Prf S (pQq, pϕ ⇒ ψq). (2.2.148)
и, кроме того, по свойству универсума (2.1.90), выводима секвенция

U (y), U (pQq) ⊢ U (FK (y, pQq)). (2.2.149)

Далее, по теореме дедукции 2.1.33, правило “modus ponens” (0.2.38), то есть выводимость секвен-
ции
ϕ, ϕ ⇒ ψ ⊢ ψ
можно представить как выводимость27 метаформулы ψ из метаформул ϕ и ϕ ⇒ ψ, то есть суще-
ствование дерева Генцена, у которого на вершинах стоят секвенции ⊢ ϕ и ⊢ ϕ ⇒ ψ (и возможно еще
аксиомы теории), а в корне — секвенция ⊢ ψ. Это дерево выглядит так:

ϕ⊢ϕ ψ⊢ψ
(LK-10*)
ϕ ⇒ ψ, ϕ ⊢ ψ
(LK-3*)
ϕ, ϕ ⇒ ψ ⊢ ψ
(LK-3*) (2.2.150)
⊢ϕ⇒ψ ϕ ⇒ ψ, ϕ ⊢ ψ
(LK-4*)
⊢ϕ ϕ⊢ψ
(LK-4*)
⊢ψ

По теореме 2.2.11 (ii) это означает, что в PA можно определить некий внешний функциональный
символ FK валентности 2, для которого будет выводима секвенция

Prf(y, pϕq), Prf(pQq, pϕ ⇒ ψq) ⊢ Prf(FK (y, pQq), pψq)

Применяя следствие 2.1.52, мы можем заключить из этого, что в теории S выводима секвенция

Prf S (y, pϕq), Prf S (pQq, pϕ ⇒ ψq) ⊢ Prf S (FK (y, pQq), pψq) (2.2.151)

По предложению 2.1.21, (2.2.151) и (2.2.149) вместе дают выводимость секвенции

U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ U (FK (y, pQq)) & Prf S (FK (y, pQq), pψq)

Мы достраиваем ее (вниз) до дерева Генцена

U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ U (FK (y, pQq)) & Prf S (FK (y, pQq), pψq)
(LK-15*)
U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ ∃z U (z) & Prf S (z, pψq)
(LK-14*)
∃y U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ ∃z U (z) & Prf S (z, pψq)
| {z } | {z }
k k
Pr S (pϕq) PrS (pψq)

и получаем, что выводима секвенция

PrS (pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ PrS (pψq).

Мы теперь по теореме об антецеденте 0.2.28 превращаем ее в секвенцию

PrS (pϕq), U (pQq), Prf S (pQq, pϕ ⇒ ψq) ⊢ PrS (pψq),


27 Отношение выводимости между формулами было определено на с.119.
§ 2. Непротиворечивость и арифметизация 145

и, пользуясь выводимостью (2.2.147) и (2.2.148), с помощью правил перестановки (LK-3*) и сечения


(LK-4*), избавляемся от формул U (pQq) и Prf S (pQq, pϕ ⇒ ψq):

PrS (pϕq) ⊢ PrS (pψq).

По теореме об импликации 2.1.23 выводимость такой секвенции равносильна выводимости формулы

PrS (pϕq) ⇒ PrS (pψq).

3. Свойство 3◦ теперь следует из 2◦ .


4. Свойство 4◦ следует из теоремы 2.2.12: в теории S выводима секвенция

Prf S (y, pϕq) ⊢ Prf S (Ded(y), pPrf S (y, pϕq)q) (2.2.152)

а с другой стороны, поскольку S интерпретирует PA, по свойству универсума (2.1.90), выводима


секвенция
U (y) ⊢ U (Ded(y)). (2.2.153)
По предложению 2.1.21, вместе это дает выводимость секвенции

U (y) & Prf S (y, pϕq) ⊢ U (Ded(y)) & Prf S (Ded(y), pPrf S (y, pϕq)q)

Мы достраиваем ее (вниз) до дерева Генцена

U (y) & Prf S (y, pϕq) ⊢ U (Ded(y)) & Prf S (Ded(y), pPrf S (y, pϕq)q)
(LK-15*)
U (y) & Prf S (y, pϕq) ⊢ ∃z U (z) & Prf S (z, pPrf S (y, pϕq)q)
(LK-14*)
∃z U (y) & Prf S (y, pϕq) ⊢ ∃z U (z) & Prf S (z, pPrf S (y, pϕq)q)
| {z } | {z }
k k
PrS (pϕq) Pr S (pPrf S (y, pϕq)q)

И мы получаем, что выводима секвенция

PrS (pϕq) ⊢ PrS (pPrf S (y, pϕq)q) (2.2.154)

С другой стороны, из выводимости секвенции

Prf(y, pϕq) ⊢ ∃y Prf(y, pϕq)

следует выводимость ее перевода

Prf S (y, pϕq) ⊢ ∃y U (y) & Prf S (y, pϕq)

то есть выводимость секвенции


Prf S (y, pϕq) ⊢ PrS (pϕq)
Это равносильно выводимости формулы

Prf S (y, pϕq) ⇒ PrS (pϕq)

из чего по свойству 2◦ следует выводимость формулы


   
PrS pPrf S (y, pϕq)q ⇒ PrS pPrS (pϕq)q

А это в свою очередь равносильно выводимости секвенции


   
PrS pPrf S (y, pϕq)q ⊢ PrS pPrS (pϕq)q (2.2.155)

Теперь из (2.2.154) и (2.2.155) по правилу сечения мы мы получаем секвенцию


 
PrS (pϕq) ⊢ PrS pPrS (pϕq)q
146 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

5. По правилу (LK-6*), существует дерево Генцена в LK


⊢ϕ ⊢ψ
⊢ϕ&ψ
По теореме 2.2.11 (ii) это означает, что в PA можно определить некий внешний функциональный
символ FK валентности 2, для которого будет выводима секвенция
Prf(y, pϕq), Prf(z, pψq) ⊢ Prf(FK (y, z), pϕ & ψq)
Применяя следствие 2.1.52, мы можем заключить из этого, что в теории S выводима секвенция
Prf S (y, pϕq), Prf S (z, pψq) ⊢ Prf S (FK (y, z), pϕ & ψq) (2.2.156)
С другой стороны, по свойству универсума (2.1.90), выводима секвенция

U (y), U (z) ⊢ U FK (y, z) . (2.2.157)
По предложению 2.1.21, (2.2.156) и (2.2.157) вместе дают выводимость секвенции

U (y) & Prf S (y, pϕq), U (z) & Prf S (z, pψq) ⊢ U FK (y, z) & Prf S (FK (y, z), pϕ & ψq)
Мы достраиваем ее (вниз) до дерева Генцена

U (y) & Prf S (y, pϕq), U (z) & Prf S (z, pψq) ⊢ U FK (y, z) & Prf S (FK (y, z), pϕ & ψq)
(LK-15*)
U (y) & Prf S (y, pϕq), U (z) & Prf S (z, pψq) ⊢ ∃t U (t) & Prf S (t, pϕ & ψq)
(LK-14*)
∃y U (y) & Prf S (y, pϕq), ∃z U (z) & Prf S (z, pψq) ⊢ ∃t U (t) & Prf S (t, pϕ & ψq)
| {z } | {z } | {z }
k k k
Pr S (pϕq) PrS (pψq) PrS (pϕ & ψq)

и получаем, что выводима секвенция


PrS (pϕq), PrS (pψq) ⊢ PrS (pϕ & ψq)
По теореме об антецеденте 0.2.28 это эквивалентно выводимости секвенции
PrS (pϕq) & PrS (pψq) ⊢ PrS (pϕ & ψq)
6. По теореме о противоречивых теориях 2.2.3, существует дерево Генцена в LK
⊢(ϕ & ¬ϕ)
...
⊢ψ
По теореме 2.2.11 (ii) это означает, что в PA можно определить некий внешний функциональный
символ FK валентности 1, для которого будет выводима секвенция
Prf(y, p(ϕ & ¬ϕ)q) ⊢ Prf(FK (y), pψq)
Применяя следствие 2.1.52, мы можем заключить из этого, что в теории S выводима секвенция
Prf S (y, p(ϕ & ¬ϕ)q) ⊢ Prf S (FK (y), pψq) (2.2.158)
С другой стороны, по свойству универсума (2.1.90), выводима секвенция

U (y) ⊢ U FK (y) . (2.2.159)
По предложению 2.1.21, (2.2.158) и (2.2.159) вместе дают выводимость секвенции

U (y) & Prf S (y, p(ϕ & ¬ϕ)q) ⊢ U FK (y) & Prf S (FK (y), pψq)
Мы достраиваем ее (вниз) до дерева Генцена

U (y) & Prf S (y, p(ϕ & ¬ϕ)q) ⊢ U FK (y) & Prf S (FK (y), pψq)
(LK-15*)
U (y) & Prf S (y, p(ϕ & ¬ϕ)q) ⊢ ∃z U (z) & Prf S (z, pψq)
(LK-14*)
∃y U (y) & Prf S (y, p(ϕ & ¬ϕ)q) ⊢ ∃z U (z) & Prf S (z, pψq)
| {z } | {z }
k k
PrS (p(ϕ & ¬ϕ)q) PrS (pψq)
§ 2. Непротиворечивость и арифметизация 147

и получаем, что выводима секвенция

PrS (p(ϕ & ¬ϕ)q) ⊢ PrS (pψq)

Свойство 1◦ в этом списке не работает в обратную сторону: если в S выводима формула PrS (pϕq),
то из этого не следует, что в S выводима формула ϕ. Однако симметрию удается восстановить если
теория S ω-непротиворечива:
Теорема 2.2.13. Пусть в теории S задана нумерация p·q деревьев Генцена, и одновременно S
интерпретирует арифметику Пеано PA. Если теория S ω-непротиворечива, то формула ϕ выво-
дима в S, тогда и только тогда, когда формула PrS (pϕq) выводима в S.

Геделево предложение.
Лемма 2.2.14. Теория S, интерпретирующая арифметику Пеано PA, противоречива тогда и
только тогда, когда в ней выводится формула 0 = 1 (где 1 = S(0), а S — функция следования в
теории PA (см. пример 2.1.18)).
Доказательство. 1. Если S противоречива, то в ней выводится любая формула, в том числе,
PrS (p0 = 1q).
2. По аксиоме (2.1.35) в теории PA выводится формула ¬(0 = 1). Поскольку теория S интерпре-
тирует PA, в ней тоже выводится формула ¬(0 = 1). Теперь если в S выводится формула 0 = 1, то
вместе с формулой ¬(0 = 1) она означает, что S противоречива.
Пусть теперь, как раньше, в теории S задана нумерация p·q деревьев Генцена, и одновременно S
интерпретирует арифметику Пеано PA. Тогда утверждение “в S выводится формула 0 = 1” можно
записать в виде формулы
PrS (p0 = 1q).
И по лемме 2.2.14 это будет эквивалентно утверждению “теория S противоречива”. Как следствие,
отрицание этой формулы ¬ PrS (p0 = 1q) формализует утверждение, что теория S непротиворечива.
У этой формулы имеется специальное обозначение:
• Символом ConS мы обозначим формулу в S

ConS = ¬ PrS (p0 = 1q). (2.2.160)

Как мы говорили, эта формула интерпретируется как утверждение о непротиворечивости


теории S.
Теорема 2.2.15. В S существует формула, определяющая функциональный символ diag валент-
ности 1, такой что для произвольной данной формулы ϕ с единственной свободной переменной x
в S выводима формула
y = diag(pϕq) ⇔ y = pϕ x=pϕq q (2.2.161)

На человеческом языке символ diag обозначает функцию, которая каждому геделеву номеру
pϕq формулы ϕ с единственной свободной переменной x в S ставит в соответствие номер pϕ x=pϕq q
формулы, получающейся подстановкой в ϕ вместо x номера pϕq.
Рассмотрим формулу в S
η = ¬ PrS (diag(y)) (2.2.162)
(поскольку PrS — внешний предикатный символ валентности 1 в S, правая часть корректно опре-
делена). Это будет формула с единственной свободной переменной y. Формула η утверждает, что в
S не выводима формула с геделевым номером diag(y).
Рассмотрим формулу

γ = η (2.2.163)
y=pηq

утверждающую, что в S не выводима формула с геделевым номером



diag(pηq) = pη y=pηq q

• Формула γ, определенная равенством (2.2.163), называется геделевым предложением в


теории S.
148 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Лемма 2.2.16. Для геделева предложения γ в S выводима формула

γ ⇔ ¬ PrS (pγq) (2.2.164)

Доказательство. Мы получаем цепочку равносильностей28:




γ ⇔ (2.2.163) ⇔ η ⇔ (2.2.162) ⇔ ¬ PrS (diag(x)) ⇔
x=pηq x=pηq


⇔ ¬ PrS (diag(pηq)) ⇔ (2.2.161) ⇔ ¬ PrS (diag(pη q)) ⇔ (2.2.163) ⇔ ¬ PrS (pγq)
x=pηq

Лемма 2.2.17. В предположении непротиворечивости теории S геделево предложение γ невы-


водимо в S.

Доказательство. Предположим, что γ выводится в S. Тогда, с одной стороны, по свойству 1◦ в S


выводится формула PrS (pγq). А, с другой стороны, из (2.2.164) следует, что в S выводится формула

γ ⇒ ¬ PrS (pγq).

То есть формула ¬ PrS (pγq) следует из формулы γ (в смысле определения на с.116). По теореме
дедукции 2.1.33 отсюда следует, что ¬ PrS (pγq) выводится из формулы γ (в смысле определения на
с.119). По нашему предположению, γ выводится в S, поэтому мы получаем, что ¬ PrS (pγq) тоже
выводится в S.
Итак, в S выводятся формулы PrS (pγq) и ¬ PrS (pγq), и это означает, что S противоречива.

Лемма 2.2.18. В предположении непротиворечивости теории S в ней выводима секвенция

ConS ⊢ γ (2.2.165)

Доказательство. Заметим сначала, что в S выводима следующая секвенция:

PrS (pϕq) & PrS (p¬ϕq) ⊢ PrS (p0 = 1q) (2.2.166)

Это следует из свойств 5◦ и 6◦ на с.143. Мы эту секвенцию включаем как правую вершину в дерево

PrS (pγq) & PrS (p¬γq) ⊢ PrS (p0 = 1q) (2.2.166)

 (LK-3*), (LK-5*)
¬ PrS (p0 = 1q) ⊢ ¬ PrS (pγq) & PrS (p¬γq)
(2.2.160)
 
ConS ⊢ ¬ PrS (pγq) & PrS (p¬γq)
(0.2.74)
ConS ⊢ ¬ PrS (pγq) ∨ ¬ PrS (p¬γq)
теорема 0.2.29
ConS ⊢ ¬ PrS (pγq), ¬ PrS (p¬γq)
(LK-3*), (LK-5*)
PrS (pγq) ⊢ PrS (pPrS (pγq)q) (2.2.144) ConS , PrS (pγq) ⊢ ¬ PrS (p¬γq)
(LK-1*) (2.2.164), свойство 3◦ на с.143
ConS , PrS (pγq) ⊢ PrS (pPrS (pγq)q) ConS , PrS (pγq) ⊢ ¬ PrS (pPrS (pγq)q)
(LK-6*)
ConS , PrS (pγq) ⊢ PrS (pPrS (pγq)q) & ¬ PrS (pPrS (pγq)q)
лемма 2.2.4
ConS , PrS (pγq) ⊢
(LK-3*), (LK-5*)
ConS ⊢ ¬ PrS (pγq)
(2.2.164)
ConS ⊢ γ

28 Понятие цепочки равносильностей было определено на с.119.


§ 2. Непротиворечивость и арифметизация 149

(c) Теоремы Геделя о непротиворечивости и контрмодели


Теоремы Гёделя о непротиворечивости. Формальная теория T называется полной, если в
ней любая формула ϕ либо выводима, либо опровержима. В противном случае (то есть когда в T
существует такая формула ϕ, что ни ϕ, ни ¬ϕ не выводимы) теория T называется неполной.
Следующие результаты австрийского математика Курта Гёделя считаются ключевыми в мате-
матической логике и традиционно называются теоремами Геделя о неполноте, хотя логичнее было
бы назвать их теоремами о непротиворечивости, поскольку в них речь идет о непротиворечивости,
но не всегда о полноте.
Теорема 2.2.19 (первая теорема Геделя о непротиворечивости). Пусть T – теория29 , интерпре-
тирующая арифметику Пеано PA. Тогда теория T либо ω-противоречива, либо неполна.
Доказательство. Предположим, что теория T ω-непротиворечива и покажем, что тогда она непол-
на. Для этого нам нужно предъявить формулу ϕ такую, что ϕ и ¬ϕ невыводимы в T . Покажем,
что такой формулой будет геделево предложение γ из (2.2.164).
1. Поскольку теория T ω-непротиворечива, по теореме 2.2.9 она непротиворечива. В лемме 2.2.17
мы уже показали, что в таком случае геделево предложение γ не выводится в T .
2. Покажем теперь, что ¬γ тоже не выводится в T . Предположим, что ¬γ наоборот, выводится.
В силу (2.2.164) это значит, что в T выводится ¬¬ PrT (pγq), то есть

PrT (pγq) = ∃y U (y) & Prf T (y, pγq) (2.2.167)
С другой стороны, для всякого замкнутого терма τ в PA, обозначающего, понятное дело, конкретное
число в N, геделев номер pτ ′ q его перевода τ ′ в T не будет геделевым номером вывода формулы γ
(потому что геделевы номера выводов не пересекаются с геделевыми номерами термов). Поэтому в
T выводима формула
¬ Prf T (pτ q, pγq). (2.2.168)
Выводимость (2.2.167) и (2.2.21) вместе означает ω-противоречивость T . А это противоречит нашей
посылке (об ω-непротиворечивости T ). Значит, ¬γ не выводится в T .
! 2.2.20. В учебнике П.Т.Джонстона30 это утверждение формулируется и доказывается в предпо-
ложении о рекурсивной аксиоматизируемости теории T и рекурсивной интерпретируемости в ней
теории PA. В принятой нами терминологии теория T имеет конечный набор аксиом и конечный на-
бор схем аксиом, поэтому она автоматически рекурсивно аксиоматизируема. А интерпретация PA в
T будет также рекурсивной, потому что по замечанию 2.1.48 на с.129 присоединение к T переводов
аксиом из PA снова дает конечный набор аксиом и конечный набор схем аксиом.
Теорема 2.2.19 усиливается до следующего утверждения:31
Теорема 2.2.21 (первая теорема Геделя о непротиворечивости в форме Россера). Пусть T –
теория32 , интерпретирующая арифметику Пеано PA. Тогда теория T либо противоречива, либо
неполна.
Еще один близкий результат выглядит так:
Теорема 2.2.22 (вторая теорема Геделя о непротиворечивости). 33 Пусть T – теория34 , интер-
претирующая арифметику Пеано PA. Тогда либо теория T противоречива, либо утверждение о
ее непротиворечивости (формула ConT ) невыводимо в T .
Доказательство. По лемме 2.2.18, из формулы ConT следует геделево предложение γ. Поэтому
если ConT выводима в T , то γ тоже выводима в T . Но по лемме 2.2.17 γ не выводима в T .
! 2.2.23. Все стандартные аксиоматические теории множеств ZFC, NBG, MK (из которых только
последняя, MK, описана в этой книге, а сведения об остальных можно найти в других руководствах)
удовлетворяют посылкам теорем 2.2.19 и 2.2.22.

29 Здесь важно напомнить читателю то, что говорилось в замечании 2.1.1: под формальной теорией мы условились

понимать теорию с конечным набором аксиом и конечным набором схем аксиом, из чего следует, что такая теория
автоматически рекурсивно аксиоматизируема.
30 P.T.Johnstone. Notes on logic and set theory. Cambridge university press, 1996. Theorem 9.1.
31 См. [13, Замечание на с.93].
32 См. подстрочное примечание 29.
33 P.T.Johnstone. Notes on logic and set theory. Cambridge university press, 1996. Theorem 9.2.
34 См. подстрочное примечание 29.
150 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

⋄ 2.2.24 (непротиворечивая, но ω-противоречивая пример, x = x. Покажем, что теория PA+¬ ConPA


теория). Рассмотрим в теории PA формулу ω-противоречива с этой интерпретацией.
Действительно, формула ¬ ConPA выводима в
¬ ConPA = ¬¬ PrPA (p0 = 1q) ∼ PrPA (p0 = 1q). PA + ¬ ConPA , поэтому по свойству 1◦ на с.143 в
PA + ¬ ConPA выводима формула
Если предполагать, что теория PA непротиворе-
чива, то по теореме Геделя 2.2.22 формула ConPA PrPA +¬ ConPA (p¬ ConPA q)
не выводится в PA. Отсюда следует, что если к
PA добавить формулу ¬ ConPA , то мы получим то есть формула
теорию PA + ¬ ConPA , которая по теореме 2.2.7
∃x Prf PA +¬ ConPA (x, p¬ ConPA q).
будет также непротиворечива.
Теория PA + ¬ ConPA считается (в предполо- С другой стороны, для всякого замкнутого терма
жении непротиворечивости PA) примером непро- τ в PA, обозначающего конкретное число в N, его
тиворечивой, но ω-противоречивой теории. геделев номер pτ q не будет геделевым номером
Чтобы это показать, заметим, что PA триви- вывода формулы ¬ ConPA (потому что геделевы
альным образом интерпретируется в PA+¬ ConPA номера выводов не пересекаются с геделевыми
(это похоже на тривиальную интерпретацию в номерами термов), поэтому в PA + ¬ ConPA выво-
самой себе из примера 2.1.54): в качестве универ- дима формула
сума U этой интерпретации нужно взять произ-
вольную выводимую формулу в PA+¬ ConPA , на- ¬ Prf PA (pτ q, p¬ ConPA q).

Умолчание о непротиворечивости. В популярной литературе теорема Геделя 2.2.22 часто ин-


терпретируется как утверждение о том, что непротиворечивость арифметики, теории множеств, а
вместе с ними и математики в целом, доказать невозможно. За этими заявлениями стоит некое
наблюдение, точный смысл которого, однако, этих эмоциональных оценок не подтвержает.
Наблюдение состоит в том, что если какая-то теория T интерпретирует35 арифметику Пеано
PA или теорию множеств Морса—Келли MK (или какую-нибудь другую рабочую теорию мно-
жеств), то T не может доказать непротиворечивость PA или MK (равно как и непротиворечи-
вость других рабочих теорий множеств).
Действительно, если в T можно сформулировать утверждение о непротиворечивости PA в виде
некоей формулы ϕ и вывести эту формулу, то немедленно встает вопрос, не будет ли теория T сама
противоречива. Это важно, потому что по теореме 2.2.3 если T противоречива, то в ней вместе с
формулой ϕ становится выводимой и формула ¬ϕ (и таким образом, теорема «в T выводится непро-
тиворечивость PA» обесценивается противоположной теоремой «в T выводится противоречивость
PA»). Но если вдобавок T интерпретирует PA, то по теореме Геделя 2.2.22 непротиворечивость T
в рамках самой теории T доказать невозможно, и получается, нужно искать новую теорию T ′ ,
доказывающую непротиворечивость T . И если эта теория T ′ интерпретирует PA, то ситуация по-
вторяется.
И то же самое с заменой PA на MK: если T интерпретирует MK и доказывает непротиворечи-
вость MK, то поскольку MK сама интерпретирует PA, мы получаем, что T тоже интерпретирует
PA. И опять по теореме Геделя 2.2.22 непротиворечивость T в рамках самой теории T доказать
невозможно, и мы приходим к той же картине.
Из сказанного, тем не менее, не следует, что теорию, доказывающую непротиворечивость PA
или MK построить невозможно, потому что такая теория T не обязана интерпретировать PA или
MK: достаточно просто, чтобы она их кодировала36.
Эта опция, однако, остается на сегодняшний день чисто умозрительной, как и проекты найти
явное противоречие в PA или в MK (или в других формальных теориях, претендующих на право
считаться фундаментом современной математики). Инициированная в начале 20 века Гильбертом
перестройка оснований математики имела одним из результатов устранение из теории множеств
старых парадоксов (мы об этом говорили на с.6), но, несмотря на предпринятые после этого мас-
штабные исследования в этой области, ни доказать непротиворечивость, ни найти противоречия в
арифметике Пеано PA или в построенных новых аксиоматических теориях множеств, в частности,
в ZF, NBG и MK, математикам не удалось.
Следствием этого является положение дел, при котором непротиворечивость теорий, лежащих в
основаниях математики приходится предполагать. Это означает, что все утверждения в той части
35 В смысле определения на с.129.
36 В смысле определения на с.137.
§ 2. Непротиворечивость и арифметизация 151

математики, где используется теория множеств (то есть, фактически везде, или, если быть
точным, везде вне некоторых совсем узких разделов логики), формулируются с дополнительным
предположением, что используемый рабочий вариант теории множеств (в нашем случае это
теория Морса-Келли MK) непротиворечив.
Это нагляднее всего иллюстрируется в традиции доказательств от противного: всякий раз, когда
математик, получая из посылки противоречие, выводит из этого, что посылка неверна, он предпо-
лагает непротиворечивость используемой им рабочей теории множеств, без чего его рассуждения
утрачивали бы смысл (мы иллюстрируем это ниже в примере 2.2.27).
Математики, тем не менее, почти никогда не следуют этому правилу явно (то есть нигде в
формулировках не говорят прямо “мы предполагаем, что теория множеств непротиворечива”)37.
Однако это всюду подразумевается по умолчанию. Мы в этой главе будем все-таки в нужных местах
эту фразу (про предполагаемую непротиворечивость MK) произносить, чтобы она отпечаталсь у
читателя в сознании (в частности, это будет вставленно в формулировки теорем 2.2.25 и 2.2.26
ниже), однако в остальных главах мы это повторять перестанем и вспоминать об этом уже не
будем.
Этому приему неявного использования в своих рассуждениях предположения о непротиворечи-
вости рабочей теории множеств полезно приписать какое-нибудь название, и мы будем в дальнейшем
называть его умолчанием о непротиворечивости.

Контрмодели. В любой теории утверждения имеют смысл только если эта теория непротиворе-
чива, или хотя бы есть основания это предполагать. Не всякий математик об этом задумывается,
но в обсуждениях все это признают, и признают, что в своих высказыаниях по умолчанию предпо-
лагают непротиворечивость используемых теорий. В математической логике из-за возобладавшего
в ней в 20 веке платоновского идеализма этот принцип так искусно затушевывается, что невольно
начинаешь подозревать в этом желание обойти его, спрятав под ковер неудобные факты (а именно,
бесплодность попыток найти доказательство непротиворечивости теорий, лежащих в основаниях
математики). Поскольку целью этой главы было объявлено освещение результатов математической
логики в духе философии формализма, мы считаем нужным показать, где в описываемых нами кон-
струкциях проявляется умолчание о непротиворечивости используемых теорий. Понятно, что оно
работает всюду в теориях PA и MK. Но там, где формальные теории связываются друг с другом,
то есть рассматриваются интерпретации и кодировки, этот эффект легко комкается и расхождения
между идеализмом и формализмом проявляются здесь особенно выпукло. В частности, сюда входит
все, что связано с понятием контрмодели, о котором мы здесь поговорим.
Прежде всего, отметим следующие два факта.

Теорема 2.2.25. В предположении, что теория MK непротиворечива,


(i) всякая модель S ′ в MK любой формальной теории S непротиворечива,
(ii) если формальная теория S противоречива, то у нее нет модели в MK;
(iii) если формальная теория S обладает моделью в MK, то теория S непротиворечива.

Доказательство. Это следует из теоремы 2.1.57 (или из теоремы 2.2.8).


1. Пусть какая-то модель S ′ теории S противоречива, то есть в ней выводится какая-то формула
ψ и ее отрицание ¬ψ. Поскольку S ′ – дефинициальное расширение теории MK, это значит, что
в MK тоже выводятся формулы ψb и ¬ψ c ∼ = (2.1.74) ∼ b Значит, теория MK тоже должна быть
= ¬ψ.
противоречивой.
2. Если формальная теория S противоречива, то в ней выводится какая-то формула ϕ и ее отри-
цание ¬ϕ. Если у S есть модель S ′ в MK, то в этой модели S ′ выводятся формулы ϕ′ и (¬ϕ′ ) = ¬(ϕ′ ).
То есть S ′ должна быть противоречивой теорией, а это противоречит уже доказанному утвержде-
нию (i).
3. Если формальная теория S обладает моделью в MK, то в силу уже доказанного свойства (ii),
S не может быть противоречивой теорией.

Теорема 2.2.26. Пусть S – формальная теория, S ′ – ее модель в MK, ϕ – формула в S, и ϕ′ – ее


перевод в S ′ . Тогда, в предположении, что теория MK непротиворечива,
— если формула ϕ′ опровержима в S ′ , то формула ϕ не может быть выводима в S,
— если формула ϕ′ выводима в S ′ , то формула ϕ не может быть опровержима в S.
37 Правильнее было бы сказать “те математики, кто продумывал эти детали, считают это подразумевающимся по

умолчанию”, потому что большая часть из них об этих вещах не задумывается.


152 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Доказательство. Докажем первую часть (вторая доказывается по аналогии). Пусть формула ϕ′


опровержима в S ′ , то есть в S ′ выводится формула ¬ϕ′ . Если предположить дополнительно, что
формула ϕ выводима в S, то по теореме 2.1.57 формула ϕ′ также выводима в S ′ . Одновременно
по нашему предположению, ϕ′ опровержима в S ′ . Значит, S ′ должна быть противоречивой, а это
противоречит теореме 2.2.25.

Теперь объясним, что такое контрмодель. Пусть нам дана какая-то формальная теория S и
формула ϕ в ней. Чтобы понять, будет эта формула выводима в S или нет, конечно, никакого
определенного алгоритма не существует. Однако если удается подобрать модель S ′ , в которой со-
ответствующая формула ϕ′ опровержима, то по теореме 2.2.26 это будет сразу означать, что в S
формула ϕ не может быть выводимой, если предполагать, что теория множеств MK непроти-
воречива. Такая модель S ′ , в которой формула ϕ′ опровержима, называется контрмоделью для
формулы ϕ.

Покажем как это понятие применяется. Значит, в нашей модели выводимо отрицание
формулы (2.2.169). То есть формула (2.2.169)
⋄ 2.2.27. Пусть S = Poset – теория частичного
опровержима в построенной модели, и поэтому
порядка, описанная в примере 2.1.16. Рассмот-
не может быть выводимой в теории частичного
рим в ней утверждение, что порядок всегда ли-
порядка (если считать, что теория множеств MK
неен:
непротиворечива).

∀x ∀y x 6 y ∨ y 6 x . (2.2.169)
⋄ 2.2.28. Пусть S = Group – теория групп, опи-
Рассмотрим множество X = 3 = {0, 1, 2}, и, в ка- санная в примере 2.1.17. Чтобы показать, что в
честве модели теории S, множество U = 2X всех ней утверждение
подмножеств в X с частичным порядком 
∀x ∀y x · y = y · x (2.2.170)
A 6 B ⇔ A ⊆ B.
— невыводимо, достаточно построить какую-
Тогда множества
нибудь модель этой теории, то есть группу, в
x = {0, 1}, y = {0, 2} которой это неверно (в предположении, что ра-
бочая теория множеств непротиворечива). Такой
будут обладать свойством моделью может быть группа
x*y &y*x S3
то есть будет выполняться отрицание формулы
(2.2.169): всех биективных отображений множества 3 =
 {0, 1, 2} в себя (с композицией отображений в ка-
∃x ∃y x 66 y&y6 6 x честве групповой операции).

§3 Выразимость средствами теории множеств и семантизация


В предыдущем параграфе мы говорили об одной из двух важных процедур кодировки, арифме-
тизации, позволяющей исследовать вопросы непротиворечивости формальных теорий. Здесь мы
поговорим о второй из этих процедур, семантизации. Она позволяет решать вопрос о выразимости
данной формальной теории S средствами теории множеств, под чем мы понимаем возможность
представить S в виде дефинициального расширения рабочей теории множеств (в нашем случае,
MK).
Идея заключается в следующем. Для данной теории S ее модели в теории множеств MK пред-
ставляют собой объекты теории MK, и при определенной предварительной работе по уточнению
нужных терминов, можно говорить о классе ModS всех моделей теории S в MK. Этот класс ModS
порождает некую новую формальную теорию S ∗ , дефинициальное расширение теории MK, которая
называется семантизацией теории S. Оказывается, что эта теория S ∗ эквивалентна теории S в том
смысле, что данная формула ϕ выводима в S тогда и только тогда, когда соответствующая ей по
определенным правилам формула ϕ∗ выводима в S ∗ . Этот результат принято называть теоремой
Гёделя о полноте (ниже мы его приводим в виде теорем 2.3.6 и 2.3.18 для случаев конечной и
бесконечной систем аксиом, которые мы называем теоремами о семантизации), и его ценность в
§ 3. Выразимость средствами теории множеств и семантизация 153

том, что он позволяет свести изучение формальных теорий к изучению дефинициальных расшире-
ний теории множеств MK. Это в свою очередь позволяет математикам (по крайней мере, тем, кто
не специализируется в математической логике) вообще забыть о формальных теориях, описывая
все необходимые конструкции языком рабочей теории множеств (и выводя все нужные результаты
внутри этой теории множеств).

Семантизация теории с конечной системой в смысле определения на с.135, то есть ес-


аксиом. Конструкцию семантизации удобно ли для всякой аксиомы α (здесь удобно взять
строить отдельно для теорий с конечной и с бес- вместо α ее замыкание всеобщности α, опре-
конечной системой аксиом, потому что в первом деленное на с.120) теории S ее семантизация
случае построения выглядят гораздо проще. Из αM в структуре M является теоремой теории
методических соображений мы рассмотрим по- MK.
этому сначала конечно аксиоматизируемые си-
стемы (а общий случай будет описан на с.167). ! 2.3.1. Здесь важно, что система аксиом тео-
рии S конечна: именно поэтому можно выстро-
1. По аналогии с тем, как это делалось на
ить требования, выделяющие класс ModS в ви-
с.135, каждой формуле ϕ конечно аксиомати-
де конечной цепочки символов, то есть опреде-
зированной теории S и каждой реляционной
лить ModS формулой языка MK. Если система
структуре M ставится в соответствие форму-
аксиом бесконечна (как, например, в самой тео-
ла ϕM теории MK по следующим правилам:
рии MK), то такое описание класса ModS ста-
— каждый предикатный символ η, приме- новится бесконечно длинным (потому что у нас
ненный к термам τ1 , ..., τn , в ϕ нужно за- нет возможности применять кванторы по систе-
менить на формулу (τ1 , ..., τn ) ∈ Mη , ме аксиом), и поэтому оно перестает быть фор-
— каждый функциональный символ η в ϕ мулой MK. Для таких случаев приходится упо-
нужно заменить на соответствующий сим- треблять более сложную конструкцию, описан-
вол Mη , ную ниже на с.167.
— если в ϕ есть свободная переменная x, то
Наконец, определяется операция ϕ 7→ ϕ∗ , ко-
заменяем ϕ на формулу
торая каждой формуле ϕ теории S ставит в со-
x ∈ M@ ⇒ (ϕ) (2.3.171) ответствие формулу ϕ∗ теории MK по правилу
(это нужно проделать последовательно со  
∀M M ∈ ModS ⇒ ϕM . (2.3.176)
всеми свободными переменными в ϕ и
остановиться),
• В результате мы получаем класс ModS моде-
— каждую подформулу лей теории S, определенный формулой язы-
∀x α (2.3.172) ка теории MK. К нему можно относиться как
к присоединенному функциональному симво-
нужно заменить на подформулу лу валентности 0, если в его определении се-
  мантизации аксиом теории S сделать замкну-
∀x x ∈ M@ ⇒ (α) (2.3.173) тыми формулами (то есть перейти к замы-
канию всеобщности ϕM ). Тогда теория MK с
— каждую подформулу этим присоединенным символом превращает-
∃x α (2.3.174) ся в дефинициальное расширение S ∗ теории
MK. Теория S ∗ называется семантизацией
нужно заменить на подформулу формальной теории S в теории MK, а фор-
  мула ϕ∗ , определенная по правилу (2.3.176) —
∃x x ∈ M@ & (α) (2.3.175) семантизацией формулы ϕ теории S.
— на заключительном этапе мы получаем ! 2.3.2. Понятно, что семантизация Mod всякой
S
формулу, которую полезно как-то обозна- формальной теории S является также формаль-
чить, пусть это будет ϕM ; мы будем ее ной теорией.
называть семантизацией в реляционной
структуре M .
! 2.3.3. По определению класса ModS , если ϕ –
2. Далее в классе StrS реляционных структур аксиома теории S, то соответствующая формула
выделяется подкласс ModS , состоящий из мо- ϕM выводима в модели M как в формальной тео-
делей теории S: структура {Mη ; η ∈ Σ} при- рии. Поэтому семантизация ϕ∗ всякой аксиомы
надлежит классу ModS , если она представля- ϕ теории S выводима в семантизации S ∗ теории
ет собой модель теории S с универсумом M@ S.
154 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

⋄ 2.3.4. Семантизация теории частичного по- формальную теорию. Объясним, как строится ее
рядка. Напомним, что в примере 2.1.16 мы опре- семантизация в MK.
делили теорию Poset частичного порядка как Прежде всего, реляционной структурой этой
формальную теорию. Объясним, как строится ее теории будет любая тройка M = (M@ , M1 , M• )
семантизация в MK. состоящая из множества M@ , его элемента M1 ∈
Прежде всего, реляционной структурой этой M@ и отображения M• : M@ × M@ → M@ . Акси-
теории будет любая пара M = (M@ , M6 ) со- омы этой теории (2.1.32)—(2.1.34)
стоящая из множества M@ и бинарного отноше-
ния M6 на нем. Аксиомы этой теории (2.1.29)— (x · y) · z = x · (y · z)
(2.1.31) x·1 =x & 1·x =x
x6x 
∀x ∃y x·y = 1 & y·x =1
x6y &y6x ⇒ x=y имеют следующие семантизации в структуре M :
x6y &y6z ⇒ x6z
x, y, z ∈ M@ ⇒ M• (M• (x, y), z) = M• (x, M• (y, z)).
имеют следующие семантизации в структуре M :
x ∈ M@ ⇒ M• (x, M1 ) = x & M• (M1 , x) = x
x ∈ M@ ⇒ (x, x) ∈ M6 . 
∀x x ∈ M@ ⇒ ∃y y ∈ M@ ⇒

x, y ∈ M@ ⇒ M• (x, y) = M1 & M• (y, x) = M1
  
(x, y) ∈ M6 & (y, x) ∈ M6 ⇒ x = y Если эти формулы выводимы в MK, то реля-
ционная структура M = (M@ , M1 , M• ) называ-
ется моделью теории групп, или что то же са-
x, y, z ∈ M@ ⇒ мое, группой. Класс ModGroup всех групп являет-
  ся объектом теории MK и определяется форму-
(x, y) ∈ M6 & (y, z) ∈ M6 ⇒ лой


(x, z) ∈ R
M ∈ ModGroup ⇐⇒ ∀x, y, z x, y, z ∈ M@ ⇒

Если эти формулы выводимы в MK, то реля- M• (M• (x, y), z) = M• (x, M• (y, z)) & ∀x
ционная структура M = (M@ , M6 ) называется  
моделью теории частичного порядка, или что x ∈ M@ ⇒ M• (x, M1 ) = x & M• (M1 , x) = x
то же самое, частично упорядоченным множе- 
ством. Класс ModPoset всех частично упорядо- ∀x x ∈ M@ ⇒ ∃y y ∈ M@ ⇒
ченных множеств является объектом теории MK 
и определяется формулой M• (x, y) = M1 & M• (y, x) = M1 (2.3.178)

Поэтому символ ModGroup можно считать пре-


M ∈ ModPoset ⇐⇒
дикатным символом валентности 0. Если к сиг-
∃M@ ∃M6 M = (M@ , M6 ) & M6 ⊆ M@ × M@ & натуре теории множеств MK присоединить сим-
 
& ∀x x ∈ M@ ⇒ (x, x) ∈ M6 & вол ModGroup , а к системе ее аксиом формулу
 (2.3.178), то полученная формальная теория бу-

& ∀x ∀y (x, y) ∈ M6 & (y, x) ∈ M6 ⇒ x = y & дет семантизацией теории групп (или просто тео-
 рией групп в классическом его понимании).
& ∀x ∀y ∀z (x, y) ∈ M6 & (y, z) ∈ M6 ⇒
Следующее утверждение представляет собой
 ослабление теоремы 2.3.18 (то есть теоремы Гё-
(x, z) ∈ M6 (2.3.177)
деля о полноте) для частного случая формаль-
ных теорий с конечным набором аксиом.
Поэтому символ ModPoset можно считать преди-
катным символом валентности 0. Если к сигна- Теорема 2.3.6 (о семантизации для конечно ак-
туре теории множеств MK присоединить сим- сиоматизированной теории). В предположении,
вол ModPoset , а к системе ее аксиом формулу что теория MK непротиворечива, для любой ко-
(2.3.177), то полученная формальная теория бу- нечно аксиоматизированной теории S над логи-
дет семантизацией теории частичного порядка кой предикатов и любой формулы ϕ в ней следу-
(или просто теорией частичного порядка в клас- ющие условия эквивалентны:
сическом его понимании).
(i) формула ϕ выводима в S,
⋄ 2.3.5. Семантизация теории групп. В приме- (ii) ее семантизация ϕ∗ выводима в се-
ре 2.1.17 мы определили теорию групп Group как мантизации S ∗ теории S.
§ 3. Выразимость средствами теории множеств и семантизация 155

! 2.3.7. Это утверждение можно понимать как есть в смысле теоремы 2.3.6), не эквивалентна S
формальный вид высказывания, что выводи- в обычном, широком смысле. Точнее, можно ска-
мость формулы ϕ в S эквивалентна тому, что в зать, что все, что утверждается (и выводится)
каждой модели M ∈ ModS теории S соответству- в исходной теории S, утверждается (и выво-
ющая формула ϕM выводима (как в формальной дится) и в ее семантизации S ∗ , но не наоборот:
теории, какую представляет собой модель M ). в семантизации S ∗ сигнатура шире (в ней содер-
Доказательство теоремы 2.3.6. В прямую сто- жатся дополнительные символы из теории мно-
рону это утверждение уже отмечалось в замеча- жеств) и аксиом гораздо больше, чем в S, и как
нии 2.3.3: если формула ϕ в формальной теории следствие, выводимых утверждений в ней тоже
S выводима, то формула ϕ∗ выводима в семанти- гораздо больше.
зации S ∗ (это проверяется так же, как в теореме Вот примеры, иллюстрирующие это замеча-
2.1.51 об интерпретации). Нетривиальной частью ние.
является обратное утверждение: если ϕ невыво-
дима в S, то ϕ∗ невыводима в S ∗ . ⋄ 2.3.8. Построенная нами в примере 2.3.4 се-
Чтобы это доказать, заметим сначала, что мантизация теории частичного порядка не эк-
формулу ϕ можно считать замкнутой, потому вивалентна самой этой теории (представленной
что по предложению ??, ϕ и ее замыкание все- как формальная теория в примере 2.1.16), по-
общности ϕ выводятся друг из друга. Пусть да- тому что, например, все, что связано с моно-
лее формула ϕ замкнута и невыводима в теории тонными отображениями частично упорядочен-
S. Тогда, по теореме 2.2.7, теория S+¬ϕ непроти- ных множеств, описывается только в семантиза-
воречива. По теореме 2.3.13 Генкина38 это озна- ции теории частичного порядка (а в самой фор-
чает, что для теории S + ¬ϕ найдется модель M мальной теории частичного порядка из примера
в теории Морса-Келли MK. В этой модели фор- 2.1.16 понятие монотонного отображения опреде-
мула (¬ϕ)M = ¬(ϕM ) выводима. Мы получаем, лить невозможно).
что ¬(ϕM ) выводима и ϕM выводима тоже (по-
⋄ 2.3.9. Точно так же описанная в примере
тому что ϕ∗ выводима). Значит, теория M , опи-
2.3.5 семантизация теории групп не эквивалент-
сывающая модель, противоречива, а вместе с ней
и содержащая ее теория MK тоже должна быть на формальной теории групп из примера 2.1.17,
противоречива. в частности, потому что понятие гомоморфизма
групп можно определить только в семантизации
Семантизация S ∗ теории S, будучи эквива- этой теории (но не в самой формальной теории
лентна S на уровне утверждений теории S (то групп).

(a) Алгебраические теории в MK


Как мы уже говорили на с.153, в случае, когда аксиом бесконечно много, конструкция, описанная
для конечного множества аксиом, не работает. Здесь рассуждения строятся совершенно иначе, и,
в частности, в этом общем случае приходится использовать идею кодировки объектами рабочей
теории множеств, в нашем случае, теории MK. Начинается все с описания нового понятия.
Дело в том, что конструкция формальной теории, описанная нами в § 1 настоящей главы, имеет
аналог внутри произвольной рабочей теории множеств, в частности, внутри теории MK, который по
аналогии с понятием алгебраической системы (или универсальной алгебры), естественно называть
алгебраической теорией. Алгебраическую теорию можно считать обобщением понятия формальной
теории. Эта конструкция нужна в описании процедуры кодировки в MK (см. ниже с.166) и при дока-
зательстве главных утверждений логики, касающихся процедуры семантизации (а именно, леммы
Линденбаума 2.3.11, теоремы Геделя—Генкина 2.3.13, теоремы Гильберта—Бернайса 2.3.14 и соб-
ственно теоремы о семантизации 2.3.18).

Алгебраические языки в теории MK. Алгебраическим языком в теории MK называется пя-


терка L = (B, A, C, F, P ), состоящая из непересекающихся множеств, удовлетворяющих следующим
условиям:

— множество B, состоящее из элементов, называемых логическими символами, под кото-


рым может пониматься произвольное множество из 7 элементов, обозначенных символами
¬, &, ∨, ⇒, ∀, ∃, ⊢,
38 Поскольку теорема 2.3.13 доказывается позже теоремы 2.3.6, мы приводим весь этот кусок текстом в две колонки.
156 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

— множество A, состоящее из элементов, называемых переменными, под которым понима-


ется произвольное множество,
— множество C, состоящее из элементов, называемых константами, под которым понима-
ется произвольное множество,
— множество F , состоящее из элементов, называемых функциональными символами, под
которым может пониматься произвольное множество с условием, что каждому элементу
f ∈ F приписано положительное целое число n, называемое валентностью функциональ-
ного символа f ,
— множество P , состоящее из элементов, называемых предикатными символами, под ко-
торым может пониматься произвольное множество с условием, что каждому элементу
p ∈ F приписано положительное целое число n, называемое валентностью предикатного
символа p.
Для данного алгебраического языка L = (B, A, C, F, P ) по индукции строятся следующие два
множества:
1) множество термов Term:
— всякая переменная является термом:

A ⊆ Term

— всякая константа является термом:

C ⊆ Term

— для всякого функционального символа f ∈ F валентности n и любых термов


τ1 , ..., τn ∈ Term строка (f, τ1 , ..., τn ) тоже является термом:

∀f ∈ F ∀τ1 , ..., τn ∈ Term (f, τ1 , ..., τn ) ∈ Term

2) множество формул Form также строится по индукции:


— если τ1 , ..., τn – термы, и p – предикатный символ валентности n, то строка

(p, τ1 , ..., τn )

– формула.
— если строка ϕ – формула, то строка (¬, ϕ) – тоже формула;
— если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:

(&, ϕ, ψ), (∨, ϕ, ψ), (⇒, ϕ, ψ),

— если x – переменная, а ϕ – формула, то следующие строки – тоже формулы:

(∀, x, ϕ), (∃, x, ϕ).

Алгебраические теории в теории MK. Алгебраической теорией в теорию MK называется пара


T = (L, Ax), в которой L — произвольный алгебраический язык в MK, а Ax — произвольное выде-
ленное подмножество в множестве формул Form алгебраического языка L. При этом, L называется
языком, а Ax – системой аксиом алгебраической теории T .
В алгебраических теориях действуют правила вывода, аналогичные правилам (LK-1*)—(LK-15*),
действующим в обычных теориях первого порядка. Для их описания нам понадобится несколько
определений из теории графов.
Ориентированным графом39 мы будем называть произвольную пару (V, E), состоящую из конеч-
ного множества V и подмножества в его декартовом квадрате E ⊆ V ×V . Элементы множества V на-
зываются узлами графа (V, E), а элементы множества E (ориентированые пары (u, v) ∈ E ⊆ V × V )
— дугами графа (V, E).
В дуге (u, v) ∈ E узел u называется началом, а узел v — концом, а про дугу (u, v) говорят, что
она выходит из u и приходит в v.
Для данного узла v ∈ V
39 Нам будет удобно изменить терминологию теории графов, чтобы это согласовывалось с терминологией для де-

ревьев Генцена, где слово “вершина” применяется только к вершинам с нулевой входящей валентностью.
§ 3. Выразимость средствами теории множеств и семантизация 157

— его исходящей валентностью называется число дуг, выходящих из v:

card{w ∈ V : (v, w) ∈ E},

— его входящей валентностью называется число дуг, приходящих в v:

card{u ∈ V : (u, v) ∈ E}.

Говорят, что дуги в паре ((u1 , v1 ), (u2 , v2 )) инцидентны, если конец первой дуги совпадает с
началом второй:
v1 = u2 .
Путем из узла u ∈ V в узел w ∈ V называется произвольная конечная последовательность
узлов v1 , ..., vn ∈ V со следующими свойствами:
1) эта последовательность начинается в u и заканчивается в w,

u = v0 , v1 , v2 , ..., vn−1 , vn = w.

2) каждая пара (vk , vk+1 ) является дугой графа (V, E):

(vk , vk+1 ) ∈ E.

Пусть v1 , ..., vn ∈ V называется циклом, если его начало совпадает с его концом.
Граф (V, E) мы будем называть деревом, если
(i) он не содержит циклов,
(ii) всякий его узел v ∈ V имеет исходящую валентность, не больщую 1, и входящую валент-
ность, не большую 2,
(iii) существует узел w ∈ V такой, что для любого узла u ∈ V можно построить путь, с
началом в u и концом в w.
• Узел с нулевой входящей валентностью называется вершиной дерева (V, E).
• Узел с нулевой исходящей валентностью называется корнем дерева (V, E). Из условий (i)—
(iii) следует, что корень всегда один, и это тот самый узел, который описывается в пункте
(iii) определения дерева (он один, потому что если бы был другой узел w′ со свойством
(iii), то можно было бы построить путь из w в w′ , а затем из w′ в w, и, подклеив эти пути
друг к другу, мы получили бы цикл, а это противоречит условию (i)). Кроме того, корень
всегда имеет исходящую валентность 0 (потому что иначе была бы дуга из w в какой-то
другой узел w′ , и мы опять получили бы ту же цепочку рассуждений).
Пусть теперь нам дана некая алгебраическая теория T в MK. Определим понятия набора формул
и секвенции в T следующим образом:
• Под набором формул языка L понимается произвольная конечная последовательность
формул Φ = (ϕ1 , ..., ϕn ) (элементов множества Form).
• Под секвенцией языка L понимается произвольная тройка (Φ, ⊢, Ψ ), где Φ и Ψ — произ-
вольные наборы формул. При этом набор формул Φ называется антецедентом, а набор
формул Ψ — сукцедентом секвенции (Φ, ⊢, Ψ ). Множество всех секвенций обозначается
Seq.
Заметим далее, что каждое правило вывода из списка (LK-1*)—(LK-15*) определяет некий класс
деревьев с узлами, являющимися элементами множества секвенций Seq.
Например, первое правило (LK-1*)
Γ ⊢∆
(2.3.179)
ϕ, Γ ⊢ ∆
выделяет класс деревьев с вершинами вида Γ ⊢ ∆ и корнями ϕ, Γ ⊢ ∆ (то есть таких деревьев,
у которых корень отличается от вершины тем, что к набору формул Γ в антецеденте добавляется
еще одна формула ϕ в начале).
Точно так же второе правило (LK-1*)

Γ ⊢∆
(2.3.180)
Γ ⊢ ∆, ϕ
158 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

выделяет класс деревьев с вершинами вида Γ ⊢ ∆ и корнями Γ ⊢ ∆, ϕ (то есть таких деревьев, у
которых корень отличается от вершины тем, что к набору формул ∆ в антецеденте добавляется
еще одна формула ϕ в конце).
И так далее, единственная деталь, которую полезно упомянуть, — что большинство правил будут
определять классы деревьев с одной ветвью, а правила (LK-4*), (LK-6*), (LK-8*), (LK-10*) — классы
деревьев с двумя ветвями.

• Деревья, выделяемые правилами вывода (LK-1*)—(LK-15*) мы будем называть правиль-


ными деревьями в алгебраической теории T .
• Деревом Генцена в алгебраической теории T мы будем называть дерево, составленное из
правильных деревьев, то есть такое, у которого для любого узла u подграф, состоящий
из всех дуг, приходящих в узел u, представляет собой правильное дерево.
• Выводом секвенции Ψ ⊢ Ω в алгебраической теории T мы будем называть произвольное
дерево Генцена в этой теории, у которого
1) корнем этого дерева является секвенция Ψ ⊢ Ω,
2) каждая вершина этого дерева представляет собой либо секвенцию вида ϕ ⊢ ϕ
(где антецедент и сукцедент совпадают и представляют собой одну формулу),
либо секвенцию вида ⊢ α, где α — какая-нибудь аксиома теории T .
Множество всех выводов алгебраической теории T обозначается DeducT .
• Секвенция Ψ ⊢ Ω в алгебраической теории T называется выводимой, если у нее существует
семантический вывод.
• Формула ϕ в алгебраической теории T называется
— выводимой, или теоремой алгебраической теории T , если выводима секвенция
⊢ ϕ.
— опровержимой, если выводима секвенция ⊢ ¬ϕ.
— разрешимой, если она выводима или опровержима.
• Класс всех теорем алгебраической теории T обозначается символом TheorT .
• Алгебраическая теория T называется
— непротиворечивой, если в ней не существует формулы ϕ, которая была бы од-
новременно выводимой и опровержимой,
— полной, если в ней не любая формула ϕ разрешима (то есть либо выводима,
опровержима),
Для алгебраических теорий справедливы все утверждения, выведенные нами ранее для фор-
мальных теорий. В частности, справедлив следующий аналог теоремы 2.2.7:

Теорема 2.3.10. Если замкнутая формула ϕ в алгебраической теории T невыводима, то (не


только теория T , но и) алгебраическая теория T +¬ϕ (получающаяся присоединеним к T аксиомы
¬ϕ) непротиворечива.

Расширение алгебраической теории и лемма Линденбаума. Условимся говорить, что ал-


гебраическая теория T является расширением алгебраической теории S в MK, если
1) у этих теорий один и тот же язык L, и
2) система AxS аксиом теории S содержится в системе AxT аксиом теории T :

AxS ⊆ AxT . (2.3.181)

Можно заметить, что из этих условий следует, что класс TheorS теорем теории S содержится в
классе TheorT теорем теории T :
TheorS ⊆ TheorT . (2.3.182)

Лемма 2.3.11 (Линденбаум). 40 Если алгебраическая теория S в MK непротиворечива, то суще-


ствует непротиворечивое и полное ее расширение J в MK.
40 Э.Мендельсон, лемма 2.11, с.74.
§ 3. Выразимость средствами теории множеств и семантизация 159

Доказательство. Пусть {αn ; n ∈ N, n > 0} — нумерация всех замкнутых формул в алгебраической


теории S (поскольку формул счетное число, мы можем такую нумерацию выбрать). Определим
последовательность алгебраических теорий {Jn ; n ∈ N} следующим образом. Прежде всего, мы
полагаем
J0 = S.
Далее, если теория Jn уже определена, мы смотрим на формулу ¬αn+1 :
— если формула ¬αn+1 выводима в теории Jn (то есть формула αn+1 опровержима в теории
Jn ), то мы полагаем
Jn+1 = Jn ,
— если же формула ¬αn+1 невыводима в теории Jn (то есть формула αn+1 неопровержима
в теории Jn ), то мы определяем Jn+1 как теорию, получающуюся присоединением к Jn
аксиомы αn+1 :
Jn+1 = Jn + αn+1 .
Заметим, что все теории Jn непротиворечивы. Действительно, по условию, теория J0 = S непро-
тиворечива. Далее, если мы доказали непротиворечивость теории Jn , то
— если формула αn+1 опровержима в теории Jn , то теория Jn+1 = Jn непротиворечива,
поскольку совпадает с непротиворечивой теорией Jn , а
— если формула αn+1 неопровержима в теории Jn , то теория Jn+1 = Jn + αn+1 непротиво-
речива по теореме 2.3.10, потому что получается из непротиворечивой теории Jn присо-
единением к списку аксиом неопровержимой в ней формулы αn+1 .
Пусть теперь J — теория, получающаяся из S добавлением к списку аксиом всех аксиом теорий
Jn :

[
AxJ = AxJn .
n=0
Из непротиворечивости всех теорий Jn следует, что теория J также непротиворечива. Покажем, что
J полна. Рассмотрим произвольную замкнутую формулу ϕ в J. Поскольку все замкнутые формулы
языка теории S (общего для всех теорий Jn и J) мы перечислили в списке {αn }, существует некий
номер n ∈ N такой, что
ϕ = αn+1 .
Теперь возможны два варианта:
— либо формула ¬ϕ = ¬αn+1 выводима в теории Jn , и тогда она будет выводима во всех
более широких теориях Jk , k > n, и в теории J,
— либо формула ¬ϕ = ¬αn+1 невыводима в теории Jn , и тогда в теории Jn+1 = Jn + αn+1
выводима формула ϕ = αn+1 , и она также будет выводима во всех более широких теориях
Jk , k > n + 1, и в теории J.
Мы получаем, что J — непротиворечивая и полная алгебраическая теория, расширяющая S.

Истинность в алгебраической теории и теорема Геделя—Генкина. Пусть T — алгебра-


ическая теория в MK. Объект M теории MK (то есть класс) называется реляционной структу-
рой или просто структурой, если он представляет собой семейство {Mη ; η ∈ Σ♯ } (отображение
η ∈ Σ♯ 7→ Mη ∈ Set) со следующими свойствами:
— множество M@ непусто,
— для всякого предикатного символа η валентности n из сигнатуры Σ справедливо вложение
Mη ⊆ (M@ )n ,
— для всякого функционального символа η валентности n из сигнатуры Σ объект Mη пред-
ставляет собой отображение Mη : (M@ )n → M@ .
— для всякой константы (которую можно рассматривать как функциональный символ ва-
лентности 0) c из сигнатуры Σ объект Mc представляет собой элемент Mc ∈ M@ .
Класс всех реляционных структур теории T обозначается StrT .
Оценкой в реляционной структуре M ∈ StrT называется произвольное отображение ε : A → M@ .
Всякое такое отображение порождает отображение множества TermT термов в универсум M@
τ ∈ TermT 7→ ετ ∈ M@ (2.3.183)
160 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

по следующим правилам:
— для всякой переменной x ∈ A
εx = ε(x),
— для всякой константы c ∈ C
εc = M c
(действие ε на константы не зависит от выбора отображения ε),
— для всякого функционального символа f ∈ F валентности n и любых термов τ1 , ..., τn ∈
Term действие этого отображения на терм (f, τ1 , ..., τn ) описывается формулой

ε(f,τ1 ,...,τn) = Mf (ετ1 , ..., ετn ).

Предикат истинности теории T определяется как отображение TrueT , которое каждой реля-
ционной структуре M ∈ StrT , каждой формуле ϕ ∈ FormT и каждой оценке ε : A → M@ ставит в
соответствие число41 0 или 1 по следующим индуктивным правилам:
— если τ1 , ..., τn – термы, а η – предикатный символ (возможно, равенство) валентности n, то
для формулы ϕ = (η, τ1 , ..., τn ) и оценки ε : A → M@ значение TrueT (M, ϕ, ε) определяется
формулой42 (
1, ε(η,τ1 ,...,τn) ∈ Mη
TrueT (M, (η, τ1 , ..., τn ), ε) = (2.3.184)
0, иначе
— для всякой строки ϕ ∈ FormT и оценки ε : A → M@ значение TrueT (M, (¬, ϕ), ε) меняется
на противоположное по сравнению с TrueT (M, ϕ, ε):
(
1, TrueT (M, ϕ, ε) = 0
TrueT (M, (¬, ϕ), ε) = (2.3.185)
0, TrueT (M, ϕ, ε) = 1

— для любых двух элементов ϕ, ψ ∈ FormT полагаем


(
1, TrueT (M, ϕ, ε) = 1 & TrueT (M, ψ, ε) = 1
TrueT (M, (&, ϕ, ψ), ε) =
0, иначе
(
0, TrueT (M, ϕ, ε) = 0 & TrueT (M, ψ, ε) = 0
TrueT (M, (∨, ϕ, ψ), ε) =
1, иначе
(
0, TrueT (M, ϕ, ε) = 1 & TrueT (M, ψ, ε) = 0
TrueT (M, (⇒, ϕ, ψ), ε) =
1, иначе
  

 True T (M, ϕ, ε) = 1 & True T (M, ψ, ε) = 1 ∨
1,  
TrueT (M, (⇔, ϕ, ψ), ε) = ∨ True T (M, ϕ, ε) = 0 & True T (M, ψ, ε) = 0



0, иначе

— если x ∈ A (переменная), а ϕ ∈ FormT (формула), то


  

 ∀g ∈ M A
∀y ∈ A y 6= x ⇒ g(y) = ε(y)
1, @

TrueT (M, (∀, x, ϕ), ε) = ⇒ TrueT (M, ϕ, g) = 1



0, иначе
41 Или конечный ординал, если термин “число” считается к настоящему времени не определенным. Напомним, что

ординалы 0 = ∅ и 1 = {∅} были определены выше формулами (0.3.260) и (0.3.261), а в свойстве 1◦ на с.60 отмечалось,
что они являются элементами FinOrd.
42 Здесь и ниже мы используем понятие характеристической функции класса, определенное формулой 0.3.209 в

главе о теории MK. Именно оно дает формальную возможность определять функцию TrueT формулами типа (??),
(2.3.185) и т.д. В частности, для ϕ = (η, τ1 , ..., τn ) TrueT (M, ϕ, ε) совпадает с характеристической функцией множества
AM,η,ε = {(x1 , ..., xk ) : (τ1 (ε(x1 , ..., xk )), ..., τn (ε(x1 ), ..., ε(xk )) ∈ Mη }.
§ 3. Выразимость средствами теории множеств и семантизация 161
  

 ∃g ∈ M@A ∀y ∈ A y 6= x ⇒ g(y) = ε(y)
 1, 
TrueT (M, (∃, x, ϕ), ε) = & TrueT (M, ϕ, g) = 1



0, иначе

Если M — реляционная структура какой-то алгебраической теории T , то для формулы ϕ ∈ FormT


ее переводом в реляционной структуре M называется формула

ϕM : ∀ε ∈ M@A TrueT (M, ϕ, ε) = 1. (2.3.186)

Говорят, что формула ϕ в алгебраической теории T истинна в реляционной структуре M , если


ее перевод ϕM выводим в теории MK. В противном случае говорят, что ϕ ложна в реляционной
структуре M .
Следующее утверждение фиксирует главную разницу между выводимостью и истинностью:
Теорема 2.3.12 (закон исключенного третьего для реляционных структур). Для всякой алгебраи-
ческой теории T , любой ее реляционной структуры M и любой замкнутой формулы ϕ в T
— либо ϕ истинна в M ,
— либо ¬ϕ истинна в M .
Доказательство. Это следует из свойств функции True: если формула ϕ замкнута, то в ней нет
свободных переменных, поэтому значения True(M, ϕ, ε) не зависят от оценки ε : A → M@ . Как
следствие, если ϕ не истинна (ложна) в реляционной структуре M , то есть (2.3.186) не выполняется
для какой-то оценки ε : A → M@
TrueT (M, ϕ, ε) 6= 1,
то для этой оценки ε
TrueT (M, ϕ, ε) = 0,
и значит, это верно для всех ε : A → M@ :

∀ε ∈ M@A TrueT (M, ϕ, ε) = 0.

Но тогда
∀ε ∈ M@A TrueT (M, ¬ϕ, ε) = 1 − TrueT (M, ϕ, ε) = 1.
То есть, формула ¬ϕ истинна в реляционной структуре M .
• Моделью алгебраической теории T называется любая ее реляционная структура M ∈ StrT ,
у которой все аксиомы аксиомы теории T истинны в M :

∀ϕ ∈ AxT ⊢MK ϕM . (2.3.187)

Иными словами, нужно, чтобы для любой аксиомы ϕ ∈ AxT при любой оценке ε : A → M@
предикат истинности имеет значение 1:

∀ϕ ∈ AxT ∀ε ∈ M@A TrueT (M, ϕ, ε) = 1. (2.3.188)

Класс ModT всех моделей теории T образует подкласс в классе StrT реляционных структур
теории T .
Из леммы Линденбаума 2.3.11 следует
Теорема 2.3.13 (Гедель, Генкин). 43 Если алгебраическая теория T в MK, непротиворечива, то
у нее существует модель в теории MK.
Доказательство. Здесь будет существенно использоваться соображение, что из предположения о
непротиворечивости алгебраической теории T в MK следует, что MK также предполагается непро-
тиворечивой теорией. Действительно, если бы MK была противоречивой, то для любой формулы
ϕ в T вместе с ϕ в T выводилась бы и формула ¬ϕ. А это значит, что теория T должна быть
противоречивой.
1. Добавим к символам теории T счетное число новых констант {bn }. Мы получим новую тео-
рию, обозначим ее T0 , которая отличается от T только списком констант. Покажем, что теория T0
43 Э.Мендельсон, предложение 2.12, с.74.
162 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

непротиворечива (как и T ). Предположим, мы вывели в теории T0 некую формулу вида ϕ&¬ϕ. Это
значит, что в T0 имеется некое дерево Генцена G, являющееся выводом ϕ&¬ϕ. Это дерево Генцена
составлено из аксиом теории T (то есть имеет вершинами аксиомы теории T ) с возможными подста-
новками вместо переменных и констант теории T еще констант {bn }. Если bi — какая-то из таких
констант, то заменив всюду в дереве G букву bi на какую-нибудь переменную x, не встречающуюся
в G, мы по правилам (LK-0*)— (LK-15*) снова получим дерево Генцена в T0 , но уже без символа bi ,
причем это будет вывод в T0 формулы
   
ϕ b =x &¬ ϕ b =x .
i i

Если таким образом заменить все встречающиеся в G константы bn , то мы получим дерево Генцена
уже в теории T , причем это будет вывод в T формулы
e ϕ,
ϕ&¬ e
e — формула, получающаяся из ϕ заменой имеющихся в ней констант bn на переменные из T .
где ϕ
Это значит, что теория T тоже должна быть противоречива. А это противоречит условиям нашей
теоремы.
2. Итак, новая теория T0 непротиворечива. Пусть {χk ; k > 0} — нумерация всех ее формул,
содержащих не более одной свободной переменной, и пусть для каждого χk символ xk обозначает
входящую в χk переменную (а для замкнутых формул χk , не содержащих переменных, мы фиксиру-
ем отдельную переменную x0 и полагаем xk = x0 ). Выберем далее какую-нибудь последовательность
bnk присоединенных констант (из списка {bn }) так, чтобы выполнялись условия
1) для всякого k константа bnk не содержится в формулах {χ1 , ..., χn },
2) для всякого k константа bnk не содержится в списке констант {bn1 , ..., bnk−1 }.
Для всякого k определим формулу
   
Sk : ¬∀xk χk ⇒ ¬χk x . (2.3.189)
k =bnk

Пусть Tk — теория, получающаяся из T присоединением формул {S1 , ..., Sk } в качестве новых ак-
сиом. Индукцией по k покажем, что все теории Tk непротиворечивы.
Непротиворечивость T0 уже установлена. Предположим, мы установили непротиворечивость
Tk−1 для некоторого k > 1. Если теория Tk противоречива, то в ней выводима любая формула, в
частности,
⊢Tk ¬Sk . (2.3.190)
Теория Tk получается из теории Tk−1 добавлением аксиомы Sk . Поэтому выводимость секвенции
(2.3.190) (в Tk ) означает выводимость секвенции (в Tk−1 )
Sk ⊢Tk−1 ¬Sk . (2.3.191)
Подклеив ее вывод к вершине дерева
Sk ⊢Tk−1 ¬Sk
(LK-5*)
⊢Tk−1 ¬Sk , ¬Sk
(LK-2*)
⊢Tk−1 ¬Sk
мы получаем, что в Tk−1 выводима секвенция
⊢ ¬Sk . (2.3.192)
то есть секвенция   
⊢ ¬ ¬∀xk χk ⇒ ¬χk x . (2.3.193)
k =bnk

Теперь в дереве
       
⊢ ¬ ¬∀xk χk ⇒ ¬χk x ¬ ¬∀xk χk ⇒ ¬χk x ⊢ ¬∀xk χk & ¬ ¬χk x
k =bnk k =bnk k =bnk

(LK-4*)
 
⊢ ¬∀xk χk & ¬ ¬χk x
k =bnk

(LK-4*)

⊢ ¬∀xk χk & χk x
k =bnk
§ 3. Выразимость средствами теории множеств и семантизация 163

левая вершина выводима, потому что это секвенция (2.3.193), а правая — потому что это частный
случай выведенной ранее секвенции (0.2.44). И мы теперь получаем, что в Tk−1 выводима секвенция

⊢ ¬∀xk χk & χk x =b . (2.3.194)
k nk

По теореме о конъюнкции 2.1.22 отсюда следует, что в Tk−1 выводимы секвенции


⊢ ¬∀xk χk (2.3.195)
и
⊢ χk x (2.3.196)
k =bnk

Рассмотрим теперь какой-нибудь вывод G в Tk−1 секвенции (2.3.196). Если в этом выводе G
заменить константу bnk на какую-то новую переменную y, не входящую ни в вывод G, ни в формулу
χk , то мы получим вывод в Tk−1 секвенции

⊢ χk x =y (2.3.197)
k

Отсюда по правилу (LK-13*), мы получаем, что в Tk−1 выводима секвенция


⊢ ∀xk χk (2.3.198)
Но вместе с (2.3.195) это означает, что теория Tk−1 противоречива. А это противоречит нашему
индуктивному предположению.
3. Итак, мы построили теории Tk , k > 0, получающиеся из T0 последовательным добавлени-
ем аксиом (2.3.189), и показали, что они непротиворечивы. Если теперь обозначить символом T∞
теорию, получающуюся присоединением к T0 сразу всех аксиом (2.3.189), то она также будет непро-
тиворечива, потому что в ней любой вывод будет состоять из конечного набора формул, и значит,
будет выводом в какой-то теории Tk . По лемме Линденбаума 2.3.11, теория T имеет какое-то полное
непротиворечивое расширение J.
Наступил момент, когда мы можем, наконец, построить модель теории T , о которой идет речь в
формулировке теоремы. Такой моделью будет некая модель M для теории J: поскольку все теоремы
теории T являются теоремами и в теории J, любая модель для J будет и моделью для T . Напомним,
что на странице 107 мы условились называть термы, не содержащие переменных, замкнутыми.
Структурные элементы нашей модели выглядят так:
— универсумом M@ нашей модели является множество всех замкнутых термов теории J,
— каждому предикатному символу η валентности n теории J ставится в соответствие мно-
жество Mη ⊆ M@n , состоящее из всех последовательностей замкнутых термов (t1 , ..., tn ),
для которых в теории J выводима формула η(t1 , ..., tn )
Mη = {(t1 , ..., tn ) ∈ M@n : ⊢J η(t1 , ..., tn )} (2.3.199)
— каждому функциональному символу η валентности n теории J ставится в соответствие
отображение Mη : M@n → M@ , которое любой последовательностей замкнутых термов
(t1 , ..., tn ) ставит в соотвествие замкнутый терм
Mη (t1 , ..., tn ) = η(t1 , ..., tn ), (t1 , ..., tn ) ∈ M@n .
Чтобы показать, что M — модель для J, нам удобно будет доказать несколько более сильное
утверждение: замкнутая формула ϕ выводима в J тогда и только тогда, когда она истинна в M .
Это доказывается индукцией по числу связок и кванторов. Прежде всего, нужно заметить, что
для замкнутых атомарных формул44 это верно просто по самому определению модели M : если η —
предикатный символ валентности n теории J, и t1 , ..., tn — замкнутые термы в J, то
(2.3.186) (2.3.199)
η(t1 , ..., tn )M ⇔ (t1 , ..., tn ) ∈ Mη ⇔ ⊢J η(t1 , ..., tn )
Теперь предположим, что нам дана замкнутая формула ϕ в J, про которую известно, что любая ее
замкнутая подформула ψ (отличающаяся от ϕ) обладает свойством, о котором говорится в нашей
индукции: ψ выводима в J тогда и только тогда еогда она истинна в M . Покажем, что тогда ϕ тоже
обладает этим свойством.
Вспомним, что по теореме 2.1.30 все формулы выражаются эквивалентностями через операции
¬, ⇒ и ∀. Из этого следует, что, проводя индукцию, мы можем считать, что в наших формулах кроме
этих логических знаков никаких других нет. Поэтому нам достаточно рассмотреть три случая.
44 Атомарные формулы определены на с.107.
164 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

A. Пусть ϕ имеет вид ¬ψ для некоторой формулы ψ в J. Из того, что ϕ замкнута, следует, что
ψ тоже замкнута. Покажем, что ϕ истинна в M тогда и только тогда, когда она выводима
в J:
— Если формула ϕ = ¬ψ истинна в M , то есть
∀ε ∈ M@A True(M, ϕ, ε) = True(M, ¬ψ, ε) = 1
то
∀ε ∈ M@A True(M, ψ, ε) = 1 − True(M, ¬ψ, ε) = 0,
и, как следствие, формула ψ ложна в M . Поскольку ψ замкнута и является
собственной подформулой в ϕ, по предположению индукции, ψ не выводима в
J. Поскольку J полна, формула ¬ψ = ϕ наоборот, должна быть выводима в J.
— Наоборот, если формула ϕ = ¬ψ ложна в M , то есть
∃ε ∈ M@A True(M, ϕ, ε) = True(M, ¬ψ, ε) = 0
то
∃ε ∈ M@A True(M, ψ, ε) = 1 − True(M, ¬ψ, ε) = 1,
и, поскольку формула ψ замкнута, и значит, значения True(M, ψ, ε) не зависят
от оценки ε, мы получаем
∀ε ∈ M@A True(M, ψ, ε) = 1,
то есть формула ψ истинна в M . Поскольку ψ замкнута и является собственной
подформулой в ϕ, по предположению индукции, ψ выводима в J. Поскольку J
непротиворечива, формула ¬ψ = ϕ не выводима в J.
B. Пусть ϕ имеет вид χ ⇒ ψ для некоторых формул χ и ψ в J. Опять из того, что ϕ замкнута,
следует, что χ и ψ тоже замкнуты. Покажем, что ϕ ложна в M тогда и только тогда, когда
ϕ невыводима в J.
— Если ϕ ложна в M , то χ истинна в M , а ψ ложна в M . Значит, по предположению
индукции, χ выводима в J, а ψ не выводима в J. Поскольку J полна, второе
означает, что ¬ψ выводима в J, и мы получаем:
⊢J χ, ⊢J ¬ψ.
Отсюда следует, что
⊢J χ & ¬ψ
то есть, в силу эквивалентности (2.1.56),
⊢J ¬(χ ⇒ ψ)
Иными словами, в J выводима формула ¬ϕ = ¬(χ ⇒ ψ). Поскольку J непроти-
воречива, формула ϕ не может быть выводима в J.
— Наоборот, если ϕ не выводима в J, то, поскольку J полна, формула ¬ϕ = ¬(χ ⇒
ψ) выводима в J. Значит, выводима и эквивалентная ей в силу (2.1.56) формула
χ & ¬ψ, и поэтому выводимы формулы χ и ¬ψ. Поскольку они замкнуты и
являются подформулами в ϕ, по предположению индукции, χ и ¬ψ истинны в
M . Иными словами, χ истинна в M , а ψ ложна в M . Значит, ϕ ложна в M .
C. Пусть ϕ имеет вид ∀x ψ для некоторой формулы ψ в J. Поскольку формула ϕ замкнута,
формула ψ должна иметь не более одной свободной переменной. Значит, она представля-
ет собой одну из формул списка {χk ; k > 1}, составленного нами в пункте 2, когда мы
нумеровали такие формулы:
ψ = χk
для некоторого k > 1. Нам далее нужно рассмотреть два случая.
— Возможен вариант, когда переменная x не входит в χk свободно. Тогда для того,
чтобы ϕ была замкнутой формулой, нужно, чтобы χk тоже была замкнутой
формулой. В этом случае мы получаем такую цепочку равносильностей в MK:
ϕ истинна в M ⇔ χk истинна в M ⇔ ⊢ J χk ⇔ ⊢J ϕ.
§ 3. Выразимость средствами теории множеств и семантизация 165

— Пусть x входит в χk свободно. Тогда x есть просто переменная xk , о которой


говорилось в пункте 2, и
ϕ = (∀xk χk ).
Нам достаточно доказать равносильность

формула ϕ невыводима в J ⇔ формула ϕ ложна в M

В прямую сторону это доказывается цепочкой

J — полная теория ϕ=(∀xk χk ) аксиома Sk из (2.3.189)


6 ⊢J ϕ ⇒ ⊢J ¬ϕ ⇒ ⊢J ¬∀xk χk ⇒

посылка индукции
⇒ ⊢J ¬χk ⇒ формула ¬χk истинна в M ⇒
xk =bnk xk =bnk


⇒ формула χk ложна в M ⇒ ∃ε ∈ M@A TrueJ (M, χk , ε) = 0 ⇒
xk =bnk xk =bnk

⇒ ∃ε ∈ M@A TrueJ (M, ∀xk χk , ε) = inf TrueJ (M, ∀xk χk , δ) = 0 ⇒


A : δ|
δ∈M@ A\{xk } =ε|A\{xk }

⇒ формула ϕ = (∀xk χk ) ложна в M

А в обратную — цепочкой

J — полная теория ϕ=(∀xk χk )


6 ⊢J ϕ ⇐ ⊢J ¬ϕ ⇐ ⊢J ¬∀xk χk ⇐

(2.1.44) посылка индукции
⇐ для некоторого замкнутого терма τ ∈ M@ ⊢J ¬χk ⇐
xk =τ


⇐ для некоторого замкнутого терма τ ∈ M@ формула ¬χk истинна в M ⇐
x =τ
k

⇐ для некоторого замкнутого терма τ ∈ M@ формула χk ложна в M ⇐
xk =τ


⇐ для некоторого замкнутого терма τ ∈ M@ ∃ε ∈ M@A TrueJ (M, χk , ε) = 0 ⇐
xk =τ
⇐ ∃ε ∈ M@A TrueJ (M, ∀xk χk , ε) = inf TrueJ (M, ∀xk χk , δ) = 0 ⇐
A : δ|
δ∈M@ A\{xk } =ε|A\{xk }

⇐ формула ϕ = (∀xk χk ) ложна в M

Теорема Гильберта—Бернайса.
Теорема 2.3.14. Пусть T — алгебраическая теория в MK. Для всякой формулы ϕ в теории T
следующие условия эквивалентны:
(i) ϕ выводима в алгебраической теории T ;
(ii) ϕ истинна в алгебраической теории T :

∀M ∈ ModT ∀ε ∈ M@A TrueT (M, ϕ, ε) = 1

Доказательство. 1. Если формула ϕ выводима в алгебраической теории T , то ϕ истинна в T (это


проверяется так же, как в теореме 2.1.51 об интерпретации).
2. Предположим, что ϕ невыводима в алгебраической теории T , и покажем, что тогда ϕ не может
быть истинной в T . Чтобы это доказать, заметим сначала, что формулу ϕ можно считать замкнутой,
потому что по предложению ??, ϕ и ее замыкание всеобщности ϕ выводятся друг из друга. Пусть
далее формула ϕ замкнута и невыводима в алгебраической теории T . Тогда, по теореме 2.2.7, теория
T + ¬ϕ непротиворечива. По теореме 2.3.13 Генкина это означает, что для теории T + ¬ϕ найдется
модель M в теории Морса-Келли MK. В этой модели формула (¬ϕ)M = ¬(ϕM ) истинна (потому
что ¬ϕ — аксиома теории T + ¬ϕ):

∀ε ∈ M@A TrueT (M, ¬ϕ, ε) = 1


166 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

В силу (2.3.185), это означает, что

∀ε ∈ M@A TrueT (M, ϕ, ε) = 0. (2.3.200)

Заметим теперь, что M будет моделью не только для теории T + ¬ϕ, но и для теории T (которая
отличается от T + ¬ϕ только тем, что в ней нет аксиомы ¬ϕ). При этом, из условия (2.3.200) следует
условие
∃ε ∈ M@A TrueT (M, ϕ, ε) 6= 1 (2.3.201)
(в этот момент мы используем предположение о непротиворечивости MK), поэтому формула ϕ не
может быть истинной формулой в модели M алгебраической теории T . Значит, ϕ не может быть
истинной формулой для алгебраической теории T .

(b) Кодировка формальной теории в MK


Алгебраическая теория, порожденная кодировкой. Пусть S — формальная теория (в смыс-
ле определения на с.105), и предположим, что мы закодировали ее средствами арифметики Пеано
(по алгоритму, описанному на с.141), и p·q – соответствующая кодировка. Тогда, в частности,
— логические символы будут также закодированы, и им будет соответствовать некое мно-
жество B ⊆ N,
— переменные теории S будут закодированы, и им будет соответствовать некое множество
A ⊆ N,
— константы теории S будут также закодированы, и им будет соответствовать некое мно-
жество C ⊆ N,
— функциональные символы теории S будут закодированы, и им будет соответствовать
некое множество F ⊆ N,
— предикатные символы теории S будут закодированы, и им будет соответствовать некое
множество P ⊆ N.
Это можно интерпретировать так, что нам задан некий алгебраический язык L = (B, A, C, F, P )
(как мы его определяли на с.155). Этот алгебраический язык определяет некое множество формул
FormL . С другой стороны, каждой формуле ϕ теории S соответствует некая формула ϕ† ∈ FormL ,
определенная по тем же правилам, что и ϕ, но интерпретируемым как правила построения алгеб-
раической формулы. Формулу ϕ† логично называть алгебраизацией формулы ϕ.
В частности, каждой аксиоме ϕ теории S будет соответствовать некая алгебраическая формула
ϕ† ∈ FormL . Точно так же, каждой схеме аксиом в S соответствует некое множество формул в FormL .
Как следствие, вся систем аксиом теории S определяет некое множество алгебраических формул

AxS ⊆ FormL .

Возникающую пару (L, AxS ) ничто не мешает рассматривать как алгебраическую теорию (в том
смысле, в котором этот термин был определен на с.156). Эту теорию мы будем называть алгебраи-
ческой кодировкой формальной теории S и обозначать

S † = (L, AxS ).

При этом правило † можно доопределить на наборы формул, секвенции и деревья Генцена. Мы
получим, что
— для каждой формулы ϕ формальной теории S определена формула ϕ† алгебраической
теории S † ,
— каждому набору формул Γ формальной теории S поставлен в соответствие набор формул
Γ † алгебраической теории S † ,
— каждой секвенции Γ ⊢ ∆ формальной теории S поставлена в соответствие неая секвенция
(Γ ⊢ ∆)† алгебраической теории S † ,
— каждому дереву Генцена R формальной теории S поставлено в соответствие некое дерево
Генцена R† алгебраической теории S † .
! 2.3.15. На всякий случай полезно заметить, что не любая алгебраическая теория в MK является
алгебраической кодировкой некоторой формальной теории S, даже если ее язык состоит из под-
множеств в N, например, потому что в нашем определении формальной теории сигнатура теории S
§ 3. Выразимость средствами теории множеств и семантизация 167

должна быть конечна, а в определении алгебраической теории этого требования нет, там она может
быть бесконечна.
Заметим теперь, что после того, как мы это проделали, для всякой формулы ϕ в исходной теории
S у нас возникает три способа понимать ее выводимость:
1) прежде всего, формула ϕ может быть выводима в самой формальной теории S,
2) кроме того, ее алгебраизация ϕ† может быть выводима в алгебраической теории S † ,
3) наконец, соответствующий предикат PrMK (pϕq) может быть выводим в теории MK.
Очень важный момент в этих рассмотрениях состоит в том, что (независимо от предположе-
ний о теории MK) при подходящем выборе алгоритма кодировки последние два вида выводимости
эквивалентны: если, например, кодировка выбрана такой, как описывается на с.141, то выводи-
мость формулы ϕ† в алгебраической теории S † эквивалентна выводимости формулы PrMK (pϕq) в
теории MK. Это так, потому что существование вывода для ϕ† в S † и существование аргумента y
для которого выводима формула Prf MK (y, pϕq) описывается формулами одной и той же теории MK,
эквивалентность которых доказывается по индукции.
Однако эквивалентность первого вида выводимости последним двум неочевидна: выше в при-
мере 2.1.59 мы уже описывали результат Гудстейна, согласно которому формула ϕ в теории PA,
перевод которой в MK выводим, не обязана быть выводимой в PA. Так же как и в той ситуации, мы
не можем заключить автоматически, что формула ϕ выводима в S, если ее алгебраизация ϕ† выво-
дима в S † , или предикат PrMK (pϕq) выводим в MK. Следующая теорема показывает, что для этого
нужно использовать сложную технику, разработанную в § 2, с дополнительным предположением об
ω-непротиворечивости теории MK.
Теорема 2.3.16 (о выводимости в кодировке). Пусть формальная теория S закодирована в MK с
универсумом N по алгоритму, описанному на с.141. Тогда в предположении ω-непротиворечивости
MK для формулы ϕ в S следующие условия эквивалентны:
(i) формула ϕ выводима в формальной теории S,
(ii) формула ϕ† выводима в алгебраической теории S † .
(iii) формула PrMK (pϕq) выводима в теории MK.
Доказательство. 1. (i) ⇒ (ii): если формула ϕ выводима в формальной теории S, то это значит,
что существует некое дерево Генцена G, являющееся выводом для ϕ. Этому дереву Генцена G
соответствует некий граф G† в алгебраической теории S † , и, поскольку определение вывода в S и
в S † описываются одинаковыми правилами, граф G† будет выводом для формулы ϕ† в S † . То есть
формула ϕ† выводима в алгебраической теории S † .
2. (ii) ⇒ (iii): если формула ϕ† выводима в алгебраической теории S † , то мы уже отмечали, что
формула PrMK (pϕq) выводима в теории MK.
3. (ii) ⇒ (iii): если PrMK (pϕq) выводима в MK, то в предположении ω-непротиворечивости теории
MK мы оказываемся в ситуации, описанную в теореме 2.2.13: из выводимости PrMK (pϕq) в MK
следует формула ϕ выводима в S.

Семантизация произвольной формальной теории.


• После того, как формальная теория S закодирована, мы получаем класс ModS † моделей
алгебраической теории S † , определенный формулой языка теории MK. К конструкциям
FormS † , AxS † , TrueS † и ModS † можно относиться как к присоединенным функциональным
символам (валентности 0, 0, 3 и 0 соответственно), тогда теория MK с этими присоеди-
ненными символами превращается в некое дефинициальное расширение S ∗ теории MK.
Теория S ∗ называется семантизацией формальной теории S в теории MK.
• Семантизация45 ϕ∗ формулы ϕ теории S определяется как формула теории S ∗ , выра-
жающая истинность алгебраизации ϕ† формулы ϕ в алгебраической теории S † :
∀M ∈ ModS ∀ε ∈ M@A True(M, ϕ, ε) = 1 (2.3.202)
(что по теореме Гильберта–Бернайса 2.3.14 эквивалентно выводимости ϕ† в S † ). Для фик-
сированной модели M ∈ ModS формула
∀ε ∈ M@A True(M, ϕ, ε) = 1 (2.3.203)
45 Для теорий с конечной системой аксиом семантизацию формул можно определить гораздо проще, см. определение
на с.153.
168 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

называется семантизацией формулы ϕ в модели M и обозначается ϕM .

! 2.3.17. По определению класса ModS , семантизация ϕ∗ всякой аксиомы ϕ теории S выводима в


семантизации S † теории S.
Следующее утверждение представляет собой один из ключевых результатов в этой науке, ко-
торый принято называть теоремой Гёделя о полноте46 . Мы приводим его под другим названием,
поскольку по нашему мнению, упоминание о полноте здесь излишне. Это утверждение показывает,
что всякая формальная теория S в определенном смысле эквивалентна своей семантизации S † (в
MK или, в действительности, в любой другой рабочей теории множеств).
Теорема 2.3.18 (о семантизации теории с бесконечной системой аксиом). В предположении ω-
непротиворечивости теории MK, для любой формальной теории47 S над логикой предикатов и
любой формулы ϕ в ней следующие условия эквивалентны:
(i) формула ϕ выводима в S,
(ii) ее семантизация ϕ∗ выводима в семантизации S ∗ теории S.
! 2.3.19. Как и в теореме 2.3.6, огрубляя картину, можно сказать, что условие (ii) здесь эквива-
лентно тому, что в каждой модели M ∈ ModS теории S соответствующая формула ϕM выводима
(как в формальной теории, какую представляет собой модель M ).
Доказательство. Закодируем теорию S в MK с универсумом N по алгоритму, описанному на с.141:
пусть S † такая кодировка. По теореме 2.3.16, условие (i) эквивалентно условию
(i)’ формула ϕ† выводима в алгебраической теории S † ,
По теореме Гильберта-Бернайса 2.3.14 это условие эквивалентно условию
(ii)’ формула ϕ† истинна в алгебраической теории S † ,
А это эквивалентно условию (ii).

(c) Семантические теории и аксиоматизация


Мы уже говорили выше, что теоремы о семантизации 2.3.6 и 2.3.18 позволяют математикам свести
изучение общих формальных теорий к изучению дефинициальных расширений теории множеств
MK. Выработанная в теории множеств интуиция фактически позволяет вообще забыть определение
формальной теории (приведенное нами на с.105) и рассматривать любую теорию как дефинициаль-
ное расширение рабочей теории множеств. По этой причине мы для дальнейших построений вводим
следующее определение.
• Семантической теорией мы будем называть произвольное дефинициальное расширение
теории множеств MK (или любой другой рабочей теории множеств). При этом аксиома-
ми семантической теории будут называться просто определения этого дефинициального
расширения (то есть новые формулы, добавленные в список аксиом теории MK).
Понятно, что семантизация формальной теории будет семантической теорией, поэтому всякую
формальную теорию S можно по теореме 2.3.18 представить как семантическую (то есть подобрать
для S эквивалентную ей в смысле теоремы 2.3.18 семантическую теорию S † ), а, с другой сторо-
ны, всякая семантическая теория по замечанию 2.3.2 является и формальной. Эти две операции
— превращение формальной теории в семантическую и наоборот — не будут, конечно, взаимно об-
ратными, но все же переход по ним дает в некотором смысле эквивалентную теорию (на уровне
утверждений, формулируемых в теории S, но, конечно, не в обычном смысле, как мы уже говорили
перед примерами 2.3.8 и 2.3.9).

Эта установка — сводить все теории к семан- циальное расширение рабочей теории множеств,
тическим — настолько естественна для матема- а вопрос, нельзя ли ее представить как семанти-
тиков, что подавляющее большинство из них о зацию какой-то формальной теории, обычно во-
формальных теориях не задумывается. Считает- обще не возникает. Это оправдывается тем, что
ся, что теорию достаточно описать как дефини- такое представление очень часто, почти всегда

46 См. напр. Г.Такеути. Теория доказательств. М.: Мир, 1978.


47 См. подстрочное примечание 29.
§ 3. Выразимость средствами теории множеств и семантизация 169

бывает чрезвычайно громоздким, а иногда и во- Это очень важная теория в тех частях матема-
все невозможным. Вот некоторые примеры та- тики, которые каким-то образом связаны с ана-
ких “трудноупрощаемых” и “неупрощаемых” се- лизом, но она, по-видимому, не представима как
мантических теорий. семантизация какой-то формальной теории.
⋄ 2.3.20. Общая топология. Топологическим про-
Это был пример, апеллирующий к общемате-
странством называется всякая пара (M, τ ), в ко-
матической эрудиции, а вот еще несколько при-
торой M — множество, а τ — система подмно-
меров теорий, описываемых в самом нашем учеб-
жеств в M , то есть множество
нике.
τ ⊆ 2M ,
⋄ 2.3.21. Теория вещественных чисел, как семан-
такое, что выполняются следующие условия, на- тическая теория, описывается на с.187.
зываемые аксиомами общей топологии:
∅ ∈ τ, (2.3.204) ⋄ 2.3.22. Теория векторных пространств, как се-
мантическая теория, описывается на с.738.
M ∈ τ, (2.3.205)
U, V ∈ τ ⇒ U ∩ V ∈ τ, (2.3.206) ⋄ 2.3.23. Теория евклидовых пространств, как се-
U ⊆τ ⇒ ∪U ∈τ (2.3.207) мантическая теория, описывается на с.822.
Класс таких объектов образует семантическую ⋄ 2.3.24. Теория инвариантной меры, как семан-
теорию в MK, называемую общая топология. тическая теория, описывается на с.971.

Аксиоматизации физических теорий. Вопрос о том, можно ли считать данную теорию фор-
мальной (или семантической, что, как мы теперь понимаем, эквивалентно), полезно обсуждать не
только в математике, но также и (по крайней мере) в тех науках, которые используют математику,
но формально не являются ее частью. Это приводит к любопытным и совсем неочевидным (по край-
ней мере, для неспециалиста по логике) выводам. Разговор об этом удобно начать с упоминания о
шестой проблеме Гильберта.
В 1900 году на II Математическом конгрессе Давид Гильберт предложил некий список перво-
очередных задач математики (так, как он их понимал), и среди них, между прочим, была такая:
аксиоматизировать физику.

Утверждается, что в момент своего выступления Гильберт сформулировал это как одну из 10 задач.
Позже он этот список расширил до 23-х, и в нем эта проблема получила номер 6. С тех пор она
называется 6-й проблемой Гильберта.
Во времена, когда она была поставлена, математическая логика еще не оформилась в строгую
дисциплину, и, в частности, что следует понимать под аксиоматизацией, еще не было толком понят-
но. Очевидно, по этой причине до сих пор не существует единого мнения о том, насколько далеко
продвинулись математики в решении этой задачи. Мнения сходятся только в том, что даже при
самом нетребовательном понимании аксиоматизации, которое можно встретить среди далеких от
логики математиков (и, в большей мере, физиков), эту проблему нельзя считать решенной (хотя
бы потому что “единой физической теории” пока не построено).
В свете того, что мы уже знаем про аксиоматические теории, задачу, поставленную Гильбер-
том, можно понимать либо как предписание построить формальную теорию (другими словами,
теорию 1 порядка), описывающую законы физики, и на уровне определений не связанную с теори-
ей множеств. Либо как семантическую теорию, то есть дефинициальное расширение какой-нибудь
рабочей теории множеств, например, теории MK. По теореме о семантизации 2.3.18 эти два решения
будут эквивалентны. С другой стороны, как показывают примеры на с.169, второе из них ближе к
традиции, и может считаться более удобным.

Как мы уже говорили, общей для всей физи- ские теории. Следующие примеры дают некото-
ки теории построить не удалось. Однако неко- рое представление о прогрессе в этой области.
торые конкретные области этой науки можно
⋄ 2.3.25. Классическая механика может считать-
считать аксиоматизированными, и именно в том
ся в настоящее время аксиоматизированной, по-
смысле, что они описаны ныне как семантиче-
скольку ее удалось описать как семантическую
48 См.: В.И.Арнольд. Математические методы классической механики. М.: Наука, 1974.
170 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

теорию в современных вариантах Лагранжевой в теории операторов на гильбертовом простран-


и Гамильтоновой механики.48 стве, по крайней мере, если целью ставится вы-
вод каких-то утверждений о строении или свой-
⋄ 2.3.26. Теория относительности также может ствах атомов, молекул или каких-то элементар-
считаться аксиоматизированной, поскольку она ных частиц (потому что ни атомам, ни молеку-
описывается как семантическая теория, дефи- лам, ни частицам определений в этой теории то-
нициальное расширение современной дифферен- же не дается).
циальной геометрии49 (которая в свою очередь Как следствие, например, таблица Д. И. Мен-
представляет собой дефинициальное расширение делеева, которая, казалось бы, должна быть пер-
теории вещественных чисел50 ). вым и главным, о доказательстве чего следова-
ло бы думать в квантовой механике, не является
⋄ 2.3.27. Квантовую механику, по контрасту с теоремой этой науки. Почему, скажем, на первой
предыдущими примерами, к настоящему време- электронной оболочке может уместиться только
ни считать аксиоматизированной нельзя, потому 2 электрона, на второй – 8, на третьей – опять
что ее пока не удалось описать ни как семантиче- 8, и т.д. – с точки зрения логики остается за-
скую теорию, ни тем более как теорию 1 поряд- гадкой (как и другие закономерности в строении
ка. Отношение нынешних специалистов к этой атомов).
проблеме иллюстрирует разницу между матема-
тическим и физическим образованием: физики, ⋄ 2.3.28. Теория вероятностей представляет со-
услышав такое, энергично протестуют, ссылаясь бой показательный пример дисциплины, аксио-
на то, что они называют “постулатами Дирака- матизация которой была найдена уже после до-
фон Неймана квантовой механики”. клада Гильберта. В 1933 году ее описание как
Одна из причин, почему мы подробно обсуж- семантической теории (дефинициального расши-
дали понятия математической логики в этом па- рения теории меры) было дано А. Н. Колмого-
раграфе, состояла как раз в том, чтобы дать ровым.52 Физики не считают эту область своей,
читателю возможность проверить детали в по- объявляя ее частью математики. Мне этот тезис
добных спорах. Поглядев на рассуждения фи- кажется спорным, из-за того, что трудно понять,
зиков на эту тему, читатель теперь может сам не является ли он следствием общей для подоб-
убедиться, что постулаты Дирака-фон Неймана ных ситуаций закономерности: как только наука
в том виде, как их описывают в нынешних учеб- получает строгую математическую интерпрета-
никах по квантовой теории51 невозможно интер- цию, она сразу становится частью математики,
претировать ни как аксиомы формальной тео- независимо от того, к какой области ее относили
рии (потому что никакая формальная теория в до этого. По этой причине я привожу этот при-
этой науке не описывается), ни как определения мер в списке физических теорий.

§4 Другие логические системы


(a) Другие аксиоматизации логики предикатов
Гильбертовское исчисление предикатов CQC. В главе 0 мы говорили, что помимо исчисле-
ния секвенций LK, предложенного Генценом для описания логики предикатов, в математике часто
используется другая система, CQC (“Classical quantificational calculus”), называемая исчислением
предикатов, построенная Гильбертом и решающая ту же задачу. Эти системы описывают одну
и ту же логику, поэтому эквивалентны. Мы не будем доказывать их эквивалентность, а просто
опишем здесь систему Гильберта, чтобы читатель мог составить себе представление о ней.
Система CQC также состоит из аксиом и правил вывода. Но, в отличие от LK, в CQC аксиом
много, а правил вывода мало. Еще одно отличие – что в CQC не используется символ секвенции ⊢
(потому что считается, что выводиться должны не формулы из формул, то есть не секвенции ϕ ⊢ χ,
а прямо сами формулы ϕ ⇒ χ).

• Аксиомами исчисление предикатов называются формулы следующих трех типов.


49 См.: А.Бессе. Многообразия Эйнштейна. Т.1,2. М.: Мир, 1990.
50 Теорию вещественных чисел как дефинициальное расширение теории множеств мы описываем ниже в главе 3.
51 См., напр., Ф.А.Березин, М.А.Шубин. Уравнение Шредингера. М.: МГУ, 1983.
52 См. A. N. Kolmogorov. Grundbegriffe der Wahrscheinlichkeitrechnung, in Ergebnisse der Mathematik. — Berlin, 1933.

Русский перевод: А. Н. Колмогоров. Основные понятия теории вероятностей. — М.: Наука, 1974.
§ 4. Другие логические системы 171

1) Формулы, называемые аксиомами исчисления высказываний53 :

ϕ ⇒ (χ ⇒ ϕ) (CQC-1)
(ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (CQC-2)
(ϕ & χ) ⇒ ϕ (CQC-3)
(ϕ & χ) ⇒ χ (CQC-4)
ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (CQC-5)
ϕ ⇒ (ϕ ∨ χ) (CQC-6)
χ ⇒ (ϕ ∨ χ) (CQC-7)
(ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (CQC-8)
(¬ϕ) ⇒ (ϕ ⇒ χ) (CQC-9)
(ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (CQC-10)
ϕ ∨ (¬ϕ) (CQC-11)

2) Формулы, называемые кванторными аксиомами исчисления предикатов:



— если x – переменная, τ — терм, и замена ϕ x=τ корректна, то

(∀x ϕ) ⇒ ϕ x=τ (CQC-12)

ϕ ⇒ (∃x ϕ)
x=τ
(CQC-13)

— если ϕ и ψ – формулы, а x – переменная, не являющаяся свободной для ψ, то

(∀x (ϕ ⇒ ψ)) ⇒ ((∃x ϕ) ⇒ ψ)) (CQC-14)


(∀x (ψ ⇒ ϕ)) ⇒ (ψ ⇒ (∀x ϕ)) (CQC-15)

• Правилами вывода в исчислении предикатов называются следующие два правила:


modus ponens: если выводимы формулы ϕ и ϕ ⇒ ψ, то выводима формула ψ; это изображается
дробью54
ϕ, ϕ ⇒ ψ
(CQC-16)
ψ
generalisation: если выводима формула ϕ, то выводима формула ∀x ϕ; это изображается дробью
ϕ
(CQC-17)
∀x ϕ

Вывод в CQC обычно выглядит не так нагляд- но труднее, чем в LK.


но, как в LK, потому что его принято представ-
лять не деревом, а линией (или, правильнее ска-
зать, деревом с одной веткой). Мы нарушим эту
традицию и покажем, как будет выглядеть эта
картина, если ее перевести на язык деревьев Ген-
цена (с очевидной поправкой, что при переводе
символ ⊢ должен исчезнуть). Как может заме-
тить читатель, в CQC, из-за громоздкости акси-
ом, деревья вывода получаются более сложны-
ми, чем в LK (по этой причине мы выносим их в
подстрочные примечания). Кроме того, при дви-
жении от аксиом вниз приходится уточнять под-
становки (чтобы зритель понимал, как из дан-
ной аксиомы получилась нужная нам формула).
Главное же неудобство здесь в том, что вообще
сообразить, как строить вывод в CQC существен- ⊲ 2.4.1. Покажите, что следующая формула вы-
53 Читатель может обратить внимание, что выводимость формул (CQC-1)—(CQC-10) в LK предлагалась в качестве

упражнения в задачах 0.2.37, а (CQC-11) была выведена в LK в (0.2.69).


54 В теории LK правило modus ponens описывалось в примере 0.2.4 как выводимость секвенции ϕ, ϕ ⇒ ψ ⊢ ψ.
172 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

водима в CQC:55 ⊲ 2.4.2. Докажите выводимость в CQC форму-


лы56
α⇒α (2.4.208) (α ⇒ β) ⇒ (α ⇒ α) (2.4.209)

Исчисление Кетонена G3c. Еще одна аксиоматизация логики предикатов, так называемое ис-
числение G3c финского математика Оива Кетонена, была придумана как модификация генценов-
ской системы LK. В языке этой системы добавляются два символа: символ ⊥, означающий “абстракт-
ную ложь”, и символ ⊤, означающий “абстрактную истину”. Кроме того, отрицание ¬α понимается
как сокращение для формулы α ⇒ ⊥. Еще один важный момент — что наборы формул в секвенци-
ях здесь понимаются не как строки, а как “мультимножества”. Это означает, что в наборе формул
можно как угодно переставлять формулы (отделенные друг от друга запятыми), и при этом счита-
ется, что набор не меняется. Отсюда, в частности, следует, что генценовские правила перестановки
(LK-3*) в этой системе лишние.57
• Аксиомами исчисления G3c считаются следующие три вида секвенций:

Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (G3c-0)

• Правила вывода для исчисления G3c делятся на три группы. В первой группе перечисля-
ются бескванторные правила:

Γ, ϕ, χ ⊢ ∆ Γ ⊢ ϕ, ∆ Γ ⊢ χ, ∆
(G3c-1)
Γ, ϕ & χ ⊢ ∆ Γ ⊢ ϕ & χ, ∆
Γ, ϕ ⊢ ∆ Γ, χ ⊢ ∆ Γ ⊢ ϕ, χ, ∆
(G3c-2)
Γ, ϕ ∨ χ ⊢ ∆ Γ ⊢ ϕ ∨ χ, ∆
Γ ⊢ ϕ, ∆ Γ, χ ⊢ ∆ Γ, ϕ ⊢ χ, ∆
(G3c-3)
Γ, ϕ ⇒ χ ⊢ ∆ Γ ⊢ ϕ ⇒ χ, ∆
Во второй – правила с кванторами,
в которых x — произвольная переменная, τ — произ-

вольный терм, а подстановка ϕ корректна:
x=τ


Γ, ∀x ϕ, ϕ ⊢∆ Γ ⊢ ϕ , ∃x ϕ, ∆
x=τ x=τ
(G3c-4)
Γ, ∀x ϕ ⊢ ∆ Γ ⊢ ∃x ϕ, ∆
И в третьей – правила с кванторами, в которых на одну из переменных, y, накладывается
требование, что она не должна входить в формулы в нижних секвенциях, а подстановка
55 Для формулы (2.4.208) выводом может быть дерево

ϕ ⇒ (χ ⇒ ϕ) (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ))


ϕ=α
ϕ=α
χ = (α ⇒ α)
χ = (α ⇒ α)
ψ=α
ϕ ⇒ (χ ⇒ ϕ) α ⇒ ((α ⇒ α) ⇒ α), (α ⇒ ((α ⇒ α) ⇒ α)) ⇒ (α ⇒ (α ⇒ α)) ⇒ (α ⇒ α)
ϕ=α
(2.4.218)
χ=α
α ⇒ (α ⇒ α), (α ⇒ (α ⇒ α)) ⇒ (α ⇒ α)
(2.4.218)
α⇒α

Здесь на вершинах ветвей находятся аксиомы (CQC-1) и (CQC-2), и при движении вниз входящие в них формулы
заменяются на формулы α или α ⇒ α, там указано как.
56 Для формулы (2.4.209) выводом может быть дерево

ϕ ⇒ (χ ⇒ ϕ) (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ))


ϕ=α
ϕ=α
χ=β
χ=α
ψ=α
α ⇒ (β ⇒ α) (α ⇒ (β ⇒ α)) ⇒ (α ⇒ β) ⇒ (α ⇒ α)
(2.4.218)
(α ⇒ β) ⇒ (α ⇒ α)

Здесь снова на вершинах ветвей находятся аксиомы (CQC-1) и (CQC-2).


57 Подробности об этой замечательной системе см. в книге: S. Negri, G. von Plato. Structural proof theory, Cambridge

University Press, 2001.


§ 4. Другие логические системы 173


ϕ должна быть корректной:
x=y


Γ, ϕ ⊢∆ Γ ⊢ ϕ ,∆
x=y x=y
(G3c-5)
Γ, ∃x ϕ ⊢ ∆ Γ ⊢ ∀x ϕ, ∆

О невыводимых секвенциях. В примерах был вывод, то он заканчивался бы переходом


2.2.27 и 2.2.28 выше мы показывали, как мож-
α, α ⊢ ⊥
но доказывать невыводимость некоторых секвен-
(G3c-3)
ций в данной формальной теории S методом по- α⊢α⇒⊥
строения контрмодели. Мы говорили там, что
недостаток этого метода состоит в том, что он Теперь если поглядеть на вершину этого дере-
применим только при фундаментальном допу- ва, то видно, что дальше вверх его не продол-
щении, что в рабочей теории множеств (в на- жишь, потому что никакое из правил (G3c-1)-
шем случае, в MK) нет противоречий. В общем (G3c-5) здесь применить невозможно (в этот мо-
случае известно, что проблема, выводима дан- мент мы используем тот факт, что α — атомар-
ная секвенция, или нет, алгоритмически нераз- ная формула). Но на вершине этого дерева не
решима. Однако есть еще один метод, позволяю- аксиома. Значит, оно – не вывод для нашей се-
щий в некоторых случаях доказывать невыводи- квенции. Мы получаем, что у секвенции (2.4.210)
мость секвенций в данной формальной теории S вывода вообще нет.
без каких-то дополнительных предположений о ⋄ 2.4.4. Пусть снова α — атомарная форму-
непротиворечивости других формальных теорий ла59 со свободной переменной x. Покажем, что
T , в которых мы строим интерпретации S. секвенция, рассматривавшаяся нами в примере
Этот метод основывается на применении ис- 0.2.13,
числения Кетонена G3c, которое для таких за- α ⊢ ∀x α (2.4.211)
дач удобнее исчисления Генцена LK тем, что в
невыводима. Выберем какую-нибудь перемен-
нем меньше правил, из-за которых дерево Генце-
ную, не входящую в формулу α, пусть это бу-
на может разрастаться бесконечно далеко вверх:
дет y (понятно, что y отличается от x, потому
именно, правила сокращения (LK-2*) и сечения
что x входит в α). Предположим, что у секвен-
(LK-4*) отсутствуют (но, правда, правила добав-
ции (2.4.211) имеется вывод. Тогда в нем послед-
ления кванторов (LK-12*) и (LK-15*) заменяются
ний шаг должен использовать правое правило
правилами (G3c-4), которые все равно оставляют
(G3c-5) (потому что перейти к (2.4.211) в систе-
такую возможность бесконечного разрастания,
ме G3c можно только с помощью правого прави-
поэтому такой способ доказательства невыводи-
ла (G3c-5)). То есть последний шаг этого вывода
мости секвенции тоже не всегда работает). По-
должен быть таким
скольку G3c эквивалентна LK, это позвляет дока-
зать невыводимость некоторых секвенций (при-
α ⊢ α
менением G3c, хотя в LK такое доказательство x=y
(G3c-5)
(2.4.212)
построить будет невозможно). Покажем это на
α ⊢ ∀x α
примерах.
Дальше уже двигаться вверх невозможно, по-
⋄ 2.4.3. Пусть α — атомарная формула58 . Рас- тому что никакое правило применить не полу-
смотрим секвенцию (0.2.45), невыводимость ко- чится (из-за атомарности формулы α). Значит,
торой мы обещали доказать в примере 0.2.11: вывод должен иметь вид дерева (2.4.212). Но в
нем на вершине не стоит аксиома (потому
что
α ⊢ ¬α. (2.4.210)
y не совпадает с x, и значит, α и α — раз-
x=y
В системе G3c это делается так. Сначала рас- ные формулы). Значит это дерево – не выводы, и
шифруем запись ¬α для системы G3c: следовательно, у секвенции (2.4.211) вывода дей-
ствительно нет.
α ⊢ α ⇒ ⊥.
⋄ 2.4.5. Пусть снова α — атомарная форму-
После этого становится видно, что единственное ла60 со свободной переменной x. Покажем, что
правило вывода в системе G3c, которое может секвенция, рассматривавшаяся нами в примере
привести к такой секвенции – правое правило в 0.2.15,
(G3c-3). Поэтому если бы у секвенции (2.4.210) ∃x α ⊢ α (2.4.213)
58 В теории множеств это формулы вида x = y и x ∈ y, мы об этом говорили на с.8.
59 См. подстрочное примечание 58 .
60 См. подстрочное примечание 58 .
174 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

невыводима. Выберем какую-нибудь перемен-
(где z не входит в формулу α , и поэтому z
ную, не входящую в формулу α, пусть это бу- x=y
не может совпадать с y), а во втором – только
дет y (понятно, что y отличается от x, пото-
таким:
му что x входит в α). Предположим, что у се-
квенции (2.4.213) имеется вывод. Тогда в нем по-

следний шаг должен использовать левое правило α ⊢ α
x=y x=z
(G3c-5) (потому что перейти к (2.4.213) в систе- (G3c-5)
ме G3c можно только с помощью левого прави- (2.4.217)
∃x α ⊢ α
ла (G3c-5)). То есть последний шаг этого вывода x=z
(G3c-5)
должен быть таким
∃x α ⊢ ∀x α

α ⊢α
x=y
(2.4.214)
(G3c-5) (где y не входит в формулу α , и поэтому z
x=z
∃x α ⊢ α опять не может совпадать с y).
Дальше уже двигаться вверх невозможно, по- Дальше уже двигаться вверх невозможно, по-
тому что никакое правило применить не полу- тому что никакое правило применить не полу-
чится (из-за атомарности формулы α). Значит, чится (из-за атомарности формулы α). Значит,
вывод должен иметь вид дерева (2.4.214). Но в вывод должен либо иметь вид дерева (2.4.216),
нем на вершине не стоит аксиома (потому что y либо дерева (2.4.217). Но в обоих случаях на вер-
шине не стоит аксиома (потому
не совпадает с x, и значит, α и α — разные что y и z — раз-
x=y
формулы). Значит это дерево – не вывод, и, как ные переменные, и значит, α и α — раз-
x=y x=z
следствие, у секвенции (2.4.213) вывода действи- ные формулы). Значит эти деревья – не выво-
тельно нет. ды, и следовательно, у секвенции (2.4.215) выво-
⋄ 2.4.6. Пусть снова α — атомарная форму- да действительно нет.
ла61 со свободной переменной x. Покажем, что
секвенция, рассматривавшаяся нами в примере
0.2.17, Контрпример к теореме дедукции. Выше
∃x α ⊢ ∀x α (2.4.215) перед формулировкой теоремы дедукции 0.2.44
мы пообещали дать контрпример, показываю-
невыводима. Будем считать, что переменные y
щий, что понятия следования и выводимости
и z не входят в формулу α. Предположим, что
между формулами не эквивалентны. Это наблю-
у секвенции (2.4.215) имеется вывод. Тогда в
дение использует рассмотренный выше пример
нем последний шаг должен использовать прави-
2.4.4:
ла (G3c-5) (потому что перейти к (2.4.215) в си-
стеме G3c можно только с помощью (G3c-5)). То
⋄ 2.4.7. Существуют формулы α и β такие, что
есть конец этого вывода должен быть либо таким
β выводится из α, но β не следует из α.

α ⊢ ∀x α
x=y
(G3c-5)
Доказательство. Рассмотрим какую-нибудь
∃x α ⊢ ∀x α атомарную формулу α со свободной переменной
x и пусть β обозначает формулу ∀x α. Тогда:
(где y не входит в формулу ∀x α), либо таким
1) формула ∀x α выводится из α: существует де-

∃x α ⊢ α рево
x=z
(G3c-5) ⊢α
∃x α ⊢ ∀x α (LK-13*)

(где z не входит в формулу ∃x α). В обоих слу- ⊢ ∀x α,


чаях движение вверх может быть опять только с
как отмечалось в предложении 0.2.42, но од-
использованием правил (G3c-3). В первом случае
новременно
дерево может получиться только таким
2) формула ∀x α не следует в LK из α: секвенция

α ⊢ α
x=y x=z
(G3c-5) α ⊢ ∀x α

(2.4.216)
α ⊢ ∀x α
x=y не выводится в LK, в силу примера 2.4.4.
(G3c-5)
∃x α ⊢ ∀x α

61 См. подстрочное примечание 58 .


§ 4. Другие логические системы 175

(b) Логика высказываний


Помимо логики предикатов в математике (и еще больше в ее приложениях) очень популярна ло-
гическая система, называемая логикой высказываний (или пропозициональным исчислением). Она
получается из логики предикатов выбрасыванием алфавита, сигнатуры и кванторов (с сохранени-
ем только метаформул, которые в этой науке называются пропозициональными формулами, и под
которыми понимается то, что остается после этих преобразований от метаформул в определении на
с.110). Мы здесь бегло ее опишем, только чтобы оттенить детали, связанные с логикой предикатов.
Доказательство утверждений мы оставляем читателю.

Различные аксиоматизации логики высказываний. Как и логику предикатов, логику вы-


сказываний можно описывать разными аксиоматическими системами. Мы здесь отметим системы,
получающиеся как модификации LK, CQC и G3c, и обозначаемые соответственно LKp, CQCp и G3cp.
Как мы говорили, в этих модификациях рассматривается только то, что остается после выбрасы-
вания переменных (а вместе с ними, термов и формул), с сохранением одних метапеременных62 (то
есть символов алфавита метаязыка) и логических символов, исключая кванторы. Формулы в LKp,
CQCp и G3cp называются пропозициональными формулами и определяются по индукции:
— всякая метапеременная

α, β, γ, ..., ϕ, χ, ψ, ω, α′ , β ′ , γ ′ , ..., ϕ′ , χ′ , ψ ′ , ω ′ , ...

является пропозициональной формулой,


— если ϕ – пропозициональная формула, то строка ¬ (ϕ) – тоже пропозициональная фор-
мула;
— если ϕ и ψ – пропозициональные формулы, то строки

(ϕ) & (ψ), (ϕ) ∨ (ψ), (ϕ) ⇒ (ψ), (ϕ) ⇔ (ψ),

— тоже пропозициональные формулы.


Понятно, что пропозициональная формула – частный случай метаформулы63 , в которой отсутству-
ют переменные теории и кванторы. Число букв (метапеременных), входящих в данную пропозици-
ональную формулу, называется валентностью этой пропозициональной формулы.

⋄ 2.4.8. Следующие пропозициональные форму- (α ∨ β) ⇒ γ,


лы
α
α ⇒ (α ∨ β)
¬α
α & β, имеют валентности, соответственно, 1,1,2,3,2.

A. Исчисление высказываний LKp получается из LK.


• Аксиома исчисления LKp одна и такая же как в LK:

ϕ ⊢ ϕ. (LKp-0)

• Правила вывода в исчислении LKp получаются выбрасыванием из LK правила сечения и


правил с кванторами:
— ослабление:
Γ ⊢∆ Γ ⊢∆
(LKp-1)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
62 Напомним, что понятие метапаременной было определено на с.110.
63 См. определение на с.110.
176 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
(LKp-2)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
ϕ, χ, ψ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, χ, ψ
(LKp-3)
ϕ, ψ, χ, Γ ⊢ ∆ Γ ⊢ ∆, χ, ϕ, ψ
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
(LKp-4)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— пересечение сукцедентов:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
(LKp-5)
Γ ⊢ ∆, ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
(LKp-6)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— объединение в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
(LKp-7)
ϕ ∨ χ, Γ ⊢ ∆
— добавление в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
(LKp-8)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— объединение с импликацией:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
(LKp-9)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
(LKp-10)
Γ ⊢ ∆, ϕ ⇒ χ

B) Исчисление высказываний CQCp получается из CQC тем же приемом.


• Аксиомами исчисления CQCp называются следующие формулы:

ϕ ⇒ (χ ⇒ ϕ) (CQCp-1)
(ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (CQCp-2)
(ϕ & χ) ⇒ ϕ (CQCp-3)
(ϕ & χ) ⇒ χ (CQCp-4)
ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (CQCp-5)
ϕ ⇒ (ϕ ∨ χ) (CQCp-6)
χ ⇒ (ϕ ∨ χ) (CQCp-7)
(ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (CQCp-8)
(¬ϕ) ⇒ (ϕ ⇒ χ) (CQCp-9)
(ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (CQCp-10)
ϕ ∨ (¬ϕ) (CQCp-11)

• Правилом вывода в исчислении CQCp считается


§ 4. Другие логические системы 177

modus ponens: если выводимы формулы ϕ и ϕ ⇒ ψ, то выводима формула ψ; это изображается


дробью
ϕ, ϕ ⇒ ψ
(2.4.218)
ψ
C) Исчисление высказываний G3cp получается из G3c так же.
Напомними, что в языке этой системы добавляются два символа: символ ⊥, означающий “аб-
страктную ложь”, и символ ⊤, означающий “абстрактную истину”. Кроме того, отрицание ¬α пони-
мается как сокращение для формулы α ⇒ ⊥, а эквивалентность α ⇔ β как сокращение формулы
(α ⇒ β) & (β ⇒ α).
• Аксиомами исчисления G3cp считаются следующие три вида секвенций:

Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (2.4.219)

• Правила вывода в исчислении G3cp такие:


Γ, ϕ, χ ⊢ ∆ Γ ⊢ ϕ, ∆ Γ ⊢ χ, ∆
(2.4.220)
Γ, ϕ & χ ⊢ ∆ Γ ⊢ ϕ & χ, ∆
Γ, ϕ ⊢ ∆ Γ, χ ⊢ ∆ Γ ⊢ ϕ, χ, ∆
(2.4.221)
Γ, ϕ ∨ χ ⊢ ∆ Γ ⊢ ϕ ∨ χ, ∆
Γ ⊢ ϕ, ∆ Γ, χ ⊢ ∆ Γ, ϕ ⊢ χ, ∆
(2.4.222)
Γ, ϕ ⇒ χ ⊢ ∆ Γ ⊢ ϕ ⇒ χ, ∆

Эквивалетность исчислений высказыва- таким:


ний. Описанные выше исчисления LKp, CQCp χ⊢χ ψ⊢ψ
и G3cp эквивалентны. Мы приведем несколь- (LKp-9)
ко примеров, иллюстрирующих эту эквивалент- ϕ⊢ϕ χ ⇒ ψ, χ ⊢ ψ
ность, а полную проверку мы оставляем читате- (LKp-9)
лю. ϕ ⇒ (χ ⇒ ψ), ϕ, χ ⊢ ψ
(LKp-3)
ϕ⊢ϕ χ, ϕ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ
(LKp-9)
ϕ ⇒ χ, ϕ, ϕ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ
(LKp-2)
ϕ ⇒ χ, ϕ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ
(LKp-3)
⋄ 2.4.9. Вывод формулы (CQCp-1) в LKp будет ϕ, ϕ ⇒ χ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ
таким: (LKp-10)
ϕ ⇒ χ, ϕ ⇒ (χ ⇒ ψ) ⊢ ϕ ⇒ ψ
(LKp-10)
ϕ ⇒ (χ ⇒ ψ) ⊢ (ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)
(LKp-10)
⊢ (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ))
ϕ⊢ϕ
(LKp-1) Выводимость в логике высказываний. В
χ, ϕ ⊢ ϕ отличие от логики предикатов, в логике выска-
(LKp-10) зываний имеется (и очень простой) алгоритм,
ϕ⊢χ⇒ϕ позволяющий понять, выводима данная секвен-
(LKp-10) ция, или нет. Он состоит в том, чтобы строить
⊢ ϕ ⇒ (χ ⇒ ϕ) дерево Генцена в исчислении G3cp: как может
заметить читатель, в правилах G3cp нет таких,
которые позволяют дереву расти бесконечно вы-
соко, и поэтому на каком-то конечном шаге по-
строение должно обязательно закончиться. Если
на вершинах при этом окажутся аксиомы, то по-
лученное дерево будет выводом, а исходная се-
квенция будет выводимой. Если же на какой-то
⋄ 2.4.10. Вывод формулы (CQCp-2) в LKp будет вершине будет не аксиома, то это будет означать,
178 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

что полученное дерево – не вывод, а исходная се- ⊲⊲ 2.4.12. Проверьте выводимость следующих
квенция невыводима. Приведем пример. формул в исчислении высказываний:

⋄ 2.4.11. Рассмотрим секвенцию (α ⇒ β) & (α ⇒ ¬β)


(α ⇒ β) ∨ (α ⇒ ¬β)
⊢ (α ⇒ β) ⇒ (α ⇒ γ)
(α ⇒ β) & (¬β ⇒ ¬α)
Для нее дерево Генцена в G3cp будет таким: (α ⇒ β) ⇒ (¬β ⇒ ¬α)
 
(α ⇒ β) & ¬β ⇒ ¬α
α ⊢ α, γ β, α ⊢ γ  
(2.4.222) (2.4.222) (α ∨ β) ⇒ γ ∨ α ∨ β
⊢ α, α ⇒ γ β⊢α⇒γ
(2.4.222) (α ∨ β) & (¬α & ¬β)
 
α⇒β⊢α⇒γ α ⇒ (β ∨ γ) ∨ (γ ⇒ ¬α)
(2.4.222)    
⊢ (α ⇒ β) ⇒ (α ⇒ γ) α ⇒ (β ⇒ γ) ⇒ (α ⇒ β) ⇒ (α ⇒ γ)
   
Видно, что на вершине справа стоит не аксиома, α ⇒ (β ⇒ γ) ⇒ (α ⇒ β) ⇒ (γ ⇒ α)
поэтому такая секвенция невыводима.    
(α ∨ β) & α ⇒ (β & γ) & β ⇒ (α & ¬γ)

Теорема о семантизации для логики высказываний. Каждой пропозициональной формуле


валентности n можно поставить в соответствие некое отображение f : {0, 1}n → {0, 1}, называемое
функцией истинности по следующему алгоритму:
1) для формулы, не содержащей ни одной логической связки,

α,

соответствующая функция истинности f : {0, 1} → {0, 1} определяется равенством

f (α) = α

(на переменную α здесь нужно глядеть как на элемент множества {0, 1}),
2) для формулы
¬α
соответствующая функция истинности f : {0, 1} → {0, 1} обозначается тем же символом
¬ и определяется равенством
(
1, α = 0
f (α) = ¬α =
0, α = 1

3) для формулы
α&β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
& и определяется равенством
(
1, α = 1 и β = 1
f (α, β) = α & β =
0, иначе

4) для формулы
α∨β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
∨ и определяется равенством
(
0, α = 0 и β = 0
f (α, β) = α ∨ β =
1, иначе
§ 4. Другие логические системы 179

5) для формулы
α⇒β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇒ и определяется равенством
(
0, α = 1 и β = 0
f (α, β) = α ⇒ β =
1, иначе

6) для формулы
α⇔β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇔ и определяется равенством
(
1, (α = 1 и β = 1) или (α = 0 и β = 0)
f (α, β) = α ⇔ β = .
0, иначе

7) для остальных пропозициональных формул булевы функции строятся как композиции


уже описанных.

⋄ 2.4.13. Описанный алгоритм позволяет ко вся- соответствующая функция истинности


кой формуле в исчислении высказываний отно-
ситься как к булевой функции (то есть к функ- f (α, β, γ) = (α ∨ β) ⇒ γ,
ции, аргументы и значения которой бегают по
двухэлементному множеству {0, 1}). Например, на аргументах α = 1, β = 0, γ = 0 принимает
для формулы значение

(α ∨ β) ⇒ γ (2.4.223) f (1, 0, 0) = (1 ∨ 0) ⇒ 0 = 1 ⇒ 0 = 0.

Следующий результат считается главным в логике высказываний (и называется обычно теоре-


мой о полноте исчисления высказываний, но мы будем называть его теоремой о семантизации по
причинам, изложенным на с.168):
Теорема 2.4.14 (о семантизации исчисления высказываний). 64 Выводимость пропозициональ-
ной формулы в исчислении высказываний эквивалентна тождественному равенству единице ее
булевой функции.

⋄ 2.4.15. Например, рассмотренная выше фор- дело так:


мула (2.4.223)
α ⊢ α, γ β, α ⊢ γ
(α ∨ β) ⇒ γ (2.4.222) (2.4.222)
⊢ α, α ⇒ γ β⊢α⇒γ
– невыводима, потому что, как мы уже отмечали (2.4.222)
в примере 2.4.13, ее функция истинности α⇒β⊢α⇒γ
(2.4.222)
f (α, β, γ) = (α ∨ β) ⇒ γ, ⊢ (α ⇒ β) ⇒ (α ⇒ γ)

равну нулю на значениях α = 1, β = 0, γ = 0. По этому дереву можно сразу понять, при ка-
ких аргументах функция истинности для нашей
⋄ 2.4.16. Вспомним, что в примере 2.4.19 мы до- формулы
казали невыводимость формулы
f (α, β, γ) = (α ⇒ β) ⇒ (α ⇒ γ)
(α ⇒ β) ⇒ (α ⇒ γ)
будет обращаться в нуль: для этого надо рас-
Соответствующее дерево Генцена в G3cp выгля- смотреть вершину дерева, не являющуюся акси-
64 P.T.Johnstone, Notes on logic and set theory, 1987 (Proposition 3.7, Theorem 2.6).
180 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

омой, в данном случае, правую вершину, На этих значениях мы получим


β, α ⊢ γ
f (1, 1, 0) = (1 ⇒ 1) ⇒ (1 ⇒ 0) = 1 ⇒ 0 = 0.
и переменные, слева от символа секвенции, по-
ложить равными единице
⊲⊲ 2.4.17. Постройте функции истинности для
β = 1, α = 1, примеров из упражнений 2.4.20 и, в случае, если
а переменные справа — равными нулю: формула невыводима, подберите значения пере-
менных для ее функции истинности, на которых
γ = 0. она принимает нулевое значение.

(c) Интуиционистская логика


Довольно неожиданно, что одно небольшое изменение в правилах исчисления LK ведет к системе,
которая, как оказывается, формализует знаменитую интуиционистскую логику, пропагандировав-
шуюся математиками Яном Брауэром, Германом Вейлем и Арендом Гейтингом в первой половине
20 века в качестве альтернативы гильбертовскому формализму (и расселовскому логицизму). Свои
взгляды интуиционисты описывали довольно невнятно, до тех пор, пока в 1930-х годах Генцен не
заметил, что их философию можно естественным образом формализовать в исчислении секвенций.
Соответствующую систему он обозначил аббревиатурой LJ (в которой буква “J” означает интуици-
онизм), и от системы LK она отличается только тем, что в ее правилах сукцеденты всех секвенций
могут содержать не более одной формулы. Мы приведем правила системы LJ, а также правила
соответствующей логики высказываний LJp (которая тоже меняется в соответствии с общим прин-
ципом “не более одной формулы в сукцеденте”).

Интуиционистская логика предикатов. Вот правила интуиционистской логики предикатов


LJ (здесь ϕ, χ, ψ, ω — произвольные формулы, а Γ , Π — произвольные наборы формул)65 .
Аксиома в LJ такая же, как в LK:

ϕ ⊢ ϕ. (LJ-0*)

a. Структурные правила:
— ослабление:
Γ ⊢ω Γ ⊢
(LJ-1*)
ϕ, Γ ⊢ ω Γ ⊢ϕ
— сокращение:

ϕ, ϕ, Γ ⊢ ω
(LJ-2*)
ϕ, Γ ⊢ ω
— перестановка:

ϕ, χ, ψ, Γ ⊢ ω
(LJ-3*)
ϕ, ψ, χ, Γ ⊢ ω
— сечение:
Γ ⊢ ϕ ϕ, Π ⊢ ω
(LJ-4*)
Γ, Π ⊢ ω

b. Правила введения логических связок:


— переброс отрицания:

Γ ⊢ϕ ϕ, Γ ⊢
(LJ-5*)
¬ ϕ, Γ ⊢ Γ ⊢ ¬ϕ
65 Читатель может заметить, что среди правил LJ отсутствуют сокращение справа и перестановка справа, поскольку

требование “не более одной формулы в сукцеденте” не оставляет им места.


§ 4. Другие логические системы 181

— конъюнкция в сукцеденте:
Γ ⊢ϕ Γ ⊢χ
(LJ-6*)
Γ ⊢ ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ω ϕ, Γ ⊢ ω
(LJ-7*)
ϕ &χ, Γ ⊢ ω χ &ϕ, Γ ⊢ ω
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ω χ, Γ ⊢ ω
(LJ-8*)
ϕ ∨ χ, Γ ⊢ ω
— добавление в сукцеденте:
Γ ⊢ϕ Γ ⊢ϕ
(LJ-9*)
Γ ⊢ ϕ∨χ Γ ⊢χ∨ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ϕ χ, Π ⊢ ω
(LJ-10*)
ϕ ⇒ χ, Γ, Π ⊢ ω
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ χ
(LJ-11*)
Γ ⊢ϕ⇒χ

— добавление квантора всеобщности в антецедент: если подстановка ϕ x=τ кор-
ректна66 (здесь x — переменная, а τ – терм), то

ϕ x=τ , Γ ⊢ ω
(LJ-12*)
∀x ϕ, Γ ⊢ ω
— добавление квантора всеобщности в сукцедент: если переменная y не входит
(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул Γ ,
ω, ∀x ϕ), то

Γ ⊢ ϕ x=y
(LJ-13*)
Γ ⊢ ∀x ϕ
— добавление квантора существования в антецедент: если переменная y не входит
(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул
∃x ϕ, Γ , ω), то

ϕ x=y , Γ ⊢ ω
(LJ-14*)
∃x ϕ, Γ ⊢ ω

— добавление квантора существования в сукцедент: если подстановка ϕ x=τ кор-
ректна67 (здесь x — переменная, а τ – терм), то

Γ ⊢ ϕ x=τ
(LJ-15*)
Γ ⊢ ∃x ϕ

⋄ 2.4.18. Вспомним закон исключенного тре- утверждение о выводимости секвенции


тьего, о котором мы говорили в примере 0.2.30, ⊢ α ∨ ¬α. (2.4.224)
и который в исчислении LK представляет собой
По контрасту с LK, в исчислении LJ эта секвен-
66 Определение корректной подстановки дано на с. 9.
67 См. определение на с. 9.
182 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА

ция не выводима (и это одна из причин, почему подклеить к нему сверху вывод секвенции
считается, что исчисление LJ формализует инту-
иционистскую логику). ⊢α
Во-первых, нужно заметить, что рассужде-
ние, использовавшееся в примере 0.2.30, здесь (а для этого нужно, чтобы такой вывод суще-
не проходит, потому что там сукцедент состо- ствовал), а второе точно так же можно превра-
ял из двух формул, а в LJ такое запрещено. А, тить в вывод, если подклеить к нему сверху вы-
во-вторых, среди правил вывода LJ-1—LJ-15 есть вод секвенции
только одно, содержащее логическую связку ∨ ⊢ ¬α
в сукцеденте, а именно, LJ-968 , и если с его по-
(и для этого тоже нужно, чтобы такой вывод су-
мощью пытаться достроить дерево вверх, то мы ществовал). Но если ни одна из этих секвенций
получим либо дерево не выводима (например, если формула α атомар-
⊢α на, и ни α, ни ¬α не входят в систему аксиом), то
(LJ-9*) (2.4.225) ни (2.4.225), ни (2.4.226) в вывод не превратишь.
⊢ α ∨ ¬α Это значит, что секвенция (2.4.224) не выво-
дима в LJ (по крайней мере) для атомарных фор-
либо дерево мул α, таких, что ни α, ни ¬α не входят в акси-
омы теории. Иными словами, если в теории над
⊢ ¬α
исчислением LJ существует хотя бы одна ато-
(LJ-9*) (2.4.226)
марная формула α, такая, что ни α, ни ¬α не
⊢ α ∨ ¬α
входят в систему ее аксиом, то в этой теории
Первое из них можно превратить в вывод, если секвенция (2.4.224) не выводима.

Интуиционистская логика высказываний. Логика высказываний в интуиционистской тео-


рии также претерпевает изменения. Возникающая в результате система LJp отличается от системы
LKp (которую мы описывали на с.175) тем, что в LJp каждый сукцедент, в соответствии с общим
принципом LJ, может иметь не более одной формулы (или, эквивалентно, LJp можно получить из
LJ выбросив правило сечения и правила с кванторами). Вот правила этой системы (ϕ, χ, ψ, ω —
произвольные формулы, а Γ , Π — произвольные наборы формул):
Аксиома исчисления LJp одна и такая же как в LKp:
ϕ ⊢ ϕ. (LJp-0)
— ослабление:
Γ ⊢ω Γ ⊢
(LJp-1)
ϕ, Γ ⊢ ω Γ ⊢ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ω
(LJp-2)
ϕ, Γ ⊢ ω
— перестановка:
ϕ, χ, ψ, Γ ⊢ ω
(LJp-3)
ϕ, ψ, χ, Γ ⊢ ω
— переброс отрицания:
Γ ⊢ϕ ϕ, Γ ⊢
(LJp-4)
¬ ϕ, Γ ⊢ Γ ⊢ ¬ϕ
— пересечение сукцедентов:
Γ ⊢ϕ Γ ⊢χ
(LJp-5)
Γ ⊢ ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ω ϕ, Γ ⊢ ω
(LJp-6)
ϕ &χ, Γ ⊢ ω χ &ϕ, Γ ⊢ ω
68 В исчислении LK это рассуждение не работает, потому что там по правилу (LK-2*) можно, двигаясь вверх по

дереву, формулы в сукцеденте множить, что в LJ невозможно.


§ 4. Другие логические системы 183

— объединение в антецеденте:
ϕ, Γ ⊢ ω χ, Γ ⊢ ω
(LJp-7)
ϕ ∨ χ, Γ ⊢ ω
— добавление в сукцеденте:
Γ ⊢ϕ Γ ⊢ϕ
(LJp-8)
Γ ⊢ ϕ∨χ Γ ⊢χ∨ϕ
— объединение с импликацией:
Γ ⊢ ϕ χ, Π ⊢ ω
(LJp-9)
ϕ ⇒ χ, Γ, Π ⊢ ω
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ χ
(LJp-10)
Γ ⊢ϕ⇒χ
В интерпретации Кетонена эта система приобретает следующий вид.
Интуиционистское исчисление высказываний G3ip:
• Аксиомами исчисления G3ip считаются следующие три вида секвенций:

Γ, ⊥ ⊢ ψ Γ, ϕ ⊢ ϕ Γ ⊢ ⊤. (G3ip-0)

• Правила вывода в исчислении G3ip такие:


Γ, ϕ, χ ⊢ ψ Γ ⊢ϕ Γ ⊢χ
(G3ip-1)
Γ, ϕ & χ ⊢ ψ Γ ⊢ϕ&χ
Γ, ϕ ⊢ ψ Γ, χ ⊢ ψ
(G3ip-2)
Γ, ϕ ∨ χ ⊢ ψ
Γ ⊢ ϕ Γ, χ ⊢ Γ, ϕ ⊢ χ
(G3ip-3)
Γ, ϕ ⇒ χ ⊢ Γ ⊢ϕ⇒χ

Выводимость в интуиционистской логике Генцена в G3ip:


высказываний. Как и в обычной “классиче-
α ⇒ β, α ⊢ γ
ской” логике высказываний, в интуиционистской
(G3ip-3)
логике высказываний также имеется алгоритм,
α⇒β⊢α⇒γ
позволяющий понять, выводима данная секвен-
(G3ip-3)
ция, или нет. Он состоит в том, чтобы строить
⊢ (α ⇒ β) ⇒ (α ⇒ γ)
дерево Генцена в исчислении G3ip: как может
заметить читатель, в правилах G3ip нет таких, Здесь на вершине в антецеденте (как всегда в
которые позволяют дереву расти бесконечно вы- G3ip) стоит мультимножество, и можно перепи-
соко, и поэтому на каком-то конечном шаге по- сать это дерево так:
строение должно обязательно закончиться. Если
на вершинах при этом окажутся аксиомы, то по- α, α ⇒ β ⊢ γ
соглашение G3 о мультимножествах
лученное дерево будет выводом, а исходная се-
квенция будет выводимой. Если же на какой-то α ⇒ β, α ⊢ γ
(G3ip-3)
вершине будет не аксиома, то это будет означать,
что полученное дерево – не вывод, а исходная се- α⇒β⊢α⇒γ
(G3ip-3)
квенция невыводима. Приведем пример.
⊢ (α ⇒ β) ⇒ (α ⇒ γ)
Но независимо от того, как ты это запишешь, вы-
⋄ 2.4.19. Рассмотрим секвенцию ше подняться невозможно (в частности, левую
формулу в (G3ip-3) применить нельзя из-за ме-
⊢ (α ⇒ β) ⇒ (α ⇒ γ) таформулы γ), и на вершине не получается ак-
сиома. Поэтому такая секвенция невыводима в
G3ip (и значит, во всей интуционистской логике
Для нее можно построить только одно дерево высказываний).
184 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
 
⊲⊲ 2.4.20. Проверьте выводимость следующих (α ∨ β) ⇒ γ ∨ α ∨ β
формул в интуиционисткой логике высказыва-
ний: (α ∨ β) & (¬α & ¬β)
 
(α ⇒ β) & (α ⇒ ¬β) α ⇒ (β ∨ γ) ∨ (γ ⇒ ¬α)
   
(α ⇒ β) ∨ (α ⇒ ¬β) α ⇒ (β ⇒ γ) ⇒ (α ⇒ β) ⇒ (α ⇒ γ)
(α ⇒ β) & (¬β ⇒ ¬α)    
(α ⇒ β) ⇒ (¬β ⇒ ¬α) α ⇒ (β ⇒ γ) ⇒ (α ⇒ β) ⇒ (γ ⇒ α)
     
(α ⇒ β) & ¬β ⇒ ¬α (α ∨ β) & α ⇒ (β & γ) & β ⇒ (α & ¬γ)
Часть II

ФУНКЦИИ ОДНОЙ
ВЕЩЕСТВЕННОЙ ПЕРЕМЕННОЙ

185
Глава 3

ЧИСЛА, КАК НЕЯВНАЯ


КОНСТРУКЦИЯ

Понятие вещественного числа является естественным развитием идеи измерения по эталону, ухо-
дящей корнями в глубокую древность и опирающейся на следующие два фундаментальных допу-
щения.
1. Первое из них — возможность сравнивать с эталоном — заключается в том, что среди значений
физической величины можно выбирать эталонные, то есть такие, которыми можно (в целых
числах) оценивать все остальные значения этой величины. Например, имея эталон длины – метр
– можно длину x любого физического тела оценивать в метрах (то есть найти, сколько метров
в этой длине укладывается, а сколько – нет):

k 6 x < k + 1.

При этом важно, что организовать методы измерения можно так, чтобы результаты не зависели
от попыток.
2. Второе же — возможность измельчения эталона — предполагает, что любой эталон можно де-
лить на равные части (точнее, на произвольное фиксированное число равных частей), которые
также можно принимать за эталоны. Из этого принципа следует, что мы можем поделить наш
исходный эталон длины, скажем, на 10 равных частей, принять их длины за новые эталоны, и
после этого поглядеть, не войдут ли в оставшуюся часть длины x − k (куда уже не входит наш
исходный эталон) новые, меньшие эталоны:

l l+1
6x−k < .
10 10
Так мы получим уже оценку в десятых долях эталона (то есть можно будет сказать, сколько
десятых долей эталона укладывается в величине, которую мы измеряем):

l l+1
k+ 6x<k+
10 10
Поскольку (согласно второму допущению) измельчать эталон можно сколь угодно долго, мы
получаем, что физическую величину x можно оценивать сверху и снизу рациональными числами
(количеством долей эталона)
m m+1
6x< ,
n n
причем с любой точностью (то есть так, чтобы числа m m+1
n и n отличались друг от друга как угодно
мало). В этом состоит применяемый в естествознании алгоритм измерения физической величины по
эталону, и интерпретировать его удобнее всего, как приближение к некоему идеальному значению,
изначально имеющемуся у данной измеряемой величины x.
Разумеется, не всякая физическая величина допускает измерение по эталону так, как мы это
описали. Например, у векторных величин (таких, как скорость или сила) оценивать при измерении
необходимо не одну, а сразу несколько числовых характеристик (скажем, проекции данной величи-
ны на заранее выбранные координатные оси), а у целочисленных величин (таких, как количество
однотипных предметов в данном объеме пространства) допущение о делимости эталонов не будет

186
§ 1. Вещественные числа и числовые множества 187

справедливым. Более того, развитие физики показало, что даже для величин, измерение которых
традиционно организуется именно сравнением с эталоном (таких как длина, масса или объем), де-
ление эталона тоже не может быть бесконечным, потому что, когда Вы доходите до планковских
размеров, дальнейшее деление утрачивает смысл (то есть попросту становится непонятно, что зна-
чит делить дальше).
Тем не менее, вера в эти принципы (или, точнее сказать, невозможность на данном этапе разви-
тия науки заменить их чем-то более эффективным) приводит к тому, что физическая величина пред-
ставляется такой, что ее можно с любой точностью оценивать рациональными числами в эталонных
единицах измерения. Само по себе это еще не означает, что значения физической величины долж-
ны непременно описываться вещественными числами, какими их изображают в математическом
анализе (дело в том, что в математике имеются альтернативные теории, например, «нестандарт-
ный анализ», где числа описываются иначе). Но при некоторых дополнительных предположениях,
в частности, что величины могут быть отрицательными, и что в качестве эталона можно выбирать
любое ненулевое значение физической величины, математическая теория, формализующая идею
измерения по эталону, оказывается единственной, и ее аксиоматика выглядит следующим образом.

§1 Вещественные числа и числовые множества


В математике имеется три главных способа объяснить, что такое число:
1) построить явную конструкцию числа в рабочей теории множеств,
2) построить формальную теорию1 чисел (наподобие теории множеств, но не связанную с
ней),
3) описать теорию чисел абстрактно, как дефинициальное расширение2 рабочей теории мно-
жеств.
Первый способ уже использовался нами в главе 1, и состоит он в том, чтобы строить числа пря-
миком из аксиом рабочей теории множеств, так, чтобы их существование (внутри теории множеств)
не вызывало сомнений.
Смысл того, что представляет из себя второй способ, можно понять по примеру 2.1.18 на стра-
нице 114, в котором описывалась формальная теория Пеано натуральных чисел. Мы не будем
обсуждать это подробно, но по аналогии с теорией Пеано можно построить формальную теорию
вещественных чисел (с другими аксиомами). Недостаток такого подхода, однако, в том, что для
привязки к остальной математике получаемую теорию все равно приходится интерпретировать в
теории множеств, а это делает вообще излишним построение теории чисел как формальной теории.
Третий способ можно считать самым удобным, потому что он избавляет зрителя от необходимо-
сти следить за громоздкими деталями (построениями главы 1), которые нигде, кроме самых первых
утверждений этой теории, не используются. Формально его недостаток в том, что доказательство
существования описываемой конструкции числа (в нашем случае существование множества веще-
ственных чисел R, описываемого свойствами на с.187) нужно проводить отдельно, и это возвращает
нас к первому способу. Однако, поскольку необходимые построения уже были нами проделаны в
главе 1, мы можем считать сейчас эту проблему решенной.
В этой главе мы опишем этот последний способ.

(a) Вещественные числа R как семантическая теория


Вот как выглядит описание теории вещественных чисел как семантической теории (точнее, как
дефинициального расширение теории множеств MK).

Аксиомы теории вещественных чисел. Под моделью вещественных чисел, понимается произ-
вольная шестерка3 (R, 0, 1, +, ·, 6), в которой R — некое множество, элементы которого называются
вещественными числами, 0 и 1 — его элементы, + и · — отображения R × R → R, называемые со-
ответственно сложением и умножением, а 6 — бинарное отношение, называемое порядком, такие
что выполняются следующие две группы требований I и II.

I. Арифметические операции над вещественными числами


1 Что такое формальная теория мы объясним на с.105.
2 Понятие дефинициального расширения было введено на с.121.
3 Понятие шестерки (строки длины 6) было введено на с.73.
188 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

A1. Коммутативность сложения: для любых чисел a и b выполняется равенство

a+b=b+a (3.1.1)

A2. Ассоциативность сложения: для любых чисел a, b, c выполняется равенство

(a + b) + c = a + (b + c) (3.1.2)

A3. Коммутативность умножения: для любых чисел a и b выполняется равенство

a·b=b·a (3.1.3)

A4. Ассоциативность умножения: для любых чисел a, b, c выполняется равенство

(a · b) · c = a · (b · c) (3.1.4)

A5. Дистрибутивность: для любых чисел a, b, c выполняется равенство

(a + b) · c = a · c + b · c (3.1.5)

A6. Свойство нуля: для любого числа a

a+0=a (3.1.6)

A7. Существование противоположного числа: для любого числа a существует такое чис-
ло −a (называемое противоположным числом к числу a) что

a + (−a) = 0 (3.1.7)

A8. Свойство единицы: для любого числа a 6= 0

a·1=a (3.1.8)

A9. Существование обратного числа: для любого числа a 6= 0 существует такое число a−1
(называемое обратным числом к числу a), что

a · a−1 = 1 (3.1.9)

II. Сравнение вещественных чисел


Для любых вещественных чисел a и b имеет смысл высказывание «a меньше, либо равно b»,
записываемое a 6 b. Оно может быть верно или неверно, но при этом выполняются следующие
правила.
A10. Рефлексивность: для любого числа a справедливо a 6 a.
A11. Транзитивность: если a 6 b и b 6 c, то a 6 c.
A12. Антисимметричность: если a 6 b и b 6 a, то a = b.
A13. Линейность: для любых чисел a и b
– либо a 6 b;
– либо b 6 a.
A14. Монотонность сложения: если a 6 b, то для любого c справедливо a + c 6 b + c.
A15. Сохранение знака + при умножении: если 0 6 a и 0 6 b, то 0 6 a · b.
A16. Непрерывность вещественной прямой: пусть X и Y – два непустых множества веще-
ственных чисел, причем для любых чисел x ∈ X и y ∈ Y выполняется неравенство x 6 y;
тогда существует хотя бы одно число c такое, что для любых x ∈ X и y ∈ Y выполняются
неравенства x 6 c и c 6 y.
• Класс всех моделей вещественных чисел естественно назвать теорией вещественных чи-
сел.
§ 1. Вещественные числа и числовые множества 189

⋄ 3.1.1. Дедекиндовы сечения. Из теорем 1.1.24 построенного в главе 1, является моделью веще-
и 1.1.25 следует, что множество всех дедекиндо- ственных чисел. Из этого примера видно, что
вых сечений множества Q рациональных чисел, класс всех моделей вещественных чисел непуст.

Из аксиом A1 - A16 следуют все остальные свойства вещественных чисел (и, в частности, все
теоремы математического анализа).
Помимо отношения «меньше, либо равно» a 6 b на множестве вещественных чисел R вводятся
еще три отношения, а именно,
– «меньше» a < b, означающее, что a 6 b и одновременно a 6= b;
– «больше, либо равно» a > b означающее, что b 6 a;
– «больше» a > b, означающее, что b 6 a и одновременно b 6= a.
Из аксиомы линейности A13 следует, что множество вещественных чисел R удобно изображать
в виде прямой, а сами вещественные числа – в виде точек на ней. Именно так и делают математики:

−1 0 1

⋄ 3.1.2. Покажем, что из аксиом A6 (о суще- Доказательство.


ствовании нуля) и A1 (коммутативности) следу-
ет, что нуль единственен. Действительно, если 0 a+x=b
и 0̃ – два разных объекта со свойствами нуля
m
∀a a + 0 = a, (3.1.10) (a + x) + (−a) = b + (−a)
m
∀a a + 0̃ = a (3.1.11) (x + a) + (−a) = b + (−a)
то мы получаем m
0̃ = (3.1.10) = 0̃ + 0 = (A1) = 0 + 0̃ = (3.1.11) = 0 x + (a + (−a)) = b + (−a)

(в скобках мы указываем формулы или аксио- m


мы, которые в данный момент используем в сво- x + 0 = b + (−a)
их рассуждениях).
m
⋄ 3.1.3. Покажем, что для данного числа a про-
x = b + (−a)
тивоположное число −a, существование которо-
го постулируется в аксиоме A7, тоже должно
быть единственно. Действительно, если бы суще-
ствовали два числа x и y со свойствами a + x = 0 ⋄ 3.1.6. Справедливы следующие тождества:
и a + y = 0, то мы получили бы 0·a= 0 (3.1.14)
x = (A6) = x + 0 = x + (a + y) = (A2) = − (−a) = a (3.1.15)
= (x + a) + y = (A1) = (a + x) + y = 0 + y = (−1) · a = −a (3.1.16)
= (A1) = y + 0 = (A6) = y (−a) · (−b) = a · b (3.1.17)

⊲ 3.1.4. Докажите равенство: Доказательство. 1. Докажем (3.1.14):

−0 = 0 (3.1.12) 0 · a = (0 + 0) · a = 0 · a + 0 · a

⋄ 3.1.5. Покажем, что справедлива следую- ⇓ (3.1.13)

щая эквивалентность, означающая, что уравне- 0 · a + (−0 · a) = 0 · a


ния вида a + x = b однозначно разрешимы в R:
⇓ (A7)

a+x=b ⇐⇒ x = b + (−a) (3.1.13) 0=0·a


190 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

2. Для (3.1.15) доказательство выглядит так: ⊲ 3.1.10. Докажите тождество:

a + (−a) = 0 −1
a−1 =a (3.1.19)

(−a) + a = 0
⋄ 3.1.11. Справедливо тождество

a – противоположное число для −a
! (−a)−1 = −a−1 (3.1.20)
у −a не может
быть двух
⇓ противоположных
чисел
Доказательство.
a = −(−a)
3. Для (3.1.16) доказательство такое:
(−a−1 ) · (−a) = (3.1.17) = a−1 · a = 1
(A7)

⇓  
в силу
1 + (−1) = 0 упражнения 3.1.9,

⇓  у −a не может 
⇓  быть двух 
обратных
чисел
(1 + (−1)) · a = 0 · a
⇓ (A5),(3.1.14)

1 · a + (−1) · a = 0
(−a)−1 = −a−1

a + (−1) · a = 0

(−1) · a – противоположное число для a

(−1) · a = −a ⊲ 3.1.12. Докажите следующие утверждения:
4. Докажем (3.1.17):
x<y =⇒ ∀a x+a<y+a (3.1.21)
(−a) · (−b) = (3.1.16) = ((−1) · a) · (−b) =
x · y = 0 =⇒ x = 0 ∨ y=0 (3.1.22)
= (A3) = (a · (−1)) · (−b) = (A4) =
x > 0 & y > 0 =⇒ x·y >0 (3.1.23)
= a · ((−1) · (−b)) = (3.1.16) =
x<0 & y<0 =⇒ x·y >0 (3.1.24)
= a · (−(−b)) = (3.1.15) = a · b
x<0 & y>0 =⇒ x·y <0 (3.1.25)
1>0 (3.1.26)
−1<0 (3.1.27)
⊲ 3.1.7. Докажите, по аналогии с примером
3.1.2, что единица 1, существование которой по- x<y =⇒ −x > −y (3.1.28)
стулируется в аксиоме A8, тоже единственна. −1
x>0 =⇒ x >0 (3.1.29)
−1
⊲ 3.1.8. Докажите равенство: x<0 =⇒ x <0 (3.1.30)
−1 −1
0<x<y =⇒ x >y (3.1.31)
1−1 = 1 (3.1.18) −1 −1
x<y<0 =⇒ x >y (3.1.32)
⊲ 3.1.9. По аналогии с примером 3.1.3 докажи- x<y & a>0 =⇒ a·x<a·y (3.1.33)
те, что для данного числа a 6= 0 обратное число x<y & a<0 =⇒ a·x>a·y (3.1.34)
a−1 (о котором идет речь в аксиоме A9), должно
a > 1 ⇐⇒ 0 < a < 1 (3.1.35)
быть единственно (то есть, не может существо-
вать двух чисел x и y со свойствами a · x = 1 и x > 0 & a > 1 =⇒ a · x > x (3.1.36)
a · y = 1). x>0 & 0<a<1 =⇒ a · x < x (3.1.37)
§ 1. Вещественные числа и числовые множества 191

Числа 2, ..., 10. Напомним, что обозначения 0, — здесь читателю предлагается самому дога-
1, 2, 3, 4, 5, 6, 7, 8, 9 были введены нами в тео- даться, какой должна быть подстановка, чтобы
рии MK в формулах (0.3.260)—(0.3.269). Сейчас можно было применить аксиому A2. Читатель
мы описываем теорию вещественных чисел, как теперь может самостоятельно расшифровать со-
дефинициальное расширение теории множеств, кращенную запись доказательства эквивалент-
для понимания которого такие детали как опре- ности определений числа 4:
деления (0.3.260)—(0.3.269) не нужны, и более то-
го, при желании читатель может вообще обхо- ((1 + 1) + 1) + 1 = (A2) = (1 + 1) + (1 + 1) =
диться наивным пониманием теории множеств. = (A2) = 1 + (1 + (1 + 1))
Поэтому помнить об определениях на с.49 не обя-
зательно, а если помнить, то то надо понимать, Что же касается числа 5, то нам теперь доста-
что определения тех же чисел от 0 до 9 в описы- точно сказать, что эквивалентность определений
ваемой теперь теории будет другим (и формаль- для него доказывается по аналогии.
но это будут другие объекты). Итак, одни и те же собственные обозначения
В частности, число 2 определяется равен- можно задавать формально по-разному, нуж-
ством но только следить, чтобы выписываемые тобой
2 := 1 + 1 (3.1.38) определения для одного и того же символа были
эквивалентны. Естественный (и самый распро-
Точно также, числа 3, 4, 5 можно определить ра-
страненный) способ вводить новые обозначения
венствами
– так называемый последовательный, в котором
3 := 1 + (1 + 1), при определении нового обозначения использу-
4 := 1 + (1 + (1 + 1)), (3.1.39) ются обозначения, введенные ранее. Например,
числа 3, 4, 5, 6, 7, 8, 9, 10 можно последователь-
5 := 1 + (1 + (1 + (1 + 1)))
но определить так:
Полезно заметить, что одно и то же число можно
3 := 2 + 1, 4 := 3 + 1,
определять по-разному. Например, 3, 4, 5 можно
иначе определить так: 5 := 4 + 1, 6 := 5 + 1,
7 := 6 + 1, 8 := 7 + 1,
3 := (1 + 1) + 1,
9 := 8 + 1, 10 := 9 + 1
4 := ((1 + 1) + 1) + 1, (3.1.40)
5 := (((1 + 1) + 1) + 1) + 1 Числа вида −a. Когда определены числа
1,...,10, их противоположные числа −1,...,−10
Строго говоря, это будут другие определения,
определять уже не нужно, поскольку они авто-
потому что записи в (3.1.39) и (3.1.40) не одина-
матически определяются аксиомой A7 о суще-
ковы (с точки зрения языка, последовательность
ствовании противоположного числа (дело в том,
символов 1 + (1 + 1) — совсем не то же самое, что
что, как мы отмечали в упражнении 3.1.3, из ак-
последовательность символов (1 + 1) + 1).
сиомы A7 и других аксиом следует, что противо-
Тем не менее, определения (3.1.39) и (3.1.40)
положное число определяется единственным об-
эквивалентны, потому что из аксиом A1 – A16
разом).
можно логическими средствами вывести, что
Вообще, всякий раз, когда мы дали собствен-
числа, определяемые формулами (3.1.39) — те
ное обозначение a какому-нибудь числу, аксиома
же самые, что числа, определяемые формулами
A7 определяет его противоположное число и да-
(3.1.40). Действительно, эквивалентность опре-
ет ему собственное обозначение −a.
делений для числа 3 получается подстановкой в
тождество из аксиомы A2 вместо a, b, c, символа
1: Числа вида a−1 . Точно также, всякий раз, ко-
гда мы даем собственное обозначение a какому-

нибудь числу (a 6= 0), аксиома A9 дает собствен-

(1 + 1) + 1 = (a + b) + c a = 1 = (A2) = ное обозначение обратному числу a−1 . В частно-

b=1 сти, обратные числа к 2, ..., 10 имеют собствен-
c=1
ные обозначения 2−1 ,...,10−1 .


= a + (b + c) a = 1 = 1 + (1 + 1)
Разность чисел определяется равенством
b=1
c=1
a − b := a + (−b) = (−b) + a.
(символ | означает подстановку, а фрагмент =
Можно заметить, например, что
(A2) = есть ссылка на аксиому A2, применяемую
в этот момент). Эту запись можно сократить так:
1 − 2 := 1 + (−2) = (3.1.16) = 1 + (−1) · 2 =
(1 + 1) + 1 = (A2) = 1 + (1 + 1) = (3.1.38) = 1 + (−1) · (1 + 1) = (A5) =
192 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

= 1 + ((−1) · 1 + (−1) · 1) = (A8) = Дроби определяются равенством


= 1 + ((−1) + (−1)) = (A2) =
a
= (1 + (−1)) + (−1) = (A7) = 0 + (−1) = = a · b−1 = b−1 · a, (b 6= 0)
b
= (A1) = (−1) + 0 = (A6) = −1.
Например,
Аналогично,
1 2 5
2 − 4 := 2 + (−4) = −2, := 2−1 , := 2 · 3−1 , := 5 · 4−1
2 3 4
5 − 2 := 5 + (−2) = 3. ⊲ 3.1.14. Докажите тождества:
⊲ 3.1.13. Докажите тождества:
a c a·d+b·c
+ = (3.1.44)
(a − b) + (c − d) = (a + c) − (b + d) (3.1.41) b d b·d
a c a·d−b·c
(a − b) − (c − d) = (a + d) − (b + c) (3.1.42) − = (3.1.45)
b d b·d
(a − b) · (c − d) = (a · c + c · d) − (b · c + a · d) a c a·c
(3.1.43) · = (3.1.46)
b d b·d

(b) Числовые множества


Как мы уже говорили, числа также образуют множества. При этом, поскольку мы строим теорию
вещественных чисел, опираясь на теорию множеств, нам не нужно давать строгое определение
этому понятию. Здесь мы приведем простейшие примеры числовых множеств и обсудим некоторые
их свойства, которые понадобятся в дальнейшем.


⋄ 3.1.15. Множества, определяемые явным (a, b] = x ∈ R : a<x6b
перечислением своих элементов. Это самый 
[a, b) = x ∈ R : a6x<b
простой пример числовых множеств. Например, 
запись (a, +∞) = x ∈ R : a<x
  
1 [a, +∞) = x ∈ R : a6x
−1; ; 3 
2 (−∞, b) = x ∈ R : x<b

обозначает множество, состоящее из трех эле- (−∞, b] = x ∈ R : x6b
ментов: −1, 21 и 3.
Точнее, в этом списке множество (a, b) называ-
⋄ 3.1.16. Числовые множества, определяе- ется интервалом, [a, b] – отрезком, (a, b] – полу-
мые отношениями порядка. Отношения 6, < интервалом с замкнутым правым концом, [a, b)
, >, > определяют на прямой R множества, из- – полуинтервалом с замкнутым левым концом,
вестные как интервал, отрезок и полуинтервалы: (a, +∞) – открытым полуинтервалом с бесконеч-
 ным правым концом, [a, +∞) – замкнутым полу-
(a, b) = x ∈ R : a < x < b интервалом с бесконечным правым концом, и так

[a, b] = x ∈ R : a 6 x 6 b далее.

Алгебраические операции над числовыми множествами и неравенства между ними.


• Если X ⊆ R — числовое множество и a ∈ R – число, то
— символом −X обозначается множество, состоящее из чисел, противоположных
числам из X:
−X := {y ∈ R : ∃x ∈ X − x = y} (3.1.47)
— символами X+a и X−a обозначаются числовые множества, получаемые сдвигом
X на a вправо и влево:

X + a = {y ∈ R : ∃x ∈ X x + a = y}, (3.1.48)
X − a = {y ∈ R : ∃x ∈ X x − a = y} (3.1.49)
§ 1. Вещественные числа и числовые множества 193

— символами a · X и X · a обозначается числовое множество, получаемое умноже-


нием X на a:

a · X = X · a = {y ∈ R : ∃x ∈ X a · x = y}, (3.1.50)

— неравенство
a 6 X, (3.1.51)
означает, что любой элемент множества X не меньше числа a

∀x ∈ X a 6 x;

точно так же формулы


a < X, X 6 a, X <a
являются сокращенными записями следующих утверждений соответственно:

∀x ∈ X a < x, ∀x ∈ X x 6 a, ∀x ∈ X x<a

• Если X и Y — два числовых множества, то


X
— символами X + Y , X − Y , X · Y , Y обозначаются множества, определяемые
формулами

X + Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x + y = z} (3.1.52)
X − Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x − y = z} (3.1.53)
X · Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x · y = z} (3.1.54)
 
X x
= z ∈ R : ∃x ∈ X ∃y ∈ Y =z (3.1.55)
Y y
— неравенство
X 6Y
по определению означает, что любой элемент множества X не превосходит лю-
бого элемента множества Y :

∀x ∈ X ∀y ∈ Y x6y

а неравенство
X <Y
– что любой элемент множества X меньше любого элемента множества Y :

∀x ∈ X ∀y ∈ Y x<y

⊲ 3.1.17. Проверьте справедливость равенств: (a; b) + c = (a + c; b + c)


   
1 9 [a; b] + c = [a + c; b + c]
−1; ; 3 + 4 = 3; ; 7
2 2 (a; +∞) + c = (a + c; +∞)
   
1 7 (−∞; a) + c = (−∞; a + c)
−1; ; 3 − 4 = −5; − ; −1
2 2

Минимум и максимум числового множества.


• Пусть X — числовое множество. Число a называется минимумом множества X, если a
принадлежит X, и все остальные элементы X не меньше a:

a∈X & a6X (то есть a ∈ X и ∀x ∈ X a 6 x)

В таких случаях пишут


a = min X
194 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

• Аналогично, число b называется максимумом множества X, если b принадлежит X, и все


остальные элементы X не больше b:

b∈X & X6b (то есть b ∈ X и ∀x ∈ X x 6 b)

и в таких случаях пишут


b = max X

⋄⋄ 3.1.18. Нетрудно сообразить, что минимум и вместе это дает (3.1.58).


и максимум отрезка X = [a; b] совпадают с его Теперь из (3.1.58) следует (3.1.57):
концами:
a = min[a; b], b = max[a; b] x<y
Но при этом у интервала X = (a; b) нет ни мини- ⇓
мума, ни максимума: 0<y−x
∄ min(a; b), ∄ max(a; b) (3.1.56) ⇓ (3.1.58)
y−x
«Наглядное» объяснение этому выглядит так: 0< <y−x
2
минимумом множества (a; b) может быть толь-
ко число a, но оно не принадлежит (a; b); и то же
самое с максимумом. Наконец, доказываем (3.1.56):
Разумеется, такие рассуждения нельзя счи-
тать строгим доказательством. Чтобы провести c = min(a; b)
аккуратные выкладки нам понадобится следую-

щее утверждение:
c ∈ (a; b)
x+y
x<y =⇒ x< < y. (3.1.57) ⇓
2
Для его доказательства в свою очередь понадо- a <c < b
бится вот что: ⇓ (3.1.57)
a a+c
0 < a =⇒ 0 < < a. (3.1.58) a< <c
2 2

Это доказывается так: с одной стороны, из
a+c
(3.1.23) получаем ∃z = ∈ (a; b) z < c
2
a ⇓
0 < a =⇒ 0 <
2
c 6= min(a; b)
отсюда, в силу (3.1.21) следует
a a a a
=0+ < + =a И то же самое с максимумом.
2 2 2 2

Свойства min и max:


1◦ Монотонность: если множества X и Y имеют минимум (максимум), то
 
X⊆Y =⇒ min X > min Y max X 6 max Y (3.1.59)

2◦ Инвариантность относительно сдвига: если множество X имеет минимум (макси-


мум), то любой его сдвиг X + a тоже имеет минимум (максимум), причем
 
min(X + a) = (min X) + a max(X + a) = (max X) + a (3.1.60)

3◦ Двойственность: если множество X имеет минимум (максимум), то противополож-


ное множество −X имеет максимум (минимум), и
 
max(−X) = − min X min(−X) = − max X (3.1.61)
§ 1. Вещественные числа и числовые множества 195

Доказательство. Мы докажем первую половину каждого утверждения (вторая доказывается по


аналогии).
1. Пусть X ⊆ Y . Тогда

a = min X =⇒ a∈X⊆Y =⇒ a > min Y

2.

p = min X =⇒ p∈X & p 6 X =⇒


=⇒ p + a ∈ X + a & p+a6X +a =⇒ p + a = min(X + a)

3.

p = min X =⇒ p∈X & p6X =⇒ −p ∈ −X & − p > −X =⇒ −p = max(−X)

Минимум и максимум двух чисел. ⋄ 3.1.20. Очевидно,


• Из аксиомы линейности A13 следует, что 0 ∧ 1 = 0, 0∨1=1
формулы
0 ∧ (−1) = −1, 0 ∨ (−1) = 0.
(
a, a 6 b
a ∧ b := (3.1.62) ⊲ 3.1.21. Докажите, что выполняются следую-
b, a > b щие тождества:
(
b, a 6 b a∧b = b∧a
a ∨ b := (3.1.63)
a, a > b a∨b = b∨a
корректно определяют две операции над ве- (a ∧ b) ∧ c = a ∧ (b ∧ c)
щественными числами. (a ∨ b) ∨ c = a ∨ (b ∨ c)
Теорема 3.1.19. Для любых двух чисел a, b ∈ R (a ∧ b) ∨ c = (a ∨ c) ∧ (b ∨ c)
множество {a, b} обладает минимумом и мак- (a ∨ b) ∧ c = (a ∧ c) ∨ (b ∧ c)
симумом, и справедливы формулы:
a ∧ b = min{a, b} (3.1.64) ⊲ 3.1.22. Докажите, что не существует числа
a ∨ b = max{a, b} (3.1.65) b ∈ R такого, что равенство
Доказательство. По аксиоме A13, выполняется a∧b=a
одно из двух: либо a 6 b, либо a > b.
В первом случае (когда a 6 b) мы получим: выполнялось бы для всех a ∈ R.
⊲ 3.1.23. Докажите, что не существует числа
a ∧ b = a = min{a, b}.
b ∈ R такого, что равенство
Здесь первое равенство выполняется по опреде-
a∨b=a
лению a ∧ b, а второе – потому что a ∈ {a, b} и
a 6 {a, b}. И точно так же выполнялось бы для всех a ∈ R.
a ∨ b = b = max{a, b}, ⊲ 3.1.24. Докажите неравенства:

и первое равенство выполняется по определению a 6 a ∨ b, a, b ∈ R (3.1.66)


a ∨ b, а второе – потому что b ∈ {a, b} и {a, b} 6 b. a ∨ b 6 a + b 6 2 · a ∨ b, a, b > 0 (3.1.67)
А во втором случае (когда a > b) мы получа- 2 2 2
2
ем a ∨ b 6 a + b 6 2 a ∨ b , a, b > 0 (3.1.68)
a ∧ b = b = min{a, b}, ⊲ 3.1.25. Проверьте, какие из следующих тож-
где второе равенство выполняется потому что деств верны:
b ∈ {a, b} и {a, b} > b. И, с другой стороны,
(a ∧ b) + c = (a + c) ∧ (b + c)
a ∨ b = a = max{a, b}, (a + b) ∧ c = (a ∧ c) + (b ∧ c)
где второе равенство верно потому что a ∈ {a, b} (a ∨ b) + c = (a + c) ∨ (b + c)
и a > {a, b}. (a + b) ∨ c = (a ∨ c) + (b ∨ c)
196 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Предложение 3.1.26. Если числовые множе- няется равенство:


ства A и B оба обладают минимумом (макси-
мумом), то их объединение A ∪ B тоже облада- min(A ∪ B) = (min A) ∧ (min B) (3.1.69)
 
ет минимумом (максимумом), причем выпол-
max(A ∪ B) = (max A) ∨ (max B) (3.1.70)

Нижняя и верхняя грани числового множества.


• Говорят, что числовое множество X ограничено снизу, если существует число s такое, что
для всякого x ∈ X выполняется неравенство s 6 x. Коротко это условие можно записать с
помощью неравенств, в которых сравниваются числа и множества (мы определяли такие
неравенства на с.193):
∃s ∈ R s 6 X.
В таких случаях принято говорить также, что число s ограничивает множество X снизу.
• Аналогично, говорят, что числовое множество X ограничено сверху, если существует чис-
ло t такое, что для всякого x ∈ X выполняется неравенство x 6 t. Это можно записать
так:
∃t ∈ R X 6 t.
В таких случаях принято говорить также, что число t ограничивает множество X свер-
ху.
• Если множество X ограничено и снизу, и сверху, то говорят, что множество X ограничено.
• Точной нижней гранью (или точной нижней границей) inf X числового множества X
называется
— символ −∞, если X не ограничено снизу; в этом случае точная нижняя грань
не является числом: запись
inf X = −∞
просто означает, что множество X не ограничено снизу;
— наибольшее из чисел s, ограничивающих X снизу, если X ограничено снизу:

inf X = max{s ∈ R : s 6 X} (3.1.71)

запись
inf X > −∞
принято использовать в случаях, когда нужно коротко дать понять, что множе-
ство X ограничено снизу.
• Точной верхней гранью (или точной верхней границей) sup X числового множества X
называется
— символ +∞, если X не ограничено сверху; опять же в этом случае точная ниж-
няя грань не является числом: запись

sup X = +∞

просто означает, что множество X не ограничено сверху;


— наименьшее из чисел t, ограничивающих X сверху, если X ограничено сверху:

sup X = min{t ∈ R : X 6 t} (3.1.72)

запись
sup X < +∞
принято использовать в случаях, когда множество X ограничено сверху.
§ 1. Вещественные числа и числовые множества 197

⋄ 3.1.27. Пусть X = (a, b) — интервал на веще- наибольшее из всех таких чисел, то есть число
ственной прямой R. A = a будет точной нижней гранью множества
X. Таким образом,

inf(a, b) = a sup(a, b) = b
a b
Точно так же для отрезка и полуинтервалов
Легко видеть, что любое число t > b ограничи-
вает множество X сверху. А наименьшее из всех inf[a, b] = inf(a, b] = inf[a, b) = a
таких чисел, то есть число B = b будет точной
верхней гранью множества X. С другой сторо-
ны, любое число s 6 a ограничивает X снизу. А sup[a, b] = sup(a, b] = sup[a, b) = b

Теорема 3.1.28. Если множество X обладает минимумом (максимумом), то он совпадает с


точной нижней (верхней) гранью этого множества:
 
∃ min X =⇒ min X = inf X ∃ max X =⇒ max X = sup X

Теорема 3.1.29 (о точной границе). Если X – непустое ограниченное снизу множество, то оно
имеет точную нижнюю грань. Аналогично, если X – непустое ограниченное сверху множество,
то оно имеет точную верхнюю грань.
Доказательство. Рассмотрим случай, когда X – непустое ограниченное сверху множество (слу-
чай, когда X ограничено снизу рассматривается аналогично). Обозначим буквой Y множество всех
чисел, ограничивающих X сверху:

Y = {y ∈ R : X 6 y} = {y ∈ R : ∀x ∈ X x 6 y}

(поскольку X ограничено сверху, хотя бы одно такое число y существует, и значит, Y – непустое
множество). Тогда
∀x ∈ X ∀y ∈ Y x 6 y
и по аксиоме непрерывности вещественной прямой A16, найдется такое число c, что

∀x ∈ X ∀y ∈ Y x6c6y

Первое неравенство здесь означает, что c ограничивает X сверху, то есть, что c ∈ Y . А второе – что
c есть наименьшее число, лежащее в Y . То есть c = min Y = min{y ∈ R : X 6 y} = sup X.

Свойства inf и sup:


1 ◦
Монотонность: если X и Y ограничены снизу (сверху), то
 
X⊆Y =⇒ inf X > inf Y sup X 6 sup Y .

2◦ Инвариантность относительно сдвига: если множество X ограничено снизу (свер-


ху), то любой его сдвиг X + a тоже ограничен снизу (сверху), причем
 
inf(X + a) = (inf X) + a sup(X + a) = (sup X) + a

3◦ Двойственность: если множество X ограничено снизу (сверху), то противоположное


множество −X ограничено сверху (снизу), и
 
sup(−X) = − inf X sup(−X) = − inf X

Доказательство. Здесь мы также докажем только первую половину каждого утверждения (пред-
ложив читателю самостоятельно по аналогии доказать вторую).
1. В первом случае получаем цепочку:

X⊆Y
198 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ


∀c ∈ R c6Y =⇒ c 6 X

{c ∈ R : c 6 Y } ⊆ {c ∈ R : c 6 X}
⇓ (свойство 1◦ на с. 194 )
inf Y = max{c ∈ R : c 6 Y } 6 max{c ∈ R : c 6 X} = inf X

2. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : c 6 X + a}
Тогда получаем цепочку

b∈B ⇐⇒ b6X ⇐⇒ b+a6X +a ⇐⇒ b+a∈C



B+a=C

   
inf X + a = max B + a =(свойство 2◦ на с. 194) = max(B + a) = max C = inf(X + a)

3. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : −X 6 c}
Тогда получаем цепочку

c∈C ⇐⇒ −X 6 c ⇐⇒ −c 6 X ⇐⇒ −c ∈ B ⇐⇒ c ∈ −B

−B = C

 
− inf X = − max B =(свойство 3◦ на с. 194) = min − B = min C = sup(−X)

§2 Натуральные, целые и рациональные числа


Вспомним, что в главах 0 и 1 мы строили множество N натуральных чисел, множество Z целых
чисел, множество Q рациональных чисел и само множество R вещественных чисел, как явные кон-
струкции. В ситуации, когда, как сейчас, нам задана “абстрактная” модель вещественных чисел
(R, 0, 1, +, ·, 6) (описываемая аксиомами на с.187), множества N, Z и Q, вместе с их свойствами,
как, например, определения и доказательства по индукции, можно описать внутри этой модели, не
вспоминая, как формально эти конструкции выглядели раньше. Это вообще говоря избавляет чи-
тателя от необходимости изучать детали теорий, использовавшихся нами до теперешнего момента,
если то, ради чего они строились — доказательство существования моделей теории вещественных
чисел — читатель готов принять на веру. В этом параграфе мы покажем, как формально это дела-
ется.

(a) Натуральные числа N и положительные натуральные числа N∗


Определение натуральных чисел N. Вначале нам понадобится вспомогательное определение:
• Множество вещественных чисел X называется индуктивным, если
1) X содержит нуль (о котором говорится в аксиоме A6):

0∈X

2) вместе с каждым числом x ∈ X ему принадлежит также число x + 1 (о числе 1


говорится в аксиоме A8):

∀x ∈ X x+1∈X
§ 2. Натуральные, целые и рациональные числа 199

⋄⋄ 3.2.1. Само множество R является индуктив- ми множествами. Наоборот, скажем, множества


ным. Полуинтервалы вида (a, ∞) где a < 0, или (0, ∞), [1, ∞), [0, 5] не являются индуктивными.
[a, ∞) где a 6 0 также являются индуктивны-

Теперь главное определение:


• Наименьшее индуктивное множество обозначается символом N и называется множе-
ством натуральных чисел, или натуральным рядом. Слово “наименьшее” здесь означает,
что выполняются два условия:
(i) N является индуктивным множеством;
(ii) если X – какое-нибудь другое индуктивное множество, то N содержится в X.

Доказательство существования и единственности. 1. Покажем сначала, что такое множество N


действительно существует. Обозначим через N пересечение всех индуктивных множеств X:
\
N= X (3.2.73)
X − индуктивное
множество

Иными словами,

y∈N ⇔ y принадлежит любому индуктивному множеству X

Тогда мы получим:
1) 0 ∈ N, потому что 0 лежит в любом индуктивном множестве X, и
2) если x ∈ N, то есть x ∈ X для всякого индуктивного множества X, то x+1 ∈ X (поскольку
X индуктивно); значит, x + 1 ∈ X для всякого индуктивного множества X, поэтому
x + 1 ∈ N.
Таким образом, N – индуктивное множество, то есть оно удовлетворяет условию (i). С другой
стороны, N содержится в любом множестве X, то есть, в любом другом индуктивном множестве.
Значит, N удовлетворяет условию (ii) на с.199.
2. Мы поняли, что множество N со свойствами (i) и (ii) существует. Теперь покажем, что такое
множество N единственно. Действительно, если бы нам было дано какое-то другое множество N e с
теми же свойствами, то мы получили бы, что, во-первых,
e
N⊆N
e и, во-вторых,
(потому что N содержится в любом индуктивном множестве, в частности, в N),

e ⊆N
N
e содержится в любом индуктивном множестве, в частности, в N). Вместе это означает,
(потому что N
что
e
N = N.

Принцип математической индукции. Напомним, что в главе 0 мы описали принцип обык-


новенной индукции для явной конструкции множества N натуральных чисел, как конечных орди-
налов (теорема 0.3.79). Следующее утверждение показывает, что построенное нами здесь на с.199
множество N как подмножество в “абстрактной” модели вещественных чисел (R, 0, 1, +, ·, 6) обла-
дает тем же свойством (и это неочевидный факт, потому что N, определенное на с.199, совсем не
обязано совпадать с множеством N конечных ординалов на с.60, ибо моделей вещественных чисел
(R, 0, 1, +, ·, 6) много, и они необязательно содержат ординалы4 ).

Теорема 3.2.2 (принцип математической индукции в абстрактной форме). Пусть E – какое-


нибудь подмножество в N, обладающее свойствами:
4 Более того, модель вещественных чисел как дедекиндовых сечений, построенная в главе 1 уже сама не содержит

подмножество N конечных ординалов, построенное на с.60.


200 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

(a) 0∈E
(b) ∀n ∈ E n+1∈E
Тогда E = N.
Доказательство. С одной стороны, нам дано, что E ⊆ N. С другой же стороны, свойства (a), (b)
означают, что E является индуктивным множеством. Поэтому, в силу условия (ii) определения 3.2,
N содержится в E: N ⊆ E. Итак,
E⊆N & N⊆E
то есть, E = N.
На практике удобно пользоваться следующей переформулировкой принципа математической
индукции.
Теорема 3.2.3 (принцип математической индукции). Пусть дана последовательность утвержде-
ний
Φn n∈N (3.2.74)
со следующими свойствами:
(a′ ) первое утверждение Φ0 истинно;
(b′ ) если при каком-нибудь n ∈ N истинно утверждение Φn , то истинно и утверждение
Φn+1 .
Тогда все утверждения Φn истинны (для всех n ∈ N).
Доказательство. Обозначим через E множество всех таких чисел n ∈ N, для которых утверждение
Φn истинно. Тогда условие (a′ ) будет эквивалентно условию (a) теоремы 3.2.2, а условие (b′ ) будет
эквивалентно условию (b). Значит, E = N, то есть Φn истинно для каждого n ∈ N.

Свойства натуральных чисел. Первое следствие из принципа математической индукции вы-


глядит так:
Теорема 3.2.4. Множество N натуральных чисел замкнуто относительно сложения и умно-
жения: если m, n ∈ N, то m + n ∈ N и m · n ∈ N.
Доказательство. 1. Зафиксируем m ∈ N и обозначим через E множество чисел n ∈ N таких, что
m + n ∈ N:
E = {n ∈ N : m + n ∈ N}
Нам нужно убедиться, что E = N. Это делается индукцией. Сначала замечаем, что 0 ∈ E, потому
что из m ∈ N следует m + 0 = (3.1.10) = m ∈ N. Затем берем какое-нибудь k ∈ E, то есть

m+k ∈N

и замечаем, что тогда k + 1 ∈ E, потому что

m + (k + 1) = (m + k) + 1 ∈ N

По принципу индукции все это означает, что E = N.


2. Опять фиксируем m ∈ N и обозначаем через E множество чисел n ∈ N таких, что m · n ∈ N:

E = {n ∈ N : m · n ∈ N}

Нам нужно убедиться, что E = N. Это тоже делается индукцией. Сначала замечаем, что 0 ∈ E,
потому что из m ∈ N следует m · 0 = (3.1.14) = 0 ∈ N. Затем берем какое-нибудь k ∈ E, то есть

m·k ∈N

и замечаем, что тогда k + 1 ∈ E, потому что из только что доказанной замкнутости N относительно
сложения следует
m · k ∈ N =⇒ m · (k + 1) = (m · k) + m ∈ N
Снова по принципу индукции E = N.
Ниже нам понадобятся еще несколько утверждений об N.
§ 2. Натуральные, целые и рациональные числа 201

• Дискретным интервалом с концами m ∈ N и n ∈ N называется множество

{m, ..., n} := {k ∈ N : m 6 k 6 n}

(очевидно, если m > n, то {m, ..., n} = ∅).


• Начальным дискретным интервалом называется дискретный интервал, у которого левый
конец равен 0:
{0, ..., n} = {k ∈ N : k 6 n}

Свойства натуральных чисел


1◦ . Для всякого n ∈ N выполняется n > 0. Поэтому,

min N = 0 (3.2.75)

2◦ . Если n ∈ N и n 6= 0, то n − 1 ∈ N.
3◦ . Для любого n ∈ N множество чисел x ∈ N, больших n − 1, имеет наименьший элемент,
а именно n:
min{x ∈ N : n − 1 < x} = n (3.2.76)
4◦ . Каждое непустое подмножество M ⊆ N обладает минимальным элементом.
5◦ . Для любых m, n ∈ N справедливы импликации:

m<n+1 =⇒ m6n (3.2.77)

m<n =⇒ m+16n (3.2.78)



6 . Если m, n ∈ N и m 6 n, то n − m ∈ N.

7 . Пусть I – подмножество в начальном интервале {0, ..., n}, удовлетворяющее условиям
(a) 0∈I
 
(b) ∀k < n k ∈ I =⇒ k + 1 ∈ I
тогда I = {0, ..., n}.
8◦ . Пусть E – подмножество в N, удовлетворяющее условиям
(a) 0∈E
(b) ∀k ∈ E {0, ..., k} ⊆ E
Тогда
— либо E = N,
— либо E – начальный интервал:

∃n ∈ E {0, ..., n} = E (3.2.79)

Доказательство. Все эти утверждения доказываются математической индукцией.


1. Формула n > 0 верна для любого n ∈ N, потому что, во-первых, она верна при n = 0: 0 > 0.
И, во-вторых, если она верна при некотором n = m, m > 0, то и при n = m + 1 она тоже верна:
m + 1 > 0 + 1 = 1 > 1.
2. Рассмотрим множество

E = {0} ∪ (N + 1) = {x ∈ R : x=0 ∨ ∃n ∈ N x = n + 1}

и заметим, что E = N. Действительно, во-первых, 0 ∈ E, а во-вторых, если m ∈ E, то либо m = 0, и


тогда m+1 ∈ N+1 ⊆ E, либо m = n+1 для некоторого n ∈ N, и тогда m+1 = (n+1)+1 ∈ N+1 ⊆ E.
Теперь из E = N получаем: если n ∈ N = E = {0} ∪ (N + 1) и n 6= 0, то n ∈ N + 1, то есть n = k + 1
для некоторого k ∈ N.
3. Обозначим Xn = {x ∈ N : n − 1 < x} и заметим, что

Xn+1 = X +1 (3.2.80)
| {z } | n{z }
k k
{y ∈ N : n < y} {y ∈ R : ∃x ∈ Xn y = x + 1}
202 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Действительно, с одной стороны, Xn + 1 ⊆ Xn+1 , потому что

y ∈ Xn + 1 =⇒ ∃x ∈ Xn y =x+1 =⇒ ∃x ∈ N n − 1 < x & y = x + 1 =⇒


=⇒ ∃x ∈ N n < x + 1 = y =⇒ y ∈ Xn+1

а, с другой – Xn+1 ⊆ Xn + 1, потому что

y ∈ Xn+1 =⇒ y∈N& n<y =⇒ ∃x ∈ N y =x+1&n<x+1 =⇒


| {z }

y > min N = 1

2◦

x := y − 1 ∈ N

=⇒ ∃x ∈ N y =x+1&n−1<x =⇒ ∃x ∈ Xn y =x+1 =⇒ y ∈ Xn + 1

Теперь доказываем (3.2.76) по индукции. Во-первых, убеждаемся, что эта формула верна при
n = 1. Действительно,
1◦
x∈N =⇒ x>1>0 =⇒ x ∈ X1
| {z }

N ⊆ X1

X1 = N

min X1 = min N = 1
Далее предполагаем, что (3.2.76) верна при n = m:

min Xm = m (3.2.81)

и докажем, что тогда она верна при n = m + 1:

min Xm+1 = (3.2.80) = min(Xm + 1) = (min Xm ) + 1 = (3.2.81) = m + 1

4. Пусть M ⊆ N и M 6= ∅. Если 1 ∈ M , то доказывать нечего, потому что тогда 1 = min M .


/ M . Тогда множество E = N \ M , наоборот, должно содержать 1:
Поэтому будем считать, что 1 ∈

1∈E

Покажем, что существует такое n ∈ N, что

{1, ..., n} ⊆ E & n+1∈


/E (3.2.82)

Действительно, если бы это было не так, то есть при любом n ∈ E мы получали бы, что из {1, ..., n} ⊆
E следует n + 1 ∈ E, то это означало бы, что E = N, то есть M = ∅.
Теперь, возвращаясь от E к M , условие (3.2.82) можно переформулировать так:

{1, ..., n} ∩ M = ∅ & n+1∈M

Это и означает, что n + 1 = min M .


5. Пусть m, n ∈ N и m < n + 1, то есть m − 1 < n. Тогда n ∈ {x ∈ N : m − 1 < x} и по свойству 3◦
получаем n > min{x ∈ N : m − 1 < x} = m. Это доказывает импликацию (3.2.77). А из нее следует
(3.2.78):
(3.1.21) (3.2.77)
m<n =⇒ m+1<n+1 =⇒ m+16n
6. Пусть m ∈ N. Рассмотрим множество

E = {0, ..., m} ∪ (N + m + 1)

и заметим, что E = N. Действительно, во-первых, 0 ∈ E, а во-вторых, если k ∈ E, то возможны три


случая, в каждом из которых получается k + 1 ∈ E:
§ 2. Натуральные, целые и рациональные числа 203

1) k < m = (m − 1) + 1 =⇒ (применяем 5◦ ) =⇒ k 6 m−1 =⇒ k+16m =⇒


k + 1 ∈ E;
2) k = m =⇒ k + 1 = 1 + m ∈ (N + m) ⊆ E;
3) k > m =⇒ k ∈ / {0, ..., m} =⇒ k ∈ (N + m + 1) =⇒ k = n + m + 1 (n ∈ N) =⇒
k + 1 = (n + 1) + m + 1 (n + 1 ∈ N) =⇒ k + 1 ∈ (N + m + 1) ⊆ E;
Таким образом, получается что N = E = {0, ..., m} ∪ (N + m + 1), и поэтому если n ∈ N, n > m,
то, либо n = m, и тогда n − m = 0 ∈ N, либо n > m, и тогда n ∈/ {0, ..., m}, и значит, n ∈ N + m + 1,
то есть n = k + m + 1, k ∈ N, и n − m = k + 1 ∈ N.
7. Рассмотрим множество M = N \ I. Тогда получаем цепочку

I ⊆ {0, ..., n} =⇒ n+1∈


/I =⇒ n+1∈ M =⇒ n + 1 > |min
{zM}

существует
в силу 4◦

Нам нужно убедиться, что min M = n+1: тогда получится, что {0, ..., n}∩M = ∅, то есть {0, ..., n} ⊆
I и значит I = {0, ..., n}.
Предположим, что это не так: min M 6= n + 1. Тогда min M < n + 1, и по свойству 5◦ min M 6 n.
/ M , и значит min M > 0, то есть по свойству 5◦ ,
С другой стороны, в силу (a), 0 ∈ I, поэтому 0 ∈
min M − 1 > 0, и
1 6 min M 6 n
Если теперь положить k = min M − 1, то получается вот что:
(b)
06k<n & k∈
/M =⇒ k∈I & k<n =⇒ {z ∈ I}
k + 1 = |min M

невозможно,
потому что
M ∩I = ∅

8. Если E 6= N, то найдется x ∈ N такое что x ∈


/ E. То есть множество

M = {x ∈ N : x∈
/ E}

непусто. Значит, по уже доказанному свойству 4◦ , M имеет минимальный элемент:

m = min M

/ M . С другой стороны, по уже доказанному свойству 1◦ , 0 6 m.


По условию (a), 0 ∈ E, и поэтому 0 ∈
Значит, 0 < m. Поэтому по свойству 2◦ , число n = m − 1 тоже лежит в N:

n=m−1∈N

Тогда, во-первых, n ∈
/ M (потому что иначе число m = n + 1 не было бы минимумом для M ), и
значит n ∈ E, откуда в силу (b),
{0, ..., n} ⊆ E (3.2.83)
А, во-вторых, для x ∈ N справедлива импликация

x>n =⇒ x∈
/ E, (3.2.84)

потому что иначе мы получили бы

n<x x∈E

(3.2.78) ⇓ (b)
m=n+16x {0, ..., x} ⊆ E
| {z }


m∈E
а это невозможно, поскольку m ∈ M . Утверждения (3.2.83) и (3.2.84) вместе означают, что {0, ..., n} =
E.
204 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Определения по индукции. Некоторые важные объекты теории вещественных чисел, напри-


мер, степень числа an или факториал n!, определяются по индукции (см. ниже определения на
с.207). Мы можем использовать для этого прием определения по индукции который мы описывали
в теореме 0.3.75 (для N как множества конечных ординалов), однако для замкнутости изложения5
удобнее сформулировать две новые теоремы (служащие обоснованием приема определения по ин-
дукции для N как подмножества в модели (R, 0, 1, +, ·, 6)), пользуясь которыми можно делать то
же самое без необходимости изучать главу 0. Первая из них используется в случаях, когда нужно
определить бесконечную последовательность элементов6 :
Теорема 3.2.5 (об определениях полной индукцией на N). Пусть X – произвольное множество
(необязательно числовое) и дано отображение G, которое каждой конечной последовательности
элементов x0 , ..., xn ∈ X, n ∈ N, ставит в соответствие определенный элемент G(x0 , ..., xn ) ∈ X.
Тогда для всякого начального элемента x0 ∈ X отображение G однозначно определяет бесконеч-
ную последовательность {xn } ⊆ X, содержащую x0 в качестве первого элемента и удовлетворя-
ющую условию
∀n ∈ N G(x0 , ..., xn ) = xn+1 (3.2.85)
Доказательство. Здесь можно считать, что X непусто, потому что если оно пусто, то утверждение
теоремы справедливо автоматически.
Зафиксируем x0 ∈ X и обозначим через E подмножество в N, состоящее из таких n ∈ N, для ко-
торых существует конечная последовательность x0 , ..., xn ∈ X (первым элементом которой является
тот самый зафиксированный нами элемент x0 ) со следующим свойством:

∀k ∈ {1, ..., n} G(x0 , ..., xk−1 ) = xk (3.2.86)


| {z }
k
[1, n] ∩ N

Тогда, во-первых, 0 ∈ E, потому что для n = 0 нужная последовательность должна состоять


только из одного элемента, и таким элементом будет x0 , а утверждение (3.2.86) будет выполняться
автоматически, потому что оно превратится в условие

∀k ∈ {1, ..., 0} G(x0 , ..., xk−1 ) = xk


| {z }
k
[1, 0] ∩ N
k

(в котором k должен выбираться из пустого множества, и значит, таких k не будет). И, во-вторых,


если n ∈ E, то это значит, что существует последовательность x0 , ..., xn ∈ X для которой выполня-
ется (3.2.86). Тогда можно положить xn+1 = G(x0 , ..., xn ), и мы получим что n + 1 ∈ E.
Таким образом, по принципу математической индукции 3.2.2, E = N. Отсюда следует, что для
всякого n ∈ N можно выбрать xn по такому правилу: выбираем какую-нибудь конечную последо-
вательность {x0 , ..., xn }, подчиненную условию (3.2.86) (такая последовательность существует по-
скольку n ∈ E), и в качестве xn берем ее последний элемент. Нам нужно только убедиться, что
элемент xn определяется таким алгоритмом однозначно. Действительно, если предположить, что
существует какой-то другой элемент x′n , которое можно определить таким же образом, то есть для
которого можно построить конечную последовательность {x′0 , ..., x′n } так, чтобы

x′0 = x0 & ∀k = 1, ..., n − 1 G(x′0 , ..., x′k ) = x′k+1

то, рассмотрев множество индексов

I = {k = 1, ..., n : ∀i 6 k x′i = xi }

мы получим, что, во-первых, 0 ∈ I (потому что x′0 = x0 ), и, во-вторых,

k<n & k∈I


k<n & ∀i 6 k x′i = xi
5И чтобы не доказывать изоморфизм между N, определенным в этой главе, и N из главы 0.
6 Напомним, что понятие бесконечной последовательности было определено на с.73.
§ 2. Натуральные, целые и рациональные числа 205

x′k+1 = G(x′0 , ..., x′k ) = G(x0 , ..., xk ) = xk+1

k+16n & ∀i 6 k + 1 x′i = xi

k+1∈I
Отсюда, по принципу конечной индукции (свойство 7◦ на с.201), I = {0, ..., n}, то есть, в частности,
x′n = xn .

Вторая теорема бывает нужна, когда нет гарантии, что определяемая тобой последовательность
будет бесконечной7 :

Теорема 3.2.6 (об определениях частной индукцией на N). Пусть X — произвольное множе-
ство (необязательно числовое) и дано отображение G, которое некоторым конечным последо-
вательностям элементов x0 , ..., xn ∈ X, n ∈ N, ставит в соответствие определенные элементы
G(x0 , ..., xn ) ∈ X. Тогда для всякого начального элемента x0 ∈ X это правило однозначно опре-
деляет (конечную или бесконечную) последовательность {xn } ⊆ X, содержащую x0 в качестве
первого элемента и удовлетворяющую условию

G(x0 , ..., xn ) = xn+1 , n<N (3.2.87)

где величина N зависит от множества X, отображения G и начального элемента x0 , и опреде-


ляется условием:
n o
N = sup n ∈ N : ∃{x1 , ..., xn } ⊆ X ∀k ∈ {1, ..., n} G(x0 , ..., xk−1 ) = xk (3.2.88)

(если величина N конечна, то она представляет собой длину последовательности {xn }).

Доказательство. Здесь, как и в предыдущей теореме, можно считать, что X непусто, потому что
если оно пусто, то утверждение справедливо автоматически.
Зафиксируем x0 ∈ X и обозначим через E подмножество в N, от которого берется верхняя грань
в формуле (3.2.88)
N = sup E,
то есть состоящее из таких n ∈ N, для которых существует конечная последовательность x0 , ..., xn ∈
X (первым элементом которой является тот самый зафиксированный нами элемент x0 ) со следую-
щим свойством:
∀k = 1, ..., n G(x0 , ..., xk−1 ) = xk (3.2.89)
Это множество E будет удовлетворять условиям (a) и (b) свойства 8◦ на с.201:
(a) 0 ∈ E (потому что для n = 0 нужная последовательность должна состоять только из
одного элемента, и таким элементом будет x0 , а утверждение (3.2.89) будет выполняться
автоматически, потому что элементов x1 , ..., xn ∈ X нет), и
(b) ∀n ∈ E {0, ..., n} ⊆ E (потому что если n ∈ E, то есть существуют x0 , ..., xn ∈ X со
свойством (3.2.89), то для всякого k 6 n последовательность x0 , ..., xk будет обладать
теми же свойствами, только с заменой k на какое-нибудь i, а после этого n на k).
По свойству 8◦ на с.201 отсюда следует, что либо E = N, либо E = {0, ..., N } для некоторого N ∈
N. В обоих случаях мы получаем, что каждому n ∈ E можно поставить в соответствие некоторый
элемент xn по такому правилу: выбираем какую-нибудь конечную последовательность {x0 , ..., xn }
(c x0 фиксированным выше), подчиненную условию (3.2.86) (такая последовательность существует
поскольку n ∈ E), и в качестве xn берем ее последний элемент. Здесь нужно только убедиться, что
элемент xn определяется таким алгоритмом однозначно. Это делается в точности так же, как при
доказательстве теоремы 3.2.5.
7 Понятие конечной последовательности было определено на с.73.
206 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Положительные натуральные числа N∗ . Помимо множества N всех натуральных чисел нам


будет часто встречаться множество положительных натуральных чисел, для которого полезно вве-
сти какое-нибудь отдельное обозначение. Мы будем использовать для этого символ N∗ :

N∗ := N \ {0} (3.2.90)

Свойства N∗ похожи на свойства N, в частности, в N∗ также справедлив принцип математической


индукции, который, правда, выглядит немного по-другому:
Теорема 3.2.7 (принцип математической индукции в абстрактной форме для N∗ ). Пусть E –
какое-нибудь подмножество в N∗ , обладающее свойствами:
(a) 1∈E
(b) ∀n ∈ E n+1∈E
Тогда E = N∗ .
На практике его удобно применять в таком виде:
Теорема 3.2.8 (принцип математической индукции для N∗ ). Пусть дана последовательность
утверждений
Φn n ∈ N∗ (3.2.91)
со следующими свойствами:
(a′ ) первое утверждение Φ1 верно;
(b′ ) если при каком-нибудь n ∈ N∗ верно утверждение Φn , то верно и утверждение Φn+1 .
Тогда все утверждения Φn справедливы (для всех n ∈ N∗ ).
По аналогии с теоремой 3.2.4 доказывается
Теорема 3.2.9. Множество N∗ положительных натуральных чисел замкнуто относительно
сложения и умножения: если m, n ∈ N∗ , то m + n ∈ N∗ и m · n ∈ N∗ .
Для множества N∗ положительных натуральных чисел имеются аналоги теорем 3.2.5 и 3.2.6,
которые выглядят так:
Теорема 3.2.10 (об определениях полной индукцией на N∗ ). Пусть X – произвольное множество
(необязательно числовое) и дано отображение G, которое каждой конечной последовательности
элементов x1 , ..., xn ∈ X, n ∈ N∗ , ставит в соответствие определенный элемент G(x1 , ..., xn ) ∈ X.
Тогда для всякого начального элемента x1 ∈ X отображение G однозначно определяет бесконеч-
ную последовательность {xn } ⊆ X, содержащую x1 в качестве первого элемента и удовлетворя-
ющую условию
∀n ∈ N∗ G(x1 , ..., xn ) = xn+1 (3.2.92)
Теорема 3.2.11 (об определениях частной индукцией на N∗ ). Пусть X – произвольное множе-
ство (необязательно числовое) и дано отображение G, которое некоторым конечным последова-
тельностям элементов x1 , ..., xn ∈ X, n ∈ N∗ , ставит в соответствие определенные элементы
G(x1 , ..., xn ) ∈ X. Тогда для всякого начального элемента x1 ∈ X это правило однозначно опре-
деляет (конечную или бесконечную) последовательность {xn } ⊆ X, содержащую x1 в качестве
первого элемента и удовлетворяющую условию

G(x1 , ..., xn ) = xn+1 , n<N (3.2.93)

где величина N зависит от множества X, отображения G и начального элемента x1 , и опреде-


ляется условием:
n o
N = sup n ∈ N∗ : ∃{x2 , ..., xn } ⊆ X ∀k ∈ {2, ..., n} G(x1 , ..., xk−1 ) = xk (3.2.94)

(если величина N конечна, то она представляет собой длину последовательности {xn }).
§ 2. Натуральные, целые и рациональные числа 207

Поговорим теперь о примерах применения • Двойной факториал числа n ∈ N определяет-


теоремы 3.2.5. ся по индукции следующими правилами:
— если число n четно, то есть имеет вид
Степени с натуральным показателем. n = 2m, m ∈ N, то
• Степенью an числа a ∈ R с показателем
n ∈ N∗ , как известно, называется число 0!! = 1, (2m + 2)!! = (2m + 2) · (2m)!! (3.2.99)

an = |a · a {z
· ... · a} — если число n нечетно, то есть имеет вид
n множителей
n = 2m − 1, m ∈ N∗ , то

Теорема 3.2.5 позволяет придать точный 1!! = 1, (2m + 1)!! = (2m + 1) · (2m − 1)!! (3.2.100)
смысл этим словам: чтобы определить an для
Pn
любого n ∈ N, нужно зафиксировать число a ∈ R Индуктивная сумма
Qn k=0 ak и индуктив-
и рассмотреть отображение G, которое любой по- ное произведение k=0 ak элементов после-
следовательности (x0 , ..., xn ) чисел из R ставит в довательности {an } определяются индуктивны-
соответствие число ми правилами так:
!
G(x0 , ..., xn ) = a · xn . X 0 n+1
X X n
ak = a0 , ak = ak + an+1
Применив к этому отображению теорему 3.2.5, k=0 k=0 k=0
мы для начального значения (3.2.101)
0 n+1 n
!
x0 = 1 Y Y Y
ak = a0 , ak = ak · an+1
получим последовательность со свойствами k=0 k=0 k=0
(3.2.102)
x0 = 1, xn+1 = a · xn , n ∈ N. – здесь (последовательность {an } считается за-
ранее фиксированной, и) в первом случае отоб-
Если обозначить ражение G определяется формулой
an = xn , G(x0 , ..., xn ) = xn + an+1 ,
то эти свойства переписываются в виде
а во втором — формулой
0
a =1 (3.2.95)
G(x0 , ..., xn ) = xn · an+1 ;

начальным же значением последовательности xn


an+1 = a · an (3.2.96)
в обоих случаях будет первый элемент последо-
Это и есть формальное определение степени. вательности {an }:
Обычно при определении по индукции указы-
ваются только эти соотношения, без уточнения, x0 = a0 .
каким должно быть отображение G, потому что
о его виде всегда можно догадаться. Часто приходится рассматривать также суммы и
произведения по интервалам натуральных чисел
! 3.2.12. Это определение, между прочим, пред- {m, ..., n}. Читатель может по аналогии дать ин-
полагает, что 00 равно единице: дуктивные определения этим понятиям, мы же
0
воспользуемся уже записанными формулами, и
0 =1 (3.2.97) положим

n
X n
X m−1
X
Факториал n! и двойной факториал n!!.
ak = ak − ak
• Факториал числа n ∈ N определяется по ин- k=m k=0 k=0
дукции следующим правилом:
n
Y n
Y . m−1
Y
0! = 1, (n + 1)! = (n + 1) · n! (3.2.98) ak = ak ak (если ak 6= 0).
k=m k=0 k=0
– здесь отображение G определяется форму-
⊲⊲ 3.2.13. Найдите формулы для последователь-
лой
ностей, определяемых следующими отображени-
G(x0 , ..., xn ) = (n + 1) · xn ,
ями:
а начальным значением последовательности
1) G(x0 , ..., xn ) = a + xn , x0 = 0. (Ответ: xn =
xn будет единица:
a · n.)
xn a
x0 = 1. 2) G(x0 , ..., xn ) = n+1 , x0 = a. (Ответ: xn = n! .)
208 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
(
1
3) G(x0 , ..., xn ) = xn , x0 = a, a 6= 0. (Ответ: a, n ∈ 2N
n xn = .)
xn = a(−1) .) 1, n ∈ 2N + 1
x0
4) G(x0 , ..., xn ) = xn , x0 = a, a 6= 0. (Ответ:

Доказательство формул по индукции. Здесь мы покажем, как с помощью математической


индукции доказываются разные формулы. Те, что мы докажем, понадобятся нам в дальнейшем.

⋄ 3.2.14. Неравенство Бернулли. Для любых n=k+1>2


n ∈ N и α > −1 выполняется неравенство

(1 + α)n > 1 + n · α (3.2.103)

Доказательство. Действительно, при n = 0 по-


лучается n! = (k + 1)! = (k + 1) · |{z}
k! >
| {z }
(1 + α)0 > 1 + 0 · α,

6
6
| {z } | {z } 2 2k−1
k k
1 1 > 2 · 2k−1 = 2k = 2n−1
то есть в этом случае неравенство верно. Предпо-
ложим, что оно верно для какого-нибудь n = k,
то есть, что справедливо
⋄ 3.2.16. При n, m ∈ N справедливо неравенство
(1 + α)k > 1 + k · α (3.2.104)
(n + m)! > n! · (n + 1)m (3.2.106)
Тогда для n = k + 1 мы получаем

(1 + α)n = (1 + α)k+1 = (1 + α) · (1 + α)k > Доказательство. Проведем индукцию по m ∈


N. При m = 0 это неравенство верно:
> (применяем (3.2.104)) > (1 + α) · (1 + k · α) =
= 1 + (k + 1) · α + k · α2 > 1 + (k + 1) · α = 1 + n · α (n + 0)! = n! > n! · (n + 1)0

Мы получили, что из того, что (3.2.103) вы- Предположим, что оно верно при m = k:
полняется для какого-то n = k автоматически
следует, что оно выполняется для n = k + 1. Та- (n + k)! > n! · (n + 1)k
ким образом, (3.2.103) обладает свойствами (a′ )
и (b′ ) теоремы 3.2.8, и поэтому оно выполняется Тогда при m = k + 1 получаем:
для любых n ∈ N.

⋄ 3.2.15. При n ∈ N∗ справедливо неравенство (n + m)! = (n + k + 1)! =


= (n + k + 1) · (n + k)! > (n + 1) · n! · (n + 1)k =
n! > 2n−1 (3.2.105) | {z } | {z }
6

Доказательство. При n = 1 это верно: n+1 n! · (n + 1)k

= n! · (n + 1)k+1 = n! · (n + 1)m
20
1! > |{z}
|{z}
1 1

Предположим, что это верно при n = k:


⋄ 3.2.17. Сумма отрезка геометрической
k! > 2k−1
прогрессии. Для всякого вещественного числа
Тогда при n = k + 1 получаем: q 6= 1 и любых чисел m, n ∈ N, m 6 n, справед-
ливы формулы:
k ∈ N∗
n
X 1 − q n+1
⇓ qi = , (3.2.107)
i=0
1−q
k>1 Xn
q m − q n+1
qi = (3.2.108)
⇓ i=m
1−q
§ 2. Натуральные, целые и рациональные числа 209

Доказательство. 1. Докажем сначала (3.2.107). m (умножаем на k!)


При n = 0 формула верна:
1 k n+1
0
+ =
X 1−q 1 (n − k)! (n − k + 1)! (n + 1 − k)!
qi = q0 = 1 = .
i=0
1−q m (умножаем на (n + 1 − k)!)

Предположим, что формула верна при n = k: n−k+1+k =n+1

k
X 1 − q k+1
qi = , (3.2.109)
i=0
1−q ⋄ 3.2.19. Бином Ньютона. Для любых a, b ∈ R
и n ∈ N∗ справедливо равенство
Тогда при n = k + 1 получаем:
n
X
k+1 k (a + b)n = Cnk · an−k · bk (3.2.112)
X X
i i k+1 k=0
q = q +q = (3.2.109) =
i=0 i=0
k+1
где Cnk – число сочетаний, определенное выше
1−q k+1 1 − q k+1 + q k+1 − q k+2 формулой (3.2.110).
= +q = =
1−q 1−q
Доказательство. Сначала проверяем ее при n =
1 − q k+2
=1: ,
1−q 1
X
1
что и есть формула (3.2.107) при n = k + 1. (a + b) = C1k · a1−k · bk
| {z }
k=0
2. После того, как (3.2.107) доказано, форму- k | {z }
ла (3.2.108) получается вычислением: a + b k
C10 · a1 · b0 + C11 · a0 · b1
n
X n
X m−1
X Затем предполагаем, что она верна при n = m
qi = qi − qi =
i=m i=0 i=0 m
X
1−q n+1
1−q m
q −q m n+1 (a + b)m = k
Cm · am−k · bk (3.2.113)
= − = k=0
1−q 1−q 1−q
и проверяем, что тогда она будет верна при n =
m + 1:
Число сочетаний Cnk . Для любых n, k ∈ N,
(a + b)m+1 = (a + b) · (a + b)m = (3.2.113) =
k 6 n число
m
X
  k
k n n! = (a + b) · Cm · am−k · bk =
Cn = = , (0 6 k 6 n) k=0
k (n − k)! · k!
m
X m
X
(3.2.110) k
называется числом сочетаний из n элементов = Cm · am+1−k · bk + k
Cm · am−k · bk+1 =
k=0 k=0
по k элементов. | {z }
заменяем k на i − 1
Предложение 3.2.18. Справедливо следующее m
X m+1
X
тождество = k
Cm ·a m+1−k k
·b + i−1
Cm · am+1−i · bi =
k=0 i=1
Cnk + Cnk−1 = Cn+1
k
, (3.2.111) | {z }
заменяем i на k
m
X m+1
X
называемое тождеством Паскаля. k
= Cm · am+1−k · bk + k−1
Cm · am+1−k · bk =
Доказательство. Это доказывается простой k=0 k=1
проверкой: m
X
= am+1 + k
Cm · am+1−k · bk +
Cnk + Cnk−1 = k
Cn+1 k=1
m
X
k−1
m + Cm · am+1−k · bk + bm+1 =
k=1
n! n! (n + 1)!
+ = Xm
(n − k)!k! (n − k + 1)!(k − 1)! (n + 1 − k)!k! = am+1 + (C k + C k−1 ) ·am+1−k · bk + bm+1 =
| m {z m }
m (делим на n!) k=1
k
k
Cn+1 ,
1 1 n+1
+ = по тождеству
(n − k)!k! (n − k + 1)!(k − 1)! (n + 1 − k)!k! Паскаля (3.2.111)
210 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

m
X 1 1 1
2) n+1 + n+2 + ... + 3n+1 > 1
= am+1 + k
Cm+1 · am+1−k · bk + bm+1 = Pn 2
k=1 3) k=1 k(3k − 1) = n (n + 1)
m+1 1 1 1 11
X 4) n+1 + n+2 + ... + 2n > 24
k
= Cm+1 · am+1−k · bk Pn 1 n
5) k=1 (4k−3)·(4k+1) = 4n+1
k=0
Qn  
1 n+2
6) k=1 1− (k+1)2 = 2n+2

7) 1 · 22 + 2 · 32 + ... + (n − 1) · n2 =
⊲ 3.2.20. Сумма отрезка арифметической n·(n2 −1)·(3n+2)
прогрессии. Докажите методом математиче- 12 (n > 2).
ской индукции формулу: ⊲⊲ 3.2.23. Докажите методом математической
Xn индукции8 (используя бином Ньютона):
n · (n + 1)
i= (3.2.114) 1) 1 · 3 · 5 · ... 2n−1 6 √ 1
2 2 4 6 2n 3n+1
i=1 √ Pn 1 √
2) n < k=1 k < 2 n (n > 2).

⊲ 3.2.21. Докажите следующие тождества для
двойного факториала: ⊲ 3.2.24. Докажите индукцией следующие тож-
дества:
n!! = n · (n − 2)!!, n > 2 (3.2.115)
Yn
n! = n!! · (n − 1)!!, n ∈ N∗ (3.2.116) an = a, a ∈ R, n ∈ N∗ (3.2.119)
m
(2m)!! = 2 · m!, m ∈ N (3.2.117) k=1
Y n
(2m − 1)!
(2m − 1)!! = m−1 , m∈N . ∗ n! = k, n ∈ N∗ (3.2.120)
2 · (m − 1)! k=1
(3.2.118) m
Y
(2m)!! = (2k), m∈N (3.2.121)
⊲⊲ 3.2.22. Докажите методом математической k=1
индукции: Ym
2 (2m − 1)!! = (2k − 1), m ∈ N∗ (3.2.122)
1) 12 + 32 + ... + (2n − 1)2 = n(4n3 −1) k=1

Принцип Архимеда.

Теорема 3.2.25. Множество натуральных чисел N не ограничено сверху.

Доказательство. Предположим, что наоборот, N ограничено сверху. Тогда по теореме 3.1.29, N


должно иметь точную верхнюю грань:

∃ sup N = B ∈ R (3.2.123)

Поскольку B – точная верхняя грань (то есть наименьшее из чисел, ограничивающих N сверху),
число B − 1 не может ограничивать N сверху. Значит, существует какое-то n ∈ N, большее чем B − 1:
n > B − 1. То есть
B <n+1
Это означает, что B не может ограничивать N сверху (потому что B меньше некоторого числа n+1 ∈
N). Таким образом, мы получили противоречие с (3.2.123). Оно означает, что наше предположение
о том, что N ограничено сверху неверно.

Из теоремы 3.2.25 следует важный вывод:

Теорема 3.2.26 (принцип Архимеда). Для любого вещественного числа C ∈ R найдется нату-
ральное число n ∈ N такое, что n > C.

Доказательство. Зафиксируем число C ∈ R, и предположим противное, то есть что для него не


существует такого n ∈ N, чтобы n > C. Тогда для всякого n ∈ N мы получаем n 6 C. Иными слова-
ми, C ограничивает N сверху. Этого не может быть по теореме 3.2.25. Значит, наше предположение
неверно.
8 Функция

f (x) = x будет определена только в следующей главе, на с.330, и здесь мы рассчитываем на школьные
знания читателя.
§ 2. Натуральные, целые и рациональные числа 211

Конечные множества в R и N.

Теорема 3.2.27. Всякое непустое конечное множество X в R обладает минимумом и максиму-


мом.

Доказательство. Покажем, что X имеет минимум (существование максимума доказывается по


аналогии). Проведем индукцию по мощности card X (числу элементов) множества X.
1. При card X = 1 мы получаем, что X состоит всего из одного элемента a, и ясно, что a будет
минимумом X:
a = min X
2. Предположим, что мы доказали наше утверждение для всех множеств X мощности card X = k,
где k ∈ N∗ .
3. Пусть X – множество мощности card X = k + 1. Рассмотрим какую-нибудь биекцию f :
{1, ..., k + 1} → X и обозначим K = {f (i); i ∈ {1, ..., k}}. Тогда:

X = K ∪ {f (k + 1)},

Рассмотрим число
a = (min K) ∧ f (k + 1)
(напомним, что мы определили операцию ∧ формулой (3.1.62)). Это число a будет минимумом
множества X, потому что, во-первых,

a = (min K) ∧ f (k + 1) = min{min K, f (k + 1)}


a = min K ∨ a = f (k + 1)

a∈K ∨ a ∈ {f (k + 1)}

a ∈ K ∪ {f (k + 1)} = X
И, во-вторых,
a = (min K) ∧ f (k + 1) = min{min K, f (k + 1)}

a 6 min K & a 6 f (k + 1)

a6K & a 6 f (k + 1)

a 6 K ∪ {f (k + 1)} = X

Теорема 3.2.28. Множество A в N конечно тогда и только тогда, когда оно ограничено:

card A < ∞ ⇐⇒ ∃N ∈ N A ⊆ {1, ..., N }

Доказательство. Первая половина этого утверждение следует из теоремы 3.2.27: если множество
A конечно, то оно либо пусто, и тогда ограничено, либо непусто, и тогда, по теореме 3.2.27, A имеет
максимум, и значит, ограничено сверху. С другой стороны, оно всегда ограничено снизу нулем 0, и
значит, оно просто ограничено.
Докажем, что, наоборот, если A ограничено, то оно конечно. Опять, если A пусто, то доказывать
ничего не нужно, поэтому мы будем считать, что A 6= ∅. Тогда, воспользовавшись свойством 4◦ на
с.201 и положив
a1 = min A,
212 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

можно определить отображение G, которое некоторым последовательностям {a1 , ..., ak } ⊆ A будет


ставить в соответствие число

G(a1 , ..., ak ) = min A \ {a1 , ..., ak }

(если множество A\{a1 , ..., ak } непусто, то такое число существует по свойству 4◦ на с.201). По теоре-
ме 3.2.6 об определениях частной индукцией, отображение G определяет некую последовательность
{an } ⊆ A, удовлетворяющую условию

G(a1 , ..., an ) = an+1 ,

для всех n, меньших длины N этой последовательности.


1. Докажем, что она строго возрастает:

∀n < N an < an+1 (3.2.124)

Действительно, во-первых,
{1, ..., an−1 } ⊆ {1, ..., an−1 , an }

A \ {1, ..., an−1 } ⊇ A \ {1, ..., an−1 , an }
⇓ (3.1.59)

an = min A \ {1, ..., an−1 } 6 min A \ {1, ..., an−1 , an } = an+1


И, во-вторых, если бы оказалось, что an = an+1 , то мы получили бы

an = an+1 = min A \ {1, ..., an }


an ∈ A \ {1, ..., an },
что невозможно.
2. Из (3.2.124) следует условие
∀n n 6 an (3.2.125)
Его можно доказать индукцией. При n = 1 оно очевидно:

1 6 a1 .

А если оно верно при n = k


k 6 ak ,
то из этого следует
k 6 ak < ak+1
⇓ (3.2.78)

k + 1 6 ak+1
То есть (3.2.125) будет верно и при n = k + 1.
3. Заметим теперь, что поскольку A ограничено, существует c ∈ R такое что

A6c

По принципу Архимеда (теорема 3.2.26), должно существовать m ∈ N∗ такое что

A6c<m

Отсюда следует, что последовательность {an } конечна. Действительно, если бы она была бесконеч-
ной, то мы получили бы, что ее элемент с номером m лежит в A

am ∈ A

А с другой стороны, это невозможно, потому что

A < m 6 am
§ 2. Натуральные, целые и рациональные числа 213

4. Итак, мы имеем конечную последовательность {an } ⊆ A, то есть отображение

f : {1, ..., N } → A, f (n) = an

где N ∈ N∗ – длина последовательности. Это отображение инъективно, потому что

m<n


f (m) = am < an = f (n)

f (m) 6= f (n)
Нам остается проверить, что оно сюръективно. Действительно, если бы оказалось, что

A \ {a1 , ..., aN } 6= ∅,

то положив
aN +1 = min A \ {a1 , ..., aN }
мы получили бы, что N не может быть длиной последовательности {an }, определяемой отображе-
нием G по теореме 3.2.6:

∃{a2 , ..., aN +1 } ⊆ A ∀k ∈ {2, ..., N + 1} G(a1 , ..., ak−1 ) = ak


n o
N + 1 6 sup n ∈ N∗ : ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak

n o
6 sup n ∈ N∗ :
N= ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak

(b) Целые числа Z


Определение множества целых чисел.
• Число x ∈ R называется целым, если оно
– либо натуральное,
x∈N
– либо противоположно натуральному

x ∈ −N

(то есть x имеет вид x = −n, где n ∈ N).


В соответствии с этим, множество целых чисел, обозначаемое символом Z, описывается
формулой
Z = (−N) ∪ N (3.2.126)

Свойства множества Z:
1◦ . Сумма x + y двух целых чисел x и y, также является целым числом:

x, y ∈ Z =⇒ x+y ∈Z (3.2.127)

2◦ . Число −x, противоположное целому числу x, также является целым числом:

x∈Z =⇒ −x ∈ Z (3.2.128)

3◦ . Произведение x · y двух целых чисел x и y, также является целым числом:

x, y ∈ Z =⇒ x·y ∈Z (3.2.129)
214 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Доказательство. 1. Пусть m, n ∈ Z. Покажем сначала, что m + n ∈ Z. Для этого придется рас-


смотреть несколько случаев:
— если m > 0 и n > 0, то m, n ∈ N, и по теореме 3.2.4 получаем m + n ∈ N ⊆ Z;
— если m 6 0 и n 6 0, то m, n ∈ −N, то есть −m ∈ N и −n ∈ N и опять по теореме 3.2.4
получаем −m − n = (−m) + (−n) ∈ N, откуда m + n ∈ −N ⊆ Z;
— если m 6 0 и n > 0, то m ∈ −N, n ∈ N, то есть −m = k ∈ N и n ∈ N; здесь нужно
рассмотреть три частных случая:
— если k 6 n, то по свойству 6◦ на с. 201, n + m = n − k ∈ N ⊆ Z;
— если k > n, то по тому же свойству 6◦ на с. 201, −(n + m) = k − n ∈ N, откуда
n + m ∈ −N ⊆ Z;
2. Свойство 2◦ очевидно: если n ∈ Z = (−N) ∪ N, то −n ∈ −((−N) ∪ N) = (−N) ∪ N = Z.
3. Замкнутость относительно умножения доказывается так же, как и относительно сложения.
Пусть m, n ∈ Z. Чтобы убедиться, что m · n ∈ Z, нужно рассмотреть несколько случаев:
— если m > 0 и n > 0, то m, n ∈ N, и по теореме 3.2.4 получаем m · n ∈ N ⊆ Z;
— если m 6 0 и n 6 0, то −m ∈ N и −n ∈ N и опять по теореме 3.2.4 получаем m · n =
(−m) · (−n) ∈ N ⊆ Z;
— если m 6 0 и n > 0, то m ∈ −N, n ∈ N, то есть −m ∈ N и n ∈ N; опять по теореме 3.2.4
получаем −m · n = (−m) · n ∈ −N, откуда m · n ∈ −N ⊆ Z.

Теорема 3.2.29. Для любых m, n ∈ Z

m<n+1 =⇒ m6n (3.2.130)

Доказательство. Здесь нужно рассмотреть несколько случаев.


1. Если 0 6 m, то −1 6 m − 1 < n, и, поскольку n ∈ Z = (−N) ∪ N, мы можем заключить, что
n ∈ N. Мы получаем, что оба числа m и n лежат в N, а этот случай уже рассмотрен в свойстве 5◦
на с.201.
2. Если m < 0, то m ∈ −N, и нужно рассмотреть два частных случая:
— если n ∈ N, то мы получаем m 6 0 6 n.
— если же n ∈ −N, то мы получаем

m<n+1 =⇒ −m > −n − 1 =⇒ −n < −m + 1;

поскольку при этом −m ∈ N и −n ∈ N, мы опять попадаем в ситуацию, описанную в


свойстве 5◦ на с.201, и получаем, что −n 6 −m. То есть m 6 n.

Следствие 3.2.30. Если m, n ∈ Z, причем n 6 m < n + 1, то m = n.

Доказательство. Из (3.2.130) получаем: m < n + 1 =⇒ m 6 n, и вместе с неравенством n 6 m это


означает, что m = n.

Теорема 3.2.31. Любое непустое ограниченное снизу (сверху) множество целых чисел E ⊆ Z
имеет минимальный (максимальный) элемент.

∃ min E (max E)

причем
n<E =⇒ n < min E (E < n =⇒ max E < n) (3.2.131)

Доказательство. Пусть E ограничено сверху. Тогда по принципу Архимеда 3.2.26, найдется нату-
ральное число n ∈ N ограничивающее E сверху. Теперь получаем:

E<n

−n < −E
§ 2. Натуральные, целые и рациональные числа 215


0 < −E + n (причем −E + n ⊆ Z, по свойствам 1◦ и 2◦ на с.213)
⇓ (3.2.126)

−E + n ⊆ N
⇓ (свойство 4◦ на с. 201)
∃ min(−E + n) ∈ N
| {z }
k (3.1.60)
min(−E) + n


∃ min(−E) ∈ Z
| {z }
k (3.1.61)
− max(E)


∃ max E ∈ Z

Аналогично рассматривается случай, когда E ограничено снизу.

Степени с целым показателем. Напомним, Z1 : следующие две группы тождеств вы-


что на странице 207 мы уже определили степень полняются всякий раз, когда обе ча-
an с показателем n ∈ N индуктивными формула- сти тождества определены:
ми (3.2.95) и (3.2.96):
— показательные законы:
0 n+1 n
a = 1, a = a · a, n∈N (3.2.132) a0 = 1, (3.2.134)
(при этом a может быть любым). Для целых от- 1
a−n = n , (3.2.135)
рицательных показателей степень определяется a
формулой am+n = am · an ; (3.2.136)
 n
−n

−1 n 1 — степенные законы:
a := |{z}a = , n ∈ N∗ , (3.2.133)
a
обратный 1n = 1, (3.2.137)
элемент  n
для a 1 1
из аксиомы
= n, (3.2.138)
a a
A9
(a · b)n = an · bn (3.2.139)
(в этом случае a должно быть ненулевым).
Z2 : тождество, называемое накопи-
• Отображение (a, n) 7→ an называется сте-
тельным законом,
пенным отображением с целым показателем.
Его свойства удобно собрать в следующей (am )n = am·n (3.2.140)
теореме.
выполняется для следующих значений
Теорема 3.2.32 (о степенном отображении). переменных:
Отображение
— при a 6= 0 и m, n ∈ Z,
(a, n) 7→ an , — при a = 0 и m, n ∈ N;

обладает следующими свойствами: Z3 : для нулевого основания степень, в


случаях, когда она определена, описы-
Z0 : оно определено в следующих двух си- вается формулой
туациях: (
— при a 6= 0 и n ∈ Z, n 1, n = 0
0 = (3.2.141)
— при a = 0 и n ∈ N, 0, n > 0

или, что то же самое, в следующих а для положительных оснований


двух: выполняется следующее условие со-
хранения знака:
— при n ∈ N и тогда a ∈ R,
— при n ∈ −N∗ и тогда a 6= 0; a>0 ⇒ an > 0 (n ∈ Z) (3.2.142)
216 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Z4 : для положительных оснований выпол- которую можно переписать так:


няются следующие условия моно-
тонности: a−n
= a−n−1 , n∈N
a
— если n > 0, то возведение в сте-
пень n сохраняет знак неравен- и доказывается это цепочкой:
ства:
1 1
0<x<y =⇒ xn < y n (3.2.143) a−n−1 = (3.2.135) = = (3.2.132) = n =
an+1 a ·a
— если n < 0, то возведение в сте- 1 1 a−n
= (3.1.46) = n · = (3.2.135) =
пень n меняет знак неравенства: a a a

0<x<y =⇒ xn > y n (3.2.144) Докажем теперь (3.2.136). Зафиксируем m ∈


Z. Для n ∈ N это доказывается индукцией:
— если a > 1, то потенцирование с
основанием a сохраняет знак нера- am+0 = am = am · a = am · a0
венства: (3.2.147)
am+n+1 = m+n m n
|a {z } ·a = a · a · a =
m n
m<n =⇒ a <a (3.2.145)

=
am · an ,
— если 0 < a < 1, то потенцирование посылка
индукции
с основанием a меняет знак нера-
(3.2.147)
венства: = am · an+1
m<n =⇒ am > an (3.2.146)
Для n ∈ −N∗ , то есть n = −k, где k ∈ N∗ , фор-
Доказательство. 1. Начнем с показательных за- мула (3.2.136) переписывается так:
конов. Формула (3.2.134) есть просто часть опре- am
деления (3.2.132) степени an с неотрицатель- am−k = am · a−k = (3.2.135) = k
a
ным показателем. Формула (3.2.135) доказыва-
ется рассмотрением трех случаев: если n ∈ N∗ , то есть так:
то am−k · ak = am
1
a−n = (3.2.133) = n
a Заменив m − k = l, мы получим:
если n = 0, то
al · ak = ak+l , l ∈ Z, k ∈ N∗
a−n = a0 = (3.2.134) = 1 =
Это просто иначе записанное равенство (3.2.136),
1 1 1
= = (3.2.134) = 0 = n в котором одна из степеней неотрицательна, и
1 a a для этого случая мы его уже доказали.
а если n ∈ −N∗ , то есть n = −k, k ∈ N∗ , то по- 2. Проверим степенные законы. Они все до-
скольку (3.2.135) уже доказано для положитель- казываются сначала для неотрицательных степе-
ных степеней, должно выполняться a−k = a1k , ней индукцией, а затем для отрицательных сте-
1
или, что то же самое, a−k = ak , поэтому пеней выводятся из уже доказанных формул. На-
пример, формулу (3.2.137) нужно доказать сна-
−n k 1 1 чала для n ∈ N индукцией:
a = a = −k = n
a a
Для доказательства (3.2.136) нам понадобит- 10 = (3.2.132) = 1,
ся следующее вспомогательное тождество: 1n+1 = (3.2.132) = |{z}
1n ·1 = 1 · 1 = 1
=

am+1 = am · a, m∈Z (3.2.147) 1,


посылка
При m ∈ N оно является просто частью опреде- индукции

ления (3.2.132), поэтому для его доказательства


нам нужно лишь проверить, что оно верно при А отсюда уже ∗
становится ясно, что она верна и

m ∈ −N , то есть при m = −k, где k ∈ N :∗ при n ∈ −N , то есть при n = −k, k ∈ N∗ :
k
a1−k = a−k · a, k ∈ N∗ 1n = 1−k = (3.2.133) = 1−1 =
Если сделать замену k − 1 = n, n ∈ N, то мы = (3.1.18) = 1| k {z
= 1}
получим эквивалентную формулу для k > 0
уже
a−n = a−n−1 · a, n∈N доказано
§ 2. Натуральные, целые и рациональные числа 217

Точно так же формула (3.2.138) доказывается Это доказывает формулу (3.2.140) для случая
сначала для n ∈ N индукцией: m ∈ Z и n ∈ N. Если же n ∈ −N∗ , то есть n = k,
 0 k ∈ N∗ , то мы получаем:
1 (3.2.132) 1 (3.2.132) 1
= 1= = ,
a 1 a0 здесь применяется
 n+1  n (3.2.140),
1 (3.2.132) 1 1 1 1 (3.1.46) уже доказанное
= · = n· = для k > 0
a a a a a z }| {
| {z } 1 1 (3.2.135)
m n m −k (3.2.135)
(a ) = (a ) = = m·k =

=
1
an ,
(am )k a
посылка
индукции = a−m·k = am·(−k) = am·n
1 (3.2.132) 1
= = 4. Формулу (3.2.141) при n = 0 можно счи-
an · a an+1 тать следствием (3.2.134) (или можно сказать
А затем для n = −k, k ∈ N∗ мы получаем: что раньше мы отмечали это утверждение как
равенство (3.2.97)). А для остальных n ∈ N она
 n  −k
1 1 доказывается индукцией:
= = (3.2.135) =
a a
(3.2.96)
1 1 1 1 0n+1 = 0n · 0 = 0
=  = 1 = (3.2.135) = −k = n
1 k a a
| a {z
ak
} Условие сохранения знака (3.2.142) для n ∈ N
здесь применяется доказывается индукцией:
(3.2.138),
уже доказанное (3.2.132)
для k > 0 a0 = 1 > 0,
(3.2.132) (3.1.23)
Ну и формула (3.2.139) тоже доказывается an+1 = an · |{z}
|{z} a > 0
сначала для n ∈ N индукцией:

<

<
0, 0
0 (3.2.132) (3.2.132) 0 0 посылка
(a · b) = 1=1·1 = a ·b , индукции
n+1 (3.2.132)
(a · b) = (a · b) ·(a · b) = an · bn · a · b =
n
А после этого для n ∈ −N∗ , то есть для n = k,
| {z }
k ∈ N∗ , мы получаем:
=

an · bn ,
посылка
индукции ak > 0 (уже доказано)

(3.2.132) ⇓ (3.1.29)
= an · a · b n · b = an+1 · bn+1
−k (3.2.135) 1
an = a = >0
А затем для n = −k, k ∈ N∗ , получается как ak
следствие из уже доказанного: 5. Импликация (3.2.143) доказывается индук-
цией по n ∈ N∗ . При n = 1 она становится тав-
(a · b)n = (a · b)−k = (3.2.135) = тологией (то есть в ней следствие является ча-
1 1 (3.1.46) 1 1 стью посылки, и поэтому утверждение будет оче-
= = k k = · =
(a · b)k a ·b ak b k видно настолько, что в обычной речи это звучало
| {z }
здесь применяется бы глупо):
(3.2.139),
уже доказанное 0<x<y =⇒ x<y
для k > 0

= (3.2.135) = a−k · b−k = an · bn Предположим, что мы доказали (3.2.143) для


какого-то n = k
3. Докажем накопительный закон (3.2.140).
Зафиксируем m ∈ Z и проведем сначала индук- 0<x<y =⇒ xk < y k
цию по n ∈ N.
Тогда для n = k + 1 мы получим:
(3.2.132) (3.2.132)
(am )0 = 1 = a0 = a0·m ,
xk < y k , x<y
m n+1 (3.2.132) m n m m·n m
(a ) = (a ) ·a =a ·a = (3.1.33) ⇓ ⇓ (3.1.33)
| {z }
x · xk < x · y k , x · yk < y · yk
=

am·n , | {z }
посылка
индукции ⇓
(3.2.132) m·n+m m·(n+1) n k+1
= a =a x =x = x · x < x · y k < y · y k = y k+1 = y n
k
218 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Когда (3.2.143) доказано, (3.2.144) становится его Когда (3.2.148) доказано, (3.2.145) становится его
следствием: если n < 0, то есть n = −k, k > 0, то следствием – при a > 1 получаем:

0<x<y m<n

⇓ (3.2.143) ⇓

xk < y k n−m>0

⇓ (3.1.31)
⇓ (3.2.148)

1 1 an−m > 1
xn = x−k = > k = y −k = y n
xk y ⇓
6. Импликацию (3.2.145) можно доказать, на- an−m − 1 > 0
пример, с помощью следующего вспомогательно-
го утверждения: ⇓
(3.1.23)
a>1 ⇒ ∀n ∈ N∗ an > 1 (3.2.148) an − am = am (an−m − 1) > 0

Оно доказывается индукцией: подставив n = 1
m
мы получим тавтологию, a < an
Наконец, из (3.2.145) выводится (3.2.146):
a>1 ⇒ a1 = a > 1
m<n 0<a<1
а если оно верно при каком-то n = k ⇓ (3.1.35)

1
−m > −n > 1
a>1 ⇒ ak > 1 | {z a }

то при n = k + 1 мы получим ⇓
 −m  −n
(3.1.36) m 1 (3.2.145) 1
n
a =a k+1 k
a · |{z}
= |{z} a > k
a >1 a = > = an
a a
<

<

0 1

Целая и дробная части числа.


• Целой частью вещественного числа x ∈ R называется целое число [x] ∈ Z, определяемое
правилом
[x] = max{n ∈ Z : n 6 x}, (3.2.149)
то есть, максимум множества E = {n ∈ Z : n 6 x} целых чисел, не превосходящих x (по
теореме 3.2.31, такой максимум существует).

Свойства целой части:



1 . Целая часть числа x ∈ [0; 1) равна нулю:

x ∈ [0; 1) =⇒ [x] = 0 (3.2.150)

2◦ . Для любого x ∈ R справедливо двойное неравенство

[x] 6 x < [x] + 1 (3.2.151)

3◦ . При сдвиге на целое число целая часть сдвигается на это число:

[x + m] = [x] + m, x ∈ R, m ∈ Z (3.2.152)

4◦ . Тождественность на целых числах: если x ∈ Z, то [x] = x.


5◦ . Монотонность: если x, y ∈ R, то

x6y =⇒ [x] 6 [y] (3.2.153)


§ 2. Натуральные, целые и рациональные числа 219

6◦ . Сохранение двойных неравенств с целыми концами: если m, n ∈ Z и x ∈ R, то

m6x<n =⇒ m 6 [x] < n (3.2.154)

Доказательство. 1. Если x ∈ [0; 1), то с одной стороны,

0 ∈ {n ∈ Z : n 6 x} =⇒ 0 6 max{n ∈ Z : n 6 x} = [x]

а с другой –
(3.2.131)
{n ∈ Z : n 6 x} 6 x < 1 =⇒ [x] = max{n ∈ Z : n 6 x} < 1
То есть 0 6 [x] < 1. По следствию 3.2.30 это означает, что [x] = 0.
2. Обозначим E = {n ∈ Z : n 6 x}. Тогда, во-первых,

E = {n ∈ Z : n 6 x} 6 x =⇒ [x] = max E 6 x

и, во-вторых, если бы [x] + 1 6 x, то мы получили бы цепочку

[x] + 1 6 x =⇒ [x] + 1 ∈ E =⇒ [x] + 1 6 max E = [x]

Поскольку последнее невозможно, это означает, что x < [x] + 1.


3. Если x ∈ Z, то x ∈ {n ∈ Z : n 6 x} 6 x, и поэтому max{n ∈ Z : n 6 x} = x.
4. При x ∈ R, m ∈ Z получаем:

[x + m] = max{n ∈ Z : n 6 x + m} = max{n ∈ Z : n − m 6 x} =
= max{k + m : k ∈ Z & k 6 x} = max{k ∈ Z : k 6 x} + m

5. Если x 6 y, то {n ∈ Z : n 6 x} ⊆ {n ∈ Z : n 6 y}, и поэтому [x] = max{n ∈ Z : n 6 x} 6


max{n ∈ Z : n 6 y} = [y].
6. Если m 6 x, то по уже доказанным свойствам 2◦ и 3◦ , m = [m] 6 [x]. А если x < n, то для
всякого k ∈ Z условие k 6 x автоматически влечет условие k < n а это, в силу (3.2.130), влечет
условие k 6 n − 1. Отсюда

[x] = max{k ∈ Z : k 6 x} 6 max{k ∈ Z : k 6 n − 1} = n − 1 < n

• Дробной частью {x} вещественного числа x ∈ R называется разность между x и его целой
частью [x]:
{x} := x − [x] (3.2.155)

Свойства дробной части:


1◦ . Дробная часть числа x ∈ [0; 1) совпадает с x:

x ∈ [0; 1) =⇒ {x} = x (3.2.156)

2◦ . Для любого x ∈ R справедливо двойное неравенство

0 6 {x} < 1 (3.2.157)

3◦ . При сдвиге на целое число дробная часть не меняется:

{x + m} = {x}, x ∈ R, m ∈ Z (3.2.158)

Доказательство. 1. Если x ∈ [0; 1), то в силу (3.2.150), [x] = 0, поэтому {x} = x − 0 = x.


2. Неравенство (3.2.157) следует сразу из неравенства (3.2.151):

[x] 6 x < [x] + 1 =⇒ 0 6 x − [x] < 1

3. А тождество (3.2.158) – из (3.2.152):

{x + m} = (x + m) − [x + m] = (x + m) − ([x] + m) = x − [x] = {x}


220 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Десятичная запись целых чисел. Как из- называемая десятичной записью числа x ∈
вестно, натуральные числа n ∈ N (мы определи- −N∗ . Например, запись
ли N на с.199) можно записывать цифрами 0, 1,
2, 3, 4, 5, 6, 7, 8, 9. Например, записи 487 и 1204 x = −247
означают числа
расшифровывается как равенство
487 = 7 + 8 · 10 + 4 · 102 ,
−x = 2 · 102 + 4 · 101 + 7 · 101
1204 = 4 + 0 · 10 + 2 · 102 + 1 · 103 .
или, что эквивалентно, как равенство
Тот факт, что любое число n ∈ N можно запи-
сать таким образом, и что (при n 6= 0) такая x = −2 · 102 − 4 · 101 − 7 · 101
запись однозначно определяет число (то есть не
может случиться, чтобы разные числа записыва- Для доказательства теоремы 3.2.33 нам пона-
лись одинаково), следует из принципа Архиме- добятся три леммы.
да 3.2.26, принципа математической индукции и
свойств отображения x 7→ [x]. Здесь мы объяс- Лемма 3.2.34. Для всякого x ∈ R найдется на-
ним, почему это так. туральное число n ∈ N такое, что

Теорема 3.2.33. Для всякого числа x ∈ N∗ най- x < 10n+1 (3.2.161)


дется число n ∈ N и конечная последователь-
ность чисел a0 , a1 , ..., an ∈ {0; 1; 2; ...; 9} такая, Доказательство. Рассмотрим число x−1 9 . По
что принципу Архимеда 3.2.26, для него найдется
n ∈ N∗ такое, что x−1
9 6 n. Отсюда получаем
2 n
x = a0 + a1 · 10 + a2 · 10 + ... + an · 10 = следствия:
Xn x−1
k <n+1
= ak · 10 (3.2.159) 9
k=0 ⇓
Числа n и ai в этой формуле можно выбрать x − 1 < (n + 1) · 9
так, чтобы старший коэффициент был ненуле-
вым ⇓
an 6= 0, (3.2.160) x < 1 + (n + 1) · 9 6 (1 + 9)n+1 = 10n+1

и тогда представление x в виде (3.2.159) стано- здесь мы применяем
вится единственным. неравенство Бернулли
(3.2.103)
• Формула (3.2.159) называется десятичным
представлением числа x ∈ N∗ , а последова-
тельность цифр {an , an−1 , ..., a1 , a0 } – после- Лемма 3.2.35. Если x ∈ R и выполняется нера-
довательностью коэффициентов этого пред- венство
ставления. Коротко эту формулу принято за- 0 6 x < 10n+1 ,
писывать в виде
то найдется число a ∈ {0; 1; 2; ...; 9} такое, что
x = an ...a1 a0
a · 10n 6 x < (a + 1) · 10n (3.2.162)
и такая запись называется десятичной запи-
сью числа x ∈ N∗ . Например, запись Доказательство. Обозначим через a целую
часть числа 10xn :
x = 1825
h x i
расшифровывается как равенство a =
10n
x = 1 · 103 + 8 · 102 + 2 · 101 + 5 · 101 Тогда, во-первых, из свойства целой части со-
хранять неравенства с целыми концами (3.2.154)
• Если x ∈ −N∗ , то по теореме 3.2.33 число следует, что a ∈ {0; 1; 2; ...; 9},
−x ∈ N∗ представимо в виде
n
0 6 x < 10n+1
X
−x = ak · 10k

k=0
x
и для этого используется запись 0 6 n < 10
10
x = −an ...a1 a0 ⇓ (3.2.154)
§ 2. Натуральные, целые и рациональные числа 221
h x i
06 < 10 Это доказывается индукцией по n.
n
| 10
{z } 1) При n = 0 условие (3.2.164) превращает-
a ся в 0 6 x < 10, и формула (3.2.159) становится
И, во-вторых, по определению целой части верна, если положить a = x.
(3.2.151), 2) Предположим, что наше утверждение вер-
h x i h x i но при n = m − 1:
x
n
6 n
< n
+ 1 m−1
| 10
{z } 10 | 10 {z } m
X
a a+1 0 6 x < 10 ⇒ x= ak · 10k (3.2.165)
k=0
⇓ и покажем, что тогда оно верно и при n = m:
a · 10n 6 x < (a + 1) · 10n m
X
0 6 x < 10m+1 ⇒ x= ak · 10k
k=0
Лемма 3.2.36. Если число x представлено в
Действительно,
виде (3.2.159), то старший коэффициент an в
этой формуле вычисляется по формуле 0 6 x < 10m+1
h x i
an = (3.2.163) ⇓ лемма 3.2.35
10n
Доказательство. Здесь применяется формула ∃am ∈ {0; 1; 2; ...; 9} :
(3.2.107) для суммы первых членов геометриче-
am · 10m 6 x < (am + 1) · 10m
ской прогрессии:
⇓ (вычитаем am · 10m )
n−1
X n−1
X n−1
X
ak ·10k 6 9 · 10k = 9 · 10k = 0 6 x − am · 10m < 10m
|{z}  
k=0 k=0 k=0 применяем посылку

>

индукции: (3.2.165)
9
m−1
X
10n − 1 10n − 1
= (3.2.107) = 9 · =9· = x − am · 10m = ak · 10k
10 − 1 9
k=0
= 10n − 1 < 10n  
переносим am · 10m
⇓ в правую часть

m−1
X m
X
n−1
X
1 k x= ak · 10k + am · 10m = ak · 10k
06 n · ak · 10 < 1
10 k=0 k=0
k=0
2. Мы доказали, что x представимо в виде

(3.2.159). Теперь убедимся, что такое представ-
! ление единственно, с точностью до добавления
n−1
X
x 1 или исключения нулевых слагаемых (то есть сла-
= n· ak · 10k + an · 10n = гаемых со старшими коэффициентами an = 0).
10n 10
k=0
Пусть нам даны два разных представления:
n−1
1 X
= · ak · 10k + an n
X l
X
10n |{z} x= ak · 10k и x= bk · 10k
k=0
| {z }

k=0 k=0
Z

[0, 1) Добавив слагаемые с нулевыми коэффициентами


(то есть, взяв дополнительные ai = 0 или bi = 0),
⇓ можно добиться, чтобы количество слагаемых в
h x i
= an этих суммах стало одинаковым:
10n
n
X n
X
ak · 10k = bk · 10k (3.2.166)
∗ k=0 k=0
Доказательство теоремы 3.2.33. Пусть x ∈ N .
Применяя лемму 3.2.34, можно выбрать n ∈ Нам нужно проверить, что тогда
N так, чтобы выполнялось (3.2.161), то есть,
(3.2.164): ak = b k , k = 0, ..., n. (3.2.167)
n+1
0 6 x < 10 , (3.2.164)
Это также делается индукцией по n.
1. Покажем, что при выполнении этого неравен- 1) Если n = 0, то (3.2.166) сразу превращает-
ства x можно представить в виде (3.2.159). ся в (3.2.167): a0 = b0 .
222 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
 
2) Предполагаем, что это верно при n = m, применяем посылку
⇓ индукции: (3.2.168)
m
X m
X
ak · 10k = bk · 10k ⇒ ∀k = 0, ..., m ak = bk
k=0 k=0  
а при k = m + 1 равенство
⇒ ∀k = 0, ..., m ak = b k (3.2.168) ak = bk уже доказано.

тогда для n = m + 1 получаем: 3. Остается убедиться, что если x 6= 0, то n


m+1 m+1
можно выбрать так, чтобы an 6= 0. Для этого
X X можно рассмотреть множество E, состоящее из
k k
ak · 10 = bk · 10 (3.2.169)
тех n ∈ N, для которых справедливо представ-
k=0 k=0
ление (3.2.159) и найти его минимум n = min E.
⇓ (лемма 3.2.36) Тогда an 6= 0, потому что иначе мы получили бы,
"m+1 # "m+1 #
X X что старшее слагаемое в (3.2.159) можно выбро-
am+1 = ak · 10k = bk · 10k = bm+1 сить,
k=0 k=0
старшие слагаемые
! n−1
X n−1
X
⇓ в (3.2.169) равны, x= ak · 10k + an · 10n = ak · 10k
и их можно | {z }
отбросить k=0 0 k=0

m
X m
X
ak · 10k = bk · 10k и это означало бы, что n − 1 ∈ E (то есть n не
k=0 k=0
может быть минимумом E).

(c) Деление с остатком и делимость


Деление с остатком.
Теорема 3.2.37 (о делении с остатком). Для любых двух чисел a ∈ R и b > 0 существуют и
единственны числа q ∈ Z и r ∈ [0; b) такие, что

a = b · q + r, (3.2.170)

Если вдобавок a ∈ Z и b ∈ N∗ , то r ∈ N.
Доказательство. Числа q и r можно определить формулами
hai nao
q= , r =b·
b b
Тогда по определению целой части q ∈ Z, а по определению дробной части, rb ∈ [0; 1), и значит
r ∈ [0, b). Нам остается доказать, что такие числа q и r единственны. Предположим, что существуют
два разложения одного числа a:
a = b · q + r = b · q̃ + r̃
Тогда
r r̃
= q̃ + q+
b b
Из этого следует, что q = q̃, потому что если бы это было не так, то есть например q < q̃, то, по
свойству (3.2.130), мы получили бы, что q + 1 6 q̃, и поскольку rb < 1,

r r̃
q+ < q + 1 6 q̃ 6 q̃ +
b b
А с другой стороны, равенство rb = q̃ − q + r̃b означает, что rb и q̃ − q + r̃b отличаются на целое число
q̃ − q, поэтому  
r nro r̃ r̃
= = q̃ − q + = (3.2.158) = ,
b b b b
и отсюда r = r̃.
Остается заметить, что поскольку q ∈ Z, то при a ∈ Z и b ∈ N∗ число r = a − b · q должно быть
целым.
§ 2. Натуральные, целые и рациональные числа 223

Делимость в множестве N∗ положитель- коротко это записывается формулой


ных натуральных чисел.
x ... A.
• Говорят что число a ∈ N∗ делится на число
b ∈ N∗ , и записывают это формулой Множество всех общих кратных для A обо-
значается A▽ :
a ... b,
A▽ := {x ∈ N∗ : x ... A} =
если найдется число m ∈ N∗ такое, что = {x ∈ N∗ : ∀a ∈ A x ... a} (3.2.171)

a = m · b. Очевидно,
A▽ ... A (3.2.172)
В этом случае • Hаименьшее общее кратное множества A (то
— число a называется кратным числа b, есть наименьшее число среди всех x ∈ A▽ )
обозначается ▽(A):
— число b называется делителем числа a.
• Если A ⊆ N∗ и B ⊆ N∗ – множества, то записи ▽(A) := min A▽ =
= min{x ∈ N∗ : ∀a ∈ A x ... a} (3.2.173)
A ... b, a ... B, A ... B
В частном случае, когда A состоит из двух
означают соответственно, что a ... b выполня- элементов a и b, наименьшее общее кратное
ется для любого a ∈ A, для любого b ∈ B, и множества A называется наименьшим общим
для любых a ∈ A и b ∈ B. кратным чисел a и b и обозначается

⋄ 3.2.38. Следующие утверждения можно про- a ▽ b := ▽{a, b} =


верить, например, с помощью калькулятора: = min{x ∈ N∗ : x ... a & x ... b} (3.2.174)
6 ... 2, 123 ... 3, 430095 ... 541 Предложение 3.2.40. Следующее соотноше-
ние справедливо для любых двух множеств A ⊆
N∗ и B ⊆ N∗ :
Свойства отношения делимости:
(A ∪ B)▽ = A▽ ∩ B ▽ (3.2.175)
1◦ . Всегда x ... 1 и x ... x.
Доказательство.
2◦ . Если x ... y, то (a · x) ... y для любого
a ∈ N∗ . x ∈ (A ∪ B)▽
3◦ . Если x ... y и y ... z, то x ... z. m
4◦ . Если x ... a и y ... a, то (x + y) ... a, а если .
.
x . (A ∪ B)
вдобавок x > y, то (x − y) ... a.
m
5◦ . Если x ... y, то x > y.
.
.
x.A & x ... B
Доказательство этих свойств мы оставляем
m
читателю.

x∈A & x ∈ B▽
⊲⊲ 3.2.39. Докажите методом математической
m
индукции9 :
x ∈ A▽ ∩ B ▽
1) n5 − n ... 5 при любом n ∈ N∗ ;
2) n7 − n ... 7 при любом n ∈ N∗ ;
3) n · (2n2 − 3n + 1) ... 6 при любом n ∈ N∗ ; ! 3.2.41. Если в формуле (3.2.175) поменять ме-
n+1 2n−1 .. ∗ стами ∪ и ∩, она перестает быть верной:
4) 11 + 12 . 133 при любом n ∈ N ;
.
5) 5 · 23n−2 + 33n−1 .. 19 при любом n ∈ N∗ . (A ∩ B)▽ 6= A▽ ∪ B ▽
Например, при A = {2} и B = {3} мы получаем
Наибольший общий делитель и наимень-
шее общее кратное. Пусть A ⊆ N∗ . ({2} ∩ {3})▽ = ∅▽ = N∗ ,
• Число x ∈ N∗ называется общим кратным но
множества A, если оно кратно любому числу {2}▽ ∪ {3}▽ = 2N∗ ∪ 3N∗
a ∈ A (то есть делится на любое a ∈ A): Это не одно и то же, потому что, например,
∀a ∈ A x ... a, 5 ∈ N∗ / 2N∗ ∪ 3N∗
& 5∈
9В первых двух примерах нужно использовать бином Ньютона.
224 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Предложение 3.2.42. Если A конечно (необя- Предложение 3.2.43. Следующее соотноше-


зательно непусто), то A▽ непусто, и поэтому ние справедливо для любых двух множеств A ⊆
существует наименьшее общее кратное ▽(A). N∗ и B ⊆ N∗ :
Доказательство. Если A пусто, то число 1 бу- (A ∪ B)△ = A△ ∩ B △ . (3.2.180)
дет его общим кратным, поскольку при a ∈ A
условие 1 ... a выполняется тривиально (из-за от- Доказательство. Это доказывается по анало-
сутствия таких a). Если же A непусто, то, по- гии с предложением 3.2.40:
скольку оно конечно, его можно представить в
виде конечной последовательности (с неповторя- x ∈ (A ∪ B)△
ющимися элементами)
m
A = {a1 , ..., an }
(A ∪ B) ... x
а затем рассмотреть произведение всех чисел,
входящих в A m
Y Yn A ... x & B ... x
x= a= ai
a∈A i=1 m

Это число делится на любой элемент a ∈ A, то x ∈ A△ & x ∈ B△


есть является общим кратным для множества A:
m
x ∈ A▽
x ∈ A△ ∩ B △
Значит, множество A▽ непусто. Как любое непу-
стое подмножество в N∗ , оно, в силу свойства 5◦
на с.201, должно иметь минимальный элемент ! 3.2.44. Если в формуле (3.2.180) поменять ме-
min A▽ = ▽(A). стами ∪ и ∩, то она перестает быть верной:
Снова пусть A ⊆ N∗ . (A ∩ B)△ 6= A△ ∪ B △

• Число x ∈ N называется общим делителем
множества A, если оно является делителем Например, при A = {2} и B = {3} мы получаем
для любого числа a ∈ A (то есть любое a ∈ A
делится на x): ({2} ∩ {3})△ = ∅△ = N∗ ,

∀a ∈ A a ... x, но
{2}△ ∪ {3}△ = {1, 2} ∪ {1, 3} = {1}.
коротко это записывается формулой
Предложение 3.2.45. Если A непусто (необя-
A ... x. зательно конечно), то A△ непусто и конечно, и
Множество всех общих делителей для A обо- поэтому существует наибольший общий дели-
значается A△ : тель △ (A).

Доказательство. Число 1, очевидно, является


A△ := {x ∈ N∗ : A ... x} =
общим делителем для множества A:
= {x ∈ N∗ : ∀a ∈ A a ... x} (3.2.176)
A ... 1
Очевидно,
A ... A△ (3.2.177) Это значит, что 1 ∈ A△ , и поэтому A△ непусто. С
• Наибольший общий делитель множества A другой стороны, если взять какое-нибудь a ∈ A
(то есть наибольшее число среди всех x ∈ A△ ) (поскольку A непусто, такое a найдется), то мы
обозначается △ (A): получим:
5◦ на
△ (A) = max A△ = с.223
= max{x ∈ N∗ : ∀a ∈ A a ... x} (3.2.178) ↓
A△ ⊆ {a}△ ⊆ {1, ..., a}
В частном случае, когда A состоит из двух
элементов a и b, наибольший общий делитель То есть A△ содержится в конечном множестве
множества A называется наибольшим общим {1, ..., a}. Значит, по свойству 1◦ на с.69, A△ са-
делителем чисел a и b и обозначается мо конечно. После этого применяется теорема
3.2.27: поскольку множество A△ конечно, оно
∗ .
. .
.
a △ b := max{x ∈ N : a . x & b . x} (3.2.179) имеет максимальный элемент.
§ 2. Натуральные, целые и рациональные числа 225

Теорема 3.2.46. Следующие соотношения Поэтому нужно доказать только два крайних со-
справедливы для любого непустого конечного отношения:
A ⊆ N∗ :
A▽ ... ▽(A), △ (A) ... A△ .
▽(A) > maxA > min A >△ (A), (3.2.181)
Мы будем их доказывать вместе с соотношения-
▽ .. .
. .
. .
. △
A . ▽(A) . A . △ (A) . A , (3.2.182) ми (3.2.183) и (3.2.184), причем в следующей по-
△ (A) = ▽(A△ ), (3.2.183) следовательности:
▽(A) =△ (A▽ ). (3.2.184) A▽ ... ▽(A) (3.2.186)
Доказательство. 1. В цепочке (3.2.181) нужно ⇓
проверить два крайних неравенства.
△ (A) = ▽(A△ )
▽(A) > max A, min A >△ (A) ⇓
Они оба следуют из свойства 5◦ на с.223. Напри-
мер, первое: △ (A) ... A△ (3.2.187)
x ∈ A▽ ⇓
⇓ ▽(A) =△ (A▽ )
x ... A 3. Докажем первое звено в этой цепочке, то
есть формулу (3.2.186). Пусть x ∈ A▽ , то есть
⇓ 5◦ на с.223
x ... A. Нам нужно показать, что x ... ▽(A). Разде-
x>A лим x на ▽(A) с остатком: по теореме 3.2.37, су-
ществуют q ∈ Z и r ∈ Z такие, что

x > max A x = ▽(A) · q + r, 0 6 r < ▽(A)

Это верно для любого x ∈ A▽ , значит Если r = 0, то мы сразу получаем, что x ... ▽(A).
Если же r > 0, то для всякого a ∈ A мы получаем
▽(A) = min A▽ = min▽ x > max A, цепочку:
x∈A
▽(A) ... A (уже доказано)
И то же самое со вторым:

x ∈ A△
x ... a, ▽(A) · q ... a, x > ▽(A)
| {z }

⇓ 4◦ на с.223
A ... x
r = x − ▽(A) · q ... a
⇓ ◦
5 на с.223
Это верно для любого a ∈ A, значит r – общее
A>x кратное для A:
r ... A

или, что то же самое,
min A > x
r ∈ A▽
Это верно для любого x ∈ A△ , значит
С другой стороны,
min A > max△ x = max A△ =△ (A)
x∈A
r < ▽(A) = min A▽
2. В цепочке (3.2.182) середина очевидна:
Это противоречие означает, что наше предполо-
▽(A) ... A ... △ (A) (3.2.185) жение, что r > 0, было неверно.
4. Докажем (3.2.183), то есть второе звено в
– с одной стороны, нашей цепочке. Для этого расшифруем уже до-
казанную формулу (3.2.186) так:
▽ ..
| {z. A}
A ⇒ ▽(A) = min A▽ ... A
x ... A ⇒ x ... ▽(A) (3.2.188)
(3.2.172)

Тогда из (3.2.177) мы получаем цепочку:


а с другой,
... A△ A ... A△
|A {z } ⇒ A ... max A△ =△ (A)
(3.2.177) ⇓
226 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

∀a ∈ A a ... A△ Теорема 3.2.47. Для любых a, b ∈ N∗ справед-


ливы импликации
⇓ (3.2.188)
 . 
∀a ∈ A a ... ▽(A△ ) x .. a
⇒ x ... (a ▽ b) (3.2.192)
x ... b
⇓  . 
a .. x
.
A .. ▽(A△ ) ⇒ (a △ b) ... x (3.2.193)
b ... x

и равенство

▽(A△ ) ∈ A△ (3.2.189) (a ▽ b) · (a △ b) = a · b (3.2.194)


С другой стороны, из (3.2.185) получаем:
Доказательство. 1. Импликации следуют из со-
▽(A△ ) ... A△ отношений (3.2.182):

⇓ A▽ ... ▽(A)
▽(A△ ) > A△ ⇓
Вместе с (3.2.189) это означает, что
{a; b} ... ▽{a; b}

▽(A△ ) = max A△ =△ (A), ⇓


то есть как раз справедливо (3.2.183). x ∈ {a; b}▽ ⇒ x ... ▽{a; b} = (a ▽ b)
5. Теперь формула (3.2.187), то есть третье
звено в нашей цепочке, получается в одну строч- ⇓
ку:
(3.2.185)
x ... {a; b} ⇒ x ... ▽{a; b} = (a ▽ b)
△ (A) = ▽(A△ ) ... A△
(3.2.183)

6. Остается доказать последнее звено цепоч-
ки – формулу (3.2.184). Здесь последователь- (3.2.192)
ность рассуждений напоминает пункт 4. Сначала И точно так же,
расшифруем уже доказанную формулу (3.2.187)
так: △ (A) ... A△
A ... x ⇒ △ (A) ... x (3.2.190)

Тогда из (3.2.172) мы получаем цепочку:
△ {a; b} ... {a; b}△
A▽ ... A


x ∈ {a; b} △
⇒ △ {a; b} ... x
∀a ∈ A A▽ ... a

⇓ (3.2.190)
x ... {a; b} ⇒ (a △ b) =△ {a; b} ... x
∀a ∈ A △ (A▽ ) ... a
⇓ ⇓

△ (A▽ ) ... A (3.2.193)


⇓ 2. Чтобы доказать (3.2.194), обозначим

a·b
△ (A▽ ) ∈ A▽ (3.2.191) x=
a▽b
С другой стороны, из (3.2.185) получаем:
и заметим, что x ∈ N∗ , потому что
A ... △ (A▽ )

(a · b) ... a, (a · b) ... b
| {z }

A▽ >△ (A▽ ) ⇓ (3.2.192)
Вместе с (3.2.191) это означает, что (a · b) ... (a ▽ b)

△ (A▽ ) = min A▽ = ▽(A), Нам нужно убедиться, что

то есть как раз справедливо (3.2.184). x=a△b


§ 2. Натуральные, целые и рациональные числа 227

Для этого отдельно докажем два неравенства • Числа a, b ∈ N∗ называются взаимно просты-
ми, если они имеют только один общий дели-
a △ b > x, x>a△b тель, а именно, число 1:
Первое из них доказывается такой цепочкой: {a, b}△ = {1}
a▽b a▽b
a=x· , b=x· Понятно, что это равносильно тому, что их
| b {z a }
наибольший общий делитель равен единице:
⇓ a △ b = 1.
.
a .. x, b ... x
| {z } Это в свою очередь означает, что
⇓ (3.2.193)
a ▽ b = a · b, (3.2.195)
(a △ b) ... x
⇓ поскольку
(3.2.194)
a△b>x (a ▽ b) · (a △ b) = a·b
| {z }
А второе так: 1

a·b b a·b a ⋄ 3.2.49. Если a и b – два различных простых


=a· , = ·b
|a △ b a △ b {z a △ b a△b } числа, то они взаимно просты, потому что

⇓ a△ = {1; a}, b△ = {1; b}


a · b .. a·b ... b ⇓
. a,
a
| △ b {z a △b }
⇓ (3.2.192) {a, b}△ = (3.2.180) = {a}△ ∩ {b}△ =
a · b .. = {1; a} ∩ {1; b} = {1}
. (a ▽ b)
a△b
⇓ Предложение 3.2.50. Если a и b – взаимно
простые числа, то для любого x ∈ N∗
a·b
> a▽b
a△b (x · a) ... b ⇐⇒ x ... b

Доказательство. В обратную сторону это сле-
a·b
x= >a△b дует из 2◦ на с.223:
a▽b
(x · a) ... b ⇐= x ... b

Основная теорема арифметики. Покажем, что она верна в прямую сторону:

• Число a ∈ N∗ , a > 1, называется (x · a) ... b =⇒ x ... b


— простым, если оно делится только на 1 и Для этого нужно добавить к (x · a) ... b очевидное
на a: соотношение (x · a) ... a:
a△ = {1; a}
— составным, если кроме 1 и a у него есть (x · a) ... b
еще какие-то делители:

a△ 6= {1; a} (x · a) . a & (x · a) ... b
.
.
| {z }
⋄ 3.2.48. Число 2 является простым, потому что
⇓ (3.2.192)
2 ... x
(x · a) ... a ▽ b
(3.2.195)
= a·b
⇓ ⇓
16x62 x x·a
= ∈ N∗
⇓ b a·b

x ∈ {1; 2}.
x ... b
То есть
2△ = {1; 2}
228 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Предложение 3.2.51. Если произведение про- Доказательство. Проведем индукцию по x ∈


стых чисел N∗ , x > 2.
a1 · a2 · ... · an 1. Пусть x = 2. Тогда в виде (3.2.197) его мож-
но представить так:
делится на простое число b, то b содержится
в последовательности a1 , ..., an : 2 = 21
(то есть в данном случае k = 1, p1 = 2, n1 = 1).
∃i ∈ {1, ..., n} ai = b Единственность такого разложения следует из
того, что, как мы убедились в примере 3.2.48,
Доказательство. Это доказывается индукцией число 2 простое: если
по n.
2 = q1m1 · q2m2 · ... · qlml (3.2.198)
1. При n = 1 утверждение становится триви-
альным: – какое-нибудь другое разложение, то мы во-
a1 ... b первых получим, что все числа qi должны быть
одинаковыми и равными двойке, потому что
⇓ 2 ... q i

b ∈ {a1 } = {1; a1 } ⇓
qi ∈ 2△ = {1; 2}
⇓ (b > 1)
⇓ (qi > 1)
b = a1 qi = 2
2. Предположим, что оно верно при n = k: То есть разложение (3.2.198) должно иметь вид
  2 = 2m
a1 · a2 · ... · ak ... b ⇒ ∃i = 1, ..., k ai = b И, во-вторых, здесь m должно быть равно 1, по-
(3.2.196) тому что иначе, то есть при m > 1, мы получили
3. Покажем, что тогда оно будет верно и при бы
(3.2.145)
n = k + 1. Пусть 2 = 21 < 2m
a1 · a2 · ... · ak · ak+1 ... b 2. Предположим далее, что наше утвержде-
ние верно при всех x, меньших некоторого N ,
Если b = ak+1 , то наше утверждение доказано. x < N.
Если же b 6= ak+1 , то обозначив x = a1 · a2 · ... · ak ,
мы получим: Покажем тогда, что оно верно и при x = N .
. Здесь придется рассмотреть два случая. Во-
x · ak+1 .. b,
первых, если x = N – простое число, то наше
причем ak+1 и b простые, не совпадающие чис- утверждение для него верно по тем же причи-
ла, и значит, в силу примера 3.2.49, взаимно про- нам, по которым оно было верно для уже рас-
стые. Поэтому по предложению 3.2.50, x должно смотренного случая x = 2: те же рассуждения,
делиться на b: но с заменой 2 на N приводят к тому же резуль-
тату.
x = a1 · a2 · ... · ak ... b Во-вторых, если x = N – составное число, то
есть
Но тогда по предположению индукции (3.2.196), N = K ·L (K, L ∈ N∗ , K, L > 1)
b = ai для некоторого i = 1, ..., k. То есть в лю-
бом случае мы получаем b = ai для некоторого то
i = 1, ..., k, k + 1. K < N, L<N
поэтому по предположению индукции числа K
Теорема 3.2.52 (основная теорема арифмети- и L раскладываются по формуле (3.2.197). От-

ки). Каждое число x ∈ N , x > 1, можно един- сюда можно сделать вывод, что их произведе-
ственным образом разложить в произведение ние N = K · L тоже раскладывается по формуле
(3.2.197).
x = pn1 1 · pn2 2 · ... · pnk k , (3.2.197) Остается только объяснить, почему для тако-
го N разложение будет единственно. Предполо-
в котором k и {n1 , n2 , ..., nk } – натуральные чис- жим, что этих разложений имеется два:
ла, а {p1 , p2 , ..., pk } – простые, расположенные в
N = pn1 1 · ... · pnk k = q1m1 · ... · qlml (3.2.199)
порядке возрастания:
Поглядим на это с точки зрения предложения
p1 < p2 < ... < pk 3.2.51: число N делится на простое число q1 , а, с
§ 2. Натуральные, целые и рациональные числа 229

другой стороны, N является произведением про- принадлежит последовательности q2 , ..., ql (пото-


стых чисел p1 , ..., pk (с разными степенями). Зна- му что p1 = q1 меньше любого из этих чисел). И
чит, среди чисел p1 , ..., pk какое-то должно быть точно так же, если бы n1 < m1 , то поделив на
равно q1 : pn1 1 , мы получили бы

∃i ∈ {1, ..., k} pi = q1 N
= pn2 2 · ... · pnk k = p1m1 −n1 · q2m2 · ... · qlml
pn1 1
По той же причине среди чисел q1 , ..., ql какое-то
должно быть равно p1 : то есть произведение простых чисел p2 , ..., pk (с
разными степенями), делилось бы на простое
∃j ∈ {1, ..., l} qj = p1
число p1 , которое не принадлежит последова-
Поскольку числа p1 , ..., pk упорядочены по воз- тельности p2 , ..., pk (потому что p1 меньше лю-
растанию, получаем бого из этих чисел).
Итак, n1 = m1 , и поэтому разложение
p1 6 pi = q1 (3.2.199) можно переписать так:

С другой стороны, числа q1 , ..., ql тоже упорядо- N = pn1 1 · pn2 2 · ... · pnk k = pn1 1 ·q2n2 · ... · qlml
чены по возрастанию, и поэтому |{z}
q1 и m1
заменены
q1 6 qj = p1 на p1 и n1

Вместе это означает, что Поделим это на pn1 1 :


p1 = q1 N
= pn2 2 · ... · pnk k = q2m2 · ... · qlml
откуда следует, что i = 1 = j. pn1 1
Теперь разложение (3.2.199) можно записать Из p > 1 и n > 0 следует, что pn1 > 1, поэтому
1 1 1
так:
N
N = pn1 1 · pn2 2 · ... · pnk k = pm 1
·q2n2 · ... · qlml <N
1
|{z} pn1 1
q1
заменено
на p1
и по предположению индукции, для числа pN n1
1
разложение (3.2.197) должно быть единственно.
Отсюда можно вывести, что n1 = m1 . Действи- То есть,
тельно, если бы оказалось, что n1 > m1 , то поде-  
лив на pm
1 , мы получили бы
1
k=l & ∀i = 2, ..., k pi = qi & ni = mi
N
= p1n1 −m1 · pn2 2 · ... · pnk k = q2m2 · ... · qlml
С другой стороны, равенства p1 = q1 и n1 = m1
pm
1
1

мы уже доказали раньше. То есть в формуле


и оказалось бы, что это число, будучи произве- (3.2.199) числа справа и слева от последнего ра-
дением простых чисел q2 , ..., ql (с разными степе- венства совпадают, и это значит, что разложение
нями), делится на простое число p1 , которое не N на множители однозначно.

(d) Рациональные числа Q


Определение и свойства рациональных чисел.
• Число x ∈ R называется рациональным, если оно представимо в виде
a
x= , a ∈ Z, b ∈ N∗
b
В соответствии с этим, множество рациональных чисел, обозначаемое символом Q, опи-
сывается формулой
Z
Q= ∗ (3.2.200)
N

Свойства множества Q:
1◦ . Сумма x + y двух рациональных чисел x и y, также является рациональным числом:
x, y ∈ Q =⇒ x+y ∈Q (3.2.201)
230 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

2◦ . Число −x, противоположное рациональному числу x, также является рациональным


числом:
x∈Q =⇒ −x ∈ Q (3.2.202)
3◦ . Произведение x · y двух рациональных чисел x и y, также является рациональным чис-
лом:
x, y ∈ Q =⇒ x · y ∈ Q (3.2.203)
4◦ . Число x−1 , обратное рациональному числу x 6= 0, также является рациональным чис-
лом:
x ∈ Q \ {0} =⇒ x−1 ∈ Q (3.2.204)
Теорема 3.2.53. В любом интервале (a, b) (с a < b) на вещественной прямой R найдутся рацио-
нальные числа.
Доказательство. Пользуясь принципом Архимеда (теорема 3.2.26), подберем число n ∈ N такое,
что
1
n>
b−a
и положим
m = [a · n] + 1
Тогда
m
<b a<
n
Левое неравенство здесь доказывается напрямую:
(3.2.151) m
a·n < [a · n] + 1 = m =⇒ a<
n
m
А правое – от противного: если бы оказалось, что b 6 n, то мы получили бы

(3.2.151) [a · n] m [a · n] + 1 [a · n] 1
[a · n] 6 a·n =⇒ 6a<b6 = = + =⇒
n  n n  n n
[a · n] [a · n] 1 1 1
=⇒ [a, b] ⊆ , + ⇒ b−a6 =⇒ n6 ,
n n n n b−a

и последнее противоречит выбору n.

Несократимые дроби. Остается проверить, что p △ q = 1. Это делается


так:
Теорема 3.2.54. Всякое положительное раци-
x ∈ {p; q}△
ональное число x ∈ Q представимо в виде дро-
би, в которой числитель и знаменатель взаим- ⇓
 . 
но просты: p .. x
p q ... x
x= , p, q ∈ N∗ , p △ q = 1 (3.2.205)
q ⇓
 
• Такие дроби называются несократи- a = p · (a △ b) ... x · (a △ b)
.
b = q · (a △ b) .. x · (a △ b)
мыми.

Доказательство. Поскольку x рационально,
оно имеет вид x = ab , где a ∈ Z и b ∈ N∗ . С x · (a △ b) ∈ {a; b}△
другой стороны, x положительно, поэтому a то- ⇓
же должно быть положительно, и значит a ∈ N∗ .
x · (a △ b) 6 max{a; b}△ = (a △ b)
Поскольку a ... (a △ b) и b ... (a △ b), числа

a b
,p= q= x61
a△b a△b
Из этой цепочки видно, что
должны быть натуральными. Понятно, что
a a
p p △ q = max{p; q}△ = 1
a△b
x= = b
=
b a△b
q
§ 2. Натуральные, целые и рациональные числа 231

Существование иррациональных чисел. Тогда число ε = 2 − c2 будет положительно:


• Число x ∈ R называется иррациональным, ес- ε = 2 − c2 > 0
ли оно не является рациональным:
Отсюда сразу следует, что
/Q
x∈
ε
c+ >c>X
Следующий пример показывает, что такие числа 3c
в самом деле существуют. ε
и следовательно число c + 3c не лежит в X. Но
⋄ 3.2.55. Существует число c ∈ [1; 2], удовлетво- с другой стороны,
10
ряющее условию
(3.2.207)
2
c = 2, (3.2.206) ⇓ (3.2.207)
1 6 c2 ⇓
1
и это число иррационально: ⇓ 0< c 61
−c2 6 −1 ⇓
1
/Q
c∈ ⇓ 0< c2 61
ε = 2 − c2 6 2 − 1 = 1
Доказательство. 1. Рассмотрим два множества: | {z }


X = {x ∈ R : x>0 & x2 6 2}

Y = {y ∈ R : y>0 & y 2 > 2}  ε 2 c · ε  ε 2


c+ = c2 + 2 · + =
Заметим, что 1 ∈ X и 2 ∈ Y , поэтому X и Y 3c 3·c 3c
2 1 1 2 1
непустые. Докажем неравенство для множеств = c2 + ·ε+ · 2 · |{z}ε2 6 c2 + ·ε+ ·ε =
3 9 |{z}
|{z} c 3 3
X 6Y

6
ε,
6

6
1 1
3 так как
Действительно, если бы для каких-то x ∈ X и 0<ε61
y ∈ Y выполнялось обратное неравенство = c2 + ε = c2 + (2 − c2 ) = 2
x > y, То есть
ε  ε 2
то, поскольку y > 0, по свойству степенного отоб- c+ >c>0 & c+ 62
ражения (3.2.143), мы получили бы 3c 3c
ε
и это значит, что число c + 3c наоборот лежит в
x2 > y 2
X. Это противоречие означает, что наше предпо-
при том что из условий x ∈ X и y ∈ Y следует ложение (3.2.208) было неверным.
Предположим, наоборот, что
x2 6 2 6 y 2 .
c2 > 2 (3.2.209)
Из неравенства X 6 Y , в силу аксиомы непре-
Тогда число ε = c2 − 2 будет положительно
рывности A16, следует, что найдется число c ∈ R,
лежащее между X и Y : ε = c2 − 2 > 0
X 6c6Y Отсюда сразу следует, что
Заметим сразу, что, поскольку 1 ∈ X и 2 ∈ Y , ε
c− <c6Y
число c должно удовлетворять условию 3c
ε
и поэтому число c− 3c не лежит в Y . Но с другой
16c62 (3.2.207)
стороны, во-первых,
2. Покажем, что ε c2 − 2 2c2 + 2
c− =c− = >0
c2 = 2 3c 3c 3c
И, во-вторых,
Предположим, что это не так, например, пусть
 ε 2 2 · ε  ε 2
2
c <2 (3.2.208) c− = c2 − + =

3c 3 3c
10 Читатель, конечно, узнает в числе c из примера 3.2.55 число 2. Мы не вставляем это в формулировку, потому
что понятие корня будет определено нами только в § 1 главы 5.
232 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

ε  ε 2 Рациональные числа с нечетным знаме-


= c2 − ε + + > c2 − ε = c2 − (c2 − 2) = 2
3 3c
| {z } нателем 2N∗Z−1 . Напомним, что выше форму-
лой (3.1.50) мы определили умножение числово-

<
0 го множества X на число a:
То есть мы получаем
 a · X = {y ∈ R : ∃x ∈ X a · x = y}
ε ε 2
c− >0 & c− >2
3c 3c формулой (3.1.49) – сдвиг множества
ε
и это значит, что число c − 3c наоборот лежит
в Y . Это противоречие говорит о том, что наше X − a = {y ∈ R : ∃x ∈ X x − a = y},
предположение (3.2.209) тоже было неверным.
3. Нам осталось доказать, что число c ирра- а формулой (3.1.55) – частное числовых мно-
ционально. Предположим, что оно рационально: жеств:
 
c∈Q X x
= z ∈ R : ∃x ∈ X ∃y ∈ Y =z
Тогда, поскольку c > 0, по теореме 3.2.54 это Y y
число можно представить в виде несократимой
Этого достаточно, чтобы сообразить, что пони-
дроби
m мается под множеством 2N∗Z−1 , о котором мы по-
c= , m△n=1 ведем речь здесь, но перед тем, как приступить
n
Мы получаем цепочку: собственно к изучению его свойств, мы рассмот-
рим несколько подготовительных примеров.
m2 2
=c =2
n2 ⋄ 3.2.56. Множество четных натуральных чисел
⇓ {2, 4, 6, 8, ...} = {2n; n ∈ N∗ } удобно записывать
2
m = 2·n 2 в виде
2N∗ .

m2 ... 2 Точно также множество нечетных натуральных
чисел {1, 3, 5, 7, ...} = {2n − 1; n ∈ N∗ } удобно

записывать в виде
в разложении (3.2.197) числа m2
имеется множитель 2s , s ∈ N∗ 2N∗ − 1.

в разложении (3.2.197) числа m ⋄ 3.2.57. Выше мы уже приводили формулу
t
имеется множитель 2 , t ∈ N ∗ (3.2.200)
Z
⇓ Q = ∗,
N
m ... 2 которую можно рассматривать, как определение
⇓ множества рациональных чисел Q.
m = 2 · k, k>1
⋄ 3.2.58. Непривычному взгляду не сразу будет
⇓ очевидной справедливость равенства
4 · k 2 = m2 = 2 · n 2
Z
⇓ Q= (3.2.210)
2N∗
2 2
2·k =n
Доказательство. Ясно, что выполняется вклю-

чение
n2 ... 2 Z
⊆Q
⇓ 2N∗
по тем же причинам, что и для m, Покажем, что верно и обратное включение:
в разложении (3.2.197) числа n
Z
должен быть множитель 2r , r ∈ N∗ Q⊆
2N∗

n ... 2 Действительно, если r = pq ∈ Q, p ∈ Z, q ∈ N∗ , то
положив m = 2p, мы получим:
Мы получаем, что оба числа m и n делятся на
2. Это противоречит тому, что у них наиболь- p m
r= = , m ∈ Z, q ∈ N∗
ший общий делитель равен 1. Это означает, что q 2q
наше предположение о рациональности c было
ошибочным. То есть r ∈ 2NZ∗ .
§ 2. Натуральные, целые и рациональные числа 233

⊲ 3.2.59. Докажите равенства: знаменатель (и, возможно, знак минус перед дро-
бью), утверждение 2◦ в этом списке не будет
2Z
=Q справедливо: равенство
2N∗

N 1 1
= {r ∈ Q : r > 0} + =1
N∗ 2 2
⋄ 3.2.60. После примера 3.2.58 можно было бы означает, что множество таких чисел не замкну-
ожидать, что если заменить в (3.2.210) четные то относительно сложения. Однако, утвержде-
◦ ◦
числа 2N∗ на нечетные 2N∗ −1, то равенство оста- ния 1 и 3 для этого класса все же будут вы-
нется верным. Но это не так: полняться.

Z • Рациональное число x с нечетным знаменате-


Q 6= лем называется
2N∗ − 1
Доказательство. Число 21 лежит в Q, но не в — четным, если его можно представить в ви-
Z де дроби с четным числителем и нечетным
2N∗ −1 (потому что его невозможно представить знаменателем:
целое
в виде нечетное ).
2m
• Число x ∈ Q называется рациональным чис- x= , m ∈ Z, n ∈ N∗
2n − 1
лом с нечетным знаменателем, если его
это равносильно тому, что в разложении x
можно представить в виде дроби, в которой
на несократимую дробь числитель являет-
числитель - целое число, а знаменатель –
ся четным числом; очевидно, что множе-
нечетное натуральное число:
ство четных чисел с нечетным знаменате-
m лем описывается формулой:
x= , m ∈ Z, n ∈ N∗
2n − 1
2Z
Нетрудно сообразить, что это равносильно 2N∗ − 1
тому, что, будучи представлено в виде несо-
— нечетным, если его нельзя представить в
кратимой дроби, x имеет нечетный знамена-
виде дроби с четным числителем и нечет-
тель. Множество всех рациональных чисел с
ным знаменателем; это равносильно тому,
нечетным знаменателем описывается форму-
что при любом представлении в виде дро-
лой
Z би с нечетным знаменателем, числитель
(3.2.211) тоже будет нечетным:
2N∗ − 1
2m − 1
Z x= , m ∈ Z, n ∈ N∗
Свойства множества 2N∗ −1 : 2n − 1
1◦ . Сумма x + y двух рациональных чисел x и y с в частности, в разложении x на несократи-
нечетным знаменателем, также является мую дробь числитель должен быть нечет-
рациональным с нечетным знаменателем: ным числом; множество нечетных чисел с
нечетным знаменателем описывается фор-
Z Z мулой:
x, y ∈ =⇒ x+y ∈ 2Z − 1
2N∗−1 2N∗ −1
2N∗ − 1
2◦ . Число −x, противоположное рациональному
числу x с нечетным знаменателем, также Доказательство следующей теоремы мы
является рациональным с нечетным знаме- оставляем читателю:
нателем: Теорема 3.2.62. Множества 2N2Z 2Z−1
∗ −1 и 2N∗ −1 не

Z Z пересекаются и в объединении дают множе-


x∈ =⇒ −x ∈
2N∗ − 1 2N∗ − 1 ство 2N∗Z−1 :
3◦ . Произведение x · y двух рациональных чисел 2Z 2Z − 1
x и y с нечетным знаменателем, также яв- ∩ =∅
2N∗ − 1 2N∗ − 1
ляется рациональным с нечетным знамена- 2Z 2Z − 1 Z
телем: ∗
∪ ∗
= ∗
2N − 1 2N − 1 2N − 1
Z Z
x, y ∈ =⇒ x·y ∈ • Четностью рационального числа x с нечет-
2N∗ −1 2N∗ −1 ным знаменателем называется число sgn2 x,
! 3.2.61. Можно заметить, что для рациональ- определяемое правилом:
ных чисел с четным знаменателем, которые мож- (
но определить как те, которые будучи представ- +1, x – четное
sgn2 x = (3.2.212)
лены в виде несократимой дроби имеют четный −1, x – нечетное
234 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ

Напомним, что выше (см.(3.1.63)) мы услови- sgn2 (x · y) = sgn2 x ∨ sgn2 y,


| {z } | {z } | {z }
лись записью a ∨ b обозначать операцию взятия

=
=
максимума двух чисел: 1 1 1

a ∨ b = max{a, b} 2) если x ∈ 2N2Z ∗ −1 , y ∈


2Z−1
2N∗ −1 , то x + y ∈ 2Z−1
2N∗ −1
и x · y ∈ 2N2Z
∗ −1 , поэтому

Такая запись позволяет придать “алгебраиче-


ский” вид последнему из тождеств в следующем sgn (x + y) = sgn2 x · sgn2 y,
| 2 {z } | {z } | {z }
списке (x, y ∈ 2N∗Z−1 ):

=
−1 1 −1
1
sgn2 x = (3.2.213) sgn2 (x · y) = sgn2 x ∨ sgn2 y,
sgn2 x | {z } | {z } | {z }
sgn2 (−x) = sgn2 x (3.2.214)

=
1 1 −1
sgn2 (x + y) = sgn2 x · sgn2 y (3.2.215)
2Z−1 2Z
sgn2 (x · y) = sgn2 x ∨ sgn2 y (3.2.216) 3) если x, y ∈ 2N ∗ −1 , то x + y ∈ 2N∗ −1 и
2Z−1
x · y ∈ 2N∗ −1 , поэтому
Доказательство. Здесь нужно просто рассмот-
реть несколько случаев. Для двух последних sgn (x + y) = sgn2 x · sgn2 y,
| 2 {z } | {z } | {z }
тождеств рассуждения выглядят так:

=
=
1) если x, y ∈ 2N2Z ∗ −1 , то x + y ∈
2Z
2N∗ −1 и
1 −1 −1
2Z
x · y ∈ 2N∗ −1 , поэтому sgn (x · y) = sgn x ∨ sgn2 y .
| 2{z } | {z2 } | {z }
sgn (x + y) = sgn2 x · sgn2 y ,

=
| 2 {z } | {z } | {z } −1 −1 −1
=

=
=

1 1 1
Глава 4

ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

§1 Числовые функции
(a) Определение функции и примеры
Понятие функции формализует в математике идею взаимной зависимости физических величин.
Идея же состоит в следующем.
Как мы уже говорили на с.187, физические величины, такие как расстояние, масса, скорость,
и так далее, поддаются количественной оценке в числах. Люди находят и устанавливают правила,
позволяющие измерять эти величины (сравнивая их с эталонами), то есть выражать их числами:
200 метров, 1,8 килограмма, и т.д. Собственно говоря, в этом состоит смысл самого понятия фи-
зической величины: параметр, существование которого предполагается теоретически, должен быть
снабжен системой правил, позволяющих его измерять и сравнивать значения в различных ситуа-
циях – только в этом случае он приобретает статус физической величины.
При этом очень важное наблюдение, с которого и начинаются технические науки, состоит в том,
что при фиксированных правилах измерений обнаруживается, что разные величины могут быть
связаны друг с другом довольно жесткими соотношениями (законами природы): если известны
результаты измерений какой-то величины, то это, как правило, означает, что можно вычислить
какие-то другие величины в рассматриваемой ситуации (без необходимости их измерять).

⋄ 4.1.1. Например, по результатам измерения ⋄ 4.1.2. Точно так же, зная (с достаточной точ-
диаметра окружности D, можно с достаточной ностью) массу тела m и плотность ρ материала,
точностью судить о том, какой будет ее длина l, из которого оно изготовлено, мы можем (опять
же, достаточно точно) определить объем V этого
l = πD, (4.1.1) тела по формуле

или площадь ограничиваемого ею круга: m


V = .
π 2 ρ
S= D . (4.1.2)
4 Нам для этого не нужно ставить экспериментов,
Важно, что нам не нужно измерять l и S, если требующих времени и денег (если, скажем, изу-
мы измерили D, потому что зависимости (4.1.1) чаемый нами предмет довольно громоздок) – все
и (4.1.2) позволяют вычислять l и S по данному легко и быстро вычисляется на бумаге (или в
D. уме).

В этих примерах одна величина выражается через другую с помощью логических правил, поз-
воляющих проводить вычисления, то есть находить нужные значения, возможно приближенные,
пользуясь заранее разработанными алгоритмами. Инженер, привыкший пользоваться подобными
вычислениями на практике, обычно только так и понимает функциональную зависимость, но мате-
матику удобнее рассматривать эту зависимость в абстрактном виде, включая те ее разновидности,
для которых алгоритмы вычислений еще не построены. Эти соображения приводят к следующему
определению:
• Числовой функцией на вещественной прямой R называется произвольное отображение1
1 Понятие отображения было определено выше на с.39.

235
236 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

f : D(f ) → R, у которого область определения D(f ) содержится в R. В дальнейшем мы


будем использовать в таких случаях запись

f : R ֒→ R

(которая будет означать, что f является отображением, у которого область определения


и область значений содержатся в R).
Интуитивно яснее, хотя и менее точно, звучит следующее неформальное описание:
• Пусть дано числовое множество X ⊆ R, и пусть задано некое правило, которое каждому
элементу x ∈ X ставит в соответствие единственный (зависящий от x) элемент y = f (x) ∈
R. Такое правило обозначается f : X → R или просто f и называется числовой функцией.
Множество X при этом называется областью определения функции f и обозначается
X = D(f ). А множество

Y = {y ∈ R : ∃x ∈ D(f ) f (x) = y}

называется областью значений функции f и обозначается Y = R(f ).


Напомним, что формальное определение на с.39 не различает отображение и его график. В
соответствии с ним, мы можем сказать, что числовая функция f : R ֒→ R представляет из себя
подмножество в декартовом произведении R × R, удовлетворяющее условию (0.3.198). Обычно все
же такое различие проводится: человеческому воображению удобно представлять себе функцию
как правило, а не как подмножество, поэтому мы будем функцию f : R ֒→ R считать правилом,
а к ее графику относиться как к множеству в декартовом произведении R × R, состоящему из
упорядоченных пар вида (x; f (y)), x ∈ D(f ) ⊆ R.

⋄ 4.1.3. Степенная функция с целым по- y


казателем. Напомним, что на странице 215 мы 2
определили степени с целым показателем. Сте-
пенной функцией с показателем n ∈ Z называет-
ся функция y = [x] 1

x
−2 −1 1 2
f (x) = xn

При n > 0 она определена на всей числовой −2


прямой R, а при n < 0 – только на множестве
R \ {0} = (−∞; 0) ∪ (0; +∞).
⋄ 4.1.5. Дробная часть числа. Формулой
(3.2.155) мы определили дробную часть числа
x ∈ R:
⋄ 4.1.4. Целая часть числа. Формулой {x} := x − [x]
(3.2.149) выше мы определили целую часть чис-
ла x ∈ R: Это тоже будет функция, определенная на R, и
ее график тоже имеет бесконечное число разры-
вов:
y
[x] = max{n ∈ Z : n 6 x},
y = {x} 1

Правило x 7→ [x] будет функцией, определенной


всюду на числовой прямой R. Ее график инте- −2 −1 1 2 x
ресен тем, что имеет бесконечно много разрывов
(что такое разрыв мы объясним ниже на с. 290): ⋄ 4.1.6. Сигнум числа x ∈ R определяется пра-
§ 1. Числовые функции 237

вилом ⋄ 4.1.7. Функция Дирихле. Функция D на R,



 определенная правилом
1, если x > 0
sgn x = 0, если x = 0 (4.1.3)

 (
−1, если x < 0 1, x ∈ Q
D(x) = (4.1.4)
График этой функции имеет разрыв только в од- /Q
0, x ∈
ной точке x = 0:
y = sgn x y называется функцией Дирихле. Ниже мы дока-
1 жем формулу (10.1.4), выражающую эту функ-
цию как двойной предел стандартных функций.
x
0 ⋄ 4.1.8. Пустая функция. В список примеров
полезно включить пустую функцию, то есть пу-
−1 стое отображение, определенное нами в примере
0.3.30, и рассматриваемое как отображение из ∅
в R.

(b) Модуль
Модулем (или абсолютной величиной) вещественного числа x ∈ R называется число |x|, определя-
емое формулой (
x, если x > 0
|x| = (4.1.5)
−x, если x < 0

y
2
y = |x|

x
−2 −1 1 2

Понятно, что отображение x 7→ |x| является функцией. Свойства этой функции так часто ис-
пользуются в анализе, что их изучению мы посвятим целый раздел.

Теорема 4.1.9. Справедливо тождество

|x| = max{−x; x} = (−x) ∨ x, x∈R (4.1.6)

Доказательство. Здесь нужно рассмотреть три случая:


1) если x > 0, то |x| = x и, с другой стороны, max{−x; x} = x, поэтому |x| = max{−x; x};
2) если x = 0, то |x| = 0 = x и, с другой стороны, max{−x; x} = 0 = x, поэтому |x| =
max{−x; x};
3) если x < 0, то |x| = −x и, с другой стороны, max{−x; x} = −x, поэтому |x| = max{−x; x}.
Мы получаем, что, (4.1.6) выполняется независимо от знака x.

Алгебраические тождества с модулем.

Теорема 4.1.10. Для любых x, y ∈ R справедливы равенства:

|x · y| = |x| · |y| (4.1.7)


|xn | = |x|n (4.1.8)
| − x| = |x| (4.1.9)
238 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство. Если оба знака у x и y положительны, получаем


(
x>0
=⇒ |x · y| = |x| · |y|
y>0 | {z } |{z} |{z}
k k k
x·y x y

Далее, если оба знака отрицательны,


(
x60
=⇒ |x · y| = |x| · |y|
y60 | {z } |{z} |{z}
k k k
x·y −x −y

Наконец, если знаки разные, например, x > 0, а y 6 0, то


(
x>0
=⇒ |x · y| = |x| · |y|
y60 | {z } |{z} |{z}
k k k
−x · y x −y

Это доказывает (4.1.7). Из (4.1.7) индукцией получается (4.1.8). Равенство (4.1.9) также следует из
(4.1.7):
|−x| = |(−1) · x| = |(−1)| · |x| = 1 · |x| = |x| .

Алгебраические неравенства с модулем.


Теорема 4.1.11. Для любых x, y ∈ R справедливы неравенства:
|x| > 0, причем |x| = 0 ⇐⇒ x = 0 (4.1.10)
|x| − |y| 6 |x + y| 6 |x| + |y| (4.1.11)
−|x − y| 6 |x| − |y| 6 |x − y| (4.1.12)
Доказательство. 1. Если x > 0, то |x| = x > 0. Если же x < 0, то |x| = −x > 0. Далее, если x = 0,
то |x| = max{0; 0} = 0. И наоборот, если |x| = 0, то либо |x| = x = 0, либо |x| = −x = 0, то есть
опять x = 0.
2. Докажем сначала правую половину (4.1.11):
|x + y| 6 |x| + |y| (4.1.13)
Это легче всего сделать так: заметим, что независимо от знака x, выполняется
 
x = |x|
x = − |x|
Это удобно изобразить равенством
x = ± |x| .
И точно так же,
y = ± |y| .
Отсюда мы получаем импликацию:
(
x + y = ±|x| ± |y| 6 |x| + |y|
=⇒ |x + y| = (4.1.6) = max{x + y; −x − y} 6 |x| + |y|
−x − y = ±|x| ± |y| 6 |x| + |y|
Из (4.1.13) теперь получаем левую половину (4.1.11):
|x| = |(x + y) − y| 6 |x + y| + | − y| = (4.1.9) = |x + y| + |y| =⇒ |x| − |y| 6 |x + y|
3. Докажем правую половину (4.1.12):
|x| = |(x − y) + y| 6 (4.1.13) 6 |x − y| + |y| =⇒ |x| − |y| 6 |x − y|
После этого становится очевидной левая половина:
|y| − |x| 6 |y − x| =⇒ −|y| + |x| > −|y − x| = −|x − y|
§ 1. Числовые функции 239

⊲ 4.1.12. Покажите индукцией, что для любой Yn Y n

последовательности чисел x1 , ..., xn выполняют- xk = |xk | (4.1.15)

k=1 k=1
ся соотношения:

Xn X n

xk 6 |xk |, (4.1.14)

k=1 k=1

Решение неравенств с модулем.


Теорема 4.1.13. Справедливы следующие правила решения неравенств с модулем:
|x| < ε ⇐⇒ x ∈ (−ε,ε) ⇐⇒ |x| ∈ (−ε, ε) (4.1.16)
|x| > ε ⇐⇒ x ∈ (−∞; −ε)∪(ε; +∞) ⇐⇒ |x| ∈ (−∞; −ε) ∪ (ε; +∞) (4.1.17)
Доказательство. 1. Первая эквивалентность в (4.1.16) доказывается цепочкой
   
x>0 x>0
 |x| < ε   x<ε 
|x| < ε ⇔   
 x<0  ⇔  x<0  ⇔
 
|x| < ε −x < ε
 
x>0  
 x<ε  x ∈ [0, ε)
⇔  
 x<0 
 ⇔ ⇔ x ∈ (−ε, ε)
x ∈ (−ε, 0)
x > −ε
а вторая — цепочкой
( )  
|x| < ε  |x| < ε 
|x| < ε ⇔ ⇔ |x| > 0 ⇔
|x| > 0  
|x| > −ε
✂✍

это неравенство выполняется
автоматически, в силу (4.1.10),
поэтому его можно добавить,
как условие в системе
  ( )
 |x| < ε  |x| ∈ (−ε, ε)
⇔ |x| > −ε ⇔ ⇔ |x| ∈ (−ε, ε)
  |x| > 0
|x| > 0
✂✂✍
это неравенство выполняется
автоматически, в силу (4.1.10),
поэтому его можно выбросить
из системы

2. Первая эквивалентность в (4.1.17) доказывается цепочкой


   
x>0 x>0
 |x| > ε   x>ε 
|x| > ε ⇔   
 x<0  ⇔  x<0  ⇔
 
|x| > ε −x > ε
 
x>0  
 x>ε  x>ε
⇔      ⇔ ⇔ x ∈ (−∞, −ε) ∪ (ε, +∞)
x<0  x < −ε
x < −ε
а вторая — цепочкой
 

|x| > ε
 ( |x| > ε ) 
|x| > ε

 |x| < −ε 
|x| > ε ⇔ ⇔   ⇔ ⇔ |x| ∈ (−∞, −ε) ∪ (ε, +∞).
x∈∅ |x| < −ε
|x| > 0
▼❇

это неравенство выполняется
автоматически, в силу (4.1.10),
поэтому его можно выбросить
из системы
240 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(c) Функции с симметриями


Четные и нечетные функции.
• Функция f называется
– четной, если
(1) для всякой точки x из области определения D(f ) функции f точка −x также лежит
в области определения,
∀ x ∈ D(f ) − x ∈ D(f )
(2) выполняется тождество
f (−x) = f (x)
Эти условия означают, что график функции f должен быть симметричен относительно
оси ординат:

y
y = f (x)

– нечетной, если
(1) для всякой точки x из области определения D(f ) функции f точка −x также лежит
в области определения,
∀ x ∈ D(f ) − x ∈ D(f )
(2) выполняется тождество
f (−x) = −f (x)
Эти условия означают, что график функции f должен быть симметричен относительно
начала координат:

y
y = f (x)

x
§ 1. Числовые функции 241

⋄ 4.1.14. Степенная функция с четным показа- 1. При n = 0 тождество (4.1.20) превращается


телем является четной: в уже доказанное тождество (3.1.20):

(−x)2n = x2n , n∈Z (4.1.18) (−x)−1 = −x−1

Доказательство. Заметим, что это достаточно 2. Предположим, что мы доказали это для
доказать для n > 0, потому что случай отрица- какого-то n = k:
тельных степеней получается отсюда в качестве
следствия: (−x)2k−1 = −x2k−1 (4.1.21)

1 1 3. Тогда для n = k + 1 мы получаем:


(−x)−2n = = 2n = x−2n
(−x)2n x
(−x)2(k+1)−1 = (−x)2k+1 =
Для n > 0 доказательство проводится по индук-
ции. = (−x)2k−1 · (−x)2 = −x2k−1 · x2 =
| {z } | {z }
1. При n = 0 утверждение очевидно: k k
− x2k−1 , x2 ,
(−x)0 = 1 = x0 в силу (4.1.21) в силу (3.1.17)

= −x2k+1 = x2(k+1)−1
2. Предположим, что мы доказали это для
какого-то n = k:

(−x)2k = x2k (4.1.19) ⋄ 4.1.16. Модуль является четной функцией:

3. Тогда для n = k + 1 мы получаем: | − x| = |x| (4.1.22)

(−x)2(k+1) = (−x)2k+2 = Доказательство. Если x > 0, то


= (−x)2k · (−x)2 = x2k · x2 = | −x | = −(−x) = x = | |{z}
x |
| {z } | {z } |{z}
k k

<
>

x2k , x2 , 0 0
в силу (4.1.19) в силу (3.1.17)

= x2k+2 = x2(k+1) Если x = 0, то

| − x| = | − 0| = |0| = |x|

⋄ 4.1.15. Степенная функция с нечетным пока- Если x < 0, то


зателем является нечетной:
x |
| −x | = −x = | |{z}
|{z}
(−x)2n−1 = −x2n−1 , n∈Z (4.1.20)
>
<

0 0
Доказательство. Как и в предыдущем приме-
ре, здесь достаточно доказать утверждение для
n > 0, потому что для n = −k, k ∈ N, это выво-
дится как следствие: ! 4.1.17. На всякий случай полезно заметить,
что функции не обязаны быть только четными
−2k−1 1 1 −2k−1 или нечетными. Например, функция
(−x) = = − 2k+1 = −x
(−x)2k+1 x
f (x) = 1 + x
Для n > 0 доказательство проводится по индук-
ции. не будет ни четной ни нечетной. Докажите это.

Периодические функции.
• Число T называется периодом числовой функции f , если
(a) оно положительно:
T > 0,
(b) область определения D(f ) функции f инвариантна относительно сдвигов на T вправо
и влево:
D(f ) − T = D(f ) = D(f ) + T
242 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(то есть для любого x ∈ D(f ) числа x + T и x − T тоже лежат в D(f )),
(c) справедливо двойное тождество:

f (x − T ) = f (x) = f (x + T ), x ∈ D(f ) (4.1.23)

(здесь из-за условия (b) достаточно выполнения какого-нибудь одного из этих двух
равенств, например f (x) = f (x + T )).
• Число h называется полупериодом числовой функции f , если число 2h является периодом
функции f .
• Числовая функция f называется
— периодической, если она обладает каким-нибудь периодом T ,
— T -периодической, если число T является ее периодом,

⋄ 4.1.18. Непериодические функции. По- Можно заметить, что вообще любое натуральное
нятно, что не всякая функция будет периодиче- число n ∈ N∗ является периодом для x 7→ {x}:
ской. Например, функция
f (x) = x, x∈R {x + n} = {x}, x∈R

– не периодическая, потому что для нее тожде-


Других же периодов здесь нет:
ство (4.1.23) эквивалентно тождеству
n o
x + T = x, x∈R T > 0 : ∀x ∈ R {x + n} = {x} = N∗
которое выполняется только если T = 0. То
есть периода (числа T > 0, удовлетворяющего Как следствие, эта функция обладает важным
(4.1.23)) у этой функции не существует. свойством, которое встречается не у всякой пе-
⋄ 4.1.19. Константы. Всякую функцию, тож- риодической функции (например, у констант его
дественно равную какому-нибудь числу C ∈ R, нет): у нее есть наименьший период – число 1.
f (x) = C, x∈R
⋄ 4.1.21. Функция Дирихле x 7→ D(x), опре-
можно считать периодической, потому что для деленная в главе 3 формулой (4.1.4), также будет
нее любое число T > 0 будет периодом: периодической, потому что любое положитель-
ное рациональное число r ∈ Q является для нее
f (x + T ) = C = f (x), x∈R
периодом
⋄ 4.1.20. Дробная часть. Функция x 7→ {x},
сопоставляющая числу x его дробную часть {x} D(x + r) = D(x), x∈R
(мы определили ее формулой (3.2.155)), являет-
ся периодической, потому что, например, число
Однако среди таких чисел r не существует наи-
1 является для нее периодом:
меньшего. Поэтому D, будучи периодической, не
{x + 1} = {x}, x∈R обладает наименьшим периодом.

Теорема 4.1.22. Если функция f является периодической и обладает наименьшим периодом M ,


то любой ее период T имеет вид
T =n·M
где n ∈ N∗ .
Доказательство. Разделим T на M с остатком по теореме 3.2.37:

T = n · M + r, 06r<M

Если бы оказалось, что r > 0, то мы получили бы, что r = T − n · M – период функции f , меньший
M . То есть M в этом случае не могло бы быть наименьшим периодом. Значит r = 0, и это то, что
нам нужно.
Теорема 4.1.23. Если функция f является периодической, но не обладает наименьшим периодом
M , то
§ 1. Числовые функции 243

(i) нижняя грань всех ее периодов равна нулю:


n o
inf T > 0 : ∀x ∈ D(f ) f (x + T ) = f (x) = 0 (4.1.24)

(ii) на любом непустом интервале I = (a, b) функция f принимает все свои значения:
   
f I ∩ D(f ) = f D(f ) (4.1.25)

(иными словами, каковы бы ни были a и b, a < b, для любой точки x ∈ D(f ) найдется
точка t ∈ (a, b) ∩ D(f ) такая, что f (t) = f (x)).
Доказательство. 1. Обозначим буквой P множество всех периодов для f , а его нижнюю грань
буквой α: n o
P = T > 0 : ∀x ∈ D(f ) f (x + T ) = f (x) , α = inf P

Если α ∈
/ P , то для всякого β > α найдется T ∈ P такое, что

α<T <β

Возьмем произвольное ε > 0. Для него существует какое-то T1 ∈ P со свойством

α < T1 < α + ε

Поскольку T1 > α, можно подобрать T2 ∈ P такое, что

α < T2 < T1 < α + ε

Числа T1 и T2 являются периодами для f . Поэтому их разность T = T1 − T2 (которая больше нуля,


потому что T1 > T2 ) тоже будет периодом для f :

f (x + T ) = f (x + T1 − T2 ) = f (x + T1 ) = f (x)

С другой стороны, T1 и T2 лежат в интервале (α, α + ε) длины ε, поэтому их разность должна быть
меньше ε:
T = T1 − T2 < ε
Мы получили, что для всякого ε > 0 найдется период T ∈ P , меньший ε. Значит, α = inf P = 0
2. Рассмотрим сначала интервал I = (−ε, ε), ε > 0. В силу уже доказанной формулы (4.1.24),
найдется период T < ε. Возьмем произвольную точку x ∈ D(f ), и обозначим через n целую часть
числа Tx : hxi
n=
T
Тогда точка t = x − nT будет обладать нужными свойствами:

t ∈ (−ε, ε), t ∈ D(f ), f (t) = f (x)

Действительно, последние два условия – t ∈ D(f ) и f (t) = f (x) – выполняются потому что T –
период. А первое следует из свойств целой части:
hxi
n=
T
⇓ (3.2.151)
x ε
n6 <n+1<n+
T T

nT 6 x < nT + ε

| −{znT} < ε
06x
t


244 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

t ∈ (−ε, ε)
3. Пусть, наконец, I = (a, b) – произвольный интервал. Положим ε = b−a 3 и, пользуясь формулой
(4.1.24), подберем период T так, чтобы
ε
>1
T
Тогда a + ε < b − ε, поэтому a+ε T < b−εT , причем расстояние между точками T
a+ε
и b−ε
T больше
единицы:
b−ε a+ε (b − ε) − (a + ε) (b − a) − 2ε 3ε − 2ε ε
− = = = = >1
T T T T T T
Значит, между ними лежит хотя бы одно целое число n ∈ Z:
a+ε b−ε
<n<
T T
Умножив на T мы получим:
a + ε < nT < b − ε

a < nT − ε & nT + ε < b

(−ε; ε) + nT = (nT − ε; nT + ε) ⊆ (a; b)
То есть (−ε; ε) – такой интервал, сдвиг которого на число nT , кратное периоду T , попадает в
интервал (a; b). Мы уже доказали, что для любой точки x ∈ D(f ) в интервале (−ε; ε) найдется
точка t, на которой функция f определена и принимает то же значение:
f (t) = f (x)
Положив s = t + nT , мы получим точку из интервала (nT − ε; nT + ε) ⊆ (a; b) с теми же свойствами:
f (s) = f (t + nT ) = f (t) = f (x)

(d) Свойства функций, связанные с отношением порядка


Ограниченные функции и точная грань функции на множестве. Пусть f – числовая
функция и E – подмножество в ее области определения:
E ⊆ D(f )
Образом этого множества под действием функции f называется множество
n o n o
f (E) = f (x); x ∈ E = y : ∃x ∈ E y = f (x) (4.1.26)

• Точная нижняя грань множества f (E) называется точной нижней гранью функции f на
множестве E и обозначается inf x∈E f (x):
n o
inf f (x) = inf f (E) = inf f (x); x ∈ E (4.1.27)
x∈E

Если функция f ограничена снизу на множестве E, то есть существует число A такое, что
∀x ∈ E A 6 f (x)
(это эквивалентно тому, что множество f (E) ограничено снизу), то точная нижняя грань
f на E совпадает с наибольшим из таких чисел A:
inf f (x) = max{A ∈ R : ∀x ∈ E A 6 f (x)}.
x∈E

В таких случаях inf x∈E f (x) само является числом (а не символом −∞, как тоже иногда
бывает), и это коротко записывается формулой:
inf f (x) > −∞
x∈E

В противном случае говорят, что функция f не ограничена снизу на множестве E, и


записывается это формулой:
inf f (x) = −∞
x∈E
§ 1. Числовые функции 245

• Точная верхняя грань множества f (E) называется точной верхней гранью функции f на
множестве E и обозначается supx∈E f (x):
n o
sup f (x) = sup f (E) = sup f (x); x ∈ E (4.1.28)
x∈E

Если функция f ограничена сверху на множестве E, то есть существует число B такое,


что
∀x ∈ E f (x) 6 B
(это эквивалентно тому, что множество f (E) ограничено сверху), то точная верхняя грань
f на E совпадает с наименьшим из таких чисел B:

sup f (x) = min{B ∈ R : ∀x ∈ E f (x) 6 B}.


x∈E

В таких случаях supx∈E f (x) является числом (а не символом +∞), и это коротко запи-
сывается формулой:
sup f (x) < +∞
x∈E

В противном случае говорят, что функция f не ограничена сверху на множестве E, и


записывается это формулой:
sup f (x) = +∞
x∈E

• Числовая функция f называется ограниченной на множестве E ⊆ D(f ), если она ограни-


чена на E сверху и снизу, то есть существуют числа A и B, такие что:

∀x ∈ E A 6 f (x) 6 B

Свойства точной верхней и точной нижней грани функции:


1◦ Точная грань от константы:
 
∀x ∈ E f (x) = C =⇒ inf f (x) = C = sup f (x)
x∈E x∈E

2 ◦
Монотонность:
 
∀x ∈ E f (x) 6 g(x) =⇒ inf f (x) 6 inf g(x) & sup f (x) 6 sup g(x)
x∈E x∈E x∈E x∈E

3◦ Антиоднородность:
 
inf − f (x) = − sup f (x)
x∈E x∈E
  (4.1.29)
sup − f (x) = − inf f (x)
x∈E x∈E

4◦ Полуаддитивность:
 
inf f (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E
  (4.1.30)
sup f (x) + g(x) 6 sup f (x) + sup g(x)
x∈E x∈E x∈E

5◦ Полумультипликативность: если f (x), g(x) > 0, то


 
inf f (x) · g(x) > inf f (x) · inf g(x)
x∈E x∈E x∈E
  (4.1.31)
sup f (x) · g(x) 6 sup f (x) · sup g(x)
x∈E x∈E x∈E

6◦ Связь с модулем:2
 

sup f (x) − f (y) = sup f (x) − f (y) (4.1.32)
x,y∈E x,y∈E
2 Это тождество понадобится нам на с.492.
246 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство. В каждом пункте (за исключением 6◦ ) мы докажем только первую половину


утверждения (вторая доказывается по аналогии).
1.
 
∀x ∈ E f (x) = C =⇒ {A : ∀x ∈ E A 6 f (x)} = {A : A 6 C} = (−∞; C] =⇒
=⇒ inf f (x) = max{A : ∀x ∈ E A 6 f (x)} = max(−∞; C] = C
x∈E

2. Пусть ∀x ∈ E f (x) 6 g(x). Тогда

{C : ∀x ∈ E C 6 f (x)} ⊆ {C : ∀x ∈ E C 6 g(x)}
⇓ (свойство 1◦ на стр. 197)
inf f (x) = max{C : ∀x ∈ E C 6 f (x)} 6 max{C : ∀x ∈ E C 6 g(x)} = inf g(x)
x∈E x∈E

3.    
inf − f (x) = inf − f (E) = (свойство 3◦ на стр. 197) = − sup f (E) = − sup f (x)
x∈E x∈E
.
4.
(
∀x ∈ E f (x) > inf x∈E f (x)
=⇒ ∀x ∈ E f (x) + g(x) > inf f (x) + inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) x∈E x∈E
 
=⇒ inf f (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E

5.
(
∀x ∈ E f (x) > inf x∈E f (x) > 0
=⇒ ∀x ∈ E f (x) · g(x) > inf f (x) · inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) > 0 x∈E x∈E
 
=⇒ inf f (x) · g(x) > inf f (x) · inf g(x)
x∈E x∈E x∈E

6. Во-первых, нужно заметить неравенство:


 

sup f (x) − f (y) 6 sup f (x) − f (y)
x,y∈E x,y∈E

Оно следует из свойства монотонности:


   

∀x, y ∈ E f (x) − f (y) 6 f (x) − f (y) =⇒ sup f (x) − f (y) 6 sup f (x) − f (y)
x,y∈E x,y∈E

После этого нужно убедиться, что это неравенство не может быть строгим. Предположим, что
 

sup f (x) − f (y) < sup f (x) − f (y)
x,y∈E x,y∈E

то есть что для каких-то элементов a, b ∈ E выполняется


 

∀x, y ∈ E f (x) − f (y) < f (a) − f (b)

В частности, взяв x = a, y = b, мы получили бы




f (a) − f (b) < f (a) − f (b)

а, взяв x = b, y = a, получили бы


f (b) − f (a) < f (a) − f (b)


Вместе эти два неравенства выполняться не могут, потому что f (a) − f (b) равен либо f (a) − f (b),
либо f (b) − f (a).
§ 1. Числовые функции 247

Монотонные функции
• Числовая функция f называется
– возрастающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких
что x < y выполняется неравенство f (x) < f (y);

f (y)

f (x)

x y

– убывающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких что


x < y выполняется неравенство f (x) > f (y);

f (x)

f (y)

x y

– невозрастающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких


что x < y выполняется неравенство f (x) > f (y);

f (x)

f (y)

x y
248 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

– неубывающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких что


x < y выполняется неравенство f (x) 6 f (y);

f (y)

f (x)

x y

– монотонной на множестве E ⊆ D(f ), если она невозрастающая или неубываю-


щая;
– строго монотонной на множестве E ⊆ D(f ), если она возрастающая или убы-
вающая.
Доказательство следующих свойств мы оставляем читателю:

Свойства монотонных функций



1 Если функция f возрастает на множестве E, то она неубывает на множестве E.
2◦ Если функция f убывает на множестве E, то она невозрастает на множестве E.
3◦ Если функция f неубывает на множестве E, то на всяком ограниченном снизу (сверху)
подмножестве M ⊆ E таком, что inf M ∈ E (sup M ∈ E) функция f ограничена снизу
(сверху) и удовлетворяет неравенству
 
f (inf M ) 6 inf f (x) sup f (x) 6 f (sup M ) (4.1.33)
x∈M x∈M

4◦ Если функция f невозрастает на множестве E, то на всяком ограниченном сверху


(снизу) подмножестве M ⊆ E таком, что sup M ∈ E (inf M ∈ E) функция f ограничена
снизу (сверху) и удовлетворяет неравенству
 
f (sup M ) 6 inf f (x) sup f (x) 6 f (inf M ) (4.1.34)
x∈M x∈M

5◦ Композиция g ◦ f функций f и g
– возрастает (неубывает), если обе функции f и g возрастают (неубывают),
либо обе убывают (невозрастают),
– убывает (невозрастает), если одна из функций f и g возрастает (неубывает),
а другая убывает (невозрастает).

⋄ 4.1.24. Степенная функция x 7→ x2n , n ∈ N∗ , ле [0; +∞) следует из теоремы 3.2.32: в силу
— убывает на полуинтервале (−∞; 0], (3.2.143), функция x 7→ x2n возрастает на интер-
вале (0; +∞):
— возрастает на полуинтервале [0; +∞).
0<x<y ⇒ x2n < y 2n
Как следствие,
А случай x = 0 получается из условия сохране-
x 6= 0 =⇒ x2n > 0 (4.1.35) ния знака (3.2.142):
(3.2.141)
Доказательство. Возрастание на полуинтерва- 0<y ⇒ 02n = 0 < y 2n
§ 1. Числовые функции 249

2n−1
С другой стороны, в силу (4.1.18), наша функция x
| {z < 0} & 0 < y 2n−1
| {z }
четная: потому что потому что
(−x)2n = x2n x, 0 ∈ (−∞; 0] 0, y ∈ [0; +∞)
| {z }
Отсюда следует, что она убывает на полуинтер-

вале (−∞; 0]:
x<y60
x2n−1 < 0 < y 2n−1 (4.1.37)

Формулы (4.1.36) можно вывести из возрастания
0 6 −y < −x функции x 7→ x2n−1 , а можно объявить их след-
⇓ ствием уже доказанного неравенства (4.1.37).
2n
(−y) < (−x)2n ⋄ 4.1.26. Степенная функция x 7→ x−2n , n ∈ N∗ ,
| {z } | {z }
y 2n x2n — возрастает на интервале (−∞; 0),
⇓ — убывает на интервале (0; +∞).
2n При этом,
y < x2n
Для доказательства (4.1.35) нужно просто рас- x 6= 0 =⇒ x−2n > 0 (4.1.38)
смотреть два случая: x > 0 и x < 0.
Доказательство. Убывание на интервале
⋄ 4.1.25. Степенная функция x 7→ x2n−1 , n ∈ N∗ , (0; +∞) следует из условия монотонности
возрастает всюду на своей области определения (3.2.144) теоремы 3.2.32. Из него и условия чет-
(то есть на прямой R). Как следствие, ности (4.1.18) выводится возрастание на интер-
вале (−∞; 0) по аналогии с тем, как это делалось
x > 0 =⇒ x2n−1 > 0 в примере 4.1.24. Свойства (4.1.38) следуют из
2n−1
(4.1.36) из условия сохранения знака (3.2.142) теоремы
x < 0 =⇒ x <0
3.2.32 и условия четности (4.1.18).
Доказательство. Возрастание на полуинтерва- ⋄ 4.1.27. Степенная функция x 7→ x−(2n−1) ,
ле [0; +∞) здесь доказывается так же, как в n ∈ N∗ ,
предыдущем примере 4.1.24. Поскольку вдоба-
вок, в силу (4.1.20), наша функция нечетная, — убывает на интервале (−∞; 0),
— убывает на интервале (0; +∞).
(−x)2n−1 = −x2n−1 ,
При этом,
она должна возрастать и на полуинтервале
(−∞; 0]: x>0 =⇒ x−(2n−1) > 0
(4.1.39)
x<y60 x<0 =⇒ x−(2n−1) < 0

Доказательство. Как и в предыдущем приме-
0 6 −y < −x ре убывание на интервале (0; +∞) следует из
условия монотонности (3.2.144) теоремы 3.2.32.
⇓ Из него и условия нечетности (4.1.20) выводит-
(−y) 2n−1
< (−x)2n−1 ся убывание на интервале (−∞; 0) по аналогии с
| {z } | {z } тем, как это делалось в примере 4.1.25. Свойства
−y 2n−1 −x2n−1
(4.1.39) следуют из из условия сохранения зна-
⇓ ка (3.2.142) теоремы 3.2.32 и условия нечетности
2n−1 (4.1.20).
−y < −x2n−1
⇓ ⊲ 4.1.28. Нарисуйте график какой-нибудь функ-
ции f : R → R со следующими свойствами:
x2n−1 < y 2n−1
1) на интервале (−∞; −1) функция f убывает и
Остается заметить, что значения функции на ограничена;
полуинтервале (−∞; 0] меньше значений на 2) на интервале (−1; 0) функция f возрастает и
[0; +∞). Это следует из того, что эти интервалы ограничена;
имеют общую точку 0:
3) на интервале (0; 1) функция f убывает, огра-
x<0<y ничена снизу, но не ограничена сверху;
4) на интервале (1; +∞) функция f возрастает
⇓ и ограничена;
250 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Понятно, что эта задача имеет неединствен- 2) на интервале (−2; 0) функция f убывает,
ное решение. В качестве возможного ответа мы ограничена сверху, но не ограничена снизу;
предлагаем следующую картинку: 3) на интервале (0; 1) функция f возрастает и не
y ограничена ни сверху, ни снизу;
1 4) на интервале (1; +∞) функция f возрастает
и ограничена снизу.
−1 0 1 x Один из возможных ответов выглядит так:
y
1
⊲ 4.1.29. Нарисуйте график какой-нибудь функ-
ции f : R → R со следующими свойствами: −2 −1 0 1 x
1) на интервале (−∞; −2) функция f возрастает
и ограничена;

§2 Предел последовательности
Напомним, что понятие бесконечной последовательности было определено на с.73. В частном слу-
чае, когда значения последовательности являются числами, такая последовательность называется
числовой. Выпишем это определение для ссылок:
• Числовой последовательностью называется произвольное отображение x : N∗ → R (на-
турального ряда N∗ в множество R вещественных чисел). Значения такого отображения
принято записывать с помощью нижнего индекса

xn = x(n), n ∈ N∗ .

а само отображение – в виде семейства {xn ; n ∈ N∗ } или {xn }. (Понятно, что вместо x
может употребляться любая другая буква.)

Способы описания числовой последовательности. В математическом анализе имеется толь-


ко три способа определить числовую последовательность. Мы перечислим их в следующих приме-
рах.

⋄ 4.2.1. Последовательности, заданные яв- или операции индуктивного суммирования,


но. Первый способ – написать формулу вида n
X 1
xn =
xn = f (n), (4.2.40) k
k=1

в которой f – заранее определенная функция. или каких-то других операций (например, диф-
Например, следующие формулы явно задают ференцирования и интегрирования которые мы
последовательности, поскольку функции в пра- опишем ниже). Во всех этих случаях считается,
вых частях были уже нами определены: что формула задает последовательность явно.
1 ⋄ 4.2.2. Последовательности, заданные ре-
xn = , xn = n, xn = (−1)n .
n куррентно. Второй способ – задать последова-
тельность индуктивно с помощью теоремы 3.2.5
Естественно, под f в формуле (4.2.40) можно
(об определениях полной индукцией). В таких
также понимать какую-нибудь функцию, состав- случаях говорят также, что последовательность
ленную из уже определенных, с помощью явно
задана рекуррентно. Например, правило
описанных операций, например, операции ком-  
позиции, 1 1
2 x1 = 2, xn+1 = xn +
xn = 2n 2 xn
или алгебраических операций, индуктивно задает некую числовую последова-
тельность (ниже в примере 4.2.60 мы будем изу-
xn = n2 − n чать ее свойства).
§ 2. Предел последовательности 251

Другой пример – знаменитая последователь- соб – воспользоваться следующим частным слу-


ность Фибоначчи, задаваемая правилом чаем аксиомы выбора, описанной на с.63:
x1 = x2 = 1, xn+2 = xn+1 + xn , (4.2.41) • Аксиома счетного выбора: для вся-
кой последовательности непустых множеств
(ниже в главе 11 мы докажем неочевидный факт,
{Xn ; n ∈ N∗ } можно подобрать
S последова-
что эту последовательность можно задать и яв-
тельность {xn ; n ∈ N∗ } ⊆ n∈N∗ Xn такую,
ной формулой (11.3.149)). Отметим, что в этом
что для всякого n ∈ N∗ объект xn является
примере ссылка на теорему 3.2.5, из которой мы
элементом множества Xn :
выводили саму возможность определений по ин-
дукции не вполне корректна, потому что в каче-
∀n ∈ N∗ xn ∈ Xn .
стве начальных данных в определении (4.2.41)
используются два числа, x1 и x2 (а не одно, Этот способ может показаться слишком аб-
x1 ). Для обоснования такого индуктивного при- страктным, но, как правило, именно он (за ред-
ема нужно заменить теорему 3.2.5 на формаль- кими исключениями) используется при дока-
но другое утверждение, в котором отображе- зательстве общих утверждений там, где быва-
ние G будет действовать на последовательно- ет нужно построить последовательность с за-
сти элементов a1 , ..., an ∈ A длиной не меньше данными свойствами. Ниже на примере до-
2. Поскольку пример Фибоначчи используется в казательств свойств подпоследовательностей 20
нашем учебнике исключительно как иллюстра- и 30 на с.276 и при доказательстве теоремы
ция, мы предоставляем читателю самостоятель- Больцано-Вейерштрасса 4.2.68 мы подробно об-
но продумать эти детали. суждаем этот эффект в связи с замечаниями о
⋄ 4.2.3. Последовательности, заданные с приеме бесконечнократного выбора, которые мы
помощью аксиомы выбора. Последний спо- делаем там же.

Способы изображения числовой последовательности. Множество натуральных чисел N∗ ,


по которому бегает аргумент n последовательности {xn }, обладает довольно редко встречающим-
ся в математике свойством перечислимости. Это значит, что можно указать алгоритм, который
сначала выдаст первый элемент этого множества, n = 1, а затем для каждого n ∈ N∗ сгенерирует
следующий за ним элемент n + 1, и таким образом будут перечислены все элементы N∗ . Из этого
следует, что последовательность {xn } можно представлять себе в виде таблицы, в которой первую
строчку (множество значений аргумента) занимают натуральные числа, а вторая строчка будет
занята соответствующими вещественными числами (значениями последовательности):

1 2 3 4 5 6 7 ...
x1 x2 x3 x4 x5 x6 x7 ...

Поскольку ячеек у такой таблицы должно быть бесконечно много, всю ее нарисовать, конечно,
невозможно, однако в качестве зрительного образа, который можно держать в голове, когда речь
заходит о последовательностях, такое представление бывает полезно.

Но оно фокусирует внимание наблюдателя на первых элементах последовательности и бывает


удобно только там, где важно ее “начало”, а на остающийся “хвост” можно не обращать внимание.
Нас же, наоборот, будет главным образом интересовать этот “хвост”: первые значения как раз не
будут нам особенно нужны (причем, каким бы длинным ни был этот начальный отрезок последова-
тельности), а важной для нас будет лишь закономерность, позволяющая понять, к чему стремится
данная последовательность (и стремится ли она к чему-то).

Пытаться уловить эту закономерность (разумеется, не на произвольных примерах, а на специаль-


но подобранных, обучающих) гораздо удобнее, пользуясь другим зрительным образом, в котором
последовательность изображается системой направленных дуг, символизирующих переходы от xn
к xn+1 :
252 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

x
x1 x2 x4 x3 x5

Это можно представлять себе как движение “блохи, прыгающей по прямой”: сначала эта “блоха
находилась в точке x1 ”, затем “прыгнула в точку x2 ”, и так далее. Понятно, что и здесь всю систему
дуг нарисовать никогда не бывает возможно (потому что их тоже бесконечно много), однако как
зрительный образ такое представление оказывается удивительно полезным.

⋄ 4.2.4. xn = 1
n ⋄ 4.2.7. xn = (−1)n · n

0 1 1 1 1 −3 −1 2 4
4 3 2

⋄ 4.2.5. xn = n ⋄ 4.2.8. xn = (−1)n

1 2 3 4 −1 1

⋄ 4.2.6. xn = (−1)n ⋄ 4.2.9. xn = 3 (постоянная последовательность)


n

−1 − 13 0 1 1 1
4 2 3

(a) Предел числовой последовательности


“Почти все n ∈ N∗ ”. Пусть P обозначает какое-нибудь переменное высказывание о натуральных
числах (то есть, на языке логики, просто формулу с единственной свободной переменной n, либо
вообще без свободных переменных, например, “n > 10”, или n ∈ 2N, и т.д.).
• Говорят, что почти все числа n ∈ N обладают свойством P , если только конечное (воз-
можно, пустое) множество чисел n ∈ N не обладает этим свойством:

card{n ∈ N∗ : ¬P } < ∞ (4.2.42)

Это эквивалентно тому, что свойство P выполняется для всех n ∈ N∗ , начиная с некото-
рого номера:
∃N ∈ N∗ ∀n > N P (4.2.43)
§ 2. Предел последовательности 253

Доказательство эквивалентности. Пусть P – какое-то переменное высказывание о натуральных


числах. Обозначим буквой A множество тех чисел n ∈ N∗ , для которых P ложно, а через B мно-
жество тех чисел n ∈ N∗ , для которых P истинно:

A = {n ∈ N∗ : ¬P }, B = {n ∈ N∗ : P}

Тогда
(4.2.42)
m
card A < ∞
m теорема 3.2.28

∃N ∈ N A ⊆ {1, ..., N }
m

∃N ∈ N {n ∈ N∗ : n > N} ⊆ B
m
(4.2.43)

⋄ 4.2.10. Ясно, что почти все числа n ∈ N удо- выполняется для почти всех n ∈ N?
влетворяют неравенству Понятно, что это не так, потому что оно
выполняется только для четных чисел (n =
n>5
2, 4, 6, 8, ...), а для нечетных чисел (n =
потому что чисел n ∈ N, не удовлетворяющих 1, 3, 5, 7, ...) – которых бесконечно много – оно
этому неравенству имеется только конечное мно- неверно.
жество (а именно n ∈ {1, 2, 3, 4}).
⋄ 4.2.11. Наоборот, неверно, что почти все числа ⊲ 4.2.13. Верно ли, что обратное неравенство
n ∈ N удовлетворяют неравенству
(−1)n 6 0
n<5
потому что чисел n ∈ N, не удовлетворяющих выполняется для почти всех n ∈ N?
этому неравенству бесконечно много (а именно, Это, конечно, тоже не так, потому что это-
n = 5, 6, 7, 8, ...). му неравенству удовлетворяют только нечетные
⊲ 4.2.12. Сообразим, будет ли неравенство числа (n = 1, 3, 5, 7, ...), а для четных чисел
(n = 2, 4, 6, 8, ...) – которых бесконечно много –
(−1)n > 0 оно неверно.

Теорема 4.2.14 (Архимеда). Каково бы ни было число C ∈ R, почти все числа n ∈ N удовлетво-
ряют неравенству
n>C (4.2.44)
Доказательство. Это следует из принципа Архимеда (теорема 3.2.26). Выберем какое-нибудь N ∈
N так, чтобы N > C. Тогда все числа n, начиная с числа N , удовлетворяют неравенству (4.2.44),
потому что n > N > C.

⊲ 4.2.15. Следующая “абстрактная” задача мо- (A) все числа n ∈ N∗ лежат в множестве M (то
жет считаться тестом на понимание термина “по- есть M = N∗ );
чти все”. Пусть M какое-нибудь множество нату- (B) конечный набор чисел n ∈ N∗ не лежит в мно-
ральных чисел (M ⊆ N∗ ), рассмотрим пять воз- жестве M , а остальные числа n ∈ N∗ (кото-
можных ситуаций: рых – бесконечное множество) лежат в M ;
254 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(C) бесконечный набор чисел n ∈ N∗ не лежит в 1) в каких из этих случаев почти все числа n ∈
множестве M , и одновременно бесконечный N∗ лежат в множестве M ?
набор чисел n ∈ N∗ лежит в M (такое быва- 2) в каких случаях почти все числа n ∈ N∗ не
ет, например, когда M – множество четных лежат в множестве M ?
чисел);
3) в каких случаях не верно ни то, ни другое?
(D) конечный набор чисел n ∈ N∗ лежит в множе-
стве M , а остальные числа n ∈ N∗ (которых Ответы:
– бесконечное множество) не лежат в M ; 1) (A) и (B) (чисел, лежащих в M больше, чем
(E) все числа n ∈ N∗ не лежат в множестве M (то остальных);
есть M = ∅). 2) (D) и (E) (чисел, не лежащих в M больше,
чем остальных);
Ответьте на вопросы: 3) (C).

• Говорят, что почти все элементы последовательности {xn } принадлежат множеству


E, если для почти всех номеров n ∈ N соответствующие числа {xn } принадлежат множе-
ству E.

⋄ 4.2.16. Проверим, что почти все элементы по- ⋄ 4.2.18. Верно ли, что почти все элементы по-
следовательности
 {xn = n1 } лежат в интервале следовательности {xn = (−1)n } лежат в интер-
1
0; 4 . вале (0; 2)?

0 1 1 1 1
4 3 2

−1 0 1 2
Действительно,

    Чтобы это понять, разберемся сначала для ка-


1 1 1
xn ∈ 0; ⇔ ∈ 0; ⇔ ких номеров n ∈ N числа xn лежат в интервале
4 n 4
 (0; 2):
 1 <1 1 1
n 4
⇔ ⇔ < ⇔ n>4
 1 >0 n 4 xn ∈ (0; 2) ⇔ (−1)n ∈ (0; 2) ⇔
n

▼❇  (−1)n > 0
❇ ⇔ ⇔ (−1)n > 0
это неравенство выполняется автоматически для любого n ∈ N,  (−1)n < 2
поэтому его можно отбросить

а последнее неравенство в этой цепочке выпол- ▼❇❇


няется для почти всех n ∈ N, по теореме Архи- это неравенство выполняется автоматически для любого n ∈ N,
поэтому его можно отбросить
меда 4.2.14.
⋄ 4.2.17. Верно ли, что почти все элементы по- Последнее неравенство в этой цепочке выполня-
следовательности
 {xn = n1 } лежат в интервале ется не для почти всех чисел n ∈ N а только
1
4; ∞ ? для четных: n ∈ {2, 4, 6, ...}. Значит, соотноше-
ние xn ∈ (0; 2) тоже выполняется не для почти
всех чисел n ∈ N.
0 1 1 1 1
4 3 2
⋄ 4.2.19. (a) Найдите какие-нибудь два числа α
и β такие, чтобы почти все элементы после-
Нет, конечно, потому что
  довательности xn = n−1
n лежали в интервале
1 1 1 (α; β).
xn ∈ ;∞ ⇔ > ⇔ n<4
4 n 4 (b) Найдите все такие числа α и β, чтобы почти
а последнее неравенство выполняется не для все элементы последовательности xn = n−1 n
почти всех чисел n ∈ N, а только для n ∈ лежали в интервале (α; β).
{1, 2, 3}. Нарисуем на прямой первые несколько эле-
§ 2. Предел последовательности 255

ментов нашей последовательности будет неверно. Поэтому ответ для второй поло-
вины задачи выглядит так
Ответ для пункта (b): α < −1 и β > 1.

⊲⊲ 4.2.21. Ничего не доказывая, но пользуясь


интуицией, попробуйте сообразить, какие интер-
0 1 2 3 1 2 валы (α; β) содержат почти все элементы данной
2 3 4
последовательности xn . Опишите все такие ин-
тервалы для последовательностей
Из рисунка видно, что, например, вне интер-
вала ( 21 ; 2) лежит только конечный набор чисел 1) xn = (−1)n + 1
n
xn . Отсюда следует (Ответ: α 6 −1, β > 1)
Ответ для пункта (a): можно взять, напри- 2) xn = (−1)n − 1
n
мер, α = 12 и β = 2. (Ответ: α < −1, β > 1)
Более того, если взять какие-нибудь другие
3) xn = (−1)n · n
числа α и β так чтобы α < 1 6 β, то начиная с
(Ответ: α = −∞, β = ∞)
какого-то номера все xn будут лежать в интер- n n

вале (α; β). 4) xn = (−1)n + 1+(−1)2


(Ответ: α < 0, β > 1)
n
5) xn = 2 + 1+(−1)n
(Ответ: α < 2, β > 2)
n
0 1 2 α 3 1 β 6) xn = 2 − 1+(−1)n
2 3 4
(Ответ: α < 2, β > 2)
n

При этом ясно, что если α > 1 или β < 1, 7) xn = n(−1)


то утверждение, что почти все числа xn лежат (Ответ: α 6 0, β = ∞)
n
−1
в интервале (α; β) будет неверно. Поэтому ответ 8) xn = (−1)n · n(−1)
для второй половины задачи выглядит так (Ответ: α < 0, β > 1)
n
Ответ для пункта (b): α < 1 6 β. 9) xn = (−1)n + n(−1) −1

(Ответ: α 6 −1, β > 2)


⋄ 4.2.20. (a) Найдите какие-нибудь два числа α
n
и β такие, чтобы почти все элементы последо- 10) xn = n · (1 + (−1) )
n (Ответ: α < 0, β = ∞)
вательности xn = (−1) лежали в интервале n
(α; β). 11) xn = 2+(−1)
2 − n1
(b) Найдите все такие числа α и β, чтобы почти (Ответ: α < 12 , β > 23 )
n

все элементы последовательности xn = (−1) 12) xn = (−1)n · 1 − n1
лежали в интервале (α; β). (Ответ: α 6 −1, β > 1)
Снова нарисуем на прямой первые несколько 13) x = (−1)n · 1 + 1 
n n
элементов нашей последовательности (Ответ: α < −1, β > 1)
3

14) xn = (−1)n−1 · 2 + n
(Ответ: α < −2, β > 2)

−2 −1 1 2 ⊲⊲ 4.2.22. Опишите все интервалы (α, β), содер-


жащие почти все элементы следующих последо-
Из рисунка видно, что, например, вне интер- вательностей:
вала (−2; 2) нет вообще никаких чисел xn . Отсю- 1) xn = (−1)
n·(n+1)
2 ,
да следует n·(n+1)
Ответ для пункта (a): можно взять, напри- 2) xn = (−1) 2 + n1 ,
мер, α = −2 и β = 2. 3) xn = (−1)
n·(n+1)
2 − n1 ,
И вообще, если взять какие-нибудь другие n·(n+1) (−1)n
числа α и β так чтобы α < −1 и β > 1, то все xn 4) xn = (−1) 2 + n ,
будут лежать в интервале (α; β). (−1)
n·(n+1)
2
5) xn = n ,
2π·n
6) xn = cos 3 ,
2π·n 1
7) xn = cos 3 + n,
α −1 1 β 2π·n 1
8) xn = cos 3 − n,
2π·n (−1)n
9) xn = cos 3 + n ,
Если же α > 1 или β 6 1, то утверждение,
cos 2π·n
что почти все числа xn лежат в интервале (α; β) 10) xn = n
3
.
256 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Окрестность точки.
• Окрестностью точки c ∈ R называется всякий интервал с центром в точке c, то есть
всякий интервал вида (c − ε; c + ε). Число ε при этом называется радиусом окрестности
(c − ε; c + ε).

c−ε c c+ε

Предложение 4.2.23. Всякая точка x произвольного интервала (a, b) содержится в нем вместе
с некоторой своей окрестностью:

x ∈ (a, b) =⇒ ∃ε > 0 : (x − ε; x + ε) ⊆ (a, b)

Доказательство. Положим
ε = min{b − x; x − a}.
Тогда
( ( (
ε6b−x ε6b−x x+ε 6 b
=⇒ =⇒ =⇒
ε 6 x−a −ε > a − x x−ε > a
=⇒ a6x−ε<x<x+ε6b =⇒ x ∈ (x − ε, x + ε) ⊆ (a, b)

Конечный предел последовательности.


• Точка c ∈ R называется пределом последовательности {xn }, если любая ее окрестность
(c − ε; c + ε) содержит почти все элементы последовательности {xn }. В этом случае пишут

lim xn = c
n→∞

или
xn −→ c
n→∞

и говорят, что последовательность {xn } стремится к числу c.


Если последовательность {xn } имеет предел (то есть стремится к какому-то числу c), то
говорят, что последовательность {xn } сходится . Если же такого числа c не существует,
то говорят, что последовательность {xn } расходится .

⋄ 4.2.24. Покажем, что

n−1 xn ∈ (1 − ε; 1 + ε) ⇔ 1 − ε < xn < 1 + ε ⇔


lim =1 ( (
n→∞ n xn > 1 − ε n−1
⇔ ⇔ n >1−ε ⇔
n−1
то есть что точка c = 1 является пределом по- xn < 1 + ε n <1+ε
следовательности {xn = n−1 ( (
n }. n−1
− n1 > −ε
Действительно, возьмем какую-нибудь ⇔ n − 1 > −ε ⇔ ⇔
n−1
окрестность (1 − ε; 1 + ε) точки c = 1, n −1 < ε − n1 < ε

 1
 n <ε 1 1
⇔ ⇔ <ε ⇔ n>
 1
 −n < ε n ε
1−ε 1+ε
▼❇

0 1 2 3 1 поскольку ε > 0,
это неравенство выполняется автоматически для любого n ∈ N,
2 3 4
значит его можно отбросить

и поймем, что означает, что xn лежит в (1−ε; 1+ По теореме Архимеда 4.2.14, последнее нера-
ε): венство выполняется для почти всех n ∈ N. Это
§ 2. Предел последовательности 257

 1
означает, что почти все числа xn содержатся в  n+2 <ε
1
интервале (1 − ε; 1 + ε). ⇔ ⇔ <ε ⇔
Итак, мы получили, что любая окрестность 
 −
1
< ε n+2
n+2
(1 − ε; 1 + ε) точки c содержит почти все элемен-
ты последовательности {xn = n−1 ▼❇❇
n }. Это как раз
означает, что точка c = 1 является пределом по- поскольку ε > 0,
это неравенство выполняется автоматически для любого n ∈ N,
следовательности {xn = n−1 n }.
значит его можно отбросить

1 1
⋄ 4.2.25. Покажем, что ⇔ n+2> ⇔ n> −2
ε ε
1 6= lim (−1)n По теореме Архимеда 4.2.14, последнее неравен-
n→∞
ство выполняется для почти всех n ∈ N. Это
то есть что число c = 1 не является пределом означает, что почти все числа xn содержатся в
последовательности {xn = (−1)n }. интервале (2 − ε; 2 + ε).
Возьмем ε = 1 и рассмотрим соответствую- Итак, мы получили, что любая окрестность
щую окрестность (0; 2) точки c = 1. Тогда (2 − ε; 2 + ε) точки c = 2 содержит почти все
элементы последовательности {xn = 2n+3 n+2 }. Это
xn ∈ (0; 2) ⇔ означает, что точка c = 2 является пределом по-

 0 < (−1)n следовательности {xn = 2n+3 n+2 }.
⇔ ⇔ 0 < (−1)n
 (−1)n < 2 ⋄ 4.2.27. Покажем, что
▼❇❇ (−1)n
это неравенство выполняется автоматически для любого n ∈ N, lim =0
поэтому его можно отбросить n→∞ n
то есть что точка c = 0 является пределом по-
Последнее неравенство выполняется только для n

четных n ∈ N. следовательности {xn = (−1)


n }.
Мы получили, что бесконечное множество Возьмем какую-нибудь окрестность (−ε; ε)
элементов последовательности {xn = (−1) } не n точки c=0
принадлежит окрестности (0; 2) точки c = 1. Та-
ким образом, будет неверно утверждать, что по-
чти все {xn = (−1)n } содержатся в окрестности
(0; 2) точки c = 1. Это означает, что c = 1 не мо- −1 − 31 0 1 1 1
4 2
жет быть пределом последовательности {xn =
(−1)n }. n
и покажем, что почти все числа xn = (−1)n со-
⋄ 4.2.26. Покажем, что держатся в интервале (−ε; ε). Действительно,

2n + 3
lim =2
n→∞ n+2
xn ∈ (−ε; ε) ⇔ (4.1.16) ⇔

то есть что точка c = 2 является пределом по- (−1)n
следовательности {xn = 2n+3 ⇔ |xn | < ε ⇔ <ε ⇔
n+2 }. n
Возьмем какую-нибудь окрестность (2 − ε; 2 +
⇔ (4.1.7), (4.1.8), (4.1.5) ⇔
ε) точки c = 2
| − 1|n 1 1
⇔ <ε ⇔ <ε ⇔ n>
n n ε

По теореме Архимеда 4.2.14, последнее нера-


5 7 9 2−ε 2 2+ε венство выполняется для почти всех n ∈ N. Это
3 4 5
означает, что почти все числа xn содержатся в
Тогда окрестности (−ε; ε) точки c = 0. Таким образом,
точка c = 0 действительно является пределом
последовательности {xn = 2n+3
n+2 }.
xn ∈ (2 − ε; 2 + ε) ⇔ 2 − ε < xn < 2 + ε ⇔
( ( ⋄ 4.2.28. Покажем, что
2n+3
xn > 2 − ε n+2 > 2 − ε
⇔ ⇔ ⇔ n
xn < 2 + ε 2n+3
n+2 < 2 + ε
0 6= lim n(−1)
n→∞
( (
2n+3 1
⇔ n+2 − 2 > −ε ⇔
− n+2 > −ε
⇔то есть что точка c = 0 не является пределом
2n+3 1 n
n+2 − 2 < ε − n+2 <ε последовательности {xn = n(−1) }.
Возьмем интервал (−1; 1), являющийся
окрестностью точки c = 0 (при ε = 1).
258 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
   
n = 2k 
 ∗ 
 k ∈ N  
 
⇔  2k < 1  ⇔
n = 2k − 1
 
 k ∈ N∗ 
 1 
2k−1 < 1
−1 0 1 1 2 3 4
3
эта система не имеет решений,
поэтому ее можно выбросить из совокупности
и посмотрим, что будет означать условие xn ∈
(−1; 1).
  ✂✌✂ 
Для этого нужно будет рассмотреть отдель- 
n = 2k
но четные и нечетные номера n. Тогда условие  
 k ∈ N∗   
xn ∈ (−1; 1) распадется в совокупность двух си-   1  
 k< 2  n = 2k − 1
стем:  
( ⇔   ⇔ k ∈ N∗
   
−1 < xn n = 2k − 1 k>1
xn ∈ (−1; 1) ⇔ ⇔  
xn < 1  k ∈ N∗ 
 
n 2k − 1 > 1
поскольку всегда n(−1) > 0,
это неравенство выполняется автоматически для любого n ∈ N,
значит его можно отбросить
Мы видим, что условие xn ∈ (−1; 1) выполняется
✂✌✂
только для индексов n = 3, 5, 7.... Таким образом,
 бесконечное множество чисел xn (с четными ин-
 −1 < n(−1)n

n
⇔ n(−1) < 1 ⇔ дексами n) не содержатся в окрестности (−1; 1)
 n(−1)n < 1 точки c = 0. Значит эта точка не может быть
n
  пределом последовательности {xn = n(−1) }.

 n – четное: n = 2k, k ∈ N∗ 
  
 тогда (−1)n = (−1)2k = 1 
 и при подстановке получается: 
 
 
 (2k)1 < 1 
⇔    
n – нечетное: n = 2k − 1, k ∈ N∗  ⇔
 
 
 тогда (−1)n = (−1)2k−1 = −1 
 
 и при подстановке получается: 

 

(2k − 1)−1 < 1

Теорема 4.2.29 (о единственности предела). Если

xn −→ a
n→∞

и
xn −→ b
n→∞
то
a=b
Доказательство. Предположим, что a 6= b, например a < b. Возьмем ε = b−a 2 , тогда мы получим,
что почти все xn лежат в двух непересекающихся интервалах – в (a − ε; a + ε) и в (b − ε; b + ε):

xn xn
n
n
↓ ↓ ↓ ↓


a−ε< a <a+ε=b−ε< b <b+ε
| {z } | {z }
⇓ ⇓
xn ∈ (a − ε, a + ε) xn ∈ (b − ε, b + ε)
для почти всех n ∈ N∗ для почти всех n ∈ N∗

Но это невозможно: если почти все xn лежат в (a − ε; a + ε), то вне (a − ε; a + ε) должен лежать
лишь конечный набор чисел xn . В частности, в (b − ε; b + ε) тоже должен лежать лишь конечный
набор чисел xn .
§ 2. Предел последовательности 259

⊲⊲ 4.2.30. Доказать что 4) limn→∞ 1−n


n+1 = −1,
1 1
1) limn→∞ n3 = 0, 5) limn→∞ 1+2 n = 0,
n−3
2) limn→∞ 2n+5 = 12 , 6) 1 6= limn→∞ (−1)n ,
3) limn→∞ n2 +1
= 1, 7) 0 6= limn→∞ (−1)n · n.
n2 +2

Бесконечный предел последовательности.


• Говорят, что числовая последовательность {xn }
– стремится к +∞
xn −→ +∞
n→∞

если любой интервал (E; +∞) содержит почти все элементы {xn }.
– стремится к −∞
xn −→ −∞
n→∞

если любой интервал (−∞; E) содержит почти все элементы {xn }.


– стремится к ∞
xn −→ ∞
n→∞

если всякое множество (−∞; −E) ∪ (E; +∞) содержит почти все элементы {xn };
нетрудно проверить, что это равносильно тому, что последовательность из мо-
дулей {|xn |} стремится к +∞:

|xn | −→ +∞
n→∞

⋄ 4.2.31. Покажем, что

lim n2 = +∞
n→∞

Возьмем какой-нибудь интервал (E; +∞)

−1 0 1 1 2
3

1 2 3 4 5 6 7E8 9 10 и рассмотрим нечетные номера n, то есть чис-


ла вида n = 2k − 1, где k ∈ N∗ . Тогда (−1)n =
Тогда (−1)2k−1 = −1, и

xn ∈ (E; +∞) ⇔ xn > E ⇔ n2 > E xn ∈ (−∞; −1) ∪ (1; +∞) ⇔ |xn | > 1 ⇔
(−1)n
Заметим далее такую цепочку: ⇔ n >1 ⇔
 применяем равенства 
⇔ n = 2k − 1, ⇔
n > E верно для почти всех n ∈ N∗ (−1)n = (−1)2k−1 = −1

по теореме Архимеда 4.2.14 ⇔ (2k − 1)−1 > 1 ⇔ 2k − 1 < 1 ⇔


⇔ k<1

n > n > E верно для почти всех n ∈ N∗
2 Последнее неравенство не выполняется ни при
каком k = 1, 2, 3... Это означает, что все чис-
⇓ ла x2k−1 не содержатся в множестве (−∞; −1) ∪
2
n > E верно для почти всех n ∈ N ∗ (1; +∞). Таким образом, бесконечное множество
чисел xn не содержатся в “окрестности беско-
⋄ 4.2.32. Покажем, что последовательность нечности” (−∞; −1) ∪ (1; +∞). Значит, бесконеч-
n
{xn = n(−1) } не стремится к бесконечности: ность не может быть пределом последовательно-
n
сти {xn = n(−1) }.
(−1)n
n −→
6 ∞
n→∞ ⊲⊲ 4.2.33. Доказать что
Возьмем множество (−∞; −1) ∪ (1; +∞)
260 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

2
4n+1 n
1) limn→∞ 3n−2 6= +∞; 2) limn→∞ 1−2n = −∞;
n
3) limn→∞ (−1) · n = ∞.

Бесконечно малые и бесконечно большие последовательности.


• Последовательность {xn } называется бесконечно малой , если выполняются следующие
равносильные условия:
(i) {xn } стремится к нулю:
xn −→ 0
n→∞

(ii) {xn } по модулю стремится к нулю:

|xn | −→ 0
n→∞

Доказательство. Здесь необходимо проверить, что условия (i) и (ii) действительно равносильны.
Для этого перепишем свойство модуля 20 пункта 0.6, подставив вместо x последовательность {xn }:

xn ∈ (−ε; +ε) ⇐⇒ |xn | ∈ (−ε; +ε)

После этого получается следующая цепочка равносильностей:

xn −→ 0
n→∞

m
для всякого ε > 0 соотношение xn ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
для всякого ε > 0 соотношение |xn | ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
|xn | −→ 0
n→∞

• Последовательность {xn } называется бесконечно большой , если выполняются следующие


равносильные условия:
(i) {xn } стремится к бесконечности

xn −→ ∞
n→∞

(ii) {xn } по модулю стремится к бесконечности

|xn | −→ ∞
n→∞

Доказательство равносильности условий (i) и (ii).

xn −→ ∞
n→∞

m
для всякого ε > 0 соотношение xn ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N
m (4.1.17)

для всякого ε > 0 соотношение |xn | ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N
m
|xn | −→ ∞
n→∞
§ 2. Предел последовательности 261

Теорема 4.2.34 (о связи между бесконечно малыми и бесконечно большими последовательностями).


Пусть xn 6= 0. Тогда последовательность {xn } бесконечно малая тогда и только тогда, когда по-
следовательность { x1n } бесконечно большая.

Доказательство.
{xn } – бесконечно малая
m
xn −→ 0
n→∞

m
∀ε > 0 |xn | < ε – верно для почти всех n ∈ N∗
m

1 1
∀ε > 0 > – верно для почти всех n ∈ N∗
xn ε

m

1
∀E > 0 >E – верно для почти всех n ∈ N∗
xn

m
1
−→ ∞
xn n→∞
m
 
1
– бесконечно большая.
xn

Теорема 4.2.35 (о связи между бесконечно малыми последовательностями и конечными предела-


ми). Последовательность {xn } стремится к числу a

xn −→ a
n→∞

тогда и только тогда, когда она имеет вид

xn = a + αn

где {αn } – некоторая бесконечно малая последовательность.

Доказательство. Положим
αn = xn − a
и заметим сразу, что

(
a − ε < xn
xn ∈ (a − ε; a + ε) ⇐⇒ a − ε < xn < a + ε ⇐⇒ ⇐⇒
xn < a + ε
(
−ε < xn − a
⇐⇒ ⇐⇒ −ε < xn − a < ε ⇐⇒ −ε < αn < ε ⇐⇒ αn ∈ (−ε; ε)
xn − a < ε

поэтому окрестность (a − ε; a + ε) точки a содержит почти все элементы последовательности xn в


том и только в том случае, если окрестность (−ε; ε) точки 0 содержит почти все элементы после-
довательности αn .
Отсюда следует, что если xn −→ a (то есть любая окрестность (a − ε; a + ε) точки a содержит
n→∞
почти все элементы последовательности xn ), то это равносильно тому, что αn −→ 0 (то есть тому,
n→∞
что любая окрестность (−ε; ε) точки 0 содержит почти все элементы последовательности αn ).
262 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Свойства бесконечно малых последовательностей


1◦ Если {αn } – бесконечно малая последовательность, то для любого числа C ∈ R последова-
тельность {C · αn } – тоже бесконечно малая.
2◦ Если {αn } и {βn } – бесконечно малые последовательности, то {αn + βn } и {αn − βn } –
тоже бесконечно малые последовательности.
3◦ Если {αn } и {βn } – бесконечно малые последовательности, то {αn · βn } – тоже бесконечно
малая последовательность.
Доказательство. 1. Пусть {αn } – бесконечно малая последовательность. Тогда если C = 0, то

C · αn = 0 −→ 0
n→∞

и поэтому {C · αn } – тоже бесконечно малая. Рассмотрим случай, когда C 6= 0. Тогда:

{αn } – бесконечно малая

m
αn −→ 0
n→∞

m
∀ε > o |αn | < ε – верно для почти всех n ∈ N∗
m
ε
∀ε > o |αn | < – верно для почти всех n ∈ N∗
|C|
m
∀ε > o |C · αn | < ε – верно для почти всех n ∈ N∗
m
{C · αn } – бесконечно малая
2. Пусть {αn } и {βn } – бесконечно малые последовательности, покажем что тогда {αn + βn } –
тоже бесконечно малая последовательность:

{αn } и {βn } – бесконечно малые


αn −→ 0, βn −→ 0
n→∞ n→∞


∀ε > o |αn | < ε & |βn | < ε – верно для почти всех n ∈ N∗

ε ε
∀ε > o |αn | < & |βn | < – верно для почти всех n ∈ N∗
2 2

ε ε
∀ε > o |αn + βn | 6 |αn | + |βn | < + – верно для почти всех n ∈ N∗
2 2

{αn + βn } – бесконечно малая
Точно так же рассматривается случай {αn − βn }.
3. Пусть снова {αn } и {βn } – бесконечно малые последовательности, покажем что {αn · βn } –
тоже бесконечно малая последовательность:

{αn } и {βn } – бесконечно малые


§ 2. Предел последовательности 263

αn −→ 0, βn −→ 0
n→∞ n→∞


∀ε > 0 |αn | < ε & |βn | < ε – верно для почти всех n ∈ N∗

∀ε ∈ (0; 1) |αn | < ε & |βn | < ε – верно для почти всех n ∈ N∗

∀ε ∈ (0; 1) |αn · βn | = |αn | · |βn | < ε2 < ε – верно для почти всех n ∈ N∗

∀ε > o |αn · βn | < ε – верно для почти всех n ∈ N∗

{αn · βn } – бесконечно малая.

Свойства бесконечно больших последовательностей


1◦ Если C 6= 0 и yn −→ ∞, то C · yn −→ ∞.
n→∞ n→∞
2◦ Если xn −→ C 6= ∞, а yn −→ ∞, то xn + yn −→ ∞.
n→∞ n→∞ n→∞
3◦ Если xn −→ C 6= 0, а yn −→ ∞, то xn · yn −→ ∞.
n→∞ n→∞ n→∞
yn
4◦ Если xn −→ C 6= ∞, а yn −→ ∞, то xn n→∞ ∞.
−→
n→∞ n→∞
5◦ Если xn −→ ∞ и |xn | 6 yn , то yn −→ ∞.
n→∞ n→∞

Доказательство. Мы докажем только второе из этих свойств (остальные доказываются аналогич-


но):
xn −→ C 6= ∞ yn −→ ∞
n→∞ n→∞
⇓ ⇓
|xn | − |C| 6 (4.1.12) 6 |xn − C| < 1 ∀D > 0 |yn | > D + |C| + 1
| {z } | {z }
↑ ↑
верно для почти всех n ∈ N∗ верно для почти всех n ∈ N∗

|xn | < |C| + 1
| {z }

верно для почти всех n ∈ N∗
| {z }


D + |C| + 1
>

z}|{
∀D > 0 |yn +xn | > (4.1.11) > |yn | −|xn | > (D+|C|+1)−|C|−1 = D – верно для почти всех n ∈ N∗
| {z }
<

−|C| − 1


xn + yn −→ ∞
n→∞

⋄ 4.2.36. Для любого α 6= 0 последовательность {α·n}n∈N∗ является бесконечно большой, точнее:


(
+∞, если α > 0
lim n · α = (4.2.45)
n→∞ −∞, если α < 0
264 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство. 1. Пусть сначала α > 0. Тогда ⋄ 4.2.38. Последовательность an является


для любого E > 0 условие
– бесконечно малой, если |a| < 1;
n·α >E – бесконечно большой, если |a| > 1.
эквивалентно условию То есть,
E
n> (
α ∞, если |a| > 1
n
которое по теореме Архимеда 4.2.14 выполняется lim a = (4.2.47)
n→∞ 0, если |a| < 1
для почти всех n. Это означает, что
n · α −→ +∞ Доказательство. 1. Если |a| > 1, то это означает
n→∞
либо a > 1, либо a < −1. Рассмотрим каждый из
2. Если же α < 0, то для любого E > 0 усло-
этих случаев отдельно. Если a > 1, то применяя
вие
неравенство Бернулли (3.2.103), мы получим
n · α < −E
эквивалентно условию (3.2.103)
|a|n = an = (1+(a−1))n > 1+n·(a−1) −→ ∞
E n→∞
n>−
α
и опять по теореме Архимеда 4.2.14 это выпол- ⇓ ◦
5 на с.263

няется для почти всех n. Это означает, что


an −→ ∞
n · α −→ −∞ n→∞
n→∞
Если же a < −1, то |a| = −a > 1, и по уже дока-
занному,
⋄ 4.2.37. Последовательность {nk }n∈N∗ являет- |a|n = (−a)n −→ ∞
ся n→∞

– бесконечно малой, если k < 0; 2. Пусть наоборот, |a| < 1. Тогда a1 = 1
|a| > 1,
– бесконечно большой, если k > 0. и мы получаем
Точнее, уже
( n доказано
1 1
0, если k < 0 = −→ ∞
lim nk = (4.2.46) |a|n a n→∞
n→∞ +∞, если k > 0

Доказательство. 1. Пусть k > 0. Применяя ⇓ теорема 4.2.34


неравенство Бернулли (3.2.103), мы получим
|a|n −→ 0
(3.2.103) n→∞
nk = (1 + (n − 1))k >
(4.2.45)
> 1 + k · (n − 1) = 1 − k + k · n −→ +∞
n→∞

⇓ 5◦ на с.263
⊲ 4.2.39. Какие из последовательностей явля-
ются бесконечно малыми, а какие – бесконечно
nk −→ ∞ большими?
n→∞
2. Пусть k < 0. Тогда −k > 0, и, по уже дока- 1) xn = 1
n,
занному, 1
n−k −→ ∞ 2) xn = n2 ,
n→∞
3) xn = n,
⇓ теорема 4.2.34
4) xn = (−1)n · n,
1
nk = −→ 0 5) xn = (−1)
n

n−k n→∞ n ,
2
7) xn = n .

Арифметические операции с пределами. Следующие свойства пределов связаны с арифме-


тическими операциями.
10 . Если xn −→ a, то для всякого числа C ∈ R справедливо C · xn −→ C · a.
n→∞ n→∞
§ 2. Предел последовательности 265

20 . Если xn −→ a и yn −→ b, то xn + yn −→ a + b и xn − yn −→ a − b.
n→∞ n→∞ n→∞ n→∞
30 . Если xn −→ a и yn −→ b, то xn · yn −→ a · b.
n→∞ n→∞ n→∞
yn
40 . Если xn −→ a и yn −→ b, причем a 6= 0 и xn 6= 0 (при любом n), то −→ ab .
xn n→∞
n→∞ n→∞

Доказательство свойств 10 -30 . 1. Свойство 10 доказывается такой логической цепочкой:

xn −→ a
n→∞

⇓ теорема 4.2.35

xn = a + αn
|{z}
n
↓ ↓

0

C · xn = C · a + C · αn
| {z }
n
↓ ↓ (свойство 10 на с.262)

0

⇓ теорема 4.2.35

C · xn −→ C · a
n→∞

2. Свойство 20 :
xn −→ a, yn −→ b
n→∞ n→∞

⇓ теорема 4.2.35

xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0

xn + yn = a + b + αn + βn
| {z }
n
↓ ↓ (свойство 20 на с.262)

0

⇓ теорема 4.2.35

xn + yn −→ a + b
n→∞

И точно так же для xn − yn .


3. Свойство 30 :
xn −→ a, yn −→ b
n→∞ n→∞

⇓ теорема 4.2.35

xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0


266 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
 
свойство 10
на с.262
0

↑ ↑
n
z }| {
xn · yn = a · b + αn · b + a · βn + αn · βn
| {z } | {z }
n n
↓ ↓ ↓ ↓
∞ ∞
 0   0 
свойство 10 свойство 30
на с.262 на с.262
| {z }
n
0
↓ ↓ (свойство 2 на с.262)

0

⇓ теорема 4.2.35

xn · yn −→ a · b
n→∞

Для доказательства последнего свойства нам понадобится следующая


Лемма 4.2.40. Если последовательность {xn } стремится к числу a, причем xn 6= 0 и a 6= 0, то
последовательность { x1n } стремится к числу a1 :

1 1
xn −→ a (xn 6= 0 & a 6= 0) =⇒ −→
n→∞ xn n→∞ a
Доказательство. По условию, a 6= 0, значит либо a < 0, либо a > 0.
1
1. Рассмотрим сначала случай, когда a > 0. Тогда в силу (3.1.29), a > 0. Выберем произвольное
ε такое, что
1
0<ε<
a
Тогда
ε · a > 0 > −ε · a

1+ε·a>1 > 1−ε·a

1 1
<1<
1+ε·a 1−ε·a

a a
<a<
1+ε·a 1−ε·a
⇓ предложение 4.2.23
a a
∃δ > 0 : <a−δ <a<a+δ <
1+ε·a 1−ε·a
Запомним это число δ и заметим теперь цепочку:

xn −→ a
n→∞


xn ∈ (a − δ, a + δ) – выполняется для почти всех n ∈ N∗

a a
< a − δ < xn < a + δ < – выполняется для почти всех n ∈ N∗
1+ε·a 1−ε·a

a a
< xn < – выполняется для почти всех n ∈ N∗
1+ε·a 1−ε·a
§ 2. Предел последовательности 267


1+ε·a 1 1−ε·a
> > – выполняется для почти всех n ∈ N∗
a xn a

1 1 1
+ε> > −ε – выполняется для почти всех n ∈ N∗
a xn a

 
1 1 1
∈ − ε, + ε – выполняется для почти всех n ∈ N∗
xn a a

Мы получили, что любая “маленькая” окрестность a1 − ε; a1 + ε точки a1 (радиуса ε < a1 ) содер-
жит почти все элементы последовательности x1n . Отсюда следует, что любая “большая” окрестность
1 1
 1 1 1
a − ε; a + ε точки a (радиуса ε > a ) тоже содержит почти все элементы последовательности xn
(потому что в ней можно выбрать какую-нибудь “маленькую” окрестность, которая будет содержать
почти все x1n ). Вместе это означает, что x1n −→ a1 .
n→∞
2. Мы доказали нашу лемму для случая, когда a > 0. Рассмотрим теперь случай a < 0. Тогда
будет по уже доказанному свойству 10 с.264 последовательность yn = −xn стремиться к числу
−a > 0. Значит, в силу уже доказанного в нашей лемме,
1 1
−→
yn n→∞ −a

откуда опять по свойству 10 с.264,


1 1 1 1
=− −→ − =
xn yn n→∞ −a a

Доказательство свойства 40 .
0 0
6=

6=

xn −→ a, yn −→ b
n→∞ n→∞
лемма 4.2.40 ⇓
1
−→ a1
xn n→∞
| {z }

⇓ свойство 30 на с.264

yn 1 1 b
= · yn −→ ·b=
xn xn n→∞ a a

Ограниченные последовательности. Последовательность {xn } называется ограниченной, если


множество чисел X = {xn } ограничено (сверху и снизу), то есть существуют такие числа C, D, что
для любого n ∈ N выполняется
C 6 xn 6 D

C x1 x2 x3 x4 D
268 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
 
⋄ 4.2.41. Проверьте, будут ли следующие после- n2 + 1 n2 + 1
xn = , xn = ,
довательности ограничены? n n

n+1 Какие из них сходятся (то есть имеют конечный


xn = (−1)n , xn = , предел)?
n

Теорема 4.2.42 (об ограниченности сходящейся последовательности). Всякая сходящаяся после-


довательность ограничена.

Свойства ограниченных последовательностей


1◦◦ Если {xn } – ограниченная последовательность, а {yn } – бесконечно малая последователь-
ность, то {xn · yn } – бесконечно малая последовательность.
2◦◦ Если {xn } – ограниченная последовательность, а {yn } – бесконечно большая последова-
тельность, то { xynn } – бесконечно малая последовательность.
3◦◦ Если {xn } – ограниченная последовательность, а {yn } – бесконечно большая последова-
тельность, то {xn + yn } – бесконечно большая последовательность.

⋄ 4.2.43. Найти предел ⊲⊲ 4.2.44. Найдите пределы


n
(−1)
lim n o
n→∞ n n3
n+1
Поскольку последовательность в числителе lim ,
(xn = (−1)n ) ограничена, а последовательность n→∞ n
в знаменателе (yn = n) бесконечно большая, по n+5
lim  ,
n
n→∞ n + n + 1
свойству 200 дробь xynn = (−1)
n должна быть бес- n 2 2
o
конечно малой, то есть n + n n+2+n+1

(−1)n lim n o
n→∞ 3 +5
lim =0 n − nn+5
n→∞ n

Вычисление пределов простейших последовательностей. Теперь, когда доказаны главные


свойства сходящихся последовательностей, мы, наконец, можем научиться вычислять простейшие
пределы. Для этого полезно переформулировать сказанное выше в виде следующей серии формул.
Это, во-первых, “арифметические формулы”:

lim (C · xn ) = C · lim xn (4.2.48)


n→∞ n→∞
lim (xn + yn ) = lim xn + lim yn (4.2.49)
n→∞ n→∞ n→∞
lim (xn − yn ) = lim xn − lim yn (4.2.50)
n→∞ n→∞ n→∞
lim (xn · yn ) = lim xn · lim yn (4.2.51)
n→∞ n→∞ n→∞
yn limn→∞ yn
lim = (4.2.52)
n→∞ xn limn→∞ xn

И, во-вторых – “эвристические” (здесь C ∈ R, причем в строчке (4.2.53) это произвольное число,


а во всех остальных строчках — ненулевое: C 6= 0):

C ∞
= 0 = ∞ (4.2.53)
∞ C
C 0
= ∞, = 0 (4.2.54)
0 C
C +∞= ∞ C ·∞= ∞ (4.2.55)
∞+∞= ∞ ∞·∞= ∞ (4.2.56)
§ 2. Предел последовательности 269

∞ 0
=? =? (4.2.57)
∞ 0
∞−∞= ? 0·∞= ? (4.2.58)

Здесь вопросительные знаки в последних четырех формулах означают, что в рассматриваемых


случаях сказать определенно, чему равен предел, невозможно, и требуется дополнительное иссле-
дование. Эти ситуации объединяются общим термином неопределенность, и что он означает легче
всего понять из примеров ниже.
Эти правила надо понимать вот как. Если, например, вам нужно найти предел
xn
lim
n→∞ yn
и вы знаете, что
lim xn = C, lim yn = ∞,
n→∞ n→∞

то по левому правилу (4.2.53) вы можете сразу сказать, что


xn
lim = 0.
n→∞ yn
Точно так же, если
lim xn = ∞, lim yn = C,
n→∞ n→∞

то по правому правилу (4.2.53)


xn
lim = ∞.
n→∞ yn
И так далее.

⋄ 4.2.45. Вычислим предел 1−0 1


= =
2+3·0 2
n−1
lim Итак, со второй попытки мы получили ответ: 12 .
n→∞ 2n + 3
На этом обсуждение этого примера можно
Если попробовать применить формулы (4.2.49)– закончить, но перед этим мы хотели бы пока-
(4.2.52) сразу, то мы увидим, что ответа не полу- зать, как можно сократить количество писанины
чается: в подобных вычислениях, одновременно, сделав
их более наглядными. Коротко и просто нашу
(4.2.52) (4.2.48)
n−1 ↓ limn→∞ (n − 1) ↓ первую попытку можно записать так:
lim = =
n→∞ 2n + 3 limn→∞ (2n + 3) n−1 ∞−1 ∞
(4.2.55) (4.2.57) lim = = =?
limn→∞ n − 1 ∞−1 ↓ ∞ ↓ n→∞ 2n + 3 2·∞+3 ∞
= = = = ?
2 · limn→∞ n + 3 2·∞+3 ∞ А вторую – так:
Появившийся вопросительный знак означает, ✯
✟ 0
1
что таким способом найти предел невозможно, 1−
n−1 n 1−0 1
и это тот случай, когда принято говорить, что lim = lim = =
n→∞ 2n + 3 n→∞ 3 2+0 2
возникает неопределенность. Это в свою очередь | {z } 2+
n
означает, что нужно искать какой-то другой спо- делим числитель
и знаменатель на n ❥
❍ 0
соб (при котором этой неопределенности не воз-
никнет). Ниже мы постараемся всюду пользоваться такой
Для этого обычно бывает достаточно преоб- “наглядной” записью, поэтому будет хорошо, ес-
разовать подходящим образом выражение под ли читатель уже сейчас обратит на нее внимание.
пределом. В нашем случае можно поделить чис- ⋄ 4.2.46. Вычислим предел
литель и знаменатель на n:
3n2 + 5n + 7
1− 1
limn→∞ (1 − 1 lim
n−1 n n) n→∞ 8n2 − 4n + 1
lim = lim 3 = 3 =
n→∞ 2n + 3 n→∞ 2 + limn→∞ (2 + n) Здесь также первая попытка ничего не дает, по-
| {z } n
делим числитель тому что неопределенность возникает на этот раз
и знаменатель на n
в знаменателе:
1
1 − limn→∞ n 1 − limn→∞ n1 3n2 + 5n + 7 3 · ∞2 + 5 · ∞ + 7 ∞
= 3 = = lim = =
2 + limn→∞ n 2 + 3 · limn→∞ n1 2
n→∞ 8n − 4n + 1 8 · ∞2 − 4 · ∞ + 1 ?
270 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
o n o
Поэтому мы снова преобразуем дробь, прежде − n(n2 + 14n + 49) : n2 =
чем пользоваться правилами (4.2.49)–(4.2.52):
15n2 + 75n + 125 − 14n2 + 49n
= lim =
0 0 n→∞ n2
✒ ✒ n2 + 26n + 125
3+
5
+
7 = lim =
3n2 + 5n + 7 n n2
n→∞ n2 !
lim = lim =
n→∞ 8n2 − 4n + 1 n→∞ 4 1 26 125
| {z } 8− + = lim 1+ + =1+0+0=1
n n2 n→∞ n n2
делим числитель
и знаменатель на n2 ❘0
❅ ❘0
❅ ❘0
❅ ❘0

3+0+0 3
= = ⋄ 4.2.50. Докажем формулу:
8−0−0 8

⋄ 4.2.47. Вычислим предел 
0, k<l
Cnk 1
−→ ,
k=l (4.2.59)
5n2 − n + 1 nl n→∞  k!

lim 3 ∞, k > l
n→∞ n + n2 + 2

Здесь у нас уже достаточно опыта, чтобы сооб- Доказательство. Начнем со случая k = l:
разить сразу, что первая попытка “подставить в
лоб” снова приведет к неопределенности, поэто- Cnk n!
му мы можем сразу перейти к преобразованию = k =
nk n · k! · (n − k)!
дроби: k множителей
z }| {
0 0 0 n · (n − 1) · ... · (n − k + 1)
✒ ✒ ✒ = =
5 1 1 |n · n{z· ... · n} ·k!
− 2 + 3
5n2 − n + 1 n n n k множителей
lim 3 2
= lim = 0 0
n→∞ n + n + 2 n→∞ 1 2
| {z } 1+
n
+ 3
n  ✒  ✒
делим числитель 1 k−1
и знаменатель на ❘
❅ ❘
❅ 1− · ... · 1 −
0 0
n n 1
максимальную степень n, = −→
то есть на n3
k! n→∞ k!

0−0+0 После этого при k < l мы получим:


= =0
1+0+0
⋄ 4.2.48. В следующем примере читатель уже Cnk 1 Ck
l
= l−k · kn −→ 0
сразу должен сообразить, что без преобразова- n n n n→∞
ний ничего не получится, поэтому о “подстановке ❘
❅ ❘
❅ 1
в лоб” мы уже и не заикаемся: 0 k!

0 0
А при k > l мы получим:
✒ ✒
1+
1
+
5 Cnk Ck
n4 + n2 + 5 n2 n4 l
= nk−l · kn −→ ∞
lim 3 = lim = n n n→∞
n→∞ n − 3n + 2 n→∞ 1 3 2 ❘

| {z }
n

n3
+
n4
∞ ❅ 1

делим числитель k!
и знаменатель на ❘0
❅ ❘0
❅ ❘0

максимальную степень n,
то есть на n4
1+0+0 1 ⊲⊲ 4.2.51. Вычислите пределы
= = = ∞ 2−n
0−0+0 0 ↑ 1) limn→∞ 3n+4
(4.2.54)

n2 −3
2) limn→∞
⋄ 4.2.49. 3n−4n2
3+2n+n2
3) limn→∞ 4−9n+4n3
раскрываем скобки
z }| { n2 +1 3n2 +1
4) limn→∞ −
(n + 5)3 − n(n + 7)2 2n+1 6n+1
lim = n2 +2n+1
2 5) limn→∞
nn
n→∞ n+5
= lim n3 + 15n2 + 75n + 125− 6) limn→∞ n3 −n2 +1
n→∞ 5−n−n2
§ 2. Предел последовательности 271

(b) Теоремы о последовательностях


Предельный переход в неравенствах.

Теорема 4.2.52 (о предельном переходе в неравенстве с конечным пределом). 3


Если последова-
тельности {xn }, {yn } связаны неравенством

xn 6 yn (4.2.60)

и сходятся
xn −→ a yn −→ b
n→∞ n→∞

то их пределы связаны тем же неравенством

a6b
a−b
Доказательство. Предположим, что b < a. Тогда можно взять ε = 2 . Из xn −→ a будет следо-
n→∞
вать, что почти все числа xn лежат в окрестности (a − ε; a + ε). То есть, для почти всех номеров
n ∈ N выполняется неравенство
a − ε < xn < a + ε
С другой стороны, из yn −→ a будет следовать, что почти все числа yn лежат в окрестности
n→∞
(b − ε; b + ε). То есть, для почти всех номеров n ∈ N выполняется неравенство

b − ε < yn < b + ε

Таким образом, у нас получается, что для почти всех номеров n ∈ N выполняются неравенства

yn < b + ε = a − ε < xn

То есть, для почти всех n ∈ N


yn < xn
Это противоречит условию (4.2.60).

Аналогично доказывается

Теорема 4.2.53 (о предельном переходе в неравенстве с бесконечным пределом). Пусть последо-


вательности {xn }, {yn } связаны неравенством

xn 6 yn

тогда
— если xn −→ +∞, то yn −→ +∞;
n→∞ n→∞
— если yn −→ −∞, то xn −→ −∞.
n→∞ n→∞

Теорема 4.2.54 (о двух милиционерах). 4


Пусть последовательности {xn }, {yn }, {zn } связаны неравенствами

xn 6 yn 6 zn

причем две крайние из них сходятся к одному пределу

xn −→ C zn −→ C
n→∞ n→∞

Тогда средняя последовательность тоже стремится к этому пределу:

yn −→ C
n→∞
3 Этот результат используется ниже в разных ситуациях, в частности, при доказательстве теоремы 4.3.20 о сохра-
нении знака непрерывной функцией
4 Эта теорема также используется довольно часто, например, при доказательстве теоремы Больцано-Вейерштрасса

4.2.68, при доказательстве непрерывности модуля, синуса и косинуса (предложение 5.1.49) и при доказательстве
замечательных пределов (теоремы 5.2.58 и 5.2.64).
272 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство. Возьмем произвольную окрестность (C − ε; C + ε) точки C. Тогда


1) поскольку xn −→ C, почти все числа xn содержатся в окрестности (C − ε; C + ε); поэтому
n→∞
для почти всех номеров n ∈ N выполняется неравенство
C − ε < xn
то есть для почти всех номеров n ∈ N выполняется
C − ε < xn 6 yn
2) поскольку zn −→ C, почти все числа zn содержатся в окрестности (C − ε; C + ε); поэтому
n→∞
для почти всех номеров n ∈ N выполняется неравенство
zn < C + ε
то есть для почти всех номеров n ∈ N выполняется
yn 6 zn < C + ε
Итак, мы получили, что для почти всех номеров n ∈ N выполняются неравенства
C − ε < yn yn < C + ε
Это означает, что почти все числа yn содержатся в окрестности (C − ε; C + ε) точки C. Поскольку
это верно для любой окрестности, мы получаем, что yn −→ C,
n→∞

⋄ 4.2.55. Докажем формулу: ⇓ теорема 4.2.54


(
nk 0, |a| > 1 nk
n
−→ (k ∈ Z) (4.2.61) −→ 0
a n→∞ ∞, |a| < 1 an n→∞
Доказательство. Очевидно, здесь достаточно 3. Если k 6 0 и 0 < a < 1, то, по уже доказан-
рассмотреть случай, когда a > 0. ному,
1. Если k < 0 и a > 1, то все очевидно: n−k
−→ 0
nk 1 1 (a−1 )n n→∞
= −k · n −→ 0
an n
|{z} a n→∞
|{z} ⇓
↓ ↓
0 0  −1
nk n−k
= −→ ∞
2. Пусть k > 0 и a > 1. Тогда a = 1 + ε, ε > 0, an (a−1 )n n→∞
и при n > k + 1 мы получаем цепочку:
n
4. Наконец, при k > 0 и 0 < a < 1 все опять
X очевидно:
n n
a = (1 + ε) = Cni εi > Cnk+1 εk+1
i=0  n
nk 1
⇓ nk ·
= |{z} −→ ∞
an a n→∞
n k
n k
1 nk ↓ | {z }
06 6 = · −→ 0 ∞ ↓
an Cnk+1 εk+1 k+1
|ε {z } Cnk+1 n→∞ ∞
| {z }
константа
↓ (4.2.59)
0

Монотонные последовательности и теорема Вейерштрасса. Последовательность {xn } на-


зывается
– возрастающей, если
x1 < x2 < x3 < ... < xn < xn+1 < ...

x1 x2 x3 x4
§ 2. Предел последовательности 273

– убывающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...

x4 x3 x2 x1

– неубывающей, если
x1 6 x2 6 x3 6 ... 6 xn 6 xn+1 6 ...

x1 x2 x3 ; x4 x5

– невозрастающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...

x5 x3 ; x4 x2 x1

– монотонной, если она неубывающая или невозрастающая;


Понятно, что если последовательность xn возрастает, то она неубывает. И наоборот, если xn
убывает, то она невозрастает.

(−1)n
⋄ 4.2.56. Последовательность xn = 1
n монотонна ⋄ 4.2.58. Последовательность xn = n немо-
(точнее, убывает) и ограничена; нотонна, но ограничена;

0 1 1 1
3 2

⋄ 4.2.57. Последовательность xn = n монотонна −1 − 31 1 1


4 2
(точнее, возрастает) и неограничена;

1 2 3

Теорема 4.2.59 (Вейерштрасса о монотоных ограниченных последовательностях). 5


Всякая монотонная ограниченная последовательность {xn } сходится (то есть имеет конеч-
ный предел), причем
— если {xn } неубывающая последовательность, то

lim xn = sup xn
n→∞ n∈N

— если {xn } невозрастающая последовательность, то

lim xn = inf xn
n→∞ n∈N
5 Этот результат используется далее при доказательстве теоремы о вложенных отрезках 4.2.62 и при доказательстве
второго замечательного предела (лемма (c)).
274 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство. Если последовательность {xn } монотонна, то это значит, что она или неубываю-
щая, или невозрастающая. Докажем теорему для случая, когда {xn } – неубывающая (случай, когда
она невозрастающая рассматривается аналогично):

C 6 x1 6 x2 6 x3 6 ... 6 xn 6 xn+1 6 ... 6 D (4.2.62)

Рассмотрим множество X, состоящее из элементов {xn }. Из цепочки неравенств (4.2.62) следует,


что оно будет ограничено сверху и непусто. Значит, по теореме 3.1.29 (о точной границе), оно имеет
точную верхнюю грань B:
B = sup{xn ; n ∈ N}
Покажем, что {xn } стремится к B. Возьмем окрестность (B − ε, B + ε) точки B. Поскольку B –
точная верхняя грань для {xn }, число B − ε < B не может быть верхней гранью для {xn }. Это
значит, что существует такое k, что
B − ε < xk
При этом для любого n > k мы получим

B − ε < xk 6 xn ,

то есть все числа {xn }, начиная с номера k, лежат в интервале (B − ε, B + ε).

B−ε B+ε

x1 x2 x3 x4 x5 B

Итак, получается, что любая окрестность (B−ε, B+ε) точки B содержит почти все точки последова-
тельности {xn }. Значит
lim xn = B.
n→∞

⋄ 4.2.60. Покажем, что последовательность, за- Поймем сначала, что означает это неравенство:
данная рекуррентно
умножаем на 2xn ;
  поскольку xn > 0,
1 1 знак неравенства не меняется
x1 = 2, xn+1 = xn + ↓
2 xn
z  }|  {
1 1
сходится, и найдем ее предел. xn+1 6 xn ⇔ xn + 6 xn ⇔
2 xn
1. Вычислим сначала несколько первых эле-
ментов последовательности {xn }, и нарисуем ⇔ x2n + 1 6 2x2n ⇔ x2n > 1 ⇔ xn > 1
картинку:
Теперь докажем, последнее неравенство:

xn > 1 (4.2.64)
41 5 2
40 4
Это делается математической индукцией.
a) Сначала проверяем наше неравенство при
2. Заметим, что все числа {xn } положитель- n = 1:
ны:
x1 = 2 > 1
xn > 0

(это можно отдельно доказать индукцией). b) Предполагаем, что оно верно при n = k:
3. Из картинки видно, что на первых
xk > 1 (4.2.65)
нескольких элементах {xn } наша последователь-
ность невозрастает. Попробуем доказать, что она
невозрастает всегда: c) Доказываем, что тогда оно будет верно при
n = k + 1.
xn+1 6 xn (4.2.63) xk+1 > 1 (4.2.66)
§ 2. Предел последовательности 275

Действительно, получаем
   
умножаем на 2xk , 1 1 1 1
и, поскольку xn > 0, c = lim xn+1 = lim xn + = c+
знак неравенства не меняется n→∞ n→∞ 2 xn 2 c

z  }|  { То есть c удовлетворяет уравнению
1 1
xk+1 > 1 ⇔ xk + >1 ⇔  
2 xk 1 1
c= c+
⇔ x2k + 1 > 2xk ⇔ x2k − 2xk + 1 > 0 ⇔ 2 c
⇔ (xk − 1)2 > 0 решая которое мы получаем
а последнее неравенство выполняется всегда (по- 2c2 = c2 + 1 ⇔ c2 = 1
тому что квадрат любого числа неотрицателен).
Итак, мы доказали (4.2.63), а значит и рав- откуда (с учетом c > 0) имеем c = 1.
носильное ему условие (4.2.64). Эти неравенства Ответ: limn→∞ xn = 1
означают, что {xn } невозрастает и ограничена
сверху. Значит, по теореме Вейерштрасса 4.2.59 ⊲⊲ 4.2.61. Докажите, что последовательность,
она имеет предел. Обозначим его буквой c: заданная рекуррентно сходится, и найдите ее
предел:
lim xn = c 1) x = 3, x = 5xn ;
n→∞ 1 n+1 3xn +1
4xn
и заметим, что c > 0, поскольку xn > 0. Тогда из 2) x1 = 1, xn+1 = 2+x2n ;
формулы   3) x1 = −1, xn+1 = xn (xn +4)
;
1 1 2
xn+1 = xn + 4) x1 = 2, xn+1 = xn (6−xn )
.
2 xn 3

Теорема о вложенных отрезках. Пусть дана последовательность отрезков [an ; bn ] такая, что
каждый последующий содержится в предыдущем:

[a1 ; b1 ] ⊇ [a2 ; b2 ] ⊇ [a3 ; b3 ] ⊇ ... ⊇ [an ; bn ] ⊇ ...

Понятно, что в этом случае концы отрезков связаны неравенствами

a1 6 a2 6 a3 6 ... 6 an 6 ... 6 bn 6 ... 6 b3 6 b2 6 b1 (4.2.67)

Пусть, кроме того, длины этих отрезков стремятся к нулю:

bn − an −→ 0 (4.2.68)
n→∞

Такая последовательность отрезков называется последовательностью вложенных отрезков.

Теорема 4.2.62 (о вложенных отрезках). 6 Для любой последовательности вложенных отрезков


[an ; bn ] существует единственная точка C, принадлежащая всем отрезкам этой последователь-
ности,
C ∈ [an ; bn ] (4.2.69)
При этом
lim an = C = lim bn (4.2.70)
n→∞ n→∞

Доказательство. Неравенства (4.2.67) означают, что последовательности {an } и {bn } монотоны и


ограничены. Значит, они сходятся (то есть имеют пределы). Обозначим буквами A и B эти пределы:

A = lim an B = lim bn
n→∞ n→∞

Покажем, что эти числа совпадают. Действительно,


 
используем свойство
B − A = lim bn − lim an = 0
2 на с.262 = lim (bn − an ) = (используем (4.2.68)) = 0
n→∞ n→∞ n→∞
6 Этот результат используется ниже при доказательстве теоремы Больцано-Вейерштрасса 4.2.68 и при доказатель-
стве теоремы Коши о промежуточном значении 4.3.22.
276 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

то есть
A=B
Итак, мы получили, что можно взять C = A = B, и тогда будет выполняться (4.2.70). По теореме
Вейерштрасса 4.2.59, получаем

a1 6 a2 6 a3 6 ... 6 an 6 ... 6 sup an = A = C = B = inf bn 6 ... 6 bn 6 ... 6 b3 6 b2 6 b1


n∈N n∈N

и это означает, что C принадлежит всем интервалам [an ; bn ]. Наконец, такая точка C (обладающая
свойством (4.2.69)), единственна, потому что если бы существовала какая-то другая точка C ′ с тем
же самым свойством (4.2.69), отличющаяся от C, например, большая, чем C, то мы получили бы,
цепочку неравенств

a1 6 a2 6 a3 6 ... 6 an 6 ... 6 C < C ′ 6 ... 6 bn 6 ... 6 b3 6 b2 6 b1

из которых следовало бы, что расстояние между концами любого отрезка [an ; bn ] не меньше чем
фиксированное число ∆ = C ′ − C

b n − an > C ′ − C = ∆ > 0

и поэтому bn − an не может стремиться к нулю.

Подпоследовательности и теорема Больцано-Вейерштрасса. Пусть нам дана какая-то по-


следовательность вещественных чисел
xn
и пусть кроме того дана бесконечно большая последовательность натуральных чисел:

nk −→ +∞
k→∞

Тогда можно рассмотреть последовательность yk = xnk (зависящую от индекса k). Она называется
подпоследовательностью числовой последовательности xn .

⋄ 4.2.63. Пусть, скажем, нам дана последова- ⊲⊲ 4.2.65. Какую нужно взять последователь-
тельность ность индексов {nk }, чтобы последовательность
1 {yk } была подпоследовательностью последова-
xn =
n тельности {xn }?
Если взять
nk = k 2 1) xn = n1 , yk = k13
2) xn = (−1)n , yk = −1
то мы получим подпоследовательность
1 1 ⊲⊲ 4.2.66. Является ли данная последователь-
yk = xnk = = 2 ность {yk } подпоследовательностью последова-
nk k
тельности {xn }? (Если да, то указать соответ-
⋄ 4.2.64. Пусть ствующую последовательность индексов {nk }.)
n
xn = (−1) 1) xn = n, yk = k 2 ,
Если взять 2) xn = n2 , yk = k,
nk = 2k 3) xn = n, yk = 2.
то мы получим подпоследовательность
yk = xnk = (−1)nk = (−1)2k = 1

Свойства подпоследовательностей
1◦ . Если последовательность {xn } стремится к числу a, то любая ее подпоследователь-
ность {xnk } тоже стремится к числу a:

xn −→ a =⇒ xnk −→ a
n→∞ k→∞
§ 2. Предел последовательности 277

2◦ . Если последовательность {xn } не стремится к числу a, то найдется такая подпосле-


довательность {xnk } и такое число ε > 0, что {xnk } отстоит от a больше чем на
ε:
xn −→
6 a =⇒ ∃ε > 0 ∃xnk ∀k |xnk − a| > ε
n→∞

3 . Если последовательность {xn } неограничена, то она содержит некоторую бесконечно
большую подпоследовательность:

sup |xn | = +∞ =⇒ ∃xnk −→ ∞


n∈N k→∞

4◦ . Если бесконечный набор элементов последовательности {xn } содержится в множестве


M , то {xn } содержит некоторую подпоследовательность, полностью содержащуюся в
M:
∃xnk ⊆ M

Доказательство. 1. Докажем сначала 1◦ . Возьмем произвольную окрестность (a − ε; a + ε) точки


a. Поскольку xn −→ a, почти все точки {xn } должны лежать в (a − ε; a + ε). Значит, точки с
n→∞
индексами nk тоже почти все лежат в (a − ε; a + ε). Поскольку это верно для любой окрестности
(a − ε; a + ε) мы получаем xnk −→ a.
n→∞
2. Свойство 20 , как многие другие утверждения в анализе, традиционно доказывается приемом
бесконечнократного выбора, о котором нужно сказать несколько слов. Он представляет из себя
неявное использование аксиомы (счетного) выбора (сформулированной выше на с.251). Другой,
“честный” способ доказать это утверждение – явно сослаться на аксиому выбора, однако у этого
пути есть важный недостаток: тогда рассуждения становятся интуитивно менее очевидными. Эти
два способа можно считать эквивалентными, и чтобы показать читателю разницу, мы приведем
здесь оба. Далее мы еще несколько раз поступим так же7 , то есть приведем два доказательства,
приемом бесконечнократного выбора и с явной ссылкой на аксиому выбора, но после этого будем в
подобных ситуациях использовать только бесконечнократный выбор без напоминаний, что за ним
стоит аксиома выбора.
а) Доказательство приемом бесконечнократного выбора. Если xn −→
6 a, то это означает, что най-
n→∞
дется такая окрестность (a − ε, a + ε) точки a, вне которой лежит бесконечное число элементов
xn . То есть множество
N = {n ∈ N∗ : xn ∈ / (a − ε, a + ε)}
бесконечно.
1) Выберем произвольное n1 ∈ N .
2) Поскольку N бесконечно, найдется n2 ∈ N такое что n2 > 2. Зафиксируем это n2 .
3) Поскольку N бесконечно, найдется n3 ∈ N такое что n3 > 3. Зафиксируем это n3 .
И так далее. Поступая подобным образом, мы получим последовательность индексов {nk } такую,
что
nk > k, k ∈ N∗
поэтому по теореме 4.2.53 о предельном переходе в неравенстве, nk −→ +∞, то есть {xnk } –
k→∞
подпоследовательность в {xn }.
б) Доказательство с явной ссылкой на аксиому выбора. Еще раз, если xn −→
6 a, то найдется такая
n→∞
окрестность (a − ε, a + ε) точки a, вне которой лежит бесконечное число элементов xn . То есть
множество
N = {n ∈ N∗ : xn ∈ / (a − ε, a + ε)}
бесконечно. По теореме 3.2.28, оно не ограничено, то есть для всякого k ∈ N∗

Nk = {n ∈ N∗ : n 6 k} 6= ∅

По аксиоме счетного выбора (с.251), найдется последовательность

nk ∈ N k
7 Точнее, дважды: при доказательстве свойства 30 в этом списке и теоремы Больцано-Вейерштрасса 4.2.68 ниже.
278 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Для нее мы получаем во-первых:

xnk ∈
/ (a − ε, a + ε), k ∈ N∗

то есть
|xnk − a| > ε, k ∈ N∗
И, во-вторых,
nk > k, k ∈ N∗ ,
откуда по теореме 4.2.53 о предельном переходе в неравенстве, nk −→ +∞, то есть {xnk } –
k→∞
подпоследовательность в {xn }.
3. Как и в предыдущем случае, мы даем два доказательства свойства 30 : традиционное и с явной
ссылкой на аксиому (счетного) выбора.
а) Доказательство приемом бесконечнократного выбора. Пусть supn∈N |xn | = +∞, построим под-
последовательность xnk −→ ∞.
k→∞
1) Сначала выбирается индекс n1 . Это делается так: поскольку {xn } неограничена, найдется
такой номер n1 , что
|xn1 | > 1
Этот номер n1 фиксируется.
2) Затем выбирается индекс n2 : поскольку {xn } неограничена, найдется такой номер n2 , что

|xn2 | > 2

Этот номер n2 фиксируется.


k). Когда индексы n1 , n2 , ..., nk−1 уже выбраны, выбирается индекс nk : поскольку {xn } неогра-
ничена, найдется такой номер nk , что
|xnk | > k
Этот номер nk фиксируется.
И так далее. В результате получается последовательность {xnk } со свойством

∀k ∈ N |xnk | > k

из которого и следует xnk −→ ∞.


k→∞
б) Доказательство с явной ссылкой на аксиому выбора. Пусть supn∈N |xn | = +∞. Это значит, что

∀k ∈ N∗ {n ∈ N∗ : |xn | > k} 6= ∅

По аксиоме счетного выбора (с.251), найдется последовательность {nk } такая, что

nk ∈ {n ∈ N∗ : |xn | > k}, k ∈ N∗

то есть
|xnk | > k, k ∈ N∗ .
Отсюда следует xnk −→ ∞.
k→∞

4. Свойство 4 доказывается тем же приемом, только номера nk здесь нужно выбирать так,
чтобы выполнялись не одно, а два условия:

nk+1 > nk & xnk+1 ∈ M.

Можно заметить, что иногда получается, что, хотя данная последовательность {xn } расходится
(то есть не имеет предела), тем не менее, выбранная подпоследовательность {yk } сходится.
§ 2. Предел последовательности 279

n
⊲⊲ 4.2.67. Для данной последовательности {xn } 3) xn = n(−1) ,
укажите какую-нибудь сходящуюся подпоследо- 4) xn = (−1)n · n(−1)
n
−1
,
вательность {xnk }, если она существует. n
5) xn = n · (1 + (−1) ),
n
1) xn = (−1) · n, 2+(−1)n
6) xn = 2 − n1 ,
(−1)n 1+(−1)n n−1 3

2) xn = n + 2 , 7) xn = (−1) · 2+ n .

Теорема 4.2.68 (Больцано-Вейерштрасса). 8 Всякая ограниченная последовательность {xn } име-


ет сходящуюся подпоследовательность {xnk }.
Для доказательства условимся длиной отрезка I = [a, b] называть число

diam I = b − a

Нам удобно начать со следующей леммы:


Лемма 4.2.69. Если отрезок I содержит бесконечно много элементов последовательности {xn },

card{n ∈ N∗ : xn ∈ I} = ∞

то в I содержится отрезок J в два раза меньшей длины,


diam I
diam J = ,
2
также содержащий бесконечно много элементов {xn }:

card{n ∈ N∗ : xn ∈ J} = ∞

Доказательство. Это очевидно: разделим отрезок I на два равных (по длине) отрезка J и K. По
крайней мере в одном из них должно содержаться бесконечное число элементов {xn } (потому что
иначе получилось бы, что J и K содержат конечный набор элементов {xn }, и значит их объединение
I = J ∪ K тоже содержит конечный набор элементов.
Доказательство теоремы 4.2.68. В соответствии с обещанием на с.277, мы даем здесь два доказа-
тельства: приемом бесконечнократного выбора и с явной ссылкой на аксиому (счетного) выбора.
а) Доказательство приемом бесконечнократного выбора.
1) Последовательность {xn } ограничена, значит она лежит в некотором отрезке I1 = [a1 ; b1 ].
Положим n1 = 1, и заметим на будущее, что xn1 ∈ I1 = [a1 ; b1 ].
2) По лемме 4.2.69, в I1 содержится некий отрезок I2 = [a2 ; b2 ] вдвое меньшей длины,
diam I1
diam I2 = ,
2
также содержащий бесконечно много чисел {xn }. Выбираем какой-нибудь номер n2 > 2, такой
что xn2 ∈ I2 = [a2 ; b2 ] (такой номер n2 найдется, потому что xn ∈ [a2 ; b2 ] для бесконечного
количества номеров n).
3) Опять по лемме 4.2.69, в I2 содержится некий отрезок I3 = [a3 ; b3 ] вдвое меньшей длины,
diam I2
diam I3 = ,
2
также содержащий бесконечно много чисел {xn }. Выбираем какой-нибудь номер n3 > 3, такой
что xn3 ∈ I3 = [a3 ; b3 ] (такой номер n3 найдется, потому что xn ∈ [a3 ; b3 ] для бесконечного
количества номеров n).
Продолжая эту процедуру, мы получим последовательность отрезков Ik = [ak ; bk ] и чисел xnk
со следующими свойствами:

[a1 ; b1 ] ⊇ [a2 ; b2 ] ⊇ [a3 ; b3 ] ⊇ ... ⊇ [ak ; bk ] ⊇ ... bk − ak −→ 0 xnk ∈ [ak ; bk ] (4.2.71)


k→∞
8 Этот результат используется ниже при доказательстве критерия Коши сходимости числовой последовательности

(теорема 4.2.70), а также при доказательстве теорем Вейерштрасса об ограниченности и об экстремумах (теоремы
4.3.23 и 4.3.28) и теоремы Кантора о равномерной ограниченности (теорема 4.3.32)
280 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Первые два свойства означают, что [ak ; bk ] – последовательность вложенных отрезков, значит,
по теореме 4.2.62 о вложенных отрезках, существует число C такое что

lim ak = C = lim bk
k→∞ k→∞

Последнее же свойство в цепочке (4.2.71) означает, что

ak 6 xnk 6 bk

и поэтому мы можем применить теорему о двух милиционерах 4.2.54, из которой следует, что

lim xnk = C
k→∞

То есть последовательность xnk имеет предел.


б) Доказательство с явной ссылкой на аксиому выбора. Опять заметим сначала, что поскольку
последовательность {xn } ограничена, она лежит в некотором отрезке I = [a; b]. Пусть I обо-
значает множество отрезков J, содержащихся в I, и содержащих бесконечный набор элементов
последовательности {xn }

J ∈I ⇐⇒ J ⊆I & card{n ∈ N∗ : xn ∈ J} = ∞

(множество I непусто, потому что, например, I ∈ I). Пусть теперь I1 , I2 , ..., Ik – конечная по-
следовательность отрезков, удовлетворяющая таким условиям:
diam Ii
{I1 , ...Ik } ⊆ I, I1 ⊃ I2 ⊃ ... ⊃ Ik , ∀i < k diam Ii+1 = , (4.2.72)
2
Тогда по лемме 4.2.69, найдется отрезок J со свойствами:
diam Ik
J ∈ I, J ⊂ Ik , diam J = . (4.2.73)
2
Это наблюдение можно переформулировать таким хитрым образом: для любой последователь-
ности I1 , I2 , ..., Ik , удовлетворяющей условиям (4.2.72), множество J (I1 , I2 , ..., Ik ) всех отрезков
J, удовлетворяющих условиям (4.2.73), непусто:
 
diam Ik
J (I1 , I2 , ..., Ik ) = J ∈ I : J ⊂ Ik , diam J = 6= ∅
2

Теперь мы применяем аксиому выбора: должно существовать отображение (I1 , I2 , ..., Ik ) 7→ G(I1 , I2 , ..., Ik ),
которое каждой последовательности (I1 , I2 , ..., Ik ) отрезков, удовлетворяющих условиям (4.2.72),
ставит в соответствие отрезок G(I1 , I2 , ..., Ik ), принадлежащий J (I1 , I2 , ..., Ik ), то есть удовлетво-
ряющий условиям
diam Ik
G(I1 , I2 , ..., Ik ) ∈ I, G(I1 , I2 , ..., Ik ) ⊂ Ik , diam G(I1 , I2 , ..., Ik ) = . (4.2.74)
2
После этого мы применяем теорему 3.2.6 об определениях частной индукцией: если положить
I1 = I, то это определит последовательность {Ik } ∈ I, содержащую I1 в качестве первого эле-
мента и удовлетворяющую условию

G(I1 , ..., Ik ) = Ik+1 , k<N

где величина N определяется условием:


n o
N = sup k ∈ N∗ : ∃{I2 , ..., Ik } ⊆ I ∀i ∈ {2, ..., k} G(I1 , ..., Ii−1 ) = Ii

Но здесь верхняя грань равна бесконечности, потому что наше отображение G было определено
на всех конечных последовательностях со свойствами (4.2.72). Поэтому последовательность {Ik },
определяемая теоремой 3.2.6 должна быть бесконечной.
Теперь каждый отрезок {Ik } содержит бесконечный набор элементов {xn }, поэтому

{n > k : xn ∈ Ik } 6= ∅
§ 2. Предел последовательности 281

Отсюда по аксиоме счетного выбора (с.251) следует, что существует последовательность номеров

nk ∈ {n > k : xn ∈ Ik }

то есть такая, что


nk > k & xnk ∈ Ik
Обозначив теперь через ak и bk концы отрезков Ik ], мы получим в точности условия (4.2.71), и
дальше рассуждения повторяют пункт а).

Критерий Коши сходимости последовательности.


Теорема 4.2.70 (критерий Коши сходимости числовой последовательности). 9
Числовая последовательность {xn } тогда и только тогда сходится, когда она удовлетворяет
следующим двум эквивалентным условиям:
(i) для любых двух бесконечно больших последовательностей индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞ (4.2.75)
i→∞ i→∞

соответствующие подпоследовательности {xpi } и {xqi } стремятся друг к другу:

xpi − xqi −→ 0 (4.2.76)


i→∞

(ii) для любой последовательности {li } ⊆ N и любой бесконечно большой последовательно-


сти {ki } ⊆ N
ki −→ ∞ (4.2.77)
i→∞
выполняется соотношение
xki +li − xki −→ 0 (4.2.78)
i→∞

Для доказательства нам понадобится две леммы.


Лемма 4.2.71. Если последовательность {xn } бесконечно большая

xn −→ ∞
n→∞

то она содержит некоторую подпоследовательность {xnk } со свойством

xnk − xnk−1 −→ ∞ (4.2.79)


k→∞

Доказательство. Подпоследовательность {xnk } строится бесконечнократным выбором (традици-


онно этот прием называется “построением по индукции”).
1. Индекс n1 выбирается произвольным, например, n1 = 1.
2. Затем выбирается индекс n2 . Для этого произносится фраза: поскольку {xn } неограничена,
найдется такой номер n2 , что
|xn2 − xn1 | > 2
Этот номер n2 фиксируется.
k. Когда индексы n1 , n2 , ..., nk−1 уже выбраны, выбирается индекс nk . Опять говорится так:
поскольку {xn } неограничена, найдется такой номер nk , что

xn − xn > k
k k−1

Этот номер nk фиксируется.


И так далее. В результате получается последовательность {xnk } со свойством

∀k ∈ N xn − xn > k
k k−1

из которого и следует (4.2.79).


9 Этот результат понадобится нам только в главе 18 при доказательстве критерия Коши сходимости числового

ряда (теорема 4.1)


282 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Лемма 4.2.72. Если последовательность {xn } обладает свойством (i) теоремы 4.2.70, то она
ограничена.

Доказательство. Предположим, что это не так, то есть что {xn } – неограниченная последова-
тельность, обладающая свойством (i). Тогда по свойству 30 предыдущего параграфа, нашлась бы
подпоследовательность {xnk } такая что

xnk −→ ∞
k→∞

а по лемме 4.2.71 это означало бы, что можно выбрать подпоследовательность {xnki } последова-
тельности {xnk } такую что
xnki − xnki−1 −→ ∞
k→∞

После этого мы бы могли взять две последовательности

pi = nki , qi = nki−1

и у нас бы получилось, что


xpi − xqi = xnki − xnki−1 −→ ∞
k→∞

Но это невозможно, потому что {xn } обладает свойством (i). Значит, наше исходное предположение
(о том, что {xn } – неограниченная последовательность) неверно. То есть {xn } обязательно ограни-
чена.

Доказательство теоремы 4.2.70. Убедимся сначала что условия (i) и (ii) действительно эквива-
лентны.
1. Импликация (i) ⇒ (ii) очевидна: если выполняется (i) то есть любые две подпоследователь-
ности {xpi } и {xqi } последовательности {xn } стремятся друг к другу

xpi − xqi −→ 0,
i→∞

то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение

xki +li − xki = xpi − xqi −→ 0


i→∞

2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(4.2.78). Возьмем какие-нибудь две бесконечно большие последовательности индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞

Положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
   
 xmax{pi ;qi } − xmin{pi ;qi } , если pi > qi   xki +li − xki , если pi > qi 
xpi − xqi = x − xmax{pi ;qi } , если pi < qi = xk − xki +li , если pi < qi
 min{pi ;qi }   i 
0, если pi = qi 0, если pi = qi

В любом случае получается


|xpi − xqi | = |xki +li − xki |
поэтому
|xpi − xqi | = |xki +li − xki | −→ 0
i→∞
и значит,
xpi − xqi −→ 0
i→∞
§ 2. Предел последовательности 283

Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {xn } сходится, то есть существует конечный
предел
lim xn = a
n→∞

то {xn } обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие по-
следовательности индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞
i→∞ i→∞

Соответствующие подпоследовательности {xpi } и {xqi } тоже стремятся к числу a по свойству 10


предыдущего параграфа:
xpi −→ a, xqi −→ a
i→∞ i→∞
поэтому их разность должна стремиться к нулю:

xpi − xqi −→ a − a = 0
i→∞

Это значит, что {xn } действительно должна обладать свойством (i).


4. Теперь докажем, что наоборот, если {xn } обладает свойством (i), то она обязательно сходит-
ся. Действительно, по лемме 4.2.72, {xn } ограничена. Значит, по теореме Больцано-Вейерштрасса
4.2.68, {xn } содержит некоторую сходящуюся подпоследовательность {xni }:

xni −→ a (4.2.80)
i→∞

Теперь возьмем следующие две последовательности индексов

pi = i, qi = ni

Поскольку {xn } обладает свойством (i), должно выполняться соотношение

xi − xni = xpi − xqi −→ 0 (4.2.81)


i→∞

Из (4.2.80) и (4.2.81) получаем

xi = (xi − xni ) + xni −→ 0 + a = a


i→∞

То есть последовательность {xn } стремится к некоторому конечному пределу a.

n
⊲⊲ 4.2.73. Проверьте с помощью критерия Коши 1) xn = 3(−1) ;
сходимость последовательностей: 2
2) xn = { n n+1 }.

Теорема Штольца—Чезаро.
Теорема 4.2.74 (О.Штольц, Э.Чезаро). 10
Пусть {yn } и {zn } – две последовательности, причем
(i) {yn } строго монотонна:

y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ... (4.2.82)

(ii) {yn } бесконечно большая:


yn −→ ∞ (4.2.83)
n→∞
zn −zn−1
(iii) последовательность yn −yn−1 имеет конечный предел:

zn − zn−1
lim =A (4.2.84)
n→∞ yn − yn−1
10 Otto Stolz (1842–1905), Ernesto Cesàro (1859 – 1906). Эта теорема используется при доказательстве правила Ло-

питаля 6.2.8 для раскрытия неопределенностей типа ∞ ∞


.
284 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Тогда последовательность { yznn } тоже имеет конечный предел, и он совпадает с A:

zn zn − zn−1
lim = lim =A (4.2.85)
n→∞ yn n→∞ yn − yn−1

Доказательство. Заметим сразу, что достаточно рассмотреть случай, когда yn возрастает:

y1 < y2 < ... < yn < ...,

поскольку случай убывающей последовательности

y1 > y2 > ... > yn > ...

сводится к случаю возрастающей заменой ỹn = −yn , (ỹ1 < ỹ2 < ... < ỹn < ...). Заодно можно счи-
тать, что все yn положительны:
0 < y1 < y2 < ... < yn < ... (4.2.86)
zn −zn−1
Из условия (iii) следует, что yn −yn−1 представимо в виде

zn − zn−1
= A + αn , (4.2.87)
yn − yn−1
где
αn −→ 0 (4.2.88)
n→∞

Зафиксируем ε > 0, и подберем N так чтобы


ε
∀n > N |αn | < (4.2.89)
2
(это можно сделать, потому что |αn | −→ 0).
n→∞
Из (4.2.83) следует, что существует M > N такое, что
2

∀n > M yn > · zN − A · yN
ε
то есть ε

∀n > M zN − A · yN < · yn (4.2.90)
2
Зафиксируем эти N и M . Из (4.2.87) получаем: для всякого n > M > N

zn − zn−1 = (αn + A) · (yn − yn−1 ) = αn · (yn − yn−1 ) + A · (yn − yn−1 )




zn − zn−1 = αn · (yn − yn−1 ) + A · (yn − yn−1 )

z
n−1 − zn−2 = αn−1 · (yn−1 − yn−2 ) + A · (yn−1 − yn−2 )

...


zN +1 − zN = αN +1 · (yN +1 − yN ) + A · (yN +1 − yN )
⇓ (складываем уравнения)

после сокращений остаются


только первое и последнее слагаемое
z }| {
zn − zn−1 + ... + zN +1 − zN = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN )+
+ A · ( yn − yn−1 + ... + yN +1 − yN )
| {z }
после сокращений остаются
только первое и последнее слагаемое


zn − zN = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + A · (yn − yN )

zn − A · yn = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + zN − A · yN
§ 2. Предел последовательности 285




zn − A · yn = αn (yn − yn−1 ) + ... + αN +1 (yN +1 − yN ) + zN − A · yN 6


6 |αn | · yn − yn−1 + ... + |αN +1 | · yN +1 − yN + zN − A · yN <
|{z} | {z }

>

>
(4.2.89) (4.2.89)
ε ε
2 2
ε
ε



< · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2 | {z } 2 | {z }

<

<
(4.2.82) (4.2.82)
0 0
ε   ε  

= · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2  2 
ε
= · yn − yn−1 + ... + yN +1 − yN + zN − A · yN =
2 | {z }
после сокращений остаются
только первое и последнее слагаемое

0
>

(4.2.86)
ε  z}|{ 
ε ε
= · yn − yN + zN − A · yN < · yn + · yn = ε · yn
2 | {z } | {z } 2 2
>

> (4.2.90)
yn ε
2 · yn




zn − A · yn < ε · yn

z
n
− A < ε
yn
У нас получилось, что для всякого ε > 0 найдется M такое, что
z
n
∀n > M − A < ε
yn
То есть
zn
∀n > M −ε< −A<ε
yn
zn
Иными словами, для любого ε > 0 почти все числа yn − A лежат в интервале (−ε, ε). Значит,

zn
− A −→ 0
yn n→∞

то есть,
zn
−→ A
yn n→∞

(c) Приложения предела последо- (i) для всякого N ∈ N∗ выполняется неравен-


вательности ство
1
0 6 x − xN < (4.2.92)
Десятичная запись вещественных чисел. 10N
из которого следует, что xN сходится к x:
Лемма 4.2.75. Для всякого вещественного чис-
ла x ∈ (0, 1) последовательность xN −→ x (4.2.93)
N →∞

[x · 10N ] (ii) последовательность {a−k ; k ∈ N∗ }, опреде-


xN = (4.2.91)
10N ленная правилом

обладает следующими свойствами: a−1 = x1 · 10 = [x · 10], (4.2.94)


286 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

a−k = (xk − xk−1 ) · 10k (k > 1) (4.2.95) ⇓


состоит из целых чисел в интервале a−k ∈ {0, 1, ..., 9}
{0, 1, ..., 9}:
3. Формула (4.2.97) доказывается индукцией.
∀k ∈ N∗ a−k ∈ {0, 1, ..., 9} (4.2.96) При N = 1 она принимает вид:
(iii) справедливо тождество x1 = a−1 · 10−1 ,
N
X и это эквивалентно (4.2.94). Далее, если (4.2.97)
xN = a−k · 10−k (4.2.97) верна для N = m,
k=1
m
X
Доказательство. 1. Начнем с (4.2.92):
a−k · 10−k = xm ,
{x · 10N } ∈ [0, 1) (3.2.157) k=1

⇓ то для N = m + 1 мы получаем:

m+1
X
[x · 10N ] a−k · 10−k =
x − xN = x − =
10N k=1
x · 10N [x · 10N ] x · 10N − [x · 10N ] xm
= N
− N
= = z }| {
10 10 10N Xm
 
{x · 10N } 1 = a−k · 10−k +a−m−1 · 10−m−1 =
= (3.2.155) = ∈ 0, N
10N 10 k=1
= xm + a−m−1 · 10−m−1 = (4.2.95) =
2. Докажем (4.2.96). Сначала заметим, что 
= xm + (xm+1 − xm ) · 10m+1 · 10−m−1 =
∀k ∈ N∗ xk · 10k = [x · 10k ] ∈ Z = xm + (xm+1 − xm ) = xm+1

 
x1 , k=1
a−k = ∈Z
(xk − xk−1 ) · 10k , k>1 Из леммы 4.2.75 и теоремы 3.2.33 следует
Теперь для k = 1 получаем: Теорема 4.2.76. Всякое число x > 0 предста-
0<x<1 вимо в виде
n
X N
X

x= ak · 10k + lim a−k · 10−k (4.2.98)
N →∞
0 < x · 10 < 10 k=0 k=1

⇓ (3.2.154)
где n ∈ N, ai ∈ {0, 1, ..., 9}.
0 6 [x · 10] < 10
Доказательство. Разложим x в сумму целой и
⇓ дробной части:
a−1 = [x · 10] ∈ {0, 1, ..., 9}
x = [x] + {x}
Затем для k > 1 получаем:
1 Если [x] = 0, то в (4.2.98) нужно положить n = 0,
0 6 x − xk−1 < (4.2.92) a0 = 0, если же [x] 6= 0, то по теореме 3.2.33 [x]
10k−1
можно представить в виде

n
X
0 6 (x − xk−1 ) · 10k < 10 [x] = ak · 10k (ak ∈ {0, 1, ..., 9})
⇓ (3.2.154) k=0

0 6 [(x − xk−1 ) · 10k ] < 10 То же самое с дробной частью: если {x} = 0, то


| {z }
в (4.2.98) нужно положить a−k = 0 при k ∈ N∗ ,
=

[x · 10k − xk−1 · 10k ] а если {x} = 6 0, то {x} можно по лемме 4.2.75


=

[x · 10k ] − xk−1 · 10k


записать в виде
=

  N
[x·10k ]
− xk−1 · 10k
X
10k {x} = lim a−k · 10−k (a−k ∈ {0, 1, ..., 9}).
N →∞
=

k=1
(xk − xk−1 ) · 10k
=

a−k
§ 2. Предел последовательности 287

• Формула (4.2.98) называется десятичным ⋄ 4.2.79. Запись


представлением числа x > 0, а последова-
тельность {an , an−1 , ..., a1 , a0 , a−1 , ...} – после- x = −34, 72
довательностью коэффициентов этого пред-
ставления. Если начиная с номера N + 1 все расшифровывается как равенство
числа a−k (k > N + 1) равны нулю, то спра-
ведливо равенство −x = 3 · 101 + 4 · 100 + 7 · 10−1 + 2 · 10−2
n
X N
X • Помимо этого, запись вида
x= ak · 10k + a−k · 10−k
k=0 k=1 x = −an ...a1 a0 , a−1 ...a−N ...
которое коротко принято записывать так:
(в которой перечислены все числа ak до номе-
x = an ...a1 a0 , a−1 ...a−N
ра a−N включительно, а после них стоит мно-
(запятая отделяет цифры с индексами 0 и готочие), называется приближенной деся-
−1), и это называется десятичной записью тичной записью числа x < 0 и означает, что
числа x. −x отличается от числа an ...a1 a0 , a−1 ...a−N
не больше чем на 10−N :
⋄ 4.2.77. Запись
x = 45, 28 0 6 −x − an ...a1 a0 , a−1 ...a−N < 10−N

расшифровывается как равенство Понятно, что это равносильно оценке


x = 4 · 101 + 5 · 100 + 2 · 10−1 + 8 · 10−2 10−N < x + an ...a1 a0 , a−1 ...a−N 6 0
• Помимо этого, запись вида
⋄ 4.2.80. Запись
x = an ...a1 a0 , a−1 ...a−N ...
x = −2, 31...
(в которой перечислены все числа ak до но-
мера a−N включительно, а после них стоит означает оценку
многоточие), называется приближенной де-
сятичной записью числа x и означает, что 10−2 < x + 2, 31 6 0
x отличается от числа an ...a1 a0 , a−1 ...a−N не
больше чем на 10−N :
Число Непера e. Из теоремы Вейерштрас-
0 6 x − an ...a1 a0 , a−1 ...a−N < 10−N са 4.2.59 выводится следующее утверждение,
неожиданно оказывающееся важным в анализе:
⋄ 4.2.78. Запись
n
• Последовательность 1 + n1 имеет конеч-
x = 102, 67...
ный предел, который называется числом
означает, что справедлива оценка Непера и обозначается буквой e:
0 6 x − 102, 67 < 10−2  n
1
e = lim 1 + (4.2.99)
• Если x < 0, то по теореме 4.2.76 число −x > 0 n→∞ n
представимо в виде
Доказательство. Рассмотрим сначала вспомо-
Xn X N гательную последовательность yn = (1 + n1 )n+1
−x = ak · 10k + a−k · 10−k и докажем что она сходится. Для n > 2 мы по-
k=0 k=1 лучаем:
Опять же, если здесь начиная с номера N + 1
1 n n
все числа a−k (k > N + 1) равны нулю, то yn−1 (1 + n−1 )n ( n−1 )
справедливо равенство = 1 n+1
= n+1 n+1
=
yn (1 + n ) ( n )
n N  n
X
k
X
−k
n2n n n2 n
−x = ak · 10 + a−k · 10 = 2 n
· = 2
· =
(n − 1) n+1 n −1 n+1
k=0 k=1  n  
1 n неравенство
и его принято коротко записывать так: = 1+ 2 · > Бернулли >
n −1 n+1 (3.2.103)
x = −an ...a1 a0 , a−1 ...a−N  
n n
> 1+ 2 · >
(запятая отделяет цифры с индексами 0 и n −1 n+1
  
−1). Это называется десятичной записью n n 1 n
числа x < 0. > 1 + 2
· = 1+ · =1
n n+1 n n+1
288 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

То есть последовательность yn монотонно убы- эта последовательность возрастает.


вает: С другой стороны, из (3.2.105) получаем:
yn−1 > yn
∀k ∈ N k! > 2k−1
С другой стороны, все числа yn положительны,
и поэтому она ограничена: ⇓
1 1
0 < ... < yn < yn−1 < ... < y3 < y2 < y1 ∀k ∈ N 6 k−1
k! 2

По теореме Вейерштрасса 4.2.59, это означает,
что последовательность yn сходится: n n n  k
X 1 X 1 X 1
En = 6 = 2· =
∃ lim yn ∈ R. k! 2k−1 2
n→∞ k=0 k=0 k=0
n+1 n+1
n 1 − 21 1 − 21
Теперь сходимость последовательности 1 + n1 = (3.2.107) = 2 · = 2 · =
следует из правила вычисления предела дроби 1 − 12 1
2
(свойство 4◦ на с. 263):  n+1 !
1 1
= 4· 1− = 4 − n−1 < 4,
 n n+1 2 2
1 1 + n1
lim 1 + = lim = и значит она ограничена сверху.
n→∞ n n→∞ 1 + n1
По теореме Вейерштрасса 4.2.59 получаем,
yn limn→∞ yn что она имеет предел. Обозначим его буквой E:
= lim =  =
n→∞ 1 + 1
n 1 
limn→∞ 1 + En −→ E
n n→∞


❆ Наша задача – проверить, что E = e. С одной
0
стороны,
= lim yn ∈ R.
n→∞
 n n
X
1 1
1+ = (3.2.112) = Cnk · k =
n n
k=0
Теорема 4.2.81. Число Непера e удовлетворя- n
X n! 1
ет соотношению: = · k =
k! · (n − k)! n
n k=0
X 1  k
n
X 1
e = lim (4.2.100) n! 1
n→∞ k! = · · =
k=0 k! (n − k)! n
k=0
причем для любого n ∈ N∗ справедливо двойное Xn
1 1 1
неравенство: = · n · ... · (n − k + 1) · · ... · =
k! | {z } |n {z n}
k=0
n k множителей
X 1 1 k множителей
0<e− 6 (4.2.101) n
X 1 n n−1 n−k+1
k! n! · n = · · · ... · =
k=0
k! n
| n {z n }
k=0
или, что то же самое двойное неравенство k множителей
Xn    
n
X n
X 1 1 k−1
1 1 1 = ·1· 1− · ... · 1 − 6
<e6 + (4.2.102) k! n n
k! k! n! · n k=0 | {z }
k=0 k=0
k множителей, и все 6 1
Xn
Доказательство. Обозначим 1
6 = En
n
X k!
1 k=0
En =
k! ⇓
k=0
 n
1
и докажем сначала равенство (4.2.100). e = lim 1+ 6 lim En = E
n→∞ n n→∞
1. Поскольку
А с другой – при любом m 6 n
n
X n
X
1 1 1 Pm 1
En = < + = Em = k=0 k!
k! k! (n + 1)! ↑ (n → ∞)
k=0 k=0
n+1 z }| {
X 1 Xm    
= = En+1 , 1 1 k−1
k! ·1· 1− · ... · 1 − 6
k=0 k! n n
k=0
§ 2. Предел последовательности 289

Xn    
1 1 k−1 ! 4.2.82. Двойное неравенство (4.2.102) позволя-
6 ·1· 1− · ... · 1 − =
k! n n ет оценивать число e. Для нахождения двух пер-
k=0
 n вых знаков после запятой можно взять n = 7:
1
= 1+ 7
X 7
X
n 1 1 1
| {z } <e6 +
k! k! 7! · 7
↓ (n → ∞) k=0 k=0
e
Значения величин справа и слева можно при-
⇓ ближенно вычислить (на бумаге, или с помощью
калькулятора), получив оценки сверху и снизу,
Em 6 e (m ∈ N∗ ) из которых затем выводится оценка для e: с од-
⇓ ной стороны,
E = lim Em 6 e 1
= 0, 000198412698...
m→∞ 8!·8

2. Докажем теперь (4.2.101). Первое неравен- 1
0, 00019 < 8!·8 < 0, 0002
ство здесь следует из возрастания последова-
тельности En : с другой –
e = lim Em = sup Em > En+1 > En P8 1
m→∞ m∈N
= 2, 71827877...
k=0 k!

⇓ P8 1
2, 718 < k=0 k! < 2, 719
e − En > 0
И вместе это дает:
А второе – из неравенства (3.2.106): для любых
n, p ∈ N∗ мы получим 8
X 1
8
X 1 1
2, 718 < <e< + <
(n + m)! > n! · (n + 1)m (3.2.106) k! k! 8! · 8
k=0 k=0

⇓ < 2, 719 + 0, 0002 = 2, 7192


1 1 ⇓
6
(n + m)! n! · (n + 1)m
⇓ 2, 71 < e < 2, 72 (4.2.103)

n+p n n+p ⇓
X 1 X 1 X 1
En+p − En = − = =
k! k! k!
k=0 k=0 k=n+1 e = 2, 71... (4.2.104)
p
m = k − n X 1
= 6 Теорема 4.2.83. Число e иррационально:
k =
16m6p
m + n
= (n + m)!
m=1
Xp p  m /Q
e∈
1 1 X 1
6 = · =
m=1
n! · (n + 1)m n! m=1 n + 1 Доказательство. Предположим, что оно рацио-
 p+1 нально, то есть имеет вид
1 1
1 n+1 − n+1
= (3.2.108) = · 1 = m
n! 1 − n+1 e=
 p  p n
1 1
1 1 − n+1 1 1 − n+1 для некоторых m, n ∈ N∗ . Из оценки (4.2.103)
= · = ·
n! n+1−1 n! n следует, что n > 2 (потому что при n = 1 мы по-
лучили бы, что e целое). Запомним это. Из двой-
⇓ ного неравенства (4.2.101) мы получаем:
 p
1
1 1− n
En+p − En 6 ·
n+1
m X 1 1
| {z } n! 0< − 6
| {z n } n k! n! · n
(p → ∞) ↓ k=n
↓ (p → ∞)
e − En 1
n!·n

⇓ n
m · n! X n! 1
1 0< − 6
e − En 6 n k! n
n! · n k=n


290 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

n 
X Мы получаем, что в полуинтервале 0; 21 лежит
0 < m · (n − 1)! − n · (n − 1) · ... · (n − k) 6
| {z } | {z } какое-то целое число. Понятно, что это невоз-
k=n
|
целое
{z
целое
} можно, и значит наше предположение (о раци-
целое ональности e) было неверным.
1 1
6 6
n 2

§3 Непрерывные функции
(a) Что такое непрерывная функция?
Пусть нам дано уравнение, связывающее две физические величины,

y = f (x),

и мы говорим, что y непрерывно зависит от x. Что это означает? Интуитивный ответ очевиден:
непрерывная функция – это такая, у которой график – непрерывная линия.

⋄ 4.3.1. Например, функция ⋄ 4.3.2. И наоборот, функция сигнум




1, если x > 0
f (x) = x2
sgn x = 0, если x = 0


−1, если x < 0
непрерывна, потому что у нее график – непре-
рывная линия разрывна, потому что у нее график имеет раз-
рыв:
y = sgn x y
y
1

x
y = x2
0

x −1

Однако, это соображение не может быть точным определением, потому что оно объясняет смысл
одного нового понятия (непрерывная функция) с помощью другого нового понятия (непрерывная
линия).
Математиками было найдено несколько способов решения этой проблемы, из которых самый
простой — объяснить суть дела, опираясь на известное нам уже (то есть, старое для нас) понятие
предела последовательности. Это делается с помощью следующей серии определений.

• Функция f , определенная на множестве E ⊆ R, называется


– непрерывной в точке a ∈ E на множестве E, если f определена на множестве E, и
для всякой последовательности точек xn ∈ E, сходящейся к точке a,
 
xn −→ a xn ∈ E
n→∞

соответствующая последовательность f (xn ) значений функции f стремится к f (a):

f (xn ) −→ f (a)
n→∞
§ 3. Непрерывные функции 291

f (a)
f (x3 )
f (x2 )
f (x1 )

0 x1 x2 x3 a x

(при этом точка a называется точкой непрерывности функции f на множестве E);


– разрывной в точке a ∈ E на множестве E, если f определена на множестве E, и
найдется последовательность
 
xn −→ a xn ∈ E
n→∞

такая, что f (xn ) не стремится к f (a)

6
f (xn )−→ f (a)
n→∞

f (x3 )
f (x2 )
f (x1 )
f (a)

0 x1 x2 x3 a x

(при этом точка a называется точкой разрыва функции f на множестве E)


• Функция f , определенная на множестве E, называется
– непрерывной на множестве E, если она непрерывна в любой точке a ∈ E на
множестве E, то есть для всякой последовательности точек xn ∈ E, сходящейся
к любой точке a ∈ E,  
xn −→ a xn , a ∈ E
n→∞

соответствующая последовательность f (xn ) значений функции f стремится к


f (a):
f (xn ) −→ f (a)
n→∞

– разрывной на множестве E, если она разрывна в некоторой точке a ∈ E на


множестве E, то есть существует такая точка a ∈ E и такая последовательности
точек xn ∈ E, сходящаяся к a,
 
xn −→ a xn , a ∈ E
n→∞

что соответствующая последовательность f (xn ) значений функции f не стре-


мится к f (a):
6
f (xn )−→ f (a)
n→∞

• Функция f называется непрерывной (соответственно, разрывной), если она непрерывна


(соответственно, разрывна) на своей области определения D(f ).
292 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

⋄ 4.3.3. Функция f (x) = x2 будет непрерывна ⊲ 4.3.7. В каких точках непрерывна функция
на множестве E = R, потому что (по свойству f (x) = [x] (целая часть числа)?
30 сходящихся последовательностей на с.265) из
условия xn −→ a следует условие f (xn ) = ⊲ 4.3.8. Для следующих функций найдите точки
n→∞
(xn )2 −→ a2 = f (a). разрыва (если они есть) и докажите, что в этих
n→∞
точках функции действительно разрывны:
⋄ 4.3.4. Наоборот, функция сигнум f (x) = sgn x,

определенная выше формулой (4.1.3), разрывна 1 − x, если x > 0

на множестве E = R, точнее, в точке x = 0, по-
f (x) = −1 − x, если x < 0 ,
тому что если взять последовательность 

0, если x = 0
1
xn = −→ 0
n n→∞ 
то окажется, что 
0, если x < 0
g(x) = 2
f (xn ) = 1 −→ 1 6= 0 = f (0) x , если 0 6 x 6 1 ,
n→∞ 

0, если x > 1
Однако, в любой другой точке она непрерыв-
на. Например, в любой точке a > 0: если взять ⋄ 4.3.9. Непрерывность модуля Функция
ε = a > 0 и рассмотреть окрестность (0; 2a) = f (x) = |x| непрерывна.
(a − ε; a + ε), то для всякой последовательности
xn −→ a Доказательство. Для любой точки a ∈ R и лю-
n→∞
бой последовательности xn −→ a получаем це-
мы получим, что почти все числа xn лежат в ин- n→∞
почку следствий:
тервале (0; 2a), значит, для почти всех n ∈ N вы-
полняется неравенство
xn −→ a
n→∞
xn > 0
⇓ теорема 4.2.35
поэтому для почти всех n ∈ N xn − a −→ 0
n→∞
f (xn ) = sgn xn = 1 определение
⇓ бесконечно малой
на с.260
и следовательно,
|xn − a| −→ 0
n→∞
f (xn ) −→ 1 = f (a)
n→∞ ⇓ (4.1.12)

Аналогично доказывается, что f (x) = sgn x −|xn − a| 6 |xn | − |a| 6 |xn − a|


| {z } | {z }
непрерывна в любой точке a < 0.
↓ ↓
0 0
⊲ 4.3.5. Покажите, что функция
( ⇓ теорема о двух
милиционерах 4.2.54
2 1, если x 6= 0
f (x) = sgn x = |xn | − |a| −→ 0
0, если x = 0 n→∞
⇓ теорема 4.2.35
также разрывна в точке 0, но непрерывна в лю-
бой точке a 6= 0.
|xn | −→ |a|.
⋄ 4.3.6. Покажем, что функция f (x) = {x} n→∞
(дробная часть числа) разрывна в точке 1. Дей-
ствительно, для последовательности Мы получили, что если xn −→ a, то |xn | −→
n→∞ n→∞
1 |a|. Это означает, что функция f (x) = |x| непре-
xn = 1 − −→ 1 рывна в любой точке a ∈ R. Таким образом,
n n→∞
мы получим f (x) = |x| – непрерывная функция.

{xn } = (3.2.156) = xn −→ 1,
n→∞
⋄ 4.3.10. Непрерывность линейной функ-
то есть
ции. Функция вида
{xn } −→
6 0 = {1}.
n→∞
В силу периодичности функции f (x) = {x}, от- f (x) = kx + b, k, b ∈ R (4.3.105)
сюда следует, что она разрывна в любой точке
a ∈ Z. С другой стороны, нетрудно убедиться, называется линейной. Покажем, что она непре-
/ Z.
что она непрерывна в любой точке a ∈ рывна.
§ 3. Непрерывные функции 293

Доказательство. Пусть Тогда, в силу арифметических свойств пределов


последовательностей (40 на с. 264), имеем
xn −→ a
n→∞
f (xn ) = (xn )k −→ ak = f (a)
тогда, в силу арифметических свойств пределов n→∞
последовательностей (10 , 30 из (a)), имеем
то есть f непрерывна в точке a. Поскольку точка
f (xn ) = kxn + b −→ ka + b = f (a) a ∈ D(f ) выбиралась произвольно, мы получаем,
n→∞
что функция f (x) = xk непрерывна.
то есть f (x) непрерывна в точке a 3. Пусть k = −m, m ∈ N∗ , тогда функция
−m
⋄ 4.3.11. Непрерывность степенной функ- f (x) = x определена на множестве (−∞; 0) ∪
ции. Функция f (x) = x непрерывна при любом
k (0; +∞). Зафиксируем точку a ∈ (−∞; 0) ∪
1
k ∈ Z. В частности, функция x 7→ x непрерывна. (0; +∞) и рассмотрим произвольную последова-
тельность
Доказательство. Напомним, что при k > 0 сте-
xn −→ a
пень xk определялась индуктивным соотношени- n→∞
ем (3.2.132), а при k < 0 – формулой (3.2.133). тогда, в силу арифметических свойств пределов
Рассмотрим три случая. последовательностей (40 на с. 264), имеем
1. При k = 0 эта функция будет по определе-
нию константой (xn )m −→ am
x0 = 1, n→∞

поэтому в этом случае она непрерывна тривиаль- а затем по лемме 4.2.40,


ным образом.
2. Пусть k ∈ N∗ , тогда функция f (x) = xk 1 1
f (xn ) = m
−→ m = f (a)
определена на всей числовой прямой R. Зафик- (xn ) n→∞ a
сируем точку a ∈ R и рассмотрим произвольную
последовательность то есть f непрерывна в точке a. Поскольку точка
a ∈ D(f ) выбиралась произвольно, мы получаем,
xn −→ a что функция f (x) = xk непрерывна.
n→∞

Интуитивный смысл непрерывности в том, что график функции f непрерывной на каком-нибудь


интервале (α; β) является непрерывной кривой.

⊲ 4.3.12. По графику функции определите, в каких точках она является непре-


рывной, и будет ли она непрерывной
y
1 1) на интервале (−∞; 1)?
x 2) на интервале (−∞; 0)?
0 1 3) на интервале (1; +∞)?
4) на интервале (0; 1)?

(b) Непрерывность и монотонные последовательности


Теорема 4.3.13. Для всякой функции f , определенной на множестве M , следующие условия эк-
вивалентны:
(i) f непрерывна в точке a на M ;
(ii) для любой строго монотонной последовательности xn −→ a
n→∞

f (xn ) −→ f (a) (4.3.106)


n→∞

Доказательство. Ясно, что из (i) следует (ii), потому что если f непрерывна в a, то f (xn ) −→ f (a)
n→∞
для любой последовательности xn −→ a (необязательно монотонной). Докажем, что наоборот если
n→∞
(i) не выполняется, то не выполняется и (ii). Пусть f – разрывная функция на M , то есть существует
последовательность xn ∈ M такие что
xn −→ a & 6
f (xn )−→ f (a)
n→∞ n→∞
294 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

План наших действий состоит в том, чтобы, последовательно переходя от xn к ее подпоследова-


тельностям, построить строго монотонную последовательность с теми же свойствами.
1. Прежде всего, по свойству подпоследовательностей 2◦ на с.276, второе условие означает, что
существует ε > 0 и последовательность натуральных чисел nk −→ ∞, такие что
k→∞

∀k ∈ N∗ f (xnk ) ∈
/ (f (a) − ε; f (a) + ε)

Обозначив yk = xnk , мы получим последовательность с такими свойствами:

yk −→ a & ∀k ∈ N∗ f (yk ) ∈
/ (f (a) − ε; f (a) + ε)
k→∞

2. Заметим далее, что числа yk не могут совпадать с a

∀k ∈ N∗ yk 6= a

потому что иначе мы получили бы, что для некоторых k числа f (yk ) = f (a) лежат в интервале
(f (a) − ε; f (a) + ε). Отсюда следует, что либо бесконечный набор этих чисел лежит левее a, либо
бесконечный набор этих чисел лежит правее a. Будем для определенности считать, что выполняется
первое (второй случай рассматривается по аналогии):

yk < a.

Тогда по свойству 4◦ на с.276, найдется последовательность ki −→ ∞ такая, что


i→∞

∀i ∈ N∗ yki < a

Обозначив zi = yki , мы получим последовательность с такими свойствами:


   
zi −→ a & ∀i ∈ N∗ zi < a & ∀i ∈ N∗ f (zi ) ∈
/ (f (a) − ε; f (a) + ε)
i→∞

3. После этого мы индуктивно определим две последовательности im и tm . Сначала полагаем

i1 = 1, t1 = z 1

Затем, если для m = 1, ..., l числа im и tm определены, мы замечаем вот что. Поскольку zi < a,
zi −→ a и tl < a, найдется такое il+1 , что zil+1 лежит в интервале (tl ; a):
i→∞

zil+1 > tl

Выбираем такое il+1 и полагаем


tl+1 = zil+1
Полученная последовательность tm = zm+1 обладает нужными нам свойствами. Во-первых, как
подпоследовательность zi , она стремится к a:

tm = zim −→ a
m→∞

Во-вторых, последовательность значений f на ней не заходит в интервал (f (a) − ε; f (a) + ε):

∀m ∈ N∗ f (tm ) = f (zim ) ∈
/ (f (a) − ε; f (a) + ε)

И, в-третьих, она строго монотонна:

tm < zim+1 = tm+1

(c) Операции над непрерывными функциями


Из непрерывных функций можно конструировать новые непрерывные функции с помощью алгеб-
раических операций и операции композиции.
§ 3. Непрерывные функции 295

Арифметические операции с непрерывными функциями.


• Если f и g – две функции, определенные на множестве X, то их суммой, разностью и
произведением называются функции на X, обозначаемые f +g, f −g и f ·g, и определенные
формулами

(f + g)(x) := f (x) + g(x), x∈X (4.3.107)


(f − g)(x) := f (x) − g(x), x∈X (4.3.108)
(f · g)(x) := f (x) · g(x), x∈X (4.3.109)

• Если f и g – две функции, определенные на множестве X, причем f нигде не обращается


в нуль на X, то отношением этих функций fg называется функция на X, определенная
формулой
g g(x)
(x) := , x∈X (4.3.110)
f f (x)
• Если f – функция, определенная на множестве X, а λ – число, то их произведением
называется функция λ · f на X, определенная формулой

(λ · f )(x) := λ · f (x), x∈X (4.3.111)

Теорема 4.3.14 (об арифметических операциях с непрерывными функциями). Если функции f и


g непрерывны (на области определения), то непрерывны (на области определения) и функции
g
f + g, f − g, λ · f, f · g,
f
(где λ ∈ R – произвольное число).
Доказательство. Пусть точка a и последовательность {xn } таковы, что обе функции f и g в них
определены, причем
xn −→ a
n→∞

Тогда, поскольку функции f и g непрерывны в точке x = a, мы получаем

f (xn ) −→ f (a) g(xn ) −→ g(a)


n→∞ n→∞

0 0 0
Поэтому, в силу свойств 1 , 2 , 4 из (a), мы получаем

f (xn ) + g(xn ) −→ f (a) + g(a) f (xn ) − g(xn ) −→ f (a) − g(a) f (xn ) · g(xn ) −→ f (a) · g(a)
n→∞ n→∞ n→∞

Это верно для произвольной точки a и последовательности xn −→ a, поэтому функции f + g, f − g,


n→∞
f · g непрерывны. Аналогично доказывается непрерывность для функции λ · f .
Если, кроме того, дополнительно потребовать, чтобы f (a) 6= 0 и f (xn ) 6= 0, то по свойству 50 из
(a) мы получим
g(xn ) g(a)
−→
f (xn ) n→∞ f (a)
и поскольку это будет верно для любой точки a ∈ D( fg ) и любой последовательности xn ∈ D( fg ),
xn −→ a, мы получим, что функция fg тоже должна быть непрерывна.
n→∞

Непрерывность композиции. Вспомним, что на с.39 мы определили понятие композиции двух


отношений. В частном случае, когда отображения являются числовыми функциями, их композиция
также становится числовой функцией (в силу формул (0.3.212) и (0.3.213)), и мы можем считать
отмеченную выше формулу (0.3.214) просто ее определением:
• Пусть g и f – две функции. Тогда функция g ◦ f , определенная правилом

(g ◦ f )(x) = g(f (x)), (4.3.112)

называется композицией функций g и f . Эту функцию называют также сложной функ-


цией, составленной из функций f и g.
296 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

⋄ 4.3.15. Пусть g(y) = 1


и f (x) = x + 1. Тогда 1 1
y H(x) = =
{x} y y={x}
1 1
(g ◦ f )(x) = g(y) = =
y=f (x) y y=x+1 x + 1
⊲⊲ 4.3.17. Составьте композиции из следующих
Если же взять композицию этих функций в об- функций в разном порядке (то есть найдите

ратном порядке, то мы получим другую функ-
g(y) и f (x) ), и проверьте, будут ли
цию: y=f (x) x=g(y)
эти функции одинаковы:
1
(f ◦ g)(y) = f (x) = x + 1 1 = + 1
x=g(y) x= y y 1) g(y) = y 2 и f (x) = D(x) − 12 .
⋄ 4.3.16. Представить функции в виде компози- 2) g(y) = sgn y и f (x) = |x|.
ции двух функций:
1 ⊲⊲ 4.3.18. Представьте функции в виде компо-
G(x) = |x + 1|, H(x) =
{x} зиции двух функций:
Решение: 1) [ x2 ],


G(x) = |x + 1| = |y| , 2) [x]
y=x+1 2 .

Теорема 4.3.19 (о композиции непрерывных функций). Если функции f и g непрерывны (на обла-
сти определения), то их композиция h(x) = g(f (x)) тоже непрерывна (на области определения).

Доказательство. Пусть точка a и последовательность {xn } лежат в области определения функции


h(x) = g(f (x)), причем
xn −→ a
n→∞

Тогда, поскольку f (x) непрерывна в точке x = a,

f (xn ) −→ f (a)
n→∞

Отсюда, поскольку g непрерывна в точке y = f (a),

h(xn ) = g(f (xn )) −→ g(f (a))


n→∞

Мы получили, что если xn −→ a, то h(xn ) = g(f (xn )) −→ g(f (a)). Это означает, что h(x) = g(f (x))
n→∞ n→∞
непрерывна в точке x = a. Поскольку точка a с самого начала выбиралась произвольной, получаем,
что h(x) = g(f (x)) непрерывна в произвольной точке, то есть всюду на области определения.

(d) Теоремы о непрерывных функциях


Непрерывные функции обладают некоторыми важными свойствами, которые понадобятся в даль-
нейшем, в частности, для доказательства теоремы Ролля 6.1.32 (необходимой для доказательства
теорем Лагранжа, Коши и Тейлора из главы 6), а также теоремы об интегрируемости непрерывной
функции 8.2.12.

Теорема о сохранении знака


Теорема 4.3.20 (о сохранении знака непрерывной функцией). 11 Пусть функция f определена
в некоторой окрестности точки c и непрерывна в точке c, причем f (c) 6= 0. Тогда существует
окрестность (c − δ; c + δ) точки c такая, что всюду в этой окрестности функция f имеет тот
же знак, что и f (c):
∀x ∈ (c − δ; c + δ) sgn f (x) = sgn f (c)

Доказательство. Пусть для определенности f (c) > 0, покажем что для некоторого δ > 0 выполня-
ется соотношение
∀x ∈ (c − δ; c + δ) f (x) > 0 (4.3.113)
11 Эта теорема используется далее в главе 6 при доказательстве теоремы 6.2.30 о точках перегиба.
§ 3. Непрерывные функции 297

y = f (x)
f (c)
f (x)
x c
0 x

Доказательство проводится методом от противного. Предположим, что (4.3.113) не выполняется ни


для какого δ > 0, то есть что

∀δ > 0 ∃x ∈ (c − δ; c + δ) f (x) 6 0
1
Тогда, в частности, оно не выполняется для чисел δn = n:
 
1 1
∀n ∈ N ∃xn ∈ c − ; c + f (xn ) 6 0
n n

Мы получаем, что имеется последовательность

xn −→ c (4.3.114)
n→∞

для которой
f (xn ) 6 0 (4.3.115)
Поскольку f непрерывна в точке c, из (4.3.114) следует

f (xn ) −→ f (c)
n→∞

а по теореме 4.2.52 (о предельном переходе в неравенстве), из (4.3.115) следует

f (c) 6 0

Это противоречит предположению, что f (c) > 0. Значит, (4.3.113) все-таки должно выполняться
для какого-то δ > 0.

Теорема Коши о промежуточном значении.


Лемма 4.3.21 (о промежуточном значении). Пусть функция ϕ непрерывна на отрезке [a; b], и на
концах его принимает значения разных знаков:

ϕ(a) < 0 < ϕ(b) (или ϕ(a) > 0 > ϕ(b))

Тогда существует точка c ∈ (a; b) в которой ϕ(x) равна нулю:

ϕ(c) = 0

Доказательство. Пусть для определенности

ϕ(a) < 0 < ϕ(b)

y = ϕ(x)
ϕ(b)

a b
0 c x
ϕ(a)
298 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Разделим отрезок [a; b] пополам. Если значение функции в середине отрезка равно нулю, то теорема
доказана. Если же нет, то выберем из двух половинок ту, у которой на концах функция ϕ принимает
значения разных знаков, и обозначим ее [a1 ; b1 ]:

ϕ(a1 ) < 0 < ϕ(b1 ), [a1 ; b1 ] ⊆ [a; b]

Проделаем то же самое с отрезком [a1 ; b1 ]: разделим его пополам, выберем ту половинку, на концах
которой ϕ(x) меняет знак, и обозначим ее [a2 ; b2 ]:

ϕ(a2 ) < 0 < ϕ(b2 ), [a2 ; b2 ] ⊆ [a1 ; b1 ]

Затем поделим отрезок [a2 ; b2 ], и так далее. В результате у нас получится цепочка вложенных
отрезков, на концах которых функция меняет знак:
b−a
[a; b] ⊃ [a1 ; b1 ] ⊃ [a2 ; b2 ] ⊃ ... b n − an = −→ 0, ϕ(an ) < 0 < ϕ(bn )
2n n→∞
По теореме 4.2.62 о вложенных отрезках, существует единственная точка c, принадлежащая всем
отрезкам [an ; bn ], причем
lim an = c = lim bn
n→∞ n→∞

Отсюда следует, что с одной стороны, поскольку ϕ(an ) < 0,

ϕ(c) = lim ϕ(an ) 6 0


n→∞

а с другой, поскольку ϕ(bn ) > 0,


ϕ(c) = lim ϕ(bn ) > 0
n→∞

И следовательно, ϕ(c) = 0.

Теорема 4.3.22 (Коши о промежуточном значении). 12 Пусть функция f непрерывна на отрезке


[a; b], и пусть C – произвольное число, лежащее между f (a) и f (b):
 
f (a) < C < f (b) или f (a) > C > f (b)

Тогда на интервале (a; b) найдется точка c такая, что

f (c) = C

Доказательство. Рассмотрим функцию

ϕ(x) = f (x) − C

Она будет непрерывна на отрезке [a; b] (как разность непрерывных функций) и принимает на концах
этого отрезка значения разных знаков
 
ϕ(a) = f (a) − C < 0 < f (b) − C = ϕ(b) или ϕ(a) = f (a) − C > 0 > f (b) − C = ϕ(b)

Поэтому, по лемме 4.3.21, существует точка c ∈ [a; b] такая, что ϕ(c) = 0. Отсюда f (c) = ϕ(c) + C =
C.

Теоремы Вейерштрасса
Теорема Вейерштрасса об ограниченности. Напомним, что функция f называется
– ограниченной сверху на множестве E, если существует число B такое, что

∀x ∈ E f (x) 6 B

– ограниченной снизу на множестве E, если существует число A такое, что

∀x ∈ E A 6 f (x)
12 Эта теорема используется далее на с.492 при доказательстве теоремы о среднем для определенного интеграла.
§ 3. Непрерывные функции 299

– ограниченной на множестве E, если она ограничена на E сверху и снизу, то есть суще-


ствуют такие числа A и B что:

∀x ∈ E A 6 f (x) 6 B

Теорема 4.3.23 (Вейерштрасса об ограниченности). 13 Если функция f определена и непрерывна


на отрезке [a; b], то она ограничена на этом отрезке.
Доказательство. Предположим обратное, то есть что f не ограничена на отрезке [a; b]. Значит f
не ограничена сверху или снизу. Пусть для определенности f не ограничена сверху:

∀B ∈ R ∃x ∈ [a; b] f (x) > B

Тогда для всякого n ∈ N можно подобрать точку xn ∈ [a; b] такую, что

f (xn ) > n (4.3.116)

Последовательность точек {xn } принадлежит отрезку [a; b] и значит ограничена. Следовательно, по


теореме Больцано-Вейерштрасса 4.2.68, {xn } содержит сходящуюся подпоследовательность {xnk }:

xnk −→ c ∈ [a; b] (4.3.117)


k→∞

Из формулы (4.3.116) получаем


f (xnk ) > nk −→ +∞
k→∞
поэтому
f (xnk ) −→ +∞ (4.3.118)
k→∞

Но с другой стороны, функция f непрерывна в любой точке отрезка [a; b], и в частности в точке
c ∈ [a; b], значит из (4.3.117) следует

f (xnk ) −→ f (c) 6= +∞ (4.3.119)


k→∞

Мы получили противоречие между (4.3.118) и (4.3.119), которое означает, что наше исходное пред-
положение было неверно. Значит, функция f все-таки ограничена.

Теорема Вейерштрасса об экстремумах. Пусть функция f определена на множестве E ⊆ R.


Точка xmax ∈ E называется точкой максимума функции f на множестве E, если

∀x ∈ E f (x) 6 f (xmax )

Число f (xmax ) при этом называется максимумом функции f на множестве E и обозначается

f (xmax ) = max f (x)


x∈E

Наоборот, точка xmin ∈ E называется точкой минимума функции f на множестве E, если

∀x ∈ E f (xmin ) 6 f (x)

Число f (xmin ) при этом называется минимумом функции f на множестве E и обозначается

f (xmin ) = min f (x)


x∈E

Экстремумом функции f на множестве E называется минимум или максимум функции f на


множестве E.
! 4.3.24. Максимум и минимум функции – не то же самое, что точная верхняя и точная нижняя
грани.

13 Эта теорема используется в следующем параграфе при доказательстве теоремы Вейерштрасса об экстремумах

4.3.28
300 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

⋄ 4.3.25. Пусть E = [−1; 1] и f (x) = x2 . чем точная нижняя грань (существует и) совпа-
дает с минимумом, а точная верхняя грань суще-
y ствует, но не совпадает с максимумом, которого
на множестве E = (−1; 1) нет (потому что нет
точек максимума):


min x2 = x2 =0= inf x2
x∈(−1;1) x=0 x∈(−1;1)
-1 0 1 x
sup x2 = 1 ∄ max x2
x∈(−1;1)
x∈(−1;1)
Тогда на множестве E у функции f имеется одна
точка минимума и две точки максимума, причем
минимум совпадает с точной нижней гранью, а ⋄ 4.3.27. Пусть E = R и f (x) = {x}.
максимум – с точной верхней гранью:
y
2 2 2
min x = x = 0 = inf x
x∈[−1;1] x=0 x∈[−1;1]
1

max x2 = x2 = x2 =1= sup x 2
x∈[−1;1] x=−1 x=1 x∈[−1;1]

⋄ 4.3.26. Пусть E = (−1; 1) и f (x) = x2 . −2 −1 0 1 2 x

y
Тогда на множестве E у функции f нет то-
чек максимума, хотя точная верхняя грань су-
ществует:

sup{x} = 1 ∄ max{x}
x∈R x∈R
-1 0 1 x
При этом минимум на этом множестве есть:
Тогда на множестве E у функции f имеется одна
точка минимума и нет точек максимума, при- inf {x} = min{x} = 0
x∈R x∈R

Итак, экстремумы могут существовать, а могут и не существовать.


Теорема 4.3.28 (Вейерштрасса об экстремумах). 14 Если функция f определена и непрерывна на
отрезке [a; b], то она имеет минимум и максимум на этом отрезке.
Доказательство. Докажем существование максимума. По теореме 4.3.23, функция f ограничена
сверху на [a; b]:
∃C ∀x ∈ [a; b] f (x) 6 C
поэтому по теореме 3.1.29 о точной границе, у функции f существует точная верхняя грань на этом
множестве:
∃ sup f (x) = M
x∈[a;b]

Это значит, что во-первых, все значения функции f на отрезке [a; b] не превосходят M

∀x ∈ [a; b] f (x) 6 M (4.3.120)

и во-вторых если взять любое число α < M , то обязательно оно окажется меньше, чем какое-то
значение f на отрезке [a; b]
∀α < M ∃x ∈ [a; b] α < f (x)
Возьмем в качестве α числа вида M − n1 . Тогда у нас получится целая последовательность {xn }:

1
∀n ∈ N ∃xn ∈ [a; b] M − < f (xn ) (4.3.121)
n
14 Эта теорема используется ниже на с.380 при доказательстве теоремы Ролля 6.1.32, на с.490 при доказательстве

теоремы об интегрируемости непрерывной функции 8.2.12, и на с.496 при доказательстве интегральной теоремы о
среднем (свойство 7◦ на с.492).
§ 3. Непрерывные функции 301

Поскольку последовательность {xn } лежит в отрезке [a; b], она ограничена. Значит по теореме
Больцано-Вейерштрасса 4.2.68, из нее можно выбрать сходящуюся подпоследовательность:
xnk −→ c (c ∈ [a; b])
k→∞

Поскольку f непрерывна в любой точке отрезка [a; b] и, в частности, в точке c ∈ [a; b], мы получаем
f (xnk ) −→ f (c)
k→∞

С другой стороны, из (4.3.120) и (4.3.121) следует


1
M− < f (xnk ) 6 |{z}
M ,
n | {z }
| {z k} ↓ ↓
↓ f (c) M
M

откуда по теореме 4.2.52 о переходе к пределу в неравенстве


M 6 f (c) 6 M,
то есть
f (c) = M.
Еще раз вспомнив (4.3.120), получим
∀x ∈ [a; b] f (x) 6 M = f (c)
Это означает, что c ∈ [a; b] является точкой максимума функции f на множестве [a; b].
Следствие 4.3.29. Множество значений всякой (определенной на отрезке) непрерывной функции
f : [a, b] → R является отрезком.
Доказательство. По теореме 4.3.28 функция f имеет минимум в некоторой точке α ∈ [a, b] и мак-
симум в некоторой точке β ∈ [a, b]:
f (α) = min f (x), f (β) = max f (x).
x∈[a,b] x∈[a,b]

Покажем, что
R(f ) = [f (α), f (β)].
1. Будем считать для начала, что α < β. Тогда по теореме Коши 4.3.22, любая точка C ∈
(f (α), f (β)) является образом некоторой точки c ∈ (α, β). Значит, весь отрезок [f (α), f (β)] лежит в
R(f ) = f ([a, b]):
[f (α), f (β)] ⊆ R(f ).
Но с другой стороны, никакая точка y, лежащая выше [f (α), f (β)], не может принадлежать f ([a, b]),
потому что тогда мы получили бы, что f (β) — не максимум множества f ([a, b]). И таким же образом,
никакая точка y, лежащая ниже [f (α), f (β)], не может принадлежать f ([a, b]), потому что тогда мы
получили бы, что f (α) — не минимум множества f ([a, b]). Значит,
[f (α), f (β)] = R(f ).
2. В случае если α > β можно рассмотреть функцию
g(x) = f (−x)
и для нее мы получим, что
g(−α) = min g(x), g(−β) = max g(x)
x∈[−a,−b] x∈[−a,−b]

и
−α < −β.
Тогда, по уже доказанному,
R(g) = [g(−α), g(−β)],
и это можно дополнить до цепочки
R(f ) = R(g) = [g(−α), g(−β)] = [f (α), f (β)].
302 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Теорема Кантора о равномерной непрерывности


Говорят, что функция f равномерно непрерывна на множестве E если для любых двух последо-
вательностей аргументов αn ∈ E и βn ∈ E стремящихся друг к другу, соответствующие последова-
тельности значений {f (αn )} и {f (βn )} тоже стремятся друг к другу:
∀αn , βn ∈ E αn − βn −→ 0 =⇒ f (αn ) − f (βn ) −→ 0 (4.3.122)
n→∞ n→∞

⋄ 4.3.30. Линейная функция f (x) = kx+b равно- то мы получим, что


мерно непрерывна на множестве E = R, потому
что если 1
αn − βn = −→ 0
αn − βn −→ 0 n n→∞
n→∞
то но при этом

f (αn ) − f (βn ) = (kαn + b) − (kβn + b) =  2


1
f (αn )−f (βn ) = (αn )2 −(βn )2 =
n+ −n2 =
= kαn − kβn = k(αn − βn ) −→ 0 n
n→∞
1 1 1
⋄ 4.3.31. Квадратичная функция f (x) = x2 не = 2n · + 2 = 2 + 2 −→ 2 6= 0
n n n n→∞
является равномерно непрерывной на множестве
E = R, потому что если взять, например,
1
αn = n + , βn = n
n

Теорема 4.3.32 (Кантора о равномерной непрерывности). 15 Если функция f определена и непре-


рывна на отрезке [a; b], то она равномерно непрерывна на этом отрезке.
Доказательство. Доказательство проводится от противного. Предположим, что f не является рав-
номерно непрерывной на [a; b]. Тогда существуют последовательности аргументов αn ∈ [a; b] и
βn ∈ [a; b] которые стремятся друг к другу
αn − βn −→ 0
n→∞

но при этом последовательности значений не стремятся друг к другу:


f (αn ) − f (βn )−→
6 0
n→∞

Рассмотрим последовательность
γn = f (αn ) − f (βn )
То, что она не стремится к нулю
γn −→
6 0
n→∞
означает, что найдется некоторая окрестность нуля (−ε; ε) которая не содержит бесконечное коли-
чество чисел {γn }. Значит можно выбрать подпоследовательность {γnk }, которая вообще не будет
заходить в окрестность (−ε; ε):
∀k |γnk | = |f (αn ) − f (βn )| > ε (4.3.123)
Рассмотрим теперь индексы {nk }. Им соответствует некоторая подпоследовательность {αnk } после-
довательности {αn }. Поскольку она ограничена (из-за того, что αnk ∈ [a; b]), по теореме Больцано-
Вейерштрасса 4.2.68 мы можем выбрать у нее некоторую сходящуюся подпоследовательность {αnkj }:

αnkj −→ c (c ∈ [a; b])


j→∞

Тогда мы получим, что соответствующая последовательность {βnkj } стремится к тому же пределу


c, потому что
βnkj = (βnkj − αnkj ) + αnkj −→ 0 + c = c
| {z } |{z } j→∞
↓ ↓
0 c

15 Эта теорема используется на с.490 при доказательстве теоремы об интегрируемости непрерывной функции.
§ 3. Непрерывные функции 303

Отсюда следует, что


   
f αnkj − f βnkj −→ f (c) − f (c) = 0
|{z} |{z} j→∞
↓ ↓
c c

а это противоречит условию (4.3.123), из которого видно, что расстояние между f (αnkj ) и f (βnkj )
не может быть меньше ε.
Итак, мы предположили, что f не является равномерно непрерывной на [a; b] и получили проти-
воречие. Это означает, что предположение неверно, и функция f все-таки равномерно непрерывна
на [a; b].

Теоремы о монотонных функциях.


Монотонные функции на отрезке.

Теорема 4.3.33 (о монотонной функции на отрезке). Пусть функция f определена и строго мо-
нотонна на отрезке I = [a, b], и пусть J – отрезок с концами f (a) и f (b):
(
[f (a); f (b)], если f возрастает
J=
[f (b); f (a)], если f убывает.

Тогда:
(i) если f биективно отображает отрезок I на отрезок J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает отрезок I на отрезок J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.

Доказательство. Будем считать для определенности, что функция f строго возрастает:

s<t =⇒ f (s) < f (t) (4.3.124)

(случай убывания рассматривается аналогично).


Докажем (i). Пусть f биективно отображает отрезок I на отрезок J. Тогда у нее имеется обратная
функция f −1 : J → I.
1. Прежде всего заметим, что f −1 : J → I также будет возрастать. Действительно, если бы это
было не так, то для некоторых y1 , y2 ∈ J мы получили бы

y1 < y2 & f −1 (y1 ) > f −1 (y2 )

Тогда можно было бы обозначить x1 = f −1 (y1 ) и x2 = f −1 (y2 ), и получилось бы:

f (x1 ) < f (x2 ) & x1 > x2


| {z } | {z } |{z} |{z}
y1 y2 f −1 (y 1) f −1 (y2 )

Это противоречит утверждению 1◦ на с.248: поскольку f возрастает, она должна неубывать, значит
условие x1 > x2 должно влечь за собой условие f (x1 ) > f (x2 ), а у нас получается наоборот, f (x1 ) <
f (x2 ).
2. Покажем, что функция f : I → J непрерывна. Пусть xn −→ x, покажем что f (xn ) −→
n→∞ n→∞
f (x). По теореме 4.3.13, последовательность xn можно считать строго монотонной. Нам придется
рассмотреть два случая.
304 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

A. Пусть сначала xn возрастает:

x1 < x2 < ... < xn < ... < x

Тогда предел x этой последовательности равен ее точной верхней грани

lim xn = sup xn = x (4.3.125)


n→∞ n∈N∗

и то же для предела последовательности f (xn ) поскольку, в силу (4.3.124), она тоже воз-
растает:
lim f (xn ) = sup f (xn ) (4.3.126)
n→∞ n∈N∗

Обозначив yn = f (xn ), мы получим



sup yn = sup f (xn ) 6 (4.1.33) 6 f sup xn = (4.3.125) = f (x)
n∈N∗ n∈N∗ n∈N∗


sup yn 6 f (x)
n∈N∗

⇓ (f −1 возрастает, как уже доказано)

  
f −1 sup yn 6 f −1 f (x) = x (4.3.127)
n∈N∗

А с другой стороны, опять, поскольку f −1 возрастает,


  
x = sup xn = sup f −1 f (xn ) = sup f −1 (yn ) 6 (4.1.33) 6 f −1 sup yn
n∈N∗ n∈N∗ n∈N∗ n∈N∗


 
x 6 f −1 sup yn (4.3.128)
n∈N∗

Неравенства (4.3.127) и (4.3.128) вместе дают


 
x = f −1 sup yn
n∈N∗

То есть
f (x) = sup yn = sup f (xn ) = (4.3.126) = lim f (xn )
n∈N∗ n∈N∗ n→∞

B. Пусть теперь наоборот, xn убывает:

x < ... < xn < ... < x2 < x1

Тогда предел x этой последовательности равен ее точной нижней грани

lim xn = inf ∗ xn = x (4.3.129)


n→∞ n∈N

и то же для предела последовательности f (xn ) поскольку, в силу (4.3.124), она тоже воз-
растает:
lim f (xn ) = inf ∗ f (xn ) (4.3.130)
n→∞ n∈N

Обозначив yn = f (xn ), мы получим



inf ∗ yn = inf ∗ f (xn ) > (4.1.33) > f inf ∗ xn = (4.3.129) = f (x)
n∈N n∈N n∈N


sup yn > f (x)
n∈N∗

⇓ (f −1 возрастает, как уже доказано)


§ 3. Непрерывные функции 305

  
f −1 inf ∗ yn > f −1 f (x) = x (4.3.131)
n∈N

А с другой стороны, опять, поскольку f −1 возрастает,


  
x = inf ∗ xn = inf ∗ f −1 f (xn ) = inf ∗ f −1 (yn ) > (4.1.33) > f −1 inf ∗ yn
n∈N n∈N n∈N n∈N


 
x > f −1 inf ∗ yn (4.3.132)
n∈N

Неравенства (4.3.131) и (4.3.132) вместе дают


 
x = f −1 inf ∗ yn
n∈N

То есть
f (x) = inf ∗ yn = inf ∗ f (xn ) = (4.3.130) = lim f (xn )
n∈N n∈N n→∞

3. Мы показали, что если функция f : I → J возрастает и биективна, то она автоматически


непрерывна. Поскольку обратная функция f −1 : J → I тоже биективна и, как мы уже убедились,
тоже возрастает, мы получаем, что она тоже должна быть непрерывной.
Докажем (ii). Пусть f непрерывна на I.
1. Заметим, что f отображает I в J. Это следует из того, что функция f неубывает (1◦ на с.248):
если x ∈ I = [a, b], то
a6x6b =⇒ f (a) 6 f (x) 6 f (b) =⇒ f (x) ∈ J = [f (a), f (b)]
2. Проверим, что f инъективно отображает I в J. Для любых x, y ∈ I получаем:
   
x < y =⇒ f (x) < f (y) f (x) < f (y)
x 6= y =⇒ =⇒ =⇒ f (x) 6= f (y) (4.3.133)
y < x =⇒ f (y) < f (x) f (y) < f (x)

3. Покажем далее, что f сюръективно отображает I в J, то есть что f (I) = J. Для любого
C ∈ J = [f (a), f (b)] получаем:
— либо C лежит на левом конце отрезка J = [f (a), f (b)], то есть C = f (a), и тогда точка
x = a ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит на правом конце отрезка J = [f (a), f (b)], то есть C = f (b), и тогда точка
x = b ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит внутри отрезка J = [f (a), f (b)], то есть f (a) < C < f (b), и тогда по
теореме Коши о промежуточном значении 4.3.22 найдется точка x ∈ (a, b) такая, что
C = f (x).
4. Инъективность и сюръективность отображения f : I → J означают, что оно является биекци-
ей, и поэтому правило
f (x) = y ⇐⇒ x = f −1 (y)
определяет обратное к нему отображение f −1 : J → I.
5. Проверим, что функция f −1 : J → I строго монотонна. Пусть y1 < y2 – две точки из J.
Обозначим x1 = f −1 (y1 ) и x2 = f −1 (y2 ). Поскольку отображение f −1 биективно, x1 не может быть
равно x2 . Значит, либо x1 < x2 , либо x1 > x2 . Но второе, в силу строгого возрастания f , влечет за
собой неравенство y1 > y2 :
x1 > x2 =⇒ y1 = f (x1 ) > f (x2 ) = y2 ,
что противоречит исходному выбору y1 < y2 . Значит, x1 > x2 тоже невозможно. Мы получаем, что
возможно только неравенство x1 < x2 , и это означает, что функция f −1 строго возрастает:
y1 > y2 =⇒ x1 = f −1 (y1 ) > f −1 (y2 ) = x2 .
6. Осталось убедиться, что функция f −1 : J → I непрерывна. Предположим, что это не так, то
есть что существует последовательность yn ∈ J = [f (a), f (b)] такая что
yn −→ y & f −1 (yn ) −→
6 f −1 (y) (4.3.134)
n→∞ n→∞
306 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Обозначим xn = f −1 (yn ) и x = f −1 (y), тогда

xn = f −1 (yn ) −→
6 f −1 (y) = x
n→∞

и по свойству 2◦ на с.276, это означает, что существует подпоследовательность xnk , лежащая вне
некоторой окрестности (x − ε; x + ε) точки x:

xnk ∈
/ (x − ε; x + ε), ε>0 (4.3.135)

С другой стороны, последовательность xnk лежит в отрезке [a, b], поэтому по теореме Больцано-
Вейерштрасса 4.2.68, у нее должна быть сходящаяся подпоследовательность:

xnki −→ t (t ∈ I = [a, b])


n→∞

Из (4.3.135) следует, что t ∈


/ (x − ε; x + ε), поэтому t 6= x. Но, с другой стороны,

xnki −→ t
n→∞

ynki = f (xnki ) −→ f (t)


n→∞

f (t) = lim ynki = (свойство 1◦ на с. 276) = lim yn = y


i→∞ n→∞

t = f −1 (f (t)) = f −1 (y) = x
То есть t 6= x и одновременно t = x. Это противоречие означает, что наше предположение (4.3.134)
о разрывности функции f −1 было неверно.

Монотонные функции на интервале.

Теорема 4.3.34 (о монотонной функции на интервале). Пусть функция f определена и строго


монотонна на интервале I = (a, b), и пусть J – интервал с концами inf x∈I f (x) и supx∈I f (x):
 
J= inf f (x); sup f (x)
x∈I x∈I

Тогда:
(i) если f биективно отображает интервал I на интервал J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает интервал I на интервал J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.

! 4.3.35. В условиях теоремы из равенства f −1 (J) = I следуют две формулы, которые, несмотря
на свою очевидность, оказываются полезными:16

inf f −1 (y) = inf I sup f −1 (y) = sup I (4.3.136)


y∈J y∈J
16 Мы используем формулы (4.3.136) ниже в предложении 5.1.7.
§ 3. Непрерывные функции 307

Доказательство. Как и в доказательстве предыдущей теоремы будем считать, что f строго воз-
растает.
Докажем (i). Пусть f биективно отображает интервал I на интервал J. Тогда у нее имеется
обратная функция f −1 : J → I.
1. Прежде всего, как и в теореме 4.3.33, без труда доказывается, что обратная функция f −1 :
J → I также возрастает.
2. Выберем отрезок [α, β] ⊆ I, и покажем, что f биективно отображает его на отрезок [f (α), f (β)] ⊆
J. Во-первых, из-за монотонности, f действительно отображает [α, β] в [f (α), f (β)]:

x ∈ [α, β] =⇒ α6x6β =⇒ f (α) 6 f (x) 6 f (β)

Во-вторых, если C ∈ [f (α), f (β)], то, поскольку f : I → J биективно, должно существовать c ∈ I


такое, что
f (c) = C
Нам нужно показать, что это c лежит в отрезке [α, β]. Если бы это было не так, то мы получили
бы:
— либо c < α, и тогда C = f (c) < f (α), а это невозможно, потому что C ∈ [f (α), f (β)],
— либо β < c, и тогда f (β) < f (c) = C, и это тоже невозможно, потому что C ∈ [f (α), f (β)].
Таким образом, что c ∈ [α, β], и это доказывает сюръективность отображения f : [α, β] → [f (α), f (β)].
С другой стороны, будучи строго монотонным, оно инъективно, поэтому является биекцией.
3. По теореме 4.3.33, функция f : [α, β] → [f (α), f (β)] должна быть непрерывной. Это верно для
любого отрезка [α, β] ⊆ I, поэтому наша исходная функция f : I → J непрерывна на интервале I.
4. Для доказательства (i) остается только убедиться, что обратная функция f −1 : J → I тоже
непрерывна на J. Для этого возьмем произвольный отрезок [A, B] ∈ J (A < B) и положим

α = f −1 (A), β = f −1 (B)

Поскольку, как мы уже заметили, f −1 возрастает, получаем

α<β

и, опять мы это уже показали, функция f будет биективно (и строго монотонно) отображать отрезок
[α, β] на отрезок [A, B] = [f (α), f (β)]. Значит, по теореме 4.3.33, обратная функция f −1 : [A, B] →
[α, β] тоже должна быть непрерывной. Это верно для любого отрезка [A, B] ∈ J, поэтому функция
f −1 : J → I должна быть непрерывна.
Докажем (ii). Пусть f непрерывна на I.
1. Если x ∈ I = (a, b), то выбрав α и β так, чтобы x ∈ [α, β] ⊆ (a, b) = I. Тогда:

a<α<x<β<b


inf f (t) 6 f (α) < f (x) < f (β) 6 sup f (t)
x∈I x∈I


 
f (x) ∈ inf f (t), sup f (t) = J
x∈I x∈I

То есть f (I) ⊆ J.
2. Инъективность отображения f : I → J доказывается той же цепочкой (4.3.133), что и для
случая, когда I – отрезок.
3. Сюръективность отображения f : I → J. Пусть y ∈ J = (inf t∈I f (t), supt∈I f (t)). Тогда:

inf f (t) < y < sup f (t) =⇒ ∃t1 , t2 ∈ I : f (t1 ) < y < f (t2 ) =⇒
t∈I t∈I
=⇒ y ∈ [f (t1 ); f (t2 )] =⇒ ∃x ∈ [t1 ; t2 ] y = f (x)
теорема 4.3.33

4. Снова инъективность и сюръективность отображения f : I → J означают, что оно является


биекцией, и поэтому правило

f (x) = y ⇐⇒ x = f −1 (y)
308 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

определяет обратное к нему отображение f −1 : J → I.


5. Строгая монотонность функции f −1 : J → I доказывается так же, как и в случае, когда I –
отрезок.
6. Остается проверить непрерывность функции f −1 : J → I. Пусть y1 < y2 – произвольные
точки из J. Рассмотрим точки x1 = f −1 (y1 ) и x2 = f −1 (y2 ) из I. Поскольку функция f −1 : J → I
строго возрастает, должно выполняться неравенство x1 < x2 . Рассмотрим отрезок [x1 , x2 ]. На нем
функция f непрерывна и строго возрастает, поэтому, как мы уже доказали, f должна непрерыв-
но и биективно отображать [x1 , x2 ] на [f (x1 ), f (x2 )] = [y1 , y2 ], а обратное отображение f −1 будет
непрерывно отображать [y1 , y2 ] в [x1 , x2 ].
Из этого можно сделать вывод, что функция f −1 : J → I непрерывна на каждом отрезке [y1 , y2 ]
из интервала J. Это автоматически означает, что f −1 непрерывна на J.

! 4.3.36. Утверждения, аналогичные теоремам 4.3.33 и 4.3.34 справедливы и для полуинтервалов.


Мы предлагаем читателю самостоятельно их сформулировать и доказать.

§4 Предел функции
В задачах физики бывает важно уметь судить о поведении значений функции f (x) при приближе-
нии аргумента x к каким-то точкам a, то есть о поведении последовательностей f (xn ) при xn → a.
Поскольку не все функции непрерывны, последовательность f (xn ) совсем необязательно будет стре-
миться к значению f (a): возможна (и часто встречается) ситуация, когда

xn −→ a & f (xn ) −→
/ f (a)
n→∞ n→∞

(не говоря уже о том, что значение f (a) может вообще не существовать, если функция f не опре-
делена в точке a).
Это важно вот в каких задачах. Например, если функция f (x) описывает поведение динамиче-
ской системы, то есть считается, что параметр x обозначает время, то имеется качественная разница
между ситуацией, когда при стремлении xn к a значения f (xn ) стремятся к некоторому числу C,
не зависящему от выбора xn ,

∃C ∈ R ∀xn xn −→ a ⇒ f (xn ) −→ C
n→∞ n→∞

0 a x

и ситуацией, когда f (xn ) уходит в бесконечность,

∀xn xn −→ a ⇒ f (xn ) −→ ∞.
n→∞ n→∞

0 a x

Если, например, под f (x) понимается количество выработанной энергии к моменту времени x, то
первая ситуация означает, что при приближении x к a динамическая система ведет себя “регулярно”,
то есть в ней не происходит качественных изменений (только количественные), а вторая — наборот,
§ 4. Предел функции 309

что в системе происходит “взрыв”, и она должна разрушиться (потому что количество выработанной
энергии к моменту времени x = a становится бесконечным).
С другой стороны, обе эти ситуации качественно отличаются от картины, когда при каком-то
выборе xn → a последовательность f (xn ) вообще не имеет предела:

∃xn xn −→ a & ∄ lim f (xn ).


n→∞ n→∞

На языке физики это означает, что при приближении x к a динамическая система теряет устойчи-
вость: при малых изменениях аргумента значения функции f начинают меняться существенно, так
что приближенно найти значение f (x) становится невозможно.
Человечеством выработан способ просто и наглядно описывать все эти детали в поведении за-
данной функции f : для этого нужно построить ее график. В качестве примера можно рассмотреть
график функции f (x) = {x} (дробной части числа, определенной на с.236):
y
y = {x} 1

−2 −1 1 2 x

Пузыри на концах наклонных отрезков в этой картине объясняют, к чему стремится значение функ-
ции, когда аргумент стремится к целому числу слева. Например, если x стремится к 1 слева, то
f (x) стремится к числу 1 (которое не является значением функции f в точке 1),

f (x) −→ 1. (4.4.137)
x→1, x<1

При этом это соотношение понимается не как-нибудь, а именно как утверждение о последователь-
ностях: если последовательность xn стремится к 1 слева, то последовательность f (xn ) обязательно
стремится к 1,
xn −→ 1, xn < 1 =⇒ f (xn ) −→ 1, (4.4.138)
n→∞ n→∞

1
f (x3 )
f (x2 )
f (x1 )

0 x1 x2 x3 1 2 x

С другой стороны, жирные точки показывают, что при стремлении аргумента x к целому числу a
справа, значение функции f (x) стремится к ее значению в точке a. Например, если x стремится к
1 справа, то f (x) стремится к 0 = f (1),

f (x) −→ 0. (4.4.139)
x→1, x>1

И опять это понимается как утверждение о последовательностях: если последовательность xn стре-


мится к 1 справа, то последовательность f (xn ) стремится к 0:

xn −→ 1, 1 < xn =⇒ f (xn ) −→ 0. (4.4.140)


n→∞ n→∞

Условие (4.4.138) (расшифровывающее запись (4.4.137)) принято записывать формулой

lim f (x) = 1,
x→1−0
310 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

и в таких случаях говорят, что функция f имеет предел слева в точке 1. А условие (4.4.140) (рас-
шифровывающее запись (4.4.139)) принято записывать формулой

lim f (x) = 0,
x→1+0

и в таких случаях говорят, что функция f имеет предел справа в точке 1, равный 0.

В этом параграфе мы подробно обсудим понятие предела функции. Ниже в главе 6 будет дано
его важное применение: с его помощью определяется понятие производной, играющие центральную
роль во всем математическом анализе.

(a) Определение и свойства предела функции

Когда в § 2 этой главы мы определяли предел последовательности, мы приводили два определения:


отдельно для конечного и бесконечного предела. В случае с пределом функции ситуация много-
кратно усложняется из-за того, что аргумент функции x и ее значение f (x) могут стремиться в
различных ситуациях к конечным величинам или бесконечности. В соответствии с этим различа-
ются четыре основных вида пределов функции, причем каждый из них имеет два дополнительных
“подвида”, потому что аргумент x предполагается иногда стремящимся к a с одной стороны.

Представление об этой картине дает следующая таблица:

Функция стремится Функция стремится


ТИПЫ ПРЕДЕЛОВ ФУНКЦИИ к конечной величине: к бесконечности:
f (x) → A f (x) → ∞
Аргумент стремится Конечный предел Бесконечный предел
к конечной величине: в точке: в точке:
x→a limx→a f (x) = A limx→a f (x) = ∞
возможно, с одной стороны:
Конечный предел Бесконечный предел
слева в точке a слева: в точке a слева:
x→a−0 limx→a−0 f (x) = A limx→a+0 f (x) = ∞
Конечный предел Бесконечный предел
или справа в точке a справа: в точке a справа:
x→a+0 limx→a+0 f (x) = A limx→a+0 f (x) = ∞
Аргумент стремится Конечный предел Бесконечный предел
к бесконечности: в бесконечности: в бесконечности:
x→∞ limx→∞ f (x) = A limx→∞ f (x) = ∞
возможно, в одну сторону:
Конечный предел Бесконечный предел
влево в минус бесконечности: в минус бесконечности:
x → −∞ limx→−∞ f (x) = A limx→−∞ f (x) = ∞
Конечный предел Бесконечный предел
или вправо в плюс бесконечности: в плюс бесконечности:
x → +∞ limx→+∞ f (x) = A limx→+∞ f (x) = ∞

К этим 12 типам пределов следует добавть еще 12, соответствующих случаям, когда функция f
стремится к бесконечности с определенным знаком:
§ 4. Предел функции 311

Функция стремится Функция стремится


ТИПЫ ПРЕДЕЛОВ ФУНКЦИИ к минус бесконечности: к плюс бесконечности:
f (x) → −∞ f (x) → +∞
Аргумент стремится Бесконечный предел Бесконечный предел
к конечной величине: в точке: в точке:
x→a limx→a f (x) = −∞ limx→a f (x) = +∞
возможно, с одной стороны:
Бесконечный предел Бесконечный предел
слева в точке a слева: в точке a слева:
x→a−0 limx→a−0 f (x) = −∞ limx→a+0 f (x) = +∞
Бесконечный предел Бесконечный предел
или справа в точке a справа: в точке a справа:
x→a+0 limx→a+0 f (x) = −∞ limx→a+0 f (x) = +∞
Аргумент стремится Бесконечный предел Бесконечный предел
к бесконечности: в бесконечности: в бесконечности:
x→∞ limx→∞ f (x) = −∞ limx→∞ f (x) = +∞
возможно, в одну сторону:
Бесконечный предел Бесконечный предел
влево в минус бесконечности: в минус бесконечности:
x → −∞ limx→−∞ f (x) = −∞ limx→−∞ f (x) = +∞
Бесконечный предел Бесконечный предел
или вправо в плюс бесконечности: в плюс бесконечности:
x → +∞ limx→+∞ f (x) = −∞ limx→+∞ f (x) = +∞

Таким образом, чтобы определить предел функции, нужно формально сформулировать 24 раз-
ных определения. Чтобы не утомлять читателя такими вразумлениями, обычно поступают иначе.
Говорят так: пусть a и A обозначают числа, или символы бесконечности, возможно с определенным
знаком
a, A ∈ R или a, A = ∞, −∞, +∞

(такие объекты называются величинами) и пусть для всякого такого a


— проколотой окрестностью величины a называется всякое множество вида
  

 (a − δ, a) ∪ (a, a + δ), где δ > 0 если a – число 


   

 

 (−∞, −E) ∪ (E, +∞), где E > 0 если a = ∞ ; 
U=  

 (−∞, −E), где E > 0 если a = −∞ ; 


   


 

 (E, +∞), где E > 0 если a = +∞ ; 

— левой полуокрестностью a называется всякий интервал вида


 
U = (a − δ, a), где δ > 0 если a – число

— правой полуокрестностью a называется всякий интервал вида


 
U = (a, a + δ), где δ > 0 если a – число

Далее следует определение, впервые сформулированное немецким математиком Генрихом Гейне:17

• Величина A называется пределом функции f при x стремящимся к a


 
A = lim f (x) f (x) −→ A
x→a x→a

если
1) f определена в некоторой выколотой окрестности U величины a и
17 Генрих Гейне (1821-1881) – известный немецкий математик.
312 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

2) для любой последовательности xn ∈ U , стремящейся к a


 
xn −→ a xn 6= a
n→∞

соответствующая последовательность значений f (xn ) стремится к A:

f (xn ) −→ A
n→∞

Отдельно определяются односторонние пределы:


• Величина A называется пределом слева (справа) функции f в точке a
 
A = lim f (x) A = lim f (x)
x→a−0 x→a+0

если
1) f определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой последовательности xn ∈ U , стремящейся к a
 
xn −→ a xn 6= a
n→∞

соответствующая последовательность значений f (xn ) стремится к A:

f (xn ) −→ A
n→∞

Перепишем эти общие определения для неко- или


торых конкретных ситуаций. lim f (x) = A
x→a
⋄ 4.4.1 (конечный предел функции в точке по ⋄ 4.4.2 (конечный предел функции в точке слева
Гейне). Применительно к случаю конечного пре- по Гейне). Число A называется пределом слева
дела функции в точке наше определение можно функции f в точке a, если
сформулировать следующим образом.
Число A называется пределом функции f в 1) функция f определена на некотором интер-
точке a ∈ R, если вале вида (a − δ; a), и
1) функция f определена на некотором множе- 2) для всякой последовательности аргументов
стве вида (a − δ; a) ∪ (a; a + δ), и {xn }, стремящейся слева к точке a
2) для всякой последовательности аргументов xn −→ a xn ∈ (a − δ; a)
n→∞
{xn }, стремящейся к точке a, но не попада-
ющей в a соответствующая последовательность значе-
ний функции {f (xn )} стремится к числу A:
xn −→ a xn ∈ (a − δ; a) ∪ (a; a + δ)
n→∞
f (xn ) −→ A
соответствующая последовательность значе- n→∞
ний функции {f (xn )} стремится к числу A: y
f (xn ) −→ A
n→∞

y
A
f (a)

A 0 a x

В этом случае пишут


0 a x
f (x) −→ A
x→a−0
В этом случае пишут
или
f (x) −→ A lim f (x) = A
x→a x→a−0
§ 4. Предел функции 313

⋄ 4.4.3 (бесконечный предел функции в точке В этом случае пишут


по Гейне). Говорят, что функция f стремится
к ∞) в точке a, если f (x) −→ A
x→+∞
1) функция f определена на некотором множе-
или
стве вида (a − δ; a) ∪ (a; a + δ), и
lim f (x) = A
2) для всякой последовательности аргументов x→+∞
{xn }, стремящейся к точке a, но не попада-
⊲ 4.4.5. Сформулируйте определения предела
ющей в a
функции для остальных ситуаций, описанных в
xn −→ a xn ∈ (a − δ; a) ∪ (a; a + δ) двух таблицах этого параграфа, и приведите гра-
n→∞
фические иллюстрации.
соответствующая последовательность значе-
ний функции {f (xn )} стремится к ∞: ⊲ 4.4.6. Нарисуйте график какой-нибудь функ-
ции f : R → R, удовлетворяющей следующим
f (xn ) −→ ∞ условиям (всем сразу):
n→∞

y 1) limx→−∞ f (x) = −2;


2) limx→−1 f (x) = 0;
3) limx→1−0 f (x) = −∞;
4) limx→1+0 f (x) = 2;
5) limx→+∞ f (x) = +∞;

0 a x Нахождение предела функции по опреде-


лению.

⋄ 4.4.7. Покажем что


1
lim =∞
x→0 x
В этом случае пишут Действительно, если взять последовательность
f (x) −→ +∞ (или −∞, или ∞) аргументов {xn }, стремящуюся к нулю, но не по-
x→a падающую в ноль
или
xn −→ 0 xn 6= 0
lim f (x) = +∞ (или −∞, или ∞) n→∞
x→a
то мы получим
⋄ 4.4.4 (конечный предел функции в бесконеч-
ности по Гейне). Число A называется пределом 1
f (xn ) = −→ ∞
функции f при x → +∞, если xn n→∞
1) функция f определена на некотором интер- Это верно для всякой последовательности
вале вида (E; +∞), и xn −→ 0 xn 6= 0, поэтому limx→0 x1 = ∞.
n→∞
2) для всякой последовательности аргументов
{xn } ⊂ (β; +∞), стремящейся к +∞ ⋄ 4.4.8. Покажем что
xn −→ +∞ x+2 1
n→∞ lim =
x→∞ 2x − 1 2
соответствующая последовательность значе-
ний функции {f (xn )} стремится к числу A: Действительно, если взять последовательность
аргументов {xn }, стремящуюся к бесконечности
f (xn ) −→ A
n→∞
xn −→ ∞
y n→∞

то мы получим
2
xn + 2 1+ xn 1
A f (xn ) = = −→
1 n→∞
2xn − 1 2− xn
2

Это верно для всякой последовательности


0 x x+2
xn −→ ∞, поэтому limx→0 2x−1 = 12 .
n→∞
314 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
 
⋄ 4.4.9. Покажем что |xn | = −xn , x2n + 1
= потому что = lim =
почти все xn < 0 n→∞ −xn (xn + 1)
1 1 | {z }
lim = −∞ lim = +∞ ↑
x→0−0 x x→0+0 x
делим числитель
и знаменатель на x2n
Действительно, если взять последовательность
аргументов {xn }, стремящуюся к 0 слева, 1+ 1   1+0
x2n применяем
= lim = теорему 4.2.34 = = −1
n→∞ −1 − x1n −1 − 0
xn −→ 0 xn < 0
n→∞
Это верно для всякой последовательности
то мы получим x2 +1
xn −→ −∞, поэтому limx→−∞ |x|(x+1) = 1.
n→∞
1
lim = (применяем теорему 4.2.34) = −∞ ⋄ 4.4.11. Покажем что
n→∞ xn

Это верно для всякой последовательности 1


lim =0
1 x→+∞ x3
xn −→ 0 xn < 0, поэтому limx→0−0 x = −∞.
n→∞
Аналогично, если Действительно, если взять последовательность
аргументов {xn }, стремящуюся к ∞,
xn −→ 0 xn > 0
n→∞
xn −→ ∞
то мы получим n→∞

то мы получим
1
lim = (применяем теорему 4.2.34) = +∞  3  
n→∞ xn 1 применяем
lim f (xn ) = lim = теорему 4.2.34 = 0
n→∞ xn
Это верно для всякой последовательности n→∞
1
xn −→ 0 xn > 0, поэтому limx→0+0 = +∞.
n→∞ x Это верно для всякой последовательности
xn −→ ∞, поэтому limx→∞ x13 = 0.
⋄ 4.4.10. Покажем что n→∞

x2 + 1 x2 + 1 ⋄ 4.4.12. Покажем что


lim =1 lim = −1
x→+∞ |x|(x + 1) x→−∞ |x|(x + 1)
lim |x|x = +∞ lim |x|x = −∞
x→+∞ x→−∞
Действительно, если взять последовательность
аргументов {xn }, стремящуюся к +∞, Действительно, если взять последовательность
аргументов {xn }, стремящуюся к +∞,
xn −→ +∞
n→∞
xn −→ +∞
n→∞
то мы получим
то мы получим
2
xn + 1
lim f (xn ) = lim =
n→∞ n→∞ |xn |(xn + 1) lim f (xn ) = lim |xn |xn =
  2
n→∞

n→∞

|xn | = xn , xn + 1 |xn | = xn ,
= потому что = lim = = потому что = lim x2n = +∞
почти все xn > 0 n→∞ xn (xn + 1) n→∞
| {z } почти все x n > 0

делим числитель Это верно для всякой последовательности
и знаменатель на x2n xn −→ +∞, поэтому limx→+∞ |x|x = +∞.
n→∞
1+ 1   1+0 Возьмем теперь последовательность аргумен-
x2n применяем
= lim 1 = теорему 4.2.34 = =1 тов {xn }, стремящуюся к −∞,
n→∞ 1+ xn
1+0

Это верно для всякой последовательности xn −→ −∞


n→∞
x2 +1
xn −→ +∞, поэтому limx→+∞ |x|(x+1) = 1.
n→∞ Тогда
Аналогично, если

xn −→ −∞ lim f (xn ) = lim |xn |xn =


n→∞ n→∞
n→∞  
|xn | = −xn , потому что
то мы получим = почти все xn < 0 = − lim x2n = −∞
n→∞

x2n + 1 Это верно для всякой последовательности


lim f (xn ) = lim = xn −→ −∞, поэтому limx→−∞ |x|x = −∞.
n→∞ n→∞ |xn |(xn + 1) n→∞
§ 4. Предел функции 315

Связь между нулевым и бесконечным пределом.


Теорема 4.4.13 (о связи между нулевым и бесконечным пределами). Пусть f (x) 6= 0 в некоторой
выколотой окретности точки a. Тогда предел функции f при x → a равен нулю в том и только
в том случае, если предел обратной функции f1 при x → a равен бесконечности:

1
lim f (x) = 0 ⇐⇒ lim = ∞. (4.4.141)
x→a x→a f (x)

Доказательство. Это следует из теоремы 4.2.34 о связи между бесконечно большими и бесконеч-
но малыми последовательностями: если xn → a, то соотношение yn = f (xn ) → 0 эквивалентно
соотношению y1n = f (x1n ) → ∞.

⋄ 4.4.14. 1
(xn )k = −→ ∞
( (yn )k n→∞
0, если k > 0 Поскольку это верно для любой последователь-
lim xk = (4.4.142)
x→0 ∞, если k < 0 ности xn → ∞, мы получаем, что

xk −→ ∞ (k > 0)
Доказательство. 1. Пусть k > 0. Тогда x→∞

xn −→ 0 2. Пусть k < 0. Тогда m = −k > 0, поэтому:


n→∞
xm −→ ∞ (уже доказано)
⇓ (свойство 30 на с.264) x→∞

(xn )k −→ 0 ⇓ (4.4.141)
n→∞
1
Поскольку это верно для любой последователь- xk = m −→ 0
ности xn → 0, мы получаем, что x x→∞

xk −→ 0 (k > 0)
x→0 ⋄ 4.4.16. Для любого n ∈ N∗
2. Пусть k < 0. Тогда m = −k > 0, поэтому: lim x2n = +∞ (4.4.144)
x→−∞
m
x −→ 0 (уже доказано)
lim x2n = +∞ (4.4.145)
x→0 x→+∞

⇓ (4.4.141) ⋄ 4.4.17. Для любого n ∈ N∗


1
xk = m −→ ∞ lim x−2n = +∞ (4.4.146)
x x→0 x→0
lim x−2n = 0 (4.4.147)
x→∞
⋄ 4.4.15.
⋄ 4.4.18. Для любого n ∈ N∗
(
∞, если k > 0 lim x2n−1 = −∞ (4.4.148)
lim xk = (4.4.143) x→−∞
x→∞ 0, если k < 0
lim x2n−1 = +∞ (4.4.149)
x→+∞
Доказательство. 1. Пусть k > 0 и
⋄ 4.4.19. Для любого n ∈ N∗
xn −→ ∞
n→∞ lim x−(2n−1) = −∞ (4.4.150)
x→−0
1
Обозначим yn = xn . Тогда lim x−(2n−1) = +∞ (4.4.151)
x→+0
yn −→ 0 (теорема 4.2.34)
lim x−(2n−1) = 0 (4.4.152)
n→∞
x→∞

⇓ (свойство 30 на с.264) ⊲⊲ 4.4.20. Покажите что


k
(yn ) −→ 0 1) limx→+∞ |x|
=1
n→∞ x

⇓ (теорема 4.2.34) 2) limx→−∞ |x|


x = −1
316 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Связь между односторонними и двусторонними пределами.


Теорема 4.4.21. Величина A будет пределом функции f в точке a
A = lim f (x)
x→a

тогда и только тогда, когда A является пределом слева и пределом справа функции f в точке a:
lim f (x) = A = lim f (x)
x→a−0 x→a+0

Доказательство. 1. Если A = limx→a f (x), то для любой последовательности xn −→ a, xn 6= a


n→∞
должно выполняться f (xn ) −→ A. В частности, если xn −→ a, xn < a то f (xn ) −→ A, и поэтому
n→∞ n→∞ n→∞
A = limx→a−0 f (x). Аналогично получается A = limx→a+0 f (x).
2. Наоборот, если limx→a−0 f (x) = A = limx→a+0 f (x), то это означает, что
∀xn −→ a, xn < a ⇒ f (xn ) −→ A
n→∞ n→∞
и
∀xn −→ a, xn > a ⇒ f (xn ) −→ A
n→∞ n→∞
Поэтому если взять последовательность xn −→ a, xn 6= a то, разложив ее на две подпоследова-
n→∞
тельности    
xnk −→ a, xnk < a , xmk −→ a, xmk > a
k→∞ k→∞
мы получим
f (xnk ) −→ A, f (xmk ) −→ A
k→∞ k→∞
Это означает, что
f (xn ) −→ A,
n→∞
Поскольку это верно для любой последовательности xn −→ a, xn 6= a, мы получаем A = limx→a f (x).
n→∞

Теорема 4.4.22. Величина A будет пределом функции f на бесконечности


A = lim f (x)
x→∞

тогда и только тогда, когда A является пределом функции f при x стремящимся к −∞ и к +∞:
lim f (x) = A = lim f (x)
x→−∞ x→+∞

Доказательство. 1. Если A = limx→∞ f (x), то для любой последовательности xn −→ ∞ долж-


n→∞
но выполняться f (xn ) −→ A. В частности, если xn −→ −∞ то f (xn ) −→ A, и поэтому A =
n→∞ n→∞ n→∞
limx→−∞ f (x). Аналогично получается A = limx→+∞ f (x).
2. Наоборот, если limx→−∞ f (x) = A = limx→+∞ f (x), то это означает, что
∀xn −→ −∞ ⇒ f (xn ) −→ A
n→∞ n→∞
и
∀xn −→ +∞ ⇒ f (xn ) −→ A
n→∞ n→∞
Поэтому если взять последовательность xn −→ ∞ то, разложив ее на две подпоследовательности
n→∞

xnk −→ −∞, xmk −→ +∞,


k→∞ k→∞
мы получим
f (xnk ) −→ A, f (xmk ) −→ A
k→∞ k→∞
Это означает, что
f (xn ) −→ A,
n→∞
Поскольку это верно для любой последовательности xn −→ ∞, мы получаем A = limx→∞ f (x).
n→∞
§ 4. Предел функции 317

⋄ 4.4.23. Покажем что (xn + 1)(xn − 1) 


= lim = lim xn +1 =2
n→∞ xn − 1 n→∞
|x| |x| ❆❯
lim = −1 lim =1 1
x→0−0 x x→0+0 x
Это верно для всякой последовательности
Действительно, если взять последовательность x2 −1
xn −→ 1, xn > 1, поэтому limx→1−0 |x−1| = 2.
аргументов {xn }, стремящуюся к 0 слева, n→∞

⋄ 4.4.25. Покажем что


xn −→ 0 xn < 0
n→∞
x2 + x3
то мы получим lim =0
x→0 |x|
  Возьмем сначала последовательность аргумен-
|xn | |xn | = −xn , −xn
lim = поскольку = lim = тов {xn }, стремящуюся к 0 слева,
n→∞ xn xn < 0 n→∞ xn

= lim (−1) = −1 xn −→ 0 xn < 0


n→∞ n→∞

Это верно для всякой последовательности тогда


xn −→ 0 xn < 0, поэтому limx→0−0 |x|
x = −1.  
n→∞ x2n + x3n |xn | = −xn ,
Аналогично, если lim = поскольку xn < 0 =
n→∞ |x | n

xn −→ 0 xn > 0 x2n + x3n


n→∞ = lim = lim (−xn − x2n ) = 0
n→∞ −xn n→∞
то мы получим
Это верно для всякой последовательности
  2
+x3
|xn | |xn | = xn , xn xn −→ 0 xn < 0, поэтому limx→0−0 x |x| = 0.
lim = поскольку = lim = lim 1 = 1 n→∞
n→∞ xn xn > 0 n→∞ xn n→∞ Аналогично, если

Это верно для всякой последовательности xn −→ 0 xn > 0


n→∞
xn −→ 0 xn > 0, поэтому limx→0−0 |x|
x = 1.
n→∞ то мы получим
⋄ 4.4.24. Покажем что  
x2n + x3n |xn | = xn ,
lim = поскольку xn > 0 =
x2 − 1 x2 − 1 n→∞ |xn |
lim = −2 lim =2
x→1−0 |x − 1| x→1+0 |x − 1| x2 + x3n
= lim n = lim (xn + x2n ) = 0
n→∞ xn n→∞
Действительно, если взять последовательность
аргументов {xn }, стремящуюся к 1 слева, Это верно для всякой последовательности
2
+x3
xn −→ 0 xn > 0, поэтому limx→0+0 x |x| = 0.
xn −→ 1 xn < 1 n→∞
2
+x3
n→∞ Мы получаем, что для функции f (x) = x |x|
то мы получим левый и правый предел в точке 0 совпадают, по-
этому
x2n − 1 (xn + 1)(xn − 1)
lim = lim = x2 + x3 x2 + x3 x2 + x3
n→∞ |xn − 1| n→∞ |xn − 1| lim = lim = lim =0
  x→0 |x| x→0−0 |x| x→0+0 |x|
|xn − 1| = −(xn − 1), (xn + 1)(xn − 1)
= поскольку xn − 1 < 0 = n→∞lim = ⋄ 4.4.26. Покажем что
−(xn − 1)
= − lim ( xn + 1) = −2 1
n→∞ lim = +∞
x→0 |x|


1
Действительно, если взять последовательность
Это верно для всякой последовательности аргументов {xn }, стремящуюся к 0 слева,
x2 −1
xn −→ 1 xn < 1, поэтому limx→1−0 |x−1| = −2.
n→∞ xn −→ 0 xn < 0
Аналогично, если n→∞
то мы получим
xn −→ 1 xn > 1
n→∞
1   1
|xn | = −xn ,
то мы получим lim
n→∞ |xn |
= потому что xn < 0 = − n→∞ lim =
xn
 
применяем
x2n − 1 (xn + 1)(xn − 1) = теорему 4.2.34 = +∞
lim = lim =
n→∞ |xn − 1| n→∞ |xn − 1|
  Это верно для всякой последовательности
|xn − 1| = xn − 1,
= поскольку xn − 1 > 0 = xn −→ 0 xn < 0, поэтому limx→0−0 x1 = +∞.
n→∞
318 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Аналогично, если Это верно для всякой последовательности


xn −→ 0 xn > 0, поэтому limx→0+0 x1 = +∞.
n→∞
xn −→ 0 xn > 0 Мы получили
n→∞

то мы получим 1 1
lim = +∞ = lim
  x→0−0 |x| x→0+0 |x|
1 |xn | = xn , 1
lim = потому что xn > 0 = lim = и это означает что
n→∞ |xn | n→∞ xn
 
применяем
= теорему 1
4.2.34 = +∞ lim = +∞
x→0 |x|

Связь предела функции с монотонными последовательностыми.


Теорема 4.4.27. 18 Пусть функция f определена на некотором интервале (a, b) и C – произволь-
ное число. Тогда следующие условия эквивалентны:
(i) limx→b−0 f (x) = C;
(ii) для любой монотонной последовательности xn

x1 < x2 < ... < xn < ... < b, xn −→ b (4.4.153)


n→∞

выполняется
f (xn ) −→ C (4.4.154)
n→∞

Доказательство. Ясно, что из (i) следует (ii), потому что если limx→b−0 f (x) = C, то f (xn ) −→
n→∞
C для любой последовательности xn −→ b, xn < b (необязательно монотонной). Докажем, что
n→∞
наоборот если (i) не выполняется, то не выполняется и (ii). Пусть limx→b−0 f (x) 6= C, то есть
существует точка последовательность xn ∈ M такая что

xn ∈ (a, b) & xn −→ a & 6


f (xn )−→ C
n→∞ n→∞

План наших действий состоит в том, чтобы, переходя от xn к ее подпоследовательностям, построить


строго монотонную последовательность с теми же свойствами.
1. Прежде всего, по свойству подпоследовательностей 2◦ на с.276, второе условие означает, что
существует ε > 0 и последовательность натуральных чисел nk −→ ∞, такие что
k→∞

∀k ∈ N∗ f (xnk ) ∈
/ (C − ε; C + ε)

Обозначив yk = xnk , мы получим последовательность с такими свойствами:

yk ∈ (a, b) & yk −→ a & ∀k ∈ N∗ f (yk ) ∈


/ (C − ε; C + ε)
k→∞

2. После этого мы индуктивно определим две последовательности km и tm . Сначала полагаем

k1 = 1, t1 = y 1

Затем, если для m = 1, ..., l числа km и tm определены, мы замечаем вот что. Поскольку a < yk ,
yk −→ a и a < tl , найдется такое kl+1 , что ykl+1 лежит в интервале (a; tl ):
k→∞

ykl+1 < tl

Выбираем такое kl+1 и полагаем


tl+1 = ykl+1
Полученная последовательность tm = zm+1 обладает нужными нам свойствами. Во-первых, (как и
для xn и yk ) все числа tm лежат в интервале (a, b):

tm ∈ (a, b)
18 Эта теорема используется ниже при доказательстве правила Лопиталя для раскрытия неопределенностей типа


.
§ 4. Предел функции 319

Во-вторых, последовательность tm , как подпоследовательность в yk , должна стремиться к a:

tm = ykm −→ a.
m→∞

В-третьих, последовательность значений f на ней не заходит в интервал (C − ε; C + ε):

∀m ∈ N∗ f (tm ) = f (zkm ) ∈
/ (C − ε; C + ε)

И, в-четвертых, она строго монотонна:

tm < ykm+1 = tm+1

Заменой переменной доказывается симметричное утверждение:


Теорема 4.4.28. Пусть функция f определена на некотором интервале (a, b) и C – произвольное
число. Тогда следующие условия эквивалентны:
(i) limx→a+0 f (x) = C;
(ii) для любой монотонной последовательности xn

a < ... < xn < ... < x2 < x1 < b, xn −→ a


n→∞

выполняется
f (xn ) −→ C
n→∞

Предел монотонной функции.


Теорема 4.4.29. Пусть функция f определена на некотором интервале (a, b) и монотонна на
нем. Тогда
— если f неубывает, то

lim f (x) = inf f (x) lim f (x) = sup f (x) (4.4.155)


x→a+0 x∈(a;b) x→b−0 x∈(a;b)

— если f невозрастает, то

lim f (x) = sup f (x) lim f (x) = inf f (x) (4.4.156)


x→a+0 x∈(a;b) x→b−0 x∈(a;b)

(b) Теоремы о пределах


Связь между понятием предела и непрерывностью.
Теорема 4.4.30 (критерий непрерывности). Пусть функция f определена на некотором интер-
вале (α; β), содержащем точку x = a. Тогда следующие условия эквивалентны:
(i) функция f непрерывна в точке a;
(ii) функция f имеет конечный предел в точке a, равный f (a):

∃ lim f (x) = f (a)


x→a

Доказательство. 1. (i) =⇒ (ii). Пусть функция f непрерывна в точке a, то есть для всякой по-
следовательности аргументов {xn }, стремящейся к точке a соответствующая последовательность
значений {f (xn )} стремится к значению f (a). Тогда, в частности, для всякой последовательности

xn −→ a, xn 6= a
n→∞

выполняется
f (xn ) −→ f (a)
n→∞

По определению предела это означает, что предел функции f в точке x = a равен f (a):

lim f (x) = f (a)


x→a
320 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

2. (ii) =⇒ (i). Пусть наоборот


lim f (x) = f (a)
x→a

Это означает, что для любой последовательности аргументов {xn }, стремящейся к точке a, но не
попадающей в a, соответствующая последовательность значений {f (xn )} стремится к значению
f (a):
 
xn −→ a & ∀n xn 6= a ⇒ f (xn ) −→ f (a) (4.4.157)
n→∞ n→∞

Нам нужно проверить то же самое для последовательностей {xn }, у которых некоторые элементы
xn совпадают с a. Пусть {xn } – как раз такая последовательность, то есть xn −→ a, причем xn = a
n→∞
для некоторых n. Возможны три ситуации:
1) xn = a для конечного набора n ∈ N. В этом случае мы получаем, что xn 6= a для почти
всех n ∈ N, и поэтому предел limn→∞ f (xn ) будет таким же, как если бы xn 6= a было
верно для всех n ∈ N, и значит, в силу (4.4.157),

f (xn ) −→ f (a)
n→∞

2) xn 6= a для конечного набора n ∈ N. В этом случае мы получаем, что xn = a для почти


всех n ∈ N, и поэтому f (xn ) = f (a) для почти всех n ∈ N, и значит,

f (xn ) −→ f (a)
n→∞

3) последний вариант — если xn 6= a для бесконечного набора n ∈ N и xn = a тоже для


бесконечного набора n ∈ N, тогда последовательность {xn } можно разложить на две под-
последовательности {xnk } и {xmk }, из которых первая не попадает в a, а вторая наоборот
не выходит из a:
xnk −→ a, xnk 6= a, xmk = a.
k→∞

Для них мы получаем:

xnk −→ a, xnk 6= a, xmk = a .


|
k→∞
{z } | {z }

(4.4.157) ⇓ f (xmk ) = f (a) −→ f (a)
f (xnk ) −→ f (a) k→∞
k→∞

Вместе это означает, что


f (xn ) −→ f (a).
n→∞

Мы видим, что какой бы ни была последовательность аргументов {xn }, стремящаяся к точке a,


соответствующая последовательность значений {f (xn )} стремится к значению f (a). Это означает,
что функция f непрерывна в точке a.

Теорема 4.4.31 (о перестановочности предела с непрерывной функцией). Если существует ко-


нечный предел
lim f (x) = A
x→a

и функция g определена в некоторой окрестности точки A и непрерывна в A, то


   
∃ lim g f (x) = g lim f (x) (4.4.158)
x→a x→a

Доказательство. Если xn −→ a, xn 6= a, то, поскольку limx→a f (x) = A, получаем f (xn ) −→ A,


n→∞   n→∞
и поскольку g непрерывна в точке A, g f (xn ) −→ g(A). Поскольку это верно для произвольной
n→∞    
последовательности xn −→ a, xn 6= a, мы получаем limx→a g f (x) = g(A) = g limx→a f (x)
n→∞
§ 4. Предел функции 321

Теорема о замене переменной под знаком предела.


Теорема 4.4.32 (о замене переменной под знаком предела). Пусть
lim f (x) = b & lim g(y) = c
x→a y→b

причем
∀x 6= a f (x) 6= b
Тогда
lim g(f (x)) = c
x→a

Доказательство. Возьмем какую-нибудь последовательность


xn −→ a, xn 6= a
n→∞

Тогда мы получим
f (xn ) −→ b, f (xn ) 6= b
n→∞
Поэтому
g(f (xn )) −→ c
n→∞
Поскольку это верно для всякой последовательности xn −→ a (xn 6= a), мы получаем, что
n→∞
limx→a g(f (x)) = c.
Эта теорема бывает полезна при вычислении предела от сложной функции. Если нам нужно
найти предел
lim g(f (x))
x→a
и известно, что f (x) −→ b причем f (x) 6= b при x 6= a, то можно сделать замену переменных:
x→a

f (x) = y


lim g(f (x)) = y −→ b = lim g(y)
x→a x→a y→b
y 6= b при x 6= a

⋄ 4.4.33. Найти предел ⊲⊲ 4.4.34. Найти пределы


2 2x2 −x
2x − x 1) limx→∞
lim x2 +10 ,
x→∞ x2 + 10 1−3x
2) limx→∞ 2x+3 ,
Решение:
(x−1)3
3) limx→∞ 2x3 +3x+1 ,
2x − x x = y , y =
2 1 1
x 10x+5
lim 2 = y −→ 0 = 4) limx→∞ 0.01x 2 −6x ,
x→∞ x + 10 x→∞

x2 −5x+1
2 1 5) limx→∞ 3x+7 ,
y2 − y 2−y
= lim 1 = lim = 6) limx→∞ x3 −5x
y→0 2
y + 10 y→0 1 + 10y 2 x+1010

2−0
= (подстановка) = =2
1 + 10 · 0

Арифметические операции над пределами.


Теорема 4.4.35. Если существуют конечные пределы limx→a f (x) и limx→a g(x), то справедливы
формулы:
lim (f (x) + g(x)) = lim f (x) + lim g(x) (4.4.159)
x→a x→a x→a
lim (f (x) − g(x)) = lim f (x) − lim g(x) (4.4.160)
x→a x→a x→a
lim (C · f (x)) = C · lim f (x) (если 0 6= C 6= ∞) (4.4.161)
x→a x→a
lim f (x) · g(x) = lim f (x) · lim g(x) (4.4.162)
x→a x→a x→a
g(x) limx→a g(x)
lim = (если lim f (x) 6= 0) (4.4.163)
x→a f (x) limx→a f (x) x→a
322 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство. Эти формулы следуют из арифметических свойств последовательностей 1◦ -4◦ ,


перечисленных на с.264. Докажем например (4.4.162). Если limx→a f (x) = A и limx→a g(x) = B, то
для всякой последовательности xn −→ a, xn 6= a возникает логическая цепочка:
n→∞

xn −→ a, xn 6= a
n→∞


f (xn ) −→ A, g(xn ) −→ B
n→∞ n→∞
 
используем свойство
⇓ 30 на с.265

f (xn ) · g(xn ) −→ A · B
n→∞

Поскольку это верно для любой последовательности xn −→ a, xn 6= a, мы получаем limx→a f (x) ·


n→∞
g(x) = A · B = limx→a f (x) · limx→a g(x).

Критерий Коши существования предела функции. В следующих двух теоремах, называе-


мых критериями Коши, объясняется, что конечный предел функции f при x → a существует тогда
и только тогда, когда разность значений этой функции в соседних точках f (s) − f (t) стремится к
нулю при s, t → a.
Теорема 4.4.36 (критерий Коши существования двустороннего предела функции). Пусть функ-
ция f определена в некоторой проколотой окрестности U величины a (где a – произвольное число
или символ бесконечности ∞). Тогда следующие условия эквивалентны:
(i) существует конечный предел
lim f (x)
x→a

(ii) для любых двух последовательностей sn , tn ∈ U стремящихся к a

sn −→ a, tn −→ a,
n→∞ n→∞

разность между соответствующими значениями функции f стремится к нулю:

f (tn ) − f (sn ) −→ 0
n→∞

Теорема 4.4.37 (критерий Коши существования одностороннего предела функции). 19 Пусть


функция f определена на интервале (α; a), где a – произвольное число или символ бесконечности
∞. Тогда следующие условия эквивалентны:
(i) существует конечный предел
lim f (x)
x→a−0

(ii) для любых двух последовательностей sn , tn ∈ (α; a) стремящихся к a

sn −→ a, tn −→ a,
n→∞ n→∞

разность между соответствующими значениями функции f стремится к нулю:

f (tn ) − f (sn ) −→ 0
n→∞

Доказательство. Эти две теоремы доказываются одинаково, поэтому мы докажем лишь вторую.
1. Легко проверяется, что из условия (i) следует условие (ii). Действительно, если существует
конечный предел limx→a−0 f (x) = C, то есть для всякой последовательности xn ∈ (α; a), xn −→ a
n→∞
выполняется соотношение
f (xn ) −→ C
n→∞

то взяв произвольные последовательности sn , tn ∈ (α; a), sn −→ a, tn −→ a, мы получим


n→∞ n→∞

f (tn ) − f (sn ) −→ C − C = 0
n→∞
19 Этот результат понадобится при доказательстве критерия Коши сходимости несобственного интеграла (теорема
9.1.30).
§ 4. Предел функции 323

2. Теперь докажем, что из условия (ii) следует условие (i). Пусть выполняется (ii).
a) Покажем сначала, что тогда для любой последовательности xn ∈ (α; a), xn −→ a существует
n→∞
конечный предел
lim f (xn )
n→∞

Действительно, обозначим yn = f (xn ). Тогда если взять любые две последовательности индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞

то положив ti = xpi , si = xqi , мы получим, что, в силу условия (ii)

ypi − yqi = f (xpi ) − f (xqi ) = f (ti ) − f (si ) −→ 0


i→∞

Это означает, что последовательность yn = f (xn ) удовлетворяет критерию Коши (то есть обладает
свойством (i) теоремы 4.2.70). Значит, yn = f (xn ) имеет конечный предел.
b) Мы показали, что для любой последовательности xn ∈ (α; a), xn −→ a существует конечный
n→∞
предел limn→∞ f (xn ). Теперь из условия (ii) следует, что все такие пределы совпадают, потому что
для любых двух последовательностей sn , tn ∈ (α; a) стремящихся к a

sn −→ a, tn −→ a
n→∞ n→∞

выполняется равенство
lim (f (tn ) − f (sn )) = 0
n→∞
и следовательно,
lim f (tn ) = lim f (sn )
n→∞ n→∞

Это в свою очередь означает, что существует число C такое, что

lim f (xn ) = C
n→∞

для любой последовательности xn ∈ (α; a), xn −→ a, то есть


n→∞

lim f (x) = C
x→a−0

Мы убедились, что из условия (ii) следует условие (i). Теорема 1.1 доказана.

(c) Язык ε-δ Коши


Определение предела функции по Коши. Данное нами на с.311 определение предела функ-
ции по Гейне – не единственно возможное. В некоторых случаях бывает полезно знать еще одно,
эквивалентное определение, предложенное известным французским математиком Огюстеном Ко-
ши (1789-1857). Чтобы его сформулировать, нам, как и в случае с определением Гейне, понадобится
вспомнить несколько терминов.
Пусть, как и в § 4(a), a и A обозначают числа, или символы бесконечности, возможно с опреде-
ленным знаком
a, A ∈ R или a, A = ∞, −∞, +∞
и пусть для всякого такого a
— проколотой окрестностью величины a называется всякое множество вида
   

 (a − δ, a) ∪ (a, a + δ), где δ > 0 если a – число 

   

 

 (−∞, −E) ∪ (E, +∞), где E > 0 если a = ∞ ; 
U=  

 (−∞, −E), где E > 0 если a = −∞ ; 


   


 

 (E, +∞), где E > 0 если a = +∞ ; 

— левой полуокрестностью a называется всякий интервал вида


 
U = (a − δ, a), где δ > 0 если a – число
324 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

— правой полуокрестностью a называется всякий интервал вида


 
U = (a, a + δ), где δ > 0 если a – число

— окрестностью величины a называется


— всякий интервал вида U = (a − ε, a + ε) (где ε > 0), если a – точка;
— всякая проколотая окрестность величины a, если a – символ бесконечности.
Теперь даем само определение по Коши:
• Величина A называется пределом функции f при x стремящимся к a
 
A = lim f (x) f (x) −→ A
x→a x→a

если
1) f определена в некоторой выколотой окрестности U величины a и
2) для любой окрестности V величины A найдется выколотая окрестность W ве-
личины a такая, что
∀x ∈ W f (x) ∈ V
Отдельно определяются односторонние пределы:
• Величина A называется пределом слева (справа) функции f в точке a
 
A = lim f (x) A = lim f (x)
x→a−0 x→a+0

если
1) f определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой окрестности V величины A найдется левая (правая) полуокрестность
W точки a такая, что
∀x ∈ W f (x) ∈ V

Покажем, как эта общая схема работает в и


конкретных ситуациях. 2) для всякого числа E > 0 существует чис-
• Конечный предел функции в точке по ло δ > 0 такое что для любого x ∈ (a −
Коши. Число A называется пределом функ- δ; a) ∪ (a, a + δ) выполняется включение
ции f в точке a f (x) ∈ (−∞, −E) ∪ (E, +∞).
• Конечный предел функции слева в точ-
lim f (x) = A
x→a ке по Коши. Число A называется пределом
если слева функции f в точке a
1) функция f определена на некотором мно- lim f (x) = A
x→a−0
жестве вида (a−η, a)∪(a, a+η) (где η > 0),
и если
2) для всякого числа ε > 0 существует чис- 1) функция f определена на некотором ин-
ло δ > 0 такое что для любого x ∈ (a − тервале вида (a − η; a) (где η > 0, и
δ; a) ∪ (a, a + δ) выполняется включение 2) для всякого числа ε > 0 существует число
f (x) ∈ (A − ε; A + ε). δ > 0 такое что для любого x ∈ (a − δ; a)
• Бесконечный предел функции в точке выполняется включение f (x) ∈ (A − ε; A +
по Коши. Говорят, что функция f имеет ε).
бесконечный предел в точке a • Конечный предел функции при x → +∞
lim f (x) = ∞ по Коши. Число A называется пределом
x→a функции f при x → +∞
если
lim f (x) = A
1) функция f определена на некотором мно- x→+∞

жестве вида (a−η, a)∪(a, a+η) (где η > 0), если


§ 4. Предел функции 325

1) функция f определена на некотором ин- β > α такое что для любого x ∈ (β; +∞)
тервале вида (α; +∞), и выполняется включение f (x) ∈ (A − ε; A +
2) для всякого числа ε > 0 существует число ε).

Теорема 4.4.38 (об эквивалентности определений предела по Коши и по Гейне). 20


Для произ-
вольной функции f и любых величин A и a следующие условия эквивалентны:
(i) A является пределом функции f при x → a по Коши;
(ii) A является пределом функции f при x → a по Гейне.
(Аналогичное утверждение справедливо для односторонних пределов.)

Доказательство. Мы докажем эту теорему для конечных пределов слева, поскольку в каждом
случае доказательство отличается лишь несущественными деталями.
1. (i) ⇒ (ii). Пусть A является пределом по Коши функции f при x → a − 0, то есть для
всякого ε > 0 существует δ > 0 такое что для любого x ∈ [a − δ; a) выполняется включение f (x) ∈
(A − ε; A + ε). Покажем, что тогда A является пределом по Гейне f при x → a − 0, то есть что для
любой последовательности аргументов xn −→ a − 0 выполняется f (xn ) −→ A.
n→∞ n→∞
Возьмем произвольную такую последовательноть xn −→ a − 0. и зафиксируем какое-нибудь
n→∞
ε > 0. По предположению, для него можно выбрать δ > 0 так чтобы

∀x ∈ [a − δ; a) f (x) ∈ (A − ε; A + ε) (4.4.164)

Зафиксируем это число δ. Получаем следующую логическую цепочку:

xn −→ a − 0
n→∞


xn ∈ [a − δ; a) для почти всех n ∈ N

(применяем (4.4.164))

f (xn ) ∈ (A − ε; A + ε) для почти всех n ∈ N
Это верно для произвольного ε > 0. Значит, f (xn ) −→ A, а именно это нам и нужно было доказать.
/ / n→∞
2. (i) ⇒ (ii). Пусть наоборот, A не является пределом по Коши функции f при x → a − 0, то
есть существует такое ε > 0, что для любого δ > 0 найдется такой x ∈ [a − δ; a), для которого
выполняется f (x) ∈ / (A − ε; A + ε). Тогда, в частности, для любого числа вида δ = n1 мы получим,
что
1
∃xn ∈ [a − δ; a) = [a − ; a) такие что f (xn ) ∈
/ (A − ε; A + ε) (4.4.165)
n
Зафиксируем такие числа xn . Получается:
1
a− < xn < a
n

xn −→ a − 0
n→∞

Но, с другой стороны, в силу (4.4.165),


6
f (xn )−→ A
n→∞

Значит, A не является пределом по Гейне функции f при x → a − 0.


Мы получили, что если не выполняется (i) то автоматически не выполняется (ii).
20 Эквивалентность определений предела по Коши и по Гейне используется ниже в главе 17 при доказательстве

признаков сравнения несобственных интегралов (теоремы 5.7 и 7.5).


326 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Равномерная непрерывность функции по Коши. На с.302 мы дали определение равномерно


непрерывной функции на множестве. Это определение легко переводится на язык ε − δ Коши. В
дальнейшем при доказательстве результатов такая переформулировка нам не понадобится, но мы
полагаем, что она сама по себе будет интересна читателю.
• Функция f называется равномерно непрерывной на множестве E, если f определена на
E, и для всякого числа ε > 0 найдется такое число δ > 0, что для любых x и y из E,
расстояние между которыми меньше δ, соответствующее расстояние между значениями
функции f и f (y) будет меньше ε:

∀ε > 0 ∃δ > 0 ∀x, y ∈ E |x − y| < δ =⇒ |f (x) − f (y)| < ε (4.4.166)

Докажем равносильность этих определений. 1. Пусть выполняется (4.4.166). Возьмем произволь-


ные последовательности xn , yn ∈ E такие, что

xn − yn −→ 0
n→∞

Покажем, что тогда


f (xn ) − f (yn ) −→ 0
n→∞

Для этого возьмем ε > 0. В силу (4.4.166), должен существовать такой δ > 0, что

∀x, y ∈ E |x − y| < δ =⇒ |f (x) − f (y)| < ε

В частности,

|xn − yn | < δ =⇒ |f (xn ) − f (yn )| < ε


| {z } | {z }
выполняется для почти всех n значит, и это выполняется для почти всех n

Последнее верно при любом ε > 0, поэтому f (xn ) − f (yn ) −→ 0.


n→∞
2. Наоборот, предположим, что (4.4.166) не выполняется, то есть существует некоторое ε > 0
такое что
∀δ > 0 ∃x, y ∈ E |x − y| < δ & |f (x) − f (y)| > ε
1
В частности, это должно выполняться для чисел δ = n:

1
∀n ∈ N∗ ∃xn , yn ∈ E |xn − yn | < & |f (xn ) − f (yn )| > ε
n
1
Мы получили последовательности xn и yn такие, что 0 6 |xn − yn | < −→
n n→∞ 0, и поэтому

xn − yn −→ 0
n→∞

но при этом |f (xn ) − f (yn )| > ε, и поэтому

f (xn ) − f (yn )−→


6 0
n→∞

Значит, (4.3.122) не может выполняться.


Теорема 4.4.39 (критерий равномерной непрерывности). Функция f : E → R тогда и только
тогда равномерно непрерывная на E, когда выполняется соотношение

sup |f (x) − f (y)| −→ 0 (4.4.167)


x,y∈E: |x−y|6δ δ→0
Глава 5

СТАНДАРТНЫЕ ФУНКЦИИ

§1 Элементарные функции
Среди функций, используемых в точных науках, имеется несколько таких, которые служат глав-
ными моделями изучаемых явлений. Эти функции называются элементарными, и их свойства, а
также свойства функций, получаемых из них с помощью алгебраических операций и композиции
(такие функции мы будем называть стандартными) служат предметом изучения в разделе ана-
лиза, называемом Исчислением (что это мы объясним ниже в § 2). Список элементарных функций
выглядит так:1

обозначение:
название x область определения
7→



 x ∈ R, b ∈ 2N∗N−1

 ∗
b x 6= 0, b ∈ − 2NN∗ −1
степенная функция x Z

 x > 0, b ∈ (0, +∞) \ 2N∗ −1

 Z
x > 0, b ∈ (−∞, 0) \ ∗
2N −1


x ∈ R,
 a>0
x
показательная функция a x > 0, a=0

x ∈ Z
2N∗ −1
, a<0

логарифм loga x x > 0, a ∈ (0; 1) ∪ (1; +∞)

синус sin x x∈R

косинус cos x x∈R

π
тангенс tg x x∈
/ 2 + πZ

котангенс ctg x x∈
/ πZ

арксинус arcsin x x ∈ [−1; 1]

арккосинус arccos x x ∈ [−1; 1]

арктангенс arctg x x∈R

арккотангенс arcctg x x∈R

Как может заметить читатель, только одна из этих функций – xb – была определена нами к на-
стоящему моменту, и то только для целых значений параметра b (см. определения на с.215 и 215).

Z
1 Смысл встречающихся в этой таблице обозначений типа , N
2N∗ −1 2N∗ −1
объяснялся выше на с.232.

327
328 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Остальные функции в этом списке мы определим необычным приемом – с помощью двух так на-
зываемых избыточных аксиом.
Это вот что такое. Избыточной или зависимой аксиомой называется такая аксиома теории, про
которую впоследствии становится известно, что ее можно вывести из остальных аксиом этой теории.
Как следствие, избыточные аксиомы можно (и с точки зрения логической стройности правильнее)
оформлять не как аксиомы, а как теоремы этой теории. Однако в математике встречаются время от
времени ситуации, когда знакомство с теоремой бывает желательно задолго до того, как появляется
возможность эту теорему строго доказать. В таких случаях полезно объявить эту теорему аксиомой,
сообщив слушателям, что в действительности эта аксиома зависима.
Элементарные функции – как раз такой пример. Чисто логически ничто не мешает молчать о
них в курсе анализа до тех пор, пока не появится возможность аккуратно их определить и дока-
зать их характеристические свойства. Однако тогда возможность решать задачи с элементарными
функциями, отличными от рациональных, появится у преподавателя и у студентов только в кон-
це второго семестра. Поскольку выбрасывание из упражнений всех иррациональных элементарных
функций эквивалентно просто отказу от Исчисления в классическом его понимании, разумно по-
ступить по-другому. В этой главе мы сформулируем две избыточные аксиомы – Аксиому степеней
(аксиома B1 на с.328) и Аксиому тригонометрии (аксиома B2 на с.341). Доказательство их зависи-
мости (избыточности) мы сможем привести очень нескоро – лишь в § 3 главы 11. Отчасти поэтому,
но, в первую очередь в соответствии с общим принципом, согласно которому все, что связано с
Исчислением считается иллюстративным материалом, мы переносим эти утверждения вместе с их
следствиями, в двухколоночный текст.

(a) Степени с нецелым показате- — показательные законы:


лем и логарифмы a0 = 1, (5.1.1)
Аксиома степеней. На страницах 215 и 215 1
a−x = , (5.1.2)
мы уже определили степень числа с целым пока- ax
зателем: ax+y = ax · ay ; (5.1.3)
an (n ∈ Z)
— степенные законы:
Для нецелых показателей это понятие вводится
с помощью следующей избыточной аксиомы: 1b = 1, (5.1.4)
 b
1 1
B1. Аксиома степеней.2 Существует един- = b, (5.1.5)
ственное отображение x x
(x · y)b = xb · y b (5.1.6)
b
(a, b) 7→ a ,
P2 : тождество, называемое накопитель-
со следующими свойствами: ным законом,
P0 : оно определено в следующих трех ситуа- (ax )y = ax·y (5.1.7)
циях:
выполняется для следующих значений пе-
— при a > 0 и произвольном b ∈ R, ременных:
— при a = 0 и b > 0,
Z
— при a > 0 и x, y ∈ R,
— при a < 0 и b ∈ 2N∗ −1 , — при a = 0 и x > 0, y > 0,
или, что то же самое, в следующих че- — при a < 0 и x, y ∈ 2N∗Z−1 ,
тырех:
P3 : для нулевого основания степень, в слу-
— при b ∈ 2N∗N−1 и тогда a ∈ R может чаях, когда она определена, описывается
быть произвольным, формулой

— при b ∈ − 2NN∗ −1 и тогда a 6= 0, (
1, b = 0
— при b ∈ (0, +∞) \ 2N∗Z−1 , и тогда a > 0, b
0 = (5.1.8)
0, b > 0
— при b ∈ (−∞, 0) \ 2N∗Z−1 , и тогда a > 0,
а для положительных выполняется сле-
P1 : следующие две группы тождеств вы- дующее условие сохранения знака:
полняются всякий раз, когда обе части
тождества определены: a>0 ⇒ ab > 0 (b ∈ R) (5.1.9)
2 Избыточность Аксиомы степеней доказывается в § 3(a) главы 11.
§ 1. Элементарные функции 329

P4 : для положительных оснований выполня- ! 5.1.4. Формула (5.1.8) для b > 0 вытекает из
ются следующие условия монотонно- остальных утверждений аксиомы: если b > 0, то
сти:
— если b > 0, то возведение в степень b 0·0=0
не меняет знак неравенства:

0<x<y =⇒ xb < y b (5.1.10)

— если b < 0, то возведение в степень b 0b · 0b = (5.1.6) = (0 · 0)b = 0b


меняет знак неравенства:

0<x<y =⇒ xb > y b (5.1.11)

— если a > 1, то потенцирование с осно- 0b · 0b − 0b = 0


ванием a не меняет знак неравенства:

x<y =⇒ ax < ay (5.1.12)
 
— если 0 < a < 1, то потенцирование 0b = 0
с основанием a меняет знак неравен- 0b = 1
ства:
Здесь второе равенство – 0b = 1 – невозможно,
x<y =⇒ ax > ay
(5.1.13) потому, что, если бы оно было верно, мы полу-
чили бы противоречие:
! 5.1.1. Эта аксиома, между прочим, предпо-
лагает справедливым равенство, которое трудно 1
считать интуитивно очевидным, но которое мы 0 = 01 = 0b· b = (5.1.7) =
1 1
уже отмечали в (3.2.97), когда индуктивно опре- 0b ) b = 1 b = (5.1.4) = 1
= ( |{z}
деляли степень с натуральным показателем: k
1,
00 = 1 (5.1.14) по предположению

(оно следует из (5.1.8)). Значит, должно быть верно первое равенство:


0b = 0.
! 5.1.2. Для натуральных значений b тождество
(5.1.3) влечет за собой индуктивное тождество
⊲ 5.1.5. Можно заметить, что условие сохране-
(3.2.132):
ния знака (5.1.9) также следует из остальных
утверждений Аксиомы степеней B1. Нам этот
a0 = 1, an+1 = an · a,
факт в дальнейшем не понадобится, однако чита-
поэтому a в этом случае совпадает со степе- тель в качестве упражнения может доказать его
n

нью числа a, определенной на странице 207. Как самостоятельно. В качестве подсказки мы сооб-
следствие, выполняется тождество щим только, что здесь удобно использовать тео-
рему о степенном отображении 3.2.32 и предло-
a1 = a. (5.1.15) жение 5.1.7 на с.330.

Из него, а также напрямую из (5.1.8) следует, в Следствие 5.1.6. Справедлива импликация:


частности, равенство
 
1 a>0 & b>0 =⇒ ab > 0 (5.1.17)
0 =0 (5.1.16)

! 5.1.3. Накопительный закон (5.1.7) не обя- Доказательство. Если a = 0, то


зан выполняться в случаях, не предусмотренных
условиями Аксиомы степеней B1. Например, ра- (5.1.8)
ab = 0 b = 0
венство
1 1
(−1)2 2 = (−1)2· 2
| {z } | {z } Если же a > 0, то
k k
1
12 (−1)1
(5.1.9)
k k
−1
ab > 0
1

конечно, не будет верным. В обоих случаях получается ab > 0.


330 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Корни. — для a > 0 первое равенство в (5.1.24) выпол-


1
няется, независимо от свойств степеней 2n−1
• Корнем степени n ∈ N∗ называется функция
и 2n − 1,

n
1
x := x n (5.1.18) — для a = 0 оно выполняется, потому что
1
2n−1 > 0 и 2n − 1 > 0,
Из аксиомы степеней B1 следует, что эта
— для a < 0 оно выполняется, потому что
функция определена 1 Z Z
2n−1 ∈ 2N∗ −1 и 2n − 1 ∈ 2N∗ −1 .
– на всей прямой R для n ∈ 2N∗ − 1 (то есть
Из (5.1.24) следует тождество:
когда n нечетно),
– на полуинтервале [0; +∞) для n ∈ 2N∗ (то 1
g(f (x)) = (x 2n−1 )2n−1 = x, x∈R
есть когда n четно).
• Корень степени 2 называется квадратным По тем же причинам цепочка равенств

корнем, и его обозначение упрощается до : 1 1

√ √ (a2n−1 ) 2n−1 = a(2n−1)· 2n−1 = a1 = a


1
2
x := x = x 2 (5.1.19)
выполняется при любых значениях a ∈ R, и из
• Корень степени 3 называется кубическим кор- нее следует тождество:
нем: √ 1 1
3
x = x3 f (g(y)) = (y 2n−1 ) 2n−1 = y, y∈R
Предложение√ 5.1.7. Корень нечетной степе-
Вместе это и означает, что функции f и g обрат-
ни x 7→ 2n−1 x
ны друг другу.
— определен всюду на R, 3. В примере 4.1.25 мы показали, что степен-
— возрастает на R, ная функция
— непрерывен на R, g(y) = y 2n−1
— равен нулю в нуле: возрастает на всей прямой R (а для интервала

2n−1 (0; +∞) это утверждается в первом условии мо-
(5.1.20)
0=0
нотонности (5.1.10)). По теореме о монотонной
— имеет бесконечные пределы на бесконечно- функции 4.3.34 отсюда следует, что ее обратная
стях: функция
1

√ f (x) = x 2n−1
lim 2n−1 x = −∞ (5.1.21)
x→−∞ должна возрастать и быть непрерывной на своей

lim 2n−1 x = +∞ (5.1.22) области определения, то есть на множестве
x→+∞
 
— удовлетворяет следующему правилу, кото- inf g(y); sup g(y) =
рое может считаться его определением: y∈R y∈R
 
√ = lim g(y); lim g(y) =
y = 2n−1 x ⇐⇒ y 2n−1 = x (5.1.23) y→−∞ y→+∞

Доказательство. 1. Как мы уже отмечали, тот = (4.4.152), (4.4.151) = (−∞; +∞) = R


√ 1
факт, что функция x 7→ 2n−1
x = x 2n−1 опреде-
4. Равенство (5.1.20) следует из тождества
лена на R постулируется в Аксиоме степеней B1
(5.1.8).
на с.328, поэтому его доказывать не нужно.
2. Докажем правило (5.1.23). Оно означает, 5. Формулы (5.1.21)-(5.1.22) следуют из фор-
что функции мул (4.3.136):

1 1 1
f (x) = x 2n−1 , g(y) = y 2n−1 lim x 2n−1 = (4.4.155) = inf x 2n−1 =
x→−∞ x∈R

(определенные на всей прямой R, по условиям = (4.3.136) = inf D(x 7→ x2n−1 ) = inf R = −∞


Аксиомы степеней B1 на с. 328) должны быть
обратны друг другу. Это доказывается с помо- и
щью накопительного закона (5.1.7): заметим, что
1 1
цепочка равенств lim x 2n−1 = (4.4.155) = sup x 2n−1 =
x→+∞ x∈R
1
2n−1 1
2n−1 ·(2n−1) 1 (5.1.15) = (4.3.136) = sup D(x 7→ x2n−1 ) = sup R = +∞
(a 2n−1 ) =a =a = a (5.1.24)

выполняется при любых значениях a ∈ R:


§ 1. Элементарные функции 331

1
⋄ 5.1.8. Предложение 5.1.7 дает достаточно ин- x 2n −→ +∞
x→+∞
формации для построения графика корня нечет-
ной степени, за исключением одной детали, 3. Равенство (5.1.25) следует из тождества
а именно свойства графика иметь выпуклость (5.1.8). √
вверх или вниз на разных участках. Смысл этих 4. Проверим, что функция x 7→ 2n x =
1
слов интуитивно очевиден, однако аккуратное x 2n возрастает на [0; +∞). Для подмножества
объяснение им удобно давать после того, как бу- (0; +∞) этот факт постулируется в условии мо-
дет определена производная, поэтому мы отло- нотонности (5.1.10). Поэтому нам нужно лишь
жим разговор о выпуклости до с.398. Если же проверить, что он будет верен для случая пары
не требовать здесь объяснений относительно вы- x, y ∈ [0; +∞), x < y, в которой x = 0. Здесь
пуклости, то в остальном из предложения 5.1.7 применяется (5.1.9):
следует, что по виду графика (то есть по тому, 1
0<y =⇒ 0 < (5.1.9) < y 2n .
где у графика имеются интервалы возрастания
и убывания, интервалы, где сохраняется выпук- 5. Докажем правило (5.1.27). В прямую сто-
лость, и какие функция имеет пределы на концах рону мы получаем: если
этих интервалов) все корни нечетной степени ве- √ 1
дут себя одинаково: y = 2n x = x 2n

— график функции x 7→ 2n−1 x выглядит как то, во-первых,
график любого представителя из этого семей-  1 2n 1
ства функций, например, как график кубиче- y 2n = x 2n = (5.1.7) = x 2n ·2n = x1 = x
ского корня
√ 1
и, во-вторых, по Аксиоме степеней B1 на с.328,
3
x = x3 (x ∈ R) 1
из того, что x 2n существует, следует, что x > 0.
Поэтому
1 (5.1.17)
y = x 2n > 0
Мы доказали импликацию
Предложение
√ 5.1.9. Корень четной степени √
x 7→ 2n x y = 2n x =⇒ y 2n = x & y>0

— определен всюду на полуинтервале [0; +∞), Теперь докажем обратную импликацию:


— возрастает на [0; +∞), √
y = 2n x ⇐= y 2n = x & y > 0
— непрерывен на [0; +∞),
Пусть
— равен нулю в нуле:
y 2n = x & y>0

2n
0=0 (5.1.25) Тогда
(5.1.17)
— имеет бесконечный предел на бесконечности: x = y 2n > 0
√ и поэтому, по Аксиоме степеней B1 нас.328,
lim 2n x = +∞ (5.1.26)
x→+∞ 1 1 1
∃ x 2n = (y 2n ) 2n = (5.1.7) = y 2n· 2n = y 1 = y
— удовлетворяет следующему правилу, кото-
То есть √
рое может считаться его определением:
y = 2n x

y = 2n x ⇐⇒ y 2n = x & y > 0 6. Остается доказать непрерывность функции

(5.1.27) x 7→ 2n x. Заметим, что правило (5.1.27) можно
интерпретировать так: функции
Доказательство.
√ 1. Тот факт, что функция x 7→
1 √ 1
2n
x = x 2n определена на [0; +∞) постулирует- f (x) = 2n x = x 2n , g(y) = y 2n ,
ся в Аксиоме степеней B1 на с.328, поэтому его
доказывать не нужно. если их считать определенными на полуинтер-
2. Докажем соотношение (5.1.26). При x > 1 вале [0; +∞) (эта оговорка нужна, потому что
мы получим: функция g(y) = y 2n формально определена на
1 1 всей прямой R, что больше, чем [0; +∞)) обрат-
>
2n 2n + 1 ны друг другу. Поэтому можно воспользоваться
⇓ замечанием 4.3.36: функции f и g определены на
полуинтервале [0; +∞), взаимно обратны, при-
1 1 (5.1.22)
x 2n > (5.1.13) > x 2n+1 −→ +∞ чем функция f возрастает на нем (мы это уже
x→+∞
доказали на первом шаге), поэтому они должны
⇓ быть непрерывны.
332 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Однако утверждение, упомянутое нами в за- m


мечании 4.3.36 мы не доказали (и даже акку-
ратно не сформулировали). Поэтому для строго-  
y−x=0
сти можно поступить иначе. Сначала заметим, & y>0
y+x=0
что функции f и g, если их считать определен-
ными на интервале (0; +∞), взаимно обратны,
и строго монотонны (в силу условия монотон- m
ности (5.1.10)). Значит, по теореме 4.3.34 они
 
должны быть непрерывны на (0; +∞). Поэтому y=x
для непрерывности на [0; +∞) нам остается до- & y>0
y = −x
казать, что f непрерывна в нуле. При 0 < x < 1
▼❇
мы получим: ❇
1 1
> невозможно,
2n 2n + 1 потому что x > 0

⇓ (5.1.13)

(5.1.9) 1 1 1 (5.1.25) m
0 < x 2n < x 2n+1 −→ 0 2n+1 = 0
x→0
| {z }
1 y = x = |x|
функция x 7→ x 2n+1
непрерывна
по предложению 5.1.7 В-третьих, если x < 0, то
⇓ √
1 y= x2
x 2n −→ 0
x→0

m
⋄ 5.1.10. Предложение 5.1.9 позволяет строить
графики корней четной степени. Опять если не y2 = x & y>0
интересоваться участками выпуклости (о кото-
рых мы упоминали в примере 5.1.8), мы получа- m
ем, что по виду графика все корни четной степе-
ни ведут себя одинаково:
√ y 2 − x2 = 0 & y>0
— график функции x 7→ 2n x выглядит как гра-
фик любого представителя из этого семейства
m
функций, например, как график квадратного
корня √ 1
x = x2 (x ∈ R) (y − x)(y + x) = 0 & y>0

 
Предложение 5.1.11. Справедливо тожде- y+x=0
& y>0
ство: y−x=0

|x| = x2 (5.1.28)
m
Доказательство. Здесь нужно рассмотреть
√ три
случая: во-первых, если x = 0, то x2 = 0 = |x|  
– очевидно. Во-вторых, если x > 0, то получаем y = −x
& y>0
√ y=x
y = x2
▼❇❇
m невозможно,
потому что x < 0
2 2
y =x & y>0
m m
2 2
y −x =0 & y>0
m y = −x = |x|

(y − x)(y + x) = 0 & y>0


§ 1. Элементарные функции 333

Степенная функция. Корни, о которых мы ⋄ 5.1.13. Как и в случае с предложением 5.1.14,


говорили в предыдущем разделе, являются част- предложение 5.1.12 позволяет строить график
ными случаями функций, называемых степенны- степенной функции, теперь уже с показателем

−1
ми. b ∈ 2N
2N∗ −1 . Опять вид графика зависит от того,
больше или меньше единицы степень b (здесь она
• При каждом фиксированном значении b ∗
−1
может быть равной 1, поскольку 1 ∈ 2N 2N∗ −1 ), и,
функция
забегая вперед, мы употребляем термин выпук-
x 7→ xb
лость, рассчитывая на интуицию (или эрудицию)
называется степенной (с показателем b). По читателя:
Аксиоме степеней B1 на с. 328, эту функцию ∗
−1
— в случае b > 1, b ∈ 2N 2N∗ −1 , график функции
можно считать определенной
b
x 7→ x является выпуклым вверх на полуин-
— на множестве R, если b ∈ 2N∗N−1 ; тервале (−∞; 0] и выпуклым вниз на полуин-

— на множестве R \ {0}, если b ∈ − 2NN∗ −1 ; тервале [0; +∞), и выглядит как график лю-
— на множестве [0, +∞), если b ∈ (0, +∞) \ бого представителя из этого семейства функ-
Z ций, например, как кубическая парабола, то
2N∗ −1 .
есть как график функции:
— на множестве (0, +∞), если и b ∈ (−∞, 0)\
Z
2N∗ −1 . f (x) = x3 (x ∈ R)
2N∗ −1
Предложение 5.1.12. При b ∈ 2N∗ −1 степен-
ная функция x 7→ xb
– определена всюду на R,
– непрерывна на R, — в случае b = 1 график функции x 7→ xb =
x1 = x, понятное дело, представляет собой
– возрастает на R, прямую:
– равна нулю в нуле,
f (x) = x (x ∈ R)
0b = 0,
– имеет бесконечные пределы на бесконечно-
стях:
lim xb = −∞ (5.1.29) — если же b < 1, b ∈ 2N

−1
x→−∞ 2N∗ −1 , то график функ-

lim xb = +∞ (5.1.30) ции x 7→ xb является выпуклым вниз на по-


x→+∞ луинтервале (−∞; 0] и выпуклым вверх на по-
Доказательство. 1. Поскольку b > 0, по Аксио- луинтервале [0; +∞), и выглядит как график
ме степеней B1 на с.328, функция x 7→ xb дей- любого представителя из этого семейства, на-
ствительно определена на R. пример, как график кубического корня:
2. Если b = 2m−1 ∗ √
2n−1 , m, n ∈ N , то степенная
1
f (x) = x 3 = 3 x (x ∈ R)
функция h(x) = xb является композицией сте-
1
пенных функций g(y) = y 2m−1 и f (x) = x 2n−1 :


h(x) = g(f (x)) = y 2m−1 1 =
y=x 2n−1 2N∗
1
2m−1 2m−1 Предложение 5.1.14. При b ∈ 2N∗ −1 степен-
= (x 2n−1 ) = (5.1.7) = x 2n−1
ная функция x 7→ xb
1
3. Поскольку функция f (x) = x 2n−1 непре- – определена всюду на R,
рывна на R по предложению 5.1.7, а функция – непрерывна на R,
g(y) = y 2m−1 непрерывна на R в силу примера
– убывает на полуинтервале (−∞; 0],
4.3.11, их композиция h = g ◦ f должна быть
непрерывна по теореме 4.3.19. – возрастает на полуинтервале [0; +∞),
1
4. Функция f (x) = x 2n−1 возрастает всю- – равна нулю в нуле,
ду на R в силу предложения 5.1.7, а функция
g(y) = y 2m−1 возрастает всюду на R в силу при- 0b = 0,
мера 4.1.25. Значит, по свойству 5◦ на с.248, ком- – имеет бесконечные пределы на бесконечно-
позиция h = g ◦ f также возрастает. стях:
5. Равенство нулю в нуле опять следует из
тождества (5.1.8). lim xb = +∞ (5.1.31)
x→−∞
6. А пределы (5.1.29)-(5.1.30) следуют из
(5.1.21)-(5.1.22) и (4.4.152)-(4.4.151). lim xb = +∞ (5.1.32)
x→+∞
334 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Доказательство. Здесь с очевидными измене- что читателю будет понятно, если, забегая впе-
ниями мы применяем те же рассуждения, что и ред, сообщить ему, что при b > 1 график степен-
при доказательстве предложения 5.1.12. ной функции является выпуклым вниз на пря-
1. Поскольку b > 0, по Аксиоме степеней B1 мой R, а при 0 < b < 1 прямая разбивается на
на с.328, функция x 7→ xb действительно опреде- два полуинтервала (−∞, 0] и [0; +∞), на которых
лена на R. график является выпуклым вверх:
2m
2. Заметим, что для b = 2n−1 , m, n ∈ N∗ , сте- — в случае b > 1, b ∈ 2N2N

∗ −1 , график функции
b
пенная функция h(x) = x является композицией x 7→ xb , выглядит как график любого пред-
1
степенных функций g(y) = y 2m и f (x) = x 2n−1 : ставителя из этого семейства функций, на-
пример, как квадратичная парабола, то есть
как график функции
h(x) = g(f (x)) = y 2m 1 =
y=x 2n−1
1 2m f (x) = x2 (x ∈ R)
= (x 2n−1 )2m = (5.1.7) = x 2n−1

3. Теперь проверим непрерывность. Посколь-


ку функция g(y) = y 2m непрерывна на R в силу
1
примера 4.3.11, а функция f (x) = x 2n−1 непре- — точно так же, если b < 1, b ∈ 2N ∗

2N∗ −1 , график
рывна на R по предложению 5.1.7, их компози- функции x 7→ xb , выглядит как график любо-
ция h = g◦f должна быть непрерывна по теореме
го представителя из этого семейства, напри-
4.3.19. мер, как парабола со степенью 32 , то есть как
4. Далее разберемся с монотонностью. Функ- график функции
1
ция f (x) = x 2n−1 возрастает на полуинтерва- 2
ле (−∞; 0] в силу предложения 5.1.7, а функция f (x) = x 3 (x ∈ R)
2m
g(y) = y убывает на полуинтервале (−∞; 0] ⊇
f ((−∞; 0]) в силу примера 4.1.24. Значит, по
свойству 5◦ на с.248, композиция h = g ◦ f убы-
вает на полуинтервале (−∞; 0]. ∗
1 Предложение 5.1.16. При b ∈ − 2N2N ∗ −1 степен-
Наоборот, функция f (x) = x 2n−1 возрастает b
на [0; +∞) в силу предложения 5.1.7, а функция ная функция x 7→ x
g(y) = y 2m возрастает на [0; +∞) ⊇ f ([0; +∞)) в – определена на множестве R \ {0},
силу примера 4.1.24. Значит, по свойству 5◦ на – непрерывна на R \ {0},
с.248, композиция h = g ◦ f также возрастает на
– возрастает на интервале (−∞; 0),
[0; +∞).
5. Равенство нулю в нуле следует из тожде- – убывает на интервале (0; +∞),
ства (5.1.8). – имеет следующие пределы в граничных точ-
6. Пределы (5.1.31)-(5.1.32) следуют из ках области определения и на бесконечно-
(5.1.21)-(5.1.22) и (4.4.144)-(4.4.145). Например, сти:
первый из них:
lim xb = +∞ (5.1.33)
x → −∞ x→−0

lim xb = +∞ (5.1.34)
⇓ (5.1.31) x→+0
1 lim xb = 0 (5.1.35)
f (x) = x 2n−1 → −∞ x→∞

⇓ Доказательство. Если обозначить c = −b, то


(4.4.144), теорема 4.4.32 ∗
мы получим c ∈ 2N2N ∗ −1 , и наша функция будет
2n
g(f (x)) = x 2n−1 → +∞ композицией функции f (x) = xc , рассмотренной
в предложении 5.1.14 и функции g(y) = y −1 , рас-
смотренной в примерах 4.1.27 и 4.3.11. Все нуж-
ные нам свойства функции x 7→ xb следуют из
⋄ 5.1.15. Предложение 5.1.14 позволяет стро- этих утверждений.
ить графики степенных функций с показателями

b ∈ 2N2N
∗ −1 . Эти графики имеют уловимое взгля- ⋄ 5.1.17. Предложение 5.1.16 позволяет стро-
дом различие, в зависимости от того, больше или ить график степенной функции с показателем

меньше единицы степень b (равной 1 она быть не b ∈ − 2N2N ∗ −1 . В отличие от предыдущих случа-

может, из-за того, что 1 ∈ / 2N2N
∗ −1 ). Различие же ев, здесь вид графика (в тех деталях, которые
состоит в том, как устроены участки выпукло- нас интересуют, а именно, монотонность, выпук-
сти, которые мы еще не успели определить, и о лость и пределы в крайних токах интервалов мо-
которых речь пойдет на с.398. Поскольку интуи- нотонности и выпуклости) не зависит от значе-
тивный смысл выпуклости очевиден, мы думаем, ния b:
§ 1. Элементарные функции 335


— если b ∈ − 2N2N b
∗ −1 , то график функции x 7→ x , – имеет бесконечный предел в бесконечности:
выглядит как график любого представителя
из этого семейства функций, например, как lim xb = +∞ (5.1.40)
x→+∞
квадратичная гипербола, то есть как график
функции Доказательство. Здесь мы с небольшими изме-
нениями повторяем рассуждения, применявшие-
f (x) = x−2 (x ∈ R) ся при доказательстве предложения 5.1.9.
1. Поскольку b > 0, по Аксиоме степеней B1
на с.328 функция x 7→ xb действительно опреде-
лена на [0; +∞).
2. Докажем соотношение (5.1.40). Для этого
2N∗ −1 1
подберем n ∈ N∗ так, чтобы b > 2n−1
Предложение 5.1.18. При b ∈ − 2N ∗ −1 степен- . Тогда при
ная функция x 7→ x b x > 1 мы получим:
– определена на множестве R \ {0}, 1
xb > (5.1.13) > x 2n−1 −→ +∞
x→+∞
– непрерывна на R \ {0},
– убывает на интервале (−∞; 0), ⇓
b
– убывает на интервале (0; +∞), x −→ +∞
x→+∞
– имеет следующие пределы в граничных точ-
3. Равенство (5.1.39) следует из тождества
ках области определения и на бесконечно-
(5.1.8).
сти:
4. Проверим, что наша функция возрастает
lim xb = −∞ (5.1.36) на [0; +∞). Для подмножества (0; +∞) этот факт
x→−0 постулируется в условии монотонности (5.1.10).
lim xb = +∞ (5.1.37) Поэтому нам нужно лишь проверить, что он бу-
x→+0
дет верен для случая пары x, y ∈ [0; +∞), x < y,
lim xb = 0 (5.1.38) в которой x = 0. Здесь применяется (5.1.9):
x→∞

Доказательство. Если обозначить c = −b, то 0 < y =⇒ 0 < (5.1.9) < y b .


2N∗
мы получим c ∈ 2N∗ −1 , и наша функция будет
композицией функции f (x) = xc , рассмотренной 5. Заметим далее, что функции
−1
в предложении 5.1.12 и функции g(y) = y , рас- f (x) = xb ,
1
g(y) = y b
смотренной в примерах 4.1.27 и 4.3.11. Все нуж-
ные нам свойства функции x 7→ xb следуют из если их считать определенными на полуинтерва-
этих утверждений. ле [0; +∞) (эта оговорка нужна, потому что мо-
жет случиться, что вторую из них можно опре-
⋄ 5.1.19. Предложение 5.1.18 позволяет стро-
делить на множестве, большем, чем [0; +∞); на-
ить график степенной функции с показателем

2N −1 пример, при b = 21 ∈ (0; +∞)\ 2N∗Z−1 мы получаем
b ∈ − 2N ∗ −1 . Как и в предыдущем случае, здесь
1 Z 1
b = y 2 оказы-
вид графика не зависит от значения b: b = 2 ∈ 2N∗ −1 , и функция y 7→ y
2N∗ −1
вается определенной на всей прямой R) обратны
b
— если b ∈ − 2N ∗ −1 , то график функции x 7→ x , друг другу. Действительно, с одной стороны, для
выглядит как график любого представите- любого x ∈ [0; +∞) мы получаем
ля из этого семейства функций, например,
как кубическая гипербола, то есть как график 1
g(f (x)) = (xb ) b = (5.1.7) =
функции 1
= xb· b = x1 = (5.1.15) = x
−3
f (x) = x (x ∈ R)
А с другой – для любого y ∈ [0; +∞)
1
f (g(y)) = (y b )b = (5.1.7) =
1

Z
= y b ·b = y 1 = (5.1.15) = y
Предложение 5.1.20. При b ∈ (0; +∞) \ 2N∗ −1
степенная функция x 7→ xb 6. После этого можно воспользоваться заме-
чанием 4.3.36: функции f и g определены на по-
– определена на полуинтервале [0; +∞),
луинтервале [0; +∞), взаимно обратны, причем
– непрерывна на [0; +∞), функция f возрастает на нем (мы это уже дока-
– возрастает на [0; +∞), зали на первом шаге), поэтому они должны быть
– равна нулю в нуле, непрерывны.
Однако поскольку утверждение, упомянутое
0b = 0, (5.1.39) нами в замечании 4.3.36 мы не доказали, мы
336 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

для строгости поступим иначе. Сначала заме- композицией функции f (x) = xc , рассмотренной
тим, что функции f и g, если их считать опреде- в предложении 5.1.20 и функции g(y) = y −1 , рас-
ленными на интервале (0; +∞), взаимно обрат- смотренной в примерах 4.1.27 и 4.3.11. Все нуж-
ны, и строго монотонны (в силу условия моно- ные нам свойства функции x 7→ xb следуют из
тонности (5.1.10)). Значит, по теореме 4.3.34 они этих утверждений.
должны быть непрерывны на (0; +∞). Поэтому
для непрерывности на [0; +∞) нам остается до- ⋄ 5.1.23. Предложение 5.1.22 позволяет стро-
казать, что f непрерывна в нуле. Для этого снова ить график степенной функций с показателем
возьмем n ∈ N∗ так, чтобы 2n−1 1
< b. Тогда при b ∈ (−∞; 0) \ 2N∗Z−1 . Здесь вид графика (в тех
0 < x < 1 мы получим: деталях, которые мы здесь уже перечисляли) не
зависит от значения b:
1
0 < (5.1.9) < xb < (5.1.13) < x 2n−1 −→ 0 — при b ∈ (−∞; 0) \ 2N∗Z−1 , график функции
x→0
x 7→ xb , выглядит как график любого пред-
⇓ ставителя из этого семейства функций, на-
xb −→ 0 пример, как график функции
x→0
1
f (x) = x− 2 (x ∈ R)

⋄ 5.1.21. Предложение 5.1.20 позволяет стро-


ить график степенной функций с показателем
b ∈ (0; +∞) \ 2N∗Z−1 . Здесь как и в примере 5.1.15,
вид графика зависит от того, больше или мень-
Показательная функция. При каждом фик-
ше единицы степень b (равной 1 она опять быть
сированном значении a отображение
не может, из-за того, что 1 ∈ 2N∗Z−1 ):
— в случае b > 1, b ∈ (0; +∞) \ 2N∗Z−1 , график x 7→ ax
функции x 7→ xb , выглядит как график лю- называется показательной функцией (с основа-
бого представителя из этого семейства функ- нием a). По Аксиоме степеней B1 на с.328, эту
ций, например, как график функции функцию можно считать определенной
3
f (x) = x 2 (x > 0) — на множестве R, если a > 0;
— на множестве [0; +∞), если a = 0;
— на множестве 2N∗Z−1 , если a < 0.

Лемма 5.1.24. При любом a > 0 последова-


— точно так же, если b < 1, b ∈ (0; +∞) \ 2N∗Z−1 , тельности a n и a− n стремятся к единице:
1 1

график функции x 7→ xb , выглядит как гра- 1 1


фик любого представителя из этого семей- a n −→ 1, a− n −→ 1 (5.1.43)
n→∞ n→∞
ства, например, как график квадратного кор-
ня Доказательство. 1. Пусть сначала a > 1. Обо-
1 √
f (x) = x = x
2 (x > 0) значим
1
xn = a n − 1
и заметим, что, во-первых,

Z
a>1
Предложение 5.1.22. При b ∈ (−∞; 0) \ 2N∗ −1
степенная функция x 7→ xb ⇓ (5.1.10)
1 1
– определена на интервале (0; +∞). a n >1 n = (5.1.4) = 1
– непрерывна на (0; +∞).

– убывает на (0; +∞) 1
xn = a − 1 > 0
n
– имеет следующие пределы на концах этого
интервала: И, во-вторых, в силу неравенства Бернулли
(3.2.103),
lim xb = +∞ (5.1.41)
x→+0
b
a = (1 + xn )n > (3.2.103) > 1 + n · xn
lim x = 0 (5.1.42)
x→+∞

Доказательство. Если обозначить c = −b, то a−1

мы получим c ∈ 2N2N
∗ −1 , и наша функция будет
> xn
n
§ 1. Элементарные функции 337

Записав эти два неравенства вместе, мы получим Из (5.1.45) следует, что для данного N можно
оценку для xn , из которой получается первый из подобрать номер K такой, что
двух пределов (5.1.43):
1
∀k > K |xk | <
a−1 N
0 < xn 6
n Поэтому:

1 1
1
a − 1 = xn −→ 0
n
∀k > K − < xk <
n→∞
N N
⇓ ⇓ (5.1.12)
1 1
1 −N
a n −→ 1 ∀k > K 1−ε<a < ax k < a N < 1 + ε
n→∞

После этого второй предел получается примене- ⇓


нием тождества (5.1.2) и свойства пределов со- ∀k > K axk ∈ (1 − ε, 1 + ε)
хранять дробь:
Мы получили, что какой ни возьми ε > 0 почти
1 1 1 все элементы последовательности axk лежат в ε-
40 , с.264
−n
a = (5.1.2) = 1 −→ =1 окрестности точки 1. Это и означает, что спра-
a n n→∞ 1 ведливо (5.1.46).
2. Если a = 1, то пределы (5.1.43) становятся 3. Пусть 0 < a < 1. Тогда из (5.1.43) следует,
тривиальными следствиями тождества (5.1.4): что для любого ε > 0 найдется номер N такой,
1 1
что
1 1
a n = 1 n = (5.1.4) = 1 −→ 1
n→∞
1 − ε < a N < a− N < 1 + ε
1 1 Опять из (5.1.45) получаем, что для данного N
a− n = 1− n = (5.1.4) = 1 −→ 1 можно подобрать номер K такой, что
n→∞

3. Если 0 < a < 1, то положив A = a1 , мы по- 1


лучим A > 1, и поэтому, как мы уже доказали, ∀k > K |xk | <
N
A n −→ 1
1 и поэтому
n→∞
1 1
Как следствие, ∀k > K − < xk <
N N
  n1 ⇓ (5.1.13)
1 1 1 1
a n = = (5.1.5) = 1 −→ =1 1 1
A An n→∞ 1 ∀k > K 1−ε<a N < ax k < a− N < 1 + ε
а отсюда уже ⇓
1 1 1 ∀k > K axk ∈ (1 − ε, 1 + ε)
a− n = (5.1.2) = 1 −→ =1
a n n→∞ 1
То есть какой ни возьми ε > 0, почти все
элементы последовательности axk лежат в ε-
окрестности точки 1. Опять это означает, что
Лемма 5.1.25. При любом a > 0 справедливо справедливо (5.1.46).
соотношение:
ax −→ 1 (5.1.44) Предложение 5.1.26. При любом a > 0 функ-
x→0
ция x 7→ ax непрерывна.
Доказательство. Нам нужно показать, что для
произвольной бесконечно малой последователь- Доказательство. Если xk k→∞ −→ x, то xk − x −→
k→∞
ности 0 и поэтому
xk −→ 0 (5.1.45)
k→∞ axk − ax = axk −x · ax − ax = (a xk −x x
| {z } −1) · a k→∞
−→ 0
выполняется ↓
axk −→ 1 (5.1.46) 1,
k→∞ в силу (5.1.44)
Рассмотрим несколько случаев.
1. Если a = 1, то (5.1.46) выполняется триви-
ально, потому что в этом случае axk = 1. Предложение 5.1.27. Справедливы следующие
2. Пусть a > 1. Из соотношений (5.1.43) сле- соотношения:
дует, что для любого ε > 0 найдется номер N
такой, что — если a > 1, то
1
1 − ε < a− N < a N < 1 + ε
1
lim ax = 0, lim ax = +∞ (5.1.47)
x→−∞ x→+∞
338 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

— если 0 < a < 1, то 1. Пусть a > 1. Тогда рассмотрев целую часть


[x] числа x (мы ее определили выше формулой
lim ax = +∞, lim ax = 0 (5.1.48) (3.2.149)), мы получим:
x→−∞ x→+∞

[x] 6 x (3.2.151)
Доказательство. 1. Пусть a > 1. Тогда в силу
(4.2.47), ⇓ (5.1.12)

an −→ +∞, 0 < a [x]


6a x
n→∞ (3.2.142)
поэтому для любого E > 0 найдется N ∈ N∗ та- ⇓
кое, что 0 < ax
aN > E
2. Наоборот, если 0 < a < 1, то
Для любого x > N мы теперь получаем:
x < [x] + 1 (3.2.151)
ax > (5.1.12) > aN > E ⇓ (5.1.13)
x [x]+1
Мы получили, что для любого E > 0 найдется N a >a > 0
(3.2.142)
такое, что при x > N выполняется неравенство
ax > E. Это означает, что справедливо второе ⇓
соотношение в (5.1.47): ax > 0

lim ax = +∞
x→+∞
⋄ 5.1.29. Предложений 5.1.26, 5.1.27 и 5.1.28
После того, как оно доказано, первое выводится достаточно, чтобы построить график функции
как его следствие: x 7→ ax в тех случаях, когда это возможно, то
  есть когда a > 0:
x y = −x −y
lim a = = lim a = – если a > 1, график выглядит так:
x→−∞ y → +∞ y→+∞
1
= lim y
= (4.4.141) = 0
y→+∞ a

❘ +∞
❅ – если a = 1, график становится прямой:
1
2. Пусть 0 < a < 1. Тогда, положив A = a,
мы получим A > 1, поэтому
  – если 0 < a < 1, график выглядит так:
y = −x
lim ax =  y → +∞  =
x→−∞
ax = A−x = Ay
= lim Ay = (5.1.47) = +∞
y→+∞
– если a = 0, график выглядит так:
и
 
y = −x
lim a =  y → −∞  =
x
x→+∞ ⋄ 5.1.30. Отдельно нужно сказать, что при a <
ax = A−x = Ay
0, график изобразить невозможно, оттого, что он
= lim Ay = (5.1.47) = 0 становится разрывным в каждой точке. Можно
y→−∞
пытаться рисовать отдельные точки на нем, на-
пример

Предложение 5.1.28. При любых a > 0 и x ∈


R справедливо неравенство

ax > 0 (5.1.49) Увеличивая число точек, мы будем добиваться


усложнения картинки
Доказательство. Если a = 1, то это неравенство
будет очевидно, в силу первого степенного зако-
на (5.1.4): 1x = 1. Поэтому важно рассмотреть
случаи a > 1 и 0 < a < 1. но, в отличие от предыдущих случаев, здесь
§ 1. Элементарные функции 339

не получится, чтобы все точки принадлежали причем x 7→ ax – непрерывная функция в силу


какой-то одной непрерывной линии. предложения 5.1.26. Значит, по теореме Коши о
Частным случаем будет график функции среднем значении 4.3.22, найдется точка c ∈ R
такая, что
f (x) = (−1)x
ac = C
В зависимости от степени подробности он может Мы получили, что какое ни возьми C ∈ (0; +∞),
изображаться так для него найдется точка c ∈ R, в которой функ-
ция x 7→ ax принимает значение C. Это и означа-
ет сюръективность x 7→ ax как отображения из
R в (0; +∞).
или так 4. Инъективность и сюръективность вме-
сте означают биективность x 7→ ax : R →
(0; +∞).

или так Предложение 5.1.31. Функция loga , опреде-


ленная правилом (5.1.50), непрерывна.

Доказательство. Это следует из теоремы 4.3.34:


функция x 7→ ax непрерывна и строго монотонна
Логарифм.
на интервале R = (−∞, +∞), значит обратная ей
• Для всякого числа a, удовлетворяющего функция y 7→ loga y тоже непрерывна.
двойному неравенству
Предложение 5.1.32. Функция loga , опреде-
0 < a 6= 1,
ленная правилом (5.1.50),
правило — возрастает при a > 1:
y = loga x ⇐⇒ ay = x (5.1.50)
0<x<y =⇒ loga x < loga y (5.1.54)
определяет функцию
— убывает при 0 < a < 1:
x 7→ loga x (x > 0)
0 < x < y =⇒ loga x > loga y (5.1.55)
называемую логарифмом по основанию a. По-
нятно, что функции x 7→ ax и loga связаны Доказательство. Пусть a > 1 и x < y. Если бы
тождествами оказалось, что loga x > loga y, то, в силу возрас-
тания x 7→ ax , мы получили бы
aloga x = x (x > 0) (5.1.51)
loga (ax ) = x (x ∈ R) (5.1.52) ln x > ln y

Второе из них влечет за собой тождество



loga a = 1 (0 < a 6= 1) (5.1.53) loga x loga y
|a {z } > a
| {z }
Доказательство. Мы докажем это утверждение x y
для случая a > 1 (случай 0 < a < 1 рассматри-
вается аналогично). ⇓
1. Неравенство (5.1.49) означает, что отоб-
x>y
ражение x 7→ ax действительно переводит R в
(0; +∞). Случай 0 < a < 1 рассматривается аналогич-
2. Далее из условия возрастания (5.1.12) сле- но.
дует, что отображение x 7→ ax инъективно.
3. Покажем, что x 7→ ax сюръективно отобра-
Предложение 5.1.33. Функция loga , опреде-
жает R на (0; +∞). Пусть C ∈ (0; +∞). Посколь-
ленная правилом (5.1.50), удовлетворяет тож-
ку limx→−∞ ax = 0 (первое равенство в (5.1.47)),
дествам
найдется x ∈ R такое, что ax < C. С другой
стороны, limx→+∞ ax = +∞ (второе равенство loga 1 = 0, (5.1.56)
в (5.1.47)), поэтому найдется y ∈ R такое, что
ay > C. Мы получаем, что 1
loga = − loga x (5.1.57)
x
ax < C < ay loga (x · y) = loga x + loga y, (5.1.58)
340 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Доказательство. Первое равенство следует Формулы, связывающие показательные


непосредственно из определения (5.1.50): функции и логарифмы с разными основа-
ниями.
a0 = (5.1.1) = 1 ⇐⇒ 0 = loga 1
Чтобы доказать второе, достаточно вычис- Предложение 5.1.36. Справедливы тожде-
лить значения функции x 7→ ax в обеих его ча- ства:
стях:
1 1
ax = bx·logb a
1
aloga x = = log x = (5.1.2) = a− loga x (5.1.61)
x a a
x
logb (a ) = x · logb a (5.1.62)
Поскольку x 7→ ax – инъективное отображение,
1
равенство aloga x = a− loga x означает, что аргу- logb x
loga x = (5.1.63)
1
менты должны быть равны: loga x = − loga x. logb a
Точно так же доказывается последнее равен-
ство: (в первых двух тождествах 0 < x, 0 < a,
0 < b 6= 1, а в третьем 0 < x, 0 < a 6= 1,
aloga (x·y) = x · y = aloga x · aloga y = 0 < b 6= 1)
= (5.1.3) = aloga x+loga y
Доказательство. Первое тождество доказыва-
Опять, поскольку x 7→ ax – инъективное отоб-
loga (x·y) loga x+loga y ется цепочкой:
ражение, равенство a =a воз-
можно только если аргументы равны: loga (x·y) =
loga x + loga y. bx·logb a = (5.1.7) = ( b|log ba x
{z } ) = a
x

k
Предложение 5.1.34. Справедливы следующие (5.1.51)
k
соотношения: a
— если a > 1, то
lim loga x = −∞, lim loga x = +∞ Из него следует второе:
x→+0 x→+∞
(5.1.59) (5.1.61) (5.1.52)
logb (ax ) = logb (bx·logb a ) = x · logb a
— если 0 < a < 1, то
lim loga x = +∞, lim loga x = −∞ А из второго следует третье:
x→+0 x→+∞
(5.1.60)
(5.1.62)
Доказательство. Пусть a > 0. Если E > 0, то logb a · loga x = logb (aloga x ) = logb x
для любого x ∈ (0; a−E ) получаем в силу (5.1.54):
loga x < loga a−E = −E ⇓
Это означает, что справедливо первое соотноше-
ние в (5.1.59): logb x
loga x =
logb a
lim loga x = −∞
x→+0

Наоборот, для любого x > aE получаем в силу


(5.1.54):
loga x > loga aE = E
Экспонента ex и натуральный логарифм
Это означает, что справедливо второе соотноше- ln x. Напомним, что число Непера e мы опре-
ние в (5.1.59): делили на с.287, а в теореме 4.2.83 мы показали,
lim loga x = +∞ что оно иррационально и лежит в интервале
x→+∞

2, 708 < e 6 2, 720


⋄ 5.1.35. Предложений 5.1.32, 5.1.33 и 5.1.34
достаточно, чтобы построить график функции Среди всех показательных функций x 7→ ax и
loga : всех логарифмов x 7→ loga x функции с основани-
— если a > 1, то картинка получается такой: ем e занимают особое место, потому что, с одной
стороны, формулы для вычисления их значений,
их производных и интегралов, оказываются осо-
бенно простыми, а с другой – все остальные по-
казательные функции и логарифмы выражаются
— если 0 < a < 1, то такой: через них с помощью формул (5.1.61)-(5.1.63).
§ 1. Элементарные функции 341

• Показательная функция x 7→ ex с основанием (b) Тригонометрические функции


e имеет специальное название – экспонента.
Аксиома тригонометрии. Напомним, что
А логарифм x 7→ loge x с основанием e на-
синус sin t и косинус cos t определяются в шко-
зывается натуральным логарифмом и у него
ле как ордината и абсцисса точки на единич-
есть специальное обозначение – ln:
ной окружности, получаемой поворотом край-
ней правой точки (1; 0) на угол t против часо-
ln x = loge x
вой стрелки (при этом угол обычно измеряется в
радианах, то есть в качестве угла берется длина
Из (5.1.61)-(5.1.63) следует, что любую пока-
дуги единичной окружности):
зательную функцию и любой логарифм можно
выразить через экспоненту и натуральный лога-
рифм так:

ax = ex·ln a (0 < a) (5.1.64)


ln x
loga x = (0 < a 6= 1) (5.1.65)
ln a

Графики эти функций выглядят как обычная по-


казательная функция и обычный логарифм:

Поскольку здесь не объясняется, что такое длина


дуги, такое «определение» синуса и косинуса, ко-
нечно, нельзя считать строгим. Однозначно эти
функции описываются следующей зависимой ак-
сиомой:
B2. Аксиома тригонометрии. 3 Существуют
и единственны числовые функции синус sin
и косинус cos, удовлетворяющие следующим
условиям:
T0 : функции sin и cos определены всюду на R
Перестановочность предела с возведением и являются периодическими,
в степень. У формулам арифметический дей-
T1 : справедливы следующие три тождества
ствий с пределами (4.4.159)-(4.4.163) полезно до-
(x, y ∈ R):
бавить еще одну:
sin2 x + cos2 x = 1 (5.1.67)
Теорема 5.1.37. Если существуют конеч- sin(x + y) = sin x · cos y + cos x · sin y
ные пределы limx→a f (x) и limx→a g(x), причем (5.1.68)
limx→a f (x) > 0, то
cos(x + y) = cos x · cos y − sin x · sin y
g(x) limx→a g(x) (5.1.69)
lim f (x) = lim f (x) (5.1.66)
x→a x→a
T2 : при x ∈ (0; 1) выполняется следующее
Доказательство. тройное неравенство:
0 < x cos x < sin x < x. (5.1.70)
g(x)
lim f (x)g(x) = lim 2log2 f (x) =
x→a x→a
g(x)·log2 f (x)
Число Архимеда π. Первое важное след-
= lim 2 = (Предложение 5.1.26) = ствие из аксиомы тригонометрии, состоит в том,
x→a
  что она позволяет определить число Архимеда.
limx→a g(x)·log2 f (x)
=2 = (4.4.158) = Предложение 5.1.38. Функция sin обладает
limx→a g(x)·limx→a log2 f (x)
=2 = (Предложение 5.1.31) = наименьшим периодом (а значит и наимень-
= 2limx→a g(x)·log2 (limx→a f (x)) = (5.1.62) = шим полупериодом).

= 2log2 {(limx→a f (x)) } = lim f (x)limx→a g(x) • Наименьший полупериод функции sin обозна-
limx→a g(x)

x→a чается буквой π и называется числом Архи-


меда:
3 Избыточность Аксиомы тригонометрии доказывается в § 3(b) главы 11.
342 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
n
π = min h > 0 : ∀x ∈ R = cos x · cos x − sin x · sin x =
o = cos2 x − |sin{z2 x} = 2 cos2 x − 1
sin(x + 2h) = sin x (5.1.71)
k
(5.1.67)
Как следствие, k
1 − cos2 x

sin(x + 2π) = sin x. (5.1.72) И отсюда уже следует:

! 5.1.39. Формула для вычисления π будет вы- 2 2


ведена нами только на с.681. Сейчас мы лишь {z x} −1 = 1 − 2 sin x
cos 2x = 2 |cos
k
отметим, что число π иррационально и удовле- (5.1.67)
творяет оценке k
1 − sin2 x

3, 14 < π < 3, 15

Доказательство. Рассмотрим число Предложение 5.1.41. В точках 0, π, 2π синус


и косинус принимают следующие значения:
1
C = sin
2
x 0 π 2π
Из (5.1.70)
 следует, что оно лежит в интервале sin x 0 0 0
0; 21 : cos x 1 −1 1
1 1
0 < sin = C <
2 2 Доказательство. 1. Сначала рассмотрим слу-
C
Положим ε = 2 и рассмотрим интервал (0; ε). чай x = 0. Во-первых,
Если предположить, что у функции sin нет наи-
sin 0 = sin(2 · 0) = (5.1.73) = 2 · sin 0 · cos 0
меньшего периода, то по теореме (4.1.23), най-
дется точка t ∈ (0, ε) такая, что ⇓
sin t = C sin 0 − 2 · sin 0 · cos 0 = 0

Но в то же время из t ∈ (0, ε) ⊆ (0; 1) в силу
(5.1.70) следует: sin 0 · (1 − 2 · cos 0) = 0

C ⇓
sin t < t < ε = <C
2  
sin 0 = 0
Полученное противоречие означает, что наше (5.1.75)
cos 0 = 12
предположение (что у sin нет наименьшего пе-
риода) неверно. Но с другой стороны,

cos 0 = cos(2 · 0) = (5.1.74) = 2 cos2 0 − 1 (5.1.76)


Синус и косинус. Это может быть неожидан-
ным, но все остальные свойства синуса и косину- и отсюда следует, что cos 0 не может быть ра-
са выводятся из тех, что перечислены в аксиоме вен 12 , потому что при подстановке в (5.1.76) мы
тригонометрии. Мы покажем здесь, как это де- получаем неверное равенство:
лается.  2
1 1
Предложение 5.1.40. Справедливы тожде- =2 −1
2 2
ства:
Таким образом, в совокупности (5.1.75) второе
равенство невозможно, и остается первое:
sin 2x = 2 sin x · cos x (5.1.73)
cos 2x = 2 cos2 x − 1 = 1 − 2 sin2 x (5.1.74) sin 0 = 0.

Доказательство. Во-первых, Отсюда уже получаем значение для cos 0:


0
sin 2x = sin(x + x) = (11.3.134) = z}|{
sin2 0 + cos2 0 = (5.1.67) = 1
= sin x · cos x + sin x · cos x = 2 · sin x · cos x

Во-вторых, 2
cos 0 = 1
cos 2x = cos(x + x) = (11.3.135) = ⇓
§ 1. Элементарные функции 343

  Из этого равенства теперь получаем:


cos 0 = 1
(5.1.77)
cos 0 = −1 2 2
|sin{z π} + cos π = 1
Здесь снова если попробовать подставить в 0
(5.1.76) вместо cos 0 значение −1, получится
неверное равенство: ⇓
2
−1 = 2 · (−1) − 1,
cos2 π = 1
поэтому второе равенство в совокупности
(5.1.77) неверно, и остается первое: ⇓
cos 0 = 1
 
2. После того, как значения в x = 0 вычис- cos π = 1
(5.1.78)
лены, из тождества периодичности для синуса cos π = −1
(5.1.72) сразу получается значение sin в точке
x = 2π: Предположим, что верно первое: cos π = 1. Тогда
в качестве следствия мы получим, во-первых,
sin 2π = sin(0 + 2π) = sin 0 = 0

Отсюда следует тождество sin(x + π) = (11.3.134) =


= sin x · cos
| {zπ} + cos x · sin
| {zπ} = sin x
sin x = sin(x + 2π) = sin x · cos 2π+ k k
1 0
+ cos x · sin
| {z2π} = sin x · cos 2π (предположение) (уже доказано)
0

1 То есть число π > 0 должно быть периодом


В частности, при x = 2 получаем:
функции sin. Но это невозможно, потому что
1 1 наименьшим периодом для sin является число
sin = sin · cos 2π 2π. Полученное противоречие означает, что на-
2 2
ше предположение о равенстве cos π = 1 было
Из (5.1.70) следует, что sin 12 > 0, потому на него неверным.
можно сократить: Значит, в совокупности (5.1.78) должно быть
1 = cos 2π верно второе равенство:

Таким образом, мы заполнили третий столбец в cos π = −1


таблице.
3. Только после этого можно получить значе-
ния в точке x = π. Во-первых,
(уже вычислено)

Предложение 5.1.42. Число π является полу-
0 = sin 2π = (5.1.73) = 2 sin π · cos π периодом и для функции cos:

⇓ cos(x + 2π) = cos x. (5.1.79)


 
sin π = 0
cos π = 0 Доказательство. Здесь используются уже най-
Второе из этих равенств – cos π = 0 – неверно, денные значения sin и cos в точке 2π:
потому что если это значение подставить в фор-
мулу (5.1.74) при x = π, cos(x + 2π) = (11.3.135) =
2 = cos x · cos
| {z2π} − sin x · sin
| {z2π} = cos x
| {z2π} = 2 cos π − 1
cos
1 0
k
1
(уже вычислено)

получается неверное равенство:

1 = 2 · 02 − 1 Предложение 5.1.43. Справедливы тожде-


ства:
Значит остается первое:

sin π = 0 sin(−x) = − sin x, cos(−x) = cos x (5.1.80)


344 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Доказательство. Зафиксируем точку x ∈ R и Очевидным следствием (5.1.80) будет


обозначим
A = sin(−x), B = cos(−x) Предложение 5.1.44. Справедливы тожде-
Тогда ства:

0 = (таблица на с.342) = sin 0 =


sin(x − y) = sin x · cos y − cos x · sin y (5.1.81)
= sin(x − x) = sin x · cos(−x) + cos x · sin(−x) =
| {z } | {z } cos(x − y) = cos x · cos y + sin x · sin y (5.1.82)
B A
= B · sin x + A · cos x
Из этого в свою очередь следует еще несколь-
И, аналогично, ко тождеств. Во-первых, тождества для произве-
дений:
1 = (таблица на с.342) = cos 0 =
= cos(x − x) = cos x · cos(−x) − sin x · sin(−x) =
| {z } | {z }
B A
Предложение 5.1.45. Справедливы тожде-
ства:
= B · cos x − A · sin x
Вместе эти равенства дают систему линейных 1 
уравнений для A и B: sin x · sin y = cos(x − y) − cos(x + y)
2
( (5.1.83)
B · sin x + A · cos x = 0
1 
B · cos x − A · sin x = 1 cos x · cos y = cos(x − y) + cos(x + y)
2
Ее можно по-разному решать, например, так: (5.1.84)
( 1  
B · sin x + A · cos x = 0 ← умножаем на sin x sin x · cos y = sin(x − y) + sin(x + y)
2
B · cos x − A · sin x = 1 ← умножаем на cos x (5.1.85)

(
2
B · sin x + A · cos x · sin x = 0 Доказательство. Мы докажем первое из этих
B · cos2 x − A · sin x · cos x = cos x тождеств, потому что остальные два доказыва-
ются по аналогии. Здесь нужно просто вычис-
⇓ (складываем равенства) лить выражение в скобках в правой части:
2
B · sin x + B · cos2 x = cos x
| {z }
k
B · (sin2 x + cos2 x)
cos(x − y) − cos(x + y) = (5.1.82), (11.3.135) =
k = cos x · cos y + sin x · sin y − cos x · cos y +
B | {z } | {z }
⇓ ↑ ↑
B = cos x + sin x · sin y = 2 sin x · sin y
Это нам и нужно было узнать про B. Точно так
же и с A: Поделив на 2, мы получим (5.1.83).
(
B · sin x + A · cos x = 0 ← умножаем на cos x
B · cos x − A · sin x = 1 ← умножаем на sin x
⇓ И, во-вторых, тождества для сумм:
(
2
B · sin x · cos x + A · cos x = 0
B · cos x · sin x − A · sin2 x = sin x Предложение 5.1.46. Справедливы тожде-
⇓ (вычитаем второе из первого) ства:
2
+ A · sin2 x} = − sin x
|A · cos x {z x+y x−y
k sin x + sin y = 2 · sin · cos (5.1.86)
A · (cos2 x + sin2 x) 2 2
k x+y x−y
A cos x + cos y = 2 · cos · cos (5.1.87)
2 2
⇓ x+y x−y
sin x − sin y = 2 · cos · sin (5.1.88)
A = − sin x 2 2
x+y x−y
cos x − cos y = −2 · sin · sin (5.1.89)
2 2
§ 1. Элементарные функции 345

Доказательство. Ниже нам понадобятся только – при −1 < x < 0 получаем:


два последних тождества, поэтому мы докажем
их. Два первых доказываются по аналогии. Обо- x ∈ (−1, 0)
значим
x+y x−y
α= , β= ⇓
2 2
Тогда
−x ∈ (0, 1)
α + β = x, α−β =y
Поэтому ⇓ (5.1.70)

sin x − sin y = sin(α + β) − sin(α − β) = 0 < sin(−x) < −x


| {z } |{z}
= (11.3.134), (5.1.81) = sin α · cos β + cos α · sin β− k k
− sin x |x|
− sin α · cos β + cos α · sin β = 2 cos α · sin β = k
| sin x|
x+y x−y
= 2 cos · sin
2 2

И точно так же,
| sin x| 6 |x|
cos x − cos y = cos(α + β) − cos(α − β) =
– и, наконец, если x ∈
/ (−1, +1), то 1 6 |x| и
= (11.3.135), (5.1.82) = cos α · cos β − sin α · sin β−
поэтому
− cos α · cos β − sin α · sin β = −2 sin α · sin β =
| sin x| 6 1 6 |x|.
x+y x−y
= −2 sin · sin
2 2

Предложение 5.1.48. Справедливы неравен-


Предложение 5.1.47. Справедливы следующие ства
неравенства (x ∈ R):
| sin x − sin a| 6 |x − a| (5.1.93)
| sin x| 6 1, (5.1.90)
| cos x − cos a| 6 |x − a| (5.1.94)
| cos x| 6 1, (5.1.91)
| sin x| 6 |x|. (5.1.92) Доказательство.

Доказательство. Из (5.1.67) получаем


| sin x − sin a| = (5.1.81) =
2
sin x + cos x = 12 x+a x − a

= 2 · cos · sin =
2 2

x + a x − a
= 2 · cos · sin 6
2
sin x 6 1 2 2

x − a
⇓ 6 (5.1.91), (5.1.92) 6 2 · 1 · = |x − a|
p 2
| sin x| = sin2 x 6 1
и точно так же доказывается (5.1.91).
Последнее неравенство доказывается отдель- | cos x − cos a| = (5.1.82) =
но для случаев x = 0, x ∈ (0; 1), x ∈ (−1, 0) и
x+a x − a
x∈/ (−1, 1): = −2 · sin · sin =
2 2
– при x = 0 получаем
x + a x − a
= 2 · sin · sin 6
2 2
| sin 0| = 0 6 |0|
x − a
6 (5.1.90), (5.1.92) 6 2 · 1 · = |x − a|
– при 0 < x < 1: 2

0 6 sin x < x = |x|

⇓ (5.1.70)
Предложение 5.1.49. Функции sin и cos непре-
| sin x| 6 |x| рывны на R.
346 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Доказательство. Для любого числа a ∈ R и лю- Доказательство. Из-за тождества нечетности


бой последовательности xn −→ a получаем: (5.1.80) здесь достаточно доказать первое утвер-
n→∞
ждение. Предположим, что оно неверно, то есть
xn −→ a что для некоторого x ∈ (0, π) выполняется
n→∞
⇓ теорема 4.2.35
 sin x 6 0. Рассмотрим отдельно два случая: когда
sin x = 0, и когда sin x < 0.
xn − a −→ 0
n→∞ 1) Если sin x = 0, то по лемме 5.1.50 число x
 
вспоминаем должно быть полупериодом для функций sin и
 определение 
⇓ бесконечно малой cos. Это невозможно, потому что x < π, то есть
пос-ти на с.260 x меньше наименьшего полупериода π.
|xn − a| −→ 0 2) Если же sin x < 0, то выберем какое-нибудь
n→∞
  число ε > 0 так, чтобы выполнялись два условия:
применяем
⇓ неравенство (5.1.93) ε < 1, ε<x
0 6 | sin xn − sin a| 6 |xn − a| −→ 0
n→∞ Из первого неравенства, в силу (5.1.70), мы по-
 
⇓ теорема о двух лучим:
милиционерах 4.2.54
sin ε > 0
| sin xn − sin a| −→ 0
n→∞ То есть на отрезке [ε, x] функция sin меняет знак:
 
определение
⇓ бесконечно малой sin ε > 0 > sin x
пос-ти на с. 260
Значит, по теореме Коши о промежуточном зна-
sin xn − sin a −→ 0
n→∞ чении 4.3.22, в некоторой точке h ∈ (ε, x) она

⇓ теорема 4.2.35 обращается в нуль:
sin xn −→ sin a sin h = 0
n→∞

Мы получили, что если xn −→ a, то sin xn −→ Но тогда снова по лемме 5.1.50 получается, что
n→∞ n→∞ число h должно быть полупериодом для функ-
sin a. Это означает, что функция f (x) = sin x ции sin, что невозможно, потому что h < x <
непрерывна в точке a ∈ R. Поскольку a – про- π, то есть h меньше наименьшего полупериода
извольная точка на R, функция sin непрерывна π.
всюду на R.
Для функции cos этот факт доказывается Предложение 5.1.52. На отрезке [0, π] коси-
аналогично, только нужно вместо неравенства нус строго убывает, а на отрезке [−π, 0] моно-
(5.1.93) применять (5.1.94). тонно возрастает:
Лемма 5.1.50. Если в некоторой точке h > 0 x, y ∈ [0, π], x<y =⇒ cos x > cos y
синус равен нулю, (5.1.97)
x, y ∈ [−π, 0], x<y =⇒ cos x < cos y
sin h = 0,
(5.1.98)
то h – полупериод для функций sin и cos. Доказательство. Заметим сначала, что из-за
Доказательство. тождества четности (5.1.80) здесь достаточно до-
казать только утверждение для отрезка [0, π].
0 Для него мы получаем такую цепочку:
 z }|{ 
sin 2h = 2 · sin h · cos h = 0 x, y ∈ [0, π], x<y
2
cos 2h = 1 − 2 · sin
| {z h} = 1
0

x+y x−y
⇓ ∈ (0, π), ∈ (−π, 0)
2 2
1 0 (отрезок [0, π] превратился в интервалы (0, π) и (−π, 0)!)
 z }| { z }| { 
sin(x + 2h) = sin x · cos 2h + cos x · sin 2h = sin x ⇓
cos(x + 2h) = cos x · cos
| {z2h} − sin x · sin
| {z2h} = cos x
1 0
cos x − cos y = (5.1.89) =
x+y x−y
= −2 · sin · sin >0
| {z2 } | {z2 }
Предложение 5.1.51. На интервале (0, π) си-
<

>

нус положителен, а на интервале (−π, 0) – от- 0 0


рицателен: ⇓
x ∈ (0, π) =⇒ sin x > 0 (5.1.95) cos x > cos y
x ∈ (−π, 0) =⇒ sin x < 0 (5.1.96)
§ 1. Элементарные функции 347

Предложение 5.1.53. Справедлива следующая ⇓


таблица значений синуса и косинуса в некото-
рых характерных точках на отрезке [0, π2 ]: " √ #
sin π4 = 2√2
t 0 π π π π sin π4 = − 22 ← невозможно, в силу (5.1.95)
√6 √4 3 2
3 2 1
cos t 1 2 0
√2 √2 ⇓
1 2 3
sin t 0 2 2 2 1

π π 2
sin = cos =
Доказательство. Мы покажем, как выводятся 4 4 2
значения этих функций в двух точках, оставив
вывод для остальных точек читателю.
1. Вычислим значения в точке π2 : во-первых,
π π Предложение 5.1.54. Справедливы тожде-
0 = sin π = 2 · sin · cos
2 2 ства:

  sin(x + π) = − sin x (5.1.99)
sin π2 = 0 ← невозможно, в силу (5.1.95)
cos(x + π) = − cos x (5.1.100)
cos π2 = 0  π
⇓ sin x + = cos x (5.1.101)
 2
π π
cos = 0 cos x + = − sin x (5.1.102)
2  2
π
И, во-вторых, sin x − = − cos x (5.1.103)
 2
π π π
sin2 + cos2 = 1 cos x − = sin x (5.1.104)
2 | {z 2}  π 2
0 sin − x = cos x (5.1.105)
 2π 

cos − x = sin x (5.1.106)
π 2
sin2 = 1
2
⇓ Доказательство. Мы докажем только первое
  тождество, остальные доказываются по анало-
sin π2 = 1 гии:
sin π2 = −1 ← невозможно, в силу (5.1.95)

⇓ | {zπ} + cos x · sin


sin(x + π) = sin x · cos | {zπ} = sin x
π −1 0
sin = 1
2
π
2. Заметим, что sin 4 = cos π4 :

π π π π π
sin = sin − = sin · cos − Индукцией из формул (5.1.99) и (5.1.100) вы-
4 2 4 | {z2} 4
водится
1
π π π
− cos · sin = cos Следствие 5.1.55. Справедливы тождества:
| {z 2} 4 4
0
cos(πn) = cos(−πn) = (−1)n ,
(5.1.107)
Отсюда получаем:
sin(πn) = sin(−πn) = 0. (5.1.108)
π π π  π π 2 π
1 = sin = sin + = 2·sin ·cos = 2·sin
2 4 4 4 4 4 Предложение 5.1.56. На интервале − π , π 
2 2
⇓ косинус положителен, а на интервале π2 , 3π
2 –
π 1 отрицателен:
sin2 =
4 2  π π
⇓ x∈ − , =⇒ cos x > 0 (5.1.109)
r  2 2

π 1 2 π 3π
sin = = x∈ , =⇒ cos x < 0 (5.1.110)
4 2 2 2 2
348 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Доказательство. Здесь все следует из предло- ⇓


жения 5.1.51:  π  π
 π π
cos x + < cos y +
x∈ − , 2 2
2 2


 π
π
x + ∈ (0, π) sin x = (5.1.102) = − cos x + >
2   2
π
⇓ > − cos y + = (5.1.102) = sin y
 2
π
cos x = (5.1.101) = sin x + >0
2
И точно так же ⋄ 5.1.58. Полученной теперь информации до-
  статочно для построения графиков синуса и ко-
π 3π синуса. Эти картинки общеизвестны, однако мы
x∈ ,
2 2 предлагаем читателю проверить самостоятельно,
что, если ставить себе целью указать на графи-

ке интервалы монотонности и знакоопределенно-
π
x + ∈ (π, 2π) сти, то из того, что мы уже успели доказать про
2 синус и косинус никаких других картинок полу-
⇓ читься не может. Для синуса график должен вы-
 π глядеть так:
cos x = (5.1.101) = sin x + <0
2

 
Предложение 5.1.57. На отрезке − π2 ,π2 си-
нус монотонно возрастает, а на отрезке π2 , 3π 2
монотонно убывает:
h π πi
x, y ∈ − , , x < y =⇒ sin x > sin y
2 2
(5.1.111)
 
π 3π А для косинуса так:
x, y ∈ , , x < y =⇒ sin x < sin y
2 2
(5.1.112)
 π π
Доказательство. Для отрезка − 2 , 2 получа-
ем: h π πi
x, y ∈ − , , x<y
2 2

π π π π
x + , y + ∈ [0, π], x+ <y+
2 2 2 2
⇓ Тангенс и котангенс.
 π  π
cos x + > cos y + • Функции тангенс tg и котангенс ctg опреде-
2 2 ляются формулами
⇓ sin x  π 
tg x = x∈/ + πZ (5.1.113)
cos x 2
 π cos x
sin x = (5.1.102) = − cos x + < ctg x = (x ∈
/ πZ) (5.1.114)
2 sin x
 π 
< − cos y + = (5.1.102) = sin y Предложение 5.1.59. Справедливы следующие
2 тождества:
 π 3π 
А для 2 , 2 : tg(x + π) = tg x, ctg(x + π) = ctg x
  (5.1.115)
π 3π 
x, y ∈ , , x<y π  π
2 2 tg x − = − ctg x, ctg x − = − tg x
2 2
⇓ (5.1.116)
π π π π tg(−x) = − tg x, ctg(−x) = − ctg x
x + , y + ∈ (π, 2π), x+ <y+ (5.1.117)
2 2 2 2
§ 1. Элементарные функции 349

Доказательство. Это сразу вытекает из свойств Предложение 5.1.62. На границах интерва-


синуса и косинуса, например, первая формула лов, где tg и ctg определены, эти функции име-
доказывается так: ют бесконечные пределы:

sin(x + π) lim tg x = ∞, (n ∈ Z) (5.1.120)


tg(x + π) = = (5.1.99), (5.1.100) = x→ π
cos(x + π) 2 +πn

− sin x sin x lim ctg x = ∞, (n ∈ Z) (5.1.121)


= = = tg x x→πn
− cos x cos x
Доказательство. Из-за π-периодичности и фор-
 мул (5.1.116), связывающих tg и ctg, здесь доста-
Предложение 5.1.60. На интервале − π2 , π2
точно рассмотреть только одну точку. Например,
функция tg возрастает:
при x → π2 мы, в силу непрерывности sin и cos,
 π π получаем:
x, y ∈ − , , x < y =⇒ tg x < tg y
2 2
(5.1.118) π π
sin x −→π sin = 1, cos x −→π cos = 0
x→ 2 2 x→ 2 2
Доказательство. В силу нечетности танген-
са (5.1.117),
 достаточно рассмотреть интервал
0, π2 . Тогда все следует из монотонности синуса ⇓
и косинуса:
 π
x, y ∈ 0, , x<y sin x
2 tg x = −→ ∞
cos x x→ π2

0 < sin x < sin y, cos x > cos y > 0

1 1 ⋄ 5.1.63. Для построения графиков нам теперь
0 < sin x < sin y, 0< <
cos x cos y не хватает нескольких значений в характерных
⇓ точках. Из таблицы для синуса и косинуса на
с.347 мы прямым вычислением получаем табли-
sin x sin y
tg x = < = tg y цу для тангенса и котангенса:
cos x cos y

Предложение 5.1.64. Справедлива следующая


Предложение 5.1.61. На интервале (0, π) таблица значений тангенса и котангенса:
функция ctg убывает:
π π π π
x, y ∈ (0, π), x<y =⇒ ctg x > ctg y x 0 6 4 √3 2
(5.1.119) tg x 0 √1 1 3 6∃
3

Доказательство. ctg x 6∃ 3 1 √1 0
3

x, y ∈ (0, π), x<y


π π  π π π π Теперь можно строить графики. Для танген-
x− ,y − ∈ − , , x− <y− са график выглядит так:
2 2 2 2 2 2

 π  π
tg x − < tg y −
2 2

 π  π
− ctg x = tg x − < tg y − = − ctg y
2 2

ctg x > ctg y
А для котангенса так:
350 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Обратные тригонометрические функции. ⋄ 5.1.69. Арктангенс:


• Следующие правила определяют функции,
называемые соответственно арксинусом, арк-
косинусом, арктангенсом и арккотангенсом:

h π πi
t = arcsin x ⇐⇒ x = sin t & t ∈ − ;
2 2
(5.1.122)
t = arccos x ⇐⇒ x = cos t & t ∈ [0; π] (5.1.123)
 π π
t = arctg x ⇐⇒ x = tg t & t ∈ − ; ⋄ 5.1.70. Арккотангенс:
2 2
(5.1.124)
t = arcctg x ⇐⇒ x = ctg t & t ∈ (0; π) (5.1.125)

Доказательство. Здесь используется теоремы о


монотонной функции на отрезке 4.3.33 и на ин-
тервале 4.3.34. Например, в случае с синусом мы
получаем вот что: по предложению
 5.1.57,
 синус
строго возрастает на отрезке − π2 ; π2 . Вдобавок
 π π
sin − = −1, sin =1
2 2
(c) Непрерывные элементарные
поэтому по теореме 4.3.33 правило (5.1.122) опре-
функции
деляет
 некую  функцию на отрезке [−1; 1] =
sin − π2 ; π2 Можно заметить, что в списке элементарных
Из теорем 4.3.33 и 4.3.34 мы автоматически функций, который мы приводили на с. 327, не
получаем все функции будут непрерывны (мы это уже от-
мечали в примере 5.1.30, но без доказательства).
Предложение 5.1.65. Функции arcsin, arccos, Объясним теперь, почему это так.
arctg и arcctg непрерывны и монотонны на сво-
ей области определения. ⋄ 5.1.71. Функция
А из предложений 5.1.51 и 5.1.56 получаем
f (x) = 0x
Предложение 5.1.66. Функции arcsin, arccos,
arctg и arcctg имеют следующие знаки на ха- разрывна в точке x = 0. Действительно, для по-
рактерных интервалах: следовательности
arcsin x > 0, x ∈ (0, 1] (5.1.126) 1
arcsin x < 0, x ∈ [−1, 0) (5.1.127) xn = −→ 0
n n→∞
arccos x > 0, x ∈ [−1, 1) (5.1.128)
мы получим
arctg x > 0, x>0 (5.1.129)
1
arctg x < 0, x<0 (5.1.130) f (xn ) = 0 n = 0 −→ 0 6= 1 = 00 = f (0)
n→∞
arcctg x > 0, x∈R (5.1.131)
⋄ 5.1.72. Функция
Остается привести графики этих функций.
⋄ 5.1.67. Арксинус: f (x) = (−1)x

разрывна в любой точке своей области опреде-


ления. Например, для точки a = 0 можно взять
последовательность

1
xn = −→ 0
3n n→∞

для которой мы получим


1
⋄ 5.1.68. Арккосинус: f (xn ) = (−1) 3n = −1 −→ −1 6= 1 = (−1)0 = f (0)
n→∞
§ 2. Стандартные функции 351

С другой стороны, очевидно, что некото- альных). Почти всегда это функции, получаю-
рые другие элементарные функции непрерывны. щиеся из элементарных с помощью алгебраиче-
Полный их список дает следующая теорема (ее ских операций (сумма, разность, произведение,
доказательство мы оставляем читателю в каче- частное) и операции композиции. Мы будем на-
стве упражнения): зывать такие функции стандартными (см. опре-
деление на с.357), чтобы отличать их от списка
Теорема 5.1.73. Следующие элементарные функций, перечисленных в § 1 этой главы и на-
функции (и только они) непрерывны в своей об- званных там элементарными.
ласти определения:

(a) Числовые выражения


x
название область определения Стандартные функции определяются с помощью
7→

числовых выражений, которые используются за-


 ∗ тем при описании формальных операций взятия

 x ∈ R, b ∈ 2NN∗ −1


x 6= 0,

b ∈ − 2NN∗ −1
производной и интеграла, и поэтому раздел ма-
степенная
xb N∗ тематики, изучающий числовые выражения, опе-
функция 
 x > 0, b ∈ (0, +∞) \
 2N∗ −1

x −N∗ рации над ними и их связь со стандартными
> 0, b ∈ (−∞, 0) \ 2N∗ −1
функциями, логично считать частью Исчисле-
показательная ния (Calculus) — дисциплины о символьных вы-
ax x ∈ R, a > 0
функция числениях в Анализе. В русском языке это слово
обычно используется в связке с одним из двух
логарифм loga x x > 0, a ∈ (0; 1) ∪ (1; +∞) прилагательных, дифференциальное или инте-
гральное, в зависимости от типа решаемых задач.
синус sin x x∈R О дифференциальном исчислении мы поговорим
на с.382, а об интегральном – на с.446.
косинус cos x x∈R С точки зрения логики на Исчисление есте-
ственно глядеть, как на недостроенную фор-
тангенс tg x x∈
/ π
2 + πZ мальную теорию4 . Качественное ее отличие от
теорий, рассматривавшихся нами в главе 2, со-
котангенс ctg x x∈
/ πZ стоит в том, что предикат равенства в ней опре-
делить (внутри самого Исчисления, без необхо-
арксинус arcsin x x ∈ [−1; 1] димости строить модель в теории вещественных
чисел) не получается5 .
арккосинус arccos x x ∈ [−1; 1] Вопрос о том, как определить равенство чис-
ловых выражений, чтобы превратить Исчисле-
арктангенс arctg x x∈R ние в полноценную формальную теорию, на се-
годняшний день, насколько известно автору, от-
арккотангенс arcctg x x∈R крыт.6 Хотя он не выглядит трансцендентным,
ясно, что ответ на него должен быть чрезвычай-
• Функции из этого списка называются но громоздким (если не появится какой-то идеи,
непрерывными элементарными функ- позволяющей все упростить, например, сменой
циями. сигнатуры). По уровню трудоемкости эта зада-
ча, наверное, сравнима с созданием операцион-
ной системы в программировании (с той разни-
§2 Стандартные функции цей, что несколько операционных систем нынче
существует и поддерживается, а Исчисление, как
В инженерном деле, и вообще в приложени- формальная теория, пока не разработано).
ях очень редко используются какие-то сложные Это сравнение с программированием кажет-
функции, представляемые суммами рядов или ся автору ключевым в выработке отношения к
решениями уравнений (например, дифференци- этой дисциплине. Ясно, что проблему равенств в
4 Напомним, что формальные теории были определены на с.105.
5 Эта тема, по-видимому, остается совершенно неразработанной, в частности, непонятно, можно ли заменить ра-
венство какими-то другими предикатами. Как следствие, в понимаемом таким образом Исчислении получается, что
есть функциональные символы, и вместе с ними и термы, но нет предикатных, и поэтому нет формул в том смысле,
как они определяются в формальных теориях (определение формулы в формальной теории было дано на с.106).
6 Автору трудно судить о современных исследованиях в этой области, но во второй половине 20 века этой про-

блемой интересовались. В частности, известный польский математик Альфред Тарский поставил так называемую
Проблему школьных тождеств (“High school identities”), которую можно считать упрощенным вариантом пробле-
мы равенств в Исчислении для частного случая, когда в сигнатуру теории включены только операции сложения,
умножения и возведения в степень (а в качестве модели рассматривается множество натуральных чисел N∗ ). Она
оказалась на удивление сложной и была решена в 1980 году Алексом Уилки, построившим знаменитый контрпример.
352 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Исчислении нужно как-то решать, но нужно ли Числовые выражения. Числовые выраже-


заставлять школьников и студентов изучать де- ния служат главным предметом изучения в шко-
тали полученного решения, когда оно будет най- ле, поэтому читателю они должны быть хорошо
дено, и нужно ли продолжать заставлять их зуб- знакомы. Грубо говоря, это конечные последова-
рить “суррогатные” алгоритмы решения задач в тельности символов (букв, цифр, или символов
обход этой проблемы, как это делается сейчас, — операций), которые можно записывать как ле-
зависит от развития событий не только в мате- вые или правые части уравнений, или которые
матике. определяют функции (возможно, от нескольких
Если удастся превратить Исчисление в (бо- переменных) с помощью элементарных функций
лее или менее простую) формальную теорию, и алгебраических операций. Например, выраже-
то понятно, что такую науку нужно будет пре- ниями будут
подавать везде, где можно, просто как доступ- p
a+b
ный пример приложений математических зна- 25, t + 2, sin x, , x2 + y 2 .
ний. Поскольку это пока не получается, и в шко- a−b
лах и университетах, по-прежнему, приходится Строгое определение этому понятию выглядит
учить людей дремучим методам решения урав- так:
нений и вычисления производных и интегралов,
большие надежды внушает наметившаяся по- • Числовыми выражениями называются ко-
следнее время возможность создать инфраструк- нечные последовательности символов, опре-
туру, которая позволила бы избавить общество деленные следующими индуктивными прави-
от этой нагрузки. лами:
Очевидно, что с развитием программирова- 1) десятичная запись целого неотрицатель-
ния отношение к вычислениям в математике бу- ного числа считается числовым выраже-
дет меняться. Арифметические вычисления, ко- нием (обозначающим обычное число из
торым до последней трети 20 века уделялось N),
главное внимание в преподавании математики, с
2) буквы π и e считаются числовыми выра-
их сосредоточенностью на вопросе “как выразить
в десятичных дробях результат данной последо- жениями (обозначающими числа π и e,
определенные выше на страницах 342 и
вательности операций с десятичными дробями?”
287),
— ушли далеко на периферию общественного со-
знания с распространением калькуляторов. Точ- 3) всякая буква латинского или греческого
но так же Исчисление, концентрирующееся на алфавита, строчная или прописная, от-
задачах “как выразить в стандартных функциях личная от π и e, также считается чис-
результат данной последовательности операций ловым выражением (обозначающим пере-
со стандартными функциями?”, должно отойти менную или параметр, о чем будет сказано
на второй план с распространением программ, позже):
позволяющих решать эти задачи автоматически.
Это не будет означать, конечно, смерть школь- a, b, c, ..., x, y, z, A, B, C, ..., X, Y, Z
ной и университетской математики, просто надо
α, β, γ, ..., χ, ψ, ω, A, B, Γ, ..., X, Ψ, Ω;
понимать, что круг задач, которыми она зани-
мается, неизбежно будет меняться. Вычисление 4) если мы выбрали какую-то букву латин-
производных и интегралов, вместе с решением ского или греческого алфавита, отличную
уравнений, утратят актуальность, как утратили от π и e, например, a, то приписывая ей
ее относительно недавно методы умножения и в качестве индекса десятичную запись це-
деления многозначных чисел. лого неотрицательного числа, мы получим
Эта неразработанность в настоящем и неопре- новое числовое выражение:
деленность для будущего делает Исчисление
неблагодарной темой для учебников. Мы по- a0 , a1 , a2 , ..., a10 , ...
стараемся в своих объяснениях минимизиро-
вать собственно рассуждения внутри Исчисле- 5) если F и G — числовые выражения, то чис-
ния, как “недостроенной формальной теории”, ловыми выражениями будут также
перенеся, насколько это возможно, формально-
сти в Анализ. В частности, проблему равен- (F ) + (G), (F ) − (G), (F ) · (G),
ства числовых выражений мы, по установив- (G)
(F )/(G), (F ) , log(F ) (G)
шейся традиции, решаем декларацией: “выраже-
ния равны, если определяемые ими стандартные (скобки могут не писаться, если это не
функции равны” 7 . приводит к недоразумению);
7 См. определение на с.359. Связь между числовыми выражениями и стандартными функциями описывается ниже

теоремой 5.2.9.
§ 2. Стандартные функции 353

6) если F — числовое выражение, то число- обозначаемое



выми выражениями будут также выраже- G , (5.2.133)
y=F
ния, получаемые подстановкой F как ар-
гумента под знак элементарных функций, и называемое результатом подстановки в G
в частности, вместо буквы y выражения F .
• Если выражение H получено из какого-то вы-
sin(F ), cos(F ), ражения G подстановкой выражения F ,
tg(F ), ctg(F ),

arcsin(F ), arccos(F ), G =H
y=F
arctg(F ), arcctg(F )
то говорят, что выражение F подчинено вы-
(как и в предыдущем правиле, скобки мо- ражению H (или является частью H).
гут не писаться, если это не приводит к
недоразумению). (b) Стандартные функции
Задание числового выражения дополняется Упорядочение переменных. Ниже мы уви-
следующим правилом: дим, что всякое числовое выражение H опреде-
ляет некое семейство функций (от одного или
• Буквы и индексированные буквы, входящие в
многих переменных, в зависимости от числа пе-
данное числовое выражение H должны быть
ременных, входящих в H), однако для форму-
поделены на переменные и параметры. Это
лировки этого факта нужно сначала научиться
нужно понимать так, что всякое записанное
упорядочивать переменные и параметры.
числовое выражение H должно сопровож-
Мы будем говорить, что в числовом выра-
даться указанием, какие из входящих в него
жении H (или на множестве числовых выраже-
букв и индексированных букв рассматрива-
ний) задан порядок переменных, если специально
ются как переменные, а какие как парамет-
оговорено, какая из переменных, входящих в H
ры.
считается первой, какая второй, и так далее до
Смысл этого деления станет понятен чуть последней. Порядок переменных удобно записы-
позже, при определении дифференциала число- вать просто строчкой, в которой через запятую
вого выражения (мы увидим, что на переменных по порядку перечисляются все переменные, вхо-
и параметрах действие этой операции задается дящие в данное выражение.
по-разному).
⋄ 5.2.3. Например, если в выражении xa счита-
• Сложность comp H выражения H — это ется, что обе буквы, x и a, являются перемен-
сколько раз в нем встречаются алгебраиче- ными, то можно условиться, что переменная x
ские операции (сложение, вычитание, умно- будет первой, а переменная a – второй. Это бу-
жение, деление, возведение в степень) и сим- дет фиксированный порядок переменных, кото-
волы элементарных функций. рый записывается строчкой
• Число мест в выражении H — это количе-
(x, a),
ство переменных в нем. Числовое выражение
H называется n-местным, если в нем n пере- и он будет отличаться от другого возможного по-
менных (и неважно, сколько параметров). рядка,
⋄ 5.2.1. Следующие числовые выражения (с (a, x),
точностью до замены букв) называются элемен- где наоборот a считается первой переменной, а x
тарными: – второй.

xα , sin x, cos x, tg x, ctg x, Точно так же определяется порядок парамет-


ров в числовом выражении.
arcsin x, arccos x, arctg x, arcctg x
(5.2.132) • Пусть P – упорядоченный набор параметров
(например, P = (a1 , ..., am )), а V – упорядо-
Подстановка. ченный набор переменных (например, можно
считать, что V = (x1 , ..., xn ) для некоторого
Теорема 5.2.2. Если G — числовое выражение, n ∈ N∗ ). Условимся говорить, что H есть чис-
y — входящая в него буква (разумеется, вме- ловое выражение над упорядоченными набо-
сто y можно выбирать любую другую букву), и рами P и V параметров и переменных, если
F — какое-то другое числовое выражение, то, в H нет никаких других параметров и пере-
подставив всюду в G вместо буквы y выраже- менных, кроме тех, что перечислены в P и
ние (F ), мы получим новое числовое выражение, V.
354 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

! 5.2.4. При этом необязательно, чтобы все па- Семейство стандартных функций, опреде-
раметры из P и переменные из V действитель- ляемое числовым выражением. Если A –
но содержались в выражении H, нужно только, некое множество, и каждому его элементу a ∈ A
чтобы в H не было “лишних” параметров и пе- поставлена в соответствие некая функция fa :
ременных, то есть таких, которые √
не содержатся Rn ֒→ R, то такое отображение
в P и V . Например, выражение 2 вообще не
содержит переменных и параметров, но можно a 7→ fa
говорить, что это выражение над набором пере-
называется семейством функций, и для такого
менных V = (x, y, z) и параметров (a, b).
объекта используется запись
• Множество всех числовых выражений над
{fa ; a ∈ A}.
упорядоченными наборами параметров
(a1 , ..., am ) и переменных (x1 , ..., xn ) мы будем В частном случае, когда A представляет собой
обозначать символом EX(a1 , ..., am ; x1 , ..., xn ). некое подмножество в Rm , каждый элемент a ∈
A будет числовой строчкой (a1 , ..., am ), и семей-
⋄ 5.2.5. Запись
ство функций fa тогда записывается так:
xn ∈ EX(n; x). {fa1 ,...,am ; (a1 , ..., am ) ∈ A}.
означает, что в выражении xn буква n считается Теорема 5.2.9. Всякое числовое выражение
параметром, а буква x – переменной. Наоборот, H над упорядоченными наборами параметров
запись (a1 , ..., am ) и переменных (x1 , ..., xn )
xn ∈ EX(x; n).
H ∈ EX(a1 , ..., am ; x1 , ..., xn )
означает, что здесь x считается параметром, а n
– переменной. определяет некое семейство функций ha1 ,...,am
по формуле
⋄ 5.2.6. Точно так же запись
ha1 ,...,am (x1 , ..., xn ) = H. (5.2.134)
a · xn ∈ EX(a, n; x)
Доказательство. Смысл формулы (5.2.134)
следует понимать, как соглашение, что в выра- нуждается в прояснении, и мы проведем его ин-
жении a · xn буква a считается первым парамет- дукцией по сложности выражения H.
ром, буква n – вторым, а буква x – переменной. 0) Пусть сначала H — выражение сложности 0,
Наоборот, то есть не содержащее ни алгебраических опе-
a · xn ∈ EX(n, a; x), раций, ни символов элементарных функций.
Тогда
значит, что здесь n – первый параметр, a – вто-
рой, а x – переменная. — либо H вообще не содержит переменных,
и является просто собственным обозна-
⋄ 5.2.7. Запись чением какого-то неотрицательного цело-
го числа; тогда формула (5.2.134) задает
a · xn + y ∈ EX(a, n; x, y) функцию ha1 ,...,am : Rn → R, которая во
всех точках равна (одному и тому же) чис-
предполагает, что здесь a считается первым па- лу, описываемому выражением H;
раметром, n – вторым, x – первой переменной, а
— либо H представляет собой какую-то пе-
y – второй. Если бы мы записали
ременную из набора (x1 , ..., xn )
a · xn + y ∈ EX(a, n; y, x), H = xi , i = 1, ..., n;
то это означало бы, что для нас, по-прежнему, a в этом случае формула (5.2.134) интерпре-
– первый параметр, n – второй, но первой пере- тируется как тождество
менной считается y, а второй x.
ha1 ,...,am (x1 , ..., xn ) = xi , x ∈ R,
⋄ 5.2.8. В качестве упражнения полезно заме-
тить, что ни при каком соглашении о параметрах определяющее функцию ha1 ,...,am : Rn →
и переменных (и ни при каком их упорядочении) R, которая в каждой точке (x1 , ..., xn ) рав-
не могут получиться включения на значению переменной xi .
— либо H представляет собой какой-то пара-
a · xn ∈ EX(n; x), метр из набора (a1 , ..., am )

a · xn + y ∈ EX(n, a; x). H = aj , i = 1, ..., n;


§ 2. Стандартные функции 355

в этом случае формула (5.2.134) интерпре- D(fa1 ,...,am ) ∩ D(ga1 ,...,am ) становится воз-
тируется как тождество можным определить функцию

ha1 ,...,am (x1 , ..., xn ) = aj , x ∈ R, ha1 ,...,am (x1 , ..., xn ) :=


= fa1 ,...,am (x1 , ..., xn )−ga1 ,...,am (x1 , ..., xn ),
определяющее функцию ha1 ,...,am Rn → R,
которая в каждой точке (x1 , ..., xn ) равна и функцию
значению параметра ai .
Понятно, что во всех трех случаях областью ha1 ,...,am (x1 , ..., xn ) :=
определения функции ha1 ,...,am является про- = fa1 ,...,am (x1 , ..., xn )·ga1 ,...,am (x1 , ..., xn );
странство Rn :
— если внешней операцией является деле-
D(ha1 ,...,am ) = Rn . ние, то есть H имеет вид

k) Предположим далее, что смысл формулы F


H= ,
(5.2.134) объяснен для всех выражений над G
набором переменных (x1 , ..., xn ) и парамет- то формулы (6.1.89) определяют некие
ров (a1 , ..., am ), имеющих сложность, мень- функции, и поэтому формула
шую некоторого числа k ∈ N∗ . Пусть H – вы-
ражение сложности k. По определению, сре- fa1 ,...,am (x1 , ..., xn )
ha1 ,...,am (x1 , ..., xn ) :=
ди операций, из которых составлено выраже- ga1 ,...,am (x1 , ..., xn )
ние H должна быть какая-то внешняя опера-
ция (то есть последняя по времени действия). определяет функцию на той части пере-
Рассмотрим по очереди возможные вариан- сечении областей определения fa1 ,...,am и
ты: ga1 ,...,am , где ga1 ,...,am отлична от нуля

— если внешней операцией является сложе- D(ha1 ,...,am ) :=


ние, то есть H имеет вид
= {(x1 , ..., xn ) ∈ D(fa1 ,...,am )∩D(ga1 ,...,am ) :
H = (F ) + (G), ga1 ,...,am (x1 , ..., xn ) 6= 0}, (5.2.136)

где F и G – выражения сложности < k, то — если внешней операцией является возведе-


по предположению индукции F и G опре- ние в степень,
деляют при заданном наборе параметров (G)
H = (F ) ,
(a1 , ..., am ) некоторые функции
то по предположению индукции формулы
fa1 ,...,am (x1 , ..., xn ) = F , (6.1.89) определяют некие функции, и как
ga1 ,...,am (x1 , ..., xn ) = G, (5.2.135) следствие, формула

и поэтому формула ha1 ,...,am (x1 , ..., xn ) :=


= fa1 ,...,am (x1 , ..., xn )ga1 ,...,am (x1 ,...,xn)
ha1 ,...,am (x1 , ..., xn ) :=
= fa1 ,...,am (x1 , ..., xn )+ga1 ,...,am (x1 , ..., xn ) определяет функцию на множестве8
n
определяет функцию на общей области D(u) := (x1 , ..., xn ) ∈ D(fa1 ,...,am )∩D(ga1 ,...,am ) :
определения функций fa1 ,...,am и ga1 ,...,am :
fa1 ,...,am (x1 , ..., xn ) > 0 ∨

D(ha1 ,...,am ) := D(fa1 ,...,am ) ∩ D(ga1 ,...,am );
∨ fa1 ,...,am (x1 , ..., xn ) = 0 &

— точно так же мы поступаем, если внешней & ga1 ,...,am (x1 , ..., xn ) > 0 ∨
операцией является вычитание или умно- 
жение: ∨ fa1 ,...,am (x1 , ..., xn ) < 0 &
H = (F ) − (G), Z o
& ga1 ,...,am (x1 , ..., xn ) ∈ ,
H = (F ) · (G), 2N∗ − 1
— если внешней операцией является взятия
– тогда опять формулы (6.1.89) определя- логарифма,
ют некие функции, и после этого на их об-
щей области определения D(ha1 ,...,am ) := H = log(F ) (G),
8 См. объяснение на с. 328 по поводу условий существования выражения ab .
356 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

то по предположению индукции формулы — если внешней операцией является вычис-


(6.1.89) определяют некие функции, и как ление арксинуса,
следствие, формула
H = arcsin(F ),
ha1 ,...,am (x1 , ..., xn ) :=
то сложность F меньше k, и по предполо-
= logfa1 ,...,am (x1 ,...,xn) ga1 ,...,am (x1 , ..., xn )
жению индукции формула (5.2.137) опре-
определяет функцию на множестве9 деляет некую функцию на подмножестве
D(fa1 ,...,am ) в Rn , и, как следствие, форму-
D(u) := ла
= {(x1 , ..., xn ) ∈ D(fa1 ,...,am )∩D(ga1 ,...,am ) :
ha1 ,...,am (x1 , ..., xn ) :=
fa1 ,...,am (x1 , ..., xn ) > 0 &
= arcsin fa1 ,...,am (x1 , ..., xn ),
& fa1 ,...,am (x1 , ..., xn ) 6= 1 &
& ga1 ,...,am (x1 , ..., xn ) > 0}, определяет функцию на множестве

— если внешней операцией является вычис- D(ha1 ,...,am ) :=


ление тангенса, n
= (x1 , ..., xn ) ∈ D(fa1 ,...,am ) :
H = tg(F ), o
fa1 ,...,am (x1 , ..., xn ) ∈ [−1, 1] ;
то сложность F меньше k, и по предполо-
жению индукции формула — если внешней операцией является вычис-
ление арккосинуса,
fa1 ,...,am (x1 , ..., xn ) = F (5.2.137)

определяет некую функцию на подмноже- H = arccos(F ),


стве D(fa1 ,...,am ) в Rn , и, как следствие,
то сложность F меньше k, и по предполо-
формула
жению индукции формула (5.2.137) опре-
деляет некую функцию на подмножестве
ha1 ,...,am (x1 , ..., xn ) :=
D(fa1 ,...,am ) в Rn , и, как следствие, форму-
= tg fa1 ,...,am (x1 , ..., xn ), ла
определяет функцию на множестве
ha1 ,...,am (x1 , ..., xn ) :=
D(ha1 ,...,am ) := = arccos fa1 ,...,am (x1 , ..., xn ),
n
= (x1 , ..., xn ) ∈ D(fa1 ,...,am ) : определяет функцию на множестве
π o
fa1 ,...,am (x1 , ..., xn ) ∈
/ + πZ ;
2 D(ha1 ,...,am ) :=
n
— если внешней операцией является вычис- = (x1 , ..., xn ) ∈ D(fa1 ,...,am ) :
ление котангенса, o
fa1 ,...,am (x1 , ..., xn ) ∈ [−1, 1] ;
H = ctg(F ),

то сложность F меньше k, и по предполо- — наконец, если внешней операцией являет-


жению индукции формула (5.2.137) опре- ся какая-нибудь из оставшихся тригоно-
деляет некую функцию на подмножестве метрических функций, то есть H имеет
D(fa1 ,...,am ) в Rn , и, как следствие, форму- вид
ла
sin(F ), cos(F ), arctg(F ), arcctg(F )
ha1 ,...,am (x1 , ..., xn ) := то, как и в предыдущих случаях, фор-
= ctg fa1 ,...,am (x1 , ..., xn ), мула (5.2.137) определяет некую функ-
цию на подмножестве D(fa1 ,...,am ) в Rn , и
определяет функцию на множестве стандартные функции, порожденные эти-
ми выражениями, определяются форму-
D(ha1 ,...,am ) :=
n лами
= (x1 , ..., xn ) ∈ D(fa1 ,...,am ) :
o ha1 ,...,am (x1 , ..., xn ) :=
fa1 ,...,am (x1 , ..., xn ) ∈
/ πZ ; = sin fa1 ,...,am (x1 , ..., xn ),
9 См. аналогичное объяснение на с. 339 по поводу loga x.
§ 2. Стандартные функции 357

ha1 ,...,am (x1 , ..., xn ) := ⋄ 5.2.11. Выражение


= cos fa1 ,...,am (x1 , ..., xn ), 1
,
ha1 ,...,am (x1 , ..., xn ) := x+y
= arctg fa1 ,...,am (x1 , ..., xn ), при упорядочении переменных (x, y), определяет
ha1 ,...,am (x1 , ..., xn ) := стандартную функцию двух переменных
= arcctg fa1 ,...,am (x1 , ..., xn ), 1
f (x, y) =
x+y

причем считается, что они определены в В соответствии с тем же правилом (5.2.136), ее


точности там же, где определена функция областью определения является множество
fa1 ,...,am :  
1
D = {(x, y) : x + y 6= 0}.
D(ha1 ,...,am ) := D(fa1 ,...,am ). x+y
⋄ 5.2.12. Выражения
1 √ √
n , x − 1 + −1 − x
• Семейство функций fa1 ,...,am : R ֒→ R, 0
(a1 , ..., am ) ∈ Rm , называется стандартным, определяют пустую функцию, потому что об-
если оно определяется некоторым числовым ласть допустимых значений переменных у них
выражением F : пуста.
fa1 ,...,am (x1 , ..., xn ) = F . ⋄ 5.2.13. Стандартная функция

Для всякого набора параметров (a1 , ..., am ) ∈ u(α, x) = xα .


Rm область определения D(fa1 ,...,am ) функ-
(здесь выбрано упорядочение переменных α, x)
ции fa1 ,...,am называется областью допу-
описывается в аксиоме степеней на с.328. Ее об-
стимых значений переменных выражения
ласть определения, или, что то же самое, область
F (при заданных значениях параметров
допустимых значений переменных в выражении
(a1 , ..., am )) и обозначается Da1 ,...,am (F ):
xα , описана на с.328:
Da1 ,...,am (F ) := D(fa1 ,...,am ). (5.2.138) 
D(x ) = (α; x) ∈ R2 : x > 0 ∨
α

В частном случае, когда параметры отсут-


ствуют, используется обозначение ∨ (x = 0 & α > 0) ∨
 
Z 
D(F ) := D(f ), ∨ x<0&α∈ .
2N∗ − 1
и это множество называется областью допу- Эквивалентно ее можно описать формулой
стимых значений переменных выражения F 
(без параметров). N
D(xα ) = (α; x) ∈ R2 : α ∈ ∗

• Числовое выражение F называется непре- 2N − 1
 N∗ 
рывным, если оно составлено из выраже-
∨ α∈− ∗ & x 6= 0 ∨
ний, определяющих непрерывные элементар- 2N − 1
ные функции (см. определение на с.351).  N∗ 
∨ α ∈ (0, +∞) \ & x > 0 ∨
2N∗ − 1
Рассмотрим примеры. 
−N∗
∨ α ∈ (−∞, 0) \ &x>0 .
⋄ 5.2.10. Выражение 2N∗ − 1
1 ⋄ 5.2.14. Стандартная функция
x
u(a, x) = loga x
определяет стандартную функцию одного пере-
(здесь выбрано упорядочение переменных a, x)
менного
1 описана на с.339. Ее область определения, или,
u(x) = . что то же самое, область допустимых значе-
x
ний переменных в выражении loga x, описывает-
В соответствии с правилом (5.2.136), ее областью
ся формулой
определения является множество
  D(loga x) = {(a; x) ∈ R2 :
1
D = {x ∈ R : x 6= 0} = R \ {0}. a ∈ (0; 1) ∪ (1; +∞) & x > 0}
x
358 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

⋄ 5.2.15. Для выражения ! 5.2.20. В частности, для случая положитель-


ной и отрицательной полупрямой формулы вы-
1
глядят так:
log2 x
 
0, x < 0 1 + sgn x
область допустимых значений переменной опре- = (5.2.141)
1, x > 0 2
деляется условиями
 
x>0 1, x < 0 1 − sgn x
= (5.2.142)
0, x > 0 2
(для того, чтобы существовал log2 x) и
⋄ 5.2.21. Функции из семейства
log2 x 6= 0 (
1, x ∈ (α, β)
(для того, чтобы можно было делить на log2 x). fα,β (x) =
0, x ∈
/ [α, β]
Поскольку эти условия должны быть выполне-
ны оба сразу, их нужно объединить в систему, являются стандартными, в силу формулы
решая которую получим ответ:
 
    1, x ∈ (α, β)
x>0 x>0 =
⇐⇒ ⇐⇒ 0, x ∈/ [α, β]
log2 x 6= 0 0 < x 6= 1
1 + sgn(x − α) 1 + sgn(x − β)
⇐⇒ x ∈ (0, 1) ∪ (1, +∞) = − (5.2.143)
2 2
Множество (0, 1) ∪ (1, +∞) будет областью допу- .
стимых значений переменной в этом выражении.
⋄ 5.2.22. Всякая функция вида
⋄ 5.2.16. Доказанное нами выше тождество
(5.1.28), √ fα,β (x) = 1, x ∈ (α, β),
|x| = x2 ,
(то есть определенная на заданном интервале
означает, между прочим, что функция модуль, (α, β) и равная на нем единице) является стан-
определенная формулой (4.1.5), является стан- дартной, потому что получается из какой-то
дартной. функции предыдущего примера возведением в
⋄ 5.2.17. Функция сигнум, определяемая прави- степень −1. Для бесконечных интервалов фор-
лом мулы выглядят так:
(
1, x>0  2
sgn x = 1, x > α = , (5.2.144)
−1, x < 0 1 + sgn(x − α)
является стандартной, потому что совпадает со
стандартной функцией  2
1, x < α = (5.2.145)
1 − sgn(x − α)
x
sgn x = в частности, для случая положительной и отри-
|x|
цательной полупрямой,
⋄ 5.2.18. Функции из семейства
(  2
1, x > 0 = (5.2.146)
1, x > α 1 + sgn x
fα (x) =
0, x < α
 2
1, x < 0 = (5.2.147)
являются стандартными, в силу формулы 1 − sgn x
 
0, x < α 1 + sgn(x − α) А, для конечных интервалов — так:
= (5.2.139)
1, x > α 2 
1, x ∈ (α, β) =
⋄ 5.2.19. Функции из семейства  −1
1 + sgn(x − α) 1 + sgn(x − β)
( = −
0, x < α 2 2
fα (x) = (5.2.148)
1, x > α

являются стандартными, в силу формулы ⋄ 5.2.23. Из предыдущего примера следует, что


если нам дана некая стандартная функция f ,
 
1, x < α 1 − sgn(x − α) то умножая ее на стандартную функцию вида
= (5.2.140) (5.2.148), где интервал (α, β) лежит в области
0, x > α 2
§ 2. Стандартные функции 359

определения f , мы получаем стандартную функ- Приведенные числовые выражения и при-


цию, определенную строго на (α, β), и совпадаю- веденные стандартные функции.
щую с f на этом интервале: • Условимся называть числовое выражение H
  приведенным, если в его построении не участ-
f (x), x ∈ (α, β) = f (x) · 1, x ∈ (α, β) вовали операции перехода от F и G к (F )(G)
или logF G. Соответствующее семейство стан-
Таким образом, ограничение стандартной функ- дартных функций
ции на любой интервал (возможно, бесконеч-
ный) также будет стандартной функцией. ha1 ,...,am (x1 , ..., xn ) = H
В частности, функция мы также будем называть приведенным.
1 1  ⋄ 5.2.27. Выражение xx не является приведен-
x , x > 0 = x · 1, x > 0 ным, как и функция

тоже является стандартной. h(x) = xx .


Для положительных значений переменной x эту
⊲ 5.2.24. Проверьте, что для любых стандарт- функцию можно представить как приведенную,
ных функций f1 ,...,fk и любого набора непересе- потому что функция
кающихся интервалов (α1 , β1 ),...,(αk , βk ), функ-
ция, определенная правилом w(x) = ex·ln x
  (определенная приведенным выражением ex·ln x )
f1 (x), x ∈ (α1 , β1 )  будет совпадать с h при x > 0:
f (x) = ...
  x
h(x) = xx = eln x = ex·ln x = w(x).
fk (x), x ∈ (αk , βk )
Но функции h и w формально различны, потому
также будет стандартной. что у них области определения разные: функция
h, например, определена в точке −1, в отличие
Равенство числовых выражений. Мы бу- от функции w:
дем считать два числовых выражения F и G рав- 1
h(−1) = (−1)−1 = = −1.
ными10 , и обозначать это записью −1
• Каждому числовому выражению H можно
F = G, (5.2.149) поставить в соответствие некое новое число-
вое выражение H,b называемое приведеннным
если они определяют одинаковые функции (или видом числового выражения H, которое по-
семейства функций). Это означает, что при лучается заменой в H всех фрагментов вида
каком-нибудь (и тогда при любом) упорядочении (F )(G) на фрагменты вида e(G)·(F ) , а фрагмен-
букв, входящих в выражения F и G, порождае- тов вида logF G на фрагменты ln F
ln G . Получаю-
мые ими функции совпадают: щееся при этом семейство стандартных функ-
ций ĥ, порожденное выражением H, b
f (x1 , ..., xn ) = F & g(x1 , ..., xn ) = G ⇒ f = g.
b b
ha1 ,...,am (x1 , ..., xn ) = H
⋄ 5.2.25. В качестве примера можно рассмот- называется приведеннным видом семейства
реть выражения h, порожденного выражением H.

(x + 1)2 , x2 + 2x + 1. ⋄ 5.2.28. В примере 5.2.27 приведенным видом


выражения xx является выражение ex·ln x ,
Они равны, потому что определяют одну и ту же cx = ex·ln x .
x
функцию:
Соответственно, приведенным видом функции h
f (x) = (x + 1)2 & g(x) = x2 + 2x + 1 ⇒ f =g является функция w:
b
h = w.
⋄ 5.2.26. По той же причине равны выражения
Понятно, что здесь h не совпадает со своим при-
2 2 2 ведением. Из этого примера видно, что числовое
(x + a) − 2ax − a , x
выражение H не всегда совпадает со своим при-
веденным видом H:b
(хотя набор содержащихся в них букв неодина-
ков). b
H 6= H.
10 Это определение понадобится нам ниже при определеии равенства дифференциалтьных выражений на с.889.
360 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

⋄ 5.2.29. Все же часто бывает так, что при при- ⊲ 5.2.33. Какие из последовательностей явля-
ведении стандартная функция не меняется, и, ются бесконечно малыми, а какие – бесконечно
как следствие, равенство большими?
1) xn = √1
b
H = H. n

2) xn = n
выполняется. Например, функция
⋄ 5.2.34. Проверьте, что следующие последова-
h(x) = logx sin x тельности ограничены:

при приведении превращается в функцию xn = sin n, xn = cos n, xn = arctg n.

ln sin x Какие из них сходятся (то есть имеют конечный


b
h(x) = ,
ln x предел)?

которая имеет ту же область опреджеления, что ⊲⊲ 5.2.35. Найти пределы


и h, и совпадает с h во всех точках этого множе- sin n n+5 n + arctg n
ства. lim , lim , lim ,
n→∞ n n→∞ n + sin n n→∞ n − cos n

(c) Стандартные функции в прой- Последовательности, заданные рекуррент-


денных темах но.

Добавление стандартных функций к общему ⋄ 5.2.36. Покажем, что последовательность, за-


списку объектов, рассматриваемых в математи- данная рекуррентно
ческом анализе, резко расширяет возможности √
x1 = 0, xn+1 = 6 + xn
иллюстрировать идеи этой дисциплины. В част-
ности, примеры последовательностей, рассмат- сходится, и найдем ее предел.
ривавшиеся в главе 4, полезно дополнить сле- 1. Вычислим сначала несколько первых эле-
дующими, определяемыми с помощью стандарт- ментов последовательности {xn }, и нарисуем
ных функций. картинку:

Предел последовательности.

⊲⊲ 5.2.30. Какими должны быть величины α, β,


чтобы почти все элементы последовательности
xn лежали в интервале (α; β)?
1) xn = cos 2πn
3
(Ответ: α < − 12 , β > 1)

2) xn = sin 2πn
3 √ √
2. Заметим, что все числа {xn } неотрицатель-
(Ответ: α < − 3
2 , β> 3
2 ) ны (это можно доказать отдельно по индукции):
3) xn = cos πn
3 xn > 0
(Ответ: α < −1, β > 1)

4) xn = sin πn
3 3. Из картинки видно, что на первых несколь-
√ √
(Ответ: α < − 3
2 , β> 3
2 )
ких элементах {xn } наша последовательность
неубывает. Попробуем доказать, что она неубы-
⊲⊲ 5.2.31. Доказать что вает всегда:
1) 0 6= limn→∞ sin πn
3
xn 6 xn+1 (5.2.150)

⊲⊲ 5.2.32. Доказать что Поймем сначала, что означает это неравенство:



1) limn→∞ n = +∞ (здесь расстояние между используем, что xn > 0

соседними точками последовательности убы- √
вает); x n 6 xn+1 ⇔ xn 6 6 + xn ⇔
2) limn→∞ log2 n = +∞ (здесь тоже рассто- ⇔ x2n 6 6 + xn ⇔ x2n − xn − 6 6 0 ⇔
яние между соседними точками последова- ⇔ (xn + 2)(xn − 3) 6 0 ⇔
тельности убывает); | {z }

1
3) limn→∞ log3 n = −∞; делим на xn + 2;
2
и, поскольку xn + 2 > 0
4) limn→∞ (−n 3 ) = −∞; знак неравенства не меняется

5) limn→∞ (−1)n · n = ∞. ⇔ xn − 3 6 0 ⇔ xn 6 3
§ 2. Стандартные функции 361

Теперь докажем, последнее неравенство: Подпоследовательности.

xn 6 3 (5.2.151) ⊲⊲ 5.2.38. Является ли данная последователь-


ность {yk } подпоследовательностью последова-
Это делается математической индукцией. тельности {xn }? (Если да, то указать соответ-
a) Сначала проверяем наше неравенство при ствующую последовательность индексов {nk }.)
n = 1: √
x1 = 0 6 3 1) xn = n, yk = k

b) Предполагаем, что оно верно при n = k: ⊲⊲ 5.2.39. Для данной последовательности {xn }
укажите какую-нибудь сходящуюся подпоследо-
xk 6 3 (5.2.152) вательность {xnk }, если она существует.
2πn
c) Доказываем, что тогда оно будет верно при 1) xn = cos 3
n = k + 1.
⊲⊲ 5.2.40. Проверьте с помощью критерия Коши
xk+1 6 3 (5.2.153)
сходимость последовательностей:
Действительно,
1) xn = sin πn
4 ;
√ πn
xk+1 6 3 ⇔ 6 + xk 6 3 ⇔ 2) xn = cos 7 ;
⇔ 6 + xk 6 9 ⇔ xk 6 3 3) xn = arctg(−1)n .

а последнее неравенство выполняется в силу Функции, заданные как пределы после-


(5.2.152). Таким образом, получилось что из довательностей. Следующая серия упражне-
(5.2.152) следует (5.2.153), а это нам и нужно бы- ний может быть полезна в теме “предел после-
ло. довательности”, хотя подробно эти примеры мы
Итак, мы доказали (5.2.151), а значит и рав- разбираем ниже в теме “поточечная сходимость”
носильное ему условие (5.2.150). Эти неравенства (начиная со страницы 593).
означают, что {xn } неубывает и ограничена свер-
ху. Значит, по теореме Вейерштрасса 4.2.59 она ⊲⊲ 5.2.41. Постройте графики следующих функ-
имеет предел. Обозначим его буквой c: ций:
lim xn = c 1) f (x) = limn→∞ xn
n→∞ 1
2) f (x) = limn→∞ 1+xn
и заметим, что c > 0, поскольку xn > 0 (по тео- 3) f (x) = limn→∞ x − xn+1 ;
n
реме 4.2.52 о переходе к пределу
√ в неравенстве).
x−n −1
Тогда из формулы xn+1 = 6 + xn мы получаем 4) f (x) = limn→∞ x−n +1 ;

n
2 5) f (x) = limn→∞ 1 + x2n
(xn+1 ) = 6 + xn q
6) f (x) = limn→∞ n
x2 + n12 .
откуда
7) f (x) = limn→∞ nx
2 2
c = lim (xn+1 ) = lim (6 + xn ) = 6 + c nx −n−x
n→∞ n→∞ 8) f (x) = limn→∞ nx +n−x

То есть c удовлетворяет квадратному уравнению x3 nx −n−x


9) f (x) = limn→∞ nx +n−x
x
−1
c2 = 6 + c 10) f (x) = limn→∞ arcsin nnx +1 .
2n
11) f (x) = limn→∞ cos x;
решая которое (с учетом, что c > 0), мы получа-
ем c = 3. 12) f (x) = limn→∞ (sin2n x − cos2n x);
x
Ответ: limn→∞ xn = 3 13) f (x) = limn→∞ 1+(2 sin x)2n ;

⊲⊲ 5.2.37. Докажите, что последовательность, 14) f (x) = limn→∞ arctg(nx);


заданная рекуррентно сходится, и найдите ее 15) f (x) = limn→∞ x · arctg(n · ctg x);
предел: 16) f (x) = limn→∞ x2 · arctg(x2n );
p
1) x1 = 1, xn+1 = xn (6 − xn ); 17) f (x) = limn→∞ arctg nx ;
2) x1 = 3, xn+1 = √4xn2 ; 18) f (x) = limn→∞ 2−nx −2nx
2+ 2xn −4 2−nx +2nx ;
√ x+x2 2nx
3) x1 = 9, xn+1 = 2 xn ; 19) f (x) = limn→∞
√ 1+2nx ;
4) x1 = 1, xn+1 = 3 xn ; 20) f (x) = limn→∞ x2
nx
−3nx
2nx +3nx ;
5) xn+1 = √10xn2 , x1 = 6 2n sin x −2−n sin x cos x
5+ 2xn −25 21) f (x) = limn→∞ ;
√ 2n sin x +2−n sin x
6) xn+1 = √ 24 , x1
x n 3
= 1. 22) f (x) = limn→∞ 2n cos x −2−n cos x sin x
9+xn 2n cos x +2−n cos x ;
362 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

log2 (1+2nx )
23) f (x) = limn→∞ log2 (1+2n ) .
Рассмотрим примеры.

(d) Вычисление пределов со стан- ⋄ 5.2.44. Вычислить предел


дартными функциями √
x + x2
lim
Рассмотрим теперь вопрос, как вычисляются x→4 1+x
пределы стандартных функций:
Решение:
lim G(x) =? √
x→a
x + x2
lim = (подстановка) =
x→4 1 + x
Существование предела. Прежде всего, ко- √
нечно, нужно понимать, что предел существует 4 + 42 2 + 16 18
= = =
не всегда. 1+4 5 5
⋄ 5.2.42. Покажем что функция f (x) = sin x1 не Число 18
и будет ответом.
5
имеет предела в точке x = 0:
1 ⋄ 5.2.45. Найти предел
∄ lim sin
x→0 x
lim (x2 − 2x + 3)
Возьмем сначала последовательность аргумен- x→1

тов
1 Решение:
xn = π −→ 0
2 + 2πn n→∞
тогда мы получим lim (x2 − 2x + 3) = (подстановка) =
x→1
1 π  = 12 − 2 · 1 + 3 = 1 − 2 + 3 = 2
f (xn ) = sin = sin + 2πn = 1 −→ 1
xn 2 n→∞
⊲⊲ 5.2.46. Вычислите пределы:
С другой стороны, если взять
1 1) limx→π/2 sin x
xn = −→ 0
π
− 2 + 2πn n→∞ 2) limx→0 arctg x − 1 + x3

x+1
то мы получим 3) limx→0 arcsin x−4
 π  4) limx→√3 x2 −3
1 x4 +x2 +1 ,
f (xn ) = sin = sin − + 2πn = −1 −→ −1
xn 2 n→∞

Таким образом, мы получаем, что если взять од- Вычисление упрощением. Обсудим теперь
ну последовательность аргументов xn −→ 0, то ситуацию, когда, по-прежнему, требуется найти
n→∞
соотвествующая последовательность f (x ) будет предел
n
стремиться к одному числу (A = 1), а если взять lim G(x) =?
x→a
другую последовательность xn −→ 0, то f (xn )
n→∞
будет стремиться к другому числу (A = −1). но функция G(x) не определена в точке x = a
Это означает, что функция f (x) = sin x1 не (хотя, например, определена слева и справа от
имеет предела в точке x = 0, потому что иначе a). Тогда говорят, что имеется так называемая
f (xn ) должно было бы стремиться к этому кон- неопределенность, и алгоритм действий в таких
кретному пределу A, независимо от того, какую случаях состоит в том, чтобы подобрать новую
берешь последовательность xn −→ 0. функцию F (x), которая совпадала бы с G(x)
n→∞ вблизи точки a, и при этом была бы непрерывной
в точке a.
Принцип подстановки. Во-вторых, нужно Зрительно изобразить это руководство мож-
помнить, что если функция непрерывна, то по но так:
критерию непрерывности 4.4.30 ее предел равен
ее значению в точке:
lim G(x) = ...
x→a
Теорема 5.2.43 (принцип подстановки). Пусть !
подбираем функцию F (x)
G – непрерывная стандартная функция, опреде- совпадающую с G(x)
... = вблизи точки a = ...
ленная в некоторой окрестности точки a. То-
и непрерывную в точке a
гда предел функции G в точке x = a существу-
ет и равен ее значению в этой точке: ... = lim F (x) = F (a)
x→a

∃ lim G(x) = G(a). Проиллюстрируем это на примерах.


x→a
§ 2. Стандартные функции 363

⋄ 5.2.47 (упрощение + сокращение). Найти пре- “уничтожает корни”. Оно называется сопряжен-
дел   ным
√ радикалом,
√ и в нашем случае имеет вид
1 2 1 + x + 1 − x. Помножим числитель и знаме-
lim −
x→1 1 − x 1 − x2 натель дроби на сопряженный радикал:
При подстановке возникает неопределенность: √ √
1+x− 1−x
  lim =
1 2 1 2 x→0 x
lim − = − =? √ √ √ √
x→1 1 − x 1 − x2 0 0 ( 1 + x − 1 − x) · ( 1 + x + 1 − x)
= lim √ √ =
x→0 x · ( 1 + x + 1 − x)
Значит, нужны преобразования. Попробуем √ 2 √ 2
упростить наше выражение: 1+x − 1−x
= lim √ √ =
  x→0 x · ( 1 + x + 1 − x)
1 2 (1 + x) − (1 − x)
lim − = = lim √ √ =
x→1 1 − x 1 − x2
  x→0 x · ( 1 + x + 1 − x)
1 2 2x
= lim − = = lim √ √ =
x→1 1 − x (1 − x)(1 + x) x→0 x · ( 1 + x + 1 − x)
1+x−2 x−1 2
= lim = lim = = lim √ √ = (подстановка) =
x→1 (1 − x)(1 + x) x→1 (1 − x)(1 + x)
x→0 1+x+ 1−x
−1 −1 2 2
= lim = lim = = √ √ = =1
x→1 1 + x x→1 1 + x
1+0+ 1−0 1+1
−1 1
= (подстановка) = =− В следующем примере снова используется со-
1+1 2
пряженный радикал.
⋄ 5.2.48 (разложение на множители). Найти
предел ⋄ 5.2.50. Вычислить предел
2
x −1 √3
lim 2 1 + x2 − 1
x→−1 x − x − 2 lim
x→0 x2
Здесь возникает неопределенность:
При подстановке имеем неопределенность:
2
x −1 1−1 0 √3

lim 2 = = =? 1 + x2 − 1 3
1+0−1 0
x→−1 x − x − 2 1+1−2 0 lim = =
x→0 x2 0 0
Это означает, что необходимы преобразования. В Значит нужны преобразования, которые здесь
данном случае они состоят в том, что числитель опять состоят в умножении на сопряженный ра-
и знаменатель нужно разложить на множители, дикал. В нашем примере радикалом является

после чего сократить дробь: выражение 3 1 + x2 − 1. Сопряженный же ради-
кал – то есть выражение, которое при умноже-
x2 − 1 (x − 1)(x + 1) нии на наш радикал “сокращает корни” – имеет
lim = lim = √ 2 √
x→−1 x2 − x − 2 x→−1 (x − 2)(x + 1)
вид 3 1 + x2 + 3 1 + x2 + 1. Умножим на него
x−1 −1 − 1 2 числитель и знаменатель:
= lim = (снова подстановка) = =
x→−1 x − 2 −1 − 2 3 √3
1 + x2 − 1
⋄ 5.2.49 (использование сопряженного радика- lim =
x→0 x2  
ла). Вычислить предел √ √ √
( 3 1 + x2 − 1) ( 3 1 + x2 )2 + 3 1 + x2 + 1
√ √  
1+x− 1−x = lim =
lim x→0
x2 (√ 3 2 √
1 + x2 ) + 3 1 + x2 + 1
x→0 x
При подстановке получается неопределенность: 1 + x2 − 1
= lim  √ 2 √  =
x→0 2 3
√ √ x 1 + x2 + 3 1 + x2 + 1
1+x− 1−x 0
lim = x2
x→0 x 0 = lim  √  =
x→0 2 3
 2 √
Поэтому нужны какие-то преобразования. В x 1 + x2 + 3 1 + x2 + 1
примерах с корнями, как этот, в качестве такого 1
преобразования можно использовать домноже- = lim √ 2 √ =
x→0 3
1+x 2 + 3 1 + x2 + 1
ние на сопряженный радикал.
Под этим понимается вот что. В √ числите- 1
= (подстановка) = √ 2 √ =
√ имеется иррациональное выражение 1 + x −
ле 3
1+0 + 31+0+1
1 − x, называемое радикалом. Подберем такое 1 1
выражение, которое при умножении на него = =
1+1+1 3
364 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

⊲⊲ 5.2.51. Найти пределы ⋄ 5.2.55. Вычислить предел


2
x −5x+6 p 
1) limx→2 x2 −2x ,

lim 1 + x2 − x
2 −1 x→+∞
2) limx→0 1+x x2
√ Решение:
1+x2 −1
3) limx→0 √16+x

2 −4


3
1+x− 3 1−x p  x = 1, y = 1
4) limx→0 2 y x

x lim 1 + x − x = y −→ 0 + 0 =
x−1 x→+∞ x→+∞
5) limx→1 √3 x−1
r 

1−x−3
1 1
6) limx→−8 2+ √ = lim 1+ 2 − =
3
x y→0+0 y y
!
Замена переменной под знаком предела. 1 p 2 1
= lim p y +1− =
В следующих примерах используется теорема y→0+0 y 2 y
4.4.32 о замене переменной под знаком предела.  
используем тождество
= p
2
y = |y|
=
⋄ 5.2.52. Найти предел  p 
1 1
√ = lim y2 + 1 − =
x−4 y→0+0 |y| y
lim √ √  
x→16 x− 4x−2 y → 0 + 0,
= значит y > 0, =
поэтому |y| = y
Решение:  p  p
√ 1 1 y2 + 1 − 1
√ 4 x = y, x = y 4 = lim y2 + 1 − = lim =
y→0+0 y y y→0+0 y
x−4
lim √ √ = y −→ 4 =

p p
x→16 x− x−2
4 x→16 ( y 2 + 1 − 1)( y 2 + 1 + 1)
y 6= 4 при x 6= 16 = lim p =
  y→0+0 y( y 2 + 1 + 1)
y2 − 4 0 (y − 2)(y + 2)
= lim 2 = = lim = y2 + 1 − 1 y2
y→4 y − y − 2 0 y→4 (y − 2)(y + 1) = lim p = lim p =
y→0+0 y( y 2 + 1 + 1) y→0+0 y( y 2 + 1 + 1)
y+2 4+2 6
= lim = = y
y→4 y + 1 4+1 5 = lim p =
y→0+0 2
y +1+1
⋄ 5.2.53. Найти предел y
√ = lim p = (подстановка) =
y→0+0 2
y +1+1
x−1
lim √ 0
x→1 3 x − 1
= √ =0
0+1+1
Решение:
√ ⋄ 5.2.56. Вычислить предел
√ 6 x = y, x = y 6
x − 1 y −→ 1

=
x
lim √ = lim √
x→1 3
x−1 x→1 x→−∞ 2
x +5
y 6= 1 при x 6= 1
  Решение:
y3 − 1 0
= lim 2 = =
y→1 y − 1 0 x = 1, y = 1
x y x
(y − 1)(y 2 + y + 1) y2 + y + 1 lim √ = y −→ 0 − 0 =
= lim = lim = x→−∞ x + 5 x→−∞
2
y→1 (y − 1)(y + 1) y→1 y+1
1 1
1+1+1 3 y y
= = = lim q = lim q =
1+1 2 y→0−0 1 y→0−0 1
y2 +5 y2+5
⋄ 5.2.54. Найти предел 1 используем
= lim py = тождество
p =
cos2 x − 1 y→0−0 1
√ 2 1 + 5y 2 y 2 = |y|
lim y
x→0 cos2 x + 2 cos x − 3 1  
y → 0 − 0,
Решение: = lim 1
py = значит y < 0, =

y→0−0
|y| 1 + 5y 2 поэтому |y| = −y

cos2 x − 1 cos x = y,
1
1
lim = y −→ 1 = py p
x→0 cos2 x + 2 cos x − 3 = lim 1
= lim =
x→0 y→0−0 1 + 5y 2 y→0−0 − 1 + 5y 2
−y
y2 − 1 (y − 1)(y + 1) 1
= lim 2 = lim = = √ = −1
y→1 y + 2y − 3 y→1 (y − 1)(y + 3)
− 1+5·0
y+1 2 1
= lim = = ⊲⊲ 5.2.57. Найти пределы
y→1 y + 3 4 2
§ 2. Стандартные функции 365

sin2 x−sin x−2


1) limx→− π2 sin3 x+1
Обсудим теперь применения первого замеча-
23x+2 x
−3·2 тельного предела.
2) limx→+∞ 1−23x+1
23x+2 −3·2x
3) limx→−∞ 1−23x+1
√ ⋄ 5.2.59. Найти предел
1+sin x−1
4) limx→0 sin x

1+9x
5) limx→+∞ 1+3 x sin 2x
√ lim
6) limx→−∞ 1+3x 1+9x x→0 x
x
−1
7) limx→0 16
8x −1
√ √  Здесь можно сделать замену переменных, после
8) limx→∞ x2 + 1 − x2 − 1 чего наш предел сведется к первому замечатель-
√ ному:
9) limx→∞ x( x2 + 1 − x)
2
2x√ −3x−4
10) limx→∞ x4 +1
sin 2x
√ y
2x = y, x =
11) limx→+∞ q √x √ y −→ 0
2

lim = x→0 =
x+ x+ x x→0 x y 6= 0 при x 6= 0
2 sin y sin y
Первый замечательный предел. При вы- = lim = 2 lim = 2·1 =2
y→0 y y→0 y
числении пределов с тригонометрическими
функциями оказывается полезным следующий
факт. ⋄ 5.2.60.
Теорема 5.2.58.

sin x 1
1 1
= y, x =
lim =1 (5.2.154) x y

x→0 x lim x · sin = y −→ 0 =
x→∞ x x→∞
y 6= 0 при любом x
• Это равенство называется первым за-
sin y
мечательным пределом. = lim =1
y→0 y
Доказательство. Пусть сначала
xn −→ 0, xn > 0 ⋄ 5.2.61.
n→∞

Почти все xn лежат в интервале (0; 1), поэтому


для них из тройного неравенства (5.1.70) мы по- tg x sin x sin x 1
lim = lim = lim · lim =
лучаем цепочку (справедливую для почти всех x→0 x x→0 x cos x x→0 x x→0 cos x
n): = 1·1 =1
0 < xn cos xn < sin xn < xn .
⇓ (делим на xn )
sin xn ⋄ 5.2.62.
0 < cos xn < <1
| {z } xn
предложение 5.1.49 ↓  
cos 0 1 − cos x 2 sin2 x2 sin x2 2
предложение 5.1.41 k
lim = lim = 2 lim =
x→0 x2 x→0 x2 x→0 x
1
 
sin x2 2 2 =y y, x = 2y
x
⇓ (теорема 4.2.54) −→ 0
= 2 lim = =
sin xn x→0 x y 6= 0 x→0
при x 6= 0
−→ 1.  2  2
xn n→∞ sin y 1 sin y 1 1
Это верно для всякой последовательности = 2 lim = lim = ·1 =
y→0 2y 2 y→0 y 2 2
xn −→ 0, xn > 0, значит
n→∞

sin x ⊲⊲ 5.2.63. Найти пределы


lim =1
x→+0 x
sin 5x
Отсюда уже следует, что 1) limx→0 3x
2) limx→0 sin αx
sin x t = −x sin(−t) sin βx
lim = = lim = 2
3) limx→∞ (x − 3) sin 3x
x→−0 x t → +0 t→+0 −t
− sin t sin t 4) limx→0 x ctg x
= lim = lim =1
t→+0 −t t→+0 t 5) limx→∞ x2 sin x1
tg x−sin x
Вместе эти равенства дают (5.2.154). 6) limx→0 sin3 x
366 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ

Второй замечательный предел. Следую- а отсюда, в свою очередь, получается


щее утверждение оказывается также весьма по-
лезным при вычислении пределов: 1 1 1
1+ >1+ >1+
nk xk nk + 1
Теорема 5.2.64.
и
 x
1 1  xk  xk   xk
lim (1 + x) = e = lim 1 +
x
(5.2.155) 1 1 1
x→0 x→∞ x 1+ > 1+ > 1+
nk xk nk + 1
• Эти (эквивалентные) равенства назы-
Расширим это двойное неравенство влево и впра-
ваются вторым замечательным пре-
во:
делом.
Доказательство. Равенство между этими дву-  nk +1  
мя пределами получается заменой переменной, 1
1+ > используем неравенство
nk + 1 > xk >
поэтому нам достаточно доказать только второе nk
 xk  xk
равенство в этой цепочке. Для начала будем счи- 1 1
тать, что x положительно, то есть докажем ра- > 1+ > 1+ >
nk xk
венство  xk  
1
 x > 1+ > используем неравенство
xk > nk >
1 nk + 1
lim 1+ =e (5.2.156)  nk
x→+∞ x 1
> 1+
Зафиксируем последовательность {xk }, стремя- nk + 1
щуюся к +∞, Теперь выбросим ненужные звенья в этой цепоч-
xk −→ +∞ ке:
k→∞
и покажем, что  nk +1  xk  nk
1 1 1
 xk 1+ > 1+ > 1+
1 nk xk nk + 1
lim 1 + =e | {z } | {z }
k→∞ xk ↓ (5.2.158) ↓ (5.2.159)
e e
Действительно, всякое число xk лежит между
какими-нибудь двумя соседними натуральными ⇓ (теорема 4.2.54)
числами, поэтому можно найти число nk ∈ N та-   xk
кое, что 1
1+ −→ e
xk k→∞
nk 6 xk < nk + 1 (5.2.157)
Мы доказали равенство (5.2.156). Из него теперь
Возникающая таким образом последователь- получаем
ность натуральных чисел {nk } будет бесконечно  x
большой 1 y = −x
lim 1+ = =
nk −→ +∞ x→−∞ x y → +∞
k→∞  −y  −y
1 y−1
потому что nk > xk − 1 −→ +∞. Мы получаем = lim 1− = lim =
импликацию:
k→∞ y→+∞ y y→+∞ y
 y  y
 n y 1
1 = lim = lim 1 + =
1+ −→ e (4.2.99) y→+∞ y − 1 y→+∞ y−1
n k→∞  z+1
z = y − 1 1
= = lim 1+ =
⇓ свойство 10 на с.(b) z → +∞ z→+∞ z
 z  
 nk 1 1
1 = lim 1+ · lim 1+ =e
1+ −→ e (5.2.158) z→+∞ z z→+∞ z
nk k→∞ | {z } | {z }
=

Аналогично доказывается что e, 1


в силу (5.2.156)
 nk +1
1
1+ −→ e (5.2.159) В результате мы доказали
nk + 1 k→∞
 x
1
Теперь рассмотрим двойное неравенство lim 1+ =e (5.2.160)
(5.2.157). Из него следует x→−∞ x

1 1 1 и вместе с (5.2.156) это дает второе равенство в


> > (5.2.155).
nk xk nk + 1
§ 2. Стандартные функции 367

Теорема 5.2.64 позволяет вычислять сложные ⊲⊲ 5.2.68. Найти пределы


2
пределы, в которых возникает неопределенность 1) limx→0 (1 + 3 tg2 x)ctg x
типа 1∞ .  3x
2x
2) limx→∞ 2x−3
⋄ 5.2.65. Найти предел  3 √x
lim (1 + tg x)ctg x 3) limx→+∞ 5x5x+2 3
x→0 1
Решение: 4) limx→0 1 + 2x2 x2
 x+1
2x+3
5) limx→∞ 2x+1
ctg x tg x = y, ctg x = 1
lim (1 + tg x) = y −→ 0
y =
ctg x
x→0 x→0 6) limx→0 (1 + tg x)
1 ctg2 x
= lim (1 + y) y = e 7) limx→0 1 + 3 tg2 x
y→0
1
8) limx→0 (cos x) sin2 x
⋄ 5.2.66. Найти предел  1
 x 9) limx→0 cos2 x sin2 x
x+1 ctg x
lim 10) limx→0 (cos x)
x→∞ x − 1
 x+1
2x+3
Решение: 11) limx→∞ 2x−1
 2 x2
 x  x 12) limx→∞ xx2+3x+1
−x+2
x+1 x+1  x
lim = lim 1 + −1 = 13) limx→∞ 5x5x
2
+1
x→∞ x − 1 x→∞ x−1 2 +x+1
 x 2  x2
2 x−1 = y, x = 1 + y2
= lim 1 + = = 14) limx→∞ x+3x+1
x→∞ x−1 y −→ 0
x→∞

2
h i
1 2
1+
= lim (1 + y) y = lim (1 + y) (1 + y) y = Следствие 5.2.69. Справедливы соотношения:
y→0 y→0
 2
1 ln(1 + x)
= lim (1 + y) lim (1 + y) y
= e2 lim =1 (5.2.161)
y→0 y→0 x→0 x
⋄ 5.2.67. Найти предел и
1 ex − 1
lim (cos x) x2 lim =1 (5.2.162)
x→0 x→0 x
Решение:
Доказательство. Сразу получается (5.2.161):
1
 x  x12
lim (cos x) = lim 1 − 2 sin2
x2 =
x→0 x→0 2 ln(1 + x) 1
2 x lim = lim ln(1 + x) x =
  1  −2 sin2 2 x→0 x x→0
2 x −2 sin2 x
x
1
= lim 1 − 2 sin 2
= = ln lim (1 + x) x = ln e = 1
x→0 2 x→0
−2 sin2 x
  
x  −2 sin
limx→0 2
1
x2
2 x А отсюда уже следует (5.2.162):
= lim 1 − 2 sin2 2
x→0 2
Теперь отдельно сосчитаем два получившихся ex − 1 ex − 1 = t t
lim = x = ln(1 + t) = lim =
предела. Во-первых, x→0 x t→0 ln(1 + t)
 −1
 ln(1 + t)
x  −2 sin
1
2 x −2 sin2 x
2 = y, = lim = (5.2.161) = 1−1 = 1
lim 1 − 2 sin2 2
= y −→ 0 = t→0 t
x→0 2 x→0
1
= lim (1 + y) y = e
y→0

И, во-вторых,
⊲⊲ 5.2.70. Найдите пределы
−2 sin2 x 2x
2 x
2 = z, x = 2z 1. limx→0 e x−1 ;
lim = z −→ 0 =
x→0 x2 x→0
2. limx→0 ln(1−3x)
;
 2 x 
1 sin z 1 5
= − lim =− 3. limx→∞ x e x − 1 ;
2 z→0 z 2
1
4. limx→∞ x ln x−1
x+1 ;
Мы получаем ответ:
ln(1−7ex )
5. limx→−∞ ;
1
− 21 1 ex
lim (cos x) x2 =e = √ . 6. 1−esin x
limx→−∞ 1−cos2 x .
x→0 e
368 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
Глава 6

ПРОИЗВОДНАЯ

§1 Производная
Понятие производной появилось в анализе как инструмент для решения задач на экстремум (то есть
на максимум и минимум), поэтому обсуждение этой темы полезно начать с какого-нибудь простого
примера, иллюстрирующего эту связь.

⋄ 6.1.1. Пусть нам дана функция


y
y = kx + b

f (x) = x2 − x4 (6.1.1)

x
и требуется найти ее наибольшее значение на 0 a
прямой R.
Нулями этой функции (то есть решениями
уравнения f (x) = 0) являются числа {−1, 0, 1},
поэтому легко сообразить, что график f будет
выглядеть примерно так: Как любая линейная функция (мы определи-
ли линейные функции формулой (4.3.105)), ка-
сательная описывается уравнением вида

y = k·x+b
y
y = x2 − x4 в котором k – угловой коэффициент, связанный
с углом наклона ϕ касательной формулой

−1 1 x k = tg ϕ
? 0 ? Если точку a сдвинуть в какое-нибудь другое ме-
сто, то угловой коэффициент k, вообще говоря,
изменится (как и вся касательная). Таким обра-
зом, мы получаем некую зависимость, или, точ-
нее сказать, функцию

a 7→ k(a)

Отсюда можно заключить, что f действительно которая каждой точке a ∈ R ставит в соответ-
будет иметь максимум в каких-то точках, лежа- ствие угловой коэффициент k = k(a) касатель-
щих на интервалах (−1, 0) и (0, 1), и нам нужно ной к графику функции f в точке a.
придумать, как найти эти точки. Заметим далее, что в точках максимума (а
также, минимума) касательная к графику функ-
Чтобы это понять, нарисуем касательную к ции f горизонтальна, то есть угловой коэффици-
графику функции f в какой-нибудь точке a ∈ R ент касательной равен нулю
(что такое касательная, мы надеемся, что чита-
тель знает по школе): k(a) = 0. (6.1.2)

369
370 Глава 6. ПРОИЗВОДНАЯ

Поэтому если б мы знали функцию a 7→ k(a), то задача будет решена в примере 6.1.3), и уравне-
решив уравнение (6.1.2), мы как раз смогли бы ние (6.1.2) решается так:
получить точки максимума.
Раздел анализа, называемый Дифференци- k(a) = 0 ⇔ 2a − 4a3 = 0 ⇔
альным исчислением (мы поговорим о нем на  
1 1
с.382), как раз предоставляет алгоритм, позво- ⇔ a∈ − √ , 0, √ ,
ляющий найти функцию a 7→ k(a) по функции 2 2
x 7→ f (x). Для нашей функции f (x) = x2 − x4 После этого становится понятно, что максимум
соответствующая функция k имеет вид нашей функции достигается в точках ± √12 , и ра-
k(a) = 2a − 4a3 (6.1.3) вен  
1 1 1 1
(почему это так станет понятно после § 1 настоя- f ± √ = − =
2 2 4 4
щей главы, а конкретно для функции (6.1.1) эта

Функция a 7→ k(a), о которой мы говорили в этом примере, на математическом языке называется


производной функции f и обозначается

k(a) = f ′ (a)

Это одно из главных понятий в математическом анализе, и, помимо нахождения экстремумов (мак-
симумов и минимумов), оно используется в разных других задачах, например,
– при построении графика функции (это описывается в (b) этой главы),
– при вычислении сложных пределов с помощью правила Лопиталя (см. (a) этой главы),
– при определении еще одного важного объекта в математическом анализе – неопределен-
ного интеграла (об этом речь пойдет в главе 8).
В этой главе мы дадим аккуратное определение этому понятию, научимся вычислять производные
стандартных функций и обсудим приложения производной.

(a) Производная и дифференцируемость


• Пусть функция f определена в некоторой окрестности точки a. Если существует конечный
предел
f (a + t) − f (a) f (x) − f (a)
f ′ (a) = lim = lim ∈ R, (6.1.4)
t→0 t x→a x−a
то он называется производной функции f в точке a, а про функцию f говорят, что она
дифференцируема в точке a.
• Функция f называется дифференцируемой на множестве E, если она (определена в
окрестности каждой точки этого множества и) дифференцируема в каждой точке это-
го множества:
f (a + t) − f (a)
∀a ∈ E ∃f ′ (a) = lim ∈R
t→0 t

⋄ 6.1.2. Для функции Ясно, что смысл нашего утверждения не изме-


нится, если заменить a на любую другую пере-
f (x) = x2 менную, например, на x:
по определению, получаем: f ′ (x) = 2x, x∈R
– эта формула будет означать, что производная
′ (a + t)2 − a2 функции f в любой точке x равна 2x.
f (a) = lim =
t→0 t
⋄ 6.1.3. Рассмотрим функцию из примера 6.1.1:
a2 + 2at + t2 − a2
= lim = lim (2a + t) = 2a
t→0 t t→0 f (x) = x2 − x4
То есть, в любой точке a производная функции опять по определению, получаем:
f (x) = x2 равна 2a: n o n o
(a + t)2 − (a + t)4 − a2 − a4
f ′ (a) = 2a, a∈R f ′ (a) = lim =
t→0 t
§ 1. Производная 371

= (3.2.112) = Если поменять переменную на x, то


1 n 
= lim · a2 + 2at + t2 − f ′ (x) = 2x − 4x3 , x ∈ R.
t→0 t
 o
− a4 + 4a3 t + 6a2 t2 + 4at3 + t4 − a2 + a4 =
⋄ 6.1.4. Наоборот, функция
1 n  o
= lim · 2at+ t2 − 4a3 t+ 6a2 t2 + 4at3 + t4 =
t→0 t f (x) = |x|
n  o
= lim 2a + t − 4a3 + 6a2 t + 4at2 + t3 =
t→0
не дифференцирема в точке a = 0, потому что
= 2a − 4a3 предел
Это совпадает с тем, что мы заявляли в примере |t|
6.1.1: f ′ (0) = lim
t→0 t

f ′ (a) = k(a) = 2a − 4a3 , a∈R не существует.

Теорема 6.1.5 (о связи между непрерывностью и дифференцируемостью). Если функция f диф-


ференцируема в точке a, то она непрерывна в этой точке.
Доказательство. Если функция f определена в некоторой окрестности точки a и дифференциру-
ема в a, то это значит, что существует конечный предел

f (a + t) − f (a)
lim = f ′ (a)
t→0 t
Отсюда следует цепочка
 
f (a + t) − f (a)
lim f (a + t) − f (a) = lim f (a + t) − lim f (a) = lim (f (a + t) − f (a)) = lim ·t =
t→0 t→0 t→0 t→0 t→0 t
f (a + t) − f (a)
= lim · lim t = f ′ (a) · 0 = 0,
t→0 t t→0

из которой мы получаем
lim f (x) = lim f (a + t) = f (a)
x→a t→0

По теореме 4.4.30 о связи между пределом и непрерывностью, это означает, что функция f непре-
рывна в точке a.

Геометрический смысл производной. У фициент (то есть тангенс угла наклона) секущей
производной имеется естественная геометриче- будет равен
ская интерпретация: число f ′ (a), определенное
формулой (6.1.4) как раз и есть угловой коэф- f (a + t) − f (a)
kt =
фициент касательной к графику функции f в t
точке a, о котором мы говорили в примере 6.1.1. Теперь “расфиксируем” число t и устремим его к
Чтобы понять, почему это так, зафиксируем сна- нулю. Тогда наша секущая тоже станет двигать-
чала число t и проведем секущую к графику ся, “приближаясь к касательной”, а “в пределе” –
функции f через точки (a; f (a)) и (a + t; f (a + t)): просто превратится в касательную.
y y
f (a + t) B

y = f (x) y = f (x)
f (a) A
C x f (a) x
0 a a+t 0 a

Из треугольника ABC видно, что угловой коэф- Угловой коэффициент (тангенс угла наклона)
372 Глава 6. ПРОИЗВОДНАЯ

этой касательной будет как раз равен производ- функции f (x) = | arctg x| производная в точ-
ной: ке x0 = 1 больше, чем в точке x1 = 2 (потому
f (a + t) − f (a) что угол наклона касательной в точке x0 = 1
k = lim = f ′ (a)
t→0 t больше, чем в точке x1 = 2):

Наглядный смысл дифферецируемости.


На интуитивном уровне дифференцируемость y
функции f в точке a означает, что в точке a к
графику функции f можно провести (однознач-
но определенную) касательную (и это не будет
вертикальная прямая).
Для понимания этих терминов следует уяс- x
нить два важных момента: 0 1 2
– во-первых, производная существует не все-
гда, и глядя на график обычно бывает в частности, если производная в какой-то точ-
нетрудно сообразить, имеет ли функция f в ке x0 равна нулю
данной точке производную (то есть, диффе-
ренцируема ли она в этой точке), или нет; на- f ′ (x0 ) = 0
пример, функция f (x) = | arctg x| то это означает, что касательная в этой точке
x0 горизонтальна
y
π y
2

y = | arctg(x)|
x
x 0 x0
0

дифференцируема в любой точке x0 6= 0 (по-


тому что в любой точке x0 6= 0 к графику если же производная в x0 положительна
можно провести касательную)
f ′ (x0 ) > 0
y
то это означает, что касательная в этой точке
x0 возрастает
y

x
0 a x
x0 0
но в точке x0 = 0 она не дифференцируема
(потому что в x0 = 0 однозначно определен-
ную касательную провести невозможно)
а если производная в x0 отрицательна
y
f ′ (x0 ) < 0
то касательная в x0 убывает
y
x

x
0 x0
– во-вторых, по графику функции можно сооб-
разить, в каких точках производная больше,
а в каких – меньше; например, у той же самой
§ 1. Производная 373

В качестве упражнения полезно порешать за- ⋄ 6.1.10. Производная степенной функции:


дачи следующего типа.
f (x) = xα =⇒ f ′ (x) = α · xα−1 , (6.1.7)
⊲ 6.1.6. Нарисуйте график какой-нибудь функ-
ции f со следующими свойствами: при x 6= 0, либо при x = 0 и α > 1.
В частности,
1) f дифференцируема в любой точке,
кроме x = −2 и x = 1; 1 1
′ ′ ′
f (x) = =⇒ f ′ (x) = − 2 (6.1.8)
2) f (0) = 0, f (2) = −1, f (−1) = 1; x x
3) f убывает на множестве (0; +∞); Действительно, при x 6= 0 мы получим
4) f возрастает на множестве (−∞; −3).
(x + t)α − xα
⊲ 6.1.7. Нарисуйте график какой-нибудь функ- f ′ (x) = lim =
t
t→0
ции f со следующими свойствами:
x + t = xes

1) f дифференцируема в любой точке, = t = x(es − 1) =
кроме x = 0; s = ln(1 + t )
x
2) f ′ (2) = 0, f ′ (3) = 1, f ′ (1) = −1; x · e − xα
α αs
xα eαs − 1
= lim = · lim =
3) f ограничена на множестве (0; +∞); s→0 x(es − 1) x s→0 es − 1
eαs − 1 αs
4) f не ограничена на множестве (−∞; 0). = xα−1 · lim · s =
s→0 αs e −1
αs
⊲ 6.1.8. По графику функции e −1 αs
= xα−1 · lim · lim s =
s→0 αs s→0 e −1
y  
в первом пределе
= делаем замену y = αs =

ey − 1 αs
= xα−1 · lim · lim s =
y→0 y s→0 e − 1
 
x
= выносим α из второго предела
и преобразуем этот предел =
0 1
 −1
ey − 1 es − 1
= αxα−1 · lim · lim =
y→0 y s→0 s
 
= дважды применяем
формулу (5.2.162) =
определите, в каких точках она дифференциру-
ема, и будет ли она дифференцируемой = αxα−1 · 1 · 1−1 = αxα−1 .
1) на интервале (−∞; 1)?
А при x = 0 и α > 1 вычисления упростятся:
2) на интервале (−∞; 0)?
3) на интервале (1; +∞)? tα − 0 α tα
4) на интервале (0; 1)? f ′ (0) = lim = lim =
t→0 t t→0 t

= lim tα−1 = 0 = α · xα−1 x=0 .
t→0
Производные элементарных функций.
Вычислим теперь производные элементарных ⋄ 6.1.11. Производная показательной
функций (в тех случаях, когда это возможно). функции:
⋄ 6.1.9. Производная линейной функции: f (x) = ax =⇒ f ′ (x) = ax · ln a (6.1.9)
f (x) = kx + b =⇒ f ′ (x) = k (6.1.5) В частности,

В частности, производная от константы: f (x) = ex =⇒ f ′ (x) = ex (6.1.10)

f (x) = C =⇒ f ′ (x) = 0 (6.1.6) Действительно,

Действительно, ax+t − ax at − 1
f ′ (x) = lim = ax · lim =
t→0 t t→0 t
f (x + t) − f (x)   et ln a − 1
f ′ (x) = lim = применяем
= формулу = a x
· lim =
t→0 t (5.1.64) t→0 t
(k · (x + t) + b) − (k · x + b) s
e −1
= lim =
t→0 t = st == t lns a = ax ln a · lim =

ln a

s→0 s
k·t применяем x x
= lim = lim k = k = формулу (5.2.162) = a ln a · 1 = a ln a
t→0 t t→0
374 Глава 6. ПРОИЗВОДНАЯ

⋄ 6.1.12. Производная логарифма: cos(x + t) − cos x


f ′ (x) = lim =
t→0 t
1 cos x · cos t − sin x · sin t − cos x
f (x) = loga x =⇒ f ′ (x) = (6.1.11) = lim =
x · ln a t→0 t
В частности, cos x · (cos t − 1) − sin x · sin t
= lim =
t→0 t
1 cos t − 1 sin t
f (x) = ln x =⇒ f ′ (x) = (6.1.12) = cos x · lim − sin x · lim =
x t→0 t t→0 t
 
Действительно, применяем формулу (6.1.14)
= и первый замечательный предел =

loga (x + t) − loga x = cos x · 0 − sin x · 1 = − sin x


f ′ (x) = lim =
t→0 t ⋄ 6.1.15. Производная тангенса:
  ln(x + t) − ln x
применяем
= формулу (5.1.64) = t→0lim = 1
t ln a f (x) = tg x =⇒ f ′ (x) = (6.1.16)
cos2 x
ln x+t
x ln(1 + xt ) s = xt
= lim = lim = t = s · x = Действительно,
t→0 t ln a t→0 t ln a
ln(1 + s) 1 ln(1 + s) tg(x + t) − tg x
= lim
s→0 s · x · ln a
= · lim = (tg x)′ (x) = lim =
x · ln a s→0 s t→0 t
  1 1 sin(x+t)
применяем sin x
= формулу (5.2.161) = ·1 = cos(x+t) − cos x
x · ln a x · ln a = lim =
t→0 t
⋄ 6.1.13. Производная синуса: sin(x + t) · cos x − sin x · cos(x + t)
= lim =
t→0 t · cos(x + t) cos x
f (x) = sin x =⇒ f ′ (x) = cos x (6.1.13)
sin ((x + t) − x) sin t
= lim = lim =
Для доказательства нам понадобится следующая t→0 t · cos(x + t) cos x t→0 t · cos(x + t) cos x
вспомогательная формула: sin t 1 1 1
= lim ·lim = 1· 2 =
cos t − 1 t→0 t t→0 cos(x + t) cos x cos x cos2 x
lim = 0, (6.1.14)
t→0 t ⋄ 6.1.16. Производная котангенса:
которую можно вывести из первого замечатель- 1
ного предела: f (x) = ctg x =⇒ f ′ (x) = − 2 (6.1.17)
sin x
Действительно,
cos t − 1 −2 sin2 t s= t
lim = lim 2
= 2 =

t→0 t t→0 t t = 2s ctg(x + t) − ctg x
f ′ (x) = lim =
−2 sin s2
sin s t→0 t
= lim = − lim ·lim sin s = −1·0 = 0 cos(x+t) cos x
s→0 2s s→0 s s→0 sin(x+t) − sin x
= lim =
Мы можем теперь доказать (6.1.13): t→0 t
cos(x + t) · sin x − cos x · sin(x + t)
= lim =
sin(x + t) − sin x t→0 t · sin(x + t) sin x
f ′ (x) = lim =
t→0 t sin (x − (x + t)) − sin t
= lim = lim =
sin x · cos t + cos x · sin t − sin x t→0 t · sin(x + t) sin x t→0 t · sin(x + t) sin x
= lim =
t→0 t sin t 1
sin x · (cos t − 1) + cos x · sin t = − lim · lim =
t→0 t t→0 sin(x + t) sin x
= lim =
t→0 t 1 1
sin x · (cos t − 1) cos x · sin t = −1 · 2 =− 2
= lim + lim = sin x sin x
t→0 t t→0 t
⋄ 6.1.17. Производная арксинуса:
cos t − 1 sin t
= sin x · lim + cos x · lim = 1

t→0 t t→0 t
 f (x) = arcsin x =⇒ f ′ (x) = √
применяем формулу (6.1.14)
= и первый 1 − x2
замечательный предел = (6.1.18)
= sin x · 0 + cos x · 1 = cos x Действительно,

⋄ 6.1.14. Производная косинуса: arcsin(x + t) − arcsin x


(arcsin x)′ (x) = lim =
t→0 t
f (x) = cos x =⇒ f ′ (x) = − sin x (6.1.15) + t) − arcsin x
= t = sins s=· arcsin(x
cos(arcsin x) + x · (cos s − 1) =
Действительно, s
= lim =
s→0 sin s · cos(arcsin x) + x · (cos s − 1)
§ 1. Производная 375
 
=
используем формулу
√ = arctg(x + t) − arctg x
cos(arcsin x) = 1 − x2 f ′ (x) = lim =

t→0 t
s
√ s = arctg(x + t) − arctg x
= lim
s→0 sin s · 2
1 − x + x · (cos s − 1)
=
= 2 )·tg s = lim s(1 − x tg s) =
t = (1+x
1−x tg s
s→0 tg s(1 + x2 )
1
= lim sin s √ cos s−1
= s cos s(1 − x tg s) cos s(1 − x tg s)
s→0
s · 1−x +x·
2
s
= lim 2
= lim sin s 2
=
s→0 sin s(1 + x ) s→0
s · (1 + x )
1
= √ = lims→0 cos s · (1 − x · lims→0 tg s)
lims→0 sins s · 1 − x2 + x · lims→0 cos ss−1 = =
  lims→0 sins s · (1 + x2 )
используем первый
= замечательный предел = 1 · (1 − x · 0) 1
и формулу (6.1.14) = =
1 · (1 + x2 ) 1 + x2
1 1
= √ = √
1· 1 − x2 + x · 0 1 − x2 ⋄ 6.1.20. Производная арккотангенса:
⋄ 6.1.18. Производная арккосинуса:
1
′ 1 f (x) = arcctg x =⇒ f ′ (x) = −
f (x) = arccos x =⇒ f (x) = − √ 1 + x2
1−x 2 (6.1.21)
(6.1.19) Действительно,
Действительно,
arccos(x + t) − arccos x arcctg(x + t) − arcctg x
f ′ (x) = lim = f ′ (x) = lim =
t t→0 t

t→0

s = arcctg(x + t) − arcctg x
s = arccos(x + t) − arccos x
= t = (cos = 2 =
s − 1) · x − sin s · sin(arccos x) = t = − 1+x
x+ctg s

s −s · (x + ctg s)
= lim = = lim =
s→0 (cos s − 1) · x − sin s · sin(arccos x) s→0 1 + x2
 
используем формулу
= sin(arccos x) = √1 − x2 = s · (x · sin s + cos s)
= − lim =
s→0 (1 + x2 ) · sin s
s
= lim √ = x · sin s + cos s
s→0 (cos s − 1) · x − sin s · 1 − x2 = − lim =
s→0 (1 + x2 ) · sin s
1 s
= lim cos s−1 sin s
√ = x · lims→0 sin s + lims→0 cos s
s→0
s · x − s · 1 − x2 =− =
(1 + x2 ) · lims→0 sins s
1
= √ = x·0+1 1
lims→0 s · x − lims→0 sins s · 1 − x2
cos s−1 =− =−
  (1 + x2 ) · 1 1 + x2
используем первый
= замечательный предел =
и формулу (6.1.14) Из этих примеров видно, что (как и в случае
1 1 с непрерывностью, о чем мы говорили в теореме
= √ = −√
0·x−1· 1−x2 1 − x2 5.1.73), не все элементарные функции дифферен-
цируемы на своей области определения:
⋄ 6.1.19. Производная арктангенса:
1 Теорема 6.1.21. Среди элементарных функций
f (x) = arctg x =⇒ f ′ (x) = (6.1.20)
1 + x2 все непрерывные1 (и только они) дифференциру-
Действительно, емы на всяком интервале в своей области опре-
деления.

(b) Правила вычисления производных


Арифметические действия с производными.

Теорема 6.1.22. Если функции f и g дифференцируемы в точке x то их сумма, разность и


произведение тоже дифференцируемы в точке x, причем
 ′
C · f (x) = C · f ′ (x), C∈R (6.1.22)
 ′
f + g (x) = f ′ (x) + g ′ (x) (6.1.23)

1 Непрерывные элементарные функции были определены нами на с.351.


376 Глава 6. ПРОИЗВОДНАЯ
 ′
f − g (x) = f ′ (x) − g ′ (x) (6.1.24)
 ′
f · g (x) = f ′ (x) · g(x) + f (x) · g ′ (x) (6.1.25)

f
а если, кроме того g(x) 6= 0 то функция g тоже дифференцируема в точке x, причем
 ′
f f ′ (x) · g(x) − f (x) · g ′ (x)
(x) = (6.1.26)
g g 2 (x)

Доказательство. Докажем (6.1.23):

   
 ′ f (x + t) + g(x + t) − f (x) + g(x)
f + g (x) = lim =

t→0
  t 
f (x + t) − f (x) + g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim + lim =
t→0 t t→0 t t→0 t
= f ′ (x) + g ′ (x)

Аналогично доказывается (6.1.24):

   
 ′ f (x + t) − g(x + t) − f (x) − g(x)
f − g (x) = lim =

t→0
  t 
f (x + t) − f (x) − g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim − lim =
t→0 t t→0 t t→0 t
= f ′ (x) − g ′ (x)

Для (6.1.25) получаем:

 ′ f (x + t) · g(x + t) − f (x) · g(x)  вычтем и прибавим 


f · g (x) = lim = слагаемое f (x) · g(x + t) =
t→0 t
f (x + t) · g(x + t) − f (x) · g(x + t) + f (x) · g(x + t) − f (x) · g(x)
= lim =
t→0 t
 f (x + t) · g(x + t) − f (x) · g(x + t) f (x) · g(x + t) − f (x) · g(x) 
= lim + =
t→0
 t   t 
f (x + t) − f (x) · g(x + t) f (x) · g(x + t) − g(x)
= lim + lim =
t→0
 t t→0
 t 
f (x + t) − f (x) g(x + t) − g(x)
= lim · lim g(x + t) + f (x) · lim =
t→0 t t→0

t→0
 t
по теореме 6.1.5, функция
= g непрерывна, значит = f ′ (x) · g(x) + f (x) · g ′ (x)
limt→0 g(x + t) = g(x)

И, наконец, для (6.1.26):

 f ′ f (x+t) f (x)
g(x+t) − g(x) f (x + t) · g(x) − f (x) · g(x + t)  вычтем и прибавим 
(x) = lim = lim = слагаемое f (x) · g(x) =
g t→0 t t→0 t · g(x + t) · g(x)
f (x + t) · g(x) − f (x) · g(x) + f (x) · g(x) − f (x) · g(x + t)
= lim =
t→0 t · g(x + t) · g(x)
 f (x + t) · g(x) − f (x) · g(x) f (x) · g(x) − f (x) · g(x + t) 
= lim + =
t→0 t · g(x + t) · g(x) t · g(x + t) · g(x)
 
f (x + t) − f (x) g(x + t) − g(x)  1
= lim · g(x) − f (x) · · =
t→0 t t g(x + t) · g(x)
§ 1. Производная 377

 f (x + t) − f (x) g(x + t) − g(x)  1


= lim · g(x) − f (x) · lim · lim =
t→0 t t→0 t t→0 g(x + t) · g(x)
   
по теореме 6.1.5, функция 1 f ′ (x) · g(x) − f (x) · g ′ (x)
= g(x) непрерывна, значит = f ′ (x) · g(x) − f (x) · g ′ (x) · 2
=
limt→0 g(x + t) = g(x) g(x) g(x)2

⋄ 6.1.23. Вычислим производную функции введем обозначения


h(x) = ln x · sin x
Для этого введем обозначения f (x) = ex , g(x) = arctg x,

f (x) = ln x, g(x) = sin x


Тогда h = fg , и по формуле (6.1.25) получаем:
Тогда h = f · g, и по формуле (6.1.25) получаем:
1
h′ (x) = f ′ (x)·g(x)+f (x)·g(x) =
·sin x+ln x·cos x
x f ′ (x) · g(x) − f (x) · g(x)
h′ (x) = =
⋄ 6.1.24. Чтобы найти производную функции g(x)2
1
ex ex · arctg x − ex · 1+x2
h(x) = =
arctg x arctg2 x

Производная композиции. Напомним, что композиция g ◦ f функций g и f (или, что то же


самое, сложная функция, составленная из f и g) была определена нами на с.295 формулой

(g ◦ f )(x) = g(f (x)).

Теорема 6.1.25. Пусть функция f дифференцирема в точке x = a, а функция g дифференцируема


в точке f (a). Тогда сложная функция

h(x) = g(f (x))

дифференцируема в точке x = a, причем

h′ (a) = g ′ (f (a)) · f ′ (a) (6.1.27)

! 6.1.26. Формулу (6.1.27) удобно записывать в виде

(g ◦ f )′ = (g ′ ◦ f ) · f ′ (6.1.28)

Доказательство. Перепишем равенство (6.1.27) по-другому:

g(f (x)) − g(f (a))


lim = g ′ (f (a)) · f ′ (a)
x→a x−a
Чтобы это доказать, нужно взять произвольную последовательность

xn −→ a, xn 6= a (6.1.29)
n→∞

и убедиться, что
g(f (xn )) − g(f (a))
lim = g ′ (f (a)) · f ′ (a) (6.1.30)
n→∞ xn − a
Для этого нужно рассмотреть три случая:
– возможна ситуация, когда для почти всех n ∈ N выполняется неравенство f (xn ) 6= f (a);
– другая ситуация — когда для почти всех n ∈ N выполняется равенство f (xn ) = f (a);
– наконец, последний вариант — если неравенство f (xn ) 6= f (a) выполняется для беско-
нечного набора чисел n ∈ N и одновременно равенство f (xn ) = f (a) выполняется для
бесконечного набора чисел n ∈ N.
378 Глава 6. ПРОИЗВОДНАЯ

1. Рассмотрим сначала первый случай, то есть когда для почти всех n ∈ N выполняется нера-
венство f (xn ) 6= f (a). Тогда можно делить и умножать на f (xn ) − f (a) 6= 0, и мы получим

g(f (xn )) − g(f (a)) g(f (xn )) − g(f (a)) f (xn ) − f (a)
lim = lim · =
n→∞ xn − a n→∞ f (xn ) − f (a) xn − a
!
g(f (xn )) − g(f (a)) f (xn ) − f (a) в левом пределе делаем
= lim · lim = замену yn = f (xn ) −→ f (a) =
n→∞
n→∞ f (xn ) − f (a) n→∞ xn − a yn = f (xn ) 6= f (a)

g(yn ) − g(f (a)) f (xn ) − f (a)


= lim · lim = g ′ (f (a)) · f ′ (a)
n→∞ yn − f (a) n→∞ xn − a

2. Рассмотрим далее второй случай, когда для почти всех n ∈ N выполняется равенство f (xn ) =
f (a). Тогда мы получаем:

g(f (xn )) − g(f (a)) вспоминаем, что g(f (a)) − g(f (a)) 0
lim = f (xn ) = f (a) = lim = lim =0
n→∞ xn − a n→∞ xn − a n→∞ xn − a

А с другой стороны,

f (xn ) − f (a) вспоминаем, что 0


f ′ (a) = lim = f (xn ) = f (a) = lim =0
n→∞ xn − a n→∞ xn − a
И, таким образом,
g(f (xn )) − g(f (a))
lim = 0 = g ′ (f (a)) · f ′ (a)
n→∞ xn − a
3. Наконец, рассмотрим последний вариант, когда неравенство f (xn ) 6= f (a) выполняется для
бесконечного набора чисел n ∈ N и в то же время равенство f (xn ) = f (a) выполняется для беско-
нечного набора чисел n ∈ N. Тогда последовательность xn можно разбить на две подпоследователь-
ности xli и xmk , такие что
f (xli ) 6= f (a), f (xmk ) = f (a).
Для подпоследовательности xli мы получаем то же, что в первом случае:

g(f (xli )) − g(f (a))


lim = g ′ (f (a)) · f ′ (a)
i→∞ xli − a

А для подпоследовательности xmk мы получаем то же, что во втором случае:

g(f (xmk )) − g(f (a))


lim = 0 = g ′ (f (a)) · f ′ (a)
k→∞ xmk − a

Поскольку подпоследовательности xli и xmk разбивают последовательность xn , мы получаем

g(f (xn )) − g(f (a))


lim = g ′ (f (a)) · f ′ (a)
n→∞ xn − a
В итоге, во всех случаях для последовательности (6.1.29) выполняется равенство (6.1.30), а это
нам и нужно было доказать.

⋄ 6.1.27. Вычислим производную функции ⋄ 6.1.28. Чтобы посчитать производную функ-


h(x) = sin(x2 ). Для этого представим ее как ком- ции h(x) = sin2 x, нужно представить ее в виде
позицию двух элементарных функций: композиции элементарных функций

h(x) = sin(x2 ) = g(f (x)), g(y) = sin y, f (x) = x2 h(x) = sin2 x = g(f (x)), g(y) = y 2 , f (x) = sin x

Тогда Тогда
g ′ (y) = cos y, f ′ (x) = 2x g ′ (y) = 2y, f ′ (x) = cos x
Применяя формулу (6.1.56), получаем: и, применяя (6.1.56), получаем:

h′ (x) = g ′ (f (x)) · f ′ (x) = cos(x2 ) · 2x h′ (x) = g ′ (f (x)) · f ′ (x) = 2 sin x · cos x


§ 1. Производная 379

⋄ 6.1.29. Вычислим производную функции Для этого представим нашу функцию, как ком-
h(x) = earctg x . Для этого представим ее как ком- позицию двух функций с помощью формулы
позицию двух элементарных функций: (6.1.31):

h(x) = earctg x = g(f (x)), g(y) = ey , f (x) = arctg x x


h(x) = xx = eln x = ex·ln x
Тогда Тогда
1
g ′ (y) = ey , f ′ (x) =
1 + x2
h(x) = g(f (x)), g(y) = ey , f (x) = x · ln x
Применяя формулу (6.1.56), получаем:
1 Производная функции f вычисляется по форму-
h′ (x) = g ′ (f (x)) · f ′ (x) = earctg x · ле (6.1.28) и равна
1 + x2
Одним из следствий теоремы о производной f ′ (x) = ln x + 1
сложной функции является возможность вычис-
лять производные функций вида f g . Это делает- а для функции g она посчитана в примере 6.1.11:
ся с помощью следующей очевидной формулы:
g ′ (y) = ey
g ln f g g·ln f
f =e =e (6.1.31)
Поэтому
(справедливой, разумеется, только при f > 0).
⋄ 6.1.30. Вычислим производную функции h′ (x) = g ′ (f (x)) · f ′ (x) =
   
h(x) = xx , x>0 = ex·ln x · ln x + 1 = xx · ln x + 1 .

(c) Теоремы о дифференцируемых функциях


Теорема Ферма.
Теорема 6.1.31 (Ферма). 2 Пусть функция f определена на интервале (a, b) и в некоторой точке
ξ ∈ (a, b) достигает экстремума на этом интервале, то есть

f (ξ) = max f (x),


x∈(a,b)

или
f (ξ) = min f (x).
x∈(a,b)

Тогда, если в точке ξ функция f дифференцируема, то

f ′ (ξ) = 0

x
a ξ b

Доказательство. Пусть для определенности

f (ξ) = max f (x)


x∈(a,b)

2 Эта теорема используется в следующем параграфе при доказательстве теоремы Ролля.


380 Глава 6. ПРОИЗВОДНАЯ

то есть
∀x ∈ (a, b) f (x) 6 f (ξ) (6.1.32)
Тогда, с одной стороны,
0

6
(6.1.32)
z }| {
f (x) − f (ξ)  если предел существует,  f (x) − f (ξ)
f ′ (ξ) = lim = то он равен пределу слева = lim >0
x→ξ x−ξ x→ξ−0 x−ξ
| {z }

>
(x < ξ)
0

А, с другой стороны,
0

6
(6.1.32)
z }| {
f (x) − f (ξ)   f (x) − f (ξ)
если предел существует,
f ′ (ξ) = lim = то он равен пределу справа = lim 60
x→ξ x−ξ x→ξ+0 x−ξ
| {z }

<
(x > ξ)
0

Итак, мы получили, что f ′ (ξ) > 0 и, одновременно, f ′ (ξ) 6 0. Значит, f ′ (ξ) = 0.

Теорема Ролля.
Теорема 6.1.32 (Ролля). 3
Пусть функция f определена на отрезке [a, b], причем
(i) f непрерывна на отрезке [a, b],
(ii) f дифференцируема на интервале (a, b),
(iii) f (a) = f (b).
Тогда существует точка ξ ∈ (a, b), такая что
f ′ (ξ) = 0

x
a ξ b

Доказательство. Поскольку функция f непрерывна на отрезке [a, b], по теореме Вейерштрасса об


экстремумах (теорема 4.3.28), f имеет максимум и минимум на [a, b]:
m = f (xm ) = min f (x) M = f (xM ) = max f (x)
x∈[a,b] x∈[a,b]

Рассмотрим два случая:


1) Если m = M , то есть
min f (x) = max f (x),
x∈[a,b] x∈[a,b]

то функция f должна быть постоянной:


∀x ∈ [a, b] m = f (x) = M.
Поэтому ее производная f ′ (x) будет равна нулю в любой точке x ∈ [a, b], и поэтому мы
можем сказать, что найдется точка ξ ∈ (a, b) такая, что f ′ (ξ) = 0.
3 Эта теорема используется в следующих трех параграфах при доказательстве теорем Лагранжа, Коши и Тейлора
§ 1. Производная 381

2) Пусть m 6= M . Заметим, что тогда невозможна ситуация, когда обе точки xm или xM
лежат на концах отрезка [a, b],

xm ∈ {a, b} ∋ xM , (6.1.33)

потому что в этом случае мы бы получили

m = f (xm ) = f (a) = f (b) = f (xM ) = M


| {z }
условие (iii)

(и это был бы случай 1). Из того, что (6.1.33) невозможно, следует, что либо xm , либо xM
лежит внутри отрезка [a, b]:
– либо a < xm < b,
– либо a < xM < b.
(и возможно, верно и то, и другое). Значит, функция f имеет экстремум на интервале
(a, b) (если a < xm < b — то минимум, а если a < xM < b — то максимум). Следовательно,
по теореме Ферма 6.1.31, найдется точка ξ ∈ (a, b) такая, что f ′ (ξ) = 0.
Мы получаем, что в любом случае найдется точка ξ ∈ (a, b) такая, что f ′ (ξ) = 0.

Теорема Лагранжа.
Теорема 6.1.33 (Лагранжа). 4
Пусть функция f определена на отрезке [a, b], причем
(i) f непрерывна на отрезке [a, b],
(ii) f дифференцируема на интервале (a, b).
Тогда существует точка ξ ∈ (a, b), такая что
f (b) − f (a)
f ′ (ξ) = (6.1.34)
b−a

f (b)

f (a)
x
a ξ b

Доказательство. Рассмотрим вспомогательную функцию


f (b) − f (a)
F (x) = f (x) − f (a) − (x − a)
b−a
Эта функция удовлетворяет всем трем условиям теоремы Ролля 6.1.32:
(1) F непрерывна на отрезке [a, b] (по теореме 4.3.14, потому что F (x) составлена из непре-
рывных функций с помощью операции вычитания);
(2) F дифференцируема на интервале (a, b) (по теореме 6.1.22, потому что F составлена из
дифференцируемых функций с помощью операции вычитания);
f (b)−f (a)
(3) F (a) = F (b) (потому что F (a) = f (a) − f (a) − b−a (a − a) = 0 − 0 = 0 и F (b) =
f (b)−f (a) f (b)−f (a)
f (b) − f (a) − b−a (b − a) = f (b) − f (a) − 1 = 0).
4 Эта теорема используется ниже при доказательстве теоремы 6.2.29 (достаточное условие строгой выпуклости).
382 Глава 6. ПРОИЗВОДНАЯ

Значит, по теореме Ролля 6.1.32, найдется такая точка ξ ∈ (a, b), что F ′ (ξ) = 0, и мы получаем:

f (b) − f (a)
0 = F ′ (ξ) = f ′ (ξ) − .
b−a
Иными словами,
f (b) − f (a)
f ′ (ξ) = .
b−a

Теорема Коши об отношении приращений.


Теорема 6.1.34 (Коши). 5
Пусть функции f и g определены на отрезке [a, b], причем
(i) f и g непрерывны на отрезке [a, b],
(ii) f и g дифференцируемы на интервале (a, b),
(iii) g ′ (x) 6= 0 при x ∈ (a, b).
Тогда существует точка ξ ∈ (a, b), такая что

f ′ (ξ) f (b) − f (a)


= (6.1.35)
g ′ (ξ) g(b) − g(a)

Доказательство. Сначала нужно убедиться, что g(a) 6= g(b), то есть что формула (6.1.35) имеет
смысл. Действительно, если бы оказалось, что g(a) = g(b), то это означало бы, что g(x) удовле-
творяет всем трем условиям теоремы Ролля 6.1.32, поэтому нашлась бы точка ξ ∈ (a, b) такая, что
g ′ (ξ) = 0. Это невозможно по условию (iii) нашей теоремы.
Теперь перейдем к доказательству формулы (6.1.35). Рассмотрим вспомогательную функцию

f (b) − f (a)
F (x) = f (x) − f (a) − · (g(x) − g(a))
g(b) − g(a)

Эта функция удовлетворяет всем трем условиям теоремы Ролля 6.1.32:


(1) F непрерывна на отрезке [a, b] (по теореме 4.3.14, потому что F составлена из непрерывных
функций с помощью операции вычитания);
(2) F дифференцируема на интервале (a, b) (по теореме 6.1.22, потому что F составлена из
дифференцируемых функций с помощью операции вычитания);
f (b)−f (a)
(3) F (a) = F (b) (потому что F (a) = f (a) − f (a) − g(b)−g(a) · (g(a) − g(a)) = 0−0 = 0 и
f (b)−f (a)
F (b) = f (b) − f (a) − g(b)−g(a) (g(b) − g(a)) = f (b) − f (a) − f (b)−f
1
(a)
= 0).
Значит, по теореме Ролля 6.1.32, найдется такая точка ξ ∈ (a, b), что F ′ (ξ) = 0, и мы получаем:

f (b) − f (a) ′
0 = F ′ (ξ) = f ′ (ξ) − · g (ξ).
g(b) − g(a)

Иными словами (учитывая что g ′ (ξ) 6= 0),

f ′ (ξ) f (b) − f (a)



= .
g (ξ) g(b) − g(a)

(d) Дифференциальное исчисле-


ние: производная, как фор-
мальная операция
В примерах на с.377 и с.378, как мог заметить чи-
татель, для вычисления производной стандарт-
5 Эта теорема используется ниже при доказательстве теоремы 6.2.1 (правило Лопиталя для предела в точке с

неопределенностью 00 )
§ 1. Производная 383

ной функции h нам приходилось вводить новые 0) если выражение F не содержит переменной
обозначения для «более простых» функций, че- x, то его частная производная по x считается
рез которые h выражается алгебраически или в нулевой:
виде композиции. Например, чтобы вычислить ∂F
= 0, (6.1.37)
производную функции h(x) = sin(x2 ) в приме- ∂x
ре 6.1.27 нам пришлось рассмотреть функции 1) частная производная от переменной x по са-
g(y) = sin y и f (x) = x2 , выписать их производ- мой этой переменной x считается равной еди-
ные и подставить их в формулу (6.1.27). нице:
Этот способ вычислений выглядит довольно ∂x
= 1, (6.1.38)
громоздким в сравнении с приемами, употреб- ∂x
лявшимися для таких задач в школе, где, как, 2) выполняются равенства
наверное, помнит читатель, вычисление произ-
водной оформляется в виде цепочки равенств ∂  α
(иногда длинной цепочки, но все же гораздо ко- x = α · xα−1 (6.1.39)
∂x
роче, чем запись, которую приходится употреб- ∂  x
лять, следуя алгоритму действий, описанному на a = ln a · ax (a > 0) (6.1.40)
∂x
страницах 377 и 378). Например, для функции ∂  x
h(x) = sin(x2 ) можно (используя обозначение e = ex (6.1.41)
∂x
(5.2.133)) записать эту цепочку так: ∂   1
loga x = (x > 0) (6.1.42)
 ′  ′ ∂x x · ln a
∂   1
sin(x2 ) = sin y = ln x = (x > 0) (6.1.43)
y=x2 ∂x x
 

= (sin y)′ 2
· (x2 )′ = cos x2 · 2x. (6.1.36) sin x = cos x (6.1.44)
y=x
∂x
∂  
Естественно поэтому задуматься, отчего школь- cos x = − sin x (6.1.45)
ные приемы приводят к правильным результа- ∂x
там, и как их следует аккуратно описать, чтобы ∂   1
tg x = (6.1.46)
грамотно использовать для вычислений. ∂x cos2 x
Раздел математического анализа, занимаю- ∂   1
ctg x = − 2 (6.1.47)
щийся этими вопросами, называется Исчисление, ∂x sin x
и мы упоминали уже о нем в начале главы 5. ∂   1
arcsin x = √ (6.1.48)
Его идея состоит в том, чтобы поглядеть на про- ∂x 1 − x2
изводную (и на интеграл, о котором мы пого- ∂   1
ворим в следующей главе), как на формальную arccos x = − √ (6.1.49)
∂x 1 − x2
операцию над числовыми выражениями6 . Такой ∂   1
отстраненный взгляд позволяет формализовать arctg x = (6.1.50)
∂x 1 + x2
приемы вычисления производной таким образом, ∂   1
что цепочки вида (6.1.36) становятся результа- arcctg x = − (6.1.51)
∂x 1 + x2
том применения одного общего алгоритма, обос-
нованность которого отдельно доказывается, и 3) для произвольных числовых выражений F и
поэтому не вызывает сомнений. G
В этом параграфе мы опишем этот алгоритм ∂   ∂F ∂G
F +G = + (6.1.52)
(и докажем правомерность его применения), что- ∂x ∂x ∂x
бы иметь формальные основания пользоваться ∂   ∂F ∂G
им в примерах. F −G = − (6.1.53)
∂x ∂x ∂x
∂   ∂F ∂G
F ·G = ·G+F · (6.1.54)
Частная производная числового выраже- ∂x ∂x ∂x
 
ния. Напомним, что приведенные числовые ∂ F ∂F
· G − F · ∂G
выражения были определены нами на с.359. Вся- = ∂x ∂x
(6.1.55)
∂x G G2
кому приведенному числовому выражению F и
любой переменной x можно естественным обра- 4) если F и G — числовые выражения, причем
зом поставить в соответствие некое новое чис- G не содержит переменную x, то для выраже-

ловое выражение, обозначаемое ∂x (F ) или ∂(F ) ния, полученного подстановкой, выполняется
∂x
(если это не приводит к недоразумениям, скоб- равенство
 
ки вокруг F могут не писаться) и называемое
∂ G
производным выражением таким образом, что- y=F ∂G ∂F
бы выполнялись следующие условия: = · (6.1.56)
∂x ∂y y=F ∂x
6 Числовые выражения были определены выше на с.352.
384 Глава 6. ПРОИЗВОДНАЯ
 ′ 1
loga x = (x > 0) (6.1.69)
x · ln a
 ′ 1
! 6.1.35. К этим правилам следует добавить, ln x = (x > 0) (6.1.70)
что операции дифференцирования выражений x
 ′
по другим переменным определяются по анало- sin x = cos x (6.1.71)
гии.  ′
cos x = − sin x (6.1.72)
! 6.1.36. Из формул (6.1.52)-(6.1.56) следует,
 ′ 1
что область допустимых значений переменной tg x = (6.1.73)
для производного выражения подчиняется ра- cos2 x
 ′ 1
венствам: ctg x = − 2 (6.1.74)
      sin x
∂(F + G) ∂F ∂G  ′ 1
D =D ∩D (6.1.57) arcsin x = √ (6.1.75)
∂x ∂x ∂x 1 − x2
     
∂(F − G) ∂F ∂G  ′ 1
D =D ∩D (6.1.58) arccos x = − √ (6.1.76)
∂x ∂x ∂x 1 − x2
       ′
∂(F · G) ∂F ∂G 1
D =D ∩D (6.1.59) arctg x = (6.1.77)
∂x ∂x ∂x 1 + x2
 F   ′ 1
∂( )
D ∂xG = arcctg x = − (6.1.78)
  (6.1.60) 1 + x2
= D ∂F ∂G
∂x ∩ D ∂x \ {x : G = 0}
 ! 3) для произвольных выражений F и G от пере-
∂ G
D y=F
= менной x,
∂x
n  o (6.1.61)  ′

= x : F ∈ D ∂G ∩ D ∂F F + G = F ′ + G′ (6.1.79)
∂y ∂x
 ′
Из (6.1.54) и (6.1.37) следует F − G = F ′ − G′ (6.1.80)
 ′
Теорема 6.1.37. Если числовое выражение G не F · G = F ′ · G + F · G′ (6.1.81)
содержит переменной x, то  ′
F F ′ · G − F · G′
  = (6.1.82)
∂   ∂ G G2
G·F =G· F (6.1.62)
∂x ∂x
4) если F и G — числовые выражения, причем G
не сожержит переменную x, то для выраже-
Производная одноместного числового вы-
ния, полученного подстановкой, выполняется
ражения. Если F – одноместное числовое вы-
равенство
ражение, например, от переменной x, то частную
 ′
производную по этой переменной удобно обозна- ∂G
чать штрихом: G = · F ′. (6.1.83)
y=F ∂y y=F

F′ = F (6.1.63)
∂x
Для этого случая правила вычисления полезно Теорема 6.1.38. Если выражение G не содер-
переписать отдельно: жит переменной x, то
0) если F – нульместное числовое выражение,  ′
то его производная считается нулевой: G · F = G · F ′.

F ′ = 0, (6.1.64) Покажем на примерах, как вычисляется про-


изводная выражения.
1) производная от переменной x считается рав-
ной единице: ⋄ 6.1.39.

x = 1, (6.1.65)  ′  ′  ′  ′
3x2 − x + 5 = 3 x2 − x + 5 =
2) выполняются равенства
= 3 · 2x − 1 + 0 = 6x − 1
 ′
xα = α · xα−1 (6.1.66) ⋄ 6.1.40.
 ′  ′  ′  ′
ax = ln a · ax (a > 0) (6.1.67) x ln x = x · ln x + x · ln x =
 ′ 1
ex = ex (6.1.68) = 1 · ln x + x · = ln x + 1
x
§ 1. Производная 385

⋄ 6.1.41. ⋄ 6.1.47. Следующая формула доказывается с


√ ′ помощью теоремы о сложной функции:
x · sin x = 1
√ ′ √  ′ , (ln |x|)′ =
(6.1.84)
x
= x · sin x + x · sin x =
Для доказательства нужно рассмотреть два слу-
1 √
= √ · sin x + x · cos x чая: при x > 0 получаем:
2 x
1
⋄ 6.1.42. (ln |x|)′ = (ln x)′ =
,
x
 ′
arctg x а при x < 0 получается то же самое:
=
x2 + 1  ′  ′

(arctg x)′ · (x2 + 1) − (x2 + 1)′ · arctg x (ln |x|)′ = ln(−x) = ln y =
y=−x
= =  ′
(x2 + 1)2 1 1
1
= ln y · (−x)′ = · (−1) = .
2 · (x2 + 1) − 2x · arctg x −x x
= x +1 =
(x2 + 1)2 ⊲⊲ 6.1.48. Найдите производную выражений:
1 − 2x · arctg x
= 1) arctg ex ; 7) earcsin ln x ;
(x2 + 1)2
2) sin x2 ; 8) arcsin ln sin x;
⊲⊲ 6.1.43. Продифференцируйте выражения по 3) tg ln x;
переменной x: 9) ln2 (1 + x3 );
4) ln tg x. √
5) ln sin ex ; 10) cos x + x3 ;
1) arctg x + x + arcctg x; √
6) sin earcsin x ; 11) 3 1 + cos x.
2) x arcsin x;
3) arccos x
arcsin x ; Для вычисления производных выражений ви-
 да F G полезно заметить формулу:
4) x2 − 7x + 8 · ex ;
G
9 27 F G = eln F = eG·ln F (6.1.85)
5) ln x3 − x − 2x2 ;
6) sin x+cos x (справедливую при F > 0).
sin x−cos x ;
√ x √ −x
7) ( 2) + ( 5) ; ⋄ 6.1.49.
8) 2x · ln |x|; ′ ′
(xx ) = (6.1.85) = ex·ln x =
9) ex · log2 x;  ′

10) log2 x · ln x · log3 x; = ey = (ey )′ · (x · ln x)′ =
y=x·ln x y=x·ln x
⋄ 6.1.44.  1  
= ex·ln x · 1 · ln x + x · = xx · ln x + 1 .
 ′  ′ x

earctg x = ey = (6.1.83) = ⋄ 6.1.50.
y=arctg x


= (ey )′ · (arctg x)′ = sin x ′
y=arctg x cos x = (6.1.85) =
1 1
 ′
= ey · = earctg x · ′
y=arctg x 1 + x2 1 + x2
= esin x·ln cos x = ey =
y=sin x·ln cos x
⋄ 6.1.45.

 ′ 

′ = (ey )′ · (sin x · ln cos x)′ =
sin2 x = y 2 = (6.1.83) =
y=sin x·ln cos x

y=sin x

= ey · (sin x)′ · ln cos x+
= (y 2 )′ · (sin x)′ = y=sin x·ln cos x
y=sin x   sin x
+ sin x · (ln cos x)′ = cos x ·

= 2y · cos x = 2 sin x · cos x ′ 
y=sin x 
cos x
⋄ 6.1.46. · cos x · ln cos x + sin x · =
cos x
 ′  ′  sin x 
(x2 + x + 1)5 = y 5

= sin2 x 
y=x2 +x+1 = cos x · cos x ln cos x −
cos x

= (6.1.83) = (y 5 )′ · (x2 + x + 1)′ = ⊲⊲ 6.1.51. Вычислите производную:
y=x2 +x+1
  x1
1) lnx x;
= 5 · y4 2
· (2x + 1) = 3) sin x ;
y=x +x+1
√ x
= 5 · (x + x + 1)4 · (2x + 1)
2
2) x x
; 4) xe .
386 Глава 6. ПРОИЗВОДНАЯ

Производная стандартной функции. Объ- То же самое верно для случая разности и про-
ясним теперь, как связана производная число- изведения выражений. Для отношения получа-
P
вого выражения с производной порождаемой им ем: если F = Q , где P и Q – выражения слож-
стандартной функции. Эта связь выражается ности < k, то, во-первых, рассмотрев функции
следующей теоремой, оправдывающей определе- (6.1.89), мы снова по предположению индукции
ние на с.878. получим, что функции p и q дифференцируемы
на интервале (a, b), и их производные опреде-
Теорема 6.1.52. Пусть стандартная функция ляются тождествами (6.1.90). А, во-вторых, из
f определяется непрерывным числовым выра- условия (6.1.87) следует, что функция q вдоба-
жением7 F (при заданных значениях парамет- вок не равна нулю на интервале (a, b):
ров),
f (x) = F . (6.1.86) (a, b) ⊆ {x : q(x) = Q =
6 0}.
Тогда на всяком интервале (a, b) из области Вместе это означает, что функция
определения производной выражения F ,
p(x)
(a, b) ⊆ D(F ′ ). (6.1.87) f (x) =
q(x)
функция f дифференцируема и ее производная дифференцируема на интервале (a, b) и ее про-
определяется на (a, b) производной выражения изводная на этом множестве определяется про-
F: изводной выражения F :
f ′ (x) = F ′ , x ∈ (a, b). (6.1.88)
p′ (x) · q(x) − p(x) · q ′ (x)
Доказательство. Проведем индукцию по слож- f ′ (x) = (6.1.26) = =
q(x)2
ности выражения F . Прежде всего, для элемен-  ′
тарных непрерывных выражений это очевидно. P ′ · Q − P · Q′ P
= 2
= (6.1.82) = = F ′.
Предположим, что это верно для выражений Q Q
сложности, меньшей некоторого k ∈ N∗ . Пусть
Остается рассмотреть (самый сложный) слу-
F – выражение сложности k. Тогда по определе-
чай композиции. Пусть
нию, F будет либо суммой, либо разностью, ли-

бо произведением, либо отношением, либо ком-
F = Q ,
позицией выражений сложности < k. Рассмот- y=P
рим каждый из этих случаев.
где Q – непрерывное элементарное выражение от
Если F = P + Q, где P и Q – выражения
переменной y, а P – непрерывное выражение от
сложности < k, то можно рассмотреть функции
переменной x сложности < k. Условие (6.1.87) в
p(x) = P, q(x) = Q (6.1.89) этом случае принимает вид

и по предположению индукции, они будут диф- (a, b) ⊆ {x : P ∈ D(Q′ )} ∩ D(P).


ференцируемы на интервале (a, b), причем Рассмотрим функции
′ ′
p (x) = P , x ∈ (a, b), p(x) = P, q(y) = Q.
′ ′ (6.1.90)
q (x) = Q , x ∈ (a, b).
По предположению индукции функция p будет
С другой стороны, функция f будет их суммой дифференцируема на интервале (a, b), причем
на (a, b):
p′ (x) = P ′ , x ∈ (a, b),
f (x) = p(x) + q(x), x ∈ (a, b),
а q должна быть непрерывной элементарной
И значит, по теореме 6.1.22, ее производная на функцией из списка на с.351.
этом интервале будет равна сумме производных Чтобы доказать (6.1.88), зафиксируем точку
p и q: x0 ∈ (a, b) и рассмотрим два случая.
1. Предположим сначала, что число p(x0 ) ле-
f ′ (x) = p′ (x) + q ′ (x), x ∈ (a, b) жит во внутренности множества D(Q′ ), то есть
существует интервал (α, β) такой, что
Следовательно, функция f ′ должна задаваться
формулой p(x0 ) ∈ (α, β) ⊆ D(Q′ ). (6.1.91)

Тогда, поскольку Q – выражение сложности < k,


f ′ (x) = (6.1.23) = p′ (x) + q ′ (x) =
по предположению индукции определяемая им
= P ′ + Q′ = (6.1.79) = F ′ . функция q должна быть дифференцируема на
7 Напомним, что непрерывные числовые выражения были определены на с.357.
§ 1. Производная 387

интервале (α, β), и ее производная должна опре- p(xn ) 6= 0. Тогда можно делить и умножать на
деляться выражением Q′ : p(xn ) − p(x0 ) 6= 0, и мы получим

q ′ (y) = Q′ , y ∈ (α, β). f (xn ) − f (x0 ) p(xn )b − p(x0 )b


lim = lim =
n→∞ xn − x0 n→∞ xn − x0
В частности, в точке p(x0 ) должно выполняться
p(xn )b − p(x0 )b p(xn ) − p(x0 )
равенство = lim · =
n→∞ p(xn ) − p(x0 ) xn − x0

p(xn )b − p(x0 )b p(xn ) − p(x0 )
q ′ (p(x0 )) = Q′ . = lim · lim =
y=p(x0 ) n→∞ p(xn ) − p(x0 ) n→∞ xn − x0
 
Теперь по теореме 6.1.25 мы получаем, что ком- p(x ) = 0
= p(x00)b = 0 =
позиция f (x) = q(p(x)) должна быть дифферен-
цируема в точке x0 , и p(xn )b p(xn ) − p(x0 )
= lim · lim =
n→∞ p(xn ) n→∞ xn − x0
f ′ (x0 ) = (6.1.27) = q ′ (p(x0 )) · p′ (x0 ) = = lim p(xn )b−1 ·p′ (x0 ) = 0 · p′ (x0 ) = 0
n→∞ | {z }

= Q′ · P ′ = (6.1.56) = F ′ b>1
y=p(x0 ) x=x0 x=x0
b. После этого рассмотрим случай, когда
Это формула (6.1.88) с подстановкой x = x0 . для некоторой подпоследовательности аргумен-
2. Предположим далее, что число p(x0 ) ∈ тов xnk соответствующая последовательность
D(Q) лежит на границе множества D(Q′ ), то есть значений p(xnk ) обладает свойством p(xnk ) =
не существует интервала (α, β) такого, чтобы вы- p(x0 ). Тогда последовательность xn можно раз-
полнялось (6.1.91). Поскольку Q – непрерывное бить на две подпоследовательности xnk и xni , та-
элементарное выражение, одно из перечислен- кие что
ных списке на с.351, такое возможно только в
случае, если Q есть степенное выражение, в ко- p(xnk ) = p(x0 ), p(xni ) 6= p(x0 )
тором показатель степени больше единицы и не Для подпоследовательности xni мы получаем то

лежит в 2NN∗ −1 , же самое, что и в предыдущем случае:
N∗ f (xni ) − f (x0 ) p(xni )b − p(x0 )b
Q = yb, b ∈ (1, +∞) \ , lim = lim = 0.
2N∗ − 1 i→∞ xni − x0 i→∞ xni − x0

а точка p(x0 ) при этом должна быть нулем: А для xnk получаем:

p(x0 ) = 0. f (xnk ) − f (x0 ) p(xnk )b − p(x0 )b


lim = lim =
k→∞ xnk − x0 k→∞ xnk − x0
Чтобы доказать (6.1.88) при x = x0 , зафиксиру-  
вспоминаем, что
ем какую-нибудь последовательность xn ∈ (a, b), = p(xn ) = p(x0 ) =
k

стремящуюся к x0 , но не попадающую в x0 : p(x0 )b − p(x0 )b 0


= lim = lim =0
k→∞ xnk − x0 k→∞ xnk − x0
xn −→ x0 , xn 6= x0 .
n→∞
Вместе все это означает, что функция f долж-
Рассмотрим соответствующую последова- на иметь нулевую производную в точке x0 :
тельность p(xn ). Поскольку функция p диффе-
f ′ (x0 ) = 0,
ренцируема в точке x0 , она непрерывна в ней, и
поэтому и это то же самое, что дает формула (6.1.88) при
p(xn ) −→ p(x0 ) = 0. x = x0 :
n→∞

Далее нам нужно рассмотреть два случая:
F = Q′ · P ′ =
x=x0 y=p(x0 ) x=x
– возможна ситуация, когда для почти 0

всех n ∈ N выполняется p(xn ) 6= = b · y b−1 · P ′ = 0.
y=p(x0 ) x=x0
p(x0 ) = 0;
– если же это не так, то для некото-
рой подпоследовательности аргумен-
⋄ 6.1.53. Покажем, что при выборе выражения,
тов xnk соответствующая последова-
представляющего функцию, область допусти-
тельность значений p(xnk ) будет обла-
мых значений переменной в его производном вы-
дать свойством p(xnk ) = p(x0 ) = 0.
ражении может меняться. Рассмотрим функ-
a. Рассмотрим сначала первый случай, то цию
есть когда для почти всех n ∈ N выполняется f (x) = x.
388 Глава 6. ПРОИЗВОДНАЯ

Выражение в правой части этой формулы пред- недифференцируема на каких-то интервалах


ставляет собой переменную, поэтому его произ- своей области допустимых значений перемен-
водная будет единицей, и значит, производная ной. Таким свойством обладает выражение
функции f также равна единице:
∂x arcsin sin x
f ′ (x) = = 1, x ∈ R
∂x
График определяемой им функции
Но функцию f можно представить другим выра-
жением: √ h(x) = arcsin sin x
3
f (x) = x3
Производная этого нового выражения будет представляет собой “пилу”:
определена только на множестве (−∞, 0) ∪
(0, +∞), поэтому производная функции f , ес- y
ли ее вычислять таким образом, также должна π
2
быть определена только на этом множестве:
√ − π2 π

2 x
3
′ ∂ x3 1 − 3π −π π
f (x) = = √ · 3 · x2 = 1, x 6= 0 2 2
∂x 3
3( x3 )2 − π2
Таким образом, при изменении выражения, ко-
торым представляется данная функция f , мно-
жество точек, в которых действует формула, вы-
– и видно, что в точках x = π2 + πn, n ∈ Z, эта
ражающая производную функции f , может ме-
функция не дифференцируема. Поэтому ее нель-
няться. Замена данного представления другим
зя назвать дифференцируемой на прямой R. Но
может добавлять или выбрасывать какие-то точ-
при этом составляющие ее функции
ки, в которых формула для производной f будет
верна. f (x) = sin x, g(y) = arcsin y
⋄ 6.1.54. Композиция выражений, дифференци-
руемых на любом интервале своей области до- дифференцируемы на каждом (открытом) ин-
пустимых значений переменной, может быть тервале своей области определения.

§2 Приложения производной
(a) Правило Лопиталя
Теоремы о дифференцируемых функциях позволяют доказать важное правило Лопиталя, с помо-
щью которого удается вычислять “сложные” пределы (которые иначе сосчитать бывает невозмож-
но).

Раскрытие неопределенностей типа 0.


0

Теорема 6.2.1 (правило Лопиталя для предела в точке с неопределенностью 00 ). 8

Пусть функции f и g обладают следующими свойствами:


(i) f и g определены и дифференцируемы в некоторой выколотой окрестности (a − ε, a) ∪
(a, a + ε) точки a,
(ii) limx→a f (x) = 0 и limx→a g(x) = 0,
(iii) g ′ (x) 6= 0 при x 6= a,
f ′ (x)
(iv) существует предел limx→a g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→a g(x) , причем

f (x) f ′ (x)
lim = lim ′ (6.2.92)
x→a g(x) x→a g (x)

8 Эта теорема используется в главе 7 при доказательстве асимптотической формулы Тейлора-Пеано 7.2.35
§ 2. Приложения производной 389

Доказательство. Чтобы доказать (6.2.92), нужно взять произвольную последовательность xn −→


n→∞
a, xn 6= a, и убедиться, что
f (xn ) f ′ (x)
lim = lim ′
n→∞ g(xn ) x→a g (x)

Доопределим функции f и g в точке a формулами


( (
˜ f (x), если x ∈ (a − ε, a) ∪ (a, a + ε) g(x), если x ∈ (a − ε, a) ∪ (a, a + ε)
f (x) = g̃(x) =
0, если x = a 0, если x = a
(6.2.93)
Тогда на каждом отрезке [a, xn ] (с a < xn ) функции f˜(x) и g̃(x) удовлетворяют условиям теоремы
Коши 6.1.34:
1) f˜ и g̃ непрерывны на отрезке [a, xn ],
2) f˜ и g̃ дифференцируемы на интервале (a, xn ),
3) g ′ (x) 6= 0 при x ∈ (a, xn ).
Значит, по теореме Коши 6.1.34, существует точка ξn ∈ (a, xn ), такая что

f˜(xn ) − f˜(a) f ′ (ξn )


= ′
g̃(xn ) − g̃(a) g (ξn )

При этом, по формуле (6.2.93), f˜(a) = g̃(a) = 0, поэтому

f˜(xn ) f ′ (ξn )
= ′ , ξn ∈ (a, xn )
g̃(xn ) g (ξn )

Точно так же на каждом отрезке [xn , a] (с xn < a) существует точка ξn ∈ (xn , a), такая что

f˜(xn ) − f˜(a) f ′ (ξn )


= ′
g̃(xn ) − g̃(a) g (ξn )

Но, по формуле (6.2.93), f˜(a) = g̃(a) = 0, поэтому

f˜(xn ) f ′ (ξn )
= ′ , ξn ∈ (xn , a)
g̃(xn ) g (ξn )

Теперь если мы устремим n к бесконечности, то получим:

ξ ∈ (a, x ),
n n

f (xn ) ˜
f (xn ) ′
f (ξn ) ξ ∈или  f ′ (ξ)
lim = lim = lim ′ =  n (xn , a), = lim ′ =
n→∞ g(xn ) n→∞ g̃(xn ) n→∞ g (ξn ) поэтому ξ→a g (ξ)
ξn −→ a
n→∞
 
неважно, какая f ′ (x)
= буква стоит под = lim
знаком предела x→a g ′ (x)

Как раз это нам и нужно было проверить.


Теорема 6.2.2 (правило Лопиталя для предела в бесконечности с неопределенностью 00 ). Пусть
функции f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы на некотором множестве (−∞, −E) ∪ (E; +∞),
(ii) limx→∞ f (x) = 0 и limx→∞ g(x) = 0,
(iii) g ′ (x) 6= 0 при x ∈ (−∞, −E) ∪ (E; +∞),
f ′ (x)
(iv) существует предел limx→∞ g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→∞ g(x) , причем

f (x) f ′ (x)
lim = lim ′ (6.2.94)
x→∞ g(x) x→∞ g (x)
390 Глава 6. ПРОИЗВОДНАЯ

Доказательство. Вычислим этот предел с помощью теоремы 6.2.1:


′
f (x) x = 1t , t = 1
x

f ( 1t ) f ( 1t )
lim = t −→ 0 = lim 1 = (применяем теорему 6.2.1) = lim  =
x→∞ g(x) t→0 g( t ) t→0 g( 1 ) ′
x→∞ t

f ′ ( 1t ) · − t12 f ′ ( 1t ) t = x1 , x = 1t , f ′ (x)
= lim ′ 1 1
 = lim 1 = x −→ ∞ = lim
t→0 g ( ) · − 2
t t
t→0 g ′ ( )
t
t→0
x→∞ g ′ (x)

   
⋄ 6.2.3. Вычислим предел ln cos x 0 применяем
lim = = теорему 6.2.1 =
x→0 x2 0
sin 2x
lim (ln cos x)′ 1
x→0 arctg 3x cos x · (− sin x)
= lim = lim =
x→0 (x2 )′ x→0 2x
Для этого можно воспользоваться теоремой    
− sin x 0 снова
6.2.1: = lim = = применяем =
x→0 2x cos x 0 теорему 6.2.1
   
sin 2x 0 применяем (− sin x)′ − cos x
lim = = теорему 6.2.1 = = lim = lim =
x→0 arctg 3x 0 x→0 (2x cos x) ′ x→0 2 cos x − 2x sin x
(sin 2x)′ cos 2x · 2 cos 0 · 2 −1 1
= lim = lim 3 = 3 = = =−
x→0 (arctg 3x)′ x→0 2−0 2
1+9x2 1+0
1·2 2
= = ⋄ 6.2.6. Теперь пример, где применяется теоре-
3 3
ма 6.2.2:
⋄ 6.2.4. Правило Лопиталя можно применять
π    
несколько раз подряд. Покажем это на следую- 2 − arctg x 0 применяем
lim  = = теорему 6.2.2 =
щем примере: x→+∞ ln 1 + x12 0
    1
1 − cos x 0 применяем
( π2 − arctg x)′ − 1+x 2
lim = = = lim ′ = lim =
теорему 6.2.1 = x→+∞ ln 1 + 1 1
· − x23
x→0 x2 0 x2
x→+∞
1+ x12
 
(1 − cos x)′ sin x 0 1 x2 + 1 x3 x
= lim = lim = = = lim · · = lim = +∞
x→0 (x2 )′ x→0 2x 0 x→+∞ 1 + x2 x2 2 x→+∞ 2
 
снова (sin x)′ cos x 1
= применяем = lim = lim =
теорему 6.2.1 x→0 (2x)′ x→0 ⊲⊲ 6.2.7. Вычислите пределы:
2 2
1. limx→1 sin 3πx
sin 2πx .
⋄ 6.2.5. Еще один пример, где правило Лопита- tg x−x
ля применяется несколько раз: 2. limx→0 sin x−x2 .
tg x−x
3. limx→0 sin x−x .


Раскрытие неопределенностей типа ∞.


Теорема 6.2.8 (правило Лопиталя для предела в точке с неопределенностью ∞ ). Пусть функции
f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы в некоторой окрестности точки a,
(ii) limx→a f (x) = ∞ и limx→a g(x) = ∞,
(iii) g ′ (x) 6= 0 в некоторой выколотой окрестности точки a,
f ′ (x)
(iv) существует предел limx→a g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→a g(x) , причем

f (x) f ′ (x)
lim = lim ′ (6.2.95)
x→a g(x) x→a g (x)
§ 2. Приложения производной 391

f ′ (x)
Доказательство. 1. Рассмотрим сначала случай, когда предел limx→a g′ (x) конечен:

f ′ (x)
lim =A∈R (6.2.96)
x→a g ′ (x)

Зафиксируем интервал (a − δ, a), на котором g ′ (x) 6= 0. В силу теоремы 6.2.22, функция g(x) должна
быть строго монотонна на (a − δ, a). Поэтому, если взять возрастающую последовательность
x1 < x2 < ... < xn < ... < a, xn −→ a
n→∞

то мы получим, что g(xn ) – строго монотонная бесконечно большая последовательность:


 
g(xn ) −→ +∞, g(x1 ) < g(x2 ) < ... < g(xn ) < ... или g(x1 ) > g(x2 ) > ... > g(xn ) > ...
n→∞

Положив
yn = g(xn ), zn = f (xn )
мы теперь получим, что последовательности yn и zn удовлетворяют всем условиям теоремы Штоль-
ца 4.2.74: во первых,
 
yn −→ ∞, y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ...
n→∞
и во вторых,

zn − zn−1 f (xn ) − f (xn−1 )


lim = lim =
n→∞ yn − yn−1 n→∞ g(xn ) − g(xn−1 )
 
по теореме Коши 6.1.34, f ′ (ξn )
= ∃ξn ∈ (xn−1 , xn ) f (xn )−f (xn−1 ) = f ′ (ξn ) = lim = (2.2) = A
g(xn )−g(xn−1 ) g′ (ξn ) n→∞ g ′ (ξn )

Значит, по теореме Штольца 4.2.74,


f (xn ) zn zn − zn−1
lim = lim = lim =A
n→∞ g(xn ) n→∞ yn n→∞ yn − yn−1

Это верно для всякой возрастающей последовательности xn −→ a, значит, по теореме 4.4.27,


n→∞

f (x)
lim =A
x→a−0 g(x)
Аналогично получаем
f (x)
lim =A
x→a+0 g(x)

2. Рассмотрим теперь случай, когда


f ′ (x)
lim =∞
x→a g ′ (x)


Тогда fg′ (x)
(x)
6= 0 в некоторой выколотой окрестности точки a. (Это следует, например, из определения
предела по Коши.) Значит, f ′ (x) 6= 0 в некоторой выколотой окрестности точки a. Таким образом,
получается:
1) f ′ (x) 6= 0 в некоторой выколотой окрестности точки a, и
g′ (x)
2) limx→a f ′ (x) =0
То есть выполняется посылка теоремы, но только с переставленными символами f и g, и с условием,
что предел отношения производных конечен. Поскольку для случая конечного предела теорема уже
доказана, имеем
g(x) g ′ (x)
lim = 0 = lim ′
x→a f (x) x→a f (x)
откуда
f (x) f ′ (x)
lim = ∞ = lim ′
x→a g(x) x→a g (x)
392 Глава 6. ПРОИЗВОДНАЯ


Теорема 6.2.9 (правило Лопиталя для предела в бесконечности с неопределенностью ∞ ). Пусть
функции f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы на некотором множестве (−∞, −E) ∪ (E, +∞),
(ii) limx→∞ f (x) = ∞ и limx→∞ g(x) = ∞,
(iii) g ′ (x) 6= 0 при x ∈ (−∞, −E) ∪ (E, +∞),
f ′ (x)
(iv) существует предел limx→∞ g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→∞ g(x) , причем

f (x) f ′ (x)
lim = lim ′ (6.2.97)
x→∞ g(x) x→∞ g (x)

Доказательство. Здесь используется тот же прием, что и в доказательстве теоремы 6.2.2:


′
f (x) x = 1t , t = 1
x

f ( 1t ) f ( 1t )
lim = t −→ 0 = lim 1 = (применяем теорему 6.2.8) = lim  =
x→∞ g(x) t→0 g( t ) t→0 g( 1 ) ′
x→∞ t

f ′ ( 1t ) · − t12 f ′ ( 1t ) t = x1 , x = 1t , f ′ (x)
= lim ′ 1 1
 = lim 1 = x −→ ∞ = lim
t→0 g ( ) · − 2
t t
t→0 g ′ ( )
t
t→0
x→∞ g ′ (x)

⋄ 6.2.10. Вычислим предел ln x  ∞   применяем 


lim = = теорему 6.2.9 =
x→+∞ x ∞
ctg x 1
lim (ln x)′ x
x→+0 ln x = lim = lim = 0.
x→+∞ (x)′ x→+∞ 1
Для этого воспользуемся теоремами 6.2.8 и 6.2.1:
⋄ 6.2.12. Вычислим предел
ctg x  ∞   применяем 
lim = = теорему 6.2.8 = ∞  
x→+0 ln x ∞ x3 применяем
lim = = теорему 6.2.9 =
(ctg x)′ − sin12 x x→+∞ e x ∞
= lim = lim 1 = (x3 )′ 3x2 ∞
x→+0 (ln x)′ x→+0
   x = lim = lim = =
 x→+∞ (ex )′ x→+∞ ex ∞
x 0 применяем  
= − lim 2 = = теорему 6.2.1 = снова (3x2 )′
x→+0 sin x 0 = применяем = lim =
x→+∞ (ex )′
(x)′ 1 теорему 6.2.9
 
= − lim
x→+0 (sin2 x)′
= − lim
x→+0 2 sin x cos x
= 6x  ∞  еще раз
  = lim x = = применяем =
1
x→+∞ e ∞ теорему 6.2.9
= − = −∞  
+0 (6x)′ 6 6
= lim x ′
= lim x = =0
x→+∞ (e ) x→+∞ e ∞
⋄ 6.2.11. Вычислим предел
⊲⊲ 6.2.13. Вычислите пределы:
ln x 2
lim 1. limx→∞ ln ln(1+x )
.
x→+∞ x ( 2 −arctg x)
π

ln(x−a)
2. limx→a ln(ex −ea ) .
Для этого воспользуемся теоремой 6.2.9:
ex +x2 +x
3. limx→+∞ x3 −ex .

Раскрытие неопределенностей 0·∞, ∞−∞, 00 , 1∞ , ∞0 . Покажем на примерах, как с помощью


правил Лопиталя можно вычислять пределы с такими неопределенностями.
§ 2. Приложения производной 393

2 2
x· ln cos x ln cos x
⋄ 6.2.14 (неопределенность вида 0 · ∞). = elimx→0 cos sin2 x = elimx→0 cos x·limx→0 sin2 x =
ln cos x
 0  
применяем
ln x ∞ = e1·limx→0 sin2 x = e 0 = теорему 6.2.1 =
lim x · ln x = (0 · ∞) = lim 1 = =
x→+0 x→+0 ∞ limx→0 (ln cos x)′ − sin x
cos x

 
x
1
=e (sin2 x)′ = elimx→0 2 sin x cos x =
применяем (ln x)′ 1
= теорему 6.2.8 = lim 1 ′
= lim x1 = −1
= elimx→0 2 cos2 x = e
−1
2 = √
x→+0 ( ) x→+0 − 2
x x e
= − lim x = 0
x→+0
⋄ 6.2.18 (неопределенность вида ∞0 ).
⋄ 6.2.15 (неопределенность вида ∞ − ∞).
1  1
  lim (ln x) x = ∞0 = lim eln(ln x) x =
1 x→+∞ x→+∞
lim − tg x = (∞ − ∞) = ln(ln x) ln(ln x) ∞
x→ π2 cos x = lim e =e x x limx→+∞
= e∞ =
    x→+∞
1 − sin x 0 применяем   x))′
= limπ = = теорему 6.2.1 = применяем limx→+∞ (ln(ln(x)′
x→ 2 cos x 0 = теорему 6.2.9 = e =
(1 − sin x)′ − cos x 1
x ln x 1
= limπ ′
= limπ =0 = elimx→+∞ 1 = elimx→+∞ x ln x = e0 = 1
x→ 2 (cos x) x→ 2 − sin x

⋄ 6.2.16 (неопределенность вида 00 ). ⊲⊲ 6.2.19. Вычислите пределы:


1. limx→+∞ x2 · e−2x .
 x
lim xx = 00 = lim eln(x ) = lim ex ln x =
x→+0 x→+0 x→+0
 ln x · ln(x − 1).
2. limx→1+0
1
  3. limx→0 − ex1−1 .
x
= elimx→+0 x ln x = применяем 0
пример 3.1 = e = 1

4. limx→+∞ ( x− ln x).
x
5. limx→+0 ln x1 .
⋄ 6.2.17 (неопределенность вида 1∞ ). 1
6. limx→+∞ (ln 2x) ln x .
 2
  1
lim cos xctg
2
x
= (1∞ ) = lim e
ln cos xctg x
= 7. limx→0 1 + sin2 x tg2 x .
x→0 x→0 8. limx→1−0 (1 − x)ln x .
2 2
= lim ectg x ln cos x
= elimx→0 ctg x ln cos x 1
= 9. limx→+0 (ln(x + e)) x .
x→0

(b) Построение графика


Монотонность и экстремум.

Теорема 6.2.20 (достаточное условие монотонности). Пусть f – дифференцируемая функция на


интервале (a; b). Тогда
(a) если ее производная положительна всюду на (a; b),

f ′ (x) > 0, x ∈ (a; b), (6.2.98)

то f (строго) возрастает на (a; b),


(b) если ее производная отрицательна всюду на (a; b),

f ′ (x) < 0, x ∈ (a; b), (6.2.99)

то f (строго) убывает на (a; b).

Доказательство. 1. Пусть выполняется (6.2.98). Тогда для любых x, y ∈ (a; b) таких что x < y
можно по теореме Лагранжа 6.1.33 подобрать точку ξ ∈ (x; y) такую, что

f (y) − f (x)
0 < f ′ (ξ) = ⇒ 0 < f (y) − f (x) ⇒ f (x) < f (y).
y−x
| {z }
<

2. Наоборот, если выполняется (6.2.99), то для любых x, y ∈ (a; b) таких что x < y можно по
394 Глава 6. ПРОИЗВОДНАЯ

теореме Лагранжа 6.1.33 подобрать точку ξ ∈ (x; y) такую, что

f (y) − f (x)
0 > f ′ (ξ) = ⇒ 0 > f (y) − f (x) ⇒ f (x) > f (y).
y−x
| {z }

<
0

Теорема 6.2.21 (о нестрогой монотонности). Пусть f – дифференцируемая функция на интервале


(a; b). Тогда
(a) f неубывает на (a; b) в том и только в том случае, если ее производная неотрицательна
всюду на (a; b):
f ′ (x) > 0, x ∈ (a; b)
(b) f невозрастает на (a; b) в том и только в том случае, если ее производная неположи-
тельна всюду на (a; b):
f ′ (x) 6 0, x ∈ (a; b)
Доказательство. Мы докажем утверждение (a), оставив читателю выполнить то же самое для (b)
по аналогии. Если f неубывает,
 
∀x, y ∈ (a; b) x<y =⇒ f (x) 6 f (y)

то, переходя при вычислении производной в точке x ∈ (a; b) к одностороннему пределу, мы получим:
0
>
z }| {
′ f (y) − f (x) f (y) − f (x)
f (x) = lim = lim >0
y→x y−x y→x+0 y−x
| {z }
<

Наоборот, если в любой точке x ∈ (a; b) производная неотрицательна, то для любых x, y ∈ (a; b)
таких, что x < y, подобрав по теореме Лагранжа 6.1.33 точку ξ ∈ (a; b) со свойством (6.1.34), мы
получим:
f (y) − f (x)
= f ′ (ξ) > 0 =⇒ f (y) − f (x) > 0 =⇒ f (x) 6 f (y)
y−x
| {z }
<

Теорема 6.2.22 (о строгой монотонности). 9 Пусть f – дифференцируемая функция на интервале


(a, b), причем ее производная нигде не обращается в нуль:

∀x ∈ (a, b) f ′ (x) 6= 0 (6.2.100)

Тогда f строго монотонна на (a, b), а именно:


— либо, f ′ (x) > 0 всюду на (a, b), и в этом случае f возрастает на (a, b):
 
∀x, y ∈ (a; b) x < y =⇒ f (x) < f (y)

— либо, f ′ (x) < 0 всюду на (a, b), и в этом случае f убывает на (a, b):
 
∀x, y ∈ (a; b) x < y =⇒ f (x) > f (y) .

Доказательству этой теоремы мы предпошлем две леммы.


9 Теорема 6.2.22 используется ниже при доказательстве правила Лопиталя для раскрытия неопределенностей типа


§ 2. Приложения производной 395

Лемма 6.2.23. В условиях теоремы 6.2.22 для любых трех точек x, y, z ∈ (a; b), связанных нера-
венством
x < y < z,
выполняется следующее:
(a) условие f (x) < f (z) влечет за собой условие f (x) < f (y) < f (z):

f (x) < f (z) =⇒ f (x) < f (y) < f (z)

(b) условие f (x) > f (z) влечет за собой условие f (x) > f (y) > f (z):

f (x) > f (z) =⇒ f (x) > f (y) > f (z).

Доказательство. Мы докажем утверждение (a) (а (b) читатель сможет доказать по аналогии).


Пусть f (x) < f (z). Нам нужно показать, что число f (y) лежит в интервале (f (x); f (z)):

f (y) ∈ f (x); f (z)

Если это не так, то либо f (y) лежит ниже этого интервала, то есть f (y) 6 f (x), либо, наоборот,
выше, то есть f (y) > f (z). Убедимся, что ни то, ни другое невозможно.
1. Предположим, что f (y) 6 f (x). Если f (y) = f (x), то по теореме Ролля 6.1.32 найдется точка
ξ ∈ (x; y) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) < f (x). Тогда, если обозначить C = f (x), то мы получим

f (y) < f (x) < f (z),


|{z}
k
C

и, по теореме Коши о промежуточном значении 4.3.22, на интервале (y; z) должна найтись такая
точка c ∈ (y; z), что
f (c) = C = f (x)
Теперь опять по теореме Ролля 6.1.32 должна существовать точка ξ ∈ (x; c) такая, что

f ′ (ξ) = 0,

и это снова противоречит условию (6.2.100). Мы получаем, что неравенство f (y) 6 f (x) невозможно.
2. Проверим, что будет, если f (y) > f (z). Если f (y) = f (z), то по теореме Ролля 6.1.32 найдется
точка ξ ∈ (y; z) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) > f (z). Тогда, если обозначить C = f (z), то мы получим

f (x) < f (z) < f (y),


|{z}
k
C

и, по теореме Коши о промежуточном значении 4.3.22, на интервале (x; y) должна найтись такая
точка c ∈ (x; y), что
f (c) = C = f (z)
Теперь опять по теореме Ролля 6.1.32 должна существовать точка ξ ∈ (c; z) такая, что

f ′ (ξ) = 0,

и это снова противоречит условию (6.2.100). Мы получаем, что неравенство f (y) > f (x) тоже невоз-
можно.
Лемма 6.2.24. В условиях теоремы 6.2.22 пусть α, β ∈ (a, b) – произвольные точки, связанные
неравенством
α < β,
Тогда:
396 Глава 6. ПРОИЗВОДНАЯ

(a) если f (α) < f (β), то функция f возрастает на интервале (α; β):
  
f (α) < f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) < f (y)

(b) если f (α) > f (β), то функция f убывает на интервале (α; β):
  
f (α) > f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) > f (y)

(c) равенство f (α) = f (β) невозможно.


Доказательство. 1. Если f (α) < f (β), то мы получаем логическую цепочку:

f (α) < f (β), α<x<β


| {z }
лемма 6.2.23(a) ⇓
f (α) < f (x) < f (β), x<y<β
| {z }
лемма 6.2.23(a) ⇓
f (x) < f (y) < f (β)
| {z }

f (x) < f (y)
2. Наоборот, если f (α) > f (β), то мы получаем цепочку:

f (α) > f (β), α<x<β


| {z }
лемма 6.2.23(b) ⇓
f (α) > f (x) > f (β), x<y<β
| {z }
лемма 6.2.23(b) ⇓
f (x) > f (y) > f (β)
| {z }

f (x) > f (y)
3. Остается убедиться, что равенство f (α) = f (β) невозможно. Действительно, если бы оно
выполнялось, то мы получили бы по теореме Ролля 6.1.32, что f ′ (ξ) = 0 для некоторого ξ ∈ (α, β),
а это противоречит условию (6.2.100).
Доказательство теоремы 6.2.22. Зафиксируем произвольные точки α, β ∈ (a, b), связанные нера-
венством
α<β
По лемме 6.2.24(c), f (α) 6= f (β), значит должно быть либо f (α) < f (β), либо f (α) > f (β). Рассмот-
рим каждый случай отдельно.
1. Пусть f (α) < f (β). Тогда по лемме 6.2.24(a), функция f возрастает на интервале (α; β). Если
теперь выбрать какие-нибудь точки x, y так, чтобы

a<x<α<β<y<b (6.2.101)

то снова по лемме 6.2.24 функция f должна быть строго монотонной на интервале (x; y). При
этом, как мы уже поняли, f возрастает на меньшем интервале (α; β), значит, она возрастает и на
большем интервале (x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (6.2.101),
мы получаем, что f возрастает на всем интервале (a; b).
Далее получается цепочка:

f возрастает на интервале (a; b)

⇓ теорема 6.2.21(a)

f (x) > 0, x ∈ (a; b)
§ 2. Приложения производной 397

⇓ (6.2.100)

f ′ (x) > 0, x ∈ (a; b)

2. Пусть наоборот, f (α) > f (β). Тогда по лемме 6.2.24(b), функция f убывает на интервале
(α; β). Если теперь выбрать какие-нибудь точки x, y так, чтобы выполнялось (6.2.101), то снова по
лемме 6.2.24 функция f должна быть строго монотонной на интервале (x; y). При этом, как мы
уже поняли, f убывает на меньшем интервале (α; β), значит, она убывает и на большем интервале
(x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (6.2.101), мы получаем, что
f убывает на всем интервале (a; b).
Далее получается цепочка:
f убывает на интервале (a; b)

⇓ теорема 6.2.21(b)

f ′ (x) 6 0, x ∈ (a; b)

⇓ (6.2.100)

f ′ (x) < 0, x ∈ (a; b)

• Точка x0 называется
– точкой строгого локального максимума функции f , если в некоторой выколотой
окрестности (x0 − δ; x0 ) ∪ (x0 ; x0 + δ) точки x0 выполняется неравенство

f (x) < f (x0 ), x ∈ (x0 − δ; x0 ) ∪ (x0 ; x0 + δ)

– точкой строгого локального минимума функции f , если в некоторой выколотой


окрестности (x0 − δ; x0 ) ∪ (x0 ; x0 + δ) точки x0 выполняется неравенство

f (x) > f (x0 ), x ∈ (x0 − δ; x0 ) ∪ (x0 ; x0 + δ)

– точкой локального экстремума функции f , если она является точкой строгого


локального минимума, или строгого локального максимума.

Теорема 6.2.25 (необходимое условие локального экстремума). Если функция f имеет в точке
x0 локальный экстремум и дифференцируема в этой точке, то

f ′ (x0 ) = 0

Доказательство. В точке x0 функция f достигает максимума или минимума на некотором интер-


вале (x0 − δ; x0 + δ), значит, по теореме Ферма 6.1.31, f ′ (x0 ) = 0.

Теорема 6.2.26 (достаточное условие локального экстремума). Пусть функция f дифференцируема


в некоторой окрестности (x0 − δ; x0 + δ) точки x0 . Тогда
– если f ′ (x) > 0 при x ∈ (x0 − δ; x0 ), и f ′ (x) < 0 при x ∈ (x0 ; x0 + δ) (то есть при переходе
через точку x0 производная меняет знак с + на −), то x0 – точка строгого локального
максимума;
– если f ′ (x) < 0 при x ∈ (x0 − δ; x0 ), и f ′ (x) > 0 при x ∈ (x0 ; x0 + δ) (то есть при переходе
через точку x0 производная меняет знак с − на +), то x0 – точка строгого локального
минимума.

Доказательство. Пусть при переходе через точку x0 производная меняет знак с − на +. Тогда
по теореме 6.2.22, на интервале (x0 − δ; x0 ) функция f строго убывает, а на интервале (x0 ; x0 + δ)
функция f строго возрастает, значит x0 – точка локального минимума.
Аналогично рассматривается случай, когда при переходе через точку x0 производная меняет
знак с − на +.
398 Глава 6. ПРОИЗВОДНАЯ

Выпуклость и перегиб. Пусть функция f определена на интервале (a; b) и пусть a < α < β < b.
Проведем хорду через точки (α; f (α)) и (β; f (β)) на графике функции f :

y
y = f (x)

x
a α β b

Уравнение этой хорды имеет вид

f (β) · (x − α) + f (α) · (β − x)
y=
β−α

Теорема 6.2.27. Для функции f : (a, b) → R следующие условия эквивалентны:


(i) для любых двух точек α, β : a < α < β < b график функции f на интервале (α, β) лежит
ниже хорды:

f (β) · (x − α) + f (α) · (β − x)
f (x) < , a<α<x<β<b (6.2.102)
β−α

y
y = f (x)

x
a α β b

(ii) для любых двух точек α 6= β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство

f (λ · α + (1 − λ) · β) < λ · f (α) + (1 − λ) · f (β) (6.2.103)

• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вниз на интервале (a, b).

Доказательство. 1. (i)⇒(ii). Пусть выполнено (i) и пусть a < α < β < b. Зафиксируем λ ∈ (0, 1).
Тогда, положив
x = λ · α + (1 − λ) · β
мы получим:
β−x β − λ · α − (1 − λ) · β −λ · α + λ · β λ · (β − α)
= = = = λ,
β−α β−α β−α β−α
x−α λ · α + (1 − λ) · β − α (1 − λ) · β − (1 − λ) · α (1 − λ) · (β − α)
= = = = 1 − λ,
β−α β−α β−α β−α
поэтому

f (β) · (x − α) + f (α) · (β − x)
f (λ · α + (1 − λ) · β) = f (x) < (6.2.102) < =
β−α
x−α β−x
= ·f (β) + ·f (α) = λ · f (α) + (1 − λ) · f (β).
β−α β−α
| {z } | {z }
1−λ λ
§ 2. Приложения производной 399

Это доказывает неравенство (6.2.103) для случая α < β. Если β < α, то по уже доказанному мы
получим
f (λ · β + (1 − λ) · α) < λ · f (β) + (1 − λ) · f (α), λ ∈ (0, 1).
Обозначив t = 1 − λ, мы превратим это неравенство в такое:

f ((1 − t) · β + t · α) < (1 − t) · f (β) + t · f (α), t ∈ (0, 1).

И теперь если сделать новую замену λ = t, мы получим

f ((1 − λ) · β + λ · α) < (1 − λ) · f (β) + λ · f (α), λ ∈ (0, 1).

и это будет то же неравенство (6.2.103), но уже с β < α.


2. (ii)⇒(i). Пусть выполнено (ii) и пусть a < α < β < b. Зафиксируем x ∈ (α, β). Тогда, положив
β−x
λ=
β−α
мы получим:
β−x x−α
1−λ=1− = ,
β−α β−α
β−x x−α β ·α−x·α+x·β −α·β
λ · α + (1 − λ) · β = ·α+ ·β = = x,
β−α β−α β−α
поэтому

f (x) = f (λ · α + (1 − λ) · β) < (6.2.103) < λ · f (α) + (1 − λ) · f (β) =


x−α β−x f (β) · (x − α) + f (α) · (β − x)
= ·f (β) + ·f (α) =
β−α β−α β−α
| {z } | {z }
1−λ λ

Точно так же доказывается


Теорема 6.2.28. Для функции f : (a, b) → R следующие условия эквивалентны:
(i) для любых двух точек α, β : a < α < β < b график функции f на интервале (α, β) лежит
выше хорды:
f (β) · (x − α) + f (α) · (β − x)
< f (x), a<α<x<β<b (6.2.104)
β−α

y = f (x)

x
a α β

(ii) для любых двух точек α, β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство

f (λ · α + (1 − λ) · β) > λ · f (α) + (1 − λ) · f (β) (6.2.105)

• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вверх на интервале (a, b).
Теорема 6.2.29 (достаточное условие выпуклости). Пусть функция f дважды дифференцируема
на интервале (a; b). Тогда
– если f ′′ (x) < 0 при x ∈ (a; b), то функция f выпукла вверх на интервале (a; b);
400 Глава 6. ПРОИЗВОДНАЯ

– если f ′′ (x) > 0 при x ∈ (a; b), то функция f выпукла вниз на интервале (a; b).
Доказательство. 1. Пусть f ′′ (x) < 0 при x ∈ (a; b). Тогда для любых α, β, x таких, что
a < α < x < β < b,
мы получим:
f (β) · (x − α) + f (α) · (β − x) f (β) · (x − α) + f (α) · (β − x) − f (x) · (β − α)
− f (x) = =
β−α β−α
f (β) · (x − α) + f (α) · (β − x) − f (x) · (β − α) + f (x) · (x − x)
= =
β−α
[f (β) − f (x)] · (x − α) − [f (x) − f (α)] · (β − x)
= =
β−α
 
применяем теорему Лагранжа 6.1.33
для f на отрезках [x; β] и [α; x]:
 
= найдутся θ ∈ [x; β] и η ∈ [α; x]

 =
такие что f (β) − f (x) = f (θ) · (β − x)

и f (x) − f (α) = f (η) · (x − α)

f ′ (θ) · (β − x) · (x − α) − f ′ (η) · (x − α) · (β − x) [f ′ (θ) − f ′ (η)] · (β − x) · (x − α)


= = =
β−α β−α
0 0 0

>

>

>
снова применяем теорему Лагранжа 6.1.33
! z }| { z }| { z }| {
но уже для f ′ (x) на отрезке [η; θ]: ′′ (θ − η) · (β − x) · (x − α)
= найдется ξ ∈ [η; θ] = f (ξ) · <0
такое что f ′ (θ) − f ′ (η) = f ′′ (ξ) · (θ − η)
| {z } β−α
| {z }

>

<
0
0


f (β) · (x − α) + f (α) · (β − x)
< f (x).
β−α
То есть функция f выпукла вверх на интервале (a; b).
2. Наоборот, если f ′′ (x) > 0 при x ∈ (a; b), то точно такими же выкладками мы получим
0 0 0
>

>

>

z }| { z }| { z }| {
f (β) · (x − α) + f (α) · (β − x) ′′ (θ − η) · (β − x) · (x − α)
− f (x) = ... = f (ξ) · >0
β−α | {z } β−α
| {z }
<

<

0
0


f (β) · (x − α) + f (α) · (β − x)
> f (x).
β−α
И это будет означать, что функция f выпукла вниз на интервале (a; b).
• Точка x0 называется точкой перегиба функции f , если при переходе через x0 выпуклость
вверх меняется на выпуклость вниз (или наоборот). Иными словами, имеется некоторая
окрестность (x0 − δ; x0 + δ) такая, что на интервале (x0 − δ; x0 ) функция f выпукла вверх,
а на интервале (x0 ; x0 + δ) она выпукла вниз (или наоборот, на (x0 − δ; x0 ) функция f
выпукла вниз, а на интервале (x0 ; x0 + δ) она выпукла вверх).
Теорема 6.2.30 (о точках перегиба). Пусть функция f дважды дифференцируема на интервале
(a; b), причем ее вторая производная f ′′ непрерывна на (a; b). Тогда если точка x0 ∈ (a; b) – точка
перегиба функции f , то f ′′ (x0 ) = 0.
Доказательство. Предположим, что f ′′ (x0 ) 6= 0, тогда либо f ′′ (x0 ) < 0, либо f ′′ (x0 ) > 0. Если
f ′′ (x0 ) < 0, то, по теореме о сохранении знака 4.3.20, f ′′ (x) < 0 для всех x из некоторой окрестности
(x0 − δ; x0 + δ) точки x0 . Поэтому по теореме 6.2.29 этой главы, f будет выпукла вверх всюду в
окрестности (x0 −δ; x0 +δ), и значит x0 не может быть точкой перегиба. Аналогично, если f ′′ (x0 ) > 0,
то по теореме о сохранении знака 4.3.20, f ′′ (x) > 0 для всех x из некоторой окрестности (x0 − δ; x0 +
δ) точки x0 . Поэтому по теореме 6.2.29 этой главы, f будет выпукла вверх всюду в окрестности
(x0 − δ; x0 + δ), и опять x0 не может быть точкой перегиба.
§ 2. Приложения производной 401

Следующее наблюдение довольно неожиданно.


Теорема 6.2.31. Если функция f выпукла (вниз или вверх) на интервале (a, b), то она непрерывна
на (a, b).
Доказательство. Будем считать, что f выпукла вниз. Зафиксируем точку x ∈ (a, b) и число h > 0
так, чтобы
a < x − h < x < x + h < b.
Покажем, что если
λn ∈ (0, 1) & λn −→ 0 (6.2.106)
n→∞
то
f (x − λn · h) −→ f (x) & f (x + λn · h) −→ f (x). (6.2.107)
n→∞ n→∞

Этого достаточно, чтобы сделать вывод, что из

xn −→ x
n→∞

следует
f (xn ) −→ f (x).
n→∞

1. Зафиксируем ε > 0 и покажем, что из условий (6.2.106) следует, что неравенство

f (x − λn · h) < f (x) + ε (6.2.108)

верно для почти всех n ∈ N∗ . Это верно потому, что в цепочке


 
f (x − λn · h) = f (1 − λn ) · x + λn · (x − h) < (6.2.103) < (1 − λn ) · f (x) + λn · f (x − h) < f (x) + ε
↓ ↓
0 0

последнее неравенство верно для почти всех n ∈ N∗ .


2. Покажем, что при ε > 0 из условий (6.2.106) следует, что неравенство

f (x + λn · h) < f (x) + ε (6.2.109)

тоже верно для почти всех n ∈ N∗ . Это верно потому, что в цепочке
 
f (x + λn · h) = f (1 − λn ) · x + λn · (x + h) < (6.2.103) < (1 − λn ) · f (x) + λn · f (x + h) < f (x) + ε
↓ ↓
0 0

последнее неравенство верно для почти всех n ∈ N∗ .


3. Теперь заметим, что
x − λ · h x + λ · h 1 1
n n
f (x) = f + < (6.2.103) < · f (x − λn · h) + · f (x + λn · h)
2 2 2 2
и поэтому
2f (x) < f (x − λn · h) + f (x + λn · h).
Отсюда следует, во-первых, что для почти всех n ∈ N∗ выполняются неравенства

2f (x) < f (x − λn · h) + f (x + λn · h) < f (x − λn · h) + f (x) + ε


| {z }
>

(6.2.109)
f (x) + ε


2f (x) < f (x − λn · h) + f (x) + ε

f (x) < f (x − λn · h) + ε

f (x) − ε < f (x − λn · h)
402 Глава 6. ПРОИЗВОДНАЯ

⇓ (6.2.108)
f (x) − ε < f (x − λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому

f (x − λn · h) −→ f (x).
n→∞


И, во-вторых, для почти всех n ∈ N выполняются неравенства

2f (x) < f (x − λn · h) +f (x + λn · h) < f (x) + ε + f (x + λn · h)


| {z }

>
(6.2.108)
f (x) + ε


2f (x) < f (x) + ε + f (x + λn · h)

f (x) < ε + f (x + λn · h)

f (x) − ε < f (x + λn · h)
⇓ (6.2.109)
f (x) − ε < f (x + λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому

f (x + λn · h) −→ f (x).
n→∞

Мы доказали (6.2.107).

⋄ 6.2.32. Выпуклая функция не обязана быть и [0, +∞), а потом нужно заметить, что хорда,
дифференцируемой. Например, функция соединяющая точки с аргументами, лежащими
справа и слева от нуля, α < 0 < β, будет лежать
f (x) = e|x|
выше двух хорд, соединяющих аргумент α с ар-
не дифференцируема в точке 0, но выпукла вниз. гументом 0, и 0 с β. И поэтому эта хорда будет
Это доказывается сначала для участков (−∞, 0] выше графика f на участке (α, β).

Асимптоты. Асимптотой называется прямая, к которой график функции “бесконечно прибли-


жается”. Более точное определение этому понятию выглядит так:
• Пусть функция f обладает следующим свойством:

lim f (x) = ∞ или lim f (x) = ∞


x→x0 −0 x→x0 +0

Тогда прямая
x = x0
называется вертикальной асимптотой функции f .
• Пусть функция f обладает следующим свойством:

lim (f (x) − (k · x + b)) = 0 или lim (f (x) − (k · x + b)) = 0


x→+∞ x→−∞

Тогда прямая
y =k·x+b
называется наклонной асимптотой функции f (при x → +∞ или x → −∞).
§ 2. Приложения производной 403

⋄ 6.2.33. Функция f (x) = 1


x имеет вертикаль- ⋄ 6.2.34. Функция f (x) = 1
x + x имеет наклон-
ную асимпоту x = 0. ную асимпоту y = x.

Теорема 6.2.35 (об асимптотах). Если прямая y = k · x + b является наклонной асимптотой


функции f при x → +∞ (или x → −∞), то
!
f (x) f (x)
k = lim или k = lim (6.2.110)
x→+∞ x x→−∞ x

и !
b = lim (f (x) − k · x) или b = lim (f (x) − k · x) (6.2.111)
x→+∞ x→−∞

Доказательство. Если
lim (f (x) − (k · x + b)) = 0
x→+∞
то  
f (x) = (k · x + b) + α(x) где α(x) −→ 0
x→+∞

поэтому  
f (x) b α(x)
lim = lim k+ + =k
x→+∞ x x→+∞ x x
и, кроме того,
lim (f (x) − k · x) = lim (b + α(x)) = b
x→+∞ x→+∞

Аналогично рассматривается случай x → −∞.

Общая схема построения графика функции.


Построение графика функции удобно проводить по следующей схеме.
1. Находится область определения; обычно она состоит из интервалов (или отрезков), концы кото-
рых удобно называть специальным термином, например, особыми точками.10
2. Находятся пределы функции в особых точках и вертикальные асимптоты.
3. Находятся пределы на бесконечности и наклонные асимптоты.
4. Вычисляется первая производная, с помощью которой затем находятся интервалы монотонности
и точки экстремума.
5. Вычисляется вторая производная, с помощью которой затем находятся интервалы выпуклости
вверх и вниз и точки перегиба.
6. С учетом полученных данных строится график.

Объясним эту схему на примерах. является особой точкой функции f .


2. Затем находим пределы функции в особых
График стандартной функции без симмет- точках:
рий.
x2 + 1 12 + 1
⋄ 6.2.36. Построим график следующей функ- lim f (x) = lim = =
x→1−0 x→1−0 x − 1 1−0−1
ции:  
2
x2 + 1 = = −∞
f (x) = −0
x−1
1. Сначала находим область определения.
Она определяется неравенством x − 1 6= 0, и по- x2 + 1 12 + 1
этому имеет вид (−∞; 1) ∪ (1; +∞). Точка x = 1 lim f (x) = lim = =
x→1+0 x→1+0 x − 1 1+0−1
10 Более
точное определение: особой точкой функции f называется любая граничная точка области определения
функции f , то есть такая точка a, в любой окрестности которой (a−ε, a+ε) содержатся точки, в которых f определена
и точки, в которых f не определена.
404 Глава 6. ПРОИЗВОДНАЯ
 
2 x2 − 2x − 1
= = +∞ f ′ (x) = 0 ⇔ =0 ⇔
+0 (x − 1)2
(
Из этих равенств следует, что прямая x = 1 явля- x2 − 2x − 1 = 0
⇔ ⇔
ется вертикальной асимптотой нашей функции. (x − 1)2 6= 0
3. Вычисляем пределы в бесконечности: √ √
⇔ x = 1 − 2 или x = 1 + 2
x2 + 1 x + x1
lim f (x) = lim = lim = Рисуем картинку, изображающую интервалы
x→+∞ x→+∞ x − 1 x→+∞ 1 − 1
! x знакопостоянства производной, а значит, интер-
1 валы монотонности функции f :
+∞ + +∞
= 1 = +∞
1 − +∞
+ √
− − √
+ x
2
x +1 x+ 1 1− 2 1 1− 2
x
lim f (x) = lim = lim = 1
x→−∞ x→−∞ x−1 x→−∞ 1 −
x
!
−∞ + −∞ 1 5. Находим вторую производную:
= 1 = −∞
1 − −∞  ′
′′ x2 − 2x − 1
f (x) = =
Ищем наклонные асимптоты по формулам (x − 1)2
(6.2.110) и (6.2.111): (x2 − 2x − 1)′ · (x − 1)2 − ((x − 1)2 )′ · (x2 − 2x − 1)
= =
(x − 1)4
2 2 2
f (x) x +1 (2x − 2) · (x − 1) − 2(x − 1) · (x − 2x − 1)
k+ = lim = lim 2 = = =
x→+∞ x x→+∞ x −x (x − 1)4
1 + x12 4
= lim =1 =
x→+∞ 1 − 1 (x − 1)3
x

Решаем уравнение f ′′ (x) = 0:


b+ = lim [f (x) − k+ · x] =
x→+∞
 2  4
x +1 f ′′ (x) = 0 ⇔ =0 ⇔ x∈∅
= lim −1·x = (x − 1)3
x→+∞ x − 1

x2 + 1 − x(x − 1) Рисуем картинку, изображающую интервалы


= lim = знакопостоянства второй производной, а значит,
x→+∞ x−1
интервалы выпуклости вверх и вниз функции f :
x2 + 1 − x2 + x 1+x
= lim = lim =
x→+∞ x−1 x→+∞ x − 1
1
+1
= lim x 1 = 1 + − x
x→+∞ 1 − 1
x

Значит, прямая

y =x+1 6. Рисуем график:

является асимптотой при x → +∞. Аналогично y


получаем, что k− = 1 и b− = 1, и поэтому та
же прямая y = x + 1 является асимптотой при
x → −∞.
4. Находим производную:
 ′
x2 + 1
f ′ (x) = =
x−1
(x2 + 1)′ · (x − 1) − (x − 1)′ · (x2 + 1)
= = √ x
(x − 1)2 1− 2 √
1 1+ 2
2x · (x − 1) − 1 · (x2 + 1) x2 − 2x − 1
= 2
=
(x − 1) (x − 1)2

Решаем уравнение f ′ (x) = 0:


§ 2. Приложения производной 405

⋄ 6.2.37. Построим график функции Решаем уравнение f ′ (x) = 0:


p
3
f (x) = x3 − 3x x2 − 1
f ′ (x) = 0 ⇔ 2 =0 ⇔
(x3 − 3x) 3
1. Очевидно, функция определена всюду, по- (
этому область определения есть вся числовая x2 − 1 = 0
⇔ ⇔ x ∈ {−1; 1}
прямая R = (−∞; +∞). x3 − 3x 6= 0
2. Функция непрерывна везде на R =
(−∞; +∞), поэтому вертикальных асимптот нет. Рисуем картинку, изображающую интервалы
3. Вычисляем пределы в бесконечности: знакопостоянства производной, а значит, интер-
валы монотонности функции f :
p
3
lim f (x) = lim x3 − 3x =
x→+∞ x→+∞
r + + − − + + x
3 3 √ √
= lim x · 1 − 2 = (+∞ · 1) = +∞ − 3 −1 0 1 3
x→+∞ x

p 5. Находим вторую производную:


3
lim f (x) = lim x3 − 3x = !′
x→−∞ x→−∞
r ′′ x2 − 1 x2 + 1
3 3 f (x) = 2 = ... = −2 5
= lim x · 1− = (−∞ · 1) = −∞ (x3 − 3x) 3 (x3 − 3x) 3
x→−∞ x2
Решаем уравнение f ′′ (x) = 0:
Ищем наклонные асимптоты по формулам
(6.2.110) и (6.2.111): 2x4 + x2 + 1
f ′′ (x) = 0 ⇔ −2 5 =0 ⇔ x∈∅

3 (x3 − 3x) 3
f (x) x3− 3x
k+ = lim = lim =
x→+∞ x x→+∞ x Рисуем картинку, изображающую интервалы
r знакопостоянства второй производной, а значит,
3 3
= lim 1− =1 интервалы выпуклости вверх и вниз функции f :
x→+∞ x2

b+ = lim [f (x) − k+ · x] =
+ √
− + √
− x
x→+∞ − 3 0 3
hp i
3
= lim x3 − 3x − 1 · x =
x→+∞
q  q q 
3 3
x − 3x − x ·
3
(x3 − 3x)2 + x ·
3 3
x − 3x + x2 6. Рисуем график:
= lim
x→+∞
q
3
q
3 3
=
(x3 − 3x)2 + x · x − 3x + x2
p y
3
(x3 − 3x)3 − x3
= lim p √ = y=
x
x→+∞ 3
(x3 − 3x)2 + x · 3 x3 − 3x + x2

−3x 3
2 √
= lim p √ = y= 3
x3 − 3x
x→+∞ 3 (x3 − 3x)2 + x · 3 x3 − 3x + x2 √ √ x
− 3 1 3
−1
−3
= lim q √ = √
x→+∞ 3 3 −32
(1 − x2 ) · (x3 − 3x) + 3 x3 − 3x + x
−3
= lim q q  =0
x→+∞ 3 2 3
x · 3 (1 − x2 ) + 3
1− x2 +1

Значит, прямая y = x является асимптотой при ⊲⊲ 6.2.38. Постройте графики следующих функ-
x → +∞. Аналогично получаем, что k− = 1 и ций:
b− = 0, и поэтому та же прямая y = x является √
1. y = 3 x2 − x3 .
асимптотой при x → −∞.
x2
4. Находим производную: 2. y = x−1 .
q
x6
p ′ 3 ′ 3. y = 5 x−a .
′ 3 3
(x − 3x)
f (x) = x − 3x = √ 2 = x3
3 3 x3 − 3x 4. y = 4(x−2) 2.
p
3x2 − 3 x2 − 1 5. y = x 3 (x + 1)2 .
= √ 2 = 2 q
3 3 x3 − 3x (x3 − 3x) 3 3 −2x2
6. y = x x−3 .
406 Глава 6. ПРОИЗВОДНАЯ

2 5
7. y = x x−4 · e− 3x . 4. Производная:
8. y = x3 + 3x2 − 9x − 3. 1
√ f ′ (x) = (x2 · ln |x|)′ = 2x · ln |x| + x2 · =
9. y = x + x2 − 1. x
= x · (2 ln |x| + 1)
Четные и нечетные функции. Построение При x > 0 получаем f ′ (x) = 0 ⇔ 2 ln x + 1 =
графика упрощается, если функция обладает 1
0 ⇔ ln x = − 21 ⇔ x = e− 2 . Интервалы знакопо-
какими-то симметриями (то есть в каком-нибудь
стоянства производной:
смысле инвариантна относительно некоторых
преобразований прямой). Мы расмотрим три из
них: четность, нечетность и периодичность. − + x
Напомним, что четные и нечетные функции 0 − 21
e
мы определили на с.240 как удовлетворяющие
тождествам
5. Вторая производная:
f (−x) = f (x) (четность),  ′ 2
f ′′ (x) = x·(2 ln |x|+1) = (2 ln |x|+1)+x· =
f (−x) = −f (x) (нечетность) x
= 2 ln |x| + 2 = 2(ln |x| + 1)
Там же отмечалось, что график четной функции
должен быть симметричен относительно оси ор- При x > 0 получаем f ′′ (x) = 0 ⇔ ln x + 1 = 0 ⇔
−1
динат, а график нечетной – центрально симмет- ln x = −1 ⇔ x = e . Интервалы знакопостоян-
ричен относительно начала координат. ства второй производной:
Отсюда следует, что если нам нужно постро-
ить график четной функции, то его достаточ- − + x
но построить на правой полуплоскости, а затем, −1
0 e
чтобы получить окончательный результат, отоб-
разить полученную картинку налево симметрич-
но относительно оси ординат. Точно так же гра- 6. График функции для x > 0:
фик нечетной функции достаточно строить на
правой полуплоскости, а потом отобразить цен- y
трально симметрично относительно начала коор-
динат. Здесь мы рассмотрим примеры.
⋄ 6.2.39. Постройте график функции:

f (x) = x2 · ln |x| 0 1 √1 x
e e

1. Область определения: (−∞; 0) ∪ (0; +∞).


Точка x = 0 является особой. Функция является − e12
четной, поэтому нам достаточно построить гра- 1
− 2e
фик только на интервале x ∈ (0; +∞).
2. Поскольку нас интересует только область
x ∈ (0; +∞), в особой точке x = 0 мы вычисляем
односторонний предел:
Отобразив эту картинку симметрично относи-
2 2
lim x · ln |x| = lim x · ln x = (0 · ∞) = тельно оси ординат, мы получим полный график
x→+0 x→+0
нашей функции:
ln x  ∞ 
= lim −2 = = y
x→+0 x ∞
 
применяем x−1 x2
= правило = lim −3
= lim =0
Лопиталя x→+0 −2x x→+0 −2

Значит, вертикальных асимптот нет.


3. Наклонная асимптота нас тоже интересует
только при x → +∞: − √1e − e1 0 1
e
√1
e x

f (x) − e12
k+ = lim = lim x · ln |x| =
x→+∞ x x→+∞
1
= lim x · ln x = ∞ − 2e
x→+∞

Это означает, что и наклонных асимптот нет.


§ 2. Приложения производной 407

⋄ 6.2.40. Постройте график функции: y


√ π
3− 3
f (x) = 2x − arcsin x
1. Область определения: [−1; 1]. Точки x = −1 √
3
и x = 1 являются особыми. Функция являет- −1 − 2 0 x

ся нечетной, поэтому нам достаточно построить 3 1
2
график только на отрезке x ∈ [0; 1].
2. Предел в особой точке конечный

π π
3 − 3
lim (2x − arcsin x) = 2 − arcsin 1 = 2 − ,
x→1−0 2
значит вертикальных асимптот нет.
3. Наклонных асимптот тоже нет, поскольку Периодические функции. Напомним, что
x не может стремиться к бесконечности. периодические функции мы определили на с.242
4. Производная: как удовлетворяющие тождеству
1
f ′ (x) = (2x − arcsin x)′ = 2 − √ f (x + T ) = f (x)
1 − x2
При x > 0 получаем f ′ (x) = 0 ⇔ 2 − √1−x 1
2
= при некотором T > 0. Там же отмечалось, что
1
√ график периодической функции f должен на-
0 ⇔ 2 = √1−x ⇔ 1 − x2 = 12 ⇔ 1 − x2 = 14 ⇔
2
√ кладываться на себя при сдвиге вправо (и влево)
x2 = 43 ⇔ x = 23 . Интервалы знакопостоянства на число T (период).
производной: Отсюда следует, что если нам нужно по-
строить график периодической функции, то его
достаточно построить на отрезке вида [a; a +
− √ + x T ], а затем, чтобы получить окончательный ре-
0 3 1
2 зультат, сдвинуть полученную картинку влево и
вправо нужное число раз (чтобы зрителю ста-
ло понятно, что сдвигать можно сколько угодно
5. Вторая производная:
раз с тем же результатом). Здесь мы рассмотрим
 1 ′  1
′ примеры.
f ′′ (x) = 2 − √ = 2 − (1 − x2 )− 2 =
1−x 2
⋄ 6.2.41. Постройте график функции:
1 2 − 32 2 − 23
= (1 − x ) · (−2x) = −x · (1 − x )
2 f (x) = sin3 x + cos3 x
′′
При x > 0 получаем f (x) = 0 ⇔ −x · (1 −
3
x2 )− 2 = 0 ⇔ x = 0. Интервалы знакопостоян- 1. Область определения: (−∞; +∞). Функция
ства второй производной: является периодической с периодом T = 2π, по-
этому нам достаточно построить график только
на отрезке x ∈ [0; 2π].
− x 2. Особых точек нет, значит и вертикальных
0 1 асимптот нет.
3. Наклонные асимптоты мы не ищем, по-
скольку нас интересует только отрезок x ∈
6. График функции для x > 0: [0; 2π].
4. Производная:
y

3− π
3
f ′ (x) = 3 sin2 x cos x − 3 cos2 x sin x =
= 3 sin x cos x(sin x − cos x)

При x ∈ [0; 2π] получаем

f ′ (x) = 0 ⇔ 3 sin x cos x(sin x − cos x) = 0 ⇔


x x ∈ {0; π} 
√    
0 3 1 sin x = 0  π 3π 

2   x ∈ ; 
⇔  cos x = 0  ⇔  2 2  ⇔
  
sin x = cos x  π 5π 
x∈ ;
4 4
Отобразив эту картинку симметрично относи-  
тельно начала координат, мы получим полный π π 5π 3π
⇔ x ∈ 0; ; ; π; ;
график нашей функции: 4 2 4 2
408 Глава 6. ПРОИЗВОДНАЯ

Интервалы знакопостоянства производной: y


1

− + − + − + x x
π π 5π 3π 0 π 2π
0 4 2 π 4 2 2π

−1
5. Вторая производная:

f ′′ (x) = (3 sin x cos x(sin x − cos x))′ = Сдвинув эту картинку несколько раз влево и
вправо на период T = 2π, мы получим полный
= 3 cos2 x(sin x − cos x) − 3 sin2 x(sin x − cos x)+ график нашей функции:
+ 3 sin x cos x(cos x + sin x) =
y
= 3(cos2 x − sin2 x)(sin x − cos x)+ y = sin3 x + cos3 x
+ 3 sin x cos x(cos x + sin x) =
= −3(cos x + sin x)(cos x − sin x)2 + −π π x
−2π 0 2π
+ 3 sin x cos x(cos x + sin x) =
= 3(cos x + sin x)[−(cos x − sin x)2 + sin x cos x] =
= 3(cos x + sin x)[− cos2 x − sin2 x + 3 sin x cos x] =
= 3(cos x + sin x)[3 sin x cos x − 1]
⊲⊲ 6.2.42. Постройте графики следующих функ-
При x ∈ [0; 2π] получаем ций:
x2 +2
1. y = 2x 2 +1 .
p p
f ′′ (x) = 0 ⇔ 2. y = 3 (x + 1)2 − 3 (x − 1)2 .
sin x+cos x
3. y = ep . p
⇔ 3(cos x + sin x)[3 sin x cos x − 1] = 0 ⇔
" # " # 4. y = (x + 1)2 + 3 (x − 1)2 .
3

cos x + sin x = 0 cos x = − sin x


⇔ ⇔ ⇔ 5. y = x−8x
2 +4 .
3 sin x cos x − 1 = 0 3 sin x cos x = 1
    6. y = arctg(sin x).
cos x = − sin x cos x = − sin x 2

⇔ 3  ⇔  2 ⇔ 7. y = √xx2 +2 .
sin 2x = 1 sin 2x =
2 3 8. y = x ln |x|.
   
x∈
3π 7π
; 9. y = ln(sin x + cos x).
 4 4  2

 2

 10. y = √x4x+1 2 −3
.

⇔ 2x = arcsin + 2πn ⇔
 3

 11. y = 2x − arctg x.
  1
2
2x = π − arcsin + 2πn
12. y = sin x−cos x.
3
   
3π 7π

x∈
4
;
4  Экстремум функции одной переменной.
 
 1 2 
⇔   x = arcsin + πn  ⇔
 ⋄ 6.2.43. Найти наибольшее и наименьшее зна-
 2 3 

π 1 2
 чение функции
x= − arcsin + πn
2 2 3

оставляем только

f (x) = x3 − 6x2 + 9x + 1
⇔ те значения x, которые ⇔
лежат в отрезке [0; 2π] на следующих множествах:
n12 π 1 2 3π
⇔x∈ arcsin ; − arcsin ; ; 1) на отрезке [0, 2],
2 3 2 2 3 4
1 2 3π 1 2 7π o 2) на полуинтервале [−2, −1).
π + arcsin ; − arcsin ;
2 3 2 2 3 4 Решение. Найдем производную:

Интервалы знакопостоянства второй произ- f ′ (x) = 3x2 − 12x + 9 = 3(x − 1)(x − 3).
водной:
Она обращается в нуль в точках x = 1 и x = 3,
причем
− + − + − + − x – f ′ (x) > 0 при x ∈ (−∞, 1) ∪ (3, ∞), поэтому
0 3π 7π
2π функция f возрастает на интервалах (−∞, 1)
4 4
и (3, ∞),
– f ′ (x) < 0 при x ∈ (1, 3), поэтому функция f
6. График функции на отрезке x ∈ [0; 2π]: убывает на интервале (1, 3).
§ 2. Приложения производной 409

Теперь рассматриваем два заданных множе- ⋄ 6.2.45. Среди всех прямоугольников с дан-
ства. ным периметром P найти прямоугольник с мак-
1. На отрезке [0, 2] функция f имеет толь- симальной площадью.
ко одну критическую точку, x = 1, причем на Пусть x – одна из сторон прямоугольника. То-
интервале (0, 1) она возрастает, а на интервале гда другая сторона будет y = P2 − x, а площадь
(1, 2) – убывает. Одновременно
Px
f (0) = 1, f (1) = 5, f (2) = 3. S =x·y = − x2 .
2
Поэтому Дифференцируя по x мы получим:
max f (x) = f (1) = 5
x∈[0,2]
P P
и S ′ (x) = − 2x = 0 ⇐⇒ x= .
2 4
min f (x) = f (0) = 1.
x∈[0,2]
При этом
2. На полуинтервале [−2, −1) функция f не 
– S ′ (x) > 0 при x ∈ 0, P4 , то есть на интервале
имеет критических точек и возрастает. Отсюда 
0, P4 функция S возрастает,
следует, что 
– S ′ (x) < 0 при x ∈ P4 , P2 , то есть на интерва-
min f (x) = f (−2) = −49, 
x∈[−2,−1) ле P4 , P2 функция S убывает.
а Поэтому
max f (x)  
x∈[−2,−1) P P2
не существует. max S(x) = S = .
x∈(0, P2 ) 4 16
⋄ 6.2.44. Найти максимальный объем цилиндра,
вписанного в данный конус. ⊲ 6.2.46. Найдите отношение катетов прямо-
Решение. Обозначим буквами R и H радиус и угольного треугольника, у которого площадь
высоту конуса, а буквами x и h радиус и высоту максимальна среди всех прямоугольных тре-
вписанного цилиндра. Тогда угольников, у которых сумма длин гипотенузы
и одного из катетов равна фиксированной вели-
H −h H чине c.
= ,
x R
поэтому ⊲ 6.2.47. Сечение тоннеля имеет форму пря-
xH моугольника, завершенного полукругом. Опре-
H −h= делить радиус полукруга, при котором площадь
R
и сечения будет наибольшей, если периметр сече-
xH H ния равен p.
h=H− = (R − x),
R R
а объем цилиндра получается ⊲ 6.2.48. Лист картона имеет форму прямо-
угольника со сторонами a и b. Вырезая по углам
πH этого прямоугольника квадраты и сгибая высту-
V (x) = · (Rx2 − x3 ).
R пающие части крестообразной фигуры, получим
Дифференцируея по x, мы получаем: открытую сверху коробку, высота которой рав-
ная стороне квадрата. Какой должна быть сто-
πH рона квадрата, чтобы объем коробки был наи-
V ′ (x) = · (2Rx − 3x2 ) = 0 ⇐⇒
R   большим?
2R
⇐⇒ x ∈ 0, . ⊲ 6.2.49. Найти наибольший объем цилиндра,
3
периметр осевого сечения которого равен a.
Здесь видно, что x = 2R 3 – точка максимума для
V: ⊲ 6.2.50. Среди всех равнобедренных треуголь-
  ников, вписанных в данный круг, найти тре-
2R угольник с наибольшим периметром.
max V (x) = V =
x∈[0,R] 3
 2  3 ! ⊲ 6.2.51. Определить размеры закрытой короб-
πH 2R 2R ки объема v с квадратным основанием, на изго-
= · R − =
R 3 3 товление которой расходуется наименьшее коли-
 3  чество материала.
πH 4R 8R3
= · − =
R 9 27 ⊲ 6.2.52. Среди всех прямоугольников данной
 
πH 12R3 8R3 4 площади S найти прямоугольник: 1) с наимень-
= · − = · πHR2 шим периметром, 2) с наименьшей диагональю.
R 27 27 27
410 Глава 6. ПРОИЗВОДНАЯ

⊲ 6.2.53. Найти наибольшую площадь прямо- ⊲ 6.2.57. Консервная банка имеет цилиндриче-
угольника, вписанного в круг радиуса R. скую форму. Найти наиболее выгодное отноше-
⊲ 6.2.54. Найти длину боковой стороны трапе- ние ее размеров (то есть отношение диаметра к
ции, имеющей наименьший периметр среди всех высоте, при котором ее объем станосится наи-
равнобедренных трапеций с заданной площадью большим при заданной полной площади поверх-
S и углом α между боковой стороной и нижним ности).
основанием. ⊲ 6.2.58. Найти наибольшую полную поверх-
⊲ 6.2.55. Вычислить наибольшую площадь тра- ность цилиндра, вписанного в шар радиуса R.
пеции, вписанной в полукруг радиуса R, у кото-
рой нижним основанием служит диаметр полу- ⊲ 6.2.59. Из кругового листа жести вырезают
круга. сектор и свертывают его в коническую воронку.
Каким должен быть угол сектора, чтобы ворон-
⊲ 6.2.56. Из трех досок одинаковой ширины ка имела наибольший объем?
нужно сколотить желоб. При какой угле накло-
на боковых стенок площадб поперечного сечения ⊲ 6.2.60. Найти наименьшую боковую поверх-
желоба будет наибольшей? ность конуса, имеющего объем V .
Глава 7

АСИМПТОТИЧЕСКИЕ МЕТОДЫ

Поведение функции при аргументе, стремящемся к некоторой величине, является предметом изуче-
ния специального раздела математического анализа, называемого асимптотическими методами.
По идеологии этой науки, свойство функции f иметь (или не иметь) предел при x → a – только
самое первое, поверхностное наблюдение, за которым скрывается гораздо более сложная картина,
которую если подходящим образом формализовать, то получаешь удивительно мощный инструмент
для решения самых разных задач, в том числе для вычисления самих пределов.

Чтобы было понятно, о чем идет речь, вспом- g(0) = earctg 0 − 1 − arctg(e0 − 1) = 0.
ним снова, как мы вычисляли пределы. После
Это значит, что можно применить правило Ло-
всех усилий, что мы потратили на изучение это-
питаля. Первые производные будут такие:
го вопроса в (c)(d) главы 5, а затем в § 2 главы 6,
для читателя может быть неожиданностью, что cos x cos ln(1 + x)
встречаются все же пределы, нахождение кото- f ′ (x) = − ,
1 + sin x 1+x
рых известными нам сейчас методами оказыва-
ется затруднительным или даже невозможным. earctg x ex
g ′ (x) = 2 − .
x +1 (1 − ex )2 + 1
⋄ 7.0.1. В качестве упражнения можно попро-
бовать найти следующий, простой на первый При подстановке x = 0 мы опять получаем нули:
взгляд, предел: cos 0 cos ln(1 + 0)
f ′ (0) = − = 0,
ln(1 + sin x) − sin ln(1 + x) 1 + sin 0 1+0
lim (7.0.1)
x→0 earctg x − 1 − arctg(ex − 1) earctg 0 e0
g ′ (0) = 2 − = 0.
Здесь, если пользоваться правилом Лопиталя, 0 +1 (1 − e0 )2 + 1
то его придется применять 4 раза, причем воз- И опять нужно дифференцировать. Вторые
никающие при дифференцировании выражения производные будут выглядеть так:
столь громоздки, что у обыкновенного человека
терпение истощается уже после первых двух ша- sin x sin ln(1 + x)
f ′′ (x) = − + −
гов. 1 + sin x (1 + x)2
Вот как выглядят эти вычисления, если по- cos2 x cos ln(1 + x)
следовательно находить производную от числи- − + ,
(1 + sin x)2 (1 + x)2
теля

f (x) = ln(1 + sin x) − sin ln(1 + x) earctg x 2x · earctg x


g ′′ (x) = − −
и знаменателя (x2 + 1)2 (x2 + 1)2
2e2x · (1 − ex ) ex
g(x) = earctg x − 1 − arctg(ex − 1), − −
((1 − ex )2 + 1)2 (1 − ex )2 + 1
не проводя возникающие в числителе дроби к об- Они опять при подстановке x = 0 дают нули:
щему знаменателю.
Прежде всего, при подстановке x = 0 напря- sin 0 sin ln(1 + 0)
мую в числитель и знаменатель мы получаем ну- f ′′ (0) = − + −
1 + sin 0 (1 + 0)2
ли: cos2 0 cos ln(1 + 0)
− 2
+ = 0,
f (0) = ln(1 + sin 0) − sin ln(1 + 0) = 0, (1 + sin 0) (1 + 0)2

411
412 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

earctg 0 0 · earctg 0 48e4x · (1 − ex )3 48e3x · (1 − ex )2


g ′′ (0) = − − − − −
(02 + 1)2 (02 + 1)2 ((1 − ex )2 + 1)4 ((1 − ex )2 + 1)3
2e0 · (1 − e0 ) e0 14e2x · (1 − ex ) 24e4x · (1 − ex )
− − =0 − + −
((1 − e0 )2 + 1)2 (1 − e0 )2 + 1 ((1 − ex )2 + 1)2 ((1 − ex )2 + 1)3
ex 12e3x
Далее мы дифференцируем в третий раз: − +
(1 − ex )2 + 1 ((1 − ex )2 + 1)2
3 sin ln(1 + x) 2 cos3 x И только в этот момент обнаруживается, что при
f ′′′ (x) = − + −
(1 + x)3 (1 + sin x)3 подстановке не получается нулей:
cos ln(1 + x) 3 sin x cos x cos x
− 3
+ 2
− , 3 sin2 0 sin 0
(1 + x) (1 + sin x) 1 + sin x f ′′′′ (0) = − + +
(1 + sin 0)2 1 + sin 0
10 sin ln(1 + 0) 6 cos4 0
2earctg x earctg x + 4
− +
g ′′′ (x) = − + + (1 + 0) (1 + sin 0)4
(x2 + 1)2 (x2 + 1)3
4 cos2 0 12 sin 0 cos2 0
8x2 · earctg x 6x · earctg x + 2
− = −2.
+ − − (1 + sin 0) (1 + sin 0)3
(x2 + 1)3 (x2 + 1)3
8e3x · (1 − ex )2 6e2x · (1 − ex )
− − − 8earctg 0 0 · earctg 0
((1 − ex )2 + 1)3 ((1 − ex )2 + 1)2 g ′′′′ (0) = − + +
(02 + 1)3 (02 + 1)3
ex 2e3x
− + earctg 0 0 · earctg 0
(1 − ex )2 + 1 ((1 − ex )2 + 1)2 + 2 + −
(0 + 1)4 (02 + 1)4
и убеждаемся, что при подстановке снова полу- 0 · earctg 0 0 · earctg 0
чаются нули: − 2 − −
(0 + 1)4 (02 + 1)4
3 sin ln(1 + 0) 2 cos3 0 48e0 · (1 − e0 )3 48e0 · (1 − e0 )2
f ′′′ (0) = − + − − − −
(1 + 0)3 (1 + sin 0)3 ((1 − e0 )2 + 1)4 ((1 − e0 )2 + 1)3
cos ln(1 + 0) 3 sin 0 cos 0 cos 0 14e0 · (1 − e0 ) 24e0 · (1 − e0 )
− + − = 0, − + −
(1 + 0) 3 (1 + sin 0) 2 1 + sin 0 ((1 − e0 )2 + 1)2 ((1 − e0 )2 + 1)3
e0 12e0
− + =
(1 − e0 )2 + 1 ((1 − e0 )2 + 1)2
2earctg 0 earctg 0
g ′′′ (0) = − + + = −8 + 1 − 1 + 12 = 4.
(02 + 1)2 (02 + 1)3
0 · earctg 0 0 · earctg 0 И мы наконец получаем ответ
+ 2 − −
(0 + 1)3 (02 + 1)3 ln(1 + sin x) − sin ln(1 + x)
8e0 · (1 − e0 )2 6e0 · (1 − e0 ) lim =
− − − x→0 earctg x − 1 − arctg(ex − 1)
((1 − e0 )2 + 1)3 ((1 − e0 )2 + 1)2 f ′′′′ (x) f ′′′′ (0) −2 1
e0 2e0 = lim ′′′′ = ′′′′ = =− .
x→0 g (x) g (0) 4 2
− + = 0.
(1 − e0 )2 + 1 ((1 − e0 )2 + 1)2
Когда решение известно и выписано на бума-
Затем в четвертый раз: ге, трудности блёкнут. По этой причине выклад-
ки в примере 7.0.1 могут не впечатлить читателя.
3 sin2 x sin x Вдобавок, с развитием символьных вычислений
f ′′′′ (x) = − + +
(1 + sin x) 2 1 + sin x задача нахождения производной сильно упрости-
10 sin ln(1 + x) 6 cos4 x лась, и можно себе представить точку зрения, по
+ 4
− + которой здесь вообще нет проблемы, поскольку
(1 + x) (1 + sin x)4
все можно считать нажатием кнопки. Но даже
4 cos2 x 12 sin x cos2 x если встать на эту радикальную позицию, про-
+ 2
− .
(1 + sin x) (1 + sin x)3 блема остается в том, что непонятно, сколько
раз нужно применять правило Лопиталя. Бо-
лее того, оказывается, что нет даже гарантии,
8earctg x 24x · earctg x что этот процесс вообще когда-нибудь приве-
g ′′′′ (x) = − + +
(x2 + 1)3 (x2 + 1)3 дет к ожидаемому результату.
earctg x 44x2 · earctg x
+ 2 + − ⋄ 7.0.2. Вот иллюстрация:
(x + 1)4 (x2 + 1)4
1
12x · earctg x 48x3 · earctg x sin(2− x2 )
− − − lim 1 . (7.0.2)
(x2 + 1)4 (x2 + 1)4 x→0 2− sin2 x
§ 1. Асимптотические отношения и формулы 413

1  
Здесь применение правила Лопиталя превраща- sin(2− x2 ) 0 f ′ (x)
ется в бесконечный процесс (со все более слож- lim − sin12 x
= = lim ′ =
x→0 2 0 x→0 g (x)
ными вычислениями на каждом следующем ша-    
0 f (n) (x) 0
ге), потому что числитель = = ... = lim (n) = =?
0 x→0 g (x) 0
1
f (x) = sin(2− x2 ) Эти примеры означают, что алгоритмы, ис-
пользуемые для вычисления пределов (в част-
и знаменатель
ности, в современных компьютерах), не могут
g(x) = 2 − sin12 x сводиться к применению одного только прави-
ла Лопиталя и должны использовать какие-то
стремятся к нулю при x → 0 вместе со всеми другие методы. И если ставить целью объясне-
своими производными. Сколько раз ни применяй ние интересующимся (в том числе, разработчи-
правило Лопиталя, ты получишь здесь неопреде- кам этих алгоритмов) сути этих методов, то огра-
ленность: ничиться тем, что уже сказано на эту тему, ко-
нечно, нельзя.

Асимптотические методы предлагают остроумный способ упростить подобные задачи, абстра-


гировавшись от несущественных свойств функций, и оставив только то, что важно для целей. При
этом оказывается, что используемый прием формализуется в виде единого алгоритма — нахождения
асимптотики функции — и применим в разных других ситуациях, например, при исследовании на
сходимость несобственных интегралов и рядов. В этой главе мы познакомим читателя с основными
понятиями этой науки и с простейшими ее приложениями (а конкретные пределы (7.0.1) и (7.0.2)
мы вычислим методами этой науки на страницах 440 и 442).

§1 Асимптотические отношения и формулы


(a) Асимптотические отношения
Асимптотическая эквивалентность функций (символ ∼) Пусть a — точка на прямой R или
символ бесконечности, возможно, со знаком.
Пусть f1 и f2 – две функции, определенные в выколотой окрестности a1 . Говорят, что функция
f1 эквивалентна функции f2 при x → a и записывают это так

f1 (x) ∼ f2 (x) (7.1.3)


x→a

если существует функция θ, определенная в выколотой окрестности a такая, что

f1 (x) = θ(x) · f2 (x)

и
θ(x) −→ 1.
x→a

В частном случае, когда f2 (x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание о θ: тогда запись (7.1.3) просто эквивалентна условию

f1 (x)
−→ 1 (7.1.4)
f2 (x) x→a

В качестве примеров выпишем несколько x2


1 − cos x ∼ (7.1.7)
важных эквивалентностей. x→0 2
ln(1 + x) ∼ x (7.1.8)
x→0
sin x ∼ x (7.1.5) x
x→0 loga (1 + x) ∼ (7.1.9)
x→0 ln a
tg x ∼ x (7.1.6)
x→0
1 Если a = ∞, то выколотой окрестностью a считается всякое множество (−∞, −E) ∪ (E, +∞), где E > 0. Если

a = +∞, то выколотой окрестностью a считается всякое множество (E, +∞), где E > 0. Если же a = −∞, то
выколотой окрестностью a считается всякое множество (−∞, −E), где E > 0.
414 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

ex − 1 ∼ x (7.1.10) (7.1.11): по определению символа ∼,


x→0
ax − 1 ∼ x · ln a (7.1.11) ax − 1
x→0 ax − 1 ∼ x ln a ⇔ −→ 1
x→0 x ln a x→0
(1 + x)α − 1 ∼ α · x (7.1.12)
x→0
Последнее соотношение доказывается с по-
arcsin x ∼ x (7.1.13)
x→0 мощью правила Лопиталя:
arctg x ∼ x (7.1.14)
x→0 ax − 1
lim = (Лопиталь) =
x→0 x ln a
Доказательство. Все эти соотношения дока- ax ln a
зываются одним и тем же способом – простым = lim = lim ax = 1
x→0 ln a x→0
вычислением, например, с помощью правила
Лопиталя. В качестве примера мы рассмотрим

Свойства асимптотической эквивалентности:


1◦ . Если f1 (x) ∼ f2 (x), то равенство или неравенство нулю в выколотой окрестности a
x→a
первой функции эквивалентно тому же для второй функции (с возможным изменением
окрестности):

f1 (x) = 0, x ∈ U̇ε (a) ⇐⇒ f2 (x) = 0, x ∈ U̇δ (a)

и
f1 (x) 6= 0, x ∈ U̇ε (a) ⇐⇒ f2 (x) 6= 0, x ∈ U̇δ (a).

2 . Рефлексивность: всегда
f1 (x) ∼ f1 (x)
x→a

3 . Симметричность:
f1 (x) ∼ f2 (x) =⇒ f2 (x) ∼ f1 (x)
x→a x→a

4◦ . Транзитивность:

f1 (x) ∼ f2 (x) & f2 (x) ∼ f3 (x) =⇒ f1 (x) ∼ f3 (x)


x→a x→a x→a

5◦ . Мультипликативность:

f1 (x) f2 (x)
f1 (x) ∼ f2 (x) & g1 (x) ∼ g2 (x) =⇒ f1 (x)·g1 (x) ∼ f2 (x)·g2 (x) & ∼
x→a x→a x→a g1 (x) x→a g2 (x)

(там, где g2 присутствует в знаменателе, нужно чтобы g2 (x) 6= 0 в некоторой выко-


лотой окрестности a).
6◦ . Связь с пределом:
f1 (x) ∼ f2 (x) −→ A =⇒ f1 (x) −→ A
x→a x→a x→a

Понятие асимптотической эквивалентности полезно при вычислении сложных пределов, кото-


рые слишком утомительно находить с помощью правила Лопиталя. Для этого используется следу-
ющая
Теорема 7.1.1 (об эквивалентной замене). Если f1 (x) ∼ f2 (x) и g1 (x) ∼ g2 (x), то
x→a x→a

f1 (x) f2 (x)
lim = lim lim f1 (x) · g1 (x) = lim f2 (x) · g2 (x)
x→a g1 (x) x→a g2 (x) x→a x→a

(там, где g2 присутствует в знаменателе, нужно чтобы g2 (x) 6= 0 в некоторой выколотой


окрестности a).
Доказательство. Условия f1 (x) ∼ f2 (x) и g1 (x) ∼ g2 (x) означают, что существуют функции θ,
x→a x→a
τ , такие что
f1 (x) = θ(x) · f2 (x), θ(x) −→ 1
x→a
§ 1. Асимптотические отношения и формулы 415

и
g1 (x) = τ (x) · g2 (x), τ (x) −→ 1
x→a

Запомним их, и поглядим, что можно сказать о пределах, о которых говорит теорема:
 
f1 (x) θ(x) · f2 (x) θ(x) f2 (x) θ(x) f2 (x) f2 (x)
lim = lim = lim · = lim · lim = lim
x→a g1 (x) x→a τ (x) · g2 (x) x→a τ (x) g2 (x) x→a τ (x) x→a g2 (x) x→a g2 (x)
| {z }
k
1

И точно так же,


   
lim f1 (x) · g1 (x) = lim θ(x) · f2 (x) · τ (x) · g2 (x) = lim θ(x) · τ (x) · f2 (x) · g2 (x) =
x→a x→a x→a
  
= lim θ(x) · τ (x) · lim f2 (x) · g2 (x) = lim f2 (x) · g2 (x)
x→a x→a x→a
| {z }
k
1

⋄ 7.1.2. Приведем иллюстрацию: ⋄ 7.1.3.


√ √
1 − cos x 1 − cos x ∼ x22
1 + x − 1 1 + x − 1 x→0
∼ x 2

= lim
= ln(1 + x) ∼ x =
x→0
lim = 2x
− 1 ∼ x · ln 2 x→0 ln2 (1 + x)
x→0 2x − 1 x→0
x→0

x x2
2 1 1
= lim = = lim 2 =
x→0 x · ln 2 2 ln 2 x→0 x2 2

В более сложных примерах следует пользоваться еще одной теоремой:


Теорема 7.1.4 (о замене переменной под знаком эквивалентности). Если f1 (x) ∼ f2 (x) и ξ(t) −→
x→a t→c
a, причем ξ(t) 6= a при t 6= c, то f1 (ξ(t)) ∼ f2 (ξ(t)).
t→c

Доказательство. Условие f1 (x) ∼ f2 (x) означает, что существуют функция θ, такая что
x→a

f1 (x) = θ(x) · f2 (x), θ(x) −→ 1


x→a

Положим
τ (t) = θ(ξ(t)).
Тогда, во-первых,
f1 (ξ(t)) = θ(ξ(t)) · f2 (ξ(t)) = τ (t) · f2 (ξ(t)),
И, во-вторых,
применяем теорему 4.4.32

о замене переменной

lim τ (t) = lim θ(ξ(t)) = под знаком предела: = lim θ(x) = 1.
t→c t→c x→a
x = ξ(t) −→ a
t→c
ξ(t) 6= a при t 6= c

То есть f1 (ξ(t)) ∼ f2 (ξ(t)).


t→c

⋄ 7.1.5. Рассмотрим предел посложнее: (7.1.14), arctg y ∼ y, можно заменой y = 7


4x
y→0

arctg 7 x (y −→ 0) получить формулу arctg 74 x ∼ 7


x.
x→0 x→0 4
lim −2x 4 Точно так же, из формулы (7.1.10), ez − 1 ∼ z,
x→0 e −1 z→0
заменой z = −2x (z −→ 0) получается e−2x −
Чтобы его вычислить, заметим, что из формулы x→0
416 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
 x
1 ∼ −2x. Отсюда 3x 3
x→0 = lim x = lim =0
x→−∞ 2 x→−∞ 2
arctg 47 x
lim = ⋄ 7.1.8.
x→0 e−2x − 1

arctg y y→0
∼ y =⇒ arctg 74 x ∼ 74 x √

= ez − 1 ∼ z =⇒ e−2x − 1 ∼ −2x =
x→0
sin( 1 + x − 1)
z→0 x→0 lim x
=
10√ − 1
7 7 x→0
4x 7
= lim = lim 4
=− sin( 1 + x − 1) ∼ √1 + x − 1 ∼ x
= =
2
x→0 −2x x→0 −2 8 x→0
10x − 1 ∼ x ln 10
x→0

x→0
⋄ 7.1.6. x
1
2
= lim =
1 − cos 5x 1− cos 5x ∼ (5x)
2
x→0 x ln 10 2 ln 10
lim = x→0 2 =
x→0 tg x2 2
tg x ∼ x 2
x→0
⊲⊲ 7.1.9. Найдите пределы
(5x)2 √
25x2 25 1. limx→0 1+x sin x−1
= lim 2 = lim = ex2 −1
x→0 x2 x→0 2x2 2 sin 5x
−1
2. limx→0 eln(1+2x)
⋄ 7.1.7. 3
arctg(ex −1)
3. limx→0
ln(1 + 3 )
x
x x
ln(1 + 3 ) ∼ 3 10arcsin3 x −1
lim = x→−∞ = 1−cos x
x→−∞ ln(1 + 2x ) ln(1 + 2x ) ∼ 2x 4. limx→0 √3
x→−∞ 1+x2 −1

Асимптотическое сравнение функций (символы ≪ и o) и шкала бесконечностей Пусть


снова a — точка на прямой R или символ бесконечности, возможно, со знаком.
И пусть f и g – две функции, определенные в выколотой окрестности a. Говорят, что функция
f бесконечно мала по сравнению с функцией g при x → a и записывают это так

f (x) ≪ g(x) (7.1.15)


x→a

или так  
f (x) = o g(x)
x→a

если существует функция α, определенная в выколотой окрестности a такая, что

f (x) = α(x) · g(x)

и
α(x) −→ 0.
x→a

В частном случае, когда g(x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание об α: тогда запись (7.1.15) просто эквивалентна условию

f (x)
−→ 0
g(x) x→a

⋄ 7.1.10. Покажем, что ⋄ 7.1.11. Убедимся, что

x2 ≪ x x ≪ x2
x→0 x→∞

или, в других обозначениях, или, в других обозначениях,

x2 = o (x) x= o (x2 )
x→0 x→∞

x2 x 1
Действительно, x = x −→ 0. Действительно, x2 = −→
x x→∞ 0.
x→0
§ 1. Асимптотические отношения и формулы 417

Свойства асимптотического сравнения


1◦ . Если f (x) ≪ g(x), то неравенство нулю в выколотой окрестности a для первой функ-
x→a
ции влечет за собой то же для второй функции (с той же окрестностью):

f (x) 6= 0, x ∈ U̇ε (a) =⇒ g(x) 6= 0, x ∈ U̇ε (a)

а равенство нулю в выколотой окрестности a для второй функции влечет за собой то


же для первой функции (с той же окрестностью):

f (x) = 0, x ∈ U̇ε (a) ⇐= g(x) = 0, x ∈ U̇ε (a).

2◦ Транзитивность:

f (x) ≪ g(x) & g(x) ≪ h(x) =⇒ f (x) ≪ h(x)


x→a x→a x→a

3◦ Связь с эквивалентностью:

f (x) ≪ g(x) ∼ h(x) =⇒ f (x) ≪ h(x),


x→a x→a x→a

f (x) ∼ g(x) ≪ h(x) =⇒ f (x) ≪ h(x).


x→a x→a x→a

Теорема 7.1.12 (о сравнении степенных То есть, ax ≪ bx . Наоборот,


x→+∞
функций). Если λ < µ, то
bx  b x
= −→ 0,
xλ ≪ xµ , xµ ≪ xλ ax a
|{z}
x→−∞
x→∞ x→0 ∨
1

или, в других обозначениях, и это означает, что bx ≪ ax .


x→−∞

xλ = o (xµ ) , xµ = o xλ .
x→∞ x→0 Теорема 7.1.14 (о шкале бесконечностей).
Справедливы соотношения
Доказательство.

xλ 1 C ≪ loga x ≪ xλ ≪ ax
(C∈R) x→+∞ (a>1) x→+∞ (λ>0) x→+∞ (a>1)
µ
= µ−λ −→ 0
x x x→∞
(7.1.16)
и это означает, что x λ µ
≪ x . Наоборот, или, в других обозначениях,
x→∞
C= o (loga x) , если a > 1,
xµ x→+∞

= xµ−λ −→ 0
xλ x→0 loga x = o xλ , если a > 1, λ > 0
x→+∞

и это означает, что xµ ≪ xλ . xλ = o (ax ) , если λ > 0, a > 1


x→0 x→+∞

Теорема 7.1.13 (о сравнении показательных Доказательство. Первое соотношение очевид-


функций). Если 0 < a < b, то но, потому что
 
C C
lim = =0
ax ≪ b x , b x ≪ ax x→+∞ loga x ∞
x→+∞ x→−∞
Докажем второе:
или, в других обозначениях,
loga x  правило 
lim = Лопиталя =
ax = o (bx ) , bx = o (ax ) . x→+∞ xλ
x→+∞ x→−∞ 1
(loga x)′ x·ln a
= lim = lim =
Доказательство. x→+∞ (xλ )′ x→+∞ λ · xλ−1
1 1 1
ax  a  x = lim = · lim =
= −→ 0 x→+∞ λ ln a · x · xλ−1 λ ln a x→+∞ xλ
bx b
|{z}
x→+∞  

= учитываем,
λ>0
что
=0
1
418 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

А теперь третье: λ · (λ − 1) · (λ − 2) · xλ−3


= lim = ... =
x→+∞ ax (ln a)3
xλ   (xλ )′  применяем правило Лопиталя 
правило
lim = Лопиталя = lim = = до тех пор, пока в числителе = ... =
x→+∞ ax x→+∞ (ax )′ λ−n
не получится x , где λ − n < 0
λxλ−1  
если λ − 1 > 0, то еще раз λ · (λ − 1) · (λ − 2) · ... · (λ − n + 1) · xλ−n
= lim x = применяем правило Лопиталя = = lim =
x→+∞ a ln a x→+∞ ax (ln a)n
   
λ · (λ − 1) · xλ−2 поскольку λ − n < 0, 0
= lim = = xλ−n −→ 0 = =0
x→+∞ ax (ln a)2 x→+∞ ∞
 
если λ − 2 > 0, то еще раз
= применяем правило Лопиталя =

Принцип выделения главного слагаемого. Символы ≪ и o, описанные в предыдущем па-


раграфе, бывают полезны в различных ситуациях при вычислении пределов. Самое простое их
применение описывается в следующей теореме.
Теорема 7.1.15 (о выделении главного слагаемого). Пусть даны несколько функций

A0 (x), A1 (x), ..., An (x),

причем при x → a функция A0 (x) бесконечно велика по сравнению с любой другой функцией из
этого списка:
A1 (x) ≪ A0 (x), A2 (x) ≪ A0 (x), ..., An (x) ≪ A0 (x) (7.1.17)
x→a x→a x→a

Тогда сумма этих функций эквивалентна A0 (x) при x → a:

A0 (x) + A1 (x) + A2 (x) + ... + An (x) ∼ A0 (x) (7.1.18)


x→a

Доказательство. Из (7.1.17) следует, что

A1 (x) = α1 (x) · A0 (x), A2 (x) = α2 (x) · A0 (x), ... An (x) = αn (x) · A0 (x),

где
α1 (x) −→ 0, α2 (x) −→ 0, ... αn (x) −→ 0
x→a x→a x→a

Поэтому

A0 (x) + A1 (x) + ... + An (x) = A0 (x) + α1 (x) · A0 (x) + ... + αn (x) · A0 (x) =
 
= 1 + α1 (x) + ... + αn (x) ·A0 (x) = θ(x) · A0 (x),
| {z }
обозначим это θ(x)

где
θ(x) = 1 + α1 (x) + ... + αn (x) −→ 1 + 0 + ... + 0 = 1.
x→a

То есть, выполняется (7.1.18).


• Функция A0 (x), для которой выполняются соотношения (7.1.17), называется главным сла-
гаемым в сумме A0 (x) + A1 (x) + A2 (x) + ... + An (x).
Теорема 7.1.15 применяется в следующей ситуации. Пусть нам необходимо вычислить предел

A0 (x) + A1 (x) + A2 (x) + ... + An (x)


lim
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

причем известно, что A0 (x) является главным слагаемым в сумме A0 (x)+ A1 (x)+ A2 (x)+ ...+ An (x),
а B0 (x) является главным слагаемым в сумме B0 (x) + B1 (x) + B2 (x) + ... + Bn (x):

A1 (x) ≪ A0 (x), A2 (x) ≪ A0 (x), ... An (x) ≪ A0 (x)


x→a x→a x→a

B1 (x) ≪ B0 (x), B2 (x) ≪ B0 (x), ... Bn (x) ≪ B0 (x)


x→a x→a x→a
§ 1. Асимптотические отношения и формулы 419

Тогда
A0 (x) + A1 (x) + A2 (x) + ... + An (x) ∼ A0 (x)
x→a

B0 (x) + B1 (x) + B2 (x) + ... + Bn (x) ∼ B0 (x)


x→a
и поэтому
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A0 (x)
lim = lim
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x) x→a B0 (x)
Таким образом, справедлив следующий важный принцип.

Теорема 7.1.16 (принцип выделения главного слагаемого). Вычисляя предел

A0 (x) + A1 (x) + A2 (x) + ... + An (x)


lim ,
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

следует выделить в числителе и знаменателе главные слагаемые, а все остальные – “второсте-


пенные” – просто зачеркнуть:
.
/ .
/ .
/
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A0 (x) + A1 (x) + A2 (x) + ... + An (x) A (x)
lim = lim .
/ .
/ / = lim 0
.
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x) x→a x→a B0 (x)
B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

Рассмотрим примеры.

⋄ 7.1.17. ⋄ 7.1.20. Здесь дробь та же, что и в предыдущем


примере, но, поскольку x → 0, главными слагае-
 по теореме 7.1.14 
(о шкале бесконечностей),
мыми, по той же теореме 7.1.12, будут наоборот,
x + ln x  ln x ≪ x,  минимальные степени у x:
 x→+∞ 
lim = кроме того, =
x→+∞ x2 + sin x   √
как легко проверить, 5x + 3 x − 2x5
sin x ≪ x2 lim √ =
x→+∞ x→0 x − 3x4 + 8 x
.
/ .
/ .
/
x + ln x √ √
x 5x + 3 x − 2x5 3 x 3
= lim .
/ = lim 2 = 0 = lim ./ .
/ = lim √ =
x→+∞ 2
x + sin x x→+∞ x
x→0 √ x→0 8 x 8
x − 3x4 + 8 x

⋄ 7.1.18. В следующем примере снова использу- ⋄ 7.1.21. Здесь используется теорема 7.1.13 (о
ется шкала бесконечностей (теорема 7.1.14): сравнении показательных функций): поскольку
√ x → +∞, главными слагаемыми будут степени с
2 x + 2 log5 x + 5 наибольшим основанием:
lim √ =
x→+∞ cos x + x − 1
.
/ .
/ 2x−1 − 3x+1 1 x x
√ √ 2 ·2 −3·3
2 x + 2 log5 x + 5 2 x lim = lim =
x→+∞ 2x+1 + 3x−1 x→+∞ 2 · 2x + 1 · 3x
= lim .
/ √ .
/ = lim √ = 2 .
/ 3
x→+∞
cos x + x − 1 x→+∞ x 1 x
2 2· − 3 · 3x −3 · 3x
= lim .
/ = lim 1 x = −9
⋄ 7.1.19. Здесь используется теорема 7.1.12 (о
x→+∞
2 · 2x + 1 · 3x x→+∞ 3 · 33
сравнении степенных функций): поскольку x →
∞, главными слагаемыми будут максимальные ⋄ 7.1.22. Здесь дробь та же, что и в предыду-
степени у x: щем примере, но, поскольку x → −∞, главными
слагаемыми, по той же теореме 7.1.13, будут на-

5x + 3 x − 2x5 оборот, степени с наименьшим основанием:
lim 4
√ =
x→∞ x − 3x + 8 x
.
/ .
/ 2x−1 − 3x+1 1 x x
√ 2 ·2 −3·3
5x + 3 x − 2x5 −2x 5 lim
x→−∞ 2x+1 + 3x−1
= lim
x→−∞ 2 · 2x + 1 · 3x
=
= lim . / .
/
√ = lim = .
/ 3
x→∞ x→∞ −3x4
x − 3x4 + 8 x 1 x x
2 ·2 −3·3
1 x
.
/ 2 ·2 1
−2x = lim = lim x
=
x→−∞ x→−∞ 2 · 2 4
= lim
x→∞ −3
=∞ 2 · 2x + 13 · 3x
420 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

3

x+ x
⋄ 7.1.23. В следующем примере мы сначала вы- 3. limx→+0 √5
sin x+ x2
деляем главное слагаемое, а затем применяем √3 x+ x

теорему 7.1.4 об эквивалентной замене: 4. limx→+∞ √5
sin x+ x2

.
/
2 10 5. limx→0 x+
ex −1
x
2
5x + 3x 10 5x + 3x √
lim = lim /
. = 6. limx→+∞ x+ x
x→0 2x5 + 7 sin x2 x→0 ex −1
2x5 + 7 sin x2 x x

  7. limx→0 2x2 +3
+x3
5x2 2 2 5x2 5 x
+3x
= lim = sin x ∼ x = lim = 8. limx→+∞ x2 2 +x
x→0 7 sin x2 x→0 x→0 7x2 7 3

2x +3x
⊲⊲ 7.1.24. 9. limx→−∞ x2 +x3
x 5 x+sin x
2 +x 10. limx→+∞ x+cos
1. limx→0 x2 +5x x
x
+x5
2. limx→+∞ x2 2 +5x

Эквивалентность модулей, степеней и логарифмов.


Теорема 7.1.25. Пусть даны две эквивалентные функции при x → a:

f1 (x) ∼ f2 (x)
x→a

Тогда
(i) модули этих функций тоже эквивалентны:

|f1 (x)| ∼ |f2 (x)|


x→a

(ii) степени этих функций (с произвольным показателем) тоже эквивалентны:

f1 (x)α ∼ f2 (x)α , α∈R


x→a

(iii) если вдобавок f2 (x) стремится к бесконечности или к нулю

f2 (x) −→ +∞ (или + 0)
x→a

то логарифмы этих функций (с произвольным основанием) эквивалентны:

loga f1 (x) ∼ loga f2 (x), 0 < a 6= 1


x→a

Доказательство.

1. f1 (x) ∼ f2 (x) ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1 ⇒


x→a x→a
⇒ |f1 (x)| = |θ(x)| · |f2 (x)| , |θ(x)| −→ 1 ⇒
x→a
⇒ |f1 (x)| ∼ |f2 (x)|
x→a
2. f1 (x) ∼ f2 (x) ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1 ⇒
x→a x→a
α α α α
⇒ f1 (x) = θ(x) · f2 (x) , θ(x) −→ 1 ⇒
x→a
⇒ f1 (x)α ∼ f2 (x)α
x→a
( (
+∞ +∞
3. f1 (x) ∼ f2 (x) −→ ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1, f2 (x) −→ ⇒
x→a x→a +0 x→a x→a +0
✯0

 loga θ(x) 
⇒ loga f1 (x) = loga θ(x) + loga f2 (x) = + 1 · loga f2 (x) ⇒
loga f2 (x)
❥∞

| {z }

1
§ 1. Асимптотические отношения и формулы 421

⇒ loga f1 (x) ∼ loga f2 (x)


x→a

Из этой теоремы следует, что при вычислении пределов с модулями, степенями или логариф-
мами также можно выделять главные слагаемые, но нужно только следить, чтобы аргументы у
логарифмов стремились к +∞ или к +0. Например,

|A0 (x) + A1 (x) + A2 (x) + ... + An (x)|


lim β
=
x→a (B0 (x) + B1 (x) + B2 (x) + ... + Bn (x))
.
/ .
/ /
.

A0 (x) + A1 (x) + A2 (x) + ... + An (x) |A0 (x)|
= lim  .
/ .
/ / β = x→a
. lim
x→a B0 (x)β
B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

Или, если B0 (x) −→ +∞ (или + 0),


x→a

α
(A0 (x) + A1 (x) + A2 (x) + ... + An (x))
lim =
x→a ln (B0 (x) + B1 (x) + B2 (x) + ... + Bn (x))
 .
/ /
. .
/ α
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A (x)α
= lim  .
/ .
/ /  = lim 0
.
x→a x→a ln B0 (x)
ln B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

И в таком духе. Рассмотрим несколько примеров.

.
/
⋄ 7.1.26. 2 ln(x2
+ x)
ln(x + x)
√ lim = lim .
/ =
| 3 x + 3x − 2x2 | x→+0 ln(x5 + x3 ) x→+0
ln(x5 + x3 )
lim √ =
x→+∞ x + x2 + x4
√./ .
/ ln x ln x 1
| 3 x + 3x − 2x2 | = lim = lim =
x→+0 ln x3 x→+0 3 ln x 3
= lim r. / .
/ =
x→+∞
2 4 ⋄ 7.1.30.
x +x +x
3 ln x + x − 2
| − 2x2 | 2x2 lim =
= lim √ = lim =2 x→+∞ ln |5 + x3 − e2x |
x→+∞ x4 x→+∞ x2 .
/ .
/
3 ln x + x − 2
⋄ 7.1.27. = lim .
/ .
/ =
√ x→+∞
ln 5 + x3 − e2x
| 3 x + 3x − 2x2 |
lim √ = x x 1
x→0 x + x2 + x4 = lim = lim =
√ .
/ .
/ x→+∞ 2x
ln |−e | x→+∞ 2x 2
| 3 x + 3x − 2x2 |
= lim r .
/ .
/ = ⊲⊲ 7.1.31. Вычислите пределы, обращая внима-
x→0
x + x2 + x4 ние на значение, к которому стремится аргумент
√ x: √
| 3 x| ln|x−2 ln x−3 x|
1. limx→+∞ √
1
= lim √ = lim x− 6 = ∞ 3 √
ln x+2x x−x2
x→0 x x→0 √
ln|x−2 ln x−3 x|
⋄ 7.1.28. 2. limx→0 √3 √
ln x+2x x−x2
√ √
.
/ ln(1+ x+ 3 x)
ln(x2
+ x) 3. limx→+∞ ln 1+ √ √
2
ln(x + x) ( 3 x+ 4 x)
lim = lim .
/ = √ √
ln(1+ x+ x) 3
x→+∞ ln(x5 + x3 ) x→+∞ 4. limx→0 ln 1+ √
ln(x5 + x3 ) ( 3 x+ 4 x)

√ √
ln( x+ x) 3
ln x2 2 ln x 2 5. limx→0 ln √ √
= lim = lim = ( 3
)
x+ 4 x
x→+∞ ln x5 x→+∞ 5 ln x 5 x
6. limx→+∞ ln(1+3x
ln(1+2 )
)
⋄ 7.1.29. ln(1+3x )
7. limx→0 ln(1+2x )
422 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

(b) Асимптотические формулы


В математическом анализе имеется специальный язык асимптотических формул, позволяющий
описывать различные связи между функциями с помощью символов o. Для  егопонимания доста-
точно просто знать, что если в какой-то формуле встречается символ o f (x) , то это означает,
x→a
что на этом местестоит некоторая (неизвестная) функция α(x), для которой справедливо соотно-
шение α(x) = o f (x) .
x→a

⋄ 7.1.32. Скажем, асимптотическая формула Выпишем несколько важных асимптотиче-


ских формул:
sin x = x + o (x)
x→0
sin x = x + o(x) (7.1.19)
означает, что x→0
tg x = x + o(x) (7.1.20)
sin x = x + α(x), где α(x) = o(x) x→0
x→0 2
x
cos x = 1 − + o(x2 ) (7.1.21)
Ее нетрудно доказать: 2 x→0
ln(1 + x) = x + o(x) (7.1.22)
sin x = x+ o (x) ⇔ sin x−x = o (x) ⇔ x→0
x→0 x→0 x
sin x − x loga (1 + x) = + o(x) (7.1.23)
⇔ −→ 0 ⇔ ln a x→0
x x→0
ex = 1 + x + o(x) (7.1.24)
sin x sin x x→0
⇔ − 1 −→ 0 ⇔ −→ 1
x x→0 x x→0 ax = 1 + x · ln a + o(x) (7.1.25)
x→0
Последнее соотношение верно, поскольку пред-
ставляет собой первый замечательный предел. (1 + x)α = 1 + αx + o(x) (7.1.26)
x→0

⋄ 7.1.33. Или вот такая асимптотическая фор- arcsin x = x + o(x) (7.1.27)


x→0
мула:
x2 arctg x = x + o (x) (7.1.28)
x→0
cos x = 1 − + o(x2 )
2 x→0
Доказательство. Все эти формулы легко выво-
Она означает, что
дятся из (7.1.5) – (7.1.14). В качестве примера
x2 рассмотрим (7.1.25):
cos x = 1 − + α(x), где α(x) = o(x2 )
2 x→0
формула (7.1.25)
и доказать ее также нетрудно: ↓
z }| {
x2 ax = 1 + x · ln a + o (x) ⇔
x→0
cos x = 1 − + o(x2 ) ⇔ x
2 x→0 ⇔ a − 1 − x · ln a = o(x) ⇔
2 x→0
x
⇔ cos x − 1 + = o(x2 ) ⇔ ax − 1 − x · ln a
2 x→0 ⇔ −→ 0 ⇔
2
x x→0
cos x − 1 + x2 ax − 1
⇔ −→ 0 ⇔ ⇔ − ln a −→ 0 ⇔
x2 x→0 x x→0
cos x − 1 1 cos x − 1 1 ax − 1
⇔ 2
+ −→ 0 ⇔ 2
−→ − ⇔ −→ ln a ⇔
x 2 x→0 x x→0 2 x x→0
ax − 1
Последнее соотношение доказывается напрямую: ⇔ −→ 1 ⇔ ax − 1 ∼ x · ln a
x · ln a x→0 |
x→0
{z }
cos x − 1  правило  − sin x ↑
lim = Лопиталя = lim = формула (7.1.11)
x→0 x2 x→0 2x
  − cos x 1
= снова правило
Лопиталя = lim =−
x→0 2 2
§ 1. Асимптотические отношения и формулы 423

Связь между асимптотической эквивалентностью и асимптотическим сравнением. Свя-


зи между формулами (7.1.19) – (7.1.28) и (7.1.5) – (7.1.14) отражают важную общую зависимость
между символами ∼ и o:

Теорема 7.1.34 (о связи между символами ∼ и o). Следующие утверждения эквивалентны:


(i) f (x) ∼ g(x);
x→a
(ii) f (x) = g(x) + o (g(x));
x→a
(iii) g(x) = f (x) + o (f (x)).
x→a

Доказательство. Докажем, что (ii) ⇔ (i):

(ii) ⇔ f (x) = g(x) + o (g(x)) ⇔ f (x) − g(x) = o (g(x)) ⇔


x→a x→a
⇔ f (x) − g(x) = α(x) ·g(x) ⇔ f (x) = (1 + α(x)) ·g(x) ⇔ f (x) ∼ g(x) ⇔ (i)
| {z} | {z } x→a
↓ ↓
0 1

А теперь – что (iii) ⇔ (i):

уже доказано свойство 3◦ , с.414


(iii) ⇔ g(x) = f (x) + o (f (x)) ⇔ g(x) ∼ f (x) ⇔
x→a x→a
⇔ f (x) ∼ g(x) ⇔ (i)
x→a

Равенство асимптотических выражений и свойства символа o. До сих пор мы рассматри-


вали асимптотические формулы, в которых символ o встречается только один раз, и в тех случаях,
когда o выражался через остальные элементы формулы, смысл этих формул был очевиден. Но в
этой науке приходится иметь дело также с формулами, где o встречается несколько раз, и для
придания смысла таким формулам необходима некая предварительная работа.
Сначала нужно определить понятие асимптотического выражения. Это то, что стоит справа в
формулах (7.1.19)-(7.1.27). Точное определение выглядит так:
• Асимптотическим выражением называется запись, полученная из числовых выраже-
ний2 с помощью следующих операций:
1) всякое числовое выражение считается асимптотическим выражением,
2) если A – асимптотическое выражение, то запись o (A) тоже считается асимп-
x→a
тотическим выражением,
3) если A – асимптотическое выражение, то подстановкой вместо произвольной
переменной, входящей в A, но не в связке вида x → a, любого другого асимпто-
тического выражения B, мы снова получаем асимптотическое выражение.

⋄ 7.1.35. Следующие записи являются асимпто- ⋄ 7.1.36. Следующие записи, наоборот, не явля-
тическими выражениями: ются асимптотическими выражениями:
 
o (x), o (x)
sin x, o (sin x), sin o (x) sin x→0 o (1)→0
x→0 x→0 x→0

К асимптотическим выражениям нужно относиться как к выражениям (в главе про логику они
назывались термами), описывающим семейства функций: когда вместо каждого входящего символа
o мы подставляем выражение, описывающее какую-то функцию (со свойством этого символа
x→a

2 Числовые выражения были определены на с.((a)).


424 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

o ), мы получаем выражение, описывающее определенную стандартную функцию. Говорят, что


x→a
два асимптотических выражения равны, если они описывают один и тот же класс функций:
 
A = B ⇐⇒ f (x) = A ⇐⇒ f (x) = B

⋄ 7.1.37. Докажем равенство: Действительно,

x + o (x) = x + o (2x)
x→0 x→0 f (x) = o (x) + o (x2 ) ⇔
x→0 x→0
Действительно,
⇔ ∃α, β f (x) = α(x) ·x + β(x) ·x2 =
|{z } |{z}
f (x) = x+ o (x) ⇔ f (x)−x = o (x) ⇔ ↓ ↓
x→0 x→0 0 0
f (x) − x  
⇔ −→ 0 ⇔ = α(x) + β(x) ·x ·x ⇔
x x→0 | {z} |{z} ↓
0
f (x) − x ↓ ↓
⇔ −→ 0 ⇔ 0 0
2x x→0 | {z }
⇔ f (x) − x = o (2x) ⇔ ⇓
x→0 γ(x) = α(x) + β(x) · x −→ 0
x→0
⇔ f (x) = x + o (2x). ⇔ ∃γ f (x) = γ(x) ·x ⇔
x→0
|{z}
⋄ 7.1.38. Покажем, что следующее равенство, ↓
0
наоборот, неверно: |{z}
 ⇓
x + o (x) = o (1) α(x) = γ(x) −→ 0
x→0
x→0 x→0
β(x) = 0 −→ 0
x→0
Для этого достаточно найти какую-нибудь функ-
⇔ f (x) = o (x)
цию f , которая принадлежала бы второму клас- x→0
су
f (x) = o (1) Предпоследнюю равносильность надо понимать
x→0
так, что из существования α и β с нужными свой-
но не первому:
ствами следует существование γ, в качестве ко-
f (x) 6= x + o (x). торой можно взять γ(x) = α(x)+β(x)·x, и наобо-
x→0
рот, из существования γ с нужными свойствами
Такой функцией будет, например, следует существование α и β, в качестве которых
√ можно взять α(x) = γ(x), β(x) = 0.
f (x) = 3 x.

Для нее мы получим: ⋄ 7.1.40. Покажем, что

f (x) √ o (x) + o (x2 ) 6= o (x2 ),


= 3 x −→ 0 ⇔ f (x) = o (1). x→0 x→0 x→0
1 x→0 x→0

А с другой стороны, Здесь достаточно предъявить функцию f со


√ свойствами
f (x) − x 3
x−x 1 
= = √ − 1−→ 0 ⇒
x x 3
x2 x→0 f (x) = o (x) + o (x2 ) & f (x) 6= o (x2 ),
x→0 x→0 x→0
⇒ f (x)−x 6= o (x) ⇒ f (x) 6= x+ o (x).
x→0 x→0

⋄ 7.1.39. Покажем, что Такой функцией будет, например,

o (x) + o (x2 ) = o (x), 4


f (x) = x 3 .
x→0 x→0 x→0

Свойства символа o:
    
1o C · o f (x) = o C · f (x) = o f (x) , C 6= 0;
x→a x→a x→a
     
2o o f (x) ± o f (x) = o f (x) ;
x→a x→a x→a
§ 1. Асимптотические отношения и формулы 425
       
3o o f (x) · o g(x) = o f (x) · g(x) = f (x) · o g(x) ;
x→a x→a x→a x→a
    
4o o o f (x) = o f (x) .
x→a x→a x→a
5o o (f (x)) = f (x) · o (1);
x→a x→a
o
6 o (1) −→ 0;
x→a x→a
   
o
7 f (x) ∼ g(x) ⇒ o f (x) = o g(x) ;
x→a x→a x→a
  µ  
8o f (x) + o f (x) = f (x) + o f (x)µ , µ 6= 0.
µ
x→a x→a

Доказательство. 1. Докажем 1o : во-первых,

u(x) = C· o (f (x)) ⇔ u(x) = C·α(x) ·f (x) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = o (C·f (x)),
x→a | {z } |{z } x→a
↓ ↓
0 0

и, во-вторых,
C6=0
u(x) = o (C·f (x)) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = C · α(x) ·f (x) ⇔ u(x) = o (f (x)).
x→a | {z} | {z } x→a
↓ ↓
0 0

2. Докажем 2o :
    
u(x) = o (f (x) ± o f (x) ⇔ u(x) = α(x) ·f (x) ± β(x) ·f (x) = α(x) ± β(x) ·f (x) ⇔
x→a x→a | {z } |{z} | {z }
↓ ↓

0 0
0
| {z }

γ(x) = α(x) ± β(x) −→ 0
x→0
 
⇔ u(x) = γ(x) ·f (x) ⇔ u(x) = o f (x)
|{z} x→a

0
|{z}
 ⇓
α(x) = γ(x) −→ 0
x→0
β(x) = 0 −→ 0
x→0

3. Докажем 3o : во-первых,
     
u(x) = o f (x) · o g(x) ⇔ u(x) = α(x) ·f (x) · β(x) ·g(x) = α(x) · β(x) ·f (x) · g(x) ⇔
x→a x→a | {z} |{z} | {z }
↓ ↓

0 0
0
| {z }

γ(x) = α(x) · β(x) −→ 0
x→0
 
⇔ u(x) = γ(x) ·f (x) · g(x) ⇔ u(x) = o f (x) · g(x) ,
|{z} x→a

0
|{z}

 2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 13 −→ 0
x→0

и, во-вторых,
 
u(x) = o f (x) · g(x) ⇔ u(x) = α(x) ·f (x) · g(x) = f (x) · α(x) ·g(x) ⇔
x→a | {z} |{z }
↓ ↓
0 0
426 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
 
⇔ u(x) = f (x) · o g(x) .
x→a
o
4. Докажем 4 :
    
u(x) = o o f (x) ⇔ u(x) = α(x) · o f (x) ⇔
x→a x→a |{z } x→a

0
 
⇔ u(x) = α(x) · β(x) ·f (x) = α(x) · β(x) ·f (x) ⇔
| {z} |{z} | {z }
↓ ↓

0 0
0
| {z }

γ(x) = α(x) · β(x) −→ 0
x→0
 
⇔ u(x) = γ(x) ·f (x) ⇒ u(x) = o f (x)
|{z} x→a

0
|{z}

 2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 31 −→ 0
x→0

5. Для доказательства 5o можно воспользоваться вторым равенством в уже доказанном свойстве


o
3 :
o (f (x)) = o (f (x) · 1) = f (x) · o (1)
x→a x→a x→a
o
6. Докажем 6 :
u(x) = o (1) ⇔ u(x) = α(x) ·1 ⇔ u(x) −→ 0.
x→a | {z} x→a

0

7. Докажем 7o : Пусть f (x) ∼ g(x), то есть


x→a

f (x) = θ(x) ·g(x)


|{z}

1

Тогда
   
u(x) = o f (x) ⇔ u(x) = α(x) ·f (x) = α(x) · θ(x) ·g(x) = α · θ(x) ·g(x) ⇔ u(x) = o g(x)
x→a |{z } | {z} |{z} | {z } x→a
↓ ↓ ↓ ↓
0 0 1 0

8.
  µ
u(x) = f (x) + o f (x) ⇔
x→a
 µ    µ  µ
⇔ u(x) = f (x) + α(x) ·f (x) = 1 + α(x) ·f (x) = 1 + α(x) ·f (x)µ ⇔
|{z } | {z } | {z }

↓ ↓
0
1 1
Теорема 7.1.34
 
⇔ u(x) ∼ f (x)µ ⇔ u(x) = f (x)µ + o f (x)µ
x→a x→a

Упрощение асимптотических многочленов. Асимптотические многочлены, о которых пой-


дет здесь речь, представляют собой частный случай асимптотических выражений.
• Простым асимптотическим многочленом называется запись вида
a1 · xλ1 + a2 · xλ2 + ... + an · xλn + o (xµ ),
x→0

где ai ∈ R, λi , µ, n ∈ N. При этом,


§ 1. Асимптотические отношения и формулы 427

— каждое выражение ai · xλi (вне символа o ) называется неасимптотическим


x→0
мономом, а числа ai и λi – его коэффициентом и степенью,
— выражение xµ (под символом o ) называется асимптотическим мономом, а
x→0
число µ называется асимптотической степенью этого асимптотического мно-
гочлена.
— если в асимптотическом многочлене есть неасимптотический моном ak · xλk с
ненулевым коэффициентом (ak 6= 0) и со степенью (λk ), меньшей чем все осталь-
ные степени,
λk < λi , i 6= k,
и не превосходящей асимптотической степени,

λk 6 µ,

то он называется главным мономом, а число λk — главной степенью этого асимп-


тотического многочлена.
• Асимптотическим многочленом называется запись, составленная из простых асимпто-
тических многочленов, применением конечного числа операций
— умножение на число (когда из асимптотического многочлена A составляется
выражение α · (A)), или
— сложения (когда из двух асимптотических многочленов A и B составляется вы-
ражение (A) + (B)), или
— умножения (когда из двух асимптотических многочленов A и B составляется
выражение (A) · (B)), или
— композиции (когда в один асимптотический многочлен A вместо переменной x
подставляется другой асимптотический многочлен B).
Главный навык, которому учит эта наука, состоит в умении упрощать асимптотические много-
члены. Его можно неформально описать правилом

“меньшие степени переменной поглощают большие”

Это надо понимать не буквально, а со следующими уточнениями. Во-первых, напомним, что в


теореме 7.1.12 мы доказали формулу

xµ ≪ xλ , λ < µ, (7.1.29)
x→0

или, что эквивалентно, формулу


xµ = o (xλ ), λ < µ.
x→0

Она позволяет выделять главное слагаемое в линейных комбинациях элементарных функций, в


частности, в многочленах. Для асимптотических многочленов это правило нужно дополнить сле-
дующей важной теоремой, которая позволяет не только выделять главное слагаемое, но описывает
вообще всю процедуру упрощения.

Теорема 7.1.41. Если λ 6 µ, то


xλ ≫ o (xµ ). (7.1.30)
x→0 x→0
и
o (xλ ) ± o (xµ ) = o (xλ ). (7.1.31)
x→0 x→0 x→0

Если же λ < µ, то
o (xλ ) + C · xµ = o (xλ ). (7.1.32)
x→0 x→0

Доказательство. 1. Условие (7.1.30) эквивалентно условию

o (xµ )
x→0
−→ 0,
xλ x→0
428 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

которое при λ 6 µ действительно выполняется:

o (xµ ) xµ · o (1)
x→0 x→0 µ−λ
= = |x {z } · o (1) −→ 0 .
xλ xλ x→0
| {z
x→0
}
ограничено
o
в окрестности свойство 6 на с. 425
нуля при
µ−λ> 0

2. Условие (7.1.31) доказывается цепочкой

u(x) = o (xλ ) ± o (xµ ) ⇔


x→0 x→0
⇔ u(x) = α(x) ·xλ ± β(x) ·xµ = α(x) ·xλ ± β(x) · µ−λ
|x {z } ·xλ =
|{z } |{z} |{z } |{z}
↓ ↓ ↓ ↓ ограничено
0 0 0 0 в окрестности
нуля при
µ−λ> 0
 
= α(x) ·xλ ± β(x) · xµ−λ ·xλ = α(x) ± β(x) · xµ−λ ·xλ ⇔
|{z } | {z } | {z }
↓ ↓

0 0
0

⇔ u(x) = γ(x) ·xλ ⇔ u(x) = o (xλ ).


|{z} x→0

0

3. Условие (7.1.32) доказывается цепочкой

u(x) = o (xλ ) + C · xµ ⇔
x→0
 
⇔ xµ−λ} ·xλ = α(x) + C · xµ−λ ·xλ
u(x) = α(x) ·xλ + C · xµ = α(x) ·xλ + |C · {z ⇔
| {z} |{z } | {z }
↓ ↓ ↓
0 ↓
0 0
(µ − λ > 0) 0

⇔ u(x) = β(x) ·xλ ⇔ u(x) = o (xλ ).


|{z} x→0

0

Перечислим важные следствия из теорем ⋄ 7.1.45. В качестве иллюстрации можно приве-


7.1.41 и 7.1.12. Во-первых, из (7.1.32) мы полу- сти такой пример:
чаем
Следствие 7.1.42. В простом асимптотиче- x + x2 + o (x2 ) + 2x + o (x) =
x→0 x→0
ском многочлене все неасимптотические моно- .
/
мы со степенями, большими асимптотической = 3x + x + o (x2 ) + o (x) =
2
x→0 x→0
степени можно без потери информации обну- .
/
2
лять. = 3x + x + o (x) = 3x + o (x).
|{z} x→0 x→0

⋄ 7.1.43. Например, ↑
здесь применяется
следствие 7.1.42
2x + 4x2 − 2x3 + 5x4 + o (x2 ) =
x→0
.
/ .
/
= 2x + 4x − 2x + 5x4 + o (x2 ) =
2 3 Во-третьих, из (7.1.29) и (7.1.30) мы получаем
x→0
Следствие 7.1.46. Главный моном простого
= 2x + 4x + o (x2 )
2
x→0
асимптотического многочлена ak · xαk (если
Во-вторых, из (7.1.31) следует он существует) является главным слагаемым
Следствие 7.1.44. При сложении асимптоти- этого многочлена:
ческих многочленов меньшая асимптотическая
степень поглощает большую. ak ·xαk ≫ ai ·xαi (i 6= k), ak ·xαk ≫ o (xβ ).
x→0 x→0 x→0
§ 1. Асимптотические отношения и формулы 429
 
(и поэтому весь многочлен эквивалентен свое- x + x2 + o (x2 ) + o x + x2 + o (x2 ) =
x→0 x→0 x→0
му главному моному).
= (следствие 7.1.48) = x + x + o (x2 )+
2

⋄ 7.1.47. Например,  .
/ .
/ 
x→0
2 2
+ o x + x + o (x ) =
2x + 4x2 − 2x3 + 5x4 + o (x2 ) ∼ 2x x→0 x→0
x→0 x→0
= x + x2 + o (x2 ) + o (x) = (следствие 7.1.44) =
x→0 x→0
Из следствия 7.1.46 и свойства 7o на с.425 мы .
/
получаем = x + x + o (x ) + o (x) = x + x2 + o (x) =
2 2
x→0 x→0 x→0
.
/
Следствие 7.1.48. При подстановке простого = (следствие 7.1.42) = x+x2+ o (x) = x+ o (x)
x→0 x→0
асимптотического многочлена A в символ o
x→0
возникающий асимптотический многочлен ра-
⋄ 7.1.51.
вен как асимптотическое выражение бесконеч-
но малому от главного монома: o (xαk ), где αk  2
x→0
– главная степень многочлена A. x + x2 + o (x2 ) =
x→0
   
⋄ 7.1.49. = x + x + o (x2 ) · x + x2 + o (x2 ) =
2
x→0 x→0
   2
o 2x + 4x2 − 2x3 + 5x4 + o (x2 ) = 2
=x +x +4 2
o (x ) + 2x + x o (x ) + x2 o (x2 ) =
3 2
x→0 x→0 x→0 x→0 x→0
 .
/ .
/ .
/ /
.      
2 3 4 2
= o 2x + 4x − 2x + 5x + o (x ) = = x +x + o x +2x + o x + o x4 =
2 4 4 3 3
x→0 x→0 x→0 x→0 x→0
= o (x) = (следствие 7.1.44) =
x→0 .
/    .
/ 
= x + x + o x4 + 2x3 + o x3 + o x4 =
2 4
Теперь рассмотрим примеры, где применяет- x→0
 
x→0 x→0
ся много правил. 2 4 3 3
= x + x + 2x + o x = (следствие 7.1.42) =
x→0
⋄ 7.1.50. .
/    
= x2 + x4+ 2x3 + o x3 = x2 + 2x3 + o x3
x→0 x→0

Последний пример особенно важен, и поэтому будет полезно найти более экономный способ
упрощать подобные выражения. Представим себе, что нам нужно упростить асимптотическое вы-
ражение
     
A0 xl + A1 xl+1 + ... + Ak xl+k + o xl+k · B0 xm + A1 xm+1 + ... + An xm+n + o xm+n
x→0 x→0
(7.1.33)
Для этого можно пользоваться следующим алгоритмом.

Алгоритм экономного раскрытия скобок


при упрощении асимптотических многочленов:

1. Мысленно раскрываем скобки, и находим сначала минимальную степень M переменной x,


которая может получиться под символом o. В нашем случае, если A0 6= 0, B0 6= 0, получается

M = min{l + m + n, l + k + m}.

Это будет означать, что после упрощения наше выражение должно оканчиваться символом
 
o xM
x→0

2.
 Последствию 7.1.42 все слагаемые со степенями µ > M при упрощении “съедаются” слагаемым
o xM :
x→0 .
/    
xµ + o xM = o xM
x→0 x→0

Поэтому, раскрывая скобки, мы должны лишь найти коэффициенты перед степенями xi , i 6 M .


Это делается так же, как при обычном умножении многочленов.

Покажем, как этот алгоритм действует на конкретных примерах.


430 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
 
⋄ 7.1.52. Рассмотрим еще раз выражение из степень x2 тоже
x2 : 0 ;
получиться не может
примера 7.2:  3

степень x может получиться,
 2 x3 : 1 когда x умножается ;
на x и еще раз на x
x + x2 + o (x2 ) = !
x→0 степень x3 может
    4 получиться в трех случаях,
= x + x2 + o (x2 ) · x + x2 + o (x2 ) x :1+1+1=3 когда в разных вариантах x .
x→0 x→0 умножается на x и на x2

1. Сначала замечаем, что минимальная сте- 3. Выписыаем результат:


пень переменной x, стоящая под символом o, ко-  3  
торая может получиться при раскрытии скобок x + x2 + o (x2 ) = x3 + 3x4 + o x4
равна 3. Это получается, когда слагаемое x умно- x→0 x→0

жается на слагаемое o (x2 ). Значит, наше упро- ⋄ 7.1.54. Упростим выражение


x→0
щенное выражение должно оканчиваться на   
1 3 
2 3 3 5 6
3
o (x ) x − x + o (x ) · 2x + x + o (x )
x→0
2 x→0 x→0

2. Выписываем коэффициенты перед степе- 1. Замечаем, что минимальная степень пере-


нями xλ , λ 6 3, которые получаются при рас- менной x, стоящая под символом o, которая мо-
крытии скобок: жет получиться при раскрытии скобок равна 6.
Это получается, когда слагаемое o (x3 ) умно-
при раскрытии скобок; x→0
0
x :0 степень x0 вообще ; жается на слагаемое 2x3 . Значит, наше упрощен-
получиться не может ное выражение должно оканчиваться на
 
x1 : 0 степень x1  
тоже получиться не может ; o x6
  x→0
степень x2 может получиться,
x2 : 1 когда x умножается на x ;
  2. Выписываем коэффициенты перед степе-
3
степень x может получиться,
2
нями xi , i 6 6, которые получаются при раскры-
x3 : 1 + 1 = 2  когда x умножается на x , . тии скобок:
и когда наоборот
x2 умножается на x  
при раскрытии скобок степень x0
x0 : 0 вообще получиться не может ;
3. Выписываем результат:
x1 : 0 (−′′ −);
 2  
x + x2 + o (x2 ) = x2 + 2x3 + o x3 x2 : 0 (−′′ −);
x→0 x→0
x3 : 0 (−′′ −);
⋄ 7.1.53. Упростим выражение, отличающееся x4 : 0 (−′′ −);
от 7.2 степенью:  5

степень x может получиться,
x5 : 2 2
когда x умножается на 2x 3 ;
 3  
x + x2 + o (x2 ) = x6 : −1 степень x6 может получиться,
.
x→0 когда − 1 x3 умножается на 2x3
    2

= x + x + o (x2 ) · x + x2 + o (x2 ) ·
2
3. Выписываем результат:
x→0 x→0
 
· x + x + o (x2 )
2   
1
x→0
x2 − x3 + o (x3 ) · 2x3 + x5 + o (x6 ) =
2 x→0 x→0
1. Сначала замечаем, что минимальная сте-
пень переменной x, стоящая под символом o, ко- = 2x5 − x6 + o (x6 )
x→0
торая может получиться при раскрытии скобок
равна 4. Это получается, когда два слагаемых x ⊲⊲ 7.1.55.

Упростите выражения:
2
2
умножаются на слагаемое o (x ). Значит, наше 1. −x2 + 32 x3 + o (x3 )
x→0 x→0
упрощенное выражение должно оканчиваться на  3
  2. 2
−x + 3 x + o (x3 )
2 3
x→0
o x4  2
x→0 1 3
3. 3x + 5x + o (x4 )
x→0
2. Выписываем коэффициенты перед степе-  3
1 3
нями xi , i 6 4, которые получаются при раскры- 4. 3x + 5x + o (x4 )
x→0

тии скобок:    
5. 3x2 + 1 3
4x + o (x3 ) · −2x + x2 + o (x2 )
при раскрытии скобок x→0 x→0
   
x0 : 0 степень x0 вообще ; 6. 3x2 + 1 3 3
· −2x + x2 + o (x3 )
получиться не может 4 x + o (x )
x→0 x→0
     
степень x1 тоже
x1 : 0 получиться не может ;
7. 3x2 + 1 3 4
4 x + o (x )
x→0
· −2x + x2 + o (x3 )
x→0
§ 1. Асимптотические отношения и формулы 431
   
8. 4x + 3x2 − 2x3 + x4 + o (x4 ) · · −x + x2 + x3 − x4 + o (x4 )
x→0 x→0
 
 
· −x + x2 + x3 − x4 + o (x4 )
x→0 10. 4x + 3x2 − 2x3 + x4 + o (x5 ) ·
x→0
   
9. 4x + 3x2 − 2x3 + x4 + o (x5 ) · · −x + x2 + x3 − x4 + o (x5 )
x→0 x→0

Вычисление пределов с помощью асимптотических формул Объясним теперь, зачем нуж-


ны асимптотические формулы. Рассмотрим предел

x6 · arctg4 x + sin5 sin tg x2


lim (7.1.34)
x→0 x2 · sin8 x + ln cos 3x5
Для его вычисления не подходит теорема об эквивалентной замене 7.1.4, или принцип выделения
главного слагаемого 7.1.16 (не говоря уже о правиле Лопиталя 6.2.1, которое пришлось бы здесь
применять 10 раз).
Так вот, в этой ситуации как раз бывают полезны асимптотические формулы. Вместе с доказан-
ными в предыдущем параграфе свойствами 10 − 110 , они позволяют вычислять такие “сложные”
пределы. Покажем как это делается, начиная с более простых задач.

 
⋄ 7.1.56.
2 2
− x2 + o (x2 ) + o − x2
x→0 x→0
= lim =
arcsin 2x − sin x используем формулы x→0 x2 · ln 2 + o (x2 )
lim = (7.1.19) и (7.1.27) = x→0
x→0 x + ln(1 + 3x) 2 
    − x2 + o (x2 ) + o x2
используем x→0 x→0
2x + o (2x) − x + o (x) = свойство 1o = lim =
= lim x→0
 x→0
 = x→0 x2 · ln 2 + o (x2 )
x→0
x→0
x + 3x + o (3x) 2
x→0   − x2 + o (x2 )
снова x→0
x + o (x) − o (x) x + o (x) = используем 20 = lim =
= lim x→0 x→0
= lim x→0
=
x→0 x2 · ln 2 + o (x2 )
x→0
x→0 4x + o (x) x→0 4x + o (x) 2
x→0 x→0
  − x2 + x2 o (1)
1 + o (1) после этого x→0
x→0 1+0 1 = свойство 6o = lim =
= lim = = x→0 x2 · ln 2 + x2 o (1)
x→0 4 + o (1) 4+0 4 x→0
x→0
  − 21 + o (1)
делим все x→0
⋄ 7.1.57. = на x2 = lim =
x→0 ln 2 + o (1)
x→0
ln(cos x) используем формулы   − 21 + 0 1
lim 2 = (7.1.21) и (7.1.24) = = применяем
= =−
x→0 2x − 1 свойство 7o
 2
 ln 2 + 0 2 ln 2
ln 1 − x2 + o (x2 )
= lim x→0
= ⋄ 7.1.58.
x→0 x2 · ln 2 + o (x2 )
x→0  1 
 x2
 1 ln (x+ex ) x
lim (x + ex ) x = lim e
2
поскольку − 2 + o (x ) −→ 0, =
x→0 x→0
 можно сделать замену  x→0 x→0
 2
y = − x2 + o (x2 ),
 1 x limx→0 1
x ·ln(x+1+x+x→0
o (x))
  = elimx→0 x ·ln(x+e )
=e =
 x→0
и тогда получится, что y −→ 0, 
 x→0  limx→0 1
x ·ln(1+2x+x→0
o (x))
=
 и по формуле
 (7.1.22) мы будем
 иметь  =
 =e =
 2
ln 1 − x2 + o (x2 ) = 
 x→0  2x
 

= ln(1 + y) = y + o (y) =
 y→0   z }| { 
2 2
= − x2 + o (x2 ) + o − x2 + o (x2 ) limx→0 1
x· 2x+ o (x)+ o
x→0 x→0
2x + o (x)
x→0 x→0

x→0
 =e x→0 =
2 2  
− x2 + o (x2 ) + o − x2 + o (x2 ) limx→0 1
x · 2x+ o (x)+ o (2x)
x→0 x→0 x→0
= lim = =e x→0 x→0
=
x→0 x2 · ln 2 + o (x2 )  
x→0 1
  limx→0 x · 2x+ o (x)+ o (x)
используем =e x→0 x→0
=
= свойство 3oo =  
 .
/  limx→0 1
x · 2x+ o (x)
2
− x2 + o (x2 ) + o
2
− x2 + o (x2 ) =e x→0
=
 
x→0 x→0 x→0
= lim = limx→0 1
x ·x· 2+ o (1)
x→0 x2 · ln 2 + o (x2 ) =e x→0
=
x→0
432 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
  1 1 1 1
limx→0 2+ o (1) 4 o (x 4 ) + 3x 4 − 2( o (x 4 ) + o (x 4 ))
=e x→0
= e2+0 = e2 = lim x→0
2
x→0
2
x→0
2 =
1
x→0 o (x 7 )
2 x→0 + o (x 7 ) + x 7
x→0
⋄ 7.1.59. Вернемся теперь к примеру (7.1.34):  
применяем
= свойства 10 и 20 §7 =
x6 · arctg4 x + sin5 sin tg x2
lim = 1 1 1
x→0 x2 · sin8 x + ln cos 3x5
  4  5  o (x 4 ) + 3x 4 − 2( o (x 4 ))
x→0 x→0
= lim x6 · x + o (x) + sin tg x2 + o (sin tg x2 ) : = lim 2 2 =
(
x→0 x→0
!)
x→0 x→0 o (x 7 ) + x 7
 8  5 2 x→0
: x2 · x + o (x) + ln 1−
(3x )
+ o (3x5 )2 =
 
применяем
x→0 2 x→0
= свойства 10 и 30 §7 =
(  
6 4 4 1 1 1
= lim x · x + o (x ) + o (x 4 ) + 3x 4 − o (x 4 )
x→0 x→0
x→0 x→0
  !5 ) = lim 2 2 =
+ tg x2 + o (tg x2 ) + o tg x2 + o (tg x2 ) :
x→0 o (x 7 ) + x 7
x→0 x→0 x→0 x→0
1 1
( !)
 
9x10   o (x 4 ) + 3x 4
: x2 · x8 + o (x8 ) + ln 1− + o 9x10 = x→0
x→0 2 x→0 = lim 2 2 =
  5 
x→0 o (x 7 ) + x 7
x→0
= lim x10 + o (x10 ) + tg x2 + o (tg x2 ) : 1 1
x→0
(
x→0 x→0
x 4 · o (1) + 3x 4
10   x→0
: x10 + o (x10 ) −
9x
+ o 9x10 +
= lim 2 2 =
x→0 2 x→0 x→0 x 7 · o (1) + x 7
!) x→0
9x10  
+ o − + o 9x10 = o (1) + 3
x→0 2 x→0 x→0
(
= lim 1 1 =
10 10
x 28 · o (1) + x 28
x→0
= lim x + o (x )+ x→0
x→0 x→0
   0+3 
  ) по свойству 80 §7
 5 = o (1) −→ 0 = =∞
+ x2 + o (x2 ) + o
x→0
x2 + o (x2 )
x→0
:
x→0
x→0 x→0 0·0+0
( )
10 10 9x10 
10
 ⋄ 7.1.61.
: x + o (x ) − + o x =
x→0 2 x→0
√ √
 5 4 3 x + 3 4 x − 2 sin x
x10 + o (x10 ) + x2 + o (x2 ) lim √7
=
= lim
x→0 x→0
=
x→∞ 1 − cos x + x2
10
x→0 − 7x2 + o (x10 ) 1 1
x→0 4x 3 + 3x 4 − 2 sin x
x10 + o (x10 ) + x10 + o (x10 )
= lim 2 =
x→0 x→0 x→∞ 1 − cos x + x 7
= lim
x→0 10
− 7x2 + o (x10 )
=  1 1 
x→0 x4 = o (x 3 )
x→∞
2x10 + o (x10 ) 2 + o (1)  sin x = o (x 31 ) 
x→0 x→0  
= lim 10
= lim
− 72 + o (1)
= = x→∞
2  =
x→0 − 7x2 + o (x10 )
x→0
x→0
x→0
o (x 7 )
cos x = x→∞
2
2+0 4 1= o (x 7 )
= =− x→∞
− 72 + 0 7 1 1 1
4x 3 + 3 o (x 3 ) − 2 o (x 3 )
x→∞ x→∞
⋄ 7.1.60. = lim 2 2 2 =
x→∞ o (x 7 ) − o (x 7 ) + x 7
x→∞ x→∞
√ √ 1 1
4 3 x + 3 4 x − 2 sin x 4x 3 + o (x 3 )
lim √ = x→∞
x→0 1 − cos x + x2
7
= lim 2 2 =
  x→∞ o (x 7 ) + x 7
= применяем формулы
(7.1.19) и (7.1.21) = x→∞
1 1
1 1
4x 3 + x 3 · o (1)
x→∞
4x + 3x − 2(x + o (x))
3 4 = lim 2 2 =
x→0 x→∞ x · o (1) + x 7
= lim 1 2 2 = 7
x→∞
x→0
2x + o (x2 ) + x 7
1 1
x→0
 1 1
 4x 21 + x 21 · o (1)
x→∞
x3 = o (x 4 )
x→0
= lim =
 1  x→∞ o (1) + 1
= x = o (x 4 ) = x→∞
x→0
2  0 
x2 = o (x 7 ) по свойству 8 §7
x→0 = o (1) −→ 0 =
n 1 1
x→∞ x→∞

= lim 4 o (x 4 ) + 3x 4 − 4 + o (1)
x→0 x→0 1 x→∞
1 1 o = lim x 21 ·
x→∞ o (1) + 1
=
− 2 o (x 4 ) + o ( o (x 4 )) : x→∞
x→0 x→0 x→0  
n1 2 2 2
o 4+0
: o (x 7 ) + o ( o (x 7 )) + x 7 = = ∞· =∞
2 x→0 x→0 x→0 0+1
 
применяем
= свойство 6o §7 = ⊲⊲ 7.1.62. Вычислите пределы:
§ 2. Формулы Пеано и асимптотика 433

1−cos x  1
1. limx→0 ln(1+tg2 x) 3. limx→0 cos x + arctg2 x arcsin2 x
ln(1+x+x2 )+arcsin 3x−5x3
2. limx→0 sin 2x+tg2 x+(ex −1)5

§2 Формулы Пеано и асимптотика


(a) Формулы Пеано
Формула Тейлора-Пеано. Говорят, что функция f непрерывно дифференцируема на интервале
(a, b), если она дифференцируема на (a, b), и ее производная непрерывна на (a, b). Иными словами,
если существует непрерывная функция g на (a, b) такая, что

∀x ∈ (a, b) ∃f ′ (x) = g(x).

Говорят, что функция f непрерывно дифференцируема порядка n ∈ N∗ на интервале (a, b), если
она дифференцируема n раз на (a, b), и все ее производные до порядка n непрерывны на (a, b). Это
эквивалентно существованию последовательности непрерывных функций g1 , ..., gn на (a, b) таких,
что
∀x ∈ (a, b) ∃f ′ (x) = g1 (x)
и
∀k 16k<n ⇒ ∀x ∈ (a, b) ∃gk′ (x) = gk+1 (x).
Асимптотические формулы (7.1.19) – (7.1.28), оказывается, являются частными случаями одной
общей формулы, которая описывается следующей теоремой:

Теорема 7.2.1 (Тейлора-Пеано). Пусть функция f непрерывно дифференцируема порядка n на


интервале (a, b). Тогда для всякой точки x0 ∈ (a, b) справедлива следующая асимптотическая
формула:

n
X f (k) (x0 )  
f (x) = · (x − x0 )k + o (x − x0 )n (7.2.35)
k! x→x0
k=0

• Эта формула называется формулой Тейлора3 с остаточным членом в форме Пеано4 по-
рядка (или точности) n для функции f в точке x0 .

Доказательство теоремы 7.2.1. Рассмотрим многочлен Тейлора


n
X f (k) (x0 )
f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )
Tn (x) = f (x0 ) + · (x − x0 ) + · (x − x0 )2 + ... + · (x − x0 )n = · (x − x0 )k
1! 2! n! k!
k=0

и заметим, что

Tn (x0 ) = f (x0 ), Tn′ (x0 ) = f ′ (x0 ), Tn′′ (x0 ) = f ′′ (x0 ), ... Tn(n) (x0 ) = f (n) (x0 ) (7.2.36)

Действительно,

f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )


Tn (x0 ) = f (x0 ) + · (x0 − x0 ) + · (x0 − x0 )2 + ... + · (x0 − x0 )n =
1! 2! n!
= f (x0 ) + 0 + 0 + ... + 0 = f (x0 )

Затем,
f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )
Tn′ (x) = 0 + ·1+ · 2(x − x0 ) + ... + · n(x − x0 )n−1
1! 2! n!
3 Брук Тейлор (1685-1731) – английский математик.
4 Джузеппе Пеано (1858-1932) – итальянский математик.
434 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

и поэтому

f ′′ (x0 ) f (n) (x0 ) f ′ (x0 )


Tn′ (x0 ) = f ′ (x0 ) + · 2(x0 − x0 ) + ... + · n(x0 − x0 )n−1 = + 0 + ... + 0 = f ′ (x0 )
2! n! 1!
И так далее. Для последней производной мы получим

f (n) (x0 )
Tn(n) (x) = 0 + 0 + ... + · n! = f (n) (x0 )
n!
и поэтому
Tn(n) (x0 ) = f (n) (x0 )
Формулы (7.2.36) позволяют вычислить следующий предел:

по первой формуле (7.2.36)


!
f (x) − Tn (x) получаем неопределенность 00 , f ′ (x) − Tn′ (x)
lim = поэтому можно применить = lim =
x→x0 (x − x0 )n правило Лопиталя
x→x0 n(x − x0 )n−1
по второй формуле (7.2.36)
!
получаем неопределенность 00 , f ′′ (x) − Tn′′ (x)
= поэтому опять применяем = lim =
правило Лопиталя
x→x0 n(n − 1)(x − x0 )n−2
по формулам (7.2.36)
!
(n)
всегда будет неопределенность 0
0,
f (n) (x) − Tn (x)
= ... = поэтому правило Лопиталя = ... = lim =
применяется n раз
x→x0 n!
  0
= применяем последнюю
формулу (7.2.36) = =0
n!
Итак, мы получили
f (x) − Tn (x)
−→ 0
(x − x0 )n x→x0
то есть,
f (x) − Tn (x) = o ((x − x0 )n )
x→x0
или
f (x) = Tn (x) + o ((x − x0 )n )
x→x0

а это как раз и есть формула (7.2.35).

⋄ 7.2.2. Выпишем формулу Тейлора для функ- Можно увеличить точность, например, до n = 3,
ции f (x) = sin x в точке x0 = π4 с точностью и тогда получится
n = 2:
f ′ (x0 )

f (x0 ) sin x = f (x) = f (x 0 ) + · (x − x0 )+
sin x = f (x) = f (x0 ) + · (x − x0 )+ 1!
1! f ′′ (x0 ) f ′′′ (x0 )
f ′′ (x0 )   + · (x − x0 )2 + · (x − x0 )3 +
+ 2
· (x − x0 ) + o (x − x0 ) = 2 2! 3!
2! x→x0 π cos π4  π
π   π   + o ((x − x0 )3 ) = sin + · x− +
π cos 4 π − sin( 4 ) π 2 x→x0 4 1! 4
= sin + · x− + · x− +
4 1! 4 √ 2! 4 − sin( π4 )  π 2 − cos( π4 )  π 3
  √ + · x − + · x − +
π 2 2 2  π 2! 4 3! √ 4
+ oπ x− = + · x− −   √
x→ 4 4 2 2 4 π 3 2 2  π
√    + oπ x− = + · x− −
2 π 2  π 2 x→ 4 4 2 2 4
− · x− + oπ x− √ √  
4 4 x→ 4 4 2  π 2 2  π 3 π 3
− · x− − · x− + oπ x−
4 4 12 4 x→ 4 4
Если убрать выкладки, получается следующий
результат: а без выкладок это будет выглядеть так:
√ √  √  √ √  √ 
2 2 π 2 π 2 2 2 π 2 π 2
sin x = + · x− − · x− + sin x = + · x − − · x − −
2 2 4 4 4  2√ 2 4 4 4
  
π 2 2  π 3  π 3
+ oπ x− − · x− + oπ x−
x→ 4 4 12 4 x→ 4 4
§ 2. Формулы Пеано и асимптотика 435

⋄ 7.2.3. Выпишем формулу Тейлора для функ- 1


+ o ((x − 1)3 ) = (x − 1) − · (x − 1)2 +
ции f (x) = ln x в точке x0 = 1 с точностью n = 3: x→x0 2
1
f ′ (x0 ) + · (x − 1)3 + o ((x − 1)3 )
ln x = f (x) = f (x0 ) + · (x − x0 )+ 3 x→x0
1!
f ′′ (x0 ) f ′′′ (x0 )
+ · (x − x0 )2 + · (x − x0 )3 + Если убрать выкладки, получается следующий
2! 3!
1 результат:
|x=1
+ o ((x − x0 )3 ) = ln 1 + x · (x − 1)+
x→x0 1!
− 12 |x=1 2
3 |x=1 (x − 1)2 (x − 1)3
+ x · (x − 1)2 + x · (x − 1)3 + ln x = (x− 1)− + + o ((x− 1)3 )
2! 3! 2 3 x→x0

Формулы Маклорена-Пеано.
• При x0 = 0 формула Тейлора называется формулой Маклорена:

f ′ (0) f ′′ (0) 2 f (n) (0) n


f (x) = f (0) + ·x+ · x + +... + · x + o (xn ) =
1! 2! n! x→0
Xn
f (k) (0) k
= · x + o (xn ) (7.2.37)
k! x→0
k=0

Некоторые примеры формул Маклорена нам уже знакомы:

Формулы Маклорена с точностью n = 1 или n = 2.

Нетрудно заметить, что асимптотические формулы (7.1.19) – (7.1.28) являются частными


случаями формулы Маклорена. Например, формула (7.1.19) получается, если подставить f (x) =
sin x и n = 1.
f ′ (0)
sin x = f (x) = f (0) + · x + o (x) = 0 + x + o (x)
1! x→0 x→0

А формула (7.1.20) – если f (x) = cos x и n = 2.

f ′ (0) f ′′ (0) 2 x2
cos x = f (x) = f (0) + ·x+ · x + o (x2 ) = 1 + 0 − + o (x2 )
1! 2! x→0 2 x→0

Формулы Маклорена с точностью n = 3

Для тех же функций, что и в (7.1.19) – (7.1.28) нетрудно выписать соответствующие формулы
с более высокой точностью, например, n = 3:

x3
sin x = x − + o (x3 ) (7.2.38)
6 x→0
3
x
tg x = x + + o (x3 ) (7.2.39)
3 x→0
x2
cos x = 1 − + o (x3 ) (7.2.40)
2 x→0
x2 x3
ln(1 + x) = x − + + o (x3 ) (7.2.41)
2 3 x→0
x x2 x3
loga (1 + x) = − + + o (x3 ) (7.2.42)
ln a 2 ln a 3 ln a x→0
x2 x3
ex = 1 + x + + + o (x3 ) (7.2.43)
2 6 x→0
2
x2
· ln a x3 · ln3 a
ax = 1 + x · ln a + + + o (x3 ) (7.2.44)
2 6 x→0
2
α(α − 1)x α(α − 1)(α − 2)x3
(1 + x)α = 1 + αx + + + o (x3 ) (7.2.45)
2 6 x→0
436 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

x3
arcsin x = x + + o (x3 ) (7.2.46)
6 x→0
x3
arctg x = x − + o (x3 ) (7.2.47)
3 x→0

Полезно сразу же, для случая n = 3 объ- = (свойство 5o на с.425) =


яснить, зачем эти формулы нужны. Нам сей- 2
x · o (1) o (1)  0 
час важно, что формулы Маклорена позволя- x→0 x→0
= lim 2 = lim = =?
x→0 x · o (1) x→0 o (1) 0
ют вычислять пределы, которые невозможно вы- x→0 x→0
числить с помощью асимптотических формул
(7.1.19) – (7.1.28). Алгоритм их применения мож- И это опять иллюстрация правила (A). Но если
но выразить следующими эвристическими пра- точность увеличить до n = 3, то мы получим от-
вилами. вет:
tg x − x
Правила вычисления пределов lim
x→0 sin x − x
= (7.2.38), (7.2.39) =
с помощью формул Маклорена: 3
x + x3 + o (x3 ) − x
x→0
(A) При использовании формул Маклорена = lim 3 =
x→0 x − x + o (x3 ) − x
может не получиться ответа, если 6 x→0
возникнет неопределенность. x3  o ( x3 )
3 + x→0
(B) Если возникает неопределенность, то = lim x3 =
это означает, что нужно увеличить x→0 −
6 + x→0
W o ( x3 )
точность формул Маклорена.
= (свойство 5o на с.425) =
(C) Если ответ получен, то дальнейшее x3 3
увеличение точности формул Макло- 3 + x · x→0 o (1)
рена не может привести к изменению = lim 3 =
x→0 − x + x3 · o (1)
6
ответа. x→0
1
3 + o (1) 1
= lim 1 x→0 = 31 = −2.
Следующий пример показывает, как это ра- x→0 − + o (1)
6 −6
x→0
ботает.
И это будет иллюстрацией правила (B). Даль-
⋄ 7.2.4.
tg x − x ше если мы будем увеличивать точность формул
lim Маклорена—Пеано, то мы увидим, что ответ от
x→0 sin x − x

Можно заметить, что здесь асимптотические этого не меняется (в соответствии с правилом


формулы (7.1.19) – (7.1.20) (то есть формулы (C)).
Маклорена—Пеано с точностью n = 1) не помо- В этом примере мы поняли как применяются
гают: формулы Маклорена—Пеано, но чем асимптоти-
tg x − x ческие формулы лучше правила Лопиталя, пока
lim = (7.1.19), (7.1.20) = остается непонятно. Чтобы это увидеть, нужно
x→0 sin x − x
 o (x) рассмотреть пример посложнее:
x + o (x) − x
x→0 x→0
= lim = lim = ⋄ 7.2.5.
x→0 x + o (x) − x x→0 W o ( x ) √
x→0 x→0 1 + 2 tg x − ex + x2
= (свойство 5 на с.425) =
o lim
x→0 arcsin x − sin x
x · o (1) o (1)  0 
x→0 Если вы попробуете посчитать этот пример по
= lim = lim x→0 = =?
x→0 x · o (1) x→0 o (1) 0 правилу Лопиталя, то вы увидите, что диффе-
x→0 x→0
ренцировать здесь придется 3 раза, а поскольку
И это иллюстрация сформулированного выше функции в числителе и знаменателе не слишком
правила (A). Та же картина будет если приме- просты, это будет довольно утомительно.
нить формулы Маклорена—Пеано с точностью С другой стороны, асимптотические форму-
n = 2: лы (7.1.19) – (7.1.28), представляющие собой
формулы Маклорена с точностью n = 1 (за ис-
tg x − x
lim = ключением формулы для косинуса, где точность
x→0 sin x − x
n = 2), здесь тоже не помогают:
x + o (x2 ) − x  o ( x2 )
x→0 x→0 √
= lim = lim = 1 + 2 tg x − ex + x2
x→0 x + o (x2 ) − x x→0 W o ( x2 ) lim =
x→0 x→0 x→0 arcsin x − sin x
§ 2. Формулы Пеано и асимптотика 437
 
применяем формулы x2 5x3
= (7.1.26), (7.1.24), (7.1.27), (7.1.19) = 1+x− 2 + 6 + o (x3 ) − ex + x2
x→0
= lim =
1+ 1
2 2 tg x + o (2 tg x) − (1 + x + o (x)) + x2 x→0 arcsin x − sin x
= lim
x→0 x→0
=  
x + o (x) − (x + o (x)) применяем формулы
x→0
x→0 x→0 = (7.2.43), (7.2.46), (7.2.47) =
tg x + o (2 tg x) − x − o (x) + x 2 (
= lim x→0 x→0
= x2 5x3
x→0 o (x) − o (x) = lim 1+x−
+ + o (x3 )−
x→0 x→0
x→0 2 6 x→0
    )
применяем свойства
= 10 , 30 = x2 x3 3 2
− 1+x+ + + o (x ) + x :
2 6 x→0
tg x + o (tg x) − x − o (x) + x2 (
= lim x→0 x→0
=  )
x→0 o (x) x3 3 x3 3
x→0 : x+ + o (x ) − x − + o (x ) =
  6 x→0 6 x→0
применяем
= (5.2) = 2x3 2x3
3 + o (x3 ) 3 + x3 · o (1)
x + o (x) + o (x + o (x)) − x − o (x) + x 2 x→0 x→0
x→0 x→0 x→0 x→0 = lim 3 = lim 3 =
= lim = x→0 x + o (x3 ) x→0 x + x3 · o (1)
x→0 o (x) 3 x→0 3 x→0
x→0
  2
=
теперь
= 3 + o (1) 2
+0
40 x→0 3
= lim = =2
x→0 1 + o (1) 1
+0
x + o (x) + o (x) − x − o (x) + x2 3 x→0 3
x→0 x→0 x→0
= lim =
x→0 o (x) Число 2 будет ответом.
x→0
  o (x) + x2   Теперь полезно убедиться в справедливости
теперь x→0 теперь
= 20 , 30 = lim = 10 = правила (C). Проверим, что если увеличить точ-
x→0 o (x) ность формул Маклорена, то ответ от этого не
x→0
x · o (1) + x 2
o (1) + x изменится. Это можно сделать, например, выпи-
x→0 x→0 сав более подробное разложение экспоненты:
= lim = lim =
x→0 x · o (1) o (1)
x→0
x→0 x→0
  0 + 0 √
теперь 1 + 2 tg x − ex + x2
= 80 = =? lim =
0 x→0 arcsin x − sin x
2 3

И это иллюстрация правила (A). Но если точ- 1 + x − x2 + 5x6 + o (x3 ) − ex + x2


x→0
= lim =
ность формул повысить до n = 3, то есть приме- x→0 arcsin x − sin x
 
нить формулы (7.2.38) – (7.2.47) то все решается применяем формулы
(и это будет иллюстрацией к правилу (B)). Для = (7.2.46), (7.2.47) =
и (7.2.51) с k = 4
этого сначала выпишем отдельно корень в чис- (
лителе: x2 5x3
= lim 1 + x − + + o (x3 )−
! x→0 2 6 x→0
по формуле (7.2.45), )
p √
1+y =  
1 + 2 tg x = y2 y3
= x2 x3 x4 4 2
1
=1+ 3
2y − 8 + 16 + o (y ) − 1+x+ + + + o (x ) + x :
y→0
2! 3! 4! x→0
2 3 (
= 1 + tg x −
tg x tg x
+ + o (tg3 x) =  )
2 2 x3 x 3
x→0 : x+ + o (x3 ) − x − + o (x3 ) =
= (применяем (7.2.39)) = 6 x→0 6 x→0
 
x3 2x3
+ o (x3 ) + x4
+ o (x4 )
=1+ x+ + o (x3 ) − 3 x→0 24 x→0
3 x→0 = lim x3
=
 2  3 x→0
3 + o (x3 )
3 3 x→0
x + x3 + o (x3 ) x + x3 + o (x3 )
2x3 x4
− x→0
+ x→0
+ 3 + x3 · o (1) + 24 + x4 · o (1)
2  2 x→0 x→0
= lim x3
=
x3 x→0
3 + x3 · o (1)
+ o (x + + o (x3 ))3 = x→0
x→0 3 x→0 2
+ o (1) + x
 упрощаем  3 x→0 24 + x→0
o (1)
= lim 1 =
= ... = с помощью
0 0
= ... = x→0
3 + o (1)
свойств 1 − 8 §7 x→0
2
x2 5x3 3 +0+0+0
=1+x− + + o (x3 ) = 1 =2
2 6 x→0
3 +0
Теперь можно вычислять предел:
То же самое получится, если поменять форму-
√ лу Маклорена на более точную в любом другом
1 + 2 tg x − ex + x2
lim = месте (или в нескольких местах).
x→0 arcsin x − sin x
438 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
 2
⋄ 7.2.6. x− x3
+ o (x3 )
arctg x 1 x2 3
e − 1−x + 2 + x→0
+
lim 1+x 2
x→0 ln 1−x − 2x  3
x3
x− + o (x3 )
Убедимся, что, как и в предыдущем случае, 3 x→0
+ +
этот предел не вычисляется с помощью формул !6
(7.1.19) – (7.1.28), то есть с помощью формул Ма-   3
x3 3
клорена с точностью n = 1: + o x− + o (x ) =
x→0 3 x→0
 упрощаем 
1 x2
earctg x − 1−x + 2 = ... = с помощью = ... =
lim = 0 0
свойств 1 − 8 §7
x→0 ln 1+x
1−x − 2x
x2
x2 x3
1 + arctg x + o (arctg x) − (1 − x)−1 + 2 = 1+x+ − + o (x3 )
= lim
x→0
= 2 6 x→0
x→0 ln(1 + x) − ln(1 − x) − 2x
( И, наконец,
   
= lim 1 + x + o (x) + o x + o (x) −
x→0 x→0 x→0 x→0 1
) = (1 − x)−1 = (применяем (7.2.45)) =
  x2 1−x
− 1 − x + o (x) + : (−1)(−2)(−x)2
x→0 2 = 1 + (−1)(−x) + +
2
( ) 3
    (−1)(−2)(−3)(−x)
: x + o (x) − −x + o (x) − 2x = + + o (x3 ) =
x→0 x→0 6 x→0
= 1 + x + x2 + x3 + o (x3 )
x2 x2 x→0
o (x) + 2 x · o (1) + 2
x→0 x→0
= lim = lim = Теперь вычисляем предел:
x→0 o (x) x→0 x · o (1)
x→0 x→0
  1 x2
o (1) + x earctg x − 1−x + 2
x→0 2 0+0 lim =
= lim = =? x→0 1+x
ln 1−x − 2x
x→0 o (1) 0 (
x→0 
x2 x3
Вы можете проверить самостоятельно, что даже = lim 1+x+ − + o (x3 ) −
x→0 2 6 x→0
если увеличить точность формул Маклорена до )
n = 2, это все равно не поможет.   x2
2 3 3
Но если воспользоваться формулами Мак- − 1 + x + x + x + o (x ) + :
x→0 2
лорена с точностью n = 3 (то есть формулами (  )
(7.2.38) – (7.2.47)), то этот предел удается со- 2x3 3
: 2x + + o (x ) − 2x =
считать. Только, как и в предыдущем примере, 3 x→0
перед вычислениями здесь следует выписать от- 3

дельно асимптотическое представление некото- − 7x6 + o (x3 )


x→0
рых фрагментов: = lim 2x3
=
x→0
3 + o (x3 )
x→0
3
1+x − 7x6 + x3 · o (1)
ln = ln(1 + x) − ln(1 − x) = x→0
1−x = lim 2x3
=
= (применяем (7.2.41)) =
x→0
3 + x3 · o (1)
x→0

x2 x3 − 76 + o (1) 7
=x− + + o (x3 )− = lim x→0
=−
2 3 x→0
x→0 2 + o (1) 4
  3
x2 x3 x→0
− −x − − + o (x3 ) =
2 3 x→0 ⋄ 7.2.7.
√ 
2x3 ln x + 1 + x2 − x + x3
= 2x + + o (x3 ) lim 6
3 x→0
x→0 x − arcsin x
Далее, Здесь мы сразу применим формулы Маклорена
с точностью n = 3. Выпишем отдельно асимп-
earctg x = (применяем (7.2.43)) = тотическое представление некоторых фрагмен-
arctg2 x arctg3 x тов:
= 1 + arctg x + + +  p   
2 6 1
3
+ o (arctg x) = (применяем (7.2.47)) = ln x + 1 + x2 = ln x + (1 + x2 ) 2 =
x→0
    1 1
 2
x3 применяем 1 2 2 −1 x
=1+ x− 3
+ o (x ) + = (7.2.45) = ln x + 1 + x + +
3 x→0 2 2
§ 2. Формулы Пеано и асимптотика 439
  !
1 1 1
2 2 −1 2 − 2 x3 3 местах точность мы будем брать разной. Выпи-
+ + o (x ) = шем получающиеся выражения:
6 x→0

1 1
 1
    
3 − 2 x2 − 21 − 23 x3
= ln 1 + x + 2
+ 2
+ cos(xex ) = cos x · 1 + x + o (x) =
2 2 6 
x→0

!
= cos x + x + o (x2 ) =
2
x→0
+ o (x3 ) =
x→0 1 2
  =1− x + x + o (x2 ) +
2

2
x→0
3 x2 3x3 3 
= ln 1 + x − + + o (x3 ) = 2 2
2 8 48 x→0 + o x + x + o (x ) =
  x→0 x→0
применяем
= (7.2.41) = 1
  = ... = 1 − x2 − x3 + o (x3 )
3 x2 3x3 2 x→0
3
= x− + + o (x ) −
2 8 48 x→0
 2
x2 3x3
3
2 x − 8 + 48 + x→0 o (x3 ) cos(xex ) − ln(1 − x) − x =
− +  
2 1 2 3 3
  = 1 − x − x + o (x ) −
3 x2 3x3
3 2 x→0
2 x − 8 + 48 + x→0 o (x3 )  2 3

+ + x x 3
3 − −x − − + o (x ) − x =
  ! 2 3 x→0
3
3 x2 3x3 3 2x3
+ o x− + + o (x ) = =1− + o (x3 )
x→0 2 8 48 x→0
3 x→0
 упрощаем 
x3
= ... = с 0помощью = ... = x − + o (x3 ) 1 1
1 − 90 §7 6 x→0 ctg x3 = 3
= 3
tg x x + o (x3 )
Теперь вычисляем предел: x→0

√  x3 Теперь вычисляем предел:


ln x + 1 + x2 − x + 6
lim =
x→0 x − arcsin x
! lim (cos(xex ) − ln(1 − x) − x)ctg x =
3
подставляем только
 что найденное

√ x→0
= разложение ln x + 1 + x2 =   3 1 3
а также формулу (7.2.46) 2x3 3
x + o (x )
x→0
  = lim 1 − + o (x ) =
x− x3
+ o (x3 ) − x + x6
3 x→0 3 x→0
6  
x→0   3 1
= lim   = 3 x + o (x3 )
x→0 3 ln 1− 2x3 + o (x3 ) x→0 
x − x + x6 + o (x3 ) x→0
x→0 = lim e =
x→0
o (x3 ) x3 · o (1) 
3

x→0 x→0 ln 1− 2x + o (x3 )
= lim 3 = lim 3 = 3 x→0
x→0 − x6 − o (x3 ) x→0 − x6 − x3 · o (1) = lim e
x3 + o (x3 )
x→0 =
x→0 x→0 x→0
   
o (1) 0
3
− 2x + o (x3 ) + o
3
− 2x + o (x3 )
x→0 3 x→0 x→0 3 x→0
= lim = =0 x3 + o (x3 )
x→0 − 16 − o (1) − 61 − 0 = lim e x→0 =
x→0 x→0
⋄ 7.2.8. 3
3
− 2x + o (x3 )
x→0
−x3 · 2 +x3 · o (1)
3 x→0
ctg x 3 x3 + o (x3 ) x3 +x3 · o (1)
lim (cos(xex ) − ln(1 − x) − x) = lim e
x→0
x→0 = lim e
x→0
x→0 =
x→0
− 2 + o (1)
Здесь мы тоже сразу применим формулы Макло- 3 x→0
− 2 +0
3 2
= e− 3
1+ o (1)
рена с “нужной” точностью. При этом, в разных = lim e x→0 =e 1+0
x→0

Формулы Маклорена с произвольной точностью

Некоторые из формул Маклорена (7.2.38) – (7.2.47) можно обобщить на случай произвольной


точности:
x3 x5 x2k+1
sin x = x − + − ... + (−1)k · + o (x2k+1 ) =
3! 5! (2k + 1)! x→0
Xk
x2i+1
= (−1)i · + o (x2k+1 ) (7.2.48)
i=0
(2i + 1)! x→0
440 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

X k
x2 x4 x2k x2i
cos x = 1 − + − ... + (−1)k · + o (x2k ) = (−1)i · + o (x2k ) (7.2.49)
2! 4! (2k)! x→0 i=0
(2i)! x→0

X k
x2 x3 xk xi
ln(1 + x) = x − + + ... + (−1)k−1 · + o (xk ) = (−1)i−1 · + o (xk ) (7.2.50)
2 3 k x→0
i=1
i x→0

X xi k
x2 xk
ex = 1 + x + + ... + + o (xk ) = + o (xk ) (7.2.51)
2! k! x→0 i=0
i! x→0

x2 xk
(1 + x)α = 1 + α · x + α(α − 1) · + ... + α(α − 1)...(α − k + 1) · + o(xk ) =
2! k! x→0
k
X xi
=1+ α(α − 1)...(α − i + 1) · + o (xk ) (7.2.52)
i=1
i! x→0
X k
1
= 1 − x + x2 + ... + (−1)k · xk + o(xk ) = (−1)k · xi + o (xk ) (7.2.53)
1+x x→0 i=0
x→0

X k
1
= 1 + x + x2 + ... + xk + o(xk ) = xi + o (xk ) (7.2.54)
1−x x→0 i=0
x→0

X k
x3 x5 x2k+1 x2i+1
arctg x = x − + − ... + (−1)k · + o(xk ) = (−1)i · + o (xk ) (7.2.55)
3 5 2k + 1 x→0 i=0
2i + 1 x→0

   
⋄ 7.2.9. Вспомним о пределе (7.0.1), которым мы = x + o (x) + o x + o (x) −
x→0 x→0 x→0
начинали эту главу:    
− x + o (x) + o x + o (x) =
ln(1 + sin x) − sin ln(1 + x) x→0 x→0 x→0
lim = o (x)
x→0 earctg x − 1 − arctg(ex − 1) x→0

Как уже говорилось, вычислять его с помощью И подстановка в предел ничего не дает:
правила Лопиталя слишком тяжело. С другой
стороны, применять теорему об эквивалентной ln(1 + sin x) − sin ln(1 + x)
замене или выделять главное слагаемое тут то- lim arctg x =
x→0 e − 1 − arctg(ex − 1)
же бесполезно.
Если применить асимптотические формулы o (x) x · o (1)
= lim x→0 = lim x→0
=
(7.1.19) – (7.1.28) (то есть формулы Маклорена с x→0 o (x) x→0 x · o (1)
x→0 x→0
точностью n = 1), то числитель разложится так:
o (1)  0 
x→0
ln(1 + sin x) − sin ln(1 + x) = = lim = =?
x→0 o (1) 0
  x→0
= применяем формулы
(7.1.22), (7.1.19) =
В соответствии с правилом (B), это означа-
= sin x + o (sin x)− ет, что нужно увеличить точность формул Ма-
x→0
 
клорена. Возьмем n = 3 (то есть воспользуемся
− ln(1 + x) + o (ln(1 + x)) =
x→0 формулами (7.2.38) – (7.2.47)). Тогда мы полу-
   
= x + o (x) + o x + o (x) − чим:
x→0 x→0 x→0
   
− x + o (x) + o x + o (x) = sin2 x sin3 x
x→0 x→0 x→0 ln(1 + sin x) = sin x − + +
= o (x)  2 3 3 
 x
x→0
+ o sin3 x = x − + o (x3 ) −
x→0 6 x→0
А знаменатель так:  2
3
1 x 3
− x− + o (x ) +
earctg x − 1 − arctg(ex − 1) = 2 6 x→0
   3
= применяем формулы
= 1 x3
(7.1.24), (7.1.28) + x− + o (x3 ) +
3 6 x→0
= 1 + arctg x + o (arctg x) − 1  3 !
x→0
  x3 3
+ o x− + o (x ) =
− ex − 1 + o (ex − 1) = x→0 6 x→0
x→0
§ 2. Формулы Пеано и асимптотика 441

x2 x3 x2 x3
= ... = x − + + o (x3 ) = ... = x + − + o (x3 )
2 6 x→0 2 6 x→0

и и поэтому

(ln(1 + x))3 earctg x − 1 − arctg(ex − 1) =


sin ln(1 + x) = ln(1 + x) − +  
6 x2 x3
  3
x2 x3 = x+ − + o (x ) −
3
+ o (ln(1 + x)) = x − + + 2 6 x→0
x→0 2 3  2 3

x x 3
 3 − x+ − + o (x ) =
! x2 x3 3 2 6 x→0
 x − 2 + 3 + o x
+ o x3 − x→0
+ = o (x3 )
x→0 6 x→0

  !
x2 x3 3
 3 И опять при подстановке в предел получается
+ o x− + + o x = неопределенность:
x→0 2 3 x→0

x2 x3 ln(1 + sin x) − sin ln(1 + x)


= ... = x − + + o (x3 ) lim =
2 6 x→0 x→0 earctg x − 1 − arctg(ex − 1)
и поэтому o (x3 ) x3 · o (1)
x→0
= lim = lim 3 x→0 =
x→0 o (x3 ) x→0 x · o (1)
ln(1 + sin x) − sin ln(1 + x) = x→0 x→0
  o (1)  
x2 x3 3 x→0 0
= x− + + o (x ) − = lim = =?
2 6 x→0 x→0 o (1) 0
 2 3
 x→0
x x 3
− x− + + o (x ) =Она снова означает, что нужно увеличить точ-
2 6 x→0
ность формул Маклорена (согласно правилу
3
= o (x )
x→0 (B)). Возьмем n = 4 (то есть воспользуемся фор-
мулами (7.2.48), (7.2.50), (7.2.51), (7.2.55), выбрав
Знаменатель тоже удобнее представлять
n так, чтобы в конце получилось o (x4 )):
асимптотическими выражениями частями: x→0

(arctg x)2 x3
earctg x − 1 = 1 + arctg x + + sin x = x − + o (x4 )
2 6 x→0

(arctg x)3 
+ + o (arctg x)3 − 1 = x2 x3 x4
6 x→0 ln(1 + x) = x − + − + o (x4 )
  2 3 4 x→0
x3 3
= x− + o (x ) + x2 x3 x4
3 x→0 ex = 1 + x + + + + o (x4 )
 2 2 6 30 x→0
1 x3 x3
+ x− + o (x3 ) + arctg x = x − + o (x4 )
2 3 x→0
3 x→0
 3
3
1 x Тогда получим
+ x− + o (x3 ) +
6 3 x→0
 3
3 ! sin2 x sin3 x sin4 x
x ln(1 + sin x) = sin x − + − +
+ o x− + o (x3 ) =
x→0 3 x→0  2 3 3  4
 x
x2 x3 + o sin4 x = x − + o (x4 ) −
= ... = x + − + o (x3 ) x→0 3! x→0
2 6 x→0  2
1 x3 4
и − x− + o (x ) +
2 3! x→0
 3
arctg(ex − 1) = 1 x3
+ x− + o (x4 ) −
 x2 x3  3 3! x→0
= arctg x + + + o (x3 ) =  4
2 6 x→0 1 x3 4
  − x− + o (x ) +
x2 x3 4 3! x→0
= x+ + + o (x3 ) −  4 !
2 6 x→0
x3
1  3 4
x2 x3 + o x− + o (x ) =
− · x+ + + o (x3 ) + x→0 3! x→0
3 2 6 x→0
 3  x2 x3 x4
x2 x3 3 = ... = x − + − + o (x4 )
+ o x+ + + o (x ) = 2 6 12 x→0
x→0 2 6 x→0
442 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

1
и sin(2− x2 ) = sin y − 12 =
y=2 x
 1
(ln(1 + x))
3 1

sin ln(1 + x) = ln(1 + x) − + = y + o (y) − 12 = 2− x2 + o 2− x2


y→0 y=2 x x→0
 6
4
+ o (ln(1 + x)) = А для знаменателя нужно провести предвари-
x→0
  тельные вычисления:
x2 x3 x4 4
= x− + − + o (x ) −
2 3 4 x→0 x3
 3 sin x = x − + o (x3 )
1 x2 x3 x4 6 x→0
− x− + − + o (x4 ) +
6 2 3 4 x→0
 2 3 4
4 ! ⇓
x x x 4
+ o x− + − + o (x ) =
x→0 2 3 4 x→0
1 1
x2 x3 = =
= ... = x − + + 0 + o (x4 ) sin x x− x3
6 + o (x3 )
2 6 x→0 x→0
1 1
Поэтому = · x2
=
x 1− 6 + o (x2 )
x→0
ln(1 + sin x) − sin ln(1 + x) = 1  x2  −1
x4 = · 1+ − + o (x2 ) =
=− + o (x4 ) x | 6 {zx→0 }
12 x→0 ↓
0
И для знаменателя
1  x2  x2 
arctg x
= · 1− − + o (x2 ) + o − + o (x2 ) =
e −1= x 6 x→0 x→0 6 x→0
x2 x3 7x4 1  x2 
=x+ − − + o (x4 ) = · 1+ + o (x2 )
2 6 24 x→0 x 6 x→0

и ⇓
arctg(ex − 1) =
x2 x3 11x4 1 1  x2 2
2
=x+ − − + o (x4 ) = · 1 + + o (x ) =
2 6 24 x→0 sin2 x x2 6 x→0

Поэтому 1  x2 x4 
= 2 · 1+ + + o (x4 ) =
x 3 36 x→0
earctg x − 1 − arctg(ex − 1) = 1 1 x2
= 2+ + + o (x2 )
7x4 11x4 x 3 36 x→0
=− + + o (x4 ) =
24 24 x→0

x4
= + o (x4 )
6 x→0 1 1 1 x2
− = − − − + o (x2 )
Теперь, подставляя в предел, мы получим: sin2 x x2 3 36 x→0

ln(1 + sin x) − sin ln(1 + x) ⇓


lim =
x→0 earctg x − 1 − arctg(ex − 1)
4 4
− x12 + o (x4 ) − x12 + x4 · o (1) 1
2
− x12 − 13 − x36 + o (x2 )
= lim x→0
= lim x→0
= 2− sin2 x = 2 x→0 =
x4 x4
x→0
6 + o (x4 ) x→0
6 + x4 · o (1) − x12 − 13
2
− x36 + o (x2 )
x→0 x→0 =2 ·2 ·2 x→0
1
− 12 + o (1) 1
x→0
= lim 1 =− . Теперь, подставляя числитель и знаменатель
x→0
6 + o (1) 2
x→0 в исходный предел, мы получим:
⋄ 7.2.10. Разберем теперь пример (7.0.2):  
1 1

sin(2 − x12
) 2 − x2 + o 2 − x2
− x12 x→0
sin(2 ) lim = lim =
lim . x→0 − sin12 x x→0 − x12
2
− x36 + o (x2 )
x→0 − sin12 x 2 2 ·2 − 13 ·2 x→0
2
1 + o (1) 1+0 1 √
Здесь числитель можно записать так: = lim 2
x→0
= 1 = 23 =
3
2.
x→0
2− 3 · 2
1 − x36 + o (x2 )
x→0 2− 3 · 20
§ 2. Формулы Пеано и асимптотика 443

x 1+sin x− 12 ln(1+x2 )−x
⊲⊲ 7.2.11. Найдите пределы: 12. limx→0 3
√ tg x
1. limx→0 ln(1+x)−x
x2 13. limx→0 esin x − 1+x2 −x cos x
ln3 (1−x)
ex −1−x √
2. limx→0 x2 esin x ln cos x − 4 1+4x+x− 32 x2
2 14. limx→0 x sin x2
cos x−1− x2   1−cos
1
3. limx→0 x4 2 tg x x
arctg x−arcsin x 15. limx→0 x+sin x
4. limx→0 x2   1
xex +1 x2
5. limx→0 arctg x−arcsin x
tg x−sin x
16. limx→0 xπ x +1
6. limx→0 2 arcsin x−arcsin 2x  √ 1
√ x3 17. limx→0 cos(sin x) + 21 arcsin2 x x2 ( 1+2x−1)
7. limx→0 √
5
1+2x−1
√ √  1
4
1+x− 1−x

18. limx→2  3 − x + ln x2 sin2 (x−2)
1+x cos x− 1+2x
8. limx→0 1 1
ln(1+x)−x 19. limx→0 sin x arctg x − tg x arcsin x
x √
− 1+2x
9. limx→0 e ln cos x 20. limx→0 esin x −1−sin(ex −1)
√ arctg4 x
x−3 3 1+x
10. limx→0 3 cos x+arcsin
ln(1−x2 ) 21. sin x3
limx→0 ln cos x−cos ln(1+x)+1
3
sin x+2x cos x2 sin((1+x)α −1)−(1+sin x)α +1
11. limx→0 ln(1+x )−2 arctg x3 22. limx→0 tg4 x

(b) Асимптотика
Формула Тейлора-Пеано (7.2.35), с которой мы начинали этот параграф, является частным случаем
следующей общей конструкции.
Пусть a – какое-нибудь число или символ бесконечности.
• Последовательность функций {ϕn } называется асимптотической последовательностью
при x → a, если
∀k ∈ N ϕk (x) ≫ ϕk+1 (x) (7.2.56)
x→a

или, более наглядно,

ϕ0 (x) ≫ ϕ1 (x) ≫ ϕ2 (x) ≫ ... ≫ ϕk (x) ≫ ...


x→a x→a x→a x→a x→a

• Асимптотическим разложением или асимптотикой порядка n функции f вдоль асимп-


тотической последовательности {ϕn } при x → a, называется всякая асимптотическая фор-
мула вида
n
X  
f (x) = λk · ϕk (x) + o ϕn (x) , λk ∈ R (7.2.57)
x→a
k=0

(если она верна). Из (7.2.56) следует, что коэффициенты λk ∈ R в формуле (7.2.57) опреде-
ляются однозначно (поэтому не бывает двух разных асимптотических разложений одного
порядка относительно данной асимптотической последовательности).

Степенная последовательность в нуле. Степенная последовательность на беско-


Функции нечности. Функции
ϕk (x) = xk , k∈N
1
образуют асимптотическую последовательность ϕk (x) = , k∈N
xk
при x → 0, потому что
образуют асимптотическую последовательность
1 = x0 ≫ x1 ≫ x2 ≫ ... ≫ xk ≫ ... при x → ∞, потому что
x→0 x→0 x→0 x→0 x→0
1 1 1 1
Для функции f , гладкой в окрестности точки 0 1 = 0 ≫ 1 ≫ 2 ≫ ... ≫ k ≫ ...
разложения вдоль такой последовательности – x x→∞ x x→∞ x x→∞ x→∞ x x→∞

это просто формулы Маклорена (7.2.37), о ко- Асимптотические разложения вдоль этой после-
торых мы уже говорили выше: довательности обычно получаются заменой x =
1
n
X t с последующим применением формул Макло-
f (k) (0) k n рена. Объясним это на примерах.
f (x) = · x + o (x )
k! x→0
k=0
444 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

⋄ 7.2.12. Пусть нам нужно найти асимптотиче- и если эта формула верна, то будет верна и фор-
ское разложение порядка 3 при x → +∞ вдоль мула первого порядка:
степенной последовательности для функции √  
p 3
x = λ0 + λ1 · x + o x (7.2.58)
f (x) = x2 + 1 x→0

Сделаем замену x = 1t : Чтобы убедиться, что эта формула неверна, нуж-


но с самого начала заметить, что из нее следует,
p r1 √
1 + t2 что λ0 должно быть нулевым, потому что при
2 x = 1t
x + 1 = t → +0 = 2
+1= = x → 0 получаем:
t t
= (7.2.52) = √  
 4
3
x = λ0 + λ1 · x + o x
1
1 + 2 · t + 2 · 12 − 1 · t2! + o (t4 )
2 1 |{z} | {z } x→0
t→+0 ↓
| {z }

= = 0 0 ↓
t 0
1 1 1 t3
1
= + · t − · + o (t3 ) = x t→=+∞ x
= Подставим λ0 = 0 в (7.2.58):
t 2 4 2! t→+0
 
1 1 1 √  
=x+ − 3+ o 3
x = λ1 · x + o x
2x 8x x→+∞ x3 x→0

⋄ 7.2.13. Найдем асимптотическое разложение Поделив все на x, при x → 0 мы получим соот-


порядка 1 при x → +∞ вдоль степенной после- ношение
1  
довательности для функции
√3
= λ1 + o 1
√ x2 x→0
2
f (x) = e x +x−x | {z } | {z }
↓ ↓
0
Опять делаем замену x = 1t : ∞

√ q √
которое не может быть верно ни при каком
1 1
+1−1 1+t−1
e x2 +x−x
= tx→=+0
t
= e t2 t t = e t = λ1 .
= (7.2.52) = Приведенный пример 7.2.14 имеет целью под-
1+ 1 ·t+ 1 ·
2
( 12 −1)· t2! +t→+0
o (t2 )−1 1
готовить читателя к мысли, что асимптотиче-
2 2 − t + o (t)
=e t = e 2 8 t→+0 = скую последовательность {ϕn }, вдоль которой
1 − 8t + o (t) мы собираемся раскладывать данную функцию
= e2 · e t→+0
= (7.2.51) = f , бывает удобно выбирать отдельно, в зависи-
√ 
t

t

= e· 1 − + o (t) + o = − + o (t) мости от вида функции f .
8 t→+0 t→+0 8 t→+0
  √
√ t √ t e ⋄ 7.2.15. Асимптотическое разложение функции
= e · 1 − + o (t) = e− + o (t) =
8 t→+0 8 t→+0 p
√   3
f (x) = x + x2
√ e 1
= e− + o
8x x→+∞ x при x → 0 бессмысленно искать вдоль стандарт-
ной степенной последовательности
Другие асимптотические последователь-
ности. Не всегда данная функция f име- ϕk (x) = xk
ет асимптотическое разложение вдоль данной
асимптотической последовательности {ϕn }. потому что здесь возникает тот же эффект, что
в примере 7.2.14: никакая формула вида (7.2.57)
⋄ 7.2.14. Формула
не будет верна, если n > 0.
√ Xn   Однако если взять последовательность
3
x= λk · xk + o xn
x→0 1 11 5k+1
k=0 x 3 ≫ x2 ≫ x 3 ≫ ... ≫ x 3 ≫ ...
x→0 x→0 x→0 x→0 x→0
не будет верна ни при каких n > 0 и λ0 , ..., λn ∈
R. то этот эффект исчезает, и разложение находит-
ся очень просто:
Доказательство. Это достаточно доказать для
n = 1, потому что любую формулу большего по- p3 1 5 1

рядка можно записать в виде x + x2 = x 3 · (1 + x 3 ) 3 = (7.2.52) =


    5 2
   
n   1 1 1 1 x3 5 2 
√ X = x 3 ·
1 +
5
· x3 + · −1 · +o x3  =
k n
3
x = λ0 + λ1 · x + λk · x + o x 3 3 3 2!
x→0
x→0
k=2 !
| {z } x3
5 10
x3  10 
  =x ·
1
3 1+ − +o x3 =
o
x→0
x 3 9
x→0
§ 2. Формулы Пеано и асимптотика 445

 11 
11  t2

1x2 x3 1+ 1
3 ·t+ 1
3 · 1
3 −1 · 2! + o t2
=x +3 − +o x 3 t→0
3 9 = (7.2.52) = 2 =
x→0
t3
(одновременно из этих вычислений становит- t
1
t
4  
2 3 3 4 = x1
ся понятно, откуда берется последовательность = t− 3 + − + o t 3 = xt → ∞ =
5k+1
3 9
t→0
ϕk (x) = x 3 ).  
2 1 1 1
⋄ 7.2.16. Попробуем найти разложение той же = x3 + 1 − 4 + o 4
3 · x3 9 · x3 x3
функции p x→∞
3
f (x) = x + x2
при x → ∞. Как и в предыдущих случаях, когда Из вычислений видно, что разложение в этом
ищется асимптотика на бесконечности, начнем с случае удобно искать вдоль асимптотической по-
замены x = 1t : следовательности

p r1 1
1
(1 + t) 3
= 1t
x + x2 = xt →
3 3 2 1 4 2
0 = + = 2 = x 3 ≫ x− 3 ≫ x− 3 ≫ ... ≫ x 3 −k ≫ ...
t t2 t3 x→∞ x→∞ x→∞ x→∞ x→∞
Глава 8

ИНТЕГРАЛ

§1 Неопределенный интеграл
В главе 6 мы определили понятие производной F ′ функции F и изучали его приложения в мате-
матике. Неопределенный интеграл представляет собой конструкцию, придуманную для решения
обратной задачи: дана функция f , нужно найти такую функцию F , для которой f была бы произ-
водной,
F ′ = f.
Такая функция F называется первообразной для функции f .
Как и в случае с производной, эта конструкция оказывается полезной в самых разных областях
естествознания, в частности, в геометрии, при вычислении площадей и объемов. Но, в отличие от
производной, задача нахождения первообразной не имеет однозначного решения: здесь решением
будет целый класс функций, который и называется неопределенным интегралом функции f .
Еще одна неприятная деталь в этой теории, отличающая ее от теории дифференцирования, —
что неопределенный интеграл от стандартной функции не всегда является стандартной функцией.
Поэтому в некоторых случаях “вычислить” неопределенный интеграл в том смысле, который вкла-
дывался в эту задачу в дифференциальном исчислении, то есть, выразив результат в элементарных
функциях, бывает невозможно.
Из-за того, что неопределенный интеграл — не одна функция, а целый их класс, эту тему при-
ходится начинать с изучения классов функций1 . Наше изложение уместно начать с какого-нибудь
примера, который объяснит, почему в том, что мы будем говорить, встретятся такие неожиданно
сложные построения.

⋄ 8.1.1. Понятие интеграла изучается в совре- Но формально последнее утверждение невер-


менной школе, и, естественно, школьникам дает- но: существуют первообразние для функции
ся таблица интегралов. В ней, в частности, име- (8.1.3) не имеющие вид (8.1.2). Например, функ-
ется такая формула: ция
1
1 1 G(x) = − + sgn x.
ˆ
(8.1.4)
2
d x = − + C. (8.1.1) x
x x
Ее нельзя представить в виде (8.1.2), но произ-
Она интерпретируется как утверждение, что вся-
водная от нее равна f всюду на области опреде-
кая функция вида
ления:
1
F (x) = − + C (8.1.2) 1
x G′ (x) = 2 = f (x), x ∈ R \ {0}.
x
является первообразной для функции
Этот пример показывает, что школьные фор-
1
f (x) = 2 (8.1.3) мулы для неопределенных интегралов правиль-
x но интерпретировать не как равенства классов
и, наоборот, любая первообразная для функции функций, а как тождественность этих клас-
(8.1.3) имеет вид (8.1.2). сов на отрезках из области определения левой и
1 Классы функций, которые мы будем рассматривать в этом параграфе, будут множествами (а не собственными

классами в смысле определения на с.29), но нам будет удобно называть их именно классами, чтобы не провоцировать
путаницы с числовыми множествами.

446
§ 1. Неопределенный интеграл 447

правой частей (это так по крайней мере в случа- и дифференцируемости функции на отрезках, и
ях, когда область определения имеет несколько почему мы так много времени тратим на их об-
связных компонент). И это объясняет, зачем ни- суждение: просто из-за своей новизны эти тер-
же мы вводим понятие тождества классов функ- мины требуют привыкания.
ций на отрезках, а затем понятия непрерывности

(a) Классы функций, тождественные на отрезках


Прежде, чем говорить о неопределенном интеграле, желательно обсудить понятие класса функций.
По идеологии теории множеств, функции тоже могут образовывать классы. Мы здесь и поговорим
о самых простых таких классах. Начнем с нескольких примеров.

⋄ 8.1.2. Рассмотрим класс F , состоящий из В соответствии с этой договоренностью, фор-


функций вида мула
G = cos x + B. (8.1.7)
f (x) = sin x + A, x ∈ R, (8.1.5)
описывает класс функций вида
где A ∈ R – произвольный параметр. Этот класс
g(x) = cos x + A, x ∈ R, (8.1.8)
можно описать формулой
где B ∈ R – произвольный параметр.
f ∈F ⇔ ∃A ∈ R ∀x ∈ R f (x) = sin x + A.
⋄ 8.1.3. Точно так же формула
Если условиться, что под x всегда будет пони-
маться переменная, используемая как аргумент F = sin(x + A). (8.1.9)
при описании функций из данного класса, а все
остальные переменные считаются параметрами, описывает класс функций вида
то при таких договоренностях описание класса
F можно сократить до записи f (x) = sin(x + A), x ∈ R, (8.1.10)

F = sin x + A. (8.1.6) где A ∈ R – произвольный параметр, а формула


G = cos(x + B). (8.1.11)
Эту запись нужно понимать так, что функции,
описываемые правой частью формулы (8.1.6) (в описывает класс функций вида
которой только x считается свободной перемен-
ной, а все остальные переменные считаются па- g(x) = sin(x + B), x ∈ R, (8.1.12)
раметрами), и только такие функции, считаются
элементами класса F . где B ∈ R – произвольный параметр.

Равенство классов функций. Говорят, что два класса функций F и G равны,

F = G,

если они равны как классы (или множества), то есть если включение f ∈ F эквивалентно включе-
нию f ∈ G:
f ∈ F ⇔ f ∈ G.
Понятно, что это эквивалентно выполнению соотношений

F ⊆G & G ⊆ F.

⋄ 8.1.4. Рассмотрим два класса функций, опи- Будут ли они равны? Чтобы это понять, нужно
санных в примере 8.1.2: проверить два включения:

F = sin x + A, G = cos x + B. F ⊆G
448 Глава 8. ИНТЕГРАЛ

и нужно понять, существует ли число B ∈ R та-


G ⊆ F. кое, для которого будет выполняться тождество
Уже первое из них неверно: f (x) = sin(x + A) = cos(x + B), x ∈ R.
F 6 ⊆G. Действительно, если положить
π
Например, если взять функцию B =A− ,
2
f (x) = sin x то
π
A=B+ ,
которая принадлежит F , то нетрудно проверить, 2
что она не будет принадлежать G, то есть не бу- и мы получим
дет иметь вид π
f (x) = sin(x + A) = sin(x + B + ) = cos(x + B),
2
f (x) = cos x + B
x ∈ R,
ни при каком значении параметра B. Действи- — здесь мы использовали доказанное ранее тож-
тельно, если предположить, что это не так, то дество (5.1.101):
есть существует некое число B ∈ R такое, что
 π
выполняется тождество sin t + = cos t.
2
sin x = cos x + B, x ∈ R,
2. Теперь проверим второе включение. Выбе-
то, перебросив cos x в левую часть, рем какую-нибудь функцию из класса G, то есть
функцию вида
sin x − cos x = B, x ∈ R,
g(x) = cos(x + B), x ∈ R,

и, поделив на 2, мы получим тождество
где B ∈ R – какое-то фиксированное число. Что-
1 1 B бы проверить, принадлежит ли она классу F ,
√ · sin x − √ · cos x = √ , x ∈ R, нужно понять, существует ли число A ∈ R та-
2 2 2
кое, для которого будет выполняться тождество
или, что эквивалентно, тождество
g(x) = cos(x + B) = sin(x + A), x ∈ R.
π B
sin x − = √ , x ∈ R. Действительно, если положить
4 2
π
Понятно, что оно не может выполняться, потому A=B+ ,
2
что синус — не постоянная функция.
Мы делаем вывод, что то
π
B =A− ,
2
F 6= G. и мы получим
⋄ 8.1.5. Рассмотрим теперь классы функций из π
примера 8.1.3: g(x) = cos(x + B) = cos(x + A − ) = sin(x + A),
2
x ∈ R,
F = sin(x + A), G = cos(x + B).
— здесь мы использовали доказанное ранее тож-
Будут ли они равны? Опять, чтобы это понять, дество (5.1.106):
нужно проверить два включения:  π
cos t − = sin t.
F ⊆G 2
⋄ 8.1.6. Следующий пример показывает, что от-
и
ношение равенства на отрезках не аддитивно:
G ⊆ F.
 
1. Проверим первое включение. Выберем F [a,b] = G [a,b] & F [b,c] = G [b,c]
какую-нибудь функцию из класса F , то есть
функцию вида 6 ⇒ F [a,c] = G [a,c]

f (x) = sin(x + A), x ∈ R, Рассмотрим функции


(
где A ∈ R – какое-то фиксированное число. Что- 1, x 6 0
f1 (x) =
бы проверить, принадлежит ли она классу G, 0, x > 0
§ 1. Неопределенный интеграл 449
(
1, x > 0 (это тоже класс, состоящий всего из двух функ-
f2 (x) = ций). Для этих классов мы получим
0, x < 0
и положим
F [−1,0] = {f1 [−1,0] , f2 [−1,0] } =
F = {f1 , f2 }
= {g2 [−1,0] , g1 [−1,0] } = G [−1,0]
(это класс, состоящий всего из двух функций). И
точно так же рассмотрим функции и
(
1, x = 0
g1 (x) = F [0,1] = {f1 [0,1] , f2 [0,1] } =
0, x 6= 0
= {g1 [0,1] , g2 [0,1] } = G [0,1]
g2 (x) = 1, x ∈ R,
но при этом
и положим
G = {g1 , g2 } F [−1,1] 6= G [−1,1] .

Классы функций с общей областью определения. Будем говорить, что класс функций F
имеет общую область определения, если любые две функции из него имеют одинаковую область
определения:
∀f, g ∈ F D(f ) = D(g).
В этом случае множество D(f ), где f ∈ F (не зависящее от выбора f ∈ F ), называется областью
определения функций из F и обозначается D(F ):

D(F ) = D(f ) (f ∈ F ).

⋄ 8.1.7. Классы функций, рассматривавшиеся в тоже имеет общую область определения, которая
примерах 8.1.2 и 8.1.3, представляет собой прямую с выкинутой точкой
0:
sin x + A, cos x + B, sin(x + A), cos(x + B),
D(F ) = R \ {0}.
являются, конечно, классами с общей областью
определения, которая у них совпадает со всей ⋄ 8.1.9. Класс функций
прямой R.
1
⋄ 8.1.8. Класс функций F=
x+A
1
F = +A наоборот не имеет общей области определения.
x

Ограничение класса функций. Напомним, что понятие ограничения отображения было опре-
делено выше формулой (0.3.227) (с.43). Применительно к числовым функциям это определение
выглядит так: ограничением функции f : R ֒→ R на множество M ⊆ R называется функция f M ,
определенная правилами:

1) область определения f представляет собой пересечение M с областью определения f :
M

D(f M ) = M ∩ D(f ),

2) на множестве D(f M ) = M ∩ D(f ) функции f M и f совпадают:

∀x ∈ M ∩ D(f ) f M (x) = f (x).

Ограничением класса функций F на множество M называется класс функций F M , определен-
ный правилом
g ∈ F M ⇔ ∃f ∈ F f M = g.
450 Глава 8. ИНТЕГРАЛ

⋄ 8.1.10. Рассмотрим класс функций (состоящий из одних констант) и класс функций

F = ln |x| + A. G = sgn x + B.

Можно заметить, что его ограничением на мно- Можно заметить, что при ограничении на мно-
жество M = (0, +∞) будет класс функций жество M = (0, +∞) получающиеся классы
функций совпадают, потому что
F (0,+∞) = ln x + A.
F (0,+∞) = A, x > 0,
⋄ 8.1.11. Рассмотрим класс функций
и
F =A G (0,+∞) = 1 + B, x > 0.

Тождественность на отрезках. Будем говорить, что два класса функций F и G тождественны


на отрезках, и изображать это записью
F ≡ G, (8.1.13)
если
(i) это классы с общей областью определения, причем область определения у них одинакова:

D(F ) = D(G);

(ii) на любом отрезке [a, b] из их области определения D(F ) = D(G) ограничения этих классов
совпадают:
F [a,b] = G [a,b] ([a, b] ⊆ D(F ) = D(G), a 6= b).

! 8.1.12. Понятно, что если классы функций F потому что, во-первых, области определения у
и G равны, то они тождественны на отрезках: них общие и совпадают
F =G ⇒ F ≡ G. D(F ) = D(G) = R \ {0},
Но обратное неверно: если F и G тождественны и, во-вторых, если отрезок [a, b] лежит в этой об-
на отрезках, то это не означает автоматически, ласти определения, то он полностью лежит либо
что они совпадают: на правой полупрямой
F ≡G 6 ⇒ F = G. [a, b] ⊆ (0, +∞),
В этом нас убеждает следующий пример. либо на левой полупрямой
⋄ 8.1.13. Рассмотрим следующие два класса
[a, b] ⊆ (−∞, 0),
функций:
1 и тогда значение функции sgn x на нем равно
F = + A,
x константе, и выражение sgn x + B в определении
и
1 G можно заменить на выражение A.
G = + sgn x + B.
x ⊲⊲ 8.1.14. Проверьте, выполняются ли следую-
Сами по себе они не совпадают щие тождества:
F 6= G, sin(x + A) ≡ cos(x + B),
потому что функции вида
A ≡ sgn x + B,
1 1 1
f (x) = + A ≡ + B,
x x+A x
не представимы в виде 1 1
1 + A ≡ + sgn(x − 1) + B,
g(x) = + sgn x + B x x
x 1 1
+ A ≡ + sgn x + A,
(и наоборот). Однако, эти классы функций тож- x x
дественны на отрезках, ex+A ≡ B · ex ,
F ≡ G, ex+A ≡ B · ex , B > 0.
§ 1. Неопределенный интеграл 451

Теорема 8.1.15. Если функции f и g имеют областью определения одно и то же связное мно-
жество M , то классы f (x) + A и g(x) + B тождественны на отрезках тогда и только тогда,
когда они совпадают, или, что эквивалентно, когда функции f и g отличаются на константу:
f (x) + A ≡ g(x) + B ⇔ f (x) + A = g(x) + B ⇔ f (x) = g(x) + C
Доказательство. Очевидно, что импликации справа налево выполняются автоматически
f (x) + A ≡ g(x) + B ⇐ f (x) + A = g(x) + B ⇐ f (x) = g(x) + C
поэтому важно только доказать импликацию
f (x) + A ≡ g(x) + B ⇒ f (x) = g(x) + C.
Зафиксируем для этого какой-нибудь отрезок [a, b] ⊆ M . Из тождества
f (x) + A ≡ g(x) + B (8.1.14)
следует, что на [a, b] функции f и g отличаются на некую константу C:
f (x) = g(x) + C, x ∈ [a, b]. (8.1.15)
Она единственна, и мы ее запоминаем. Теперь если [c, d] ⊆ M — какой-то другой отрезок, содержа-
щий [a, b],
[a, b] ⊆ [c, d], (8.1.16)
то опять из тождества (8.1.14) будет следовать, что f и g отличаются на некую константу C ′ теперь
на отрезке [c, d]:
f (x) = g(x) + C ′ , x ∈ [c, d]. (8.1.17)
При этом (8.1.15) и (8.1.17) вместе означают, что константы C и C ′ должны совпадать:
C = C′.
Мы получаем тождество
f (x) = g(x) + C, x ∈ [c, d], (8.1.18)
в котором C — константа, зафиксированная нами на этапе, когда мы выбрали отрезок [a, b] (и
отметили тождество (8.1.15)). И это выполняется для любого отрезка [c, d] со свойством [a, b] ⊆
[c, d] ⊆ M . Это эквивалентно утверждению, что f и g отличаются на константу на M .

! 8.1.16. Для произвольных классов функций F В качестве примера можно взять классы C(R)
и G с общей связной областью определения тео- непрерывных функций на R и C00 (R) непрерыв-
рема 8.1.15 не верна: из тождества ных функций с компактным носителем на R. Для
них
F ≡G
C(R) ≡ C00 (R),
формально не следует равенство
но
F =G C(R) 6= C00 (R)

Алгебраические операции с классами функций. Если F и G — два класса функций с общими


областями определения, то их суммой называется класс функций F + G, определенный правилом
h∈F +G ⇔ ∃f ∈ F ∃g ∈ G h = f + g.
Область определения получаемого класса совпадает с пересечением областей определения F и G:
D(F + G) = D(F ) ∩ D(G).
Точно так же произведением класса функций F на скаляр α называется класс функций α · F ,
определяемый правилом
h ∈ α · F ⇔ ∃f ∈ F h = α · f.
Область определения получаемого класса совпадает с областью определения F :
D(α · F ) = D(F ).
452 Глава 8. ИНТЕГРАЛ

Теорема 8.1.17. Нетривиальная линейная комбинация (то есть такая, чтобы хотя бы один из
коэффициентов α или β был ненулевым) классов f (x) + A и g(x) + B описывается формулой

α · (f (x) + A) + β · (g(x) + B) = α · f (x) + β · g(x) + C (8.1.19)

Доказательство. Если функция h лежит в классе α · (f (x) + A) + β · (g(x) + B), то

h(x) = α · (f (x) + A) + β · (g(x) + B)

для некоторых A, B ∈ R. Поэтому

h(x) = α · f (x) + β · g(x) + C

где C = α · A + β · B. Значит, h лежит в классе α · f (x) + β · g(x) + C. И наоборот, если h лежит в


классе α · f (x) + β · g(x) + C, то h имеет вид

h(x) = α · f (x) + β · g(x) + C.

для некоторого C ∈ R. Подберем A, B ∈ R так, чтобы C = α · A + β · B (это всегда можно сделать,


если хотя бы один из коэффициентов α или β был ненулевой). Тогда

h(x) = α · f (x) + β · g(x) + C = α · f (x) + β · g(x) + α · A + β · B = α · (f (x) + A) + β · (g(x) + B),

то есть h лежит в классе α · (f (x) + A) + β · (g(x) + B).


Теорема 8.1.18. Если
D(f ) ⊆ D(h) (8.1.20)
и
(f (x) + A) + (g(x) + B) ≡ h(x) + C
то
f (x) + A ≡ h(x) − (g(x) + B)
Доказательство. Пусть
(f (x) + A) + (g(x) + B) ≡ h(x) + C.
По уже доказанному свойству 1◦ ,

(f (x) + A) + (g(x) + B) = f (x) + g(x) + E,

поэтому это равносильно условию

f (x) + g(x) + E ≡ h(x) + C.

Это значит, что


D(f ) ∩ D(g) = D(h) (8.1.21)
и на всяком отрезке [a, b] ⊆ D(f ) ∩ D(g) = D(h) функция H представима в виде f (x) + g(x) + E тогда
и только тогда, когда она представима в виде h(x) + C:

∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (8.1.22)

∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (8.1.23)

Заметим, что из условия (8.1.21) следует вложение

D(f ) ⊇ D(h)

которое вместе с (8.1.20)


D(f ) ⊆ D(h)
дает равенство
D(f ) = D(h). (8.1.24)
§ 1. Неопределенный интеграл 453

С другой стороны, из условия (8.1.21) следует вложение

D(g) ⊇ D(h)

из которого в свою очередь следует


D(h) = D(h) ∩ D(g)
Вместе с (8.1.24) это дает
D(f ) = D(h) = D(h) ∩ D(g).
Отсюда можно сделать вывод, что в формулах (8.1.22) и (8.1.23) множество D(f ) ∩ D(g) = D(h)
можно заменить на совпадающее с ним множество D(f ) = D(h) ∩ D(g):

∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (8.1.25)

∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (8.1.26)

Эти условия можно переписать, перебросив g(x) в правую часть:

∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]) (8.1.27)

∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]). (8.1.28)

А затем можно сделать замену E = A и C = −B, и мы получим

∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀A ∈ R ∃B ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]) (8.1.29)

∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀B ∈ R ∃A ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]). (8.1.30)

Эти два условия означают, что на всяком отрезке [a, b] ⊆ D(f ) = D(h)∩D(g) функция F представима
в виде f (x)+A тогда и только тогда, когда она представима в виде h(x)−(g(x)+B), и это в точности
тождество
f (x) + A ≡ h(x) − (g(x) + B).

Если G — класс функций с общей областью определения, и f — функция, у которой область


значений лежит в области определения G,

R(f ) ⊆ D(G)

то композицией G и f называется класс функций G ◦ f , определенный правилом

h∈G◦f ⇔ ∃g ∈ G h = g ◦ f.

Композиция с функцией, непрерывной на отрезках.


• Условимся говорить, что функция f : R ֒→ R непрерывна на отрезках, если она непре-
рывна на всяком отрезке [a, b] из своей области определения.

! 8.1.19. Непрерывность на отрезках эквива- дует непрерывность на всей области определе-


лентна непрерывности на невырожденных отрез- ния. В качестве примера рассмотрим множество
ках (потому что на каждом вырожденном отрез-
ке, то есть на одноточечном множестве [a, a] =
{a}, любая функция непрерывна).
[∞  
1 1
M = [−1, 0] ∪ , ,
⋄ 8.1.20. Из непрерывности на отрезках не сле- n=1
2n 2n − 1
454 Глава 8. ИНТЕГРАЛ

и определим функцию f на нем формулой но при этом


(  
0, x ∈ h[−1, 0] i 1 
f (x) = f = 1 −→ 0 = f (0).
1, x ∈ 2n 1 1
, 2n−1 . 2n n→∞

В этом примере можно было отрезок [−1, 0] за-


На каждом отрезке [a, b] в своей области опреде- менить вырожденным отрезком [0; 0] = {0}, но
ления D(f ) = M функция f непрерывна (точ- мы задали такую область определения, чтобы
нее, равна или 1, если 0 ∈ / [a, b] или 0, если она была интегральной в смысле определения на
{0} = [a, b]), но в точке 0 она разрывна, потому с.456, а получившаяся функция f была диффе-
что ренцируемой в смысле определения на с.456 ни-
1
D(f ) ∋ −→ 0 ∈ D(f ), же.
2n n→∞

Теорема 8.1.21. Если f — функция, непрерывная на отрезках,

R(f ) ⊆ D(G) = D(H) (8.1.31)

и
G ≡ H, (8.1.32)
то
G◦f ≡H◦f (8.1.33)

Доказательство. 1. Пусть p ∈ G ◦ f . Это означает, что существует функция g ∈ G такая, что


p = g ◦ f . Если зафиксировать отрезок [a, b] ⊆ D(f ) = D(G ◦ f ) = D(H ◦ f ), то поскольку функция f
непрерывна, по следствию 4.3.29, его образ f ([a, b]) при отображении f тоже будет отрезком (воз-
можно вырожденным) в R. Поэтому из (8.1.32) следует, что на множестве f ([a, b]) классы функций
G и H совпадают:
G f ([a,b]) = H f ([a,b]) .

Значит, для функции g ∈ G можно подобрать функцию h ∈ H такую, что



g f ([a,b]) = h f ([a,b]) .

Отсюда следует, что


p [a,b] = g ◦ f [a,b] = h ◦ f [a,b] ∈ H ◦ f [a,b] .

Мы доказали вложение
G ◦ f [a,b] ⊆ H ◦ f [a,b] .

2. Точно так же доказывается вложение



G ◦ f [a,b] ⊇ H ◦ f [a,b] .

3. Вместе эти два вложения означают равенство



G ◦ f [a,b] = H ◦ f [a,b] .

которое справедливо для всякого отрезка [a, b] ⊆ D(f ) = D(G ◦ f ) = D(H ◦ f ). Это доказывает
(8.1.33).

(b) Определение и свойства неопределенного интеграла


Дифференцируемые функции и первообразная на отрезке.
• Пусть функция h определена на отрезке [a; b]. Тогда
— ее правой производной в точке a называется предел

h(x) − h(a)
h′+ (a) := lim (8.1.34)
x→a+0 x−a
§ 1. Неопределенный интеграл 455

— ее левой производной в точке b называется предел


h(x) − h(b)
h′− (b) := lim (8.1.35)
x→b−0 x−b
• Если эти величины конечны, и кроме того функция h имеет (обычную) конечную произ-
водную в любой точке интервала (a; b), то говорят, что h дифференцируема на отрезке
[a; b], а ее производной на отрезке [a; b] называется функция

 ′
h+ (a), x = a
h′ (x) = h′ (x), x ∈ (a; b) (8.1.36)

 ′
h− (b), x = b

Предложение 8.1.22. Всякая дифференцируемая функция на отрезке [a, b] непрерывна на нем.


Доказательство. Если функция h дифференцируема на отрезке [a; b], то по теореме 6.1.5, она будет
непрерывна в каждой внутренней точке этого отрезка. Остается убедиться, что на концах она тоже
непрерывна. Это делается тем же приемом, что и в теореме 6.1.5: если пределы (8.1.34) и (8.1.35)
существуют и конечны, то функция h непрерывна в точках a и b.
• Функция F называется первообразной для функции f на отрезке [a; b], если F определена
на [a; b], дифференцируема на нем и ее производная на нем равна f :

F ′ (x) = f (x), x ∈ [a; b] (8.1.37)

При этом, в соответствии с определением производной на отрезке формулой (8.1.36), на


концах отрезка формула (8.1.37) интерпретируется, как условие на односторонние произ-
водные:
F+′ (a) = f (a), F−′ (b) = f (b) (8.1.38)
Лемма 8.1.23. Пусть функция H определена и дифференцируема на отрезке [a, b], причем ее
производная равна нулю на [a, b]:
H ′ (x) = 0, x ∈ [a, b] (8.1.39)
Тогда функция H(x) постоянна на [a, b]:

H(x) = C, x ∈ [a, b]

для некоторого C ∈ R.
Доказательство. Положим C = H(a). Для любого x ∈ (a, b] мы получим, что функция H
– дифференцируема на интервале (a; x) (потому что она дифференцируема на (a, b)), и
– непрерывна на отрезке [a; x] (по предложению 8.1.22)
поэтому, мы можем применить к функции H на отрезке [a; x] теорему Лагранжа 6.1.33, и тогда
получим, что существует такая точка ξ ∈ (a; x), что

H(x) − H(a)
= H ′ (ξ) = (8.1.39) = 0
x−a
отсюда
H(x) − H(a) = 0 =⇒ H(x) = H(a) = C

Свойства первообразных на отрезке


10 . Если F – первообразная для некоторой функции f на отрезке [a; b], то F является непре-
рывной функцией на [a; b].
20 . Если F – какая-нибудь первообразная для функции f на отрезке [a; b], то все первообраз-
ные для функции f на отрезке [a; b] имеют вид

F (x) + C

где C – произвольные константы.


456 Глава 8. ИНТЕГРАЛ

Доказательство. 1. Если F – первообразная для f на [a; b], то F дифференцируема на [a; b] (и ее


производной будет f ), поэтому в силу предложения 8.1.22, F непрерывна на [a; b].
2. Пусть F и G – две первообразные для f на отрезке [a; b]:

F ′ (x) = G′ (x) = f (x), x ∈ [a, b]

Тогда их разность H = G − F будет иметь нулевую производную на [a; b]

H ′ (x) = G′ (x) − F ′ (x) = f (x) − f (x) = 0, x ∈ [a; b]

Значит, по лемме 8.1.23, функция H постоянна:

H(x) = G(x) − F (x) = C, x ∈ [a; b]

(где C – некоторая константа). Следовательно,

G(x) = F (x) + C, x ∈ [a; b]

У нас получилось, что если F – какая-нибудь первообразная, то любая другая первообразная G


имеет вид G(x) = F (x) + C.

Интегральные множества и функции, дифференцируемые на отрезках.


´
• Пусть M ⊆ R — какое-то числовое множество. Интегральной частью M множества M
называется объединение всех невырожденных отрезков, содержащихся в M :
´ [
M = [a, b].
[a,b]⊆M, a6=b

• Множество M называется интегральным, если оно совпадает со своей интегральной ча-


стью: ´
M =M

⋄ 8.1.24. Интегральная часть (невырожденно- ⋄ 8.1.26. Интегральная часть дискретного2 мно-


го) открытого интервала (a, b) совпадает с ним жества, например, N, пуста:
самим: ´
´
N = ∅,
(a, b) = (a, b),

поэтому любой интервал является интеграль- поэтому никакое дискретное множество не ин-
ным множеством. тегрально
⋄ 8.1.27. Интегральная часть последовательно-
⋄ 8.1.25. Интегральная часть (невырожденного) сти тоже всегда пуста, например,
отрезка [a, b] совпадает с ним самим:
 ´
1 ∗
; n∈N =∅
´
[a, b] = [a, b], n

поэтому любой отрезок является интегральным поэтому никакая последовательность не инте-


множеством гральна

• Будем говорить, что функция F : R ֒→ R дифференцируема на отрезках, если


(i) ее область определения D(F ) является интегральным множеством,
(ii) на каждом невырожденном отрезке [a, b] ⊆ D(F ) (a 6= b) функция F дифферен-
цируема (в смысле определения на с.455).

2 Множество M называется дискретным, если каждая его точка x ∈ M обладает окрестностью U (x), в которой
ε
не содержится никаких других точек множества M .
§ 1. Неопределенный интеграл 457

⋄ 8.1.28. Функция f (x) = x2 , очевидно, диффе- ке [−1, 1] она не дифференцируема).


ренцируема на отрезках. √
⋄ 8.1.30. Функция f (x) = x не дифференци-
⋄ 8.1.29. Функция f (x) = |x|, наоборот, не диф- руема на отрезках (потому что на отрезке [0, 1]
ференцируема на отрезках (потому что на отрез- она не дифференцируема).

Теорема 8.1.31. Если функция F : R ֒→ R дифференцируема на отрезках, то существует функ-


ция f : R ֒→ R с той же областью определения,

D(f ) = D(F ) (8.1.40)



такая, что на любом невырожденном отрезке [a, b] ⊆ D(F ) ограничение f [a,b] является производ-

ной ограничения F (в смысле определения на с.455):
[a,b]

(F [a,b] )′ = f [a,b] (8.1.41)

• Функция f : R ֒→ R с перечисленными в теореме 8.1.31 свойствами (8.1.40) и (8.1.41)


называется производной функции F на отрезках и обозначается

f = F′ (8.1.42)

Доказательство. Функция F дифференцируема на отрезках, и это значит, что на каждом невы-


рожденном отрезке [a, b] ⊆ D(F ) она дифференцируема, и поэтому существует некая функция fa,b ,
являющаяся производной F на этом отрезке:

(F [a,b] )′ = fa,b

Наша задача — показать, что все функции fa,b являются ограничениями f[a,b] некоторой единой
функции f : D(F ) → R:
f [a,b] = fa,b .

Для этого нужно просто проверить, что для любых двух отрезков [a, b], [c, d] ⊆ D(F ) соответствую-
щие функции fa,b и fc,d совпадают на пересечении [a, b] ∩ [c, d]:

∀x ∈ [a, b] ∩ [c, d] fa,b (x) = fc,d (x).

Действительно, если это пересечение [a, b] ∩ [c, d] непусто, то объединение отрезков [a, b] и [c, d]
представляет собой отрезок, содержащийся в D(F ):

[a, b] ∪ [c, d] = [A, B] ⊆ D(F ),

и для любой точки x ∈ [a, b] ∩ [c, d] мы получим

F (y) − F (x) F (y) − F (x)


fa,b (x) = (F [a,b] )′ (x) = lim = lim = (F [A,B] )′ (x) =
y→x, y∈[a,b] y−x y→x, y∈[A,B] y−x
F (y) − F (x) F (y) − F (x)
= lim = lim = (F [c,d] )′ (x) = fc,d (x).
y→x, y∈[A,B] y−x y→x, y∈[c,d] y−x

Из предложения 8.1.22 следует


Теорема 8.1.32. Всякая дифференцируемая на отрезках функция непрерывна на отрезках3 .

3 Понятие функции, непрерывной на отрезках, было определено на с.453.


458 Глава 8. ИНТЕГРАЛ

! 8.1.33. Однако, из дифференцируемости функ- непрерывность на всей своей области определе-


ции f : R ֒→ R на отрезках не следует ее ния D(f ), как показывает пример 8.1.20.

Неопределенный интеграл.
• Функция F : R ֒→ R называется первообразной для функции f : R ֒→ R, если f является
производной для F на отрезках (в смысле определения на с.457). Это означает 3 вещи:
(i) область определения D(f ) функции f является интегральным множеством;
(ii) области определения функций F и f совпадают:

D(F ) = D(f ) (8.1.43)

(iii) на каждом невырожденном отрезке [a, b] ⊆ D(F ) = D(f ) функция F являет-


ся первообразной для функции f (в смысле определения на с.455), то есть F
дифферецируема на [a, b], и ее производная совпадает с f на [a, b]:

(F [a,b] )′ = f [a,b] . (8.1.44)

• Класс всех первообразных для функции f называется ее неопределенным интегралом и


обозначается символом ˆ
f (x) d x

(символ d здесь называется дифференциалом и нужен он для того, чтобы показать, по


какой переменной ведется интегрирование). Из (8.1.43) следует равенство
ˆ 
D f (x) d x = D(f ) (8.1.45)

Теорема 8.1.34. Если F – какая-нибудь первообразная для функции f , то неопределенный инте-


грал функции f тождественен на отрезках классу функций F (x) + C:
ˆ
f (x) d x ≡ F (x) + C. (8.1.46)

Доказательство. Тождество на отрезках (8.1.46) означает две вещи:


— что области определения функциональных классов в обеих частях совпадают:
ˆ 
D f (x) d x = D(F (x) + C), (8.1.47)

´
— и что на каждом отрезке [a, b] ⊆ D( f (x) d x) = D(F (x) + C) ограничения этих классов
совпадают: ˆ 

f (x) d x [a,b] = F (x) + C [a,b] . (8.1.48)

1. Утверждение (8.1.47) доказывается цепочкой:


ˆ 
D f (x) d x = (8.1.45) = D(f ) = (8.1.43) = D(F ) = D(F (x) + C).

2. Для доказательства (8.1.48) заметим сначала, что


ˆ
f (x) d x ⊇ F (x) + C. (8.1.49)

Это доказывается такой цепочкой:


G имеет вид F + C
⇓ F удовлетворяет (8.1.43) и (8.1.44), как первообразная для f

G удовлетворяет (8.1.43) и (8.1.44):


§ 1. Неопределенный интеграл 459

D(G) = D(F ) = D(f ) ∀[a, b] ⊆ D(f ) (G [a,b] )′ = (F [a,b] )′ = f [a,b]

G первообразная для f

ˆ
G принадлежит классу f (x) d x

После того, как доказано


´ (8.1.49), мы можем сделать вывод, что, в частности, для всякого отрезка
[a, b] ⊆ D(f ) = D( f (x) d x) = D(F (x) + C) выполняется включение
ˆ 

f (x) d x [a,b] ⊇ F (x) + C [a,b] . (8.1.50)

´3. Теперь, чтобы доказать (8.1.48) остается проверить, что для всякого отрезка [a, b] ⊆ D(f ) =
D( f (x) d x) = D(F (x) + C) выполняется обратное включение:
ˆ 

f (x) d x [a,b] ⊆ F (x) + C [a,b] . (8.1.51)

Здесь используется такая цепочка:


ˆ
G принадлежит классу f (x) d x


G — первообразная для f

G удовлетворяет (8.1.44) :

(G [a,b] )′ = f [a,b]
⇓ свойство 20 первообразных на отрезке (с.455)

G [a,b]
отличается от F [a,b] на константу:

∃C G [a,b] = F (x) + C [a,b]

dx
ˆ
Таблица интегралов. Неопределенные инте- ≡ ln |x| + C (8.1.54)
гралы элементарных функций подсчитаны, и вот x
их список.45 ax
ˆ
ax d x ≡ + C, (0 < a 6= 1) (8.1.55)
ln a
ˆ
ex d x ≡ ex + C
ˆ
(8.1.56)
A dx ≡ A ·x + C (8.1.52)
ˆ
xα+1 sin x d x ≡ − cos x + C (8.1.57)
ˆ
xα d x ≡ +C (α 6= −1) (8.1.53)
α+1
4 При α ∈ (−1, 0) в формуле (8.1.53) области определения левой и правой частей формально не совпадают, потому
что
/ D(xα )
0∈ & 0 ∈ D(xα+1 ).
Поэтому чтобы формула (8.1.53) в этом случае была верна, нужно ввести соглашение, что правая часть здесь счита-
ется определенной на области определения подынтегральной функции. Это также относится к формуле (8.1.62). В
остальных формулах это требование излишне, потому что области определения первообразной и подынтегральной
функции совпадают по определению.
5 В формулах (8.1.52), (8.1.53), (8.1.55), (8.1.61), (8.1.62), (8.1.63), (8.1.64) значения параметров A, α и a считаются

фиксированными, чтобы не получилось, что интеграл берется от целого класса функций. Это важно, потому что,
например, если в (8.1.53) считать, что α может меняться, то тождество классов функций можно будет понимать
более широко, так что в одной из частей можно будет заменить α на новую букву, например, β, и получающееся
тождество тоже придется признать верным.
460 Глава 8. ИНТЕГРАЛ
ˆ
cos x d x ≡ sin x + C (8.1.58) мер, из формулы
 α+1 
dx ∂ x (α + 1) · xα
ˆ
≡ tg x + C (8.1.59) = = xα
cos2 x ∂x α + 1 α+1
dx
ˆ
≡ − ctg x + C (8.1.60) следует, формула (8.1.53):
sin2 x
dx 1 x
ˆ
xα+1
ˆ
2 2
≡ arctg + C (8.1.61) xα d x ≡ +C
a +x a a α+1
dx x
ˆ
√ ≡ arcsin + C (8.1.62) В доказательстве формул (8.1.54), (8.1.63) и
2
a −x 2 a
(8.1.64) используется доказанная выше формула
dx 1
a + x + C
ˆ
≡ ln (8.1.63) (6.1.84).
2
a −x 2 2a a − x
dx p
(8.1.64) ! 8.1.35. Понятное дело, в качестве парамет-
ˆ

√ ≡ ln x + x2 + A + C
x2 + A ра можно выбирать любую букву, кроме тех,
что входят в интегрируемое выражение, необя-
Доказательство. Здесь всюду используется тео- зательно C. Например, можно писать
рема 8.1.34, и доказательство состоит в том, что-
бы проверить, что производная от правой части xα+1
ˆ
α
совпадает с подынтегральной функцией. Напри- x d x ≡ + D.
α+1

Свойства неопределенных интегралов.


1◦ . Линейность: если α 6= 0 или β 6= 0, и функции f , и g имеют первообразные, причем D(f )∩D(g)
— интегральное множество, то

ˆ ˆ ˆ
α · f (x) + β · g(x) d x ≡ α · f (x) d x + β · g(x) d x (8.1.65)

2◦ . Замена переменной: если функция g имеет первообразную, а f — дифференцируемая на от-


резках функция, у которой область значений содержится в области определения функции g,

R(f ) ⊆ D(g), (8.1.66)


то ˆ ˆ 

g(f (x)) · f ′ (x) d x ≡ g(y) d y (8.1.67)
y=f (x)

3◦ . Интегрирование по частям: если функции f и g дифференцируемы на отрезках, D(f ) ∩ D(g)


— интегральное множество, а функции f · g ′ и f ′ · g имеют первообразные, то
ˆ ˆ
f (x) · g ′ (x) d x ≡ f (x) · g(x) − g(x) · f ′ (x) d x (8.1.68)

Доказательство. 1. В первом свойстве сначала нужно проверить, что левая и правая части имеют
одинаковые области определения. Действительно,
ˆ 
 
D α · f (x) + β · g(x) d x = D α · f + β · g = D(f ) ∩ D(g) =
 ˆ   ˆ   ˆ ˆ 
= D α · f (x) d x ∩ D β · g(x) d x = D α · f (x) d x + β · g(x) d x .

Далее, пусть F и G — первообразные для f и g соответственно:


′ ′
F [a,b] = f [a,b] ([a, b] ⊆ D(f )), G [a,b] = g [a,b] ([a, b] ⊆ D(g)).

Тогда для любого отрезка [a, b] ⊆ D(f ) ∩ D(g) справедливо равенство


′ ′ ′
(α · F + β · G) [a,b] = α · F [a,b] + β · G [a,b] = α · f [a,b] + β · g [a,b]
§ 1. Неопределенный интеграл 461

С другой стороны,
 
D α · F + β · G = D(F ) ∩ D(G) = D(f ) ∩ D(g) = D α · f + β · g .

И, наконец, множество
D(f ) ∩ D(g) = D(α · f + β · g)
по условиям утверждения 1◦ интегрально. Вместе это значит, что функции α · F + β · G и α · f + β · g
удовлеторяют условиям (i)—(iii) определения первообразной на с.458, то есть функция α · F + β · G
является первообразной для функции α · f + β · g. Как следствие,


ˆ
α · f (x) + β · g(x) d x ≡ (8.1.46) ≡ (α · F + β · G)(x) + C = α · F (x) + β · G(x) + C =
ˆ ˆ
= (8.1.19) = α · (F (x) + A) + β · (G(x) + B) ≡ (8.1.46) ≡ α · f (x) d x + β · g(x) d x

2. В тождестве (8.1.67) нужно сначала проверить, что области определения функциональных


классов слева и справа совпадают. Это следует из того, что условие дифференцируемости функции
f на отрезках автоматически предполагает равенство

D(f ′ ) = D(f ),

а условие (8.1.66) дает условие


D(g ◦ f ) = D(f ).
Из них мы получаем цепочку:
ˆ  ˆ 

D g(f (x)) · f ′ (x) d x = D (g ◦ f ) · f ′ = D(g ◦ f ) ∩ D(f ′ ) = D(f ) = D g(y) d y
| {z } | {z } y=f (x)
k k
D(f ) D(f )

Пусть далее G — первообразная для функции g:



G [α,β] = g [α,β] , [α, β] ⊆ D(g).

Тогда, в силу (8.1.46), ˆ


g(y) d y ≡ G(y) + C (8.1.69)

Поскольку функция f дифференцируема на отрезках, она непрерывна на отрезках (по теореме


8.1.32). Вдобавок условие (8.1.66) означает, что
ˆ 
R(f ) ⊆ D g(y) d y = D(G(y) + C).

Отсюда, применяя теорему 8.1.21, мы можем заключить, что тождество (8.1.69) влечет за собой
тождество

ˆ
g(y) d y y=f (x) ≡ G(y) + C y=f (x) . (8.1.70)

Заметим далее, что функция G ◦ f является первообразной для функции (g ◦ f ) · f ′ :

(G ◦ f )′ (x) = G′ (f (x)) · f ′ (x) = g(f (x)) · f ′ (x).


′ ′

(G ◦ f ) [a,b] = (g ◦ f ) [a,b] · f [a,b] , [a, b] ⊆ D((g ◦ f ) · f ′ ) = D(f )

Отсюда и из (8.1.46) мы получаем первое тождество в цепочке


ˆ
g(f (x)) · f ′ (x) d x ≡ (G ◦ f )(x) + C = G(f (x)) + C =

ˆ
= G(y) + C y=f (x) ≡ (8.1.70) ≡ g(y) d y y=f (x)
462 Глава 8. ИНТЕГРАЛ

3. В тождестве (8.1.68) нужно опять сначала проверить, что девая и правая части имеют одну и
ту же область определения. Это следует из того, что функции f и g дифференцируемы на отрезках:
по этой причине выполняются равенства

D(f ′ ) = D(f ), D(g ′ ) = D(g),

из которых мы получаем систему равенств

D(f · g ′ ) = D(f · g) = D(f ′ · g) (8.1.71)


| {z } | {z } | {z }
k k k
D(f ) ∩ D(g′ ) D(f ) ∩ D(g) D(f ′ ) ∩ D(g)

а из них — цепочку
ˆ 
D f (x) · g ′ (x) d x = D(f · g ′ ) = D(f ) ∩ D(g ′ ) = D(f ) ∩ D(g) =
 
 
ˆ
= D(f ) ∩ D(g) ∩ D(f ′ ) ∩ D(g) = D f (x) · g(x) − g(x) · f ′ (x) d x

Заметим далее, что для любого отрезка [a, b] ⊆ D(f ) ∩ D(g) справедливо равенство
′ ′ ′
(f · g) [a,b] = f [a,b] · g [a,b] + f [a,b] · g [a,b] .

С другой стороны,
 
D f · g = D(f ) ∩ D(f ) = D(f ′ ) ∩ D(g) ∩ D(f ) ∩ D(g ′ ) = D f ′ · g + f · g ′ .

И, наконец, множество
D(f ) ∩ D(g) = D(f ′ · g + f · g ′ )
по условиям утверждения 3◦ интегрально. Вместе это значит, что функции f · g и f ′ · g + f · g ′
удовлеторяют условиям (i)—(iii) определения первообразной на с.458, то есть функция f ·g является
первообразной для функции f ′ · g + f · g ′ . Как следствие,


ˆ
(f · g)(x) + C ≡ (8.1.46) ≡ f ′ (x) · g(x) + f (x) · g ′ (x) d x ≡ (8.1.65) ≡
ˆ ˆ
≡ f ′ (x) · g(x) d x + f (x) · g ′ (x) d x (8.1.72)

Комбинируя это со вторым равенством в (8.1.71),

D(f · g ′ ) = D(f · g),

и применяя теорему 8.1.18, мы получим


ˆ ˆ ˆ
f (x) · g (x) d x ≡ (f · g)(x) + C − f (x) · g(x) d x ≡ (f · g)(x) − f ′ (x) · g(x) d x.
′ ′

(c) Вычисление неопределенных ⋄ 8.1.36.


интегралов ˆ 
5

3
2 + x − 3 sin x − dx ≡
Покажем теперь на примерах, как с помощью пе- 1 + x2
речисленных формул вычисляются неопределен-
ˆ ˆ ˆ
ные интегралы. ≡ 2 d x + x3 d x − 3 sin x d x−

1 x4
ˆ
−5 d x = 2x+ +3 cos x−5 arctg x+C
Применение формулы линейности. Пока- 1+x 2 4
жем, как применяется формула (8.1.65). ⋄ 8.1.37.
§ 1. Неопределенный интеграл 463
ˆ  
√ 2
ˆ
x+
1
d x ≡ x 2 d x+ Теперь покажем, чем может быть полезно вы-
cos2 x несение из-под знака дифференциала.
1 2 3
ˆ
+2 d x = x 2 + 2 tg x + C ⋄ 8.1.41.
cos2 x 3
y = 2x − 5
ˆ
10
(2x − 5) d x = =
x = y+5
Внесение под знак дифференциала и при- 2

менение формулы замены переменной. 1
ˆ ˆ

= y 10  d y+5
2 = y 10
dy =
Формулу (8.1.67) удобно применять, предвари- y=2x−5 2 y=2x−5
тельно договорившись о следующем обозначе- 1 1

нии: для всякой функции f пусть символ d f (x) = y 11 + C = (2x − 5)11 + C =
2 · 11 y=2x−5 2 · 11
обозначает выражение f ′ (x) d x: 1
= (2x − 5)11 + C
d f (x) = f ′ (x) · d x (8.1.73) 22
⋄ 8.1.42.

В частности, интеграл g(f (x))·f ′ (x) d x в левой y = 1 + √x
´
dx
ˆ
части (8.1.67) можно тогда переписать в таком √ = =
1 + x x = (y − 1)2
виде:
d (y − 1)2
ˆ 
= √ =
ˆ ˆ
g(f (x)) · f ′ (x) d x = g(f (x)) d f (x). y y=1+ x
ˆ
2(y − 1)dy
= √ =
Если используя это обозначение переписать фор- y y=1+ x
мулу (8.1.67) ˆ  
1
ˆ  =2 1− dy √ ≡
ˆ
y y=1+ x
g(f (x)) d f (x) ≡ g(y) d y , (8.1.74)

y=f (x) ≡ 2y − 2 ln |y| + C √ =
y=1+ x
то переход в ней от правой части к левой можно √ √
= 2(1 + x) − 2 ln(1 + x) + C
будет интерпретировать как замену переменной.
⊲⊲ 8.1.43. Найдите неопределенные интегралы:
• Переход от левой части к правой в формуле 1. ´ cosxln x d x
´
(8.1.73) называется вынесением из-под знака 2. √ cos2 x dx
sin x+3
дифференциала, а переход от правой части к ´ 2x
левой — внесением под знак дифференциала. 3. 1+x4 d x
´ etg x
4. ´ cos 2x dx
Покажем, какую пользу может принести вне- 2x−1
5. √1−x+x dx
2
сение под знак дифференциала. ´ 3x2 3
6. x3 +1 ln(x + 1) d x
⋄ 8.1.38. ´ arcsin x
7. e√1−x2 d x
ˆ ˆ ´ ex
8. √4−e dx
esin x · cos x d x = esin x d sin x =

´ sin x 2x
9. √ dx
ˆ ´ cos√x
3
= ey d y = ey + C = esin x + C 10. x 2x4 − 3 d x
y=sin x y=sin x ´ x5
11. √7−x dx
´ cos x6
⋄ 8.1.39. 12. √3+sin x d x
1
ˆ ˆ

cos 3x d x = cos 3x · 3 d x = Интегрирование по частям. Прежде, чем
3
1
ˆ
1
ˆ перейти к обсуждению формулы (8.1.68), пере-

= cos 3x d 3x = cos y d y = пишем ее в следующем виде, используя формулу
3 3 y=3x
внесения под знак дифференциала (8.1.73):
1 1
= sin y + C = sin 3x + C ˆ ˆ
3 y=3x 3 f (x) d g(x) ≡ f (x)·g(x)− g(x) d f (x) (8.1.75)
⋄ 8.1.40.
⋄ 8.1.44.
sin x  
ˆ ˆ ˆ
tg x d x = dx = ln x d x = интегрирование =
cos x по частям

− sin x d x d cos x
ˆ ˆ ˆ
=− dx = − = = ln x · x − x d ln x =
cos x cos x
d y
ˆ
1
ˆ ˆ
=− ≡ − ln |y| + C = = ln x · x − x · d x = ln x · x − 1 d x =
y y=cos x y=cos x x
= − ln | cos x| + C = ln x · x − x + C
464 Глава 8. ИНТЕГРАЛ
ˆ
⋄ 8.1.45. = x2 sin x − 2 x sin x d x =

ˆ ˆ   ˆ  
xex d xH = x d ex = интегрирование
по частям = = x sin x + 2 x d cos x = интегрирование
2
=
по частям
ˆ  
= xex − ex d x = xex − ex + C
ˆ
= x2 sin x + 2 x cos x − cos x d x =
⋄ 8.1.46. = x2 sin x + 2 (x cos x − sin x − C1 ) =
ˆ ˆ   = x2 sin x + 2x cos x − 2 sin x + C
xsin x d x = − x d cos x = интегрирование

по частям =
 ˆ  ⊲⊲ 8.1.51. Найдите интегралы:
= − x cos x + cos x d x = 1) x2 sin x d x
´
´ 2 −x
= − (x cos x + sin x + C1 ) = −x cos x − sin x + C 2) x e d x
3) x ln2 x d x
´
⋄ 8.1.47. 4) x3 d cos x,
´
  5) cos x d x3 ,
´
1
ˆ ˆ
2 3 интегрирование
x ln x d @x = ln x d x = по частям = 6) x d ex .
´
3
 
1
ˆ
= ln x · x3 − x3 d ln x = Случается, что интегрирование по частям
3
  приводит к исходным интегралам. В таких слу-
1 1
ˆ
== ln x · x3 − x3 · d x = чаях нужно поступать следующим образом.
3 x
 
1 ⋄ 8.1.52.
ˆ
= ln x · x3 − x2 d x =
3
  ˆ ˆ  
1 3 1 3 1 3 1 3 e sin x d > x = sin x d ex = интегрирование
x
=
= ln x · x − x + C = ln x·x − x +C по частям
3 3 3 9 ˆ
⊲⊲ 8.1.48. Найдите интегралы: = ex sin x − ex W d sin x =
´ ln x ˆ
x x
´
1) ´ x22xd x 6) sin2 x d x = e sin x − ex cos x d > x =
2) ´√
´ xe d x 7) x ln x d x ˆ  
3) ´ arctg x d x ´ n = ex sin x − cos x d ex = интегрирование =
4) 8) x ln x d x по частям
´ x cos x d x ´  ˆ 
5) x arctg x d x 9) arcsin x d x
= ex sin x − ex cos x − ex d cos x =
Иногда бывает необходимо применять фор- ˆ
x x
мулу интегрирования по частям несколько раз. = e sin x − e cos x + ex W d cos x =

⋄ 8.1.49.
ˆ
= ex sin x − ex cos x − ex sin x d x
ˆ ˆ  
x2 ex d xH = x2 d ex = интегрирование
по частям =
ˆ ˆ Мы вернулись к исходному интегралу. Если те-
перь обозначить
= x2 ex − ex U d x2 = x2 ex − 2 ex x d xD =
ˆ   ˆ
= x e − 2 x d ex = интегрирование
2 x
по частям = I= ex sin x d x,
 ˆ 
= x2 ex − 2 xex − ex d x = то мы получим уравнение

= x2 ex − 2 (xex − ex − C1 ) = I = ex sin x − ex cos x − I, (8.1.76)


= x2 ex − 2xex + 2ex + C
из которого легко находится I:
⋄ 8.1.50.
ˆ ˆ 2I = ex sin x − ex cos x
x2 cos x d x = x2 d sin x =

 

= интегрирование
по частям =
ˆ
1 x
= x2 sin x − ] sin x d x2 = I= (e sin x − ex cos x)
2
§ 1. Неопределенный интеграл 465

Теперь нужно вспомнить, что неопределенный ⊲⊲ 8.1.54. ´ √ Найдите интегралы:


интеграл вычисляется с точностью до констан- 1) ´ 1 + x2 d x
ты, поэтому окончательный ответ будет таким:6 2) ´ ex cos x d x
3) ´ e2x sin2 x d x
1
ˆ
ex sin x d x = (ex sin x − ex cos x) + C 4) ´ cos(ln x) d x
2 5) earcsin x d x
(8.1.77)
⋄ 8.1.53. Рекуррентные формулы
ˆ p   Теперь мы перейдем к специальным приемам вы-
1 − x2 d x = интегрирование
по частям = числения неопределенных интегралов.
p ˆ
√ Некоторые интегралы удается найти только
= x 1 − x2 − x  d 1 − x2 = с помощью так называемых рекуррентных инте-
p гральных формул. Что это такое станет ясно из
x2
ˆ
=x 1−x + 2 √ dx = следующего примера.
1 − x2
p ˆ
1 − x2
ˆ
1 Теорема 8.1.55. Для интегралов
= x 1 − x2 − √ dx+ √ dx =
1−x 2 1 − x2 dx
ˆ
p ˆ p In = (8.1.79)
(x2 + a2 )n
= x 1 − x2 − 1 − x2 d x + arcsin x + C
первый из которых, по формуле (8.1.61), равен
Мы вернулись к исходному интегралу. Если те-
перь обозначить 1 x
I1 = arctg + C (8.1.80)
ˆ p a a
I= 1 − x2 d x, справедлива следующая рекуррентная формула

то получается алгебраическое уравнение, из ко- In+1 = 1 · x 2n − 1


2 2 2 n
+ · In (n ∈ N)
торого находится I: 2na (x + a ) 2na2
p (8.1.81)
2
I = x 1 − x − I + arcsin x + C
Доказательство.

dx
ˆ
p
2I = x 1 − x2 + arcsin x + C In+1 = =
(x2 + a2 )n+1
⇓ 1 a2
ˆ
 p  = 2
dx =
1 2
a (x + a2 )n+1
2
I= x 1 − x + arcsin x + C ˆ 2
2 1 x + a2 − x2
7 = 2
dx =
Выбрав новую константу , получаем оконча- a (x2 + a2 )n+1
тельный ответ: 1
ˆ
1 1
ˆ
x2
ˆ p  p  = 2 2 2 n
dx − 2 dx =
1 a (x + a ) a (x + a2 )n+1
2
1 − x2 d x = x 1 − x2 + arcsin x + A
2 1 1
ˆ
= 2 In − 2 (x2 + a2 )−(n+1) · x· x d x =

(8.1.78) a a
6 В этом месте мы неаккуратно объясняем наши действия, точное объяснение состоит в следующем. Равенство

(8.1.76), которое мы получили, является равенством классов функций. Символ I обозначает в нем класс функций,
представимых в виде F (x) + A, где F — некоторая фиксированная первообразная для подынтегральной функции.
Равенство (8.1.76) поэтому формально означает высказывание
∀A ∃B ∀x F (x) + A = ex sin x − ex cos x − (F (x) + B),
В нем если выразить F (x) через все остальное, то мы получим высказывание
1 x
∀A ∃B ∀x F (x) = (e sin x − ex cos x) − A − B,
2
Из него следует, что любая первообразная F к функции ex sin x имеет вид
1 x
F (x) = (e sin x − ex cos x) − A − B
2
где A, B – какие-то константы. В частности, в качестве первообразной можно выбрать функцию
1 x
F (x) = (e sin x − ex cos x) .
2
И это нам дает ответ (8.1.77).
7 Здесь, как и в примере 8.1.52, в наших рассуждениях имеется небрежность, см. по этому поводу подстрочное

примечание 6.
466 Глава 8. ИНТЕГРАЛ

1 1
ˆ
= In − (x2 + a2 )−(n+1) ·x d (x6 2 + a2 ) = Интегрирование рациональных функций
a2 2a2
1 1
ˆ   • Рациональной функцией называется всякая
2 2 −n интегрируем
= 2 In + x d(x +a ) = по частям = функция R(x), которую можно представить
a 2na2
в виде отношения двух многочленов:
1 1 2 2 −n
= 2 In + 2
x · (x + a ) −
a ˆ2na P (x)
1 2 2 −n
R(x) =
− (x + a ) d x = Q(x)
2na2
1 1 x 1 dx ⋄ 8.1.59. Например, функции
ˆ
= 2 In + 2 2 2 n
− 2 2 2 n
=
a 2na (x + a ) 2na (x + a )
1 1 x 1 x2 + x + 1 2x + 1
= 2 In + − I = , 3
, x5 − 2x + 1
a 2na2 (x2 + a2 )n 2na2
n x − 2 x −x+5
1 x 2n − 1 являются рациональными, а функции
= 2
· 2 2 n
+ · In
2na (x + a ) 2na2
x
sin x, √ , 2x
x−3
Теперь покажем, как применяется рекуррент- не являются рациональными.
ная формула (8.1.81).
В этом параграфе мы покажем, как вычисля-
⋄ 8.1.56. Вычислим, например, интеграл I2 . Для
ются интегралы от рациональных функций.
этого в формулу (8.1.81) подставим n = 1:

1 x 1 Интегрирование простейших дробей Са-


I2 = · + · I1 = (8.1.80) =
2a2 (x2 + a2 ) 2a2 мыми простыми рациональными функциями яв-
x 1 x ляются так называемые простейшие дроби, то
= 2 2 + · arctg + C есть дроби следующих четырех типов.
2a (x + a2 ) 2a3 a
То есть, Типы простейших дробей
dx
ˆ
I2 = = — простейшие дроби 1 типа:
(x2
+ a2 )2
x 1 x A
= 2 2 + · arctg + C (8.1.82) x−a
2a (x + a2 ) 2a3 a
⋄ 8.1.57. Вычислим, интеграл I3 , для чего в — простейшие дроби 2 типа:
формулу (8.1.81) подставим n = 2:
A
(n ∈ N, n > 1)
1 x 3 (x − a)n
I3 = · + 2 · I2 = (8.1.82) =
4a2 (x2 + a2 )2 4a
x — простейшие дроби 3 типа:
= 2 2 +
4a (x + a2 )2 Bx + C
  (p2 − 4q < 0)
3 x 1 x x2 + px + q
+ 2· + · arctg + C =
4a 2a2 (x2 + a2 ) 2a3 a
x 3x 3 x — простейшие дроби 4 типа:
= 2 2 2 2
+ 4 2 2
+ 5 ·arctg +C
4a (x + a ) 8a (x + a ) 8a a
Bx + C
(p2 − 4q < 0, n ∈ N, n > 1)
То есть, (x2 + px + q)n

dx Покажем, как они интегрируются.


ˆ
I3 = =
(x2 + a2 )3
x 3x 3 x ⋄ 8.1.60 (простейшая дробь 1 типа). Для таких
= 2 2 + + ·arctg +C дробей можно вывести общую формулу:
4a (x + a2 )2 8a4 (x2 + a2 ) 8a5 a
(8.1.83)
A y =x−a
ˆ
d x = =
⊲⊲ 8.1.58. Выведите рекуррентные формулы x−a x=y+a
для следующих интегралов, и вычислите их при
ˆ
A ˆ
dy

n = 2, 3: ´ = d(y + a) = A ≡
y y=x−a y y=x−a
k n
1) Jn = ´ x ln x d x (n ∈ N)

2) Kn = sinn x d x (n ∈ N) ≡ A ln |y| + C = A ln |x − a| + C
y=x−a
§ 1. Неопределенный интеграл 467

1
⋄ 8.1.61 (простейшая дробь 2 типа). Здесь так- 3y +
ˆ
2
= dy =
3
же можно найти общую формулу y2 + 4
y 1 1
ˆ ˆ
A y =x−a =3 d y + dy =
ˆ
dx = = 2
y +4 3 2 y + 43
2
(x − a)n x=y+a  
в первом интеграле
A dy
ˆ ˆ
= вносим y под знак =
= d(y + a) = A ≡ дифференциала
yn y=x−a y n y=x−a
3 dy 2 1 1
ˆ ˆ
A A = + dy =
≡ +C = +C 2 y 2 + 34 2 y 2 + 43
(n − 1)y n−1 y=x−a (n − 1)(x − a)n−1
в первом интеграле
!
⋄ 8.1.62 (простейшая дробь 3 типа). Здесь, хо- =
делаем замену
=
y 2 = z − 34
тя и можно вывести общую формулу, но запом- z = y 2 + 43
нить ее уже будет вряд ли возможно. Поэтому 
3 d z − 34 1 dy
ˆ ˆ
мы приведем лишь общий план действий. Чтобы = + =
вычислить интеграл 2 z y=z− 43 z=y+ 34 2 y 2 + 43
3 dz 1 dy
ˆ ˆ
ˆ
Bx + C = 2 3+  √ 2 =
dx (p2 − 4q < 0) 2 z z=y + 4 2
x2 + px + q y 2 + 23
 
применяем
нужно сначала выделить полный квадрат в зна- = формулы ≡
менателе, то есть переписать знаменатель так, (8.1.54) и (8.1.61)
3 1 2 2y
чтобы переменная x встречалась только один
≡ ln |z| + · √ · arctg √ + C =
раз: 2 z=y 2 + 43 2 3 3

3 3 1 2y
p  p 2  p 2 = ln y 2 + + √ · arctg √ + C =
x2 + px + q = x2 + 2 · ·x+ − +q = 2 4 3 3
2 2  
  2  возвращаемся
p 2 p2 = к исходной =
= x+ + q− переменной x
2 4  2 
3 1 3 1 2 x − 12
а затем выражение в скобках заменить на новую = ln x − + + √ ·arctg √ +C =
2 2 4 3 3
переменную:
p 3 1 2x − 1
x+ =y = ln x2 − x + 1 + √ · arctg √ +C =
2 2 3 3
 
Оказывается, что при этом мы получим таблич- всегда
= x2 − x + 1 > 0 =
ные интегралы.
Приведем иллюстрацию. Пусть требуется вы- 3  1 2x − 1
= ln x2 − x + 1 + √ · arctg √ +C
числить интеграл 2 3 3
ˆ
3x − 1 ⋄ 8.1.63 (простейшая дробь 4 типа). Для таких
d x дробей вывести общую формулу и вовсе невоз-
x2 − x + 1
можно. План действий же состоит в следующем.
Поскольку дискриминант знаменателя отрицате- Чтобы вычислить интеграл
лен, ˆ
Bx + C
p2 − 4q = 1 − 4 = −3 < 0 dx (n ∈ N, n > 1, p2 −4q < 0)
(x + px + q)n
2

выражение под интегралом действительно явля- нужно, как и в предыдущем случае, сначала вы-
ется простейшей дробью третьего типа. Выделим делить полный квадрат у квадратного трехчлена
полный квадрат в знаменателе: в знаменателе,
 2  2 p  p 2  p 2
2 2 1 1 1 x 2
+ px + q = x2
+ 2 · · x + − +q =
x −x+1 = x −2· ·x+ − +1 = 2 2
2 2 2   2 
 2    2 p 2 p2
1 1 1 3 = x + + q −
= x− + 1− = x− + 2 4
2 4 2 4
затем выражение в скобках заменить на новую
Теперь делаем замену переменной в интеграле: переменную:
p
x+ =y
ˆ
3x − 1
ˆ
3x − 1 2
dx = 2 dx = При этом получится несколько интегралов, из
x2 − x + 1 x − 21 + 43
ˆ    которых одни окажутся табличными, а другие
y = x− 1 1
3 y + − 1 1 можно будет вычислить с помощью рекуррент-
= 2 = 2
d y+ =
x = y + 12 y 2 + 34 2 ных формул §7.
468 Глава 8. ИНТЕГРАЛ

Приведем иллюстрацию. Пусть требуется вы- Интегрирование правильных дробей


числить интеграл
• Рациональная функция
x−1
ˆ
dx P (x)
(x2 + 2x + 3)2 R(x) =
Q(x)
Поскольку дискриминант знаменателя отрицате- называется правильной дробью, если степень
лен, многочлена в числителе меньше степени мно-
p2 − 4q = 4 − 12 = −8 < 0 гочлена в знаменателе:
выражение под интегралом действительно явля- deg P < deg Q
ется простейшей дробью четвертого типа. Выде-
лим полный квадрат в знаменателе: ⋄ 8.1.65. Например, дроби

x2 + 2x + 3 = x2 + 2 · 1 · x + 12 − 12 + 3 = (x + 1)2 + 2 x+1 x3 x2 − 2x + 1
, , ,
x2 +x+1 (x2 − 1)(x2 + 4) x3
Теперь делаем замену переменной в интеграле:
будут правильными, а дроби
x−1 x−1
ˆ ˆ
dx = dx = x2 + 1 x3 x2 − 2x + 1
(x2 + 2x + 3) 2 2 , , ,
((x + 1)2 + 2) x2 + x + 1 (x − 1)(x + 4) x
ˆ
y = x+1 y−2 – неправильными.
= = d(y − 1) =
x=y−1 (y 2 + 2)2
Для интегрирования правильных дробей
y−2 y dy dy
ˆ ˆ ˆ
= d y = −2 = нужно научиться пользоваться следующей клас-
(y 2 + 2)2 (y 2 + 2)2 (y 2 + 2)2 сической теоремой.
1 dy 2 dy
ˆ ˆ
= −2 = Теорема 8.1.66. Всякая правильная дробь одно-
2 (y 2 + 2)2 (y 2 + 2)2
значным образом раскладывается в сумму про-
1 d(z − 2) dy
ˆ ˆ
= 2 −2 = стейших дробей.
2 z2 z=y +2 (y 2 + 2)2
Мы не будем доказывать этот результат, а
1 dz dy
ˆ ˆ
= − 2  √ 2 2 = лишь объясним как он работает. Для этого по-
2 z 2 z=y2 +2 лезно запомнить следующие
y2 + 2
 
применяем 1 Правила разложения на простейшие дроби:
= формулы ≡− −
(8.1.53) и (8.1.82) 2z z=y2 +2
  — если в разложении знаменателя Q(x) на мно-
y 1 y
−2 + √ · arctg √ + C = жители имеется множитель (x − a)n
4(y 2 + 2) 2( 2)3 2
1 Q(x) = ... · (x − a)n · ...
=− −
2(y 2 + 2) то в разложении правильной дро-
  P (x)
y 1 y би в сумму простейших дробей
−2 + √ · arctg √ + C = Q(x)
4(y 2 + 2) 2( 2)3 2 должны присутствовать слагаемые вида
A1 A2 An
1 y 1 y x−a , (x−a)2 , ..., (x−a)n :
=− − − √ · arctg √ + C =
2(y 2 + 2) 2(y 2 + 2) 2 2 2
√ P (x) A1 A2 An
y+1 2 y = ...+ + 2
+...+ +...
=− − · arctg √ + C = Q(x) x − a (x − a) (x − a)n
2
2(y + 2) 4 2
  — если в разложении знаменателя Q(x) на мно-
возвращаемся
= к исходной = жители имеется множитель (x2 +px+q)n (p2 −
переменной x
√ 4q < 0)
x+2 2 x+1
=− − · arctg √ + C Q(x) = ... · (x2 + px + q)n · ...
2(x2 + 2x + 3) 4 2
⊲⊲ 8.1.64. Вычислите интегралы: то в разложении правильной дро-
P (x)
би Q(x) в сумму простейших дробей
´ dx
1) x−7 ;
´ x dx
7) x2 +7x+13 ; должны присутствовать слагаемые вида
B1 x+C1 B2 x+C2 Bn x+Cn
x2 +px+q , (x2 +px+q)2 , ..., (x2 +px+q)n :
´ dx
8) 3x24x+8
´
2) 3−x ; +2x+5 d x;
9) 2x2x+5
´ dx ´
3) 1+5x ; +2x+3 d x; P (x) B1 x + C1 B2 x + C2
= ...+ 2 + 2 +...
´ dx ´ 5x−7
4) (3x+2)2 ; 10) 8x2 +x+1 d x; Q(x) x + px + q (x + px + q)2
3x+5
´
dx 11) (x2 +2x+2)2 d x;
´
5) x2 +2x+1 ; Bn x + Cn
´ dx
´ 3x+2
12) (x2 −3x+3) ... + 2 + ...
6) 4x2 −4x+1 ; 2 d x. (x + px + q)n
§ 1. Неопределенный интеграл 469
 
Покажем теперь на примерах, что эти прави- 
A + B + C = 9 
A + B + C = 9
ла означают. 2B − 2C = −2 ⇔ B − C = −1 ⇔

 

⋄ 8.1.67 (случай неповторяющихся множителей −4A = −8 A=2
 
первой степени). Рассмотрим интеграл  
2 + B + C = 9 B + C = 7
ˆ
9x2 − 2x − 8 ⇔ B − C = −1 ⇔ B − C = −1 ⇔
dx 
 

x3 − 4x A=2 A=2
 
Разложим знаменатель дроби на множители: 
B + C = 7 
B + C = 7
⇔ 2B = 6 ⇔ B=3 ⇔
x3 − 4x = x(x2 − 4) = x(x − 2)(x + 2) 
 

A=2 A=2
 
В соответствии с первым правилом, это означа- 
3 + C = 7 
C = 4
ет, что в разложении нашей (правильной) дроби ⇔ B=3 ⇔ B=3
в сумму простейших дробей должны присутство- 
 

A=2 A=2
вать следующие слагаемые:
A B C Мы нашли коэффициенты A, B, C методом
, ,
x x−2 x+2 неопределенных коэффициентов. Теперь пока-
жем, как их можно было найти по-другому, а
То есть,
именно методом частных значений.
9x2 − 2x − 8 A B C Еще раз рассмотрим равенство (8.1.67):
= + +
x3 − 4x x x−2 x+2
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2)
Теперь необходимо найти коэффициенты
A, B, C. Для этого приведем правую часть к
Оно должно выполняться при любом x. В част-
общему знаменателю
ности, при x = 0, x = 2 и x = −2. Посмотрим,
во что превращаются левая и правая части при
9x2 − 2x − 8
= этих значениях переменной:
x3 − 4x
A(x − 2)(x + 2) + Bx(x + 2) + Cx(x − 2) x = 0 : − 8 = −4A ⇒ A=2
=
x(x − 2)(x + 2)
x = 2 : 24 = 8B ⇒ B=3
Эти дроби действительно будут совпадать, если x = −2 : 32 = 8C ⇒ C =4
у них совпадают числители:
Эта запись означает, что при x = 0 равенство
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2)
(8.1.67) превращается в равенство −8 = −4A, от-
Далее коэффициенты A, B, C можно искать куда следует что A = 2, и т.д.
двумя разными методами. В общем, каким способом ни считай, получа-
Первый из них называется методом неопре- ется

деленных коэффициентов. Он состоит в следу- 
A = 2
ющем. Сначала приведем подобные слагаемые B=3
справа: 

C=4
9x2 − 2x − 8 = (A + B + C)x2 + (2B − 2C)x − 4A
Мы получаем, что
Слева и справа записаны многочлены от пере-
менной x. Они будут совпадать только если у них 9x2 − 2x − 8 2 3 4
= + +
совпадают коэффициенты: x3 − 4x x x−2 x+2

x2 : 9 = A + B + C и теперь, наконец, можно вычислить наш инте-


грал:
x1 : − 2 = 2B − 2C
0
x : − 8 = −4A 9x2 − 2x − 8
ˆ
dx =
x3 − 4x
Эта запись означает, что число 9 является коэф-
2 3 4
ˆ ˆ ˆ
фициентом перед x2 слева, и оно совпадает с чис- = dx + dx + dx ≡
лом A+ B + C, которое является коэффициентом x x−2 x+2
перед x2 справа, и т.д. Мы получаем линейную ≡ 2 ln |x| + 3 ln |x − 2| + 4 ln |x + 2| + D
систему, решая которую находим числа A, B, C:
(D – постоянная интегрирования).
470 Глава 8. ИНТЕГРАЛ

3x + 2 2 2
ˆ ˆ ˆ
⋄ 8.1.68 (случай повторяющихся множителей d x = d x − d x−
первой степени). Рассмотрим интеграл x(x + 1)3 x x+1
2 1
ˆ ˆ
ˆ
3x + 2 − 2
d x + dx ≡
dx (x + 1) (x + 1)3
x(x + 1)3 2 1
≡ 2 ln |x| − 2 ln |x + 1| + − +E
Знаменатель дроби уже разложен на множители: x + 1 2(x + 1)2
(E – постоянная интегрирования).
x(x + 1)3
⋄ 8.1.69 (случай неповторяющихся множителей
В соответствии с первым правилом, в разложе- второй степени). Рассмотрим интеграл
нии нашей (правильной) дроби в сумму простей-
x3 − 2x + 2
ˆ
ших дробей должны присутствовать следующие dx
слагаемые: (x − 1)2 (x2 + 1)
Знаменатель дроби уже разложен на множители:
A B C D
, , ,
x x+1 (x + 1)2 (x + 1)3 (x − 1)2 (x2 + 1)

Значит, В соответствии с первым и вторым правилами,


в разложении нашей (правильной) дроби в сум-
3x + 2 A B C D му простейших дробей должны присутствовать
= + + +
x(x + 1)3 x x + 1 (x + 1)2 (x + 1)3 следующие слагаемые:

Теперь необходимо найти коэффициенты A B Cx + D


, ,
A, B, C, D. Для этого приведем правую часть x−1 (x − 1)2 x2 + 1
к общему знаменателю Значит,

3x + 2 x3 − 2x + 2 A B Cx + D
= 2 2
= + 2
+ 2
x(x + 1)3 (x − 1) (x + 1) x − 1 (x − 1) x +1
A(x + 1)3 + Bx(x + 1)2 + Cx(x + 1) + Dx Чтобы найти коэффициенты A, B, C, D, приве-
= дем правую часть к общему знаменателю
x(x + 1)3

Эти дроби действительно будут совпадать, если x3 − 2x + 2


=
у них совпадают числители: (x − 1)2 (x2 + 1)
A(x − 1)(x2 + 1) + B(x2 + 1) + (Cx + D)(x − 1)2
3x + 2 = A(x + 1)3 + Bx(x + 1)2 + Cx(x + 1) + Dx =
(x − 1)2 (x2 + 1)

Эти дроби совпадают, если у них совпадают чис-


Теперь коэффициенты A, B, C, D лучше все-
лители:
го искать, комбинируя метод частных значений
с методом неопределенных коэффициентов. x3 − 2x + 2 =
x=0: 2=A ⇒ A=2 = A(x−1)(x2 +1)+B(x2 +1)+(Cx+D)(x−1)2
x = −1 : − 1 = −D ⇒ D=1 Теперь коэффициенты A, B, C, D ищем, ком-
3
x : 0=A+B =2+B ⇒ B = −2 бинируя метод частных значений с методом
2 неопределенных коэффициентов.
x : 0 = 3A + 2B + C = 2 + C ⇒
⇒ C = −2 x = 1 : 1 = 2B
x3 : 1 = A + C
Таким образом,
x2 : 0 = −A + B − 2C + D


 A=2 x0 : 2 = −A + B + D

 B = −2 Получается система

 C = −2  

 2B = 1 A=0
D=1 
 


A + C = 1 
B = 1
⇔ ... ⇔ 2
Значит, 
 −A + B − 2C + D = 0 
 C = 1

 

3x + 2 2 2 2 1 −A + B + D = 2 D = 23
3
= − − 2
+
x(x + 1) x x + 1 (x + 1) (x + 1)3 Значит,
и теперь можно вычислять наш интеграл: x3 − 2x + 2 1 2x + 3
2 2
= 2
+
(x − 1) (x + 1) 2(x − 1) 2(x2 + 1)
§ 1. Неопределенный интеграл 471

и теперь можно вычислять наш интеграл: Значит,


ˆ
x3 − 2x + 2 2x2 − 3x + 1 2 1
d x = 3
= − 2
(x − 1)2 (x2 + 1) x +1 x+1 x −x+1
ˆ
1
ˆ
2x + 3 и теперь можно вычислять наш интеграл:
= d x + d x ≡
2(x − 1)2 2(x2 + 1) ˆ
2x2 − 3x + 1
1
ˆ
2x
ˆ
3 dx ≡
≡− + d x+ dx = x3 + 1
2(x − 1) 2
2(x + 1) 2
2(x + 1) 2 1
ˆ ˆ
1
ˆ
d(x2 + 1) 3
ˆ
dx ≡ dx − 2−x+1
dx ≡
=− + + = x + 1 x
2(x − 1) 2
2(x + 1) 2 2
x +1 1
ˆ
1 1 3 ≡ 2 ln |x + 1| −   √ 2 d x =
2
=− + ln(x2 + 1) + arctg x + E x + 12 + 23
2(x − 1) 2 2
y =x+ 1
(E – постоянная интегрирования). = 2 = 2 ln |x + 1|−
x=y− 1
2
 
⋄ 8.1.70 (еще один случай неповторяющихся 1 1
ˆ
множителей второй степени). Рассмотрим инте- −  √ 2 d y − =
2 3 2 y=x+ 21
грал y + 2
ˆ
2x2 − 3x + 1 ˆ
1
d x
3
x +1 = 2 ln |x + 1| −  √  2 d y =
y=x+ 21
y 2 + 23
Разложим знаменатель на множители:  
применяем
= формулу (8.1.61) =
x3 + 1 = (x + 1)(x2 − x + 1)
2 2y
= 2 ln |x + 1| − √ arctg √ =
В соответствии с первым и вторым правилами, 3 3 y=x+ 12
в разложении нашей (правильной) дроби в сум- 
2 2 x + 21
му простейших дробей должны присутствовать = 2 ln |x + 1| − √ arctg √ +D =
следующие слагаемые: 3 3
2 2x + 1
A Bx + C = 2 ln |x + 1| − √ arctg √ +D
, 3 3
x+1 x2 − x + 1
(D – постоянная интегрирования).
Значит,
⋄ 8.1.71 (случай повторяющихся множителей
2x2 − 3x + 1 A Bx + C второй степени). Рассмотрим интеграл
= +
x3 + 1 x + 1 x2 − x + 1
x3 + 3
ˆ
dx
Чтобы найти коэффициенты A, B, C, приведем (x + 1)(x2 + 1)2
правую часть к общему знаменателю
Знаменатель дроби уже разложен на множители:
2x2 − 3x + 1 A(x2 − x + 1) + (Bx + C)(x + 1)
= (x + 1)(x2 + 1)2
x3 + 1 (x + 1)(x2 − x + 1)
В соответствии с первым и вторым правилами,
Эти дроби совпадают, если у них совпадают чис-
в разложении нашей (правильной) дроби в сум-
лители:
му простейших дробей должны присутствовать
2x2 − 3x + 1 = A(x2 − x + 1) + (Bx + C)(x + 1) следующие слагаемые:
A Bx + C Dx + E
Теперь коэффициенты A, B, C ищем, комби- , ,
нируя метод частных значений с методом неопре- x+1 x2 + 1 (x2 + 1)2
деленных коэффициентов. Значит,
x = −1 : 6 = 3A x3 + 3 A Bx + C Dx + E
= + 2 + 2
x2 : 2 = A + B (x + 1)(x2 + 1)2 x+1 x +1 (x + 1)2
x0 : 1 = A + C Чтобы найти коэффициенты A, B, C, D, E, при-
ведем правую часть к общему знаменателю
Получается система
  x3 + 3
  =
3A = 6 A = 2 (x + 1)(x2 + 1)2
A+B =2 ⇔ ... ⇔ B=0 A(x2 + 1)2 + (Bx + C)(x + 1)(x2 + 1) + (Dx + E)(x + 1)

 
 =
A+C =1 C = −1 (x + 1)(x2 + 1)2
472 Глава 8. ИНТЕГРАЛ

x2 +x−1 dx
´ ´
Эти дроби совпадают, если у них совпадают чис- 1) x3 +x2 −6x d x;
7) (x2 +2)(x−1)2 ;
лители: ´ dx x3 +3x2 −3x+1
2) (x+1)(x−2) ;
´
8) (x+1)2 (x2 +1) d x;
xdx
´
x3 + 3 = A(x2 + 1)2 + 3) 3x2 −3x−2 ; 9)
´ 3 2
3x −x −4x+13
d x;
x2 (x2 −4x+13)
2x+11
´
2
+ (Bx + C)(x + 1)(x + 1) + (Dx + E)(x + 1) 4) (x2 +6x+13)2 d x; ´ 4x −8x2
10) (x−1)2 (x2 +1)2 d x;
x2 d x
´
5) (x+2)2 (x+4)2 ;
´ x 2
Теперь коэффициенты A, B, C, D, E ищем, 11) (x2 +2x+2)2 d x;
dx
´
комбинируя метод частных значений с методом 6) x3 (x−1) ;
´ 3 2
x +2x +3x+4
неопределенных коэффициентов. 12) x4 +x3 +2x2 d x.

x = −1 : 2 = 4A Интегрирование неправильных дробей.


4
x : 0=A+B • Рациональная функция
3
x : 1=B+C P (x)
R(x) =
x2 : 0 = 2A + B + C + D Q(x)
x0 : 3 = A + C + E называется неправильной дробью, если сте-
пень многочлена в числителе больше или рав-
Получается система на степени многочлена в знаменателе:
 

 4A = 2  1
A = 2 deg P > deg Q

 


A + B = 0 
B = − 12
  Справедлива
B+C =1 ⇔ ... ⇔ C = 23

 
 Теорема 8.1.73. Всякая неправильная дробь

 2A + B + C + D = 0 
D = −2

 
 представима в виде суммы многочлена и пра-
A + C + E = 3 E = 1
вильной дроби.

Значит, Она позволяет вычислять интегралы от лю-


бых рациональных функций (потому что любую
1
x3 + 3 − 1 x + 32 −2x + 1 рациональную функцию можно представить в
2 2
= 2 + 22 + 2 виде суммы многочлена и правильной дроби, а
(x + 1)(x + 1) x+1 x +1 (x + 1)2
их мы уже умеем интегрировать).
и теперь можно вычислять наш интеграл:
⋄ 8.1.74. Рассмотрим интеграл
3 1
x +3 5x3 + 9x2 − 22x − 8
ˆ ˆ ˆ
2
dx = d x+ dx
(x + 1)(x2 + 1)2 x+1 x3 − 4x
− 12 x + 32 −2x + 1
ˆ ˆ
+ d x + dx = Разделив числитель на знаменатель с остатком,
2
x +1 (x2 + 1)2 получим
1 dx 1 x dx 3 dx
ˆ ˆ ˆ
= − + − 5x3 + 9x2 − 22x − 8 9x2 − 2x − 8
2 x+1 2 x2 + 1 2 x2 + 1 3
=5+
x − 4x x3 − 4x
2x d x dx
ˆ ˆ
− + ≡ Поэтому
(x2 + 1)2 (x2 + 1)2
1 1 d(x2 + 1) 3
ˆ
5x3 + 9x2 − 22x − 8
ˆ
≡ ln |x + 1| − 2
+ arctg x− dx =
2 4 x +1 2 x3 − 4x
в последнем
!
d(x2 + 1) 9x2 − 2x − 8
ˆ ˆ
dx
ˆ ˆ
интеграле
− + = = = 5 d x + dx =
(x2 + 1)2 (x2 + 1)2 применяем x3 − 4x
формулу (8.1.82)  
второй интеграл
1 1 3 1 = мы уже нашли =
= ln |x + 1| − ln(x2 + 1) + arctg x + 2 + в примере 8.1.67
2 4 2 x +1
x 1 = 5x + (2 ln |x| + 3 ln |x − 2| + 4 ln |x + 2| + D)
+ + · arctg x + H =
2(x2 + 1) 2 ⋄ 8.1.75. Рассмотрим интеграл
1 1 2
= ln |x + 1| − ln(x + 1) + 2 arctg x+ ˆ
2x4 + 5x2 − 2
2 4 dx
1 x 2x3 − x − 1
+ 2 + +H
x + 1 2(x2 + 1) Разделив числитель на знаменатель с остатком,
получим
(H – постоянная интегрирования).
2x4 + 5x2 − 2 6x2 + x − 2
⊲⊲ 8.1.72. Вычислите интегралы: 3
=x+ 3
2x − x − 1 2x − x − 1
§ 1. Неопределенный интеграл 473

x2 2x + 23
ˆ
Теперь надо подумать о том, как вычислить ин-
≡ + ln |x − 1| + 1 dx ≡
теграл от второго слагаемого (то есть от полу- 2 x2 + x + 2
ченной правильной дроби). Для этого разложим x2
знаменатель на множители: ≡ + ln |x − 1|+
2
2x3 − x − 1 = (x − 1)(2x2 + 2x + 1) 2x + 32
ˆ
+ 2 2 dx =
x2 + 2 · 21 x + 21 − 12 + 21
В соответствии с первым и вторым правилами,
x2 2x + 23
ˆ
в разложении нашей (правильной) дроби в сум- = + ln |x − 1| + dx =
2
му простейших дробей должны присутствовать 2 x + 12 + 41
следующие слагаемые:
y = x + 1 x2
= 2 = + ln |x − 1|+
A Bx + C x = y − 21 2
,   
x−1 2x2 + 2x + 1 2 y − 12 + 32 1 x2
ˆ
+ 2 1 d y − = +
Значит, y +4 2 y=x+ 2 1
2
ˆ
2y + 12
6x2 + x − 2 A Bx + C
+ ln |x − 1| + d y =
= + y 2 + 41 y=x+ 12
2x3 − x − 1 x − 1 2x2 + 2x + 1
x2 2y d y
ˆ
Чтобы найти коэффициенты A, B, C, приведем = + ln |x − 1| + +
2 y 2 + 14 y=x+ 12
правую часть к общему знаменателю
1 dy x2
ˆ
6x2 + x − 2 A(2x2 + 2x + 1) + (Bx + C)(x − 1) + = + ln |x − 1|+
= 2 y 2 + 41 y=x+ 12 2
3
2x − x − 1 (x − 1)(2x2 + 2x + 1) 
d y 2 + 14 1 dy
ˆ ˆ

+ 1 + 2 =
Эти дроби совпадают, если у них совпадают чис- 2
y +4 y=x+ 21
2 2
y + 2 1 y=x+ 21
лители:  
применяем x2
= формулы = + ln |x − 1|+
6x2 + x − 2 = A(2x2 + 2x + 1) + (Bx + C)(x − 1) (8.1.54) и (8.1.61) 2
 
1

Теперь коэффициенты A, B, C ищем, комби- + ln y 2 + + arctg(2y) +D =
4 y=x+ 21 y=x+ 12
нируя метод частных значений с методом неопре-  2 !
деленных коэффициентов. x2 1 1
= + ln |x − 1| + ln x+ + +
2 2 4
x=1: 5 = 5A  
2 1
x : 6 = 2A + B + arctg 2 x + +D =
2
0
x : −2=A−C  
x2 2 1
= +ln |x−1|+ln x + x + +arctg(2x+1)+D
Получается система 2 2
 

A = 1 
A = 1 (D – постоянная интегрирования).
2A + B = 6 ⇔ ... ⇔ B=4

 
 ⊲⊲ 8.1.76. Вычислите интегралы:
A − C = −2 C =3
x5 +x4 −8 x3 +x2 +x+3
´ ´
Значит, 1) x3 −4x d x; 4) (x+3)(x2 +x+1) d x;
3x3 +5x2 −25x−1 x9
´
2) d x;
´
(x+2)(x−1)2 5) (x4 −1)2 d x.
6x2 + x − 2 1 4x + 3 ´ x5 −2x2 +3
3
= + 2 3) x2 −4x+4 d x;
2x − x − 1 x − 1 2x + 2x + 1
Отсюда Интегрирование рациональных тригоно-
метрических функций
2x4 + 5x2 − 2
=
2x3 − x − 1 Рациональной функцией от двух переменных u и
6x2 + x − 2 1 4x + 3 v называется любая функция R, которую можно
=x+ 3 =x+ + 2 представить как дробь
2x − x − 1 x − 1 2x + 2x + 1
и теперь можно вычислять исходный интеграл: P (u, v)
R(u, v) = ,
Q(u, v)
2x4 + 5x2 − 2
ˆ ˆ
d x = x d x+
2x3 − x − 1 где P и Q — многочлены от двух переменных.
1 4x + 3 Это то же самое, что сказать, что выражение
ˆ ˆ
+ dx + dx ≡ R(u, v) составленно из u и v и констант с помо-
x−1 2x2 + 2x + 1
474 Глава 8. ИНТЕГРАЛ

щью алгебраических операций +, −, ·, /. Напри- ⋄ 8.1.79.


мер, функция
t = tg x2
2t
2 2
3u v − 2uv + 7v − 1 dx sin x =
ˆ
1+t2
R(u, v) = √ = 2 =
v2 + 5 8 − 4 sin x + 7 cos x cos x = 1+t2 1−t
dx = 2dt
1+t2
является рациональной. ˆ 2dt
Рациональной тригонометрической функци- = 1+t2
=
ей называется любая рациональная функция от 2t 1−t2
8 − 4 1+t2 + 7 1+t 2
переменных sin x и cos x, например, ˆ
2dt
= =
8(1 + t ) − 8t + 7(1 − t2 )
2
f (x) = R(sin x, cos x) =
2dt 2
ˆ ˆ
3 sin2 x cos x − 2 sin x cos2 x + 7 cos x − 1 = 2
= dt =
= √ t − 8t + 15 (t − 3)(t − 5)
cos2 x + 5 здесь мы ”в уме”
!
раскладываем дробь
= под интегралом =
В этом пункте мы рассмотрим способы инте- на простейшие
грирования рациональных тригонометрических ˆ  
1 1
функций. = − dt ≡
t−5 t−3
 
Универсальная тригонометрическая под- возвращаемся
≡ ln |t−5|−ln |t−3|+C = =
становка Существует один универсальный к переменной x
x x
способ превратить интеграл от рациональной
= ln tg − 5 − ln tg − 3 + C
тригонометрической функции в интеграл от 2 2
обычной рациональной функции (который мы ⊲⊲ 8.1.80. Найдите интегралы
уже умеем вычислять). Он называется универ-
1) 5+4dxsin x
´ ´ sin x·cos x
сальной тригонометрической подстановкой и 4) (3+cos 2 dx
´ sin x x)
состоит в следующем. Если необходимо вычис- dx
´
2) 3 sin x−4 cos x 5) 1+tg x d x
лить интеграл ´ dx
3) 5+sin x+3 cos x
ˆ
R(sin x, cos x) d x Частные тригонометрические подстанов-
ки. Часто бывает, что универсальная триго-
то сделать это можно заменой нометрическая подстановка приводит к слож-
 ным выкладкам, которых можно избежать, ес-
x
x = 2 arctg t t = tg ли пользоваться другими подстановками. Такие
2 подстановки называются частными, и их имеет-
тогда получится ся три:

2t 1 − t2 2dt — если функция R(sin x, cos x) нечетная относи-


sin x = , cos x = , dx = тельно синуса, то есть
1 + t2 1 + t2 1 + t2
Рассмотрим примеры. R(− sin x, cos x) = −R(sin x, cos x)

⋄ 8.1.77. то применима подстановка




 cos x = t
t = tg x2 ˆ 2dt sin x = √1 − t2 ,

dx
ˆ
1+t2
= sin x = 1+t
2t
2
= 2t = (8.1.84)
sin x 2dt 
 x = arccos t,
dx = 1+t 2
1+t2 
 dt
ˆ
dt   dx = − √1−t 2
= ≡ ln |t| + C = квозвращаемся
переменной x =
t — если функция R(sin x, cos x) нечетная относи-
x
тельно косинуса, то есть
= ln tg + C
2
R(sin x, − cos x) = −R(sin x, cos x)
⋄ 8.1.78.
то применима подстановка
t = tg x2 ˆ 2dt 
dx 2
ˆ
1−t
= cos x = 1+t2 = 1+t2
= 
 sin x = t
cos x 2dt
1−t2 cos x = √1 − t2 ,

dx = 1+t 2
1+t 2

(8.1.85)
ˆ
2dt 1 + t 
 x = arcsin t,
=
≡ ln +C 
 dt
1 − t2 1 − t dx = √1−t 2
§ 1. Неопределенный интеграл 475

— если функция R(sin x, cos x) четная относи- ⊲⊲ 8.1.84. Найдите интегралы


тельно синуса и косинуса, то есть 1) cos4 x sin3 x d x
´

2) cos5 x sin2 x d x
´
R(− sin x, − cos x) = R(sin x, cos x) ´ sin3 x
3) 1+cos 2x dx
то применима подстановка ´ cos3 x
4) 4 sin2 x−1 d x

 tg x = t, dx
´

 5) 3 cos2 x+4 sin2 x

 t
 sin x = √ , 6) 19 sin2 x−8dx
´
 1+t2 sin x cos x−3
1 (8.1.86)
cos x = √1+t2 ,



x = arctg t,

 Интегрирование тригонометрических про-
 dt
dx = 1+t 2 изведений
⋄ 8.1.81. Для интегрирования некоторых специальных
  тригонометрических функций полезно знать “до-
подынтегральная
ˆ
sin3 x  функция нечетна  полнительные хитрости”, которые мы обсудим в
d x =  относительно sin x  = этом параграфе.
cos x − 3 поэтому используем
подстановку cos x = t
√ 3
Интегрирование функций sin ax·cos bx, sin ax·
ˆ 2
1 − t2 dt t −1
ˆ
=− √ = dt =
t−3 1−t 2 t−3 sin bx, cos ax · cos bx Для интегрирования таких
  ˆ  8
 произведений применяются тригонометрические
= делим многочлены
с остатком = t + 3 + dt ≡ тождества (5.1.83)-(5.1.85). Рассмотрим приме-
t−3
  ры.
t2
≡ + 3t + 8 ln |t − 3| + C = квозвращаемся
переменной x =
2 ⋄ 8.1.85.
cos2 x
= + 3 cos x + 8 ln | cos x − 3| + C ˆ
2
sin 4x sin 6x d x = (5.1.83) =
⋄ 8.1.82.
1
ˆ
  = (cos(4x − 6x) − cos(4x + 6x)) d x =
подынтегральная
ˆ
cos x3 функция нечетна  2
 относительно
dx =  cos x  = 1 1
ˆ ˆ
sin4 x поэтому используем = cos 2x d x − cos 10x d x =
подстановку sin x = t 2 2
√ 3 1
ˆ
1
ˆ
1 − t2 dt 1 − t2 = cos 2x d(2x) − cos 10x d(10x) =
ˆ ˆ
= √ = dt = 4 20
t4 1 − t2 t4
  1 1
ˆ
1 1 1 1 = sin 2x − sin 10x + C
= − 2 dt = − 3 + + C = 4 20
t 4 t 3t t
  1 1 ⊲⊲ 8.1.86. Найдите интегралы
возвращаемся
= к переменной x = − + +C
1) cos x3 sin x4 d x
´
3 sin x
3 sin x ´
⋄ 8.1.83. 2) cos 4x cos 7x d x
3) sin x3 sin x2 d x
´
dx
ˆ ´
= 4) sin 3x cos 10x d x
2
sin x − 4 sin x cos x + 5 cos2 x 5) sin 3x sin2 x d x
´
 
подынтегральная
 функция четна 
= относительно sin x и cos x =
поэтому используем Интегрирование функций sinα x·cosβ x Для
подстановку tg x = t интегрирования таких произведений нужно за-
ˆ dt помнить следующие правила:
1+t2
=  2  2 =
√ t −4· √ t · √ 1 +5 √ 1 — если α – нечетное положительное целое число
1+t2 1+t2 1+t2 1+t2 (то есть α ∈ 2N − 1), то делается подстановка
dt dt
ˆ ˆ
= = = 
t2 − 4t + 5 (t − 2)2 + 1  cos x = t,
ˆ 
t−2=y dy sin x = √1 − t2 ,

= =
= (8.1.87)
t=y+2 y 2 + 1 y=t−2  x = arccos t,


 dt
= arctg y + C = arctg(t − 2) + C = d x = − √1−t 2
y=t−2
 
= квозвращаемся
переменной x = arctg(tg x − 2) + C — если β – нечетное положительное целое число
476 Глава 8. ИНТЕГРАЛ
 2
(то есть β ∈ 2N − 1), то делается подстановка 1 − cos 2x 1 + cos 2x
ˆ
= · dx =
 2 2

 sin x = t, 1 − cos 2x 1 + 2 cos 2x + cos2 2x
ˆ
cos x = √1 − t2 ,
 = · dx =
(8.1.88) 2 4

 x = arcsin t, 1
ˆ

 = (1 + cos 2x − cos2 2x − cos3 2x) d x =
dt
d x = √1−t 2 8
ˆ  
1 1 + cos 4x 1 + cos 4x
= 1 + cos 2x − − cos 2x d x =
— если α + β – четное отрицательное целое чис- 8 2 2
ло (α + β ∈ −2N), то делается подстановка 1
ˆ
= (1 + cos 2x − cos 4x − cos 4x cos 2x) d x =
 16
 tg x = t,  

 применяем
= формулу

 t (5.1.84) =
sin x = √1+t2 ,

1
ˆ 
1

cos x = √1+t1
2,
(8.1.89) = 1 + cos 2x − cos 4x − (cos 2x + cos 6x) dx =
 16 2


x = arctg t, 1
ˆ

 = (2 + cos 2x − 2 cos 4x − cos 6x) d x =
 dt
dx = 1+t 2 32
 
1 1 1 1
— если α и β – четные неотрицательные целые = 2x + sin 2x − sin 4x − sin 6x + C =
числа (α, β ∈ 2(N − 1)), то применяются фор- 32 2 2 6
мулы понижения степени: x sin 2x sin 4x sin 6x
= + − − +C
16 64 64 192
1 − cos 2x 1 + cos 2x
sin2 x = , cos2 x = ⊲⊲ 8.1.90. Найдите интегралы
2 2
⋄ 8.1.87. (8.1.90)
sin5 x cos4 x d x dx
´ ´
поскольку 1) 6) √ 4 3 x cos5 x
ˆ p 3 ´ sin
sin 5 x cos5 x d x 7) ´ cos2 x d x
´
3 = 3 ∈ 2N − 1, 2)
sin x cos x d x = β подстановка
2 3
=
3)
´
√ sin3 x
dx 8) ´ cos4 x d x
sin x = t 3
ˆ √ p 3
cos4 x 9) ´sin4 x d x
dt dx
´
=
3
t2 1 − t2 √ = 4) sin3 x cos x 10) ´ sin4 x cos2 x d x
1 − t2 dx
11) cos6 x d x
´
ˆ  5) √
ˆ
2 2 8
 sin x cos3 x
= t 3 (1 − t2 ) d t = t3 − t3 d t =
  Интегрирование некоторых алгебраиче-
3 5 3 11 ских иррациональностей.
= t 3 − t 3 + C = квозвращаемся
переменной x =
5 11 √
3 5 3 11
Интегрирование функций R(x, n x), n ∈ N.
= (sin x) 3 − (sin x) 3 + C = Если R(x, y) – рациональная функция от пере-
5 11 √
3p3 3 p3
менных x и y, то функция R(x, n x) интегриру-
= sin5 x − sin11 x + C ется заменой
5 11

⋄ 8.1.88. t= nx (x = tn , d x = ntn−1 dt)

поскольку ⋄ 8.1.91.
ˆ
dx α + β = − 72 − 12 =

√ = = −4 ∈ −2N, = √ √ 3
cos x sin x x ( 6 x)
ˆ ˆ
7 подстановка
tg x = t √3
dx = √ 4 dx =
x − x2 x − ( 6 x)
ˆ dt ˆ dt √ ˆ
= r 1+t2
= 1+t2 t= 6x t3
 7

1
2 √ = = x = t65 = 6t5 dt =
√ 1 √ t 1+t2 t dx = 6t dt t − t4
6
1+t2 1+t2  
t4 делим
ˆ
ˆ  
1 + t2 =6 dt = многочлены =
ˆ
1 3
= √ dt = t− 2 + t 2 d t = t2 − 1 с остатком
t ˆ  
  1
1 2 5 =6 t2 + 1 + 2 dt =
= 2t 2 + t 2 + C = квозвращаемся
переменной x = t −1
5 q ˆ  
√ 2 2 1
= 2 tg x + tg5 x + C =6 t +1+ dt =
5 (t − 1)(t + 1)
 
раскладываем
⋄ 8.1.89. = на простейшие =
дроби
ˆ  
поскольку 1 1 1 1
ˆ α = 2 ∈ 2(N − 1), =6 2
t +1+ − dt =
2t−1 2t+1
sin2 x cos4 x d x = β = 4 ∈ 2(N − 1), =
применяем формулы
(8.1.90) = 2t3 + 6t + 3 ln |t − 1| − 3 ln |t + 1| + C =
§ 1. Неопределенный интеграл 477
  √ 3 √  
возвращаемся возвращаемся
= к переменной x = 2 6 x + 6 6 x+ = =
к переменной x
√ √ s
+ 3 ln 6 x − 1 − 3 ln 6 x + 1 + C

 2
1 1 1 23
= √ ln x − + x− + + C =
⊲⊲ 8.1.92. Найдите интегралы 2 4 4 16
r
√ √
1 1 1 3
1)
´
√x
dx 3)
´ x
√ dx
1+ x 1+ 4
x = √ ln x − + x2 − x + + C
´ dx 2 4 2 2
2) √ √
(1+ 3 x)· x
 q  ⋄ 8.1.96.
Интегрирование функций R x, cx+d , n ∈ n ax+b

dx 1 dx
ˆ ˆ
N. Интегралы такого вида вычисляются заме- √ = √ q =
5 − 2x − 3x 2 3 5 2 2
ной r 3 − 3 x − x
n ax + b
t= 1 dx t = 1
+x
ˆ
cx + d =√ q = x = 3t − 31 =
3 16 1
2 dx = dt
⋄ 8.1.93. 9 − 3 +x
1 dt 1 3t
ˆ
q = √ q  = √ arcsin + C =
r 1−x
1 1−x t = 1+x 3 2 3 4
ˆ
4
· d x = x = 1−t 2 = 3 − t2
(1 − x) 2 1+x 1+t2  
dx = − (1+t4tdt 1 1 + 3x
= квозвращаемся
2 )2
переменной x = √ arcsin +C
1 4tdt 3 4
ˆ
=−  2 · t =
1−t2 (1 + t2 )2
1 − 1+t 2 ⊲⊲ 8.1.97. Найдите интегралы
2 2 2
(1 + t ) 4t dt dt 1
ˆ ˆ
=− =− = +C = 1) √5x2dx dx
´ ´
4 2 2 2 2) √2+3x−2x
4t (1 + t ) t t +3x+2 2

  r1 + x √ 
= квозвращаемся
переменной x = +C Интегрирование функций R x, ax2 + bx + c
1−x Выделением полного квадрата и последующей
√ 
заменой функция R x, ax 2 + bx + c приводит-
⊲⊲ 8.1.94. Найдите интегралы
´ √1+x ся к виду
1) x dx  p 
´ √ 3
3x+4 R x, a 2 − x2 ,
2) 1+ √ 3
3x+4
dx
q  p 
1
3) (1−x)(1+x)2 · 1+x
´
1−x d x R x, x 2 + a2 ,
´ q
4) 3 1−x dx
1+x · (1+x)2  p 
R x, x2 − a2
Интегрирование функций √ax2 +bx+c 1
После а затем делается тригонометрическая подстанов-
выделения полного квадрата под знаком радика- ка:
ла интегралы этого вида сводятся к следующим:
— для
— если a > 0, то получаем табличный ин-
ˆ  p 
R x, a2 − x2 d x
теграл
1
ˆ
√ dx используется подстановка
x2 + A
— если a < 0, то получаем табличный ин- x = a sin t (или x = a cos t)
теграл
1 — для
ˆ
√ dx ˆ  p 
2
B −x 2
R x, x2 + a2 d x
⋄ 8.1.95. используется подстановка
dx 1 dx
ˆ ˆ
= √ q = x = a tg t (или x = a ctg t)
2x2 − x + 3 2 x − 12 x + 32
2
— для
1 dx t = x − 41  p 
ˆ ˆ
= √ q = x = t + 41 =
2 2 23 dx = dt R x, x2 − a2 d x
x − 14 + 16
r используется подстановка
1
ˆ
dt 1 23
 a 
=√ q 2
= √ ln t + t + + C =
2 2 16 a
t2 + 23
16
x= или x =
cos t sin t
478 Глава 8. ИНТЕГРАЛ

⋄ 8.1.98. ⋄ 8.1.100.
x= 1
dx
ˆ
dx x = 3 sin t cos t
ˆ
√ = 1 =
√ = t = arcsin x3 = 2
(x + 2) x − 1 2
t
dx
=
=
arccos
sin t
x
d t

(x2 + 16) 9 − x2 dx = 3 cos tdt cos 2 t
sin t
cos2 t d t cos t d t
ˆ ˆ
3 cos tdt
ˆ
= p = = q 1 =
1 + 2 cos2 t
=
(9 sin t + 16) 9 − 9 sin2 t
2 1
2
cos t + 2 2
cos t − 1
3 cos tdt ˆ
ˆ
cos t d t ds
ˆ
= = sin t = s
2
(9 sin t + 16)3 cos t = 2 = ds = cos tdt = =
3 − 2 sin t 3 − 2s2
применяем частную  
1 1
ˆ
подстановку (8.1.86) применяем
ˆ
dt = q  2 d s = формулу (8.1.63) =
= = tg t = s
= 2 3
2
9 sin t + 16 sin t = √ s 2 2 − s2
1+s
dt = ds q
1+s2 3 + s  
ds 1 2
ds = √ ln q + C = возвращаемся =
ˆ ˆ
1+s2
=  2 =
9s2 + 16(1 + s2 )
= 2 6 3 − s к переменной t

9 √ s + 16 2
1+s2 q
3 + sin t  
ds 2
ˆ
1
= = = √ ln q + C = возвращаемся =
25s2 + 16 2 6 3 − sin t к переменной x

1 ds 1 5s 2
ˆ
= 2 = arctg +C = q
25 2
s + 5 4 20 4 3 + sin arccos 1
1 2 x
  = √ ln q +C =
= квозвращаемся
1 5 tg t 2 6 3 − sin arccos 1
переменной t = arctg +C = 2 x
20 4
  q q
1 5 tg arcsin x3 3 + 1− 1
= квозвращаемся
переменной x = arctg +C = 1 2 x 2
20 4 = √ ln q q +C =
x
2 6 3 − 1 − 12
5q 3 x 2 2 x
1 1−( 3 ) 1 5x √ √ √
= arctg +C = arctg √ +C
20 4 20 4 9 − x2 1 x 3 + 2 x2 − 1
= √ ln √ √ √ +C
2 6 x 3 − 2 x2 − 1
⋄ 8.1.99.
⊲⊲ 8.1.101. Найдите интегралы
x = ctg t
x2 − x + 1
ˆ
√ d x = t = arcctg x = dx x2
´ ´
1) 3 4) 3 dx
(x2 + 1) x2 + 1 dt
dx = − sin2t
2
(9+x ) 2 2
(x +5) 2

ctg2 t − ctg t + 1 2) √ dx 2 3 5) √ dx 2 3
´ ´
dt
ˆ
=− p · 2 =
(5−x ) (1+x+x )
2 2
(ctg t + 1) ctg t + 1 sin t ´ √
x2 −4
´ √
1+x2
3) x3 dx 6) 2+x2 d x
ctg2 t − ctg t + 1 dt
ˆ
=− · 2 =
dx
´
1
· 1
sin t 7) √
(x2 +4) 4x2 +1
dx
sin2 x sin x
ˆ
= − (ctg2 t − ctg t + 1) sin x d t = Интегрирование функций xm · (a + bxn )p ,

заметим, что
 m, n, p ∈ Q. Интегралы от таких функций вы-
= ctg2 t + 1 = 12 = ражаются через элементарные функции только
sin t
ˆ   если одно из чисел
1
=− − ctg t sin x d t = m+1 m+1
sin2 t p, , +p
ˆ   n n
1
=− − cos t d t = является целым. В соответствии с этим следует
sin t
  употреблять три различных подстановки:
dt первый интеграл
ˆ ˆ
=− + cos t d t = мы уже вычисляли = — если p целое отрицательное (p ∈ −N) и
sin t в примере 8.1.77

t
  m = qs , n = rs , то используется подста-
= − ln tg + sin t + C = квозвращаемся
переменной x =
новка
2 x = ts

arcctg x

= − ln tg + sin arcctg x + C = — если m+1 целое ( m+1 ∈ Z), то исполь-
2 n n
  зуется подстановка
применяем
= тригонометрические = a + bxn = t
тождества
1
p
— если m+1 m+1
n + p целое ( n + p ∈ Z), то
= √ + ln x + 1 + x2 + C используется подстановка
1 + x2
ax−n + b = t
§ 2. Определенный интеграл 479
√ √
⋄ 8.1.102. 1 t y= t
ˆ
=−
dt = t =y 2 =
4 (t − 1)2 dt = 2ydy

ˆ
3 2
x3 (1 − x2 )− 2 d x = 1 y 1 y
ˆ ˆ
=− 2 2
2ydy = − dy =
4 (y − 1) 2 (y − 1)2
2
здесь m = 3, n = 2, p = − 23  

= раскладываем дробь
m+1
и n =2∈Z =
= поэтому применяем = на простейшие
подстановку !
t = 1 − x2 , xdx = − 1 dt 1 1 1 1 1
ˆ
4 4 4 4
2 =− + − + dy =
2 y−1 (y − 1)2 y+1 (y + 1)2
1 1
ˆ ˆ
− 23 3 1
=− (1 − t)t dt = − (t− 2 − t− 2 ) d t = =
1
ln |y − 1| −
1 1
+ ln |y + 1| +
1
+C =
2 2 8 8(y − 1) 8 8(y + 1)
 
1 1
= t− 2 + t 2 + C = квозвращаемся 1 y + 1 y
переменной x = = ln + +C =
8 y−1 2
4(y − 1)
1 p √ √
= √ + 1 − x2 + C   1 t + 1 t
1 − x2 = к переменной t = ln √
возвращаемся +
+C =
8 t − 1 4(t − 1)
 
⋄ 8.1.103.
= квозвращаемся
переменной x =
√ √
здесь m = 1, n = 4, p = 21
m+1 1 x−4 + 1 + 1 x−4 + 1
ˆ p и n +p=1∈Z
= ln √ + +C =
поэтому применяем 8 x−4 + 1 − 1 4x−4
x 1 + x4 d x = подстановку = √

1 1 + x4 + x2 x2 p
1
t = x−4 + 1, x = (t −5 1)− 4

dx = − 41 (t − 1) 4 dt
= ln √ + 1 + x4 + C
q 8 1 + x4 − x2 4
1
ˆ
1 1 5
=− (t − 1)− 4 1 + (t − 1)− 4 ·4 (t − 1)− 4 dt =
4 ⊲⊲ 8.1.104. Найдите интегралы
1 3p
ˆ
=− (t − 1)− 2 1 + (t − 1)−1 d t = ´ √
x
r 3
4 1) √ 2 dx ´ 4 1
√ (1+ 3 x) 5) 1 + x2 dx
1 t
ˆ
2
− 23 x√5 (1 + x2 ) 3
´
=− (t − 1) √ dt = 2) dx ´ √2− √
3 x
4 t−1 √
√ 3)
´ 4+ 3 x
√ dx 6) √
3
x
dx
3 2
1 t
ˆ
3
´ √ p
x

=− (t − 1)− 2 √ dt = √ dx
´
4) 3
3 3
x· 1 + 3 x2 d x 7) dx
4 t−1 x2 3
(1+x3 )2

§2 Определенный интеграл
Определенный интеграл функции f на отрезке [a; b] есть величина, геометрический смысл которой
– площадь криволинейной трапеции, ограничиваемой графиком функции f (при условии, что f
неотрицательна на [a; b]):

y = f (x)

S =?

x
a b

Точный смысл этих слов вряд ли может быть сейчас понятен читателю, поскольку в школьном
курсе геометрии не объясняется, что такое площадь фигуры (мы же даем соответствующие строгие
определения лишь в главе 16). Но всякий раз, когда вводится новое определение, полезно, чтобы
слушатель держал в голове какую-то геометрическую картинку, упрощающую понимание соот-
ветствующих формальных определений и математических результатов. В случае с определенным
интегралом такой картинкой, несомненно, будет площадь криволинейной трапеции (понимаемая
пока на интуитивном уровне).
480 Глава 8. ИНТЕГРАЛ

В этой главе мы даем формальное определение этому новому понятию, приводим способ его
вычисления и описываем некоторые приложения.

(a) Определение определенного интеграла


Разбиения отрезка. Перед тем как давать определение определенному интегралу нужно проде-
лать некую предварительную работу – сказать несколько слов про разбиения отрезка.
Разбиением отрезка [a; b] называется произвольная конечная система точек {x0 ; x1 ; ...; xk } такая
что
a = x0 < x1 < x2 < ... < xk−1 < xk = b
Если нам дано какое-то разбиение {x0 ; x1 ; ...; xk }, то его удобно обозначать одной буквой, например,
τ:
τ = {x0 ; x1 ; ...; xk }
Наибольшее расстояние между соседними точками разбиения τ обозначается

diam τ = max (xi − xi−1 )


i=1,...,k

и называется диаметром разбиения τ = {x0 ; x1 ; ...; xk }.


⋄ 8.2.1. Система точек τ = {0; 12 ; 1; 2; 2} яв- ⊲ 8.2.2. Проверьте, что следующие системы то-
ляется разбиением отрезка [0; 2], потому что эти чек являются разбиениями данных отрезков и
числа образуют строго возрастающую конечную найдите диаметр этих разбиений:
последовательность, у которой концы совпадают 1) τ = {0; 32 ; 54 ; 11
5 ; 3}, [a; b] = [0; 3]
с концами отрезка [0; 2]: 2) τ = {−1; − 21 ; − 14 ; 0; 14 ; 21 ; 1}, [a; b] = [−1; 1]
√ √
1 √ 3) τ = {1; 2; 3; 2}, [a; b] = [1; 2]
0< <1< 2<2
2
Диаметр этого разбиения равен
 
1 1 √ √ √
diam τ = max ; ; 2 − 1; 2 − 2 = 2 − 2
2 2

Понятно, что у любого отрезка имеется много всяких разбиений. Поэтому можно рассматривать
последовательности разбиений.

⋄ 8.2.3. Рассмотрим, например, отрезок [0; 1] и ...


его разбиения:
Ясно, что для любого n точки τ (n) =
τ (1) = {0; 1} {0; n1 ; n2 ; ...; n−1
n ; 1} действительно являются раз-
  биением отрезка [0; 1]. Диаметр такого разбиения
1
τ (2) = 0; ; 1 равен
2 1
  diam τ (n) =
1 2 n
τ (3) = 0; ; ; 1
3 3 Можно заметить, что при n → ∞ эта величина
... стремится к нулю:
 
(n) 1 2 n−1 1
τ = 0; ; ; ...; ;1 diam τ (n) = −→ 0
n n n n n→∞

• Последовательность разбиений τ (n) , у которой диаметр стремится к нулю

diam τ (n) −→ 0
n→∞

называется измельчающейся.
§ 2. Определенный интеграл 481
 n
⊲ 8.2.4. Проверьте, будут ли следующие после- 2) τ (n) = 0; 21n ; 22n ; ...; 2in ; ...; 2 2−1
n ;1

довательности разбиений отрезка [0; 1] измельча- n o


1 1 1
3) τ (n) = 0; 2n ; 2n−1 ; 2n−2 ; ...; n1 ; 1
ющимися:
n q q q o
4) τ (n) = 0; n1 ; n2 ; ...; n−1 ; 1
 n
1) τ (n) = 0; n1 ; n−1
n ;1 , n > 2 (здесь каждое n q q q o
разбиение состоит из четырех точек); 5) τ (n) = 0; n n1 ; n n2 ; ...; n n−1 n ;1

Определение определенного интеграла. Пусть функция f определена на отрезке [a; b] и пусть


дано разбиение этого отрезка τ = {x0 ; x1 ; ...; xk }. В каждом маленьком отрезке [xi−1 ; xi ] зафикси-
руем произвольную точку ξi ∈ [xi−1 ; xi ]. Такая система точек ξi называется системой выделенных
точек в данном разбиении τ . Рассмотрим сумму
k
X
f (ξi ) · ∆xi (где ∆xi = xi − xi−1 )
i=1

Она называется интегральной суммой функции f , соответствующей разбиению τ = {x0 ; x1 ; ...; xk }


с выделенными точками ξi . Легко видеть, что эта величина равна площади ступенчатой фигуры,
построенной на точках ξi ∈ [xi−1 ; xi ]:

y = f (x)

ξ1 ξ2 ξ3 ξ4 ξk−1
x
a x1 x2 x3 xk−1 b

Представим теперь, что разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] меняются, становясь все более
мелкими. Тогда площадь ступенчатой фигуры должна приближаться к числу, которое естественно
считать "площадью криволинейной трапеции о которой мы говорили в начале этой главы.

y = f (x)

x
a b

Это число называется определенным интегралом функции f на отрезке [a; b]. Более точное опреде-
ление выглядит так:
• Число I называется определенным интегралом функции f на отрезке [a; b], и обозначается
ˆ
I= f (x) d x
[a,b]

если для всякой измельчающейся последовательности разбиений отрезка [a; b]


(n) (n) (n) (n)
τ (n) : a = x0 < x1 < ... < xk(n) −1 < xk(n) = b, diam τ (n) −→ 0
n→∞
482 Глава 8. ИНТЕГРАЛ

и любой системы выделенных точек


(n) (n) (n)
ξi ∈ [xi−1 ; xi ]

соответствующие интегральные суммы стремятся к числу I:


(n)
k
X (n)
f (ξi ) · ∆xi −→ I
n→∞
i=1

Если такое число I существует, то функция f называется интегрируемой (по Риману) на


отрезке [a; b].
Это определение можно коротко записать в виде формулы:
ˆ k
X
f (x) d x = lim f ( ξi ) · ∆xi (8.2.91)
[a,b] diam {x0 ,...,xk }→0
i=1


[xi−1 ; xi ]

Ее удобно применять в случаях, когда не нужно следить за строгостью рассуждений.

Проверим, что в простейших случаях наше ⋄ 8.2.6. Интеграл от линейной функции.


определение приводит к правильным результа- Рассмотрим теперь функцию f (x) = x и вычис-
там, то есть что, вычисляя интеграл, мы дей- лим определенный интеграл от нее на отрезке
ствительно получаем площадь соответствующей [0; 1]. Соответствующая картинка выглядит так:
фигуры.
y
⋄ 8.2.5. Интеграл от константы. Рассмот-
1
рим постоянную функцию f (x) = C и вычислим
определенный интеграл от нее на произвольном
отрезке [a; b]. Соответствующая картинка выгля-
дит так:

y
ξ1 ξ2 ξk−1
x
x1 x2 xk−1 1

C
Криволинейная трапеция в данном случае
представляет собой треугольник, поэтому отве-
том должна быть площадь треугольника S =
x 1 1
ξ ξ 1 ξ
2 2 · 1 · 1 = 2 (половина произведения основания на
k−1

a x1 x2 x b высоту).
k−1

Чтобы проверить это, возьмем какое-нибудь


Поскольку криволинейная трапеция в данном разбиение τ = {x0 ; x1 ; ...; xk } отрезка [0; 1] и
случае представляет собой прямоугольник, ответ какие-нибудь точки
нам известен заранее – интеграл должен быть ра-
вен C · (b − a). Проверим это: ξi ∈ [xi−1 ; xi ]

ˆ k
X Заметим такую формулу:
f (x) d x = lim f (ξi ) · ∆xi =
diam τ →0 k
X
[a,b] i=1
k k
(xi−1 + xi ) · ∆xi = 1. (8.2.93)
X X i=1
= lim C · ∆xi = lim C· ∆xi =
diam τ →0 diam τ →0
i=1 i=1
| {z } Доказывается она так:
b−a
k
X
= lim C · (b − a) = C · (b − a)
diam τ →0 (xi−1 + xi ) · ∆xi =
Запишем вывод: i=1
ˆ k
X
C d x = C · (b − a) (8.2.92) = (xi + xi−1 ) · (xi − xi−1 ) =
[a,b] i=1
§ 2. Определенный интеграл 483

k
X k
X [0; 1] и любых точек ξi ∈ [xi−1 ; xi ]:
= (x2i − x2i−1 ) = (−x2i−1 + x2i ) =
k
i=1 i=1 X 1

0 1 f (ξi ) · ∆xi − 6 diam τ
2

=
k ↓ ↓ ↓ ↓ ↓ ↓ i=1
= (− x20 + x21 ) + (−x21 + x22 ) + ... +(−x2k−1 + x2k ) =
| {z } | {z } | {z }
Если
(n) (n) (n)
теперь τ (n) = {x0 ; x1 ; ...; xkn } –
i=1 i=2 i=k
какая-нибудь измельчающая последователь-
= 1. (n)
ность разбиений с выделенными точками ξi ∈
Теперь мы получим: (n) (n)
[xi−1 ; xi ], то мы получаем
Pk
1
· i=1 (xi−1 + xi ) · ∆xi
ξi 2 k(n)
X
=

(8.2.93)
1
=

k z }| { z}|{ (n) (n)


f (ξi ) · ∆xi − 6 diam τ (n) −→ 0
X 1 2 n→∞
f (ξi ) ·∆xi − = i=1
2
i=1
Отсюда
X k
1 X
k

= ξi · ∆xi − · (xi−1 + xi ) · ∆xi =
2 k (n)
i=1 i=1 X 1
(n)
f (ξi ) · ∆xi
(n)
− −→ 0
X k X k
xi−1 + xi 2 n→∞

== ξi · ∆xi − · ∆xi = i=1
2
i=1 i=1
то есть
X k   (n)
xi−1 + xi k
X 1
= ξi − · ∆xi = (n)
f (ξi ) · ∆xi
(n)
−→
2 n→∞ 2
i=1
k i=1
X 2ξ − x
i i−1 − xi Это верно для любой измельчающейся последо-
= · ∆xi =
2 (n) (n) (n)
вательности τ (n) = {x0 ; x1 ; ...; xk } разбиений
i=1
k
X (ξ − x ) + (ξ − x ) отрезка [0; 1] и любой системы выделенных точек
i i−1 i i (n) (n) (n)
= · ∆xi 6 ξi ∈ [xi−1 ; xi ], значит число 12 действительно
2 ´
i=1 является определенным интегралом [a,b] x d x.
6 (4.1.14) 6 Запишем вывод:

k

X
(ξi − xi−1 ) + (ξi − xi ) 1
6 · ∆xi = ˆ
1
2 |{z} x dx =
i=1
2
6

0
0
⋄ 8.2.7. Интеграл от функции Дирихле. По-
1
Xk

= · (ξi − xi−1 ) + (ξi − xi ) · ∆xi 6 кажем, что определенный интеграл не всегда су-
i=1
2 ществует. Классическим примером здесь являет-
6 (4.1.11) 6 ся функция Дирихле, которую мы определили
Xk   выше формулой (4.1.4):
1
6 · |ξi − xi−1 | + |ξi − xi | · ∆xi 6 (
2 | {z } | {z }
i=1 1, если x – рациональное число
>

>

D(x) =
∆xi , ∆xi , 0, если x – иррациональное число
поскольку поскольку
ξi ∈ [xi−1 ; xi ] ξi ∈ [xi−1 ; xi ]
k k
Попробуем понять, что будет интегралом этой
X ∆xi + ∆xi X
6 · ∆xi = ∆x ·∆xi 6 функции на произвольном отрезке [a; b]. Выбе-
2 |{z}i рем какое-нибудь разбиение τ = {x0 ; x1 ; ...; xk }
i=1 i=1
>

diam τ
отрезка [a; b].
Точки ξi ∈ [xi−1 ; xi ] можно выбирать по-
k
X разному, но нас будут интересовать два способа:
6 diam τ · ∆xi =
i=1 – первый способ заключается в том, чтобы
k
X в каждом отрезке [xi−1 ; xi ] выбрать какую-
= diam τ · ∆xi = diam τ нибудь рациональную точку ξi . Тогда полу-
i=1
| {z } чится D(ξi ) = 1, и интегральные суммы ока-
жутся равны b − a:
=

1
k
X k
X
Мы получили неравенство, справедливое для D(ξi ) · ∆xi = 1 · ∆xi = b − a
любого разбиения τ = {x0 ; x1 ; ...; xk } отрезка i=1 i=1
484 Глава 8. ИНТЕГРАЛ

– второй способ заключается в том, чтобы в а для второго способа получим, что они стремят-
каждом отрезке [xi−1 ; xi ] выбрать какую- ся к нулю:
нибудь иррациональную точку ξi . Тогда полу-
(n)
чится D(ξi ) = 0, и интегральные суммы ока- k
X (n) (n)
жутся равны 0: D(ξi ) · ∆xi = 0 −→ 0
n→∞
i=1
k
X k
X
D(ξi ) · ∆xi = 0 · ∆xi = 0
Спросим себя теперь: существует ли единое чис-
i=1 i=1 ло I, к которому бы стремились все интеграль-
Если теперь взять измельчающуюся последо- ные суммы, независимо от того, какая выбрана
(n) (n) (n)
вательность разбиений τ (n) = {x0 ; x1 ; ...; xk } измельчающаяся последовательность разбиений
(n)
отрезка [a; b], τ (n) = {x0 ; x1 ; ...; xk } и какие выбраны точки
(n) (n) (n)
diam τ (n) −→ 0 ξi ∈ [xi−1 ; xi ]? Понятно, что такого числа I
n→∞
´
(то есть интеграла [a,b] D(x) d x) не существует.
(n)
то выбрав точки ξi первым способом, мы полу- Значит, мы можем сделать
чим, что интегральные суммы стремятся к числу Вывод: функция Дирихле не интегрируема
b − a: ни на каком отрезке [a; b].
(n)
k
X (n) (n)
D(ξi ) · ∆xi = b − a −→ b − a
n→∞
i=1

(b) Когда существует определенный интеграл?


Из примера 8.2.7 видно, что не всякую функцию можно интегрировать. В этом пункте мы обсудим
вопрос о том, когда определенный интеграл существует.

Суммы Дарбу. Пусть функция f определена и ограничена на отрезке [a; b] и пусть τ = {x0 ; x1 ; ...; xk }
– какое-нибудь его разбиение. На каждом отрезке [xi−1 ; xi ] найдем нижнюю и верхнюю грань функ-
ции f
mi = inf f (ξ), Mi = sup f (ξ)
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]

и обозначим
k
X k
X
sτ = mi · ∆xi , Sτ = Mi · ∆xi
i=1 i=1

Поскольку f ограничена на [a; b], mi и Mi являются обычными числами, и поэтому sτ и Sτ тоже


являются числами, причем
s τ 6 Sτ (8.2.94)
• Величина sτ называется нижней, а величина Sτ – верхней суммой Дарбу (функции f на
отрезке [a; b] при разбиении τ ).
Перечислим главные

Свойства сумм Дарбу


0
1 . Если разбиение σ получено из разбиения τ добавлением новых точек

τ ⊆σ

то
s τ 6 s σ 6 Sσ 6 Sτ (8.2.95)
(то есть, при добавлении к данному разбиению τ новых точек нижняя сумма Дарбу
увеличивается, а верхняя уменьшается).
20 . Для любых двух разбиений σ и τ данного отрезка выполняется неравенство

s σ 6 Sτ (8.2.96)

(то есть, любая нижняя сумма Дарбу меньше любой верхней).


§ 2. Определенный интеграл 485

30 . Любая интегральная сумма лежит между нижней и верхней суммами Дарбу


k
X
sτ 6 f (ξi ) · ∆xi 6 Sτ (8.2.97)
i=1

причем нижняя сумма Дарбу есть нижняя грань всех интегральных сумм при данном
разбиении, а верхняя сумма Дарбу – верхняя грань:
k
X k
X
sτ = inf f (ξi ) · ∆xi , Sτ = sup f (ξi ) · ∆xi (8.2.98)
ξi ∈[xi−1 ;xi ] ξi ∈[xi−1 ;xi ] i=1
i=1

40 . Если функция f интегрируема на [a, b], то для произвольного разбиения τ отрезка [a, b]
интеграл от f лежит между нижней и верхней суммами Дарбу:
ˆ
sτ 6 f (x) d x 6 Sτ (8.2.99)
[a,b]

Доказательство. 1. Для доказательства 10 достаточно рассмотреть случай, когда к данному раз-


биению τ = {x0 ; x1 ; ...; xk } добавляется всего одна точка x∗ :

σ = τ ∪ {x∗ } = {x0 ; x1 ; ...; xk } ∪ {x∗ }

Тогда x∗ лежит в каком-то отрезке [xj−1 ; xj ]:

x∗ ∈ [xj−1 ; xj ] (8.2.100)

и поэтому

k
X X X
sτ = mi · ∆xi = mj · ∆xj + mi · ∆xi = mj · (xj − xj−1 ) + mi · ∆xi = (8.2.100) =
i=1 i6=j i6=j
X
= inf f (ξ) ·(xj − x∗ ) + inf f (ξ) ·(x∗ − xj−1 ) + mi · ∆xi 6
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ]
| {z } | {z } i6=j
>

>

inf ξ∈[x∗ ,xj ] f (ξ), inf ξ∈[xj−1 ,x∗ ] f (ξ),


потому что потому что
[xj−1 ; xj ] ⊇ [x∗ , xj ] [xj−1 ; xj ] ⊇ [xj−1 , x∗ ]
X
6 inf

f (ξ) · (xj − x∗ ) + inf f (ξ) · (x∗ − xj−1 ) + mi · ∆xi = sσ
ξ∈[x ,xj ] ξ∈[xj−1 ,x∗ ]
i6=j

То есть, sτ 6 sσ . Аналогично доказывается. что Sτ > Sσ :

k
X X X
Sτ = Mi · ∆xi = Mj · ∆xj + Mi · ∆xi = Mj · (xj − xj−1 ) + Mi · ∆xi = (8.2.100) =
i=1 i6=j i6=j
X
= sup f (ξ) ·(xj − x∗ ) + sup f (ξ) ·(x∗ − xj−1 ) + Mi · ∆xi >
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ] i6=j
| {z } | {z }
6

supξ∈[x∗ ,xj ] f (ξ), supξ∈[xj−1 ,x∗ ] f (ξ),


потому что потому что
[xj−1 ; xj ] ⊇ [x∗ , xj ] [xj−1 ; xj ] ⊇ [xj−1 , x∗ ]
X
> sup f (ξ) · (xj − x∗ ) + sup f (ξ) · (x∗ − xj−1 ) + Mi · ∆xi = Sσ
ξ∈[xj−1 ;x∗ ] ξ∈[x∗ ;xj ] i6=j

Оставшееся неравенство в (8.2.95), sσ 6 Sσ , есть просто неравенство (8.2.94), в котором τ заменено


на σ.
2. Если σ и τ – два разбиения отрезка [a; b], то, добавлением новых точек, можно сделать из них
третье разбиение ρ, которое бы содержало и σ, и τ :

σ ⊆ ρ, τ ⊆ρ
486 Глава 8. ИНТЕГРАЛ

Для него мы получим:


(8.2.95) (8.2.94) (8.2.95)
sσ 6 sρ 6 Sρ 6 Sτ
| {z } | {z }
σ⊆ρ ρ⊇τ

3. Неравенства (8.2.97) очевидны,

k
X k
X k
X
sτ = inf f (ζi ) · ∆xi 6 f (ξi ) · ∆xi 6 sup f (ζi ) · ∆xi 6 Sτ ,
ζi ∈[xi−1 ;xi ]
i=1 i=1 i=1 ζi ∈[xi−1 ;xi ]

и из них сразу следуют неравенства


k
X k
X
sτ 6 inf f (ξi ) · ∆xi , sup f (ξi ) · ∆xi 6 Sτ .
ξi ∈[xi−1 ;xi ] ξi ∈[xi−1 ;xi ] i=1
i=1

Поэтому, чтобы, например, доказать первое равенство в (8.2.98), достаточно доказать обратное
неравенство:
Xk
sτ > inf f (ξi ) · ∆xi (8.2.101)
ξi ∈[xi−1 ;xi ]
i=1

Для этого (зафиксировав разбиение τ = {x0 , ..., xk }) для каждого i = 1, ..., k выберем последова-
(n)
тельность точек ξi ∈ [xi−1 ; xi ] такую, что
(n)
f (ξi ) −→ inf f (ξi )
n→∞ ξi ∈[xi−1 ;xi ]

Тогда (8.2.101) получается так:

k
X k
X   k
X  
(n) (n)
inf f (ξi ) · ∆xi 6 inf f ξi · ∆xi = lim f ξi · ∆xi =
ξi ∈[xi−1 ;xi ] n→∞ n→∞
i=1 i=1 i=1
k
X   k
X
(n)
= lim f ξi · ∆xi = inf f (ξi ) · ∆xi = sτ
n→∞ ξi ∈[xi−1 ;xi ]
i=1 i=1

Второе равенство в (8.2.98) доказывается аналогично.


4. Для доказательства 40 , зафиксируем разбиение τ . Для всякого более мелкого разбиения σ ⊇ τ
и любой системы выделенных точек ξi разбиения σ мы получим:

(8.2.95) (8.2.97) k
X (8.2.97) (8.2.95)
sτ 6 sσ 6 f (ξi ) · ∆xi 6 Sσ 6 Sτ
i=1

Если теперь заморозить τ , а σ выбирать все более измельчающимся, то мы получим:


k
X
sτ 6 f (ξi ) · ∆xi 6 Sτ
i=1
| {z }
diam σ
↓ ↓
´ 0

[a,b]
f (x) d x

Отсюда и следует (8.2.99).

• Верхняя грань всех нижних сумм Дарбу для функции f на отрезке [a; b]

I∗ = sup sτ
τ

называется нижним интегралом Дарбу, а нижняя грань всех верхних сумм Дарбу

I ∗ = inf Sτ
τ
§ 2. Определенный интеграл 487

называется верхним интегралом Дарбу. Из неравенства (8.2.96) следует, что для любых
двух разбиений σ и τ данного отрезка выполняются неравенства
sσ 6 I∗ 6 I ∗ 6 Sτ (8.2.102)
Если вдобавок функция f интегрируема на [a, b], то эту цепочку можно дополнить так:
ˆ
sσ 6 I∗ 6 f (x) d x 6 I ∗ 6 Sτ (8.2.103)
[a,b]

⊲ 8.2.8. Найдите верхний и нижний интегра- и функции Дирихле (определенной формулой


лы Дарбу на отрезке [−1; 1] для функции сиг- (4.1.4)).
нум sgn x (определенной выше формулой (4.1.3))

Критерий интегрируемости.
Теорема 8.2.9 (критерий интегрируемости). 8 Ограниченная на отрезке [a; b] функция f тогда и
только тогда интегрируема на [a; b], когда для всякой измельчающейся последовательности τ (n)
разбиений отрезка [a; b]
diam τ (n) −→ 0
n→∞
соответствующие верхняя и нижняя суммы Дарбу стремятся друг к другу:
Sτ (n) − sτ (n) −→ 0 (8.2.104)
n→∞

В этом случае (для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b])
суммы Дарбу необходимо стремятся к интегралу от f на [a, b]:
ˆ
Sτ (n) −→ f (x) d x ←− sτ (n) (8.2.105)
n→∞ [a,b] ∞←n

Доказательство. 1. Необходимость. Пусть f интегрируема на [a; b], покажем что тогда выполняется
(8.2.104). Возьмем какую-нибудь измельчающуюся последовательность разбиений τ (n) отрезка [a; b].
Из левой формулы (8.2.98)
Xk
sτ = inf f (ξi ) · ∆xi ,
ξi ∈[xi−1 ;xi ]
i=1
(n)
следует, что для всякого n можно выбрать точки ξi ∈ [xi−1 ; xi ] так, чтобы

k
X   1
(n)
sτ − f ξi · ∆xi 6
n
i=1

Тогда мы получим
k
X  
(n)
sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1

Теперь вспомним, что, по предположению, функция f интегрируема на [a; b], то есть существует
такое число I, что
Xk  
(n)
f ξi · ∆xi −→ I (8.2.106)
n→∞
i=1
(n)
для всякой измельчающейся последовательности τ (n) и любой системы точек ξi ∈ [xi−1 ; xi ]. В
частности, это должно быть верно для нашей последовательности τ (n) и выбранной нами системы
(n)
точек ξi ∈ [xi−1 ; xi ]. Отсюда
!
k
X   k
X  
(n) (n)
sτ (n) = sτ (n) − f ξi · ∆xi + f ξi · ∆xi −→ 0 + I = I
n→∞
i=1 i=1
8 Эта теорема используется ниже при доказательстве теорем 8.2.10 и 8.2.11.
488 Глава 8. ИНТЕГРАЛ

Точно также из правой формулы (8.2.98)

k
X
Sτ = sup f (ξi ) · ∆xi ,
ξi ∈[xi−1 ;xi ] i=1

(n)
следует, что для всякого n можно выбрать (новые) точки ξi ∈ [xi−1 ; xi ] так, чтобы

Xk   1
(n)
Sτ − f ξi · ∆xi 6
n
i=1

Тогда мы получим
k
X  
(n)
Sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1

Поскольку функция f интегрируема, выполняется (8.2.106), значит


!
k
X   k
X  
(n) (n)
Sτ (n) = Sτ (n) − f ξi · ∆xi + f ξi · ∆xi −→ 0 + I = I
n→∞
i=1 i=1

Таким образом, мы получили, что

sτ (n) −→ I, Sτ (n) −→ I
n→∞ n→∞

откуда и следует (8.2.104):


Sτ (n) − sτ (n) −→ 0
n→∞

2. Докажем достаточность. Пусть для всякой измельчающейся последовательности τ (n) разбие-


ний отрезка [a; b]
diam τ (n) −→ 0
n→∞

соответствующие верхняя и нижняя суммы Дарбу стремятся друг к другу:

Sτ (n) − sτ (n) −→ 0
n→∞

Заметим, что тогда верхний и нижний интегралы Дарбу должны совпадать

I∗ = I ∗ ,

потому что из неравенств (8.2.102) следует

0 6 I ∗ − I∗ 6 Sτ (n) − sτ (n) −→ 0.
n→∞

Теперь положим
I = I∗ = I ∗
и покажем, что I является интегралом функции f на отрезке [a; b].
Для этого опять возьмем измельчающуюся последовательность τ (n) разбиений отрезка [a; b]. Из
неравенств (8.2.102) получаем две цепочки:

0 6 I − sτ (n) 6 Sτ (n) − sτ (n) 0 6 Sτ (n) − I 6 Sτ (n) − sτ (n)


| {z } | {z }
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
⇓ ⇓
I − sτ (n) −→ 0 Sτ (n) − I −→ 0
n→∞ n→∞
⇓ ⇓
sτ (n) −→ I Sτ (n) −→ I
n→∞ n→∞
§ 2. Определенный интеграл 489

(n)
Теперь из формулы (8.2.97) при произвольном выборе точек ξi ∈ [xi−1 ; xi ] мы получаем

k
X (n) (n)
sτ (n) 6 f (ξi ) · ∆xi 6 Sτ (n)
| {z } | {z }
i=1
n n
↓ ↓ ↓ ↓
∞ ∞
I I

Последовательности по бокам этого двойного неравенства стремятся к I, значит, интегральная


сумма тоже стремится к I:
Xk
(n) (n)
f (ξi ) · ∆xi −→ I
n→∞
i=1

Это верно для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b] и любой
(n) (n) (n)
системы выделенных точек ξi ∈ [xi−1 ; xi ], значит I действительно является интегралом для f
на [a; b]. Это нам и нужно было доказать.

Ограниченность интегрируемой функции.

Теорема 8.2.10. Если функция f интегрируема на отрезке [a; b], то она ограничена на нем.

Доказательство. Докажем это утверждение в эквивалентной формулировке: если функция f (опре-


делена и) НЕ ограничена на отрезке [a; b], то она НЕ интегрируема на нем. Пусть функция f не
ограничена на отрезке [a; b]. Это означает, что она или неограничена сверху, или неограничена снизу:

sup f (x) = +∞ или inf f (x) = −∞


x∈[a;b] x∈[a;b]

Предположим, для определенности, что она неограничена сверху:

sup f (x) = +∞
x∈[a;b]

Зафиксируем какое-нибудь число M и возьмем произвольное разбиение τ = {x0 ; x1 ; ...; xk } отрезка


[a; b].
Поскольку f неограничена на отрезке [a; b], она должна быть неограничена на каком-нибудь
отрезке [xi−1 ; xi ]. То есть, существует индекс j такой что

sup f (ξ) = +∞ (8.2.107)


ξ∈[xj−1 ;xj ]

Зафиксируем этот индекс j и выберем произвольным образом точки ξi ∈ [xi−1 ; xi ], i 6= j. Тогда в


интегральной сумме
Xk X
f (ξi ) · ∆xi = f (ξj ) · ∆xj + f (ξi ) · ∆xi
i=1 i6=j
P
величина i6=j f (ξi ) · ∆xi фиксирована, а слагаемое f (ξj ) · ∆xj – переменная, поскольку точка
ξj ∈ [xj−1 ; xj ] еще не выбрана. Из (8.2.107) следует, что недостающую точку ξj ∈ [xj−1 ; xj ] можно
выбрать так, чтобы вся сумма была больше числа M :
k
X X
f (ξi ) · ∆xi = f (ξj ) · ∆xj + f (ξi ) · ∆xi > M
i=1 i6=j

Мы получили, что для всякого разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] можно выбрать числа
ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M .
Значит, если взять измельчающуюся последовательность разбиений τ (n) , то для нее тоже можно
(n) (n) (n)
выбрать числа ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M :
(n)
k
X
f (ξi ) · ∆xi > M
i=1
490 Глава 8. ИНТЕГРАЛ

Отсюда следует, что интеграл (то есть предел таких интегральных сумм), если он существует, не
может быть меньше M :
(n)
k
X
I = lim f (ξi ) · ∆xi > M
n→∞
i=1
Но число M мы выбирали произвольным: получается, что число I должно быть больше какого
хочешь другого числа M , а это абсурд.

Интегрируемость монотонной функции.


Теорема 8.2.11. Если функция f (определена и) монотонна на отрезке [a; b], то она интегриру-
ема на нем.
Доказательство. Пусть функция f (определена и) монотонна на отрезке [a; b], например, неубывает
на нем:
s 6 t =⇒ f (s) 6 f (t)
покажем, что тогда f интегрируема на [a; b]. Для этого возьмем какое-нибудь разбиение τ отрезка
[a; b] и покажем, что суммы Дарбу удовлетворяют неравенству:
Sτ − sτ 6 diam τ · {f (b) − f (a)} (8.2.108)
Действительно,
k
X k
X k
X k
X
Sτ −sτ = sup f (ξ) ·∆xi − inf f (ξ) ·∆xi = f (xi )·∆xi − f (xi−1 )·∆xi =
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1
| {z } i=1 | {z } i=1 i=1
k   k 
f xi , f xi−1 ,
поскольку f поскольку f
монотонно неубывает монотонно неубывает

k
X k
X k
X
= (f (xi ) − f (xi−1 )) · ∆xi 6 (f (xi ) − f (xi−1 )) · diam
| {z τ} = diam τ · (f (xi ) − f (xi−1 )) =
|{z}
i=1 i=1 не зависит i=1
>

от индекса i,
diam τ поэтому можно
вынести за знак суммы

f (b) сокращаютсясокращаются сокращаются сокращаются


f (a)
=

=
n ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ o
= diam τ · f (xk ) − f (xk−1 ) + f (xk−1 ) − f (xk−2 ) + ... +f (x2 ) − f (x1 ) + f (x1 ) − f (x0 ) =
| {z } | {z } | {z } | {z }
i=k i=k−1 i=2 i=1
= diam τ · {f (b) − f (a)}
Если теперь взять измельчающуюся последовательность разбиений τ (n) отрезка [a; b], то мы полу-
чим
0 6 Sτ (n) − sτ (n) 6 (8.2.108) 6 diam τ (n) · {f (b) − f (a)} −→ 0
n→∞
значит,
Sτ (n) − sτ (n) −→ 0
n→∞

Это верно для любой измельчающейся последовательности разбиений τ (n) , значит, по теореме 8.2.9,
f интегрируема на [a; b].

Интегрируемость непрерывной функции.


Теорема 8.2.12. Если функция f (определена и) непрерывна на отрезке [a; b], то она интегриру-
ема на нем.
Для доказательства теоремы 8.2.12 нам понадобится следующая
Лемма 8.2.13. Если f – непрерывная функция на отрезке [a; b], то для любого разбиения τ отрезка
[a; b] существуют числа α, β ∈ [a; b], такие что расстояние между ними не превышает диаметра
разбиения τ
|α − β| 6 diam τ, (8.2.109)
а разность между верхней и нижней интегральными суммами Дарбу этого разбиения оценива-
ется неравенством:

Sτ − sτ 6 f (α) − f (β) · (b − a) (8.2.110)
§ 2. Определенный интеграл 491

Доказательство. По теореме Вейерштрасса об экстремумах 4.3.28, функция f достигает максиму-


ма и минимума на каждом отрезке [xi−1 ; xi ], то есть существуют такие точки ηi , θi ∈ [xi−1 ; xi ], что

f (ηi ) = sup f (x) & f (θi ) = inf f (x) (8.2.111)


x∈[xi−1 ;xi ] x∈[xi−1 ;xi ]

Рассмотрим конечный набор чисел


f (η1 ) − f (θ1 ) , f (η2 ) − f (θ2 ) , ..., f (ηi ) − f (θi ) , ..., f (ηk ) − f (θk )
и выберем среди них максимальное: пусть соответствующий индекс обозначается j:
f (ηj ) − f (θj ) = max (f (ηi ) − f (θi )) (8.2.112)
i=1,2,...,k

Обозначив теперь
α = ηj , β = θj
мы получим нужные числа: с одной стороны, поскольку α, β ∈ [xj−1 ; xj ], получается
 
|α − β| 6 ∆xj 6 ∆ τ

А, с другой стороны,
!
 
f (α) − f (β) = max f (ηi ) − f (θi ) = max sup f (x) − inf f (x) (8.2.113)
16i6k 16i6k x∈[xi−1 ;xi ] x∈[xi−1 ;xi ]

Поэтому
k k k
" #
X X X
Sτ −sτ = sup f (ξ)·∆xi − inf f (ξ)·∆xi = sup f (ξ) − inf f (ξ) ·∆xi 6
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1 ξ∈[xi−1 ;xi ] i=1 i=1 ξ∈[xi−1 ;xi ]
| {z }

>
(8.2.113)
f (α) − f (β)
Xk h i h i k
X h i
6 f (α) − f (β) ·∆xi = f (α) − f (β) · ∆xi = f (α) − f (β) · (b − a)
i=1 | {z } i=1
не зависит
| {z }
от индекса i длина отрезка [a,b]

Доказательство теоремы 8.2.12. Пусть τ (n) – измельчающаяся последовательность разбиений от-


резка [a; b]:
diam τ (n) −→ 0
n→∞
(n) (n)
По лемме 8.2.13, найдутся числа α ,β ∈ [a, b] такие, что
(n)
|α − β (n) | 6 diam τ (n)
и h i
Sτ (n) − sτ (n) 6 f (α(n) ) − f (β (n) ) · (b − a)

Из первого условия следует, что последовательности α(n) и β (n) стремятся друг к другу:
α(n) − β (n) −→ 0
n→∞

Поэтому по теореме Кантора 4.3.32 (функция f непрерывна на [a; b], значит она должна быть
равномерно непрерывна на нем), получаем:
f (α(n) ) − f (β (n) ) −→ 0
n→∞

Отсюда уже следует


h i
0 6 Sτ (n) − sτ (n) 6 f (α(n) ) − f (β (n) ) · (b − a) −→ 0 =⇒ Sτ (n) − sτ (n) −→ 0
n→∞ n→∞

(n)
Это верно для любой измельчающейся последовательности разбиений τ , значит, по теореме 8.2.9,
f интегрируема на [a; b].
492 Глава 8. ИНТЕГРАЛ

(c) Свойства определенного интеграла

Свойства определенного интеграла


10 . Интеграл по вырожденному отрезку: всякая функция f , определенная в заданной
точке a, интегрируема на вырожденном отрезке [a; a], и интеграл от нее равен нулю:
ˆ
f (x) d x = 0 (8.2.114)
[a;a]

20 . Линейность: если функции f и g интегрируемы на отрезке [a; b] то для любых чисел


α, β ∈ R функция α · f + β · g тоже интегрируема на отрезке [a; b], причем
ˆ   ˆ ˆ
α · f (x) + β · g(x) d x = α · f (x) d x + β · g(x) d x (8.2.115)
[a,b] [a,b] [a,b]

30 . Аддитивность: пусть a < b < c, тогда функция f : [a, c] → R интегрируема на отрез-


ках [a; b] и [b; c], тогда и только тогда когда она интегрируема на отрезке [a; c], и при
этом ˆ ˆ ˆ
f (x) d x + f (x) d x = f (x) d x (8.2.116)
[a,b] [b,c] [a,c]

40 . Монотонность: если функции f и g интегрируемы на отрезке [a; b] и при этом

f (x) 6 g(x), x ∈ [a; b] (8.2.117)

то ˆ ˆ
f (x) d x 6 g(x) d x (8.2.118)
[a,b] [a,b]

50 . Выпуклость: если функция f интегрируема на отрезке [a; b], то функция |f | тоже


интегрируема на отрезке [a; b], и при этом
ˆ ˆ


f (x) d x 6 |f (x)| d x (8.2.119)
[a,b] [a,b]

60 . Оценка сверху: если функция f интегрируема на отрезке [a; b], то


ˆ


f (x) d x 6 (b − a) · sup |f (x)| (8.2.120)
[a,b] x∈[a,b]

70 . Непрерывность: если функция f интегрируема на отрезке [a; b], то для всякой точки
c ∈ [a, b]
ˆ ˆ
f (x) d x −→ f (x) d x (8.2.121)
[a,y] y→c [a,c]
ˆ ˆ
f (x) d x −→ f (x) d x (8.2.122)
[y,b] y→c [c;b]

(все эти интегралы существуют по свойству 20 выше).


8 . Теорема о среднем: если функция f непрерывна на отрезке [a; b], то найдется такая
0

точка ξ ∈ [a; b], что


ˆ
f (x) d x = f (ξ) · (b − a) (8.2.123)
[a,b]

90 . Интегрируемость произведения: если функции f и g интегрируемы на отрезке [a; b],


то их произведение f · g – тоже интегрируемая функция на отрезке [a; b].
§ 2. Определенный интеграл 493

Доказательство. 1. Пусть функция f определена в точке a. Вырожденный отрезок [a, a] состоит


всего из одной точки
[a, a] = {a},
поэтому разбиений у него может быть только одно, а именно, последовательность, состоящая из
одной точки x0 = a. У такого разбиения отрезков [xi−1 , xi ] вообще нет. Поэтому интегральная
сумма состоит из нулевого числа слагаемых:
k
X
f (ξi ) · ∆xi
i=0

Но это значит, что она равна нулю:


k
X
f (ξi ) · ∆xi = 0.
i=0

Естественно, в пределе получается тоже ноль:


ˆ k
X
f (x) d x = lim f (ξi ) · ∆xi = 0.
[a,a] diam{x0 ,...,xk }→0
i=0

2. Линейность. Пусть функции f и g интегрируемы на отрезке [a; b], и


ˆ ˆ
F = f (x) d x, G= g(x) d x
[a,b] [a,b]

Для всякого разбиения τ = {x0 , ..., xk } отрезка [a; b] и любой системы выделенных точек ξi ∈
[xi−1 ; xi ] мы получим:
k 
X  k
X k
X
α · f (ξi ) + β · g (ξi ) · ∆xi = α · f (ξi ) · ∆xi +β · g (ξi ) · ∆xi −→ α·F +β·G
diam τ →0
i=1 i=1 i=1
| {z } | {z }
diam τ diam τ
↓ ↓ ↓ ↓
0 0
F G

Это нужно понимать так: если взять последовательность разбиений τ (n) , диаметры которых стре-
(n)
мятся к нулю, то какую ни выбирай систему выделенных точек ξi , интегральная сумма функции
α·f +β ·g будет стремится к числу α·F +β ·G. То есть, функция α·f +β ·g получается интегрируемой,
и ˆ   ˆ ˆ
α · f (x) + β · g(x) d x = α · F + β · G = α · f (x) d x + β · g(x) d x
[a,b] [a,b] [a,b]

3. Аддитивность. Пусть для начала нам дано, что функция f интегрируема на отрезках [a; b] и
[b; c]. Тогда по теореме 8.2.10, f ограничена на отрезках [a; b] и [b; c], а значит и на отрезке [a; c]:

∃M ∈ R ∀x ∈ [a; c] |f (x)| 6 M (8.2.124)

Обозначим через A и B интегралы по отрезкам [a; b] и [b; c]


ˆ ˆ
A= f (x) d x, B = f (x) d x
[a,b] [b,c]

Нам нужно показать, что f интегрируема на [a; c], причем


ˆ
f (x) d x = A + B
[a,c]

Возьмем разбиение τ = {x0 , ..., xk } отрезка [a; c]. Точка b попадет в какой-то полуинтервал (xj−1 , xj ]:

τ = {a = x0 < x1 < ... < xj−1 < b 6 xj < xj+1 < ... < xk = c}

Запомним этот индекс j и выберем произвольные точки ξi ∈ [xi−1 ; xi ]. Тогда:


494 Глава 8. ИНТЕГРАЛ

интегральная сумма
на отрезке [a; c]
z }| {
X k j−1
X k
X
f (ξi ) · ∆xi = f (ξi ) · ∆xi + f (ξj ) · ∆xj + f (ξi ) · ∆xi =
i=1 i=1 i=j+1
j−1
X   k
X
= f (ξi ) · ∆xi + f (b) + f (ξj ) − f (b) · ∆xj + f (ξi ) · ∆xi =
i=1 i=j+1
j−1
X k
X  
= f (ξi ) · ∆xi + f (b) · ∆xj + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
j−1
X k
X  
= f (ξi ) · ∆xi + f (b) · (xj − xj−1 ) + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
xj − xj−1
k
j−1
X z }| { k
X  
= f (ξi ) · ∆xi + f (b) · (b − xj−1 − b + xj ) + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
j−1
X k
X  
= f (ξi ) · ∆xi + f (b) · (b − xj−1 ) + f (b) · (xj − b) + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj
i=1 i=j+1
| {z } | {z }
интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]

интегральная сумма
на отрезке [a; c] интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]
z }| z }| {
z }| { !{ 
X k j−1
X Xk

f (ξi ) · ∆xi − f (ξi ) · ∆xi + f (b) · (b − xj−1 ) − f (b) · (xj − b) + f (ξi ) · ∆xi  =

i=1 i=1 i=j+1
| {z } | {z }
diam τ
diam τ
↓ ↓
↓ ↓
0
0
A B
 

= f (ξj ) − f (b) · ∆xj 6 f (ξj ) + f (b) · ∆xj 6 2M · diam τ −→ 0
| {z } | {z } |{z} diam τ →0
>
>

>

M M diam τ


k
X
f (ξi ) · ∆xi −→ A+B
diam τ →0
i=1

Опять же, это нужно понимать так, что какую ни возьми последовательность разбиений τ (n) от-
(n)
резка [a, c], с диаметрами стремящимися к нулю, то при любом выборе выделенных точек ξi ,
интегральные суммы функции f на отрезке [a, c] будут стремиться к числу A + B. Это нам и нужно
было доказать.
Теперь для завершения доказательства свойства 20 нам еще нужно проверить, что из интегри-
руемости функции f на отрезке [a, c] следует ее интегрируемость на отрезках [a, b] и [b, c]. Мы
докажем это для отрезка [a, b] (для [b, c] это делается по аналогии). Итак, будем считать, что
(n) (n)
функция f интегрируема на отрезке [a, c]. Пусть τ (n) = {x0 , ..., xk(n) } – измельчающаяся после-
довательность разбиений отрезка [a; b]. Ее можно дополнить до какой-нибудь последовательности
(n) (n) (n) (n)
ρ(n) = {x0 , ..., xk(n) , xk(n) +1 , ..., xl(n) } разбиений отрезка [a, c] так, чтобы она тоже была измельчаю-
щейся. Мы тогда получим:

(n) (n)
k
X k
X
0 6 Sτ (n) − sτ (n) = sup f (ξ) · ∆xi − inf f (ξ) · ∆xi =
ξ∈[xi−1 ;xi ]
i=1 ξ∈[xi−1 ;xi ] i=1
§ 2. Определенный интеграл 495

k (n) ! l (n) !
X X
= sup f (ξ) − inf f (ξ) · ∆xi 6 sup f (ξ) − inf f (ξ) · ∆xi =
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1 i=1
(n) (n)
l
X l
X
= sup f (ξ) · ∆xi − inf f (ξ) · ∆xi = Sρ(n) − sρ(n) −→ 0.
ξ∈[xi−1 ;xi ] n→∞
i=1 ξ∈[xi−1 ;xi ] i=1


Sτ (n) − sτ (n) −→ 0
n→∞
(n) (n)
Это верно для любой измельчающейся последовательности τ (n) = {x0 , ..., xk(n) } разбиений отрезка
[a; b], поэтому по теореме 8.2.9, функция f интегрируема на [a; b].
4. Монотонность. Пусть функции f и g интегрируемы на отрезке [a; b], причем

f (x) 6 g(x), x ∈ [a; b]

Тогда для любых разбиений τ = {x0 , ..., xk } отрезка [a; c] и любых точек ξi ∈ [xi−1 ; xi ] мы получим

∀i f (ξi ) 6 g (ξi )


∀i f (ξi ) · ∆xi 6 g (ξi ) · ∆xi

ˆ k
X k
X ˆ
f (x) d x ←− f (ξi ) · ∆xi 6 g (ξi ) · ∆xi −→ g(x) d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1


ˆ ˆ
f (x) d x 6 g(x) d x
[a,b] [a,b]

5. Выпуклость. Здесь при доказательстве используются свойства точных граней функции, о


которых мы говорили на с.244. Сначала нужно доказать следующее неравенство, связывающее
верхние и нижние суммы Дарбу для f и |f |:

Sτ (|f |) − sτ (|f |) 6 Sτ (f ) − sτ (f ) (8.2.125)

Действительно:

k
!
X
Sτ (|f |) − sτ (|f |) = sup |f (η)| − inf |f (θ)| · ∆xi = (4.1.29) =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
!
k
X   k
X  
= sup |f (η)| + sup − |f (θ)| · ∆xi = sup |f (η)| − |f (θ)| · ∆xi 6
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
k
X k
X
6 (4.1.12) 6 sup |f (η) − f (θ)| · ∆xi = (4.1.32) = sup (f (η) − f (θ)) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
!
k
X  
= sup f (η) + sup − f (θ) · ∆xi = (4.1.29) =
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
k
!
X
= sup f (η) − inf f (θ) · ∆xi = Sτ (f ) − sτ (f )
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1

Если теперь функция f интегрируема на отрезке [a; b], то по критерию интегрируемости (теоре-
ма 8.2.9 этой главы), для любой измельчающейся последовательности τ (n) разбиений отрезка [a; b]
разность между верхними и нижними суммами Дарбу для функции f должна стремиться к нулю,
поэтому из (8.2.125) получаем:

0 6 Sτ (n) (|f |) − sτ (n) (|f |) 6 Sτ (n) (f ) − sτ (n) (f ) −→ 0


n→∞
496 Глава 8. ИНТЕГРАЛ

откуда
Sτ (n) (|f |) − sτ (n) (|f |) −→ 0
n→∞

То есть функция |f | тоже должна быть интегрируема на отрезке [a; b]. Нам остается доказать нера-
венство (8.2.119):
ˆ
Xk k
X ˆ

f (x) d x ←− f (ξi ) · ∆xi 6 (4.1.14) 6 |f (ξi )| · ∆xi −→ |f (x)| d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1


ˆ ˆ


f (x) d x 6 |f (x)| d x
[a,b] [a,b]

6. Оценка сверху. Если функция f интегрируема на отрезке [a, b], то по теореме 8.2.10, она
ограничена. Обозначим C = supx∈[a,b] |f (x)|. Тогда
ˆ
ˆ ˆ

f (x) d x 6 (8.2.119) 6 |f (x)| d x 6 C d x = (8.2.92) = (b − a) · C
[a,b] [a,b] [a,b]
| {z }
⇑ (8.2.118)
|f (x)| 6 C

7. Непрерывность. Из двух формул (8.2.121) и (8.2.122) мы докажем первую, имея в виду, что
вторая доказывается по аналогии:
ˆ ˆ
f (x) d x −→ f (x) d x
[a,y] y→c [a,c]

Ее, в свою очередь, можно разбить на два односторонних предела,


ˆ ˆ ˆ ˆ
f (x) d x −→ f (x) d x, f (x) d x −→ f (x) d x,
[a,y] y→c−0 [a,c] [a,y] y→c+0 [a,c]

и доказать, например, второй, заявив, что первый доказывается аналогично:


ˆ ˆ y

ˆ
f (x) d x −
f (x) d x = f (x) d x 6 (8.2.120) 6 (y − c) · sup |f (x)| −→ 0
| {z } x∈[c,y] y→c+0
[a,y] [a,c] c
| {z } ↓ | {z }
0
=

>

(8.2.116)
f (x) d x + cy f (x) d x
´ ´
[a,c] supx∈[c,y] |f (x)|
>

теорема 8.2.10

8. Теорема о среднем. Пусть f непрерывна на отрезке [a; b]. Тогда по теореме Вейерштрасса об
экстремумах (теорема 4.3.28), найдутся такие точки α, β ∈ [a; b], что

∀x ∈ [a; b] f (α) 6 f (x) 6 f (β)

Теперь по уже доказанному свойству монотонности 30 ,


ˆ ˆ ˆ
f (α) d x 6 f (x) d x 6 f (β) d x
[a,b] [a,b] [a,b]

Вспомнив теперь (8.2.92), получаем


ˆ
f (α) · (b − a) 6 f (x) d x 6 f (β) · (b − a)
[a,b]

откуда
1
ˆ
f (α) 6 · f (x) d x 6 f (β)
b−a [a,b]
§ 2. Определенный интеграл 497

1
´
Таким образом, число M = b−a · [a,b] f (x) лежит между значениями f (α) и f (β) непрерывной
функции f на отрезке [α; β]. Значит, по теореме Коши о промежуточном значении (теорема 4.3.22),
найдется точка ξ ∈ [α; β] ⊆ [a; b] такая что

1
ˆ
f (ξ) = · f (x) d x
b − a [a,b]

Отсюда и получается (8.2.123): ˆ


f (x) d x = f (ξ) · (b − a)
[a,b]

9. Произведение интегрируемых функций. Пусть функции f и g интегрируемы на отрезке [a; b].


Тогда по теореме 8.2.10 они должны быть ограничены на [a; b]:

∃A, B ∈ R ∀x ∈ [a; b] |f (x)| 6 A, |g(x)| 6 B

Заметим, что для любых η, θ ∈ [a, b] выполняется неравенство

|f (η) · g(η) − f (θ) · g(θ)| 6 B · |f (η) − f (θ)| + A · |g(η) − g(θ)| (8.2.126)

Действительно,

|f (η) · g(η) − f (θ) · g(θ)| = |f (η) · g(η) − f (θ) · g(η) + f (θ) · g(η) − f (θ) · g(θ)| 6
6 |f (η) · g(η) − f (θ) · g(η)| + |f (θ) · g(η) − f (θ) · g(θ)| = |f (η) − f (θ)| · |g(η)| + |f (θ)| · |g(η) − g(θ)| 6
6 |f (η) − f (θ)| · B + A · |g(η) − g(θ)|

Теперь, чтобы доказать, что f · g интегрируема на [a; b], возьмем разбиение τ отрезка [a; b] и оценим
разность между верхними и нижними суммами Дарбу для функции f (x) · g(x):

k
!
X
Sτ (f · g) − sτ (f · g) = sup f (η) · g(η) − inf f (θ) · g(θ) · ∆xi =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
k
X

= sup f (η) · g(η) − f (θ) · g(θ) · ∆xi 6 (8.2.126) 6
i=1 η,θ∈[xi−1 ;xi ]
k
X  

6 sup B · f (η) − f (θ) + A · g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ]
k
X k
X

=B· sup f (η) − f (θ) · ∆xi + A · sup g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
   
= B · Sτ (f ) − sτ (f ) +A · Sτ (g) − sτ (g) −→ 0
| {z } | {z } diam τ →0
←−

←−

diam τ diam τ
↓ ↓
0 0
0, 0,
поскольку f поскольку g
интегрируема интегрируема

Гладкие функции на отрезке и замена переменной в определенном интеграле.


• Функция h называется гладкой на отрезке [a; b], если она дифференцируема на [a; b] (в
смысле определения на с.455), и ее производная h′ на этом отрезке (определенная фор-
мулой (8.1.36)) непрерывна на [a; b]. Класс всех гладких функций на [a; b] обозначается
символом C 1 [a, b]. Из предложения 8.1.22 следует, что любая гладкая функция автомати-
чески непрерывна, то есть выполняется включение:

C 1 [a, b] ⊂ C[a, b] (8.2.127)

Теорема 8.2.14 (о замене переменной в определенном интеграле). Пусть


498 Глава 8. ИНТЕГРАЛ

1) функция f интегрируема на отрезке [a; b], и


2) функция ϕ определена на отрезке [α; β] и обладает свойствами:
a) ϕ – гладкая на отрезке [α; β];
b) ϕ – строго монотонная на отрезке [α; β];
c) ϕ сюръективно отображает отрезок [α; β] на отрезок [a; b]:
 
ϕ [α; β] = [a, b],

тогда функция (f ◦ ϕ) · |ϕ′ | интегрируема на отрезке [α, β], и


ˆ ˆ
f (x) d x = f (ϕ(t)) · |ϕ′ (t)| d t (8.2.128)
[a,b] [α,β]

Доказательство. Поскольку f интегрируема, по теореме 8.2.10 должна быть конечна величина


M = sup |f (x)|
x∈[a,b]

Далее, функция ϕ строго монотонна, значит она либо возрастает, либо убывает. Будем считать для
начала, что ϕ возрастает. Тогда
ϕ(α) = a, ϕ(β) = b, ϕ′ (x) > 0, x ∈ [α, β]
Рассмотрим произвольное разбиение τ = {t0 , ..., ti , ..., tk } отрезка [α, β] с выделенной системой точек
ζi ∈ [ti−1 , ti ]. Положив xi = ϕ(ti ) и ξi = ϕ(ζi ), мы получим разбиение отрезка [a, b], причем по
теореме Лагранжа 6.1.33, для некоторых точек ηi ∈ [ti−1 , ti ] будет выполняться равенство
∆xi = xi − xi−1 = ϕ(ti ) − ϕ(ti−1 ) = (6.1.34) = ϕ′ (ηi ) · (ti − ti−1 ) = ϕ′ (ηi ) · ∆ti
Если теперь взять ε > 0, то по теореме Кантора 4.3.32 найдется δ > 0 такое, что для любых
s, t ∈ [α, β] выполняется импликация:
ε
|s − t| < δ =⇒ |ϕ′ (s) − ϕ′ (t)| <
M · (β − α)
Поэтому если диаметр разбиения τ меньше δ, мы получим
X k
 Xk X k


f ϕ(ζi ) · |ϕ′ (ζi )| ·∆ti − f (ξi ) · ∆xi = f (ξi ) · ϕ′ (ζi ) − ϕ′ (ηi ) · ∆ti 6
| {z } | {z } |{z}
i=1 i=1 i=1
=
=
=

f (ξi ) ϕ′ (ζi ) ϕ′ (ηi ) · ∆ti

k
X Xk
ε
6 |f (ξi )| · ϕ′ (ζi ) − ϕ′ (ηi ) ·∆ti < M · · ∆ti = ε
| {z } | {z } M · (β − α) i=1
i=1
| {z }
>

>

supx∈[a,b] |f (x)| ε
=

M ·(β−α)
=

β−α
M

Это означает, что при стремлении к нулю диаметра разбиения τ отрезка [α, β] интегральные суммы
стремятся друг к другу:
k
X k
X

f ϕ(ζi ) · |ϕ′ (ζi )| · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1

С другой стороны, диаметр соответствующего разбиения ϕ(τ ) = {x0 , ..., xk } отрезка [a, b] тоже при
этом будет стремиться к нулю, потому что
diam ϕ(τ ) = max ∆xi = max ϕ′ (ηi ) · ∆ti 6 max ϕ′ (t) · max ∆ti = max ϕ′ (t) · diam τ −→ 0
i i t∈[α,β] i t∈[α,β] diam τ →0
P
Значит интегральные суммы ki=1 f (ξi ) · ∆xi должны стремиться к интегралу [a,b] f (x) d x, и мы
´

получаем:
Xk k
X

f ϕ(ζi ) · |ϕ′ (ζi )| · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1
| {z }
diam ϕ(τ )
↓ ↓
´ 0

[a,b]
f (x) d x
§ 2. Определенный интеграл 499

То есть
k
X 
ˆ
f ϕ(ζi ) · |ϕ′ (ζi )| · ∆ti −→ f (x) d x
diam τ →0 [a,b]
i=1
Остается рассмотреть случай, когда ϕ убывает. Тогда возрастающая последовательность
α = t0 < ... < ti < ... < tk = β
превращается в убывающую
b = x0 > ... > xi > ... > xk = a
Поэтому в интегральной сумме величину ∆xi нужно определять как разность xi−1 − xi , чтобы она
получилась положительной:
   
∆xi = − xi − xi−1 = − ϕ(ti ) − ϕ(ti−1 ) = (6.1.34) = −ϕ′ (ηi ) · (ti − ti−1 ) = −ϕ′ (ηi ) · ∆ti

Вдобавок, поскольку ϕ убывает, ее производная должна быть отрицательной


ϕ′ (t) 6 0 =⇒ |ϕ′ (ζi )| = −ϕ′ (ζi )
и в вычислениях мы получим
X k
 Xk X k


f ϕ(ζi ) · |ϕ′ (ζi )| ·∆ti − f (ξi ) · ∆xi = − f (ξi ) · ϕ′ (ζi ) − ϕ′ (ηi ) · ∆ti 6 ... < ε
| {z } | {z } |{z}
i=1 i=1 i=1
=
=
=

f (ξi ) −ϕ′ (ζi ) −ϕ′ (ηi ) · ∆ti

Таким образом, после взятия модуля ничто не меняется, и все рассуждения можно оставить преж-
ними.

(d) Формула Бонне


Преобразование Абеля.
Лемма 8.2.15. Для любых числовых последовательностей {an } и {bn }, p 6 n 6 q, справедливо
равенство
Xq q−1
X
an · b n = An · (bn − bn+1 ) + Aq · bq , p6q (8.2.129)
n=p n=p
где
N
X
AN = an
n=p

• Равенство (8.2.129) называется преобразованием Абеля9 , а неравенство (8.2.135) – нера-


венством Абеля.
Доказательство.
Ap −Ap + Ap+1 −Aq−2 + Aq−1 −Aq−1 + Aq
=

q
X z}|{ z }| { z }|{ z}|{
an · bn = ap ·bp + ap+1 ·bp+1 + ... + aq−1 ·bq−1 + aq ·bq =
n=p
= Ap bp + (−Ap + Ap+1 )bp+1 + ... + (−Aq−2 + Aq−1 )bq−1 + (−Aq−1 + Aq )bq =
= Ap bp − Ap bp+1 + Ap+1 bp+1 + ... −Aq−2 bq−1 + Aq−1 bq−1 − Aq−1 bq +Aq bq =
| {z } | {z } | {z } | {z }
=

Ap (bp − bp+1 ) Aq−1 (bq−1 − bq )


q−1
X
= An · (bn − bn+1 ) + Aq · bq
n=p


PN
(8.2.129) можно ввести третий параметр, число M < p, и тогда в обозначении AN = n=M an формула примет
более привычный вид:
Xq q−1
X
an · bn = An · (bn − bn+1 ) + Aq · bq − Ap−1 · bp ,
n=p n=p
500 Глава 8. ИНТЕГРАЛ

Лемма 8.2.16. Если числа


n
X
An = ai
i=p

удовлетворяют неравенствам
m 6 An 6 M, (8.2.130)
а числа bn неотрицательны и невозрастают

bp > bp+1 > ... > bn > bn+1 > ... > bq > 0, (8.2.131)

то
q
X
m · bp 6 an · b n 6 M · b p . (8.2.132)
n=p

Доказательство. Домножая (8.2.130) на bn − bn+1 > 0, мы получим неравенства

m · (bn − bn+1 ) 6 An · (bn − bn+1 ) 6 M · (bn − bn+1 ). (8.2.133)

Точно так же, домножая неравенство


m 6 Aq 6 M,
на число bq > 0, мы получим
m · bq 6 Aq · bq 6 M · bq . (8.2.134)
Отсюда, во-первых, получается цепочка

q
X q−1
X q−1
X
an · bn = (8.2.129) = An · (bn − bn+1 ) + Aq · bq > m · (bn − bn+1 ) + m · bq =
n=p n=p n=p

X
q−1   ↓ ↓ ↓ ↓↓ ↓ ↓ ↓ 
=m· (bn − bn+1 ) + bq =m· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +bq = m · bp .
n=p
| {z } | {z } | {z }
n=p n=p+1 n=q−1

И, во-вторых, цепочка

q
X q−1
X q−1
X
an · bn = (8.2.129) = An · (bn − bn+1 ) + Aq · bq 6 M · (bn − bn+1 ) + M · bq =
n=p n=p n=p

X
q−1   ↓ ↓ ↓
↓↓ ↓ ↓ ↓ 
=M· (bn − bn+1 ) + bq =M· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +bq = M · bp .
n=p
| {z } | {z } | {z }
n=p n=p+1 n=q−1

Лемма 8.2.17. Если {bn } – монотонная последовательность, то справедливо неравенство


q
X X N n o

an · bn 6 3 · max an · max |bp |, |bq | (8.2.135)
n=p p6N 6q
n=p

• Неравенство (8.2.135) называется неравенством Абеля.


Доказательство. Здесь можно считать, что {bn } невозрастает, потому что случай, когда она неубы-
вает, сводится к этому умножением {bn } на −1:

b1 > b2 > b3 > ... (8.2.136)

Обозначим N
X

A = max |AN | = max an (8.2.137)
p6N 6q p6N 6q
n=p

Тогда:
§ 2. Определенный интеграл 501
q q−1 q−1
X X X

an · bn = (8.2.129) = An · (bn − bn+1 ) + Aq · bq 6 |An | ·|bn − bn+1 | + |Aq | ·|bq | 6
n=p n=p n=p |{z} |{z}

>

>
(8.2.137)
A A
0

>
X
q−1 z }| { 
(8.2.136)
X
q−1 
6A· | bn − bn+1 | +|bq | = A · (bn − bn+1 ) + |bq | =
n=p
| {z } n=p

=
bn − bn+1

 ↓ ↓ ↓
↓↓ ↓ 
=A· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +|bq | =
| {z } | {z } | {z }
n=p n=p+1 n=q−1
= A · (bp − bq + |bq |) 6 A · (|bp | + |bq | + |bq |) 6 3 · A · max{|bp |, |bq |}

Формула Бонне. Ниже при доказательстве теоремы 9.1.37 нам понадобится следующее утвер-
ждение:
Теорема 8.2.18. Если f – интегрируемая, а g – монотонная функции на отрезке [a, b], то най-
дется точка ξ ∈ [a, b] такая, что
ˆ ˆ ˆ
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x (8.2.138)
[a,b] [a,ξ] [ξ,b]

• Равенство (8.2.138) называется формулой Бонне10 , а теорему 8.2.18 иногда называют вто-
рой теоремой о среднем для интеграла.
Для его доказательства нам, в свою очередь, понадобятся две леммы.
Лемма 8.2.19. Если f – интегрируемая, а g – неотрицательная невозрастающая функции на
отрезке [a, b], то
ˆ ˆ ˆ
g(a) · min f (x) d x 6 f (x) · g(x) d x 6 g(a) · max f (x) d x (8.2.139)
ξ∈[a,b] [a,ξ] [a,b] ξ∈[a,b] [a,ξ]

Доказательство. 1. Докажем сначала такую формулу:


n
X ˆ ˆ
g(xi−1 ) · f (x) d x −→ f (x) · g(x) d x (8.2.140)
[xi−1 ,xi ] diam τ →0 [a,b]
i=1

Для этого заметим, что функция f , будучи интегрирроуемой по Риману на [a, b], ограничена на
этом отрезке:
|f (x)| 6 C, x ∈ [a, b] (8.2.141)
Поэтому
n
X ˆ ˆ

g(xi−1 ) · f (x) d x − f (x) · g(x) d x =
[x ,x
i−1 i ] [a,b]
i=1 ˆ
X n X n ˆ X n ˆ  

= g(xi−1 ) · f (x) d x − g(x) · f (x) d x = g(xi−1 − g(x)) · f (x) d x 6

i=1 [xi−1 ,xi ] i=1 [xi−1 ,xi ] i=1 [xi−1 ,xi ]
X n ˆ Xn ˆ

6 g(xi−1 ) − g(x) · |f (x)| d x 6 C · g(xi−1 ) − g(x) d x =
i=1 [xi−1 ,xi ] [xi−1 ,xi ] |
i=1
{z }
6

x > xi−1 ⇒ g(xi−1 ) > g(x)


0
n ˆ
X   Xn ˆ  
=C· g(xi−1 ) − g(x) d x 6 C · g(xi−1 − g(xi )) d x =
i=1 [xi−1 ,xi ] | {z } i=1 [xi−1 ,xi ]
>

x 6 xi ⇒ g(x) > g(xi )


g(xi−1 ) − g(xi )

10 П.О.Бонне (1819-1892) – французский математик


502 Глава 8. ИНТЕГРАЛ

n 
X   X
n n
X 
=C· g(xi−1 ) − g(xi ) · ∆xi = C · g(xi−1 ) ·∆xi − g(xi ) ·∆xi =
| {z } | {z }
i=1 i=1 i=1
k k
sup g(x) inf g(x)
x∈[xi−1 ,xi ] x∈[xi−1 ,xi ]
| {z } | {z }
k k
Sτ sτ
(верхняя интегральная (нижняя интегральная
сумма Дарбу) сумма Дарбу)

= C · Sτ − s τ −→ 0
diam τ →0

2. Обозначим ˆ t
F (t) = f (x) d x, m = min F (ξ), M = max F (ξ).
a ξ∈[a,b] ξ∈[a,b]

Тогда по формуле (8.2.134),


n
X  
m · g(x0 ) 6 g(xi−1 ) · F (xi ) − F (xi−1 ) 6 M · g(x0 )
| {z } | {z }
i=1
k | {z } k
m · g(a) M · g(a)
Pn ´k
i=1 g(xi−1 ) · [xi−1 ,xi ]
f (x) d x
´ ↓ (8.2.140)
[a,b]
f (x) · g(x) d x

В пределе как раз получается формула (8.2.139):


ˆ
m · g(a) 6 f (x) d x 6 M · g(a).
[xi−1 ,xi ]

Лемма 8.2.20. Если f – интегрируемая, а g – неотрицательная невозрастающая функции на


отрезке [a, b], то найдется точка ξ ∈ [a, b] такая, что
ˆ ˆ
f (x) · g(x) d x = g(a) · f (x) d x (8.2.142)
[a,b] [a,ξ]

Доказательство. Если g(a) = 0, то (8.2.139) превращается в двойное неравенство


ˆ
06 f (x) · g(x) d x 6 0
[a,b]

из которого мы получаем
ˆ ˆ
f (x) · g(x) d x = 0 = g(a) · f (x) d x.
[a,b] [a,ξ]

Если же g(a) 6= 0, то поскольку g неотрицательна, это означает, что g(a) > 0, и поделив (8.2.139) на
число g(a), мы получим двойное неравенство
1
ˆ ˆ ˆ
min f (x) d x 6 · f (x) · g(x) d x 6 max f (x) d x (8.2.143)
ξ∈[a,b] [a,ξ] g(a) [a,b] ξ∈[a,b] [a,ξ]

Если обозначить ˆ t
F (t) = f (x) d x,
a
то (8.2.143) можно будет переписать так:
1
ˆ
min F (t) 6 · f (x) · g(x) d x 6 max F (t)
t∈[a,b] g(a) [a,b] t∈[a,b]

При этом по свойству 7◦ на с.492, F — непрерывная функция. Мы получаем, что число


1
ˆ
· f (x) · g(x) d x
g(a) [a,b]
§ 3. Формула Ньютона-Лейбница 503

лежит между некоторыми значениями mint∈[a,b] F (t) и mint∈[a,b] F (t) непрерывной функции F на
отрезке [a, b]. По теореме Коши о промежуточном значении 4.3.22, найдется точка ξ ∈ [a, b] такая,
что
1
ˆ
F (ξ) = · f (x) · g(x) d x.
g(a) [a,b]
Это и есть формула (8.2.142).

Доказательство теоремы 8.2.18. 1. Будем считать для начала, что g — неубывающая функция.
Рассмотрим функцию
G(x) = g(b) − g(x).
Она будет невозрастающей и неотрицательной функцией. Поэтому по лемме 8.2.20 найдется точка
ξ ∈ [a, b] такая, что ˆ ˆ
f (x) · G(x) d x = G(a) · f (x) d x
[a,b] [a,ξ]

Отсюда мы получаем цепочку:


ˆ ˆ
f (x) · G(x) d x = G(a) · f (x) d x
[a,b] [a,ξ]


 
ˆ ˆ
f (x) · g(b) − g(x) d x = g(b) − g(a) · f (x) d x
[a,b] [a,ξ]


ˆ ˆ ˆ ˆ
g(b) · f (x) d x − f (x) · g(x) d x = g(b) · f (x) d x − g(a) · f (x) d x
[a,b] [a,b] [a,ξ] [a,ξ]


ˆ ˆ ˆ ˆ
−g(b) · f (x) d x + f (x) · g(x) d x = −g(b) · f (x) d x + g(a) · f (x) d x
[a,b] [a,b] [a,ξ] [a,ξ]


ˆ ˆ ˆ ˆ
f (x) · g(x) d x = g(b) · f (x) d x − g(b) · f (x) d x +g(a) · f (x) d x
[a,b] [a,b] [a,ξ] [a,ξ]
| {z }
 k 
´ ´
g(b) · [a,b]
f (x) d x − [a,ξ]
f (x) d x

´ k
g(b) · [ξ,b]
f (x) d x


ˆ ˆ ˆ
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x.
[a,b] [a,ξ] [ξ,b]

2. Если g — невозрастающая функция, то мы можем рассмотреть функцию

G(x) = g(x) − g(a).

Она будет невозрастающей и неотрицательной функцией и те же самые рассуждения приведут нас


к тому же результату.

§3 Формула Ньютона-Лейбница
Между двумя независимыми на первый взгляд понятиями – производной и определенным интегра-
лом, – как оказывается, существует глубокая связь. Эта связь устанавливается знаменитой форму-
лой Ньютона-Лейбница, которая считается главной в интегральном исчислении. Здесь мы погово-
рим об этой формуле.
504 Глава 8. ИНТЕГРАЛ

(a) Основные результаты


Интеграл с переменным верхним пределом.
Теорема 8.3.1 (об интеграле с переменным верхним пределом). Пусть функция f непрерывна на
отрезке [a; b], тогда функция ˆ
F (x) = f (t) d t (8.3.144)
[a,x]

является гладкой11 на [a; b] и будет первообразной для f на [a; b]:


F ′ (c) = f (c), c ∈ [a, b]. (8.3.145)
! 8.3.2. В соответствии с определением производной на отрезке формулой (8.1.36), соотношение
(8.3.145) следует понимать так:
— для точек внутри отрезка [a; b] эта формула расшифровывается как равенство
!
1
ˆ ˆ
F ′ (c) = lim f (t) d t − f (t) d t = f (c), c ∈ (a; b) (8.3.146)
x→c x − c [a,x] [a,c]

— а на концах отрезка [a; b] имеются в виду односторонние производные:


1   1
ˆ ˆ ˆ
F+′ (a) = lim f (t) d t − f (t) d t = lim f (t) d t = f (a),
x→a+0 x − a [a,x] [a,a] x→a+0 x − a [a,x]
| {z }
k
0
(8.3.147)
1   1
ˆ ˆ ˆ
F−′ (b) = lim f (t) d t − f (t) d t = lim f (t) d t = f (b).
x→b−0 x − b [a,x] [a,b] x→b−0 b − x [x,b]
| {z }
´ k
− [x,b]
f (t) d t
(8.3.148)
Доказательство. Заметим сразу, что здесь достаточно доказать тождество (8.3.145), потому что
остальное – то есть утверждение, что функция F является гладкой – будет следовать из (8.3.145) и
того факта, что f непрерывна. В свою очередь (8.3.145) разбивается на условия (8.3.146)-(8.3.148),
и каждое нужно проверить. Зафиксируем для этого какую-нибудь точку c ∈ [a; b] и найдем в ней
производную функции F . Нам придется рассмотреть несколько случаев.
1. Пусть для начала точка c лежит внутри отрезка [a; b], то есть a < c < b. Чтобы найти
производную функции F (x) в точке c,
F (x) − F (c)
F ′ (c) = lim ,
x→c x−c
вычислим по отдельности правый и левый пределы в этой точке.
a) Пусть x > c, то есть a < c < x < b. Тогда
(ˆ )
F (x) − F (c) 1
ˆ
= f (t) d t − f (t) d t =
x−c x−c [a,x] [a,c]
(ˆ )
1
ˆ ˆ
= f (t) d t + f (t) d t − f (t) d t =
x−c [a,c] [c,x] [a,c]

1 1
ˆ
= · f (t) d t = · f (ξ) · (x − c) = f (ξ) −→ f (c)
x−c [c,x] x − c x→c+0
| {z } | {z }

=

(8.2.123)
f (ξ) · (x − c), ξ −→ c
x→c+0
ξ ∈ [c, x] ⇑
ξ ∈ [c, x]

Таким образом,
F (x) − F (c)
lim = f (c) (8.3.149)
x→c+0 x−c
11 Понятие гладкой функции на отрезке было определено на с.497.
§ 3. Формула Ньютона-Лейбница 505

b) Аналогично, если x < c, то есть a < x < c < b, то


(ˆ )
F (x) − F (c) 1
ˆ
= f (t) d t − f (t) d t =
x−c x−c [a,x] [a,c]
(ˆ !)
1
ˆ ˆ
= f (t) d t − f (t) d t + f (t) d t =
x−c [a,x] [a,x] [x,c]

1 1
ˆ
=− · f (t) d t =− · f (ξ) · (c − x) = f (ξ) −→ f (c)
x−c [x,c] x−c x→c−0
| {z } | {z }

=
(8.2.123)
f (ξ) · (c − x), ξ −→ c
x→c−0
ξ ∈ [x, c] ⇑
ξ ∈ [x, c]

Таким образом,
F (x) − F (c)
lim = f (c) (8.3.150)
x→c−0 x−c
Формулы (8.3.149) и (8.3.150) вместе дают

F (x) − F (c)
F ′ (c) = lim = f (c), c ∈ (a; b)
x→c x−c
2. Теперь рассмотрим случай, когда c = a. Тогда аналогично пункту a) получаем равенство

F (x) − F (a)
lim = f (a)
x→a+0 x−a

3. Остается случай, когда c = b, который нужно рассмотреть по аналогии с пунктом b), и тогда
получится формула
F (x) − F (b)
lim = f (b)
x→b−0 x−b

Формула Ньютона-Лейбница.

Теорема 8.3.3 (Ньютона-Лейбница). Пусть функция f непрерывна на отрезке [a; b] тогда для
любой ее первообразной Φ на этом отрезке выполняется равенство
ˆ
f (x) d x = Φ(b) − Φ(a) (8.3.151)
[a,b]

• Формула (8.3.151) называется формулой Ньютона-Лейбница.

Доказательство. Рассмотрим функцию


ˆ
F (x) = f (t) d t, x ∈ [a, b].
[a,x]

По теореме 8.3.1, она является первообразной для функции f на отрезке [a; b]. Значит, F и Φ – две
первообразные для одной и той же функции f на отрезке [a; b]. Поэтому, по свойству 20 на с.455,
эти функции отличаются друг от друга на какую-то константу:

F (x) = Φ(x) + C, x ∈ [a; b]

То есть, ˆ
f (t) d t = Φ(x) + C, x ∈ [a; b] (8.3.152)
[a,x]

Взяв x = a, мы получим ˆ
0= f (t) d t = Φ(a) + C,
[a,a]
506 Глава 8. ИНТЕГРАЛ

откуда
C = −Φ(a),
поэтому, подставив это в (8.3.152), получаем
ˆ
f (t) d t = Φ(x) − Φ(a), x ∈ [a; b]
[a,x]

и, если сюда подставить x = b, то получится как раз (8.3.151).

Если знать первообразную функции f на равна


отрезке [a, b], то формуда Ньютона-Лейбница
позволяет сразу же вычислить интеграл
ˆ
´
f (x) d x, который, как мы говорили выше, S = sin x d x = (8.1.57) =
[a,b] [0,π]
интерпретируется как площадь фигуры под гра- π

фиком функции, то есть фигуры, описываемой = − cos x + C = − cos π − (− cos 0) = 2.
0
условиями (
a6x6b ⋄ 8.3.6. Поучительно было бы найти площадь
0 6 y 6 f (x). какой-нибудь известной фигуры, например, кру-
га, с помощью теоремы Ньютона-Лейбница, и
⋄ 8.3.4. Например, площадь фигуры убедиться, что при этом получается ответ, кото-
(
06x61 рый дает школьная геометрия. В качестве при-
мера найдем интеграл
0 6 y 6 x2 .
ˆ 1p
1 − x2 d x
y −1

y = x2
1 (то есть площадь полукруга радиуса 1).

0 x 1
1

равна
ˆ
x3 1 1 x

S= x2 d x = (8.1.53) = + C = . −1 1
[0,1] 3 0 3
⋄ 8.3.5. Площадь фигуры, ограниченной аркой
синусоиды Здесь используется формула (8.1.78), кото-
(
06x6π рую мы вывели раньше. Подставляя ее в теорему
Ньютона-Лейбница, мы получаем:
0 6 y 6 sin x.
ˆ 1p
y 1 − x2 d x = (8.1.78) =
−1
1 p  x=1
1 y = sin x
= x 1 − x2 + arcsin x =
2 x=−1
x 1 
1 π π π
0 = (arcsin 1 − arcsin(−1)) = + =
2 2 2 2 2
Видно, что ответ здесь такой же, какой ожида-
ешь: площадь полукруга радиуса 1 равна π2 .

(b) Интеграл по ориентированному отрезку и вычисления


§ 3. Формула Ньютона-Лейбница 507

⋄ 8.3.7. В физике часто встречаются величи- а если в противоположную сторону, от b к a, зна-


ны, представляющие собой интегралы, у кото- чение A будет противоположно по знаку:
рых значения зависят от направления, в котором
происходит интегрирование. Например, если мы
ˆ
A=− F (x) d x.
перемещаем некое тело по отрезку [a, b], причем в [a,b]
каждой точке x ∈ R на это тело действует некая
сила F (x), то работа A этой силы, которая рав- Чтобы учесть эти детали, в анализе вводится по-
на интегралу от F по отрезку [a, b], формально нятие ориентированного отрезка и интеграла по
зависит от того, в каком направлении мы это те- нему. Интересное наблюдение состоит в том, что,
ло перемещаем. Если мы двигаемся из точки a в хотя это нововведение представляет собой над-
точку b, то у нас получится число стройку над основной конструкцией интеграла
ˆ
Римана, вычисления интегралов при этом упро-
A= F (x) d x,
[a,b] щается.

Ориентированные отрезки в R.
• Ориентированным отрезком на прямой R называется произвольная пара чисел (a, b),
a, b ∈ R (здесь важно, какое из чисел стоит на первом месте, а какое на втором: пары (a, b)
и (b, a) считаются разными). Чтобы не путать такую пару (a, b) и интервалом (a, b) = {x ∈
R : a < x < b}, вводится специальное обозначение:
−→
a; b = (a, b)
−→
Этому объекту приписывается некий геометрический образ: считается, что a; b представ-
ляет собой обычный отрезок с концами a и b, относительно крайних точек которого a и
b имеется соглашение, что a в этой паре служит началом, а b концом (при этом, необяза-
тельно, чтобы a 6 b, возможно и наоборот, a > b).
• Частный случай, когда a = b, также считается ориентированным отрезком, в котором
конец и начало совпадают, и такой ориентированный отрезок называется вырожденным.
−→ −→
• Носителем [a; b] ориентированного отрезка a; b называется тот же самый отрезок, но уже
обычный, неориентированный (то есть такой, у которого мы “забыли”, какая из его край-
них точек была началом, а какая концом). Понятно, что


[a, b], a < b
−→
[a; b] = {a}, a = b


[b, a], a > b
−→ −→
• Суммой ориентированных отрезков a; b и b; c называется ориентированный отрезок −
a;→c:
−→ −→
a; b ⊕ b; c := −
a;→c (8.3.153)

(подразумевается, что сумма определена только если конец предыдущего отрезка совпа-
дает с началом следующего).
−→ −→
• Противоположным отрезком к отрезку a; b называется отрезок b; a, и обозначается он
−→
символом ⊖a; b:
−→ −→
⊖a; b := b; a (8.3.154)
−→ −→ −→ −→
Сумму вида − a;→c ⊕ (⊖b; c) = −
a;→c ⊕ c; b = a; b принято записывать как −
a;→c ⊖ b; c и называть
−→ −→
разностью ориентированных отрезков a; c и b; c:
− −→ −→ −→ −→
a;→c ⊖ b; c := −
a;→c ⊕ (⊖b; c) = −
a;→c ⊕ c; b = a; b (8.3.155)
508 Глава 8. ИНТЕГРАЛ

−→
⋄ 8.3.8. Запись 0; 1 означает отрезок [0; 1], в ко- му
−→ −→
тором 0 считается началом, а 1 концом. Наобо- 1; 0 = ⊖0; 1
−→
рот, 1; 0 означает отрезок [0, 1], но в котором 0
считается концом, а 1 началом. Носители у этих ⋄ 8.3.9. Очевидно, справедливы равенства:
отрезков одинаковы −→ −→ −→
0; 1 ⊕ 1; 2 = 0; 2
−→ −→
[0; 1] = [0; 1] = [1; 0] −→ −→ −→
0; 2 ⊖ 1; 2 = 0; 1
−→ −→ −→
но ориентация у них противоположная, и поэто- 0; 1 ⊖ 2; 1 = 0; 2

Интеграл по ориентированному отрезку.


• Говорят, что числовая функция f определена (интегрируема, непрерывна, гладка) на ори-
−→
ентированном отрезке a; b, если она определена (интегрируема, непрерывна, гладка) на его
−→
носителе [a; b]. При этом
−→
— скачком функции f на ориентированном отрезке a; b называется число
x=b

f (x) := f (b) − f (a) (8.3.156)
x=a
−→
— интегралом функции f по ориентированному отрезку a; b, или анизотропным
−→
интегралом по a; b, называется число
ˆ b (´
[a,b] f (x) d x, a6b
f (x) d x := ´ (8.3.157)
a − [b,a] f (x) d x, b < a

Свойства интеграла по ориентированному отрезку:


10 . Интеграл по вырожденному ориентированному отрезку: интеграл по вырожден-
ному ориентированному отрезку равен нулю:
ˆ a
f (x) d x = 0 (8.3.158)
a

20 . Линейность: интеграл от линейной комбинации функций равен линейной комбинации


интегралов
ˆ b  ˆ b ˆ b
α · f (x) + β · g(x) d x = α · f (x) d x + β · g(x) d x (8.3.159)
a a a

3 . Аддитивность: интеграл по сумме ориентированных отрезков равен сумме интегралов


0

по этим отрезкам:
ˆ b ˆ c ˆ c
f (x) d x + f (x) d x = f (x) d x (8.3.160)
a b a
а интеграл по разности равен разности интегралов:
ˆ c ˆ b ˆ c
f (x) d x − f (x) d x = f (x) d x (8.3.161)
a a b
−→
40 . Теорема о среднем: если функция f непрерывна на отрезке a; b, то найдется такая
−→
точка ξ ∈ a; b, что
ˆ b
f (x) d x = f (ξ) · (b − a) (8.3.162)
a
5◦ Формула Ньютона-Лейбница: интеграл от непрерывной функции по ориентирован-
ному отрезку равен скачку ее (произвольной) первообразной на этом отрезке:
ˆ b x=b

f (x) d x = Φ(x) (8.3.163)
a x=a
§ 3. Формула Ньютона-Лейбница 509

6◦ Формула Бонне: если f – интегрируемая, а g – монотонная функции на ориентиро-


−→ −→
ванном отрезке a; b, то найдется точка ξ ∈ a; b такая, что
ˆ b ˆ ξ ˆ b
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x (8.3.164)
a a ξ

Доказательство. 1. Первое свойство следует из (8.2.114):


ˆ a ˆ
f (x) d x = f (x) d x = (8.2.114) = 0.
a [a;a]

2. Второе свойство следует из (8.2.115), и для его доказательства нужно просто рассмотреть два
случая взаимного расположения точек a и b на прямой. Если a 6 b, то
ˆ b   ˆ  
α · f (x) + β · g(x) d x = (8.3.157) = α · f (x) + β · g(x) d x = (8.2.115) =
a [a,b]
ˆ ˆ ˆ b ˆ b
= α· f (x) d x + β · g(x) d x = (8.3.157) = α · f (x) d x + β · g(x) d x
[a,b] [a,b] a a

А если a > b, то
ˆ b   ˆ  
α · f (x) + β · g(x) d x = (8.3.157) = − α · f (x) + β · g(x) d x = (8.2.115) =
a [b,a]
ˆ ˆ ˆ b ˆ b
= −α · f (x) d x − β · g(x) d x = (8.3.157) = α · f (x) d x + β · g(x) d x
[b,a] [b,a] a a

3. Равенство (8.3.160) эквивалентно (8.3.161) и следует из (8.2.116). Оно доказывается тем же


приемом: нужно рассмотреть несколько вариантов расположения точек a, b и c. В простейшем
случае, если a < b < c, мы получаем:
ˆ b ˆ c ˆ ˆ
f (x) d x + f (x) d x = (8.3.157) = f (x) d x + f (x) d x = (8.2.116) =
a b [a,b] [b,c]
ˆ ˆ c
= f (x) d x = (8.3.157) = f (x) d x
[a,c] a

В случае, если, например, a < c < b, мы получаем:


ˆ b ˆ c ˆ ˆ
f (x) d x + f (x) d x = (8.3.157) = f (x) d x − f (x) d x = (8.2.116) =
a b [a,b] [c,b]
ˆ ˆ c
= f (x) d x = (8.3.157) = f (x) d x
[a,c] a

И в таком духе. Остальные варианты мы предлагаем читателю проверить самостоятельно.


4. Свойство 4◦ следует из (8.2.123): если a < b, то
ˆ b ˆ
f (x) d x = f (x) d x = (8.2.123) = f (ξ) · (b − a)
a [a,b]

Если же a > b, то
ˆ b ˆ
f (x) d x = − f (x) d x = (8.2.123) = −f (ξ) · (a − b) = f (ξ) · (b − a)
a [b,a]

5. Свойство 5◦ следует из (8.3.151): если a 6 b, то


ˆ b ˆ x=b

f (x) d x = (8.3.157) = f (x) d x = (8.3.151) = Φ(b) − Φ(a) = (8.3.156) = Φ(x)
a [a,b] x=a

Если же a > b, то
510 Глава 8. ИНТЕГРАЛ
ˆ b ˆ
f (x) d x = (8.3.157) = − f (x) d x = (8.3.151) =
a [b,a]
  x=b

= − Φ(a) − Φ(b) = Φ(b) − Φ(a) = (8.3.156) = Φ(x)
x=a

6. Свойство 6◦ следует из (8.2.138): если a < b, то по теореме 8.2.18 для некоторой точки ξ ∈ [a, b]
выпоняется равенство
ˆ ˆ ˆ
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x
[a,b] [a,ξ] [ξ,b]
| {z } | {z } | {z }
´b ´ξ ´b
a
f (x)·g(x) d x g(a)· a
f (x) d x g(b)· ξ
f (x) d x

Если же a > b, то по теореме 8.2.18 для некоторой точки ξ ∈ [b, a] должно выполняться равенство
ˆ ˆ ˆ
f (x) · g(x) d x = g(b) · f (x) d x + g(a) · f (x) d x.
[b,a] [b,ξ] [ξ,a]

Умножив это на −1, получим:


ˆ ˆ ˆ
− f (x) · g(x) d x = −g(b) · f (x) d x −g(a) · f (x) d x
[b,a] [b,ξ] [ξ,a]
| {z } | {z }| {z }
´b ´b ´ξ
a
f (x)·g(x) d x g(b)· ξ
f (x) d x g(a)· a
f (x) d x

⋄ 8.3.10. ⋄ 8.3.11.
4 √ ˆ 4 
1+ x 1 1
ˆ
π
d x = + √ dx = ˆ 2
1 x2 1 x2 x· x (1 + 2 cos x − sin x) d x = (8.3.159) =
ˆ 4 ˆ 4 0
3
−2
= (8.3.159) = x dx + x− 2 d x = ˆ π
2
ˆ π
2
ˆ π
2
1 1 = 1 dx + 2 · cos x d x − sin x d x =
1 x=4 1 x=4 0
π2 π2 π2
0 0
= (8.1.53) = − − √ = π
x x=1 2 x x=1 = x + 2 sin x − cos x = + 2 − 1 =
1 1 1 0 0 0 2
= − + 1 − + = 1. π
4 4 2 = + 1.
2

Интегрирование вдоль гладкой функции.


• Если f – интегрируемая функция, а g – гладкая функция на ориентированном отрезке
−→ −→
a; b, то интегралом от функции f вдоль функции g по ориентированному отрезку a; b
называется число ˆ ˆ b b
f (x) d g(x) := f (x) · g ′ (x) d x (8.3.165)
a a

В частном случае, когда f (x) = 1, это число обозначается также


ˆ b ˆ b
d g(x) := g ′ (x) d x (8.3.166)
a a

−→
⋄ 8.3.12 (интеграл по пути). Физический смысл R в зависимости от времени: для всякого x ∈ a; b
интеграла вдоль функции состоит в том, что под число g(x) представляет собой координату тела
ним понимается интегрирование по пути. Пред- на R в момент времени x (то есть, в частности,
−→
ставьте себе ситуацию, когда функция g : [a; b] → в начальный момент времени x = a координа-
R описывает положение некоего тела на прямой та нашего тела была g(a), а в конечный момент
§ 3. Формула Ньютона-Лейбница 511

времени x = b она была g(b)). И представим се- ся измерение). Тогда работа силы f по перемеще-
−→ нию нашего тела из точки g(a) в точку g(b) будет
бе, что для всякого x ∈ a; b число f (x) представ-
ляет собой силу, действующую на наше тело в равна интегралу от функции f вдоль функции g
−→
момент времени x (то есть в нашей задаче си- по ориентированному отрезку a; b
ла, действующая на тело, формально зависит
не от положения этого тела в пространстве,
ˆ b

а от момента времени, в который производит- A= f (x) d g(x).


a

Теорема 8.3.13 (о скачке гладкой функции). Скачок гладкой функции g на ориентированном


−→
отрезке a; b равен интегралу от единицы вдоль g по этому отрезку:
ˆ b ˆ b x=b

d g(x) = g ′ (x) d x = g(x) (8.3.167)
a a x=a

Доказательство. Это следует из формулы Ньютона-Лейбница (8.3.163), если положить f = g ′ ,


Φ = g.

Следствие 8.3.14. Функция g : [a, b] → R является гладкой тогда и только тогда, когда она пред-
ставима в виде интеграла с переменным верхним пределом от некоторой непрерывной функции
f : [a, b] → R:
ˆ x
g(x) = g(a) + f (t) d t
a

Доказательство. В качестве f нужно взять производную g ′ функции g, доопределенную произ-


вольным образом в точках недифференцируемости g.

В вычислениях удобно переход от левой части и говорим при этом, что "вносим g ′ (x) под знак
к правой и наоборот в формуле (8.3.165) оформ- дифференциала".
лять специальной записью и сопровождать под-
ходящей речевой конструкцией. В качестве за-
писи в таких случаях используется стрелка над ⋄ 8.3.15. В этом пункте нам нужны примеры,
формулой, а речевых конструкций придумано иллюстрирующие формулу (8.3.165) как опреде-
две: "вынесение из-под знака дифференциала"и ление интеграла вдоль гладкой функции, поэто-
"внесение под знак дифференциала". Именно, му в вычислениях здесь мы будем выносить вы-
если нам нужно в (8.3.165) перейти от левой ча- ражения из-под знака дифференциала:
сти к правой, то мы рисуем стрелку от выраже-
ния под дифференциалом в пространство перед ˆ 1 ˆ 1
ним, x3
d x5 = x3 · 5x4 d x =
ˆ b ˆ b 0 0
f (x) d g(x) = f (x) · g ′ (x) d x, 1
5 8 x=1 5
 ˆ
a a =5 x7 d x = x =
0 8 x=0 8
и говорим при этом, что "выносим g(x) из-под
знака дифференциала". А если наоборот, нам
нужно в (8.3.165) перейти от правой части к ле- ⋄ 8.3.16. Еще один такой же пример:
вой (такое тоже часто бывает нужно, см. приме-
ры, начиная с 8.3.20), то мы рисуем стрелку от
нужного выражения в пространство после знака ˆ π ˆ π
дифференциала, cos x d sin x =
 cos2 x d x =
0 0
ˆ b ˆ b ˆ π
1 + cos 2x 1 1 π π
′ 
f (x) · g (x) d x = f (x) d g(x), = d x = · x + · sin 2x =
a a 0 2 2 4 0 2
512 Глава 8. ИНТЕГРАЛ

Теорема о замене переменной в определенном интеграле по ориентированному отрезку.


Теорема 8.2.14 о замене переменной в определенном интеграле очень красиво формулируется и
доказывается для интегралов по ориентированным отрезкам.
−−→
• Говорят, что функция ϕ является преобразованием ориентированного отрезка α; β в ори-
−→
ентированный отрезок a; b, и обозначают это записью
−−→ −→
ϕ : α; β → a; b, (8.3.168)

если
−−→ −→
(i) ϕ гладко отображает носитель α; β в носитель a; b:
−−→ −→
ϕ : [α; β] → [a; b] (8.3.169)
−−→
(это, в частности, означает, что для всякого t ∈ [α; β] значение ϕ(t) лежит в
−→
[a; b]);
(ii) ϕ сохраняет ориентацию в следующем смысле:

ϕ(α) = a, ϕ(β) = b (8.3.170)

−−→
⋄ 8.3.17. Функция не будет преобразованием отрезка 0; 3π
2 в отрезок
−→
ϕ(t) = cos t 1; 0, хотя она по-прежнему гладкая, и сохраняет
ориентацию этих отрезков:
является преобразованием ориентированного от-
−→ −−−→ 3π
резка 0; π в ориентированный отрезок 1; −1: cos 0 = 1, cos =0
2
−→ −−−→
cos : 0; π → 1; −1
Дело в том, что эта функция не будет отображе-
потому что она гладко отображает носитель пер- нием носителя первого отрезка в носитель вто-
вого отрезка в носитель второго рого:
−→ −−−→ "−−−→#  
cos : [0; π] = [0, π] → [−1; 1] = [1; −1] 3π 3π  −→
cos : 0; = 0, −→[0; 1] = [1; 0]
и сохраняет ориентацию: 2 2

cos 0 = 1, cos π = −1.  


потому что, например, в точке t = π ∈ 0, 3π
2 ее
⋄ 8.3.18. Но та же функция значения вылезают из отрезка [0; 1]:

ϕ(t) = cos t cos π = −1 ∈


/ [0; 1].

Теорема 8.3.19 (о замене переменной в определенном интеграле по ориентированному отрезку).


Пусть даны
−−→ −→
(i) преобразование ϕ ориентированного отрезка α; β в ориентированный отрезок a; b (удо-
влетворяющее условиям (8.3.169) и (8.3.170)), и
−→
(ii) функция f , непрерывная на ориентированном отрезке a; b;
тогда ˆ b ˆ β ˆ β
f (x) d x = f (ϕ(t)) d ϕ(t) = f (ϕ(t)) · ϕ′ (t) d t (8.3.171)
a α α
−→
Доказательство. Пусть F – первообразная функции f на отрезке [a; b]:
−→
F ′ (x) = f (x), x ∈ [a; b] (8.3.172)

(такая первообразная существует, например, по теореме 8.3.1).


§ 3. Формула Ньютона-Лейбница 513

−−→
Тогда композиция F ◦ϕ будет первообразной для функции (f ◦ϕ)·ϕ′ , на отрезке [α; β], по формуле
(6.1.28):
−−→
(F ◦ ϕ)′ (t) = F ′ ( ϕ(t) ) · ϕ′ (t) = f (ϕ(t)) · ϕ′ (t), t ∈ [α; β] (8.3.173)
|{z}


−→
[a; b]
k
D(F ′ )

Поэтому
ˆ β t=β  

f (ϕ(t)) · ϕ′ (t) d t = (8.3.163) = (F ◦ ϕ)(t) =F ϕ(β) −F ϕ(α) =
α t=α | {z } | {z }

=
(8.3.170) (8.3.170)
b a
ˆ b
= F (b) − F (a) = (8.3.163) = f (x) d x
a

3 ˆ 3 2
(t2 − 1) d(t2 − 1) (t − 1) · 2t d t
ˆ
В противоположность примерам на с.511 те-
= = =
перь оказывается полезным вносить под знак 2 t 2 t
дифференциала. ˆ 3  3 
t t=3
=2 (t2 − 1) d t = 2 · −t =
⋄ 8.3.20. 2 3 t=2
  
ˆ 2 ˆ 2 8 32
x2 1 2 = 2 (9 − 3) − −2 =
ex · 2x d x =

x · e dx = · 3 3
0 2 0

1 2 x2 x = t, t = x2
ˆ
= 2
e dx = −→ −→ = ⊲⊲ 8.3.23. Найдите определенные интегралы:
2 0 x ∈ 0; 2 ⇔ t ∈ 0; 4 ´1√
1) 0 4 − x2 d x
1 4 t 1 4 e4 − 1 ´ ln 5 x √ x
ˆ
= e d t = et = 2) 0 e exe+3−1 d x
2 0 2 0 2 ´a
3) 02 √adx2 −x2
⋄ 8.3.21. ´1 √
4) 0 x2 1 − x2 d x
ˆ π4 π
sin x
ˆ 4 ´ 1 dx
tg x d x = dx = 5) 0 ex +e −x

0 0 cos x ´ π2
ˆ π4  ˆ π4 6) 0 1+sindx x+cos x
− sin x d x d cos x ´π
=− dx = − = 7) 04 1+2dx
0 cos x 0 cos x sin2 x

x = arccos t, t = cos x ˆ 12
dy
− − → ⊲⊲ 8.3.24. Найдите определенные интегралы:
= −−→π 1 = − = ´1√
x ∈ 0; 4 ⇔ t ∈ 1; 2 1 y 1) 0 1 + x d x
21 1
´π

= − ln |y| = − ln + ln 1 = ln 2 2) 02 sin3 x d x
1 2 ´1
3) 0 (xx2 +1)
dx
3
⋄ 8.3.22. Иногда, однако, бывает удобно сразу ´ e 1+ln x
4) 1 x d x
заменять переменную, не внося ничего под знак ´ − π cos3 x
дифференциала: 5) − π4 √ 3
sin x
dx
´ 1 2 dx
ˆ 4 √ 7) 0 x2 +4x+5
x dx 1 + x = t, x = t2 − 1
√ = −→ −→ = ´1 dx
1 1+ x x ∈ 1; 4 ⇔ t ∈ 2; 3 8) 0 √3+2x−x 2

Интегрирование по частям.

Теорема 8.3.25 (об интегрировании по частям). Если f и g – гладкие функции на ориентирован-


−→
ном отрезке a; b, то
ˆ b x=b ˆ b

f (x) d g(x) = f (x) · g(x) − g(x) d f (x) (8.3.174)
a x=a a
514 Глава 8. ИНТЕГРАЛ

Доказательство.
ˆ b ˆ b ˆ b ˆ b
f (x) d g(x) + g(x) d f (x) = (8.3.165) = f (x) · g ′ (x) d x + g(x) · f ′ (x) d x = (8.3.159) =
a a a a
ˆ b   ˆ b x=b x=b

= f (x) · g ′ (x) + f ′ (x) · g(x) dx = (f ·g)′ (x) d x = (8.3.167) = (f ·g)(x) = f (x)·g(x)
a | {z } a x=a x=a

=
(f · g)′ (x)


´b
(переносим a
g(x) d f (x) направо)
ˆ b x=b ˆ b

f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
a x=a a

⋄ 8.3.26. обозначим его какой-нибудь буквой, например,


ˆ e x=e ˆ π

ln x d x = (8.3.174) = x · ln x − I= ex cos x d x.
1 x=1
0
ˆ e x=e ˆ e 1

− x d ln x = x · ln x − x · dx = Тогда, дважды применяя интегрирование по ча-
1 x=1 1 x
x=e ˆ e x=e x=e стям, можно получить следующую цепочку, на-
чинающуюся с I и в итоге снова возвращающу-
= x · ln x − 1 d x = x · ln x − x =
x=1 1 x=1 x=1 юся к I, но так, что из полученной формулы I
= e · ln e − 1 · ln 1 − (e − 1) = 1 можно выразить:
⋄ 8.3.27. ˆ π ˆ π
ex cos x d x = cos x d ex = (8.3.174) =

ˆ 2 ˆ 2
I=
0
ex x d x =

x d ex = (8.3.174) = π ˆ 0π
0 0

x
x=2 ˆ 2 x=2 x=2 = cos x · e − ex  d cos x =
| {z 0}
0
= x · ex − ex d x = x · ex − ex =
x=0 0 x=0 x=0 k
2 0 2 0 2 eπ − 1
= 2 · e − 0 · e − (e − e ) = e + 1 ˆ π
π
ex sin x d x =

⋄ 8.3.28. Повторное интегрирование по частям: =e −1+
ˆ 2 ˆ 2 ˆ π 0
x 2 
e x dx = x d ex = (8.3.174) = = eπ − 1 + sin x d ex = (8.3.174) =
0 0 0
x=2 ˆ 2 π ˆ π
π

x
= x2 · ex − ex
d x2 = = e − 1 + sin x · e − ex  d sin x =
x=0 0 0
| {z } 0
| {z }
k k
4e2 0
ˆ 2 ˆ π
= 4e2 − ex 2x d x =
 = eπ − 1 − ex cos x d x = eπ − 1 − I
0 0
ˆ 2
= 4e2 − 2 x d ex = (8.3.174) = Итогом этих вычислений будет равенство
0
x=2 ˆ 2 I = eπ − 1 − I,
2 x
= 4e − 2x · e +2 ex d x =
| {z } x=0 0 из которого I выражается формулой
k
4e2 eπ − 1
I= .
x=2 2

= 2ex = 2 · e2 − 2
x=0 ⊲⊲ 8.3.30. Найдите определенные интегралы:
⋄ 8.3.29. Следующий прием называется "воз- ´1 ´2
вращением к исходному интегралу". Чтобы со- 1) 0 arctg x d x 4) 1 x ln x d x
´π 3
считать интеграл ´1 5) 0 x sin x d x
2) xe−x d x ´π
ˆ π 0 6) 0 ex sin x d x
ex cos x d x, 3)
´ 1
2
arcsin x d x
´π
7) 02 e2x cos x d x
0 0
§ 3. Формула Ньютона-Лейбница 515
π
Использование рекуррентных соотноше-
ˆ 2
+ (n − 1) · sinn−2 x · cos2 x d x =
ний. 0
ˆ π
⋄ 8.3.31. Некоторые определенные интегралы = (n − 1) ·
2
sinn−2 x · (1 − sin2 x) d x =
вычисляются с помощью рекуррентных соотно- 0
шений. Например, следующие равенства12: = (n − 1) · In−2 − (n − 1) · In
π π

ˆ 2
ˆ 2
n
sin x d x = cosn x d x =
0
( 0 n−1
(n−1)!! π ∗
· In−2
In =
n!! · 2, n ∈ 2N − 1 n
= (n−1)!! (8.3.175)
n!! , n ∈ 2N∗ Теперь для n = 0 получаем:
ˆ π2
(напомним, что двойной факториал n!! был опре- π
I0 = dx =
делен формулами (3.2.99) и (3.2.100)). Сначала 0 2
проверим, что эти интегралы совпадают:
и поэтому при n = 2k,
ˆ π2 x = π
− y
2
sinn x d x = x = 0 ⇔ y = π2 = 2k − 1 (2k − 1) · (2k − 3)
0 x = π ⇔ y = 0 I2k = ·I2k−2 = ·I2k−4 =
2 2k 2k · (2k − 2)
ˆ 0 π  π  (2k − 1) · (2k − 3) · ... · 1 (2k − 1)!! π
= sinn −y d −y = = ... = ·I0 = ·
π 2 2 2k · (2k − 2) · ... · 2 (2k)!! 2
2
ˆ 0 ˆ π2
n А для n = 1 получаем:
=− cos y d y = cosn y d y
π
2 0 ˆ π2 π1

После этого выведем рекуррентную формулу: I1 = sin x d x = − cos x = 1,
0 0
π π
поэтому при n = 2k + 1,
ˆ 2
ˆ 2
In = sinn x d x = sinn−1 x d(− cos x) =
0 0
π2 2k 2k · (2k − 2)
n−1 I2k+1 = ·I2k−1 = ·I2k−3 =
= − sin x · cos x + 2k + 1 (2k + 1) · (2k − 1)
0
| {z }
(2k) · (2k − 2) · ... · 2 (2k)!!
=

= ... = ·I1 =
0 (2k + 1) · (2k − 1) · ... · 1 (2k + 1)!!

(c) Интегрирование кусочно-непрерывных и кусочно-гладких функций


Интегралы, с которыми нам придется иметь дело в дальнейшем, будут, как правило, интегралами
от непрерывных функций, возможно, вдоль гладких функций. Однако в главе 12, где речь пойдет
о рядах Фурье, а также в главе 7, где будут изучаться асимптотики, нам придется интегрировать
функции из несколько более широкого класса, а именно, кусочно-непрерывные функции, возможно,
вдоль непрерывных кусочно-гладких функций. В этом пункте мы поговорим о таких интегралах.

Кусочно-непрерывные функции.
• Функция f на отрезке [a, b] называется кусочно-непрерывной, если
1) на [a, b] функция f непрерывна во всех точках, кроме, возможно, конечного
набора;
2) в каждой точке разрыва c ∈ R функция f имеет конечные левый и правый
предел
f (c − 0) = lim f (x), f (c + 0) = lim f (x) (8.3.176)
x→c−0 x→c+0

Теорема 8.3.32. Функция f кусочно-непрерывна на отрезке [a, b] тогда и только тогда, когда су-
ществует разбиение τ = {c0 , ..., ck } этого отрезка такое, что на каждом отрезке [ci−1 , ci ] можно
определить непрерывную функцию ϕi , совпадающую с f на интервале (ci−1 , ci ):

f (x) = ϕi (x), x ∈ (ci−1 , ci )


12 Равенства (8.3.175) понадобятся нам на с.532 при доказательстве формулы Валлиса.
516 Глава 8. ИНТЕГРАЛ

Доказательство. Занумеруем по возрастанию точки разрыва функции f и добавим к ним, если


этого не произошло сразу, концы отрезка [a, b]. У нас получится некоторое разбиение:

a = c0 < c1 < ... < ck = b

На всяком отрезке [ci−1 , ci ] формула




f (x), x ∈ (ci−1 , ci )
ϕi (x) = f (ci−1 + 0), x = ci−1


f (ci − 0), x = ci

определяет непрерывную функцию ϕi , совпадающую с f на интервале (ci−1 , ci ).

⊲ 8.3.33. Проверьте, что функция не является кусочно-непрерывной, например, на


отрезке [0, 1], потому что имеет на нем бесконеч-
f (x) = sgn sin x 1
ное число точек разрыва (x = πn ).
имеющая график
⊲ 8.3.35. Функция
y (
1 1
x 6= 0
f (x) = x,
0, x=0
−π π x
с графиком
y
−1

1
y= x
является кусочно-непрерывной на любом отрез-
ке [a, b]. 0 x
⊲ 8.3.34. Наоборот, функция
(
sgn sin x1 , x 6= 0
f (x) =
0, x = 0
с графиком
y
тоже не будет кусочно-непрерывной на отрезке
1 [0, 1], потому что имеет бесконечный предел в
точке 0.
− π1 1
− 2π 1
− 3π 1

1

1
π
x

−1

Теорема 8.3.36. Всякая кусочно-непрерывная функция f на отрезке [a, b] интегрируема на нем.

Для доказательства теоремы 8.3.36 нам понадобится следующая

Лемма 8.3.37. Пусть функции f и ϕ определены на отрезке [a, b] и совпадают на интервале


(a, b):
f (x) = ϕ(x), x ∈ (a, b)
Тогда если ϕ интегрируема на отрезке [a, b], то и f интегрируема на [a, b], причем
ˆ b ˆ b
f (x) d x = ϕ(x) d x
a a
§ 3. Формула Ньютона-Лейбница 517

Доказательство. Заметим сразу, что обе функции f и ϕ должны быть ограничены на [a, b]: функ-
ция ϕ ограничена по теореме 8.2.10, как интегрируемая на [a, b], а функция f отличается от нее не
более чем в двух точках. Мы можем даже считать, что они ограничены одной константой:

sup |f (x)| 6 M, sup |ϕ(x)| 6 M


x∈[a,b] x∈[a,b]

Теперь для произвольных разбиений τ отрезка [a; b] и выделенных точек ξi мы получим:

интегральная интегральная
сумма для f сумма для ϕ
z }| { z }| {
X k X k

f (ξi ) · ∆xi − ϕ(ξi ) · ∆xi =

i=1 i=1
| {z }
diam τ
↓ ↓
0
´b
a
ϕ(x) d x
   
k−1
X k−1
X

= f (ξ1 ) · ∆x1 + f (ξi ) · ∆xi + f (ξk ) · ∆xk − ϕ(ξ1 ) · ∆x1 + ϕ (ξi ) · ∆xi +ϕ (ξk ) · ∆xk =

i=2 i=2
| {z } | {z }
↑ сокращаются, поскольку f (ξ) = ϕ(ξ) при ξ ∈ (a, b) ↑

   

= f (ξ1 ) − ϕ(ξ1 ) · ∆x1 + f (ξk ) − ϕ(ξk ) · ∆xk 6



6 f (ξ1 ) − ϕ(ξ1 ) · ∆x1 + f (ξk ) − ϕ(ξk ) · ∆xk 6 4M · diam τ −→ 0
| {z } |{z} | {z } |{z} diam τ →0
6

6
6

diam τ diam τ
|f (ξ1 )| − |ϕ(ξ1 )| |f (ξk )| − |ϕ(ξk )|
6

2M 2M

Отсюда получаем:
k
X ˆ b
f (ξi ) · ∆xi −→ ϕ(x) d x
diam τ →0 a
i=1
´b
Это значит, что функция f интегрируема на [a, b] и ее интеграл равен a ϕ(x) d x.
Доказательство теоремы 8.3.36. Подберем с помощью теоремы 8.3.32 разбиение отрезка [a, b]

a = c0 < c1 < ... < ck = b

такое, что на всяком интервале (ci−1 , ci ) функция f совпадает с некоторой функцией ϕi , непрерыв-
ной на отрезке [ci−1 , ci ]. Тогда по лемме 8.3.37, функция f будет интегрируемой на всяком отрезке
[ci−1 , ci ]. Значит, по свойству аддитивности интеграла (30 на с.492), f интегрируема на отрезке
[a, b] = [a, c1 ] ∪ [c1 , c2 ] ∪ ... ∪ [cn , b].

Кусочно-гладкие функции.
• Функция f на отрезке [a, b] называется кусочно-гладкой, если
1) на отрезке [a, b] она дифференцируема во всех точках, кроме, возможно, конеч-
ного набора;
2) в каждой точке c ∈ [a, b], где f дифференцируема, ее производная непрерывна,

f ′ (c) = lim f ′ (x) (8.3.177)


x→c

3) в каждой точке c ∈ [a, b], где f не дифференцируема, она обладает следующими


свойствами:
(i) f имеет конечные левый и правый пределы (либо один из них, если c
совпадает с каким-то из концов отрезка [a, b])

f (c − 0) = lim f (x), f (c + 0) = lim f (x) (8.3.178)


x→c−0 x→c+0
518 Глава 8. ИНТЕГРАЛ

(ii) f имеет конечные левую и правую производные (либо одну из них,


если c совпадает с каким-то из концов отрезка [a, b])

′ f (x) − f (c − 0) f (x) − f (c + 0) ′
f− (c) = lim , f+ (c) = lim
x→c−0 x−c x−c x→c+0
(8.3.179)
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x)
′ ′
стремится соответственно к f− (c) или f+ (c):

f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (8.3.180)
x→c−0 x→c+0

Следующее утверждение доказывается в точности, как теорема 8.3.32:

Теорема 8.3.38. Функция f является кусочно-гладкой на отрезке [a, b] тогда и только тогда,
когда существует разбиение τ = {c0 , ..., ck } этого отрезка такое, что на каждом отрезке [ci−1 , ci ]
можно определить гладкую функцию ϕi , совпадающую с f на интервале (ci−1 , ci ):

f (x) = ϕi (x), x ∈ (ci−1 , ci )

Следующее утверждение мы считаем очевидным:

Теорема 8.3.39. Пусть g – непрерывная кусочно-гладкая функция на отрезке [a, b]. Тогда
(i) произвольным образом доопределяя производную g ′ функции g в точках недифференци-
руемости g на [a, b], мы получим кусочно-непрерывную функцию на [a, b];
(ii) для любой интегрируемой функции f на [a, b] интеграл
ˆ b
f (x) · g ′ (x) d x
a

не зависит от того, как доопределена функция g ′ в точках недифференцируемости g.

• Как следствие, для любой интегрируемой функции f и любой непрерывной13 кусочно-


гладкой функции g на отрезке [a, b] формула
ˆ b ˆ b
f (x) d g(x) := f (x) · g ′ (x) d x (8.3.181)
a a

однозначно определяет число, называемое определенным интегралом от функции f вдоль


функции g на отрезке [a, b]. В частном случае, когда f = 1 эта величина обозначается
ˆ b ˆ b
d g(x) := g ′ (x) d x (8.3.182)
a a

Целью наших рассмотрений здесь является обобщение теорем 8.3.40 и 8.3.25 об интегрировании
вдоль функции на случай, когда эта функция является непрерывной кусочно-гладкой (а не просто
гладкой).

Теорема 8.3.40 (о скачке непрерывной кусочно-гладкой функции). Скачок непрерывной кусочно-


−→
гладкой функции g на ориентированном отрезке a; b равен интегралу от единицы вдоль g по этому
отрезку:
ˆ b ˆ b x=b

d g(x) = g ′ (x) d x = g(x) (8.3.183)
a a x=a

Доказательство. Понятно, что здесь достаточно считать, что a < b, потому что противоположный
случай получается умножением равенства (8.3.183) на −1.
13 Объяснение, почему функцию g в определении интеграла ab f (x) d g(x) нужно брать непрерывной кусочно-
´
гладкой (а не просто кусочно-гладкой) заключается в том, что только тогда этот интеграл можно определить фор-
мулой (8.3.181). В общем случае эта конструкция называется интегралом Римана-Стилтьеса и определяется она
по аналогии с интегралом Римана но с заменой ∆xi = xi − xi−1 на ∆gi = g(xi ) − g(xi−1 ). Для сходимости частичных
сумм необходимо требовать, чтобы g была функцией ограниченной вариации. Подробности можно найти, например,
в учебнике: А.Н.Колмогоров, С.В.Фомин, Элементы теории функций и функционального анализа, М.: Наука, 1981.
§ 3. Формула Ньютона-Лейбница 519

1. Пусть сначала функция g дифференцируема везде внутри отрезка [a, b] (а недифференцируема


может быть только на концах этого отрезка). Тогда для любых точек α и β таких, что
a < α < β < b,
функция v будет гладкой на отрезке [α, β], и значит к ним применима теорема 8.3.40:
ˆ β
d g(x) = g(β) − g(α)
α

Переходя к пределам при α → a и β → b, мы получаем как раз (8.3.183):


ˆ β
d g(x) = g(β) − g(α)
| {z }
| α {z } ↓

=
(8.3.181) g(b) − g(a)
´β  
α
g′ (x) d x здесь используется
´b ′ ↓ непрерывность g
a
g (x) d x

=
´b (8.3.181)
a
d g(x)

2. В общем случае мы выбираем по теореме 8.3.38 разбиение отрезка [a, b]


a = c0 < c1 < ... < ck = b
так, чтобы внутри каждого отрезка [ci−1 , ci ] функция g была дифференцируема, и, по уже дока-
занному, мы получим:
ˆ b k ˆ ci
X Xk x=ci x=a

d g(x) = d g(x) = g(x) = g(x)
a ci−1 x=ci−1 x=b
i=1 i=1

Следствие 8.3.41. Функция g : [a, b] → R является непрерывной кусочно-гладкой тогда и только


тогда, когда она представима в виде интеграла с переменным верхним пределом от некоторой
кусочно-непрерывной функции f : [a, b] → R:
ˆ x
g(x) = g(a) + f (t) d t
a

Доказательство. В качестве f нужно взять производную g ′ функции g, доопределенную произ-


вольным образом в точках недифференцируемости g.
Теорема 8.3.42 (об интегрировании по частям для непрерывных кусочно-гладких функций). Если
−→
f и g – непрерывные кусочно-гладкие функции на ориентированном отрезке a; b, то
ˆ b x=b ˆ b

f (x) d g(x) = f (x) · g(x) − g(x) d f (x) (8.3.184)
a x=a a
Доказательство. Как и в доказательстве теоремы 8.3.40, здесь достаточно считать, что a < b.
1. Пусть для начала функции f и g дифференцируемы везде внутри отрезка [a, b] (а недиф-
ференцируемы могут быть только на концах этого отрезка). Тогда для любых точек α и β таких,
что
a < α < β < b,
функции f и g будут гладкими на отрезке [α, β], и значит к ним применима теорема 8.3.25:
ˆ β x=β ˆ β

f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
α x=α α

Переходя к пределам при α → a и β → b по формулам (8.2.121) и (8.2.122), мы получаем как раз


(8.3.184):
ˆ β x=β ˆ β

f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
x=α
| α
{z } | {z } | α
{z }

=

(8.3.181) (8.3.181)
´β x=b ´β
α
f (x) · g′ (x) d x f (x) · g(x) α
g(x) · f ′ (x) d x
↓  x=a  ↓
´b здесь используется ´b
a
f (x) · g′ (x) d x непрерывность f и g a
g(x) · f ′ (x) d x
=

´b (8.3.181) ´b (8.3.181)
a
f (x) d g(x) a
g(x) d f (x)
520 Глава 8. ИНТЕГРАЛ

2. В общем случае мы выбираем по теореме 8.3.38 разбиение отрезка [a, b]

a = c0 < c1 < ... < ck = b

так, чтобы внутри каждого отрезка [ci−1 , ci ] функции f и g были дифференцируемы, и, по уже
доказанному, мы получим:
ˆ b k ˆ
X ci k
X x=ci k ˆ
X ci

f (x) d g(x) = f (x) d g(x) = f (x) · g(x) − g(x) d f (x) =
a ci−1 x=ci−1 ci−1
i=1 i=1 i=1
x=b ˆ b

= f (x) · g(x) − g(x) d f (x)
x=a a

(d) Некоторые следствия формулы Ньютона-Лейбница


Первообразная на интервале. Напомним, что выше на с.455 мы ввели понятие первообраз-
ной для функции на отрезке, а затем на с.458 было определено понятие первообразной функции,
определенной на интегральном множестве. Для частного случая, когда это интегральное множество
представляет собой интервал, определение можно упростить:
• Функция F называется первообразной для функции f на интервале (α, β), если производ-
ная F на этом интервале равна f :

F ′ (x) = f (x), x ∈ (α, β). (8.3.185)

Предложение 8.3.43. Для любой непрерывной функции f на интервале (α, β) и любой точки
c ∈ (α; β) формула ˆ x
F (x) = f (t) d t, x ∈ (α, β)
c

определяет первообразную функции f на интервале (α, β).


Доказательство. Здесь используется теорема 8.3.1 об интеграле с переменным верхним пределом.
1. Зафиксируем x0 ∈ (c, β). Взяв какое-нибудь b ∈ (x0 , β), мы можем считать, что переменная x
бегает по отрезку [c, b], на котором x0 будет внутренней точкой, поэтому производную функции F
в x0 можно вычислить по формуле (8.3.146):
ˆ x x0 
1
ˆ
F ′ (x0 ) = lim f (t) d t − f (t) d t =
x→x0 x − x0 c c
!
1
ˆ ˆ
= lim f (t) d t − f (t) d t = (8.3.146) = f (x0 ). (8.3.186)
x→x0 x − x0 [c,x] [c,x0 ]

Более того, представив F тем же интегралом с x бегающим по отрезку [c, b], мы можем найти
правую производную F в точке c по формуле (8.3.147):
x
F (x) − F (c) 1
ˆ
F+′ (c) = lim = lim f (t) d t =
x→c+0 x−c x→c+0 x − c c
1
ˆ
= lim f (t) d t = (8.3.147) = f (c). (8.3.187)
x→c+0 x − c [c,x]

2. Если α < x0 < c, то взяв какое-нибудь a : α < a < x0 , мы получим


ˆ x  x0 ˆ x 
1 1
ˆ
F ′ (x0 ) = lim f (t) d t −
f (t) d t = (8.3.161) = lim f (t) d t =
x→x0 x − x0 c c x→x0 x − x0 x0
ˆ x ˆ x0 
1
= (8.3.161) = lim f (t) d t − f (t) d t =
x→x0 x − x0 a a
!
1
ˆ ˆ
= lim f (t) d t − f (t) d t = (8.3.146) = f (x0 ) (8.3.188)
x→x0 x − x0 [a,x] [a,x0 ]
§ 3. Формула Ньютона-Лейбница 521

И представив F тем же интегралом с x бегающим по отрезку [a, c], мы можем найти левую произ-
водную F в точке c по формуле (8.3.148):
ˆ x
′ F (x) − F (c) 1
F− (c) = lim = lim f (t) d t =
x→c−0 x−c x→c−0 x − c c
ˆ c
1
= lim f (t) d t = (8.3.148) = f (c). (8.3.189)
x→c−0 c − x x

3. Теперь мы получаем, что формулы (8.3.187) и (8.3.189) вместе дают (8.3.185) для случая x0 = c,
а для всех остальных точек x0 6= c то же самое утверждается в формулах (8.3.186) и (8.3.188).

Лемма Адамара для функций одной переменной.


Лемма 8.3.44 (Адамар). Для любой гладкой функции f на отрезке [a, b] и любой точки c ∈ [a, b]
найдется непрерывная функция g на [a, b] такая, что
f (x) − f (c) = (x − c) · g(x), x ∈ [a, b] (8.3.190)
Доказательство. Положим
ˆ 1  
g(x) = f ′ (x − c) · s + c d s, x ∈ [a, b]
0

Из непрерывности функции f ′ следует, что функция g тоже непрерывна на [a, b]. Действительно,
пусть ε > 0. По теореме Кантора 4.3.32, найдется δ > 0 такое, что для любых x, y ∈ [a, b]
|x − y| < δ =⇒ |f ′ (x) − f ′ (y)| < ε
Поэтому справедлива цепочка:
|x − y| < δ

 

∀s ∈ [0, 1] (x − c) · s + c − (y − c) · s + c = (x − y) · s = |x − y| · |s| 6 |x − y| < δ

 

∀s ∈ [0, 1] f (x − c) · s + c − f ′ (y − c) · s + c < ε

ˆ 1 1
 
ˆ
|g(x) − g(y)| = ′
f (x − c) · s + c d s − f (y − c) · s + c d s =

0 0
ˆ

ˆ

′ ′
= f (x − c) · s + c d s − f (y − c) · s + c d s =
[0;1] [0;1]
ˆ
  

= f ′ (x − c) · s + c − f ′ (y − c) · s + c d s 6
[0;1]
ˆ  
ˆ
′ ′
6 f (x − c) · s + c − f (y − c) · s + c d s < ε ds = ε
[0;1] | {z } [0;1]
>

Остается проверить тождество (8.3.190). Для любого x > c мы получаем:



ˆ x t = (x − c) · s + c ˆ 1  
s ∈ [0, 1]
f (x) − f (c) = f ′ (t) d t = d t = (x − c) d s = f ′ (x − c) · s + c · (x − c) d s =
c t ∈ cx
→ ⇔ s∈−
− 0; 1
→ 0
ˆ 1  
= (x − c) · f ′ (x − c) · s + c d s = (x − c) · g(x)
0
522 Глава 8. ИНТЕГРАЛ

y
(e) Приложения определенного
интеграла y=x
Площадь правильной области на плоско- −2 x
сти. Пусть функции f и g непрерывны на от- 1
резке [a, b] и удовлетворяют неравенству
y = 2 − x2
f (x) 6 g(x), x ∈ [a; b]

Тогда система неравенств


( Теперь интересующая нас область в правильном
a6x6b
виде записывается следующим образом:
f (x) 6 y 6 g(x)
(
−2 6 x 6 1
задает на координатной плоскости некоторую об- D:
ласть D x 6 y 6 2 − x2

y y = g(x) и остается применить формулу (8.3.191):


ˆ 1
SD = {2 − x2 − x} d x =
−2
 
x3 x2 1
y = f (x) = 2x − − =
3 2 −2
0 x    
a b 1 1 8 9
= 2− − − −4 + − 2 =
3 2 3 2
Всякая такая область называется правильной
(относительно оси OX). ⊲⊲ 8.3.47. Найдите площади фигур, ограничен-
ных линиями:
Теорема 8.3.45. Площадь SD правильной обла-
1) y = 6x − x2 − 7, y = x − 3;
сти (
a6x6b 2) y = 2x − x2 , y = x;
D:
f (x) 6 y 6 g(x) 3) y = x3 , y = x;
x2 3x
равна14 4) y = 2 , y =2− 2 ;
5) y = −x , y = x2 − 2x − 4;
2
ˆ b h i
x3
SD = g(x) − f (x) d x (8.3.191) 6) y = 2x2 , y = 3 ;
a
7) y = x(x − a)2 , y = 0.
⋄ 8.3.46. Найдем площадь фигуры, ограничен-
ной кривыми ⊲⊲ 8.3.48. Найдите площади фигур, ограничен-
ных линиями:
y = x, y = 2 − x2
1) y = ex , y = e−x , x = 1,
Найдем сначала точки пересечения этих линий: 2) y = 2px2 , x = 2py 2 ,
( ) ( ) 3) y = −x, y = 2x − x2 .
y=x y=x
⇔ ⇔
y = 2 − x2 x = 2 − x2
  Площадь области, ограниченной парамет-
( ) 
"
y=x  ризованной кривой. Для любых непрерыв-
y=x #
⇔ ⇔ x = −2 ⇔ ных функций ϕ, χ : [α, β] → R система уравнений
x2 + x − 2 = 0 
 
 вида
x=1 
 ( )  x = ϕ(t)

x = −2 y = χ(t)
 y = −2  

  t ∈ [α; β]
⇔  ( ) 
 x=1  задает на плоскости некоторое множество точек,
y=1 называемых параметризованной кривой (пара-
метр t необязательно бегает по отрезку, в некото-
На плоскости эта область изображается картин- рых определениях это может быть интервал или
кой (которую можно построить по точкам): более сложное множество).
14 Это утверждение является частным случаем теоремы 16.2.9, которую мы доказываем в главе 16.
§ 3. Формула Ньютона-Лейбница 523

⋄ 8.3.49 (эллипс). Можно проверить, что урав- ⋄ 8.3.51 (циклоида). Уравнения


нения ( (
x = a cos t x = a(t − sin t)
, t∈R , t∈R
y = b sin t y = a(1 − cos t)
определяют эллипс:
y задают на плоскости кривую, называемую цик-
лоидой. Ее также можно построить по точкам, и
b соответсвующая картинка будет выглядеть так:

−a a x
y
2a
−b

x
Действительно, 0 πa 2πa

x2 y2
+ = cos2 t + sin2 t = 1
a b
⋄ 8.3.50 (астроида). Уравнения
( Область на плоскости можно определять па-
x = a cos3 t раметризованными кривыми. Например, систе-
, t∈R ма
y = b sin3 t (
задают на плоскости кривую, называемую аст- x = ϕ(t)
D: , t ∈ [α; β]
роидой. Для ее построения можно составить таб- 0 6 y 6 ψ(t)
лицу
задает на плоскости примерно такую область
t 0 ± π6 ± π4 ± π3 ± π2
√ √
x a 3 3
a 2
a 1
a 0 y
8 4√ 8√
y 0 ± 18 b ± 2
4 b ±383b ±b ψ(β)

ψ(α)

t ± 2π3 ± 3π ± 5π ±π
√4 √6
x − 18 a − 42 a −383a −a
√ √ x
y ±383b ± 42 b ± 18 b 0 ϕ(α) ϕ(β)

затем отметить все эти точки на рисунке:


если ϕ) возрастает, и
y
y
ψ(α)
−a a x

ψ(β)

x
ϕ(β) ϕ(α)
и соединить их “плавной линией”. Получится
картинка
y если ϕ убывает.
b
Теорема 8.3.52. Пусть
−a a x 1) ϕ – гладкая монотонная функция на
отрезке t ∈ [α; β], у которой производ-
ная не равна нулю на интервале (α; β):
−b
∀t ∈ (α; β) ϕ′ (t) 6= 0 (8.3.192)
524 Глава 8. ИНТЕГРАЛ

2) χ – непрерывная неотрицательная ⋄ 8.3.54. Найдем площадь фигуры, ограничен-


функция на отрезке t ∈ [α; β]: χ(t) > 0, ной астроидой из примера 8.3.50.
ненулевая на интервале (α; β):
y
b
∀t ∈ (α; β) χ(t) 6= 0 (8.3.193)

Тогда площадь SD области, ограниченной пара- −a a x


метризованной кривой
(
x = ϕ(t)
D: , t ∈ [α; β] −b
0 6 y 6 χ(t)

равна15 Для этого выделим четвертинку, определяемую


ˆ системой
β (
h πi
SD = χ(t) d ϕ(t) (8.3.194) x = a cos3 t
α D: , t ∈ 0;
0 6 y 6 b sin3 t 2
⋄ 8.3.53 (площадь эллипса). Найдем площадь
эллипса из примера 8.3.49. y
b
y
b −a a x
−a a x

−b
−b

и найдем ее площадь:
ˆ π
Для этого выделим четвертинку этой области, 2 
3 3
определяемую системой SD = b sin t d a cos t =
0
( ˆ π
x = a cos t π 2

D: , t ∈ [0; ] = 3ab sin4 t cos2 t d t =
0 6 y 6 b sin t 2 0
ˆ π 
2 1 − cos 2t 2 1 + cos 2t

= 3ab d t =
0 2 2
ˆ π
3ab 2 2

= (1 − cos 2t) 1 − cos 2t d t =
8 0
ˆ π  
3ab 2 1 + cos 4t

= (1 − cos 2t) 1 − d t =
8 0 2
ˆ π
и найдем ее площадь: 3ab 2

= (1 − cos 2t) (1 − cos 4t) d t =
ˆ π ˆ π 16 0
2 2 ˆ π
3ab 2
SD = b sin t d a cos t = ab sin2 t d t =
0 0 = (1 − cos 2t − cos 4t + cos 2t cos 4t) d t =
ˆ π 16 0
2 1 − cos 2t ab  sin 2t
 π
ˆ π
t−
2
3ab 2 
= ab d t = =
0 2 2 2 0 = 1 − cos 2t − cos 4t+
16 0
πab
= 1 
4
+ (cos 6t + cos 2t) d t =
2
Умножив это число на 4, получаем площадь эл- ˆ π
липса: 3ab 2

= (2 − cos 2t − 2 cos 4t + cos 6t) d t =
S = πab 32 0
15 Эта формула доказывается ниже на с.1054.
§ 3. Формула Ньютона-Лейбница 525
  π
3ab 1 1 1 2 При этом, полярные координаты связаны с
= 2t − sin 2t − sin 4t + sin 6t =
32 6 2 6 0 декартовыми формулами
3abπ ( ( p
= x = ρ · cos ϕ ρ = x2 + y 2
32 , ,
y = ρ · sin ϕ tg ϕ = xy
Умножив это число на 4, получим площадь всей
фигуры: Как и в случае с декартовыми координатами,
3abπ
S= всякое уравнение, связывающее полярные коор-
8
динаты,
⋄ 8.3.55. Найдем площадь фигуры, ограничен- ρ = R(ϕ)
ной аркой циклоиды
( задает некоторую кривую на плоскости. Рас-
x = a(t − sin t) смотрим примеры.
D: , t ∈ [0; 2π]
0 6 y 6 a(1 − cos t) ⋄ 8.3.57 (кардиоида). Построим кривую, задан-
ную уравнением в полярных координатах
y
ρ = a · (1 + cos ϕ)
2a
Это можно сделать по точкам. Сначала состав-
ляется таблица
x
0 2πa ϕ 0 ±π ± π4 ± π3 ± π2
 6√   √ 
ρ 2a a 1 + 23 a 1+ 2
2 3a
2 a

Вычисляем площадь: ϕ ± 2π
3 ± 3π ± 5π ±π
 4√   6
√ 
a
ˆ 2π ρ a 1 − 22 a 1− 3
0
2 2

SD = a(1 − cos t) d a(t − sin t) =
0
ˆ 2π Потом соответствующие точки строятся на плос-

2

=a (1 − cos t) d t =
2
кости:
0
ˆ 2π y

= a2 1 − 2 cos t + cos2 t d t = a
0
ˆ 2π  
1 + cos 2t
= a2 1 − 2 cos t + d t = a 2a x
0 2
 
3 sin 2t 2π
= a2 t − 2 sin t + = 3πa2
2 4 0 −a
⊲⊲ 8.3.56. Найдите площади фигур, ограничен-
ных параметризованными кривыми (разные ва-
рианты петель): Эти точки соединяются плавной линией, и полу-
2 3
1) x = a(t + 1), y = b(t − 3t), чается кривая:
1 2 2
2) x = 3 (3 − t ), y = t , y
3) x = 2t − t2 , y = 2t2 − t3 . a

Площадь области в полярных координа-


a 2a x
тах. Положение точки A на плоскости можно
задавать не только декартовыми координатами
(то есть обычными значениями переменных x и
y), но также полярными координатами – значе- −a
нием угла ϕ между лучом OX и лучом OA, со-
единяющим начало координат O с точкой A, и
расстояния ρ от A до начала координат O: ⋄ 8.3.58 (лемниската Бернулли). Построим кри-
вую, заданную уравнением в полярных коорди-
ρ натах p
ρ = a cos 2ϕ
ϕ Это также делается по точкам. Сначала состав-
x ляется таблица (в которой знак ∄ говорит, что
526 Глава 8. ИНТЕГРАЛ

y
для данного значения ϕ соответсвующее значе-
a
ние параметра ρ не определено):

ϕ 0 ± π6 ± π4 ± π3 ± π2
a
ρ a √
2
0 ∄ ∄
x

ϕ ± 2π
3 ± 3π
4 ± 5π
6 ±π
ρ ∄ 0 √a a
2
В результате получается кривая:

Потом соответствующие точки строятся на плос- y


a
кости:
y

−a a x x

Нетрудно показать, что эта кривая – окруж-


ность. Для этого нужно перейти к декартовым
координатам:
И в результате получается кривая:
ρ = a sin ϕ ⇔ ρ2 = aρ sin ϕ ⇔ x2 +y 2 = ay ⇔
y
a2 a2  a 2  a 2
⇔ x2 +y 2 −ay+ = ⇔ x2 + y − =
4 4 2 2
−a a x
Теорема 8.3.60. Площадь области на плоско-
сти, заданной неравенствами
(
α6ϕ6β
D:
ρ 6 R(ϕ)

⋄ 8.3.59 (окружность). Построим кривую, за-


данную уравнением в полярных координатах y
ρ = a sin ϕ
ρ = R(ϕ)
Составляем таблицу

β
ϕ −π − 3π − π2 − π4 0 α x
4
ρ 0 ∄ ∄ ∄ 0

ϕ π
4
π
2

4 π вычисляется по формуле16
ρ √a a √a 0
2 2 β
1
ˆ
SD = R(ϕ)2 d ϕ (8.3.195)
2 α
(здесь знак ∄ мы пишем в случае, когда значение
ρ получается отрицательным; это должно озна- ⋄ 8.3.61. Вычислим площадь области, ограни-
чать, что при данном ϕ соответствующая точка ченной кардиоидой (линией, построенной нами в
не существует, поскольку ρ есть расстояние до примере 8.3.57):
нуля, и значит не может быть отрицательным).
Потом на плоскости строятся точки: ρ = a · (1 + cos ϕ)
16 Эта формула доказывается ниже на с.??.
§ 3. Формула Ньютона-Лейбница 527

y y
a a

2a x

x
−a

По теореме 8.3.60 получаем:


2π π
1
ˆ
1
ˆ
SD = 2
a · (1 + cos ϕ) d ϕ = 2 SD = a2 · sin2 ϕ d ϕ =
2 0
2 0
ˆ π 
a2
ˆ 2π a2 1 − cos 2ϕ
= · (1 + 2 cos ϕ + cos2 ϕ) d ϕ = = · dϕ =
2 0
2 0 2
 
a2
ˆ 2π 
1 + cos 2ϕ
 a2 ϕ sin 2ϕ ϕ=π πa2
= · 1 + 2 cos ϕ + dϕ = = · − =
2 2 2 2 2 ϕ=0 4
0
ˆ 2π  
a2 3 cos 2ϕ ⊲⊲ 8.3.64. Найдите площади фигур, ограничен-
= · + 2 cos ϕ + dϕ =
2 0 2 2 ных линиями:
 
a2 3 sin 2ϕ ϕ=2π 3πa2
= · ϕ + 2 sin ϕ + = 1) ρ = 4 sin2 ϕ 5) ρ = a cos 4ϕ
2 2 4 ϕ=0 2
2) ρ = a(2 + sin ϕ)
⋄ 8.3.62. Вычислим площадь области, ограни- 6) ρ = a sin2 3ϕ
3) ρ = a cos ϕ
ченной лемнискатой Бернулли (линией, постро- 7) ρ = a cos2 3ϕ
4) ρ = a sin 3ϕ
енной нами в примере 8.3.58):
p Длина кривой.
ρ = a cos 2ϕ
Теорема 8.3.65. Если кривая задана уравнени-
y ем
y = f (x), x ∈ [a; b]
(в котором f – гладкая функция на отрезке
−a a x [a; b]), то ее длина равна17
ˆ b q
2
l= 1 + (f ′ (x)) d x (8.3.196)
a

⋄ 8.3.66. Найдем длину куска экспоненты


Для этого достаточно найти площадь одного “ле- y = ex , x ∈ [a, b]
пестка”:
По формуле (8.3.196) имеем:
a2 sin 2ϕ ϕ= π4
π
1
ˆ 4
SA = a2 · cos 2ϕ d ϕ = · =
2 −π
4
2 2 ϕ=− π4 ˆp b
2 2 l= 1 + e2x d x =
a a a
= · (1 − (−1)) = √
4 2 t = 1 + e2x , x = 1 ln(t2 − 1)
2
d x = tt2d−1
t
Общая площадь теперь получается удвоением = =
−→ −
√−−−−−−−√ −−−−−→
площади одного лепестка: x ∈ a, b ↔ t ∈ 1 + e2a , 1 + e2b
ˆ √1+e2b 2 ˆ √1+e2b 2
SD = 2SA = a2 t dt t −1+1
= √ 2−1
= √ dt =
2a t 2a t2 − 1
⋄ 8.3.63. Убедимся, что формула (8.3.195), бу- 1+e 1+e
ˆ √1+e2b 
дучи применена к вычислению площади круга, 1 
построенного в примере 8.3.59, приводит к пра- = √ 1+ 2 dt =
2 1+e2a t −1
вильному результату : πR2 = πa4 . √
ˆ 1+e2b  
1 1 1 
= √ 1+ − dt =
ρ = a sin ϕ 1+e2a 2 t−1 t+1
17 Эта формула доказывается ниже на с.1080.
528 Глава 8. ИНТЕГРАЛ

√1+e2b Теорема 8.3.69. Если кривая задана парамет-


1 t − 1
= t + ln = рическими уравнениями
2 t + 1 √1+e2a
p p (
= 1 + e2b − 1 + e2a + x = ϕ(t)
√ √ , t ∈ [α; β]
1 1 + e2b − 1 1 + e2a + 1 y = χ(t)
+ ln √ ·√
2 1 + e2b + 1 1 + e2a − 1
причем ϕ(t), χ(t) – гладкие функции на [α; β], то
⋄ 8.3.67. Найдем длину куска полукубической ее длина равна18
параболы: ˆ βq
3
y = x 2 , x ∈ [0; 1] 2 2
l= (ϕ′ (t)) + (χ′ (t)) d t (8.3.197)
α
По формуле (8.3.196) имеем:
s ⋄ 8.3.70 (длина астроиды). Найдем длину астро-
1  2 иды (с совпадающими значениями параметров,
3
ˆ
1
l= 1+ · x2 dx = a = b):
0 2 (
ˆ 1r x = a cos3 t
9
= 1 + ·x dx = y = a sin3 t
0 4
q
t = 1 + 49 x По формуле (8.3.197), длина четвертинки равна

= x = 94 (t2 − 1) √ =
x ∈ [0; 1] ⇔ t ∈ [1; 13 ]
2 l

13   ˆ √213 =
ˆ
42 8 4
= td · (t2 − 1) = · ·t2 d t = ˆ π2 q
9 9 1 2 2
1
  = (−3a cos2 t sin t) + 3a sin2 t cos t d t =

3 13  √ !3  13√13 − 8 0
8 t 2 8 13 ˆ π
p
= · = · −1 = 2

9 3 1 27  2  27 = 3a cos4 t sin2 t + sin4 t cos2 t d t =


0
ˆ π
2 p
⋄ 8.3.68. Найдем длину куска обычной парабо- = 3a |cos t sin t| cos2 t + sin2 t d t =
лы: 0
π π
y = x2 , x ∈ [0; 1] √
ˆ 2
ˆ 2
= 3a cos t sin t 1 d t = 3a sin t d sin t =
По формуле (8.3.196) (с использованием тожде- 0 0
x
ства sin arctg x = √1+x 2
) мы получаем: sin2 t π2 3a
= 3a =
2 0 2
ˆ 1p
l= 1 + 4x2 d x = Умножив на 4, получаем ответ:
0

2x = tg t, t = arctg 2x ˆ arctg 4 l = 6a
dt
= d x = 2 cosdt
2t
=
3t
=
− → −−
x ∈ 0, 1 ⇔ t ∈ 0, arctg 4 −− −−→ 0 2 cos ⋄ 8.3.71 (длина арки циклоиды). Вспомним кри-
вую из примера 8.3.55:
1 arctg 4 d sin t 1 arctg 4 d sin t
ˆ ˆ
= = = (
2 0 cos4 t 2 0 (1 − sin2 t)2 x = a(t − sin t)
, t ∈ [0; 2π]
z = sin t, t = arcsin z y = a(1 − cos t)

= −−−−−−→ −−−−−−−−→ −−−4→ =
t ∈ 0, arctg 4 ⇔ z ∈ 0, sin arctg 4 = 0, √17
ˆ √4   По формуле (8.3.197) получаем:
1 17 dz раскладываем
= = на простейшие дроби = 2π q
2 0 (1 − z 2 )2
ˆ
по теореме 8.1.66
ˆ √4 l= a2 (1 − cos t)2 + a2 sin2 t d t =
1 17   0
1 1 1 1 1
= + + + dz = ˆ 2π p
2 0 4 1−z 1+z (1 − z) 2 (1 + z) 2

  √4 = a2 − 2a2 cos t + a2 cos2 t + a2 sin2 t d t =


1 1 + z 1 1 17 0
= · ln + − = 2π p
1 + z 0
ˆ
8 1−z 1−z = 2a2 − 2a2 cos t d t =
√ √ √ !
1 17 + 4 17 17 0
√ ˆ 2π
= · ln √ + √ −√ = √
8 17 − 4 17 − 4 17 + 4 =a 2 1 − cos t d t =
√ 0
17 + 4 √ r
1 √ ˆ 2π t
= · ln √ + 17 =a 2 2 sin2 d t =
8 17 − 4 2
0
18 Эта формула доказывается ниже на с.1080.
§ 3. Формула Ньютона-Лейбница 529
ˆ 2π t
ˆ 2π
t

= 2a sin d t = 2a sin d t =
y
0 | {z2} 0 2
y = f (x)

6
0

t t t 2π x
ˆ
= 4a sin d = −4a cos = a b
0 2 2 2 0
= −4a(cos π − cos 0) = 8a.

Теорема 8.3.72. Если кривая задана уравнени-


ем в полярных координатах,

ρ = R(ϕ), ϕ ∈ [α; β] Если ее график заставить вращаться вокруг оси


OX, получится поверхность, описываемая урав-
(где R(ϕ) – гладкая функция на [α; β]), то ее нением
длина равна19
ˆ βq
y 2 + z 2 = f (x)2 , x ∈ [a; b]
l= R(ϕ)2 + (R′ (ϕ))2 d ϕ (8.3.198)
α

⋄ 8.3.73 (длина кардиоиды). Найдем длину кар- и называемая поверхностью вращения.


диоиды:
ρ = a · (1 + cos ϕ)
По формуле (8.3.198),
q y
ˆ 2π
2 2
l= {a · (1 + cos ϕ)} + (a sin ϕ) d ϕ =
0
ˆ 2π q
=a 1 + 2 cos ϕ + cos2 ϕ + sin2 ϕ d ϕ = x
0
2π p ˆ a b
=a 2 + 2 cos ϕ d ϕ = z
0
ˆ 2π r ˆ 2π
2
ϕ ϕ
=a 4 cos d ϕ = 2a cos d ϕ =
0 2 0 2
 
разбиваем отрезок [0; 2π]
= на два отрезка, где cos ϕ2 =
имеет постоянный знак

ˆ π
ϕ
ˆ 2π
ϕ

= 2a cos d ϕ + 2a cos d ϕ =
0 2 π 2 Эта поверхность ограничивает вместе с плоско-
!
при ϕ∈ [0; π] имеем
ˆ π стями x = a и x = b область в терхмерном про-
cos ϕ = cos ϕ ϕ
= а при ϕ ∈2 [π; 2π] имеем 2
= 2a cos d ϕ− странстве, которая называется телом вращения

cos ϕ = − cos ϕ 0 2
2 2 и описывается системой неравенств
ϕ π ϕ 2π
ˆ 2π
ϕ
− 2a cos d ϕ = 4a sin − 4a sin =
π 2 2 0 2 π (
    y 2 + z 2 6 f (x)2
π 2π π (8.3.199)
= 4a sin − 0 − 4a sin − sin = a6x6b
2 2 2
= 4a + 4a = 8a

⊲⊲ 8.3.74. Найдите длину кривой: Теорема 8.3.75. Объем тела вращения


1) y = 41 x2 − 21 ln x, x ∈ [1; e], (8.3.199) вычисляется по формуле20

2) y = 31 (3 − x) x, x ∈ [1; 2],
3) x = et cos t, y = et sin t, t ∈ [0; π], b
ˆ
V =π f (x)2 d x (8.3.200)
4) ρ = eϕ , ϕ ∈ [0; 2π]. a

Объем тела вращения. Пусть на отрез-


ке [a; b] задана непрерывная неотрицательная ⋄ 8.3.76. Найдем объем√тела, образованного вра-
функция f щением параболы y = x и плоскостью x = b:
19 Эта формула доказывается ниже на с.1080.
20 Эта формула доказывается ниже на с.1055.
530 Глава 8. ИНТЕГРАЛ

2) χ – непрерывная неотрицательная
y функция на отрезке t ∈ [α; β]: χ(t) > 0,
ненулевая на интервале (α; β):

∀t ∈ (α; β) χ(t) 6= 0 (8.3.203)


x
0 b Теорема 8.3.78. Объем тела вращения
(8.3.201) вычисляется по формуле21
ˆ
β
2
V =π χ(t) d ϕ(t) (8.3.204)
α

⋄ 8.3.79. Найдем объем эллипсоида, то есть те-


По формуле (8.3.200) получаем ла, образованного вращением эллипса
b √ 2 b
π 2 b π (
ˆ ˆ
V =π x dx = π x dx = x = b2 x = a cos t
0 0 2 0 2
y = b sin t
⋄ 8.3.77. Найдем объем тела, образованного вра-
щением полуволны синусоиды y = sin x, x ∈ вокруг оси OX:
[0; π]:

y
y
b
1

x
x
π
−a a
0 2
π

−b
−1

По формуле (8.3.200) получаем По формуле (8.3.204) получаем


ˆ π
1 − cos 2x
ˆ π ˆ π
V =π sin2 x d x = π dx = 2
2 V = π (b sin t) d (a cos t) =
0 0
  0
π sin 2x π π2 ˆ π



= x− = 2
= ab π sin t d cos t =
2
2 2 0 2
ˆ π 0
Кривая, вращаемая вокруг оси, может быть 2

= ab π 1 − cos t d cos t =
2
задана параметрически, и тогда соответствую-
0 
щее тело вращения будет описываться системой 2
cos3 t π
( = ab π cos t − =
3 0
x = ϕ(t)  
D: , t ∈ [α; β] (8.3.201) 2 2 4π 2
y 2 + z 2 6 χ(t)2 = ab π 2 − = ab
3 3
— здесь предполагается, что функции ϕ и χ удо-
влетворяют условиям теоремы 8.3.52: ⊲⊲ 8.3.80. Найдите объем тел вращения:
1) ϕ – гладкая монотонная функция на 1) y = x3 , x ∈ [0; b]
отрезке t ∈ [α; β], у которой производ-
2) y = ex , x ∈ [a; b]
ная не равна нулю на интервале (α; β):
3) x = a(t − sin t), y = a(1 − cos t), t ∈ [0; 2π]
∀t ∈ (α; β) ϕ′ (t) 6= 0 (8.3.202) 4) x = a cos3 t, y = a sin3 t
21 Эта формула доказывается ниже на с.1056.
§ 3. Формула Ньютона-Лейбница 531
(  32   23 )
Площадь поверхности вращения. 4π 1 1
= b+ − =
3 4 4
Теорема 8.3.81. Пусть f : [a, b] → R – гладкая ( )
функция, причем 3
4π 1 2 1
= b+ −
3 4 8
f (x) > 0, x ∈ (a; b). (8.3.205)
⋄ 8.3.83. Найдем площадь поверхности, обра-
Тогда площадь поверхности вращения зованной вращением полуволны синусоиды y =
sin x, x ∈ [0; π]:
y 2 + z 2 = f (x)2 , x ∈ [a; b] (8.3.206)

y
1
y

x
π π
x 0 2

a b
z −1

По формуле (8.3.200) получаем


ˆ π p
вычисляется по формуле22 S = 2π sin x · 1 + cos2 x d x =
0
ˆ b q ˆ πp
2
S = 2π f (x) · 1 + (f ′ (x)) d x (8.3.207) = −2π 1 + cos2 x d cos x =
a 0
ˆ −1 p
⋄ 8.3.82. Найдем площадь поверхности, образо-
cos x = t
√ = = −2π
x ∈ [0; π] ⇔ t ∈ [1; −1] 1 + t2 d t =
ванной вращением параболы y = x, x ∈ [0; b]: 1
  ˆ 1p
меняем местами
= пределы интегрирования = 2π 1 + t2 d t =
−1
 
y интегрируем по частям
= с возвращением к исходному =
интегралу (как в примере 8.1.53)
1p p  1

= t 1 + t2 + ln t + 1 + t2 =
2 −1
x 1 √ √ √ 

b = 2 2 + ln 1 + 2 − ln −1 + 2 =
0 2 √
√ 1 2 + 1 √ 1 √ 2
= 2 + ln √ = 2 + ln 2+1 =
2 2 − 1 2
√ √ 
= 2 + ln 2+1

Теорема 8.3.84. Пусть ϕ : [α, β] → R и χ :


[α, β] → R – две гладкие функции, причем
По формуле (8.3.207) получаем
χ(t) > 0, t ∈ (α, β) (8.3.208)
s  2
b √ 1 и
ˆ
S = 2π x· 1+ √ dx = t ∈ (α, β). ϕ′ (t) > 0,
(8.3.209)
0 2 x
r r
ˆ b
√ 1
ˆ b
1 Тогда площадь поверхности вращения, образо-
= 2π x· 1+ d x = 2π x + d x = ванной параметризованной кривой
0 4x 0 4 (
ˆ br    3
1 1 2 1 2 b x = ϕ(t)
, t ∈ [α; β] (8.3.210)
= 2π x+ d x+ = 2π x+ = D: y 2 + z 2 = χ(t)2
0 4 4 3 4 0
22 Эта формула доказывается ниже на с.1122.
23 Эта формула доказывается ниже на с.1122.
532 Глава 8. ИНТЕГРАЛ

вычисляется по формуле23 Формула Стирлинга. Закончить разговор о


ˆ β q приложениях интеграла будет поучительно зна-
2 2 менитой формулой Стирлинга, описывающей
S = 2π χ(t) · (ϕ′ (t)) + (χ′ (t)) d t (8.3.211)
α асимптотическое поведение факториала:

⋄ 8.3.85. Найдем площадь поверхности, образо- nn · 2πn
ванной вращением астроиды n! ∼ (8.3.212)
n→∞ en
(
x = a cos3 t Для ее доказательства нам понадобится еще од-
3 но соотношение, называемое формулой Валлиса:
y = a sin t
 2
1 (2k)!! π
вокруг оси OX: · −→ (8.3.213)
2k + 1 (2k − 1)!! k→∞ 2

Доказательство формулы Валлиса. Здесь при-


y меняется формула (8.3.175). Обозначим
b  2
(2k)!!
xk =
(2k − 1)!!
x
Тогда:
−a a
h πi
sin2k+1 x < sin2k x < sin2k−1 x, x ∈ 0,
2
−b

ˆ π ˆ π
2 2
sin2k+1 x d x < sin2k x d x <
0 0
По формуле (8.3.211) получаем площадь поло- ˆ π
2
винки равна < sin2k−1 x d x
0
S
= ⇓ (8.3.175)
2
q
ˆ π
2 (2k)!! (2k − 1)!! π (2k − 2)!!
= 2π 3
a sin t · (−3a cos2 t sin t)2 + (3a sin2 t cos t)2 d t = < · <
0
π
(2k + 1)!! (2k)!! 2 (2k − 1)!!
ˆ
2
p
= 2π a sin t ·
3
9a2 cos4 t sin2 t + 9a2 sin4 t cos2 t d t = ⇓
0
ˆ π
2 p  2  2
= 6a2 π sin3 t · | cos t sin t| cos2 t + sin2 t d t = 1 (2k)!! π 1 (2k)!!
· < < ·
0 2k + 1 (2k − 1)!! 2 2k (2k − 1)!!
ˆ π
2
| {z } | {z }
xk xk
= 6a π 2
sin3 t · cos t sin t · 1 · d t =
0
ˆ π

2
= 6a π 2
sin4 t · cos t d t = xk π xk
< <
0 2k + 1 2 2k
sin5 t π2
ˆ π
2

= 6a2 π sin4 t d sin t = 6a2 π =
0 5 0 2k π 2k xk xk π
6 · < · = <
= a2 π 2k + 1 |{z}
2 2k + 1 2k 2k + 1 2
5
>

xk
Отсюда полная площадь 2k


12 2
S= a π 2k π xk π
5 · < <
2k + 1 2 2k + 1 2
⊲⊲ 8.3.86. Найдите площади поверхностей, обра- | {z }

зованных вращением следующих кривых вокруг 1
оси OX:

1) x = a cos t, y = b sin t xk π
2) x = a(t − sin t), y = a(1 − cos t), t ∈ [0; 2π] −→
2k + 1 k→∞ 2
ex +e−x
3) y = ch x = 2 ,x ∈ [a; b]
§ 3. Формула Ньютона-Лейбница 533

Доказательство формулы Стирлинга. Обо- xn > xn+1


значим
n! · en Мы получили, что {xn } – убывающая и ограни-
xn = n+ 1 ченная снизу нулем последовательность. Значит,
n 2
у нее имеется предел:
Из маклореновского разложения для логарифма
(11.2.77) получаем такую цепочку: n! · en
xn = n+ 1 −→ a

X m n 2 n→∞
m−1 x
ln(1 + x) = (−1) · , x ∈ (0, 1). Это соотношение можно понимать как эквива-
m=1
m
лентность
⇓ 1
nn+ 2
n! ∼ a · n , (8.3.214)
n→∞ e
1+x
ln = ln(1 + x) − ln(1 − x) = в которой a ∈ R – пока неизвестное число. Для
1−x

X X∞   его нахождения и нужна доказанная выше фор-
xm xm
= (−1)m−1 · − − = мула Валлиса (8.3.213):
m=1
m m=1
m
∞  2
X x2k π 1 (2k)!!
2x ·
= |{z} > 2x · |{z}
1 = 2x ←− · = (3.2.118) =
2k + 1 2 ∞←k 2k + 1 (2k − 1)!!
k=0 | {z } k=0  2
<

1 (2k)!! · (2k − 2)!!


<

0
0 = · = (3.2.117) =
2k + 1 (2k − 1)!
1  k 2
⇓ подстановка: x = 1 2 · k! · 2k−1 · (k − 1)!
2n + 1 = · =
  2k + 1 (2k − 1)!
1
1 1 + 2n+1 2 1  k 2
ln 1 + = ln 1 > = 1
1 2 · k! · 2k · k!
n 1 − 2n+1 2n + 1 n+ 2 = · =
2k + 1 2k · (2k − 1)!
⇓ 24k (k!)4 (8.3.214)
 n+ 12     = · 2 ∼
1 1 1 2k + 1 k→∞
ln 1 + = n+ · ln 1 + >1 (2k)!
n 2 n  4
1
kk+ 2
⇓ a · 4k+2
24k ek 24k a4 · k e4k
 n+ 21 ∼ · 2 = · 4k+1 =
1 k→∞ 2k
(2k)2k+ 2
1 2k a2 · (2k)4k
1+ >e a · e2k e
n
⇓ 24k a2 · k 4k+2 24k a2 · k 4k+2 a2
= · = · =
2k (2k)4k+1 2k 24k+1 · k 4k+1 4
n!·en 1
xn 1
nn+ 2 (n + 1)n+1+ 2 ⇓
= (n+1)!·en+1
= 1 =
xn+1 1 (n + 1) · nn+ 2 ·e 2π = a2
(n+1)n+1+ 2
1  n+ 12 ⇓
1 (n + 1)n+ 2 1 1
= · 1 = · 1 + >1 √
e nn+ 2 e n 2π = a
⇓ Это превращает (8.3.214) в (8.3.212).
Глава 9

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ
И ЧИСЛОВЫЕ РЯДЫ

§1 Несобственные интегралы
Несобственный интеграл формализует в математическом анализе идею площади неограниченной
фигуры.

⋄ 9.1.1. В предыдущей главе мы изучали опре- y


деленный интеграл, геометрический смысл кото-
рого – площадь криволинейной трапеции. Рас- y= √1
x
смотрим теперь какую-нибудь неограниченную
криволинейную трапецию (то есть такую, кото-
рая не лежит ни в каком прямоугольнике)

x
y = f (x) 1

то Вас наверняка удивит наблюдение, что эта


площадь конечна и равна 2 (хотя сама фигура
неограничена).
Дело в том, что эту величину можно посчи-
тать как предел площадей ограниченных криво-
линейных трапеций:
a x
b
y

y= √1
x
Ее площадь будет непонятно чему равна, потому
что определенный интеграл от неограниченной
функции не существует (по теореме 8.2.10).
Тем более неожиданным должно быть наблю- 1
дение, что у некоторых неограниченных криво-
линейных трапеций все-таки имеется конечная
площадь. Точнее, понятие площади можно обоб-
щить таким образом, что некоторые неограни- t x
1
ченные криволинейные трапеции будут иметь ко-
нечную площадь. Например, если Вы задумае-
тесь, чему должна быть равна площадь криволи-
нейной трапеции, ограниченной кривой y = √1x

534
§ 1. Несобственные интегралы 535

1
1 √ 1 ⋄ 9.1.3. Еще один пример – площадь криволи-
ˆ
S = lim √ d x = lim 2 x = 1
t→+0 t x t→+0 t нейной трапеции, ограниченной кривой y = 1+x 2
 √ на полуинтервале [0; +∞):
= lim 2 − 2 t = 2
t→+0
y
⋄ 9.1.2. С другой стороны, если вместо кривой y= 1
1+x2
y = √1x взять ничем особенным, как будто, не
отличающуюся от нее кривую y = x1 ,

y 0 x
1
y= x Ее можно вычислить как предел площадей полу-
чающихся, когда x бегает по отрезкам [0, t], при
t → ∞,
y
1 1
y= 1+x2

t x
1
0 t x
то окажется, что соответствующая площадь, по- π
и оказывается, что она равна 2:
считанная тем же способом бесконечна:
+∞ t
1 dx dx
ˆ ˆ
1
1
ˆ
= lim =
S = lim d x = lim ln x = 0 1 + x2 t→+∞ 0 1 + x2
t→+0 t x t→+0 t t
π
= lim (ln 1 − ln t) = +∞ = lim arctg x = lim arctg t =
t→+0 t→+∞ 0 t→+∞ 2

После этих примеров естественно спросить, какой должна быть неограниченная криволинейная
трапеция, чтобы ее площадь была конечна? И чему равны площади конкретных неограниченных
криволинейных трапеций? Об этом мы поговорим в настоящей главе.

(a) Определение несобственного интеграла и его свойства


Начнем со следующего определения.

• Функция f называется локально интегрируемой на множестве E, если она определена


на E и интегрируема на любом отрезке [a, b], содержащемся в E.

⋄ 9.1.4. Функция ⋄ 9.1.5. Функция Дирихле, которую мы опреде-


( ляли формулой (4.1.4),
1
x, x 6= 0 (
f (x) =
0, x=0 1, x ∈ Q
D(x) =
/Q
0, x ∈
конечно, не интегрируема на отрезке [0, 1] (по-
тому что не ограничена на нем). Но она локаль- не будет локально интегрируемой, например на
но интегрируема на полуинтервале (0, 1] (потому R, потому что она не интегрируема ни на каком
что непрерывна на (0, 1]). отрезке.

Несобственный интеграл по конечному промежутку.


536 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

• Пусть функция f локально интегрируема на полуинтервале (a; b], где a, b – произвольные


числа. Тогда предел
ˆ b
lim f (x) d x
t→a+0 t

называется несобственным интегралом от f по конечному промежутку (a; b] и обозна-


чается ˆ b
f (x) d x
a
Если этот предел существует и конечен, то говорят, что несобственный интеграл схо-
дится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
• Аналогично, если f локально интегрируема на полуинтервале [a; b), то предел
ˆ t
lim f (x) d x
t→b−0 a

называется несобственным интегралом от f по конечному промежутку [a; b) и обозна-


чается ˆ b
f (x) d x
a
и опять если этот предел существует и конечен, то говорят, что несобственный интеграл
сходится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
Рассмотрим примеры.

⋄ 9.1.6. = cos 1 − lim cos y


y→+∞
  | {z }
1
dx 1
dx 1 x=1
ˆ ˆ
предел не существует
= lim = lim − =
0 x2 t→+0 t x2 t→+0 x x=t
  Вывод: интеграл расходится.
1
= lim −1 + = +∞ ⋄ 9.1.9.
t→+0 t
1 ˆ 12
Вывод: интеграл расходится. dx dx
ˆ 2
= lim =
⋄ 9.1.7. 0 x ln2 x t→+0 t x ln2 x
1 12
ˆ 21
d(ln x)
ˆ
dx1 ˆ t
dx = lim = − lim =
√ = lim √ = t→+0 t ln2 x t→+0 ln x t
2  
0 1−x t→1−0 0 1 − x2 1 1 1
x=t = lim − 1 =
t→+0 ln t ln 2 ln 2
= lim arcsin x = lim (arcsin t − 0) =
t→1−0 x=0 t→1−0
π Вывод: интеграл сходится и равен 1
= arcsin 1 = ln 2 .
2
π ⊲⊲ 9.1.10. Вычислите интегралы или установите
Вывод: интеграл сходится и равен 2. их расходимость:
⋄ 9.1.8. ´π
1) 04 ctg x d x
´ 1 dx
ˆ
sin x1 d x
1 ˆ 1
sin x1 d x 2) 0 √x1−x 2
= lim =
0 x2 t→+0 t x2 ´ 4 dx
3) 0 x+√x
1 1
ˆ 1
1 1 ´1
= − lim sin d = lim cos = 4) 02 x dlnxx
t→+0 t x x t→+0 x t
1 ´0 1
5) −1 e x dx2x
  t = 1y
1 t= ´1 1
= lim cos 1 − cos = y =
6) 0 e x xd 2x
t→+0 t t → +0 ´ π sin x+cos x
y → +∞ 7) 04 √ 3
sin x−cos x
§ 1. Несобственные интегралы 537

Несобственный интеграл по бесконечному промежутку. Выше мы определили несобствен-


ный интеграл по конечному промежутку, формализующий понятие площади криволинейной тра-
пеции специального вида: основанием такой трапеции является конечный полуинтервал, а “по вер-
тикали” эта фигура может быть неограничена (такие фигуры мы описывали в примерах 9.1.1 и
9.1.2).
Но помимо таких криволинейных трапеций можно рассматривать другие, основаниями которых
являются бесконечные полуинтервалы, и которые поэтому “неограничены по горизонтали” (эту си-
туацию мы описывали в примере 9.1.3). Соответствующий математический объект, формализующий
это понятие также называется неопределенным интегралом, но уже по бесконечному промежутку.

• Пусть функция f локально интегрируема на полуинтервале [a; +∞), где a – произвольное


число. Тогда предел
ˆ t
lim f (x) d x
t→+∞ a

называется несобственным интегралом от f по бесконечному промежутку [a; +∞) и


обозначается
ˆ +∞
f (x) d x
a

Если этот предел существует и конечен, то говорят, что несобственный интеграл схо-
дится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
• Аналогично, если f локально интегрируема на полуинтервале (−∞; b], то предел
ˆ b
lim f (x) d x
t→−∞ t

называется несобственным интегралом от f по бесконечному промежутку (−∞; b] и


обозначается
ˆ b
f (x) d x
−∞

и опять если этот предел существует и конечен, то говорят, что несобственный интеграл
сходится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.

Рассмотрим примеры.

+∞ t
⋄ 9.1.11.
ˆ ˆ
cos x d x = lim cos x d x =
ˆ +∞ ˆ t 0 t→+∞ 0
dx dx t
= lim =
1 x t→+∞ 1 x = lim sin x = lim sin t
t→+∞ 0 t→+∞
t | {z }

= lim ln x = lim ln t = ∞ предел не существует
t→+∞ 1 t→+∞

Вывод: интеграл расходится. Вывод: интеграл расходится.


⋄ 9.1.12.
⊲⊲ 9.1.14. Вычислите интегралы или установите
ˆ 0 ˆ 0 0
их расходимость:
ex d x = lim ex d x = lim ex =
−∞ t→−∞ t t→−∞ t
t

= lim 1 − e = 1 ´ +∞ arctg x d x
´ +∞
t→−∞ 1) 2 x2 +1 4) 0 xex d x
´ +∞ d x
Вывод: интеграл сходится и равен 1. ´ +∞ 5) e
2) ex d x ´ +∞ xx lnd xx
0 6) 3 2
⋄ 9.1.13. ´0 ´ 0 x −1 dx
3) −∞
ex d x 7) −∞ x2 +2x+2
538 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

(b) Несобственные интегралы от степенной и показательной функций


Мы видели, что несобственный интеграл может сходиться, а может расходиться. Здесь мы поймем,
в каких случаях сходится интеграл от конкретных двух функций – x1α и ax .

Теорема 9.1.15 (о несобственном интеграле по 2) Если α = 1, то интеграл расходится:


конечному промежутку от степенной функции).
+∞ +∞
dx dx
ˆ ˆ
(
ˆ b
dx сходится, если α < 1 = =
←− a xα a x
0 xα
расходится, если α > 1 ˆ t
dx x=t

= lim = lim ln x =
Доказательство. Рассмотрим три случая. t→+∞ a x t→+∞ x=a
1) Если α < 1, то интеграл сходится: = lim {ln t − ln a} = ∞
t→+∞
ˆ b ˆ b ˆ b
dx −α
α
= x d x = lim x−α d x = 3) Если α < 1, то интеграл расходится:
0 x 0 t→+0 t

x1−α x=b ˆ +∞
dx
ˆ +∞
= lim = = x−α d x =
t→+0 (1 − α) x=t α
 1−α  a x a
b t1−α ˆ t
x1−α x=t
= lim − = = lim x−α d x = lim =
t→+0 (1 − α) (1 − α) t→+∞ a t→+∞ (1 − α) x=a
1 − α > 0  1−α   
b1−α t a1−α 1−α>0
= поэтому = = lim − = 1−αпоэтому =∞
t1−α → 0 (1 − α) t→+∞ (1 − α) (1 − α) t →∞
2) Если α = 1, то интеграл расходится:
ˆ b ˆ b ˆ b
dx dx dx
α
= = lim = Теорема 9.1.17 (о несобственном интеграле от
0 x 0 x t→+0 t x показательной функции).
x=b
(
= lim ln x = lim {ln b − ln t} = ∞ ˆ +∞
t→+0 x=t t→+0
x сходится, если 0 < A < 1
A d x ←−
3) Если α > 1, то интеграл расходится: a расходится, если A > 1
ˆ b ˆ b ˆ b
dx −α Доказательство. Рассмотрим три случая.
α
= x d x = lim x−α d x =
0 x 0 t→+0 t 1) Если 0 < A < 1, то интеграл сходится:
x1−α x=b
= lim = ˆ +∞ ˆ t
t→+0 (1 − α) x=t
 1−α    Ax d x = lim Ax d x =
t→+∞
b t1−α 1−α<0 a a
= lim − = 1−α поэтому = Ax t 1
t→+0 (1 − α) (1 − α) t →∞ = lim = lim (At − Aa ) =
t→+∞ ln A a ln A t→+∞
=∞ 0 < A < 1
Aa
= поэтому = −
At → 0 ln A
Теорема 9.1.16 (о несобственном интеграле по
2) Если A = 1, то интеграл расходится:
бесконечному промежутку от степенной функ-
ции). ˆ +∞ ˆ +∞ ˆ t
ˆ +∞ ( Ax d x = 1 d x = lim 1 dx =
dx сходится, если α > 1 a a t→+∞ a
←−
a xα
расходится, если α 6 1 x t t−a
= lim = lim = +∞
t→+∞ ln A a t→+∞ ln A
Доказательство. Рассмотрим три случая.
1) Если α > 1, то интеграл сходится: 3) Если A > 1, то интеграл расходится:
ˆ +∞ ˆ +∞ ˆ t
dx −α +∞ t
x−α d x =
ˆ ˆ
= x d x = lim
a xα a t→+∞ a Ax d x = lim Ax d x =
t→+∞
x1−α x=t
a a
= lim = Ax t 1
t→+∞ 1 − α x=a = lim = lim (At − Aa ) =
 1−α    t→+∞ ln A a ln A t→+∞
t a1−α 1−α <0  A>1 
= lim − = поэтому = = поэтому =∞
t→+∞ 1 − α 1−α t1−α → 0 t
A →∞
a1−α
=−
1−α
§ 1. Несобственные интегралы 539

(c) Замена переменной в несобственном интеграле


Если функции f и g определены на полуинтервале [a; b), то символом
ˆ b
f (x) d g(x)
a

обозначается несобственный интеграл от функции f · g ′ по [a; b):


ˆ b ˆ b ˆ t
f (x) d g(x) := f (x) · g ′ (x) d x = lim f (x) · g ′ (x) d x
a a t→b−0 a

   
⋄ 9.1.18. 2 t 2
= lim − 1 = lim 2 − 1 = 2
ˆ +∞ ˆ +∞ ˆ t t→+∞ x2 1 t→+∞ t2
1 1 1
√ d ln x = 3 dx = lim 3 dx =
1 x 1 x2 t→+∞ 1 x2

Теорема 9.1.19 (о замене переменной в несобственном интеграле). Пусть даны:


1) функция f , непрерывная на полуинтервале [a; b)
2) функция ϕ, определенная на полуинтервале [α; β), со следующими свойствами:
a) ϕ гладкая на полуинтервале [α; β) (то есть ϕ гладкая на каждом отрезке1
[s, t] ⊆ [α; β);
b) ∀t ∈ [α; β) ϕ(t) ∈ [a; b);
c) ϕ(α) = a, ϕ(t) −→ b.
t→β−0

Тогда ˆ b ˆ β ˆ β
f (x) d x = f (ϕ(t)) d ϕ(t) = f (ϕ(t)) · ϕ′ (t) d t (9.1.1)
a α α

Доказательство. Здесь используется тот же прием, что и при доказательстве теоремы 8.3.19 о за-
мене переменной в определенном интеграле.2 Пусть F – первообразная функции f на полуинтервале
[a, b):
F ′ (x) = f (x), x ∈ [a, b) (9.1.2)
Например, в качестве F можно взять интеграл с переменным верхним пределом:
ˆ ˆ x
F (x) = f (t) d t = f (t) d t, x ∈ [a, b)
[a,x] a

(тогда по теореме 8.3.1 F будет первообразной для f на каждом отрезке [a, c] ⊆ [a, b), и значит,
на всем полуинтервале [a, b)). Композиция F ◦ ϕ будет первообразной для функции (f ◦ ϕ) · ϕ′ , на
полуинтервале [α, β), по формуле (6.1.28):

(F ◦ ϕ)′ (t) = F ′ ( ϕ(t) ) · ϕ′ (t) = f (ϕ(t)) · ϕ′ (t), t ∈ [α, β) (9.1.3)


|{z}

[a, b)
k
D(F ′ )

Поэтому

1 Функция, гладкая на отрезке, была определена на с.497.


2 Можно использовать теорему 8.3.19 напрямую, но для этого нужно ввести дополнительное условие, что функция
ϕ : [α, β) → [a, b) монотонна, чтобы для всякого T ∈ [α, β) ограничение ϕ|[α,T ] было отображением из [a, T ] в [a, ϕ(T )]
−−→ −−−−→
(и поэтому преобразованием ориентированного отрезка α, T в ориентированный отрезок a, ϕ(T )).
540 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
ˆ β ˆ T t=T

f (ϕ(t)) · ϕ′ (t) d t = lim f (ϕ(t)) · ϕ′ (t) d t = (8.3.163) = lim (F ◦ ϕ)(t) =
α T →β−0 α T →β−0 t=α
     
= lim F ϕ(T ) − F ϕ(α) = lim F ϕ(T ) − F (a) = (8.3.163) =
T →β−0 | {z } T →β−0

=
(8.3.170)
a
ˆ ϕ(T ) ˆ y ˆ b
= lim f (x) d x = lim f (x) d x = f (x) d x
T →β−0 a y→b−0 a a

⋄ 9.1.20. ⋄ 9.1.21.
+∞
dx x = 1t , t= x1

ˆ

√ = x = 2 ⇔ t = 12 = 1
dx t = 1 − x, x = 1 − t2
ˆ
x x2 − 1 x → +∞ ⇔ t → +0
√ = x=0⇔t=1 =
2
0 ˆ 21 12 0 (2 − x) 1 − x x → 1 − 0 ⇔ t → +0
− dt dt π
ˆ
ˆ 0 ˆ 1 1
= √ = √ = arcsin t = −t d t dt π
1 1−t 2
0 1−t 2 0 6 = 2
= 2
= arctg t =
1 t(t + 1) 0 t +1 2
2
0

(d) Признаки сходимости несобственных интегралов


Не всякий несобственный интеграл можно явно вычислить, даже если известно, что он сходится.
Например, попробуйте найти несобственный интеграл
1
sin2 x1
ˆ
√ dx (9.1.4)
0 x

и Вы увидите, что это нелегко. Поэтому часто бывает важно просто понять, сходится или нет
данный несобственный интеграл, не вычисляя его. Например, интеграл (9.1.4), как будет показано
в примере 9.1.25 сходится (хотя и непонятно, чему равен).
В этом параграфе мы приведем некоторые признаки сходимости несобственных интегралов.

Признаки сходимости знакопостоянных интегралов


´b
• Несобственный интеграл a f (x) d x называется
— знакопостоянным, если его подынтегральная функция f не меняет знак на про-
межутке интегрирования;
— знакоположительным, если его подынтегральная функция f неотрицательная
на промежутке интегрирования

f (x) > 0, x ∈ (a, b)

Понятно, что исследование на сходимость знакопостоянных интегралов сводится исследованию


знакоположительных: если f (x) 6 0, то можно взять функцию g(x) = −f (x) > 0, и окажется, что
ˆ b ˆ t ˆ t ˆ b
f (x) d x = lim f (x) d x = − lim g(x) d x = − g(x) d x
a t→b−0 a t→b−0 a a

откуда и будет следовать, что интеграл


ˆ b
f (x) d x
a

сходится тогда и только тогда, когда сходится интеграл


ˆ b
g(x) d x
a
§ 1. Несобственные интегралы 541

Критерий сходимости знакоположительного интеграла.

Теорема 9.1.22. Пусть функция f локально интегрируема и неотрицательна на полуинтервале


[a; b)
f (x) > 0, x ∈ [a, b)
´b ´t
Тогда сходимость интеграла a f (x) d x эквивалентна ограниченности интегралов a f (x) d x, t ∈
[a, b):
ˆ b ˆ t
f (x) d x сходится ⇐⇒ sup f (x) d x < ∞
a t∈[a,b) a

´b
! 9.1.23. Условие справа (то есть утверждение, что интегралы a f (x) d x ограничены) принято
записывать неравенством
ˆ b
f (x) d x < ∞
a
´b
и, в силу теоремы 9.1.22, такая запись считается эквивалентной утверждению, что интеграл a f (x) d x
сходится (при неотрицательной f ).

Доказательство. Обозначим
ˆ t
F (t) = f (x) d x
a

и заметим, что это будет монотонно неубывающая функция, поскольку под интегралом стоит неот-
рицательная функция: если α 6 β, то
ˆ α ˆ α ˆ β ˆ β
F (α) = f (x) d x 6 f (x) d x + f (x) d x = f (x) d x = F (β)
a a
|α {z } a
6

Отсюда мы получим цепочку:


ˆ b
интеграл f (x) d x сходится
a

m
ˆ t
F имеет конечный предел слева в b: lim F (t) = lim f (x) d x < ∞
t→b−0 t→b−0 a
| {z }
(применяем (4.4.156), поскольку F – неубывающая функция) k
sup F (t)
t∈[a,b)

m
ˆ t
sup f (x) d x = sup F (t) < ∞.
t∈[a,b) a t∈[a,b)

Признак сравнения интегралов.

Теорема 9.1.24 (признак сравнения несобственных интегралов). Пусть f и g – локально инте-


грируемые функции на полуинтервале [a; c) (где c – число или символ бесконечности +∞), причем

0 6 f (x) 6 g(x), x ∈ [a; c) (9.1.5)


Соответствующая зависимость между несобственными интегралами коротко записывается
следующим образом: ˆ c ˆ c
f (x) d x 6 g(x) d x
a a

Тогда
542 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a f (x) d x: ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится
a a
´c
(ii) из расходимости меньшего интеграла a
f (x) d x следует расходимость большего инте-
´c
грала a g(x) d x:
ˆ c ˆ c
f (x) d x расходится =⇒ g(x) d x расходится
a a

Доказательство. Обозначим
ˆ t ˆ t
F (t) = f (x) d x, G(t) = g(x) d x
a a

тогда из (9.1.5) следует, что, во-первых, как и в доказательстве теоремы 9.1.22,

F (t) и G(t) − неубывающие функции на промежутке t ∈ [a; c), (9.1.6)

и, во-вторых,
0 6 F (t) 6 G(t), t ∈ [a; c). (9.1.7)
1. Теперь мы получаем цепочку:
ˆ c
g(x) d x сходится
a

⇓ теорема 9.1.22
ˆ t
sup g(x) d x < ∞
t∈[a,b) a
| {z }
k
supt∈[a,b) G(t)
6

supt∈[a,b) F (t)

supt∈[a,b) at f (x) d x


ˆ t
sup f (x) d x < ∞
t∈[a,b) a

⇓ теорема 9.1.22
ˆ c
f (x) d x сходится
a

´ c 2. Мы доказали утверждение (i). ´ c Утверждение (ii) является его следствием: если интеграл
a f (x) d x расходится, то интеграл g(x) d x не может сходиться (потому что иначе мы получили
´c ´c a
бы что a f (x) d x расходится, а a g(x) d x сходится, а это невозможно в силу уже доказанного
утверждения 2 (A)).

⋄ 9.1.25. Чтобы понять, сходится ли интеграл Отсюда получаем


sin2 x1
ˆ 1 ˆ 1
sin2 x1
ˆ 1
1
√ dx 06 √ dx 6 √ dx
0 x 0 x 0 x

заметим, что подынтегральная функция поло- причем больший интеграл сходится по теореме
жительна и меньше функции √1x : 9.1.15. Значит, по теореме 9.1.24, наш исходный
интеграл тоже сходится.
2 1
´ 1 sin2 1
sin x 1 Вывод: интеграл 0 √xx d x сходится.
06 √ 6 √
x x
§ 1. Несобственные интегралы 543
´ +∞
⋄ 9.1.26. Для следующего интеграла Вывод: интеграл π
3+cos
√ x
x x
d x сходится.
ˆ 1
1
dx ⋄ 9.1.28. Снова рассмотрим интеграл по беско-
0 sin x нечному промежутку:
мы аналогичные рассуждения запишем более ко-
ротко: +∞ +∞
3 + cos x 2
ˆ ˆ
ˆ 1
1
ˆ 1
1 √ dx > √ dx =
dx > dx π x π x
0 sin x x ˆ +∞
| 0 {z } 1
=2 1 dx
расходится по π x 2
теореме 9.1.15 | {z }
´1 расходится по
1
Вывод: интеграл 0 sin x
d x расходится. теореме 9.1.16

⋄ 9.1.27. Теперь рассмотрим интеграл по беско- ´ +∞ 3+cos


Вывод: интеграл √ x d x расходится.
нечному промежутку: π x

+∞
3 + cos x +∞
4 ⊲⊲ 9.1.29. Исследуйте на сходимость интегралы:
ˆ ˆ
√ dx 6 √ dx =
π x x π x x
ˆ +∞ ´ +∞ sin2 x ´1 cos x 1
1 1) π x2 d x; 4) 0
√ 3 x d x;
=4 3 dx ´ +∞ ln x ´ 1 e x1
x2 }
| π {z 2) 3 x d x;

5)
e 0 x3 d x;
сходится по ´ +∞ arctg x ´ 0 e x1
теореме 9.1.16 3) 2

x x
d x; 6) −1 x3 d x

Критерий Коши сходимости несобственного интеграла


Теперь от знакопостоянных интегралов мы возвращаемся к произвольным.

Теорема 9.1.30 (критерий Коши сходимости несобственного интеграла). 3 Пусть функция f ло-
кально интегрируема на полуинтервале [a; b). Тогда следующие условия эквивалентны:
(i) несобственный интеграл
ˆ b
f (x) d x
a

сходится;
(ii) для любых двух числовых последовательностей sn , tn ∈ [a; b), стремящихся к b

sn −→ b, tn −→ b,
n→∞ n→∞

−−−→
интеграл от функции f по направленному отрезку sn ; tn стремится к нулю при n → ∞:
ˆ tn
f (x) d x −→ 0
sn n→∞

Доказательство. Рассмотрим функцию


ˆ t
F (t) = f (x) d x
a

Тогда мы получим следующую логическую цепочку:


ˆ b
несобственный интеграл f (x) d x сходится
a

m
существует конечный предел lim F (t)
t→b−0

3 Этот результат понадобится ниже при доказательстве признака абсолютной сходимости несобственного интеграла

(теорема 9.1.33)
544 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

m (теорема 4.4.37)

∀sn −→ b, ∀tn −→ b F (tn ) − F (sn ) −→ 0


n→∞ n→∞ | {z } n→∞

=
´ tn ´ sn
a
f (x) d x − a
f (x) d x

=
´ tn
sn
f (x) d x

m
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞

( 2  )
⋄ 9.1.31. Критерий Коши обычно бывает удобен 1 5π π 2
для доказательства расходимости несобственно- = + 2πn − + 2πn =
4 6 6
го интеграла (если он действительно расходит-
ся). Рассмотрим, например, интеграл 1 n 25π 2 5
= + π 2 n + π 2 · n2 −
ˆ +∞ 4 36 3
π2 1 2 o
x · sin x d x = − π n − π 2 · n2 =
0 36 3
Выберем следующие две числовые последова- 1 n 24π 2 4 o
= + π 2 n −→ ∞ = 6 0,
тельности: 4 36 3 n→∞

π 5π
sn = + 2πn, tn = + 2πn и по признаку Коши это означает, что наш инте-
6 6
грал расходится.
Тогда ´ +∞
Вывод: интеграл 0 x · sin x d x расходится.
1
∀x ∈ [sn ; tn ] sin x >
2
поэтому ⊲ 9.1.32. Проверьте по критерию Коши, что ин-
ˆ tn ˆ tn теграл
1 ˆ +∞
x · sin x d x > x · dx =
sn sn 2 x · cos x d x
2 5π +2πn 0
x 6
= = расходится.
4 π6 +2πn

Признак абсолютной сходимости


Теорема 9.1.33 (признак абсолютной сходимости). Пусть функция f локально интегрируема на
полуинтервале [a; b). Тогда справедливы импликации:
ˆ b ˆ b ˆ t
f (x) d x сходится ⇐= |f (x)| d x сходится ⇐= sup |f (x)| d x < ∞
a a t∈[a,b) a

Доказательство.
ˆ b
интеграл |f (x)| d x сходится
a

⇓ (теорема 9.1.30)
ˆ tn
∀sn −→ b, ∀tn −→ b |f (x)| d x −→ 0
n→∞ n→∞ sn n→∞
| {z }
6

´
tn
sn f (x) d x
6


§ 1. Несобственные интегралы 545
ˆ tn

∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ n→∞
sn


ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞

⇓ (теорема 9.1.30)
ˆ b
несобственный интеграл f (x) d x сходится
a

⋄ 9.1.34. Чтобы исследовать на сходимость исследуется тем же способом:


несобственный интеграл ˆ +∞ ˆ +∞
sin x 1
06 dx 6 dx
ˆ 1
1 x 2 x2
1 1
sin d x
0 x
По признаку сравнения для знакопостоянных
рассмотрим соответствующий интеграл от моду- интегралов (теорема´ +∞ 9.1.24), из сходимости боль-
1
ля шего интеграла – 1 x2
d x – следует сходи-
ˆ 1 ˆ 1 мость меньшего – 1
´ +∞ sinx
d x. Отсюда по при-

06 sin 1 d x 6 1 dx знаку абсолютной
x2
сходимости (теорема 9.1.33)
x
0 0 ´ +∞ sin x
Вывод: интеграл 1 x 2 d x сходится.
и применим признак сравнения для знакопосто-
янных интегралов (теорема 9.1.24): поскольку ⊲⊲ 9.1.36. Исследуйте на сходимость интегра-
´1
больший интеграл – 0 1 d x = 1 – сходится, лы:
´1 ´ +∞
меньший – 0 sin x1 d x – тоже должен сходить- 1) 0 e−x cos x d x;
ся. Отсюда по признаку абсолютной сходимости ´ +∞ √x cos x
2) 2 x2 +x+ln x d x;
(теорема 9.1.33) получаем ´ +∞ (1+√x+ln x) sin x
´1
Вывод: Интеграл 0 sin x1 d x сходится. 3) 2 x2 +x3 +x4 d x;
´ 1 cos x1
4) 0 √x+x+x2 d x;
⋄ 9.1.35. Интеграл
´ 1 cos x1
ˆ +∞ 5) 0 e√x −1 d x;
sin x √
x sin 1
dx ´ 1
6) 0 ln(1+x+x x2
x2 2 ) d x.
1

Признаки Дирихле и Абеля для интегралов.


Теорема 9.1.37 (признак Дирихле). Пусть даны:
(i) непрерывная функция f : [a; +∞) → R с ограниченной первообразной на [a; +∞):
ˆ t


sup f (x) d x < ∞ (9.1.8)
t>a a

(ii) монотонная функция g : [a; +∞) → R, стремящаяся к нулю:


монотонно
g(x) −→ 0. (9.1.9)
x→+∞

Тогда интеграл
ˆ +∞
f (x) · g(x) d x
a

сходится.
546 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Доказательство. Обозначим ˆ t

C = sup f (x) d x < ∞
t>a a
и заметим, что ˆ t

∀s, t ∈ [a, ∞) f (x) d x 6 2C (9.1.10)

s

Действительно,
ˆ t ˆ t s ˆ t ˆ s

ˆ
f (x) d x = f (x) d x − f (x) d x 6 f (x) d x + f (x) d x 6 2C

s a a
| a {z } | a {z }

>

>
C C

´∞
Чтобы убедиться, что интеграл a f (x)·g(x) d x сходится, воспользуемся критерием Коши (теорема
9.1.30): выберем произвольные последовательности

sn −→ +∞, tn −→ +∞.
n→∞ n→∞

−−−→
По формуле Бонне (8.3.164), для любого n найдется точка ξn ∈ sn , tn такая, что
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x
sn sn ξn

−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞

ˆ tn ˆ ξn ˆ tn

f (x) · g(x) d x 6 |g(sn )| · f (x) d x + |g(tn )| · f (x) d x −→ 0
sn | {z } sn | {z } ξn n→∞
↓ | {z } ↓ | {z }
>

>
0 (9.1.10) 0 (9.1.10)
2C 2C

´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.

⋄ 9.1.38. Для исследования интеграла тоже сходится по признаку Дирихле (с f (t) =


1
ˆ +∞ sin t, g(t) = 2√ t
).
sin x
dx
1 x ⋄ 9.1.40. Интеграл
можно воспользоваться признаком Дирихле, по- 1
ложив f (x) = sin x и g(x) = x1 , и мы получим cos x1
1 x = t, x = 1t
ˆ
√ d x = x=1⇔t=1 =
´ +∞ sin x x → +0 ⇔ t → +∞
Вывод: интеграл 1 x d x сходится. 0 x x
3

ˆ 1   ˆ 1
⋄ 9.1.39. Интеграл √
3 1 cos t
= t t · cos t d =− 2 dt =
ˆ +∞ √ +∞ t +∞ t 3
x2 = t, x = t ˆ +∞
x · sin x d x =
2 2
x=1⇔t=1 =

cos t
1 x → +∞ ⇔ t → +∞ = 2 dt
+∞ +∞
1 t3
√ sin t
ˆ ˆ
= t · sin t d t= √ dt тоже сходится по признаку Дирихле.
1 1 2 t

Теорема 9.1.41 (признак Абеля). Пусть даны:


´∞
(i) сходящийся интеграл a f (x) d x и
(ii) монотонная и ограниченная функция g : [a, ∞) → R.
´∞
Тогда интеграл a f (x) · g(x) d x сходится.
§ 1. Несобственные интегралы 547

Доказательство. Воспользуемся критерием Коши (теорема 9.1.30): выберем произвольные после-


довательности
sn −→ +∞, tn −→ +∞.
n→∞ n→∞
−−−→
По формуле Бонне (8.3.164), для любого n найдется точка ξn ∈ sn , tn такая, что
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x
sn sn ξn

−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞

ограничена ограничена
ˆ tn z }| { ˆ ξn z }| { ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x −→ 0
sn sn ξn n→∞
| {z } | {z }
↓ теорема 9.1.30 ↓ теорема 9.1.30
0, 0,
´поскольку
∞ ´поскольку

a
f (x) d x a
f (x) d x
сходится сходится

´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.

⋄ 9.1.42. Для исследования интеграла Поскольку функция x 7→ cos x1 монотонна, по


´ +∞
ˆ +∞ признаку Абеля интеграл 1 x2 ·sin x2 ·cos x1 d x
sin x
· arctg x d x тоже сходится.
1 x

вспомним, что в примере (9.1.38) мы убедились, ⋄ 9.1.44. Следующий интеграл заменой пере-
что интеграл менных превращается в интеграл, который мож-
но исследовать по признаку Абеля:
ˆ +∞
sin x
dx
1 x ˆ 1 t= 1
arccos x 1 x
· cos d x = x = 1t =
сходится. Поскольку функция x 7→ arctg x мо- 0 x x d x = − d2t
нотонна, по
´ +∞признаку Абеля мы получаем, что t
sin x 1
1 d t
ˆ
интеграл 1 · arctg x d x тоже сходится.
x =− t · arccos · cos t · 2 =
+∞ t t
⋄ 9.1.43. Для исследования интеграла ˆ ∞
cos t 1
ˆ +∞ = · arccos d t
1 1 t t
x2 · sin x2 · cos d x
1 x ´∞
По признаку Дирихле интеграл 1 cost t d t схо-
вспомним, что в примере 9.1.39 мы доказали схо-
дится. А функция x 7→ arccos 1t монотонна и
димость интеграла
ограничена на [0, +∞).´Значит, по признаку Абе-

ˆ +∞ ля, сходится интеграл 1 cost t ·arccos 1t d t, а вме-
2 2
x · sin x d x ´ 1
сте с ним и интеграл 0 arccos x
· cos x1 d x.
1 x

(e) Асимптотика интегралов


Асимптотическая эквивалентность интегралов
Теорема 9.1.45 (признак эквивалентности несобственных интегралов). Пусть функции f и g об-
ладают следующими свойствами:
a) f и g непрерывны на полуинтервале [a; c);
b) f (x) ∼ g(x);
x→c−0
c) g(x) > 0, ∀x ∈ (a; c).
548 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Соответствующая зависимость между несобственными интегралами коротко записывается


формулой: ˆ c ˆ c
f (x) d x ∼ g(x) d x
a c a
´c ´c
Тогда сходимость интеграла a f (x) d x эквивалентна сходимости интеграла a g(x) d x:
ˆ c ˆ c
f (x) d x сходится ⇐⇒ g(x) d x сходится, (9.1.11)
a a

При этом,
(i) если эти интегралы сходятся, то справедливо следующее соотношение, показывающее,
что скорость их сходимости будет одинаковой:
ˆ c ˆ c
f (x) d x ∼ g(x) d x (9.1.12)
T T →c−0 T

(ii) если эти интегралы расходятся, то справедливо следующее соотношение, показываю-


щее, что скорость их расходимости будет одинаковой:
ˆ T ˆ T
f (x) d x ∼ g(x) d x (9.1.13)
a T →c−0 a

! 9.1.46. Если интегралы (9.1.11) расходятся, то то соотношение (9.1.13) для сходящихся инте-
формула (9.1.12) утрачивает смыл, и поэтому пе- гралов возможно только, если подынтегральные
рестает быть верной. А если интегралы (9.1.11) функции совпадают. Действительно, из неравен-
сходятся, то формула (9.1.13), хотя и сохраняет ства g(x) > 0 следует, что интеграл от g не может
смысл, но также перестает работать. Например, быть нулевым,
x−1 1
∼ ˆ c ˆ T
x3 x→+∞ x2 g(x) d x = lim g(x) d x 6= 0
однако a T →c−0 a

ˆ T ˆ T 
x−1 1 1 Поэтому соотношение (9.1.13), если оно выпол-
d x = − dx = няется, означает просто равенство пределов:
1 x3 1 x2 x3
  T
1 1 1 1 1 ˆ T ˆ T
= − + 2 =− +1+ − ∼ lim f (x) d x = lim g(x) d x
x 2x T 2T 2 2 T →+∞ T →c−0 T →c−0
1 a a
T
1 1 1
∼ 6∼ 1 ∼ 1 − = − = Отсюда
T →+∞ 2 T →+∞ T →+∞ T x
1
ˆ T
1 0
= dx
>

x2 z }|
1 ˆ T  {
То есть lim g(x) − f (x) d x =
T →c−0 a
T T
x−1 1
ˆ ˆ
T T
d x 6∼ dx
ˆ ˆ
1 x3 T →+∞ 1 x2 = lim g(x) d x − lim f (x) d x = 0
T →c−0 a T →c−0 a
Более того, можно заметить, что если одна из
функций не превосходит другую на интервале ⇓
интегрирования, например,
f (x) 6 g(x), x ∈ [a, c) f (x) = g(x), x ∈ [a, c)

Для доказательства теоремы 9.1.45 нам понадобится следующая


Лемма 9.1.47. Пусть функция f непрерывна на полуинтервале [a; c) и пусть b ∈ [a; c). Тогда
сходимость несобственного интеграла от f на промежутке [a; c) эквивалентна сходимости на
промежутке [b; c):
ˆ c ˆ c
f (x) d x сходится ⇐⇒ f (x) d x сходится
a b
§ 1. Несобственные интегралы 549

Доказательство. Это следует из того, что интегралы по промежуткам [a; c) и [b; c) отличаются
друг от друга на константу
!
ˆ c ˆ t ˆ b ˆ t
f (x) d x = lim f (x) d x = lim f (x) d x + f (x) d x =
a t→c a t→c a b
ˆ b ˆ t ˆ b ˆ c
= f (x) d x + lim f (x) d x = f (x) d x + f (x) d x
a t→c b a b

Доказательство теоремы 9.1.45. . 1. Сначала докажем (9.1.11). Условие (b) означает, что

f (x)
−→ 1 (9.1.14)
g(x) x→c−0
f (x)
По определению предела Коши (с.324), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ ( 12 ; 23 ), то
есть
1 f (x) 3
∀x ∈ [b; c) < <
2 g(x) 2
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
1 3
∀x ∈ [b; c) g(x) < f (x) < g(x)
2 2
Перепишем это иначе: (
g(x) < 2f (x)
∀x ∈ [b; c) (9.1.15)
f (x) < 32 g(x)
Отсюда получаются две цепочки следствий. Во-первых,
ˆ c
интеграл f (x) d x сходится
a

⇓ (применяем лемму 9.1.47)


ˆ c
интеграл f (x) d x сходится
b

ˆ c
интеграл 2f (x) d x сходится
b
 
вспоминаем первое неравенство
⇓ в (9.1.15) и теорему 9.1.24
ˆ c
интеграл g(x) d x сходится
b
⇓ (применяем лемму 9.1.47)
ˆ c
интеграл g(x) d x сходится
a
И, во-вторых, ˆ c
интеграл g(x) d x сходится
a
⇓ (применяем лемму 9.1.47)
ˆ c
интеграл g(x) d x сходится
b

c
3
ˆ
интеграл g(x) d x сходится
b 2
 
вспоминаем второе неравенство
⇓ в (9.1.15) и теорему 9.1.24
550 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
ˆ c
интеграл f (x) d x сходится
b
⇓ (применяем лемму 9.1.47)
ˆ c
интеграл f (x) d x сходится
a

Мы доказали (9.1.11).
2. Остается доказать (9.1.12) и (9.1.13). Обе эти формулы доказываются с помощью правила
Лопиталя. Сначала предположим, что оба интеграла сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a

Тогда  
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
и поэтому
´c  
T
f (x) d x 0 −f (T ) f (T )
lim ´ c = = (6.2.92) = lim = lim = (9.1.14) = 1
T →c−0 g(x) d x 0 T →c−0 −g(T ) T →c−0 g(T )
T

Наоборот, предположим, что оба интеграла расходятся, и обозначим


ˆ T ˆ T
F (T ) = f (x) d x, G(T ) = g(x) d x
a a

Тогда  
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim = = (6.2.95) = lim = (9.1.14) = 1
T →c−0 T ∞ g(T )
´
g(x) d x T →c−0
a

⋄ 9.1.48. Чтобы понять, сходится ли интеграл Из формулы (9.1.13) можно вывести скорость
ˆ +∞ √ 2 расходимости:
x +1 ˆ T √ 2
dx x +1
ˆ T
1
1 x2 d x ∼ d x = ln T
x 2 T →+∞ x
1 1
заметим, что подынтегральная функция поло-
жительна, и подберем к ней эквивалентную: ⋄ 9.1.49. Рассмотрим интеграл
√ ˆ 1 √
x2 + 1 x 1 sin x
∼ = x
dx
x2 x→+∞ x2 x 0 e −1

Теперь по теореме 9.1.45 получаем, что сходи- Здесь особой точкой (x = 0) будет нижняя грани-
мость нашего интеграла эквивалентна сходимо- ца интегрирования, но теорема 9.1.45 применима
сти более простого интеграла: и к этому случаю, в очевидным образом пере-
формулированном виде. Опять подынтегральная
ˆ +∞ √ 2 ˆ +∞
x +1 1 функция положительна. Подберем к ней экви-
2
dx ∼ dx = валентную функцию при стремлении x к особой
1 x x→+∞ 1 x
+∞ точке: √ √
sin x x 1

= ln x = +∞ x
∼ = √
e − 1 x→0 x x
1
Мы получаем по теореме 9.1.45, что сходимость
Поскольку второй интеграл расходится, мы по- исходного интеграла эквивалентна сходимости
лучаем, что наш исходный интеграл тоже расхо- более простого интеграла
дится: ˆ +∞ √ 2 √
√ 1
ˆ 1 ˆ 1
x +1 sin x 1
d x = ∞ x
d x ∼ √ d x = 2 x
1 x2 0 e −1 0 0 x 0
§ 1. Несобственные интегралы 551

+∞ ˆ +∞
x + sin x x
ˆ
Второй интеграл сходится, значит, наш исходный
√ dx ∼ √ dx =
интеграл тоже сходится. Его скорость сходимо- 1 1+x 3 x→+∞ 1 x3
сти описывается формулой (9.1.12): √ +∞
ˆ +∞
1
√ = √ dx = 2 x
ˆ T
sin x
ˆ T
1 √ 1 x 1

x
d x ∼ √ dx = 2 T.
0 e −1 T →+0 0 x
Последний интеграл расходится, значит, наш ис-
⋄ 9.1.50. Те же самые рассуждения для инте- ходный интеграл тоже расходится. Скорость рас-
грала ходимсоти:
ˆ 1
1 − cos x
3
dx
0 ln(1 + x )
T ˆ T
x + sin x 1
ˆ
запишем короче: √ dx ∼ √ dx =
1 1 + x3 T →+∞ 1 x
1 1 x 2 √ T √ √
1 − cos x =2 x =2 T −2 ∼ 2 T
ˆ ˆ
2
dx ∼ dx = 1 T →+∞
0 ln(1 + x3 ) 0 0 x3
1 1
1 1 ⊲⊲ 9.1.53. Исследуйте на сходимость интегралы
ˆ

= d x = ln x
2 0 x 0 и оцените скорость сходимости и расходимости:
´ +∞ 1
Второй интеграл расходится, значит, наш исход- 1) 2 √ d x;
1+ x
ный интеграл тоже расходится. Скорость расхо- ´ +∞
2) 2 √1 d x;
димости описывается формулой 1+ x+x5
´ −2 1
ˆ 1 3) −∞ 1+x5 d x;
1 − cos x 1 11
ˆ
d x ∼ d x = − ln T ´1
3
T ln(1 + x ) T →+0 2 T x 4) 0 arctg√ x d x;
x3x
´ +∞ arctg x
⋄ 9.1.51. Снова интеграл по бесконечному про- 5) 1 √
x3x
d x;
межутку: ´ 1 arctg x
6) 0 √ 3
x
d x;
+∞ ˆ +∞
x + sin x x
ˆ ´ +∞ arctg x
√ dx ∼ √ dx = 7) 1 √3x d x;
1+x 6 x→+∞ x6
1 1 ´ 1 ex −1
ˆ +∞
x
ˆ +∞
1 1 +∞ 8) 0 x3 d x;
= d x = d x = − ´0 x
1 x3 1 x2 x 1 9) −1 e x−1 3 d x;
´1 1
Последний интеграл сходится, значит, наш ис- 10) 0 √x−1 d x;
ходный интеграл тоже сходится. Скорость схо- ´1 1
11) 0 √x−1 d x;
димости:
´1 1
ˆ +∞ ˆ +∞ 12) 0 ex −cos x d x;
x + sin x 1 1
√ dx ∼ 2
dx = ´ 1 ln(1+ √ 3 2
x )
T 1+x 6 T →+∞ T x T 13) 0 ex −1 d x;
´ +∞ ln(1+ x1 )
⋄ 9.1.52. Еще один интеграл по бесконечному 14) e x+ln x d x;
промежутку: ´ +∞ ln(1+ x1 +x)
15) e 1+ln x+sin x d x.

Асимптотическое сравнение интегралов

Теорема 9.1.54 (асимптотический признак сравнения). Пусть функции f и g обладают следую-


щими свойствами:
a) f и g непрерывны на полуинтервале [a; c);
b) f (x) ≪ g(x) (то есть f (x) = o (g(x)));
x→c−0 x→c−0
c) g(x) > 0, ∀x ∈ (a; c).

• Возникающая зависимость между несобственными интегралами коротко записывается


формулой
ˆ c ˆ c
f (x) d x ≪ g(x) d x.
a c a

Тогда
552 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a f (x) d x: ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится, (9.1.16)
a a

причем скорости сходимости оцениваются соотношением


ˆ c ˆ c
f (x) d x ≪ g(x) d x; (9.1.17)
T T →c−0 T
´c
(ii) из расходимости меньшего интеграла a
f (x) d x следует расходимость большего инте-
´c
грала a g(x) d x:
ˆ c ˆ c
f (x) d x расходится =⇒ g(x) d x расходится (9.1.18)
a a

причем скорости расходимости оцениваются соотношением


ˆ T ˆ T
f (x) d x ≪ g(x) d x; (9.1.19)
a T →c−0 a

Доказательство. 1. Забудем на время о формулах (9.1.17) и (9.1.19). Оставшиеся в условиях (i) и


(ii) утверждения (9.1.16) и (9.1.18) эквивалентны, поэтому из них достаточно доказать какое-нибудь
одно, например, первое. Условие (b) означает, что

f (x)
−→ 0. (9.1.20)
g(x) x→c−0
f (x)
По определению предела Коши (с.324), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ (−1; 1), то
есть
f (x)
∀x ∈ [b; c) − 1 < <1
g(x)
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
∀x ∈ [b; c) − g(x) < f (x) < g(x)
Перепишем это иначе:
∀x ∈ [b; c) |f (x)| < g(x) (9.1.21)
Отсюда получается следующая цепочка следствий:
ˆ c
интеграл g(x) d x сходится
a

⇓ лемма 9.1.47
ˆ c
интеграл g(x) d x сходится
b

⇓ неравенство (9.1.21) и теорема 9.1.24


ˆ c
интеграл |f (x)| d x сходится
b

⇓ теорема 9.1.33
ˆ c
интеграл f (x) d x сходится
b

2. Теперь вспомним о формулах (9.1.17) и (9.1.19). Они доказывается тем же приемом (с помощью
правила Лопиталя), что и формулы (9.1.12)-(9.1.13) выше. Сначала предположим, что оба интеграла
сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a
§ 1. Несобственные интегралы 553

Тогда  
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
и поэтому
´c  
T
f (x) d x 0 −f (T ) f (T )
lim c = = (6.2.92) = lim = lim = (9.1.20) = 0
T →c−0 −g(T )
´
T →c−0
T
g(x) d x 0 T →c−0 g(T )

Наоборот, предположим, что оба интеграла расходятся, и обозначим


ˆ T ˆ T
F (T ) = f (x) d x, G(T ) = g(x) d x
a a

Тогда  
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim ´T = = (6.2.95) = lim = (9.1.20) = 0
T →c−0 g(x) d x ∞ T →c−0 g(T )
a

⋄ 9.1.55. Чтобы исследовать на сходимость заметим, что


несобственный интеграл ex x

10
≫ e2
ˆ +∞ 10 x x→+∞
x sin x
dx Поэтому
0 ex
заметим, что ˆ +∞ x
e
ˆ +∞
x

x +∞
d x ≫ e 2 d x = 2e 2

x10 sin x 1 1 x10 +∞ 1 1


−x
≪ x = e
2
ex x→+∞ e 2
Поскольку меньший интеграл расходится, боль-
Поэтому ший тоже должен расходиться. Скорость расхо-
ˆ +∞ 10 ˆ +∞ димости оценивается формулой
x sin x x +∞
−x −
dx ≪ e 2 d x = −2e 2
0 ex +∞ 0 0 ˆ T x
e
ˆ T
x

10
dx ≫ e2 dx =
Поскольку больший интеграл (справа от ≪) схо- 1 x T →+∞ 1
дится, меньший (то есть наш исходный) интеграл T 1
= 2e 2 − 2e 2 ∼ 2e 2
T

тоже должен сходиться. Его скорость сходимости T →+∞


оценивается формулой (9.1.17): и, если упростить,
ˆ +∞ 10 ˆ +∞
x sin x x T ˆ T x
x
dx ≪ e− 2 d x = 2e− 2 e T
T e T →+∞ T
10
dx ≫ e2
1 x T →+∞
или, если упростить,
ˆ +∞ 10 Применяя оценку
x sin x − T2
d x ≪ e
T ex T →+∞ x10 ≪ eεx (ε > 0),
x→+∞
Применяя оценку
можно доказать формулу
x10 ≪ eεx (ε > 0),
x→+∞ T
ex
ˆ
можно доказать более точную формулу: d x ≫ aT (a < e)
1 x10 T →+∞
ˆ +∞ 10
x sin x ⋄ 9.1.57.
x
d x ≪ aT (a < e).
T e T →+∞

1 1
= y, x = y13
⋄ 9.1.56. Чтобы исследовать на сходимость ln x
ˆ √
3x

√ d x = x → +0 ⇔ y → +∞ =
несобственный интеграл 0
3
x x=1⇔y=1
ˆ +∞ x 1 1
1 1 −3
ˆ ˆ
e
dx = y ln 3 d 3 = (−3y ln y) dy =
1 x10 +∞ y y +∞ y4
554 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

1 ˆ +∞ ˆ 1
1 ˆ +∞ y
ln y ln y 1 −ey e
ˆ ˆ
y
=9 3
d y = −9 dy ≪ = e d = dy = dy ≫
+∞ y 1 y3 +∞ +∞ y +∞ y
2
1 y2 +∞

9 +∞
ˆ +∞ ˆ +∞ ˆ +∞ 2 ˆ +∞
y 1 y +∞
≪ −9 d y = −9 d y = ≫ dy = 1 dy = y
+∞ 1 y3 1 y2 y 1 +∞ 1 y 2
1 1

Последний интеграл сходится, значит меньший Последний интеграл расходится, значит боль-
(исходный) интеграл тоже сходится. Для скоро- ший (исходный) интеграл тоже расходится. Для
сти сходимости с помощью той же оценки полу- скорости расходимости получаем с помощью той
чается формула: же оценки формулу:
1 ˆ 1
ˆ T
ln x √3 = y, x = y13 ˆ 1 1
= y, x = y1 1
x e
1
d x =
x
= ey d ≫
√ d x = x → +0 ⇔ y → +∞ = x x = T ⇔ y = T1

0
3
x x = T ⇔ y = T1 T x=1⇔y=1 1
T
y T →+0
ˆ +∞
ln y
ˆ +∞
y
ˆ 1
y2 T1 1 1
T

= −9 3
d y ≪ −9 dy = ≫ 2
d y = y = −1 ∼
1
T
y T →+0 1
T
y3 T →+0 1 y 1 T T →+0 T
9 +∞ Применяя формулу
= 1 = 9T
y T
ey ≫ yε (ε > 0)
Сокращая константу 9, получаем: y→+∞

ˆ T
ln x можно добиться оценки
√ dx ≪ T
0
3
x T →+0 ˆ 1
1 1
ex dx ≫ (n ∈ N∗ )
Оценкой T T →+0 T n

ln y ≪ yε (ε > 0) ⊲⊲ 9.1.59. Исследуйте на сходимость несобствен-


y→+∞
ные интегралы и найдите оценки сходимости и
можно добиться формулы расходимости:
´0 1 1
ˆ T
1) e x d x; ln7√x d x
´
ln x −1 5) 2
;
√ dx ≪ Tα (α < 2). 0 x
0
3
x T →+0 ´1 ex
1 ´ +∞ ln(1+x+x2 )
2) 0 x3 d x; 6) e 1+x+x2 d x;
⋄ 9.1.58. ´0 1
ex ´ +∞ 1
ln(1+ x + √1x )
3) −1 x3 d x; 7) √ d x;
1 e ln(1+x+ x)
1 1
= y, x = y 1
ˆ
dx ln(1+ ln1x + √1x )
1 x
´
ex d x = x → +0 ⇔ y → +∞ = 4) 2
x3 ln x ;
´ +∞
0 8) e 5 4 d x;
0 x=1⇔y=1 x+x 4 +x 3

Интегрирование асимптотических формул. Из теоремы 9.1.54 сразу следует


Теорема 9.1.60. Пусть функции f , g и h обладают следующими свойствами:
a) f , g и h непрерывны на полуинтервале [a; c);
b) f , g и h удовлетворяют асимптотическому соотношению

f (x) = g(x) + o (h(x))


x→c−0

c) h(x) > 0, ∀x ∈ (a; c).


Тогда
´c ´c ´c
(i) если несобственные интегралы a f (x) d x, a g(x) d x и a h(x) d x сходятся, то спра-
ведлива асимптотическая формула
ˆ c ˆ c ˆ c 
f (t) d t = g(t) d t + o f (t) d t (9.1.22)
x x x→c−0 x
´c
(ii) если несобственный интеграл a h(x) d x расходится, то справедлива асимптотическая
формула ˆ x ˆ x ˆ x 
f (t) d t = g(t) d t + o f (t) d t (9.1.23)
a a x→c−0 a
§ 1. Несобственные интегралы 555

Из теоремы 9.1.60 тут же следует метод на- Мы получили асимптотическую формулу:


хождения асимптотики интегралов ˆ xp
x2 1
ˆ x ˆ c t2 + 1 d t = + · ln x + o (ln x)
1 2 2 t→+∞
F (x) = f (t) d t, F (x) = f (t) d t
a x
Можно было бы поступить иначе: вместо то-
– для этого нужно найти асимптотику для го, чтобы огрублять формулу (9.1.24) перед тем
подынтегральной функции, а затем проинтегри- как ее интегрировать, можно переписать ее так,
ровать ее. Покажем, как это делается на приме- чтобы была применима часть (i) теоремы 9.1.60:
рах. p  
2
1 1 1
t +1−t− =− 3 + o (9.1.25)
⋄ 9.1.61. Найдем асимптотику интеграла 2t 8t t→+∞ t3
ˆ xp
Здесь правая часть бесконечно мала по срав-
F (x) = t2 + 1 d t, x → +∞
1 нению с функцией t12 , интеграл от которой на
[1, +∞) сходится. Поэтому по теореме 9.1.54, ин-
Оговоримся сразу, что этот интеграл можно вы- теграл от левой части тоже должен сходиться:
числить явно (мы даже предлагали это читате- ˆ ∞ p 
лю в упражнении 8.1.54), и как следствие, его 1
2
t +1−t− dt = A ∈ R
асимптотику можно вывести по аналогии с при- 1 2t
мерами § 2(b) (вычислив F (x), и, после преобра-
зований, разложив полученное выражение с по- Теперь, применяя к (9.1.25) теорему 9.1.60 (i), по-
мощью формул Пеано). Однако здесь наша цель лучаем:
– объяснить, как находится асимптотика подоб- ˆ ∞ p 
1
ных интегралов без их явного вычисления. Мы t2 + 1 − t − dt =
выбрали этот пример только чтобы не усложнять x 2t
ˆ ∞ ˆ ∞ 
вычисления. Читателю же мы предлагаем само- 1 1
=− d t + o d t =
стоятельно найти асимптотику так, как мы опи- x 8t3 t→+∞ x t3
 
сали, а затем сравнить ответы, полученные раз- 1 t=∞ 1 t=∞
ными методами. = + o − =
16t2 t=x t→+∞ 2t2 t=x
Вспомним, что в примере 7.2.12 мы уже иска-  
1 1
ли асимптотику подынтегрального выражения, и =− + o =
(с точностью до замены переменной) мы получи- 16x2 t→+∞ 2x2
 
ли такой ответ: 1 1
  = − 2
+ o
p 16x t→+∞ x2
2
1 1 1
t +1=t+ − + o (9.1.24)
2t 8t3 t→+∞ t3 Отсюда следует:
К этой формуле, однако, невозможно применить ˆ x p 
2
1
часть (ii) теоремы 9.1.60, как нам бы хотелось, t +1−t− dt =
1 2t
потому что получающийся интеграл под симво- ˆ ∞ p 
1
лом o сходится. Но если огрубить эту формулу = 2
t +1−t− dt−
до формулы 2t
|1 {z }
p   A
1 1 ˆ ∞ p 
t2 + 1 = t + + o 2+1−t−
1
2t t→+∞ t − t dt =
x 2t
| {z }
то интеграл под o становится расходящимся, и
− 16x1
2+ o ( x12 )
теорема 9.1.60 (ii) становится применима: t→+∞
 
ˆ xp 1 1
=A+ 2
+ o
t2 + 1 d t = 16x t→+∞ x2
1
 x  ˆ x  ⇓
1 1
ˆ
= t+ dt+ o dt =
1 2t t→+∞ 1 t xp x p 
 2    1
ˆ ˆ
t 1 t=x t=x t2 + 1 dt = t2 +1−t− dt+
= + · ln t + o ln t = 1 2t
2 2 t=1 t→+∞ t=1 |1 {z }
x2
x2 1 1 2 + 12 ·ln x− 21
= + · ln x − + o (ln x) =  
2 2 2 t→+∞ 1 1
| {z } +A+ + o =
o (ln x) 16x2 t→+∞ x2
t→+∞  
x2 1 1 1 1
x2 1 = + · ln x − + A + + o
= + · ln x + o (ln x) 2 2 2 16x2 t→+∞ x2
2 2 t→+∞
556 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Мы получили асимптотическое разложение на- где p 



1
ˆ
шего интеграла порядка 2 вдоль степенной по- 2
A= t +1−t− d t.
следовательности на бесконечности: 1 2t
ˆ xp Заметим, наконец, что, выписывая более точ-
t2 + 1 d t = ную асимптотику для подынтегральной функ-
1
  ции (то есть заменяя формулу (9.1.24) на более
x2 1 1 1 1 точную), можно по этому алгоритму получать и
= + · ln x − + A + + o ,
2 2 2 16x2 t→+∞ x2 асимптотику интеграла нужной точности.

Нахождение асимптотики интегрированием по частям Описанный в предыдущем пункте


способ нахождения асимптотики интеграла не всегда работает. Например, асимптотику интегралов
ˆ x ˆ x
sin t
d t, t2 · e t d t (x → +∞)
1 t2 1

невозможно получить, раскладывая подынтегральную функцию в асимптотическую формулу, а


затем интегрируя ее (потому что асимптотику для подынтегральной функции здесь трудно приду-
мать). В таких случаях полезно держать в голове другой метод – интегрирование по частям. Здесь
мы рассмотрим несколько примеров на эту тему.

x
sin t
ˆ
⋄ 9.1.62. Найдем асимптотику интеграла F (x) = d t = ... =
ˆ x 1 t2
sin t ˆ ∞
F (x) = dt (9.1.26) cos x cos t
1 t2 = A− 2 −2 dt =
x x t3
ˆ ∞
Прежде всего заметим, что существует конечный cos x d sin t
=A− 2 −2 =
предел x x t3
cos x 2 sin t ∞
ˆ ∞
ˆ ∞
sin t sin t
A = lim F (x) = dt =A− 2 − 3 − 6 dt =
t2 x t x t4
x→∞ 1 ˆ ∞x
cos x 2 sin x sin t
´∞ t =A− 2 + −6 dt =
– поскольку интеграл 1 sin t2 d t сходится абсо- x x 3 t4
| {z } x | {z}
лютно: o (
1
) ( t13 )
o
ˆ ∞ x→+∞ x
2

1 ∞
ˆ ∞ t→+∞
sin t 1 | {z }
dt 6 d t = − =1
t2 t2 t 1 o ( x12 )
x→+∞
1 1
 
Запомним это число A. Тогда, интегрируя по ча- cos x 1
= A− 2 + o
x x→+∞ x2
стям один раз, получим:
´∞ И так далее. Увеличивая число интегрирований
sin t
dt
1 t2
ˆ ∞ по частям, мы будем повышать точность асимп-
=

ˆ x
sin t sin t тотического разложения.
F (x) = 2
d t = A − dt =
1 t x t2
⋄ 9.1.63. Найдем асимптотику интеграла
cos t ∞
ˆ ∞ ˆ ∞
d cos t cos t
= A+ 2
= A+ 2 −2 dt = ˆ x
x t t x x t3 F (x) = tα · et d t, x → +∞
ˆ ∞
cos x cos t 1
=A− 2
+2 dt =
|x{z } x t3 }
| {z Интегрируя по частям, получаем:
o 1
x→+∞ x
( ) o
t→+∞
( )
1
t2
ˆ x ˆ x
| {z } F (x) = tα · e t d t = tα d e t =
o (x 1 1
x→+∞
1
) t=x ˆ x
 
1 = tα · e t − e t d tα =
t=1
=A+ o 1
x→+∞ x ˆ x
α x
=x ·e −e−α· (9.1.27) tα−1 · et d t
Это первое асимптотическое разложение. Если 1
проинтегрировать по частям два раза, получится Поглядим внимательно на последний интеграл:
более точная формула:
tα−1 · et ≪ tα · et
t→+∞
§ 2. Числовые ряды 557

⇓ (9.1.19) ⇓
ˆ x ˆ x
tα−1 · et d t ≪ tα · et d t = F (x)
1 x→+∞ 1 ˆ x
Мы получаем: tα · et d t = (9.1.27) =
1
ˆ x
F (x) = xα · ex −e + o (F (x)) α x
x→+∞ =x ·e −e−α· tα−1 · et d t = (9.1.29) =
| {z } 1
o (F (x))  
x→+∞ α x α−1 x α−1 x

= x ·e −e−α· x ·e + o x ·e =
x→+∞
⇓ 
α x = xα · ex − α · xα−1 · ex −e + o xα−1 · ex =
F (x) = x · e + o (F (x)) |
x→+∞
{z }
x→+∞
o (xα−1 ·ex )
⇓ x→+∞

x = xα · ex − α · xα−1 · ex + o xα−1 · ex
ˆ
α t α x
F (x) = t ·e dt ∼ x ·e x→+∞
1 x→+∞

⇓ Получается разложение:
ˆ x 
x
tα ·et d t = xα ·ex −α·xα−1 ·ex + xα−1 · ex
ˆ
α t
t · e dt = x · e + α x
o α x
(x · e ) (9.1.28) o
1 x→+∞
1 x→+∞
(9.1.30)
Это первое асимптотическое разложение. Из Здесь также можно заменить α на α − 1 и после
него можно выводить асимптотики более высо- этого подставить полученную формулу в (9.1.27)
кого порядка. Заменив в (9.1.28) α на α − 1, мы – тогда появится асимптотика более высокого по-
получим цепочку: рядка, и так далее. Понятно, что асимптотиче-
ˆ x
 ская последовательность здесь берется такая:
tα−1 · et d t = xα−1 · ex + o xα−1 · ex
1 x→+∞
(9.1.29) xα · ex ≫ xα−1 · ex ≫ xα−2 · ex ≫ ...
x→+∞ x→+∞ x→+∞

§2 Числовые ряды
Представим, что у нас есть числовая последовательность {an } и нам захотелось сосчитать (беско-
нечную) сумму ее элементов:

X
an = a1 + a2 + a3 + ...
n=1

В таких случаях говорят, что нужно вычислить сумму числового ряда. Интересное наблюдение, с
которого начинается вся теория рядов, состоит в том, что иногда такая бесконечная сумма оказы-
вается конечной величиной.

⋄ 9.2.1. Например, нетрудно убедиться (это сле- (мы это сделаем в замечании 12.2.30 на с.712). С
дует из приводимой ниже формулы (9.2.33)), что другой стороны, сумма может оказаться и беско-
X∞ нечной, например,
1
= 1
2n ∞
n=1 X 1
Труднее доказать, что =∞
n=1
n
X∞
1 π2
= (9.2.31)
n=1
n2 6 (это будет доказано в примере 9.2.19).

Заинтриговав читателя этими заявлениями, мы можем перейти к точным формулировкам.


558 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

(a) Определение числового ряда


• Пусть задана числовая последовательность {an } и из нее составлена новая последователь-
ность {SN } по формуле
N
X
SN = an = a1 + a2 + a3 + ... + aN
n=1

Тогда такая пара последовательностей {an } и {SN } называется числовым рядом и обо-
значается ∞
X
an = a1 + a2 + a3 + ...
n=1
P∞
Числа an называются слагаемыми ряда n=1 an , а числа SN – частичными суммами
этого ряда.
• Если частичные суммы стремятся к некоторому конечному пределу

SN −→ S, (S ∈ R)
N →∞
P∞
то этот предел S называется суммой ряда n=1 an , а сам ряд называется сходящимся
(или про него говорят, что он сходится). Коротко это записывают формулой

X
an = S
n=1

• Если же последовательность частичных сумм не имеет конечного предела

6 ∃ lim SN ∈ R,
N →∞
P∞
то ряд n=1 an называется расходящимся (или про него говорят, что он расходится).

⋄ 9.2.2. Рассмотрим ряд преобразуем его слагаемые:



X 1 1  
умножаем на
n(n + 1) √ √ = сопряженный радикал =
n=1 n+ n+1
√ √
Чтобы понять, сходится он или нет, заметим, что n− n+1
= √ √ √ √ =
слагаемые можно разложить на простейшие дро- ( n + n + 1)( n − n + 1)
би: √ √ √ √
1 1 1 n− n+1 n− n+1
= − = = =
n(n + 1) n n+1 n − (n + 1) −1
√ √
Теперь найдем частичные суммы: =− n+ n+1
N
X N 
X  Теперь найдем частичные суммы:
1 1 1
SN = = − =
n(n + 1) n=1 n n + 1 N
n=1 X 1
сокращаются
SN = √ √ =
↓ ↓ ↓ ↓ ↓ ↓↓ ↓ n + n+1
n=1
1 1 1 1 1 1 1 1
= − + − + − +... + − = N
X √ √ 
1 2 2 3 3 4
| {z } | {z } | {z } N N +1 = − n+ n+1 =
| {z }
n=1 n=2 n=3 n=N n=1
1 ↓ ↓ ↓ ↓ ↓ ↓
=1− −→ 1 = S √ √ √ √ √ √
N + 1 N →∞ = − 1 + 2 − 2 + 3 − 3 + 4 +...
P∞ 1
| {z } | {z } | {z }
Вывод: ряд n=1 n(n+1) сходится, и его сум- n=1 n=2 n=3
ма равна 1. ↓ ↓
√ √ √
⋄ 9.2.3. Чтобы исследовать на сходимость ряд ... − N + N + 1 = −1 + N + 1 −→ +∞
| {z } N →∞

X n=N
1
√ √ P∞ 1
n=1
n+ n+1 Вывод: ряд n=1
√ √
n+ n+1
расходится.
§ 2. Числовые ряды 559

⋄ 9.2.4. Рассмотрим ряд Рассмотрим три случая:



X а) если |q| < 1, то
(−1)n
n=1 0
✁✕
Найдем первые несколько частичных сумм:
1
1 − q N +1 1
X SN = −→
n 1 1−q 1−q
S1 = (−1) = (−1) = −1 N →∞
n=1
и, значит в этом случае ряд сходится, причем мы
2
X сразу получаем формулу (9.2.32), из которой в
S2 = (−1)n = (−1)1 + (−1)2 = −1 + 1 = 0 свою очередь тут же следует формула (9.2.33):
n=1

X ∞
X ∞
X q
3
X qn = q · q n−1 = q · qk =
S3 = (−1)n = (−1)1 + (−1)2 + (−1)3 = n=1 n=1
1−q
k=0
| {z }
n=1

=
= −1 + 1 − 1 = −1 1
1−q

Теперь видна закономерность:


( б) если |q| > 1, то
−1, если N нечетное
SN = ∞
0, если N четное
✁✕
Ясно, что такая последовательность не имеет 1 − q N +1
предела: SN = −→ ∞
6 ∃ lim SN 1−q N →∞
N →∞
P∞ и, значит в этом случае ряд расходится.
Вывод: ряд n=1 (−1)n расходится.
в) если |q| = 1, то это означает, что q = 1 или
Следующий пример особенно важен. q = −1, и тогда
Теорема 9.2.5 (геометрическая прогрессия). — при q = 1 получается

(
X сходится, если |q| < 1 ∞
n
q ←
n=0
расходится, если |q| > 1
N ✁✁✕
X
причем SN = 1 = N + 1 −→ ∞;
N →∞
∞ n=0
X 1
qn = , |q| < 1 (9.2.32)
1−q — а если q = 1, то этот случай мы уже рассмот-
n=0
∞ рели в примереP∞ 9.2.4, и показали, что получа-
X q
qn = , |q| < 1 (9.2.33) ющийся ряд n=0 (−1)n расходится.
n=1
1−q

Доказательство. Здесь используется формула


(3.2.107) суммы конечного числа членов геомет-
⊲⊲ 9.2.6. Исследуйте на сходимость ряды:
рической прогрессии, которую мы доказали в P∞ 1
главе 3: 1) n=1 4n2 −1 ;
P∞ 2n+1
N 2)
X
n 1 − q N +1 n=1 n2 (n+1)2 ;
SN = q = , q 6= 1 (9.2.34) P∞ √ √ √
n=0
1−q 3) n=1 ( n − 2 n + 1 + n + 2).

(b) Арифметические свойства числовых рядов


P∞ P∞
10 . Если ряд n=1 an сходится, то для всякого числа λ ∈ R ряд n=1 λ · an тоже сходится,
причем

X ∞
X
λ · an = λ · an (9.2.35)
n=1 n=1
560 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞ P∞ P∞
20 . Если ряды n=1 an и n=1 bn сходятся, то ряд n=1 (an + bn ) тоже сходится, причем

X ∞
X ∞
X
(an + bn ) = an + bn (9.2.36)
n=1 n=1 n=1
P∞
Доказательство. 1. Если ряд n=1 an сходится, то это означает, что его частичные суммы SN =
PN
n=1 an стремятся к какому-то числу S:

N
X
an = SN −→ S
N →∞
n=1

Поэтому для всякого λ ∈ R


N
X N
X
λan = λ an = λSN −→ λS
N →∞
n=1 n=1
P∞ P∞
Это означает, что ряд n=1 λan сходится, и его сумма равна λS = λ n=1 an , то есть справедлива
формула (9.2.35). P P∞

2. Пусть ряды n=1 an и n=1 bn сходятся. Это означает, что если обозначить через AN и BN
их частичные суммы, то они стремятся к каким-то числам A и B:
N
X N
X
an = AN −→ A, bn = BN −→ B
N →∞ N →∞
n=1 n=1

Поэтому
N
X N
X N
X
(an + bn ) = an + bn = AN + BN −→ A + B
N →∞
n=1 n=1 n=1
P∞ P∞ P∞
Это означает, что ряд n=1 (an + bn ) сходится, и его сумма равна A + B = n=1 an + n=1 bn , то
есть справедлива формула (9.2.36).

X∞ X∞  n  n 
⋄ 9.2.7. 2n + 3n 2 3
= + =
X∞ ∞   5 n 5 5
5 5X 1 делаем замену n=1 n=1
= = n−1=k = X∞  n X∞  n
2n 2 n=1 2n−1 тогда k = 0, 1, 2, ... 2 3
n=1 = + = (9.2.33) =
∞ 5 5
5 X 1 5 1 n=1 n=1
= · = · 1 =5 1 1 5 5 25
2 2k 2 1− 2 = + = + =
k=0 2 3
1− 5 1− 5
3 2 6
⋄ 9.2.8.

(c) Признаки сходимости рядов


Как правило, сумму ряда точно вычислить невозможно, даже если известно, что ряд сходится.
Например, формула, упомянутая нами в начале этого параграфа

X∞
1 π2
2
= ,
n=1
n 6

является результатом случайного наблюдения, а не какого-то найденного математиками способа


вычисления сумм, с помощью которого ее и другие подобные формулы можно было бы выводить.
Из-за этого в теории рядов становится важно просто понять, сходится данный ряд или нет, не
вычисляя его суммы.
Правила, объясняющие, когда данный ряд сходится, а когда нет, называются признаками схо-
димости. В этом параграфе мы приведем некоторые признаки сходимости рядов. Мы начнем со
знакопостоянных рядов.
§ 2. Числовые ряды 561

Общие признаки сходимости рядов


Необходимое условие сходимости.
P
Теорема 9.2.9. Если ряд ∞
n=1 an сходится, то an −→ 0. n→∞
P∞
Теорема 9.2.10 (эквивалентная формулировка). Если an −→
6 0, то ряд n=1 an расходится.
n→∞
P∞
Доказательство. Если ряд n=1 an сходится, то для последовательностей ki = i − 1 и li = 1, по
критерию Коши (теорема 9.2.15), мы получим
−1+1
kiX
an = aki −1+1 = aki = ai −→ 0
i→∞
n=ki −1+1

⋄ 9.2.11. Чтобы исследовать на сходимость ряд P∞ 1


nn+ n
Вывод: ряд n=1 (n+1)n расходится.
X∞
1
√ ⋄ 9.2.13. Чтобы исследовать на сходимость ряд
n=1
n
n
достаточно вычислить предел ∞
X 1

(−1)n · n · sin
1  n
1 1 ln n− n n=1
lim √ = lim n− n = lim e =
n→∞ n
n n→∞ n→∞
ln n достаточно вычислить предел
= lim e− n = e0 = 1 6= 0
n→∞
P∞ 1 1
Вывод: ряд 1
√ расходится. lim |an | = lim n · sin = lim n · = 1 6= 0
n=1 nn n→∞ n→∞ n n→∞ n
⋄ 9.2.12. Чтобы исследовать ряд . .
∞ То есть |an | −→ 0, откуда an −→ 0.
X n
1
n+ n
n→∞ n→∞
(n + 1)n P∞
n=1 Вывод: ряд n=1 (−1)
n
·n · sin n1 расходится.
вычисляем предел
⊲⊲ 9.2.14. Исследуйте на сходимость ряды:
nn+ n
1   P∞ (−1)n
делим числитель
lim = и знаменатель на nn = 1) n=1 n n ;

n→∞ (n + 1)n
P∞
2) √1
n=1 n ln n ;
1
nn 1
= lim n = 6= 0 P∞ n 2 1

n→∞ 1 + n1 e 3) n=1 (−1) · n · 1 − cos n .

Критерий Коши сходимости ряда.


Теорема 9.2.15 (критерий Коши сходимости ряда). Пусть {an } – произвольная числовая после-
довательность. Тогда следующие условия эквивалентны:
(i) ряд

X
an
n=1
сходится;
(ii) для любой последовательности li ∈ N, и любой бесконечно большой последовательности
ki ∈ N
ki −→ ∞,
i→∞
Pki +li
сумма n=ki +1 an стремится к нулю при i → ∞:
kX
i +li

an −→ 0
i→∞
n=ki +1
562 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞
Доказательство. Рассмотрим частичные суммы ряда n=1 an :

N
X
SN = an
n=1

Мы получаем следующую логическую цепочку:



X
ряд an сходится
n=1

последовательность SN сходится
 
вспоминаем критерий Коши сходимости
m последовательности – теорему 4.2.70

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
i→∞
выполняется соотношение: Ski +li − Ski −→ 0
i→∞

!
замечаем, что
m Ski +li − Ski =
Pki +li
n=k +1 an
i

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
Pki +li i→∞
выполняется соотношение: n=ki +1 an −→ 0 i→∞

Сходимость знакопостоянных рядов


P∞
• Числовой ряд n=1 an называется
— знакопостоянным, если его члены an не меняют знак:
   
∀n ∈ N∗ an > 0 или ∀n ∈ N∗ an 6 0

— знакоположительным, если его члены an неотрицательны:

∀n ∈ N∗ an > 0

Как и в случае с несобственными интегралами, исследование на сходимость знакопостоянных


рядов сводится к исследованию знакоположительных: если an 6 0, то можно взять последователь-
ность bn = −an > 0, и окажется, что


X N
X N
X ∞
X
an = lim an = − lim bn = − an
N →+∞ N →+∞
n=1 n=1 n=1 n=1

откуда и будет следовать, что ряд



X
an
n=1

сходится тогда и только тогда, когда сходится ряд



X
bn
n=1
§ 2. Числовые ряды 563

Критерий сходимости знакоположительного ряда.


Теорема 9.2.16. Пусть последовательность an неотрицательна

an > 0, n ∈ N∗
P∞ PN
Тогда сходимость ряда n=1 an эквивалентна ограниченности его частичных сумм n=1 an , N ∈
N∗ :

X N
X
an сходится ⇐⇒ sup an < ∞
n=1 N ∈N∗ n=1

PN
! 9.2.17. Условие справа (то есть утверждение, что частичные суммы n=1 an , N ∈ N∗ ограничены)
принято записывать неравенством
X∞
an < ∞
n=1
P∞
и, в силу теоремы 9.2.16, такая запись считается эквивалентной утверждению, что ряд n=1 an
сходится (при неотрицательных an ).
Доказательство. Поскольку an > 0, частичные суммы
N
X
SN = an
n=1

образуют монотонно неубывающую последовательность. Поэтому справедлива цепочка



X
ряд an сходится
n=1

m
SN имеет конечный предел lim SN ∈ R
N →∞

m SN – монотонно неубывает

N
X
SN – ограничена сверху: sup an = sup SN < ∞.
N ∈N∗ n=1 N ∈N∗

Интегральный признак Коши и постоянная Эйлера.


Теорема 9.2.18 (интегральный признак Коши). Пусть f – неотрицательная и монотонная функ-
ция на полуинтервале [1; +∞). Тогда существует такое число C ∈ R, что
N
X ˆ N
f (n) − f (x) d x −→ C (9.2.37)
1 N →∞
n=1

P∞
• Число C в этой формуле называется постоянной Эйлера ряда n=1 f (n).
Как следствие,

X ˆ ∞
ряд f (n) сходится ⇐⇒ интеграл f (x) d x сходится
n=1 1

• Такую связь между рядом и несобственным интегралом (когда сходимость одного экви-
валентна сходимости другого) коротко записывают формулой

X ˆ ∞
f (n) ∼ f (x) d x.
n=1 1

P∞ ´∞
и говорят при этом, что ряд n=1 f (n) эквивалентен интегралу 1 f (x) d x.
564 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Доказательство. Заметим с самого начала, что нам достаточно рассмотреть случай ненулевой
невозрастающей функции f , потому что
— если f нулевая, то и ряд

X
f (n),
n=1
и интеграл ˆ ∞
f (x) d x
1

оба сходятся,
— если же f ненулевая и неубывает,

x6y ⇒ f (x) 6 f (y),

то ни ряд

X
f (n),
n=1
ни интеграл ˆ ∞
f (x) d x
1

сходиться не могут (первый по необходимому признаку сходимости 9.2.10, а второй по


критерию Коши сходимости несобственного интеграла 9.1.30)
1. Итак далее мы считаем, что функция f ненулевая и невозрастает. Рассмотрим сначала вспо-
могательную последовательность
N
X ˆ N +1
FN = f (n) − f (x) d x
n=1 1

и покажем, что она сходится. Для этого нужно просто заметить, что она ограничена и монотонна.
Действительно, во-первых,
∀x∈[n,n+1]
z }| {
f (n) > f (x) > f (n + 1)

ˆ n+1
f (n) > f (x) d x > f (n + 1) (9.2.38)
n


ˆ n+1
−f (n) 6 − f (x) d x 6 −f (n + 1)
n

ˆ n+1
0 6 f (n) − f (x) d x 6 f (n) − f (n + 1) (9.2.39)
n

FN
=

PN ´ N +1
n=1 f (n) − 1
f (x) d x
=

PN PN ´ n+1
n=1 f (n) − n=1 n
f (x) d x
=

z }| {
XN  ˆ n+1  XN  
06 f (n) − f (x) d x 6 f (n) − f (n + 1) =
n=1 n n=1
§ 2. Числовые ряды 565

↓ ↓ ↓ ↓ ↓ ↓
z}|{ z}|{ z}|{ z }| {
= f (1) − f (2) + f (2) − f (3) + ... + f (N ) −f (N + 1) = f (1) − f (N + 1) 6 f (1)
| {z } | {z } | {z } | {z }
n=1 n=2 n=N

6
0


0 6 FN 6 f (1)
И, во-вторых,

N +1
! N
!
X ˆ N +2 X ˆ N +1
FN +1 − FN = f (n) − f (x) d x − f (n) − f (x) d x =
n=1 1 n=1 1
N +1 N
! !
X X ˆ N +2 ˆ N +1 ˆ N +1 (9.2.39)
= f (n) − f (n) − f (x) d x − f (x) d x = f (N +1)− f (x) d x > 0
n=1 n=1 1 1 N


FN +1 > FN
Итак, FN монотонна и ограничена, и значит, имеет предел:

FN −→ A
N →∞

2. Заметим далее, что последовательность f (n) тоже монотонна и ограничена, и значит тоже
имеет предел:
f (n) −→ B
n→∞

Отсюда, в силу (9.2.38), следует, что


ˆ n+1
f (x) d x −→ B
n n→∞

´ n+1
(потому что n f (x) d x заключена между двумя милиционерами, стремящимися к B). Теперь
получаем:
N
X ˆ N N
X ˆ N +1 ˆ N +1
f (n) − f (x) d x = f (n) − f (x) d x + f (x) d x −→ A + B = C
1 1 N →∞
n=1 n=1
| {z } |N {z }

=

B
FN

A

Это доказывает (9.2.37).


P∞ PN
3. Из (9.2.37) следует, что если ряд n=1 f (n) сходится, то есть n=1 f (n) −→ S ∈ R, то
N →∞

N N
!
ˆ N X X ˆ N
f (x) d x = f (n) − f (n) − f (x) d x −→ S − C
1 1 N →∞
n=1 n=1
| {z } | {z }
↓ ↓
S C

Отсюда следует, что ˆ y


f (x) d x −→ S − C
1 y→∞
´y
поскольку функция F (y) = 1 f (x) d x монотонна (из-за неотрицательности f ). То есть, интеграл
´∞
1 f (x) d x сходится. ´∞ ´y
4. Наоборот, если интеграл 1 f (x) d x сходится, то есть 1 f (x) d x −→ I ∈ R, то
y→∞

ˆ N
f (x) d x −→ I
1 N →∞
566 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

и поэтому !
N
X N
X ˆ N ˆ N
f (n) = f (n) − f (x) d x + f (x) d x −→ C − I
1 N →∞
n=1
|
n=1
{z } |1 {z }


C I

PN
То есть, ряд n=1 f (n) сходится.

⋄ 9.2.19. Гармонический ряд. Числовой ряд и тогда


X∞
1 XN XN
1
n > 1 = N −→ ∞,
n=1
n=1
nα n=1
N →∞

называется гармоническим. Он расходится, по-


тому что эквивалентен расходящемуся интегра- и значит, ряд расходится. Если же α > 0, то мож-
лу: но применить теорему 9.2.18, и мы получим:
X∞
1
ˆ ∞
1 ∞
X∞ ˆ ∞
∼ d x = ln x = ∞ 1 1
n=1
n 1 x 1 ∼ dx .
n α xα
1
Несмотря на то, что суммы у этого ряда нет, у
n=1 | {z }
сходится
него есть постоянная Эйлера: только при α > 1,
по теореме 9.1.16
X
N 
1
C = lim − ln N
|{z} (9.2.40)
N →∞
n=1
n
=

´N 1
dx
1 x
⋄ 9.2.21.
Это число привлекает внимание специалистов по

X ∞
теории чисел тем, что за прошедшие с его от- 1 1
ˆ
крытия два с половиной века до сих пор так и не ∼ dx =
n=2
n ln n 2 x ln x
удалось понять, будет ли оно рациональным. ∞ ∞
1
ˆ

⋄ 9.2.20. Ряд Дирихле. Покажем, что = d ln x = ln ln x = ∞
2 ln x 2

(
X 1 сходится, если α > 1 P ∞ 1
← Вывод: ряд n=2 n ln n расходится.
n α
n=1
расходится, если α 6 1
(9.2.41) ⋄ 9.2.22.
Этот ряд называется рядом Дирихле. При α > 0

X ˆ ∞
к нему применима теорема 9.2.18, и в этом слу- 1 1
чае ему соответствуют постоянные Эйлера 2 ∼ dx =
n=2
n ln n 2 x ln2 x
X  1 ∞
N
ˆ ∞
1 N 1−α − 1 1 1
Cα = lim − (9.2.42) = 2 d ln x = − =
N →∞ n α 1−α 2 ln x ln x 2 ln 2
n=1 | {z }
P∞
=

´N 1
dx
Вывод: ряд n=2 n ln12 n сходится.
1 xα

Доказательство. Если α 6 0, то общий член ⊲⊲ 9.2.23. Исследуйте на сходимость ряды:


этого ряда не меньше единицы
P∞ 1 P∞ e−

n
1 1) Pn=2 n lnα n 3) n=1

n
> 1, 2) ∞ 1
nα n=2 n ln n lnα ln n

Признак сравнения рядов.


Теорема 9.2.24 (признак сравнения рядов). Пусть 0 6 an 6 bn . Соответствующая зависимость
между рядами коротко записывается следующим образом:

X ∞
X
an 6 bn (9.2.43)
n=1 n=1
§ 2. Числовые ряды 567

Тогда
P∞ P∞
1) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :

X ∞
X
an сходится ⇐= bn сходится
n=1 n=1
P∞ P∞
2) из расходимости меньшего ряда n=1 an следует расходимость большего ряда n=1 bn :


X ∞
X
an расходится =⇒ bn расходится
n=1 n=1
P∞ P∞
Доказательство. Обозначим через AN и BN частичные суммы рядов n=1 an и n=1 bn :

N
X N
X
AN = an , BN = bn
n=1 n=1

Тогда
B1 6 B2 6 B3 6 ... 6 BN 6 ...
6

6
A1 6 A2 6 A3 6 ... 6 AN 6 ...
1. Теперь возникает логическая цепочка:

X
ряд bn сходится
n=1

⇓ теорема 9.2.16

последовательность BN ограничена : B1 6 B2 6 B3 6 ... 6 BN 6 ... 6 B



последовательность AN ограничена : A1 6 A2 6 A3 6 ... 6 AN 6 ... 6 B
⇓ теорема 9.2.16

X
ряд an сходится
n=1
P∞ P∞
2. Мы доказали, что если n=1 bn сходится, то n=1 an тоже сходится. То есть,

X ∞
X
невозможна ситуация, когда an расходится. а bn сходится
n=1 n=1
P∞ P∞
Поэтому если n=1 an расходится, то n=1 bn тоже должен расходиться.

⋄ 9.2.25. ⋄ 9.2.26.

X∞ X∞
cos2 n 1 X∞
2 + cos n X∞
1
n
6 n >
n=1
2 n=1
2 n n
| {z } n=1 n=1
| {z }
сходится, расходится,
как сумма геометрической прогрессии в силу примера 9.2.19
со знаменателем |q| < 1

Больший ряд сходится, значит и меньший ряд Меньший ряд расходится, значит и больший ряд
сходится. расходится.
P∞ P∞
2
Вывод: ряд n=1 cos2n n сходится. Вывод: ряд n=1 2+cos
n
n
расходится.
568 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

X∞
⋄ 9.2.27. 1 1
= · √
X∞ ∞ ∞ arctg 4 n
2 + cos n X 3 X 1 n=1
| {z }
2
6 2
= 3 · 2
n=1
n n=1
n n=1
n расходится,
| {z } в силу примера 9.2.20
сходится,
в силу примера 9.2.20
P∞ 1
Вывод: ряд n=1

n·arctg(3+sin n)
расходится.
P∞ 2+cos n
Вывод: ряд n=1 n2 сходится. ⊲⊲ 9.2.29. Исследуйте на сходимость ряды:
⋄ 9.2.28. P P∞
1) P∞
n=1 e
−n2
; 4) n=1
4+cos n
nα ;

X ∞
X ∞
2) n=1 √ ln n
; P∞
1 1 5) + sin n) ·
n=1 (2
3 2
√ > √ = P n
2n
n=1
n · arctg(3 + sin n) n=1
n · arctg 4 3) ∞n=1 n·3n ; nα .

Признак Даламбера.
Теорема 9.2.30 (признак Даламбера). Пусть an > 0, и
an+1
D = lim (9.2.44)
n→∞ an

Тогда
P∞
— если D < 1, то ряд n=1 an сходится;
P∞
— если D > 1, то ряд n=1 an расходится.
• Число
P∞ D, определяемое формулой (9.2.44), называется числом Даламбера ряда
n=1 a n .
Для доказательства нам понадобится следующая
P∞
Лемма 9.2.31 (лемма об остатке). Пусть n=1 an – числовой ряд, и M ∈ N – произвольное число.
Тогда
∞ ∞ ∞
!
X X X
ряд an сходится ⇐⇒ сходится ряд an называемый остатком ряда an
n=1 n=M n=1

Доказательство. Обозначим через SN и RN частичные суммы самого ряда и его остатка:


N
X N
X
SN = an , RN = an
n=1 n=M

Очевидно, при N > M


N
X M−1
X N
X
SN = an = an + an = C + RN ,
n=1 n=1 n=M
PM−1
где C = n=1 an – константа, не зависящая от N . Теперь получаем следующую логическую це-
почку:

X
ряд an сходится
n=1
m
существует конечный предел lim SN
N →∞
m
существует конечный предел lim RN
N →∞
m

X
остаток an сходится
n=M
§ 2. Числовые ряды 569

Доказательство теоремы 9.2.30. 1. Предположим, что


an+1
D = lim <1 (9.2.45)
n→∞ an

Возьмем какое-нибудь число ε > 0 так чтобы D + ε < 1. Из (9.2.45) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
Если обозначить q = D + ε, то мы получим что q < 1 и
an+1
∀n > M <q
an
то есть
∀n > M an+1 < q · an
В частности,
aM+1 < q · aM
aM+2 < q · aM+1 < q · (q · aM ) = q 2 · aM
aM+3 < q · aM+2 < q · (q 2 · aM ) = q 3 · aM
...
aM+k < q · aM+k−1 < ... < q k · aM
Отсюда

X ∞
X ∞
X ∞
X

an = aM+k < q k · aM = aM · qk
n=M k=0 k=0 k=0
Последний ряд сходится как
P∞геометрическая прогрессия со знаменателем q < 1. Значит, по признаку
P∞
сравнения, меньший ряд n=M an тоже сходится. Отсюда по лемме об остатке 9.2.31, ряд n=1 an
сходится.
2. Предположим, что наоборот,
an+1
D = lim >1 (9.2.46)
n→∞ an

Возьмем какое-нибудь число ε > 0 так чтобы D − ε > 1. Из (9.2.46) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
Если обозначить q = D − ε, то мы получим что q > 1 и
an+1
∀n > M q <
an
то есть
∀n > M an+1 > q · an
В частности,
aM+1 > q · aM
aM+2 > q · aM+1 > q · (q · aM ) = q 2 · aM
aM+3 > q · aM+2 > q · (q 2 · aM ) = q 3 · aM
...
aM+k > q · aM+k−1 > ... > q k · aM
Отсюда

X ∞
X ∞
X ∞
X

an = aM+k > q k · aM = aM · qk
n=M k=0 k=0 k=0
Последний ряд расходится как P
геометрическая прогрессия со знаменателем q > 1. Значит, по при-

знаку
P∞ сравнения, больший ряд n=M an тоже расходится. Отсюда по лемме об остатке 9.2.31, ряд
a
n=1 n расходится.
570 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

⋄ 9.2.32. Чтобы исследовать на сходимость ряд Его число Даламбера:

X∞
n · 2n (n+1)n+1
an+1 (n+1)!
3n D = lim = lim nn =
n=1 n→∞ an n→∞
n!

найдем его число Даламбера: (n + 1)n+1 · n! (n + 1)n+1 · n!


= lim = lim =
n→∞ nn · (n + 1)! n→∞ nn · (n + 1) · n!
  n
an+1
(n+1)·2n+1 (n + 1)n n+1
D = lim = lim 3n+1
= = lim = lim =
n→∞ an n→∞ n·2n n→∞ nn n→∞ n
3n  n
(n + 1) · 2 n+1
·3 n 1
= lim = = lim 1 + =e>1
n→∞ n
n·2 ·3 n+1 n→∞ n
(n + 1) · 2 2 P∞ nn
= lim = <1 Вывод: ряд n=1 n! расходится.
n→∞ n·3 3
P∞ n ⊲⊲ 9.2.34. Исследуйте на сходимость ряды:
Вывод: ряд n=1 n·2
3n сходится.
P∞ 1 P∞ 3n ·n!
1) n=1 n!n ; 5) nn ;
⋄ 9.2.33. Рассмотрим ряд P n=1
2) ∞
n=1
e
n! ; P∞ (n!)2
∞ P∞ (n!)2 6) n=1 2n2 ;
X nn 3) n=1 (2n)! ;
P∞ 2n ·n!
P∞ n5
n=1
n! 4) n=1 nn ; 7) n=1 2n +3n .

Радикальный признак Коши.


Теорема 9.2.35 (радикальный признак Коши). Пусть an > 0, и

C = lim n an (9.2.47)
n→∞

Тогда
P∞
— если C < 1, то ряд n=1 an сходится;
P∞
— если C > 1, то ряд n=1 an расходится.
P∞
• Число C, определяемое формулой (9.2.47), называется числом Коши ряда n=1 an .
Доказательство. 1. Предположим, что

C = lim n
an < 1 (9.2.48)
n→∞

Возьмем какое-нибудь число ε > 0 так чтобы C + ε < 1. Из (9.2.48) следует, что ε-окрестность числа

C содержит почти все числа n an , то есть

∃M ∀n > M C − ε < n an < C + ε

Если обозначить q = C + ε, то мы получим что q < 1 и



∀n > M n an < q

то есть
∀n > M an < q n
Отсюда

X ∞
X
an < qn
n=M n=M

Последний ряд сходится как


P геометрическая прогрессия со знаменателем q < 1. Значит, по признаку
P∞
сравнения, меньший ряд ∞ n=M an тоже сходится. Отсюда по лемме об остатке 9.2.31, ряд n=1 an
сходится.
2. Предположим, что наоборот

C = lim n an > 1 (9.2.49)
n→∞
§ 2. Числовые ряды 571

Возьмем какое-нибудь число ε > 0 так чтобы C − ε > 1. Из (9.2.49) следует, что ε-окрестность числа

C содержит почти все числа n an , то есть

∃M ∀n > M C −ε< n
an < C + ε

Если обозначить q = C − ε, то мы получим что q > 1 и



∀n > M n
an > q

то есть
∀n > M an > q n
Отсюда

X ∞
X
an > qn
n=M n=M

Последний ряд расходится как P


геометрическая прогрессия со знаменателем q > 1. Значит, по при-

знаку
P∞ сравнения, меньший ряд n=M an тоже расходится. Отсюда по лемме об остатке 9.2.31, ряд
n=1 an расходится.

P∞  2
⋄ 9.2.36. Чтобы исследовать на сходимость ряд Вывод: ряд 1+ 1 n
расходится.
n=1 n
X∞  n
n−1 ⊲⊲ 9.2.38. Исследуйте на сходимость ряды:
n=1
2n + 1 P∞ 1  2
1 n
1) n=1 2n · 1 + n ;
найдем его число Коши: P∞ 1  2
1 n
√ n−1 1 2) n=1 3n · 1 + n ;
C = lim n an = lim = <1 P∞ 
1 n
n→∞ 2n + 1 2 3) n=1 n · arcsin n ;
n→∞
P∞  n−1 n P∞ nn+ n1
Вывод: ряд n=1 2n+1 сходится. 4) n=1 (n+1)n (здесь признак Коши не дает ре-
⋄ 9.2.37. Рассмотрим ряд зультатов);
P∞ −n+sin n
X∞  n2 5) n=1 2 ;
1 P∞ 2+(−1)n
1+ 6) (этот ряд исследуется по при-
n=1
n n=1 2n
знаку Коши, но не по признаку Даламбера).
Его число Коши:
 n
√ 1
C = lim n
an = lim 1 + =e>1
n→∞ n→∞ n

Признак абсолютной сходимости. Следующая теорема позволяет свести в некоторых случаях


исследование на сходимость произвольного ряда к исследованию на сходимость знакоположитель-
ного.
P P∞
Теорема 9.2.39. Если ряд ∞ n=1 |an | сходится, то ряд n=1 an тоже сходится.

Доказательство.

X
ряд |an | сходится
n=1
 
применяем критерий Коши
⇓ сходимости ряда – теорему 9.2.15

  kX
i +li

∀ li , ki ∈ N ki −→ ∞ |an | −→ 0
n→∞ i→∞
n=ki +1


k +l k +l !
Xi i kX
i +li Xi i kX
i +li

06 an 6 |an | −→ 0 ⇒ an −→ 0 ⇒ an −→ 0
i→∞ i→∞ i→∞
n=ki +1 n=ki +1 n=ki +1 n=ki +1
572 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ


  kX
i +li

∀ li , ki ∈ N ki −→ ∞ an −→ 0
n→∞ i→∞
n=ki +1
 
снова применяем критерий Коши
⇓ сходимости ряда

X
ряд an сходится
n=1

⋄ 9.2.40. Чтобы исследовать ряд рассмотрим соответствующий ряд из модулей:



X n
(−1)
√ X∞ X∞
n n sin n 1
n=1 6
2n 2 n
рассмотрим соответствующий ряд из модулей: n=1 n=1
| {z }
X∞ ∞ ∞
(−1)n X 1 X 1 сходится,
√ = √ = как сумма геометрической прогрессии
n n n n 3
со знаменателем |q| < 1
n=1 n
2
n=1 n=1
| {z }
сходится как ряд Дирихле P∞ sin n
с показателем степени α > 1 Вывод: ряд n=1 2n сходится.
P∞ n
(−1)
Вывод: ряд √
n=1 n n сходится.
⋄ 9.2.41. Чтобы исследовать ряд ⊲⊲ 9.2.42. Исследуйте на сходимость ряды:
P∞ cos n
X∞ 1) n=1 n2 +n+ln n;
sin n
P∞ n(n−1) 5

n=1
2n 2) n=1 (−1) 2 n3n .

Специальные признаки сходимости рядов


Признак Лейбница.
Теорема 9.2.43. Пусть последовательность {bn } обладает свойствами:
(i) она неотрицательна и невозрастает,
b0 > b1 > b2 > ... > 0 (9.2.50)
(ii) и стремится к нулю:
bn −→ 0 (9.2.51)
n→∞
Тогда
P∞ n
(a) ряд n=0 (−1) bn сходится,
(b) его остаток оценивается сверху своим первым членом:

X∞
n
(−1) bn 6 bN +1 (9.2.52)

n=N +1

! 9.2.44. То же справедливо и для ряда, у которого нижний предел суммирования равен 1:



X
(−1)n bn
n=1

Доказательство. Рассмотрим частичные суммы нашего ряда:


N
X
SN = (−1)n bn
n=0

Мы покажем, что SN образуют последовательность, которую можно изобразить картинкой


§ 2. Числовые ряды 573

S1 S3 S4 S2 S0

(нечетные суммы образуют возрастающую последовательность, а четные – убывающую, причем


расстояние между четными и нечетными стремится к нулю).
Действительно, рассмотрим подпоследовательности нечетных и четных сумм:

Ak = S2k−1 , Bk = S2k

1. Покажем сначала, что Ak монотонна и ограничена:

A1 6 A2 6 A3 6 ... 6 b0 (9.2.53)

Действительно, с одной стороны,


2k+1
X 2k−1
X
Ak+1 = S2k+1 = (−1)n bn = (−1)n bn + b2k − b2k+1 > S2k−1 = Ak
| {z }
n=0 n=0
| {z }

6
0
k
S2k−1

А, с другой, –
Ak = S2k−1 = b0 − (b1 − b2 ) − (b3 − b4 ) −... − b2k−1 6 b0
| {z } | {z } | {z }

6
6

0 0 0

2. Докажем монотонность и ограниченность последовательности {Bk }:

0 6 ... 6 B2 6 B1 6 B0 (9.2.54)

С одной стороны, получаем:


2k+2
X 2k
X
Bk+1 = S2k+2 = (−1)n bn = (−1)n bn − (b2k+1 − b2k+2 ) 6 S2k = Bk
| {z }
n=0 n=0
| {z }
6

0
k
S2k

А, с другой, –
Bk = S2k = (b0 − b1 ) + (b2 − b3 ) +... + (b2k−1 − b2k ) > 0
| {z } | {z } | {z }
6

0 0 0

3. Из (9.2.53) и (9.2.54) следует, что последовательности {Ak } и {Bk } сходятся:

Ak −→ A = sup Ak , Bk −→ B = inf Bk (9.2.55)


n→∞ k∈N n→∞ k∈N

При этом,

B − A = lim Bk − lim Ak = lim (Bk − Ak ) = lim (S2k − S2k−1 ) = lim b2k = 0,


k→∞ k→∞ k→∞ k→∞ k→∞

то есть
A = B,
и поэтому соотношения (9.2.55) удобно переписать так:

S2k−1 −→ sup S2k−1 = S = inf S2k ←− S2k (9.2.56)


k→∞ k∈N k∈N ∞←k

где S = A = B. Отсюда сразу следует, что последовательность SN сходится к S,

SN −→ S,
N →∞
574 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞ n
то есть ряд n=0 (−1) bn сходится. С другой стороны, из (9.2.56) следует двойное неравенство

∀k ∈ N∗ S2k−1 6 S 6 S2k (9.2.57)

из которого мы получаем, во-первых,

|S − S2k−1 | = S − S2k−1 6 S2k − S2k−1 = (−1)2k · b2k = b2k (9.2.58)

и, во-вторых,

|S − S2k | = S2k − S 6 S2k − S2k+1 = −(−1)2k+1 · b2k+1 = b2k+1 (9.2.59)



−S 6 −S2k+1

S2k+1 6 S

(9.2.57)

Цепочки (9.2.58) и (9.2.59) вместе дают оценку

|S − SN | 6 bN +1 ,

((9.2.58) доказывает это неравенство для нечетных N , а (9.2.59) для четных). Это как раз и есть
неравенство (9.2.52).

⋄ 9.2.45. Ряд Ее производная будет отрицательной на проме-


X∞
(−1)n жутке x > 3
n
n=1 1 − ln x
P∞ f ′ (x) = < 0, x>3
можно представить в виде n=1 (−1)n bn , где x2
1 монотонно Поэтому f (x) монотонно убывает при x > 3,
bn = −→ 0
n n→∞ значит, наша последовательность bn = f (n) мо-
поэтому по теореме Лейбница получаем нотонно убывает начиная с номера n = 3. От-
P∞ n
Вывод: ряд n=1 (−1)
n сходится. сюда по теореме Лейбница получаем, что дол-
P∞ n
жен сходиться ряд n=3 (−1)n ln n . Он является
⋄ 9.2.46. Ряд P∞ (−1)n ln n

остатком ряда n=1 n , значит этот ряд
X (−1)n ln n P∞ (−1) ln nn

n=1 n тоже сходится (по лемме об остат-


n=1
n ке 9.2.31).
P∞ P∞ n

можно представить в виде n=1 (−1)n bn , где Вывод: ряд n=1 (−1)n ln n сходится.

ln n ⊲⊲ 9.2.47. Исследуйте на сходимость ряды:


bn =
n P∞ n P∞ (−1)n
Эта последовательность стремится к нулю по 1) n=1 (−1)
ln nn ; 3) n=1 n·(ln n)α .
P∞ (−1)
теореме о шкале бесконечностей, но непонятно, 2) n=1 nα ;
будет ли это стремление монотоным. Для того,
чтобы это проверить, можно рассмотреть вспо-
могательную функцию
ln x
f (x) =
x

Признаки Дирихле и Абеля для рядов.


Теорема 9.2.48 (признак Дирихле). Пусть последовательности {an } и {bn } обладают следую-
щими свойствами:
P∞
(i) частичные суммы ряда n=1 an ограничены:
N
X

sup an < ∞
N ∈N
n=1
§ 2. Числовые ряды 575

(ii) последовательность {bn } монотонно стремится к нулю:


монотонно
bn −→ 0
n→∞
P∞
Тогда ряд n=1 an · bn сходится.
Доказательство. Обозначим
XN

sup an = C < ∞
N ∈N n=1

и заметим, что q
X

∀p, q ∈ N an 6 2C (9.2.60)

n=p

Действительно,
X X X p−1
q q p−1
X q X
a = a − a 6 a + a
n 6 2C
n n n n
n=p n=1 n=1 n=1 n=1
| {z } | {z }

>

>
C C
P∞
Чтобы убедиться, что ряд n=1 an · bn сходится, воспользуемся критерием Коши (теорема 9.2.15):
выберем произвольные последовательности li ∈ N и ki ∈ N (ki −→ ∞). По неравенству Абеля
n→∞
(8.2.135) получаем:
k +l N
X i i X n o

an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z } ↓ ↓
0 0
>

(9.2.60)
2C

P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
Признак Дирихле часто используется для исследования рядов вида

X ∞
X
bn · sin nx, bn · cos nx
n=1 n=1

В этих случаях бывают полезны следующие тригонометрические формулы:


N
X N
X
sin N2 x · sin N2+1 x sin N2 x · cos N2+1 x
sin nx = , cos nx = (x 6= 2πk) (9.2.61)
n=1
sin x2 n=1
sin x2

Покажем как они применяются.

⋄ 9.2.49. Исследуем на сходимость ряд = (9.2.61) =



∞ sin N · sin N +1 1
X sin n 2 2
= sup 6 < +∞
n N ∈N sin 12 sin 12
n=1
По признаку Дирихле,
P получаем
Если положить Вывод: ряд ∞ sin n
n=1 n сходится.
1
an = sin n, bn = ⋄ 9.2.50. Исследуем на сходимость ряд
n ∞
X sin nx
монотонно
то мы получим bn −→ 0, и n
n→∞ n=1
N N Если положить
X X
1
sup an = sup sin n =
N ∈N N ∈N an = sin nx, bn =
n=1 n=1 n
576 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

монотонно
то мы получим bn −→ 0, и Ясно, что этот ряд
P∞сходится.
n→∞
Вывод: ряд n=1 sinnnx сходится при любом

XN XN x ∈ R.

sup an = sup sin nx =
N ∈N
n=1
N ∈N
n=1
⊲⊲ 9.2.51. Исследуйте на сходимость ряды:
= (9.2.61) = P∞ cos n
1) n=1 n ;
sin N x · sin N +1 x P ∞ cos nx
1 2)
= sup 2 2
6 n ;
x < +∞
n=1
x P
N ∈N sin 2
sin ∞ sin πn
2 3) n=1 ln n ;
12

По признаку Дирихле, получаем, что наш ряд 4) P ∞ ln n πn


n=1 n · cos 12 ;
сходится при x 6= 2πk. P∞ n(n+1)
Остается проверить, будет ли он сходиться 5) n=1 (−1)
2 · √1n .
при x = 2πk. Подставим это значение в наш ряд:
X∞ ∞
sin 2πkn X
= 0
n=1
n n=1

Теорема 9.2.52 (признак Абеля). Пусть последовательности {an } и {bn } обладают следующими
свойствами:
P
(i) ряд ∞n=1 an сходится;
(ii) последовательность {bn } монотонна и ограничена.
P∞
Тогда ряд n=1 an · bn сходится.
P∞
Доказательство. Заметим, что из сходимости ряда n=1 an следует, что для произвольных после-
довательностей li ∈ N и ki ∈ N (ki −→ ∞) выполняется соотношение
n→∞
N
X

max an −→ 0 (9.2.62)
ki 6N 6ki +li i→∞
n=ki +1

Действительно, если бы это было не так,



X
N

max an −→
6 0
ki 6N 6ki +li i→∞
n=ki +1

то, переходя к подпоследовательности, мы получили бы, что для некоторого ε > 0 выполняется
соотношение N
X

max an > ε
ki 6N 6ki +li
n=ki +1


N
X i

∃Ni ∈ [ki , ki + li ] an > ε

n=ki +1
| {z }
здесь Ni > ki ,
потому что
иначе было бы
PN i
n=k +1 an = 0
i


k +m
iX i

∃mi = Ni − ki an > ε

n=ki +1
| {z }

это невозможно,
потому что
по критерию Коши
P(теорема 9.2.15)

ki +mi
n=k +1 an −→ 0
i i→∞
§ 2. Числовые ряды 577

Теперь обозначим
B = sup |bn | < ∞
n∈N∗
P∞
Чтобы доказать сходимость ряда n=1 an · bn , снова воспользуемся критерием Коши (теоремой
9.2.15): для произвольных последовательностей li ∈ N и ki ∈ N (ki −→ ∞) по неравенству Абеля
n→∞
(8.2.135) мы получим
k +l N
X i i X n o

an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z }

>

>
↓ (9.2.62)
B B
0

P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.

⋄ 9.2.53. Рассмотрим ряд то мы получим, что


X∞
sin n π ∞
X X∞ ∞
cos sin nx · cos nx X sin 2nx
n n an = =
n=1
n=2 n=2
ln n n=2
2 ln n
Если положить
sin n π – сходящийся ряд при любом x ∈ R (это
an = , bn = cos доказывается так же, как в примере 9.2.50),
n n
P∞ а bn – монотонная ограниченная последова-
то мы получим, что n=1 an – сходящийся ряд тельность. Значит, по признаку Абеля, ряд
(мы уже доказали это в примере 9.2.49), а bn P∞ sin nx·cos nx
n=2 ln n arctg(nx) сходится при любом
– монотонная ограниченная последовательность.
P x ∈ R.
Значит, по признаку Абеля, ряд ∞ sin n π
n=1 n cos n
сходится.
⊲⊲ 9.2.55. Исследуйте на сходимость ряды:
⋄ 9.2.54. Следующий ряд P∞ cos n n
1) n=1 n · arcsin n+1 ;
X∞
sin nx · cos nx P∞ cos nx
arctg(nx) 2) n=1 n · arctg(nx);
ln n P∞ sin πn
3) n=1 ln n · arcctg(−n);
n=2 12

P∞ ln n  
исследуется таким же образом. Если положить πn n
4) n=1 n · cos 12 · arccos − n+1 ;
sin nx · cos nx P∞ n(n+1) cos 1
an = , bn = arctg(nx) 5) n=1 (−1)
2 · √nn .
ln n

(d) Асимптотика сумм и рядов


По аналогии с определением асимпотической эквивалентности функций на с.413, мы говорим, что
две числовые последовательности an и bn асимптотически эквивалентны, и изображаем это запи-
сью
an ∼ b n ,
n→∞

если их отношение стремится к единице:


an
−→ 1. (9.2.63)
bn n→∞

Это автоматически означает, что последовательность bn должна быть ненулевой, по крайней мере,
начиная с какого-то номера (потому что иначе делить на нее будет нельзя), и то же самое должно
быть справедливо для an (потому что иначе в пределе не получится единицы).
578 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Асимптотическая эквивалентность рядов.


Теорема 9.2.56 (признак эквивалентности рядов). Пусть

an > 0, bn > 0, an ∼ b n (9.2.64)


n→∞

• Коротко эти три условия записываются формулой



X ∞
X
an ∼ bn
n=1 n=1
P∞ P∞
Тогда сходимость ряда n=1 an эквивалентна сходимости ряда n=1 bn :


X ∞
X
an сходится ⇐⇒ bn сходится
n=1 n=1

При этом,
(i) если эти ряды сходятся, то справедливо следующее соотношение, показывающее, что
скорость их сходимости будет одинаковой:

X ∞
X
an ∼ bn (9.2.65)
N →∞
n=N n=N

(ii) если эти ряды расходятся, то справедливо следующее соотношение, показывающее, что
скорость их расходимости будет одинаковой:
N
X N
X
an ∼ bn (9.2.66)
N →∞
n=1 n=1

Доказательство. Зафиксируем сначала какое-нибудь ε ∈ (0, 1) и заметим такую логическую це-


почку:
an ∼ b n
n→∞


an
−→ 1
bn n→∞

an
∃L ∀n > L ∈ [1 − ε; 1 + ε]
bn

an
∃L ∀n > L 1 − ε 6 61+ε
bn

∃L ∀n > L (1 − ε) · bn 6 an 6 (1 + ε) · bn


X ∞
X ∞
X
(1 − ε) · bn 6 an 6 (1 + ε) · bn (9.2.67)
n=L n=L n=L

(последнее двойное неравенство понимается как почленное сравнение рядов, определенное форму-
лой (9.2.43)). P∞ P∞
1. Покажем теперь, что сходимость ряда n=1 an эквивалентна сходимости ряда n=1 bn . С
одной стороны, справедлива такая цепочка:

X
an сходится
n=1
§ 2. Числовые ряды 579

⇓ (применяем лемму об остатке 9.2.31)



X
an сходится
n=L
 
применяем неравенство (9.2.67)
⇓ и признак сравнения 9.2.24

X
(1 − ε) · bn сходится
n=L

⇓ (применяем свойство 10 , §2)



X
bn сходится
n=L

⇓ (применяем лемму об остатке 9.2.31)



X
bn сходится
n=1

А, с другой стороны, справедлива цепочка в обратном направлении:



X
bn сходится
n=1

⇓ (применяем лемму об остатке 9.2.31)



X
bn сходится
n=L

⇓ (применяем свойство 10 , §2)



X
(1 + ε) · bn сходится
n=L
 
применяем неравенство (9.2.67)
⇓ и признак сравнения 9.2.24

X
an сходится
n=L

⇓ (применяем лемму об остатке 9.2.31)



X
an сходится
n=1

2. Теперь предположим, что оба ряда сходятся и докажем формулу (9.2.65). Из (9.2.67) получаем:

X ∞
X ∞
X  

X ∞
X
∃L ∈ N∗ ∀N > L (1 − ε) · bn 6 an 6 (1 + ε) · bn здесь уже an и bn – числа
n=N n=N
n=N n=N n=N


P∞  
an
∃L ∈ N∗ ∀N > L 1−ε 6 Pn=N
∞ 6 1+ε здесь ε ∈ (0; 1) с самого начала выбиралось произвольным
n=N bn


P∞
∗ an
∀ε ∈ (0, 1) ∃L ∈ N ∀N > L 1 − ε 6 Pn=N
∞ 61+ε
n=N bn


P∞
an
Pn=N
∞ −→ 1
n=N bn N →∞

то есть справедливо (9.2.65).


580 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

3. Нам остается доказать (9.2.66) в предположении, что оба ряда расходятся. Здесь применяется
теорема Штольца 4.2.74. Из условия an ∼ bn следует, что, начиная с некоторого номера M , все
числа bn ненулевые (мы отмечали это при определении асимптотически эквивалентных последова-
тельностей на с.577), и поэтому положительны:

∀n > M bn > 0 (9.2.68)

Зафиксируем это M и обозначим


N
X N
X
AN = an , BN = bn .
n=M n=M

Из (9.2.68) следует, что последовательность BN (N > M ) строго возрастает:

BM < BM+1 < ... < BN < ...


P∞
С другой стороны, она стремится к бесконечности, поскольку мы предполагаем ряд n=1 bn рас-
ходящимся:
XN
BN = bn −→ ∞
N →∞
n=M

Поэтому по теореме 4.2.74,


AN AN − AN −1 aN
lim = lim = lim =1
N →∞ BN N →∞ BN − BN −1 N →∞ bN

Если теперь обозначить


M−1
X M−1
X
A= an , B= bn ,
n=1 n=1
то мы получим:
0 1
✁✕ ✁✕
A AN
PN PM−1 PN +
an an + an A + AN BN BN
lim Pn=1
N
= lim Pn=1
M−1 PN
n=M
= lim = lim =1
N →∞
n=1 bn
N →∞
n=1 bn + n=M bn N →∞ B + BN N →∞ B
+1
BN

❆❯
0
То есть справедливо (9.2.66).

⋄ 9.2.57. ражать асимптотику рядов через стандартные



X ∞
X функции.
1 1
2+n−1
∼ 2 ⋄ 9.2.58.
n=1
n n=1
n
| {z } X∞ √ ∞ √
X X∞
1+ n n 1
сходится √ ∼ √ =
P∞ n=1
3
n + 2n n=1 n3 n=1
n
1
Вывод: ряд n=1 n2 +n−1 сходится. | {z }
В соответствии с теоремой 9.2.56, можно дать расходится

асимптотическую оценку скорости сходимости P∞ 1+√n


Вывод: ряд n=1 √n3 +2n расходится.
этого ряда:
⋄ 9.2.59.
X N XN
1 1 X∞  α X∞
∼ , 1 1
n 2 + n − 1 N →∞ n 2 sin ∼ α
n=1 n=1
n=1
n n=1
n
однако это будет мало информативно, потому | {z }
сходится
что до теорем 9.2.68 и 9.2.71 мы не сможем вы- при α > 1
§ 2. Числовые ряды 581
P∞ α P∞ √ √ 
Вывод: ряд n=1 sin n1 сходится при α > 1. 3) n=1 n · n+1− n−1 ;
P∞
⋄ 9.2.60. 4) √1 n+1
· ln n−1 ;
n=1 3 n
∞  ∞ P∞ √
X ln 1 + n1 X 1 ln(n+ n+ln n+1)
∼ 5) n=1 3n−ln n+arctg n−1 ;
n=1
nα n=1
nα+1 P∞ ln(1+ n
1
+ n12 )
| {z } 6) n=1 ln(n−n√n+ln n+3) ;
сходится
при α + 1 > 1 P∞  1 α
7) n=1 n · e − 1 ;
то есть при α > 0 n

P∞ 1+n
P∞ ln(1+ n
1
) 8) n=1 α;
Вывод: ряд n=1 nα сходится при α > 0. ( n1 −sin n1 )
P∞ n 3 oα
⊲⊲ 9.2.61. Исследуйте на сходимость ряды: 9) n=1 1 + 1 2
n − 1 ;
P∞ √  1+n2 2 P∞ α
(arctg n1 )
1) n=1 n · 1+n3 ; 10) n=1 1 .
1−cos
P∞ 1
n
2) n=1
√ ;
n(n+1)(n+2)

Асимптотическое сравнение рядов.


Теорема 9.2.62 (асимптотический признак сравнения рядов). Пусть последовательности {an } и
{bn } обладают следующими свойствами:
(1) an ≪ bn (то есть an = o (bn ));
n→∞ n→∞
(2) bn > 0, ∀n ∈ N.
• Коротко эти два условия записываются формулой:

X ∞
X
an ≪ bn
n=1 n=1

Тогда
P∞ P∞
(i) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :

X ∞
X
an сходится ⇐= bn сходится (9.2.69)
n=1 n=1

причем скорости сходимости оцениваются соотношением



X ∞
X
an ≪ bn ; (9.2.70)
N →∞
n=N n=N
P∞ P∞
(ii) из расходимости меньшего ряда n=1 an следует расходимость большего ряда n=1 bn :


X ∞
X
an расходится =⇒ bn расходится (9.2.71)
n=1 n=1

причем скорости расходимости оцениваются соотношением


N
X N
X
an ≪ bn ; (9.2.72)
N →∞
n=1 n=1

Доказательство. Зафиксируем сначала какое-нибудь ε > 0 и заметим такую логическую цепочку:

an ≪ b n
n→∞


an
−→ 0
bn n→∞
582 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ


|an |
−→ 0
bn n→∞

|an |
∃L ∀n > L <ε
bn

∃L ∀n > L |an | < ε · bn


X ∞
X
|an | < ε · bn (9.2.73)
n=L n=L

(последнее неравенство понимается как почленное сравнение рядов).


1. Докажем (9.2.69) и (9.2.71). Замечаем такую цепочку:

X
ряд bn сходится
n=1

⇓ (применяем лемму об остатке 9.2.31)



X
ряд bn сходится
n=L



X
ряд ε · bn сходится
n=L
 
вспоминаем неравенство (9.2.73)
⇓ и признак сравнения рядов 9.2.24

X
ряд |an | сходится
n=L

⇓ (применяем лемму об остатке 9.2.31)



X
ряд |an | сходится
n=1



X
ряд an сходится
n=1

Это доказывает утверждение (9.2.69). Его можно переформулировать так:



X ∞
X
невозможна ситуация, когда an расходится. а bn сходится
n=1 n=1
P∞ P∞
и отсюда следует, что если n=1 an расходится, то n=1 bn тоже должен расходиться. То есть
выполняется и (9.2.71).
2. Теперь предположим, что оба ряда сходятся и докажем формулу (9.2.70). Из (9.2.73) получаем:

X ∞
X  

X ∞
X
∃L ∈ N∗ ∀N > L |an | < ε · bn здесь уже an и bn – числа
n=N n=N
n=N n=N


P∞  
|an |
∃L ∈ N∗ ∀N > L Pn=N
∞ <ε здесь ε > 0 с самого начала выбиралось произвольным
n=N bn
§ 2. Числовые ряды 583


P∞
|an |
∀ε > 0 ∃L ∈ N∗ ∀N > L Pn=N
∞ <ε
n=N bn

P∞
|an |
Pn=N
∞ −→ 0
n=N bn N →∞

P∞
an
Pn=N
∞ −→ 0
n=N bn N →∞

то есть справедливо (9.2.70).


3. Нам остается доказать (9.2.72) в предположении, что оба ряда расходятся. Здесь применяется
теорема Штольца 4.2.74. Из условия an ≪ bn следует, что начиная с некоторого номера M все
n→∞
числа bn ненулевые, и поэтому положительны:

∀n > M bn > 0 (9.2.74)

Зафиксируем это M и обозначим


N
X N
X
AN = an , BN = bn .
n=M n=M

Из (9.2.74) следует, что последовательность BN (N > M ) строго возрастает:

BM < BM+1 < ... < BN < ...


P∞
С другой стороны, она стремится к бесконечности, поскольку мы предполагаем ряд n=1 bn рас-
ходящимся:
XN
BN = bn −→ ∞
N →∞
n=M

Поэтому по теореме 4.2.74,


AN AN − AN −1 aN
lim = lim = lim =0
N →∞ BN N →∞ BN − BN −1 N →∞ bN

Если теперь обозначить


M−1
X M−1
X
A= an , B= bn ,
n=1 n=1
то мы получим:
0 0
✁✕ ✁✕
A AN
PN PM−1 PN +
an an + an A + AN BN BN
lim Pn=1
N
= lim Pn=1
M−1 PN
n=M
= lim = lim =0
N →∞
n=1 bn
N →∞
n=1 bn + n=M bn
N →∞ B + BN N →∞ B
+1
BN

❆❯
0
То есть справедливо (9.2.72).
584 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Асимптотический признак сравнения рядов выпишем асимптотику его общего члена:


удобно применять, переписав и дополнив для
 
дискретного аргумента шкалу бесконечностей (−1)n (−1)n
(7.1.16) следующим образом: ln 1 + √ = (7.2.50) = √ −
n ln n n ln n
 2  2 !
1 ≪ loga n ≪ nα ≪ 1 (−1)n (−1)n
n→∞ n→∞ (α>0) n→∞
− · √ + o √ =
(a>1) 2 n ln n n→∞ n ln n
≪ an ≪ n! ≪ nn  
n→∞ (a>1) n→∞ n→∞
(−1)n 1 1
= √ − + o
n ln n 2n ln2 n n→∞ n ln2 n
(9.2.75)
⋄ 9.2.63. Отсюда
X∞ X∞ 1 ∞
X   X
ln n n2 1 ∞
X (−1)n

(−1)n
≪ = 3 ln 1 + √ = √ −
n=1
n2 n=1
n2 n=1 n 2
n ln n n ln n
| {z } n=2 n=2
∞ ∞  
сходится,
1 X 1 X 1
в силу примера 9.2.20 − · + o (9.2.77)
2 n=2 n ln2 n n=2 n→∞ n ln2 n
Больший ряд сходится, значит и меньший ряд
сходится. P∞ причем последний ряд надо понимать так, что
Вывод: ряд n=1 lnn2n сходится. его общий член является последовательностью,
В соответствии с теоремой 9.2.62, можно дать точное выражение которой через элементарные
асимптотическую оценку скорости сходимости функции нам неважно, но про нее мы знаем, что
этого ряда: она бесконечно мала по сравнению с последова-
N N
тельностью n ln12 n . Отсюда следует, что ряды в
X ln n X 1
≪ , правой части (9.2.77) сходятся:
3
n=1
n2 N →∞
n=1 n2
∞ X (−1)n
но как и в примерах, иллюстрировавших теоре- √
му 9.2.56, это мало что объяснит, поскольку, как n=2
n ln n
мы уже говорили, до теорем 9.2.68 и 9.2.71 мы
не сможем выражать асимптотику рядов через – по признаку Лейбница (теорема 9.2.43),
стандартные функции. ∞
X 1
⋄ 9.2.64.
n=2
n ln2 n

X 1 ∞
X1
≫ – по интегральному признаку (теорема 9.2.18), а
n=2
ln n n=2
n
| {z }  
X∞
расходится, 1
в силу примера 9.2.19 o
n→∞ n ln2 n
n=2
Меньший ряд расходится, значит и больший ряд
расходится. – по асимптотическому признаку сравнения ря-
P∞ 1 дов (теорема 9.2.62). В итоге получаем, что ис-
Вывод: ряд n=2 ln n расходится.
ходный ряд (9.2.76) сходится.
⊲⊲ 9.2.65. Исследуйте на сходимость ряды:
P∞ P∞ ⊲⊲ 9.2.67. Исследуйте на сходимость ряды:
5 n
P∞  (−1)n 
1) n=2 2nn ; 4) n=2 ne100 ; n ln n − 1 ;
P∞ n P ∞ n 1) 2
2) n=2 (−1)n 5n! ; 5) n=2 √5n! . n=2  
P∞ ln√n P∞ q
3) n=2 sin n n n ; 2) 3
1 + (−1)n
n+1
−1 ;
n=1  
⋄ 9.2.66. Чтобы понять, сходится ли ряд P∞

(−1)n
3) e n ln n − 1 ;
X∞   n=2
(−1)n P∞  (−1)n+1 
ln 1 + √ , (9.2.76) 4) 4 n − 1 .
n=2
n ln n n=1

Связь с несобственными интегралами и формула суммирования Эйлера. Связь между


рядами и несобственными интегралами, успевшая к настоящему времени проявить себя в интеграль-
ном признаке сходимости (теорема 9.2.18), позволяет в некоторых случаях выразить асимптотику
§ 2. Числовые ряды 585

частичных сумм ряда в стандартных функциях. Первый результат на эту тему – очевидное след-
ствие теоремы 9.2.18:
Теорема 9.2.68. Пусть f – неотрицательная и невозрастающая функция на полуинтервале
[1; +∞). Тогда
XN ˆ N
f (n) = f (x) d x + C + o (1) (9.2.78)
1 N →∞
n=1
P∞ P∞
где C – постоянная Эйлера ряда n=1 f (n). Если вдобавок ряд n=1 f (n) расходится, то
N
X ˆ N
f (n) ∼ f (x) d x (9.2.79)
N →∞ 1
n=1

Доказательство. Формула (9.2.78) – просто по-другому переписанное соотношение (9.2.37):


N
X ˆ N
f (n) − f (x) d x −→ C
1 N →∞
n=1
P∞
Если ряд n=1 f (n) расходится, то есть
N
X
f (n) −→ ∞,
N →∞
n=1

то, мы получим:
P 
N
o n=1 f (n)
N →∞
!
=

N
X ˆ N z}|{ ˆ N XN
f (n) = f (x) d x + C + o (1) = f (x) d x + o f (n)
1 N →∞ 1 N →∞
n=1 | {z } n=1
=

P 
N
o n=1 f (n)
N →∞

а это эквивалентно формуле (9.2.78) по теореме 7.1.34.

⋄ 9.2.69. Частичные суммы гармонического ря- рять формуле


да XN
X∞
1 1 N 1−α − 1
= +Cα + o (1) (9.2.81)
nα 1−α N →∞
n=1
n n=1 | {z }
=

по теореме 9.2.68 удовлетворяют формуле ´N 1


dx
1 xα

XN
1 где Cα – постоянные Эйлера (9.2.42). При 0 <
ln N +C + o (1)
= |{z} (9.2.80)
n N →∞ α < 1 этот ряд расходится, поэтому выполняется
n=1
=

´N 1
соотношение (9.2.79)
1 x dx
XN
где C – постоянная Эйлера (9.2.40). Мы отме- 1 N 1−α − 1
∼ .
чали в примере 9.2.19, и это видно из форму- n=1
nα N →∞ 1 − α
лы (9.2.80), что этот ряд расходится. Формула
Его можно немного упростить, воспользовав-
(9.2.79) для него принимает вид:
шись теоремой 7.1.34,
XN
1 N 1−α − 1 N 1−α 1 N 1−α
∼ ln N. = + ∼ ,
n N →∞ 1−α 1−α 1 − α N →∞ 1 − α
n=1 | {z } | {z }
⋄ 9.2.70. Частичные суммы ряда Дирихле
=


∞ o (1)
X∞ N →∞
1
, и в результате мы получим
n=1

XN
1 N 1−α
который мы рассматривали в примере 9.2.20, при α
∼ (0 < α < 1).
n N →∞ 1 − α
0 < α 6= 1 должны по теореме 9.2.68 удовлетво- n=1
586 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Теорема 9.2.71. Для любой гладкой функции f на отрезке [1, N ], N ∈ N∗ , справедлива формула:

N
X ˆ N ˆ N
f (n) = f (1) + f (x) d x + {x} · f ′ (x) d x (9.2.82)
n=1 1 1

(здесь {x} – дробная часть x).

• Эта формула называется формулой суммирования Эйлера.

! 9.2.72. Понятно, что выбор единицы в качестве нижнего предела суммирования здесь несуще-
ственен – сдвигом аргумента из (9.2.82) выводится, например, что для любой гладкой функции f
на отрезке [0, N ] справедлива формула

N
X ˆ N ˆ N
f (n) = f (0) + f (x) d x + {x} · f ′ (x) d x
n=0 0 0

Доказательство. Рассмотрим функцию

[x]
X
F (x) = f (n) + {x} · f (x)
n=1

(здесь [x] – целая часть x).


1. Заметим, что функция F кусочно-гладкая. Действительно, при x ∈ (k, k + 1), k ∈ N∗ , выпол-
няется равенство [x] = k, поэтому {x} = x − [x] = x − k, и значит

[x] k
X X
F (x) = f (n) + {x} · f (x) = f (n) + (x − k) · f (x) (9.2.83)
n=1 n=1

Отсюда видно, что на интервале (k, k + 1) функция F гладкая и имеет конечные односторонние
производные на концах.
2. Заметим далее (и это неожиданно), что функция F непрерывна. Мы уже показали, что на
каждом интервале (k, k + 1), k ∈ N∗ , она будет гладкой, поэтому ее непрерывность нужно проверить
только в целых точках. Зафиксируем какую-нибудь точку k ∈ N∗ и вычислим в ней значение F и
значения ее односторонних пределов:

[k] k
X X
F (k) = f (n) + {k} ·f (k) = f (n)
n=1
|{z} n=1
=

nX [x] o k−1
X k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 1 · f (k) = f (n)
x→k−0 x→k−0
n=1 n=1 n=1
nX [x] o k
X k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 0 · f (k) = f (n)
x→k+0 x→k+0
n=1 n=1 n=1

Видно, что эти три величины совпадают между собой, значит F непрерывна в k.
3. Заметим, что из формулы (9.2.83) следует, что на каждом интервале (k, k + 1), k ∈ N∗ , произ-
водная функции F имеет вид:

d X  d  
k
F ′ (x) = f (n) + (x − k) · f (x) = (x − k) · f (x) = 1 · f (x) + (x − k) · f ′ (x) = f (x) + {x} · f ′ (x)
d x n=1 dx
§ 2. Числовые ряды 587

Теперь по формуле перемещения непрерывной кусочно-гладкой функции (8.3.183) получаем:

f (1)

=
0

=
P1 z}|{
n=1 f (n) + {1} ·f (1)

=
z }| { ˆ N ˆ N ˆ N

F (N ) − F (1) = F (x) d x = f (x) d x + {x} · f ′ (x) d x
| {z } 1 1 1
PN =
n=1 f (n) + {N } ·f (N )
| {z }
=

0
=

PN
n=1 f (n)


N
X ˆ N ˆ N
f (n) − f (1) = f (x) d x + {x} · f ′ (x) d x
n=1 1 1

Остается перенести f (1) в правую часть, и получится формула (9.2.82).

Формула суммирования Эйлера сводит нахождение асимптотики суммы к асимптотике интегра-


ла. Чтобы объяснить, как ее применять, нам понадобится некое новое понятие:
• Функциями Эйлера называются функции, определенные индуктивным правилом

E0 (x) = {x} (9.2.84)


ˆ x ˆ 1
Ek (x) = Ek−1 (t) d t − x · Ek−1 (t) d t, (9.2.85)
0 0

Интегралы
ˆ 1
εk = Ek (t) d t (9.2.86)
0

называются числами Эйлера, и с их помощью формула (9.2.85) записывается в виде:


ˆ x
Ek (x) = Ek−1 (t) d t − εk−1 · x (9.2.87)
0

Предложение 9.2.73. Каждая функция Эйлера Ek


— кусочно-гладка, а если k > 0, то и непрерывна,
— периодична с периодом 1,
Ek (x + 1) = Ek (x), x∈R
— ограничена на R,
— равна нулю в целых точках:
Ek (n) = 0, n∈Z (9.2.88)
— имеет производную в нецелых точках:

Ek′ (x) = Ek−1 (x) − εk−1 , /Z


x∈ (9.2.89)

Доказательство. Кусочная гладкость и непрерывность при k > 0 следует из теоремы 8.3.41. Пе-
риодичность доказывается по индукции: для E0 (x) = {x} это верно, а если Ek−1 (x + 1) = Ek−1 (x),
то
ˆ x+1 ˆ x 
Ek (x + 1) − Ek (x) = Ek−1 (t) d t − εk−1 · (x + 1) − Ek−1 (t) d t − εk−1 · x =
0 0
ˆ x+1 ˆ 1
= Ek−1 (t) d t − εk−1 = Ek−1 (t) d t − εk−1 = 0.
x 0
588 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

После этого ограниченность становится следствием непрерывности и периодичности. А равенство


нулю в целых точках следует из равенства нулю в нуле:
ˆ 0
Ek (0) = Ek−1 (t) d t − εk−1 · 0 = 0.
0

Для приложений будет полезно вычислить несколько первых чисел Эйлера и функций Эйлера
на периоде [0, 1).
Предложение 9.2.74. При x ∈ [0, 1) справедливы формулы:
1
E0 (x) = x, ε0 = (9.2.90)
2
x2 x 1
E1 (x) = − , ε1 = − (9.2.91)
2 2 12
x3 x2 x
E2 (x) = − + , ε2 = 0 (9.2.92)
6 4 12
Доказательство. При x ∈ [0, 1) получаем цепочку:

E0 (x) = {x} = x


1 1
1
ˆ ˆ
ε0 = E0 (t) d t = t dt =
0 0 2

x x
x x2 x
ˆ ˆ
E1 (x) = E0 (t) d t − ε0 · x = t dt − = −
0 0 2 2 2

1 1     1
t2 t t3 t2
= 1−1 =−1
ˆ ˆ
ε1 = E1 (t) d t = − dt = −
0 0 2 2 6 4 0 6 4 12

x x 2 
t t x x3 x2 x
ˆ ˆ
E2 (x) = E1 (t) d t − ε1 · x = − dt+ = − +
0 0 2 2 12 6 4 12

1 1     1
3
t t t 2
t4 t3 t2
= 1 − 1 + 1 =0
ˆ ˆ
ε2 = E2 (t) d t = − + dt = − +
0 0 6 4 12 24 12 24 0 24 12 24

Теперь перейдем к асимптотикам сумм.

N
⋄ 9.2.75. В примере 9.2.69 мы нашли асимпто- X ˆ N ˆ N
1 dx {x}
тическую формулу для частичной суммы гармо- =1+ − dx =
n=1
n 1 x 1 x2
нического ряда: ˆ N
{x}
XN
1 = 1 + ln N − d x. (9.2.93)
= ln N + C + o (1) (9.2.80) 1 x2
n=1
n N →∞
Таким образом, нахождение асимптотики суммы
(C – постоянная Эйлера (9.2.40)). свелось к нахождению асимптотики интеграла
Покажем теперь, как с помощью формулы ˆ N ˆ N
Эйлера (9.2.82) можно эту асимптотику уточ- {t} E0 (t)
I(N ) = d t = d t (9.2.94)
нять. Взяв f (x) = x1 , мы по формуле Эйлера по- 1 t2 1 t2
лучим:
Он отличается от изучавшегося уже нами инте-
§ 2. Числовые ряды 589

XN ˆ N
грала (9.1.26) 1 {x}
ˆ x
sin t = 1 + ln N − dx =
dt n=1
n 1 x2
1 t2  
1 1
тем, что синус sin t в подынтегральном выраже- = 1 + ln N − A + + o .
2N N →∞ N
нии заменен дробной частью {t}, а верхний пре-
дел стал дискретным. Метод нахождения асимп- Сравнив с (9.2.80), мы видим теперь, что посто-
тотики для (9.2.94) представляет собой модифи- янная A связана с постоянной Эйлера C равен-
кацию метода для (9.1.26). ством
Коротко идею можно сформулировать так: 1−A=C
здесь тоже нужно интегрировать по частям,
и поэтому полученную асимптотику можно пере-
но сначала нужно добиваться, чтобы в диффе-
писать так:
ренциале стояла функция Эйлера с подходящим
XN  
индексом. А это достигается добавлением и вы- 1 1 1
читанием чисел Эйлера в периодической части = ln N + C + + o . (9.2.95)
n=1
n 2N N →∞ N
подынтегрального выражения.
Продемонстрируем это на интеграле (9.2.94). Это уточняет асимптотическую формулу
Прежде всего замечаем, что существует конеч- (9.2.80).
ный предел Ее можно и дальше уточнять. Для этого нуж-
ˆ ∞ но заметить, что, вычисляя асимптотику для
E0 (t)
A = lim I(N ) = dt I(N ), мы попутно вывели формулу
N →∞ 1 t2 ˆ ∞
1 E1 (t)
´∞
– поскольку интеграл 1 E0t2(t) d t сходится абсо- I(N ) = A − −2 dt
2N N t3
лютно:
ˆ ∞ Подставим ее в (9.2.93):
1 ∞
ˆ ∞
E0 (t) 1
dt 6 d t = − =1
t2 t2 t 1 XN ˆ N
1 1 1 {x}
= 1 + ln N − dx =
Запомним это число A. Тогда: n=1
n 1 x2
ˆ ∞
N
1 E1 (t)
E0 (t) = 1 + ln N − A + +2 dt =
ˆ
I(N ) = dt = 2N t3
1 t2 ˆ ∞N
ˆ ∞ ˆ ∞ 1 E1 (t)
E0 (t) E0 (t) = ln N + C + +2 d t (9.2.96)
= d t − dt = 2N N t3
t 2 t2
|1 {z } N
Отдельно найдем асимптотику последнего инте-
=

A
грала:

ε0 + E0 (t) − ε0 ˆ ∞
ˆ
= A− dt = E1 (t)
t2 I2 (N ) = 2 dt =
N
ˆ ∞ ˆ ∞ N t3
1 E0 (t) − ε0 ˆ ∞
ε1 + E1 (t) + ε1
= A − ε0 d t − dt = =2 dt =
|{z} N t2 N t2 t3
ˆ ∞N
=

(9.2.90) ˆ ∞
1 1 E1 (t) − ε1
2
= 2 ε1 dt + 2 dt =
1 ∞ |{z} N t3 t3
ˆ ∞ ′
E1 (t) N
= A+ − dt =
=

(9.2.91)
2t N N t2 1
− 12

1 ∞
ˆ ∞ ˆ ∞
1 1 2 d E2 (t)
= A− − 2
d E1 (t) = (8.3.184) = = · 2 + 2 =
2N N t 2 · 12 t N N t3
E1 (t) ∞ 2E2 (t) ∞
ˆ ∞ ˆ ∞
1 E1 (t) 1 E2 (t)
=A− − 2 −2 dt = =− + + 6 dt =
2N t N N t3 12N 2 t 3 N t4
1 E1 (N )
ˆ ∞
E1 (t) ˆ ∞N
=A− + −2 dt = 1 2E2 (N ) E2 (t)
2N N 2 t3 } =− 2
− 3
+6 dt =
| {z } N | {z 12N | N{z } N t4 }
| {z
( t12 )
=

(9.2.89) o ( t13 )
=

t→∞
(9.2.89) o
0 | {z } 0 t→∞
| {z }
o (1) o ( N12 )
N →∞ N
  N →∞
 
1 1 1 1
=A− + o =− + o
2N N →∞ N 12N 2 N →∞ N 2
Подставим это в (9.2.93): Подставив это в (9.2.96), получим:
590 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

XN ˆ ∞
1 1 E1 (t) Обозначим буквой A его значение:
= ln N + C + +2 dt =
n=1
n 2N N t3 ˆ ∞
E1 (x)
  A= dx
1 1 1 1 x2
= ln N + C + − + o
2N 12N 2 N →∞ N 2
Тогда
Мы получили уточнение для формулы (9.2.95):
N
X
N   1
X 1 1 1 1 ln n = N · ln N − N + 1 + ln N +
= ln N + C + +− + o . n=1
2
n=1
n 2N 12N 2 N →∞ N 2 N
E1 (x) 1
ˆ
(9.2.97) + d x = N · ln N − N + 1 + ln N +
x 2 2
И так далее. Применяя функции Эйлера нуж- 1
ˆ ∞ ˆ ∞
ное число раз, можно добиться любой точности E1 (x) E1 (x)
+ dx− dx
асимптотического разложения. x2 | x
2
{z }
|1 {z } N

=
⋄ 9.2.76. Найдем асимптотику суммы

=
1

A o x
x→∞
N | {z }
X

=
ln n o (1)
N →∞
n=1

По формуле Эйлера (9.2.82) получаем: И в качестве ответа получаем:


N
X
N · ln N − (N − 1) 1
ln n = N · ln N − N + ln N + 1 − A + o (1)
=

N 2 N →∞

x · ln x − 1N x d ln x n=1
´
1
=

0
z }| { (A определено выше). Понятно, что эту асимп-
=

N
X z}|{ N N
{x} тотику можно уточнять.
ˆ ˆ
ln n = ln 1 +ln x d x + dx =
n=1 1 1 x ⊲ 9.2.77. Уточните асимптотическую формулу
ˆ N
{x} (9.2.81) для частичных сумм ряда Дирихле:
= N · ln N − N + 1 + dx =
1 x X∞
ˆ N 1
E0 (x) α
, 0 < α 6= 1
= N · ln N − N + 1 + dx = n=1
n
1 x
ˆ N
ε0 + E0 (x) − ε0
= N · ln N − N + 1 + d x = Точное вычисление сумм. Неожиданное
1 x следствие формулы Эйлера состоит в том, что,
= N · ln N − N + 1+ если под знаком суммы стоит многочлен, то мы
ˆ N
dx
ˆ N
E0 (x) − ε0 можем в точности сосчитать частичную сумму
+ ε0 + dx = ряда.
|{z} 1 x 1 x
=

(9.2.90)
1 ⋄ 9.2.78. Выведем формулу для суммы
2
ˆ N
1 d E1 (x) XN
= N · ln N − N + 1 + ln N + dx = n2
2 1 x
1 E1 (x) N n=1
= N · ln N − N + 1 + ln N + +
2 | x{z 1} По формуле Эйлера получаем:
=

E1 (N ) E1 (1) N
X ˆ N ˆ N
N − 1
n2 = 1 + x2 d x + 2 {x} · x d x =
=

(9.2.89)
0 n=1 1 1
ˆ N
E1 (x) 1 N3 − 1
ˆ N  
+ d x = N · ln N − N + 1 + ln N + =1+ +2 ε0 + E0 (x) − ε0 · x d x =
1 x2 2 3 1
ˆ N N
E1 (x) N3 − 1
ˆ
+ dx =1+ + 2 ε0 x d x+
1 x2 3 |{z} 1
=

(9.2.90)
Теперь заметим, что поскольку функция E1 1
2
ограничена на R, сходится абсолютно интеграл ˆ N  
´ ∞ E1 (x)
1 x2 d x: +2 E0 (x) − ε0 · x d x =
1
ˆ ∞ ˆ ∞
E1 (x) M N3 − 1 N2 − 1
ˆ N
dx 6 dx < ∞ =1+ + +2 x d E1 (x) =
x2 x2 3 2
1 1 1
§ 2. Числовые ряды 591

N3 − 1 N2 − 1 N3 N2 N
=1+ + + = + +
3 2 3 2 6
N ˆ N
Вывод:
+ 2x · E1 (x) −2 E1 (x) d x =
1
| {z } | 1
{z } N
X N3 N2 N

=
2N · E1 (N ) − 2 · E1 (1) (N − 1)
´1
E1 (x) d x
n2 = + + (9.2.98)
0 3 2 6
=
(9.2.89) n=1

=
0 (N − 1) · ε1
⊲ 9.2.79. Найдите формулы для сумм:

=
(9.2.91)
− N12
−1
PN 3
1) n=1 n ,
N3 − 1 N2 − 1 N − 1 PN
=1+ + + = 2) 4
3 2 6 n=1 n .
Глава 10

ФУНКЦИОНАЛЬНАЯ
СХОДИМОСТЬ,
ФУНКЦИОНАЛЬНЫЕ РЯДЫ И
АППРОКСИМАЦИЯ

§1 Функциональные последовательности и функциональные


ряды
• Функциональной последовательностью называется последовательность, элементами ко-
торой являются функции:
f1 , f2 , f3 , ...
• Если задана функциональная последовательность {an }, то последовательностью ее ча-
стичных сумм называется функциональная последовательность
N
X
SN (x) = an (x) = a1 (x) + a2 (x) + a3 (x) + ... + aN (x)
n=1

Пара последовательностей {an } и {SN } называется функциональным рядом и обознача-


ется

X
an (x) = a1 (x) + a2 (x) + a3 (x) + ...
n=1
P∞
Функции an называются слагаемыми ряда n=1 an , а функции SN – его частичными
суммами.

(a) Поточечная сходимость


Область сходимости функциональной последовательности
• Пусть задана функциональная последовательность

fn (x).

При каждом фиксированном значении переменной x = x0 она превращается в числовую


последовательность
fn (x0 ).
Если эта числовая последовательность сходится

∃ lim fn (x0 ) = f (x0 ),


n→∞

то говорят, что функциональная последовательность fn (x) сходится в точке x = x0 .

592
§ 1. Функциональные последовательности и функциональные ряды 593

• Множество всех точек x, в которых последовательность fn (x) сходится называется обла-


стью сходимости

D = {x ∈ R : предел lim fn (x) существует и конечен},


n→∞

а функция x ∈ D 7→ f (x) – поточечным пределом функциональной последовательности


fn (x).
• Говорят, что функциональная последовательность {fn } стремится к функции f поточечно
на множестве E, если для всякого x ∈ E числовая последовательность {fn (x)} стремится
к числу f (x):
∀x ∈ E fn (x) −→ f (x) (10.1.1)
n→∞
коротко это записывается так:
x∈E
fn (x) −→ f (x)
n→∞

⋄ 10.1.1. Функциональная последовательность 1) если |x| > 1, то f (x) = limn→∞ 1


1+xn =
 
1
fn (x) = xn 1+∞ = 0;
1 1
2) если |x| < 1, то f (x) = limn→∞ 1+x n = 1+0 =
имеет область сходимости
0;
D = (−1; 1], 3) если x = 1, то получаем f (1) =
1 1 1 1
limn→∞ 1+x n = limn→∞ 1+1n = 1+1 = 2 ;
и ее пределом будет функция 1
4) если x = −1, то limn→∞ 1+x n не существует,
(
0, если x ∈ (−1; 1) и поэтому f (−1) не определено.
f (x) =
1, если x = 1 В результате получаем

Это следует из очевидного соотношения 
0, если |x| > 1
( f (x) = 1, если |x| < 1
∞, если |x| > 1 
1
2 , если x = 1
n
x −→ (10.1.2)
n→∞ 0, если |x| < 1
и график этой функции выглядит следующим
⋄ 10.1.2. Функциональная последовательность образом:

fn (x) = nx

имеет область сходимости

D = (−∞; 0]

и ее пределом будет функция


(
0, если x < 0 Видно, что x = 1 здесь является точкой раз-
f (x) =
1, если x = 0 рыва, а все остальные точки, в которых функ-
ция определена – то есть точки x ∈ (−∞; −1) ∪
Это следует из соотношения (−1; 1) ∪ (1; +∞) – являются точками непрерыв-
( ности f (x). (При этом, в точке x = −1 функция
α ∞, если α > 0
n −→ (10.1.3) f не определена, и поэтому не имеет смысла го-
n→∞ 0, если α < 0 ворить о непрерывности f в этой точке.)
⋄ 10.1.3. Рассмотрим функцию, заданную фор- ⋄ 10.1.4. Решим ту же задачу для функции
мулой
1 nx − n−x
f (x) = lim f (x) = lim x
n→∞ 1 + xn n→∞ n + n−x

Покажем, что, несмотря на такой необыч- Рассмотрим несколько случаев (используя


ный способ задания функции, можно постро- (10.1.3)):
ить ее график (и заодно найти точки разрыва). nx −n−x
Здесь надо использовать (10.1.2) и рассмотреть 1) если x > 0, то f (x) = limn→∞ nx +n−x =
1−n−2x 1−0
несколько случаев: limn→∞ 1+n −2x = 1+0 = 1;
594Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

nx −n−x
2) если x < 0, то f (x) = limn→∞ nx +n−x = ⊲⊲ 10.1.6. Постройте графики и найдите точки
2x
−1
limn→∞ nn2x +1 = 0−1
= −1; разрыва следующих функций:
0+1

3) если x = 0, то f (x) = limn→∞ n0 −n0


= 1−1
= 1) f (x) = limn→∞ xn − xn+1 ;
n0 +n0 1+1
x−n −1
0. 2) f (x) = limn→∞ x−n +1 ;
q
В результате получаем 3) f (x) = limn→∞ n
x2 + 1
 n2 .

 1, если x > 0 4) f (x) = limn→∞ x3 nx −n−x
nx +n−x
f (x) = 0, если x = 0 x
−1

 5) f (x) = limn→∞ arcsin nnx +1 .
−1, если x < 0
2n
6) f (x) = limn→∞ cos x;
то есть f (x) совпадает с функцией сигнум: 7) f (x) = limn→∞ (sin2n x − cos2n x);
x
8) f (x) = limn→∞ 1+(2 sin x)2n ;
9) f (x) = limn→∞ arctg(nx);
10) f (x) = limn→∞ x · arctg(n · ctg x);
11) f (x) = limn→∞ x2 · arctg(x2n );
12) f (x) = limn→∞ arctg nx ;
2−nx −2nx
13) f (x) = limn→∞ 2−nx +2nx ;
Видно, что x = 0 здесь является точкой раз- 14) f (x) = lim x+x2 2nx
n→∞ 1+2nx ;
рыва, а все остальные точки, – то есть точки
x2nx −3nx
x ∈ (−∞; 0)∪(0; +∞) – являются точками непре- 15) f (x) = limn→∞ 2nx +3nx ;
рывности f (x). 16) f (x) = limn→∞ 2n sin x −2−n sin x cos x
;
2n sin x +2−n sin x
⋄ 10.1.5. Рассмотрим функциональную последо- 2n cos x −2−n cos x sin x
17) f (x) = limn→∞ 2n cos x +2−n cos x ;
вательность
p log2 (1+2nx )
n 18) f (x) = limn→∞ log2 (1+2n ) .
fn (x) = 1 + x2n
Ее областью сходимости будет вся числовая пря- ⋄ 10.1.7. Докажем следующую формулу, выра-
мая жающую функцию Дирихле из (4.1.4) как двой-
D=R ной поточечный предел стандартных функций:
а пределом будет функция  
1, x ∈ Q
 D(x) = = lim lim cosm 2π · n! · x
 если |x| < 1 /Q
0, x ∈ n→∞ m→∞
1,
(10.1.4)
f (x) = 1, если |x| = 1

 2 (эту формулу надо понимать так: чтобы вычис-
x , если |x| > 1 лить значение в точке x нужно сначала взять
потому что предел при m → ∞, а затем предел при n → ∞).
— при |x| < 1 Доказательство. Пусть x ∈ Q, то есть x = p
q,
p
n
p ∈ Z, q ∈ N∗ , тогда при n > q мы получим:
f (x) = lim 1 + x2n =
n→∞
1 n! ... q
x2n ) n = 10 = 1,
= lim (1 + |{z}
n→∞

0 ⇓

— при |x| = 1 p
n! · x = n! · ∈Z
1
q
x2n ) n = 20 = 1,
f (x) = lim (1 + |{z}
n→∞ ⇓
k
1
cos 2π · n! · x = 1
— при |x| > 1

1
f (x) = lim (1 + x2n ) n =
n→∞
  n1 cosm 2π · n! · x = 1
1
= lim x2 · 2n
+1 = x2 · 10 = x2 . ⇓
n→∞ x
|{z}

0
lim cosm 2π · n! · x = 1
m→∞
§ 1. Функциональные последовательности и функциональные ряды 595

Это верно для n > q, то есть для почти всех n. | cos 2π · n! · x| < 1
Поэтому

m
lim lim cos 2π · n! · x = 1 = D(x) m
lim cos 2π · n! · x = 0
n→∞ m→∞ m→∞

Наоборот, если x ∈/ Q, то при любом n ∈ N∗ Это верно для всех n, значит


получим:
lim lim cosm 2π · n! · x = 0 = D(x)
/Z
n! · x ∈ n→∞ m→∞

Область сходимости функционального ряда


• Пусть задан функциональный ряд

X
an (x).
n=1

При каждом фиксированном значении переменной x = x0 последовательность его частич-


ных сумм превращается в числовую последовательность
N
X
SN (x0 ) = an (x0 )
n=1

Если эта числовая последовательность сходится



X
∃ lim SN (x0 ) = S(x0 ) = an (x0 )
N →∞
n=1
P
(то есть, если числовой ряд ∞
P n=1 an (x0 ) сходится), то говорят, что функциональный ряд

a
n=1 n сходится в точке x = x0 .
P
• Множество всех точек x, в которых ряд ∞ n=1 an (x) сходится (то есть, область сходимости
функциональной последовательности SN ) называется областью сходимости
N
X
D = {x ∈ R : предел lim an (x) существует и конечен},
N →∞
n=1
P
а функция x ∈ D 7→ S(x) – поточечной суммой функционального ряда ∞ n=1 an (x).
P∞
• Говорят, что функциональный ряд n=1 an сходится Pк функции S поточечно на множе-
стве E ⊆ R, , если для всякого x ∈ E числовой ряд ∞n=1 an (x) сходится к числу S(x):

N
X
∀x ∈ E an (x) −→ S(x). (10.1.5)
N →∞
n=1

⋄ 10.1.8. Областью сходимости ряда рисуют картинку:


X
xn
n=1

⋄ 10.1.9. Областью сходимости ряда Дирихле

X∞
будет, как мы уже отмечали в теореме 9.2.5, мно- 1
жество (−1; 1). Для наглядности в таких случаях n=1
nx
596Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

будет, как уже говорилось в примере 10.1.17, Отсюда


множество (1; +∞).
1 √ 1
C= √ <1 ⇔ x+2> ⇔
3· x+2 3
1 1 17
⇔ x+2> ⇔ x> −2=−
9 9 9
Теперь можно сделать вывод, что ряд сходится
при x > − 17
9 :
⋄ 10.1.10. Найдем область сходимости ряда
X∞
(−1)n
n=1
nx

Для этого заметим, что




0, если x > 0 2. Посмотрим, что получается при x < − 17
(−1)n 9 :
= 1 −→ 1, если x = 0
nx nx n→∞ 
 17 √ 1 1
∞, если x < 0
x<− ⇒ x+2< ⇒ √ >1 ⇒
9 3 3· x+2
Отсюда получаем: .
P∞ n (−1)n 1
1) если x > 0, то n1x −→ 0, и ряд n=1 (−1)
nx ⇒ √ = √ −→ 0 ⇒
n→∞ 3 · x + 2 3 · x + 2
будет сходиться по признаку
Лейбница;
.  
n→∞
(−1)n вспоминаем
2) если x 6 0, то nx −→ 0, и ряд ⇒ необходимое условие ⇒
n→∞ сходимости
P∞ (−1) n

n=1 nxбудет расходиться в силу необходи- ∞


X (−1)n
мого условия сходимости. ⇒ ряд p расходится
n (x + 2)n
n=1 n · 3 ·

Отмечаем это на картинке:

P∞ (−1)n
Вывод: областью сходимости ряда n=1 nx
является множество (0; +∞).
⋄ 10.1.11. Найдем область сходимости ряда 3. Нам остается посмотреть, что будет при

X n x = − 17
9 :
(−1)
p
n· 3n · (x + 2)n ∞
X X∞
n=1 (−1)n (−1)n
p = q  =
Для этого сразу заметим, что область определе- n (x + 2)n 1 n
n=1 n · 3 · 9 n=1 n · 3n ·
ния нашего ряда (то есть общая область опреде-
X∞ n X∞
ления слагаемых ряда) есть множество x > −2. (−1) (−1)n
1. Исследуем теперь ряд на абсолютную схо- = 1 =
n=1
n · 3n · 3n n=1
n
димость (то есть пробуем применить к нему тео-
рему 9.2.39): Этот ряд сходится по признаку Лейбница:


X (−1)n

p =
n · 3n · (x + 2)n
n=1

X 1
= p =
n=1 n· 3n · (x + 2)n

X 1 Вывод: областью сходимости ряда
= √ n P∞
n· 3· x+2 (−1)n
n=1 n=1 n
√ n
является множество
 17 n·3 · (x+2)
Находим число Коши: − 9 ; +∞ .
s
1 1 ⊲⊲ 10.1.12. Найдите область сходимости функ-
C = lim n
√ n = √
n→∞ n· 3· x+2 3· x+2 циональных рядов:
§ 1. Функциональные последовательности и функциональные ряды 597
P∞ cos nx
1) n=1 (признак Дирихле + необходимое
n условие сходимости);
P∞ 
условие сходимости); 6) n 1
(теорема об абсолютной
P∞ cos nx n=1 x + n·2n ·xn
2) n=1 n n (теорема об абсолютной сходимо-
√ сходимости + признак Даламбера + необхо-
сти); димое условие сходимости);
P∞ n! P∞  n
3) n x
n=1 xn (необходимое условие сходимости); 7) n=1 n+1 · 2x+1 (теорема об абсолютной
P∞ xn
4) n=1 1−xn (теорема об абсолютной сходи- сходимости + признак Даламбера + необхо-
мости + признак Даламбера + необходимое димое условие сходимости);
условие сходимости); P∞ n·32n n n
P∞ 2n ·sinn x 8) n=1 2n · x · (1 − x) (теорема об абсолют-
5) n=1 n2 (теорема об абсолютной сходи- ной сходимости + признак Даламбера + необ-
мости + признак Даламбера + необходимое ходимое условие сходимости).

(b) Равномерная сходимость


• Равномерной нормой функции f на множестве E, называется величина

kf kE = kf (x)kx∈E := sup |f (x)| (10.1.6)


x∈E

(здесь предполагается, что функция f определена на множестве E).

⋄⋄ 10.1.13. k sin x kx∈R = sup | sin x| = 1


x∈R
2 2
k x kx∈[0;2]= sup |x | = 4 π
x∈[0;2] karctg xkx∈R = sup | arctg x| =
x∈R 2
k x2 kx∈R = sup |x2 | = ∞
x∈R

Свойства равномерной нормы


1◦ . Неотрицательность:
kf kE > 0 (10.1.7)
причем
kf kE = 0 ⇐⇒ ∀x ∈ E f (x) = 0 (10.1.8)
2◦ . Однородность:
kλ · f kE = |λ| · kf kE , λ∈R (10.1.9)
3◦ . Полуаддитивность:
kf + gkE 6 kf kE + kgkE (10.1.10)
4◦ . Полумультпликативность:
kf · gkE 6 kf kE · kgkE (10.1.11)
5◦ . При расширении множества норма не убывает:

D⊆E =⇒ kf kD 6 kf kE (10.1.12)

Доказательство. Все эти свойства напрямую следуют из свойств модуля. Например, полуаддитив-
ность доказывается так:
 
kf + gkE = sup |f (x) + g(x)| 6 (4.1.11) 6 sup |f (x)| + |g(x)| = (4.1.30) =
x∈E x∈E
= sup |f (x)| + sup |g(x)| = kf kE + kgkE
x∈E x∈E
598Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Равномерная сходимость функциональной последовательности


• Говорят, что последовательность функций {fn } стремится к функции f равномерно на
множестве E, если равномерная норма разности fn − f на множестве E стремится к
нулю при n → ∞:
kfn − f kE −→ 0 (10.1.13)
n→∞

Коротко это записывается так:


x∈E
fn (x) ⇒ f (x)
n→∞

Теорема 10.1.14 (о связи между поточечной и равномерной сходимостью). Если последователь-


ность функций fn стремится к функции f равномерно на множестве E, то fn стремится к f
поточечно на E:
x∈E x∈E
fn (x) −→ f (x) ⇐= fn (x) ⇒ f (x)
n→∞ n→∞

Доказательство.
x∈E
fn (x) ⇒ f (x)
n→∞


k fn (x) − f (x) kx∈E = sup |fn (x) − f (x)| −→ 0
x∈E n→∞


∀x ∈ E 0 6 |fn (x) − f (x)| 6 sup |fn (x) − f (x)| −→ 0
x∈E n→∞


∀x ∈ E |fn (x) − f (x)| −→ 0
n→∞


∀x ∈ E fn (x) − f (x) −→ 0
n→∞


∀x ∈ E fn (x) −→ f (x)
n→∞


x∈E
fn (x) −→ f (x)
n→∞

Обсудим на примерах понятие равномерной поточечно стремится к функции


сходимости. Мы увидим, что утверждение, про- (
тивоположное теореме 10.1.14 неверно: из приме- 0, x ∈ (−1; 1)
f (x) = . (10.1.14)
ров 10.1.15 и 10.1.18 следует, что функции могут 1, x = 1
сходиться поточечно, но не равномерно:
Однако fn не стремится к f равномерно на
. x∈E
x∈E (−1, 1]:
fn (x) −→ f (x) =⇒ fn (x) ⇒ f (x).
n→∞ n→∞
kfn (x) − f (x)kx∈(−1,1] =
⋄ 10.1.15. Очевидно,
( = sup |fn (x) − f (x)| =
x∈(−1,1]
n 0, x ∈ (−1; 1)
x −→ . = max{ sup |fn (x) − f (x)| , |fn (1) − f (1)|} =
n→∞ 1, x = 1 x∈(−1,1)

Это соотношение можно интерпретировать так, = max{ sup |xn − 0| , |1n − 1|} =
x∈(−1,1)
что функциональнгая последовательность .
= max{1, 0} = 1 −→ 0
fn (x) = xn , x ∈ (−1, 1], n→∞
§ 1. Функциональные последовательности и функциональные ряды 599

⋄ 10.1.16. Та же самая функциональная по- kfn (x) − f (x)kx∈[0;1] = xn − xn+1 x∈[0;1] =
следовательность, рассмотренная на отрезке
 1 1 = sup xn − xn+1
−2, 2 , x∈[0;1]
 
1 1 Это можно сделать, построив график функции
fn (x) = xn , x∈ − , , fn (x) = xn − xn+1 с помощью производной:
2 2
будет равномерно на нем стремиться к функции fn′ (x) = nxn−1 − (n + 1)xn =
 
f (x) = 0 (получающейся из функции (10.1.14) n−1 n
=x (n − (n + 1)x) = 0 ⇔ x ∈ 0;
ограничением на этот отрезок): n+1
Интервалы возрастания и убывания на отрезке
||fn (x) − f (x)||x∈E = ||xn − 0||x∈[− 1 ; 1 ] =
2 2 [0; 1]:
 n
1
= sup |xn −0| = sup |xn | = −→ 0
x∈[− 12 ; 12 ] x∈[− 21 ; 12 ] 2 n→∞

⋄ 10.1.17. Последовательность
sin x
fn (x) = Значение функции в точке максимума:
n
 
стремится к функции f (x) = 0 поточечно на мно- n nn nn+1
fn = − =
жестве E = R: n+1 (n + 1)n (n + 1)n+1
 
sin x x∈R nn n nn 1
−→ 0, = 1 − = · =
n n→∞ (n + 1)n n+1 (n + 1)n n + 1
1 1
и эта сходимость равномерна на E = R: = n ·
1 + n1 n+1
sin x График:
||fn (x) − f (x)||x∈E =k − 0 kx∈R =
n
sin x 1 1
= sup − 0 = · sup | sin x| = −→ 0.
x∈R n n x∈R n n→∞

⋄ 10.1.18. Похожая последовательность


x
fn (x) = sin
n
тоже стремится к функции f (x) = 0 поточечно
на множестве E = R:
x x∈R Норма на отрезке [0; 1]:
sin −→ 0,
n n→∞
kfn (x) − f (x)kx∈[0;1] = sup xn − xn+1 =
однако эта сходимость не равномерна: x∈[0;1]
 
x n 1 1 1
||fn (x) − f (x)||x∈E =k sin − 0 kx∈R = = fn = 1
n · −→ ·0 = 0
n n+1 1+ n n + 1 n→∞ e
x x .

= sup sin − 0 = sup sin = 1 −→ 0. Вывод: последовательность fn (x) = xn − xn+1
x∈R n x∈R n
n→∞ стремится к f (x) = 0 (поточечно и) равномер-
но на множестве E = [0; 1]:
⋄ 10.1.19. Рассмотрим функциональную после-
довательность x∈[0;1]
xn − xn+1 ⇒ 0
n→∞
fn (x) = xn − xn+1
⋄ 10.1.20. Рассмотрим функциональную после-
на множестве E = [0; 1]. Ясно, что она поточечно довательность
стремится к нулю: r
1
fn (x) = x2 + 2
x∈[0;1] n
xn − xn+1 −→ 0
n→∞ на множестве E = R. Ясно, что она поточечно
стремится к функции f (x) = |x|:
Чтобы проверить стремится ли она равномерно, r
нужно найти норму 1 x∈R p 2
x2 + 2 −→ x + 0 = |x|
n n→∞
600Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

x
Проверим, будет ли это стремление равномер- k fn (x) − f (x) kx∈[−a;a] =k arctg kx∈[−a;a] =
n
ным:
x
r = sup arctg =
x∈[−a;a] n
1 ˆ 
k fn (x) − f (x) kx∈R =k x2 + 2 − |x| kx∈R = x ′
n t
r   = sup arctg d t =
1 домножаем на n
x∈[−a;a] −a t
= sup x2 + 2 − |x| = сопряженный = ˆ
x∈R n радикал x 1
n
q  2 = sup d t =
2 + 1 2 x∈[−a;a] −a 1 + n2
t2

x − |x|
n 2

= sup q = ˆ x 1
x∈R x2 + n12 + |x| = sup n
dt 6
t2
x∈[−a;a] −a 1 + n2

2 ˆ x 1
x + n12 − x2 1 n 1
= sup q = sup q

n2 =

6 sup d t = · (a − a) −→ 0
x∈R x∈[−a;a] −a 1 + 0 n n→∞
x2 + 12 + |x| x∈R x2 + 12 + |x|
n n
1 1 Вывод: последовательность fn (x) = arctg nx стре-
= 2· q  =
n inf 1 мится к f (x) = 0 (поточечно и) равномерно на
x∈R x2 + n2 + |x|
множестве E = [−a; a]:
1
1 1 n2 1
= ·q = 1 = −→ 0 x x∈[−a;a]
n2 0 + n12 + 0 n
n n→∞ arctg ⇒ 0
n n→∞
q
⊲⊲ 10.1.22. Проверьте соотношения:
Вывод: последовательность fn (x) = x2 + n12
x∈R
стремится к f (x) = |x| (поточечно и) равномерно 1) arctg x ⇒ 0;
n
на множестве E = R: n→∞
r x∈[−a;a]
1 x∈R 2) sin nx ⇒ 0 (воспользоваться тем же приемом, что
x2 + 2 ⇒ |x| n→∞
n n→∞ и в примере 10.1.21);
x∈(−∞;0)
⋄ 10.1.21. Рассмотрим функциональную после- 3) nx ⇒ 0;
довательность n→∞
|x|< 43
x 1
4) ⇒ 1;
fn (x) = arctg 1+xn
n→∞
n
|x|<1
1
на множестве E = [−a; a]. Ясно, что она пото- 5) 1+xn ⇒ 1;
n→∞
чечно стремится к функции f (x) = 0: x>0
nx −n−x
6) nx +n−x ⇒ 1;
x x∈[−a;a] n→∞
arctg −→ arctg 0 = 0
n n→∞ |x|<1
7) sin2n x ⇒ 0;
Проверим, будет ли это стремление равномер- n→∞
|x|< π
ным: 2
8) sin2n x ⇒ 0;
n→∞

Свойства равномерно сходящихся функциональных последовательностей.


1◦ . Если функции fn равномерно сходятся к функции f на множестве E, то равномерная
норма последовательности fn ограничена:
sup kfn kE < ∞.
n∈N∗

2◦ . Если функции fn непрерывны на множестве E и равномерно сходятся на нем к функции


f
x∈E
fn (x) ⇒ f (x),
n→∞
то функция f непрерывна на множестве E.
3◦ . Если функции fn непрерывны и равномерно сходятся на интервале (a, b), то для всякой
точки c ∈ (a, b) справедливо равенство
lim lim fn (x) = lim lim fn (x) (10.1.15)
x→c n→∞ n→∞ x→c
§ 1. Функциональные последовательности и функциональные ряды 601

4◦ . Если функции fn непрерывны и равномерно сходятся на отрезке [a, b], то


ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x (10.1.16)
a n→∞ n→∞ a

5◦ . Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке
[a, b], и хотя бы для одной точки c ∈ [a, b] существует конечный предел

lim fn (c) (10.1.17)


n→∞

Тогда функции fn равномерно сходятся на отрезке [a, b], причем


 ′
lim fn = lim fn′ (10.1.18)
n→∞ n→∞

Доказательство. 1. Если kfn − f kE −→ 0, то supn∈N∗ kfn − f kE < ∞, и


n→∞

kfn kE 6 kfn − f kE + kf kE 6 sup kfn − f kE + kf kE < ∞.


n∈N∗

2. Пусть функции fn непрерывны на множестве E и равномерно сходятся к функции f на E.


Покажем, что f непрерывна на E, то есть что для любой последовательности xi ∈ E, сходящейся к
точке c ∈ E
xi −→ c
n→∞

обязательно выполняется соотношение

f (xi ) −→ f (c)
i→∞

Для этого зафиксируем какой-нибудь ε > 0 и покажем, что почти все числа f (xi ) содержатся в
интервале (f (c) − ε, f (c) + ε), то есть, что для почти всех номеров i ∈ N выполняется неравенство

|f (xi ) − f (c)| < ε (10.1.19)

Для этого заметим, что из равномерной сходимости fn к f то есть из соотношения

k fn (x) − f (x) kx∈E −→ 0


n→∞

следует что найдется номер N ∈ N, для которого


ε
k fN (x) − f (x) kx∈E <
3
Поскольку функция fN непрерывна на множестве E, должно выполняться соотношение

fN (xi ) −→ fN (c)
i→∞

Значит, найдется такой номер I ∈ N, что


ε
∀i > I |fN (xi ) − fN (c)| <
3
Теперь получаем ∀i > I

|f (xi ) − f (c)| = |f (xi ) − fN (xi ) + fN (xi ) − fN (c) + fN (c) − f (c)| 6


6 |f (xi ) − fN (xi )| + |fN (xi ) − fN (c)| + |fN (c) − f (c)| 6
ε ε ε
6k f (x) − fN (x) kx∈E +|fN (xi ) − fN (c)|+ k fN (c) − f (c) kx∈E < + + =ε
3 3 3
Мы получили то, что хотели: формула (10.1.19) выполняется для почти всех i ∈ N.
3. Пусть функции fn непрерывны и равномерно сходятся на интервале (a, b) к какой-то функции
f:
x∈(a,b)
fn (x) ⇒ f (x)
n→∞
602Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Тогда функция f будет непрерывна в силу уже доказанного свойства 10 , поэтому для всякой точки
c ∈ (a, b) мы получим
lim lim fn (x) = lim f (x) = f (c) = lim fn (c) = lim lim fn (x)
x→c n→∞ x→c n→∞ n→∞ x→c

4. Пусть функции fn непрерывны и равномерно сходятся на отрезке [a, b] к какой-нибудь функ-


ции f . Тогда
ˆ ˆ ˆ
b ˆ b b b

fn (x) d x − f (x) d x = (fn (x) − f (x)) d x 6 |fn (x) − f (x)| d x 6
a a a a
ˆ b ˆ b
6 sup |fn (x) − f (x)| d x = sup |fn (x) − f (x)| · 1 d x =k fn (x) − f (x) kx∈[a,b] ·(b − a) −→ 0
a x∈[a,b] x∈[a,b] a n→∞

То есть ˆ b ˆ b
fn (x) d x − f (x) d x −→ 0
a a n→∞
или ˆ b ˆ b
fn (x) d x −→ f (x) d x
a n→∞ a
а это уже означает, что выполняется (10.1.16):
ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x
n→∞ a a n→∞

5. Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке [a, b]
к какой-то функции g,
x∈E
fn′ (x) ⇒ g(x), (10.1.20)
n→∞
и хотя бы для одной точки c ∈ [a, b] существует конечный предел (10.1.17):
H = lim fn (c).
n→∞

Тогда, в силу доказанного уже свойства 2 , функция g непрерывна на отрезке [a, b]. Поэтому можно
рассмотреть функцию ˆ x
f (x) = H + g(t) d t, x ∈ [a, b] (10.1.21)
c
Покажем, что функции fn равномерно сходятся к функции f на отрезке [a, b]. Заметим, что
 ˆ x   ˆ x 


|fn (x) − f (x)| = fn (c) + ′
fn (t) d x − H + g(t) d t =
ˆ x c ˆ x
c
 ˆ x

= (fn (c) − H) + ′
fn (t) d x − g(t) d t 6 |fn (c) − H| + (fn′ (t) − g(t)) d t 6
ˆc x c
ˆ x c


6 |fn (c) − H| + |fn (t) − g(t)| d t 6 |fn (c) − H| + sup |fn′ (t) − g(t)| d t =
c c t∈[a,b]

= |fn (c) − H| + sup |fn′ (t) − g(t)| · |x − c| = |fn (c) − H| + k fn′ (t) − g(t) kt∈[a,b] ·|x − c|
t∈[a,b]

Отсюда

k fn (x) − f (x) kx∈[a,b] = sup |fn (x) − f (x)| = |fn (c) − H|+ k fn′ (t) − g(t) kt∈[a,b] · sup |x − c| 6
x∈[a,b] x∈[a,b]

6 |fn (c) − H|+ k fn′ (t) − g(t) kt∈[a,b] ·|b − a| −→ 0 + 0 = 0


n→∞

То есть,
x∈E
fn (x) ⇒ f (x). (10.1.22)
n→∞
Теперь формула (10.1.18) становится очевидной:
 ′

lim fn = (10.1.22) = (f ) = (10.1.21) = g = (10.1.20) = lim fn′
n→∞ n→∞
§ 1. Функциональные последовательности и функциональные ряды 603

Критерий Коши равномерной сходимости последовательности.

Теорема 10.1.23 (критерий Коши равномерной сходимости функциональной последовательности).


Функциональная последовательность {fn } тогда и только тогда равномерно сходится на множе-
стве E, когда она удовлетворяет следующим двум эквивалентным условиям:
(i) для любых двух бесконечно больших последовательностей индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞ (10.1.23)
i→∞ i→∞

соответствующие подпоследовательности {fpi } и {fqi } последовательности {fn } рав-


номерно стремятся друг к другу на множестве E:

k fpi (x) − fqi (x) kx∈E −→ 0 (10.1.24)


i→∞

(ii) для любой последовательности {li } ⊆ N и любой бесконечно большой последовательно-


сти {ki } ⊆ N
ki −→ ∞ (10.1.25)
i→∞
выполняется соотношение

k fki +li (x) − fki (x) kx∈E −→ 0 (10.1.26)


i→∞

Доказательство. Убедимся сначала, что условия (i) и (ii) действительно эквивалентны.


1. Импликация (i) ⇒ (ii) очевидна: если выполняется (i) то есть любые две подпоследователь-
ности {fpi (x)} и {fqi (x)} последовательности {fn (x)} стремятся друг к другу

k fpi (x) − fqi (x) kx∈E −→ 0,


i→∞

то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение

k fki +li (x) − fki (x) kx∈E =k fpi (x) − fqi (x) kx∈E −→ 0
i→∞

2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(10.1.26). Возьмем какие-нибудь две бесконечно большие последовательности индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞

и положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
 
fmax{pi ;qi } (x) − fmin{pi ;qi } (x), если pi > qi
fpi (x) − fqi (x) =  fmin{pi ;qi } (x) − fmax{pi ;qi } (x), если pi < qi  =
0, если pi = qi
 
fki +li (x) − fki (x), если pi > qi
=  fki (x) − fki +li (x), если pi < qi 
0, если pi = qi

В любом случае получается

k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E

поэтому
k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E −→ 0
i→∞
604Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

и значит,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞

Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {fn (x)} сходится равномерно к некоторой функ-
ции f , то есть
k fn (x) − f (x) kx∈E −→ 0
i→∞

то {fn (x)} обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие
последовательности индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞
i→∞ i→∞

Соответствующие подпоследовательности {fpi (x)} и {fqi (x)} тоже сходится равномерно к f (x), по-
тому что
k fpi (x) − f (x) kx∈E −→ 0, k fqi (x) − f (x) kx∈E −→ 0
i→∞ i→∞
поэтому

0 6k fpi (x) − fqi (x) kx∈E =k fpi (x) − f (x) + f (x) − fqi (x) kx∈E 6 (10.1.10) 6
6k fpi (x) − f (x) kx∈E + k f (x) − fqi (x) kx∈E −→ 0 + 0 = 0
i→∞

То есть,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞

и это значит, что {fn (x)} действительно должна обладать свойством (i).
4. Пусть выполнено (i), то есть для любых последовательностей индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞

выполняется соотношение
k fpi (x) − fqi (x) kx∈E −→ 0 (10.1.27)
i→∞

Тогда для всякой точки a ∈ E мы получим

0 6 |fpi (a) − fqi (a)| 6 sup |fpi (x) − fqi (x)| =k fpi (x) − fqi (x) kx∈E −→ 0
x∈E i→∞

откуда по теореме о двух милиционерах,

fpi (a) − fqi (a) −→ 0


i→∞

Это значит, что для всякой точки a ∈ E числовая последовательность {fn (a)} сходится по критерию
Коши 4.2.70. Обозначим через f (a) ее предел:

f (a) = lim fn (a), a∈E (10.1.28)


n→∞

Мы получили функцию f , определенную на множестве x ∈ E.


Покажем, что функциональная последовательность fn (x) равномерно сходится к функции f на
множестве E.
k fn (x) − f (x) kx∈E −→ 0
n→∞

Предположим, что это не так, то есть что числовая последовательность cn =k fn (x) − f (x) kx∈E не
стремится к нулю: 
cn =k fn (x) − f (x) kx∈E −→ 0 (10.1.29)
n→∞
0
Тогда, по свойству 2 на с.276, существуют подпоследовательность pi −→ ∞ и число ε > 0 такие,
i→∞
что
cpi > ε
То есть,
k fpi (x) − f (x) kx∈E = sup |fpi (x) − f (x)| > ε
x∈E
§ 1. Функциональные последовательности и функциональные ряды 605

Отсюда следует, что для всякого i существует точка ai ∈ E такая что

|fpi (ai ) − f (ai )| > ε

то есть
fpi (ai ) − ε < f (ai ) < fpi (ai ) − ε
Вспомним теперь формулу (10.1.28): число f (ai ) является пределом последовательности fn (ai ) и
лежит в интервале (fpi (ai ) − ε, fpi (ai ) − ε) Значит, почти все числа fn (ai ) лежат в этом интервале:

fpi (ai ) − ε < fn (ai ) < fpi (ai ) − ε

Обозначим через qi какое-нибудь значение n с таким свойством:

fpi (ai ) − ε < fqi (ai ) < fpi (ai ) − ε

Из этого двойного неравенства получаем

|fpi (ai ) − fqi (ai )| > ε

а отсюда
k fpi (x) − fqi (x) kx∈E > |fpi (ai ) − fqi (ai )| > ε
Это противоречит формуле (10.1.27). Таким образом, наше предположение (5.7) неверно.

Равномерная сходимость функционального ряда


Говорят, что функциональный ряд

X
an (x)
n=1

сходится равномерно на множестве E к сумме S, если последовательность его частичных сумм


N
X
SN (x) = an (x)
n=1

стремится к функции S равномерно на E:


x∈E
SN (x) ⇒ S(x) (10.1.30)
N →∞

(то есть ||SN (x) − S(x)||x∈E −→ 0).


N →∞

⋄ 10.1.24. Выясним, будет ли ряд ||SN (x) − S(x)||x∈(0;1) =




X = || x − xN +1 − x||x∈(0;1) =
(1 − x) · xn .
n=1
= sup xN +1 = 1 −→ 0
x∈(0;1)
N →∞
сходиться равномерно на множестве E = (0; 1). P∞
Для этого найдем предел его частичных сумм: Вывод: ряд n=1 (1 − x) · xn сходится на множе-
стве (0; 1) поточечно, но не равномерно к сумме
N
X N
X S(x) = x.
SN (x) = (1 − x) · xn = (xn − xn+1 ) = ⋄ 10.1.25. Выясним, будет ли ряд
n=1 n=1

X
= (x−x )+(x −x )+(x −x )+...+(xN −xN +1 ) =
2 2 3 3 4 x
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ n=0
(nx − x + 1)(nx + 1)
2
= x − x + x − x + x − x4 + ... + xN − xN +1 =
2 3 3
сходиться равномерно на множестве E =
=x−x N +1 x∈(0;1)
−→ x = S(x) (1; +∞). Для этого сразу заметим, что слагаемые
N →∞ раскладываются на простейшие дроби:
Теперь найдем норму остатка x 1 1
= −
(nx − x + 1)(nx + 1) nx − x + 1 nx + 1
606Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
P∞ x
Вычислим частичные суммы: Вывод: ряд n=1 (nx−x+1)(nx+1) сходится на
множестве (1; +∞) равномерно к сумме S(x) =
N 
X  1
1 1 1−x .
SN (x) = − =
n=0
nx − x + 1 nx + 1
↓ ↓ ↓ ↓ ↓ ⊲⊲ 10.1.26. Выясните, будет ли данный ряд схо-
1 1 1 1 1 1 диться равномерно на множестве E:
= − + − + − + P∞ 
−x + 1 1 1 x + 1 x + 1 2x + 1 n 1
| {z } | {z } | {z } 1) n=1 (1 − x) · x , E = 0; 2 ;
n=0 n=1 n=2 P∞ x
2) n=1 (nx−x+1)(nx+1) , E = (0; 1);
↓ ↓ ↓ P∞ 
n n 1
1 1 3) n=1 (1 − x ) · x , E = (0; 1), E = 0; 2
+ ... + − = (представить как сумму двух геомет-
(N − 1)x + 1 N x + 1
| {z } рических прогрессий);
n=N P∞ x √ P∞ √ √ 
1 1 x∈(0;1) 1 4) n=1 nx+x+ nx =

n=1 nx + x − nx ,
= − −→ = S(x) E = (0; 1);
1 − x N x + 1 N →∞ 1 − x
P∞ √ √ √ 
Теперь найдем норму 5) n=1  nx + 2x − 2 nx + x + nx  =
P∞ x x
n=1
√ √
nx+2x+ nx+x
− √nx+x+√nx ,
1
||SN (x) − S(x)||x∈(1;+∞) = sup E = (0; +∞), E = (1; +∞);
Nx + 1 =
x∈(1;+∞) P∞ xn +(x+1)n P∞  1 1

6) n=1 xn ·(x+1)n = n=1 (x+1)n + xn ,
1
= −→ 0 E = (0; 1), E = (1; +∞).
N + 1 N →∞

Свойства равномерно сходящихся функциональных рядов.

P
1◦ . Если ряд ∞n=1 an (x) равномерно сходится на множестве E, то равномерная норма его
частичных сумм ограничена:
XN

sup an < ∞.
n∈N∗
n=1 E
0
2 . Если функции an непрерывны на множестве E и ряд

X
an (x)
n=1

равномерно сходится на множестве E то его сумма



X
S(x) = an (x)
n=1

непрерывна на множестве E.
30 . Если функции an непрерывны на интервале (a, b) и ряд

X
an (x)
n=1

равномерно сходится на (a, b), то для всякой точки c ∈ (a, b) справедливо равенство
! ∞ 
X∞ X 
lim an (x) = lim an (x) (10.1.31)
x→c x→c
n=1 n=1

40 . Если функции an непрерывны на отрезке [a, b] и ряд



X
an (x)
n=1

равномерно сходится на [a, b], то


ˆ b X ∞
! ∞
!
X ˆ b
an (x) d x = an (x) d x (10.1.32)
a n=1 n=1 a
§ 1. Функциональные последовательности и функциональные ряды 607

50 . Пусть an – гладкие функции на отрезке [a, b], ряд из производных



X
a′n (x)
n=1

равномерно сходится на отрезке [a, b], и хотя бы для одной точки c ∈ [a, b] сходится
числовой ряд

X
an (c) (10.1.33)
n=1

Тогда функциональный ряд



X
an (x)
n=1

равномерно сходится на отрезке [a, b], причем его сумма будет гладкой на [a, b], и ее
производную можно вычислить почленным дифференцированием:

!′ ∞
X X
an = a′n (10.1.34)
n=1 n=1

Доказательство. 1. Свойство
P∞ 1◦ следует сразу из свойства 1◦ на с.600.
2. Пусть дан ряд n=1 an (x), коэффициенты которого an (x) – непрерывные функции на мно-
жестве E. Тогда частичные суммы
N
X
SN (x) = an (x)
n=1

будут непрерывны на множестве E (по теореме 4.3.14), как конечные суммы непрерывных функ-
ций). Если ряд сходится равномерно на E, то есть частичные суммы стремятся равномерно на E к
некоторой функции S(x)
x∈E
SN (x) ⇒ S(x),
N →∞

то по свойству 2◦ на с.600 эта функция



X
S(x) = an (x)
n=1

должна быть непрерывна на множестве E.


3. Пусть функции an (x) непрерывны и ряд

X
an (x)
n=1

равномерно сходятся на интервале (a, b). Это значит, что его частичные суммы
N
X
SN (x) = an (x)
n=1

непрерывны на (a, b) и стремятся равномерно на (a, b) к некоторой функции S(x)


x∈(a,b)
SN (x) ⇒ S(x),
N →∞

По свойству 3◦ на с.600, отсюда следует, что для всякой точки c ∈ (a, b) справедливо равенство

lim lim SN (x) = lim lim SN (x)


x→c N →∞ N →∞ x→c

то есть равенство !

X ∞ 
X 
lim an (x) = lim an (x)
x→c x→c
n=1 n=1
608Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

4. Пусть функции an непрерывны и ряд



X
an
n=1

PN
равномерно сходятся на отрезке [a, b]. Это означает, что частичные суммы ряда SN = n=1 an
непрерывны на [a, b] и стремятся равномерно на [a, b] к некоторой функции S
x∈(a,b)
SN (x) ⇒ S(x),
N →∞

По свойству 4◦ на с.601, отсюда следует, что


ˆ b ˆ b
lim SN (x) d x = lim SN (x) d x
a N →∞ N →∞ a

то есть, ! !
ˆ b ∞
X ∞
X ˆ b
an (x) dx = an (x) d x
a n=1 n=1 a

5. Пусть an – гладкие функции на [a, b], ряд из производных



X
a′n (x)
n=1

равномерно сходятся на отрезке [a, b], и для какой-нибудь точки c ∈ [a, b] сходится ряд

X
an (c)
n=1

P
Тогда частичные суммы SN = N n=1 an – гладкие функции на [a, b], последовательность их произ-
водных равномерно сходится на [a, b] к некоторой функции g(x)
x∈[a,b]

SN (x) ⇒ g(x),
N →∞

и для точки c ∈ [a, b] существует конечный предел

lim SN (c)
N →∞

По свойству 5◦ на с.601, отсюда следует, что функции SN равномерно на [a, b] сходится (к некоторой
гладкой функции S),
x∈[a,b]
SN (x) ⇒ S(x),
N →∞
причем  ′

lim SN = lim SN
N →∞ N →∞

Это означает, что ряд



X
an (x)
n=1

равномерно сходятся на отрезке [a, b], и



!′ ∞
X X
an = a′n
n=1 n=1
§ 1. Функциональные последовательности и функциональные ряды 609

⋄ 10.1.27. Сумма членов геометрической про- потому что частичные суммы ряда не ограниче-
грессии, рассматривавшаяся в теореме 9.2.5, ны по равномерной норме на этом интервале:
представляетс собой функциональныцй ряд
N

X
X n
xn kSN (x)kx∈(−1;1) = sup x >
x∈(−1;1) n=1
n=1
XN X N

сходящийся поточечно на интервале (−1, 1): > lim xn = 1n = N −→ ∞.
x→1 N →∞
∞ n=1 n=1
X 1
xn = , x ∈ (−1, 1).
1−x (а в силу свойства 1◦ на с.606 для сходимости
n=1
ряда эта последовательность должна быть огра-
Однако эта сходимость не равномерна на (−1, 1), ничена).

Критерий Коши равномерной сходимости ряда.

Теорема 10.1.28 (критерий Коши равномерной сходимости ряда). Пусть {an } – произвольная
последовательность функций, определенных на множестве x ∈ E. Тогда следующие условия экви-
валентны:
(i) функциональный ряд

X
an
n=1

сходится равномерно на множестве E;


(ii) для любой последовательности li ∈ N, и любой бесконечно большой последовательности
ki ∈ N
ki −→ ∞,
i→∞
Pki +li
сумма n=ki +1 an (x) стремится к нулю при i → ∞ равномерно на множестве E:
k +l
Xi i

an −→ 0
i→∞
n=ki +1 E

PN
Доказательство. Для частичных суммы SN (x) = n=1 an (x) мы получаем следующую логиче-
скую цепочку:

X
ряд an (x) сходится равномерно на E
n=1

последовательность SN (x) сходится равномерно на E


критерий Коши (теорема 10.1.23)
m сходимости функциональной последовательности

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
i→∞
выполняется соотношение: k Ski +li (x) − Ski (x) kx∈E −→ 0
i→∞
Pki +li
m Ski +li (x) − Ski (x) = n=ki +1 an (x)

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
P i→∞
ki +li
выполняется соотношение: n=k i +1
a n (x) −→ 0
x∈E i→∞
610Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Необходимое условие равномерной сходимости ряда. Часто бывает, что частичные суммы
функционального ряда не поддаются вычислению, как, например, в случае с рядом

X x
sin (10.1.35)
n=1
n2

Чтобы понять, сходится этот ряд равномерно, или нет, используются теоремы, называемые призна-
ками равномерной сходимости. Первый из них звучит так:

Теорема 10.1.29. Если функциональный ряд



X
an (x)
n=1

равномерно сходится на множестве E, то его общий член равномерно стремится к нулю на E:

x∈E
an (x) ⇒ 0
n→∞

Доказательство. По критерию Коши (теорема 10.1.28), если этот ряд сходится равномерно на E,
то для последовательностей li = 1, и ki = i должно выполняться условие
k +l
Xi i X
i+1

an (x) = an (x) = ||ai+1 (x)||x∈E −→ 0
i→∞
n=ki +1 x∈E n=i+1 x∈E

⋄ 10.1.30. Рассмотрим ряд (10.1.35): Это можно сделать, например, с помощью фор-

X мулы Ньютона-Лейбница: при x > 0 мы получа-
x ем
sin
n=1
n2

По признаку абсолютной сходимости (теорема 0


>

(5.1.129)
9.2.39), он сходится при любом x ∈ R: z }| { x
dt
ˆ
∞ | arctg x | = arctg x = 6
x
X X∞ X∞
x 1 0 1 + t2
sin 2 6 (5.1.92) 6 2 = |x|· <∞ ˆ x
n n n2
n=1 n=1 n=1 6 1 d t = x = |x|
0
Поймем, будет ли он сходиться равномерно на
множестве E = R. Для этого вычислим норму
общего члена: и отсюда уже для x < 0 получаем
x x 

sin 2 = sup sin 2 = 1 −→ 0
n x∈R x∈R n n→∞
0 0
<

>

(5.1.130)
Вывод: ряд сходится на R, но не равномерно. z }| { z}|{
arctg x = − arctg x = arctg( −x ) 6 −x = |x|
⊲ 10.1.31. Проверьте, будет ли ряд сходится рав-
номерно на множестве R:
∞ ⊲⊲ 10.1.32. Проверьте, будут ли данные ряды
X x
arctg 2 сходится равномерно на множестве E:
n=1
n P∞ n
1. x , E = (−1; 1);
Здесь предварительно нужно доказать формулу, Pn=1
∞ n n
аналогичную (5.1.92):
2. n=1 x · (1 − x ), E = [0; 1] (здесь необхо-
димо исследование функции xn · (1 − xn ) на
| arctg x| 6 |x|, x∈R (10.1.36) экстремум на множестве [0; 1]).
§ 1. Функциональные последовательности и функциональные ряды 611

Признак Вейерштрасса равномерной сходимости.


Теорема 10.1.33. Если числовой ряд, состоящий из норм функций an на множестве E

X
||an ||E (10.1.37)
n=1

сходится, то функциональный ряд



X
an
n=1

равномерно сходится на множестве E.


Доказательство. Если ряд (10.1.37) сходится, то, по критерию Коши сходимости числового ряда
(теорема 9.2.15), для любой последовательности li ∈ N, и любой бесконечно большой последова-
тельности ki ∈ N ki −→ ∞,
i→∞
kX
i +li

||an (x)||x∈E −→ 0
i→∞
n=ki +1

Отсюда k +l
Xi i kX
i +li

0 6 an (x) 6 ||an (x)||x∈E −→ 0
i→∞
n=ki +1 x∈E n=ki +1


k +l
Xi i

an (x) −→ 0
i→∞
n=ki +1 x∈E

Поскольку это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), по критерию Ко-
i→∞
P∞
ши равномерной сходимости функционального ряда (теорема 10.1.28), ряд n=1 an (x) равномерно
сходится на множестве E.

⋄ 10.1.34. Проверим, будет ли ряд (10.1.35) схо- Вывод: ряд сходится равномерно на отрезке [0; 1].
диться равномерно на множестве [0; 1]:
⊲⊲ 10.1.35. Проверьте, будут ли данные ряды
X∞
x сходится равномерно на множестве E:
sin 2 P∞
n 1. 1
E = R;
n=1 n=1 x2 +n2 ,
P∞ n  
Для этого вычислим норму общего члена: 2. n=1 x , E = − 21 ; 12 ;
P∞
x

x 1 3. x
n=1 1+n4 ·x2 , E = R (здесь необходимо ис-
sin 2 = sup sin 2 = sin 2
n x∈[0;1] x∈[0;1] n n следование функции 1+nx4 ·x2 на экстремум);
P∞ n·x
Теперь получаем 4. n=1 1+n5 ·x , E = R;
P∞  n n+1

∞ x x
X x X∞
1 5. n=1 n − n+1 , E = R;
sin 2 = sin 2 6 P∞ n2  
n=1
n x∈[0;1] n=1 n 6. √ (xn + x−n ) , E = 1, 2 .
n=1 n! 2
X∞
1
6 (5.1.92) 6 2
<∞
n=1
n

Признак Лейбница равномерной сходимости.


Теорема 10.1.36. Пусть функциональная последовательность {bn ; x ∈ E} обладает следующими
свойствами:
(i) она неотрицательна и невозрастает,

b0 (x) > b1 (x) > b2 (x) > ... > 0 (10.1.38)


612Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

(ii) она стремится к нулю равномерно на E:

||bn ||E −→ 0 (10.1.39)


n→∞

Тогда
P∞ n
(a) функциональный ряд n=0 (−1) bn сходится равномерно на множестве E,
(b) его остаток оценивается сверху нормой своего первого члена:

X

(−1)n bn (x) 6 ||bN +1 ||E (10.1.40)

n=N +1 x∈E

Доказательство. Из признака Лейбница сходимостиP числового ряда (теорема 9.2.43) следует, что
при каждом фиксированном x ∈ E числовой ряд ∞ n=0 (−1)n
b n (x) сходится. Обозначим через S(x)
его сумму, а через SN (x) его частичные суммы:

X N
X
S(x) = (−1)n bn (x), SN (x) = (−1)n bn (x)
n=0 n=0

В силу (9.2.52), мы получаем:



X


∀x ∈ E |S(x) − SN (x)| = (−1)n bn (x) 6 bN +1 (x) 6 ||bN +1 ||E

n=N +1



X
n
||S(x) − SN (x)||x∈E = sup |S(x) − SN (x)| = sup (−1) bn (x) 6 ||bN +1 ||E
x∈E x∈E n=N +1

То есть справедлива оценка (10.1.40). Из нее сразу следует равномерная сходимость ряда:

||S(x) − SN (x)||x∈E 6 ||bN +1 ||E −→ 0


N →∞


||S(x) − SN (x)||x∈E −→ 0
N →∞


x∈E
SN (x) ⇒ S(x)
N →∞

Признаки Дирихле и Абеля равномерной сходимости.


Теорема 10.1.37 (признак Дирихле). 1 Пусть функциональные последовательности {an } и {bn }
обладают следующими свойствами:
P
(i) частичные суммы ряда ∞ n=1 an равномерно ограничены на множестве E:

XN

sup an (x) <∞
N ∈N
n=1 x∈E

(ii) последовательность {bn (x)} монотонна при любом x ∈ E;


(iii) последовательность {bn } равномерно стремится к нулю на множестве E:

kbn (x)kx∈E −→ 0 (10.1.41)


n→∞
P∞
Тогда ряд n=1 an (x) · bn (x) равномерно сходится на множестве E.
1 Теорема 10.1.37 часто называется также признаком Харди.
§ 1. Функциональные последовательности и функциональные ряды 613

Доказательство. Здесь с очевидными изменениями копируется доказательство теоремы 9.2.48.


Обозначим N
X

C = sup an (x) <∞
N ∈N
n=1 x∈E
и заметим, что q
X

sup an (x) 6 2C < ∞ (10.1.42)

p,q∈N n=p
x∈E

Действительно,
q q q p−1
X X p−1
X X X

an (x) = an (x) − an (x) 6 an (x) + an (x) 6 2C
n=p
x∈E n=1 n=1 x∈E n=1 x∈E n=1 x∈E
| {z } | {z }

>

>
C C

Воспользуемся теперь критерием Коши (теорема 10.1.28): выберем произвольные последовательно-


сти li ∈ N и ki ∈ N (ki −→ ∞). По неравенству Абеля (8.2.135) получаем:
n→∞
k +l N
Xi i X n o

an (x) · bn (x) 6 3 · max an (x) · max |bki +1 (x)| , |bki +li (x)|
ki 6N 6ki +li | {z } | {z }
n=ki +1 n=ki +1
| {z }

>

>

bk (x) x∈E bki +li (x) x∈E
>

i +1
P
N
n=ki +1 an (x)
x∈E
>

(10.1.42)
2C


k +l
Xi i n o

an (x) · bn (x) 6 6 · C · max kbki +1 (x)kx∈E , kbki +li (x)kx∈E −→ 0
| {z } | {z } i→∞
n=ki +1 x∈E ↓ (10.1.41) ↓ (10.1.41)
0 0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.

⋄ 10.1.38. Проверим, будет ли ряд откуда


∞ N
X xn X

sup an (x) 62<∞
n=1
n N ∈N
n=1 x∈(−1;0)
сходиться равномерно на множестве (−1; 0). Обо- А, с другой стороны,
значим
1 монотонно
an (x) = xn , bn (x) = √ и равномерно
n 1 по x ∈ (−1, 0)
Тогда bn (x) = √ ⇒ 0
n n→∞

X N XN Вывод: ряд сходится равномерно на множестве

an (x) = sup an (x) = (−1; 0).

x∈(−1;0) n=1
n=1 x∈(−1;0)
⊲⊲ 10.1.39. Проверьте, будут ли данные ряды
XN 1 − xN
n 6 сходится равномерно на множестве E:
= sup x = sup x ·

x∈(−1;0) n=1 x∈(−1;0) 1−x P∞ (−1) 2
n(n−1)

1. n=1

3 2
n +ex
, E = R;
|x| · (1 + |xN |) P∞
6 sup 6 cos 2πn
x∈(−1;0) |1 − x| 2. n=1
√ , E = R (здесь нужно применить
3
n2 +x2
supx∈(−1;0) |x| · (1 + |xN |) формулы (9.2.61));
2 P∞ sin x·sin nx
6 6 =2 3. √ , E = R (тоже нужны форму-
inf x∈(−1;0) |1 − x| 1 n=1 n+1
лы (9.2.61)).
614Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Теорема 10.1.40 (признак Абеля). Пусть функциональные последовательности {an } и {bn } на


множестве E обладают следующими свойствами:
P∞
(i) ряд n=1 an сходится равномерно на E;
(ii) последовательность {bn } монотонна и равномерно ограничена на E:

sup kbn (x)kx∈E < ∞


n∈N∗
P∞
Тогда ряд n=1 an · bn сходится равномерно на E.
Доказательство. Здесь повторяются рассуждения, применявшиеся приPдоказательстве теоремы

9.2.52. Сначала нужно заметить, что из равномерной сходимости ряда n=1 an следует, что для
произвольных последовательностей li ∈ N и ki ∈ N (ki −→ ∞) выполняется соотношение
n→∞

X
N

max an −→ 0 (10.1.43)
ki 6N 6ki +li i→∞
n=ki +1 E

После этого, обозначив


B = sup kbn kE = sup sup |bn (x)| < ∞
n∈N∗ n∈N∗ x∈E

мы пользуемся критерием Коши (теоремой 10.1.28): для произвольных последовательностей li ∈ N


и ki ∈ N (ki −→ ∞) по неравенству Абеля (8.2.135) мы получим
n→∞
k +l
X i i XN n o

an (x) · bn (x) 6 3 · max an (x) · max |bki +1 (x)|, |bki +li (x)|
ki 6N 6ki +li | {z } | {z }
n=ki +1 n=ki +1
| {z }
>

>
B B
>

P
N
n=ki +1 an
E


k +l N
X i i X

an · bn 6 3B · max an −→ 0
ki 6N 6ki +li i→∞
n=ki +1 n=ki +1
| {z }
↓ (10.1.43)
0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится равномерно.

Всюду непрерывная, но нигде не диффе- мых этого ряда образуют сходящийся ряд
ренцируемая функция. X∞ X∞
bn kcos(an πx)kx∈R = bn < ∞
⋄ 10.1.41. Пусть числа a и b удовлетворяют n=0 n=0
условиям:
поэтому по признаку Вейерштрасса (теорема
∗ 3 10.1.33), функциональный ряд в (10.1.44) сходит-
0 < b < 1, a ∈ 2N − 1, ab > 1 + π
2 ся равномерно, и значит, определяет непрерыв-
ную функцию. Зафиксируем точку x ∈ R и убе-
Тогда функция
димся, что f не дифференцируема в ней.
X∞ Заметим прежде всего, что
f (x) = bn cos(an πx) (10.1.44) 3
n=0 ab > 1 + π
2
определена и непрерывна всюду на R, но не диф- ⇓
ференцируема ни в одной точке.
3 π
Доказательство. Равномерные нормы слагае- > (10.1.45)
2 ab − 1
§ 1. Функциональные последовательности и функциональные ряды 615

Далее рассмотрим три последовательности: k−1
X cos an π(x + h ) − cos(an πx)
n k
    6 b · 6
hk
1 1 1 1 n=0
ξk = ak x + − ∈ − , k−1 k−1
2 2 2 2 X an πhk X
  6 bn · =π· (ab)n =
1 hk
αk = ak x + = ak x − ξk ∈ Z n=0 n=0
2
 k (ab)k − 1 πak bk
3 1 = (3.2.107) = π · 6
1 − ξk 2 − a x+ 2 ab − 1 ab − 1
hk = =
ak ak
После этого оценим R. Пусть n > k. Тогда,
(здесь [·] и {·} – целая и дробная части числа, во-первых,
определенные формулами (3.2.149) и (3.2.155)).
Очевидно, что ak · (x + hk ) = ak · x + ak · hk =
 
3 k 3 k 1
0 < hk 6 (10.1.46) =a ·x+ − a x+ =
2ak 2 2
 
1 1
⇓ = ak · x + − ak x + +1=
2 2
hk −→ 0,  
1
k→∞ = ak x + + 1 = αk + 1
поэтому наша задача будет выполнена, если мы 2
докажем, что ⇓
f (x + hk ) − f (x)
−→ ∞ an · π · (x + hk ) = an−k · ak (x + hk ) · π =
hk k→∞
= an−k · (αk + 1) · π
Обозначим
 ⇓
k−1
X n n
n cos a π(x + hk ) − cos(a πx)    
S= b ·
n=0
hk cos an ·π·(x+hk ) = cos an−k · (αk + 1) ·π =
∞  | {z }
X n n
n cos a π(x + hk ) − cos(a πx)


R= b · . Z
hk
n=k
2N∗ − 1

Тогда z }| {
 n−k αk +1
= (−1) an−k ·(αk +1)
= (−1) a = (−1)αk +1
f (x + hk ) − f (x)
=
hk Во-вторых,
∞ 
X n n ak · x = αk + ξk
n cos a π(x + hk ) − cos(a πx)
= b · =
n=0
hk ⇓
∞ n n−k
k−1
X X a ·x=a · (αk + ξk )
= + =S+R

n=0 n=k
   
Сначала оценим сверху S: cos an πx = cos an−k · π · (αk + ξk ) =
  

cos an π(x + hk ) − cos(an πx) = = cos an−k παk + an−k πξk = (11.3.135) =
    

= cos an πx + an πhk − cos(an πx) = (5.1.89) = = cos an−k αk π · cos an−k πξk −
| {z }
2an πx + an πhk an πhk

=

n
= 2 sin
2 · sin 2 6 a πhk (−1)a
n−k ·α
k
| {z } | {z }    
− sin an−k αk π · sin an−k πξk =
>

>

n (5.1.92)

1 a πhk
2 | {z }
=

an πhk
2
0
n−k
 
·αk
⇓ = (−1)a · cos an−k πξk =
2N∗ − 1
k−1 

X n n z }| { 
n cos a π(x + hk ) − cos(a πx)  n−k αk  
|S| = b · 6
hk = (−1) a · cos an−k πξk =
n=0
616Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

= (−1)αk · cos an−k πξk 0

=
z }| {
Вместе мы получаем: 1 + cos a k − k πξ 
k
> bk · =
hk
 | {z }
cos an π(x + hk ) − cos(an πx) = n=k
αk +1 αk n−k
 
−π π

= (−1) − (−1) · cos a πξk = 2, 2


  z}|{ 
= (−1)αk +1 1 + cos an−k πξk 1 + cos πξk bk 2ak bk
k
=b · > (10.1.46) >
hk hk 3
⇓ Теперь получаем:

f (x + hk ) − f (x)
∞  > |R| − |S| >
X 1 + cos a n−k
πξk hk
|R| = (−1)αk · bn · =
hk 2ak bk πak bk
n=k
∞  > − =
X n 1 + cos an−k πξk 3 ab − 1
= b · =  
hk 2 π
n=k | {z } = − (ab)k −→ ∞
3 ab − 1 k→∞
| {z }
6

<
(10.1.45)
∞  0
X 1 + cos a n−k
πξk
= bn · >
hk
n=k

(c) Равномерная по производным сходимость


Пусть E – интервал или отрезок в R.
• Функция f называется гладкой на E порядка m, если она имеет m непрерывных производ-
ных на E, то есть если существует конечная последовательность непрерывных функций
f0 , f1 , ..., fm на E таких, что
f0 = f
и для всякого k = 0, ..., m − 1 функция fk дифференцируема на E (если E – отрезок, то
дифференцируемость на нем понимается в смысле определения на с.455) и ее производная
равна fk+1 :
fk′ = fk+1 , k<m
Множество всех функций, гладких на E порядка m, обозначается C m (E).
• Функция f называется бесконечно гладкой на E, если для всякого m ∈ N∗ она является
гладкой на E порядка m:
∀m ∈ N∗ f ∈ C m (E).
Множество всех бесконечно гладких функций на E обозначается C ∞ (E). Таким образом,

\
C ∞ (E) = C m (E)
m=0

Можно заметить, что бесконечная гладкость f эквивалентна просто существованию про-


изводной любого порядка, то есть существованию бесконечной последовательности функ-
ций {fk } на E такой, что

f0 = f, ∀k ∈ N ∃fk′ = fk+1 .

• Нормой функции f ∈ C m (E), равномерной на множестве E по производным до порядка


m ∈ N, называется величина

1
m
X m
X
(m) (m) 1
kf kE = kf (x)kx∈E := · f (k) = · sup |f (k) (x)| (10.1.47)
k! E k! x∈I
k=0 k=0
§ 1. Функциональные последовательности и функциональные ряды 617

Если для какого-нибудь k функция f (k) не ограничена на E, то эта величина считается


бесконечной. Однако такое может случиться только если E – интервал, потому что если
E – отрезок, то по теореме Вейерштрасса 4.3.23, все функции f (k) будут ограничены на
E.
Отметим, что равномерная по производным норма мажорирует обычную равномерную
норму, которую мы определяли формулой (10.1.6):

(m)
kf kE 6 kf kE

⋄⋄ 10.1.42. 1
+ · sup |2| = 4 + 4 + 1 = 9
2 x∈[0;2]
2 (0)
x = sup |x2 | = 4 (1)
x∈[0;2] ksin xkx∈R = sup | sin x| + sup | cos x| = 1 + 1 = 2
x∈[0;2] x∈R x∈R
2 (1)
x = sup |x2 | + sup |2x| = 4 + 4 = 8 (2)
ksin xkx∈R = sup | sin x| + sup | cos x|+
x∈[0;2]
x∈[0;2] x∈[0;2] x∈R x∈R
2 (2) 1 1
x = sup |x2 | + sup |2x|+ + · sup | − sin x| = 1 + 1 + = 2, 5
x∈[0;2]
x∈[0;2] x∈[0;2] 2 x∈R 2

Свойства равномерной по производным нормы

1◦ . Неотрицательность:
(m)
kf kE >0 (10.1.48)

причем
(m)
kf kE =0 ⇐⇒ ∀k = 0, ..., m ∀x ∈ E f (k) (x) = 0 (10.1.49)

2◦ . Однородность:
(m) (m)
kλ · f kE = |λ| · kλ · f kE , λ∈R (10.1.50)

3◦ . Полуаддитивность:
(m) (m) (m)
kf + gkE 6 kf kE + kgkE (10.1.51)

4◦ . Полумультпликативность:

(m) (m) (m)


kf · gkE 6 kf kE · kgkE (10.1.52)

5◦ . При расширении множества норма не убывает:

(m) (m)
D⊆E =⇒ kf kD 6 kf kE (10.1.53)

6◦ . При увеличении индекса норма не убывает:

(m) (n)
m6n =⇒ kf kE 6 kf kE (10.1.54)

7◦ . Норма функции мажорирует норму ее производной: для любого k 6 m



(k) (m) (k+m)
f 6 kf kE (10.1.55)
E

Доказательство. Как и в случае со свойствами равномерной нормы на с.597, все эти утверждения
следуют напрямую из свойств модуля. Мы предоставляем читателю самостоятельно проверить их
справедливость.
618Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Равномерная по производным сходимость последовательности


• Говорят, что последовательность функций {fn } стремится к функции f равномерно по
производным до порядка m на множестве E, если
(m)
kfn − f kE −→ 0 (10.1.56)
n→∞

Следующие свойства доказываются по аналогии со свойствами 1◦ и 5◦ на с.600.

Свойства функциональных последовательностей,


сходящихся равномерно по производным.
1◦ . Если функции fn равномерно по производным до порядка m сходятся к функции f на
(m)
множестве E, то норма k·k последовательности fn ограничена:
(m)
sup kfn kE < ∞.
n∈N∗

2◦ . Пусть функции fn ∈ C m [a, b] равномерно по производным до порядка m сходятся на


отрезке [a, b]. Тогда их поточечный предел лежит в C m [a, b],

lim fn ∈ C m [a, b],


n→∞

и для всякого k 6 m его производная порядка k совпадает с поточечным пределом про-


изводных порядка k:
 (k)
lim fn = lim fn(k) . (10.1.57)
n→∞ n→∞

Следующее утверждение аналогично теореме 10.1.23 и доказывается так же:


Теорема 10.1.43 (критерий Коши равномерной по производным сходимости функциональной по-
следовательности). Функциональная последовательность fn ∈ C m (E) тогда и только тогда схо-
дится к некоторой функции f ∈ C m (E) равномерно по производным до порядка m на множестве
E, когда она удовлетворяет следующим двум эквивалентным условиям:
(i) для любых двух бесконечно больших последовательностей индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞ (10.1.58)
i→∞ i→∞

соответствующие подпоследовательности {fpi } и {fqi } равномерно по производным до


порядка m стремятся друг к другу на множестве E:
(m)
kfpi − fqi kE −→ 0 (10.1.59)
i→∞

(ii) для любой последовательности {li } ⊆ N и любой бесконечно большой последовательно-


сти {ki } ⊆ N
ki −→ ∞ (10.1.60)
i→∞
выполняется соотношение
(m)
kfki +li − fki kE −→ 0 (10.1.61)
i→∞

Равномерная по производным сходимость ряда


P∞
• Говорят, что функциональный ряд n=0 an сходится на множестве E равномерно по
производным до порядка m к функции S, если частичные суммы этого ряда сходятся к S
на E равномерно по производным до порядка m:
(m)
Xn

ak − S −→ 0 (10.1.62)
n→∞
k=0 E

Следующие свойства доказываются по аналогии со свойствами 1◦ и 5◦ на с.600.

Свойства функциональных рядов,


сходящихся равномерно по производным.
§ 1. Функциональные последовательности и функциональные ряды 619
P
1◦ . Если функциональный ряд ∞ n=1 an равномерно по производным до порядка m сходятся
(m)
на множестве E, то норма k·k последовательности его частичных сумм SN ограни-
чена: N
X (m)

sup an < ∞.
N ∈N ∗
n=1 E
P∞
2◦ . Пусть слагаемые функционального ряда n=1 an принадлежат пространству C m [a, b],
и ряд равномерно по производным до порядка m сходятся на отрезке [a, b]. Тогда пото-
чечный предел этого ряда тоже лежит в C m [a, b],

X
an ∈ C m [a, b],
n=1

и для всякого k 6 m его производная порядка k совпадает с поточечной суммой произ-


водных порядка k:

!(k) ∞
X X
an = a(k)
n . (10.1.63)
n=1 n=1

Следующие две теоремы аналогичны теоремам 10.1.28 и 10.1.33, и доказывается так же:
Теорема 10.1.44 (критерий Коши равномерной по производным сходимости ряда). Для последо-
вательности функций an ∈ C m (E) следующие условия эквивалентны:
(i) функциональный ряд

X
an (x)
n=1

сходится равномерно по производным до порядка m на множестве E к некоторой сумме


S ∈ C m (E);
(ii) для любой последовательности li ∈ N, и любой бесконечно большой последовательности
ki ∈ N
ki −→ ∞,
i→∞
Pki +li
сумма n=ki +1 an стремится к нулю при i → ∞ равномерно по производным до порядка
m на множестве E: k +l (m)
Xi i

an −→ 0
i→∞
n=ki +1 E

Теорема 10.1.45 (признак Вейерштрасса для равномерной по производным сходимости). Пусть


an ∈ C m (E), и числовой ряд

X (m)
kan (x)kx∈E
n=1

сходится. Тогда функциональный ряд



X
an (x)
n=1

сходится равномерно по производным до порядка m на множестве E.

Контрпримеры в классе гладких функций. Доказательство. Рассмотрим функцию


( 1
e− x , x > 0
⋄ 10.1.46. Существует бесконечно гладкая f (x) =
0, x60
функция f ∈ C ∞ (R) со следующими свойства-
ми: Все объявленные ее свойства очевидны, кроме
( бесконечной гладкости. Очевидно, f будет беско-
f (x) = 0, x 6 0 нечно гладкой в некоторой окрестности каждой
f (x) > 0, x > 0 точки x 6= 0, поэтому нужно только доказать,
620Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

что она является бесконечно гладкой в окрест- ⋄ 10.1.49. Для любой последовательности чи-
ности точки x = 0. Чтобы это понять, вычислим сел
сначала односторонние производные в этой точ- a<α<β<b
ке. Ясно, что левая производная равна нулю: существует бесконечно гладкая функция η ∈
′ C ∞ (R) со следующими свойствами:
f− (0) = 0


η(x) = 0, x∈/ (a, b)
Найдем правую:
η(x) = 1, x ∈ (α, β)
1 1 

e− x = t 0 < η(x) < 1, x ∈ (a, α) ∪ (β, b)

f+ (0) = lim = x = lim te −t
= 0
x→+0 x t → +∞ t→+∞
Доказательство. Можно взять
Мы получили, что первая производная суще- η(x) = ha,α (x) + 1 − hβ,b (x),
ствует в каждой точке. Существование осталь-
ных проверяется по индукции. Предположим, где ha,α и hβ,b – функции из примера 10.1.48.
что мы доказали, что существует производная
порядка n. Очевидно, она имеет вид Лемма 10.1.50. Для любых ε > 0 и n ∈ N суще-
ствует гладкая функция ϕ ∈ C ∞ [−1; 1] со следу-
( P (x) 1
n −x
e , x>0 ющими свойствами:
f (n) (x) = Qn (x)
0, x60 1) в точке x = 0 все ее производные равны нулю,
кроме производной порядка n, которая равна
где Pn (x) и Qn (x) некоторые многочлены. Отсю- единице,
да получаем (
0, k 6= n
ϕ(k) (0) =
(n+1) Pn (x)e −x1
1, k = n
f+ (0) = lim =
x→+0 xQn (x)
1 2) ее равномерная норма на отрезке [−1, 1] по
= t Rn (t) −t производным до порядка n − 1 меньше ε,
= x = lim e =0
t → +∞ t→+∞ Sn (t)
(n−1)
kϕk[−1,1] < ε.
где Rn (t) и Sn (t) – некоторые новые многочле-
ны. Доказательство. Положим δ = εe (где e – чис-
ло Непера) и рассмотрим функцию η из примера
⋄ 10.1.47. Для любого интервала (a, b) на R 10.1.49 со следующими свойствами:
существует бесконечно гладкая функция g ∈ 
C ∞ (R) со следующими свойствами: 
η(x) = 0, x∈/ (−δ, δ)

( η(x) = 1, x ∈ − δ2 , 2δ


ga,b (x) = 0, x ∈ / (a, b) 0 < η(x) < 1, – в остальных случаях
ga,b (x) > 0, x ∈ (a, b)
Рассмотрим последовательность функций fn ,
Доказательство. Можно положить определенную рекуррентными соотношениями:
f0 = η,
ga,b (x) = f (b − x) · f (x − a), (´ x
f
0 ´ m−1
(t) d t, x∈
/ [0, 1]
где f – функция из примера 10.1.46. fm (x) = 0 , m>1
− x fm−1 (t) d t, x∈
/ [−1, 0)
⋄ 10.1.48. Для любого интервала (a, b) на R су- По предложению 8.3.43, все функции fm явля-
ществует бесконечно гладкая функция ha,b ∈
ются гладкими на отрезке [−1, 1], причем
C ∞ (R) со следующими свойствами:

 fm = fm−1 , m>1

ha,b (x) = 0, x6a
Отсюда следует формула:
0 < ha,b (x) < 1, x ∈ (a, b)

 
ha,b (x) = 1, x>b 
fm−k , 06k<m
(k)
fm = η, k=m (10.1.64)
Доказательство. Этими свойствами будет обла- 
 (k−m)
η , k>m
дать функция
´x Из нее, в свою очередь, следует три важных для
ga,b (t) d t нас соотношения:
ha,b (x) = ´ab ,
g a,b (t) d t (
a
(k) 0, k 6= m
fm (0) = , (10.1.65)
где ga,b – функция из примера 10.1.47. 1, k = m
§ 1. Функциональные последовательности и функциональные ряды 621

kfm k[−1,1] = sup |fm (x)| 6 δ, m>1 А с другой стороны,


x∈[−1,1]
(10.1.66) kfm k[−1,0] = sup |fm (x)| =
(m−1) x∈[−1,0]
kfm k[−1,1] <ε (10.1.67) ˆ 0

= sup fm−1 (t) d t 6
Здесь равенство (10.1.65) доказывается пере- x∈[−1,0] x
числением случаев: если 0 6 k < m, то 6 sup (0 − x) · sup |fm−1 (x)| 6
ˆ 0 x∈[−1,0] x∈[−1,0]
(k) 6 1 · kfm−1 k[−1,1] 6δ
fm (0) = fm−k (0) = fm−1 (t) d t = 0,
0 | {z }

>
если k = m, то δ,
по предположению
(k) индукции
fm (0) = η(0) = 1,
И вместе получается (10.1.66) для m:
и если же k > m, то
n o
(k)
fm (0) = η (k−m) (0) = 0. kfm k[−1,1] = max kfm k[−1,0] , kfm k[0,1] 6 δ

постоянная Неравенство (10.1.67) доказывается вычисле-
на интервале
(− δ2 , 2δ ) нием:

1
m−1
X
Неравенство (10.1.66) доказывается индукци- (m−1) (k)
ей. При m = 1 получаем, с одной стороны, kfm k[−1,1] = · fm = (10.1.64) =
k! [−1,1]
k=0
ˆ x m−1
X 1
kf1 k[0,1] = sup |f1 (x)| = sup η(t) d t = = · kfm−k k[−1,1] 6 (10.1.66) 6
x∈[0,1] x∈[0,1] 0 k!
k=0
ˆ x ˆ δ m−1 ∞
!
X 1 X 1 ε
= sup η(t) d t = η(t) d t 6 6 ·δ < ·δ =e· =ε
x∈[0,1] 0 0 k! k! e
k=0 k=0
6 δ · sup η(x) = δ
x∈[0,δ] После того, как соотношения (10.1.65)–
(10.1.67) доказаны, нам остается положить
С другой стороны,
ϕ = fn
kf1 k[−1,0] = sup |f1 (x)| =
x∈[−1,0] и мы получим
ˆ
0
ˆ 0 (
= sup − η(t) d t = sup η(t) d t = (k) 0, k 6= n
x∈[−1,0] x x∈[−1,0] x ϕ = (10.1.65) =
ˆ 0
1, k = n
= η(t) d t 6 δ · sup η(x) = δ и
−δ x∈[−δ,0] (n−1)
kϕk[−1,1] < (10.1.67) < ε
Вместе это дает
n o
kf1 k[−1,1] = max kf1 k[−1,0] , kf1 k[0,1] 6 δ Теорема 10.1.51 (Борель). Для любой последо-
вательности чисел a = {an ; n ∈ N} существу-
Далее, если для m − 1 неравенство (10.1.66) уже ет гладкая функция f на R такая, что
доказано, то для m получаем: с одной стороны,
∀n ∈ N f (n) (0) = an (10.1.68)
kfm k[0,1] = sup |fm (x)| = Доказательство. Выберем последовательность
x∈[0,1]
ˆ x функций ϕn со следующими свойствами:

= sup fm−1 (t) d t 6 1) если an = 0, то ϕn = 0,
x∈[0,1] 0
2) если an 6= 0, то ϕn выбирается по лемме
6 sup (x − 0) · sup |fm−1 (x)| 6
x∈[0,1] x∈[0,1] 10.1.50 так, чтобы выполнялись условия:
6 1 · kfm−1 k[−1,1] 6δ (
| {z } 0, 6 n
k=
ϕ(k)
n = , (10.1.69)
1, k=n
>

δ,
по предположению (n−1) 1
индукции kϕn k[−1,1] < (10.1.70)
2n−1 · |an |
622Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Заметим, что функциональный ряд штрасса 10.1.45 следует, что его сумма

X ∞
X
an · ϕn f= an · ϕn
n=0 n=0

сходится на [−1, 1] равномерно по производным


является гладкой функцией порядка k. Это спра-
до произвольного порядка k. Действительно, при
ведливо для любого k, значит f является глад-
любом фиксированном k мы получаем:
кой. При этом, по свойству 2◦ на с.619,
X (k)
X (n−1)
kan · ϕn k[−1,1] 6 kan · ϕn k[−1,1] = ∞
X
n>k+1 | {z } n>k+1 f (k) = an · ϕ(k)
n
>

(n−1)
n=0
kan · ϕn k[−1,1] ,
⇑ и отсюда
(10.1.55)


X
k 6n−1
X f (k) (0) = an · ϕ(k) (0) = (10.1.69) = ak
=
(n−1)
|an | · kϕn k[−1,1] 6 (10.1.70) 6 | n{z }
n=0

n>k+1 среди этих чисел
X 1 X 1 отлично от нуля
6 |an | · = <∞ только с индексом
2n−1 · |an | 2 n−1
n=k
n>k+1 n>k+1

Из сходимости этого ряда по признаку Вейер-

(d) Интегральная сходимость


• Пусть функция f определена и интегрируема на отрезке [a, b]. Ее интегральной нормой
на отрезке [a, b], называется величина
´ ´ ˆ
kf k[a,b] = kf (x)kx∈[a,b] := |f (x)| d x. (10.1.71)
[a,b]

ˆ
⋄⋄ 10.1.52.
´
ksin xkx∈[0,2π] = | sin x| d x =
2 ´ x3 x=2 8 [0,2π]
ˆ
x = |x2 | d x = = ˆ π ˆ 2π
x∈[0;2] 3 x=0 3
[0;2] = sin x d x − sin x d x =
0 π
x=π x=2π

´ ˆ
ksin xkx∈[0;π] = | sin x| d x = = − cos x + cos x =2+2=4
x=0 x=π
[0;π]
ˆ π x=π

= sin x d x = − cos x =2
0 x=0

Свойства интегральной нормы


1◦ . Неотрицательность: ´
kf k[a,b] > 0 (10.1.72)
2◦ . Однородность: ´ ´
kλ · f k[a,b] = |λ| · kλ · f k[a,b] , λ∈R (10.1.73)
3◦ . Полуаддитивность: ´ ´ ´
kf + gk[a,b] 6 kf k[a,b] + kgk[a,b] (10.1.74)

4◦ . Монотонность по отрезку [a, b]:


´ ´
[a, b] ⊆ [c, d] =⇒ kf k[a,b] 6 kf k[c,d] (10.1.75)
§ 1. Функциональные последовательности и функциональные ряды 623

5◦ . Связь с равномерной нормой:


´
kf k[a,b] 6 |b − a| · kf k[a,b] . (10.1.76)

Доказательство. Как и в случаях с равномерной нормой и с равномерной по производным нормой


эти свойства следуют из свойств модуля (и в данном случае еще из свойств интеграла).

Интегральная сходимость последовательности


• Говорят, что последовательность функций {fn } стремится к функции f интегрально на
отрезке [a, b], если ´
kfn − f k[a,b] −→ 0 (10.1.77)
n→∞

Следующие свойства доказываются по аналогии со свойствами 1◦ и 4◦ на с.600.

Свойства функциональных последовательностей,


сходящихся интегрально
1◦ . Если функции fn интегрально сходятся на отрезке [a, b], то интегральная норма после-
довательности fn ограничена: ´
sup kfn k[a,b] < ∞.
n∈N∗

2◦ . Пусть функции fn интегрально сходятся на отрезке [a, b], тогда интеграл их предела
совпадает с пределом интегралов:
ˆ b  ˆ b
lim fn (x) d x = lim fn (x) d x. (10.1.78)
a n→∞ n→∞ a

Из неравенства (10.1.76) следует


Теорема 10.1.53. Если последовательность интегрируемых функций fn сходится к интегриру-
емой функции f равномерно на отрезке [a, b], то fn сходится к f интегрально на [a, b].

⋄ 10.1.54. Функциональная последовательность Однако эта сходимость не равномерна, потому


что
fn (x) = xn , x ∈ [0, 1],
kfn − f k[0,1] = max |fn (x) − f (x)| =
интегрально сходится к функции f (x) = 0, пото- x∈[0,1]

му что = max xn = 1 −→ 0.
x∈[0,1] n→∞
´ ˆ 1
kfn − f k[0,1] = |fn (x) − f (x)| d x = Более того, эта сходимость и не поточечна, пото-
0 му что в точке x = 1 мы получаем
1
xn+1 1 1
ˆ
= xn d x = = −→ 0. 
n+1 0 n + 1 n→∞ fx (1) = 1n = 1 −→ 0 = f (1).
0
n→∞

Интегральная сходимость ряда


P
• Говорят, что функциональный ряд ∞ i=1 ai сходится к сумме S интегрально на отрезке
[a, b], если последовательность его частичных сумм сходится к S интегрально на [a, b]
´
Xn

ai − S −→ 0 (10.1.79)
n→∞
i=1 [a,b]

◦ ◦
Следующие свойства следуют из свойств 1 и 2 на с.623.

Свойства функциональных рядов,


сходящихся интегрально
624Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
P∞
1◦ . Если функциональный ряд n=1 an интегрально сходятся на отрезке [a, b], то инте-
гральная норма последовательности его частичных сумм ограничена:
N ´
X

sup an < ∞.
N ∈N∗
n=1 [a,b]


P∞
2 . Пусть функциональный ряд n=1 an интегрально сходится на отрезке [a, b], тогда ин-
теграл его суммы совпадает с суммой интегралов:
ˆ b X ∞
! ∞ ˆ b
X
an (x) d x = an (x) d x. (10.1.80)
a n=1 n=1 a

N N
⋄ 10.1.55. Ряд X X

X SN (x) = (1 − x) · xn = (xn − xn+1 ) =
n
x n=1 n=1
n=1 x∈[0;1]
= x − xN +1 −→ x = S(x)
не сходится интегрально на отрезке [0; 1], пото- N →∞
му что его частичные суммы не ограничены по
интегральной норме на этом отрезке: Интегральная норма остатка:

N
1X
ˆ ´
kSN (x) − S(x)kx∈[0;1] =
´
kSN (x)kx∈[0;1] = xn d x =
ˆ 1
0 n=1
= (x − xN +1 ) − x d x =
N ˆ
X 1 N
X 1 0
= xn d x = −→ ∞. 1
xN +2 1 1
ˆ
0 n + 1 N →∞ N +1
n=1 n=1 = x dx = = −→ 0
0 N +2 0 N + 2 N →∞
(а в силу замечания (d) для сходимости ряда эта
P
последовательность должна быть ограничена). Вывод: ряд ∞ n
n=1 (1 − x) · x сходится на отрезке
⋄ 10.1.56. Выясним, будет ли ряд [0; 1] интегрально к сумме S(x) = x.

X ⊲⊲ 10.1.57. Выясните, будет ли данный ряд схо-
(1 − x) · xn диться интегрально на отрезке [0, 1]:
n=1
P∞ x
1) n=1 (nx−x+1)(nx+1) ;
сходиться интегрально на отрезке [0; 1]. В при- P∞ P∞ √ √ 
x √
мере 10.1.56 мы нашли поточечный предел его 2) n=1 nx+x+ nx =

n=1 nx + x − nx ;
частичных сумм: P∞ xn +(x+1)n P∞  1 1

3) n=1 xn ·(x+1)n = n=1 (x+1)n + xn .

§2 Аппроксимация
(a) Приближение интегрируемых функций
Приближение интегрируемой функции кусочно постоянными.
• Функция g на отрезке [a, b] называется кусочно-постоянной, если существует разбиение
τ = {x0 , ..., xk } отрезка [a, b] такое, что на каждом интервале (xi−1 , xi ) функция g посто-
янна:
g(s) = g(t), s, t ∈ (xi−1 , xi )
Понятно, что всякая кусочно-постоянная функция g будет кусочно-гладкой, и значит, интегри-
руемой на [a, b]. Если через Ci обозначить значения g на интервалах постоянства (xi−1 , xi ),
g(x) = Ci , x ∈ (xi−1 , xi ),
то по лемме 8.3.37, интеграл по каждому отрезку [xi−1 , xi ] от g будет равен интегралу от Ci по
этому отрезку ˆ xi

g(x) d x = Ci · xi − xi−1
xi−1
§ 2. Аппроксимация 625

Как следствие, интеграл от g по всему [a, b] будет равен

b k
X 
ˆ
g(x) d x = Ci · xi − xi−1 (10.2.81)
a i=1

Теорема 10.2.1. Для любой интегрируемой функции f на отрезке [a, b] и любого ε > 0 можно
найти кусочно-постоянную функцию g на [a, b] такую, что
´ ˆ b
kf − gk[a,b] = |f (x) − g(x)| d x < ε (10.2.82)
a

Функцию g можно выбрать так, чтобы выполнялось условие:

sup |g(x)| 6 sup |f (x)| (10.2.83)


x∈[a,b] x∈[a,b]

Доказательство. Выберем разбиение τ = {x0 , ..., xk } отрезка [a, b] так, чтобы нижняя сумма Дарбу
sτ отличалась от интеграла меньше чем на ε:
ˆ b
06 f (x) d x − sτ < ε
a

(этого всегда можно добиться, в силу соотношений (8.2.105)). Положим

g(t) = inf f (x), t ∈ [xi−1 , xi )


x∈[xi−1 ,xi ]

(а в последней точке xk = b функцию g можно определить, например, положив g(b) = f (b)). Тогда
мы получим:
g(x) 6 f (x), x ∈ [a, b]

и поэтому
ˆ b ˆ b   ˆ b ˆ b
| f (x) − g(x) | d x = f (x) − g(x) d x = f (x) d x − g(x) d x = (10.2.81) =
a | {z } a a a
6

0
ˆ b k
X ˆ b
= f (x) d x − inf f (x) · ∆xi = f (x) d x − sτ < ε
a x∈[xi−1 ,xi ] a
i=1
| {z }
=

Условие (10.2.83) выполняется по построению g.

Приближение интегрируемой функции непрерывными.

Теорема 10.2.2. Для любой интегрируемой функции f на отрезке [a, b] и любого ε > 0 можно
найти непрерывную функцию g на [a, b] такую, что
´ ˆ b
kf − gk[a,b] = |f (x) − g(x)| d x < ε (10.2.84)
a

Функцию g можно выбрать так, чтобы выполнялось условие:

sup |g(x)| 6 sup |f (x)| (10.2.85)


x∈[a,b] x∈[a,b]

а также условие
g(a) = 0 = g(b) (10.2.86)
626Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Доказательство. 1. Рассмотрим сначала случай, когда функция f представляет собой ступеньку,


то есть имеет вид (
C, x ∈ [α, β]
f (x) =
0, x ∈
/ [α, β]
для некоторого отрезка [α, β] ⊆ [a, b] и некоторого числа C ∈ R. Тогда для любого ε > 0 можно
поправить функцию f линейно в окрестностях точек разрыва α и β (или в окрестности одной из
них, если другая является концом отрезка [a, b]) так, чтобы получилась непрерывная функция g,
отличающаяся от f только в этих окрестностях, и интеграл от модуля разности будет маленьким.
На языке формул это можно выразить так: если a 6= α и β 6= b, то положим


 0, x<α−δ



 C C

ε
  δ · x + C − δ · α, x ∈ [α − δ, α]
δ = min , α − a, b − β , g(x) = C, x ∈ [α, β]
3|C| 


 C C
− δ · x + C + δ · β, x ∈ [β, β + δ]


0, x>β+δ

и тогда g непрерывна, отличается от f только на интервалах (α − δ, α) и (β, β + δ), и разность f − g


нигде не превосходит |C|, поэтому
b α β+δ
ε 2ε
ˆ ˆ ˆ
|f (x) − g(x)| d x = |f (x) − g(x)| d x + |f (x) − g(x)| d x 6 2|C|δ 6 2|C| · = <ε
a α−δ β 3|C| 3

Если же a = α или β = b, то в определении g интервал (α − δ, α) или интервал (β, β + δ) соот-


ветственно нужно исключить, и результат будет тем же. Условие (10.2.85) при этом выполняется
автоматически.
2. После этого предположим, что функция f кусочно-постоянна. Тогда, если не считать ее значе-
ний в точках разрыва, она будет совпадать с суммой некоторого конечного набора ступенек f1 , ..., fn :
n
X
f= fi
i=1

Для каждой ступеньки fi подберем непрерывную функцию gi так, чтобы


b
ε
ˆ
|fi (x) − gi (x)| d x <
a n
Pn
Тогда, положив g = i=1 gi , мы получим:
n ˆ b X
ˆ b ˆ b X Xn n  

|f (x) − g(x)| d x = fi (x) − gi (x) d x = fi (x) − gi (x) d x 6
a a
a i=1
i=1 i=1
ˆ bX n Xn b Xn
ε
ˆ

6 fi (x) − gi (x) d x = fi (x) − gi (x) d x < =ε
a i=1 i=1 a i=1
n

Если вдобавок gi выбирались так, чтобы выполнялось условие (10.2.85),

sup |gi (x)| 6 sup |fi (x)|


x∈[a,b] x∈[a,b]

то это условие будет выполняться и для g:

sup |g(x)| = max sup |gi (x)| 6 max sup |fi (x)| = sup |f (x)|
x∈[a,b] 16i6n x∈[a,b] 16i6n x∈[a,b] x∈[a,b]

3. Наконец, если f – произвольная интегрируемая функция, и ε > 0, то, подберем для нее по
теореме 10.2.1 кусочно-постоянную функцию, обозначим ее h, так, чтобы
b
ε
ˆ
|f (x) − h(x)| d x <
a 2
§ 2. Аппроксимация 627

Затем, по уже доказанному, мы можем подобрать для функции h непрерывную функцию g так,
чтобы ˆ b
ε
|h(x) − g(x)| d x <
a 2
И тогда мы получим:
ˆ b ˆ b ˆ b  
|f (x) − g(x)| d x = |f (x) − h(x) + h(x) − g(x)| d x 6 |f (x) − h(x)| + |h(x) − g(x)| dx =
a a a
b b
ε ε
ˆ ˆ
= |f (x) − h(x)| d x + |h(x) − g(x)| d x < + =ε
a a 2 2
Если кроме того, h и g выбирались так, чтобы удовлетворять условиям (10.2.85) и (10.2.83), то мы
получим
(10.2.85) (10.2.83)
sup |g(x)| 6 sup |h(x)| 6 sup |f (x)|
x∈[a,b] x∈[a,b] x∈[a,b]

4. Последнее условие (10.2.86) можно обеспечить, поправив еще немного функцию g в окрестно-
сти точки a или b так, как мы это делали в пункте 1 (то есть линейно).

(b) Свертка
• Сверткой функций f : R → R и g : R → R называется функция f ∗g : R → R, определенная
формулой
ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y, y ∈ R (10.2.87)
−∞ A → −∞ A
B → +∞

Здесь в правой части стоит несобственный интеграл, который, конечно, не для любых f , g
и x существует, и поэтому свертка f ∗ g не всегда определена. Среди достаточных условий для
существования свертки нас будет интересовать только одно, а именно, то, в котором функции f и g
локально интегрируемы, причем одна из них финитна. Понятие локально интегрируемой функции
было введено нами на с.535, а что такое финитная функция объясняется в следующем определении:
• Функция f : R → R называется финитной, если существует отрезок [a, b], вне которого
функция f обращается в нуль:

∀x ∈
/ [a, b] f (x) = 0

Наименьший из таких отрезков мы будем называть выпуклым носителем функции f и


обозначать conv supp f :
\n o
conv supp f = [a, b] : ∀x ∈
/ [a, b] f (x) = 0

(если f финитная и не везде нулевая, то такой отрезок всегда существует).


Теорема 10.2.3. Если функции f и g локально интегрируемы, причем одна из них финитна, то
свертка f ∗ g : R → R корректно определена и непрерывна.
Доказательство. Если финитна функция f , то интеграл в правой части (10.2.87) будет равен ин-
тегралу по ее выпуклому носителю [a, b] = conv supp f :
ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y =
−∞ A → −∞ A
B → +∞
(ˆ )
a ˆ b ˆ B
= lim f (y) · g(x − y) d y + f (y) · g(x − y) d y + f (y) · g(x − y) d y =
A → −∞ A a b
B → +∞ | {z } | {z }
=

0 0
ˆ b
= f (y) · g(x − y) d y
a
628Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Если же финитна функция g, и [a, b] = conv supp g – ее выпуклый носитель, то для всякого фик-
сированного x ∈ R функция y 7→ g(x − y) будет тоже финитной, и ее выпуклым носителем будет
отрезок [x − b, x − a]:

x−y ∈ [a, b] ⇔ a 6 x−y 6 b ⇔ −a > y−x > −b ⇔ x−a > y > x−b ⇔ y ∈ [x−b, x−a]

Поэтому интеграл в (10.2.87) будет интегралом по отрезку [x − b, x − a]:


ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y =
−∞ A → −∞ A
B → +∞
(ˆ )
x−b ˆ x−a ˆ B
= lim f (y) · g(x − y) d y + f (y) · g(x − y) d y + f (y) · g(x − y) d y =
A → −∞
B → +∞ |A {z } x−b
|
x−a
{z }
=

=
0 0
ˆ x−a
= f (y) · g(x − y) d y
x−b

Остается проверить, что функция f ∗ g непрерывна – мы это сделаем позже, на с.631.


• Сдвигом функции f : R → R на величину a ∈ R называется функция Ta f : R → R,
определенная правилом
Ta f (x) := f (x + a), x∈R (10.2.88)

Свойства свертки

1 . Дистрибутивность:
(f + g) ∗ h = f ∗ h + g ∗ h (10.2.89)
2◦ . Коммутативность:
f ∗g =g∗f (10.2.90)

3 . Перестановочность со сдвигом:

(Ta f ) ∗ g = Ta (f ∗ g) = f ∗ (Ta g) (10.2.91)

4◦ . Оценка равномерной нормы: если функция g (локально интегрируема и) сосредоточена


на отрезке [a, b],
∀x ∈
/ [a, b] g(x) = 0,
то для любой (локально интегрируемой) функции f и любого отрезка [A, B] выполня-
ются неравенства:
´
kf ∗ gk[A,B] 6 kf k[A−b,B−a] · kgk[a,b] (10.2.92)
´
kf ∗ gk[A,B] 6 kf k[A−b,B−a] · kgk[a,b] (10.2.93)

Доказательство. 1. Первое свойство доказывается просто вычислением:


  ˆ +∞  
(f + g) ∗ h (x) = f (y) + g(y) · h(x − y) d y =
−∞
ˆ +∞ ˆ +∞
= f (y) · h(x − y) d y + g(y) · h(x − y) d y = (f ∗ h)(x) + (g ∗ h)(x)
−∞ −∞

2. Следующие два свойства доказываются заменой переменной. Коммутативность:


+∞ B
x−y =t
ˆ ˆ
f ∗ g(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y = y = x − t = (8.2.128) =

−∞ A → −∞ A dy = −dt
B → +∞
x−B x−A e
B = x − A A→−∞
−→ +∞
ˆ ˆ
=− lim f (x − t) · g(t) d t = lim f (x − t) · g(t) d t = Ae = x − B −→ −∞ =

A → −∞ x−A A → −∞ x−B B→+∞
B → +∞ B → +∞
§ 2. Аппроксимация 629

ˆ e
B ˆ +∞
= lim f (x − t) · g(t) d t = f (x − t) · g(t) d t = (g ∗ f )(x)
e → −∞
A e
A −∞
e → +∞
B

3. Перестановочность со сдвигами:
+∞ B
y + a = t
ˆ ˆ
(Ta f ) ∗ g(x) = Ta f (y) · g(x − y) d y = lim f (y + a) · g(x − y) d y = y = t − a = (8.2.128) =

−∞ A → −∞ A dy = dt
B → +∞
B+a
−→ −∞
α = A + a A→−∞
ˆ
= lim f (t) · g(x + a − t) d t = β = B + a −→ +∞ =

A → −∞ A+a B→+∞
B → +∞
ˆ β ˆ +∞ 
= lim f (t) · g(x + a − t) d t = f (t) · g(x + a − t) d t = (g ∗ f )(x + a) = Ta (g ∗ f ) (x)
α → −∞ α −∞
β → +∞

И точно так же доказывается вторая формула в (10.2.91).


4. Докажем (10.2.92):

ˆ ∞ ˆ b


∀x ∈ [A, B] (f ∗ g)(x) =
f (x − y) · g(y) d y = f (x − y) · g(y) d y 6
−∞ |{z} a

отлично от нуля
только при y ∈ [a, b]
[A − b, B − a]

[x − b, x − a]

ˆ b z }| {

ˆ b



´
6 |f ( x − y )| · g(y) d y 6 kf k[A−b,B−a] · g(y) d y = kf k[A−b,B−a] · kgk[a,b]
a | {z } a
>

kf k[A−b,B−a]




´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]

Теперь (10.2.93):
ˆ ∞


∀x ∈ [A, B] (f ∗ g)(x) = f (x − y) · g(y) d y =
−∞ |{z}

отлично от нуля
только при y ∈ [a, b]
ˆ ˆ
b b

= f (x − y) · g(y) d y 6 f (x − y) · |g(y)| d y 6 (8.2.117) 6
a a | {z }
>

kgk[a,b]
b ˆ x−b
x−y = t
ˆ

6 f (x − y) d y · kgk[a,b] = y = x − t
d y = − d t = − kgk [a,b] · fn (t) − f (t) d t =
a x−a
ˆ x−a ˆ B−a

´
= f (t) d t · kgk[a,b] 6 f (t) d t · kgk[a,b] = kf k[A−b,B−a] · kgk[a,b]
x−b ↑ A−b
[x − b, x − a] ⊆ [A − b, B − a]




´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]

Лемма 10.2.4. Пусть f – непрерывная функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
kTsn f − f k[α,β] = kf (x + s) − f (x)kx∈[α,β] −→ 0 (10.2.94)
s→0
630Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Доказательство. Функция f непрерывна на отрезке [α − 1, β + 1], значит по теореме Кантора 4.3.32


она равномерно непрерывна на нем, то есть для любого ε > 0 существует δ > 0 такое что для любых
x и y будет справедлива импликация:
 
y ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1] =⇒ |f (y) − f (x)| < ε
 
|y − x| < δ

Здесь при необходимости число δ можно уменьшить так, чтобы выполнялось дополнительное нера-
венство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
 
 x + s ∈ [α − 1, β + 1] 
x ∈ [α − 1, β + 1]
|(x + s) − x| = |s| < δ 

|f (x + s) − f (x)| < ε

Поэтому
kTs f − f k[α,β] = sup |f (x + s) − f (x)| 6 ε (10.2.95)
x∈[α,β]

То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(10.2.95). Это и нужно было доказать.

Лемма 10.2.5. Пусть f – гладкая функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
Ts f − f f (x + s) − f (x)
− f ′
= − f ′
(x) −→ 0 (10.2.96)
s s s→0
[α,β] x∈[α,β]

Доказательство. Здесь тот же прием примененяется не к функции f , а к ее производной f ′ . Функ-


ция f ′ непрерывна на отрезке [α − 1, β + 1], значит по теореме Кантора 4.3.32 она равномерно
непрерывна на нем, то есть для любого ε > 0 существует δ > 0 такое что для любых x и y будет
справедлива импликация:
 
y ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1] =⇒ |f ′ (y) − f ′ (x)| < ε
 
|y − x| < δ

Опять замечаем, что при необходимости число δ можно уменьшить так, чтобы выполнялось допол-
нительное неравенство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
 
 x + τ ∈ [α − 1, β + 1] 
x ∈ [α − 1, β + 1]
|(x + τ ) − x| = |τ | 6 |s| < δ 
1   ⇓

· f (x + s) − f (x) −f ′ (x) = |f ′ (x + τ ) − f (x)| < ε ′
s |

{z } →

0s
=

(8.3.163)
´ x+s
x
f ′ (y) d y
=

´s
0
f ′ (x + t) d t
=

(8.3.162)
f ′ (x + τ ) · s,


τ ∈ 0s

Поэтому
Ts f − f f (x + s) − f (x)
− f ′
= sup − f ′
(x) 6ε (10.2.97)
s s
[α,β] x∈[α,β]

То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(10.2.97). Это и нужно было доказать.
§ 2. Аппроксимация 631

Окончание доказательства теоремы 10.2.3. Вспомним, что в доказательстве теоремы 10.2.3 мы


отложили на будущее проверку того, что свертка f ∗ g действительно является непрерывной функ-
цией. Теперь можем в этом убедиться.
1. Предположим сначала, что функция g непрерывна и финитна. Пусть [a, b] – ее выпуклый
носитель:
conv supp g = [a, b]
Тогда для любой последовательности sn → 0, по модулю не превосходящей 1,

|sn | 6 1

сдвиги Tsn g функции g будут сосредоточены на отрезке [a − 1, b + 1]:

conv supp Tsn g ⊆ [a − 1, b + 1] (10.2.98)

Из леммы 10.2.4 мы получим цепочку:

kTsn g − gk[a−1,b+1] −→ 0 (лемма 10.2.4)


n→∞

∀x ∈ R |(f ∗ g)(x + sn ) − (f ∗ g)(x)| = |Tsn (f ∗ g)(x) − (f ∗ g)(x)| = kTsn (f ∗ g) − f ∗ gk[x,x] =


 

= (10.2.91) = kf ∗ (Tsn g) − f ∗ gk[x,x] = (10.2.89) = f ∗ Tsn g − g 6
[x,x]
´
6 (10.2.93) 6 kf k[x−b−1,x−a+1] · kTsn g − gk[a−1,b+1] −→ 0
| {z } n→∞

0


∀x ∈ R (f ∗ g)(x + sn ) −→ (f ∗ g)(x)
n→∞

Это верно для любой последовательности sn → 0 со свойством |sn | 6 1, значит,

∀x ∈ R (f ∗ g)(x + s) −→ (f ∗ g)(x)
s→0

то есть функция f ∗ g непрерывна.


2. Теперь пусть g – произвольная локально интегрируемая финитная функция и [a, b] – ее вы-
пуклый носитель. По теореме 10.2.2 можно подобрать последовательность непрерывных функций
gn так, чтобы выполнялись условия
´
kgn − gk[a,b] −→ 0, g(a) = 0 = g(b)
n→∞

Второе из этих условий означает, что функции gn можно продолжить нулем вне отрезка [a, b], и они
станут непрерывными функциями, определенными на всей прямой R, и, как и g, сосредоточенными
на отрезке [a, b], поэтому
∀n conv supp(gn − g) ⊆ [a, b]
После этого для всякого отрезка [A, B] ⊂ R мы получим:
´
kf ∗ gn − f ∗ gk[A,B] = (10.2.89) = kf ∗ (gn − g)k[A,B] 6 (10.2.92) 6 kf k[A−b,B−a] · kgn − gk[a,b] −→ 0
n→∞


x∈[A,B]
(f ∗ gn )(x) ⇒ (f ∗ g)(x)
n→∞

При этом, поскольку функции gn непрерывны, по уже доказанному, свертки f ∗ gn – тоже непрерыв-
ные функции. Значит, по свойству 1◦ на с.600, равномерный на отрезке [A, B] предел f ∗ g функций
f ∗ gn должен быть непрерывной функцией на [A, B]. Это верно для любого отрезка [A, B], значит
функция f ∗ g должна быть непрерывна всюду на R.
632Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Теорема 10.2.6. Если одна из функций f или g является гладкой, то свертка f ∗g тоже является
гладкой, причем если гладкой является функция f , то

(f ∗ g)′ = f ′ ∗ g (10.2.99)

если же гладкой является функция g, то

(f ∗ g)′ = f ∗ g ′ (10.2.100)

Доказательство. Пусть функция f – гладкая, а g – финитная (и локально интегрируемая) с носи-


телем [a, b]. Тогда для произвольной последовательности sn −→ 0, sn 6= 0, мы получим:
n→∞

 
1
∀[α, β] ⊂ R ′
sn Tsn f − f − f −→ 0
n→∞
(лемма 10.2.5)
[α,β]


(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R − (f ∗ g)(x) =

sn
   
1 1
= ′
(Tsn f ∗ g)(x) − (f ∗ g)(x) − (f ∗ g)(x) = Tsn f ∗ g − f ∗ g − f ∗ g

=
sn sn
[x,x]
     
1 1 ´
= sn sn T f − f − f ′
∗ g
6 (10.2.92) 6 T
sn sn f − f − f ′
· kgk[a,b] −→ 0
n→∞
[x,x] [x−b,x−a]
| {z }
n
↓ ↓

0

(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
sn n→∞

Это верно для любой последовательности sn → 0. Поэтому

(f ∗ g)(x + s) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
s s→0

Мы получаем, что функция f ∗ g дифференцируема и ее производная будет равна f ′ ∗ g. Остается


вспомнить, что в силу только что законченного доказательства теоремы 10.2.3, функция f ′ ∗ g будет
непрерывна.
По аналогии рассматривается случай, когда функция f – произвольная (локально интегрируе-
мая), а g – гладкая и финитная.

Следствие 10.2.7. Если одна из функций f или g является бесконечно гладкой, то их свертка
тоже будет бесконечно гладкой.

Доказательство. Пусть f бесконечно гладкая. Тогда по теореме 10.2.6 свертка f ∗ g будет гладкой,
причем
(f ∗ g)′ = f ′ ∗ g

Поскольку f ′ тоже гладкая, опять по теореме 10.2.6 получаем, что свертка f ′ ∗ g, то есть функция
(f ∗ g)′ , будет гладкой, причем
(f ∗ g)′′ = (f ′ ∗ g)′ = f ′′ ∗ g

И так далее.
§ 2. Аппроксимация 633

(c) Приближение непрерывных функций


Аппроксимативная единица.
• Последовательность локально интегрируемых функций ∆n : R → R называется аппрок-
симативной единицей, если выполняются следующие условия:
(i) функции ∆n имеют общий компактный носитель, то есть существует отрезок [α, β],
вне которого все они равны нулю:

∀x ∈
/ [α, β] ∀n ∈ N∗ ∆n (x) = 0

если это верно, то в качестве [α, β] всегда можно выбрать отрезок вида [−D, D], где
D > 0, и тогда будет выполняться условие
 
∀x ∈ R |x| > D =⇒ ∀n ∈ N∗ ∆n (x) = 0 (10.2.101)

(ii) все функции ∆n неотрицательны:


∆n > 0 (10.2.102)
(iii) интеграл от всякой функции ∆n равен единице:
ˆ +∞
∆n (x) d x = 1 (10.2.103)
−∞

(iv) для всякого δ > 0 выполняется соотношение:


ˆ +δ
∆n (x) d x −→ 1 (10.2.104)
−δ n→∞

или, что равносильно, соотношение


ˆ
∆n (x) d x −→ 0 (10.2.105)
|x|>δ n→∞

1
⋄ 10.2.8. Покажем, что функции 2
ˆ
= ´1 · (1 − x2 )n d x 6
2 n
( −1 (1 − x ) d x | δ {z }
´1 1
· (1 − x2 )n , |x| 6 1 | {z }
>

(1−x2 )n d x
∆n (x) =
>

−1 ´1
(1 − δ 2 )n d x
0, |x| > 1 n+1 δ
=

(10.2.106) (1 − δ 2 )n · (1 − δ)
образуют аппроксимативную единицу. Условия (4.2.61)
(i)-(iii) здесь очевидны. Докажем (iv). Для вся- 6 (n + 1) · (1 − δ 2 )n · (1 − δ) −→ 0
n→∞
кого δ > 0 мы получим:
⋄ 10.2.9. Покажем, что функции
1 1
( 1
· cos2n x2 , |x| 6 π
ˆ ˆ ´π
(1 − x2 )n d x = 2 (1 − x2 )n d x > cos2n x
2 dx
∆n (x) = −π
−1 0 0, |x| > π
1
(1 − x)n+1 x=1 2 (10.2.107)
ˆ
>2 (1−x)n d x = −2· =
0 n+1 x=0 n+1 образуют аппроксимативную единицу. Как и в
предыдущем примере, здесь нужно проверить
⇓ только условие (iv). Для всякого δ > 0 мы по-
лучим:
2 ˆ π x
6n+1 x =y
cos2n d x = 2 =
´1
−1 (1 − x2 )n d x 2 x = 2y
−π
ˆ π2 ˆ π2
⇓ =2 cos2n y d y = 4 cos2n y d y >
−π 2 0 | {z }
6

1 − 2y
π ,
ˆ ˆ 1 потому что
∆n (x) d x = 2 · ∆n (x) d x = cos – выпуклая
 
|x|>δ δ функция на 0, π
2
634Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
 2n
π
2y мы получим функцию со следующими свойства-
ˆ 2
>4 1− dy =
0 π ми:
 2n+1 y= π2 
2π 2y 2π 
h(x) = 0, x∈/ (−1, 1)
=− 1− =
2n + 1 π 2n +1 h(x) > 0, x ∈ (−1, 1)
y=0 
´ 1
⇓ −1 h(x) d x = 1

1 2n + 1 Теперь положив
´π x
6
−π cos
2n
2 dx 2π
⇓ ∆n (x) = n · h(nx)
ˆ ˆ π
мы получим последовательность неотрицатель-
∆n (x) d x = 2 ∆n (x) d x =
|x|>δ δ ных функций ∆n ∈ C ∞ (R), имеющих в качестве
1
ˆ π  x 2n общего носителя отрезок [−1, 1]:
= ´π 2n x ·2 cos dx 6
−π cos 2 dx δ 2
| {z } x∈
/ (−1, 1) =⇒ nx ∈
/ (−1, 1) =⇒
>

2n+1 =⇒ ∆n (x) = h(nx) = 0



 x
2n + 1 π =y x 2n
ˆ
6 ·2 cos dx = 2 = Интеграл от каждой такой функции будет равен
2π δ 2 x = 2y
ˆ π2  единице:
2n + 1 2n
= ·4 cos y dy 6
2π δ | {z } ˆ ∞ ˆ ∞
∆n (x) d x = n · h(nx) d x =
>

cos δ, −∞ −∞
потому что ˆ ∞ ˆ ∞
cos убывает
  = h(nx) d(nx) = h(y) d y = 1
на 0, π 2 −∞ −∞
ˆ π2
4n + 2
6 · cos2n δ d x = А для каждого δ > 0 и любого n > 1
мы полу-
π δ δ
4n + 2  2
n  π  (4.2.61) чим:
= · |cos
{z }δ · − δ −→ 0
π 2 n→∞
δ δ
>

ˆ ˆ
1 ∆n (x) d x = n · h(nx) d x =
−δ −δ
⋄ 10.2.10. Бесконечно гладкая аппроксима- ˆ δ ˆ nδ
тивная единица. Следуя примеру 10.1.47 по- = h(nx) d(nx) = h(y) d y =
строим гладкую функцию g ∈ C ∞ (R) со следую- −δ
|
−nδ
{z }
щими свойствами: nδ>1
( ˆ 1
g(x) = 0, x ∈
/ (−1, 1) = h(y) d y = 1
g(x) > 0, x ∈ (−1, 1) −1

Положив Таким образом, выполняются все четыре усло-


g(x) вия (i)-(iv) на с.633, и наша последовательность
h(x) = ´ 1
−1 g(t) d t ∆n является аппроксимативной единицей.

Теорема 10.2.11. Пусть f : R → R – непрерывная функция на R. Тогда для всякой аппроксима-


тивной единицы ∆n последовательность сверток f ∗ ∆n стремится к f равномерно на каждом
отрезке [a, b]:
x∈[a,b]
f ∗ ∆n (x) ⇒ f (x) (10.2.108)
n→∞

Доказательство. Зафиксируем отрезок [a, b] и число D со свойством (10.2.101). Поскольку функция


f непрерывна на отрезке [a − D, b + D], по теореме Вейерштрасса 4.3.28 должна быть конечна
величина
M = kf k[a−D,b+D] = sup |f (s)| (10.2.109)
s∈[a−D,b+D]

Пусть далее ε > 0. Поскольку функция f непрерывна на R, она непрерывна и на отрезке [a−D, b+D].
По теореме Кантора 4.3.32 это означает, что f равномерно непрерывна на [a − D, b + D], поэтому
§ 2. Аппроксимация 635

для числа 2ε > 0 должно существовать δ > 0, которое можно подчинить дополнительному условию
δ < D, такое, что
ε
∀s, t ∈ [a − D, b + D] |s − t| < δ =⇒ |f (s) − f (t)| <
2
В частности, при t = x ∈ [a, b] и s = x − y, где y ∈ (−δ, δ), мы получим такое соотношение:
ε
∀x ∈ [a, b] ∀y ∈ (−δ, δ) |f (x − y) − f (x)| < (10.2.110)
2
Теперь для любого x ∈ [a, b] мы получаем:
f ∗ ∆n (x) 1

=
(10.2.87) (10.2.103)

zˆ }| { zˆ }| {
∞ ∞
f ∗ ∆n (x) − f (x) = f (x − y) · ∆n (y) d y −f (x) · ∆n (y) d y =

−∞
ˆ ∞ ˆ ∞ −∞ ˆ ∞  

= f (x − y) · ∆n (y) d y −
f (x − y) · ∆n (y) d y = f (x − y) − f (x) · ∆n (y) d y =
−∞ −∞ −∞ | {z }

=
0,
при |y| > D
ˆ D   ˆ D


= f (x − y) − f (x) · ∆n (y) d y 6 f (x − y) − f (x) · ∆n (y) d y 6
−D −D
ˆ δ ˆ

6 f (x − y) − f (x) ·∆n (y) d y + f (x − y) − f (x) ·∆n (y) d y 6
−δ | {z } |y|>δ | {z }
>

>
(10.2.110)
ε
2 |f (x − y)| + |f (x)|
> (10.2.109)
M +M
=

2M
δ
ε
ˆ ˆ
6 · ∆n (y) d y + 2M · ∆n (y) d y
2 −δ |y|>δ

Это верно для любого x ∈ [a, b]. Значит,


ε δ
ε
ˆ ˆ
kf ∗ ∆n − f k[a,b] = sup f ∗∆n (x)−f (x) 6 · ∆n (y) d y +2M · ∆n (y) d y −→ <ε
x∈[a,b] 2 −δ |y|>δ n→∞ 2
| {z } | {z }
n n
(10.2.104) ↓ ↓ (10.2.105) ↓ ↓
∞ ∞
1 0

И это верно для любого ε > 0. Мы получаем, что, какое ни возьми ε > 0, для почти всех n ∈ N∗
будет верно неравенство
kf ∗ ∆n − f k[a,b] < ε
То есть,
kf ∗ ∆n − f k[a,b] −→ 0,
n→∞
а это нам и нужно было доказать.

Аппроксимация гладкими функциями.


Теорема 10.2.12. Для любой непрерывной функции f : R → R можно подобрать последователь-
ность бесконечно гладких функций ϕn : R → R, равномерно сходящуюся к f на каждом отрезке
[a, b] ⊂ R:
x∈[a,b]
∀[a, b] ⊂ R ϕn (x) ⇒ f (x) (10.2.111)
n→∞
Доказательство. Пусть ∆n – бесконечно гладкая аппроксимативная единица, построенная в при-
мере 10.2.10. Тогда по следствию 10.2.7, функции
ϕn = f ∗ ∆n
будут бесконечно гладкими, а по теореме 10.2.11, они будут стремиться к f равномерно на каждом
отрезке в R.
636Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Следствие 10.2.13. Для любой непрерывной функции f : [a, b] → R можно подобрать последо-
вательность бесконечно гладких функций ϕn : [a, b] → R, равномерно сходящуюся к f на [a, b]:
x∈[a,b]
ϕn (x) ⇒ f (x) (10.2.112)
n→∞

Доказательство. Нужно сначала продолжить f до непрерывной функции на всю прямую R. Это


можно сделать, например, положив
(
f (a), x < a
f (x) =
f (b), x > b

После этого по теореме 10.2.12, найдется последовательность гладких функций ϕn , приближающая


f равномерно на каждом отрезке, в частности, на отрезке [a, b].

Аппроксимация алгебраическими многочленами. Напомним, что


• функции вида
n
X
f (x) = ak · xk (x ∈ R),
k=0
где n ∈ N∗ и ak ∈ R, называются алгебраическими многочленами или просто многочле-
нами (от одной переменной). Если an 6= 0, то число n называется степенью многочлена
f.
Теорема 10.2.14 (Вейерштрасса об аппроксимации алгебраическими многочленами). Для любой
непрерывной функции f : [a, b] → R можно подобрать последовательность многочленов ϕn :
[a, b] → R, равномерно сходящуюся к f на [a, b]:
x∈[a,b]
fn (x) ⇒ f (x) (10.2.113)
n→∞

Доказательство. 1. Прежде всего заметим, что линейной заменой переменной утверждение сво-
дится к случаю [a, b] ⊂ (0, 1). Например, функция

ϕ(t) = 3(b − a) · t + 2a − b
1 2

превращает отрезок 3, 3 в отрезок [a, b]:
 
1 2
ϕ , = [a, b]
3 3
 
А функция f в композиции с ϕ превращается в функцию f ◦ ϕ на отрезке 31 , 23 . Если мы сможем
 
построить последовательность многочленов gn , приближающую f ◦ ϕ равномерно на отрезке 31 , 32
(содержащимся в интервале (0, 1))
t∈[ 13 , 32 ]  
gn (t) ⇒ f ϕ(t) ,
n→∞
−1
то функции fn = gn ◦ ϕ будут многочленами, приближающими f равномерно на [a, b]:
  x∈[a,b]  
fn (x) = gn ϕ−1 (x) ⇒ f ϕ ϕ−1 (x) = f (x)
n→∞

2. Итак, можно считать, что отрезок [a, b] лежит в интервале (0; 1):

[a, b] ⊂ (0, 1)

Тогда f можно доопределить непрерывно на всю прямую R так, чтобы ее выпуклым носителем был
отрезок [0, 1]. Например, можно на оставшихся кусках интервала (0, 1) доопределить функцию f
линейно, то есть положить
 f (a)

 a · x, x ∈ (0, a)
f (b)
f (x) = b−1 · (x − b) + f (b), x ∈ (b, 1)


0, x ∈ (−∞, 0] ∪ [1, +∞)
§ 2. Аппроксимация 637

Запомним это, и рассмотрим аппроксимативную единицу (10.2.106):


(
Cn · (1 − x2 )n , |x| 6 1 1
∆n (x) = , Cn = ´ 1
0, |x| > 1 2 n
−1 (1 − x ) d x

По теореме 10.2.11, выполняется соотношение


x∈[a,b]
f ∗ ∆n (x) ⇒ f (x)
n→∞

Нам остается только заметить, что на отрезке [a, b] функции f ∗∆n представляют собой многочлены:
ˆ +∞ ˆ x+1
f ∗ ∆n (x) = f (y) · ∆n (x − y) d y = f (y) · ∆n (x − y) d y =
−∞ | {z } x−1
=

0,
при y ∈/ [x − 1, x + 1],
поскольку
conv supp ∆n = [−1, 1]
ˆ x+1  n ˆ 1  n
2
= Cn · f (y) · 1 − (x − y) d y = Cn · f (y) · 1 − (x − y)2 dy =
x−1 |{z} 0 | {z }
=

многочлен по y
0,
при y ∈
/ [0, +1],
причем
x−1 6 0 < 1 6 x+1
число
z }| {
ˆ 1 2n
X 2n 
X ˆ 1
= Cn · f (y) · pk (x) · y n d y = Cn · f (y) · y n d y · pk (x)
0 0 | {z }
k=0 k=0
многочлен
по x

Аппроксимация тригонометрическими многочленами.


• Функции вида
n n
X o
f (x) = c + ak · cos kx + bk · sin kx (x ∈ R),
k=1

где n ∈ N∗ , c, ak , bk ∈ R, называются тригонометрическими многочленами. Если an 6= 0


или bn 6= 0, то число n называется степенью тригонометрического многочлена f .

Теорема 10.2.15 (Вейерштрасса об аппроксимации тригонометрическими многочленами). Для


любой непрерывной 2π-периодической функции f : R → R можно подобрать последовательность
тригонометрических многочленов fn : R → R, равномерно сходящуюся к f на R:
x∈R
fn (x) ⇒ f (x) (10.2.114)
n→∞

Доказательство. Здесь нужно рассмотреть аппроксимативную единицу (10.2.107). По теореме 10.2.11,


выполняется соотношение
x∈[−π,π]
f ∗ ∆n (x) ⇒ f (x)
n→∞

и наша задача – убедиться, что функции f ∗ ∆n являются тригонометрическими многочленами.


Для этого нужно заметить, что на отрезке [−π, π] функции ∆n сами будут тригонометрическими
многочленами:
N n
X o
∆n (x) = c + ak cos kx + bk sin kx
k=1

Отсюда следует цепочка:


638Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
ˆ +∞ ˆ x+π
f ∗ ∆n (x) = f (y) · ∆n (x − y) d y = f (y) · ∆n (x − y ) d y =
−∞ | {z } x−π | {z }


=
0, [−π, π]
при y ∈/ [x − π, x + π],
поскольку
conv supp ∆n = [−π, π]
!
ˆ x+π N n
X o
по сдвинутому периоду
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) d y = интеграл
равен интегралу по периоду =
x−π k=1
| {z }
2π-периодическая функция от y
N n
!
ˆ +π X o
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) d y = (5.1.82), (5.1.81) =
−π k=1
ˆ +π  N n
X o
= f (y) · C + Ak (x) · cos ky + Bk (x) · sin ky dy =
−π | {z } | {z }
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
число число число
zˆ }| { z }| { zˆ }| {
+π N n
X ˆ +π +π o
=C· f (y) d y + Ak (x) · f (y) · cos ky d y + Bk (x) · f (y) · sin ky d y
−π | {z } −π | {z } −π
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
Глава 11

СТЕПЕННЫЕ РЯДЫ И
АНАЛИТИЧЕСКИЕ ФУНКЦИИ

• Степенным рядом называется функциональный ряд следующего специального вида:



X
cn · (x − x0 )n (11.0.1)
n=0

Число x0 называется центром этого степенного ряда, а числа cn – его коэффициентами.


• Частным случаем степенного ряда будет ряд, в котором коэффициенты cn вычисляются
по формулам
f (n) (x0 )
c0 = (11.0.2)
n!
где f – некоторая функция, бесконечно гладкая в окрестности точки x0 . Такой степен-
ной ряд называется рядом Тейлора функции f в точке x0 . Его коэффициенты (11.0.2)
называются коэффициентами Тейлора функции f в точке x0 , а частичные суммы
N
X
TN (x) = cn · (x − x0 )n , N ∈ N, (11.0.3)
n=0

– многочленами Тейлора функции f в точке x0 .


Среди всевозможных функций в математическом анализе важный класс образуют функции,
являющиеся суммами своего ряда Тейлора:

X
f (x) = cn · (x − x0 )n .
n=0

Такие функции называются аналитическими (точное определение см. на с.666), и в этой главе мы
поговорим о них.

§1 Степенные ряды, аналитические последовательности и про-


изводящие функции
(a) Степенные ряды
Область сходимости степенного ряда.

Теорема 11.1.1 (об области сходимости степенного ряда). Область сходимости D всякого сте-
пенного ряда
X∞
cn · (x − x0 )n (11.1.4)
n=0

имеет следующий вид:

639
640 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

— либо D состоит из одной точки: D = {x0 };


— либо D совпадает со всей числовой прямой: D = (−∞, +∞);
— либо существует такое число R > 0, что D совпадает с отрезком [x0 − R, x0 + R],
исключая, может быть, точки на границе: (x0 − R, x0 + R) ⊆ D ⊆ [x0 − R, x0 + R].

• Число R при этом называется радиусом сходимости, а интервал (x0 − R, x0 + R) – интер-


валом сходимости степенного ряда (11.1.4).
Доказательство этой теоремы использует следующую лемму.

Лемма 11.1.2 (Абель). Пусть нам дан степенной ряд



X
cn · z n . (11.1.5)
n=0

Тогда:
— если ряд (11.1.5) сходится в какой-то точке z = ζ, то он сходится также в любой
точке z = η по модулю меньшей ζ:
|η| < |ζ|
— если ряд (11.1.5) расходится в какой-то точке z = η, то он расходится также в любой
точке z = ζ по модулю большей η:
|η| < |ζ|.

Доказательство. 1. Докажем сначала первую часть. Здесь используется некий стандартный прием,
постоянно применяемый при изучении степенных рядов, и называемый логической цепочкой Абеля.
Он состоит в следующем.
Ряд (11.1.5) сходится в точке z = ζ


X
числовой ряд cn · ζ n сходится
n=0


общий член стремится к нулю: cn · ζ n −→ 0
n→∞

последовательность cn · ζ n ограничена: ∃M > 0 ∀n ∈ N |cn · ζ n | 6 M (11.1.6)



для всякого η : |η| < |ζ| получаем:
n n
n
n η
η η η
n
|cn · η | = cn · ζ · n = |cn · ζ | · 6 (применяем (11.1.6)) 6 M
n
· , где <1
ζ
ζ ζ ζ

∞ ∞ ∞
X X η n X η n η
n
|cn · η | 6
M · =M · − сходится, поскольку <1
ζ ζ ζ
n=0 n=0 n=0



X
|cn · η n | − сходится, по признаку сравнения (теорема 9.2.24)
n=0



X
cn · η n − сходится, по признаку абсолютной сходимости (теорема 9.2.39)
n=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 641

2. Для доказательства второй части достаточно


P∞ переформулировать доказанное
P∞ утверждение
так: не бывает, чтобы |η| < |ζ|, и при этом ряд n=0 cn ·η n расходился, а ряд n=0 cn ·ζ n сходился.
Отсюда сразу получается импликация

X ∞
X
|η| < |ζ| & ряд cn · η n расходится =⇒ ряд cn · ζ n расходится
n=0 n=0

Доказательство теоремы 11.1.1. Заметим сразу, что нам достаточно рассмотреть ряд (11.1.5), по-
тому что ряд (11.1.4) превращается в него заменой переменной

x − x0 = z

Обозначим через D его область сходимости. Нам нужно доказать, что либо D = {0}, либо D = R,
либо существует такое число R > 0, что (−R, R) ⊆ D ⊆ [−R, R].
Ясно, что D 6= ∅, поскольку 0 ∈ D. Кроме того, из леммы Абеля 11.1.2 следуют утверждения:

если z ∈ R и ∃ζ ∈ D : |z| < |ζ| то z ∈ D (11.1.7)

и
если z ∈ R и ∃η ∈
/D: |η| < |z| то z ∈
/D (11.1.8)
Положим
R = sup{|ζ|; ζ ∈ D}
и рассмотрим несколько возможных случаев.
1. Если R = 0, то это означает, что область сходимости состоит из одной точки: D = {0}.
2. Если R = ∞, то это означает, что для всякой точки z ∈ R найдется ζ ∈ D такое, что |z| < |ζ|.
Поэтому, в силу (11.1.7), z принадлежит D. Это верно для любой z ∈ R, поэтому D = R.
3. Пусть 0 < R < ∞, тогда мы получим
– если z ∈ (−R, R), то есть |z| < R, то это означает, что найдется ζ ∈ D такое, что |z| < |ζ|,
поэтому, в силу утверждения (11.1.7), z ∈ D;
– если же z ∈ / [−R, R], то есть |z| > R, то это означает, что найдется η ∈
/ D такое, что
|z| > |η|, поэтому, в силу утверждения (11.1.8), z ∈
/ D;
Таким образом, мы получаем, что D содержит интервал (−R, R) и не содержит точек, не лежа-
щих в отрезке [−R, R]. То есть,
(−R, R) ⊆ D ⊆ [−R, R]
Это нам и нужно было доказать.

Теорема 11.1.3 (о радиусе сходимости степенного ряда). Радиус сходимости R произвольного


степенного ряда
X∞
cn · (x − x0 )n
n=0

можно вычислить по формулам



cn

R = lim = lim p1
n→∞ cn+1 n→∞ n |c |
n

(если такие пределы существуют). При этом, равенство

R=0

означает, что область сходимости D этого ряда имеет вид D = {x0 }, а равенство

R=∞

– что D = R.
642 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Доказательство. Достаточно рассмотреть ряды с нулевым центром, то есть рядов вида (11.1.5).
Мы докажем лишь первую формулу, сказав про вторую лишь, что она доказывается аналогично.
Пусть
cn
R = lim ,
n→∞ cn+1

причем предел справа существует и конечен. Тогда


P
— если |z| < R, то ряд ∞ n
n=0 |cn ·z | будет сходиться по признаку Даламбера (теорема 9.2.30),
потому что число Даламбера будет меньше единицы:

cn+1 · z n+1 |cn+1 | |z| |z|
D = lim n
= lim · |z| = |c |
= < 1;
n→∞ |cn · z | n→∞ |cn | limn→∞ n R
|cn+1 |
P∞
значит, ряд · z n тоже должен сходиться;
n=0 cn

cn
— если |z| > R = limn→∞ cn+1 , то есть

|z| |z| cn+1 · z
1< = ,
R cn = n→∞
lim
c
limn→∞ cn+1 n

то это означает, что существует такое число C > 1, что, для некоторого номера N выпол-
няется следующее:
cn+1 z
∀n > N >C
cn

∀n > N |cn+1 z| > C|cn |


∀n > N cn+1 z n+1 > C |cn z n |

то есть, последовательность |cn z n | должна быть неубывающей; отсюда следует, что



cn z n −→ 0,
n→∞
P∞
значит, ряд n=0 cn z n не может сходиться.
Мы доказали, что
(−R, R) ⊆ D ⊆ [−R, R]
и поэтому R действительно должен быть радиусом сходимости ряда (11.1.5).
Нам нужно только еще рассмотреть случай R = limn→∞ |c|cn+1 n|
| = ∞. Тогда мы получим для
P∞
любого z ∈ R ряд n=0 |cn · z n | снова будет сходиться по признаку Даламбера:
 
cn+1 · z n+1 |cn+1 | |z| |z|
D = lim = lim · |z| = |cn |
= =0
n→∞ |cn · z n | n→∞ |cn | limn→∞ ∞
|cn+1 |
P∞
поэтому ряд n=0 cn · z n тоже сходится, и таким образом, D = R.

Перейдем, наконец, к примерам.

⋄ 11.1.4. Рассмотрим ряд поэтому область сходимости будет состоять из



X одной точки – центра нашего ряда x0 = 0.
n! · xn Вывод: Область сходимости D = {0}.
n=1

Радиус сходимости в этом случае оказывается ⋄ 11.1.5. Рассмотрим ряд


равным нулю
X∞
xn
cn n! 1

R = lim = lim = lim = 0
n→∞ cn+1 n→∞ (n + 1)! n→∞ n + 1 n=1
n!
§ 1. Степенные ряды, аналитические последовательности и производящие функции 643

Радиус сходимости в этом случае оказывается Вывод: Область сходимости D = [−1, 1).
равным бесконечности
⋄ 11.1.7. Рассмотрим ряд с ненулевым центром:
cn (n + 1)!
R = lim = lim = lim (n+1) = ∞ ∞
n→∞ cn+1 n→∞ n! n→∞ X (x + 1)n
поэтому область сходимости будет совпадать со n=1
2n
всей прямой R.
Вывод: Область сходимости D = R. Радиус сходимости:

⋄ 11.1.6. Рассмотрим ряд cn n+1
R = lim = lim 2 =2
∞ n→∞ cn+1 n→∞ 2n
X xn
n Картинка:
n=1

Вычисляем радиус сходимости:


? ?
cn

R = lim = lim n + 1 = 1 pacx. cx. pacx. x
n→∞ cn+1 n→∞ n
-3 1
Это значит, что область сходимости D являет-
ся отрезком [−1, 1], кроме, может быть, точек на
Проверяем точки x = −3 и x = 1.
границе. Наглядно это удобно показать следую-
1) При x = −3 получаем ряд
щей картинкой:
X∞ X∞
(−2)n
n
= (−1)n
? ? n=1
2 n=1
pacx. cx. pacx. x
расходящийся по необходимому условию сходи-
−1 1 мости (теорема 9.2.9).
2) При x = 1 получаем ряд
Нам остается лишь проверить точки x = −1 и
x = 1. X∞ X∞
2n
1) При x = −1 получаем ряд = 1
n=1
2n n=1
X∞
(−1)n
n также расходящийся по необходимому условию
n=1
сходимости.
который сходится по признаку Лейбница (теоре- Поправленная картинка:
ма 9.2.43).
2) При x = 1 получаем гармонический ряд pacx. pacx.

X∞ X∞
1n 1 pacx. cx. pacx. x
=
n n
n=1 n=1 -3 1
который расходится, в силу примера 9.2.19.
Таким образом, нашу картинку можно попра- Вывод: Область сходимости D = (−3, 1).
вить следующим образом:
⊲⊲ 11.1.8. Найдите область сходимости:
P (x−2)n P∞ xn
cx. pacx.
1. P ∞
n=1 n2 ;
5. n=1 nn .

2. Pn=1 n2 · (x − 2)n ; P∞ (x+1)n
pacx. cx. pacx. x 6. n·3n .

3. Pn=1 3n · (x + 2)n ; Pn=1
∞ (x+3)n
−1 1 ∞
4. n=1 nn · xn ;
7. n=1 n2
.
(1+ n1 )

Равномерная сходимость степенного ряда.

Теорема 11.1.9. Всякий степенной ряд



X
cn · (x − x0 )n
n=0
644 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

сходится равномерно на каждом отрезке [a, b] внутри интервала сходимости (x0 − R, x0 + R).

x
x0 − R a x0 b x0 + R

Доказательство. Поскольку [a, b] ⊆ (x0 − R, x0 + R), можно найти число C > 0 такое, что

x0 − R < x0 − C < a < b < x0 + C < x0 + R

x
x0 − R x0 − C a x0 b x0 + C x0 + R

Зафиксируем его и заметим, что


 
|x − x0 | |a − x0 | |b − x0 |
sup = max ; =λ<1 (11.1.9)
x∈[a,b] C C C

Наш ряд сходится в точке x0 + C ∈ (x0 − R, x0 + R), и это приводит к логической цепочке Абеля
(описывавшейся при доказательстве леммы 11.1.2):

X
cn · C n − сходится
n=0


cn · C n −→ 0
n→∞


последовательность cn · C n ограничена :

∃M > 0 ∀n |cn · C n | 6 M (11.1.10)



n
n (x − x0 )
n n
||cn · (x − x0 ) ||x∈[a,b] = sup |cn · (x − x0 ) | = sup cn · C ·
Cn =
x∈[a,b] x∈[a,b]

(x − x0 )n
= |cn · C n | · sup 6 (применяем (11.1.10)) 6

x∈[a,b] Cn
!n
|x − x0 |
6 M · sup 6 (применяем (11.1.9)) 6 M · λn (где λ < 1)
x∈[a,b] C



X ∞
X ∞
X
||cn · (x − x0 )n ||x∈[a,b] 6 M · λn = M · λn (где λ < 1)
n=0 n=0 n=0


§ 1. Степенные ряды, аналитические последовательности и производящие функции 645


X
||cn · (x − x0 )n ||x∈[a,b] − сходится
n=0
 
вспоминаем признак Вейерштрасса
⇓ равномерной сходимости (теорему 10.1.33)

X
cn · (x − x0 )n − сходится равномерно на отрезке [a, b]
n=0

Непрерывность суммы степенного ряда.


Теорема 11.1.10. Сумма всякого степенного ряда

X
S(x) = cn · (x − x0 )n
n=0

непрерывна на интервале сходимости (x0 − R, x0 + R).


Доказательство. По теореме 11.1.9, этот ряд сходится равномерно на любом отрезке [a, b] ⊆ (x0 −
R, x0 +R). С другой стороны, он состоит их непрерывных функций cn ·(x−x0 )n , поэтому, по свойству
20 на с.606, сумма S должна быть непрерывна на [a, b]. Это верно для любого отрезка [a, b] ⊆
(x0 −R, x0 +R), поэтому сумма S(x) должна быть непрерывна на всем интервале (x0 −R, x0 +R).

Дифференцирование и интегрирование степенных рядов. Зафиксируем произвольный сте-


пенной ряд

X
cn · (x − x0 )n (11.1.11)
n=0

и выпишем ряд, получающийся его почленным дифференцированием



X ∞
X

{cn · (x − x0 )n } = cn · n · (x − x0 )n−1 (11.1.12)
n=0 n=1

и ряд, получающийся почленным интегрированием:


∞ ˆ
X x X∞
cn
cn · (t − x0 )n d t = · (x − x0 )n+1 (11.1.13)
n=0 x0 n=0
n + 1

Теорема 11.1.11. Радиусы (и интервалы) сходимости рядов (11.1.11), (11.1.12) и (11.1.13) совпа-
дают, и
(i) сумма ряда (11.1.11) является гладкой функцией на интервале сходимости, и ее произ-
водную на нем можно вычислить почленным дифференцированием:
!
∂   X
∞ ∞ ∞
∂ X n
X
cn · (x − x0 ) = cn · (x − x0 )n = cn · n · (x − x0 )n−1 (11.1.14)
∂x n=0 n=0
∂x n=1

(ii) интеграл от суммы ряда (11.1.11) можно вычислить почленным интегрированием:


ˆ x X ∞
! ∞ ˆ x ∞
X X cn
n
cn · (t − x0 ) dt = cn · (t − x0 )n d t = · (x − x0 )n+1 (11.1.15)
x0 n=0 n=0 x 0 n=0
n + 1

Доказательство. 1. Убедимся сначала, что радиусы сходимости рядов (11.1.11), (11.1.12) и (11.1.13)
совпадают. Заметим прежде всего, что для этого нам достаточно проверить совпадение радиусов
сходимости для рядов (11.1.11) и (11.1.12). Это будет означать, что при дифференцировании сте-
пенного ряда его радиус сходимости не меняется, значит, поскольку ряд (11.1.11) тоже получается
из ряда (11.1.13) почленным дифференцированием, их радиусы сходимости тоже будут совпадать.
Сделаем после этого замену переменной

x − x0 = z
646 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Тогда ряды (11.1.11) и (11.1.12) перепишутся следующим образом:



X
cn · z n (11.1.16)
n=0


X
cn · n · z n−1 (11.1.17)
n=1

Обозначим через R1 радиус сходимости ряда (11.1.16), а через R2 – радиус сходимости


P∞ ряда (11.1.17).
A) Докажем сначала, что R1 6 R2 . Это равносильно тому, что если P∞ ряд n=0 c n · ζ n сходится
n−1
при каком-нибудь ζ, то при любом z : 0 < |z| < |ζ| сходится ряд n=1 cn · n · z . Применяем
логическую цепочку Абеля:
X∞
cn · ζ n − сходится
n=0


cn · ζ n −→ 0
n→∞


∃M > 0 ∀n |cn · ζ n | 6 M

для всякого z : 0 < |z| < |ζ|
n n
n
n n z n z n z
|cn · n · z n−1 n
| = cn · ζ · · n = |cn · ζ | · · 6M· ·
z ζ |z| ζ |z| ζ

∞ n
∞ ∞ n
X z X X
n n z
|cn · n · z n−1
· = M ·
|6 M· ·
n=1
ζn=1
|z|
n=1
|z| ζ

z
− сходится по признаку Даламбера, поскольку < 1
ζ


X
|cn · n · z n−1 | − сходится по признаку сравнения
n=1



X
cn · n · z n−1 − сходится по признаку абсолютной сходимости
n=1
P∞
B) Теперь докажем, что R2 6 R1 . Это равносильно тому, чтоPесли ряд n=1 cn · n · ζ n−1 сходится
при каком-нибудь ζ, то при любом z : 0 < |z| < |ζ| сходится ряд ∞ n
n=0 cn ·z . Применяем логическую
цепочку Абеля:
X∞
cn · n · ζ n−1 − сходится
n=1


n−1
cn · n · ζ −→ 0
n→∞


∃M > 0 ∀n |cn · n · ζ n−1 | 6 M

для всякого z : 0 < |z| < |ζ|
n n
n−1 ζ z n |ζ| z |ζ| z
n
|cn · z | = cn · n · ζ · · n = |cn · n · ζ n−1
|· · 6M· ·
n ζ n ζ n ζ
§ 1. Степенные ряды, аналитические последовательности и производящие функции 647


∞ ∞ n ∞ n
X X |ζ| z X |ζ| z
n
|cn · z | 6 M· · =M· ·
n=0 n=0
n ζ n=0
n ζ

z
− сходится по признаку Даламбера, поскольку < 1
ζ


X
|cn · z n | − сходится по признаку сравнения
n=0


X
cn · z n − сходится по признаку абсолютной сходимости
n=0
Итак, мы доказали, что
R1 6 R2 6 R1
то есть
R1 = R2
2. Докажем далее тождество (11.1.14). Возьмем какие-нибудь точки a, b так чтобы

x0 − R < a < x0 < b < x0 + R

Тогда, по теореме 11.1.9, мы получим, что ряд (11.1.12)



X ∞
X
cn · n · (x − x0 )n−1 = (cn · n · (x − x0 )n )′
n=1 n=0

сходится равномерно на отрезке [a, b], а, с другой стороны, ряд



X
cn · (x − x0 )n
n=0

сходится в точке x0 , потому что все его члены, кроме нулевого равны нулю в этой точке:

X

cn · n · (x − x0 )n = c0 · 1 + c1 · 0 + c2 · 0 + ...
x=x0
n=0

По свойству 50 на с.607, это означает, что сумма ряда (11.1.11) будет дифференцируема на [a, b], и
ее производную в каждой точке x ∈ [a, b] можно вычислить почленным дифференцированием:
!
∂   X
∞ ∞ ∞
∂ X X
cn · (x − x0 )n = cn · (x − x0 )n = cn · n · (x − x0 )n−1 , x ∈ [a, b]
∂x n=0 n=0
∂x n=1

То есть тождество (11.1.14) выполняется для x ∈ [a, b]. Поскольку числа a, b здесь выбирались
произвольными, удовлетворяющими условию x0 − R < a < x0 < b < x0 + R, мы получаем, что это
тождество выполняется при любом x ∈ (x0 − R, x0 + R).
3. Теперь докажем (11.1.15). Зафиксируем x из интервала сходимости (общего для рядов (11.1.11)
и (11.1.13)). По теореме 11.1.9, мы получим, что ряд

X
cn · n · (t − x0 )n
n=0

сходится равномерно на отрезке [x0 , x]. Поэтому, по свойству 40 на с.606, должно выполняться
равенство
ˆ xX ∞ X∞ ˆ x X∞
n cn
cn · (t − x0 ) d t = cn · (t − x0 )n d t = · (x − x0 )n+1
x0 n=0 n=0 x 0 n=0
n + 1

То есть справедливо (11.1.15).


648 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Следствие 11.1.12. Сумма всякого степенного ряда является бесконечно гладкой функцией на
интервале сходимости (x0 − R, x0 + R) этого ряда, и производная порядка k этой функции вычис-
ляется по формуле

! ∞
∂k X n
X n!
k
c n · (x − x0 ) = · cn · (x − x0 )n−k , x ∈ (x0 − R, x0 + R) (11.1.18)
∂x n=0
(n − k)!
n=k

Доказательство. Обозначим для удобства сумму нашего степенного ряда буквой P :



X
P (x) = cn · (x − x0 )n , x ∈ (x0 − R, x0 + R)
n=0

По теореме 11.1.11, P дифференцируема на (x0 −R, x0 +R), причем ее производная является суммой
степенного ряда с тем же интервалом сходимости:

X
P ′ (x) = cn · n · (x − x0 )n−1 , x ∈ (x0 − R, x0 + R)
n=1

Значит, опять по теореме 11.1.11, P ′ дифференцируема на (x0 − R, x0 + R), причем ее производная


является суммой степенного ряда с тем же интервалом сходимости:

X
P ′′ (x) = cn · n · (n − 1) · (x − x0 )n−2 , x ∈ (x0 − R, x0 + R)
n=2

И так далее. Индукцией по k получаем формулу (11.1.18).

Вычисление суммы степенного ряда. Тео- Наоборот, дифференцируя (11.1.19) при |x| <
рема 11.1.11 позволяет в некоторых случаях яв- 1, получаем:
но вычислить сумму степенного ряда. Здесь мы ∞
покажем на примерах, как это делается. X 1
n · xn−1 = , |x| < 1 (11.1.22)
Все начинается с формулы для суммы чле- n=1
(1 − x)2
нов бесконечной геометрической прогрессии, ко-
торую мы выписывали в примере 9.2.5: Точно так же, дифференцируя k раз, по индук-
ции получаем:
X∞
1
xn = , |x| < 1 (11.1.19) X∞
n! k!
n=0
1 − x · xn−k = , |x| < 1
(n − k)! (1 − x)k+1
n=k
Из нее выводится целый ряд других полезных (11.1.23)
формул для сумм степенных рядов. Прежде все- Далее, заменив в (11.1.20) x на x2 , мы полу-
го, заменой x на −x мы получаем тождество чим

X ∞
1 X 1
(−1)n · xn = , |x| < 1 (11.1.20) (−1)n · x2n = , |x| < 1 (11.1.24)
n=0
1+x
n=0
1 + x2

Интегрируя его при |x| < 1 мы получаем Интегрируя (11.1.24) по теореме 11.1.11 (при
|x| < 1) мы получаем:

X X∞
xn xn+1
(−1)n−1 · = (−1)n · = ∞
X x2n+1 X∞ ˆ x
n=1
n n=0
n+1 (−1) ·n
= (−1)n · t2n d t =
∞ ˆ x
2n + 1 0
X ˆ x
dt n=0 n=0
(−1)n · tn d t =
ˆ x
= = ln(1 + x) dt
n=0 0 0 1 +t = = arctg x
0 1 + t2
То есть, То есть

X ∞
X
xn x2n+1
(−1)n−1 · = ln(1 + x), |x| < 1 (−1)n · = arctg x, |x| < 1
n=1
n n=0
2n + 1
(11.1.21) (11.1.25)
§ 1. Степенные ряды, аналитические последовательности и производящие функции 649


X
Полученных формул уже достаточно, чтобы 1
n · xn−1 =
перейти к решению задач. (1 − x)2
n=1
⋄ 11.1.13. Предположим, нам нужно найти сум- Умножаем на x:
му степенного ряда

X x
X∞
xn x· n · xn−1 =
(11.1.26) n=1
(1 − x)2
n=1
n

Рецепт решения заключается в том, чтобы сооб-
разить, как этот ряд можно получить из фор- Ответ:
X∞
мул (11.1.19)-(11.1.25) с помощью операций диф- x
n · xn =
ференцирования, интегрирования, замены пере- n=1
(1 − x)2
k
менной и умножения на x . Для данного ряда
последовательность действий выглядит следую- ⋄ 11.1.15. Найти сумму степенного ряда
щим образом. Сначала мы выписываем формулу ∞
X xn
(11.1.19): (−1) n
· , x > 0.
X ∞
n 1 n=0
2n + 1
x =
n=0
1−x
Здесь вычисления начинаются с формулы
Затем меняем в ней индекс n на k − 1: (11.1.25), которую мы перепишем с переменной
∞ t вместо x:
X 1
xk−1 = X∞
1−x t2n+1
k=1 (−1)n · = arctg t
n=0
2n + 1
После этого интегрируем:
∞ ∞ Мы делим ее на t
X xk
ˆ xX ˆ x
1
k−1
= t dt = d t = − ln(1−x) ∞
k 0 k=1 0 1−t 1 X t2n+1 arctg t
k=1 · (−1)n · =
t n=0 2n + 1 t
Остается увидеть, что полученный ряд отлича-
ется от (11.1.26) только индексом. Если теперь ⇓
поменять k на n, то получится
X∞
Ответ: t2n arctg t
X∞
xn (−1)n · =
= − ln(1 − x) n=0
2n + 1 t
n=1
n
Потом делаем замену переменной t2 = x (это
⋄ 11.1.14. Найти сумму степенного ряда можно, потому что x > 0) и получается
X∞ Ответ:
n · xn X∞ √
n xn arctg x
n=1 (−1) · = √ .
n=0
2n + 1 x
Снова выписываем формулу (11.1.19):
∞ ⊲⊲ 11.1.16.
P∞ Найдите сумму ряда:
X 1 2 n
n
x = 1. Pn=1 n · x ;
1−x 2. ∞ n n
n=0 n=1 2 · x ;
P∞ x3n
3. Pn=1 n ;
Дифференцируем ее:
4. ∞ n
n=1 n+1 · x ;
n
(∞ )′  ′ P ∞ n
X 1 5. Pn=1 x (1+x) n ;
xn = 6.

n · x n
(1 + x);
1−x P∞ n=1 n
n=0 x (1+xn )
7. Pn=1 n ;
⇓ 8. ∞ n=1 n · x n
(1 + xn ).

(b) Аналитические последовательности и производящие функции


• Числовая последовательность {an ; n ∈ N} называется аналитической, если она удовле-
творяет следующим эквивалентным условиям:
650 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
P∞
(i) степенной ряд n=0 an · xn имеет ненулевой радиус сходимости:

X
∃r > 0 ряд an · rn сходится (11.1.27)
n=0

(ii) для некоторого числа A > 0 последовательность An мажорирует последователь-


ность |an |:
∀n ∈ N |an | 6 An (11.1.28)
Множество всех аналитических последовательностей обозначается символом A.
P∞
• Радиус сходимости степенного ряда n=0 an · xn называется радиусом сходимости после-
довательности a и обозначается ρ(a):
( ∞
)
X
n
ρ(a) = sup r > 0 : ряд an · r сходится
n=0

• Производящей функцией1 или генератриссой Gena аналитической последовательности a ∈


A называется функция, определенная в окрестности нуля (−ρ(a), ρ(a)) формулой

X
Gena (x) := an · xn
n=0

По теореме 11.1.11 эта функция является гладкой на интервале (−ρ(a), ρ(a)).

⋄ 11.1.17. Последовательность ⋄ 11.1.18. Наоборот, последовательность

an = n! 1
an =
n!
не будет аналитической, потому что в силу при-
мера 11.1.4, порождаемый ею ряд будет аналитической, потому что, как мы убеди-
лись в примере 11.1.5, порождаемый ею ряд

X
n! · xn X∞
xn
n=1
n=1
n!
имеет нулевой радиус сходимости. К такому
же выводу можно прийти, используя критерий имеет радиус сходимости R = ∞ (для нас глав-
(11.1.28). ное, что R 6= 0). Критерий (11.1.28) дает то же
самое.

Алгебраические операции с аналитическими последовательностями.


• Если a ∈ A, то есть a = {an ; n ∈ N} – аналитическая последовательность, то противопо-
ложная последовательность −a определяется формулой

(−a)n := −an

Из (11.1.28) сразу следует, что −a ∈ A.


• Если же a, b ∈ A, то есть a = {an ; n ∈ N} и b = {bn ; n ∈ N} – аналитические последова-
тельности, то их сумма a + b и свертка a ∗ b определяются формулами
n
X
(a + b)n := an + bn , (a ∗ b)n := ak · bn−k
k=0

Сейчас мы покажем, что a + b ∈ A и a ∗ b ∈ A.


1 Подробнее на эту тему можно прочитать в книжке: С. К. Ландо, Лекции о производящих функциях, М.: МЦНМО,
2007.
§ 1. Степенные ряды, аналитические последовательности и производящие функции 651

Доказательство. В силу (11.1.28), условия a ∈ A и b ∈ A означают, что для некоторых A > 0 и


B > 0 выполняются неравенства
|an | 6 An , |bn | 6 B n (n ∈ N)
Отсюда следует, во-первых,
n
X
|(a + b)n | = |an + bn | 6 |an | + |bn | 6 An + B n 6 Cnk · Ak · B n−k = (A + B)n
k=0

то есть последовательность |(a + b)n | мажорируется последовательностью (A + B)n , и значит, по


условию (11.1.28), a + b ∈ A.
И, во-вторых,

Xn X n n
X n
X

|(a ∗ b)n | = ak · bn−k 6 |ak | · |bn−k | 6 Ak · B n−k 6 Cnk · Ak · B n−k = (A + B)n

k=0 k=0 k=0 k=0

то есть последовательность |(a ∗ b)n | мажорируется последовательностью (A + B)n , и опять в силу


(11.1.28), a ∗ b ∈ A.

Свойства алгебраических операций над аналитическими последовательностями:


1◦ . Операция сложения на множестве A удовлетворяет следующим тождествам:
a + b = b + a, (a + b) + c = a + (b + c), a + 0 = a, a + (−a) = 0 (11.1.29)
где 0 – последовательность, состоящая из нулей:
0n := 0
2◦ . Операция свертки на множестве A удовлетворяет следующим тождествам:
a ∗ b = b ∗ a, (a ∗ b) ∗ c = a ∗ (b ∗ c), a∗1=a (11.1.30)
где 1 – последовательность, у которой на нулевом месте стоит единица, а на осталь-
ных местах нули: (
1, n = 0
1n := (11.1.31)
0, n > 0
3◦ . Операции + и ∗ связаны между собой тождеством дистрибутивности:
(a + b) ∗ c = a ∗ c + b ∗ c (11.1.32)
4◦ . Производящая функция суммы равна сумме производящих функций,
Gena+b (x) = Gena (x) + Genb (x), (11.1.33)
причем ρ(a + b) > min{ρ(a), ρ(b)}.
5◦ . Производящая функция свертки равна произведению производящих функций,
Gena∗b (x) = Gena (x) · Genb (x), (11.1.34)
причем ρ(a ∗ b) > min{ρ(a), ρ(b)}.
Для доказательства нам понадобится следующая
P∞ P∞
Лемма 11.1.19. Пусть k=0 uk и l=0 vl – два абсолютно сходящихся ряда. Положим
n
X
wn = uk · vn−k
k=0
P∞ P∞
Тогда
P∞ ряд n=0 wn абсолютно сходится, и его сумма равна произведению сумм рядов k=0 uk и
l=0 vl :

∞ n
N X N
! N
! ∞
! ∞
!
X X X X X X
wn = lim uk · vn−k = lim uk · lim vl = uk · vl (11.1.35)
N →∞ N →∞ N →∞
n=0 n=0 k=0 k=0 l=0 k=0 l=0
652 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Доказательство. Для всякого N ∈ N∗ получаем:


n
N X

N
X X X N X n X X

|wn | 6 uk · vn−k 6 |uk | · |vn−k | = |uk | · |vl | 6 |uk | · |vl | =

n=0 n=0 k=0 n=0 k=0 k+l6N max{k,l}6N
| {z }
k+l6N =⇒ max{k,l}6N
N X
N N
! N
! ∞
! ∞
!
X X X X X
= |uk | · |vl | = |uk | · |vl | 6 |uk | · |vl | <∞
k=0 l=0 k=0 l=0 k=0 l=0
P∞
Отсюда следует, что ряд n=0 wn абсолютно сходится. С другой стороны, снова для любого N ∈ N∗
имеем:
! ! 2N n
X2N XN XN X X XN X N

wn − uk · vl = uk · vn−k − uk · vl =

n=0 k=0 l=0 n=0 k=0 k=0 l=0

X X X X

= uk · vl − uk · vl = uk · vl 6 |uk | · |vl | 6
   
k+l62N max{k,l}6N k + l 6 2N k + l 6 2N
| {z } max{k, l} > N max{k, l} > N
k+l62N ⇐= max{k,l}6N
X X X X
6 |uk | · |vl | = |uk | · |vl | = |uk | · |vl | + |uk | · |vl | =
 
max{k, l} 6 2N N <max{k,l}62N 06k6N N < k 6 2N
max{k, l} > N N < l 6 2N 0 6 l 6 2N
       
X X X X
= |uk | ·  |vl | +  |uk | ·  |vl | =
06k6N N <l62N N <k62N 06l6N

! ! ! ∞
!
X X X X
= |uk | · |vl | + |uk | · |vl | −→ 0
N →∞
k=0 l>N k>N l=0
| {z } | {z } | {z } | {z }
↓ ↓
<

<
∞ 0, 0, ∞
при N → ∞ при N → ∞

И поэтому
∞ 2N
" N
! N
!# ∞
! ∞
!
X X X X X X
wn = lim wn = lim uk · vl = uk · vl
N →∞ N →∞
n=0 n=0 k=0 l=0 k=0 l=0

Доказательство свойств 1◦ -5◦ . Свойство 1◦ мы считаем очевидным и сразу переходим к 2◦ . Ком-


мутативность свертки:
n n
X n − k = i, k = n − i X
(a ∗ b)n = ak · bn−k = = an−i · bi = (b ∗ a)n
0 6 k 6 n ⇔ 0 6 i 6 n
k=0 i=0

Ассоциативность свертки:

n n k
!
X X X X
((a ∗ b) ∗ c)n = (a ∗ b)k · cn−k = ai · bk−i · cn−k = ai · bk−i · cn−k =
k=0 k=0 i=0 06k6n
06i6k
n n
!
X X X k − i = j, k =i+j
= ai · bk−i · cn−k = ai · bk−i · cn−k = =
i6k6n ⇔ 0 6 j 6 n − i
06i6n i=0 k=i
i6k6n
 
n
X Xn−i n
X
= ai ·  bj · cn−i−j  = ai · (b ∗ c)n−i = (a ∗ (b ∗ c))n
i=0 j=0 i=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 653

Единица относительно свертки:


n
X X
(a ∗ 1)n = ak · 1n−k = ak · 1 = an
| {z }
k=0 k=n

=
(
1, k=n
0, k 6= n

Остается свойство дистрибутивности 3◦ :


n
X n
X n
X n
X
((a + b) ∗ c)n = (a + b)k · cn−k = (ak + bk ) · cn−k = ak · cn−k + bk · cn−k = (a ∗ c)n + (b ∗ c)n
k=0 k=0 k=0 k=0

4. Если |x| < min{ρ(a), ρ(b)}, то


X X
Gena+b (x) = lim (a + b)n · xn = lim (an + bn ) · xn =
N →∞ N →∞
n6N n6N
 
X X ∞
X ∞
X
= lim  an · xn + bn · xn  = an · xn + bn · xn = Gena (x) + Genb (x)
N →∞
n6N n6N n=0 n=0

Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.
5. Если |x| < min{ρ(a), ρ(b)}, то

n
!
X X X
n
Gena∗b (x) = lim (a ∗ b)n · x = lim ak · bn−k · xn =
N →∞ N →∞
n6N n6N k=0
n ∞
! ∞
!
X X   X X
k n−k k l
= lim ak · x · bn−k · x = (11.1.35) = ak · x · bl · x = Gena (x) · Genb (x)
N →∞
n6N k=0 k=0 l=0

Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.

Порядок аналитической последовательности.


• Порядком аналитической последовательности b ∈ A называется число

ω(a) = min{n ∈ N : an 6= 0}

Теорема 11.1.20. Справедливо неравенство:

ω(a ∗ b) > ω(a) + ω(b) (11.1.36)

Доказательство. Справедлива логическая цепочка:


n
X
(a ∗ b)n = ak · bn−k 6= 0
k=0


∃k ∈ {0, ..., n} ak · bn−k 6= 0

(
ak 6= 0
∃k ∈ {0, ..., n}
bn−k 6= 0

(
k > ω(a)
∃k ∈ {0, ..., n}
n − k > ω(b)

654 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
(
k > ω(a)
∃k ∈ {0, ..., n}
n > ω(b) + k > ω(b) + ω(a)

n > ω(b) + ω(a)
Из нее получаем: 
ω(a ∗ b) = min n ∈ N : (a ∗ b)n 6= 0 > ω(b) + ω(a)

Сравнение аналитических последовательностей.


• Неравенство a 6 b для последовательностей a, b ∈ A означает, что каждая компонента a
не превосходит соответствующую компоненту b:

a6b ⇐⇒ ∀n ∈ N an 6 b n

Предложение 11.1.21. Производящая функция сохраняет неравенства для неотрицательных


аргументов:
a6b =⇒ ∀r ∈ (0, ρ(b)) Gena (r) 6 Genb (r) (11.1.37)

X ∞
X
n
Доказательство. Gena (r) = an · r 6 bn · rn 6 Genb (r).
n=0 n=0
| {z }
an 6bn

Модуль аналитической последовательности.


• Модулем последовательности a ∈ A называется последовательность |a| ∈ A, определенная
формулой:
|a|n := |an | (11.1.38)
Очевидно, последовательность a = {an ; n ∈ N} является аналитической тогда и только
тогда, когда ее модуль |a| = {|an |; n ∈ N} является аналитической последовательностью:

a∈A ⇐⇒ |a| ∈ A (11.1.39)

Свойства модуля аналитической последовательности:


1◦ . Модуль суммы не превосходит суммы модулей:

|a + b| 6 |a| + |b| (11.1.40)

2◦ . Модуль свертки не превосходит свертки модулей:

|a ∗ b| 6 |a| ∗ |b| (11.1.41)

3◦ . Радиус сходимости модуля совпадает с радиусом сходимости исходной последователь-


ности:
ρ(|a|) = ρ(a) (11.1.42)
а производящие функции удовлетворяют неравенству:

| Gena (x)| 6 Gen|a| (|x|) (11.1.43)

Доказательство. Первые два свойства мы считаем очевидными, и перейдем сразу к 3◦ . В нем


неравенство (11.1.43) тоже очевидно

X∞ X ∞
n
| Gena (x)| = an · x 6 |an | · |x|n = Gen|a| (|x|)

n=0 n=0

А равенство (11.1.42) доказывается двукратным применением логической цепочки Абеля (см. с.640).
С одной стороны,
0 < r < ρ(a)
§ 1. Степенные ряды, аналитические последовательности и производящие функции 655



X
числовой ряд an · rn сходится
n=0


общий член стремится к нулю: an · rn −→ 0
n→∞


последовательность an · rn ограничена: sup |an · rn | = M < ∞
n∈N


σ n σ n  σ 

∀σ ∈ (0, r) =⇒ |an | · σ n = |an · rn | · 6 M · <1
r r r


X
для всякого σ ∈ (0, r) числовой ряд |an | · σ n сходится
n=0



X
радиус сходимости ряда |an | · xn не меньше r
n=0


ρ(|a|) > r ← верно для любого r ∈ (0, ρ(a))

ρ(|a|) > ρ(a)
А с другой стороны,
0 < r < ρ(|a|)


X
числовой ряд |an | · rn сходится
n=0

общий член стремится к нулю: |an | · rn −→ 0
n→∞

последовательность |an | · rn ограничена: sup |an | · rn = M < ∞
n∈N


σ n σ n  σ 

∀σ ∈ (0, r) =⇒ |an · σ n | = |an · rn | · 6 M · <1
r r r


X
для всякого σ ∈ (0, r) числовой ряд an · σ n сходится
n=0



X
радиус сходимости ряда an · xn не меньше r
n=0


ρ(a) > r ← верно для любого r ∈ (0, ρ(|a|))

ρ(a) > ρ(|a|).
656 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Степень аналитической последовательности.


• Степень bk аналитической последовательности b ∈ A определяется индуктивно правила-
ми
b0 = 1, bk+1 = bk ∗ b, k∈N
(здесь 1 – единичная последовательность, определенная равенством (11.1.31)).

Свойства степени:
1◦ . Модуль степени не превосходит степени модуля:

|bk | 6 |b|k (11.1.44)

2◦ . Производящая функция степени равна степени производящей функции:


 k
Genbk (x) = Genb (x) (11.1.45)

3◦ . Порядок и степень аналитической последовательности связаны неравенством:

∀k ∈ N ω(bk ) > k · ω(b) (11.1.46)

Доказательство. Свойство 1◦ следует из (11.1.41), 2◦ – из (11.1.34), а 3◦ – из (11.1.36) .

Композиция аналитических последовательностей.


• Пусть порядок аналитической последовательности b ∈ A отличен от нуля, то есть не
меньше единицы:
ω(b) > 1.
Тогда по формуле (11.1.46), порядок ее степени не меньше показателя степени:

ω(bk ) > k, k ∈ N.

То есть
∀n < k (bk )n = 0
и это можно интерпретировать так, что при фиксированном номере n ∈ Z почти все числа
(bk )n ; k ∈ N равны нулю:

∀n ∈ N ∀k > n (bk )n = 0 (11.1.47)


P
Отсюда следует, что для любой последовательности a ∈ A и любого n ∈ N в ряде ∞ k=0 ak ·
(bk )n только первые n элементов (с индексами k = 1, ..., n) могут быть отличны от нуля,
поэтому он сходится. Его сумма обозначается (a ◦ b)n :

X n
X
(a ◦ b)n = ak · (bk )n = ak · (bk )n (11.1.48)
k=0 k=0

Эта формула определяет некую последовательность


n o
a ◦ b = (a ◦ b)n ; n ∈ N ,

называемую композицией последовательностей a и b. Более коротко ее определение мож-


но записать формулой:

X n
X
a◦b= ak · b k = ak · b k . (11.1.49)
k=0 k=0

Теорема 11.1.22. Композиция аналитических последовательностей тоже является аналити-


ческой последовательностью:

a, b ∈ A & ω(b) > 1 =⇒ a◦b∈A (11.1.50)


§ 1. Степенные ряды, аналитические последовательности и производящие функции 657

Доказательство. Пусть a, b ∈ A и ω(b) > 1. Выберем ε ∈ (0, ρ(|a|)), то есть ε > 0 такое, что

X
Gen|a| (ε) = |an | · εm < ∞
n=0

Условие ω(b) > 1 означает, что b0 = 0, поэтому производящая функция последовательности |b| имеет
вид

X ∞
X
m
Gen|b| (x) = |bm | · x = |bm | · xm
m=0 m=1

Отсюда в свою очередь следует, что


Gen|b| (0) = 0
и, поскольку Gen|b| – непрерывная функция, существует δ > 0 такое, что

| Gen|b| (δ)| < ε

Теперь получаем:
∀k ∈ N |bk | 6 |b|k (11.1.44)

⇓ (11.1.37)

 k
∀k ∈ N Gen|bk | (δ) 6 Gen|b| (δ) < εk

∀K, N ∈ N, K >N =⇒

N
X N X
X K N X
X K K X
X N
n
|(a ◦ b)n | · δ = ak · (b )n · δ n 6
k
|ak | · |(bk )n | · δ n = |ak | · |(bk )n | · δ n =

n=0 n=0 k=0 n=0 k=0 k=0 n=0
K
X N
X K
X ∞
X K
X K
X ∞
X
= |ak | · |(bk )n | · δ n 6 |ak | · |(bk )n | · δ n = |ak | · Gen|bk |(δ) < |ak | · εk 6 |ak | · εk =
k=0 n=0 k=0 n=0 k=0 k=0 k=0
| {z }
Gen|bk |(δ)

= Gen|a| (ε) < ∞



X
Gen|a◦b| (δ) = |(a ◦ b)n | · δ n 6 Gen|a| (ε) < ∞
n=0

Это означает, что |a ◦ b| ∈ A, и по свойству (11.1.39), a ◦ b ∈ A.

Свойства композиции:

1◦ . Модуль композиции аналитических последовательностей не превосходит композиции


модулей:
|a ◦ b| 6 |a| ◦ |b| (11.1.51)
2◦ . Выполняется следующее правило дистрибутивности:

(a + b) ◦ c = a ◦ c + b ◦ c (11.1.52)

3◦ . Производящая функция композиции аналитических последовательностей равна компо-


зиции производящих функций в некоторой окрестности нуля:

∃δ > 0 ∀x ∈ (−δ, δ) Gena◦b (x) = (Gena ◦ Genb )(x) (11.1.53)


658 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Доказательство. Свойство 1◦ доказывается цепочкой:



Xn X n

|a ◦ b|n = (11.1.38) = |(a ◦ b)n | = (11.1.48) = ak · (bk )n 6 |ak | · |(bk )n | = (11.1.38) =

k=0 k=0
n
X n
X
= |a|k · |bk |n 6 (11.1.44) 6 |a|k · (|b|k )n = (11.1.48) = (|a| ◦ |b|)n
k=0 k=0

Свойство 2◦ :
n
X n
X
((a + b) ◦ c)n = (11.1.48) = (a + b)k · (ck )n = (ak + bk ) · (ck )n =
k=0 k=0
n
X n
X
= ak · (ck )n + bk · (ck )n = (11.1.48) = (a ◦ c)n + (b ◦ c)n = (a ◦ c + b ◦ c)n
k=0 k=0

Свойство 3◦ мы сначала докажем для случая, когда a – финитная последовательность, то есть


такая, у которой почти все элементы равны нулю:

sup{k ∈ N : ak 6= 0} = K < ∞ (11.1.54)

В этом случае для всякого x ∈ (−ρ(b), ρ(b)) мы получим:


X ∞ X
X ∞ ∞ X
X K
Gena◦b (x) = (a ◦ b)n · xn = ak · (bk )n · xn = (11.1.54) = ak · (bk )n · xn =
n=0 n=0 k=0 n=0 k=0
K
X ∞
X K
X K
X  k
= ak · (bk )n · xn = ak · Genbk (x) = (11.1.45) = ak · Genb (x) =
k=0 n=0 k=0 k=0
| {z }
Genbk (x)

X  k  
= ak · Genb (x) = Gena Genb (x)
k=0

После этого рассматривается общий случай. Для любой последовательности a ∈ A и для всякого
N ∈ N обозначим через PN a последовательность, определенную формулой
(
ak , k 6 K
(PK a)k =
0, k>K

Это будет финитная последовательность, поэтому по уже доказанному,


 
GenPK a◦b (x) = GenPK a Genb (x) , x ∈ (−ρ(b), ρ(b)) (11.1.55)

Зафиксируем ε > 0 такое, что Gen|a| (ε) < ∞, и подберем δ > 0 такое, что | Gen|b| (δ)| < ε. Покажем,
что при x ∈ (−δ, δ) и K → ∞ равенство (11.1.55) превращается в (11.1.53):
 
GenPK a◦b (x) = GenPK a Genb (x) , x ∈ (−δ, δ) (11.1.56)
| {z } | {z }
(K → ∞) ↓
↓ (K → ∞)
Gena◦b (x)
Gena◦b (x)

– это и будет доказательством для (11.1.53) в общем случае.


Предельный переход справа в (11.1.56) очевиден:
K
X ∞
X
GenPK a (y) = ak · y k −→ ak · y k = Gena (y), y ∈ (−ε, ε)
K→∞
k=0 k=0


   
GenPK a Genb (x) −→ Gena Genb (x) , x ∈ (−δ, δ)
K→∞
§ 2. Ряд Тейлора и аналитические функции 659

Докажем левый предельный переход. Для этого заметим прежде всего, что
(
0, k6K
ak − (PK a)k = (11.1.57)
ak , k > K

Тогда для всякого x ∈ (−δ, δ) мы получим:



|Gena◦b (x) − GenPK a◦b (x)| = (11.1.33) = |Gena◦b−PK a◦b (x)| = (11.1.52) = Gen(a−PK a)◦b (x) 6 (11.1.43) 6

X ∞ X
X ∞
n
6 Gen|(a−PK a)◦b| (|x|) 6 Gen|a−PK a|◦|b| (|x|) = (|a−PK a|◦|b|)n ·|x| = |a−PK a|k ·(|b|k )n ·|x|n =
n=0 n=0 k=0
∞ X
X ∞ ∞
X ∞
X
= |ak − (PK a)k | · (|b|k )n · |x|n = (11.1.57) = |ak | · (|b|k )n · |x|n =
n=0 k=0 n=0 k=K+1

X ∞
X ∞
X ∞
X  k
= |ak | · (|b|k )n · |x|n = |ak | · Gen|b|k (|x|) 6 |ak | · Gen|b| (|x|) 6
k=K+1 n=0 k=K+1 k=K+1

X  k ∞
X
6 |ak | · Gen|b| (δ) 6 |ak | · εk −→ 0,
K→∞
k=K+1 k=K+1
P∞
потому что k=0 |ak | · εk = Gen|a| (ε) < ∞. Отсюда уже следует нужное нам соотношение

GenPK a◦b (x) −→ Gena◦b (x), x ∈ (−δ, δ)


K→∞

§2 Ряд Тейлора и аналитические функции


(a) Формулы Тейлора
Теорема об остатке.
• Функция f называется
— дифференцируемой порядка n на интервале (a, b), если на (a, b) она имеет про-
изводные до порядка n включительно, то есть существует конечная последова-
тельность функций f0 , f1 , ..., fm на (a, b) таких, что

f0 = f,

и для всякого k = 0, ..., n − 1 функция fk дифференцируема на (a, b) и ее произ-


водная равна fk+1 :
fk′ = fk+1 , k < n.
Теорема 11.2.1. Пусть нам даны:
1) функция f , дифференцируемая порядка n + 1 на отрезке [a, b], и
2) функция g, непрерывная на отрезке [a, b], и имеющая внутри этого отрезка ненулевую
производную:
∀t ∈ (a, b) g ′ (t) 6= 0
Тогда найдутся:
– точка ζ ∈ (a; b), для которой будет справедливо равенство:
n
X f (k) (a) g(b) − g(a) (n+1)
f (b) = · (b − a)k + ·f (ζ) · (b − ζ)n (11.2.58)
k! g ′ (ζ) · n!
k=0

– точка η ∈ (a; b), для которой будет справедливо равенство:


n
X f (k) (b) g(a) − g(b) (n+1)
f (a) = · (a − b)k + ·f (η) · (a − η)n (11.2.59)
k! g ′ (η) · n!
k=0
660 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

! 11.2.2. Формулы (11.2.58) и (11.2.59) можно объединить в одну, усложнив формулировку тео-
ремы следующим образом:
 пусть x0 и xобозначают концы отрезка [a, b], причем возможны оба
x0 = a x=a
варианта, как , так и ; тогда найдется точка ξ ∈ (a; b) такая, что
x=b x0 = b
n
X f (k) (x0 ) g(x) − g(x0 ) (n+1)
f (x) = · (x − x0 )k + ·f (ξ) · (x − ξ)n (11.2.60)
k! g ′ (ξ) · n!
k=0
   
x0 = a x=a
В такой формулировке случай превращает формулу (11.2.60) в (11.2.58), а при
x=b x0 = b
формула (11.2.60) превращается в (11.2.59).
Доказательство. 1. Для доказательства (11.2.58) рассмотрим вспомогательную функцию
n
X f (k) (t)
F (t) = f (b) − · (b − t)k
k!
k=0

Применим к паре функций F и g теорему Коши об отношении приращений 6.1.34: должна суще-
ствовать точка ζ ∈ (a; b) такая, что

F (b) − F (a) F ′ (ζ)


= ′
g(b) − g(a) g (ζ)
Или, иначе
g(b) − g(a)
F (b) − F (a) = · F ′ (ζ) (11.2.61)
g ′ (ζ)
Выразим в этой формуле F через f . Во-первых,
n
X n
X
f (k) (b) f (k) (b) f (0) (b)
F (b) = f (b) − · (b − b)k = f (b) − 0k = f (b) −
· |{z} =0
k! k! 0! }
| {z
k=0 k=0 k
(
0, при k > 0 k
f (b)
0, при k = 0

Во-вторых,
n
X f (k) (a)
F (a) = f (a) − · (b − a)k
k!
k=0

И, в-третьих,

n
! n
!
∂ X f (k) (t) ∂ X f (k) (t)
′ k k
F (t) = f (b) − · (b − t) = f (b) − f (t) − · (b − t) =
∂t k! ∂t k!
k=0 k=1
X n  
∂ f (k) (t)
′ k
= 0 − f (t) − · (b − t) =
∂t k!
k=1
Xn    
∂ f (k) (t) f (k) (t) ∂ 
= −f ′ (t) − · (b − t)k + · (b − t)k =
∂t k! k! ∂t
k=1
Xn  (k+1) 
f (t) f (k) (t)
= −f ′ (t) − · (b − t)k + · k · (b − t)k−1 · (−1) =
k! k!
k=1
n
X X n
f (k+1) (t) f (k) (t)
= − f ′ (t) − · (b − t)k + · (b − t)k−1 =
| {z } k! (k − 1)!
k=1 k=1
k | {z }
f (1) (t) заменяем k − 1 на i
0! · (b − t)0
| {z }
объединяем в одну сумму
n
X n−1
X
f (k+1) (t) f (i+1) (t)
=− · (b − t)k + · (b − t)i =
k! i=0
i!
k=0
| {z }
отщепляем последнее слагаемое
§ 2. Ряд Тейлора и аналитические функции 661

n−1
X f (k+1) (t) n−1
X f (i+1) (t)
f (n+1) (t) f (n+1) (t)
=− · (b − t)n − · (b − t)k + · (b − t)i = − · (b − t)n
n! k! i=0
i! n!
k=0
| {z }
сокращаем

Подставляя ζ вместо t получим:

f (n+1) (ζ)
F ′ (ζ) = − · (b − ζ)n
n!
Теперь подставим полученные выражения в (11.2.61):
n
!  
X f (k) (a) g(b) − g(a) f (n+1) (ζ)
k n
0 − f (a) − · (b − a) = · − · (b − ζ)
k! g ′ (ζ) n!
k=0

Убрав минус в обеих частях, получим равенство, эквивалентное (11.2.58):


n
X f (k) (a) g(b) − g(a) f (n+1) (ζ)
f (a) − · (b − a)k = · · (b − ζ)n
k! g ′ (ζ) n!
k=0

2. Для доказательства (11.2.59) нужно рассмотреть другую вспомогательную функцию:


n
X f (k) (t)
F (t) = f (a) − · (a − t)k
k!
k=0

Тогда
n
X f (k) (b)
F (b) = f (a) − · (a − b)k
k!
k=0
n
X f (k) (a)
F (a) = f (a) − · (a − a)k = 0
k!
k=0

f (n+1) (t)
F ′ (t) = − · (a − t)n
n!
И при подстановке в (11.2.61) получается равенство, эквивалентное (11.2.59):
Xn  
f (k) (b) g(b) − g(a) f (n+1) (ζ)
f (a) − · (a − b)k − 0 = · − · (a − ζ)n
k! g ′ (ζ) n!
k=0

Формула Тейлора с остаточным членом в форме Лагранжа.


Теорема 11.2.3 (Тейлор-Лагранж). Пусть функция f определена и дифференцируема n + 1 раз
на интервале (a, b). Тогда для любых дух точек x0 , x ∈ (a, b) найдется точка ξ, лежащая между
ними (то есть ξ ∈ (x0 , x), если x0 < x, и ξ ∈ (x, x0 ), если x < x0 ) такая, что выполняется
равенство

n
X f (k) (x0 ) f (n+1) (ξ) (11.2.62)
f (x) = · (x − x0 )k + · (x − x0 )n+1
k! (n + 1)!
k=0

• Равенство (11.2.62) называется формулой Тейлора с остаточным членом в форме Лагран-


жа порядка n для функции f в точке x0 .
Доказательство. Этот факт следует из теоремы 11.2.1, если в ней выбрать в качестве g функцию

g(t) = (x − t)n+1
662 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Формула Тейлора с остаточным членом в форме Коши.

Теорема 11.2.4 (Тейлора-Коши). Пусть функция f определена и дифференцируема n + 1 раз на


интервале (a, b). Тогда для любых дух точек x0 , x ∈ (a, b) найдется точка ξ, лежащая между
ними (то есть ξ ∈ (x0 , x), если x0 < x, и ξ ∈ (x, x0 ), если x < x0 ) такая, что выполняется
равенство

n
X f (k) (x0 ) f (n+1) (ξ) (11.2.63)
f (x) = · (x − x0 )k + · (x − ξ)n · (x − x0 )
k! n!
k=0

• Равенство (11.2.63) называется формулой Тейлора с остаточным членом в форме Коши


порядка n для функции f в точке x0 :

Доказательство. Это следует из теоремы 11.2.1, если в ней выбрать в качестве g функцию

g(t) = x − t

Дифференциал функции и запись формулы Тейлора с его помощью.


• Дифференциалом k-го порядка функции f : R ֒→ R в точке x называется функция
p 7→ d f (x)[p] от нового переменного p ∈ R, которая в каждой точке p ∈ R определяется
равенством:
dk f (x)[p] = f (k) (x) · pk (11.2.64)
В частности, дифференциал нулевого порядка описывается формулой

d0 f (x)[p] = f (x) (11.2.65)

(и поэтому не зависит от p), а дифференциал первого порядка формулой

d f (x)[p] = f ′ (x) · p. (11.2.66)

(и поэтому линейно зависит от p).


Следующий факт следует из теоремы 11.2.3:

Теорема 11.2.5. Справедлива следующая модификация формулы Тейлора-Лагранжа (11.2.62):


m
X 1 1
f (x + p) = · dk f (x)[p] + · dm+1 f (x + θ · p)[p], θ ∈ [0, 1] (11.2.67)
k! (m + 1)!
k=0

(b) Ряд Тейлора


Формулы Тейлора (11.2.62)-(11.2.63)-(7.2.35) подсказывают следующую конструкцию.
• Если f – гладкая функция на интервале (a, b), то любой точке x0 ∈ (a, b) можно поставить
в соответствие степенной ряд

X∞
f (n) (x0 )
· (x − x0 )n (11.2.68)
n=0
n!

Этот ряд называется рядом Тейлора функции f в точке x0 .


• В частном случае, когда x0 = 0 ряд Тейлора называется рядом Маклорена:

X∞
f (n) (0) n
·x (11.2.69)
n=0
n!
§ 2. Ряд Тейлора и аналитические функции 663

От ряда Тейлора естественно ожидать, что он будет сходиться к порождающей его функции
f хотя бы в некоторой окрестности (x0 − δ; x0 + δ) точки x0 , то есть что выполняется следующее
тождество, называемое разложением Тейлора функции f в окрестности (x0 − δ; x0 + δ):
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (11.2.70)
n=0
n!

В частном случае, когда x0 = 0, оно называется разложением Маклорена (в окрестности (−δ; δ)):
X∞
f (n) (0) n
f (x) = ·x , x ∈ (−δ; δ) (11.2.71)
n=0
n!

Часто так и бывает (мы приведем примеры такого рода на с.664). Но не всегда. В следующих
примерах мы увидим, что ряд Тейлора функции f необязательно сходится, а если сходится, то его
сумма необязательно совпадает с функцией f .

Контрпримеры. Поскольку на левой полупрямой эта функция ну-


⋄ 11.2.6. Ряд Маклорена, расходящийся левая, в точке 0 все ее производные равны нулю,
везде, кроме точки 0. Рассмотрим последова- поэтому ряд Маклорена будет нулевой:
тельность
0
an = (n!)2 k
z }| {
По теореме Бореля 10.1.51 существует гладкая X∞ ∞
f (n) (0) n X
функция f на R такая, что ·x = 0 · xn
n=0
n! n=0
∀n ∈ N f (n) (0) = an = (n!)2
Ее ряд Маклорена имеет вид Сумма такого ряда, понятное дело, тоже будет
∞ ∞ ∞ нулевой,
X f (n) (0) n X (n!)2 n X
·x = ·x = n! · xn X∞
f (n) (0) n
n=0
n! n=0
n! n=0 ·x =0
n=0
n!
В примере 11.1.4 мы уже рассматривали такой
степенной ряд, и поняли, что он сходится только
и поэтому она не может совпадать с f ни на ка-
в точке 0.
ком интервале (−δ, +δ): тождество
⋄ 11.2.7. Ряд Маклорена сходящийся всю-
ду, но не к порождающей его функции. X∞
f (n) (0) n
Рассмотрим функцию из примера 10.1.46, то есть · x = 0 = f (x), x ∈ (−δ, +δ),
n!
гладкую на R функцию f со свойствами: n=0
(
f (x) = 0, x 6 0 невозможно потому что при x > 0 функция f
f (x) > 0, x > 0 отлична от нуля.

Всякий сходящийся степенной ряд есть ряд Тейлора своей суммы. Несмотря на отме-
ченное нами нерегулярное поведение ряда Тейлора, эта конструкция оказывается центральным
примером в теории степенных рядов из-за следующей теоремы:
Теорема 11.2.8. Если функция f является суммой какого-то степенного ряда в некоторой окрест-
ности его центра

X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ, x0 + δ), (11.2.72)
n=0

то этот степенной ряд является рядом Тейлора функции f в точке x0 :

f (n) (x0 )
cn =
n!
Доказательство. В силу следствия 11.1.12, функция f является гладкой на интервале (x0 −δ, x0 +δ),
и по формуле (11.1.18),
664 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ


X n!
f (k) (x) = · cn · (x − x0 )n−k =
(n − k)!
n=k
k! (k + 1)! (k + 2)!
= · ck · (x − x0 )0 + · ck+1 · (x − x0 )1 + · ck+2 · (x − x0 )2 + ... =
(k − k)! (k + 1 − k)! (k + 2 − k)!
(k + 1)! (k + 2)!
= k! · ck + · ck+1 · (x − x0 ) + · ck+2 · (x − x0 )2 + ..., x ∈ (x0 − R, x0 + R)
1! 2!
Подставив сюда x = x0 , получим

(k + 1)! (k + 2)!
f (k) (x0 ) = k! · ck + · ck+1 · 0 + · ck+2 · 0 + ... = k! · ck
1! 2!
f (k) (x0 )
То есть, ck = k!
P
! 11.2.9. Из этой теоремы следует, что если степенной ряд ∞ n
n=0 cn · (x − x0 ) сходится хотя бы в
одной точке x, отличной от его центра x0 , то автоматически
P∞ он является рядом Тейлора для неко-
торой функции f , а именно, для своей суммы f (x) = n=0 cn · (x − x0 )n (которая будет определена
как минимум в окрестности точки x0 радиуса δ = |x − x0 |).

Сходимость ряда Тейлора. Обсудим теперь, когда все-таки ряд Тейлора сходится к порожда-
ющей его функции. Удобное достаточное условие для этого выглядит так:
Предложение 11.2.10. Пусть функция f определена в δ-окрестности некоторой точки x0 , бес-
конечно гладкая на (x0 − δ; x0 + δ), и имеет ограниченные в совокупности производные:

sup sup |f (n) (x)| = M < ∞ (11.2.73)


n∈N x∈(x0 −δ;x0 +δ)

Тогда на интервале (x0 − δ; x0 + δ) функция f удовлетворяет тождеству:

X∞
f (n) (x0 )
f (x) = · (x − x0 )n (11.2.74)
n=0
n!

Доказательство. Выпишем формулу Тейлора-Лагранжа (11.2.62) для f : для любой точки x ∈


(x0 − δ; x0 + δ) найдется точка ξ, лежащая между x0 и x, такая что выполняется равенство
n
X f (k) (x0 ) f (n+1) (ξ)
f (x) = · (x − x0 )k + · (x − x0 )n+1
k! (n + 1)!
k=0

Из него мы получаем:
n
X f (k) (x0 ) f (n+1) (ξ)
f (x) − · (x − x0 )k = · (x − x0 )n+1
k! (n + 1)!
k=0



n
X f (k) (x0 ) f (n+1) (ξ) δn

f (x) − · (x − x0 )k = · (x − x0 )n+1 6 M · −→ 0
k! (n + 1)! (n + 1)! n→∞
k=0


n
X f (k) (x0 )
· (x − x0 )k −→ f (x)
k! n→∞
k=0

Стандартные разложения Маклорена. справедливы в интервале |x| < 1:

1
⋄⋄ 11.2.11. Следующие разложения Маклорена = 1 + x + x2 + ... + xk + ... =
1−x
§ 2. Ряд Тейлора и аналитические функции 665


X
= xn , (11.2.75) 
|1 + ξ|α−1 6 max (1 − |x|)α−1 ; (1 + |x|)α−1
n=0
(11.2.82)
1
= 1 − x + x2 + ... + (−1)k · xk + ... = И, во-вторых,
1+x

X |x − ξ| |x| − |ξ| 1 − |ξ| − (1 − |x|)
= (−1)n · xn (11.2.76) 6 = =
n=0 |1 + ξ| 1 − |ξ| 1 − |ξ|
x2 x3 xk 1 − |x| 1 − |x|
ln(1 + x) = x − + + ... + (−1)k · + ... = =1− 61− = |x| (11.2.83)
2 3 k 1 − |ξ| 1−0
X∞
xn
= (−1)n−1 · (11.2.77) Теперь остаток ряда Маклорена можно оценить
n=1
n так:
1
= 1 − x2 + x4 + ... + (−1)k · x2k + ... = X n
f (k) (0) k
1 + x2
f (x) − · x = (11.2.81) =
X∞ k!
k=0
= (−1)n · x2n (11.2.78) (n+1)
f (ξ)
n=0
= · (x − ξ) · x =
n
x3 x5 x2k+1 n!
arctg x = x − + − ... + (−1)k · +
3 5 2k + 1 α(α − 1)...(α − n) · (1 + ξ)α−n−1
= ·
X∞ 2n+1 n!
x
+ ... = (−1)n · (11.2.79) n
2n + 1 · |x − ξ| · |x| =
n=0  α  α 
2
x = α 1 − ... 1 − ·
(1 + x)α = 1 + α · x + α(α − 1) · + ... 2 n
2!
· |1 + ξ|α−n−1 · |x − ξ|n · |x| =
xk 
... + α(α − 1)...(α − k + 1) · + ... = α  α 
k! = α 1 − ... 1 − ·
∞ 2
 nn
X xn
=1+ α(α − 1)...(α − n + 1) · |x − ξ|
n! · |1 + ξ|α−1 · · |x| 6
n=1 |1 + ξ|
(11.2.80) 6 (11.2.82), (11.2.83) 6
 α  α 

Доказательство. Тождества (11.2.75)-(11.2.79) 6 α 1 − ... 1 − ·
 2 n
мы уже доказали на с.648, поэтому их доказы-
вать нет необходимости, нужно только заметить, · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1
что в силу теоремы 11.2.8 они будут разложени-
Обозначим последнюю величину Mn
ями Маклорена (поскольку центром ряда здесь
будет точка 0).  α  α 

Таким образом, интерес в этом списке пред- Mn = α 1 − ... 1 − ·
 2 n
ставляет лишь формула (11.2.80). Для ее доказа- · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1 .
α
тельства заметим, что функция f (x) = (1 + x)
имеет производные Нам нужно показать, что Mn стремится к нулю
при n → ∞. Зафиксируем какое-нибудь число q
f (n) (x) = α(α − 1)...(α − n + 1) · (1 + x)α−n такое, что
|x| < q < 1
Применим к этой функции теорему Тейлора-
Коши 11.2.4: для любого x ∈ (−1, 1) и любого (такое q найдется, поскольку |x| < 1). Теперь мы
n ∈ N∗ найдется точка ξ, лежащая между 0 и x получаем:

такая, что 1 − α −→ 1
n + 1 n→∞
Xn
f (k) (0) k ⇓
f (x) = ·x +
k! Mn+1
k=0
= 1 − α · |x| −→ |x| < q
f (n+1)
(ξ) Mn n + 1 n→∞
+ · (x − ξ)n · x (11.2.81)
n! ⇓
Заметим две вещи: во-первых, Mn+1
∃N ∈ N∗ ∀n > N <q
Mn
1 − |x| 6 1 − |ξ| 6 |1 + ξ| 6 1 + |ξ| 6 1 + |x|

⇓ ∀k ∈ N MN +k < MN · q k
666 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

⇓ интервале (−R, R) рядом (11.2.84). Поскольку



X ∞
X это верно для любого R > 0, мы получаем, что
MN +k 6 MN · q k < ∞ f (x) = ex формула (11.2.84) верна при любом
k=0 k=0 x ∈ R.
⇓ 2. Производные функции sin
Mn −→ 0 
n→∞ 
 sin x, n = 4k, k ∈ N
n


∂ cos x, n = 4k + 1, k ∈ N
sin x =
(∂x)n 
 − sin x, n = 4k + 2, k ∈ N
⋄⋄ 11.2.12. Следующие разложения Маклорена 

справедливы на всей числовой прямой x ∈ R: − cos x, n = 4k + 3, k ∈ N

x2 xk ограничены в совокупности на R (и как след-


ex = 1 + x + + ... + + ... = ствие, на любом интервале (−R, R)):
2! k!
X∞
xn
= (11.2.84) sup sup | sin(n) (x)| 6 1 < ∞
n=0
n! n∈N x∈(−R,R)

x3 x5 x2k+1
sin x = x − + − ... + (−1)n · + ... = В силу предложения 11.2.10, это означает, функ-
3! 5! (2k + 1)! цию sin можно представить сходящимся на ин-
X∞ 2n+1
x тервале (−R, R) рядом (11.2.85). Поскольку это
= (−1)n · (11.2.85) верно для любого R > 0, мы получаем, что фор-
n=0
(2n + 1)!
мула (11.2.85) верна при любом x ∈ R.
x2 x4 k x2k 3. Производные функции cos
cos x = 1 − + − ... + (−1) · + ... =
2! 4! (2k)!

X∞
x2n 
cos x, n = 4k, k ∈ N
= (−1)n · (11.2.86) 
− sin x, n = 4k + 1, k ∈ N
n=0
(2n)! cos(n) x =

− cos x, n = 4k + 2, k ∈ N


Доказательство. 1. Из формулы для производ- sin x, n = 4k + 3, k ∈ N
ных функции ex
∂n x ограничены в совокупности на R. Поэтому функ-
e = ex ция cos удовлетворяет условию (11.2.73) на лю-
(∂x)n
бом интервале (−R, R), R > 0:
видно, что она удовлетворяет условию (11.2.73)
на любом интервале (−R, R), R > 0: sup sup | sin(n) (x)| 6 1 < ∞
n∈N x∈(−R,R)

sup sup |f (n) (x)| = В силу предложения 11.2.10, cos можно пред-
n∈N x∈(−R,R)
ставить сходящимся на интервале (−R, R) рядом
= sup sup |ex | = eR < ∞ (11.2.86). Поскольку это верно для любого R > 0,
n∈N x∈(−R,R)
равенство (11.2.86) будет выполняться для любо-
В силу предложения 11.2.10, это означает, что го x ∈ R.
функцию f (x) = ex представить сходящимся на

(c) Аналитические и целые функции

Аналитические функции.
• Функция f называется аналитической на интервале (a, b), если она определена на (a, b)
и удовлетворяет следующим равносильным условиям:
(i) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f представима в виде суммы степенного ряда:

X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (11.2.87)
n=0
§ 2. Ряд Тейлора и аналитические функции 667

иными словами, в окрестности (x0 − δ; x0 + δ) функция f должна быть сдвигом


производящей функции некоторой аналитической последовательности cn :

f (x) = Genc (x − x0 ), x ∈ (x0 − δ; x0 + δ) (11.2.88)

(ii) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f (является гладкой и) представима в виде суммы своего ряда Тейлора:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (11.2.89)
n=0
n!

иными словами, в окрестности (x0 − δ; x0 + δ) функция f должна быть сдвигом


производящей функции последовательности своих коэффициентов Тейлора:

f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ (x0 − δ; x0 + δ) (11.2.90)
n!
Доказательство. Равносильность условий (i) и (ii) следует из теоремы 11.2.8.
Теорема 11.2.13. Сумма всякого степенного ряда

X
f (x) = cn · (x − x0 )n , x ∈ (x0 − R; x0 + R)
n=0

является аналитической функцией на интервале сходимости (x0 − R; x0 + R) этого степенного


ряда.
Доказательство. Понятно, что здесь достаточно рассмотреть случай x0 = 0. Пусть

X
f (x) = cn · xn , |x| < R.
n=0

Зафиксируем какую-нибудь точку x1 ∈ (−R; R) и выберем произвольные числа ρ и r так, чтобы

0 < |x1 | < ρ < r < R.

Строим логическую цепочку Абеля (как на с.640):



X
числовой ряд cn · r n сходится
n=0

общий член стремится к нулю: cn · rn −→ 0


n→∞


последовательность cn · rn ограничена: ∃M > 0 ∀n ∈ N |cn · rn | = |cn | · rn 6 M

M
∃M > 0 ∀n ∈ N |cn | 6 (11.2.91)
rn
Выберем δ < min{ρ − |x1 |; r − ρ}. Тогда для любой точки ξ ∈ (x1 − δ; x1 + δ) мы получим |ξ| < ρ,
поэтому
M
rn
6

∞ z}|{
X c · n! X∞
|cn | ·n!

X n! M · ρn−k
(k) n n−k n−k
f (ξ) = (11.1.18) = ·ξ 6 · |ξ| 6 · =
(n − k)! (n − k)! | {z } (n − k)! rn
n=k n=k n=k
>

ρn−k
668 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

M X

n!  ρ n−k M · k! M · r · k!
= k
· · = (11.1.23) = k+1 =
r (n − k)! r ρ
rk · 1 − r (r − ρ)k+1
n=k

(n+1)
Xn
f (k) (x1 ) f (ξ)
k n+1
∀x ∈ (x1 − δ; x1 + δ) f (x) − · (x − x1 ) = (11.2.62) = · (x − x1 ) =
k! (n + 1)!
k=0
(n+1)  n+1
f (ξ) M · r · (n + 1)! M ·r δ
= · |x − x1 |n+1 6 · δ n+1
= · −→ 0. (11.2.92)
(n + 1)! (n + 1)! · (r − ρ)n+2 r−ρ r−ρ n→∞

Выше на с.295 мы показывали, что сумма, разность, произведение, частное и композиция непре-
рывных функций снова является непрерывной функцией. Те же самые свойства для дифференци-
руемых функций доказывались нами на с.375: сумма, разность, произведение, частное и композиция
дифференцируемых функций снова является дифференцируемой функцией. Оказывается, что то
же самое верно и для аналитических функций.

Теорема 11.2.14 (о композиции аналитических функций). Если f – аналитическая функция на


множестве U , а g – аналитическая функция на множестве V ⊇ f (U ), то их композиция h(x) =
g(f (x)) – аналитическая функция на множестве U .

Доказательство. Зафиксируем точку x0 ∈ U и положим

F (x) = f (x) − f (x0 ), G(y) = g(y + f (x0 ))

Композиция этих функций тоже равна h:

G(F (x)) = g(f (x) − f (x0 ) + f (x0 )) = g(f (x)) = h(x), x∈U

С другой стороны, эти функции тоже аналитические, поэтому

F (x) = Genb (x − x0 ), G(y) = Gena (y), x ∈ Uδ (x0 ), y ∈ Uε (0)

для некоторых аналитических последовательностей a и b. При этом

b0 = Genb (0) = F (x0 ) = f (x0 ) − f (x0 ) = 0,

то есть порядок аналитической последовательности b ∈ A отличен от нуля:

ω(b) > 1.

Значит, определена композиция последовательностей a◦b, которая по теореме 11.1.22 тоже является
аналитической: a ◦ b ∈ A. А производящие функции этих последовательностей связаны формулой
(11.1.53), из которой получаем:

h(x) = (G ◦ F )(x) = G(F (x)) = Gena Genb (x − x0 ) = (11.1.53) = Gena◦b (x − x0 ), x ∈ Uδ (x0 )

Таким образом, в некоторой окрестности Uδ (x0 ) точки x0 функция h совпадает с производящей


функцией некоторой аналитической последовательности (a ◦ b). Поскольку это верно для произ-
вольной точки x0 ∈ U , функция h является аналитической на множестве U .

Теорема 11.2.15 (об арифметических операциях с аналитическими функциями). Если f и g –


аналитические функции на множестве U , то следующие функции – тоже аналитические на
множестве U :
f + g, f − g, C · f, f · g,
(C – произвольная константа). А функция
g
f
– аналитическая на множестве U \ {x : f (x) = 0}.
§ 2. Ряд Тейлора и аналитические функции 669

Доказательство. В первых четырех случаях утверждение следует из формул (11.1.33)-(11.1.34):


для произвольной точки x0 ∈ U выберем окрестность (x0 − δ, x0 + δ) и аналитические последова-
тельности a и b так, чтобы

f (x) = Gena (x − x0 ), g(x) = Genb (x − x0 ), x ∈ (x0 − δ, x0 + δ)

Тогда

(f +g)(x) = f (x)+g(x) = Gena (x−x0 )+Genb (x−x0 ) = (11.1.33) = Gena+b (x−x0 ), x ∈ (x0 −δ, x0 +δ)

То есть в некоторой окрестности (x0 − δ, x0 + δ) точки x0 функция f + g совпадает с производящей


функцией некоторой аналитической последовательности (a + b). Поскольку это верно для произ-
вольной точки x0 ∈ U , функция f + g является аналитической на множестве U . То же самое верно
для f − g, C · f , f · g (в последнем случае используется формула (11.1.34)).
Теперь для доказательства аналитичности fg достаточно доказать аналитичность обратной функ-
ции f1 . Это делается с помощью теоремы 11.2.14: поскольку функция G(y) = y1 аналитична в силу
примера 11.2.19, ее композиция с f
1
G(f (x)) =
f (x)
– тоже аналитична.

⋄ 11.2.16. Гладкая, но не аналитическая рена этой функции


функция. Рассмотрим функцию из примера
0
10.1.46, то есть гладкую на R функцию f со свой- k

ствами: z }| {
X∞
f (n) (0) n
x = 0,
( n!
n=0
f (x) = 0, x 6 0
f (x) > 0, x > 0 не сходится к ней ни в какой окрестности нуля
(−δ, +δ), потому что при x > 0 наша функция от-
лична от нуля. Отсюда следует, что f не может
В примере 11.2.7 мы отмечали, что ряд Макло- быть аналитической в точке x = 0.

Целые функции.
• Функция f называется целой, если она определена всюду на R и удовлетворяет следующим
равносильным условиям:
(i)∗ f представима в виде суммы всюду сходящегося на R степенного ряда в нуле:

X
f (x) = cn · xn , x∈R (11.2.93)
n=0

иными словами, функция f всюду на R должна совпадать с производящей функ-


цией некоторой аналитической последовательности cn :

f (x) = Genc (x), x∈R (11.2.94)

(i)∗∗ f представима в виде суммы всюду сходящегося на R степенного ряда в произ-


вольной точке x0 ∈ R:

X
f (x) = cn · (x − x0 )n , x∈R (11.2.95)
n=0

иными словами, функция f всюду на R должна совпадать со сдвигом произво-


дящей функции некоторой аналитической последовательности cn :

f (x) = Genc (x − x0 ), x∈R (11.2.96)


670 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

(ii)∗ f является гладкой и всюду на R совпадает с суммой своего ряда Маклорена:

X∞
f (n) (0) n
f (x) = ·x , x∈R (11.2.97)
n=0
n!

иными словами, функция f всюду на R должна совпадать с производящей функ-


цией последовательности своих коэффициентов Маклорена:

f (n) (0)
f (x) = Genc (x), cn = , x∈R (11.2.98)
n!
(ii)∗∗ f является гладкой и всюду на R совпадает с суммой своего ряда Тейлора в
произвольной точке x0 ∈ R:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x∈R (11.2.99)
n=0
n!

иными словами, функция f всюду на R должна совпадать со сдвигом произво-


дящей функции последовательности своих коэффициентов Тейлора:

f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ R. (11.2.100)
n!
Доказательство. Равносильности (i)∗ ⇔(ii)∗ и (i)∗∗ ⇔(ii)∗∗ следуют из теоремы 11.2.8. С другой
стороны, импликация (i)∗ ⇐(i)∗∗ очевидна, и поэтому остается доказать импликацию (i)∗ ⇒(ii)∗∗ .
Здесь используется тот же прием, что при доказательстве теоремы 11.2.13: поскольку параметры
r и ρ мы можем выбирать произвольными (так, чтобы выполнялась 0 < |x1 | < ρ < r), для всякой
точки x ∈ R можно найти r, ρ и δ так, чтобы x ∈ (x1 − δ, x1 + δ) и выполнялось (11.2.92).
Из теоремы 11.2.13 сразу следует
Теорема 11.2.17. Всякая целая функция является аналитической (и поэтому бесконечно глад-
кой) на R.

X∞
⋄ 11.2.18.
P∞ xВ примере 11.1.5 мы убедились, что (−1)n n
= n+1 · (x − x0 )
n
ряд n=1 n! сходится всюду на R. В соответ- n=0
x0
ствии с нашим определением, это означает, что
порождаемая им функция Таким образом, функция f аналитическая. Ее,
X∞ однако, нельзя считать целой хотя бы потому что
xn
f (x) = она определена не на всей прямой R. Более то-
n=1
n! го, ее нельзя продолжить до целой функции на
является целой. R, потому что по теореме 11.1.10 целая функция
должна быть непрерывна на R, а f не продол-
⋄ 11.2.19. Аналитическая, но не целая
жается до непрерывной функции на R из-за со-
функция. Покажем, что функция
отношения
1 lim f (x) = ∞.
f (x) = x→0
x
является аналитической (на области своего опре- ⋄ 11.2.20. Всюду определенная аналитиче-
деления x ∈ R \ {0}). Зафиксируем точку x0 6= 0. ская, но не целая функция. Функция
Тогда при |x−x0 | < |x0 | справедливо разложение 1
в степенной ряд: f (x) =
1 + x2
1 1 1 1 является аналитический по теореме 11.2.15, как
f (x) = = = · x − x0 =
x x0 + (x − x0 ) x0 1 + отношение двух аналитических функций. Но она
x не является целой, потому что ее ряд Маклорена
| {z0 }
по модулю ∞
меньше 1 X
единицы = (11.2.76) = (−1)n · x2n
1 + x2
∞  n n=0
1 X x − x0
= (11.2.76) = · (−1)n · = сходится только при |x| < 1.
x0 n=0 x0
§ 3. Приложения степенных рядов 671

§3 Приложения степенных рядов


(a) Доказательство зависимости Аксиомы степеней.
Читатель помнит, наверное, что степенное отображение

(a, b) 7→ ab ,

вводилось нами в общем случае (то есть для необязательно целых показателей b) с помощью Акси-
омы степеней B1 на с.328, зависимость которой от других аксиом мы пообещали доказать позже.
Теперь, наконец, мы можем выполнить данное тогда обещание. Собственно доказательству этой
аксиомы (на с.676), мы предпошлем 16 вспомогательных утверждений (леммы 11.3.1-11.3.16). Все
это время читателю предлагается делать вид, что до сих пор он не глядел на текст в двух колонках
и, как следствие не знает ничего об отображении (a, b) 7→ ab , по крайней мере, для случая нецелого
b (случай целых степеней можно считать известным, поскольку для него все необходимые факты
были аккуратно доказаны нами еще в главе 3 в теореме о степенном отображении 3.2.32). Только
после приведенного здесь доказательства Аксиомы степеней все сказанное нами ранее на этот счет
вступит в законную силу, и этой цели посвящен настоящий раздел.

Функция exp. 1
exp(−x) = (11.3.104)
exp x
Лемма 11.3.1. Формула
exp(x + y) = exp x · exp y, (11.3.105)

X n
x
exp x = (11.3.101) Доказательство. 1. Первое равенство доказы-
n=0
n! вается простым вычислением:
X∞
определяет функцию exp всюду на прямой R. 0n 00 01 02
exp 0 = = + + +... = 1
n! 0!
|{z} 1!
|{z} 2!
|{z}
Доказательство. Радиус сходимости этого сте- n=0
1 0 0
пенного ряда равен бесконечности:
2. Докажем затем последнее равенство. По
cn
R = lim = lim (n + 1)! = определению, функция exp является целой, и
n→∞ cn+1 n→∞ n! значит (по условию (ii)∗∗ на с.670), она совпада-
= lim (n + 1) = ∞ ет с суммой своего ряда Тейлора в произвольной
n→∞ точке a ∈ R:
поэтому ряд сходится всюду на R. X∞
exp(n) a n
exp(a + y) = ·y (11.3.106)
Лемма 11.3.2. Функция exp, определенная ря- n=0
n!
дом (11.3.101), имеет производную, причем
По лемме 11.3.2, производная функции exp равна
∂ самой этой функции, поэтому вторая, третья, и
exp x = exp x (11.3.102)
∂x все остальные производные exp тоже совпадают
с exp:
Доказательство. Продифференцируем ряд
exp(n) = exp
(11.3.101) с помощью теоремы 11.1.11:
Подставив это в (11.3.106), мы получим:
X∞ n X∞  n
∂ ∂ x ∂ x ∞ ∞
exp x = = = X exp(n) a n X exp a n
∂x ∂x n=0 n! n=0
∂x n! exp(a + y) = ·y = ·y =
∞ ∞ n=0
n! n=0
n!
X xn−1 X x k
= = = exp x X∞
(n − 1)! k! 1
n=1 k=0 = exp a · · y n = exp a · exp y
n=0
n!

От (11.3.105) это отличается только заменой a на


Лемма 11.3.3. Функция exp, определенная ря- x.
дом (11.3.101), удовлетворяет следующему ра- 3. Второе тождество оказывается следствием
венству и двум тождествам: первого и третьего:
exp 0 = 1, (11.3.103) 1 = exp 0 = exp(x − x) = exp x · exp(−x)
672 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

⇓ Функция ln.
1
exp(−x) = Лемма 11.3.7. Функция exp, определенная ря-
exp x дом (11.3.101), биективно отображает прямую
R на интервал (0; +∞)
Лемма 11.3.4. Функция exp, определенная ря- exp : R → (0; +∞) (11.3.110)
дом (11.3.101), всюду положительна, а в нуле
равна единице: и поэтому правило
exp x > 0 (11.3.107)
t = ln x ⇐⇒ exp t = x (11.3.111)
Доказательство. Предположим, что в какой-то
точке a функция exp равняется нулю: корректно определяет функцию ln, обратную к
exp:
exp a = 0. ln : (0; +∞) → R (11.3.112)
Тогда: Доказательство. 1. Прежде всего, неравенство
(11.3.107) означает, что отображение exp дей-
1 = exp 0 = exp(a − a) = (11.3.105) = ствительно переводит R в (0; +∞).
= exp a · exp(−a) = 0, 2. Далее из условия возрастания (11.3.109)
| {z }
0 следует, что отображение exp инъективно.
3. Покажем, что exp сюръективно отобра-
что, конечно, невозможно. Таким образом, exp
жает R на (0; +∞). Пусть C ∈ (0; +∞). По-
– непрерывная функция, определенная всюду на
скольку limx→−∞ exp x = 0 (первое равенство в
прямой R, нигде не обращающаяся в нуль, а в
(11.3.109)), найдется x ∈ R такое, что exp x < C.
точке 0 равная единице. Такое возможно только
С другой стороны, limx→+∞ exp x = +∞ (второе
если exp всюду положительна.
равенство в (11.3.109)), поэтому найдется y ∈ R
Лемма 11.3.5. Функция exp, определенная ря- такое, что exp y > C. Мы получаем, что
дом (11.3.101), возрастает на R:
exp x < C < exp y
x<y =⇒ exp x < exp y (11.3.108)
причем exp – непрерывная функция по теореме
Доказательство. Производная этой функции 11.1.10. Значит, по теореме Коши о среднем зна-
всюду положительна чении 4.3.22, найдется точка c ∈ R такая, что
∂ exp c = C
exp x = (11.3.102) = exp x > (11.3.107) > 0,
∂x
поэтому по теореме 6.2.22 о строгой монотонно- Мы получили, что какое ни возьми C ∈ (0; +∞),
сти, эта функция должна возрастать. для него найдется точка c ∈ R, в которой функ-
ция exp принимает значение C. Это и означа-
Лемма 11.3.6. Функция exp, определенная ря- ет сюръективность exp как отображения из R в
дом (11.3.101), имеет следующие пределы на бес- (0; +∞).
конечности: 4. Инъективность и сюръективность вместе
означают биективность exp : R → (0; +∞).
lim exp x = 0 lim exp x = +∞ (11.3.109)
x→−∞ x→+∞
Лемма 11.3.8. Функция ln, определенная пра-
Доказательство. Второй предел следует из оче- вилом (11.3.111), возрастает:
видного неравенства:
0<x<y =⇒ ln x < ln y (11.3.113)
x2
∀x > 0 exp x = 1 + x + + ... > 1 + x
2 Доказательство. Если бы оказалось, что ln x >
ln y, то, в силу возрастания exp, мы получили бы
После того, как он доказан, первый предел полу-
чается заменой переменных: ln x > ln y
 
y = −x ⇓
lim exp x = = lim exp(−y) =
x→−∞ y → +∞ y→+∞
  exp(ln x) > exp(ln y)
1 1 | {z } | {z }
= (11.3.104) = lim = = x y
y→+∞ exp y limy→+∞ exp y
  ⇓
1
= =0
+∞ x>y
§ 3. Приложения степенных рядов 673

Лемма 11.3.9. Функция ln, определенная пра- Доказательство. Если a > 0, то мы получаем:
вилом (11.3.111), удовлетворяет следующему
равенству и двум тождествам: ab = (11.3.117) = exp(b · ln a) =
 z }| { 
1
ln 1 = 0, (11.3.114) = sgn2 b ∨ sgn a · exp(b · ln |a| )
1 | {z } |{z}
ln = − ln x (11.3.115) 1
a
x
ln(x · y) = ln x + ln y, (11.3.116) Если же a < 0, то

Доказательство. Первое равенство следует ab = (11.3.117) = sgn2 b · exp(b · ln |a|) =


непосредственно из определения (11.3.111): −1
 z }| { 
exp 0 = (11.3.103) = 1 ⇐⇒ 0 = ln 1 = sgn2 b ∨ sgn a · exp(b · ln |a|)
| {z }
Чтобы доказать второе, достаточно вычис- sgn2 b

лить значения функции exp в обеих его частях:


 
1 1 1 Лемма 11.3.11. Отображение (a, b) 7→ ab ,
exp ln = = =
x x exp(ln x) определенное формулой (11.3.117), удовлетворя-
= (11.3.104) = exp(− ln x) ет показательным законам (5.1.1)-(5.1.3):
a0 = 1, (11.3.119)
Поскольку exp – инъективное отображение, ра-
венство exp ln x1 = exp(− ln x) означает, что ар- 1
a−x = , (11.3.120)
гументы у exp должны быть равны: ln x1 = − ln x. ax
Точно так же доказывается последнее равен- ax+y = ax · ay (11.3.121)
ство:
(каждое из этих равенств верно всякий раз, ко-
exp (ln(x · y)) = x · y = exp(ln x) · exp(ln y) = гда обе его части определены).
= (11.3.105) = exp(ln x + ln y)Доказательство. Здесь нужно рассмотреть
несколько случаев.
Опять, поскольку exp – инъективное отображе- 1. Проверим сначала эти равенства в случае,
ние, равенство exp (ln(x · y)) = exp(ln x + ln y) когда a > 0. Тогда, во-первых,
возможно только если аргументы у exp равны:
ln(x · y) = ln x + ln y. a0 = (11.3.117) = exp(0·ln a) = exp 0 = (11.3.103) = 1
Во-вторых,
Определение степеней ab и доказательство
Аксиомы степеней. Теперь мы можем опре- a−x = (11.3.117) = exp(−x · ln a) =
делить степенное отображение (a, b) 7→ ab . В 1 1
его определении участвует отображение sgn2 : = (11.3.104) = = (11.3.117) = x
Z exp(x · ln a) a
2N∗ −1 → {−1; +1}, которое мы когда-то давно
задавали формулой (3.2.212): И, в-третьих,


 exp(b · ln a), a>0 ax+y = (11.3.117) = exp((x + y) · ln a) =

0, a = 0, b > 0 = exp(x · ln a + y · ln a) = (11.3.105) =
ab :=

 1, a = 0, b = 0 = exp(x · ln a) · exp(y · ln a) = (11.3.117) = ax · ay


sgn2 b · exp(b · ln |a|), a < 0, b ∈ 2N∗Z−1
2. После этого перейдем к случаю a = 0. То-
(11.3.117) гда, во-первых,
Напомним, что еще в главе 3 (формула
(3.1.63)) мы условились символом a ∨ b обозна- a0 = 00 = (11.3.117) = 1
чать операцию взятия максимума двух чисел:
Во-вторых, в соответствии с определением
a ∨ b = max{a, b} (11.3.117), выражение 0−x имеет смысл только
при x 6 0, а и 0x – только при x > 0. Значит, од-
Такая запись позволяет сделать более наглядны- новременно то и другое имеет смысл только при
ми (или более “алгебраическими”) выкладки, ко- x = 0. Мы получаем, что равенство 0−x = 1x
0
торыми мы займемся в этом пункте. нужно проверять лишь для случая x = 0, но то-
Лемма 11.3.10. При a 6= 0 и b ∈ 2N∗Z−1 справед- гда оно становится 0
следствием уже отмеченного
ливо тождество: равенства 0 = 1:
  1 1
ab = sgn2 b ∨ sgn a · exp(b · ln |a|) (11.3.118) 0−0 = 00 = 1 = = 0
1 0
674 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

В-третьих, выражения 0x+y , 0x , 0y имеют смысл Лемма 11.3.12. Отображение (a, b) 7→ ab ,


при x > 0 и y > 0. Поэтому для доказательства определенное формулой (11.3.117), удовлетворя-
равенства 0x+y = 0x · 0y придется рассмотреть ет степенным законам (5.1.4)-(5.1.6):
дополнительно четыре случая:  b
b 1 1
— если x = y = 0, то 1 = 1, = b, (x · y)b = xb · y b
x x
(11.3.122)
0x+y = 00+0 = 00 = 1 =
(каждое из этих равенств верно всякий раз, ко-
= 1 · 1 = 00 · 00 = 0x · 0y гда обе его части определены).
— если x = 0, y > 0, то Доказательство. 1. Первое равенство имеет
смысл при любом b ∈ R, и мы получаем:
0x+y = 00+y = 0y = (11.3.117) = 0 = 1b = (11.3.117) = exp(b · ln 1) = (11.3.114) =
0 y x y
= 1 · 0 = (11.3.117) = 0 · 0 = 0 · 0 = exp(b · 0) = exp 0 = (11.3.103) = 1

— если x > 0, y = 0, то 2. Для доказательства второго тождества


нужно рассмотреть три случая:
0x+y = 0x+0 = 0x = (11.3.117) = 0 = — если x > 0, то b ∈ R, и
x 0 x y  b  
= 0 · 1 = (11.3.117) = 0 · 0 = 0 · 0
1 1
= (11.3.117) = exp b · ln =
— если x > 0, y > 0, то x x
= (11.3.115) = exp(−b · ln x) = (11.3.104) =
0x+y = (11.3.117) = 0 = 1 1
= = (11.3.117) = b
= 0 · 0 = (11.3.117) = 0x · 0y exp(b · ln x) x
— если x = 0, то выражение x1 не имеет смысл,
3. Остается случай a < 0. Во-первых, поэтому проверять нечего;
Z
— если x < 0, то b ∈ 2N∗ −1 , и
a0 = (11.3.117) = sgn2 0 · exp(0 · ln |a|) =
| {z }  b
1 1
= exp(0) = (11.3.103) = 1 = (11.3.117) =
x
 
1
Во-вторых, в соответствии с определением = sgn2 b · exp b · ln =
(11.3.117), выражения a−x и ax имеют смысл для x
 
x ∈ 2N∗Z−1 . В этом случае получается: = sgn2 b · exp b · ln
1
= (11.3.115) =
|x|
a−x = (11.3.117) = sgn2 (−x) · exp(−x · ln |a|) = = sgn2 b · exp(−b · ln |x|) = (11.3.104) =
1 1
= (3.2.214), (11.3.104) = sgn2 x · = = sgn2 b · = (3.2.213) =
exp(x · ln |a|) exp(b · ln |x|)
1 1 1 1
= (3.2.213) = = (11.3.117) = x = = (11.3.117) = b
sgn2 x · exp(x · ln |a|) a sgn2 b · exp(b · ln |x|) x
3. Для доказательства третьего тождества
В-третьих, выражения ax+y , ax , ay имеют смысл приходится рассматривать 6 случаев. Во-первых,
при x, y ∈ 2N∗Z−1 , и мы получаем: нужно отдельно поглядеть, что получается, ко-
гда x или y равно нулю:
ax+y = (11.3.117) =
— если x = 0, то чтобы xb имело смысл, нужно
= sgn2 (x + y) · exp((x + y) · ln |a|) = чтобы b > 0, и при этом становится неважно,
= sgn2 (x + y) · exp(x · ln |a| + y · ln |a|) = каким будет y:
= (3.2.215), (11.3.105) = 1) при b = 0 получаем:
= sgn2 x · sgn2 y · exp(x · ln |a|) · exp(y · ln |a|) =
(x · y)b = (0 · y)0 = 00 = (11.3.117) = 1 =
= sgn2 x · exp(x · ln |a|) · sgn2 y · exp(y · ln |a|) =
| {z } | {z } = 1 · 1 = (11.3.117) = 00 · y 0 = xb · y b
ax ay
= (11.3.117) = ax · ay 2) при b > 0 получаем:

(x · y)b = (0 · y)b = 0b = (11.3.117) = 0 =


= 0 · y b = (11.3.117) = 0b · y b = xb · y b
§ 3. Приложения степенных рядов 675

— по тем же причинам при y = 0 нужно чтобы = (11.3.117) = ax·y


b > 0, при этом становится неважно каким
будет x, и тождество также выполняется. 2. Пусть a = 0 и x > 0, y > 0. Тогда:

После этого остается рассмотреть 4 случая, — если x = 0, то


когда x и y принимают разные знаки:
(ax )y = (|{z}
00 )y = 1y = (11.3.122) =
— если x > 0, y > 0, то b ∈ R, и 1
= 1 = (11.3.117) = 00 = 00·y = ax·y
(x · y)b = (11.3.117) = exp(b · ln(x · y)) =
= (11.3.116) = exp(b · (ln x + ln y)) = — если x > 0 и y = 0, то
= exp(b · ln x + b · ln y) = (11.3.105) = (ax )y = (|{z}
0x )0 = |{z}
00 = 0x·0 = ax·y
b b
= exp(b·ln x)·exp(b·ln y) = (11.3.117) = x ·y 0 1

— если x < 0, y > 0, то b ∈ Z — если x > 0 и y > 0, то


2N∗ −1 , и
(ax )y = (|{z}
0x )y = |{z}
0y = 0x·y = ax·y
(x·y)b = (11.3.117) = sgn2 b·exp(b·ln |x·y|) =
0 0
= sgn2 b · exp(b · ln(|x| · y)) = (11.3.116) =
3. Пусть a < 0 и x, y ∈ 2N∗Z−1 . Тогда
= sgn2 b · exp(b · ln |x| + b · ln y) = (11.3.105) =
нужно воспользоваться формулами (11.3.118) и
= sgn2 b · exp(b · ln |x|) · exp(b · ln y) = xb · y b (3.2.216):
| {z } | {z }
xb yb
a x )y = (11.3.117) =
(|{z}
— то же самое, с точностью до очевидных пере-
становок, получается при x > 0, y < 0 (тогда
<

опять b ∈ 2N∗Z−1 ); 0
 y
Z = sgn2 x · exp(x · ln |a|) = (11.3.118) =
— наконец, если x < 0, y < 0, то b ∈ 2N∗ −1 , и | {z }
6=

0 0
>

  
z}|{
(x · y)b = (11.3.117) = exp(b · ln(x · y)) = = sgn2 y ∨ sgn sgn2 x · exp(x · ln |a|) ·
1 x·y | {z }
z }| { z }| { sgn2 x
= (sgn2 b)2 · exp(b · ln(|x| · |y|)) =  

· exp y · ln sgn2 x · exp(x · ln |a|) =
= (11.3.116) = (sgn2 b)2 ·exp(b·ln |x|+b·ln |y|) = | {z }
= (11.3.105) = exp(x·ln |a|)

= sgn2 b · exp(b · ln |x|) · sgn2 b · exp(b · ln |y|) = = sgn2 y ∨ sgn2 x ·
| {z } | {z } | {z }
xb yb
=

(3.2.216)
= xb · y b
=

sgn2 (y · x)
  
Лемма 11.3.13. Отображение (a, b) 7→ ab , · exp y · ln exp(x · ln |a|) =
определенное формулой (11.3.117), удовлетворя- | {z }
ет накопительному закону (5.1.7):
=

x · ln |a|
x y x·y 
(a ) = a (a > 0) (11.3.123) = sgn2 (y · x) · exp y · x · ln |a| = ay·x = ax·y
в следующих случаях:
— при a > 0 и x, y ∈ R, Лемма 11.3.14. Отображение (a, b) 7→ ab ,
— при a = 0 и x > 0, y > 0, определенное формулой (11.3.117), удовлетворя-
— при a < 0 и x, y ∈ 2N∗Z−1 . ет условию сохранения знака (3.2.142):

Доказательство. 1. Пусть a > 0 и x, y ∈ R. То- a>0 ⇒ an > 0 (n ∈ Z) (11.3.124)


гда:
Доказательство.
x y x
(a ) = (11.3.117) = exp(y ·ln a ) = (11.3.117) = (11.3.107)
 (11.3.117)
 a>0 ⇒ an = exp(b · ln a) > 0
= exp y · ln exp(x · ln a) = exp(y · x · ln a) =
| {z }
x·ln a
676 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Лемма 11.3.15. Отображение (a, b) 7→ ab , Доказательство. Если a > 1, то ln a > ln 1 = 0


определенное формулой (11.3.117), удовлетворя- (поскольку функция ln возрастает), поэтому при
ет условиям монотонности (5.1.10)-(5.1.11): умножении на ln a знак неравенства не меняется:
 
b>0 & 0<x<y =⇒ 0 < xb < y b x<y
(11.3.125)
  ⇓
b b
b<0 & 0<x<y =⇒ x >y >0
x · ln a < y · ln a
(11.3.126)
Доказательство. При b > 0 получаем: ⇓

0<x<y exp(x · ln a) < exp(y · ln a)


| {z } | {z }
ax ay

Если же 0 < a < 1, то ln a < ln 1 = 0 (посколь-
ln x < ln y
ку функция ln возрастает), поэтому при умноже-
⇓ нии на ln a знак неравенства меняется:
b · ln x < b · ln y
x<y

exp(b · ln x) < exp(b · ln y) ⇓
| {z } | {z }
xb yb
x · ln a > y · ln a
А при b < 0:
0<x<y ⇓
⇓ exp(x · ln a) > exp(y · ln a)
| {z } | {z }
ln x < ln y ax ay

b · ln x > b · ln y
Доказательство зависимости Аксиомы B1 на с.328.

Формула (11.3.117) определяет отображение
exp(b · ln x) > exp(b · ln y) (a, b) 7→ ab в точности для тех ситуаций, что
| {z } | {z }
xb yb перечислены в условии P0 Аксиомы степеней
B1. По леммам 11.3.11 и 11.3.12, это отображе-
ние удовлетворяет показательным и степенным
Лемма 11.3.16. Отображение (a, b) 7→ ab , законам, то есть условию P1 . По лемме 11.3.13,
определенное формулой (11.3.117), удовлетворя- оно удовлетворяет накопительному закону, то
ет условиям монотонности (5.1.12)-(5.1.13): есть условию P2 . По лемме 11.3.14, закон со-
  хранения знака (5.1.9) тоже выполняется, а в
a>1 & x<y =⇒ ax < ay (11.3.127) силу замечания 5.1.4, формула (5.1.8) выполня-
  ется автоматически, поэтому ее доказывать не
0<a<1 & x<y =⇒ ax > ay нужно. Наконец, по леммам 11.3.15 и 11.3.16 оно
(11.3.128) удовлетворяет условиям монотонности P4 .

(b) Доказательство зависимости Аксиомы тригонометрии.


Наступил момент вспомнить еще об одном важном результате, доказательство которого (как в слу-
чае с Аксиомой степеней B1 на с.328) было отложено нами на будущее. Это Аксиома тригонометрии
B2 на с.341, с помощью которой мы вводили функции синус и косинус. Теперь мы можем доказать
и ее. Мы предпошлем доказательству 11 вспомогательных утверждений (леммы 11.3.17-11.3.27).
Здесь (как в случае с Аксиомой степеней B1 на с.328) мы опять предлагаем читателю сделать вид,
что до настоящего времени он не глядел на текст в двух колонках и не знает ничего из того, что
писалось о синусе и косинусе вплоть до момента, когда мы собственно примемся за доказательство
Аксиомы тригонометрии (на с.681). Только в самом доказательстве мы вспомним, что следствия
из Аксиомы тригонометрии уже рассматривались ранее нами в иллюстрациях (и из этого будет
выводиться единственность функций sin и cos).
§ 3. Приложения степенных рядов 677

Лемма 11.3.17. Формулы Радиус сходимости последнего степенного ряда


будет таким:

X x2n+1
sin x = (−1)n · (11.3.129) cn n
(2n + 1)! R = lim = lim (−1) · (2n + 2)! =
n=0
n→∞ cn+1
n→∞ (−1) n+1 · (2n)!
X∞
x2n
cos x = (−1)n · (11.3.130) = lim (2n + 1)(2n + 2) = ∞
n=0
(2n)! n→∞

Значит ряд
определяют функции sin и cos всюду на прямой ∞
X yn
R. (−1)n ·
n=0
(2n)!
Доказательство. 1. Первый ряд перепишем в сходится при любом y. Как следствие, при под-
виде становке y = x2 получающийся ряд
∞ ∞ ∞
X
X x2n+1 X (x2 )n (x2 )n
(−1) · n
= x· (−1)n · = (−1)n ·
(2n + 1)! (2n + 1)! n=0
(2n)!
n=0 n=0


X yn тоже должен сходиться, независимо от того, ка-
n
=x· (−1) · кое значение принимает x. Мы получаем, что
n=0
(2n + 1)!
y=x формула (11.3.130) определяет функцию cos всю-
2

и вычислим радиус сходимости у последнего сте- ду на прямой R.


пенного ряда (от переменной y) по формуле Да- Лемма 11.3.18. Функции sin и cos, определен-
ламбера: ные рядами (11.3.129)-(11.3.130), удовлетворя-
ют тождествам:
cn (−1)n · (2n + 3)!

R = lim
= lim =
n→∞ cn+1 n→∞ (−1)n+1 · (2n + 1)! sin(−x) = − sin x cos(−x) = cos x (11.3.131)
= lim (2n + 2)(2n + 3) = ∞ Доказательство.
n→∞


X
То есть ряд (−x)2n+1
sin(−x) = (11.3.129) = (−1)n · =
∞ (2n + 1)!
X yn n=0
(−1)n · ∞
X −(x2n+1 )
n=0
(2n + 1)! = (−1)n · =
n=0
(2n + 1)!
сходится при любом y. Значит при подстановке ∞
X
y = x2 получающийся ряд x2n+1
=− (−1)n · = (11.3.129) = − sin x
n=0
(2n + 1)!

X
n (x2 )n
(−1) ·
(2n + 1)! ∞
X
n=0 (−x)2n
cos(−x) = (11.3.130) = (−1)n · =
тоже сходится независимо от того, какое значе- n=0
(2n)!
ние принимает x. После умножения на x получа- ∞
X 2n
ющийся ряд x
= (−1)n · = (11.3.130) = cos x
n=0
(2n)!

X
n x2n+1
(−1) ·
n=0
(2n + 1)!
Лемма 11.3.19. Функции sin и cos, определен-
тоже должен сходиться в силу свойства 1◦ на ные рядами (11.3.129)-(11.3.130), удовлетворя-
с.559, каким бы ни был x. Все это означает, что ют равенствам:
формула (11.3.129) определяет функцию sin всю-
ду на прямой R. sin 0 = 0 cos 0 = 1 (11.3.132)
2. Второй ряд можно переписать так:
Доказательство.

X ∞
X
x2n (x2 )n ∞
X 02n+1
(−1)n · = (−1)n · = sin 0 = (11.3.129) = (−1)n · =
n=0
(2n)! n=0 (2n)! (2n + 1)!
n=0
y n

X ∞
n
X
= (−1) · = (−1)n · 0 = 0
n=0
(2n)!
y=x2 n=0
678 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ


X 02n Доказательство. Зафиксируем какое-нибудь
cos 0 = (11.3.130) = (−1)n · =
(2n)! число a ∈ R и рассмотрим три функции:
n=0

X 2n
0 02·0 F (x) = sin(x + a) − sin x · cos a − cos x · sin a
= (−1)n · = (−1)0 · +
(2n)! (2 · 0)! G(x) = cos(x + a) − cos x · cos a + sin x · sin a
n=0 | {z }
1 H(x) = F (x)2 + G(x)2

X 02n
+ (−1)n · =1 Заметим две вещи: во-первых,
n=1 |
(2n)!
{z } (
0 F (0) = sin a − sin 0 · cos a − cos 0 · sin a = 0
G(0) = cos a − cos 0 · cos a + sin 0 · sin a = 0
Лемма 11.3.20. Функции sin и cos, определен- ⇓
ные рядами (11.3.129)-(11.3.130), имеют следу-
ющие производные: H(0) = F (0)2 + G(0)2 = 0
∂ ∂ И, во-вторых,
sin x = cos x cos x = − sin x (11.3.133)
∂x ∂x  ′

 F (x) = cos(x + a) − cos x · cos a+
Доказательство. 
 + sin x · sin a = G(x)
∂ ′
G (x) = − sin(x + a) + sin x · cos a+

sin x = (11.3.129) = 

∂x + cos x · sin a = −F (x)

∂ X x2n+1
= (−1)n · = ⇓
∂x n=0 (2n + 1)!

X ∂ x2n+1
= (−1)n · = H ′ (x) = 2 · F (x) · F ′ (x) + 2 · G(x) · G′ (x) =
n=0
∂x (2n + 1)!

= 2 · F (x) · G(x) − 2 · G(x) · F (x) = 0
X (2n + 1) · x2n
n
= (−1) · = Вместе это означает, что функция H должна
n=0
(2n + 1)!
быть тождественно равна нулю, а значит F и G

X x2n тоже тождественно равны нулю:
= (−1)n · = cos x
(2n)!
n=0
H(x) = F (x)2 + G(x)2 ≡ 0

∂ ⇓
cos x = (11.3.130) = (
∂x
∞ F (x) ≡ 0
∂ X x2n
= (−1)n · = G(x) ≡ 0
∂x n=0 (2n)!
∞ Заменяя a на y, мы из последних тождеств по-
X ∂ x2n
= (−1) · n
= лучаем (11.3.134)-(11.3.135).
n=0
∂x (2n)!

Лемма 11.3.22. Функции sin и cos, определен-
X (2n) · x2n−1
n
= (−1) · 0 + (−1) · n
= ные рядами (11.3.129)-(11.3.130), удовлетворя-
n=1
(2n)! ют тождеству:
X∞  
n x2n−1 замена:
sin2 x + cos2 x = 1 (11.3.136)
= (−1) · = k = n − 1 =
n=1
(2n − 1)! n=k+1

Доказательство. Подставив y = −x в
X x2k+1 (11.3.135), мы получим:
k+1
= (−1) · =
(2k + 1)!
k=1

X 1 = (11.3.132) = cos 0 = cos(x − x) =
x2k+1
=− (−1)k · = − sin x = cos x · cos(−x) − sin x · sin(−x) =
(2k + 1)!
k=1
= (11.3.131) = cos2 x + sin2 x

Лемма 11.3.21. Функции sin и cos, определен-


ные рядами (11.3.129)-(11.3.130), удовлетворя- Лемма 11.3.23. Функция sin, определенная ря-
ют тождествам: дом (11.3.129), строго положительна на интер-
вале (0, 2):
sin(x + y) = sin x · cos y + cos x · sin y (11.3.134)
cos(x + y) = cos x · cos y − sin x · sin y (11.3.135) ∀x ∈ (0, 2) sin x > 0
§ 3. Приложения степенных рядов 679

Доказательство. Перепишем ряд, определяю- слагаемые в этом ряду неотрицательны. Значит,


щий sin таким образом: cos на отрезке x ∈ [0, 2] можно оценить сверху,
оборвав последний ряд после первого слагаемо-

X x2n+1 го:
sin x = (−1)n · =
n=0
(2n + 1)!  
X∞
3 5 7 x4k+2 x2
x x x · 1− >
=x−
+ − + ... = (4k + 2)! (4k + 3) · (4k + 4)
 3!
 5!  7! 
k=0
 
x2 x5 x2 X0
x4k+2 x2
=x· 1− − · 1− + ... = > · 1− =
2·3 5! 6·7 (4k + 2)! (4k + 3) · (4k + 4)

X   k=0
 
x4k+1 x2 x2 x2
= · 1− = · 1−
(4k + 1)! (4k + 3) · (4k + 4) 2! 3·4
k=0

И заметим, что при x ∈ [0, 2] множитель в скоб-



ках в последнем ряде положителен:

x ∈ [0, 2]
cos x = 1−
⇓ X∞  
x4k+2 x2
2 − · 1− 6
x 6 4 < (4k + 3) · (4k + 4) (k ∈ N) k=0
(4k + 2)! (4k + 3) · (4k + 4)
 
⇓ x2 x2
61− · 1−
x2 2! 3·4
<1 (k ∈ N)
(4k + 3) · (4k + 4)
В частности, при x = 2 получаем:

 
22 22
x2 cos 2 6 1 − · 1− =
1− >0 (k ∈ N) (11.3.137) 2! 3·4
(4k + 3) · (4k + 4)  
2 1 1
=1− · 1− =− <0
Отсюда следует, что при x ∈ (0, 2) в полученном 2! 3 3
ряде все слагаемые тоже положительны, и зна-
чит С другой стороны, в силу (11.3.132),
X∞  
x4k+1 x2 cos 0 = 1
sin x = · 1− >0
(4k + 1)! (4k + 3) · (4k + 4)
k=0
Мы получаем, что на отрезке [0, 2] функция cos
меняет знак. Значит, по теореме Коши о про-
межуточном значении 4.3.22, она обращается в
Лемма 11.3.24. Функция cos, определенная ря-
нуль в некоторой точке a ∈ (0, 2).
дом (11.3.130), имеет на промежутке (0, 2) ров-
но один нуль: Остается показать, что это единственный
нуль на (0, 2). Действительно, по лемме 11.3.23,
∃! a ∈ (0, 2) cos a = 0 (11.3.138) производная этой функции отрицательна на ин-
тервале (0, 2):
Доказательство. Перепишем ряд, определяю-
щий cos, иначе: ∂
cos x = − sin x < 0
∂x
X∞
x2n
cos x = (−1)n · = Значит, по теореме 6.2.22 cos монотонно убывает
(2n)!
n=0 на интервале (0, 2), и поэтому не может дважды
x2 x4 x6 x8 обращаться в нуль на нем.
=1− + − + − ... =
 2! 4!
 6!  8! 
x2 x2 x6 x2
=1− · 1− − · 1− + ... = Лемма 11.3.25. Точка a ∈ (0, 2), определенная
2! 3·4 6! 7·8 условием (11.3.138), обладает следующими свой-
X∞ 4k+2
 2
 ствами:
x x
=1− · 1−
(4k + 2)! (4k + 3) · (4k + 4)
k=0 cos a = 0 sin a = 1 (11.3.139)
В силу (11.3.137), при x ∈ [0, 2] множитель в cos 2a = −1 sin 2a = 0 (11.3.140)
скобках в последнем ряде положителен, поэтому cos 4a = 1 sin 4a = 0 (11.3.141)
680 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
   
Доказательство. Первая строчка: x2 x5 x2
=x· 1− + · 1− + ... =
2 4! 5·6
cos a = 0  
x2
=x· 1− +
⇓ 2
| {z }

<
sin2 a = 1 − cos2 a = 1 0,
при x ∈ (0, 1)
⇓ ∞  
  X x4k+1 x2
sin a = 1 + · 1− >0
(4k)! (4k + 1) · (4k + 2)
sin a = −1 ← невозможно, в силу леммы 11.3.23 k=1 | {z }

<
⇓ 0,
при x ∈ (0, 1)
sin a = 1
Вторая строчка: 2. Второе неравенство:
cos 2a = cos2 a − sin2 a = 0 − 1 = −1,
sin x − x · cos x =
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 X∞
x2n+1 X∞
x2n
= (−1)n · −x· (−1)n · =
Третья строчка: n=0
(2n + 1)! n=0
(2n)!

X X∞
cos 4a = cos2 2a − sin2 2a = 0 − 1 = −1, x2n+1
n x2n+1
= (−1) · − (−1)n · =
n=0
(2n + 1)! n=0 (2n)!
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 ∞  2n+1 
X x x2n+1
n
= (−1) · − =
n=0
(2n + 1)! (2n)!
Лемма 11.3.26. Число 4a, где a ∈ (0, 2) опре- ∞
X x2n+1  
делено условием (11.3.138), является периодом = (−1)n · · 1 − (2n + 1) =
n=0
(2n + 1)!
для функций sin и cos, определенных рядами

X
(11.3.129)-(11.3.130): x2n+1
= (−1)n+1 · · 2n =
n=0
(2n + 1)!
sin(x + 4a) = sin x, cos(x + 4a) = cos x
3
x x5 x7 x9
=0+ ·2− ·4+ ·6− · 8 + ... =
Доказательство. Здесь просто применяется 3! 5! 7! 9! 
  
(11.3.141): x3 x2 x7 x2
= · 2− + · 6− · 8 + ... =
3! 5 7! 9
sin(x + 4a) = sin x · cos
| {z4a} + cos x · sin
| {z4a} = sin x ∞  
X x4k+3 x2
1 0 = · (4k + 2) − >0
(4k + 3)! 4k + 5
cos(x + 4a) = cos x · cos
k=0 | {z }
| {z4a} − sin x · sin
| {z4a} = cos x
<

1 0 0,
при x ∈ (0, 1)

Лемма 11.3.27. При x ∈ (0; 1) для функций sin 3. Третье неравенство:


и cos, определенных рядами (11.3.129)-(11.3.130)
выполняется следующее тройное неравенство: ∞
X x2n+1
x − sin x = x − (−1)n · =
0 < x cos x < sin x < x. (11.3.142) (2n + 1)!
n=0

Доказательство. Здесь всюду используется x3 x5 x7 x9


= − + − + ... =
прием, который мы применяли при доказатель-
3
 3! 2 5!  7!7 9! 
стве леммы 11.3.23 – нужно представить ряд, x x x x2
= · 1− + · 1− + ... =
которым записывается функция, в удобном для 3! 4·5 7! 8·9
оценок виде. X∞  
x4k+3 x2
1. Первое неравенство: = · 1− >0
(4k + 3)! (4k + 4) · (4k + 5)
k=0 | {z }

X x2n
<

x · cos x = x · (−1)n · = 0,
n=0
(2n)! при x ∈ (0, 1)

x3 x5 x7
=x− + − + ... =
2! 4! 6!
§ 3. Приложения степенных рядов 681

Доказательство зависимости Аксиомы B2. 1. функций sin и cos, удовлетворяющих условиям


Лемма 11.3.17 определяет функции sin и cos всю- T0 -T1 Аксиомы тригонометрии, уже доказана:
ду на числовой прямой R, а по лемме 11.3.26 эти в иллюстративном тексте мы, последовательно
функции являются периодическими. Это дока- выводя следствия из Аксиомы B2, получили, что
зывает условие T0 Аксиомы тригонометрии. если какие-то функции sin и cos удовлетворяют
2. Условие T1 доказывается леммами 11.3.21 условиям T0 -T2 Аксиомы B2, то они автомати-
и 11.3.22. чески должны описываться рядами (11.2.85) и
3. Условие T1 доказывается леммой 11.3.27. (11.2.86), или, что то же самое, рядами (11.3.129)-
4. Остается заметить, что единственность (11.3.130).

(c) Значение числа π


В заключение разговора о степенных рядах и аналитических функциях отметим еще одно приложе-
ние этой теории – формулу для нахождения числа π, которую мы обещали читателю еще на с.342,
когда определяли это число.

Предложение 11.3.28. Число π представимо Как сумма равномерно сходящегося ряда из


в виде суммы числового ряда формулой непрерывных функций, функция f должна быть
∞ непрерывна на отрезке [0, 1]. С другой стороны,
X (−1)n · 4
π= , (11.3.143) в силу тождества (11.1.25), функция f совпадает
n=0
2n + 1 с функцией arctg на полуинтервале [0, 1):
и для всякого N ∈ N∗ удовлетворяет оценке ∞
X x2n+1
∀x ∈ [0, 1) arctg x = (−1)n · = f (x)
XN
(−1)n · 4 4 2n + 1
n=0
π − 6 (11.3.144)
2n + 1 2N + 3
n=0
При этом, как мы знаем, функция arctg непре-
или, что то же самое, оценке рывна на R (и значит на [0, 1]) в силу предло-
жения 5.1.65. Отсюда следует, что функции f и
XN
(−1)n · 4 4 arctg совпадают в точке 1:
− <π<
n=0
2n + 1 2N +3
arctg 1 = lim arctg x = lim f (x) = f (1)
XN x→1−0 x→1−0
(−1)n · 4 4
< + (11.3.145)
n=0
2n + 1 2N +3 Теперь мы получаем:
Доказательство. Рассмотрим функциональный π
ряд = arctg 1 = f (1) =
|4 {z }

X x2n+1 по определению
(−1)n · , x ∈ [0, 1] (11.3.146) арктангенса (5.1.124)
2n + 1
x2n+1
n=0 ∞
X ∞
X 1
2n+1 = (−1)n · = (−1)n ·
Если обозначить bn (x) = x2n+1 , то при x ∈ [0, 1] n=0
2n + 1 x=1 n=0 2n + 1
это будет неотрицательная невозрастающая по-
следовательность Умножая это на 4, мы получим форму-
лу (11.3.143), а из оценки остатка знакоче-
b0 (x) > b1 (x) > b2 (x) > ... > 0 редующегося ряда (9.2.52) получаем оценку
стремящаяся к нулю равномерно на [0, 1]: (11.3.144).

1
||bn ||[0,1] = −→ 0 ! 11.3.29. Как и в случае с числом Непера e,
2n + 1 n→∞
значение которого, как мы помним оценивались
То есть ряд (11.3.146) удовлетворяет условиям с помощью неравенства (4.2.102), значения π так-
теоремы 10.1.36 (признак Лейбница равномерной же можно оценивать, используя теперь неравен-
сходимости), и значит, он равномерно сходится ство (11.3.145), однако эти два случая качествен-
на отрезке [0, 1]. Обозначим его сумму буквой f : но различаются тем, что нужная точность для π

достигается гораздо медленнее, чем для e. На-
X x2n+1
f (x) = (−1)n · , x ∈ [0, 1] пример, для вычисления первых двух знаков по-
n=0
2n + 1 сле запятой для π нужно брать сумму 1000 сла-
682 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

1000
X
гаемых: во-первых, (−1)n · 4 4
< − <π<
4 2n + 1 2 · 1000 + 3
= 0, 0019970...
2·1000+3
n=0
⇓ 1000
X (−1)n · 4 4
4
0, 001 < 2·1000+3 < 0, 002 < − <
n=0
2n + 1 2 · 1000 + 3

4
−0, 002 < − 2·1000+3 < −0, 001 < 3, 142 + 0, 002 = 3, 144

во-вторых, ⇓
P1000 n
(−1) ·4
n=0 = 3, 14259165...
2n+1
⇓ 3, 14 < π < 3, 15 (11.3.147)
P1000 (−1)n ·4
3, 142 < n=0 2n+1 < 3, 143

и вместе это дает

3, 140 = 3, 142 − 0, 002 < π = 3, 14... (11.3.148)

(d) Числа Фибоначчи


Пример приложения теории степенных рядов, не упомянуть который нельзя, – способ нахожде-
ния явных формул для последовательностей, заданных рекуррентно. Мы проиллюстрируем его на
последовательности Фибоначчи, описанной нами в примере 4.2.2.


X ∞
X
Напомним, что числа Фибоначчи определя-
= x1 ·s2 + xk−1 · sk + xk−2 · sk =
ются рекуррентными соотношениями (4.2.41): |{z}
k=3 k=3
=

1
x1 = x2 = 1, xn+2 = xn+1 + xn , n ∈ N∗

X
= s2 + (xk−1 + xk−2 ) ·sk =
Предложение 11.3.30. Числа Фибоначчи опи- | {z }
k=3
сываются явно формулой xk

X
" √ !n √ !n # 2
= −s + |s +
{zs} + xk · sk =
1 1+ 5 1− 5
xn = √ − k=3
=

5 2 2
x1 · s1 + x2 · s2
(11.3.149) ∞
X
= −s + xk · sk = −s + F (s)
Доказательство. Рассмотрим производящую k=1
функцию этой последовательности: ⇓

X (s + s2 ) · F (s) = −s + F (s)
F (s) = xn · sn ⇓
n=1
s = (1 − s − s2 ) · F (s)
(суммирование начинается с номера n = 1; это ⇓
можно объяснить, например, так: мы будем счи-
тать, что x0 = 0). Помножив F (s) на многочлен s
F (s) = (11.3.150)
s + s2 , мы получим цепочку: 1 − s − s2
Разложим знаменатель на множители:

X 1 − s − s2 = −(s − a)(s − b)
(s + s2 ) · F (s) = (s + s2 ) · xn · sn =
n=1 где √ √

X ∞
X −1 − 5 −1 + 5
= xn · sn+1 + xn · sn+2 = a= , b=
2 2
n=1 n=1 Заметим попутно, что
| {z } | {z }
замена: n + 1 = k замена: n + 2 = k √ √
∞ ∞
−1 + 5 1 + 5 √
X X b−a= + = 5 (11.3.151)
= xk−1 · sk + xk−2 · sk = 2 2
k=2 k=3
§ 3. Приложения степенных рядов 683
√  
1 2 2 · (1 − 5) s 1 1 1 1
=− √ =− √ √ = = · · s − · = (11.2.75) =
a 1+ 5 (1 + 5) · (1 − 5) b−a a 1− a b 1 − as
√ √ !
1 X  s n 1 X  s n
∞ ∞
2 · (1 − 5) 1− 5 s
=− = (11.3.152) = · · − · =
1−5 2 b−a a n=0 a b n=0 b
∞ ∞
!
√ s X sn X sn
1 2 2 · (1 + 5) = · − =
=− √ =− √ √ = b−a an+1 n=0 bn+1
b 1− 5 (1 − 5) · (1 + 5) n=0
√ √ ∞  
2 · (1 + 5) 1+ 5 1 X 1 1
=− = (11.3.153) = · − ·sn+1 = |n + 1 = k| =
1−5 2 b − a n=0 an+1 bn+1
Тогда X∞  
1 1 1
= · − k · sk =
s 1 b−a ak b
F (s) = = −s · = k=1
1 − s − s2 (s − a)(s − b) = (11.3.151), (11.3.152), (11.3.153) =
| {z }  
раскладываем ∞ √ !k √ !k
1 X 1− 5  k
на простейшие дроби
= √ ·  1+ 5 − ·s
по правилам на с.468
! 5 2 2
1 1   k=1
a−b s
b−a 1 1
= −s· + = · − =
s−a s−b b−a s−b s−a
 
s 1 1 Выделяя коэффициенты перед sk , мы теперь по-
= · − = лучим (11.3.149).
b−a a−s b−s
Глава 12

ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

• Тригонометрическим многочленом называется функция вида

a0 X n πnx o
N
πnx
+ an · cos + bn · sin (12.0.1)
2 n=1
T T

Число T называется полупериодом этого тригонометрического многочлена, числа an и bn


– его коэффициентами, а число N — его степенью.
• Тригонометрическим рядом называется функциональный ряд вида

a0 X n πnx o

πnx
+ an · cos + bn · sin (12.0.2)
2 n=1
T T

Число T называется полупериодом этого тригонометрического ряда, а числа an и bn – его


коэффициентами.
• Частным случаем тригонометрического ряда будет ряд, в котором коэффициенты an и bn
найдены по формулам

1 T
ˆ
a0 = f (x) d x,
T −T
1 T πnx
ˆ
an = f (x) cos d x, (12.0.3)
T −T T
1 T πnx
ˆ
bn = f (x) sin dx
T −T T

где f – некоторая интегрируемая на отрезке [−T, T ] функция. Такой тригонометрический


ряд называется рядом Фурье функции f с полупериодом T . Его коэффициенты (12.0.3)
называются коэффициентами Фурье функции f , а частичные суммы

a0 X n πnx o
N
πnx
SN (x) = + an · cos + bn · sin (12.0.4)
2 n=1
T T

– многочленами Фурье функции f .


В этой главе нас будет интересовать вопрос, какой должна быть функция f , чтобы быть суммой
своего ряда Фурье:
a0 X n πnx o

πnx
f (x) = + an · cos + bn · sin (12.0.5)
2 n=1
T T
Понятно, что первым необходимым условием для этого должна быть интегрируемость функции f
на отрезке [−T, T ] (потому что иначе будет непонятно, что такое ряд Фурье для нее, то есть как
понимать интегралы (12.0.3)). С другой стороны, функции x 7→ cos πnx πnx
T и x 7→ sin T в тригономет-
рическом ряде (12.0.2) имеют период 2T :
πn(x + 2T )  πnx  πnx πn(x + 2T )  πnx  πnx
cos = cos + 2πn = cos , sin = sin + 2πn = sin
T T T T T T

684
§ 1. Сходимость ряда Фурье в среднем квадратичном 685

поэтому, если функция f является суммой своего ряда Фурье (12.0.5), то она тоже должна иметь
период 2T :
f (x + 2T ) = f (x)
Отсюда становится понятно, что предметом изучения для нас должны быть периодические функции
f , интегрируемые на отрезке [−T, T ], где T – период. Всякая такая функция будет интегрируема
не только на отрезке [−T, T ], но и вообще на любом отрезке [a, b] ⊂ R, поэтому нам будет удобно
употреблять для таких функций следующий термин:
• Функция f : R → R называется локально интегрируемой, если она интегрируема на
каждом отрезке [a, b] ⊂ R.

§1 Сходимость ряда Фурье в среднем квадратичном


Изучение рядов Фурье удобно проводить для случая, когда в качестве полупериода T выбрано
число π, потому что тогда формулы (12.0.2) и (12.0.3) упрощаются: тригонометрический ряд (12.0.2)
принимает вид
a0 X n o

+ an cos nx + bn sin nx , (12.1.6)
2 n=1

коэффициенты Фурье (12.0.3) вычисляются по формулам:

1 π 1 π 1 π
ˆ ˆ ˆ
a0 = f (x) d x, an = f (x) cos nx d x, bn = f (x) sin nx d x (12.1.7)
π −π π −π π −π

а многочлены Фурье записываются в виде

a0 X n o
N
SN (x) := + an cos nx + bn sin nx (12.1.8)
2 n=1

(здесь an и bn – коэффициенты Фурье (12.1.7)).


В соответствии с этим мы будем всюду далее до теоремы 12.2.32 рассматривать локально инте-
грируемые 2π-периодические функции (и их ряды Фурье с полупериодом π). Множество всех таких
функций удобно обозначить каким-нибудь символом:
• Символом R(π) мы обозначаем множество всех локально интегрируемых функций с по-
лупериодом π на R.

(a) Основная теорема


• Пусть f ∈ R(π), то есть f – локально интегрируемая функция с полупериодом π на R.
Поскольку f интегрируема на отрезке [−π, π], по свойству 80 на с.492 ее квадрат f 2 = |f |2
тоже интегрируем на отрезке [−π, π]. Значит, определено число
s ˆ
1 π
kf k = |f (x)|2 d x (12.1.9)
π −π

Оно называется среднеквадратичной нормой функции f в пространстве R(π). Слово “нор-


ма” употребляется применительно к этой величине потому, что, как мы убедимся ниже
на с.687, отображение f 7→ kf k обладает свойствами 1◦ -3◦ равномерной нормы, упоминав-
шимися на с 597 (правда, без условия kf k = 0 ⇔ f = 0).
Весь этот параграф посвящен доказательству следующего фундаментального факта:
Теорема 12.1.1 (о сходимости ряда Фурье в среднем квадратичном). Всякая локально интегриру-
емая 2π-периодическая функция f на прямой R единственным образом представима в виде суммы
в среднем квадратичном тригонометрического ряда с полупериодом π

a0 X n o

f (x) = + an cos nx + bn sin nx , (12.1.10)
2 n=1

и таким рядом будет ряд Фурье с полупериодом π функции f .


686 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

! 12.1.2. Эти слова следует понимать, как выполнение двух утверждений:


(i) если an и bn – коэффициенты Фурье (12.1.7) функции f , а SN – ее многочлены Фурье
(12.1.8), то справедливо соотношение
s ˆ
1 π
kf − SN k = |f (x) − SN (x)|2 d x −→ 0 (12.1.11)
π −π N →∞

(именно так интерпретируется в теореме 12.1.1 равенство (12.1.10)), и


(ii) если an и bn – две последовательности чисел, а SN – частичные суммы соответствующего
им тригонометрического ряда (12.1.6), то из соотношения (12.1.11) следует, что числа an и
bn являются коэффициентами Фурье (12.1.7) функции f (а SN – ее многочленами Фурье
(12.1.8)).
Неподготовленному читателю формулировка теоремы 12.1.1, несомненно, покажется обескура-
живающей, потому что из сказанного до сих пор должно быть непонятно, отчего разложение функ-
ции f в ряд Фурье (12.1.10) следует понимать в таком экзотическом смысле (а не, например, как
поточечную или равномерную сходимость, к которым мы привыкли в главе 10). Объяснение заклю-
чается в том, что теорема 12.1.1 встретилась нам сразу как готовое утверждение, при том, что в
математике она появилась в результате длительного процесса осмысления и привыкания к накап-
ливающимся фактам. Дисциплина, которая занимется этими вопросами, называется гармонический
анализ. В ней давно было замечено, что квадратичная норма (12.1.9) чудесным образом упрощает
формулировки и доказательства, и, если в этой науке и есть результат, который можно признать
центральным, то им будет как раз теорема о разложении функции в ряд Фурье в смысле среднего
квадратичного (а не поточечно или в каком-нибудь другом смысле). Именно поэтому мы начинаем
изложение теории рядов Фурье с теоремы 12.1.1. Оставшаяся часть этого параграфа посвящена ее
доказательству.

Скалярное произведение функций. Оригинальная идея, приведшая к теореме 12.1.1, заклю-


чается в том, чтобы посмотреть на функции из R(π) с несколько неожиданной точки зрения: как
на векторы в пространстве со скалярным произведением.
• Пусть f, g ∈ R(π), то есть f и g – две локально интегрируемые 2π-периодические функции.
Поскольку они интегрируемы на отрезке [−π, π], их произведение f · g тоже будет инте-
грируемо на [−π, π] в силу свойства 90 на с.492. Поэтому можно рассмотреть величину

1 π
ˆ
hf, gi = f (x) · g(x) d x (12.1.12)
π −π
Она называется скалярным произведением функций f и g. Перечислим некоторые

Свойства скалярного произведения

10 . Положительная полуопределенность:

hf, f i > 0
20 . Симметричность:
hf, gi = hg, f i
30 . Билинейность:
hα · f + β · g, hi = α · hf, hi + β · hg, hi

Доказательство. Эти свойства очевидны, например, третье следует из линейности интеграла:

1 π n o 1 π n o
ˆ ˆ
hα · f + β · g, hi = α · f (x) + β · g(x) · h(x) d x = α · f (x) · h(x) + β · g(x) · h(x) d x =
π −π π −π
ˆ π
1 1 π
ˆ
=α· f (x) · h(x) d x + β · g(x) · h(x) d x = α · hf, hi + β · hg, hi
π −π π −π
§ 1. Сходимость ряда Фурье в среднем квадратичном 687

Еще одно свойство скалярного произведения – формула, связывающая его со среднеквадратич-


ной нормой (12.1.9):
s ˆ
1 π p
kf k = |f (x)|2 d x = hf, f i (12.1.13)
π −π

Теорема 12.1.3 (неравенство Коши-Шварца для функций). Для любых функций f, g ∈ R(π) спра-
ведливо следующее неравенство, называемое неравенством Коши-Шварца:

hf, gi 6 kf k · kgk (12.1.14)

Доказательство. Зафиксируем f и g и рассмотрим многочлен второй степени:


2 2
p(t) = hf + tg, f + tgi = hf, f i + 2thf, gi + t2 hg, gi = kf k + 2thf, gi + t2 kgk

Поскольку hf + tg, f + tgi > 0, этот многочлен должен при любом значении t быть неотрицателен:
2 2
p(t) = kf k + 2thf, gi + t2 kgk > 0, ∀t ∈ R

Значит, он не может иметь двух вещественных корней, и поэтому его дискриминант должен быть
неположительным:
2 2
D = 4hf, gi2 − 4 kf k · kgk 6 0


2 2
hf, gi2 6 kf k · kgk




hf, gi 6 kf k · kgk

Свойства среднеквадратичной нормы:


1◦ . Неотрицательность:
kf k > 0. (12.1.15)
2◦ . Однородность:
kλ · f k = |λ| · kf k , λ∈R (12.1.16)
3◦ . Неравенство треугольника:
kf + gk 6 kf k + kgk . (12.1.17)
4◦ . Тождество параллелограмма:

kf + gk2 + kf − gk2 2 2
= kf k + kgk . (12.1.18)
2
Доказательство. Первые два свойства очевидны, докажем неравенство треугольника (12.1.17):
2 2
kf + gk 6 kf k+kgk ⇐= kf + gk 6 kf k + kgk ⇐= hf, gi 6 |hf, gi| 6 kf k · kgk
| {z } | {z } | {z }
k k ↑
hf + g, f + gi kf k2 + 2 · kf k · kgk + kgk2 неравенство
k k Коши-Шварца (12.1.14)
hf, f i + 2hf, gi + hg, gi hf, f i + 2 · kf k · kgk + hg, gi

Тождество параллелограмма (12.1.18) доказывается прямым вычислением:


2 2 2 2 2 2 2 2
kf + gk + kf − gk kf k + 2hf, gi + kgk + kf k − 2hf, gi + kgk 2 kf k + 2 kgk 2 2
= = = kf k + kgk
2 2 2
688 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Теорема 12.1.4 (о непрерывности скалярного произведения). Если функции fn ∈ R(π) стремятся


к функции f ∈ R(π) в смысле среднеквадратичной нормы,

kf − fn k −→ 0,
n→∞

то для любой функции g ∈ R(π)


hfn , gi −→ hf, gi
n→∞

Доказательство.

hf, gi − hfn , gi = hf − fn , gi 6 (12.1.14) 6 kf − fn k · kgk −→ 0
n→∞

Ортогональность тригонометрической системы и связь скалярного произведения с ко-


эффициентами Фурье.
• Говорят, что функции f и g из R(π) ортогональны, если их скалярное произведение равно
нулю:
hf, gi = 0
• Последовательность функций fn ∈ R(π) называется ортогональной системой, если в ней
любые две функции ортогональны:

∀i 6= j hfi , fj i = 0

• Обозначим символами cosn и sinn функции

cosn (x) = cos nx, sinn (x) = sin nx (12.1.19)

и условимся символом 1 обозначать не только число 1, но и функцию, тождественно


равную единице:
1(x) = 1, x ∈ R (12.1.20)
Функции 1, cosn , sinn называются тригонометрической системой.
Лемма 12.1.5. Справедливы следующие формулы, означающие, что тригонометрическая систе-
ма функций ортогональна:

h1, 1i = 2, h1, cosn i = 0, h1, sinn i = 0, (12.1.21)


   
0, n 6= m 0, n 6= m
hcosn , sinm i = 0, hcosn , cosm i = , hsinn , sinm i = (12.1.22)
1, n=m 1, n=m

Доказательство. Это проверяется прямым вычислением с помощью тригонометрических формул,


которые мы выводили в § 1 главы 5. Например, для произведения синусов при n 6= m мы получим:
π π
1 1
ˆ ˆ
hsinn , sinm i = sin nx · sin mx d x = (5.1.83) = {cos(n − m)x − cos(n + m)x} d x =
π −π 2π −π
sin(n − m)x x=π sin(n + m)x x=π
= − =0
2π(n − m) x=−π 2π(n + m) x=−π
А при n = m получаем
π π
1 1 2π
ˆ ˆ
hsinn , sinn i = sin nx · sin nx d x = (5.1.74) = {1 − cos 2nx} d x = =1
π −π 2π −π 2π

Лемма 12.1.6. Пусть


a0 X n o
N
P = + an · cosn +bn · sinn
2 n=1

— тригонометрический многочлен степени N ∈ N. Тогда для всякого числа k 6 N

hP, 1i = a0 , hP, cosk i = ak , hP, sink i = bk (N > k). (12.1.23)


§ 1. Сходимость ряда Фурье в среднем квадратичном 689

Доказательство. Эти равенства доказываются прямым подсчетом с применением формул (12.1.21)—


(12.1.22). Например, второе доказывается так (здесь важно, что N > k):
* +
a0 X n o
N
hPN , cosk i = + an · cosn +bn · sinn , cosk =
2 n=1
N n
X o
a0
= · h1, cosk i + an · hcosn , cosk i +bn · hsinn , cosk i = ak .
2 | {z } n=1 | {z } | {z }
k (12.1.21) ( k (12.1.22) k (12.1.22)
0 0, если n 6= k 0
1, если n = k

Лемма 12.1.7. Коэффициенты ряда Фурье произвольной функции f ∈ R(π) связаны со скалярным
произведением следующими формулами:
D E D E D E
a0 = f, 1 , ak = f, cosk , bk = f, sink (12.1.24)

Доказательство. Эти формулы проверяются простым вычислением. Например,

1 π 1 π
ˆ ˆ
hf, cosk i = (12.1.12) = f (x) · cosk (x) d x = f (x) · cos kx d x = ak .
π −π π −π

Лемма 12.1.8. Многочлены Фурье произвольной функции f ∈ R(π)

XN n o
a0
SN = ·1+ an · cosn +bn · sinn (12.1.25)
2 n=1

имеют те же коэффициенты Фурье порядка не больше N , что и функция f :


D E D E
SN , 1 = a0 = f, 1 ,
D E D E
SN , cosk = ak = f, cosk , k6N (12.1.26)
D E D E
SN , sink = bk = f, sink , k6N

Доказательство. Действительно,
* N
+ N
a0 X  a0
X 


hSN , 1i = ·1+ an cosn +bn sinn , 1 = · 1, 1 + an · cosn , 1 + bn · sinn , 1 =
2 n=1
2 n=1
XN
a0 
= (12.1.21) = ·2+ an · 0 + b n · 0 = a0
2 n=1

Аналогично, если k 6 N , то
* N
+
a0 X 
hSN , cosk i = ·1+ an cosn +bn sinn , cosk =
2 n=1
N
a0
X 


= · 1, cosk + an · cosn , cosk + bn · sinn , cosk =
2 n=1
XN  
a0  0, если n 6= k
= (12.1.21), (12.1.22) = ·0+ an · + b n · 0 = ak
2 1, если n = k
n=1

Точно также доказывается последняя формула из (12.1.26).


690 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Минимальное свойство многочленов Фурье.


• Если f, g ∈ R(π), то расстоянием от f до g называется величина
kf − gk
Напомним, что тригонометрические многочлены были определены выше формулой (12.0.1).
Здесь мы рассмотрим тригонометрические многочлены P ∈ R(π) (то есть с полупериодом π) и
с заданной фиксированной степенью N :

λ0 X n o
N
P = + λn · cos nx + µn · sin nx , λn , µn ∈ R.
2 n=1

Лемма 12.1.9. Среди всевозможных тригонометрических многочленов P ∈ R(π) степени N


самым близким к функции f ∈ R(π) по среднеквадратичной
r норме является ее многочлен Фурье
P n o
a20
SN степени N , расстояние до которого равно hf, f i − 2 − N 2 2
n=1 an + bn :

v
u
a2 X n 2 o
u N
min kf − P k = kf − SN k = thf, f i − 0 − an + b2n (12.1.27)
P 2 n=1

(an и bn – коэффициенты Фурье (12.1.24)).


Доказательство. Зафиксируем f и обозначим

λ0 X n o a0 X n o
N N
P = + λn cosn +µn sinn , SN = + an cosn +bn sinn
2 n=1
2 n=1

– здесь числа an и bn вычисляются по формулам (12.1.24), поэтому их мы считаем фиксированными,


а числа λn и µn , наоборот, могут меняться. Тогда:
* +
λ0 X n o λ0 X n o
N N
2
kf − P k = hf −P, f −P i = f − − λn cosn +µn sinn , f − − λn cosn +µn sinn =
2 n=1
2 n=1
  *X N n o X N n o
+
λ0 λ0
= hf, f i + , + λn cosn +µn sinn , λn cosn +µn sinn −
2 2
| {z } | n=1
{z
n=1
}
k k
λ2 PN n o
0 · h1, 1i
4 n=1 λ2n · hcosn , cosn i + µ2n · hsinn , sinn i
  * N + * +
λ0 Xn o λ0 X n
N o
− 2 · f, −2 · f, λn cosn +µn sinn −2 · , λn cosn +µn sinn =
2 2 n=1
| {z } |
n=1
{z } | {z }
k k k
λ0 · hf, 1i PN n o
λn · hf, cosn i + µn · hf, sinn i 0
n=1

XN n o XN n o
λ20
= hf, f i+ ·h1, 1i+ λ2n ·hcosn , cosn i+µ2n ·hsinn , sinn i −λ0 · hf, 1i −2· λn · hf, cosn i +µn · hf, sinn i =
4 | {z } | {z } | {z }
n=1 n=1
(12.1.26) k (12.1.26) k (12.1.26) k
a0 an bn

λ20 X n 2 o
N XN n o
= hf, f i + + λn + µ2n − λ0 · a0 − 2 · λn · an + µn · bn =
2 n=1 n=1

a2 X  2  X
N N   a2 X N n o
λ20
= hf, f i+ − λ0 · a0 + 0 + λn − 2 · λn · an + a2n + µ2n − 2 · µn · bn + b2n − 0 − a2n +b2n =
|2 {z 2} n=1 | {z } n=1 | {z } 2 n=1
k k k
(λ0 −a0 )2 (λn − an )2 (µn − bn )2
2

a2 X n 2 o
N N N
(λ0 − a0 )2 X X
= hf, f i + + (λn − an )2 + (µn − bn )2 − 0 − an + b2n >
2 n=1 n=1
2 n=1
| {z }
достигает минимума при λn = an , µn = bn
то есть при P = SN
§ 1. Сходимость ряда Фурье в среднем квадратичном 691

a20 X n 2
N o

> hf, f i − − an + b2n = kf − P k2 = kf − SN k2
2 n=1
P =SN

Полнота тригонометрической системы.

Лемма 12.1.10. Для всякой функции f ∈ R(π) и любого ε > 0 найдется тригонометрический
многочлен P , расстояние от которого до f меньше ε:

kf − P k < ε (12.1.28)

Доказательство. Обозначим
M= sup |f (x)|
x∈[−π,π]

Воспользуемся сначала теоремой 10.2.2, и подберем непрерывную функцию g на [−π, π] так, чтобы
выполнялись условия:
π
π · ε2
ˆ
|f (x) − g(x)| d x < , sup |g(x)| 6 M, g(−π) = g(π)
−π 8M x∈[−π,π]

Тогда

π π
1 1
ˆ ˆ
2
kf − gk = |f (x) − g(x)|2 d x = |f (x) − g(x)| ·|f (x) − g(x)| d x 6
π −π π −π | {z }
>

|f (x)| + |g(x)|
>

2M
π
2M 2M π · ε2 ε2
ˆ
6 |f (x) − g(x)| d x < · =
π −π π 8M 4


ε
kf − gk <
2
Далее заметим, что поскольку функция g непрерывна на [−π, π] и принимает одинаковые значения
на концах этого отрезка, ее можно продолжить до непрерывной 2π-периодической функции на всю
прямую R. Тогда воспользовавшись теоремой 10.2.15 мы сможем подобрать тригонометрический
многочлен P так, чтобы
ε
sup |g(x) − P (x)| < √
x∈[−π,π] 2 2
Для него мы получим:
π π
1 1 ε2 ε2
ˆ ˆ
2
kg − P k = |g(x) − P (x)|2 d x 6 dx =
π −π | {z } π −π 8 4
>

ε2
8


ε
kg − P k <
2
Вместе получается:
ε ε
kf − P k = k(f − g) + (g − P )k 6 (12.1.17) 6 kf − gk + kg − P k < + =ε
2 2
692 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Неравенство Бесселя.
Лемма 12.1.11. Пусть an и bn – коэффициенты Фурье (12.1.24) функции f ∈ R(π). Тогда числовой
ряд
a20 X n 2 o

+ an + b2n
2 n=1

сходится, причем его сумма не превосходит величины hf, f i:

a20 X n 2 o

1 π
ˆ
+ an + b2n 6 hf, f i = f (x)2 d x (12.1.29)
2 n=1
π −π

Доказательство. 1. Докажем следующую формулу:

a20 X n 2 o
N
hf, SN i = hSN , SN i = + an + b2n (12.1.30)
2 n=1

Действительно, с одной стороны,


* N n
+
a0 X o
hf, SN i = f, ·1+ ak · cosk +bk · sink =
2
k=1

a0 D E Xn D N E D Eo a2 X n 2
No
= · f, 1 + ak · f, cosk + bk · f, sink = (12.1.24) = 0 + an + b2n
2 2 n=1
k=1

А с другой,
* N n
+
a0 X o
hSN , SN i = SN , ·1+ ak · cosk +bk · sink =
2
k=1

a0 D E XN n D E D Eo a2 X n 2 o
N
= · SN , 1 + ak · SN , cosk + bk · SN , sink = (12.1.26) = 0 + an + b2n
2 2 n=1
k=1

2. Обозначим
RN = f − SN
и заметим, что SN и RN ортогональны:
D E
SN , RN =0 (12.1.31)

Действительно,
D E D E D E D E
SN , RN = SN , f − SN = SN , f − SN , SN = (12.1.30) = 0

3. Теперь докажем формулу


D E D E D E
f, f = SN , SN + RN , RN (12.1.32)

Действительно,
D E D E D E D E
f, f = SN + RN , SN + RN = SN + RN , SN + SN + RN , RN =
D E D E D E D E D E D E
= SN , SN + RN , SN + SN , RN + RN , RN = SN , SN + RN , RN
| {z }
k
0
в силу (12.1.31)

4. Из (12.1.32) следует:
D E D E D E D E a2 X n 2
N o
f, f = (12.1.32) = SN , SN + RN , RN > SN , SN + 0 = (12.1.30) = 0 + an + b2n
| {z } 2 n=1
свойство 10
>

0
§ 1. Сходимость ряда Фурье в среднем квадратичном 693

то есть,
a20 X n 2 o D E
N
+ an + b2n 6 f, f (12.1.33)
2 n=1

a20 P∞ n 2 2
o
Это верно при любом N ∈ N, поэтому ряд 2 + n=1 a n + b n сходится. При этом, автоматически
выполняется (12.1.29):
!
a20 X n 2 o a20 X n 2 o
∞ N π
1
ˆ
+ an + b2n = lim + an + b2n 6 (12.1.33) 6 hf, f i = f (x)2 d x
2 n=1
N →∞ 2 n=1
π −π

Равенство Парсеваля.

Лемма 12.1.12. Для всякой функции f ∈ R(π) выполняется следующее равенство, называемое
равенством Парсеваля:

a20 X n 2 o
∞ π
1
ˆ
+ an + b2n = hf, f i = f (x)2 d x (12.1.34)
2 n=1
π −π

(здесь an и bn – коэффициенты Фурье (12.1.24) функции f ).

Доказательство. По лемме 12.1.11, ряд в левой части этой формулы должен сходиться, причем
его сумма, обозначим ее C, не превосходит величины hf, f i:

a20 X n 2 o

+ an + b2n = C 6 hf, f i
2 n=1

Наша задача – убедиться, что C > hf, f i. Зафиксируем ε > 0 и по лемме 12.1.10 подберем тригоно-
метрический многочлен P , для которого выполняется (12.1.28):

kf − P k < ε

Пусть N – степень этого тригонометрического многочлена. Тогда:


2
kf − P k < ε2
| {z }
6

(12.1.27)
kf − SN k2
=

(12.1.27)
a2 PN n o
hf, f i − 0
2 − n=1 a2n + b2n

a20 X n 2 o
N
hf, f i − − an + b2n < ε2
2 n=1

a20 X n 2 o a2 X n 2 o
N ∞
hf, f i < + an + b2n + ε2 6 0 + an + b2n + ε2 = C + ε2
2 n=1
2 n=1

hf, f i < C + ε2

Это верно для любого ε > 0, значит hf, f i 6 C.


694 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Доказательство основной теоремы. Доказательство теоремы 12.1.1 мы теперь можем офор-


мить в виде двух лемм. Первая из них гласит, что если функция f лежит в классе R(π), то ее ряд
Фурье сходится к ней в среднем квадратичном:
Лемма 12.1.13. Для всякой функции f ∈ R(π) выполняется соотношение (12.1.11),
kf − SN k −→ 0,
N →∞

в котором SN – многочлены Фурье (12.1.8) функции f .


Доказательство.
 o
a20 X n 2
N
2 (12.1.27) 2
kf − SN k = hf, f i − + an + b n −→ 0
2 n=1
N →∞
| {z }
N
↓ ↓

a2 P∞ n o
0
2 + n=1 a2n + b2n

=
(12.1.34)
hf, f i

А вторая лемма утверждает, что если какой-то тригонометрический ряд сходится в среднем
квадратичном к некоторой функции f ∈ R(π), то это будет в точности ряд Фурье этой функции:
Лемма 12.1.14. Пусть an и bn – две последовательности чисел и

a0 X n o
N
PN = + an · cosn +bn · sinn
2 n=1

– последовательность частичных сумм соответствующего им тригонометрического ряда с по-


лупериодом π. Если функции PN сходятся в среднем квадратичном к некоторой локально инте-
грируемой 2π-периодической функции f ,
kf − PN k −→ 0, (12.1.35)
N →∞

то числа an и bn являются коэффициентами Фурье (12.1.7) функции f .


Доказательство. Прежде всего вспомним равенства (12.1.23) и перепишем их для наших много-
членов PN :
hPN , 1i = a0 , hPN , cosk i = ak , hPN , sink i = bk (N > k). (12.1.36)
Далее, из (12.1.35) мы получаем, что для всякого k ∈ N∗
теорема 12.1.4
kf − PN k −→ 0 =⇒ hPN , cosk i −→ hf, cosk i =⇒ ak = hf, cosk i
N →∞ | {z } N →∞
k (12.1.36)
ak ,
при N > k

и точно также, заменяя cosk на sink и на 1, мы получаем равенства


bk = hf, sink i, a0 = hf, 1i.

§2 Поточечная и равномерная сходимость ряда Фурье


Теорема 12.1.1 о разложении в ряд Фурье локально интегрируемой 2π-периодической функции f
ничего не говорит о том, будет ли этот ряд сходиться к функции f поточечно, то есть, можно ли
утверждать, что для всякого x ∈ R выполняется соотношение

a0 X n o
N
+ an cos nx + bn sin nx −→ f (x)
2 n=1
N →∞

(где an и bn – коэффициенты Фурье (12.1.7) функции f ). Следующий элементарный пример пока-


зывает, что это не всегда верно.
§ 2. Поточечная и равномерная сходимость ряда Фурье 695

nxo 2π
⋄ 12.2.1. Рассмотрим функцию 1
ˆ
bn = · sin nx d x =
nxo π0 2π
f (x) = 1 2π x
ˆ
2π = · sin nx d x =
x π 0 2π
(взятие дробной части от 2π ). Она локально ин- ˆ 2πn
тегрируема и имеет период 2π. Вычислим ее ко- 1
=− 2 x d cos nx =
эффициенты Фурье: 2π n 0
1 2π 1
ˆ 2π
nxo
1 π
1 2π n x o = − 2 · x · cos nx + 2 cos nx d x =
ˆ ˆ
a0 = dx = dx = 2π n | {z 0 } 2π n 0
π −π 2π π 0 2π

=
1 2π x x2 x=2π
ˆ

= dx = =1 2π
π 0 2π 4π 2 x=0 1 1 1
=− + 2 2 · sin nx = −
πn 2π n | {z 0 } πn
nxo

=

1
ˆ
an = · cos nx d x = 0
π0 2π
1 2π x
ˆ
Ряд Фурье получается такой:
= · cos nx d x =
π 0 2π

1 X 1
ˆ 2π
1
= x d sin nx = − · sin nx
2π 2 n 0 2 n=1 πn
1 2π 1
ˆ 2π

= · x · sin nx − 2 sin nx d x = и в точке x = 0 он сходится не к значению f (0):
2π 2 n | {z 0 } 2π n 0
=

N
0
1 X 1 1
1 2π − · sin 0 −→ 6= 0 = f (0)
2 n=1 πn N →∞ 2
= · cos nx = 0
2π 2 n2 0 | {z = }
0

Уже из этого примера видно, что если мы хотим, чтобы ряд Фурье сходился к функции f
поточечно, то нужно как-то сузить класс изучаемых функций, перейдя от класса R(π) (локально
интегрируемых функций с полупериодом π) к каким-то его подклассам. В этом параграфе мы
рассмотрим два таких подкласса, для которых поточечная сходимость ряда Фурье сохраняется, хотя
и в разных смыслах: это классы кусочно-непрерывных и кусочно-гладких функций с полупериодом
π. Попутно мы сформулируем для них теоремы о равномерной сходимости ряда Фурье.

(a) Кусочно-непрерывные и кусочно-гладкие функции на R


• Функция f на прямой R называется
— кусочно-непрерывной (на R), если она кусочно непрерывна на любом отрезке1 [a, b] ⊂ R;
это означает выполнение двух условий:
(1) на любом отрезке [a, b] она непрерывна во всех точках, кроме, возможно, конечного
набора;
(2) в каждой точке разрыва c ∈ R функция f имеет конечные левый и правый пределы

f (c − 0) = lim f (x), f (c + 0) = lim f (x) (12.2.37)


x→c−0 x→c+0

— кусочно-гладкой (на R), если она кусочно гладкая на любом отрезке2 [a, b] ⊂ R; это
означает выполнение следующих условий:
(1) на любом отрезке [a, b] она дифференцируема во всех точках, кроме, возможно,
конечного набора;
(2) в каждой точке c ∈ R, где f дифференцируема, ее производная непрерывна,

f ′ (c) = lim f ′ (x) (12.2.38)


x→c
1 Напомним, что определение кусочно-непрерывной функции на отрезке было дано выше на с. 515.
2 Определение кусочно-гладкой функции на отрезке приводилось выше на с. 517.
696 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

(3) в каждой точке c ∈ R, где f не дифференцируема, она обладает следующими свой-


ствами:
(i) f имеет конечные левый и правый пределы
f (c − 0) = lim f (x), f (c + 0) = lim f (x) (12.2.39)
x→c−0 x→c+0

(ii) f имеет конечные левую и правую производные

′ f (x) − f (c − 0) ′ f (x) − f (c + 0)
f− (c) = lim , f+ (c) = lim (12.2.40)
x→c−0 x−c x→c+0 x−c
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x) стремится
′ ′
соответственно к f− (c) или f+ (c):

f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (12.2.41)
x→c−0 x→c+0

Из теоремы 8.3.36 следует


Теорема 12.2.2. Любая кусочно-непрерывная функция f на R локально интегрируема.

⊲ 12.2.3. Функция тоже 2π-периодическая и кусочно-гладкая.


f (x) = sgn sin x ⋄ 12.2.5. А функция
имеющая график p
f (x) = | sin x|
y
1 с графиком
x y
−π π 1
−2π 2π
−1
x
− 3π −π − π2 π π 3π
является 2π-периодической и кусочно-гладкой. 2 2 2

⊲ 12.2.4. Функция
хотя и 2π-периодическая, но не кусочно-гладкая,
f (x) = arcsin sin x
потому что в точке x ∈ πZ не имеет односторон-
с графиком них производных.
y

x
− 3π −π − π2 π π 3π
2 2 2

• Говорят, что кусочно-непрерывная функция f на прямой R удовлетворяет тождеству


Лебега, если в каждой точке x ∈ R ее значение f (x) равно среднему арифметическому
левого и правого пределов в этой точке:
f (x − 0) + f (x + 0)
f (x) = , x∈R (12.2.42)
2
Очевидно, это равенство автоматически выполняется в точках непрерывности, так как в
этом случае f (x − 0) = f (x) = f (x + 0), и значит
f (x − 0) + f (x + 0) f (x) + f (x)
= = f (x)
2 2
Поэтому тождество (12.2.42) нужно проверять только в точках разрыва функции f .
§ 2. Поточечная и равномерная сходимость ряда Фурье 697

⋄ 12.2.6. Функция ⋄ 12.2.7. А наоборот, функция


 (

−1, x < 0 −1, x < 0
f (x) = sgn x = 0, x = 0 f (x) =
 1, x > 0

1, x > 0
с графиком
с графиком
y y
1 1
x x

−1 −1

очевидно, удовлетворяет тождеству Лебега. не удовлетворяет тождеству Лебега.

(b) Суммирование ряда Фурье обычным способом


Теорема 12.2.8 (о поточечной и равномерной сходимости ряда Фурье). Для всякой кусочно-
гладкой 2π-периодической функции f на прямой R ее ряд Фурье с полупериодом π сходится в
каждой точке x ∈ R к среднему арифметическому ее левого и правого пределов в этой точке:

a0 X n o

f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R. (12.2.43)
2 2 n=1

В частности, если f удовлетворяет тождеству Лебега (12.2.42), то она является поточечной


суммой своего ряда Фурье:

a0 X n o

f (x) = + an cos nx + bn sin nx , x ∈ R. (12.2.44)
2 n=1

Кроме того,
(i) если f – непрерывная (и по-прежнему, кусочно-гладкая и 2π-периодическая) функция на
R, то ряд (12.2.44) сходится к ней на прямой R равномерно:3

a0 X n
N o

f (x) − − an cos nx + bn sin nx −→ 0; (12.2.45)
2 N →∞
n=1 x∈R

(ii) если f – бесконечно гладкая (и по-прежнему, 2π-периодическая) функция на R, то ряд


(12.2.44) сходится к ней на прямой R равномерно по производным:4

a0 X n
N o (m)

∀m ∈ N f (x) − − an cos nx + bn sin nx −→ 0. (12.2.46)
2 N →∞
n=1 x∈R

Доказательство этого факта мы разобьем на несколько лемм, и посвятим ему оставшуюся часть
этого пункта.

Лемма Римана.

Лемма 12.2.9. Если функция W интегрируема на отрезке [a, b], то


ˆ b ˆ b
W (x) · cos p x d x −→ 0, W (x) · sin p x d x −→ 0 (12.2.47)
a p→+∞ a p→+∞
3 Норма k·kE была определена формулой (10.1.6).
4 Норма (m)
k·kE была определена формулой (10.1.47).
698 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Доказательство. Эти соотношения доказываются одинаково, поэтому мы докажем только второе


(в действительности, только оно используется при доказательстве теоремы 12.2.8).
1. Прежде всего, нужно заметить, что если функция W постоянна, то утверждение будет оче-
видно:
 
C
p · cos p a − cos p b

=
x=b

−C
p · cos px
x=a

=
ˆ ˆ z }| {
b b |C|
=
W (x) · sin px d x = C · sin px d x · cos p a − cos p b 6
a a p
|C|   |C|
6 · | cos p a| + | cos p b| 6 · 2 −→ 0
p p p→+∞

2. Из этого следует, что если функция W кусочно-постоянна,

W (x) = Ci , x ∈ (xi−1 , xi )

то соотношение также верно:


ˆ b k ˆ
X xi
W (x) · sin px d x = Ci · sin px d x −→ 0
a xi−1 p→+∞
i=1

3. Теперь если W – произвольная интегрируемая функция, то для всякого ε > 0 можно по


теореме 10.2.1 выбрать кусочно-постоянную функцию g на [a, b] так, чтобы выполнялось
b
ε
ˆ
|W (x) − g(x)| d x <
a 2
´b
Тогда, по уже доказанному, a
g(x) · cos px d x −→ 0, и значит можно выбрать P так, чтобы
p→+∞
ˆ
b ε

∀p > P g(x) · cos px d x < ,
a 2

В результате, для всякого p > P мы получим:


ˆ ˆ
b b  ˆ b

W (x) · sin px d x = W (x) − g(x) · sin px d x + g(x) · sin px d x 6
a a a
ˆ ˆ
b  b ε ε

6 W (x) − g(x) · sin px d x + g(x) · sin px d x < + = ε
a a 2 2
| {z } | {z }
>

>

´b ε
a
|W (x) − g(x)| · | sin px| d x 2
>

´b
a
|W (x) − g(x)| d x
>

ε
2

Это доказывает второе соотношение в (12.2.47).

Ядро Дирихле.
• Ядром Дирихле называется функция
N
1 X
DN (t) := + cos nt (12.2.48)
2 n=1

Свойства ядра Дирихле:


§ 2. Поточечная и равномерная сходимость ряда Фурье 699

1◦ . Ядро Дирихле DN является четной непрерывной 2π-периодической функцией на R.

DN (−t) = DN (t), DN (t + 2π) = DN (t)

2◦ . Интеграл по периоду от ядра Дирихле равен π:


ˆ π ˆ π
DN (t) d t = 2 DN (t) d t = π (12.2.49)
−π 0

3◦ . Ядро Дирихле удовлетворяет тождеству:



N + 1 , t ∈ 2πZ
2
DN (t) = sin(N + 12 )t (12.2.50)
 t , t∈
/ 2πZ
2 sin 2

Доказательство. Свойство 1◦ вытекает из определения DN формулой (12.2.48), а формула (12.2.49)


доказывается прямым вычислением. Тождество (12.2.50) для точек вида t = 2πk доказывается
вычислением:
N N
1 X 1 X 1
DN (2πk) = + cos(2πnk) = + 1= +N
2 n=1 2 n=1 2

а для точек t 6= 2πk – умножением на 2 sin 2t :

1 N
X  N N      
t t X t t X 1 1
+ cos nt ·2 sin = sin + 2 cos nt·sin = sin + − sin n − t + sin n + t =
2 n=1 2 2 n=1 2 2 n=1 2 2
      
t t 3t 3t 5t 1  1
= sin + − sin + sin + − sin + sin + ... + − sin N − t + sin N + t =
| {z2} | {z 2} | {z2} | {z 2} | {z2} | {z 2 } 2
↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑
 
1
= sin N + t
2

Интегралы Дирихле.

Лемма 12.2.10. Для всякой 2π-периодической локально интегрируемой функции f ее многочлен


Фурье SN с полупериодом π выражается через ядро Дирихле DN формулами

1 π
ˆ
SN (x) = f (x + t) · DN (t) d t, x∈R (12.2.51)
π −π

1
ˆ π n o
SN (x) = f (x + t) + f (x − t) · DN (t) d t, x∈R (12.2.52)
π 0

• Интегралы в правых частях формул (12.2.51) и (12.2.52) называются интегралами Дири-


хле.

Доказательство. Сначала (12.2.51):

a0 X n o
N
SN (x) = + ak cos kx + bk sin kx = (12.1.7) =
2
k=1
ˆ π XN  
1 1 1 π 1 π
ˆ ˆ
= · f (y) d y + cos kx f (y) cos ky d y + sin kx f (y) sin ky d y =
2 π −π π −π π −π
k=1
( N
) ( N
)
1 π 1 X 1 π 1 X
ˆ ˆ
= f (y) + cos kx · cos ky + sin kx · sin ky d y = f (y) + cos k(y − x) d y =
π −π 2 π −π 2
k=1 k=1

1 π y − x = t, y = x + t, d y = d t 1 π−x
ˆ ˆ
= f (y) · D(y − x) d y = = f (x + t) · D(t) d t =
π −π y ∈ [−π, π] ⇔ t ∈ [−π − x, π − x] π −π−x
700 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
  π
интеграл от периодической 1
ˆ
= функции по периоду равен = f (x + t) · DN (t) d t
интегралу по “сдвинутому периоду” π −π

После этого (12.2.51) следует (12.2.52):

1 π 1 0 1 π
ˆ ˆ ˆ
SN (x) = f (x + t) · DN (t) d t = f (x + t) · DN (t) d t + f (x + t) · DN (t) d t =
π −π π −π π 0
 
в первом интеграле 1 0 1 π
ˆ ˆ
= делаем замену =− f (x − s) · DN (−s) d s + f (x + t) · DN (t) d t =
t = −s π π π 0
 
вспоминием, что DN 1 0 1 π
ˆ ˆ
= – четная функция: = − f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
DN (−s) = DN (s) π π π 0
 
в первом интеграле 1 π 1 π
ˆ ˆ
= переворачиваем = f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
пределы интегрирования π 0 π 0
 
в первом интеграле 1 π 1 π
ˆ ˆ
= делаем замену = f (x − t) · DN (t) d t + f (x + t) · DN (t) d t =
s=t π 0 π 0
1 πn o
ˆ
= f (x + t) + f (x − t) · DN (t) d t
π 0

Поточечная сходимость ряда Фурье. Мы можем теперь доказать ту часть теоремы 12.2.8, где
речь идет о поточечной сходимости:

Лемма 12.2.11. Для всякой кусочно-гладкой 2π-периодической функции f на прямой R ее ряд


Фурье с полупериодом π сходится в каждой точке x ∈ R к среднему арифметическому ее левого
и правого пределов в этой точке:

a0 X n o

f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R.
2 2 n=1

Доказательство. Пусть f – кусочно-гладкая 2π-периодическая функция. Рассмотрим функции


 f (x+t)−f (x+0)   f (x−t)−f (x−0) 
, t ∈ (0, π] −t , t ∈ (0, π]
A(t) = t
′ , B(t) = ′
f+ (0), t = 0 f− (0), t = 0

Они должны быть кусочно-непрерывны на отрезке [0, π], потому что в точке t = 0 они непрерывны,
а при t ∈ (0, π] они получаются умножением кусочно-непрерывных функций g(t) = f (x+t)−f (x+0)
и h(t) = f (x − t) − f (x − 0) на непрерывную функцию 1t .
Кроме того, если рассмотреть функцию
( )
t
2 sin 2t t ∈ (0, π]
C(t) =
1, t = 0

то она будет непрерывна на отрезке [0, π].


Из этого можно сделать вывод, что функция
n o
W (t) = A(t) − B(t) · C(t)

кусочно-непрерывна на отрезке [0, π].


f (x+0)+f (x−0)
Теперь рассмотрим разность между 2 и частичной суммой SN (x) ряда Фурье:

f (x + 0) + f (x − 0)
SN (x) − =
ˆ π n2 o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · DN (t) d t − · DN (t) d t =
π 0 2 π 0
| {z } | {z }
=

(12.2.52) (12.2.49)
SN (x) 1
§ 2. Поточечная и равномерная сходимость ряда Фурье 701

1
ˆn π o 1 πn
ˆ o
= f (x + t) + f (x − t) · DN (t) d t − f (x + 0) + f (x − 0) · DN (t) d t =
π 0 π 0
ˆ πn o
1
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · DN (t) d t =
π
ˆ 0
1 π nh i h io
= f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · DN (t) d t =
π 0
1 π nh
ˆ i h io sin N + 1  t
2
= (12.2.50) = f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · dt =
π 0 2 sin 2t
ˆ    
1 π f (x + t) − f (x + 0) f (x − t) − f (x − 0) t 1
= − · · sin N + t dt =
π 0 | t
{z } | −t
{z } 2 sin 2t 2
| {z }
=

=
A(t) B(t) C(t)
| {z }

=
W (t)
π  
1 1
ˆ
= W (t) · sin N + t d t −→ 0
π 0 2 N →∞

Мы получили нужное соотношение:


f (x + 0) + f (x − 0)
SN (x) −→
N →∞ 2

Дифференцирование ряда Фурье. Если f – непрерывная кусочно-гладкая 2π-периодическая


функция на R, то ее производная f ′ может быть определена не всюду на R (потому что в некоторых
точках на R функция f может быть недифференцируема). Тем не менее, как мы помним, по теореме
8.3.39, будут однозначно определены интегралы вида
ˆ π ˆ π
g(x) · f ′ (x) d x = g(x) d f (x)
−π −π

где g – произвольная кусочно-непрерывная функция. В частности, поэтому для f ′ можно опреде-


лить коэффициенты ряда Фурье:
1 π ′ 1 π ′ 1 π ′
ˆ ˆ ˆ
α0 = f (x) d x, αn = f (x) · cos nx d x, βn = f (x) · sin nx d x, (12.2.53)
π −π π −π π −π

Таким образом, f ′ тоже порождает какой-то ряд Фурье (с коэффициентами αn , βn ). Оказывается,


что ряд Фурье для f ′ получается из ряда Фурье для f почленным дифференцированием. Вот как
точно выглядит это утверждение:
Лемма 12.2.12. Пусть f – непрерывная кусочно-гладкая 2π-периодическая функция на R. Тогда
коэффициенты Фурье (12.2.53) производной f ′ связаны с коэффициентами Фурье (12.1.7) функции
f формулами
α0 = 0, αn = n · bn , βn = −n · an , n ∈ N∗ (12.2.54)
! 12.2.13. Объясним, почему это интерпретируется, как возможность почленно дифференцировать
ряд Фурье. Обозначим символами SN [f ] и SN [f ′ ] соответственно частичные суммы рядов Фурье
функций f и f ′

a0 X n o α0 X n o
N N

SN [f ](x) = + an cos nx + bn sin nx , SN [f ](x) = + αn cos nx + βn sin nx
2 n=1
2 n=1

Тогда из леммы 12.2.12 следует, что SN [f ′ ] получается из SN [f ] дифференцированием:


 ′
SN [f ′ ] = SN [f ] (12.2.55)

Действительно,
702 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
!
 ′ a0 X n
N o ′ X N n o
SN [f ] (x) = + an cos nx + bn sin nx = − n · an sin nx + n · bn cos nx =
2 n=1 n=1
XN n o α XN n o
α0 0
= (12.2.54) = + βn sin nx + αn cos nx = + αn cos nx + βn sin nx = SN [f ′ ](x)
2
|{z} n=1
2 n=1

=
0

Доказательство. Для α0 мы используем формулу (8.3.183):


1 π ′
ˆ
1 π
ˆ
1 x=π

α0 = f (x) d x = d f (x) = (8.3.183) = · f (x)
π −π π −π π x=−π

А для αn и βn это доказывается интегрированием по частям (с применением теоремы 8.3.42):


π π
1 1
ˆ ˆ
αn = f ′ (x) · cos nx d x = cos nx d f (x) = (8.3.184) =
π −π π −π
1 x=π
1 π
ˆ
1 π
ˆ

= · cos nx · f (x) − f (x) d cos nx = n · f (x) · sin nx d x = n · bn
π x=−π π −π π −π
| {z }
=

0,
потому что cosn и f –
2π-периодические
функции

и
π
1 1 π
ˆ ˆ

βn = f (x) · sin nx d x = sin nx d f (x) = (8.3.184) =
π −π π −π
1 x=π 1 π
ˆ
1 π
ˆ

= · sin nx · f (x) − f (x) d sin nx = −n · f (x) · cos nx d x = −n · an
π x=−π π −π π −π
| {z }
=

0,
потому что sinn и f –
2π-периодические
функции

Равномерная сходимость ряда Фурье непрерывной кусочно-гладкой функции. Теперь


мы можем доказать часть (i) теоремы 12.2.8, то есть следующее утверждение:
Лемма 12.2.14. Непрерывная кусочно-гладкая 2π-периодическая функция f является равномерной
суммой своего ряда Фурье (12.2.44).
Доказательство. Заметим, что, поскольку функция f ′ интегрируема на [−π, π], по лемме 12.1.11,
ряд из квадратов ее коэффициентов Фурье должен сходиться:
∞ n
X o
α2n + βn2 < ∞
n=1

Отсюда следует такая цепочка:


2 
1 2
0 6 |βn | − n1 = βn2 − 2|βnn | + 1
n2 0 6 |αn | − n = α2n − 2|αnn | + 1
n2
⇓ ⇓
2|βn | 2|αn |
n 6 βn2 + n12 n 6 α2n + n12
⇓ ⇓
 
|an | = |βnn | 6 12 · βn2 + n12 |bn | = |αn |
n 6 21 · α2n + n12
| {z }

∞ n
X o ∞ n
X o X ∞
1 1
|an | + |bn | 6 · α2n + βn2 + <∞
n=1
2 n=1 n=1
n2
§ 2. Поточечная и равномерная сходимость ряда Фурье 703



X ∞ n
X o ∞ n
X o
kan cos nx + bn sin nxkx∈R 6 kan cos nxkx∈R + kbn sin nxkx∈R = |an | + |bn | < ∞
n=1 n=1 n=1

⇓ теорема Вейерштрасса 10.1.33

∞ n
X o
ряд an cos nx + bn sin nx сходится равномерно на R
n=1

Мы получили, что ряд Фурье функции f сходится равномерно к некоторой функции S. Но с другой
стороны, по лемме 12.2.11 этот ряд должен поточечно сходиться к функции f . Значит, S = f , и ряд
Фурье этой функции сходится к ней равномерно.

Равномерная по производным сходимость ряда Фурье непрерывной кусочно-гладкой


функции. Теперь мы можем доказать часть (ii) теоремы 12.2.8, то есть следующее утверждение:

Лемма 12.2.15. Бесконечно гладкая 2π-периодическая функция f является равномерной по про-


изводным суммой своего ряда Фурье (12.2.44).

Доказательство. Для всякого k ∈ N рассмотрим производную f (k) порядка k функции f , и пусть


SN [f (k) ] обозначает многочлен Фурье функции f (k) :

(k) XN n o
a0
SN [f (k) ](x) = + a(k) (k)
n cos nx + bn sin nx ,
2 n=1

π π π
1 1 1
ˆ ˆ ˆ
(k) (k)
α0 = f (x) d x, αn(k) = f (k)
(x) · cos nx d x, βn(k) = f (k) (x) · sin nx d x.
π −π π −π π −π

Формула (12.2.55), применительно к функции f (k) , означает, что SN [f (k+1) ] получается из SN [f (k) ]
дифференцированием:
 ′
SN [f (k+1) ] = SN [f (k) ]

Отсюда по индукции можно заключить, что SN [f (k) ] есть просто производная порядка k из SN [f ]
(частичной суммы ряда Фурье исходной функции f ):
 (k)
SN [f (k) ] = SN [f ] (12.2.56)

Теперь заметим, что каждая функция f (k) является гладкой и 2π-периодической, поэтому по лемме
12.2.14 ее ряд Фурье должен сходиться к ней равномерно на R, то есть

(k)
f − SN [f (k) ] −→ 0
R N →∞

В силу (12.2.56) это можно интерпретировать, как равномерное стремление к нулю производной
порядка k от разности f − SN [f ]:
 (k)  (k)

f − SN [f ] = f (k) − SN [f ] = (12.2.56) =
f (k) − SN [f (k) ] −→ 0
R N →∞
R R

Отсюда для всякого m ∈ N получаем нужное нам соотношение:

(k) m  (k)
X 1
f − SN [f ] = (10.1.47) =
· f − SN [f ] −→ 0
R k! N →∞
k=0 R
704 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

(c) Суммирование ряда Фурье методом арифметических средних


Если 2π-периодическая функция f не является кусочно-гладкой, а, скажем, только кусочно-непре-
рывной и удовлетворяющей тождеству Лебега (12.2.42), то из теоремы 12.2.8 не следует, что она
должна быть поточечной суммой своего ряда Фурье. Это не случайно: как оказывается, существу-
ют такие кусочно-непрерывные, и даже непрерывные, функции, у которых ряд Фурье не сходится
в некоторых точках. Несмотря на это, кусочно-непрерывную 2π-периодическую функцию f , удо-
влетворяющую тождеству Лебега, всегда можно считать поточечной суммой своего ряда Фурье, но
в несколько неожиданном смысле: для этого нужно f понимать как предел не многочленов Фу-
рье SN , а их арифметических средних. Это оригинальное наблюдение принадлежит венгерскому
математику Липоту Фейеру, и в этом пункте мы поговорим о его результатах.
• Пусть SN – частичные суммы ряда Фурье с полупериодом π для функции f :

a0 X n o
N
SN (x) = + an cos nx + bn sin nx
2 n=1

(коэффициенты вычисляются по формулам (12.1.7)). Арифметические средние этой по-


следовательности, то есть функции
N −1
1 X
σN (x) = Sn (x) (12.2.57)
N n=0

называются многочленами Фейера функции f .


Теорема 12.2.16 (Фейер). Для всякой кусочно-непрерывной 2π-периодической функции f на пря-
мой R ее многочлены Фейера σN сходятся в каждой точке x ∈ R к среднему арифметическому ее
левого и правого пределов в этой точке:
f (x − 0) + f (x + 0)
= lim σN (x), x ∈ R. (12.2.58)
2 N →∞

В частности, если f удовлетворяет тождеству Лебега (12.2.42), то она является поточечным


пределом своей последовательности многочленов Фейера:
f (x) = lim σN (x), x ∈ R. (12.2.59)
N →∞

Кроме того,
(i) если f – непрерывная (и, по-прежнему, 2π-периодическая) функция на R, то то много-
члены Фейера сходятся к ней на прямой R равномерно:5
kf (x) − σN (x)kx∈R −→ 0; (12.2.60)
N →∞

(ii) если f – бесконечно гладкая (и по-прежнему, 2π-периодическая) функция на R, то мно-


гочлены Фейера сходятся к ней на прямой R равномерно по производным:6
(m)
∀m ∈ N kf (x) − σN (x)kx∈R −→ 0. (12.2.61)
N →∞

Как и в случае с теоремой 12.2.8, доказательство этого факта мы разобьем на несколько лемм.

Ядро Фейера.
• Ядром Фейера называется арифметическое среднее ядер Дирихле
N −1 N −1 n
!
1 X 1 X 1 X
ΦN (t) = Dn (x) = + cos kt (12.2.62)
N n=0 N n=0 2
k=1

Эта функция обладает свойствами, похожими на свойства ядра Дирихле, но главная разница
заключается в том, что ядро Фейера оказывается неотрицательной функцией (что оказывается
очень полезно для дальнейших выводов).

Свойства ядра Фейера:


5 Норма k·kE была определена формулой (10.1.6).
6 Норма (m)
k·kE была определена формулой (10.1.47).
§ 2. Поточечная и равномерная сходимость ряда Фурье 705

1◦ . Ядро Фейера ΦN является непрерывной, четной, 2π-периодической и неотрицательной


функцией на R:
 
ΦN (−t) = ΦN (t), ΦN (t + 2π) = ΦN (t), ΦN (t) > 0 t∈R

2◦ . Интеграл по периоду от ядра Фейера равен π:


ˆ π ˆ π
ΦN (t) d t = 2 ΦN (t) d t = π (12.2.63)
−π 0

3◦ . Ядро Фейера удовлетворяет тождеству:


(N
2, t ∈ 2πZ
ΦN (t) = sin2 N2 t
(12.2.64)
2N ·sin2 2t
, t∈
/ 2πZ

4◦ . Для всякого δ > 0 равномерная норма функции Φ на отрезке [δ, π] стремится к нулю
при N → ∞:
kΦN (t)kt∈[δ,π] = max ΦN (t) −→ 0 (12.2.65)
t∈[δ,π] N →∞

◦ ◦
Доказательство. Свойства 1 и 2 вытекают сразу же из свойств ядра Дирихле на с.698, за исклю-
чением неотрицательности ΦN , которая, в свою очередь, является следствием тождества (12.2.64).
Поэтому для доказательства 1◦ , 2◦ и 3◦ достаточно проверить (12.2.64). Для точек t = 2πk мы
получаем:
N −1 N −1   N −1
1 X 1 X 1 1 X N N −1 1 N
ΦN (2πk) = Dn (2πk) = n+ = n + = + =
N n=0 | {z } N n=0 2 N n=1
2N 2 2 2
| {z }
=

(12.2.50)
1
n+ 2
= (3.2.114)
(N −1)·N
2

А для t 6= 2πk получаем:

N −1 N −1  
t 1 X t X 1 t
ΦN (t) · 2N sin2 = Dn (x) ·2N sin2 =2 sin n + t · sin =
2 N n=0 | {z } 2 n=0 |
2 2
{z }
=

 
(12.2.50)
=

sin n+ 1 t  (5.1.83) 
2
t 1
2 sin
2 2 cos nt − cos(n + 1)t

N
X −1        
= cos nt − cos(n + 1)t = cos 0 − cos
| {z } |{z} t + cos t − cos
|{z} | {z } 2t + ... + cos(N − 1)t − cos N t =
| {z }
n=0 ↑ ↑ ↑ ↑ ↑
=


1

N +1
= 1 − cos N t = (5.1.74) = sin2 t
2
Поделив это на 2N sin2 2t , мы получим нижнюю строчку в (12.2.64).
После того, как (12.2.64) доказано, свойство (12.2.65) становится его следствием:

sin2 N t maxt∈[δ,π] sin2 N2 t 1
2
kΦN (t)kt∈[δ,π] = max ΦN (t) = max 2 6 2 t = −→ 0
t∈[δ,π] t∈[δ,π] 2N · sin t
2
2N · min t∈[δ,π] sin 2 2N · sin2 δ N →∞
2

Интеграл Фейера.
Лемма 12.2.17. Для всякой 2π-периодической локально интегрируемой функции f ее многочлен
Фейера σN выражается через ядро Фейера ΦN формулами
1 π
ˆ
σN (x) = f (x + t) · ΦN (t) d t, x∈R (12.2.66)
π −π

1
ˆ π n o
σN (x) = f (x + t) + f (x − t) · ΦN (t) d t, x∈R (12.2.67)
π 0
706 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

• Интегралы справа в формулах (12.2.66) и (12.2.67) называются интегралами Фейера.

Доказательство. Это следует из формул для интеграла Дирихле (12.2.51) и (12.2.52): во-первых,

Sn (x)

=
(12.2.51)
N −1 N −1
z ˆ }| {
1 X 1 X 1 π
σN (x) = Sn (x) = f (x + t) · Dn (t) d t =
N n=0 N n=0 π −π
N −1
1 π 1 X 1 π
ˆ ˆ
= f (x + t) · Dn (t) d t = f (x + t) · ΦN (t) d t,
π −π N n=0 π −π
| {z }

=
(12.2.62)
ΦN (t)

и, во-вторых,

Sn (x)

=
(12.2.52)
z ˆ }| {
1 X 1 πn o
N −1 N −1
1 X
σN (x) = Sn (x) = f (x + t) + f (x − t) · Dn (t) d t =
N n=0 N n=0 π 0

1 πn o 1 πn o
N −1
1 X
ˆ ˆ
= f (x + t) + f (x − t) · Dn (t) d t = f (x + t) + f (x − t) · ΦN (t) d t.
π 0 N n=0 π 0
| {z }
=

(12.2.62)
ΦN (t)

Поточечная сходимость многочленов Фейера. Мы можем теперь доказать ту часть теоремы


12.2.16, где речь идет о поточечной сходимости:

Лемма 12.2.18. Для всякой кусочно-непрерывной 2π-периодической функции f на прямой R ее


многочлены Фейера сходятся в каждой точке x ∈ R к среднему арифметическому ее левого и
правого пределов в этой точке:

f (x − 0) + f (x + 0)
= lim σN (x), x ∈ R.
2 N →∞

Доказательство. Поскольку f кусочно-непрерывна и периодична, она ограничена на R. Обозначим


буквой M ограничивающую ее константу:

sup |f (x)| = M (M ∈ R).


x∈R

Зафиксируем точку x ∈ R. Из кусочной непрерывности f следует также, что существуют пределы

f (x + 0) = lim f (x + t), f (x − 0) = lim f (x − t)


t→+0 t→+0

Поэтому если зафиксировать ε > 0, то найдется δ > 0 такое, что

∀t ∈ (0, δ) |f (x + t) − f (x + 0)| < ε & |f (x − t) − f (x − 0)| < ε

Подберем такое N0 ∈ N∗ , чтобы для всех N > N0 выполнялось неравенство


ε
max ΦN (t) < (12.2.68)
t∈[δ,π] 4M

(это всегда можно сделать, в силу (12.2.65)). Тогда для всех N > N0 мы получим:
ˆ π

f (x + t) − f (x + 0) · ΦN (t) d t =
0
§ 2. Поточечная и равномерная сходимость ряда Фурье 707
ˆ δ ˆ π

= f (x + t) − f (x + 0) ·ΦN (t) d t + f (x + t) − f (x + 0) ·ΦN (t) d t 6
0 | {z } δ | {z }

>

>
ε |f (x + t)| + |f (x + 0)|

>
2M
δ π
π·ε π·ε
ˆ ˆ
6ε· ΦN (t) d t +2M · ΦN (t) d t 6 + = π·ε
2 2
|0 {z } |δ {z }

>

>
´π
0
ΦN (t) d t (π − δ) · maxt∈[δ,π] ΦN (t)

>
(12.2.63) (12.2.68)
π ε
2 (π − δ) · 4M

>
π·ε
4M

Таким образом,
1
ˆ π

∀N > N0 · f (x + t) − f (x + 0) · ΦN (t) d t < ε (12.2.69)
π 0

Точно так же доказывается, что

1
ˆ π

∀N > N0 · f (x − t) − f (x − 0) · ΦN (t) d t < ε (12.2.70)
π 0

f (x+0)+f (x−0)
Теперь оценим разность между 2 и многочленом Фейера:


σN (x) − f (x + 0) + f (x − 0) =
2
ˆ πn o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · ΦN (t) d t − · DN (t) d t =
π 2 π
| 0 {z } | 0 {z }
=

=
(12.2.67) (12.2.63)
σN (x) 1
ˆ πn o
1 1 πn o
ˆ
= f (x + t) + f (x − t) · ΦN (t) d t − f (x + 0) + f (x − 0) · ΦN (t) d t =
π 0 π 0
ˆ πn o
1
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · ΦN (t) d t =
π 0
ˆ
1 π h i ˆ πh i
= · f (x + t) − f (x + 0) · ΦN (t) d t + f (x − t) − f (x − 0) · ΦN (t) d t 6
π 0 0
ˆ π ˆ π
1 1
6 · f (x + t) − f (x + 0) · ΦN (t) d t + · f (x − t) − f (x − 0) · ΦN (t) d t < 2ε
π 0 π 0
| {z } | {z }
>

>

(12.2.69) (12.2.70)
ε ε

Мы получили, что для произвольной точки x ∈ R и любого ε > 0 можно подобрать такое N0 ∈ N∗ ,
что для любого N > N0 выполняется соотношение:


σN (x) − f (x + 0) + f (x − 0) < 2ε
2

Это эквивалентно тому, что нам нужно:

f (x + 0) + f (x − 0)
∀x ∈ R σN (x) −→
N →∞ 2

Равномерная сходимость многочленов Фейера.

Лемма 12.2.19. Непрерывная 2π-периодическая функция f является равномерной суммой своей


последовательности многочленов Фейера (12.2.57).
708 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Доказательство. Пусть f – непрерывная 2π-периодическая функция на R. Поскольку f непрерыв-


на на [−π, π], должна быть конечной величина

M = sup |f (x)| = sup |f (x)| (12.2.71)


x∈R x∈[−π,π]

Зафиксируем число ε > 0 и выберем такое δ > 0, чтобы


ε

∀x ∈ [−π, π] ∀t ∈ (−δ, δ) f (x) − f (x + t) < (12.2.72)
3
(поскольку f непрерывна, и значит, равномерно непрерывна на [−π, π], это всегда можно сделать).
После этого найдем N0 такое, что
ε
∀N > N0 kΦN (t)kt∈[δ,π] < (12.2.73)
6M
Тогда для всякого N > N0 мы получим:
1 π
ˆ
1 π
ˆ


f (x) − σN (x) = f (x) · ΦN (t) d t − f (x + t) · ΦN (t) d t =
π −π π −π
| {z } | {z }
=

=
(12.2.63) (12.2.66)
1 σN (x)
ˆ π 
1  1 π
ˆ

= f (x) − f (x + t) · ΦN (t) d t 6 f (x) − f (x + t) · ΦN (t) d t =
π −π π −π
1 −δ 1 δ
ˆ ˆ

= f (x) − f (x + t) ·ΦN (t) d t + f (x) − f (x + t) ·ΦN (t) d t+
π −π | {z } π −δ | {z }
>

>
ε
(12.2.72)
|f (x)| + |f (x + t)| 3
>

(12.2.71)
2M
ˆ π
1
+ f (x) − f (x + t) ·ΦN (t) d t 6
π δ | {z }
>

|f (x)| + |f (x + t)|
>

(12.2.71)
2M
−δ ˆ δ
2M ε 2M π
ˆ ˆ
6 ΦN (t) d t + ΦN (t) d t + ΦN (t) d t =
π−π 3π −δ π δ
| {z } | {z }
↑ ↑
ˆ δ ˆ π
ε 4M ε 4M πε ε 2ε
= · ΦN (t) d t + · ΦN (t) d t < ·π+ · = + =ε
3π −δ π δ 3π π 6M 3 3
| {z } | {z }
>
>

´π
ΦN (t) d t (π − δ) · kΦN (t)kt∈[δ,π]
−π
>
=

(12.2.63) (12.2.73)
ε
π (π − δ) · 6M
>

πε
6M

Отсюда

∀N > N0 kf (x) − σN (x)kx∈R = sup f (x) − σN (x) 6 ε
x∈R

Это доказывает (12.2.60).

Равномерная по производным сходимость многочленов Фейера.


Лемма 12.2.20. Бесконечно гладкая 2π-периодическая функция f является равномерной по про-
изводным суммой своей последовательности многочленов Фейера (12.2.57).
Доказательство. Это можно вывести как следствие пункта (ii) теоремы 12.2.8: из соотношения
(m)
∀m ∈ N kf − SN kR −→ 0.
N →∞
§ 2. Поточечная и равномерная сходимость ряда Фурье 709

следует, что при фиксированных m ∈ N и ε > 0 существует N0 такое, что при N > N0 выполняется
(m)
kf − SN kR <ε

Отсюда следует, что при N > N0 будет выполняться


(m) (m)
1 X
N −1 1 NX−1
1 X
N −1
(m)
kf − σN kR = f − Sn = f− Sn =
N n=0 N N
R n=0 n=0 R
N −1 (m)
1 X N −1
1 X
N −1
1 X
(m)
= (f − Sn ) 6 k(f − Sn )kR < ε=ε
N N n=0 N n=0
n=0 R

Поскольку m ∈ N и ε > 0 выбирались произвольно, получаем


(m)
∀m ∈ N kf − σN kR −→ 0.
N →∞

(d) Примеры 1 0 1 π
ˆ ˆ
=− sin nx d x + sin nx d x =
π −π π 0
В следующих примерах нас будет интересовать x=0 x=π
поточечная сходимость, поэтому они будут ил- 1 1
= cos nx − cos nx =
люстрациями к теореме 12.2.8. πn x=−π πn x=0
1 1
= {1 − cos(−πn)} − {cos(πn) − 1} =
Разложение Фурье произвольной 2π- πn πn
периодической функции. 2 2
= {1 − cos(πn)} = {1 − (−1)n }
πn πn
⋄ 12.2.21. Найдем разложение Фурье функции
Вывод:


1, x ∈ (2πn, π + 2πn) X∞
2
f (x) = sgn sin x = 0, x = πn sgn sin x = {1 − (−1)n } · sin nx
 πn
 n=1
−1, x ∈ (−π + 2πn, 2πn)
⋄ 12.2.22. Вычислим разложение 2π-
Для этого нужно просто вычислить коэффици- периодической функции f , удовлетворяющей
енты Фурье: тождеству Лебега и заданной на интервале
(−π, π) формулой
1 π 1 0
ˆ ˆ
a0 = sgn sin x d x = (−1) d x+ 
π −π π −π 
1, x ∈ (0, π)
1
ˆ π
π π f (x) = 12 , x = 0
+ 1 dx = − + = 0 

π 0 π π 0, x ∈ (−π, 0)

1 π
ˆ
an = sgn sin x · cos nx d x =
π −π
1 0 1 π
ˆ ˆ
= (−1) · cos nx d x + 1 · cos nx d x =
π −π π 0
1 0 1 π
ˆ ˆ
=− cos nx d x + cos nx d x =
π −π π 0
1 x=0 1 x=π
Вычисляем коэффициенты Фурье:
=− sin nx + sin nx = 0+0 = 0
πn x=−π πn x=0
π
1
ˆ
a0 = f (x) d x =
π
π −π
1
ˆ
0 π
bn = sgn sin x · sin nx d x = 1 1 π
ˆ ˆ
π −π = 0 dx + 1 dx = =1
0 π
π −π π 0 π
1 1
ˆ ˆ
= (−1) · sin nx d x + 1 · sin nx d x =
π −π π 0
710 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

1 π 1 π 1 π
ˆ
an = f (x) · cos nx d x = =− {cos(πn) − cos } = {cos − (−1)n }
π −π πn 2 πn 2
1 0 1 π Вывод:
ˆ ˆ
= 0 · cos nx d x + 1 · cos nx d x =
π −π π 0
1 X n sin πn

1 x=π f (x) = + 2
· cos nx+

= sin nx =0 4 n=1 πn
πn x=0
1 π o
{cos − (−1)n } · sin nx
+
πn 2
1 π
ˆ
bn = f (x) · sin nx d x = ⊲⊲ 12.2.24. Разложите в ряд Фурье 2π-
π −π периодические функции, заданные на интервале
1 0 1 π
ˆ ˆ
(−π, π) формулами:
= 0 · sin nx d x + 1 · sin nx d x =
π −π π 0 1) f (x) = e(x
1 x=π 1 x, x ∈ (0, π)

=− cos nx = − {cos(πn) − 1} = 2) f (x) =
πn x=0 πn 0, x ∈ (−π, 0)
1 (
= {1 − (−1)n } 0, x ∈ (0, π)
πn 3) f (x) =
x, x ∈ (−π, 0)
Вывод: 

x, x ∈ (0, π)
1 X 1
∞ 4) f (x) = π2 , x = 0
f (x) = + {1 − (−1)n } · sin nx 

2 n=1 πn π, x ∈ (−π, 0)

⋄ 12.2.23. Вычислим разложение 2π-перио- Разложение Фурье четных и нечетных 2π-


дической функции f , удовлетворяющей тожде- периодических функций.
ству Лебега и заданной на интервале (−π, π)
Предложение 12.2.25. Если 2π-периодическая
формулой
функция f четна
 
 π
1, x ∈ 0, 2 f (−x) = f (x) (12.2.74)
f (x) = 21 , x ∈ 0, π2

  то в ее ряде Фурье отсутствуют слагаемые с
0, x ∈ (−π, 0) ∪ π2 , π синусами:

y a0 X
f (x) = + an cos nx (12.2.75)
2
1 n=1
1
2 а коэффициенты a0 , an можно вычислять по
x формулам
−π − π2 π π
2 π
ˆ
2
a0 = f (x) d x,
π 0
(12.2.76)
2 π
ˆ
Вычисляем коэффициенты Фурье: an = f (x) cos nx d x
π 0
π
1
ˆ
a0 = f (x) d x = Доказательство. Коэффициенты bn обнуляют-
π −π ся:
π
0 π
1 1 1 π 1
ˆ ˆ ˆ
1 π
2 ˆ
= 0 d x+ 1 d x+ 0 dx = = bn = f (x) sin nx d x =
π −π π π π π
2
π 2 π −π
1 0 1 π
ˆ ˆ
= f (x) sin nx d x + f (x) sin nx d x =
1 π
ˆ π π 0
an = f (x) · cos nx d x = | −π {z }
π −π замена: x = −t

1 π
ˆ
1 x=π sin πn 1
ˆ 0
1
ˆ π
2
= 1 · cos nx d x = sin nx π = = f (−t) sin(−nt) d(−t)+ f (x) sin nx d x =
π π2 πn x= 2 πn π π | {z } π 0
=

(12.2.74)
f (t)
0 π
1 π 1 1
ˆ ˆ ˆ
bn = f (x) · sin nx d x = = f (t) sin nt d t + f (x) sin nx d x = 0
π −π π π π 0
x=π | {z }
1 π 1
ˆ

=

= 1 · sin nx d x = − cos nx π = 1
−π
´π
f (t) sin nt d t
π π2 πn x= 2 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 711

π
1
ˆ
Докажем формулы (12.2.76): во-первых, a0 = f (x) d x =
π −π
π
1
ˆ
0 π
1 1
ˆ ˆ
a0 = f (x) d x = = f (x) d x + f (x) d x =
π −π π π
−π 0
0 π | {z }
1 1
ˆ ˆ
= f (x) d x + f (x) d x = замена: x = −t
π −π π 0 1
ˆ 0
1
ˆ π
| {z } = f (−t) d(−t) + f (x) d x =
замена: x = −t π π | {z } π 0
0 π

=
1 1 (12.2.77)
ˆ ˆ
= f (−t) d(−t) + f (x) d x = −f (t)
π π | {z } π 0 0 π
1 1
ˆ ˆ
=

(12.2.74)
f (t) = f (t) d t + f (x) d x = 0
π π π 0
0 π π | {z }
1 1 2
ˆ ˆ ˆ

=
=− f (t) d t + f (x) d x = f (x) d x ´π
π π π 0 π 0
1
−π 0
f (t) d t
| {z }
=

1
´π а для коэффициентов an ,
π 0
f (t) d t

1 π
ˆ
и, во-вторых, an = f (x) cos nx d x =
π −π
1 π
ˆ
1 0 1 π
ˆ ˆ
an = f (x) cos nx d x = = f (x) cos nx d x + f (x) cos nx d x =
π −π π −π π 0
| {z }
1 0 1 π
ˆ ˆ
= f (x) cos nx d x + f (x) cos nx d x = замена: x = −t
π −π π 0 ˆ 0
1
| {z } = f (−t) cos(−nt) d(−t)+
замена: x = −t π π | {z }
ˆ 0

=
1 (12.2.77)
= f (−t) cos(−nt) d(−t)+ −f (t)
π π | {z } ˆ π
1
=

(12.2.74) + f (x) cos nx d x =


f (t) π 0
π 0 π
1
ˆ
1 1
ˆ ˆ
+ f (x) cos nx d x = = f (t) cos nt d t + f (x) cos nx d x = 0
π 0 π π π 0
0 π | {z }
1 1
ˆ ˆ
=

=− f (t) cos nt d t + f (x) cos nx d x = 1


´π
π π π 0 −π 0
f (t) cos nt d t
| {z }
=

1
´π Докажем формулу (12.2.79):
π 0
f (t) cos nt d t
π π
2
ˆ
1
ˆ
= f (x) cos nx d x bn = f (x) sin nx d x =
π 0 π −π
0 π
1 1
ˆ ˆ
= f (x) sin nx d x + f (x) sin nx d x =
π −π π 0
Предложение 12.2.26. Если 2π-периодическая | {z }
замена: x = −t
функция f нечетна ˆ 0
1
= f (−t) sin(−nt) d(−t)+
f (−x) = −f (x) (12.2.77) π π | {z }
=

(12.2.77)
то в ее ряде Фурье отсутствуют свободное сла- −f (t)
ˆ π
гаемое и слагаемые с косинусами: 1
+ f (x) sin nx d x =
∞ π 0
X
0 π
f (x) = bn sin nx (12.2.78) 1 1
ˆ ˆ
n=1
=− f (t) sin nt d t + f (x) sin nx d x =
π π π 0
| {z }
а коэффициенты bn можно вычислять по фор-
=

1
´π
мулам π 0
f (t) sin nt d t
π
2
ˆ
2 π = f (x) sin nx d x
ˆ
bn = f (x) sin nx d x (12.2.79) π 0
π 0

Доказательство. Для коэффициента a0 полу-


чим: ⋄ 12.2.27. Найдем разложение четной 2π-
периодической функции f , удовлетворяющей
712 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

тождеству Лебега и заданной на интервале (0, π) 2 2


=− {π · (−1n ) − 0} = − · (−1)n
формулой πn n
f (x) = x Вывод:
X∞
Ясно, что график имеет вид 2(−1)n
f (x) = − · sin nx
n
y n=1

π ⋄ 12.2.29. Разложим в ряд Фурье четную 2π-


периодическую функцию, заданную на интерва-
ле (−π, π) формулой
x f (x) = x2
−2π −π π 2π График имеет вид

Поскольку f четна, нужно вычислить только a0 y


и an : π2
2 π 2 x2 π
ˆ
a0 = x dx = · = π
π 0 π 2 0
x
−3π −2π −π π 2π 3π
π ˆ π
2 2
ˆ
an = x · cos nx d x = x d sin nx =
π 0 πn 0 Поскольку f четна, нужно вычислить только a0
 π π 
2 и an :
ˆ

= x · sin nx − sin nx d x =
πn 0 2 π 2 2 x3 π 2π 2
ˆ
0
2 n cos nx π o 2 a0 =
π 0
x dx = · =
π 3 0 3
= 0+ = {cos πn − 1} =
πn n 0 πn2
2
{(−1)n − 1} 2 π 2
ˆ π
= 2
ˆ
πn2 an = x · cos nx d x = x2 d sin nx =
π 0 πn 0
Вывод: 2 n 2 π ˆ π o

= · x · sin nx −2 x · sin nx d x =
∞ πn 0
π X 2 | {z } 0
f (x) = + {(−1)n − 1} · cos nx
=

2 n=1 πn2 0
π
4
ˆ
⋄ 12.2.28. Найдем разложение нечетной 2π- = · x d cos nx =
периодической функции f , удовлетворяющей πn2 0
4 n π ˆ π o
тождеству Лебега и заданной на интервале (0, π)
= · x · cos nx − cos nx d x =
формулой πn2 0 0
f (x) = x 4 n 1 π o (−1)n
n
= · π · (−1) − · sin nx = 4 ·
График здесь имеет вид πn2 |n {z 0
} n2
=

y 0
π
Вывод:

x π2 X (−1)n
f (x) = +4· · cos nx (12.2.80)
−3π −2π −π π 2π 3π 3 n2
n=1

−π ! 12.2.30. Из тождества (12.2.80), между про-


чим, следует формула (9.2.31), которую мы обе-
Поскольку f нечетна, нужно вычислить только щали доказать в параграфе о числовых рядах:
bn : если положить x = π, то мы получим равенство
X∞
2
ˆ π
2
ˆ π π2 (−1)n
bn = x · sin nx d x = − x d cos nx = π2 = +4· 2
· (−1)n ,
π πn 0 3 n=1
n
0
 π ˆ π 
2 которое после упрощений как раз дает (9.2.31)
=− x · cos nx − cos nx d x =
πn 0 0
  X∞
2 sin nx π π2
=
1
.
=− π · cos πn − = 6 n2
πn n 0 n=1
§ 2. Поточечная и равномерная сходимость ряда Фурье 713

⊲⊲ 12.2.31. Разложите в ряд Фурье 2π- (i) если функция f четная, то


периодические функции, заданные на интервале

(0, π), рассмотрев отдельно случай когда f четна f (x − 0) + f (x + 0) a0 X πnx
= + an cos ,
и нечетна:   2 2 T
π n=1

1, x ∈ 0, 2
2 T
ˆ
1) f (x) = 21 , x = π2 a0 = f (x) d x,

  T 0
0 x ∈ π2 , π
(  2 T
ˆ
πnx
x, x ∈ 0, π2 an = f (x) cos dx
2) f (x) = π π
 T 0 T
, x ∈ 2,π
2 
 π (ii) если f нечетная, то
x, x ∈ 0, 2
3) f (x) = π4 , x = π2 ∞

  f (x − 0) + f (x + 0) X πnx
0, x ∈ π2 , π = bn sin ,
2 n=1
T
T
2 πnx
ˆ
Ряды Фурье функций с произвольным пе- bn = f (x) sin dx
риодом. T 0 T

Теорема 12.2.32. Для всякой кусочно-гладкой Доказательство. Заменой переменной


функции f с полупериодом T на прямой R, ее Ty
ряд Фурье x=
π
a0 X n πnx o

πnx функция f превращается в функцию с полупери-
+ an · cos + bn · sin (12.2.81) одом π. После этого применяется теорема 12.2.8
2 n=1
T T
и предложения 12.2.25 и 12.2.26.
с коэффициентами (12.0.3)
⊲⊲ 12.2.33. Разложите в ряд Фурье 2T -
ˆ T периодические функции, заданные на полупе-
1
a0 = f (x) d x, риоде (0, T ), рассмотрев отдельно случай когда
T −T f (x) четна и нечетна:
1 T πnx
ˆ
an = f (x) cos d x, (12.2.82) 1) f (x) = x, T = 4
T −T T
2) f (x) = 3 − x, T = 3
1 T
ˆ
πnx 
bn = f (x) sin dx 
0, x ∈ (0, 1)
T −T T
3) f (x) = 12 , x = 1 , T =2


сходится в каждой точке к среднему арифме- 1 x ∈ (1, 2)
тическому ее левого и правого пределов (
1, x ∈ (0, 1]
4) f (x) = , T =2
f (x − 0) + f (x + 0) 2 − x x ∈ (1, 2)
= (
2 2 − x, x ∈ (0, 1]
a0 X n πnx o
∞ 5) f (x) = , T =2
πnx 1 x ∈ (1, 2)
= + an cos + bn sin (12.2.83)
2 T T (
n=1
x, x ∈ (0, 1]
6) f (x) = , T =2
При этом 1 x ∈ (1, 2)
Часть III

ФУНКЦИИ НЕСКОЛЬКИХ
ВЕЩЕСТВЕННЫХ ПЕРЕМЕННЫХ

714
Глава 13

ЛИНЕЙНАЯ АЛГЕБРА

В § 1 главы 3 мы говорили, что вещественные числа появляются в науке как идея, упрощающая
понимание алгоритмов измерения по эталону. Физические величины, для измерения которых доста-
точно указать эталон и алгоритм сравнения по нему, называются скалярными. Таковыми, например,
являются длина, объем, масса, заряд и т.д. Помимо них есть и другие, для измерения которых нуж-
но дополнительно фиксировать систему координат. Такие величины называются векторными.

⋄ 13.0.1. Типичный пример векторной величи- ной точке. По определению, это дробь
ны – положение тела в пространстве. Если ука-
зан эталон длины и система координат в про- F
E=
странстве, то положение тела (точнее, матери- q
альной точки) однозначно описывается тремя ко-
где F – сила, действующая на пробный заряд ве-
ординатами. Точно так же скорость тела или си-
личиной q, помещенный в данную точку. Знаме-
ла, действующая на него являются векторными
нитые уравнения Максвелла связывают эту ве-
величинами.
личину с еще тремя векторными величинами: на-
⋄ 13.0.2. Еще один пример векторной величины пряжённостью H магнитного поля, электриче-
– напряженность электрического поля E в дан- ской индукцией B и магнитной индукцией D.

Если для данной векторной величины заданы эталон, алгоритм сравнения по нему и система
координат, то результат измерения этой величины в каждой конкретной ситуации будет конечной
последовательностью чисел фиксированной длины n. Напомним определение главы 3 (с.73):
• Конечной последовательностью элементов множества S (необязательно, числового) на-
зывается произвольное отображение a : {1, ..., k} → S из какого-нибудь отрезка {1, ..., k}
натурального ряда N∗ . Значения такого отображения часто записывают с помощью ин-
дексов
ai = a(i), i ∈ {1, ..., k}.
а само это отображение – в виде семейства {ai ; i ∈ N∗ } или {ai }. Число k при этом
называется длиной последовательности {ai ; i ∈ N∗ }.
• В частном случае, когда S = R – множество чисел, последовательность {ai ; i ∈ N∗ }
принято называть (конечной) числовой последовательностью.
• Напомним, что до сих пор мы записывали конечные числовые последовательности в виде
строк 
x = x1 , x2 , ..., xn .
Такие объекты в математике принято также называть числовыми строками (длины n ∈
N∗ ). Множество всех числовых строк длины n называется координатным пространством
размерности n и обозначается Rn :

x ∈ Rn ⇔ x = x1 , x2 , ..., xn , xi ∈ R

Элементы этого множества, то есть строки, называются также точками или векторами
пространства Rn .

715
716 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

• Конечная числовая последовательность может быть также записана в виде столбца


 1
x
 x2 
x= 
 ...  .
xn

(при этом индексы у элементов последовательности мы будем писать справа вверху). Та-
кие объекты принято называть числовыми столбцами (длины n ∈ N∗ ).1 Множество всех
числовых столбцов длины n также называется координатным пространством размерно-
сти n и обозначается Rn :
 1
x
 x2 
x ∈ Rn ⇔ x =   i
 ...  , x ∈ R
xn

Элементы этого множества, то есть столбцы, тоже называются точками или векторами
пространства Rn .
Координатные пространства Rn и Rn играют в изучении векторных величин ту же роль, что и
множество R вещественных чисел при изучении скалярных. Однако система фактов об Rn и Rn ,
необходимых для доказательства нужных утверждений, намного более сложна и менее очевидна,
чем в случае с R. В этой главе мы обсудим те свойства Rn и Rn , которые вытекают из наличия на
этих множествах естественных алгебраических операций.

§1 Комбинаторика
Разговор о пространствах Rn и Rn полезно начать с обсуждения свойств конечных последователь-
ностей, причем не только числовых. Это понадобится нам в дальнейшем, например, при описании
свойств определителя2 , многочленов и полилинейных форм (§ 3, (a) и § 5 этой главы3 ) а также
главы 154 . Область математики, где рассматриваются объекты такого типа, называется комбина-
торика. Свой предмет эта наука определяет, как изучение конечных множеств5. В этом параграфе
мы опишем некоторые ее результаты.
Область математики, изучающая конечные множества, называется комбинаторикой. Результа-
ты этого параграфа понадобятся нам ниже в главах 6 и 13.

(a) Основные понятия комбинаторики


Правило комбинаторного умножения.
Теорема 13.1.1. Пусть X0 , ..., Xn – конечная последовательность конечных множеств. Тогда
n
Y n
Y
card Xi = card Xi . (13.1.1)
i=1 i=1

Доказательство. Здесь нужно провести индукцию по числу n. При n = 1 мы получаем


1
Y 1
Y
card Xi = card X1 = card Xi .
i=1 i=1
1 При таком определении столбцы не отличаются от строк, потому что и то и другое – просто отображения из

{1, ..., n} в R. Однако для удобства вычислений с матрицами, о которых пойдет речь ниже в § 3, удобно различать
строки и столбцы, и на формальном языке это различие можно представлять как дополнительную метку, приписыва-
емую данной конечной последовательности x, скажем, 0, если эту последовательность мы представляем как строку, и
1, если как столбец. Иными словами, парой (x, 0) мы записываем последовательность x, представляемую как строку, а
парой (x, 1) ту же последовательность, представляемую как столбец. Далее в тексте мы, однако, такое представление
строк и столбцов использовать не будем, просто удовлетворившись тем, что формальный способ выразить разницу
между ними существует.
2 Группа перестановок Σ используется в самом определении определителя матрицы на с.768.
n
3 Это алгебраические результаты, но они применяются затем в анализе, например, в теореме 15.1.43 ниже.
4 Например, понятие мультииндекса используется при определении мультистепени элементарного дифференциала

на с.889.
5 Напомним, что конечные множества мы определили на с.69.
§ 1. Комбинаторика 717

Предположим, это верно при n = k:


k
Y k
Y
card Xi = card Xi . (13.1.2)
i=1 i=1

Тогда для n = k + 1 мы получим


Y
k  k+1
Y
Xi = (0.3.345) ∼
× Xk+1 ∼ = Xi
i=1 i=1

и поэтому

k+1
Y  Y
k   Y
k 
card Xi = card Xi × Xk+1 = (1.1.50) = card Xi · card Xk+1 = (13.1.2) =
i=1 i=1 i=1
Y
k  k+1
Y
= card Xi · card Xk+1 = (3.2.102) = card Xi .
i=1 i=1

Теорему 13.1.1 удобно переписать для приложений в следующем виде:


Теорема 13.1.2 (правило комбинаторного умножения). Пусть у нас имеется возможность по-
строить конечную последовательность (x1 , ..., xn ) длины n, причем
1) элемент x1 мы можем выбрать d1 способами,
2) после того, как выбран x1 , элемент x2 мы можем выбрать d2 способами,
...) ...
n) после того, как выбраны x1 ,...,xn−1 , элемент xn мы можем выбрать dn способами.
Тогда последовательность (x1 , ..., xn ) мы можем выбрать d1 · d2 · ... · dn способами.

⋄ 13.1.3. Сколько слов длины 3 можно соста- собами, второй – двумя. Значит маршрут можно
вить из алфавита, состоящего из двух букв X = выбрать
{a, b}? 3·2=6
Решение. Первую букву в слове можно вы-
брать двумя способами, вторую – тоже двумя способами.
способами, третью – тоже двумя. Получается по
теореме 13.1.2 все слово можно составить ⋄ 13.1.5. Сколько четырехзначных чисел можно
составить из цифр 0, 1, 2, 3, 4, 5, если
2·2·2 =8
1) цифры не повторяются,
способами. 2) цифры могут повторяться,
3) цифры могут повторяться, и получающееся
⋄ 13.1.4. Из пункта A в пункт C можно добрать-
число должно быть нечетным.
ся через пункт B следующими видами транспор-
та: Какова в каждом случае вероятность, что полу-
чающееся число оканчивается на 0?
1) сначала из A в B: автобусом, поездом или па-
роходом, Решение.
1. В первом случае (когда цифры не повторя-
2) потом B в C: пароходом, или самолетом.
ются):
Сколькими способами можно выбрать маршрут
— первую цифру можно выбрать 5 способами
из A в C?
(среди цифр 1, 2, 3, 4, 5),
Решение. Составить маршрут – это все равно
что составить последовательность из двух эле- — после того, как первая цифра выбрана, вто-
ментов: на первом месте должен быть какой-то рую цифру можно выбрать снова 5 способами
вид транспорта при путешествии от A до B, а (среди 0 и оставшихся 4 цифр из 1, 2, 3, 4, 5),
на втором – при путешествиии от B до C. Пер- — после того, как первые две цифры выбраны,
вый вид транспорта можно выбрать тремя спо- третью цифру можно выбрать 4 способами,
718 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

— после того, как первые три цифры выбраны, (теперь понятно, почему). Вероятность, что в
четвертую цифру можно выбрать 3 способа- этом случае выбранное число оканчивается на 0,
ми. будет равна
180 1
Всего по теореме 13.1.2 в этом случае полу- P = = .
1080 6
чается
5 · 5 · 4 · 3 = 120 3. В третьем случае (когда цифры могут по-
вторяться и последняя должна быть нечетной):
вариантов выбора. Среди этих 120 чисел име-
ется некоторое количество оканчивающихся на — первую цифру можно выбрать 5 способами
0. Чтобы их сосчитать, снова применим теорему (среди цифр 1, 2, 3, 4, 5),
13.1.2. Здесь выбрать число – это выбрать только — после того, как первая цифра выбрана, вто-
первые три цифры, потому что последняя цифра рую цифру можно выбрать 6 способами (сре-
будет 0. Получаем: ди цифр 0, 1, 2, 3, 4, 5),
— первую цифру можно выбрать 5 способами — после того, как первые две цифры выбраны,
(среди цифр 1, 2, 3, 4, 5), третью цифру можно выбрать 6 способами
— после того, как первая цифра выбрана, вто- (среди цифр 0, 1, 2, 3, 4, 5),
рую цифру можно выбрать 4 способами (сре- — после того, как первые три цифры выбраны,
ди оставшихся 4 цифр из 1, 2, 3, 4, 5), четвертую цифру можно выбрать 3 способа-
— после того, как первые две цифры выбраны, ми (среди цифр 1, 3, 5).
третью цифру можно выбрать 3 способами. Всего по теореме 13.1.2 в этом случае полу-
Всего в первом случае чисел, оканчивающих- чается
ся на 0, имеется 5 · 6 · 6 · 3 = 540
вариантов. Из них ни одно число не оканчивает-
5 · 4 · 3 = 60.
ся на 0. Поэтому вероятность получения такого
Вероятность, что в первом случае выбранное числа нулевая:
число оканчивается на 0, будет равна 0
P = = 0.
60 1 540
P = = .
120 2 ⋄ 13.1.6. Подбрасываются две игральные кости.
2. Во втором случае (когда цифры могут по- Найдите вероятность того, что
вторяться): 1) выпадут одинаковые цифры,
— первую цифру можно выбрать 5 способами 2) выпадут четные цифры.
(среди цифр 1, 2, 3, 4, 5),
Решение. Всего вариантов выпадения двух
— после того, как первая цифра выбрана, вто- костей имеется по теореме 13.1.2
рую цифру можно выбрать 6 способами (сре-
ди цифр 0, 1, 2, 3, 4, 5), 6 · 6 = 36
— после того, как первые две цифры выбраны,
третью цифру можно выбрать 6 способами (потому что первую цифру можно выбрать 6 спо-
(среди цифр 0, 1, 2, 3, 4, 5), собами, как и вторую). Количество вариантов, в
которых цифры одинаковые, равно 6. Поэтому
— после того, как первые три цифры выбраны, вероятность в первом случае равна
четвертую цифру можно выбрать 6 способа-
ми (среди цифр 0, 1, 2, 3, 4, 5). 6 1
P = = .
Всего по теореме 13.1.2 в этом случае полу- 36 6
чается Во втором случае количество вариантов будет
5 · 6 · 6 · 6 = 1080 равно
вариантов выбора, то есть четырехзначных чи- 3·3=9
сел, составленных из цифр 0, 1, 2, 3, 4, 5. Из них
и вероятность этого
оканчивающихся на 0 будет
9 1
5 · 6 · 6 = 180 P = = .
36 4

Инъективные последовательности (размещения). Последовательность {xi ; i = 1, ..., k} эле-


ментов множества S называется размещением из элементов множества S (длины k), если она
§ 1. Комбинаторика 719

инъективна, то есть ее элементы не повторяются:

∀i 6= j ∈ {1, ..., k} xi 6= xj

Множество всех размещений длины k из элементов множества S обозначается символом AkS .


• Числом размещений из n элементов по k элементов называется число

n!
Akn = (13.1.3)
(n − k)!

Связь между AkS и Akn выражает следующая

Теорема 13.1.7. Мощность множества AkS всех размещений длины k в (конечном) множестве
S, мощности n (также конечна и) равна числу размещений Akn из n по k:

n!
card AkS = Akn = (13.1.4)
(n − k)!

Доказательство. Здесь используется правило комбинаторного умножения (теорема 13.1.2). По-


считаем, сколькими способами можно составить последовательность длины k с неповторяющимися
элементами из множества S мощности n:
— первый элемент можно выбрать n способами (им может быть любой из элементов S)
— после того, как первый элемент выбран, второй можно выбрать n − 1 способами (им может быть
любой из элементов S, кроме уже выбранного первого),
— после того, как первые два элемента выбраны, третий можно выбрать n−2 способами (им может
быть любой из элементов S, кроме уже выбранных первых двух),
— и так далее, и когда мы дойдем до элемента с номером k, то его можно будет выбрать n − (k − 1)
способами (им может быть любой из элементов S, кроме уже выбранных k−1 первых элементов).
Всего по теореме 13.1.2 в этом случае получается

n!
n · (n − 1) · (n − 2) · ... · (n − (k − 1)) =
(n − k)!

вариантов.

⊲ 13.1.8. Сколькими способами можно расса- — сначала выбираем из 8 расставленнх в круг


дить 25 человек на 10 местах (предполагается, стульев пару соседних, на которых будут си-
что 15 человек остаются стоять)? деть А и Б; таких пар имеется 8;
25!
Ответ: A10
25 = 15! . — после того как пара соседних стульев выбра-
⊲ 13.1.9. Сколькими способами можно расса- на, выбираем из них, на каком конкретно из
дить 10 человек на 25 местах? них будет сидеть А, а на каком Б; таких ва-
Ответ (такой же как в предыдущей задаче): риатнтов имеется 2;
25!
A10
25 = 15! . — после того, как выбраны места для А и Б,
⊲ 13.1.10. Сколькими способами могут разме- остается еще 6 свободных стульев и 6 чело-
ститься 5 покупателей в очереди в кассу? век, которые нужно на них разместить; это
Ответ: A55 = 5!. можно сделать A66 = 6! способами.
⋄ 13.1.11. 8 человек рассаживаются за круглым В итоге вариантов, когда А и Б оказываются ря-
столом. Какова вероятность, что два конкретных дом имеется
человека, А и Б, окажутся рядом?
8 · 2 · 6!.
Всего способов рассадить 8 человек на 8 сту-
льев (будем считать их расставленными в круг) Вероятность, этого события будет
имеется A88 = 8!. Из них число вариантов, когда
А и Б оказываются рядом, считатеся по теореме 8 · 2 · 6! 2
13.1.2: P = = .
8! 7
720 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Подмножества (сочетания).
Теорема 13.1.12. Если (конечное) множество S состоит из n элементов, то множество 2S
всех подмножеств в множестве S (также конечно и) состоит из 2n элементов.
Доказательство. Занумеруем элементы S:

S = {x1 , ..., xn }.

Задать подмножество M в S – то же, что присвоить каждому элементу xi число ai , равное 1, если
xi ∈ M , и 0, если xi ∈
/ M . Это то же самое, что выбрать последовательность (a1 , ..., an ) из чисел 0
и 1. Таких последовательностей по теореме 13.1.2 имеется

· ... · 2} = 2n
|2 · 2 {z
n множителей

(потому что первое число a1 можно выбрать 2 способами, второе a2 – тоже 2 способами, и так
далее).
Для всякого множества S и любого натурального числа k ∈ N сочетанием в множестве S по
k элементов называется произвольное подмножество X в S мощности k:

X ⊆ S, card X = k.

Множество всех сочетаний из S по k элементов обозначается CSk .


• Напомним, что число Cnk сочетаний из n элементов по k элементов было определено в
главе 3 формулой (3.2.110).:
n!
Cnk = , (0 6 k 6 n) (13.1.5)
(n − k)! · k!

Связь между CSk и Cnk выражает следующая


Теорема 13.1.13. Мощность множества CSk всех сочетаний в (конечном) множестве S мощ-
ности n по k элементов (также конечна и) равна числу Cnk сочетаний из n по k:
n!
card CSk = Cnk = , (0 6 k 6 n) (13.1.6)
(n − k)! · k!
Доказательство. Обозначим буквой E число всех подмножеств мощности k в S. Наша задача –
показать, что E = Cnk .
По теореме (13.1.7), число последовательностей длины k из неповторяющихся элементов множе-
ства S равно
n!
Akn = . (13.1.7)
(n − k)!
То же самое число можно посчитать другим способом:
— сначала нужно выбрать какое-нибудь подмножество T мощности k в S – число таких
вариантов равно E (мы еще не знаем, сколько это);
— после того, как выбрано подмножество T мощности k в S, мы нумеруем его элементы
цифрами от 1 до k – это можно сделать Akk = k! способами (по теореме (13.1.7)).
В результате по правилу комбинаторного умножения (теорема 13.1.2) получается всего

E · k! (13.1.8)

вариантов выбрать размещение длины k в S.


Приравнивая (13.1.8) и (13.1.7), получаем:
n! n!
E · k! = =⇒ E= = Cnk .
(n − k)! k! · (n − k)!
§ 1. Комбинаторика 721

⋄ 13.1.14. Сколько экзаменационных комиссий когда мы такое подмножество выберем, его оста-
из 7 человек можно составить из 14 преподава- нется упорядочить по убыванию, и получится
телей? Какова вероятность, что в выбранной ко- число с нужным свойством). Таких подмножеств
миссии окажется данный человек? имеется
Пусть S – множество преподавателей (мощ-
ности 14), из которого выбирается комиссия. Вы- 4 10! 10 · 9 · 8 · 7
C10 = = = 10 · 3 · 7.
брать комиссию из 7 человек – это то же самое, 4! · 6! 4·3·2
что выбрать подмножество в S мощности 7. Та- Всего четырехзначных чисел по правилу комби-
ких подмножеств по теореме 13.1.13 имеется наторного умножения (теорема 13.1.2) имеется
7 14!
C14 = 9 · 10 · 10 · 10.
(7!)2
– и это ответ на первый вопрос. Вероятность, что выбранное наугад четырех-
Далее найдем число комиссий, в которые вхо- значное число будет таким, как нам надо, равна
дит данный человек. Выбрать такую комиссию –
все равно, что добавить к этому человеку еще 6 4
C10 10 · 3 · 7
из 13 оставшихся. А это то же самое, что выбрать P = = =
9 · 10 · 10 · 10 9 · 10 · 10 · 10
подмножество мощности 6 из множества мощно- 7 7
сти 13. Таких подмножеств по теореме 13.1.13 = =
3 · 10 · 10 300
имеется
6 13! ⊲ 13.1.16. В партии из 10 изделий 3 бракованы.
C13 =
6! · 7! Наудачу выбираются 3 изделия. Какова вероят-
Теперь верояность, что в выбранной комиссии ность, что
окажется данный человек равна
1) все выбранные изделия бракованы?
6 13!
C13 6!·7! 7! 1 2) все выбранные изделия качественные?
P = 7 = 14!
= =
C14 (7!)2
6! · 14 2 3) хотя бы одно из выбранных изделий бракова-
но?
⋄ 13.1.15. Сколько имеется четырехзначных чи-
4) ровно 2 из выбранных изделий браковано?
сел, у которых каждая следующая цифра мень-
ше предыдущей? Какова вероятность, что вы- Ответы:
бранное наугад четырехзначное число будет та- 1
ким? 1) 3 ,
C10
Решение. Выбрать четырехзначное чис- 2)
C73
3 ,
C10
ло, у которого каждая следующая цифра
3
меньше предыдущей – все равно что вы- C10 −C73
3) 3
C10
,
брать подмножество мощности 4 в множестве
C32 ·C71
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} всех цифр (потому что 4) C103 .

Мультииндексы (выборки). Выборкой из n элементов, или мультииндексом длины n, назы-


вается произвольная конечная последовательность k = (k1 , ..., kn ) натуральных чисел ki ∈ N (из
которых некоторые или все могут быть нулями). При этом
— число
n
X
|k| = ki (13.1.9)
i=1

называется объемом выборки (мультииндекса) k,


— число
n
X
k! = ki ! (13.1.10)
i−1

называется факториалом выборки (мультииндекса) k.


— число  
k |k| |k|! |k|!
C|k| = := = (13.1.11)
k k! k1 ! · ... · kn !
называется биномальным коэффициентом выборки (мультииндекса) k.
722 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Множество всех выборок (мультииндексов) длины n и объема m мы будем обозначать символом


Mn [m]. Множество всех мультииндексов длины n мы обозначаем Mn :
[
Mn = Mn [m] (13.1.12)
m∈N

Теорема 13.1.17. Число мультииндексов длины n и объема m равно

n−1 m (m + n − 1)!
card Mn [m] = Cm+n−1 = Cm+n−1 = (13.1.13)
m! · (n − 1)!

Доказательство. Обозначим символом E множество всех последовательностей длины m + n − 1,


состоящих из нулей и единиц и имеющих m единиц и n − 1 нулей:

ε∈E ⇐⇒ ε = (ε1 , ..., εm+n−1 ), εi ∈ {0; 1}, card{i : εi = 1} = m, card{i : εi = 0} = n − 1.

Заметим, что каждая такая последовательность порождает некоторый мультииндекс k : {1, ..., n} →
N объема m по такому правилу:
1) k1 – число единиц в ε до первого нуля,
2) k2 – число единиц в ε между первым и вторым нулями,
...)
i) ki – число единиц в ε между i − 1-м и i-м нулями,
...)
n) kn – число единиц в ε после последнего нуля.
Более того, это правило устанавливает биекцию между мультииндексами k : {1, ..., n} → N
объема m и последовательностями ε ∈ E. Поэтому количество таких мультииндексов равно чилу
элементов в E. А задать последовательность в E – то же самое, что описать куда поставить n − 1
нулей в строке из m + n − 1 элементов. То есть выбрать подмножество мощности n − 1 в множестве
n−1
мощности m + n − 1. По теореме 13.1.13 таких подмножеств имеется Cm+n−1 .

⋄ 13.1.18. В кондитерской 10 видов пирожных. что выбрать подмножество мощности 4 в мно-


Покупатель выбрал 8. Какова вероятность, что жестве мощности 10. По теореме 13.1.13 таких
4
1) все выбранные пирожные будут одного вида, вариантов имеется C10 . Получается, вероятность
такого события равна
2) выбранные пирожные будут разных видов (то
4
есть не все одного вида), C10
P = 9 .
3) будут выбраны по 2 пирожных одного вида? C17

Здесь выбрать пирожные – это то же самое, ⊲ 13.1.19. В библиотеке книги по 16 разделам.


что сделать выборку из 10 элементов объема 8. Заказано 10 книг. Какова вероятность, что
По формуле (13.1.13) число таких выборок будет 1) все заказанные книги будут из одного разде-
10−1 9
равно C8+10−1 = C17 . ла,
1. В первом случае имеется всего 10 способов
2) заказанные книги будут не из одного раздела,
выбрать пирожные (так, чтобы они были одного
вида). Поэтому вероятность будет 3) никакие две книги не будут из одного разде-
ла?
10
P = 9 . ⋄ 13.1.20. m одинаковых шаров случайно рас-
C17
кладываются по n урнам. Найти вероятность,
2. Во втором случае сделать выбор – значит что
сделть выборку, отличную от случая 1. Таких 1) все шары лягут в 1-ю урну,
9
выборок понятное дело, будет C17 − 10. Вероят-
2) в 1-у урну не попадет ни одного шара,
ность такого события
9
3) все шары лягут в какую-то одну урну?
C17 − 10 10
P = 9 =1− 9 . Здесь разложить шары по урнам – то же са-
C17 C17
мое, что задать выборку из n элементов объемом
3. Во третьем случае сделать выбор – значит m. По формуле (13.1.13) таких выборок имеется
n−1
выбрать 4 вида пирожных из 10. Это то же самое, Cm+n−1 .
§ 1. Комбинаторика 723

1. В первой ситуации благоприятный исход По формуле (13.1.13) таких выборок имеется


n−2
имеется один: (m, 0, ..., 0). Поэтому вероятность Cm+n−2 . Вероятность такого события равна
этого события равна
1 C n−2
P = n−1 . P = m+n−2
n−1 .
Cm+n−1 Cm+n−1
2. Во второй ситуации благоприятным исхо- 3. В третьей ситуации благоприятных исхо-
дом является любая выборка (k1 , k2 , ..., kn ), у ко- дов будет n, потому что выбрать благоприятный
торой первый элемент нулевой, k1 = 0. Задать исход - то же самое, что выбрать урну, куда по-
такую выборку – то же самое, что задать остав- падут все шары. В результате вероятность будет
шиеся элементы (k2 , ..., kn ) (с условием, что их
сумма будет равна m). Это то же самое, что за- n
P = n−1 .
дать выборку из n − 1 элементов объемом m. Cm+n−1

Разбиения. Пусть нам дано число n ∈ N и множество S.


• Разбиением множества S длины n называется произвольная последовательность мно-
жеств K1 , ..., Kn (из которых некоторые могут быть пустыми) со свойствами:
n
[
S= Ki , ∀i 6= j Ki ∩ Kj = ∅, ∀i = 1, ..., k.
i=1

Множество всех разбиений множества S длины n обозначается nS .

Теорема 13.1.21. Число разбиений длины n конечного множества S мощности m равно

card(nS ) = nm (13.1.14)

Доказательство. Каждому разбиению K = {K1 , ..., Kn } ∈ nS множества S поставим в соответствие


функцию

f : S → {1, ..., n} f (x) = i ⇔ x ∈ Ki .

Это будет взаимно однозначным отображением между разбиениями K = {K1 , ..., Kn } ∈ nS и функ-
циями f ∈ {1, ..., n}S . Поэтому мощность множества разбиений nS совпадает с мощностью множе-
ства функций {1, ..., n}S :
card(nS ) = card({1, ..., n}S )
Остается проверить, что второе число равно nm . Для этого заметим, что если заменить множество
S на равномощное ему множество {1, ..., m}, то получающиеся множества функций будут равно-
мощны:
card({1, ..., n}S ) = card({1, ..., n}{1,...,m})
Теперь заметим, что функция f ∈ {1, ..., n}{1,...,m} — это строка длины m из элементов множества
{1, ..., n}:
f = (f (1), f (2), ..., f (m)), f (i) ∈ {1, ..., n}.
Выбрать первый элемент f (1) такой строки можно n способами, второй, f (2), — тоже n способами,
и так далее до последнего, f (m), который тоже можно выбрать n способами. Поэтому по теореме
13.1.2 (по правилу комбинаторного умножения) выбрать функцию f можно nm способами. Это
значит, что
card({1, ..., n}{1,...,m}) = nm .

Пусть далее S — по-прежнему, множество мощности m, и путь нам дан некий мультииндекс
k = (k1 , ..., kn ) объема m:
|k| = k1 + k2 + ... + kn = m.
724 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

• Разбиением множества S типа (k1 , ..., kn ) называется последовательность множеств K1 , ..., Kn


со свойствами:
n
[
S= Ki , ∀i 6= j Ki ∩ Kj = ∅, ∀i = 1, ..., k card Ki = ki .
i=1

Множество всех разбиений множества S типа k = (k1 , ..., kn ) обозначается CSk1 ,...,kn .
Теорема 13.1.22. Число разбиений типа (k1 , ..., kn ) конечного множества S мощности m равно6
 
k1 ,...,kn m m!
Cm = = (13.1.15)
k1 , ..., kn k1 ! · ... · kn !

Доказательство. Подсчитаем, сколькими способами можно выбрать разбиение K1 , ..., Kn множе-


ства S:
— первое множество K1 (из k1 элементов в множестве из m элементов) можно по теореме
k1
13.1.13 выбрать Cm способами,
— после того, как K1 выбрано, второе множество K2 (из k2 элементов в множестве из остав-
k1
шихся m − k1 элементов) можно по теореме 13.1.13 выбрать Cm−k 1
способами,
— после того, как K1 и K2 выбраны, третье множество K3 (из k3 элементов в множестве из
k1
оставшихся m − k1 − k2 элементов) можно по теореме 13.1.13 выбрать Cm−k 1
способами,
...
— и последнее множество, Kn уже нужно будет выбирать из множества мощности m − k1 −
k2 − ... − kn−1 = kn элементов, и оно уже будет выбираться однозначно.
В результате по правилу комбинаторного умножения (теорема 13.1.2) мы получаем, что способов
выбрать разбиение K1 , ..., Kn множества S имеется

k1 k2 k3 m−1 k
Cm · Cm−k1
· Cm−k1 −k2
· ... · Cm−k1 −k2 −...−km−2
·1 =
m! (m − k1 )! (m − k1 − k2 )! (m − k1 − k2 − ... − kn−1 )!
= · · · ... · =
k1 !(m − k1 )! k2 !(m − k1 − k2 )! k3 !(m − k1 − k2 − k3 )! kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )!
m! m!
= =
k1 ! · k2 ! · k3 ! · ... · kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )! k1 ! · k2 ! · k3 ! · ... · kn−1 ! · kn !

⋄ 13.1.23. Сколькими способами можно разде- разбиений имеется


лить 3m предметов между 3 людьми поровну? 10!
3,3,4
Здесь речь идет о разбиении типа (m, m, m), C10 = .
3!3!4!
поэтому по теореме 13.1.22 число разбиений рав- Далее, разместить 10 человек так, чтобы двое по-
но пали в 4-местный номер – все равно, что разме-
m,m,m (3m)! (3m)! стить оставшихся 8 человек по номерам вмести-
C3m = = . мостью 3, 3 и 2 (оставшиеся 2 места в 4-местном
m! · m! · m! (m!)3
номере). Это в свою очередь эквивалентно раз-
⋄ 13.1.24. 10 человек случайно размещаются в биению 8-элементного множества типа (3, 3, 2), и
гостиннице по трем номерам: таких разбиений имеется
8!
— 2 номера 3-местных, и C83,3,2 =
.
3!3!2!
— 1 номер 4-местный. Вероятность, что А и Б попадут в 4-местный но-
Какова вероятность, что два конкретных чело- мер равна отношению числа благоприятных ис-
века, А и Б, попадут в 4-местный номер? ходов для этого события к числу всех возможных
исходов:
Разместить 10 человек по таким номерам –
все равно что выбрать разбиение 10-элементного C83,3,2 8!
3!3!2! 8!4! 4·3 1
P = 3,3,4 = 10!
= = = .
множества (из 10 человек) типа (3, 3, 4). Таких C10 10!2! 10 · 9 15
3!3!4!
6 Число k1 ,...,kn
Cm в формуле (13.1.15) называется иногда мультиномиальным коэффициентом.
§ 1. Комбинаторика 725

⋄ 13.1.25. В ящике имеется k1 + k2 + ... + kn = m множества мест (индексов) {1, 2, 3, 4, 5}. Напри-
кубиков разных цветов: мер, последовательность
— k1 кубиков первого цвета, (1, 1, 3, 3, 6) (13.1.16)
— k2 кубиков второго цвета,
... порождает такое разбиение множества мест:
— kn кубиков n-го цвета. {1, 2}, {3, 4}, {5}.
Случайным образом кубики раскладываются в
– здесь первое множество, {1, 2}, показывает, что
ряд. Какова вероятность, что первые k1 кубиков
на первых двух местах в (13.1.16) стоят едини-
окажутся первого цвета?
цы, второе множество, {3, 4} – что на третьем и
Решение. Разложить кубики в ряд – все четвертом месте стоят тройки, а последнее мно-
равно, что разбить множество {1, 2, ..., m} на
жество – что на пятом месте стоит шестерка.
подмножества (K1 , K2 , ..., Kn ) типа (k1 , k2 , ..., kn )
Наоборот, если дано, например, разбиение
(потому что каждое такое разбиение показывает,
какой цвет имеет кубик с данным номером). Та- {2, 4}, {1, 5}, {3}.
ких разбиений имеется
то ему соответствует последовательность выпвв-
k1 ,...,kn m! ших цифр
Cm = .
k1 ! · ... · kn ! (3, 1, 6, 1, 3).
Среди них имеются разбиения, у которых эле- Таким образом, описать распределение вы-
менты первого множества K1 находятся на пер- павших костей с 2 единицами, 2 тройками и 1 ше-
вых k1 местах. Выбрать такое разбиение – стеркой – то же самое, что задать разбиение типа
все равно что выбрать расположение остальных (2, 2, 1) множества мест (индексов) {1, 2, 3, 4, 5}.
множеств K2 , ..., Kn , то есть выбрать разбиение Получается, что между нужными распределе-
множества {k1 + 1, ..., m} (из m − k1 элементов) ниями выпавших костей и разбиенями имеется
по типу (k2 , ..., kn ). Таких разбиений имеется взаимно однозначное соответствие. А по теореме
13.1.22 таких разбиений имеется
k2 ,...,kn (m − k1 )!
Cm−k = . 5!
1
k2 ! · ... · kn ! C52,2,1 = = 5 · 3 · 2 = 30.
2! · 2! · 1!
Вероятность, что попадется именно такое разби-
Теперь вероятность выпадения нужного распре-
ение равна отношению числа таких разбиений к
деления
числу всех разбиений: 30 5
P = 5 = 4.
(m−k1 )! 6 6
C k2 ,...,kn
(m − k1 )! · k1 !
P = m−k 1
k1 ,...,kn
= k2 !·...·kn !
m!
= . 2. Во втором вопросе благоприятным исходом
Cm k !·...·k !
m! является размещение длины 5 из элементов мно-
1 n

жества {1, 2, 3, 4, 5, 6}. По формуле (13.1.4) таких


⋄ 13.1.26. Бросается 5 игральных костей. Найти последовательностей имеется
вероятности, что
6!
1) выпадут 2 единицы, 2 тройки и 1 шестерка, A56 = = 6!.
(6 − 5)!
2) выпадут неповторяющиеся цифры,
3) выпадут ровно 3 одинаковые цифры. Вероятность, что выпадет такое распределение

Решение. Результат бросания 5 костей мож- 6! 5!


P = 5 = 4.
но понимать как последовательность длинной 5 6 6
из цифр 1, 2, 3, 4, 5, 6. Например, последователь- 3. В третьем вопросе число благоприятных
ность распределений выпавших костей можно посчи-
(3, 1, 4, 2, 2) тать с помощью правила комбинаторного умно-
означает, что первая косточка выпала цифрой 3, жения. Выбрать последовательность длины 5, в
вторая – цифрой 1, третья – цифрой 4, четвертая которой ровно 3 одинаковых цифры из множе-
и пятая – цифрой 2. Таких последовательностей ства {1, 2, 3, 4, 5, 6} можно так:
имеется — сначала выбираются 3 места, куда лягут эти
6 · 6 · 6 · 6 · 6 = 65 . одинаковые цифры; это то же самое, что вы-
1. Заметим, что каждую последовательность, брать подмножество мощности 3 в множестве
удовлетворяющую первому условию (то есть та- индексов мощности 5, поэтому таких вариан-
кую, в которой 2 единицы, 2 тройки и 1 шестер- тов имеется
5!
ка) можно понимать как разбиение типа (2, 2, 1) C53 = ;
3! · 2!
726 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

— после этого выбираем цифру, которая на эти 2 · 3 · 133 133


= = .
3 места ляжет; всего вариантов имеется 49 · 50 · 51 49 · 25 · 17
2. Во втором вопросе благоприятные исходы
6
считаются так:
— затем на оставшиеся 3 места выбираем цифры — сначала выбираем игрока, который получит
из оставшизся 4-х, причем с условием, чтобы карты одной масти, таких вариантов имеется
они не повторялись; это то же самое, что вы-
брать размещение длины 2 в множестве мощ- 4,
ности 2, и по формуле (13.1.4) таких последо-
— затем выбираем масть, которую он получит,
вательностей имеется
таких вариантов имеется тоже
4!
A24 = = 12. 4
(4 − 2)!
По правилу комбинаторного умножения (теоре- — после этого распределяем оставшиеся 39 карт
ма 13.1.2), число таких последовательностей рав- по оставшимся 3 игрокам, это то же самое,
но что задать разбиенти типа 13, 13, 13 множе-
5! ства из 39 элементов, вариантов будет
· 6 · 12.
3! · 2! 39!
13,13,13
Вероятность выпадения такой комбинавции C39 = .
(13!)3
5!
3!·2! · 6 · 12 5! По правилу комбинаторного умножения (теоре-
P = = 4.
65 6 ма 13.1.2), всего благоприятных исходов будет
⋄ 13.1.27. 52 карты раздаются по 4 игрокам 39!
(каждому по 13 карт). Найти вероятность того, 4·4· .
(13!)3
что
Вероятность такого распределения карт
1) каждый игрок получит туза,
39!
2) какой-то игрок получит карты только одной 4·4· (13!)3 42 · 39! · 13
P = = .
масти, 52! 52!
(13!)4
3) все тузы попадут к одному игроку,
3. В третьем вопросе:
4) двое определенных игроков не получат ни од-
ного туза. — сначала выбираем игрока, которому попадут
тузы, таких вариантов имеется
Здесь задать распределение карт – то же что
задать разбиение типа (13, 13, 13, 13) множества 4,
из 52 карт. Таких разбиений всего
— после этого распределяем оставшиеся 48 карт,
13,13,13,13 52! это то же самое, что задать разбиенти типа
C52 = .
(13!)4 9, 13, 13, 13 множества из 48 элементов, вари-
антов будет
1. В первом вопросе число благоприятных ис-
ходов можно посчитать так: 9,13,13,13 48!
C48 = .
— сначала раздаем тузы по 4 игрокам, всего ва- 9! · (13!)3
риантов По правилу комбинаторного умножения (теоре-
A44 = 4!, ма 13.1.2), всего благоприятных исходов будет
— потом распределяем остальные 48 карт по 4 48!
игрокам, всего вариантов 4· .
9! · (13!)3
12,12,12,12 48! Вероятность такого распределения карт
C48 =
(12!)4
48!
4· 9!·(13!)3 4 · 13
В результате благоприятных исходов P = = =
52! 9 · 49 · 50 · 51 · 52
(13!)4
48!
4! · . 1
(12!)4 = .
9 · 49 · 50 · 51
Вероятность такого распределения карт 4. В четвертом вопросе будем считать, что ту-
48! зы должны получить только 1-й и 2-й игроки (а
4! · 4! · 48! · 134 2 · 3 · 4 · 134
= 3-й и 4-й их не получат). Здесь придется рассмот-
(12!)4
P = 52!
= =
(13!)4
52! 49 · 50 · 51 · 52 реть 5 случаев:
§ 1. Комбинаторика 727

a) сначала считаем, что 1-й игрок получил все e) наконец, остается вариант, когда 1-й игрок не
4 туза, а 2-й (и остальные) – ни одного; то- получает тузов, и 2-й получает все 4 туза; то-
гда оставшиеся 48 карт распределятся в про- гда оставшиеся 48 карт распределятся в про-
порции (9, 13, 13, 13), и число таких вариантов порции (13, 9, 13, 13), и число таких вариантов
будет будет
9,13,13,13
C48 , 13,9,13,13
C48 .
b) затем рассматриваем ситуацию, когда 1-й иг-
рок получил 3 туза, а 2-й – 1 туз; тогда остав-
Эти множества исходов не пересекаются (то есть
шиеся 48 карт распределятся в пропорции
не может быть, чтобы какое-то распределение
(10, 12, 13, 13), и число таких вариантов будет
карт подходило, например, под случай a и од-
10,12,13,13
C48 , новременно под случай b). Поэтому общее число
таких исходов равно сумме чисел в каждом ва-
c) затем считаем, что 1-й игрок получил 2 ту-
рианте:
за, и 2-й – 2 туза; тогда оставшиеся 48 карт
распределятся в пропорции (11, 11, 13, 13), и
9,13,13,13 10,12,13,13 11,11,13,13
число таких вариантов будет C48 + C48 + C48 +
11,11,13,13 12,10,13,13 13,9,13,13
C48 , + C48 + C48 .

d) затем рассматриваем ситуацию, когда 1-й иг-


рок получил 1 туз, и 2-й – 3 туза; тогда остав- Вероятность такого распределения карт
шиеся 48 карт распределятся в пропорции
(12, 10, 13, 13), и число таких вариантов будет 9,13,13,13 10,12,13,13 11,11,13,13
P = (C48 + C48 + C48 +
12,10,13,13 12,10,13,13 13,9,13,13 13,13,13,13
C48 , + C48 + C48 )/C52

• Представлением мультииндекса k ∈ Mn [m] (m = |k|) называется произвольная последо-


вательность σ : {1, ..., m} → {1, ..., n} со свойством

∀i ∈ {1, ..., n} card σ −1 (i) = ki .

Множество всех представлений мультииндекса k ∈ Mn [m] обозначается Rep(k).


Теорема 13.1.28. Число представлений данного мультииндекса k ∈ Mn [m] равно
 
k1 ,...,kn |k| |k|! |k|!
card Rep(k) = C|k| = = = (13.1.17)
k k! k1 ! · ... · kn !

Доказательство. Задать представление мультииндекса k ∈ Mn [m] – то же самое, что задать разби-


k1 ,...,kn
ение типа k1 , ..., kn множества {1, ..., m}. А по теореме 13.1.22 таких разбиений имеется C|k| .

⋄ 13.1.29. В примере 13.1.18 предположим, что равно что выбрать представление мультииндекса
выборка пирожных была такой: (4, 3, 1) (то есть 4 (2, 2) (первая двойка означает, что в нашем слове
одного вида, 3 другого и еще 1 третьего). Сколь- две буквы “а”, а вторая — что две буквы “м”). По
кими способами их можно распределить между теореме 13.1.28 таких представлений всего
8 людьми за столом?
4!
Здесь распределить пирожные между людь- = 6.
ми – то же самое, что задать разбиение людей 2! · 2!
типа (4, 3, 1). Таких разбиений будет по теореме 2. Выбрать перестановку слова “математика”
13.1.22 (или по теореме 13.1.28) C84,3,1 = 4!·3!·1!
8!
. — все равно что выбрать представление мульти-
индекса (3, 1, 1, 2, 2) (3 буквы “а”, 1 буква “е”, 1
⋄ 13.1.30. Сколько разных слов можно полу- буква “к”, 2 буквы “м”, 2 буквы “т”). По теореме
чить перестановками слов 13.1.28 таких представлений всего
1) “мама”,
9!
2) “математика”, = 9 · 8 · 7 · 6 · 5.
3! · 1! · 1! · 2! · 2!
3) “комбинаторика”?
3. Выбрать перестановку слова “комбинато-
1. Выбрать перестановку слова “мама” — все рика” — все равно что выбрать представление
728 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

мультииндекса (2, 1, 2, 2, 1, 1, 2, 1, 1) (2 буквы “а”, По теореме 13.1.28 таких представлений всего


1 буква “б”, 2 буквы “и”, 2 буквы “к”, 1 буква “м”,
1 буква “н”, 2 буквы “о”, 1 буква “р”, 1 буква “т”). 13! 13!
= .
2! · 1! · 2! · 2! · 1! · 1! · 2! · 1! · 1! 8

(b) Перестановки
• Перестановкой длины n ∈ N∗ называется произвольное биективное отображение началь-
ного интервала {1, ..., n} натурального ряда в себя:

σ : {1, ..., n} → {1, ..., n}

На с.73 мы определили конечные последовательности как отображения с областью опре-


деления на конечном ординале. Нам будет удобно немного видоизменить это определение:
под конечной последовательностью мы будем понимать отображение с областью определе-
ния на начальном интервале {1, ..., n} натурального ряда. Поэтому перестановку σ длины
n также удобно записывать в виде конечной последовательности (строки):

σ = (σ(1), σ(2), ..., σ(n)) (13.1.18)

Множество всех перестановок длины n обозначается символом Sn .

Число перестановок.

Теорема 13.1.31. Число всех перестановок длины n равно n!:

card Sn = n! (13.1.19)

Доказательство. Каждую перестановку σ : {1, ..., n} → {1, ..., n} можно представлять себе как
размещение длины n в множестве мощности n. По формуле (13.1.4) число таких размещений будет
равно
n!
Ann = = n!.
(n − n)!

Пусть τ : {1, ..., m} → {1, ..., n} – произвольное отображение. Условимся говорить, что переста-
новка σ : {1, ..., m} → {1, ..., m} не меняет отображение τ , если

τ ◦ σ = τ.

Теорема 13.1.32. Число перестановок σ : {1, ..., m} → {1, ..., m} не меняющих отображение τ :
{1, ..., m} → {1, ..., n} равно
n
Y
card{σ ∈ Sm : τ ◦ σ = τ } = card τ −1 (i)!. (13.1.20)
i=1

В частном случае, если τ является представлением мультииндекса k, то число перестановок его


аргументов, не меняющих τ , равно факториалу мультииндекса k:

card{σ ∈ Sm : τ ◦ σ = τ } = k!. (13.1.21)

Доказательство. Выбрать такую перестановку σ – все равно что сначала выбрать перестановку
индексов, лежащих в множестве τ −1 (1) (таких перестановок имеется card τ −1 (1)!), затем выбрать
перестановку индексов, лежащих в множестве τ −1 (2) (таких перестановок имеется card τ −1 (2)!), и
так далее. Вместе по правилу комбинаторного умножения имеется card τ −1 (1)! · card τ −1 (2)! · ... ·
card τ −1 (n)! перестановок.
§ 1. Комбинаторика 729

Группа перестановок Sn . Для любых двух перестановок σ и τ длины n их композиция σ ◦ τ


определяется как обычная композиция отображений7 из {1, ..., n} в {1, ..., n}:

(σ ◦ τ )(i) = σ(τ (i)), i ∈ {1, ..., n} (13.1.22)

Множество Sn всех перестановок образует группу относительно этой операции, Это означает, что,
во-первых, выполняется тождество ассоциативности,

(σ ◦ τ ) ◦ υ = σ ◦ (τ ◦ υ), σ, τ, υ ∈ Sn ,

во-вторых, существует некий элемент e ∈ Sn , а именно, тождественная перестановка

e(i) = i, i ∈ {1, ..., n}, (13.1.23)

характеризуемый условием
σ ◦ e = σ = e ◦ σ, σ ∈ Sn ,
и, в третьих, у любой перестановки σ ∈ Sn существует обратная перестановка σ −1 ∈ Sn (обратное
отображение8 для биекции σ), характеризуемая условием

σ ◦ σ −1 = e = σ −1 ◦ σ.

Циклы. Говорят, что перестановка σ ∈ Sn оставляет неподвижным элемент k множества {1, ..., n},
если
σ(k) = k.
В противном случае, если
σ(k) 6= k,
говорят, что перестановка σ ∈ Sn сдвигает элемент k.
Говорят, что перестановка σ ∈ Sn связывает два элемента k и l множества {1, ..., n}, если для
некоторого m ∈ Z
σ m (k) = l.
Циклом или циклической перестановкой длины n ∈ N∗ называется всякая перестановка σ ∈ Sn ,
которая связывает любые два сдвигаемых ею элемента k, l ∈ {1, ..., n}:
 
σ(k) 6= k & σ(l) 6= l =⇒ ∃m ∈ Z σ m (k) = l.

Всякая последовательность попарно различных элементов {a1 , ..., ar } множества {1, ..., n} опре-
деляет цикл, обозначаемый символом (a1 a2 ... ar ), по формуле


k, k∈/ {a1 , ..., ar }
(a1 a2 ... ar )(k) = ai+1 , k = ai , i < r . (13.1.24)


a1 , k = ar

(отличие от записи (13.1.18) в том, что здесь элементы строки ai разделяются пробелами, а не
запятыми).

Теорема 13.1.33. Всякая перестановка σ ∈ Sn представима в виде композиции некоторого числа


циклов.

Доказательство. Для любых двух элементов k и l множества {1, ..., n} условимся писать k ∼ l
если перестановка σ связывает эти элементы. Нетрудно видеть, что отношение ∼ является отно-
шением эквивалентности на {1, ..., n}. Поэтому оно разбивает {1, ..., n} на классы эквивалентности.
Обозначим их I1 , ..., Ip . Для каждого q = 1, ..., p положим
(
σ(k), k ∈ Iq
τq (k) =
k, k∈/ Iq
7 Напомним, что композиция отображений была определена на с.39 части I.
8 Обратное отображение определялось на с.41.
730 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Нетрудно заметить, что каждое отображение τq является циклической перестановкой длины n. С


другой стороны, для всякого k ∈ {1, ..., n} выбрав номер q так, чтобы k ∈ Iq , мы получим

Ip Ip−1

6=

6=
Iq Iq


(τ1 ◦ ... ◦ τq ◦ ... ◦ τp )( k ) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τp−1 )( k ) = ... = (τ1 ◦ ... ◦ τq )(k) =
= (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−1 )(σ(k)) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−2 )(σ(k)) = τ1 (σ(k)) = σ(k)


Iq Iq Iq

6=

6=

6=
Iq−1 Iq−2 I1

(мы здесь для наглядности считаем, что 2 < q < p − 1). То есть композиция циклов τq совпадает с
σ:
τ1 ◦ ... ◦ τp = σ
(при этом можно заметить, что последовательность перемножения циклов τq здесь не важна, при
любой их перестановке результатом все равно будет σ).

Транспозиции.
• Транспозицией называется цикл, сдвигающий ровно два элемента, то есть перестановка,
меняющая местами два числа i 6= j, а остальные оставляющая на месте:


k, k ∈/ {i, j}
(i j)(k) = j, k = i . (13.1.25)


i, k = j

Отметим следующее тождество:

(a b) ◦ (a c) = (a c) ◦ (b c) (13.1.26)

Его достаточно проверить на трех элементах, a, b, c:


   
(a b) ◦ (a c) (a) = (a b) (a c)(a) = (a b)(c) = c = (a c)(a) = (a c) (b c)(a) = (a c) ◦ (b c) (a),
   
(a b) ◦ (a c) (c) = (a b) (a c)(c) = (a b)(a) = b = (a c)(b) = (a c) (b c)(c) = (a c) ◦ (b c) (c),
   
(a b) ◦ (a c) (b) = (a b) (a c)(b) = (a b)(b) = a = (a c)(c) = (a c) (b c)(b) = (a c) ◦ (b c) (b).

Теорема 13.1.34. Всякая перестановка представима в виде композиции транспозиций

π = τm ◦ ... ◦ τ1 (13.1.27)

(в частном случае, когда σ = e это утверждение следует понимать так, что в правой части
стоит пустое множество транспозиций).

Доказательство. По теореме 13.1.33 достаточно доказать это утверждение для циклов. Пусть σ –
какой-нибудь цикл. Выберем какой-нибудь элемент a1 ∈ {1, ..., n}, который σ сдвигает. Положим
затем
ai+1 = σ(ai ),
для всех i, меньших общего числа r сдвигаемых элементов. Тогда

σ = (a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 ).

Действительно, подставляя в качестве аргумента a1 , мы получим

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a2 ) = a2 ,

затем для a2

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a3 ) = a3 ,
§ 1. Комбинаторика 731

затем для a3

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a1 ) = a4 ,

и так далее, и наконец для ar ,

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(ar ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(ar ) = (a1 ar )(ar ) = a1 .

Остается заметить, что все остальные элементы, то есть не лежащие в множестве {a1 , ..., ar } явля-
ются неподвижными как для σ, так и для всех транспозиций (a1 ai ).

Теорема 13.1.35. Всякая транспозиция является композицией некоторого набора транспозиций


соседних чисел, а именно

(i i+k) = (i i+1)◦(i+1 i+2)◦...◦(i+k−2 i+k−1)◦(i+k−1 i+k)◦(i+k−1 i+k−2)◦...◦(i+2 i+1)◦(i+1 i)


(13.1.28)

Знак перестановки и четность.

Теорема 13.1.36. В разложении любой перестановки π ∈ Sn в композицию транспозиций

π = τp ◦ ... ◦ τ1 (13.1.29)

число
sgn π = (−1)p (13.1.30)
не зависит от выбора разложения (13.1.29).

• Число sgn π в (13.1.30) называется знаком перестановки π ∈ Sn . Если sgn π = 1, то π


называется четной перестановкой, а если sgn π = −1, то нечетной.
Для доказательства нам понадобятся две леммы.

Лемма 13.1.37. Если σ и τ – две неодинаковые транспозиции, то для всякого элемента i ∈


{1, ..., n}, сдвигаемого транспозицией τ можно подобрать две транспозиции σ ′ и τ ′ так, чтобы

σ ◦ τ = σ′ ◦ τ ′ , σ ′ (i) 6= i, τ ′ (i) = i.

Доказательство. Пусть τ = (i j). Тогда возможны варианты:


— σ = (k l), где {k, l} ∩ {i, j} = ∅, и в этом случае

σ ◦ τ = (k l) ◦ (i j) = (i j) ◦ (k l),

— σ = (i k), где k ∈
/ {i, j}, и в этом случае

σ ◦ τ = (i k) ◦ (i j) = (13.1.26) = (i j) ◦ (j k),

— σ = (j k), где k ∈
/ {i, j}, и в этом случае

σ ◦ τ = (j k) ◦ (i j) = (13.1.26) = (i k) ◦ (j k).

Лемма 13.1.38. В любом разложении тождественной перестановки в композицию транспози-


ций
e = τp ◦ ... ◦ τ1 (13.1.31)
число сомножителей p четно.

Доказательство. Заметим сразу, что p не может быть единицей, потому что иначе мы получили
бы, что тождественная перестановка сама является транспозицией:

e = τ.
732 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Предположим далее, что мы доказали, что p не может быть нечетным числом в интервале между
1 и некоторым P . Пусть p = P + 2 (то есть нечетное число, следующее за P ). Если в разложении
(13.1.31) какие-то две рядом стоящие транспозиции одинаковы

τi+1 = τi ,

то в композиции они дают e, и поэтому на них можно сократить, и мы опять получим равенство
(13.1.31), в котором p = P , и это равенство будет невозможно по предположению индукции.
Поэтому можно считать, что никакие две рядом стоящие транспозиции в (13.1.31) неодинаковы.
Выберем теперь элемент i, сдвигаемый транспозицией τ1 . По лемме 13.1.37 существуют транспози-
ции τ2′ и τ1′ такие, что
τ2 ◦ τ1 = τ2′ ◦ τ1′ , τ2′ (i) 6= i, τ1′ (i) = i.

После этого опять по лемме 13.1.37 существуют транспозиции τ3′ и τ2′′ такие, что

τ3 ◦ τ2′ = τ3′ ◦ τ2′′ , τ3′ (i) 6= i, τ2′′ (i) = i.

И так далее. В конце этой процедуры мы получим (вернув в обозначениях где нужно один штрих
вместо двух) равенство
e = τp′ ◦ ... ◦ τ1′

в котором последняя перестановка τp′ сдвигает элемент i, а первые p − 1 перестановок τ1′ , ..., τp−1

оставляют его на месте:


τp′ (i) 6= i, ′
τp−1 (i) = ... = τ1′ (i) = i.

Вместе это дает противоречие:

i = e(i) = τp′ ◦ ... ◦ τ1′ (i) = τp′ (i) 6= i.

Доказательство теоремы 13.1.36. Пусть заданы два разложения перестановки π на транспозиции:

π = τp ◦ ... ◦ τ1 = σq ◦ ... ◦ σ1

Тогда

e = π ◦ π −1 = (τp ◦ ... ◦ τ1 ) ◦ (σq ◦ ... ◦ σ1 )−1 = τp ◦ ... ◦ τ1 ◦ σ1−1 ◦ ... ◦ σq−1 = τp ◦ ... ◦ τ1 ◦ σ1 ◦ ... ◦ σq

По лемме 13.1.38 число сомножителей здесь p + q должно быть четно. Поэтому либо оба числа p и
q четны, либо оба они нечетны. В каждом из вариантов

(−1)p = (−1)q .

Свойства перестановок:

10 . Тождественная перестановка четна:

sgn e = 1 (13.1.32)

20 . Знак композиции равен произведению знаков:

sgn(π ◦ σ) = sgn π · sgn σ (13.1.33)

30 . При переходе к обратной перестановке знак не меняется:

sgn π −1 = sgn π (13.1.34)


§ 1. Комбинаторика 733

Доказательство. 1. Четность тождественной перестановки доказана в лемме 13.1.38.


2. Если перестановки π и σ обе четные, то есть их можно разложить в композицию трансвер-
сий с четным числом множителей, то их произведение также будет композицией четного набора
трансверсий, поэтому π ◦ σ тоже четное, и мы получаем
sgn(π ◦ σ) = 1 = 1 · 1 = sgn π · sgn σ.
Если перестановки π и σ обе нечетные, то есть их можно разложить в композицию трансверсий с
нечетным числом множителей, то их произведение снова будет композицией четного набора транс-
версий, поэтому π ◦ σ тоже четное, и мы получаем
sgn(π ◦ σ) = 1 = (−1) · (−1) = sgn π · sgn σ.
Если π четная, а σ нечетная, то π раскладывается в композицию четного набора трансверсий, а σ
в композицию нечетного набора, и поэтому их произведение будет композицией нечетного набора
трансверсий. То есть π ◦ σ в этом случае нечетное, и мы получаем
sgn(π ◦ σ) = −1 = 1 · (−1) = sgn π · sgn σ.
И точно так же если π нечетная, а σ четная.
3. Если π = τp ◦ ... ◦ τ1 , то π −1 = τ1−1 ◦ ... ◦ τp−1 = τ1 ◦ ... ◦ τp . То есть π и π −1 имеют разложения с
одинаковым числом трансверсий, поэтому четность этих перестановок тоже одинакова.

Перестановка, как смена порядка. Напомним, что в главе 3 на с.188 мы аксиоматически


ввели понятие сравнения чисел. В математике сравнивать можно не только числа, но и элементы
разных абстрактных множеств, например, функции, матрицы, подмножества и так далее. Точное
определение понятию порядка на множестве выглядит как естественная модификация определения
на с.188:
• Пусть N – некоторое множество и пусть среди всевозможных пар (a, b) его элементов
a, b ∈ N выделены такие, для которых справедливо (подходящим образом определенное)
высказывание «a меньше, либо равно b», записываемое a  b, и при этом выполняются
следующие правила.
O1. Рефлексивность: для любого a справедливо a  a.
O2. Транзитивность: если a  b и b  c, то a  c.
O3. Антисимметричность: если a  b и b  a, то a = b.
Тогда говорят, что на множестве N задан частичный порядок .
• Если дополнительно выполняется аксиома
O4. Линейность: для любых a и b верно одно из двух:
– либо a  b;
– либо b  a.
порядок  на множестве N называется линейным.

⋄ 13.1.39. Индуцированный порядок на зательно задавать таким способом (то есть ин-
множестве чисел. Если N – подмножество в дуцируя его из R). Например, если выбрать про-
множестве чисел R, то на нем можно рассмот- извольную инъективную последовательность чи-
реть линейный порядок, индуцированный из R, сел x1 , ..., xk (то есть размещение, определенное
то есть такой, при котором неравенство a  b вы- на с.718), то в ней порядок можно определить
полняется, если оно верно, как неравенство чисел как порядок индексов:
(в линейно упорядочнном множестве R):
xi  xj ⇐⇒ i 6 j.
ab ⇐⇒ a 6 b.
⋄ 13.1.40. Порядок, заданный нумераци- (Понятно, что это необязательно то же самое,
ей. Но порядок на числовом множестве необя- что xi 6 xj .)

Ниже из линейно упорядоченных множеств нас будут интересовать только конечные. Справед-
лива
734 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Теорема 13.1.41. Всякий линейный порядок на конечном множестве N задается некоторой ну-
мерацией элементов этого множества: существует биективное отображение

τN : {1, ..., n} → N

где n = card N – число элементов N , такое, что


 
∀i, j ∈ {1, ..., n} τN (i)  τN (j) ⇐⇒ i6j . (13.1.35)

• Отображение τN : {1, ..., n} → N с этими свойствами называется отображением нумера-


ции по возрастанию элементов линейно упорядоченного множества N .
Пусть N – линейно упорядоченное конечное множество. По теореме 13.1.41 его порядок задается
некоторой нумерацией его элементов. Если мы поменяем парядок на N , то это автоматически будет
означать, что нумерация его элементов тоже сменится. При этом нам будет удобно следить за тем,
как по новым номерам можно восстановить старые: элементу с новым номером 1 соответствует
определенный старый номер σ(1), элементу с новым номером 2 – старый номер σ(2), и так далее.
В результате у нас получится некоторое биективное отображение σ : {1, ..., n} → {1, ..., n}, то есть
перестановка σ ∈ Sn .
Это полезно изобразить некоей картинкой. Условимся считать, что буква N обозначает не только
множество N , но и исходный порядок на нем , а буква N ′ означает то же самое множество с новым
порядком ′ . Обозначим какой-нибудь буквой, например, ι, тождественное отображение N в себя,

ι(x) = x, x ∈ N, (13.1.36)

то перестановка σ, о которой мы говорим, становится элементом следующей диаграммы:


ι / N′
NO O (13.1.37)

τN τN ′

{1, ..., n} o σ {1, ..., n}

(где τN и τN ′ – отображения нумерации элементов N и N ′ ).


Мы получаем следующее утверждение:
Теорема 13.1.42. Смена линейного порядка на конечном множестве N эквивалентна переста-
новке индексов в его нумерации.
! 13.1.43. В дальнейшем нас будет интересовать почти исключительно случай, когда N с самого
начала представляет собой отрезок натурального ряда {1, ..., n} с его обычным порядком 6 (ин-
дуцированным из N∗ ). Тогда τN , как и ι, будет просто тождественным отображением {1, ..., n} в
себя:
τN (i) = ι(i) = i, i ∈ {1, ..., n},
и поэтому диаграмма (13.1.37) превратится в диаграмму
ι / {1, ..., n}′
{1, ..., n} (13.1.38)
O O
ι τ′

{1, ..., n} o σ
{1, ..., n}

в которой {1, ..., n}′ обозначает множество {1, ..., n} с новым порядком 6′ , а τ ′ – нумерация его
элементов по возрастанию. Здесь ι – тождественное отображение из (13.1.36), поэтому мы получаем,
что в этом случае перестановка σ, соответствующая смене порядка, просто совпадает с нумерацией
τ ′:
σ = τ ′.
• Если K и L – два непересекающихся линейно упорядоченных конечных множества (с
порядками K и L ), то на их объединении K ⊔ L можно задать линейный порядок ,
положив a  b в случае, если выполняется одно из трех:
§ 1. Комбинаторика 735

— либо a, b ∈ K и a K b,
— либо a, b ∈ L и a L b,
— либо a ∈ K и b ∈ L.
Множество K ⊔ L с заданным таким образом линейным порядком называется склейкой
линейнго упорядоченных множеств K и L и обозначается K ⊳ L.
Понятно, что операция склеивания не коммутативна

K ⊳ L 6= L ⊳ K,

но ассоциативна
(K ⊳ L) ⊳ M = K ⊳ (L ⊳ M ).
• Рассмотрим частную ситуацию, когда K и L образуют разбиение отрезка натурального
ряда:
K ⊔ L = {1, ..., n}, n ∈ N∗ .
Множества K и L мы будем считать линейно упорядоченными (с линейным порядком,
индуцированным из N∗ ). Их склейка K ⊳ L представляет собой то же самое множество
K ⊔ L = {1, ..., n}, только с новым линейным порядком, поэтому согласно замечанию
13.1.43, переход от K ⊔ L = {1, ..., n} к K ⊳ L можно себе представлять как перестановку σ
элементов {1, ..., n}, которая совпадает с отображением τK⊳L нумерации по возрастанию
элементов множества τK⊳L , потому что диаграмма (13.1.38) принимает здесь вид
ι
{1, ..., n} = K ⊔ L / K ⊳L
O (13.1.39)
O
ι τK⊳L

{1, ..., n} = K ⊔ L o σ=τK⊳L {1, ..., n} = K ⊔ L

Это отображение (перестановку) σ = τK⊳L мы будем называть в дальнейшем отображе-


нием склейки разбиения (K, L) множества {1, ..., n}.
Предложение 13.1.44. Пусть N = K ⊔ L, k = card K, l = card L. Тогда отображение склейки
σ = τK⊳L удовлетворяет условиям

σ(1) < σ(2) < ... < σ(k), σ(k + 1) < σ(k + 2) < ... < σ(k + l) (13.1.40)

а множества K и L восстанавливаются по σ формулами

K = {xσ(1) , ..., xσ(k) }, L = {xσ(k+1) , ..., xσ(k+l) }. (13.1.41)

Наоборот, если какая-то перестановка σ ∈ Sk+l удовлетворяет условиям (13.1.40), то она явля-
ется отображением склейки σ = τK⊳L для множеств (13.1.41).
Предложение 13.1.45. Пусть {1, ..., k + l} = K ⊔ L, k = card K, l = card L и для некоторого
i ∈ {1, ..., k + l} множество K содержит ровно одно из чисел i и i + 1,
   
i∈K & i+1∈L ∨ i+1∈K & i∈L .

Пусть множества K ′ и L′ получаются из K и L перестановкой i и i + 1.

K ′ = (i i + 1)(K), L′ = (i i + 1)(L).

Тогда транспозиция θ = (i i + 1) превращает отображение склейки τK⊳L в отображение склейки


τK ′ ⊳L′ :
θ ◦ τK⊳L = τK ′ ⊳L′ . (13.1.42)

Доказательство. Обозначим σ = τK⊳L в σ ′ = τK ′ ⊳L′ . Чтобы доказать равенство

θ ◦ σ = σ′ ,

нужно проверить две вещи:


736 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

1) θ ◦ σ является биекцией между {1, ..., k} и K ′ и между {k + 1, ..., k + l} и L′ , и


2) θ ◦ σ монотонно возрастает на множествах {1, ..., k} и {k + 1, ..., k + l}.
Первое сразу следует из того, что σ является биекцией между {1, ..., k} и K и между {k+1, ..., k+
l} и L. А второе не очевидно, и его нужно доказывать. Обозначим i′ = σ −1 (i) и j ′ = σ −1 (i + 1).
1) Если считать, что i ∈ K и i + 1 ∈
/ K, то мы получаем, во-первых,

i+1 ∈
/K

′ ′
σ(1) < ... < σ(i − 1) < σ(i ) = i 6 i + 1 < σ(i′ + 1) < ... < σ(k)
|{z} | {z } | {z } | {z } |{z}
k  k k k k 
 
θ σ(1) θ σ(i′ − 1) θ(i) θ σ(i′ + 1) θ σ(k)
k 
θ σ(i′ )


    
θ σ(1) < ... < θ σ(i′ − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)
И, во-вторых,
i∈K


σ(k + 1) < ... < σ(j − 1) < i
|{z} < i + 1 = σ(j ′ ) < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z }
k k k k k
  θ(i + 1)  
θ σ(k + 1) θ σ(j ′ − 1) θ σ(j ′ + 1) θ σ(k + l)
k 
θ σ(j ′ )


    
θ σ(k + 1) < ... < θ σ(j ′ − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)
2) Если же i ∈
/ K и i + 1 ∈ K, то, во-первых,

i∈
/K

σ(1) < ... < σ(i′ − 1) < i
|{z} < i + 1 = σ(i′ ) < σ(i′ + 1) < ... < σ(k)
|{z} | {z } | {z } |{z}
k  k k k k 
 θ(i + 1) 
θ σ(1) θ σ(i′ − 1) θ σ(i′ + 1) θ σ(k)
k 
θ σ(i′ )


    
θ σ(1) < ... < θ σ(i − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)

И, во-вторых,
i+1∈K

′ ′
σ(k + 1) < ... < σ(j − 1) < σ(j ) = i 6 i| +
{z 1} < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z }
k k k k k
   
θ σ(k + 1) θ σ(j ′ − 1) θ(i) θ σ(j ′ + 1) θ σ(k + l)
k 
θ σ(j ′ )


    
θ σ(k + 1) < ... < θ σ(j − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)

Свойства склейки:
10 . Если {1, ..., n} = K ⊔ L, то

sgn(τK⊳L ) = (−1)kl · sgn(τK⊳L ) (13.1.43)

где k = card K и l = card L.


§ 1. Комбинаторика 737

20 . Если {1, ..., n} = K ⊔ L ⊔ M , то


sgn(τK⊳L ) · sgn(τ(K⊔L)⊳M ) = sgn(τK⊳L⊳M ) (13.1.44)
Доказательство. 1. Пусть {1, ..., n} = K ⊔ L. Заметим, что отображения склейки τK⊳L и τL⊳K
связаны между собой перестановкой υ, меняющей местами отрезки {1, ..., k} и {k + 1, ..., k + l}:
ι ι
L ⊳O K o K ⊔O L /K ⊳L
O
τL⊳K ι τK⊳L

τL⊳K τK⊳L
{1, ..., n} j / {1, ..., n} o {1, ..., n}

Поэтому
−1
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(τL⊳K ◦ τK⊳L ) = sgn(υ).
А последнюю величину легко вычислить: чтобы переставить множества A = {1, ..., k} и B = {k +
1, ..., k + l}, нужно сначала последовательно передвигать первый элемент b1 = k + 1 множества B
влево, так, чтобы он встал перед A, на это уйдет ровно k транспозиций соседних элементов (по
числу элементов множества A), затем точно так же нужно передвинуть второй элемент b2 = k + 2
множества B, так, чтобы он встал между b1 и множеством A, и на это опять уйдет k транспозиций.
И так далее, и в конце концов мы передвинем l элементов множества B, и на каждую операцию
уйдет k транспозиций. Значит, всего понадобится kl транспозиций, и мы получаем
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(υ) = (−1)kl .
2. Пусть {1, ..., n} = K ⊔ L ⊔ M . Построение склейки (K ⊳ L) ⊳ M можно представить как после-
довательность трех действий:
1) сначала строится склейка (K⊔L)⊳M , это эквивалентно построению отображения τ(K⊔L)⊳M :
{1, ..., n} → {1, ..., n}, которое первые k + l индексов {1, ..., k + l} тратит на нумерацию
элементов множества K ⊔ L, а оставшиеся m индексов {k + l + 1, ..., n} – на нумерацию
элементов M ;
2) после того, как это сделано, упорядоченное множество K ⊔ L оказывается занумеровано
индексами {1, ..., k + l}; обозначим
−1 −1
K ′ = τ(K⊔L)⊳M (K), L′ = τ(K⊔L)⊳M (L).

и построим новую склейку, K” ⊳ L′ , или, иными словами, отображение τK ′ ⊳L′ : {1, ..., k +
l} → {1, ..., k + l}, которое первые k индексов трати на нумерацию элементов K ′ , а остав-
шиеся l индексов на нумерацию L′ ;
3) когда построено τK ′ ⊳L′ , мы полагаем
(
τK ′ ⊳L′ (i), i 6 k + l
σ(i) =
i, i>k+l

и это будет перестановка σ : {1, ..., n} → {1, ..., n}, композиция которой с τ(K⊔L)⊳M дает
τ(K⊳L)⊳M :
τ(K⊳L)⊳M = τ(K⊔L)⊳M ◦ σ. (13.1.45)
Наглядно это можно изобразить диаграммой
ι ι
K ⊔ LO ⊔ M / (K ⊔ L) ⊳ M / (K ⊳ L) ⊳ M
O O
ι τ(K⊔L)⊳M τ(K⊳L)⊳M

τ(K⊔L)⊳M σ
{1, ..., n} ol {1, ..., n} o {1, ..., n}

τ(K⊳L)⊳M

Из (13.1.45) мы получаем
sgn τ(K⊳L)⊳M = sgn τ(K⊔L)⊳M · sgn σ = sgn τ(K⊔L)⊳M · sgn τK⊳L ,
738 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

§2 Векторные пространства
Важное свойство векторных величин (из которых затем, при дополнительном предположении ко-
нечномерности, формально следуют все остальные их свойства) заключается в том, что их можно
складывать друг с другом и умножать на число. В математике эти свойства формализуются кон-
струкцией векторного пространства, и в этом параграфе мы объясним, что это такое.

(a) Векторные пространства


Определение векторного пространства и примеры.
• Множество X называется (вещественным) векторным пространством или (веществен-
ным) линейным пространством, если
(a) любым двум элементам x, y ∈ X поставлен в соответствие некоторый элемент
x + y ∈ X так, что выполняются следующие правила:
V1. Коммутативность сложения: для любых элементов x, y ∈ X вы-
полняется равенство
x+y = y+x (13.2.46)
V2. Ассоциативность сложения: для любых элементов x, y, z ∈ X вы-
полняется равенство

(x + y) + z = x + (y + z) (13.2.47)

V3. Существование нуля: существует такой элемент 0 ∈ X, что

x + 0 = x, x∈X (13.2.48)

V4. Существование противоположного элемента: для любого эле-


мента a ∈ X существует такой элемент −x ∈ X (называемый проти-
воположным к элементу a) что

x + (−x) = 0 (13.2.49)

(b) любому элементу x ∈ X и любому числу λ ∈ R поставлен в соответствие неко-


торый элемент λ · x ∈ X так, что выполняются следующие правила:
V5. Ассоциативность умножения: для любых чисел λ и µ и любого
элемента x ∈ X выполняется равенство

(λ · µ) · x = λ · (µ · x) (13.2.50)

V6. Действие единицы: умножение на единицу 1 ∈ R не меняет элемен-


ты X:
1 · x = x, x∈X (13.2.51)
(c) между собой операции сложения векторов и умножения вектора на скаляр свя-
заны правилом
V7. Дистрибутивность: для любых элементов x, y ∈ X и любого числа
λ ∈ R выполняется равенство

λ · (x + y) = λ · x + λ · y (13.2.52)

⋄ 13.2.1. Координатное пространство Rn явля- ленных на произвольном множестве T ,


ется вещественным векторным пространством с
f ∈ RT ⇐⇒ f : T → R
операциями
 является вещественным векторным простран-
x + y := x1 + y1 , ..., xn + yn (13.2.53)
 ством относительно операций
λ · x := λ · x1 , ..., λ · xn . (13.2.54)
(f + g)(t) := f (t) + g(t), t∈T (13.2.55)
⋄ 13.2.2. Множество RT всех функций, опреде- (λ · f )(t) := λ · f (t), t ∈ T. (13.2.56)
§ 2. Векторные пространства 739

Линейно независимые системы.


• Линейной комбинацией векторов x1 , ..., xk векторного пространства X называется всякий
вектор вида
λ1 · x1 + ... + λk · xk
где λ1 , ..., λk ∈ R.
• Линейной оболочкой векторов x1 , ..., xk векторного пространства X называется множество
в X, обозначаемое span{x1 , ..., xk } и состоящее из всевозможных линейных комбинаций
векторов x1 , ..., xk

span{x1 , ..., xk } = {λ1 · x1 + ... + λk · xk ; λ1 , ..., λk ∈ R}.

• Система векторов x1 , ..., xk векторного пространства X называется


— линейно зависимой, если какой-то из этих векторов, обозначим его xi , можно
выразить как линейную комбинацию остальных:

∃λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi = λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,

— линейно независимой, если никакой xi не является линейной комбинацией осталь-


ных:

∀λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi 6= λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,

Свойства линейно независимых систем:


1◦ . В линейно независимой системе векторов x1 , ..., xk никакой вектор не может быть
нулевым:
xi 6= 0, i = 1, ..., k.
2◦ . Всякая подсистема xi1 , ..., xil линейно независимой системы x1 , ..., xk также линейно
независима.
Доказательство. 1. Если какой-то вектор в системе равен нулю, xi = 0, то его можно представить
как тривиальную линейную комбинацию остальных векторов

xi = 0 · x1 + ... + 0 · xi−1 + 0 · xi+1 + ... + 0 · xk ,

и поэтому такая система будет линейно зависимой.


2. Если x1 , ..., xk – линейно независимая система, то есть любой вектор xi не выражается линейно
через остальные векторы xj , то тем более xi не будет выражаться линейно через остальные векторы
xj , лежащие в какой-то подсистеме M ⊆ {x1 , ..., xk }. Поэтому M тоже линейно независима.
Теорема 13.2.3. Система векторов x1 , ..., xk векторного пространства X линейно независима в
том и только в том случае, если равенство

λ1 · x1 + ... + λk · xk = 0 (13.2.57)

выполняется только при нулевых коэффициентах λ1 , ..., λk :

λ1 = ... = λk = 0

Доказательство. 1. Пусть равенство (13.2.57) выполняется для набора коэффициентов, среди ко-
торых есть какой-то ненулевой:
λi 6= 0.
Тогда можно выразить слагаемое λi · xi через все остальные

λi · xi = −λ1 · x1 − ... − λi−1 · xi−1 − λi+1 · xi+1 − ... − λk · xk ,

а затем выразить сам вектор xi :


λ1 λi−1 λi+1 λk
xi = − · x1 − ... − · xi−1 − · xi+1 − ... − · xk .
λi λi λi λi
740 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Мы получаем, что система x1 , ..., xk линейно зависима.


2. Наоборот, если система x1 , ..., xk линейно зависима, то есть какой-то вектор выражается через
остальные,
xi = λ1 · x1 + ... + λi−1 · xi−1 + λi+1 · xi+1 + ... + λk · xk ,
то перебросив все в левую часть мы получим равенство (13.2.57)

−λ1 · x1 − ... − λi−1 · xi−1 + xi − λi+1 · xi+1 − ... − λk · xk = 0,

в котором коэффициент при xi ненулевой (а именно, равен 1).

Базис и размерность.
• Система векторов b1 , ..., bn векторного пространства X называется (конечным) базисом
этого пространства, если
1) она линейно независима, и
2) любой вектор x ∈ X представим в виде некоторой линейной комбинации векто-
ров b1 , ..., bn :
∃β 1 , ..., β n ∈ R x = β 1 · b1 + ... + β n · bn , (13.2.58)
(это свойство называется линейной полнотой системы b1 , ..., bn ).

⋄ 13.2.4. В координатном пространстве Rn си- то есть как сумму (13.2.58) с


стема векторов
( β i = xi .
0, i 6
= j
(ei )j = (13.2.59)
1, i = j • Базис {e1 , ..., en }, определенный формулой
(13.2.59), называется стандартным базисом
образует базис. Действительно, во-первых, при
в Rn .
λi ∈ R равенство
• Аналогичной формулой определяется стан-
λ1 · e1 + ... + λn · en = 0 дартный базис {e1 , ..., en } в Rn :
означает для всякого i (
i 1 n i i 0, i 6= j
λ = (λ · e1 + ... + λ · en ) = 0. (e )j = . (13.2.60)
1, i = j
1 n n
А, во-вторых, всякий вектор x = (x , ..., x ) ∈ R
можно представлять себе как сумму
x = x1 · e1 + ... + xn · en ,

Теорема 13.2.5. Коэффициенты β 1 , ..., β n разложения произвольного данного вектора x ∈ X по


заданному базису b1 , ..., bn в X
x = β 1 · b1 + ... + β n · bn ,
определяются однозначно.
Доказательство. Предположим противное, то есть что вектор x можно разложить двумя разными
способами по базису b1 , ..., bn :

x = β 1 · b1 + ... + β n · bn = λ1 · b1 + ... + λn · bn ,

где
∃k = 1, ..., n β k 6= λk .
Тогда
 
(β 1 − λ1 ) · b1 + ... + (β n − λn ) · bn = β 1 · b1 + ... + β n · bn − λ1 · b1 + ... + λn · bn = x − x = 0

причем для некоторого k


β k − λk 6= 0.
Мы получаем, что нетривиальная линейная комбинация векторов b1 , ..., bn равна нулю. Значит,
система b1 , ..., bn линейно зависима, а это противоречит тому, что она образует базис.
§ 2. Векторные пространства 741

Лемма 13.2.6. Длина любой линейно независимой системы a1 , ..., am в векторном пространстве
X не превосходит длины базиса b1 , ..., bn этого пространства (если он существует):

m 6 n.

Доказательство. Предположим наоборот, что

m > n.

Покажем, что тогда векторы a1 , ..., an (то есть первые n векторов в последовательности a1 , ..., am )
образуют базис пространства X. Это делается индукцией.
1. Заметим сначала, что, перенумеровав, если нужно, векторы b1 , b2 , ..., bn , можно добиться, что-
бы система a1 , b2 , ..., bn (получающаяся заменой b1 на a1 ) была базисом в X.
Поскольку b1 , ..., bn – базис, вектор a1 выражается как линейная комбинация векторов b1 , ..., bn :

a1 = λ1 · b1 + ... + λn · bn ,

для некоторых λ1 , ..., λn ∈ R. При этом по свойству 1◦ на с.739 вектор a1 (будучи элементом линейно
независимой системы) не может быть нулевым:

0 6= a1 = λ1 · b1 + ... + λn · bn .

Поэтому какой-то из коэффициентов λi тоже должен быть ненулевым. Перенумеровав, если нужно
векторы b1 , ..., bn (вместе с коэффициентами λ1 , ..., λn ), мы можем считать, что ненулевым коэффи-
циентом в этой комбинации будет λ1 :
λ1 6= 0
Тогда мы получим, что b1 выражается через векторы a1 , b2 , ..., bn :

λ1 ·b1 + λ2 · b2 + ... + λn · bn ,
a1 = |{z} (13.2.61)
6=


2
1 λ λn
· a 1 = b 1 + · b 2 + ... + · bn ,
λ1 λ1 λ1

1 λ2 λn
·b1 =
a 1 − · b 2 − ... − · bn ,
λ1 λ1 λ1
Отсюда следует, что вообще любой вектор x ∈ X выражается через векторы a1 , b2 , ..., bn :

x = β 1 · b1 + β 2 · b2 + ... + β n · bn ,

 
1 λ2 λn
x = β1 · 1
· a1 − 1 · b2 − ... − 1 · bn + β 2 · b2 + ... + β n · bn =
λ λ λ
   
β1 β 1 · λ2 β 1 · λn
= 1 · a1 + β 2 − · b 2 + ... + β 2
− · bn .
λ λ1 λ1
Покажем теперь, что система a1 , b2 , ..., bn должна быть линейно независима. Действительно,
пусть для каких то γ 1 , ..., γ n выполняется равенство

γ 1 · a1 + γ 2 · b2 + ... + γ n · bn = 0,

Тогда, мы сразу получаем, что γ 1 = 0, потому что иначе возникает цепочка

γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1
6=


742 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

γ2 γn
a1 = · b 2 + ... + · bn
γ1 γ1
⇓ (вычитаем из (13.2.61))
   
γ2 γn
λ1 ·b1 + λ2 − 1 · b2 + ... + λn − 1 · bn ,
0 = |{z}
γ γ

6=
0

означающая, что система b1 , ..., bn линейно зависима (чего не может быть, поскольку b1 , ..., bn –
базис).
А из γ 1 = 0 затем следует, что все остальные γ i тоже равны нулю:

γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1

=
0


γ · b2 + ... + γ n · bn = 0,
2


γ = ... = γ n = 0,
2

потому что подсистема b2 , ..., bn линейно независима (по свойству 2◦ на с.739).


Итак, мы получили, что система a1 , b2 , ..., bn линейно независима и любой вектор x ∈ X выра-
жается через нее. То есть a1 , b2 , ..., bn – базис в X.
2. Переходим ко второму шагу индукции. Предположим, что для некоторого r < n < m мы
(после некоторой перенумерации векторов b1 , ..., bn ) доказали, что система

a1 , ..., ar , br+1 , ..., bn

является базисом в X. Покажем теперь, что перенумеровав если нужно векторы br+1 , ..., bn , можно
добиться, чтобы система
a1 , ..., ar , ar+1 , br+2 , ..., bn
была базисом в X.
Выразим ar+1 через базис a1 , ..., ar , br+1 , ..., bn :

ar+1 = λ1 · a1 + ... + λr · ar + λr+1 · br+1 + ... + λn · bn

Заметим, что в этой линейной комбинации какой-то из коэффициентов λr+1 , ..., λn должен быть
ненулевым, потому что иначе мы получили бы, что ar+1 выражается через a1 , ..., ar

ar+1 = λ1 · a1 + ... + λr · ar ,

(то есть получилось бы, что система a1 , ..., am должна быть линейно зависима, а это невозможно,
потому что она – базис). Перенумеровав, если нужно векторы br+1 , ..., bn (вместе с коэффициентами
λr+1 , ..., λn ), мы можем считать, что ненулевым коэффициентом в этой комбинации будет λr+1 :

λr+1 6= 0

Теперь теми же рассуждениями, что в пункте 1, показываем, что система a1 , ..., ar , ar+1 , br+2 , ..., bn
– базис в X.
Описанная индукция доказывает, что подходящей перенумерацией векторов b1 , ..., bn , а затем по-
следовательной заменой bi на ai , мы получим систему базисов пространства X, в которой последним
будет базис a1 , ..., an :
b1 , b2 , b3 , ..., bn
7→

a1 , b2 , b3 , ..., bn
7→

a1 , a2 , b3 , ..., bn
§ 2. Векторные пространства 743

7→
...

7→
a1 , a2 , a3 , ..., an .
Отсюда следует, в частности, что вектор am (как любой другой вектор пространства X) должен
выражаться через векторы базиса a1 , ..., an :

am = λ1 · a1 + ... + λn · an

То есть система a1 , ..., an , ..., am должна быть линейно зависима. Это противоречие означает, что
наше исходное предположение, что m > n было неверно.
Теорема 13.2.7. Любые два базиса a1 , ..., am и b1 , ..., bn векторного пространства X (если они
существуют) имеют одинаковую длину:
m = n.
Доказательство. Поскольку a1 , ..., am – линейно независимая система, а b1 , ..., bn – базис в X, по
лемме 13.2.6 получаем
m 6 n.
С другой стороны, b1 , ..., bn – линейно независимая система, а a1 , ..., am – базис в X, поэтому опять
по лемме 13.2.6 получаем
n 6 m.
Вместе это дает равенство m = n.
• Векторное пространство X называется конечномерным, если оно обладает конечным ба-
зисом, и бесконечномерным, если конечного базиса в нем нет. Из теоремы 13.2.7 следует,
что если в X есть конечный базис b1 , ..., bn , то любой другой базис должен иметь то же
самое число элементов n. Это число n называется размерностью векторного пространства
X и обозначается dim X.
Лемма 13.2.8. Если a1 , ..., ak – линейно независимая система в векторном пространстве X,
не являющаяся базисом этого пространства, то найдется вектор ak+1 такой, что система
a1 , ..., ak , ak+1 также будет линейно независимой.
Доказательство. Поскольку a1 , ..., ak – не базис в X, найдется какой-то вектор ak+1 ∈ X, который
не выражается через вектора a1 , ..., ak :

ak+1 ∈
/ span{a1 , ..., ak }.

Система a1 , ..., ak , ak+1 будет линейно независимой, потому что если

λ1 · a1 + ... + λk · ak + λk+1 · ak+1 = 0,

то, во-первых, должно быть λk+1 = 0, потому что иначе мы получили бы, что ak+1 линейно выра-
жается через a1 , ..., ak :
λ1 · a1 + ... + λk · ak + |λk+1
{z } ·ak+1 = 0,
6=


1
λ λk
ak+1 = − · a 1 − ... − · ak .
λk+1 λk+1
А, во-вторых, из λk+1 = 0 следует равенство

λ1 · a1 + ... + λk · ak = 0,

которое может выполняться только если все коэффициенты λ1 , ..., λk равны нулю (потому что си-
стема a1 , ..., ak линейно независима):
λ1 = ... = λk = 0.
744 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Теорема 13.2.9. В конечномерном пространстве X длина линейно независимой системы a1 , ..., am


всегда не больше размерности пространства X

m 6 dim X. (13.2.62)

и эта система тогда и только тогда является базисом, когда ее длина равна размерности этого
пространства:
m = dim X. (13.2.63)
Доказательство. 1. Неравенство (13.2.62) – непосредственное следствие леммы 13.2.6.
2. Если a1 , ..., am – базис, то по определению размерности длина m последовательности векторов
a1 , ..., am должна быть равна размерности X, то есть выполняется (13.2.63).
3. Наоборот, если a1 , ..., am – не базис, то по лемме 13.2.8 найдется элемент am+1 такой, что систе-
ма a1 , ..., an , am+1 снова будет линейно независимой. Но тогда по лемме 13.2.6 должно выполняться
неравенство
m + 1 6 dim X,
из которого следует, что (13.2.63) неверно.
Теорема 13.2.10. Если пространство X конечномерно, то в нем всякая линейно независимая си-
стема векторов a1 , ..., am дополняется до некоторого базиса a1 , ..., am , am+1 , ..., an (где n = dim X).
Доказательство. По теореме 13.2.9, длина системы a1 , ..., am не превышает размерности простран-
ства X:
m 6 n.
Если m = n, то по теореме 13.2.9 a1 , ..., am уже является базисом, и доказывать нечего. Поэтому
интересен случай, когда
m < n.
Тогда по теореме 13.2.9 a1 , ..., am – не базис, и значит по лемме 13.2.8, найдется вектор am+1 такой,
что система a1 , ..., am , am+1 снова является линейно независимой. Если m + 1 < n, то опять по по
теореме 13.2.9 a1 , ..., am , am+1 – не базис, и снова по лемме 13.2.8, найдется вектор am+2 такой, что
система a1 , ..., am , am+1 , am+2 также является линейно независимой, и так далее.
Действуя так по индукции, мы в какой-то момент получим линейно независимую систему
a1 , ..., am , am+1 , ..., an длины n = dim X, и по теореме 13.2.9 она будет базисом в X.

Подпространства.
• Подмножество Y в векторном пространстве X называется подпространством в X, если
оно замкнуто относительно операций взятия суммы и умножения на скаляр, то есть

∀x, y ∈ Y x+y ∈Y

и
∀y ∈ Y ∀λ ∈ R λ·y ∈Y

Свойства подпространств:
1◦ . В конечномерном векторном пространстве X любое подпространство Y тоже конеч-
номерно, причем
dim Y 6 dim X, (13.2.64)
и равенство dim Y = dim X достигается только в случае, если Y = X.

2 . Если Y и Z – два подпространства в векторном пространстве X, то
(a) пересечение Y ∩ Z подпространств Y и Z является подпространством в X,
(b) множество
Y + Z = {y + z; y ∈ Y, z ∈ Z}
всех векторов вида y + z, где y ∈ Y и z ∈ Z образует подпространство в X
(называемое алгебраической суммой подпространств Y и Z),
(c) если вдобавок X конечномерно, то

dim(Y ∩ Z) + dim(Y + Z) = dim Y + dim Z (13.2.65)


§ 2. Векторные пространства 745

Доказательство. 1. Сначала нужно рассмотреть тривиальный случай: если пространство Y состо-


ит из одного нуля
Y = {0},
то оно считается конечномерным, потому что в нем есть базис, состоящий из пустого множества (а
размерность Y в этом случае считается нулевой).
Если же Y содержит хотя бы один ненулевой элемент a1 , то зафиксировав его, мы можем приме-
нить индукцию как при доказательстве теоремы 13.2.10: если a1 – не базис в Y , то по лемме 13.2.8,
найдется вектор a2 ∈ Y такой, что система a1 , a2 является линейно независимой. Если после этого
a1 , a2 все еще не базис в Y , то опять по лемме 13.2.8, найдется вектор a3 ∈ Y такой, что система
a1 , a2 , a3 является линейно независимой, и так далее. Это индуктивный процесс на каком-то шаге
приведет к конечной последовательности a1 , ..., am , являющейся базисом в Y , потому что длина
всех таких последовательностей a1 , ..., am ограничена размерностью dim X пространства X:

m 6 dim X

Из этого неравенства заодно и следует (13.2.64).


2. Утверждения 2◦ (a) и 2◦ (b) проверяются элементарно, поэтому перейдем сразу к 2◦ (c). По-
скольку пространство Y ∩ Z конечномерно (как подпространство в конечномерном пространстве
X), мы можем выбрать в нем базис
a1 , ..., ak ∈ Y ∩ Z.
Если рассмотреть эту последовательность как систему векторов в пространстве Y , то она будет
линейно независима, и поэтому по теореме 13.2.10 ее можно дополнить до некоторого базиса в Y :

a1 , ..., ak , y1 , ..., ym ∈ Y.

С другой стороны, последовательность a1 , ..., ak можно считать системой векторов в Z, и там она
тоже будет линейно независимой. Поэтому по теореме 13.2.10 ее можно дополнить до некоторого
базиса в Z:
a1 , ..., ak , z1 , ..., zn ∈ Z.
Теперь покажем, что система векторов a1 , ..., ak , y1 , ..., ym , z1 , ..., zn будет базисом в Y + Z.
1. Сначала убедимся, что эта система линейно независима. Пусть

α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym + γ 1 · z1 + ... + γ n · zn = 0 (13.2.66)

Обозначим
z = γ 1 · z1 + ... + γ n · zn .
Тогда с одной стороны, поскольку z1 , ..., zn ∈ Z,

z ∈ Z.

А, с другой стороны,
z = −α1 · a1 − ... − αk · ak − β 1 · y1 − ... − β m · ym
где a1 , ..., ak , y1 , ..., ym ∈ Y , и поэтому
z ∈ Y.
Как следствие,
z ∈ Y ∩ Z,
и поскольку a1 , ..., ak – базис в Y ∩ Z, должны существовать числа λ1 , ..., λk такие, что

z = λ1 · a1 + ... + λk · ak .

Теперь мы получаем цепочку:

γ 1 · z1 + ... + γ n · zn = z = λ1 · a1 + ... + λk · ak .


γ 1 · z1 + ... + γ n · zn − λ1 · a1 − ... − λk · ak = 0.
⇓ (a1 , ..., ak , z1 , ..., zn – базис в Z )
746 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

γ 1 = ... = γ n = λ1 = ... = λk = 0.
⇓ подставляем γ i = 0 в (13.2.66)

α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym + γ 1 · z1 + ... + γ n · zn = 0


| {z }

=
0


α · a1 + ... + α · ak + β 1 · y1 + ... + β m · ym = 0
1 k

⇓ (a1 , ..., ak , y1 , ..., ym – базис в Y )


1 k 1 m
α = ... = α = β = ... = β =0
Таким образом, равенство (13.2.66) влечет равенство нулю всех коэффициентов

α1 = ... = αk = β 1 = ... = β m = γ 1 = ... = γ n = 0,

и значит, система a1 , ..., ak , y1 , ..., ym , z1 , ..., zn линейно независима.


2. Теперь покажем, что она полна в Y + Z. Действительно, по определению, всякий вектор
x ∈ Y + Z имеет вид
x = y + z,
где y ∈ Y и z ∈ Z. Поскольку a1 , ..., ak , y1 , ..., ym – базис в Y , существуют коэффициенты α1 , ..., αk , β 1 , ..., β m ∈
R такие что
y = α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym .
e1 , ..., α
С другой стороны, поскольку a1 , ..., ak , z1 , ..., zn – базис в Z, существуют коэффициенты α ek , γ 1 , ..., γ n ∈
R такие что
z=α e1 · a1 + ... + α ek · ak + γ 1 · z1 + ... + γ n · zn .
Вместе это дает
   
x = y + z = α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym + αe1 · a1 + ... + α
ek · ak + γ 1 · z1 + ... + γ n · zn =
= (α1 + α
e1 ) · a1 + ... + (αk + α
ek ) · ak + β 1 · y1 + ... + β m · ym + γ 1 · z1 + ... + γ n · zn

То есть x выражается через a1 , ..., ak , y1 , ..., ym , z1 , ..., zn .


Мы поняли, что система векторов a1 , ..., ak , y1 , ..., ym , z1 , ..., zn является базисом в пространстве
Y + Z. Теперь получаем:
k   k + m 
a1 , ..., ak a1 , ..., ak , y1 , ..., ym
=

– базис в Y ∩ Z – базис в Y
z }| { z }| {
dim(Y ∩ Z) + dim(Y + Z) = 2k + m + n = dim Y + dim
| {z Z}
| {z }  
a  a1 , ..., ak , z1 , ..., zn
=

1 , ..., ak , y1 , ..., ym , – базис в Z


=

z1 , ..., zn
– базис в Y + Z k+n
k+m+n

(b) Линейные функционалы и сопряженное пространство


• Линейным функционалом или линейной формой на векторном пространстве X называется
всякое отображение f : X → R, удовлетворяющее условию линейности:

f (α · x + β · y) = α · f (x) + β · f (y), x, y ∈ X, α, β ∈ R (13.2.67)

Линейные функционалы на Rn и Rn . линейный функционал f : Rn → R по формуле:


 1
x
⋄ 13.2.11. Всякая числовая строка α = f (x) = α · x = (α1 , ..., αn ) ·  ...  =
(α1 , ..., αn ) ∈ Rn (αi ∈ R) определяет некоторый xn
§ 2. Векторные пространства 747

n
X n
X
= αi · xi , x ∈ Rn (13.2.68) = xi · αi = α · x
i=1 i=1

И наоборот, всякий линейный функционал f :


Rn → R определяет некую числовую строку
α = (α1 , ..., αn ) ∈ Rn (αi ∈ R) по формуле ⋄ 13.2.13. Для пространства строк Rn , есте-
ственно, картина будет симметричной: всякий
αi = f (ei ) (13.2.69) α1
числовой столбец α =  ...  ∈ Rn (αi ∈ R)
где e = (e1 , ..., en ) – стандартный базис в Rn . αn
определяет некоторый линейный функционал f :
Теорема 13.2.12. Формулы (13.2.68) и (13.2.69)
Rn → R по формуле:
устанавливают взаимно однозначное соответ-
ствие между числовыми строками α ∈ Rn и  1
линейными функционалами f : Rn → R. α
f (x) = x · α = (x1 , ..., xn ) ·  ...  =
Доказательство. Действительно, если α ∈ Rn , αn
то из (13.2.68) X n
f (x) = α · x = xi · αi , x ∈ Rn (13.2.70)
i=1
следует (13.2.69):
n
И наоборот, всякий линейный функционал f :
X Rn 
→ R определяет некий числовой столбец
∀j f (ej ) = α · ej = αi · eij
= aj
|{z} α1
i=1

α = ...  ∈ Rn по формуле
=

(
0, 6 j
i= αn
1, i=j

αi = f (ei ) (13.2.71)
И наоборот, если f : Rn → R – линейный функ-
ционал, то из (13.2.69)  
e1
где e =  ...  – стандартный базис в Rn .
αi = f (ei )
en
следует (13.2.68):
Теорема 13.2.14. Формулы (13.2.70) и (13.2.71)
n
! n
устанавливают взаимно однозначное соответ-
X X
f (x) = f xi · ei = xi · f (ei ) = ствие между числовыми столбцами α ∈ Rn и
i=1 i=1
линейными функционалами f : Rn → R.

Столбец коэффициентов.
• Пусть X – векторное пространство и (b1 , ..., bn ) – его базис. Коэффициенты β i в раз-
ложении (13.2.58) вектора x по заданному базису (b1 , ..., bn ) мы условимся обозначать
h ii  i
x
специальным символом b1 ,...,bn
или xb :
n h ii
X n 
X i
x x
x= · bi = · bi (13.2.72)
i=1
b i=1
b1 , ..., bn
 i h x ii
По теореме 13.2.5 числа xb = b1 ,...,bn
определяются однозначно. Их удобно представ-
лять как столбец (соответствующий произвольному вектору x при фиксированном базисе
b = (b1 , ..., bn )):
  x 1 
h x i   xb 2 
= b
 ...
.

b
 x n
b

Свойства столбца коэффициентов:


1◦ . Однородность:  
λ·x hxi
=λ· (13.2.73)
b b
748 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

2◦ . Аддитивность:   h i h i
x+y x y
= + (13.2.74)
b b b

! 13.2.15. Справедливо также следующее тож- (здесь λ · b = (λ · b1 , ..., λ · bn ) – базис, получа-


  ющийся умножением каждого вектора на число
дество обратной однородности, служащее опре-
деленным оправданием самому обозначению xb : λ). Доказывается это теми же приемами.
h x i 1 hxi
= · , λ 6= 0 (13.2.75)
λ·b λ b

Доказательство. 1. Подставив в (13.2.72) вместо x вектор λ · x, мы получим равенство


n 
X i
λ·x
λ·x = · bi
i=1
b

С другой стороны, умножив (13.2.72) на λ, мы получим равенство


n
X h x ii
λ·x= λ· · bi
i=1
b

Мы получаем, что один и тот же вектор λ · x двумя способами разложен по базису b1 , ..., bn :
Xn  i Xn h x ii
λ·x
· bi = λ · x = λ· · bi
i=1
b i=1
b

По теореме 13.2.5 коэффициенты этих разложений должны совпадать:


 i h x ii
λ·x
=λ· , i = 1, ..., n
b b

Это и есть (13.2.73):


    1 
   x 1 
λ·x 1
    b 2  λ · xb b
λ· x  λ·x   λ ·  x 2    x 2  h i
 b  
= b  = λ ·  b =λ· x .
b  ...  ...   ...  b
 λ·x n  x n  x n
b
λ · b b

2. Равенство (13.2.74) доказывается так же: сначала подставив в (13.2.72) вместо x вектор x + y,
мы получим
Xn  i
x+y
x+y = · bi
i=1
b

Затем, сложив (13.2.72) с тем же равенством, только выписанном для вектора y, мы получим
n h ii
X n h ii
X n h ii
X h y ii  n h i
X h y ii
x y x x
x+y = · bi + · bi = + · bi = + · bi
i=1
b i=1
b i=1
b b i=1
b b
| {z } | {z }
x y

В результате один и тот же вектор x + y оказывается двумя способами разложен по базису b1 , ..., bn :
Xn  i Xn h i h y ii
x+y x
· bi = x + y = + · bi
i=1
b i=1
b b

и по теореме 13.2.5 коэффициенты этих разложений должны совпадать:


 i h x i h y ii
x+y
= +
b b b
§ 2. Векторные пространства 749

Это и есть (13.2.74):


 
  x 1  y 1    x 1    y 1 
x+y 1
  b b + b b b
x+y  b   x 2 +  y 2    x 2    y 2  h x i h y i
  x+y 2 

= =      =
b

 ...  
 b
...
b
 =  ...
b
 +  ...
b
 b
+
b
.
 x+y n  x n  y n  x n  y n
b b + b b b

Линейные операции над функционалами и сопряженное пространство X ∗ .


• Если f : X → R и g : X → R – два линейных функционала на X, то их суммой называется
отображение
(f + g)(x) := f (x) + g(x), x ∈ X (13.2.76)
Нетрудно заметить, что оно также будет линейным функционалом на X.
• Произведением линейного функционала f : X → R на число λ ∈ R называется отображе-
ние
(λ · f )(x) := λ · f (x), x ∈ X (13.2.77)
и оно тоже является линейным функционалом на X.
• Множество всех линейных функционалов на векторном пространстве X обозначается сим-
волом X ∗ и называется сопряженным пространством к пространству X. Оно будет век-
торным пространством относительно операций суммы функционалов и умножения функ-
ционала на число, определенных формулами (13.2.76) и (13.2.77).
Теорема 13.2.16. Если a = (a1 , ..., an ) – базис в векторном пространстве X, то линейные функ-
 i
ционалы a1 : X → R определенные формулой
 i h x ii
1
(x) := , x ∈ X, i = 1, ..., n. (13.2.78)
a a
образуют базис сопряженного пространства X ∗ . Разложение всякого линейного функционала f ∈
X ∗ по этому базису имеет вид
Xn  i
1
f= f (ai ) · (13.2.79)
i=1
a

Следствие 13.2.17. Если векторное пространство X конечномерно, то его сопряженное про-


странство X ∗ тоже конечномерно, и их размерности совпадают:

dim X = dim X ∗ (13.2.80)

(c) Линейные операторы


• Пусть X и Y – векторные пространства. Отображение A : X → Y называется линей-
ным оператором из X в Y , если оно удовлетворяет следующему тождеству, называемому
свойством линейности:

A(λ · p + µ · q) = λ · A(p) + µ · A(q) p, q ∈ X, λ, µ ∈ R (13.2.81)

Ядро и образ оператора.


• Пусть X и Y – векторные пространства и A : X → Y – линейный оператор. Тогда
– ядром оператора A называется множество Ker A векторов x ∈ X, которые A
переводит в нуль:
Ker A = {x ∈ X : Ax = 0} (13.2.82)
– образом оператора A называется множество Im A векторов y ∈ X, которые яв-
ляются значениями оператора A на каких-то векторах x ∈ X:

Im A = {y ∈ Y : ∃x ∈ X Ax = y} (13.2.83)
750 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

! 13.2.18. Понятно, что оператор A : X → Y то- Несколько менее очевидно, что оператор A :
гда и только тогда будет сюръективным, когда X → Y тогда и только тогда будет инъектив-
его образ совпадает с Y : ным, когда его ядро состоит из одного нуля:

Im A = Y Ker A = {0}.

Теорема 13.2.19. Ядро Ker A и образ Im A оператора A : X → Y являются подпространствами


в X и Y соответственно, причем если пространство X конечномерно, то Ker A и Im A тоже
конечномерны, и выполняется равенство

dim Ker A + dim Im A = dim X (13.2.84)

Доказательство. Равенство (13.2.84) следует из изоморфизма

X/ Ker A ∼
= Im A.

Следствие 13.2.20. Если векторные пространства X и Y имеют одинаковую (и конечную) раз-


мерность
dim X = dim Y,
то для любого оператора A : X → Y следующие условия эквивалентны:
(i) A сюръективен;
(ii) A инъективен;
(iii) A биективен (то есть обратим).

Доказательство. Здесь достаточно доказать эквивалентность условий (i) и (ii). Это делается сле-
дующей цепочкой:
A сюръективен
m
Im A = Y
m свойство 1◦ на с.744

dim Im A = dim Y = dim X


m (13.2.84)

dim Ker A = 0
m
Ker A = {0}
m
A инъективен

Линейные операции над операторами.


• Если A : X → Y и B : X → Y – два линейных оператора, то их суммой называется
отображение
(A + B)(x) := A(x) + B(x), x ∈ X (13.2.85)
Нетрудно заметить, что оно также будет линейным оператором из X в Y .
• Произведением линейного оператора A : X → Y на число λ ∈ R называется отображение

(λ · A)(x) := λ · A(x), x∈X (13.2.86)

и оно тоже является линейным оператором из X в Y .


§ 2. Векторные пространства 751

• Множество всех линейных операторов A : X → Y обозначается Hom(X, Y ). Оно будет


векторным пространством относительно операций суммы операторов и умножения опе-
ратора на число, определенных формулами (13.2.85) и (13.2.86). В частном случае, когда
X = Y , обозначение сокращается:

End(X) = Hom(X, X) (13.2.87)

Теорема 13.2.21. Если X и Y – конечномерные векторные пространства, то пространство опе-


раторов Hom(X, Y ) также конечномерно, и

dim Hom(X, Y ) = dim X · dim Y. (13.2.88)

В частности,
dim End(X) = (dim X)2 (13.2.89)

Произведение операторов и обратимые операторы.


• Единичным оператором в векторном пространстве X называется линейный оператор IX :
X → X, действующий по формуле

IX (x) := x, x∈X (13.2.90)

• Если A : X → Y и B : Y → Z – два линейных оператора, то их произведением называется


композиция отображений A и B, то есть отображение

(BA)(x) := B(A(x)), x∈X (13.2.91)

Нетрудно заметить, что оно будет линейным оператором из X в Z.

Свойства операции умножения операторов:


(i) Справедливы тождества дистрибутивности:

(A + B) · C = A · C + B · C, A, B ∈ Hom(Y, Z), C ∈ Hom(X, Y ) (13.2.92)


A · (B + C) = A · B + A · C, A ∈ Hom(Y, Z), B, C ∈ Hom(X, Y ) (13.2.93)

(ii) Умножение на единичный оператор не меняет оператора:

A · I = A, A ∈ Hom(X, Y ), I ∈ Hom(X, X) (13.2.94)


I · A = A, A ∈ Hom(X, Y ), I ∈ Hom(Y, Y ) (13.2.95)

• Два линейных оператора A : X → Y и B : Y → X называются обратными друг другу (а


каждый из них называется обратным по отношению к другому), если их произведения
дают единичные операторы:

B · A = IX , A · B = IY .

В этом случае пишут


A = B −1 , B = A−1 .
• Линейный оператор A : X → Y называется обратимым, или изоморфизмом (векторных
пространств), если у него существует обратный линейный оператор A−1 .
Теорема 13.2.22. Для линейного оператора A : X → Y следующие условия эквивалентны:
(i) A обратим,
(ii) A является биективным отображением9 .
(iii) A переводит некоторый базис e1 , ..., ek пространства X в базис Ae1 , ..., Aek простран-
ства Y .

9 Биективные отображения были определены на с.41.


752 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

• Для всякого векторного пространства X его Заметим, что для всякого базиса a =
вторым сопряженным пространством X ∗∗ (a1 , ..., an ) в векторном пространстве X базис 11 ,
a
называется пространство сопряженное к про- сопряженный к сопряженному базису a1 к a пред-
странству X ∗ : ставляет собой просто образ базиса a под дей-
ствием отображения ιX :
X ∗∗ := (X ∗ )∗
 i
1
Естественным отображением из X в X ∗∗ на- 1 := ιX (ai ), i = 1, ..., n. (13.2.97)
a
зывается отображение ιX : X → X ∗∗ , дей-
ствующее по формуле Теорема 13.2.23. Для всякого конечномерно-
го векторного пространства X естественное
ιX (x)(f ) := f (x), x ∈ X, f ∈ X ∗. отображение ιX : X → X ∗∗ является изомор-
(13.2.96) физмом.

Сопряженные операторы. Для всякого оператора A : X → Y формула

A∗ (f ) = f ◦ A, f ∈ Y ∗, (13.2.98)

определяет некое отображение


A∗ : Y ∗ → X ∗ ,
которое, как нетрудно убедиться, является линейным оператором. Он называется сопряженным
оператором к оператору A.

Алгебраические дополнения и проекторы.


• Говорят, что векторное пространство X разложено в прямую сумму своих подпространств
Y и Z, и записывают это формулой

X = Y ⊕ Z,

если выполняются следующие два условия:


(a) пересечение Y и Z состоит из нулевого вектора:

Y ∩ Z = {0}

(b) алгебраическая сумма Y и Z совпадает со всем X

X =Y +Z

(то есть любой вектор x ∈ X представим в виде суммы y + z, где y ∈ Y и z ∈ Z).


Эти условия вместе эквивалентны следующему одному условию:
(c) любой вектор x ∈ X единственным образом представим в виде суммы y + z, где
y ∈ Y и z ∈ Z:
∀x ∈ X ∃!y ∈ Y ∃!z ∈ Z x=y+z
При этом подпространство Z называется алгебраическим дополнением к подпространству
Y в пространстве X (и наоборот, Y – алгебраическим дополнением к Z). Из формулы
(13.2.65) следует импликация:

X =Y ⊕Z ⇒ dim X = dim Y + dim Z. (13.2.99)

Теорема 13.2.24. Всякое подпространство Y в (конечномерном10 ) векторном пространстве X


имеет алгебраическое дополнение (неединственное, если {0} 6= Y 6= X).
10 Теорема 13.2.24 верна не только для конечномерных пространств, но и для бесконечномерных также, однако мы

ограничиваемся конечномерным случаем.


§ 2. Векторные пространства 753

Доказательство. По свойству 1◦ на с.744 пространство Y конечномерно, значит в нем есть ко-


нечный базис a1 , ..., am . Эта система векторов линейно независима в Y и значит в X. Поэтому по
теореме 13.2.10 она дополняется до некоторого базиса a1 , ..., am , am+1 , ..., an в X. Линейная оболочка
новых присоединенных векторов
Z = span{am+1 , ..., an }
будет, как легко понять, алгебраическим дополнением для Y .
• Проектором в векторном пространстве X называется любой линейный оператор P : X →
X со свойством
P 2 = P.

Свойства проекторов:
1◦ . Если P – проектор в X, то I − P – тоже проектор в X, причем

Ker(I − P ) = Im P, Im(I − P ) = Ker P. (13.2.100)

2◦ . Если P – проектор в X, то его ядро Ker P и образ Im P алгебраически дополняют друг


друга в X:
X = Ker P ⊕ Im P.
3◦ . Если X разложено в прямую сумму своих подпространств Y и Z,

X = Y ⊕ Z,

то существует единственный проектор P в X, для которого Y является ядром, а Z –


образом:
Ker P = Y, Im P = Z.
• Фраза “P является проектором на подпространство Z” означает, что P – проектор, и
Z = Im P , а фраза “P является проектором вдоль подпространства Y ” означает, что P
– проектор, и Y = Ker P .
Доказательство. 1. Если P – проектор в X, то есть P 2 = P , то

(I − P )2 = (I − P ) · (I − P ) = |{z}
I 2 − |P{z· I} − I| {z P 2 = I − P − P + P = I − P.
· P} + |{z}
=

I P P P

Для доказательства (13.2.100) заметим две цепочки: во-первых,

x ∈ Ker(I − P ) ⇒ x − P (x) = 0 ⇒ x = P (x) ⇒ x ∈ Im P

а, во-вторых,

x ∈ Im P ⇒ ∃y ∈ X x = P (y) ⇒ ∃y ∈ X P (x) = P (P (y)) = P (y) = x ⇒


⇒ P (x) = x ⇒ x − P (x) = 0 ⇒ x ∈ Ker(I − P ).

Вместе они дают равенство Ker(I −P ) = Im P (верное для любого проектора P ). Если в нем заменить
проектор P на проектор I − Q, мы получим равенство Ker Q = Im(I − Q) (верное для любого
проектора Q), то есть второе равенство в (13.2.100).
2. Пусть P – проектор в X. Тогда, во-первых,
(
P (y) = 0
y ∈ Ker P ∩ Im P =⇒ =⇒ 0 = P (y) = P (P (x)) = P (x) = y,
∃x ∈ X : y = P (x)

то есть Ker P ∩ Im P = 0. И, во-вторых, для любого x ∈ X векторы z = P (x) и y = x − z обладают


свойствами:


z ∈ Im P,
P (y) = P (x − z) = P (x) − P (z) = P (x) − P (P (x)) = P (x) − P (x) = 0 =⇒ y ∈ Ker P,


x = y + z.
754 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

То есть X = Ker P + Im P , и вместе это означает, что X = Y ⊕ Z.


3. Пусть X разложено в прямую сумму своих подпространств,
X = Y ⊕ Z.
Это означает, что всякий вектор x ∈ X единственным образом раскладывается в сумму
x=y+z
где y ∈ Y и z ∈ Z. Это в свою очередь можно переформулировать так: для любого вектора x ∈ X
существует единственный вектор z ∈ Z такой, что x − z ∈ Y . То есть, правило
x−z ∈Y ⇐⇒ P (x) = z (13.2.101)


Z

корректно определяет некое отображение P : X → Z, и поскольку Z ⊆ X, его можно считать


отображением из X в X:
P :X →X
Покажем, что P линейно. Для всякого λ ∈ R мы получим:
(13.2.101)
x − P (x) ∈ Y =⇒ λ · x − λ · P (x) ∈ Y =⇒ P (λ · x) = λ · P (x).
| {z } | {z }

Z Z

А для любых x, x′ ∈ X
  (13.2.101)
x − P (x) ∈ Y & x′ − P (x′ ) ∈ Y =⇒ x + x′ − P (x) + P (x′ ) ∈ Y =⇒
| {z } | {z } | {z }

Z Z Z

=⇒ P (x + x′ ) = P (x) + P (x′ ).
Заметим далее следующую цепочку, из которой следует, что P является проектором:
(13.2.101)
x − P (x) − 0 ∈ Y =⇒ P (x − P (x)) = 0 =⇒ P (x) − P (P (x)) = 0 =⇒ P (P (x)) = P (x).

Далее убедимся, что Ker P = Y :


(13.2.101)
x ∈ Ker P ⇐⇒ P (x) = 0 ⇐⇒ x−0 ∈Y ⇐⇒ x ∈ Y.

И, наконец, что Im P = Z:
(13.2.101)
z ∈ Im P ⇐⇒ ∃x ∈ X P (x) = z ⇐⇒ ∃x ∈ X x−z ∈Y ⇐⇒ z ∈ Z.

(d) Полилинейные отображения, полилинейные формы и тензоры


• Пусть X1 , ..., Xk , Y – векторные пространства. Отображение
ϕ : X1 × · · · × Xk → Y
называется полилинейным, если оно линейно по каждому аргументу, то есть для любого
i = 1, ..., k и любых фиксированных векторов a1 ∈ X1 , ..., ai−1 ∈ Xi−1 , ai+1 ∈ Xi+1 , ..., ak ∈
Xk отображение
x ∈ Xi 7→ ϕ(a1 , ..., ai−1 , x, ai+1 , ..., an ) ∈ Y
является линейным оператором:

ϕ(a1 , ..., ai−1 , λ · p + µ · q, ai+1 , ..., an ) =


= λ · ϕ(a1 , ..., ai−1 , p, ai+1 , ..., an ) + µ · ϕ(a1 , ..., ai−1 , q, ai+1 , ..., an )
§ 2. Векторные пространства 755

Полилинейные формы.
• В частном случае, когда Y = R, полилинейное отображение
ϕ : X1 × · · · × Xk → R
называется полилинейной формой на последовательности пространств X1 , ..., Xk (при k =
2 – билинейной формой на паре пространств (X1 , X2 )). Множество всех полилинейных
форм на последовательности векторных пространств X1 , ..., Xk обозначается символом
L(X1 , ..., Xk ). В частном случае, когда пространства X1 , ..., Xk совпадают, мы будем ис-
пользовать обозначение
Lk (X) = L(X, ..., X). (13.2.102)
| {z }
k аргументов

⋄ 13.2.25. Всякая последовательность функци- действующую по правилу


оналов ξ1 ∈ X1∗ , ..., ξk ∈ Xk∗ определяет некую
полилинейную форму (x1 ⊠ ... ⊠ xk )(ξ1 , ..., ξk ) = ξ1 (x1 ) · ... · ξk (xk ),
ξ1 ⊠ ... ⊠ ξk ∈ L(X1 , . . . , Xk ), ξ1 ∈ X1∗ , . . . , ξk ∈ Xk∗ . (13.2.104)

действующую по правилу ⋄ 13.2.26. Не всякая полилинейная форма на


X имеет вид (13.2.103). Например, формы α :
(ξ1 ⊠ ... ⊠ ξk )(x1 , ..., xk ) = ξ1 (x1 ) · ... · ξk (xk ), R2 × R2 → R,
x1 ∈ X1 , . . . , xk ∈ Xk (13.2.103)
α(x; y) = x1 · y 1 + x2 · y 2
Наоборот, для последовательности векторов x1 ∈
X1 , ..., xk ∈ Xk символ x1 ⊠ ... ⊠ xk обозначает по- и
лилинейную форму на X1∗ , ..., Xk∗ , α(x; y) = x1 · y 2 − x2 · y 1
x1 ⊠ ... ⊠ xk ∈ L(X1∗ , . . . , Xk∗ ), нельзя представить в таком виде.

Теорема 13.2.27. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , и в соответствии
 i  j
с (13.2.78) a1 и 1b – сопряженные базисы в X ∗ и Y ∗ . Тогда билинейные формы
 i  j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
образуют базис в пространстве L(X, Y ) билинейных форм на X × Y . Разложение всякой билиней-
ной формы ϕ : X × Y → R по этому базису имеет вид
k X
X l  i  j
1 1
ϕ= ϕ(ai , bj ) · ⊠ (13.2.105)
i=1 j=1
a b

! 13.2.28. Этот результат очевидным образом обобщается на случай пространства L(X1 , ..., Xk ) с
произвольной последовательностью аргументов (X1 , ..., Xk ).
Доказательство. Сначала убедимся, что эта система линейно независима. Пусть для некоторых
скаляров λi,j выполняется равенство
k X
X l  i  j
1 1
λi,j · ⊠ = 0.
i=1 j=1
a b

Тогда для всякой пары индексов (p, q) мы получим:


 i  j  i  j (
1 1 1 1 0, (i, j) 6= (p, q)
⊠ (ap , bq ) = (ap ) · (bq ) = ,
a b a b 1, (i, j) = (p, q)
и поэтому
k X
X l  i  j
1 1
0= λi,j · ⊠ (ap , bq ) = λp,q .
i=1 j=1
a b
756 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
 i  j
Это верно для любых p и q, поэтому система a1 ⊠ 1b действительно линейно независима.
Теперь покажем, что она линейно полна. Пусть ϕ : X × Y → R – билинейная форма. Тогда для
любых x ∈ X и y ∈ Y
 
k h ii
X l h ii
X Xk X l h ii h ij
x y x y
ϕ(x, y) = ϕ  · ai , · bj  = · · ϕ (ai , bj ) = (13.2.103) =
i=1
a j=1
b i=1 j=1
a b
k X
X l  i  j !
1 1
= ϕ(ai , bj ) · ⊠ (x, y)
i=1 j=1
a b

Отбрасывая аргумент (x, y), мы получаем (13.2.105).

⋄ 13.2.29. Для любого числового семейства ет, что всякая билинейная форма α : Rn ×Rn → R
{αi,j ; i, j ∈ {1, ..., n}} ⊆ R формула имеет вид (13.2.106), где семейство чисел αi,j
X n определяется формулой
α(x, y) = αi,j · xi · y j , x, y ∈ Rn ,
i,j=1 αi,j = α(ei , ej ), (13.2.107)
(13.2.106)
очевидно, определяет билинейную форму α : в которой ei – стандартный базис в Rn , опреде-
Rn ×Rn → R. Наоборот, из теоремы 13.2.27 следу- ленный в (13.2.59).

Предложение 13.2.30. Для всякой последовательности конечномерных векторных пространств


X1 , ..., Xk размерность пространства L(X1 , . . . , Xk ) полилинейных форм на ней равна произведе-
нию размерностей пространств X1 , ..., Xk :

dim L(X1 , . . . , Xk ) = dim X1 · ... · dim Xk . (13.2.108)

Доказательство. В частном случае, когда множителей в тензорном произведении два, X и Y , это


равенство следует из теоремы 13.2.27

dim L(X, Y ) = dim X · dim Y,

потому что если a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , то в L(X, Y ) число элементов
в базисе  i  j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
равно k · l. В общем случае те же рассуждения опираются на замечание 13.2.28.

Тензоры.
• Тензором в последовательности конечномерных векторных пространств X1 , ..., Xk назы-
вается всякий линейный функционал

T : L(X1 , ..., Xk ) → R

на пространстве L(X1 , ..., Xk ) полилинейных форм на X1 , ..., Xk . Множество всех тензоров


на X1 , ..., Xk обозначается символом X1 ⊗ ... ⊗ Xk и называется тензорным произведением
последовательности пространств X1 , ..., Xk . По определению,

X1 ⊗ ... ⊗ Xk := L(X1 , ..., Xk )∗ (13.2.109)

⋄ 13.2.31. Всякая последовательность x1 ∈ X1 , нал)


..., xk ∈ Xk определяет некий тензор (функцио-
x1 ⊗ ... ⊗ xk ∈ X1 ⊗ ... ⊗ Xk = L(X1 , . . . , Xk )∗ ,
§ 2. Векторные пространства 757

действующий по правилу обозначает тензор (функционал)

ξ1 ⊠ ... ⊠ ξk ∈ X1∗ ⊗ ... ⊗ Xk∗ = L(X1∗ , . . . , Xk∗ )∗ ,


(x1 ⊗ · · · ⊗ xk )(α) := α(x1 , . . . , xk ),
α ∈ L(X1 , . . . , Xk ) (13.2.110) действующий по правилу

Точно так же, для последовательности функци- (ξ1 ⊗ · · · ⊗ ξk )(f ) = α(ξ1 , . . . , ξk ),


оналов ξ1 ∈ X1∗ , ..., ξk ∈ Xk∗ символ ξ1 ⊗ ... ⊗ ξk f ∈ L(X1∗ , . . . , Xk∗ ). (13.2.111)

Теорема 13.2.32. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y . Тогда тензоры

ai ⊗ b j ; i = 1, ..., k, j = 1, ..., l

образуют базис в тензорном произведении X ⊗ Y = L(X, Y )∗ .

! 13.2.33. Этот результат очевидным образом обобщается на случай пространства X1 ⊗ ... ⊗ Xk с


произвольной последовательностью аргументов (X1 , ..., Xk ).

Доказательство. Опять начнем с того, что убедимся, что эта система линейно независима. Пусть
для некоторых скаляров λi,j выполняется равенство
k X
X l
λi,j · ai ⊗ bj = 0.
i=1 j=1

 1 i  1 j
Пусть в соответствии с (13.2.78) a и b – сопряженные базисы в X ∗ и Y ∗ . Для всякой пары
индексов (p, q) мы получим
 p  q   p  q  p  q (
1 1 1 1 1 1 0, (i, j) 6= (p, q)
ai ⊗ b j ⊠ = ⊠ (ai , bj ) = (ai ) · (bj ) = ,
a b a b a b 1, (i, j) = (p, q)

поэтому
k X
X l  p  q 
i,j 1 1
0= λ · ai ⊗ b j ⊠ = λp,q .
i=1 j=1
a b

Это верно для любых p и q, поэтому система ai ⊗ bj действительно линейно независима.


Теперь покажем, что она линейно полна. Пусть T ∈ X ⊗ Y = L(X, Y )∗ – произвольный тензор.
Тогда для любой билинейной формы ϕ ∈ L(X, Y )
 
k X
X l  i  j k l  i  j !
1 1  XX 1 1
T (ϕ) = (13.2.105) = T  ϕ(ai , bj ) · ⊠ = ϕ(ai , bj ) · T ⊠ =
i=1 j=1
a b i=1 j=1
a b

Xk X l  i  j !
1 1
= ai ⊗ bj (ϕ) · T ⊠
i=1 j=1
a b

Выбрасывая аргумент ϕ мы получаем, что T является линейной комбинацией билинейных форм


ai ⊗ b j :
Xk X l  i  j !
1 1
T = T ⊠ · ai ⊗ b j .
i=1 j=1
a b

Из этой леммы, или напрямую из предложения 13.2.30 следует

Предложение 13.2.34. Для всякой последовательности конечномерных векторных пространств


X1 , ..., Xk размерность тензорного произведения X1 ⊗ · · · ⊗ Xk равна произведению размерностей
пространств X1 , ..., Xk :
dim(X1 ⊗ · · · ⊗ Xk ) = dim X1 · ... · dim Xk . (13.2.112)
758 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Изоморфизм X1 ⊗ ... ⊗ Xk ∼
= L X1∗ , ..., Xk∗ .

Теорема 13.2.35. Для любых конечномерных векторных пространств X1 , ..., Xk отображение



@ : L(X1 , . . . , Xk )∗ → L X1∗ , . . . , Xk∗ @T (ξ1 , ..., ξk ) = T (ξ1 ⊠...⊠ξk ), T ∈ L(X1 , . . . , Xk )∗ , ξi ∈ Xi∗ ,
| {z }
k
X1 ⊗ ... ⊗ Xk

является изоморфизмом векторных пространств, переводящим произвольный функционал x1 ⊗


... ⊗ xk в полилинейную форму ιX1 (x1 ) ⊠ ... ⊠ ιXk (xk ):11

x1 ⊗ ... ⊗ xk 7→ ιX1 (x1 ) ⊠ ... ⊠ ιXk (xk ). (13.2.113)



Всякое вообще линейное отображение L(X1 , . . . , Xk )∗ → L X1∗ , . . . , Xk∗ , удовлетворяющее условию
(13.2.113), совпадает с @.

Доказательство. Ограничимся случаем двух пространств X и Y и соответственно отображения



@ : L(X, Y )∗ → L X ∗ , Y ∗ @T (ξ, υ) = T (ξ ⊠ υ), T ∈ L(X, Y )∗ , ξ ∈ X ∗ , υ ∈ Y ∗

(общий случай рассматривается по аналогии).


1. Прежде всего нужно убедиться, что это отображение линейно. Для любых S, T ∈ L(X, Y )∗ ,
α, β ∈ R, ξ ∈ X ∗ , υ ∈ Y ∗ мы получим:

@(α · S + β · T )(ξ, υ) = (α · S + β · T )(ξ ⊠ υ) = α · S(ξ ⊠ υ) + β · T (ξ ⊠ υ) = α · @(S)(ξ, υ) + β · @(T )(ξ, υ).

Теперь отбрасывая ξ и υ, имеем:

@(α · S + β · T ) = α · @(S) + β · @(T ).

2. После этого проверим условие (13.2.113):

@(x ⊗ y)(ξ, υ) = (x ⊗ y)(ξ ⊠ υ) = (13.2.110) = (ξ ⊠ υ)(x, y) =


= ξ(x) · υ(y) = (13.2.96) = ιX (x)(ξ) · ιY (y)(υ) = (ιX (x) ⊠ ιY (y))(ξ, υ)

3. Зафиксируем теперь какие-нибудь базисы a1 , ..., ak и b1 , ..., bl в X и Y соответственно. По


теореме 13.2.32 тензоры вида

ai ⊗ b j , i = 1, ..., k, j = 1, ..., l

образуют базис в пространстве X ⊗ Y = L(X, Y )∗ . А по теореме 13.2.27 билинейные формы


 i  j
1 1
1 ⊠ 1 = (13.2.97) = ιX (ai ) ⊠ ιY (bj ); i = 1, ..., k, j = 1, ..., l
a b

образуют базис в пространстве L(X ∗ , Y ∗ ). При этом по уже доказанной формуле (13.2.113), при
отображении @ первый базис превращается во второй:

@(ai ⊗ bj ) = ιX (ai ) ⊠ ιY (bj ).



Мы получили, что линейное отображение @ : L(X, Y )∗ → L X ∗ , Y ∗ переводит базис в базис. По
теореме 13.2.22 это означает, что оно является изоморфизмом векторных пространств.

Универсальность пространства тензоров. Для всякой последовательности векторных про-


странств X1 , ..., Xk рассмотрим отображение


⊗ : X1 × ... × Xk → X1 ⊗ ... ⊗ Xk ⊗ (x1 , ..., xk ) = x1 ⊗ ... ⊗ xk , xi ∈ Xi .

и заметим, что оно полилинейно.


11 Отображения вида ιX → X ∗∗ были определены формулой (13.2.96).
§ 3. Матрицы и определители 759

Теорема 13.2.36. Для всякого набора конечномерных векторных пространств X1 , ..., Xk , Y и вся-
кого полилинейного отображения ϕ : X1 ×...×Xk → Y найдется единственный линейный оператор
ϕ⊗ : X1 ⊗ ... ⊗ Xk → Y , замыкающий диаграмму

X1 × ... × Xk
♦♦ ❖❖❖
⊗ ♦♦♦♦ ❖❖❖
♦♦ ❖❖ϕ❖ .
♦♦♦ ❖❖❖
w♦♦ ❖❖❖
'
X1 ⊗ ... ⊗ Xk ❴ ❴ ❴ ❴ ❴ ❴ ❴ ⊗❴ ❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ
Доказательство. Каждому функционалу f ∈ Y ∗ поставим в соответствие полилинейную форму
на X1 , ..., Xk по формуле
ψ(f ) = f ◦ ϕ.
У нас получился линейный оператор
ψ : Y ∗ → L(X1 , ..., Xk ).
Рассмотрим отображение ιY : Y → Y ∗∗ , определенное формулой (13.2.96). По теореме 13.2.23 оно
является изоморфизмом, поэтому определено обратное отображение ι−1
Y :Y
∗∗
→ Y . Положим
ϕ⊗ = ι−1 ∗ ∗
Y ◦ ψ : L(X1 , ..., Xk ) → Y

Тогда возникает цепочка (в которой xi ∈ Xi , f ∈ Y ∗ ):

ιY (ϕ⊗ (⊗(x1 , ..., xk )))(f ) = ψ ∗ (⊗(x1 , ..., xk ))(f ) = ψ ∗ (x1 ⊗...⊗xk )(f ) = (13.2.98) = (x1 ⊗...⊗xk )(ψ(f )) =
= (x1 ⊗...⊗xk )(f ◦ϕ) = (13.2.110) = (f ◦ϕ)(x1 , ..., xk ) = f (ϕ(x1 , ..., xk )) = (13.2.96) = ιY (ϕ(x1 , ..., xk ))(f )


ιY (ϕ (⊗(x1 , ..., xk ))) = ιY (ϕ(x1 , ..., xk ))


ϕ (⊗(x1 , ..., xk )) = ϕ(x1 , ..., xk )


ϕ ◦ ⊗ = ϕ.

§3 Матрицы и определители
(a) Матрицы
Напомним, что начальным интервалом натурального ряда N∗ мы условились называть (см. опре-
деление на с.201) произвольное множество вида
{1, ..., n} = {k ∈ N∗ : k 6 n}
• Матрицей размера m × n, где m, n ∈ N∗ , называется произвольная вещественнознач-
ная функция на декартовом произведении {1, ..., m} × {1, ..., n} начальных интервалов
{1, ..., m} и {1, ..., n}, то есть отображение вида
M : {1, ..., m} × {1, ..., n} → R
Значение такой функции в точке (i, j) ∈ {1, ..., m}×{1, ..., n} удобно обозначать с помощью
индексов:
Mij := M (i, j)
а всю матрицу удобно изображать в виде таблицы, в которой нижний индекс обозначает
номер столбца, а верхний – номер строки:
 1 
M1 M21 ... Mm1
 M12 M22 ... Mm2
M =  ...

... ... ... 
M1n M2n ... Mmn

Числа Mij в этой таблице (то есть значения функции M в точках (i, j)) называются эле-
ментами матрицы M , число m называется ее длиной, а число n – ее высотой.
760 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

• Множество всех матриц размера m × n (то есть длиной m и высотой n) мы будем обозна-
чать Rnm .
• Матрицы, у которых длина равна высоте, называются квадратными матрицами.
• Матрицы, у которых высота равна 1, можно отождествить со строками, которые мы
определили на с.715.
• Двойственным образом, матрицы, у которых длина равна 1 отождествляются со столб-
цами, определенными на с.716.

Алгебраические операции над матрицами.


• Всякую матрицу M можно умножать поэлементно на произвольное число λ ∈ R – полу-
чающаяся при этом матрица обозначается λ · M и называется произведением матрицы
M на число λ:
(λ · M )ji := λ · Mij

• Если M и N – матрицы одинакового размера m×n, то их можно складывать поэлементно,


и получающаяся матрица (того же размера m × n) называется суммой матриц M и N и
обозначается M + N :

(M + N )ji := Mij + Nij (M, N ∈ Rnm )

• Кроме того, если M – матрица размера m × n, а N – матрица размера l × m, то формула


m
X
(M · N )ji := Mkj · Nik (M ∈ Rnm , N ∈ Rm
l ) (13.3.114)
k=1

определяет матрицу M · N размера l × n, называемую произведением матриц M и N .


• Для всякой матрицы M размера m × n ее транспонированной матрицей называется мат-
рица размера n × m, обозначаемая символом M ⊤ и определяемая формулой

(M ⊤ )ji := Mji

Действие матрицы на строку векторов и разложение по базису.


• Пусть M ∈ Rnm – матрица длины m и высоты n. Тогда для любого векторного простран-
ства X и любой строки (x1 , ..., xn ) длины n векторов из X строка длины m

(x1 , ..., xn ) · M := x1 · M11 + ... + xn · M1n , ..., x1 · Mm
1 n
+ ... + xn · Mm (13.3.115)

или, что эквивалентно, строка (y1 , ..., ym ), элементы которой определяются формулой
n
X
yi = xj · Mij ,
j=1

называется внешним действием матрицы M на строку (x1 , ..., xn ).

• Если (b1 , ..., bn ) – базис в векторном пространстве X, а (x1 , ..., xm ) – произвольная по-
следовательность элементов X, то мы можем разложить каждый элемент xi по базису
(b1 , ..., bn ),
n h
X xi ij
xi = · bj ,
j=1
b

выписать столбцы коэффициентов


  xi 1 
  b
hx i
i xi   xi 2 
= =
 ...b .

b b1 , ..., bn
 x n
i
b
§ 3. Матрицы и определители 761

и рассмотреть матрицу, составленную из этих столбцов:


  x1 1  x2 1  xm 1 
  b ...
hxi   x1 2  xb 2  xb 2 
x1 , ..., xm  2
... m

= :=  b b b (13.3.116)
b b1 , ..., bn
 x...n  x...n ...  ... 
xm n
1
b b
2
... b

Эта матрица называется матрицей коэффициентов последовательности векторов x =


(x1 , ..., xm ) в разложении по базису b = (b1 , ..., bn ). Коротко она определяется равенством
h x ij h x ij
i
:= , i = 1, ..., m, j = 1, ..., n (13.3.117)
b i b
Теорема 13.3.1. Строка векторов пространства X восстанавливается по матрице коэффици-
ентов их разложения по базису с помощью следующей формулы:
hxi
(x1 , ..., xm ) = (b1 , ..., bn ) · (13.3.118)
b
Доказательство.
hxi  h x i1 h x in h x i1 h x in 
(b1 , ..., bn ) · = (13.3.115) = b1 · + ... + bn · , . . . , b1 · + ... + bn · =
b b 1 b 1 b m b m
 h x i1 h x in h x i1 h x in 
1 1 m m
= b1 · + ... + bn · , . . . , b1 · + ... + bn · = (x1 , ..., xm )
| b {z b } | b {z b }
=

=
(13.2.72) (13.2.72)
x1 xm

Действие матрицы на столбец векторов и разложение по базису.


• Пусть M ∈ Rnm – матрицадлины  m и высоты n. Тогда для любого векторного простран-
x1
ства X и любого столбца  ...  высоты m векторов из X столбец высоты n
xm
 1  1 1 1

x M1 · x + ... + Mm · xm
M ·  ...  :=  ...  (13.3.119)
xm M1n · x1 + ... + Mm
n
· xm
 1
x
называется внешним действием матрицы M на столбец  ... .
xm

Матрица перехода к новому базису.


• В частном случае, если (a1 , ..., an ) и (b1 , ..., bn ) – два базиса в векторном пространстве
X, то (квадратная) матрица коэффициентов последовательности векторов (a1 , ..., an ) в
разложении по базису (b1 , ..., bn )
  a1  1  a 1  a 1 
b
2
... n

hai   a1  2  ab2 2  abn 2 



:=  b b ... b  (13.3.120)
b
 a...n  a...n ...  ... 
an n
b
1
b
2
... b

называется матрицей перехода от базиса (a1 , ..., an ) к базису (b1 , ..., bn ). Коротко ее опре-
деление записывается формулой
h a ij h a ij
i
:= , i, j = 1, ..., n (13.3.121)
b i b
Из теоремы 13.3.1 следует
762 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Теорема 13.3.2. Базисы (a1 , ..., an ) и (b1 , ..., bn ) в векторном пространстве X связаны между
собой через матрицу перехода по следующей формуле:
hai
(a1 , ..., an ) = (b1 , ..., bn ) · (13.3.122)
b
Теорема 13.3.3. Если (a1 , ..., an ) и (b1 , ..., bn ) – два базиса в векторном пространстве X, то
hai hxi hxi
· = , x∈X (13.3.123)
b a  b  
hai b b hai
· =I= · (13.3.124)
b a a b
h a i−1  b 
= (13.3.125)
b a
(где I – единичная матрица размера n × n).
Доказательство. 1. Равенство (13.3.123) выводится из цепочки
!  
Xn h i h ij Xn Xn h ij h ii X n h ii Xn h ij
a x a x x a
· · bj = · · bj = · · bj  =
j=1
b a j=1 i=1
b i a i=1
a j=1
b i
 
X n h ii Xn h ij X n h ii Xn h ij
x ai x x
= · · bj  = · ai = x = · bj
i=1
a j=1
b i=1
a j=1
b

2. В (13.3.124) первое равенство выводится прямым вычислением:


n h i  j n h ij  k
! n h  k !
ak i j b i
X Xn X Xn X
a b a b
· · bj = · · bj = · · bj =
j=1
b a i j=1
b k a i j=1
b a
k=1 k=1

n
" Pn  bi k #j n  j n
X · ak X bi X
= k=1 a
· bj = · bj = bi = Iij · bj
j=1
b j=1
b j=1


h i  j
a b
· = Iij
b a i

hai  b 
· =I
b a
А после этого второе равенство в (13.3.124) тоже можно считать доказанным, потому что оно по-
лучается из первого перестановкой букв a и b.
3. Равенство (13.3.125) теперь – следствие (13.3.124).

Исчисление матричных представлений.


• Действием линейного оператора A : X → Y на последовательность a = (a1 , ..., am )
векторов в пространстве X называется последовательность векторов
Aa = ((Aa)1 , ..., (Aa)m ) = (Aa1 , ..., Aam ) (13.3.126)
• Пусть a1 , ..., am – базис в X, а b1 , ..., bn – базис в Y . Тогда матрицей линейного оператора
A : X → Y (или его матричным представлением) относительно этих базисов называется
матрица, у которой в i-м столбце и j-й строке стоит j-й коэффициент разложения вектора
Aai по базису b1 , ..., bn :
 j  j
Aa Aai
:= (13.3.127)
b i b
Иными словами, характеристическим свойством этой матрицы является тождество
Xn  j Xn  j
Aa Aai
Aai = · bj = · bj (13.3.128)
j=1
b i j=1
b
§ 3. Матрицы и определители 763

Теорема 13.3.4. Если a1 , ..., am – базис в X, а b1 , ..., bn – базис в Y , то справедливы тождества:


   
Ax Aa h x i
= · (13.3.129)
b b a
 
Aa h x i
Ax = (b1 , ..., bn ) · · , x∈X (13.3.130)
b a
Доказательство. Равенство (13.3.130) доказывается цепочкой

n h ii
! n h ii n h ii X n  j
X x X x X x Aa
Ax = A · ai = · Aai = (13.3.128) = · · bj =
i=1
a i=1
b i=1
b j=1
b i
n  j h i ! n   j  
Aa h x i Aa h x i
Xn X X
Aa x i
= · ·bj = (13.3.114) = · ·bj = (13.3.115) = (b1 , ..., bn )· ·
j=1 i=1
b i b j=1
b b b a

После этого (13.3.129) становится следствием равенства


n  j n   j
X Ax X Aa h x i
· bj = Ax = · · bj
j=1
b j=1
b a

Следствие 13.3.5. Если a1 , ..., am – базис в X, а b1 , ..., bn – базис в Y , то тождества


hxi
Ax = (b1 , ..., bn ) · M · , x∈X (13.3.131)
  a
Aa
M= (13.3.132)
b
устанавливают взаимно однозначное соответствие между матрицами M длины m и высоты n
и линейными операторами A : X → Y .
Теорема 13.3.6 (об исчислении матричных представлений). Если a = (a1 , ..., am ) — базис в X, а
b = (b1 , ..., bn ) и c = (c1 , ..., cn ) — базисы в Y , то для всякого оператора A : X → Y справедливо
равенство:      
b Aa Aa
· = , a ∈ X m , b, c ∈ Y n . (13.3.133)
c b c
Если a = (a1 , ..., am ) и c = (c1 , ..., cm ) — базисы в X, а b = (b1 , ..., bn ) — базис в Y , то для всякого
оператора A : X → Y справедливо равенство:
   
Aa h c i Ac
· = , a, c ∈ X m , b ∈ Y n . (13.3.134)
b a b
Доказательство. 1. В первом случае для всякого индекса i 6 m мы получаем
 
Xn    j Xn Xn  j  k ! Xn  k Xn  j
b Aa b Aa Aa b
· · cj = · · cj = · · cj  =
j=1
c b i j=1 k=1
c k b i b i j=1
c k
k=1
 
Xn  k Xn  j n 
X k Xn  k
Aa bk Aa (Aa)i
= · · cj  = · bk = · bk =
b i j=1
c b i b
k=1 k=1 k=1
n 
X j n 
X j
(Aa)i Aa
= (Aa)i = · cj = · cj
| {z } c c i
k=1 k=1

i-й вектор
в строке (A(a1 ), ..., A(an ))


   j  j
b Aa Aa
· =
c b i c i
764 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

И это доказывает (13.3.133).


2. Во втором случае для всякого индекса i 6 m мы получаем
 
Xn   h ij Xn Xn  j h i ! Xm h ik X n  j
Aa c Aa c k c Aa
· · bj = · · bj = · · bj  =
j=1
b a i j=1 k=1
b k a i a i
j=1
b k
k=1
 
m h ik
X Xn  j m h ik
X Xm h ik
c (Aa)k c c
= · · bj  = · (Aa)k = · A(ak ) =
a i b a i | {z } a i
k=1 j=1 k=1 k=1

k-й вектор
в строке (A(a1 ), ..., A(an ))
m h ik
! m h ik
! n  j n  j
X c X ci X A(ci ) X Ac
=A · ak =A · ak = A(ci ) = · bj = · bj
a i a j=1
b j=1
b i
k=1 k=1


  h ij  j
Aa c Ac
· =
b a i b i
И это доказывает (13.3.134).

В частном случае, когда a = b мы получаем


Следствие 13.3.7. Если b = (b1 , ..., bn ) и c = (c1 , ..., cn ) – два базиса в векторном пространстве
X, то для всякого оператора A : X → X справедливы равенства:
         
b Ab Ab Ac b
· = = · (13.3.135)
c b c c c

! 13.3.8. Формулы (13.3.133) и (13.3.134) удобно ся: " # " #


представлять как алгоритм “сокращения дробей” ... b h ... i
 · 6= .
в матричных представлениях: b ... ...
" # " #  
b Aa Aa Чтобы в этом убедиться, достаточно рассмот-
·  = (13.3.136) реть случай, когда X = Y и a = b, при котором
c b c
уже получаются неравенства:
" # " #        
Aa c Ac Ab b Ab
·  = (13.3.137) · 6= (13.3.140)
b a b b c c
h c i  Ab   Ac 
Однако при этом важно понимать, что при пе- · 6= (13.3.141)
рестановке множителей эти правила перестают b b b
работать: 1. Докажем сначала неравенство (13.3.140).
" # " #   Пусть X = R2 ,
Aa b Aa    
 · 6= (13.3.138) 1 0
b c c b1 = , b2 =
0 1
" # " #  
c Aa Ac — стандартный базис,
 · 6= (13.3.139)    
a b b 1 0
c1 = , c2 =
Это можно запомнить так: сокращаются базисы, −1 1
лежащие на главной диагонали, с северо-запада — новый базис, а оператор A представляется в
на юго-восток, базисе b = (b1 , b2 ) матрицей
" # " #    
b ... h ... i Ab 1 1
·  = = .
... ... b 0 1
b
Тогда
Но если они лежат на “неглавной” диагонали, с hci  
1 0
северо-востока на юго-запад, они не сокращают- = ,
b −1 1
§ 3. Матрицы и определители 765

откуда — новый базис, а оператор A представляется в


  h c i−1 базисе b = (b1 , b2 ) матрицей
b
= (13.3.125) = =
c b    
 −1   Ab 1 1
1 0 1 0 = .
= = . b 0 1
−1 1 1 1
Поэтому Тогда
       
Ab b Ab hci
= (13.3.133) = · = 1 0
c c b = ,
      b −1 1
1 0 1 1 0 1
= · = .
1 1 0 1 1 2 Поэтому
Отсюда мы уже получаем (13.3.140):
            h i
Ab b 1 1 1 0 Ac Ab c
· = · = = (13.3.134) = · ·=
b c 0 1 1 1 b b b
           
2 1 0 1 Ab 1 1 1 0 0 1
= 6= = . = · = .
1 1 1 2 c 0 1 −1 1 1 1

2. Теперь докажем (13.3.141). Пусть опять


X = R2 , Отсюда мы получаем (13.3.141):
   
1 0
b1 = , b2 = h c i  Ab     
0 1 1 0 1 1
— стандартный базис, · = · =
b b −1 1 0 1
         
1 0 0 1 0 1 Ac
c1 = , c2 = = 6= = .
−1 1 −1 0 1 1 b

Переход к новому базису.


Теорема 13.3.9 (о переходе к новому базису). Если b = (b1 , ..., bn ) и c = (c1 , ..., cn ) – два базиса в
векторном пространстве X, то для всякого оператора A : X → X справедливы равенства:
     −1   h i  
b Ab b Ac c −1 Ab h c i
· · = = · · (13.3.142)
c b c c b b b
• Из этих равенств второе обычно называется формулой перехода к новому базису:
  h i  
Ac c −1 Ab h c i
= · · (13.3.143)
c b b b
   
Здесь Ab — матрица оператора A в старом базисе b = (b1 , ..., bn ), bc — матрица, выража-
b  Ac 
ющая новый базис c = (c1 , ..., cn ) через старый b = (b1 , ..., bn ), а c — матрица оператора
A в новом базисе c = (c1 , ..., cn ).
Доказательство. Левое равенство в (13.3.142) получается из (13.3.135) умножением справа на мат-
 −1
рицу cb :        
b Ab Ac b
· = ·
c b c c

     −1      −1    
b Ab b Ac b b Ac Ac
· · = · · = ·I =
c b c c c c c c
| {z }
I
 b −1 c
После этого правое равенство в (13.3.142) получается из левого заменой c на b по формуле
(13.3.125).
766 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

⋄ 13.3.10. Пусть X = R2 , Обратная матрица имеет вид


   
1 0
b1 = , b2 = h c i−1  
0 1 1 0
= .
— стандартный базис, b 1 1
   
1 0
c1 = , c2 =
−1 1 Поэтому матрица A в базисе c = (c1 , c2 )
— новый базис, а оператор A представляется в
базисе b = (b1 , b2 ) матрицей   h i  
    Ac c −1 Ab h c i
Ab 1 −1 = · · =
= . c b b b
b 0 −1      
1 0 1 −1 1 0
Матрица, выражающая базис c через базис b = · · =
1 1 0 −1 −1 1
hci        
1 0 1 −1 1 0 2 −1
= . = · =
b −1 1 1 −2 −1 1 3 −2

Матрица билинейной формы


• Билинейной формой на векторном пространстве X называется всякая полилинейная фор-
ма на последовательности пространств (X, X), то есть всякое отображение α : X ×X → R,
линейное по каждому аргументу:

α(λ1 · x1 + λ2 · x2 , y) = λ1 · α(x1 , y) + λ2 · α(x2 , y), x1 , x2 , y ∈ X, λ1 , λ2 ∈ R,

и
α(x, λ1 · y1 + λ2 · y2 ) = λ1 · α(x, y1 ) + λ2 · α(x, y2 ), x, y1 , y2 ∈ X, λ1 , λ2 ∈ R.
• Если α : X × X → R – билинейная форма на векторном пространстве X и a = (a1 , ..., an )
– какой-нибудь базис в X, то матрицей билинейной формы α в базисе a = (a1 , ..., an )
называется матрица, определяемая формулой

α[a; a]ij = α(ai ; aj ). (13.3.144)

Теорема 13.3.11. Справедлива формула


n
X h x ii h y ij h x i⊤ hy i
α(x; y) = α(ai ; aj ) · · = · α[a; a] · (13.3.145)
i,j=1
a a a a

Доказательство. Здесь используется билинейность α: для любых x, y ∈ X мы получим


   
n h ii
X n h ij
X n h ii
X n h ij
X
x y x y
α(x; y) = α  · ai ; · aj  = · α  ai ; · aj  =
i=1
a j=1
a i=1
a j=1
a
Xn h ii X n h ij X n h x ii h y ij
x y
= · · α (ai ; aj ) = α(ai ; aj ) · ·
i=1
a j=1
a i,j=1
a a

Это первое равенство в (13.3.145). Второе также проверяется вычислением:


 
h x i⊤ hy i n h i⊤ 
X  h y ii X n h ii X n h y ij
x x
· α[a; a] · = · α[a; a] · = · α[a; a]ij · =
a a i=1
a i a i=1
a j=1
a
n
X h x ii h y ij
= α(ai ; aj ) · ·
i,j=1
a a
§ 3. Матрицы и определители 767

Следствие 13.3.12. Для всякого фиксированного базиса a = (a1 , ..., an ) в векторном пространстве
X тождества
h x i⊤ hyi
α(x; y) = ·M · , x, y ∈ X (13.3.146)
a a
M = α[a; a] (13.3.147)

устанавливают взаимно однозначное соответствие между матрицами M размера n × n и били-


нейными формами α на X.

Теорема 13.3.13. Если a1 , ..., an и b1 , ..., bn – два базиса в векторном пространстве X, то для
всякой билинейной формы α на X справедливо равенство
 ⊤  
b b
α[b, b] = · α[a, a] · (13.3.148)
a a

Доказательство. Здесь нужно просто вычислить матричный элемент матрицы справа:


 
 ⊤  ! k X n  ⊤ ! k   i X n  i Xn  j
b b b b b b 
· α[a; a] · = · α[a; a] · = · α[a; a]ij · =
a a i=1
a a l i=1
a k j=1
a l
l i
n
X  i  j Xn  i  j
b b bk bl
= α[a; a]ij · · = α(ai ; aj )· · = (13.3.145) = α(bk ; bl ) = (13.3.144) = α[b; b]kl
i,j=1
a k a l i,j=1
a a

• Пусть A : X → X – произвольный линейный оператор. Для любой билинейной формы α


на X можно рассмотреть билинейную форму

(x, y) 7→ α(Ax, Ay)

называемую действием оператора A на форму α.

Теорема 13.3.14. Справедливо тождество:


 ⊤  
Ab Ab
α[Ab, Ab] = · α[b, b] · (13.3.149)
b b

Доказательство.
 
 ⊤  !k Xn  ⊤ ! k   i X n  i X n  j
Ab Ab Ab Ab Ab  Ab 
· α[b; b] · = · α[b; b] · = · α[b; b]ij · =
b b i=1
b b l i=1
b k j=1
b l
l i
n
X i  j  Xn  i  j
Ab Ab (Ab)k (Ab)l
= α[b; b]ij · · = α[bi ; bj ] · · = (13.3.145) =
i,j=1
b k b l i,j=1
b b

= α((Ab)k ; (Ab)l ) = (13.3.144) = α[Ab; Ab]kl

Если a = (a1 , ..., an ) – строка элементов векторного пространства X и M ∈ Rnm – матрица, то,
напомним, формулой (13.3.115) мы определили внешнее действие матрицы M на строку векторов
a = (a1 , ..., an ):

a · M = (a1 , ..., an ) · M := a1 · M11 + ... + an · M1n , ..., a1 · Mm
1 n
+ ... + an · Mm

Теорема 13.3.15. Если a = (a1 , ..., an ) – базис векторного пространства X и M ∈ Rnn – обратимая
матрица, то матрица билинейной формы α в преобразованном базисе a · M = (a1 , ..., an ) · M имеет
вид:
α[a · M, a · M ] = M ⊤ · α[a, a] · M (13.3.150)
768 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Доказательство.

  X
m m
X 
α[a · M, a · M ]ij = α (a · M )i , (a · M )j = (13.3.115) = α ak · Mik , al · Mjl =
k=1 l=1
!
m
X m
X m
X m
X m
X i  k
= Mik · α(ak , al ) · Mjl = Mik · α[a; a]kl · Mjl = M⊤ k
· α[a, a] · M =
j
k=1 l=1 k=1 l=1 k=1
 i
= M ⊤ · α[a, a] · M
j

(b) Определитель
Определитель матрицы, как полилинейная кососимметрическая форма.
• Определителем квадратной матрицы A порядка n называется число
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n (13.3.151)
σ∈Sn

где Sn — множество перестановок длины n, определенное выше на с.728.


• Если (x1 , ..., xm ) – последовательность длины m элементов пространства Rn , то есть столб-
цов высоты n,  1  1
x1 xm
x1 =  ...  , ..., xm =  ...  ,
xn1 xnm
то условимся символом [x1 , ..., xm ] обозначать матрицу, составленную из этих столбцов:
 1 
x1 ... x1m
[x1 , ..., xm ] =  ... 
xn1 ... xnm

Понятно, что любую матрицу N ∈ Rnm можно представить как строку из таких столбцов

N = [x1 , ..., xm ], xi ∈ Rn ,

Для любой матрицы M размером k × m справедливо равенство


произведение произведение
матрицы матрицы
на столбец на столбец
z }| { z }| {
M · [x1 , ..., xm ] = [ M · x1 , ..., M · xm ] (13.3.152)
| {z }
произведение
матриц

С другой стороны, для любого столбца y ∈ Rm выполняется

[x1 , ..., xm ] · y = y 1 · x1 + ... + y m · xm (13.3.153)

Рассмотрим теперь определитель det как функцию от этих столбцов матрицы,

(x1 , ..., xn ) 7→ det[x1 , ..., xn ]

то есть как функцию на декартовом произведении

det : Rn × ... × Rn → R
| {z }
n множителей

Теорема 13.3.16. Определитель, как функция от столбцов матрицы,

f (x1 , ..., xn ) = det[x1 , ..., xn ]

обладает следующими свойствами:


§ 3. Матрицы и определители 769

(i) полилинейность: f линейна по каждому аргументу, то есть для всякого индекса i ∈ N∗


и фиксированных xj , j 6= i, отображение
x → f (x1 , ..., x , ..., xn )

i-е место

является линейным отображением: для любых λ, µ ∈ R, y, z ∈ Rn


f (x1 , ..., λ · y + µ · z , ..., xn ) = λ · f (x1 , ..., y , ..., xn ) + µ · f (x1 , ..., z , ..., xn ) (13.3.154)
| {z } ↑ ↑
↑ i-е место i-е место
i-е место

(ii) кососимметричность: f меняет знак при транспозиции аргументов:


j-е место i-е место
↓ ↓
f (x1 , ..., xi , ..., xj , ..., xn ) = −f (x1 , ..., xj , ..., xi , ..., xn ) (13.3.155)
↑ ↑
i-е место j-е место

И наоборот, если f : Rn × ... × Rn → R – какая-то функция, обладающая этими свойствами, то


| {z }
n множителей
она имеет вид
f (x1 , ..., xn ) = λ · det[x1 , ..., xn ] (13.3.156)
где
λ = f (e1 , ..., en ) (13.3.157)
Лемма 13.3.17. Если x1 , ..., xn – последовательность векторов из X, в которой какой-то вектор
xi равен нулю
xi = 0,
то значение любой полилинейной формы f : X × ... × X → R на этой последовательности равно
| {z }
n множителей
нулю:
f (x1 , ..., xn ) = 0
Доказательство. Обозначим λ = f (x1 , ..., xi , ..., xn ). Тогда

λ = f (x1 , ..., xi , ..., xn ) = f (x1 , ..., 0, ..., xn ) = f (x1 , ..., 2 · 0, ..., xn ) =


= 2 · f (x1 , ..., 0, ..., xn ) = 2 · f (x1 , ..., xi , ..., xn ) = 2 · λ

λ=0

Лемма 13.3.18. Если x1 , ..., xn – последовательность векторов из X, в которой какие-то два


вектора совпадают
xi = xj , i 6= j,
... × X} → R на этой по-
| × {z
то значение любой кососимметрической полилинейной формы f : X
n множителей
следовательности равно нулю:
f (x1 , ..., xn ) = 0
Доказательство. Обозначим y = xi = xj ∈ X и λ = f (x1 , ..., xn ). Тогда
y y
=

λ = f (x1 , ..., xi , ..., xj , ..., xn ) = (13.3.155) = −f (x1 , ..., xj , ..., xi , ..., xn ) = −λ


=

y y


2λ = 0

λ=0
770 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Лемма 13.3.19. При перестановке аргументов кососимметрическая форма меняет знак в соот-
ветствии с четностью этой перестановки:

f (xσ(1) , ..., xσ(n) ) = sgn σ · f (x1 , ..., xn ), σ ∈ Sn (13.3.158)

Доказательство. Это следует из теоремы 13.1.34: для транспозиций эта формула представляет со-
бой просто определение кососимметрической формы. А затем применяется индукция: если формула
(13.3.158) доказана для перестановок σ, которые можно разложить в композицию k транспозиций,
то добавляя еще одну транспозицию τ , мы получим:

f (xσ(τ (1)) , ..., xσ(τ (n)) ) = sgn σ · f (xτ (1) , ..., xτ (n) ) = sgn σ · sgn τ · f (x1 , ..., xn ) =
= (13.1.33) = sgn(σ ◦ τ ) · f (x1 , ..., xn )

Доказательство теоремы 13.3.16. 1. Сначала докажем первую часть теоремы. Полилинейность


отображения f (x1 , ..., xn ) = det[x1 , ..., xn ] проверяется прямым вычислением, например, если вместо
x1 подставить λ · y + µ · z, y, z ∈ Rn , то мы получим:
X σ(2)
f (λ · y + µ · z, x2 , ..., xn ) = det[λ · y + µ · z, x2 , ..., xn ] = sgn σ · (λ · y + µ · z)σ(1) · x2 · ... · xσ(n)
n =
σ∈Sn
X σ(2) σ(2)
σ(1)
= λ· sgn σ · y · x2 · ... · xσ(n)
n + µ · sgn σ · z σ(1) · x2 · ... · xσ(n)
n =
σ∈Sn

= λ · det[y, x2 , ..., xn ] + µ · det[z, x2 , ..., xn ] = λ · f (y, x2 , ..., xn ) + µ · f (z, x2 , ..., xn )

Теперь кососимметричность: пусть τ – какая-нибудь транспозиция (13.1.25), тогда


X σ(1) σ(n)
f (xτ (1) , ..., xτ (n) ) = det[xτ (1) , ..., xτ (n) ] = sgn σ · xτ (1) · ... · xτ (n) =
σ∈Sn
X σ(τ (1)) σ(τ (n))
X σ(1)
X σ(1)
= sgn(σ◦τ )·xτ (1) ·...·xτ (n) = sgn(σ◦τ )·x1 ·...·xσ(n)
n =− sgn(σ)·x1 ·...·xσ(n)
n =
σ◦τ ∈Sn σ∈Sn σ∈Sn

= − det[x1 , ..., xn ] = −f (x1 , ..., xn )

2. Теперь наоборот, пусть f – произвольное отображение со свойствами (i) и (ii). Тогда

n n
!
X X X
f (x1 , ..., xn ) = f xσ1 1 · eσ1 , ..., xσnn · eσn = xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
σ1 =1 σn =1 σ1 ,...,σn ∈{1,...,n}
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) + xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
| {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}
=

∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 13.3.18

сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) = (13.3.158) = xσ1 1 · ... · xσnn · sgn σ · f (e1 , ..., en ) =
| {z }
σ∈Sn σ∈Sn
λ
X
=λ· sgn σ · xσ1 1 · ... · xσnn = λ · det[x1 , ..., xn ]
σ∈Sn

Правило Крамера.
Теорема 13.3.20. Для последовательности (a1 , ..., an ) ⊂ Rn числовых столбцов высотой n следу-
ющие условия эквивалентны:
§ 3. Матрицы и определители 771

(i) уравнение
[a1 , ..., an ] · x = b (13.3.159)
разрешимо в Rn при любой правой части b ∈ Rn ;
(ii) уравнение
[a1 , ..., an ] · x = 0 (13.3.160)
имеет только одно решение x = 0 ∈ Rn ;
(iii) столбцы a1 , ..., an линейно независимы (то есть образуют базис) в векторном простран-
стве Rn ;
(iv) определитель матрицы [a1 , ..., an ] отличен от нуля:

det[a1 , ..., an ] 6= 0 (13.3.161)

При этом решение уравнения (13.3.159) описывается формулой


1
xi = · det[a1 , ..., b, ..., an ] (13.3.162)
det[a1 , ..., an ] ↑
этот столбец
подставлен в
[a1 , ..., an ] вместо
столбца ai

Лемма 13.3.21. Пусть a1 , ..., an , x, b ∈ Rn – числовые столбцы высотой n. Тогда если выполняется
равенство (13.3.159), то для всякого i = 1, ..., n справедливо равенство

xi · det[a1 , ..., an ] = det[a1 , ..., b , ..., an ] (13.3.163)



этот столбец
подставлен вместо
столбца ai

Доказательство. Перепишем равенство (13.3.159), расписав левую часть по формуле (13.3.153):

x1 · a1 + ... + xn · an = b

Теперь вычислим определитель в правой части (13.3.163) (здесь неявно предполагается, что 1 6= i 6=
n, но нетрудно переписать выкладки для i = 1 и i = n):

det[a1 , ..., b , ..., an ] = det[a1 , ..., x1 · a1 + ... + xi · ai + ... + xn · an , ..., an ] =


↑ | {z }
этот столбец ↑
подставлен вместо этот столбец
столбца ai подставлен вместо
столбца ai
i-й столбец i-й столбец i-й столбец
↓ ↓ ↓
1 i n
=x · det[a1 , ..., a1 , ..., an ] +... +x · det[a1 , ..., ai , ..., an ] +... +x · det[a1 , ..., an , ..., an ] =
| {z } | {z } | {z }
=

0, det[a1 , ..., an ] 0,
по лемме 13.3.18, по лемме 13.3.18,
поскольку поскольку
a1 повторяется an повторяется
в аргументе дважды в аргументе дважды

= xi · det[a1 , ..., an ]

Доказательство теоремы 13.3.20. Заметим сразу, что здесь нужно только доказать эквивалент-
ность условий (i)-(iv), потому что из (iv) и формулы (13.3.163) сразу же следует формула (13.3.162).
(i)⇔(ii). Рассмотрим оператор A : Rn → Rn , действующий по формуле

Ax = [a1 , ..., an ] · x, x ∈ Rn .

Условие (i) применительно к A означает, что отображение A : Rn → Rn должно быть сюръективно,


а условие (ii) – что A инъективно. По следствию 13.2.20 эти условия эквивалентны.
(ii)⇔(iii). Условие (ii) означает, что если для какого-то числового столбца x ∈ Rn справедливо
равенство
0 = [a1 , ..., an ] · x = x1 · a1 + ... + xn · an ,
772 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

то из этого автоматически следует, что x = 0, то есть что

x1 = ... = xn = 0.

Но это (в силу теоремы 13.2.3) как раз и есть условие линейной независимости векторов a1 , ..., an .
(iii)⇔(iv). 1. Пусть сначала столбцы a1 , ..., an линейно зависимы, то есть

0 = [a1 , ..., an ] · x = x1 · a1 + ... + xn · an ,

для некоторого x 6= 0 ∈ Rn . Тогда по лемме 13.3.21 для любого i = 1, ..., n выполняется равенство

xi · det[a1 , ..., an ] = det[a1 , ..., 0 , ..., an ] = (лемма 13.3.17) = 0 (13.3.164)



этот столбец
подставлен вместо
столбца ai

Поскольку x 6= 0, найдется индекс i такой, что xi 6= 0. Для него тоже верно (13.3.164). Значит,

det[a1 , ..., an ] = 0.

2. Пусть наоборот столбцы a1 , ..., an линейно независимы (то есть образуют базис) в Rn . Тогда
каждый базисный вектор ei представим в виде линейной комбинации векторов a1 , ..., an :
h e i1 h e in
i i
ei = · a1 + ... + · an
a a
 x j
(напомним, что обозначения a вводились выше формулой (13.2.72)). Отсюда мы получаем такую
цепочку:

n h
" #
e1 iσ1
n h
X X en iσn
1 = det[e1 , ..., en ] = det · aσ1 , ..., · aσn = (13.3.154) =
σ =1
a σ =1
a
1 n
n
X h e iσ1 h e iσn
1 n
= · ... · · det[aσ1 , ..., aσn ] =
σ1 ,...,σn =1
a a
X h e iσ1 h e iσn X h e iσ1 h e iσn
1 n 1 n
= · ... · · det[aσ1 , ..., aσn ] + · ... · · det[aσ1 , ..., aσn ] =
a a a a | {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}
=

∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 13.3.18

сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X h e1 iσ1 h e iσn
n
X h e1 iσ1 h e iσn
n
= ·...· ·det[aσ1 , ..., aσn ] = (13.3.158) = ·...· ·sgn σ·det[a1 , ..., an ] =
a a a a
σ∈Sn σ∈Sn
X h e iσ1 h e iσn hei
1 n
= det[a1 , ..., an ] · sgn σ · · ... · = det[a1 , ..., an ] · det
a a a
σ∈Sn


hei
1 = det[a1 , ..., an ] · det
a

det[a1 , ..., an ] 6= 0.
§ 3. Матрицы и определители 773

Свойства определителей матриц. Докажем следующее.


1◦ . Определитель треугольной матрицы равен произведению ее диагональных элементов:
 
∀i < j Aji = 0 =⇒ det A = A11 · A22 · ... · Ann (13.3.165)

2◦ . Определитель не меняется при транспонировании матрицы:

det A⊤ = det A (13.3.166)

3◦ . Определитель произведения равен произведению определителей:

det(A · B) = det A · det B (13.3.167)

4◦ . Матрица M тогда и только тогда обратима, когда ее определитель ненулевой

∃M −1 ⇐⇒ det M 6= 0

При этом определитель обратной матрицы равен обратному числу:

det(M −1 ) = (det M )−1 (13.3.168)

Доказательство. 1. Пусть матрица A треугольна, то есть Aji 6= 0 только если i > j. Тогда можно
показать, что в сумме (13.3.151) ненулевым будет только одно слагаемое, а именно, то, которое
соответствует тривиальной перестановке:
 σ(1)  

 A1 6= 0 
 σ(1) = 1
 σ(1) 6 1

Aσ(2) 6= 0 
σ(2) = 2 
σ(2) 6 2
σ(1) σ(2)
A1 · A2 · ... · Aσ(n)
n 6= 0 ⇐⇒ 2
⇐⇒ ⇐⇒

 ... 
 ... 
 ...

 σ(n) 
 

An 6= 0 σ(n) = n σ(n) 6 n
(13.3.169)
В этой цепочке лишь последняя эквивалентность требует некоторых объяснений. Она доказывается
последовательной расшифровкой условий σ(i) 6 i:
1) первое неравенство σ(1) 6 1, вместе с условием σ(1) ∈ N∗ сразу же дает σ(1) = 1;
2) после того, как мы это поняли, второе неравенство σ(2) 6 2 будет означать σ(2) = 2,
поскольку σ(2) ∈ N∗ и σ(2) 6= σ(1) = 1;
...
n) так по индукции мы к n-му шагу доказываем равенство σ(i) = i для любых i < n, и тогда
на n-м шаге неравенство σ(n) 6 n будет означать, что σ(n) = n, поскольку, σ(n) ∈ N∗ и
σ(n) 6= σ(i) = i при i = 1, ..., n − 1.
Из (13.3.169) следует, что в формуле (13.3.151) для матрицы A только одно слагаемое может быть
отлично от нуля – то, которое соответствует тождественной подстановке:
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n = sgn(1, 2, ..., n) ·A11 · A22 · ... · Ann = A11 · A22 · ... · Ann
| {z }
σ∈Sn
k
1

2. Для транспонированной матрицы получаем:

если упорядочить множители


по нижнему индексу
−1
sgn σ то получится
k σ−1 (1) −1 (n)
A1 · ... · Aσ
n
(13.1.34)

k z }| {
X σ(1) σ(n) X z }| {
det A⊤ = sgn σ · A⊤ 1
· ... · A⊤ n
= sgn σ · A1σ(1) · ... · Anσ(n) =
σ∈Sn σ∈Sn
X σ−1 (1) −1 X τ (1)
= sgn σ −1 · A1 · ... · Aσn (n)
= sgn τ · A1 · ... · Aτn(n) = det A
σ∈Sn τ ∈Sn
774 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

3. Пусть e1 , ..., en – стандартный базис в Rn . Зафиксируем матрицу A и рассмотрим функцию


 
f (x1 , ..., xn ) = det A · [x1 , ..., xn ] = det[A · x1 , ..., A · xn ], xi ∈ Rn

Она будет полилинейной формой, потому что

f (x1 , ..., λ · y + µ · z, ..., xn ) = det[A · x1 , ..., A · (λ · y + µ · z), ..., A · xn ] =


= det[A·x1 , ..., λ·A·y +µ·A·z, ..., A·xn] = λ·det[A·x1 , ..., A·y, ..., A·xn ]+µ·det[A·x1 , ..., A·z, ..., A·xn ] =
= λ · f (x1 , ..., y, ..., xn ) + µ · f (x1 , ..., z, ..., xn )

Эта форма будет кососимметрична, потому что

i-е место j-е место i-е место j-е место


↓ ↓ ↓ ↓
= det[A · x1 , ..., A · xi, ..., A · xj, ..., A · xn ] =
f (x1 , ..., xi , ..., xj , ..., xn )
= − det[A · x1 , ...,A · xj, ..., A · xi, ..., A · xn ] = −f (x1 , ..., xj , ..., xi , ..., xn )
↑ ↑ ↑ ↑
i-е место j-е место i-е место j-е место

Значит, по теореме 13.3.16, эта форма должна иметь вид:

f (x1 , ..., xn ) = λ · det[x1 , ..., xn ], (13.3.170)

где
 
λ = f (e1 , ..., en ) = det[A · e1 , ..., A · en ] = det A · [e1 , ..., en ] = det(A · I) = det A (13.3.171)
| {z }

единичная
матрица I

Поэтому
 
det(A·B) = det A·(B1 , ..., Bn ) = f (B1 , ..., Bn ) = (13.3.170) = λ·det(B1 , ..., Bn ) = (13.3.171) = det A·det B.

4. Представим матрицу M как строку из столбцов:

M = [a1 , ..., an ]

Ее обратимость означает, что уравнение


M ·x =b

однозначно разрешимо в Rn при любой правой части b ∈ Rn . По теореме 13.3.20 это эквивалентно
тому, что определитель M отличен от нуля:

det M 6= 0.

Далее из равенства
I = M · M −1

мы по уже доказанному свойству 3◦ получаем:



1 = det I = det M · M −1 = det M · det M −1

1
det M −1 = = (det M )−1
det M
§ 3. Матрицы и определители 775

Определитель оператора.
• Пусть X – конечномерное векторное пространство, a = (a1 , ..., an ) – произвольный базис
в X, и A : X → X – произвольный оператор. Число
 
Aa
det A = det (13.3.172)
a
| {z }

матрица оператора A
в базисе a

не зависит от выбора базиса a = (a1 , ..., an ) и называется определителем оператора A.


Доказательство. Пусть (b1 , ..., bn ) – какой-нибудь другой базис в X. Тогда

 h i   
Ab a Aa h a i−1
det = (13.3.142) = det · · = (13.3.167) =
b b a b
hai   h a i−1  hai    
Aa Aa  h a i−1 Aa
= det · det · det = (13.3.168) = det · det · det = det
b a b b a b a

Из свойств определителей матриц на с.773 следуют

Свойства определителей операторов


1◦ . Определитель единичного оператора равен единице:

det I = 1 (13.3.173)

2◦ . Определитель произведения равен произведению определителей:

det(A · B) = det A · det B (13.3.174)

3◦ . Оператор A тогда и только тогда обратим, когда его определитель ненулевой

∃A−1 ⇐⇒ det A 6= 0,

при этом определитель обратной матрицы равен обратному числу:

det(A−1 ) = (det A)−1 (13.3.175)

(c) Собственные числа и собственные векторы


Вектор x ∈ X называется собственным вектором оператора A : X → X, если x 6= 0 и он коллинеа-
рен вектору Ax, то есть существует число λ ∈ R такое, что

Ax = λx.

Число λ при этом называется собственным значением для собственного вектора x оператора A.

В самых простых случаях собственные векто- подпространства Q


ры и собственные числа легко находятся.
Ax = p ⇔ p ∈ P & x − p ∈ Q,
⋄ 13.3.22 (собственные векторы оператора про- имеет собственными векторами
ектирования). Пусть пространство X разложено
в прямую сумму подпространств 1) векторы пространства P , которые A
оставляет на месте
X =P ⊕Q Ap = p, p ∈ P,
(то есть X = P + Q и P ∩ Q = {0}). Опера- и поэтому собственные значения у та-
тор проектирования на подпространство P вдоль ких векторов λ = 1,
776 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

2) векторы пространства Q, которые A имеет собственными векторами


обнуляет
1) векторы пространства P , которые A
Aq = 0, q ∈ Q, оставляет на месте
и поэтому собственные значения у та-
Ap = p, p ∈ P,
ких векторов λ = 0.
⋄ 13.3.23 (собственные векторы оператора отра- и поэтому собственные значения у та-
жения). Опять пусть пространство X разложено ких векторов λ = 1,
в прямую сумму подпространств
2) векторы пространства Q, которые A
X =P ⊕Q отображает в противоположные векто-
ры
(то есть X = P + Q и P ∩ Q = {0}). Оператор от-
ражения относительно подпространства P вдоль Aq = −q, q ∈ Q,
подпространства Q
и поэтому собственные значения у та-
Ax = y ⇔ x + y ∈ P & x − y ∈ Q, ких векторов λ = −1.

Характеристический многочлен. Характеристическим многочленом оператора A : X → X


называется функция
fA (λ) = det(A − λI)
(где I — единичный оператор в X). Уравнение

fA (λ) = 0

называется характеристическим уравнением оператора A.


Теорема 13.3.24. Число λ является собственным значением оператора A в том и только в том
случае, если оно — корень его характеристического многочлена fA .

Базис из собственных векторов.


Теорема 13.3.25. В пространстве X базис из собственных векторов оператора A : X → X
существует тогда и только тогда, когда выполняются следующие два условия:
(a) характеристический многочлен fA разлагается на линейные множители, и
(b) размерность каждого собственного подпространства равна кратности соответствую-
щего корня многочлена fA .

⋄ 13.3.26. Следующий пример показывает, что У него имеется единственный корень


условия (a) и (b) в теореме 13.3.25 не эквивалент-
λ = 1.
ны. Пусть X = R2 ,
    Но соответствующее ему собственное подпро-
1 0 странство будет одномерно:
b1 = , b2 =
0 1    
1−λ 1 x
— стандартный базис, а оператор A представля- · =0 ⇔
0 1−λ y
ется в базисе b = (b1 , b2 ) матрицей    
0 1 x
    ⇔ · =0 ⇔
Ab 1 1 0 0 y
= .  
b 0 1 y
⇔ =0 ⇔ y=0 ⇔
0
Его характеристическое уравнение имеет вид       
x 1
    ⇔ V1 = ; x∈R = x· ; x∈R
1 1 1 0 0 0
fA (λ) = det −λ· =
0 1 0 1 То есть здесь выполняется условие (a), но не вы-
 
1−λ 1 полняется условие (b). Собственные векторы, ко-
= det = (1 − λ)2 = 0 нечно, в этом случае базис в X не образуют.
0 1−λ
§ 3. Матрицы и определители 777

⋄ 13.3.27. Пусть X = R2 , И мы можем проверить равенство (13.3.143):


          h i  
1 0 Ac c −1 Ab h c i
P = α ; α∈R , Q= β ; β∈R , = · ·
1 1 c b b b
— два дополняющие друг друга подпространства Действительно,
в X, а A — оператор проектирования на P вдоль
h c i−1  Ab  h c i
Q:
· · =
Ax = y ⇔ y ∈ P & x − y ∈ Q. b b b
     
Оператор A переводит стандартный базис 1 0 1 0 1 0
= · · =
    −1 1 1 0 1 1
1 0        
b1 = , b2 = 1 0 1 0 1 0 Ac
0 1 = · = =
0 0 1 1 0 0 c
в векторы
⋄ 13.3.28. Пусть X = R2 ,
           
1 0 1 0
Ab1 = , Ab2 = P = α ; α∈R , Q= β ; β∈R ,
1 0 1 1
поэтому в этом базисе он представляется матри- — два дополняющие друг друга подпространства
цей     в X, а A — оператор отражения относительно P
Ab 1 0 вдоль Q:
= .
b 1 0
Ax = y ⇔ x + y ∈ P & x − y ∈ Q.
Как отмечалось в примере 13.3.22, собственных
значений у такого оператора два: Оператор A переводит стандартный базис
1) λ = 1 с собственными векторами из P ,    
1 0
то есть имеющими вид b1 = , b2 =
0 1
 
1 в векторы
α· , α ∈ R,
1    
1 0
Ab1 = , Ab2 =
2) λ = 0 с собственными векторами из Q, 2 −1
то есть имеющими вид
поэтому в этом базисе он представляется матри-
 
0 цей    
β· , β ∈ R. Ab 1 0
1 = .
b 2 −1
Из собственных векторов можно выбрать ба- Как отмечалось в примере 13.3.23, собственных
зис, например, такой: значений у такого оператора два:
   
1 0 1) λ = 1 с собственными векторами из P ,
c1 = , c2 = .
1 1 то есть имеющими вид
 
Матрица, выражающая новый базис c через ста- 1
α· , α ∈ R,
рый b будет такой: 1
hci  
2) λ = −1 с собственными векторами из
1 0
= . Q, то есть имеющими вид
b 1 1
 
а обратная к ней матрица — такой: 0
β· , β ∈ R.
1
h c i−1   −1  
1 0 1 0 Из собственных векторов можно выбрать ба-
= = .
b 1 1 −1 1 зис, например, такой:
Далее, из равенств    
1 0
c1 = , c2 = .
1 1
Ac1 = c1 , Ac2 = 0
Матрица, выражающая новый базис c через ста-
следует, что в новом базисе оператор A имеет рый b будет такой:
матрицу    
Ac hci  
1 0 1 0
= . = .
c 0 0 b 1 1
778 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

а обратная к ней матрица — такой: И мы можем проверить равенство (13.3.143):


h c i−1  −1  
1 0 1 0 h c i−1  Ab  h c i
= = .
b 1 1 −1 1 · · =
b b b
Далее, из равенств      
1 0 1 0 1 0
= · · =
Ac1 = c1 , Ac2 = −c2 −1 1 2 −1 1 1
       
1 0 1 0 1 0 Ac
следует, что в новом базисе оператор A имеет = · = =
1 −1 1 1 0 −1 c
матрицу    
Ac 1 0
= .
c 0 −1

§4 Симметрические формы и однородные многочлены


(a) Общие симметрические формы и однородные многочлены
Симметрические формы Σm (X).
• Полилинейная форма ω на векторном пространстве X
ω : X × ... × X → R
| {z }
k множителей

называется симметрической формой степени k на X, если она инвариантна относительно


транспозиций:
ω(x1 , ..., xi , ..., xj , ..., xk ) = ω(x1 , ..., xj , ..., xi , ..., xk ), x1 , ..., xk ∈ X. (13.4.176)
Поскольку по теореме (13.1.36) любая вообще перестановка является композицией транс-
позиций, это эквивалентно инвариантности относительно всех перестановок:
ω(xσ(1) , ..., xσ(k) ) = ω(x1 , ..., xk ), σ ∈ Sk , x1 , ..., xk ∈ X. (13.4.177)
Множество всех симметрических форм степени k на X обозначается Σk (X). Ясно, что это
будет векторное пространство относительно поточечных алгебраических операций.

Симметрическое произведение функционалов. Если η 1 , ..., η m – произвольная последова-


тельность длины m линейных функционалов на X, то формула
1 X
(η 1 ⊓ ... ⊓ η m )(x1 , ..., xm ) := · η σ(1) (x1 ) · ... · η σ(m) (xm ) (13.4.178)
m!
σ∈Sm

или, эквивалентно, формула


1 X
η 1 ⊓ ... ⊓ η m := · η σ(1) ⊠ ... ⊠ η σ(m) (13.4.179)
m!
σ∈Sm

определяет симметрическую форму степени k на X, называемую симметрическим произведением


функционалов η 1 , . . . , η k .
Мы считаем очевидными следующие
Свойства симметрического произведения функционалов:
1◦ . При перестановке элементов последовательности η 1 , ..., η k симметрическое произведение не
меняется:
η σ(1) ⊓ ... ⊓ η σ(k) = η 1 ⊓ ... ⊓ η k , σ ∈ Sk . (13.4.180)
2◦ . При умножении какого-нибудь функционала η i на скаляр λ симметрическое произведение умно-
жается на скаляр:
η 1 ⊓ ... ⊓ λ · η i ⊓ ... ⊓ η k = λ · η 1 ⊓ ... ⊓ η i ⊓ ... ⊓ η k . (13.4.181)
3◦ . При замене какого-нибудь функционала η i на сумму функционалов α + β симметрическое про-
изведение заменяется на сумму конкатенаций с подставленными α и β вместо η i :
η 1 ⊓ ... ⊓ (α + β) ⊓ ... ⊓ η k = η 1 ⊓ ... ⊓ α ⊓ ... ⊓ η k + η 1 ⊓ ... ⊓ β ⊓ ... ⊓ η k (13.4.182)
§ 4. Симметрические формы и однородные многочлены 779

Симметризация. Для всякой полилинейной формы ω : X m → R ее симметризацией называется


полилинейная форма
1 X
Sym ω(x1 , ..., xm ) = · ω(xσ(1) , ..., xσ(m) ) (13.4.183)
m!
σ∈Sm

Отображение, которое каждой форме ω ставит в соответствие ее симметризацию


ω 7→ Sym ω
называется симметрированием.
Свойства симметрирования:
1◦ Линейность:
Sym(λ · ω + µ · π) = λ · Sym ω + µ · Sym π, ω ∈ Lm (X),
2◦ Инвариантность при перестановке:
Sym ω(xσ(1) , ..., xσ(m) ) = Sym ω(x1 , ..., xm ), ω ∈ Lm (X), σ ∈ Sm , x1 , ..., xm ∈ X.
(13.4.184)
3◦ Всякую полилинейную форму операция симметрирования превращает в симметриче-
скую,
∀ω ∈ Lm (X) Sym ω ∈ Sm (X), (13.4.185)
и при этом всякую симметрическую форму она не меняет:
∀ω ∈ Sm (X) Sym ω = ω. (13.4.186)
4◦ Идемпотентность: при вторичном применении симметрирование не меняет резуль-
тат
Sym(Sym ω) = Sym ω, ω ∈ Lm (X). (13.4.187)

⋄ 13.4.1. Из формулы (13.4.179) видно, что если метризацией формы η 1 ⊠· · ·⊠η m является форма
η 1 , . . . , η m – произвольная последовательность η 1 ⊓ · · · ⊓ η m :
длины m линейных функционалов на X, то сим-
Sym(η 1 ⊠ · · · ⊠ η m ) = η 1 ⊓ · · · ⊓ η m (13.4.188)

Базис в пространстве симметрических форм Σm (X).


• Пусть X – векторное пространство и ω ∈ Σm (X) – симметрическая форма на нем. Пусть
кроме того x = (x1 , ..., xn ) – строка элементов X (длина которой n необязательно сов-
падает со степенью m формы ω), и k : |1, ..., n| → N – мультииндекс объема m. Для
произвольного представления σ ∈ Rep(k) мультииндекса k рассмотрим величину
ω(xσ(1) , ..., xσ(m) ).
Поскольку ω – симметрическая форма, эта величниа не зависит от выбора представления
σ, а только от самого мультииндекса k. Поэтому определена величина
ω(xk ) = ω(xσ(1) , ..., xσ(m) ), σ ∈ Rep(k), (13.4.189)
называемая действием формы ω на мультистепень k строки x = (x1 , ..., xn ).
• Пусть X – векторное пространство и пусть η 1 , ..., η n – некая фиксированная последова-
тельность линейных функционалов на X. Если k : |1, ..., n| → N – мультииндекс, то для
любого его представления σ ∈ Rep(k) симметрическая форма
η σ(1) ⊓ ... ⊓ η σ(m)
не зависит от выбора этого представления σ. Поэтому определена симметрическая форма
η ⊓k = η σ(1) ⊓ ... ⊓ η σ(m) ∈ Σm (X). (13.4.190)
называемая мультистепенью строки функционалов η 1 , ..., η n .
780 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
   n 
1
Лемма 13.4.2. Пусть a = (a1 , ..., an ) – базис в X, и a1 = a1 , ..., a1 – сопряженный ему базис

в X . Тогда для любых двух мультииндексов k, l : {1, ..., n} → N одинакового объема,

|k| = m = |l|,

справедливо равенство
 ⊓k (
k!
1 , k=l
(al ) = m! . (13.4.191)
a 0, k 6= l

Доказательство. Выберем какие-нибудь представления σ ∈ Rep(k) и τ ∈ Rep(l). Тогда

 ⊓k  σ(1)  σ(m) !


1 1 1
(al ) = ⊓ ... ⊓ (aτ (1) , ..., aτ (m) ) = (13.4.178) =
a a a

1 X  1 σ(1)  σ(m)
1
= · (aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) (13.4.192)
m! a a
ρ∈Sm

Пусть теперь k 6= l. Тогда ki 6= li для некоторого i ∈ {1, ..., n}, и поэтому при любом ρ ∈ Sm

card σ −1 (i) = ki 6= li = card τ −1 (i) = card(τ ◦ ρ)−1 (i).


 σ(j)
Это означает, что в последовательностях a1 и aτ (ρ(j)) число элементов с индексами, равными
i неодинаково. Как следствие, найдется такой индекс j ∈ {1, ..., m}, что σ(j) = i 6= τ (ρ(j)), либо
σ(j) 6= i = τ (ρ(j)). Для такого j мы получим
 σ(j)
1
(aτ (ρ(j)) ) = 0,
a
и поэтому
 σ(1)  σ(m)
1 1
(aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) = 0
a a
Это верно для любого ρ ∈ Sm , и мы получаем, что вся сумма в конце (13.4.192) нулевая.
Наоборот, пусть k = l. Тогда в цепочке (13.4.192) с самого начала можно считать, что σ = τ .
Для того, чтобы слагаемое в конце (13.4.192) было ненулевым, должны выполняться равенства

τ (j) = τ (ρ(j)), j ∈ {1, ..., m},

(то есть чтобы перестановка ρ не меняла отображение τ ) и в этом случае все произведение будет
равно единице:
 σ(1)  σ(m)
1 1
(aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) = 1.
a a
Таких перестановок ρ, которые не меняют τ по теореме 13.1.32 имеется ровно k!. Поэтому вся сумма
в конце (13.4.192) будет равна k!.

Теорема 13.4.3 (о базисе в Σk (X)). Пусть η 1 , ..., η n – базис в сопряженном пространстве X ∗ .


Тогда для всякого числа m ∈ N симметрические формы {η ⊓k ; |k| = m} определенные формулой
(13.4.190) (где k пробегает всевозможные мультииндексы длины n и объема m), образуют базис
 1  n
в пространстве Σm (X). В частном случае когда η 1 = a1 , ..., η n = a1 – сопряженный базис
к некоторому базису a = (a1 , ..., an ) в X, разложение всякой симметрической формы по базису
(13.4.190) имеет вид
X  ⊓k
m! 1
ω= · ω(ak ) · (13.4.193)
k! a
k : {1, ..., n} → N :
|k| = m

(суммирование ведется по всевозможным мультииндексам k объема m).


§ 4. Симметрические формы и однородные многочлены 781

Доказательство. 1. Докажем сначала линейную независимость. Пусть для некоторых λk выпол-


няется равенство
X X X  
1 X τk ρ(1)
0= λk ·η ⊓k = λk ·η τk (1) ⊓...⊓η τk (m) = (13.4.178) = λk · · η ⊠...⊠η τk ρ(m)
m!
|k|=m |k|=m |k|=m ρ∈Sm
(13.4.194)
где τk – какое-нибудь фиксированное представление мультииндекса k. Заметим, что при любом
выборе мультииндексов k, l и перестановок ρ, π ∈ Sm равенство
 
η τk ρ(1) ⊠ ... ⊠ η τk ρ(m) = η τl (π(1)) ⊠ ... ⊠ η τl (π(m)) (13.4.195)

может выполняться только если k = l и τk ◦ ρ = τk ◦ π.


Действительно, если k 6= l, то найдется какой-то индекс i ∈ {1, ..., n} такой, что ki 6= li . Как
следствие,

card(τk ◦ ρ)−1 (i) = card τk−1 (i) = ki =


6 li = card τl−1 (i) = card(τl ◦ π)−1 (i).
 
Это означает, что в последовательностях η τk ρ(1) , ..., η τk ρ(m) и η τl (π(1))
 , ..., η
τl (π(m))
имеется
 неоди-
наковое количество векторов η i . Уже по этой причине формы η τk ρ(1) ⊠ ... ⊠ η τk ρ(m)
и η τl (π(1)) ⊠
... ⊠ η τl (π(m)) не могут совпадать.
Наоборот, если k = l, то (13.4.195) эквивалентно равенству
 
τk ρ(1) τk ρ(m)
η ⊠ ... ⊠ η = η τk (π(1)) ⊠ ... ⊠ η τk (π(m))

а это эквивалентно системе


τk (ρ(i)) = τk (π(i)), 1 6 i 6 m,
то есть τk ◦ ρ = τk ◦ π.
Разобьем теперь последнее выражение в (13.4.194) на подсуммы, в которых слагаемые одина-
ковы. В силу сказанного, это то же самое, что разбить последнюю сумму на подсуммы, в которых
перестановки ρ имеют одну и ту же композицию с τk . А это то же самое, что разбить эту сумму на
подклассы, соответствующие представлениям мультииндекса k:

X  
1 X τk ρ(1)
X λk X X
0= λk · · η ⊠ ... ⊠ η τk ρ(m)
= · η τ (1) ⊠ ... ⊠ η τ (m) =
m! m!
|k|=m ρ∈Sm |k|=m τ ∈Rep(k) σ∈Sm : τ ◦σ=τ
X λk X
= · card{σ ∈ Sm : τ ◦ σ = τ } ·η τ (1) ⊠ ... ⊠ η τ (m) =
m! | {z }
|k|=m τ ∈Rep(k)
k (13.1.21)
k!
X λk X
= · k! · η τ (1) ⊠ ... ⊠ η τ (m)
m!
|k|=m τ ∈Rep(k)

Теперь мы получаем, что в последнем выражении векторы η τ (1) ⊠ ... ⊠ η τ (m) не повторяются (при
изменении k и τ ∈ Rep(k)). А по замечанию 13.2.28 векторы вида η i1 ⊠ ... ⊠ η im (is ∈ {1, ..., n})
образуют базис в пространстве L(X, ..., X) всех полилинейных форм степени m на X. Значит, век-
торы η τ (1) ⊠ ... ⊠ η τ (m) должны быть линейно независимы (при изменении k и τ ∈ Rep(k)). Значит,
равенство нулю суммы означает равенство нулю клоэффициентов:
λk
∀k · k! = 0.
m!
или
∀k λk = 0.
2. Теперь докажем полноту. Если ω – какая-нибудь симметрическая форма, то, поскольку в
силу замечания 13.2.28 формы вида η i1 ⊠ ... ⊠ η ik (is ∈ {1, ..., n}) образуют базис в L(X, ..., X), ω
представима как их линейная комбинация:
X
ω= λi1 ,...,im · η i1 ⊠ ... ⊠ η im
is ∈{1,...,n}
782 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

Под действием симметрирования это равенство превращается в цепочку


X
ω = (13.4.186) = Sym ω = λi1 ,...,im · Sym(η i1 ⊠ ... ⊠ η im ) =
is ∈{1,...,n}
X
= (13.4.188) = λi1 ,...,ik · η i1 ⊓ ... ⊓ η im
is ∈{1,...,n}

То есть ω представима как линейная комбинация форм вида η i1 ⊓ ... ⊓ η im .


3. Мы убедились, что формы (13.4.190) образуют базис в Σm (X). Остается доказать формулу
 ⊓k
(13.4.193). Пусть a = (a1 , ..., an ) – базис в X. Разложим произвольную форму ω по базису a1 :

X  ⊓k
1
ω= λk · .
a
k : {1, ..., n} → N :
|k| = m

Рассмотрим произвольный мультииндекс l : {1, ..., n} → N объема m и подставим в качестве аргу-


мента строчку al :
X  ⊓k
1 l!
ω(al ) = λk · (al ) = · λl .
a m!
k : {1, ..., n} → N : | {z }
|k| = m k (13.4.191)
(
l!
m! , k=l
,
0, k 6= l

То есть
m!
λl = · ω(al ).
l!

(b) Однородные многочлены Pm (X)


• Многочленами на конечномерном векторном пространстве X называются функции f :
X → R, определенные следующими индуктивными правилами:
0) всякая постоянная функция f : X → R,

f (x) = λ, x∈X

является многочленом на X;
1) всякий линейный функционал f : X → R является многочленом на X;
2) если f : X → R и g : X → R – многочлены на X, то их произведение f ·g : X → R
тоже является многочленом на X;
3) если f : X → R и g : X → R – многочлены на X, то их сумма f + g : X → R
тоже является многочленом на X.
• Многочлен f : X → R называется однородным степени m, если выполняется тождество

f (λ · x) = λm · f (x), x ∈ X, λ ∈ R. (13.4.196)

Множество всех однородных многочленов степени m на X мы будем обозначать Pm (X).

Базис в пространстве однородных многочленов. Пусть X – векторное пространство раз-


мерности n ∈ N∗ и η 1 , ..., η n – последовательность линейных функционалов на X. Каждому муль-
тииндексу12 k : {1, ..., n} → N поставим в соответствие функцию
n
Y
η k (x) = η i (x)ki , x ∈ X. (13.4.197)
i=1

называемую k-мономом последовательности η 1 , ..., η n . Понятно, что всякая такая функция явля-
ется однородным многочленом на X степени m = |k| (равной объему мультииндекса k).
12 Понятие мультииндекса было определено на с.721.
§ 4. Симметрические формы и однородные многочлены 783

Теорема 13.4.4. При фиксиорованном базисе η1 , ..., ηn – в сопряженном пространства X ∗ мономы


{η k ; |k| = m} (где k пробегает множество мультииндексов длины n и объема m) образуют базис в
пространстве Pm (X) всех однородных многочленов на X степени m: всякий многочлен f ∈ Pm (X)
однозначно раскладывается в сумму X
f= λk · η k (13.4.198)
|k|=m

(где λk ∈ R, а суммирование ведется по всевозможным мультииндексам длины n и объема m).

Изоморфизм Pm (X ∗ ) ∼ = Σm (X)∗ . Пусть a = (a1 , ..., an ) – базис в векторном пространстве X.


Каждый вектор ai можно считать функционалом на сопряженном пространстве X ∗ , потому что
ему соответствует функционал ιX (ai ) ∈ (X ∗ )∗ , определенный формулой (13.2.96):

ιX (ai )(f ) = f (ai ), f ∈ X ∗.

Более того, поскольку по теореме 13.2.23 отображение ιX : X → (X ∗ )∗ является изоморфизмом


векторных пространств, функционалы a1 , ..., an образуют базис пространства (X ∗ )∗ .
Поэтому каждому мультииндексу k : {1, ..., n} → N будет соответствовать некий k-моном базиса
a1 , ..., an в (X ∗ )∗ .
n
Y n
Y n
Y
ak (f ) = ai (f )ki = ιX (ai )(f )ki = f (ai )ki , f ∈ X ∗.
i=1 i=1 i=1

Каждому моному ak ∈ Pm (X ∗ ) можно приписать действие на симметрические формы ω ∈ Σm (X)


по формуле
@ak (ω) = ω(aσ(1) , ..., aσ(|k|) ) (13.4.199)
где σ : {1, ..., |k|} → {1, ..., n} – произвольное представление13 мультииндекса k (поскольку форма
ω симметрична, правая часть (13.4.199) не зависит от выбора представления σ). По теореме 13.4.4
мономы ak образуют базис в пространстве многочленов Pm (X ∗ ). Значит, каждый многочлен f ∈
Pm (X ∗ ) однозначно раскладывается по этому базису по формуле
X
f= λk · ak , λk ∈ R. (13.4.200)
|k|=m

Для любой формы ω ∈ Σm (X) положим


X
@f (ω) = λk · ω(ak ). (13.4.201)
|k|=m

Это число мы называем действием многочлена f ∈ Pm (X ∗ ) на форму ω ∈ Σm (X). При фикси-


рованном f ∈ Pm (X ∗ ) эта формула определает линейный функционал @f : Σm (X) → R, а если
считать, что f может меняться, то мы получаем отображение

@ : Pm (X ∗ ) → Σm (X)∗ .

Теорема 13.4.5. Действие (13.4.201) многочлена f ∈ Pm (X ∗ ) на симметрическую форму ω ∈


Σm (X) обладает следующими свойствами:
(i) определение @f (ω) не зависит от выбора базиса a = (a1 , ..., an ) в X;
(ii) если ω 6= 0, то существует f такой, что @f (ω) 6= 0;
(iii) если f 6= 0, то существует ω такая, что @f (ω) 6= 0;
(iv) отображение @ : Pm (X ∗ ) → Σm (X)∗ является изморфизмом векторных пространств.

Доказательство. 1. Пусть b = (b1 , ..., bn ) – другой базис в X. Для любых мультииндексов k, l :


{1, ..., n} → N объема |k| = |l| = m, и любого представления σ ∈ Rep(k) обозначим
h a il X h aσ(1) iτ (1) ha iτ (m)
k σ(m)
= · ... · (13.4.202)
b b b
τ ∈Rep(l)

13 Представление мультииндекса было определено на с.727.


784 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

и заметим, что это число не зависит от выбора σ ∈ Rep(k). Действительно, если σ ′ – какое-то другое
представление мультииндекса k, то от σ оно отличается некоторой перестановкой аргументов

σ ′ = σ ◦ υ, υ ∈ Sm .

Поэтому
"a  #τ (1) "a  #τ (m)
X h aσ′ (1) iτ (1) ha ′
σ (m)
iτ (m) X σ υ(1) σ υ(m)
· ... · = · ... · =
b b b b
τ ∈Rep(l) τ ∈Rep(l)
| {z }
если заменить τ на τ ◦ υ, то сумма не изменится
 
"a  #τ υ(1) "a  #τ υ(m)
X σ υ(1) σ υ(m) X h aσ(1) iτ (1) ha
σ(m)
iτ (m)
= · ... · = · ... ·
b b b b
τ ∈Rep(l) τ ∈Rep(l)
| {z }
k
ha iτ (1) ha iτ (m)
σ(1) σ(m)
b · ... · b

Определение (13.4.202) позволяет выразить ak через bl : для произвольного σ ∈ Rep(k)


   
n h
X aσ(1) ij1 Xn h
aσ(1) ijn
ak = aσ(1) · ... · aσ(m) = (13.2.72) =  · bj1  · ... ·  · bjn  =
j =1
b j =n
b
1 1

n
X ha ij1 ha ijn
σ(1) σ(1)
= · ... · · bj1 · ... · bjn =
j1 ,...,jn =1
b b
X X h aσ(1) iτ (1) ha
σ(1)
iτ (n) X h ak il
= · ... · · bτ (1) , ..., bτ (m) = · bl
b b b
|l|=m τ ∈Rep(l) |l|=m

Отсюда следует, что если многочлен f раскладывается по базису a формулой (13.4.200), то в раз-
ложении по базису b он принимает вид
X X X h ak il X X h a il
k
X
f= λk · ak = λk · · bl = λk · · bl = µl · b l
b b
|k|=m |k|=m |l|=m |l|=m |k|=m |l|=m

где
X h a il
k
µl = λk · .
b
|k|=m

Если теперь обозначить символами @a f (ω) и @b f (ω) действия многочлена f на форму ω опреде-
ленные правилом (13.4.201) примененном к базисам a и b соответственно,
X X
@a f (ω) = λk · ω(ak ), @b f (ω) = λl · ω(bl ).
|k|=m |l|=m

то мы получим, что эти действия совпадают:


X X
@a f (ω) = λk · ω(ak ) = λk · ω(aσ(1) · ... · aσ(m) ) = (13.2.72) =
|k|=m |k|=m
 
X Xn h ij1 Xn h ijn
a σ(1) a σ(1)
= λk · ω  · bj1 , ..., · bjn  =
j =1
b j =n
b
|k|=m 1 1

X n
X ha ij1 ha ijn
σ(1) σ(1)
= λk · · ... · · ω(bj1 , ..., bjn ) =
j1 ,...,jn =1
b b
|k|=m
X X X h aσ(1) iτ (1) ha
σ(1)
iτ (n)
= λk · · ... · · ω(bτ (1) , ..., bτ (m) ) =
b b
|k|=m |l|=m τ ∈Rep(l)
X X h a il X
k
= λk · · ω(bl ) = µl · ω(bl ) = @b f (ω).
b
|l|=m |k|=m |l|=m
§ 4. Симметрические формы и однородные многочлены 785

2. Пусть ω 6= 0. Тогда эта форма отлична от нуля на какой-то последовательности aσ(1) , ..., aσ(m)
базисных векторов:
ω(aσ(1) , ..., aσ(m) ) 6= 0.
Последовательность σ(1), ..., σ(m) является представлением некоторого мультииндекса k, и поэтому
мы получаем
ω(ak ) 6= 0.
То есть @f (ω) 6= 0 при f = ak .
3. Наоборот, пусть f 6= 0. По тореме 13.4.4 многочлен f раскладывается по базису ak :
X
f= λk · ak .
|k|=m

Поскольку f 6= 0, какой-то коэффициент в этом разложении должен быть ненудевым: λl 6= 0. Если


 l
взять симметричевую форму ω = a1 , то мы получим

X X  l  l
1 1
@f (ω) = λk · ω(ak ) = λk · (ak ) = (13.4.191) = λl · (al ) = λl · l! 6= 0.
a a
|k|=m |k|=m

4. Докажем (iv). Понятно, что отображение @ : Pm (X ∗ ) → Σm (X)∗ лмнейно. Оно инъективно,


потому что если f 6= 0, то по свойству (iii) найдется ω такая, что @f (ω) 6= 0, и значит @f 6= 0.
Покажем, что оно сюръективно. Пусть F ∈ Σm (X)∗ – какой-нибудь функционал. Положим
X 1   k 
1
f= ·F · ak .
k! a
|k|=m

Тогда для любой формы ω ∈ Σm (X) мы получим


X 1   k   X  k 
1 1 1
@f (ω) = ·F · ω(ak ) = F · · ω(ak ) = (13.4.193) = F (ω).
k! a k! a
|k|=m |k|=m

Это значит, что @f = F .

Симметрическая поляризация Pm (X) ∼ = Σm (X). Пусть X – векторное пространство размер-


ности n, η 1 , ..., η n – базис его сопряженного пространства X ∗ и m ∈ N∗ . По теореме (13.4.4) всякий
однородный многочлен f ∈ Pm (X) однозначно раскладывается по базису мономов {η k } степени m,
X
f= λk · η k , (13.4.203)
|k|=m

а по теореме 13.4.3 всякая симметрическая форма ω ∈ Σm (X) однозначно раскладывается по базису


элементарных форм {η ⊓k } степени m,
X
ω= λk · η ⊓k .
|k|=m

• Отображение X X
Π:f = λk · η k 7→ ω= λk · η ⊓k (13.4.204)
|k|=m |k|=m

(которое каждому многочлену f ∈ Pm (X) ставит в соответствие симметрическую форму


ω ∈ Σm (X) с теми же коэффициенами в разложении по базису {η ⊓k }, что и у f в раз-
ложении по базису {η k }) называется симметрической поляризацией. Это отображение
однозначно определяется тем, что оно линейно и переводит базис {η k } в базис {η ⊓k }:

Π(η k ) = η ⊓k .

Теорема 13.4.6. Отображение симметрической поляризации Π : Pm (X) → Σm (X) линейно, би-


ективно, не зависит от выбора базиса η 1 , ..., η n в X ∗ , а обратное ему отображение Π −1 : Σm (X) →
Pm (X) совпадает с отображением ограничения на диагональ:

Π −1 (ω)(x) = ω(x, ..., x), x ∈ X. (13.4.205)


786 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА

! 13.4.7. Ниже мы покажем, что поляризацию Π можно задать формулой


1 d d

Π(f )(x1 , ..., xm ) = · ... f (t1 · x1 + ... + tm · xm ) , xi ∈ X, (13.4.206)
m! d t1 d tm t1 =...=tm =0

Доказательство. 1. Линейность и биективность этого отображения очевидны. Покажем, что оно


не зависит от базиса. Здесь повторяются рассуждения теоремы 13.4.5. Фиксируется какой-нибудь
другой базис θ1 , ..., θn в X ∗ . Затем определяется система чисел, аналогичная (13.4.202):
 k X  η σ(1)   σ(m) 
η η
= · ... · ,
θ l θ τ (1) θ τ (m)
τ ∈Rep(l)

и отмечается, что они не зависят от выбора представления σ ∈ Rep(k). Отсюда следует, что если
многочлен f раскладывается по базису η k формулой (13.4.203), то в разложении по базису θl он
принимает вид X X
f= λk · η k = µl · θ l (13.4.207)
|k|=m |l|=m
где  
X ηk
µl = λk · .
θ l
|k|=m

Если теперь для многочлена (13.4.207) обозначить символом Πη (f ) форму, определенную правилом
(13.4.204), а символом Πθ (f ) форму, определенную тем же правилом (13.4.204), но а заменой η на
θ, X X
Πη (f ) = λk · η ⊓k , Πθ (f ) = µl · θ⊓l ,
|k|=m |l|=m

то мы получим, что эти формы совпадают:


X X
Πη (f ) = λk · η ⊓k = λk · η σ(1) ⊓ ... ⊓ η σ(m) ) = (13.2.72) =
|k|=m |k|=m
   
X X n  σ(1)  Xn  σ(1) 
η η
= λk ·  · θj1  ⊓ ... ⊓  · θjn  =
j =1
θ j1 j =n
θ jn
|k|=m 1 1

X n
X  σ(1)
  
η η σ(1)
= λk · · ... · · θj1 ⊓ ... ⊓ θjn =
j1 ,...,jn =1
θ j1 θ jn
|k|=m
X X X  η σ(1)   σ(1) 
η
= λk · · ... · · θτ (1) ⊓ ... ⊓ θτ (m) =
θ τ (1) θ τ (n)
|k|=m |l|=m τ ∈Rep(l)

X X  l X
ηk
= λk · · θl = µl · θl = Πθ (f ).
θ
|l|=m |k|=m |l|=m

2. Тождество (13.4.205) достаточно проверить на базисных векторах. Для ω = η ⊓k мы получим:

ω(x, ..., x) = η ⊓k (x, ..., x) = (13.4.190) = (η σ(1) ⊓ ... ⊓ η σ(m) )(x, ..., x) = (13.4.178) =
1 X
= · η σ(τ (1)) (x) · ... · η σ(τ (m)) (x) = η k (x) = Π −1 (η ⊓k )(x) = Π −1 (ω)(x)
m! | {z }
τ ∈Sm
k
η σ(1) (x) · ... · η σ(m) (x)
k
η k (x)

Универсальность пространства однородных многочленов. Пусть X – конечномерное веще-


ственное векторное пространство. Каждому числу k ∈ N∗ и каждой последовательность (x1 , ..., xk )
векторов из X поставим в соответствие однородный многочлен x1 ⊔ ... ⊔ xm степени m на сопряжен-
ном пространстве X ∗ по формуле

(x1 ⊔ ... ⊔ xm )(f ) = f (x1 ) · ... · f (xm ), f ∈ X ∗. (13.4.208)


§ 4. Симметрические формы и однородные многочлены 787

Заметим, что отображение


⊔k : (x1 , ..., xm ) 7→ x1 ⊔ ... ⊔ xm (13.4.209)
является кососимметрическим полилинейным отображением ⊔m : X × ... × X → Pm (X ∗ ). Кроме
того справедливо тождество

@(x1 ⊔ ... ⊔ xm )(ω) = ω(x1 , ..., xm ), x1 , ..., xm ∈ X. (13.4.210)

Действительно, если a = (a1 , ..., an ) – базис в X, то


 X h i   X h x ijm 
x j1 1 m
@(x1 ⊔ ... ⊔ xm )(ω) = @ · aj1 ⊔ ... ⊔ · ajm (ω) =
j1
a jm
a
 X h i   X h x ijm   X X h x1 ij1 h xm ijm 
x1 j1 m
=@ ·aj1 ⊔...⊔ ·ajm (ω) = @ ·...· ·aj1 ⊔...⊔ajm (ω) =
j1
a jm
a j1 jm
a a
X X h x1 ij1 h x ijm
m
X X h x1 ij1 h x ijm
m
= · ... · · ω(aj1 ⊔ ... ⊔ ajm ) = · ... · · ω(aj1 , ..., ajm ) =
j1 jm
a a j1 jm
a a
 X h i   X h x ijm 
x1 j1 m
=ω · aj1 , ..., · ajm = ω(x1 , ..., xm ).
j
a j
a
1 m

Теорема 13.4.8 (универсальность пространства однородных многочленов). Для любого симмет-


рического полининейного отображения ϕ : X ... × X} → Y найдется единственное линейное
| × {z
m множителей
отображение ϕ∨ : Pm (X ∗ ) → Y , замыкающее диаграмму

X × ... × X
t ❏❏
⊔m tt
tt ❏❏
❏❏ ϕ
ttt ❏❏
❏❏ .
ttt ❏❏
zt ❏$
Pm (X ∗ ) ❴ ❴ ❴ ❴ ❴ ❴ ⊔❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ

Доказательство. Каждому функционалу f ∈ Y ∗ поставим в соответствие симметрическую форму


ψ(f ) степени m на X по формуле
ψ(f ) = f ◦ ϕ.
У нас получится линейный оператор

ψ : Y ∗ → Σm (X).

Ему соответствует сопряженное отображение

ψ ∗ : Σm (X)∗ → Y ∗∗ .

Рассмотрим отображение ιY : Y → Y ∗∗ , определенное формулой (13.2.96). По теореме 13.2.23 оно


является изоморфизмом векторных пространств, поэтому определено обратное отображение ι−1 Y :
Y ∗∗ → Y . Положим
ϕ⊔ = ι−1 ∗
Y ◦ ψ ◦ @ : Pm (X) → Y

ψ∗
Σm (X)∗ / Y ∗∗
O

@ ι=1


Pm (X) ⊔
/Y
ϕ

Тогда возникает цепочка (в которой xi ∈ X, f ∈ Y ∗ ):


   
f ϕ⊔ ⊔m (x1 , ..., xm ) = f ϕ⊔ (x1 ⊔ ... ⊔ xm ) = f (ι−1 ∗
Y ◦ ψ ◦ @)(x1 ⊔ ... ⊔ xm ) =
   
−1 ∗
   
= f ιY ψ @(x1 ⊔ ... ⊔ xm ) = ψ ∗ @(x1 ⊔ ... ⊔ xm ) (f ) = @(x1 ⊔ ... ⊔ xm ) ψ(f ) =
788 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
 
= @(x1 ⊔ ... ⊔ xm ) (f ◦ ϕ) = (13.4.210) = (f ◦ ϕ)(x1 , ..., xm ) = f ϕ(x1 , ..., xm )




ϕ ⊔m (x1 , ..., xm ) = ϕ(x1 , ..., xm )


ϕ ◦ ⊔m = ϕ.

(c) Симметрические билинейные формы и критерий Сильвестра


Симметрические билинейные формы. Билинейная форма α на векторном пространстве X
называется симметрической, если она удовлетворяет тождеству

α(x, y) = α(y, x), x, y ∈ X (13.4.211)

Теорема 13.4.9. Для билинейной формы α на векторном пространстве X следующие условия


эквивалентны:
(i) α является симметрической;
(ii) матрица A билинейной формы α в каком-нибудь базисе b1 , ..., bn является симметриче-
ской:
A⊤ = A (13.4.212)
(iii) матрица A билинейной формы α в любом базисе b1 , ..., bn является симметрической.
Доказательство.

Вам также может понравиться