Академический Документы
Профессиональный Документы
Культура Документы
МАТЕМАТИЧЕСКИЙ АНАЛИЗ
без пробелов
С.С.Акбаров
18 февраля 2019 г.
2
i
Если задаться целью проследить, во что превратятся курсы математики, читаемые на техни-
ческих факультетах нынешних университетов, при условии, что изложение в них будет вестись на
современном уровне строгости, с нуля и без пробелов, то можно быть уверенным, что большинству
преподавателей и студентов открывшаяся картина покажется неожиданной. Главным сюрпризом
наверняка будет то, что такое изложение вообще возможно. Вторым по неожиданности — его де-
тали. И третьим — что такая подача материала будет все же доступна для понимания. Настоящий
учебник — попытка такой систематизации. Автор строит курс математики, включающий в себя
основные факты математического анализа и лежащих в его основе дисциплин — математической
логики и линейной алгебры — с расчетом на формально нулевую подготовку читателя. Последнее,
разумеется, не означает обещания, что изложение будет понятно первокласснику, но подразумевает
возможность для человека, способного абстрагироваться от части своих знаний, проверить детали
внушаемого ему со школы убеждения, что математика — строгая наука, где все аккуратно выстра-
ивается чисто логическими средствами, без ссылок на интуицию, причем сами логические средства
также ясно формализуются и никак не связаны с человеческой биологией.
Предисловие
Настоящий текст представляет собой черновик учебника по математическому анализу и тем обла-
стям математики, на которые он опирается: математической логике и линейной алгебре (в объеме,
с точностью до некоторых отклонений по ходу изложения, необходимом для доказательства утвер-
ждений математического анализа). Идея, руководившая автором при его создании, состояла в том,
чтобы дать возможность студентам и преподавателям проследить цепочки рассуждений, ведущие
от самых элементарных понятий теории множеств к главным результатам университетской мате-
матики. При этом первостепенными требованиями к этим цепочкам выставлялись их ясность и
непрерывность, и, поскольку по опыту автора, это требует объяснения, настоящее Предисловие
предназначено главным образом для него.
Что не так? Если задуматься, что теоретически может мешать человеку понимать предмет, из-
ложенный в учебнике, то в голову придут два главных возможных препятствия:
1) Темные места. Плохо объясненные, плохо проработанные, неоправданно сложные, непо-
нятные, запутанные детали в каких-то частях изложения, — причем таковыми могут быть
даже целые темы, — понятно, составляют проблему.
2) Пробелы. Они бывают двух типов: пробелы со ссылками и пробелы без ссылок.
a) Первые отсылают читателя за подробностями к другим источникам, и, хотя в
таких случаях считается, что человек сам может восстановить недостающие де-
тали, надо понимать, что это далеко не всегда бывает легко. Негарантированная
доступность источника, рассогласованность в терминологии и обозначениях, в
стиле, необязательно внятное освещение этой темы в самом источнике, всегда
представляют дополнительные сложности, иногда небольшие, но часто очень
существенные, вплоть до непреодолимых.
b) Помимо пробелов со ссылками бывают еще пробелы без ссылок. Это происходит,
когда какие-то вещи автору текста кажутся очевидными, или общеизвестными,
или незаслуживающими детального обсуждения. Во всех случаях это может
быть причиной непонимания или вовсе отторжения материала.
В математическом анализе эти трудности представлены полным списком. Вот, в частности, из-
вестные автору темные места и пробелы без ссылок (пробелы со ссылками мы перечислим чуть
ниже, на странице v).
1. Элементарные функции. Почти во всех учебниках они вводятся “описательно”, без строгих
определений. Если бы так было везде, это был бы пробел без ссылок, однако автору известна одна
книга, а именно, учебник Г. Грауэрта, И. Либа и В. Фишера [3], где экспонента, логарифм, степень и
тригонометрические функции определены аккуратно [3, Глава VI, § 4]. Можно было бы поэтому не
видеть здесь проблемы, но неприятность в том, что в [3] определения элементарных функций даются
только после темы “Разложение Тейлора”. Естественно, это делает их формально непригодным в
предыдущих темах, то есть, фактически во всем первом семестре изучения матанализа. Поскольку
в матанализе элементарные функции принято использовать сразу, проблема остается, и ее можно
классифицировать как темное место.
2. Кривые и поверхности. Эта тема выглядит недоработанным введением в геометрическую тео-
рию меры, в котором, вопреки ожиданиям зрителя, создатели не захотели или не смогли избавиться
от параметризации. То есть, например, кривая в Rn определяется не как множество в Rn , а как
отображение
γ : [a, b] → Rn
с подходящими свойствами (гладкость, липшицевость, спрямляемость, на вкус автора). Все после-
дующие конструкции — длина (или площадь, в случае с поверхностями), интегралы двух типов и
ii
iii
h(x) = sin(x2 ).
h(z) − h(x)
h(x) = lim , (1)
z→x z−x
то для этого нам необходимо будет ввести две вспомогательные функции
Этот способ намного менее удобен (особенно когда функция устроена сложно, с большим числом
композиций и/или алгебраических операций), чем школьный, в виде цепочки преобразований, ко-
торая в данном случае принимает вид
′ ′
sin(x2 ) = sin y 2
= (sin y)′ 2
· (x2 )′ = cos y 2
· 2x = cos x2 · 2x
y=x y=x y=x
h(z) − h(1)
h(1) = lim .
z→1 z−1
Если же то же самое проделать с формулами (2), подставив, например, y = 1 и x = 1 (что есте-
ственно, когда считаешь значение производной функции h(x) = sin(x2 ) в точке 1), то мы получим
формально ложные равенства:
(потому что производная от константы должна быть нулевой). Это означает, что если мы хотим
сохранить школьные приемы вычисления производной, мы должны помимо (1) иметь другое опре-
деление производной, предназначенное специально для вычислений.
Естественный способ приписать точный смысл тождествам (2) — относиться к операции взятия
производной в них как к формальной операции τ 7→ τ ′ на термах подходящей теории 1 порядка4 .
1 Ниже это упражнение приведено как пример 5.1.23.
2В тексте формула (5.1.4).
3 Ниже формула (5.1.61).
4 Понятие теории 1 порядка, или формальной теории, описывается ниже в тексте на с.79.
iv
Если представлять Calculus как такую теорию, то его сигнатуру логично было бы считать состоящей
их нульместных функциональных символов
0, 1, e, π
В такой теории производную и интеграл можно было бы определять как операции на термах (или
как подходящие преобразования формул5 ), а возникающие конструкции на множестве R веществен-
ных чисел были бы просто моделью6 Calculus, как теории 1 порядка. Поскольку решение школьных
уравнений и неравенств также представляет собой систему операций над выражениями, постро-
енными из тех же символов, эту часть математики также можно было бы считать компонентой
Calculus.
Но Calculus как теория 1 порядка к настоящему времени не разработан7. Со времен Коши и
Вейерштрасса, когда, как считается, в Анализе был наведен порядок, эта тема так и осталась белым
пятном, и как следствие, традиционно объясняется путано, ссылок на специальные дисциплины не
имеет, а времени на обучение требует пропорционально своей непроходимости: последние несколько
лет школы и первые годы университета.
С чего начать и где остановиться? Автор счел разумным (и возможным) изложить основные
факты математического анализа с элиминацией темных мест и пробелов, причем не только пробе-
лов без ссылок, но и со ссылками. Последнее условие в этой программе понимается максимально
широко: изложение ведется прямо от оснований математики, что позволяет сделать его полностью
независимым от других источников (в частности, избавиться в теоретическом материале от тради-
ционных ссылок на так называемую “базу школьных знаний”, которыми всегда злоупотребляют в
учебниках по университетской математике).
Для перечисленных выше трех трудных мест в тексте предложены следующие решения.
5 См.формулы на с.330 и 402.
6 Понятие модели теории 1 порядка определяется на с.102.
7 Очевидно, из-за проблемы с определением равенства термов, о которой мы говорим ниже на с.301.
v
1. Элементарные функции: здесь проблема решается введением двух избыточных аксиом (подроб-
ности на с.277). В нашем учебнике эта тема описывается в главе 4, после темы “Пределы”. Такое
расположение материала связано с тем, что при доказательстве свойств элементарных функций,
в частности, тождеств, приходится активно использовать классические теоремы о непрерывных
функциях (а именно, теорему Коши о промежуточном значении 3.3.6 и теорему об обратной функ-
ции 3.3.12), которые, как следствие, к этому моменту желательно иметь в своем распоряжении.
Однако если формальная сторона дела не стоит в приоритете, ничто не мешает на занятиях опи-
сать аксиомы степеней и тригонометрии сразу в теме “числовые функции”, перечислив главные
следствия из них без доказательств (или пообещав доказать это позже). Тогда пользоваться эле-
ментарными функциями можно будет с первых занятий.
2. Кривые и поверхности: здесь предложенное решение состоит в том, чтобы ввести класс гладких
отображений на измеримых по Жордану компактах, которые характеризуются инъективностью по-
чти всюду и невырожденностью почти всюду дифференциала (в тексте такие отображения называ-
ются полурегулярными, см. определение на с.946). Это позволяет доказать теорему о существовании
(подходящим образом понимаемой) функции перехода от одной параметризации к другой (теоре-
ма 15.3.15), что в свою очередь дает решение упомянутой выше проблемы независимости нужных
конструкций от параметризации.
3. Calculus: здесь автор должен признаться, что не смог (пока) найти идею, позволяющую эле-
гантно обойти упомянутые выше трудности. Последовательно разрабатывать Calculus, как теорию 1
порядка, — задача, по-видимому, слишком громоздкая (см. подробности на с.300), а можно ли (с со-
блюдением строгости) описать эту теорию проще — автору неизвестно. В тексте Дифференциальное
исчисление описывается как язык 1 порядка с набором функциональных символов, включающим
обозначения всех элементарных функций (в том числе функций, определенных не везде на R)8 с
дополнительной операцией взятия частной производной над термами. Обсуждение этой темы мы
начинаем со страницы 300, а детали решения приводим на страницах 330 (для функций одной пе-
ременной) и на с.817 (для функций нескольких переменных). Интегральное исчисление, наоборот,
описывается как конструкция внутри Анализа на с.402, без выхода в теорию формальных языков,
потому что неопределенный интеграл удобнее считать операцией на классах функций со значения-
ми в классах функций (а не на классе термов со значениями в классе термов, где он будет не везде
определен).
В соответствии с общей философской установкой, в текст включены также темы, которые по
описанной выше классификации можно считать пробелами со ссылками. Вот их список в сторону
удлинения цепочки связей с матанализом:
4. Линейная алгебра. Многомерный вещественный анализ базируется на линейной алгебре9 , по-
этому если задаваться целью ликвидировать не только пробелы без ссылок, но и со ссылками, то
соответствующий материал из линейной алгебры в такой текст нужно включать. Мы это делаем в
главе 12.
5. Комбинаторика. Линейная алгебра в свою очередь использует результаты комбинаторики10 .
Этот материал мы излагаем в начале главы 12.
6. Теория вещественного числа. Вещественный анализ и линейная алгебра, строятся как дефи-
нициальные расширения теории вещественных чисел. Мы излагаем эту теорию в главе 2.
7. Теория множеств и логика. Теория вещественных чисел в свою очередь представляет собой
дефинициальное расширение аксиоматической теории множеств. Мы описываем ее в главе 0, а в
главе 1 мы приводим материал из математической логики, необходимый для понимания логической
структуры всего курса (в частности, определение самого дефинициального расширения дается на
с.90).
О логике нужно сказать несколько слов отдельно, поскольку ее можно считать одновременно и
пробелом со ссылками, и темным местом, и, при определенном уровне требовательности, пробелом
без ссылок. Речь идет вот о чем. После знаменитого кризиса начала 20 века эта наука пришла к со-
стоянию, когда ее описание удобнее всего представлять как некую игру с символами. И, хотя в этом
8 То есть, помимо алгебраических операций, включающих деление и возведение в степень, в этой сигнатуре функ-
9 В качестве иллюстрации можно привести, например, теорему о локальном экстремуме 14.1.27, или теоремы
Лагранжа 14.3.11 и 14.3.12, или теорему об искажении меры при линейном преобразовании 15.1.21, и другие, где
содержатся ссылки на действия с матрицами и полилинейными формами на конечномерном вещественном векторном
пространстве.
10 Например, в конструкции определителя.
vi
и заключался главный итог исследований первой половины 20 века в этой области, — превращение
всей математики в игру с символами, — правила этой игры и главные ее результаты объясняются
на сегодняшний день очень плохо. Неспециалиста эти объяснения поражают своей сложностью и
требуют от него усилий, несоразмерных с целями ознакомления с предметом.
Автору очевидно, что причиной здесь является утвердившийся среди логиков после работ Гёделя
язык платоновских идей, проявляющийся в традиции использовать понятия множества и функции
вне их аксиоматического описания, а понятия истинности и ложности вне их связи с выводимо-
стью из аксиом теории множеств. На самом элементарном уровне понимания предмета это видно
в том, что в современной логике понятия множества и функции используются до того, как тео-
рия множеств построена как формальная теория. Это приводит к странной неоднозначности в
понимании этих терминов: с одной стороны, они используются как термины формальной теории,
но одновременно (и очень часто, почти всегда, невозможно уловить разницу) как просто слова в
повседневной речи, значение которых не требует уточнений (но тем не менее выводы, к которым
приводит их употребление, остаются на удивление глубокими и неочевидными11 ).
Человек с улицы (даже математик, но не специалист в этой области) понять эту игру намеков,
конечно, не в состоянии, и остается удивляться, как получилось, что до сих пор никто не пытался
навести в этой области “линейный порядок” (принятый во всей остальной математике). То есть
такое положение дел, при котором ссылки на конструкции, не описанные формально на момент
использования, считаются недопустимыми.
В первой части нашего учебника, посвященной основаниям математики (главы 0 и 1) мы поста-
раемся исправить это недоразумение и даем “линейное” изложение главных результатов этой науки.
Неспециалисту это прояснит картину, а специалисту позволит взглянуть на нее по-новому (что, как
мы уже отмечали в аннотации, полезно). Автор, помимо прочего, считает, что такой “линейный”
способ объяснять этот материал представляет собой естественное развитие гильбертовской фило-
софии формализма (которой только обстоятельства помешали превратиться в описываемую здесь
систему).
С теорией множеств и логикой мы доходим до основ, дальше которых уже ничего нет, и у нас
получается курс университетской математики с нуля.
Объем охвата тем 4-7 в этом списке диктуется потребностями математического анализа, но
иногда, когда затрагиваемый круг вопросов важен для математики в целом, как, например, в случае
с рангом множества (см. определение на с.74), мы отступаем от этого правила и даем немного
больше информации.
например, формулы для простейших геометрических величин в главе 8 – площади правильной об-
ласти на плоскости, объема тела вращения и т.п. – которые мы по традиции приводим раньше, чем
эти величины формально будут определены, и как следствие, доказательство этих формул перено-
сится на несколько глав вперед). При таком подходе, в частности, все, что связано с Исчислением,
включая определения элементарных (/стандартных) функций, описание формальных операций над
ними и доказательство связи этих операций с дифференцированием и интегрированием, попадает
в двухколоночный текст, поскольку идеологически превращается в иллюстративный материал.
При работе над текстом автор использовал многие идеи доказательств, а также некоторые за-
дачи и упражнения из учебников и пособий, выходивших в разные годы в России. Эти руководства
приведены в списке литературы на странице viii.
Остающиеся пробелы. В предлагаемом варианте текста все еще остаются один пробел без ссы-
лок и одно темное место:
1. Темным местом по-прежнему можно считать Calculus, потому что, как уже говорил ав-
тор, найти идею, позволяющую изложить этот материал одновременно строго и просто,
ему пока не удалось. Предлагаемое решение можно считать строгим, но простым его не
назовешь.
2. Пробелом без ссылок является теорема Гёделя о полноте для рекурсивно аксиоматизи-
рованных теорий, описываемая в тексте в нетрадиционно формализованном виде и на-
званная здесь теоремой о семантизации (теорема 1.1.23). Это утверждение приводится
без доказательства (и без ссылок на доказательство) и даже сама его формулировка пока
не точна.
Автор публикует в сети этот черновик в надежде на помощь коллег и будет признателен за любые
ссылки и идеи для устранения этих недостатков.
Литература
viii
Часть I
ОСНОВАНИЯ МАТЕМАТИКИ
1
Глава 0
ТЕОРИЯ МНОЖЕСТВ
Вся современная математика (за исключением некоторых разделов логики) строится на теории
множеств (понимаемой ныне как система аксиоматических теорий, различающихся некоторыми
деталями). Поэтому если задаваться целью излагать какую-то часть математики (в нашем случае,
Анализ) без пробелов, начинать нужно все-таки с теории множеств.
В этой главе мы опишем одну из аксиоматических теорий множеств, теорию Морса-Келли, и
при этом постараемся сделать это описание максимально формализованным, чтобы дать читателю
представление об игре с символами, о которой мы говорили в Предисловии на с.v.
2
§ 1. Наивная теория множеств 3
⋄ 0.1.4. В следующих формулах X является сво- Чтобы строить теорию, нужны исходные поло-
бодной переменной: жения (называемые аксиомами), из которых за-
тем будут выводиться более сложные утвержде-
X = X, ния (называемые теоремами). В наивной теории
множеств аксиомами удобно считать следующие
X ∈ X, семь высказываний (точнее сказать, классифи-
∃Y X ∈ Y. кационный список высказываний).
Первые три аксиомы называют обычно акси-
А в следующих, наоборот, X – связанная пере- омами равенства:
менная:
∀X X = X, NST-1 Аксиома рефлексивности:
∃X X ∈ X, X = X. (0.1.5)
∀X ∃Y X ∈ Y. Это надо понимать так, что равенство X = X
считается верным для всех множеств X.
• Подстановкой переменной Y вместо перемен-
ной X в формулу ϕ называется формула, по- NST-2 Аксиома симметричности:
лучающаяся из ϕ заменой X на Y во всех сво-
бодных вхождениях переменной X в формуле X = Y ⇒ Y = X. (0.1.6)
ϕ. Мы обозначаем такую формулу символом На человеческом языке это означает, что равен-
ство X = Y формально не отличается от равен-
ϕ (0.1.4) ства Y = X.
X=Y
NST-3 Аксиома транзитивности:
• Подстановка ϕ называется корректной,
X=Y (X = Y & Y = Z) ⇒ X = Z. (0.1.7)
если при замене X на Y вторая переменная
не попадает в область действия квантора по То есть равенства X = Y и Y = Z влекут за
этой переменной. собой равенство X = Z.
Следующая аксиома устанавливает связь
⋄ 0.1.5. Подстановка Y вместо X в формулу
между равенством и отношением принадлежно-
X =Y сти:
NST-4 Аксиома инвариантности:
дает формулу
Y =Y (X = A & Y = B & X ∈ Y ) ⇒ A ∈ B
(0.1.8)
⋄ 0.1.6. Подстановка Y вместо X в формулу
Иными словами, в отношение X ∈ Y можно под-
A=B ставлять множества, равные X и Y , и при этом
будут получаться следсвия.
дает ту же формулу Три последние аксиомы описывают собствен-
но отношение принадлежности:
A=B
NST-5 Аксиома невырожденности:
⋄ 0.1.7. Подстановка Y вместо X в формулу
∃X ∃Y X ∈ Y. (0.1.9)
∃Y X ∈ Y
То есть существуют множества X и Y такие, что
дает формулу X ∈Y.
∃Y Y ∈ Y, NST-6 Аксиома объемности:
однако такая подстановка некорректна, потому X = Y ⇐⇒ ∀A (A ∈ X ⇐⇒ A ∈ Y )
что после замены Y попадает в область действия (0.1.10)
квантора ∃ по Y .
То есть два множества X и Y совпадают, если и
только если они «имеют одинаковый набор эле-
(b) Аксиомы, теоремы и антино-
ментов».
мии.
NST-7 Аксиома безусловного выделе-
Аксиомы наивной теории множеств. Если ния: пусть ϕ – формула теории мно-
не предполагать ничего о свойствах отношений жеств с единственной свободной пере-
= и ∈, которым удовлетворяют или не удовле- менной X, тогда
творяют различные множества, то и сказать о
множествах ничего внятного будет невозможно. ∃Y (X ∈ Y ⇐⇒ ϕ) (0.1.11)
§ 1. Наивная теория множеств 5
A∈B
– и в этом случае, как и в NST, говорят, что “A принадлежит B”, или что “A является элементом
B”, или что “B содержит A в качестве элемента”.
Формулы теории множеств. Формулы теории MK определяются так же как в теории NST, с
той разницей, что алфавит удобно расширить, включив строчные буквы латинского алфавита и еще
возможность добавлять к букве штрих. То есть, повторим с уточнениями, на интуитивном уровне,
формула в MK – это утверждение или, другой термин, высказывание о классах5 , которое можно
получить инструментами теории, то есть с помощью отношения принадлежности ∈, к которому
еще добавляется отношение равенства =, а также с помощью (некоторых) логических операций
и кванторов, список которых был приведен в таблице на с.3: ¬, &, ∨, ⇒, ∀, ∃ (символ ⇔ будет
определен позже формулой (0.2.24)). При этом, информация во втором столбце этой таблицы (о
смысле этих символов) приводится пока только для интуитивного понимания существа дела, и для
нашей ближайшей цели – описать понятие формулы в теории множеств – нам не нужна. Точный
смысл этих значков мы объясним на с.10.
Определение понятию формулы выглядит так:
• Переменной в теории множеств мы будем считать произвольную букву латинского ал-
фавита, прописную
A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z,
или строчную,
a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,
либо такую же букву с добавленным (возможно, несколько раз) штрихом, то есть если α
– переменная, то α′ – тоже переменная, например
X =Y (0.2.21)
является формулой,
2) если X и Y – переменные, то запись
X∈Y (0.2.22)
является формулой,
3) если строка ϕ – формула, то строка ¬ (ϕ) – тоже формула;
4) если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:
X 6= Y (0.2.25)
¬(X = Y ),
а
X∈
/Y (0.2.26)
– эквивалентная запись отношения
¬(X ∈ Y ).
• Подстановкой переменной Y вместо переменной X в формулу ϕ называется формула,
получающаяся из ϕ заменой X на Y во всех свободных вхождениях переменной X в
формуле ϕ. Мы обозначаем такую формулу символом
ϕ (0.2.27)
X=Y
Секвенции. Формулы в языке связаны между собой тем, что одни следуют из других. Если нас
интересует вопрос, следует ли формула χ из формулы ϕ, то это принято записывать строчкой
ϕ ⊢ χ,
и называется такая запись секвенцией. В секвенции может быть несколько формул слева и справа
от знака секвенции ⊢, тогда эти формулы должны быть разделены запятыми, и при этом запятая
слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как сокращение
символа ∨.7 То есть, например, секвенция
ϕ, χ ⊢ ψ, ω
означает, что мы хотим понять, следует ли формула ψ ∨ ω из формулы ϕ &χ, и поэтому она экви-
валентна секвенции
ϕ &χ ⊢ ψ ∨ ω. (0.2.28)
Точно так же секвенция
α, β, γ ⊢ δ, η, θ, ι
эквивалентна секвенции
α &β &γ ⊢ δ ∨ η ∨ θ ∨ ι.
В секвенции формулы могут повторяться, например, так:
ϕ, ϕ ⊢ χ,
или так
ϕ, ⊢ χ, χ, χ
6 См. сравнение на с.25.
7 Это правило, — “запятая слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как
сокращение символа ∨”, — формально не присутствует в правилах исчисления LK, оно выводится потом. В нашем
тексте оно доказывается ниже в теоремах 0.2.1 и 0.2.2.
10 Глава 0. ТЕОРИЯ МНОЖЕСТВ
(повторение может быть сколь угодно длинным, но конечным, потому что формул в секвенции
всегда конечный набор).
Заглавные греческие буквы, например, Γ , ∆, обозначают конечные наборы формул (возможно,
повторяющиеся), связанные запятыми. В частности, запись
Γ ⊢∆
означает секвенцию, в которой под Γ и ∆ понимаются такие конечные наборы формул. Точно так
же запись
A, B ⊢ Γ, ∆
означает секвенцию, в которой A, B, Γ , ∆ тоже такие наобры формул, причем там, где кончается
A и начинается B тоже стоит запятая (и то же самое для Γ и ∆).
В секвенции
Γ ⊢∆
набор формул Γ (слева от знака ⊢) называется антецедентом (или посылкой), а набор формул ∆
(справа от знака ⊢) – сукцедентом (или следствием). Не всегда ∆ следует из Γ , но в тех случаях,
когда удается построить так называемый вывод для секвенции Γ ⊢ ∆ (что это такое мы объясним
на с.12), говорят, что эта секвеция выводима (а ∆ действительно следует из Γ ).
Наборы Γ или ∆ могут быть пустыми: секвенция
⊢ ∆,
если она выводима, означает, что дизъюнкция формул ∆ следует из пустого набора формул (это
можно понимать так, что ∆ следует из чего угодно)8 , а секвенция
Γ ⊢
– что из конъюнкции формул Γ следует все что угодно9 . Секвенция, пустая с обеих сторон
⊢,
если она выводима, означает, что в этом языке из любого набора формул Γ следует любой набор
формул ∆ (это понимается так, что рассматриваемый язык противоречив).
LK-0: ϕ ⊢ ϕ. (0.2.29)
допускается наличие функциональных символов (которых нет в языке теории множеств, из-за чего тот проще). Для
языков с функциональными символами нижеприводимые правила вывода LK-12 и LK-15 усложняются тем, что вместо
переменной y в них позволено подставлять произвольный терм (понятие терма будет определено на с.80).
§ 2. Логика предикатов для теории множеств 11
a. Структурные правила:
— ослабление:
Γ ⊢∆ Γ ⊢∆
LK-1: (0.2.30)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
LK-2: (0.2.31)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
ϕ, χ, ψ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, χ, ψ
LK-3: (0.2.32)
ϕ, ψ, χ, Γ ⊢ ∆ Γ ⊢ ∆, χ, ϕ, ψ
— сечение:
Γ ⊢ ∆, ϕ ϕ, Π ⊢ Λ
LK-4: (0.2.33)
Γ, Π ⊢ ∆, Λ
b. Логические правила:
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
LK-5: (0.2.34)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— конъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
LK-6: (0.2.35)
Γ ⊢ ∆, ϕ&χ
— конъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
LK-7: (0.2.36)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
LK-8: (0.2.37)
ϕ ∨ χ, Γ ⊢ ∆
— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
LK-9: (0.2.38)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
LK-10: (0.2.39)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
LK-11: (0.2.40)
Γ ⊢ ∆, ϕ ⇒ χ
— добавление квантора всеобщности в антецедент: если подстановка ϕ x=y
корректна11 , то
ϕ x=y
,Γ ⊢ ∆
LK-12: (0.2.41)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y не
входит (как свободная переменная) в нижнюю секвенцию (то есть в
наборы формул Γ , ∆, ∀x ϕ), то
Γ ⊢ ∆, ϕ x=y
LK-13: (0.2.42)
Γ ⊢ ∆, ∀x ϕ
11 Определение корректной подстановки дано на с. 8.
12 Глава 0. ТЕОРИЯ МНОЖЕСТВ
ϕ x=y
,Γ ⊢ ∆
LK-14: (0.2.43)
∃x ϕ, Γ ⊢ ∆
Γ ⊢ ∆, ϕ x=y
LK-15: (0.2.44)
Γ ⊢ ∆, ∃x ϕ
χ ⊢ ψ, (0.2.45)
Γ ′ ⊢ ∆′
χ⊢ψ
или
Γ ′ ⊢ ∆′ Γ ′′ ⊢ ∆′′
χ⊢ψ
где Γ ′ , Γ ′′ и ∆′ и ∆′′ – некие новые наборы формул. После этого нужно попробовать достроить эту
картинку, проделав то же самое с новыми секвенциями Γ ′ ⊢ ∆′ и Γ ′′ ⊢ ∆′′ , и так далее. Картинка
которая у нас будет всякий раз получаться, например, что-нибудь в таком духе,
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
(0.2.46)
χ⊢ψ
— называется деревом Генцена. В нем секвенция в самом низу (здесь это χ ⊢ ψ) называется корнем,
а секвенции на самом верху (в данном случае Γ ′′′ ⊢ ∆′′′ и Γ ′′′′ ⊢ ∆′′′′ ) — вершинами.
Если (за конечное число шагов) нам удастся построить дерево Генцена, в котором на вершинах
стоят аксиомы исчисления LK, то есть секвенции вида LK-0,
ϕ ⊢ ϕ,
• Пусть
Γ ⊢ ∆, (0.2.47)
— произвольная секвенция (у которой антецедент и сукцедент состоят из произвольных
наборов формул).
1) Деревом Генцена для секвенции (0.2.47) называется произвольная запись вида
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
(0.2.48)
Γ ⊢∆
в которой в самом низу записана секвенция (0.2.47), и каждый переход снизу
вверх представляет собой применение одного из правил LK-0 — LK-15,
2) Если у какого-то дерева Генцена (0.2.48) на всех вершинах стоят аксиомы ис-
числения LK, то есть секвенции вида LK-0,
ϕ ⊢ ϕ,
α ⊢ ¬α. (0.2.55)
⋄ 0.2.8. Для секвенции
Самое простое дерево Генцена, которое для нее
можно построить, выглядит так:
α ⇒ β ⊢ ¬β ⇒ ¬α (0.2.53) α, α ⊢
(0.2.34)
α ⊢ ¬α.
вывод может быть таким:
В нем секвенция на вершине,
α⊢α α, α ⊢
(0.2.30) – не аксиома, поэтому это дерево не будет выво-
¬β, α ⊢ α ¬β ⊢ ¬β дом.
(0.2.32) (0.2.30) Однако формально это не означает, что се-
α, ¬β ⊢ α ¬β ⊢ ¬β, ¬α квенция (0.2.55) невыводима в LK, потому что
(0.2.34) (0.2.32) для нее можно строить разные другие деревья,
¬β ⊢ α, ¬α ¬β ⊢ ¬α, ¬β например, такое:
(0.2.32) (0.2.34)
¬β ⊢ ¬α, α β, ¬β ⊢ ¬α α, α, α ⊢
(0.2.39) (0.2.31)
α ⇒ β, ¬β ⊢ ¬α α, α ⊢
(0.2.32) (0.2.34)
¬β, α ⇒ β ⊢ ¬α α ⊢ ¬α.
(0.2.40)
Или такое:
α ⇒ β ⊢ ¬β ⇒ ¬α
α⊢β β ⊢ ¬α
(0.2.33)
α ⊢ ¬α.
⋄ 0.2.9. Для секвенции
(где вместо β можно вставлять разные другие
формулы). Эти деревья также не будут вывода-
α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ) (0.2.54) ми (потому что на их вершинах снова стоят не
13 Атомарные формулы в теории множеств были определены на с.8.
§ 2. Логика предикатов для теории множеств 15
аксиомы), но, поскольку таких деревьев можно – и оно опять не будет выводом, потому что се-
получить бесконечно много, перебрать все вари- квенция на вершине
анты без специально разработанных для этого
технических средств не получится. α⊢α x=y
,α x=z
Забегая вперед, скажем, что для атомарных – не аксиома.
формул13 α секвенция (0.2.55) невыводима. Од- Как и в примере 0.2.10, мы здесь ограничим-
нако доказать это мы сможем только в конце это- ся заявлением, что для атомарных формул α со
го параграфа (см. ниже пример 0.2.38). свободной переменной x секвенция (0.2.61) невы-
⋄ 0.2.11. Для секвенции водима, но почему это так, мы покажем только
в конце этого параграфа (в примере 0.2.39).
∀x α ⊢ α (0.2.56) ⋄ 0.2.13. Для секвенции
вывод такой:
Как и в примере (0.2.10), здесь секвенция, стоя-
щая на вершине α⊢α
(0.2.44)
α⊢α x=y α ⊢ ∃x α
(0.2.41)
— не аксиома. Поэтому такое дерево не будет вы- ∀x α ⊢ ∃x α
водом для (0.2.57).
Но опять, как и в примере (0.2.10), из это- ⋄ 0.2.16. Для противоположной секвенции
го формально не следует, что секвенция (0.2.57)
невыводима, потому что дерево вывода для нее ∃x α ⊢ ∀x α (0.2.61)
можно строить по-разному, и таких вариантов вывод построить не удается. Для построения де-
имеется бесконечно много из-за неоднозначно- рева Генцена выберем какие-нибудь две перемен-
сти при движении вверх в правилах сокращения ные, отличные от x и не входящие в формулу α.
(0.2.31) и сечения (0.2.33). Скажем, если приме- Пусть такими переменными будут a и b. Тогда
нить правило сокращения LK-2 в самом начале дерево Генцена может быть таким:
(и выбрать больше переменных, отличных от x
и не входящих в α, например, пусть такими пере- α x=a
⊢α x=b
менными будут y и z), то можно получить дерево (0.2.42)
α x=a
⊢ ∀x α
α⊢α x=y
,α x=z (0.2.43)
(0.2.42) ∃x α ⊢ ∀x α
α⊢α x=y
, ∀x α
(0.2.32)
Как и в примере (0.2.10), здесь секвенция, стоя-
α ⊢ ∀x α, α щая на вершине
x=y
(0.2.42) α x=a
⊢α x=b
α ⊢ ∀x α, ∀x α
(0.2.31) — не аксиома. Поэтому такое дерево не будет вы-
α ⊢ ∀x α водом для (0.2.61).
16 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Но опять, как и в примере (0.2.10), из это- Пусть опять это будут a и b. Тогда вывод может
го формально не следует, что секвенция (0.2.61) быть таким:
невыводима, потому что дерево вывода для нее α|x=a,y=b ⊢ α|x=a,y=b
можно строить по-разному, и таких вариантов (0.2.44)
имеется бесконечно много из-за неоднозначно- α|x=a,y=b ⊢ ∃x α|y=b
сти при движении вверх в правилах сокращения (0.2.44)
(0.2.31) и сечения (0.2.33). Скажем, если приме- α|x=a,y=b ⊢ ∃y ∃x α
нить правило сокращения LK-2 в самом начале (и (0.2.43)
выбрать больше переменных, отличных от x и не ∃y α|x=a ⊢ ∃y ∃x α
входящих в α, например, пусть такими перемен- (0.2.43)
ными будут a, b, c), то можно получить дерево ∃x ∃y α ⊢ ∃y ∃x α
α x=a
,α x=b
⊢α x=c
⋄ 0.2.19. Тот же прием позволяет доказать вы-
(0.2.42) водимость секвенции
α x=a
,α x=b
⊢ ∀x α ∃x ∀y α ⊢ ∀y ∃x α, (0.2.64)
(0.2.43)
∃x α, α ⊢ ∀x α Пусть опять a и b – переменные, отличные от x
x=b
(0.2.32) и y, и не входящие в формулу α. Тогда вывод
α , ∃x α ⊢ ∀x α может быть таким:
x=b
(0.2.43) α|x=a,y=b ⊢ α|x=a,y=b
∃x α, ∃x α ⊢ ∀x α (0.2.44)
(0.2.31) α|x=a,y=b ⊢ ∃x α|y=b
∃x α ⊢ ∀x α (0.2.41)
∀y α|x=a ⊢ ∃x α|y=b
– и оно опять не будет выводом, потому что се- (0.2.42)
квенция на вершине ∀y α|x=a ⊢ ∀y ∃x α
(0.2.43)
α ,α ⊢α
x=a x=b x=c ∃x ∀y α ⊢ ∀y ∃x α
– не аксиома. ⋄ 0.2.20. Для секвенции, противоположной
Как и в примере 0.2.10, мы здесь ограничим- (0.2.64),
ся заявлением, что для атомарных формул α со ∀x ∃y α ⊢ ∃y ∀x α, (0.2.65)
свободной переменной x секвенция (0.2.61) невы-
вывод построить не получается. В качестве при-
водима, но почему это так мы покажем только в
мера дерево Генцена можно построить так. Вы-
конце этого параграфа (в примере 0.2.41).
берем четыре переменных, отличных от x и y, и
⋄ 0.2.17. Чтобы доказать выводимость секвен- не входящих в формулу α. Пусть это будут a, b,
ции c, d. Тогда дерево Генцена может быть таким:
∀x ∀y α ⊢ ∀y ∀x α (0.2.62) α|x=a,y=c ⊢ α|x=d,y=b
нужно выбрать какие-нибудь две переменные, (0.2.42)
ϕ ⊢ χ,
ϕ ⇒ χ.
ϕ⊢χ
(0.2.40)
⊢ ϕ ⇒ χ.
Это дерево Генцена надо понимать так, что если у его вершины — секвенции ϕ ⊢ χ — есть вывод,
то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом для
секвенции ⊢ ϕ ⇒ χ, а это и означает выводимость формулы ϕ ⇒ χ.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.49):
ϕ, ϕ ⇒ χ ⊢ χ
(0.2.32)
⊢ϕ⇒χ ϕ ⇒ χ, ϕ ⊢ χ
(0.2.33)
ϕ⊢χ
20 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Опять это дерево надо понимать так, что если у его левой вершины — секвенции ⊢ ϕ ⇒ χ —
есть вывод (что эквивалентно выводимости формулы ϕ ⇒ χ), то его можно пристроить к этой
вершине сверху, затем к правой вершине — секвенции ϕ, ϕ ⇒ χ ⊢ χ — нужно будет присторить ее
вывод, который мы получили на с.13, и мы в результате получим дерево, являющееся выводом для
секвенции ϕ ⊢ χ.
⋄ 0.2.35. Для любых двух формул α и β из фор- Здесь видно, что если выводима формула α&β,
мулы α&β выводятся и α, и β. то есть секвенция ⊢ α&β, то ее вывод можно при-
Рассмотрим дерево клеить к левой вершине этого дерева, и мы по-
α⊢α лучим вывод для секвенции ⊢ α. Для формулы
(0.2.36)
β нужно построить похожее дерево.
⊢ α&β α&β ⊢ α
(0.2.33)
⊢α
⊢α
(0.2.42) (0.2.80)
⊢ ∀x α
∀x α ⊢ α (0.2.82)
Если этот вывод из примера 0.2.11 приклеить к правой вершине дерева (0.2.81), то мы получим
дерево вида (0.2.79), означающее, что формула α выводится из формулы ∀x α.
Следующая лемма представляет собой аналог теоремы 0.2.1 для отношения выводимости фор-
мул:
Лемма 0.2.5. Пусть Σ — конечный набор формул в LK и σ — конъюнкция этих формул. Тогда
для формулы ω следующие условия эквивалентны:
(i) ω выводится из Σ в LK,
(ii) ω выводится из σ в LK.
Доказательство. Пусть для начала Σ состоит из двух формул: α и β. Тогда σ есть просто конъ-
юнкция α&β.
1. Рассмотрим дерево
⊢α ⊢β
(0.2.35)
⊢ α&β
⊢ω
Если ω выводима из σ то есть из α&β, то, поскольку α&β выводима из α и β, то есть из Σ, мы
получаем, что ω выводима из Σ.
2. Для доказательства обратного рассмотрим дерево
⊢ α&β ⊢ α&β
⊢α ⊢β
(0.2.35)
⊢ω
В нем верхние две ветви мы можем считать деревьями Генцена в силу примера 0.2.35. Поэтому если
последний переход — тоже дерево Генцена, то есть если ω выводится из α и β (или, иными словами,
из Σ), то ω должна выводиться и из α&β, то есть из σ.
Общий случай (с произвольным числом формул в Σ) рассматривается аналогично.
Теорема 0.2.6 (о дедукции для LK). Пусть ω – формула и Σ — конечный набор формул в LK.
Рассмотрим два условия:
(a) ω следует из Σ в LK,
(b) ω выводится из Σ в LK.
§ 2. Логика предикатов для теории множеств 23
Тогда:
(i) условие (a) влечет условие (b),
(ii) если формулы Σ замкнуты, то условие (b) влечет условие (a) (то есть в этом случае
(a) и (b) равносильны).
Доказательство. Пусть σ — конъюнкция формул из Σ. По лемме 0.2.5 выводимость из Σ эквива-
лентна выводимости из σ, поэтому всюду мы можем заменить Σ на σ.
1. Рассмотрим дерево
⊢σ σ⊢ω
(0.2.33) (0.2.83)
⊢ω
Если ω следует из σ, то есть выводима секвенция σ ⊢ ω, то ее вывод можно подклеить к правой
вершине этого дерева, и тогда если вдобавок выводима секвенция ⊢ σ, то, подклеив ее вывод к
левой вершине, мы получим вывод для секвенции ⊢ ω. Это доказывает, что из (a) следует (b).
2. Предположим теперь, что формулы Σ замкнуты. Тогда их конъюнкция σ тоже замкнута.
Покажем, что в этом случае из (b) следует (a). Если выполнется (b), то есть ω выводится из σ, то
это означает, что существует некое дерево Генцена,
α⊢α ⊢σ
... ...
⊢ω
у которого в корне записана секвенция ⊢ ω, а на вершинах стоят либо секвенции вида α ⊢ α,
либо секвенция ⊢ σ. Впишем в каждый антецедент этого дерева формулу σ как дополнительную
формулу:
σ,α⊢α σ⊢σ
... ...
(0.2.84)
σ⊢ω
и покажем, что полученная картинка может быть дополнена до дерева Генцена с теми же вершинами
и корнем.
Для этого нужно проверить, что если в правилах LK-1 — LK-15 всюду в антецеденты вписать
формулу σ, то все они дополняются до деревьев Генцена с теми же вершинами и корнем. Для правил
LK-1 — LK-12, LK-15 это верно без требования, чтобы формула σ была замкнутой: если, например,
в левое правило LK-1 вписать таким образом σ, то мы получим картинку
σ, Γ ⊢ ∆
, (0.2.85)
σ, ϕ, Γ ⊢ ∆
которую можно дополнить до картинки
σ, Γ ⊢ ∆
(0.2.30)
ϕ, σ, Γ ⊢ ∆,
(0.2.32)
σ, ϕ, Γ ⊢ ∆,
а она будет деревом Генцена с теми же, что у (0.2.85) вершиной и корнем. Точно так же, например,
если в правиле LK-12 вписать в антецедент формулы σ,
σ, ϕ x=y
,Γ ⊢ ∆
, (0.2.86)
σ, ∀x ϕ, Γ ⊢ ∆
то эту картинку можно дополнить до картинки
σ, ϕ x=y
,Γ ⊢ ∆
(0.2.32)
ϕ x=y
, σ, Γ ⊢ ∆,
(0.2.41)
∀x ϕ, σ, Γ ⊢ ∆,
(0.2.32)
σ, ∀x ϕ, Γ ⊢ ∆,
а она будет деревом Генцена с теми же, что у (0.2.86) вершиной и корнем.
24 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Так будет со всеми правилами LK-1 — LK-12, LK-15, но когда мы дойдем до правил LK-13 и LK-14
нам понадобится все-таки требование, что все формулы σ — замкнутые. Например, если дополнить
правило LK-13
Γ ⊢ ∆, ϕ x=y
(0.2.87)
Γ ⊢ ∆, ∀x ϕ
как раньше, в антецедентах, формулой σ, то полученную картинку
σ, Γ ⊢ ∆, ϕ x=y
(0.2.88)
σ, Γ ⊢ ∆, ∀x ϕ
можно будет считать частным случаем правила LK-13 только если выполнено ограничение на пере-
менную y в этом правиле: нужно, чтобы y не входил как свободная переменная в нижнюю секвен-
цию. Это условие будет выполнено, потому что в (0.2.87) y не входил как свободная переменная в
нижнюю секвенцию, а в σ он не входит, потому что σ — замкнутая формула.
И то же самое с правилом LK-14. Это доказывает, что картинку (0.2.84) можно дополнить до
дерева Генцена с теми же вершинами и корнем. Теперь заметим, что там, где на вершинах стоят
секвенции σ, α ⊢ α, их можно продолжить вверх по правилу LK-1,
Γ ⊢∆
σ, Γ ⊢ ∆
и мы получим дерево Генцена
α⊢α
σ,α⊢α σ⊢σ
... ...
,
σ⊢ω
у которого все вершины — аксиомы теории LK-1, а корень — секвенция σ ⊢ ω. Иными словами, это
вывод секвенции σ ⊢ ω.
CQC − 1 : ϕ ⇒ (χ ⇒ ϕ) (0.2.89)
CQC − 2 : (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (0.2.90)
CQC − 3 : (ϕ & χ) ⇒ ϕ (0.2.91)
CQC − 4 : (ϕ & χ) ⇒ χ (0.2.92)
CQC − 5 : ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (0.2.93)
CQC − 6 : ϕ ⇒ (ϕ ∨ χ) (0.2.94)
CQC − 7 : χ ⇒ (ϕ ∨ χ) (0.2.95)
CQC − 8 : (ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (0.2.96)
CQC − 9 : (¬ϕ) ⇒ (ϕ ⇒ χ) (0.2.97)
CQC − 10 : (ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (0.2.98)
CQC − 11 : ϕ ∨ (¬ϕ) (0.2.99)
16 Читательможет обратить внимание, что выводимость формул CQC-1—CQC-10 в LK предлагалась в качестве
упражнения в задачах 0.2.32, а CQC-11 была выведена в LK в (0.2.72).
§ 2. Логика предикатов для теории множеств 25
Вывод в CQC обычно выглядит не так нагляд- становки (чтобы зритель понимал, как из дан-
но, как в LK, потому что его принято представ- ной аксиомы получилась нужная нам формула).
лять не деревом, а линией (или, правильнее ска- Главное же неудобство здесь в том, что вообще
зать, деревом с одной веткой). Мы нарушим эту сообразить, как строить вывод в CQC существен-
традицию и покажем, как будет выглядеть эта но труднее, чем в LK.
картина, если ее перевести на язык деревьев Ген-
цена (с очевидной поправкой, что при переводе ⊲ 0.2.36. Покажите, что следующая секвенция
символ ⊢ должен исчезнуть). Как может заме- выводима в CQC:17
тить читатель, в CQC, из-за громоздкости акси-
α⇒α (0.2.106)
ом, деревья вывода получаются более сложны-
ми, чем в LK (по этой причине мы выносим их в ⊲ 0.2.37. Докажите выводимость в CQC секвен-
подстрочные примечания). Кроме того, при дви- ции18
жении от аксиом вниз приходится уточнять под- (α ⇒ β) ⇒ (α ⇒ α) (0.2.107)
Здесь на вершинах ветвей находятся аксиомы PC-1 и PC-2, и при движении вниз входящие в них формулы заменяются
на формулы α или α ⇒ α, там указано как.
18 Для секвенции (0.2.107) выводом может быть дерево
Исчисление Кетонена G3c. Еще одна аксиоматизация логики предикатов, так называемое ис-
числение G3c финского математика Оива Кетонена, была придумана как модификация генценов-
ской системы LK. Мы приведем здесь ее вариант19 для языка теории множеств (или любого языка
без функциональных символов). В языке этой системы добавляются два символа: символ ⊥, означа-
ющий “абстрактную ложь”, и символ ⊤, означающий “абстрактную истину”. Кроме того, отрицание
¬α понимается как сокращение для формулы α ⇒ ⊥. Еще один важный момент — что наборы
формул в секвенциях здесь понимаются не как строки, а как “мультимножества”. Это означает, что
в наборе формул можно как угодно переставлять формулы (отделенные друг от друга запятыми), и
при этом считается, что набор не меняется. Отсюда, в частноти, следует, что генценовские правила
перестановки (0.2.32) в этой системе лишние.
• Аксиомами исчисления G3c считаются следующие три вида секвенций:
Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (0.2.108)
• Правила вывода для исчисления G3c делятся на три группы. В первой группе перечисля-
ются бескванторные правила:
Γ, ϕ, χ ⊢ ∆ Γ ⊢ ϕ, ∆ Γ ⊢ χ, ∆
(0.2.109)
Γ, ϕ & χ ⊢ ∆ Γ ⊢ ϕ & χ, ∆
Γ, ϕ ⊢ ∆ Γ, χ ⊢ ∆ Γ ⊢ ϕ, χ, ∆
(0.2.110)
Γ, ϕ ∨ χ ⊢ ∆ Γ ⊢ ϕ ∨ χ, ∆
Γ ⊢ ϕ, ∆ Γ, χ ⊢ ∆ Γ, ϕ ⊢ χ, ∆
(0.2.111)
Γ, ϕ ⇒ χ ⊢ ∆ Γ ⊢ ϕ ⇒ χ, ∆
Γ, ∀x ϕ, ϕ ⊢∆ Γ ⊢ϕ , ∃x ϕ, ∆
x=y x=y
(0.2.112)
Γ, ∀x ϕ ⊢ ∆ Γ ⊢ ∃x ϕ, ∆
И в третьей – правила с кванторами, в которых на одну из переменных, y, накладывается
требование, что она не должна входить в формулы из Γ и ∆, а подстановка ϕ должна
x=y
быть корректной:
Γ, ϕ ⊢∆ Γ ⊢ϕ ,∆
x=y x=y
(0.2.113)
Γ, ∃x ϕ ⊢ ∆ Γ ⊢ ∀x ϕ, ∆
ются уточнением, что под y следует понимать произвольный терм (понятие терма будет определено на с.80).
21 В теории множеств это формулы вида x = y и x ∈ y, мы об этом говорили на с.8.
§ 2. Логика предикатов для теории множеств 27
⋄ 0.2.40. Пусть снова α — атомарная форму- (где z не входит в формулу ∃x α). В обоих слу-
ла23 со свободной переменной x. Покажем, что чаях движение вверх может быть опять только с
секвенция, рассматривавшаяся нами в примере использованием правил (0.2.111). В первом слу-
0.2.14, чае дерево может получиться только таким
∃x α ⊢ α (0.2.117)
α ⊢α
невыводима. Выберем какую-нибудь перемен- x=y x=z
ную, не входящую в формулу α, пусть это бу- (0.2.113)
• Дерево Генцена считается выводом в MK, если каждая его вершина является
— либо аксиомой исчисления секвенций LK, то есть секвенцией вида α ⊢ α,
— либо секвенцией вида ⊢ σ, где σ — какая-нибудь аксиома теории MK.
Понятно, что поскольку деревьев Генцена, признаваемых выводами, в MK больше, чем в LK, класс
выводимых секвенций26 в MK шире, чем в LK. То же самое происходит и с отношением следования
между формулами (которое в MK слабее, чем в LK27 ), и с классом теорем (которых в MK больше,
чем в LK28 ):
1) если секвенция Γ ⊢ ∆ выводима в теории LK, то она выводима и в теории MK, не не
наоборот,
2) если формула χ следует из формулы ϕ в теории LK, то это верно и в теории MK, не не
наоборот,
3) если формула α является теоремой теории LK, то она является теоремой и в теории
MK, не не наоборот.
Аксиомы равенства.
MK-1 Аксиома рефлексивности равенства:
X =X (0.3.122)
X=Y ⇒Y =X (0.3.123)
(X = Y & Y = Z) ⇒ X = Z (0.3.124)
Аксиома невырожденности.
26 Понятие выводимой секвенции в LK для языка теории множеств было определено на с.13.
27 Отношение следования между формулами в LK для языка теории множеств было определено на с.13.
28 Понятие теоремы (выводимой формулы) в LK для языка теории множеств было определено на с.19.
30 Глава 0. ТЕОРИЯ МНОЖЕСТВ
∃X ∃Y X ∈ Y. (0.3.126)
X = Y ⇐⇒ ∀A (A ∈ X ⇐⇒ A ∈ Y ) (0.3.127)
(два класса X и Y совпадают, если и только если они «имеют одинаковый набор эле-
ментов»).
! 0.3.1. В одну сторону это утверждение следует из аксиомы инвариантности MK-4: если X = Y ,
то условие A ∈ X ⇔ A ∈ Y выполняется автоматически. Поэтому содержательный смысл MK-6
состоит в импликации в левую сторону:
X = Y ⇐= ∀A (A ∈ X ⇐⇒ A ∈ Y ) (0.3.128)
Аксиома выделения. Из аксиомы объемности MK-6 следует, что для описания объекта теории
множеств (класса) достаточно (и необходимо) описать входящие в него элементы. Это используется
в следующей аксиоме, формализующей способ построения новых классов из уже имеющихся.
MK-7 Аксиома выделения: пусть ϕ – формула теории множеств с единственной свободной
переменной X, не содержащая переменные Y и Z, тогда
ϕ.
{X : ϕ}
T ∈ {X : ϕ} ⇐⇒ ϕ
X=T
Считается, что первое из этих требований, (0.3.130), автоматически добавляется к каждой фор-
муле ϕ такого вида, когда описывается определяемый ею класс. Поскольку строить новые классы
в этой науке приходится постоянно, удобно ввести некий термин, обозначающий объекты X со
свойством (0.3.130). Таким термином является слово “множество”:
• Класс X называется множеством, если существует класс Y , содержащий X в качестве
элемента:
∃Y X ∈ Y.
Если же такого Y не существует, то класс X называется собственным классом.
29 Аксиома MK-5 в действительности не очень важна, потому что избыточна: она является формальным следствием
аксиомы бесконечности MK-13 на с.63. Нам она нужна для методических целей: она дает возможность доказывать
результаты, важные для понимания предмета, раньше, чем это было бы возможным без нее.
§ 3. Теория множеств Морса-Келли 31
⋄ 0.3.2. Пустой класс ∅. Следующее равенство MK-1 это верно для любого X, класс Set содер-
определяет так называемый пустой класс: жит все на свете множества (и только их).
∅ := {X : X 6= X}. (0.3.131)
Как и в наивной теории множеств, в теории
(символ := здесь означает, что это соотношение Морса-Келли
следует понимать как определение, то есть как
декларацию, согласно которой символ слева от ! 0.3.4. Классы ∅ и Set не совпадают:
:= будет использоваться в тексте всюду для обо-
значения объекта, лежащего справа от этого зна- ∅ 6= Set (0.3.133)
ка).
В соответствии с аксиомой выделения, рас- Доказательство. Здесь почти слово в слово по-
шифровывается эта запись так: элементами вторяются рассуждения примера 0.1.10. По ак-
класса ∅ считаются те и только те множества сиоме объемности MK-6, чтобы доказать нера-
X, которые не равны самому себе. Поскольку по венство ∅ 6= Set, достаточно подобрать какой-
аксиоме MK-1 таких X не бывает (высказывание нибудь класс X такой, чтобы
X = X считается верным всегда), класс ∅ во-
обще не содержит никаких элементов (отчего и / ∅ & X ∈ Set .
X∈
называется пустым).
⋄ 0.3.3. Класс Set всех множеств. Следую- Для этого воспользуемся аксиомой MK-5 и рас-
щее равенство определяет так называемый класс смотрим какие-нибудь два класса X и Y такие,
всех множеств: что
Set := {X : X = X}. (0.3.132) X ∈ Y.
Это расшифровывается так: элементами класса Понятно, что X является множеством, поэтому
/ ∅ (потому что
Set считаются те и только те множества X, ко- X ∈ Set. С другой стороны, X ∈
торые равны самому себе. Поскольку по аксиоме Z ∈ ∅ невозможно ни для какого Z).
• Полезно также ввести отношение строгого включения: говорят, что класс X строго со-
держится в классе Y , или что X является строгим подклассом класса Y , и изображают
это записью
X⊂Y
или записью
Y ⊃ X,
если
X ⊆ Y & X 6= Y.
Отрицание отношения ⊂ записывается символом ⊂
6 :
X⊂
6 Y ⇐⇒ ¬(X ⊂ Y ).
Экспонента 2X .
• Экспонентой произвольного класса X называется класс
2X = {Z : Z ⊆ X} (0.3.144)
⋄ 0.3.7. Экспонента класса всех множеств сов- быть множеством: Y ∈ Set. Мы получаем вклю-
падает с классом всех множеств: чение 2Set ⊆ Set. Наоборот, если Y ∈ Set, то,
поскольку Y является классом, в силу (0.3.135)
2Set = Set (0.3.145) мы получаем, что Y ⊆ Set. Таким образом, одно-
временно Y ∈ Set и Y ⊆ Set, и значит, Y ∈ 2Set .
Set
Доказательство. Если Y ∈ 2 = {Z : Z ⊆ Это доказывает включение Set ⊆ 2Set . Применяя
Set}, то по аксиоме выделения MK-7′ , Y должно (0.3.137), мы получаем 2Set = Set.
Z ⊆X ⇔ Z ∈ 2X (0.3.146)
X ∩ Y = {Z : Z ∈ X & Z ∈ Y } (0.3.147)
X ∪ Y = {Z : Z ∈ X ∨ Z ∈ Y } (0.3.148)
∅ ∩ X = ∅, ∅ ∪ X = X. (0.3.149)
X ∩ Y ⊆ X ⊆ X ∪ Y. (0.3.151)
X ∩ Y = Y ∩ X, X ∪ Y = Y ∪ X. (0.3.153)
(X ∩ Y ) ∩ Z = X ∩ (Y ∩ Z), (X ∪ Y ) ∪ Z = X ∪ (Y ∪ Z) (0.3.154)
(X ∩ Y ) ∪ Z = (X ∪ Z) ∩ (Y ∪ Z), (X ∪ Y ) ∩ Z = (X ∩ Z) ∪ (Y ∩ Z) (0.3.155)
∪X = {Z : ∃Y (Y ∈ X & Z ∈ Y )} (0.3.157)
∩X = {Z : ∀Y (Y ∈ X ⇒ Z ∈ Y )} (0.3.158)
X ∈Y =⇒ ∩Y ⊆ X ⊆ ∪Y. (0.3.162)
X 6= ∅ =⇒ ∩X ∈ Set . (0.3.164)
Дополнение и разность.
• Дополнением класса X называется класс
\X = {Y : Y ∈
/ X} (0.3.165)
Свойства дополнения:
1◦ Связь с пустым классом и классом всех множеств:
X ∩ \X = ∅, X ∪ \X = Set . (0.3.167)
\(\X) = X. (0.3.169)
X \ Y = X ∩ (\Y ) (0.3.171)
Свойства разности:
1◦ Связь с пустым классом и классом всех множеств: для любого класса X
X \ ∅ = X, ∅ \ X = ∅. (0.3.172)
36 Глава 0. ТЕОРИЯ МНОЖЕСТВ
X ∩ (Y \ Z) = (X ∩ Y ) \ Z, (X ∪ Y ) \ Z = (X \ Z) ∪ (Y \ Z) (0.3.173)
X \ (Y \ Z) = (X \ Y ) ∪ (X ∩ Y ∩ Z). (0.3.175)
Аксиома регулярности.
MK-11 Аксиома регулярности: если X – непустой класс, X 6= ∅, то в нем существует
элемент Y ∈ X, пересечение которого с X пусто:
X ∩ Y = ∅.
X = {Z : Z = A}.
Set
Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.179), Y = A, и поэтому мы получаем
A ∩ X = Y ∩ X = ∅.
X = {Z : Z = A ∨ Z = B}.
§ 3. Теория множеств Морса-Келли 37
∋
Set Set
Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.180), Y = A или Y = B. Если Y = A, то мы
получаем
A∩X =Z ∩X =∅
Но, с другой стороны, поскольку B ∈ A и B ∈ X, должно быть B ∈ A ∩ X = ∅, что невозможно. И
точно так же для случая Y = B.
∩{X} = X = ∪{X}.
{X} = Set;
⋄ 0.3.10. Напомним, что согласно примеру 0.3.5, ⋄ 0.3.11. Наоборот, одночленный класс {Set},
пустой класс ∅ является множеством. Покажем, порожденный классом Set всех множеств, сов-
что одночленный класс {∅}, порожденный пу- падает с классом Set:
стым множеством ∅, не совпадает с пустым мно-
жеством:
{∅} 6= ∅ (0.3.182) {Set} = Set . (0.3.183)
Это следует из аксиомы объемности MK-6: ∅ ∈
{∅}, но ∅ 6= ∅. Это следует из теоремы 0.3.6.
{X, Y } = Set;
∪ ∩(X, Y ) ∪ ∪ ∪(X, Y ) \ ∪ ∩ (X, Y ) = Y (0.3.191)
left Z = ∩ ∩ Z (0.3.196)
Декартово произведение.
• Декартовым произведением классов X и Y называется класс
– и тогда по теореме 0.3.1 это будет означать, что X × Y – тоже множество. Это делается так:
(0.3.146)
(A, B) ∈ X × Y =⇒ A∈X &B∈Y =⇒ A∈ X ∪Y & B ∈ X ∪Y =⇒
(0.3.146) X∪Y
=⇒ {A} ∈ 2X∪Y & {A, B} ∈ 2X∪Y =⇒ (A, B) = {{A}, {A, B}} ∈ 22 .
Отношения.
• Отношением называется произвольный класс r, элементами которого являются упорядо-
ченные пары:
C ∈ r =⇒ ∃A ∃B C = (A, B).
(Это автоматически означает, что компоненты A и B каждой такой пары (A, B) должны
быть множествами, потому что иначе пара (A, B) не могла бы быть элементом r.)
! 0.3.12. Всякое отношение r является подклассом в декартовом произведении X × Y некоторых
классов X и Y :
r ⊆X ×Y (0.3.204)
В качестве X и Y можно взять, например, класс Set всех множеств.
A ∈ B ⇐⇒
6 (A, B) ∈ e, s = {(A, B) : A ⊆ B}, (0.3.207)
(r ◦ s) ◦ t = r ◦ (s ◦ t), (0.3.212)
r ◦ (s ∩ t) = (r ◦ s) ∩ (r ◦ t), (0.3.213)
r ◦ (s ∪ t) = (r ◦ s) ∪ (r ◦ t). (0.3.214)
Отображения.
• Класс f называется отображением, если он является отношением и удовлетворяет усло-
вию:
∀X ∀Y ∀Z (X, Y ) ∈ f & (X, Z) ∈ f ⇒ Y = Z . (0.3.218)
• Запись
f :X→Y (0.3.222)
означает, что f является отображением, область определения которого совпадает с клас-
сом X, а область значений лежит в классе Y :
• Полезно также зарезервировать какое-то обозначение для ситуации, когда условия (0.3.223)
ослаблены до условий
D(f ) ⊆ X & R(f ) ⊆ Y. (0.3.224)
Мы в таких случаях будем писать
f : X ֒→ Y. (0.3.225)
⋄ 0.3.13. Можно заметить, что пустое множе- теореме 0.3.9, (X, Y ) ∈ Set и (X, Z) ∈ Set, но
ство ∅ является отображением, потому что фор- Y 6= Z. Несмотря на это, можно найти область
мулы (X, Y ) ∈ ∅ и (X, Z) ∈ ∅, ложны, и значит, определения и область значений класса Set:
из них следует что угодно, в частности Y = Z.
При этом, D(Set) = Set = R(Set).
Действительно, для всякого X ∈ Set мы получа-
D(∅) = ∅ = R(∅) (0.3.226) ем (X, ∅) ∈ Set, и значит X ∈ D(Set), а с другой
стороны (∅, X) ∈ Set, и поэтому X ∈ R(Set).
потому что из (X, Y ) ∈ ∅ следует X ∈ ∅ и Y ∈ ∅.
Определение (0.3.221) позволяет также найти
Для произвольного класса X значение на нем
значение класса Set на произвольном классе X:
отображения ∅ равно (
∅, X ∈ Set
∅(X) = ∅ (0.3.227) Set(X) = . (0.3.228)
Set, X ∈/ Set
потому что Действительно, если X ∈ Set, то
Аксиома подстановки.
MK-12 Аксиома подстановки: если f – отображение, и его область определения D(f ) –
множество, то и его область значений R(f ) – тоже множество.
Свойства отображений:
◦
1 Если f и g – отображения, то f ◦ g – тоже отображение.
2◦ Если f – отображение, то
f = {(X, Y ) : Y = f (X)} (0.3.236)
§ 3. Теория множеств Морса-Келли 43
f ∈YX ⇐⇒ f : X → Y. (0.3.238)
f ∈YX =⇒ f ⊆X ×Y =⇒ f ∈ 2X×Y ,
Иными словами,
Y X ⊆ 2X×Y . (0.3.239)
Если X и Y – множества, то по теореме 0.3.13, декартово произведение X ×Y – тоже множество. От-
сюда по теореме 0.3.2, 2X×Y – тоже множество. Таким образом, в (0.3.239) справа стоит множество,
и значит, по теореме 0.3.1, слева – тоже множество.
и
Q(g)(B, A) = g(B)(A), A ∈ X, B ∈ Y, g ∈ (Z Y )X . (0.3.241)
Y ×X Y X
определяют пару взаимно обратных биекций между Z и (Z ) :
P : Z Y ×X → (Z Y )X , Q : (Z Y )X → Z Y ×X
Q ◦ P = idZ Y ×X , P ◦ Q = id(Z Y )X .
и
P (Q(g))(B)(A) = (0.3.240) = Q(g)(B, A) = (0.3.241) = g(B)(A), g ∈ (Z Y )X .
[
f (Y ) = {Z : ∃Y Y ∈ X & Z ∈ f (Y )} (0.3.242)
Y ∈X
\
f (Y ) = {Z : ∀Y Y ∈ X ⇒ Z ∈ f (Y )} (0.3.243)
Y ∈X
Теорема
S 0.3.22. ЕслиT отображение f является множеством, то для любого множества X
классы Y ∈X f (Y ) и Y ∈X f (Y ) являются множествами.
44 Глава 0. ТЕОРИЯ МНОЖЕСТВ
r X
= r ∩ (X × Set) (0.3.244)
Теорема 0.3.23. Для всякого отображения f его ограничение f X на произвольный класс X яв-
ляется отображением, причем его область определения описывается равенством
D(f X
) = D(f ) ∩ X (0.3.245)
а действие – правилом
f X
(Y ) = f (Y ), Y ∈ D(f ) ∩ X. (0.3.246)
Отношение эквивалентности.
• Отношение r ⊆ X × X называется отношением эквивалентности на классе X, если оно
обладает следующими свойствами:
— рефлексивность:
ArA, (0.3.247)
— симметричность:
ArB ⇒ BrA, (0.3.248)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.249)
• Если r — отношение эквивалентности на классе X, то классом эквивалентности по от-
ношению r называется произвольный непустой класс Y ⊆ X такой, что
∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.250)
Лемма 0.3.24. Любые два класса эквивалентности Y и Z либо не пересекаются, либо совпадают.
Доказательство. Если существует A ∈ Y ∩ Z, то для всякого B ∈ X мы получим:
Теорема 0.3.25. Пусть r — отношение эквивалентности на непустом классе X такое что все
классы эквивалентности по нему являются множествами. Тогда
(i) существует класс X/r, элементами которого являются в точности классы эквива-
лентности по отношению r:
Y ∈ X/r ⇔ Y ⊆ X & ∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.251)
∀A ∈ X A ∈ p(A) (0.3.252)
Поскольку каждый класс эквивалентности Y является множеством, X/r будет состоять в точности
из всех классов эквивалентности по r. С другой стороры, отображение p определяется формулой
Ясно, что A ∈ p(A), а с другой стороны, p(A) является классом эквивалентности. Отображение
p будет сюръективно, потому что если Y – класс эквивалентности, то по определению он непуст,
поэтому найдется A ∈ Y . Для него мы получим A ∈ X и A ∈ p(A). Значит, Y и p(A) – классы
эквивалентности, содержащие A, и по лемме 0.3.24 мы получаем, что Y = p(A).
Теорема 0.3.26. Если X – множество, то на нем любое отношение эквивалентности r удовле-
творяет условиям теоремы 0.3.25, а фактор-класс X/r является множеством.
Доказательство. По теореме 0.3.25, фактор-отображение p : X → X/r сюръективно, поэтому
R(p) = X/r,
∀A ∈ X A⊆X (0.3.253)
⋄ 0.3.18. Очевидно, пустой класс ∅ наполнен. ⋄ 0.3.24. Класс X = {{∅}} обладает тем свой-
ством, что на нем отношение принадлежности ∈
⋄ 0.3.19. Одночленный класс {∅} также напол-
транзитивно,
нен.
⋄ 0.3.20. Упорядоченная пара {∅, {∅}} являет- ∀A, B, C ∈ X A ∈ B ∈ C ⇒ A ∈ C (0.3.254)
ся наполненным классом. но при этом класс X не наполнен.
⋄ 0.3.21. Эту цепочку примеров можно продол- Доказательство. Цепочка A ∈ B ∈ C ∈ {{∅}}
жать, потому что если X – наполненное множе- невозможна: можно построить цепочку из двух
ство, то класс X ∪ {X} – тоже наполненное мно- знаков ∈
жество. В частности, наполнены классы ∅ ∈ {∅} ∈ {{∅}},
{∅, {∅}, {∅, {∅}}} := {∅, {∅}} ∪ {{∅, {∅}}}, но левее уже никаких классов не подпишешь.
Отсюда следует, что класс X = {{∅}} триви-
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} := ально удовлетворяет условию (0.3.254). Но он не
удовлетворяет условию (0.3.253), потому что для
= {∅, {∅}, {∅, {∅}}} ∪ {{∅, {∅}, {∅, {∅}}}}
него нужно было бы, чтобы из
и так далее.
{∅} ∈ {{∅}}
⋄ 0.3.22. Класс Set всех множеств, очевидно, на-
полнен. следовало
{∅} ⊆ {{∅}}
! 0.3.23. Следующие примеры показывают, что
условие наполненности класса (несмотря на то есть
внешнее сходство) не эквивалентно условию ∅ ∈ {{∅}},
транзитивности отношения ∈ на данном классе. а это неверно.
46 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Y = Y ∩ X = ∅.
(iii) f продолжает любое другое отображение со свойствами (i) и (ii): если g – какое-
то другое отображение, удовлетворяющее (i) и (ii), то g ⊆ f .
Следующая теорема – один из из самых важных результатов этой науки:
Заметим, что класс F непуст, потому что содержит по крайней мере пустое множество:
∅ ∈ F.
Покажем далее, что любые два отображения из класса F совпадают на общей области определения:
B∈A & B ∩ A = ∅.
и это противоречит первому утверждению в (0.3.259). Значит, наше предположение, что A непусто,
неверно. То есть A = ∅, и это доказывает (0.3.257).
После этого нужно положить
f = ∪F,
и это будет отображение, индуктивно порожденное отображением h.
Теорема 0.3.28. Если отображение h определено на классе Set, то определенное им индуктивно
отображение f также определено на классе Set:
Тогда
Set \ D(f ) 6= ∅,
и к этому классу можно применить аксиому регулярности MK-11: существует класс Y ∈ Set \ D(f )
такой, что
Y ∩ (Set \ D(f )) = ∅.
Иными словами,
Y ∈ Set \ D(f ) & Y ⊆ D(f ). (0.3.261)
Рассмотрим класс
N = {Y } ∪ D(f ).
Он наполнен, потому что если Z ∈ N , то
— либо Z ∈ D(f ), и тогда, поскольку D(f ) наполнен, мы получаем
Z ⊆ D(f ) ⊆ N,
Z = Y ⊆ D(f ) ⊆ N.
Оно будет принадлежать F и продолжать отображение f на более широкий, чем D(f ), класс N .
Это означает, что f не может удовлетворять условию (iii) в определении на с.58. Как следствие,
наше предположение (0.3.260) не может быть верно.
Теорема 0.3.29. Пусть отображение h и классы M и P удовлетворяют следующим условиям:
(i) класс M наполнен:
∀X ∈ M X ⊆ M, (0.3.262)
48 Глава 0. ТЕОРИЯ МНОЖЕСТВ
R(h) ⊆ P. (0.3.264)
Оно корректно определено в силу (0.3.263). По теореме 0.3.28, H индуктивно определяет некое
отображение F : Set → Set. В частности, F будет удовлетворять условию (0.3.324):
Покажем, что
∀X ∈ M F X
∈ P X. (0.3.268)
Предположим, что это не так:
∃X ∈ M F X
/ P X.
∈ (0.3.269)
Зафиксируем этот элемент X ∈ M . Условие (0.3.269) означает, что найдется Y ∈ X такой, что
F (Y ) ∈
/ P.
N = {Y ∈ M : F (Y ) ∈
/ P}
A∈N & A ∩ N = ∅.
а второе – что
∀Z ∈ A Z ∈
/ N = {Y ∈ M : F (Y ) ∈
/ P },
Опять применяя (0.3.262), можно это переформулировать так:
∀Z ∈ A Z∈M & Z∈
/ N = {Y ∈ M : F (Y ) ∈
/ P} .
∀Z ∈ A F (Z) ∈ P,
A∈M & F A
∈ P A. (0.3.271)
Теперь мы получаем:
То есть F (A) ∈ P , и это противоречит (0.3.270). Значит, наше предположение (0.3.269) неверно, и
поэтому справедливо (0.3.268).
§ 3. Теория множеств Морса-Келли 49
Положим теперь
f =F M
.
Для него будет выполняться тождество (0.3.265),
f (X) = h(F X
) ∈ R(h) ⊆ (0.3.264) ⊆ P
N = {X ∈ M : f (X) 6= g(X)}
непуст. Значит, к нему можно применить аксиому регулярности MK-11: существует класс A такой,
что
A ∈ N & A ∩ N = ∅.
Первое условие означает, что
A∈M & f (A) 6= g(A). (0.3.273)
А второе – что
∀X ∈ A f (X) = g(X),
то есть что
f A
=g A
.
Но отсюда, применяя первое условие из (0.3.273), A ∈ M , мы получаем
(e) Ординалы
Отношение полного порядка.
• Отношение r ⊆ X × X называется отношением строгого частичного порядка на классе
X, если оно обладает следующими свойствами:
— антисимметричность:
ArB ⇒ ¬(BrA), (0.3.274)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.275)
• Отношение r ⊆ X × X называется отношением строгого линейного порядка на классе
X, если оно является отношением строгого частичного порядка и обладает следующим
дополнительным свойством:
— линейность:
A 6= B ⇒ (ArB ∨ BrA), (0.3.276)
• Говорят, что в классе X элемент A ∈ X является
— минимальным для отношения r, если для любого другого элемента B ∈ X из
A 6= B следует, что BrA ложно,
— максимальным для отношения r, если для любого другого элемента B ∈ X из
A 6= B следует, что ArB ложно.
50 Глава 0. ТЕОРИЯ МНОЖЕСТВ
min Y. (0.3.278)
⋄ 0.3.26 (конструкция фон Неймана). Матема- — класс {∅, {∅}, {∅, {∅}}} является ординалом
тику Джону фон Нейману принадлежит следую- и обозначается
щая остроумная идея строить ординалы “по ин-
дукции”. 3 := {∅, {∅}, {∅, {∅}}} = {0, 1, 2} = 2 ∪ {2}.
Прежде всего, пустое множество ∅ являет- (0.3.282)
ся ординалом. В дальнейшем нам будет удобно — следующий в этой цепочке класс 3 ∪ {3} тоже
использовать для него новый символ: является ординалом и обозначается
Таким образом, класс Y наполнен и любой его элемент Z ∈ Y – тоже наполненный класс. Значит,
Y – ординал.
Теорема 0.3.33 (об отношении ∈ на ординале). Пусть X – ординал. Тогда отношение принад-
лежности ∈ на X будет отношением полного порядка31 , то есть будет обладать следующими
свойствами:
(i) транзитивность:
∀A, B, C ∈ X A∈B∈C =⇒ A∈C (0.3.291)
(ii) линейность:
∀A, B ∈ X A ∈ B ∨ B ∈ A ∨ A = B. (0.3.292)
(iii) полная упорядоченность: если ∅ 6= Y ⊆ X — непустой подкласс в X, то найдется
элемент B ∈ Y , принадлежащий любому другому элементу C ∈ Y , отличному от B:
C ∈ Y & C 6= B ⇒ B ∈ C, (0.3.293)
B = ∩Y (0.3.294)
B = min Y (0.3.295)
min Y = ∩Y (0.3.296)
Y = {B ∈ X : ∃A ∈ X A∈
/ B & A 6= B & B ∈
/ A}. (0.3.297)
31 Отношение полного порядка было определено на с.50.
52 Глава 0. ТЕОРИЯ МНОЖЕСТВ
По аксиоме регулярности MK-11 на с.36, это означает, что существует элемент y ∈ Y такой что
y ∩ Y = ∅. Зафиксируем этот класс y. Он один из тех B, для которых выполняется формула,
определяющая Y :
B ∈ X & (∃A ∈ X A ∈ / B & A 6= B & B ∈/ A)
То есть формула
y ∈ X & (∃A ∈ X A∈
/ y & A 6= y & y ∈
/ A).
Это означает, что класс
Z = {z ∈ X : z ∈
/ y & z 6= y & y ∈
/ z} (0.3.298)
– тоже непуст. Опять аксиоме регулярности MK-11 на с.36, существует элемент z ∈ Z такой что
z ∩ Z = ∅. Зафиксируем z тоже.
Заметим теперь, что y ∈
/ Z (потому что y 6= y неверно, и значит, формула y ∈ X & y ∈
/ y & y 6=
y &y ∈ / y, получаемая подстановкой y вместо z в фигурные скобки (0.3.298), тоже неверна). По-
скольку z ∈ Z, отсюда можно сделать вывод, что
y 6= z. (0.3.299)
y = z. (0.3.300)
C ∈ Y & C 6= B ⇒ B ⊆ C.
C∈Y ⇒ B ⊆ C.
Y ⊆X ⇐⇒ (Y ∈ X ∨ Y = X), (0.3.302)
причем если Y ⊆ X и Y 6= X, то
Y = min(X \ Y ) (0.3.303)
Доказательство. Пусть X – ординал, Y – наполненный класс и Y ⊆ X. В утверждении (0.3.302)
импликация в левую сторону очевидна:
Y ⊆X ⇐= (Y ∈ X ∨ Y = X).
Y ⊆X =⇒ (Y ∈ X ∨ Y = X).
Свойства ординалов:
◦
1 Всякий непустой ординал X содержит пустой класс ∅ в качестве элемента,
∅ ∈ X, (0.3.304)
min X = ∅. (0.3.306)
54 Глава 0. ТЕОРИЯ МНОЖЕСТВ
∅∈X =⇒ ∩X ⊆ ∅ =⇒ ∩X = ∅.
и отношение
A6B ⇐⇒ A∈B ∨ A=B , A, B ∈ Ord . (0.3.311)
X ∈ Ord =⇒ X ⊆ Ord .
С другой стороны, всякий элемент X ∈ Ord является ординалом и значит, наполненным классом.
Вместо это означет, что Ord – ординал. Он не может быть множеством, потому что тогда мы полу-
чили бы Ord ∈ Ord, а это противоречит следствию 1◦ из аксиомы регулярности MK-11 на с.36.
2. Пусть X – ординал. По уже доказанному свойству 1◦ , Ord – тоже ординал. Поэтому по свойству
6◦ на с.54, либо X = Ord, либо X ∈ Ord, либо Ord ∈ X. Последнее – Ord ∈ X – невозможно, потому
что оно означало бы, что Ord – множество, а мы уже доказали в 1◦ , что это не так. Значит, остается
либо X = Ord, либо X ∈ Ord.
3. Если X – ординал, то по уже доказанному свойству 2◦ , либо X = Ord, либо X ∈ Ord. В первом
случае X тривиально содержится в Ord, а во втором это будет следствием того, что класс Ord,
будучи ординалом, наполнен:
X ∈ Ord ⇒ X ⊆ Ord .
Наоборот, если X – наполненный класс, содержащийся в ординале Ord, то по теореме 0.3.31, X
является ординалом.
4. Свойство 4◦ есть непосредственное следствие свойства 3◦ на с.54.
5. А свойство 5◦ сразу следует из свойства 4◦ на с.54.
6. Если B, C ∈ Ord, то условие ∀A < B A < C расшифровывается так: ∀A ∈ B A ∈ C. Это
как раз означает, что B ⊆ C.
Операция X 7→ S(X).
• Для всякого малого ординала X класс X ∪ {X} называется следующим ординалом после
X и имеет специальное обозначение:
4◦ Если X ∈ Ord, то
∪ S(X) = X ∈ S(X) (0.3.314)
5◦ Если X ∈ Ord, то
∪X ⊆ X ⊆ S(∪X), (0.3.315)
причем справедлива следующая альтернатива:
— либо в (0.3.315) выполняется равенство слева, эквивалентное неравенству спра-
ва:
∪X = X ⇔ X 6= S(∪X). (0.3.316)
— либо в (0.3.315) выполняется равенство справа, эквивалентное замене включе-
ния слева на символ принадлежности:
∪X ∈ X ⇔ X = S(∪X). (0.3.317)
A ∈ ∪ S(X) ⇐⇒ ∃Y ∈ S(X) A ∈ Y ⇐⇒ ∈ X} ∨ ∃Y
|A {z | ∈X
{z A ∈ Y} ⇐⇒ A ∈ X.
| {z }
k Y ∈{X} ⇓
X ∪ {X} A∈Y ∈X
⇓
A∈X
Заметим далее, что поскольку X и S(∪X) – ординалы, по лемме 0.3.34, второе включение в (0.3.315),
X ⊆ S(∪X), эквивалентно условию
X ∈ S(∪X) ∨ X = S(∪X).
§ 3. Теория множеств Морса-Келли 57
⊆
(0.3.315)
∪X ∈ X ⇔ {∪X} ⊆ X ⇔ (∪X) ∪ {∪X} ⊆ X ⇔ S(∪X) = X
| {z }
k
S(∪X)
⊆
(0.3.315)
X
Теорема 0.3.36. Класс M ⊆ Ord тогда и только тогда будет множеством, когда он содержится
в некотором малом ординале A ∈ Ord:
∀A ∈ Ord ∃B ∈ M B∈
/ A.
Поскольку класс Ord линейно упорядочен по отношению ∈, это условие можно переписать так:
∀A ∈ Ord ∃B ∈ M A ∈ B ∨ A = B.
∀A ∈ Ord ∃B ∈ M A ∈ B.
Теорема 0.3.37. Непустой ординал X ∈ Ord изолирован тогда и только тогда, когда
∪X ∈ X (0.3.319)
(0.3.314) (0.3.314)
∪X = ∪ S(Y ) = Y ∈ S(Y ) = X.
Теорема 0.3.38. Непустой ординал X ∈ Ord пределен тогда и только тогда, когда33
∪X = X, (0.3.321)
f =F Y
.
Поскольку D(F ) и Ord – наполненные классы, их пересечение Y = D(F ) ∩ Ord – тоже наполненный
класс (по свойству 2◦ на с.46). При этом Y ⊆ Ord, поэтому по свойству 4◦ на с.55, Y – ординал.
Условие (0.3.324) выполняется для отображения f автоматически, и то же самое с условием (iii).
Из теоремы 0.3.29 сразу следует
Теорема 0.3.40. Пусть M – ординал, P – произвольный класс, и отображение h удовлетворяет
следующим условиям:
(i) для всякого ординала X ∈ M класс P X всех отображений f : X → P содержится в
области определения h:
∀X ∈ M P X ⊆ D(h), (0.3.325)
(ii) область значений h содержится в классе P :
R(h) ⊆ P. (0.3.326)
(где R(T ) – область значений класса T , определенная формулой (0.3.220)). По теореме 0.3.39 оно
определяет некое отображение f , у которого область определения D(f ) является ординалом, и
∀Z ∈ D(f ) f (Z) = h(f |Z ) = min M \ R(f |Z ) .
и мы получим отображение g с областью определения D(g) = D(f ) ∪ {D(f )} = S(D(f )), более
широкой чем у f , но с теми же свойствами, что у f , и это будет означать, что g продолжает f ,
сохраняя его свойства, что невозможно по определению (на с.58) отображения, порожденного h.
4. Заметим далее, что отображение f нестрого монотонно:
⇓
∀A ∈ D(f ) A ∈ X
⇓
D(f ) ⊆ X
∀B < A B ∈ Y, (0.3.331)
то A ∈ Y .
Тогда Y = X.
Доказательство. Пусть A ∈ X и A ⊆ Y . Предположим сначала, что A – изолированный ординал,
то есть либо A = ∅, либо A = S(B) для некоторого B ∈ X. Тогда если A = ∅, то по условию OT-0,
A = ∅ ∈ Y . Если же A = S(B) для некоторого B ∈ X, то условие
Y ⊇ A = S(B) = B ∪ {B}
влечет за собой условие B ∈ Y , из которого в свою очередь в силу OT-1, мы получаем A = S(B) ∈ Y .
Если же A – предельный ординал, то для него условие
Y ⊇ A = {B : B ∈ A} = {B ∈ X : B < A}
P n ⊆ D(h)
R(h) ⊆ P.
Тогда формула
f (n) = h(f n ), n ∈ FinOrd (0.3.333)
однозначно определяет отображение f : FinOrd → P .
Следующая модификация теоремы 0.3.45 очень полезна в приложениях.
Теорема 0.3.46 (об определении индукцией на конечных ординалах). Пусть Q – класс, и H –
отображение, действующее из Q в Q:
H : Q → Q.
Тогда для всякого множества X ∈ Q правила
Теорема 0.3.47 (принцип полной индукции). Пусть класс Y ⊆ FinOrd обладает следующими
свойствами:
CI: если для какого-то числа n ∈ FinOrd выполняется n ⊆ Y , то n ∈ Y .
Тогда Y = FinOrd.
Доказательство. Это частный случай теоремы 0.3.42 с X = FinOrd.
Теорема 0.3.48 (принцип обыкновенной индукции). Пусть класс Y ⊆ FinOrd обладает следую-
щими свойствами:
OI-0: ∅ ∈ Y ;
OI-1: если m ∈ Y , то S(m) ∈ Y .
Тогда Y = FinOrd.
Доказательство. Это частный случай теоремы 0.3.43 с X = FinOrd, только качественная разница
в том, что здесь условие OT-2 отпадает, потому что в FinOrd нет предельных ординалов (в силу
определения конечного ординала).
MK-13 Аксиома бесконечности: существует множество35 Y со следующими свойствами:
(i) ∅∈ Y;
(ii) если X ∈ Y , то X ∪ {X} ∈ Y .
Из этой аксиомы следует
Теорема 0.3.49. FinOrd ∈ Ord.
Доказательство. По свойству 3◦ на с.62, FinOrd – ординал. Поэтому нам нужно только доказать,
что FinOrd является множеством. Рассмотриме множество Y из аксиомы MK-13 и покажем, что
FinOrd ⊆ Y . По теореме 0.3.1 это будет означать, что FinOrd – тоже множество. Обозначим X =
Y ∩ FinOrd. Понятно, что X ⊆ FinOrd. Заметим, что
1. ∅ ∈ X, потому что ∅ ∈ Y по условию (i) аксиомы MK-13, а с другой стороны, ∅ ∈ FinOrd
в силу свойства 1◦ на с.61.
2. Если A ∈ X, то A ∈ Y , поэтому по условию (i) аксиомы MK-13, S(A) ∈ Y , а с другой
стороны, A ∈ FinOrd, поэтому в силу свойства 2◦ на с.61, S(A) ∈ FinOrd. В результате,
S(A) ∈ X.
Мы видим, что класс X удовлетворяет посылкам теоремы 0.3.48, значит X = Y ∩ FinOrd = FinOrd.
Отсюда FinOrd ⊆ Y .
Теорема 0.3.50. FinOrd является минимальным предельным ординалом.
Доказательство. Сначала покажем, что FinOrd – предельный ординал. По теореме 0.3.38 для этого
нужно убедиться, что
∪ FinOrd = FinOrd .
Вложение ∪ FinOrd ⊆ FinOrd следует из (0.3.315), нам нужно проверить обратное вложение, FinOrd ⊆
∪ FinOrd. Это следует из свойства 2◦ на с.61: если X ∈ FinOrd, то X ∈ S(X) ∈ FinOrd, поэтому
X ∈ ∪ FinOrd.
Мы поняли, что FinOrd – предельный ординал. Показать, что это минимальный ординал с таким
свойством, можно просто заметив, что никакой меньший ординал не будет предельным. Действи-
тельно, если X < FinOrd, то есть X ∈ FinOrd, то X – конечный ординал, и поэтому изолированный
ординал, то есть не предельный.
S
Действительно, во-первых, 2. Если Y ∈ fill X = n∈FinOrd filln X, то
Y ∈ filln X для некоторого n ∈ FinOrd. Приме-
fill0 X = f (0) = f (∅) = h(f ∅
) = h(∅) = X. няя (0.3.162), получаем
И, во-вторых,
Y ⊆ ∪ filln X = fillS(n) X ⊆ fill X.
fillS(n) X = f (S(n)) = H(f (n)) =
3. Пусть Y – наполненый класс, и X ⊆ Y .
= ∪f (n) = ∪ filln X.
Чтобы доказать включение fill X ⊆ Y , мы при-
Теперь наполнение fill X множества X опреде- меним теорему 0.3.48. Сначала заметим, что
ляется равенством
[ fill0 X = X ⊆ Y.
fill X = filln X. (0.3.335)
n∈FinOrd После этого предположим, что для некоторого
n ∈ FinOrd выполняется
Свойства наполнения:
◦ filln X ⊆ Y.
1 Всякое множество X содержится в своем
наполнении fill X:
Тогда
X ⊆ fill X (0.3.336)
fillS(n) X = ∪ filln X ⊆ (0.3.161) ⊆ ∪Y ⊆ Y.
2◦ Наполнение fill X любого множества X яв-
ляется наполненным множеством: 4. Если множество X наполнено, то подстав-
ляя Y = X в (0.3.338), мы получим
Y ∈ fill X =⇒ Y ⊆ fill X (0.3.337)
Доказательство. Напомним, что область значений R(M ) класса M была определена нами форму-
лой (0.3.220). Зафиксируем X и рассмотрим отображение
где c – функция выбора, существование которой декларируется аксиомой MK-14. По теореме 0.3.39
отображение h определяет единственное отображение f , определенное на некотором ординале D(f )
по формуле
f (Y ) = h(f Y ) = c (X \ R(f Y )), Y ∈ D(f ) ⊆ Ord .
Приглядимся к этому отображению f .
1. Заметим сначала, что f должно быть биекцией (между своими областью определения D(f )
и множеством значений R(f )). Действительно, предположим, что для некоторых A 6= B ∈ D(f )
выполняется f (A) = f (B). По свойству ординалов 6◦ на с.54 либо A ∈ B, либо B ∈ A. Будем
считать, что A ∈ B. Тогда f (A) ∈ R(f B ), и мы получаем такую импликацию:
f (B) = c (X \ R(f B
)) ∈ X \ R(f B ) ⇒ f (A) 6= f (B).
| {z }
∈
f (A)
f (Y ) = c (X \ R(f Y
)) ∈ X \ R(f Y
) ⊆ X,
поэтому R(f ) ⊆ X. Отсюда по теореме 0.3.1 следует, что R(f ) – множество, а из этого по аксиоме
MK-12 на с.42 следует, что
D(f ) = f −1 R(f −1 ) = f −1 D(f )
– тоже множество, и значит,
D(f ) ∈ Ord .
3. Поскольку D(f ) ∈
/ D(f ), по теореме 0.3.17 мы получаем
f (D(f )) = Set
| {z }
k
c X \ R(f D(f ) )
k
c X \ R(f )
То есть
c X \ R(f ) = Set .
/ D(c) = Set \{∅}. То есть должно быть X \ R(f ) = ∅, и,
Такое возможно только если X \ R(f ) ∈
поскольку R(f ) ⊆ X, мы получем
R(f ) = X.
Таким образом, f – биекция между D(f ) ∈ Ord и R(f ) = X.
Кардинальные числа.
• Говорят, что два множества X и Y равномощны, и обозначают это записью
X ≃ Y, (0.3.340)
X 6≃ Y
Свойства отношения ≃:
1◦ Рефлексивность: всегда X ≃ X.
2◦ Симметричность: если X ≃ Y , то Y ≃ X.
3◦ Транзитивность: если X ≃ Y и Y ≃ Z, то X ≃ Z.
66 Глава 0. ТЕОРИЯ МНОЖЕСТВ
(то есть пара (X, P ) принадлежит классу card, если X равномощно P и P является кардиналом).
Если (X, P ) ∈ card и (X, Q) ∈ card, то X ≃ P и X ≃ Q, поэтому по свойствам 2◦ и 3◦ отношения
≃, P ≃ Q. С другой стороны, P, Q ∈ Card, поэтому в силу (0.3.343), P = Q, Поскольку это верно
для любых (X, P ) ∈ card и (X, Q) ∈ card, это означает, что отношение card – отображение. Условие
(0.3.344) следует из (0.3.345), и остается доказать, что card определено на всем классе Set. Это
следует из теоремы 0.3.51: всякое множество X ∈ Set равномощно некоторому ординалу T ∈ Ord,
который в свою очередь (по свойству 1◦ класса Card) равномощен некоторому кардиналу P ∈ Card,
поэтому (X, P ) ∈ card.
Доказательство. Из card X ≃ X следует card X ∈ {Z ∈ Ord : Z ≃ X}, поэтому card X > min{Z ∈
Ord : Z ≃ X}. Если предположить, что неравенство строгое, card X > min{Z ∈ Ord : Z ≃ X}, то мы
получим
min{Z ∈ Ord : Z ≃ X} ≃ X ≃ card X,
то есть min{Z ∈ Ord : Z ≃ X} – ординал, равномощный card X, но меньший card X. Это означает,
что card X – не кардинал (потому что противоречит определению кардиналов).
Свойства мощности:
1◦ Если X, Y ∈ Set, то X ≃ Y тогда и только тогда, когда card X = card Y .
2◦ P ∈ Card тогда и только тогда, когда P ∈ Set и card P = P .
3◦ Если X ∈ Set, то card(card X) = card X.
Доказательство. 1. Если X ≃ Y , то
(0.3.344) (0.3.344) транзитивность ≃ (0.3.343)
card X ≃ X ≃Y ≃ card Y =⇒ card X ≃ card Y =⇒ card X = card Y.
∋
Card Card
где c – функция выбора из аксиомы MK-14 на с.64. Отображение g будет инъективно, и значит,
биективно между D(g) = R(f ) и R(g) ⊆ D(f ). Применяя свойство мощности 1◦ и лемму 0.3.56, мы
получаем
R(f ) = D(g) ≃ R(g) ⊆ D(f ) =⇒ card R(f ) = card D(g) = card R(g) 6 card D(f ).
Доказательство теоремы 0.3.54. 1. Докажем сначала импликацию (i) ⇒ (ii). Пусть card X 6
card Y . Пусть p : X → card X и q : Y → card Y – биекции, и r : card X → card Y – естествен-
ное вложение
r(A) = A, A ∈ card X.
Тогда отображение f = q −1 ◦ r ◦ p : X → Y является инъекцией, как композиция инъекций.
2. Далее докажем (ii) ⇒ (iii). Пусть дана инъекция f : X → Y . Поскольку X 6= ∅, найдется
элемент A ∈ X. Зафиксируем его и определим отображение
(
f −1 (B), B ∈ R(f )
g(B) = , B ∈ Y.
A, B∈/ R(f )
X ≃ B
⊆
⊇
(0.3.349)
A ≃ Y
то X ≃ Y .
Доказательство. Здесь применяются только что доказанные свойства 1◦ и 4◦ : с одной стороны,
а, с другой стороны,
Y ≃A⊆X =⇒ card Y = card A 6 card X.
⋄ 0.3.32. Всякий конечный ординал является Ясно, что отображение f можно переопределить
кардиналом: так, чтобы A переходило в B, а X в Y :
изолированный ординал. С другой стороны, от- Доказательство. Если X ≃ FinOrd для некото-
ношение k ≃ S(n) невозможно при k = ∅, по- рого X ∈ FinOrd, то
этому k 6= ∅. Значит, k – непустой изолирован-
ный ординал. То есть k = m + 1 для некоторого X ⊆ S(X) ⊆ FinOrd & FinOrd
| {z ≃ X}
m ∈ FinOrd. Для него мы получаем | {z }
⇓
⇓ лемма 0.3.56
card X 6 card S(X) 6 card FinOrd card FinOrd = card X
m + 1 = k ≃ S(n).
Отсюда по лемме 0.3.59,
⇓
m ≃ n. (0.3.351)
С другой стороны, из card X 6 card S(X) 6 card FinOrd = card X
m + 1 = k ∈ S(n) ⇓
◦
по свойству 7 на с.56 следует
card S(X) = card X
m ∈ n. (0.3.352)
Условия (0.3.351) и (0.3.352) вместе означают, ⇓
что n – не кардинал, а это противоречит нашему
предположению n ∈ FinOrd ∩ Card. S(X) ≃ X.
⋄ 0.3.33. Множество FinOrd конечных ордина-
Это противоречит примеру (0.3.59), согласно ко-
лов является кардиналом:
торому элемент S(X) ∈ FinOrd должен быть кар-
FinOrd ∈ Card (0.3.353) диналом.
f : X → 2X f (Y ) = {Y }, Y ∈ X.
Z = {Y : Y ∈ X & Y ∈
/ g(Y )}. (0.3.356)
Доказательство. По теореме 0.3.41, существует сюръекция f : Ord ֒→ Card со свойствами (i) и (ii),
у которой область определения D(f ) является ординалом. Если предположить, что D(f ) 6= Ord, то по
свойству 3◦ на с.55, D(f ) ∈ Ord, и значит D(f ) является множеством. Тогда по аксиоме подстановки
MK-12 на с.42, R(f ) = Card тоже должно быть множеством, а это противоречит теореме 0.3.61.
card X ∈ FinOrd .
и X ∪ Y – конечное множество. Далее, предположим, что мы доказали это для всех множеств Y
мощности card Y = n. Пусть card Y = S(n). Выделим какой-нибудь элемент z ∈ Y и рассмотрим
множество Y \ {z}. Его мощность будет равна n,
card(Y \ {z}) = n,
поэтому по нашему предположению, множество X ∪ (Y \ {z}) конечно. Теперь если добавить к нему
не пересекающееся с ним одноэлементное множество {z}, то это будет в точности рассмотренный
случай a), и мы получаем, что множество
X ∪ (Y \ {z}) ∪ {z} = X ∪ Y
X ∪ (Y \ X) = X ∪ Y
Каждый класс X × {y} равномощен множеству X, поэтому он будет конечен. А множество таких
классов
{X × {y}; y ∈ Y }
равномощно Y и поэтому тоже конечно. Значит, по уже доказанному свойству 7◦ , объединение этих
классов [
X ×Y = X × {y} = ∪{X × {y}; y ∈ Y }
y∈Y
С другой стороны, g можно рассматривать как инъекцию g : card S(Y ) → X, поэтому по теореме
0.3.54,
card S(Y ) = card(card S(Y )) 6 card X.
Вместе это дает цепочку
card Y < card S(Y ) 6 card X,
откуда и получается card Y 6= card X.
Теорема 0.3.65. Множество X бесконечно тогда и только тогда, когда существует инъектив-
ное отображение f : FinOrd → X.
Доказательство. Множество X бесконечно, тогда и только тогда, когда его мощность card X боль-
ше любого конечного ординала n ∈ FinOrd, то есть не меньше кардинала FinOrd, или, что то же
самое, мощности FinOrd:
card X > FinOrd = card FinOrd .
По теореме 0.3.54, это эквивалентно существованию инъективного отображения f : FinOrd → X.
Теорема 0.3.66. Множество X бесконечно тогда и только тогда, когда оно имеет равномощное
себе подмножество, не совпадающее с X.
Для доказательства нам понадобится следующая
Лемма 0.3.67. Если FinOrd 6 A ∈ Card, то A ≃ A \ {∅}.
Доказательство. Формула (
S(n), n ∈ FinOrd
f (n) =
n, n∈/ FinOrd
определяет биекцию между A и A \ {∅}.
Доказательство теоремы 0.3.66. Если существует Y ⊆ X такое что Y 6= X и card Y = card X, то
по теореме 0.3.64 это несовместимо с условием конечности X. Значит, X будет бесконечным.
Наоборот, пусть X бесконечно. Тогда card X > FinOrd. Рассмотрим какую-нибудь биекцию g :
card X → X и положим
Y = R(g card X\{∅} ).
Тогда Y 6= X, и при этом
лемма 0.3.67
Y ≃ card X \ {∅} ≃ card X ≃ X.
§ 3. Теория множеств Морса-Келли 73
Теорема 0.3.68. Множество M ⊆ FinOrd тогда и только тогда конечно, когда оно содержится
в некотором конечном ординале A ∈ FinOrd:
∀A ∈ FinOrd ∃B ∈ M A ∈ B ∨ A = B.
∀A ∈ FinOrd ∃B ∈ M A ∈ B.
D(x) ∈ FinOrd .
xk = x(k), k ∈ n = D(x).
а само это отображение – в виде семейства {xk ; k ∈ n}. Ординал n при этом называется
длиной последовательности {xk ; k ∈ n}.
• Конечная последовательность длины n называется также строкой длины n. При этом
строку длины 2 удобно называть парой, строку длины 3 — тройкой, строку длины 4 —
четверкой, строку длины 5 — пятеркой, строку длины 6 — шестеркой, и так до строки
длины 9, которую называют девяткой38 .
⋄ 0.3.34. Введенное здесь понятие пары как по- потому что всякой последовательности a : 2 →
следовательности длины 2 согласуется с поняти- Set длины 2 естественным образом можно сопо-
ем упорядоченной пары множеств (X, Y ), опре- ставить упорядоченную пару множеств (X, Y )
деленной выше формулой (0.3.186)
Напомним, что декартово произведение классов X × Y было определено нами выше формулой
(0.3.202):
X × Y = {(A, B) : A ∈ X & B ∈ Y }.
Обобщением этого понятия на случай большего числа множителей можно считать следующую кон-
струкцию.
• Заметим, что в соответствии с обозначением (0.3.238), множество всех последовательно-
стей длины n со значениями в множестве Y естественно обозначать символом Y n :
Доказательство. Отображение
Y Y
f: Xi × Xn+1 → Xi f (x0 , ..., xn ), xn+1 = x0 , ..., xn , xn+1
i∈n i∈n+1
является биекцией.
Ранг множества. Напомним, что выше (0.3.221) мы определили значение g(X) любого класса g
на любом множестве X. Заметим, что если g – множество, то класс ординалов
непуст: поскольку g – множество, R(g) – тоже множество, значит R(g) ∩ Ord – тоже множество, и по
теореме 0.3.36, R(g) ∩ Ord ⊆ A для некоторого A ∈ Ord.
Рассмотрим отображение
h(g) = min{A ∈ Ord : ∀T (g(T ) ∈ Ord ⇒ g(T ) ∈ A)} = min{A ∈ Ord : R(g) ∩ Ord ⊆ A}, g ∈ Set
Оно определено всюду на Set и принимаeт значения в Ord, поэтому по теореме 0.3.28 h индуктивно
определяет некое отображение rank : Set → Ord формулой (0.3.324):
rank X = h(rank X
) = min{A ∈ Ord : R(rank X
) ∩ Ord ⊆ A} (0.3.364)
R(rank X
) ∩ Ord = {rank T ; T ∈ X} ∩ Ord = {rank T ; T ∈ X} ⊆ B.
B ∈ {A ∈ Ord : R(rank X
) ∩ Ord ⊆ A}
и условию
B > min{A ∈ Ord : R(rank X
) ∩ Ord ⊆ A} = rank A.
2. Пусть X ∈ Y . Тогда, очевидно, rank X ∈ R(rank Y ), а с другой стороны, rank X ∈ Ord, поэтому
rank X ∈ R(rank Y ) ∩ Ord. Поэтому если для какого-то ординала A справедливо R(rank Y ) ∩ Ord ⊆
A, то автоматически справедливо и rank X ∈ A. Это можно переформулировать так, что rank X
принадлежит пересечению всех таких A, и поэтому мы получаем цепочку
Как следствие,
rank Y > min{A ∈ Ord : R(rank X
) ∩ Ord ⊆ A} = rank X.
4. Прежде всего, из X ⊆ X ∪ Y следует, в силу уже доказанного свойства 3◦ , что rank X 6
rank(X ∪ Y ), и точно так же из Y ⊆ X ∪ Y следует, что rank Y 6 rank(X ∪ Y ). Это в свою очередь
означает в силу (0.3.302), что
Поэтому
rank X ∪ rank Y ⊆ rank(X ∪ Y ). (0.3.365)
Докажем теперь обратное включение. Для этого заметим такую цепочку:
T ∈X ∪Y =⇒ T ∈X ∨ T ∈Y =⇒
=⇒ rank T ∈ rank X ∨ rank T ∈ rank Y =⇒ rank T ∈ rank X ∪ rank Y.
Это можно понимать так, что ординал rank X ∪ rank Y содержится в классе всех ординалов A, для
которых выполняется условие
R(rank X∪Y ) ∩ Ord ⊆ A.
Или, иными словами,
Понятно, что rank X ∪ rank Y должен быть не меньше минимума этого множества:
rank X ∪ rank Y > min{A ∈ Ord : R(rank X∪Y
) ∩ Ord ⊆ A} = (0.3.364) = rank(X ∪ Y ).
Опять в силу (0.3.302) мы получаем
rank X ∪ rank Y ⊇ rank(X ∪ Y ),
Вместе с (0.3.365) это дает 4◦ .
5. Во-первых, из цепочки
T ∈ ∪X =⇒ ∃Y ∈ X T ∈ Y =⇒ ∃Y ∈ X rank T ∈ rank Y =⇒ rank T ∈ ∪{rank Y ; Y ∈ X}
следует включение
∪{rank Y ; Y ∈ X} ∈ {A ∈ Ord : R(rank ∪X
) ∩ Ord ⊆ A}
а из него – неравенство
∪{rank Y ; Y ∈ X} > min{A ∈ Ord : R(rank ∪X
) ∩ Ord ⊆ A} = rank ∪X. (0.3.366)
Во-вторых, из цепочки
Y ∈X =⇒ Y ⊆ ∪X =⇒ rank Y 6 rank ∪X
следует неравенство
∪{rank Y ; Y ∈ X} 6 rank ∪X.
которое вместе с (0.3.366) это дает равенство в 5◦ :
∪{rank Y ; Y ∈ X} = rank ∪X.
В-третьих, из цепочки
Y ∈X =⇒ rank Y ∈ rank X =⇒ rank Y 6 rank X
мы получаем неравенство в 5◦ :
∪{rank Y ; Y ∈ X} 6 rank X.
◦
6. Равенство 6 доказывается прямым вычислением:
что ∅ удовлетворяет этому условию, потому что rank ∅ = min{C ∈ Ord : ∅ ∩ Ord ⊆ C} = min Ord = ∅.
§ 3. Теория множеств Морса-Келли 77
Свойства SetA :
1◦ X ⊆ SetA тогда и только тогда, когда rank X 6 A.
2◦ rank SetA = A.
3◦ Наполненность: X ∈ SetA =⇒ X ⊆ SetA .
4◦ Если A ∈ B, то SetA ∈ SetB (и поэтому SetA ⊆ SetB ).
5◦ 2SetA = SetS(A) .
S
6◦ Если A – предельный ординал41 , то SetA = B: B∈A SetB .
◦
S
7 Set = A: A∈Ord SetA .
Доказательство. 1. Первое свойство здесь эквивалентно свойству 1◦ на с.75:
∈ Set, то существует A ∈ Ord такой что rank X < A, поэтому X ∈ SetA . Иными
7. Если X S
словами, X ∈ A: A∈Ord SetA .
Полное упорядочение Set. Напомним, что понятие полного порядка было введено на с.50.
Теорема 0.3.71. На каждом множестве X можно ввести отношение полного порядка.
Доказательство. По теореме 0.3.51 существует биекция f : X → T на некоторый малый ординал
T ∈ Ord. Правило
A ≺ B ⇐⇒ f (A) ∈ f (B), A, B ∈ X,
определяет полный порядок на X.
Теорема 0.3.72. На классе Set всех множеств можно ввести отношение полного порядка.
Доказательство. Для каждого малого ординала A ∈ Ord класс SetA является по теореме 0.3.70
множеством, поэтому по теореме 0.3.71 на SetA существует (хотя бы один) полный порядок. Если
обозначить через WA класс всевозможных полных порядков на SetA , то, во-первых, он будет непуст
(потому что, как мы уже говорили, существует хотя бы один полный порядок на SetA ), а, во-вторых,
он будет множеством (потому что каждый полый порядок на SetA содержится в SetA × SetA , и
значит WA содержится в множестве 2SetA × SetA ).
Мы получаем, что {WA ; A ∈ Ord} ⊆ Set \{∅}. Значит, к классам WA можно применить функцию
выбора c : Set \{∅} → Set (из аксиомы MK-14 на с.64), и для каждого A ∈ Ord мы получим некий
полный порядок ≺A = c(WA ) ∈ WA на SetA . Теперь определим отношение ≺ на Set правилом:
X ≺ Y , если
— либо rank X ∈ rank Y ,
— либо rank X = rank Y = A, и X ≺A Y .
Отношение ≺ будет полным порядком на Set.
Глава 1
МАТЕМАТИЧЕСКАЯ ЛОГИКА
Глядя на шаги, по которым в главе 0 строилась теория множеств, нетрудно представить, как, меняя
какие-то элементы этой конструкции, можно построить другую подобную теорию. Например, можно
менять аксиомы самой теории (если варьировать аксиомы MK-1 – MK-14, оставив все остальные
элементы неизменными, то будут получаться различные варианты теории множеств, каковых много
в математике). Точно так же можно менять язык теории (алфавит и сигнатуру), и даже аксиомы
логики и правила вывода LK-0 – LK-151 . При этом будут получаться конструкции, называемые
формальными теориями (понятно, что они могут сильно отличаться друг от друга).
Изучением таких теорий, построенных по примеру уже описанной нами теории множеств, зани-
мается наука, называемая математической логикой. Сами теории такого вида имеют специальное
название: формальные теории, или формальные системы, или теории первого порядка. В этой главе
мы опишем основные выводы этой науки, увиденные глазами сторонника гильбертовской филосо-
фии формализма (в том смысле как мы описали это на с.v).
Понятия и результаты этой главы будут полезны ниже в главе 4 о стандартных функциях при
объяснении трудностей построения Исчисления (Calculus, см. с.301).
a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,
является переменной,
— если x – переменная, то добавляя к ней штрих ′ мы получаем новую переменную:
x′ , x′′ , ...
1 В качестве примера читатель может поглядеть на правила интуиционистской логики, которые мы приводим на
с.116.
79
80 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
– также терм. В частном случае, когда валентность F равна 2, принято для краткости
вместо (1.1.1) писать
τ1 F τ2
(как это делается в теории групп с символом умножения ·, см. ниже пример 1.1.4).
4. После этого формулой данного языка объявляется произвольная строка символов, постро-
енная по следующим правилам:
— если τ1 , ..., τn – термы, и P – предикатный символ валентности n, то строка
α = β,
ϕ (1.1.4)
x=τ
LK-0: ϕ ⊢ ϕ. (1.1.5)
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
LK-2: (1.1.7)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
ϕ, χ, ψ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, χ, ψ
LK-3: (1.1.8)
ϕ, ψ, χ, Γ ⊢ ∆ Γ ⊢ ∆, χ, ϕ, ψ
— сечение:
Γ ⊢ ∆, ϕ ϕ, Π ⊢ Λ
LK-4: (1.1.9)
Γ, Π ⊢ ∆, Λ
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
LK-5: (1.1.10)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
82 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
— конъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
LK-6: (1.1.11)
Γ ⊢ ∆, ϕ&χ
— конъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
LK-7: (1.1.12)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
LK-8: (1.1.13)
ϕ ∨ χ, Γ ⊢ ∆
— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
LK-9: (1.1.14)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
LK-10: (1.1.15)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
LK-11: (1.1.16)
Γ ⊢ ∆, ϕ ⇒ χ
— добавление квантора всеобщности в антецедент: если подстановка
ϕ x=τ корректна2 (здесь x — переменная, а τ – терм), то
ϕ x=τ , Γ ⊢ ∆
LK-12:∗ (1.1.17)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y
не входит (как свободная переменная) в нижнюю секвенцию (то
есть в наборы формул Γ , ∆, ∀x ϕ), то
Γ ⊢ ∆, ϕ x=y
LK-13: (1.1.18)
Γ ⊢ ∆, ∀x ϕ
— добавление квантора существования в антецедент: если переменная
y не входит (как свободная переменная) в нижнюю секвенцию (то
есть в наборы формул ∃x ϕ, Γ , ∆), то
ϕ x=y
,Γ ⊢ ∆
LK-14: (1.1.19)
∃x ϕ, Γ ⊢ ∆
— добавление квантора существования в сукцедент: если подстановка
ϕ x=τ корректна3 (здесь x — переменная, а τ – терм), то
Γ ⊢ ∆, ϕ x=τ
LK-15:∗ (1.1.20)
Γ ⊢ ∆, ∃x ϕ
Подобно тому как это делалось на с.12 для теории MK, деревом Генцена в формальной теории
называется произвольная картинка
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
, (1.1.21)
χ⊢ψ
в которой внизу выписана какая-то одна секвенция, а каждый переход сверху вниз представляет
собой применение одного из правил вывода LK-1 — LK-15. При этом секвенция в самом низу
(здесь это χ ⊢ ψ) называется корнем, а секвенции на самом верху (в данном случае Γ ′′′ ⊢ ∆′′′ и
Γ ′′′′ ⊢ ∆′′′′ ) — вершинами этого дерева.
2 Определение корректной подстановки дано на с. 8.
3 См. определение на с. 8.
§ 1. Логика предикатов для общей формальной теории 83
• Дерево Генцена считается выводом в формальной теории T , если каждая его вершина
является
— либо аксиомой исчисления секвенций LK, то есть секвенцией вида ϕ ⊢ ϕ, где
ϕ — какая-нибудь аксиома теории T ,
— либо секвенцией вида ⊢ α, где α — какая-нибудь аксиома теории T (то есть
формула из списка A аксиом этой теории).
• Секвенция Γ ⊢ ∆ называется выводимой в теории T , если у нее есть вывод в теории
T.
• Формула ω формальной теории T называется
— выводимой (или теоремой теории T ), если в T выводима секвенция ⊢ ω;
— опровержимой, если ее отрицание, ¬ω, выводимо в теории T .
• Формальная теория T называется теорией с равенством, если в ее сигнатуру включен специ-
альный символ =, а в систему аксиом – следующие аксиомы, называемые аксиомами равенства:
— аксиомы эквивалентности для равенства:
x=x (1.1.22)
x=y ⇒ y=x (1.1.23)
(x = y & y = z) ⇒ x=z (1.1.24)
b. Для любого предикатного символа P валентности n и для любых двух строк переменных
x1 , ..., xn и y1 , ..., yn длины n задается аксиома5
(x1 = y1 & ... & xn = yn ) & P (x1 , ..., xn ) ⇒ P (y1 , ..., yn ). (1.1.26)
⋄ 1.1.1. Теория множеств Морса-Келли MK, по- но представить как формальную теорию с равен-
строенная нами выше в § 2 и § 3, является приме- ством над логикой предикатов, у которой сигна-
ром формальной теории с равенством. Это тео- тура состоит из единственного двуместного пре-
рия над логикой предикатов, ее сигнатура состо- дикатного символа сравнения 6 (не считая дву-
ит из единственного двуместного предикатного местного предикатного символа равенства =), а
символа принадлежности ∈ (не считая двумест- содержательными аксиомами считаются форму-
ного предикатного символа равенства =), а акси- лы
омы – утверждения MK-1 – MK-14, приведенные
в § 3. x6x (1.1.27)
⇒ x=y
x6y &y6x (1.1.28)
⋄ 1.1.2. Наивная теория множеств NST, по-
строенная в § 1 этой главы, также является при- x6y &y6z ⇒ x6z (1.1.29)
мером формальной теории с равенством. Это
⋄ 1.1.4. Теорию групп, также часто используе-
также теория над логикой предикатов, у нее та-
мую в алгебре и анализе, можно представить как
кая же сигнатура, как у MK, а система аксиом
формальную теорию с равенством. Ее сигнатура,
NST-1—NST-7 описана на с.4.
состоит (помимо двуместного предикатного сим-
⋄ 1.1.3. Теорию частичного порядка, используе- вола равенства =) из функционального символа
мую в разных разделах алгебры и анализа, мож- 1 (валентности 0) и функционального символа ·
4В (1.1.25) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.61.
5В (1.1.26) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.61.
84 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Теорема 1.1.1 (об импликации). Секвенция α, Γ ⊢ ∆, β выводима тогда и только тогда, когда
выводима секвенция Γ ⊢ ∆, α ⇒ β.
α, Γ ⊢ ∆, β
(1.1.16)
Γ ⊢ ∆, α ⇒ β.
Это дерево Генцена надо понимать так, что если у его вершины — секвенции α, Γ ⊢ ∆, β — есть
вывод, то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом
для секвенции Γ ⊢ ∆, α ⇒ β.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.49):
α, α ⇒ β ⊢ β
(1.1.8)
Γ ⊢ ∆, α ⇒ β α ⇒ β, α ⊢ β
(1.1.9)
Γ, α ⊢ ∆, β
(1.1.8)
α, Γ ⊢ ∆, β
Опять это дерево надо понимать так, что если у его левой вершины — секвенции Γ ⊢ ∆, α ⇒ β —
есть вывод, то его можно пристроить к этой вершине сверху, затем к правой вершине — секвенции
α, α ⇒ β ⊢ β — нужно будет пристроить ее вывод, который мы получили на с.13, и мы в результате
получим дерево, являющееся выводом для секвенции α, Γ ⊢ ∆, β.
! 1.1.6. Если формулу α заменить здесь каким-нибудь набором (из более чем одной формулы)
Θ, то это утверждение утрачивает силу: из выводимости секвенций Γ ⊢ Θ и Θ ⊢ ∆ не следует
выводимость секвенции Γ ⊢ ∆.
6 Мы уже определяли это отношение между формулами выше на с.13.
§ 1. Логика предикатов для общей формальной теории 85
Γ ⊢α α⊢∆
(1.1.9)
Γ ⊢∆
Теорема 1.1.3. Если выводима секвенция α ⊢ β, то для любой формулы γ выводима секвенция
β ⇒ γ ⊢ α ⇒ γ.
Доказательство. Пусть выводима секвенция α ⊢ β. Тогда по теореме 1.1.1 выводима секвенция
⊢ α ⇒ β.
α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ).
⊢ (β ⇒ γ) ⇒ (α ⇒ γ).
β ⇒ γ ⊢ α ⇒ γ.
α ∼ β.
∀x α ∼ ∀x β, ∃x α ∼ ∃x β. (1.1.41)
2◦ Если α1 ∼ β1 и α2 ∼ β2 , то
то из этого нельзя заключить, что ¬β следует из ¬α. Все же применение логических операций & и ∨ и кванторов ∀
и ∃ сохраняет отношение следствия.
86 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Замыкание всеобщности.
• Пусть α — формула формальной теории T , и пусть x1 , ..., xn — ее свободные переменные.
Тогда замыканием всеобщности α формулы α называется формула
Противоречивость и непротиворечивость.
⊢ ϕ ⊢ ¬ϕ
(1.1.11)
⊢ ϕ & ¬ϕ
Если в T выводимы формулы ϕ и ¬ϕ, то подклеив их выводы к вершинам этого дерева, мы получим
вывод формулы ϕ & ¬ϕ.
2. (ii)⇒(iii). Вспомним выведенную выше секвенцию (0.2.76),
α & β ⊢ α ⇒ β. (1.1.45)
ϕ & ¬ϕ ⊢ ϕ ⇒ ¬ϕ,
⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ ϕ ⇒ ¬ϕ
(1.1.11)
⊢ ϕ ⇒ ¬ϕ
Если теперь выводима формула ϕ & ¬ϕ, то подклеив ее вывод к левой вершине, мы получим вывод
формулы ϕ ⇒ ¬ϕ.
Точно также заменив в (1.1.45) α на ¬ϕ, а β на ϕ, мы получим выводимую секвенцию
¬ϕ & ϕ ⊢ ¬ϕ ⇒ ϕ.
⊢ ¬ϕ & ϕ ¬ϕ & ϕ ⊢ ¬ϕ ⇒ ϕ
(1.1.11) (1.1.46)
⊢ ¬ϕ ⇒ ϕ
Теперь если выводима формула ϕ & ¬ϕ, то, в силу выводимости секвенции (0.2.52), выводима и
формула ¬ϕ & ϕ. Подклеив ее вывод к левой вершине дерева (1.1.46), мы получим вывод формулы
¬ϕ ⇒ ϕ.
Мы получили, что если выводима формула ϕ & ¬ϕ, то выводимы формулы ϕ ⇒ ¬ϕ и ¬ϕ ⇒ ϕ.
Значит, выводима формула ϕ ⇔ ¬ϕ.
3. (iii)⇒(i). Пусть выводима некоторая формула ϕ ⇔ ¬ϕ, то есть секвенция
⊢ ϕ ⇔ ¬ϕ.
ϕ ⊢ ¬ϕ
и
¬ϕ ⊢ ϕ.
88 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
⋄ 1.1.7. Наивная теория множеств NST, кото- чим, означает, что в NST выводима также фор-
рую мы строили в § 1 главы 0, противоречива мула
как формальная теория, потому что парадокс R∈R&R∈
/ R,
Рассела (0.1.20), обсуждавшийся нами в примере
0.1.13, означает выводимость в этой теории фор- и что в этой теории выводима и опровержима
мулы формула R ∈ R (мы это отмечали в замечании
R∈R ⇔ R∈ /R 0.1.14, но тогда мы пользовались обычным мате-
(где R — множество Рассела, определенное фор- матическим языком, не организованным в фор-
мулой (0.1.18)). По теореме 1.1.8 это, между про- мальное исчисление).
Теорема 1.1.9 (о противоречивых теориях). Если теория T противоречива, то в ней любая фор-
мула одновременно выводима и опровержима.
Доказательство. Здесь используется секвенция (0.2.74), которую мы вывели когда-то. Пусть ϕ –
какая-нибудь формула в T , являющаяся выводимой и опровержимой одновременно. Зафиксируем
какую-нибудь формулу ψ в теории T и покажем, что она тоже выводима и опровержима в T .
Выводимость ϕ значит, что существует ее вывод в теории T , то есть дерево Генцена (1.1.44)
α⊢α ⊢β
... ...
⊢ϕ
с корнем ⊢ ϕ, и вершинами вида α ⊢ α, где α — произвольная формула теории, либо ⊢ β, где β —
произвольная аксиома теории T .
Точно так же выводимость ¬ϕ значит, что существует такое же дерево Генцена
α⊢α ⊢β
... ...
.
⊢ ¬ϕ
Подклеив эти деревья сверху к левым двум вершинам дерева (а вывод секвенции (0.2.74) — к
его правой вершине)
⊢ ϕ ⊢ ¬ϕ ϕ & ¬ϕ ⊢ (0.2.74)
(1.1.11) (1.1.6)
⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ ψ
(1.1.9)
⊢ψ
§ 1. Логика предикатов для общей формальной теории 89
Теорема 1.1.11. Если замкнутая формула ϕ в теории T невыводима, то (не только теория T ,
но и) теория T + ¬ϕ непротиворечива.
Доказательство. Заметим, что аксиомы теории T тоже можно считать замкнутыми (как и форму-
лу ϕ), потому что по теореме 1.1.7 теория T и ее замыкание T дают один и тот же класс выводимых
формул.
Теперь предположим, что теория T + ¬ϕ противоречива. Тогда по теореме 1.1.9 в ней выводится
любая формула, в том числе и формула ϕ. Иными словами, ϕ выводится из ¬ϕ и некоторого ко-
нечного набора Σ аксиом теории T . При этом, как мы уже говорили, формулы Σ можно считать
замкнутыми (поскольку это аксиомы теории T ), а формула ¬ϕ замкнута потому что ϕ замкнута.
Отсюда по теореме о дедукции 1.1.5 мы получаем, что ϕ (не просто выводится, но и) следует из
¬ϕ и Σ. То есть в LK выводима секвенция
¬ϕ, Σ ⊢ ϕ.
Подклеив ее вывод к левой вершине дерева Генцена (а вывод секвенции (0.2.75) — к его правой
вершине)
¬ϕ, Σ ⊢ ϕ
(1.1.10)
Σ ⊢ ϕ, ¬(¬ϕ) ¬(¬ϕ) ⊢ ϕ (0.2.75)
(1.1.9)
Σ ⊢ ϕ, ϕ
(1.1.7)
Σ⊢ϕ
мы получим, что ϕ следует из Σ. Опять применяя теорему дедукции 1.1.5, мы получим, что формула
ϕ выводима из Σ, то есть выводима в T .
⋄ 1.1.8. Символ Ord, обозначающий класс малых циального расширения теории MK.
ординалов, определенный формулой (0.3.309),
может считаться примером внешнего функцио- ⋄ 1.1.10. Символ ≃, обозначающий отноше-
нального символа валентности 0, присоединен- ние равномощности, и определенный формулой
ного к теории MK. А теория MK с присоединен- (0.3.340), – пример внешнего предикатного сим-
ным к ней символом, определенным формулой вола валентности 2 для теории MK.
(0.3.309), – пример дефинициального расшире-
ния теории MK. ! 1.1.11. Глядя на эти примеры, можно заме-
⋄ 1.1.9. Символ S, обозначающий функцию сле- тить, что в теории множеств Морса-Келли MK
дования, определенную формулой (0.3.312), – всякий присоединенный предикатный символ η
пример внешнего функционального символа ва- валентности n выделяет некий класс строк дли-
лентности 1 для теории MK. Точно так же теория ны n, а всякий присоединенный функциональ-
MK с присоединенным к ней символом S, опре- ный символ θ валентности n выделяет некое
деленным формулой (0.3.312), – пример дефини- отображение на строках длины n.
ϕ (1.1.50)
x1 =τ1 ,...,xn =τn
ϕ =ϕ ...
x1 =τ1 ,...,xn =τn x1 =τ1 xn =τn
ϕ=χ
y=F (τ1 ,...,τn )
b=ϕ
ϕ (1.1.51)
¬ϕ
c = ¬ϕ,
b (ϕ ⇒ ψ)b = (ϕ b
b ⇒ ψ) (1.1.54)
ϕ\ b
b & ψ,
&ψ=ϕ \
ϕ ∨ψ =ϕ b
b ∨ ψ, (1.1.55)
[
∀x ϕ = ∀x ϕ,
b [
∃x ϕ = ∃x ϕ.
b (1.1.56)
8 Равенство формул было определено на с.80.
92 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
ϕ ⇔ ϕ
b (1.1.57)
6◦ Если τ — терм теории T (без новых присоединенных символов), для которого подста-
b x=τ также будет корректна, и справедливо
новка ϕ x=τ корректна, то подстановка ϕ
равенство формул
ϕ\ =ϕ b . (1.1.58)
x=τ x=τ
◦
7 Если в теории R подстановка ϕ x=τ корректна (и τ — произвольный терм в R, то есть,
возможно, содержащий присоединенные к T символы), то в T выводимы секвенции
∀x ϕ \
b⊢ϕ (1.1.59)
x=τ
\ ⊢ ∃x ϕ
ϕ b (1.1.60)
x=τ
ϕ ∼ ϕ,
b
поэтому то же самое верно для любых формул, составленных из атомарных с помощью связок ¬,
&, ∨, ⇒, и кванторов ∀, ∃. То есть это верно для любых вообще формул.
Свойство 7 доказывается индукцией по сложности формулы.
⋄ 1.1.12. Напомним, что отношение включе- Ее перевод ϕb на язык теории MK, естественно,
ния ⊆ было определено в теории MK формулой должен содержать только символы сигнатуры
(0.3.134) теории MK (то есть = или ∈, без ⊆), и мы его
упоминали уже, — это формула (0.3.140):
X ⊆Y ⇔ ∀A (A ∈ X ⇒ A ∈ Y ).
Понятно, что ⊆ можно понимать как внешний
двуместный предикатный символ в MK. Саму ∀A (A ∈ X ⇒ A ∈ Y )
теорию MK с присоединенным к ней предикат-
& ∀A (A ∈ Y ⇒ A ∈ X)
ным символом ⊆ можно поэтому рассматривать
как дефинициальное расширение теории MK. ⇒ X = Y.
Обозначим его MK+ ⊆. Рассмотрим в MK+ ⊆
какую-нибудь формулу ϕ с участием этого сим-
вола, например, (0.3.139): На с.32 мы приводили вывод формулы ϕb в MK,
9
а формула ϕ, в свою очередь, выводится в
X ⊆Y &Y ⊆X ⇒ X = Y. MK+ ⊆.
Доказательство. Заметим сразу, что в одну сторону это утверждение следует сразу из свойства
b выводима в T , то ϕ выводима в R. Действительно, в R выводима формула (1.1.57),
(1.1.57): если ϕ
а значит, и формула
b ⇒ ϕ,
ϕ
и по теореме об импликации 1.1.1, секвенция
b ⊢ ϕ.
ϕ
⊢ϕ b⊢ϕ
b ϕ
(1.1.9)
⊢ϕ
у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
α ⊢ α), либо секвенции вида ⊢ γ, где γ — аксиомы теории T или теории R.
Преобразуем каждую формулу ψ в этом дереве в формулу ψb теории T (по правилам, описанным
на с.91). Мы получим некую картинку с секвенциями теории T :
α⊢
b αb ⊢b
γ
b ⊢∆
Γ c b ⊢∆
Γ c
3 3 4 4
b ⊢∆
Γ c b ⊢∆
Γ c
1 1 2 2
... ...
(1.1.62)
⊢ϕ
b
В вершинах этой картинки стоят либо секвенции вида α b⊢αb, то есть аксиомы исчисления преди-
катов LK, либо секвенции вида ⊢ γ
b, где γ — аксиомы теории T , либо секвенции вида ⊢ bγ , где γ —
аксиома теории R, то есть определение в T . Но всякое определение имеет вид (1.1.47)
η(x1 , ..., xn ) ⇐⇒ α,
α ⊢ α.
Γbp ⊢ ∆
bp
(1.1.63)
Γbq ⊢ ∆
bq
94 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Γp ⊢ ∆p
, (1.1.64)
Γq ⊢ ∆q
который в свою очередь получен применением какого-то из правил вывода LK-1 — LK-15. Нужно
перебрать все правила от LK-1 до LK-15 и убедиться, что всякий раз, когда в (1.1.64) выводимость
нижней секвенция следует из выводимости верхней применением этого правила, в (1.1.63) выводи-
мость нижней секвенции также получается из выводимости верхней применением этого же правила,
возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (1.1.64) получено применением первого правила в LK-1, то есть имеет вид
Γ ⊢∆
α, Γ ⊢ ∆
Γb ⊢ ∆b
,
b, Γb ⊢ ∆
α b
\ , Γb ⊢ ∆
α b
x=τ
.
dα, Γb ⊢ ∆
∀x b
Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(1.1.9),
dα ⊢ α
∀x \ \ , Γb ⊢ ∆
α b
x=τ x=τ
,
dα, Γb ⊢ ∆
∀x b
и по правилу (1.1.56) это будет эквивалентно переходу
∀x α \
b⊢α \ , Γb ⊢ ∆
α b
x=τ x=τ
.
b, Γb ⊢ ∆
∀x α b
Последний переход представляет собой применение правила сечения LK-4, а добавленная нами вер-
шина слева — ∀x α
b⊢α\ — выводимая секвенция в T , в силу (1.1.59).
x=τ
4. Пусть (1.1.64) получено применением правила LK-13∗ , то есть имеет вид
Γ ⊢ ∆, α x=y
Γ ⊢ ∆, ∀x α
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
Γb ⊢ ∆,
b α\
x=y
Γb ⊢ ∆, dα
b ∀x
Γb ⊢ ∆,
b αb x=y
Γb ⊢ ∆,
b ∀x α
b
§ 1. Логика предикатов для общей формальной теории 95
α x=y
,Γ ⊢ ∆
∃x α, Γ ⊢ ∆
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
\ , Γb ⊢ ∆
α b
x=y
dα, Γb ⊢ ∆
∃x b
b
α x=y
, Γb ⊢ ∆
b
b, Γb ⊢ ∆
∃x α b
Γ ⊢ ∆, α x=τ
Γ ⊢ ∆, ∃x α
— где x — переменная, а τ – терм. Это преобразуется в переход
Γb ⊢ ∆,
b α\
x=τ
.
Γb ⊢ ∆, dα
b ∃x
Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(1.1.9),
Γb ⊢ ∆,
b α\ \ ⊢ ∃x
α dα
x=τ x=τ
,
Γb ⊢ ∆, dα
b ∃x
и по правилу (1.1.56) это будет эквивалентно переходу
Γb ⊢ ∆,
b α\ \ ⊢ ∃x α
α b
x=τ x=τ
,
b b
Γ ⊢ ∆, ∃x α
b
Последний переход представляет собой применение правила сечения LK-4, а добавленная нами вер-
\ ⊢ ∃x α
шина справа — α b — выводимая секвенция в T , в силу (1.1.60).
x=τ
⊢ ∃x U (x) (1.1.65)
96 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
— каждую подформулу
∃x α (1.1.69)
нужно заменить на подформулу
∃x U (x) & (α) (1.1.70)
S ⊆ S′ ⊆ T .
Доказательство теоремы 1.1.13. Здесь схема рассуждений похожа на ту, что использовалась в
доказательстве второй части теоремы 1.1.12, только каждый шаг усложняется пропроционально
усложнению конструкции ϕ′ в сравнении с ϕ.
b
Нам достаточно рассмотреть случай, когда формула ϕ выводима в S. Тогда у нее есть вывод в
S, то есть некое дерево Генцена,
λ⊢λ ⊢γ
Γ3 ⊢∆3 Γ4 ⊢∆4
Γ1 ⊢∆1 Γ2 ⊢∆2
... ...
(1.1.73)
⊢ϕ
у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
λ ⊢ λ), либо секвенции вида ⊢ γ, где γ — аксиомы теории S.
Преобразуем каждую формулу ψ в этом дереве в формулу ψ ′ теории S ′ (по правилам, описанным
на с.96). Мы получим некую картинку с секвенциями теории S ′ :
λ′ ⊢λ′ ⊢γ ′
Γ ′ ⊢∆′ Γ ′ ⊢∆′
3 3 4 4
Γ1′ ⊢∆′ Γ2′ ⊢∆′
1 2
... ...
(1.1.74)
⊢ ϕ′
В вершинах этой картинки стоят либо секвенции вида λ′ ⊢ λ′ , то есть аксиомы исчисления предика-
тов LK, либо секвенции вида ⊢ γ ′ , где γ — аксиомы теории S, а это выводимые секвенции, поскольку
операция γ 7→ γ ′ есть интерпретация теории S.
Поэтому если доказать, что в (1.1.74) каждый переход вниз осуществляется по правилам вывода
исчисления LK, то это будет выводом секвенции
⊢ ϕ′
Γp′ ⊢ ∆′p
(1.1.75)
Γq′ ⊢ ∆′q
Γp ⊢ ∆p
, (1.1.76)
Γq ⊢ ∆q
который в свою очередь получен применением какого-то из правил вывода LK-1 — LK-15. Нужно
перебрать все правила от LK-1 до LK-15 и убедиться, что всякий раз, когда в (1.1.76) выводимость
нижней секвенция следует из выводимости верхней применением этого правила, в (1.1.75) выводи-
мость нижней секвенции также получается из выводимости верхней применением этого же правила,
возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (1.1.76) получено применением первого правила в LK-1, то есть имеет вид
Γ ⊢∆
α, Γ ⊢ ∆
Γ ′ ⊢ ∆′
,
α′ , Γ ′ ⊢ ∆′
(α x=τ )′ , Γ ′ ⊢ ∆′
,
(∀x α)′ , Γ ′ ⊢ ∆′
По правилам преобразования (1.1.72) и (1.1.68) этот переход расшифровывается так:
U (y1 ) & ... & U (yn ) ⇒ α′ x=τ ′ (y ,...,y ) , Γ ′ ⊢ ∆′
1 n
, (1.1.77)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
U (y) ⇒ α′ x=τ ′ , Γ ′ ⊢ ∆′
, (1.1.79)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
Теперь чтобы доказать, что из верхней секвенции здесь выводится нижняя, заметим, что из
правила (1.1.66), записанного применительно к нашим условиям в виде
U (y1 ), ..., U (yn ) ⊢ U τ ′ (y1 , ..., yn ) ,
Если снова воспользоваться обозначением (1.1.78), то эту секвенцию можно будет коротко записать
так:
U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′
Добавив ее слева к верхней секвенции в (1.1.79), мы получим дерево
U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′ U (y) ⇒ α′ x=τ ′ , Γ ′ ⊢ ∆′
(1.1.9)
U τ ′ (y) ⇒ α′ x=τ ′ (y)
, Γ ′ ⊢ ∆′
(1.1.17)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
Здесь секвенция в левой вершине, как мы уже заметили, выводима. Поэтому из выводимости се-
квенции в правой вершине следует выводимость корня дерева.
4. Пусть (1.1.76) получено применением правила LK-13∗ , то есть имеет вид
Γ ⊢ ∆, α x=y
Γ ⊢ ∆, ∀x α
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
′
Γ ′ ⊢ ∆′ , α x=y
′
Γ ′ ⊢ ∆′ , ∀x α
Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=y
Γ ′ ⊢ ∆′ , ∀x U (x) ⇒ α′
§ 1. Логика предикатов для общей формальной теории 99
(опять мы в числителе заменяем формулу на эквивалентную, применяя теорему 1.1.4), или, что
эквивалентно, так:
Γ ′ ⊢ ∆′ , U (x) ⇒ α′ x=y
.
Γ ′ ⊢ ∆′ , ∀x U (x) ⇒ α′
При этом, y по-прежнему не входит (как свободная переменная) в нижнюю секвенцию. Но это в
точности применение правила LK-13∗ к верхней секвенции.
5. Пусть (1.1.76) получено применением правила LK-14∗ , то есть имеет вид
α x=y
,Γ ⊢ ∆
∃x α, Γ ⊢ ∆
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
′
α x=y , Γ ′ ⊢ ∆′
′
∃x α , Γ ′ ⊢ ∆′
U (y) ⇒ α′ x=y
, Γ ′ ⊢ ∆′
(1.1.80)
∃x U (x) & α′ , Γ ′ ⊢ ∆′
Теперь чтобы доказать, что из верхней секвенции здесь выводится нижняя, заметим, что выведен-
ную нами выше секвенцию (0.2.76) можно записать применительно к нашим условиям в виде
Добавив эту секвенцию слева к верхней секвенции в (1.1.80), мы получим дерево Генцена
U (x) & α′ x=y ⊢ U (y) ⇒ α′ x=y U (y) ⇒ α′ x=y , Γ ′ ⊢ ∆′
(1.1.9)
U (x) & α′ x=y
, Γ ′ ⊢ ∆′
(1.1.19)
∃x U (x) & α′ , Γ ′ ⊢ ∆′
Γ ⊢ ∆, α x=τ
Γ ⊢ ∆, ∃x α
— где x — переменная, а τ – терм. Это преобразуется в переход
′
Γ ′ ⊢ ∆′ , α x=τ
′ .
Γ ′ ⊢ ∆′ , ∃x α
Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=τ ′
. (1.1.81)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′
— где как и раньше, в соответствии с соглашением (1.1.78), под U (y) понимается U (y1 ) & ... & U (yn ).
Заметим, что по теореме 1.1.1 секвенция
Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=τ ′
100 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
. (1.1.82)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′
U (y) ⊢ U (τ ′ (y))
(1.1.6)
U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
(1.1.11)
U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) & α′ x=τ ′
(1.1.20)
U (y), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.78)
U (y1 ) & U (y2 ) & ... & U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
Теорема 0.2.1
U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.19)
⊢ ∃y1 U (y1 ) ∃y1 U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.9)
U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.9)
...
(1.1.9)
⊢ ∃yn U (yn ) U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.9)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
Здесь самая правая вершина — секвенция U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′ — верхняя секвенция в (1.1.82).
Вершина на самом верху — секвенция U (y) ⊢ U (τ ′ ) — правило (1.1.66), записанное для терма τ ′ .
Остальные вершины — секвенции ⊢ ∃yi U (yi ) — представляют собой правило (1.1.65) непустоты уни-
версума, записанное для переменных yi . С их помощью мы последовательно избавляемся от формул
U (yi ) в антецеденте получающейся секвенции U (y1 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x). Из этого де-
рева видно, что если выводится U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′ , то выводится и Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x).
Вместе все это означает, что такая система опре- будет интерпретацией теории PA в теории MK (с
делений для символов 0, S, +, · в теории MK универсумом FinOrd).
Теорема 1.1.16 (первая теорема Гёделя о неполноте). Пусть T – формальная теория, содержа-
щая арифметику Пеано. Тогда теория T либо противоречива, либо неполна.
Теорема 1.1.17 (вторая теорема Гёделя о неполноте). Пусть T – формальная теория, содержа-
щая арифметику Пеано. Тогда либо теория T противоречива, либо утверждение о ее непротиво-
речивости невыводимо в T .
Второе из этих утверждений может быть интерпретировано, как, ни много, ни мало, свидетель-
ство того, что непротиворечивость арифметики, теории множеств, а вместе с ними и математики
в целом, доказать (в рамках логики предикатов) невозможно. Действительно, для доказательства
непротиворечивости любой более или менее содержательной теории T (то есть, теории, включаю-
щей арифметику, как, скажем, теория множеств) нужно, как выясняется, строить новую теорию
T ′ (обычно под T ′ понимается какая-то более широкая теория, хотя это необязательно, достаточно
просто чтобы T интерпретировалась в T ′ ), после чего немедленно встает вопрос о том, не будет ли
T ′ сама противоречива. Это важно, потому что по теореме 1.1.9 если T ′ противоречива, то в ней
вместе с утверждением о непротиворечивости T становится выводимым и утверждение о противо-
речивости T (и таким образом, теорема «в T ′ выводится непротиворечивость T » обесценивается
противоположной теоремой «в T ′ выводится противоречивость T »).
Это наблюдение имеет важное следствие для математической логики и всей математики. Из
невозможности доказать непротиворечивость теорий, лежащих в основаниях математики, в част-
ности, какой-нибудь аксиоматической теории множеств, эту непротиворечивость приходится пред-
полагать. Это означает, что все утверждения в той части математики, где используется тео-
рия множеств (то есть, фактически везде, или, если быть точным, везде вне некоторых совсем
узких разделов логики), формулируются с дополнительным предположением, что используемый
рабочий вариант теории множеств (в нашем случае это теория Морса-Келли MK) непротиво-
речив. Математики почти никогда не следуют этому правилу формально (то есть нигде в форму-
лировках не говорят явно “мы предполагаем, что теория множеств непротивроречива”), однако это
всюду предполагается по умолчанию.11 Мы в этом параграфе будем эту фразу произносить, чтобы
она отпечаталсь у читателя в сознании (в частности, это будет вставленно в формулировки теорем
1.1.19 и 1.1.20 ниже), однако в дальнейшем мы об этом также забудем и вспоминать не будем.
10 P.
Smith. An intoduction to Gödel’s theorems. Cambridge University Press. 2007.
11 Правильнее было бы сказать “те математики, кто продумывал эти детали, считают это предполагающимся по
умолчанию”, потому что большая часть из них об этих вещах не задумывается.
102 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
— каждую подформулу
∃x α (1.1.85)
нужно заменить на подформулу
∃x x ∈ U & (α) (1.1.86)
A6B ⇔ A ⊆ B. — невыводимо.
Теорема Генкина. У теоремы 1.1.19 (iii) имеется обращение, которое чаще всего называют од-
ним из вариантов теоремы Гёделя о полноте. Чтобы не путать его с приводимой ниже теоремой о
семантизации 1.1.22, которую также обычно называют теоремой Гёделя о полноте, мы будем на-
зывать его теоремой Генкина12 , по имени человека, выделившего этот результат в первоначальных
рассуждениях Гёделя и приведшего относительно простое его доказательство.
Теорема 1.1.21. Если формальная теория S непротиворечива, то у нее существует модель в
теории MK.13
(d) Семантика
Для всякой формальной теории S ее модели представляют собой объекты теории MK, и при опре-
деленной предварительной работе по уточнению нужных терминов, можно говорить о классе ModS
всех моделей теории S в MK. Этот класс ModS порождает некую новую формальную теорию S ∗ ,
дефинициальное расширение теории MK, которая называется семантизацией теории S. Оказыва-
ется, что эта теория S ∗ эквивалентна теории S в том смысле, что данная формула ϕ выводима в S
тогда и только тогда, когда соответствующая ей по определенным правилам формула ϕ∗ выводима
12 Леон Генкин (1921-2006) — американский математик.
13 Доказательство этого факта приводится в различных учебниках по математической логике, см. например,
C.C.Leary, L.Kristiansen, A friendly introduction to mathematical logic, NY, 2015 (с. 75). См. также P.T.Johnstone,
Notes on logic and set theory, 1987 (Theorem 3.7).
104 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
в S ∗ . Этот результат принято называть теоремой Гёделя о полноте (ниже мы его приводим в виде
теорем 1.1.22 и 1.1.23 для случаев конечной и бесконечной систем аксиом, которые мы называем
теоремами о семантизации), и его ценность в том, что он позволяет свести изучение формаль-
ных теорий к изучению дефинициальных расширений теории множеств MK. Это в свою очередь
позволяет математикам (по крайней мере, тем, кто не специализируется в математической логике)
вообще забыть о формальных теориях, описывая все необходимые конструкции языком рабочей
теории множеств (и выводя все нужные результаты внутри этой теории множеств).
Семантизация конечно аксиоматизируемой теории. Для случая, когда теория S имеет ко-
нечную систему аксиом, класс ModS ее моделей определяется относительно просто, и сейчас мы
опишем эту конструкцию. Она состоит из четырех частей.
1. Прежде всего, нужно расширить сигнатуру Σ теории S. Выберем какой-нибудь символ,
не лежащий в Σ, например, пусть таким символом будет ♯. Дополним сигнатуру Σ этим
символом: пусть Σ♯ обозначает сигнатуру Σ с добавленным символом ♯.
2. Затем нужно превратить расширенную сигнатуру Σ♯ в объект теории Морса-Келли.
Это можно сделать, просто пронумеровав элементы Σ♯ . Поскольку Σ♯ — конечный на-
бор символов, нам для этого понадобится конечный набор чисел. Когда мы занумеруем
элементы Σ♯ , мы установим взаимно однозначное соответствие между Σ♯ и некоторым
натуральным числом n = {0, 1, ..., n − 1}. После этого можно будет забыть о символах Σ♯ ,
заменяя их номерами из n = {0, 1, ..., n − 1}, и это позволит считать Σ♯ (а также его эле-
менты) объектом теории MK, или, точнее, конечным множеством. Когда это уложилось
в сознании, удобно сделать шаг назад: поскольку неважно, какими символами мы обо-
значаем элементы сингатуры Σ♯ , можно дальше забыть о нумерации, и с самого начала
относиться к Σ♯ как к объекту теории MK, точнее, как к конечному множеству.
3. Затем строится класс StrS так называемых реляционных структур, или просто структур
теории S: объект P теории MK (то есть класс) считается элементом класса StrS (и на-
зывается реляционной структурой или просто структурой), если он представляет собой
семейство {η ′ ; η ∈ Σ♯ } (отображение η ∈ Σ♯ 7→ η ′ ∈ Set) со следующими свойствами:
— множество P♯ непусто,
— для всякого предикатного символа η валентности n из сигнатуры Σ справедливо
вложение η ′ ⊆ (P♯ )n ,
— для всякого функционального символа η валентности n из сигнатуры Σ множе-
ство η ′ представляет собой отображение η ′ : (P♯ )n → P♯ .
4. На последнем этапе в классе StrS реляционных структур выделается подкласс ModS , со-
стоящий из моделей теории S: структура {η ′ ; η ∈ Σ} принадлежит классу ModS , если она
представляет собой модель теории S с универсумом P♯ в смысле определения на с.102.
Как это делается, удобнее понять на примерах 1.1.18-1.1.19, которые мы приводим ниже.
Важно, что здесь существенно используется, что система аксиом теории S конечна:
именно поэтому можно выстроить требования, выделяющие класс ModS в виде конеч-
ной цепочки символов, то есть определить класс ModS формулой языка MK.14
• В результате мы получаем класс ModS моделей теории S, определенный формулой языка
теории MK. К нему можно относиться как к присоединенному функциональному символу
валентности 0, тогда теория MK с этим присоединенным символом превращается в дефи-
нициальное расширение S ∗ теории MK. Теория S ∗ называется семантизацией формальной
теории S в теории MK.
! 1.1.17. Понятно, что семантизация ModS всякой формальной теории S является также формаль-
ной теорией.
14 Если система аксиом бесконечна (как, например, в самой теории MK), то такое описание класса Mod становится
S
бесконечно длинным (потому что у нас нет возможности применять кванторы по системе аксиом), и поэтому это
описание перестает быть формулой MK. Как разрешается эта проблема в случае бесконечной системы аксиом мы
поговорим на с.107.
§ 1. Логика предикатов для общей формальной теории 105
⋄ 1.1.18. Семантизация теории частичного по- ⋄ 1.1.19. Семантизация теории групп. В при-
рядка. Напомним, что в примере 1.1.3 мы опреде- мере 1.1.4 мы определили теорию групп как фор-
лили теорию частичного порядка как формаль- мальную теорию. Ее семантизацией в MK будет
ную теорию. Ее семантизацией в MK будет сле- следующая конструкция. Рассмотрим в MK фор-
дующая конструкция. Рассмотрим в MK форму- мулу, которая на человеческом языке описывает-
лу, которая на человеческом языке описывается ся словами “G является группой”, а на формаль-
словами “X является частично упорядоченным ном имеет вид
множеством с отношением порядка R”, а на фор-
мальном имеет вид
∃M ∃e ∃f
∃M ∃R X = (M, R) & R ⊆ M × M & G = (M, e, f ) & e ∈ M & f : M × M → M &
& ∀x x ∈ M ⇒ (x, x) ∈ R & & ∀x ∀y ∀z f ((x, y), z) = f (x, (y, z)) &
& ∀x ∀y (x, y) ∈ R & (y, x) ∈ R ⇒ x = y & & ∀x f (x, e) = x & f (e, x) = x &
& ∀x ∀y ∀z (x, y) ∈ R & (y, z) ∈ R ⇒ & ∀x ∃y f (x, y) = e & f (y, x) = e (1.1.92)
(x, z) ∈ R (1.1.90)
Эта формула, обозначим ее η, имеет только одну
Эта формула, обозначим ее η, имеет только одну
свободную переменную, G, и поэтому ею опреде-
свободную переменную, X, и поэтому ею опре-
ляется некий внешний предикатный символ ва-
деляется некий внешний предикатный символ
лентности 1, в качестве него можно взять букву
валентности 1, в качестве него можно взять η.
η. Определение η можно переписать так:
Определение η можно переписать так:
η(X) ⇐⇒
η(G) ⇐⇒
∃M ∃R X = (M, R) & R ⊆ M × M &
∃M ∃e ∃f G = (M, e, f ) &
& ∀x x ∈ M ⇒ (x, x) ∈ R & & e∈M & f :M ×M →M &
& ∀x ∀y (x, y) ∈ R & (y, x) ∈ R ⇒ x = y & & ∀x ∀y ∀z f ((x, y), z) = f (x, (y, z)) &
& ∀x ∀y ∀z (x, y) ∈ R & (y, z) ∈ R ⇒ & ∀x f (x, e) = x & f (e, x) = x &
(x, z) ∈ R (1.1.91) & ∀x ∃y f (x, y) = e & f (y, x) = e (1.1.93)
• По аналогии с тем, как это делалось на с.102, каждой формуле ϕ теории S поставим в
соответствие формулу ϕ∗ теории S ∗ по следующим правилам:
— каждый предикатный символ η, примененный к переменным x1 , ..., xn , в ϕ нужно за-
менить на формулу (x1 , ..., xn ) ∈ η ′ ,
— каждый функциональный символ η в ϕ нужно заменить на соответствующий символ
η′ ,
— если в ϕ есть свободная переменная x, то заменяем ϕ на формулу
x ∈ P♯ ⇒ (ϕ) (1.1.94)
(это нужно проделать последовательно со всеми свободными переменными в ϕ и оста-
новиться),
— каждую подформулу
∀x α (1.1.95)
нужно заменить на подформулу
∀x x ∈ P♯ ⇒ (α) (1.1.96)
106 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
— каждую подформулу
∃x α (1.1.97)
нужно заменить на подформулу
∃x x ∈ P♯ & (α) (1.1.98)
порядка из примера 1.1.3 понятие гомоморфизма на формальной теории групп из примера 1.1.4,
определить невозможно). потому что, например, понятие гомоморфизма
групп можно определить только в семантизации
⋄ 1.1.23. Точно так же описанная в примере этой теории (но не в самой формальной теории
1.1.19 семантизация теории групп не эквивалент- групп).
— для всякого ϕ ∈ FormS строка (¬, ϕ), смысл которой — формула ¬ ϕ — также объяв-
ляется элементом FormS ,
— для любых двух элементов ϕ, ψ ∈ FormS строки
кодирующие формулы
∀α (ϕ), ∃α (ϕ).
— также считаются элементами FormS .
8. Важным элементом этой картины должно быть то, что в классе FormS формул теории S
выделяется подкласс AxS аксиом. То есть должна строиться формула в теории MK, вы-
деляющая AxS в FormS . Как пример, AxS может выделяться каким-нибудь индуктивным
правилом.
9. Далее определяется так называемый предикат истинности теории S. Это отображение
TrueS , которое каждой структуре P ∈ StrS , каждой формуле ϕ ∈ FormS и каждому отоб-
ражению f : A → P♯ , называемому оценкой, ставит в соответствие конечный ординал16 0
или 1 по следующим индуктивным правилам:
— если τ1 , ..., τn – термы, α – предикатный символ (возможно, равенство) валентно-
сти n, то для формулы ϕ = (α, τ1 , ..., τn ) со свободными переменными x1 , ..., xk , и
оценки f : A → P♯ значение TrueS (P, ϕ, f ) равно 1, если строка (f (x1 ), ..., f (xk ))
принадлежит множеству
AP,α = {z : ∃y1 ... ∃yk z = (y1 , ..., yk ) Pα (τ1 (y1 , ..., yk ), ..., τn (y1 , ..., yk ))}
16 Напомним, что ординалы 0 = ∅ и 1 = {∅} были определены выше формулами (0.3.279) и (0.3.280), а в свойстве
10. На последнем этапе в классе StrS реляционных структур выделяется подкласс ModS , со-
стоящий из моделей теории S. Под моделью теории S понимается реляционная структура
P ∈ StrS , у которой на всякой аксиоме ϕ теории S при любой оценке f : A → P♯ предикат
истинности имеет значение 1:
Семантические теории. Мы уже говорили выше, что теоремы о семантизации 1.1.22 и 1.1.23
позволяют математикам свести изучение общих формальных теорий к изучению дефинициальных
расширений теории множеств MK. Выработанная в теории множеств интуиция фактически позво-
ляет вообще забыть определение формальной теории (приведенное нами на с.79) и рассматривать
любую теорию как дефинициальное расширение рабочей теории множеств. По этой причине мы
для дальнейших построений вводим следующее определение.
• Семантической теорией мы будем называть произвольное дефинициальное расширение
теории множеств MK (или любой другой рабочей теории множеств). При этом аксиома-
ми семантической теории будут называться просто определения этого дефинициального
расширения (то есть новые формулы, добавленные в список аксиом теории MK).
110 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Понятно, что семантизация формальной теории будет семантической теорией, поэтому всякую
формальную теорию S можно по теореме 1.1.23 представить как семантическую (то есть подобрать
для S эквивалентную ей в смысле теоремы 1.1.23 семантическую теорию S ∗ ), а, с другой стороны,
всякая семантическая теория по замечанию 1.1.17 является и формальной. Эти две операции —
превращение формальной теории в семантическую и наоборот — не будут, конечно, взаимно об-
ратными, но все же переход по ним дает в некотором смысле эквивалентную теорию (на уровне
утверждений, формулируемых в теории S, но, конечно, не в обычном смысле, как мы уже говорили
перед примерами 1.1.22 и 1.1.23).
такое, что выполняются следующие условия, на- ⋄ 1.1.29. Теория евклидовых пространств, как се-
зываемые аксиомами общей топологии: мантическая теория, описывается на с.751.
∅ ∈ τ, (1.1.103) ⋄ 1.1.30. Теория инвариантной меры, как семан-
M ∈ τ, (1.1.104) тическая теория, описывается на с.884.
6-я проблема Гильберта. Вопрос о том, можно ли считать данную теорию формальной (или
семантической, что, как мы теперь понимаем, эквивалентно), полезно обсуждать не только в мате-
матике, но также и (по крайней мере) в тех науках, которые используют математику, но формально
не являются ее частью. Это приводит к любопытнейшим, совсем неочевидным (по крайней мере,
для неспециалиста по логике) и весьма поучительным выводам. Обсуждение удобно начать с упо-
минания о шестой проблеме Гильберта.
В 1900 году на II Математическом конгрессе Давид Гильберт предложил некий список перво-
очередных задач математики (так, как он их понимал), и среди них, между прочим, была такая:
аксиоматизировать физику.
Утверждается, что в момент своего выступления Гильберт сформулировал это как одну из 10 задач.
Позже он этот список расширил до 23-х, и в нем эта проблема получила номер 6. С тех пор она
называется 6-й проблемой Гильберта.
Во времена, когда она была поставлена, математическая логика еще не оформилась в строгую
дисциплину, и, в частности, что следует понимать под аксиоматизацией, еще не было толком понят-
но. Очевидно, по этой причине до сих пор не существует единого мнения о том, насколько далеко
продвинулись математики в решении этой задачи. Мнения сходятся только в том, что даже при
самом нетребовательном понимании аксиоматизации, которое можно встретить среди далеких от
логики математиков (и, в больше мере, физиков), эту проблему нельзя считать решенной (хотя бы
потому что “единой физической теории” пока не построено).
§ 1. Логика предикатов для общей формальной теории 111
В свете того, что мы уже знаем про аксиоматические теории, задачу, поставленную Гильбер-
том, можно понимать либо как предписание построить формальную теорию (другими словами,
теорию 1 порядка), описывающую законы физики, и на уровне определений не связанную с теори-
ей множеств. Либо как семантическую теорию, то есть дефинициальное расширение какой-нибудь
рабочей теории множеств, например, теории MK. По теореме о семантизации 1.1.23 эти два решения
будут эквивалентны. С другой стороны, как показывают примеры на с.110, второе из них ближе к
традиции, и может считаться более удобным.
Как мы уже говорили, общей для всей физи- в том виде, как их описывают в нынешних учеб-
ки теории построить не удалось. Однако неко- никах по квантовой теории20 невозможно интер-
торые конкретные области этой науки можно претировать ни как аксиомы формальной тео-
считать аксиоматизированными, и именно в том рии (потому что никакая формальная теория в
смысле, что они описаны ныне как семантиче- этой науке не описывается), ни как определения
ские теории. Следующие примеры дают некото- в теории операторов на гильбертовом простран-
рое представление о прогрессе в этой области. стве, по крайней мере, если целью ставится вы-
вод каких-то утверждений о строении или свой-
⋄ 1.1.31. Классическая механика может считать-
ствах атомов, молекул или каких-то элементар-
ся в настоящее время аксиоматизированной, по-
ных частиц (потому что ни атомам, ни молеку-
скольку ее удалось описать как семантическую
лам, ни частицам определений в этой теории то-
теорию в современных вариантах Лагранжевой
же не дается).
и Гамильтоновой механики.17
Как следствие, например, таблица Д. И. Мен-
⋄ 1.1.32. Теория относительности также может делеева, которая, казалось бы, должна быть пер-
считаться аксиоматизированной, поскольку она вым и главным, о доказательстве чего следова-
описывается как семантическая теория, дефи- ло бы думать в квантовой механике, не является
нициальное расширение современной дифферен- теоремой этой науки. Почему, скажем, на первой
циальной геометрии18 (которая в свою очередь электронной оболочке может уместиться только
представляет собой дефинициальное расширение 2 электрона, на второй – 8, на третьей – опять
теории вещественных чисел19 ). 8, и т.д. – с точки зрения логики остается за-
гадкой (как и другие закономерности в строении
⋄ 1.1.33. Квантовую механику, по контрасту с атомов).
предыдущими примерами, к настоящему време-
ни нельзя считать аксиоматизированной, потому ⋄ 1.1.34. Теория вероятностей представляет со-
что ее пока не удалось описать ни как семантиче- бой показательный пример дисциплины, аксио-
скую теорию, ни тем более как теорию 1 поряд- матизация которой была найдена уже после до-
ка. Отношение нынешних специалистов к этой клада Гильберта. В 1933 году ее описание как
проблеме иллюстрирует разницу между матема- семантической теории (дефинициального расши-
тическим и физическим образованием: физики, рения теории меры) было дано А. Н. Колмого-
услышав такое, энергично протестуют, ссылаясь ровым.21 Физики не считают эту область своей,
на то, что они называют “постулатами Дирака- объявляя ее частью математики. Мне этот тезис
фон Неймана квантовой механики”. кажется спорным, из-за того, что трудно понять,
Одна из причин, почему мы подробно обсуж- не является ли он следствием общей для подоб-
дали понятия математической логики в этом па- ных ситуаций закономерности: как только наука
раграфе, состояла как раз в том, чтобы дать получает строгую математическую интерпрета-
читателю возможность проверить детали в по- цию, она сразу становится частью математики,
добных спорах. Поглядев на рассуждения фи- независимо от того, к какой области ее относили
зиков на эту тему, читатель теперь может сам до этого. По этой причине я привожу этот при-
убедиться, что постулаты Дирака-фон Неймана мер в списке физических теорий.
Русский перевод: А. Н. Колмогоров. Основные понятия теории вероятностей. — М.: Наука, 1974.
112 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
¬α, α & β, α ∨ β, α ⇒ β, α ⇔ β
LKp-0: ϕ ⊢ ϕ. (1.2.107)
— добавление в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
LKp-6: (1.2.113)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— объединение в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
LKp-7: (1.2.114)
ϕ ∨ χ, Γ ⊢ ∆
— добавление в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
LKp-8: (1.2.115)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— объединение с импликацией:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
LKp-9: (1.2.116)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
LKp-10: (1.2.117)
Γ ⊢ ∆, ϕ ⇒ χ
B) Исчисление высказываний CQCp получается из CQC тем же приемом.
• Аксиомами исчисления CQCp называются следующие формулы:
CQCp − 1 : ϕ ⇒ (χ ⇒ ϕ) (1.2.118)
CQCp − 2 : (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (1.2.119)
CQCp − 3 : (ϕ & χ) ⇒ ϕ (1.2.120)
CQCp − 4 : (ϕ & χ) ⇒ χ (1.2.121)
CQCp − 5 : ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (1.2.122)
CQCp − 6 : ϕ ⇒ (ϕ ∨ χ) (1.2.123)
CQCp − 7 : χ ⇒ (ϕ ∨ χ) (1.2.124)
CQCp − 8 : (ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (1.2.125)
CQCp − 9 : (¬ϕ) ⇒ (ϕ ⇒ χ) (1.2.126)
CQCp − 10 : (ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (1.2.127)
CQCp − 11 : ϕ ∨ (¬ϕ) (1.2.128)
• Правилом вывода в исчислении CQCp считается
modus ponens: если выводимы формулы ϕ и ϕ ⇒ ψ, то выводима формула ψ; это изображается
дробью
ϕ, ϕ ⇒ ψ
(1.2.129)
ψ
C) Исчисление высказываний G3cp получается из G3c так же.
Напомними, что в языке этой системы добавляются два символа: символ ⊥, означающий “аб-
страктную ложь”, и символ ⊤, означающий “абстрактную истину”. Кроме того, отрицание ¬α пони-
мается как сокращение для формулы α ⇒ ⊥, а эквивалентность α ⇔ β как сокращение формулы
(α ⇒ β) & (β ⇒ α).
• Аксиомами исчисления G3cp считаются следующие три вида секвенций:
Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (1.2.130)
• Правила вывода в исчислении G3cp такие:
Γ, ϕ, χ ⊢ ∆ Γ ⊢ ϕ, ∆ Γ ⊢ χ, ∆
(1.2.131)
Γ, ϕ & χ ⊢ ∆ Γ ⊢ ϕ & χ, ∆
Γ, ϕ ⊢ ∆ Γ, χ ⊢ ∆ Γ ⊢ ϕ, χ, ∆
(1.2.132)
Γ, ϕ ∨ χ ⊢ ∆ Γ ⊢ ϕ ∨ χ, ∆
Γ ⊢ ϕ, ∆ Γ, χ ⊢ ∆ Γ, ϕ ⊢ χ, ∆
(1.2.133)
Γ, ϕ ⇒ χ ⊢ ∆ Γ ⊢ ϕ ⇒ χ, ∆
114 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
f (α) = α
§ 2. Другие логические системы 115
(на переменную α здесь нужно глядеть как на элемент множества {0, 1}),
2) для формулы
¬α
соответствующая функция истинности f : {0, 1} → {0, 1} обозначается тем же символом
¬ и определяется равенством
(
1, α = 0
f (α) = ¬α =
0, α = 1
3) для формулы
α&β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
& и определяется равенством
(
1, α = 1 и β = 1
f (α, β) = α & β =
0, иначе
4) для формулы
α∨β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
∨ и определяется равенством
(
0, α = 0 и β = 0
f (α, β) = α ∨ β =
1, иначе
5) для формулы
α⇒β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇒ и определяется равенством
(
0, α = 1 и β = 0
f (α, β) = α ⇒ β =
1, иначе
6) для формулы
α⇔β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇔ и определяется равенством
(
1, (α = 1 и β = 1) или (α = 0 и β = 0)
f (α, β) = α ⇔ β = .
0, иначе
(α ∨ β) ⇒ γ (1.2.134) f (1, 0, 0) = (1 ∨ 0) ⇒ 0 = 1 ⇒ 0 = 0.
(α ⇒ β) ⇒ (α ⇒ γ) β = 1, α = 1,
— сокращение:
ϕ, ϕ, Γ ⊢ ω
LJ-2: (1.2.136)
ϕ, Γ ⊢ ω
— перестановка:
ϕ, χ, ψ, Γ ⊢ ω
LJ-3: (1.2.137)
ϕ, ψ, χ, Γ ⊢ ω
— сечение:
Γ ⊢ ϕ ϕ, Π ⊢ ω
LJ-4: (1.2.138)
Γ, Π ⊢ ω
Γ ⊢ϕ ϕ, Γ ⊢
LJ-5: (1.2.139)
¬ ϕ, Γ ⊢ Γ ⊢ ¬ϕ
— конъюнкция в сукцеденте:
Γ ⊢ϕ Γ ⊢χ
LJ-6: (1.2.140)
Γ ⊢ ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ω ϕ, Γ ⊢ ω
LJ-7: (1.2.141)
ϕ &χ, Γ ⊢ ω χ &ϕ, Γ ⊢ ω
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ω χ, Γ ⊢ ω
LJ-8: (1.2.142)
ϕ ∨ χ, Γ ⊢ ω
— добавление в сукцеденте:
Γ ⊢ϕ Γ ⊢ϕ
LJ-9: (1.2.143)
Γ ⊢ϕ∨χ Γ ⊢χ∨ϕ
Γ ⊢ ϕ χ, Π ⊢ ω
LJ-10: (1.2.144)
ϕ ⇒ χ, Γ, Π ⊢ ω
ϕ, Γ ⊢ χ
LJ-11: (1.2.145)
Γ ⊢ϕ⇒χ
ϕ x=τ , Γ ⊢ ω
LJ-12:∗ (1.2.146)
∀x ϕ, Γ ⊢ ω
Γ ⊢ϕ x=y
LJ-13: (1.2.147)
Γ ⊢ ∀x ϕ
24 Определение корректной подстановки дано на с. 8.
118 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА
⋄ 1.2.10. Вспомним закон исключенного тре- Первое из них можно превратить в вывод, если
тьего, о котором мы говорили в примере 0.2.26, подклеить к нему сверху вывод секвенции
и который в исчислении LK представляет собой
утверждение о выводимости секвенции
⊢α
⊢ α ∨ ¬α. (1.2.150)
По контрасту с LK, в исчислении LJ эта секвен- (а для этого нужно, чтобы такой вывод суще-
ция не выводима (и это одна из причин, почему ствовал), а второе точно так же можно превра-
считается, что исчисление LJ формализует инту- тить в вывод, если подклеить к нему сверху вы-
иционистскую логику). вод секвенции
Во-первых, нужно заметить, что рассужде-
ние, использовавшееся в примере 0.2.26, здесь ⊢ ¬α
не проходит, потому что там сукцедент состо-
ял из двух формул, а в LJ такое запрещено. А,
во-вторых, среди правил вывода LJ-1—LJ-15 есть (а для этого нужно, чтобы такой вывод суще-
только одно, содержащее логическую связку ∨ ствовал). Но если ни одна из этих секвенций не
в сукцеденте, а именно, LJ-926 , и если с его по- выводима (например, если формула α атомарна,
мощью пытаться достроить дерево вверх, то мы и ни α, ни ¬α не входят в систему аксиом), то ни
получим либо дерево (1.2.151), ни (1.2.152) в вывод не превратишь.
— перестановка:
ϕ, χ, ψ, Γ ⊢ ω
LJp-3: (1.2.155)
ϕ, ψ, χ, Γ ⊢ ω
— переброс отрицания:
Γ ⊢ϕ ϕ, Γ ⊢
LJp-4: (1.2.156)
¬ ϕ, Γ ⊢ Γ ⊢ ¬ϕ
— пересечение сукцедентов:
Γ ⊢ϕ Γ ⊢χ
LJp-5: (1.2.157)
Γ ⊢ ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ω ϕ, Γ ⊢ ω
LJp-6: (1.2.158)
ϕ &χ, Γ ⊢ ω χ &ϕ, Γ ⊢ ω
— объединение в антецеденте:
ϕ, Γ ⊢ ω χ, Γ ⊢ ω
LJp-7: (1.2.159)
ϕ ∨ χ, Γ ⊢ ω
— добавление в сукцеденте:
Γ ⊢ϕ Γ ⊢ϕ
LJp-8: (1.2.160)
Γ ⊢ϕ∨χ Γ ⊢χ∨ϕ
— объединение с импликацией:
Γ ⊢ ϕ χ, Π ⊢ ω
LJp-9: (1.2.161)
ϕ ⇒ χ, Γ, Π ⊢ ω
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ χ
LJp-10: (1.2.162)
Γ ⊢ϕ⇒χ
Часть II
ФУНКЦИИ ОДНОЙ
ВЕЩЕСТВЕННОЙ ПЕРЕМЕННОЙ
120
Глава 2
ВЕЩЕСТВЕННЫЕ ЧИСЛА
Понятие вещественного числа является естественным развитием идеи измерения по эталону, ухо-
дящей корнями в глубокую древность и опирающейся на следующие два фундаментальных допу-
щения.
1. Первое из них — возможность сравнивать с эталоном — заключается в том, что среди значений
физической величины можно выбирать эталонные, то есть такие, которыми можно (в целых
числах) оценивать все остальные значения этой величины. Например, имея эталон длины – метр
– можно длину x любого физического тела оценивать в метрах (то есть найти, сколько метров
в этой длине укладывается, а сколько – нет):
k 6 x < k + 1.
При этом важно, что организовать методы измерения можно так, чтобы результаты не зависели
от попыток.
2. Второе же — возможность измельчения эталона — предполагает, что любой эталон можно де-
лить на равные части (точнее, на произвольное фиксированное число равных частей), которые
также можно принимать за эталоны. Из этого принципа следует, что мы можем поделить наш
исходный эталон длины, скажем, на 10 равных частей, принять их длины за новые эталоны, и
после этого поглядеть, не войдут ли в оставшуюся часть длины x − k (куда уже не входит наш
исходный эталон) новые, меньшие эталоны:
l l+1
6x−k < .
10 10
Так мы получим уже оценку в десятых долях эталона (то есть можно будет сказать, сколько
десятых долей эталона укладывается в величине, которую мы измеряем):
l l+1
k+ 6x<k+
10 10
Поскольку (согласно второму допущению) измельчать эталон можно сколь угодно долго, мы
получаем, что физическую величину x можно оценивать сверху и снизу рациональными числами
(количеством долей эталона)
m m+1
6x< ,
n n
причем с любой точностью (то есть так, чтобы числа m m+1
n и n отличались друг от друга как угодно
мало). В этом состоит применяемый в естествознании алгоритм измерения физической величины по
эталону, и интерпретировать его удобнее всего, как приближение к некоему идеальному значению,
изначально имеющемуся у данной измеряемой величины x.
Разумеется, не всякая физическая величина допускает измерение по эталону так, как мы это
описали. Например, у векторных величин (таких, как скорость или сила) оценивать при измерении
необходимо не одну, а сразу несколько числовых характеристик (скажем, проекции данной величи-
ны на заранее выбранные координатные оси), а у целочисленных величин (таких, как количество
однотипных предметов в данном объеме пространства) допущение о делимости эталонов не будет
справедливым. Более того, развитие физики показало, что даже для величин, измерение которых
традиционно организуется именно сравнением с эталоном (таких как длина, масса или объем), де-
ление эталона тоже не может быть бесконечным, потому что, когда Вы доходите до планковских
121
122 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
размеров, дальнейшее деление утрачивает смысл (то есть попросту становится непонятно, что зна-
чит делить дальше).
Тем не менее, вера в эти принципы (или, точнее сказать, невозможность на данном этапе разви-
тия науки заменить их чем-то более эффективным) приводит к тому, что физическая величина пред-
ставляется такой, что ее можно с любой точностью оценивать рациональными числами в эталонных
единицах измерения. Само по себе это еще не означает, что значения физической величины долж-
ны непременно описываться вещественными числами, какими их изображают в математическом
анализе (дело в том, что в математике имеются альтернативные теории, например, «нестандарт-
ный анализ», где числа описываются иначе). Но при некоторых дополнительных предположениях,
в частности, что величины могут быть отрицательными, и что в качестве эталона можно выбирать
любое ненулевое значение физической величины, математическая теория, формализующая идею
измерения по эталону, оказывается единственной, и ее аксиоматика выглядит следующим образом.
Аксиомы теории вещественных чисел. Под моделью вещественных чисел, понимается произ-
вольная шестерка3 (R, 0, 1, +, ·, 6), в которой R — некое множество, элементы которого называются
вещественными числами, 0 и 1 — его элементы, + и · — отображения R × R → R, называемые со-
ответственно сложением и умножением, а 6 — бинарное отношение, называемая порядком, такие
что выполняются следующие две группы требований I и II.
a+b=b+a (2.1.1)
1 Что такое формальная теория мы объясним на с.79.
2 Понятие дефинициального расширения было введено на с.89.
3 Понятие шестерки (строки длины 6) было введено на с.73.
§ 1. Вещественные числа и числовые множества 123
(a + b) + c = a + (b + c) (2.1.2)
a·b=b·a (2.1.3)
(a · b) · c = a · (b · c) (2.1.4)
(a + b) · c = a · c + b · c (2.1.5)
a+0=a (2.1.6)
A7. Существование противоположного числа: для любого числа a существует такое чис-
ло −a (называемое противоположным числом к числу a) что
a + (−a) = 0 (2.1.7)
A8. Существование единицы: существует число 1 6= 0 такое, что для любого числа a 6= 0
справедливо равенство
a·1=a (2.1.8)
A9. Существование обратного числа: для любого числа a 6= 0 существует такое число a−1
(называемое обратным числом к числу a), что
a · a−1 = 1 (2.1.9)
⋄ 2.1.1. Дедекиндовы сечения. Из теорем 2.1.18 является моделью вещественных чисел. Из это-
и 2.1.19 следует, что множество всех дедекиндо- го примера видно, что класс всех моделей веще-
вых сечений множества Q рациональных чисел ственных чисел непуст.
124 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
Из аксиом A1 - A16 следуют все остальные свойства вещественных чисел (и, в частности, все
теоремы математического анализа).
Помимо отношения «меньше, либо равно» a 6 b на множестве вещественных чисел R вводятся
еще три отношения, а именно,
– «меньше» a < b, означающее, что a 6 b и одновременно a 6= b;
– «больше, либо равно» a > b означающее, что b 6 a;
– «больше» a > b, означающее, что b 6 a и одновременно b 6= a.
Из аксиомы линейности A13 следует, что множество вещественных чисел R удобно изображать
в виде прямой, а сами вещественные числа – в виде точек на ней. Именно так и делают математики:
⇓
1 + (−1) = 0 ⊲ 2.1.12. Докажите следующие утверждения:
Полезно заметить, что одно и то же число можно определения для одного и того же символа были
определять по-разному. Например, 3, 4, 5 можно эквивалентны. Естественный (и самый распро-
иначе определить так: страненный) способ вводить новые обозначения
– так называемый последовательный, в котором
3 := (1 + 1) + 1, при определении нового обозначения использу-
4 := ((1 + 1) + 1) + 1, (2.1.40) ются обозначения, введенные ранее. Например,
5 := (((1 + 1) + 1) + 1) + 1 числа 3, 4, 5, 6, 7, 8, 9, 10 можно последователь-
но определить так:
Строго говоря, это будут другие определения,
потому что записи в (2.1.39) и (2.1.40) не одина- 3 := 2 + 1, 4 := 3 + 1,
ковы (с точки зрения языка, последовательность 5 := 4 + 1, 6 := 5 + 1,
символов 1 + (1 + 1) — совсем не то же самое, что
7 := 6 + 1, 8 := 7 + 1,
последовательность символов (1 + 1) + 1).
Тем не менее, определения (2.1.39) и (2.1.40) 9 := 8 + 1, 10 := 9 + 1
эквивалентны, потому что из аксиом A1 – A16
можно логическими средствами вывести, что Числа вида −a. Когда определены числа
числа, определяемые формулами (2.1.39) — те 1,...,10, их противоположные числа −1,...,−10
же самые, что числа, определяемые формулами определять уже не нужно, поскольку они авто-
(2.1.40). Действительно, эквивалентность опре- матически определяются аксиомой A7 о суще-
делений для числа 3 получается подстановкой в ствовании противоположного числа (дело в том,
тождество из аксиомы A2 вместо a, b, c, символа что, как мы отмечали в упражнении 2.1.3, из ак-
1: сиомы A7 и других аксиом следует, что противо-
положное число определяется единственным об-
разом).
(1 + 1) + 1 = (a + b) + c a = 1 = (A2) =
Вообще, всякий раз, когда мы дали собствен-
b=1
c=1
ное обозначение a какому-нибудь числу, аксиома
A7 определяет его противоположное число и да-
= a + (b + c) = 1 + (1 + 1) ет ему собственное обозначение −a.
a=1
b=1
c=1 Числа вида a−1 . Точно также, всякий раз, ко-
гда мы даем собственное обозначение a какому-
(символ | означает подстановку, а фрагмент =
нибудь числу (a 6= 0), аксиома A9 дает собствен-
(A2) = есть ссылка на аксиому A2, применяемую
ное обозначение обратному числу a−1 . В частно-
в этот момент). Эту запись можно сократить так:
сти, обратные числа к 2, ..., 10 имеют собствен-
(1 + 1) + 1 = (A2) = 1 + (1 + 1) ные обозначения 2−1 ,...,10−1 .
Множество неотрицательных целых чисел Z∗+ . Напомним, что множество FinOrd конеч-
ных ординалов было определено на с.61. С этого момента удобно присвоить ему новое название,
множество неотрицательных целых чисел, и новое обозначение,
Его элементы (конечные ординалы) мы далее будем называть неотрицательными целыми числами.
Теорема 2.1.1. Существует единственное отображение (m, n) ∈ Z∗+ × Z∗+ 7→ m + n ∈ Z∗+ со
следующими свойствами:
И, во-вторых, (2.1.46):
Покажем, что
m + n = m ⊕ n. (2.1.52)
Зафиксируем m ∈ Z∗+ и проведем индукциею по n ∈ Z∗+ . При n = 0 мы получим
m + 0 = (2.1.45) = m = (2.1.50) = m ⊕ 0.
Предположим, что (2.1.52) верно при каком-то n ∈ Z∗+ . Тогда для S(n) мы получим:
2. В (2.1.54) правая часть есть тождество (2.1.45), поэтому нужно доказать только левую. Это
делается индукцией по n. Для n = 0 мы получаем
0 + 0 = (2.1.45) = 0.
0+n=n (2.1.58)
l + (m + 0) = (2.1.45) = l + m = (2.1.45) = (l + m) + 0.
l + (m + n) = (l + m) + n, (2.1.61)
0+m=0+n ⇒ m = n.
§ 1. Вещественные числа и числовые множества 129
l+m=l+n ⇒ m = n, (2.1.62)
2. Теперь предположим, что формула (2.1.66) доказана для всех Y мощности card Y = n:
X ∩ Y = ∅ & card(Y ) = n =⇒ card(X ∪ Y ) = card X + card Y. (2.1.68)
Покажем, что тогда она верна и для случая card Y = S(n). Пусть f : Y → S(n) – биекция. Рассмот-
рим элемент4
y = f −1 (n) ∈ Y.
Отображение f |Y \{y} будет биекцией между Y \ {y} и n, поэтому card(Y \ {y}) = n. Отсюда мы
получаем:
card(X ∪ Y ) = card (X ∪ {y}) ∪ ( Y \ {y} ) = (2.1.68) = card(X ∪ {y}) + card(Y \ {y}) =
| {z } | {z } | {z }
↑ k (2.1.67) k
card(Y \ {y}) = n card X + card{y} n
k
card X + 1
И, во-вторых, (2.1.70):
Покажем, что
m · n = m ⊙ n. (2.1.76)
Зафиксируем m ∈ Z∗+ и проведем индукциею по n ∈ Z∗+ . При n = 0 мы получим
m · 0 = (2.1.69) = 0 = (2.1.74) = m ⊙ 0.
Предположим, что (2.1.76) верно при каком-то n ∈ Z∗+ . Тогда для S(n) мы получим:
0 · n = 0 = n · 0, n ∈ Z∗+ (2.1.77)
1 · n = n = n · 1, n ∈ Z∗+ (2.1.78)
m · n = ·m, m, n ∈ Z∗+ (2.1.79)
l · (m · n) = (l · m) · n, l, m, n ∈ Z∗+ (2.1.80)
l · (m + n) = l · m + l · n, l, m, n ∈ Z∗+ (2.1.81)
§ 1. Вещественные числа и числовые множества 131
Доказательство. 1. В (2.1.77) правая часть есть тождество (2.1.69), поэтому нужно доказать только
левую. Это делается индукцией по n. Для n = 0 мы получаем
0 · 0 = (2.1.69) = 0.
Если же левая часть (2.1.77) верна для какого-то n ∈ Z∗+ ,
0·n=n (2.1.82)
то для S(n) мы получаем:
0 · S(n) = (2.1.70) = 0 · n + 0 = (2.1.82) = 0 + 0 = (2.1.45) = 0.
2. В (2.1.78) правая часть выводится из (2.1.70):
n · 1 = n · S(0) = (2.1.70) = n · 0 + n = (2.1.77) = 0 + n = (2.1.54) = n.
А левая часть доказывается индукцией по n. При n = 0 мы получаем
1 · 0 = (2.1.69) = 0.
Если левая часть (2.1.78) верна для какого-то n ∈ Z∗+ ,
1·n=n (2.1.83)
то для S(n) мы получаем:
1 · S(n) = (2.1.70) = 1 · n + 1 = (2.1.83) = n + 1 = (2.1.53) = S(n).
3. Свойство (2.1.79) доказывается двойной индукцией, внешей по m, и внутренней по n. При
m = 0 утверждение вытекает для всех n из (2.1.77):
∀n ∈ Z∗+ 0 · n = (2.1.77) = 0 = (2.1.77) = n · 0.
Предположим, что (2.1.79) верно для некоторого m при всех n:
∀n ∈ Z∗+ m · n = n · m. (2.1.84)
Тогда для S(m) оно доказывается индукцией по n. При n = 0 мы получаем
S(m) · 0 = (2.1.77) = 0 = (2.1.77) = 0 · S(m).
Если же это верно для какого-то n,
S(m) · n = n · S(m) (2.1.85)
то для S(n) мы получаем:
S(m) · S(n) = (2.1.70) = S(m) · n + S(m) = (2.1.85) = n · S(m) + S(m) = (2.1.70) = (n · m + n) + S(m) =
= (2.1.53) = (n · m + n) + (m + 1) = (2.1.56) = ((n · m + n) + m) + 1 = (2.1.56) = ((n · m + (n + m)) + 1 =
= (2.1.55) = ((n · m + (m + n)) + 1 = (2.1.56) = ((n · m + m) + n) + 1 = (2.1.84) = ((m · n + m) + n) + 1 =
= (2.1.70) = (m · S(n) + n) + 1 = (2.1.56) = m · S(n) + (n + 1) = (2.1.53) = m · S(n) + S(n) = (2.1.84) =
= S(n) · m + S(n) = (2.1.70) = S(n) · S(m).
4. После того, как доказано (2.1.79), свойство (2.1.81) можно переписать в виде
(m + n) · l = m · l + n · l, (2.1.86)
и доказать это индукцией по l. При l = 0 мы получим
(m + n) · 0 = (2.1.74) = 0 = (2.1.45) = 0 + 0 = (2.1.74) = m · 0 + n · 0.
Предположим, что (2.1.86) верно для некоторого l. Тогда для S(l) мы получим
Рассмотрим случай card Y = S(n). Пусть f : Y → S(n) = n ∪ {n}. Обозначим y = f −1 (n). Тогда
f |Y \{y} : Y → n будет биекция, и поэтому card(Y \ {y}) = n. С другой стороны, отобюражение
A ∈ X 7→ (A, y) ∈ X × {y} также будет биекцией. Поэтому
card(X × Y ) = card X × (Y \ {y}) ∪ (X × {y}) = card X × (Y \ {y}) + card(X × {y}) =
| {z } | {z }
k (2.1.95) k
card X · n card X
Целые числа Z∗ . На странице 127 мы определили множество Z∗+ целых неотрицательных чисел
(как множество всех конечных ординалов FinOrd, определенное ранее), а в теоремах 2.1.1 и 2.1.3
мы описали операции + и · на нем. Рассмотрим декартово произведение Z∗+ × Z∗+ и введем на нем
следующее отношение:
(n, m) ∼ (n′ , m′ ) ⇔ n + m′ = n′ + m. (2.1.96)
(2.1.96)
(n, m) ∼ (n, m) ⇒ n+m=n+m
Транзитивность:
Для всякого элемента (n, m) ∈ Z∗+ × Z∗+ обозначим символом [(n, m)] класс эквивалентности, кото-
рому принадлежит (n, m):
(n, m) ∈ [(n, m)] ∈ (Z∗+ × Z∗+ )/ ∼ .
Тогда на множестве Z∗ можно определить отношение порядка
0 + p = p = p + 0, p ∈ Z∗ (2.1.101)
∗
p + q = q + p, p, q ∈ Z (2.1.102)
p + (q + r) = (p + q) + r, p, q, r ∈ Z∗ (2.1.103)
0 · p = 0 = p · 0, p ∈ Z∗ (2.1.104)
1 · p = p = p · 1, p ∈ Z∗ (2.1.105)
p · q = q · p, p, q ∈ Z∗ (2.1.106)
p · (q · r) = (p · q) · r, p, q, r ∈ Z∗ (2.1.107)
p · (q + r) = p · q + p · r, p, q, r ∈ Z∗ (2.1.108)
p · q = 0 ⇒ p = 0 ∨ q = 0, p, q ∈ Z∗ (2.1.109)
(p 6= 0 & p · q = p · r) ⇒ q = r, p, q, r ∈ Z∗ (2.1.110)
Рациональные числа Q∗ . После того, как построено множество Z∗ целых чисел, мы рассмотрим
декартово произведение Z∗ × (Z∗ \ {0}) и определяем на нем отношение
(2.1.111)
(p, q) ∼ (0, q ′ ) & (0, q ′ ) ∼ (p′′ , q ′′ ) ⇒ p · q ′ = 0 · q & 0 · q ′′ = p′′ · q ′ ⇒
|{z} | {z }
k k
0 0
(2.1.109) (2.1.111)
⇒ p = 0 & p′′ = 0 ⇒ p · q ′′ = 0 · q ′′ = 0 = 0 · q = p′′ · q ⇒ (p, q) ∼ (p′′ , q ′′ )
134 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
6=
6=
0 0
Для всякого элемента (p, q) ∈ Z∗ × (Z∗ \ {0}) обозначим символом [(p, q)] класс эквивалентности,
которому принадлежит (p, q):
(p, q) ∈ [(p, q)] ∈ Z∗ × (Z∗ \ {0}) / ∼ .
0 + a = a = a + 0, a ∈ Q∗ (2.1.116)
∗
a + b = b + a, a, b ∈ Q (2.1.117)
a + (b + c) = (a + b) + c, a, b, c ∈ Q∗ (2.1.118)
0 · a = 0 = a · 0, a ∈ Q∗ (2.1.119)
1 · a = a = a · 1, a ∈ Q∗ (2.1.120)
a · b = b · a, a, b ∈ Q∗ (2.1.121)
∗
a · (b · c) = (a · b) · c, a, b, c ∈ Q (2.1.122)
a · (b + c) = a · b + a · c, a, b, c ∈ Q∗ (2.1.123)
a · b = 0 ⇒ a = 0 ∨ b = 0, a, b ∈ Q∗ (2.1.124)
(a 6= 0 & a · b = a · c) ⇒ b = c, a, b, c ∈ Q∗ (2.1.125)
a 6 a, a ∈ Q∗ (2.1.126)
(a 6 b & b 6 a) ⇒ a = b, a, b ∈ Q∗ (2.1.127)
(a 6 b & b 6 c) ⇒ a 6 c, a, b, c ∈ Q∗ (2.1.128)
∀a ∀b (a 6 b ∨ b 6 a), a, b ∈ Q∗ (2.1.129)
(a < x & b < y) ⇒ a + x < b + y, a, b, x, y ∈ Q∗ (2.1.130)
(0 6 a & 0 6 b) ⇒ 0 6 a · b, a, b ∈ Q∗ (2.1.131)
(0 < a & 0 < b) ⇒ 0 < a · b, a, b ∈ Q∗ (2.1.132)
(0 < a < x & 0 < b < y) ⇒ 0 < a · b < x · y, a, b, x, y ∈ Q∗ (2.1.133)
(0 < a & x < y) ⇒ a · x < a · y, a, x, y ∈ Q∗ (2.1.134)
−1 ∗
0 < a < 1 ⇒ a > 1, a∈Q (2.1.135)
a < b ⇒ ∃x a < x < b, a, b, x ∈ Q∗ (2.1.136)
• Элементы n ∈ Z∗ принято отождествлять с элементами [(n, 1)] ∈ Q∗ :
n = [(n, 1)], n ∈ Z∗ . (2.1.137)
Теорема 2.1.7. Для любого x ∈ Q∗ найдется число n ∈ Z∗ такое что 0 < n и x < n.
§ 1. Вещественные числа и числовые множества 135
A ∩ A′ = ∅, A ∪ A′ = Q∗ (2.1.139)
⋄ 2.1.16. Для всякого элемента a ∈ Q∗ рассмот- ⋄ 2.1.17. Помимо сечений из примера 2.1.16 бы-
рим множества вают и другие. Например, можно рассмотреть
пару (A, A′ ), в которой
∗
(a) = {x ∈ Q : x < a} (2.1.142)
A = {x ∈ Q∗ : x < 0 ∨ x · x < 2}
и
(a)′ = {x ∈ Q∗ : a 6 x} (2.1.143)
и
Тогда пара (A, A ), в которой A = (a), A′ = (a)′ ,
′
A′ = {x ∈ Q∗ : 0 6 x & 2 6 x · x}
является является дедекиндовым сечением в Q∗ .
Такое сечение назвывается сечением, порожден- и это будет дедекиндово сечение, не порожденное
ным элементом a ∈ Q∗ . никаким элементом Q∗ .
Из (2.1.139) следует, что в дедекиндовом сечении (A, A′ ) левый элемент, A полностью определяет
правый, A′ :
A′ = Q∗ \ A.
Поэтому можно описывать дедекиндовы сечения свойствами левой компоненты:
Теорема 2.1.8. Множество A ⊆ Q∗ тогда и только тогда является первой компонентой неко-
торого дедекиндова сечения, когда оно удовлетворяет следующим свойствам:
(i) A непусто и не совпадает с Q∗ :
∅ 6= A 6= Q∗ , (2.1.144)
(ii) A замкнуто относительно переходов влево:
∀x ∀a x6a∈A =⇒ x ∈ A, (2.1.145)
∀x ∈ A ∃a ∈ A x<a (2.1.146)
С этого момента условимся под дедекиндовым сечением понимать его левую компоненту, то есть
произвольное множество A ⊆ Q∗ , удовлетворяющее условиям (i)—(iii) теоремы 2.1.8.
∀z ∀y z>y∈
/A =⇒ z∈
/ A, (2.1.147)
Пусть символ R∗ обозначает множество всех дедекиндовых сечений множества Q∗ (то есть,
в соответствии с нашим соглашением, множество всех подмножеств A ⊆ Q∗ , удовлетворяющих
условиям теоремы 2.1.8). Определим на R∗ отношение порядка
A 6= B & A <
6 B =⇒ B < A,
A 6= B & A <
6 B =⇒ A 6= B & ¬(A 6= B & A ⊆ B) =⇒ A 6= B & (A = B ∨ A ⊆
6 B) =⇒
=⇒ A ⊆ 6 B =⇒ A \ B 6= ∅ =⇒ ∃a ∈ A a |∈
/ B}
{z
⇓ (2.1.140)
∀b ∈ B b < a
| {z }
⇓ (2.1.145)
∀b ∈ B b ∈ A
⇓
B⊆A
| {z }
⇓
B⊂A
xn = b + q · n.
∀n ∈ N∗ xn = b + q · n ∈ A. (2.1.152)
∀n ∈ N∗ xn = b + q · n 6 y.
То есть
y−b
∀n ∈ N∗ n6 .
q
Это противоречит теореме 2.1.7. Значит, наше предположение (2.1.152) неверно, и выполняется
обратное:
∃n ∈ N∗ xn = b + q · n ∈
/ A. (2.1.153)
§ 1. Вещественные числа и числовые множества 137
Рассмотрим множество M = {n ∈ N∗ : b + q · n ∈
/ A} и пусть m – его минимальный элемент5 , то
есть
b+q·m−q ∈A & b+q·m∈ / A. (2.1.154)
Рассмотрим два случая.
1. Если b + q · m — не минимальный элемент множества Q∗ \ A, то есть существует x ∈ / A такой
что x < b + q · m, то мы полагаем a = b + q · m − q, r = b + q · m − x и тогда у нас получается:
a= b+q·m−q ∈ A & a + q − r = b + q · m − (b + q · m − x) = x ∈
/ A.
A + B = {a + b; a ∈ A, b ∈ B} (2.1.155)
A 6= ∅ & B 6= ∅ =⇒ ∃a ∈ A & ∃b ∈ B =⇒ ∃a + b ∈ A + B.
A 6= Q∗ & B 6= Q∗ =⇒ ∃x ∈ / A & ∃y ∈
/ B =⇒
=⇒ ∃x ∈ Q∗ (∀a ∈ A a < x) & ∃y ∈ Q∗ (∀b ∈ B b < y) =⇒
∗
=⇒ ∃x, y ∈ Q ∀a ∈ A ∀b ∈ B a+b<x+y =⇒ A + B 6= Q∗ .
A B
(0) < A & (0) < B =⇒ A · B = {x ∈ Q∗ : ∃a ∈ A ∃b ∈ B a > & b > 0 & x 6 a · b},
(2.1.157)
а после этого для остальных сечений:
(−A) · (−B), A < (0) & B < (0)
−((−A) · B), A < (0) < B
A·B = (2.1.158)
−(A · (−B)), B < (0) < A
(0), A = (0) ∨ B = (0)
Но из a ∈ A и x ∈
/ A следует
a < x.
А из b ∈ B и y ∈
/ B следует
b < y.
Добавив условия a > 0, b > 0, мы получим
c−1 − 1 = (z + 1) − 1 = z ∈
/A =⇒ c ∈ A−1 .
При этом,
z>0 =⇒ c = (z + 1)−1 > 0.
С другой стороны, из леммы 2.1.11 следует, что существует a ∈ A такой что a > 0. Воспользуемся
(2.1.136) м выберем x так, чтобы 0 < x1 < a. Тогда для всякого y > 0 мы получим
1 1
−y <a∈A =⇒ −y ∈A =⇒ / A−1
x∈ =⇒ A−1 6= ∅.
x x
2. Пусть x < b ∈ A−1 . Если x 6 0, то по формуле (2.1.162) мы сразу получаем, что x ∈ A−1 .
Поэтому для нас важен случай x > 0. Тогда возникает система импликаций
3. Пусть x ∈ A−1 . Снова рассмотрим два случая. Если x 6 0, то, по лемме 2.1.16, A−1 > 0,
поэтому по лемме 2.1.11 существует c ∈ A−1 такой что c > 0, и мы получаем x 6 0 < c ∈ A−1 . Если
же x > 0, то условие x ∈ A−1 означает, что существует y > 0 такой что x−1 − y ∈/ A. Это число y
можно при необходимости уменьшить, чтобы 0 < y < x−1 . Зафиксируем такой y и выберем a так,
чтобы
y
a−1 = x−1 − .
2
Тогда
y (2.1.147)
a−1 − = x−1 − y ∈ /A =⇒ a ∈ A−1 .
2
С другой стороны,
y
a−1 = x−1 − =⇒ a−1 < x−1
2
и
y y
0 < y < x−1 =⇒ a−1 = x−1 − > > 0 =⇒ a−1 > 0
2 2
и поэтому
0 < a−1 < x−1 =⇒ 0 < x < a.
A + (0) = A (2.1.165)
A + (−A) = (0) (2.1.166)
− (−A) = A (2.1.167)
− (A + B) = (−A) + (−B) (2.1.168)
A > (0) ⇐⇒ −A < (0) (2.1.169)
A < (0) ⇐⇒ −A > (0) (2.1.170)
A > (0) & B > (0) =⇒ A · B > (0) (2.1.171)
A < (0) < B =⇒ A · B < (0) (2.1.172)
A < (0) & B < (0) =⇒ A · B > (0) (2.1.173)
A 6 B =⇒ ∀C A+C 6B +C (2.1.174)
(−A) · B = −(A · B) (2.1.175)
A·B = B·A (2.1.176)
(A · B) · C = A · (B · C) (2.1.177)
A · (1) = A (2.1.178)
A · A−1 = (1), A 6= (0) (2.1.179)
(A + B) · C = A · C + B · C (2.1.180)
A + B = (2.1.155) = {a + b; a ∈ A, b ∈ B} = {b + a; a ∈ A, b ∈ B} = (2.1.155) = B + A.
2. Тождество (2.1.164):
(A + B) + C = {a + b; a ∈ A, b ∈ B} + C = {(a + b) + c; a ∈ A, b ∈ B, c ∈ C} =
= {a + (b + c); a ∈ A, b ∈ B, c ∈ C} = A + {b + c; b ∈ B, c ∈ C} = A + (B + C).
3. Тождество (2.1.165):
4. Тождество (2.1.166) доказывается так. Пусть сначала z ∈ A + (−A). Это значит, что z = a + x
для некоторых a ∈ A и x ∈ −A. Второе означает, что −x − y ∈ / A для некоторого y > 0. Поскольку
a ∈ A и −x − y ∈
/ A, мы получаем цепочку
Это доказывает включение A + (−A) ⊆ (0). Наоборот, пусть z ∈ (0), то есть z < 0. Воспользуемся
леммой 2.1.12 и выберем a ∈ A так, чтобы для некоторого r > 0 выполнялось
a−z−r ∈
/ A.
−x − r = a − z − r ∈
/A =⇒ x ∈ −A,
и, во-вторых,
z = a + x ∈ A + (−A).
Это доказывает включение (0) ⊆ A + (−A).
5. Тождество (2.1.168). Сначала система импликаций
z ∈ (−A) + (−B) =⇒ ∃x ∈ −A ∃y ∈ −B z = x + y =⇒
=⇒ ∃x ∃y ∃p > 0 ∃q > 0 −x − p ∈/A & −y − q ∈
/B & z =x+y
| {z } | {z }
⇓ ⇓
∀a ∈ A − x − p > a ∀b ∈ B − y − q > b
| {z }
⇓
∀a ∈ A ∀b ∈ B − z − p − q = −x − p − y − q > a + b
⇓
−z − p − q ∈/ A+B
⇓
z ∈ −(A + B)
§ 1. Вещественные числа и числовые множества 141
– доказывает включение
(−A) + (−B) ⊆ −(A + B).
А затем обратное включение
−(A + B) ⊆ (−A) + (−B) (2.1.181)
– доказывается следующими рассуждениями. Пусть z ∈ −(A + B), то есть
−z − r ∈
/ A+B (2.1.182)
x ∈ −A.
Обозначим
y = −z − x.
Условие (2.1.182) можно переписать так:
∀a ∈ A ∀b ∈ B a + b < −z − r.
r r r
∀b ∈ B a′ + b < −z − r =⇒ ∀b ∈ B b < −z − a′ − r = −z −a′ − − = y − =⇒
2
| {z } 2 2
k
−x
r
=⇒ y− ∈
/B =⇒ y ∈ −B.
2
Это доказывает (2.1.181).
6. Тождество (2.1.167) доказывается цепочкой
(2.1.170) (2.1.171)
A < (0) < B =⇒ −A > (0) & B > (0) =⇒
(2.1.169)
=⇒ (−A) · B > (0) =⇒ A · B = (2.1.158) = −((−A) · B) < (0)
(2.1.148) (2.1.171)
A6B =⇒ A⊆B =⇒
=⇒ A + C = {a + c; a ∈ A, c ∈ C} ⊆ {b + c; b ∈ B, c ∈ C} = B + C
13. Для доказательства (2.1.175) нужно рассмотреть несколько случаев. Если A > (0) и B > (0),
то
(−A) ·B = (2.1.158) = −((−(−A)) · B) = (2.1.167) = −(A · B).
| {z }
> (2.1.169)
0
0
<
(2.1.170)
0
15. Тем же приемом доказывается тождество (2.1.177). Если A > (0), B > (0) и C > (0), то
Остальные варианты рассматриваются так же как при доказательстве (2.1.176). Например, для
A < (0) < B и C > (0) получаем:
<
0 0
>
(2.1.169),(2.1.171)
0
0
<
<
(2.1.171)
0 0
16. Тождество (2.1.178). Пусть сначала A > (0). Тогда, прежде всего,
(2.1.145)
=⇒ ∃a ∈ A x<a =⇒ x ∈ A,
(2.1.134) (2.1.136)
x∈A =⇒ ∃a ∈ A a > 0 & x < a =⇒ ∃a ∈ A a > 0 & x · a−1 < a · a−1 = 1 =⇒
(2.1.136)
=⇒ ∃a ∈ A ∃b a>0& x a−1} < b < 1
| ·{z =⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x·a−1 < b =⇒
<
А если A = (0), то
A · (1) = (0) · (1) = (2.1.158) = (0) = A.
17. Тождество (2.1.179). Пусть сначала A > (0). Тогда по лемме 2.1.16, A−1 > (0), и мы, прежде
всего, получаем цепочку
(2.1.162)
x ∈ A · A−1 =⇒ ∃a ∈ A ∃b ∈ A−1 a > 0 & b > 0 & x < a · b =⇒
=⇒ ∃a > 0 ∃b > 0 ∃y > 0 a ∈ A & b−1 − y ∈
/ A & x<a·b =⇒ x<1 =⇒ x ∈ (1),
| {z }
⇓
a < b−1 − y
⇓
a · b < (b−1 − y) · b = 1 − y · b < 1
| {z }
⇓
x<a·b<1
доказывающую включение
A · A−1 ⊆ (1).
Чтобы доказать обратное включение,
(1) ⊆ A · A−1 , (2.1.184)
зафиксируем x ∈ (1), то есть x < 1. Если x 6 0, то мы сразу можем выбрать a ∈ A, a > 0, и b ∈ A−1 ,
b > 0, для которых получится
x 60 <a·b =⇒ x ∈ x ∈ A · A−1 .
Поэтому важнен немного более сложный случай 0 < x < 1. Для него по формуле (2.1.135), x−1 > 1,
поэтому положив p = 1 − x−1 , мы получим
a∈ A & a+a·p−r ∈
/A
c−1 − r = a · x−1 − r = a · (1 + p) − r = a + a · p − r ∈
/A =⇒ c ∈ A−1 .
144 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
Это доказывает включение (2.1.184), и вместе с ним, формулу (2.1.179) для случая A > (0). Случай
A < (0) будет его следствием:
18. В тождестве (2.1.180) сначала мы предполагаем, что A + B > (0) и C > (0). Тогда
x ∈ (A + B) · C ⇐⇒ ∃y ∈ A + B ∃c ∈ C x6y·c ⇐⇒
⇐⇒ ∃a ∈ A ∃b ∈ B ∃c ∈ C x 6 (a + b) · c = |{z}
a · c + |{z}
b·c ∈ A·C +B·C ⇐⇒
∋
A·C B·C
⇐⇒ x∈ A·C +B·C
После этого рассматриваются остальные случаи. Например, при A + B < (0) и C > (0) мы получаем
Случаи A + B > (0) & C < (0) и A + B < (0) & C < (0) рассматриваются так же. Случай C = (0)
тоже очевиден. Остается случай A + B = (0), то есть B = (−A). Для него мы получаем
∀A ∈ X ∀B ∈ Y A 6 B. (2.1.186)
∀A ∈ X ∀B ∈ Y A 6 C 6 B. (2.1.187)
Доказательство. Положим [
C = ∪X = A.
A∈X
1. Проверим сначала, что C — сечение. Прежде всего, поскольку множество X непусто, найдется
A ∈ X, и поскольку A – сечение, это множество тоже должно быть непусто. Мы получаем, что
∅ 6= A ⊆ C =⇒ C 6= ∅.
С другой стороны, поскольку Y непусто, найдется B ∈ Y , и для него будет справедливо неравенство
A 6 B, при любом A ∈ X. Это означает, что все элементы A ∈ X содержатся в B, и мы получаем
цепочку6 [
∀A ∈ X A ⊆ B =⇒ C = A ⊆ B ⊂ Q∗ =⇒ C 6= Q∗ .
A∈X
2. После этого остается убедиться, что справедливо условие (2.1.187). Первое неравенство в нем,
∀A ∈ X A 6 C,
эквивалентно включению
∀A ∈ X A ⊆ C,
S
справедливому, потому что C = A∈X A. А второе неравенство
∀B ∈ Y C 6 B,
эквивалентно включению
∀B ∈ Y C ⊆ B,
которое доказывается цепочкой
[
∀A ∈ X A6B =⇒ ∀A ∈ X A⊆B =⇒ C= A ⊆ B.
A∈X
⋄ 2.1.18. Множества, определяемые явным (a, b] = x ∈ R : a<x6b
перечислением своих элементов. Это самый
[a, b) = x ∈ R : a6x<b
простой пример числовых множеств. Например,
запись (a, +∞) = x ∈ R : a<x
1 [a, +∞) = x ∈ R : a6x
−1; ; 3
2 (−∞, b) = x ∈ R : x<b
обозначает множество, состоящее из трех эле- (−∞, b] = x ∈ R : x6b
ментов: −1, 21 и 3.
Точнее, в этом списке множество (a, b) называ-
⋄ 2.1.19. Числовые множества, определяе- ется интервалом, [a, b] – отрезком, (a, b] – полу-
мые отношениями порядка. Отношения 6, < интервалом с замкнутым правым концом, [a, b)
, >, > определяют на прямой R множества, из- – полуинтервалом с замкнутым левым концом,
вестные как интервал, отрезок и полуинтервалы: (a, +∞) – открытым полуинтервалом с бесконеч-
ным правым концом, [a, +∞) – замкнутым полу-
(a, b) = x ∈ R : a<x<b интервалом с бесконечным правым концом, и так
[a, b] = x ∈ R : a6x6b далее.
X + a = {y ∈ R : ∃x ∈ X x + a = y}, (2.1.189)
X − a = {y ∈ R : ∃x ∈ X x − a = y} (2.1.190)
146 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
a · X = X · a = {y ∈ R : ∃x ∈ X a · x = y}, (2.1.191)
— неравенство
a 6 X, (2.1.192)
означает, что любой элемент множества X не меньше числа a
∀x ∈ X a 6 x;
∀x ∈ X a < x, ∀x ∈ X x 6 a, ∀x ∈ X x<a
X + Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x + y = z} (2.1.193)
X − Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x − y = z} (2.1.194)
X · Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x · y = z} (2.1.195)
X x
= z ∈ R : ∃x ∈ X ∃y ∈ Y =z (2.1.196)
Y y
— неравенство
X 6Y
по определению означает, что любой элемент множества X не превосходит лю-
бого элемента множества Y :
∀x ∈ X ∀y ∈ Y x6y
а неравенство
X <Y
– что любой элемент множества X меньше любого элемента множества Y :
∀x ∈ X ∀y ∈ Y x<y
2.
3.
a ∧ b = min{a, b} (2.1.205)
a ∨ b = max{a, b} (2.1.206) ⊲ 2.1.24. Докажите, что не существует числа
b ∈ R такого, что равенство
Доказательство. По аксиоме A13, выполняется
одно из двух: либо a 6 b, либо a > b. a∧b=a
В первом случае (когда a 6 b) мы получим:
выполнялось бы для всех a ∈ R.
a ∧ b = a = min{a, b}. ⊲ 2.1.25. Докажите, что не существует числа
Здесь первое равенство выполняется по опреде- b ∈ R такого, что равенство
лению a ∧ b, а второе – потому что a ∈ {a, b} и a∨b=a
a 6 {a, b}. И точно так же
выполнялось бы для всех a ∈ R.
a ∨ b = b = max{a, b},
⊲ 2.1.26. Докажите неравенства:
и первое равенство выполняется по определению
a ∨ b, а второе – потому что b ∈ {a, b} и {a, b} 6 b. a 6 a ∨ b, a, b ∈ R
А во втором случае (когда a > b) мы получа- (2.1.207)
ем a ∨ b 6 a + b 6 2 · a ∨ b, a, b > 0
a ∧ b = b = min{a, b}, (2.1.208)
2 2
где второе равенство выполняется потому что a∨b 6 a2 + b 2 6 2 a ∨ b , a, b > 0
b ∈ {a, b} и {a, b} > b. И, с другой стороны, (2.1.209)
a ∨ b = a = max{a, b}, ⊲ 2.1.27. Проверьте, какие из следующих тож-
деств верны:
где второе равенство верно потому что a ∈ {a, b}
и a > {a, b}. (a ∧ b) + c = (a + c) ∧ (b + c)
§ 1. Вещественные числа и числовые множества 149
запись
inf X > −∞
принято использовать в случаях, когда нужно коротко дать понять, что множе-
ство X ограничено снизу.
• Точной верхней гранью (или точной верхней границей) sup X числового множества X
называется
— символ +∞, если X не ограничено сверху; опять же в этом случае точная ниж-
няя грань не является числом: запись
inf X = +∞
запись
sup X < +∞
принято использовать в случаях, когда множество X ограничено сверху.
150 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
⋄ 2.1.28. Пусть X = (a, b) — интервал на веще- роны, любое число s 6 a ограничивает X снизу.
ственной прямой R. А наибольшее из всех таких чисел, то есть число
A = a будет точной нижней гранью множества
X. Таким образом,
inf(a, b) = a sup(a, b) = b
Теорема 2.1.23 (о точной границе). Если X – непустое ограниченное снизу множество, то оно
имеет точную нижнюю грань. Аналогично, если X – непустое ограниченное сверху множество,
то оно имеет точную верхнюю грань.
Доказательство. Рассмотрим случай, когда X – непустое ограниченное сверху множество (слу-
чай, когда X ограничено снизу рассматривается аналогично). Обозначим буквой Y множество всех
чисел, ограничивающих X сверху:
Y = {y ∈ R : X 6 y} = {y ∈ R : ∀x ∈ X x 6 y}
(поскольку X ограничено сверху, хотя бы одно такое число y существует, и значит, Y – непустое
множество). Тогда
∀x ∈ X ∀y ∈ Y x 6 y
и по аксиоме непрерывности вещественной прямой A16, найдется такое число c, что
∀x ∈ X ∀y ∈ Y x6c6y
Первое неравенство здесь означает, что c ограничивает X сверху, то есть, что c ∈ Y . А второе – что
c есть наименьшее число, лежащее в Y . То есть c = min Y = min{y ∈ R : X 6 y} = sup X.
Доказательство. Здесь мы также докажем только первую половину каждого утверждения (пред-
ложив читателю самостоятельно по аналогии доказать вторую).
1. В первом случае получаем цепочку:
X⊆Y
§ 2. Натуральные, целые и рациональные числа 151
⇓
∀c ∈ R c6Y =⇒ c 6 X
⇓
{c ∈ R : c 6 Y } ⊆ {c ∈ R : c 6 X}
⇓ (свойство 1◦ на с. 147 )
inf Y = max{c ∈ R : c 6 Y } 6 max{c ∈ R : c 6 X} = inf X
2. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : c 6 X + a}
Тогда получаем цепочку
3. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : −X 6 c}
Тогда получаем цепочку
c∈C ⇐⇒ −X 6 c ⇐⇒ −c 6 X ⇐⇒ −c ∈ B ⇐⇒ c ∈ −B
⇓
−B = C
⇓
− inf X = − max B =(свойство 3◦ на с. 147) = min − B = min C = sup(−X)
1∈X
∀x ∈ X x+1∈X
152 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
Иными словами,
Тогда мы получим:
1) 1 ∈ N, потому что 1 лежит в любом множестве X, и
2) если x ∈ N, то есть x ∈ N для всякого индуктивного множества X, то x+1 ∈ X (поскольку
X индуктивно); значит, x + 1 ∈ X для всякого индуктивного множества X, поэтому
x + 1 ∈ N.
Таким образом, N – индуктивное множество. С другой стороны, N содержится в любом множе-
стве X, то есть, в любом другом индуктивном множестве. Значит, N как раз и есть множество
натуральных чисел.
2. Убедимся, что N – наименьшее индуктивное множество, то есть оно удовлетворяет условию
(ii) на с.152. Действительно, если Y – какое-нибудь индуктивное множество, то оно содержится в
семействе множеств X, по которому устраивается пересечение в формуле (2.2.214). Поэтому N ⊆ Y .
3. Убедимся, что множество N определяется однозначно. Действительно, если бы нам было дано
какое-то другое множество N e с теми же свойствами, то мы получили бы, что, во-первых,
e
N⊆N
e и, во-вторых,
(потому что N содержится в любом индуктивном множестве, в частности, в N),
e ⊆N
N
e содержится в любом индуктивном множестве, в частности, в N). Вместе это означает,
(потому что N
что
e
N = N.
Доказательство. С одной стороны, нам дано, что E ⊆ N. С другой же стороны, свойства (a), (b)
означают, что E является индуктивным множеством. Поэтому, в силу условия (ii) определения 3.2,
N содержится в E: N ⊆ E. Итак,
E⊆N & N⊆E
то есть, E = N.
На практике удобно пользоваться следующей переформулировкой принципа математической
индукции.
Теорема 2.2.2 (принцип математической индукции). Пусть дана последовательность утвержде-
ний
Φn n∈N (2.2.215)
со следующими свойствами:
(a′ ) первое утверждение Φ1 истинно;
(b′ ) если при каком-нибудь n ∈ N истинно утверждение Φn , то истинно и утверждение
Φn+1 .
Тогда все утверждения Φn истинны (для всех n ∈ N).
Доказательство. Обозначим через E множество всех таких чисел n ∈ N, для которых утверждение
Φn истинно. Тогда условие (a′ ) будет эквивалентно условию (a) теоремы 2.2.1, а условие (b′ ) будет
эквивалентно условию (b). Значит, E = N, то есть Φn истинно для каждого n ∈ N.
m+k ∈N
m + (k + 1) = (m + k) + 1 ∈ N
E = {n ∈ N : m · n ∈ N}
Нам нужно убедиться, что E = N. Это тоже делается индукцией. Сначала замечаем, что 1 ∈ E,
потому что из m ∈ N следует m · 1 = m ∈ N. Затем берем какое-нибудь k ∈ E, то есть
m·k ∈N
и замечаем, что тогда k + 1 ∈ E, потому что из только что доказанной замкнутости N относительно
сложения следует
m · k ∈ N =⇒ m · (k + 1) = (m · k) + m ∈ N
Снова по принципу индукции E = N.
Ниже нам понадобятся еще несколько утверждений об N.
• Дискретным интервалом с концами m ∈ N и n ∈ N называется множество
{m, ..., n} := {k ∈ N : m 6 k 6 n}
min N = 1 (2.2.216)
2◦ . Если n ∈ N и n 6= 1, то n − 1 ∈ N.
3◦ . Для любого n ∈ N множество чисел x ∈ N, больших n − 1, имеет наименьший элемент,
а именно n:
min{x ∈ N : n − 1 < x} = n (2.2.217)
4◦ . Каждое непустое подмножество M ⊆ N обладает минимальным элементом.
5◦ . Для любых m, n ∈ N справедливы импликации:
E = {1} ∪ (N + 1) = {x ∈ R : x=1 ∨ ∃n ∈ N x = n + 1}
Xn+1 = X +1 (2.2.221)
| {z } | n{z }
k k
{y ∈ N : n < y} {y ∈ R : ∃x ∈ Xn y = x + 1}
=⇒ ∃x ∈ N n < x + 1 = y =⇒ y ∈ Xn+1
=⇒ ∃x ∈ N y =x+1&n−1<x =⇒ ∃x ∈ Xn y =x+1 =⇒ y ∈ Xn + 1
Теперь доказываем (2.2.217) по индукции. Во-первых, убеждаемся, что эта формула верна при
n = 1. Действительно,
1◦
x∈N =⇒ x>1>0 =⇒ x ∈ X1
| {z }
⇓
N ⊆ X1
⇓
X1 = N
⇓
min X1 = min N = 1
Далее предполагаем, что (2.2.217) верна при n = m:
min Xm = m (2.2.222)
1∈E
Действительно, если бы это было не так, то есть при любом n ∈ E мы получали бы, что из {1, ..., n} ⊆
E следует n + 1 ∈ E, то это означало бы, что E = N, то есть M = ∅.
Теперь, возвращаясь от E к M , условие (2.2.223) можно переформулировать так:
E = {1, ..., m} ∪ (N + m)
2) k = m =⇒ k + 1 = 1 + m ∈ (N + m) ⊆ E;
3) k > m =⇒ k ∈ / {1, ..., m} =⇒ k ∈ (N + m) =⇒ k = n + m (n ∈ N) =⇒
k + 1 = (n + 1) + m (n + 1 ∈ N) =⇒ k + 1 ∈ (N + m) ⊆ E;
Таким образом, получается что N = E = {1, ..., m} ∪ (N + m), и поэтому если n ∈ N, n > m,
то, поскольку n ∈/ {1, ..., m}, имеем n ∈ N + m, то есть n = m + k, k ∈ N, или, иными словами,
n − m = k ∈ N.
7. Рассмотрим множество M = N \ I. Тогда получаем цепочку
Нам нужно убедиться, что min M = n+1: тогда получится, что {1, ..., n}∩M = ∅, то есть {1, ..., n} ⊆
I и значит I = {1, ..., n}.
Предположим, что это не так: min M 6= n + 1. Тогда min M < n + 1, и по свойству 5◦ min M 6 n.
/ M , и значит min M > 1, то есть по свойству 5◦ ,
С другой стороны, в силу (a), 1 ∈ I, поэтому 1 ∈
min M − 1 > 1, и
2 6 min M 6 n
Если теперь положить k = min M − 1, то получается вот что:
(b)
16k<n & k∈
/M =⇒ k∈I & k<n =⇒ {z ∈ I}
k + 1 = |min M
↑
невозможно,
потому что
M ∩I = ∅
M = {x ∈ N : x∈
/ E}
m = min M
n=m−1∈N
Тогда, во-первых, n ∈
/ M (потому что иначе число m = n + 1 не было бы минимумом для M ), и
значит n ∈ E, откуда в силу (b),
{1, ..., n} ⊆ E (2.2.224)
А, во-вторых, для x ∈ N справедлива импликация
x>n =⇒ x∈
/ E, (2.2.225)
n<x x∈E
⇓
(2.2.219) ⇓ (b)
m=n+16x {1, ..., x} ⊆ E
| {z }
m∈E
а это невозможно, поскольку m ∈ M . Утверждения (2.2.224) и (2.2.225) вместе означают, что
{1, ..., n} = E.
§ 2. Натуральные, целые и рациональные числа 157
Определения по индукции. Читатель мог заметить, что среди примеров собственных обозна-
чений для чисел на странице 125 не было чисел, больших 10. Мы могли бы, конечно, по аналогии
последовательно определить числа 11, 12, или присвоить собственные обозначения вообще любому
конечному набору натуральных чисел, но чтобы дать собственные обозначения всем натуральным
числам (которых бесконечно много), нужно использовать так называемый прием определения по
индукции. О собственных обозначениях для чисел из N (точнее, об их десятичной записи) мы по-
говорим ниже на странице 172, а здесь мы приведем две теоремы, служащие обоснованием приема
определения по индукции и проиллюстрируем их примерами. Первая из них используется в случаях,
когда нужно определить бесконечную последовательность элементов7 :
Теорема 2.2.6 (об определениях полной индукцией). Пусть X – произвольное множество (необя-
зательно числовое) и дано отображение G, которое каждой конечной последовательности эле-
ментов x1 , ..., xn ∈ X, n ∈ N, ставит в соответствие определенный элемент G(x1 , ..., xn ) ∈ X. То-
гда для всякого начального элемента x1 ∈ X отображение G однозначно определяет бесконечную
последовательность {xn } ⊆ X, содержащую x1 в качестве первого элемента и удовлетворяющую
условию
∀n ∈ N G(x1 , ..., xn ) = xn+1 (2.2.228)
Доказательство. Зафиксируем x1 ∈ X и обозначим через E подмножество в N, состоящее из та-
ких n ∈ N, для которых существует конечная последовательность x1 , ..., xn ∈ X со следующим
свойством:
∀k = 2, ..., n G(x1 , ..., xk−1 ) = xk (2.2.229)
Тогда, во-первых, 1 ∈ E, потому что для n = 1 нужная последовательность должна состоять
только из одного числа, и таким числом будет x1 . И, во-вторых, если n ∈ E, то это значит, что
существует последовательность x1 , ..., xn ∈ X для которой выполняется (2.2.229). Тогда можно
положить xn+1 = G(x1 , ..., xn ), и мы получим что n + 1 ∈ E.
Таким образом, по принципу математической индукции (2.2.1), E = N. Отсюда следует, что для
всякого n ∈ N можно выбрать xn по такому правилу: выбираем какую-нибудь конечную после-
довательность {x1 , ..., xn }, подчиненную условию (2.2.229) (такая последовательность существует
поскольку n ∈ E), и в качестве xn берем ее последний элемент. Нам нужно только убедиться,
что число xn определяется таким алгоритмом однозначно. Действительно, если предположить, что
существует какое-то другое число x′n , которое можно определить таким же образом, то есть для
которого можно построить конечную последовательность {x′1 , ..., x′n } так, чтобы
Применив к этому отображению теорему 2.2.6, 0!! = 1, (2m + 2)!! = (2m + 2) · (2m)!! (2.2.238)
мы для начального значения
— если число n нечетно, то есть имеет вид
x1 = a n = 2m − 1, m ∈ N, то
получим последовательность со свойствами 1!! = 1, (2m + 1)!! = (2m + 1) · (2m − 1)!! (2.2.239)
Pn
x1 = a, xn+1 = a · xn , n ∈ N. Индуктивная сумма Qn k=1 ak и индуктив-
ное произведение k=1 ak элементов после-
Если обозначить довательности {an } определяются индуктивны-
ми правилами так:
an = xn , !
X1 n+1
X Xn
! 2.2.2. Это определение, между прочим, пред- Часто приходится рассматривать также суммы и
полагает, что 00 равно единице: произведения по интервалам натуральных чисел
{m, ..., n}. Читатель может по аналогии дать ин-
00 = 1 (2.2.236) дуктивные определения этим понятиям, мы же
160 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
6
то есть, что справедливо 6
2 2k−1
k
(1 + α) > 1 + k · α (2.2.243) > 2 · 2k−1 = 2k = 2n−1
Тогда для n = k + 1 мы получаем 2. После того, как (2.2.244) доказано для n ∈
N, остается заметить, что при n = 0 оно тоже
(1 + α)n = (1 + α)k+1 = (1 + α) · (1 + α)k > верно:
> (применяем (2.2.243)) > (1 + α) · (1 + k · α) = 1
0! = 1 > = 2−1 .
2
= 1 + (k + 1) · α + k · α2 > 1 + (k + 1) · α = 1 + n · α
Следовательно, оно верно для n ∈ Z+ .
Мы получили, что из того, что (2.2.242) вы-
⋄ 2.2.6. При n, m ∈ Z+ справедливо неравенство
полняется для какого-то n = k автоматически
следует, что оно выполняется для n = k + 1. Та- (n + m)! > n! · (n + 1)m (2.2.245)
ким образом, (2.2.242) обладает свойствами (a′ )
и (b′ ) теоремы 2.2.2, и поэтому оно выполняется Доказательство. Проведем индукцию по m ∈
для любых n ∈ N. Z+ . При m = 0 это неравенство верно:
⋄ 2.2.5. При n ∈ Z+ справедливо неравенство (n + 0)! = n! > n! · (n + 1)0
n! > 2n−1 (2.2.244) Предположим, что оно верно при m = k:
k∈N
§ 2. Натуральные, целые и рациональные числа 161
k
X 1 − q k+1 ⋄ 2.2.8. Бином Ньютона. Для любых a, b ∈ R
qi = , (2.2.248) и n ∈ N справедливо равенство
i=0
1−q
n
X
Тогда при n = k + 1 получаем: (a + b)n = Cnk · an−k · bk (2.2.251)
k=0
k+1 k
X X где Cnk – число сочетаний, определенное выше
qi = q i + q k+1 = (2.2.248) = формулой (2.2.249).
i=0 i=0
1 − q k+1 1 − q k+1 + q k+1 − q k+2 Доказательство. Сначала проверяем ее при n =
= + q k+1 = = 1:
1−q 1−q 1
X
1 − q k+2 (a + b)1 = C1k · a1−k · bk
= , | {z }
1−q k
k=0
| {z }
a+b k
что и есть формула (2.2.246) при n = k + 1. C10 · a1 · b0 + C11 · a0 · b1
2. После того, как (2.2.246) доказано, форму- Затем предполагаем, что она верна при n = m
ла (2.2.247) получается вычислением: m
X
m k
(a + b) = Cm · am−k · bk (2.2.252)
Xn Xn m−1
X
i i i k=0
q = q − q =
i=m i=0 i=0
и проверяем, что тогда она будет верна при n =
1 − q n+1 1 − qm q m − q n+1 m + 1:
= − =
1−q 1−q 1−q (a + b)m+1 = (a + b) · (a + b)m = (2.2.252) =
Xm
k
= (a + b) · Cm · am−k · bk =
k=0
m m
Число сочетаний Cnk . Для любых n, k ∈ Z+ , X
k
X
k 6 n число = Cm · am+1−k · bk + k
Cm · am−k · bk+1 =
k=0 k=0
| {z }
n! заменяем k на i − 1
Cnk = , (0 6 k 6 n) (2.2.249)
(n − k)! · k! m
X m+1
X
k
= Cm · am+1−k · bk + i−1
Cm · am+1−i · bi =
называется числом сочетаний из n по k. k=0 i=1
| {z }
заменяем i на k
Предложение 2.2.8. Справедливо следующее
m
X m+1
X
тождество k
= Cm · am+1−k · bk + k−1
Cm · am+1−k · bk =
k=0 k=1
Cnk + Cnk−1 = Cn+1
k
, (2.2.250) m
X
= am+1 + k
Cm · am+1−k · bk +
называемое тождеством Паскаля. k=1
162 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
m
X 1 1 1 11
k−1 4) n+1 + n+2 + ... + 2n > 24
+ Cm · am+1−k · bk + bm+1 = Pn 1 n
k=1 5) k=1 (4k−3)·(4k+1) = 4n+1
Xm Qn
1 n+2
= am+1 + (C k + C k−1 ) ·am+1−k · bk + bm+1 = 6) k=1 1− (k+1)2 = 2n+2
| m {z m }
k=1
k 7) 1 · 22 + 2 · 32 + ... + (n − 1) · n2 =
k
Cn+1 , n·(n2 −1)·(3n+2)
по тождеству 12 (n > 2),
Паскаля (2.2.250) n P2n−1 1
8) 2 < k=0 k < n.
m
X
= am+1 + k
Cm+1 · am+1−k · bk + bm+1 = ⊲⊲ 2.2.12. Докажите методом математической
k=1 индукции9 (используя бином Ньютона):
m+1
X 1 3 5 2n−1 √ 1
= k
Cm+1 · am+1−k · bk 1)2 · 4 · 6 · ... 2n 6 3n+1
√ Pn √
k=0 2) n < k=1 √1k < 2 n (n > 2).
2
xk 6 |xk |, (2.2.262)
1) 12 + 32 + ... + (2n − 1)2 = n(4n3 −1) k=1 k=1
1 1 1 Yn Yn
2) n+1 + n+2 + ... + 3n+1 >1
Pn 2
xk = |xk | (2.2.263)
3) k=1 k(3k − 1) = n (n + 1) k=1 k=1
Принцип Архимеда.
∃ sup N = B ∈ R (2.2.264)
Поскольку B – точная верхняя грань (то есть наименьшее из чисел, ограничивающих N сверху),
число B − 1 не может ограничивать N сверху. Значит, существует какое-то n ∈ N, большее чем B − 1:
n > B − 1. То есть
B <n+1
Это означает, что B не может ограничивать N сверху (потому что B меньше некоторого числа n+1 ∈
N). Таким образом, мы получили противоречие с (2.2.264). Оно означает, что наше предположение
о том, что N ограничено сверху неверно.
9 Функция
√
f (x) = x будет определена только в следующей главе, на с.280, и здесь мы рассчитываем школьные
знания читателя.
§ 2. Натуральные, целые и рациональные числа 163
Теорема 2.2.10 (принцип Архимеда). Для любого вещественного числа C ∈ R найдется нату-
ральное число n ∈ N такое, что n > C.
Конечные множества в R и N.
X = K ∪ {f (k + 1)},
Рассмотрим число
a = (min K) ∧ f (k + 1)
(напомним, что мы определили операцию ∧ формулой (2.1.203)). Это число a будет минимумом
множества X, потому что, во-первых,
⇓
a = min K ∨ a = f (k + 1)
⇓
a∈K ∨ a ∈ {f (k + 1)}
⇓
a ∈ K ∪ {f (k + 1)} = X
И, во-вторых,
a = (min K) ∧ f (k + 1) = min{min K, f (k + 1)}
⇓
a 6 min K & a 6 f (k + 1)
⇓
a6K & a 6 f (k + 1)
⇓
a 6 K ∪ {f (k + 1)} = X
Теорема 2.2.12. Множество A в N конечно тогда и только тогда, когда оно ограничено:
Доказательство. Первая половина этого утверждение следует из теоремы 2.2.11: если множество
A конечно, то оно либо пусто, и тогда ограничено, либо непусто, и тогда оно является образом R(f )
некоторого инъективного отображения f : {1, ..., n} → N. Отсюда по теореме 2.2.11 получаем, что
A имеет максимум, и поэтому ограничено сверху. С другой стороны, оно всегда ограничено снизу
единицей 1, и значит оно просто ограничено.
Докажем, что, наоборот, если A ограничено, то оно конечно. Опять, если A пусто, то доказывать
ничего не нужно, поэтому мы будем считать, что A 6= ∅. Тогда, положив
a1 = min A,
(если множество A\{a1 , ..., ak } непусто, то такое число существует по свойству 4◦ на с.154). По теоре-
ме 2.2.7 об определениях частной индукцией, отображение G определяет некую последовательность
{an } ⊆ A, удовлетворяющую условию
Действительно, во-первых,
{1, ..., an−1 } ⊆ {1, ..., an−1 , an }
⇓
A \ {1, ..., an−1 } ⊇ A \ {1, ..., an−1 , an }
⇓ (2.1.200)
⇓
an ∈ A \ {1, ..., an },
что невозможно.
2. Из (2.2.265) следует условие
∀n n 6 an (2.2.266)
Его можно доказать индукцией. При n = 1 оно очевидно:
1 6 a1 .
k + 1 6 ak+1
То есть (2.2.266) будет верно и при n = k + 1.
§ 2. Натуральные, целые и рациональные числа 165
A6c
A6c<m
Отсюда следует, что последовательность {an } конечна. Действительно, если бы она была бесконеч-
ной, то мы получили бы, что ее элемент с номером m лежит в A
am ∈ A
A < m 6 am
m<n
⇓
f (m) = am < an = f (n)
⇓
f (m) 6= f (n)
Нам остается проверить, что оно сюръективно. Действительно, если бы оказалось, что
A \ {a1 , ..., aN } 6= ∅,
то положив
aN +1 = min A \ {a1 , ..., aN }
мы получили бы, что N не может быть длиной последовательности {an }, определяемой отображе-
нием G по теореме 2.2.7:
⇓
n o
N + 1 6 sup n ∈ N : ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak
⇓
n o
6 sup n ∈ N :
N= ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak
x ∈ −N
∃ min E (max E)
причем
n<E =⇒ n < min E (E < n =⇒ max E < n) (2.2.269)
Доказательство. Пусть E ограничено сверху. Тогда по принципу Архимеда 2.2.10, найдется нату-
ральное число n ∈ N ограничивающее E сверху. Теперь получаем:
E<n
⇓
−n < −E
⇓
0 < −E + n (причем −E + n ⊆ Z, по теореме 2.2.13)
⇓ (2.2.267)
−E + n ⊆ N
⇓ (свойство 5◦ на с. 154)
∃ min(−E + n) = min(−E) + n > 0
⇓ (свойство 2◦ (i) на с. 147)
∃ min(−E) > −n
⇓ (свойство 2◦ (ii) на с. 147)
∃ max E = − min(−E) < n
(2.2.284) n −k
am+n+1 m+n m n 1 1
= |a {z } ·a = a · a · a = = = (2.2.272) =
a a
=
am · an , 1 1 1 1
посылка = = 1 = (2.2.272) = −k = n
индукции 1 k a a
ak
(2.2.284)
| a {z }
= am · an+1 здесь применяется
(2.2.275),
уже доказанное
Для n ∈ −N, то есть n = −k, где k ∈ N, формула для k > 0
(2.2.273) переписывается так:
Ну и формула (2.2.276) тоже доказывается
m−k m −k am сначала для n ∈ Z+ индукцией:
a =a ·a = (2.2.272) = k
a
(2.2.235) (2.2.235)
то есть так: (a · b)0 = 1 = 1·1 = a0 · b 0 ,
am−k · ak = am (2.2.235)
(a · b)n+1 = (a · b)n·(a · b) = an · bn · a · b =
| {z }
Заменив m − k = l, мы получим:
=
an · bn ,
al · ak = ak+l , l ∈ Z, k ∈ N посылка
индукции
1,
посылка 3. Докажем накопительный закон (2.2.277).
индукции
Зафиксируем m ∈ Z и проведем сначала индук-
А отсюда уже становится ясно, что она верна и цию по n ∈ Z+ .
при n ∈ −N, то есть при n = −k, k ∈ N: (2.2.235) (2.2.235)
(am )0 = 1 = a0 = a0·m ,
−1 k
1n = 1−k = (2.2.270) = 1 = (am )n+1
(2.2.235)
= (am )n ·am = am·n · am =
k | {z }
= (2.1.18) = 1| {z
= 1}
=
1
an , m n m −k (2.2.272) 1 1 (2.2.272)
посылка (a ) = (a ) = = m·k =
индукции (am )k a
1 (2.2.235) 1 = a−m·k = am·(−k) = am·n
= n
=
a ·a an+1
4. Формулу (2.2.278) при n = 0 можно счи-
А затем для n = −k, k ∈ N мы получаем: тать следствием (2.2.271) (или можно сказать
что раньше мы отмечали это утверждение как
170 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
1 1
01 = 00 · 0 = 1 · 0 = 0 xn = x−k = k
> k = y −k = y n
x y
А для остальных n ∈ N она доказывается индук- 6. Импликацию (2.2.282) можно доказать, на-
цией: пример, с помощью следующего вспомогательно-
го утверждения:
(2.2.235)
0n+1 = 0n ·0 = 0
|{z}
a>1 ⇒ ∀n ∈ N an > 1 (2.2.285)
=
0,
посылка Оно доказывается индукцией: подставив n = 1
индукции
мы получим тавтологию,
Условие сохранения знака (2.2.279) для n ∈ Z+ a>1 ⇒ a1 = a > 1
доказывается индукцией:
а если оно верно при каком-то n = k
(2.2.235)
a0 = 1 > 0,
(2.1.23) a>1 ⇒ ak > 1
n+1 (2.2.235) n
a = a · |{z}
|{z} a > 0
то при n = k + 1 мы получим
<
<
0, 0
посылка (2.1.36)
индукции an = ak+1 = |{z}
ak · |{z}
a > ak > 1
<
<
А после этого для n ∈ −N, то есть для n = k, 0 1
k ∈ N, мы получаем:
Когда (2.2.285) доказано, (2.2.282) становится его
ak > 0 (уже доказано) следствием – при a > 1 получаем:
⇓ (2.1.29)
1 m<n
−k (2.2.272)
an = a = >0
ak ⇓
5. Импликация (2.2.280) доказывается индук- n−m>0
цией по n ∈ N. При n = 1 она становится тавто-
логией (то есть в ней следствие является частью ⇓ (2.2.285)
посылки, и поэтому утверждение будет очевид- a n−m
>1
но настолько, что в обычной речи это звучало бы
глупо): ⇓
0 < x < y =⇒ x < y an−m − 1 > 0
Предположим, что мы доказали (2.2.280) для ⇓
какого-то n = k
(2.1.23)
k k
an − am = am (an−m − 1) > 0
0<x<y =⇒ x <y
⇓
Тогда для n = k + 1 мы получим: a m
< an
xk < y k , x<y Наконец, из (2.2.282) выводится (2.2.283):
(2.1.33) ⇓ ⇓ (2.1.33)
x · xk < x · y k , x · yk < y · yk m<n 0<a<1
| {z } ⇓ ⇓ (2.1.35)
1
−m > −n >1
⇓ | {z a }
n k+1
x =x = x · x < x · y k < y · y k = y k+1 = y n
k
⇓
Когда (2.2.280) доказано, (2.2.281) становится его −m −n
m 1 (2.2.282) 1
следствием: если n < 0, то есть n = −k, k > 0, то a = > = an
a a
0<x<y
§ 2. Натуральные, целые и рациональные числа 171
[x + m] = [x] + m, x ∈ R, m ∈ Z (2.2.289)
0 ∈ {n ∈ Z : n 6 x} =⇒ 0 6 max{n ∈ Z : n 6 x} = [x]
а с другой –
(2.2.269)
{n ∈ Z : n 6 x} 6 x < 1 =⇒ [x] = max{n ∈ Z : n 6 x} < 1
То есть 0 6 [x] < 1. По следствию 2.2.15 это означает, что [x] = 0.
2. Обозначим E = {n ∈ Z : n 6 x}. Тогда, во-первых,
{n ∈ Z : n 6 x} 6 x =⇒ [x] = max{n ∈ Z : n 6 x} 6 x
[x + m] = max{n ∈ Z : n 6 x + m} = max{n ∈ Z : n − m 6 x} =
= max{k + m : k ∈ Z & k 6 x} = max{k ∈ Z : k 6 x} + m
• Дробной частью {x} вещественного числа x ∈ R называется разность между x и его целой
частью [x]:
{x} := x − [x] (2.2.292)
{x + m} = {x}, x ∈ R, m ∈ Z (2.2.295)
x − 1 < (n + 1) · 9 n−1
X n−1
X n−1
X
k k
ak ·10 6 9 · 10 = 9 · 10k =
⇓ |{z}
k=0 k=0 k=0
>
[0, 1)
0 6 x < 10n+1
⇓
⇓
h x i
x = an
0 6 n < 10 10n
10
⇓ (2.2.291)
174 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
Добавив слагаемые с нулевыми коэффициентами и это означало бы, что n − 1 ∈ E (то есть n не
(то есть, взяв дополнительные ai = 0 или bi = 0), может быть минимумом E).
§ 2. Натуральные, целые и рациональные числа 175
a = b · q + r, (2.2.307)
Если вдобавок a ∈ Z и b ∈ N, то r ∈ Z+ .
Доказательство. Числа q и r можно определить формулами
hai nao
q= , r =b·
b b
Тогда по определению целой части q ∈ Z, а по определению дробной части, rb ∈ [0; 1), и значит
r ∈ [0, b). Нам остается доказать, что такие числа q и r единственны. Предположим, что существуют
два разложения одного числа a:
a = b · q + r = b · q̃ + r̃
Тогда
r r̃
= q̃ + q+
b b
Из этого следует, что q = q̃, потому что если бы это было не так, то есть например q < q̃, то, по
свойству (2.2.268), мы получили бы, что q + 1 6 q̃, и поскольку rb < 1,
r r̃
q+ < q + 1 6 q̃ 6 q̃ +
b b
А с другой стороны, равенство rb = q̃ − q + r̃b означает, что rb и q̃ − q + r̃b отличаются на целое число
q̃ − q, поэтому
r nro r̃ r̃
= = q̃ − q + = (2.2.295) = ,
b b b b
и отсюда r = r̃.
Остается заметить, что поскольку q ∈ Z, то при a ∈ Z и b ∈ N число r = a − b · q должно быть
целым.
x ∈ A▽ & x ∈ B▽ A△ := {x ∈ N : A ... x} =
m = {x ∈ N : ∀a ∈ A a ... x} (2.2.313)
▽ ▽
x∈A ∩B Очевидно,
A ... A△ (2.2.314)
§ 2. Натуральные, целые и рациональные числа 177
∀a ∈ A △ (A▽ ) ... a
r ∈ A▽
⇓
С другой стороны, △ (A▽ ) ... A
r < ▽(A) = min A▽ ⇓
§ 2. Натуральные, целые и рациональные числа 179
⇓ (a · b) ... a, (a · b) ... b
| {z }
A▽ >△ (A▽ )
⇓ (2.2.329)
Вместе с (2.2.328) это означает, что
(a · b) ... (a ▽ b)
△ (A▽ ) = min A▽ = ▽(A),
Нам нужно убедиться, что
то есть как раз справедливо (2.2.321).
x=a△b
Теорема 2.2.28. Для любых a, b ∈ N справедли-
вы импликации Для этого отдельно докажем два неравенства
.
x .. a
⇒ x ... (a ▽ b) (2.2.329) a △ b > x, x>a△b
x ... b
.
a .. x Первое из них доказывается такой цепочкой:
⇒ (a △ b) ... x (2.2.330)
b ... x
a▽b a▽b
и равенство a=x· , b=x·
| b {z a}
(a ▽ b) · (a △ b) = a · b (2.2.331)
⇓
Доказательство. 1. Импликации следуют из со-
отношений (2.2.319): a ... x, b ... x
| {z }
⇓ (a △ b) ... x
⇓ a · b ..
. (a ▽ b)
△ {a; b} ... {a; b}△ a△b
⇓ ⇓
(x · a) ... b
⋄ 2.2.19. Число 2 является простым, потому что
⇓
2 ... x
(x · a) .. a & (x · a) ... b
.
| {z }
⇓
⇓ (2.2.329)
16x62
(x · a) ... a ▽ b = a · b
(2.2.332)
⇓
⇓
x ∈ {1; 2}. x x·a
= ∈N
b a·b
То есть
⇓
2△ = {1; 2}
x ... b
• Числа a, b ∈ N называются взаимно просты-
ми, если они имеют только один общий дели-
тель, а именно, число 1: Предложение 2.2.30. Если произведение про-
стых чисел
{a, b}△ = {1} a1 · a2 · ... · an
Понятно, что это равносильно тому, что их делится на простое число b, то b содержится
наибольший общий делитель равен единице: в последовательности a1 , ..., an :
a △ b = 1. ∃i ∈ {1, ..., n} ai = b
(2.2.331)
⇓
(a ▽ b) · (a △ b) = a·b
| {z } b ∈ {a1 }△ = {1; a1 }
1
⇓ (b > 1)
⋄ 2.2.20. Если a и b – два различных простых
b = a1
числа, то они взаимно просты, потому что
2. Предположим, что оно верно при n = k:
a△ = {1; a}, b△ = {1; b}
a1 · a2 · ... · ak ... b ⇒ ∃i = 1, ..., k ai = b
⇓ (2.2.333)
3. Покажем, что тогда оно будет верно и при
n = k + 1. Пусть
{a, b}△ = (2.2.317) = {a}△ ∩ {b}△ =
= {1; a} ∩ {1; b} = {1} a1 · a2 · ... · ak · ak+1 ... b
причем ak+1 и b простые, не совпадающие чис- Покажем тогда, что оно верно и при x = N .
ла, и значит, в силу примера 2.2.20, взаимно про- Здесь придется рассмотреть два случая. Во-
стые. Поэтому по предложению 2.2.29, x должно первых, если x = N – простое число, то наше
делиться на b: утверждение для него верно по тем же причи-
нам, по которым оно было верно для уже рас-
x = a1 · a2 · ... · ak ... b смотренного случая x = 2: те же рассуждения,
но с заменой 2 на N приводят к тому же резуль-
Но тогда по предположению индукции (2.2.333), тату.
b = ai для некоторого i = 1, ..., k. То есть в лю- Во-вторых, если x = N – составное число, то
бом случае мы получаем b = ai для некоторого есть
i = 1, ..., k, k + 1.
N = K ·L (K, L ∈ N, K, L > 1)
Теорема 2.2.31 (основная теорема арифмети-
ки). Каждое число x ∈ N, x > 1, можно един- то
ственным образом разложить в произведение K < N, L<N
x = pn1 1 · pn2 2 · ... · pknk , (2.2.334) поэтому по предположению индукции числа K
и L раскладываются по формуле (2.2.334). От-
в котором k и {n1 , n2 , ..., nk } – натуральные чис- сюда можно сделать вывод, что их произведе-
ла, а {p1 , p2 , ..., pk } – простые, расположенные в ние N = K · L тоже раскладывается по формуле
порядке возрастания: (2.2.334).
Остается только объяснить, почему для тако-
p1 < p2 < ... < pk
го N разложение будет единственно. Предполо-
Доказательство. Проведем индукцию по x ∈ N, жим, что этих разложений имеется два:
x > 2.
N = pn1 1 · ... · pnk k = q1m1 · ... · qlml (2.2.336)
1. Пусть x = 2. Тогда в виде (2.2.334) его мож-
но представить так: Поглядим на это с точки зрения предложения
2.2.30: число N делится на простое число q1 , а, с
2 = 21
другой стороны, N является произведением про-
(то есть в данном случае k = 1, p1 = 2, n1 = 1). стых чисел p1 , ..., pk (с разными степенями). Зна-
Единственность такого разложения следует из чит, среди чисел p1 , ..., pk какое-то должно быть
того, что, как мы убедились в примере 2.2.19, равно q1 :
число 2 простое: если
∃i ∈ {1, ..., k} pi = q1
2 = q1m1 · q2m2 · ... · qlml (2.2.335)
По той же причине среди чисел q1 , ..., ql какое-то
– какое-нибудь другое разложение, то мы во- должно быть равно p1 :
первых получим, что все числа qi должны быть
∃j ∈ {1, ..., l} qj = p1
одинаковыми и равными двойке, потому что
Поскольку числа p1 , ..., pk упорядочены по воз-
2 ... qi
растанию, получаем
⇓
p1 6 pi = q1
△
qi ∈ 2 = {1; 2}
С другой стороны, числа q1 , ..., ql тоже упорядо-
⇓ (qi > 1)
чены по возрастанию, и поэтому
qi = 2
q1 6 qj = p1
То есть разложение (2.2.335) должно иметь вид
Вместе это означает, что
2 = 2m
p1 = q1
И, во-вторых, здесь m должно быть равно 1, по-
тому что иначе, то есть при m > 1, мы получили откуда следует, что i = 1 = j.
бы Теперь разложение (2.2.336) можно записать
(2.2.282)
2 = 21 < 2m так:
2. Предположим далее, что наше утвержде- N = pn1 1 · pn2 2 · ... · pnk k = pm
1
1
·q2n2 · ... · qlml
ние верно при всех x, меньших некоторого N , |{z}
q1
заменено
x < N. на p1
182 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
точно так же, если бы n1 < m1 , то поделив на разложение (2.2.334) должно быть единственно.
pn1 1 , мы получили бы То есть,
N
n2 nk m1 −n1 m2 ml
= p · ... · p = p · q · ... · q k = l & ∀i = 2, ..., k p i = qi & n i = m i
pn1 1 2 k 1 2 l
Свойства множества Q:
1◦ . Сумма x + y двух рациональных чисел x и y, также является рациональным числом:
x, y ∈ Q =⇒ x+y ∈Q (2.2.338)
(2.2.288) [a · n] m [a · n] + 1 [a · n] 1
[a · n] < a·n =⇒ 6a<b6 = = + =⇒
n n n n n
1 1
=⇒ b−a6 =⇒ n6 ,
n b−a
и последнее противоречит выбору n.
Несократимые дроби. a = p · (a △ b) ... x · (a △ b)
b = q · (a △ b) ... x · (a △ b)
Теорема 2.2.33. Всякое положительное раци-
ональное число x ∈ Q представимо в виде дро- ⇓
би, в которой числитель и знаменатель взаим- x · (a △ b) ∈ {a; b}△
но просты:
⇓
p
x= , p, q ∈ N, p△q=1 (2.2.342) x · (a △ b) 6 max{a; b}△ = (a △ b)
q
⇓
• Такие дроби называются несократи-
мыми. x61
a a
p /Q
x∈
a△b
x= = b
=
b a△b
q Следующий пример показывает, что такие числа
в самом деле существуют.
Остается проверить, что p △ q = 1. Это делается
так: ⋄ 2.2.21. Существует число c ∈ [1; 2], удовлетво-
x ∈ {p; q}△ ряющее условию11
⇓ c2 = 2 (2.2.343)
.
p .. x
q ... x Это число иррационально:
⇓ /Q
c∈
11 Читатель,
√
конечно, узнает в числе c из примера 2.2.21 число 2. Мы не вставляем это в формулировку, потому
что понятие корня будет определено нами только в § 1 главы 4.
184 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
ε 2 c · ε ε 2
Доказательство. 1. Рассмотрим два множества: c+ = c2 + 2 · + =
3c 3·c 3c
X = {x ∈ R : x>0 & x2 6 2} 2 1 1 2 1
= c2 + ·ε+ · 2 · |{z} ε2 6 c2 + ·ε+ ·ε =
3 9 c
|{z} |{z} 3 3
Y = {y ∈ R : y>0 & y 2 > 2}
6
ε,
6
Заметим, что 1 ∈ X и 2 ∈ Y , поэтому X и Y 1
3
1 так как
непустые. Докажем неравенство для множеств 0<ε61
= c2 + ε = c2 + (2 − c2 ) = 2
X 6Y
То есть
Действительно, если бы для каких-то x ∈ X и
ε ε 2
y ∈ Y выполнялось обратное неравенство c+ >c>0 & c+ 62
3c 3c
x > y, ε
и это значит, что число c + 3c наоборот лежит в
X. Это противоречие означает, что наше предпо-
то, поскольку y > 0, по свойству степенного отоб-
ложение (2.2.345) было неверным.
ражения (2.2.280), мы получили бы
Предположим, наоборот, что
x2 > y 2 c2 > 2 (2.2.346)
при том что из условий x ∈ X и y ∈ Y следует Тогда число ε = c2 − 2 будет положительно
x2 6 2 6 y 2 . ε = c2 − 2 > 0
Из неравенства X 6 Y , в силу аксиомы непре- Отсюда сразу следует, что
рывности A16, следует, что найдется число c ∈ R, ε
лежащее между X и Y : c− <c6Y
3c
X 6c6Y ε
и поэтому число c− 3c не лежит в Y . Но с другой
стороны, во-первых,
Заметим сразу, что, поскольку 1 ∈ X и 2 ∈ Y ,
число c должно удовлетворять условию ε c2 − 2 2c2 + 2
c− =c− = >0
3c 3c 3c
16c62 (2.2.344)
И, во-вторых,
2. Покажем, что ε 2 2 · ε ε 2
c− = c2 − + =
c2 = 2 3c 3 3c
ε ε 2
= c2 − ε + + > c2 − ε = c2 − (c2 − 2) = 2
Предположим, что это не так, например, пусть 3 3c
| {z }
<
c2 < 2 (2.2.345) 0
2
Тогда число ε = 2 − c будет положительно: То есть мы получаем
ε ε 2
ε = 2 − c2 > 0 c− >0 & c− >2
3c 3c
Отсюда сразу следует, что ε
и это значит, что число c − 3c наоборот лежит
ε в Y . Это противоречие говорит о том, что наше
c+ >c>X
3c предположение (2.2.346) тоже было неверным.
ε 3. Нам осталось доказать, что число c ирра-
и следовательно число c + 3c не лежит в X. Но
ционально. Предположим, что оно рационально:
с другой стороны,
c∈Q
(2.2.344)
⇓ (2.2.344) Тогда, поскольку c > 0, по теореме 2.2.33 это
1 6 c2 ⇓ число можно представить в виде несократимой
1
⇓ 0< c 61 дроби
−c2 6 −1 ⇓ m
1
c= , m△n=1
⇓ 0< c2 61 n
ε = 2 − c2 6 2 − 1 = 1 Мы получаем цепочку:
| {z }
m2
⇓ = c2 = 2
n2
§ 2. Натуральные, целые и рациональные числа 185
=
=
тождеств рассуждения выглядят так: 1 1 −1
2Z 2Z
1) если x, y ∈ 2N−1 , то x + y ∈ 2N−1 и x·y ∈
2Z
2N−1 , поэтому 3) если x, y ∈ 2Z−1
то x + y ∈ 2Z
и x·y ∈
2N−1 , 2N−1
sgn (x + y) = sgn2 x · sgn2 y , 2Z−1
| 2 {z } | {z } | {z } 2N−1 , поэтому
=
=
1 1 1 sgn (x + y) = sgn2 x · sgn2 y,
| 2 {z } | {z } | {z }
sgn2 (x · y) = sgn2 x ∨ sgn2 y ,
=
=
| {z } | {z } | {z }
= 1 −1 −1
=
=
1 1 1
2Z 2Z−1 2Z−1
2) если x ∈ 2N−1 ,y∈ 2N−1 , то x + y ∈ 2N−1 и sgn (x · y) = sgn x ∨ sgn2 y .
2Z
x · y ∈ 2N−1 , поэтому | 2{z } | {z2 } | {z }
=
sgn (x + y) = sgn2 x · sgn2 y , −1 −1 −1
| 2 {z } | {z } | {z }
=
=
=
−1 1 −1
Глава 3
ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
§1 Числовые функции
(a) Определение функции и примеры
Понятие функции формализует в математике идею взаимной зависимости физических величин.
Идея же состоит в следующем.
Как мы уже говорили на с.122, физические величины, такие как расстояние, масса, скорость,
и так далее, поддаются количественной оценке в числах. Люди находят и устанавливают правила,
позволяющие измерять эти величины (сравнивая их с эталонами), то есть выражать их числами:
200 метров, 1,8 килограмма, и т.д. Собственно говоря, в этом состоит смысл самого понятия фи-
зической величины: параметр, существование которого предполагается теоретически, должен быть
снабжен системой правил, позволяющих его измерять и сравнивать значения в различных ситуа-
циях – только в этом случае он приобретает статус физической величины.
При этом очень важное наблюдение, с которого и начинаются технические науки, состоит в том,
что при фиксированных правилах измерений обнаруживается, что разные величины могут быть
связаны друг с другом довольно жесткими соотношениями (законами природы): если известны
результаты измерений какой-то величины, то это, как правило, означает, что можно вычислить
какие-то другие величины в рассматриваемой ситуации (без необходимости их измерять).
⋄ 3.1.1. Например, по результатам измерения ⋄ 3.1.2. Точно так же, зная (с достаточной точ-
диаметра окружности D, можно с достаточной ностью) массу тела m и плотность ρ материала,
точностью судить о том, какой будет ее длина l, из которого оно изготовлено, мы можем (опять
же, достаточно точно) определить объем V этого
l = πD, (3.1.1) тела по формуле
В этих примерах одна величина выражается через другую с помощью логических правил, поз-
воляющих проводить вычисления, то есть находить нужные значения, возможно приближенные,
пользуясь заранее разработанными алгоритмами. Инженер, привыкший пользоваться подобными
вычислениями на практике, обычно только так и понимает функциональную зависимость, но мате-
матику удобнее рассматривать эту зависимость в абстрактном виде, включая те ее разновидности,
для которых алгоритмы вычислений еще не построены. Эти соображения приводят к следующему
определению:
• Числовой функцией на вещественной прямой R называется произвольное отображение1
1 Понятие отображения было определено выше на с.41.
188
§ 1. Числовые функции 189
f : R ֒→ R
⋄ 3.1.3. Степенная функция с целым по- ⋄ 3.1.6. Дробная часть числа. Формулой
казателем. Напомним, что на странице 167 мы (2.2.292) мы определили дробную часть числа
определили степени с целым показателем. Сте- x ∈ R:
пенной функцией с показателем n ∈ Z называет- {x} := x − [x]
ся функция Это тоже будет функция, определенная на R, и
ее график тоже имеет бесконечное число разры-
f (x) = xn вов:
⋄ 3.1.4. Модуль числа. Выше формулой (3.1.5) ⋄ 3.1.7. Сигнум числа x ∈ R определяется пра-
мы определили модуль числа x ∈ R: вилом
1, если x > 0
(
x, если x > 0 sgn x = 0, если x = 0 (3.1.3)
|x| =
x, если x < 0 −1, если x < 0
График этой функции имеет разрыв только в од-
ной точке x = 0:
Понятно, что правило x 7→ |x| будет функцией,
определенной всюду на числовой прямой R.
(b) Модуль
Модулем (или абсолютной величиной) вещественного числа x ∈ R называется число |x|, определя-
емое формулой
(
x, если x > 0
|x| = (3.1.5)
−x, если x < 0
Ниже на с.189 мы отметим, что отображение x 7→ |x| является функцией. Свойства этой функции
так часто используются в анализе, что их изучению мы посвятим целый раздел.
– нечетной, если
(1) для всякой точки x из области определения D(f ) функции f точка −x также лежит
в области определения,
∀ x ∈ D(f ) − x ∈ D(f )
(2) выполняется тождество
f (−x) = −f (x)
Эти условия означают, что график функции f должен быть симметричен относительно
начала координат:
§ 1. Числовые функции 193
Доказательство. Заметим, что это достаточно 2. Предположим, что мы доказали это для
доказать для n > 0, потому что случай отрица- какого-то n = k:
тельных степеней получается отсюда в качестве
следствия: (−x)2k−1 = −x2k−1 (3.1.18)
= −x2k+1 = x2(k+1)−1
2. Предположим, что мы доказали это для
какого-то n = k:
<
>
x2k , x2 , 0 0
в силу (3.1.16) в силу (2.1.17)
| − x| = | − 0| = |0| = |x|
0 0
Доказательство. Как и в предыдущем приме-
ре, здесь достаточно доказать утверждение для
n > 0, потому что для n = −k, k ∈ Z+ , это выво-
дится как следствие: ! 3.1.13. На всякий случай полезно заметить,
что функции не обязаны быть только четными
−2k−1 1 1 −2k−1 или нечетными. Например, функция
(−x) = = − 2k+1 = −x
(−x)2k+1 x
f (x) = 1 + x
Для n > 0 доказательство проводится по индук-
ции. не будет ни четной ни нечетной. Докажите это.
Периодические функции.
• Число T называется периодом числовой функции f , если
(a) оно положительно:
T > 0,
(b) область определения D(f ) функции f инвариантна относительно сдвигов на T вправо
и влево:
D(f ) − T = D(f ) = D(f ) + T
194 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
(то есть для любого x ∈ D(f ) числа x + T и x − T тоже лежат в D(f )),
(c) справедливо двойное тождество:
(здесь из-за условия (b) достаточно выполнения какого-нибудь одного из этих двух
равенств, например f (x) = f (x + T )).
• Число h называется полупериодом числовой функции f , если число 2h является периодом
функции f .
• Числовая функция f называется
— периодической, если она обладает каким-нибудь периодом T ,
— T -периодической, если число T является ее периодом,
⋄ 3.1.14. Непериодические функции. По- Можно заметить, что вообще любое натуральное
нятно, что не всякая функция будет периодиче- число n ∈ N является периодом для x 7→ {x}:
ской. Например, функция
f (x) = x, x∈R {x + n} = {x}, x∈R
T = n · M + r, 06r<M
Если бы оказалось, что r > 0, то мы получили бы, что r = T − n · M – период функции f , меньший
M . То есть M в этом случае не могло бы быть наименьшим периодом. Значит r = 0, и это то, что
нам нужно.
Теорема 3.1.6. Если функция f является периодической, но не обладает наименьшим периодом
M , то
§ 1. Числовые функции 195
(ii) на любом непустом интервале I = (a, b) функция f принимает все свои значения:
f I ∩ D(f ) = f D(f ) (3.1.22)
(иными словами, каковы бы ни были a и b, a < b, для любой точки x ∈ D(f ) найдется
точка t ∈ (a, b) ∩ D(f ) такая, что f (t) = f (x)).
Доказательство. 1. Обозначим буквой P множество всех периодов для f , а его нижнюю грань
буквой α: n o
P = T > 0 : ∀x ∈ D(f ) f (x + T ) = f (x) , α = inf P
Если α ∈
/ P , то для всякого β > α найдется T ∈ P такое, что
α<T <β
α < T1 < α + ε
f (x + T ) = f (x + T1 − T2 ) = f (x + T1 ) = f (x)
С другой стороны, T1 и T2 лежат в интервале (α, α + ε) длины ε, поэтому их разность должна быть
меньше ε:
T = T1 − T2 < ε
Мы получили, что для всякого ε > 0 найдется период T ∈ P , меньший ε. Значит, α = inf P = 0
2. Рассмотрим сначала интервал I = (−ε, ε), ε > 0. В силу уже доказанной формулы (3.1.21),
найдется период T < ε. Возьмем произвольную точку x ∈ D(f ), и обозначим через n целую часть
числа Tx : hxi
n=
T
Тогда точка t = x − nT будет обладать нужными свойствами:
Действительно, последние два условия – t ∈ D(f ) и f (t) = f (x) – выполняются потому что T –
период. А первое следует из свойств целой части:
hxi
n=
T
⇓ (2.2.288)
x ε
n6 <n+1<n+
T T
⇓
nT 6 x < nT + ε
⇓
| −{znT} < ε
06x
t
⇓
196 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
t ∈ (−ε, ε)
3. Пусть, наконец, I = (a, b) – произвольный интервал. Положим ε = b−a 3 и, пользуясь формулой
(3.1.21), подберем период T так, чтобы
ε
>1
T
Тогда a + ε < b − ε, поэтому a+ε T < b−εT , причем расстояние между точками T
a+ε
и b−ε
T больше
единицы:
b−ε a+ε (b − ε) − (a + ε) (b − a) − 2ε 3ε − 2ε ε
− = = = = >1
T T T T T T
Значит, между ними лежит хотя бы одно целое число n ∈ Z:
a+ε b−ε
<n<
T T
Умножив на T мы получим:
a + ε < nT < b − ε
⇓
a < nT − ε & nT + ε < b
⇓
(−ε; ε) + nT = (nT − ε; nT + ε) ⊆ (a; b)
То есть (−ε; ε) – такой интервал, сдвиг которого на число nT , кратное периоду T , попадает в
интервал (a; b). Мы уже доказали, что для любой точки x ∈ D(f ) в интервале (−ε; ε) найдется
точка t, на которой функция f определена и принимает то же значение:
f (t) = f (x)
Положив s = t + nT , мы получим точку из интервала (nT − ε; nT + ε) ⊆ (a; b) с теми же свойствами:
f (s) = f (t + nT ) = f (t) = f (x)
• Точная нижняя грань множества f (E) называется точной нижней гранью функции f на
множестве E и обозначается inf x∈E f (x):
n o
inf f (x) = inf f (E) = inf f (x); x ∈ E (3.1.24)
x∈E
Если функция f ограничена снизу на множестве E, то есть существует число A такое, что
∀x ∈ E A 6 f (x)
(это эквивалентно тому, что множество f (E) ограничено снизу), то точная нижняя грань
f на E совпадает с наибольшим из таких чисел A:
inf f (x) = max{A ∈ R : ∀x ∈ E A 6 f (x)}.
x∈E
В таких случаях inf x∈E f (x) само является числом (а не символом −∞, как тоже иногда
бывает), и это коротко записывается формулой:
inf f (x) > −∞
x∈E
• Точная верхняя грань множества f (E) называется точной верхней гранью функции f на
множестве E и обозначается supx∈E f (x):
n o
sup f (x) = sup f (E) = sup f (x); x ∈ E (3.1.25)
x∈E
В таких случаях supx∈E f (x) является числом (а не символом +∞), и это коротко запи-
сывается формулой:
sup f (x) < +∞
x∈E
∀x ∈ E A 6 f (x) 6 B
2◦ Монотонность:
∀x ∈ E f (x) 6 g(x) =⇒ inf f (x) 6 inf g(x) & sup f (x) 6 sup g(x)
x∈E x∈E x∈E x∈E
3◦ Антиоднородность:
inf − f (x) = − sup f (x)
x∈E x∈E
(3.1.26)
sup − f (x) = − inf f (x)
x∈E x∈E
4◦ Полуаддитивность:
inff (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E
(3.1.27)
sup f (x) + g(x) 6 sup f (x) + sup g(x)
x∈E x∈E x∈E
6◦ Связь с модулем:2
sup f (x) − f (y) = sup f (x) − f (y) (3.1.29)
x,y∈E x,y∈E
3.
inf − f (x) = inf − f (E) = (свойство 3◦ на стр. 150) = − sup f (E) = − sup f (x)
x∈E x∈E
.
4.
(
∀x ∈ E f (x) > inf x∈E f (x)
=⇒ ∀x ∈ E f (x) + g(x) > inf f (x) + inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) x∈E x∈E
=⇒ inf f (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E
5.
(
∀x ∈ E f (x) > inf x∈E f (x) > 0
=⇒ ∀x ∈ E f (x) · g(x) > inf f (x) · inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) > 0 x∈E x∈E
=⇒ inf f (x) · g(x) > inf f (x) · inf g(x)
x∈E x∈E x∈E
После этого нужно убедиться, что это неравенство не может быть строгим. Предположим, что
sup f (x) − f (y) < sup f (x) − f (y)
x,y∈E x,y∈E
а, взяв x = b, y = a, получили бы
Вместе эти два неравенства выполняться не могут, потому что f (a) − f (b) равен либо f (a) − f (b),
либо f (b) − f (a).
2 Это тождество понадобится нам на с.434.
§ 1. Числовые функции 199
Монотонные функции
5◦ Композиция g ◦ f функций f и g
– возрастает (неубывает), если обе функции f и g возрастают (неубывают),
либо обе убывают (невозрастают),
– убывает (невозрастает), если одна из функций f и g возрастает (неубывает),
а другая убывает (невозрастает).
x<y60 ⇓
⇓ −y 2n−1 < −x2n−1
0 6 −y < −x ⇓
⇓ x2n−1 < y 2n−1
(−y)2n < (−x)2n Остается заметить, что значения функции на
| {z } | {z }
y 2n x2n полуинтервале (−∞; 0] меньше значений на
[0; +∞). Это следует из того, что эти интервалы
⇓ имеют общую точку 0:
2n
y < x2n
x<0<y
Для доказательства (3.1.32) нужно просто рас-
смотреть два случая: x > 0 и x < 0. ⇓
§ 2. Предел последовательности 201
2n−1
x
| {z < 0} & 0 < y 2n−1 Из него и условия нечетности (3.1.17) выводит-
| {z }
потому что потому что
ся убывание на интервале (−∞; 0) по аналогии с
x, 0 ∈ (−∞; 0] 0, y ∈ [0; +∞) тем, как это делалось в примере 3.1.19. Свойства
| {z } (3.1.36) следуют из из условия сохранения зна-
⇓ ка (2.2.279) теоремы 2.2.17 и условия нечетности
(3.1.17).
x2n−1 < 0 < y 2n−1 (3.1.34) ⊲ 3.1.22. Нарисуйте график какой-нибудь функ-
ции f : R → R со следующими свойствами:
Формулы (3.1.33) можно вывести из возрастания
функции x 7→ x2n−1 , а можно объявить их след- 1) на интервале (−∞; −1) функция f убывает и
ствием уже доказанного неравенства (3.1.34). ограничена;
2) на интервале (−1; 0) функция f возрастает и
⋄ 3.1.20. Степенная функция x 7→ x−2n , n ∈ N,
ограничена;
— возрастает на интервале (−∞; 0), 3) на интервале (0; 1) функция f убывает, огра-
— убывает на интервале (0; +∞). ничена снизу, но не ограничена сверху;
При этом, 4) на интервале (1; +∞) функция f возрастает
и ограничена;
x 6= 0 =⇒ x−2n > 0 (3.1.35)
Понятно, что эта задача имеет неединствен-
ное решение. В качестве возможного ответа мы
Доказательство. Убывание на интервале предлагаем следующую картинку:
(0; +∞) следует из условия монотонности
(2.2.281) теоремы 2.2.17. Из него и условия чет-
ности (3.1.15) выводится возрастание на интер-
вале (−∞; 0) по аналогии с тем, как это делалось
в примере 3.1.18. Свойства (3.1.35) следуют из
из условия сохранения знака (2.2.279) теоремы
2.2.17 и условия четности (3.1.15).
§2 Предел последовательности
Напомним, что понятие бесконечной последовательности было определено на с.73. В частном слу-
чае, когда значения последовательности являются числами, такая последовательность называется
числовой. Выпишем это определение для ссылок:
• Числовой последовательностью называется произвольное отображение a : N → R (на-
турального ряда N в множество R вещественных чисел). Значения такого отображения
принято записывать с помощью нижнего индекса
an = a(n), n ∈ N.
а само отображение – в виде семейства {an ; n ∈ N} или {an }. (Понятно, что вместо a
может употребляться любая другая буква.)
202 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
следует, что последовательность {xn } можно представлять себе в виде таблицы, в которой первую
строчку (множество значений аргумента) занимают натуральные числа, а вторая строчка будет
занята соответствующими вещественными числами (значениями последовательности):
1 2 3 4 5 6 7 ...
x1 x2 x3 x4 x5 x6 x7 ...
Поскольку ячеек у такой таблицы должно быть бесконечно много, всю ее нарисовать, конечно,
невозможно, однако в качестве зрительного образа, который можно держать в голове, когда речь
заходит о последовательностях, такое представление бывает полезно.
Но оно фокусирует внимание наблюдателя на первых элементах последовательности и бывает
удобно только там, где важно ее “начало”, а на остающийся “хвост” можно не обращать внимание.
Нас же, наоборот, будет главным образом интересовать этот “хвост”: первые значения как раз не
будут нам особенно нужны (причем, каким бы длинным ни был этот начальный отрезок последова-
тельности), а важной для нас будет лишь закономерность, позволяющая понять, к чему стремится
данная последовательность (и стремится ли она к чему-то).
Пытаться уловить эту закономерность (разумеется, не на произвольных примерах, а на специаль-
но подобранных, обучающих) гораздо удобнее, пользуясь другим зрительным образом, в котором
последовательность изображается системой направленных дуг, символизирующих переходы от xn
к xn+1 :
Это можно представлять себе как движение “блохи, прыгающей по прямой”: сначала эта “блоха
находилась в точке x1 ”, затем “прыгнула в точку x2 ”, и так далее. Понятно, что и здесь всю систему
дуг нарисовать никогда не бывает возможно (потому что их тоже бесконечно много), однако как
зрительный образ такое представление оказывается удивительно полезным.
⋄ 3.2.4. xn = 1
n ⋄ 3.2.7. xn = (−1)n · n
⋄ 3.2.5. xn = n
⋄ 3.2.8. xn = (−1)n
(−1)n
⋄ 3.2.6. xn = n ⋄ 3.2.9. xn = 3 (постоянная последовательность)
204 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Это эквивалентно тому, что свойство P выполняется для всех n ∈ N, начиная с некоторого
номера:
∃N ∈ N ∀n > N P (3.2.40)
A = {n ∈ N : ¬P }, B = {n ∈ N : P}
Тогда
(3.2.39)
m
card A < ∞
m теорема 2.2.12
∃N ∈ N A ⊆ {1, ..., N }
m
∃N ∈ N {n ∈ N : n > N} ⊆ B
m
(3.2.40)
⋄ 3.2.10. Ясно, что почти все числа n ∈ N удо- выполняется для почти всех n ∈ N?
влетворяют неравенству Понятно, что это не так, потому что оно
выполняется только для четных чисел (n =
n>5
2, 4, 6, 8, ...), а для нечетных чисел (n =
потому что чисел n ∈ N, не удовлетворяющих 1, 3, 5, 7, ...) – которых бесконечно много – оно
этому неравенству имеется только конечное мно- неверно.
жество (а именно n ∈ {1, 2, 3, 4}).
⋄ 3.2.11. Наоборот, неверно, что почти все числа ⊲ 3.2.13. Верно ли, что обратное неравенство
n ∈ N удовлетворяют неравенству
(−1)n 6 0
n<5
потому что чисел n ∈ N, не удовлетворяющих выполняется для почти всех n ∈ N?
этому неравенству бесконечно много (а именно, Это, конечно, тоже не так, потому что это-
n = 5, 6, 7, 8, ...). му неравенству удовлетворяют только нечетные
⊲ 3.2.12. Сообразим, будет ли неравенство числа (n = 1, 3, 5, 7, ...), а для четных чисел
(n = 2, 4, 6, 8, ...) – которых бесконечно много –
(−1)n > 0 оно неверно.
§ 2. Предел последовательности 205
Теорема 3.2.1 (Архимеда). Каково бы ни было число C ∈ R, почти все числа n ∈ N удовлетворя-
ют неравенству
n>C (3.2.41)
Доказательство. Это следует из принципа Архимеда (теорема 2.2.10). Выберем какое-нибудь N ∈
N так, чтобы N > C. Тогда все числа n, начиная с числа N , удовлетворяют неравенству (3.2.41),
потому что n > N > C.
⋄ 3.2.15. Проверим, что почти все элементы по- няется для почти всех n ∈ N, по теореме Архи-
следовательности
{xn = n1 } лежат в интервале меда 3.2.1.
1
0; 4 .
⋄ 3.2.16. Верно ли, что почти все элементы по-
следовательности
{xn = n1 } лежат в интервале
1
4; ∞ ?
Действительно,
1 1 1 Нет, конечно, потому что
xn ∈ 0; ⇔ ∈ 0; ⇔
4 n 4
1 1 1
1 <1 1 1 xn ∈ ;∞ ⇔ > ⇔ n<4
⇔
n 4
⇔ < ⇔ n>4 4 n 4
1 >0 n 4
n а последнее неравенство выполняется не для
▼❇ почти всех чисел n ∈ N, а только для n ∈
❇ {1, 2, 3}.
это неравенство выполняется автоматически для любого n ∈ N,
поэтому его можно отбросить
⋄ 3.2.17. Верно ли, что почти все элементы по-
а последнее неравенство в этой цепочке выпол- следовательности {xn = (−1)n } лежат в интер-
206 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
n
1 −1
1) xn = (−1)n + n 8) xn = (−1)n · n(−1)
(Ответ: α 6 −1, β > 1) (Ответ: α < 0, β > 1)
n
2) xn = (−1) − n1n
9) xn = (−1)n + n(−1) −1
Окрестность точки.
• Окрестностью точки c ∈ R называется всякий интервал с центром в точке c, то есть
всякий интервал вида (c − ε; c + ε). Число ε при этом называется радиусом окрестности
(c − ε; c + ε).
Предложение 3.2.2. Всякая точка x произвольного интервала (a, b) содержится в нем вместе
с некоторой своей окрестностью:
Доказательство. Положим
ε = min{b − x; x − a}.
Тогда
( ( (
ε6b−x ε6b−x x+ε 6 b
=⇒ =⇒ =⇒
ε 6 x−a −ε > a − x x−ε > a
=⇒ a6x−ε<x<x+ε6b =⇒ x ∈ (x − ε, x + ε) ⊆ (a, b)
lim xn = c
n→∞
или
xn −→ c
n→∞
2n + 3
lim =2
n→∞ n+2
и поймем, что означает, что xn лежит в (1−ε; 1+ то есть что точка c = 2 является пределом по-
ε): следовательности {xn = 2n+3
n+2 }.
Возьмем какую-нибудь окрестность (2 − ε; 2 +
ε) точки c = 2
xn ∈ (1 − ε; 1 + ε) ⇔ 1 − ε < xn < 1 + ε ⇔
( (
n−1
xn > 1 − ε n > 1−ε
⇔ ⇔ n−1
⇔
xn < 1 + ε n < 1+ε
( (
n−1
n − 1 > −ε − n1 > −ε
⇔ n−1
⇔ ⇔
n −1 <ε − n1 < ε
1
n <ε 1 1
⇔ ⇔ <ε ⇔ n>
1
−n < ε n ε Тогда
▼❇
❇
поскольку ε > 0,
xn ∈ (2 − ε; 2 + ε) ⇔ 2 − ε < xn < 2 + ε ⇔
это неравенство выполняется автоматически для любого n ∈ N,
значит его можно отбросить ( (
2n+3
xn > 2 − ε n+2 > 2 − ε
По теореме Архимеда 3.2.1, последнее нера- ⇔ ⇔ 2n+3
⇔
xn < 2 + ε n+2 < 2 + ε
венство выполняется для почти всех n ∈ N. Это ( (
2n+3 1
означает, что почти все числа xn содержатся в n+2 − 2 > −ε − n+2 > −ε
⇔ ⇔ ⇔
интервале (1 − ε; 1 + ε). 2n+3
− 2 < ε − 1
n+2 n+2 < ε
Итак, мы получили, что любая окрестность
1
(1 − ε; 1 + ε) точки c содержит почти все элемен- n+2 < ε 1
ты последовательности {xn = n−1 n }. Это как раз
⇔ ⇔ <ε ⇔
1
−n + 2 < ε n + 2
означает, что точка c = 1 является пределом по-
следовательности {xn = n−1 n }. ❇▼
❇
⋄ 3.2.22. Покажем, что поскольку ε > 0,
это неравенство выполняется автоматически для любого n ∈ N,
n→∞
1 1
то есть что число c = 1 не является пределом ⇔ n+2> ⇔ n> −2
ε ε
последовательности {xn = (−1)n }.
Возьмем ε = 1 и рассмотрим соответствую- По теореме Архимеда 3.2.1, последнее неравен-
щую окрестность (0; 2) точки c = 1. Тогда ство выполняется для почти всех n ∈ N. Это
означает, что почти все числа xn содержатся в
xn ∈ (0; 2) ⇔
интервале (2 − ε; 2 + ε).
0 < (−1)n Итак, мы получили, что любая окрестность
⇔ ⇔ 0 < (−1)n (2 − ε; 2 + ε) точки c = 2 содержит почти все
(−1)n < 2
элементы последовательности {xn = 2n+3 n+2 }. Это
❇▼ означает, что точка c = 2 является пределом по-
❇
это неравенство выполняется автоматически для любого n ∈ N, следовательности {xn = 2n+3 n+2 }.
поэтому его можно отбросить
Возьмем какую-нибудь окрестность (−ε; ε) Для этого нужно будет рассмотреть отдель-
точки c = 0 но четные и нечетные номера n. Тогда условие
xn ∈ (−1; 1) распадется в совокупность двух си-
стем:
(
−1 < xn
xn ∈ (−1; 1) ⇔ ⇔
xn < 1
n
поскольку всегда n(−1) > 0,
это неравенство выполняется автоматически для любого n ∈ N,
значит его можно отбросить
✂
✂✌
−1 < n(−1)n n
⇔ ⇔ n(−1) < 1 ⇔
n
n(−1) < 1
n
xn −→ a
n→∞
и
xn −→ b
n→∞
210 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
то
a=b
Доказательство. Предположим, что a 6= b, например a < b. Возьмем ε = b−a 2 , тогда мы получим,
что почти все xn лежат в двух непересекающихся интервалах – в (a − ε; a + ε) и в (b − ε; b + ε):
xn xn
n
n
↓ ↓ ↓ ↓
∞
∞
a−ε< a <a+ε=b−ε< b <b+ε
| {z } | {z }
⇓ ⇓
xn ∈ (a − ε, a + ε) xn ∈ (b − ε, b + ε)
для почти всех n ∈ N для почти всех n ∈ N
Но это невозможно: если почти все xn лежат в (a − ε; a + ε), то вне (a − ε; a + ε) должен лежать
лишь конечный набор чисел xn . В частности, в (b − ε; b + ε) тоже должен лежать лишь конечный
набор чисел xn .
если любой интервал (E; +∞) содержит почти все элементы {xn }.
– стремится к −∞
xn −→ −∞
n→∞
если всякое множество (−∞; −E) ∪ (E; +∞) содержит почти все элементы {xn };
нетрудно проверить, что это равносильно тому, что последовательность из мо-
дулей {|xn |} стремится к +∞:
|xn | −→ +∞
n→∞
Тогда
lim n2 = +∞ xn ∈ (E; +∞) ⇔ xn > E ⇔ n2 > E
n→∞
§ 2. Предел последовательности 211
|xn | −→ 0
n→∞
Доказательство. Здесь необходимо проверить, что условия (i) и (ii) действительно равносильны.
Для этого перепишем свойство модуля 20 пункта 0.6, подставив вместо x последовательность {xn }:
xn −→ 0
n→∞
m
для всякого ε > 0 соотношение xn ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
для всякого ε > 0 соотношение |xn | ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
|xn | −→ 0
n→∞
212 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
xn −→ ∞
n→∞
|xn | −→ ∞
n→∞
xn −→ ∞
n→∞
для всякого ε > 0 соотношение xn ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N
m (3.1.14)
для всякого ε > 0 соотношение |xn | ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N
|xn | −→ ∞
n→∞
Доказательство.
{xn } – бесконечно малая
xn −→ 0
n→∞
m
1 1
∀ε > 0 > – верно для почти всех n ∈ N
xn ε
m
1
∀E > 0 >E – верно для почти всех n ∈ N
xn
m
1
−→ ∞
xn n→∞
m
1
– бесконечно большая.
xn
§ 2. Предел последовательности 213
xn −→ a
n→∞
xn = a + αn
(
a − ε < xn
xn ∈ (a − ε; a + ε) ⇐⇒ a − ε < xn < a + ε ⇐⇒ ⇐⇒
xn < a + ε
(
−ε < xn − a
⇐⇒ ⇐⇒ −ε < xn − a < ε ⇐⇒ −ε < αn < ε ⇐⇒ αn ∈ (−ε; ε)
xn − a < ε
C · αn = 0 −→ 0
n→∞
m
αn −→ 0
n→∞
m
∀ε > o |αn | < ε – верно для почти всех n ∈ N
m
ε
∀ε > o |αn | < – верно для почти всех n ∈ N
|C|
m
∀ε > o |C · αn | < ε – верно для почти всех n ∈ N
m
214 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
{C · αn } – бесконечно малая
2. Пусть {αn } и {βn } – бесконечно малые последовательности, покажем что тогда {αn + βn } –
тоже бесконечно малая последовательность:
⇓
αn −→ 0, βn −→ 0
n→∞ n→∞
⇓
∀ε > o |αn | < ε & |βn | < ε – верно для почти всех n ∈ N
⇓
ε ε
∀ε > o |αn | < & |βn | < – верно для почти всех n ∈ N
2 2
⇓
ε ε
∀ε > o |αn + βn | 6 |αn | + |βn | < + – верно для почти всех n ∈ N
2 2
⇓
{αn + βn } – бесконечно малая
Точно так же рассматривается случай {αn − βn }.
3. Пусть снова {αn } и {βn } – бесконечно малые последовательности, покажем что {αn · βn } –
тоже бесконечно малая последовательность:
⇓
αn −→ 0, βn −→ 0
n→∞ n→∞
⇓
∀ε > 0 |αn | < ε & |βn | < ε – верно для почти всех n ∈ N
⇓
∀ε ∈ (0; 1) |αn | < ε & |βn | < ε – верно для почти всех n ∈ N
⇓
∀ε ∈ (0; 1) |αn · βn | = |αn | · |βn | < ε2 < ε – верно для почти всех n ∈ N
⇓
∀ε > o |αn · βn | < ε – верно для почти всех n ∈ N
⇓
{αn · βn } – бесконечно малая.
⇓
D + |C| + 1
>
z}|{
∀D > 0 |yn +xn | > (3.1.10) > |yn | −|xn | > (D+|C|+1)−|C|−1 = D – верно для почти всех n ∈ N
| {z }
<
−|C| − 1
⇓
xn + yn −→ ∞
n→∞
E (2.2.242)
n> nk = (1 + (n − 1))k >
α
(3.2.42)
которое по теореме Архимеда 3.2.1 выполняется > 1 + k · (n − 1) = 1 − k + k · n −→ +∞
n→∞
для почти всех n. Это означает, что
⇓ ◦
5 на с.214
n · α −→ +∞
n→∞ nk −→ ∞
n→∞
2. Если же α < 0, то для любого E > 0 усло-
2. Пусть k < 0. Тогда −k > 0, и, по уже дока-
вие
занному,
n · α < −E
n−k −→ ∞
n→∞
эквивалентно условию
⇓ теорема 3.2.4
E
n>− 1
α nk = −→ 0
n−k n→∞
и опять по теореме Архимеда 3.2.1 это выполня-
ется для почти всех n. Это означает, что
⋄ 3.2.32. Последовательность an является
n · α −→ −∞
n→∞ – бесконечно малой, если |a| < 1;
– бесконечно большой, если |a| > 1.
216 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
То есть, и мы получаем
( уже
n ∞, если |a| > 1 n доказано
lim a = (3.2.44) 1 1
n→∞ 0, если |a| < 1 = −→ ∞
|a|n a n→∞
(2.2.242)
|a|n = an = (1+(a−1))n > 1+n·(a−1) −→ ∞ ⊲ 3.2.33. Какие из последовательностей явля-
n→∞
ются бесконечно малыми, а какие – бесконечно
⇓ 5◦ на с.214 большими?
1
an −→ ∞ 1) xn = n,
n→∞ 1
2) xn = n2 ,
Если же a < −1, то |a| = −a > 1, и по уже дока- 3) xn = n,
занному,
4) xn = (−1)n · n,
|a|n = (−a)n −→ ∞ n
n→∞
5) xn = (−1)
n ,
1 1 2
2. Пусть наоборот, |a| < 1. Тогда a = |a| > 1, 7) xn = n .
xn −→ a
n→∞
⇓ теорема 3.2.5
xn = a + αn
|{z}
n
↓ ↓
∞
0
⇓
C · xn = C · a + C · αn
| {z }
n
↓ ↓ (свойство 10 на с.213)
∞
0
⇓ теорема 3.2.5
C · xn −→ C · a
n→∞
0
2. Свойство 2 :
xn −→ a, yn −→ b
n→∞ n→∞
⇓ теорема 3.2.5
§ 2. Предел последовательности 217
xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
⇓
xn + yn = a + b + αn + βn
| {z }
n
↓ ↓ (свойство 20 на с.213)
∞
0
⇓ теорема 3.2.5
xn + yn −→ a + b
n→∞
⇓ теорема 3.2.5
xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
⇓
свойство 10
на с.213
0
∞
↑ ↑
n
z }| {
xn · yn = a · b + αn · b + a · βn + αn · βn
| {z } | {z }
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
свойство 10 свойство 30
на с.213 на с.213
| {z }
n
↓ ↓ (свойство 20 на с.213)
∞
0
⇓ теорема 3.2.5
xn · yn −→ a · b
n→∞
1 1
xn −→ a (xn 6= 0 & a 6= 0) =⇒ −→
n→∞ xn n→∞ a
Доказательство. По условию, a 6= 0, значит либо a < 0, либо a > 0.
1
1. Рассмотрим сначала случай, когда a > 0. Тогда в силу (2.1.29), a > 0. Выберем произвольное
ε такое, что
1
0<ε<
a
Тогда
ε · a > 0 > −ε · a
⇓
1+ε·a>1 > 1−ε·a
218 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
⇓
1 1
<1<
1+ε·a 1−ε·a
⇓
a a
<a<
1+ε·a 1−ε·a
⇓ предложение 3.2.2
a a
∃δ > 0 : <a−δ <a<a+δ <
1+ε·a 1−ε·a
Запомним это число δ и заметим теперь цепочку:
xn −→ a
n→∞
⇓
xn ∈ (a − δ, a + δ) – выполняется для почти всех n ∈ N
⇓
a a
< a − δ < xn < a + δ < – выполняется для почти всех n ∈ N
1+ε·a 1−ε·a
⇓
a a
< xn < – выполняется для почти всех n ∈ N
1+ε·a 1−ε·a
⇓
1+ε·a 1 1−ε·a
> > – выполняется для почти всех n ∈ N
a xn a
⇓
1 1 1
+ε> > − ε – выполняется для почти всех n ∈ N
a xn a
⇓
1 1 1
∈ − ε, + ε – выполняется для почти всех n ∈ N
xn a a
Мы получили, что любая “маленькая” окрестность a1 − ε; a1 + ε точки a1 (радиуса ε < a1 ) содер-
жит почти все элементы последовательности x1n . Отсюда следует, что любая “большая” окрестность
1 1
1 1 1
a − ε; a + ε точки a (радиуса ε > a ) тоже содержит почти все элементы последовательности xn
(потому что в ней можно выбрать какую-нибудь “маленькую” окрестность, которая будет содержать
почти все x1n ). Вместе это означает, что x1n −→ a1 .
n→∞
2. Мы доказали нашу лемму для случая, когда a > 0. Рассмотрим теперь случай a < 0. Тогда
будет по уже доказанному свойству 10 с.216 последовательность yn = −xn стремиться к числу
−a > 0. Значит, в силу уже доказанного в нашей лемме,
1 1
−→
yn n→∞ −a
откуда опять по свойству 10 с.216,
1 1 1 1
=− −→ − =
xn yn n→∞ −a a
Доказательство свойства 40 .
0 0
6=
6=
xn −→ a, yn −→ b
n→∞ n→∞
лемма 3.2.6 ⇓
1
−→ a1
xn n→∞
| {z }
⇓ 0
свойство 3 на с.216
yn 1 1 b
= · yn −→ ·b=
xn xn n→∞ a a
§ 2. Предел последовательности 219
⋄ 3.2.34. Проверьте, будут ли следующие после- n2 + 1 n2 + 1
xn = , xn = ,
довательности ограничены? n n
(−1)n lim n o
n→∞ 3 +5
lim =0 n − nn+5
n→∞ n
C C
= 0 = ∞, (3.2.50)
∞ 0
∞ 0
= ∞ = 0 (3.2.51)
C C
C +∞= ∞ C·∞= ∞ (3.2.52)
∞+∞= ∞ ∞·∞= ∞ (3.2.53)
∞ 0
=? =? (3.2.54)
∞ 0
∞−∞= ? 0·∞ = ? (3.2.55)
0 0
15n2 + 75n + 125 − 14n2 + 49n
✒ ✒ = lim =
5 7 n→∞ n2
3+ + 2
3n2 + 5n + 7 n n2 n + 26n + 125
lim = lim = = lim =
n→∞ 8n2 − 4n + 1 n→∞ 4 1 n→∞ n2 !
| {z } 8− +
n n2
делим числитель 26 125
и знаменатель на n2 ❘
❅ ❘
❅ = lim 1+ + =1+0+0=1
n→∞ n n2
0 0
3+0+0 3 ❘0
❅ ❘0
❅
= =
8−0−0 8
⋄ 3.2.42. Докажем формулу:
⋄ 3.2.39. Вычислим предел
5n2 − n + 1
0,
k<l
lim 3 Cnk 1
n→∞ n + n2 + 2 −→ k! , k=l (3.2.56)
nl n→∞
∞, k > l
Здесь у нас уже достаточно опыта, чтобы сооб-
разить сразу, что первая попытка “подставить в
лоб” снова приведет к неопределенности, поэто- Доказательство. Начнем со случая k = l:
му мы можем сразу перейти к преобразованию
дроби: Cnk n!
= k =
nk n · k! · (n − k)!
0 0 0 k множителей
✒ ✒ ✒ z }| {
5 1 1 n · (n − 1) · ... · (n − k + 1)
− + = =
5n2 − n + 1 n n2 n3
lim 3 2
= lim = · ... · n} ·k!
|n · n{z
n→∞ n +n +2 n→∞ 1 2 k множителей
| {z } 1+ +
n n3 0 0
делим числитель
и знаменатель на ❘0
❅ ❘0
❅ ✒
✒
максимальную степень n, 1 k−1
то есть на n3 1− · ... · 1 −
n n 1
0−0+0 = −→
= =0 k! n→∞ k!
1+0+0
После этого при k < l мы получим:
⋄ 3.2.40. В следующем примере читатель уже
сразу должен сообразить, что без преобразова- Cnk 1 Cnk
ний ничего не получится, поэтому о “подстановке = · −→ 0
nl nl−k nk n→∞
в лоб” мы уже и не заикаемся:
❘0
❅ ❘
❅ 1
0 0 k!
✒ ✒
1 5
А при k > l мы получим:
4 2 1+ +
n +n +5 n2 n4
lim 3
= lim = Cnk Cnk
| − {z
n 3n + 2}
n→∞ n→∞ 1 3 2 k−l
− + = n · −→ ∞
n n3 n4 nl nk n→∞
делим числитель
❘
❅
и знаменатель на ❘0
❅ ❘0
❅ ❘0
❅ ∞ ❅ 1
❘
максимальную степень n, k!
то есть на n4
1+0+0 1
= = = ∞
0−0+0 0 ↑
(3.2.50) ⊲⊲ 3.2.43. Вычислите пределы
2−n
⋄ 3.2.41. 1) limn→∞ 3n+4
n2 −3
раскрываем скобки 2) limn→∞ 3n−4n2
z }| {
3+2n+n2
(n + 5)3 − n(n + 7)2 3) limn→∞ 4−9n+4n3
lim 2
=
n2 +1 3n2 +1
nn
n→∞
4) limn→∞ 2n+1 − 6n+1
= lim n3 + 15n2 + 75n + 125− n2 +2n+1
n→∞ 5) limn→∞
o n o n+5
− n(n2 + 14n + 49) : n2 = 6) limn→∞ n3 −n2 +1
5−n−n2
222 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
xn 6 yn (3.2.57)
и сходятся
xn −→ a yn −→ b
n→∞ n→∞
a6b
a−b
Доказательство. Предположим, что b < a. Тогда можно взять ε = 2 . Из xn −→ a будет следо-
n→∞
вать, что почти все числа xn лежат в окрестности (a − ε; a + ε). То есть, для почти всех номеров
n ∈ N выполняется неравенство
a − ε < xn < a + ε
С другой стороны, из yn −→ a будет следовать, что почти все числа yn лежат в окрестности
n→∞
(b − ε; b + ε). То есть, для почти всех номеров n ∈ N выполняется неравенство
b − ε < yn < b + ε
Таким образом, у нас получается, что для почти всех номеров n ∈ N выполняются неравенства
yn < b + ε = a − ε < xn
Аналогично доказывается
xn 6 yn
тогда
— если xn −→ +∞, то yn −→ +∞;
n→∞ n→∞
— если yn −→ −∞, то xn −→ −∞.
n→∞ n→∞
xn 6 yn 6 zn
xn −→ C zn −→ C
n→∞ n→∞
yn −→ C
n→∞
3 Этот результат используется ниже в разных ситуациях, в частности, при доказательстве теоремы 3.3.4 о сохра-
нении знака непрерывной функцией
4 Эта теорема также используется довольно часто, например, при доказательстве теоремы Больцано-Вейерштрасса
3.2.13, при доказательстве непрерывности модуля, синуса и косинуса (предложение 4.1.32) и при доказательстве
замечательных пределов (теоремы 4.2.4 и 4.2.5).
§ 2. Предел последовательности 223
C − ε < xn
C − ε < xn 6 yn
zn < C + ε
yn 6 zn < C + ε
C − ε < yn yn < C + ε
Это означает, что почти все числа yn содержатся в окрестности (C − ε; C + ε) точки C. Поскольку
это верно для любой окрестности, мы получаем, что yn −→ C,
n→∞
– убывающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...
– неубывающей, если
x1 6 x2 6 x3 6 ... 6 xn 6 xn+1 6 ...
– невозрастающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...
⋄ 3.2.45. Последовательность xn = 1
n монотонна (точнее, возрастает) и неограничена;
(точнее, убывает) и ограничена;
(−1)n
⋄ 3.2.46. Последовательность xn = n монотонна ⋄ 3.2.47. Последовательность xn = n немо-
§ 2. Предел последовательности 225
нотонна, но ограничена;
lim xn = sup xn
n→∞ n∈N
lim xn = inf xn
n→∞ n∈N
Доказательство. Если последовательность {xn } монотонна, то это значит, что она или неубываю-
щая, или невозрастающая. Докажем теорему для случая, когда {xn } – неубывающая (случай, когда
она невозрастающая рассматривается аналогично):
B − ε < xk 6 xn
Итак, получается, что любая окрестность (B−ε, B+ε) точки B содержит почти все точки последова-
тельности {xn }. Значит
lim xn = B
n→∞
⋄ 3.2.48. Покажем, что последовательность, за- 1. Вычислим сначала несколько первых эле-
данная рекуррентно ментов последовательности {xn }, и нарисуем
1 1
x1 = 2, xn+1 = xn +
2 xn
Теорема о вложенных отрезках. Пусть дана последовательность отрезков [an ; bn ] такая, что
каждый последующий содержится в предыдущем:
bn − an −→ 0 (3.2.65)
n→∞
A = lim an B = lim bn
n→∞ n→∞
то есть
A=B
Итак, мы получили, что можно взять C = A = B, и тогда будет выполняться (3.2.67). По теореме
Вейерштрасса 3.2.11, получаем
и это означает, что C принадлежит всем интервалам [an ; bn ]. Наконец, такая точка C (обладающая
свойством (3.2.66)), единственна, потому что если бы существовала какая-то другая точка C ′ с тем
же самым свойством (3.2.66), отличющаяся от C, например, большая, чем C, то мы получили бы,
цепочку неравенств
из которых следовало бы, что расстояние между концами любого отрезка [an ; bn ] не меньше чем
фиксированное число ∆ = C ′ − C
b n − an > C ′ − C = ∆ > 0
nk −→ +∞
k→∞
Тогда можно рассмотреть последовательность yk = xnk (зависящую от индекса k). Она называется
подпоследовательностью числовой последовательности xn .
6 Этот результат используется ниже при доказательстве теоремы Больцано-Вейерштрасса 3.2.13 и при доказатель-
⋄ 3.2.50. Пусть, скажем, нам дана последова- ⊲⊲ 3.2.52. Какую нужно взять последователь-
тельность ность индексов {nk }, чтобы последовательность
1 {yk } была подпоследовательностью последова-
xn =
n тельности {xn }?
Если взять
nk = k 2 1) xn = n1 , yk = k13
2) xn = (−1)n , yk = −1
то мы получим подпоследовательность
1 1 ⊲⊲ 3.2.53. Является ли данная последователь-
yk = xnk = = 2 ность {yk } подпоследовательностью последова-
nk k
тельности {xn }? (Если да, то указать соответ-
⋄ 3.2.51. Пусть ствующую последовательность индексов {nk }.)
n
xn = (−1) 1) xn = n, yk = k 2 ,
Если взять 2) xn = n2 , yk = k,
nk = 2k 3) xn = n, yk = 2.
то мы получим подпоследовательность
yk = xnk = (−1)nk = (−1)2k = 1
Свойства подпоследовательностей
1◦ . Если последовательность {xn } стремится к числу a, то любая ее подпоследователь-
ность {xnk } тоже стремится к числу a:
xn −→ a =⇒ xnk −→ a
n→∞ k→∞
б) Доказательство с явной ссылкой на аксиому выбора. Пусть supn∈N |xn | = +∞. Это значит, что
∀k ∈ N {n ∈ N : |xn | > k} 6= ∅
то есть
|xnk | > k, k ∈ N.
Отсюда следует xnk −→ ∞.
k→∞
◦
4. Свойство 4 доказывается тем же приемом, только номера nk здесь нужно выбирать так,
чтобы выполнялись не одно, а два условия:
Можно заметить, что иногда получается, что, хотя данная последовательность {xn } расходится
(то есть не имеет предела), тем не менее, выбранная подпоследовательность {yk } сходится.
n
⊲⊲ 3.2.54. Для данной последовательности {xn } 3) xn = n(−1) ,
укажите какую-нибудь сходящуюся подпоследо- n
4) xn = (−1)n · n(−1) −1 ,
вательность {xnk }, если она существует.
5) xn = n · (1 + (−1)n ),
1) xn = (−1)n · n, 2+(−1)n
6) xn = 2 − n1 ,
(−1)n 1+(−1)n n−1 3
2) xn = n + 2 , 7) xn = (−1) · 2+ n .
diam I = b − a
card{n ∈ N : xn ∈ I} = ∞
card{n ∈ N : xn ∈ J} = ∞
Доказательство. Это очевидно: разделим отрезок I на два равных (по длине) отрезка J и K. По
крайней мере в одном из них должно содержаться бесконечное число элементов {xn } (потому что
иначе получилось бы, что J и K содержат конечный набор элементов {xn }, и значит их объединение
I = J ∪ K тоже содержит конечный набор элементов.
Доказательство теоремы 3.2.13. В соответствии с обещанием на с.228, мы даем здесь два доказа-
тельства: приемом бесконечнократного выбора и с явной ссылкой на аксиому (счетного) выбора.
8 Этот результат используется ниже при доказательстве критерия Коши сходимости числовой последовательности
(теорема 3.2.15), а также при доказательстве теорем Вейерштрасса об ограниченности и об экстремумах (теоремы
3.3.7 и 3.3.8) и теоремы Кантора о равномерной ограниченности (теорема 3.3.10)
§ 2. Предел последовательности 231
Первые два свойства означают, что [ak ; bk ] – последовательность вложенных отрезков, значит,
по теореме 3.2.12 о вложенных отрезках, существует число C такое что
lim ak = C = lim bk
k→∞ k→∞
ak 6 xnk 6 bk
и поэтому мы можем применить теорему о двух милиционерах 3.2.10, из которой следует, что
lim xnk = C
k→∞
J ∈I ⇐⇒ J ⊆I & card{n ∈ N : xn ∈ J} = ∞
(множество I непусто, потому что, например, I ∈ I). Пусть теперь I1 , I2 , ..., Ik – конечная по-
следовательность отрезков, удовлетворяющая таким условиям:
diam Ii
{I1 , ...Ik } ⊆ I, I1 ⊃ I2 ⊃ ... ⊃ Ik , ∀i < k diam Ii+1 = , (3.2.69)
2
Тогда по лемме 3.2.14, найдется отрезок J со свойствами:
diam Ik
J ∈ I, J ⊂ Ik , diam J = . (3.2.70)
2
Это наблюдение можно переформулировать таким хитрым образом: для любой последователь-
ности I1 , I2 , ..., Ik , удовлетворяющей условиям (3.2.69), множество J (I1 , I2 , ..., Ik ) всех отрезков
J, удовлетворяющих условиям (3.2.70), непусто:
diam Ik
J (I1 , I2 , ..., Ik ) = J ∈ I : J ⊂ Ik , diam J = 6= ∅
2
Теперь мы применяем аксиому выбора: должно существовать отображение (I1 , I2 , ..., Ik ) 7→ G(I1 , I2 , ..., Ik ),
которое каждой последовательности (I1 , I2 , ..., Ik ) отрезков, удовлетворяющих условиям (3.2.69),
232 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
ставит в соответствие отрезок G(I1 , I2 , ..., Ik ), принадлежащий J (I1 , I2 , ..., Ik ), то есть удовлетво-
ряющий условиям
diam Ik
G(I1 , I2 , ..., Ik ) ∈ I, G(I1 , I2 , ..., Ik ) ⊂ Ik , diam G(I1 , I2 , ..., Ik ) = . (3.2.71)
2
После этого мы применяем теорему 2.2.7 об определениях частной индукцией: если положить
I1 = I, то это определит последовательность {Ik } ∈ I, содержащую I1 в качестве первого эле-
мента и удовлетворяющую условию
G(I1 , ..., Ik ) = Ik+1 , k<N
Но здесь верхняя грань равна бесконечности, потому что наше отображение G было определено
на всех конечных последовательностях со свойствами (3.2.69). Поэтому последовательность {Ik },
определяемая теоремой 2.2.7 должна быть бесконечной.
Теперь каждый отрезок {Ik } содержит бесконечный набор элементов {xn }, поэтому
{n > k : xn ∈ Ik } 6= ∅
Отсюда по аксиоме счетного выбора (с.202) следует, что существует последовательность номеров
nk ∈ {n > k : xn ∈ Ik }
pi −→ ∞, qi −→ ∞ (3.2.72)
i→∞ i→∞
xn −→ ∞
n→∞
Лемма 3.2.17. Если последовательность {xn } обладает свойством (i) теоремы 3.2.15, то она
ограничена.
Доказательство. Предположим, что это не так, то есть что {xn } – неограниченная последова-
тельность, обладающая свойством (i). Тогда по свойству 30 предыдущего параграфа, нашлась бы
подпоследовательность {xnk } такая что
xnk −→ ∞
k→∞
а по лемме 3.2.16 это означало бы, что можно выбрать подпоследовательность {xnki } последова-
тельности {xnk } такую что
xnki − xnki−1 −→ ∞
k→∞
pi = nki , qi = nki−1
Но это невозможно, потому что {xn } обладает свойством (i). Значит, наше исходное предположение
(о том, что {xn } – неограниченная последовательность) неверно. То есть {xn } обязательно ограни-
чена.
Доказательство теоремы 3.2.15. Убедимся сначала что условия (i) и (ii) действительно эквива-
лентны.
1. Импликация (i) ⇒ (ii) очевидна: если выполняется (i) то есть любые две подпоследователь-
ности {xpi } и {xqi } последовательности {xn } стремятся друг к другу
xpi − xqi −→ 0,
i→∞
то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение
2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(3.2.75). Возьмем какие-нибудь две бесконечно большие последовательности индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
234 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
xmax{pi ;qi } − xmin{pi ;qi } , если pi > qi xki +li − xki , если pi > qi
xpi − xqi = x − xmax{pi ;qi } , если pi < qi = xk − xki +li , если pi < qi
min{pi ;qi } i
0, если pi = qi 0, если pi = qi
Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {xn } сходится, то есть существует конечный
предел
lim xn = a
n→∞
то {xn } обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие по-
следовательности индексов {pi }, {qi } ⊆ N
pi −→ ∞, qi −→ ∞
i→∞ i→∞
xpi − xqi −→ a − a = 0
i→∞
xni −→ a (3.2.77)
i→∞
pi = i, qi = ni
n
⊲⊲ 3.2.55. Проверьте с помощью критерия Коши 1) xn = 3(−1) ;
сходимость последовательностей: 2
2) xn = { n n+1 }.
Теорема Штольца-Чезаро.
Теорема 3.2.18 (О.Штольц, Э.Чезаро). 10
Пусть {yn } и {zn } – две последовательности, причем
(i) {yn } строго монотонна:
y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ... (3.2.79)
zn − zn−1
lim =A (3.2.81)
n→∞ yn − yn−1
zn zn − zn−1
lim = lim =A (3.2.82)
n→∞ yn n→∞ yn − yn−1
сводится к случаю возрастающей заменой ỹn = −yn , (ỹ1 < ỹ2 < ... < ỹn < ...). Заодно можно счи-
тать, что все yn положительны:
0 < y1 < y2 < ... < yn < ... (3.2.83)
zn −zn−1
Из условия (iii) следует, что yn −yn−1 представимо в виде
zn − zn−1
= A + αn , (3.2.84)
yn − yn−1
где
αn −→ 0 (3.2.85)
n→∞
⇓
zn − zn−1 = αn · (yn − yn−1 ) + A · (yn − yn−1 )
z
n−1 − zn−2 = αn−1 · (yn−1 − yn−2 ) + A · (yn−1 − yn−2 )
...
zN +1 − zN = αN +1 · (yN +1 − yN ) + A · (yN +1 − yN )
⇓ (складываем уравнения)
⇓
zn − zN = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + A · (yn − yN )
⇓
zn − A · yn = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + zN − A · yN
⇓
>
(3.2.86) (3.2.86)
ε ε
2 2
ε ε
< · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2 | {z } 2 | {z }
<
<
(3.2.79) (3.2.79)
0 0
ε ε
= · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2 2
ε
= · yn − yn−1 + ... + yN +1 − yN + zN − A · yN =
2 | {z }
после сокращений остаются
только первое и последнее слагаемое
0
>
(3.2.83)
ε z}|{ ε ε
= · yn − yN + zN − A · yN < · yn + · yn = ε · yn
2 | {z } | {z } 2 2
>
>
yn (3.2.87)
ε
2 · yn
zn − A · yn < ε · yn
⇓
zn
−A <ε
yn
У нас получилось, что для всякого ε > 0 найдется M такое, что
zn
∀n > M −A <ε
yn
То есть
zn
∀n > M −ε< −A<ε
yn
§ 2. Предел последовательности 237
zn
Иными словами, для любого ε > 0 почти все числа yn − A лежат в интервале (−ε, ε). Значит,
zn
− A −→ 0
yn n→∞
то есть,
zn
−→ A
yn n→∞
[x·10k ]
N
X − xk−1 · 10k
10k
−k
xN = a−k · 10 (3.2.94)
=
a−k
Доказательство. 1. Начнем с (3.2.89):
⇓
{x · 10N } ∈ [0, 1) (2.2.294)
a−k ∈ {0, 1, ..., 9}
⇓ 3. Формула (3.2.94) доказывается индукцией.
При N = 1 она принимает вид:
[x · 10N ] x1 = a−1 · 10−1 ,
x − xN = x − =
10N
x · 10N [x · 10N ] x · 10N − [x · 10N ] и это эквивалентно (3.2.91). Далее, если (3.2.94)
= N
− N
= = верна для N = m,
10 10 10N
m
{x · 10N } 1 X
= (2.2.292) = ∈ 0, N a−k · 10−k = xm ,
10N 10
k=1
238 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Xn X n Xn k
1 1 1 ⇓
En = 6 k−1
= 2 · =
k! 2 2 Em 6 e (m ∈ N)
k=0 k=0 k=0
n+1 n+1
1 − 12 1 − 21 ⇓
= (2.2.246) = 2 · =2· =
1 − 21 1
2 E = lim Em 6 e
n+1 ! m→∞
1 1 2. Докажем теперь (3.2.98). Первое неравен-
=4· 1− = 4 − n−1 < 4,
2 2 ство здесь следует из возрастания последова-
тельности En :
и значит она ограничена сверху.
По теореме Вейерштрасса 3.2.11 получаем, e = lim Em = sup Em > En+1 > En
m→∞ m∈Z+
что она имеет предел. Обозначим его буквой E:
⇓
En −→ E
n→∞ e − En > 0
Наша задача – проверить, что E = e. С одной А второе – из неравенства (2.2.245): для любых
стороны, n, p ∈ N мы получим
n n
X (n + m)! > n! · (n + 1)m (2.2.245)
1 1
1+ = (2.2.251) = Cnk · k =
n n ⇓
k=0
n
X n! 1 1 1
= · k = 6
k! · (n − k)! n (n + m)! n! · (n + 1)m
k=0
n k ⇓
X 1 n! 1
= · · =
k! (n − k)! n n+p
X n
X n+p
X 1
k=0 1 1
Xn En+p − En = − = =
1 1 1 k! k! k!
= · n · ... · (n − k + 1) · · ... · = k=0 k=0 k=n+1
k! | {z } |n {z n}
Xp
k=0 m=k−n 1
k множителей
k множителей = k =m+n = 6
n
X 16m6p (n + m)!
1 n n−1 n−k+1 m=1
= · · · ... · = Xp p m
k! 1 1 X 1
k=0 |n n {z n }
6 = · =
k множителей
m=1
n! · (n + 1)m n! m=1 n + 1
Xn p+1
1 1 k−1 1 1
= ·1· 1− · ... · 1 − 6 1 n+1 − n+1
k! n n = (2.2.247) = · =
k=0 | {z } n! 1
k множителей, и все 6 1
1 − n+1
p p
Xn 1 1
6
1
= En 1 1 − n+1 1 1 − n+1
k! = · = ·
k=0 n! n + 1 − 1 n! n
⇓ ⇓
p
n 1
1 1 1 − n+1
e = lim 1 + 6 lim En = E En+p − En 6 ·
n→∞ n n→∞ | {z } |n! {z n }
(p → ∞) ↓
А с другой – при любом m 6 n e − En
↓ (p → ∞)
1
n!·n
Pm 1
Em = k=0 k!
⇓
↑ (n → ∞) 1
z }| { e − En 6
Xm n! · n
1 1 k−1
·1· 1− · ... · 1 − 6
k! n n
k=0
n ! 3.2.60. Двойное неравенство (3.2.99) позволяет
X 1 1 k−1
6 ·1· 1− · ... · 1 − = оценивать число e. Для нахождения двух первых
k! n n знаков после запятой можно взять n = 7:
k=0
n 7 7
1 X 1 X 1 1
= 1+ <e6 +
n k! k! 7! · 7
| {z } k=0 k=0
↓ (n → ∞) Значения величин справа и слева можно при-
e ближенно вычислить (на бумаге, или с помощью
§ 3. Непрерывные функции 241
калькулятора), получив оценки сверху и снизу, Доказательство. Предположим, что оно рацио-
из которых затем выводится оценка для e: с од- нально, то есть имеет вид
ной стороны,
m
e=
1 n
8!·8 = 0, 000198412698...
⇓ для некоторых m, n ∈ N. Из оценки (3.2.100) сле-
1
0, 00019 < 8!·8 < 0, 0002 дует, что n > 2 (потому что при n = 1 мы получи-
с другой – ли бы, что e целое). Запомним это. Из двойного
неравенства (3.2.98) мы получаем:
P8 1
= 2, 71827877... n
m X 1
k=0 k!
⇓ 1
P8 0< − 6
1
2, 718 < k=0 k! < 2, 719 n k! n! · n
k=n
⇓ n
X
0 < m · (n − 1)! − n · (n − 1) · ... · (n − k) 6
| {z } | {z }
k=n
целое целое
2, 71 < e < 2, 72 (3.2.100) | {z }
целое
⇓ 1 1
6 6
n 2
e = 2, 71... (3.2.101)
Мы получаем, что в полуинтервале 0; 12 лежит
Теорема 3.2.22. Число e иррационально: какое-то целое число. Понятно, что это невоз-
можно, и значит наше предположение (о раци-
e∈/Q ональности e) было неверным.
§3 Непрерывные функции
(a) Что такое непрерывная функция?
Пусть нам дано уравнение, связывающее две физические величины,
y = f (x),
и мы говорим, что y непрерывно зависит от x. Что это означает? Интуитивный ответ очевиден:
непрерывная функция – это такая, у которой график – непрерывная линия.
1, если x > 0
f (x) = x2 sgn x = 0, если x = 0
−1, если x < 0
непрерывна, потому что у нее график – непре- разрывна, потому что у нее график имеет раз-
рывная линия рыв:
242 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Однако, это соображение не может быть точным определением, потому что оно объясняет смысл
одного нового понятия (непрерывная функция) с помощью другого нового понятия (непрерывная
линия).
Как же быть? Оказывается, имеется очень простой способ объяснить, что такое непрерывная
функция, опираясь на известное нам уже (то есть, старое для нас) понятие предела последователь-
ности. Это делается с помощью следующей серии определений.
• Функция f , определенная на множестве E ⊆ R, называется
– непрерывной в точке a ∈ E на множестве E, если f определена на множестве E, и
для всякой последовательности точек xn ∈ E, сходящейся к точке a,
xn −→ a xn ∈ E
n→∞
Доказательство. Ясно, что из (i) следует (ii), потому что если f непрерывна в a, то f (xn ) −→ f (a)
n→∞
для любой последовательности xn −→ a (необязательно монотонной). Докажем, что наоборот если
n→∞
(i) не выполняется, то не выполняется и (ii). Пусть f – разрывная функция на M , то есть существует
последовательность xn ∈ M такие что
xn −→ a & 6
f (xn )−→ f (a)
n→∞ n→∞
∀k ∈ N f (xnk ) ∈
/ (f (a) − ε; f (a) + ε)
yk −→ a & ∀k ∈ N f (yk ) ∈
/ (f (a) − ε; f (a) + ε)
k→∞
∀k ∈ N yk 6= a
потому что иначе мы получили бы, что для некоторых k числа f (yk ) = f (a) лежат в интервале
(f (a) − ε; f (a) + ε). Отсюда следует, что либо бесконечный набор этих чисел лежит левее a, либо
бесконечный набор этих чисел лежит правее a. Будем для определенности считать, что выполняется
первое (второй случай рассматривается по аналогии):
yk < a.
∀i ∈ N yki < a
i1 = 1, t1 = z 1
Затем, если для m = 1, ..., l числа im и tm определены, мы замечаем вот что. Поскольку zi < a,
zi −→ a и tl < a, найдется такое il+1 , что zil+1 лежит в интервале (tl ; a):
i→∞
zil+1 > tl
tm = zim −→ a
m→∞
∀m ∈ N f (tm ) = f (zim ) ∈
/ (f (a) − ε; f (a) + ε)
Теорема 3.3.3 (о композиции непрерывных функций). Если функции f и g непрерывны (на обла-
сти определения), то их композиция h(x) = g(f (x)) тоже непрерывна (на области определения).
f (xn ) −→ f (a)
n→∞
Мы получили, что если xn −→ a, то h(xn ) = g(f (xn )) −→ g(f (a)). Это означает, что h(x) = g(f (x))
n→∞ n→∞
непрерывна в точке x = a. Поскольку точка a с самого начала выбиралась произвольной, получаем,
что h(x) = g(f (x)) непрерывна в произвольной точке, то есть всюду на области определения.
Доказательство. Пусть для определенности f (c) > 0, покажем что для некоторого δ > 0 выполня-
ется соотношение
∀x ∈ (c − δ; c + δ) f (x) > 0 (3.3.110)
11 Эта теорема используется далее в главе 5 при доказательстве теоремы 5.2.15 о точках перегиба.
248 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Разделим отрезок [a; b] пополам. Если значение функции в середине отрезка равно нулю, то теорема
доказана. Если же нет, то выберем из двух половинок ту, у которой на концах функция ϕ принимает
§ 3. Непрерывные функции 249
Проделаем то же самое с отрезком [a1 ; b1 ]: разделим его пополам, выберем ту половинку, на концах
которой ϕ(x) меняет знак, и обозначим ее [a2 ; b2 ]:
Затем поделим отрезок [a2 ; b2 ], и так далее. В результате у нас получится цепочка вложенных
отрезков, на концах которых функция меняет знак:
b−a
[a; b] ⊃ [a1 ; b1 ] ⊃ [a2 ; b2 ] ⊃ ... b n − an = −→ 0, ϕ(an ) < 0 < ϕ(bn )
2n n→∞
По теореме 3.2.12 о вложенных отрезках, существует единственная точка c, принадлежащая всем
отрезкам [an ; bn ], причем
lim an = c = lim bn
n→∞ n→∞
И следовательно, ϕ(c) = 0.
Теорема 3.3.6 (Коши о промежуточном значении). 12 Пусть функция f непрерывна на отрезке
[a; b], и пусть C – произвольное число, лежащее между f (a) и f (b):
f (a) < C < f (b) или f (a) > C > f (b)
f (c) = C
ϕ(x) = f (x) − C
Она будет непрерывна на отрезке [a; b] (как разность непрерывных функций) и принимает на концах
этого отрезка значения разных знаков
ϕ(a) = f (a) − C < 0 < f (b) − C = ϕ(b) или ϕ(a) = f (a) − C > 0 > f (b) − C = ϕ(b)
Поэтому, по лемме 3.3.5, существует точка c ∈ [a; b] такая, что ϕ(c) = 0. Отсюда f (c) = ϕ(c) + C =
C.
Теоремы Вейерштрасса
Теорема Вейерштрасса об ограниченности. Напомним, что функция f называется
– ограниченной сверху на множестве E, если существует число B такое, что
∀x ∈ E f (x) 6 B
∀x ∈ E A 6 f (x)
∀x ∈ E A 6 f (x) 6 B
12 Эта теорема используется далее на с.435 при доказательстве теоремы о среднем для определенного интеграла.
250 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Но с другой стороны, функция f непрерывна в любой точке отрезка [a; b], и в частности в точке
c ∈ [a; b], значит из (3.3.114) следует
Мы получили противоречие между (3.3.115) и (3.3.116), которое означает, что наше исходное пред-
положение было неверно. Значит, функция f все-таки ограничена.
∀x ∈ E f (x) 6 f (xmax )
∀x ∈ E f (xmin ) 6 f (x)
13 Эта теорема используется в следующем параграфе при доказательстве теоремы Вейерштрасса об экстремумах
3.3.8
§ 3. Непрерывные функции 251
⋄ 3.3.18. Пусть E = [−1; 1] и f (x) = x2 . точка минимума и нет точек максимума, при-
чем точная нижняя грань (существует и) совпа-
дает с минимумом, а точная верхняя грань суще-
ствует, но не совпадает с максимумом, которого
на множестве E = (−1; 1) нет (потому что нет
точек максимума):
sup x2 = 1 ∄ max x2
x∈(−1;1) x∈(−1;1)
Тогда на множестве E у функции f имеется одна
точка минимума и две точки максимума, причем
⋄ 3.3.20. Пусть E = R и f (x) = {x}.
минимум совпадает с точной нижней гранью, а
максимум – с точной верхней гранью:
min x2 = x2 =0= inf x2
x∈[−1;1] x=0 x∈[−1;1]
Это значит, что во-первых, все значения функции f на отрезке [a; b] не превосходят M
и во-вторых если взять любое число α < M , то обязательно оно окажется меньше, чем какое-то
значение f (x) на отрезке [a; b]
∀α < M ∃x ∈ [a; b] α < f (x)
Возьмем в качестве α числа вида M − n1 . Тогда у нас получится целая последовательность {xn }:
1
∀n ∈ N ∃xn ∈ [a; b] M − < f (xn ) (3.3.118)
n
14 Эта теорема используется ниже на с.327 при доказательстве теоремы Ролля 5.1.6, на с.433 при доказательстве
теоремы об интегрируемости непрерывной функции 7.2.4, и на с.438 при доказательстве интегральной теоремы о
среднем (свойство 7◦ на с.435).
252 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Поскольку последовательность {xn } лежит в отрезке [a; b], она ограничена. Значит по теореме
Больцано-Вейерштрасса 3.2.13, из нее можно выбрать сходящуюся подпоследовательность:
Поскольку f (x) непрерывна в любой точке отрезка [a; b] и, в частности, в точке c ∈ [a; b], мы
получаем
f (xnk ) −→ f (c)
k→∞
Это означает, что c ∈ [a; b] является точкой максимума функции f на множестве [a; b].
Следствие 3.3.9. Множество значений всякой (определенной на отрезке) непрерывной функции
f : [a, b] → R является отрезком.
Доказательство. По теореме 3.3.8 функция f имеет минимум в некоторой точке α ∈ [a, b] и мак-
симум в некоторой точке β ∈ [a, b]:
Покажем, что
R(f ) = [f (α), f (β)].
1. Будем считать для начала, что α < β. Тогда по теореме Коши 3.3.6, любая точка C ∈
(f (α), f (β)) является образом некоторой точки c ∈ (α, β). Значит, весь отрезок [f (α), f (β)] лежит в
R(f ) = f ([a, b]):
[f (α), f (β)] ⊆ R(f ).
Но с другой стороны, никакая точка y, лежащая выше [f (α), f (β)], не может принадлежать f ([a, b]),
потому что тогда мы получили бы, что f (β) — не максимум множества f ([a, b]). И таким же образом,
никакая точка y, лежащая ниже [f (α), f (β)], не может принадлежать f ([a, b]), потому что тогда мы
получили бы, что f (α) — не минимум множества f ([a, b]). Значит,
g(x) = f (−x)
и
−α < −β.
Тогда, по уже доказанному,
R(g) = [g(−α), g(−β)],
и это можно дополнить до цепочки
Рассмотрим последовательность
γn = f (αn ) − f (βn )
То, что она не стремится к нулю
γn −→
6 0
n→∞
означает, что найдется некоторая окрестность нуля (−ε; ε) которая не содержит бесконечное коли-
чество чисел {γn }. Значит можно выбрать подпоследовательность {γnk }, которая вообще не будет
заходить в окрестность (−ε; ε):
∀k |γnk | = |f (αn ) − f (βn )| > ε (3.3.120)
Рассмотрим теперь индексы {nk }. Им соответствует некоторая подпоследовательность {αnk } после-
довательности {αn }. Поскольку она ограничена (из-за того, что αnk ∈ [a; b]), по теореме Больцано-
Вейерштрасса 3.2.13 мы можем выбрать у нее некоторую сходящуюся подпоследовательность {αnkj }:
15 Эта теорема используется на с.433 при доказательстве теоремы об интегрируемости непрерывной функции.
254 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
а это противоречит условию (3.3.120), из которого видно, что расстояние между f (αnkj ) и f (βnkj )
не может быть меньше ε.
Итак, мы предположили, что f (x) не является равномерно непрерывной на [a; b] и получили про-
тиворечие. Это означает, что предположение неверно, и функция f все-таки равномерно непрерывна
на [a; b].
Теорема 3.3.11 (о монотонной функции на отрезке). Пусть функция f определена и строго мо-
нотонна на отрезке I = [a, b], и пусть J – отрезок с концами f (a) и f (b):
(
[f (a); f (b)], если f возрастает
J=
[f (b); f (a)], если f убывает.
Тогда:
(i) если f биективно отображает отрезок I на отрезок J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает отрезок I на отрезок J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.
Это противоречит утверждению 1◦ на с.199: поскольку f возрастает, она должна неубывать, значит
условие x1 > x2 должно влечь за собой условие f (x1 ) > f (x2 ), а у нас получается наоборот, f (x1 ) <
f (x2 ).
2. Покажем, что функция f : I → J непрерывна. Пусть xn −→ x, покажем что f (xn ) −→
n→∞ n→∞
f (x). По теореме 3.3.1, последовательность xn можно считать строго монотонной. Нам придется
рассмотреть два случая.
§ 3. Непрерывные функции 255
и то же для предела последовательности f (xn ) поскольку, в силу (3.3.121), она тоже воз-
растает:
lim f (xn ) = sup f (xn ) (3.3.123)
n→∞ n∈N
⇓
sup yn 6 f (x)
n∈N
f −1 sup yn 6 f −1 f (x) = x (3.3.124)
n∈N
⇓
x 6 f −1 sup yn (3.3.125)
n∈N
То есть
f (x) = sup yn = sup f (xn ) = (3.3.123) = lim f (xn )
n∈N n∈N n→∞
и то же для предела последовательности f (xn ) поскольку, в силу (3.3.121), она тоже воз-
растает:
lim f (xn ) = inf f (xn ) (3.3.127)
n→∞ n∈N
⇓
sup yn > f (x)
n∈N
f −1 inf yn > f −1 f (x) = x (3.3.128)
n∈N
⇓
x > f −1 inf yn (3.3.129)
n∈N
То есть
f (x) = inf yn = inf f (xn ) = (3.3.127) = lim f (xn )
n∈N n∈N n→∞
3. Покажем далее, что f сюръективно отображает I в J, то есть что f (I) = J. Для любого
C ∈ J = [f (a), f (b)] получаем:
— либо C лежит на левом конце отрезка J = [f (a), f (b)], то есть C = f (a), и тогда точка
x = a ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит на правом конце отрезка J = [f (a), f (b)], то есть C = f (b), и тогда точка
x = b ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит внутри отрезка J = [f (a), f (b)], то есть f (a) < C < f (b), и тогда по
теореме Коши о промежуточном значении 3.3.6 найдется точка x ∈ (a, b) такая, что C =
f (x).
4. Инъективность и сюръективность отображения f : I → J означают, что оно является биекци-
ей, и поэтому правило
f (x) = y ⇐⇒ x = f −1 (y)
определяет обратное к нему отображение f −1 : J → I.
5. Проверим, что функция f −1 : J → I строго монотонна. Пусть y1 < y2 – две точки из J.
Обозначим x1 = f −1 (y1 ) и x2 = f −1 (y2 ). Поскольку отображение f −1 биективно, x1 не может быть
равно x2 . Значит, либо x1 < x2 , либо x1 > x2 . Но второе, в силу строгого возрастания f , влечет за
собой неравенство y1 > y2 :
x1 > x2 =⇒ y1 = f (x1 ) > f (x2 ) = y2 ,
что противоречит исходному выбору y1 < y2 . Значит, x1 > x2 тоже невозможно. Мы получаем, что
возможно только неравенство x1 < x2 , и это означает, что функция f −1 строго возрастает:
y1 > y2 =⇒ x1 = f −1 (y1 ) > f −1 (y2 ) = x2 .
6. Осталось убедиться, что функция f −1 : J → I непрерывна. Предположим, что это не так, то
есть что существует последовательность yn ∈ J = [f (a), f (b)] такая что
yn −→ y & f −1 (yn ) −→
6 f −1 (y) (3.3.131)
n→∞ n→∞
§ 3. Непрерывные функции 257
xn = f −1 (yn ) −→
6 f −1 (y) = x
n→∞
и по свойству 2◦ на с.228, это означает, что существует подпоследовательность xnk , лежащая вне
некоторой окрестности (x − ε; x + ε) точки x:
xnk ∈
/ (x − ε; x + ε), ε>0 (3.3.132)
С другой стороны, последовательность xnk лежит в отрезке [a, b], поэтому по теореме Больцано-
Вейерштрасса 3.2.13, у нее должна быть сходящаяся подпоследовательность:
xnki −→ t
n→∞
t = f −1 (f (t)) = f −1 (y) = x
То есть t 6= x и одновременно t = x. Это противоречие означает, что наше предположение (3.3.131)
о разрывности функции f −1 было неверно.
Тогда:
(i) если f биективно отображает интервал I на интервал J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает интервал I на интервал J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.
! 3.3.23. В условиях теоремы из равенства f −1 (J) = I следуют две формулы, которые, несмотря
на свою очевидность, оказываются полезными:16
Доказательство. Как и в доказательстве предыдущей теоремы будем считать, что f строго воз-
растает.
Докажем (i). Пусть f биективно отображает интервал I на интервал J. Тогда у нее имеется
обратная функция f −1 : J → I.
1. Прежде всего, как и в теореме 3.3.11, без труда доказывается, что обратная функция f −1 :
J → I также возрастает.
2. Выберем отрезок [α, β] ⊆ I, и покажем, что f биективно отображает его на отрезок [f (α), f (β)] ⊆
J. Во-первых, из-за монотонности, f действительно отображает [α, β] в [f (α), f (β)]:
α = f −1 (A), β = f −1 (B)
α<β
и, опять мы это уже показали, функция f будет биективно (и строго монотонно) отображать отрезок
[α, β] на отрезок [A, B] = [f (α), f (β)]. Значит, по теореме 3.3.11, обратная функция f −1 : [A, B] →
[α, β] тоже должна быть непрерывной. Это верно для любого отрезка [A, B] ∈ J, поэтому функция
f −1 : J → I должна быть непрерывна.
Докажем (ii). Пусть f непрерывна на I.
1. Если x ∈ I = (a, b), то выбрав α и β так, чтобы x ∈ [α, β] ⊆ (a, b) = I. Тогда:
a<α<x<β<b
⇓
inf f (t) 6 f (α) < f (x) < f (β) 6 sup f (t)
x∈I x∈I
⇓
f (x) ∈ inf f (t), sup f (t) = J
x∈I x∈I
То есть f (I) ⊆ J.
2. Инъективность отображения f : I → J доказывается той же цепочкой (3.3.130), что и для
случая, когда I – отрезок.
3. Сюръективность отображения f : I → J. Пусть y ∈ J = (inf t∈I f (t), supt∈I f (t)). Тогда:
inf f (t) < y < sup f (t) =⇒ ∃t1 , t2 ∈ I : f (t1 ) < y < f (t2 ) =⇒
t∈I t∈I
=⇒ y ∈ [f (t1 ); f (t2 )] =⇒ ∃x ∈ [t1 ; t2 ] y = f (x)
теорема 3.3.11
f (x) = y ⇐⇒ x = f −1 (y)
§ 4. Предел функции 259
§4 Предел функции
В примере 3.3.6 выше мы заметили, что функция f (x) = {x} (дробная часть числа) разрывна в
точке x = 1 (да и вообще во всех целых точках a ∈ Z), то есть для некоторых последовательностей
аргументов xn выполняются соотношения
xn −→ 1, 6
f (xn )−→ f (1)
n→∞ n→∞
Если приглядеться к этой функции, то можно заметить, что в поведении последовательности f (xn )
имеется следующая простая закономерность: если xn стремится к 1 слева, то f (xn ) стремится к 1,
Это наблюдение оказывается очень полезным, потому что позволяет просто и наглядно объяснить,
как ведет себя наша функция вблизи своих точек разрыва: если сказать, что при приближении
аргумента к точке разрыва слева функция стремится к единице, а при приближении аргумента
справа – к нулю, то изобразив это графически картинкой
мы даем человеческому сознанию наглядный образ, с помощью которого все вопросы о пределах
последовательностей вида f (xn ) решаются без труда.
Условие (3.4.134) коротко записывается формулой
lim f (x) = 1,
x→1−0
и в таких случаях говорят, что функция f имеет предел слева в точке 1. А условие (3.4.135) запи-
сывается формулой
lim f (x) = 0,
x→1+0
и в таких случаях говорят, что функция f имеет предел справа в точке 1, равный 0.
В этом параграфе мы подробно обсудим понятие предела функции. Ниже в главе 5 будет дано
его важное применение: с его помощью определяется понятие производной, играющие центральную
роль во всем математическом анализе.
260 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
К этим 12 типам пределов следует добавть еще 12, соответствующих случаям, когда функция f
стремится к бесконечности с определенным знаком:
§ 4. Предел функции 261
Таким образом, чтобы определить предел функции, нужно формально сформулировать 24 раз-
ных определения. Чтобы не утомлять читателя такими вразумлениями, обычно поступают иначе.
Говорят так: пусть a и A обозначают числа, или символы бесконечности, возможно с определенным
знаком
a, A ∈ R или a, A = ∞, −∞, +∞
если
1) f (x) определена в некоторой выколотой окрестности U величины a и
17 Генрих Гейне (1821-1881) – известный немецкий математик, поэт и публицист (1797-1856).
262 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
f (xn ) −→ A
n→∞
если
1) f (x) определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой последовательности xn ∈ U , стремящейся к a
xn −→ a xn 6= a
n→∞
f (xn ) −→ A
n→∞
f (xn ) −→ A f (xn ) −→ A
n→∞ n→∞
§ 4. Предел функции 263
f (xn ) −→ A
n→∞
f (x) −→ A
x→a−0
или
lim f (x) = A В этом случае пишут
x→a−0
Доказательство. Это следует из теоремы 3.2.4 о связи между бесконечно большими и бесконеч-
но малыми последовательностями: если xn → a, то соотношение yn = f (xn ) → 0 эквивалентно
соотношению y1n = f (x1n ) → ∞.
⋄ 3.4.13. 1
(xn )k = −→ ∞
( (yn )k x→0
0, если k > 0 Поскольку это верно для любой последователь-
lim xk = (3.4.137)
x→0 ∞, если k < 0 ности xn → ∞, мы получаем, что
xk −→ ∞ (k > 0)
Доказательство. 1. Пусть k > 0. Тогда x→∞
(xn )k −→ 0 ⇓ (3.4.136)
x→0
xk −→ 0 (k > 0)
x→0 ⋄ 3.4.15. Для любого n ∈ N
2. Пусть k < 0. Тогда m = −k > 0, поэтому:
lim x2n = +∞ (3.4.139)
x→−∞
m
x −→ 0 (уже доказано)
lim x2n = +∞ (3.4.140)
x→0
x→+∞
⇓ (3.4.136)
⋄ 3.4.16. Для любого n ∈ N
1
xk = m −→ ∞ lim x−2n = +∞ (3.4.141)
x x→0 x→0
lim x−2n = 0 (3.4.142)
x→∞
⋄ 3.4.14.
⋄ 3.4.17. Для любого n ∈ N
(
∞, если k > 0
lim xk = (3.4.138) lim x2n−1 = −∞ (3.4.143)
x→∞ 0, если k < 0 x→−∞
⇓ 0
(свойство 3 на с.216)
⊲⊲ 3.4.19. Покажите что
k
(yn ) −→ 0 1) limx→+∞ |x|
=1
x→0 x
|x|
⇓ (теорема 3.2.4) 2) limx→−∞ x = −1
266 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
тогда и только тогда, когда A является пределом слева и пределом справа функции f в точке a:
lim f (x) = A = lim f (x)
x→a−0 x→a+0
тогда и только тогда, когда A является пределом функции f при x стремящимся к −∞ и к +∞:
lim f (x) = A = lim f (x)
x→−∞ x→+∞
то мы получим 1 1
lim = +∞ = lim
x→0−0 |x| x→0+0 |x|
1 |xn | = xn , 1
lim = потому что xn > 0 = lim = и это означает что
n→∞ |xn | n→∞ xn
применяем
= теорему 1
3.2.4 = +∞ lim = +∞
x→0 |x|
выполняется
f (xn ) −→ C (3.4.149)
n→∞
Доказательство. Ясно, что из (i) следует (ii), потому что если limx→b−0 f (x) = C, то f (xn ) −→
n→∞
C для любой последовательности xn −→ b, xn < b (необязательно монотонной). Докажем, что
n→∞
наоборот если (i) не выполняется, то не выполняется и (ii). Пусть limx→b−0 f (x) 6= C, то есть
существует точка последовательность xn ∈ M такая что
∀k ∈ N f (xnk ) ∈
/ (C − ε; C + ε)
k1 = 1, t1 = y 1
Затем, если для m = 1, ..., l числа km и tm определены, мы замечаем вот что. Поскольку a < yk ,
yk −→ a и a < tl , найдется такое kl+1 , что ykl+1 лежит в интервале (a; tl ):
k→∞
ykl+1 < tl
tm ∈ (a, b)
18 Эта теорема используется ниже при доказательстве правила Лопиталя для раскрытия неопределенностей типа
∞
∞
.
§ 4. Предел функции 269
tm = ykm −→ a.
m→∞
∀m ∈ N f (tm ) = f (zkm ) ∈
/ (C − ε; C + ε)
выполняется
f (xn ) −→ C
n→∞
— если f невозрастает, то
Доказательство. 1. (i) =⇒ (ii). Пусть функция f непрерывна в точке a, то есть для всякой по-
следовательности аргументов {xn }, стремящейся к точке a соответствующая последовательность
значений {f (xn )} стремится к значению f (a). Тогда, в частности, для всякой последовательности
xn −→ a, xn 6= a
n→∞
выполняется
f (xn ) −→ f (a)
n→∞
По определению предела это означает, что предел функции f в точке x = a равен f (a):
xn −→ a, xn 6= a
n→∞
выполняется
f (xn ) −→ f (a)
n→∞
Нам нужно проверить то же самое для последовательностей {xn }, у которых некоторые элементы
xn совпадают с a. Пусть {xn } – как раз такая последовательность, то есть xn −→ a, причем xn = a
n→∞
для некоторых n. Тогда {xn } можно разложить на две подпоследовательности {xnk } и {xmk } такие
что
xnk −→ a xnk 6= a, xmk = a
k→∞
Мы показали, что для всякой последовательности аргументов {xn }, стремящейся к точке a соот-
ветствующая последовательность значений {f (xn )} стремится к значению f (a). Это означает, что
функция f непрерывна в точке a.
Теорема 3.4.8 (о перестановочности предела с непрерывной функцией). Если существует конеч-
ный предел
lim f (x) = A
x→a
причем
∀x 6= a f (x) 6= b
Тогда
lim g(f (x)) = c
x→a
xn −→ a, xn 6= a
n→∞
Тогда мы получим
f (xn ) −→ b, f (xn ) 6= b
n→∞
Поэтому
g(f (xn )) −→ c
n→∞
Поскольку это верно для всякой последовательности xn −→ a (xn 6= a), мы получаем, что
n→∞
limx→a g(f (x)) = c.
§ 4. Предел функции 271
Эта теорема бывает полезна при вычислении предела от сложной функции. Если нам нужно
найти предел
lim g(f (x))
x→a
и известно, что f (x) −→ b причем f (x) 6= b при x 6= a, то можно сделать замену переменных:
x→a
f (x) = y
lim g(f (x)) = y −→ b = lim g(y)
x→a x→a y→b
y 6= b при x 6= a
2−0
= (подстановка) = =2
1 + 10 · 0
Теорема 3.4.10. Если существуют конечные пределы limx→a f (x) и limx→a g(x), то справедливы
формулы:
xn −→ a, xn 6= a
n→∞
f (xn ) −→ A, g(xn ) −→ B
n→∞ n→∞
используем свойство
⇓ 30 на с.216
f (xn ) · g(xn ) −→ A · B
n→∞
sn −→ a, tn −→ a,
n→∞ n→∞
f (tn ) − f (sn ) −→ 0
n→∞
sn −→ a, tn −→ a,
n→∞ n→∞
f (tn ) − f (sn ) −→ 0
n→∞
Доказательство. Эти две теоремы доказываются одинаково, поэтому мы докажем лишь вторую.
1. Легко проверяется, что из условия (i) следует условие (ii). Действительно, если существует
конечный предел limx→a−0 f (x) = C, то есть для всякой последовательности xn ∈ (α; a), xn −→ a
n→∞
выполняется соотношение
f (xn ) −→ C
n→∞
f (tn ) − f (sn ) −→ C − C = 0
n→∞
2. Теперь докажем, что из условия (ii) следует условие (i). Пусть выполняется (ii).
a) Покажем сначала, что тогда для любой последовательности xn ∈ (α; a), xn −→ a существует
n→∞
конечный предел
lim f (xn )
n→∞
Действительно, обозначим yn = f (xn ). Тогда если взять любые две последовательности индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
Это означает, что последовательность yn = f (xn ) удовлетворяет критерию Коши (то есть обладает
свойством (i) теоремы 3.2.15). Значит, yn = f (xn ) имеет конечный предел.
19 Этот результат понадобится при доказательстве критерия Коши сходимости несобственного интеграла (теорема
8.1.7).
§ 4. Предел функции 273
sn −→ a, tn −→ a
n→∞ n→∞
выполняется равенство
lim (f (tn ) − f (sn )) = 0
n→∞
и следовательно,
lim f (tn ) = lim f (sn )
n→∞ n→∞
lim f (xn ) = C
n→∞
lim f (x) = C
x→a−0
Мы убедились, что из условия (ii) следует условие (i). Теорема 1.1 доказана.
если
274 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
если
1) f (x) определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой окрестности V величины A найдется левая (правая) полуокрестность
W точки a такая, что
∀x ∈ W f (x) ∈ V
если если
1) функция f определена на некотором мно- 1) функция f определена на некотором ин-
жестве вида (a−η, a)∪(a, a+η) (где η > 0), тервале вида (a − η; a) (где η > 0, и
и 2) для всякого числа ε > 0 существует число
2) для всякого числа ε > 0 существует чис- δ > 0 такое что для любого x ∈ (a − δ; a)
ло δ > 0 такое что для любого x ∈ (a − выполняется включение f (x) ∈ (A − ε; A +
δ; a) ∪ (a, a + δ) выполняется включение ε).
f (x) ∈ (A − ε; A + ε). • Конечный предел функции при x → +∞
• Бесконечный предел функции в точке по Коши. Число A называется пределом
по Коши. Говорят, что функция f имеет функции f при x → +∞
бесконечный предел в точке a
lim f (x) = A
x→+∞
lim f (x) = ∞
x→a
если
если 1) функция f определена на некотором ин-
1) функция f определена на некотором мно- тервале вида (α; +∞), и
жестве вида (a−η, a)∪(a, a+η) (где η > 0), 2) для всякого числа ε > 0 существует число
и β > α такое что для любого x ∈ (β; +∞)
2) для всякого числа E > 0 существует чис- выполняется включение f (x) ∈ (A − ε; A +
ло δ > 0 такое что для любого x ∈ (a − ε).
Доказательство. Мы докажем эту теорему для конечных пределов слева, поскольку в каждом
случае доказательство отличается лишь несущественными деталями.
1. (i) ⇒ (ii). Пусть A является пределом по Коши функции f при x → a − 0, то есть для всякого
ε > 0 существует δ > 0 такое что для любого x ∈ [a−δ; a) выполняется включение f (x) ∈ (A−ε; A+ε).
Покажем, что тогда A является пределом по Гейне f (x) при x → a − 0, то есть что для любой
последовательности аргументов xn −→ a − 0 выполняется f (xn ) −→ A.
n→∞ n→∞
Возьмем произвольную такую последовательноть xn −→ a − 0. и зафиксируем какое-нибудь
n→∞
ε > 0. По предположению, для него можно выбрать δ > 0 так чтобы
∀x ∈ [a − δ; a) f (x) ∈ (A − ε; A + ε) (3.4.158)
xn −→ a − 0
n→∞
(применяем (3.4.158))
1
a− < xn < a
n
xn −→ a − 0
n→∞
xn − yn −→ 0
n→∞
Для этого возьмем ε > 0. В силу (3.4.160), должен существовать такой δ > 0, что
В частности,
1
∀n ∈ N ∃xn , yn ∈ E |xn − yn | < & |f (xn ) − f (yn )| > ε
n
1
Мы получили последовательности xn и yn такие, что 0 6 |xn − yn | < −→
n n→∞ 0, и поэтому
xn − yn −→ 0
n→∞
СТАНДАРТНЫЕ ФУНКЦИИ
§1 Элементарные функции
Среди функций, используемых в точных науках, имеется несколько таких, которые служат глав-
ными моделями изучаемых явлений. Эти функции называются элементарными, и их свойства, а
также свойства функций, получаемых из них с помощью алгебраических операций и композиции
(такие функции мы будем называть стандартными) служат предметом изучения в разделе ана-
лиза, называемом Исчислением (что это мы объясним ниже в § 2). Список элементарных функций
выглядит так:1
обозначение:
название x область определения
7→
Z+
x ∈ R, b ∈ 2N−1
N
b x 6= 0, b ∈ − 2N−1
степенная функция x
x > 0, b ∈ (0, +∞) \ Z
2N−1
Z
x > 0, b ∈ (−∞, 0) \ 2N−1
x ∈ R,
a>0
x
показательная функция a x > 0, a=0
x ∈ Z ,
2N−1 a<0
π
тангенс tg x x∈
/ 2 + πZ
котангенс ctg x x∈
/ πZ
Как может заметить читатель, только одна из этих функций – xb – была определена нами к на-
стоящему моменту, и то только для целых значений параметра b (см. определения на с.159 и 167).
Z
1 Смысл встречающихся в этой таблице обозначений типа , N
2N−1 2N−1
объяснялся выше на с.185.
277
278 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
Остальные функции в этом списке мы определим необычным приемом – с помощью двух так на-
зываемых зависимых аксиом.
Это вот что такое. Зависимой или избыточной аксиомой называется такая аксиома теории, про
которую впоследствии становится известно, что ее можно вывести из остальных аксиом этой теории.
Как следствие, зависимые аксиомы можно (и с точки зрения логической стройности правильнее)
оформлять не как аксиомы, а как теоремы этой теории. Однако в математике встречаются время от
времени ситуации, когда знакомство с теоремой бывает желательно задолго до того, как появляется
возможность эту теорему строго доказать. В таких случаях полезно объявить эту теорему аксиомой,
сообщив слушателям, что в действительности эта аксиома зависима.
Элементарные функции – как раз такой пример. Чисто логически ничто не мешает молчать о
них в курсе анализа до тех пор, пока не появится возможность аккуратно их определить и дока-
зать их характеристические свойства. Однако тогда возможность решать задачи с элементарными
функциями, отличными от рациональных, появится у преподавателя и у студентов только в кон-
це второго семестра. Поскольку выбрасывание из упражнений всех иррациональных элементарных
функций эквивалентно просто отказу от Исчисления в классическом его понимании, разумно по-
ступить по-другому. В этой главе мы сформулируем две избыточные аксиомы – Аксиому степеней
(аксиома B1 на с.278) и Аксиому тригонометрии (аксиома B2 на с.291). Доказательство их зависи-
мости (избыточности) мы сможем привести очень нескоро – лишь в § 3 главы 10. Отчасти поэтому,
но, в первую очередь в соответствии с общим принципом, согласно которому все, что связано с
Исчислением считается иллюстративным материалом, мы переносим эти утверждения вместе с их
следствиями, в двухколоночный текст.
√
— график функции x 7→ 2n−1 x выглядит как то, во-первых,
график любого представителя из этого семей- 1 2n 1
ства функций, например, как график кубиче- y 2n = x 2n = (4.1.7) = x 2n ·2n = x1 = x
ского корня
√ 1 и, во-вторых, по Аксиоме степеней B1 на с.278,
3
x = x3 (x ∈ R) 1
из того, что x 2n существует, следует, что x > 0.
Поэтому
1 (4.1.17)
y = x 2n > 0
Мы доказали импликацию
Предложение
√ 4.1.3. Корень четной степени
x 7→ 2n x √
y = 2n x =⇒ y 2n = x & y>0
— определен всюду на полуинтервале [0; +∞),
Теперь докажем обратную импликацию:
— возрастает на [0; +∞),
√
— непрерывен на [0; +∞), y = 2n x ⇐= y 2n = x & y > 0
— равен нулю в нуле:
√ Пусть
2n
0=0 (4.1.25) y 2n = x & y>0
(4.1.9)
0 <
1 1
x 2n < x 2n+1 −→ 0 2n+1
1 (4.1.25)
= 0 В-третьих, если x < 0, то
x→0 √
| {z } y = x2
1
функция x 7→ x 2n+1
непрерывна m
по предложению 4.1.2 2
y =x & y>0
⇓ m
x
1
2n −→ 0 y 2 − x2 = 0 & y>0
x→0
m
(y − x)(y + x) = 0 & y>0
⋄ 4.1.7. Предложение 4.1.3 позволяет строить m
графики корней четной степени. Опять если не
y+x=0
интересоваться участками выпуклости (о кото- & y>0
y−x=0
рых мы упоминали в примере 4.1.6), мы получа-
ем, что по виду графика все корни четной степе- m
ни ведут себя одинаково: y = −x
√ & y>0
y=x
— график функции x 7→ 2n x выглядит как гра-
фик любого представителя из этого семейства ▼❇❇
функций, например, как график квадратного
невозможно,
корня √ потому что x < 0
1
x = x2 (x ∈ R)
m
y = −x = |x|
m lim xb = −∞ (4.1.29)
x→−∞
lim xb = 0 (4.1.38)
x→∞
f (x) = x−3 (x ∈ R) 1
g(f (x)) = (xb ) b = (4.1.7) =
1
= xb· b = x1 = (4.1.15) = x
1
f (x) = x 2 (x > 0)
b
f (x) = x , g(y) = y b
286 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
Z
— точно так же, если b < 1, b ∈ (0; +∞) \ 2N−1 , Лемма 4.1.11. При любом a > 0 последова-
1 1
b
график функции x 7→ x , выглядит как гра- тельности a n и a− n стремятся к единице:
фик любого представителя из этого семей- 1
a n −→ 1,
1
a− n −→ 1 (4.1.43)
ства, например, как график квадратного кор- n→∞ n→∞
ня Доказательство. 1. Пусть сначала a > 1. Обо-
1 √
f (x) = x 2 = x (x > 0) значим
1
xn = a n − 1
и заметим, что, во-первых,
a>1
Z
Предложение 4.1.10. При b ∈ (−∞; 0) \ 2N−1 ⇓ (4.1.10)
степенная функция x 7→ xb a
1
n >1
1
n = (4.1.4) = 1
– определена на интервале (0; +∞). ⇓
1
– непрерывна на (0; +∞). xn = a − 1 > 0
n
Лемма 4.1.12. При любом a > 0 справедливо Предложение 4.1.13. При любом a > 0 функ-
соотношение: ция x 7→ ax непрерывна.
x
a −→ 1 (4.1.44) Доказательство. Если x −→ x, то x − x −→
x→0 k k
k→∞ k→∞
Доказательство. Нам нужно показать, что для 0 и поэтому
произвольной бесконечно малой последователь- axk − ax = axk −x · ax − ax = (axk −x −1) · ax −→ 0
ности | {z } k→∞
↓
xk −→ 0 (4.1.45) 1,
k→∞ в силу (4.1.44)
выполняется
axk −→ 1 (4.1.46)
k→∞
Рассмотрим несколько случаев. Предложение 4.1.14. Справедливы следующие
1. Если a = 1, то (4.1.46) выполняется триви- соотношения:
ально, потому что в этом случае axk = 1. — если a > 1, то
2. Пусть a > 1. Из соотношений (4.1.43) сле-
lim ax = 0, lim ax = +∞ (4.1.47)
дует, что для любого ε > 0 найдется номер N x→−∞ x→+∞
такой, что — если 0 < a < 1, то
1 1
1 − ε < a− N < a N < 1 + ε lim ax = +∞, lim ax = 0 (4.1.48)
x→−∞ x→+∞
Из (4.1.45) следует, что для данного N можно Доказательство. 1. Пусть a > 1. Тогда в силу
подобрать номер K такой, что (3.2.44),
1 an −→ +∞,
∀k > K |xk | < n→∞
N поэтому для любого E > 0 найдется N ∈ N такое,
Поэтому: что
aN > E
1 1
∀k > K − < xk < Для любого x > N мы теперь получаем:
N N
⇓ (4.1.12) ax > (4.1.12) > aN > E
1 1
∀k > K 1 − ε < a− N < ax k < a N < 1 + ε Мы получили, что для любого E > 0 найдется N
такое, что при x > N выполняется неравенство
⇓
ax > E. Это означает, что справедливо второе
xk
∀k > K a ∈ (1 − ε, 1 + ε) соотношение в (4.1.47):
Мы получили, что какой ни возьми ε > 0 почти lim ax = +∞
xk x→+∞
все элементы последовательности a лежат в ε-
окрестности точки 1. Это и означает, что спра- После того, как оно доказано, первое выводится
ведливо (4.1.46). как его следствие:
3. Пусть 0 < a < 1. Тогда из (4.1.43) следует,
y = −x
что для любого ε > 0 найдется номер N такой, lim ax = = lim a−y =
x→−∞ y → +∞ y→+∞
что
1
− 1
1 − ε < aN < a N < 1 + ε 1
= lim = (3.4.136) = 0
y→+∞ ay
Опять из (4.1.45) получаем, что для данного N
можно подобрать номер K такой, что ❘ +∞
❅
1 2. Пусть 0 < a < 1. Тогда, положив A = 1
∀k > K |xk | < a,
N мы получим A > 1, поэтому
и поэтому
y = −x
1 1
∀k > K − < xk < lim ax = y → +∞ =
N N x→−∞
ax = A−x = Ay
⇓ (4.1.13)
= lim Ay = (4.1.47) = +∞
1
xk 1
−N y→+∞
∀k > K 1−ε<a N <a <a < 1+ε
и
⇓
xk
y = −x
∀k > K a ∈ (1 − ε, 1 + ε) lim ax = y → −∞ =
x→+∞
То есть какой ни возьми ε > 0, почти все ax = A−x = Ay
элементы последовательности axk лежат в ε- = lim Ay = (4.1.47) = 0
окрестности точки 1. Опять это означает, что y→−∞
справедливо (4.1.46).
288 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
Предложение 4.1.15. При любых a > 0 и x ∈ пытаться рисовать отдельные точки на нем, на-
R справедливо неравенство пример
ax > 0 (4.1.49)
⇓ (4.1.13)
x [x]+1
a >a > 0
(2.2.279)
или так
⇓
x
a >0
Логарифм.
⋄ 4.1.14. Предложений 4.1.13, 4.1.14 и 4.1.15 • Для всякого числа a, удовлетворяющего
достаточно, чтобы построить график функции двойному неравенству
x 7→ ax в тех случаях, когда это возможно, то 0 < a 6= 1,
есть когда a > 0:
правило
– если a > 1, график выглядит так: y = loga x ⇐⇒ ay = x (4.1.50)
определяет функцию
x 7→ loga x (x > 0)
– если a = 1, график становится прямой: называемую логарифмом по основанию a. По-
нятно, что функции x 7→ ax и loga связаны
тождествами
aloga x = x (x > 0) (4.1.51)
x
– если 0 < a < 1, график выглядит так: loga (a ) = x (x ∈ R) (4.1.52)
Второе из них влечет за собой тождество
loga a = 1 (0 < a 6= 1) (4.1.53)
⇓ lim loga x = −∞
x→+0
⋄ 4.1.16. Предложений 4.1.17, 4.1.18 и 4.1.19 стороны, формулы для вычисления их значений,
достаточно, чтобы построить график функции их производных и интегралов, оказываются осо-
loga : бенно простыми, а с другой – все остальные по-
казательные функции и логарифмы выражаются
— если a > 1, то картинка получается такой: через них с помощью формул (4.1.61)-(4.1.63).
ln x = loge x
k
(4.1.51)
k
a
1 = cos 2π
sin 0 = 0
(4.1.75) Таким образом, мы заполнили третий столбец в
cos 0 = 12
таблице.
Но с другой стороны, 3. Только после этого можно получить значе-
2 ния в точке x = π. Во-первых,
cos 0 = cos(2 · 0) = (4.1.72) = 2 cos 0 − 1 (4.1.76)
(уже вычислено)
и отсюда следует, что cos 0 не может быть ра- ↓
0 = sin 2π = (4.1.71) = 2 sin π · cos π
вен 21 , потому что при подстановке в (4.1.76) мы
получаем неверное равенство: ⇓
2 sin π = 0
1 1
=2 −1 cos π = 0
2 2
Второе из этих равенств – cos π = 0 – неверно,
Таким образом, в совокупности (4.1.75) второе потому что если это значение подставить в фор-
равенство невозможно, и остается первое: мулу (4.1.72) при x = π,
2
sin 0 = 0. | {z2π} = 2 cos π − 1
cos
k
Отсюда уже получаем значение для cos 0: 1
(уже вычислено)
0
z}|{ получается неверное равенство:
sin2 0 + cos2 0 = (4.1.67) = 1
1 = 2 · 02 − 1
⇓ Значит остается первое:
cos2 0 = 1
sin π = 0
⇓
Из этого равенства теперь получаем:
2
cos 0 = 1 2
(4.1.77) |sin{z π} + cos π = 1
cos 0 = −1 0
§ 1. Элементарные функции 293
⇓ И, аналогично,
cos2 π = 1
1 = (таблица на с.292) = cos 0 =
⇓ = cos(x − x) = cos x · cos(−x) − sin x · sin(−x) =
| {z } | {z }
B A
cos π = 1 = B · cos x − A · sin x
(4.1.78)
cos π = −1
Предположим, что верно первое: cos π = 1. Тогда Вместе эти равенства дают систему линейных
в качестве следствия мы получим, во-первых, уравнений для A и B:
(
B · sin x + A · cos x = 0
sin(x + π) = (10.3.134) =
B · cos x − A · sin x = 1
= sin x · cos
| {zπ} + cos x · sin
| {zπ} = sin x
k k Ее можно по-разному решать, например, так:
1 0
(предположение) (уже доказано) (
B · sin x + A · cos x = 0 ← умножаем на sin x
То есть число π > 0 должно быть периодом B · cos x − A · sin x = 1 ← умножаем на cos x
функции sin. Но это невозможно, потому что
наименьшим периодом для sin является число ⇓
2π. Полученное противоречие означает, что на- (
B · sin2 x + A · cos x · sin x = 0
ше предположение о равенстве cos π = 1 было
неверным. B · cos2 x − A · sin x · cos x = cos x
Значит, в совокупности (4.1.78) должно быть ⇓ (складываем равенства)
верно второе равенство:
B · sin2 x + B · cos2 x = cos x
| {z }
cos π = −1 k
B · (sin2 x + cos2 x)
k
B
Тогда
Очевидным следствием (4.1.80) будет
0 = (таблица на с.292) = sin 0 = Предложение 4.1.27. Справедливы тожде-
= sin(x − x) = sin x · cos(−x) + cos x · sin(−x) = ства:
| {z } | {z }
B A sin(x − y) = sin x · cos y − cos x · sin y (4.1.81)
= B · sin x + A · cos x cos(x − y) = cos x · cos y + sin x · sin y (4.1.82)
294 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
Из этого в свою очередь следует еще несколь- cos x − cos y = cos(α + β) − cos(α − β) =
ко тождеств. Во-первых, тождества для произве- = (10.3.135), (4.1.82) = cos α · cos β − sin α · sin β−
дений:
− cos α · cos β − sin α · sin β = −2 sin α · sin β =
Предложение 4.1.28. Справедливы тожде- x+y x−y
= −2 sin · sin
ства: 2 2
1
sin x · sin y = cos(x − y) − cos(x + y)
2
(4.1.83) Предложение 4.1.30. Справедливы следующие
1 неравенства (x ∈ R):
cos x · cos y = cos(x − y) + cos(x + y)
2 | sin x| 6 1, (4.1.90)
(4.1.84)
1 | cos x| 6 1, (4.1.91)
sin x · cos y = sin(x − y) + sin(x + y) | sin x| 6 |x|. (4.1.92)
2
(4.1.85)
Доказательство. Из (4.1.67) получаем
Доказательство. Мы докажем первое из этих
тождеств, потому что остальные два доказыва- sin2 x + cos2 x = 1
ются по аналогии. Здесь нужно просто вычис-
лить выражение в скобках в правой части: ⇓
2
sin x 6 1
cos(x − y) − cos(x + y) = (4.1.82), (10.3.135) =
⇓
= cos x · cos y + sin x · sin y − cos x · cos y + p
| {z } | {z }
| sin x| = sin2 x 6 1
↑ ↑
+ sin x · sin y = 2 sin x · sin y и точно так же доказывается (4.1.91).
Последнее неравенство доказывается отдель-
Поделив на 2, мы получим (4.1.83). но для случаев x = 0, x ∈ (0; 1), x ∈ (−1, 0) и
x∈/ (−1, 1):
И, во-вторых, тождества для сумм:
– при x = 0 получаем
Предложение 4.1.29. Справедливы тожде-
ства: | sin 0| = 0 6 |0|
x+y x−y – при 0 < x < 1:
sin x + sin y = 2 · sin · cos (4.1.86)
2 2
x+y x−y 0 6 sin x < x = |x|
cos x + cos y = 2 · cos · cos (4.1.87)
2 2
x+y x−y ⇓ (4.1.70)
sin x − sin y = 2 · cos · sin (4.1.88)
2 2 | sin x| 6 |x|
x+y x−y
cos x − cos y = −2 · sin · sin (4.1.89) – при −1 < x < 0 получаем:
2 2
Доказательство. Ниже нам понадобятся только x ∈ (−1, 0)
два последних тождества, поэтому мы докажем
их. Два первых доказываются по аналогии. Обо- ⇓
значим −x ∈ (0, 1)
x+y x−y
α= , β=
2 2 ⇓ (4.1.70)
Тогда
0 < sin(−x) < −x
α + β = x, α−β =y | {z } |{z}
k k
Поэтому − sin x |x|
k
| sin x|
sin x − sin y = sin(α + β) − sin(α − β) =
⇓
= (10.3.134), (4.1.81) = sin α · cos β + cos α · sin β−
− sin α · cos β + cos α · sin β = 2 cos α · sin β = | sin x| 6 |x|
x+y x−y – и, наконец, если x ∈ / (−1, +1), то 1 6 |x| и
= 2 cos · sin
2 2 поэтому
| sin x| 6 1 6 |x|.
И точно так же,
§ 1. Элементарные функции 295
⇓
Доказательство. Заметим сначала, что из-за π
тождества четности (4.1.80) здесь достаточно до- sin = 1
2
казать только утверждение для отрезка [0, π]. 2. Заметим, что sin π4 = cos π4 :
Для него мы получаем такую цепочку: π π
π π π
sin = sin − = sin · cos −
x, y ∈ [0, π], x<y 4 2 4 | {z2} 4
1
⇓ π π π
− cos · sin = cos
x+y x−y | {z 2} 4 4
∈ (0, π), ∈ (−π, 0)
2 2 0
(отрезок [0, π] превратился в интервалы (0, π) и (−π, 0)!)
Отсюда получаем:
π π π π π π
⇓
1 = sin = sin + = 2·sin ·cos = 2·sin2
2 4 4 4 4 4
cos x − cos y = (4.1.89) = ⇓
x+y x−y 2 π 1
= −2 · sin · sin >0 sin =
4 2
| {z } | {z2 }
2
⇓
r √
<
>
0 0 π 1 2
sin = =
4 2 2
⇓ ⇓
" √ #
cos x > cos y sin π4 = 2√2
sin π4 = − 22 ← невозможно, в силу (4.1.95)
Предложение 4.1.36. Справедлива следующая ⇓
√
таблица значений синуса и косинуса в некото- π π 2
sin = cos =
рых характерных точках на отрезке [0, π2 ]: 4 4 2
π π π π
t 0 Предложение 4.1.37. Справедливы тожде-
√6 √4 3 2
3 2 1
cos t 1 2 0 ства:
√2 √2
1 2 3
sin t 0 2 2 2 1 sin(x + π) = − sin x (4.1.99)
cos(x + π) = − cos x (4.1.100)
π
Доказательство. Мы покажем, как выводятся sin x + = cos x (4.1.101)
2
значения этих функций в двух точках, оставив π
вывод для остальных точек читателю. cos x + = − sin x (4.1.102)
2
1. Вычислим значения в точке π2 : во-первых, π
sin x − = − cos x (4.1.103)
π π 2
0 = sin π = 2 · sin · cos π
2 2 cos x − = sin x (4.1.104)
π 2
⇓ sin − x = cos x (4.1.105)
sin π
=0 ← невозможно, в силу (4.1.95) 2π
2
cos π
=0 cos − x = sin x (4.1.106)
2 2
§ 1. Элементарные функции 297
Доказательство. Мы докажем только первое Доказательство. Для отрезка − π2 , π2 получа-
тождество, остальные доказываются по анало- ем: h π πi
гии: x, y ∈ − , , x<y
2 2
sin(x + π) = sin x · cos
| {zπ} + cos x · sin
| {zπ} = sin x ⇓
−1 0 π π π π
x + , y + ∈ [0, π], x+ <y+
2 2 2 2
⇓
Индукцией из формул (4.1.99) и (4.1.100) вы- π π
водится cos x + > cos y +
2 2
Следствие 4.1.38. Справедливы тождества: ⇓
π π
π 3π
x∈ − , =⇒ cos x > 0 (4.1.109) x, y ∈ , , x<y
2 2 2 2
π 3π
x∈ , =⇒ cos x < 0 (4.1.110) ⇓
2 2
π π π π
Доказательство. Здесь все следует из предло- x+ , y + ∈ (π, 2π), x+ <y+
2 2 2 2
жения 4.1.34: π π ⇓
x∈ − ,
2 2 π π
cos x + < cos y +
⇓ 2 2
π ⇓
x+ ∈ (0, π)
2
π
⇓ sin x = (4.1.102) = − cos x + >
π 2
π
cos x = (4.1.101) = sin x + >0
2 > − cos y + = (4.1.102) = sin y
2
И точно так же
π 3π
x∈ , ⋄ 4.1.18. Полученной теперь информации до-
2 2
статочно для построения графиков синуса и ко-
⇓ синуса. Эти картинки общеизвестны, однако мы
π предлагаем читателю проверить самостоятельно,
x+ ∈ (π, 2π) что, если ставить себе целью указать на графи-
2
ке интервалы монотонности и знакоопределенно-
⇓ сти, то из того, что мы уже успели доказать про
π
cos x = (4.1.101) = sin x + <0 синус и косинус никаких других картинок полу-
2 читься не может. Для синуса график должен вы-
глядеть так:
Предложение 4.1.40. На отрезке − π2 ,π2 си-
нус монотонно возрастает, а на отрезке π2 , 3π
2
монотонно убывает:
h π πi
x, y ∈ − , , x < y =⇒ sin x > sin y
2 2
(4.1.111)
π 3π
x, y ∈ , , x < y =⇒ sin x < sin y
2 2
(4.1.112) А для косинуса так:
298 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
π π π π
x 0 6 4
Предложение 4.1.43. На интервале (0, π) √3 2
tg x 0 √1 1 3 6∃
функция ctg убывает: √ 3
ctg x 6∃ 3 1 √1 0
3
x, y ∈ (0, π), x<y =⇒ ctg x > ctg y
(4.1.119)
§ 1. Элементарные функции 299
Теперь можно строить графики. Для танген- Предложение 4.1.47. Функции arcsin, arccos,
са график выглядит так: arctg и arcctg имеют следующие знаки на ха-
рактерных интервалах:
⋄ 4.1.20. Арксинус:
Обратные тригонометрические функции.
• Следующие правила определяют функции,
называемые соответственно арксинусом, арк-
косинусом, арктангенсом и арккотангенсом:
h π πi
t = arcsin x ⇐⇒ x = sin t & t ∈ − ;
2 2
(4.1.122)
t = arccos x ⇐⇒ x = cos t & t ∈ [0; π] (4.1.123)
π π
t = arctg x ⇐⇒ x = tg t & t ∈ − ; ⋄ 4.1.21. Арккосинус:
2 2
(4.1.124)
t = arcctg x ⇐⇒ x = ctg t & t ∈ (0; π) (4.1.125)
7→
Можно заметить, что в списке элементарных
x ∈ R, b N
∈ 2N−1
функций, который мы приводили на с. 277, не степенная
x 6= 0, b N
∈ − 2N−1
xb
все функции будут непрерывны (мы это уже от- функция
x > 0, b ∈ (0, +∞) \ N
2N−1
−N
мечали в примере 4.1.15, но без доказательства). x > 0, b ∈ (−∞, 0) \ 2N−1
1
f (xn ) = 0 n = 0 −→ 0 6= 1 = 00 = f (0) арккосинус arccos x x ∈ [−1; 1]
n→∞
f (x) = (−1)x
• Функции из этого списка называются
разрывна в любой точке своей области опреде- непрерывными элементарными функ-
ления. Например, для точки a = 0 можно взять циями.
последовательность
1 §2 Стандартные функции
xn = −→ 0
3n n→∞
В инженерном деле, и вообще в приложени-
ях очень редко используются какие-то сложные
для которой мы получим
функции, представляемые суммами рядов или
1
решениями уравнений (например, дифференци-
f (xn ) = (−1) 3n = −1 −→ −1 6= 1 = (−1)0 = f (0) альных). Почти всегда это функции, получаю-
n→∞
щиеся из элементарных с помощью алгебраиче-
ских операций (сумма, разность, произведение,
С другой стороны, очевидно, что некото- частное) и операции композиции. Мы будем на-
рые другие элементарные функции непрерывны. зывать такие функции стандартными (см. опре-
Полный их список дает следующая теорема (ее деление на с.306), чтобы отличать их от списка
доказательство мы оставляем читателю в каче- функций, перечисленных в § 1 этой главы и на-
стве упражнения): званных там элементарными.
производной и интеграла, и поэтому раздел ма- большие надежды внушает наметившаяся по-
тематики, изучающий числовые выражения, опе- следнее время возможность создать инфраструк-
рации над ними и их связь со стандартными туру, которая позволила бы избавить общество
функциями, логично считать частью Исчисле- от этой нагрузки.
ния (Calculus) — дисциплины о символьных вы- Очевидно, что с развитием программирова-
числениях в Анализе. В русском языке это слово ния отношение к вычислениям в математике бу-
обычно используется в связке с одним из двух дет меняться. Арифметические вычисления, ко-
прилагательных, дифференциальное или инте- торым до последней трети 20 века уделялось
гральное, в зависимости от типа решаемых задач. главное внимание в преподавании математики, с
О дифференциальном исчислении мы поговорим их сосредоточенностью на вопросе “как выразить
на с.330, а об интегральном – на с.392. в десятичных дробях результат данной последо-
С точки зрения логики на Исчисление есте- вательности операций с десятичными дробями?”
ственно глядеть, как на недостроенную фор- — ушли далеко на периферию общественного со-
мальную теорию4 . Качественное ее отличие от знания с распространением калькуляторов. Точ-
теорий, рассматривавшихся нами в главе 1, со- но так же Исчисление, концентрирующееся на
стоит в том, что предикат равенства в ней опре- задачах “как выразить в стандартных функциях
делить (внутри самого Исчисления, без необхо- результат данной последовательности операций
димости строить модель в теории вещественных со стандартными функциями?”, должно отойти
чисел) не получается5. на второй план с распространением программ,
Вопрос о том, как определить равенство чис- позволяющих решать эти задачи автоматически.
ловых выражений, чтобы превратить Исчисле- Это не будет означать, конечно, смерть школь-
ние в полноценную формальную теорию, на се- ной и университетской математики, просто надо
годняшний день, насколько известно автору, от- понимать, что круг задач, которыми она зани-
крыт.6 Хотя он не выглядит трансцендентным, мается, неизбежно будет меняться. Вычисление
ясно, что ответ на него должен быть чрезвычай- производных и интегралов, вместе с решением
но громоздким (если не появится какой-то идеи, уравнений, утратят актуальность, как утратили
позволяющей все упростить, например, сменой ее относительно недавно методы умножения и
сигнатуры). По уровню трудоемкости эта зада- деления многозначных чисел.
ча, наверное, сравнима с созданием операцион-
Эта неразработанность в настоящем и неопре-
ной системы в программировании (с той разни- деленность для будущего делает Исчисление
цей, что несколько операционных систем нынче
неблагодарной темой для учебников. Мы по-
существует и поддерживается, а Исчисление, как стараемся в своих объяснениях минимизиро-
формальная теория, пока не разработано). вать собственно рассуждения внутри Исчисле-
Это сравнение с программированием кажет- ния, как “недостроенной формальной теории”,
ся автору ключевым в выработке отношения к перенеся, насколько это возможно, формально-
этой дисциплине. Ясно, что проблему равенств в сти в Анализ. В частности, проблему равен-
Исчислении нужно как-то решать, но нужно ли ства числовых выражений мы, по установив-
заставлять школьников и студентов изучать де- шейся традиции, решаем декларацией: “выраже-
тали полученного решения, когда оно будет най- ния равны, если определяемые ими стандартные
дено, и нужно ли продолжать заставлять их зуб- функции равны” 7 .
рить “суррогатные” алгоритмы решения задач в
обход этой проблемы, как это делается сейчас, —
зависит от развития событий не только в мате-
матике. Числовые выражения. Числовые выраже-
Если удастся превратить Исчисление в (бо- ния служат главным предметом изучения в шко-
лее или менее простую) формальную теорию, ле, поэтому читателю они должны быть хорошо
то понятно, что такую науку нужно будет пре- знакомы. Грубо говоря, это конечные последова-
подавать везде, где можно, просто как доступ- тельности символов (букв, цифр, или символов
ный пример приложений математических зна- операций), которые можно записывать как ле-
ний. Поскольку это пока не получается, и в шко- вые или правые части уравнений, или которые
лах и университетах, по-прежнему, приходится определяют функции (возможно, от нескольких
учить людей дремучим методам решения урав- переменных) с помощью элементарных функций
нений и вычисления производных и интегралов, и алгебраических операций. Например, выраже-
6 Автору трудно судить о современных исследованиях в этой области, но во второй половине 20 века этой про-
блемой интересовались. В частности, известный польский математик Альфред Тарский поставил так называемую
Проблему школьных тождеств (“High school identities”), которую можно считать упрощенным вариантом проблемы
равенств в Исчислении, для частного случая, когда в сигнатуру теории включены только операции сложения, умно-
жения и возведения в степень (а в качестве модели рассматривается множество натуральных чисел N). Она оказалась
на удивление сложной и была решена в 1980 году Алексом Уилки, построившим знаменитый контрпример.
7 Связь между числовыми выражениями и стандартными функциями описывается ниже теоремой 4.2.2.
302 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
Теорема 4.2.2. Всякое числовое выражение набором переменных (x1 , ..., xn ) и парамет-
H над упорядоченными наборами параметров ров (a1 , ..., am ), имеющих сложность, мень-
(a1 , ..., am ) и переменных (x1 , ..., xn ) шую некоторого числа k ∈ N. Пусть H – вы-
ражение сложности k. По определению, сре-
H ∈ EX(a1 , ..., am ; x1 , ..., xn ) ди операций, из которых составлено выраже-
ние H должна быть какая-то внешняя опера-
определяет некое семейство функций ha1 ,...,am ция (то есть последняя по времени действия).
по формуле Рассмотрим по очереди возможные вариан-
ты:
ha1 ,...,am (x1 , ..., xn ) = H. (4.2.134)
— если внешней операцией является сложе-
Доказательство. Смысл формулы (4.2.134) ние, то есть H имеет вид
нуждается в прояснении, и мы проведем его ин- H = (F ) + (G),
дукцией по сложности выражения H.
где F и G – выражения сложности < k, то
0) Пусть сначала H — выражение сложности 0,
по предположению индукции F и G опре-
то есть не содержащее ни алгебраических опе-
деляют при заданном наборе параметров
раций, ни символов элементарных функций.
(a1 , ..., am ) некоторые функции
Тогда
— либо H вообще не содержит переменных, fa1 ,...,am (x1 , ..., xn ) = F ,
и является просто собственным обозна- ga1 ,...,am (x1 , ..., xn ) = G, (4.2.135)
чением какого-то неотрицательного цело-
го числа; тогда формула (4.2.134) задает и поэтому формула
функцию ha1 ,...,am : Rn → R, которая во
всех точках равна (одному и тому же) чис- ha1 ,...,am (x1 , ..., xn ) :=
лу, описываемому выражением H; = fa1 ,...,am (x1 , ..., xn )+ga1 ,...,am (x1 , ..., xn )
— либо H представляет собой какую-то пе- определяет функцию на общей области
ременную из набора (x1 , ..., xn ) определения функций fa1 ,...,am и ga1 ,...,am :
H = xi , i = 1, ..., n; D(ha1 ,...,am ) := D(fa1 ,...,am ) ∩ D(ga1 ,...,am );
в этом случае формула (4.2.134) интерпре- — точно так же мы поступаем, если внешней
тируется как тождество операцией является вычитание или умно-
жение:
ha1 ,...,am (x1 , ..., xn ) = xi , x ∈ R, H = (F ) − (G),
определяющее функцию ha1 ,...,am : Rn → H = (F ) · (G),
R, которая в каждой точке (x1 , ..., xn ) рав- – тогда опять формулы (5.1.88) определя-
на значению переменной xi . ют некие функции, и после этого на их об-
— либо H представляет собой какой-то пара- щей области определения D(ha1 ,...,am ) :=
метр из набора (a1 , ..., am ) D(fa1 ,...,am ) ∩ D(ga1 ,...,am ) становится воз-
можным определить функцию
H = aj , i = 1, ..., n;
ha1 ,...,am (x1 , ..., xn ) :=
в этом случае формула (4.2.134) интерпре- = fa1 ,...,am (x1 , ..., xn )−ga1 ,...,am (x1 , ..., xn ),
тируется как тождество
и функцию
ha1 ,...,am (x1 , ..., xn ) = aj , x ∈ R,
ha1 ,...,am (x1 , ..., xn ) :=
определяющее функцию ha1 ,...,am Rn → R, = fa1 ,...,am (x1 , ..., xn )·ga1 ,...,am (x1 , ..., xn );
которая в каждой точке (x1 , ..., xn ) равна
значению параметра ai . — если внешней операцией является деле-
ние, то есть H имеет вид
Понятно, что во всех трех случаях областью
определения функции ha1 ,...,am является про- F
H= ,
странство Rn : G
то формулы (5.1.88) определяют некие
D(ha1 ,...,am ) = Rn .
функции, и поэтому формула
k) Предположим далее, что смысл формулы fa1 ,...,am (x1 , ..., xn )
(4.2.134) объяснен для всех выражений над ha1 ,...,am (x1 , ..., xn ) :=
ga1 ,...,am (x1 , ..., xn )
§ 2. Стандартные функции 305
— если внешней операцией является вычис- Для всякого набора параметров (a1 , ..., am ) ∈
ление арккосинуса, Rm область определения D(fa1 ,...,am ) функ-
ции fa1 ,...,am называется областью допу-
H = arccos(F ), стимых значений переменных выражения
F (при заданных значениях параметров
то сложность F меньше k, и по предполо- (a1 , ..., am )) и обозначается Da1 ,...,am (F ):
жению индукции формула (4.2.137) опре-
деляет некую функцию на подмножестве Da1 ,...,am (F ) := D(fa1 ,...,am ). (4.2.138)
D(fa1 ,...,am ) в Rn , и, как следствие, форму-
ла В частном случае, когда параметры отсут-
ствуют, используется обозначение
ha1 ,...,am (x1 , ..., xn ) :=
= arccos fa1 ,...,am (x1 , ..., xn ), D(F ) := D(f ),
⋄ 4.2.10. Выражения
• Семейство функций fa1 ,...,am : Rn ֒→ R, 1 √ √
(a1 , ..., am ) ∈ Rm , называется стандартным, , x − 1 + −1 − x
0
если оно определяется некоторым числовым
выражением F : определяют пустую функцию, потому что об-
ласть допустимых значений переменных у них
fa1 ,...,am (x1 , ..., xn ) = F . пуста.
§ 2. Стандартные функции 307
⋄ 4.2.25. Бывает все же так, что при приведе- 2) limn→∞ log2 n = +∞ (здесь тоже рассто-
нии стандартная функция не меняется. Напри- яние между соседними точками последова-
мер, функция тельности убывает);
3) limn→∞ log3 n1 = −∞;
h(x) = logx sin x 2
4) limn→∞ (−n 3 ) = −∞;
при приведении превращается в функцию 5) limn→∞ (−1)n · n = ∞.
ln sin x ⊲ 4.2.29. Какие из последовательностей явля-
ĥ(x) = ,
ln x ются бесконечно малыми, а какие – бесконечно
которая имеет ту же область опреджеления, что большими?
и h, и совпадает с h во всех точках этого множе- 1) xn = √1
n
ства. √
2) xn = n
Предел последовательности.
⊲⊲ 4.2.26. Какими должны быть величины α, β,
чтобы почти все элементы последовательности
xn лежали в интервале (α; β)?
1) xn = cos 2πn
3
(Ответ: α < − 12 , β > 1)
2. Заметим, что все числа {xn } неотрицатель-
2) xn = sin 2πn
3 ны (это можно доказать отдельно по индукции):
√ √
3 3
(Ответ: α < − 2 , β> 2 )
xn > 0
3) xn = cos πn
3
(Ответ: α < −1, β > 1) 3. Из картинки видно, что на первых несколь-
4) xn = sin πn ких элементах {xn } наша последовательность
3 √ √
(Ответ: α < − 3
2 , β> 3
2 )
неубывает. Попробуем доказать, что она неубы-
вает всегда:
⊲⊲ 4.2.27. Доказать что xn 6 xn+1 (4.2.149)
1) 0 6= limn→∞ sin πn
3 Поймем сначала, что означает это неравенство:
⊲⊲ 4.2.28. Доказать что используем, что xn > 0
√ ↓
1) limn→∞ n = +∞ (здесь расстояние между √
соседними точками последовательности убы- xn 6 xn+1 ⇔ xn 6 6 + xn ⇔
вает); ⇔ x2n 6 6 + xn ⇔ x2n − xn − 6 6 0 ⇔
310 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
xn 6 3 (4.2.150)
Подпоследовательности.
Это делается математической индукцией. ⊲⊲ 4.2.34. Является ли данная последователь-
a) Сначала проверяем наше неравенство при ность {yk } подпоследовательностью последова-
n = 1: тельности {xn }? (Если да, то указать соответ-
x1 = 0 6 3 ствующую последовательность индексов {nk }.)
b) Предполагаем, что оно верно при n = k: √
1) xn = n, yk = k
xk 6 3 (4.2.151) ⊲⊲ 4.2.35. Для данной последовательности {xn }
укажите какую-нибудь сходящуюся подпоследо-
c) Доказываем, что тогда оно будет верно при вательность {x }, если она существует.
nk
n = k + 1.
2πn
xk+1 6 3 (4.2.152) 1) xn = cos 3
Действительно, ⊲⊲ 4.2.36. Проверьте с помощью критерия Коши
√ сходимость последовательностей:
xk+1 6 3 ⇔ 6 + xk 6 3 ⇔
1) xn = sin πn
4 ;
⇔ 6 + xk 6 9 ⇔ xk 6 3
2) xn = cos πn
7 ;
а последнее неравенство выполняется в силу 3) xn = arctg(−1)n .
(4.2.151). Таким образом, получилось что из
(4.2.151) следует (4.2.152), а это нам и нужно бы- Функции, заданные как пределы после-
ло. довательностей. Следующая серия упражне-
Итак, мы доказали (4.2.150), а значит и рав- ний может быть полезна в теме “предел после-
носильное ему условие (4.2.149). Эти неравенства довательности”, хотя подробно эти примеры мы
означают, что {xn } неубывает и ограничена свер- разбираем ниже в теме “поточечная сходимость”
ху. Значит, по теореме Вейерштрасса 3.2.11 она (начиная со страницы 529).
имеет предел. Обозначим его буквой c:
⊲⊲ 4.2.37. Постройте графики следующих функ-
lim xn = c ций:
n→∞
1) f (x) = limn→∞ xn
и заметим, что c > 0, поскольку xn > 0 (по тео- 1
реме 3.2.8 о переходе к пределу в неравенстве). 2) f (x) = limn→∞ 1+x n
√
Тогда из формулы xn+1 = 6 + xn мы получаем 3) f (x) = limn→∞ xn − xn+1 ;
x−n −1
(xn+1 )2 = 6 + xn 4) f (x) = limn→∞ x−n +1 ;
√
n
5) f (x) = limn→∞ 1 + x2n
откуда q
6) f (x) = limn→∞ n
x2 + n12 .
c2 = lim (xn+1 )2 = lim (6 + xn ) = 6 + c
n→∞ n→∞ 7) f (x) = limn→∞ nx
nx −n−x
То есть c удовлетворяет квадратному уравнению 8) f (x) = limn→∞ nx +n−x
x3 nx −n−x
c2 = 6 + c 9) f (x) = limn→∞ nx +n−x
x
−1
10) f (x) = limn→∞ arcsin nnx +1 .
решая которое (с учетом, что c > 0), мы получа- 2n
ем c = 3. 11) f (x) = limn→∞ cos x;
Ответ: limn→∞ xn = 3 12) f (x) = limn→∞ (sin2n x − cos2n
x);
x
13) f (x) = limn→∞ 1+(2 sin x)2n ;
⊲⊲ 4.2.33. Докажите, что последовательность,
заданная рекуррентно сходится, и найдите ее 14) f (x) = limn→∞ arctg(nx);
предел: 15) f (x) = limn→∞ x · arctg(n · ctg x);
p
1) x1 = 1, xn+1 = xn (6 − xn ); 16) f (x) = limn→∞ x2 · arctg(x2n );
§ 2. Стандартные функции 311
1 Решение:
= lim √ 2 √ =
x→0 3
1+x 2 + 3 1 + x2 + 1
1 cos2 x − 1 cos x = y,
= (подстановка) = √ 2 √ = lim = y −→ 1 =
3 x→0 cos2 x + 2 cos x − 3
1+0 + 31+0+1 x→0
1 1 y2 − 1 (y − 1)(y + 1)
= = = lim = lim =
1+1+1 3 y→1 y 2 + 2y − 3 y→1 (y − 1)(y + 3)
y+1 2 1
⊲⊲ 4.2.46. Найти пределы = lim
y→1 y + 3
= =
4 2
x2 −5x+6
1) limx→2 x2 −2x ,
√ ⋄ 4.2.50. Вычислить предел
2 −1
2) limx→0 1+x x2
p
√ lim 1 + x2 − x
1+x2 −1
3) limx→0 √16+x 2 −4
x→+∞
√
3
√
3
4) limx→0 1+x− x
1−x Решение:
√
x−1
5) limx→1 √
3 x−1 p x = y1 , y = x1
√
1−x−3
lim 1 + x2 − x = y −→ 0 + 0 =
6) limx→−8 2+ √ x→+∞
3 x x→+∞
r
1 1
= lim 1+ 2 − =
Замена переменной под знаком предела. y→0+0 y y
В следующих примерах используется теорема !
1 p 2 1
3.4.9 о замене переменной под знаком предела. = lim p y +1− =
y→0+0 y 2 y
⋄ 4.2.47. Найти предел
используем
p тождество
= =
√ 2
y = |y|
x−4 p
lim √ √ 1 1
x→16 x− 4x−2 = lim y2 + 1 − =
y→0+0 |y| y
Решение: y → 0 + 0,
= значит y > 0, =
√ поэтому |y| = y
√ 4
x = y, x = y 4 p p
x−4 1 1 y2 + 1 − 1
lim √ √ = y −→ 4 = = lim 2
y +1− = lim =
x→16 x− 4 x−2 x→16 y→0+0 y y y→0+0 y
y 6= 4 при x 6= 16 p p
2
( y 2 + 1 − 1)( y 2 + 1 + 1)
y −4 0 (y − 2)(y + 2) = lim p =
= lim 2 = = lim = y→0+0 y( y 2 + 1 + 1)
y→4 y − y − 2 0 y→4 (y − 2)(y + 1)
y+2 4+2 6 y2 + 1 − 1 y2
= lim = = = lim p = lim p =
y→0+0 y( y 2 + 1 + 1) y→0+0 y( y 2 + 1 + 1)
y→4 y + 1 4+1 5
y
⋄ 4.2.48. Найти предел = lim p =
y→0+0 2
y +1+1
√ y
x−1 = lim p = (подстановка) =
lim √ y→0+0 y2 + 1 + 1
x→1 3
x−1
0
= √ =0
Решение: 0+1+1
√ ⋄ 4.2.51. Вычислить предел
√ 6
x = y, x = y 6
x−1 y −→ 1
lim √ = x→1
= x
x→1 3
x−1 lim √
y 6= 1 при x 6= 1 x→−∞ 2
x +5
y3 − 1 0 Решение:
= lim 2 = =
y→1 y − 1 0
(y − 1)(y 2 + y + 1) y2 + y + 1 x x = y1 , y = x1
= lim = lim = lim √ = y −→ 0 − 0 =
y→1 (y − 1)(y + 1) y→1 y+1 x→−∞ 2
x +5 x→−∞
1+1+1 3 1 1
= = y y
1+1 2 = lim q = lim q =
y→0−0 1 y→0−0 1
y2 +5 +5 y2
⋄ 4.2.49. Найти предел используем
1
2
cos x − 1 = lim py = тождество
p =
lim y→0−0 √1 2 1 + 5y 2 y 2 = |y|
x→0 cos2 x + 2 cos x − 3 y
314 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
1
y → 0 − 0, ⇓ (теорема 3.2.10)
= lim 1
py = значит y < 0, =
y→0−0
|y| 1 + 5y 2 поэтому |y| = −y sin xn
−→ 1.
1 xn n→∞
y 1
= lim 1
p = lim p = Это верно для всякой последовательности
y→0−0 1 + 5y 2 y→0−0 − 1 + 5y 2
−y xn −→ 0, xn > 0, значит
1 n→∞
= √ = −1
− 1+5·0 sin x
lim =1
x→+0 x
⊲⊲ 4.2.52. Найти пределы
sin2 x−sin x−2 Отсюда уже следует, что
1) limx→− π2 sin3 x+1
23x+2 −3·2x sin x t = −x sin(−t)
2) limx→+∞ 1−23x+1 lim = = lim =
23x+2
−3·2 x x→−0 x t → +0 t→+0 −t
3) limx→−∞ 1−23x+1
√ − sin t sin t
1+sin x−1 = lim = lim =1
4) limx→0 sin x t→+0 −t t→+0 t
√
1+9x
5) limx→+∞ 1+3 x Вместе эти равенства дают (4.2.153).
√
1+9x
6) limx→−∞ 1+3x Обсудим теперь применения первого замеча-
x
−1
7) limx→0 16
8x −1
тельного предела.
√ √
8) limx→∞ x2 + 1 − x2 − 1 ⋄ 4.2.53. Найти предел
√
9) limx→∞ x( x2 + 1 − x) sin 2x
2
2x√ −3x−4 lim
10) limx→∞ x4 +1
x→0 x
√
11) limx→+∞ q √x √ Здесь можно сделать замену переменных, после
x+ x+ x чего наш предел сведется к первому замечатель-
ному:
Первый замечательный предел. При вы-
y
числении пределов с тригонометрическими sin 2x 2x = y, x = 2
lim = y −→ 0 =
функциями оказывается полезным следующий x→0 x x→0
y 6= 0 при x 6= 0
факт.
2 sin y sin y
= lim = 2 lim = 2·1 =2
Теорема 4.2.4. y→0 y y→0 y
sin x ⋄ 4.2.54.
lim =1 (4.2.153)
x→0 x
1 1
= y, x =
1 x y
• Это равенство называется первым за- lim x · sin = y −→ 0
x→∞
=
x→∞ x y 6= 0 при любом x
мечательным пределом.
sin y
Доказательство. Пусть сначала = lim =1
y→0 y
xn −→ 0, xn > 0 ⋄ 4.2.55.
n→∞
tg x sin x sin x 1
Почти все xn лежат в интервале (0; π2 ), поэтому lim = lim = lim · lim =
x→0 x x→0 x cos x x→0 x x→0 cos x
для них из тройного неравенства (4.1.70) мы по-
лучаем цепочку: = 1·1 =1
⋄ 4.2.56.
0 < sin xn < xn < tg xn
1 − cos x 2 sin2 x2 sin x2 2
⇓ (делим на sin xn ) lim = lim = 2 lim =
x→0 x2 x→0 x2 x→0 x
xn 1
sin x2 2
x
1< < 2 = y, x = 2y
sin xn cos xn = 2 lim = y −→ 0
x→0 =
x→0 x y 6= 0 при x 6= 0
⇓ (возводим в степень −1) 2 2
sin y 1 sin y 1 1
sin xn = 2 lim = lim = ·1 =
1> > cos xn y→0 2y 2 y→0 y 2 2
xn | {z }
↓ (cos – непрерывная функция)
cos 0 ⊲⊲ 4.2.57. Найти пределы
k sin 5x
1 1) limx→0 3x
§ 2. Стандартные функции 315
sin αx
2) limx→0 sin βx Аналогично доказывается что
2
3) limx→∞ (x − 3) sin 3x nk +1
1
1+ −→ e (4.2.158)
4) limx→0 x ctg x nk + 1 k→∞
5) limx→∞ x2 sin x1
Теперь рассмотрим двойное неравенство
tg x−sin x
6) limx→0 sin3 x (4.2.156). Из него следует
1 1 1
Второй замечательный предел. Следую- > >
nk xk nk + 1
щее утверждение оказывается также весьма по-
а отсюда, в свою очередь, получается
лезным при вычислении пределов:
1 1 1
Теорема 4.2.5. 1+ >1+ >1+
nk xk nk + 1
x и
1 1
lim (1 + x) = e = lim 1 +
x
(4.2.154) xk xk xk
x→0 x→∞ x 1 1 1
1+ > 1+ > 1+
nk xk nk + 1
• Эти (эквивалентные) равенства назы-
ваются вторым замечательным пре- Расширим это двойное неравенство влево и впра-
делом. во:
1
1+ −→ e (4.2.157) e, 1
nk k→∞ в силу (4.2.155)
316 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ
(4.2.154). 1
4) limx→0 1 + 2x2 x2
Теорема 4.2.5 позволяет вычислять сложные x+1
2x+3
5) limx→∞ 2x+1
пределы, в которых возникает неопределенность
типа 1∞ . 6) limx→0 (1 + tg x)ctg x
ctg2 x
⋄ 4.2.58. Найти предел 7) limx→0 1 + 3 tg2 x
1
ctg x 8) limx→0 (cos x) sin2 x
lim (1 + tg x) 1
x→0 9) limx→0 cos2 x sin2 x
ctg x
Решение: 10) limx→0 (cos x)
x+1
2x+3
tg x = y, ctg x = 1 11) limx→∞ 2x−1
lim (1 + tg x)ctg x = y −→ ∞
y
= 2 x2
x→0 x→0
1
12) limx→∞ xx2+3x+1
−x+2
= lim (1 + y) y = e x
y→0 5x2 +1
13) limx→∞ 5x2 +x+1
⋄ 4.2.59. Найти предел x2
x+1
14) limx→∞ x+3
x
x+1
lim Следствие 4.2.6. Справедливы соотношения:
x→∞ x − 1
Решение: ln(1 + x)
lim =1 (4.2.160)
x→0 x
x
x и
x+1 x+1
lim = lim 1 + −1 = ex − 1
x→∞ x − 1 x→∞ x−1 lim =1 (4.2.161)
x x→0 x
2 2
= y, x = 1 + y2
= lim 1 + = x−1 y −→ 0 = Доказательство. Сразу получается (4.2.160):
x→∞ x−1 x→∞
h i
1 2
1+ 2
= lim (1 + y) y = lim (1 + y) (1 + y) y = ln(1 + x) 1
y→0 y→0 lim = lim ln(1 + x) x =
2 x→0 x x→0
1 1
= lim (1 + y) lim (1 + y) y = e2 = ln lim (1 + x) x = ln e = 1
y→0 y→0 x→0
ПРОИЗВОДНАЯ
§1 Производная
Понятие производной появилось в анализе как инструмент для решения задач на экстремум (то есть
на максимум и минимум), поэтому обсуждение этой темы полезно начать с какого-нибудь простого
примера, иллюстрирующего эту связь.
f (x) = x2 − x4 (5.1.1)
k = tg ϕ
a 7→ k(a)
Отсюда можно заключить, что f действительно которая каждой точке a ∈ R ставит в соответ-
будет иметь максимум в каких-то точках, лежа- ствие угловой коэффициент k = k(a) касатель-
щих на интервалах (−1, 0) и (0, 1), и нам нужно ной к графику функции f в точке a.
придумать, как найти эти точки. Заметим далее, что в точках максимума (а
также, минимума) касательная к графику функ-
ции f горизонтальна, то есть угловой коэффици-
Чтобы это понять, нарисуем касательную к ент касательной равен нулю
графику функции f в какой-нибудь точке a ∈ R
(что такое касательная, мы надеемся, что чита- k(a) = 0. (5.1.2)
317
318 Глава 5. ПРОИЗВОДНАЯ
Поэтому если б мы знали функцию a 7→ k(a), то задача будет решена в примере 5.1.3), и уравне-
решив уравнение (5.1.2), мы как раз смогли бы ние (5.1.2) решается так:
получить точки максимума.
Раздел анализа, называемый Дифференци- k(a) = 0 ⇔ 2a − 4a3 = 0 ⇔
альным исчислением (мы поговорим о нем на
1 1
с.330), как раз предоставляет алгоритм, позво- ⇔ a∈ − √ , 0, √ ,
ляющий найти функцию a 7→ k(a) по функции 2 2
x 7→ f (x). Для нашей функции f (x) = x2 − x4 После этого становится понятно, что максимум
соответствующая функция k имеет вид нашей функции достигается в точках ± √12 , и ра-
k(a) = 2a − 4a3 (5.1.3) вен
1 1 1 1
(почему это так станет понятно после § 1 настоя- f ± √ = − =
2 2 4 4
щей главы, а конкретно для функции (5.1.1) эта
k(a) = f ′ (a)
Это одно из главных понятий в математическом анализе, и, помимо нахождения экстремумов (мак-
симумов и минимумов), оно используется в разных других задачах, например,
– при построении графика функции (это описывается в (b) этой главы),
– при вычислении сложных пределов с помощью правила Лопиталя (см. (a) этой главы),
– при определении еще одного важного объекта в математическом анализе – неопределен-
ного интеграла (об этом речь пойдет в главе 8).
В этой главе мы дадим аккуратное определение этому понятию, научимся вычислять производные
стандартных функций и обсудим приложения производной.
f (a + t) − f (a)
lim = f ′ (a)
t→0 t
Отсюда следует, что существует предел
f (a + t) − f (a) f (a + t) − f (a)
lim (f (a + t) − f (t)) = lim · t = lim · lim t = f ′ (a) · 0 = 0
t→0 t→0 t t→0 t t→0
То есть,
lim f (x) = lim f (a + t) = f (a)
x→a t→0
f ′ (x0 ) = 0
Для понимания этих терминов следует уяс- то это означает, что касательная в этой точке
нить два важных момента: x0 горизонтальна
f ′ (x0 ) > 0
f ′ (x0 ) < 0
то касательная в x0 убывает
но в точке x0 = 0 она не дифференцируема
(потому что в x0 = 0 однозначно определен-
ную касательную провести невозможно)
– во-вторых, по графику функции можно сооб- ⊲ 5.1.5. Нарисуйте график какой-нибудь функ-
разить, в каких точках производная больше, ции f со следующими свойствами:
а в каких – меньше; например, у той же самой
1) f дифференцируема в любой точке,
функции f (x) = | arctg x| производная в точ-
кроме x = −2 и x = 1;
ке x0 = 1 больше, чем в точке x1 = 2 (потому
′
что угол наклона касательной в точке x0 = 1 2) f (0) = 0, f ′ (2) = −1, f ′ (−1) = 1;
больше, чем в точке x1 = 2): 3) f убывает на множестве (0; +∞);
§ 1. Производная 321
′ f (x + t) + g(x + t) − f (x) + g(x)
f + g (x) = lim =
t→0
t
f (x + t) − f (x) + g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim + lim =
t→0 t t→0 t t→0 t
= f ′ (x) + g ′ (x)
Аналогично доказывается (5.1.24):
′ f (x + t) − g(x + t) − f (x) − g(x)
f − g (x) = lim =
t→0
t
f (x + t) − f (x) − g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim − lim =
t→0 t t→0 t t→0 t
= f ′ (x) − g ′ (x)
Для (5.1.25) получаем:
f ′ f (x+t) f (x)
g(x+t) − g(x) f (x + t) · g(x) − f (x) · g(x + t) вычтем и прибавим
(x) = lim = lim = слагаемое f (x) · g(x) =
g t→0 t t→0 t · g(x + t) · g(x)
f (x + t) · g(x) − f (x) · g(x) + f (x) · g(x) − f (x) · g(x + t)
= lim =
t→0 t · g(x + t) · g(x)
f (x + t) · g(x) − f (x) · g(x) f (x) · g(x) − f (x) · g(x + t)
= lim + =
t→0 t · g(x + t) · g(x) t · g(x + t) · g(x)
f (x + t) − f (x) g(x + t) − g(x) 1
= lim · g(x) − f (x) · · =
t→0 t t g(x + t) · g(x)
f (x + t) − f (x) g(x + t) − g(x) 1
= lim · g(x) − f (x) · lim · lim =
t→0 t t→0 t t→0 g(x + t) · g(x)
по теореме 5.1.1, функция 1 f ′ (x) · g(x) − f (x) · g ′ (x)
= g(x) непрерывна, значит = f ′ (x) · g(x) − f (x) · g ′ (x) · =
limt→0 g(x + t) = g(x) g(x)2 g(x)2
§ 1. Производная 325
(g ◦ f )′ = (g ′ ◦ f ) · f ′ (5.1.28)
xn −→ a, xn 6= a (5.1.29)
n→∞
и убедиться, что
g(f (xn )) − g(f (a))
lim = g ′ (f (a)) · f ′ (a) (5.1.30)
xn − a
n→∞
g(f (xn )) − g(f (a)) g(f (xn )) − g(f (a)) f (xn ) − f (a)
lim = lim · =
n→∞ xn − a n→∞ f (xn ) − f (a) xn − a
g(f (xn )) − g(f (a)) f (xn ) − f (a) в левом пределе делаем
= lim · lim = замену yn = f (xn ) =
n→∞ f (xn ) − f (a) n→∞ xn − a
g(yn ) − g(f (a)) f (xn ) − f (a)
= lim · lim = g ′ (f (a)) · f ′ (a)
n→∞ yn − f (a) n→∞ xn − a
326 Глава 5. ПРОИЗВОДНАЯ
2. После этого рассмотрим случай, когда для некоторой подпоследовательности аргументов xnk
соответствующая последовательность значений f (xnk ) обладает свойством f (xnk ) = f (a). Тогда
последовательность xn можно разбить на две подпоследовательности xnk и xni , такие что
g(f (xnk )) − g(f (a)) вспоминаем, что g(f (a)) − g(f (a)) 0
lim = f (xn ) = f (a) = lim = lim =0
k→∞ xnk − a k k→∞ xnk − a k→∞ xnk − a
А с другой стороны,
И, таким образом,
g(f (xnk )) − g(f (a))
lim = 0 = g ′ (f (a)) · f ′ (a)
k→∞ xnk − a
Мы получили, что для любой последовательности (5.1.29) выполняется равенство (5.1.30), а это
нам и нужно было доказать.
h(x) = earctg x = g(f (x)), g(y) = ey , f (x) = arctg x а для функции g она посчитана в примере 5.1.10:
Тогда g ′ (y) = ey
1
g ′ (y) = ey , f ′ (x) = Поэтому
1 + x2
Применяя формулу (5.1.61), получаем:
h′ (x) = g ′ (f (x)) · f ′ (x) =
1
h′ (x) = g ′ (f (x)) · f ′ (x) = earctg x · = ex·ln x · ln x + 1 = xx · ln x + 1 .
1 + x2
§ 1. Производная 327
или
f (ξ) = min f (x).
x∈(a,b)
f ′ (ξ) = 0
то есть
∀x ∈ (a, b) f (x) 6 f (ξ) (5.1.32)
Тогда, с одной стороны,
0
6
(5.1.32)
z }| {
f (x) − f (ξ) если предел существует, f (x) − f (ξ)
f ′ (ξ) = lim = то он равен пределу слева = lim >0
x→ξ x−ξ x→ξ−0 x−ξ
| {z }
>
(x < ξ)
0
А, с другой стороны,
0
6
(5.1.32)
z }| {
f (x) − f (ξ) f (x) − f (ξ)
если предел существует,
f ′ (ξ) = lim = то он равен пределу справа = lim 60
x→ξ x−ξ x→ξ+0 x−ξ
| {z }
<
(x > ξ)
0
Теорема Ролля.
Теорема 5.1.6 (Ролля). 3
Пусть функция f определена на отрезке [a, b], причем
(i) f непрерывна на отрезке [a, b],
2 Эта теорема используется в следующем параграфе при доказательстве теоремы Ролля.
3 Эта теорема используется в следующих трех параграфах при доказательстве теорем Лагранжа, Коши и Тейлора
328 Глава 5. ПРОИЗВОДНАЯ
f ′ (ξ) = 0
∀x ∈ [a, b] m = f (x) = M,
поэтому ее производная f ′ (x) будет равна нулю в любой точке x ∈ [a, b].
Во втором же случае мы получаем, что с одной стороны f (a) = f (b), а с другой, m = f (xm ) <
f (xM ) = M . Это означает, что xm или xM не не может быть концом отрезка [a, b]:
– либо a < xm < b,
– либо a < xM < b.
Значит, функция f имеет экстремум на интервале (a, b) (если a < xm < b – то минимум, а если
a < xM < b – то максимум). Следовательно, по теореме Ферма 5.1.5, найдется точка ξ ∈ (a, b) такая,
что f ′ (ξ) = 0.
Теорема Лагранжа.
f (b) − f (a)
f ′ (ξ) = (5.1.33)
b−a
4 Эта теорема используется ниже при доказательстве теоремы 5.2.14 (достаточное условие строгой выпуклости).
§ 1. Производная 329
F ′ (ξ) = 0
Иными словами,
f (b) − f (a) ′
f ′ (ξ) − · g (ξ) = 0
g(b) − g(a)
5 Эта теорема используется ниже при доказательстве теоремы 5.2.1 (правило Лопиталя для предела в точке с
неопределенностью 00 )
330 Глава 5. ПРОИЗВОДНАЯ
лить производную функции h(x) = sin(x2 ) в при- (если это не приводит к недоразумениям, скоб-
мере 5.1.23 нам пришлось рассмотреть функции ки вокруг F могут не писаться) и называемое
g(y) = sin y и f (x) = x2 , выписать их производ- производным выражением таким образом, что-
ные и подставить их в формулу (5.1.27). бы выполнялись следующие условия:
Этот способ вычислений выглядит довольно
0) если выражение F не содержит переменной
громоздким в сравнении с приемами, употреб-
x, то его частная производная по x считается
лявшимися для таких задач в школе, где, как,
нулевой:
наверное, помнит читатель, вычисление произ- ∂F
водной оформляется в виде цепочки равенств = 0, (5.1.36)
∂x
(иногда длинной цепочки, но все же гораздо ко-
1) частная производная от переменной x по са-
роче, чем запись, которую приходится употреб-
мой этой переменной x считается равной еди-
лять, следуя алгоритму действий, описанному на
нице:
страницах 325 и 326). Например, для функции ∂x
h(x) = sin(x2 ) можно (используя обозначение = 1, (5.1.37)
∂x
(4.2.133)) записать эту цепочку так:
2) для произвольных числовых выражений F и
′ ′ G
sin(x2 ) = sin y = ∂ ∂ ∂
y=x2
F +G = F+ G (5.1.38)
∂x ∂x ∂x
= (sin y)′ · (x2 )′ = cos x2 · 2x. (5.1.35)
y=x2 ∂ ∂ ∂
F −G = F− G (5.1.39)
∂x ∂x ∂x
Естественно поэтому задуматься, отчего школь- ∂ ∂ ∂
ные приемы приводят к правильным результа- F ·G = F ·G+F · G (5.1.40)
∂x ∂x ∂x
там, и как их следует аккуратно сформулиро-
∂F ∂G
вать, чтобы грамотно использовать для вычис- ∂ F ∂x · G − F · ∂x
лений. = (5.1.41)
∂x G G2
Раздел математического анализа, занимаю-
щийся этими вопросами, называется Исчисление, 3) для произвольного числового выражения F
и мы упоминали уже о нем в начале главы 4.
Его идея состоит в том, чтобы поглядеть на про- ∂ α ∂F
изводную (и на интеграл, о котором мы пого- F = α · F α−1 · (5.1.42)
∂x ∂x
ворим в следующей главе), как на формальную ∂ F F ∂F
операцию над числовыми выражениями6 . Такой a = ln a · a · (a > 0) (5.1.43)
∂x ∂x
отстраненный взгляд позволяет формализовать ∂ F ∂F
приемы вычисления производной таким образом, e = eF · (5.1.44)
∂x ∂x
что цепочки вида (5.1.35) становятся результа- ∂ 1 ∂F
том применения одного общего алгоритма, обос- loga F = · (F > 0) (5.1.45)
∂x F · ln a ∂x
нованность которого отдельно доказывается, и ∂ 1 ∂F
поэтому не вызывает сомнений. ln F = · (F > 0) (5.1.46)
∂x F ∂x
В этом параграфе мы опишем этот алгоритм ∂ ∂F
(и докажем правомерность его применения), что- sin F = cos F · (5.1.47)
∂x ∂x
6 Числовые выражения были определены выше на с.302.
§ 1. Производная 331
∂ ∂F
cos F = − sin F · (5.1.48) производную по этой переменной удобно обозна-
∂x ∂x чать штрихом:
∂ 1 ∂F ∂
tg F = · (5.1.49) F′ = F (5.1.62)
∂x cos2 F ∂x ∂x
∂ 1 ∂F Для этого случая правила вычисления полезно
ctg F = − 2 · (5.1.50)
∂x sin F ∂x переписать отдельно:
∂ 1 ∂F 0) если F – нульместное числовое выражение,
arcsin F = √ · (5.1.51)
∂x 1−F 2 ∂x то его производная считается нулевой:
∂ 1 ∂F
arccos F = − √ · (5.1.52) F ′ = 0, (5.1.63)
∂x 1−F 2 ∂x
∂ 1 ∂F 1) производная от переменной x считается рав-
arctg F = · (5.1.53) ной единице:
∂x 1 + F 2 ∂x
∂ 1 ∂F x′ = 1, (5.1.64)
arcctg F = − · (5.1.54) 2) для произвольных выражений F и G от пере-
∂x 1 + F 2 ∂x
менной x,
′
F + G = F ′ + G′ (5.1.65)
! 5.1.27. К этим правилам следует добавить, ′
что операции дифференцирования выражений F − G = F ′ − G′ (5.1.66)
по другим переменным определяются по анало- ′
гии. F · G = F ′ · G + F · G′ (5.1.67)
! 5.1.28. Из формул (5.1.38)-(5.1.61) следует, ′
F F ′ · G − F · G′
что область допустимых значений переменной = (5.1.68)
G G2
для производного выражения подчиняется ра-
венствам: 3) для произвольного выражения F от перемен-
ной x,
∂(F + G) ∂F ∂G
D =D ∩D (5.1.55)
∂x ∂x ∂x ′
F α = α · F α−1 · F ′ (5.1.69)
∂(F − G) ∂F ∂G
D =D ∩D (5.1.56) ′
∂x ∂x ∂x
aF = ln a · aF · F ′ (a > 0) (5.1.70)
∂(F · G) ∂F ∂G ′
D =D ∩D (5.1.57)
∂x ∂x ∂x eF = eF · F ′ (5.1.71)
F
∂( ) ′ 1
D ∂xG =
(5.1.58) loga F = · F ′ (F > 0) (5.1.72)
= D ∂F ∂G F · ln a
∂x ∩ D ∂x \ {x : G = 0} ′
! 1
∂ G ln F = · F ′ (F > 0) (5.1.73)
D y=F
= F
∂x ′
n o (5.1.59) sin F = cos F · F ′ (5.1.74)
= x : F ∈ D ∂G
∂y ∩D ∂F
∂x ′
cos F = − sin F · F ′ (5.1.75)
Из (5.1.40) и (5.1.36) следует ′ 1
tg F = · F′ (5.1.76)
Теорема 5.1.9. Если выражение F не содер- cos2 F
′ 1
жит переменной x, то ctg F = − 2 · F ′ (5.1.77)
sin F
∂ ∂ ′ 1
F ·G = F · G (5.1.60) arcsin F = √ · F′ (5.1.78)
∂x ∂x 1 − F2
′ 1
Теорема 5.1.10. Если F — одноместное выра- arccos F = − √ · F′ (5.1.79)
жение от переменной x, а G — одноместное вы- 1 − F2
′ 1
ражение от переменной y, то для выражения,
arctg F = · F′ (5.1.80)
полученного подстановкой, выполняется равен- 1 + F2
ство ′ 1
arcctg F = − · F′ (5.1.81)
∂ ∂ ∂ 1 + F2
G = G · F (5.1.61)
∂x y=F ∂y y=F ∂x
Теорема 5.1.11. Если выражение F не содер-
Производная одноместного числового вы- жит переменной x, то
ражения. Если F – одноместное числовое вы- ′
ражение, например, от переменной x, то частную F · G = F · G′.
332 Глава 5. ПРОИЗВОДНАЯ
⋄ 5.1.32. = 5 · y4 · (2x + 1) =
y=x2 +x+1
′ = 5 · (x + x + 1)4 · (2x + 1)
2
arctg x
=
x2 + 1
⋄ 5.1.37. Следующая формула доказывается с
(arctg x)′ · (x2 + 1) − (x2 + 1)′ · arctg x помощью теоремы о сложной функции:
= =
(x2 + 1)2
1 1
2 · (x2 + 1) − 2x · arctg x (ln |x|)′ = , (5.1.83)
= x +1 = x
(x2 + 1)2
1 − 2x · arctg x Для доказательства нужно рассмотреть два слу-
= чая: при x > 0 получаем:
(x2 + 1)2
1
⊲⊲ 5.1.33. Продифференцируйте выражения по (ln |x|)′ = (ln x)′ = ,
переменной x: x
Производная стандартной функции. Объ- То же самое верно для случая разности и про-
ясним теперь, как связана производная число- изведения выражений. Для отношения получа-
вого выражения с производной порождаемой им ем: если F = Q P
, где P и Q – выражения слож-
стандартной функции. Эта связь выражается ности < k, то, во-первых, рассмотрев функции
следующей теоремой, оправдывающей определе- (5.1.88), мы снова по предположению индукции
ние на с.806. получим, что функции p и q дифференцируемы
на интервале (a, b), и их производные опреде-
Теорема 5.1.13. Пусть стандартная функция
ляются тождествами (5.1.89). А, во-вторых, из
f определяется непрерывным числовым выра-
условия (5.1.86) следует, что функция q вдоба-
жением7 F (при заданных значениях парамет-
вок не равна нулю на интервале (a, b):
ров),
f (x) = F . (5.1.85) (a, b) ⊆ {x : q(x) = Q =
6 0}.
Тогда на всяком интервале (a, b) из области
определения производной выражения F , Вместе это означает, что функция
Остается рассмотреть (самый сложный) слу- а точка p(x0 ) при этом должна быть нулем:
чай композиции. Пусть
p(x0 ) = 0.
F =Q ,
y=P
Чтобы доказать (5.1.87) при x = x0 , зафиксиру-
где Q – непрерывное элементарное выражение от ем какую-нибудь последовательность xn ∈ (a, b),
переменной y, а P – непрерывное выражение от стремящуюся к x0 , но не попадающую в x0 :
переменной x сложности < k. Условие (5.1.86) в
этом случае принимает вид xn −→ x0 , xn 6= x0 .
n→∞
= Q′ · P′ = (5.1.61) = F ′
b. После этого рассмотрим случай, когда
y=p(x0 ) x=x0 x=x0
для некоторой подпоследовательности аргумен-
Это формула (5.1.87) с подстановкой x = x0 . тов xnk соответствующая последовательность
2. Предположим далее, что число p(x0 ) ∈ значений p(xnk ) обладает свойством p(xnk ) =
D(Q) лежит на границе множества D(Q′ ), то есть p(x0 ). Тогда последовательность xn можно раз-
не существует интервала (α, β) такого, чтобы вы- бить на две подпоследовательности xnk и xni , та-
полнялось (5.1.90). Поскольку Q – непрерывное кие что
элементарное выражение, одно из перечислен-
ных списке на с.300, такое возможно только в p(xnk ) = p(x0 ), p(xni ) 6= p(x0 )
случае, если Q есть степенное выражение, в ко-
тором показатель степени больше единицы и не Для подпоследовательности xni мы получаем то
N
лежит в 2N−1 , же самое, что и в предыдущем случае:
arcsin sin x
⋄ 5.1.42. Покажем, что при выборе выражения,
представляющего функцию, область допусти- График определяемой им функции
мых значений переменной в его производном вы-
ражении может меняться. Рассмотрим функ- h(x) = arcsin sin x
цию
f (x) = x. представляет собой “пилу”:
§2 Приложения производной
(a) Правило Лопиталя
Теоремы о дифференцируемых функциях позволяют доказать важное правило Лопиталя, с помо-
щью которого удается вычислять “сложные” пределы (которые иначе сосчитать бывает невозмож-
но).
f (x) f ′ (x)
lim = lim ′ (5.2.91)
x→a g(x) x→a g (x)
Тогда на каждом отрезке [a, xn ] функции f˜(x) и g̃(x) удовлетворяют условиям теоремы Коши 5.1.8:
1) f˜ и g̃ непрерывны на отрезке [a, xn ],
2) f˜ и g̃ дифференцируемы на интервале (a, xn ),
3) g ′ (x) 6= 0 при x ∈ (a, xn ).
Значит, по теореме Коши 5.1.8, существует точка ξn ∈ (a, xn ), такая что
f˜(xn ) f ′ (ξn )
= ′ , ξn ∈ (a, xn )
g̃(xn ) g (ξn )
!
f (xn ) f˜(xn ) f ′ (ξn ) ξn ∈ (a, xn ),
поэтому
f ′ (ξ)
lim = lim = lim ′ = = lim =
n→∞ g(xn ) n→∞ g̃(xn ) n→∞ g (ξn ) ξn −→ a
n→∞
ξ→a g ′ (ξ)
неважно, какая f ′ (x)
= буква стоит под = lim ′
знаком предела x→a g (x)
f (x) f ′ (x)
lim = lim ′ (5.2.93)
x→∞ g(x) x→∞ g (x)
§ 2. Приложения производной 337
⋄ 5.2.1. Вычислим предел ln cos x 0 применяем
lim = = теорему 5.2.1 =
x→0 x2 0
sin 2x
lim (ln cos x)′ 1
x→0 arctg 3x cos x · (− sin x)
= lim = lim =
x→0 (x2 )′ x→0 2x
Для этого можно воспользоваться теоремой
− sin x 0 снова
5.2.1: = lim = = применяем =
x→0 2x cos x 0 теорему 5.2.1
sin 2x 0 применяем (− sin x)′ − cos x
lim = = теорему 5.2.1 = = lim = lim =
x→0 arctg 3x 0 x→0 (2x cos x) ′ x→0 2 cos x − 2x sin x
(sin 2x)′ cos 2x · 2 cos 0 · 2 −1 1
= lim = lim 3 = 3 = = =−
x→0 (arctg 3x)′ x→0 2−0 2
1+9x2 1+0
1·2 2
= = ⋄ 5.2.4. Теперь пример, где применяется теоре-
3 3
ма 5.2.2:
⋄ 5.2.2. Правило Лопиталя можно применять
π
несколько раз подряд. Покажем это на следую- 2 − arctg x 0 применяем
lim = = теорему 5.2.2 =
щем примере: x→+∞ ln 1 + x12 0
1
1 − cos x 0 применяем
( π2 − arctg x)′ − 1+x 2
lim = = = lim ′ = lim =
теорему 5.2.1 = x→+∞ ln 1 + 1 1
· − x23
x→0 x2 0 x2
x→+∞
1+ x12
(1 − cos x)′ sin x 0 1 x2 + 1 x3 x
= lim = lim = = = lim · · = lim = +∞
x→0 (x2 )′ x→0 2x 0 x→+∞ 1 + x2 x2 2 x→+∞ 2
снова (sin x)′ cos x 1
= применяем = lim = lim =
теорему 5.2.1 x→0 (2x)′ x→0 ⊲⊲ 5.2.5. Вычислите пределы:
2 2
1. limx→1 sin 3πx
sin 2πx .
⋄ 5.2.3. Еще один пример, где правило Лопита- tg x−x
ля применяется несколько раз: 2. limx→0 sin x−x2 .
tg x−x
3. limx→0 sin x−x .
∞
Раскрытие неопределенностей типа ∞.
∞
Теорема 5.2.3 (правило Лопиталя для предела в точке с неопределенностью ∞ ). Пусть функции
f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы в некоторой окрестности точки a,
(ii) limx→a f (x) = ∞ и limx→a g(x) = ∞,
(iii) g ′ (x) 6= 0 в некоторой выколотой окрестности точки a,
f ′ (x)
(iv) существует предел limx→a g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→a g(x) , причем
f (x) f ′ (x)
lim = lim ′ (5.2.94)
x→a g(x) x→a g (x)
338 Глава 5. ПРОИЗВОДНАЯ
f ′ (x)
Доказательство. 1. Рассмотрим сначала случай, когда предел limx→a g′ (x) конечен:
f ′ (x)
lim =A∈R (5.2.95)
x→a g ′ (x)
Зафиксируем интервал (a − δ, a), на котором g ′ (x) 6= 0. В силу теоремы 5.2.7, функция g(x) должна
быть строго монотонна на (a − δ, a). Поэтому, если взять возрастающую последовательность
x1 < x2 < ... < xn < ... < a, xn −→ a
n→∞
Положив
yn = g(xn ), zn = f (xn )
мы теперь получим, что последовательности yn и zn удовлетворяют всем условиям теоремы Штоль-
ца 3.2.18: во первых,
yn −→ ∞, y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ...
n→∞
и во вторых,
f (x)
lim =A
x→a−0 g(x)
Аналогично получаем
f (x)
lim =A
x→a+0 g(x)
′
Тогда fg′ (x)
(x)
6= 0 в некоторой выколотой окрестности точки a. (Это следует, например, из определения
предела по Коши.) Значит, f ′ (x) 6= 0 в некоторой выколотой окрестности точки a. Таким образом,
получается:
1) f ′ (x) 6= 0 в некоторой выколотой окрестности точки a, и
g′ (x)
2) limx→a f ′ (x) =0
То есть выполняется посылка теоремы, но только с переставленными символами f и g, и с условием,
что предел отношения производных конечен. Поскольку для случая конечного предела теорема уже
доказана, имеем
g(x) g ′ (x)
lim = 0 = lim ′
x→a f (x) x→a f (x)
откуда
f (x) f ′ (x)
lim = ∞ = lim ′
x→a g(x) x→a g (x)
§ 2. Приложения производной 339
∞
Теорема 5.2.4 (правило Лопиталя для предела в бесконечности с неопределенностью ∞ ). Пусть
функции f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы на некотором множестве (−∞, −E) ∪ (E, +∞),
(ii) limx→∞ f (x) = ∞ и limx→∞ g(x) = ∞,
(iii) g ′ (x) 6= 0 при x ∈ (−∞, −E) ∪ (E, +∞),
f ′ (x)
(ii) существует предел limx→∞ g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→∞ g(x) , причем
f (x) f ′ (x)
lim = lim ′ (5.2.96)
x→∞ g(x) x→∞ g (x)
ln(x−a)
2. limx→a ln(ex −ea ) .
Для этого воспользуемся теоремой 5.2.4:
ex +x2 +x
3. limx→+∞ x3 −ex .
2 2
x· ln cos x ln cos x
⋄ 5.2.10 (неопределенность вида 0 · ∞). = elimx→0 cos sin2 x = elimx→0 cos x·limx→0 sin2 x =
ln cos x
0
применяем
ln x ∞ = e1·limx→0 sin2 x = e 0 = теорему 5.2.1 =
lim x · ln x = (0 · ∞) = lim 1 = =
x→+0 x→+0 ∞ limx→0 (ln cos x)′ − sin x
cos x
x
1
=e (sin2 x)′ = elimx→0 2 sin x cos x =
применяем (ln x)′ 1
= теорему 5.2.3 = lim 1 ′
= lim x1 = −1
= elimx→0 2 cos2 x = e
−1
2 = √
x→+0 ( ) x→+0 − 2
x x e
= − lim x = 0
x→+0
⋄ 5.2.14 (неопределенность вида ∞0 ).
⋄ 5.2.11 (неопределенность вида ∞ − ∞).
1 1
lim (ln x) x = ∞0 = lim eln(ln x) x =
1 x→+∞ x→+∞
lim − tg x = (∞ − ∞) = ln(ln x) ln(ln x) ∞
x→ π2 cos x = lim e =e x x limx→+∞
= e∞ =
x→+∞
1 − sin x 0 применяем x))′
= limπ = = теорему 5.2.1 = применяем limx→+∞ (ln(ln(x)′
x→ 2 cos x 0 = теорему 5.2.4 = e =
(1 − sin x)′ − cos x 1
x ln x 1
= limπ ′
= limπ =0 = elimx→+∞ 1 = elimx→+∞ x ln x = e0 = 1
x→ 2 (cos x) x→ 2 − sin x
x→+0
lim xx = 00 = lim eln(x ) = lim ex ln x =
x→+0 x→+0
ln x · ln(x − 1).
2. limx→1+0
1
3. limx→0 − ex1−1 .
x
= elimx→+0 x ln x = применяем 0
пример 3.1 = e = 1
√
4. limx→+∞ ( x− ln x).
x
5. limx→+0 ln x1 .
⋄ 5.2.13 (неопределенность вида 1∞ ). 1
6. limx→+∞ (ln 2x) ln x .
2
1
lim cos xctg
2
x
= (1∞ ) = lim e
ln cos xctg x
= 7. limx→0 1 + sin2 x tg2 x .
x→0 x→0 8. limx→1−0 (1 − x)ln x .
2 2
= lim ectg x ln cos x
= elimx→0 ctg x ln cos x 1
= 9. limx→+0 (ln(x + e)) x .
x→0
Доказательство. 1. Пусть выполняется (5.2.97). Тогда для любых x, y ∈ (a; b) таких что x < y
можно по теореме Лагранжа 5.1.7 подобрать точку ξ ∈ (x; y) такую, что
f (y) − f (x)
0 < f ′ (ξ) = ⇒ 0 < f (y) − f (x) ⇒ f (x) < f (y).
y−x
| {z }
<
2. Наоборот, если выполняется (5.2.98), то для любых x, y ∈ (a; b) таких что x < y можно по
§ 2. Приложения производной 341
f (y) − f (x)
0 > f ′ (ξ) = ⇒ 0 > f (y) − f (x) ⇒ f (x) > f (y).
y−x
| {z }
<
0
то, переходя при вычислении производной в точке x ∈ (a; b) к одностороннему пределу, мы получим:
0
>
z }| {
′ f (y) − f (x) f (y) − f (x)
f (x) = lim = lim >0
y→x y−x y→x+0 y−x
| {z }
<
Наоборот, если в любой точке x ∈ (a; b) производная неотрицательна, то для любых x, y ∈ (a; b)
таких, что x < y, подобрав по теореме Лагранжа 5.1.7 точку ξ ∈ (a; b) со свойством (5.1.33), мы
получим:
f (y) − f (x)
= f ′ (ξ) > 0 =⇒ f (y) − f (x) > 0 =⇒ f (x) 6 f (y)
y−x
| {z }
<
— либо, f ′ (x) < 0 всюду на (a, b), и в этом случае f убывает на (a, b):
∀x, y ∈ (a; b) x < y =⇒ f (x) > f (y) .
Лемма 5.2.8. В условиях теоремы 5.2.7 для любых трех точек x, y, z ∈ (a; b), связанных неравен-
ством
x < y < z,
выполняется следующее:
(a) условие f (x) < f (z) влечет за собой условие f (x) < f (y) < f (z):
(b) условие f (x) > f (z) влечет за собой условие f (x) > f (y) > f (z):
Если это не так, то либо f (y) лежит ниже этого интервала, то есть f (y) 6 f (x), либо, наоборот,
выше, то есть f (y) > f (z). Убедимся, что ни то, ни другое невозможно.
1. Предположим, что f (y) 6 f (x). Если f (y) = f (x), то по теореме Ролля 5.1.6 найдется точка
ξ ∈ (x; y) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) < f (x). Тогда, если обозначить C = f (x), то мы получим
и, по теореме Коши о промежуточном значении 3.3.6, на интервале (y; z) должна найтись такая
точка c ∈ (y; z), что
f (c) = C = f (x)
Теперь опять по теореме Ролля 5.1.6 должна существовать точка ξ ∈ (x; c) такая, что
f ′ (ξ) = 0,
и это снова противоречит условию (5.2.99). Мы получаем, что неравенство f (y) 6 f (x) невозможно.
2. Проверим, что будет, если f (y) > f (z). Если f (y) = f (z), то по теореме Ролля 5.1.6 найдется
точка ξ ∈ (y; z) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) > f (z). Тогда, если обозначить C = f (z), то мы получим
и, по теореме Коши о промежуточном значении 3.3.6, на интервале (x; y) должна найтись такая
точка c ∈ (x; y), что
f (c) = C = f (z)
Теперь опять по теореме Ролля 5.1.6 должна существовать точка ξ ∈ (c; z) такая, что
f ′ (ξ) = 0,
и это снова противоречит условию (5.2.99). Мы получаем, что неравенство f (y) > f (x) тоже невоз-
можно.
Лемма 5.2.9. В условиях теоремы 5.2.7 пусть α, β ∈ (a, b) – произвольные точки, связанные
неравенством
α < β,
Тогда:
§ 2. Приложения производной 343
(a) если f (α) < f (β), то функция f возрастает на интервале (α; β):
f (α) < f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) < f (y)
(b) если f (α) > f (β), то функция f убывает на интервале (α; β):
f (α) > f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) > f (y)
a<x<α<β<y<b (5.2.100)
то снова по лемме 5.2.9 функция f должна быть строго монотонной на интервале (x; y). При этом,
как мы уже поняли, f возрастает на меньшем интервале (α; β), значит, она возрастает и на большем
интервале (x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (5.2.100), мы
получаем, что f возрастает на всем интервале (a; b).
Далее получается цепочка:
⇓ теорема 5.2.6(a)
′
f (x) > 0, x ∈ (a; b)
344 Глава 5. ПРОИЗВОДНАЯ
⇓ (5.2.99)
2. Пусть наоборот, f (α) > f (β). Тогда по лемме 5.2.9(b), функция f убывает на интервале
(α; β). Если теперь выбрать какие-нибудь точки x, y так, чтобы выполнялось (5.2.100), то снова
по лемме 5.2.9 функция f должна быть строго монотонной на интервале (x; y). При этом, как мы
уже поняли, f убывает на меньшем интервале (α; β), значит, она убывает и на большем интервале
(x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (5.2.100), мы получаем, что
f убывает на всем интервале (a; b).
Далее получается цепочка:
f убывает на интервале (a; b)
⇓ теорема 5.2.6(b)
f ′ (x) 6 0, x ∈ (a; b)
⇓ (5.2.99)
• Точка x0 называется
– точкой строгого локального максимума функции f , если в некоторой окрестно-
сти (x0 − δ; x0 + δ) точки x0 выполняется неравенство
Теорема 5.2.10 (необходимое условие локального экстремума). Если функция f имеет в точке
x0 локальный экстремум и дифференцируема в этой точке, то
f ′ (x0 ) = 0
Доказательство. Пусть при переходе через точку x0 производная меняет знак с − на +. Тогда
по теореме 5.2.7, на интервале (x0 − δ; x0 ) функция f строго убывает, а на интервале (x0 ; x0 + δ)
функция f строго возрастает, значит x0 – точка локального минимума.
Аналогично рассматривается случай, когда при переходе через точку x0 производная меняет
знак с − на +.
§ 2. Приложения производной 345
Выпуклость и перегиб. Пусть функция f определена на интервале (a; b) и пусть a < α < β < b.
Проведем хорду через точки (α; f (α)) и (β; f (β)) на графике функции f :
(ii) для любых двух точек α 6= β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство
• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вниз на интервале (a, b).
Доказательство. 1. (i)⇒(ii). Пусть выполнено (i) и пусть a < α < β < b. Зафиксируем λ ∈ (0, 1).
Тогда, положив
x = λ · α + (1 − λ) · β
мы получим:
β−x β − λ · α − (1 − λ) · β −λ · α + λ · β λ · (β − α)
= = = = λ,
β−α β−α β−α β−α
x−α λ · α + (1 − λ) · β − α (1 − λ) · β − (1 − λ) · α (1 − λ) · (β − α)
= = = = 1 − λ,
β−α β−α β−α β−α
поэтому
f (β) · (x − α) + f (α) · (β − x)
f (λ · α + (1 − λ) · β) = f (x) < (5.2.101) < =
β−α
x−α β−x
= ·f (β) + ·f (α) = λ · f (α) + (1 − λ) · f (β).
β−α β−α
| {z } | {z }
1−λ λ
Это доказывает неравенство (5.2.102) для случая α < β. Если β < α, то по уже доказанному мы
получим
f (λ · β + (1 − λ) · α) < λ · f (β) + (1 − λ) · f (α), λ ∈ (0, 1).
346 Глава 5. ПРОИЗВОДНАЯ
β−x
λ=
β−α
мы получим:
β−x x−α
1−λ=1− = ,
β−α β−α
β−x x−α β ·α−x·α+x·β −α·β
λ · α + (1 − λ) · β = ·α+ ·β = = x,
β−α β−α β−α
поэтому
f (β) · (x − α) + f (α) · (β − x)
< f (x), a<α<x<β<b (5.2.103)
β−α
(ii) для любых двух точек α, β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство
• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вверх на интервале (a, b).
Заметим теперь, что (θ − η) > 0, (β − x) > 0, (x − α) > 0, (β − α) > 0. Значит, если f ′′ (x) < 0
при x ∈ (a; b), то, в частности, f ′′ (ξ) < 0, и поэтому
f (β) · (x − α) + f (α) · (β − x)
− f (x) < 0
β−α
(то есть функция f выпукла вверх на интервале (a; b)). Если же f ′′ (x) > 0 при x ∈ (a; b), то, в
частности, f ′′ (ξ) > 0, и поэтому
f (β) · (x − α) + f (α) · (β − x)
− f (x) < 0
β−α
• Точка x0 называется точкой перегиба функции f , если при переходе через x0 выпуклость
вверх меняется на выпуклость вниз (или наоборот). Иными словами, имеется некоторая
окрестность (x0 − δ; x0 + δ) такая, что на интервале (x0 − δ; x0 ) функция f выпукла вверх,
а на интервале (x0 ; x0 + δ) она выпукла вниз (или наоборот, на (x0 − δ; x0 ) функция f
выпукла вниз, а на интервале (x0 ; x0 + δ) она выпукла вверх).
Доказательство. Предположим, что f ′′ (x0 ) 6= 0, тогда либо f ′′ (x0 ) < 0, либо f ′′ (x0 ) > 0. Если
f ′′ (x0 ) < 0, то, по теореме о сохранении знака 3.3.4, f ′′ (x) < 0 для всех x из некоторой окрестности
(x0 − δ; x0 + δ) точки x0 . Поэтому по теореме 5.2.14 этой главы, f будет выпукла вверх всюду в
окрестности (x0 −δ; x0 +δ), и значит x0 не может быть точкой перегиба. Аналогично, если f ′′ (x0 ) > 0,
то по теореме о сохранении знака 3.3.4, f ′′ (x) > 0 для всех x из некоторой окрестности (x0 − δ; x0 +
δ) точки x0 . Поэтому по теореме 5.2.14 этой главы, f будет выпукла вверх всюду в окрестности
(x0 − δ; x0 + δ), и опять x0 не может быть точкой перегиба.
Теорема 5.2.16. Если функция f выпукла (вниз или вверх) на интервале (a, b), то она непрерывна
на (a, b).
Доказательство. Будем считать, что f выпукла вниз. Зафиксируем точку x ∈ (a, b) и число h > 0
так, чтобы
a < x − h < x < x + h < b.
Покажем, что если
λn ∈ (0, 1) & λn −→ 0 (5.2.105)
n→∞
348 Глава 5. ПРОИЗВОДНАЯ
то
f (x − λn · h) −→ f (x) & f (x + λn · h) −→ f (x). (5.2.106)
n→∞ n→∞
xn −→ x
n→∞
следует
f (xn ) −→ f (x).
n→∞
тоже верно для почти всех n ∈ N. Это следует из того, что в цепочке
f (x + λn · h) = f (1 − λn ) · x + λn · (x + h) < (5.2.102) < (1 − λn ) · f (x) + λn · f (x + h) < f (x) + ε
↓ ↓
0 0
(5.2.108)
f (x) + ε
⇓
2f (x) < f (x − λn · h) + f (x) + ε
⇓
f (x) < f (x − λn · h) + ε
⇓
f (x) − ε < f (x − λn · h)
⇓ (5.2.107)
f (x) − ε < f (x − λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому
f (x − λn · h) −→ f (x).
n→∞
(5.2.107)
f (x) + ε
§ 2. Приложения производной 349
⇓
2f (x) < f (x) + ε + f (x + λn · h)
⇓
f (x) < ε + f (x + λn · h)
⇓
f (x) − ε < f (x + λn · h)
⇓ (5.2.108)
f (x) − ε < f (x + λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому
f (x + λn · h) −→ f (x).
n→∞
Мы доказали (5.2.106).
⋄ 5.2.16. Выпуклая функция не обязана быть и [0, +∞), а потом нужно заметить, что хорда,
дифференцируемой. Например, функция соединяющая точки с аргументами, лежащими
справа и слева от нуля, α < 0 < β, будет лежать
f (x) = e|x|
выше двух хорд, соединяющих аргумент α с ар-
не дифференцируема в точке 0, но выпукла вниз. гументом 0, и 0 с β. И поэтому эта хорда будет
Это доказывается сначала для участков (−∞, 0] выше графика f на участке (α, β).
Тогда прямая
x = x0
называется вертикальной асимптотой функции f .
• Пусть функция f обладает следующим свойством:
lim (f (x) − (k · x + b)) = 0 или lim (f (x) − (k · x + b)) = 0
x→+∞ x→−∞
Тогда прямая
y =k·x+b
называется наклонной асимптотой функции f (при x → +∞ или x → −∞).
и !
b = lim (f (x) − k · x) или b = lim (f (x) − k · x) (5.2.110)
x→+∞ x→−∞
350 Глава 5. ПРОИЗВОДНАЯ
Доказательство. Если
lim (f (x) − (k · x + b)) = 0
x→+∞
то
f (x) = (k · x + b) + α(x) где α(x) −→ 0
x→+∞
поэтому
f (x) b α(x)
lim = lim k+ + =k
x→+∞ x x→+∞ x x
и, кроме того,
lim (f (x) − k · x) = lim (b + α(x)) = b
x→+∞ x→+∞
Объясним эту схему на примерах. Из этих равенств следует, что прямая x = 1 явля-
ется вертикальной асимптотой нашей функции.
График стандартной функции без симмет- 3. Вычисляем пределы в бесконечности:
рий.
x2 + 1 x + x1
⋄ 5.2.19. Построим график следующей функ- lim f (x) = lim = lim =
x→+∞ x→+∞ x − 1 x→+∞ 1 − 1
x
ции: !
1
x2 + 1 +∞ + +∞
f (x) = = 1 = +∞
x−1 1 − +∞
1. Сначала находим область определения.
Она определяется неравенством x − 1 6= 0, и по-
x2 + 1 x + x1
этому имеет вид (−∞; 1) ∪ (1; +∞). Точка x = 1 lim f (x) = lim = lim =
x→−∞ x→−∞ x − 1 x→−∞ 1 − 1
является особой точкой функции f . x
!
2. Затем находим пределы функции в особых −∞ + −∞ 1
точках: = 1 = −∞
1 − −∞
x2 + 1 12 + 1
lim f (x) = lim = = Ищем наклонные асимптоты по формулам
x→1−0 x→1−0 x − 1 1−0−1
(5.2.109) и (5.2.110):
2
= = −∞
−0 f (x) x2 + 1
k+ = lim = lim 2 =
x→+∞ x x→+∞ x − x
1 + x12
x2 + 1 12 + 1 = lim =1
lim f (x) = lim = = x→+∞ 1 − 1
x→1+0 x→1+0 x − 1 1+0−1 x
2
= = +∞
+0 b+ = lim [f (x) − k+ · x] =
x→+∞
10 Более точное определение: особой точкой функции f называется любая граничная точка области определения
функции f , то есть такая точка a, в любой окрестности которой (a−ε, a+ε) содержатся точки, в которых f определена
и точки, в которых f не определена.
§ 2. Приложения производной 351
x2 + 1 Рисуем картинку, изображающую интервалы
= lim −1·x =
x→+∞ x − 1 знакопостоянства второй производной, а значит,
x2 + 1 − x(x − 1) интервалы выпуклости вверх и вниз функции f :
= lim =
x→+∞ x−1
x2 + 1 − x2 + x 1+x
= lim = lim =
x→+∞ x−1 x→+∞ x − 1
1
+1
= lim x 1 = 1
x→+∞ 1 −
x
p
3
lim f (x) = lim x3 − 3x =
x→−∞ x→−∞
r
3 3
= lim x · 1− = (−∞ · 1) = −∞
x→−∞ x2
5. Находим вторую производную: Ищем наклонные асимптоты по формулам
′ (5.2.109) и (5.2.110):
x2 − 2x − 1
f ′′ (x) = = √
3
(x − 1)2 f (x) x3 − 3x
k+ = lim = lim =
(x2 − 2x − 1)′ · (x − 1)2 − ((x − 1)2 )′ · (x2 − 2x − 1) x→+∞ x x→+∞ x
= = r
(x − 1)4
3 3
2
(2x − 2) · (x − 1) − 2(x − 1) · (x − 2x − 1) 2 = lim 1− =1
= = x→+∞ x2
(x − 1)4
4
= b+ = lim [f (x) − k+ · x] =
(x − 1)3 x→+∞
hp i
3
Решаем уравнение f ′′ (x) = 0: = lim x3 − 3x − 1 · x =
x→+∞
q q q
4 3 3
x − 3x − x ·
3
(x3 − 3x)2 + x ·
3 3
x − 3x + x2
f ′′ (x) = 0 ⇔ =0 ⇔ x∈∅ = lim q q =
(x − 1)3 x→+∞ 3
(x3 − 3x)2 + x ·
3 3
x − 3x + x2
352 Глава 5. ПРОИЗВОДНАЯ
p
3
(x3 − 3x)3 − x3 ⊲⊲ 5.2.21. Постройте графики следующих функ-
= lim p √ =
x→+∞ 3 (x3 − 3x)2 + x · 3 x3 − 3x + x2 ций:
−3x √
= lim p √ = 1. y = 3
x2 − x3 .
x→+∞ 3
(x − 3x) + x · 3 x3 − 3x + x2
3 2
x2
−3 2. y = x−1 .
= lim q √ = q
x→+∞ 3
(1 − x32 ) · (x3 − 3x) + 3 x3 − 3x + x 3. y = 5 x6
x−a .
−3 x3
= lim q q =0 4. y = 4(x−2)2 .
x→+∞
x · 3 (1 − 3 2
1− 3 p
x2 ) + +1
3
x2 5. y = x 3 (x + 1)2 .
q
Значит, прямая y = x является асимптотой при 3 −2x2
6. y = x x−3 .
x → +∞. Аналогично получаем, что k− = 1 и
x2 −4 5
b− = 0, и поэтому та же прямая y = x является 7. y = x · e− 3x .
асимптотой при x → −∞. 8. y = x + 3x2 − 9x − 3.
3
4. Находим производную: √
9. y = x + x2 − 1.
p ′ (x3 − 3x)′
f ′ (x) =
3
x3 − 3x = √ 2 =
3 3 x3 − 3x
3x2 − 3 x2 − 1
= √ 2 = 2
3 3 x3 − 3x (x3 − 3x) 3
Решаем уравнение f ′ (x) = 0: Четные и нечетные функции. Построение
графика упрощается, если функция обладает
x2 − 1 какими-то симметриями (то есть в каком-нибудь
f ′ (x) = 0 ⇔ 2 =0 ⇔ смысле инвариантна относительно некоторых
(x3 − 3x) 3
( преобразований прямой). Мы расмотрим три из
x2 − 1 = 0 них: четность, нечетность и периодичность.
⇔ ⇔ x ∈ {−1; 1}
x3 − 3x 6= 0
Напомним, что четные и нечетные функции
Рисуем картинку, изображающую интервалы мы определили на с.192 как удовлетворяющие
знакопостоянства производной, а значит, интер- тождествам
валы монотонности функции f :
f (x) = x2 · ln |x|
f (x)
k+ = lim = lim x · ln |x| =
x→+∞ x x→+∞
= lim x · ln x = ∞
x→+∞
f (x) = 2x − arcsin x
1
f ′ (x) = (x2 · ln |x|)′ = 2x · ln |x| + x2 · =
x
= x · (2 ln |x| + 1) 1. Область определения: [−1; 1]. Точки x = −1
и x = 1 являются особыми. Функция являет-
ся нечетной, поэтому нам достаточно построить
При x > 0 получаем f ′ (x) = 0 ⇔ 2 ln x + 1 = график только на отрезке x ∈ [0; 1].
1
0 ⇔ ln x = − 21 ⇔ x = e− 2 . Интервалы знакопо-
стоянства производной: 2. Предел в особой точке конечный
π
lim (2x − arcsin x) = 2 − arcsin 1 = 2 − ,
x→1−0 2
′ 1
′′ 2 f ′ (x) = (2x − arcsin x)′ = 2 − √
f (x) = x·(2 ln |x|+1) = (2 ln |x|+1)+x· = 1 − x2
x
= 2 ln |x| + 2 = 2(ln |x| + 1) 1
При x > 0 получаем f ′ (x) = 0 ⇔ 2 − √1−x 2 =
1
√ 1 2 1
2
При x > 0 получаем f ′′ (x) = 0 ⇔ ln x + 1 = 0 ⇔ 0 ⇔ 2 = 1−x2 √⇔ 1 − x = 2 ⇔ 1 − x = 4 ⇔
√
−1 2 3
ln x = −1 ⇔ x = e . Интервалы знакопостоян- x = 4 ⇔ x = 23 . Интервалы знакопостоянства
354 Глава 5. ПРОИЗВОДНАЯ
5. Вторая производная:
2
f ′′ (x) = 0 ⇔ x +2
1. y = 2x 2 +1 .
p p
⇔ 3(cos x + sin x)[3 sin x cos x − 1] = 0 ⇔ 2. y = (x + 1)2 − 3 (x − 1)2 .
3
cos x = − sin x
cos x = − sin x
5. y = x−8x
2 +4 .
⇔ 3 ⇔ 2 ⇔ 6. y = arctg(sin x).
sin 2x = 1 sin 2x = 2
2
3 7. y = √xx2 +2 .
3π 7π
x∈ ; 8. y = x ln |x|.
4 4
⇔ 2x = arcsin + 2πn
2
⇔ 9. y = ln(sin x + cos x).
2
3
10. y = √x4x+1 2 −3
.
2
2x = π − arcsin + 2πn
3
11. y = 2x − arctg x.
1
3π 7π 12. y = sin x−cos x.
x∈ ;
4 4
1 2
⇔ x = arcsin + πn ⇔
Экстремум функции одной переменной.
2 3
π 1 2
x= − arcsin + πn ⋄ 5.2.26. Найти наибольшее и наименьшее зна-
2 2 3
оставляем только
чение функции
⇔ те значения x, которые ⇔
лежат в отрезке [0; 2π] f (x) = x3 − 6x2 + 9x + 1
n1 2 π 1 2 3π
⇔x∈ arcsin ; − arcsin ; ; на следующих множествах:
2 3 2 2 3 4
1 2 3π 1 2 7π o 1) на отрезке [0, 2],
π + arcsin ; − arcsin ;
2 3 2 2 3 4 2) на полуинтервале [−2, −1).
Интервалы знакопостоянства второй произ- Решение. Найдем производную:
водной:
f ′ (x) = 3x2 − 12x + 9 = 3(x − 1)(x − 3).
а
max f (x)
⊲⊲ 5.2.25. Постройте графики следующих функ- x∈[−2,−1)
ций: не существует.
356 Глава 5. ПРОИЗВОДНАЯ
⋄ 5.2.27. Найти максимальный объем цилиндра, ⊲ 5.2.29. Найдите отношение катетов прямо-
вписанного в данный конус. угольного треугольника, у которого площадь
Решение. Обозначим буквами R и H радиус и максимальна среди всех прямоугольных тре-
высоту конуса, а буквами x и h радиус и высоту угольников, у которых сумма длин гипотенузы
вписанного цилиндра. Тогда и одного из катетов равна фиксированной вели-
чине c.
H −h H
= ,
x R ⊲ 5.2.30. Сечение тоннеля имеет форму пря-
поэтому моугольника, завершенного полукругом. Опре-
xH делить радиус полукруга, при котором площадь
H −h=
R сечения будет наибольшей, если периметр сече-
и ния равен p.
xH H
h=H− = (R − x),
R R ⊲ 5.2.31. Лист картона имеет форму прямо-
а объем цилиндра получается угольника со сторонами a и b. Вырезая по углам
этого прямоугольника квадраты и сгибая высту-
πH
V (x) = · (Rx2 − x3 ). пающие части крестообразной фигуры, получим
R открытую сверху коробку, высота которой рав-
Дифференцируея по x, мы получаем: ная стороне квадрата. Какой должна быть сто-
рона квадрата, чтобы объем коробки был наи-
πH большим?
V ′ (x) = · (2Rx − 3x2 ) = 0 ⇐⇒
R
2R ⊲ 5.2.32. Найти наибольший объем цилиндра,
⇐⇒ x ∈ 0, . периметр осевого сечения которого равен a.
3
⊲ 5.2.33. Среди всех равнобедренных треуголь-
Здесь видно, что x = 2R 3 – точка максимума для ников, вписанных в данный круг, найти тре-
V:
угольник с наибольшим периметром.
2R
max V (x) = V = ⊲ 5.2.34. Определить размеры закрытой короб-
x∈[0,R] 3 ки объема v с квадратным основанием, на изго-
2 3 !
πH 2R 2R товление которой расходуется наименьшее коли-
= · R − = чество материала.
R 3 3
3
πH 4R 8R3 ⊲ 5.2.35. Среди всех прямоугольников данной
= · − =
R 9 27 площади S найти прямоугольник: 1) с наимень-
шим периметром, 2) с наименьшей диагональю.
πH 12R3 8R3 4
= · − = · πHR2
R 27 27 27 ⊲ 5.2.36. Найти наибольшую площадь прямо-
⋄ 5.2.28. Среди всех прямоугольников с дан- угольника, вписанного в круг радиуса R.
ным периметром P найти прямоугольник с мак- ⊲ 5.2.37. Найти длину боковой стороны трапе-
симальной площадью. ции, имеющей наименьший периметр среди всех
Пусть x – одна из сторон прямоугольника. То- равнобедренных трапеций с заданной площадью
гда другая сторона будет y = P2 − x, а площадь S и углом α между боковой стороной и нижним
Px основанием.
S = x·y = − x2 .
2 ⊲ 5.2.38. Вычислить наибольшую площадь тра-
Дифференцируя по x мы получим: пеции, вписанной в полукруг радиуса R, у кото-
рой нижним основанием служит диаметр полу-
P P круга.
S ′ (x) = − 2x = 0 ⇐⇒ x= .
2 4
⊲ 5.2.39. Из трех досок одинаковой ширины
При этом
нужно сколотить желоб. При какой угле накло-
– S ′ (x) > 0 при x ∈ 0, P4 , то есть на интервале на боковых стенок площадб поперечного сечения
0, P4 функция S возрастает, желоба будет наибольшей?
′ P P
– S (x) < 0 при x ∈ 4 , 2 , то есть на интерва- ⊲ 5.2.40. Консервная банка имеет цилиндриче-
ле P4 , P2 функция S убывает. скую форму. Найти наиболее выгодное отноше-
Поэтому ние ее размеров (то есть отношение диаметра к
высоте, при котором ее объем станосится наи-
P P2 большим при заданной полной площади поверх-
max S(x) = S = .
x∈(0, P2 ) 4 16 ности).
§ 2. Приложения производной 357
⊲ 5.2.41. Найти наибольшую полную поверх- Каким должен быть угол сектора, чтобы ворон-
ность цилиндра, вписанного в шар радиуса R. ка имела наибольший объем?
⊲ 5.2.42. Из кругового листа жести вырезают ⊲ 5.2.43. Найти наименьшую боковую поверх-
сектор и свертывают его в коническую воронку. ность конуса, имеющего объем V .
Глава 6
АСИМПТОТИЧЕСКИЕ МЕТОДЫ
Поведение функции при аргументе, стремящемся к некоторой величине, является предметом изуче-
ния специального раздела математического анализа, называемого асимптотическими методами.
По идеологии этой науки, свойство функции f иметь (или не иметь) предел при x → a – только
самое первое, поверхностное наблюдение, за которым скрывается гораздо более сложная картина,
которую если подходящим образом формализовать, то получаешь удивительно мощный инструмент
для решения самых разных задач, в том числе для вычисления самих пределов.
Чтобы было понятно, о чем идет речь, вспом- g(0) = earctg 0 − 1 − arctg(e0 − 1) = 0.
ним снова, как мы вычисляли пределы. После
Это значит, что можно применить правило Ло-
всех усилий, что мы потратили на изучение это-
питаля. Первые производные будут такие:
го вопроса в (c)(c) главы 4, а затем в § 2 главы 5,
для читателя может быть неожиданностью, что cos x cos ln(1 + x)
встречаются все же пределы, нахождение кото- f ′ (x) = − ,
1 + sin x 1+x
рых известными нам сейчас методами оказыва-
ется затруднительным или даже невозможным. earctg x ex
g ′ (x) = 2 − .
x +1 (1 − ex )2 + 1
⋄ 6.0.1. В качестве упражнения можно попро-
бовать найти следующий, простой на первый При подстановке x = 0 мы опять получаем нули:
взгляд, предел: cos 0 cos ln(1 + 0)
f ′ (0) = − = 0,
ln(1 + sin x) − sin ln(1 + x) 1 + sin 0 1+0
lim (6.0.1)
x→0 earctg x − 1 − arctg(ex − 1) earctg 0 e0
g ′ (0) = 2 − = 0.
Здесь, если пользоваться правилом Лопиталя, 0 +1 (1 − e0 )2 + 1
то его придется применять 4 раза, причем воз- И опять нужно дифференцировать. Вторые
никающие при дифференцировании выражения производные будут выглядеть так:
столь громоздки, что у обыкновенного человека
терпение истощается уже после первых двух ша- sin x sin ln(1 + x)
f ′′ (x) = − + −
гов. 1 + sin x (1 + x)2
Вот как выглядят эти вычисления, если по- cos2 x cos ln(1 + x)
следовательно находить производную от числи- − + ,
(1 + sin x)2 (1 + x)2
теля
358
359
2earctg 0 earctg 0 = −8 + 1 − 1 + 12 = 4.
g ′′′ (0) = − + +
(02 + 1)2 (02 + 1)3 И мы наконец получаем ответ
0 · earctg 0 0 · earctg 0
+ 2 − − ln(1 + sin x) − sin ln(1 + x)
(0 + 1)3 (02 + 1)3 lim =
8e0 · (1 − e0 )2 6e0 · (1 − e0 ) x→0 earctg x − 1 − arctg(ex − 1)
− − − f ′′′′ (x) f ′′′′ (0) −2 1
((1 − e0 )2 + 1)3 ((1 − e0 )2 + 1)2 = lim ′′′′ = ′′′′ = =− .
x→0 g (x) g (0) 4 2
e0 2e0
− + = 0.
(1 − e0 )2 + 1 ((1 − e0 )2 + 1)2 Когда решение известно и выписано на бума-
ге, трудности блёкнут. Они не кажутся такими
Затем в четвертый раз: серьезными как в момент, когда не знаешь ни от-
вета, ни способа, которым его можно получить.
3 sin2 x sin x Поэтому приведенные нами в примере 6.0.1 вы-
f ′′′′ (x) = − 2
+ +
(1 + sin x) 1 + sin x кладки могут не впечатлить читателя. Но даже
10 sin ln(1 + x) 6 cos4 x если встать на точку зрения радикального сто-
+ 4
− + ронника компьютерных методов и считать, что
(1 + x) (1 + sin x)4
вычисление производной совсем не составляет
4 cos2 x 12 sin x cos2 x
+ 2
− . труда, проблема остается в том, что непонятно,
(1 + sin x) (1 + sin x)3 сколько раз нужно применять правило Лопита-
ля. Дело ведь в том, что нет гарантии даже,
что этот процесс вообще когда-то приведет к
8earctg x 24x · earctg x
g ′′′′ (x) = − + + удобоваримому результату.
(x2 + 1)3 (x2 + 1)3
earctg x 44x2 · earctg x ⋄ 6.0.2. В качестве иллюстрации, можно рас-
+ 2 + − смотреть следующий пример:
(x + 1)4 (x2 + 1)4
1
12x · earctg x 48x3 · earctg x sin(2− x2 )
− − − lim 1 . (6.0.2)
(x2 + 1)4 (x2 + 1)4 x→0 2− sin2 x
360 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
1
Здесь применение правила Лопиталя превраща- sin(2− x2 ) 0 f ′ (x)
ется в бесконечный процесс (со все более слож- lim − sin12 x
= = lim ′ =
x→0 2 0 x→0 g (x)
ными вычислениями на каждом следующем ша-
0 f (n) (x) 0
ге), потому что числитель = = ... = lim (n) = =?
0 x→0 g (x) 0
1
f (x) = sin(2− x2 ) Эти примеры означают, что алгоритмы, ис-
пользуемые для вычисления пределов (в част-
и знаменатель
ности, в современных компьютерах), не могут
g(x) = 2 − sin12 x сводиться к применению одного только прави-
ла Лопиталя и должны использовать какие-то
стремятся к нулю при x → 0 вместе со всеми другие методы. И если ставить целью объясне-
своими производными. Сколько раз ни применяй ние интересующимся (в том числе, разработчи-
правило Лопиталя, ты получишь здесь неопреде- кам этих алгоритмов) сути этих методов, то огра-
ленность: ничиться тем, что уже сказано на эту тему, ко-
нечно, нельзя.
и
θ(x) −→ 1.
x→a
В частном случае, когда f2 (x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание о θ: тогда запись (6.1.3) просто эквивалентна условию
f1 (x)
−→ 1 (6.1.4)
f2 (x) x→a
a = +∞, то выколотой окрестностью a считается всякое множество (E, +∞), где E > 0. Если же a = −∞, то
выколотой окрестностью a считается всякое множество (−∞, −E), где E > 0.
§ 1. Асимптотические отношения и формулы 361
и
f1 (x) 6= 0, x ∈ U̇ε (a) ⇐⇒ f2 (x) 6= 0, x ∈ U̇δ (a).
◦
2 . Рефлексивность: всегда
f1 (x) ∼ f1 (x)
x→a
◦
3 . Симметричность:
f1 (x) ∼ f2 (x) =⇒ f2 (x) ∼ f1 (x)
x→a x→a
4◦ . Транзитивность:
5◦ . Мультипликативность:
f1 (x) f2 (x)
f1 (x) ∼ f2 (x) & g1 (x) ∼ g2 (x) =⇒ f1 (x)·g1 (x) ∼ f2 (x)·g2 (x) & ∼
x→a x→a x→a g1 (x) x→a g2 (x)
f1 (x) f2 (x)
lim = lim lim f1 (x) · g1 (x) = lim f2 (x) · g2 (x)
x→a g1 (x) x→a g2 (x) x→a x→a
и
g1 (x) = τ (x) · g2 (x), τ (x) −→ 1
x→a
Запомним их, и поглядим, что можно сказать о пределах, о которых говорит теорема:
f1 (x) θ(x) · f2 (x) θ(x) f2 (x) θ(x) f2 (x) f2 (x)
lim = lim = lim · = lim · lim = lim
x→a g1 (x) x→a τ (x) · g2 (x) x→a τ (x) g2 (x) x→a τ (x) x→a g2 (x) x→a g2 (x)
| {z }
k
1
x x2
2 1 1
= lim = = lim 2 =
x→0 x · ln 2 2 ln 2 x→0 x2 2
Доказательство. Условие f1 (x) ∼ f2 (x) означает, что существуют функция θ, такая что
x→a
Положим
τ (t) = θ(ξ(t)).
Тогда, во-первых,
f1 (ξ(t)) = θ(ξ(t)) · f2 (ξ(t)) = τ (t) · f2 (ξ(t)),
И, во-вторых,
применяем теорему 3.4.9
о замене переменной
lim τ (t) = lim θ(ξ(t)) = под знаком предела: = lim θ(x) = 1.
t→c t→c x→a
x = ξ(t) −→ a
t→c
ξ(t) 6= a при t 6= c
То есть f1 (ξ(t)) ∼ f2 (ξ(t)).
t→c
или так
f (x) = o g(x)
x→a
и
α(x) −→ 0.
x→a
В частном случае, когда g(x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание об α: тогда запись (6.1.15) просто эквивалентна условию
f (x)
−→ 0
g(x) x→a
x2 ≪ x x ≪ x2
x→0 x→∞
x2 = o (x) x= o (x2 )
x→0 x→∞
x2 x 1
Действительно, x = x −→ 0. Действительно, x2 = −→
x x→∞ 0.
x→0
1◦ . Если f (x) ≪ g(x), то неравенство нулю в выколотой окрестности a для первой функ-
x→a
ции влечет за собой то же для второй функции (с той же окрестностью):
2◦ Транзитивность:
3◦ Связь с эквивалентностью:
λxλ−1 если λ − 1 > 0, то еще раз
применяем правило Лопиталя
= lim x = применяем правило Лопиталя = = до тех пор, пока в числителе = ... =
x→+∞ a ln a не получится xλ−n , где λ − n < 0
λ · (λ − 1) · xλ−2 λ · (λ − 1) · (λ − 2) · ... · (λ − n + 1) · xλ−n
= lim = = lim
ax (ln a)n
=
x→+∞ ax (ln a)2 x→+∞
поскольку λ − n < 0, 0
если λ − 2 > 0, то еще раз
= применяем правило Лопиталя =
= xλ−n −→ 0 = =0
x→+∞ ∞
λ · (λ − 1) · (λ − 2) · xλ−3
= lim = ... =
x→+∞ ax (ln a)3
причем при x → a функция A0 (x) бесконечно велика по сравнению с любой другой функцией из
этого списка:
A1 (x) ≪ A0 (x), A2 (x) ≪ A0 (x), ..., An (x) ≪ A0 (x) (6.1.17)
x→a x→a x→a
A1 (x) = α1 (x) · A0 (x), A2 (x) = α2 (x) · A0 (x), ... An (x) = αn (x) · A0 (x),
где
α1 (x) −→ 0, α2 (x) −→ 0, ... αn (x) −→ 0
x→a x→a x→a
Поэтому
A0 (x) + A1 (x) + ... + An (x) = A0 (x) + α1 (x) · A0 (x) + ... + αn (x) · A0 (x) =
= 1 + α1 (x) + ... + αn (x) ·A0 (x) = β(x) · A0 (x),
| {z }
обозначим это θ(x)
где
θ(x) = 1 + α1 (x) + ... + αn (x) −→ 1 + 0 + ... + 0 = 1.
x→a
причем известно, что A0 (x) является главным слагаемым в сумме A0 (x)+ A1 (x)+ A2 (x)+ ...+ An (x),
а B0 (x) является главным слагаемым в сумме B0 (x) + B1 (x) + B2 (x) + ... + Bn (x):
Тогда
A0 (x) + A1 (x) + A2 (x) + ... + An (x) ∼ A0 (x)
x→a
366 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
Рассмотрим примеры.
⋄ 6.1.12. Здесь используется теорема 6.1.3 (о ⋄ 6.1.15. Здесь дробь та же, что и в предыду-
сравнении степенных функций): поскольку x → щем примере, но, поскольку x → −∞, главными
∞, главными слагаемыми будут максимальные слагаемыми, по той же теореме 6.1.4, будут на-
степени у x: оборот, степени с наименьшим основанием:
√
5x + 3 x − 2x5 1
lim √ = 2x−1 − 3x+1 · 2x − 3 · 3x
x→∞ x − 3x4 + 8 x lim x+1 x−1
= lim 2 x 1 x =
.
/ .
/
√ x→−∞ 2 +3 x→−∞ 2 · 2 +
3 ·3
5x + 3 x − 2x5 .
/
−2x5 1 x x
= lim . / .
/ 2 ·2 −3·3
1
√ = lim
x→∞ −3x4
= · 2x 1
x→∞
x − 3x4 + 8 x = lim .
/ = lim 2 x =
x→−∞ x 1 x x→−∞ 2 · 2 4
2·2 + 3 ·3
−2x
= lim =∞
x→∞ −3 ⋄ 6.1.16. В следующем примере мы сначала вы-
⋄ 6.1.13. Здесь дробь та же, что и в предыдущем деляем главное слагаемое, а затем применяем
примере, но, поскольку x → 0, главными слага- теорему 6.1.2 об эквивалентной замене:
емыми, по той же теореме 6.1.3, будут наоборот,
§ 1. Асимптотические отношения и формулы 367
.
/ √
3
√
2 10 x+ x
2
5x + 3x 10 5x + 3x 4. limx→+∞ √
5
sin x+ x2
lim 5 = lim /
. = √
x→0 2x + 7 sin x2 x→0 5. x+ x
limx→0 ex −1
2x5 + 7 sin x2
√
5x2 5x2 5 6. limx→+∞ x+ x
ex −1
= lim 2
= sin x2 ∼ x2 = lim 2 = x x
x→0 7 sin x x→0 x→0 7x 7 7. limx→0 2x2 +3
+x3
⊲⊲ 6.1.17. x
+3x
8. limx→+∞ x2 2 +x 3
2x +x5
1. limx→0 x2 +5x 2x +3x
9. limx→−∞ x2 +x3
2x +x5
2. limx→+∞ x2 +5x x+sin x
√ √ 10. limx→+∞ x+cos x
3
x+ x
3. limx→0 √
5
sin x+ x2
Тогда
(i) модули этих функций тоже эквивалентны:
|f1 (x)| ∼ |f2 (x)|
x→a
Доказательство.
1. f1 (x) ∼ f2 (x) ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1 ⇒
x→a x→a
⇒ |f1 (x)| = |θ(x)| · |f2 (x)| , |θ(x)| −→ 1 ⇒
x→a
⇒ |f1 (x)| ∼ |f2 (x)|
x→a
2. f1 (x) ∼ f2 (x) ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1 ⇒
x→a x→a
α α α α
⇒ f1 (x) = θ(x) · f2 (x) , θ(x) −→ 1 ⇒
x→a
⇒ f1 (x)α ∼ f2 (x)α
x→a
( (
+∞ +∞
3. f1 (x) ∼ f2 (x) −→ ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1, f2 (x) −→ ⇒
x→a x→a +0 x→a x→a +0
✯0
✟
loga θ(x)
⇒ loga f1 (x) = loga θ(x) + loga f2 (x) = + 1 · loga f2 (x) ⇒
loga f2 (x)
❥∞
❍
| {z }
↓
1
Из этой теоремы следует, что при вычислении пределов с модулями, степенями или логариф-
мами также можно выделять главные слагаемые, но нужно только следить, чтобы аргументы у
логарифмов стремились к +∞ или к +0. Например,
α
(A0 (x) + A1 (x) + A2 (x) + ... + An (x))
lim =
x→a ln (B0 (x) + B1 (x) + B2 (x) + ... + Bn (x))
.
/ /
. .
/ α
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A (x)α
= lim .
/ .
/ / = lim 0
.
x→a x→a ln B0 (x)
ln B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)
.
/
⋄ 6.1.18. 2 ln(x2
+ x)
ln(x + x)
√ lim 5 3
= lim .
/ =
| 3 x + 3x − 2x2 | x→+0 ln(x + x ) x→+0
lim√ = ln(x5 + x3 )
x→+∞ x + x2 + x4 ln x ln x 1
√./ .
/
= lim = lim =
| 3 x + 3x − 2x2 | x→+0 ln x 3 x→+0 3 ln x 3
= lim r. / .
/ =
x→+∞
x +x 2 +x4 ⋄ 6.1.22.
| − 2x2 | 2x2 3 ln x + x − 2
= lim √ = lim =2 lim =
x→+∞ x2
x→+∞ ln |5 + x3 − e2x |
x→+∞ x4 .
/ .
/
⋄ 6.1.19. 3 ln x + x − 2
= lim .
/ .
/ =
√ x→+∞
ln 5 + x3 − e2x
| 3 x + 3x − 2x2 |
lim √ =
x→0 x + x2 + x4 x x 1
√ .
/ .
/ = lim = lim =
x→+∞ ln |−e2x | x→+∞ 2x 2
| 3 x + 3x − 2x2 |
= lim r .
/ .
/ = ⊲⊲ 6.1.23. Вычислите пределы, обращая внима-
x→0
x+x +x2 4
ние на значение, к которому стремится аргумент
√ x: √
| 3 x| 1 ln|x−2 ln x−3 x|
= lim √ = lim x− 6 = ∞ 1. limx→+∞ √ √
x→0 x x→0 3
ln x+2x x−x2
√
ln|x−2 ln x−3 x|
⋄ 6.1.20. 2. limx→0 √3 √
ln x+2x x−x2
.
/ √ √
ln(1+ x+ 3 x)
2 ln(x2
+ x) 3. limx→+∞ ln 1+ √ √
ln(x + x) ( 3 x+ 4 x)
lim 5 3
= lim .
/ = √
ln(1+ x+ 3 x)
√
x→+∞ ln(x + x ) x→+∞ 4. limx→0 ln 1+ √
ln(x5 + x3 ) ( 3 x+ 4 x)
√
√ √
ln( x+ x) 3
ln x2 2 ln x 2 5. limx→0 ln √ √
= lim = lim = ( 3
)
x+ 4 x
x→+∞ ln x5 x→+∞ 5 ln x 5 x
6. limx→+∞ ln(1+3x
ln(1+2 )
)
⋄ 6.1.21. ln(1+3x )
7. limx→0 ln(1+2x )
§ 1. Асимптотические отношения и формулы 369
между символами ∼ и o:
Теорема 6.1.9 (о связи между символами ∼ и o). Следующие утверждения эквивалентны:
(i) f (x) ∼ g(x);
x→a
(ii) f (x) = g(x) + o (g(x));
x→a
(ii) g(x) = f (x) + o (f (x)).
x→a
⋄ 6.1.26. Следующие записи являются асимпто- ⋄ 6.1.27. Следующие записи, наоборот, не явля-
тическими выражениями: ются асимптотическими выражениями:
o (x), o (x)
sin x, o (sin x), sin o (x) sin x→0 o (1)→0
x→0 x→0 x→0
К асимптотическим выражениям нужно относиться как к выражениям (в главе про логику они
назывались термами), описывающим семейства функций: когда вместо каждого входящего символа
o мы подставляем выражение, описывающее какую-то функцию (со свойством этого символа
x→a
o ), мы получаем выражение, описывающее определенную стандартную функцию. Говорят, что
x→a
два асимптотических выражения равны, если они описывают один и тот же класс функций:
A = B ⇐⇒ f (x) = A ⇐⇒ f (x) = B
Свойства символа o:
1o C · o f (x) = o C · f (x) = o f (x) , C 6= 0;
x→a x→a x→a
2o o f (x) ± o f (x) = o f (x) ;
x→a x→a x→a
3o o f (x) · o g(x) = o f (x) · g(x) = f (x) · o g(x) ;
x→a x→a x→a x→a
4o o o f (x) = o f (x) .
x→a x→a x→a
5o o (f (x)) = f (x) · o (1);
x→a x→a
6o o (1) −→ 0;
x→a x→a
7o f (x) ∼ g(x) ⇒ o f (x) = o g(x) ;
x→a x→a x→a
372 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
µ
8o f (x) + o f (x) = f (x)µ + o f (x)µ , µ 6= 0.
x→a x→a
u(x) = C· o (f (x)) ⇔ u(x) = C·α(x) ·f (x) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = o (C·f (x)),
x→a | {z } |{z } x→a
↓ ↓
0 0
и, во-вторых,
C6=0
u(x) = o (C·f (x)) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = C · α(x) ·f (x) ⇔ u(x) = o (f (x)).
x→a | {z} | {z } x→a
↓ ↓
0 0
2. Докажем 2o :
u(x) = o (f (x) ± o f (x) ⇔ u(x) = α(x) ·f (x) ± β(x) ·f (x) = α(x) ± β(x) ·f (x) ⇔
x→a x→a | {z } |{z} | {z }
↓ ↓
↓
0 0
0
| {z }
⇓
γ(x) = α(x) ± β(x) −→ 0
x→0
⇔ u(x) = γ(x) ·f (x) ⇔ u(x) = o f (x)
|{z} x→a
↓
0
|{z}
⇓
α(x) = γ(x) −→ 0
x→0
β(x) = 0 −→ 0
x→0
3. Докажем 3o : во-первых,
u(x) = o f (x) · o g(x) ⇔ u(x) = α(x) ·f (x) · β(x) ·g(x) = α(x) · β(x) ·f (x) · g(x) ⇔
x→a x→a | {z} |{z} | {z }
↓ ↓
↓
0 0
0
| {z }
⇓
γ(x) = α(x) · β(x) −→ 0
x→0
⇔ u(x) = γ(x) ·f (x) · g(x) ⇔ u(x) = o f (x) · g(x) ,
|{z} x→a
↓
0
|{z}
⇓
2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 13 −→ 0
x→0
и, во-вторых,
u(x) = o f (x) · g(x) ⇔ u(x) = α(x) ·f (x) · g(x) = f (x) · α(x) ·g(x) ⇔
x→a | {z} |{z }
↓ ↓
0 0
⇔ u(x) = f (x) · o g(x) .
x→a
o
4. Докажем 4 :
u(x) = o o f (x) ⇔ u(x) = α(x) · o f (x) ⇔
x→a x→a |{z } x→a
↓
0
§ 1. Асимптотические отношения и формулы 373
⇔ u(x) = α(x) · β(x) ·f (x) = α(x) · β(x) ·f (x) ⇔
| {z} |{z} | {z }
↓ ↓
↓
0 0
0
| {z }
⇓
γ(x) = α(x) · β(x) −→ 0
x→0
⇔ u(x) = γ(x) ·f (x) ⇒ u(x) = o f (x)
|{z} x→a
↓
0
|{z}
⇓
2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 31 −→ 0
x→0
6. Докажем 6o :
u(x) = o (1) ⇔ u(x) = α(x) ·1 ⇔ u(x) −→ 0.
x→a | {z} x→a
↓
0
Тогда
u(x) = o f (x) ⇔ u(x) = α(x) ·f (x) = α(x) · θ(x) ·g(x) = α · θ(x) ·g(x) ⇔ u(x) = o g(x)
x→a |{z } | {z} |{z} | {z } x→a
↓ ↓ ↓ ↓
0 0 1 0
8.
µ
u(x) = f (x) + o f (x) ⇔
x→a
µ µ µ
⇔ u(x) = f (x) + α(x) ·f (x) = 1 + α(x) ·f (x) = 1 + α(x) ·f (x)µ ⇔
|{z } | {z } | {z }
↓
↓ ↓
0
1 1
Теорема 6.1.9
⇔ u(x) ∼ f (x)µ ⇔ u(x) = f (x)µ + o f (x)µ
x→a x→a
λk 6 µ,
xµ ≪ xλ , λ < µ, (6.1.29)
x→0
Если же λ < µ, то
o (xλ ) + C · xµ = o (xλ ). (6.1.32)
x→0 x→0
o (xµ )
x→0
−→ 0,
xλ x→0
o (xµ ) xµ · o (1)
x→0 x→0 µ−λ
= = |x {z } · o (1) −→ 0 .
xλ xλ x→0
| {z
x→0
}
ограничено
o
в окрестности свойство 6 на с. 371
нуля при
µ−λ> 0
§ 1. Асимптотические отношения и формулы 375
u(x) = o (xλ ) + C · xµ ⇔
x→0
⇔ xµ−λ} ·xλ = α(x) + C · xµ−λ ·xλ
u(x) = α(x) ·xλ + C · xµ = α(x) ·xλ + |C · {z ⇔
| {z} |{z } | {z }
↓ ↓ ↓
0 ↓
0 0
(µ − λ > 0) 0
.
/
Перечислим важные следствия из теорем = 3x + x2 + o (x) = 3x + o (x).
6.1.10 и 6.1.3. Во-первых, из (6.1.32) мы получаем |{z} x→0 x→0
↑
Следствие 6.1.11. В простом асимптотиче- здесь применяется
следствие 6.1.11
ском многочлене все неасимптотические моно-
мы со степенями, большими асимптотической Во-третьих, из (6.1.29) и (6.1.30) мы получаем
степени можно без потери информации обну-
лять. Следствие 6.1.13. Главный моном простого
асимптотического многочлена ak · xαk (если
⋄ 6.1.32. Например, он существует) является главным слагаемым
этого многочлена:
2x + 4x2 − 2x3 + 5x4 + o (x2 ) = ak ·xαk ≫ ai ·xαi (i 6= k), ak ·xαk ≫ o (xβ ).
x→0
.
/ .
/ x→0 x→0 x→0
= 2x + 4x2 − 2x3 + 5x4 + o (x2 ) =
x→0 (и поэтому весь многочлен эквивалентен свое-
2 2
= 2x + 4x + o (x ) му главному моному).
x→0
⋄ 6.1.34. Например,
Во-вторых, из (6.1.31) следует
2x + 4x2 − 2x3 + 5x4 + o (x2 ) ∼ 2x
x→0 x→0
Следствие 6.1.12. При сложении асимптоти-
ческих многочленов меньшая асимптотическая Из следствия 6.1.13 и свойства 7o на с.371 мы
степень поглощает большую. получаем
⋄ 6.1.33. В качестве иллюстрации можно приве- Следствие 6.1.14. При подстановке простого
сти такой пример: асимптотического многочлена A в символ o
x→0
возникающий асимптотический многочлен ра-
x + x2 + o (x2 ) + 2x + o (x) = вен как асимптотическое выражение бесконеч-
x→0 x→0
/
. но малому от главного монома: o (xαk ), где αk
x→0
= 3x + x2 + o (x2 ) + o (x) = – главная степень многочлена A.
x→0 x→0
376 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
.
/
⋄ 6.1.35. = (следствие 6.1.11) = x+x2+ o (x) = x+ o (x)
x→0 x→0
o 2x + 4x2 − 2x3 + 5x4 + o (x2 ) =
x→0 x→0
.
/ .
/ .
/ /
. ⋄ 6.1.37.
= o 2x + 4x − 2x + 5x4 + o (x2 ) =
2 3
x→0 x→0
= o (x) 2
x→0 x + x2 + o (x2 ) =
x→0
Теперь рассмотрим примеры, где применяет-
ся много правил. = x + x + o (x2 ) · x + x2 + o (x2 ) =
2
x→0 x→0
2
⋄ 6.1.36. = x2 + x4 + o (x2 ) + 2x3 + x o (x2 ) + x2 o (x2 ) =
x→0
x→0
x→0
2 2
x + x + o (x ) + o x + x2 + o (x2 ) = = x2 +x4 + o x4 +2x3 + o x3 + o x4 =
x→0 x→0 x→0 x→0 x→0 x→0
= (следствие 6.1.14) = x + x2 + o (x2 )+ = (следствие 6.1.12) =
x→0 .
/ .
/
.
/ .
/
2
+ o x + x + o (x ) = 2 = x + x + o x4 + 2x3 + o x3 + o x4 =
2 4
x→0 x→0 x→0 x→0 x→0
2 2 2 4 3 3
= x + x + o (x ) + o (x) = (следствие 6.1.12) = = x + x + 2x + o x = (следствие 6.1.11) =
x→0 x→0 x→0
/
. .
/
= x + x + o (x ) + o (x) = x + x2 + o (x) =
2 2
= x + x + 2x + o x3 = x2 + 2x3 + o x3
2 4 3
x→0 x→0 x→0 x→0 x→0
Последний пример особенно важен, и поэтому будет полезно найти более экономный способ
упрощать подобные выражения. Представим себе, что нам нужно упростить асимптотическое вы-
ражение
A0 xl + A1 xl+1 + ... + Ak xl+k + o xl+k · B0 xm + A1 xm+1 + ... + An xm+n + o xm+n
x→0 x→0
(6.1.33)
Для этого можно пользоваться следующим алгоритмом.
M = min{l + m + n, l + k + m}.
Это будет означать, что после упрощения наше выражение должно оканчиваться символом
o xM
x→0
2.
Последствию 6.1.11 все слагаемые со степенями µ > M при упрощении “съедаются” слагаемым
o xM :
x→0 .
/
xµ + o xM = o xM
x→0 x→0
⋄ 6.1.38. Рассмотрим еще раз выражение из 1. Сначала замечаем, что минимальная сте-
примера 7.2: пень переменной x, стоящая под символом o, ко-
торая может получиться при раскрытии скобок
2 равна 3. Это получается, когда слагаемое x умно-
x + x2 + o (x2 ) =
x→0 жается на слагаемое o (x2 ). Значит, наше упро-
x→0
= x + x2 + o (x2 ) · x + x2 + o (x2 )
x→0 x→0
§ 1. Асимптотические отношения и формулы 377
2
⋄ 6.1.42. − x2 + o (x2 ) + o x2
используем x→0 x→0
= свойство 1o = lim =
x→0 x2 · ln 2 + o (x2 )
arcsin 2x − sin x x→0
используем формулы
lim = = 2
x→0 x + ln(1 + 3x) (6.1.19) и (6.1.27) − x2 + o (x2 )
=
снова
= lim x→0
=
используем 20 x2 · ln 2 + o (x2 )
2x + o (2x) − x + o (x) x→0
x→0 x→0 x→0
= lim = 2
x→0
x + 3x + o (3x) − x2 + x2 o (1)
x→0 после этого x→0
= свойство 6o = lim =
x + o (x) − o (x) x + o (x) x→0 x2 · ln 2 + x2 o (1)
x→0 x→0 x→0 x→0
= lim = lim =
x→0 4x + o (x) x→0 4x + o (x) − 21 + o (1)
x→0 x→0 делим все x→0
= на x2 = lim =
1 + o (1) x→0 ln 2 + o (1)
x→0 1+0 1 x→0
= lim = =
x→0 4 + o (1) 4+0 4 применяем − 21 + 0 1
x→0 = свойство 7o = =−
ln 2 + 0 2 ln 2
⋄ 6.1.43. ⋄ 6.1.44.
1
1 ln (x+ex ) x
lim (x + ex ) x = lim e =
ln(cos x) используем формулы x→0 x→0
lim x2 = (6.1.21) и (6.1.24) = 1 x limx→0 1
x ·ln(x+1+x+x→0
o (x))
x→0 2 −1
= elimx→0 x ·ln(x+e )
=e =
2
ln 1 − x2 + o (x2 ) limx→0 1
x ·ln(1+2x+x→0
o (x))
x→0 =e =
= lim =
x→0 x2 · ln 2 + o (x2 ) 1
x→0 limx→0 x · 2x+ o (x)+ o 2x+ o (x)
x2 2
=e x→0 x→0 x→0
=
поскольку − 2 + o (x ) −→ 0,
x→0 x→0
можно сделать замену limx→0 1
x · 2x+ o (x)+ o 2x+ o (2x)
2
y = − x2 + o (x2 ),
=e x→0 x→0 x→0
=
x→0
и тогда получится, что y −→ 0,
x→0 limx→0 1
x · 2x+ o (x)+ o (2x)
=
и по формуле
(6.1.22) мы будем
иметь =
=e x→0 x→0
=
2
ln 1 − x2 + o (x2 ) =
x→0 1
limx→0 x · 2x+ o (x)+ o (x)
= ln(1 + y) = y + o (y) =
y→0
=e x→0 x→0
=
2 2
2 2
= − x2 + o (x ) + o − x2 + o (x ) 1
x→0 x→0 x→0 limx→0 x ·x· 2+ o (1)+ o (1)
2
2
=e x→0 x→0
=
− x2 + o (x ) + o 2
− x2 + o (x ) 2
x→0 x→0 x→0 limx→0 2+ o (1)+ o (1)
= lim = =e x→0 x→0
= e2+0+0 = e2
x→0 x2 · ln 2 + o (x2 )
x→0
⋄ 6.1.45. Вернемся теперь к примеру (6.1.34):
используем
= свойство 3oo = x6 · arctg4 x + sin5 sin tg x2
2
2 .
/ lim
x→0 x2 · sin8 x + ln cos 3x5
=
− x2 + o (x2 ) + o − x2 + o (x2 ) 4 5
x→0 x→0 x→0 = lim x6 · x + o (x) + sin tg x2 + o (sin tg x2 )
= lim = x→0 x→0
:
x→0
x→0 x2 · ln 2 + o (x2 ) ( 8 !)
x→0 (3x )
5 2
2
2 : x2 · x + o (x) + ln + o 1− (3x5 )2 =
− x2 + o (x ) + o − x2
2 x→0
(
2 x→0
x→0 x→0
= lim =
x→0 x2 · ln 2 + o (x2 ) = lim x6 · x4 + o (x4 ) +
x→0 x→0
x→0
§ 1. Асимптотические отношения и формулы 379
!5 )
применяем
+ tg x2 + o (tg x2 ) + o tg x2 + o (tg x2 ) : = свойства 10 и 30 §7 =
x→0 x→0 x→0
( !) 1 1 1
9x10 o (x ) + 3x − o (x 4 )
4 4
: x2 · x8 + o (x8 ) + o 9x10 + ln 1− = x→0 x→0
x→0 2 x→0 = lim 2 2 =
5 x→0 o (x 7 ) + x 7
x→0
= lim x10 + o (x10 ) + tg x2 + o (tg x2 ) :
x→0 x→0 x→0 1 1
( o (x 4 ) + 3x 4
9x10 x→0
: x10 + o (x10 ) − + o 9x10 + = lim 2 2 =
x→0 2 x→0 x→0 o (x 7 ) + x 7
!) x→0
9x10
1 1
+ o − + o 9x10 = x 4 · o (1) + 3x 4
x→0 2 x→0
x→0
( = lim 2 2 =
= lim x
10
+ o (x
10
)+
x→0 x 7 · o (1) + x 7
x→0 x→0 x→0
)
5
o (1) + 3
x→0
+ x2 + o (x2 ) + o x2 + o (x2 ) : = lim 1 1 =
x→0 x→0 x→0
( )
x→0 · o (1) + x 28
x 28
x→0
9x10
: x
10
+ o (x
10
)− + o x
10
= по свойству 80 §7 0 + 3
x→0 2 x→0
5
= o (1) −→ 0 = =∞
x→0 x→0 0·0+0
x10 + o (x10 ) + x2 + o (x2 )
x→0 x→0
= lim
x→0 10
− 7x2 + o (x10 )
=
⋄ 6.1.47.
x→0
= применяем формулы
(6.1.19) и (6.1.21) = x→∞ x→∞
1 1
1 1 4x 3 + o (x 3 )
4x + 3x − 2(x + o (x))
3 4
= lim x→∞
=
x→0 2 2
= lim 1 2 2 = x→∞ o (x 7 ) + x 7
x→0
2x + o (x2 ) +x 7 x→∞
x→0 1 1
1 1
4x 3 + x 3 · o (1)
x3 = o (x 4 ) x→∞
x→0
1 = lim 2 2 =
= x = o (x 4 ) =
x→∞ x · o (1) + x 7
7
x→0 x→∞
2
x2 = o (x 7 ) 1 1
n
x→0 4x 21 + x 21 · o (1)
x→∞
1 1
= lim 4 o (x 4 ) + 3x 4 − = lim =
x→0 x→0
x→∞ o (1) + 1
x→∞
1 1 o
по свойству 8 §7 0
− 2 o (x 4 ) + o ( o (x 4 )) : = o (1) −→ 0 =
x→0 x→0 x→0 x→∞ x→∞
n1 2 2 2
o
: o (x 7 ) + o ( o (x 7 )) + x 7 = 1
4 + o (1)
x→∞
2 x→0
x→0 x→0
= lim x 21 · =
применяем
x→∞ o (1) + 1
= свойство 6o §7 = x→∞
1 1 1 1
4+0
4 o (x 4 ) + 3x 4 − 2( o (x 4 ) + o (x 4 )) = ∞· =∞
x→0 x→0 x→0 0+1
= lim 1 2 2 2 =
x→0 o (x 7 )
+ o (x 7 ) + x 7
2 x→0 x→0 ⊲⊲ 6.1.48. Вычислите пределы:
применяем 1−cos x
= свойства 10 и 20 §7 = 1. limx→0 ln(1+tg2 x)
1 1 1 ln(1+x+x2 )+arcsin 3x−5x3
o (x 4 ) + 3x 4 − 2( o (x 4 )) 2. limx→0 sin 2x+tg2 x+(ex −1)5
x→0 x→0
= lim 2 2 = 1
x→0 o (x 7 ) + x 7 3. limx→0 cos x + arctg2 x arcsin2 x
x→0
380 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
n
X f (k) (x0 )
f (x) = · (x − x0 )k + o (x − x0 )n (6.2.35)
k! x→x0
k=0
• Эта формула называется формулой Тейлора с остаточным членом в форме Пеано порядка
(или точности) n для функции f в точке x0 .
Доказательство теоремы 6.2.1. Рассмотрим многочлен Тейлора
n
X f (k) (x0 )
f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )
Tn (x) = f (x0 ) + · (x − x0 ) + · (x − x0 )2 + ... + · (x − x0 )n = · (x − x0 )k
1! 2! n! k!
k=0
и заметим, что
Tn (x0 ) = f (x0 ), Tn′ (x0 ) = f ′ (x0 ), Tn′′ (x0 ) = f ′′ (x0 ), ... Tn(n) (x0 ) = f (n) (x0 ) (6.2.36)
Действительно,
Затем,
f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )
Tn′ (x) = 0 + ·1+ · 2(x − x0 ) + ... + · n(x − x0 )n−1
1! 2! n!
и поэтому
f (n) (x0 )
Tn(n) (x) = 0 + 0 + ... + · n! = f (n) (x0 )
n!
и поэтому
Tn(n) (x0 ) = f (n) (x0 )
Формулы (6.2.36) позволяют вычислить следующий предел:
Итак, мы получили
f (x) − Tn (x)
−→ 0
(x − x0 )n x→x0
то есть,
f (x) − Tn (x) = o ((x − x0 )n )
x→x0
или
f (x) = Tn (x) + o ((x − x0 )n )
x→x0
√ √
⋄ 6.2.1. Выпишем формулу Тейлора для функ- π 3 2 2 π
+ oπ x− = + · x− −
ции f (x) = sin x в точке x0 = π4 с точностью x→ 4 4 2 2 4
n = 2: √ √
2 π 2 2 π 3 π 3
− · x− − · x− + oπ x−
f ′ (x0 ) 4 4 12 4 x→ 4 4
sin x = f (x) = f (x0 ) + · (x − x0 )+
1!
′′
f (x0 ) а без выкладок это будет выглядеть так:
+ · (x − x0 )2 + o (x − x0 )2 =
2! x→x0 √ √ √
π − sin( π4 ) 2 2 π 2 π 2
π cos 4 π π 2 sin x = + · x− − · x− −
= sin + · x− + · x− + 2√ 2 4 4 4
4 1! 4 √ 2! 4
√ 2 π 3 π 3
π 2 2 2 π − · x− + oπ x−
+ oπ x− = + · x− − 12 4 x→ 4 4
x→ 4 4 2 2 4
√
2 π 2 π 2 ⋄ 6.2.2. Выпишем формулу Тейлора для функ-
− · x− + oπ x−
4 4 x→ 4 4 ции f (x) = ln x в точке x0 = 1 с точностью n = 3:
Если убрать выкладки, получается следующий
f ′ (x0 )
результат: ln x = f (x) = f (x0 ) + · (x − x0 )+
1!
√ √ √ f ′′ (x0 ) f ′′′ (x0 )
2 2 π 2 π 2 + · (x − x0 )2 + · (x − x0 )3 +
sin x = + · x− − · x− + 2! 3!
2 2 4 4 4 1
π 2 |x=1
+ oπ x− + o ((x − x0 )3 ) = ln 1 + x · (x − 1)+
x→ 4 4 x→x0 1!
− 12 |x=1 2
3 |x=1
Можно увеличить точность, например, до n = 3, + x · (x − 1)2 + x · (x − 1)3 +
2! 3!
и тогда получится 1
+ o ((x − 1)3 ) = (x − 1) − · (x − 1)2 +
f ′ (x0 ) x→x0 2
sin x = f (x) = f (x0 ) + · (x − x0 )+ 1
1! 3
+ · (x − 1) + o ((x − 1)3 )
f ′′ (x0 ) f ′′′ (x0 ) 3 x→x0
+ · (x − x0 )2 + · (x − x0 )3 +
2! 3! Если убрать выкладки, получается следующий
π cos π4 π результат:
+ o ((x − x0 )3 ) = sin + · x− +
x→x0 4 1! 4
− sin( π4 ) π 2 − cos( π4 ) π 3 (x − 1)2 (x − 1)3
+ · x− + · x− + ln x = (x− 1)− + + o ((x− 1)3 )
2! 4 3! 4 2 3 x→x0
Формулы Маклорена-Пеано.
• При x0 = 0 формула Тейлора называется формулой Маклорена:
f ′ (0) f ′′ (0) 2 x2
cos x = f (x) = f (0) + ·x+ · x + o (x2 ) = 1 + 0 − + o (x2 )
1! 2! x→0 2 x→0
Для тех же функций, что и в (6.1.19) – (6.1.28) нетрудно выписать соответствующие формулы
с более высокой точностью, например, n = 3 или n = 4:
x3
sin x = x − + o (x3 ) (6.2.38)
6 x→0
3
x
tg x = x + + o (x3 ) (6.2.39)
3 x→0
x2
cos x = 1 − + o (x3 ) (6.2.40)
2 x→0
x2 x3
ln(1 + x) = x − + + o (x3 ) (6.2.41)
2 3 x→0
x x2 x3
loga (1 + x) = − + + o (x3 ) (6.2.42)
ln a 2 ln a 3 ln a x→0
x2 x3
ex = 1 + x + + + o (x3 ) (6.2.43)
2 6 x→0
2
x2
· ln a x3 · ln3 a
ax = 1 + x · ln a + + + o (x3 ) (6.2.44)
2 6 x→0
2
α(α − 1)x α(α − 1)(α − 2)x3
(1 + x)α = 1 + αx + + + o (x3 ) (6.2.45)
2 6 x→0
x3
arcsin x = x + + o (x3 ) (6.2.46)
6 x→0
3
x
arctg x = x − + o (x3 ) (6.2.47)
3 x→0
Полезно сразу же, для случая n = 3 объ- это означает, что нужно увеличить
яснить, зачем эти формулы нужны. Нам сей- точность формул Маклорена.
час важно, что формулы Маклорена позволя- (C) Если ответ получен, то дальнейшее
ют вычислять пределы, которые невозможно вы- увеличение точности формул Макло-
числить с помощью асимптотических формул рена не может привести к изменению
(6.1.19) – (6.1.28). Алгоритм их применения мож- ответа.
но выразить следующими эвристическими пра-
вилами.
⋄ 6.2.3.
Правила вычисления пределов
√
с помощью формул Маклорена: 1 + 2 tg x − ex + x2
lim
(A) При использовании формул Маклорена
x→0 arcsin x − sin x
может не получиться ответа, если Объясним сначала, почему здесь нужны фор-
возникнет неопределенность. мулы Маклорена. Если этот предел вычислять с
(B) Если возникает неопределенность, то помощью правила Лопиталя, то Вы увидите, что
§ 2. Формулы Пеано и асимптотика 383
2x3
+ o (x3 ) + x4
+ o (x4 ) x2 x3
3 x→0 24 x→0 =x− + + o (x3 )−
= lim = 2 3 x→0
x→0 x3
+ o (x3 )
3 x→0 x2 x3
− −x − − + o (x3 ) =
2x3 3 x4 2 3
3 + x · o (1) + 24 + x4 · o (1) x→0
x→0 x→0
= lim = 2x3
x→0 x3
3 + x3 · o (1) = 2x + + o (x3 )
x→0 3 x→0
2 x
3 + o (1) + 24 + x→0
o (1) Далее,
x→0
= lim 1 =
x→0 + o (1)
3 x→0 earctg x = (применяем (6.2.43)) =
2
3 +0+0+0 arctg2 x arctg3 x
= 1 =2 = 1 + arctg x + + +
3 +0 2 6
+ o (arctg3 x) = (применяем (6.2.47)) =
То же самое получится, если поменять форму- x→0
лу Маклорена на более точную в любом другом x3
месте (или в нескольких местах). =1+ x− + o (x3 ) +
3 x→0
2
⋄ 6.2.4. 3
x − x3 + o (x3 )
1 x2
earctg x − 1−x + 2 + x→0
+
lim 2
x→0 ln 1+x
1−x − 2x 3
3
x − x3 + o (x3 )
Убедимся, что, как и в предыдущем случае, + x→0
+
этот предел не вычисляется с помощью формул 6 !
(6.1.19) – (6.1.28), то есть с помощью формул Ма- 3
x3
клорена с точностью n = 1: + o x− + o (x3 ) =
x→0 3 x→0
упрощаем
1 x2
earctg x − 1−x + 2 = ... = с помощью = ... =
lim = 0 0
свойств 1 − 8 §7
x→0 ln 1+x
1−x − 2x
x2 x3
1 + arctg x + o (arctg x) − (1 − x)−1 + x2
2 = 1+x+ − + o (x3 )
= lim
x→0
= 2 6 x→0
x→0 ln(1 + x) − ln(1 − x) − 2x
( И, наконец,
= lim 1 + x + o (x) + o x + o (x) −
x→0 x→0 x→0 x→0 1
) = (1 − x)−1 = (применяем (6.2.45)) =
x2 1−x
− 1 − x + o (x) + : (−1)(−2)(−x)2
x→0 2 = 1 + (−1)(−x) + +
( ) 2
(−1)(−2)(−3)(−x)3
: x + o (x) − −x + o (x) − 2x = + + o (x3 ) =
x→0 x→0 6 x→0
= 1 + x + x2 + x3 + o (x3 )
x2 x2 x→0
o (x) + 2 x · o (1) + 2
x→0 x→0
= lim = lim = Теперь вычисляем предел:
x→0 o (x) x→0 x · o (1)
x→0 x→0
o (1) + x earctg x − 1
+ x2
x→0 2 0+0 1−x 2
= lim = =? lim 1+x =
x→0 o (1) 0 x→0 ln 1−x − 2x
x→0 (
x2 x3
Вы можете проверить самостоятельно, что даже = lim 1+x+ − + o (x3 ) −
если увеличить точность формул Маклорена до
x→0 2 6 x→0
)
n = 2, это все равно не поможет. x2
Но если воспользоваться формулами Мак- − 1 + x + x2 + x3 + o (x3 ) + :
x→0 2
лорена с точностью n = 3 (то есть формулами ( )
(6.2.38) – (6.2.47)), то этот предел удается со- 2x3 3
считать. Только, как и в предыдущем примере, : 2x + + o (x ) − 2x =
3 x→0
перед вычислениями здесь следует выписать от- 3
дельно асимптотическое представление некото- − 7x6 + o (x3 )
x→0
рых фрагментов: = lim 2x3
=
x→0
3 + o (x3 )
x→0
1+x 3
ln = ln(1 + x) − ln(1 − x) = − 7x6 + x3 · o (1)
1−x = lim x→0
=
2x3
= (применяем (6.2.41)) = x→0
3 + x3 · o (1)
x→0
§ 2. Формулы Пеано и асимптотика 385
− 67 + o (1) 7 ⋄ 6.2.6.
x→0
= lim 2 =−
x→0 + o (1) 4 ctg x3
3 x→0 lim (cos(xex ) − ln(1 − x) − x)
x→0
⋄ 6.2.5.
√ Здесь мы не будем утомлять читателя предвари-
x3
ln x + 1 + x2 − x + 6
тельными прикидками, а сразу применим фор-
lim мулы Маклорена с “нужной” точностью. При
x→0 x − arcsin x
этом, в разных местах точность мы будем брать
Здесь мы сразу применим формулы Маклорена
разной, но важно понимать, согласно нашим пра-
с точностью n = 3. Выпишем отдельно асимп-
вилам, что если ты не знаешь какой должна быть
тотическое представление некоторых фрагмен-
точность, то можно брать наугад любую, а затем
тов:
уже, если получится неопределенность (а это са-
p
ln x + 1 + x2 = ln x + (1 + x ) 2 = 2 1 мое страшное, что может получиться) – повы-
2 шать порядок точности до тех пор, пока не по-
1 1 1
−1 x лучится определенность. И, кроме того, следует
= применяем
(6.2.45) = ln x + 1 + x + 2 2 + иметь в виду, что если на каком-то шаге ответ
2 2
! уже получен, а ты все равно продолжаешь вы-
1 1 1 3
− 1 − 2 x числения, увеличивая порядок точности, то ты
+ 2 2 2
+ o (x3 ) =
6 x→0 не сможешь получить другой ответ (если, конеч-
но не делаешь арифметических ошибок).
1 1 1 1
3 2 −2 x
2
2 −2 − 23 x3 Выпишем получающиеся выражения:
= ln 1 + x + + +
2 2 6
! cos(xex ) = cos x · 1 + x + o (x) =
x→0
+ o (x3 ) =
x→0
= cos x + x + o (x2 ) =
2
x→0
3 x2 3x3 3 1 2
= ln 1 + x − + + o (x ) = =1− x + x + o (x2 ) +
2
2 8 48 x→0
2
x→0
3
применяем
= (6.2.41) = + o 2
x + x + o (x ) 2
=
x→0 x→0
3 x2 3x3
= x− + + o (x3 ) − 1
2 8 48 x→0 = ... = 1 − x2 − x3 + o (x3 )
2 2 x→0
3 x2 3x3 3
2 x − 8 + 48 + x→0 o (x )
− + cos(xex ) − ln(1 − x) − x =
2
3
3 x2 3x3 3 1 2
2 x − 8 + 48 + o (x ) = 1 − x − x 3
+ o (x 3
) −
x→0 2 x→0
+ +
3
3 ! x2 x3 3
3 x 2
3x 3 − −x − − + o (x ) −x=
+ o x− + + o (x3 ) = 2 3 x→0
x→0 2 8 48 x→0
упрощаем 2x3
3 =1− + o (x3 )
x 3 3 x→0
= ... = с 0помощью = ... = x − + o (x )
1 − 90 §7 6 x→0
1 1
ctg x3 = 3
= 3
Теперь вычисляем предел: tg x x + o (x3 )
x→0
√ 3
ln x + 1 + x2 − x + x6 Теперь вычисляем предел:
lim =
x→0 x − arcsin x 3
! lim (cos(xex ) − ln(1 − x) − x)ctg x =
подставляем только
что найденное
x→0
√
= разложение ln x + 1 + x2 = 3 1 3
а также формулу (6.2.46) 2x3 x + o (x )
3 − 2 + o (1)
− 2x + o (x3 ) −x3 · 2 +x3 · o (1) 3 x→0
3 x→0 3 x→0 − 2 +0 2
1+ o (1) 3
= lim e
x3 + o (x3 )
x→0 = lim e
x3 +x3 · o (1)
x→0 = = lim e x→0 =e 1+0 = e− 3
x→0 x→0 x→0
X k
x2 x4 x2k x2i
cos x = 1 − + − ... + (−1)k · + o (x2k ) = (−1)i · + o (x2k ) (6.2.49)
2! 4! (2k)! x→0 i=0
(2i)! x→0
X k
x2 x3 xk xi
ln(1 + x) = x − + + ... + (−1)k−1 · + o (xk ) = (−1)i−1 · + o (xk ) (6.2.50)
2 3 k x→0
i=1
i x→0
X xi k
x2 xk
ex = 1 + x + + ... + + o (xk ) = + o (xk ) (6.2.51)
2! k! x→0 i=0
i! x→0
x2 xk
(1 + x)α = 1 + α · x + α(α − 1) · + ... + α(α − 1)...(α − k + 1) · + o(xk ) =
2! k! x→0
k
X xi
=1+ α(α − 1)...(α − i + 1) · + o (xk ) (6.2.52)
i=1
i! x→0
X k
1
= 1 − x + x2 + ... + (−1)k · xk + o(xk ) = (−1)k · xi + o (xk ) (6.2.53)
1+x x→0 i=0
x→0
X k
1
= 1 + x + x2 + ... + xk + o(xk ) = xi + o (xk ) (6.2.54)
1−x x→0 i=0
x→0
X k
x3 x5 x2k+1 x2i+1
arctg x = x − + − ... + (−1)k · + o(xk ) = (−1)i · + o (xk ) (6.2.55)
3 5 2k + 1 x→0 i=0
2i + 1 x→0
⋄ 6.2.7. Вспомним о пределе (6.0.1), которым мы − ln(1 + x) + o (ln(1 + x)) =
x→0
начинали эту главу:
= x + o (x) + o x + o (x) −
x→0 x→0 x→0
ln(1 + sin x) − sin ln(1 + x)
lim
x→0 earctg x − 1 − arctg(ex − 1) − x + o (x) + o x + o (x) =
x→0 x→0 x→0
и поэтому
3
(ln(1 + x))
sin ln(1 + x) = ln(1 + x) − +
6 earctg x − 1 − arctg(ex − 1) =
x2 x3 x2 x3
+ o (ln(1 + x))3 = x − + + = x+ − 3
+ o (x ) −
x→0 2 3 2 6 x→0
! x2 x3
3 x2 x3
x − 2 + 3 + o x3 − x+ − + o (x3 ) =
+ o x3 − x→0
+ 2 6 x→0
x→0 6 = o (x3 )
! x→0
x2 x3 3
3
+ o x− + + o x = И опять при подстановке в предел получается
x→0 2 3 x→0
неопределенность:
x2 x3
= ... = x − + + o (x3 )
2 6 x→0 ln(1 + sin x) − sin ln(1 + x)
lim =
и поэтому x→0 earctg x − 1 − arctg(ex − 1)
o (x3 ) x3 · o (1)
x→0
ln(1 + sin x) − sin ln(1 + x) = = lim = lim 3 x→0 =
x→0 o (x3 ) x→0 x · o (1)
x→0 x→0
x2 x3 3
= x− + + o (x ) −
o (1)
2 6 x→0 x→0 0
= lim = =?
x 2
x 3 x→0 o (1) 0
3
− x− + + o (x ) = x→0
2 6 x→0
x3 arctg(ex − 1) =
sin x = x − + o (x4 )
6 x→0 x2 x3 11x4
=x+ − − + o (x4 )
2 6 24 x→0
x2 x3 x4
ln(1 + x) = x − + − + o (x4 ) Поэтому
2 3 4 x→0
x2 x3 x4 earctg x − 1 − arctg(ex − 1) =
ex = 1 + x + + + + o (x4 )
2 6 30 x→0 7x4 11x4
3 =− + + o (x4 ) =
x 24 24 x→0
arctg x = x − + o (x4 )
3 x→0 x4
= + o (x4 )
Тогда получим 6 x→0
1
1
3
= y + o (y) − 1
= 2 − x2 + o 2 − x2
(ln(1 + x)) y→0 y=2 x2 x→0
sin ln(1 + x) = ln(1 + x) − +
6 А для знаменателя нужно провести предвари-
4 тельные вычисления:
+ o (ln(1 + x)) =
x→0
x3
x2 x3 x4 sin x = x − + o (x3 )
= x− + − + o (x4 ) − 6 x→0
2 3 4 x→0
2 3 4
3 ⇓
1 x x x 4
− x− + − + o (x ) +
6 2 3 4 x→0
4 ! 1 1
= =
x2 x3 x4 4 sin x x− x3
+ o (x3 )
+ o x− + − + o (x ) = 6 x→0
x→0 2 3 4 x→0
1 1
x2 x3 = · x2
=
= ... = x − + + 0 + o (x4 ) x 1− 6 + o (x2 )
x→0
2 6 x→0
1 x2 −1
Поэтому = · 1+ − + o (x2 ) =
x | 6 {zx→0 }
↓
ln(1 + sin x) − sin ln(1 + x) = 0
=−
x4
+ o (x4 ) 1 x2 x2
= · 1− − + o (x2 ) + o − + o (x2 ) =
12 x→0 x 6 x→0 x→0 6 x→0
1 x2
И для знаменателя = · 1+ + o (x2 )
x 6 x→0
earctg x − 1 = ⇓
§ 2. Формулы Пеано и асимптотика 389
1 1 x2 2 cos x−1− x2
2
2 = 2 · 1+ + o (x2 ) = 3. limx→0 x4
sin x x 6 x→0 arctg x−arcsin x
2 4. limx→0 x2
1 x x4 tg x−x
= 2 · 1+ + + o (x4 ) = 5. limx→0
sin x−x
x 3 36 x→0 arctg x−arcsin x
1 1 x2 6. limx→0 tg x−sin x
= 2+ + + o (x2 ) 7. limx→0 2 arcsin x−arcsin 2x
x 3 36 x→0 √ x3
5
1+2x−1
8. limx→0 √ √
⇓ 4
1+x− 1−x √
1 1 1 x2
cos x− 1+2x
9. limx→0 1+xln(1+x)−x
− = − − − + o (x2 ) x √
− 1+2x
sin2 x x2 3 36 x→0 10. limx→0 e ln cos x √
x−3 3 1+x
⇓ 11. limx→0 3 cos x+arcsin
ln(1−x2 )
3
sin x+2x cos x2
12. limx→0 ln(1+x )−2 arctg x3
2 √
1 − x12 − 31 − x36 + o (x2 ) x 1+sin x− 12 ln(1+x2 )−x
2− sin2 x = 2 x→0 = 13. limx→0 3
√ tg x
2
− x36 + o (x2 ) esin x − 1+x2 −x cos x
1
= 2 − x2 · 2 − 3 · 2
1
x→0
14. limx→0 ln3 (1−x)
√
esin x ln cos x − 4 1+4x+x− 32 x2
15. limx→0 x sin x2
Теперь, подставляя числитель и знаменатель 1−cos
1
2 tg x x
в исходный предел, мы получим: 16. limx→0 x+sin x
1
xex +1 x2
− x12
1
2 − x2 + o 2 − x2
1
17. limx→0 xπ x +1
sin(2 ) x→0 √ 1
lim = lim =
x→0 2 − sin12 x x→0 − x12 1
2
− x36 + o (x2 ) 18. limx→0 cos(sin x) + 21 arcsin2 x x2 ( 1+2x−1)
2 · 2− 3 ·2 x→0
√ 1
1 + o (1) √ 19. limx→2 3 − x + ln x2 sin2 (x−2)
x→0 1+0 1 3
= lim 2 = 1 = 23 = 2. 1
20. limx→0 sin x arctg − 1
x→0
2− 3 · 2
1 − x36 + o (x2 )
x→0 2− 3 · 20 x tg x arcsin x
esin x −1−sin(ex −1)
21. limx→0
⊲⊲ 6.2.9. Найдите пределы: arctg4 x
sin x3
1. limx→0 ln(1+x)−x 22. limx→0 ln cos x−cos ln(1+x)+1
x2 α
x x)α +1
2. limx→0 e −1−x
x2 23. limx→0 sin((1+x) −1)−(1+sin
tg4 x
(b) Асимптотика
Формула Тейлора-Пеано (6.2.35), с которой мы начинали этот параграф, является частным случаем
следующей общей конструкции.
Пусть a – какое-нибудь число или символ бесконечности.
• Последовательность функций {ϕn } называется асимптотической последовательностью
при x → a, если
∀k ∈ Z+ ϕk (x) ≫ ϕk+1 (x) (6.2.56)
x→a
(если она верна). Из (6.2.56) следует, что коэффициенты λk ∈ R в формуле (6.2.57) опреде-
ляются однозначно (поэтому не бывает двух разных асимптотических разложений одного
порядка относительно данной асимптотической последовательности).
390 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
√ q √
Степенная последовательность в нуле. e x2 +x−x
= x = 1t
=e
1
t2
+ 1t − 1t
=e
1+t−1
t =
t → +0
Функции
= (6.2.52) =
ϕk (x) = xk , k ∈ Z+ (
1+ 1 ·t+ 1 · 1 −1 · t2 + o (t2 )−1
) 1
2 2 2 2! t→+0 − 8t + o (t)
=e t = e2 t→+0
=
образуют асимптотическую последовательность
1 − 8t + o (t)
при x → 0, потому что =e ·e t→+0 2 = (6.2.51) =
√ t
t
1 = x0 ≫ x1 ≫ x2 ≫ ... ≫ xk ≫ ... = e · 1 − + t→+0
o (t) + o − + o (t) =
8 t→+0 8 t→+0
x→0 x→0 x→0 x→0 x→0 √
√ t √ t e
Для функции f , гладкой в окрестности точки 0 = e· 1 − + o (t) = e − + o (t) =
8 t→+0 8 t→+0
разложения вдоль такой последовательности – √
√ e 1
это просто формулы Маклорена (6.2.37), о ко- = e− + o
торых мы уже говорили выше: 8x x→+∞ x
n
X f (k) (0) Другие асимптотические последователь-
f (x) = · xk + o (xn ) ности. Не всегда данная функция f име-
k! x→0
k=0 ет асимптотическое разложение вдоль данной
асимптотической последовательности {ϕn }.
Степенная последовательность на беско-
нечности. Функции ⋄ 6.2.12. Формула
√ Xn
1 3
x = λ · xk
+ o xn
ϕk (x) = k , k ∈ Z+ k
x→0
x k=0
образуют асимптотическую последовательность не будет верна ни при каких n > 0 и λ0 , ..., λn ∈
при x → ∞, потому что R.
1 1 1 1 Доказательство. Это достаточно доказать для
1= ≫ 1 ≫ 2 ≫ ... ≫ k ≫ ...
0
x x→∞ x x→∞ x x→∞ x→∞ x x→∞ n = 1, потому что любую формулу большего по-
рядка можно записать в виде
Асимптотические разложения вдоль этой после-
довательности обычно получаются заменой x = √ n
X
1
3
x = λ0 + λ1 · x + λk · xk + o xn
t с последующим применением формул Макло- x→0
k=2
рена. Объясним это на примерах. | {z }
⋄ 6.2.10. Пусть нам нужно найти асимптотиче- o
x→0
x
ИНТЕГРАЛ
§1 Неопределенный интеграл
В главе 5 мы определили понятие производной F ′ функции F и изучали его приложения в мате-
матике. Неопределенный интеграл представляет собой конструкцию, придуманную для решения
обратной задачи: дана функция f , нужно найти такую функцию F , для которой f была бы произ-
водной,
F ′ = f.
Такая функция F называется первообразной для функции f .
Как и в случае с производной, эта конструкция оказывается полезной в самых разных областях
естествознания, в частности, в геометрии, при вычислении площадей и объемов. Но, в отличие от
производной, задача нахождения первообразной не имеет однозначного решения: здесь решением
будет целый класс функций, который и называется неопределенным интегралом функции f .
Еще одна неприятная деталь в этой теории, отличающая ее от теории дифференцирования, —
что неопределенный интеграл от стандартной функции не всегда является стандартной функцией.
Поэтому в некоторых случаях “вычислить” неопределенный интеграл в том смысле, который вкла-
дывался в эту задачу в дифференциальном исчислении, то есть, выразив результат в элементарных
функциях, бывает невозможно.
Из-за того, что неопределенный интеграл — не одна функция, а целый их класс, эту тему при-
ходится начинать с изучения классов функций1 .
где A ∈ R – произвольный параметр. Этот класс Эту запись нужно понимать так, что функции,
можно описать формулой описываемые правой частью формулы (7.1.2) (в
которой только x считается свободной перемен-
f ∈F ⇔ ∃A ∈ R ∀x ∈ R f (x) = sin x + A. ной, а все остальные переменные считаются па-
раметрами), и только такие функции, считаются
Если условиться, что под x всегда будет пони- элементами класса F .
маться переменная, используемая как аргумент
В соответствии с этой договоренностью, фор-
при описании функций из данного класса, а все
мула
остальные переменные считаются параметрами,
то при таких договоренностях описание класса G = cos x + B. (7.1.3)
1 Классы функций, которые мы будем рассматривать в этом параграфе, будут множествами (а не собственными
классами в смысле определения на с.30), но нам будет удобно называть их классами, а не множествами, чтобы не
провоцировать путаницы с числовыми множествами.
392
§ 1. Неопределенный интеграл 393
F = G,
если они равны как классы (или множества), то есть если включение f ∈ F эквивалентно включе-
нию f ∈ G:
f ∈ F ⇔ f ∈ G.
Понятно, что это эквивалентно выполнению соотношений
F ⊆G & G ⊆ F.
√
⋄ 7.1.3. Рассмотрим два класса функций, опи- и, поделив на 2, мы получим тождество
санных в примере 7.1.1:
1 1 B
√ · sin x − √ · cos x = √ , x ∈ R,
F = sin x + A, G = cos x + B. 2 2 2
Будут ли они равны? Чтобы это понять, нужно или, что эквивалентно, тождество
проверить два включения: π B
sin x − =√ , x ∈ R.
F ⊆G 4 2
Понятно, что оно не может выполняться, потому
и
что синус — не постоянная функция.
G ⊆ F.
Мы делаем вывод, что
Уже первое из них неверно:
F=
6 G.
F 6⊆ G.
⋄ 7.1.4. Рассмотрим теперь классы функций из
Например, если взять функцию примера 7.1.2:
f (x) = sin x F = sin(x + A), G = cos(x + B).
которая принадлежит F , то нетрудно проверить, Будут ли они равны? Опять, чтобы это понять,
что она не будет принадлежать G, то есть не бу- нужно проверить два включения:
дет иметь вид
F ⊆G
f (x) = cos x + B
и
ни при каком значении параметра B. Действи- G ⊆ F.
тельно, если предположить, что это не так, то
есть существует некое число B ∈ R такое, что 1. Проверим первое включение. Выберем
выполняется тождество какую-нибудь функцию из класса F , то есть
функцию вида
sin x = cos x + B, x ∈ R,
f (x) = sin(x + A), x ∈ R,
то, перебросив cos x в левую часть,
где A ∈ R – какое-то фиксированное число. Что-
sin x − cos x = B, x ∈ R, бы проверить, принадлежит ли она классу G,
394 Глава 7. ИНТЕГРАЛ
нужно понять, существует ли число B ∈ R та- где B ∈ R – какое-то фиксированное число. Что-
кое, для которого будет выполняться тождество бы проверить, принадлежит ли она классу F ,
нужно понять, существует ли число A ∈ R та-
f (x) = sin(x + A) = cos(x + B), x ∈ R. кое, для которого будет выполняться тождество
Действительно, если положить
g(x) = cos(x + B) = sin(x + A), x ∈ R.
π
B =A− ,
2 Действительно, если положить
то
π
A=B+ , π
2 A=B+ ,
и мы получим 2
π то
f (x) = sin(x + A) = sin(x + B + ) = cos(x + B), π
2 B =A− ,
2
x ∈ R,
и мы получим
— здесь мы использовали доказанное ранее тож-
дество (4.1.101): π
g(x) = cos(x + B) = cos(x + A − ) = sin(x + A),
π 2
sin t + = cos t. x ∈ R,
2
2. Теперь проверим второе включение. Выбе- — здесь мы использовали доказанное ранее тож-
рем какую-нибудь функцию из класса G, то есть дество (4.1.106):
функцию вида
π
g(x) = cos(x + B), x ∈ R, cos t − = sin t.
2
Классы функций с общей областью определения. Будем говорить, что класс функций F
имеет общую область определения, если любые две функции из него имеют одинаковую область
определения:
∀f, g ∈ F D(f ) = D(g).
В этом случае множество D(f ), где f ∈ F (не зависящее от выбора f ∈ F ), называется областью
определения функций из F и обозначается D(F ):
D(F ) = D(f ) (f ∈ F ).
⋄ 7.1.5. Классы функций, рассматривавшиеся в тоже имеет общую область определения, которая
примерах 7.1.1 и 7.1.2, представляет собой прямую с выкинутой точкой
0:
sin x + A, cos x + B, sin(x + A), cos(x + B),
D(F ) = R \ {0}.
являются, конечно, классами с общей областью
определения, которая у них совпадает со всей ⋄ 7.1.7. Класс функций
прямой R.
1
⋄ 7.1.6. Класс функций F=
x+A
1
F = +A наоборот не имеет общей области определения.
x
Ограничение класса функций. Напомним, что понятие ограничения отображения было опре-
делено выше формулой (0.3.246) (с.44). Применительно к числовым функциям это определение
выглядит так: ограничением функции f : R ֒→ R на множество M ⊆ R называется функция f M ,
определенная правилами:
1) область определения f M
представляет собой пересечение M с областью определения f :
D(f M
) = M ∩ D(f ),
§ 1. Неопределенный интеграл 395
2) на множестве D(f M
) = M ∩ D(f ) функции f M
и f совпадают:
∀x ∈ M ∩ D(f ) f M
(x) = f (x).
F = ln |x| + A. G = sgn x + B.
Можно заметить, что его ограничением на мно- Можно заметить, что при ограничении на мно-
жество M = (0, +∞) будет класс функций жество M = (0, +∞) получающиеся классы
функций совпадают, потому что
F (0,+∞)
= ln x + A.
F (0,+∞)
= A, x > 0,
⋄ 7.1.9. Рассмотрим класс функций
и
F =A G (0,+∞)
= 1 + B, x > 0.
D(F ) = D(G);
(ii) на любом отрезке [a, b] из их области определения D(F ) = D(G) ограничения этих классов
совпадают:
F [a,b] = G [a,b] ([a, b] ⊆ D(F ) = D(G), a 6= b).
потому что функции вида и тогда значение функции sgn x на нем равно
константе, и выражение sgn x + B в определении
1
f (x) = + A G можно заменить на выражение A.
x
396 Глава 7. ИНТЕГРАЛ
h∈F +G ⇔ ∃f ∈ F ∃g ∈ G h = f + g.
D(α · F ) = D(F ).
Теорема 7.1.1. Нетривиальная линейная комбинация (то есть такая, чтобы хотя бы один из
коэффициентов α или β был ненулевым) классов f (x) + A и g(x) + B описывается формулой
и на всяком отрезке [a, b] ⊆ D(f ) ∩ D(g) = D(h) функция H представима в виде f (x) + g(x) + E тогда
и только тогда, когда она представима в виде h(x) + C:
∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (7.1.12)
и
∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (7.1.13)
Заметим, что из условия (7.1.11) следует вложение
D(f ) ⊇ D(h)
которое вместе с (7.1.10)
D(f ) ⊆ D(h)
дает равенство
D(f ) = D(h). (7.1.14)
С другой стороны, из условия (7.1.11) следует вложение
D(g) ⊇ D(h)
из которого в свою очередь следует
D(h) = D(h) ∩ D(g)
Вместе с (7.1.14) это дает
D(f ) = D(h) = D(h) ∩ D(g).
Отсюда можно сделать вывод, что в формулах (7.1.12) и (7.1.13) множество D(f ) ∩ D(g) = D(h)
можно заменить на совпадающее с ним множество D(f ) = D(h) ∩ D(g):
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (7.1.15)
и
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (7.1.16)
Эти условия можно переписать, перебросив g(x) в правую часть:
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]) (7.1.17)
и
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]). (7.1.18)
А затем можно сделать замену E = A и C = −B, и мы получим
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀A ∈ R ∃B ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]) (7.1.19)
и
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀B ∈ R ∃A ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]). (7.1.20)
Эти два условия означают, что на всяком отрезке [a, b] ⊆ D(f ) = D(h)∩D(g) функция F представима
в виде f (x)+A тогда и только тогда, когда она представима в виде h(x)−(g(x)+B), и это в точности
тождество
f (x) + A ≡ h(x) − (g(x) + B).
! 7.1.12. Непрерывность на отрезках эквива- {0} = [a, b]), но в точке 0 она разрывна, потому
лентна непрерывности на невырожденных отрез- что
ках (потому что на каждом вырожденном отрез- 1
D(f ) ∋ −→ 0 ∈ D(f ),
ке, то есть на одноточечном множестве [a, a] = 2n n→∞
{a}, любая функция непрерывна). но при этом
⋄ 7.1.13. Из непрерывности на отрезках не сле-
1
дует непрерывность на всей области определе- f = 1 6−→ 0 = f (0).
ния. В качестве примера рассмотрим множество 2n n→∞
[∞
В этом примере можно было отрезок [−1, 0] за-
1 1
M = [−1, 0] ∪ , , менить вырожденным отрезком [0; 0] = {0}, но
n=1
2n 2n − 1
мы задали такую область определения, чтобы
и определим функцию f на нем формулой она была интегральной в смысле определения на
( с.400, а получившаяся функция f была диффе-
0, x ∈ h[−1, 0] i ренцируемой в смысле определения на с.401 ни-
f (x) = 1 1
1, x ∈ 2n , 2n−1 . же. Как следствие, этот пример показывает по-
путно, что дифференцируемая функция необяза-
На каждом отрезке [a, b] в своей области опреде- тельно непрерывна на своей области определе-
ления D(f ) = M функция f непрерывна (точ- ния (хотя обязательно непрерывна на отрезках,
нее, равна или 1, если 0 ∈ / [a, b] или 0, если в силу формулируемой ниже теоремы 7.1.7).
и
G ≡ H, (7.1.22)
то
G◦f ≡H◦f (7.1.23)
g f ([a,b])
=h f ([a,b])
.
Мы доказали вложение
G◦f [a,b]
⊆H◦f [a,b]
.
G◦f [a,b]
⊇H◦f [a,b]
.
G◦f [a,b]
=H◦f [a,b]
.
которое справедливо для всякого отрезка [a, b] ⊆ D(f ) = D(G ◦ f ) = D(H ◦ f ). Это доказывает
(7.1.23).
§ 1. Неопределенный интеграл 399
h(x) − h(a)
h′+ (a) := lim (7.1.24)
x→a+0 x−a
— ее левой производной в точке b называется предел
h(x) − h(b)
h′− (b) := lim (7.1.25)
x→b−0 x−b
• Если эти величины конечны, и кроме того функция h имеет (обычную) конечную произ-
водную в любой точке интервала (a; b), то говорят, что h дифференцируема на отрезке
[a; b], а ее производной на отрезке [a; b] называется функция
′
h+ (a), x = a
′ ′
h (x) = h (x), x ∈ (a; b) (7.1.26)
′
h− (a), x = b
Доказательство. Если функция h дифференцируема на отрезке [a; b], то по теореме 5.1.1, она будет
непрерывна в каждой внутренней точке этого отрезка. Остается убедиться, что на концах она тоже
непрерывна. Это делается тем же приемом, что и в теореме 5.1.1: если пределы (7.1.24) и (7.1.25)
существуют и конечны, то функция h непрерывна в точках a и b.
• Функция F называется первообразной для функции f на отрезке [a; b], если F определена
на [a; b], дифференцируема на нем и ее производная на нем равна f :
Лемма 7.1.5. Пусть функция H определена и дифференцируема на отрезке [a, b], причем ее про-
изводная равна нулю на [a, b]:
H ′ (x) = 0, x ∈ [a, b] (7.1.29)
Тогда функция H(x) постоянна на [a, b]:
H(x) = C, x ∈ [a, b]
для некоторого C ∈ R.
H(x) − H(a)
= H ′ (ξ) = (7.1.29) = 0
x−a
отсюда
H(x) − H(a) = 0 =⇒ H(x) = H(a) = C
400 Глава 7. ИНТЕГРАЛ
F (x) + C
⋄ 7.1.14. Интегральная часть открытого интер- ⋄ 7.1.16. Интегральная часть дискретного2 мно-
вала (a, b) совпадает с ним самим: жества, например, N, пуста:
´
N = ∅,
´
(a, b) = (a, b),
поэтому никакое дискретное множество не ин-
поэтому любой интервал является интеграль-
тегрально
ным множеством.
⋄ 7.1.17. Интегральная часть последовательно-
⋄ 7.1.15. Интегральная часть отрезка [a, b] сов- сти тоже всегда пуста, например,
падает с ним самим:
´
1
; n∈N = ∅.
´
[a, b] = [a, b], n
(F [a,b]
)′ = f [a,b]
(7.1.30)
Наша задача — показать, что все функции fa,b являются ограничениями f[a,b] некоторой единой
функции f : D(F ) → R:
f [a,b] = fa,b .
Для этого нужно просто проверить, что для любых двух отрезков [a, b], [c, d] ⊆ D(F ) соответствую-
щие функции fa,b и fc,d совпадают на пересечении [a, b] ∩ [c, d]:
Действительно, если это пересечение [a, b] ∩ [c, d] непусто, то объединение отрезков [a, b] и [c, d]
представляет собой отрезок, содержащийся в D(F ):
! 7.1.18. Однако, из дифференцируемости функ- всей своей области определения D(f ), как пока-
ции f : R ֒→ R не следует ее непрерывность на зывает пример 7.1.13.
Неопределенный интеграл.
• Функция F : R ֒→ R называется первообразной для функции f : R ֒→ R, если f является
производной для F в смысле определения на с.401.
• Класс всех первообразных для функции f называется ее неопределенным интегралом и
обозначается символом ˆ
f (x) d x
´
— и что на каждом отрезке [a, b] ⊆ D( f (x) d x) = D(F (x) + C) ограничения этих классов
совпадают: ˆ
f (x) d x [a,b] = F (x) + C [a,b] .
dx
ˆ
Таблица интегралов. Неопределенные инте- ≡ ln |x| + C (7.1.35)
гралы элементарных функций подсчитаны, и вот x
их список.4 ax
ˆ
ax d x ≡ + C, (0 < a 6= 1) (7.1.36)
ln a
ˆ ˆ
A dx ≡ A ·x + C (7.1.33) ex d x ≡ ex + C (7.1.37)
xα+1
ˆ ˆ
xα d x ≡ +C (α 6= −1) (7.1.34) sin x d x ≡ − cos x + C (7.1.38)
α+1
4 В формуле (7.1.34) правая часть считается определенной на области определения подынтегральной функции. В
остальных формулах это замечание излишне, потому что области определения первообразной и подынтегральной
функции совпадают по определению.
§ 1. Неопределенный интеграл 403
ˆ
cos x d x ≡ sin x + C (7.1.39) из формулы
α+1
dx ∂ x (α + 1) · xα
ˆ
≡ tg x + C (7.1.40) = = xα
cos2 x ∂x α + 1 α+1
dx
ˆ
≡ − ctg x + C (7.1.41) следует, формула (7.1.34):
sin2 x
dx 1 x
ˆ
xα+1
ˆ
2 2
≡ arctg + C (7.1.42) xα d x ≡ +C
a +x a a α+1
dx x
ˆ
√ ≡ arcsin + C (7.1.43) В доказательстве формул (7.1.35), (7.1.44) и
2
a −x 2 a
ˆ
dx 1 a+x (7.1.45) используется доказанная выше формула
≡ ln +C (7.1.44) (5.1.83).
a2 − x2 2a a−x
dx p
(7.1.45) ! 7.1.19. Понятное дело, в качестве парамет-
ˆ
√ ≡ ln x + x2 + A + C
x2 + A ра можно выбирать любую букву, кроме тех,
что входят в интегрируемое выражение, необя-
Доказательство. Здесь всюду используется тео- зательно C. Например, можно писать
рема 7.1.8, и доказательство состоит в том, чтобы
проверить, что производная от правой части сов- xα+1
ˆ
α
падает с подынтегральной функцией. Например, x d x = + D.
α+1
то ˆ ˆ
g(f (x)) · f ′ (x) d x ≡ g(y) d y (7.1.48)
y=f (x)
Доказательство. 1. В первом свойстве сначала нужно проверить, что левая и правая части имеют
одинаковые области определения. Действительно,
ˆ
D α · f (x) + β · g(x) d x = D α · f + β · g = D(f ) ∩ D(g) =
ˆ ˆ ˆ ˆ
= D α · f (x) d x ∩ D β · g(x) d x = D α · f (x) d x + β · g(x) d x .
Тогда для любого x из произвольного отрезка [a, b] ⊆ D(f ) ∩ D(g) справедливо равенство
ˆ
α · f (x) + β · g(x) d x ≡ (7.1.32) ≡ (α · F + β · G)(x) + C = α · F (x) + β · G(x) + C =
ˆ ˆ
= (7.1.9) = α · (F (x) + A) + β · (G(x) + B) ≡ (7.1.32) ≡ α · f (x) d x + β · g(x) d x
D(f ′ ) = D(f ),
Поскольку функция f дифференцируема, она непрерывна на отрезках (по теореме 7.1.7). Вдобавок
условие (7.1.47) означает, что
ˆ
R(f ) ⊆ D g(y) d y = D(G(y) + C).
Отсюда, применяя теорему 7.1.3, мы можем заключить, что тождество (7.1.50) влечет за собой
тождество
ˆ
g(y) d y y=f (x) ≡ G(y) + C y=f (x) . (7.1.51)
3. В тождестве (7.1.49) нужно опять сначала проверить, что девая и правая части имеют одну
и ту же область определения. Это следует из того, что функции f и g дифференцируемы: по этой
причине выполняются равенства
а из них — цепочку
ˆ
D f (x) · g (x) d x = D(f · g ′ ) = D(f ) ∩ D(g ′ ) = D(f ) ∩ D(g) =
′
ˆ
′ ′
= D(f ) ∩ D(g) ∩ D(f ) ∩ D(g) = D f (x) · g(x) − g(x) · f (x) d x
Заметим далее, что для любого x из произвольного отрезка [a, b] ⊆ D(f ) ∩ D(g) справедливо
равенство
(f · g)′ (x) = f ′ (x) · g(x) + f (x) · g ′ (x).
А с другой стороны, множество
(f · g)′ = f ′ · g + f · g ′ .
Поэтому
ˆ
(f · g)(x) + C ≡ (7.1.32) ≡ f ′ (x) · g(x) + f (x) · g ′ (x) d x ≡ (7.1.46) ≡
ˆ ˆ
≡ f ′ (x) · g(x) d x + f (x) · g ′ (x) d x (7.1.53)
Покажем теперь на примерах, как с помощью пе- Внесение под знак дифференциала и при-
речисленных формул вычисляются неопределен- менение формулы замены переменной.
ные интегралы. Формулу (7.1.48) удобно применять, предаври-
тельно договорившись о следующем обозначе-
Применение формулы линейности. Пока- нии: для всякой функции f пусть символ d f (x)
жем, как применяется формула (7.1.46). обозначает выражение f ′ (x) d x:
⋄ 7.1.20. d f (x) = f ′ (x) · d x (7.1.54)
ˆ
5 В частности, интеграл g(f (x))·f ′ (x) d x в левой
´
3
2 + x − 3 sin x − dx ≡
1 + x2 части (7.1.48) можно тогда переписать в таком
виде:
ˆ ˆ ˆ
≡ 2 d x + x3 d x − 3 sin x d x− ˆ ˆ
g(f (x)) · f ′ (x) d x = g(f (x)) d f (x).
1 x4
ˆ
−5 2
d x = 2x+ +3 cos x−5 arctg x+C
1+x 4
Если используя это обозначение переписать фор-
⋄ 7.1.21. мулу (7.1.48)
ˆ ˆ
√ 2
ˆ ˆ
1
x+ dx ≡ x 2 d x+ g(f (x)) d f (x) ≡ g(y) d y , (7.1.55)
cos2 x y=f (x)
406 Глава 7. ИНТЕГРАЛ
(7.1.57), которое мы получили, является равенством классов функций. Символ I обозначает в нем класс функций,
представимых в виде F (x) + A, где F — некоторая фиксированная первообразная для подынтегральной функции.
Равенство (7.1.57) поэтому формально означает высказывание
∀A ∃B ∀x F (x) + A = ex sin x − ex cos x − (F (x) + B),
В нем если выразить F (x) через все остальное, то мы получим высказывание
1 x
∀A ∃B ∀x F (x) = (e sin x − ex cos x) − A − B,
2
Из него следует, что любая первообразная F к функции ex sin x имеет вид
1 x
F (x) = (e sin x − ex cos x) − A − B
2
408 Глава 7. ИНТЕГРАЛ
примечание 5.
§ 1. Неопределенный интеграл 409
2
а затем выражение в скобках заменить на новую 3 1 3 1 2 x − 12
переменную: = ln x− + + √ ·arctg √ +C =
2 2 4 3 3
p
x+ =y 3 1 2x − 1
2 = ln x2 − x + 1 + √ · arctg √ +C =
2 3 3
Оказывается, что при этом мы получим таблич-
всегда
ные интегралы. = x2 − x + 1 > 0 =
Приведем иллюстрацию. Пусть требуется вы-
3 1 2x − 1
числить интеграл = ln x2 − x + 1 + √ · arctg √ +C
2 3 3
3x − 1
ˆ
dx ⋄ 7.1.46 (простейшая дробь 4 типа). Для таких
x2 − x + 1 дробей вывести общую формулу и вовсе невоз-
Поскольку дискриминант знаменателя отрицате- можно. План действий же состоит в следующем.
лен, Чтобы вычислить интеграл
p2 − 4q = 1 − 4 = −3 < 0 Bx + C
ˆ
dx (n ∈ N, n > 1, p2 −4q < 0)
(x2 + px + q)n
выражение под интегралом действительно явля-
ется простейшей дробью третьего типа. Выделим нужно, как и в предыдущем случае, сначала вы-
полный квадрат в знаменателе: делить полный квадрат у квадратного трехчлена
в знаменателе,
2 2
1 1 1 p p 2 p 2
x2 − x + 1 = x2 − 2 · · x + − +1 = x2 + px + q = x2 + 2 · · x + − +q =
2 2 2 2 2
2 2 2
1 1 1 3 p 2 p2
= x− + 1− = x− + = x+ + q−
2 4 2 4 2 4
Теперь делаем замену переменной в интеграле: затем выражение в скобках заменить на новую
переменную:
p
3x − 1 3x − 1 x+ =y
ˆ ˆ
dx = 2 dx = 2
x2 − x + 1 x − 21 + 43 При этом получится несколько интегралов, из
y = x − 12 3 y + 21 − 1 1 которых одни окажутся табличными, а другие
ˆ
= = d y+ = можно будет вычислить с помощью рекуррент-
x = y + 12 y 2 + 34 2
ных формул §7.
3y + 21
ˆ
= dy = Приведем иллюстрацию. Пусть требуется вы-
y 2 + 34 числить интеграл
y 1 1
ˆ ˆ
x−1
ˆ
=3 dy + dy = dx
y 2 + 34 2 y 2 + 34 2
x + 2x + 3
в первом интеграле
= вносим y под знак = Поскольку дискриминант знаменателя отрицате-
дифференциала
лен,
3 dy 2 1 1
ˆ ˆ
= + dy = p2 − 4q = 4 − 12 = −8 < 0
3
2 2
y +4 2 y + 43
2
выражение под интегралом действительно явля-
в первом интеграле!
делаем замену
ется простейшей дробью четвертого типа. Выде-
= y 2 = z − 34 = лим полный квадрат в знаменателе:
z = y 2 + 43
3
x2 + 2x + 3 = x2 + 2 · 1 · x + 12 − 12 + 3 = (x + 1)2 + 2
3 d z− 1 dy
ˆ ˆ
4
= + =
2 z 3 3
y=z− 4 z=y+ 4 2 y + 43
2
Теперь делаем замену переменной в интеграле:
3 dz 1 dy
ˆ ˆ
= + √ 2 = x−1 x−1
ˆ ˆ
2 z 2
z=y + 43
2 d x = 2 dx =
y 2 + 23 2
(x + 2x + 3) 2
((x + 1)2 + 2)
y−2
ˆ
применяем y =x+1
= формулы = = = d(y − 2) =
(7.1.35) и (7.1.42) x=y−1 (y 2 + 2)2
3 1 2 2y y−2 y dy dy
ˆ ˆ ˆ
= ln |z| + · √ · arctg √ + C = = 2 2
d y = 2 2
−2 =
2 2 3
z=y + 4 2 3 3 (y + 2) (y + 2) (y + 2)2
2
3 3 1 2y 1 dy 2 dy
ˆ ˆ
= ln y 2 + + √ · arctg √ + C = = 2 2
− 2 =
2 4 3 3 2 (y + 2) (y + 2)2
2
возвращаемся 1 d(z − 2) dy
ˆ ˆ
= к исходной = = 2
− 2 =
переменной x 2 z 2
z=y +2 (y + 2)2
2
§ 1. Неопределенный интеграл 411
1 dz dy
ˆ ˆ
= −2 Мы не будем доказывать этот результат, а
2 z2 z=y 2 +2
√ 2 2 = лишь объясним как он работает. Для этого по-
y2 + 2
лезно запомнить следующие
применяем 1
= формулы =− −
(7.1.34) и (7.1.63) 2z Правила разложения на простейшие дроби:
z=y 2 +2
y 1 y
−2 + √ · arctg √ + C = — если в разложении знаменателя Q(x) на мно-
4(y 2 + 2) 2( 2)3 2 жители имеется множитель (x − a)n
1
=− −
2(y 2 + 2) Q(x) = ... · (x − a)n · ...
y 1 y
−2 + √ · arctg √ + C = то в разложении правильной дро-
4(y 2 + 2) 2( 2)3 2 P (x)
би Q(x) в сумму простейших дробей
1 y 1 y
=− − − √ · arctg √ + C = должны присутствовать слагаемые вида
2(y 2 + 2) 2(y 2 + 2) 2 2 2 A1 A2 An
√ x−a , (x−a)2 , ..., (x−a)n :
y+1 2 y
=− − · arctg √ + C =
2(y 2 + 2) 4 2 P (x) A1 A2 An
= ...+ + 2
+...+ +...
возвращаемся Q(x) x − a (x − a) (x − a)n
= к исходной =
переменной x
√ — если в разложении знаменателя Q(x) на мно-
x+2 2 x+1 жители имеется множитель (x2 +px+q)n (p2 −
=− 2
− · arctg √ + C
2(x + 2x + 3) 4 2 4q < 0)
⊲⊲ 7.1.47. Вычислите интегралы:
Q(x) = ... · (x2 + px + q)n · ...
´ dx ´ x dx
1) x−7 ; 7) x2 +7x+13 ;
´ dx ´ 4x+8 то в разложении правильной дро-
2) 3−x ; 8) 3x2 +2x+5 d x; P (x)
´ dx би Q(x) в сумму простейших дробей
9) 2x2x+5
´
3) 1+5x ; d x; должны присутствовать слагаемые вида
´ +2x+3
10) 8x5x−7
´ dx
B1 x+C1 B2 x+C2 Bn x+Cn
4) (3x+2)2 ; +x+1 d x;
´ 2 3x+5 x2 +px+q , (x2 +px+q)2 , ..., (x2 +px+q)n :
dx 11) (x2 +2x+2)2 d x;
´
5) x2 +2x+1 ;
dx 3x+2
´ ´
6) 4x2 −4x+1 ; 12) (x2 −3x+3) 2 d x. P (x) B1 x + C1 B2 x + C2
= ...+ 2 + +...
Q(x) x + px + q (x2 + px + q)2
Интегрирование правильных дробей Bn x + Cn
... + 2 + ...
• Рациональная функция (x + px + q)n
P (x)
R(x) =
Q(x) Покажем теперь на примерах, что эти прави-
ла означают.
называется правильной дробью, если степень
многочлена в числителе меньше степени мно- ⋄ 7.1.49 (случай неповторяющихся множителей
гочлена в знаменателе: первой степени). Рассмотрим интеграл
deg P < deg Q ˆ
9x2 − 2x − 8
dx
⋄ 7.1.48. Например, дроби x3 − 4x
Теперь необходимо найти коэффициенты Оно должно выполняться при любом x. В част-
A, B, C. Для этого приведем правую часть к ности, при x = 0, x = 2 и x = −2. Посмотрим,
общему знаменателю во что превращаются левая и правая части при
этих значениях переменной:
9x2 − 2x − 8
= x = 0 : − 8 = −4A ⇒ A=2
x3 − 4x
A(x − 2)(x + 2) + Bx(x + 2) + Cx(x − 2) x = 2 : 24 = 8B ⇒ B = 3
=
x(x − 2)(x + 2) x = −2 : 32 = 8C ⇒ C =4
Эти дроби действительно будут совпадать, если Эта запись означает, что при x = 0 равенство
у них совпадают числители: (7.1.49) превращается в равенство −8 = −4A, от-
куда следует что A = 2, и т.д.
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2) В общем, каким способом ни считай, получа-
ется
Далее коэффициенты A, B, C можно искать
A = 2
двумя разными методами.
Первый из них называется методом неопре- B=3
деленных коэффициентов. Он состоит в следу- C=4
ющем. Сначала приведем подобные слагаемые Это означает, что
справа:
9x2 − 2x − 8 2 3 4
9x2 − 2x − 8 = (A + B + C)x2 + (2B − 2C)x − 4A 3
= + +
x − 4x x x−2 x+2
Слева и справа записаны многочлены от пере- и теперь, наконец, можно вычислить наш инте-
менной x. Они будут совпадать только если у них грал:
совпадают коэффициенты:
9x2 − 2x − 8
ˆ
2
x : 9=A+B+C dx =
x3 − 4x
x1 : − 2 = 2B − 2C 2 3 4
ˆ ˆ ˆ
= dx + dx + dx =
0
x : − 8 = −4A x x − 2 x + 2
= 2 ln |x| + 3 ln |x − 2| + 4 ln |x + 2| + D
Эта запись означает, что число 9 является коэф-
фициентом перед x2 слева, и оно совпадает с чис- (D – постоянная интегрирования).
лом A+ B + C, которое является коэффициентом
⋄ 7.1.50 (случай повторяющихся множителей
перед x2 справа, и т.д. Мы получаем линейную
первой степени). Рассмотрим интеграл
систему, решая которую находим числа A, B, C:
3x + 2
ˆ
dx
A + B + C = 9
A + B + C = 9 x(x + 1)3
2B − 2C = −2 ⇔ B − C = −1 ⇔
Знаменатель дроби уже разложен на множители:
−4A = −8 A=2
x(x + 1)3
2 + B + C = 9 B + C = 7
⇔ B − C = −1 ⇔ B − C = −1 ⇔ В соответствии с первым правилом, в разложе-
A=2 A=2 нии нашей (правильной) дроби в сумму простей-
ших дробей должны присутствовать следующие
B + C = 7
B + C = 7 слагаемые:
⇔ 2B = 6 ⇔ B=3 ⇔
A B C D
A=2 A=2 , , ,
x x+1 (x + 1) 2 (x + 1)3
3 + C = 7
C = 4
⇔ B=3 ⇔ B=3 Значит,
A=2 A=2 3x + 2 A B C D
3
= + + 2
+
x(x + 1) x x + 1 (x + 1) (x + 1)3
Мы нашли коэффициенты A, B, C методом
неопределенных коэффициентов. Теперь пока- Теперь необходимо найти коэффициенты
жем, как их можно было найти по-другому, а A, B, C, D. Для этого приведем правую часть
именно методом частных значений. к общему знаменателю
Еще раз рассмотрим равенство (7.1.49):
3x + 2
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2) =
x(x + 1)3
§ 1. Неопределенный интеграл 413
Таким образом, x = 1 : 1 = 2B
x3 : 1 = A + C
A=2
B = −2 x2 : 0 = −A + B − 2C + D
C = −2 x0 : 2 = −A + B + D
D=1
Получается система
Значит,
2B = 1
A=0
3x + 2 2 2 2 1
A + C = 1
B = 1
= − − + 2
x(x + 1)3 x x + 1 (x + 1)2 (x + 1)3 ⇔ ... ⇔
−A + B − 2C + D = 0
C = 1
и теперь можно вычислять наш интеграл: −A + B + D = 2 D = 23
3x + 2 2 2
ˆ ˆ ˆ
d x = d x − d x− Значит,
x(x + 1) 3 x x+1
2 1 x3 − 2x + 2 1 2x + 3
ˆ ˆ
− dx + dx = = +
(x + 1) 2 (x + 1)3 (x − 1)2 (x2 + 1) 2(x − 1)2 2(x2 + 1)
2 1 и теперь можно вычислять наш интеграл:
= 2 ln |x| − 2 ln |x + 1| + − +E
x + 1 2(x + 1)2
x3 − 2x + 2
ˆ
(E – постоянная интегрирования). dx =
(x − 1)2 (x2 + 1)
⋄ 7.1.51 (случай неповторяющихся множителей ˆ
1
ˆ
2x + 3
второй степени). Рассмотрим интеграл = 2
d x + dx =
2(x − 1) 2(x2 + 1)
1 2x 3
ˆ ˆ
x3 − 2x + 2
ˆ
dx =− + 2
d x+ 2
dx =
(x − 1)2 (x2 + 1) 2(x − 1) 2(x + 1) 2(x + 1)
1 d(x2 + 1) 3 dx
ˆ ˆ
Знаменатель дроби уже разложен на множители: =− + 2
+ 2
=
2(x − 1) 2(x + 1) 2 x +1
(x − 1)2 (x2 + 1) 1 1 3
=− + ln(x2 + 1) + arctg x + E
2(x − 1) 2 2
В соответствии с первым и вторым правилами,
в разложении нашей (правильной) дроби в сум- (E – постоянная интегрирования).
му простейших дробей должны присутствовать
следующие слагаемые: ⋄ 7.1.52 (еще один случай неповторяющихся
множителей второй степени). Рассмотрим инте-
A B Cx + D грал
, ,
2x2 − 3x + 1
ˆ
x−1 (x − 1)2 2
x +1
dx
x3 + 1
Значит,
Разложим знаменатель на множители:
x3 − 2x + 2 A B Cx + D
= + + 2 x3 + 1 = (x + 1)(x2 − x + 1)
(x − 1)2 (x2 + 1) x − 1 (x − 1)2 x +1
414 Глава 7. ИНТЕГРАЛ
Эти дроби совпадают, если у них совпадают чис- В соответствии с первым и вторым правилами,
лители: в разложении нашей (правильной) дроби в сум-
му простейших дробей должны присутствовать
2x2 − 3x + 1 = A(x2 − x + 1) + (Bx + C)(x + 1) следующие слагаемые:
то применима подстановка
t = tg x2 ˆ 2dt
dx
ˆ
2t 1+t2
= sin x = 1+t2 = 2t = cos x = t
sin x
dx = 1+t2dt
2
1+t2 sin x = √1 − t2 ,
ˆ
dt (7.1.65)
= = ln |t| + C = квозвращаемся x = arccos t,
переменной x =
t dt
dx = − √1−t
x 2
= ln tg +C
2 — если функция R(sin x, cos x) нечетная относи-
⋄ 7.1.59. тельно косинуса, то есть
1
ˆ
⋄ 7.1.63. = (cos(4x − 6x) − cos(4x + 6x)) d x =
2
подынтегральная 1 1
ˆ ˆ
3 = cos 2x d x − cos 10x d x =
cos x функция нечетна
ˆ
относительно 2 2
dx = cos x =
sin4 x поэтому используем
1
ˆ
1
ˆ
подстановку sin x = t = cos 2x d(2x) − cos 10x d(10x) =
√ 3 4 20
1 − t2 dt 1 − t2
ˆ ˆ
= √ = dt = 1 1
t4 1 − t2 t4 = sin 2x − sin 10x + C
4 20
1 1 1 1
ˆ
= − 2 dt = − 3 + + C = ⊲⊲ 7.1.67. Найдите интегралы
t 4 t 3t t 1) ´ cos x3 sin x4 d x
´
1 1
возвращаемся
= к переменной x = − + +C 2) ´ cos 4x cos 7x d x
3 sin3 x sin x 3) ´ sin x3 sin x2 d x
⋄ 7.1.64. 4) ´ sin 3x cos 10x d x
5) sin 3x sin2 x d x
dx
ˆ
2 = Интегрирование функций sinα x·cosβ x Для
sin x − 4 sin x cos x + 5 cos2 x
интегрирования таких произведений нужно за-
подынтегральная
функция четна помнить следующие правила:
= относительно sin x и cos x =
поэтому используем — если α – нечетное положительное целое число
подстановку tg x = t
(то есть α ∈ 2N − 1), то делается подстановка
ˆ dt
= 2
1+t2
2 =
cos x = t,
√ t
sin x = √1 − t2 ,
t 1 1
1+t2
− 4 · 1+t2 · 1+t2 + 5
√ √ √
1+t2
ˆ
dt
ˆ
dt (7.1.68)
= = =
x = arccos t,
t2 − 4t + 5 (t − 2)2 + 1
dt
d x = − √1−t 2
t−2=y dy
ˆ
= = =
t=y+2 y 2 + 1 y=t−2 — если β – нечетное положительное целое число
(то есть β ∈ 2N − 1), то делается подстановка
= arctg y + C = arctg(t − 2) + C =
y=t−2
sin x = t,
возвращаемся
= к переменной x = arctg(tg x − 2) + C
√
cos x = 1 − t2 ,
(7.1.69)
⊲⊲ 7.1.65. Найдите интегралы
x = arcsin t,
dt
1) ´ cos4 x sin3 x d x d x = √1−t
´
2
5 2
2) cos x sin x d x
´ sin3 x — если α + β – четное отрицательное целое чис-
3) 1+cos 2 dx
´ cos3 xx ло (α + β ∈ −2N), то делается подстановка
4) 4 sin2 x−1 d x
dx
tg x = t,
´
5) 3 cos2 x+4 sin2x
dx t
´
6) 19 sin2 x−8 sin x cos x−3 sin x = √1+t2 ,
1
cos x = √1+t , (7.1.70)
2
Интегрирование тригонометрических про-
x = arctg t,
изведений dt
dx = 1+t 2
3 5 3 11
= t 3 − t 3 + C = квозвращаемся Интегрирование некоторых алгебраиче-
переменной x =
5 11 ских иррациональностей.
3 5 3 11
√
= (sin x) 3 − (sin x) 3 + C = Интегрирование функций R(x, n x), n ∈ N.
5 11
3p3 3 p 3 Если R(x, y) – рациональная функция
√ от пере-
= sin5 x − sin11 x + C менных x и y, то функция R(x, n x) интегриру-
5 11
ется заменой
⋄ 7.1.69. √
t= nx (x = tn , d x = ntn−1 dt)
поскольку
ˆ
dx α + β = − 72 − 12 = ⋄ 7.1.72.
√ = = −4 ∈ −2N, =
cos7 x sin x подстановка √ √ 3
x ( 6 x)
ˆ ˆ
tg x = t
√3
d x = √ 4 dx =
ˆ dt ˆ dt x − x2 x − ( 6 x)
1+t2 1+t2
= r = 2 √ = t= 6x
√
7 t3
ˆ
√ 1 √ t
1
1+t2 t = x=t 6
= 6t5 dt =
1+t2 1+t2 dx = 6t5 dt t6 − t4
ˆ
1 + t2 t4 делим
ˆ ˆ
1 3
= √ dt = t− 2 + t 2 d t = =6 d t = многочлены =
t t2 − 1 с остатком
2 5 1
ˆ
1
= 2t 2 + t 2 + C = квозвращаемся
переменной x = =6 2
t +1+ 2 dt =
5 q t −1
√ 2
1
ˆ
= 2 tg x + tg5 x + C =6 2
t +1+ dt =
5 (t − 1)(t + 1)
раскладываем
⋄ 7.1.70. = на простейшие =
дроби
поскольку
ˆ
2 1 1 1 1
α = 2 ∈ 2(N − 1), =6 t +1+ − dt =
ˆ
sin2 x cos4 x d x = β = 4 ∈ 2(N − 1), = 2t−1 2t+1
применяем формулы
(7.1.71) = 2t3 + 6t + 3 ln |t − 1| − 3 ln |t + 1| + C =
2 √ 3 √
1 − cos 2x 1 + cos 2x = квозвращаемся
ˆ 6
переменной x = 2 x + 6 6 x+
= · dx =
2 2 √ √
+ 3 ln 6 x − 1 − 3 ln 6 x + 1 + C
1 − cos 2x 1 + 2 cos 2x + cos2 2x
ˆ
= · dx =
2 4 ⊲⊲ 7.1.73. Найдите интегралы
1
ˆ
√ √
= (1 + cos 2x − cos2 2x − cos3 2x) d x = 1)
´
√x
dx 3)
´ x
√ dx
8 1+ x 1+ 4 x
ˆ ´ dx
=
1
1 + cos 2x −
1 + cos 4x
−
1 + cos 4x
= 2) √ √
8 2 2
cos 2x d x (1+ 3 x)· x
1
ˆ q
= (1 + cos 2x − cos 4x − cos 4x cos 2x) d x = Интегрирование функций R x, n ax+b
16 cx+d , n ∈
N. Интегралы такого вида вычисляются заме-
применяем
= формулу (4.1.84) = ной
ˆ
r
1 1 ax + b
= 1 + cos 2x − cos 4x − (cos 2x + cos 6x) d x = t= n
16 2 cx + d
1
ˆ
= (2 + cos 2x − 2 cos 4x − cos 6x) d x = ⋄ 7.1.74.
32
q
1 1 1 1 r t= 1−x
= 2x + sin 2x − sin 4x − sin 6x + C = 1 1−x
ˆ 1+x
2
32 2 2 6 2
· dx = x = 1−t
1+t2
=
(1 − x) 1+x 4tdt
dx = − (1+t2 )2
x sin 2x sin 4x sin 6x
= + − − +C
16 64 64 192 1 4tdt
ˆ
=− 2 · t =
1−t 2 (1 + t2 )2
⊲⊲ 7.1.71. Найдите интегралы 1 − 1+t 2
(1 + t2 )2 4t2 dt dt 1
ˆ ˆ
1)
´
sin5 x cos4 x d x
´
6) √ dx =− 4 2 2
= − 2
= +C =
4
´ sin 3 x cos5 x 4t (1 + t ) t t
3
sin 5 x cos5 x d x 7) ´ cos2 x d x r1 + x
´
2)
´ sin3 x 8) ´ cos4 x d x = квозвращаемся
переменной x = +C
3) √3 dx 1−x
cos4 x 9) ´sin4 x d x
dx
´
4) sin3 x cos x 10) ´ sin4 x cos2 x d x ⊲⊲ 7.1.75. Найдите интегралы
dx
´ √1+x
11) cos6 x d x
´
5) √
sin x cos3 x
1) x dx
420 Глава 7. ИНТЕГРАЛ
√
3
p
3x+4
´
2) √
1+ 3 3x+4
dx R x, x2 + a2 ,
q
1 1+x
´
3) (1−x)(1+x) 2 · 1−x dx p
´ q
3 1−x dx R x, x2 − a2
4) 1+x · (1+x)2
3 cos tdt
ˆ
dx 1 dx = =
ˆ ˆ
2
√ =√ q = (9 sin t + 16)3 cos t
5 − 2x − 3x 2 3 5 2 2
3 − 3x − x применяем частную
подстановку (7.1.67)
dt
ˆ
1
1 dx t= 3 +x
ˆ
tg t = s
= √ q = x = t − 13 = = 2 = sin t = √ s 2
=
3 16 1
2 dx = dt
9 sin t + 16 1+s
9 − 3 +x
ds
d t = 1+s 2
1 dt 1 3t ds
ˆ
ds
ˆ ˆ
=√ q = √ arcsin + C = =
1+s2
2 = =
3 4 2 2 3 4 9s 2 + 16(1 + s2 )
3 −t 9 √1+s s
+ 16
2
1 1 + 3x
= квозвращаемся ds
ˆ
переменной x = √ arcsin +C = =
3 4 25s2 + 16
⊲⊲ 7.1.78. Найдите интегралы 1 ds 1 5s
ˆ
= = arctg +C =
25 2 4 2 20 4
s + 5
1) √5x2dx dx
´ ´
2) √2+3x−2x
+3x+2 2
1 5 tg t
= квозвращаемся
переменной t = arctg +C =
√ 20 4
Интегрирование функций R x, ax2 + bx + c 1 5 tg arcsin x3
возвращаемся
Выделением полного квадрата √ и последующей
= к переменной x = arctg +C =
20 4
заменой функция R x, ax2 + bx + c приводит- x
ся к виду 5q 3 x 2
p 1 1−( 3 ) 1 5x
R x, a2 − x2 , = arctg +C = arctg √ +C
20 4 20 4 9 − x2
§ 1. Неопределенный интеграл 421
x2 − x + 1 x = ctg t dx x2
ˆ ´ ´
√ d x = t = arcctg x = 1) 3 4) 3 dx
(9+x2 ) 2 (x2 +5) 2
(x2 + 1) x2 + 1 dx = − sindt
2t
dx dx
√ √
´ ´
2) 5)
ctg2 t − ctg t + 1 dt
ˆ
(5−x2 )3 (1+x+x2 )3
=− p · 2 = √ √
2 2 x2 −4
(ctg t + 1) ctg t + 1 sin t 1+x2
´ ´
3) x3 dx 6) 2+x2 d x
ctg2 t − ctg t + 1 dt
ˆ
dx
´
=− · 7) √ dx
1 1 2 = (x2 +4) 4x2 +1
2 ·
sin x sin x sin t
ˆ
= − (ctg2 t − ctg t + 1) sin x d t = Интегрирование функций xm · (a + bxn )p ,
m, n, p ∈ Q. Интегралы от таких функций вы-
заметим, что
= ctg2 t + 1 = 12 = ражаются через элементарные функции только
ˆ
sin t
если одно из чисел
1
=− − ctg t sin x d t = m+1 m+1
sin2 t p, , +p
ˆ n n
1
=− − cos t d t = является целым. В соответствии с этим следует
sin t
употреблять три различных подстановки:
dt первый интеграл
ˆ ˆ
=− + cos t d t = мы уже вычисляли = — если p целое отрицательное (p ∈ −N) и
sin t в примере 7.1.58
m = qs , n = rs , то используется подста-
t
= − ln tg + sin t + C = квозвращаемся переменной x =
новка
2 x = ts
arcctg x
= − ln tg + sin arcctg x + C = — если m+1
n целое ( m+1
n ∈ Z), то исполь-
2
зуется подстановка
применяем
= тригонометрические =
тождества a + bxn = t
1 p
= √ + ln x + 1 + x2 + C — если m+1 m+1
n + p целое ( n + p ∈ Z), то
1+x2
используется подстановка
⋄ 7.1.81.
ax−n + b = t
1
dx x = cos t
ˆ
√ = t = arccos 1
x = ⋄ 7.1.83.
(x2 + 2) x2 − 1 sin t
dx = cos 2 t dt ˆ
sin t 3
cos2 t d t cos t d t x3 (1 − x2 )− 2 d x =
ˆ ˆ
= q = =
1
+ 2 1
− 1 1 + 2 cos2 t
2
cos t 2
cos t здесь m = 3, n = 2, p = − 23
и m+1
n =2∈Z
cos t d t ds
ˆ ˆ
= = sin t = s
= = = поэтому применяем =
2 ds = cos tdt подстановку
3ˆ− 2 sin t 3 − 2s2 t = 1 − x2 , xdx = − 12 dt
1 1
применяем
1 1
ˆ ˆ
= q d s = формулу (7.1.44) = − 32 3 1
2 3
2 =− (1 − t)t dt = − (t− 2 − t− 2 ) d t =
− s2 2 2
2
q − 12 1 возвращаемся
3 = t + t + C = к переменной x =
2
1 2 +s
= √ ln q + C = квозвращаемся p
переменной t = 1
2 6 3
− s =√ + 1 − x2 + C
2 1 − x2
q
1
3
2 + sin t
⋄ 7.1.84.
= √ ln q + C = квозвращаемся
переменной x =
2 6 3
− sin t здесь m = 1, n = 4, p = 1
2
2 и m+1 +p=1∈Z
q ˆ p n
поэтому применяем
3 1 x 1 + x4 d x = =
2 + sin arccos x
подстановку
1 1
= √ ln q +C = t = x−4 + 1, x = (t − 1)− 4
2 6 3 1 5
2 − sin arccos x 4 dx = − 1 (t − 1)− 4 dt
q q q
1
ˆ
− 41 1 5
3
+ 1 − x12 =− (t − 1) 1 + (t − 1)− 4 ·4 (t − 1)− 4 dt =
1 2 4
= √ ln q q +C =
1 3p
ˆ
2 6 3
− 1 − 12
2 x =− (t − 1)− 2 1 + (t − 1)−1 d t =
√ √ √ 4
1 x 3 + 2 x2 − 1 √
1 t
ˆ
= √ ln √ √ √ +C =− − 32
(t − 1) √ dt =
2 6 x 3 − 2 x2 − 1 4 t−1
422 Глава 7. ИНТЕГРАЛ
√
1 t возвращаемся
ˆ
=− − 23
(t − 1) √ dt = = =
к переменной x
4 t−1 √ √
√ √ 1 x−4 + 1 + 1 x−4 + 1
1 t y= t
ˆ
= ln √ + +C =
=− dt = t = y2 = 8 x−4 + 1 − 1 4x−4
4 (t − 1)2 dt = 2ydy
√
1 y 1 y2 1 1 + x4 + x2 x2 p
ˆ ˆ
=− 2 2
2ydy = − dy = = ln √ + 1 + x4 + C
4 (y − 1) 2 (y − 1)2
2 8 1+x −x4 2 4
= раскладываем дробь
на простейшие =
1
ˆ 1 1 1 1
! ⊲⊲ 7.1.85. Найдите интегралы
4 4 4 4
=− + − + dy =
2 y−1 (y − 1)2 y+1 (y + 1)2
1 1 1 1 √
x
r 3
= ln |y − 1| − + ln |y + 1| + +C =
´
8 8(y − 1) 8 8(y + 1) 1) √ 2 dx ´ 4 1
(1+ 3 x) 5) 1 + x2 dx
1 y+1 y 2
x√5 (1 + x2 ) 3
´
= ln
8 y−1
+ 2
4(y − 1)
+C = 2)
√
dx ´ √2− √
3 x
√ √ 3)
´ 4+ 3 x
√ dx 6) √
3
x
dx
1 t+1 t
3 2
´ √ 3 √ p
x
= квозвращаемся = ln √ + +C = √ dx
´
переменной t
3
4) 3 x· 1 + 3 x2 d x 7) dx
8 t − 1 4(t − 1) x2 3
(1+x3 )2
§2 Определенный интеграл
Определенный интеграл функции f на отрезке [a; b] есть величина, геометрический смысл которой
– площадь криволинейной трапеции, ограничиваемой графиком функции f (при условии, что f
неотрицательна на [a; b]):
Точный смысл этих слов вряд ли может быть сейчас понятен читателю, поскольку в школьном
курсе геометрии не объясняется, что такое площадь фигуры (мы же даем соответствующие строгие
определения лишь в главе 15). Но всякий раз, когда вводится новое определение, полезно, чтобы
слушатель держал в голове какую-то геометрическую картинку, упрощающую понимание соот-
ветствующих формальных определений и математических результатов. В случае с определенным
интегралом такой картинкой, несомненно, будет площадь криволинейной трапеции (понимаемая
пока на интуитивном уровне).
В этой главе мы даем формальное определение этому новому понятию, приводим способ его
вычисления и описываем некоторые приложения.
Понятно, что у любого отрезка имеется много всяких разбиений. Поэтому можно рассматривать
последовательности разбиений.
diam τ (n) −→ 0
n→∞
называется измельчающейся.
n
⊲ 7.2.4. Проверьте, будут ли следующие после- 2) τ (n) = 0; 21n ; 22n ; ...; 2in ; ...; 2 2−1
n ;1
k
X
f (ξi ) · ∆xi (где ∆xi = xi − xi−1 )
i=1
424 Глава 7. ИНТЕГРАЛ
Представим теперь, что разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] меняются, становясь все более
мелкими. Тогда площадь ступенчатой фигуры должна приближаться к числу, которое естественно
считать "площадью криволинейной трапеции о которой мы говорили в начале этой главы.
Это число называется определенным интегралом функции f на отрезке [a; b]. Более точное опреде-
ление выглядит так:
• Число I называется определенным интегралом функции f на отрезке [a; b], и обозначается
ˆ
I= f (x) d x
[a,b]
[xi−1 ; xi ]
=
(7.2.74)
=
b−a
k z }| {
z}|{
X 1
= lim C · (b − a) = C · (b − a) f (ξi ) ·∆xi − =
diam τ →0
i=1
2
k
X k
X
Запишем вывод: xi−1 + xi
= ξi · ∆xi − · ∆xi =
i=1 i=1
2
k
ˆ
C d x = C · (b − a) (7.2.73) X xi−1 + xi
[a,b] = ξi − · ∆xi =
i=1
2
k
X
⋄ 7.2.6. Интеграл от линейной функции. 2ξi − xi−1 − xi
= · ∆xi =
Рассмотрим теперь функцию f (x) = x и вычис- i=1
2
лим определенный интеграл от нее на отрезке k
X (ξi − xi−1 ) + (ξi − xi )
[0; 1]. Соответствующая картинка выглядит так: = · ∆xi 6
i=1
2
6 (2.2.262) 6
k
X (ξi − xi−1 ) + (ξi − xi )
6 · ∆xi =
2 |{z}
i=1
6
0
k
X 1
= · (ξi − xi−1 ) + (ξi − xi ) · ∆xi 6
i=1
2
Криволинейная трапеция в данном случае
представляет собой треугольник, поэтому отве- 6 (3.1.10) 6
том должна быть площадь треугольника S = Xk
1
1 1 6 · |ξi − xi−1 | + |ξi − xi | · ∆xi 6
2 · 1 · 1 = 2 (половина произведения основания на 2 | {z } | {z }
высоту). i=1
>
>
∆xi , ∆xi ,
Чтобы проверить это, возьмем какое-нибудь поскольку поскольку
разбиение τ = {x0 ; x1 ; ...; xk } отрезка [0; 1] и ξi ∈ [xi−1 ; xi ] ξi ∈ [xi−1 ; xi ]
какие-нибудь точки k
X k
X
∆xi + ∆xi
6 · ∆xi = ∆x ·∆xi 6
2 |{z}i
i=1 i=1
ξi ∈ [xi−1 ; xi ]
>
diam τ
k
X
Заметим, что тогда площадь нашего треугольни- 6 diam τ · ∆xi =
ка S = 21 можно представить, как сумму площа- i=1
426 Глава 7. ИНТЕГРАЛ
k
X Точки ξi ∈ [xi−1 ; xi ] можно выбирать по-
= diam τ · ∆xi = diam τ разному, но нас будут интересовать два способа:
i=1
| {z } – первый способ заключается в том, чтобы
=
1 в каждом отрезке [xi−1 ; xi ] выбрать какую-
нибудь рациональную точку ξi . Тогда полу-
Мы получили неравенство, справедливое для чится D(ξi ) = 1, и интегральные суммы ока-
любого разбиения τ = {x0 ; x1 ; ...; xk } отрезка жутся равны b − a:
[0; 1] и любых точек ξi ∈ [xi−1 ; xi ]:
k
X k
X
k
X 1 D(ξi ) · ∆xi = 1 · ∆xi = b − a
f (ξi ) · ∆xi − 6 diam τ
i=1
2 i=1 i=1
(n) (n)
⋄ 7.2.7. Интеграл от функции Дирихле. По- D(ξi ) · ∆xi = 0 −→ 0
n→∞
i=1
кажем, что определенный интеграл не всегда су-
ществует. Классическим примером здесь являет- Спросим себя теперь: существует ли единое чис-
ся функция Дирихле, которую мы определили ло I, к которому бы стремились все интеграль-
выше формулой (3.1.4): ные суммы, независимо от того, какая выбрана
( измельчающаяся последовательность разбиений
1, если x – рациональное число (n)
D(x) = τ (n) = {x0 ; x1 ; ...; xk } и какие выбраны точки
0, если x – иррациональное число (n) (n) (n)
ξi ∈ [xi−1 ; xi ]? Понятно,´ что такого числа I
Попробуем понять, что будет интегралом этой (то есть интеграла [a,b] D(x) d x) не существует.
функции на произвольном отрезке [a; b]. Выбе- Значит, мы можем сделать
рем какое-нибудь разбиение τ = {x0 ; x1 ; ...; xk } Вывод: функция Дирихле не интегрируема
отрезка [a; b]. ни на каком отрезке [a; b].
Суммы Дарбу. Пусть функция f определена и ограничена на отрезке [a; b] и пусть τ = {x0 ; x1 ; ...; xk }
– какое-нибудь его разбиение. На каждом отрезке [xi−1 ; xi ] найдем нижнюю и верхнюю грань функ-
ции f
mi = inf f (ξ), Mi = sup f (ξ)
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
и обозначим
k
X k
X
sτ = mi · ∆xi , Sτ = Mi · ∆xi
i=1 i=1
τ ⊆σ
то
s τ 6 s σ 6 Sσ 6 Sτ (7.2.76)
(то есть, при добавлении к данному разбиению τ новых точек нижняя сумма Дарбу
увеличивается, а верхняя уменьшается).
0
2 . Для любых двух разбиений σ и τ данного отрезка выполняется неравенство
s σ 6 Sτ (7.2.77)
причем нижняя сумма Дарбу есть нижняя грань всех интегральных сумм при данном
разбиении, а верхняя сумма Дарбу – верхняя грань:
k
X k
X
sτ = inf f (ξi ) · ∆xi , Sτ = sup f (ξi ) · ∆xi (7.2.79)
ξi ∈[xi−1 ;xi ] ξi ∈[xi−1 ;xi ] i=1
i=1
40 . Если функция f интегрируема на [a, b], то для произвольного разбиения τ отрезка [a, b]
интеграл от f лежит между нижней и верхней суммами Дарбу:
ˆ
sτ 6 f (x) d x 6 Sτ (7.2.80)
[a,b]
x∗ ∈ [xj−1 ; xj ] (7.2.81)
и поэтому
428 Глава 7. ИНТЕГРАЛ
k
X X X
sτ = mi · ∆xi = mj · ∆xj + mi · ∆xi = mj · (xj − xj−1 ) + mi · ∆xi = (7.2.81) =
i=1 i6=j i6=j
X
= inf f (ξ) ·(xj − x∗ ) + inf f (ξ) ·(x∗ − xj−1 ) + mi · ∆xi 6
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ]
| {z } | {z } i6=j
>
>
inf ξ∈[x∗ ,xj ] f (ξ), inf ξ∈[xj−1 ,x∗ ] f (ξ),
потому что потому что
[xj−1 ; xj ] ⊇ [x∗ , xj ] [xj−1 ; xj ] ⊇ [xj−1 , x∗ ]
X
6 inf
∗
f (ξ) · (xj − x∗ ) + inf f (ξ) · (x∗ − xj−1 ) + mi · ∆xi = sσ
ξ∈[x ,xj ] ξ∈[xj−1 ,x∗ ]
i6=j
k
X X X
Sτ = Mi · ∆xi = Mj · ∆xj + Mi · ∆xi = Mj · (xj − xj−1 ) + Mi · ∆xi = (7.2.81) =
i=1 i6=j i6=j
X
= sup f (ξ) ·(xj − x∗ ) + sup f (ξ) ·(x∗ − xj−1 ) + Mi · ∆xi >
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ] i6=j
| {z } | {z }
6
σ ⊆ ρ, τ ⊆ρ
Поэтому, чтобы, например, доказать первое равенство в (7.2.79), достаточно доказать обратное
неравенство:
Xk
sτ > inf f (ξi ) · ∆xi (7.2.82)
ξi ∈[xi−1 ;xi ]
i=1
Для этого (зафиксировав разбиение τ = {x0 , ..., xk }) для каждого i = 1, ..., k выберем последова-
(n)
тельность точек ξi ∈ [xi−1 ; xi ] такую, что
(n)
f (ξi ) −→ inf f (ξi )
n→∞ ξi ∈[xi−1 ;xi ]
k
X k
X k
X
(n) (n)
inf f (ξi ) · ∆xi 6 inf f ξi · ∆xi = lim f ξi · ∆xi =
ξi ∈[xi−1 ;xi ] n→∞ n→∞
i=1 i=1 i=1
k
X k
X
(n)
= lim f ξi · ∆xi = inf f (ξi ) · ∆xi = sτ
n→∞ ξi ∈[xi−1 ;xi ]
i=1 i=1
[a,b]
f (x) d x
называется нижним интегралом Дарбу, а нижняя грань всех верхних сумм Дарбу
I ∗ = inf Sτ
τ
называется верхним интегралом Дарбу. Из неравенства (7.2.77) следует, что для любых
двух разбиений σ и τ данного отрезка выполняются неравенства
sσ 6 I∗ 6 I ∗ 6 Sτ (7.2.83)
Если вдобавок функция f интегрируема на [a, b], то эту цепочку можно дополнить так:
ˆ
sσ 6 I∗ 6 f (x) d x 6 I ∗ 6 Sτ (7.2.84)
[a,b]
Критерий интегрируемости.
Теорема 7.2.1 (критерий интегрируемости). 7 Ограниченная на отрезке [a; b] функция f тогда и
только тогда интегрируема на [a; b], когда для всякой измельчающейся последовательности τ (n)
разбиений отрезка [a; b]
diam τ (n) −→ 0
n→∞
соответствующие верхняя и нижняя суммы Дарбу стремятся друг к другу:
Sτ (n) − sτ (n) −→ 0 (7.2.85)
n→∞
В этом случае (для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b])
суммы Дарбу необходимо стремятся к интегралу от f на [a, b]:
ˆ
Sτ (n) −→ f (x) d x ←− sτ (n) (7.2.86)
n→∞ [a,b] ∞←n
7 Эта теорема используется ниже при доказательстве теорем 7.2.2 и 7.2.3.
430 Глава 7. ИНТЕГРАЛ
Доказательство. 1. Необходимость. Пусть f интегрируема на [a; b], покажем что тогда выполняется
(7.2.85). Возьмем какую-нибудь измельчающуюся последовательность разбиений τ (n) отрезка [a; b].
Из левой формулы (7.2.79)
Xk
sτ = inf f (ξi ) · ∆xi ,
ξi ∈[xi−1 ;xi ]
i=1
(n)
следует, что для всякого n можно выбрать точки ξi ∈ [xi−1 ; xi ] так, чтобы
Xk 1
(n)
sτ − f ξi · ∆xi 6
i=1
n
Тогда мы получим
k
X
(n)
sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1
Теперь вспомним, что, по предположению, функция f интегрируема на [a; b], то есть существует
такое число I, что
Xk
(n)
f ξi · ∆xi −→ I (7.2.87)
n→∞
i=1
(n)
для всякой измельчающейся последовательности τ (n) и любой системы точек ξi ∈ [xi−1 ; xi ]. В
частности, это должно быть верно для нашей последовательности τ (n) и выбранной нами системы
(n)
точек ξi ∈ [xi−1 ; xi ]. Отсюда
!
k
X k
X
(n) (n)
sτ (n) = sτ (n) − f ξi · ∆xi + f ξi · ∆xi −→ 0 + I = I
n→∞
i=1 i=1
(n)
следует, что для всякого n можно выбрать (новые) точки ξi ∈ [xi−1 ; xi ] так, чтобы
Xk 1
(n)
Sτ − f ξi · ∆xi 6
i=1
n
Тогда мы получим
k
X
(n)
Sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1
sτ (n) −→ I, Sτ (n) −→ I
n→∞ n→∞
Sτ (n) − sτ (n) −→ 0
n→∞
I∗ = I ∗ ,
0 6 I ∗ − I∗ 6 Sτ (n) − sτ (n) −→ 0.
n→∞
Теперь положим
I = I∗ = I ∗
и покажем, что I является интегралом функции f на отрезке [a; b].
Для этого опять возьмем измельчающуюся последовательность τ (n) разбиений отрезка [a; b]. Из
неравенств (7.2.83) получаем две цепочки:
(n)
Теперь из формулы (7.2.78) при произвольном выборе точек ξi ∈ [xi−1 ; xi ] мы получаем
k
X (n) (n)
sτ (n) 6 f (ξi ) · ∆xi 6 Sτ (n)
| {z } | {z }
i=1
n n
↓ ↓ ↓ ↓
∞ ∞
I I
Это верно для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b] и любой
(n) (n) (n)
системы выделенных точек ξi ∈ [xi−1 ; xi ], значит I действительно является интегралом для f
на [a; b]. Это нам и нужно было доказать.
sup f (x) = +∞
x∈[a;b]
Поскольку f неограничена на отрезке [a; b], она должна быть неограничена на каком-нибудь
отрезке [xi−1 ; xi ]. То есть, существует индекс j такой что
Мы получили, что для всякого разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] можно выбрать числа
ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M .
Значит, если взять измельчающуюся последовательность разбиений τ (n) , то для нее тоже можно
(n) (n) (n)
выбрать числа ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M :
(n)
k
X
f (ξi ) · ∆xi > M
i=1
Отсюда следует, что интеграл (то есть предел таких интегральных сумм), если он существует, не
может быть меньше M :
(n)
k
X
I = lim f (ξi ) · ∆xi > M
n→∞
i=1
Но число M мы выбирали произвольным: получается, что число I должно быть больше какого
хочешь другого числа M , а это абсурд.
Теорема 7.2.3. Если функция f (определена и) монотонна на отрезке [a; b], то она интегрируема
на нем.
Доказательство. Пусть функция f (определена и) монотонна на отрезке [a; b], например, неубывает
на нем:
s 6 t =⇒ f (s) 6 f (t)
покажем, что тогда f интегрируема на [a; b]. Для этого возьмем какое-нибудь разбиение τ отрезка
[a; b] и покажем, что суммы Дарбу удовлетворяют неравенству:
Действительно,
k
X k
X k
X k
X
Sτ −sτ = sup f (ξ) ·∆xi − inf f (ξ) ·∆xi = f (xi )·∆xi − f (xi−1 )·∆xi =
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1
| {z } i=1 | {z } i=1 i=1
k k
f xi , f xi−1 ,
поскольку f поскольку f
монотонно неубывает монотонно неубывает
k
X k
X k
X
= (f (xi ) − f (xi−1 )) · ∆xi 6 (f (xi ) − f (xi−1 )) · diam
| {z τ} = diam τ · (f (xi ) − f (xi−1 )) =
|{z}
i=1 i=1 не зависит i=1
>
от индекса i,
diam τ поэтому можно
вынести за знак суммы
§ 2. Определенный интеграл 433
=
n ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ o
= diam τ · f (xk ) − f (xk−1 ) + f (xk−1 ) − f (xk−2 ) + ... +f (x2 ) − f (x1 ) + f (x1 ) − f (x0 ) =
| {z } | {z } | {z } | {z }
i=k i=k−1 i=2 i=1
= diam τ · {f (b) − f (a)}
Если теперь взять измельчающуюся последовательность разбиений τ (n) отрезка [a; b], то мы полу-
чим
0 6 Sτ (n) − sτ (n) 6 (7.2.89) 6 diam τ (n) · {f (b) − f (a)} −→ 0
n→∞
значит,
Sτ (n) − sτ (n) −→ 0
n→∞
Это верно для любой измельчающейся последовательности разбиений τ (n) , значит, по теореме 7.2.1,
f интегрируема на [a; b].
Теорема 7.2.4. Если функция f (определена и) непрерывна на отрезке [a; b], то она интегрируема
на нем.
Лемма 7.2.5. Если f – непрерывная функция на отрезке [a; b], то для любого разбиения τ отрезка
[a; b] существуют числа α, β ∈ [a; b], такие что расстояние между ними не превышает диаметра
разбиения τ
|α − β| 6 diam τ, (7.2.90)
а разность между верхней и нижней интегральными суммами Дарбу этого разбиения оценива-
ется неравенством:
Sτ − sτ 6 f (α) − f (β) · (b − a) (7.2.91)
f (η1 ) − f (θ1 ) , f (η2 ) − f (θ2 ) , ..., f (ηi ) − f (θi ) , ..., f (ηk ) − f (θk )
Обозначив теперь
α = ηj , β = θj
мы получим нужные числа: с одной стороны, поскольку α, β ∈ [xj−1 ; xj ], получается
|α − β| 6 ∆xj 6 ∆ τ
А, с другой стороны,
!
f (α) − f (β) = max f (ηi ) − f (θi ) = max sup f (x) − inf f (x) (7.2.94)
16i6k 16i6k x∈[xi−1 ;xi ] x∈[xi−1 ;xi ]
Поэтому
434 Глава 7. ИНТЕГРАЛ
k k k
" #
X X X
Sτ −sτ = sup f (ξ)·∆xi − inf f (ξ)·∆xi = sup f (ξ) − inf f (ξ) ·∆xi 6
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1 ξ∈[xi−1 ;xi ] i=1 i=1 ξ∈[xi−1 ;xi ]
| {z }
>
(7.2.94)
f (α) − f (β)
Xk h i h i k
X h i
6 f (α) − f (β) ·∆xi = f (α) − f (β) · ∆xi = f (α) − f (β) · (b − a)
i=1 | {z } i=1
не зависит
| {z }
от индекса i длина отрезка [a,b]
и h i
Sτ (n) − sτ (n) 6 f (α(n) ) − f (β (n) ) · (b − a)
Из первого условия следует, что последовательности α(n) и β (n) стремятся друг к другу:
α(n) − β (n) −→ 0
n→∞
Поэтому по теореме Кантора 3.3.10 (функция f непрерывна на [a; b], значит она должна быть
равномерно непрерывна на нем), получаем:
f (α(n) ) − f (β (n) ) −→ 0
n→∞
Это верно для любой измельчающейся последовательности разбиений τ (n) , значит, по теореме 7.2.1,
f интегрируема на [a; b].
20 . Аддитивность: пусть a < b < c и функция f интегрируема на отрезках [a; b] и [b; c],
тогда она интегрируема на отрезке [a; c], и при этом
ˆ ˆ ˆ
f (x) d x + f (x) d x = f (x) d x (7.2.96)
[a,b] [b,c] [a,c]
то ˆ ˆ
f (x) d x 6 g(x) d x (7.2.98)
[a,b] [a,b]
§ 2. Определенный интеграл 435
60 . Непрерывность: если функция f интегрируема на отрезке [a; b], то для всякой точки
c ∈ [a, b]
ˆ ˆ
f (x) d x −→ f (x) d x (7.2.101)
[a,y] y→c [a,c]
ˆ ˆ b
f (x) d x −→ f (x) d x (7.2.102)
[y,b] y→c c
70 . Теорема о среднем: если функция f непрерывна на отрезке [a; b], то найдется такая
точка ξ ∈ [a; b], что ˆ
f (x) d x = f (ξ) · (b − a) (7.2.103)
[a,b]
Для всякого разбиения τ = {x0 , ..., xk } отрезка [a; b] и любой системы выделенных точек ξi ∈
[xi−1 ; xi ] мы получим:
k
X k
X k
X
α · f (ξi ) + β · g (ξi ) · ∆xi = α · f (ξi ) · ∆xi +β · g (ξi ) · ∆xi −→ α·F +β·G
diam τ →0
i=1 i=1 i=1
| {z } | {z }
diam τ diam τ
↓ ↓ ↓ ↓
0 0
F F
Это нужно понимать так: если взять последовательность разбиений τ (n) , диаметры которых стре-
(n)
мятся к нулю, то какую ни выбирай систему выделенных точек ξi , интегральная сумма функции
436 Глава 7. ИНТЕГРАЛ
α·f +β ·g будет стремится к числу α·F +β ·G. То есть, функция α·f +β ·g получается интегрируемой,
и ˆ ˆ ˆ
α · f (x) + β · g(x) d x = α · F + β · G = α · f (x) d x + β · g(x) d x
[a,b] [a,b] [a,b]
2. Аддитивность. Пусть f интегрируема на отрезках [a; b] и [b; c]. Тогда по теореме 7.2.2, f огра-
ничена на отрезках [a; b] и [b; c], а значит и на отрезке [a; c]:
Возьмем разбиение τ = {x0 , ..., xk } отрезка [a; c]. Точка b попадет в какой-то полуинтервал (xj−1 , xj ]:
τ = {a = x0 < x1 < ... < xj−1 < b 6 xj < xj+1 < ... < xk = c}
интегральная сумма
на отрезке [a; c]
z }| {
X k j−1
X k
X
f (ξi ) · ∆xi = f (ξi ) · ∆xi + f (ξj ) · ∆xj + f (ξi ) · ∆xi =
i=1 i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) + f (ξj ) − f (b) · ∆xj + f (ξi ) · ∆xi =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · ∆xj + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · (xj − xj−1 ) + f (ξi ) · ∆xi + [f (ξj ) − f (b)] · ∆xj =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · (b − xj−1 ) + f (b) · (xj − b) + f (ξi ) · ∆xi + [f (ξj ) − f (b)] · ∆xj
i=1 i=j+1
| {z } | {z }
интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]
интегральная сумма
на отрезке [a; c] интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]
z }| z }| {
z
k
}| {
j−1
!{ k
X X X
f (ξi ) · ∆xi − f (ξi ) · ∆xi + f (b) · (b − xj−1 ) − f (b) · (xj − b) + f (ξi ) · ∆xi =
i=1 i=1 i=j+1
| {z } | {z }
diam τ
diam τ
↓ ↓
↓ ↓
0
0
A B
= f (ξj ) − f (b) · ∆xj 6 f (ξj ) + f (b) · ∆xj 6 2M · diam τ −→ 0
| {z } | {z } |{z} diam τ →0
>
>
>
M M diam τ
⇓
§ 2. Определенный интеграл 437
k
X
f (ξi ) · ∆xi −→ A+B
diam τ →0
i=1
Опять же, это нужно понимать так, что какую ни возьми последовательность разбиений τ (n) от-
(n)
резка [a, c], с диаметрами стремящимися к нулю, то при любом выборе выделенных точек ξi ,
интегральные суммы функции f на отрезке [a, c] будут стремиться к числу A + B. Это нам и нужно
было доказать.
3. Монотонность. Пусть функции f и g интегрируемы на отрезке [a; b], причем
Тогда для любых разбиений τ = {x0 , ..., xk } отрезка [a; c] и любых точек ξi ∈ [xi−1 ; xi ] мы получим
∀i f (ξi ) 6 g (ξi )
⇓
∀i f (ξi ) · ∆xi 6 g (ξi ) · ∆xi
⇓
ˆ k
X k
X ˆ
f (x) d x ←− f (ξi ) · ∆xi 6 g (ξi ) · ∆xi −→ g(x) d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1
⇓
ˆ ˆ
f (x) d x 6 g(x) d x
[a,b] [a,b]
Действительно:
k
!
X
Sτ (|f |) − sτ (|f |) = sup |f (η)| − inf |f (θ)| · ∆xi = (3.1.26) =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
!
k
X k
X
= sup |f (η)| + sup − |f (θ)| · ∆xi = sup |f (η)| − |f (θ)| · ∆xi 6
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
k
X k
X
6 (3.1.11) 6 sup |f (η) − f (θ)| · ∆xi = (3.1.29) = sup (f (η) − f (θ)) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
!
k
X
= sup f (η) + sup − f (θ) · ∆xi = (3.1.26) =
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
k
!
X
= sup f (η) − inf f (θ) · ∆xi = Sτ (f ) − sτ (f )
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
Если теперь функция f интегрируема на отрезке [a; b], то по критерию интегрируемости (теоре-
ма 7.2.1 этой главы), для любой измельчающейся последовательности τ (n) разбиений отрезка [a; b]
разность между верхними и нижними суммами Дарбу для функции f должна стремиться к нулю,
поэтому из (7.2.106) получаем:
откуда
Sτ (n) (|f |) − sτ (n) (|f |) −→ 0
n→∞
438 Глава 7. ИНТЕГРАЛ
То есть функция |f | тоже должна быть интегрируема на отрезке [a; b]. Нам остается доказать нера-
венство (7.2.99):
ˆ k
X k
X ˆ
f (x) d x ←− f (ξi ) · ∆xi 6 (2.2.262) 6 |f (ξi )| · ∆xi −→ |f (x)| d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1
⇓
ˆ ˆ
f (x) d x 6 |f (x)| d x
[a,b] [a,b]
5. Оценка сверху. Если функция f интегрируема на отрезке [a, b], то по теореме 7.2.2, она огра-
ничена. Обозначим C = supx∈[a,b] |f (x)|. Тогда
ˆ ˆ ˆ
f (x) d x 6 (7.2.99) 6 |f (x)| d x 6 C d x = (7.2.73) = (b − a) · C
[a,b] [a,b] [a,b]
| {z }
⇑ (7.2.98)
|f (x)| 6 C
6. Непрерывность. Из двух формул (7.2.101) и (7.2.102) мы докажем первую, имея в виду, что
вторая доказывается по аналогии:
ˆ ˆ
f (x) d x −→ f (x) d x
[a,y] y→c [a,c]
0
>
(7.2.96)
f (x) d x + cy f (x) d x
´ ´
[a,c] supx∈[c,y] |f (x)|
>
теорема 7.2.2
∞
7. Теорема о среднем. Пусть f непрерывна на отрезке [a; b]. Тогда по теореме Вейерштрасса об
экстремумах (теорема 3.3.8), найдутся такие точки α, β ∈ [a; b], что
откуда
1
ˆ
f (α) 6 · f (x) d x 6 f (β)
b−a [a,b]
1
´
Таким образом, число M = b−a · [a,b] f (x) лежит между значениями f (α) и f (β) непрерывной
функции f на отрезке [α; β]. Значит, по теореме Коши о промежуточном значении (теорема 3.3.6),
найдется точка ξ ∈ [α; β] ⊆ [a; b] такая что
1
ˆ
f (ξ) = · f (x) d x
b − a [a,b]
§ 2. Определенный интеграл 439
Действительно,
|f (η) · g(η) − f (θ) · g(θ)| = |f (η) · g(η) − f (θ) · g(η) + f (θ) · g(η) − f (θ) · g(θ)| 6
6 |f (η) · g(η) − f (θ) · g(η)| + |f (θ) · g(η) − f (θ) · g(θ)| = |f (η) − f (θ)| · |g(η)| + |f (θ)| · |g(η) − g(θ)| 6
6 |f (η) − f (θ)| · B + A · |g(η) − g(θ)|
Теперь, чтобы доказать, что f · g интегрируема на [a; b], возьмем разбиение τ отрезка [a; b] и оценим
разность между верхними и нижними суммами Дарбу для функции f (x) · g(x):
k
!
X
Sτ (f · g) − sτ (f · g) = sup f (η) · g(η) − inf f (θ) · g(θ) · ∆xi =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
k
X
= sup f (η) · g(η) − f (θ) · g(θ) · ∆xi 6 (7.2.107) 6
i=1 η,θ∈[xi−1 ;xi ]
k
X
6 sup B · f (η) − f (θ) + A · g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ]
k
X k
X
=B· sup f (η) − f (θ) · ∆xi + A · sup g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
= B · Sτ (f ) − sτ (f ) +A · Sτ (g) − sτ (g) −→ 0
| {z } | {z } diam τ →0
←−
←−
diam τ diam τ
↓ ↓
0 0
0, 0,
поскольку f поскольку g
интегрируема интегрируема
M = sup |f (x)|
x∈[a,b]
Далее, функция ϕ строго монотонна, значит она либо возрастает, либо убывает. Будем считать для
начала, что ϕ возрастает. Тогда
Рассмотрим произвольное разбиение τ = {t0 , ..., ti , ..., tk } отрезка [α, β] с выделенной системой точек
ζi ∈ [ti−1 , ti ]. Положив xi = ϕ(ti ) и ξi = ϕ(ζi ), мы получим разбиение отрезка [a, b], причем по
теореме Лагранжа 5.1.7, для некоторых точек ηi ∈ [ti−1 , ti ] будет выполняться равенство
∆xi = xi − xi−1 = ϕ(ti ) − ϕ(ti−1 ) = (5.1.33) = ϕ′ (ηi ) · (ti − ti−1 ) = ϕ′ (ηi ) · ∆ti
Если теперь взять ε > 0, то по теореме Кантора 3.3.10 найдется δ > 0 такое, что для любых
s, t ∈ [α, β] выполняется импликация:
ε
|s − t| < δ =⇒ |ϕ′ (s) − ϕ′ (t)| <
M · (β − α)
440 Глава 7. ИНТЕГРАЛ
k
X Xk Xk
f ϕ(ζi ) · |ϕ′ (ζi )| ·∆ti − f (ξi ) · ∆xi = f (ξi ) · ϕ′ (ζi ) − ϕ′ (ηi ) · ∆ti 6
| {z } | {z } |{z}
i=1 i=1 i=1
=
=
= ϕ′ (ζi ) ϕ′ (ηi ) · ∆ti
f (ξi )
k
X Xk
ε
6 |f (ξi )| · ϕ′ (ζi ) − ϕ′ (ηi ) ·∆ti < M · · ∆ti = ε
| {z } | {z } M · (β − α) i=1
i=1
| {z }
>
>
supx∈[a,b] |f (x)| ε
=
M ·(β−α)
=
β−α
M
Это означает, что при стремлении к нулю диаметра разбиения τ отрезка [α, β] интегральные суммы
стремятся друг к другу:
k
X k
X
f ϕ(ζi ) · ϕ′ (ζi ) · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1
С другой стороны, диаметр соответствующего разбиения ϕ(τ ) = {x0 , ..., xk } отрезка [a, b] тоже при
этом будет стремиться к нулю, потому что
diam ϕ(τ ) = max ∆xi = max ϕ′ (ηi ) · ∆ti 6 max ϕ′ (t) · max ∆ti = max ϕ′ (t) · diam τ −→ 0
i i t∈[α,β] i t∈[α,β] diam τ →0
Pk ´
Значит интегральные суммы i=1 f (ξi ) · ∆xi должны стремиться к интегралу [a,b] f (x) d x, и мы
получаем:
Xk k
X
f ϕ(ζi ) · ϕ′ (ζi ) · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1
| {z }
diam ϕ(τ )
↓ ↓
´ 0
[a,b]
f (x) d x
То есть
k
X
ˆ
f ϕ(ζi ) · ϕ′ (ζi ) · ∆ti −→ f (x) d x
diam τ →0 [a,b]
i=1
превращается в убывающую
b = x0 > ... > xi > ... > xk = a
Поэтому в интегральной сумме величину ∆xi нужно определять как разность xi−1 − xi , чтобы она
получилась положительной:
∆xi = − xi − xi−1 = − ϕ(ti ) − ϕ(ti−1 ) = (5.1.33) = −ϕ′ (ηi ) · (ti − ti−1 ) = −ϕ′ (ηi ) · ∆ti
и в вычислениях мы получим
k
X Xk k
X
f ϕ(ζi ) · |ϕ′ (ζi )| ·∆ti − f (ξi ) · ∆xi = − f (ξi ) · ϕ′ (ζi ) − ϕ′ (ηi ) · ∆ti 6 ... < ε
| {z } | {z } |{z}
i=1 i=1 i=1
=
=
=
f (ξi )
′
−ϕ (ζi ) −ϕ′ (ηi ) · ∆ti
Таким образом, после взятия модуля ничто не меняется, и все рассуждения можно оставить преж-
ними.
§ 3. Формула Ньютона-Лейбница 441
§3 Формула Ньютона-Лейбница
Между двумя независимыми на первый взгляд понятиями – производной и определенным интегра-
лом, – как оказывается, существует глубокая связь. Эта связь устанавливается знаменитой форму-
лой Ньютона-Лейбница, которая считается главной в интегральном исчислении. Здесь мы погово-
рим об этой формуле.
Теорема 7.3.1 (об интеграле с переменным верхним пределом). Пусть функция f непрерывна на
отрезке [a; b], тогда функция ˆ
F (x) = f (t) d t (7.3.109)
[a,x]
1
ˆ
F+′ (a) = lim f (t) d t = f (a), (7.3.112)
x→a+0 x − a [a,x]
!
b
1 1
ˆ ˆ ˆ
F−′ (b) = lim f (t) d t − f (t) d t = lim f (t) d t = f (b).
x→b−0 x − b [a,x] [a,b] x→b−0 b − x x
(7.3.113)
Доказательство. Заметим сразу, что здесь достаточно доказать тождество (7.3.110), потому что
остальное – то есть утверждение, что функция F является гладкой – будет следовать из (7.3.110) и
того факта, что f непрерывна. В свою очередь (7.3.110) разбивается на условия (7.3.111)-(7.3.113),
и каждое нужно проверить. Зафиксируем для этого какую-нибудь точку c ∈ [a; b] и найдем в ней
производную функции F . Нам придется рассмотреть несколько случаев.
1. Пусть для начала точка c лежит внутри отрезка [a; b], то есть a < c < b. Чтобы найти
производную функции F (x) в точке c,
F (x) − F (c)
F ′ (c) = lim ,
x→c x−c
вычислим по отдельности правый и левый пределы в этой точке.
a) Пусть x > c, то есть a < c < x < b. Тогда
(ˆ )
F (x) − F (c) 1
ˆ
= f (t) d t − f (t) d t =
x−c x−c [a,x] [a,c]
442 Глава 7. ИНТЕГРАЛ
(ˆ )
1
ˆ ˆ
= f (t) d t + f (t) d t − f (t) d t =
x−c [a,c] [c,x] [a,c]
1 1
ˆ
= · f (t) d t = · f (ξ) · (x − c) = f (ξ) −→ f (c)
x−c [c,x] x−c x→c+0
| {z } | {z }
⇑
=
(7.2.104)
f (ξ) · (x − c), ξ −→ c
x→c+0
ξ ∈ [c, x] ⇑
ξ ∈ [c, x]
Таким образом,
F (x) − F (c)
lim = f (c) (7.3.114)
x→c+0 x−c
b) Аналогично, если x < c, то есть a < x < c < b, то
(ˆ )
F (x) − F (c) 1
ˆ
= f (t) d t − f (t) d t =
x−c x−c [a,x] [a,c]
(ˆ !)
1
ˆ ˆ
= f (t) d t − f (t) d t + f (t) d t =
x−c [a,x] [a,x] [x,c]
1 1
ˆ
=− · f (t) d t =− · f (ξ) · (c − x) = f (ξ) f (ξ) −→ f (c)
x−c [x,c] x−c x→c−0
| {z } | {z }
⇑
=
(7.2.104)
f (ξ) · (c − x), ξ −→ c
x→c−0
ξ ∈ [x, c] ⇑
ξ ∈ [x, c]
Таким образом,
F (x) − F (c)
lim = f (c) (7.3.115)
x→c−0 x−c
Формулы (7.3.114) и (7.3.115) вместе дают
F (x) − F (c)
F ′ (c) = lim = f (c), c ∈ (a; b)
x→c x−c
F (x) − F (a)
lim = f (a)
x→a+0 x−a
3. Остается случай, когда c = b, который нужно рассмотреть по аналогии с пунктом b), и тогда
получится формула
F (x) − F (b)
lim = f (b)
x→b−0 x−b
Формула Ньютона-Лейбница.
Теорема 7.3.2 (Ньютона-Лейбница). Пусть функция f непрерывна на отрезке [a; b] тогда для
любой ее первообразной Φ на этом отрезке выполняется равенство
ˆ
f (x) d x = Φ(b) − Φ(a) (7.3.116)
[a,b]
По теореме 7.3.1, она является первообразной для функции f на отрезке [a; b]. Значит, F и Φ – две
первообразные для одной и той же функции f на отрезке [a; b]. Поэтому, по свойству 20 на с.400,
эти функции отличаются друг от друга на какую-то константу:
То есть,
ˆ
f (t) d t = Φ(x) + C, x ∈ [a; b] (7.3.117)
[a,x]
Взяв x = a, мы получим
ˆ
0= f (t) d t = Φ(a) + C,
[a,a]
откуда
C = −Φ(a),
равна
x3 1 1
ˆ
S= x2 d x = (7.1.34) = +C = .
Здесь используется формула (7.1.59), кото-
[0,1] 3 0 3
рую мы вывели раньше. Подставляя ее в теорему
⋄ 7.3.3. Площадь фигуры, ограниченной аркой Ньютона-Лейбница, мы получаем:
синусоиды ( ˆ 1p
06x6π 1 − x2 d x = (7.1.59) =
0 6 y 6 sin x. −1
1 p x=1
равна = x 1 − x2 + arcsin x =
2 x=−1
1
1 π π π
= (arcsin 1 − arcsin(−1)) = + =
ˆ
S= sin x d x = (7.1.38) = 2 2 2 2 2
[0,π]
π Видно, что ответ правильный: площадь полукру-
= − cos x + C = − cos π − (− cos 0) = 2. га радиуса 1 равна π2 .
0
444 Глава 7. ИНТЕГРАЛ
(подразумевается, что сумма определена только если конец предыдущего отрезка совпа-
дает с началом следующего).
→
− →
−
• Противоположным отрезком к отрезку ab называется отрезок ba, и обозначается он
→
−
символом ⊖ ab:
→
− →
−
⊖ab := ba (7.3.119)
→
− →
− →
− →
−
Сумму вида − →
ac ⊕ (⊖ bc) = −
→
ac ⊕ cb = ab принято записывать как −→
ac ⊖ bc и называть
→
− →
−
разностью ориентированных отрезков ac и bc:
−
→ →
− →
− → −
− →
ac ⊖ bc := −
→
ac ⊕ (⊖ bc) = −
→
ac ⊕ cb = ab (7.3.120)
−→
⋄ 7.3.5. Запись 0; 1 означает отрезок [0; 1], в ко- му
−→ −→
тором 0 считается началом, а 1 концом. Наобо- 1; 0 = ⊖0; 1
−→
рот, 1; 0 означает отрезок [0, 1], но в котором 0
считается концом, а 1 началом. Носители у этих ⋄ 7.3.6. Очевидно, справедливы равенства:
отрезков одинаковы −→ −→ −→
0; 1 ⊕ 1; 2 = 0; 2
−→ −→
[0; 1] = [0; 1] = [1; 0] −→ −→ −→
0; 2 ⊖ 1; 2 = 0; 1
−→ −→ −→
но ориентация у них противоположная, и поэто- 0; 1 ⊖ 2; 1 = 0; 2
→
−
— скачком функции f на ориентированном отрезке ab называется число
x=b
f (x) := f (b) − f (a) (7.3.121)
x=a
→
−
— интегралом функции f по ориентированному отрезку ab, или анизотропным
→
−
интегралом по ab, называется число
´
ˆ b [a,b] f (x) d x,
a<b
f (x) d x := 0, a=b (7.3.122)
a
´
− [b,a] f (x) d x, b < a
→
−
30 . Теорема о среднем: если функция f непрерывна на отрезке ab, то найдется такая
−
→
точка ξ ∈ ab, что
ˆ b
f (x) d x = f (ξ) · (b − a) (7.3.126)
a
4◦ Формула Ньютона-Лейбница: интеграл от непрерывной функции по ориентирован-
ному отрезку равен скачку какой-нибудь ее первообразной на этом отрезке:
ˆ b x=b
f (x) d x = Φ(x) (7.3.127)
a x=a
Доказательство. 1. Первое свойство следует из (7.2.95), и для его доказательства нужно просто
рассмотреть два случая взаимного расположения точек a и b на прямой. Если a < b, то
ˆ b ˆ
α · f (x) + β · g(x) d x = (7.3.122) = α · f (x) + β · g(x) d x = (7.2.95) =
a [a,b]
ˆ ˆ ˆ b ˆ b
= α· f (x) d x + β · g(x) d x = (7.3.122) = α · f (x) d x + β · g(x) d x
[a,b] [a,b] a a
А если a > b, то
ˆ b ˆ
α · f (x) + β · g(x) d x = (7.3.122) = − α · f (x) + β · g(x) d x = (7.2.95) =
a [b,a]
ˆ ˆ ˆ b ˆ b
= −α · f (x) d x − β · g(x) d x = (7.3.122) = α · f (x) d x + β · g(x) d x
[b,a] [b,a] a a
Если же a > b, то
ˆ b ˆ
f (x) d x = − f (x) d x = (7.2.103) = −f (ξ) · (a − b) = f (ξ) · (b − a)
a [b,a]
Если же a > b, то
ˆ b ˆ
f (x) d x = (7.3.122) = − f (x) d x = (7.3.116) =
a [b,a]
x=b
= − Φ(a) − Φ(b) = Φ(b) − Φ(a) = (7.3.121) = Φ(x)
x=a
⋄ 7.3.7. ⋄ 7.3.8.
4 √ ˆ 4
1+ x 1 1
ˆ
π
dx = + √ dx = ˆ 2
1 x2 1 x2 x· x (1 + 2 cos x − sin x) d x = (7.3.123) =
ˆ 4 ˆ 4 0
3
= (7.3.123) = x−2 d x + x− 2 d x = ˆ π
2
ˆ π
2
ˆ π
2
1 1 = 1 dx + 2 · cos x d x − sin x d x =
1 x=4 1 x=4 0 0 0
= (7.1.34) = − − √ = π
2
π
2
π
2 π
x x=1 2 x x=1 =x + 2 sin x − cos x = +2−1=
1 1 1 0 0 0 2
= − + 1 − + = 1. π
4 4 2 = + 1.
2
Следствие 7.3.4. Функция g : [a, b] → R является гладкой тогда и только тогда, когда она пред-
ставима в виде интеграла с переменным верхним пределом от некоторой непрерывной функции
f : [a, b] → R: ˆ x
g(x) = g(a) + f (t) d t
a
В вычислениях удобно переход от левой части и говорим при этом, что "вносим g ′ (x) под знак
к правой и наоборот в формуле (7.3.128) оформ- дифференциала".
лять специальной записью и сопровождать под-
ходящей речевой конструкцией. В качестве за-
писи в таких случаях используется стрелка над ⋄ 7.3.9. В этом пункте нам нужны примеры, ил-
формулой, а речевых конструкций придумано люстрирующие формулу (7.3.128) как определе-
две: "вынесение из-под знака дифференциала"и ние интеграла вдоль гладкой функции, поэтому
"внесение под знак дифференциала". Именно, в вычислениях здесь мы будем выносить выра-
если нам нужно в (7.3.128) перейти от левой ча- жения из-под знака дифференциала:
сти к правой, то мы рисуем стрелку от выраже-
ния под дифференциалом в пространство перед ˆ 1 ˆ 1
ним,
x3 d x5 = x3 · 5x4 d x =
ˆ b ˆ b 0 0
f (x) d g(x) = f (x) · g ′ (x) d x, ˆ 1
5 8 x=1 5
a a =5 x7 d x = x =
0 8 x=0 8
и говорим при этом, что "выносим g(x) из-под
знака дифференциала". А если наоборот, нам
нужно в (7.3.128) перейти от правой части к ле- ⋄ 7.3.10. Еще один такой же пример:
вой (такое тоже часто бывает нужно, см. приме-
ры, начиная с 7.3.13), то мы рисуем стрелку от
нужного выражения в пространство после знака ˆ π ˆ π
дифференциала, cos x d sin x = cos2 x d x =
0 0
ˆ b ˆ b ˆ π π
′ 1 + cos 2x 1 1 π
f (x) · g (x) d x = f (x) d g(x), = d x = · x + · sin 2x =
a a 0 2 2 4 0 2
если
−
→ →
−
(i) ϕ гладко отображает носитель αβ в носитель ab:
−
→ →
−
ϕ : [αβ] → [ab] (7.3.132)
−
→ →
−
(это, в частности, означает, что для всякого t ∈ [αβ] значение ϕ(t) лежит в [ab]);
448 Глава 7. ИНТЕГРАЛ
−−→
⋄ 7.3.11. Функция не будет преобразованием отрезка 0; 3π
2 в отрезок
−→
ϕ(t) = cos t 1; 0, хотя она по-прежнему гладкая, и сохраняет
ориентацию этих отрезков:
является преобразованием ориентированного от-
−→ −−−→ 3π
резка 0; π в ориентированный отрезок 1; −1: cos 0 = 1, cos =0
2
−→ −−−→
cos : 0; π → 1; −1
Дело в том, что эта функция не будет отображе-
потому что она гладко отображает носитель пер- нием носителя первого отрезка в носитель вто-
вого отрезка в носитель второго рого:
−→ −−−→ "−−−→#
cos : [0; π] = [0, π] → [−1; 1] = [1; −1] 3π 3π −→
cos : 0; = 0, →
6 [0; 1] = [1; 0]
и сохраняет ориентацию: 2 2
→
−
[ab]
k
D(F ′ )
Поэтому
ˆ β t=β
f (ϕ(t)) · ϕ′ (t) d t = (7.3.127) = (F ◦ ϕ)(t) =F ϕ(β) −F ϕ(α) =
α t=α | {z } | {z }
=
(7.3.133) (7.3.133)
b a
ˆ b
= F (b) − F (a) = (7.3.127) = f (x) d x
a
§ 3. Формула Ньютона-Лейбница 449
4 √
x dx
ˆ
В противоположность примерам на с.447 те- 1 + x = t, x = t2 − 1
√ = −→ −→
x ∈ 1; 4 ⇔ t ∈ 2; 3
=
перь оказывается полезным вносить под знак 1 1+ x
дифференциала. ˆ 3
(t2 − 1) d(t2 − 1)
ˆ 3 2
(t − 1) · 2t d t
= = =
⋄ 7.3.13. 2 t 2 t
ˆ 3 3
ˆ 2 ˆ 2 t t=3
x2 1 2 =2 (t2 − 1) d t = 2 · −t =
ex · 2x d x =
x · e dx = · 2 3 t=2
0 2 0
√ 8 32
1 2 x2 = 2 (9 − 3) − −2 =
ˆ
x = t, t = x2
= e d x2 = x ∈ − → −→
0; 2 ⇔ t ∈ 0; 4
= 3 3
2 0
1 4 t 1 4 e4 − 1 ⊲⊲ 7.3.16. Найдите определенные интегралы:
ˆ
= e d t = et = ´1√
2 0 2 0 2 1) 0 4 − x2 d x
´ ln 5 x √ x
⋄ 7.3.14. 2) 0 e exe+3−1 d x
´a
ˆ π4 π 3) 02 √adx2 2
sin x ´ 1 2 √−x
ˆ 4
tg x d x = dx = 4) 0 x 1 − x2 d x
0 cos x 0 ´ 1 dx
ˆ π4
− sin x d x
ˆ π4
d cos x 5) 0 ex +e −x
=− dx = − = ´ π2
0 cos x 0 cos x 6) 0 1+sindx x+cos x
ˆ 21 ´π
x = arccos t, t = cos x dy 7) 04 1+2dx sin2 x
= −−→π
−−→
x ∈ 0; 4 ⇔ t ∈ 1; 21 = − =
1 y
1
⊲⊲ 7.3.17. Найдите определенные интегралы:
2 1
= − ln |y| = − ln + ln 1 = ln 2 ´1√
1 2 ´ − π4 cos3 x
1) 0 1 + x d x 5) −π
√
3 dx
sin x
⋄ 7.3.15. Иногда, однако, бывает удобно сразу ´π
2) 02 sin3 x d x ´1
2
dx
заменять переменную, не внося ничего под знак ´ 1 x dx 7) 0 x2 +4x+5
3) 0 (x2 +1)3
дифференциала: ´e ´1
4) 1 1+ln x
dx 8) √ dx
x 0 3+2x−x2
Интегрирование по частям.
Теорема 7.3.6 (об интегрировании по частям). Если f и g – гладкие функции на ориентиро-
→
−
ванном отрезке ab, то
ˆ b x=b
ˆ b
f (x) d g(x) = f (x) · g(x) − g(x) d f (x) (7.3.137)
a x=a a
Доказательство.
ˆ b ˆ b ˆ b ˆ b
f (x) d g(x) + g(x) d f (x) = (7.3.128) = f (x) · g ′ (x) d x + g(x) · f ′ (x) d x = (7.3.123) =
a a a a
ˆ b ˆ b x=b x=b
= f (x) · g ′ (x) + f ′ (x) · g(x) dx = (f ·g)′ (x) d x = (7.3.130) = (f ·g)(x) = f (x)·g(x)
a | {z } a x=a x=a
=
(f · g)′ (x)
⇓
´b
(переносим a
g(x) d f (x) направо)
ˆ b x=b
ˆ b
f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
a x=a a
e ˆ e
x=e 1
ˆ
⋄ 7.3.18. − x d ln x = x · ln x − x · dx =
1 x=1 1 x
e x=e
ˆ e x=e x=e
x=e
ˆ
ln x d x = (7.3.137) = x · ln x − = x · ln x − 1 d x = x · ln x −x =
1 x=1 x=1 1 x=1 x=1
450 Глава 7. ИНТЕГРАЛ
π ˆ π
= e · ln e − 1 · ln 1 − (e − 1) = 1 π x
= e − 1 + sin x · e − ex d sin x =
0
⋄ 7.3.19. | {z 0}
k
ˆ 2 ˆ 2 0
ex x d x = x d ex = (7.3.137) =
ˆ π
0 0 = eπ − 1 − ex cos x d x = eπ − 1 − I
x=2
ˆ 2 x=2 x=2 0
= x · ex − ex d x = x · ex − ex =
x=0 0 x=0 x=0 Итогом этих вычислений будет равенство
= 2 · e2 − 0 · e0 − (e2 − e0 ) = e2 + 1
I = eπ − 1 − I,
⋄ 7.3.20. Повторное интегрирование по частям:
из которого I выражается формулой
2 2
eπ − 1
ˆ ˆ
ex x2 d x = x d ex = (7.3.137) =
I= .
0 0 2
x=2
ˆ 2
2
=x ·e x
− ex d x2 = ⊲⊲ 7.3.22. Найдите определенные интегралы:
x=0
| {z } 0 ´1 ´2
k 1) 0
arctg x d x 4) 1 x ln x d x
´π
4e2 ´1 5) 0 x3 sin x d x
2 2) 0 xe−x d x ´π x
6) 0 e sin x d x
ˆ
= 4e2 − ex 2x d x =
1 ´π
7) 02 e2x cos x d x
´
0 3) 0
2
arcsin x d x
ˆ 2
= 4e2 − 2 x d ex = (7.3.137) =
0
Использование рекуррентных соотноше-
x=2
ˆ 2 ний.
= 4e2 − 2x · ex +2 ex d x =
| {z x=0
} 0 ⋄ 7.3.23. Некоторые определенные интегралы
k вычисляются с помощью рекуррентных соотно-
4e2 шений. Например, следующие равенства8:
x=2
= 2ex = 2 · e2 − 2 ˆ π
2
ˆ π
2
x=0 n
sin x d x = cosn x d x =
⋄ 7.3.21. Следующий прием называется "воз- 0
( 0
(n−1)!! π
вращением к исходному интегралу". Чтобы со- n ∈ 2N − 1 n!! · 2,
= (7.3.138) (n−1)!!
считать интеграл n ∈ 2N ,
n!!
ˆ π
ex cos x d x, (напомним, что двойной факториал n!! был опре-
0 делен формулами (2.2.238) и (2.2.239)). Сначала
обозначим его какой-нибудь буквой, например, проверим, что эти интегралы совпадают:
π
x = π2 − y
ˆ
π
ex cos x d x.
ˆ
I= 2
n
0 sin x d x = x = 0 ⇔ y = π2 =
0 x = π2 ⇔ y = 0
Тогда, дважды применяя интегрирование по ча- ˆ 0 π π
стям, можно получить следующую цепочку, на- = sinn −y d −y =
чинающуюся с I и в итоге снова возвращающу- π
2
2 2
юся к I, но так, что из полученной формулы I ˆ 0 ˆ π2
можно выразить: =− cosn y d y = cosn y d y
π
2 0
ˆ π ˆ π
ex cos x d x = cos x d ex = (7.3.137) = После этого выведем рекуррентную формулу:
I=
0 0
π ˆ π ˆ π ˆ π
2 2
= cos x · ex − ex d cos x = In = sinn x d x = sinn−1 x d(− cos x) =
0
| {z 0} 0 0
π
2
k
e −1π = − sinn−1 x · cos x +
0
ˆ π | {z }
=
= eπ − 1 + ex sin x d x =
0
ˆ π 0 ˆ π
2
π
=e −1+ sin x d ex = (7.3.137) = + (n − 1) · sinn−2 x · cos2 x d x =
0 0
8 Равенства (7.3.138) понадобятся нам на с.467 при доказательстве формулы Валлиса.
§ 3. Формула Ньютона-Лейбница 451
π
(2k − 1) · (2k − 3) · ... · 1 (2k − 1)!! π
ˆ 2
= (n − 1) · sinn−2 x · (1 − sin2 x) d x = = ... = ·I0 = ·
0
2k · (2k − 2) · ... · 2 (2k)!! 2
= (n − 1) · In−2 − (n − 1) · In
А для n = 1 получаем:
⇓
n−1 ˆ π
2
π
In = · In−2 I1 = sin x d x = − cos x
1
= 1,
n 0
0
Теперь для n = 0 получаем:
ˆ π2
π поэтому при n = 2k + 1,
I0 = dx =
0 2
2k 2k · (2k − 2)
и поэтому при n = 2k, I2k+1 = ·I2k−1 = ·I2k−3 =
2k + 1 (2k + 1) · (2k − 1)
2k − 1 (2k − 1) · (2k − 3) (2k) · (2k − 2) · ... · 2 (2k)!!
I2k = ·I2k−2 = ·I2k−4 = = ... = ·I1 =
2k 2k · (2k − 2) (2k + 1) · (2k − 1) · ... · 1 (2k + 1)!!
Кусочно-непрерывные функции.
• Функция f на отрезке [a, b] называется кусочно-непрерывной, если
1) на [a, b] функция f непрерывна во всех точках, кроме, возможно, конечного
набора;
2) в каждой точке разрыва c ∈ R функция f имеет конечные левый и правый
предел
f (c − 0) = lim f (x), f (c + 0) = lim f (x) (7.3.139)
x→c−0 x→c+0
Теорема 7.3.7. Функция f кусочно-непрерывна на отрезке [a, b] тогда и только тогда, когда су-
ществует разбиение τ = {c0 , ..., ck } этого отрезка такое, что на каждом отрезке [ci−1 , ci ] можно
определить непрерывную функцию ϕi , совпадающую с f на интервале (ci−1 , ci ):
имеющая график отрезке [0, 1], потому что имеет на нем бесконеч-
1
ное число точек разрыва (x = πn ).
⊲ 7.3.26. Функция
(
1
x, x 6= 0
f (x) =
0, x=0
с графиком
является кусочно-непрерывной на любом отрез-
ке [a, b].
⊲ 7.3.25. Наоборот, функция
(
sgn sin x1 , x 6= 0
f (x) =
0, x = 0
с графиком
тоже не будет кусочно-непрерывной на отрезке
[0, 1], потому что имеет бесконечный предел в
точке 0.
Доказательство. Заметим сразу, что обе функции f и ϕ должны быть ограничены на [a, b]: функ-
ция ϕ ограничена по теореме 7.2.2, как интегрируемая на [a, b], а функция f отличается от нее не
более чем в двух точках. Мы можем даже считать, что они ограничены одной константой:
sup |f (x)| 6 M, sup |ϕ(x)| 6 M
x∈[a,b] x∈[a,b]
интегральная интегральная
сумма для f сумма для ϕ
z }| { z }| {
X k X k
f (ξi ) · ∆xi − ϕ(ξi ) · ∆xi =
i=1 i=1
| {z }
diam τ
↓ ↓
0
´b
a
ϕ(x) d x
k−1
X k−1
X
= f (ξ1 ) · ∆x1 + f (ξi ) · ∆xi + f (ξk ) · ∆xk − ϕ(ξ1 ) · ∆x1 + ϕ (ξi ) · ∆xi +ϕ (ξk ) · ∆xk =
i=2 i=2
| {z } | {z }
↑ сокращаются, поскольку f (ξ) = ϕ(ξ) при ξ ∈ (a, b) ↑
§ 3. Формула Ньютона-Лейбница 453
= f (ξ1 ) − ϕ(ξ1 ) · ∆x1 + f (ξk ) − ϕ(ξk ) · ∆xk 6
6
6
6
diam τ diam τ
|f (ξ1 )| − |ϕ(ξ1 )| |f (ξk )| − |ϕ(ξk )|
6
2M 2M
Отсюда получаем:
k
X ˆ b
f (ξi ) · ∆xi −→ ϕ(x) d x
diam τ →0 a
i=1
´b
Это значит, что функция f интегрируема на [a, b] и ее интеграл равен a
ϕ(x) d x.
Доказательство теоремы 7.3.8. Подберем с помощью теоремы 7.3.7 разбиение отрезка [a, b]
такое, что на всяком интервале (ci−1 , ci ) функция f совпадает с некоторой функцией ϕi , непрерыв-
ной на отрезке [ci−1 , ci ]. Тогда по лемме 7.3.9, функция f будет интегрируемой на всяком отрезке
[ci−1 , ci ]. Значит, по свойству аддитивности интеграла (20 на с.434), f интегрируема на отрезке
[a, b] = [a, c1 ] ∪ [c1 , c2 ] ∪ ... ∪ [cn , b].
Кусочно-гладкие функции.
• Функция f на отрезке [a, b] называется кусочно-гладкой, если
1) на отрезке [a, b] она дифференцируема во всех точках, кроме, возможно, конеч-
ного набора;
2) в каждой точке c ∈ [a, b], где f дифференцируема, ее производная непрерывна,
′ f (x) − f (c − 0) f (x) − f (c + 0)
′
f− (c) = lim , f+ (c) = lim
x→c−0 x−c x−c x→c+0
(7.3.142)
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x)
′ ′
стремится соответственно к f− (c) или f+ (c):
′
f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (7.3.143)
x→c−0 x→c+0
Теорема 7.3.11. Пусть g – непрерывная кусочно-гладкая функция на отрезке [a, b]. Тогда
(i) произвольным образом доопределяя производную g ′ функции g в точках недифференци-
руемости g на [a, b], мы получим кусочно-непрерывную функцию на [a, b];
(ii) для любой интегрируемой функции f на [a, b] интеграл
ˆ b
f (x) · g ′ (x) d x
a
Целью наших рассмотрений здесь является обобщение теорем 7.3.12 и 7.3.6 об интегрировании
вдоль функции на случай, когда эта функция является непрерывной кусочно-гладкой (а не просто
гладкой).
Теорема 7.3.12 (о скачке непрерывной кусочно-гладкой функции). Скачок непрерывной
→
−
кусочно-гладкой функции g на ориентированном отрезке ab равен интегралу от единицы вдоль g
по этому отрезку:
ˆ b ˆ b x=b
d g(x) = g ′ (x) d x = g(x) (7.3.146)
a a x=a
Доказательство. Понятно, что здесь достаточно считать, что a < b, потому что противоположный
случай получается умножением равенства (7.3.146) на −1.
1. Пусть сначала функция g дифференцируема везде внутри отрезка [a, b] (а недифференцируема
может быть только на концах этого отрезка). Тогда для любых точек α и β таких, что
функция v будет гладкой на отрезке [α, β], и значит к ним применима теорема 7.3.12:
ˆ β
d g(x) = g(β) − g(α)
α
´b (7.3.144)
a
d g(x)
так, чтобы внутри каждого отрезка [ci−1 , ci ] функция g была дифференцируема, и, по уже дока-
занному, мы получим:
ˆ b k ˆ
X ci k
X x=ci x=a
d g(x) = d g(x) = g(x) = g(x)
a ci−1 x=ci−1 x=b
i=1 i=1
Доказательство. Как и в доказательстве теоремы 7.3.12, здесь достаточно считать, что a < b.
1. Пусть для начала функции f и g дифференцируемы везде внутри отрезка [a, b] (а недиф-
ференцируемы могут быть только на концах этого отрезка). Тогда для любых точек α и β таких,
что
a < α < β < b,
функции f и g будут гладкими на отрезке [α, β], и значит к ним применима теорема 7.3.6:
ˆ β x=β
ˆ β
f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
α x=α α
´b (7.3.144) ´b (7.3.144)
a
f (x) d g(x) a
g(x) d f (x)
так, чтобы внутри каждого отрезка [ci−1 , ci ] функции f и g были дифференцируемы, и, по уже
доказанному, мы получим:
ˆ b k ˆ
X ci k
X x=ci k ˆ
X ci
f (x) d g(x) = f (x) d g(x) = f (x) · g(x) − g(x) d f (x) =
a ci−1 x=ci−1 ci−1
i=1 i=1 i=1
x=b
ˆ b
= f (x) · g(x) − g(x) d f (x)
x=a a
456 Глава 7. ИНТЕГРАЛ
Предложение 7.3.15. Для любой непрерывной функции f на интервале (α, β) и любой точки
c ∈ (α; β) формула ˆ x
F (x) = f (t) d t, x ∈ (α, β)
c
определяет первообразную функции f на интервале (α, β).
Доказательство. Здесь используется теорема 7.3.1 об интеграле с переменным верхним пределом.
1. Зафиксируем x0 ∈ (c, β). Взяв какое-нибудь b ∈ (x0 , β), мы можем считать, что переменная x
бегает по отрезку [c, b], на котором x0 будет внутренней точкой, поэтому производную функции F
в x0 можно вычислить по формуле (7.3.111):
ˆ x x0
1
ˆ
F ′ (x0 ) = lim f (t) d t − f (t) d t =
x→x0 x − x0 c c
!
1
ˆ ˆ
= lim f (t) d t − f (t) d t = (7.3.111) = f (x0 ). (7.3.149)
x→x0 x − x0 [c,x] [c,x0 ]
Более того, представив F тем же интегралом с x бегающим по отрезку [c, b], мы можем найти
правую производную F в точке c по формуле (7.3.112):
x
F (x) − F (c) 1
ˆ
F+′ (c) = lim = lim f (t) d t =
x→c+0 x−c x→c+0 x−c c
1
ˆ
= lim f (t) d t = (7.3.112) = f (c). (7.3.150)
x→c+0 x − c [c,x]
И представив F тем же интегралом с x бегающим по отрезку [a, c], мы можем найти левую произ-
водную F в точке c по формуле (7.3.113):
x
F (x) − F (c) 1
ˆ
F−′ (c) = lim = lim f (t) d t =
x→c−0 x−c x→c−0 x − c c
c
1
ˆ
= lim f (t) d t = (7.3.113) = f (c). (7.3.152)
x→c−0 c − x x
3. Теперь мы получаем, что формулы (7.3.150) и (7.3.152) вместе дают (7.3.148) для случая x0 = c,
а для всех остальных точек x0 6= c то же самое утверждается в формулах (7.3.149) и (7.3.151).
Лемма Адамара.
Лемма 7.3.16 (Адамар). Для любой гладкой функции f на отрезке [a, b] и любой точки c ∈ [a, b]
найдется непрерывная функция g на [a, b] такая, что
Доказательство. Положим
ˆ 1
g(x) = f ′ (x − c) · s + c d s, x ∈ [a, b]
0
Из непрерывности функции f ′ следует, что функция g тоже непрерывна на [a, b]. Действительно,
пусть ε > 0. По теореме Кантора 3.3.10, найдется δ > 0 такое, что для любых x, y ∈ [a, b]
⇓
∀s ∈ [0, 1] f ′ (x − c) · s + c − f ′ (y − c) · s + c < ε
ˆ 1
ˆ 1
′
|g(x) − g(y)| = f (x − c) · s + c d s − f ′ (y − c) · s + c d s =
0 0
ˆ ˆ
= f ′ (x − c) · s + c d s − f ′ (y − c) · s + c d s =
[0;1] [0;1]
ˆ
= f ′ (x − c) · s + c − f ′ (y − c) · s + c ds 6
[0;1]
ˆ ˆ
6 f ′ (x − c) · s + c − f ′ (y − c) · s + c d s < ε ds = ε
[0;1] | {z } [0;1]
>
ˆ x t = (x − c) · s + c ˆ 1
s ∈ [0, 1]
f (x) − f (c) = f ′ (t) d t = d t = (x − c) d s = f ′ (x − c) · s + c · (x − c) d s =
c → ⇔ s∈−
−
t ∈ cx
→
0; 1 0
ˆ 1
= (x − c) · f ′ (x − c) · s + c d s = (x − c) · g(x)
0
Найдем сначала точки пересечения этих линий: Площадь области, ограниченной парамет-
( ) ( ) ризованной кривой. Для любых непрерыв-
y=x y=x ных функций ϕ, χ : [α, β] → R система уравнений
⇔ ⇔ вида
y = 2 − x2 x = 2 − x2
x = ϕ(t)
( ) y=x y = χ(t)
y=x " #
⇔ ⇔ x = −2 ⇔ t ∈ [α; β]
x2 + x − 2 = 0
x=1 задает на плоскости некоторое множество точек,
( ) называемых параметризованной кривой (пара-
x = −2 метр t необязательно бегает по отрезку).
y = −2
⇔ ) ⋄ 7.3.30 (эллипс). Можно проверить, что урав-
(
x=1 нения (
y=1 x = a cos t
, t∈R
y = b sin t
На плоскости эта область изображается картин- определяют эллипс:
кой (которую можно построить по точкам):
Действительно,
Теперь интересующая нас область в правильном
x2 y2
виде записывается следующим образом: + = cos2 t + sin2 t = 1
a b
(
−2 6 x 6 1 ⋄ 7.3.31 (астроида). Уравнения
D: 2 (
x6y 62−x x = a cos3 t
, t∈R
и остается применить формулу (7.3.154): y = a sin3 t
задают на плоскости кривую, называемую аст-
ˆ 1 роидой. Для ее построения можно составить таб-
SD = {2 − x2 − x} d x = лицу
−2
x3 x2 1
t 0 ± π6 ±π ± π3 ± π2
= 2x − − = √ √ 4
3 2 −2 3 3 2 1
x a 8 a 4√ a 8√a 0
1 1 8 9
= 2− − − −4 + − 2 = y 0 ± 81 a ± 42 a 3 3
± 8 a ±a
3 2 3 2
затем отметить все эти точки на рисунке: задает на плоскости примерно такую область
если ϕ) возрастает, и
и соединить их “плавной линией”. Получится
картинка
если ϕ убывает.
(
x = ϕ(t)
D: , t ∈ [α; β]
0 6 y 6 χ(t)
задают на плоскости кривую, называемую цик-
лоидой. Ее также можно построить по точкам, и равна
соответсвующая картинка будет выглядеть так:
ˆ β
SD = χ(t) d ϕ(t) (7.3.155)
α
( (
x = ϕ(t) x = a cos t π
D: , t ∈ [α; β] D: , t ∈ [0; ]
0 6 y 6 ψ(t) 0 6 y 6 b sin t 2
460 Глава 7. ИНТЕГРАЛ
π
3a2 1 + cos 4t
ˆ 2
= (1 − cos 2t) 1 − dt =
8 0 2
ˆ π2 2
3a
= (1 − cos 2t) (1 − cos 4t) d t =
16 0
ˆ π2
3a2
= (1 − cos 2t − cos 4t + cos 2t cos 4t) d t =
16 0
ˆ π2
и найдем ее площадь: 3a2
= 1 − cos 2t − cos 4t+
16 0
π π
ˆ 2
ˆ 2
SD = b sin t d a cos t = ab sin2 t d t = 1
0 0
+ (cos 6t + cos 2t) d t =
2
π π
1 − cos 2t ab sin 2t
ˆ 2 π
2
3a2
ˆ 2
= ab dt = t− = = (2 − cos 2t − 2 cos 4t + cos 6t) d t =
0 2 2 2 0
32 0
πab π
= 3a2 1 1 1 2
4 = 2t − sin 2t − sin 4t + sin 6t =
32 6 2 6 0
Умножив это число на 4, получаем площадь эл- 3a2 π
липса: =
32
S = πab
⋄ 7.3.34. Найдем площадь фигуры, ограничен- Умножив это число на 4, получим площадь всей
ной астроидой из примера 7.3.31. фигуры:
3a2 π
S=
8
Вычисляем площадь:
ˆ 2π
SD = a(1 − cos t) d a(t − sin t) =
0
и найдем ее площадь: ˆ 2π
2
=a (1 − cos t)2 d t =
π 0
ˆ 2
SD = a sin3 t d a cos3 t = 2π
ˆ
2
0 =a 1 − 2 cos t + cos2 t d t =
0
2π
ˆ π
2
1 + cos 2t
ˆ
2 4 2
= 3a sin t cos t d t = = a2 1 − 2 cos t + dt =
0 0 2
π 2
ˆ 2 1 − cos 2t 1 + cos 2t 3 sin 2t 2π
= 3a 2
dt = = a2 t − 2 sin t + = 3πa2
0 2 2 2 4 0
π
3a2 ⊲⊲ 7.3.36. Найдите площади фигур, ограничен-
ˆ 2
= (1 − cos 2t) 1 − cos2 2t d t =
8 0 ных параметризованными кривыми:
§ 3. Формула Ньютона-Лейбница 461
ϕ 0 ± π6 ± π4 ± π3 ± π2
ρ a √a 0 ∄ ∄
2
При этом, полярные координаты связаны с
декартовыми формулами ϕ ± 2π ± 3π ± 5π ±π
( ( p 3 4 6
x = ρ · cos ϕ ρ = x2 + y 2 ρ ∄ 0 √a a
, , 2
y = ρ · sin ϕ tg ϕ = xy
Как и в случае с декартовыми координатами, Потом соответствующие точки строятся на плос-
всякое уравнение, связывающее полярные коор- кости:
динаты,
ρ = R(ϕ)
задает некоторую кривую на плоскости. Рас-
смотрим примеры.
⋄ 7.3.37 (кардиоида). Построим кривую, задан-
ную уравнением в полярных координатах
ρ = a · (1 + cos ϕ)
И в результате получается кривая:
Это можно сделать по точкам. Сначала состав-
ляется таблица
ϕ 0 ±π ±π ± π3 ± π2
6√ 4√
ρ 2a a 1 + 23 a 1 + 22 3a
2 a
ϕ ± 2π
3 ± 3π ± 5π ±π
4√ 6√
a
ρ a 1 − 22 a 1 − 23 0
2 ⋄ 7.3.39 (окружность). Построим кривую, за-
данную уравнением в полярных координатах
Потом соответствующие точки строятся на плос-
кости: ρ = a sin ϕ
Составляем таблицу
ϕ −π − 3π
4 − π2 − π4 0
ρ 0 ∄ ∄ ∄ 0
π π 3π
ϕ 4 2 4 π
ρ √a a √a 0
Эти точки соединяются плавной линией, и полу- 2 2
462 Глава 7. ИНТЕГРАЛ
2π
1
ˆ
SD = a2 · (1 + cos ϕ)2 d ϕ =
2 0
ˆ 2π
a2
В результате получается кривая: = · (1 + 2 cos ϕ + cos2 ϕ) d ϕ =
2 0
ˆ 2π
a2 1 + cos 2ϕ
= · 1 + 2 cos ϕ + dϕ =
2 0 2
ˆ 2π
a2 3 cos 2ϕ
= · + 2 cos ϕ + dϕ =
2 0 2 2
a2 3 sin 2ϕ ϕ=2π 3πa2
= · ϕ + 2 sin ϕ + =
2 2 4 ϕ=0 2
Нетрудно показать, что эта кривая – окруж- ⋄ 7.3.41. Вычислим площадь области, ограни-
ность. Для этого нужно перейти к декартовым ченной лемнискатой Бернулли (линией, постро-
координатам: енной нами в примере 7.3.38):
p
ρ = a sin ϕ ⇔ ρ2 = aρ sin ϕ ⇔ x2 +y 2 = ay ⇔ ρ=a cos 2ϕ
a2 a2 a 2 a 2
⇔ x2 +y 2 −ay+ = ⇔ x2 + y − =
4 4 2 2
a2 a2
= · (1 − (−1)) =
4 2
ρ = a · (1 + cos ϕ) ρ = a sin ϕ
§ 3. Формула Ньютона-Лейбница 463
p p
= 1 + e2b − 1 + e2a +
√ √
1 1 + e2b − 1 1 + e2a + 1
+ ln √ ·√
2 1 + e2b + 1 1 + e2a − 1
⋄ 7.3.45. Найдем длину куска полукубической
параболы:
3
y = x 2 , x ∈ [0; 1]
По формуле (7.3.157) имеем:
s 2
ˆ 1
3 1
π l= 1+ · x2 dx =
1 2
ˆ
0
SD = a2 · sin2 ϕ d ϕ = ˆ 1r
2 0 9
ˆ π = 1 + · x dx =
a2 1 − cos 2ϕ 4
= · dϕ = 0
q
2 0 2 t = 1 + 94 x
a2 ϕ sin 2ϕ ϕ=π πa2 = x = 94 (t2 − 1) √ =
= · − = x ∈ [0; 1] ⇔ t ∈ [1; 213 ]
2 2 2 ϕ=0 4 √
13 ˆ √213
4 8
ˆ 2
⊲⊲ 7.3.43. Найдите площади фигур, ограничен- = td · (t2 − 1) = · ·t2 d t =
ных линиями: 1 9 9 1
√ √ !3 13√13 − 8
8 t3 2 8
13
13
1) ρ = 4 sin2 ϕ 5) ρ = a cos 4ϕ = · = · −1 =
2) ρ = a(2 + sin ϕ) 9 3 1 27 2 27
6) ρ = a sin2 3ϕ
3) ρ = a cos ϕ
⋄ 7.3.46. Найдем длину куска обычной парабо-
4) ρ = a sin 3ϕ 7) ρ = a cos2 3ϕ
лы:
y = x2 , x ∈ [0; 1]
Длина кривой.
По формуле (7.3.157) (с использованием тожде-
Теорема 7.3.20. Если кривая задана уравнени- ства sin arctg x = √1+x x
2
) мы получаем:
ем
ˆ 1p
y = f (x), x ∈ [a; b]
l= 1 + 4x2 d x =
(в котором f – гладкая функция на отрезке 0
[a; b]), то ее длина равна 2x = tg t, t = arctg 2x ˆ arctg 4
dt dt
ˆ bq = d x = 2 cos2 t = 3t
=
−→ −− −− − −
→ 0 2 cos
l=
2
1 + (f ′ (x)) d x (7.3.157) x ∈ 0, 1 ⇔ t ∈ 0, arctg 4
a
1 arctg 4 d sin t 1 arctg 4 d sin t
ˆ ˆ
= = =
⋄ 7.3.44. Найдем длину куска экспоненты 2 0 cos4 t 2 0 (1 − sin2 t)2
y = ex , x ∈ [a, b] z = sin t, t = arcsin z
= −−−−−−→ −−−−−−−−→ −−−→ =
t ∈ 0, arctg 4 ⇔ z ∈ 0, sin arctg 4 = 0, √417
По формуле (7.3.157) имеем: ˆ √4
1 17 dz раскладываем
p b = = на простейшие дроби =
(1 − z 2 )2
ˆ
2 0 по теореме 7.1.10
l= 1 + e2x d x = ˆ √4
a 1 17
√ =
1 1
+
1
+
1
+
1
dz =
t = 1 + e2x , x = 12 ln(t2 − 1) 2 0 4 1−z 1+z (1 − z) 2 (1 + z) 2
= d x = tt2 d−1
t
= √4
−→ −−−−−−−−√
√ −−−−−→ 1 1+z 1 1 17
x ∈ a, b ↔ t ∈ 1 + e , 1 + e2a 2b = · ln + − =
8 1−z 1−z 1+z 0
ˆ √1+e2b 2 ˆ √1+e2b 2 √ √ √ !
t dt t −1+1 1 17 + 4 17 17
= √ 2−1
= √ dt = = · ln √ +√ −√ =
1+e2a t 1+e 2a t2 − 1 8 17 − 4 17 − 4 17 + 4
√
ˆ 1+e2b √
1 1 17 + 4 √
= √ 1+ 2 dt = = · ln √ + 17
1+e2a t −1 8 17 − 4
ˆ √1+e2b
1 1 1 Теорема 7.3.21. Если кривая задана парамет-
= √ 1+ − dt =
1+e2a 2 t−1 t+1 рическими уравнениями
√ (
1+e2b
1 t−1 x = ϕ(t)
= t + ln = , t ∈ [α; β]
2 t + 1 √1+e2a y = χ(t)
464 Глава 7. ИНТЕГРАЛ
причем ϕ(t), χ(t) – гладкие функции на [α; β], то Теорема 7.3.22. Если кривая задана уравнени-
ее длина равна ем в полярных координатах,
β q
ρ = R(ϕ), ϕ ∈ [α; β]
ˆ
l= (ϕ′ (t))2 + (χ′ (t))2 d t (7.3.158)
α
(где R(ϕ) – гладкая функция на [α; β]), то ее
⋄ 7.3.47 (длина астроиды). Найдем длину аст- длина равна
роиды: ( ˆ βq
2
x = a cos3 t l= R(ϕ)2 + (R′ (ϕ)) d ϕ (7.3.159)
α
y = a sin3 t
⋄ 7.3.49 (длина кардиоиды). Найдем длину кар-
По формуле (7.3.158), длина четвертинки равна
диоиды:
ρ = a · (1 + cos ϕ)
l
= По формуле (7.3.159),
4
ˆ π2 q
2 2 ˆ 2π q
= (−3a cos2 t sin t) + 3a sin2 t cos t d t =
0 l= {a · (1 + cos ϕ)}2 + (a sin ϕ)2 d ϕ =
ˆ π2 p 0
= 3a cos4 t sin2 t + sin4 t cos2 t d t = ˆ 2π q
0 =a 1 + 2 cos ϕ + cos2 ϕ + sin2 ϕ d ϕ =
ˆ π2 p 0
= 3a |cos t sin t| cos2 t + sin2 t d t = ˆ 2π p
0 =a 2 + 2 cos ϕ d ϕ =
ˆ π2 √ ˆ π2 0
= 3a cos t sin t 1 d t = 3a sin t d sin t = ˆ 2π r ˆ 2π
ϕ ϕ
0 0 =a 4 cos2 d ϕ = 2a cos dϕ =
2 π 0 2 0 2
sin t 2 3a
= 3a = разбиваем отрезок [0; 2π]
2 0 2 = на два отрезка, где cos ϕ2 =
имеет постоянный знак
Умножив на 4, получаем ответ: π 2π
ϕ ϕ
ˆ ˆ
= 2a cos d ϕ + 2a cos dϕ =
l = 6a 0 2 π 2
при ϕ ∈ [0; π] имеем
!
π
ϕ
ˆ
cos ϕ
2 = cos 2
ϕ
⋄ 7.3.48 (длина арки циклоиды). Вспомним кри- = а при ϕ ∈ [π; 2π] имеем = 2a cos d ϕ−
cos ϕ ϕ 0 2
вую из примера 7.3.35: 2 = − cos 2
2π
ϕ ϕ π ϕ 2π
ˆ
(
x = a(t − sin t) − 2a d ϕ = 4a sin
cos − 4a sin =
, t ∈ [0; 2π] π 2 2 0 2 π
π
y = a(1 − cos t) 2π π
= 4a sin − 0 − 4a sin − sin =
2 2 2
По формуле (7.3.158) получаем: = 4a + 4a = 8a
2π q
⊲⊲ 7.3.50. Найдите длину кривой:
ˆ
l= a2 (1 − cos t)2 + a2 sin2 t d t =
0 1) y = 41 x2 − 21 ln x, x ∈ [1; e],
ˆ 2π p √
= a2 − 2a2 cos t + a2 cos2 t + a2 sin2 t d t = 2) y = 13 (3 − x) x, x > 0,
0 3) x = et cos t, y = et sin t, t ∈ [0; π],
ˆ 2π p
= 2a2 − 2a2 cos t d t = 4) ρ = eϕ , ϕ ∈ [0; 2π].
0
√ ˆ√ 2π
Объем тела вращения. Пусть на отрез-
=a 2 1 − cos t d t =
0 ке [a; b] задана непрерывная неотрицательная
r
√ ˆ 2π t функция f
=a 2 2 sin2 d t =
0 2
ˆ 2π ˆ 2π
t t
= 2a sin d t = 2a sin d t =
0 2
| {z } 0 2
6
0
2π
t t t 2π
ˆ
= 4a sin d = −4a cos =
0 2 2 2 0
= −4a(cos π − cos 0) = 8a. Если ее график заставить вращаться вокруг оси
§ 3. Формула Ньютона-Лейбница 465
OX, получится поверхность, описываемая урав- Кривая, вращаемая вокруг оси, может быть
нением задана параметрически, и тогда соответствую-
щее тело вращения будет описываться системой
y 2 + z 2 = f (x)2 , x ∈ [a; b] (
x = ϕ(t)
и называемая поверхностью вращения. D: , t ∈ [α; β] (7.3.162)
y 2 + z 2 6 χ(t)2
p ˆ 1
меняем местами
= пределы интегрирования 1 + t2 d t =
= 2π
−1
интегрируем по частям
= с возвращением к исходному =
интегралу (как в примере 7.1.37)
1p p 1
= t 1 + t2 + ln t + 1 + t2 =
2 −1
1 √ √ √
= 2 2 + ln 1 + 2 − ln −1 + 2 =
2
√
вычисляется по формуле √ 1 2+1 √ 1 √ 2
= 2 + ln √ = 2 + ln 2+1 =
ˆ b q 2 2−1 2
2 √ √
S = 2π f (x) · 1 + (f ′ (x)) d x (7.3.166)
a = 2 + ln 2+1
⋄ 7.3.55. Найдем площадь поверхности,
√ образо- Теорема 7.3.26. Пусть ϕ : [α, β] → R и χ :
ванной вращением параболы y = x, x ∈ [0; b]: [α, β] → R – две гладкие функции, причем
и
ϕ′ (t) > 0, t ∈ (α, β). (7.3.168)
Тогда площадь поверхности вращения, образо-
ванной параметризованной кривой
(
По формуле (7.3.166) получаем x = ϕ(t)
D: , t ∈ [α; β] (7.3.169)
s y 2 + z 2 = χ(t)2
b 2
√ 1
ˆ
S = 2π x· 1+ √ dx = вычисляется по формуле
0 2 x
b
r ˆ br ˆ β q
√ 1 1
ˆ
2 2
= 2π 1+ x· d x = 2π x + dx = S = 2π χ(t) · (ϕ′ (t)) + (χ′ (t)) d t (7.3.170)
0 4x 0 4 α
ˆ br 23
1 1 2 1 b ⋄ 7.3.57. Найдем площадь поверхности, образо-
= 2π x+ d x+ = 2π x+ = ванной вращением астроиды
0 4 4 3 4 0
( 3 23 ) (
4π 1 2 1 x = a cos3 t
= b+ − =
3 4 4 y = a sin3 t
( 23 )
4π 1 1 вокруг оси OX:
= b+ −
3 4 8
S
=
2
По формуле (7.3.161) получаем ˆ π
2
q
= 2π a sin3 t · (−3a cos2 t sin t)2 + (3a sin2 t cos t)2 d t =
0
ˆ p π ˆ π p
S = 2π sin x · 1 + cos2 x d x = = 2π 2
a sin3 t · 9a2 cos4 t sin2 t + 9a2 sin4 t cos2 t d t =
0 0
ˆ πp ˆ π
2 p
= −2π 1 + cos2 x d cos x = = 6a2 π sin3 t · | cos t sin t| cos2 t + sin2 t d t =
0 0
cos x = t
ˆ −1 p ˆ π
2
= x ∈ [0; π] ⇔ t ∈ [1; −1] = −2π 1 + t2 d t = = 6a2 π sin3 t · cos t sin t · 1 · d t =
1 0
§ 3. Формула Ньютона-Лейбница 467
ˆ π
2
⇓
= 6a π 2
sin4 t · cos t d t =
0 xk π xk
π < <
ˆ 2 sin5 t π
2
2k + 1 2 2k
= 6a2 π sin4 t d sin t = 6a2 π = ⇓
0 5 0
6 2 2k π 2k xk xk π
= a π · < · = <
5 2k + 1 |{z}
2 2k + 1 2k 2k + 1 2
>
Отсюда полная площадь xk
2k
12 2 ⇓
S= a π
5 2k π xk π
· < <
⊲⊲ 7.3.58. Найдите площади поверхностей, обра- 2k + 1
| {z } 2 2k + 1 2
зованных вращением следующих кривых вокруг ↓
оси OX: 1
1) x = a cos t, y = b sin t ⇓
2) x = a(t − sin t), y = b(1 − cos t), t ∈ [0; 2π] xk π
−→
ex +e−x
2k + 1 k→∞ 2
3) y = ch x = 2 ,x ∈ [a; b]
Тогда:
<
0
h πi 0
sin2k+1 x < sin2k x < sin2k−1 x, x ∈ 0,
2 ⇓ подстановка: x =
1
2n + 1
⇓ 1
1 1+ 2n+1 2 1
ln 1 + = ln 1 > = 1
ˆ π ˆ π n 1− 2n+1
2n + 1 n+ 2
2 2
sin2k+1 x d x < sin2k x d x < ⇓
0 0
π n+ 21
1 1 1
ˆ 2
< sin2k−1 x d x ln 1 + = n+ · ln 1 + >1
0
n 2 n
⇓
⇓ (7.3.138)
n+ 21
(2k)!! (2k − 1)!! π (2k − 2)!! 1
< · < 1+ >e
(2k + 1)!! (2k)!! 2 (2k − 1)!! n
⇓
⇓
2 2
1 (2k)!! π 1 (2k)!! n!·en 1
· < < · xn nn+ 2
1
(n + 1)n+1+ 2
2k + 1 (2k − 1)!! 2 2k (2k − 1)!! = (n+1)!·en+1
= 1 =
| {z } | {z } xn+1 1 (n + 1) · nn+ 2 · e
xk xk (n+1)n+1+ 2
468 Глава 7. ИНТЕГРАЛ
1 n+ 12 2
1 (n + 1)n+ 2 1 1 1 2k · k! · 2k−1 · (k − 1)!
= · 1 = · 1 + >1 = · =
e nn+ 2 e n 2k + 1 (2k − 1)!
k 2
⇓ 1 2 · k! · 2k · k!
= · =
xn > xn+1 2k + 1 2k · (2k − 1)!
24k (k!)4 (7.3.173)
Мы получили, что {xn } – убывающая и ограни- = · 2 ∼
ченная снизу нулем последовательность. Значит, 2k + 1 k→∞
(2k)!
у нее имеется предел: 4
1
kk+ 2
n! · en a · ek 4k+2
xn = −→ a 24k 24k a4 · k e4k
nn+ 2
1
n→∞ ∼ · 2 = · 4k+1 =
k→∞ 2k 1
(2k)2k+ 2
2k a2 · (2k)4k
a · e2k e
Это соотношение можно понимать как эквива-
лентность
24k a2 · k 4k+2 24k a2 · k 4k+2 a2
n+ 21 = · = · 4k+1 4k+1 =
n 2k (2k) 4k+1 2k 2 ·k 4
n! ∼ a · , (7.3.173)
n→∞ en
в которой a ∈ R – пока неизвестное число. Для ⇓
его нахождения и нужна доказанная выше фор-
мула Валлиса (7.3.172): 2π = a2
2 ⇓
π 1 (2k)!!
←− · = (2.2.257) = √
2 ∞←k 2k + 1 (2k − 1)!!
2 2π = a
1 (2k)!! · (2k − 2)!!
= · = (2.2.256) = Это превращает (7.3.173) в (7.3.171).
2k + 1 (2k − 1)!
Глава 8
НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ
И ЧИСЛОВЫЕ РЯДЫ
§1 Несобственные интегралы
Несобственный интеграл формализует в математическом анализе идею площади неограниченной
фигуры.
469
470 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
1 1
1
ˆ
S = lim d x = lim ln x =
t→+0 t x t→+0 t
= lim (ln 1 − ln t) = +∞
t→+0
π
и оказывается, что она равна 2:
+∞ t
dx dx
ˆ ˆ
= lim =
0 1 + x2 t→+∞ 0 1 + x2
⋄ 8.1.3. Еще один пример – площадь криволи- t π
1
нейной трапеции, ограниченной кривой y = 1+x = lim arctg x = lim arctg t =
2 t→+∞ 0 t→+∞ 2
После этих примеров естественно спросить, какой должна быть неограниченная криволинейная
трапеция, чтобы ее площадь была конечна? И чему равны площади конкретных неограниченных
криволинейных трапеций? Об этом мы поговорим в настоящей главе.
Если этот предел существует и конечен, то говорят, что несобственный интеграл схо-
дится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
• Аналогично, если f локально интегрируема на полуинтервале (−∞; a], то предел
ˆ b
lim f (x) d x
t→−∞ t
и опять если этот предел существует и конечен, то говорят, что несобственный интеграл
сходится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
Рассмотрим примеры.
+∞ t
⋄ 8.1.11.
ˆ ˆ
cos x d x = lim cos x d x =
ˆ +∞ ˆ t 0 t→+∞ 0
dx dx t
= lim = = − lim sin x = − lim sin t
1 x t→+∞ 1 x t→+∞ 0 t→+∞
t | {z }
= − lim ln x = − lim ln t = ∞ предел не существует
t→+∞ 1 t→+∞
x1−α x=b +∞ ˆ +∞
= lim = dx
ˆ
t→+0 (1 − α) x=t
α
= x−α d x =
1−α a x a
b t1−α ˆ t
= lim − = x1−α d x x=t
t→+0 (1 − α) (1 − α) = lim x−α d x = lim =
1 − α > 0 t→+∞ a t→+∞ (1 − α) x=a
b1−α 1−α
= поэтому = t a1−α 1−α>0
t1−α → 0 (1 − α) = lim − = 1−αпоэтому =∞
t→+∞ (1 − α) (1 − α) t →∞
2) Если α = 1, то интеграл расходится:
ˆ b ˆ b ˆ b
dx dx dx
α
= = lim = Теорема 8.1.3 (о несобственном интеграле от
0 x 0 x t→+0 t x
x=b
показательной функции).
= lim ln x = lim {ln b − ln t} = ∞ (
t→+0 x=t t→+0 ˆ +∞
x сходится, если 0 < A < 1
3) Если α > 1, то интеграл расходится: A d x ←−
a расходится, если A > 1
ˆ b ˆ b ˆ b
dx −α Доказательство. Рассмотрим три случая.
α
= x d x = lim x−α d x =
0 x 0 t→+0 t 1) Если 0 < A < 1, то интеграл сходится:
x1−α d x x=b
= lim = ˆ +∞ ˆ t
t→+0 (1 − α) x=t
1−α 1−α <0 Ax d x = lim Ax d x =
b d x t1−α d x a t→+∞ a
= lim − = 1−α поэтому = Ax t 1
t→+0 (1 − α) (1 − α) t →∞
= lim = lim (At − Aa ) =
=∞ t→+∞ ln A a ln A t→+∞
0 < A < 1
Aa
= поэтому = −
At → 0 ln A
Теорема 8.1.2 (о несобственном интеграле по
бесконечному промежутку от степенной функ- 2) Если A = 1, то интеграл расходится:
ции).
(
ˆ +∞ ˆ +∞ ˆ t
ˆ +∞
dx сходится, если α > 1 Ax d x = 1 d x = lim 1 dx =
←− a a t→+∞ a
xα
a расходится, если α 6 1 x t t−a
= lim = lim = +∞
Доказательство. Рассмотрим три случая. t→+∞ ln A a t→+∞ ln A
1) Если α > 1, то интеграл сходится:
3) Если A > 1, то интеграл расходится:
ˆ +∞ ˆ +∞ ˆ t
dx −α
= x d x = lim x−α d x = ˆ +∞ ˆ t
a xα a t→+∞ a Ax d x = lim Ax d x =
t→+∞
x1−α d x x=t a a
= lim = Ax t 1
t→+∞ (1 − α) x=a = lim = lim (At − Aa ) =
1−α t→+∞ ln A a ln A t→+∞
t a1−α 1−α<0 A>1
= lim − = поэтому =
t→+∞ (1 − α) (1 − α) t1−α → 0 = поэтому
t
=∞
A →∞
t1−α
=
(1 − α)
474 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
2 t 2
⋄ 8.1.15. = lim − 1 = lim 2− 1 =2
ˆ +∞ ˆ +∞ ˆ t t→+∞ x2 1 t→+∞ t2
1 1 1
√ d ln x = 3 d x = lim 3 dx =
1 x 1 x2 t→+∞ 1 x 2
Тогда ˆ b ˆ β ˆ β
f (x) d x = f (ϕ(t)) d ϕ(t) = f (ϕ(t)) · ϕ′ (t) d t (8.1.1)
a α α
Доказательство. Здесь используется тот же прием, что и при доказательстве теоремы 7.3.5 о за-
мене переменной в определенном интеграле.1 Пусть F – первообразная функции f на полуинтервале
[a, b):
F ′ (x) = f (x), x ∈ [a, b) (8.1.2)
Например, в качестве F можно взять интеграл с переменным верхним пределом:
ˆ ˆ x
F (x) = f (t) d t = f (t) d t, x ∈ [a, b)
[a,x] a
(тогда по теореме 7.3.1 F будет первообразной для f на каждом отрезке [a, c] ⊆ [a, b), и значит,
на всем полуинтервале [a, b)). Композиция F ◦ ϕ будет первообразной для функции (f ◦ ϕ) · ϕ′ , на
полуинтервале [α, β), по формуле (5.1.28):
[a, b)
k
D(F ′ )
Поэтому
ˆ β ˆ T t=T
f (ϕ(t)) · ϕ′ (t) d t = lim f (ϕ(t)) · ϕ′ (t) d t = (7.3.127) = lim (F ◦ ϕ)(t) =
α T →β−0 α T →β−0 t=α
1 Можно использовать теорему 7.3.5 напрямую, но для этого нужно ввести дополнительное условие, что функция
ϕ : [α, β) → [a, b) монотонна, чтобы для всякого T ∈ [α, β) ограничение ϕ|[α,T ] было отображением из [a, T ] в [a, ϕ(T )]
−−→ −−−−→
(и поэтому преобразованием ориентированного отрезка α, T в ориентированный отрезок a, ϕ(T )).
§ 1. Несобственные интегралы 475
= lim F ϕ(T ) − F ϕ(α) = lim F ϕ(T ) − F (a) = (7.3.127) =
T →β−0 | {z } T →β−0
=
(7.3.133)
a
ˆ ϕ(T ) ˆ y ˆ b
= lim f (x) d x = lim f (x) d x = f (x) d x
T →β−0 a y→b−0 a a
⋄ 8.1.16. ⋄ 8.1.17.
+∞ x = 1t , 1
dx t= x
ˆ
1 √
√ = x = 2 ⇔ t = 12 =
ˆ
dx t = 1 − x, x = 1 − t2
2 x x2 − 1 x → +∞ ⇔ t → +0 √ = x=0⇔t=1 =
0 ˆ 21 1 0 (2 − x) 1 − x x → 1 − 0 ⇔ t → +0
− dt dt π
ˆ
2 ˆ 0 ˆ 1
= √ = √ = arcsin t = −t d t dt 1 π
1 1−t 2
0 1−t 2 0 6 = 2 + 1)
= 2+1
= arctg t =
2
1 t(t 0 t 0 2
и Вы увидите, что это нелегко. Поэтому часто бывает важно просто понять, сходится или нет
данный несобственный интеграл, не вычисляя его. Например, интеграл (8.1.4), как будет показано
в примере 8.1.19 сходится (хотя и непонятно, чему равен).
В этом параграфе мы приведем некоторые признаки сходимости несобственных интегралов.
´b
! 8.1.18. Условие справа (то есть утверждение, что интегралы a f (x) d x ограничены) принято
записывать неравенством
ˆ b
f (x) d x < ∞
a
´b
и, в силу теоремы 8.1.5, такая запись считается эквивалентной утверждению, что интеграл a f (x) d x
сходится (при неотрицательной f ).
Доказательство. Обозначим
ˆ t
F (t) = f (x) d x
a
и заметим, что это будет монотонно неубывающая функция, поскольку под интегралом стоит неот-
рицательная функция: если α 6 β, то
ˆ α ˆ α ˆ β ˆ β
F (α) = f (x) d x 6 f (x) d x + f (x) d x = f (x) d x = F (β)
a a
|α {z } a
6
m
ˆ t
F имеет конечный предел слева в b: lim F (t) = lim f (x) d x < ∞
t→b−0 t→b−0 a
| {z }
(применяем (3.4.151), поскольку F – неубывающая функция) k
sup F (t)
t∈[a,b)
m
ˆ t
sup f (x) d x = sup F (t) < ∞.
t∈[a,b) a t∈[a,b)
Тогда
§ 1. Несобственные интегралы 477
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a f (x) d x: ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится
a a
´c
(ii) из расходимости меньшего интеграла a
f (x) d x следует расходимость большего инте-
´c
грала a g(x) d x:
ˆ c ˆ c
f (x) d x расходится =⇒ g(x) d x расходится
a a
Доказательство. Обозначим
ˆ t ˆ t
F (t) = f (x) d x, G(t) = g(x) d x
a a
и, во-вторых,
0 6 F (t) 6 G(t), t ∈ [a; c). (8.1.7)
1. Теперь мы получаем цепочку:
ˆ c
g(x) d x сходится
a
⇓ теорема 8.1.5
ˆ t
sup G(t) = sup g(x) d x < ∞
t∈[a,b) |{z} t∈[a,b) a
6
(8.1.7)
F (t)
⇓
ˆ t
sup F (t) = sup f (x) d x < ∞
t∈[a,b) t∈[a,b) a
⇓ теорема 8.1.5
ˆ c
f (x) d x сходится
a
´ c 2. Мы доказали утверждение (i). ´ c Утверждение (ii) является его следствием: если интеграл
a
f (x) d x расходится, то интеграл g(x) d x не может сходиться (потому что иначе мы получили
´c ´c a
бы что a f (x) d x расходится, а a g(x) d x сходится, а это невозможно в силу уже доказанного
утверждения 2 (A)).
⋄ 8.1.19. Чтобы понять, сходится ли интеграл причем больший интеграл сходится по теореме
8.1.1. Значит, по теореме 8.1.6, наш исходный ин-
sin2 x1
ˆ 1
√ dx теграл тоже сходится.
0 x ´ 1 sin2 1
Вывод: интеграл 0 √xx d x сходится.
заметим, что подынтегральная функция поло-
жительна и меньше функции √1x :
⋄ 8.1.20. Для следующего интеграла
sin2 1 1
06 √ x 6 √
x x 1
1
ˆ
Отсюда получаем dx
0 sin x
sin2 x1
ˆ 1 ˆ 1
1
06 √ dx 6 √ dx мы аналогичные рассуждения запишем более ко-
0 x 0 x
478 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
+∞ +∞
3 + cos x 4
ˆ ˆ ´ +∞ 3+cos
√ x
√ dx 6 √ dx = Вывод: интеграл π x
d x расходится.
π x x π x x
⊲⊲ 8.1.23. Исследуйте на сходимость интегралы:
ˆ +∞
1
=4 3 dx
| π x
{z
2
} ´ +∞ sin2 x ´1 cos x 1
1) π x2 d x; 4) 0
√ 3 x d x;
сходится по
теореме 8.1.2
´ +∞ ln x ´ 1 e x1
2) e 3 x d x;
√
5) d x;
0 x3
´ +∞ 3+cos
´ +∞ arctg x ´ 0 e x1
Вывод: интеграл √ x d x сходится. 3) d x; 6) −1 x3 d x
√
π x x 2 x x
Теорема 8.1.7 (критерий Коши сходимости несобственного интеграла). 2 Пусть функция f ло-
кально интегрируема на полуинтервале [a; b). Тогда следующие условия эквивалентны:
(i) несобственный интеграл
ˆ b
f (x) d x
a
сходится;
(ii) для любых двух числовых последовательностей sn , tn ∈ [a; b), стремящихся к b
sn −→ b, tn −→ b,
n→∞ n→∞
m (теорема 3.4.12)
2 Этот результат понадобится ниже при доказательстве признака абсолютной сходимости несобственного интеграла
(теорема 8.1.8)
§ 1. Несобственные интегралы 479
=
´ tn ´ sn
a
f (x) d x − a
f (x) d x
=
´ tn
sn
f (x) d x
m
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞
( 2 )
⋄ 8.1.24. Критерий Коши обычно бывает удобен 1 5π π 2
для доказательства расходимости несобственно- = + 2πn − + 2πn =
4 6 6
го интеграла (если он действительно расходит-
ся). Рассмотрим, например, интеграл 1 n 25π 2 5
= + π 2 n + π 2 · n2 −
ˆ +∞ 4 36 3
π2 1 2 o
x · sin x d x = − π n − π 2 · n2 =
0 36 3
Выберем следующие две числовые последова- 1 n 24π 2 4 o
= + π 2 n −→ ∞ = 6 0,
тельности: 4 36 3 n→∞
π 5π
sn = + 2πn, tn = + 2πn и по признаку Коши это означает, что наш инте-
6 6
грал расходится.
Тогда ´ +∞
Вывод: интеграл 0 x · sin x d x расходится.
1
∀x ∈ [sn ; tn ] sin x >
2
поэтому ⊲ 8.1.25. Проверьте по критерию Коши, что ин-
ˆ tn ˆ tn теграл
1 ˆ +∞
x · sin x d x > x · dx =
sn sn 2 x · cos x d x
0
x2 5π
6 +2πn
= = расходится.
4 π
6 +2πn
Доказательство.
ˆ b
интеграл |f (x)| d x сходится
a
⇓ (теорема 8.1.7)
ˆ tn
∀sn −→ b, ∀tn −→ b |f (x)| d x −→ 0
n→∞ n→∞ sn n→∞
| {z }
6
´ tn
sn
f (x) d x
6
⇓
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞
480 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
⇓
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞
⇓ (теорема 8.1.7)
ˆ b
несобственный интеграл f (x) d x сходится
a
По свойству непрерывности интеграла 60 на с.435, это будет непрерывная функция на отрезке [a, b].
На концах этого отрезка она принимает такие значения:
ˆ b ˆ b
F (a) = g(b) · f (x) d x, F (b) = g(a) · f (x) d x
a a
3 П.О.Бонне (1819-1892) – французский математик
§ 1. Несобственные интегралы 481
⇓
g(a) · f (x) 6 g(x) · f (x) 6 g(b) · f (x), x ∈ [a, b]
⇓
ˆ b ˆ b ˆ b
g(a) · f (x) d x 6 g(x) · f (x) d x 6 g(b) · f (x) d x
a a a
| {z } | {z }
=
=
F (b) F (a)
´b
Таким образом, число a g(x) · f (x) d x лежит между двумя значениями F (a) и F (b) функции F ,
непрерывной на отрезке [a, b]. По теореме Коши о промежуточном значении 3.3.6, найдется точка
ξ ∈ [a, b] такая, что
ˆ b
F (ξ) = g(x) · f (x) d x,
a
Тогда интеграл
ˆ +∞
f (x) · g(x) d x
a
сходится.
Доказательство. Обозначим
ˆ t
C = sup f (x) d x < ∞
t>a a
и заметим, что
ˆ t
∀s, t ∈ [a, ∞) f (x) d x 6 2C (8.1.11)
s
482 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Действительно,
ˆ t ˆ t ˆ s ˆ t ˆ s
f (x) d x = f (x) d x − f (x) d x 6 f (x) d x + f (x) d x 6 2C
s a a a a
| {z } | {z }
>
>
C C
´∞
Чтобы убедиться, что интеграл a f (x)·g(x) d x сходится, воспользуемся критерием Коши (теорема
8.1.7): выберем произвольные последовательности
sn −→ +∞, tn −→ +∞.
n→∞ n→∞
−−−→
По формуле Бонне (8.1.8), для любого n найдется точка ξn ∈ sn , tn такая, что
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x
sn sn ξn
−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x 6 |g(sn )| · f (x) d x + |g(tn )| · f (x) d x −→ 0
sn | {z } sn | {z } ξn n→∞
↓ | {z } ↓ | {z }
>
>
0 (8.1.11) 0 (8.1.11)
2C 2C
´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.
−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞
ограничена ограничена
ˆ tn z }| { ˆ ξn z }| { ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x −→ 0
sn sn ξn n→∞
| {z } | {z }
↓ теорема 8.1.7 ↓ теорема 8.1.7
0, 0,
´поскольку
∞ ´поскольку
∞
a
f (x) d x a
f (x) d x
сходится сходится
´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.
вспомним, что в примере (8.1.29) мы убедились, ⋄ 8.1.34. Следующий интеграл заменой пере-
что интеграл менных превращается в интеграл, который мож-
но исследовать по признаку Абеля:
ˆ +∞
sin x
dx
1 x ˆ 1 t = x1
arccos x 1
· cos d x = x = 1t =
сходится. Поскольку функция x 7→ arctg x мо- x x
0 d x = − dt2t
нотонна, по
´ +∞признаку Абеля мы получаем, что ˆ 1
sin x 1 dt
интеграл 1 x · arctg x d x тоже сходится. =− t · arccos · cos t · 2 =
+∞ t t
⋄ 8.1.33. Для исследования интеграла ˆ ∞
cos t 1
ˆ +∞ = · arccos d t
1 1 t t
x2 · sin x2 · cos d x
1 x ´∞
По признаку Дирихле интеграл 1 cost t d t схо-
вспомним, что в примере 8.1.30 мы доказали схо-
дится. А функция x 7→ arccos 1t монотонна и
димость интеграла
ограничена на [0, +∞).´Значит, по признаку Абе-
∞
ˆ +∞ ля, сходится интеграл 1 cost t ·arccos 1t d t, а вме-
2 2
x · sin x d x ´ 1
сте с ним и интеграл 0 arccos x
· cos x1 d x.
1 x
При этом,
484 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
! 8.1.35. Если интегралы (8.1.12) расходятся, то то соотношение (8.1.14) для сходящихся инте-
формула (8.1.13) утрачивает смыл, и поэтому пе- гралов возможно только, если подынтегральные
рестает быть верной. А если интегралы (8.1.12) функции совпадают. Действительно, из неравен-
сходятся, то формула (8.1.14), хотя и сохраняет ства g(x) > 0 следует, что интеграл от g не может
смысл, но также перестает работать. Например, быть нулевым,
x−1 1
∼ ˆ c ˆ T
x3 x→+∞ x2 g(x) d x = lim g(x) d x 6= 0
однако a T →c−0 a
ˆ T ˆ T
x−1 1 1 Поэтому соотношение (8.1.14), если оно выпол-
dx = − 3 dx = няется, означает просто равенство пределов:
1 x3 1 x2 x
T
1 1 1 1 1 ˆ T ˆ T
= − + 2 =− +1+ 2
− ∼ lim f (x) d x = lim g(x) d x
x 2x T 2T 2 T →+∞ T →c−0 T →c−0
1 a a
T
1 1 1
∼ 6∼ 1 ∼ 1− =− = Отсюда
T →+∞ 2 T →+∞ T →+∞ T x 1
ˆ T
1 0
= dx
>
2
1 x z }|
ˆ T {
То есть lim g(x) − f (x) d x =
T →c−0 a
T T
x−1 1
ˆ ˆ
T T
d x 6∼ dx
ˆ ˆ
1 x3 T →+∞ 1 x2 = lim g(x) d x − lim f (x) d x = 0
T →c−0 a T →c−0 a
Более того, можно заметить, что если одна из
функций не превосходит другую на интервале ⇓
интегрирования, например,
f (x) 6 g(x), x ∈ [a, c) f (x) = g(x), x ∈ [a, c)
Доказательство. Это следует из того, что интегралы по промежуткам [a; c) и [b; c) отличаются
друг от друга на константу
!
ˆ c ˆ ˆ t ˆ b t
f (x) d x = lim f (x) d x = lim f (x) d x + f (x) d x =
a t→c a t→c a b
ˆ b ˆ t ˆ b ˆ c
= f (x) d x + lim f (x) d x = f (x) d x + f (x) d x
a t→c b a b
§ 1. Несобственные интегралы 485
Доказательство теоремы 8.1.12. . 1. Сначала докажем (8.1.12). Условие (b) означает, что
f (x)
−→ 1 (8.1.15)
g(x) x→c−0
f (x)
По определению предела Коши (с.274), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ ( 12 ; 23 ), то
есть
1 f (x) 3
∀x ∈ [b; c) < <
2 g(x) 2
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
1 3
∀x ∈ [b; c) g(x) < f (x) < g(x)
2 2
Перепишем это иначе: (
g(x) < 2f (x)
∀x ∈ [b; c) (8.1.16)
f (x) < 32 g(x)
Отсюда получаются две цепочки следствий. Во-первых,
ˆ c
интеграл f (x) d x сходится, то
a
⇓
ˆ c
интеграл 2f (x) d x сходится
b
вспоминаем первое неравенство
⇓ в (8.1.16) и теорему 8.1.6
ˆ c
интеграл g(x) d x сходится
b
И, во-вторых, ˆ c
интеграл g(x) d x сходится, то
a
⇓
c
3
ˆ
интеграл g(x) d x сходится
b 2
вспоминаем второе неравенство
⇓ в (8.1.16) и теорему 8.1.6
ˆ c
интеграл f (x) d x сходится
b
Мы доказали (8.1.12).
486 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
2. Остается доказать (8.1.13) и (8.1.14). Обе эти формулы доказываются с помощью правила
Лопиталя. Сначала предположим, что оба интеграла сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a
Тогда
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
и поэтому
´c
T f (x) d x 0 −f (T ) f (T )
lim c = = (5.2.91) = lim = lim = (8.1.15) = 1
T →c−0 −g(T )
´
T →c−0
T
g(x) d x 0 T →c−0 g(T )
Тогда
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim ´T = = (5.2.94) = lim = (8.1.15) = 1
T →c−0 g(x) d x ∞ T →c−0 g(T )
a
1
Второй интеграл сходится, значит, наш исходный
Поскольку второй интеграл расходится, мы по- интеграл тоже сходится. Его скорость сходимо-
лучаем, что наш исходный интеграл тоже расхо- сти описывается формулой (8.1.13):
дится: ˆ T √ ˆ T √
ˆ +∞ √ 2 sin x 1
x +1 x
d x ∼ √ d x = 2 T.
dx = ∞ 0 e −1 T →+0 0 x
x 2
1
⋄ 8.1.38. Те же самые рассуждения для инте-
Из формулы (8.1.14) можно вывести скорость грала
ˆ 1
расходимости: 1 − cos x
dx
ˆ T √ 0 ln(1 + x3 )
T
x2 + 1 1
ˆ
dx ∼ d x = ln T запишем короче:
x2 T →+∞ 1 x
1
§ 1. Несобственные интегралы 487
1 1 x2
1 − cos x Последний интеграл расходится, значит, наш ис-
ˆ ˆ
2
dx ∼ dx = ходный интеграл тоже расходится. Скорость рас-
0 ln(1 + x3 ) 0 0 x3
1 1 ходимсоти:
1 1
ˆ
= d x = ln x
2 0 x 0 T ˆ T
x + sin x 1
ˆ
√ dx ∼ √ dx =
Второй интеграл расходится, значит, наш исход- 1 1 + x3 T →+∞ 1 x
ный интеграл тоже расходится. Скорость расхо- √ T √ √
=2 x =2 T −2 ∼ 2 T
димости описывается формулой 1 T →+∞
1
1 − cos x 1 1
1 ⊲⊲ 8.1.41. Исследуйте на сходимость интегралы
ˆ ˆ
dx ∼ d x = − ln T и оцените скорость сходимости и расходимости:
T ln(1 + x3 ) T →+0 2 T x
´ +∞ 1
1) 2 √ d x;
⋄ 8.1.39. Снова интеграл по бесконечному про- ´ +∞
1+ x
межутку: 2) 2 √1 d x;
1+ x+x5
´ −2 1
+∞ ˆ +∞ 3) −∞ 1+x5 d x;
x + sin x x
ˆ
√ dx ∼ √ dx = ´1
1 1+x 6 x→+∞ 1 x6 4) 0 arctg√ x d x;
x3x
ˆ +∞ ˆ +∞
x 1 1 +∞ ´ +∞ arctg x
5) 1 √ d x;
= d x = d x = − x3x
1 x3 1 x2 x 1 ´ 1 arctg x
6) 0 √ 3
x
d x;
Последний интеграл сходится, значит, наш ис- ´ +∞ arctg x
ходный интеграл тоже сходится. Скорость схо- 7) 1 √3x d x;
димости: ´ 1 ex −1
8) 0 x3 d x;
+∞ +∞
´0 x
x + sin x 1 1 9) −1 e x−1 d x;
ˆ ˆ
3
√ dx ∼ dx =
T 1 + x6 T →+∞ T x2 T ´1 1
10) 0 √x−1 d x;
⋄ 8.1.40. Еще один интеграл по бесконечному
´1 1
11) 0 √x−1 d x;
промежутку: ´1 1
12) 0 ex −cos x d x;
ˆ +∞
x + sin x
ˆ +∞
x ´ 1 ln(1+ √ 3 2
x )
√ dx ∼ √ dx = 13) 0 ex −1 d x;
1+x 3 x→+∞ x3
1 1 ´ +∞ ln(1+ x1 )
ˆ +∞
1 √ +∞ 14) e x+ln x d x;
= √ dx = 2 x ´ +∞ ln(1+ x1 +x)
x 1 15) e 1+ln x+sin x d x.
1
Тогда
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a
f (x) d x:
ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится, (8.1.17)
a a
причем скорости сходимости оцениваются соотношением
ˆ c ˆ c
f (x) d x ≪ g(x) d x; (8.1.18)
T T →c−0 T
488 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
´c
(ii) из расходимости меньшего интеграла a
f (x) d x следует расходимость большего инте-
´c
грала a g(x) d x:
ˆ c ˆ c
f (x) d x расходится =⇒ g(x) d x расходится (8.1.19)
a a
f (x)
−→ 0. (8.1.21)
g(x) x→c−0
f (x)
По определению предела Коши (с.274), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ (− 12 ; + 12 ),
то есть
1 f (x) 1
∀x ∈ [b; c) − < <+
2 g(x) 2
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
1 1
∀x ∈ [b; c) − g(x) < f (x) < g(x)
2 2
Перепишем это иначе:
1
∀x ∈ [b; c) |f (x)| < g(x) (8.1.22)
2
Отсюда получается следующая цепочка следствий:
ˆ c
интеграл g(x) d x сходится
a
⇓ лемма 8.1.13
ˆ c
интеграл g(x) d x сходится
b
⇓
c
1
ˆ
интеграл g(x) d x сходится
b 2
⇓ неравенство (8.1.22) и теорема 8.1.6
ˆ c
интеграл |f (x)| d x сходится
b
⇓ теорема 8.1.8
ˆ c
интеграл f (x) d x сходится
b
2. Теперь вспомним о формулах (8.1.18) и (8.1.20). Они доказывается тем же приемом (с помощью
правила Лопиталя), что и формулы (8.1.13)-(8.1.14) выше. Сначала предположим, что оба интеграла
сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a
Тогда
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
§ 1. Несобственные интегралы 489
и поэтому
´c
f (x) d x 0 −f (T ) f (T )
lim ´Tc = = (5.2.91) = lim = lim = (8.1.21) = 0
T →c−0 g(x) d x 0 T →c−0 −g(T ) T →c−0 g(T )
T
Тогда
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim ´T = = (5.2.94) = lim = (8.1.21) = 0
T →c−0 g(x) d x ∞ T →c−0 g(T )
a
d x ≪ e −x2 d x = −2e −x
2 10
d x ≫ e2 dx =
ex +∞ 0 0 1 x T →+∞ 1
0
T 1 T
= 2e 2 − 2e 2 ∼ 2e 2
Поскольку больший интеграл (справа от ≪) схо- T →+∞
дится, меньший (то есть наш исходный) интеграл и, если упростить,
тоже должен сходиться. Его скорость сходимости ˆ T x
оценивается формулой (8.1.18): e T
10
dx ≫ e2
ˆ +∞ 10 ˆ +∞ 1 x T →+∞
x sin x −x − T2
dx ≪ e 2 d x = 2e Применяя оценку
T ex T →+∞ T
x
d x ≪ e− 2
T e T →+∞ ˆ T x
e
10
d x ≫ aT (a < e)
Применяя оценку 1 x T →+∞
Последний интеграл сходится, значит меньший Последний интеграл расходится, значит боль-
(исходный) интеграл тоже сходится. Для ско- ший (исходный) интеграл тоже расходится. Для
рость сходимости с помощью той же оценки по- скорости расходимости получаем с помощью той
лучается формула: же оценки формулу:
T 3 x = y,
1
x = y3 1 1 1
= y, x = y1 1
ln x 1
ˆ √
ˆ ˆ
1 x
√ d x = x → +0 ⇔ y → +∞ = e x dx = x = T ⇔ y = T1 = ey d ≫
0
3
x x = T ⇔ y = T1 T x=1⇔y=1 1
T
y T →+0
ˆ +∞ ˆ +∞ 1
ln y y y2 1
1 1
ˆ T T
= −9 3
d y ≪ −9 3
dy = ≫ dy = y = −1 ∼
1
T
y T →+0
T
1 y T →+0 1 y2 1 T T →+0 T
9 +∞
= = 9T Применяя формулу
y 1
T
x
sin t
ˆ
⋄ 8.1.48. Найдем асимптотику интеграла F (x) = d t = ... =
ˆ x 1 t2
sin t ˆ ∞
F (x) = dt (8.1.27) cos x cos t
1 t2 = A− 2 −2 dt =
x x t3
ˆ ∞
Прежде всего заметим, что существует конечный cos x d sin t
=A− 2 −2 =
предел x x t3
ˆ ∞
ˆ ∞
sin t cos x 2 sin t ∞ sin t
A = lim F (x) = dt =A− 2 − 3
− 6 dt =
t2 x t x t4
x→∞ 1 ˆ ∞x
cos x 2 sin x sin t
´∞ t =A− 2 + −6 dt =
– поскольку интеграл 1 sin t2 d t сходится абсо- x x 3 t4
| {z } x | {z}
лютно: o
x→+∞ x
(
1
2 ) ( t13 )
o
t→+∞
ˆ ∞ ˆ ∞
sin t 1 1 ∞ | {z }
2
d t 6 2
dt = − =1 o ( x12 )
1 t 1 t t 1 x→+∞
Запомним это число A. Тогда, интегрируя по ча- cos x 1
= A− 2 + o
x x→+∞ x2
стям один раз, получим:
´∞ И так далее. Увеличивая число интегрирований
sin t
dt
1 t2
ˆ ∞ по частям, мы будем повышать точность асимп-
=
ˆ x
sin t sin t тотического разложения.
F (x) = 2
d t = A − dt =
1 t x t2
ˆ ∞ ˆ ∞ ⋄ 8.1.49. Найдем асимптотику интеграла
d cos t cos t ∞ cos t
= A+ 2
= A+ 2
−2 dt = ˆ x
x t t x x t3 F (x) = tα · et d t, x → +∞
ˆ ∞
cos x cos t 1
=A− 2
+2 dt =
|x{z } x t3 }
| {z Интегрируя по частям, получаем:
o 1
x→+∞ x
( ) o
t→+∞
( )
1
t2
ˆ x ˆ x
| {z } F (x) = tα · e t d t = tα d e t =
o (x 1 1
1
) ˆ x
x→+∞ t=x
= tα · e t − e t d tα =
1 t=1
=A+ o 1
x→+∞ x ˆ x
α x
=x ·e −e−α· (8.1.28) tα−1 · et d t
Это первое асимптотическое разложение. Если 1
проинтегрировать по частям два раза, получится Поглядим внимательно на последний интеграл:
более точная формула:
tα−1 · et ≪ tα · et
t→+∞
§ 2. Числовые ряды 493
⇓ (8.1.20) ⇓
ˆ x ˆ x
tα−1 · et d t ≪ tα · et d t = F (x)
1 x→+∞ 1 ˆ x
Мы получаем: tα · et d t = (8.1.28) =
1
ˆ x
F (x) = xα · ex −e + o (F (x)) α x
x→+∞ =x ·e −e−α· tα−1 · et d t = (8.1.30) =
| {z } 1
o (F (x))
x→+∞ α x α−1 x α−1 x
= x ·e −e−α· x ·e + o x ·e =
x→+∞
⇓
α x = xα · ex − α · xα−1 · ex −e + o xα−1 · ex =
F (x) = x · e + o (F (x)) |
x→+∞
{z }
x→+∞
o (xα−1 ·ex )
⇓ x→+∞
x = xα · ex − α · xα−1 · ex + o xα−1 · ex
ˆ
α t α x
F (x) = t ·e dt ∼ x ·e x→+∞
1 x→+∞
⇓ Получается разложение:
ˆ x
x
tα ·et d t = xα ·ex −α·xα−1 ·ex + xα−1 · ex
ˆ
α t
t · e dt = x · e + α x
o α x
(x · e ) (8.1.29) o
1 x→+∞
1 x→+∞
(8.1.31)
Это первое асимптотическое разложение. Из Здесь также можно заменить α на α − 1 и после
него можно выводить асимптотики более высо- этого подставить полученную формулу в (8.1.28)
кого порядка. Заменив в (8.1.29) α на α − 1, мы – тогда появится асимптотика более высокого по-
получим цепочку: рядка, и так далее. Понятно, что асимптотиче-
ˆ x
ская последовательность здесь берется такая:
tα−1 · et d t = xα−1 · ex + o xα−1 · ex
1 x→+∞
(8.1.30) xα · ex ≫ xα−1 · ex ≫ xα−2 · ex ≫ ...
x→+∞ x→+∞ x→+∞
§2 Числовые ряды
Представим, что у нас есть числовая последовательность {an } и нам захотелось сосчитать (беско-
нечную) сумму ее элементов:
∞
X
an = a1 + a2 + a3 + ...
n=1
В таких случаях говорят, что нужно вычислить сумму числового ряда. Интересное наблюдение, с
которого начинается вся теория рядов, состоит в том, что иногда такая бесконечная сумма оказы-
вается конечной величиной.
⋄ 8.2.1. Например, нетрудно убедиться (это сле- (мы это сделаем в замечании 11.2.15 на с.647). С
дует из приводимой ниже формулы (8.2.34)), что другой стороны, сумма может оказаться и беско-
X∞ нечной, например,
1
= 1
2n ∞
n=1 X 1
Труднее доказать, что =∞
n=1
n
X∞
1 π2
= (8.2.32)
n=1
n2 6 (это будет доказано в примере 8.2.9).
Тогда такая пара последовательностей {an } и {SN } называется числовым рядом и обо-
значается ∞
X
an = a1 + a2 + a3 + ...
n=1
P∞
Числа an называются слагаемыми ряда n=1 an , а числа SN – частичными суммами
этого ряда.
• Если частичные суммы стремятся к некоторому конечному пределу
SN −→ S, (S ∈ R)
N →∞
P∞
то этот предел S называется суммой ряда n=1 an , а сам ряд называется сходящимся
(или про него говорят, что он сходится). Коротко это записывают формулой
∞
X
an = S
n=1
6 ∃ lim SN ∈ R,
N →∞
P∞
то ряд n=1 an называется расходящимся (или про него говорят, что он расходится).
=
= −1 + 1 − 1 = −1 1
1−q
N
X
an = SN −→ S
N →∞
n=1
Поэтому
N
X N
X N
X
(an + bn ) = an + bn = AN + BN −→ A + B
N →∞
n=1 n=1 n=1
P∞ P∞ P∞
Это означает, что ряд n=1 (an + bn ) сходится, и его сумма равна A + B = n=1 an + n=1 bn , то
есть справедлива формула (8.2.37).
X∞ X∞ n n
⋄ 8.2.6. 2n + 3n 2 3
= + =
X∞ ∞ 5 n 5 5
5 5X 1 делаем замену n=1 n=1
= = n−1=k = X∞ n X∞ n
2n 2 n=1 2n−1 тогда k = 0, 1, 2, ... 2 3
n=1 = + = (8.2.34) =
∞ 5 5
5 X 1 5 1 n=1 n=1
= · = · 1 =5 1 1 5 5 25
2 2k 2 1− 2 = + = + =
k=0 2 3
1− 5 1− 5
3 2 6
⋄ 8.2.7.
X∞
1 π2
2
= ,
n=1
n 6
m
SN имеет конечный предел lim SN ∈ R
N →∞
m SN – монотонно неубывает
N
X
SN – ограничена сверху: sup an = sup SN < ∞.
N ∈N n=1 N ∈N
498 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞
• Число C в этой формуле называется постоянной Эйлера ряда n=1 f (n).
Как следствие,
∞
X ˆ ∞
ряд f (n) сходится ⇐⇒ интеграл f (x) d x сходится
n=1 1
• Такую связь между рядом и несобственным интегралом (когда сходимость одного экви-
валентна сходимости другого) коротко записывают формулой
∞
X ˆ ∞
f (n) ∼ f (x) d x.
n=1 1
P∞ ´∞
и говорят при этом, что ряд n=1 f (n) эквивалентен интегралу 1 f (x) d x.
Доказательство. 1. Рассмотрим сначала вспомогательную последовательность
N
X ˆ N +1
FN = f (n) − f (x) d x
n=1 1
и покажем, что она сходится. Для этого нужно просто заметить, что она ограничена и монотонна.
Действительно, во-первых,
∀x∈[n,n+1]
z }| {
f (n) > f (x) > f (n + 1)
⇓
ˆ n+1
f (n) > f (x) d x > f (n + 1) (8.2.39)
n
⇓
ˆ n+1
−f (n) 6 − f (x) d x 6 −f (n + 1)
n
⇓
ˆ n+1
0 6 f (n) − f (x) d x 6 f (n) − f (n + 1) (8.2.40)
n
⇓
FN
=
PN ´ N +1
n=1 f (n) − 1
f (x) d x
=
PN PN ´ n+1
n=1 f (n) − n=1 n
f (x) d x
=
z }| {
XN ˆ n+1 XN
06 f (n) − f (x) d x 6 f (n) − f (n + 1) =
n=1 n n=1
↓ ↓ ↓ ↓ ↓ ↓
z}|{ z}|{ z}|{ z }| {
= f (1) − f (2) + f (2) − f (3) + ... + f (N ) −f (N + 1) = f (1) − f (N + 1) 6 f (1)
| {z } | {z } | {z } | {z }
n=1 n=2 n=N
6
0
§ 2. Числовые ряды 499
⇓
0 6 FN 6 f (1)
И, во-вторых,
N +1
! N
!
X ˆ N +2 X ˆ N +1
FN +1 − FN = f (n) − f (x) d x − f (n) − f (x) d x =
n=1 1 n=1 1
N +1 N
! !
X X ˆ N +2 ˆ N +1 ˆ N +1 (8.2.40)
= f (n) − f (n) − f (x) d x − f (x) d x = f (N +1)− f (x) d x > 0
n=1 n=1 1 1 N
⇓
FN +1 > FN
Итак, FN монотонна и ограничена, и значит, имеет предел:
FN −→ A
N →∞
2. Заметим далее, что последовательность f (n) тоже монотонна и ограничена, и значит тоже
имеет предел:
f (n) −→ B
n→∞
Отсюда, в силу (8.2.39), следует, что
ˆ n+1
f (x) d x −→ B
n n→∞
´ n+1
(потому что n
f (x) d x заключена между двумя милиционерами, стремящимися к B). Теперь
получаем:
N
X ˆ N N
X ˆ N +1 ˆ N +1
f (n) − f (x) d x = f (n) − f (x) d x + f (x) d x −→ A + B = C
1 1 N N →∞
n=1 n=1
| {z } | {z }
↓
=
B
FN
↓
A
´N 1
dx
1 x
⋄ 8.2.11.
Это число привлекает внимание специалистов по
∞
X ∞
теории чисел тем, что за прошедшие с его от- 1 1
ˆ
крытия два с половиной века до сих пор так и не ∼ dx =
n=2
n ln n 2 x ln x
удалось понять, будет ли оно рациональным. ∞
1 ∞
ˆ
⋄ 8.2.10. Ряд Дирихле. Покажем, что d ln x = ln ln x = ∞
=
2 ln x 2
∞
(
X 1 сходится, если α > 1 P∞ 1
← Вывод: ряд n=2 n ln n расходится.
n α
n=1
расходится, если α 6 1
(8.2.42) ⋄ 8.2.12.
Этот ряд называется рядом Дирихле. При α > 0
∞
X ˆ ∞
к нему применима теорема 8.2.3, и в этом случае 1 1
ему соответствуют постоянные Эйлера 2 ∼ 2 dx =
n=2
n ln n 2 x ln x
XN ˆ ∞
1 1 ∞ 1
1 N 1−α − 1 = d ln x = − =
Cα = lim − (8.2.43) 2
ln x ln x 2 ln 2
N →∞
n=1
nα | 1 − {z α }
2
P∞
=
´N 1
dx
Вывод: ряд n=2 n ln12 n сходится.
1 xα
Тогда
P∞ P∞
1) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :
∞
X ∞
X
an сходится ⇐= bn сходится
n=1 n=1
P∞ P∞
2) из расходимости меньшего ряда n=1 an следует расходимость большего ряда n=1 bn :
∞
X ∞
X
an расходится =⇒ bn расходится
n=1 n=1
§ 2. Числовые ряды 501
P∞ P∞
Доказательство. Обозначим через AN и BN частичные суммы рядов n=1 an и n=1 bn :
N
X N
X
AN = an , BN = bn
n=1 n=1
Тогда
B1 6 B2 6 B3 6 ... 6 BN 6 ...
6
A1 6 A2 6 A3 6 ... 6 AN 6 ...
1. Теперь возникает логическая цепочка:
∞
X
ряд bn сходится
n=1
⇓ теорема 8.2.2
P∞
⋄ 8.2.14. Вывод: ряд n=1
2+cos n
n2 сходится.
X∞ X∞
cos2 n 1 ⋄ 8.2.17.
n
6
n=1
2 n=1
2n
| {z } ∞
X 1
∞
X 1
сходится, √ > √ =
как сумма геометрической прогрессии
n=1
n · arctg(3 + sin n) n=1 n · arctg 4
со знаменателем |q| < 1
X∞
1 1
Больший ряд сходится, значит и меньший ряд = · √
сходится. arctg 4 n=1
n
P∞ 2 | {z }
Вывод: ряд n=1 cos2n n сходится. расходится,
⋄ 8.2.15. в силу примера 8.2.10
X∞
2 + cos n X∞
1 P∞ 1
> Вывод: ряд n=1
√
n·arctg(3+sin n)
расходится.
n=1
n n=1
n
| {z } ⊲⊲ 8.2.18. Исследуйте на сходимость ряды:
расходится,
в силу примера 8.2.9 P∞ 2 P∞ 4+cos n
1) Pn=1 e−n ; 4) n=1 nα ;
Меньший ряд расходится, значит и больший ряд ∞
2) n=1 √ ln n P∞
3 2; 5) + sin n) ·
расходится. P∞ 2nn n=1 (2
P∞ 3) n=1 n·3n ; nα .
Вывод: ряд n=1 2+cos
n
n
расходится.
⋄ 8.2.16.
X∞ X∞ X∞
2 + cos n 3 1
6 = 3 ·
n=1
n2 n=1
n 2
n=1
n2
| {z }
сходится,
в силу примера 8.2.10
502 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Признак Даламбера.
• Число
P∞ D, определяемое формулой (8.2.45), называется числом Даламбера ряда
n=1 a n .
Для доказательства нам понадобится следующая
P∞
Лемма 8.2.6 (лемма об остатке). Пусть n=1 an – числовой ряд, и M ∈ N – произвольное число.
Тогда
∞ ∞ ∞
!
X X X
ряд an сходится ⇐⇒ сходится ряд an называемый остатком ряда an
n=1 n=M n=1
m
существует конечный предел lim SN
N →∞
m
существует конечный предел lim RN
N →∞
m
∞
X
остаток an сходится
n=M
Возьмем какое-нибудь число ε > 0 так чтобы D + ε < 1. Из (8.2.46) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
§ 2. Числовые ряды 503
Возьмем какое-нибудь число ε > 0 так чтобы D − ε > 1. Из (8.2.47) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
Если обозначить q = D − ε, то мы получим что q > 1 и
an+1
∀n > M q<
an
то есть
∀n > M an+1 > q · an
В частности,
aM+1 > q · aM
aM+2 > q · aM+1 > q · (q · aM ) = q 2 · aM
aM+3 > q · aM+2 > q · (q 2 · aM ) = q 3 · aM
...
aM+k > q · aM+k−1 > ... > q k · aM
Отсюда
∞
X ∞
X ∞
X ∞
X
an = aM+k > q k · aM = aM · qk
n=M k=0 k=0 k=0
X∞ (n+1)·2n+1
n · 2n an+1 3n+1
3n D = lim = lim n·2n =
n→∞ an n→∞
n=1 3n
504 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Тогда
P∞
— если C < 1, то ряд n=1 an сходится;
P∞
— если C > 1, то ряд n=1 an расходится.
P∞
• Число C, определяемое формулой (8.2.48), называется числом Коши ряда n=1 an .
Возьмем какое-нибудь число ε > 0 так чтобы C + ε < 1. Из (8.2.49) следует, что ε-окрестность числа
√
C содержит почти все числа n an , то есть
√
∃M ∀n > M C −ε< n
an < C + ε
то есть
∀n > M an < q n
Отсюда
∞
X ∞
X
an < qn
n=M n=M
Возьмем какое-нибудь число ε > 0 так чтобы C − ε > 1. Из (8.2.50) следует, что ε-окрестность числа
√
C содержит почти все числа n an , то есть
√
∃M ∀n > M C −ε< n
an < C + ε
§ 2. Числовые ряды 505
то есть
∀n > M an > q n
Отсюда
∞
X ∞
X
an > qn
n=M n=M
Последний ряд расходится как геометрическая
P∞ прогрессия со знаменателем q > 1. Значит, по при-
знаку
P∞ сравнения, меньший ряд a
n=M n тоже расходится. Отсюда по лемме об остатке 8.2.6, ряд
a
n=1 n расходится.
P∞ 2
⋄ 8.2.22. Чтобы исследовать на сходимость ряд Вывод: ряд 1+ 1 n
расходится.
n=1 n
X∞ n
n−1 ⊲⊲ 8.2.24. Исследуйте на сходимость ряды:
n=1
2n + 1 P∞ 1 2
1 n
1) n=1 2n · 1 + n ;
найдем его число Коши: P∞ 1 2
1 n
√ n−1 1 2) n=1 3n · 1 + n ;
C = lim n an = lim = <1 P∞ 1
n
n→∞ 2n + 1 2 3) n=1 n · arcsin n ;
n→∞
P∞ n−1 n P∞ nn+ n 1
Вывод: ряд n=1 2n+1 сходится. 4) n=1 (n+1)n (здесь признак Коши не дает ре-
⋄ 8.2.23. Рассмотрим ряд зультатов);
P∞ −n+sin n
X∞ n2 5) n=1 2 ;
1 P∞ 2+(−1)n
1+ 6) (этот ряд исследуется по при-
n=1
n n=1 2n
знаку Коши, но не по признаку Даламбера).
Его число Коши:
n
√ 1
C = lim n
an = lim 1 + =e>1
n→∞ n→∞ n
сходится;
(ii) для любой последовательности li ∈ N, и любой бесконечно большой последовательности
ki ∈ N
ki −→ ∞,
i→∞
Pki +li
сумма n=ki +1 an стремится к нулю при i → ∞:
kX
i +li
an −→ 0
i→∞
n=ki +1
P∞
Доказательство. Рассмотрим частичные суммы ряда n=1 an :
N
X
SN = an
n=1
506 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
m
последовательность SN сходится
вспоминаем критерий Коши сходимости
m последовательности – теорему 3.2.15
Доказательство.
∞
X
ряд |an | сходится
n=1
применяем критерий Коши
⇓ сходимости ряда – теорему 8.2.8
kX
i +li
∀ li , ki ∈ N ki −→ ∞ |an | −→ 0
n→∞ i→∞
n=ki +1
⇓
kX
!
i +li kX
i +li kX
i +li kX
i +li
06 an 6 |an | −→ 0 ⇒ an −→ 0 ⇒ an −→ 0
i→∞ i→∞ i→∞
n=ki +1 n=ki +1 n=ki +1 n=ki +1
kX
i +li
∀ li , ki ∈ N ki −→ ∞ an −→ 0
n→∞ i→∞
n=ki +1
снова применяем критерий Коши
⇓ сходимости ряда
∞
X
ряд an сходится
n=1
n=1
2n 2) n=1 (−1) 2 n3n .
508 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Тогда
P∞
(a) ряд n=0 (−1)n bn сходится,
(b) его остаток оценивается сверху своим первым членом:
∞
X
(−1)n bn 6 bN +1 (8.2.53)
n=N +1
Ak = S2k−1 , Bk = S2k
A1 6 A2 6 A3 6 ... 6 b0 (8.2.54)
0
k
S2k−1
А, с другой, –
0 0 0 0
§ 2. Числовые ряды 509
0 6 ... 6 B2 6 B1 6 B0 (8.2.55)
6
0
k
S2k
А, с другой, –
Bk = S2k = (b0 − b1 ) + (b2 − b3 ) +... + (b2k−1 − b2k ) > 0
| {z } | {z } | {z }
6
0 0 0
При этом,
то есть
A = B,
и поэтому соотношения (8.2.56) удобно переписать так:
SN −→ S,
N →∞
P∞ n
то есть ряд n=0 (−1) bn сходится. С другой стороны, из (8.2.57) следует двойное неравенство
и, во-вторых,
где
N
X
AN = an
n=p
q
X z}|{ z }| { z }|{ z}|{
an · bn = ap ·bp + ap+1 ·bp+1 + ... + aq−1 ·bq−1 + aq ·bq =
n=p
= Ap bp + (−Ap + Ap+1 )bp+1 + ... + (−Aq−2 + Aq−1 )bq−1 + (−Aq−1 + Aq )bq =
= Ap bp − Ap bp+1 + Ap+1 bp+1 + ... −Aq−2 bq−1 + Aq−1 bq−1 − Aq−1 bq +Aq bq =
| {z } | {z } | {z } | {z }
=
Обозначим
N
X
A = max |AN | = max an (8.2.64)
p6N 6q p6N 6q
n=p
Тогда:
q
X q−1
X q−1
X
an · bn = (8.2.61) = An · (bn − bn+1 ) + Aq · bq 6 |An | ·|bn − bn+1 | + |Aq | ·|bq | 6
n=p n=p n=p
|{z} |{z}
>
>
(8.2.64)
A A
0
>
X
q−1 z
(8.2.63)
}| { X
q−1
6 A· | bn − bn+1 | +|bq | = A · (bn − bn+1 ) + |bq | =
n=p
| {z } n=p
=
bn − bn+1
↓ ↓ ↓ ↓↓ ↓
=A· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +|bq | =
| {z } | {z } | {z }
n=p n=p+1 n=q−1
= A · (bp − bq + |bq |) 6 A · (|bp | + |bq | + |bq |) 6 3 · A · max{|bp |, |bq |}
Теорема 8.2.14 (признак Дирихле). Пусть последовательности {an } и {bn } обладают следую-
щими свойствами:
P∞
(i) частичные суммы ряда n=1 an ограничены:
N
X
sup an < ∞
N ∈N n=1
Действительно,
q
X q
X p−1
X q
X p−1
X
an = an − an 6 an + an 6 2C
n=p n=1 n=1 n=1 n=1
| {z } | {z }
>
>
C C
P∞
Чтобы убедиться, что ряд n=1 an · bn сходится, воспользуемся критерием Коши (теорема 8.2.8):
выберем произвольные последовательности li ∈ N и ki ∈ N (ki −→ ∞). По неравенству Абеля
n→∞
(8.2.62) получаем:
kX
i +li N
X n o
an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z } ↓ ↓
0 0
>
(8.2.65)
2C
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
512 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
монотонно
⋄ 8.2.36. Исследуем на сходимость ряд то мы получим bn −→ 0, и
n→∞
X∞
sin n N N
X X
n=1
n sup an = sup sin nx =
N ∈N n=1 N ∈N n=1
Если положить = (8.2.66) =
N
1 sin 2x· sin N2+1 x 1
an = sin n, bn = = sup 6 < +∞
n N ∈N sin 2x
sin x2
монотонно
то мы получим bn −→ 0, и
n→∞ По признаку Дирихле, получаем, что наш ряд
сходится при x 6= 2πk.
N
X N
X Остается проверить, будет ли он сходиться
sup an = sup sin n = при x = 2πk. Подставим это значение в наш ряд:
N ∈N n=1 N ∈N n=1
= (8.2.66) = X∞ ∞
sin 2πkn X
= 0
sin N2 · sin N2+1 1 n
= sup 6 < +∞ n=1 n=1
N ∈N sin 12 sin 12
Ясно, что этот ряд
P∞сходится.
По признаку Дирихле,
P получаем Вывод: ряд n=1 sinnnx сходится при любом
Вывод: ряд ∞ sin n
n=1 n сходится. x ∈ R.
Если положить P∞ ln n πn
4) n=1 n · cos 12 ;
1 P∞ n(n+1)
an = sin nx, bn = 5) n=1 (−1)
2 · √1n .
n
Теорема 8.2.15 (признак Абеля). Пусть последовательности {an } и {bn } обладают следующими
свойствами:
P∞
(i) ряд n=1 an сходится;
(ii) последовательность {bn } монотонна и ограничена.
P∞
Тогда ряд n=1 an · bn сходится.
P∞
Доказательство. Заметим, что из сходимости ряда n=1 an следует, что для произвольных после-
довательностей li ∈ N и ki ∈ N (ki −→ ∞) выполняется соотношение
n→∞
N
X
max an −→ 0 (8.2.67)
ki 6N 6ki +li i→∞
n=ki +1
§ 2. Числовые ряды 513
то, переходя к подпоследовательности, мы получили бы, что для некоторого ε > 0 выполняется
соотношение
N
X
max an > ε
ki 6N 6ki +li
n=ki +1
⇓
Ni
X
∃Ni ∈ [ki , ki + li ] an >ε
n=ki +1
| {z }
здесь Ni > ki ,
потому что
иначе было бы
PN i
n=k +1 an = 0
i
⇓
kiX
+mi
∃mi = Ni − ki an > ε
n=ki +1
| {z }
↑
это невозможно,
потому что
по критерию Коши
(теорема 8.2.8)
Pki +mi
n=k +1 an −→ 0
i i→∞
Теперь обозначим
B = sup |bn | < ∞
n∈N
P∞
Чтобы доказать сходимость ряда n=1 an · bn , снова воспользуемся критерием Коши (теоремой
8.2.8): для произвольных последовательностей li ∈ N и ki ∈ N (ki −→ ∞) по неравенству Абеля
n→∞
(8.2.62) мы получим
kX
i +li N
X n o
an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z }
>
>
↓ (8.2.67)
B B
0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
∞
X ∞
X
an сходится ⇐⇒ bn сходится
n=1 n=1
При этом,
(i) если эти ряды сходятся, то справедливо следующее соотношение, показывающее, что
скорость их сходимости будет одинаковой:
∞
X ∞
X
an ∼ bn (8.2.70)
N →∞
n=N n=N
(ii) если эти ряды расходятся, то справедливо следующее соотношение, показывающее, что
скорость их расходимости будет одинаковой:
N
X N
X
an ∼ bn (8.2.71)
N →∞
n=1 n=1
⇓
§ 2. Числовые ряды 515
an
−→ 1
bn n→∞
⇓
an
∃L ∀n > L ∈ [1 − ε; 1 + ε]
bn
⇓
an
∃L ∀n > L 1 − ε 6 61+ε
bn
⇓
∃L ∀n > L (1 − ε) · bn 6 an 6 (1 + ε) · bn
⇓
∞
X ∞
X ∞
X
(1 − ε) · bn 6 an 6 (1 + ε) · bn (8.2.72)
n=L n=L n=L
(последнее двойное неравенство понимается как почленное сравнение рядов, определенное форму-
лой (8.2.44)). P∞ P∞
1. Покажем теперь, что сходимость ряда n=1 an эквивалентна сходимости ряда n=1 bn . С
одной стороны, справедлива такая цепочка:
∞
X
an сходится
n=1
∞
X
(1 − ε) · bn сходится
n=L
∞
X
an сходится
n=L
⇓ (применяем лемму об остатке 8.2.6)
∞
X
an сходится
n=1
2. Теперь предположим, что оба ряда сходятся и докажем формулу (8.2.70). Из (8.2.72) получаем:
X∞ X∞ ∞
X
∞
X ∞
X
∃L ∈ N ∀N > L (1 − ε) · bn 6 an 6 (1 + ε) · bn здесь уже an и bn – числа
n=N n=N
n=N n=N n=N
⇓
P∞
an
∃L ∈ N ∀N > L 1 − ε 6 Pn=N
∞ 6 1+ε здесь ε ∈ (0; 1) с самого начала выбиралось произвольным
n=N bn
⇓
P∞
an
∀ε ∈ (0, 1) ∃L ∈ N ∀N > L 1 − ε 6 Pn=N
∞ 6 1+ε
n=N bn
⇓
P∞
a n
Pn=N
∞ −→ 1
n=N bn N →∞
то есть справедливо (8.2.70).
3. Нам остается доказать (8.2.71) в предположении, что оба ряда расходятся. Здесь применяется
теорема Штольца 3.2.18. Из условия an ∼ bn следует, что, начиная с некоторого номера M , все
числа bn ненулевые (мы отмечали это при определении асимптотически эквивалентных последова-
тельностей на с.514), и поэтому положительны:
∀n > M bn > 0 (8.2.73)
Зафиксируем это M и обозначим
N
X N
X
AN = an , BN = bn .
n=M n=M
❆❯
0
То есть справедливо (8.2.71).
§ 2. Числовые ряды 517
P∞ α
⋄ 8.2.42. Вывод: ряд n=1 sin n1 сходится при α > 1.
∞
X X∞
1 1
2+n−1
∼ 2
⋄ 8.2.45.
n=1
n n=1
n
| {z } ∞ ∞
сходится
X ln 1 + 1 X 1
n
∼
P∞ 1 n=1
nα n=1
n α+1
Вывод: ряд n=1 n2 +n−1 сходится. | {z }
В соответствии с теоремой 8.2.16, можно дать сходится
при α + 1 > 1
асимптотическую оценку скорости сходимости то есть при α > 0
этого ряда:
N
X XN P∞ ln(1+ n
1
)
1 1 Вывод: ряд n=1 nα сходится при α > 0.
2+n−1
∼ 2
,
n=1
n N →∞
n=1
n
⊲⊲ 8.2.46. Исследуйте на сходимость ряды:
однако это будет мало информативно, потому
P∞ √ 1+n2 2
что до теорем 8.2.18 и 8.2.19 мы не сможем вы- 1) n=1 n · 1+n3 ;
ражать асимптотику рядов через стандартные P∞ 1
функции. 2) n=1
√ ;
n(n+1)(n+2)
P∞ √ √
⋄ 8.2.43. 3) n=1 n · n+1− n−1 ;
P∞ 1
√ ∞ √ n+1
4) n=1 3 n · ln n−1 ;
X∞ X X∞ √
1+ n n 1
√ ∼ √ = P∞ √
ln(n+ n+ln n+1)
3
n + 2n n=1 n3 n 5)
n=1 n=1
| {z } n=1 3n−ln n+arctg n−1 ;
расходится P∞ ln(1+ n
1
+ n12 )
6) n=1 ln(n−n√n+ln n+3) ;
P∞ 1+√n
Вывод: ряд √
n=1 n3 +2n расходится. P∞ 1 α
7) n=1 n · e n − 1 ;
⋄ 8.2.44. P∞ 1+n
∞ α ∞ 8) n=1 α;
X 1 X 1 ( n1 −sin n1 )
sin ∼ P∞ n 3 oα
α
n=1
n n=1
n 9) n=1 1 + n1 2 − 1 ;
| {z }
сходится P∞ (arctg n1 )
α
Тогда
P∞ P∞
(i) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :
∞
X ∞
X
an сходится ⇐= bn сходится (8.2.74)
n=1 n=1
∞
X ∞
X
an расходится =⇒ bn расходится (8.2.76)
n=1 n=1
an ≪ b n
n→∞
⇓
an
−→ 0
bn n→∞
⇓
|an |
−→ 0
bn n→∞
⇓
|an |
∃L ∀n > L <ε
bn
⇓
∃L ∀n > L |an | < ε · bn
⇓
∞
X ∞
X
|an | < ε · bn (8.2.78)
n=L n=L
⇓
∞
X
ряд ε · bn сходится
n=L
вспоминаем неравенство (8.2.78)
⇓ и признак сравнения рядов 8.2.4
∞
X
ряд |an | сходится
n=L
⇓
§ 2. Числовые ряды 519
∞
X
ряд an сходится
n=1
⇓
P∞
|an |
∃L ∈ N ∀N > L Pn=N
∞ <ε здесь ε > 0 с самого начала выбиралось произвольным
n=N bn
⇓
P∞
|an |
∀ε > 0 ∃L ∈ N ∀N > L Pn=N
∞ <ε
n=N bn
⇓
P∞
|an |
Pn=N
∞ −→ 0
n=N bn N →∞
⇓
P∞
an
Pn=N
∞ −→ 0
n=N bn N →∞
то мы получим:
0 0
✁✕ ✁✕
A AN
PN PM−1 PN +
an an + an A + AN BN BN
lim Pn=1
N
= lim Pn=1
M−1 PN
n=M
= lim = lim =0
N →∞
n=1 bn
N →∞
n=1 bn + n=M bn N →∞ B + BN N →∞ B
+1
BN
❆❯
0
То есть справедливо (8.2.77).
∞ (−1)n
P
– по интегральному признаку (теорема 8.2.3), а 1) 2 n ln n − 1 ;
X∞ n=2
1 q
o P
∞
3 (−1)n+1
n→∞ n ln2 n 2) 1+ n −1 ;
n=2 n=1
– по асимптотическому признаку сравнения ря- P
∞ (−1)n
√
дов (теорема 8.2.17). В итоге получаем, что ис- 3) e n ln n − 1 ;
n=2
ходный ряд (8.2.81) сходится. ∞
P (−1)n+1
то, мы получим:
P
N
o n=1 f (n)
N →∞
!
=
N
X ˆ N z}|{ ˆ N XN
f (n) = f (x) d x + C + o (1) = f (x) d x + o f (n)
1 N →∞ 1 N →∞
n=1 | {z } n=1
=
P
N
o n=1 f (n)
N →∞
´N 1
1 x dx
∞
X 1 где C – постоянная Эйлера (8.2.41). Мы отме-
n=1
n чали в примере 8.2.9, и это видно из форму-
522 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
лы (8.2.85), что этот ряд расходится. Формула где Cα – постоянные Эйлера (8.2.43). При 0 <
(8.2.84) для него принимает вид: α < 1 этот ряд расходится, поэтому выполняется
соотношение (8.2.84)
XN
1
∼ ln N. XN
n N →∞ 1 N 1−α − 1
n=1
α
∼ .
n=1
n N →∞ 1−α
⋄ 8.2.53. Частичные суммы ряда Дирихле
∞
Его можно немного упростить, воспользовав-
X 1
, шись теоремой 6.1.9,
n=1
nα
N 1−α − 1 N 1−α 1 N 1−α
= + ∼ ,
который мы рассматривали в примере 8.2.10, при 1−α |1 −
{z α} |1 −
{z α} 1−α
N →∞
0 < α 6= 1 должны по теореме 8.2.18 удовлетво-
=
↓
рять формуле ∞ o
N →∞
(1)
XN
1 N 1−α − 1 и в результате мы получим
α
= +Cα + o (1) (8.2.86)
n | 1−{z α }
N →∞
n=1 XN
1 N 1−α
∼ (0 < α < 1).
=
´N
1
1
xα dx n=1
nα N →∞ 1−α
Теорема 8.2.19. Для любой гладкой функции f на отрезке [1, N ], N ∈ N, справедлива формула:
N
X ˆ N ˆ N
f (n) = f (1) + f (x) d x + {x} · f ′ (x) d x (8.2.87)
n=1 1 1
Отсюда видно, что на интервале (k, k + 1) функция F гладкая и имеет конечные односторонние
производные на концах.
2. Заметим далее (и это неожиданно), что функция F непрерывна. Мы уже показали, что на
каждом интервале (k, k + 1), k ∈ N, она будет гладкой, поэтому ее непрерывность нужно проверить
только в целых точках. Зафиксируем какую-нибудь точку k ∈ N и вычислим в ней значение F и
значения ее односторонних пределов:
[k] k
X X
F (k) = f (n) + {k} ·f (k) = f (n)
n=1
|{z} n=1
=
0
§ 2. Числовые ряды 523
nX
[x] o k−1
X k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 1 · f (k) = f (n)
x→k−0 x→k−0
n=1 n=1 n=1
nX
[x] o Xk k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 0 · f (k) = f (n)
x→k+0 x→k+0
n=1 n=1 n=1
Видно, что эти три величины совпадают между собой, значит F непрерывна в k.
3. Заметим, что из формулы (8.2.88) следует, что на каждом интервале (k, k + 1), k ∈ N, произ-
водная функции F имеет вид:
d X d
k
F ′ (x) = f (n) + (x − k) · f (x) = (x − k) · f (x) = 1 · f (x) + (x − k) · f ′ (x) = f (x) + {x} · f ′ (x)
d x n=1 dx
f (1)
=
0
=
P1 z}|{
n=1 f (n) + {1} ·f (1)
=
z }| { ˆ N ˆ N ˆ N
F (N ) − F (1) = F ′ (x) d x = f (x) d x + {x} · f ′ (x) d x
| {z } 1 1 1
=
PN
n=1 f (n) + {N } ·f (N )
| {z }
=
0
=
PN
n=1 f (n)
⇓
N
X ˆ N ˆ N
f (n) − f (1) = f (x) d x + {x} · f ′ (x) d x
n=1 1 1
Интегралы
ˆ 1
εk = Ek (t) d t (8.2.91)
0
Доказательство. Кусочная гладкость и непрерывность при k > 0 следует из теоремы 7.3.13. Пе-
риодичность доказывается по индукции: для E0 (x) = {x} это верно, а если Ek−1 (x + 1) = Ek−1 (x),
то
ˆ x+1 ˆ x
Ek (x + 1) − Ek (x) = Ek−1 (t) d t − εk−1 · (x + 1) − Ek−1 (t) d t − εk−1 · x =
0 0
ˆ x+1 ˆ 1
= Ek−1 (t) d t − εk−1 = Ek−1 (t) d t − εk−1 = 0.
x 0
Для приложений будет полезно вычислить несколько первых чисел Эйлера и функций Эйлера
на периоде [0, 1).
Предложение 8.2.21. При x ∈ [0, 1) справедливы формулы:
1
E0 (x) = x, ε0 = (8.2.95)
2
x2 x 1
E1 (x) = − , ε1 = − (8.2.96)
2 2 12
x3 x2 x
E2 (x) = − + , ε2 = 0 (8.2.97)
6 4 12
Доказательство. При x ∈ [0, 1) получаем цепочку:
E0 (x) = {x} = x
⇓
1 1
1
ˆ ˆ
ε0 = E0 (t) d t = t dt =
0 0 2
⇓
x x
x x2 x
ˆ ˆ
E1 (x) = E0 (t) d t − ε0 · x = t dt − = −
0 0 2 2 2
⇓
1 1 1
t2 t t3 t2 1 1 1
ˆ ˆ
ε1 = E1 (t) d t = − dt = − = − =−
0 0 2 2 6 4 0 6 4 12
⇓
x ˆ x
t2 t x x3 x2 x
ˆ
E2 (x) = E1 (t) d t − ε1 · x = − dt+ = − +
0 0 2 2 12 6 4 12
⇓
1 1 1
t3 t2 t t4 t3 t2 1 1 1
ˆ ˆ
ε2 = E2 (t) d t = − + dt = − + = − + =0
0 0 6 4 12 24 12 24 0 24 12 24
=
(8.2.95)
= ln N + C + o (1) (8.2.85) 1
n=1
n N →∞ 2
ˆ ∞ ′
1 ∞ E1 (t)
(C – постоянная Эйлера (8.2.41)). =A+ − dt =
2t N N t2
Покажем теперь, как с помощью формулы 1
ˆ ∞
1
Эйлера (8.2.87) можно эту асимптотику уточ- =A− − 2
d E1 (t) = (7.3.147) =
2N t
нять. Взяв f (x) = x1 , мы по формуле Эйлера по- N
ˆ ∞
лучим: 1 E1 (t) ∞ E1 (t)
=A− − 2 −2 dt =
2N t N N t3
N ˆ ∞
X 1
ˆ N
dx
ˆ N
{x} 1 E1 (N ) E1 (t)
=1+ − dx = =A− + 2
−2 dt =
n 1 x 1 x2 2N N
| {z } N t3 }
| {z
n=1
( )
=
(8.2.94) 1
ˆ N o
{x} 0 t→∞ t2
= 1 + ln N − d x. (8.2.98) | {z }
1 x2 o (1)
N →∞ N
Таким образом, нахождение асимптотики суммы
1 1
свелось к нахождению асимптотики интеграла = A− + o
2N N →∞ N
ˆ N ˆ N
{t} E0 (t)
I(N ) = 2
dt = d t (8.2.99) Подставим это в (8.2.98):
1 t 1 t2
Он отличается от изучавшегося уже нами инте- XN ˆ N
1 {x}
грала (8.1.27) = 1 + ln N − dx =
ˆ x
sin t n=1
n 1 x2
dt
1 t2 1 1
= 1 + ln N − A + + o .
тем, что синус sin t в подынтегральном выраже- 2N N →∞ N
нии заменен дробной частью {t}, а верхний пре-
дел стал дискретным. Метод нахождения асимп- Сравнив с (8.2.85), мы видим теперь, что посто-
тотики для (8.2.99) представляет собой модифи- янная A связана с постоянной Эйлера C равен-
кацию метода для (8.1.27). ством
Коротко идею можно сформулировать так: 1−A=C
здесь тоже нужно интегрировать по частям,
но сначала нужно добиваться, чтобы в диффе- и поэтому полученную асимптотику можно пере-
ренциале стояла функция Эйлера с подходящим писать так:
индексом. А это достигается добавлением и вы- N
читанием чисел Эйлера в периодической части X 1 1 1
= ln N + C + + o . (8.2.100)
подынтегрального выражения. n=1
n 2N N →∞ N
Продемонстрируем это на интеграле (8.2.99).
Прежде всего замечаем, что существует конеч- Это уточняет асимптотическую формулу
ный предел (8.2.85).
ˆ ∞
E0 (t) Ее можно и дальше уточнять. Для этого нуж-
A = lim I(N ) = dt но заметить, что, вычисляя асимптотику для
N →∞ 1 t2
I(N ), мы попутно вывели формулу
´∞
– поскольку интеграл 1 E0t2(t) d t сходится абсо- ∞
1 E1 (t)
ˆ
лютно: I(N ) = A − −2 dt
ˆ ∞ ˆ ∞ 2N N t3
E0 (t) 1 1 ∞
2
d t 6 2
dt = − =1
1 t 1 t t 1 Подставим ее в (8.2.98):
Запомним это число A. Тогда:
XN ˆ N
1 {x}
ˆ N
E0 (t) = 1 + ln N − dx =
I(N ) = dt = n=1
n 1 x2
t2
ˆ1 ∞
ˆ ∞
ˆ ∞ 1 E1 (t)
E0 (t) E0 (t) = 1 + ln N − A + +2 dt =
= d t − dt = 2N t3
1 t 2
N t2 ˆ ∞ N
| {z } 1 E1 (t)
= ln N + C + +2 d t (8.2.101)
=
A
2N N t3
526 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
N
ε0 + E0 (x) − ε0
ˆ
Отдельно найдем асимптотику последнего инте-
= N · ln N − N + 1 + dx =
грала: 1 x
∞
= N · ln N − N + 1+
E1 (t)
ˆ
ˆ N ˆ N
I2 (N ) = 2 dt = dx E0 (x) − ε0
N t3 + ε0 + dx =
ˆ ∞ |{z} 1 x 1 x
ε1 + E1 (t) + ε1
=
(8.2.95)
=2 dt = 1
t3 2
ˆ ∞N ˆ ∞ ˆ N
1 E1 (t) − ε1 1 d E1 (x)
= 2 ε1 dt+ 2 dt = = N · ln N − N + 1 + ln N + dx =
|{z} N t3 N t3 2 1 x
=
(8.2.96)
1
− 12
1 E1 (x) N
= N · ln N − N + 1 + ln N + +
ˆ ∞ 2 | x{z 1}
2 1 ∞ d E2 (t)
= · 2 +2 =
=
2 · 12 t N N t3 E1 (N ) E1 (1)
∞ N − 1
1 2E2 (t) ∞ E2 (t)
ˆ
=
(8.2.94)
=− + + 6 dt = 0
12N 2 t3 N t4
ˆ ∞N ˆ N
E1 (x) 1
1 2E2 (N ) E2 (t) + d x = N · ln N − N + 1 + ln N +
=− − +6 dt = x 2 2
12N 2 | N 3
{z } N t4 }
| {z 1
ˆ N
( ) E1 (x)
=
(8.2.94) 1
o
0 t→∞ t3 + dx
{z| } 1 x2
o ( N12 )
N →∞
Теперь заметим, что поскольку функция E1
1 1 ограничена на R, сходится абсолютно интеграл
=− + o ´ ∞ E1 (x)
12N 2 N →∞ N 2 d x:
1 x2
XN N
X
1 1 1 1 1
= ln N + C + +− + o . ln n = N · ln N − N + 1 + ln N +
n 2N 12N 2 N →∞ N 2 n=1
2
n=1
(8.2.102) ˆ N
E1 (x) 1
И так далее. Применяя функции Эйлера нуж- + d x = N · ln N − N + 1 + ln N +
1 x2 2
ное число раз, можно добиться любой точности ˆ ∞ ˆ ∞
асимптотического разложения. E1 (x) E1 (x)
+ dx− dx
x2 | x
2
{z }
⋄ 8.2.56. Найдем асимптотику суммы |1 {z } N
=
=
1
A o x
N
X x→∞
| {z }
ln n
=
n=1 o (1)
N →∞
N ln n = N · ln N − N + ln N + 1 − A + o (1)
2
´N
x · ln x − 1
x d ln x N →∞
1 n=1
=
0
z }| {
=
=
⋄ 8.2.58. Выведем формулу для суммы 2N · E1 (N ) − 2 · E1 (1) ´1
(N − 1) 0
E1 (x) d x
=
(8.2.94)
=
N
X 0 (N − 1) · ε1
n2
=
(8.2.96)
n=1 − N12
−1
(8.2.95) n=1
1
2
ˆ N
+2 E0 (x) − ε0 · x d x = ⊲ 8.2.59. Найдите формулы для сумм:
1 PN 3
N 1) n=1 n ,
N3 − 1 N2 − 1
ˆ
=1+ + +2 x d E1 (x) = PN 4
3 2 1
2) n=1 n .
Глава 9
ФУНКЦИОНАЛЬНАЯ
СХОДИМОСТЬ,
ФУНКЦИОНАЛЬНЫЕ РЯДЫ И
АППРОКСИМАЦИЯ
fn (x).
528
§ 1. Функциональные последовательности и функциональные ряды 529
fn (x) = nx
D = (−∞; 0]
nx −n−x
2) если x < 0, то f (x) = limn→∞ nx +n−x = ⊲⊲ 9.1.6. Постройте графики и найдите точки
2x
−1
limn→∞ nn2x +1 = 0−1
= −1; разрыва следующих функций:
0+1
1, если x > 0 4) f (x) = limn→∞ x3 nx −n−x
nx +n−x
f (x) = 0, если x = 0 x
−1
5) f (x) = limn→∞ arcsin nnx +1 .
−1, если x < 0
2n
6) f (x) = limn→∞ cos x;
то есть f (x) совпадает с функцией сигнум: 7) f (x) = limn→∞ (sin2n x − cos2n x);
x
8) f (x) = limn→∞ 1+(2 sin x)2n ;
9) f (x) = limn→∞ arctg(nx);
10) f (x) = limn→∞ x · arctg(n · ctg x);
11) f (x) = limn→∞ x2 · arctg(x2n );
12) f (x) = limn→∞ arctg nx ;
2−nx −2nx
13) f (x) = limn→∞ 2−nx +2nx ;
Видно, что x = 0 здесь является точкой раз- 14) f (x) = lim x+x2 2nx
n→∞ 1+2nx ;
рыва, а все остальные точки, – то есть точки
x2nx −3nx
x ∈ (−∞; 0)∪(0; +∞) – являются точками непре- 15) f (x) = limn→∞ 2nx +3nx ;
рывности f (x). 16) f (x) = limn→∞ 2n sin x −2−n sin x cos x
;
2n sin x +2−n sin x
⋄ 9.1.5. Рассмотрим функциональную последо- 2n cos x −2−n cos x sin x
17) f (x) = limn→∞ 2n cos x +2−n cos x ;
вательность
p log2 (1+2nx )
n 18) f (x) = limn→∞ log2 (1+2n ) .
fn (x) = 1 + x2n
Ее областью сходимости будет вся числовая пря- ⋄ 9.1.7. Докажем следующую формулу, выража-
мая ющую функцию Дирихле из (3.1.4) как двойной
D=R поточечный предел стандартных функций:
а пределом будет функция
1, x ∈ Q
D(x) = = lim lim cosm 2π · n! · x
если |x| < 1 /Q
0, x ∈ n→∞ m→∞
1,
(9.1.4)
f (x) = 1, если |x| = 1
2 (эту формулу надо понимать так: чтобы вычис-
x , если |x| > 1 лить значение в точке x нужно сначала взять
потому что предел при m → ∞, а затем предел при n → ∞).
— при |x| < 1 Доказательство. Пусть x ∈ Q, то есть x = p
q,
p
n
p ∈ Z, q ∈ N, тогда при n > q мы получим:
f (x) = lim 1 + x2n =
n→∞
1 n! ... q
x2n ) n = 10 = 1,
= lim (1 + |{z}
n→∞
↓
0 ⇓
p
— при |x| = 1 n! · x = n! · ∈Z
q
1
x2n ) n = 20 = 1,
f (x) = lim (1 + |{z}
n→∞ ⇓
k
1
cos 2π · n! · x = 1
— при |x| > 1
⇓
1
f (x) = lim (1 + x2n ) n =
n→∞
n1 cosm 2π · n! · x = 1
1
= lim x2 · 2n
+1 = x2 · 10 = x2 . ⇓
n→∞ x
|{z}
↓
0
lim cosm 2π · n! · x = 1
m→∞
§ 1. Функциональные последовательности и функциональные ряды 531
Это верно для n > q, то есть для почти всех n. | cos 2π · n! · x| < 1
Поэтому
⇓
m
lim lim cos 2π · n! · x = 1 = D(x) m
lim cos 2π · n! · x = 0
n→∞ m→∞ m→∞
/ Q, то при любом n ∈ N
Наоборот, если x ∈ Это верно для всех n, значит
получим:
lim lim cosm 2π · n! · x = 0 = D(x)
/Z
n! · x ∈ n→∞ m→∞
N
X
∀x ∈ E an (x) −→ S(x). (9.1.5)
N →∞
n=1
∞
X
xn
n=1
X∞
будет, как мы уже отмечали в теореме 8.2.1, мно- 1
жество (−1; 1). Для наглядности в таких случаях n=1
nx
532Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
P∞ (−1)n
Вывод: областью сходимости ряда n=1 nx
является множество (0; +∞).
⋄ 9.1.11. Найдем область сходимости ряда 3. Нам остается посмотреть, что будет при
∞
X n x = − 17
9 :
(−1)
p
n· 3n · (x + 2)n ∞
X X∞
n=1 (−1)n (−1)n
p = q =
Для этого сразу заметим, что область определе- n (x + 2)n 1 n
n=1 n · 3 · 9 n=1 n · 3n ·
ния нашего ряда (то есть общая область опреде-
X∞ n X∞
ления слагаемых ряда) есть множество x > −2. (−1) (−1)n
1. Исследуем теперь ряд на абсолютную схо- = 1 =
n=1
n · 3n · 3n n=1
n
димость (то есть пробуем применить к нему тео-
рему 8.2.11): Этот ряд сходится по признаку Лейбница:
∞
X (−1)n
p =
n=1 n · 3n · (x + 2)n
∞
X 1
= p =
n=1 n· 3n · (x + 2)n
∞
X 1 Вывод: областью сходимости ряда
= √ n P∞
n· 3· x+2 (−1)n
n=1 n=1 n
√ n
является множество
17 n·3 · (x+2)
Находим число Коши: − 9 ; +∞ .
s
1 1 ⊲⊲ 9.1.12. Найдите область сходимости функци-
C = lim n
√ n = √
n→∞ n· 3· x+2 3· x+2 ональных рядов:
§ 1. Функциональные последовательности и функциональные ряды 533
P∞ cos nx
1) n=1 (признак Дирихле + необходимое
n условие сходимости);
P∞
условие сходимости); 6) n 1
(теорема об абсолютной
P∞ cos nx n=1 x + n·2n ·xn
2) n=1 n n (теорема об абсолютной сходимо-
√ сходимости + признак Даламбера + необхо-
сти); димое условие сходимости);
P∞ n! P∞ n
3) n x
n=1 xn (необходимое условие сходимости); 7) n=1 n+1 · 2x+1 (теорема об абсолютной
P∞ xn
4) n=1 1−xn (теорема об абсолютной сходи- сходимости + признак Даламбера + необхо-
мости + признак Даламбера + необходимое димое условие сходимости);
условие сходимости); P∞ n·32n n n
P∞ 2n ·sinn x 8) n=1 2n · x · (1 − x) (теорема об абсолют-
5) n=1 n2 (теорема об абсолютной сходи- ной сходимости + признак Даламбера + необ-
мости + признак Даламбера + необходимое ходимое условие сходимости).
D⊆E =⇒ kf kD 6 kf kE (9.1.12)
Доказательство. Все эти свойства напрямую следуют из свойств модуля. Например, полуаддитив-
ность доказывается так:
kf + gkE = sup |f (x) + g(x)| 6 (3.1.10) 6 sup |f (x)| + |g(x)| = (3.1.27) =
x∈E x∈E
= sup |f (x)| + sup |g(x)| = kf kE + kgkE
x∈E x∈E
534Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Доказательство.
x∈E
fn (x) ⇒ f (x)
n→∞
⇓
k fn (x) − f (x) kx∈E = sup |fn (x) − f (x)| −→ 0
x∈E n→∞
⇓
∀x ∈ E 0 6 |fn (x) − f (x)| 6 sup |fn (x) − f (x)| −→ 0
x∈E n→∞
⇓
∀x ∈ E |fn (x) − f (x)| −→ 0
n→∞
⇓
∀x ∈ E fn (x) − f (x) −→ 0
n→∞
⇓
∀x ∈ E fn (x) −→ f (x)
n→∞
⇓
x∈E
fn (x) −→ f (x)
n→∞
Это соотношение можно интерпретировать так, = max{ sup |xn − 0| , |1n − 1|} =
x∈(−1,1)
что функциональнгая последовательность .
= max{1, 0} = 1 −→ 0
fn (x) = xn , x ∈ (−1, 1], n→∞
§ 1. Функциональные последовательности и функциональные ряды 535
⋄ 9.1.16. Последовательность
sin x
fn (x) = Значение функции в точке максимума:
n
стремится к функции f (x) = 0 поточечно на мно- n nn nn+1
fn = − =
жестве E = R: n+1 (n + 1)n (n + 1)n+1
sin x x∈R nn n nn 1
−→ 0, = 1 − = · =
n n→∞ (n + 1)n n+1 (n + 1)n n + 1
1 1
и эта сходимость равномерна на E = R: = n ·
1 + n1 n+1
sin x
||fn (x) − f (x)||x∈E =k − 0 kx∈R = График:
n
sin x 1 1
= sup − 0 = · sup | sin x| = −→ 0.
x∈R n n x∈R n n→∞
на множестве E = [0; 1]. Ясно, что она поточечно ⋄ 9.1.19. Рассмотрим функциональную последо-
стремится к нулю: вательность
r
1
x∈[0;1]
xn − xn+1 −→ 0 fn (x) = x2 + 2
n→∞ n
на множестве E = R. Ясно, что она поточечно
Чтобы проверить стремится ли она равномерно,
стремится к функции f (x) = |x|:
нужно найти норму
r
1 x∈R p 2
kfn (x) − f (x)kx∈[0;1] = xn − xn+1 x∈[0;1] = x2 + 2 −→ x + 0 = |x|
n n→∞
536Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
x
Проверим, будет ли это стремление равномер- = sup =
arctg
ным: x∈[−a;a] n
ˆ x ′
r t
1 = sup arctg dt =
k fn (x) − f (x) kx∈R =k x2 + 2 − |x| kx∈R = x∈[−a;a] −a n t
n
r ˆ x 1
1 домножаем на
= sup n
dt =
= sup x2 + 2 − |x| = сопряженный = t2
x∈R n радикал x∈[−a;a] −a 1 + n2
q 2 ˆ x 1
n
x2 + n12 − |x|2 = sup t2
dt 6
= sup q = x∈[−a;a] −a 1 + n2
x∈R x2 + n12 + |x|
ˆ x 1
n 1
6 sup d t = · (a − a) −→ 0
x∈[−a;a] −a 1 + 0 n n→∞
x2 + n12 − x2 1
n2
= sup q = sup q =
x∈R x2 + n12 + |x| x∈R x2 + n12 + |x| Вывод: последовательность fn (x) = arctg nx стре-
мится к f (x) = 0 (поточечно и) равномерно на
1 1
= 2· q = множестве E = [−a; a]:
n inf x2 + n12 + |x|
x∈R
1 1 1
1 x x∈[−a;a]
= 2·q n2
= 1 = −→ 0 arctg ⇒ 0
n n n→∞
n n→∞
1
0 + n2 + 0 n
5◦ . Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке
[a, b], и хотя бы для одной точки c ∈ [a, b] существует конечный предел
f (xi ) −→ f (c)
i→∞
Для этого зафиксируем какой-нибудь ε > 0 и покажем, что почти все числа f (xi ) содержатся в
интервале (f (c) − ε, f (c) + ε), то есть, что для почти всех номеров i ∈ N выполняется неравенство
fN (xi ) −→ fN (c)
i→∞
Тогда функция f будет непрерывна в силу уже доказанного свойства 10 , поэтому для всякой точки
c ∈ (a, b) мы получим
lim lim fn (x) = lim f (x) = f (c) = lim fn (c) = lim lim fn (x)
x→c n→∞ x→c n→∞ n→∞ x→c
То есть ˆ b ˆ b
fn (x) d x − f (x) d x −→ 0
a a n→∞
или ˆ b ˆ b
fn (x) d x −→ f (x) d x
a n→∞ a
а это уже означает, что выполняется (9.1.16):
ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x
n→∞ a a n→∞
5. Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке [a, b]
к какой-то функции g,
x∈E
fn′ (x) ⇒ g(x), (9.1.20)
n→∞
и хотя бы для одной точки c ∈ [a, b] существует конечный предел (9.1.17):
H = lim fn (c).
n→∞
◦
Тогда, в силу доказанного уже свойства 1 , функция g непрерывна на отрезке [a, b]. Поэтому можно
рассмотреть функцию ˆ x
f (x) = H + g(t) d t, x ∈ [a, b] (9.1.21)
c
Покажем, что функции fn равномерно сходятся к функции f на отрезке [a, b]. Заметим, что
ˆ x ˆ x
′
|fn (x) − f (x)| = fn (c) + fn (t) d x − H + g(t) d t =
ˆ x c ˆ x c ˆ x
= (fn (c) − H) + fn′ (t) d x − g(t) d t 6 |fn (c) − H| + (fn′ (t) − g(t)) d t 6
ˆc x c
ˆ x c
′
6 |fn (c) − H| + |fn (t) − g(t)| d t 6 |fn (c) − H| + sup |fn′ (t) − g(t)| d t =
c c t∈[a,b]
= |fn (c) − H| + sup |fn′ (t) − g(t)| · |x − c| = |fn (c) − H| + k fn′ (t) − g(t) kt∈[a,b] ·|x − c|
t∈[a,b]
Отсюда
k fn (x) − f (x) kx∈[a,b] = sup |fn (x) − f (x)| = |fn (c) − H|+ k fn′ (t) − g(t) kt∈[a,b] · sup |x − c| 6
x∈[a,b] x∈[a,b]
То есть,
x∈E
fn (x) ⇒ f (x). (9.1.22)
n→∞
Теперь формула (9.1.18) становится очевидной:
′
′
lim fn = (9.1.22) = (f ) = (9.1.21) = g = (9.1.20) = lim fn′
n→∞ n→∞
§ 1. Функциональные последовательности и функциональные ряды 539
pi −→ ∞, qi −→ ∞ (9.1.23)
i→∞ i→∞
то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение
k fki +li (x) − fki (x) kx∈E =k fpi (x) − fqi (x) kx∈E −→ 0
i→∞
2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(9.1.26). Возьмем какие-нибудь две бесконечно большие последовательности индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
и положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
fmax{pi ;qi } (x) − fmin{pi ;qi } (x), если pi > qi
fpi (x) − fqi (x) = fmin{pi ;qi } (x) − fmax{pi ;qi } (x), если pi < qi =
0, если pi = qi
fki +li (x) − fki (x), если pi > qi
= fki (x) − fki +li (x), если pi < qi
0, если pi = qi
k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E
поэтому
k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E −→ 0
i→∞
540Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
и значит,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞
Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {fn (x)} сходится равномерно к некоторой функ-
ции f , то есть
k fn (x) − f (x) kx∈E −→ 0
i→∞
то {fn (x)} обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие
последовательности индексов {pi }, {qi } ⊆ N
pi −→ ∞, qi −→ ∞
i→∞ i→∞
Соответствующие подпоследовательности {fpi (x)} и {fqi (x)} тоже сходится равномерно к f (x), по-
тому что
k fpi (x) − f (x) kx∈E −→ 0, k fqi (x) − f (x) kx∈E −→ 0
i→∞ i→∞
поэтому
0 6k fpi (x) − fqi (x) kx∈E =k fpi (x) − f (x) + f (x) − fqi (x) kx∈E 6 (9.1.10) 6
6k fpi (x) − f (x) kx∈E + k f (x) − fqi (x) kx∈E −→ 0 + 0 = 0
i→∞
То есть,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞
и это значит, что {fn (x)} действительно должна обладать свойством (i).
4. Пусть выполнено (i), то есть для любых последовательностей индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
выполняется соотношение
k fpi (x) − fqi (x) kx∈E −→ 0 (9.1.27)
i→∞
0 6 |fpi (a) − fqi (a)| 6 sup |fpi (x) − fqi (x)| =k fpi (x) − fqi (x) kx∈E −→ 0
x∈E i→∞
Это значит, что для всякой точки a ∈ E числовая последовательность {fn (a)} сходится по критерию
Коши 3.2.15. Обозначим через f (a) ее предел:
Предположим, что это не так, то есть что числовая последовательность cn =k fn (x) − f (x) kx∈E не
стремится к нулю:
cn =k fn (x) − f (x) kx∈E 6−→ 0 (9.1.29)
n→∞
0
Тогда, по свойству 2 на с.228, существуют подпоследовательность pi −→ ∞ и число ε > 0 такие,
i→∞
что
cpi > ε
То есть,
k fpi (x) − f (x) kx∈E = sup |fpi (x) − f (x)| > ε
x∈E
§ 1. Функциональные последовательности и функциональные ряды 541
то есть
fpi (ai ) − ε < f (ai ) < fpi (ai ) − ε
Вспомним теперь формулу (9.1.28): число f (ai ) является пределом последовательности fn (ai ) и
лежит в интервале (fpi (ai ) − ε, fpi (ai ) − ε) Значит, почти все числа fn (ai ) лежат в этом интервале:
а отсюда
k fpi (x) − fqi (x) kx∈E > |fpi (ai ) − fqi (ai )| > ε
Это противоречит формуле (9.1.27). Таким образом, наше предположение (5.7) неверно.
N N
⋄ 9.1.22. Сумма членов геометрической прогрес- X X
сии, рассматривавшаяся в теореме 8.2.1, пред- > lim xn = 1n = N −→ ∞.
x→1 N →∞
n=1 n=1
ставляетс собой функциональныцй ряд
(а в силу замечания (b) для сходимости ряда эта
∞
X
n последовательность должна быть ограничена).
x
n=1 ⋄ 9.1.23. Выясним, будет ли ряд
∞
X
сходящийся поточечно на интервале (−1, 1): (1 − x) · xn
∞ n=1
X 1
xn = , x ∈ (−1, 1). сходиться равномерно на множестве E = (0; 1).
1−x
n=1 Для этого найдем предел его частичных сумм:
Однако эта сходимость не равномерна на (−1, 1), N
X N
X
потому что частичные суммы ряда не ограниче- SN (x) = (1 − x) · xn = (xn − xn+1 ) =
ны по равномерной норме на этом интервале: n=1 n=1
= (x−x2 )+(x2 −x3 )+(x3 −x4 )+...+(xN −xN +1 ) =
N
X ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
kSN (x)kx∈(−1;1) = sup xn >
x∈(−1;1) n=1 = x − x2 + x2 − x3 + x3 − x4 + ... + xN − xN +1 =
542Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
x∈(0;1) ↓ ↓ ↓
= x − xN +1 −→ x = S(x)
N →∞ 1 1
+ ... + − =
(N − 1)x + 1 N x + 1
Теперь найдем норму остатка | {z }
n=N
P∞
1◦ . Если ряд n=1 an (x) равномерно сходится на множестве E, то равномерная норма его
частичных сумм ограничена:
XN
sup an < ∞.
n∈N n=1 E
0
2 . Если функции an непрерывны на множестве E и ряд
∞
X
an (x)
n=1
непрерывна на множестве E.
0
3 . Если функции an непрерывны на интервале (a, b) и ряд
∞
X
an (x)
n=1
§ 1. Функциональные последовательности и функциональные ряды 543
равномерно сходится на (a, b), то для всякой точки c ∈ (a, b) справедливо равенство
! ∞
X∞ X
lim an (x) = lim an (x) (9.1.31)
x→c x→c
n=1 n=1
равномерно сходится на отрезке [a, b], и хотя бы для одной точки c ∈ [a, b] сходится
числовой ряд
∞
X
an (c) (9.1.33)
n=1
равномерно сходится на отрезке [a, b], причем его сумма будет гладкой на [a, b], и ее
производную можно вычислить почленным дифференцированием:
∞
!′ ∞
X X
an = a′n (9.1.34)
n=1 n=1
Доказательство. 1. Свойство
P∞ 1◦ следует сразу из свойства 1◦ на с.536.
2. Пусть дан ряд n=1 an (x), коэффициенты которого an (x) – непрерывные функции на мно-
жестве E. Тогда частичные суммы
N
X
SN (x) = an (x)
n=1
будут непрерывны на множестве E (по теореме 3.3.2), как конечные суммы непрерывных функ-
ций). Если ряд сходится равномерно на E, то есть частичные суммы стремятся равномерно на E к
некоторой функции S(x)
x∈E
SN (x) ⇒ S(x),
N →∞
◦
то по свойству 2 на с.536 эта функция
∞
X
S(x) = an (x)
n=1
равномерно сходятся на интервале (a, b). Это значит, что его частичные суммы
N
X
SN (x) = an (x)
n=1
По свойству 3◦ на с.536, отсюда следует, что для всякой точки c ∈ (a, b) справедливо равенство
то есть равенство !
∞
X ∞
X
lim an (x) = lim an (x)
x→c x→c
n=1 n=1
то есть, ! !
ˆ b ∞
X ∞
X ˆ b
an (x) dx = an (x) d x
a n=1 n=1 a
равномерно сходятся на отрезке [a, b], и для какой-нибудь точки c ∈ [a, b] сходится ряд
∞
X
an (c)
n=1
PN
Тогда частичные суммы SN = n=1 an – гладкие функции на [a, b], последовательность их произ-
водных равномерно сходится на [a, b] к некоторой функции g(x)
x∈[a,b]
′
SN (x) ⇒ g(x),
N →∞
lim SN (c)
N →∞
По свойству 5◦ на с.537, отсюда следует, что функции SN равномерно на [a, b] сходится (к некоторой
гладкой функции S),
x∈[a,b]
SN (x) ⇒ S(x),
N →∞
§ 1. Функциональные последовательности и функциональные ряды 545
причем
′
′
lim SN = lim SN
N →∞ N →∞
∞
!′ ∞
X X
an = a′n
n=1 n=1
Теорема 9.1.3 (критерий Коши равномерной сходимости ряда). Пусть {an } – произвольная по-
следовательность функций, определенных на множестве x ∈ E. Тогда следующие условия эквива-
лентны:
(i) функциональный ряд
∞
X
an
n=1
kX
i +li
an −→ 0
i→∞
n=ki +1 E
PN
Доказательство. Для частичных суммы SN (x) = n=1 an (x) мы получаем следующую логиче-
скую цепочку:
∞
X
ряд an (x) сходится равномерно на E
n=1
Необходимое условие равномерной сходимости ряда. Часто бывает, что частичные суммы
функционального ряда не поддаются вычислению, как, например, в случае с рядом
∞
X x
sin (9.1.35)
n=1
n2
Чтобы понять, сходится этот ряд равномерно, или нет, используются теоремы, называемые призна-
ками равномерной сходимости. Первый из них звучит так:
x∈E
an (x) ⇒ 0
n→∞
Доказательство. По критерию Коши (теорема 9.1.3), если этот ряд сходится равномерно на E, то
для последовательностей li = 1, и ki = i должно выполняться условие
kX
i +li i+1
X
an (x) = an (x) = ||ai+1 (x)||x∈E −→ 0
i→∞
n=ki +1 x∈E n=i+1 x∈E
⋄ 9.1.26. Рассмотрим ряд (9.1.35): Это можно сделать, например, с помощью фор-
∞
X мулы Ньютона-Лейбница: при x > 0 мы получа-
x ем
sin
n=1
n2
(4.1.129)
8.2.11), он сходится при любом x ∈ R: z }| { x
dt
ˆ
∞
X ∞
X ∞
X | arctg x | = arctg x = 6
x x 1 0 1 + t2
sin 2 6 (4.1.92) 6 2
= |x|· <∞ x
n n n2
ˆ
n=1 n=1 n=1 6 1 d t = x = |x|
0
Поймем, будет ли он сходиться равномерно на
множестве E = R. Для этого вычислим норму
общего члена: и отсюда уже для x < 0 получаем
x x
sin 2 = sup sin 2 = 1 6−→ 0 0
n x∈R x∈R n n→∞ 0
<
>
(4.1.130)
Вывод: ряд сходится на R, но не равномерно. z }| { z}|{
arctg x = − arctg x = arctg( −x ) 6 −x = |x|
⊲ 9.1.27. Проверьте, будет ли ряд сходится рав-
номерно на множестве R:
∞ ⊲⊲ 9.1.28. Проверьте, будут ли данные ряды схо-
X x
arctg 2 дится равномерно на множестве E:
n=1
n P∞ n
1. x , E = (−1; 1);
Здесь предварительно нужно доказать формулу, Pn=1
∞ n n
аналогичную (4.1.92):
2. n=1 x · (1 − x ), E = [0; 1] (здесь необхо-
димо исследование функции xn · (1 − xn ) на
| arctg x| 6 |x|, x∈R (9.1.36) экстремум на множестве [0; 1]).
§ 1. Функциональные последовательности и функциональные ряды 547
||an (x)||x∈E −→ 0
i→∞
n=ki +1
Отсюда
kX
i +li kX
i +li
⇓
kX
i +li
an (x) −→ 0
i→∞
n=ki +1 x∈E
⋄ 9.1.29. Проверим, будет ли ряд (9.1.35) схо- Вывод: ряд сходится равномерно на отрезке [0; 1].
диться равномерно на множестве [0; 1]:
⊲⊲ 9.1.30. Проверьте, будут ли данные ряды схо-
X∞
x дится равномерно на множестве E:
sin 2 P∞
n 1. 1
E = R;
n=1 n=1 x2 +n2 ,
P∞ n
Для этого вычислим норму общего члена: 2. n=1 x , E = − 21 ; 12 ;
P∞ x
x x 1 3. n=1 1+n4 ·x2 , E = R (здесь необходимо ис-
sin 2 = sup sin 2 = sin 2
n x∈[0;1] x∈[0;1] n n следование функции 1+nx4 ·x2 на экстремум);
P∞ n·x
Теперь получаем 4. n=1 1+n5 ·x , E = R;
P∞ n n+1
x x
X∞
x X∞
1 5. n=1 n − n+1 , E = R;
sin 2 = sin 2 6 P∞ n2
n=1
n x∈[0;1] n=1 n 6. √ (xn + x−n ) , E = 1, 2 .
n=1 n! 2
X∞
1
6 (4.1.92) 6 2
<∞
n=1
n
Тогда
P∞ n
(a) функциональный ряд n=0 (−1) bn сходится равномерно на множестве E,
(b) его остаток оценивается сверху нормой своего первого члена:
∞
X
(−1)n bn (x) 6 ||bN +1 ||E (9.1.40)
n=N +1 x∈E
Доказательство. Из признака Лейбница сходимостиP числового ряда (теорема 8.2.12) следует, что
при каждом фиксированном x ∈ E числовой ряд ∞ n=0 (−1)n
b n (x) сходится. Обозначим через S(x)
его сумму, а через SN (x) его частичные суммы:
∞
X N
X
S(x) = (−1)n bn (x), SN (x) = (−1)n bn (x)
n=0 n=0
⇓
∞
X
||S(x) − SN (x)||x∈E = sup |S(x) − SN (x)| = sup (−1)n bn (x) 6 ||bN +1 ||E
x∈E x∈E n=N +1
То есть справедлива оценка (9.1.40). Из нее сразу следует равномерная сходимость ряда:
⇓
||S(x) − SN (x)||x∈E −→ 0
N →∞
⇓
x∈E
SN (x) ⇒ S(x)
N →∞
N
X
sup an (x) <∞
N ∈N n=1 x∈E
Действительно,
q
X q
X p−1
X q
X p−1
X
an (x) = an (x) − an (x) 6 an (x) + an (x) 6 2C
n=p x∈E n=1 n=1 x∈E n=1 x∈E n=1 x∈E
| {z } | {z }
>
>
C C
kX
i +li N
X n o
an (x) · bn (x) 6 3 · max an (x) · max |bki +1 (x)| , |bki +li (x)|
ki 6N 6ki +li | {z } | {z }
n=ki +1 n=ki +1
| {z }
>
>
bki +1 (x) bki +li (x)
>
x∈E x∈E
PN
n=ki +1 an (x)
x∈E
>
(9.1.42)
2C
⇓
kX
i +li n o
an (x) · bn (x) 6 6 · C · max kbki +1 (x)kx∈E , kbki +li (x)kx∈E −→ 0
n=ki +1
| {z } | {z } i→∞
x∈E ↓ (9.1.41) ↓ (9.1.41)
0 0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
1. n=1
√
3 2
n +ex
, E = R;
|x| · (1 + |xN |) P∞
6 sup 6 cos 2πn
x∈(−1;0) |1 − x| 2. n=1 , E = R (здесь нужно применить
√ 3
n2 +x2
supx∈(−1;0) |x| · (1 + |xN |) формулы (8.2.66));
2 P∞ sin x·sin nx
6 6 =2 3. √ , E = R (тоже нужны форму-
inf x∈(−1;0) |1 − x| 1 n=1 n+1
лы (8.2.66)).
550Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Теорема 9.1.8 (признак Абеля). Пусть функциональные последовательности {an } и {bn } на мно-
жестве E обладают следующими свойствами:
P∞
(i) ряд n=1 an сходится равномерно на E;
(ii) последовательность {bn } монотонна и равномерно ограничена на E:
N
X
max an −→ 0 (9.1.43)
ki 6N 6ki +li i→∞
n=ki +1 E
kX
i +li N
X n o
an (x) · bn (x) 6 3 · max an (x) · max |bki +1 (x)|, |bki +li (x)|
ki 6N 6ki +li | {z } | {z }
n=ki +1 n=ki +1
| {z }
>
>
B B
>
PN
n=ki +1 an
E
⇓
kX
i +li N
X
an · bn 6 3B · max an −→ 0
ki 6N 6ki +li i→∞
n=ki +1 n=ki +1
| {z }
↓ (9.1.43)
0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится равномерно.
Всюду непрерывная, но нигде не диффе- мых этого ряда образуют сходящийся ряд
ренцируемая функция. X∞ X∞
bn kcos(an πx)kx∈R = bn < ∞
⋄ 9.1.33. Пусть числа a и b удовлетворяют n=0 n=0
условиям:
поэтому по признаку Вейерштрасса (теорема
3 9.1.5), функциональный ряд в (9.1.44) сходится
0 < b < 1, a ∈ 2N − 1, ab > 1 + π
2 равномерно, и значит, определяет непрерывную
функцию. Зафиксируем точку x ∈ R и убедимся,
Тогда функция
что f не дифференцируема в ней.
X∞ Заметим прежде всего, что
f (x) = bn cos(an πx) (9.1.44) 3
n=0 ab > 1 + π
2
определена и непрерывна всюду на R, но не диф- ⇓
ференцируема ни в одной точке.
3 π
Доказательство. Равномерные нормы слагае- > (9.1.45)
2 ab − 1
§ 1. Функциональные последовательности и функциональные ряды 551
k−1
Далее рассмотрим три последовательности: X cos an π(x + hk ) − cos(an πx)
6 bn · 6
1 1 1 1 n=0
hk
ξk = ak x + − ∈ − , k−1 k−1
2 2 2 2 X an πhk X
6 bn · =π· (ab)n =
1 hk
αk = ak x + = ak x − ξk ∈ Z n=0 n=0
2
k (ab)k − 1 πak bk
3 1 = (2.2.246) = π · 6
1 − ξk 2 − a x+ 2 ab − 1 ab − 1
hk = k
= k
a a
После этого оценим R. Пусть n > k. Тогда,
(здесь [·] и {·} – целая и дробная части числа, во-первых,
определенные формулами (2.2.286) и (2.2.292)).
Очевидно, что ak · (x + hk ) = ak · x + ak · hk =
3 k 3 k 1
0 < hk 6 (9.1.46) =a ·x+ − a x+ =
2ak 2 2
1 1
⇓ = ak · x + − ak x + +1=
2 2
hk −→ 0,
1
k→∞ = ak x + + 1 = αk + 1
поэтому наша задача будет выполнена, если мы 2
докажем, что ⇓
f (x + hk ) − f (x)
−→ ∞ an · π · (x + hk ) = an−k · ak (x + hk ) · π =
hk k→∞
= an−k · (αk + 1) · π
Обозначим
⇓
k−1
X n n
n cos a π(x + hk ) − cos(a πx)
S= b ·
n=0
hk cos an ·π·(x+hk ) = cos an−k · (αk + 1) ·π =
∞ | {z }
X n n
n cos a π(x + hk ) − cos(a πx)
∋
R= b · . Z
hk
n=k
2N − 1
∈
Тогда z }| {
n−k αk +1
= (−1) an−k ·(αk +1)
= (−1) a = (−1)αk +1
f (x + hk ) − f (x)
=
hk Во-вторых,
∞
X n n ak · x = αk + ξk
n cos a π(x + hk ) − cos(a πx)
= b · =
n=0
hk ⇓
∞ n n−k
k−1
X X a ·x=a · (αk + ξk )
= + =S+R
⇓
n=0 n=k
Сначала оценим сверху S: cos an πx = cos an−k · π · (αk + ξk ) =
cos an π(x + hk ) − cos(an πx) = = cos an−k παk + an−k πξk = (10.3.135) =
= cos an πx + an πhk − cos(an πx) = (4.1.89) = = cos an−k αk π · cos an−k πξk −
| {z }
2an πx + an πhk an πhk
=
>
(4.1.92)
1 an πhk
2 | {z }
=
an πhk
2
0
n−k
·αk
⇓ = (−1)a · cos an−k πξk =
2N − 1
∈
k−1
X n n z }| {
n cos a π(x + hk ) − cos(a πx) n−k αk
|S| = b · 6
hk = (−1) a · cos an−k πξk =
n=0
552Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
= (−1)αk · cos an−k πξk 0
=
z }| {
Вместе мы получаем: 1 + cos a k − k πξ
k
> bk · =
hk
| {z }
cos an π(x + hk ) − cos(an πx) = n=k
αk +1 αk n−k
−π
π
= (−1) − (−1) · cos a πξk = 2, 2
∈
z}|{
= (−1)αk +1 1 + cos an−k πξk 1 + cos πξk bk 2ak bk
k
=b · > (9.1.46) >
hk hk 3
⇓ Теперь получаем:
f (x + hk ) − f (x)
∞
X1 + cos an−k πξk > |R| − |S| >
hk
|R| = (−1)αk · bn · =
hk 2ak bk πak bk
n=k
∞ > − =
X n−k 3 ab − 1
n 1 + cos a πξk
= b · = 2 π
h = − (ab)k −→ ∞
n=k | {z k } 3 ab − 1 k→∞
| {z }
6
<
(9.1.45)
∞ 0
X 1 + cos a n−k
πξk
= bn · >
hk
n=k
f0 = f, ∀k ∈ Z+ ∃fk′ = fk+1 .
⋄⋄ 9.1.34. 1
+ · sup |2| = 4 + 4 + 1 = 9
2 x∈[0;2]
(0)
x2 x∈[0;2]
= sup |x2 | = 4 (1)
ksin xkx∈R = sup | sin x| + sup | cos x| = 1 + 1 = 2
x∈[0;2] x∈R x∈R
(1) (2)
x2 x∈[0;2] 2
= sup |x | + sup |2x| = 4 + 4 = 8 ksin xkx∈R = sup | sin x| + sup | cos x|+
x∈[0;2] x∈[0;2] x∈R x∈R
(2) 1 1
x2 x∈[0;2] 2
= sup |x | + sup |2x|+ + · sup | − sin x| = 1 + 1 + = 2, 5
x∈[0;2] x∈[0;2] 2 x∈R 2
Доказательство. Как и в случае со свойствами равномерной нормы на с.533, все эти утверждения
следуют напрямую из свойств модуля. Мы предоставляем читателю самостоятельно проверить их
справедливость.
pi −→ ∞, qi −→ ∞ (9.1.58)
i→∞ i→∞
Следующие две теоремы аналогичны теоремам 9.1.3 и 9.1.5, и доказывается так же:
Теорема 9.1.10 (критерий Коши равномерной по производным сходимости ряда). Для последова-
тельности функций an ∈ C m (E) следующие условия эквивалентны:
(i) функциональный ряд
∞
X
an (x)
n=1
an −→ 0
i→∞
n=ki +1 E
Все объявленные ее свойства очевидны, кроме Мы получили, что первая производная суще-
бесконечной гладкости. Очевидно, f будет беско- ствует в каждой точке. Существование осталь-
нечно гладкой в некоторой окрестности каждой ных проверяется по индукции. Предположим,
556Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
что мы доказали, что существует производная Лемма 9.1.12. Для любых ε > 0 и n ∈ Z+ суще-
порядка n. Очевидно, она имеет вид ствует гладкая функция ϕ ∈ C ∞ [−1; 1] со следу-
( P (x) 1 ющими свойствами:
n −x
e , x > 0
f (n) (x) = Qn (x) 1) в точке x = 0 все ее производные равны нулю,
0, x60 кроме производной порядка n, которая равна
единице,
где Pn (x) и Qn (x) некоторые многочлены. Отсю-
(
да получаем 0, k 6= n
(k)
ϕ (0) =
1 1, k = n
(n+1) Pn (x)e− x
f+ (0) = lim =
x→+0 xQn (x) 2) ее равномерная норма на отрезке [−1, 1] по
1 R (t)
= t n производным до порядка n − 1 меньше ε,
= x = lim e−t = 0
t → +∞ t→+∞ Sn (t)
(n−1)
kϕk[−1,1] < ε.
где Rn (t) и Sn (t) – некоторые новые многочле-
ны. Доказательство. Положим δ = εe (где e – чис-
ло Непера) и рассмотрим функцию η из примера
⋄ 9.1.36. Для любого интервала (a, b) на R 9.1.38 со следующими свойствами:
существует бесконечно гладкая функция g ∈
C ∞ (R) со следующими свойствами:
η(x) = 0, x∈/ (−δ, δ)
( η(x) = 1, x ∈ − δ2 , 2δ
ga,b (x) = 0, x ∈ / (a, b)
0 < η(x) < 1, – в остальных случаях
ga,b (x) > 0, x ∈ (a, b)
Рассмотрим последовательность функций fn ,
Доказательство. Можно положить определенную рекуррентными соотношениями:
ga,b (x) = f (b − x) · f (x − a), f0 = η,
(´ x
где f – функция из примера 9.1.35. 0 ´fm−1 (t) d t, x∈
/ [0, 1]
fm (x) = 0 , m>1
⋄ 9.1.37. Для любого интервала (a, b) на R су- − x fm−1 (t) d t, x∈
/ [−1, 0)
ществует бесконечно гладкая функция ha,b ∈
По предложению 7.3.15, все функции fm явля-
C ∞ (R) со следующими свойствами:
ются гладкими на отрезке [−1, 1], причем
ha,b (x) = 0, x6a ′
fm = fm−1 , m>1
0 < ha,b (x) < 1, x ∈ (a, b)
Отсюда следует формула:
ha,b (x) = 1, x>b
Доказательство. Этими свойствами будет обла-
fm−k , 06k<m
(k)
дать функция f m = η, k =m (9.1.64)
(k−m)
´x η , k>m
a ga,b (t) d t
ha,b (x) = ´ b ,
g (t) d t Из нее, в свою очередь, следует три важных для
a a,b
нас соотношения:
где ga,b – функция из примера 9.1.36. (
(k) 0, k 6= m
⋄ 9.1.38. Для любой последовательности чисел fm (0) = , (9.1.65)
1, k = m
a<α<β<b kfm k[−1,1] = sup |fm (x)| 6 δ, m>1
x∈[−1,1]
существует бесконечно гладкая функция η ∈ (9.1.66)
C ∞ (R) со следующими свойствами: (m−1)
kfm k[−1,1] <ε (9.1.67)
η(x) = 0, x∈/ (a, b)
Здесь равенство (9.1.65) доказывается пере-
η(x) = 1, x ∈ (α, β) числением случаев: если 0 6 k < m, то
0 < η(x) < 1, x ∈ (a, α) ∪ (β, b) ˆ 0
(k)
Доказательство. Можно взять fm (0) = fm−k (0) = fm−1 (t) d t = 0,
0
(n−1)
δ, kϕn k[−1,1] < (9.1.70)
по предположению 2n−1 · |an |
индукции
Заметим, что функциональный ряд
А с другой стороны, ∞
X
an · ϕn
kfm k[−1,0] = sup |fm (x)| = n=0
x∈[−1,0]
сходится на [−1, 1] равномерно по производным
ˆ 0
= sup fm−1 (t) d t 6 до произвольного порядка k. Действительно, при
x∈[−1,0] x любом фиксированном k мы получаем:
6 sup (0 − x) · sup |fm−1 (x)| 6 X (k)
X (n−1)
x∈[−1,0] x∈[−1,0] kan · ϕn k[−1,1] 6 kan · ϕn k[−1,1] =
6 1 · kfm−1 k[−1,1] 6δ n>k+1 | {z } n>k+1
>
| {z } (n−1)
kan · ϕn k[−1,1] ,
>
δ, ⇑
по предположению (9.1.55)
индукции ⇑
k 6n−1
558Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
X (n−1)
= |an | · kϕn k[−1,1] 6 (9.1.70) 6 кой. При этом, по свойству 2◦ на с.555,
n>k+1
∞
X
X 1 X 1
6 |an | · = <∞ f (k) = an · ϕ(k)
n
2 n−1 · |an | 2n−1
n>k+1 n>k+1 n=0
и отсюда
Из сходимости этого ряда по признаку Вейер-
∞
X
штрасса 9.1.11 следует, что его сумма
f (k) (0) = an · ϕ(k) (0) = (9.1.69) = ak
n=0
| n{z }
∞
X ↑
f= an · ϕn среди этих чисел
n=0 отлично от нуля
только с индексом
n=k
является гладкой функцией порядка k. Это спра-
ведливо для любого k, значит f является глад-
ˆ
⋄⋄ 9.1.39.
´
ksin xkx∈[0,2π] = | sin x| d x =
x3 x=2 8 [0,2π]
´ ˆ
2 2
x x∈[0;2]
= |x | d x = = ˆ π ˆ 2π
[0;2] 3 x=0 3
= sin x d x − sin x d x =
0 π
´ ˆ x=π x=2π
ksin xkx∈[0;π] = | sin x| d x = = − cos x + cos x =2+2=4
x=0 x=π
[0;π]
ˆ π x=π
= sin x d x = − cos x =2
0 x=0
2◦ . Однородность: ´ ´
kλ · f k[a,b] = |λ| · kλ · f k[a,b] , λ∈R (9.1.73)
3◦ . Полуаддитивность: ´ ´ ´
kf + gk[a,b] 6 kf k[a,b] + kgk[a,b] (9.1.74)
2◦ . Пусть функции fn интегрально сходятся на отрезке [a, b], тогда интеграл их предела
совпадает с пределом интегралов:
ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x. (9.1.78)
a n→∞ n→∞ a
N N
⋄ 9.1.41. Ряд X X
∞
X SN (x) = (1 − x) · xn = (xn − xn+1 ) =
n
x n=1 n=1
n=1 x∈[0;1]
= x− xN +1 −→ x = S(x)
не сходится интегрально на отрезке [0; 1], пото- N →∞
му что его частичные суммы не ограничены по
интегральной норме на этом отрезке: Интегральная норма остатка:
N
1X
ˆ ´
kSN (x) − S(x)kx∈[0;1] =
´
n
kSN (x)kx∈[0;1] = x dx =
0 n=1
ˆ 1
N ˆ N = (x − xN +1 ) − x d x =
X 1 X 1 0
= xn d x = −→ ∞. 1
xN +2 1
ˆ
n + 1 N →∞ 1
n=1 0 n=1 = xN +1 d x = 0
= −→ 0
0 N +2 N + 2 N →∞
(а в силу замечания (d) для сходимости ряда эта
последовательность должна быть ограничена). P∞
Вывод: ряд n=1 (1 − x) · xn сходится на отрезке
⋄ 9.1.42. Выясним, будет ли ряд [0; 1] интегрально к сумме S(x) = x.
∞
X ⊲⊲ 9.1.43. Выясните, будет ли данный ряд схо-
(1 − x) · xn диться интегрально на отрезке [0, 1]:
n=1
P∞ x
1) n=1 (nx−x+1)(nx+1) ;
сходиться интегрально на отрезке [0; 1]. В приме- P∞ P∞ √ √
x √
ре 9.1.42 мы нашли поточечный предел его ча- 2) n=1 nx+x+ nx =
√
n=1 nx + x − nx ;
стичных сумм: P∞ xn +(x+1)n P∞ 1 1
3) n=1 xn ·(x+1)n = n=1 (x+1)n + xn .
§2 Аппроксимация
(a) Приближение интегрируемых функций
Приближение интегрируемой функции кусочно постоянными.
• Функция g на отрезке [a, b] называется кусочно-постоянной, если существует разбиение
τ = {x0 , ..., xk } отрезка [a, b] такое, что на каждом интервале (xi−1 , xi ) функция g посто-
янна:
g(s) = g(t), s, t ∈ (xi−1 , xi )
Понятно, что всякая кусочно-постоянная функция g будет кусочно-гладкой, и значит, интегри-
руемой на [a, b]. Если через Ci обозначить значения g на интервалах постоянства (xi−1 , xi ),
g(x) = Ci , x ∈ (xi−1 , xi ),
то по лемме 7.3.9, интеграл по каждому отрезку [xi−1 , xi ] от g будет равен интегралу от Ci по этому
отрезку ˆ xi
g(x) d x = Ci · xi − xi−1
xi−1
b k
X
ˆ
g(x) d x = Ci · xi − xi−1 (9.2.81)
a i=1
§ 2. Аппроксимация 561
Теорема 9.2.1. Для любой интегрируемой функции f на отрезке [a, b] и любого ε > 0 можно
найти кусочно-постоянную функцию g на [a, b] такую, что
´ ˆ b
kf − gk[a,b] = |f (x) − g(x)| d x < ε (9.2.82)
a
Доказательство. Выберем разбиение τ = {x0 , ..., xk } отрезка [a, b] так, чтобы нижняя сумма Дарбу
sτ отличалась от интеграла меньше чем на ε:
ˆ b
06 f (x) d x − sτ < ε
a
(а в последней точке xk = b функцию g можно определить, например, положив g(b) = f (b)). Тогда
мы получим:
g(x) 6 f (x), x ∈ [a, b]
и поэтому
ˆ b ˆ b ˆ b ˆ b
| f (x) − g(x) | d x = f (x) − g(x) d x = f (x) d x − g(x) d x = (9.2.81) =
a | {z } a a a
6
0
ˆ b k
X ˆ b
= f (x) d x − inf f (x) · ∆xi = f (x) d x − sτ < ε
a x∈[xi−1 ,xi ] a
i=1
| {z }
=
sτ
а также условие
g(a) = 0 = g(b) (9.2.86)
Доказательство. 1. Рассмотрим сначала случай, когда функция f представляет собой ступеньку,
то есть имеет вид (
C, x ∈ [α, β]
f (x) =
0, x ∈
/ [α, β]
для некоторого отрезка [α, β] ⊆ [a, b] и некоторого числа C ∈ R. Тогда для любого ε > 0 можно
поправить функцию f линейно в окрестностях точек разрыва α и β (или в окрестности одной из
них, если другая является концом отрезка [a, b]) так, чтобы получилась непрерывная функция g,
отличающаяся от f только в этих окрестностях, и интеграл от модуля разности будет маленьким.
562Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Если же a = α или β = b, то в определении g интервал (α−δ, α) или интервал (β, β+δ) соответственно
нужно исключить, и результат будет тем же. Условие (9.2.85) при этом выполняется автоматически.
2. После этого предположим, что функция f кусочно-постоянна. Тогда, если не считать ее значе-
ний в точках разрыва, она будет совпадать с суммой некоторого конечного набора ступенек f1 , ..., fn :
n
X
f= fi
i=1
ˆ b ˆ b n
X n
X ˆ b n
X
|f (x) − g(x)| d x = fi (x) − gi (x) d x = fi (x) − gi (x) d x 6
a a i=1 i=1 a i=1
n
bX Xn ˆ b Xn
ε
ˆ
6 fi (x) − gi (x) d x = fi (x) − gi (x) d x < =ε
a i=1 i=1 a i=1
n
sup |g(x)| = max sup |gi (x)| 6 max sup |fi (x)| = sup |f (x)|
x∈[a,b] 16i6n x∈[a,b] 16i6n x∈[a,b] x∈[a,b]
3. Наконец, если f – произвольная интегрируемая функция, и ε > 0, то, подберем для нее по
теореме 9.2.1 кусочно-постоянную функцию, обозначим ее h, так, чтобы
ˆ b
ε
|f (x) − h(x)| d x <
a 2
Затем, по уже доказанному, мы можем подобрать для функции h непрерывную функцию g так,
чтобы ˆ b
ε
|h(x) − g(x)| d x <
a 2
И тогда мы получим:
ˆ b ˆ b ˆ b
|f (x) − g(x)| d x = |f (x) − h(x) + h(x) − g(x)| d x 6 |f (x) − h(x)| + |h(x) − g(x)| dx =
a a a
b b
ε ε
ˆ ˆ
= |f (x) − h(x)| d x + |h(x) − g(x)| d x < + =ε
a a 2 2
§ 2. Аппроксимация 563
Если кроме того, h и g выбирались так, чтобы удовлетворять условиям (9.2.85) и (9.2.83), то мы
получим
(9.2.85) (9.2.83)
sup |g(x)| 6 sup |h(x)| 6 sup |f (x)|
x∈[a,b] x∈[a,b] x∈[a,b]
4. Последнее условие (9.2.86) можно обеспечить, поправив еще немного функцию g в окрестности
точки a или b так, как мы это делали в пункте 1 (то есть линейно).
(b) Свертка
• Сверткой функций f : R → R и g : R → R называется функция f ∗g : R → R, определенная
формулой
ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y, y ∈ R (9.2.87)
−∞ A → −∞ A
B → +∞
Здесь в правой части стоит несобственный интеграл, который, конечно, не для любых f , g
и x существует, и поэтому свертка f ∗ g не всегда определена. Среди достаточных условий для
существования свертки нас будет интересовать только одно, а именно, то, в котором функции f и g
локально интегрируемы, причем одна из них финитна. Понятие локально интегрируемой функции
было введено нами на с.470, а что такое финитная функция объясняется в следующем определении:
• Функция f : R → R называется финитной, если существует отрезок [a, b], вне которого
функция f обращается в нуль:
∀x ∈
/ [a, b] f (x) = 0
0 0
ˆ b
= f (y) · g(x − y) d y
a
Если же финитна функция g, и [a, b] = conv supp g – ее выпуклый носитель, то для всякого фик-
сированного x ∈ R функция y 7→ g(x − y) будет тоже финитной, и ее выпуклым носителем будет
отрезок [x − b, x − a]:
x−y ∈ [a, b] ⇔ a 6 x−y 6 b ⇔ −a > y−x > −b ⇔ x−a > y > x−b ⇔ y ∈ [x−b, x−a]
=
0 0
ˆ x−a
= f (y) · g(x − y) d y
x−b
Свойства свертки
1◦ . Дистрибутивность:
(f + g) ∗ h = f ∗ h + g ∗ h (9.2.89)
2◦ . Коммутативность:
f ∗g =g∗f (9.2.90)
3◦ . Перестановочность со сдвигом:
ˆ +∞
(f + g) ∗ h (x) = f (y) + g(y) · h(x − y) d y =
−∞
ˆ +∞ ˆ +∞
= f (y) · h(x − y) d y + g(y) · h(x − y) d y = (f ∗ h)(x) + (g ∗ h)(x)
−∞ −∞
3. Перестановочность со сдвигами:
ˆ +∞ ˆ B y+a=t
(Ta f ) ∗ g(x) = Ta f (y) · g(x − y) d y = lim f (y + a) · g(x − y) d y = y =t−a = (7.2.104) =
−∞ A → −∞ A dy = dt
B → +∞
§ 2. Аппроксимация 565
ˆ B+a α=A+a −→ −∞
A→−∞
= lim f (t) · g(x + a − t) d t = β =B+a −→ +∞ =
A → −∞ A+a B→+∞
B → +∞
ˆ β ˆ +∞
= lim f (t) · g(x + a − t) d t = f (t) · g(x + a − t) d t = (g ∗ f )(x + a) = Ta (g ∗ f ) (x)
α → −∞ α −∞
β → +∞
ˆ ∞ ˆ b
∀x ∈ [A, B] (f ∗ g)(x) = f (x − y) · g(y) d y = f (x − y) · g(y) d y 6
−∞ |{z} a
↑
отлично от нуля
только при y ∈ [a, b]
[A − b, B − a]
⊆
[x − b, x − a]
∈
ˆ b z }| { ˆ b ´
6 |f ( x − y )| · g(y) d y 6 kf k[A−b,B−a] · g(y) d y = kf k[A−b,B−a] · kgk[a,b]
a | {z } a
>
kf k[A−b,B−a]
⇓
´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]
Теперь (9.2.93):
ˆ ∞
∀x ∈ [A, B] (f ∗ g)(x) = f (x − y) · g(y) d y =
−∞ |{z}
↑
отлично от нуля
только при y ∈ [a, b]
ˆ b ˆ b
= f (x − y) · g(y) d y 6 f (x − y) · |g(y)| d y 6 (7.2.97) 6
a a | {z }
>
kgk[a,b]
ˆ b x−y =t
ˆ x−b
6 f (x − y) d y · kgk[a,b] = y =x−t = − kgk[a,b] · fn (t) − f (t) d t =
a dy = −dt x−a
ˆ x−a ˆ B−a ´
= f (t) d t · kgk[a,b] 6 f (t) d t · kgk[a,b] = kf k[A−b,B−a] · kgk[a,b]
x−b ↑ A−b
[x − b, x − a] ⊆ [A − b, B − a]
⇓
´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]
Лемма 9.2.4. Пусть f – непрерывная функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
kTsn f − f k[α,β] = kf (x + s) − f (x)kx∈[α,β] −→ 0 (9.2.94)
s→0
Здесь при необходимости число δ можно уменьшить так, чтобы выполнялось дополнительное нера-
венство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
x + s ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1]
|(x + s) − x| = |s| < δ
⇓
|f (x + s) − f (x)| < ε
Поэтому
kTs f − f k[α,β] = sup |f (x + s) − f (x)| 6 ε (9.2.95)
x∈[α,β]
То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(9.2.95). Это и нужно было доказать.
Лемма 9.2.5. Пусть f – гладкая функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
Ts f − f f (x + s) − f (x)
− f′ = − f ′ (x) −→ 0 (9.2.96)
s [α,β] s x∈[α,β]
s→0
Опять замечаем, что при необходимости число δ можно уменьшить так, чтобы выполнялось допол-
нительное неравенство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
x + τ ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1]
|(x + τ ) − x| = |τ | 6 |s| < δ
1 ⇓
· f (x + s) − f (x) −f ′ (x) = |f ′ (x + τ ) − f (x)| < ε ′
s |
∋
{z } →
−
0s
=
(7.3.127)
´ x+s
x
f ′ (y) d y
=
´s
0
f ′ (x + t) d t
=
(7.3.126)
f ′ (x + τ ) · s,
→
−
τ ∈ 0s
Поэтому
Ts f − f f (x + s) − f (x)
− f′ = sup − f ′ (x) 6 ε (9.2.97)
s [α,β] x∈[α,β] s
То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(9.2.97). Это и нужно было доказать.
Окончание доказательства теоремы 9.2.3. Вспомним, что в доказательстве теоремы 9.2.3 мы от-
ложили на будущее проверку того, что свертка f ∗g действительно является непрерывной функцией.
Теперь можем в этом убедиться.
1. Предположим сначала, что функция g непрерывна и финитна. Пусть [a, b] – ее выпуклый
носитель:
conv supp g = [a, b]
Тогда для любой последовательности sn → 0, по модулю не превосходящей 1,
|sn | 6 1
§ 2. Аппроксимация 567
∀x ∈ R (f ∗ g)(x + sn ) −→ (f ∗ g)(x)
n→∞
∀x ∈ R (f ∗ g)(x + s) −→ (f ∗ g)(x)
s→0
Второе из этих условий означает, что функции gn можно продолжить нулем вне отрезка [a, b], и они
станут непрерывными функциями, определенными на всей прямой R, и, как и g, сосредоточенными
на отрезке [a, b], поэтому
∀n conv supp(gn − g) ⊆ [a, b]
После этого для всякого отрезка [A, B] ⊂ R мы получим:
´
kf ∗ gn − f ∗ gk[A,B] = (9.2.89) = kf ∗ (gn − g)k[A,B] 6 (9.2.92) 6 kf k[A−b,B−a] · kgn − gk[a,b] −→ 0
n→∞
⇓
x∈[A,B]
(f ∗ gn )(x) ⇒ (f ∗ g)(x)
n→∞
При этом, поскольку функции gn непрерывны, по уже доказанному, свертки f ∗ gn – тоже непрерыв-
ные функции. Значит, по свойству 1◦ на с.536, равномерный на отрезке [A, B] предел f ∗ g функций
f ∗ gn должен быть непрерывной функцией на [A, B]. Это верно для любого отрезка [A, B], значит
функция f ∗ g должна быть непрерывна всюду на R.
Теорема 9.2.6. Если одна из функций f или g является гладкой, то свертка f ∗g тоже является
гладкой, причем если гладкой является функция f , то
(f ∗ g)′ = f ′ ∗ g (9.2.99)
(f ∗ g)′ = f ∗ g ′ (9.2.100)
568Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
1
∀[α, β] ⊂ R Tsn f − f − f ′ −→ 0 (лемма 9.2.5)
sn [α,β]
n→∞
(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R − (f ′ ∗ g)(x) =
sn
1 1
= (Tsn f ∗ g)(x) − (f ∗ g)(x) − (f ′ ∗ g)(x) = Tsn f ∗ g − f ∗ g − f ′ ∗ g =
sn sn [x,x]
1 1 ´
= Tsn f − f − f ′ ∗ g 6 (9.2.92) 6 Tsn f − f − f ′ · kgk[a,b] −→ 0
sn [x,x] sn [x−b,x−a]
n→∞
| {z }
n
↓ ↓
∞
0
⇓
(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
sn n→∞
(f ∗ g)(x + s) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
s s→0
∀x ∈
/ [α, β] ∀n ∈ N ∆n (x) = 0
если это верно, то в качестве [α, β] всегда можно выбрать отрезок вида [−D, D], где
D > 0, и тогда будет выполняться условие
∀x ∈ R |x| > D =⇒ ∀n ∈ N ∆n (x) = 0 (9.2.101)
§ 2. Аппроксимация 569
π x
x
ˆ
⋄ 9.2.1. Покажем, что функции cos2ndx = 2
=y
=
( −π 2 x = 2y
1
´1
(1−x2 )n d x
· (1 − x2 )n , |x| 6 1 ˆ π2 ˆ π2
∆n (x) = −1
=2 cos2n y d y = 4 cos2n y d y >
0, |x| > 1 − π
0 | {z }
2
(9.2.106)
6
образуют аппроксимативную единицу. Условия 1 − 2y
π ,
потому что
(i)-(iii) здесь очевидны. Докажем (iv). Для вся- cos – выпуклая
кого δ > 0 мы получим: функция на 0, π
2
2n
π
2y
ˆ 2
ˆ 1 ˆ 1 >4 1− dy =
(1 − x2 )n d x = 2 (1 − x2 )n d x > 0 π
−1 0 2n+1 y= π2
1
2π 2y 2π
(1 − x)n+1 x=1 2 =− 1− =
ˆ
>2 (1−x)n d x = −2· = 2n + 1 π y=0 2n +1
0 n+1 x=0 n+1
⇓ ⇓
2 1 2n + 1
6n+1 ´π x
6
´1 cos2n dx 2π
−1
(1 − x2 )n d x −π 2
⇓ ⇓
ˆ ˆ π
ˆ ˆ 1
∆n (x) d x = 2 · ∆n (x) d x = ∆n (x) d x = 2 ∆n (x) d x =
|x|>δ δ
|x|>δ δ
1
ˆ π x 2n
1
2
ˆ
2 n = ´π ·2 cos dx 6
= ´1 · (1 − x ) d x 6 cos2n x
dx δ 2
− x2 )n d x | δ −π 2
−1 (1 {z } | {z }
| {z }
>
>
>
´1 2n+1
n+1 δ
(1 − δ 2 )n d x 2π
x 2n
=
π x
2n + 1
ˆ
(1 − δ 2 )n · (1 − δ)
=y
6 ·2 dx = 2
cos =
2π δ 2 x = 2y
(3.2.58)
6 (n + 1) · (1 − δ 2 )n · (1 − δ) −→ 0 2n + 1
ˆ π2 2n
n→∞
= ·4 cos y dy 6
2π | {z }
⋄ 9.2.2. Покажем, что функции δ
>
( 1
cos δ,
´π
cos2n x
· cos2n x2 , |x| 6 π потому что
∆n (x) = −π 2 dx cos убывает
0, |x| > π на 0, π 2
(9.2.107) 4n + 2
ˆ π2
образуют аппроксимативную единицу. Как и в 6 · cos2n δ d x =
π δ
предыдущем примере, здесь нужно проверить
4n + 2 2
n π (3.2.58)
только условие (iv). Для всякого δ > 0 мы по- = · cos
| {z }δ · − δ −→ 0
лучим: π 2 n→∞
>
1
570Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Пусть далее ε > 0. Поскольку функция f непрерывна на R, она непрерывна и на отрезке [a−D, b+D].
По теореме Кантора 3.3.10 это означает, что f равномерно непрерывна на [a − D, b + D], поэтому
для числа 2ε > 0 должно существовать δ > 0, которое можно подчинить дополнительному условию
δ < D, такое, что
ε
∀s, t ∈ [a − D, b + D] |s − t| < δ =⇒ |f (s) − f (t)| <
2
В частности, при t = x ∈ [a, b] и s = x − y, где y ∈ (−δ, δ), мы получим такое соотношение:
ε
∀x ∈ [a, b] ∀y ∈ (−δ, δ) |f (x − y) − f (x)| < (9.2.110)
2
Теперь для любого x ∈ [a, b] мы получаем:
f ∗ ∆n (x) 1
=
(9.2.87) (9.2.103)
zˆ }| { zˆ }| {
∞ ∞
f ∗ ∆n (x) − f (x) = f (x − y) · ∆n (y) d y −f (x) · ∆n (y) d y =
−∞ −∞
ˆ ∞ ˆ ∞ ˆ ∞
= f (x − y) · ∆n (y) d y − f (x − y) · ∆n (y) d y = f (x − y) − f (x) · ∆n (y) d y =
−∞ −∞ −∞ | {z }
=
0,
при |y| > D
§ 2. Аппроксимация 571
ˆ D ˆ D
= f (x − y) − f (x) · ∆n (y) d y 6 f (x − y) − f (x) · ∆n (y) d y 6
−D −D
ˆ δ ˆ
6 f (x − y) − f (x) ·∆n (y) d y + f (x − y) − f (x) ·∆n (y) d y 6
−δ | {z } |y|>δ | {z }
>
>
(9.2.110)
ε
2 |f (x − y)| + |f (x)|
>
(9.2.109)
M +M
=
2M
δ
ε
ˆ ˆ
6 · ∆n (y) d y + 2M · ∆n (y) d y
2 −δ |y|>δ
И это верно для любого ε > 0. Мы получаем, что, какое ни возьми ε > 0, для почти всех n ∈ N
будет верно неравенство
kf ∗ ∆n − f k[a,b] < ε
То есть,
kf ∗ ∆n − f k[a,b] −→ 0,
n→∞
ϕn = f ∗ ∆n
будут бесконечно гладкими, а по теореме 9.2.8, они будут стремиться к f равномерно на каждом
отрезке в R.
Следствие 9.2.10. Для любой непрерывной функции f : [a, b] → R можно подобрать последо-
вательность бесконечно гладких функций ϕn : [a, b] → R, равномерно сходящуюся к f на [a, b]:
x∈[a,b]
ϕn (x) ⇒ f (x) (9.2.112)
n→∞
x∈[a,b]
fn (x) ⇒ f (x) (9.2.113)
n→∞
Доказательство. 1. Прежде всего заметим, что линейной заменой переменной утверждение сво-
дится к случаю [a, b] ⊂ (0, 1). Например, функция
ϕ(t) = 3(b − a) · t + 2a − b
1 2
превращает отрезок 3, 3 в отрезок [a, b]:
1 2
ϕ , = [a, b]
3 3
А функция f в композиции с ϕ превращается в функцию f ◦ ϕ на отрезке 31 , 23 . Если мы сможем
построить последовательность многочленов gn , приближающую f ◦ ϕ равномерно на отрезке 31 , 32
(содержащимся в интервале (0, 1))
t∈[ 13 , 32 ]
gn (t) ⇒ f ϕ(t) ,
n→∞
−1
то функции fn = gn ◦ ϕ будут многочленами, приближающими f равномерно на [a, b]:
x∈[a,b]
fn (x) = gn ϕ−1 (x) ⇒ f ϕ ϕ−1 (x) = f (x)
n→∞
2. Итак, можно считать, что отрезок [a, b] лежит в интервале (0; 1):
[a, b] ⊂ (0, 1)
Тогда f можно доопределить непрерывно на всю прямую R так, чтобы ее выпуклым носителем был
отрезок [0, 1]. Например, можно на оставшихся кусках интервала (0, 1) доопределить функцию f
линейно, то есть положить
f (a)
a · x, x ∈ (0, a)
f (b)
f (x) = b−1 · (x − b) + f (b), x ∈ (b, 1)
0, x ∈ (−∞, 0] ∪ [1, +∞)
Нам остается только заметить, что на отрезке [a, b] функции f ∗∆n представляют собой многочлены:
§ 2. Аппроксимация 573
ˆ +∞ ˆ x+1
f ∗ ∆n (x) = f (y) · ∆n (x − y) d y = f (y) · ∆n (x − y) d y =
−∞ | {z } x−1
=
0,
при y ∈/ [x − 1, x + 1],
поскольку
conv supp ∆n = [−1, 1]
ˆ x+1 n ˆ 1 n
= Cn · f (y) · 1 − (x − y)2 d y = Cn · f (y) · 1 − (x − y)2 dy =
x−1 |{z} 0 | {z }
=
многочлен по y
0,
при y ∈
/ [0, +1],
причем
x−1 6 0 < 1 6 x+1
число
z }| {
ˆ 1 2n
X 2n
X ˆ 1
n n
= Cn · f (y) · pk (x) · y dy = Cn · f (y) · y d y · pk (x)
0 0 | {z }
k=0 k=0
многочлен
по x
0, [−π, π]
при y ∈/ [x − π, x + π],
поскольку
conv supp ∆n = [−π, π]
N n
!
ˆ x+π X o
интеграл по сдвинутому периоду
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) dy = равен интегралу по периоду =
x−π k=1
| {z }
2π-периодическая функция от y
N n
!
ˆ +π X o
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) d y = (4.1.82), (4.1.81) =
−π k=1
574Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
ˆ +π N n
X o
= f (y) · C + Ak (x) · cos ky + Bk (x) · sin ky dy =
−π | {z } | {z }
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
число число число
zˆ }| { z }| { zˆ }| {
+π N n
X ˆ +π +π o
=C· f (y) d y + Ak (x) · f (y) · cos ky d y + Bk (x) · f (y) · sin ky d y
−π | {z } −π | {z } −π
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
Глава 10
СТЕПЕННЫЕ РЯДЫ И
АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Такие функции называются аналитическими (точное определение см. на с.602), и в этой главе мы
поговорим о них.
Теорема 10.1.1 (об области сходимости степенного ряда). Область сходимости D всякого сте-
пенного ряда
X∞
cn · (x − x0 )n (10.1.4)
n=0
575
576 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Тогда:
— если ряд (10.1.5) сходится в какой-то точке z = ζ, то он сходится также в любой
точке z = η по модулю меньшей ζ:
|η| < |ζ|
— если ряд (10.1.5) расходится в какой-то точке z = η, то он расходится также в любой
точке z = ζ по модулю большей η:
|η| < |ζ|.
Доказательство. 1. Докажем сначала первую часть. Здесь используется некий стандартный прием,
постоянно применяемый при изучении степенных рядов, и называемый логической цепочкой Абеля.
Он состоит в следующем.
Ряд (10.1.5) сходится в точке z = ζ
⇓
∞
X
числовой ряд cn · ζ n сходится
n=0
⇓
общий член стремится к нулю: cn · ζ n −→ 0
n→∞
⇓
∞
X
|cn · η n | − сходится, по признаку сравнения (теорема 8.2.4)
n=0
⇓
∞
X
cn · η n − сходится, по признаку абсолютной сходимости (теорема 8.2.11)
n=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 577
Доказательство теоремы 10.1.1. Заметим сразу, что нам достаточно рассмотреть ряд (10.1.5), по-
тому что ряд (10.1.4) превращается в него заменой переменной
x − x0 = z
Обозначим через D его область сходимости. Нам нужно доказать, что либо D = {0}, либо D = R,
либо существует такое число R > 0, что (−R, R) ⊆ D ⊆ [−R, R].
Ясно, что D 6= ∅, поскольку 0 ∈ D. Кроме того, из леммы Абеля 10.1.2 следуют утверждения:
и
если z ∈ R и ∃η ∈
/D: |η| < |z| то z ∈
/D (10.1.8)
Положим
R = sup{|ζ|; ζ ∈ D}
и рассмотрим несколько возможных случаев.
1. Если R = 0, то это означает, что область сходимости состоит из одной точки: D = {0}.
2. Если R = ∞, то это означает, что для всякой точки z ∈ R найдется ζ ∈ D такое, что |z| < |ζ|.
Поэтому, в силу (10.1.7), z принадлежит D. Это верно для любой z ∈ R, поэтому D = R.
3. Пусть 0 < R < ∞, тогда мы получим
– если z ∈ (−R, R), то есть |z| < R, то это означает, что найдется ζ ∈ D такое, что |z| < |ζ|,
поэтому, в силу утверждения (10.1.7), z ∈ D;
– если же z ∈ / [−R, R], то есть |z| > R, то это означает, что найдется η ∈
/ D такое, что
|z| > |η|, поэтому, в силу утверждения (10.1.8), z ∈
/ D;
Таким образом, мы получаем, что D содержит интервал (−R, R) и не содержит точек, не лежа-
щих в отрезке [−R, R]. То есть,
(−R, R) ⊆ D ⊆ [−R, R]
Это нам и нужно было доказать.
cn 1
R = lim = lim p
n→∞ cn+1 n→∞ n |c |
n
R=0
означает, что область сходимости D этого ряда имеет вид D = {x0 }, а равенство
R=∞
– что D = R.
578 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Доказательство. Достаточно рассмотреть ряды с нулевым центром, то есть рядов вида (10.1.5).
Мы докажем лишь первую формулу, сказав про вторую лишь, что она доказывается аналогично.
Пусть
cn
R = lim ,
n→∞ cn+1
cn+1 z
∀n > N >C
cn
⇓
∀n > N |cn+1 z| > C|cn |
⇓
∀n > N cn+1 z n+1 > C |cn z n |
то есть, последовательность cn+1 z n+1 должна быть неубывающей; отсюда следует, что
cn z n 6−→ 0,
n→∞
P∞
значит, ряд n=0 cn+1 z n+1 не может сходиться.
Мы доказали, что
(−R, R) ⊆ D ⊆ [−R, R]
и поэтому R действительно должен быть радиусом сходимости ряда (10.1.5).
Нам нужно только еще рассмотреть случай R = limn→∞ |c|cn+1 n|
| = ∞. Тогда мы получим для
P∞
любого z ∈ R ряд n=0 |cn · z n | снова будет сходиться по признаку Даламбера:
cn+1 · z n+1 |cn+1 | |z| |z|
D = lim = lim · |z| = = =0
n→∞ n
|cn · z | n→∞ |cn | limn→∞ |c|cn+1
n|
|
∞
P∞
поэтому ряд n=0 cn · z n тоже сходится, и таким образом, D = R.
Перейдем, наконец, к примерам.
Радиус сходимости в этом случае оказывается Радиус сходимости в этом случае оказывается
равным нулю равным бесконечности
cn n! 1 cn (n + 1)!
R = lim = lim = lim = 0 R = lim = lim = lim (n+1) = ∞
n→∞ cn+1 n→∞ (n + 1)! n→∞ n+1 n→∞ cn+1 n→∞ n! n→∞
поэтому область сходимости будет состоять из поэтому область сходимости будет совпадать со
одной точки – центра нашего ряда x0 = 0. всей прямой R.
Вывод: Область сходимости D = {0}. Вывод: Область сходимости D = R.
§ 1. Степенные ряды, аналитические последовательности и производящие функции 579
cn n+1 cn 2n+1
R = lim = lim =1 R = lim = lim =2
n→∞ cn+1 n→∞ n n→∞ cn+1 n→∞ 2n
Проверяем точки x = −3 и x = 1.
1) При x = −3 получаем ряд
X∞ X∞
Нам остается лишь проверить точки x = −1 и (−2)n
n
= (−1)n
x = 1. n=1
2 n=1
1) При x = −1 получаем ряд
расходящийся по необходимому условию сходи-
X∞ мости (теорема 8.2.9).
(−1)n
2) При x = 1 получаем ряд
n=1
n
X∞ X∞
2n
который сходится по признаку Лейбница (теоре- = 1
2n
ма 8.2.12). n=1 n=1
2) При x = 1 получаем гармонический ряд
также расходящийся по необходимому условию
∞
X ∞
X сходимости.
1n 1
= Поправленная картинка:
n=1
n n=1
n
сходится равномерно на каждом отрезке [a, b] внутри интервала сходимости (x0 − R, x0 + R).
580 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Доказательство. Поскольку [a, b] ⊆ (x0 − R, x0 + R), можно найти число C > 0 такое, что
Наш ряд сходится в точке x0 + C ∈ (x0 − R, x0 + R), и это приводит к логической цепочке Абеля
(описывавшейся при доказательстве леммы 10.1.2):
∞
X
cn · C n − сходится
n=0
cn · C n −→ 0
n→∞
последовательность cn · C n ограничена :
(x − x0 )n
||cn · (x − x0 )n ||x∈[a,b] = sup |cn · (x − x0 )n | = sup cn · C n · =
x∈[a,b] x∈[a,b] Cn
n
(x − x0 )
= |cn · C n | · sup 6 (применяем (10.1.10)) 6
x∈[a,b] Cn
!n
|x − x0 |
6M· sup 6 (применяем (10.1.9)) 6 M · λn (где λ < 1)
x∈[a,b] C
⇓
∞
X ∞
X ∞
X
||cn · (x − x0 )n ||x∈[a,b] 6 M · λn = M · λn (где λ < 1)
n=0 n=0 n=0
⇓
∞
X
||cn · (x − x0 )n ||x∈[a,b] − сходится
n=0
вспоминаем признак Вейерштрасса
⇓ равномерной сходимости (теорему 9.1.5)
∞
X
cn · (x − x0 )n − сходится равномерно на отрезке [a, b]
n=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 581
Теорема 10.1.6. Радиусы (и интервалы) сходимости рядов (10.1.11), (10.1.12) и (10.1.13) совпа-
дают, и
(i) сумма ряда (10.1.11) является гладкой функцией на интервале сходимости, и ее произ-
водную на нем можно вычислить почленным дифференцированием:
!
∂ X
∞ ∞ ∞
∂ X n
X
cn · (x − x0 ) = cn · (x − x0 )n = cn · n · (x − x0 )n−1 (10.1.14)
∂x n=0 n=0
∂x n=1
Доказательство. 1. Убедимся сначала, что радиусы сходимости рядов (10.1.11), (10.1.12) и (10.1.13)
совпадают. Заметим прежде всего, что для этого нам достаточно проверить совпадение радиусов
сходимости для рядов (10.1.11) и (10.1.12). Это будет означать, что при дифференцировании сте-
пенного ряда его радиус сходимости не меняется, значит, поскольку ряд (10.1.11) тоже получается
из ряда (10.1.13) почленным дифференцированием, их радиусы сходимости тоже будут совпадать.
Сделаем после этого замену переменной
x − x0 = z
∞
X
cn · n · z n−1 (10.1.17)
n=1
Обозначим через R1 радиус сходимости ряда (10.1.16), а через R2 – радиус сходимости ряда (10.1.17).
582 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
P∞
A) Докажем сначала, что R1 6 R2 . Это равносильно тому, что если
P∞ ряд n=0n−1 cn · ζ n сходится
при каком-нибудь ζ, то при любом z : 0 < |z| < |ζ| сходится ряд n=1 cn · n · z . Применяем
логическую цепочку Абеля:
X∞
cn · ζ n − сходится
n=0
⇓
cn · ζ n −→ 0
n→∞
⇓
∃M > 0 ∀n |cn · ζ n | 6 M
⇓
для всякого z : 0 < |z| < |ζ|
n n
n zn n z n z
|cn · n · z n−1 | = cn · ζ n · · = |cn · ζ n | · · 6M· ·
z ζn |z| ζ |z| ζ
⇓
∞
X ∞
X n X∞ n
n z n z
|cn · n · z n−1 | 6 M· · =M· ·
n=1 n=1
|z| ζ n=1
|z| ζ
z
− сходится по признаку Даламбера, поскольку <1
ζ
⇓
∞
X
|cn · n · z n−1 | − сходится по признаку сравнения
n=1
⇓
∞
X
cn · n · z n−1 − сходится по признаку абсолютной сходимости
n=1
P∞
B) Теперь докажем, что R2 6 R1 . Это равносильно тому, чтоPесли ряд n=1 cn · n · ζ n−1 сходится
∞
при каком-нибудь ζ, то при любом z : 0 < |z| < |ζ| сходится ряд n=0 cn ·z n . Применяем логическую
цепочку Абеля:
X∞
cn · n · ζ n−1 − сходится
n=1
⇓
n−1
cn · n · ζ −→ 0
n→∞
⇓
∃M > 0 ∀n |cn · n · ζ n−1 | 6 M
⇓
для всякого z : 0 < |z| < |ζ|
n n
ζ zn |ζ| z |ζ| z
|cn · z n | = cn · n · ζ n−1 · · = |cn · n · ζ n−1 | · · 6M· ·
n ζn n ζ n ζ
⇓
∞
X ∞
X n X∞ n
n |ζ| z |ζ| z
|cn · z | 6 M· · =M· ·
n=0 n=0
n ζ n=0
n ζ
z
− сходится по признаку Даламбера, поскольку <1
ζ
⇓
§ 1. Степенные ряды, аналитические последовательности и производящие функции 583
∞
X
|cn · z n | − сходится по признаку сравнения
n=0
⇓
∞
X
cn · z n − сходится по признаку абсолютной сходимости
n=0
сходится в точке x0 , потому что все его члены, кроме нулевого равны нулю в этой точке:
∞
X
cn · n · (x − x0 )n = c0 · 1 + c1 · 0 + c2 · 0 + ...
x=x0
n=0
По свойству 40 на с.543, это означает, что сумма ряда (10.1.11) будет дифференцируема на [a, b], и
ее производную в каждой точке x ∈ [a, b] можно вычислить почленным дифференцированием:
!
∂ X
∞ ∞ ∞
∂ X n
X
cn · (x − x0 ) = cn · (x − x0 )n = cn · n · (x − x0 )n−1 , x ∈ [a, b]
∂x n=0 n=0
∂x n=1
То есть тождество (10.1.14) выполняется для x ∈ [a, b]. Поскольку числа a, b здесь выбирались
произвольными, удовлетворяющими условию x0 − R < a < x0 < b < x0 + R, мы получаем, что это
тождество выполняется при любом x ∈ (x0 − R, x0 + R).
3. Теперь докажем (10.1.15). Зафиксируем x из интервала сходимости (общего для рядов (10.1.11)
и (10.1.13)). По теореме 10.1.4, мы получим, что ряд
∞
X
cn · n · (t − x0 )n
n=0
сходится равномерно на отрезке [x0 , x]. Поэтому, по свойству 30 на с.543, должно выполняться
равенство
∞
xX ∞ ˆ
X x X∞
cn
ˆ
cn · (t − x0 )n d t = cn · (t − x0 )n d t = · (x − x0 )n+1
x0 n=0 n=0 x0 n=0
n + 1
Вычисление суммы степенного ряда. Тео- Точно так же, дифференцируя k раз, по индук-
рема 10.1.6 позволяет в некоторых случаях явно ции получаем:
вычислить сумму степенного ряда. Здесь мы по- ∞
кажем на примерах, как это делается. X n! k!
· xn−k = , |x| < 1
Все начинается с формулы для суммы чле- (n − k)! (1 − x)k+1
n=k
нов бесконечной геометрической прогрессии, ко-
(10.1.23)
торую мы выписывали в примере 8.2.1:
Далее, заменив в (10.1.20) x на x2 , мы полу-
X∞ чим
n 1
x = , |x| < 1 (10.1.19) X∞
1−x 1
n=0 (−1)n · x2n = , |x| < 1 (10.1.24)
n=0
1 + x2
Из нее выводится целый ряд других полезных
формул для сумм степенных рядов. Прежде все- Интегрируя (10.1.24) по теореме 10.1.6 (при |x| <
го, заменой x на −x мы получаем тождество 1) мы получаем:
∞
X ∞ ˆ x
X
∞
X 1 x2n+1
n n
(−1) · x = , |x| < 1 (10.1.20) (−1)n · = (−1)n · t2n d t =
1 + x n=0
2n + 1 n=0 0
n=0 ˆ x
dt
= = arctg x
Интегрируя его при |x| < 1 мы получаем 0 1 + t2
То есть
∞
X X∞
n−1 xn xn+1
(−1) · = (−1)n · = ∞
X x2n+1
n=1
n n=0
n+1 (−1)n · = arctg x, |x| < 1
∞ ˆ x
2n + 1
X ˆ x
dt n=0
= (−1)n · tn d t = ln(1 + x) = (10.1.25)
n=0 0 0 1 +t
Полученных формул уже достаточно, чтобы
перейти к решению задач.
То есть,
⋄ 10.1.6. Предположим, нам нужно найти сум-
∞
X xn му степенного ряда
(−1)n−1 · = ln(1 + x), |x| < 1 ∞
n=1
n X xn
(10.1.26)
(10.1.21) n=1
n
Наоборот, дифференцируя (10.1.19) при |x| <
1, получаем: Рецепт решения заключается в том, чтобы сооб-
разить, как этот ряд можно получить из фор-
X∞ мул (10.1.19)-(10.1.25) с помощью операций диф-
1
n · xn−1 = , |x| < 1 (10.1.22) ференцирования, интегрирования, замены пере-
n=1
(1 − x)2 менной и умножения на xk . Для данного ряда
§ 1. Степенные ряды, аналитические последовательности и производящие функции 585
an = n! 1
an =
n!
не будет аналитической, потому что в силу при-
мера 10.1.1, порождаемый ею ряд будет аналитической, потому что, как мы убеди-
лись в примере 10.1.2, порождаемый ею ряд
∞
X
n! · xn X∞
xn
n=1
n=1
n!
имеет нулевой радиус сходимости. К такому
же выводу можно прийти, используя критерий имеет радиус сходимости R = ∞ (для нас глав-
(10.1.28). ное, что R 6= 0). Критерий (10.1.28) дает то же
самое.
(−a)n := −an
|an | 6 An , |bn | 6 B n (n ∈ Z+ )
0n := 0
(a + b) ∗ c = a ∗ c + b ∗ c (10.1.32)
∞ N X
n N
! N
! ∞
! ∞
!
X X X X X X
wn = lim uk · vn−k = lim uk · lim vl = uk · vl (10.1.35)
N →∞ N →∞ N →∞
n=0 n=0 k=0 k=0 l=0 k=0 l=0
N
X N X
X n N X
X n X X
|wn | 6 uk · vn−k 6 |uk | · |vn−k | = |uk | · |vl | 6 |uk | · |vl | =
n=0 n=0 k=0 n=0 k=0 k+l6N max{k,l}6N
| {z }
k+l6N =⇒ max{k,l}6N
588 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
N X
N N
! N
! ∞
! ∞
!
X X X X X
= |uk | · |vl | = |uk | · |vl | 6 |uk | · |vl | <∞
k=0 l=0 k=0 l=0 k=0 l=0
P∞
Отсюда следует, что ряд n=0 wn абсолютно сходится. С другой стороны, снова для любого N ∈ N
имеем:
2N N
! N
! 2N X
n N X
N
X X X X X
wn − uk · vl = uk · vn−k − uk · vl =
n=0 k=0 l=0 n=0 k=0 k=0 l=0
X X X X
= uk · vl − uk · vl = uk · vl 6 |uk | · |vl | 6
k+l62N max{k,l}6N k + l 6 2N k + l 6 2N
| {z } max{k, l} > N max{k, l} > N
k+l62N ⇐= max{k,l}6N
X X X X
6 |uk | · |vl | = |uk | · |vl | = |uk | · |vl | + |uk | · |vl | =
max{k, l} 6 2N N <max{k,l}62N 06k6N N < k 6 2N
max{k, l} > N N < l 6 2N 0 6 l 6 2N
X X X X
= |uk | · |vl | + |uk | · |vl | =
06k6N N <l62N N <k62N 06l6N
∞
! ! ! ∞
!
X X X X
= |uk | · |vl | + |uk | · |vl | −→ 0
N →∞
k=0 l>N k>N l=0
| {z } | {z } | {z } | {z }
↓ ↓
<
<
∞ 0, 0, ∞
при N → ∞ при N → ∞
И поэтому
∞ 2N
" N
! N
!# ∞
! ∞
!
X X X X X X
wn = lim wn = lim uk · vl = uk · vl
N →∞ N →∞
n=0 n=0 k=0 l=0 k=0 l=0
Ассоциативность свертки:
n n k
!
X X X X
((a ∗ b) ∗ c)n = (a ∗ b)k · cn−k = ai · bk−i · cn−k = ai · bk−i · cn−k =
k=0 k=0 i=0 06k6n
06i6k
n n
!
X X X k − i = j, k =i+j
= ai · bk−i · cn−k = ai · bk−i · cn−k = =
i6k6n ⇔ 06j 6n−i
06i6n i=0 k=i
i6k6n
n
X Xn−i n
X
= ai · bj · cn−i−j = ai · (b ∗ c)n−i = (a ∗ (b ∗ c))n
i=0 j=0 i=0
(
1, k=n
0, k 6= n
§ 1. Степенные ряды, аналитические последовательности и производящие функции 589
Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.
5. Если |x| < min{ρ(a), ρ(b)}, то
n
!
X X X
n
Gena∗b (x) = lim (a ∗ b)n · x = lim ak · bn−k · xn =
N →∞ N →∞
n6N n6N k=0
n ∞
! ∞
!
X X X X
k n−k k l
= lim ak · x · bn−k · x = (10.1.35) = ak · x · bl · x = Gena (x) · Genb (x)
N →∞
n6N k=0 k=0 l=0
Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.
ω(a) = min{n ∈ Z+ : an 6= 0}
⇓
∃k ∈ {0, ..., n} ak · bn−k 6= 0
⇓
(
ak 6= 0
∃k ∈ {0, ..., n}
bn−k 6= 0
⇓
(
k > ω(a)
∃k ∈ {0, ..., n}
n − k > ω(b)
⇓
(
k > ω(a)
∃k ∈ {0, ..., n}
n > ω(b) + k > ω(b) + ω(a)
⇓
n > ω(b) + ω(a)
Из нее получаем:
ω(a ∗ b) = min n ∈ Z+ : (a ∗ b)n 6= 0 > ω(b) + ω(a)
590 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
a6b ⇐⇒ ∀n ∈ Z+ an 6 b n
А равенство (10.1.42) доказывается двукратным применением логической цепочки Абеля (см. с.576).
С одной стороны,
0 < r < ρ(a)
⇓
∞
X
числовой ряд an · rn сходится
n=0
⇓
общий член стремится к нулю: an · rn −→ 0
n→∞
⇓
§ 1. Степенные ряды, аналитические последовательности и производящие функции 591
⇓
σ n σ n σ
∀σ ∈ (0, r) =⇒ |an | · σ n = |an · rn | · 6M· <1
r r r
⇓
∞
X
для всякого σ ∈ (0, r) числовой ряд |an | · σ n сходится
n=0
⇓
∞
X
радиус сходимости ряда |an | · xn не меньше r
n=0
⇓
∞
X
числовой ряд |an | · rn сходится
n=0
⇓
σ n σ n σ
∀σ ∈ (0, r) =⇒ |an · σ n | = |an · rn | · 6M· <1
r r r
⇓
∞
X
для всякого σ ∈ (0, r) числовой ряд an · σ n сходится
n=0
⇓
∞
X
радиус сходимости ряда an · xn не меньше r
n=0
Свойства степени:
1◦ . Модуль степени не превосходит степени модуля:
ω(bk ) > k, k ∈ Z+ .
То есть
∀n < k (bk )n = 0
и это можно интерпретировать так, что при фиксированном номере n ∈ Z почти все числа
(bk )n ; k ∈ Z+ равны нулю:
Отсюда
P∞ следует, что для любой последовательности a ∈ A и любого n ∈ Z+ в ряде
k
k=0 ak · (b )n только первые n элементов (с индексами k = 1, ..., n) могут быть отличны
от нуля, поэтому он сходится. Его сумма обозначается (a ◦ b)n :
∞
X n
X
(a ◦ b)n = ak · (bk )n = ak · (bk )n (10.1.48)
k=0 k=0
Доказательство. Пусть a, b ∈ A и ω(b) > 1. Выберем ε ∈ (0, ρ(|a|)), то есть ε > 0 такое, что
∞
X
Gen|a| (ε) = |an | · εm < ∞
n=0
Условие ω(b) > 1 означает, что b0 = 0, поэтому производящая функция последовательности |b| имеет
вид
∞
X ∞
X
m
Gen|b| (x) = |bm | · x = |bm | · xm
m=0 m=1
Теперь получаем:
∀k ∈ Z+ |bk | 6 |b|k (10.1.44)
⇓ (10.1.37)
k
∀k ∈ Z+ Gen|bk | (δ) 6 Gen|b| (δ) < εk
∀K, N ∈ Z+ , K>N =⇒
N
X N
X K
X N X
X K K X
X N
|(a ◦ b)n | · δ n = ak · (bk )n · δ n 6 |ak | · |(bk )n | · δ n = |ak | · |(bk )n | · δ n =
n=0 n=0 k=0 n=0 k=0 k=0 n=0
K
X N
X K
X ∞
X K
X K
X ∞
X
= |ak | · |(bk )n | · δ n 6 |ak | · |(bk )n | · δ n = |ak | · Gen|bk |(δ) < |ak | · εk 6 |ak | · εk =
k=0 n=0 k=0 n=0 k=0 k=0 k=0
| {z }
Gen|bk |(δ)
⇓
∞
X
Gen|a◦b| (δ) = |(a ◦ b)n | · δ n 6 Gen|a| (ε) < ∞
n=0
Свойства композиции:
(a + b) ◦ c = a ◦ c + b ◦ c (10.1.52)
n
X n
X
k
|a ◦ b|n = (10.1.38) = |(a ◦ b)n | = (10.1.48) = ak · (b )n 6 |ak | · |(bk )n | = (10.1.38) =
k=0 k=0
n
X n
X
= |a|k · |bk |n 6 (10.1.44) 6 |a|k · (|b|k )n = (10.1.48) = (|a| ◦ |b|)n
k=0 k=0
Свойство 2◦ :
n
X n
X
((a + b) ◦ c)n = (10.1.48) = (a + b)k · (ck )n = (ak + bk ) · (ck )n =
k=0 k=0
n
X n
X
= ak · (ck )n + bk · (ck )n = (10.1.48) = (a ◦ c)n + (b ◦ c)n = (a ◦ c + b ◦ c)n
k=0 k=0
∞
X ∞ X
X ∞ ∞ X
X K
Gena◦b (x) = (a ◦ b)n · xn = ak · (bk )n · xn = (10.1.54) = ak · (bk )n · xn =
n=0 n=0 k=0 n=0 k=0
K
X ∞
X K
X K
X k
= ak · (bk )n · xn = ak · Genbk (x) = (10.1.45) = ak · Genb (x) =
k=0 n=0 k=0 k=0
| {z }
Genbk (x)
∞
X k
= ak · Genb (x) = Gena Genb (x)
k=0
После этого рассматривается общий случай. Для любой последовательности a ∈ A и для всякого
N ∈ Z+ обозначим через PN a последовательность, определенную формулой
(
ak , k 6 K
(PK a)k =
0, k>K
Зафиксируем ε > 0 такое, что Gen|a| (ε) < ∞, и подберем δ > 0 такое, что | Gen|b| (δ)| < ε. Покажем,
что при x ∈ (−δ, δ) и K → ∞ равенство (10.1.55) превращается в (10.1.53):
GenPK a◦b (x) = GenPK a Genb (x) , x ∈ (−δ, δ) (10.1.56)
| {z } | {z }
(K → ∞) ↓
↓ (K → ∞)
Gena◦b (x)
Gena◦b (x)
⇓
GenPK a Genb (x) −→ Gena Genb (x) , x ∈ (−δ, δ)
K→∞
§ 2. Ряд Тейлора и аналитические функции 595
Докажем левый предельный переход. Для этого заметим прежде всего, что
(
0, k6K
ak − (PK a)k = (10.1.57)
ak , k > K
|Gena◦b (x) − GenPK a◦b (x)| = (10.1.33) = |Gena◦b−PK a◦b (x)| = (10.1.52) = Gen(a−PK a)◦b (x) 6 (10.1.43) 6
∞
X ∞ X
X ∞
n
6 Gen|(a−PK a)◦b| (|x|) 6 Gen|a−PK a|◦|b| (|x|) = (|a−PK a|◦|b|)n ·|x| = |a−PK a|k ·(|b|k )n ·|x|n =
n=0 n=0 k=0
∞ X
X ∞ ∞
X ∞
X
= |ak − (PK a)k | · (|b|k )n · |x|n = (10.1.57) = |ak | · (|b|k )n · |x|n =
n=0 k=0 n=0 k=K+1
∞
X ∞
X ∞
X ∞
X k
= |ak | · (|b|k )n · |x|n = |ak | · Gen|b|k (|x|) 6 |ak | · Gen|b| (|x|) 6
k=K+1 n=0 k=K+1 k=K+1
∞
X k ∞
X
6 |ak | · Gen|b| (δ) 6 |ak | · εk −→ 0,
K→∞
k=K+1 k=K+1
P∞
потому что k=0 |ak | · εk = Gen|a| (ε) < ∞. Отсюда уже следует нужное нам соотношение
f0 = f,
! 10.2.1. Формулы (10.2.58) и (10.2.59) можно объединить в одну, усложнив формулировку тео-
ремы следующим образом:
пусть x0 и xобозначают концы отрезка [a, b], причем возможны оба
x0 = a x=a
варианта, как , так и ; тогда найдется точка ξ ∈ (a; b) такая, что
x=b x0 = b
n
X f (k) (x0 ) g(x) − g(x0 ) (n+1)
f (x) = · (x − x0 )k + ·f (ξ) · (x − ξ)n (10.2.60)
k! g ′ (ξ) · n!
k=0
x0 = a x=a
В такой формулировке случай превращает формулу (10.2.60) в (10.2.58), а при
x=b x0 = b
формула (10.2.60) превращается в (10.2.59).
Применим к паре функций F и g теорему Коши об отношении приращений 5.1.8: должна существо-
вать точка ζ ∈ (a; b) такая, что
F (b) − F (a) F ′ (ζ)
= ′
g(b) − g(a) g (ζ)
Или, иначе
g(b) − g(a)
F (b) − F (a) = · F ′ (ζ) (10.2.61)
g ′ (ζ)
Выразим в этой формуле F через f . Во-первых,
n
X n
X
f (k) (b) f (k) (b) f (0) (b)
F (b) = f (b) − · (b − b)k = f (b) − 0k = f (b) −
· |{z} =0
k! k! 0! }
| {z
k=0 k=0 k
(
0, при k > 0 k
f (b)
0, при k = 0
Во-вторых,
n
X f (k) (a)
F (a) = f (a) − · (b − a)k
k!
k=0
И, в-третьих,
n
! n
!
∂ X f (k) (t) ∂ X f (k) (t)
′ k k
F (t) = f (b) − · (b − t) = f (b) − f (t) − · (b − t) =
∂t k! ∂t k!
k=0 k=1
X n
∂ f (k) (t)
′ k
= 0 − f (t) − · (b − t) =
∂t k!
k=1
Xn
∂ f (k) (t) f (k) (t) ∂
= −f ′ (t) − · (b − t)k + · (b − t)k =
∂t k! k! ∂t
k=1
Xn (k+1)
f (t) f (k) (t)
= −f ′ (t) − · (b − t)k + · k · (b − t)k−1 · (−1) =
k! k!
k=1
n
X X n
f (k+1) (t) f (k) (t)
= − f ′ (t) − · (b − t)k + · (b − t)k−1 =
| {z } k! (k − 1)!
k=1 k=1
k | {z }
f (1) (t) заменяем k − 1 на i
0! · (b − t)0
| {z }
объединяем в одну сумму
n
X n−1
X
f (k+1) (t) f (i+1) (t)
=− · (b − t)k + · (b − t)i =
k! i=0
i!
k=0
| {z }
отщепляем последнее слагаемое
§ 2. Ряд Тейлора и аналитические функции 597
n−1
X f (k+1) (t) n−1
X f (i+1) (t)
f (n+1) (t) f (n+1) (t)
=− · (b − t)n − · (b − t)k + · (b − t)i = − · (b − t)n
n! k! i=0
i! n!
k=0
| {z }
сокращаем
f (n+1) (ζ)
F ′ (ζ) = − · (b − ζ)n
n!
Теперь подставим полученные выражения в (10.2.61):
n
!
X f (k) (a) g(b) − g(a) f (n+1) (ζ)
k n
0 − f (a) − · (b − a) = · − · (b − ζ)
k! g ′ (ζ) n!
k=0
Тогда
n
X f (k) (b)
F (b) = f (a) − · (a − b)k
k!
k=0
n
X f (k) (a)
F (a) = f (a) − · (a − a)k = 0
k!
k=0
f (n+1) (t)
F ′ (t) = − · (a − t)n
n!
И при подстановке в (10.2.61) получается равенство, эквивалентное (10.2.59):
Xn
f (k) (b) g(b) − g(a) f (n+1) (ζ)
f (a) − · (a − b)k − 0 = · − · (a − ζ)n
k! g ′ (ζ) n!
k=0
n
X f (k) (x0 ) f (n+1) (ξ) (10.2.62)
f (x) = · (x − x0 )k + · (x − x0 )n+1
k! (n + 1)!
k=0
g(t) = (x − t)n+1
598 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
n
X f (k) (x0 ) f (n+1) (ξ) (10.2.63)
f (x) = · (x − x0 )k + · (x − ξ)n · (x − x0 )
k! n!
k=0
Доказательство. Это следует из теоремы 10.2.1, если в ней выбрать в качестве g функцию
g(t) = x − t
X∞
f (n) (x0 )
· (x − x0 )n (10.2.68)
n=0
n!
X∞
f (n) (0) n
·x (10.2.69)
n=0
n!
§ 2. Ряд Тейлора и аналитические функции 599
От ряда Тейлора естественно ожидать, что он будет сходиться к порождающей его функции
f хотя бы в некоторой окрестности (x0 − δ; x0 + δ) точки x0 , то есть что выполняется следующее
тождество, называемое разложением Тейлора функции f в окрестности (x0 − δ; x0 + δ):
X∞
f (n) (0)
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (10.2.70)
n=0
n!
В частном случае, когда x0 = 0, оно называется разложением Маклорена (в окрестности (−δ; δ)):
X∞
f (n) (0) n
f (x) = ·x , x ∈ (−δ; δ) (10.2.71)
n=0
n!
Часто так и бывает (мы приведем примеры такого рода на с.600). Но не всегда. В следующих
примерах мы увидим, что ряд Тейлора функции f необязательно сходится, а если сходится, то его
сумма необязательно совпадает с функцией f .
Всякий сходящийся степенной ряд есть ряд Тейлора своей суммы. Несмотря на отме-
ченное нами нерегулярное поведение ряда Тейлора, эта конструкция оказывается центральным
примером в теории степенных рядов из-за следующей теоремы:
Теорема 10.2.5. Если функция f является суммой какого-то степенного ряда в некоторой окрест-
ности его центра
∞
X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ, x0 + δ), (10.2.72)
n=0
f (n) (x0 )
cn =
n!
Доказательство. В силу следствия 10.1.7, функция f является гладкой на интервале (x0 −δ, x0 +δ),
и по формуле (10.1.18),
600 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
∞
X n!
f (k) (x) = · cn · (x − x0 )n−k =
(n − k)!
n=k
k! (k + 1)! (k + 2)!
= · ck · (x − x0 )0 + · ck+1 · (x − x0 )1 + · ck+2 · (x − x0 )2 + ... =
(k − k)! (k + 1 − k)! (k + 2 − k)!
(k + 1)! (k + 2)!
= k! · ck + · ck+1 · (x − x0 ) + · ck+2 · (x − x0 )2 + ..., x ∈ (x0 − R, x0 + R)
1! 2!
Подставив сюда x = x0 , получим
(k + 1)! (k + 2)!
f (k) (x0 ) = k! · ck + · ck+1 · 0 + · ck+2 · 0 + ... = k! · ck
1! 2!
f (k) (x0 )
То есть, ck = k!
P
! 10.2.4. Из этой теоремы следует, что если степенной ряд ∞ n
n=0 cn · (x − x0 ) сходится хотя бы в
одной точке x, отличной от его центра x0 , то автоматически
P∞ он является рядом Тейлора для неко-
торой функции f , а именно, для своей суммы f (x) = n=0 cn · (x − x0 )n (которая будет определена
как минимум в окрестности точки x0 радиуса δ = |x − x0 |).
Сходимость ряда Тейлора. Обсудим теперь, когда все-таки ряд Тейлора сходится к порожда-
ющей его функции. Удобное достаточное условие для этого выглядит так:
Предложение 10.2.6. Пусть функция f определена в δ-окрестности некоторой точки x0 , бес-
конечно гладкая на (x0 − δ; x0 + δ), и имеет ограниченные в совокупности производные:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n (10.2.74)
n=0
n!
Из него мы получаем:
n
X f (k) (x0 ) f (n+1) (ξ)
f (x) − · (x − x0 )k = · (x − x0 )n+1
k! (n + 1)!
k=0
⇓
n
X f (k) (x0 ) f (n+1) (ξ) δn
f (x) − · (x − x0 )k = · (x − x0 )n+1 6 M · −→ 0
k! (n + 1)! (n + 1)! n→∞
k=0
⇓
n
X f (k) (x0 )
· (x − x0 )k −→ f (x)
k! n→∞
k=0
1
⋄⋄ 10.2.5. Следующие разложения Маклорена = 1 + x + x2 + ... + xk + ... =
1−x
§ 2. Ряд Тейлора и аналитические функции 601
∞
X
= xn , (10.2.75)
|1 + ξ|α−1 6 max (1 − |x|)α−1 ; (1 + |x|)α−1
n=0
(10.2.82)
1
= 1 − x + x2 + ... + (−1)k · xk + ... = И, во-вторых,
1+x
∞
X |x − ξ| |x| − |ξ| 1 − |ξ| − (1 − |x|)
= (−1)n · xn (10.2.76) 6 = =
n=0 |1 + ξ| 1 − |ξ| 1 − |ξ|
x2 x3 xk 1 − |x| 1 − |x|
ln(1 + x) = x − + + ... + (−1)k · + ... = =1− 61− = |x| (10.2.83)
2 3 k 1 − |ξ| 1−0
X∞
xn
= (−1)n−1 · (10.2.77) Теперь остаток ряда Маклорена можно оценить
n=1
n так:
1
= 1 − x2 + x4 + ... + (−1)k · x2k + ... = n
X f (k) (0)
1 + x2 f (x) − · xk = (10.2.81) =
X∞ k!
k=0
= (−1)n · x2n (10.2.78)
f (n+1) (ξ)
n=0
= · (x − ξ)n · x =
x3 x5 x2k+1 n!
arctg x = x − + − ... + (−1)k · +
3 5 2k + 1 α(α − 1)...(α − n) · (1 + ξ)α−n−1
∞
= ·
X x2n+1 n!
+ ... = (−1)n · (10.2.79)
2n + 1 · |x − ξ|n · |x| =
n=0 α α
x2 = α 1− ... 1 − ·
(1 + x)α = 1 + α · x + α(α − 1) · + ... 2 n
2!
· |1 + ξ|α−n−1 · |x − ξ|n · |x| =
xk
... + α(α − 1)...(α − k + 1) · + ... = α α
k! = α 1− ... 1 − ·
∞ 2
nn
X xn
=1+ α(α − 1)...(α − n + 1) · |x − ξ|
n! · |1 + ξ|α−1 · · |x| 6
n=1 |1 + ξ|
(10.2.80) 6 (10.2.82), (10.2.83) 6
α α
Доказательство. Тождества (10.2.75)-(10.2.79) 6 α 1− ... 1 − ·
2 n
мы уже доказали на с.584, поэтому их доказы-
вать нет необходимости, нужно только заметить, · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1
что в силу теоремы 10.2.5 они будут разложени-
Обозначим последнюю величину Mn
ями Маклорена (поскольку центром ряда здесь
будет точка 0). α α
Таким образом, интерес в этом списке пред- Mn = α 1 − ... 1 − ·
2 n
ставляет лишь формула (10.2.80). Для ее доказа- · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1 .
тельства заметим, что функция f (x) = (1 + x)α
имеет производные Нам нужно показать, что Mn стремится к нулю
при n → ∞. Зафиксируем какое-нибудь число q
f (n) (x) = α(α − 1)...(α − n + 1) · (1 + x)α−n такое, что
|x| < q < 1
Применим к этой функции теорему Тейлора-
Коши 10.2.3: для любого x ∈ (−1, 1) и любого (такое q найдется, поскольку |x| < 1). Теперь мы
n ∈ N найдется точка ξ, лежащая между 0 и x получаем:
такая, что α
1− −→ 1
n + 1 n→∞
X n
f (k) (0) k ⇓
f (x) = ·x +
k! Mn+1 α
k=0
= 1− · |x| −→ |x| < q
f (n+1) (ξ) n
M n n + 1 n→∞
+ · (x − ξ) · x (10.2.81)
n! ⇓
Заметим две вещи: во-первых, Mn+1
∃N ∈ N ∀n > N <q
Mn
1 − |x| 6 1 − |ξ| 6 |1 + ξ| 6 1 + |ξ| 6 1 + |x|
⇓
⇓ ∀k ∈ Z+ MN +k < MN · q k
602 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
x3 x5 x2k+1
sin x = x − + − ... + (−1)n · + ... = В силу предложения 10.2.6, это означает, функ-
3! 5! (2k + 1)! цию sin можно представить сходящимся на ин-
X∞ 2n+1
x тервале (−R, R) рядом (10.2.85). Поскольку это
= (−1)n · (10.2.85) верно для любого R > 0, мы получаем, что фор-
n=0
(2n + 1)!
мула (10.2.85) верна при любом x ∈ R.
x2 x4 k x2k 3. Производные функции cos
cos x = 1 − + − ... + (−1) · + ... =
2! 4! (2k)!
X∞
x2n
cos x, n = 4k, k ∈ Z+
= (−1)n · (10.2.86)
− sin x, n = 4k + 1, k ∈ Z
n=0
(2n)! cos(n) x =
+
− cos x, n = 4k + 2, k ∈ Z+
Доказательство. 1. Из формулы для производ- sin x, n = 4k + 3, k ∈ Z+
ных функции ex
∂n x ограничены в совокупности на R. Поэтому функ-
e = ex ция cos удовлетворяет условию (10.2.73) на лю-
(∂x)n
бом интервале (−R, R), R > 0:
видно, что она удовлетворяет условию (10.2.73)
на любом интервале (−R, R), R > 0: sup sup | sin(n) (x)| 6 1 < ∞
n∈Z+ x∈(−R,R)
sup sup |f (n) (x)| = В силу предложения 10.2.6, cos можно предста-
n∈Z+ x∈(−R,R)
вить сходящимся на интервале (−R, R) рядом
= sup sup |ex | = eR < ∞ (10.2.86). Поскольку это верно для любого R > 0,
n∈Z+ x∈(−R,R)
равенство (10.2.86) будет выполняться для любо-
В силу предложения 10.2.6, это означает, что го x ∈ R.
функцию f (x) = ex представить сходящимся на
Аналитические функции.
• Функция f называется аналитической на интервале (a, b), если она определена на (a, b)
и удовлетворяет следующим равносильным условиям:
(i) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f представима в виде суммы степенного ряда:
∞
X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (10.2.87)
n=0
§ 2. Ряд Тейлора и аналитические функции 603
(ii) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f (является гладкой и) представима в виде суммы своего ряда Тейлора:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (10.2.89)
n=0
n!
f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ (x0 − δ; x0 + δ) (10.2.90)
n!
Доказательство. Равносильность условий (i) и (ii) следует из теоремы 10.2.5.
Теорема 10.2.7. Сумма всякого степенного ряда
∞
X
f (x) = cn · (x − x0 )n , x ∈ (x0 − R; x0 + R)
n=0
⇓
последовательность cn · rn ограничена: ∃M > 0 ∀n ∈ Z+ |cn · rn | = |cn | · rn 6 M
M
∃M > 0 ∀n ∈ Z+ |cn | 6 (10.2.91)
rn
Выберем δ < min{ρ − |x1 |; r − ρ}. Тогда для любой точки ξ ∈ (x1 − δ; x1 + δ) мы получим |ξ| < ρ,
поэтому
M
rn
6
∞ ∞
z}|{ ∞
X cn · n! X |cn | ·n! n−k
X n! M · ρn−k
(k) n−k
f (ξ) = (10.1.18) = ·ξ 6 · |ξ| 6 · =
(n − k)! (n − k)! | {z } (n − k)! rn
n=k n=k n=k
>
ρn−k
604 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
M X
∞
n! ρ n−k M · k! M · r · k!
= k
· · = (10.1.23) = k+1 =
r (n − k)! r ρ
rk · 1 − r (r − ρ)k+1
n=k
n
X f (k) (x1 ) f (n+1) (ξ)
∀x ∈ (x1 − δ; x1 + δ) f (x) − · (x − x1 )k = (10.2.62) = · (x − x1 )n+1 =
k! (n + 1)!
k=0
n+1
f (n+1) (ξ) M · r · (n + 1)! M ·r δ
= · |x − x1 |n+1 6 · δ n+1 = · −→ 0. (10.2.92)
(n + 1)! (n + 1)! · (r − ρ)n+2 r−ρ r−ρ n→∞
Выше на с.246 мы показывали, что сумма, разность, произведение, частное и композиция непре-
рывных функций снова является непрерывной функцией. Те же самые свойства для дифференци-
руемых функций доказывались нами на с.323: сумма, разность, произведение, частное и композиция
дифференцируемых функций снова является дифференцируемой функцией. Оказывается, что то
же самое верно и для аналитических функций.
G(F (x)) = g(f (x) − f (x0 ) + f (x0 )) = g(f (x)) = h(x), x∈U
ω(b) > 1.
Значит, определена композиция последовательностей a◦b, которая по теореме 10.1.11 тоже является
аналитической: a ◦ b ∈ A. А производящие функции этих последовательностей связаны формулой
(10.1.53), из которой получаем:
h(x) = (G ◦ F )(x) = G(F (x)) = Gena Genb (x − x0 ) = (10.1.53) = Gena◦b (x − x0 ), x ∈ Uδ (x0 )
Тогда
(f +g)(x) = f (x)+g(x) = Gena (x−x0 )+Genb (x−x0 ) = (10.1.33) = Gena+b (x−x0 ), x ∈ (x0 −δ, x0 +δ)
ствами: z }| {
X∞
f (n) (0) n
x = 0,
( n!
n=0
f (x) = 0, x 6 0
f (x) > 0, x > 0 не сходится к ней ни в какой окрестности нуля
(−δ, +δ), потому что при x > 0 наша функция от-
лична от нуля. Отсюда следует, что f не может
В примере 10.2.3 мы отмечали, что ряд Макло- быть аналитической в точке x = 0.
Целые функции.
• Функция f называется целой, если она определена всюду на R и удовлетворяет следующим
равносильным условиям:
(i)∗ f представима в виде суммы всюду сходящегося на R степенного ряда в нуле:
∞
X
f (x) = cn · xn , x∈R (10.2.93)
n=0
X∞
f (n) (0) n
f (x) = ·x , x∈R (10.2.97)
n=0
n!
f (n) (0)
f (x) = Genc (x), cn = , x∈R (10.2.98)
n!
(ii)∗∗ f является гладкой и всюду на R совпадает с суммой своего ряда Тейлора в
произвольной точке x0 ∈ R:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x∈R (10.2.99)
n=0
n!
f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ R. (10.2.100)
n!
Доказательство. Равносильности (i)∗ ⇔(ii)∗ и (i)∗∗ ⇔(ii)∗∗ следуют из теоремы 10.2.5. С другой
стороны, импликация (i)∗ ⇐(i)∗∗ очевидна, и поэтому остается доказать импликацию (i)∗ ⇒(ii)∗∗ .
Здесь используется тот же прием, что при доказательстве теоремы 10.2.7: поскольку параметры r
и ρ мы можем выбирать произвольными (так, чтобы выполнялась 0 < |x1 | < ρ < r), для всякой
точки x ∈ R можно найти r, ρ и δ так, чтобы x ∈ (x1 − δ, x1 + δ) и выполнялось (10.2.92).
Из теоремы 10.2.7 сразу следует
Теорема 10.2.10. Всякая целая функция является аналитической (и поэтому бесконечно глад-
кой) на R.
X∞
⋄ 10.2.8.
P∞ В примере 10.1.2 мы убедились, что (−1)n n
xn = n+1 · (x − x0 )
ряд n=1 n! сходится всюду на R. В соответ- n=0
x0
ствии с нашим определением, это означает, что
порождаемая им функция Таким образом, функция f аналитическая. Ее,
X∞ однако, нельзя считать целой хотя бы потому что
xn
f (x) = она определена не на всей прямой R. Более то-
n=1
n! го, ее нельзя продолжить до целой функции на
является целой. R, потому что по теореме 10.1.5 целая функция
должна быть непрерывна на R, а f не продол-
⋄ 10.2.9. Аналитическая, но не целая функ-
жается до непрерывной функции на R из-за со-
ция. Покажем, что функция
отношения
1 lim f (x) = ∞.
f (x) = x→0
x
является аналитической (на области своего опре- ⋄ 10.2.10. Всюду определенная аналитиче-
деления x ∈ R \ {0}). Зафиксируем точку x0 6= 0. ская, но не целая функция. Функция
Тогда при |x−x0 | < |x0 | справедливо разложение 1
в степенной ряд: f (x) =
1 + x2
1 1 1 1 является аналитический по теореме 10.2.9, как
f (x) = = = · x − x0 =
x x0 + (x − x0 ) x0 1 + отношение двух аналитических функций. Но она
x не является целой, потому что ее ряд Маклорена
| {z0 }
по модулю ∞
меньше 1 X
единицы = (10.2.76) = (−1)n · x2n
1 + x2
∞ n n=0
1 X x − x0
= (10.2.76) = · (−1)n · = сходится только при |x| < 1.
x0 n=0 x0
§ 3. Приложения степенных рядов 607
(a, b) 7→ ab ,
вводилось нами в общем случае (то есть для необязательно целых показателей b) с помощью Акси-
омы степеней B1 на с.278, зависимость которой от других аксиом мы пообещали доказать позже.
Теперь, наконец, мы можем выполнить данное тогда обещание. Собственно доказательству этой
аксиомы (на с.612), мы предпошлем 16 вспомогательных утверждений (леммы 10.3.1-10.3.16). Все
это время читателю предлагается делать вид, что до сих пор он не глядел на текст в двух колонках
и, как следствие не знает ничего об отображении (a, b) 7→ ab , по крайней мере, для случая нецелого
b (случай целых степеней можно считать известным, поскольку для него все необходимые факты
были аккуратно доказаны нами еще в главе 2 в теореме о степенном отображении 2.2.17). Только
после приведенного здесь доказательства Аксиомы степеней все сказанное нами ранее на этот счет
вступит в законную силу, и этой цели посвящен настоящий раздел.
Функция exp. 1
exp(−x) = (10.3.104)
exp x
Лемма 10.3.1. Формула
exp(x + y) = exp x · exp y, (10.3.105)
∞
X n
x
exp x = (10.3.101) Доказательство. 1. Первое равенство доказы-
n=0
n! вается простым вычислением:
X∞
определяет функцию exp всюду на прямой R. 0n 00 01 02
exp 0 = = + + +... = 1
n! 0!
|{z} 1!
|{z} 2!
|{z}
Доказательство. Радиус сходимости этого сте- n=0
1 0 0
пенного ряда равен бесконечности:
2. Докажем затем последнее равенство. По
cn (n + 1)! определению, функция exp является целой, и
R = lim = lim =
n→∞ cn+1 n→∞ n! значит (по условию (ii)∗∗ на с.606), она совпада-
= lim (n + 1) = ∞ ет с суммой своего ряда Тейлора в произвольной
n→∞ точке a ∈ R:
поэтому ряд сходится всюду на R. X∞
exp(n) a n
exp(a + y) = ·y (10.3.106)
Лемма 10.3.2. Функция exp, определенная ря- n=0
n!
дом (10.3.101), имеет производную, причем
По лемме 10.3.2, производная функции exp равна
∂ самой этой функции, поэтому вторая, третья, и
exp x = exp x (10.3.102)
∂x все остальные производные exp тоже совпадают
с exp:
Доказательство. Продифференцируем ряд
exp(n) = exp
(10.3.101) с помощью теоремы 10.1.6:
Подставив это в (10.3.106), мы получим:
X∞ n X∞ n
∂ ∂ x ∂ x ∞ ∞
exp x = = = X exp(n) a n X exp a n
∂x ∂x n=0 n! n=0
∂x n! exp(a + y) = ·y = ·y =
∞ ∞ n=0
n! n=0
n!
X xn−1 X x k
= = = exp x X∞
(n − 1)! k! 1
n=1 k=0 = exp a · · y n = exp a · exp y
n=0
n!
⇓ Функция ln.
1
exp(−x) = Лемма 10.3.7. Функция exp, определенная ря-
exp x дом (10.3.101), биективно отображает прямую
R на интервал (0; +∞)
Лемма 10.3.4. Функция exp, определенная ря- exp : R → (0; +∞) (10.3.110)
дом (10.3.101), всюду положительна, а в нуле
равна единице: и поэтому правило
exp x > 0 (10.3.107)
t = ln x ⇐⇒ exp t = x (10.3.111)
Доказательство. Предположим, что в какой-то
точке a функция exp равняется нулю: корректно определяет функцию ln, обратную к
exp:
exp a = 0. ln : (0; +∞) → R (10.3.112)
Тогда: Доказательство. 1. Прежде всего, неравенство
(10.3.107) означает, что отображение exp дей-
1 = exp 0 = exp(a − a) = (10.3.105) = ствительно переводит R в (0; +∞).
= exp a · exp(−a) = 0, 2. Далее из условия возрастания (10.3.109)
| {z }
0 следует, что отображение exp инъективно.
3. Покажем, что exp сюръективно отобра-
что, конечно, невозможно. Таким образом, exp
жает R на (0; +∞). Пусть C ∈ (0; +∞). По-
– непрерывная функция, определенная всюду на
скольку limx→−∞ exp x = 0 (первое равенство в
прямой R, нигде не обращающаяся в нуль, а в
(10.3.109)), найдется x ∈ R такое, что exp x < C.
точке 0 равная единице. Такое возможно только
С другой стороны, limx→+∞ exp x = +∞ (второе
если exp всюду положительна.
равенство в (10.3.109)), поэтому найдется y ∈ R
Лемма 10.3.5. Функция exp, определенная ря- такое, что exp y > C. Мы получаем, что
дом (10.3.101), возрастает на R:
exp x < C < exp y
x<y =⇒ exp x < exp y (10.3.108)
причем exp – непрерывная функция по теореме
Доказательство. Производная этой функции 10.1.5. Значит, по теореме Коши о среднем зна-
всюду положительна чении 3.3.6, найдется точка c ∈ R такая, что
∂ exp c = C
exp x = (10.3.102) = exp x > (10.3.107) > 0,
∂x
поэтому по теореме 5.2.7 о строгой монотонно- Мы получили, что какое ни возьми C ∈ (0; +∞),
сти, эта функция должна возрастать. для него найдется точка c ∈ R, в которой функ-
ция exp принимает значение C. Это и означа-
Лемма 10.3.6. Функция exp, определенная ря- ет сюръективность exp как отображения из R в
дом (10.3.101), имеет следующие пределы на бес- (0; +∞).
конечности: 4. Инъективность и сюръективность вместе
означают биективность exp : R → (0; +∞).
lim exp x = 0 lim exp x = +∞ (10.3.109)
x→−∞ x→+∞
Лемма 10.3.8. Функция ln, определенная пра-
Доказательство. Второй предел следует из оче- вилом (10.3.111), возрастает:
видного неравенства:
0<x<y =⇒ ln x < ln y (10.3.113)
x2
∀x > 0 exp x = 1 + x + + ... > 1 + x
2 Доказательство. Если бы оказалось, что ln x >
ln y, то, в силу возрастания exp, мы получили бы
После того, как он доказан, первый предел полу-
чается заменой переменных: ln x > ln y
y = −x ⇓
lim exp x = = lim exp(−y) =
x→−∞ y → +∞ y→+∞
exp(ln x) > exp(ln y)
1 1 | {z } | {z }
= (10.3.104) = lim = = x y
y→+∞ exp y limy→+∞ exp y
⇓
1
= =0
+∞ x>y
§ 3. Приложения степенных рядов 609
Лемма 10.3.9. Функция ln, определенная пра- Доказательство. Если a > 0, то мы получаем:
вилом (10.3.111), удовлетворяет следующему
равенству и двум тождествам: ab = (10.3.117) = exp(b · ln a) =
z }| {
1
ln 1 = 0, (10.3.114) = sgn2 b ∨ sgn a · exp(b · ln |a| )
1 | {z } |{z}
ln = − ln x (10.3.115) 1
a
x
ln(x · y) = ln x + ln y, (10.3.116) Если же a < 0, то
0 0
>
xb yb
(2.2.353)
= xb · y b
=
sgn2 (y · x)
· exp y · ln exp(x · ln |a|) =
Лемма 10.3.13. Отображение (a, b) 7→ ab , | {z }
определенное формулой (10.3.117), удовлетворя-
=
в следующих случаях:
— при a > 0 и x, y ∈ R, Лемма 10.3.14. Отображение (a, b) 7→ ab ,
— при a = 0 и x > 0, y > 0, определенное формулой (10.3.117), удовлетворя-
Z ет условию сохранения знака (2.2.279):
— при a < 0 и x, y ∈ 2N−1 .
Доказательство. 1. Пусть a > 0 и x, y ∈ R. То- a>0 ⇒ an > 0 (n ∈ Z) (10.3.124)
гда:
Доказательство.
x y x
(a ) = (10.3.117) = exp(y ·ln a ) = (10.3.117) = (10.3.117) (10.3.107)
a>0 ⇒ an = exp(b · ln a) > 0
= exp y · ln exp(x · ln a) = exp(y · x · ln a) =
| {z }
x·ln a
612 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Значит ряд
определяют функции sin и cos всюду на прямой ∞
X yn
R. (−1)n ·
n=0
(2n)!
Доказательство. 1. Первый ряд перепишем в сходится при любом y. Как следствие, при под-
виде становке y = x2 получающийся ряд
∞ ∞ ∞
X
X x2n+1 X (x2 )n (x2 )n
(−1) · n
= x· (−1)n · = (−1)n ·
(2n + 1)! (2n + 1)! n=0
(2n)!
n=0 n=0
∞
X тоже должен сходиться, независимо от того, ка-
yn
=x· (−1)n · кое значение принимает x. Мы получаем, что
n=0
(2n + 1)!
y=x2 формула (10.3.130) определяет функцию cos всю-
и вычислим радиус сходимости у последнего сте- ду на прямой R.
пенного ряда (от переменной y) по формуле Да- Лемма 10.3.18. Функции sin и cos, определен-
ламбера: ные рядами (10.3.129)-(10.3.130), удовлетворя-
ют тождествам:
cn (−1)n · (2n + 3)!
R = lim = lim =
n→∞ cn+1 n→∞ (−1)n+1 · (2n + 1)! sin(−x) = − sin x cos(−x) = cos x (10.3.131)
= lim (2n + 2)(2n + 3) = ∞ Доказательство.
n→∞
∞
X
То есть ряд (−x)2n+1
sin(−x) = (10.3.129) = (−1)n · =
∞ (2n + 1)!
X yn n=0
(−1)n · ∞
X −(x2n+1 )
n=0
(2n + 1)! = (−1)n · =
n=0
(2n + 1)!
сходится при любом y. Значит при подстановке ∞
X
y = x2 получающийся ряд x2n+1
=− (−1)n · = (10.3.129) = − sin x
n=0
(2n + 1)!
∞
X
n (x2 )n
(−1) ·
(2n + 1)! ∞
X
n=0 (−x)2n
cos(−x) = (10.3.130) = (−1)n · =
тоже сходится независимо от того, какое значе- n=0
(2n)!
ние принимает x. После умножения на x получа- ∞
X 2n
ющийся ряд x
= (−1)n · = (10.3.130) = cos x
n=0
(2n)!
∞
X
n x2n+1
(−1) ·
n=0
(2n + 1)!
Лемма 10.3.19. Функции sin и cos, определен-
тоже должен сходиться в силу свойства 1◦ на ные рядами (10.3.129)-(10.3.130), удовлетворя-
с.495, каким бы ни был x. Все это означает, что ют равенствам:
формула (10.3.129) определяет функцию sin всю-
ду на прямой R. sin 0 = 0 cos 0 = 1 (10.3.132)
2. Второй ряд можно переписать так:
Доказательство.
∞
X ∞
X
x2n (x2 )n ∞
X 02n+1
(−1)n · = (−1)n · = sin 0 = (10.3.129) = (−1)n · =
n=0
(2n)! n=0 (2n)! (2n + 1)!
n=0
∞
X ∞
nyn X
= (−1) · = (−1)n · 0 = 0
n=0
(2n)!
y=x2 n=0
614 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
∞
X 02n Доказательство. Зафиксируем какое-нибудь
cos 0 = (10.3.130) = (−1)n · =
(2n)! число a ∈ R и рассмотрим три функции:
n=0
∞
X 2n
0 02·0 F (x) = sin(x + a) − sin x · cos a − cos x · sin a
= (−1)n · = (−1)0 · +
(2n)! (2 · 0)! G(x) = cos(x + a) − cos x · cos a + sin x · sin a
n=0 | {z }
1 H(x) = F (x)2 + G(x)2
∞
X 02n
+ (−1)n · =1 Заметим две вещи: во-первых,
n=1 |
(2n)!
{z } (
0 F (0) = sin a − sin 0 · cos a − cos 0 · sin a = 0
G(0) = cos a − cos 0 · cos a + sin 0 · sin a = 0
Лемма 10.3.20. Функции sin и cos, определен- ⇓
ные рядами (10.3.129)-(10.3.130), имеют следу-
ющие производные: H(0) = F (0)2 + G(0)2 = 0
∂ ∂ И, во-вторых,
sin x = cos x cos x = − sin x (10.3.133)
∂x ∂x ′
F (x) = cos(x + a) − cos x · cos a+
Доказательство.
+ sin x · sin a = G(x)
∂ ′
G (x) = − sin(x + a) + sin x · cos a+
sin x = (10.3.129) =
∂x + cos x · sin a = −F (x)
∞
∂ X x2n+1
= (−1)n · = ⇓
∂x n=0 (2n + 1)!
∞
X ∂ x2n+1
= (−1)n · = H ′ (x) = 2 · F (x) · F ′ (x) + 2 · G(x) · G′ (x) =
n=0
∂x (2n + 1)!
∞
= 2 · F (x) · G(x) − 2 · G(x) · F (x) = 0
X (2n + 1) · x2n
n
= (−1) · = Вместе это означает, что функция H должна
n=0
(2n + 1)!
быть тождественно равна нулю, а значит F и G
∞
X x2n тоже тождественно равны нулю:
= (−1)n · = cos x
(2n)!
n=0
H(x) = F (x)2 + G(x)2 ≡ 0
∂ ⇓
cos x = (10.3.130) = (
∂x
∞ F (x) ≡ 0
∂ X x2n
= (−1)n · = G(x) ≡ 0
∂x n=0 (2n)!
∞ Заменяя a на y, мы из последних тождеств по-
X ∂ x2n
= (−1) · n
= лучаем (10.3.134)-(10.3.135).
n=0
∂x (2n)!
∞
Лемма 10.3.22. Функции sin и cos, определен-
X (2n) · x2n−1
n
= (−1) · 0 + (−1) · n
= ные рядами (10.3.129)-(10.3.130), удовлетворя-
n=1
(2n)! ют тождеству:
X∞
n x2n−1 замена:
sin2 x + cos2 x = 1 (10.3.136)
= (−1) · = k = n − 1 =
n=1
(2n − 1)! n=k+1
∞
Доказательство. Подставив y = −x в
X x2k+1 (10.3.135), мы получим:
k+1
= (−1) · =
(2k + 1)!
k=1
∞
X 1 = (10.3.132) = cos 0 = cos(x − x) =
x2k+1
=− (−1)k · = − sin x = cos x · cos(−x) − sin x · sin(−x) =
(2k + 1)!
k=1
= (10.3.131) = cos2 x + sin2 x
x ∈ [0, 2]
cos x = 1−
⇓ X∞
x4k+2 x2
x2 6 4 < (4k + 3) · (4k + 4) (k ∈ Z+ ) − · 1− 6
(4k + 2)! (4k + 3) · (4k + 4)
k=0
⇓
x2 x2
2 61− · 1−
x 2! 3·4
<1 (k ∈ Z+ )
(4k + 3) · (4k + 4)
В частности, при x = 2 получаем:
⇓
2
22 22
x cos 2 6 1 − · 1− =
1− >0 (k ∈ Z+ ) 2! 3·4
(4k + 3) · (4k + 4)
(10.3.137) 2 1 1
=1− · 1− =− <0
Отсюда следует, что при x ∈ (0, 2) в полученном 2! 3 3
ряде все слагаемые тоже положительны, и зна-
чит С другой стороны, в силу (10.3.132),
X∞
x4k+1 x2 cos 0 = 1
sin x = · 1− >0
(4k + 1)! (4k + 3) · (4k + 4)
k=0
Мы получаем, что на отрезке [0, 2] функция cos
меняет знак. Значит, по теореме Коши о проме-
жуточном значении 3.3.6, она обращается в нуль
Лемма 10.3.24. Функция cos, определенная ря- в некоторой точке a ∈ (0, 2).
дом (10.3.130), имеет на промежутке (0, 2) ров-
Остается показать, что это единственный
но один нуль:
нуль на (0, 2). Действительно, по лемме 10.3.23,
∃! a ∈ (0, 2) cos a = 0 (10.3.138) производная этой функции отрицательна на ин-
тервале (0, 2):
Доказательство. Перепишем ряд, определяю-
щий cos, иначе: ∂
cos x = − sin x < 0
∂x
X∞
x2n
cos x = (−1)n · = Значит, по теореме 5.2.7 cos монотонно убывает
n=0
(2n)! на интервале (0, 2), и поэтому не может дважды
x2 x4 x6 x8 обращаться в нуль на нем.
=1− + − + − ... =
2
2! 2 4! 6!6 8!
x x x x2 Лемма 10.3.25. Точка a ∈ (0, 2), определенная
=1− · 1− − · 1− + ... =
2! 3·4 6! 7·8 условием (10.3.138), обладает следующими свой-
X∞ ствами:
x4k+2 x2
=1− · 1−
(4k + 2)! (4k + 3) · (4k + 4)
k=0 cos a = 0 sin a = 1 (10.3.139)
В силу (10.3.137), при x ∈ [0, 2] множитель в cos 2a = −1 sin 2a = 0 (10.3.140)
скобках в последнем ряде положителен, поэтому cos 4a = 1 sin 4a = 0 (10.3.141)
616 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Доказательство. Первая строчка: x2 x5 x2
=x· 1− + · 1− + ... =
2 4! 5·6
cos a = 0
x2
=x· 1− +
⇓ 2
| {z }
<
sin2 a = 1 − cos2 a = 1 0,
при x ∈ (0, 1)
⇓ ∞
X x4k+1 x2
sin a = 1 + · 1− >0
(4k)! (4k + 1) · (4k + 2)
sin a = −1 ← невозможно, в силу леммы 10.3.23 k=1 | {z }
<
⇓ 0,
при x ∈ (0, 1)
sin a = 1
Вторая строчка: 2. Второе неравенство:
cos 2a = cos2 a − sin2 a = 0 − 1 = −1,
sin x − x · cos x =
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 X∞
x2n+1 X∞
x2n
= (−1)n · −x· (−1)n · =
Третья строчка: n=0
(2n + 1)! n=0
(2n)!
∞
X X∞
cos 4a = cos2 2a − sin2 2a = 0 − 1 = −1, x2n+1
n x2n+1
= (−1) · − (−1)n · =
n=0
(2n + 1)! n=0 (2n)!
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 ∞ 2n+1
X x x2n+1
n
= (−1) · − =
n=0
(2n + 1)! (2n)!
Лемма 10.3.26. Число 4a, где a ∈ (0, 2) опре- ∞
X x2n+1
делено условием (10.3.138), является периодом = (−1)n · · 1 − (2n + 1) =
n=0
(2n + 1)!
для функций sin и cos, определенных рядами
∞
X
(10.3.129)-(10.3.130): x2n+1
= (−1)n+1 · · 2n =
n=0
(2n + 1)!
sin(x + 4a) = sin x, cos(x + 4a) = cos x
3
x x5 x7 x9
=0+ ·2− ·4+ ·6− · 8 + ... =
Доказательство. Здесь просто применяется 3! 5! 7! 9!
(10.3.141): x3 x2 x7 x2
= · 2− + · 6− · 8 + ... =
3! 5 7! 9
sin(x + 4a) = sin x · cos
| {z4a} + cos x · sin
| {z4a} = sin x ∞
X x4k+3 x2
1 0 = · (4k + 2) − >0
(4k + 3)! 4k + 5
cos(x + 4a) = cos x · cos
k=0 | {z }
| {z4a} − sin x · sin
| {z4a} = cos x
<
1 0 0,
при x ∈ (0, 1)
x · cos x = x · (−1)n · = 0,
n=0
(2n)! при x ∈ (0, 1)
x3 x5 x7
=x− + − + ... =
2! 4! 6!
§ 3. Приложения степенных рядов 617
1
||bn ||[0,1] = −→ 0 ! 10.3.1. Как и в случае с числом Непера e, зна-
2n + 1 n→∞
чение которого, как мы помним оценивались с
То есть ряд (10.3.146) удовлетворяет условиям помощью неравенства (3.2.99), значения π так-
теоремы 9.1.6 (признак Лейбница равномерной же можно оценивать, используя теперь неравен-
сходимости), и значит, он равномерно сходится ство (10.3.145), однако эти два случая качествен-
на отрезке [0, 1]. Обозначим его сумму буквой f : но различаются тем, что нужная точность для π
∞
достигается гораздо медленнее, чем для e. На-
X x2n+1
f (x) = (−1)n · , x ∈ [0, 1] пример, для вычисления первых двух знаков по-
n=0
2n + 1 сле запятой для π нужно брать сумму 1000 сла-
618 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
1000
X
гаемых: во-первых, (−1)n · 4 4
< − <π<
4 2n + 1 2 · 1000 + 3
= 0, 0019970...
2·1000+3
n=0
⇓ 1000
X (−1)n · 4 4
4
0, 001 < 2·1000+3 < 0, 002 < − <
n=0
2n + 1 2 · 1000 + 3
⇓
4
−0, 002 < − 2·1000+3 < −0, 001 < 3, 142 + 0, 002 = 3, 144
во-вторых, ⇓
P1000 n
(−1) ·4
n=0 = 3, 14259165...
2n+1
⇓ 3, 14 < π < 3, 15 (10.3.147)
P1000 (−1)n ·4
3, 142 < n=0 2n+1 < 3, 143
⇓
и вместе это дает
∞
X ∞
X
Напомним, что числа Фибоначчи определя-
= x1 ·s2 + xk−1 · sk + xk−2 · sk =
ются рекуррентными соотношениями (3.2.38): |{z}
k=3 k=3
=
1
x1 = x2 = 1, xn+2 = xn+1 + xn , n∈N
∞
X
= s2 + (xk−1 + xk−2 ) ·sk =
Предложение 10.3.29. Числа Фибоначчи опи- | {z }
k=3
сываются явно формулой xk
∞
X
" √ !n √ !n # 2
= −s + |s +
{zs} + xk · sk =
1 1+ 5 1− 5
xn = √ − k=3
=
5 2 2
x1 · s1 + x2 · s2
(10.3.149) ∞
X
= −s + xk · sk = −s + F (s)
Доказательство. Рассмотрим производящую k=1
функцию этой последовательности: ⇓
∞
X (s + s2 ) · F (s) = −s + F (s)
F (s) = xn · sn ⇓
n=1
s = (1 − s − s2 ) · F (s)
(суммирование начинается с номера n = 1; это ⇓
можно объяснить, например, так: мы будем счи-
тать, что x0 = 0). Помножив F (s) на многочлен s
F (s) = (10.3.150)
s + s2 , мы получим цепочку: 1 − s − s2
Разложим знаменатель на множители:
∞
X 1 − s − s2 = −(s − a)(s − b)
(s + s2 ) · F (s) = (s + s2 ) · xn · sn =
n=1 где √ √
∞
X ∞
X −1 − 5 −1 + 5
= xn · sn+1 + xn · sn+2 = a= , b=
2 2
n=1 n=1 Заметим попутно, что
| {z } | {z }
замена: n + 1 = k замена: n + 2 = k √ √
∞ ∞
−1 + 5 1 + 5 √
X X b−a= + = 5 (10.3.151)
= xk−1 · sk + xk−2 · sk = 2 2
k=2 k=3
§ 3. Приложения степенных рядов 619
√
1 2 2 · (1 − 5) s 1 1 1 1
=− √ =− √ √ = = · · s − · = (10.2.75) =
a 1+ 5 (1 + 5) · (1 − 5) b−a a 1− a b 1 − as
√ √ !
1 X s n 1 X s n
∞ ∞
2 · (1 − 5) 1− 5 s
=− = (10.3.152) = · · − · =
1−5 2 b−a a n=0 a b n=0 b
∞ ∞
!
√ s X sn X sn
1 2 2 · (1 + 5) = · − =
=− √ =− √ √ = b−a an+1 n=0 bn+1
b 1− 5 (1 − 5) · (1 + 5) n=0
√ √ ∞
2 · (1 + 5) 1+ 5 1 X 1 1
=− = (10.3.153) = · − ·sn+1 = |n + 1 = k| =
1−5 2 b − a n=0 an+1 bn+1
Тогда X∞
1 1 1
= · − k · sk =
s 1 b−a ak b
F (s) = = −s · = k=1
1 − s − s2 (s − a)(s − b) = (10.3.151), (10.3.152), (10.3.153) =
| {z }
раскладываем ∞ √ !k √ !k
1 X 1− 5 k
на простейшие дроби
= √ · 1+ 5 − ·s
по правилам на с.411
! 5 2 2
1 1 k=1
a−b s
b−a 1 1
= −s· + = · − =
s−a s−b b−a s−b s−a
s 1 1 Выделяя коэффициенты перед sk , мы теперь по-
= · − = лучим (10.3.149).
b−a a−s b−s
Глава 11
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
a0 X n πnx o
∞
πnx
+ an · cos + bn · sin (11.0.1)
2 n=1
T T
a0 X n πnx o
N
πnx
SN (x) = + an · cos + bn · sin (11.0.3)
2 n=1
T T
620
§ 1. Сходимость ряда Фурье в среднем квадратичном 621
a0 X n o
N
SN (x) := + an cos nx + bn sin nx (11.1.7)
2 n=1
a0 X n o
∞
f (x) = + an cos nx + bn sin nx , (11.1.9)
2 n=1
1 π
ˆ
hf, gi = f (x) · g(x) d x (11.1.11)
π −π
Она называется скалярным произведением функций f и g. Перечислим некоторые
10 . Положительная полуопределенность:
hf, f i > 0
20 . Симметричность:
hf, gi = hg, f i
30 . Билинейность:
hα · f + β · g, hi = α · hf, hi + β · hg, hi
1
ˆ nπ o 1 π n
ˆ o
hα · f + β · g, hi = α · f (x) + β · g(x) · h(x) d x = α · f (x) · h(x) + β · g(x) · h(x) d x =
π −π π −π
1 π 1 π
ˆ ˆ
=α· f (x) · h(x) d x + β · g(x) · h(x) d x = α · hf, hi + β · hg, hi
π −π π −π
Теорема 11.1.2 (неравенство Коши-Шварца для функций). Для любых функций f, g ∈ R(π) спра-
ведливо следующее неравенство, называемое неравенством Коши-Шварца:
hf, gi 6 kf k · kgk (11.1.13)
Доказательство. Зафиксируем f и g и рассмотрим многочлен второй степени:
2 2
p(t) = hf + tg, f + tgi = hf, f i + 2thf, gi + t2 hg, gi = kf k + 2thf, gi + t2 kgk
Поскольку hf + tg, f + tgi > 0, этот многочлен должен при любом значении t быть неотрицателен:
2 2
p(t) = kf k + 2thf, gi + t2 kgk > 0, ∀t ∈ R
Значит, он не может иметь двух вещественных корней, и поэтому его дискриминант должен быть
неположительным:
D = 4hf, gi2 − 4 kf k2 · kgk2 6 0
⇓
hf, gi 6 kf k2 · kgk2
2
⇓
hf, gi 6 hf, gi 6 kf k · kgk
Доказательство.
hf, gi − hfn , gi = hf − fn , gi 6 (11.1.13) 6 kf − fn k · kgk −→ 0
n→∞
624 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
1 π
ˆ π
1
ˆ
hsinn , sinm i = sin nx · sin mx d x = (4.1.83) = {cos(n − m)x − cos(n + m)x} d x =
π −π 2π −π
sin(n − m)x x=π sin(n + m)x x=π
= − =0
2π(n − m) x=−π 2π(n + m) x=−π
А при n = m получаем
π π
1 1 2π
ˆ ˆ
hsinn , sinn i = sin nx · sin nx d x = (4.1.72) = {1 + cos 2nx} d x = =1
π −π 2π −π 2π
Лемма 11.1.5. Коэффициенты ряда Фурье произвольной функции f ∈ R(π) связаны со скалярным
произведением следующими формулами:
D E D E D E
a0 = f, 1 , an = f, cosn , bn = f, sinn (11.1.22)
a0 Xn N o
SN = ·1+ ak · cosk +bk · sink (11.1.23)
2
k=1
Доказательство. Действительно,
!
a0 Xn N o a0 D E X n
N D E D Eo
hSN , 1i = ·1+ ak cosk +bk sink , 1 = · 1, 1 + ak · cosk , 1 + bk · sink , 1 =
2 2
k=1 k=1
a0 Xn N o
= (11.1.20) = ·2+ ak · 0 + b k · 0 = a0
2
k=1
Аналогично, если n 6 N , то
!
a0 Xn N o
hSN , cosn i = ·1+ ak cosk +bk sink , cosn =
2
k=1
a0 D E X N n D E D Eo
= · 1, cosn + ak · cosk , cosn + bk · sink , cosn =
2
k=1
XN n o
a0 0, если k 6= n
= (11.1.20), (11.1.21) = ·0+ ak · + b k · 0 = an
2 1, если k = n
k=1
kf − gk
a20 X n 2 o
N
min kf − P k = kf − SN k = hf, f i − − an + b2n (11.1.25)
P 2 n=1
λ0 X n o a0 X n o
N N
P = + λn cosn +µn sinn , SN = + an cosn +bn sinn
2 n=1
2 n=1
XN n o XN n o
λ20
= hf, f i+ ·h1, 1i+ λ2n ·hcosn , cosn i+µ2n ·hsinn , sinn i −λ0 · hf, 1i −2· λn · hf, cosn i +µn · hf, sinn i =
4 n=1
| {z } n=1
| {z } | {z }
(11.1.24) k (11.1.24) k (11.1.24) k
a0 an bn
λ20 X n 2 o
N XN n o
= hf, f i + + λn + µ2n − λ0 · a0 − 2 · λn · an + µn · bn =
2 n=1 n=1
a2 X 2 X
N N a2 X N n o
λ20
= hf, f i+ − λ0 · a0 + 0 + λn − 2 · λn · an + a2n + µ2n − 2 · µn · bn + b2n − 0 − a2n +b2n =
|2 {z 2} n=1 | {z } n=1 | {z } 2 n=1
k k k
(λ0 −a0 )2 (λn − an )2 (µn − bn )2
2
a2 X n 2 o
N N N
(λ0 − a0 )2 X X
= hf, f i + + (λn − an )2 + (µn − bn )2 − 0 − an + b2n >
2 n=1 n=1
2 n=1
| {z }
достигает минимума при λn = an , µn = bn
то есть при P = SN
a20 X n 2 o
N
2 2
> hf, f i − − an + b2n = kf − P k P =SN
= kf − SN k
2 n=1
Лемма 11.1.8. Для всякой функции f ∈ R(π) и любого ε > 0 найдется тригонометрический
многочлен P , расстояние от которого до f меньше ε:
kf − P k < ε (11.1.26)
Доказательство. Обозначим
M= sup |f (x)|
x∈[−π,π]
Воспользуемся сначала теоремой 9.2.2, и подберем непрерывную функцию g на [−π, π] так, чтобы
выполнялись условия:
π
π · ε2
ˆ
|f (x) − g(x)| d x < , sup |g(x)| 6 M, g(−π) = g(π)
−π 8M x∈[−π,π]
Тогда
π π
1 1
ˆ ˆ
2
kf − gk = |f (x) − g(x)|2 d x = |f (x) − g(x)| ·|f (x) − g(x)| d x 6
π −π π −π | {z }
>
|f (x)| + |g(x)|
>
2M
π
2M 2M π · ε2 ε2
ˆ
6 |f (x) − g(x)| d x < · =
π −π π 8M 4
⇓
ε
kf − gk <
2
Далее заметим, что поскольку функция g непрерывна на [−π, π] и принимает одинаковые значения
на концах этого отрезка, ее можно продолжить до непрерывной 2π-периодической функции на всю
прямую R. Тогда воспользовавшись теоремой 9.2.12 мы сможем подобрать тригонометрический
многочлен P так, чтобы
ε
sup |g(x) − P (x)| < √
x∈[−π,π] 2 2
§ 1. Сходимость ряда Фурье в среднем квадратичном 627
>
ε2
8
⇓
ε
kg − P k <
2
Вместе получается:
ε ε
kf − P k = k(f − g) + (g − P )k 6 (11.1.16) 6 kf − gk + kg − P k < + =ε
2 2
Неравенство Бесселя.
Лемма 11.1.9. Пусть an и bn – коэффициенты Фурье (11.1.22) функции f ∈ R(π). Тогда числовой
ряд
a20 X n 2 o
∞
+ an + b2n
2 n=1
a20 X n 2 o
∞ π
1
ˆ
+ an + b2n 6 hf, f i = f (x)2 d x (11.1.27)
2 n=1
π −π
a20 X n 2 o
N
hf, SN i = hSN , SN i = + an + b2n (11.1.28)
2 n=1
a0 D E X n D E D Eo a2 X n 2 o
N N
= · f, 1 + ak · f, cosk + bk · f, sink = (11.1.22) = 0 + an + b2n
2 2 n=1
k=1
А с другой,
* N n
+
a0 X o
hSN , SN i = SN , ·1+ ak · cosk +bk · sink =
2
k=1
a0 D E XN n D E D Eo a2 X n 2 o
N
= · SN , 1 + ak · SN , cosk + bk · SN , sink = (11.1.24) = 0 + an + b2n
2 2 n=1
k=1
2. Обозначим
RN = f − SN
и заметим, что SN и RN ортогональны:
D E
SN , RN =0 (11.1.29)
Действительно,
D E D E D E D E
SN , RN = SN , f − SN = SN , f − SN , SN = (11.1.28) = 0
628 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
Действительно,
D E D E D E D E
f, f = SN + RN , SN + RN = SN + RN , SN + SN + RN , RN =
D E D E D E D E D E D E
= SN , SN + RN , SN + SN , RN + RN , RN = SN , SN + RN , RN
| {z }
k
0
в силу (11.1.29)
4. Из (11.1.30) следует:
D E D E D E D E a2 X n 2
N o
f, f = (11.1.30) = SN , SN + RN , RN > SN , SN + 0 = (11.1.28) = 0 + an + b2n
| {z } 2 n=1
свойство 10
>
то есть,
a20 X n 2 o D E
N
+ an + b2n 6 f, f (11.1.31)
2 n=1
a2 P∞ n o
Это верно при любом N ∈ N, поэтому ряд 20 + n=1 a2n + b2n сходится. При этом, автоматически
выполняется (11.1.27):
!
a20 X n 2 o a20 X n 2 o
∞ N
1 π
ˆ
2 2
+ an + bn = lim + an + b n 6 (11.1.31) 6 hf, f i = f (x)2 d x
2 n=1
N →∞ 2 n=1
π −π
Равенство Парсеваля.
Лемма 11.1.10. Для всякой функции f ∈ R(π) выполняется следующее равенство, называемое
равенством Парсеваля:
a20 X n 2 o
∞ π
1
ˆ
+ an + b2n = hf, f i = f (x)2 d x (11.1.32)
2 n=1
π −π
a20 X n 2 o
∞
+ an + b2n = C 6 hf, f i
2 n=1
Наша задача – убедиться, что C > hf, f i. Зафиксируем ε > 0 и по лемме 11.1.8 подберем тригоно-
метрический многочлен P , для которого выполняется (11.1.26):
kf − P k < ε
kf − P k2 < ε2
| {z }
6
(11.1.25)
kf − SN k2
=
(11.1.25)
a2 PN n o
hf, f i − 0
2 − n=1 a2n + b2n
§ 1. Сходимость ряда Фурье в среднем квадратичном 629
a20 X n 2 o a2 X n 2 o
N ∞
hf, f i < + an + b2n + ε2 6 0 + an + b2n + ε2 = C + ε2
2 n=1
2 n=1
hf, f i < C + ε2
kf − SN k −→ 0,
N →∞
Доказательство.
o
a20 X n 2
N
2 (11.1.25)
kf − SN k = hf, f i − + an + b2n −→ 0
2 n=1
N →∞
| {z }
N
↓ ↓
∞
a2 P∞ n o
0
2 + n=1 a2n + b2n
=
(11.1.32)
hf, f i
a0 X n o
N
SN = + an · cosn +bn · sinn
2 n=1
kf − SN k −→ 0,
N →∞
теорема 11.1.3
kf − SN k −→ 0 =⇒ hSN , cosk i −→ hf, cosk i =⇒ ak = hf, cosk i
N →∞ | {z } N →∞
=
D PN n o E
a0
2 + n=1 an · cosn +bn · sinn , cosk
=
ak ,
при N > k
a0 X n o
N
+ an cos nx + bn sin nx −→ f (x)
2 n=1
N →∞
nxo 2π
⋄ 11.2.1. Рассмотрим функцию 1
ˆ
bn = · sin nx d x =
nxo 0π 2π
f (x) = 1 2π x
ˆ
2π = · sin nx d x =
x π 0 2π
(взятие дробной части от 2π ). Она локально ин- ˆ 2πn
тегрируема и имеет период 2π. Вычислим ее ко- 1
=− 2 x d cos nx =
эффициенты Фурье: 2π n 0
ˆ 2π
nxo 1 2π 1
1 π
1 2π n x o = − 2 · x · cos nx + 2 cos nx d x =
ˆ ˆ
a0 = dx = dx = 2π n | {z 0 } 2π n 0
π −π 2π π 0 2π
=
1 2π x x2 x=2π
ˆ
2π
= dx = =1
π 0 2π 4π 2 x=0 1 1 2π 1
=− + 2 2 · sin nx =−
πn 2π n | {z 0 } πn
nxo
=
2π
1
ˆ
an = · cos nx d x = 0
π0 2π
1 2π x
ˆ
Ряд Фурье получается такой:
= · cos nx d x =
π 0 2π
∞
1 X 1
ˆ 2π
1
= x d sin nx = − · sin nx
2π 2 n 0 2 n=1 πn
2π
ˆ 2π
1 1
= · x · sin nx − sin nx d x = и в точке x = 0 он сходится не к значению f (0):
2π 2 n | {z 0 } 2π n 0
2
=
N
0
1 X 1 1
1 2π − · sin 0 −→ 6= 0 = f (0)
= · cos nx =0 2 n=1 πn N →∞ 2
2π 2 n2 0 | {z }
=
Уже из этого примера видно, что если мы хотим, чтобы ряд Фурье сходился к функции f
поточечно, то нужно как-то сузить класс изучаемых функций, перейдя от класса R(π) (локально
интегрируемых функций с полупериодом π) к каким-то его подклассам. В этом параграфе мы
рассмотрим два таких подкласса, для которых поточечная сходимость ряда Фурье сохраняется, хотя
и в разных смыслах: это классы кусочно-непрерывных и кусочно-гладких функций с полупериодом
π. Попутно мы сформулируем для них теоремы о равномерной сходимости ряда Фурье.
(2) в каждой точке разрыва c ∈ R функция f имеет конечные левый и правый пределы
— кусочно-гладкой (на R), если она кусочно гладкая на любом отрезке2 [a, b] ⊂ R; это
означает выполнение следующих условий:
(1) на любом отрезке [a, b] она дифференцируема во всех точках, кроме, возможно,
конечного набора;
(2) в каждой точке c ∈ R, где f дифференцируема, ее производная непрерывна,
′ f (x) − f (c − 0) ′ f (x) − f (c + 0)
f− (c) = lim , f+ (c) = lim (11.2.36)
x→c−0 x−c x→c+0 x−c
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x) стремится
′ ′
соответственно к f− (c) или f+ (c):
′
f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (11.2.37)
x→c−0 x→c+0
имеющая график
⊲ 11.2.3. Функция
a0 X n o
∞
f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R. (11.2.39)
2 2 n=1
a0 X n o
∞
f (x) = + an cos nx + bn sin nx , x ∈ R. (11.2.40)
2 n=1
Кроме того,
(i) если f – непрерывная (и по-прежнему, кусочно-гладкая и 2π-периодическая) функция на
R, то ряд (11.2.40) сходится к ней на прямой R равномерно:3
a0 X n o
N
f (x) − − an cos nx + bn sin nx −→ 0; (11.2.41)
2 n=1
N →∞
x∈R
3 Норма k·kE была определена формулой (9.1.6).
§ 2. Поточечная и равномерная сходимость ряда Фурье 633
Доказательство этого факта мы разобьем на несколько лемм, и посвятим ему оставшуюся часть
этого пункта.
Лемма Римана.
x=b
−C
p · cos px
x=a
=
z }| {
b b
|C|
ˆ ˆ
W (x) · sin px d x = C · sin px d x = · cos p a − cos p b 6
a a p
|C| |C|
6 · | cos p a| + | cos p b| 6 · 2 −→ 0
p p p→+∞
W (x) = Ci , x ∈ (xi−1 , xi )
b
ε
ˆ
∀p > P g(x) · cos px d x < ,
a 2
ˆ b ˆ b ˆ b
W (x) · sin px d x = W (x) − g(x) · sin px d x + g(x) · sin px d x 6
a a a
4 Норма (m)
k·kE была определена формулой (9.1.47).
634 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
ˆ b ˆ b
ε ε
6 W (x) − g(x) · sin px d x + g(x) · sin px d x < + =ε
a a 2 2
| {z } | {z }
>
>
´b ε
a
|W (x) − g(x)| · | sin px| d x 2
>
´b
a
|W (x) − g(x)| d x
>
ε
2
Ядро Дирихле.
• Ядром Дирихле называется функция
N
1 X
DN (t) := + cos nt (11.2.44)
2 n=1
1 N
X N N
t t X t t X 1 1
+ cos nt ·2 sin = sin + 2 cos nt·sin = sin + − sin n − t + sin n + t =
2 n=1 2 2 n=1 2 2 n=1 2 2
t t 3t 3t 5t 1 1
= sin + − sin + sin + − sin + sin + ... + − sin N − t + sin N + t =
| {z2} | {z 2} | {z2} | {z 2} | {z2} | {z 2 } 2
↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑
1
= sin N + t
2
Интегралы Дирихле.
Лемма 11.2.4. Для всякой 2π-периодической локально интегрируемой функции f ее многочлен
Фурье SN с полупериодом π выражается через ядро Дирихле DN формулами
1 π
ˆ
SN (x) = f (x + t) · DN (t) d t, x∈R (11.2.47)
π −π
1 πn o
ˆ
SN (x) = f (x + t) + f (x − t) · DN (t) d t, x∈R (11.2.48)
π 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 635
a0 X n o
N
SN (x) = + ak cos kx + bk sin kx = (11.1.6) =
2
k=1
ˆ π XN
1 1 1 π 1 π
ˆ ˆ
= · f (y) d y + cos kx f (y) cos ky d y + sin kx f (y) sin ky d y =
2 π −π π −π π −π
k=1
( N
) ( N
)
1 π 1 X 1 π 1 X
ˆ ˆ
= f (y) + cos kx · cos ky + sin kx · sin ky d y = f (y) + cos k(y − x) d y =
π −π 2 π −π 2
k=1 k=1
1 π 1 π−x
ˆ ˆ
y − x = t, y = x + t, d y = d t
= f (y) · D(y − x) d y = = f (x + t) · D(t) d t =
π −π y ∈ [−π, π] ⇔ t ∈ [−π − x, π − x] π −π−x
интеграл от периодической 1 π
ˆ
= функции по периоду равен = f (x + t) · DN (t) d t
интегралу по “сдвинутому периоду” π −π
1 π 1 0 1 π
ˆ ˆ ˆ
SN (x) = f (x + t) · DN (t) d t = f (x + t) · DN (t) d t + f (x + t) · DN (t) d t =
π −π π −π π 0
в первом интеграле 1 0 1 π
ˆ ˆ
= делаем замену =− f (x − s) · DN (−s) d s + f (x + t) · DN (t) d t =
t = −s π π π 0
вспоминием, что DN 1 0 1 π
ˆ ˆ
= – четная функция: = − f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
DN (−s) = DN (s) π π π 0
в первом интеграле 1 π 1 π
ˆ ˆ
= переворачиваем = f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
пределы интегрирования π 0 π 0
в первом интеграле 1 π 1 π
ˆ ˆ
= делаем замену = f (x − t) · DN (t) d t + f (x + t) · DN (t) d t =
s=t π 0 π 0
1 πn o
ˆ
= f (x + t) + f (x − t) · DN (t) d t
π 0
Поточечная сходимость ряда Фурье. Мы можем теперь доказать ту часть теоремы 11.2.2, где
речь идет о поточечной сходимости:
Лемма 11.2.5. Для всякой кусочно-гладкой 2π-периодической функции f на прямой R ее ряд Фурье
с полупериодом π сходится в каждой точке x ∈ R к среднему арифметическому ее левого и правого
пределов в этой точке:
a0 X n o
∞
f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R.
2 2 n=1
Они должны быть кусочно-непрерывны на отрезке [0, π], потому что в точке t = 0 они непрерывны,
а при t ∈ (0, π] они получаются умножением кусочно-непрерывных функций g(t) = f (x+t)−f (x+0)
и h(t) = f (x − t) − f (x − 0) на непрерывную функцию 1t .
Кроме того, если рассмотреть функцию
( )
t
2 sin 2t
t ∈ (0, π]
C(t) =
1, t = 0
636 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
f (x + 0) + f (x − 0)
SN (x) − =
ˆ π n2 o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · DN (t) d t − · DN (t) d t =
π 2 π
| 0 {z } | 0 {z }
=
=
(11.2.48) (11.2.45)
SN (x) 1
1 nˆ π o 1 πn
ˆ o
= f (x + t) + f (x − t) · DN (t) d t − f (x + 0) + f (x − 0) · DN (t) d t =
π
0 π 0
1 πn o
ˆ
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · DN (t) d t =
π
ˆ 0
1 π nh i h io
= f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · DN (t) d t =
π 0
1 π nh
ˆ i h io sin N + 1 t
2
= (11.2.46) = f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · dt =
π 0 2 sin 2t
ˆ
1 π f (x + t) − f (x + 0) f (x − t) − f (x − 0) t 1
= − · · sin N + t dt =
π 0 | t
{z } | −t
{z } 2 sin 2t 2
| {z }
=
=
A(t) B(t) C(t)
| {z }
=
W (t)
π
1 1
ˆ
= W (t) · sin N + t d t −→ 0
π 0 2 N →∞
a0 X n o α0 X n o
N N
SN [f ](x) = + an cos nx + bn sin nx , SN [f ′ ](x) = + αn cos nx + βn sin nx
2 n=1
2 n=1
Действительно,
!
′ a0 X n
N o ′ X N n o
SN [f ] (x) = + an cos nx + bn sin nx = − n · an sin nx + n · bn cos nx =
2 n=1 n=1
XN n o α XN n o
α0 0
= (11.2.50) = + βn sin nx + αn cos nx = + αn cos nx + βn sin nx = SN [f ′ ](x)
2
|{z} n=1
2 n=1
=
0,
потому что cosn и f –
2π-периодические
функции
и
π
1 1 π
ˆ ˆ
′
βn = f (x) · sin nx d x = sin nx d f (x) = (7.3.147) =
π −π π −π
1 x=π 1 π 1 π
ˆ ˆ
= · sin nx · f (x) − f (x) d sin nx = −n · f (x) · cos nx d x = −n · an
π x=−π π −π π −π
| {z }
=
0,
потому что sinn и f –
2π-периодические
функции
Теперь заметим, что каждая функция f (k) является гладкой и 2π-периодической, поэтому по лемме
11.2.7 ее ряд Фурье должен сходиться к ней равномерно на R, то есть
f (k) − SN [f (k) ] −→ 0
R N →∞
В силу (11.2.52) это можно интерпретировать, как равномерное стремление к нулю производной
порядка k от разности f − SN [f ]:
(k) (k)
f − SN [f ] = f (k) − SN [f ] = (11.2.52) = f (k) − SN [f (k) ] −→ 0
R R R N →∞
a0 X n o
N
SN (x) = + an cos nx + bn sin nx
2 n=1
Кроме того,
(i) если f – непрерывная (и, по-прежнему, 2π-периодическая) функция на R, то то много-
члены Фейера сходятся к ней на прямой R равномерно:5
kf (x) − σN (x)kx∈R −→ 0; (11.2.56)
N →∞
Как и в случае с теоремой 11.2.2, доказательство этого факта мы разобьем на несколько лемм.
Ядро Фейера.
• Ядром Фейера называется арифметическое среднее ядер Дирихле
N −1 N −1 n
!
1 X 1 X 1 X
ΦN (t) = Dn (x) = + cos kt (11.2.58)
N n=0 N n=0 2
k=1
Эта функция обладает свойствами, похожими на свойства ядра Дирихле, но главная разница
заключается в том, что ядро Фейера оказывается неотрицательной функцией (что оказывается
очень полезно для дальнейших выводов).
4◦ . Для всякого δ > 0 равномерная норма функции Φ на отрезке [δ, π] стремится к нулю
при N → ∞:
kΦN (t)kt∈[δ,π] = max ΦN (t) −→ 0 (11.2.61)
t∈[δ,π] N →∞
◦ ◦
Доказательство. Свойства 1 и 2 вытекают сразу же из свойств ядра Дирихле на с.634, за исклю-
чением неотрицательности ΦN , которая, в свою очередь, является следствием тождества (11.2.60).
Поэтому для доказательства 1◦ , 2◦ и 3◦ достаточно проверить (11.2.60). Для точек t = 2πk мы
получаем:
N −1 N −1 N −1
1 X 1 X 1 1 X N N −1 1 N
ΦN (2πk) = Dn (2πk) = n+ = n + = + =
N n=0 | {z } N n=0 2 N n=1
2N 2 2 2
| {z }
=
(11.2.46)
1
n+ 2
= (2.2.253)
(N −1)·N
2
N −1 N −1
t 1 X t X 1 t
ΦN (t) · 2N sin2 = Dn (x) ·2N sin2 =2 sin n + t · sin =
2 N n=0 | {z } 2 n=0 |
2 2
{z }
=
(11.2.46)
=
sin n+ 1 t (4.1.83)
2
t 1
2 sin
2 2 cos nt − cos(n + 1)t
N
X −1
= cos nt − cos(n + 1)t = cos 0 − cos
| {z } |{z} t + cos t − cos
|{z} | {z } 2t + ... + cos(N − 1)t − cos N t =
| {z }
n=0 ↑ ↑ ↑ ↑ ↑
=
↑
1
N +1
= 1 − cos N t = (4.1.72) = sin2 t
2
Поделив это на 2N sin2 2t , мы получим нижнюю строчку в (11.2.60).
После того, как (11.2.60) доказано, свойство (11.2.61) становится его следствием:
Интеграл Фейера.
Лемма 11.2.10. Для всякой 2π-периодической локально интегрируемой функции f ее многочлен
Фейера σN выражается через ядро Фейера ΦN формулами
1 π
ˆ
σN (x) = f (x + t) · ΦN (t) d t, x∈R (11.2.62)
π −π
1
ˆ π n o
σN (x) = f (x + t) + f (x − t) · ΦN (t) d t, x∈R (11.2.63)
π 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 641
Доказательство. Это следует из формул для интеграла Дирихле (11.2.47) и (11.2.48): во-первых,
Sn (x)
=
(11.2.47)
N −1 N −1
z ˆ }| {
1 X 1 X 1 π
σN (x) = Sn (x) = f (x + t) · Dn (t) d t =
N n=0 N n=0 π −π
N −1
1 π 1 X 1 π
ˆ ˆ
= f (x + t) · Dn (t) d t = f (x + t) · ΦN (t) d t,
π −π N n=0 π −π
| {z }
=
(11.2.58)
ΦN (t)
и, во-вторых,
Sn (x)
=
(11.2.48)
z ˆ }| {
1 X 1 πn o
N −1 N −1
1 X
σN (x) = Sn (x) = f (x + t) + f (x − t) · Dn (t) d t =
N n=0 N n=0 π 0
1 πn o 1 πn o
N −1
1 X
ˆ ˆ
= f (x + t) + f (x − t) · Dn (t) d t = f (x + t) + f (x − t) · ΦN (t) d t.
π 0 N n=0 π 0
| {z }
=
(11.2.58)
ΦN (t)
f (x − 0) + f (x + 0)
= lim σN (x), x ∈ R.
2 N →∞
(это всегда можно сделать, в силу (11.2.61)). Тогда для всех N > N0 мы получим:
ˆ π
f (x + t) − f (x + 0) · ΦN (t) d t =
0
642 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
ˆ δ ˆ π
= f (x + t) − f (x + 0) ·ΦN (t) d t + f (x + t) − f (x + 0) ·ΦN (t) d t 6
0 | {z } δ | {z }
>
>
ε |f (x + t)| + |f (x + 0)|
>
2M
δ π
π·ε π·ε
ˆ ˆ
6ε· ΦN (t) d t +2M · ΦN (t) d t 6 + = π·ε
2 2
|0 {z } |δ {z }
>
>
´π
0
ΦN (t) d t (π − δ) · maxt∈[δ,π] ΦN (t)
>
(11.2.59) (11.2.64)
π ε
2 (π − δ) · 4M
>
π·ε
4M
Таким образом,
π
1
ˆ
∀N > N0 · f (x + t) − f (x + 0) · ΦN (t) d t < ε (11.2.65)
π 0
f (x+0)+f (x−0)
Теперь оценим разность между 2 и многочленом Фейера:
f (x + 0) + f (x − 0)
σN (x) − =
2
ˆ πn o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · ΦN (t) d t − · DN (t) d t =
π 2 π
| 0 {z } | 0 {z }
=
=
(11.2.63) (11.2.59)
σN (x) 1
1 nˆ π o 1 πn
ˆ o
= f (x + t) + f (x − t) · ΦN (t) d t − f (x + 0) + f (x − 0) · ΦN (t) d t =
0π π 0
1 πn o
ˆ
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · ΦN (t) d t =
π 0
ˆ πh i ˆ πh i
1
= · f (x + t) − f (x + 0) · ΦN (t) d t + f (x − t) − f (x − 0) · ΦN (t) d t 6
π 0 0
ˆ π ˆ π
1 1
6 · f (x + t) − f (x + 0) · ΦN (t) d t + · f (x − t) − f (x − 0) · ΦN (t) d t < 2ε
π 0 π 0
| {z } | {z }
>
>
(11.2.65) (11.2.66)
ε ε
Мы получили, что для произвольной точки x ∈ R и любого ε > 0 можно подобрать такое N0 ∈ N,
что для любого N > N0 выполняется соотношение:
f (x + 0) + f (x − 0)
σN (x) − < 2ε
2
f (x + 0) + f (x − 0)
∀x ∈ R σN (x) −→
N →∞ 2
=
(11.2.59) (11.2.62)
1 σN (x)
1
ˆ π 1 π
ˆ
= f (x) − f (x + t) · ΦN (t) d t 6 f (x) − f (x + t) · ΦN (t) d t =
π −π π −π
1 −δ 1 δ
ˆ ˆ
= f (x) − f (x + t) ·ΦN (t) d t + f (x) − f (x + t) ·ΦN (t) d t+
π −π | {z } π −δ | {z }
>
>
ε
(11.2.68)
|f (x)| + |f (x + t)| 3
>
(11.2.67)
2M
ˆ π
1
+ f (x) − f (x + t) ·ΦN (t) d t 6
π δ | {z }
>
|f (x)| + |f (x + t)|
>
(11.2.67)
2M
−δ ˆ δ
2M ε 2M π
ˆ ˆ
6 ΦN (t) d t + ΦN (t) d t + ΦN (t) d t =
π−π 3π −δ π δ
| {z } | {z }
↑ ↑
ˆ δ ˆ π
ε 4M ε 4M πε ε 2ε
= · ΦN (t) d t + · ΦN (t) d t < ·π+ · = + =ε
3π −δ π δ 3π π 6M 3 3
| {z } | {z }
>
>
´π
ΦN (t) d t (π − δ) · kΦN (t)kt∈[δ,π]
−π
>
=
(11.2.59) (11.2.69)
ε
π (π − δ) · 6M
>
πε
6M
Отсюда
∀N > N0 kf (x) − σN (x)kx∈R = sup f (x) − σN (x) 6 ε
x∈R
следует, что при фиксированных m ∈ Z+ и ε > 0 существует N0 такое, что при N > N0 выполняется
(m)
kf − SN kR <ε
N −1 (m) N −1 N −1 (m)
(m) 1 X 1 X 1 X
kf − σN kR = f− Sn = f− Sn =
N n=0 N n=0 N n=0
R R
N −1 (m) N −1 N −1
1 X 1 X (m) 1 X
= (f − Sn ) 6 k(f − Sn )kR < ε=ε
N n=0 N n=0 N n=0
R
(d) Примеры 1 0 1 π
ˆ ˆ
=− sin nx d x + sin nx d x =
π −π π 0
В следующих примерах нас будет интересовать
поточечная сходимость, поэтому они будут ил- 1 x=0 1 x=π
= cos nx − cos nx =
люстрациями к теореме 11.2.2. πn x=−π πn x=0
1 1
= {1 − cos(−πn)} − {cos(πn) − 1} =
Разложение Фурье произвольной 2π- πn πn
периодической функции. 2 2
= {1 − cos(πn)} = {1 − (−1)n }
πn πn
⋄ 11.2.8. Найдем разложение Фурье функции
Вывод:
1, x ∈ (2πn, π + 2πn) X∞
2
f (x) = sgn sin x = 0, x = πn sgn sin x = {1 − (−1)n } · sin nx
πn
n=1
−1, x ∈ (−π + 2πn, 2πn)
⋄ 11.2.9. Вычислим разложение 2π-
Для этого нужно просто вычислить коэффици- периодической функции f , удовлетворяющей
енты Фурье: тождеству Лебега и заданной на интервале
(−π, π) формулой
1 π 1 0
ˆ ˆ
a0 = sgn sin x d x = (−1) d x+
π −π π −π
1, x ∈ (0, π)
1
ˆ π
π π f (x) = 12 , x = 0
+ 1 dx = − + = 0
π 0 π π 0, x ∈ (−π, 0)
1 π
ˆ
an = sgn sin x · cos nx d x =
π −π
1 0 1 π
ˆ ˆ
= (−1) · cos nx d x + 1 · cos nx d x =
π −π π 0
1 0 1 π
ˆ ˆ
=− cos nx d x + cos nx d x =
π −π π 0
1 x=0 1 x=π Вычисляем коэффициенты Фурье:
=− sin nx + sin nx = 0+0 = 0
πn x=−π πn x=0
π
1
ˆ
a0 = f (x) d x =
π
π −π
1
ˆ
0 π
bn = sgn sin x · sin nx d x = 1 1 π
ˆ ˆ
π −π = 0 dx + 1 dx = =1
0 π
π −π π 0 π
1 1
ˆ ˆ
= (−1) · sin nx d x + 1 · sin nx d x =
π −π π 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 645
1 π 1 π 1 π
ˆ
an = f (x) · cos nx d x = =− {cos(πn) − cos } = {cos − (−1)n }
π −π πn 2 πn 2
1 0 1 π Вывод:
ˆ ˆ
= 0 · cos nx d x + 1 · cos nx d x =
π −π π 0
1 X n sin πn
∞
2
1 x=π f (x) = + · cos nx+
= sin nx =0 4 n=1 πn
πn x=0
1 π o
{cos − (−1)n } · sin nx
+
πn 2
1 π
ˆ
bn = f (x) · sin nx d x = ⊲⊲ 11.2.11. Разложите в ряд Фурье 2π-
π −π
периодические функции, заданные на интервале
1 0 1 π
ˆ ˆ
(−π, π) формулами:
= 0 · sin nx d x + 1 · sin nx d x =
π −π π 0 1) f (x) = e(x
1 x=π 1 x, x ∈ (0, π)
=− cos nx = − {cos(πn) − 1} = 2) f (x) =
πn x=0 πn 0, x ∈ (−π, 0)
1 (
= {1 − (−1)n } 0, x ∈ (0, π)
πn 3) f (x) =
x, x ∈ (−π, 0)
Вывод:
x, x ∈ (0, π)
∞
1 X 1 4) f (x) = π2 , x = 0
f (x) = + {1 − (−1)n } · sin nx
2 n=1 πn π, x ∈ (−π, 0)
(11.2.70)
f (t)
0 π
1 π 1 1
ˆ ˆ ˆ
bn = f (x) · sin nx d x = = f (t) sin nt d t + f (x) sin nx d x = 0
π −π π π π 0
| {z }
1 π 1 x=π
ˆ
=
= 1 · sin nx d x = − cos nx = 1
−π
´π
f (t) sin nt d t
π π2 πn x= π
2
0
646 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
π
1
ˆ
Докажем формулы (11.2.72): во-первых, a0 = f (x) d x =
π −π
π
1
ˆ
0 π
1 1
ˆ ˆ
a0 = f (x) d x = = f (x) d x + f (x) d x =
π −π π π
−π 0
0 π | {z }
1 1
ˆ ˆ
= f (x) d x + f (x) d x = замена: x = −t
π −π π 0 1
ˆ 0
1
ˆ π
| {z } = f (−t) d(−t) + f (x) d x =
замена: x = −t π π | {z } π 0
0 π
=
1 1 (11.2.73)
ˆ ˆ
= f (−t) d(−t) + f (x) d x = −f (t)
π π | {z } π 0 0 π
1 1
ˆ ˆ
=
(11.2.70)
f (t) = f (t) d t + f (x) d x = 0
π π π 0
0 π π | {z }
1 1 2
ˆ ˆ ˆ
=
=− f (t) d t + f (x) d x = f (x) d x ´π
π π π 0 π 0
1
−π 0
f (t) d t
| {z }
=
1
´π а для коэффициентов an ,
π 0
f (t) d t
1 π
ˆ
и, во-вторых, an = f (x) cos nx d x =
π −π
1 π
ˆ
1 0 1 π
ˆ ˆ
an = f (x) cos nx d x = = f (x) cos nx d x + f (x) cos nx d x =
π −π π −π π 0
| {z }
1 0 1 π
ˆ ˆ
= f (x) cos nx d x + f (x) cos nx d x = замена: x = −t
π −π π 0 ˆ 0
1
| {z } = f (−t) cos(−nt) d(−t)+
замена: x = −t π π | {z }
ˆ 0
=
1 (11.2.73)
= f (−t) cos(−nt) d(−t)+ −f (t)
π π | {z } ˆ π
1
=
1
´π Докажем формулу (11.2.75):
π 0
f (t) cos nt d t
π π
2
ˆ
1
ˆ
= f (x) cos nx d x bn = f (x) sin nx d x =
π 0 π −π
0 π
1 1
ˆ ˆ
= f (x) sin nx d x + f (x) sin nx d x =
π −π π 0
Предложение 11.2.15. Если 2π-периодическая | {z }
замена: x = −t
функция f нечетна ˆ 0
1
= f (−t) sin(−nt) d(−t)+
f (−x) = −f (x) (11.2.73) π π | {z }
=
(11.2.73)
то в ее ряде Фурье отсутствуют свободное сла- −f (t)
ˆ π
гаемое и слагаемые с косинусами: 1
+ f (x) sin nx d x =
∞ π 0
X
0 π
f (x) = bn sin nx (11.2.74) 1 1
ˆ ˆ
n=1
=− f (t) sin nt d t + f (x) sin nx d x =
π π π 0
| {z }
а коэффициенты bn можно вычислять по фор-
=
1
´π
мулам π 0
f (t) sin nt d t
π
2
ˆ
2 π = f (x) sin nx d x
ˆ
bn = f (x) sin nx d x (11.2.75) π 0
π 0
f (x) = x2
π ˆ π
2 2
ˆ
an = x · cos nx d x = x d sin nx = Поскольку f четна, нужно вычислить только a0
π 0 πn 0
π и an :
2 π
ˆ
= x · sin nx − sin nx d x = 2 π 2
ˆ
2 x3 π 2π 2
πn 0 0 a0 = x dx = · =
2 n cos nx π o 2 π 0 π 3 0 3
= 0+ = {cos πn − 1} =
πn n 0 πn2
2
{(−1)n − 1} π ˆ π
= 2 2
ˆ
πn2 an = x2 · cos nx d x = x2 d sin nx =
π0 πn 0
Вывод: 2 n 2 o
π
ˆ π
= · x · sin nx −2 x · sin nx d x =
∞
π X 2 πn | {z 0
} 0
f (x) = + {(−1)n − 1} · cos nx
=
2 n=1 πn2
0
ˆ π
⋄ 11.2.13. Найдем разложение нечетной 2π- 4
= · x d cos nx =
периодической функции f , удовлетворяющей πn2 0
4 n o
ˆ π
тождеству Лебега и заданной на интервале (0, π) π
формулой = · x · cos nx − cos nx d x =
πn2 0 0
f (x) = x 4 n 1 πo (−1)n
= 2
· π · (−1)n − · sin nx =4·
График здесь имеет вид πn |n {z 0
} n2
=
Вывод:
X∞
π2 (−1)n
f (x) = +4· · cos nx (11.2.76)
3 n=1
n2
ФУНКЦИИ НЕСКОЛЬКИХ
ВЕЩЕСТВЕННЫХ ПЕРЕМЕННЫХ
649
Глава 12
ЛИНЕЙНАЯ АЛГЕБРА
В § 1 главы 2 мы говорили, что вещественные числа появляются в науке как идея, упрощающая
понимание алгоритмов измерения по эталону. Физические величины, для измерения которых доста-
точно указать эталон и алгоритм сравнения по нему, называются скалярными. Таковыми, например,
являются длина, объем, масса, заряд и т.д. Помимо них есть и другие, для измерения которых нуж-
но дополнительно фиксировать систему координат. Такие величины называются векторными.
⋄ 12.0.1. Типичный пример векторной величи- ной точке. По определению, это дробь
ны – положение тела в пространстве. Если ука-
зан эталон длины и система координат в про- F
E=
странстве, то положение тела (точнее, матери- q
альной точки) однозначно описывается тремя ко-
где F – сила, действующая на пробный заряд ве-
ординатами. Точно так же скорость тела или си-
личиной q, помещенный в данную точку. Знаме-
ла, действующая на него являются векторными
нитые уравнения Максвелла связывают эту ве-
величинами.
личину с еще тремя векторными величинами: на-
⋄ 12.0.2. Еще один пример векторной величины пряжённостью H магнитного поля, электриче-
– напряженность электрического поля E в дан- ской индукцией B и магнитной индукцией D.
Если для данной векторной величины заданы эталон, алгоритм сравнения по нему и система
координат, то результат измерения этой величины в каждой конкретной ситуации будет конечной
последовательностью чисел фиксированной длины n. Напомним определение главы 2 (с.73):
• Конечной последовательностью элементов множества S (необязательно, числового) на-
зывается произвольное отображение a : {1, ..., k} → S из какого-нибудь отрезка {1, ..., k}
натурального ряда N. Значения такого отображения часто записывают с помощью индек-
сов
ai = a(i), i ∈ {1, ..., k}.
а само это отображение – в виде семейства {ai ; i ∈ N} или {ai }. Число k при этом
называется длиной последовательности {ai ; i ∈ N}.
• В частном случае, когда S = R – множество чисел, последовательность {ai ; i ∈ N} при-
нято называть (конечной) числовой последовательностью.
• Напомним, что до сих пор мы записывали конечные числовые последовательности в виде
строк
x = x1 , x2 , ..., xn .
Такие объекты в математике принято также называть числовыми строками (длины n ∈
N). Множество всех числовых строк длины n называется координатным пространством
размерности n и обозначается Rn :
x ∈ Rn ⇔ x = x1 , x2 , ..., xn , xi ∈ R
Элементы этого множества, то есть строки, называются также точками или векторами
пространства Rn .
650
§ 1. Комбинаторика 651
(при этом индексы у элементов последовательности мы будем писать справа вверху). Та-
кие объекты принято называть числовыми столбцами (длины n ∈ N).1 Множество всех
числовых столбцов длины n также называется координатным пространством размерно-
сти n и обозначается Rn :
1
x
x2
x ∈ Rn ⇔ x = i
... , x ∈ R
xn
Элементы этого множества, то есть столбцы, тоже называются точками или векторами
пространства Rn .
Координатные пространства Rn и Rn играют в изучении векторных величин ту же роль, что и
множество R вещественных чисел при изучении скалярных. Однако система фактов об Rn и Rn ,
необходимых для доказательства нужных утверждений, намного более сложна и менее очевидна,
чем в случае с R. В этой главе мы обсудим те свойства Rn и Rn , которые вытекают из наличия на
этих множествах естественных алгебраических операций.
§1 Комбинаторика
Разговор о пространствах Rn и Rn полезно начать с обсуждения свойств конечных последователь-
ностей, причем не только числовых. Это понадобится нам в дальнейшем, например, при описании
свойств определителя2 , многочленов и полилинейных форм (§ 3, (a) и § 5 этой главы3 ) а также
главы 144 . Область математики, где рассматриваются объекты такого типа, называется комбина-
торика. Свой предмет эта наука определяет, как изучение конечных множеств5. В этом параграфе
мы опишем некоторые ее результаты.
Область математики, изучающая конечные множества, называется комбинаторикой. Результа-
ты этого параграфа понадобятся нам ниже в главах 5 и 12.
{1, ..., n} в R. Однако для удобства вычислений с матрицами, о которых пойдет речь ниже в § 3, удобно различать
строки и столбцы, и на формальном языке это различие можно представлять как дополнительную метку, приписыва-
емую данной конечной последовательности x, скажем, 0, если эту последовательность мы представляем как строку, и
1, если как столбец. Иными словами, парой (x, 0) мы записываем последовательность x, представляемую как строку, а
парой (x, 1) ту же последовательность, представляемую как столбец. Далее в тексте мы, однако, такое представление
строк и столбцов использовать не будем, просто удовлетворившись тем, что формальный способ выразить разницу
между ними существует.
2 Группа перестановок Σ используется в самом определении определителя матрицы на с.699.
n
3 Это алгебраические результаты, но они применяются затем в анализе, например, в теореме 14.1.10 ниже.
4 Например, понятие мультииндекса используется при определении мультистепени элементарного дифференциала
на с.813.
5 Напомним, что конечные множества мы определили на с.70.
652 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
и поэтому
k+1
Y Y
k Y
k
card Xi = card Xi × Xk+1 = (2.1.94) = card Xi · card Xk+1 = (12.1.2) =
i=1 i=1 i=1
Y
k k+1
Y
= card Xi · card Xk+1 = (2.2.241) = card Xi .
i=1 i=1
⋄ 12.1.1. Сколько слов длины 3 можно соста- собами, второй – двумя. Значит маршрут можно
вить из алфавита, состоящего из двух букв X = выбрать
{a, b}? 3·2=6
Решение. Первую букву в слове можно вы-
брать двумя способами, вторую – тоже двумя способами.
способами, третью – тоже двумя. Получается по
теореме 12.1.2 все слово можно составить ⋄ 12.1.3. Сколько четырехзначных чисел можно
составить из цифр 0, 1, 2, 3, 4, 5, если
2·2·2 =8
1) цифры не повторяются,
способами. 2) цифры могут повторяться,
3) цифры могут повторяться, и получающееся
⋄ 12.1.2. Из пункта A в пункт C можно добрать-
число должно быть нечетным.
ся через пункт B следующими видами транспор-
та: Какова в каждом случае вероятность, что полу-
чающееся число оканчивается на 0?
1) сначала из A в B: автобусом, поездом или па-
роходом, Решение.
1. В первом случае (когда цифры не повторя-
2) потом B в C: пароходом, или самолетом.
ются):
Сколькими способами можно выбрать маршрут
— первую цифру можно выбрать 5 способами
из A в C?
(среди цифр 1, 2, 3, 4, 5),
Решение. Составить маршрут – это все равно
что составить последовательность из двух эле- — после того, как первая цифра выбрана, вто-
ментов: на первом месте должен быть какой-то рую цифру можно выбрать снова 5 способами
вид транспорта при путешествии от A до B, а (среди 0 и оставшихся 4 цифр из 1, 2, 3, 4, 5),
на втором – при путешествиии от B до C. Пер- — после того, как первые две цифры выбраны,
вый вид транспорта можно выбрать тремя спо- третью цифру можно выбрать 4 способами,
§ 1. Комбинаторика 653
— после того, как первые три цифры выбраны, (теперь понятно, почему). Вероятность, что в
четвертую цифру можно выбрать 3 способа- этом случае выбранное число оканчивается на 0,
ми. будет равна
180 1
Всего по теореме 12.1.2 в этом случае полу- P = = .
1080 6
чается
5 · 5 · 4 · 3 = 120 3. В третьем случае (когда цифры могут по-
вторяться и последняя лодна быть нечетной):
вариантов выбора. Среди этих 120 чисел име-
ется некоторое количество оканчивающихся на — первую цифру можно выбрать 5 способами
0. Чтобы их сосчитать, снова применим теорему (среди цифр 1, 2, 3, 4, 5),
12.1.2. Здесь выбрать число – это выбрать только — после того, как первая цифра выбрана, вто-
первые три цифры, потому что последняя цифра рую цифру можно выбрать 6 способами (сре-
будет 0. Получаем: ди цифр 0, 1, 2, 3, 4, 5),
— первую цифру можно выбрать 5 способами — после того, как первые две цифры выбраны,
(среди цифр 1, 2, 3, 4, 5), третью цифру можно выбрать 6 способами
— после того, как первая цифра выбрана, вто- (среди цифр 0, 1, 2, 3, 4, 5),
рую цифру можно выбрать 4 способами (сре- — после того, как первые три цифры выбраны,
ди оставшихся 4 цифр из 1, 2, 3, 4, 5), четвертую цифру можно выбрать 3 способа-
— после того, как первые две цифры выбраны, ми (среди цифр 1, 3, 5).
третью цифру можно выбрать 3 способами. Всего по теореме 12.1.2 в этом случае полу-
Всего в первом случае чисел, оканчивающих- чается
ся на 0, имеется 5 · 6 · 6 · 3 = 540
вариантов. Из них ни одно число не оканчивает-
5 · 4 · 3 = 60.
ся на 0. Поэтому вероятность получения такого
Вероятность, что в первом случае выбранное числа нулевая:
число оканчивается на 0, будет равна 0
P = = 0.
60 1 540
P = = .
120 2 ⋄ 12.1.4. Подбрасываются две игральные кости.
2. Во втором случае (когда цифры могут по- Найдите вероятность того, что
вторяться): 1) выпадут одинаковые цифры,
— первую цифру можно выбрать 5 способами 2) выпадут четные цифры.
(среди цифр 1, 2, 3, 4, 5),
Решение. Всего вариантов выпадения двух
— после того, как первая цифра выбрана, вто- костей имеется по теореме 12.1.2
рую цифру можно выбрать 6 способами (сре-
ди цифр 0, 1, 2, 3, 4, 5), 6 · 6 = 36
— после того, как первые две цифры выбраны,
третью цифру можно выбрать 6 способами (потому что первую цифру можно выбрать 6 спо-
(среди цифр 0, 1, 2, 3, 4, 5), собами, как и вторую). Количество вариантов, в
которых цифры одинаковые, равно 6. Поэтому
— после того, как первые три цифры выбраны, вероятность в первом случае равна
четвертую цифру можно выбрать 6 способа-
ми (среди цифр 0, 1, 2, 3, 4, 5). 6 1
P = = .
Всего по теореме 12.1.2 в этом случае полу- 36 6
чается Во втором случае количество вариантов будет
5 · 6 · 6 · 6 = 1080 равно
вариантов выбора, то есть четырехзначных чи- 3·3=9
сел, составленных из цифр 0, 1, 2, 3, 4, 5. Из них
и вероятность этого
оканчивающихся на 0 будет
9 1
5 · 6 · 6 = 180 P = = .
36 4
654 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
Размещения. Последовательность {xi ; i = 1, ..., k} называется размещением (длины k), если она
инъективна, то есть ее элементы не повторяются:
∀i 6= j ∈ {1, ..., k} xi 6= xj
n!
Akn = (12.1.3)
(n − k)!
Подмножества.
Теорема 12.1.4. Если (конечное) множество S состоит из n элементов, то множество 2S всех
подмножеств в множестве S (также конечно и) состоит из 2n элементов.
Доказательство. Занумеруем элементы S:
S = {x1 , ..., xn }.
§ 1. Комбинаторика 655
Задать подмножество M в S – то же, что присвоить каждому элементу xi число ai , равное 1, если
xi ∈ M , и 0, если xi ∈
/ M . Это то же самое, что выбрать последовательность (a1 , ..., an ) из чисел 0
и 1. Таких последовательностей по теореме 12.1.2 имеется
· ... · 2} = 2n
|2 · 2 {z
n множителей
(потому что первое число a1 можно выбрать 2 способами, второе a2 – тоже 2 способами, и так
далее).
Напомним, что число сочетаний из n элементов по k было определено нами в главе 2 формулой
(2.2.249):
n!
Cnk = , (0 6 k 6 n) (12.1.4)
(n − k)! · k!
Теорема 12.1.5. Если (конечное) множество S состоит из n элементов, то для любого k 6 n
множество CSk всех подмножеств мощности k в множестве S (также конечно и) состоит из
Cnk элементов.
Доказательство. Обозначим буквой E число всех подмножеств мощности k в S. Наша задача –
показать, что E = Cnk .
По теореме (12.1.3), число последовательностей длины k из неповторяющихся элементов множе-
ства S равно
n!
Akn = . (12.1.5)
(n − k)!
То же самое число можно посчитать другим способом:
— сначала нужно выбрать какое-нибудь подмножество T мощности k в S – число таких
вариантов равно E (мы еще не знаем, сколько это);
— после того, как выбрано подмножество T мощности k в S, мы нумеруем его элементы
цифрами от 1 до k – это можно сделать Akk = k! способами (по теореме (12.1.3)).
В результате по правилу комбинаторного умножения (теорема 12.1.2) получается всего
E · k! (12.1.6)
n! n!
E · k! = =⇒ E= = Cnk .
(n − k)! k! · (n − k)!
Множество всех разбиений множества S типа (k1 , ..., kn ) обозначается CSk1 ,...,kn .
Теорема 12.1.6. Число разбиений типа (k1 , ..., kn ) конечного множества S мощности m равно
k1 ,...,kn m!
Cm = (12.1.7)
k1 ! · ... · kn !
Доказательство. Подсчитаем, сколькими способами можно выбрать разбиение K1 , ..., Kn множе-
ства S:
— первое множество K1 (из k1 элементов в множестве из m элементов) можно по теореме
k1
12.1.5 выбрать Cm способами,
— после того, как K1 выбрано, второе множество K2 (из k2 элементов в множестве из остав-
k1
шихся m − k1 элементов) можно по теореме 12.1.5 выбрать Cm−k 1
способами,
— после того, как K1 и K2 выбраны, третье множество K3 (из k3 элементов в множестве из
k1
оставшихся m − k1 − k2 элементов) можно по теореме 12.1.5 выбрать Cm−k 1
способами,
...
— и последнее множество, Kn уже нужно будет выбирать из множества мощности m − k1 −
k2 − ... − kn−1 = kn элементов, и оно уже будет выбираться однозначно.
В результате по правилу комбинаторного умножения (теорема 12.1.2) мы получаем, что способов
выбрать разбиение K1 , ..., Kn множества S имеется
k1 k2 k3 m−1 k
Cm · Cm−k1
· Cm−k1 −k2
· ... · Cm−k1 −k2 −...−km−2
·1 =
m! (m − k1 )! (m − k1 − k2 )! (m − k1 − k2 − ... − kn−1 )!
= · · · ... · =
k1 !(m − k1 )! k2 !(m − k1 − k2 )! k3 !(m − k1 − k2 − k3 )! kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )!
§ 1. Комбинаторика 657
m! m!
= =
k1 ! · k2 ! · k3 ! · ... · kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )! k1 ! · k2 ! · k3 ! · ... · kn−1 ! · kn !
⋄ 12.1.11. Сколькими способами можно разде- (потому что каждое такое разбиение показывает,
лить 3m предметов между 3 людьми поровну? какой цвет имеет кубик с данным номером). Та-
Здесь речь идет о разбиении типа (m, m, m), ких разбиений имеется
поэтому по теореме 12.1.6 число разбиений равно
k1 ,...,kn m!
Cm = .
m,m,m (3m)! (3m)! k1 ! · ... · kn !
C3m = = .
m! · m! · m! (m!)3 Среди них имеются разбиения, у которых эле-
менты первого множества K1 находятся на пер-
⋄ 12.1.12. 10 человек случайно размещаются в
вых k1 местах. Выбрать такое разбиение –
гостиннице по трем номерам:
все равно что выбрать расположение остальных
— 2 номера 3-местных, и множеств K2 , ..., Kn , то есть выбрать разбиение
— 1 номер 4-местный. множества {k1 + 1, ..., m} (из m − k1 элементов)
по типу (k2 , ..., kn ). Таких разбиений имеется
Какова вероятность, что два конкретных чело-
века, А и Б, попадут в 4-местный номер? k2 ,...,kn (m − k1 )!
Cm−k = .
Разместить 10 человек по таким номерам – 1
k2 ! · ... · kn !
все равно что выбрать разбиение 10-элементного
Вероятность, что попадется именно такое разби-
множества (из 10 человек) типа (3, 3, 4). Таких
ение равна отношению числа таких разбиений к
разбиений имеется
числу всех разбиений:
3,3,4 10! (m−k1 )!
C10 = . C k2 ,...,k n
(m − k1 )! · k1 !
3!3!4! P = m−k 1
k1 ,...,kn
= k2 !·...·kn !
m!
= .
Cm k1 !·...·kn !
m!
Далее, разместить 10 человек так, чтобы двое по-
пали в 4-местный номер – все равно, что разме- ⋄ 12.1.14. Бросается 5 игральных костей. Найти
стить оставшихся 8 человек по номерам вмести- вероятности, что
мостью 3, 3 и 2 (оставшиеся 2 места в 4-местном
1) выпадут 2 единицы, 2 тройки и 1 шестерка,
номере). Это в свою очередь эквивалентно раз-
биению 8-элементного множества типа (3, 3, 2), и 2) выпадут неповторяющиеся цифры,
таких разбиений имеется 3) выпадут ровно 3 одинаковые цифры.
второе множество, {3, 4} – что на третьем и чет- По правилу комбинаторного умножения (теоре-
вертом месте стоят тройки, а последнее множе- ма 12.1.2), число таких последовательностей рав-
ство – что на пятом месте стоит шестерка. но
Наоборот, если дано, например, разбиение 5!
· 6 · 12.
3! · 2!
{2, 4}, {1, 5}, {3}.
Вероятность выпадения такой комбинавции
то ему соответствует последовательность выпвв-
ших цифр 5!
· 6 · 12 5!
(3, 1, 6, 1, 3). P = 3!·2! 5 = 4.
6 6
Таким образом, описать распределение вы-
павших костей с 2 единицами, 2 тройками и 1 ше- ⋄ 12.1.15. 52 карты раздаются по 4 игрокам
стеркой – то же самое, что задать разбиение типа (каждому по 13 карт). Найти вероятность того,
(2, 2, 1) множества мест (индексов) {1, 2, 3, 4, 5}. что
Получается, что между нужными распределе-
1) каждый игрок получит туза,
ниями выпавших костей и разбиенями имеется
взаимно однозначное соответствие. А по теореме 2) какой-то игрок получит карты только одной
12.1.6 таких разбиений имеется масти,
5! 3) все тузы попадут к одному игроку,
C52,2,1 = = 5 · 3 · 2 = 30. 4) двое определенных игроков не получат ни од-
2! · 2! · 1!
Теперь вероятность выпадения нужного распре- ного туза.
деления Здесь задать распределение карт – то же что
30 5 задать разбиение типа (13, 13, 13, 13) множества
P = 5 = 4.
6 6 из 52 карт. Таких разбиений всего
2. Во втором вопросе благоприятным исходом
является размещение длины 5 из элементов мно- 13,13,13,13 52!
жества {1, 2, 3, 4, 5, 6}. По формуле (12.1.3) таких C52 = .
(13!)4
последовательностей имеется
6! 1. В первом вопросе число благоприятных ис-
A56 = = 6!. ходов можно посчитать так:
(6 − 5)!
Вероятность, что выпадет такое распределение — сначала раздаем тузы по 4 игрокам, всего ва-
риантов
6! 5!
P = = 4. A44 = 4!,
65 6
3. В третьем вопросе число благоприятных — потом распределяем остальные 48 карт по 4
распределений выпавших костей можно посчи- игрокам, всего вариантов
тать с помощью правила комбинаторного умно-
жения. Выбрать последовательность длины 5, в 12,12,12,12 48!
которой ровно 3 одинаковых цифры из множе- C48 =
(12!)4
ства {1, 2, 3, 4, 5, 6} можно так:
— сначала выбираются 3 места, куда лягут эти В результате благоприятных исходов
одинаковые цифры; это то же самое, что вы-
48!
брать подмножество мощности 3 в множестве 4! · .
(12!)4
индексов мощности 5, поэтому таких вариан-
тов имеется
5! Вероятность такого распределения карт
C53 = ;
3! · 2!
48!
— после этого выбираем цифру, которая на эти 4! · (12!) 4 4! · 48! · 134 2 · 3 · 4 · 134
3 места ляжет; всего вариантов имеется P = 52!
= = =
4(13!)
52! 49 · 50 · 51 · 52
6 2 · 3 · 133 133
= = .
— затем на оставшиеся 3 места выбираем цифры 49 · 50 · 51 49 · 25 · 17
из оставшизся 4-х, причем с условием, чтобы
они не повторялись; это то же самое, что вы- 2. Во втором вопросе благоприятные исходы
брать размещение длины 2 в множестве мощ- считаются так:
ности 2, и по формуле (12.1.3) таких последо- — сначала выбираем игрока, который получит
вательностей имеется карты одной масти, таких вариантов имеется
4!
A24 = = 12. 4,
(4 − 2)!
§ 1. Комбинаторика 659
— затем выбираем масть, которую он получит, a) сначала считаем, что 1-й игрок получил все
таких вариантов имеется тоже 4 туза, а 2-й (и остальные) – ни одного; то-
гда оставшиеся 48 карт распределятся в про-
4 порции (9, 13, 13, 13), и число таких вариантов
— после этого распределяем оставшиеся 39 карт будет
9,13,13,13
по оставшимся 3 игрокам, это то же самое, C48 ,
что задать разбиенти типа 13, 13, 13 множе-
ства из 39 элементов, вариантов будет b) затем рассматриваем ситуацию, когда 1-й иг-
рок получил 3 туза, а 2-й – 1 туз; тогда остав-
13,13,13 39! шиеся 48 карт распределятся в пропорции
C39 = .
(13!)3 (10, 12, 13, 13), и число таких вариантов будет
По правилу комбинаторного умножения (теоре- 10,12,13,13
C48 ,
ма 12.1.2), всего благоприятных исходов будет
39! c) затем считаем, что 1-й игрок получил 2 ту-
4·4· .
(13!)3 за, и 2-й – 2 туза; тогда оставшиеся 48 карт
распределятся в пропорции (11, 11, 13, 13), и
Вероятность такого распределения карт число таких вариантов будет
39!
4·4· (13!)3 42 · 39! · 13 11,11,13,13
P = 52!
= . C48 ,
(13!)4
52!
n−1 m (n + m − 1)!
card Mn [m] = Cm+n−1 = Cm+n−1 = (12.1.12)
m! · (n − 1)!
Заметим, что каждая такая последовательность порождает некоторый мультииндекс k : {1, ..., n} →
Z+ объема m по такому правилу:
1) k1 – число единиц в ε до первого нуля,
2) k2 – число единиц в ε между первым и вторым нулями,
...)
i) ki – число единиц в ε между i − 1-м и i-м нулями,
...)
n) kn – число единиц в ε после последнего нуля.
Более того, это правило устанавливает биекцию между мультииндексами k : {1, ..., n} → Z+
объема m и последовательностями ε ∈ E. Поэтому количество таких мультииндексов равно чилу
элементов в E. А задать последовательность в E – то же самое, что описать куда поставить n − 1
нулей в строке из m + n − 1 элементов. То есть выбрать подмножество мощности n − 1 в множестве
n−1
мощности m + n − 1. По теореме 12.1.5 таких подмножеств имеется Cm+n−1 .
3) никакие две книги не будут из одного разде- 2. Во второй ситуации благоприятным исхо-
ла? дом является любая выборка (k1 , k2 , ..., kn ), у ко-
торой первый элемент нулевой, k1 = 0. Задать
⋄ 12.1.18. m одинаковых шаров случайно рас- такую выборку – то же самое, что задать остав-
кладываются по n урнам. Найти вероятность, шиеся элементы (k , ..., k ) (с условием, что их
2 n
что сумма будет равна m). Это то же самое, что за-
1) все шары лягут в 1-ю урну, дать выборку из n − 1 элементов объемом m.
2) в 1-у урну не попадет ни одного шара, По формуле (12.1.12) таких выборок имеется
n−2
Cm+n−2 . Вероятность такого события равна
3) все шары лягут в какую-то одну урну?
n−2
Здесь разложить шары по урнам – то же са- Cm+n−2
мое, что задать выборку из n элементов объемом P = n−1 .
Cm+n−1
m. По формуле (12.1.12) таких выборок имеется
n−1
Cm+n−1 . 3. В третьей ситуации благоприятных исхо-
1. В первой ситуации благоприятный исход дов будет n, потому что выбрать благоприятный
имеется один: (m, 0, ..., 0). Поэтому вероятность исход - то же самое, что выбрать урну, куда по-
этого события равна падут все шары. В результате вероятность будет
1 n
P = n−1 . P = n−1 .
Cm+n−1 Cm+n−1
⋄ 12.1.19. В примере 12.1.16 предположим, что 12.1.6 (или по теореме 12.1.8) C84,3,1 = 4!·3!·1!
8!
.
выборка пирожных была такой: (4, 3, 1) (то есть 4
одного вида, 3 другого и еще 1 третьего). Сколь- ⊲ 12.1.20. Сколько разных слов можно полу-
кими способами их можно распределить между чить перестановками слов
8 людьми за столом?
1) “мама”,
Здесь распределить пирожные между людь-
ми – то же самое, что задать разбиение людей 2) “математика”,
типа (4, 3, 1). Таких разбиений будет по теореме 3) “комбинаторика”?
(b) Перестановки
• Перестановкой длины n ∈ N называется произвольное биективное отображение началь-
ного интервала {1, ..., n} натурального ряда в себя:
Число перестановок.
Теорема 12.1.9. Число всех перестановок длины n равно n!:
card Sn = n! (12.1.15)
Доказательство. Каждую перестановку σ : {1, ..., n} → {1, ..., n} можно представлять себе как
размещение длины n в множестве мощности n. По формуле (12.1.3) число таких размещений будет
равно
n!
Ann = = n!.
(n − n)!
Пусть τ : {1, ..., m} → {1, ..., n} – произвольное отображение. Условимся говорить, что переста-
новка σ : {1, ..., m} → {1, ..., m} не меняет отображение τ , если
τ ◦ σ = τ.
Теорема 12.1.10. Число перестановок σ : {1, ..., m} → {1, ..., m} не меняющих отображение τ :
{1, ..., m} → {1, ..., n} равно
n
Y
card{σ ∈ Sm : τ ◦ σ = τ } = card τ −1 (i)!. (12.1.16)
i=1
Циклы. Говорят, что перестановка σ ∈ Sn оставляет неподвижным элемент k множества {1, ..., n},
если
σ(k) = k.
В противном случае, если
σ(k) 6= k,
говорят, что перестановка σ ∈ Sn сдвигает элемент k.
Говорят, что перестановка σ ∈ Sn связывает два элемента k и l множества {1, ..., n}, если для
некоторого m ∈ Z
σ m (k) = l.
Циклом или циклической перестановкой длины n ∈ N называется всякая перестановка σ ∈ Sn ,
которая связывает любые два сдвигаемых ею элемента k, l ∈ {1, ..., n}:
σ(k) 6= k & σ(l) 6= l =⇒ ∃m ∈ Z σ m (k) = l.
Всякая последовательность попарно различных элементов {a1 , ..., ar } множества {1, ..., n} опре-
деляет цикл, обозначаемый символом (a1 a2 ... ar ), по формуле
k, k∈/ {a1 , ..., ar }
(a1 a2 ... ar )(k) = ai+1 , k = ai , i < r . (12.1.20)
a1 , k = ar
(отличие от записи (12.1.14) в том, что здесь элементы строки ai разделяются пробелами, а не
запятыми).
Теорема 12.1.11. Всякая перестановка σ ∈ Sn представима в виде композиции некоторого числа
циклов.
Доказательство. Для любых двух элементов k и l множества {1, ..., n} условимся писать k ∼ l
если перестановка σ связывает эти элементы. Нетрудно видеть, что отношение ∼ является отно-
шением эквивалентности на {1, ..., n}. Поэтому оно разбивает {1, ..., n} на классы эквивалентности.
Обозначим их I1 , ..., Ip . Для каждого q = 1, ..., p положим
(
σ(k), k ∈ Iq
τq (k) =
k, k∈/ Iq
Ip Ip−1
6=
6=
Iq Iq
∈
(τ1 ◦ ... ◦ τq ◦ ... ◦ τp )( k ) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τp−1 )( k ) = ... = (τ1 ◦ ... ◦ τq )(k) =
= (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−1 )(σ(k)) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−2 )(σ(k)) = τ1 (σ(k)) = σ(k)
∋
Iq Iq Iq
6=
6=
6=
Iq−1 Iq−2 I1
(мы здесь для наглядности считаем, что 2 < q < p − 1). То есть композиция циклов τq совпадает с
σ:
τ1 ◦ ... ◦ τp = σ
(при этом можно заметить, что последовательность перемножения циклов τq здесь не важна, при
любой их перестановке результатом все равно будет σ).
Транспозиции.
• Транспозицией называется цикл, сдвигающий ровно два элемента, то есть перестановка,
меняющая местами два числа i 6= j, а остальные оставляющая на месте:
k, k ∈/ {i, j}
(i j)(k) = j, k = i . (12.1.21)
i, k = j
664 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
(a b) ◦ (a c) = (a c) ◦ (b c) (12.1.22)
π = τm ◦ ... ◦ τ1 (12.1.23)
(в частном случае, когда σ = e это утверждение следует понимать так, что в правой части
стоит пустое множество транспозиций).
Доказательство. По теореме 12.1.11 достаточно доказать это утверждение для циклов. Пусть σ –
какой-нибудь цикл. Выберем какой-нибудь элемент a1 ∈ {1, ..., n}, который σ сдвигает. Положим
затем
ai+1 = σ(ai ),
для всех i, меньших общего числа r сдвигаемых элементов. Тогда
затем для a2
(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a3 ) = a3 ,
затем для a3
(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a1 ) = a4 ,
(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(ar ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(ar ) = (a1 ar )(ar ) = a1 .
Остается заметить, что все остальные элементы, то есть не лежащие в множестве {a1 , ..., ar } явля-
ются неподвижными как для σ, так и для всех транспозиций (a1 ai ).
Теорема 12.1.13. Всякая транспозиция является композицией некоторого набора транспозиций
соседних чисел, а именно
π = τp ◦ ... ◦ τ1 (12.1.25)
число
sgn π = (−1)p (12.1.26)
не зависит от выбора разложения (12.1.25).
• Число sgn π в (12.1.26) называется знаком перестановки π ∈ Sn . Если sgn π = 1, то π
называется четной перестановкой, а если sgn π = −1, то нечетной.
§ 1. Комбинаторика 665
σ ◦ τ = σ′ ◦ τ ′ , σ ′ (i) 6= i, τ ′ (i) = i.
σ ◦ τ = (k l) ◦ (i j) = (i j) ◦ (k l),
— σ = (i k), где k ∈
/ {i, j}, и в этом случае
σ ◦ τ = (i k) ◦ (i j) = (12.1.22) = (i j) ◦ (j k),
— σ = (j k), где k ∈
/ {i, j}, и в этом случае
σ ◦ τ = (j k) ◦ (i j) = (12.1.22) = (i k) ◦ (j k).
Доказательство. Заметим сразу, что p не может быть единицей, потому что иначе мы получили
бы, что тождественная перестановка сама является транспозицией:
e = τ.
Предположим далее, что мы доказали, что p не может быть нечетным числом в интервале между
1 и некоторым P . Пусть p = P + 2 (то есть нечетное число, следующее за P ). Если в разложении
(12.1.27) какие-то две рядом стоящие транспозиции одинаковы
τi+1 = τi ,
то в композиции они дают e, и поэтому на них можно сократить, и мы опять получим равенство
(12.1.27), в котором p = P , и это равенство будет невозможно по предположению индукции.
Поэтому можно считать, что никакие две рядом стоящие транспозиции в (12.1.27) неодинаковы.
Выберем теперь элемент i, сдвигаемый транспозицией τ1 . По лемме 12.1.15 существуют транспози-
ции τ2′ и τ1′ такие, что
τ2 ◦ τ1 = τ2′ ◦ τ1′ , τ2′ (i) 6= i, τ1′ (i) = i.
После этого опять по лемме 12.1.15 существуют транспозиции τ3′ и τ2′′ такие, что
И так далее. В конце этой процедуры мы получим (вернув в обозначениях где нужно один штрих
вместо двух) равенство
e = τp′ ◦ ... ◦ τ1′
в котором последняя перестановка τp′ сдвигает элемент i, а первые p − 1 перестановок τ1′ , ..., τp−1
′
π = τp ◦ ... ◦ τ1 = σq ◦ ... ◦ σ1
Тогда
e = π ◦ π −1 = (τp ◦ ... ◦ τ1 ) ◦ (σq ◦ ... ◦ σ1 )−1 = τp ◦ ... ◦ τ1 ◦ σ1−1 ◦ ... ◦ σq−1 = τp ◦ ... ◦ τ1 ◦ σ1 ◦ ... ◦ σq
По лемме 12.1.16 число сомножителей здесь p + q должно быть четно. Поэтому либо оба числа p и
q четны, либо оба они нечетны. В каждом из вариантов
(−1)p = (−1)q .
Свойства перестановок:
10 . Тождественная перестановка четна:
sgn e = 1 (12.1.28)
⋄ 12.1.21. Индуцированный порядок на зательно задавать таким способом (то есть ин-
множестве чисел. Если N – подмножество в дуцируя его из R). Например, если выбрать про-
множестве чисел R, то на нем можно рассмот- извольную инъективную последовательность чи-
реть линейный порядок, индуцированный из R, сел x1 , ..., xk (то есть размещение, определенное
то есть такой, при котором неравенство a b вы- на с.654), то в ней порядок можно определить
полняется, если оно верно, как неравенство чисел как порядок индексов:
(в линейно упорядочнном множестве R):
xi xj ⇐⇒ i 6 j.
ab ⇐⇒ a 6 b.
⋄ 12.1.22. Порядок, заданный нумераци- (Понятно, что это необязательно то же самое,
ей. Но порядок на числовом множестве необя- что xi 6 xj .)
Ниже из линейно упорядоченных множеств нас будут интересовать только конечные. Справед-
лива
Теорема 12.1.17. Всякий линейный порядок на конечном множестве N задается некоторой ну-
мерацией элементов этого множества: существует биективное отображение
τN : {1, ..., n} → N
где n = card N – число элементов N , такое, что
∀i, j ∈ {1, ..., n} τN (i) τN (j) ⇐⇒ i6j . (12.1.31)
τN τN ′
в которой {1, ..., n}′ обозначает множество {1, ..., n} с новым порядком 6′ , а τ ′ – нумерация его
элементов по возрастанию. Здесь ι – тождественное отображение из (12.1.32), поэтому мы получаем,
что в этом случае перестановка σ, соответствующая смене порядка, просто совпадает с нумерацией
τ ′:
σ = τ ′.
• Если K и L – два непересекающихся линейно упорядоченных конечных множества (с
порядками K и L ), то на их объединении K ⊔ L можно задать линейный порядок ,
положив a b в случае, если выполняется одно из трех:
— либо a, b ∈ K и a K b,
— либо a, b ∈ L и a L b,
— либо a ∈ K и b ∈ L.
Множество K ⊔ L с заданным таким образом линейным порядком называется склейкой
линейнго упорядоченных множеств K и L и обозначается K ⊳ L.
Понятно, что операция склеивания не коммутативна
K ⊳ L 6= L ⊳ K,
но ассоциативна
(K ⊳ L) ⊳ M = K ⊳ (L ⊳ M ).
• Рассмотрим частную ситуацию, когда K и L образуют разбиение отрезка натурального
ряда:
K ⊔ L = {1, ..., n}, n ∈ N.
Множества K и L мы будем считать линейно упорядоченными (с линейным порядком,
индуцированным из N). Их склейка K ⊳ L представляет собой то же самое множество
K ⊔ L = {1, ..., n}, только с новым линейным порядком, поэтому согласно замечанию
12.1.23, переход от K ⊔ L = {1, ..., n} к K ⊳ L можно себе представлять как перестановку σ
элементов {1, ..., n}, которая совпадает с отображением τK⊳L нумерации по возрастанию
элементов множества τK⊳L , потому что диаграмма (12.1.34) принимает здесь вид
ι
{1, ..., n} = K ⊔ L / K ⊳L
O (12.1.35)
O
ι τK⊳L
σ(1) < σ(2) < ... < σ(k), σ(k + 1) < σ(k + 2) < ... < σ(k + l) (12.1.36)
§ 1. Комбинаторика 669
Наоборот, если какая-то перестановка σ ∈ Sk+l удовлетворяет условиям (12.1.36), то она явля-
ется отображением склейки σ = τK⊳L для множеств (12.1.37).
Предложение 12.1.20. Пусть {1, ..., k + l} = K ⊔ L, k = card K, l = card L и для некоторого
i ∈ {1, ..., k + l} множество K содержит ровно одно из чисел i и i + 1,
i∈K & i+1∈L ∨ i+1∈K & i∈L .
K ′ = (i i + 1)(K), L′ = (i i + 1)(L).
θ ◦ σ = σ′ ,
⇓
θ σ(1) < ... < θ σ(i − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)
′
И, во-вторых,
i∈K
⇓
′
σ(k + 1) < ... < σ(j − 1) < i
|{z} < i + 1 = σ(j ′ ) < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z }
k k k k k
θ(i + 1)
θ σ(k + 1) θ σ(j ′ − 1) θ σ(j ′ + 1) θ σ(k + l)
k
θ σ(j ′ )
⇓
θ σ(k + 1) < ... < θ σ(j ′ − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)
2) Если же i ∈
/ K и i + 1 ∈ K, то, во-первых,
i∈
/K
⇓
′
σ(1) < ... < σ(i − 1) < i
|{z} < i + 1 = σ(i′ ) < σ(i′ + 1) < ... < σ(k)
|{z} | {z } | {z } |{z}
k k k k k
θ(i + 1)
θ σ(1) θ σ(i′ − 1) θ σ(i′ + 1) θ σ(k)
k
θ σ(i′ )
⇓
670 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
θ σ(1) < ... < θ σ(i′ − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)
И, во-вторых,
i+1∈K
⇓
′ ′
σ(k + 1) < ... < σ(j − 1) < σ(j ) = i 6 i + 1 < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z } | {z }
k k k k k
θ σ(k + 1) θ σ(j ′ − 1) θ(i) θ σ(j ′ + 1) θ σ(k + l)
k
θ σ(j ′ )
⇓
θ σ(k + 1) < ... < θ σ(j − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)
′
Свойства склейки:
10 . Если {1, ..., n} = K ⊔ L, то
sgn(τK⊳L ) = (−1)kl · sgn(τK⊳L ) (12.1.39)
где k = card K и l = card L.
0
2 . Если {1, ..., n} = K ⊔ L ⊔ M , то
sgn(τK⊳L ) · sgn(τ(K⊔L)⊳M ) = sgn(τK⊳L⊳M ) (12.1.40)
Доказательство. 1. Пусть {1, ..., n} = K ⊔ L. Заметим, что отображения склейки τK⊳L и τL⊳K
связаны между собой перестановкой υ, меняющей местами отрезки {1, ..., k} и {k + 1, ..., k + l}:
ι ι
L ⊳O K o K ⊔O L /K ⊳L
O
τL⊳K ι τK⊳L
τL⊳K τK⊳L
{1, ..., n} j / {1, ..., n} o {1, ..., n}
Поэтому
−1
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(τL⊳K ◦ τK⊳L ) = sgn(υ).
А последнюю величину легко вычислить: чтобы переставить множества A = {1, ..., k} и B = {k +
1, ..., k + l}, нужно сначала последовательно передвигать первый элемент b1 = k + 1 множества B
влево, так, чтобы он встал перед A, на это уйдет ровно k транспозиций соседних элементов (по
числу элементов множества A), затем точно так же нужно передвинуть второй элемент b2 = k + 2
множества B, так, чтобы он встал между b1 и множеством A, и на это опять уйдет k транспозиций.
И так далее, и в конце концов мы передвинем l элементов множества B, и на каждую операцию
уйдет k транспозиций. Значит, всего понадобится kl транспозиций, и мы получаем
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(υ) = (−1)kl .
2. Пусть {1, ..., n} = K ⊔ L ⊔ M . Построение склейки (K ⊳ L) ⊳ M можно представить как после-
довательность трех действий:
1) сначала строится склейка (K⊔L)⊳M , это эквивалентно построению отображения τ(K⊔L)⊳M :
{1, ..., n} → {1, ..., n}, которое первые k + l индексов {1, ..., k + l} тратит на нумерацию
элементов множества K ⊔ L, а оставшиеся m индексов {k + l + 1, ..., n} – на нумерацию
элементов M ;
2) после того, как это сделано, упорядоченное множество K ⊔ L оказывается занумеровано
индексами {1, ..., k + l}; обозначим
−1 −1
K ′ = τ(K⊔L)⊳M (K), L′ = τ(K⊔L)⊳M (L).
и построим новую склейку, K” ⊳ L′ , или, иными словами, отображение τK ′ ⊳L′ : {1, ..., k +
l} → {1, ..., k + l}, которое первые k индексов трати на нумерацию элементов K ′ , а остав-
шиеся l индексов на нумерацию L′ ;
§ 2. Векторные пространства 671
и это будет перестановка σ : {1, ..., n} → {1, ..., n}, композиция которой с τ(K⊔L)⊳M дает
τ(K⊳L)⊳M :
τ(K⊳L)⊳M = τ(K⊔L)⊳M ◦ σ. (12.1.41)
Наглядно это можно изобразить диаграммой
ι ι
K ⊔ LO ⊔ M / (K ⊔ L) ⊳ M / (K ⊳ L) ⊳ M
O O
ι τ(K⊔L)⊳M τ(K⊳L)⊳M
τ(K⊔L)⊳M σ
{1, ..., n} ol {1, ..., n} o {1, ..., n}
τ(K⊳L)⊳M
Из (12.1.41) мы получаем
§2 Векторные пространства
Важное свойство векторных величин (из которых затем, при дополнительном предположении ко-
нечномерности, формально следуют все остальные их свойства) заключается в том, что их можно
складывать друг с другом и умножать на число. В математике эти свойства формализуются кон-
струкцией векторного пространства, и в этом параграфе мы объясним, что это такое.
(x + y) + z = x + (y + z) (12.2.43)
x + 0 = x, x∈X (12.2.44)
x + (−x) = 0 (12.2.45)
(λ · µ) · x = λ · (µ · x) (12.2.46)
λ · (x + y) = λ · x + λ · y (12.2.48)
∃λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi = λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,
∀λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi 6= λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,
Доказательство. 1. Если какой-то вектор в системе равен нулю, xi = 0, то его можно представить
как тривиальную линейную комбинацию остальных векторов
λ1 · x1 + ... + λk · xk = 0 (12.2.53)
λ1 = ... = λk = 0
Доказательство. 1. Пусть равенство (12.2.53) выполняется для набора коэффициентов, среди ко-
торых есть какой-то ненулевой:
λi 6= 0.
Тогда можно выразить слагаемое λi · xi через все остальные
λ1 λi−1 λi+1 λk
xi = − · x1 − ... − · xi−1 − · xi+1 − ... − · xk .
λi λi λi λi
Мы получаем, что система x1 , ..., xk линейно зависима.
2. Наоборот, если система x1 , ..., xk линейно зависима, то есть какой-то вектор выражается через
остальные,
xi = λ1 · x1 + ... + λi−1 · xi−1 + λi+1 · xi+1 + ... + λk · xk ,
то перебросив все в левую часть мы получим равенство (12.2.53)
Базис и размерность.
• Система векторов b1 , ..., bn векторного пространства X называется (конечным) базисом
этого пространства, если
1) она линейно независима, и
2) любой вектор x ∈ X представим в виде некоторой линейной комбинации векто-
ров b1 , ..., bn :
∃β 1 , ..., β n ∈ R x = β 1 · b1 + ... + β n · bn , (12.2.54)
(это свойство называется линейной полнотой системы b1 , ..., bn ).
образует базис. Действительно, во-первых, при А, во-вторых, всякий вектор x = (x1 , ..., xn ) ∈ Rn
674 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
β i = xi . (
i 0, i 6= j
(e )j = . (12.2.56)
• Базис {e1 , ..., en }, определенный формулой 1, i = j
x = β 1 · b1 + ... + β n · bn = λ1 · b1 + ... + λn · bn ,
где
∃k = 1, ..., n β k 6= λk .
Тогда
(β 1 − λ1 ) · b1 + ... + (β n − λn ) · bn = β 1 · b1 + ... + β n · bn − λ1 · b1 + ... + λn · bn = x − x = 0
m 6 n.
m > n.
Покажем, что тогда векторы a1 , ..., an (то есть первые n векторов в последовательности a1 , ..., am )
образуют базис пространства X. Это делается индукцией.
1. Заметим сначала, что, перенумеровав, если нужно, векторы b1 , b2 , ..., bn , можно добиться, что-
бы система a1 , b2 , ..., bn (получающаяся заменой b1 на a1 ) была базисом в X.
Поскольку b1 , ..., bn – базис, вектор a1 выражается как линейная комбинация векторов b1 , ..., bn :
a1 = λ1 · b1 + ... + λn · bn ,
для некоторых λ1 , ..., λn ∈ R. При этом по свойству 1◦ на с.672 вектор a1 (будучи элементом линейно
независимой системы) не может быть нулевым:
0 6= a1 = λ1 · b1 + ... + λn · bn .
Поэтому какой-то из коэффициентов λi тоже должен быть ненулевым. Перенумеровав, если нужно
векторы b1 , ..., bn (вместе с коэффициентами λ1 , ..., λn ), мы можем считать, что ненулевым коэффи-
циентом в этой комбинации будет λ1 :
λ1 6= 0
Тогда мы получим, что b1 выражается через векторы a1 , b2 , ..., bn :
λ1 ·b1 + λ2 · b2 + ... + λn · bn ,
a1 = |{z} (12.2.57)
6=
0
§ 2. Векторные пространства 675
⇓
1 λ2 λn
1
· a1 = b1 + 1 · b2 + ... + 1 · bn ,
λ λ λ
⇓
1 λ2 λn
· a −
b1 =
1 · b 2 − ... − · bn ,
λ1 λ1 λ1
Отсюда следует, что вообще любой вектор x ∈ X выражается через векторы a1 , b2 , ..., bn :
x = β 1 · b1 + β 2 · b2 + ... + β n · bn ,
1 λ2 λn
x = β1 · 1
· a1 − 1 · b2 − ... − 1 · bn + β 2 · b2 + ... + β n · bn =
λ λ λ
β1 β 1 · λ2 β 1 · λn
= 1 · a1 + β 2 − · b 2 + ... + β 2
− · bn .
λ λ1 λ1
Покажем теперь, что система a1 , b2 , ..., bn должна быть линейно независима. Действительно,
пусть для каких то γ 1 , ..., γ n выполняется равенство
γ 1 · a1 + γ 2 · b2 + ... + γ n · bn = 0,
γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1
6=
⇓
γ2 γn
a1 = 1
· b2 + ... + 1 · bn
γ γ
⇓ (вычитаем из (12.2.57))
γ2 γn
λ1 ·b1 + λ2 − 1 · b2 + ... + λn − 1 · bn ,
0 = |{z}
γ γ
6=
означающая, что система b1 , ..., bn линейно зависима (чего не может быть, поскольку b1 , ..., bn –
базис).
А из γ 1 = 0 затем следует, что все остальные γ i тоже равны нулю:
γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1
=
⇓
γ 2 · b2 + ... + γ n · bn = 0,
⇓
γ = ... = γ n = 0,
2
является базисом в X. Покажем теперь, что перенумеровав если нужно векторы br+1 , ..., bn , можно
добиться, чтобы система
a1 , ..., ar , ar+1 , br+2 , ..., bn
была базисом в X.
Выразим ar+1 через базис a1 , ..., ar , br+1 , ..., bn :
Заметим, что в этой линейной комбинации какой-то из коэффициентов λr+1 , ..., λn должен быть
ненулевым, потому что иначе мы получили бы, что ar+1 выражается через a1 , ..., ar
ar+1 = λ1 · a1 + ... + λr · ar ,
(то есть получилось бы, что система a1 , ..., am должна быть линейно зависима, а это невозможно,
потому что она – базис). Перенумеровав, если нужно векторы br+1 , ..., bn (вместе с коэффициентами
λr+1 , ..., λn ), мы можем считать, что ненулевым коэффициентом в этой комбинации будет λr+1 :
λr+1 6= 0
Теперь теми же рассуждениями, что в пункте 1, показываем, что система a1 , ..., ar , ar+1 , br+2 , ..., bn
– базис в X.
Описанная индукция доказывает, что подходящей перенумерацией векторов b1 , ..., bn , а затем по-
следовательной заменой bi на ai , мы получим систему базисов пространства X, в которой последним
будет базис a1 , ..., an :
b1 , b2 , b3 , ..., bn
7→
a1 , b2 , b3 , ..., bn
7→
a1 , a2 , b3 , ..., bn
7→
...
7→
a1 , a2 , a3 , ..., an .
Отсюда следует, в частности, что вектор am (как любой другой вектор пространства X) должен
выражаться через векторы базиса a1 , ..., an :
am = λ1 · a1 + ... + λn · an
То есть система a1 , ..., an , ..., am должна быть линейно зависима. Это противоречие означает, что
наше исходное предположение, что m > n было неверно.
Теорема 12.2.4. Любые два базиса a1 , ..., am и b1 , ..., bn векторного пространства X (если они
существуют) имеют одинаковую длину:
m = n.
ak+1 ∈
/ span{a1 , ..., ak }.
то, во-первых, должно быть λk+1 = 0, потому что иначе мы получили бы, что ak+1 линейно выра-
жается через a1 , ..., ak :
λ1 · a1 + ... + λk · ak + |λk+1
{z } ·ak+1 = 0,
6=
0
λ1 λk
ak+1 = − · a 1 − ... − · ak .
λk+1 λk+1
А, во-вторых, из λk+1 = 0 следует равенство
λ1 · a1 + ... + λk · ak = 0,
которое может выполняться только если все коэффициенты λ1 , ..., λk равны нулю (потому что си-
стема a1 , ..., ak линейно независима):
λ1 = ... = λk = 0.
m 6 dim X. (12.2.58)
и эта система тогда и только тогда является базисом, когда ее длина равна размерности этого
пространства:
m = dim X. (12.2.59)
Теорема 12.2.7. Если пространство X конечномерно, то в нем всякая линейно независимая си-
стема векторов a1 , ..., am дополняется до некоторого базиса a1 , ..., am , am+1 , ..., an (где n = dim X).
678 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
Подпространства.
• Подмножество Y в векторном пространстве X называется подпространством в X, если
оно замкнуто относительно операций взятия суммы и умножения на скаляр, то есть
∀x, y ∈ Y x+y ∈Y
и
∀y ∈ Y ∀λ ∈ R λ·y ∈Y
Свойства подпространств:
1◦ . В конечномерном векторном пространстве X любое подпространство Y тоже конеч-
номерно, причем
dim Y 6 dim X, (12.2.60)
и равенство dim Y = dim X достигается только в случае, если Y = X.
◦
2 . Если Y и Z – два подпространства в векторном пространстве X, то
(a) пересечение Y ∩ Z подпространств Y и Z является подпространством в X,
(b) множество
Y + Z = {y + z; y ∈ Y, z ∈ Z}
всех векторов вида y + z, где y ∈ Y и z ∈ Z образует подпространство в X
(называемое алгебраической суммой подпространств Y и Z),
(c) если вдобавок X конечномерно, то
m 6 dim X
Если рассмотреть эту последовательность как систему векторов в пространстве Y , то она будет
линейно независима, и поэтому по теореме 12.2.7 ее можно дополнить до некоторого базиса в Y :
a1 , ..., ak , y1 , ..., ym ∈ Y.
С другой стороны, последовательность a1 , ..., ak можно считать системой векторов в Z, и там она
тоже будет линейно независимой. Поэтому по теореме 12.2.7 ее можно дополнить до некоторого
базиса в Z:
a1 , ..., ak , z1 , ..., zn ∈ Z.
Теперь покажем, что система векторов a1 , ..., ak , y1 , ..., ym , z1 , ..., zn будет базисом в Y + Z.
1. Сначала убедимся, что эта система линейно независима. Пусть
Обозначим
z = γ 1 · z1 + ... + γ n · zn .
Тогда с одной стороны, поскольку z1 , ..., zn ∈ Z,
z ∈ Z.
А, с другой стороны,
z = −α1 · a1 − ... − αk · ak − β 1 · y1 − ... − β m · ym
где a1 , ..., ak , y1 , ..., ym ∈ Y , и поэтому
z ∈ Y.
Как следствие,
z ∈ Y ∩ Z,
и поскольку a1 , ..., ak – базис в Y ∩ Z, должны существовать числа λ1 , ..., λk такие, что
z = λ1 · a1 + ... + λk · ak .
γ 1 · z1 + ... + γ n · zn = z = λ1 · a1 + ... + λk · ak .
⇓
γ 1 · z1 + ... + γ n · zn − λ1 · a1 − ... − λk · ak = 0.
⇓ (a1 , ..., ak , z1 , ..., zn – базис в Z )
γ 1 = ... = γ n = λ1 = ... = λk = 0.
⇓ i
подставляем γ = 0 в (12.2.62)
⇓
α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym = 0
⇓ (a1 , ..., ak , y1 , ..., ym – базис в Y )
α1 = ... = αk = β 1 = ... = β m = 0
Таким образом, равенство (12.2.62) влечет равенство нулю всех коэффициентов
=
– базис в Y ∩ Z – базис в Y
z }| { z }| {
dim(Y ∩ Z) + dim(Y + Z) = 2k + m + n = dim Y + dim
| {z Z}
| {z }
a a1 , ..., ak , z1 , ..., zn
=
1 , ..., ak , y1 , ..., ym , – базис в Z
=
z1 , ..., zn
– базис в Y + Z k+n
k+m+n
(
1 0, i 6= j
x 1, i = j
f (x) = α · x = (α1 , ..., αn ) · ... =
xn И наоборот, если f : Rn → R – линейный функ-
Xn ционал, то из (12.2.65)
= αi · xi , x ∈ Rn (12.2.64)
αi = f (ei )
i=1
Столбец коэффициентов.
• Пусть X – векторное пространство и (b1 , ..., bn ) – его базис. Коэффициенты β i в раз-
ложении (12.2.54) вектора x по заданному базису (b1 , ..., bn ) мы условимся обозначать
h ii i
x
специальным символом b1 ,...,bn
или xb :
n h ii
X n
X i
x x
x= · bi = · bi (12.2.68)
i=1
b i=1
b1 , ..., bn
i h x ii
По теореме 12.2.2 числа xb = b1 ,...,bn
определяются однозначно. Их удобно представ-
лять как столбец (соответствующий произвольному вектору x при фиксированном базисе
b = (b1 , ..., bn )):
x 1
h x i xb 2
= b
...
.
b
x n
b
1◦ . Однородность:
hxi
λ·x
=λ· (12.2.69)
b b
2◦ . Аддитивность: h i h i
x+y x y
= + (12.2.70)
b b b
Мы получаем, что один и тот же вектор λ · x двумя способами разложен по базису b1 , ..., bn :
n
X i n
X h x ii
λ·x
· bi = λ · x = λ· · bi
i=1
b i=1
b
2. Равенство (12.2.70) доказывается так же: сначала подставив в (12.2.68) вместо x вектор x + y,
мы получим
Xn i
x+y
x+y = · bi
i=1
b
Затем, сложив (12.2.68) с тем же равенством, только выписанном для вектора y, мы получим
n h ii
X n h ii
X n h ii
X h y ii n h i
X h y ii
x y x x
x+y = · bi + · bi = + · bi = + · bi
i=1
b i=1
b i=1
b b i=1
b b
| {z } | {z }
x y
В результате один и тот же вектор x + y оказывается двумя способами разложен по базису b1 , ..., bn :
n
X i n h i
X h y ii
x+y x
· bi = x + y = + · bi
i=1
b i=1
b b
Теорема 12.2.10. Если a = (a1 , ..., an ) – базис в векторном пространстве X, то линейные функ-
i
ционалы a1 : X → R определенные формулой
i h x ii
1
(x) := , x ∈ X, i = 1, ..., n. (12.2.74)
a a
Im A = {y ∈ Y : ∃x ∈ X Ax = y} (12.2.79)
! 12.2.7. Понятно, что оператор A : X → Y то- Несколько менее очевидно, что оператор A :
гда и только тогда будет сюръективным, когда X → Y тогда и только тогда будет инъектив-
его образ совпадает с Y : ным, когда его ядро состоит из одного нуля:
Im A = Y Ker A = {0}.
Доказательство. Здесь достаточно доказать эквивалентность условий (i) и (ii). Это делается сле-
дующей цепочкой:
A сюръективен
Im A = Y
m свойство 1◦ на с.678
m (12.2.80)
dim Ker A = 0
Ker A = {0}
A инъективен
В частности,
dim End(X) = (dim X)2 (12.2.85)
§ 2. Векторные пространства 685
B · A = IX , A · B = IY .
• Для всякого векторного пространства X его Заметим, что для всякого базиса a =
вторым сопряженным пространством X ∗∗ (a1 , ..., an ) в векторном пространстве X базис 11 ,
a
называется пространство сопряженное к про- сопряженный к сопряженному базису a1 к a пред-
странству X ∗ : ставляет собой просто образ базиса a под дей-
ствием отображения ιX :
X ∗∗ := (X ∗ )∗
i
1
Естественным отображением из X в X на- ∗∗ 1 := ιX (ai ), i = 1, ..., n. (12.2.93)
a
зывается отображение ιX : X → X ∗∗ , дей-
ствующее по формуле Теорема 12.2.16. Для всякого конечномерно-
го векторного пространства X естественное
ιX (x)(f ) := f (x), x ∈ X, f ∈ X ∗. отображение ιX : X → X ∗∗ является изомор-
(12.2.92) физмом.
A∗ (f ) = f ◦ A, f ∈ Y ∗, (12.2.94)
X = Y ⊕ Z,
Y ∩ Z = {0}
X =Y +Z
Свойства проекторов:
1◦ . Если P – проектор в X, то I − P – тоже проектор в X, причем
X = Y ⊕ Z,
(I − P )2 = (I − P ) · (I − P ) = |{z}
I 2 − |P{z· I} − I| {z P 2 = I − P − P + P = I − P.
· P} + |{z}
=
=
I P P P
а, во-вторых,
Вместе они дают равенство Ker(I −P ) = Im P (верное для любого проектора P ). Если в нем заменить
проектор P на проектор I − Q, мы получим равенство Ker Q = Im(I − Q) (верное для любого
проектора Q), то есть второе равенство в (12.2.96).
2. Пусть P – проектор в X. Тогда, во-первых,
(
P (y) = 0
y ∈ Ker P ∩ Im P =⇒ =⇒ 0 = P (y) = P (P (x)) = P (x) = y,
∃x ∈ X : y = P (x)
X = Y ⊕ Z.
x=y+z
где y ∈ Y и z ∈ Z. Это в свою очередь можно переформулировать так: для любого вектора x ∈ X
существует единственный вектор z ∈ Z такой, что x − z ∈ Y . То есть, правило
∋
Z Z
А для любых x, x′ ∈ X
(12.2.97)
x − P (x) ∈ Y & x′ − P (x′ ) ∈ Y =⇒ x + x′ − P (x) + P (x′ ) ∈ Y =⇒
| {z } | {z } | {z }
∋
∋
Z Z Z
=⇒ P (x + x′ ) = P (x) + P (x′ ).
∋
Z
И, наконец, что Im P = Z:
(12.2.97)
z ∈ Im P ⇐⇒ ∃x ∈ X P (x) = z ⇐⇒ ∃x ∈ X x−z ∈Y ⇐⇒ z ∈ Z.
∋
Z
ϕ : X1 × · · · × Xk → Y
называется полилинейным, если оно линейно по каждому аргументу, то есть для любого
i = 1, ..., k и любых фиксированных векторов a1 ∈ X1 , ..., ai−1 ∈ Xi−1 , ai+1 ∈ Xi+1 , ..., ak ∈
Xk отображение
x ∈ Xi 7→ ϕ(a1 , ..., ai−1 , x, ai+1 , ..., an ) ∈ Y
является линейным оператором:
Полилинейные формы.
• В частном случае, когда Y = R, полилинейное отображение
ϕ : X1 × · · · × Xk → R
Теорема 12.2.18. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , и в соответствии
i j
с (12.2.74) a1 и 1b – сопряженные базисы в X ∗ и Y ∗ . Тогда билинейные формы
i j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
образуют базис в пространстве L(X, Y ) билинейных форм на X × Y . Разложение всякой билиней-
ной формы ϕ : X × Y → R по этому базису имеет вид
Xk X l i j
1 1
ϕ= ϕ(ai , bj ) · ⊠ (12.2.101)
i=1 j=1
a b
! 12.2.10. Этот результат очевидным образом обобщается на случай пространства L(X1 , ..., Xk ) с
произвольной последовательностью аргументов (X1 , ..., Xk ).
Доказательство. Сначала убедимся, что эта система линейно независима. Пусть для некоторых
скаляров λi,j выполняется равенство
k X
X l i j
1 1
λi,j · ⊠ = 0.
i=1 j=1
a b
Xk X l i j !
1 1
= ϕ(ai , bj ) · ⊠ (x, y)
i=1 j=1
a b
⋄ 12.2.11. Для любого числового семейства ет, что всякая билинейная форма α : Rn ×Rn → R
{αi,j ; i, j ∈ {1, ..., n}} ⊆ R формула имеет вид (12.2.102), где семейство чисел αi,j
X n определяется формулой
i j n
α(x, y) = αi,j · x · y , x, y ∈ R ,
i,j=1 αi,j = α(ei , ej ), (12.2.103)
(12.2.102)
очевидно, определяет билинейную форму α : в которой ei – стандартный базис в Rn , опреде-
Rn ×Rn → R. Наоборот, из теоремы 12.2.18 следу- ленный в (12.2.55).
потому что если a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , то в L(X, Y ) число элементов
в базисе i j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
равно k · l. В общем случае те же рассуждения опираются на замечание 12.2.10.
Тензоры.
• Тензором в последовательности конечномерных векторных пространств X1 , ..., Xk назы-
вается всякий линейный функционал
T : L(X1 , ..., Xk ) → R
Теорема 12.2.20. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y . Тогда тензоры
ai ⊗ b j ; i = 1, ..., k, j = 1, ..., l
1 i 1 j
Пусть в соответствии с (12.2.74) a и b – сопряженные базисы в X ∗ и Y ∗ . Для всякой пары
индексов (p, q) мы получим
p q p q p q (
1 1 1 1 1 1 0, (i, j) 6= (p, q)
ai ⊗ b j ⊠ = ⊠ (ai , bj ) = (ai ) · (bj ) = ,
a b a b a b 1, (i, j) = (p, q)
поэтому
k X
X l p q
1 1
0= λi,j · ai ⊗ bj ⊠ = λp,q .
i=1 j=1
a b
Xk X l i j !
1 1
= ai ⊗ bj (ϕ) · T ⊠
i=1 j=1
a b
ai ⊗ b j , i = 1, ..., k, j = 1, ..., l
образуют базис в пространстве L(X ∗ , Y ∗ ). При этом по уже доказанной формуле (12.2.109), при
отображении @ первый базис превращается во второй:
Теорема 12.2.23. Для всякого набора конечномерных векторных пространств X1 , ..., Xk , Y и вся-
кого полилинейного отображения ϕ : X1 ×...×Xk → Y найдется единственный линейный оператор
ϕ⊗ : X1 ⊗ ... ⊗ Xk → Y , замыкающий диаграмму
X1 × ... × Xk
♦♦ ❖❖❖
⊗ ♦♦♦♦ ❖❖❖
♦♦ ❖❖ϕ❖ .
♦♦♦ ❖❖❖
w♦♦ ❖❖❖
'
X1 ⊗ ... ⊗ Xk ❴ ❴ ❴ ❴ ❴ ❴ ❴ ⊗❴ ❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ
∗
Доказательство. Каждому функционалу f ∈ Y поставим в соответствие полилинейную форму
на X1 , ..., Xk по формуле
ψ(f ) = f ◦ ϕ.
У нас получился линейный оператор
ψ : Y ∗ → L(X1 , ..., Xk ).
§ 3. Матрицы и определители 693
ϕ⊗ = ι−1 ∗ ∗
Y ◦ ψ : L(X1 , ..., Xk ) → Y
ιY (ϕ⊗ (⊗(x1 , ..., xk )))(f ) = ψ ∗ (⊗(x1 , ..., xk ))(f ) = ψ ∗ (x1 ⊗...⊗xk )(f ) = (12.2.94) = (x1 ⊗...⊗xk )(ψ(f )) =
= (x1 ⊗...⊗xk )(f ◦ϕ) = (12.2.106) = (f ◦ϕ)(x1 , ..., xk ) = f (ϕ(x1 , ..., xk )) = (12.2.92) = ιY (ϕ(x1 , ..., xk ))(f )
ϕ⊗ ◦ ⊗ = ϕ.
§3 Матрицы и определители
(a) Матрицы
Напомним, что начальным интервалом натурального ряда N мы условились называть (см. опре-
деление на с.154) произвольное множество вида
{1, ..., n} = {k ∈ N : k 6 n}
Значение такой функции в точке (i, j) ∈ {1, ..., m}×{1, ..., n} удобно обозначать с помощью
индексов:
Mij := M (i, j)
а всю матрицу удобно изображать в виде таблицы, в которой нижний индекс обозначает
номер столбца, а верхний – номер строки:
1
M1 M21 ... Mm1
M12 M22 ... Mm2
M = ...
... ... ...
M1n M2n ... Mmn
Числа Mij в этой таблице (то есть значения функции M в точках (i, j)) называются эле-
ментами матрицы M , число m называется ее длиной, а число n – ее высотой.
• Множество всех матриц размера m × n (то есть длиной m и высотой n) мы будем обозна-
чать Rnm .
• Матрицы, у которых длина равна высоте, называются квадратными матрицами.
• Матрицы, у которых высота равна 1, можно отождествить со строками, которые мы
определили на с.650.
• Двойственным образом, матрицы, у которых длина равна 1 отождествляются со столб-
цами, определенными на с.651.
694 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
(M ⊤ )ji := Mji
или, что эквивалентно, строка (y1 , ..., ym ), элементы которой определяются формулой
n
X
yi = xj · Mij ,
j=1
=
(12.2.68) (12.2.68)
x1 xm
называется матрицей перехода от базиса (a1 , ..., an ) к базису (b1 , ..., bn ). Коротко ее опре-
деление записывается формулой
h a ij h a ij
i
:= , i, j = 1, ..., n (12.3.117)
b i b
Из теоремы 12.3.1 следует
Теорема 12.3.2. Базисы (a1 , ..., an ) и (b1 , ..., bn ) в векторном пространстве X связаны между
собой через матрицу перехода по следующей формуле:
hai
(a1 , ..., an ) = (b1 , ..., bn ) · (12.3.118)
b
Теорема 12.3.3. Если (a1 , ..., an ) и (b1 , ..., bn ) – два базиса в векторном пространстве X, то
hai hxi hxi
· = , x∈X (12.3.119)
b a b
hai b b h a i
· =I= · (12.3.120)
b a a b
h a i−1
b
= (12.3.121)
b a
(где I – единичная матрица размера n × n).
696 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
!
Xn h i h ij Xn Xn h ij h ii n h ii
X n h ij
X
a x a x x a
· · bj = · · bj = · · bj =
j=1
b a j=1 i=1
b i a i=1
a j=1
b i
n h ii n h
ai ij
X X n h ii
X n h ij
X
x x x
= · · bj = · ai = x = · bj
i=1
a j=1
b i=1
a j=1
b
n h i j n h ij k
! n h k !
ak i j b i
X Xn X Xn X
a b a b
· · bj = · · bj = · · bj =
j=1
b a i j=1
b k a i j=1
b a
k=1 k=1
n
" Pn bi k #j n j n
X · ak X bi X
= k=1 a
· bj = · bj = bi = Iij · bj
j=1
b j=1
b j=1
⇓
h i j
a b
· = Iij
b a i
⇓
hai b
· =I
b a
А после этого второе равенство в (12.3.120) тоже можно считать доказанным, потому что оно по-
лучается из первого перестановкой букв a и b.
3. Равенство (12.3.121) теперь – следствие (12.3.120).
n h ii
! n h ii n h ii X n j
X x X x X x Aa
Ax = A · ai = · Aai = (12.3.123) = · · bj =
i=1
a i=1
b i=1
b j=1
b i
n j h i ! n j
Aa h x i Aa h x i
Xn X X
Aa x i
= · ·bj = (12.3.110) = · ·bj = (12.3.111) = (b1 , ..., bn )· ·
j=1 i=1
b i b j=1
b b b a
§ 3. Матрицы и определители 697
Теорема 12.3.6. Если a1 , ..., an и b1 , ..., bn – два базиса в векторном пространстве X, то для
всякого оператора A : X → X справедливы тождества:
h a i Aa Ab h a i
· = · (12.3.128)
b a b b
h a i Aa h a i−1 Ab h a i Aa b
· · = = · · (12.3.129)
b a b b b a a
Доказательство. Заметим, что левое равенство в (12.3.129) получается из (12.3.128) умножением
−1
справа на матрицу ab :
h a i Aa Ab h a i
· = ·
b a b b
⇓
h a i Aa h a i−1 Ab h a i h a i−1 Ab
Ab
· · = · · = ·I =
b a b b | b {z b } b b
I
−1
После этого правое равенство в (12.3.129) получается из левого заменой ab на ab по формуле
(12.3.121).
Поэтому нам нужно только доказать (12.3.128). Для всякого индекса i справедлива следующая
цепочка:
Xn h i j X n X n h ij k ! Xn k Xn h ij
a Aa a Aa Aa a
· · bj = · · bj = · · bj =
j=1
b a i j=1 k=1
b k a i a i j=1
b k
k=1
Xn k Xn h i Xn k Xn k
Aa ak j Aa (Aa)i
= · · bj = · ak = · ak = (Aa)i = A(ai ) =
a i j=1
b a i a
k=1 k=1 k=1
!
Xn h ik X n h ik Xn h ik Xn h ik Xn j
ai ai a a (Ab)k
=A · bk = · A(bk ) = · (Ab)k = · · bj =
b b b i b i j=1
b
k=1 k=1 k=1 k=1
n h ik n j n j h i ! n j
Ab h a i
X X Xn X X
a Ab Ab a k
= · · bj = · · bj = · · bj
b i j=1
b k j=1
b k b i j=1
b b i
k=1 k=1
Отсюда мы получаем
h i j h ij
a Aa Ab a
· = · , i, j = 1, ..., n
b a i b b i
Следствие 12.3.8. Для всякого фиксированного базиса a = (a1 , ..., an ) в векторном пространстве
X тождества
h x i⊤ hyi
α(x; y) = ·M · , x, y ∈ X (12.3.132)
a a
M = α[a; a] (12.3.133)
устанавливают взаимно однозначное соответствие между матрицами M размера n × n и били-
нейными формами α на X.
Теорема 12.3.9. Если a1 , ..., an и b1 , ..., bn – два базиса в векторном пространстве X, то для
всякой билинейной формы α на X справедливо равенство
⊤
b b
α[b, b] = · α[a, a] · (12.3.134)
a a
Доказательство. Здесь нужно просто вычислить матричный элемент матрицы справа:
⊤ ! k X n ⊤ ! k i X n i Xn j
b b b b b b
· α[a; a] · = · α[a; a] · = · α[a; a]ij · =
a a i=1
a a l i=1
a k j=1
a l
l i
n
X i j Xn i j
i b b bk bl
= α[a; a]j · · = α(ai ; aj )· · = (12.3.131) = α(bk ; bl ) = (12.3.130) = α[b; b]kl
i,j=1
a k a l i,j=1
a a
§ 3. Матрицы и определители 699
Доказательство.
⊤ !k Xn ⊤ ! k i X n i n j
Ab Ab Ab Ab Ab X Ab =
· α[b; b] · = · α[b; b] · = · α[b; b]ij ·
b b i=1
b b l i=1
b k j=1
b l
l i
n
X
i j Xn i j
Ab Ab (Ab)k (Ab)l
= α[b; b]ij · · = α[bi ; bj ] · · = (12.3.131) =
i,j=1
b k b l i,j=1
b b
Если a = (a1 , ..., an ) – строка элементов векторного пространства X и M ∈ Rnm – матрица, то,
напомним, формулой (12.3.111) мы определили внешнее действие матрицы M на строку векторов
a = (a1 , ..., an ):
a · M = (a1 , ..., an ) · M := a1 · M11 + ... + an · M1n , ..., a1 · Mm
1 n
+ ... + an · Mm
Теорема 12.3.11. Если a = (a1 , ..., an ) – базис векторного пространства X и M ∈ Rnn – обратимая
матрица, то матрица билинейной формы α в преобразованном базисе a · M = (a1 , ..., an ) · M имеет
вид:
α[a · M, a · M ] = M ⊤ · α[a, a] · M (12.3.136)
Доказательство.
X
m m
X
α[a · M, a · M ]ij = α (a · M )i , (a · M )j = (12.3.111) = α ak · Mik , al · Mjl =
k=1 l=1
!
m
X m
X m
X m
X m
X i k
= Mik · α(ak , al ) · Mjl = Mik · α[a; a]kl · Mjl = M⊤ k
· α[a, a] · M =
j
k=1 l=1 k=1 l=1 k=1
i
= M ⊤ · α[a, a] · M
j
(b) Определитель
Определитель матрицы, как полилинейная кососимметрическая форма.
• Определителем квадратной матрицы A порядка n называется число
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n (12.3.137)
σ∈Sn
Понятно, что любую матрицу N ∈ Rnm можно представить как строку из таких столбцов
N = [x1 , ..., xm ], xi ∈ Rn ,
det : Rn × ... × Rn → R
| {z }
n множителей
f (x1 , ..., λ · y + µ · z , ..., xn ) = λ · f (x1 , ..., y , ..., xn ) + µ · f (x1 , ..., z , ..., xn ) (12.3.140)
| {z } ↑ ↑
↑ i-е место i-е место
i-е место
λ=0
y y
=
y y
2λ = 0
λ=0
Лемма 12.3.15. При перестановке аргументов кососимметрическая форма меняет знак в соот-
ветствии с четностью этой перестановки:
Доказательство. Это следует из теоремы 12.1.12: для транспозиций эта формула представляет со-
бой просто определение кососимметрической формы. А затем применяется индукция: если формула
(12.3.144) доказана для перестановок σ, которые можно разложить в композицию k транспозиций,
то добавляя еще одну транспозицию τ , мы получим:
f (xσ(τ (1)) , ..., xσ(τ (n)) ) = sgn σ · f (xτ (1) , ..., xτ (n) ) = sgn σ · sgn τ · f (x1 , ..., xn ) =
= (12.1.29) = sgn(σ ◦ τ ) · f (x1 , ..., xn )
702 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
n n
!
X X X
f (x1 , ..., xn ) = f xσ1 1 · eσ1 , ..., xσnn · eσn = xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
σ1 =1 σn =1 σ1 ,...,σn ∈{1,...,n}
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) + xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
| {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}
=
∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 12.3.14
↑
сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) = (12.3.144) = xσ1 1 · ... · xσnn · sgn σ · f (e1 , ..., en ) =
| {z }
σ∈Sn σ∈Sn
λ
X
=λ· sgn σ · xσ1 1 · ... · xσnn = λ · det[x1 , ..., xn ]
σ∈Sn
Правило Крамера.
Теорема 12.3.16. Для последовательности (a1 , ..., an ) ⊂ Rn числовых столбцов высотой n следу-
ющие условия эквивалентны:
(i) уравнение
[a1 , ..., an ] · x = b (12.3.145)
разрешимо в Rn при любой правой части b ∈ Rn ;
(ii) уравнение
[a1 , ..., an ] · x = 0 (12.3.146)
имеет только одно решение x = 0 ∈ Rn ;
(iii) столбцы a1 , ..., an линейно независимы (то есть образуют базис) в векторном простран-
стве Rn ;
(iv) определитель матрицы [a1 , ..., an ] отличен от нуля:
Лемма 12.3.17. Пусть a1 , ..., an , x, b ∈ Rn – числовые столбцы высотой n. Тогда если выполняется
равенство (12.3.145), то для всякого i = 1, ..., n справедливо равенство
x1 · a1 + ... + xn · an = b
Теперь вычислим определитель в правой части (12.3.149) (здесь неявно предполагается, что 1 6= i 6=
n, но нетрудно переписать выкладки для i = 1 и i = n):
=
0, det[a1 , ..., an ] 0,
по лемме 12.3.14, по лемме 12.3.14,
поскольку поскольку
a1 повторяется an повторяется
в аргументе дважды в аргументе дважды
= xi · det[a1 , ..., an ]
Доказательство теоремы 12.3.16. Заметим сразу, что здесь нужно только доказать эквивалент-
ность условий (i)-(iv), потому что из (iv) и формулы (12.3.149) сразу же следует формула (12.3.148).
(i)⇔(ii). Рассмотрим оператор A : Rn → Rn , действующий по формуле
Ax = [a1 , ..., an ] · x, x ∈ Rn .
x1 = ... = xn = 0.
Но это (в силу теоремы 12.2.1) как раз и есть условие линейной независимости векторов a1 , ..., an .
(iii)⇔(iv). 1. Пусть сначала столбцы a1 , ..., an линейно зависимы, то есть
для некоторого x 6= 0 ∈ Rn . Тогда по лемме 12.3.17 для любого i = 1, ..., n выполняется равенство
Поскольку x 6= 0, найдется индекс i такой, что xi 6= 0. Для него тоже верно (12.3.150). Значит,
det[a1 , ..., an ] = 0.
2. Пусть наоборот столбцы a1 , ..., an линейно независимы (то есть образуют базис) в Rn . Тогда
каждый базисный вектор ei представим в виде линейной комбинации векторов a1 , ..., an :
h e i1 h e in
i i
ei = · a1 + ... + · an
a a
j
(напомним, что обозначения xa вводились выше формулой (12.2.68)). Отсюда мы получаем такую
цепочку:
n h
" #
e1 iσ1
n h
X X en iσn
1 = det[e1 , ..., en ] = det · aσ1 , ..., · aσn = (12.3.140) =
σ =1
a σ =1
a
1 n
n
X h e iσ1 h e iσn
1 n
= · ... · · det[aσ1 , ..., aσn ] =
σ1 ,...,σn =1
a a
X h e iσ1 h e iσn X h e iσ1 h e iσn
1 n 1 n
= · ... · · det[aσ1 , ..., aσn ] + · ... · · det[aσ1 , ..., aσn ] =
a a a a | {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}
=
∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 12.3.14
↑
сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X h e1 iσ1 h e iσn
n
X h e1 iσ1 h e iσn
n
= ·...· ·det[aσ1 , ..., aσn ] = (12.3.144) = ·...· ·sgn σ·det[a1 , ..., an ] =
a a a a
σ∈Sn σ∈Sn
X h e iσ1 h e iσn hei
1 n
= det[a1 , ..., an ] · sgn σ · · ... · = det[a1 , ..., an ] · det
a a a
σ∈Sn
⇓
hei
1 = det[a1 , ..., an ] · det
a
⇓
det[a1 , ..., an ] 6= 0.
∃M −1 ⇐⇒ det M 6= 0
Доказательство. 1. Пусть матрица A треугольна, то есть Aji 6= 0 только если i > j. Тогда можно
показать, что в сумме (12.3.137) ненулевым будет только одно слагаемое, а именно, то, которое
соответствует тривиальной перестановке:
σ(1)
A1 6= 0
σ(1) 6 1
σ(1) = 1
Aσ(2) 6= 0
σ(2) 6 2
σ(2) = 2
σ(1) σ(2)
A1 · A2 · ... · Aσ(n)
n 6= 0 ⇐⇒ 2
⇐⇒ ⇐⇒
...
...
...
σ(n)
An 6= 0 σ(n) 6 n σ(n) = n
(12.3.155)
В этой цепочке лишь последняя эквивалентность требует некоторых объяснений. Она доказывается
последовательной расшифровкой условий σ(i) 6 i:
1) первое неравенство σ(1) 6 1, вместе с условием σ(1) ∈ N сразу же дает σ(1) = 1;
2) после того, как мы это поняли, второе неравенство σ(2) 6 2 будет означать σ(2) = 2,
поскольку σ(2) ∈ N и σ(2) 6= σ(1) = 1;
...
n) так по индукции мы к n-му шагу доказываем равенство σ(i) = i для любых i < n, и тогда
на n-м шаге неравенство σ(n) 6 n будет означать, что σ(n) = n, поскольку, σ(n) ∈ N и
σ(n) 6= σ(i) = i при i = 1, ..., n − 1.
Из (12.3.155) следует, что в формуле (12.3.137) для матрицы A только одно слагаемое может быть
отлично от нуля – то, которое соответствует тождественной подстановке:
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n = sgn(1, 2, ..., n) ·A11 · A22 · ... · Ann = A11 · A22 · ... · Ann
| {z }
σ∈Sn
k
1
где
λ = f (e1 , ..., en ) = det[A · e1 , ..., A · en ] = det A · [e1 , ..., en ] = det(A · I) = det A (12.3.157)
| {z }
↑
единичная
матрица I
Поэтому
det(A·B) = det A·(B1 , ..., Bn ) = f (B1 , ..., Bn ) = (12.3.156) = λ·det(B1 , ..., Bn ) = (12.3.157) = det A·det B.
Определитель оператора.
• Пусть X – конечномерное векторное пространство, (a1 , ..., an ) – произвольный базис в X,
и A : X → X – произвольный оператор. Число
Aa
det A = det (12.3.158)
a
не зависит от выбора базиса (a1 , ..., an ) и называется определителем оператора A.
Доказательство. Пусть (b1 , ..., bn ) – какой-нибудь другой базис в X. Тогда
h i
Ab a Aa h a i−1
det = (12.3.129) = det · · = (12.3.153) =
b b a b
hai h a i−1 hai
Aa Aa h a i−1 Aa
= det · det · det = (12.3.154) = det · det · det = det
b a b b a b a
ω : X × ... × X → R
| {z }
k множителей
ω(x1 , ..., xi , ..., xj , ..., xk ) = ω(x1 , ..., xj , ..., xi , ..., xk ), x1 , ..., xk ∈ X. (12.4.162)
Множество всех симметрических форм степени k на X обозначается Σk (X). Ясно, что это
будет векторное пространство относительно поточечных алгебраических операций.
ω 7→ Sym ω
называется симметрированием.
Свойства симметрирования:
708 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
1◦ Линейность:
⋄ 12.4.1. Из формулы (12.4.165) видно, что если метризацией формы η 1 ⊠· · ·⊠η m является форма
η 1 , . . . , η m – произвольная последовательность η 1 ⊓ · · · ⊓ η m :
длины m линейных функционалов на X, то сим-
Sym(η 1 ⊠ · · · ⊠ η m ) = η 1 ⊓ · · · ⊓ η m (12.4.174)
|k| = m = |l|,
справедливо равенство (
⊓k k!
1 , k=l
(al ) = m! . (12.4.177)
a 0, k 6= l
§ 4. Симметрические формы и однородные многочлены 709
1 X 1 σ(1) σ(m)
1
= · (aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) (12.4.178)
m! a a
ρ∈Sm
Пусть теперь k 6= l. Тогда ki 6= li для некоторого i ∈ {1, ..., n}, и поэтому при любом ρ ∈ Sm
(то есть чтобы перестановка ρ не меняла отображение τ ) и в этом случае все произведение будет
равно единице:
σ(1) σ(m)
1 1
(aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) = 1.
a a
Таких перестановок ρ, которые не меняют τ по теореме 12.1.10 имеется ровно k!. Поэтому вся сумма
в конце (12.4.178) будет равна k!.
Теорема 12.4.2 (о базисе в Σk (X)). Пусть η 1 , ..., η n – базис в сопряженном пространстве X ∗ .
Тогда для всякого числа m ∈ Z+ симметрические формы {η ⊓k ; |k| = m} определенные формулой
(12.4.176) (где k пробегает всевозможные мультииндексы длины n и объема m), образуют базис
1 n
в пространстве Σm (X). В частном случае когда η 1 = a1 , ..., η n = a1 – сопряженный базис
к некоторому базису a = (a1 , ..., an ) в X, разложение всякой симметрической формы по базису
(12.4.176) имеет вид
X ⊓k
m! 1
ω= · ω(ak ) · (12.4.179)
k! a
k : {1, ..., n} → Z+ :
|k| = m
Действительно, если k 6= l, то найдется какой-то индекс i ∈ {1, ..., n} такой, что ki 6= li . Как
следствие,
card(τk ◦ ρ)−1 (i) = card τk−1 (i) = ki =
6 li = card τl−1 (i) = card(τl ◦ π)−1 (i).
Это означает, что в последовательностях η τk ρ(1) , ..., η τk ρ(m) и η τl (π(1))
, ..., η
τl (π(m))
имеется
неоди-
наковое количество векторов η i . Уже по этой причине формы η τk ρ(1) ⊠ ... ⊠ η τk ρ(m)
и η τl (π(1)) ⊠
... ⊠ η τl (π(m)) не могут совпадать.
Наоборот, если k = l, то (12.4.181) эквивалентно равенству
η τk ρ(1) ⊠ ... ⊠ η τk ρ(m) = η τk (π(1)) ⊠ ... ⊠ η τk (π(m))
а это эквивалентно системе
τk (ρ(i)) = τk (π(i)), 1 6 i 6 m,
то есть τk ◦ ρ = τk ◦ π.
Разобьем теперь последнее выражение в (12.4.180) на подсуммы, в которых слагаемые одина-
ковы. В силу сказанного, это то же самое, что разбить последнюю сумму на подсуммы, в которых
перестановки ρ имеют одну и ту же композицию с τk . А это то же самое, что разбить эту сумму на
подклассы, соответствующие представлениям мультииндекса k:
X
1 X τk ρ(1) X λk X X
0= λk · · η ⊠ ... ⊠ η τk ρ(m) = · η τ (1) ⊠ ... ⊠ η τ (m) =
m! m!
|k|=m ρ∈Sm |k|=m τ ∈Rep(k) σ∈Sm : τ ◦σ=τ
X λk X
= · card{σ ∈ Sm : τ ◦ σ = τ } ·η τ (1) ⊠ ... ⊠ η τ (m) =
m! | {z }
|k|=m τ ∈Rep(k)
k (12.1.17)
k!
X λk X
= · k! · η τ (1) ⊠ ... ⊠ η τ (m)
m!
|k|=m τ ∈Rep(k)
Теперь мы получаем, что в последнем выражении векторы η τ (1) ⊠ ... ⊠ η τ (m) не повторяются (при
изменении k и τ ∈ Rep(k)). А по замечанию 12.2.10 векторы вида η i1 ⊠ ... ⊠ η im (is ∈ {1, ..., n})
образуют базис в пространстве L(X, ..., X) всех полилинейных форм степени m на X. Значит, век-
торы η τ (1) ⊠ ... ⊠ η τ (m) должны быть линейно независимы (при изменении k и τ ∈ Rep(k)). Значит,
равенство нулю суммы означает равенство нулю клоэффициентов:
λk
∀k · k! = 0.
m!
или
∀k λk = 0.
2. Теперь докажем полноту. Если ω – какая-нибудь симметрическая форма, то, поскольку в
силу замечания 12.2.10 формы вида η i1 ⊠ ... ⊠ η ik (is ∈ {1, ..., n}) образуют базис в L(X, ..., X), ω
представима как их линейная комбинация:
X
ω= λi1 ,...,im · η i1 ⊠ ... ⊠ η im
is ∈{1,...,n}
X ⊓k
1 l!
ω(al ) = λk · (al ) = · λl .
a m!
k : {1, ..., n} → Z+ : | {z }
|k| = m k (12.4.177)
(
l!
m! , k=l
,
0, k 6= l
То есть
m!
λl = · ω(al ).
l!
f (x) = λ, x∈X
является многочленом на X;
1) всякий линейный функционал f : X → R является многочленом на X;
2) если f : X → R и g : X → R – многочлены на X, то их произведение f ·g : X → R
тоже является многочленом на X;
3) если f : X → R и g : X → R – многочлены на X, то их сумма f + g : X → R
тоже является многочленом на X.
• Многочлен f : X → R называется однородным степени m, если выполняется тождество
f (λ · x) = λm · f (x), x ∈ X, λ ∈ R. (12.4.182)
n
Y
η k (x) = η i (x)ki , x ∈ X. (12.4.183)
i=1
называемую k-мономом последовательности η 1 , ..., η n . Понятно, что всякая такая функция явля-
ется однородным многочленом на X степени m = |k| (равной объему мультииндекса k).
@ : Pm (X ∗ ) → Σm (X)∗ .
и заметим, что это число не зависит от выбора σ ∈ Rep(k). Действительно, если σ ′ – какое-то другое
представление мультииндекса k, то от σ оно отличается некоторой перестановкой аргументов
σ ′ = σ ◦ υ, υ ∈ Sm .
Поэтому
"a #τ (1) "a #τ (m)
X h aσ′ (1) iτ (1) ha ′
σ (m)
iτ (m) X σ υ(1) σ υ(m)
· ... · = · ... · =
b b b b
τ ∈Rep(l) τ ∈Rep(l)
| {z }
если заменить τ на τ ◦ υ, то сумма не изменится
n
X ha ij1 ha ijn
σ(1) σ(1)
= · ... · · bj1 · ... · bjn =
j1 ,...,jn =1
b b
X X h aσ(1) iτ (1) ha
σ(1)
iτ (n) X h ak il
= · ... · · bτ (1) , ..., bτ (m) = · bl
b b b
|l|=m τ ∈Rep(l) |l|=m
Отсюда следует, что если многочлен f раскладывается по базису a формулой (12.4.186), то в раз-
ложении по базису b он принимает вид
X X X h ak il X X h a il
k
X
f= λk · ak = λk · · bl = λk · · bl = µl · b l
b b
|k|=m |k|=m |l|=m |l|=m |k|=m |l|=m
где
X h a il
k
µl = λk · .
b
|k|=m
Если теперь обозначить символами @a f (ω) и @b f (ω) действия многочлена f на форму ω опреде-
ленные правилом (12.4.187) примененном к базисам a и b соответственно,
X X
@a f (ω) = λk · ω(ak ), @b f (ω) = λl · ω(bl ).
|k|=m |l|=m
X n
X ha ij1 ha ijn
σ(1) σ(1)
= λk · · ... · · ω(bj1 , ..., bjn ) =
j1 ,...,jn =1
b b
|k|=m
X X X h aσ(1) iτ (1) ha
σ(1)
iτ (n)
= λk · · ... · · ω(bτ (1) , ..., bτ (m) ) =
b b
|k|=m |l|=m τ ∈Rep(l)
X X h a il X
k
= λk · · ω(bl ) = µl · ω(bl ) = @b f (ω).
b
|l|=m |k|=m |l|=m
2. Пусть ω 6= 0. Тогда эта форма отлична от нуля на какой-то последовательности aσ(1) , ..., aσ(m)
базисных векторов:
ω(aσ(1) , ..., aσ(m) ) 6= 0.
Последовательность σ(1), ..., σ(m) является представлением некоторого мультииндекса k, и поэтому
мы получаем
ω(ak ) 6= 0.
То есть @f (ω) 6= 0 при f = ak .
714 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
X X l l
1 1
@f (ω) = λk · ω(ak ) = λk · (ak ) = (12.4.177) = λl · (al ) = λl · l! 6= 0.
a a
|k|=m |k|=m
X 1 k
1
f= ·F · ak .
k! a
|k|=m
X 1 k X k
1 1 1
@f (ω) = ·F · ω(ak ) = F · · ω(ak ) = (12.4.179) = F (ω).
k! a k! a
|k|=m |k|=m
• Отображение
X X
Π:f = λk · η k 7→ ω= λk · η ⊓k (12.4.190)
|k|=m |k|=m
Π(η k ) = η ⊓k .
1 d d
Π(f )(x1 , ..., xm ) = · ... f (t1 · x1 + ... + tm · xm ) , xi ∈ X, (12.4.192)
m! d t1 d tm t1 =...=tm =0
§ 4. Симметрические формы и однородные многочлены 715
и отмечается, что они не зависят от выбора представления σ ∈ Rep(k). Отсюда следует, что если
многочлен f раскладывается по базису η k формулой (12.4.189), то в разложении по базису θl он
принимает вид X X
f= λk · η k = µl · θ l (12.4.193)
|k|=m |l|=m
где
X ηk
µl = λk · .
θ l
|k|=m
Если теперь для многочлена (12.4.193) обозначить символом Πη (f ) форму, определенную правилом
(12.4.190), а символом Πθ (f ) форму, определенную тем же правилом (12.4.190), но а заменой η на
θ, X X
Πη (f ) = λk · η ⊓k , Πθ (f ) = µl · θ⊓l ,
|k|=m |l|=m
X n
X σ(1)
σ(1)
η η
= λk · · ... · · θj1 ⊓ ... ⊓ θjn =
j1 ,...,jn =1
θ j1 θ jn
|k|=m
X X X η σ(1) σ(1)
η
= λk · · ... · · θτ (1) ⊓ ... ⊓ θτ (m) =
θ τ (1) θ τ (n)
|k|=m |l|=m τ ∈Rep(l)
X X l X
ηk
= λk · · θl = µl · θl = Πθ (f ).
θ
|l|=m |k|=m |l|=m
ω(x, ..., x) = η ⊓k (x, ..., x) = (12.4.176) = (η σ(1) ⊓ ... ⊓ η σ(m) )(x, ..., x) = (12.4.164) =
1 X
= · η σ(τ (1)) (x) · ... · η σ(τ (m)) (x) = η k (x) = Π −1 (η ⊓k )(x) = Π −1 (ω)(x)
m! | {z }
τ ∈Sm
k
η σ(1) (x) · ... · η σ(m) (x)
k
η k (x)
X × ... × X
t ❏❏
⊔m tt
tt ❏❏
❏❏ ϕ
ttt
t ❏❏
❏❏ .
tt ❏❏
zt ❏$
Pm (X ∗ ) ❴ ❴ ❴ ❴ ❴ ❴ ⊔❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ
ψ : Y ∗ → Σm (X).
ψ ∗ : Σm (X)∗ → Y ∗∗ .
ψ∗
Σm (X)∗ / Y ∗∗
O
@ ι=1
Pm (X) ⊔
/Y
ϕ
⇓
ϕ⊔ ⊔m (x1 , ..., xm ) = ϕ(x1 , ..., xm )
⇓
ϕ⊔ ◦ ⊔m = ϕ.
Квадратичные формы.
• Многочлен q : X → R на векторном пространстве X называется квадратичной формой на
X, если он удовлетворяет следующему так называемому тождеству параллелограмма:
q(x + y) + q(x − y)
= q(x) + q(y), x, y ∈ Rn (12.4.199)
2
q(0) = 0 (12.4.202)
Доказательство.
q(x + y) + q(y + z) + q(x + z) = q(x + y) + q(y + z) + q(x + z) = (12.4.199) =
q (x + y) + (y + z) + q (x + y) − (y + z) q x + 2y + z + q x − z
= + q(x + z) = + q(x + z) =
2 2
q x + 2y + z + q(x + z) + q x − z + q(x + z)
= =
2
q (x + y + z) + y + q (x + y + z) − y + q x − z + q(x + z)
= =
2
2q x + y + z + 2q y + q x − z + q(x + z) q x − z + q(x + z)
= =q x+y+z +q y + =
2 2
= q x + y + z + q(y) + q(x) + q(z)
m (12.4.201)
x⊥y ⇐⇒ α(x, y) = 0.
Y ⊥ = {x ∈ X : ∀i = 1, ..., k α(x, ei ) = 0}
Ker α := X ⊥ = {x ∈ X : ∀y ∈ X x ⊥ y}.
Ker α = X ⊥ = {0}
! 12.4.8. Можно заметить, что эти условия не казывается примером, построенном в замечании
зависят (ни в прямую, ни в обратную сторону) 12.4.7:
от равенства
Y = (Y ⊥ )⊥ (12.4.208)
В нем Но на подпространстве
x∈Y⊥ ⇔ ∀t ∈ R x1 · t − x2 · t = 0 ⇔ Y = {x ∈ R2 : x1 = x2 }
⇔ x1 = x2 ⇔ x∈Y
эта форма становится нулевой:
то есть
Y ⊥ = Y. x2 · y 2 = 0,
α(x, y) = x1 · y 1 − |{z} x, y ∈ Y.
|{z}
Поэтому
=
Y ⊥⊥ = Y, x1 y1
Y ∩ Y ⊥ = {0}
⇓
⊥ ⊥
dim(Y + Y ) = dim(Y ∩ Y ) + dim(Y + Y ) = (12.2.61) = dim Y + dim Y ⊥ > (12.4.207) > dim X
⊥
| {z }
k
0
⇓
Y +Y⊥ ⊇X
⇓
вдобавок к этому, по-прежнему,
Y +Y⊥ =X ← Y ∩ Y ⊥ = {0}
⇓
X =Y ⊕Y⊥
z }| {
Y ⊥ ∩ Y ⊥⊥ = 0 =⇒ Y⊥∩Y = 0
(теорема 12.4.13) m m (теорема 12.4.13)
α невырождена на Y ⊥ α невырождена на Y
∋
∋
⊥⊥ ⊥
Y Y Y
⊇
Y ⊥⊥
Ker P = Y, Im P = Y ⊥ .
Отсюда
X = Ker P ⊕ Im P = Y ⊕ Y ⊥ , Y ⊥⊥ = Ker P ⊥⊥ = Im P ⊥ = Ker P = Y,
и это доказывает импликацию (iv)⇐(v).
4. По аналогии доказывается равносильность (iv)⇔(vi) (или здесь можно сослаться на очевидную
эквивалентность (v) и (vi)).
Ортогональный базис.
• Базис e = (e1 , ..., en ) пространства X называется ортогональным для симметрической
билинейной формы α на X, если его элементы ортогональны друг другу относительно α:
∀i 6= j ei ⊥ ej
Это означает, что в матрице α(e, e) все элементы, лежащие вне диагонали, равны нулю,
поэтому формула (12.3.131) в таком базисе принимает специальный вид:
§ 4. Симметрические формы и однородные многочлены 723
α(e1 , e1 ) = q(e1 ) 6= 0
X = span e1 ⊕ (span e1 )⊥
– тогда мы получим
(
1
· q(ek ) ∈ {−1; +1}, q(ek ) 6= 0
q(e′k ) = |q(ek )|
0, q(ek ) = 0
(iii) для какого-нибудь (и тогда для любого) базиса b = (b1 , ..., bn ) в X матрица α(b, b) разло-
жения формы α невырождена:
α(b1 , b1 ) . . . α(b1 , bn )
det α[b, b] = det . . . ... . . . 6= 0 (12.4.212)
α(bn , b1 ) . . . α(bn , bn )
724 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
Доказательство. (i)⇔(ii). Пусть e = (e1 , ..., en ) – какой-нибудь ортогональный базис для α. Пока-
жем, что условие (12.4.211) эквивалентно невырожденности формы α.
Предположим сначала, что α(ej , ej ) = 0 для некоторого j. Тогда для любого y ∈ X мы получаем
n
X h e ii h y ii
1
α(ej , y) = (12.4.209) = α(ei , ei ) · · = 0.
| {z } | {z e } e
i=1
=
0,
0,
при i = j
при i 6= j
=
6=
6=
6=
0 1
0, 0
только если i = j
det α[e, e] 6= 0,
0,
только если i = j
h x ij α(x, ej )
=⇒ = .
e α(ej , ej )
§ 4. Симметрические формы и однородные многочлены 725
и (12.4.215):
n
X h x ii h y ii X n
α(x, ei ) · α(y, ei )
α(x, y) = (12.4.209) = α(ei , ei ) · · =
i=1
e e i=1
α(ei , ei )
Ортогонализация Грама-Шмидта.
Теорема 12.4.18 (Грам, Шмидт). Пусть α – симметрическая билинейная форма на векторном
пространстве X и пусть b = (b1 , ..., bn ) – базис в X, для которого все угловые миноры матрицы
α(b, b) отличны от нуля:
α(b1 , b1 ) . . . α(b1 , bk )
∀k = 1, ..., n det . . . ... . . . 6= 0 (12.4.216)
α(bk , b1 ) . . . α(bk , bk )
Тогда найдется (единственный) ортогональный для α базис e = (e1 , ..., en ) в X такой, что всякий
вектор ek выражается через векторы b1 , ..., bk , причем коэффициент при bk равен 1:
k−1
X
ek = λik · bi + bk (12.4.217)
i=1
Как следствие,
(i) матрица eb перехода от базиса b к базису e является нижнетреугольной с единицами
на диагонали,
1 0 0 ... 0
hei λ
1
1
1 1 0 ... 0
= λ2 λ2
2
1 ... 0
b . . . . . . . . . . . . . . .
λ1n λ2n λ3n . . . 1
(ii) для всякого k = 1, ..., n выполняется равенство определителей:
α(b1 , b1 ) α(b1 , b2 ) . . . α(b1 , bk )
α(b2 , b1 ) α(b2 , b2 ) . . . α(b2 , bk )
det
...
=
... ... ...
α(bk , b1 ) α(bk , b2 ) . . . α(bk , bk )
α(e1 , e1 ) 0 ... 0
0 α(e2 , e2 ) . . . 0
= det ...
= q(e1 ) · ... · q(ek ) (12.4.218)
... ... ...
0 0 . . . α(ek , ek )
Доказательство. Покажем сначала, что из формулы (13.1.25) следуют условия (i) и (ii). Первое
из них – просто переформулировка (13.1.25). Второе же следует из равенства (12.3.134). Посколь-
ку, помимо прочего из (13.1.25) следует, что при любом k = 1, ..., n линейные оболочки векторов
(e1 , ..., ek ) и (b1 , ..., bk ) совпадают, (e1 , ..., ek ) и (b1 , ..., bk ) можно рассматривать как два базиса в
подпространстве span(e1 , ..., ek ) = span(b1 , ..., bk ) ⊆ X, поэтому для них можно записать равенство
(12.3.134):
⊥
(e1 , ..., ek ) (e1 , ..., ek )
α((e1 , ..., ek ), (e1 , ..., ek )) = ·α((b1 , ..., bk ), (b1 , ..., bk )) ·
| {z } (b1 , ..., bk ) (b1 , ..., bk )
диагональная матрица | {z } | {z }
с элементами q(e1 ), ..., q(ek ) треугольная матрица треугольная матрица
на диагонали с единицами на диагонали с единицами на диагонали
Отсюда
⊥
(e1 , ..., ek ) (e1 , ..., ek )
det α((e1 , ..., ek ), (e1 , ..., ek )) = det · det α((b1 , ..., bk ), (b1 , ..., bk )) · det
| {z } (b1 , ..., bk ) (b1 , ..., bk )
k | {z } | {z }
q(e1 ) · ... · q(en ) k k
1 1
⇓
∀i = 1, ..., k q(ei ) 6= 0
Теперь уже вектор en ∈ X можно определить формулой (12.4.219):
n−1
X α(bn , ei )
en = bn − · ei
i=1
q(ei )
Поскольку en ∈ X \ Y , система (e1 , ..., en−1 , en ) будет базисом в X. Этот базис будет ортогональным,
потому что en ортогонален всем остальным векторам e1 , ..., en−1 : для любого k = 1, ..., n − 1 имеем
при i 6= k
0
! k
α(bn , ei ) z }| {
n−1
X n−1
X
α(bn , ei )
α(en , ek ) = α bn − · ei , ek = α(bn , ek ) − · α(ei , ek ) =
i=1
q(ei ) i=1
q(ei )
§ 4. Симметрические формы и однородные многочлены 727
α(bn , ek )
= α(bn , ek ) − · α(ek , ek ) = 0
q(ek ) | {z }
k
q(ek )
q(x) > 0 ∀x ∈ Rn
q(x) 6 0 ∀x ∈ Rn
q(x) > 0 ∀x 6= 0
q(x) < 0 ∀x 6= 0
(ii) q отрицательно определена тогда и только тогда, когда знаки главных миноров мат-
рицы Q чередуются начиная с минуса:
Отсюда следует, что все числа q(e1 ), ..., q(en ) положительны, и, по формуле (12.4.210), при любом
x 6= 0 получаем:
Xn h i 2
x i
q(x) = q(ei ) · >0
| {z } e
i=1
здесь все числа | {z }
положительны все эти числа
неотрицательны,
и хотя бы одно
из них ненулевое
То есть, главные миноры матрицы Q = α(b, b) ненулевые, и снова можно применить ортогонализа-
цию Грама-Шмидта. В новом ортогональном базисе e = (e1 , ..., en ) квадратичная форма q примет
вид (12.4.210),
Xn h i 2
x i
q(x) = q(ei ) · ,
i=1
e
и, поскольку она положительно определена, все числа q(ei ) должны быть положительны. Из этого
следуют неравенства (12.4.222), и вместе с ними, неравенства (12.4.220).
2. Теперь (ii) становится следствием (i). Отрицательная определенность формы q эквивалентна
положительной определенности формы −q, и в силу (i), это эквивалентно тому, что главные миноры
матрицы −α(b, b) положительны:
∀k = 1, ..., n det − α (b1 , ..., bk ), (b1 , ..., bk ) > 0
| {z }
k
(−1)k · det α (b1 , ..., bk ), (b1 , ..., bk )
ω(x1 , ..., xi , ..., xj , ..., xm ) = −ω(x1 , ..., xj , ..., xi , ..., xm ), x1 , ..., xm ∈ X. (12.5.224)
(iii) при любой транспозиции соседних аргументов знак формы меняется на противополож-
ный:
ω(x1 , ..., xi , xi+1 , ..., xm ) = −ω(x1 , ..., xi+1 , xi , ..., xm ), x1 , ..., xm ∈ X. (12.5.225)
... × X} → R
| × {z
ω: X
m множителей
ψ(y, y) = 0, y ∈ X.
= ψ(xj , xi ) + ψ(xi , xj )
⇓
ψ(xi , xj ) = −ψ(xj , xi ).
⇓
ω(x1 , ..., xi , ..., xj , ..., xm ) = −ω(x1 , ..., xj , ..., xi , ..., xm ).
4. Точно так же доказывается эквивалентность (iii)⇔(v).
730 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
η 1 ∧ · · · ∧ η m ∈ Λm (X).
η 1 ∧ ... ∧ η i ∧ ... ∧ η i ∧ η m = 0
для которого (
1, i = j
η j (xi ) = ,
6 j
0, i =
и поэтому
η 1 (x1 ) . . . η 1 (xm ) 1 ... 0
(η ∧ · · · ∧ η )(x1 , . . . , xm ) = det . . .
1 m
... . . . = det . . . . . . . . . = 1.
η m (x1 ) . . . η m (xm ) 0 ... 1
Тогда
X
η 1 ∧ · · · ∧ η m = η 1 ∧ ... ∧ η j ∧ ... ∧ η m = η 1 ∧ ... ∧ λi · η i ∧ ... ∧ η m =
i6=j
X
= λi · η 1 ∧ ... ∧ η i ∧ ... ∧ η m = (12.5.230) = 0.
| {z }
i6=j
здесь элемент η i
встречается дважды
Здесь в скобках стоит один и тот же вектор, а функционалы η 1 , ..., η n образуют базис в X ∗ . Отсюда
следует, что вектор в их аргументах равен нулю
λ1 · x1 + ... + λn · xn = 0
ω 7→ Alt ω
называется альтернированием.
Свойства альтернирования:
1◦ Линейность:
Alt(λ · ω + µ · π) = λ · Alt ω + µ · Alt π, ω ∈ Lm (X),
◦
2 Сохранение знака перестановки:
Alt ω(xσ(1) , ..., xσ(m) ) = sgn(σ) · Alt ω(x1 , ..., xm ), ω ∈ Lm (X), σ ∈ Sm , x1 , ..., xm ∈ X.
(12.5.234)
3◦ Всякую полилинейную форму операция альтернирования превращает во внешнюю,
1 X σ◦π =τ
Alt ω(xσ(1) , ..., xσ(m) ) = sgn(π) · ω(xπ(σ(1)) , ..., xπ(σ(m)) ) = =
m! π = σ −1 ◦ τ
π∈Sm
1 X
= sgn(σ −1 ◦ τ ) · ω(xτ (1) , ..., xτ (m) ) = (12.1.29), (12.1.30) =
m!
τ ∈Sm
sgn(σ) X
= sgn(τ ) · ω(xτ (1) , ..., xτ (m) ) = sgn(σ) · Alt ω(x1 , ..., xm ).
m!
τ ∈Sm
3. Если ω ∈ Lm (X), то равенство (12.5.234) означает, что форма Alt ω является внешней. Если
же ω ∈ Λm (X), то
1 X
Alt ω(x1 , ..., xm ) = sgn(π) · ω(xπ(1) , ..., xπ(m) ) =
m!
π∈Sm
1 X 1 X
= sgn(π) · sgn(π) ·ω(x1 , ..., xm ) = ω(x1 , ..., xm ) = ω(x1 , ..., xm ).
m! | {z } m!
π∈Sm π∈Sm
k
1
Базис в пространстве внешних форм Λm (X). Напомним, что на с.667 мы определили отоб-
ражение τX : {1, ..., n} → X нумерации элементов линейно упорядоченного конечного множества.
• Пусть X – векторное пространство, и пусть x = (x1 , ..., xn ) – строка длины n ∈ N из
элементов X. Каждому подмножеству M ⊆ {1, ..., n} поставим в соответствие числовую
строку, называемую ограничением строки x = (x1 , ..., xn ) на множество M ,
η M ∈ Λm (X).
card M = m = card L,
справедливо равенство (
M
1 1, L=M
(aL ) = . (12.5.243)
a 0, L 6= M
Доказательство. Прежде всего,
M τM (1) τM (m)
1 1 1
(aL ) = ∧ ... ∧ (aτL (1) , ..., aτL (m) ) = (12.5.228) =
a a a
τ (1) 1 τM (1)
1 M
(a τ (1) ) . . . (a τ (m) )
a L a L
= det ... ... ... .
1 τM (m) 1 τM (m)
a (a τL (1) ) . . . a (a τL (m) )
734 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
Наоборот, если L 6= M , то найдется какой-то элемент τM (i) ∈ M , которого нет среди элементов
τL (1), ..., τL (m) ∈ L. Это означает, что в матрице под определителем целая строка с индексом τM (i)
должна быть нулевой, и значит определитель тоже будет нулевым.
Теорема 12.5.3 (о базисе в Λm (X)). Пусть η 1 , ..., η n – базис в сопряженном пространстве X ∗ .
Тогда для всякого числа m 6 n внешние формы (12.5.241)
где M пробегает всевозможные подмножества в {1, ..., n} мощности m, образуют базис в про-
1 n
странстве Λm (X). В частном случае когда η 1 = a1 , ..., η n = a1 – сопряженный базис к неко-
торому базису a = (a1 , ..., an ) в X, разложение всякой внешней формы по базису (12.5.244) имеет
вид13 M
X 1
ω= ω(aM ) · (12.5.245)
a
M ⊆ {1, ..., n} :
card M = m
Заметим, что при любом выборе множеств M ⊆ {1, ..., n} и L ⊆ {1, ..., n} и перестановок ρ, π ∈ Sm
равенство
η τM ρ(1) ⊠ ... ⊠ η τM ρ(m) = η τL (π(1)) ⊠ ... ⊠ η τL (π(m)) (12.5.247)
может выполняться только если M = L и ρ = π.
Действительно, если M 6= L, то найдется какой-то индекс τM (s) ∈ M , которого нет среди индек-
сов τL (1), ..., τL (m) ∈ L. Это уже означает, что равенство (12.5.247) не может выполняться. Если же
M = L, то (12.5.247) эквивалентно равенству
η τM ρ(1) ⊠ ... ⊠ η τM ρ(m) = η τM (π(1)) ⊠ ... ⊠ η τM (π(m))
τM (ρ(s)) = τM (π(s)), 1 6 s 6 m.
13 В
1 M
формуле (12.5.245) обозначение aM описано в (12.5.239), а a
– в (12.5.241).
§ 5. Кососимметрические (внешние) формы и поливекторы 735
ρ(s) = π(s), 1 6 s 6 m.
τM ρ(1)
Итак, мы поняли, что в последнем выражении в цепочке (12.5.246) элементы η ⊠ ... ⊠
τM ρ(m)
η строго различны при различных вариантах значений τM (1), ..., τM (m) и ρ. Поскольку в
силу замечания 12.2.10 формы вида η p1 ⊠ ... ⊠ η pm (ps ∈ {1, ..., n}) образуют базис в L(X, ..., X), и
значит, линейно независимы, числовые коэффициенты в (12.5.246) должны быть нулевыми:
То есть
λM = 0, M ⊆ {1, ..., n}, ρ ∈ Sm .
2. Теперь докажем полноту. Если ω – какая-нибудь внешняя форма, то, поскольку в силу заме-
чания 12.2.10 формы вида η i1 ⊠ ... ⊠ η im (is ∈ {1, ..., n}) образуют базис в L(X, ..., X), ω представима
как их линейная комбинация:
X
ω= λi1 ,...,im · η i1 ⊠ ... ⊠ η im
is ∈{1,...,n}
То есть ω представима как линейная комбинация форм η i1 ∧ ... ∧ η im . При этом если в последова-
тельности i1 , ..., im какие-то индексы повторяются, то, в силу (12.5.230), форма η i1 ∧ ... ∧ η im автома-
тически обнуляется. Значит, можно считать, что ω есть линейная комбинация форм η i1 ∧ ... ∧ η im с
неповторяющимися индексами. Если кроме того переставить эти индексы так, чтобы они возраста-
ли, то при такой перестановке перед каждым выражением η i1 ∧...∧η im просто добавится скалярный
множитель в виде знака перестановки. И мы можем сделать вывод, что ω есть линейная комбинация
форм η i1 ∧ ... ∧ η im со строго возрастающими индексами.
3. Мы убедились, что формы (12.5.244) образуют базис в Λm (X). Остается доказать формулу
M
(12.5.245). Пусть a = (a1 , ..., an ) – базис в X. Разложим произвольную форму ω по базису a1 :
X M
1
ω= λM · .
a
M ⊆ {1, ..., n} :
card M = m
(в которой множества K, L образуют разбиение типа (k, l) множества {1, ..., k + l}, и суммиро-
вание ведется по всем таким разбиениям).
§ 5. Кососимметрические (внешние) формы и поливекторы 737
∃i xi = xi+1 .
Зафиксируем этот i и после этого разделим слагаемые в правой части (12.5.254) на три группы:
1) в первую группу пусть входят слагаемые, соответствующие разбиениям {1, ..., k + l} =
K ⊔ L, в которых оба индекса i и i + 1 лежат в K,
2) во вторую группу пусть входят слагаемые,соответствующие разбиениям {1, ..., k + l} =
K ⊔ L, в которых оба индекса i и i + 1 лежат в L,
3) в третью группу пусть входят остальные слагаемые, то есть те, которые соответствуют
разбиениям {1, ..., k + l} = K ⊔ L, в которых K содержит ровно один из индексов i и i + 1.
Тогда
X
(ψ ∧ ω)(x1 , ..., xk , xk+1 , ..., xk+l ) = sgn(τK⊳L ) · ψ(xK ) · ω(xL )+
{i,i+1}⊆K
X X
+ sgn(τK⊳L ) · ψ(xK ) · ω(xL ) + sgn(τK⊳L ) · ψ(xK ) · ω(xL ).
{i,i+1}⊆L (i∈K & i+1∈L) ∨ (i+1∈K & i∈L)
(12.5.255)
Заметим теперь, что в первой сумме в каждом слагаемом (то есть при любом выборе рабине-
ния (K, L)) у формы ψ среди аргументов xK = (xj ), j ∈ K, имеются два одинаковых с разными
индексами: xi = xi+1 . Поэтому здесь ψ(xK ) = 0, и вообще вся первая сумма равна нулю:
X
sgn(τK⊳L ) · ψ(xK ) · ω(xL ) = 0.
{i,i+1}⊆K
Точно так же, во второй сумме в (12.5.255) в каждом слагаемом (то есть при любом выборе
рабинения (K, L)) у формы ω среди аргументов xL = (xj ), j ∈ L, имеются два одинаковых с
разными индексами: xi = xi+1 . Поэтому здесь ω(xK ) = 0, и вообще вся вторая сумма равна нулю:
X
sgn(τK⊳L ) · ψ(xK ) · ω(xL ) = 0.
{i,i+1}⊆L
Наконец, чтобы понять, что происходит в третьей сумме в (12.5.255), рассмотрим транспози-
цию14 , меняющую местами i и i + 1:
s, s∈/ {i, i + 1}
τ (s) = (i i + 1)(s) = i + 1, s = i .
i, s=i+1
K ′ ⊳ L′ = τ ◦ (K ⊳ L).
мы получим следствие
Это можно интерпретировать так, что у каждого слагаемого в третьей сумме в (12.5.255), соответ-
ствующего какому-то разбиению (K, L) (где K и L содержат ровно по одному из чисел i и i + 1)
найдется парное слагаемое, соответствующее разбиению (K ′ , L′ ) (получающемуся перестановкой i
и i + 1), такое, что эти слагаемые компенсируют друг друга:
Разбив третью сумму на такие пары, мы получим, что она вся равна нулю.
2. Для форм λ ∈ Λ0 (X) и ω ∈ Λk (X) в определении конкатенации формулой (12.5.254) мнодже-
ство K должно быть пустым, поэтому в сумме имеется только одно слагаемое:
А с другой –
X
(ϕ ∧ (χ ∧ ψ))(x1 , ..., xk+l+m ) = sgn(τK⊳K ′ ) · ϕ(xk ) · (χ ∧ ψ)(xK ′ ) =
k,l+m
(K,K ′ )∈C{1,...,k+l+m}
X X
= sgn(τK⊳K ′ ) · ϕ(xk ) · sgn(τL⊳M ) · χ(xL ) · ψ(xM ) =
k,l+m l,m
(K,K ′ )∈C{1,...,k+l+m} (L,M)∈C{1,...,l+m}
X
= sgn(τK⊳K ′ ) · sgn(τL⊳M ) · ϕ(xk ) · χ(xL ) · ψ(xM ) = (12.1.40) =
k,l,m
(K,L,M)∈C{1,...,k+l+m}
X
= sgn(τK⊳L⊳M ) · ϕ(xK ) · χ(xL ) · ψ(xM ).
k,l,m
(K,L,M)∈C{1,...,k+l+m}
7. Остается доказать, что операция (ψ, ω) 7→ ψ ∧ω с такими свойствами единственна. Это следует
из теоремы 12.5.3: формы ψ и ω являются линейными комбинациями форм вида (12.5.228), а на
них операция (ψ, ω) 7→ ψ ∧ ω определена однозначно, потому что она совпадает с конкатенацией,
определенной формулой (12.5.228).
Конкатенация векторов. Как и в случае с внешними формами, для поливекторов имеется стан-
дартная конструкция, служащая типичным примером.
Пусть x1 , ..., xm – произвольная последовательность длины m векторов пространства X. Всякой
внешней форме α ∈ Λm (X) можно поставить в соответствие число
x1 ∨ · · · ∨ xm : Λm (X) → R,
и
(x1 ∨ · · · ∨ xm )(λ · α) := (λ · α)(x1 , ..., xm ) = λ · α(x1 , ..., xm ) = λ · (x1 ∨ · · · ∨ xm )(α)
Это значит, что x1 ∨ · · · ∨ xm представляет собой поливектор степени m в X.
• Поливектор x1 ∨ ... ∨ xm ∈ Vm (X) называется конкатенацией векторов x1 , ..., xm ∈ X.
(x1 ∨ ... ∨ xm )(α) = (12.5.257) = α(x1 , ..., xi , ..., xi , ..., xm ) = (меняем местями агрументы с xi ) =
= −α(x1 , ..., xi , ..., xi , ..., xm ) = −(x1 ∨ ... ∨ xm )(α)
Такое возможно только если (x1 ∨ ... ∨ xm )(α) = 0.
3. Для λ ∈ R
(x1 ∨ ... ∨ λ · xi ∨ ... ∨ xm )(α) = (12.5.257) = α(x1 , ..., λ · xi , ..., xm ) = λ · α(x1 , ..., xi , ..., xm ) =
= (12.5.257) = λ · (x1 ∨ ... ∨ xm )(α)
4. Если заменить xi на a + b, то
(x1 ∨...∨(a+b)∨...∨xm )(α) = (12.5.257) = α(x1 , ..., a+b, ..., xm ) = α(x1 , ..., a, ..., xm )+α(x1 , ..., b, ..., xm ) =
= (12.5.257) = (x1 ∨...∨a∨...∨xm )(α)+(x1 ∨...∨b∨...∨xm )(α) = (x1 ∨...∨a∨...∨xm +x1 ∨...∨b∨...∨xm )(α).
5. Если векторы x1 , ..., xm линейно независимы, то их можно дополнить до базиса x1 , ..., xm , ..., xn
в пространстве X. Тогда можно взять сопряженный базис в X ∗ ,
i
i 1
η = ,
x
для которого (
j 1, i = j
η (xi ) = ,
0, i 6= j
и поэтому
Тогда
X
x1 ∨ · · · ∨ xm = x1 ∨ ... ∨ xj ∨ ... ∨ xm = x1 ∨ ... ∨ λi · xi ∨ ... ∨ xm =
i6=j
X
= λi · x1 ∨ ... ∨ xi ∨ ... ∨ xm = (12.5.259) = 0.
| {z }
i6=j
здесь элемент xi
встречается дважды
§ 5. Кососимметрические (внешние) формы и поливекторы 741
a∨M = aτM (1) ∨ ... ∨ aτM (m) , M ⊆ {1, ..., n}, card M = m,
X M !
1
p= p · a∨M . (12.5.264)
a
M ⊆ {1, ..., n} :
card M = m
Доказательство. Опять начнем с того, что убедимся, что эта система линейно независима. Пусть
для некоторых скаляров λM выполняется равенство
X
λM · a∨M = 0.
M ⊆ {1, ..., n} :
card M = m
i
Пусть в соответствии с (12.2.74) a1 – сопряженный базис в X ∗ . Для всякого множества L ⊆
{1, ..., n}, card L = m, мы получим
L ! L (
1 1 0, L 6= M
a∨M = (12.5.263) = (aM ) = (12.5.243) = ,
a a 1, L = M
поэтому
X L !
M 1
0= λ · a∨M = λL .
a
M ⊆ {1, ..., n} :
card M = m
Это верно для любого множества L ⊆ {1, ..., n}, card L = m, поэтому система aM действительно
линейно независима.
Теперь покажем, что она линейно полна. Пусть p ∈ Vm (X) = Λm (X)∗ – произвольный поливек-
тор. Тогда для любой внешней формы ω ∈ Λm (X)
X M X M !
1 1
p(ω) = (12.5.245) = p ω(aM ) · = ω(aM )·p = (12.5.263) =
a a
M ⊆ {1, ..., n} : M ⊆ {1, ..., n} :
card M = m card M = m
X M !
1
= a∨M (ω) · p
a
M ⊆ {1, ..., n} :
card M = m
x 1 xn 1
Поливекторы максимальной степени. a
1
... a
= det ... ... ... · a1 ∨ ... ∨ an
⋄ 12.5.2. Поливекторы степени m = n (рав- x1 n xn n
a ... a
ной размерности пространства X) описывают-
(12.5.267)
ся довольно просто. Если зафиксировать базис
a1 , ..., an в X, то по теореме 12.5.7 поливектор
(в определителе матрица коэффициентов разло-
a1 ∨ ... ∨ an жения элементов xi по базису aj ).
hxi
x1 ∨ ... ∨ xn = det · a1 ∨ ... ∨ an =
a
Π(x1 ∨ ... ∨ xm )(ξ1 , ..., ξm ) = (x1 ∨ ... ∨ xm )(ξ1 ∧ ... ∧ ξm ) = (12.5.257) = (ξ1 ∧ ... ∧ ξm )(x1 , ..., xm ) =
ξ1 (x1 ) . . . ξ1 (xm ) ιX (x1 )(ξ1 ) . . . ιX (xm )(ξ1 )
= (12.5.228) = det . . . ... . . . = (12.2.92) = det ... ... ... =
ξm (x1 ) . . . ξm (xm ) ιX (x1 )(ξm ) . . . ιX (xm )(ξm )
= (12.5.228) = (ιX (x1 ) ∧ ... ∧ ιX (xm ))(ξ1 , ..., ξm )
образуют базис в пространстве Λm (X ∗ ). При этом по уже доказанной формуле (12.5.268), при отоб-
ражении Π первый базис превращается во второй:
(ii) Билинейность:
(iii) Антикоммутативность:
x ∨ y = −y ∨ x, x, y ∈ X. (12.5.272)
(iv) Ассоциативность:
и положим
−1
p ∨ q = Πk+l Πk (p) ∧ Πl (q) ,
где символ ∧ обозначает конкатенацию внешних форм, существование которой устанавливается в
теореме 12.5.6. Свойства (i)-(v) следуют сразу из аналогичных утверждений теоремы 12.5.6.
744 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
X × ... × X
❏❏
tt ❏❏
∨k ttt ❏❏ ϕ
ttt ❏❏
❏❏ .
t
ztt ❏❏
$
Vk (X) ❴ ❴ ❴ ❴ ❴ ❴ ∨❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ
∗
Доказательство. Каждому функционалу f ∈ Y поставим в соответствие внешнюю форму ψ(f )
степени k на X по формуле
ψ(f ) = f ◦ ϕ.
У нас получился линейный оператор
ψ : Y ∗ → Λk (X).
Ему соответствует сопряженное отображение
ψ ∗ : Λk (X)∗ → Y ∗∗ .
ϕ∨ = ι−1 ∗ ∗
Y ◦ ψ : Vk (X) = Λk (X) → Y
ιY (ϕ∨ (∨k (x1 , ..., xk )))(f ) = ψ ∗ (∨k (x1 , ..., xk ))(f ) = ψ ∗ (x1 ∨...∨xk )(f ) = (12.2.94) = (x1 ∨...∨xk )(ψ(f )) =
= (x1 ∨...∨xk )(f ◦ϕ) = (12.5.257) = (f ◦ϕ)(x1 , ..., xk ) = f (ϕ(x1 , ..., xk )) = (12.2.92) = ιY (ϕ(x1 , ..., xk ))(f )
⇓
∨
ιY (ϕ (∨k (x1 , ..., xk ))) = ιY (ϕ(x1 , ..., xk ))
⇓
ϕ∨ (∨k (x1 , ..., xk )) = ϕ(x1 , ..., xk )
⇓
∨
ϕ ◦ ∨k = ϕ.
(p · M )(ω) := p(M · ω)
m m
!
X X
∨m (a1 , ..., am ) · M (ω) = (12.3.111) = ∨m ak · M1k , ..., ak · k
Mm (ω) =
k=1 k=1
m m
! m m
!
X X X X
= ak · M1k ∨ ... ∨ ak · k
Mm (ω) = ω ak · M1k , ..., ak · k
Mm = ω (a1 , ..., am ) · M =
k=1 k=1 k=1 k=1
= (M · ω)(a1 , ..., am ) = (a1 ∨ ... ∨ am )(M · ω) = ∨m (a1 , ..., am )(M · ω) = ∨m (a1 , ..., am ) · M (ω)
Доказательство. Здесь нужно сразу заметить, что достаточно доказать формулу (12.5.282). Идею
доказательства удобно описать случаем m = 2: если
α γ
x, y ∈ X, M=
β δ
то
В общем же случае
(a1 ∨ ... ∨ am ) · M = ∨m (a1 , ..., am ) · M = (12.5.280) = ∨m (a1 , ..., am ) · M = (12.3.111) =
= ∨m a1 · M11 + ... + am · M1m , ..., a1 · M1m + ... + am · Mm m
=
1 m
m m
= a1 · M1 + ... + am · M1 ∨ ... ∨ a1 · M1 + ... + am · Mm =
X σ(1)
= (−1)sgn σ · M1 · ... · Mm
σ(m)
· a1 ∨ ... ∨ am = det M · a1 ∨ ... ∨ am
σ∈Σ(m)
Доказательство.
∨m A (a1 ∨ ... ∨ am ) · M = ∨m A det M · (a1 ∨ ... ∨ am ) = det M · ∨m A(a1 ∨ ... ∨ am )
(d) Ориентация
Линейный векторный порядок. Напомним, что на с.667 мы определили понятие частичного
порядка на произвольном множестве X. Предположим теперь, что X – вещественное векторное
пространство, и на нем задан неколторый частичный порядок .
• Частичный порядок на вещественном векторном пространстве X называется вектор-
ным порядком, если (помимо аксиом O1-O3 на с.667) он удовлетворяет следующим двум
дополнительным аксиомам:
O5. Трансляционность: если a b, то для любого x ∈ X выполняется a+x b+x.
O6. Однородность: если a b, то для любого λ > 0 выполняется λ · a λ · b.
C = {x ∈ X : 0 x} (12.5.287)
определяет конус в X.
(b) Всякий конус C в X определяет векторный порядок на X правилом
xy ⇐⇒ y − x ∈ C, (12.5.288)
⋄ 12.5.8. Из теоремы 12.5.14 следует, что на пря- ⋄ 12.5.9. Наоборот, применительно к плоскости
мой R существует только два векторных поряд- R2 теорема 12.5.14 означает, что здесь существу-
ка, потому что в R имеется только два множе- ет бесконечно много векторных порядков, пото-
ства, удовлетворяющие условиям 1◦ − 3◦ , а имен- му что конусов в R2 бесконечно много: помимо
но конуса
C = {x ∈ R : x > 0}
и C = {(x1 , x2 ) ∈ R2 : x1 > 0 & x2 > 0}
C = {x ∈ R : x 6 0}. существуют разные другие конусы, получающи-
Первое из них явлется конусом обычного вектор- еся из этого множества поворотами на разные уг-
ного порядка 6, определенного на с.123. А второе лы относительно точки 0.
– конусом противоположного порядка:
ab ⇐⇒ b 6 a.
dim X = 1,
то
748 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
a1 ∨ .. ∨ an > 0.
Заметим еще вот что. Всякая ориентация на векторном пространстве X, то есть векторный
порядок на пространстве Vn (X) поливекторов максимальной степени, n = dim X, автоматически
порождает некоторый векторный порядок на пространстве Λn (X) внешних форм этой степени на X:
если C – конус в пространстве Vn (X), то в пространстве Λn (X) он порождает множество, состоящее
из форм, на которых все поливекторы p ∈ C неотрицательны
и легко проверить, что это множество будет конусом в Λn (X). Как следствие, оно порождает век-
торный порядок на Λn (X).
И наоборот, если нам дан какой-то векторный порядок на Λn (X), то мы можем рассмотреть его
конус Γ , и тогда множество поливекторов, неотрицательных на Γ ,
Очевидно, это будет линейный функционал на X. Заметим, что его ядром является пространство
Y:
Y = {x ∈ X : f (x) = 0}.
Действительно, равенство
означает по предложению 12.5.5, что векторы a1 , ..., an−1 , x должны быть линейно зависимы. По-
скольку при этом a1 , ..., an−1 – линейно независимы, это значит, что x должен выражаться как
линейная комбинация a1 , ..., an−1 :
То есть x ∈ Y .
Теперь разобьем пространство X на три части: ту, где функция f положительна, где f равна
нулю, и где f отрицательна:
ЕВКЛИДОВЫ ПРОСТРАНСТВА
§1 Евклидовы пространства
Напомним, что невырожденные билинейные формы были определены нами на с.720, а положитель-
ные (положительно определенные) на с.727.
• Евклидовым пространством называется произвольное конечномерное векторное простран-
ство X с заданной на нем невырожденной положительно определенной симметрической
билинейной формой (x, y) 7→ hx, yi, то есть удовлетворяющей условиям:
— положительная определенность:
∀x ∈ X x, x > 0,
причем
x, x = 0 ⇔ x=0
— симметричность:
x, y = y, x
— билинейность:
α · x + β · y, z = α · x, z + β · y, z
— невырожденность: для всякого x 6= 0 найдется y такой что
hx, yi 6= 0.
• Билинейная форма (x, y) 7→ hx, yi называется скалярным произведением евклидова про-
странства X.
751
752 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
Свойства модуля
1◦ . Неотрицательность:
|x| > 0, x ∈ Rn (13.1.4)
2◦ . Однородность:
λ · x = |λ| · |x| , x ∈ Rn , λ ∈ R (13.1.5)
3◦ . Неравенство треугольника:
5◦ . Тождество параллелограмма:
2 2
|x + y| + x − y
= |x|2 + |y|2 , x, y ∈ Rn (13.1.8)
2
Доказательство. Первые два свойства очевидны, докажем неравенство треугольника (13.1.6):
2
|x + y| 6 |x| + |y| ⇐⇒ |x + y|2 6 |x| + |y| ⇐⇒ hx, yi 6 |x| · |y|
| {z } | {z } | {z }
k k ↑
hx + y, x + yi |x|2 + 2 · |x| · |y| + |y|2 неравенство
k k Коши-Шварца (13.1.9)
hx, xi + 2hx, yi + hy, yi hx, xi + 2 · |x| · |y| + hy, yi
|x + y|2 + |x − y|2 |x|2 + 2hx, yi + |y|2 + |x|2 − 2hx, yi + |y|2 2|x|2 + 2|y|2
= = = |x|2 + |y|2
2 2 2
x, y 6 |x| · y , (13.1.9)
Поскольку hx + ty, a + tyi > 0, этот многочлен должен при любом значении t быть неотрицателен:
Значит, он не может иметь двух вещественных корней, и поэтому его дискриминант должен быть
неположительным:
D = 4hx, yi2 − 4 · |x|2 · |y|2 6 0
⇓
hx, yi 6 |x|2 · |y|2
2
⇓
hx, yi 6 hx, yi 6 |x| · |y|
|x|
2. Теперь докажем (13.1.10). Если hx, yi = |x| · |y|, то положив λ = |y| , получим
2
|x − λy|2 = hx − λy, x − λyi = hx, xi − 2λ hx, yi +λ2 hy, yi = |x|2 − 2λ|x||y| + λ2 |y|2 = |x| − λ |y| =0
| {z } k
|x|
k |y|
|x||y|
То есть, x = λy.
Следствие 13.1.3. Если x = (x1 , ..., xn ) и y = (y1 , ..., yn ) – две числовые последовательности, то
v v
n u n u n
X uX uX
xi · yi 6 t xi · t
2 yi2 (13.1.11)
i=1 i=1 i=1
Доказательство. Во-первых,
и, во-вторых,
верхняя грань функции на множестве
не элементе,
меньше, чем значение на конкретном x 1 1
sup x, y > в частности на элементе > x, = · x, x = · |x|2 = |x|
|y|=1 x
y = |x| |x| |x| |x|
(b) Ортогональность
Ортогональные векторы.
• В соотоветствии с определением на с.719, два вектора x и y в евклидовом пространстве
X называются ортогональными, если их скалярное произведение нулевое:
x⊥y ⇐⇒ hx, yi = 0,
=
0 0
Отсюда уже следует, что тождество параллелограмма в этой ситуации можно переписать так:
|x + y|2
=
z }| {
2 2
|x + y| + |x − y| 2
|x|2 + |y|2 = = |x + y| .
2
Pm i=1
i=1 λi · ei
И, во-вторых,
m
X
y ∈ Im P ⇔ ∃x ∈ X y = P (x) = hx, ei i · ei ⇔ y ∈ span{e1 , ..., em } = Y.
i=1
и это доказывает (13.1.22). Более того, из этой цепочки видно, что равенство |x|2 = |P (x)|2 возможно
только если Q(x) = 0, а это эквивалентно равенству x = P (x).
756 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
Предложение 13.1.9. У матрицы Грама произвольного базиса b = (b1 , ..., bn ) в евклидовом про-
странстве X все главные миноры отличны от нуля1 :
hb1 , b1 i . . . hb1 , bk i
∀k = 1, ..., n det . . . ... ... = 6 0 (13.1.24)
hbk , b1 i . . . hbk , bk i
Это наблюдение позволяет следующим образом упростить теорему Грама-Шмидта 12.4.18 для
случая евклидова пространства:
Теорема 13.1.10 (Грам, Шмидт). Для всякого базиса b = (b1 , ..., bn ) (необязательно ортогональ-
ного) в евклидовом пространстве X найдется (единственный) ортогональный базис e = (e1 , ..., en )
в X такой, что всякий вектор ek выражается через векторы b1 , ..., bk , причем коэффициент при
bk равен 1:
k−1
X
ek = λik · bi + bk (13.1.25)
i=1
Как следствие,
(i) матрица eb перехода от базиса b к базису e является нижнетреугольной с единицами
на диагонали,
1 0 0 ... 0
hei λ
1
1
1 1 0 ... 0
= λ2 λ2
2
1 ... 0
b . . . . . . . . . . . . . . .
λ1n λ2n λ3n . . . 1
(ii) для всякого k = 1, ..., n выполняется равенство определителей:
hb1 , b1 i hb1 , b2 i . . . hb1 , bk i
hb2 , b1 i hb2 , b2 i . . . hb2 , bk i
det
...
=
... ... ...
hbk , b1 i hbk , b2 i . . . hbk , bk i
he1 , e1 i 0 ... 0
0 he , e2 i ... 0
= det 2 = |e1 |2 · ... · |ek |2 (13.1.26)
... ... ... ...
0 0 . . . hek , ek i
k−1
X hbk , ei i
e1 = b1 , ek = bk − 2 · ei . (13.1.27)
i=1 |ei |
будет ортонормированным в X ∗ .
То есть hf, gi выражается через bj по той же формуле (13.1.28), только с подставленным вместо
базиса e базисом b. Это и нужно было доказать в 1◦ .
2. Во втором утверждении нужно проверить свойства положительной определенности, симмет-
ричности, билинейности и невырожденности операции (f, g) 7→ hf, gi. Это можно считать очевид-
ным.
3. Если e = (e1 , ..., en ) – ортонормированный базис в X, то для i 6= j мы получаем
* + n i j
i j X
1 1 1 1
, = (13.1.28) = (ek ) · (ek ) = 0,
e e e e
k=1 | {z } | {z }
k k
0 0
при k 6= i при k 6= j
а с другой стороны,
* + n i i i i
i i X
1 1 1 1 1 1
, = (13.1.28) = (ek ) · (ek ) = (ei ) · (ei ) = 1.
e e e e e e
k=1 | {z } | {z } | {z } | {z }
k k k k
0 0 1 1
при k 6= i при k 6= i
758 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
То есть ∇f выражается через bj по той же формуле (13.1.29), только с подставленным вместо базиса
e базисом b. Это и нужно было доказать в 1◦ .
2. Равенство (13.1.30) проверяется вычислением:
j X n j i
1 1 1
∇ = (ei ) ·ei = (ei ) · ei = ei .
e i=1 |
e e
{z }
k
0
при i 6= j
действующих по формуле
i h x ii
1
⊙ fj (x) = · fj , x ∈ X,
e e
То есть hA, Bi выражается через bj по той же формуле (13.1.33), только с подставленным вместо
базиса e базисом b. Это и нужно было доказать в 1◦ .
2. Во втором утверждении нужно проверить свойства положительной определенности, симмет-
ричности, билинейности и невырожденности операции (A, B) 7→ hA, Bi. Это можно считать очевид-
ным.
3. Если e = (e1 , ..., en ) – ортонормированный базис в X, а f = (f1 , ..., fn ) – ортонормированный
базис в Y , то для i 6= i′ и любых j и j ′ мы получаем
* i′ + n i i′
i X
1 1 1 1
⊙ fj , ⊙ fj ′ = (13.1.33) = (ek ) ·fj , (ek ) ·fj ′ = 0.
e e e e
k=1 | {z } | {z }
k k
0 0
при k 6= i при k 6= i′
Для случая i = i′ и j 6= j ′
760 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
* i′ + n i i
i X
1 1 1 1
⊙ fj , ⊙ fj ′ = (13.1.33) = (ek ) ·fj , (ek ) ·fj ′ =
e e e e
k=1 | {z } | {z }
k k
0 0
при k 6= i при k 6= i
i i
1 1
= (ei ) ·fj , (ei ) ·fj ′ = hfj , fj ′ i = 0.
e e
| {z } | {z }
k k
1 1
Доказательство. 1. Из (13.1.36) следует, что для всякого вектора p со свойством |p| 6 1 выполня-
ется неравенство
|A(p)| 6 kAk .
x
Поэтому для любого x 6= 0, из очевидного равенства |x| = 1 должно следовать
x
A 6 kAk
|x|
Это доказывает (13.1.37) для ненулевых векторов x ∈ X. А для нулевого это неравенство очевидно.
2. В (13.1.38) второе неравенство есть переформулировка (13.1.35). А первое доказывается це-
почкой
v v v
u n u n u n
uX u X uX
|A| = (13.1.34) = t 2
|Aei | 6 (13.1.37) 6 t kAk · |ei | = t
2 2
kAk2 = n · kAk .
i=1 i=1 i=1
причем нижняя граница достигается только если система векторов a1 , ..., ak линейно
зависима,
0 = Gram(a1 , ..., ak ) ⇐⇒ ∃i ai ∈ span{aj ; j 6= i} (13.1.40)
а верхняя (при ненулевых ai ) – только если любые два вектора ai и aj ортогональны,
40 . Линейное искажение: для любых векторов (a1 , ..., ak ) и любой матрицы M ∈ Rkk
∀i, j Gram(a1 , ..., ai , ..., aj , ..., ak ) = Gram(a1 , ..., aj , ..., ai , ..., ak ) (13.1.45)
λ1 · a1 + ... + λk · ak = 0
∀y ∈ Y y 6= 0 =⇒ q(y) > 0
Мы доказали первое неравенство в цепочке (13.1.39) и условие (13.1.40). Теперь докажем второе
неравенство и условие (13.1.41). Если система векторов (a1 , ..., ak ) линейно зависима, то, как мы
уже показали, ее определитель Грама Gram(a1 , ..., ak ) равен нулю, и тогда неравенство
выполняется автоматически. Поэтому для нас важен случай, когда система (a1 , ..., ak ) линейно неза-
висима. Тогда любая ее подсистема (a1 , ..., ai ), 1 6 i 6 k, также будет линейно независима, и мы
уже показали, что определитель Грама такой системы должен быть положительным:
ha1 , a1 i ... ha1 , ai i
Gram(a1 , ..., ai ) = det ... ... ... > 0, ∀i 6 k (13.1.48)
hai , a1 i ... hai , ai i
Вдобавок, никакой вектор ei не может быть нулевым (поскольку (e1 , ..., ek ) образуют базис), и
значит |ei | > 0. В результате мы получаем систему
(
Gram(a1 , ..., ak ) = |e1 |2 · ... · |ek |2 6 |a1 |2 · ... · |ak |2
,
0 < |ei | 6 |ai |
из которой следует, во-первых, второе неравенство в цепочке (13.1.39), а, во-вторых, что равенство
возможно только при |ei | = pr{e1 ,...,ei−1 }⊥ (ai ) = |ai | для любого i = 1, ..., k, то есть, в силу (13.1.23),
при ei = ai для всех i = 1, ..., k (такое возможно только если векторы ai изначально были ортого-
нальны друг другу).
2. Докажем индуктивное равенство (13.1.42). Если векторы (a1 , ..., ak−1 , ak ) линейно зависи-
мы, то либо подсистема (a1 , ..., ak−1 ) тоже линейно зависима, и тогда Gram(a1 , ..., ak−1 , ak ) = 0 =
764 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
Gram(a1 , ..., ak−1 ), и обе части в (13.1.42) получаются нулевыми, либо подсистема (a1 , ..., ak−1 ) ли-
нейно независима, но тогда ak ∈ span{a1 , ..., ak−1 }, поэтому d = pr{a1 ,...,ak−1 }⊥ (ak ) = 0, и опять
получается, что обе части в (13.1.42) нулевые.
Таким образом, нам нужно рассмотреть случай, когда векторы (a1 , ..., ak−1 , ak ) линейно незави-
симы. Тогда получается ситуация, которую мы уже рассматривали: из-за линейной независимости
всякой подсистемы вида (a1 , ..., ai ), i 6 k, определители Грама всех этих систем будут ненулевыми
(неравенства (13.1.48)), поэтому можно применить ортогонализацию Грама-Шмидта, которая даст
ортогональный базис (e1 , ..., ek ) со свойствами:
ha1 , a1 i ... ha1 , ai i
∀i 6 k Gram(a1 , ..., ai ) = det ... ... ... = |e1 |2 · ... · |ei |2 ,
hai , a1 i ... hai , ai i
3. Докажем неравенство Адамара (13.1.43). Если векторы (a1 , ..., ak , b1 , ..., bl ) линейно зависимы,
то это неравенство выполняется автоматически, потому что слева стоит нуль, а справа – неотрица-
тельные числа:
0 6 Gram(a1 , ..., ak ) · Gram(b1 , ..., bl )
Поэтому нам нужно рассмотреть случай, когда (a1 , ..., ak , b1 , ..., bl ) – линейно независимая система.
Здесь мы организуем индукцию по числу l ∈ N. Прежде всего, при l = 1 мы получаем:
2
Gram(a1 , ..., ak , b1 ) = (13.1.42) = Gram(a1 , ..., ak ) · pr{a1 ,...,ak }⊥ (b1 ) 6
6 Gram(a1 , ..., ak ) · |b1 |2 = Gram(a1 , ..., ak ) · Gram(b1 )
Далее мы предполагаем, что неравенство (13.1.43) верно при некотором l. Тогда для l + 1 мы полу-
чаем:
предположение индукции z }| {
z }| { 2
Gram(a1 , ..., ak , b1 , ..., bl , bl+1 ) = (13.1.42) = Gram(a1 , ..., ak , b1 , ..., bl ) · pr{a1 ,...,ak ,b1 ,...,bl }⊥ (bl+1 ) 6
2
6 Gram(a1 , ..., ak ) · Gram(b1 , ..., bl ) · pr{b1 ,...,bl }⊥ (bl+1 ) 6 Gram(a1 , ..., ak ) · Gram(b1 , ..., bl , bl+1 )
| {z }
k
Gram(b1 , ..., bl , bl+1 ),
в силу (13.1.42)
⇓
§ 1. Евклидовы пространства 765
ha1 , a1 i ha1 , a2 i ... ha1 , an i
ha2 , a1 i ha2 , a2 i ... ha2 , an i
=
... ... ... ...
han , a1 i han , a2 i ... han , an i
ha1 , e1 i ha1 , e2 i ... ha1 , en i he1 , a1 i he1 , a2 i ... he1 , an i
ha2 , e1 i ha2 , e2 i ... ha2 , en i
= · he2 , a1 i he2 , a2 i ... he2 , an i =
... ... ... ... ... ... ... ...
han , e1 i han , e2 i ... han , en i hen , a1 i hen , a2 i ... hen , an i
⊤
ha1 , e1 i ha1 , e2 i ... ha1 , en i ha1 , e1 i ha1 , e2 i ... ha1 , en i
ha2 , e1 i ha2 , e2 i ... ha2 , en i ha2 , e1 i ha2 , e2 i ... ha2 , en i
=
...
·
... ... ... ... ... ... ...
han , e1 i han , e2 i ... han , en i han , e1 i han , e2 i ... han , en i
ha1 , a1 i ha1 , a2 i ... ha1 , an i
ha2 , a1 i ha2 , a2 i ... ha2 , an i
det
...
=
... ... ...
han , a1 i han , a2 i ... han , an i
⊤
ha1 , e1 i ha1 , e2 i ... ha1 , en i ha1 , e1 i ha1 , e2 i ... ha1 , en i
ha2 , e1 i ha2 , e2 i ... ha2 , en i ha2 , e1 i ha2 , e2 i ... ha2 , en i
= det
...
· det =
... ... ... ... ... ... ...
han , e1 i han , e2 i ... han , en i han , e1 i han , e2 i ... han , en i
2
ha1 , e1 i ha1 , e2 i ... ha1 , en i
ha2 , e1 i ha2 , e2 i ... ha2 , en i
= (12.3.152) =
det ...
... ... ...
han , e1 i han , e2 i ... han , en i
6. Если векторы ai линейно независимы, то формула (13.1.47) сразу следует из (13.1.26). Если
же они линейно зависимы, то в (13.1.47) левая часть будет нулевой в силу уже доказанного свойства
(13.1.40), а правая – потому что какой-то вектор ei окажется нулевым.
∀j ∈ M hai , aj i = 0,
и3
haτL (1) , aτM (1) i ... haτL (1) , aτM (m) i
aL | aM = aτL (1) , ..., aτL (m) | aτM (1) , ..., aτM (m) = det ... ... ... =0
haτL (m) , aτM (1) i ... haτL (m) , aτM (m) i
и положим
X X X
p | q := pL · q M · aL | aM = pM · q M (13.1.54)
card L=m card M=m
| {z } card M=m
( k (13.1.50)
0, L 6= M
1, L=M
(p, q) 7→ p | q
?
β(∨m (x1 , ..., xm ), ∨m (y1 , ..., ym )) = x1 ∨ ... ∨ xm | y1 ∨ ... ∨ ym = x1 , ..., xm | y1 , ..., ym =
= α(x1 , ..., xm , y1 , ..., ym ).
Поскольку эти отображения полилинейны по аргументам x1 , ..., xm , y1 , ..., ym , это равенство доста-
точно доказать, подставляя вместо xk и yl элементы базиса a1 , ..., an :
?
ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm = ak1 , ..., akm | al1 , ..., alm (13.1.55)
Заметим, что если в последовательности k1 , ..., km или в последовательности l1 , ..., lm есть повторя-
ющиеся индексы, то обе части равенства будут равны нулю, и оно выполняется автоматически:
ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm = 0 = ak1 , ..., akm | al1 , ..., alm .
Поэтому важно проверить равенство в случае, когда в k1 , ..., km и l1 , ..., lm нет повторяющихся индек-
сов. Это, в свою очередь, сводится к случаю, когда последовательности k1 , ..., km и l1 , ..., lm строго
возрастают. Действительно, выбрав перестановки σ, τ ∈ Σm так, чтобы
kσ(1) < ... < kσ(m) , lτ (1) < ... < lτ (m) ,
Итак, можно считать, что последовательности индексов k1 , ..., km и l1 , ..., lm строго возрастают.
Тогда они представляют собой отображения нумерации4 τK и τL неких множеств K, L ⊆ {1, ..., n}.
Тогда при K 6= L мы получаем:
а при K = L
Доказательство. p
|x ∨ y| = (13.1.52) = Gram(x, y) 6 (13.1.39) 6 |x| · |y|
2 2 2 2 2 2
|ϕ(x)| + |ϕ(y)| − |ϕ(x) − ϕ(y)| |ϕ(x)| + |ϕ(y)| − |ϕ(x − y)|
ϕ(x), ϕ(y) = (13.1.1) = = =
2 2
2 2 2
|x| + |y| − |x − y|
= (13.1.59) = = (13.1.1) = hx, yi.
2
Нужно только еще проверить, что ϕ – линейный оператор. Для этого зафиксируем какой-нибудь
ортогональный нормированный базис e (существование которого гарантируется теоремой 13.1.6).
Из уже доказанного свойства (13.1.57) следуют равенства
(
1, i = j
ϕ(ei ), ϕ(ej ) = hei , ej i =
0, i 6= j
означающие, что векторы ϕ(e1 ), ..., ϕ(en ) тоже образуют ортогональный нормированный базис в X.
Теперь для всякого вектора x ∈ X мы получаем
n
X n
X
ϕ(x) = hϕ(x), ϕ(ei )i · ϕ(ei ) = (13.1.57) = hx, ei i · ϕ(ei )
i=1 i=1
Отсюда мы получаем:
§ 1. Евклидовы пространства 769
n
X n
X
ϕ(α · x + β · y) = hα · x + β · y, ei i · ϕ(ei ) = α · hx, ei i + β · hy, ei i · ϕ(ei ) =
i=1 i=1
n
X n
X
=α· hx, ei i · ϕ(ei ) + β · hy, ei i · ϕ(ei ) = α · ϕ(x) + β · ϕ(y)
i=1 i=1
Значит, оно является изометрией. Вдобавок, поскольку размерность Rn такая же как у X, по тео-
реме 13.1.15, ϕ является биекцией, и значит, изоморфизмом евклидовых пространств (впрочем,
биективность ϕ видна из его определения).
ϕ(0) = Φ(0) − a = 0.
То есть ϕ удовлетворяет также условию (13.1.59). Поэтому по теореме 13.1.14, ϕ является изомет-
рией.
Следствие 13.1.18. Всякое движение Φ : X → X в евклидовом пространстве X является биек-
цией.
Доказательство. Разложим Φ в композицию изометрии и сдвига, по теореме 13.1.17:
Φ(x) = ϕ(x) + a, x ∈ X.
xm −→ x
m→∞
|xm − x| −→ 0 (13.2.62)
m→∞
|xm − x| −→ 0
m→∞
m
r 2 2
x1m − x1 + ... + xnm − xn −→ 0
m→∞
m |Am | =
s 2 2
1 πm 1 πm
∀ i = 1, ..., n xim − xi −→ 0 = cos −0 + sin −0 =
m→∞ m 2 m 2
r
m 1 πm πm 1
= cos2 + sin2 = −→ 0
m 2 2 m m→∞
∀ i = 1, ..., n xim −→ xi
m→∞
Второй способ – проверить, что каждая коорди-
ната точки Am стремится к соотвествующей ко-
772 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
⋄ 13.2.5. Рассмотрим на плоскости R2 множе- для E, потому что ее окрестность U 12 (A) (с ра-
ство точек с неотрицательной ординатой: диусом ε = 21 ) содержится в множестве E. Более
n o
того, любая точка B(x; y) с ординатой y > 0 то-
E = (x; y) : y > 0
же будет внутренней для E (потому что в этом
случае можно взять ε = y2 ).
Наоборот, точка C(0; 0) не будет внутренней
для E потому что никакая ее окрестность не бу-
дет содержаться в E.
∀x ∈ E ∃ε > 0 Uε (x) ⊆ E
Теорема 13.2.5. Множество E ⊆ X открыто тогда и только тогда, когда оно совпадает со
своей внутренностью:
E – открыто ⇐⇒ Int(E) = E
⋄ 13.2.7. Покажем, что любой интервал (a, b) на разом, любая точка x ∈ (a, b) автоматически яв-
прямой R является открытым множеством. Возь- ляется внутренней точкой для (a, b), значит (a, b)
мем какую-нибудь
n o x ∈ (a, b), и положим действительно является открытым множеством.
точку
ε = min |x − a|, |b − x| .
Предложение 13.2.7. На прямой R всякое от-
крытое множество U представляет собой объ-
единение некоторой последовательности (воз-
можно, конечной) интервалов:
∞
[
U= (ai , bi )
i=1
то есть x – внутренняя точка для (a, b). Таким об- второе открыто, а первое – нет.
Из теоремы 3.2 следует, что открытые множества характеризуются тем свойством, что после-
довательность, стремящаяся к какой-нибудь точке такого множества, обязательно заходит в это
множество:
xm −→ x ∈ E =⇒ ∃N ∀m > N xm ∈ E
m→∞
∀ε > 0 E ∩ Uε (x) 6= ∅
(то есть требуется, чтобы пересечение E ∩ Uε (x) множества E с любой окрестностью Uε (x) было
непусто).
⋄ 13.2.10. Рассмотрим на плоскости R2 множе- 0; 2ε , или саму точку C(0, 0)). Более того, лю-
ство точек с неотрицательной ординатой: бая точка B(x; y) с ординатой y > 0 будет точкой
n o прикосновения для E (потому что в этом случае
E = (x; y) : y > 0 B ∈ E ∩ Uε (B)).
Наоборот, точка D(0; −1) не будет точкой
Точка C(0, 0) является точкой прикосновения прикосновения для E, потому что, например, ее
для E, потому что любая ее окрестность Uε (C) окрестность U 12 (D) (с радиусом ε = 21 ) не будет
содержит точки множества E (например, точку пересекаться с E.
Доказательство. 1. (i) ⇒ (ii) Пусть x – точка прикосновения для E, то есть такая точка, у
которой всякая окрестность Uε (x) пересекается с E.
∀ε > 0 E ∩ Uε (x) 6= ∅
В частности, это должно выполняться для окрестностей вида U m1 (x).
∀m ∈ N E ∩ U m1 (x) 6= ∅
Значит, можно выбрать точки xm :
xm ∈ E ∩ U m1 (x)
Мы получим некоторую последовательность {xm }. Покажем, что она стремится к x. Для этого
выпишем логическую цепочку:
xm ∈ U m1 (x)
⇓
1
0 6 |xm − x| < −→ 0
m m→∞
⇓
|xm − x| −→ 0
m→∞
⇓
xm −→ x
m→∞
2. Импликация (ii) ⇒ (iii) очевидна.
3. (iii) ⇒ (i) Пусть наоборот, имеется последовательность {xm } стремящаяся к x, у которой
почти все элементы лежат в E.
xm −→ x, & ∃N ∀m > N xm ∈ E (13.2.64)
m→∞
Теорема 13.2.11. Множество E ⊆ X замкнуто тогда и только тогда, когда оно совпадает со
своим замыканием:
E – замкнуто ⇐⇒ E = E
Теорема 13.2.12. Замыкание E произвольного множества E ⊆ X есть наименьшее замкнутое
множество, содержащее E.
xm −→ x
m→∞
Поскольку xm ∈ [a, b], должны выполняться Мы получили, что любая точка прикосновения
неравенства x для [a, b] автоматически принадлежит [a, b],
то есть [a, b] действительно является замкнутым
множеством.
a 6 xm 6 b
⊲ 13.2.13. Проверьте, что из множеств на плос-
кости
Поэтому, по теореме о переходе к пределу в нера-
n o n o
венстве E = (x; y) : y > 0 , N = (x; y) : y > 0 ,
x ←− x ∈E =⇒ x∈E
∞←m | m{z }
выполняется
для почти всех m
Доказательство. 1. (i) ⇒ (ii) Пусть множество E замкнуто, покажем что тогда выполняется
(ii). Возьмем сходящуюся последовательность xm −→ x, почти все элементы которой лежат в E:
m→∞
∃N ∀m > N xm ∈ E
Тогда по теореме 13.2.9, x должна быть точкой прикосновения для E, значит, поскольку E замкнуто,
x ∈ E.
2. Импликация (ii) ⇒ (iii) очевидна.
3. (iii) ⇒ (i) Наоборот, пусть выполняется (ii), покажем что тогда множество E замкнуто.
Возьмем какую-нибудь точку прикосновения x для E. По теореме 13.2.9, найдется последователь-
ность {xm } стремящаяся к x
xm −→ x
m→∞
∃N ∀m > N xm ∈ E
По свойству (ii) это означает, что x ∈ E. Мы получили, что всякая точка прикосновения x для E
обязательно должна лежать в E. Значит E – замкнутое множество.
x∈
/E
⇓
x∈L
Мы получили, что любая точка прикосновения x для множества L автоматически принадлежит L.
Это означает, что L – замкнутое множество.
2. Предположим, что наоборот, E замкнуто, то есть любая точка прикосновения x для E автома-
тически лежит в E. Отсюда следует, что если x не лежит в E, то x не является точкой прикосновения
для E:
x∈/ E =⇒ x – не точка прикосновения для E (13.2.66)
Запомним это, и покажем, что тогда L открыто.
Возьмем любую точку x из L. Получаем следующую логическую цепочку:
x∈L
⇓
x∈
/E
⇓ (13.2.66)
D \ E = {x ∈ D : x ∈
/ E}
Вместе с теоремой 13.2.14 эта формула делает очевидным следующее свойство разности множеств:
Теорема 13.2.15. Пусть U – открытое, а M – замкнутое множества в евклидовом простран-
стве X. Тогда
– разность U \ M – открытое множество в X;
– разность M \ U – замкнутое множество в X.
Rn \ M = Rn \ Int(M ) (13.2.67)
n n
Int(R \ M ) = R \ M (13.2.68)
Теорема 13.2.18. Граница Fr(E) произвольного множества E ⊆ X есть разность между замы-
канием и внутренностью множества E:
Fr(E) = E \ Int(E)
Fr(A ∪ B) ⊆ Fr(A) ∪ Fr(B), Fr(A ∩ B) ⊆ Fr(A) ∪ Fr(B), Fr(A\B) ⊆ Fr(A) ∪ Fr(B) (13.2.69)
Ядро и нарост.
• Для всякого замкнутого множества E в евклидовом пространстве X
– его ядром называется замыкание его внутренности:
D = Nuc(D) = Int(D)
Int(X \ M ) = ∅.
Связные множества.
• Множество M в евклидовом пространстве X называется
— несвязным, если в X найдутся два непересекающихся открытых множества U
и V , объедиение которых содержит M :
M ⊆U ∪V & U ∩ V = ∅,
— связным, если таких множеств нет, то есть если любые два открытые множества
U и V в X, объедиение которых содержит M , обязательно пересекаются:
M ⊆U ∪V =⇒ U ∩ V 6= ∅.
§3 Компактность и паракомпактность
(a) Ограниченные множества
• Множество E в евклидовом пространстве X называется ограниченным, если оно содер-
жится в некотором шаре Br (0):
∃r > 0 E ⊆ Br (0)
diam E = sup |x − y|
x,y∈E
xm
mk −→ +∞
k→∞
Свойства подпоследовательностей
1◦ . Если последовательность {xm } стремится к точке a ∈ X, то любая ее подпоследователь-
ность {xmk } тоже стремится к a:
xm −→ a =⇒ xmk −→ a
m→∞ k→∞
и положим:
K = {x ∈ Rn : xi ∈ [ai , bi ]}
Тогда, во-первых,
v
uX
u n
∀i = 1, ..., n ∀x, y ∈ B |y − x | 6 t
i i
|y j − xj |2 = |y − x| 6 diam B
j=1
И, во-вторых,
∀i = 1, ..., n B i ⊆ [ai , bi ]
B ⊆ {x ∈ Rn : xi ∈ [ai , bi ]}
x1m ⊆ [a1 , b1 ].
xm ∈ K
xmk −→ x
k→∞
Критерий компактности
xm −→ x
m→∞
∀m ∈ N K 6⊆ Um (0)
Это значит, что для всякого m ∈ N можно выбрать точку xm ∈ K которая не будет лежать в Um (0):
∀m ∈ N xm ∈ K & xm ∈
/ Um (0)
|xm | > m
|xm | −→ +∞
m→∞
Ясно, что тогда любая подпоследовательность {xmk } тоже будет стремиться к бесконечности:
|xmk | −→ +∞
k→∞
⇓
|xmk − x| > |xmk | − |x| −→ +∞ − |x| = +∞
k→∞
⇓
|xmk − x| −→ +∞
k→∞
xmk −→ x
k→∞
При этом, поскольку xmk ∈ K, а K – замкнутое множество, по теореме 13.2.13 получаем что x ∈ K.
Мы доказали, что всякая последовательность {xm } точек из K содержит подпоследовательность
{xmk }, сходящуюся к точке из K. Это значит, что K – компактное множество.
Следствие 13.3.5. Замкнутое подмножество в компакте само является компактом.
Доказательство. Если A – компакт в Rn и B – замкнутое подмножество в A, то B замкнуто и
ограничено в Rn , и значит, по критерию компактности 13.3.4 B тоже является компактом.
⋄ 13.3.4 (сходящиеся последовательности как является компактом в Rn (потому что оно за-
компакты). Из теоремы 13.3.4 следует, что ес- мкнуто и ограничено).
ли {xk } – сходящаяся последовательность в Rn ,
и x – ее предел, Сходящиеся последовательности могут счи-
таться примерами “сложно устроенных” компак-
xk −→ x, тов, потому что, если xk попарно не совпадают,
k→∞
то множество то M состоит из бесконечного набора компонент
связности6 – отдельно стоящих точек xk (и x, ес-
M = {x} ∪ {xk ; k ∈ N} ли она не совпадает ни с какой xk ).
6 Компоненты связности были определены на с.781.
786 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
Отделимость компакта.
Теорема 13.3.6 (об отделимости компакта). Пусть E и K – непересекающиеся множества в
евклидовом пространстве X
K ∩E =∅ (13.3.72)
причем K – компакт, а E – замкнуто в X. Тогда найдется такое число ε > 0 что расстояние
между любыми точками из K и E не меньше ε:
∀ε > 0 ∃x ∈ K ∃y ∈ E |x − y| 6 ε (13.3.74)
1
Тогда, в частности, для ε = m получим:
1 1
∀ε = ∃xm ∈ K ∃ym ∈ E |xm − ym | 6
m m
Поскольку K – компакт, из последовательности xm ∈ K можно выбрать сходящуюся подпоследо-
вательность:
xmk −→ a ∈ K
k→∞
Поскольку E замкнуто, и ymk ∈ E, это означает, что a ∈ E. Таким образом, точка a лежит в обоих
множествах K и E:
a ∈ K ∩ E,
что противоречит условию (13.3.72). Это противоречие означает, что наше предположение (13.3.74)
неверно. Значит, должно быть верно (13.3.73).
• Для всякого множества A ⊆ Rn и любого числа ε > 0 множество точек, отстоящих от A
не более чем на ε n o
Bε (A) = y ∈ Rn : ∀x ∈ A |y − x| 6 ε (13.3.75)
A⊆U
Bε (K) ⊆ U (13.3.77)
7 Этот результат используется при доказательстве леммы 15.3.2 и теоремы 14.1.13
§ 3. Компактность и паракомпактность 787
∀x ∈ K ∀y ∈ E |x − y| > ε
y ∈ Bε (K) =⇒ ∃x ∈ K |y − x| 6 ε =⇒ / E = Rn \U
y∈ =⇒ y∈U
Стягивание к компакту.
• Последовательность компактов Ki называется сужающейся, если в ней каждый следую-
щий компакт содержится в предыдущем:
xit ∈ Kit , xit+1 ∈ Kit+1 ⊆ Kit , xit+2 ∈ Kit+2 ⊆ Kit+1 ⊆ Kit , ...
Это верно для любого t ∈ N. То есть точка x принадлежит каждому компакту вида Kit . Отсюда
следует, что x принадлежит каждому компакту вида Ki , потому что выбрав для данного i номер t
так, чтобы it > i, мы получим:
x ∈ Kit ⊆ Ki
То есть x принадлежит пересечению компактов Ki ,
∞
\
x∈ Ki
i=1
∃i0 ∈ N ∀i > i0 Ki ⊂ U
Доказательство. Предположим, что это не так, то есть что существует последовательность индек-
сов is −→ ∞ такая, что
s→∞
Kis 6⊆ U
Для каждого s выберем точку
xs ∈ Kis \ U (13.3.78)
Поскольку все компакты Kis содержатся в компакте K1 , последовательность xs тоже лежит в K1 ,
и значит из нее можно выбрать сходящуюся подпоследовательность
xsj −→ x
j→∞
T∞
Точно так же, как при доказательстве теоремы 13.3.8 можно убедиться, что x ∈ K = i=1 Ki .
Поскольку K ⊆ U , мы получаем, что
x∈U
При этом U – открытое множество, значит x – внутренняя точка для U . Следовательно, по теореме
13.2.3, почти все элементы последовательности xsj должны лежать в U :
∃j0 ∀j > j0 xsj ∈ U
Но это противоречит условию (13.3.78), согласно которому все xs должны лежать вне U .
8 Связные множества были определены на с.781.
§ 3. Компактность и паракомпактность 789
Доказательство. Это можно доказывать по-разному, например, можно в качестве Ki взять мно-
жества
n 1
Ki = x ∈ R : |x| 6 i & inf |x − y| >
y ∈U
/ i
Всякое такое Ki замкнуто и ограничено, значит компактно. Покажем, что Ki исчерпывают U . Пусть
x ∈ U , тогда найдется ε > 0 такое, что
Uε (x) ⊆ U,
поэтому
inf |x − y| > ε > 0
y ∈U
/
|x| 6 m
Взяв
i = max{l, m}
мы получим:
1 1
|x| 6 m 6 i & inf |x − y| > > ,
y ∈U
/ l i
то есть
x ∈ Ki .
Таким образом, для каждого x ∈ U найдется i ∈ N такое, что x ∈ Ki , и это означает, что справедливо
(13.3.79).
K ⊆ Q1
Система {Ui ; i ∈ I} является покрытием всего Rn , значит, в частности, она покрывает и Q1 . При
этом, из нее невозможно выделить конечное подпокрытие для Q1 , потому что оно было бы конечным
подпокрытием для K.
Теперь разделим каждый отрезок [ai , bi ] пополам. Тогда клетка Q1 разделится на 2n клеток
P1 , ..., P2n :
Q1 = P1 ∪ ... ∪ P2n
Среди этих маленьких клеток P1 , ..., P2n найдется хотя бы одна Pj , для которой покрытие {Ui ; i ∈ I}
не содержит конечного подпокрытия (потому что иначе получилось бы, что у объединения этих
клеток P1 ∪ ... ∪ P2n = Q1 тоже есть конечное подпокрытие). Обозначим эту клетку Pj символом
Q2 :
Q2 = Pj
Затем повторим эту процедуру: поделим каждое ребро клетки Q2 пополам, тогда Q2 разделится
на 2n клеток P1 , ..., P2n ,
Q2 = P1 ∪ ... ∪ P2n ,
и опять среди этих маленьких клеток P1 , ..., P2n найдется хотя бы одна Pj , для которой покрытие
{Ui ; i ∈ I} не содержит конечного подпокрытия (потому что иначе получилось бы, что для Q2 тоже
есть конечное подпокрытие). Мы обозначаем эту клетку Pj символом Q3 :
Q3 = Pj
x ∈ Uε (x) ⊆ Ui
§ 3. Компактность и паракомпактность 791
diam Qk < ε
Для этого индекса k множество Qk должно содержаться в Uε (x), потому что если y ∈ Qk , то
|y − x| 6 diam Qk < ε. Значит
Qk ⊆ Uε (x) ⊆ Ui
Мы получаем, что множество Ui уже образует покрытие клетки Qk . Это противоречит выбору
клеток Qk , по которому система {Ui ; i ∈ I} не допускает конечного подпокрытия для Qk .
2. Предположим теперь, что K – не компакт, то есть что существует последовательность {xk } ⊆
K, такая, что никакая ее подпоследовательность не сходится к точке из K. Это значит, в частности,
что точки {xk } не могут бесконечно повторяться, то есть равенство вида
xk = x
не может выполняться для бесконечного набора индексов k (потому что тогда точка x была бы пре-
делом некоторой подпоследовательности xki ). Отсюда, в свою очередь, следует, что можно выбро-
сить из {xk } повторяющиеся точки, если такие найдутся, и добиться, чтобы точки не повторялись.
Далее, пусть x ∈ K. Тогда найдется выколотая окрестность U̇ε (x), не содержащая точек {xk }
(если бы это было не так, то есть если бы любая выколотая окрестность U̇ε (x) содержала точку из
{xk }, то x была бы пределом некоторой подпоследовательности {xki }). Итак, выберем для каждой
точки x ∈ K число εx так, чтобы выколотая окрестность U̇εx (x) не содержала бы точек {xk }. Тогда
обычная, невыколотая окрестность Uεx (x) будет содержать точку x, и
— / {xk }, то Uεx (x) ∩ {xk ; k ∈ N} = ∅,
если x ∈
— если x ∈ {xk }, то Uεx (x) ∩ {xk ; k ∈ N} = {x},
Поглядим теперь на полученные множества Uεx (x), x ∈ K. Это будет система открытых мно-
жеств, покрывающая K: [
K⊆ Uεx (x)
x∈K
(потому что ∀x ∈ K x ∈ Uεx (x)). Но из этого покрытия невозможно выделить конечное подпокры-
тие, потому что всякая конечная подсистема {Uεxi (xi ); i = 1, ..., m} будет содержать не больше m
точек последовательности {xk } (из-за того, что каждое Uεxi (xi ) содержит не больше одной такой
точки).
Теорема 13.3.12 (свойство равномерности открытого покрытия компакта). Если U1 , ..., Uk – от-
крытое покрытие компакта K в евклидовом пространстве X, то найдется число δ > 0 такое,
что всякое множество A в Rn , пересекающееся с K и имеющее диаметр, меньший δ, обязательно
содержится в некотором Us :
A ∩ K 6= ∅, diam A < δ =⇒ ∃s ∈ {1, ..., k} A ⊆ Us . (13.3.80)
Поскольку x ∈ K ⊆ U1 ∪...∪Ul , найдется индекс s ∈ {1, ..., k} такой, что x ∈ Us . При этом множество
Us открыто, поэтому x содержится в Us вместе с некоторой своей окрестностью Uε (x):
Uε (x) ⊆ Us , ε>0
1
(первое можно обеспечить, поскольку ali −→ x, а второе – поскольку diam Al < l ). Тогда мы
i→∞
получим:
ε ε
∀b ∈ Al |b − x| 6 |b − al | + |al − x| 6 diam Al + |al − x| < + = ε,
2 2
поэтому
∀b ∈ Al b ∈ Uε (x) ⊆ Us ,
то есть Al ⊆ Us , что противоречит выбору последовательности {Al }.
Счетные подпокрытия.
Возьмем теперь первый компакт K1 . Поскольку множества {Ui ; i ∈ I} покрывают его, среди них
найдется конечное подпокрытие Ui1 , ..., Uil1 :
Рассмотрим далее второй компакт K2 . Опять поскольку множества {Ui ; i ∈ I} покрывают его,
среди них найдется конечное подпокрытие, обозначим его Uil1 +1 , ..., Uil1 +l2 :
Отсюда получаем:
∞
[ ∞
[
U= Km ⊆ Uis
m=1 s=1
Для каждой точки x ∈ U выберем такое ε(x) > 0 и рассмотрим семейство множеств {U ε(x) (x); x ∈
3
U }. Поскольку каждое x ∈ U лежит в своей окрестности U ε(x) (x), мы получаем, что семейство
3
{U ε(x) (x); x ∈ U } есть покрытие множества U .
3
[
U= U ε(x) (x)
3
x∈U
Применим к этому покрытию теорему 13.3.13 и выделим из него некоторое счетное подпокрытие:
∞
[
U= U ε(xj ) (xj )
3
j=1
∀k < j(x) x∈
/ U 2ε(xk ) (xk )
3
⇓
∀k < j(x) x∈
/ B ε(xk ) (xk )
3
⇓
x ∈ U ε(xj(x) ) (xj(x) ) & ∀k < j(x) x∈
/ B ε(xk ) (xk )
3 3
⇓
794 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
x ∈ Uε(xj(x) ) (xj(x) ) \ B ε(x1 ) (x1 ) ∪ B ε(x2 ) (x2 ) ∪ ... ∪ B ε(xj(x)−1 ) (xj(x)−1 ) = Vj(x)
3 3 3
Наконец, покажем, что {Vj } локально конечно. Пусть x ∈ U . Выберем k так, чтобы
x ∈ U ε(xk ) (xk )
3
U ε(xk ) (xk ) ∩ Vj = ∅
3
⇓
Uδ (x) ∩ Vj = ∅
То есть, окрестность Uδ (x) точки x может пересекаться только с конечным набором множеств Vj ,
а именно с теми, у которых номер не больше k.
Теорема 13.3.15. В любое открытое покрытие {Ui ; i ∈ I} открытого множества U в евкли-
довом пространстве X можно комбинаторно вписать локально конечное открытое покрытие
{Wi ; i ∈ I} множества U .
Доказательство. По теореме 13.3.14 в {Ui ; i ∈ I} можно вписать локально конечное открытое
покрытие {Vj ; j ∈ J}:
∀j ∈ J ∃i ∈ I Vj ⊆ Ui
Зафиксируем для каждого индекса j ∈ J какой-нибудь индекс f (j) ∈ I такой, что
Vj ⊆ Uf (j)
(объединяются все множества Vj , у которых индекс j обладает свойством f (j) = i). Тогда
1) множества Wi будут открытыми, как объединения открытых множеств,
2) получающееся семейство {Wi ; i ∈ I} будет покрытием для U , потому что
[ [ [ [ [
Wi ⊇ Wf (k) = Vj = Vj = U
i∈I k∈J k∈J j∈J : j∈J
f (j) = f (k)
3) семейство {Wi ; i ∈ I} будет комбинаторно вписано в семейство {Ui ; i ∈ I}, потому что
∀j ∈ J Vj ⊆ Uf (j)
⇓
∀j ∈ J f (j) = i =⇒ Vj ⊆ Ui
⇓
[ [
Wi = Vj = (13.3.81) = Vj ⊆ Ui
j∈J : j∈J :
f (j) = i f (j) = i
§ 3. Компактность и паракомпактность 795
Jx = {j ∈ J : Vj ∩ Uε (x) 6= ∅}
Ix = {i ∈ I : Wi ∩ Uε (x) 6= ∅}
тоже будет конечно, потому что оно является образом конечного множества Jx при отоб-
ражении f : J → I:
Ix = f (Jx )
это доказывается следующей цепочкой:
i ∈ Ix
m
[ [ [
Vj ∩Uε (x) = Vj ∩Uε (x) = (13.3.81) = Vj ∩Uε (x) = Wi ∩Uε (x) 6= ∅
j∈J : j∈J : j∈J :
f (j) = i f (j) = i f (j) = i
m
∃j ∈ J f (j) = i & Vj ∩ Uε (x) 6= ∅
m
∃j ∈ J f (j) = i & j ∈ Jx
m
∃j ∈ Jx f (j) = i
m
f (Jx ) ∋ i.
Глава 14
ГЛАДКАЯ СТРУКТУРА НА
ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
Эти примеры иллюстрируют часто встречающуюся в природе ситуацию, когда одна физическая
величина выражается сразу через несколько других. Необходимость изучать такого рода зависимо-
сти как раз и привела к понятию функции многих переменных. Формально под этим понимается
обобщение понятия числовой функции (определенной на с.188), в котором область определения счи-
тается подмножеством (не на прямой R, а) в каком-нибудь координатном пространстве Rn (или Rn ).
Чтобы не отвлекать внимание на несущественные детали, мы будем заменять Rn более абстрактным
объектом, произвольным евклидовым пространством X.
• Числовой функцией на евклидовом пространстве X называется произвольное отображе-
ние f : D(f ) → R, у которого область определения D(f ) содержится в X. В дальнейшем
мы будем использовать в таких случаях запись
f : X ֒→ R
(которая будет означать, что f является функцией с областью определения D(f ) ⊆ X).
796
§ 1. Гладкие функции на евклидовых пространствах 797
xm −→ a (xm ∈ E)
m→∞
Доказательство. Это утверждение доказывается так же, как теоремы Вейерштрасса 3.3.7 и 3.3.8
для одномерного случая.
1. Сначала доказывается, что f ограничена на E. Предположим обратное, то есть что f не огра-
ничена на E. Значит f не ограничена сверху или снизу. Пусть для определенности f не ограничена
сверху:
∀B ∈ R ∃x ∈ E f (x) > B
Тогда для всякого m ∈ N можно подобрать точку xm ∈ E такую, что
xmk −→ c ∈ E (14.1.4)
k→∞
Мы получили противоречие между (14.1.5) и (14.1.6), которое означает, что наше исходное предпо-
ложение было неверно. Значит, функция f все-таки ограничена.
2. Затем доказывается, что f достигает нижней и верхней грани на E. Например, докажем
существование максимума. Поскольку, как мы уже убедились, функция f ограничена сверху на E
∃C ∀x ∈ E f (x) 6 C,
по теореме 2.1.23 о точной границе, мы получаем, что у функции f существует точная верхняя
грань на этом множестве:
∃ sup f (x) = H
x∈E
∀x ∈ E f (x) 6 H (14.1.7)
и во-вторых если взять любое число α < H, то обязательно оно окажется меньше, чем какое-то
значение f на E
∀α < H ∃x ∈ E α < f (x)
1
Возьмем в качестве α числа вида H − m . Тогда у нас получится целая последовательность {xm }:
1
∀m ∈ N ∃xm ∈ E H− < f (xm ) (14.1.8)
m
Поскольку последовательность {xm } лежит в E, она ограничена. Значит по теореме Больцано-
Вейерштрасса 3.2.13, из нее можно выбрать сходящуюся подпоследовательность:
xmk −→ c (c ∈ E)
k→∞
f (xmk ) −→ f (c)
k→∞
то есть
f (c) = H
Еще раз вспомнив 14.1.7, получим
∀x ∈ E f (x) 6 H = f (c)
Теорема 14.1.2 (Кантора для функций многих переменных). Если функция f : X ֒→ R на евкли-
довом пространстве X определена и непрерывна на компакте K ⊆ Rn , то она равномерно непре-
рывна на этом компакте: для любых двух последовательностей аргументов αk ∈ K и βk ∈ K
стремящихся друг к другу, соответствующие последовательности значений {f (αk )} и {f (βk )}
тоже стремятся друг к другу:
∀αk , βk ∈ E αk − βk −→ 0 =⇒ f (αk ) − f (βk ) −→ 0
k→∞ k→∞
Доказательство. Это доказывается так же как теорема Кантора в одномерном случае (часть I
с.253).
Теорема 14.1.3 (Коши о промежуточном значении для функций многих переменных). Пусть M
– связное множество в евклидовом пространстве X и f : M → R – непрерывная функция. Для
любых двух точек a, b ∈ M , таких, что f (a) 6= f (b), и любого числа C, лежащего между f (a) и
f (b),
f (a) < C < f (b) или f (a) > C > f (b)
найдется точка c ∈ M такая, что
f (c) = C
xm −→ a
m→∞
и не попадающей в a
∀m ∈ N xm 6= a
соответствующая последовательность {f (xm )} значений функции f стремится к A:
f (xm ) −→ A
m→∞
xm −→ a, ∀m ∈ N xm 6= a
m→∞
а с другой –
f (xm ) −→ B,
m→∞
Для этого возьмем произвольную последователь- Для этого оценим нашу дробь по модулю:
ность (xm , ym ) на плоскости R2 , сходящуюся к
точке (0, 0), но не попадающую в (0, 0) x2m · ym x2m · |ym |
06 = 6
(xm )2 + (ym )2 (xm )2 + (ym )2
(xm , ym ) −→ (0, 0), (xm , ym ) 6= (0, 0) 6 (2.1.207), (2.1.209) 6
m→∞
3
max{|xm |, |ym |}
Это означает, что последовательности {xm } и 6 2 = max{|xm |, |ym |} m→∞
−→ 0
{ym } должны обладать следующими свойства- max{|xm |, |ym |}
ми:
xm −→ 0, По теореме о двух милиционерах, это означает,
m→∞ что
ym −→ 0, x2m · ym
m→∞
−→ 0,
2 2
(xm ) + (ym ) 6= 0 (xm )2 + (ym )2 m→∞
§ 1. Гладкие функции на евклидовых пространствах 801
x·y
Вывод: x2 +y 2 6−→ 0. ⋄ 14.1.13. Выясните, существует ли предел у
(x,y)→(0,0) функции
⋄ 14.1.11. Проверим соотношение x2 − y 2
f (x, y) =
|x| + |y|
sin x · y
−→ 0 в точке (0, 0) и, если да, найдите его.
max{|x|, |y|} (x,y)→(0,0) Для решения, посмотрим сначала, к чему
стремится наша функция на нескольких проб-
Берем последовательности {xm } и {ym } такие
ных последовательностях. Возьмем, например,
что
xm −→ 0, последовательность
m→∞
ym −→ 0, 1
m→∞ xm = m
(xm )2 + (ym )2 6= 0 ym = 0
802 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
x2m − ym 2 0 − m12 1
f (xm , ym ) = = −→ 0. Тогда
1 = − m m→∞
|xm | + |ym | 0+ m
1
x2 − ym2
m2 − 0
Эти два примера рождают подозрение, что f (xm , ym ) = m = 1 = 1 −→ 1
x2m + ym
2
m2 + 0
m→∞
f (x, y) стремится к нулю при (x, y) → (0, 0). По-
пробуем доказать это: Возьмем после этого другую последовательность
2
x −y 2
?
f (x, y) = −→ 0 xm = 0
|x| + |y| (x,y)→(0,0) ym = m1
+y 2 .
x2m − ym 2
x2m + ym 2
⊲⊲ 14.1.15. Проверьте, существуют ли пределы,
06 6 6
|xm | + |ym | |xm | + |ym | и если да, то найдите их:
2 √
1+x·y−1
2 max{|xm |, |ym |} 1) lim(x,y)→(0,0) x2 +y 2 ;
6 (2.1.208), (2.1.209) 6 = cos(x2 ·y)−1
max{|xm |, |ym |} 2) lim(x,y)→(0,0) ;
x4 +y 4
= 2 max{|xm |, |ym |} −→ 0 cos(x2 ·y)−1
m→∞ 3) lim(x,y)→(0,0) x2 +y 2 ;
По теореме о двух милиционерах, это означает, 4) lim(x,y)→(0,0) ln(1+x·y)
|x|+y 2 ;
что
x2m − ym 2 ln(1+x2 +y 2 )
−→ 0, 5) lim(x,y)→(0,0) max{|x|,|y|} ;
|xm | + |ym | m→∞ 2
ex+y −1
6) lim(x,y)→(0,0) x2 +|y| .
откуда и получаем (3.3).
2
x2 −y 2 ex ·y −1
Вывод: lim(x,y)→(0,0) |x|+|y| = 0. 7) lim(x,y)→(0,0) x2 +y 2 .
получим
Отсюда
f (x, y) − f (a, b) − A · (x − a) − B · (y − b)
p =
(x − a)2 + (y − b)2
x−a y−b
= ∇1 f (u, y) − A · p + ∇2 f (a, v) − B · p −→ 0.
| {z } 2
(x − a) + (y − b) 2 | {z } (x − a)2 + (y − b)2 (x,y)→(a,b)
↓ | {z } ↓ | {z }
>
>
0 0
1 1
То есть,
p
f (x, y) = f (a, b) + A · (x − a) + B · (y − b) + o (x − a)2 + (y − b)2 ,
(x,y)→(a,b)
и f дифференцируема в точке (a, b). Теперь для всякого вектора (p, q) ∈ R2 мы получим
f (a, b) + t · (p, q) − f (a, b) f (a + t · p, b + t · q) − f (a, b)
lim = lim =
t→0 t
t→0 t
1 p
= lim · A · t · p + B · t · q + o 2
(tp) + (tq) 2 =
t→0 t t→0
p
|t| 2 2
= lim A · p + B · q + · o p +q = A · p + B · q.
t→0 t t→0
Это означает, что у функции f имеется дифференциал в каждой точке (a, b) ∈ D(f ), и он имеет вид
В этом случае частные производные вычисляют- частная производная ∇1 f вычисляется как ре-
ся по формуле зультат формальной операции дифференцирова-
ния по переменной x:
f (a + t · ei ) − f (a)
∇i f (a) = lim = ∂ 2
t→0 t ∇ 1 f (x, y) = x − 3x · y = 2x − 3y
∂x
f a1 , ..., ai + t, ..., an − f a1 , ..., ai , ..., an
= lim . И точно так же, частную производную ∇ f мож-
t→0 t 1
но найти как результат формального дифферен-
Частные производные стандартных функ- цирования по переменной y:
ций. Напомним, что числовые выражения бы- ∂ 2
ли определены на с.302 части I. На с. 806 части I ∇2 f (x, y) = x − 3x · y = 0 − 3x = −3x
∂y
было затем определено понятие производного вы-
ражения ∂x∂
(P), или ∂(P)
∂x , числового выражения В частности, в точке (−1, 2), получаются числа
P по переменной x. Там же приводились правила
вычисления производного выражения. ∇1 f (−1, 2) = −8, ∇2 f (−1, 2) = 3
∇f (a)
∂p f (a) = |∇f (a)| ⇔ p= .
|∇f (a)|
n
X i Xn h p ii
1
d f (a)[p] = (14.2.123) = d f (a)[ei ] · [p] = d f (a)[ei ] · =
i=1
e i=1
e
n
* n +
X X
= (13.1.15) = d f (a)[ei ] · hei , pi = d f (a)[ei ] · ei , p = (14.1.25) = h∇f (a), pi
i=1 i=1
∂p f (a) = (14.1.22) = h∇f (a), pi 6 (13.1.9) 6 |∇f (a)| · |p| = |∇f (a)| · 1 = |∇f (a)|,
а равенство достигается только если p сонаправлен с ∇f (a), то есть p = λ · ∇f (a), λ > 0. Поскольку
∇f (a)
|p| = 1, получаем λ · |∇f (a)| = 1 откуда λ = |∇f1(a)| . То есть p = |∇f (a)| .
◦ ◦
3. Свойство 3 есть переформулировка 2 .
f (x, y) = x2 + y 2
Поскольку
∂f (x, y) ∂f (x, y)
= 2x, = 2y
∂x ∂y Если ее наложить на рисунок из §1, где изобра-
жались линии уровня функции f (x, y) = x2 + y 2 ,
получаем то получится интригующая картинка
∇f (x, y) = (2x, 2y)
∇j ∇i f
У этих функций в свою очередь тоже можно вычислять частные производные, и так далее.
⋄ 14.1.26. Пусть ∂
∇1 ∇2 f (x, y) = 2x · y + 3y 2 = 2y,
∂x
f (x, y) = x2 + x · y 2 + y 3
тогда ∂
∇2 ∇2 f (x, y) = 2x · y + 3y 2 = 6y
∂ 2 ∂y
∇1 f (x, y) = x + x · y 2 + y 3 = 2x + y 2 ,
∂x
Можно заметить, что
∂ 2
∇2 f = x + x · y 2 + y 3 = 2x · y + 3y 2
∂y ∇2 ∇1 f (x, y) = ∇1 ∇2 f (x, y).
и
∂
∇1 ∇1 f (x, y) = 2x + y 2 = 2,
∂x Оказывается, это не случайное совпадение, это
∂ тождество выполняется для любой “достаточно
∇2 ∇1 f (x, y) = 2x + y 2 = 2y гладкой” функции.
∂y
= ∇2 ∇1 f (u, v) · (y − b) · (x − a).
С другой стороны, если при фиксированном x обозначить ψ(y) = f (x, y) − f (a, y), то
n o n o
Φ(x, y) = f (x, y) − f (a, y) − f (x, b) − f (a, b) =
= ψ(y) − ψ(b) = ∇2 ψ(ṽ) · (y − b) = v ) ·(y − b) =
∇2 f (x, ve) − ∇2 f (a, e
| {z } | {z }
k теорема Лагранжа 5.1.7 k теорема Лагранжа 5.1.7
ψ ′ (ṽ) · (y − b) ∇1 ∇2 f (e v ) · (x − a)
u, e
для некоторого для некоторого
ṽ ∈ [b, y] e ∈ [a, x]
u
= ∇1 ∇2 f (e
u, ve) · (x − a) · (y − b).
⇓ сокращаем на (x − a) · (y − b)
∇2 ∇1 f (a, b) ←− ∇2 ∇1 f (u, v) = ∇1 ∇2 f (e
u, e
v) −→ ∇1 ∇2 f (a, b)
(x,y)→(a,b) (x,y)→(a,b)
⇓
∇2 ∇1 f (a, b) = ∇1 ∇2 f (a, b).
2. Рассмотрим теперь случай произвольного n ∈ N. Зафиксируем точку a ∈ D(f ), индексы
i 6= j ∈ {1, ..., n}, и положим
ϕ(x, y) = f (a + x · ei + y · ej ), x, y ∈ R.
|k| = k1 + ... + kn = m.
∂p f : Rn ֒→ R x ∈ U 7→ ∂p f (x) ∈ R.
h(t) = f (a + tp), t ∈ R,
Тогда
2. После того, как первое равенство в (14.1.37) доказано, сгруппируем слагаемые в этой сумме
так, чтобы последовательности i1 , ..., im были представлениями одного мультииндекса и применим
формулу (12.1.13):
n
X h p iσ1 h p iσm
dm f (a)[p] = ∇σ1 ...∇σm f (a) · · ... · =
σ1 ,...,σm =1
e e
X X h p iσ1 h p iσm X m! h p ik
= ∇σ1 ...∇σm f (a) · · ... · = · ∇k f (a) ·
e e k1 ! · ... · kn ! e
|k|=m σ∈Rep(k) |k|=m
Формула Тейлора.
Теорема 14.1.12. (Тейлора с остаточным членом в форме Лагранжа) Пусть X – евклидово
пространство, функция f : X ֒→ R непрерывно дифференцируема порядка m + 1 и определена в
некоторой окрестности Uε (a) точки a ∈ X. Тогда для любой точки p ∈ Uε (0) найдется число
ξ ∈ [0, 1] такое что
1 1 1 m
f (a + p) = f (a) + d f (a)[p] + d2 f (a)[p] + ... + d f (a)[p]+
1! 2! m!
1
+ dm+1 f (a + ξp)[p] (14.1.39)
(m + 1)!
• Формула (14.1.39) называется формулой Тейлора для функции многих переменных с оста-
точным членом в форме Лагранжа.
Доказательство. Зафиксируем точку p ∈ Uε (0) и рассмотрим одномерное ограничение функции f
в точке a по направлению p:
h(t) = f (a + tp), t ∈ [0, 1]
Поскольку все производные по направлению функции f до порядка m + 1 включительно непрерыв-
ны, функция h должна быть непрерывно дифференцируема до порядка m + 1. Значит, по теореме
Тейлора 10.2.2,
1 1 1 1
h(1) = h(0) + · h′ (0) ·t + · h′′ (0) ·t2 + ... + · h(m) (0) ·tm + · h(m+1) (ξ) ·tm+1
|{z} |{z} 1! | {z } 2! | {z } m! | {z } m! | {z }
k k k k k k
f (a + p) f (a) d f (a)[p] d2 f (a)[p] dm f (a)[p] dm+1 f (a + ξ · p)[p]
! 14.1.28. Для случая двух переменных форму- А для случая трех переменных – вид
ла (14.1.39) принимает вид
1
f (a+p, b+q, c+r) = f (a, b, c)+ d f (a, b, c)(p, q, r)+
1 1!
f (a + p, b + q) = f (a, b) + d f (a, b)(p, q)+ 1 1 m
1! + d2 f (a, b, c)(p, q, r)+...+ d f (a, b, c)(p, q, r)+
1 2 1 m 2! m!
+ d f (a, b)(p, q) + ... + d f (a, b)(p, q)+ 1
2! m! + dm+1 f (a + ξp, b + ξq, c + ξr)(p, q, r)
1 m+1 (m + 1)!
+ d f (a + ξp, b + ξq)(p, q) (14.1.40)
(m + 1)! (14.1.41)
Тогда если x ∈ K и |p| 6 ε, то точка x + ξp (ξ ∈ [0, 1]) всегда принадлежит множеству Bε (K),
поэтому
1
|Rm (x, p)| = (14.1.39) = dm+1 f (x + ξp)[p] = (14.1.37) =
(m + 1)!
X (m + 1)! X (m + 1)!
= · ∇k f (x + ξp) · pk 6 · |∇k f (x + ξp)| · |pk | 6
k1 ! · ... · kn ! k1 ! · ... · kn ! | {z } |{z}
|k|=m+1 |k|=m+1
>
k
max |∇k f (y)| k
p1 1 · ... · pk
n
n
y∈Bε (K)
k
k
p1 1 · ... · pk n
n
>
• Формула (14.1.43) называется формулой Тейлора для функции многих переменных с оста-
точным членом в форме Пеано.
Доказательство. Здесь надо просто проверить, что остаток Rm (x, p) в формуле Тейлора (14.1.42)
является бесконечно малой функцией порядка |p|m при p → 0:
Rm (x, p) = o (|p|m ) .
x→a
Действительно,
Rm (x, p) M · |p|m+1
m
6 = M · |p| −→ 0.
|p| |p|m p→0
(14.1.60)
z}|{
d a · V ≡ (14.1.63) ≡ d a ·V + a · d V =
d F α ≡ α · F α−1 · d F (14.1.64)
= 0 · V + a · d V = 0 + a · d V = (14.1.51) = a · d V
F F
d a ≡ ln a · a · d F (14.1.65)
d eF ≡ eF · d F (14.1.66) ⋄ 14.1.31. Для числового выражения F и диф-
1 ференциального выражения U справедливо ра-
d loga F ≡ · d F (14.1.67) венство
F · ln a
1
d ln F ≡ · dF (14.1.68) d U · F − U · d F
U
F d ≡ (14.1.80)
d sin F ≡ cos F · d F (14.1.69) F F2
d cos F ≡ − sin F · d F (14.1.70) Дифференциал числового выражения.
1 Теорема 14.1.15. Дифференциал всякого при-
d tg F ≡ · dF (14.1.71)
cos2 F веденного числового выражения F над перемен-
1 ными x1 , ..., xn раскладывается по элементар-
d ctg F ≡ − 2 · d F (14.1.72)
sin F ным дифференциалам
1
d arcsin F ≡ √ · dF Xn
∂F
1 − F2 dF ≡ · d xi , (14.1.81)
(14.1.73) i=1
∂xi
§ 1. Гладкие функции на евклидовых пространствах 815
X
Доказательство. Это доказывается индукцией d U ≡ (14.1.56) ≡ d Fk · d xk ≡
по построению F . k∈Mn
X
1. Если F представляет собой десятичную за-
≡ (14.1.62) ≡ d Fk · d xk ≡
пись числа или параметр или переменную, то это
k∈Mn
очевидно верно. X
2. Если это верно для какого-то выражения ≡ (14.1.78) ≡ d Fk · d xk ≡
F , то для выражений F α , aF , F и остальных в k∈Mn
списке (14.1.64)–(14.1.76) это будет верно в силу X Xn
∂Fk
этих самых формул (14.1.64)–(14.1.76). ≡ (14.1.84) ≡ · d xi · d xk ,
i=1
∂xi
3. Если это верно для каких-то двух числовых k∈Mn
π √
√ √
и при этом F не содержит переменной p и (при 2 2 2 2
этих значениях параметров) его дифференциал sin +p = + ·p− ·p −
4 2 2 4
порядка k ∈ Z+ определен на интервале (a, b): 1 π
− cos + θp · p3 , θ ∈ [0, 1]
6 4
(a, b) ⊆ D(dk F ). (14.1.88)
⋄ 14.1.33. Найдем дифференциалы до 3 порядка
Тогда дифференциал функции f порядка k опре- включительно от функции
делен на интервале (a, b), и получается из диф-
ференциала выражения F заменой d x на p: f (x) = arctg x
3x2 − 1
=2· · p3 и при этом F не содержит переменных
(1 + x2 )3
(p1 , ..., pn ) и (при этих значениях параметров)
Формула Тейлора-Лагранжа порядка 2 для этой его дифференциал порядка k ∈ Z+ определен на
функции имеет поэтому вид: открытом множестве U ⊆ Rn :
1 1 2x
arctg(x+p) = arctg x+ 2
·p− · ·p2 + U ⊆ D(dk F ). (14.1.90)
1+x 2 (1 + x2 )2
1 3(x + θp)2 − 1
+ · · p3 Тогда дифференциал функции f порядка k опре-
3 (1 + (x + θp)2 )3
делен на множестве U , и получается из диффе-
Можно выписать ее в конкретной точке, напри- ренциала выражения F заменой d xi на pi :
мер, в x = 1:
π 1 1 dk f (x1 , ..., xn )[p1 , ..., pn ] = dk F ,
arctg(1 + p) = + · p − · p2 + d xi =pi
4 2 4
n
1 3(1 + θp)2 − 1 x ∈ U, p ∈ R . (14.1.91)
+ · · p3
3 (1 + (1 + θp)2 )3
⊲⊲ 14.1.34. Найдите дифференциалы 1-го, 2-го ⊲⊲ 14.1.35. Найдите дифференциалы 1-го, 2-го
и 3-го порядка для многочленов: и 3-го порядка для функций:
2 3 2
1) f (x, y) = x + y + x · y ; 1) f (x, y) = x2 + y 3 + x · y 2 ;
2) f (x, y, z) = xy 2 z 3 ;
2) f (x, y, z) = xy 2 z 3 ;
3) f (x, y, z) = x + y 2 + z 3 ;
3) f (x, y, z) = x + y 2 + z 3 ;
Связь с дифференциалом числового вы- 4) f (x, y) = x · sin y;
ражения. Напомним, что дифференциальные 5) f (x, y) = x ;
y
выражения и формальный дифференциал были
6) f (x, y) = x + cos y;
определены нами в главе 5 на с.813. Аналог тео-
y
ремы 14.1.20 для многих переменных выглядит 7) f (x, y) = x ;
так: 8) f (x, y, z) = xyz .
d f (a) = 0 (14.1.92)
h(t) = f (a + tp)
h′ (0) = 0
∃p, q ∈ Rn d2 f (a)[p] = ∂p2 f (a) > 0 & d2 f (a)[p] = ∂p2 f (a) < 0, (14.1.96)
Тогда
h′ (t) − h′ (0) = (теорема Лагранжа 5.1.7) = h′′ (ξ) · (t − 0) > 0, t ∈ [0, δ]
⇓
′ ′
h (t) > h (0) = 0, t ∈ [0, δ]
⇓
h(t) − h(0) = (теорема Лагранжа 5.1.7) = h′ (ξ) · (t − 0) > 0, t ∈ [0, δ]
⇓
h(t) > h(0), t ∈ [0, δ]
Последнее противоречит условию 2.
Доказательство теоремы 14.1.22. Рассмотрим какой-нибудь замкнутый шар U ε (a) с центром в a,
на котором функция f определена:
U ε (a) = {x ∈ Rn : |x − a| 6 ε}
Sε = {x ∈ Rn : |x − a| = ε}
Рассмотрим функцию
hp (t) = f (a + tp), p ∈ Sε , t ∈ [0, 1]
Из (14.1.36) получаем
n
X n
X
h′p (t) = ∇i f (a + tp) · pi , h′′p (t) = ∇j ∇i f (a + tp) · pj · pi
i=1 i,j=1
Из последней формулы следует, между прочим, что h′′p – непрерывная функция от переменных
(p, t) ∈ Sε × [0, 1].
1. Предположим теперь, что выполняется условие (i), но при этом a – не точка локального
минимума для f . Тогда
∀δ > 0 ∃x ∈ Uδ (a) f (x) < f (a)
⇓
∀δ > 0 ∃p ∈ Sε ∃t ∈ [0, δ] hp (t) = f (a + tp) < f (a) = hp (0)
⇓ применяем лемму 14.1.23
tmi −→ 0
m→∞
820 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
Значит,
0 > h′′pm (tmi ) −→ h′′p (0)
i m→∞
Таким образом,
∃p ∈ Sε ∂p2 f (a) 6 0
выполняется условие
h′′p (0) > 0
Поскольку h′′p (t) непрерывна, это означает, что существует целый отрезок, на котором h′′p (t) поло-
жительна:
∃δ > 0 ∀t ∈ [0, δ] h′′p (t) > 0
Отсюда
h′p (t) − h′p (0) = (теорема Лагранжа 5.1.7) = h′′p (ξ) · (t − 0) > 0, t ∈ (0, δ]
Доказательство. Симметричность матрицы Гессе есть условие, доказанное в теореме Шварца 14.1.8:
∇i ∇j f (a) = ∇j ∇i f (a)
Равенство (14.1.100) следует из формулы (14.1.37):
D E n
X
Hf (a)p, p = ∇i ∇j f (a) · pi · pj = (14.1.37) = d2 f (a)[p]
i,j=1
После этого по теореме 12.4.8, из формулы (14.1.100) и симметричности матрицы Hf (a), следует
что d2 f (a) – квадратичная форма (и Hf (a) – ее порождающая матрица).
Применяя к теореме 14.1.22 критерий Сильвестра (теорему 12.4.19), мы получаем
Теорема 14.1.26 (достаточное условие локального экстремума). Пусть функция f : Rn ֒→ R
непрерывно дифференцируема порядка 2 в некоторой окрестности точки a ∈ Rn и ее частные
производные первого порядка в точке a равны нулю:
∇1 f (a) = ... = ∇n f (a) = 0.
Тогда
8 Людвиг Отто Гессе (Ludwig Otto Hesse) (1811-1874) – немецкий математик.
822 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
∇1 ∇1 f (a) ∇2 ∇1 f (a)
∇1 ∇1 f (a) > 0, > 0, ...,
∇1 ∇2 f (a) ∇2 ∇2 f (a)
∇1 ∇1 f (a) ... ∇n ∇1 f (a)
... ... ... > 0, (14.1.101)
∇1 ∇n f (a) ... ∇n ∇n f (a)
∇1 ∇1 f (a) ∇2 ∇1 f (a)
∇1 ∇1 f (a) < 0, > 0, ...,
∇1 ∇2 f (a) ∇2 ∇2 f (a)
∇1 ∇1 f (a) ... ∇n ∇1 f (a)
(−1)n · ... ... ... > 0, (14.1.102)
∇1 ∇n f (a) ... ∇n ∇n f (a)
∇1 ∇1 f (a, b) ∇2 ∇1 f (a, b)
det Hf (a, b) = >0 (14.1.104)
∇1 ∇2 f (a, b) ∇2 ∇2 f (a, b)
∇1 ∇1 f (a, b) ∇2 ∇1 f (a, b)
det Hf (a, b) = <0 (14.1.105)
∇1 ∇2 f (a, b) ∇2 ∇2 f (a, b)
∇1 ∇1 f (a, b) ∇2 ∇1 f (a, b)
det Hf (a, b) = =0
∇1 ∇2 f (a, b) ∇2 ∇2 f (a, b)
Тогда f может иметь, а может и не иметь локального экстремума в точке (a, b).
Доказательство. C самого начала обозначим
Тогда
A B
det Hf (a, b) = = A · C − B2.
B C
1. Рассмотрим сначала случай, когда Гессиан положителен:
A · C − B2 > 0
§ 1. Гладкие функции на евклидовых пространствах 823
Тогда, во-первых,
A 6= 0, C 6= 0, sgn A = sgn C
и, во-вторых, дискриминанты квадратных трехчленов
B C A B
λ2 + 2 λ+ , + 2 µ + µ2
A A C C
отрицательны:
B2 C B2 A
4 2
− < 0, 4 2
− < 0,
A A C C
Отсюда следует, что квадратные трехчлены всегда положительны:
B C A B
λ2 + 2 λ+ > 0, + 2 µ + µ2 > 0
A A C C
Поэтому, если взять вместо λ число вида pq , то получится
p2 Bp C
+2 + >0
q2 Aq A
откуда
sgn Ap2 + 2Bpq + Cq 2 = sgn A, q 6= 0 (14.1.106)
C Bq q2
+2 + 2 >0
A Ap p
откуда
sgn Ap2 + 2Bpq + Cq 2 = sgn C, p 6= 0 (14.1.107)
Из (14.1.104) и (14.1.105) следует, что если p 6= 0 или q 6= 0 (то есть, если (p, q) 6= 0), то
sgn Ap2 + 2Bpq + Cq 2 = sgn A = sgn C (14.1.108)
Поэтому вторая производная функции f (x, y) в точке (a, b) по направлению (p, q) 6= 0 должна иметь
тот же знак, что и A:
sgn d2 f (a, b)(p, q) = sgn Ap2 + 2Bpq + Cq 2 = sgn A
A · C − B2 < 0
Aλ2 + 2Bλ + C
Возьмем теперь
p1
p1 , q1 : = λ1
q1
824 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
Тогда
2 !
2 p1 p1
d f (a, b)(p1 , q1 ) = Ap21 + 2Bp1 q1 + Cq1 = q12 A + 2B + C = Aλ21 + 2Bλ1 + C > 0
q1 q1
Вместе это означает, что выполняется условие (iii) теоремы 5.6, то есть (a, b) не может быть точкой
локального экстремума.