Академический Документы
Профессиональный Документы
Культура Документы
МАТЕМАТИЧЕСКИЙ АНАЛИЗ
без пробелов
С.С.Акбаров
26 августа 2021 г.
2
i
Если задаться целью проследить, во что превратятся курсы математики, читаемые на техни-
ческих факультетах нынешних университетов, при условии, что изложение в них будет вестись на
современном уровне строгости, с нуля и без пробелов, то можно быть уверенным, что большинству
преподавателей и студентов открывшаяся картина покажется неожиданной. Главным сюрпризом
наверняка будет то, что такое изложение вообще возможно. Вторым по неожиданности — его де-
тали. И третьим — что такая подача материала будет все же доступна для понимания. Настоящий
учебник — попытка такой систематизации. Автор строит курс математики, включающий в себя
основные факты математического анализа и лежащих в его основе дисциплин — математической
логики и линейной алгебры — с расчетом на формально нулевую подготовку читателя. Последнее,
разумеется, не означает обещания, что изложение будет понятно первокласснику, но подразумевает
возможность для человека, способного абстрагироваться от части своих знаний, проверить детали
внушаемого ему со школы убеждения, что математика — строгая наука, где все аккуратно выстра-
ивается чисто логическими средствами, без ссылок на интуицию, причем сами логические средства
также ясно формализуются и никак не связаны с человеческой биологией.
Предисловие
Эта книга представляет собой учебник по математическому анализу и тем областям математики,
на которые он опирается: математической логике и линейной алгебре (в объеме, с точностью до
некоторых отклонений по ходу изложения, необходимом для доказательства утверждений мате-
матического анализа). Идея, руководившая автором при ее создании, состояла в том, чтобы дать
возможность студентам и преподавателям проследить цепочки рассуждений, ведущие от самых
элементарных понятий теории множеств к главным результатам университетской математики. При
этом первостепенными требованиями к этим цепочкам выставлялись их ясность и непрерывность,
и, поскольку по опыту автора, это требует объяснения, настоящее Предисловие предназначено глав-
ным образом для него.
Что не так? Если задуматься, что теоретически может мешать человеку понимать предмет, из-
ложенный в учебнике, то в голову придут два главных возможных препятствия:
1) Темные места. Плохо объясненные, плохо проработанные, неоправданно сложные, непо-
нятные, запутанные детали в каких-то частях изложения, — причем таковыми могут быть
даже целые темы, — понятно, составляют проблему.
2) Пробелы. Они бывают двух типов: пробелы со ссылками и пробелы без ссылок.
a) Первые отсылают читателя за подробностями к другим источникам, и, хотя в
таких случаях считается, что человек сам может восстановить недостающие де-
тали, надо понимать, что это далеко не всегда бывает легко. Негарантированная
доступность источника, рассогласованность в терминологии и обозначениях, в
стиле, необязательно внятное освещение этой темы в самом источнике, всегда
представляют дополнительные сложности, иногда небольшие, но часто очень
существенные, вплоть до непреодолимых.
b) Помимо пробелов со ссылками бывают еще пробелы без ссылок. Это происходит,
когда какие-то вещи автору текста кажутся очевидными, или общеизвестными,
или незаслуживающими детального обсуждения. Во всех случаях это может
быть причиной непонимания или вовсе отторжения материала.
В математическом анализе эти трудности представлены полным списком. Вот, в частности, из-
вестные автору темные места и пробелы без ссылок (пробелы со ссылками мы перечислим чуть
ниже, на странице v).
1. Элементарные функции. Почти во всех учебниках они вводятся “описательно”, без строгих
определений. Если бы так было везде, это был бы пробел без ссылок, однако автору известна одна
книга, а именно, учебник Г. Грауэрта, И. Либа и В. Фишера [3], где экспонента, логарифм, степень и
тригонометрические функции определены аккуратно [3, Глава VI, § 4]. Можно было бы поэтому не
видеть здесь проблемы, но неприятность в том, что в [3] определения элементарных функций даются
только после темы “Разложение Тейлора”. Естественно, это делает их формально непригодными в
предыдущих темах, то есть, фактически во всем первом семестре изучения матанализа. Поскольку
в матанализе элементарные функции принято использовать сразу, проблема остается, и ее можно
классифицировать как темное место.
2. Кривые и поверхности. Эта тема выглядит недоработанным введением в геометрическую тео-
рию меры, в котором, вопреки ожиданиям зрителя, создатели не захотели или не смогли избавиться
от параметризации. То есть, например, кривая в Rn определяется не как множество в Rn , а как
отображение
γ : [a, b] → Rn
с подходящими свойствами (гладкость, липшицевость, спрямляемость, на вкус автора). Все после-
дующие конструкции — длина (или площадь, в случае с поверхностями), интегралы двух типов и
ii
iii
h(x) = sin(x2 ).
h(z) − h(x)
h(x) = lim , (1)
z→x z−x
то для этого нам необходимо будет ввести две вспомогательные функции
Этот способ намного менее удобен (особенно когда функция устроена сложно, с большим числом
композиций и/или алгебраических операций), чем школьный, в виде цепочки преобразований, ко-
торая в данном случае принимает вид
′ ′
sin(x2 ) = sin y 2 = (sin y)′ 2 · (x2 )′ = cos y 2 · 2x = cos x2 · 2x
y=x y=x y=x
h(z) − h(1)
h(1) = lim .
z→1 z−1
Если же то же самое проделать с формулами (2), подставив, например, y = 1 и x = 1 (что есте-
ственно, когда считаешь значение производной функции h(x) = sin(x2 ) в точке 1), то мы получим
формально ложные равенства:
(потому что производная от константы должна быть нулевой). Это означает, что если мы хотим
сохранить школьные приемы вычисления производной, мы должны помимо (1) иметь другое опре-
деление производной, предназначенное специально для вычислений.
Естественный способ приписать точный смысл тождествам (2) — относиться к операции взятия
производной в них как к формальной операции τ 7→ τ ′ на термах подходящей теории 1 порядка4 .
1 Ниже это упражнение приведено как пример 6.1.27.
2В тексте формула (6.1.4).
3 Ниже формула (6.1.56).
4 Понятие теории 1 порядка, или формальной теории, описывается ниже в тексте на с.105.
iv
Если представлять Calculus как такую теорию, то его сигнатуру логично было бы считать состоящей
из констант
0, 1, e, π
(e – число Непера, π – число Архимеда), одноместных функциональных символов
В такой теории производную и интеграл можно было бы определять как операции на термах (или
как подходящие преобразования формул5 ), а возникающие конструкции на множестве R веществен-
ных чисел были бы просто моделью6 Calculus, как теории 1 порядка. Поскольку решение школьных
уравнений и неравенств также представляет собой систему операций над выражениями, постро-
енными из тех же символов, эту часть математики также можно было бы считать компонентой
Calculus.
Но Calculus как теория 1 порядка к настоящему времени не разработан7. Со времен Коши и
Вейерштрасса, когда, как считается, в Анализе был наведен порядок, эта тема так и осталась белым
пятном, и как следствие, традиционно объясняется путано, ссылок на специальные дисциплины не
имеет, а времени на обучение требует пропорционально своей непроходимости: последние несколько
лет школы и первые годы университета.
С чего начать и где остановиться? Автор счел разумным (и возможным, правда, с точностью
до проблем, описываемых ниже на с.vii) изложить основные факты математического анализа с
элиминацией темных мест и пробелов, причем не только пробелов без ссылок, но и со ссылками.
Последнее условие в этой программе понимается максимально широко: изложение ведется прямо от
оснований математики, что позволяет сделать его полностью независимым от других источников (в
частности, избавиться в теоретическом материале от традиционных ссылок на так называемую “базу
школьных знаний”, которыми всегда злоупотребляют в учебниках по университетской математике).
Для перечисленных выше трех трудных мест в тексте предложены следующие решения.
5 См.формулы на с.383 и 459.
6 Понятие модели теории 1 порядка определяется на с.135.
7 Очевидно, из-за проблемы с определением равенства термов, о которой мы говорим ниже на с.351.
v
1. Элементарные функции: здесь проблема решается введением двух избыточных аксиом (по-
дробности на с.327). В нашем учебнике эта тема описывается в главе 5, после темы “Пределы”.
Такое расположение материала связано с тем, что при доказательстве свойств элементарных функ-
ций, в частности, тождеств, приходится активно использовать классические теоремы о непрерыв-
ных функциях (а именно, теорему Коши о промежуточном значении 4.3.22 и теорему об обратной
функции 4.3.34), которые, как следствие, к этому моменту желательно иметь в своем распоряже-
нии. Однако если формальная сторона дела не стоит в приоритете, ничто не мешает на занятиях
описать аксиомы степеней и тригонометрии сразу в теме “числовые функции”, перечислив глав-
ные следствия из них без доказательств (или пообещав доказать это позже). Тогда пользоваться
элементарными функциями можно будет с первых занятий.
2. Кривые и поверхности: здесь предложенное решение состоит в том, чтобы ввести класс глад-
ких отображений на измеримых по Жордану компактах, которые характеризуются инъективностью
почти всюду и невырожденностью почти всюду дифференциала (в тексте такие отображения назы-
ваются полурегулярными, см. определение на с.1034). Это позволяет доказать теорему о существо-
вании (подходящим образом понимаемой) функции перехода от одной параметризации к другой
(теорема 16.3.17), что в свою очередь дает решение упомянутой выше проблемы независимости
нужных конструкций от параметризации.
3. Calculus: здесь автор должен признаться, что не смог (пока) найти идею, позволяющую эле-
гантно обойти упомянутые выше трудности. Последовательно разрабатывать Calculus, как теорию 1
порядка, — задача, по-видимому, слишком громоздкая (см. подробности на с.351), а можно ли (с со-
блюдением строгости) описать эту теорию проще — автору неизвестно. В тексте Дифференциальное
исчисление описывается как язык 1 порядка с набором функциональных символов, включающим
обозначения всех элементарных функций (в том числе функций, определенных не везде на R)8 с
дополнительной операцией взятия частной производной над термами. Обсуждение этой темы мы
начинаем со страницы 351, а детали решения приводим на страницах 382 (для функций одной пе-
ременной) и на с.893 (для функций нескольких переменных). Интегральное исчисление, наоборот,
описывается как конструкция внутри Анализа на с.458, без выхода в теорию формальных языков,
потому что неопределенный интеграл удобнее считать операцией на классах функций со значения-
ми в классах функций (а не на классе термов со значениями в классе термов, где он будет не везде
определен).
В соответствии с общей философской установкой, в текст включены также темы, которые по
описанной выше классификации можно считать пробелами со ссылками. Вот их список в сторону
удлинения цепочки связей с матанализом:
4. Линейная алгебра. Многомерный вещественный анализ базируется на линейной алгебре9 , по-
этому если задаваться целью ликвидировать не только пробелы без ссылок, но и со ссылками, то
соответствующий материал из линейной алгебры в такой текст нужно включать. Мы это делаем в
главе 13.
5. Комбинаторика. Линейная алгебра в свою очередь использует результаты комбинаторики10 .
Этот материал мы излагаем в начале главы 13.
6. Теория вещественного числа. Вещественный анализ и линейная алгебра, строятся как дефи-
нициальные расширения теории вещественных чисел. Мы излагаем эту теорию в главе 3.
7. Теория множеств и логика. Теория вещественных чисел в свою очередь представляет собой
дефинициальное расширение аксиоматической теории множеств. Мы описываем ее в главе 0, а в
главе 2 мы приводим материал из математической логики, необходимый для понимания логической
структуры всего курса (в частности, определение самого дефинициального расширения дается на
с.121).
О логике нужно сказать несколько слов отдельно, поскольку ее можно считать одновременно и
пробелом со ссылками, и темным местом, и, при определенном уровне требовательности, пробелом
без ссылок. Речь идет вот о чем. После знаменитого кризиса начала 20 века эта наука пришла к со-
стоянию, когда ее описание удобнее всего представлять как некую игру с символами. И, хотя в этом
8 То есть, помимо алгебраических операций, включающих деление и возведение в степень, в этой сигнатуре функ-
9 В качестве иллюстрации можно привести, например, теорему о локальном экстремуме 15.1.81, или теоремы
Лагранжа 15.3.24 и 15.3.25, или теорему об искажении меры при линейном преобразовании 16.1.34, и другие, где
содержатся ссылки на действия с матрицами и полилинейными формами на конечномерном вещественном векторном
пространстве.
10 Например, в конструкции определителя.
vi
и заключался главный итог исследований первой половины 20 века в этой области, — превращение
всей математики в игру с символами, — правила этой игры и главные ее результаты объясняются
на сегодняшний день очень плохо. Неспециалиста эти объяснения поражают своей сложностью и
требуют от него усилий, несоразмерных с целями ознакомления с предметом.
Автору очевидно, что причиной здесь является утвердившийся среди логиков после работ Гёделя
язык платоновских идей, проявляющийся в традиции использовать понятия множества и функции
вне их аксиоматического описания, а понятия истинности и ложности вне их связи с выводимо-
стью из аксиом теории множеств. На самом элементарном уровне понимания предмета это видно
в том, что в современной логике понятия множества и функции используются до того, как тео-
рия множеств построена как формальная теория11 . Это приводит к странной неоднозначности в
понимании этих терминов: с одной стороны, они используются как термины формальной теории,
но одновременно (и очень часто, почти всегда, невозможно уловить разницу) как просто слова в
повседневной речи, значение которых не требует уточнений (но тем не менее выводы, к которым
приводит их употребление, остаются на удивление глубокими и неочевидными12 ).
Человек с улицы (даже математик, но не специалист в этой области) понять эту игру намеков,
конечно, не в состоянии, и остается удивляться, как получилось, что до сих пор никто не пытался
навести в этой области “линейный порядок” (принятый во всей остальной математике). То есть
такое положение дел, при котором ссылки на конструкции, не описанные формально на момент
использования, считаются недопустимыми.
В первой части нашего учебника, посвященной основаниям математики (главы 0—2) мы по-
стараемся исправить это недоразумение и даем “линейное” изложение главных результатов этой
науки. Неспециалисту это прояснит картину, а специалисту позволит взглянуть на нее по-новому
(что всегда полезно). Автор, помимо прочего, считает, что такой “линейный” способ объяснять этот
материал представляет собой естественное развитие гильбертовской философии формализма (ко-
торой только обстоятельства помешали превратиться в описываемую здесь систему).
С теорией множеств и логикой мы доходим до основ, дальше которых уже ничего нет, и у нас
получается курс университетской математики с нуля.
Объем охвата тем 4-7 в этом списке диктуется потребностями математического анализа, но
иногда, когда затрагиваемый круг вопросов важен для математики в целом, как, например, в случае
с рангом множества (см. определение на с.74), мы отступаем от этого правила и даем немного
больше информации.
тической логике.
12 Такова, например, теорема Гёделя о полноте, формулируемая ниже в виде двух теорем 2.3.6 и 2.3.18 (отдельно
тексте понятиям и приемам, и, как следствие, уровень логической строгости здесь снижается. Одна-
ко, не намного, а только до той планки, на которой некоторые понятия позволяется упоминать суще-
ственно раньше, чем они будут формально определены (например, понятие длины кривой впервые
упоминается на с.527, хотя определяется только на с.1076), а некоторым утверждениям позволяется
быть сформулированными задолго до того, как они будут аккуратно доказаны в тексте (таковы,
например, формулы для простейших геометрических величин в главе 8 – площади правильной об-
ласти на плоскости, объема тела вращения и т.п. – которые мы по традиции приводим раньше, чем
эти величины формально будут определены, и как следствие, доказательство этих формул перено-
сится на несколько глав вперед). При таком подходе, в частности, все, что связано с Исчислением,
включая определения элементарных (/стандартных) функций, описание формальных операций над
ними и доказательство связи этих операций с дифференцированием и интегрированием, попадает
в двухколоночный текст, поскольку идеологически превращается в иллюстративный материал.
При работе над текстом автор использовал многие идеи доказательств, а также некоторые за-
дачи и упражнения из учебников и пособий, выходивших в разные годы в России. Эти руководства
приведены в списке литературы на странице viii.
Остающиеся пробелы и темное место. В предлагаемом варианте текста все еще остаются
несколько пробелов (со ссылками) и одно темное место. Пробелами (мы уже упоминали их на с.vi)
являются
— несколько утверждений главы 2 о логике а именно, два технических результата Геделя о
теориях с нумерацией (теоремы 2.2.11 и 2.2.12) и теорема 2.2.21 Геделя о непротиворечи-
вости в форме Россера, а также
— теорема 19.2.30 об ацикличных областях в главе 19 про Гаусса и Стокса.
Результаты Геделя мы приводим без доказательства из-за громоздскости традиционных рас-
суждений в этой части логики. Поскольку эта область (рекурсивные функции и их применение)
формально не связана с математическим анализом, мы считаем разумным оставить этот блок ин-
формации читателю для самостоятельно изучения. Что касается теоремы об ацикличных областях,
мы приводим ее как иллюстрацию к теоремам Гаусса и Стокса, и доказываем лишь частично, потому
что аккуратное доказательство требует отдельного (и не входящего в наши планы) повествования
о теории гомологий.
Наконец, темным местом остается Calculus. Как уже говорил автор, найти идею, позволяющую
изложить этот материал одновременно строго и просто, ему не удалось. Предлагаемое решение15
можно считать строгим, но простым его не назовешь. В руководствах по матанализу эта тема тради-
ционно замалчивается именно про причине отмечаемых здесь трудностей, однако автора удержива-
ет от искушения пойти по этому пути соображение, что где-то все-таки эта методичесская проблема
должна быть обозначена. Естественно, автор будет благодарен читателям за любые предложения
и ссылки, которые могли бы помочь упростить этот материал.
15 В учебнике этот материал разбросан по нескольким главам, в качестве ссылок удобно указать страницы 351, 382,
446 и 893.
Литература
viii
Оглавление
Предисловие ii
Что не так? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
Делить или объединять? . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
С чего начать и где остановиться? . . . . . . . . . . . . . . . . . . . . . . iv
Структура учебника. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Остающиеся пробелы и темное место. . . . . . . . . . . . . . . . . . . . . vii
Благодарности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
I ОСНОВАНИЯ МАТЕМАТИКИ 1
0 ТЕОРИЯ МНОЖЕСТВ 2
§ 1 Наивная теория множеств . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
(a) Формулы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Элементарные высказывания. . . . . . . . . . . . . . . . . . . . . . . . . . 2
Логические операции и кванторы. . . . . . . . . . . . . . . . . . . . . . . 3
Высказывания (формулы). . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Сокращения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Подстановка. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
(b) Аксиомы, теоремы и антиномии. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Аксиомы наивной теории множеств. . . . . . . . . . . . . . . . . . . . . . 4
Обозначение {X : ϕ}. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Теоремы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Антиномия Рассела. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Программа Гильберта. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
§ 2 Логика предикатов для теории множеств . . . . . . . . . . . . . . . . . . . . . . . . . . 7
(a) Язык теории множеств . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Сигнатура теории множеств. . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Формулы теории множеств. . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Квантор ∃! существования и единственности. . . . . . . . . . . . . . . . . 9
(b) Логика предикатов в аксиоматизации Генцена . . . . . . . . . . . . . . . . . . . 9
Секвенции. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Аксиома и правила вывода в LK. . . . . . . . . . . . . . . . . . . . . . . . 11
Дерево Генцена и выводимость секвенций в LK. . . . . . . . . . . . . . . 12
Отношение выводимости между секвенциями. . . . . . . . . . . . . . . . 18
Почему антецедент можно понимать как конъюнкцию, а сукцедент как
дизъюнкцию входящих в них формул. . . . . . . . . . . . . . . 18
Выводимые формулы в LK. . . . . . . . . . . . . . . . . . . . . . . . . . . 21
(c) Отношения между формулами в LK . . . . . . . . . . . . . . . . . . . . . . . . . 22
Отношение следования между формулами. . . . . . . . . . . . . . . . . . 22
Отношение выводимости между формулами в LK. . . . . . . . . . . . . . 23
§ 3 Теория множеств Морса-Келли . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
(a) Аксиомы равенства, невырожденности, объемности и выделения . . . . . . . . 27
Аксиомы равенства. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Аксиома невырожденности. . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Аксиома объемности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Схема аксиом выделения. . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
ix
x Оглавление
6 ПРОИЗВОДНАЯ 369
§ 1 Производная . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
(a) Производная и дифференцируемость . . . . . . . . . . . . . . . . . . . . . . . . . 370
Геометрический смысл производной. . . . . . . . . . . . . . . . . . . . . . 371
Наглядный смысл дифферецируемости. . . . . . . . . . . . . . . . . . . . 372
Производные элементарных функций. . . . . . . . . . . . . . . . . . . . . 373
(b) Правила вычисления производных . . . . . . . . . . . . . . . . . . . . . . . . . . 375
Арифметические действия с производными. . . . . . . . . . . . . . . . . . 375
Производная композиции. . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
(c) Теоремы о дифференцируемых функциях . . . . . . . . . . . . . . . . . . . . . . 379
Теорема Ферма. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
Теорема Ролля. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
Теорема Лагранжа. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
Теорема Коши об отношении приращений. . . . . . . . . . . . . . . . . . 382
(d) Дифференциальное исчисление: производная, как формальная операция . . . 382
Частная производная числового выражения. . . . . . . . . . . . . . . . . 383
Производная одноместного числового выражения. . . . . . . . . . . . . . 384
Производная стандартной функции. . . . . . . . . . . . . . . . . . . . . . 386
§ 2 Приложения производной . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388
Оглавление xv
8 ИНТЕГРАЛ 446
§ 1 Неопределенный интеграл . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446
(a) Классы функций, тождественные на отрезках . . . . . . . . . . . . . . . . . . . 447
Равенство классов функций. . . . . . . . . . . . . . . . . . . . . . . . . . . 447
Классы функций с общей областью определения. . . . . . . . . . . . . . 449
Ограничение класса функций. . . . . . . . . . . . . . . . . . . . . . . . . . 449
Тождественность на отрезках. . . . . . . . . . . . . . . . . . . . . . . . . . 450
Алгебраические операции с классами функций. . . . . . . . . . . . . . . . 451
Композиция с функцией, непрерывной на отрезках. . . . . . . . . . . . . 453
(b) Определение и свойства неопределенного интеграла . . . . . . . . . . . . . . . . 454
Дифференцируемые функции и первообразная на отрезке. . . . . . . . . 454
Интегральные множества и функции, дифференцируемые на отрезках. 456
Неопределенный интеграл. . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
Таблица интегралов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
Свойства неопределенных интегралов. . . . . . . . . . . . . . . . . . . . . 460
(c) Вычисление неопределенных интегралов . . . . . . . . . . . . . . . . . . . . . . 462
Применение формулы линейности. . . . . . . . . . . . . . . . . . . . . . . 462
Внесение под знак дифференциала и применение формулы замены пе-
ременной. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
Интегрирование по частям. . . . . . . . . . . . . . . . . . . . . . . . . . . 463
Рекуррентные формулы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
Интегрирование рациональных функций . . . . . . . . . . . . . . . . . . . . . . 466
Интегрирование простейших дробей . . . . . . . . . . . . . . . . . . . . . 466
Интегрирование правильных дробей . . . . . . . . . . . . . . . . . . . . . 468
xvi Оглавление
ОСНОВАНИЯ МАТЕМАТИКИ
1
Глава 0
ТЕОРИЯ МНОЖЕСТВ
Вся современная математика (за исключением некоторых разделов логики) строится на теории
множеств (понимаемой ныне как система аксиоматических теорий, различающихся некоторыми
деталями). Поэтому если задаваться целью излагать какую-то часть математики (в нашем случае,
Анализ) без пробелов, начинать нужно все-таки с теории множеств.
В этой главе мы опишем одну из аксиоматических теорий множеств, теорию Морса-Келли, и
при этом постараемся сделать это описание максимально формализованным, чтобы дать читателю
представление об игре с символами, о которой мы говорили в Предисловии на с.v.
2
§ 1. Наивная теория множеств 3
⋄ 0.1.4. В следующих формулах X является сво- Чтобы строить теорию, нужны исходные поло-
бодной переменной: жения (называемые аксиомами), из которых за-
тем будут выводиться более сложные утвержде-
X = X, ния (называемые теоремами). В наивной теории
множеств аксиомами удобно считать следующие
X ∈ X, семь высказываний (точнее сказать, классифи-
∃Y X ∈ Y. кационный список высказываний).
Первые три аксиомы называют обычно акси-
А в следующих, наоборот, X – связанная пере- омами равенства:
менная:
∀X X = X, NST-1 Аксиома рефлексивности:
∃X X ∈ X, X = X. (0.1.5)
∀X ∃Y X ∈ Y. Это надо понимать так, что равенство X = X
считается верным для всех множеств X.
• Подстановкой переменной Y вместо перемен-
ной X в формулу ϕ называется формула, по- NST-2 Аксиома симметричности:
лучающаяся из ϕ заменой X на Y во всех сво-
бодных вхождениях переменной X в формуле X = Y ⇒ Y = X. (0.1.6)
ϕ. Мы обозначаем такую формулу символом На человеческом языке это означает, что равен-
ство X = Y формально не отличается от равен-
ϕ (0.1.4) ства Y = X.
X=Y
NST-3 Аксиома транзитивности:
• Подстановка ϕ называется корректной,
X=Y (X = Y & Y = Z) ⇒ X = Z. (0.1.7)
если при замене X на Y вторая переменная
не попадает в область действия квантора по То есть равенства X = Y и Y = Z влекут за
этой переменной. собой равенство X = Z.
Следующая аксиома устанавливает связь
⋄ 0.1.5. Подстановка Y вместо X в формулу
между равенством и отношением принадлежно-
X =Y сти:
NST-4 Аксиома инвариантности:
дает формулу
Y =Y (X = A & Y = B & X ∈ Y ) ⇒ A ∈ B
(0.1.8)
⋄ 0.1.6. Подстановка Y вместо X в формулу
Иными словами, в отношение X ∈ Y можно под-
A=B ставлять множества, равные X и Y , и при этом
будут получаться следсвия.
дает ту же формулу Три последние аксиомы описывают собствен-
но отношение принадлежности:
A=B
NST-5 Аксиома невырожденности:
⋄ 0.1.7. Подстановка Y вместо X в формулу
∃X ∃Y X ∈ Y. (0.1.9)
∃Y X ∈ Y
То есть существуют множества X и Y такие, что
дает формулу X ∈Y.
∃Y Y ∈ Y, NST-6 Аксиома объемности:
однако такая подстановка некорректна, потому X = Y ⇐⇒ ∀A (A ∈ X ⇐⇒ A ∈ Y )
что после замены Y попадает в область действия (0.1.10)
квантора ∃ по Y .
То есть два множества X и Y совпадают, если и
только если они «имеют одинаковый набор эле-
(b) Аксиомы, теоремы и антино-
ментов».
мии.
NST-7 Аксиома безусловного выделе-
Аксиомы наивной теории множеств. Если ния: пусть ϕ – формула теории мно-
не предполагать ничего о свойствах отношений жеств, не содержащая переменную Y в
= и ∈, которым удовлетворяют или не удовле- качестве свободной переменной, тогда
творяют различные множества, то и сказать о
множествах ничего внятного будет невозможно. ∃Y ∀X (X ∈ Y ⇐⇒ ϕ) (0.1.11)
§ 1. Наивная теория множеств 5
Антиномия Рассела. В 1902 году англий- если R ∈ R, то, если R ∈
/ R, то
ским математиком Бертраном Расселлом было в силу (0.1.20), в силу (0.1.20),
сделано следующее наблюдение.
R∈ /R R∈R
⋄ 0.1.13. Антиномия Рассела. По аксиоме без-
условного выделения NST-7 в наивной теории ⇓
множеств определено множество
R = {X : X ∈
/ X}. (0.1.18) R∈R&R∈
/ R.
Оно называется множеством Рассела и состоит Отсюда уже следует, что в NST выводимы каж-
из всевозможных таких множеств X, для кото- дая из формул R ∈ R и R ∈/R
рых верно X ∈
/ X:
X ∈ R ⇐⇒ X ∈
/X (0.1.19) Программа Гильберта. Из антиномии Рассе-
ла (и не только из нее, потому что почти одно-
Зададимся вопросом, будет ли R элементом са-
временно с ней были обнаружены разные дру-
мого себя:
гие противоречия в тогдашней теории множеств)
R ∈ R или R ∈ /R? следует, ни много, ни мало, что в NST вообще лю-
бое утверждение ϕ можно доказать (вместе
Антиномия Рассела состоит в том, что эти с его отрицанием ¬ϕ) — на этот счет имеется
утверждения эквивалентны: специальная теорема логики о противоречивых
теориях, которую мы приводим ниже (теорема
вспоминаем 2.2.3).
определение R
(0.1.19) Понятно, что обнаружение таких противоре-
↓ чий означало, что построенная к тому време-
R∈R ⇐⇒ R – одно из тех X, для
ни теория множеств, которую мы здесь описа-
которых выполняется X ∈ /X ⇐⇒ R∈/ R ли как аксиоматическую теорию NST, не может
↑
упрощаем выполнять роль фундамента всей математики,
высказывание
для которой она была создана. По этой при-
То есть, чине сама эта теория и связанная с ней логи-
ка, определяющая общие принципы математиче-
R ∈ R ⇐⇒ R ∈ / R. (0.1.20) ских рассуждений — эти области тогда как раз
стали оформляться в специальный раздел мате-
Из этого наблюдения следует много странных матики, называемый основания математики —
утверждений, в частности, такое: были подвергнуты пересмотру. Немецким мате-
матиком Давидом Гильбертом в начале 20 ве-
! 0.1.14. В предположении непротиворечиво-
ка была предложена специальная программа, це-
сти теории NST, в ней оказывается выводима
лью которой объявлялось превращение основа-
формула4
ний математики в “универсальную” аксиомати-
R∈R &R∈ /R (0.1.21)
ческую теорию, где не только будут удалены су-
(из которой следует противоречивость NST), ществующие противоречия, но также будет до-
а также по отдельности каждая из формул казано, что
R∈RиR∈ / R.
1) никаких новых противоречий в дальнейшем
Доказательство. В предположении непротиво- возникнуть не может (это свойство теории на-
речивости теории NST, из закона исключенного зывается непротиворечивостью), и
третьего5 следует такая цепочка:
2) любое утверждение ϕ либо верно само, либо
невозможна ситуация, верно его отрицание ¬ϕ (это называется пол-
когда R ∈ R и одновременно R ∈ /R нотой).
4 На языке формальной логики выводимость формулы (0.1.21) и вытекающую из этого противоречивость теории
Через некоторое время эта работа привела непротиворечивость любой такой теории (точ-
к определенным успехам: подходящим уточне- нее, любой теории, включающей арифметику,
нием определений и введением новых строгих без которой математику пока все-таки предста-
правил для построения новых объектов удалось вить невозможно). Параллельно обнаружилась
добиться устранения всех накопленных к то- несовместимость непротиворечивости с пол-
му времени в математике противоречий. Однако нотой. Эти результаты принадлежат австрий-
новым неприятным сюрпризом, ставшим одним скому математику Курту Гёделю, и мы о них по-
из главных итогов всей этой деятельности, яви- говорим на с.105 (см. теоремы 2.2.19 и 2.2.22).
лась принципиальная невозможность доказать
A∈B
– и в этом случае, как и в NST, говорят, что “A принадлежит B”, или что “A является элементом
B”, или что “B содержит A в качестве элемента”.
Формулы теории множеств. Формулы теории MK определяются так же как в теории NST, с
той разницей, что алфавит удобно расширить, включив строчные буквы латинского алфавита и еще
возможность добавлять к букве штрих. То есть, повторим с уточнениями, на интуитивном уровне,
формула в MK – это утверждение или, другой термин, высказывание о классах7 , которое можно
получить инструментами теории, то есть с помощью отношения принадлежности ∈, к которому
еще добавляется отношение равенства =, а также с помощью (некоторых) логических операций
и кванторов, список которых был приведен в таблице на с.3: ¬, &, ∨, ⇒, ∀, ∃ (символ ⇔ будет
определен позже формулой (0.2.25)). При этом, информация во втором столбце этой таблицы (о
смысле этих символов) приводится пока только для интуитивного понимания существа дела, и для
нашей ближайшей цели – описать понятие формулы в теории множеств – нам не нужна. Точный
смысл этих значков мы объясним на с.11.
Определение понятию формулы выглядит так:
• Переменной в теории множеств мы будем считать произвольную букву латинского ал-
фавита, прописную
A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z,
6 Энтони Морс, Джон Келли. В компактном виде эта теория описана в Добавлении к учебнику Дж. Л. Келли [5].
или строчную,
a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,
либо такую же букву с добавленным (возможно, несколько раз) штрихом, то есть если α
– переменная, то α′ – тоже переменная, например
X =Y (0.2.22)
является формулой,
2) если X и Y – переменные, то запись
X∈Y (0.2.23)
является формулой,
3) если строка ϕ – формула, то строка ¬ (ϕ) – тоже формула;
4) если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:
X 6= Y (0.2.26)
¬(X = Y ),
а
X∈
/Y (0.2.27)
– эквивалентная запись отношения
¬(X ∈ Y ).
§ 2. Логика предикатов для теории множеств 9
∃!x α
Секвенции. Формулы в языке связаны между собой тем, что одни следуют из других. Если нас
интересует вопрос, следует ли формула χ из формулы ϕ, то это принято записывать строчкой
ϕ ⊢ χ,
и называется такая запись секвенцией. В секвенции может быть несколько формул слева и справа
от знака секвенции ⊢, тогда эти формулы должны быть разделены запятыми, и при этом запятая
8 См. сравнение на с.171.
10 Глава 0. ТЕОРИЯ МНОЖЕСТВ
слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как сокращение
символа ∨.9 То есть, например, секвенция
ϕ, χ ⊢ ψ, ω
означает, что мы хотим понять, следует ли формула ψ ∨ ω из формулы ϕ &χ, и поэтому она экви-
валентна секвенции
ϕ &χ ⊢ ψ ∨ ω. (0.2.30)
Точно так же секвенция
α, β, γ ⊢ δ, η, θ, ι
эквивалентна секвенции
α &β &γ ⊢ δ ∨ η ∨ θ ∨ ι.
В секвенции формулы могут повторяться, например, так:
ϕ, ϕ ⊢ χ,
или так
ϕ ⊢ χ, χ, χ
(повторение может быть сколь угодно длинным, но конечным, потому что формул в секвенции
всегда конечный набор).
Заглавные греческие буквы, например, Γ , ∆, обозначают конечные наборы формул (возможно,
повторяющихся), связанных запятыми. В частности, запись
Γ ⊢∆
означает секвенцию, в которой под Γ и ∆ понимаются такие конечные наборы формул. Точно так
же запись
A, B ⊢ Γ, ∆
означает секвенцию, в которой A, B, Γ , ∆ тоже такие наобры формул, причем там, где кончается
A и начинается B тоже стоит запятая (и то же самое для Γ и ∆).
В секвенции
Γ ⊢∆
набор формул Γ (слева от знака ⊢) называется антецедентом (или посылкой), а набор формул ∆
(справа от знака ⊢) – сукцедентом (или следствием). Не всегда ∆ следует из Γ , но в тех случаях,
когда удается построить так называемый вывод для секвенции Γ ⊢ ∆ (что это такое мы объясним
на с.12), говорят, что эта секвеция выводима (а ∆ действительно следует из Γ ).
Наборы Γ или ∆ могут быть пустыми: секвенция
⊢ ∆,
если она выводима, означает, что дизъюнкция формул ∆ следует из пустого набора формул (это
можно понимать так, что ∆ следует из чего угодно)10 , а секвенция
Γ ⊢
– что из конъюнкции формул Γ следует все что угодно11 . Секвенция, пустая с обеих сторон
⊢,
если она выводима, означает, что в этом языке из любого набора формул Γ следует любой набор
формул ∆ (это понимается так, что рассматриваемый язык противоречив12).
9 Это правило, — “запятая слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как
сокращение символа ∨”, — формально не присутствует в правилах исчисления LK, оно выводится потом. В нашем
тексте оно доказывается ниже в теоремах 0.2.28 и 0.2.29.
10 См. ниже в качестве иллюстрации пример 0.2.30.
11 См. ниже в качестве иллюстрации пример 0.2.31.
12 См. по этому поводу теорему 2.2.5 ниже.
§ 2. Логика предикатов для теории множеств 11
ϕ ⊢ ϕ. (LK-0)
символов (которых нет в языке теории множеств, из-за чего тот проще). Для языков с функциональными симво-
лами нижеприводимые правила вывода LK-12 и LK-15 усложняются тем, что вместо переменной y в них позволено
подставлять произвольный терм (понятие терма будет определено на с.106).
12 Глава 0. ТЕОРИЯ МНОЖЕСТВ
— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
(LK-9)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
(LK-10)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
(LK-11)
Γ ⊢ ∆, ϕ ⇒ χ
— добавление квантора всеобщности в антецедент: если подстановка ϕx=y
корректна14 , то
ϕx=y , Γ ⊢ ∆
(LK-12)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y не
входит (как свободная переменная) в нижнюю секвенцию (то есть в
наборы формул Γ , ∆, ∀x ϕ), то
Γ ⊢ ∆, ϕx=y
(LK-13)
Γ ⊢ ∆, ∀x ϕ
— добавление квантора существования в антецедент: если переменная y
не входит (как свободная переменная) в нижнюю секвенцию (то есть
в наборы формул ∃x ϕ, Γ , ∆), то
ϕx=y , Γ ⊢ ∆
(LK-14)
∃x ϕ, Γ ⊢ ∆
— добавление
квантора существования в сукцедент: если подстановка
ϕx=y корректна15 , то
Γ ⊢ ∆, ϕx=y
(LK-15)
Γ ⊢ ∆, ∃x ϕ
Дерево Генцена и выводимость секвенций в LK. Теперь объясним, как это работает. Если
нам даны какие-то два набора формул Γ и ∆ (то есть два набора высказываний в языке теории
множеств), то в этой науке имеет смысл высказывание
Правила вывода (LK-0) — (LK-15) дают нам (в некоторых случаях) формальную возможность
понять, действительно ли выводима секвенция
Γ ⊢∆ (0.2.34)
14 Определение корректной подстановки дано на с. 9.
15 См.определение на с. 9.
16 Почему (0.2.31) эквивалентно (0.2.32) станет понятно только после теорем 0.2.28 и 0.2.29 ниже.
§ 2. Логика предикатов для теории множеств 13
(это не всегда просто и даже не всегда можно выяснить, но довольно часто все-таки получается, и
математика строится на этом). Для этого надо попытаться представить ее как результат применения
какого-нибудь правила вывода из (LK-1) — (LK-15), оформив это в виде картинки
Γ ′ ⊢ ∆′
Γ ⊢∆
или
Γ ′ ⊢ ∆′ Γ ′′ ⊢ ∆′′
Γ ⊢∆
′ ′′ ′ ′′
где Γ , Γ и ∆ и ∆ – некие новые наборы формул. После этого нужно попробовать достроить эту
картинку, проделав то же самое с новыми секвенциями Γ ′ ⊢ ∆′ и Γ ′′ ⊢ ∆′′ , и так далее. Картинка
которая у нас будет всякий раз получаться, например, что-нибудь в таком духе,
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
(0.2.35)
Γ ⊢∆
— называется деревом Генцена. В нем секвенция в самом низу (здесь это Γ ⊢ ∆) называется корнем,
а секвенции на самом верху (в данном случае Γ ′′′ ⊢ ∆′′′ и Γ ′′′′ ⊢ ∆′′′′ ) — вершинами.
Если (за конечное число шагов) нам удастся построить дерево Генцена, в котором на вершинах
стоят аксиомы исчисления LK, то есть секвенции вида (LK-0),
ϕ ⊢ ϕ,
ϕ ⊢ ϕ,
(потому что на его вершинах стоят аксиомы). То же справедливо для всех остальных примеров
Это дерево Генцена означает, что секвенция ниже, и мы не будем дальше об этом напоминать.
(0.2.38) выводима независимо от того, какие
формулы языка теории множеств подставишь
вместо α и β. Например, подставив вместо α фор- ⋄ 0.2.7. Для секвенции
мулу x ∈ x, а вместо β формулу ∃y x ∈ y, мы
получим выводимую секвенцию
α&β⊢β &α (0.2.41)
x ∈ x, x ∈ x ⇒ (∃y x ∈ y) ⊢ ∃y x ∈ y.
⊢ α, ¬α ¬α, α ⊢ ¬β ⊢ α, ¬α ¬β ⊢ ¬α, ¬β
(LK-5) (LK-5) (LK-3) (LK-5)
⊢ ¬¬α ⇒ α ⊢ α ⇒ ¬¬α α ⇒ β, ¬β ⊢ ¬α
(LK-6) (LK-3)
⊢ ¬¬α ⇔ α α ⇒ β ⊢ ¬β ⇒ ¬α
(LK-3) (LK-1) α, α ⊢
β ⇒ γ, α ⊢ γ, α α, β, β ⇒ γ ⊢ γ (LK-5)
α, α ⇒ β, β ⇒ γ ⊢ γ α ⊢ ¬α.
(LK-3)
(где вместо β можно вставлять разные другие
α, β ⇒ γ, α ⇒ β ⊢ γ формулы). Эти два дерева также не будут вы-
(LK-11)
водами (потому что на их вершинах снова стоят
β ⇒ γ, α ⇒ β ⊢ α ⇒ γ не аксиомы), но, поскольку таких деревьев мож-
(LK-11)
но получить бесконечно много, перебрать все ва-
α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ) рианты без специально разработанных для этого
технических средств не получится.
⋄ 0.2.10. Для секвенции
Забегая вперед, скажем, что для атомарных
17
¬(α ⇒ β) ⊢ α & ¬β (0.2.44) формул α секвенция (0.2.45) невыводима. Од-
нако доказать это мы сможем только на с.173 (в
вывод такой: примере 2.4.3).
⋄ 0.2.12. Для секвенции
α⊢α β⊢β
(LK-1) (LK-5) ∀x α ⊢ α (0.2.46)
α ⊢ α, β ⊢ β, ¬β
(LK-3) (LK-1) вывод такой:
α ⊢ β, α α ⊢ β, ¬β α⊢α
(LK-6) (LK-12)
α ⊢ β, α & ¬β ∀x α ⊢ α
(LK-3)
α ⊢ α & ¬β, β ⋄ 0.2.13. Для секвенции, противоположной
(LK-11) (0.2.46),
⊢ α & ¬β, α ⇒ β α ⊢ ∀x α (0.2.47)
(LK-5) вывод построить не удается. Для построения де-
¬(α ⇒ β) ⊢ α & ¬β рева Генцена выберем какую-нибудь перемен-
ную, отличную от x и не входящие в формулу
⋄ 0.2.11. До сих пор секвенции, которые мы рас- α. Пусть такой переменной будет y. Тогда дере-
сматривали, были выводимыми. Рассмотрим в во Генцена может быть таким:
качестве контрпримера следующую секвенцию:
α ⊢ αx=y
α ⊢ ¬α. (0.2.45) (LK-13)
α ⊢ ∀x α
Самое простое дерево Генцена, которое для нее
можно построить, выглядит так: Как и в примере 0.2.11, здесь секвенция, стоящая
на вершине
α, α ⊢ α ⊢ αx=y
(LK-5)
α ⊢ ¬α. — не аксиома. Поэтому такое дерево не будет вы-
водом для (0.2.47).
В нем секвенция на вершине, Но опять, как и в примере 0.2.11, из это-
го формально не следует, что секвенция (0.2.47)
α, α ⊢ невыводима, потому что дерево вывода для нее
17 Атомарные формулы в теории множеств были определены на с.8.
16 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Пусть это будут a и b. Тогда вывод может быть c, d. Тогда дерево Генцена может быть таким:
таким:
α|x=a,y=c ⊢ α|x=d,y=b
(LK-13)
α|x=a,y=b ⊢ α|x=a,y=b
(LK-12)
α|x=a,y=c ⊢ ∀x α|y=b
(LK-14)
∀y α|x=a ⊢ α|x=a,y=b
(LK-12)
∃y α|x=a ⊢ ∀x α|y=b
(LK-15)
∀x ∀y α ⊢ α|x=a,y=b
(LK-13)
∃y α|x=a ⊢ ∃y ∀x α
(LK-12)
∀x ∀y α ⊢ ∀x α|y=b
(LK-13)
∀x ∃y α ⊢ ∃y ∀x α
∀x ∀y α ⊢ ∀y ∀x α Снова, как и в примерах 0.2.11 и 0.2.51, мы ска-
жем здесь, что секвенция (0.2.55) невыводима,
⋄ 0.2.19. Точно так же чтобы доказать выводи- пообещав доказать это потом.
мость секвенции
⋄ 0.2.22. Для секвенции
∃x ∃y α ⊢ ∃y ∃x α, (0.2.53) ∀x ∀y α ⊢ ∀y ∀x α (0.2.56)
вывод такой:
нужно выбрать какие-нибудь две переменные,
отличные от x и y, и не входящие в формулу α. α⊢α
Пусть опять это будут a и b. Тогда вывод может (LK-15)
быть таким: α ⊢ ∃x α
(LK-12)
α|x=a,y=b ⊢ α|x=a,y=b ∀x α ⊢ ∃x α
(LK-15)
⋄ 0.2.23. Для секвенции
α|x=a,y=b ⊢ ∃x α|y=b
(LK-15) (∀x α) & (∀x β) ⊢ ∀x (α & β) (0.2.57)
α|x=a,y=b ⊢ ∃y ∃x α
вывод такой:
(LK-14)
∃y α|x=a ⊢ ∃y ∃x α α&β⊢α&β
(LK-14) (LK-12)
∃x ∃y α ⊢ ∃y ∃x α (∀x α) & (∀x β) ⊢ α & β
(LK-13)
⋄ 0.2.20. Тот же прием позволяет доказать вы- (∀x α) & (∀x β) ⊢ ∀x (α & β)
водимость секвенции И точно так же выводится секвенция
Γ1 ⊢ ∆1 Γn ⊢ ∆n Λ1 ⊢ Ω1 Λm ⊢ Ωm
Γ ⊢∆
Γ ⊢∆ (0.2.64)
§ 2. Логика предикатов для теории множеств 19
и
γ⊢∆ (0.2.65)
выводятся друг из друга в LK.
Доказательство. Здесь достаточно рассмотреть случай, когда Γ состоит из двух формул α и β,
потому что общий случай рассматривается по аналогии.
1. Выводимость (0.2.65) из (0.2.64) видна из дерева
α, β ⊢ ∆
(LK-7)
α & β, β ⊢ ∆
(LK-3)
β, α & β ⊢ ∆
(LK-7)
α & β, α & β ⊢ ∆
(LK-2)
α&β⊢∆
α, β ⊢ α & β α&β⊢∆
(LK-4)
α, β ⊢ ∆
в котором секвенция в левой вершине есть (0.2.59), и, как мы поняли выше, она выводима.
И вторая теорема, объясняющая, почему сукцедент можно понимать как дизъюнкцию:
Теорема 0.2.29 (о сукцеденте). Пусть ∆ — конечный набор формул в LK и δ — дизъюнкция этих
формул. Тогда для любого набора формул Γ секвенции
Γ ⊢∆ (0.2.66)
и
Γ ⊢δ (0.2.67)
выводятся друг из друга в LK.
Доказательство. Здесь достаточно рассмотреть случай, когда ∆ состоит из двух формул α и β,
потому что общий случай рассматривается по аналогии.
1. Выводимость (0.2.67) из (0.2.66) видна из дерева
Γ ⊢ α, β
(LK-9)
Γ ⊢ α, α ∨ β
(LK-3)
Γ ⊢ α ∨ β, α
(LK-9)
Γ ⊢ α ∨ β, α ∨ β
(LK-2)
Γ ⊢ α∨β
Γ ⊢α∨β α ∨ β ⊢ α, β
(LK-4)
Γ ⊢ α, β
в котором правая вершина есть секвенция (0.2.60), про которую мы уже знаем, что она выводима.
20 Глава 0. ТЕОРИЯ МНОЖЕСТВ
α⊢α
α&β⊢α&β (LK-7) β⊢β
теорема 0.2.28 α&β⊢α (LK-7)
α, β ⊢ α & β (LK-3), (LK-5) α&β⊢β
(LK-3), (LK-5) ¬α ⊢ ¬(α & β) (LK-3), (LK-5)
¬(α & β) ⊢ ¬α, ¬β ¬β ⊢ ¬(α & β)
теорема 0.2.29 (LK-8)
¬(α & β) ⊢ (¬α) ∨ (¬β) (¬α) ∨ (¬β) ⊢ ¬(α & β)
(LK-11) (LK-11)
⊢ ¬(α & β) ⇒ (¬α) ∨ (¬β) ⊢ (¬α) ∨ (¬β) ⇒ ¬(α & β)
(LK-6)
⊢ ¬(α & β) ⇒ (¬α) ∨ (¬β) & (¬α) ∨ (¬β) ⇒ ¬(α & β)
(0.2.25)
⊢ ¬(α & β) ⇔ (¬α) ∨ (¬β)
x: β ⇒ (∀x α) ⇔ ∀x (β ⇒ α)
¬∀x α ⇔ ∃x ¬α ((∃x α) ⇒ β) ⇔ ∃x (α ⇒ β)
¬∃x α ⇔ ∀x ¬α β ⇒ (∃x α) ⇔ ∃x (β ⇒ α)
((∀x α) & β) ⇔ ∀x (α & β) ((∀x α) & (∀x γ)) ⇔ ∀x (α ⇒ γ)
β & (∀x α) ⇔ ∀x (β & α) ((∃x α) ∨ (∃x γ)) ⇔ ∃x (α ∨ γ)
((∃x α) & β) ⇔ ∃x (α & β) ∀y β ⇔ ∀x β|y=x
β & (∃x α) ⇔ ∃x (β & α) ∃y β ⇔ ∃x β|y=x
((∀x α) ∨ β) ⇔ ∀x (α ∨ β) ∀x β ⇔ β
β ∨ (∀x α) ⇔ ∀x (β ∨ α) ∃x β ⇔ β
((∃x α) ∨ β) ⇔ ∃x (α ∨ β)
⊲ 0.2.39. Докажите выводимость формулы 20
β ∨ (∃x α) ⇔ ∃x (β ∨ α)
((∀x α) ⇒ β) ⇔ ∀x (α ⇒ β) ¬(α ∨ β) ⇔ (¬α &¬β) (0.2.77)
ϕ⊢χ
(LK-11)
⊢ ϕ ⇒ χ.
Это дерево Генцена надо понимать так, что если у его вершины — секвенции ϕ ⊢ χ — есть вывод,
то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом для
секвенции ⊢ ϕ ⇒ χ, а это и означает выводимость формулы ϕ ⇒ χ.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.38):
ϕ, ϕ ⇒ χ ⊢ χ
(LK-3)
⊢ϕ⇒χ ϕ ⇒ χ, ϕ ⊢ χ
(LK-4)
ϕ⊢χ
Опять это дерево надо понимать так, что если у его левой вершины — секвенции ⊢ ϕ ⇒ χ —
есть вывод (что эквивалентно выводимости формулы ϕ ⇒ χ), то его можно пристроить к этой
вершине сверху, затем к правой вершине — секвенции ϕ, ϕ ⇒ χ ⊢ χ — нужно будет присторить ее
вывод, который мы получили на с.13, и мы в результате получим дерево, являющееся выводом для
секвенции ϕ ⊢ χ.
• В другом частном случае, если Σ совсем не содержит формул, мы получаем определение фор-
мулы ω выводимой в LK, данное на с.21.
⋄ 0.2.41. Для любых двух формул α и β из фор- Здесь видно, что если выводима формула α&β,
мулы α&β выводятся и α, и β. то есть секвенция ⊢ α&β, то ее вывод можно при-
Рассмотрим дерево клеить к левой вершине этого дерева, и мы по-
α⊢α лучим вывод для секвенции ⊢ α. Для формулы
(LK-7)
β нужно построить похожее дерево.
⊢ α&β α&β ⊢ α
(LK-4)
⊢α
⊢α
(LK-13) (0.2.83)
⊢ ∀x α
24 Глава 0. ТЕОРИЯ МНОЖЕСТВ
∀x α ⊢ α (0.2.85)
Если этот вывод из примера 2.1.19 приклеить к правой вершине дерева (0.2.84), то мы получим
дерево вида (0.2.81), означающее, что формула α выводится из формулы ∀x α.
Следующая лемма представляет собой аналог теоремы 0.2.28 для отношения выводимости фор-
мул:
Лемма 0.2.43. Пусть Σ — конечный набор формул в LK и σ — конъюнкция этих формул. Тогда
для формулы ω следующие условия эквивалентны:
(i) ω выводится из Σ в LK,
(ii) ω выводится из σ в LK.
Доказательство. Пусть для начала Σ состоит из двух формул: α и β. Тогда σ есть просто конъ-
юнкция α&β.
1. Рассмотрим дерево
⊢α ⊢β
(LK-6)
⊢ α&β
⊢ω
Если ω выводима из σ то есть из α&β, то, поскольку α&β выводима из α и β, то есть из Σ, мы
получаем, что ω выводима из Σ.
2. Для доказательства обратного рассмотрим дерево
⊢ α&β ⊢ α&β
⊢α ⊢β
(LK-6)
⊢ω
В нем верхние две ветви мы можем считать деревьями Генцена в силу примера 0.2.41. Поэтому если
последний переход — тоже дерево Генцена, то есть если ω выводится из α и β (или, иными словами,
из Σ), то ω должна выводиться и из α&β, то есть из σ.
Общий случай (с произвольным числом формул в Σ) рассматривается аналогично.
Теорема 0.2.44 (о дедукции для LK). Пусть ω – формула и Σ — конечный набор формул в LK.
Рассмотрим два условия:
(a) ω следует из Σ в LK,
(b) ω выводится из Σ в LK.
Тогда:
(i) условие (a) влечет условие (b),
(ii) если формулы Σ замкнуты, то условие (b) влечет условие (a) (то есть в этом случае
(a) и (b) равносильны).
§ 2. Логика предикатов для теории множеств 25
σ, Γ ⊢ ∆
(LK-1)
ϕ, σ, Γ ⊢ ∆,
(LK-3)
σ, ϕ, Γ ⊢ ∆,
а она будет деревом Генцена с теми же, что у (0.2.88) вершиной и корнем. Точно так же, например,
если в правиле (LK-12) вписать в антецедент формулы σ,
σ, ϕx=y , Γ ⊢ ∆
, (0.2.89)
σ, ∀x ϕ, Γ ⊢ ∆
то эту картинку можно дополнить до картинки
σ, ϕx=y , Γ ⊢ ∆
(LK-3)
ϕx=y , σ, Γ ⊢ ∆,
(LK-12)
∀x ϕ, σ, Γ ⊢ ∆,
(LK-3)
σ, ∀x ϕ, Γ ⊢ ∆,
а она будет деревом Генцена с теми же, что у (0.2.89) вершиной и корнем.
Так будет со всеми правилами (LK-1) — (LK-12), (LK-15), но когда мы дойдем до правил (LK-13) и
(LK-14) нам понадобится все-таки требование, что формула σ замкнута. Например, если дополнить
правило (LK-13)
Γ ⊢ ∆, ϕx=y
(0.2.90)
Γ ⊢ ∆, ∀x ϕ
26 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Аксиомы равенства.
MK-1 Аксиома рефлексивности равенства:
X =X (0.3.92)
(равенство X = X верно для всех классов X).
MK-2 Аксиома симметричности равенства:
X=Y ⇒Y =X (0.3.93)
(равенство X = Y не отличается от равенства Y = X).
MK-3 Аксиома транзитивности равенства:
(X = Y & Y = Z) ⇒ X = Z (0.3.94)
(равенства X = Y и Y = Z влекут за собой равенство X = Z).
MK-4 Аксиома инвариантности символа принадлежности:
(X = A & Y = B & X ∈ Y ) ⇒ A ∈ B (0.3.95)
(в отношение X ∈ Y можно подставлять классы, равные X и Y , и при этом будут
получаться следствия).
Аксиома невырожденности.
MK-5 Аксиома невырожденности25 :
∃X ∃Y X ∈ Y. (0.3.96)
(существуют классы X и Y такие, что X ∈ Y ).
Схема аксиом выделения. Из аксиомы объемности MK-6 следует, что для описания объек-
та теории множеств (класса) достаточно (и необходимо) описать входящие в него элементы. Это
используется в следующей аксиоме, формализующей способ построения новых классов из уже име-
ющихся.
ϕ.
Как и в теории NST, аксиома MK-7 позволяет определять объекты: если формула ϕ не содержит
никаких свободных переменных, кроме X, X1 , ..., Xn (возможно, не все из этого списка, но всякая
свободная переменная из ϕ все-таки лежит в нем), то формула
определяет некую операцию в теории MK, интуитивно понимаемую как сопоставление классам
X1 , ..., Xn класса Φ(X1 , ..., Xn ), состоящего из элементов X, удовлетворяющих условию
(∃Z X ∈ Z) & ϕ.
Однако это только интуитивное понимание сути дела, потому что формально операция Φ не являет-
ся отображением в том смысле, который вкладывается в этот термин в теории MK (см. определение
на с.39): у отображения и аргументы X1 , ..., Xn и значения Φ(X1 , ..., Xn ) обязаны быть множествами
(по определению множества на с.29 и по теореме 0.3.33), а у операции Φ это совсем не обязательно
так, здесь X1 , ..., Xn и Φ(X1 , ..., Xn ) вполне могут быть собственными классами (не множествами).
Как следствие, Φ следует понимать исключительно как операцию над символами (правильнее ска-
зать, термами, см. определение на с.106) языка.
Ниже на с.121 мы увидим, что такой тип рассуждений в логике используется для определе-
ния внешних функциональных символов, и в данном случае таким внешним символом будет как
раз буква Φ. Однако эта буква в формуле (0.3.101) выбрана случайно, потому что в теориях мно-
жеств, в том числе в MK, определяемую таким образом операцию не принято обозначать с помощью
какого-то функционального символа. Ее традиционно вообще никак не обозначают, а обозначение
используется только для ее значений на аргументах X1 , ..., Xn . И таким обозначением является
строка символов {X : ϕ}:
{X : ϕ} = Φ(X1 , ..., Xn ).
Аккуратное определение выглядит так:
• Если формула ϕ не содержит никаких свободных переменных, кроме X, X1 , ..., Xn , то при под-
разумеваемом в каких-то рассуждениях смысле обозначений X1 , ..., Xn обозначение
{X : ϕ}
{X : ϕ},
⋄ 0.3.2. Пустой класс ∅. Следующее равенство Доказательство. Здесь почти слово в слово по-
определяет так называемый пустой класс: вторяются рассуждения примера 0.1.10. По ак-
сиоме объемности MK-6, чтобы доказать нера-
∅ := {X : X 6= X}. (0.3.104) венство ∅ 6= Set, достаточно подобрать какой-
нибудь класс X такой, чтобы
(символ := здесь означает, что это соотношение
следует понимать как определение, то есть как X∈ / ∅ & X ∈ Set .
декларацию, согласно которой символ слева от Для этого воспользуемся аксиомой MK-5 и рас-
:= будет использоваться в тексте всюду для обо- смотрим какие-нибудь два класса X и Y такие,
значения объекта, лежащего справа от этого зна- что
ка). X ∈ Y.
В соответствии с аксиомой выделения, рас-
шифровывается эта запись так: элементами Понятно, что X является множеством, поэтому
класса ∅ считаются те и только те множества X ∈ Set. С другой стороны, X ∈ / ∅ (потому что
X, которые не равны самому себе. Поскольку по Z ∈ ∅ невозможно ни для какого Z по определе-
аксиоме MK-1 таких X не бывает (высказывание нию ∅).
X = X считается верным всегда), класс ∅ во- ! 0.3.5. Объясним, почему в аксиоме MK-7 важ-
обще не содержит никаких элементов (отчего и но, чтобы Y не входил в формулу ϕ как свобод-
называется пустым). ная переменная. Действительно, если бы этого
условия не было, то мы могли бы рассмотреть,
⋄ 0.3.3. Класс Set всех множеств. Следую-
например, формулу
щее равенство определяет так называемый класс
всех множеств: X∈ /Y (0.3.107)
X⊆Y ⇔ ∀Z (Z ∈ X ⇒ Z ∈ Y ). (0.3.114)
X ⊆Y ⊆Z
эквивалентна высказыванию
X ⊆ Y & Y ⊆ Z.
Отрицание отношения ⊆ записывается символом ⊆
6 :
X⊆
6 Y ⇐⇒ ¬(X ⊆ Y ).
• Полезно также ввести отношение строгого включения: говорят, что класс X строго со-
держится в классе Y , или что X является строгим подклассом класса Y , и изображают
это записью
X⊂Y
или записью
Y ⊃ X,
если
X ⊆ Y & X 6= Y.
Отрицание отношения ⊂ записывается символом ⊂
6 :
X⊂
6 Y ⇐⇒ ¬(X ⊂ Y ).
1◦ Всякий класс X содержит пустой класс ∅ и содержится в классе Set всех множеств:
∅ ⊆ X ⊆ Set . (0.3.115)
X ⊆ X. (0.3.116)
X⊆Y ⊆X ⇐⇒ X = Y. (0.3.117)
4◦ Транзитивность: если X ⊆ Y и Y ⊆ Z, то X ⊆ Z:
X⊆Y ⊆Z =⇒ X ⊆ Z. (0.3.118)
⊢ (∀A A ∈ X ⇔ A ∈ Y ) ⇒ X = Y (0.3.98)
теорема 0.2.40
∀A (A ∈ X ⇔ A ∈ Y ) ⊢ X = Y
(0.2.25)
(∀A α) & (∀A β) ⊢ ∀A (α & β) (0.2.57) ∀A (α & β) ⊢ X = Y
(LK-4)
(∀A A ∈ X ⇒ A ∈ Y ) & (∀A A ∈ Y ⇒ A ∈ X) ⊢ X = Y
(LK-11)
(∀A A ∈ X ⇒ A ∈ Y ) & (∀A A ∈ Y ⇒ A ∈ X) ⇒ X = Y
∀Z (Z ⊆ X ⇒ Z ∈ Y ). (0.3.121)
Экспонента 2X .
• Экспонентой произвольного класса X называется класс
2X = {Z : Z ⊆ X} (0.3.124)
⋄ 0.3.9. Экспонента класса всех множеств сов- быть множеством: Y ∈ Set. Мы получаем вклю-
падает с классом всех множеств: чение 2Set ⊆ Set. Наоборот, если Y ∈ Set, то,
поскольку Y является классом, в силу (0.3.115)
2Set = Set (0.3.125) мы получаем, что Y ⊆ Set. Таким образом, одно-
временно Y ∈ Set и Y ⊆ Set, и значит, Y ∈ 2Set .
Set
Доказательство. Если Y ∈ 2 = {Z : Z ⊆ Это доказывает включение Set ⊆ 2Set . Применяя
Set}, то по аксиоме выделения MK-7′ , Y должно (0.3.117), мы получаем 2Set = Set.
Z ⊆X ⇔ Z ∈ 2X (0.3.126)
X ∩ Y = {Z : Z ∈ X & Z ∈ Y } (0.3.127)
X ∪ Y = {Z : Z ∈ X ∨ Z ∈ Y } (0.3.128)
∅ ∩ X = ∅, ∅ ∪ X = X. (0.3.129)
X ∩ Y ⊆ X ⊆ X ∪ Y. (0.3.131)
X ∩ Y = Y ∩ X, X ∪ Y = Y ∪ X. (0.3.133)
(X ∩ Y ) ∩ Z = X ∩ (Y ∩ Z), (X ∪ Y ) ∪ Z = X ∪ (Y ∪ Z) (0.3.134)
(X ∩ Y ) ∪ Z = (X ∪ Z) ∩ (Y ∪ Z), (X ∪ Y ) ∩ Z = (X ∩ Z) ∪ (Y ∩ Z) (0.3.135)
∪X = {Z : ∃Y (Y ∈ X & Z ∈ Y )} (0.3.137)
∩X = {Z : ∀Y (Y ∈ X ⇒ Z ∈ Y )} (0.3.138)
X ∈Y =⇒ ∩Y ⊆ X ⊆ ∪Y. (0.3.142)
34 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Дополнение и разность.
• Дополнением класса X называется класс
\X = {Y : Y ∈
/ X} (0.3.145)
Свойства дополнения:
◦
1 Связь с пустым классом и классом всех множеств:
\∅ = Set, \ Set = ∅. (0.3.146)
2◦ Связь с пересечением и объединением: для любого класса X
X ∩ \X = ∅, X ∪ \X = Set . (0.3.147)
3◦ Связь с включением: для любых классов X и Y
X⊆Y =⇒ \Y ⊆ \X. (0.3.148)
4◦ Инволютивность: для любого класса X
\(\X) = X. (0.3.149)
5◦ Законы де Моргана: для любых классов X и Y
\(X ∩ Y ) = (\X) ∪ (\Y ), \(X ∪ Y ) = (\X) ∩ (\Y ). (0.3.150)
• Разностью классов X и Y называется класс
X \ Y = X ∩ (\Y ) (0.3.151)
Свойства разности:
◦
1 Связь с пустым классом и классом всех множеств: для любого класса X
X \ ∅ = X, ∅ \ X = ∅. (0.3.152)
◦
2 Связь с пересечением и объединением: для любых классов X, Y , Z
X ∩ (Y \ Z) = (X ∩ Y ) \ Z, (X ∪ Y ) \ Z = (X \ Z) ∪ (Y \ Z) (0.3.153)
3◦ Связь с включением: для любых классов X, Y , Z
X⊆Y =⇒ X \Z ⊆Y \Z & Z \ Y ⊆ Z \ X. (0.3.154)
4◦ Двойная разность: для любых классов X, Y , Z
X \ (Y \ Z) = (X \ Y ) ∪ (X ∩ Y ∩ Z). (0.3.155)
5◦ Законы де Моргана: для любых классов X, Y , Z
X \ (Y ∩ Z) = (X \ Y ) ∪ (X \ Z), X \ (Y ∪ Z) = (X \ Y ) ∩ (X \ Z). (0.3.156)
§ 3. Теория множеств Морса-Келли 35
Аксиома регулярности.
MK-11 Аксиома регулярности: если X – непустой класс, X 6= ∅, то в нем существует
элемент Y ∈ X, пересечение которого с X пусто:
X ∩ Y = ∅.
X = {Z : Z = A}.
Set
Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.159), Y = A, и поэтому мы получаем
A ∩ X = Y ∩ X = ∅.
X = {Z : Z = A ∨ Z = B}.
Set Set
Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.160), Y = A или Y = B. Если Y = A, то мы
получаем
A∩X =Z ∩X =∅
∩{X} = X = ∪{X}.
{X} = Set;
⋄ 0.3.17. Напомним, что согласно примеру 0.3.7, ⋄ 0.3.18. Наоборот, одночленный класс {Set},
пустой класс ∅ является множеством. Покажем, порожденный классом Set всех множеств, сов-
что одночленный класс {∅}, порожденный пу- падает с классом Set:
стым множеством ∅, не совпадает с пустым мно-
жеством:
{∅} 6= ∅ (0.3.162) {Set} = Set . (0.3.163)
Это следует из аксиомы объемности MK-6: ∅ ∈
{∅}, но ∅ 6= ∅. Это следует из теоремы 0.3.16.
{X, Y } = Set;
∪ ∩(X, Y ) ∪ ∪ ∪(X, Y ) \ ∪ ∩ (X, Y ) = Y (0.3.171)
left Z = ∩ ∩ Z (0.3.176)
Декартово произведение.
• Декартовым произведением классов X и Y называется класс
– и тогда по теореме 0.3.6 это будет означать, что X × Y – тоже множество. Это делается так:
(0.3.126)
(A, B) ∈ X × Y =⇒ A∈X &B∈Y =⇒ A∈ X ∪Y & B ∈ X ∪Y =⇒
(0.3.126) X∪Y
=⇒ {A} ∈ 2X∪Y & {A, B} ∈ 2X∪Y =⇒ (A, B) = {{A}, {A, B}} ∈ 22 .
Отношения.
• Отношением называется произвольный класс r, элементами которого являются упорядо-
ченные пары:
C ∈ r =⇒ ∃A ∃B C = (A, B).
(Это автоматически означает, что компоненты A и B каждой такой пары (A, B) должны
быть множествами, потому что иначе пара (A, B) не могла бы быть элементом r.)
! 0.3.26. Всякое отношение r является подклассом в декартовом произведении X × Y некоторых
классов X и Y :
r ⊆X ×Y (0.3.184)
В качестве X и Y можно взять, например, класс Set всех множеств.
(r ◦ s) ◦ t = r ◦ (s ◦ t), (0.3.192)
r ◦ (s ∩ t) = (r ◦ s) ∩ (r ◦ t), (0.3.193)
r ◦ (s ∪ t) = (r ◦ s) ∪ (r ◦ t). (0.3.194)
Отображения.
• Класс f называется отображением, если он является отношением и удовлетворяет усло-
вию:
∀X ∀Y ∀Z (X, Y ) ∈ f & (X, Z) ∈ f ⇒ Y = Z . (0.3.198)
• Запись
f :X→Y (0.3.202)
означает, что f является отображением, область определения которого совпадает с клас-
сом X, а область значений лежит в классе Y :
• Полезно также зарезервировать какое-то обозначение для ситуации, когда условия (0.3.203)
ослаблены до условий
D(f ) ⊆ X & R(f ) ⊆ Y. (0.3.204)
Мы в таких случаях будем писать
f : X ֒→ Y. (0.3.205)
⋄ 0.3.30. Можно заметить, что пустое множе- Определение (0.3.201) позволяет также найти
ство ∅ является отображением, потому что фор- значение класса Set на произвольном классе X:
мулы (X, Y ) ∈ ∅ и (X, Z) ∈ ∅, ложны, и значит, (
из них следует что угодно, в частности Y = Z. ∅, X ∈ Set
Set(X) = . (0.3.208)
При этом, Set, X∈/ Set
Если же X ∈
/ Set, то
∅(X) = ∅ (0.3.207)
Схема аксиом подстановки. Следующая схема аксиом теории MK представляет собой утвер-
ждение, что если f – отображение, и его область определения D(f ) – множество, то и его область
значений R(f ) – тоже множество.
MK-12 Аксиома подстановки: пусть ϕ — формула теории множеств, не содержащая пе-
ременную B в качестве свободной переменной, тогда
∃A ∀X X ∈ A ⇒ ∃!Y ϕ ⇒ ∀A A ∈ Set ⇒ ∃B ∈ Set ∀X X ∈ A ⇒ ∃Y Y ∈ B & ϕ
(0.3.216)
(здесь формула до первой импликации — ∃A ∀X X ∈ A ⇒ ∃!Y ϕ — означает, что ϕ
выражает функциональную зависимость между переменными X и Y , а формула после
первой импликации — что если X пробегает множество, то Y тоже пробегает множество).
Свойства отображений:
1◦ Если f и g – отображения, то f ◦ g – тоже отображение.
2◦ Если f – отображение, то
f = {(X, Y ) : Y = f (X)} (0.3.217)
3◦ Отображения f и g совпадают тогда и только тогда, когда они совпадают на всех
значениях:
f = g ⇐⇒ ∀X f (X) = g(X) (0.3.218)
4◦ Если f – отображение, у которого область определения D(f ) является множеством,
то f – множество.
42 Глава 0. ТЕОРИЯ МНОЖЕСТВ
f ∈YX ⇐⇒ f : X → Y. (0.3.219)
f ∈YX =⇒ f ⊆X ×Y =⇒ f ∈ 2X×Y ,
Иными словами,
Y X ⊆ 2X×Y . (0.3.220)
Если X и Y – множества, то по теореме 0.3.25, декартово произведение X ×Y – тоже множество. От-
сюда по теореме 0.3.10, 2X×Y – тоже множество. Таким образом, в (0.3.220) справа стоит множество,
и значит, по теореме 0.3.6, слева – тоже множество.
и
Q(g)(B, A) = g(B)(A), A ∈ X, B ∈ Y, g ∈ (Z Y )X . (0.3.222)
определяют пару взаимно обратных биекций между Z Y ×X и (Z Y )X :
P : Z Y ×X → (Z Y )X , Q : (Z Y )X → Z Y ×X
Q ◦ P = idZ Y ×X , P ◦ Q = id(Z Y )X .
и
P (Q(g))(B)(A) = (0.3.221) = Q(g)(B, A) = (0.3.222) = g(B)(A), g ∈ (Z Y )X .
[
f (Y ) = {Z : ∃Y Y ∈ X & Z ∈ f (Y )} (0.3.223)
Y ∈X
\
f (Y ) = {Z : ∀Y Y ∈ X ⇒ Z ∈ f (Y )} (0.3.224)
Y ∈X
S
Класс Y ∈XTf (Y ) при этом называется объединением значений отображения f на классе
X, а класс Y ∈X f (Y ) — пересечением значений отображения f на классе X.
Теорема
S 0.3.38. ЕслиT отображение f является множеством, то для любого множества X
классы Y ∈X f (Y ) и Y ∈X f (Y ) являются множествами.
§ 3. Теория множеств Морса-Келли 43
а действие – правилом
f X (Y ) = f (Y ), Y ∈ D(f ) ∩ X. (0.3.227)
Отношение эквивалентности.
• Отношение r ⊆ X × X называется отношением эквивалентности на классе X, если оно
обладает следующими свойствами:
— рефлексивность:
ArA, (0.3.228)
— симметричность:
ArB ⇒ BrA, (0.3.229)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.230)
• Если r — отношение эквивалентности на классе X, то классом эквивалентности по от-
ношению r называется произвольный непустой класс Y ⊆ X такой, что
∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.231)
Лемма 0.3.40. Любые два класса эквивалентности Y и Z либо не пересекаются, либо совпадают.
Доказательство. Если существует A ∈ Y ∩ Z, то для всякого B ∈ X мы получим:
Теорема 0.3.41. Пусть r — отношение эквивалентности на непустом классе X такое что все
классы эквивалентности по нему являются множествами. Тогда
(i) существует класс X/r, элементами которого являются в точности классы эквива-
лентности по отношению r:
Y ∈ X/r ⇔ Y ⊆ X & ∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.232)
∀A ∈ X A ∈ p(A) (0.3.233)
Поскольку каждый класс эквивалентности Y является множеством, X/r будет состоять в точности
из всех классов эквивалентности по r. С другой стороры, отображение p определяется формулой
Ясно, что A ∈ p(A), а с другой стороны, p(A) является классом эквивалентности. Отображение
p будет сюръективно, потому что если Y – класс эквивалентности, то по определению он непуст,
поэтому найдется A ∈ Y . Для него мы получим A ∈ X и A ∈ p(A). Значит, Y и p(A) – классы
эквивалентности, содержащие A, и по лемме 0.3.40 мы получаем, что Y = p(A).
Теорема 0.3.42. Если X – множество, то на нем любое отношение эквивалентности r удовле-
творяет условиям теоремы 0.3.41, а фактор-класс X/r является множеством.
Доказательство. По теореме 0.3.41, фактор-отображение p : X → X/r сюръективно, поэтому
R(p) = X/r,
∀A ∈ X A⊆X (0.3.234)
⋄ 0.3.45. Очевидно, пустой класс ∅ наполнен. ⋄ 0.3.51. Класс X = {{∅}} обладает тем свой-
ством, что на нем отношение принадлежности ∈
⋄ 0.3.46. Одночленный класс {∅} также напол-
транзитивно,
нен.
⋄ 0.3.47. Упорядоченная пара {∅, {∅}} являет- ∀A, B, C ∈ X A ∈ B ∈ C ⇒ A ∈ C (0.3.235)
ся наполненным классом. но при этом класс X не наполнен.
⋄ 0.3.48. Эту цепочку примеров можно продол- Доказательство. Цепочка A ∈ B ∈ C ∈ {{∅}}
жать, потому что если X – наполненное множе- невозможна: можно построить цепочку из двух
ство, то класс X ∪ {X} – тоже наполненное мно- знаков ∈
жество. В частности, наполнены классы ∅ ∈ {∅} ∈ {{∅}},
{∅, {∅}, {∅, {∅}}} := {∅, {∅}} ∪ {{∅, {∅}}}, но левее уже никаких классов не подпишешь.
Отсюда следует, что класс X = {{∅}} триви-
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} := ально удовлетворяет условию (0.3.235). Но он не
удовлетворяет условию (0.3.234), потому что для
= {∅, {∅}, {∅, {∅}}} ∪ {{∅, {∅}, {∅, {∅}}}}
него нужно было бы, чтобы из
и так далее.
{∅} ∈ {{∅}}
⋄ 0.3.49. Класс Set всех множеств, очевидно, на-
полнен. следовало
{∅} ⊆ {{∅}}
! 0.3.50. Следующие примеры показывают, что
условие наполненности класса (несмотря на то есть
внешнее сходство) не эквивалентно условию ∅ ∈ {{∅}},
транзитивности отношения ∈ на данном классе. а это неверно.
§ 3. Теория множеств Морса-Келли 45
Y = Y ∩ X = ∅.
(iii) f продолжает любое другое отображение со свойствами (i) и (ii): если g – какое-
то другое отображение, удовлетворяющее (i) и (ii), то g ⊆ f .
Следующая теорема – один из из самых важных результатов этой науки:
Заметим, что класс F непуст, потому что содержит по крайней мере пустое множество:
∅ ∈ F.
Покажем далее, что любые два отображения из класса F совпадают на общей области определения:
∀f, g ∈ F f D(f )∩D(g) = g D(f )∩D(g) (0.3.238)
B∈A & B ∩ A = ∅.
и это противоречит первому утверждению в (0.3.240). Значит, наше предположение, что A непусто,
неверно. То есть A = ∅, и это доказывает (0.3.238).
После этого нужно положить
f = ∪F,
и это будет отображение, индуктивно порожденное отображением h.
Теорема 0.3.54. Если отображение h определено на классе Set, то определенное им индуктивно
отображение f также определено на классе Set:
Тогда
Set \ D(f ) 6= ∅,
и к этому классу можно применить аксиому регулярности MK-11: существует класс Y ∈ Set \ D(f )
такой, что
Y ∩ (Set \ D(f )) = ∅.
Иными словами,
Y ∈ Set \ D(f ) & Y ⊆ D(f ). (0.3.242)
Рассмотрим класс
N = {Y } ∪ D(f ).
Он наполнен, потому что если Z ∈ N , то
— либо Z ∈ D(f ), и тогда, поскольку D(f ) наполнен, мы получаем
Z ⊆ D(f ) ⊆ N,
Z = Y ⊆ D(f ) ⊆ N.
Оно будет принадлежать F и продолжать отображение f на более широкий, чем D(f ), класс N .
Это означает, что f не может удовлетворять условию (iii) в определении на с.57. Как следствие,
наше предположение (0.3.241) не может быть верно.
Теорема 0.3.55. Пусть отображение h и классы M и P удовлетворяют следующим условиям:
(i) класс M наполнен:
∀X ∈ M X ⊆ M, (0.3.243)
§ 3. Теория множеств Морса-Келли 47
R(h) ⊆ P. (0.3.245)
Оно корректно определено в силу (0.3.244). По теореме 0.3.54, H индуктивно определяет некое
отображение F : Set → Set. В частности, F будет удовлетворять условию (0.3.305):
Покажем, что
∀X ∈ M F X ∈ P X . (0.3.249)
Предположим, что это не так:
∃X ∈ M F X ∈
/ P X. (0.3.250)
Зафиксируем этот элемент X ∈ M . Условие (0.3.250) означает, что найдется Y ∈ X такой, что
F (Y ) ∈
/ P.
N = {Y ∈ M : F (Y ) ∈
/ P}
A∈N & A ∩ N = ∅.
а второе – что
∀Z ∈ A Z ∈
/ N = {Y ∈ M : F (Y ) ∈
/ P },
Опять применяя (0.3.243), можно это переформулировать так:
∀Z ∈ A Z∈M & Z∈
/ N = {Y ∈ M : F (Y ) ∈
/ P} .
∀Z ∈ A F (Z) ∈ P,
Теперь мы получаем:
F (A) = (0.3.248) = H(F A ) = (0.3.252), (0.3.247) = h(F A ) ∈ R(h) ⊆ (0.3.245) ⊆ P
То есть F (A) ∈ P , и это противоречит (0.3.251). Значит, наше предположение (0.3.250) неверно, и
поэтому справедливо (0.3.249).
48 Глава 0. ТЕОРИЯ МНОЖЕСТВ
Положим теперь
f = F M .
Для него будет выполняться тождество (0.3.246),
∀X ∈ M f (X) = F (X) = (0.3.248) = H(F X ) = (0.3.249), (0.3.247) = h(F X ),
N = {X ∈ M : f (X) 6= g(X)}
непуст. Значит, к нему можно применить аксиому регулярности MK-11: существует класс A такой,
что
A ∈ N & A ∩ N = ∅.
Первое условие означает, что
A∈M & f (A) 6= g(A). (0.3.254)
А второе – что
∀X ∈ A f (X) = g(X),
то есть что
f A = g A .
Но отсюда, применяя первое условие из (0.3.254), A ∈ M , мы получаем
f (A) = (0.3.246) = h(f A ) = h(g A ) = (0.3.253) = g(A),
(e) Ординалы
Отношение полного порядка.
• Отношение r ⊆ X × X называется отношением строгого частичного порядка на классе
X, если оно обладает следующими свойствами:
— антисимметричность:
ArB ⇒ ¬(BrA), (0.3.255)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.256)
• Отношение r ⊆ X × X называется отношением строгого линейного порядка на классе
X, если оно является отношением строгого частичного порядка и обладает следующим
дополнительным свойством:
— линейность:
A 6= B ⇒ (ArB ∨ BrA), (0.3.257)
• Говорят, что в классе X элемент A ∈ X является
— минимальным для отношения r, если для любого другого элемента B ∈ X из
BrA следует, что B = A,
— максимальным для отношения r, если для любого другого элемента B ∈ X из
ArB следует, что B = A.
§ 3. Теория множеств Морса-Келли 49
min Y. (0.3.259)
⋄ 0.3.57 (конструкция фон Неймана). Матема- — класс {∅, {∅}, {∅, {∅}}} является ординалом
тику Джону фон Нейману принадлежит следую- и обозначается
щая остроумная идея строить ординалы “по ин-
дукции”. 3 := {∅, {∅}, {∅, {∅}}} = {0, 1, 2} = 2 ∪ {2}.
Прежде всего, пустое множество ∅ являет- (0.3.263)
ся ординалом. В дальнейшем нам будет удобно — следующий в этой цепочке класс 3 ∪ {3} тоже
использовать для него новый символ: является ординалом и обозначается
Таким образом, класс Y наполнен и любой его элемент Z ∈ Y – тоже наполненный класс. Значит,
Y – ординал.
Теорема 0.3.62 (об отношении ∈ на ординале). Пусть X – ординал. Тогда отношение принад-
лежности ∈ на X будет отношением полного порядка27 , то есть будет обладать следующими
свойствами:
(i) транзитивность:
∀A, B, C ∈ X A∈B∈C =⇒ A∈C (0.3.272)
(ii) линейность:
∀A, B ∈ X A ∈ B ∨ B ∈ A ∨ A = B. (0.3.273)
(iii) полная упорядоченность: если ∅ 6= Y ⊆ X — непустой подкласс в X, то найдется
элемент B ∈ Y , принадлежащий любому другому элементу C ∈ Y , отличному от B:
C ∈ Y & C 6= B ⇒ B ∈ C, (0.3.274)
B = ∩Y (0.3.275)
B = min Y (0.3.276)
min Y = ∩Y (0.3.277)
Y = {B ∈ X : ∃A ∈ X A∈
/ B & A 6= B & B ∈
/ A}. (0.3.278)
27 Отношение полного порядка было определено на с.49.
§ 3. Теория множеств Морса-Келли 51
По аксиоме регулярности MK-11 на с.35, это означает, что существует элемент y ∈ Y такой что
y ∩ Y = ∅. Зафиксируем этот класс y. Он один из тех B, для которых выполняется формула,
определяющая Y :
B ∈ X & (∃A ∈ X A ∈ / B & A 6= B & B ∈/ A)
То есть формула
y ∈ X & (∃A ∈ X A∈
/ y & A 6= y & y ∈
/ A).
Это означает, что класс
Z = {z ∈ X : z ∈
/ y & z 6= y & y ∈
/ z} (0.3.279)
– тоже непуст. Опять аксиоме регулярности MK-11 на с.35, существует элемент z ∈ Z такой что
z ∩ Z = ∅. Зафиксируем z тоже.
Заметим теперь, что y ∈
/ Z (потому что y 6= y неверно, и значит, формула y ∈ X & y ∈
/ y & y 6=
y &y ∈ / y, получаемая подстановкой y вместо z в фигурные скобки (0.3.279), тоже неверна). По-
скольку z ∈ Z, отсюда можно сделать вывод, что
y 6= z. (0.3.280)
y = z. (0.3.281)
C ∈ Y & C 6= B ⇒ B ⊆ C.
C∈Y ⇒ B ⊆ C.
Y ⊆X ⇐⇒ (Y ∈ X ∨ Y = X), (0.3.283)
причем если Y ⊆ X и Y 6= X, то
Y = min(X \ Y ) (0.3.284)
Доказательство. Пусть X – ординал, Y – наполненный класс и Y ⊆ X. В утверждении (0.3.283)
импликация в левую сторону очевидна:
Y ⊆X ⇐= (Y ∈ X ∨ Y = X).
Y ⊆X =⇒ (Y ∈ X ∨ Y = X).
Свойства ординалов:
◦
1 Всякий непустой ординал X содержит пустой класс ∅ в качестве элемента,
∅ ∈ X, (0.3.285)
min X = ∅. (0.3.287)
§ 3. Теория множеств Морса-Келли 53
∅∈X =⇒ ∩X ⊆ ∅ =⇒ ∩X = ∅.
и отношение
A6B ⇐⇒ A∈B ∨ A=B , A, B ∈ Ord . (0.3.292)
X ∈ Ord =⇒ X ⊆ Ord .
С другой стороны, всякий элемент X ∈ Ord является ординалом и значит, наполненным классом.
Вместо это означет, что Ord – ординал. Он не может быть множеством, потому что тогда мы полу-
чили бы Ord ∈ Ord, а это противоречит следствию 1◦ из аксиомы регулярности MK-11 на с.35.
2. Пусть X – ординал. По уже доказанному свойству 1◦ , Ord – тоже ординал. Поэтому по свойству
◦
6 на с.53, либо X = Ord, либо X ∈ Ord, либо Ord ∈ X. Последнее – Ord ∈ X – невозможно, потому
что оно означало бы, что Ord – множество, а мы уже доказали в 1◦ , что это не так. Значит, остается
либо X = Ord, либо X ∈ Ord.
3. Если X – ординал, то по уже доказанному свойству 2◦ , либо X = Ord, либо X ∈ Ord. В первом
случае X тривиально содержится в Ord, а во втором это будет следствием того, что класс Ord,
будучи ординалом, наполнен:
X ∈ Ord ⇒ X ⊆ Ord .
Наоборот, если X – наполненный класс, содержащийся в ординале Ord, то по теореме 0.3.60, X
является ординалом.
4. Свойство 4◦ есть непосредственное следствие свойства 3◦ на с.53.
5. А свойство 5◦ сразу следует из свойства 4◦ на с.53.
6. Если B, C ∈ Ord, то условие ∀A < B A < C расшифровывается так: ∀A ∈ B A ∈ C. Это
как раз означает, что B ⊆ C.
Операция X 7→ S(X).
• Для всякого порядкового числа X класс X ∪ {X} называется следующим порядковым
числом после X и имеет специальное обозначение:
5◦ Если X ∈ Ord, то
∪X ⊆ X ⊆ S(∪X), (0.3.296)
причем справедлива следующая альтернатива:
— либо в (0.3.296) выполняется равенство слева, эквивалентное неравенству спра-
ва:
∪X = X ⇔ X 6= S(∪X). (0.3.297)
— либо в (0.3.296) выполняется равенство справа, эквивалентное замене включе-
ния слева на символ принадлежности:
∪X ∈ X ⇔ X = S(∪X). (0.3.298)
Доказательство. 1. Пусть X ∈ Ord. Убедимся, что класс S(X) наполнен. Действительно, если
A ∈ B ∈ S(X) = X ∪ {X}, то либо A ∈ B = X, и значит, A ∈ X, либо A ∈ B ∈ X, и тогда A ∈ X,
в силу наполненности X. В любом случае, A ∈ X ⊆ S(X). С другой стороны, всякий элемент
B ∈ S(X) = X ∪ {X} либо совпадает с X, либо является элементом X. В обоих случаях B является
ординалом и значит, наполнен. Вместе это означает, что S(X) – ординал.
2. Если ∅ = S(X) = X ∪ {X}, то {X} ⊆ ∅, то есть X ∈ ∅, что невозможно. Если же X = S(X) =
X ∪ {X}, то {X} ⊆ X, то есть X ∈ X, что тоже невозможно.
3. Пусть X ∈ Ord. Обозначим Z = {Y : Y ∈ Ord & X ∈ Y }. В 1◦ мы уже доказали, что S(X) ∈
Ord. С другой стороны, X ∈ X ∪ {X} = S(X). Вместе эти два утверждения означают, что S(X) ∈ Z.
Покажем теперь, что это минимальный элемент в Z в смысле отношения ∈. Предположим, что
существует B ∈ Z такой, что B ∈ S(X) = X ∪ {X}. Тогда либо B = X, либо B ∈ X. В первом
случае, B = X, мы получаем
X ∈ B = X,
⇑
B∈Z
A ∈ ∪ S(X) ⇐⇒ ∃Y ∈ S(X) A ∈ Y ⇐⇒ ∈ X} ∨ ∃Y
|A {z | ∈X
{z A ∈ Y} ⇐⇒ A ∈ X.
| {z }
k Y ∈{X} ⇓
X ∪ {X} A∈Y ∈X
⇓
A∈X
X – наполненный
класс
A ∈ ∪X ⇒ ∃B ∈ X A ∈ B ⇒ A∈B∈X ⇒ A ∈ X.
(0.3.288)
A∈X ⇒ A ∈ ∪X ∨ A = ∪X ⇒ A ∈ (∪X) ∪ {∪X} = S(∪X).
Заметим далее, что поскольку X и S(∪X) – ординалы, по лемме 0.3.63, второе включение в (0.3.296),
X ⊆ S(∪X), эквивалентно условию
X ∈ S(∪X) ∨ X = S(∪X).
56 Глава 0. ТЕОРИЯ МНОЖЕСТВ
⊆
(0.3.296)
∪X ∈ X ⇔ {∪X} ⊆ X ⇔ (∪X) ∪ {∪X} ⊆ X ⇔ S(∪X) = X
| {z }
k
S(∪X)
⊆
(0.3.296)
X
Теорема 0.3.65. Класс M ⊆ Ord тогда и только тогда будет множеством, когда он содержится
в некотором порядковом числе A ∈ Ord:
∀A ∈ Ord ∃B ∈ M B∈
/ A.
Поскольку класс Ord линейно упорядочен по отношению ∈, это условие можно переписать так:
∀A ∈ Ord ∃B ∈ M A ∈ B ∨ A = B.
∀A ∈ Ord ∃B ∈ M A ∈ B.
Теорема 0.3.66. Непустое порядковое число X ∈ Ord изолировано тогда и только тогда, когда
∪X ∈ X (0.3.300)
(0.3.295) (0.3.295)
∪X = ∪ S(Y ) = Y ∈ S(Y ) = X.
Теорема 0.3.67. Непустой ординал X ∈ Ord пределен тогда и только тогда, когда28
∪X = X, (0.3.302)
Поскольку D(F ) и Ord – наполненные классы, их пересечение Y = D(F ) ∩ Ord – тоже наполненный
класс (по свойству 2◦ на с.45). При этом Y ⊆ Ord, поэтому по свойству 4◦ на с.54, Y – ординал.
Условие (0.3.305) выполняется для отображения f автоматически, и то же самое с условием (iii).
Из теоремы 0.3.55 сразу следует
Теорема 0.3.69. Пусть M – ординал, P – произвольный класс, и отображение h удовлетворяет
следующим условиям:
(i) для всякого ординала X ∈ M класс P X всех отображений f : X → P содержится в
области определения h:
∀X ∈ M P X ⊆ D(h), (0.3.306)
(ii) область значений h содержится в классе P :
R(h) ⊆ P. (0.3.307)
(где R(T ) – область значений класса T , определенная формулой (0.3.200)). По теореме 0.3.68 оно
определяет некое отображение f , у которого область определения D(f ) является ординалом, и
∀Z ∈ D(f ) f (Z) = h(f |Z ) = min M \ R(f |Z ) .
и мы получим отображение g с областью определения D(g) = D(f ) ∪ {D(f )} = S(D(f )), более
широкой чем у f , но с теми же свойствами, что у f , и это будет означать, что g продолжает f ,
сохраняя его свойства, что невозможно по определению (на с.57) отображения, порожденного h.
4. Заметим далее, что отображение f нестрого монотонно:
⇓
∀A ∈ D(f ) A ∈ X
⇓
D(f ) ⊆ X
∀B < A B ∈ Y, (0.3.312)
то A ∈ Y .
Тогда Y = X.
Y ⊇ A = S(B) = B ∪ {B}
влечет за собой условие B ∈ Y , из которого в свою очередь в силу OT-1, мы получаем A = S(B) ∈ Y .
Если же A – предельный ординал, то для него условие
Y ⊇ A = {B : B ∈ A} = {B ∈ X : B < A}
Таким образом, Y – изолированное порядковое число, и любой его элемент Z ∈ Y – тоже изолиро-
ванное порядковое число. Значит, Y – натуральное число.
Свойства класса N:
1◦ Ординалы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, определенные выше формулами (0.3.260) — (0.3.269),
являются натуральными числами:
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} ⊆ N (0.3.313)
29 Изолированные порядковые числа были определены на с.57.
§ 3. Теория множеств Морса-Келли 61
2◦ Если X ∈ N, то S(X) ∈ N.
◦
3 Класс N является ординалом.
Доказательство. 1. Свойство 1◦ очевидно.
2. Пусть X ∈ N, то есть X – натуральное число. Если Y ∈ S(X) = X ∪{X}, то либо Y ∈ X, и тогда
Y – изолированное порядковое число, потому у X, как у натурального числа, все элементы должны
быть изолированными ординалами. Либо Y = X, и тогда Y – изолированный ординал, потому что
X, как натуральное число, должно быть изолированным ординалом. Итак, любой элемент Y ∈ S(X)
– изолированный ординал. С другой стороны, S(X) – тоже изолированный ординал (потому что
имеет вид S(Y ) для Y = X). Вместе это означает, что S(X) – натуральное число.
3. Если A ∈ B ∈ N, то B – натуральное число, и поэтому по теореме 0.3.74 A – тоже натуральное
число. Значит, A ∈ N, и это доказывает наполненность класса N. С другой стороны, всякий элемент
B ∈ N является натуральным числом, и значит, ординалом, и поэтому наполнен. Вместе это значит,
что N – ординал.
Из теоремы 0.3.69 следует
Теорема 0.3.75 (об определении индукцией на натуральных числах). Пусть P – класс, и h –
отображение со следующими свойствами:
(i) для любого натурального числа n ∈ N класс P n (состоящий из всевозможных отобра-
жений f : n → P ) содержится в области определения D(h),
P n ⊆ D(h)
R(h) ⊆ P.
Тогда формула
f (n) = h(f n ), n∈N (0.3.314)
однозначно определяет отображение f : N → P .
Следующая модификация теоремы 0.3.75 очень полезна в приложениях.
Теорема 0.3.76 (об определении индукцией на натуральных числах). Пусть Q – класс, и H –
отображение, действующее из Q в Q:
H : Q → Q.
Тогда для всякого множества X ∈ Q правила
Операция наполнения X 7→ fill X. Полез- Если считать, что Q = Set, то Q и H будут удо-
ность теорем 0.3.76 и 0.3.79 можно проиллюсти- влетворять посылке теоремы 0.3.76, и поэтому
ровать конструкцией, сопоставляющей любому формула (0.3.315) определяет некое отображение
множеству X наименьшее содержащее его напол- f : N → Set. Обозначим
ненное31 множество, обозначаемое fill X и на-
зываемое наполнением X. filln X = f (n)
Зафиксируем произвольное множество X ∈
Set и определим отображение H : Set → Set и заметим, что
правилом
(
∪T, T 6= ∅ fill0 X = X, fillS(n) X = ∪ filln X,
H(T ) = n ∈ N.
X, T = ∅
30 В аксиоме MK-13 важно утверждение, что Y является множеством, а не просто классом.
31 В смысле определения на с.44.
§ 3. Теория множеств Морса-Келли 63
где c – функция выбора, существование которой декларируется аксиомой MK-14. По теореме 0.3.68
отображение h определяет единственное отображение f , определенное на некотором ординале D(f )
64 Глава 0. ТЕОРИЯ МНОЖЕСТВ
по формуле
f (Y ) = h(f Y ) = c (X \ R(f Y )), Y ∈ D(f ) ⊆ Ord .
Приглядимся к этому отображению f .
1. Заметим сначала, что f должно быть биекцией (между своими областью определения D(f )
и множеством значений R(f )). Действительно, предположим, что для некоторых A 6= B ∈ D(f )
выполняется f (A) = f (B). По свойству
ординалов 6◦ на с.53 либо A ∈ B, либо B ∈ A. Будем
считать, что A ∈ B. Тогда f (A) ∈ R(f B ), и мы получаем такую импликацию:
f (B) = c (X \ R(f B )) ∈ X \ R(f B ) ⇒ f (A) 6= f (B).
| {z }
∈
f (A)
поэтому R(f ) ⊆ X. Отсюда по теореме 0.3.6 следует, что R(f ) – множество, а из этого по аксиоме
MK-12 на с.41 следует, что
D(f ) = f −1 R(f −1 ) = f −1 D(f )
– тоже множество, и значит,
D(f ) ∈ Ord .
3. Поскольку D(f ) ∈
/ D(f ), по теореме 0.3.33 мы получаем
f (D(f )) = Set
| {z }
k
c X \ R(f D(f ) )
k
c X \ R(f )
То есть
c X \ R(f ) = Set .
/ D(c) = Set \{∅}. То есть должно быть X \ R(f ) = ∅, и,
Такое возможно только если X \ R(f ) ∈
поскольку R(f ) ⊆ X, мы получем
R(f ) = X.
Таким образом, f – биекция между D(f ) ∈ Ord и R(f ) = X.
Кардинальные числа.
• Говорят, что два множества X и Y равномощны, и обозначают это записью
X ≃ Y, (0.3.321)
X≃
6 Y
Свойства отношения ≃:
1◦ Рефлексивность: всегда X ≃ X.
2◦ Симметричность: если X ≃ Y , то Y ≃ X.
3◦ Транзитивность: если X ≃ Y и Y ≃ Z, то X ≃ Z.
§ 3. Теория множеств Морса-Келли 65
(то есть пара (X, P ) принадлежит классу card, если X равномощно P и P является кардиналом).
Если (X, P ) ∈ card и (X, Q) ∈ card, то X ≃ P и X ≃ Q, поэтому по свойствам 2◦ и 3◦ отношения
≃, P ≃ Q. С другой стороны, P, Q ∈ Card, поэтому в силу (0.3.324), P = Q, Поскольку это верно
для любых (X, P ) ∈ card и (X, Q) ∈ card, это означает, что отношение card – отображение. Условие
(0.3.325) следует из (0.3.326), и остается доказать, что card определено на всем классе Set. Это
следует из теоремы 0.3.83: всякое множество X ∈ Set равномощно некоторому ординалу T ∈ Ord,
который в свою очередь (по свойству 1◦ класса Card) равномощен некоторому кардиналу P ∈ Card,
поэтому (X, P ) ∈ card.
Доказательство. Из card X ≃ X следует card X ∈ {Z ∈ Ord : Z ≃ X}, поэтому card X > min{Z ∈
Ord : Z ≃ X}. Если предположить, что неравенство строгое, card X > min{Z ∈ Ord : Z ≃ X}, то мы
получим
min{Z ∈ Ord : Z ≃ X} ≃ X ≃ card X,
то есть min{Z ∈ Ord : Z ≃ X} – ординал, равномощный card X, но меньший card X. Это означает,
что card X – не кардинал (потому что противоречит определению кардиналов).
Свойства мощности:
1◦ Если X, Y ∈ Set, то X ≃ Y тогда и только тогда, когда card X = card Y .
2◦ P ∈ Card тогда и только тогда, когда P ∈ Set и card P = P .
3◦ Если X ∈ Set, то card(card X) = card X.
Доказательство. 1. Если X ≃ Y , то
(0.3.325) (0.3.325) транзитивность ≃ (0.3.324)
card X ≃ X ≃Y ≃ card Y =⇒ card X ≃ card Y =⇒ card X = card Y.
∋
Card Card
где c – функция выбора из аксиомы MK-14 на с.63. Отображение g будет инъективно, и значит,
биективно между D(g) = R(f ) и R(g) ⊆ D(f ). Применяя свойство мощности 1◦ и лемму 0.3.88, мы
получаем
R(f ) = D(g) ≃ R(g) ⊆ D(f ) =⇒ card R(f ) = card D(g) = card R(g) 6 card D(f ).
Доказательство теоремы 0.3.86. 1. Докажем сначала импликацию (i) ⇒ (ii). Пусть card X 6
card Y . Пусть p : X → card X и q : Y → card Y – биекции, и r : card X → card Y – естествен-
ное вложение
r(A) = A, A ∈ card X.
Тогда отображение f = q −1 ◦ r ◦ p : X → Y является инъекцией, как композиция инъекций.
2. Далее докажем (ii) ⇒ (iii). Пусть дана инъекция f : X → Y . Поскольку X 6= ∅, найдется
элемент A ∈ X. Зафиксируем его и определим отображение
(
f −1 (B), B ∈ R(f )
g(B) = , B ∈ Y.
A, B∈/ R(f )
X ≃ B
⊆
⊇
(0.3.330)
A ≃ Y
то X ≃ Y .
Доказательство. Здесь применяются только что доказанные свойства 1◦ и 4◦ : с одной стороны,
а, с другой стороны,
Y ≃A⊆X =⇒ card Y = card A 6 card X.
⋄ 0.3.91. Всякое натуральное число является Ясно, что отображение f можно переопределить
кардиналом: так, чтобы A переходило в B, а X в Y :
N ⊆ Card . (0.3.331)
A
❴ X
❴
Для доказательства нам понадобится следу-
ющая
B Y
Лемма 0.3.92. Если X, Y ∈ Ord и S(X) ≃ S(Y ),
то X ≃ Y . Это новое отображение g : S(X) → S(Y ) опреде-
ляется формулой
Доказательство. Покажем, что если существу-
ет какая-то биекция f : S(X) → S(Y ), то суще- g = f \ (A, Y ), (X, B) ∪ (A, B), (X, Y )
ствует и биекция g : S(X) → S(Y ), переводя-
щая элемент X ∈ S(X) = X ∪ {X} в элемент и понятно, что оно также будет биекцией.
Y ∈ S(Y ) = Y ∪ {Y }. Для этого обозначим Доказательство примера 0.3.91. Проведем ин-
дукцию (то есть воспользуемся теоремой 0.3.79).
A = f −1 (Y ), B = f (X).
Во-первых, ∅ ∈ Card, потому что не существу-
Если переход от A к Y и от X к B под действием ет ординального числа, меньшего ∅. Во-вторых,
отображения f обозначить стрелками 7→, то мы пусть n ∈ N ∩ Card. Предположим, что S(n) ∈ /
можем изобразить это картинкой N ∩ Card, то есть существует k ∈ S(n) такой что
k ≃ S(n). Поскольку k ∈ S(n) ⊆ N, по теореме
A❅ X 0.3.81 мы получаем, что k – изолированный ор-
❅❅ ⑦⑦❃ динал. С другой стороны, отношение k ≃ S(n)
❅❅⑦
⑦ ❅❅
~⑦⑦ ❅ невозможно при k = ∅, поэтому k 6= ∅. Значит,
B Y k – непустой изолированный ординал. То есть
68 Глава 0. ТЕОРИЯ МНОЖЕСТВ
С другой стороны, из
⇓
m + 1 = k ∈ S(n)
card X 6 card S(X) 6 card N = card X
◦
по свойству 7 на с.55 следует
⇓
m ∈ n. (0.3.333)
card S(X) = card X
Условия (0.3.332) и (0.3.333) вместе означают,
что n – не кардинал, а это противоречит нашему ⇓
предположению n ∈ N ∩ Card.
S(X) ≃ X.
⋄ 0.3.93. Множество N натуральных чисел яв-
Это противоречит примеру (0.3.92), согласно ко-
ляется кардиналом:
торому элемент S(X) ∈ N должен быть кардина-
N ∈ Card (0.3.334) лом.
Доказательство. По теореме 0.3.70, существует сюръекция f : Ord ֒→ Card со свойствами (i) и (ii),
у которой область определения D(f ) является ординалом. Если предположить, что D(f ) 6= Ord, то по
свойству 3◦ на с.54, D(f ) ∈ Ord, и значит D(f ) является множеством. Тогда по аксиоме подстановки
MK-12 на с.41, R(f ) = Card тоже должно быть множеством, а это противоречит теореме 0.3.95.
card X ∈ N.
и X ∪ Y – конечное множество. Далее, предположим, что мы доказали это для всех множеств Y
мощности card Y = n. Пусть card Y = S(n). Выделим какой-нибудь элемент z ∈ Y и рассмотрим
множество Y \ {z}. Его мощность будет равна n,
card(Y \ {z}) = n,
поэтому по нашему предположению, множество X ∪ (Y \ {z}) конечно. Теперь если добавить к нему
не пересекающееся с ним одноэлементное множество {z}, то это будет в точности рассмотренный
случай a), и мы получаем, что множество
X ∪ (Y \ {z}) ∪ {z} = X ∪ Y
X ∪ (Y \ X) = X ∪ Y
Каждый класс X × {y} равномощен множеству X, поэтому он будет конечен. А множество таких
классов
{X × {y}; y ∈ Y }
§ 3. Теория множеств Морса-Келли 71
равномощно Y и поэтому тоже конечно. Значит, по уже доказанному свойству 7◦ , объединение этих
классов [
X ×Y = X × {y} = ∪{X × {y}; y ∈ Y }
y∈Y
— тоже конечное множество.
9. Здесь используется теорема 0.3.79 (принцип обыкновенной индукции). Рассмотрим класс
n o
Y = m : m ∈ N & ∀X card X = m ⇒ card 2X ∈ N .
Теорема 0.3.99. Множество X бесконечно тогда и только тогда, когда существует инъектив-
ное отображение f : N → X.
Доказательство. Множество X бесконечно, тогда и только тогда, когда его мощность card X боль-
ше любого конечного ординала n ∈ N, то есть не меньше кардинала N, или, что то же самое,
мощности N:
card X > N = card N.
По теореме 0.3.86, это эквивалентно существованию инъективного отображения f : N → X.
Теорема 0.3.100. Множество X бесконечно тогда и только тогда, когда оно имеет равномощное
себе подмножество, не совпадающее с X.
Доказательство. Формула (
S(n), n∈N
f (n) =
n, /N
n∈
Теорема 0.3.102. Множество M ⊆ N тогда и только тогда конечно, когда оно содержится в
некотором натуральном числе A ∈ N:
∀A ∈ N ∃B ∈ M A ∈ B ∨ A = B.
∀A ∈ N ∃B ∈ M A ∈ B.
D(x) ∈ N.
xk = x(k), k ∈ n = D(x).
а само это отображение – в виде семейства {xk ; k ∈ n}. Ординал n при этом называется
длиной последовательности {xk ; k ∈ n}.
• Конечная последовательность длины n называется также строкой длины n. При этом
строку длины 2 удобно называть парой, строку длины 3 — тройкой, строку длины 4 —
четверкой, строку длины 5 — пятеркой, строку длины 6 — шестеркой, и так до строки
длины 9, которую называют девяткой33 .
⋄ 0.3.103. Введенное здесь понятие пары как по- Set длины 2 естественным образом можно сопо-
следовательности длины 2 согласуется с поняти- ставить упорядоченную пару множеств (X, Y )
ем упорядоченной пары множеств (X, Y ), опре-
деленной выше формулой (0.3.166) X = a0 , Y = a2 ,
Напомним, что декартово произведение классов X × Y было определено нами выше формулой
(0.3.182):
X × Y = {(A, B) : A ∈ X & B ∈ Y }.
Обобщением этого понятия на случай большего числа множителей можно считать следующую кон-
струкцию.
• Заметим, что в соответствии с обозначением (0.3.219), множество всех последовательно-
стей длины n со значениями в множестве Y естественно обозначать символом Y n :
Доказательство. Отображение
Y
n n+1
Y
f: Xi × Xn+1 → Xi f (x0 , ..., xn ), xn+1 = x0 , ..., xn , xn+1
i=0 i=0
является биекцией.
Ранг множества. Напомним, что выше (0.3.201) мы определили значение g(X) любого класса g
на любом множестве X. Заметим, что если g – множество, то класс ординалов
непуст: поскольку g – множество, R(g) – тоже множество, значит R(g) ∩ Ord – тоже множество, и по
теореме 0.3.65, R(g) ∩ Ord ⊆ A для некоторого A ∈ Ord.
Рассмотрим отображение
h(g) = min{A ∈ Ord : ∀T (g(T ) ∈ Ord ⇒ g(T ) ∈ A)} = min{A ∈ Ord : R(g) ∩ Ord ⊆ A}, g ∈ Set
Оно определено всюду на Set и принимаeт значения в Ord, поэтому по теореме 0.3.54 h индуктивно
определяет некое отображение rank : Set → Ord формулой (0.3.305):
rank X = h(rank X ) = min{A ∈ Ord : R(rank X ) ∩ Ord ⊆ A} (0.3.346)
и условию
B > min{A ∈ Ord : R(rank X ) ∩ Ord ⊆ A} = rank A.
2. Пусть X ∈ Y . Тогда, очевидно, rank X ∈ R(rank Y ), а с другой стороны, rank X ∈ Ord,
поэтому
rank X ∈ R(rank Y ) ∩ Ord. Поэтому если для какого-то ординала A справедливо R(rank Y ) ∩ Ord ⊆
§ 3. Теория множеств Морса-Келли 75
Как следствие,
rank Y > min{A ∈ Ord : R(rank X ) ∩ Ord ⊆ A} = rank X.
4. Прежде всего, из X ⊆ X ∪ Y следует, в силу уже доказанного свойства 3◦ , что rank X 6
rank(X ∪ Y ), и точно так же из Y ⊆ X ∪ Y следует, что rank Y 6 rank(X ∪ Y ). Это в свою очередь
означает в силу (0.3.283), что
Поэтому
rank X ∪ rank Y ⊆ rank(X ∪ Y ). (0.3.347)
Докажем теперь обратное включение. Для этого заметим такую цепочку:
T ∈X ∪Y =⇒ T ∈ X ∨ T ∈ Y =⇒
=⇒ rank T ∈ rank X ∨ rank T ∈ rank Y =⇒ rank T ∈ rank X ∪ rank Y.
Это можно понимать так, что ординал rank X ∪ rank Y содержится в классе всех ординалов A, для
которых выполняется условие
R(rank X∪Y ) ∩ Ord ⊆ A.
Или, иными словами,
rank X ∪ rank Y ∈ {A ∈ Ord : R(rank X∪Y ) ∩ Ord ⊆ A}.
Понятно, что rank X ∪ rank Y должен быть не меньше минимума этого множества:
rank X ∪ rank Y > min{A ∈ Ord : R(rank X∪Y ) ∩ Ord ⊆ A} = (0.3.346) = rank(X ∪ Y ).
следует включение
∪{rank Y ; Y ∈ X} ∈ {A ∈ Ord : R(rank ∪X ) ∩ Ord ⊆ A}
а из него – неравенство
∪{rank Y ; Y ∈ X} > min{A ∈ Ord : R(rank ∪X ) ∩ Ord ⊆ A} = rank ∪X. (0.3.348)
Во-вторых, из цепочки
Y ∈X =⇒ Y ⊆ ∪X =⇒ rank Y 6 rank ∪X
следует неравенство
∪{rank Y ; Y ∈ X} 6 rank ∪X.
76 Глава 0. ТЕОРИЯ МНОЖЕСТВ
В-третьих, из цепочки
мы получаем неравенство в 5◦ :
∪{rank Y ; Y ∈ X} 6 rank X.
7. С одной стороны,
уже доказанное
A свойство 2◦
A⊆A =⇒ A∈2 =⇒ rank A ∈ rank 2A =⇒ rank S(A) 6 rank 2A .
А, с другой,
A ∈ S(A)
уже доказанное
⇓
свойство 2◦
уже доказанное rank Y ∈ rank S(A)
свойство 3◦ ⇓
Y ∈ 2A =⇒ Y ⊆A =⇒ rank Y 6 rank A < rank S(A) =⇒ rank Y < rank S(A).
∀B ∈ A rank B = B.
Тогда
R(rank A ) = R({rank B; B ∈ A}) = R({B; B ∈ A}) = A,
и
rank A = min{C ∈ Ord : R(rank A ) ∩ Ord ⊆ C} = min{C ∈ Ord : A ⊆ C} = A.
Кумулятивная иерархия.
что ∅ удовлетворяет этому условию, потому что rank ∅ = min{C ∈ Ord : ∅ ∩ Ord ⊆ C} = min Ord = ∅.
§ 3. Теория множеств Морса-Келли 77
Свойства SetA :
1◦ X ⊆ SetA тогда и только тогда, когда rank X 6 A.
◦
2 rank SetA = A.
3◦ Наполненность: X ∈ SetA ⇒ X ⊆ SetA .
4◦ Если A ∈ B, то SetA ∈ SetB (и поэтому SetA ⊆ SetB ).
5◦ 2SetA = SetS(A) .
S
6◦ Если A – предельный ординал35 , то SetA = B: B∈A SetB .
Доказательство. 1. Первое свойство здесь эквивалентно свойству 1◦ на с.74:
Теорема 0.3.106. Класс Set всех множеств является объединением множеств SetA , A ∈ Ord:
[
Set = SetA (0.3.351)
A: A∈Ord
.
S
Доказательство. SВложение Set ⊇ A: A∈Ord SetA очевидно, поэтому нам нужно доказать обратное
вложение: Set ⊆ A: A∈Ord SetA . Пусть X ∈ Set. Тогда, по определению ранга (0.3.346), rank X ∈
Ord. Отсюда можно заключить, что существует ординал A ∈ Ord такой что rank X < A (например,
можно положить A = S(rank X)). SПо определению SetA (формулой (0.3.349)), это означает, что
X ∈ SetA . Мы получаем, что X ∈ A: A∈Ord SetA .
• Система множеств {SetA ; A ∈ Ord} называется кумулятивной иерархией множеств в
MK, а каждое множество SetA в ней — элементом кумулятивной иерархии в MK.
Полное упорядочение Set. Напомним, что понятие полного порядка было введено на с.49.
Теорема 0.3.115. На классе Set всех множеств можно ввести отношение полного порядка.
Доказательство. Для каждого порядкового числа A ∈ Ord класс SetA является по теореме 0.3.105
множеством, поэтому по теореме 0.3.114 на SetA существует (хотя бы один) полный порядок. Если
обозначить через WA класс всевозможных полных порядков на SetA , то, во-первых, он будет непуст
(потому что, как мы уже говорили, существует хотя бы один полный порядок на SetA ), а, во-вторых,
он будет множеством (потому что каждый полный порядок на SetA содержится в SetA × SetA , и
значит WA содержится в множестве 2SetA × SetA ).
Мы получаем, что {WA ; A ∈ Ord} ⊆ Set \{∅}. Значит, к классам WA можно применить функцию
выбора c : Set \{∅} → Set (из аксиомы MK-14 на с.63), и для каждого A ∈ Ord мы получим некий
полный порядок ≺A = c(WA ) ∈ WA на SetA . Теперь определим отношение ≺ на Set правилом:
X ≺ Y , если
— либо rank X ∈ rank Y ,
— либо rank X = rank Y = A, и X ≺A Y .
Отношение ≺ будет полным порядком на Set.
вариантах теории множеств с кумулятивной иерархией (наше доказательство, впрочем, строится иначе).
80 Глава 0. ТЕОРИЯ МНОЖЕСТВ
здесь формулировку автор нигде не встречал (что, наверное, можно объяснить просто тем, что
вообще вся теория Морса—Келли описывается в учебниках очень скупо и фрагментарно), поэтому
ей желательно дать какое-то название. Мы назовем этот факт теоремой о выборе.
Теорема 0.3.116 (о выборе). Пусть ∼ — отношение эквивалентности37 на классе X. Тогда су-
ществует подкласс Y ⊆ X со следующими свойствами:
(i) у всякого элемента x ∈ X найдется эквивалентный ему в смысле отношения ∼ элемент
y ∈Y:
∀x ∈ X ∃y ∈ Y x ∼ y
(ii) эквивалентные элементы в классе Y совпадают:
∀y, z ∈ Y y∼z ⇒ y = z.
Y = R(f ).
то есть тождество
f (f (x)) = f (x), x ∈ X. (0.3.359)
3. Из (0.3.359) следует цепочка
то есть тождество
y = f (y), y ∈ Y. (0.3.360)
4. Теперь можно доказать утверждение (ii): если y, z ∈ Y и y ∼ z, то
y∼z
⇓
{t : t ∈ X & t ∼ y} = {t : t ∈ X & t ∼ z}
⇓
y = (0.3.360) = f (y) = min{t : t ∈ X & t ∼ y} = min{t : t ∈ X & t ∼ z} = f (z) = (0.3.360) = z.
После того, как построена формальная теория множеств, логично объяснить, как на ее основе стро-
ятся стандартные числовые множества, используемые в анализе. Строить числа можно по-разному,
и мы даем обзор стандартных подходов в главе 3 (на с.187), но независимо от того, какой подход ты
выбираешь, существование чисел (под которым понимается доказуемость утверждения, что числа
как объекты существуют внутри теории, используемой математиком в качестве фундамента сво-
ей науки) требует обоснования. Самый простой способ решить эту проблему — описать числа как
явную конструкцию в рабочей теории множеств, и мы это делаем в этой главе.
81
82 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ
И, во-вторых, (1.1.2):
Покажем, что
m + n = m ⊕ n. (1.1.8)
Зафиксируем m ∈ N и проведем индукциею по n ∈ N. При n = 0 мы получим
m + 0 = (1.1.1) = m = (1.1.6) = m ⊕ 0.
Предположим, что (1.1.8) верно при каком-то n ∈ N. Тогда для S(n) мы получим:
2. В (1.1.10) правая часть есть тождество (1.1.1), поэтому нужно доказать только левую. Это
делается индукцией по n. Для n = 0 мы получаем
0 + 0 = (1.1.1) = 0.
0+n=n (1.1.14)
∀n ∈ N 0 + n = (1.1.10) = n = (1.1.1) = n + 0.
∀n ∈ N m+n=n+m (1.1.15)
l + (m + 0) = (1.1.1) = l + m = (1.1.1) = (l + m) + 0.
l + (m + n) = (l + m) + n, (1.1.17)
0+m=0+n ⇒ m = n.
l+m=l+n ⇒ m = n, (1.1.18)
И, во-вторых, (1.1.23):
Покажем, что
m · n = m ⊙ n. (1.1.29)
Зафиксируем m ∈ N и проведем индукциею по n ∈ N. При n = 0 мы получим
m · 0 = (1.1.22) = 0 = (1.1.27) = m ⊙ 0.
Предположим, что (1.1.29) верно при каком-то n ∈ N. Тогда для S(n) мы получим:
Доказательство. 1. В (1.1.30) правая часть есть тождество (1.1.22), поэтому нужно доказать только
левую. Это делается индукцией по n. Для n = 0 мы получаем
0 · 0 = (1.1.22) = 0.
0·n=n (1.1.35)
1 · 0 = (1.1.22) = 0.
1·n=n (1.1.36)
∀n ∈ N 0 · n = (1.1.30) = 0 = (1.1.30) = n · 0.
∀n ∈ N m · n = n · m. (1.1.37)
S(m) · S(n) = (1.1.23) = S(m) · n + S(m) = (1.1.38) = n · S(m) + S(m) = (1.1.23) = (n · m + n) + S(m) =
= (1.1.9) = (n · m + n) + (m + 1) = (1.1.12) = ((n · m + n) + m) + 1 = (1.1.12) = ((n · m + (n + m)) + 1 =
= (1.1.11) = ((n · m + (m + n)) + 1 = (1.1.12) = ((n · m + m) + n) + 1 = (1.1.37) = ((m · n + m) + n) + 1 =
= (1.1.23) = (m · S(n) + n) + 1 = (1.1.12) = m · S(n) + (n + 1) = (1.1.9) = m · S(n) + S(n) = (1.1.37) =
= S(n) · m + S(n) = (1.1.23) = S(n) · S(m).
4. После того, как доказано (1.1.32), свойство (1.1.34) можно переписать в виде
(m + n) · l = m · l + n · l, (1.1.39)
Предположим, что (1.1.39) верно для некоторого l. Тогда для S(l) мы получим
2. Теперь предположим, что формула (1.1.47) доказана для всех Y мощности card Y = n:
X ∩ Y = ∅ & card(Y ) = n =⇒ card(X ∪ Y ) = card X + card Y. (1.1.49)
Покажем, что тогда она верна и для случая card Y = S(n). Пусть f : Y → S(n) – биекция. Рассмот-
рим элемент3
y = f −1 (n) ∈ Y.
Отображение f |Y \{y} будет биекцией между Y \ {y} и n, поэтому card(Y \ {y}) = n. Отсюда мы
получаем:
card(X ∪ Y ) = card (X ∪ {y}) ∪ ( Y \ {y} ) = (1.1.49) = card(X ∪ {y}) + card(Y \ {y}) =
| {z } | {z } | {z }
↑ k (1.1.48) k
card(Y \ {y}) = n card X + card{y} n
k
card X + 1
Рассмотрим случай card Y = S(n). Пусть f : Y → S(n) = n ∪ {n}. Обозначим y = f −1 (n). Тогда
f |Y \{y} : Y → n будет биекция, и поэтому card(Y \ {y}) = n. С другой стороны, отобюражение
A ∈ X 7→ (A, y) ∈ X × {y} также будет биекцией. Поэтому
card(X × Y ) = card X × (Y \ {y}) ∪ (X × {y}) = card X × (Y \ {y}) + card(X × {y}) =
| {z } | {z }
k (1.1.51) k
card X · n card X
Транзитивность:
Z = (N × N)/ ∼ (1.1.53)
0 + p = p = p + 0, p∈Z (1.1.57)
p + q = q + p, p, q ∈ Z (1.1.58)
p + (q + r) = (p + q) + r, p, q, r ∈ Z (1.1.59)
0 · p = 0 = p · 0, p∈Z (1.1.60)
1 · p = p = p · 1, p∈Z (1.1.61)
p · q = q · p, p, q ∈ Z (1.1.62)
p · (q · r) = (p · q) · r, p, q, r ∈ Z (1.1.63)
p · (q + r) = p · q + p · r, p, q, r ∈ Z (1.1.64)
p · q = 0 ⇒ p = 0 ∨ q = 0, p, q ∈ Z (1.1.65)
(p 6= 0 & p · q = p · r) ⇒ q = r, p, q, r ∈ Z (1.1.66)
88 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ
сохраняет порядок
m6n ⇒ σ(m) 6 σ(n) (1.1.69)
нуль
σ(0) = 0 (1.1.70)
единицу
σ(1) = 1 (1.1.71)
сумму
σ(m + n) = σ(m) + σ(n) (1.1.72)
и умножение
σ(m · n) = σ(m) · σ(n) (1.1.73)
Теорема 1.1.8 позволяет отождествить N с подмножеством σ(N) множества Z, потому что с точки
зрения свойств операций +, · и отношения 6 между N и σ(N) разницы нет: все, что можно доказать
об этих операциях и об этом отношении в N, можно доказать о них и в σ(N), и наоборот.
Отождествление N и σ(N) естественно понимать просто как равенство
N
∋
В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них натуральное, а другое целое:
(1.1.77)
(p, q) ∼ (0, q ′ ) & (0, q ′ ) ∼ (p′′ , q ′′ ) ⇒ p · q ′ = 0 · q & 0 · q ′′ = p′′ · q ′ ⇒
|{z} | {z }
k k
0 0
(1.1.65) (1.1.77)
⇒ p = 0 & p′′ = 0 ⇒ p · q ′′ = 0 · q ′′ = 0 = 0 · q = p′′ · q ⇒ (p, q) ∼ (p′′ , q ′′ )
6=
0 0
0 + a = a = a + 0, a∈Q (1.1.82)
a + b = b + a, a, b ∈ Q (1.1.83)
a + (b + c) = (a + b) + c, a, b, c ∈ Q (1.1.84)
0 · a = 0 = a · 0, a∈Q (1.1.85)
1 · a = a = a · 1, a∈Q (1.1.86)
a · b = b · a, a, b ∈ Q (1.1.87)
a · (b · c) = (a · b) · c, a, b, c ∈ Q (1.1.88)
a · (b + c) = a · b + a · c, a, b, c ∈ Q (1.1.89)
a · b = 0 ⇒ a = 0 ∨ b = 0, a, b ∈ Q (1.1.90)
(a 6= 0 & a · b = a · c) ⇒ b = c, a, b, c ∈ Q (1.1.91)
a 6 a, a∈Q (1.1.92)
90 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ
(a 6 b & b 6 a) ⇒ a = b, a, b ∈ Q (1.1.93)
(a 6 b & b 6 c) ⇒ a 6 c, a, b, c ∈ Q (1.1.94)
∀a ∀b (a 6 b ∨ b 6 a), a, b ∈ Q (1.1.95)
(a < x & b < y) ⇒ a + x < b + y, a, b, x, y ∈ Q (1.1.96)
(0 6 a & 0 6 b) ⇒ 0 6 a · b, a, b ∈ Q (1.1.97)
(0 < a & 0 < b) ⇒ 0 < a · b, a, b ∈ Q (1.1.98)
(0 < a < x & 0 < b < y) ⇒ 0 < a · b < x · y, a, b, x, y ∈ Q (1.1.99)
(0 < a & x < y) ⇒ a · x < a · y, a, x, y ∈ Q (1.1.100)
0 < a < 1 ⇒ a−1 > 1, a∈Q (1.1.101)
a < b ⇒ ∃x a < x < b, a, b, x ∈ Q (1.1.102)
сохраняет порядок
m6n ⇒ τ (m) 6 τ (n) (1.1.105)
нуль
τ (0) = 0 (1.1.106)
единицу
τ (1) = 1 (1.1.107)
сумму
τ (m + n) = τ (m) + τ (n) (1.1.108)
и умножение
τ (m · n) = τ (m) · τ (n) (1.1.109)
Теорема 1.1.10 позволяет отождествить Z с подмножеством τ (Z) множества Q, потому что с
точки зрения свойств операций +, · и отношения 6 между Z и τ (Z) разницы нет: все, что можно
доказать об этих операциях и об этом отношении в Z, можно доказать о них и в τ (Z), и наоборот.
Отождествление Z и τ (Z) естественно понимать просто как равенство
Z
∋
В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них целое, а другое рациональное:
n + [(p, q)] = [(n, 1)] + [(p, q)] = [(nq + p, q)], n ∈ Z, [(p, q)] ∈ Q (1.1.111)
n · [(p, q)] = [(n, 1)] · [(p, q)] = [(np, q)], n ∈ Z, [(p, q)] ∈ Q. (1.1.112)
Теорема 1.1.11. Для любого x ∈ Q найдется число n ∈ Z такое что 0 < n и x < n.
A ∩ A′ = ∅, A ∪ A′ = Q (1.1.114)
§ 1. Явные конструкции числовых множеств 91
⋄ 1.1.12. Для всякого элемента a ∈ Q рассмот- ⋄ 1.1.13. Помимо сечений из примера 1.1.12 бы-
рим множества вают и другие. Например, можно рассмотреть
пару (A, A′ ), в которой
(a) = {x ∈ Q : x < a} (1.1.117)
A = {x ∈ Q : x < 0 ∨ x · x < 2}
и
(a)′ = {x ∈ Q : a 6 x} (1.1.118)
и
Тогда пара (A, A ), в которой A = (a), A′ = (a)′ ,
′
A′ = {x ∈ Q : 0 6 x & 2 6 x · x}
является является дедекиндовым сечением в Q.
Такое сечение назвывается сечением, порожден- и это будет дедекиндово сечение, не порожденное
ным элементом a ∈ Q. никаким элементом Q.
Из (1.1.114) следует, что в дедекиндовом сечении (A, A′ ) левый элемент, A полностью определяет
правый, A′ :
A′ = Q \ A.
Поэтому можно описывать дедекиндовы сечения свойствами левой компоненты:
Теорема 1.1.14. Множество A ⊆ Q тогда и только тогда является первой компонентой неко-
торого дедекиндова сечения, когда оно удовлетворяет следующим свойствам:
(i) A непусто и не совпадает с Q:
∅ 6= A 6= Q, (1.1.119)
(ii) A замкнуто относительно переходов влево:
∀x ∀a x6a∈A =⇒ x ∈ A, (1.1.120)
∀x ∈ A ∃a ∈ A x<a (1.1.121)
• С этого момента условимся под дедекиндовым сечением понимать его левую компоненту,
то есть произвольное множество A ⊆ Q, удовлетворяющее условиям (i)—(iii) теоремы
1.1.14.
Теорема 1.1.15. Если A – дедекиндово сечение, то справедливо утверждение, двойственное (1.1.120):
∀z ∀y z>y∈
/A =⇒ z∈
/ A, (1.1.122)
Доказательство. Предположим, что z > y ∈ / A, но z ∈ A. Тогда мы получим y < z ∈ A, и
по условию (1.1.120) это означает, что y ∈ A. Это противоречит исходному предположению, что
y∈/ A.
A 6= B & A <
/ B =⇒ B < A,
A 6= B & A <
/ B =⇒ A 6= B & ¬(A 6= B & A ⊆ B) =⇒ A 6= B & (A = B ∨ A ⊆
/ B) =⇒
=⇒ A⊆
/ B =⇒ A \ B 6= ∅ =⇒ ∃a ∈ A |a ∈
/ B}
{z
⇓ (1.1.115)
∀b ∈ B b < a
| {z }
⇓ (1.1.120)
∀b ∈ B b ∈ A
⇓
B⊆A
| {z }
⇓
B⊂A
Доказательство. Если A > (0), то (0) ⊆ A и (0) 6= A. Значит, найдется число x ∈ A \ (0). Условие
x∈/ (0) означает, что x > 0. Воспользуемся теперь условием (1.1.121) и подберем a ∈ A так, чтобы
x < a. Тогда мы получим 0 6 x < a ∈ A, и отсюда 0 < a ∈ A.
Лемма 1.1.18. Для всякого сечения A и любого числа q ∈ Q, q > 0, найдется такое число a ∈ A
и такое число r ∈ Q, r > 0, что
a∈ A & a+q−r ∈ /A (1.1.126)
xn = b + q · n.
∀n ∈ N∗ xn = b + q · n ∈ A. (1.1.127)
∀n ∈ N∗ xn = b + q · n 6 y.
То есть
y−b
∀n ∈ N∗ n6 .
q
Это противоречит теореме 1.1.11. Значит, наше предположение (1.1.127) неверно, и выполняется
обратное:
∃n ∈ N∗ xn = b + q · n ∈
/ A. (1.1.128)
Рассмотрим множество M = {n ∈ N∗ : b + q · n ∈
/ A} и пусть m – его минимальный элемент4 , то
есть
b+q·m−q ∈A & b+q·m∈ / A. (1.1.129)
Рассмотрим два случая.
4 Напомним, что минимальный элемент ординала был определен на с.50.
§ 1. Явные конструкции числовых множеств 93
a= b+q·m−q ∈ A & a + q − r = b + q · m − (b + q · m − x) = x ∈
/ A.
A + B = {a + b; a ∈ A, b ∈ B} (1.1.130)
A 6= ∅ & B 6= ∅ =⇒ ∃a ∈ A & ∃b ∈ B =⇒ ∃a + b ∈ A + B.
A 6= Q & B 6= Q =⇒ ∃x ∈ / A & ∃y ∈
/ B =⇒
=⇒ ∃x ∈ Q (∀a ∈ A a < x) & ∃y ∈ Q (∀b ∈ B b < y) =⇒
=⇒ ∃x, y ∈ Q ∀a ∈ A ∀b ∈ B a+b<x+y =⇒ A + B 6= Q.
A B
−A = {x ∈ Q : ∃y ∈ Q y > 0 & − x − y ∈
/ A} (1.1.131)
С другой стороны, из леммы 1.1.17 следует, что существует a ∈ A такой что a > 0. Воспользуемся
(1.1.102) м выберем x так, чтобы 0 < x1 < a. Тогда для всякого y > 0 мы получим
1 1
−y <a∈A =⇒ −y ∈A =⇒ / A−1
x∈ =⇒ A−1 6= ∅.
x x
2. Пусть x < b ∈ A−1 . Если x 6 0, то по формуле (1.1.137) мы сразу получаем, что x ∈ A−1 .
Поэтому для нас важен случай x > 0. Тогда возникает система импликаций
3. Пусть x ∈ A−1 . Снова рассмотрим два случая. Если x 6 0, то, по лемме 1.1.22, A−1 > 0,
поэтому по лемме 1.1.17 существует c ∈ A−1 такой что c > 0, и мы получаем x 6 0 < c ∈ A−1 . Если
же x > 0, то условие x ∈ A−1 означает, что существует y > 0 такой что x−1 − y ∈/ A. Это число y
можно при необходимости уменьшить, чтобы 0 < y < x−1 . Зафиксируем такой y и выберем a так,
чтобы
y
a−1 = x−1 − .
2
Тогда
y (1.1.122)
a−1 − = x−1 − y ∈ /A =⇒ a ∈ A−1 .
2
С другой стороны,
y
a−1 = x−1 − =⇒ a−1 < x−1
2
и
y y
0 < y < x−1 =⇒ a−1 = x−1 − > > 0 =⇒ a−1 > 0
2 2
и поэтому
0 < a−1 < x−1 =⇒ 0 < x < a.
A + B = (1.1.130) = {a + b; a ∈ A, b ∈ B} = {b + a; a ∈ A, b ∈ B} = (1.1.130) = B + A.
2. Тождество (1.1.139):
(A + B) + C = {a + b; a ∈ A, b ∈ B} + C = {(a + b) + c; a ∈ A, b ∈ B, c ∈ C} =
= {a + (b + c); a ∈ A, b ∈ B, c ∈ C} = A + {b + c; b ∈ B, c ∈ C} = A + (B + C).
3. Тождество (1.1.140):
4. Тождество (1.1.141) доказывается так. Пусть сначала z ∈ A + (−A). Это значит, что z = a + x
для некоторых a ∈ A и x ∈ −A. Второе означает, что −x − y ∈ / A для некоторого y > 0. Поскольку
a ∈ A и −x − y ∈
/ A, мы получаем цепочку
Это доказывает включение A + (−A) ⊆ (0). Наоборот, пусть z ∈ (0), то есть z < 0. Воспользуемся
леммой 1.1.18 и выберем a ∈ A так, чтобы для некоторого r > 0 выполнялось
a−z−r ∈
/ A.
−x − r = a − z − r ∈
/A =⇒ x ∈ −A,
и, во-вторых,
z = a + x ∈ A + (−A).
Это доказывает включение (0) ⊆ A + (−A).
5. Тождество (1.1.143). Сначала система импликаций
– доказывает включение
(−A) + (−B) ⊆ −(A + B).
А затем обратное включение
−(A + B) ⊆ (−A) + (−B) (1.1.156)
– доказывается следующими рассуждениями. Пусть z ∈ −(A + B), то есть
−z − r ∈
/ A+B (1.1.157)
§ 1. Явные конструкции числовых множеств 97
x ∈ −A.
Обозначим
y = −z − x.
Условие (1.1.157) можно переписать так:
∀a ∈ A ∀b ∈ B a + b < −z − r.
(1.1.145) (1.1.146)
A < (0) < B =⇒ −A > (0) & B > (0) =⇒
(1.1.144)
=⇒ (−A) · B > (0) =⇒ A · B = (1.1.133) = −((−A) · B) < (0)
(1.1.123) (1.1.146)
A6B =⇒ A⊆B =⇒
=⇒ A + C = {a + c; a ∈ A, c ∈ C} ⊆ {b + c; b ∈ B, c ∈ C} = B + C
13. Для доказательства (1.1.150) нужно рассмотреть несколько случаев. Если A > (0) и B > (0),
то
(−A) ·B = (1.1.133) = −((−(−A)) · B) = (1.1.142) = −(A · B).
| {z }
>
(1.1.144)
0
98 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ
>
0
<
(1.1.145)
0
15. Тем же приемом доказывается тождество (1.1.152). Если A > (0), B > (0) и C > (0), то
Остальные варианты рассматриваются так же как при доказательстве (1.1.151). Например, для
A < (0) < B и C > (0) получаем:
<
0 0
>
(1.1.144),(1.1.146)
0
0
<
<
(1.1.146)
0 0
16. Тождество (1.1.153). Пусть сначала A > (0). Тогда, прежде всего,
(1.1.100) (1.1.102)
x∈A =⇒ ∃a ∈ A a > 0 & x < a =⇒ ∃a ∈ A a > 0 & x · a−1 < a · a−1 = 1 =⇒
(1.1.102)
=⇒ ∃a ∈ A ∃b a>0& x a−1} < b < 1
| ·{z =⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x·a−1 < b =⇒
<
0
А если A = (0), то
A · (1) = (0) · (1) = (1.1.133) = (0) = A.
17. Тождество (1.1.154). Пусть сначала A > (0). Тогда по лемме 1.1.22, A−1 > (0), и мы, прежде
всего, получаем цепочку
(1.1.137)
x ∈ A · A−1 =⇒ ∃a ∈ A ∃b ∈ A−1 a > 0 & b > 0 & x < a · b =⇒
=⇒ ∃a > 0 ∃b > 0 ∃y > 0 a ∈ A & b−1 − y ∈
/ A & x<a·b =⇒ x<1 =⇒ x ∈ (1),
| {z }
⇓
a < b−1 − y
⇓
a · b < (b−1 − y) · b = 1 − y · b < 1
| {z }
⇓
x<a·b<1
доказывающую включение
A · A−1 ⊆ (1).
Чтобы доказать обратное включение,
(1) ⊆ A · A−1 , (1.1.159)
зафиксируем x ∈ (1), то есть x < 1. Если x 6 0, то мы сразу можем выбрать a ∈ A, a > 0, и b ∈ A−1 ,
b > 0, для которых получится
x 60 <a·b =⇒ x ∈ x ∈ A · A−1 .
Поэтому важнен немного более сложный случай 0 < x < 1. Для него по формуле (1.1.101), x−1 > 1,
поэтому положив p = 1 − x−1 , мы получим
a∈ A & a+a·p−r ∈
/A
c−1 − r = a · x−1 − r = a · (1 + p) − r = a + a · p − r ∈
/A =⇒ c ∈ A−1 .
Это доказывает включение (1.1.159), и вместе с ним, формулу (1.1.154) для случая A > (0). Случай
A < (0) будет его следствием:
18. В тождестве (1.1.155) сначала мы предполагаем, что A + B > (0) и C > (0). Тогда
x ∈ (A + B) · C ⇐⇒ ∃y ∈ A + B ∃c ∈ C x6y·c ⇐⇒
⇐⇒ ∃a ∈ A ∃b ∈ B ∃c ∈ C x 6 (a + b) · c = |{z} b·c ∈ A·C +B·C
a · c + |{z} ⇐⇒
∋
A·C B·C
⇐⇒ x∈ A·C +B·C
После этого рассматриваются остальные случаи. Например, при A + B < (0) и C > (0) мы получаем
Случаи A + B > (0) & C < (0) и A + B < (0) & C < (0) рассматриваются так же. Случай C = (0)
тоже очевиден. Остается случай A + B = (0), то есть B = (−A). Для него мы получаем
∀A ∈ X ∀B ∈ Y A 6 B. (1.1.161)
∀A ∈ X ∀B ∈ Y A 6 C 6 B. (1.1.162)
Доказательство. Положим [
C = ∪X = A.
A∈X
1. Проверим сначала, что C — сечение. Прежде всего, поскольку множество X непусто, найдется
A ∈ X, и поскольку A – сечение, это множество тоже должно быть непусто. Мы получаем, что
∅ 6= A ⊆ C =⇒ C 6= ∅.
С другой стороны, поскольку Y непусто, найдется B ∈ Y , и для него будет справедливо неравенство
A 6 B, при любом A ∈ X. Это означает, что все элементы A ∈ X содержатся в B, и мы получаем
цепочку5 [
∀A ∈ X A ⊆ B =⇒ C = A ⊆ B ⊂ Q =⇒ C 6= Q.
A∈X
2. После этого остается убедиться, что справедливо условие (1.1.162). Первое неравенство в нем,
∀A ∈ X A 6 C,
эквивалентно включению
∀A ∈ X A ⊆ C,
5 Напомним, что отношение M ⊂ N было определено на с.30 и означает, что M ⊆ N и M 6= N .
§ 1. Явные конструкции числовых множеств 101
S
справедливому, потому что C = A∈X A. А второе неравенство
∀B ∈ Y C 6 B,
эквивалентно включению
∀B ∈ Y C ⊆ B,
(в котором (a) есть левая компонента дедекиндова сечения, которую мы в соответствии с согла-
шением на с.91, отождествляем со всем дедекиндовым сечением ((a), (a)′ )) переводит множество
рациональных чисел Q в множество вещественных чисел R.
сохраняет порядок
a6b ⇒ υ(a) 6 υ(b) (1.1.165)
нуль
υ(0) = 0 (1.1.166)
единицу
υ(1) = 1 (1.1.167)
сумму
υ(a + b) = υ(a) + υ(b) (1.1.168)
и умножение
υ(a · b) = υ(a) · υ(b) (1.1.169)
a = (a) , a ∈ Q. (1.1.170)
|{z}
∋
Q
∋
В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них рационально, а другое вещественно:
a + B = (a) + B, a ∈ Q, B ∈ R (1.1.171)
a · B = (a) · B, a ∈ Q, B ∈ R. (1.1.172)
102 Глава 1. ЧИСЛА, КАК ЯВНАЯ КОНСТРУКЦИЯ
C = R × R. (1.1.173)
Для комплексного числа (x, y) ∈ C его первая компонента, то есть вещественное число x, называ-
ется вещесвенной частью, а вторая компонента, то есть вещественное число y, называется мнимой
частью (при этом оба числа x и y по-прежнему вещественные).
Алгебраические операции в C.
• Суммой комплексных чисел (x, y) и (x′ , y ′ ) называется комплексное число
(a + b) · c = a · c + b · c (1.1.180)
a + 0 = a. (1.1.181)
a · 1 = a. (1.1.185)
a · a−1 = 1. (1.1.187)
сохраняет нуль
υ(0) = 0 (1.1.191)
единицу
υ(1) = 1 (1.1.192)
сумму
υ(s + t) = υ(s) + υ(t) (1.1.193)
и умножение
υ(s · t) = υ(s) · υ(t) (1.1.194)
R
∋
В частности, оно позволяет придать точный смысл операциям сложения и умножения чисел в
случае, когда одно из них вещественно, а другое комплексно:
i2 = −1. (1.1.199)
(x, y) = x · 1 + y · i, x, y ∈ R. (1.1.201)
i2 = i·i = (0, 1)·(0, 1) = (1.1.175) = (0·0−1·1, 0·1+1·0) = (−1, 0) = (1.1.184) = −(1, 0) = (1.1.186) = −1.
(x, y) = x + y · i, (x′ , y ′ ) = x′ + y ′ · i
(x, y)+(x′ , y ′ ) = (x+y·i)+(x′ +y ′ ·i) = x+(y·i+(x′ +y ′ ·i)) = x+((y·i+x′ )+y ′ ·i) = x+((x′ +y·i)+y ′ ·i) =
= x + (x′ + (y · i + y ′ · i)) = (x + x′ ) + (y · i + y ′ · i) = (x + x′ ) + (y + y ′ ) · i = (1.1.202) = (x + x′ , y + y ′ ).
МАТЕМАТИЧЕСКАЯ ЛОГИКА
Глядя на шаги, по которым в главе 0 строилась теория множеств, нетрудно представить, как из-
менение каких-то элементов этой конструкции приводит к построению других подобных теорий.
Например, можно менять аксиомы самой теории (если варьировать аксиомы MK-1 – MK-14, оставив
все остальные элементы неизменными, то будут получаться различные варианты теории множеств,
каковых много в математике). Точно так же можно менять язык теории (алфавит и сигнатуру), и
даже аксиомы логики и правила вывода (LK-0) – (LK-15)1 . При этом будут получаться конструк-
ции, называемые формальными теориями (или формальными системами, или теориями первого
порядка, и, понятно, что они могут сильно отличаться друг от друга).
Изучением таких теорий, построенных по примеру уже описанной нами теории множеств, зани-
мается наука, называемая математической логикой. В этой главе мы опишем основные ее выво-
ды, увиденные глазами сторонника гильбертовской философии формализма (в том смысле как мы
описали это на с.v). Выбранная нами в Предисловии цель избавления от замкнутых кругов в опре-
делениях (вместе с выбором исчисления секвенций LK в качестве аксиоматической системы логики)
ведет к картине, детали которой, как может заметить читатель, отличаются от традиционных. В
частности, под семантикой формальной теории T мы понимаем всевозможные представления этой
теории в виде дефинициальных расширений рабочей теории множеств (см. ниже результаты § 3).
Мы постараемся дать замкнутое изложение этой темы, однако часть утверждений — в нашем
тексте это главные технические результаты Геделя об арифметизации формальных теорий (ниже
это теоремы 2.2.11 и 2.2.12) — приходится все-таки (по традиции) формулировать без доказательств,
в силу их громоздкости.
Понятия и результаты этой главы будут полезны в главе 5 о стандартных функциях при объяс-
нении трудностей построения Исчисления (Calculus, см. с.351).
§1 Формальные теории
(a) Определение формальной теории
Формальная теория T над логикой предикатов состоит из языка теории, ее системы аксиом и
логического исчисления. Эти компоненты удобно описать одно за другим, обсуждая попутно кон-
струкции, которые понадобятся в самих этих описаниях и в дальнейшем при доказательстве утвер-
ждений. Язык формальной теории мы описываем на с.106, систему аксиом на с.111, а логическое
исчисление на с.111.
! 2.1.1. Мы предупредим только читателя с са- ной стороны, все реально используемые матема-
мого начала, что наше определение формальной тиками формальные теории, такие как рабочие
теории будет отличаться от общепринятого теории множеств ZF, NBG, MK, или арифметика
тем, что в нем мы под системой аксиом по- Пеано PA, содержатся в этом классе, а с другой —
нимаем конечный список аксиом или конечный все теории из этого класса рекурсивно аксиома-
список схем аксиом. Это делается для того, что- тизируемы, что позволяет избавиться от необхо-
бы упростить формулировки без существенного димости обсуждать этот нюанс в формулировках
сужения класса рассматриваемых теорий: с од- утверждений.
1 В качестве примера читатель может поглядеть на правила интуиционистской логики, которые мы приводим на
с.180.
105
106 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Язык формальной теории. Язык формальной теории (над логикой предикатов) представляет
из себя алфавит, сигнатуру и правила построения формул.
a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,
является переменной,
— если x – переменная, то добавляя к ней штрих ′ мы получаем новую переменную:
x′ , x′′ , ...
3. Далее вводится понятие терма, под которым понимается фрагмент формулы, составленный
посредством функциональных символов, без предикатных. Точное определение выглядит так:
термом называется произвольная строка символов, построенная по следующим правилам
— всякая переменная является термом,
— всякая константа (функциональный символ валентности 0) является термом,
— если τ1 , ..., τn – термы, и F – функциональный символ валентности n, то строка
– также терм. В частном случае, когда валентность F равна 2, принято для краткости вместо
(2.1.1) писать
τ1 F τ2
(как это делается в теории групп с символом умножения ·, см. ниже пример 2.1.17).
4. После этого формулой данного языка объявляется произвольная строка символов, построенная
по следующим правилам:
— если τ1 , ..., τn – термы, и P – предикатный символ валентности n, то строка
— формула. В частном случае, когда валентность P равна 2, принято для краткости вместо
(2.1.2) писать
τ1 P τ2
(как это делается в теории множеств с символом принадлежности ∈, см. (0.2.23));
— если строка ϕ – формула, то строка ¬ (ϕ) – тоже формула;
— если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:
α = β, (2.1.4)
Переименования и подстановки.
• Говорят, что формула ψ получена из кванторной формулы ϕ = (∀x α) или ϕ = (∃x α)
глобальным переименованием связанной переменной x, если ψ получена из ϕ заменой
всех вхождений переменной x (и свободных, и связанных)2 на какую-нибудь новую пе-
ременную y, не входящую в ϕ (ни свободно, ни связанно)3 . Это оформляется записью
ψ = ϕ . (2.1.5)
x=y
ϕ∼
= ψ,
Очевидны следующие
Свойства подстановки:
§ 1. Формальные теории 109
Теорема 2.1.9. Всякую подстановку ϕ можно сделать корректной, если сначала переимено-
x=τ
вать связанные переменные в формуле ϕ.
• Групповой подстановкой термов τ1 , ..., τn вместо переменных x1 , ..., xn в формулу ϕ назы-
вается формула, получающаяся из ϕ одновременной заменой всех свободных вхождений
каждой переменной xk в формуле ϕ на терм τk . Мы обозначаем такую формулу символом
ϕ (2.1.14)
x1 =τ1 ,...,xn =τn
⋄ 2.1.10 (важность введения новых перемен- Эту групповую подстановку можно представить
ных). Следующий пример показывает, что груп- как композицию однократных:
повую подстановку нельзя понимать как компо-
зицию “однократных” подстановок без введения
∃y (x ∈ y & y ∈ z) =
новых переменных. Рассмотрим формулу в язы- x=p1 z=p2 p1 =y p2 =x
ке теории множеств
= ∃y (p1 ∈ y & y ∈ p2 ) =
p1 =y p2 =z
x ∈ y. (2.1.16)
= ∃y (y ∈ y & y ∈ x) .
Групповая подстановка x = y, y = z дает фор-
мулу Здесь видно, что при замене p1 = y переменная y
попадает в область действия квантора ∃ по этой
(x ∈ y) = (y ∈ z). (2.1.17) переменной, поэтому такая групповая подстанов-
x=y,y=z
ка будет некорректна.
Однако последовательная подстановка сначала
x = y, а потом y = z дает формулу ⋄ 2.1.12 (корректная групповая подстановка).
Рассмотрим ту же кванторную формулу, что и
(x ∈ y) = (y ∈ y) = (z ∈ z). (2.1.18) в предыдущем примере
x=y y=z y=z
α, β, γ, δ, ι, κ, λ, µ, ν, ξ, σ, τ, υ, ϕ, χ, ψ, ω,
возможно со штрихами:
α′ , β ′ , ..., α′′ , β ′′ , ...
и т.д. Элементы этого алфавита мы будем называть метапеременными теории T . Далее, форму-
лы метаязыка теории T , или метаформулы теории T , определяются по следующим индуктивным
правилам:
§ 1. Формальные теории 111
⋄ 2.1.13. Руководящим примером для нас будет смысл которой — существование пустого класса
аксиома выделения MK-7 на с.28: ∅.
∃Y ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & ϕ) (2.1.21) Как контрпример, можно рассмотреть фор-
мулу (0.3.107), обсуждавшуюся в замечании
Она представляет собой схему формул теории 0.3.5:
MK, у которой на метапеременную ϕ наклады-
вается выписанное в этой теории ограничение: ϕ X∈ / Y. (2.1.22)
не должна содержать Y как свободную перемен-
ную. Здесь Y является свободной переменной, и поэто-
Как пример, вместо ϕ можно подставить фор- му эту формулу нельзя подставлять в качестве ϕ
мулу X = X, и мы получим аксиому теории MK: в схему формул (2.1.21). Мы говорили в замеча-
∃Y ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & X = X), нии 0.3.5, что если бы не было этого ограничения
на Y , и формулу (2.1.22) все-таки можно было
означающую существование класса Set всех мно-
бы подставлять в схему (2.1.21), это сразу при-
жеств. Другой пример: подстановка вместо ϕ вело бы к противоречиям в теории MK. Этот при-
формулы X 6= X дает аксиому
мер показывает, почему в схемах формул важны
∃Y ∀X (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & X 6= X) ограничения на переменные.
• Под системой аксиом формальной теории мы будем понимать4 конечный набор формул
и/или конечный набор схем формул этой теории. Всякая формула в этом списке называ-
ется аксиомой теории T , а всякая схема формул в этом списке называется схемой аксиом
теории T .
a. Структурные правила:
— ослабление:
Γ ⊢∆ Γ ⊢∆
(LK-1*)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
(LK-2*)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
Γ, ϕ, χ, Π ⊢ ∆ Γ ⊢ ∆, ϕ, χ, Λ
(LK-3*)
Γ, χ, ϕ, Π ⊢ ∆ Γ ⊢ ∆, χ, ϕ, Λ
— сечение:
Γ ⊢ ∆, ϕ ϕ, Π ⊢ Λ
(LK-4*)
Γ, Π ⊢ ∆, Λ
b. Правила введения логических связок:
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
(LK-5*)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— конъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
(LK-6*)
Γ ⊢ ∆, ϕ&χ
— конъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
(LK-7*)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
(LK-8*)
ϕ ∨ χ, Γ ⊢ ∆
— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
(LK-9*)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
(LK-10*)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
(LK-11*)
Γ ⊢ ∆, ϕ ⇒ χ
— добавление квантора всеобщности в антецедент: если подстановка ϕx=τ кор-
ректна5 (здесь x — переменная, а τ – терм), то
ϕx=τ , Γ ⊢ ∆
(LK-12*)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y не входит
(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул Γ ,
∆, ∀x ϕ), то
Γ ⊢ ∆, ϕx=y
(LK-13*)
Γ ⊢ ∆, ∀x ϕ
5 Определение корректной подстановки дано на с. 9.
§ 1. Формальные теории 113
x=x (2.1.24)
x=y ⇒ y=x (2.1.25)
(x = y & y = z) ⇒ x=z (2.1.26)
b. Для любого предикатного символа P валентности n и для любых двух строк переменных
x1 , ..., xn и y1 , ..., yn длины n задается аксиома8
(x1 = y1 & ... & xn = yn ) & P (x1 , ..., xn ) ⇒ P (y1 , ..., yn ). (2.1.28)
6 См. определение на с. 9.
7В (2.1.27) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.60.
8 В (2.1.28) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.60.
114 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Вот первые несколько примеров, которые по- ной теории выводима секвенция (0.2.46):
надобятся нам в дальнейшем.
∀x α ⊢ α (2.1.42)
там функциональных символов нет: если подста- а вторая получается из первой применением пра-
новка x = τ в формулу α корректна, то выводи- вил (LK-5*) и (LK-3*):
мы секвенции
∀x α ⊢ αx=τ
∀x α ⊢ α x=τ (2.1.43) (LK-5*)
¬α , ∀x α ⊢
и x=τ
¬αx=τ ⊢ ¬∀x α (2.1.44) (LK-3*)
∀x α, ¬αx=τ ⊢
Первая из них имеет такой вывод:
(LK-5*)
α
x=τ
⊢ αx=τ
¬α ⊢ ¬∀x α
x=τ
(LK-12*)
∀x α ⊢ αx=τ
Связь между выводимостью секвенций. Часто бывает, что из выводимости одних секвенций
следует выводимость других.
ϕ⊢χ
и
α ∨ ϕ ⊢ α ∨ χ. (2.1.46)
α⊢α ϕ⊢χ
(LK-7*) (LK-7*)
α&ϕ⊢α α&ϕ⊢χ
(LK-6*)
α&ϕ⊢α&χ
В нем левая вершина — аксиома, и если вдобавок правая выводима, то ее вывод можно подклеить
к ней сверху, и мы получим вывод для корня, то есть для секвенции (2.1.45).
2. Рассмотрим дерево Генцена
α⊢α ϕ⊢χ
(LK-9*) (LK-9*)
α⊢α∨ϕ ϕ⊢ α∨χ
(LK-8*)
α∨ϕ ⊢ α∨χ
В нем левая вершина — аксиома, и если вдобавок правая выводима, то ее вывод можно подклеить
к ней сверху, и мы получим вывод для корня, то есть для секвенции (2.1.46).
α, β ⊢ γ (2.1.47)
и
ϕ, χ ⊢ ψ, (2.1.48)
то выводима и секвенция
α & ϕ, β & χ ⊢ γ & ψ (2.1.49)
116 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Если в нем выводимы вершины, то есть секвенции (2.1.47) и (2.1.48), то их выводы нужно поделеить
сверху к этим вершинам, и мы получим вывод для секвенции (2.1.49).
α, Γ ⊢ ∆, β
(LK-11*)
Γ ⊢ ∆, α ⇒ β.
Это дерево Генцена надо понимать так, что если у его вершины — секвенции α, Γ ⊢ ∆, β — есть
вывод, то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом
для секвенции Γ ⊢ ∆, α ⇒ β.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.38):
α, α ⇒ β ⊢ β
(LK-3*)
Γ ⊢ ∆, α ⇒ β α ⇒ β, α ⊢ β
(LK-4*)
Γ, α ⊢ ∆, β
(LK-3*)
α, Γ ⊢ ∆, β
Опять это дерево надо понимать так, что если у его левой вершины — секвенции Γ ⊢ ∆, α ⇒ β —
есть вывод, то его можно пристроить к этой вершине сверху, затем к правой вершине — секвенции
α, α ⇒ β ⊢ β — нужно будет пристроить ее вывод, который мы получили на с.13, и мы в результате
получим дерево, являющееся выводом для секвенции α, Γ ⊢ ∆, β.
Теорема 2.1.24 (о транзитивности). Если выводимы секвенции Γ ⊢ α и α ⊢ ∆, то выводима и
секвенция Γ ⊢ ∆.
! 2.1.25. Если формулу α заменить здесь каким-нибудь набором (из более чем одной формулы)
Θ, то это утверждение утрачивает силу: из выводимости секвенций Γ ⊢ Θ и Θ ⊢ ∆ не следует
выводимость секвенции Γ ⊢ ∆.
Доказательство. Это частный случай правила сечения (LK-4*):
Γ ⊢α α⊢∆
(LK-4*)
Γ ⊢∆
Теорема 2.1.26. Если выводима секвенция α ⊢ β, то для любой формулы γ выводима секвенция
β ⇒ γ ⊢ α ⇒ γ.
Доказательство. Пусть выводима секвенция α ⊢ β. Тогда по теореме 2.1.23 выводима секвенция
⊢ α ⇒ β.
α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ).
⊢ (β ⇒ γ) ⇒ (α ⇒ γ).
β ⇒ γ ⊢ α ⇒ γ.
∀x α ∼ ∀x β, ∃x α ∼ ∃x β. (2.1.52)
3◦ Если α1 ∼ β1 и α2 ∼ β2 , то
Теорема 2.1.28. Если формулы α и β конгруэнтны (то есть одна получена из другой переимено-
ванием связанных переменных11), то α и β эквивалентны:
α∼
=β =⇒ α ∼ β.
⋄ 2.1.29. Справедливы следующие эквивалент- Теорема 2.1.30. Все логические формулы выра-
ности формул: жаются эквивалентностями через операции ¬,
¬(α & β) ∼ (¬α) ∨ (¬β), (2.1.54) ⇒ и квантор ∀. В частности,
¬(α ∨ β) ∼ (¬α) & (¬β), (2.1.55)
¬(α ⇒ β) ∼ α & ¬β, (2.1.56) α & β ∼ ¬(α ⇒ ¬β), (2.1.59)
¬(∀x α) ∼ ∃x ¬α, (2.1.57) α ∨ β ∼ (¬α) ⇒ β, (2.1.60)
¬(∃x α) ∼ ∀x ¬α. (2.1.58) ∃x α ∼ ¬(∀x ¬α). (2.1.61)
αi ⇒ αi+1
10 Эти свойства не распространяются на отношение следствия между формулами. Например, если β следует из α,
то из этого нельзя заключить, что ¬β следует из ¬α. Все же применение логических операций & и ∨ и кванторов ∀
и ∃ сохраняет отношение следствия.
11 Процедура переименования связанных переменных была определена на с.??.
§ 1. Формальные теории 119
αi ⊢ αj ,
(с произвольными индексами i < j). С помощью цепочек импликаций обычно доказываются отно-
шения следования между формулами: для вывода формулы
α1 ⇒ αn ,
α1 ⇔ α2 ⇔ α3 ⇔ ... ⇔ αn (2.1.63)
в которой любые две соседние αi и αi+1 связаны знаком эквивалентности, который следует понимать
как эквивалентность αi и αi+1 в смысле определения на с.117, то есть выводимость формул
αi ⇒ αi+1 , αi+1 ⇒ αi
αi ⊢ αi+1 , αi+1 ⊢ αi
αi ⊢ αj , αj ⊢ αi
α1 ⇔ αn ,
• В другом частном случае, если Σ совсем не содержит формул, говорят, что формула ω выводится
в теории T , а дерево (2.1.64), принимающее вид
α⊢α ⊢β
... ...
, (2.1.66)
⊢ω
где α — произвольная формула теории T , а β — произвольная аксиома теории T , называется
выводом формулы ω в теории T . В этом случае говорят также, что формула ω выводима в
теории T (или является теоремой теории T );
• Формула ω называется опровержимой в теории T , если ее отрицание, ¬ω, выводимо в теории
T.
T
! 2.1.31. Из примера 2.4.7 видно, что отношение взаименой выводимости ≈ из (2.1.66), не эквива-
T
лентно отношению эквивалентности ∼ из (2.1.50).
Пусть T – формальная теория и σ – формула в ней. Условимся символом T + σ обозначать
формальную теорию, полученную из T присоединением формулы σ к списку аксиом. Следующее
утверждение очевидно:
Теорема 2.1.32. Для формул ω и σ в теории T следующие условия эквивалентны:
(a) ω выводится из σ в T ,
(b) ω выводится в T + σ.
По аналогии с теоремой о дедукции для LK 0.2.44 доказывается
Теорема 2.1.33 (о дедукции для произвольной теории T ). Пусть ω – формула и Σ — конечный
набор формул в формальной теории T . Рассмотрим два условия:
(a) ω следует из Σ в T ,
(b) ω выводится из Σ в T .
Тогда:
(i) условие (a) влечет условие (b),
(ii) если формулы Σ замкнуты, то условие (b) влечет условие (a) (то есть в этом случае
(a) и (b) равносильны).
Замыкание всеобщности.
• Пусть α — формула формальной теории T , и пусть x1 , ..., xn — ее свободные переменные.
Тогда замыканием всеобщности α формулы α называется формула
(такая подстановка будет корректна, потому что переменные из τ1 , ..., τn не будут содер-
жаться в α′ как связанные переменные). Понятно, что формула ϕ b определяется неодно-
значно, а с точностью до переименования связанных переменных.
2. Пусть R получено из T присоединением функционального символа F , определенного фор-
b для атомарных формул ϕ:
мулой β по правилу (2.1.68). Построим сначала перевод ϕ
— b совпадает с ϕ,
если ϕ не содержит символа F , то мы считаем, что ϕ
— предположим, что мы построили формулы ϕ b для всех атомарных формул ϕ, в
которых символ F встречается k раз,
— пусть далее ϕ – атомарная формула, в которой символ F встречается k + 1 раз;
подберем формулу β ′ , отличающуюся от β в (2.1.68) переименованием связан-
ных переменных, так, чтобы связанные переменные в формуле β ′ не входили
в ϕ (ни свободно, ни связанно); среди всех вхождений символа F в ϕ рассмот-
рим такие, которые внутри себя уже не сожержат F (то есть входящие в терм
F (τ1 , ..., τn ), в котором “подтермы” τ1 , ..., τn не содержат символа F ); эти вхож-
дения F линейно упорядочены как элементы записи формулы ϕ; выберем среди
них самое первое вхождение, и заменим соответствующий терм F (τ1 , ..., τn ) на
какую-нибудь букву y, не входящую в ϕ ни свободно, ни связанно; обозначим
соответствующую формулу буквой χ, тогда ϕ будет результатом подстановки
ϕ = χ
y=F (τ1 ,...,τn )
После того, как перевод ϕb построен для всех атомарных формул ϕ, мы, рассматривая
произвольную формулу ψ, заменяем в ней всякую атомарную подформулу ϕ на ее пере-
b В общем случае, когда присоединено несколько символов, мы занумеровываем их,
вод ϕ.
и, двигаясь от последнего к первому, устраиваем переводы формулы ϕ последовательно
устраняя в них один за другим присоединенные символы, пока не дойдем до ситуации,
когда присоединенных символов совсем не останется.
§ 1. Формальные теории 123
\
ϕ ⊢ ∃x ϕ
b (2.1.82)
x=τ
16 Равенство формул было определено на с.107.
124 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
\ \
ϕ ⊢ϕ
x=y x=y
(LK-1*)
\ \
y\
= τ, ϕ ⊢ϕ
bx=y ⊢ ϕ
ϕ bx=y x=y x=y
(LK-11*)
(LK-12*)
\ \
∀x ϕ bx=y
b⊢ϕ ϕ ⊢ y\
=τ ⇒ ϕ
x=y x=y
(LK-13*) (LK-12*)
∀x ϕ bx=y
b ⊢ ∀y ϕ \
∀y ϕ ⊢ y\ \
=τ ⇒ ϕ
x=y x=y
(2.1.78) (LK-13*)
∀x ϕ \
b ⊢ ∀y ϕ \ \
x=y ∀y ϕ x=y
⊢ ∀y \
y = τ ⇒ ϕ x=y
(LK-4*)
b ⊢ ∀y y\
∀x ϕ \
=τ ⇒ ϕ
x=y
(2.1.80)
\
∀x ϕ
b⊢ϕ
x=τ
\ \
ϕ ⊢ϕ
x=y x=y
bx=y ⊢ ϕ
ϕ bx=y
(LK-7*)
\ \ (LK-15*)
y\
=τ &ϕ ⊢ϕ
x=y x=y bx=y ⊢ ∃x ϕ
ϕ b
(LK-15*)
\ \ (LK-14*)
y\
=τ &ϕ ⊢ ∃y ϕ bx=y ⊢ ∃x ϕ
∃y ϕ b
x=y x=y
(LK-14*) (2.1.78)
∃y y\ \
=τ &ϕ \
⊢ ∃y ϕ \
x=y x=y ∃y ϕ x=y
⊢ ∃x ϕ
b
(LK-4*)
∃y y\ \
=τ &ϕ ⊢ ∃x ϕ
b
x=y
(2.1.80)
\
ϕ ⊢ ∃x ϕ
b
x=τ
⋄ 2.1.45. Напомним, что отношение включе- ∀A (A ∈ X ⇒ A ∈ Y )
ния ⊆ было определено в теории MK формулой
(0.3.114) & ∀A (A ∈ Y ⇒ A ∈ X)
X ⊆Y ⇔ ∀A (A ∈ X ⇒ A ∈ Y ). ⇒ X = Y.
⊢ϕ b⊢ϕ
b ϕ
(LK-4*)
⊢ϕ
у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
α ⊢ α), либо секвенции вида ⊢ γ, где γ — аксиомы теории T или теории R.
Преобразуем каждую формулу ψ в этом дереве в формулу ψb теории T (по правилам, описанным
на с.123). Мы получим некую картинку с секвенциями теории T :
α⊢
b αb ⊢b
γ
b ⊢∆
Γ c b ⊢∆
Γ c
3 3 4 4
b ⊢∆
Γ c b ⊢∆
Γ c
1 1 2 2
... ...
(2.1.84)
⊢ϕ
b
В вершинах этой картинки стоят либо секвенции вида α b⊢αb, то есть аксиомы исчисления преди-
катов LK, либо секвенции вида ⊢ γ
b, где γ — аксиомы теории T , либо секвенции вида ⊢ bγ , где γ —
аксиома теории R, то есть определение в T . Но всякое определение имеет вид (2.1.67)
η(x1 , ..., xn ) ⇐⇒ α,
α ⊢ α.
17 Формула ϕ имеет следующий вывод в MK+ ⊆:
⊢ (∀A A ∈ X ⇔ A ∈ Y )
⇒ X = Y (0.3.98)
теорема 0.2.40
∀A (A ∈ X ⇔ A ∈ Y )
⊢ X ⊆ Y ⇒ (∀A α) (0.3.114) ⊢ Y ⊆ X ⇒ (∀A β) (0.3.114) ⊢X =Y
теорема 0.2.40 теорема 0.2.40 (∀A α) & (∀A β) ⊢ (0.2.25)
X ⊆ Y ⊢ ∀A α Y ⊆ X ⊢ ∀A β ∀A (α & β) (0.2.57) ∀A (α & β) ⊢ X = Y
пример 0.2.27 (LK-4*)
X ⊆ Y & Y ⊆ X ⊢ (∀A α) & (∀A β) (∀A α) & (∀A β) ⊢ X = Y
(LK-4*)
X ⊆Y &Y ⊆X ⊢X =Y
(LK-11*)
⊢ X⊆Y &Y ⊆X ⇒ X=Y
где α — формула A ∈ X ⇒ A ∈ Y , а β — формула A ∈ Y ⇒ A ∈ X.
126 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Γbp ⊢ ∆
bp
(2.1.85)
Γbq ⊢ ∆
bq
Γp ⊢ ∆p
, (2.1.86)
Γq ⊢ ∆q
который в свою очередь получен применением какого-то из правил вывода (LK-1*) — (LK-15*).
Нужно перебрать все правила от (LK-1*) до (LK-15*) и убедиться, что всякий раз, когда в (2.1.86)
выводимость нижней секвенция следует из выводимости верхней применением этого правила, в
(2.1.85) выводимость нижней секвенции также получается из выводимости верхней применением
этого же правила, возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (2.1.86) получено применением первого правила в (LK-1*), то есть имеет вид
Γ ⊢∆
α, Γ ⊢ ∆
Γb ⊢ ∆
b
,
b
b, Γ ⊢ ∆
α b
\
α , Γb ⊢ ∆b
x=τ
.
dα, Γb ⊢ ∆
∀x b
Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(LK-4*),
\ \
dα ⊢ α
∀x α , Γb ⊢ ∆
b
x=τ x=τ
,
dα, Γb ⊢ ∆
∀x b
и по правилу (2.1.76) это будет эквивалентно переходу
\ \
∀x α
b⊢α α , Γb ⊢ ∆
b
x=τ x=τ
.
b, Γb ⊢ ∆
∀x α b
Последний переход представляет собой применение правила сечения (LK-4*), а добавленная нами
\
вершина слева — ∀x α
b⊢α — выводимая секвенция в T , в силу (2.1.81).
x=τ
§ 1. Формальные теории 127
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
\
Γb ⊢ ∆,
b α
x=y
Γb ⊢ ∆,
b ∀x
dα
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
\
α , Γb ⊢ ∆
b
x=y
dα, Γb ⊢ ∆
∃x b
b, Γb ⊢ ∆
∃x α b
\
Γb ⊢ ∆,
b α
x=τ
.
b b d
Γ ⊢ ∆, ∃x α
Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(LK-4*),
\ \
Γb ⊢ ∆,
b α α dα
⊢ ∃x
x=τ x=τ
,
Γb ⊢ ∆, dα
b ∃x
Последний переход представляет собой применение правила сечения (LK-4*), а добавленная нами
\
вершина справа — α ⊢ ∃x α
b — выводимая секвенция в T , в силу (2.1.82).
x=τ
128 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
потому что card и 1 — присоединенные к MK символы. Следующая теорема показывает, что это
требование не существенно, и в схемах аксиом можно использовать формулы с новыми символами
тоже.
⊢ ∃x U (x), (2.1.88)
(ii) нужно чтобы для каждой константы η из сигнатуры Σ соответствующий символ кон-
станты η ′ в теории S ′ , обладал свойством U , то есть чтобы в S ′ была выводима секвен-
ция
⊢ U (η), (2.1.89)
18 Напомним, что понятие схемы формул было определено на с. 111.
19 Понятие эквивалентности теорий было определено на с.120.
§ 1. Формальные теории 129
— каждую подформулу
∃x α (2.1.93)
нужно заменить на подформулу
∃x U (x) & (α) (2.1.94)
Это наблюдение понадобится нам ниже при доказательстве теорем Геделя о непротиворечивости
(теоремы 2.2.19 и 2.2.22).
S ⊆ S′ ⊆ T .
Γ ⊢∆
Γ ′ ⊢ ∆′
⊢ (γ ⇒ δ)′ ,
Доказательство теоремы 2.1.51. Здесь схема рассуждений похожа на ту, что использовалась в
доказательстве второй части теоремы 2.1.46, только каждый шаг усложняется пропроционально
усложнению конструкции ϕ′ в сравнении с ϕ.
b
§ 1. Формальные теории 131
Нам достаточно рассмотреть случай, когда формула ϕ выводима в S. Тогда у нее есть вывод в
S, то есть некое дерево Генцена,
λ⊢λ ⊢γ
Γ3 ⊢∆3 Γ4 ⊢∆4
Γ1 ⊢∆1 Γ2 ⊢∆2
... ...
(2.1.97)
⊢ϕ
у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
λ ⊢ λ), либо секвенции вида ⊢ γ, где γ — аксиомы теории S.
Преобразуем каждую формулу ψ в этом дереве в формулу ψ ′ теории S ′ (по правилам, описанным
на с.129). Мы получим некую картинку с секвенциями теории S ′ :
λ′ ⊢λ′ ⊢γ ′
Γ ′ ⊢∆′ Γ ′ ⊢∆′
3 3 4 4
Γ1′ ⊢∆′ Γ2′ ⊢∆′
1 2
... ...
(2.1.98)
⊢ ϕ′
В вершинах этой картинки стоят либо секвенции вида λ′ ⊢ λ′ , то есть аксиомы исчисления предика-
тов LK, либо секвенции вида ⊢ γ ′ , где γ — аксиомы теории S, а это выводимые секвенции, поскольку
операция γ 7→ γ ′ есть интерпретация теории S.
Поэтому если доказать, что в (2.1.98) каждый переход вниз осуществляется по правилам вывода
исчисления LK, то это будет выводом секвенции
⊢ ϕ′
Γp′ ⊢ ∆′p
(2.1.99)
Γq′ ⊢ ∆′q
который в свою очередь получен применением какого-то из правил вывода (LK-1*) — (LK-15*).
Нужно перебрать все правила от (LK-1*) до (LK-15*) и убедиться, что всякий раз, когда в (2.1.100)
выводимость нижней секвенция следует из выводимости верхней применением этого правила, в
(2.1.99) выводимость нижней секвенции также получается из выводимости верхней применением
этого же правила, возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (2.1.100) получено применением первого правила в (LK-1*), то есть имеет вид
Γ ⊢∆
α, Γ ⊢ ∆
Тогда (2.1.99), получаемое преобразованием этого перехода, имеет вид
Γ ′ ⊢ ∆′
,
α′ , Γ ′ ⊢ ∆′
и это тоже применение правила (LK-1*).
2. Следующие правила, от (LK-2*) до (LK-11*) включительно проверяются так же элементарно.
3. Сложности начинаются с правила (LK-12*). Пусть (2.1.100) получено применением этого пра-
вила, то есть имеет вид
αx=τ , Γ ⊢ ∆
∀x α, Γ ⊢ ∆
— где x — переменная, а τ – терм. Это преобразуется в переход
(αx=τ )′ , Γ ′ ⊢ ∆′
,
(∀x α)′ , Γ ′ ⊢ ∆′
132 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Если снова воспользоваться обозначением (2.1.102), то эту секвенцию можно будет коротко записать
так:
U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′
Добавив ее слева к верхней секвенции в (2.1.103), мы получим дерево
U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′ U (y) ⇒ α′ x=τ ′ , Γ ′ ⊢ ∆′
(LK-4*)
U τ ′ (y) ⇒ α′ x=τ ′ (y) , Γ ′ ⊢ ∆′
(LK-12*)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
Здесь секвенция в левой вершине, как мы уже заметили, выводима. Поэтому из выводимости се-
квенции в правой вершине следует выводимость корня дерева.
4. Пусть (2.1.100) получено применением правила (LK-13*), то есть имеет вид
Γ ⊢ ∆, αx=y
Γ ⊢ ∆, ∀x α
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
′
Γ ′ ⊢ ∆′ , αx=y
′
Γ ′ ⊢ ∆′ , ∀x α
При этом, y по-прежнему не входит (как свободная переменная) в нижнюю секвенцию. Но это в
точности применение правила (LK-13*) к верхней секвенции.
5. Пусть (2.1.100) получено применением правила (LK-14*), то есть имеет вид
αx=y , Γ ⊢ ∆
∃x α, Γ ⊢ ∆
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
′
αx=y , Γ ′ ⊢ ∆′
′
∃x α , Γ ′ ⊢ ∆′
Теперь чтобы доказать, что из верхней секвенции здесь выводится нижняя, заметим, что выведен-
ную нами выше секвенцию (0.2.73) можно записать применительно к нашим условиям в виде
U (y) & α′ ⊢ U (y) ⇒ α′
x=y x=y
Добавив эту секвенцию слева к верхней секвенции в (2.1.104), мы получим дерево Генцена
U (x) & α′ x=y ⊢ U (y) ⇒ α′ x=y U (y) ⇒ α′ x=y , Γ ′ ⊢ ∆′
(LK-4*)
U (x) & α′ x=y , Γ ′ ⊢ ∆′
(LK-14*)
∃x U (x) & α′ , Γ ′ ⊢ ∆′
— где как и раньше, в соответствии с соглашением (2.1.102), под U (y) понимается U (y1 ) & ... & U (yn ).
Заметим, что по теореме 2.1.23 секвенция
Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=τ ′
U (y) ⊢ U (τ ′ (y))
(LK-1*)
U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
(LK-6*)
U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) & α′ x=τ ′
(LK-15*)
U (y), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(2.1.102)
U (y1 ) & U (y2 ) & ... & U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
Теорема 0.2.28
U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-14*)
⊢ ∃y1 U (y1 ) ∃y1 U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-4*)
U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-4*)
...
(LK-4*)
⊢ ∃yn U (yn ) U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(LK-4*)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
Здесь самая правая вершина — секвенция U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′ — верхняя секвенция в (2.1.106).
Вершина на самом верху — секвенция U (y) ⊢ U (τ ′ ) — правило (2.1.90), записанное для терма τ ′ .
Остальные вершины — секвенции ⊢ ∃yi U (yi ) — представляют собой правило (2.1.88) непустоты уни-
версума, записанное для переменных yi . С их помощью мы последовательно избавляемся от формул
′ ′ ′
1 ), ..., U (yn ), Γ ⊢ ∆ , ∃x′ U (x)′ & α (x). Из этого
U (yi ) в антецеденте получающейся секвенции U (y
′
де-
′ ′
рева видно, что если выводится U (y), Γ ⊢ ∆ , α x=τ ′ , то выводится и Γ ⊢ ∆ , ∃x U (x) & α′ (x).
⋄ 2.1.54. Нетрудно заметить, что любая теория символ + определяется теоремой 1.1.1, а символ
S тривиальным образом интерпретируется в са- · – теоремой 1.1.3. Тогда
мой себе, если в качестве универсума U выбира- — условие (2.1.35) будет выполняться в силу
ется какая-нибудь выводимая формула, напри- свойства 20 на с.54,
мер, x = x.
— условие (2.1.36) будет выполняться в силу
⋄ 2.1.55. Интерпретация арифметики Пеано свойства 60 на с.55,
PA в теории множеств MK. Рассмотрим сигна-
— условие (2.1.37) будет выполняться в силу
туру теории PA, описанную в примере 2.1.18:
(1.1.1),
0, S, +, · — условие (2.1.38) будет выполняться в силу
Вспомним определения, которые мы давали этим (1.1.2),
символам в теории MK. Оставим эти определе- — условие (2.1.39) будет выполняться в силу
ния, подкорректировав только одно из них, для (1.1.22),
функции S, а именно: пусть символ 0 обозначает — условие (2.1.40) будет выполняться в силу
пустое множество ∅ (то есть определяется фор- (1.1.23),
мулой (0.3.260))
— условие (2.1.41) будет выполняться по теоре-
0 = ∅,
ме 0.3.79 (принцип обыкновенной индукции).
символ S – ограничение отображения S, опре-
деленного формулой (0.3.293), на множество Вместе все это означает, что такая система опре-
FinOrd конечных ординалов делений для символов 0, S, +, · в теории MK
будет интерпретацией теории PA в теории MK (с
S(X) = X ∪ {X}, универсумом x ∈ FinOrd).
§ 1. Формальные теории 135
— каждую подформулу
∃x α (2.1.109)
нужно заменить на подформулу
∃x x ∈ M & (α) (2.1.110)
Теория S ′ называется моделью теории S, если для всякой аксиомы ϕ теории S соответ-
ствующая формула ϕ′ выводима в S ′ (разумеется, это эквивалентно тому, что теория S ′
является интерпретацией S в смысле определения на с.128). Множество M при этом на-
зывается универсумом этой модели, а формула ϕ′ — переводом формулы ϕ в этой модели.
Теорему 2.1.57 невозможно усилить до утвер- этого дерева еще не представлена в 2-чной запи-
ждения, что выводимость формулы ϕ в теории си. Но если ее представить,
S эквивалентна выводимости формулы ϕ′ в ее
21
модели S ′ . Вот типичная иллюстрация: 35 = 22 +1 + 21 + 20 ,
это утверждение можно доказать построением более простой, чем MK, теории множеств.
§ 2. Непротиворечивость и арифметизация 137
§2 Непротиворечивость и арифметизация
Помимо интерпретаций в логике имеется еще один способ погрузить одну формальную теорию в
другую, а именно, кодировка. Это процедура, превращающая формулы и деревья Генцена заданной
теории S в термы другой теории T . В зависимости от выразительности языка теории T это поз-
воляет в некоторых случаях превратить суждения о выводимости формул S в формулы теории T .
Среди таких процедур в логике имеется две главные, из которых получаются основные результаты
этой науки: кодировка средствами арифметики (арифметизация) и кодировка средствами теории
множеств (семантизация). Первая из них предлагает эффективный инструмент для исследования
вопросов непротиворечивости формальных теорий, а вторая позволяет в некотором смысле изба-
виться от самого понятия формальной теории, заменив его подходящим дефинициальным расши-
рением рабочей теорией множеств. В этом параграфе мы опишем первую процедуру.
α & β ⊢ α ⇒ β. (2.2.114)
ϕ & ¬ϕ ⊢ ϕ ⇒ ¬ϕ,
Если теперь выводима формула ϕ & ¬ϕ, то подклеив ее вывод к левой вершине, мы получим вывод
формулы ϕ ⇒ ¬ϕ.
Точно также заменив в (2.2.114) α на ¬ϕ, а β на ϕ, мы получим выводимую секвенцию
¬ϕ & ϕ ⊢ ¬ϕ ⇒ ϕ.
Теперь если выводима формула ϕ & ¬ϕ, то, в силу выводимости секвенции (0.2.41), выводима и
формула ¬ϕ & ϕ. Подклеив ее вывод к левой вершине дерева (2.2.115), мы получим вывод формулы
¬ϕ ⇒ ϕ.
Мы получили, что если выводима формула ϕ & ¬ϕ, то выводимы формулы ϕ ⇒ ¬ϕ и ¬ϕ ⇒ ϕ.
Значит, выводима формула ϕ ⇔ ¬ϕ.
3. Остается последняя импликация (iii)⇒(i). Пусть выводима некоторая формула ϕ ⇔ ¬ϕ, то
есть секвенция
⊢ ϕ ⇔ ¬ϕ.
138 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
ϕ ⊢ ¬ϕ
и
¬ϕ ⊢ ϕ.
Выводимость первой из них влечет выводимость формулы ¬ϕ в силу дерева
ϕ ⊢ ¬ϕ
(LK-5*)
⊢ ¬ϕ, ¬ϕ
(LK-2*)
⊢ ¬ϕ
¬ϕ ⊢ ϕ
(LK-5*)
⊢ ϕ, ¬(¬ϕ) ¬(¬ϕ) ⊢ ϕ (0.2.72)
(LK-4*)
⊢ ϕ, ϕ
(LK-2*)
⊢ϕ
⋄ 2.2.2. Наивная теория множеств NST, которую (где R — множество Рассела, определенное фор-
мы строили в § 1 главы 0, противоречива по тео- мулой (0.1.18)). По той же теореме 2.2.1 это, в
реме 2.2.1 как формальная теория, потому что частности, означает, что в NST выводима также
парадокс Рассела (0.1.20), обсуждавшийся нами формула
в примере 0.1.13, означает выводимость в этой R∈R&R∈ / R,
теории формулы
а также по отдельности каждая из формул R ∈ R
R∈R ⇔ R∈
/R иR∈ / R, о чем мы говорили в замечании 0.1.14.
Если к его вершинам приклеить их выводы (к левой вершине вывод секвенции (2.2.116), а к правой
– вывод секвенции (0.2.71), который мы получили раньше), то это дерево превратится в вывод
формулы ψ в теории T .
То есть ψ выводима в теории T . Это верно для любой формулы ψ, поэтому если взять вместо
нее формулу ¬ψ, то для нее это тоже будет верно. Значит, обе формулы, ψ и ¬ψ выводимы в T .
Лемма 2.2.4. Если в формальной теории T для каких-то формул ϕ и ψ выводится секвенция
то в T выводится и секвенция
ψ⊢ (2.2.118)
Доказательство. Здесь снова используется секвенция (0.2.71). Если ее вывод подклеить к правой
вершине, а вывод секвенции (2.2.117) — к левой вершине дерева
Теорема 2.2.5 (о пустой секвенции). Формальная теория T противоречива тогда и только тогда,
когда в ней выводима пустая секвенция:
⊢ (2.2.119)
к которому если сверху приклеить вывод секвенции (2.2.119), то оно превратится в вывод формулы
ψ. То есть любая формула выводима в T , и по теореме 2.2.3 это означает, что теория T противоре-
чива.
2. Наоборот, если T противоречива, то по теореме 2.2.3 в ней выводима любая формула ψ, то
есть любая секвенция
⊢ ψ.
В частности, это верно для пустой формулы, то есть выводима секвенция (2.2.119).21
Теорема 2.2.7. Если замкнутая формула ϕ в теории T невыводима, то (не только теория T ,
но и) теория T + ¬ϕ непротиворечива.
21 Для привыкания к подобным трюкам полезно поглядеть на доказательство необходимости в теореме 2.2.3 с
подставленной в него вместо ψ пустой формулой. Дерево Генцена при этом получается таким:
Доказательство. Заметим, что аксиомы теории T тоже можно считать замкнутыми (как и форму-
лу ϕ), потому что по теореме 2.1.36 теория T и ее замыкание T дают один и тот же класс выводимых
формул.
Теперь предположим, что теория T + ¬ϕ противоречива. Тогда по теореме 2.2.5 в ней выводится
пустая секвенция
⊢ (2.2.120)
По определению вывода, это значит, что в теории T из формулы ¬ϕ выводится пустая формула.
Поскольку формула ¬ϕ замкнута (потому что ϕ замкнута), по теореме о дедукции 2.1.33 мы полу-
чаем, что пустая формула (не просто выводится, но и) следует из ¬ϕ в T . То есть в T выводится
секвенция
¬ϕ ⊢ . (2.2.121)
Рассмотрим дерево Генцена в T :
¬ϕ ⊢
(LK-5*)
⊢ ¬¬ϕ
теорема 2.1.27
⊢ϕ
Если к его вершине подклеить вывод секвенции (2.2.121), то мы получим вывод формулы ϕ. То
есть формула ϕ выводима в T . Но это невозможно, потому что по условиям теоремы ϕ выбрана
как невыводимая формула в T .
Теорема 2.2.8 (о наследовании противоречивости при интерпретациях). Пусть задана интерпре-
тация S ′ теории S в теории T . Тогда
— если теория S противоречива, то теория T тоже противоречива,
— если теория T непротиворечива, то теория S тоже непротиворечива,
Доказательство. Здесь достаточно проверить первое утверждение. Если ϕ – формула в теории
S, являющаяся одновременно выводимой и опровержимой, то по теореме 2.1.51 соответствующая
формула ϕ′ в теории T также будет одновременно выводимой и опровержимой.
(b) Арифметизация
Геделевы номера. Пусть S — формальная теория. Нумерацию ее деревьев Генцена (или коди-
ровку средствами теории PA) можно организовывать по-разному, один из возможных вариантов
следующий.
1. С самого начала нужно присвоить номера символам секвенции ⊢ и перехода на следующий
уровень в дереве Генцена −. Пусть это будут числа 3 и5:
p⊢q = 3 (2.2.122)
p−q = 5 (2.2.123)
2. Затем нужно присвоить номера скобкам и логическим символам. Это можно сделать,
например, занумеровав эти элементы нечетными числами, следующимми за 5:
p(q = 7 (2.2.124)
p)q = 9 (2.2.125)
p, q = 11 (2.2.126)
p¬q = 13 (2.2.127)
p&q = 15 (2.2.128)
p∨q = 17 (2.2.129)
p⇒q = 19 (2.2.130)
p∀q = 21 (2.2.131)
p∃q = 23 (2.2.132)
3. После этого нужно присвоить номер каждому элементу η сигнатуры Σ теории S. Это
также можно сделать, занумеровав их нечетными числами, следующими за 23:
Q P Q
,
R R
подстановкой вместо P и Q деревьев P или Q соответственно, номера которых уже опре-
делены, то его номером считается
Q
p q = 2pQq · 3pRq (2.2.139)
R
P Q
p q = 2pPq · 3pQq · 5p−q · 7pRq (2.2.140)
R
Суждения о выводимости как формулы в PA. Геделю принадлежит наблюдение, что нуме-
рация секвенций и выводов данной теории S позволяет выразить суждения о выводимости формул
и секвенций в S средствами теории PA. Смысл проделанного им в этой области можно описать
двумя утверждениями, которые удобно представлять как главные технические результаты, лежа-
щие в фундаменте геделевских теорем о непротиворечивости (или о неполноте) 2.2.21 и 2.2.22: это
теорема 2.2.11, которую мы формулируем здесь, и следующая за ней ниже теорема 2.2.12.
Теорема 2.2.11. В предположении непротиворечивости арифметики Пеано PA, для всякой тео-
рии S с заданной нумерацией p·q ее деревьев Генцена в теории PA существует формула, опреде-
ляющая предикатный символ Prf валентности 2 со следующими свойствами:
(i) для произвольной данной формулы ϕ в S и произвольного дерева Генцена K в S формула
Prf(pKq, pϕq)
выводима в PA тогда и только тогда, когда дерево K является выводом формулы ϕ (или,
что то же самое, секвенции ⊢ ϕ) в S.
(ii) всякое дерево Генцена K (из метаформул) в LK с языком теории S, выражающее выводи-
мость метаформулы ψ из метаформул ϕ1 ,...,ϕn (то есть с n вершинами ⊢ ϕ1 ,...,⊢ ϕn ,
а также, возможно с другими вершинами, являющимися аксиомами теории LK (с язы-
ком S), то есть имеющими вид α ⊢ α, и с корнем ⊢ ψ),
⊢ϕ1
... ... ⊢ϕ
...
n
...
K : ,
⊢ψ
Prf(y1 , pϕ1 q), ..., Prf(yn , pϕn q) ⊢ Prf(FK (y1 , ..., yn ), pψq) (2.2.141)
Как и теорема 2.2.12 ниже, это утверждение представляет собой перевод на язык исчисления
секвенций части технических результатов Геделя. Традиционно эта область освещается в логике
скупо и туманно22 по причине громоздскости сформировавшейся в ней на сегодняшний день систе-
мы рассуждений23 . Поскольку эта часть математики (рекурсивные функции и их применение) не
связана с математическим анализом, мы считаем разумным оставить это место в качестве пробела
со ссылкой на книгу П. Смита (которая, во всяком случае, формально дает возможность отследить
дальнейшие детали).24 .
22 См.например, доказательтство Предложения 10.9 в книге Г.Такеути. Теория доказательств. М.: Мир, 1978.
23 См.также подстрочное примечание на с.234 в книге P. Smith, An introduction to Gödel’s incompleteness theorems.
Cambridge University Press, 2007.
24 Мы предупреждали об этом пробеле (и точно так же о доказательстве теоремы 2.2.12) в Предисловии на с.vii.
§ 2. Непротиворечивость и арифметизация 143
(иными словами, если y — номер вывода для формулы ϕ, то Ded(y) — номер вывода для формулы
Prf(y, pϕq)).
Этот результат, как и теорему 2.2.11 выше, мы приводим без доказательства со ссылкой книгу
П. Смита25 .
• Пусть в теории S задана нумерация p·q деревьев Генцена, и одновременно задана интер-
претация арифметики Пеано PA с неким универсумом U (то есть теория S интерпретирует
арифметику Пеано PA с универсумом U ), и пусть Prf S — естественный перевод формулы
Prf в теории S. Тогда формула
PrS (x) ⇔ ∃y U (y) & Prf S (y, x) (2.2.143)
PrS (pϕq) & PrS (pψq) ⊢ PrS (pϕ & ψq) (2.2.145)
Доказательство. 1. Пусть формула ϕ выводима в теории S. Это значит, что у нее есть некоторый
вывод P в S. Поэтому по теореме 2.2.11, в PA выводима формула Prf(pP q, pϕq). Отсюда по теореме
2.1.51 в S выводима формула Prf S (pP q, pϕq), а значит и формула PrS (pϕq).
2. Пусть ϕ и ψ — конкретные формулы теории S и оказалось, что в S выводима формула ϕ ⇒ ψ.
Это значит, что у нее имеется некий вывод Q. Зафиксируем эти значения метапеременных ϕ и ψ и
этот вывод Q.
25 См. выше подстрочные примечания 22 и 23. В Предисловии на с.vii мы говорили об этом пробеле.
26 В учебниках по логике эти утверждения обычно формулируются без доказательств или с набросками доказа-
тельств (см. напр. книгу Г.Такеути. Теория доказательств. М.: Мир, 1978 (Предложении 10.9), или книгу P.Smith,
An introduction to Gödel’s incompleteness theorems. Cambridge University Press, 2007 (Section 25.2)). Мы выводим эти
утверждения из сформулированых выше теорем 2.2.11 и 2.2.12.
144 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Далее, по теореме дедукции 2.1.33, правило “modus ponens” (0.2.38), то есть выводимость секвен-
ции
ϕ, ϕ ⇒ ψ ⊢ ψ
можно представить как выводимость27 метаформулы ψ из метаформул ϕ и ϕ ⇒ ψ, то есть суще-
ствование дерева Генцена, у которого на вершинах стоят секвенции ⊢ ϕ и ⊢ ϕ ⇒ ψ (и возможно еще
аксиомы теории), а в корне — секвенция ⊢ ψ. Это дерево выглядит так:
ϕ⊢ϕ ψ⊢ψ
(LK-10*)
ϕ ⇒ ψ, ϕ ⊢ ψ
(LK-3*)
ϕ, ϕ ⇒ ψ ⊢ ψ
(LK-3*) (2.2.150)
⊢ϕ⇒ψ ϕ ⇒ ψ, ϕ ⊢ ψ
(LK-4*)
⊢ϕ ϕ⊢ψ
(LK-4*)
⊢ψ
По теореме 2.2.11 (ii) это означает, что в PA можно определить некий внешний функциональный
символ FK валентности 2, для которого будет выводима секвенция
Применяя следствие 2.1.52, мы можем заключить из этого, что в теории S выводима секвенция
Prf S (y, pϕq), Prf S (pQq, pϕ ⇒ ψq) ⊢ Prf S (FK (y, pQq), pψq) (2.2.151)
U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ U (FK (y, pQq)) & Prf S (FK (y, pQq), pψq)
U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ U (FK (y, pQq)) & Prf S (FK (y, pQq), pψq)
(LK-15*)
U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ ∃z U (z) & Prf S (z, pψq)
(LK-14*)
∃y U (y) & Prf S (y, pϕq), U (pQq) & Prf S (pQq, pϕ ⇒ ψq) ⊢ ∃z U (z) & Prf S (z, pψq)
| {z } | {z }
k k
Pr S (pϕq) PrS (pψq)
U (y) & Prf S (y, pϕq) ⊢ U (Ded(y)) & Prf S (Ded(y), pPrf S (y, pϕq)q)
U (y) & Prf S (y, pϕq) ⊢ U (Ded(y)) & Prf S (Ded(y), pPrf S (y, pϕq)q)
(LK-15*)
U (y) & Prf S (y, pϕq) ⊢ ∃z U (z) & Prf S (z, pPrf S (y, pϕq)q)
(LK-14*)
∃z U (y) & Prf S (y, pϕq) ⊢ ∃z U (z) & Prf S (z, pPrf S (y, pϕq)q)
| {z } | {z }
k k
PrS (pϕq) Pr S (pPrf S (y, pϕq)q)
Свойство 1◦ в этом списке не работает в обратную сторону: если в S выводима формула PrS (pϕq),
то из этого не следует, что в S выводима формула ϕ. Однако симметрию удается восстановить если
теория S ω-непротиворечива:
Теорема 2.2.13. Пусть в теории S задана нумерация p·q деревьев Генцена, и одновременно S
интерпретирует арифметику Пеано PA. Если теория S ω-непротиворечива, то формула ϕ выво-
дима в S, тогда и только тогда, когда формула PrS (pϕq) выводима в S.
Геделево предложение.
Лемма 2.2.14. Теория S, интерпретирующая арифметику Пеано PA, противоречива тогда и
только тогда, когда в ней выводится формула 0 = 1 (где 1 = S(0), а S — функция следования в
теории PA (см. пример 2.1.18)).
Доказательство. 1. Если S противоречива, то в ней выводится любая формула, в том числе,
PrS (p0 = 1q).
2. По аксиоме (2.1.35) в теории PA выводится формула ¬(0 = 1). Поскольку теория S интерпре-
тирует PA, в ней тоже выводится формула ¬(0 = 1). Теперь если в S выводится формула 0 = 1, то
вместе с формулой ¬(0 = 1) она означает, что S противоречива.
Пусть теперь, как раньше, в теории S задана нумерация p·q деревьев Генцена, и одновременно S
интерпретирует арифметику Пеано PA. Тогда утверждение “в S выводится формула 0 = 1” можно
записать в виде формулы
PrS (p0 = 1q).
И по лемме 2.2.14 это будет эквивалентно утверждению “теория S противоречива”. Как следствие,
отрицание этой формулы ¬ PrS (p0 = 1q) формализует утверждение, что теория S непротиворечива.
У этой формулы имеется специальное обозначение:
• Символом ConS мы обозначим формулу в S
На человеческом языке символ diag обозначает функцию, которая каждому геделеву номеру
pϕq формулы ϕ с единственной свободной переменной x в S ставит в соответствие номер pϕx=pϕq q
формулы, получающейся подстановкой в ϕ вместо x номера pϕq.
Рассмотрим формулу в S
η = ¬ PrS (diag(y)) (2.2.162)
(поскольку PrS — внешний предикатный символ валентности 1 в S, правая часть корректно опре-
делена). Это будет формула с единственной свободной переменной y. Формула η утверждает, что в
S не выводима формула с геделевым номером diag(y).
Рассмотрим формулу
γ = η (2.2.163)
y=pηq
γ ⇒ ¬ PrS (pγq).
То есть формула ¬ PrS (pγq) следует из формулы γ (в смысле определения на с.116). По теореме
дедукции 2.1.33 отсюда следует, что ¬ PrS (pγq) выводится из формулы γ (в смысле определения на
с.119). По нашему предположению, γ выводится в S, поэтому мы получаем, что ¬ PrS (pγq) тоже
выводится в S.
Итак, в S выводятся формулы PrS (pγq) и ¬ PrS (pγq), и это означает, что S противоречива.
ConS ⊢ γ (2.2.165)
Это следует из свойств 5◦ и 6◦ на с.143. Мы эту секвенцию включаем как правую вершину в дерево
(LK-3*), (LK-5*)
¬ PrS (p0 = 1q) ⊢ ¬ PrS (pγq) & PrS (p¬γq)
(2.2.160)
ConS ⊢ ¬ PrS (pγq) & PrS (p¬γq)
(0.2.74)
ConS ⊢ ¬ PrS (pγq) ∨ ¬ PrS (p¬γq)
теорема 0.2.29
ConS ⊢ ¬ PrS (pγq), ¬ PrS (p¬γq)
(LK-3*), (LK-5*)
PrS (pγq) ⊢ PrS (pPrS (pγq)q) (2.2.144) ConS , PrS (pγq) ⊢ ¬ PrS (p¬γq)
(LK-1*) (2.2.164), свойство 3◦ на с.143
ConS , PrS (pγq) ⊢ PrS (pPrS (pγq)q) ConS , PrS (pγq) ⊢ ¬ PrS (pPrS (pγq)q)
(LK-6*)
ConS , PrS (pγq) ⊢ PrS (pPrS (pγq)q) & ¬ PrS (pPrS (pγq)q)
лемма 2.2.4
ConS , PrS (pγq) ⊢
(LK-3*), (LK-5*)
ConS ⊢ ¬ PrS (pγq)
(2.2.164)
ConS ⊢ γ
29 Здесь важно напомнить читателю то, что говорилось в замечании 2.1.1: под формальной теорией мы условились
понимать теорию с конечным набором аксиом и конечным набором схем аксиом, из чего следует, что такая теория
автоматически рекурсивно аксиоматизируема.
30 P.T.Johnstone. Notes on logic and set theory. Cambridge university press, 1996. Theorem 9.1.
31 См. [13, Замечание на с.93].
32 См. подстрочное примечание 29.
33 P.T.Johnstone. Notes on logic and set theory. Cambridge university press, 1996. Theorem 9.2.
34 См. подстрочное примечание 29.
150 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
математики, где используется теория множеств (то есть, фактически везде, или, если быть
точным, везде вне некоторых совсем узких разделов логики), формулируются с дополнительным
предположением, что используемый рабочий вариант теории множеств (в нашем случае это
теория Морса-Келли MK) непротиворечив.
Это нагляднее всего иллюстрируется в традиции доказательств от противного: всякий раз, когда
математик, получая из посылки противоречие, выводит из этого, что посылка неверна, он предпо-
лагает непротиворечивость используемой им рабочей теории множеств, без чего его рассуждения
утрачивали бы смысл (мы иллюстрируем это ниже в примере 2.2.27).
Математики, тем не менее, почти никогда не следуют этому правилу явно (то есть нигде в
формулировках не говорят прямо “мы предполагаем, что теория множеств непротиворечива”)37.
Однако это всюду подразумевается по умолчанию. Мы в этой главе будем все-таки в нужных местах
эту фразу (про предполагаемую непротиворечивость MK) произносить, чтобы она отпечаталсь у
читателя в сознании (в частности, это будет вставленно в формулировки теорем 2.2.25 и 2.2.26
ниже), однако в остальных главах мы это повторять перестанем и вспоминать об этом уже не
будем.
Этому приему неявного использования в своих рассуждениях предположения о непротиворечи-
вости рабочей теории множеств полезно приписать какое-нибудь название, и мы будем в дальнейшем
называть его умолчанием о непротиворечивости.
Контрмодели. В любой теории утверждения имеют смысл только если эта теория непротиворе-
чива, или хотя бы есть основания это предполагать. Не всякий математик об этом задумывается,
но в обсуждениях все это признают, и признают, что в своих высказыаниях по умолчанию предпо-
лагают непротиворечивость используемых теорий. В математической логике из-за возобладавшего
в ней в 20 веке платоновского идеализма этот принцип так искусно затушевывается, что невольно
начинаешь подозревать в этом желание обойти его, спрятав под ковер неудобные факты (а именно,
бесплодность попыток найти доказательство непротиворечивости теорий, лежащих в основаниях
математики). Поскольку целью этой главы было объявлено освещение результатов математической
логики в духе философии формализма, мы считаем нужным показать, где в описываемых нами кон-
струкциях проявляется умолчание о непротиворечивости используемых теорий. Понятно, что оно
работает всюду в теориях PA и MK. Но там, где формальные теории связываются друг с другом,
то есть рассматриваются интерпретации и кодировки, этот эффект легко комкается и расхождения
между идеализмом и формализмом проявляются здесь особенно выпукло. В частности, сюда входит
все, что связано с понятием контрмодели, о котором мы здесь поговорим.
Прежде всего, отметим следующие два факта.
Теперь объясним, что такое контрмодель. Пусть нам дана какая-то формальная теория S и
формула ϕ в ней. Чтобы понять, будет эта формула выводима в S или нет, конечно, никакого
определенного алгоритма не существует. Однако если удается подобрать модель S ′ , в которой со-
ответствующая формула ϕ′ опровержима, то по теореме 2.2.26 это будет сразу означать, что в S
формула ϕ не может быть выводимой, если предполагать, что теория множеств MK непроти-
воречива. Такая модель S ′ , в которой формула ϕ′ опровержима, называется контрмоделью для
формулы ϕ.
Покажем как это понятие применяется. Значит, в нашей модели выводимо отрицание
формулы (2.2.169). То есть формула (2.2.169)
⋄ 2.2.27. Пусть S = Poset – теория частичного
опровержима в построенной модели, и поэтому
порядка, описанная в примере 2.1.16. Рассмот-
не может быть выводимой в теории частичного
рим в ней утверждение, что порядок всегда ли-
порядка (если считать, что теория множеств MK
неен:
непротиворечива).
∀x ∀y x 6 y ∨ y 6 x . (2.2.169)
⋄ 2.2.28. Пусть S = Group – теория групп, опи-
Рассмотрим множество X = 3 = {0, 1, 2}, и, в ка- санная в примере 2.1.17. Чтобы показать, что в
честве модели теории S, множество U = 2X всех ней утверждение
подмножеств в X с частичным порядком
∀x ∀y x · y = y · x (2.2.170)
A 6 B ⇔ A ⊆ B.
— невыводимо, достаточно построить какую-
Тогда множества
нибудь модель этой теории, то есть группу, в
x = {0, 1}, y = {0, 2} которой это неверно (в предположении, что ра-
бочая теория множеств непротиворечива). Такой
будут обладать свойством моделью может быть группа
x*y &y*x S3
то есть будет выполняться отрицание формулы
(2.2.169): всех биективных отображений множества 3 =
{0, 1, 2} в себя (с композицией отображений в ка-
∃x ∃y x 66 y&y6 6 x честве групповой операции).
том, что он позволяет свести изучение формальных теорий к изучению дефинициальных расшире-
ний теории множеств MK. Это в свою очередь позволяет математикам (по крайней мере, тем, кто
не специализируется в математической логике) вообще забыть о формальных теориях, описывая
все необходимые конструкции языком рабочей теории множеств (и выводя все нужные результаты
внутри этой теории множеств).
⋄ 2.3.4. Семантизация теории частичного по- формальную теорию. Объясним, как строится ее
рядка. Напомним, что в примере 2.1.16 мы опре- семантизация в MK.
делили теорию Poset частичного порядка как Прежде всего, реляционной структурой этой
формальную теорию. Объясним, как строится ее теории будет любая тройка M = (M@ , M1 , M• )
семантизация в MK. состоящая из множества M@ , его элемента M1 ∈
Прежде всего, реляционной структурой этой M@ и отображения M• : M@ × M@ → M@ . Акси-
теории будет любая пара M = (M@ , M6 ) со- омы этой теории (2.1.32)—(2.1.34)
стоящая из множества M@ и бинарного отноше-
ния M6 на нем. Аксиомы этой теории (2.1.29)— (x · y) · z = x · (y · z)
(2.1.31) x·1 =x & 1·x =x
x6x
∀x ∃y x·y = 1 & y·x =1
x6y &y6x ⇒ x=y имеют следующие семантизации в структуре M :
x6y &y6z ⇒ x6z
x, y, z ∈ M@ ⇒ M• (M• (x, y), z) = M• (x, M• (y, z)).
имеют следующие семантизации в структуре M :
x ∈ M@ ⇒ M• (x, M1 ) = x & M• (M1 , x) = x
x ∈ M@ ⇒ (x, x) ∈ M6 .
∀x x ∈ M@ ⇒ ∃y y ∈ M@ ⇒
x, y ∈ M@ ⇒ M• (x, y) = M1 & M• (y, x) = M1
(x, y) ∈ M6 & (y, x) ∈ M6 ⇒ x = y Если эти формулы выводимы в MK, то реля-
ционная структура M = (M@ , M1 , M• ) называ-
ется моделью теории групп, или что то же са-
x, y, z ∈ M@ ⇒ мое, группой. Класс ModGroup всех групп являет-
ся объектом теории MK и определяется форму-
(x, y) ∈ M6 & (y, z) ∈ M6 ⇒ лой
(x, z) ∈ R
M ∈ ModGroup ⇐⇒ ∀x, y, z x, y, z ∈ M@ ⇒
Если эти формулы выводимы в MK, то реля- M• (M• (x, y), z) = M• (x, M• (y, z)) & ∀x
ционная структура M = (M@ , M6 ) называется
моделью теории частичного порядка, или что x ∈ M@ ⇒ M• (x, M1 ) = x & M• (M1 , x) = x
то же самое, частично упорядоченным множе-
ством. Класс ModPoset всех частично упорядо- ∀x x ∈ M@ ⇒ ∃y y ∈ M@ ⇒
ченных множеств является объектом теории MK
и определяется формулой M• (x, y) = M1 & M• (y, x) = M1 (2.3.178)
! 2.3.7. Это утверждение можно понимать как есть в смысле теоремы 2.3.6), не эквивалентна S
формальный вид высказывания, что выводи- в обычном, широком смысле. Точнее, можно ска-
мость формулы ϕ в S эквивалентна тому, что в зать, что все, что утверждается (и выводится)
каждой модели M ∈ ModS теории S соответству- в исходной теории S, утверждается (и выво-
ющая формула ϕM выводима (как в формальной дится) и в ее семантизации S ∗ , но не наоборот:
теории, какую представляет собой модель M ). в семантизации S ∗ сигнатура шире (в ней содер-
Доказательство теоремы 2.3.6. В прямую сто- жатся дополнительные символы из теории мно-
рону это утверждение уже отмечалось в замеча- жеств) и аксиом гораздо больше, чем в S, и как
нии 2.3.3: если формула ϕ в формальной теории следствие, выводимых утверждений в ней тоже
S выводима, то формула ϕ∗ выводима в семанти- гораздо больше.
зации S ∗ (это проверяется так же, как в теореме Вот примеры, иллюстрирующие это замеча-
2.1.51 об интерпретации). Нетривиальной частью ние.
является обратное утверждение: если ϕ невыво-
дима в S, то ϕ∗ невыводима в S ∗ . ⋄ 2.3.8. Построенная нами в примере 2.3.4 се-
Чтобы это доказать, заметим сначала, что мантизация теории частичного порядка не эк-
формулу ϕ можно считать замкнутой, потому вивалентна самой этой теории (представленной
что по предложению ??, ϕ и ее замыкание все- как формальная теория в примере 2.1.16), по-
общности ϕ выводятся друг из друга. Пусть да- тому что, например, все, что связано с моно-
лее формула ϕ замкнута и невыводима в теории тонными отображениями частично упорядочен-
S. Тогда, по теореме 2.2.7, теория S+¬ϕ непроти- ных множеств, описывается только в семантиза-
воречива. По теореме 2.3.13 Генкина38 это озна- ции теории частичного порядка (а в самой фор-
чает, что для теории S + ¬ϕ найдется модель M мальной теории частичного порядка из примера
в теории Морса-Келли MK. В этой модели фор- 2.1.16 понятие монотонного отображения опреде-
мула (¬ϕ)M = ¬(ϕM ) выводима. Мы получаем, лить невозможно).
что ¬(ϕM ) выводима и ϕM выводима тоже (по-
⋄ 2.3.9. Точно так же описанная в примере
тому что ϕ∗ выводима). Значит, теория M , опи-
2.3.5 семантизация теории групп не эквивалент-
сывающая модель, противоречива, а вместе с ней
и содержащая ее теория MK тоже должна быть на формальной теории групп из примера 2.1.17,
противоречива. в частности, потому что понятие гомоморфизма
групп можно определить только в семантизации
Семантизация S ∗ теории S, будучи эквива- этой теории (но не в самой формальной теории
лентна S на уровне утверждений теории S (то групп).
A ⊆ Term
C ⊆ Term
(p, τ1 , ..., τn )
– формула.
— если строка ϕ – формула, то строка (¬, ϕ) – тоже формула;
— если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:
ревьев Генцена, где слово “вершина” применяется только к вершинам с нулевой входящей валентностью.
§ 3. Выразимость средствами теории множеств и семантизация 157
Говорят, что дуги в паре ((u1 , v1 ), (u2 , v2 )) инцидентны, если конец первой дуги совпадает с
началом второй:
v1 = u2 .
Путем из узла u ∈ V в узел w ∈ V называется произвольная конечная последовательность
узлов v1 , ..., vn ∈ V со следующими свойствами:
1) эта последовательность начинается в u и заканчивается в w,
u = v0 , v1 , v2 , ..., vn−1 , vn = w.
(vk , vk+1 ) ∈ E.
Пусть v1 , ..., vn ∈ V называется циклом, если его начало совпадает с его концом.
Граф (V, E) мы будем называть деревом, если
(i) он не содержит циклов,
(ii) всякий его узел v ∈ V имеет исходящую валентность, не больщую 1, и входящую валент-
ность, не большую 2,
(iii) существует узел w ∈ V такой, что для любого узла u ∈ V можно построить путь, с
началом в u и концом в w.
• Узел с нулевой входящей валентностью называется вершиной дерева (V, E).
• Узел с нулевой исходящей валентностью называется корнем дерева (V, E). Из условий (i)—
(iii) следует, что корень всегда один, и это тот самый узел, который описывается в пункте
(iii) определения дерева (он один, потому что если бы был другой узел w′ со свойством
(iii), то можно было бы построить путь из w в w′ , а затем из w′ в w, и, подклеив эти пути
друг к другу, мы получили бы цикл, а это противоречит условию (i)). Кроме того, корень
всегда имеет исходящую валентность 0 (потому что иначе была бы дуга из w в какой-то
другой узел w′ , и мы опять получили бы ту же цепочку рассуждений).
Пусть теперь нам дана некая алгебраическая теория T в MK. Определим понятия набора формул
и секвенции в T следующим образом:
• Под набором формул языка L понимается произвольная конечная последовательность
формул Φ = (ϕ1 , ..., ϕn ) (элементов множества Form).
• Под секвенцией языка L понимается произвольная тройка (Φ, ⊢, Ψ ), где Φ и Ψ — произ-
вольные наборы формул. При этом набор формул Φ называется антецедентом, а набор
формул Ψ — сукцедентом секвенции (Φ, ⊢, Ψ ). Множество всех секвенций обозначается
Seq.
Заметим далее, что каждое правило вывода из списка (LK-1*)—(LK-15*) определяет некий класс
деревьев с узлами, являющимися элементами множества секвенций Seq.
Например, первое правило (LK-1*)
Γ ⊢∆
(2.3.179)
ϕ, Γ ⊢ ∆
выделяет класс деревьев с вершинами вида Γ ⊢ ∆ и корнями ϕ, Γ ⊢ ∆ (то есть таких деревьев,
у которых корень отличается от вершины тем, что к набору формул Γ в антецеденте добавляется
еще одна формула ϕ в начале).
Точно так же второе правило (LK-1*)
Γ ⊢∆
(2.3.180)
Γ ⊢ ∆, ϕ
158 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
выделяет класс деревьев с вершинами вида Γ ⊢ ∆ и корнями Γ ⊢ ∆, ϕ (то есть таких деревьев, у
которых корень отличается от вершины тем, что к набору формул ∆ в антецеденте добавляется
еще одна формула ϕ в конце).
И так далее, единственная деталь, которую полезно упомянуть, — что большинство правил будут
определять классы деревьев с одной ветвью, а правила (LK-4*), (LK-6*), (LK-8*), (LK-10*) — классы
деревьев с двумя ветвями.
Можно заметить, что из этих условий следует, что класс TheorS теорем теории S содержится в
классе TheorT теорем теории T :
TheorS ⊆ TheorT . (2.3.182)
по следующим правилам:
— для всякой переменной x ∈ A
εx = ε(x),
— для всякой константы c ∈ C
εc = M c
(действие ε на константы не зависит от выбора отображения ε),
— для всякого функционального символа f ∈ F валентности n и любых термов τ1 , ..., τn ∈
Term действие этого отображения на терм (f, τ1 , ..., τn ) описывается формулой
Предикат истинности теории T определяется как отображение TrueT , которое каждой реля-
ционной структуре M ∈ StrT , каждой формуле ϕ ∈ FormT и каждой оценке ε : A → M@ ставит в
соответствие число41 0 или 1 по следующим индуктивным правилам:
— если τ1 , ..., τn – термы, а η – предикатный символ (возможно, равенство) валентности n, то
для формулы ϕ = (η, τ1 , ..., τn ) и оценки ε : A → M@ значение TrueT (M, ϕ, ε) определяется
формулой42 (
1, ε(η,τ1 ,...,τn) ∈ Mη
TrueT (M, (η, τ1 , ..., τn ), ε) = (2.3.184)
0, иначе
— для всякой строки ϕ ∈ FormT и оценки ε : A → M@ значение TrueT (M, (¬, ϕ), ε) меняется
на противоположное по сравнению с TrueT (M, ϕ, ε):
(
1, TrueT (M, ϕ, ε) = 0
TrueT (M, (¬, ϕ), ε) = (2.3.185)
0, TrueT (M, ϕ, ε) = 1
ординалы 0 = ∅ и 1 = {∅} были определены выше формулами (0.3.260) и (0.3.261), а в свойстве 1◦ на с.60 отмечалось,
что они являются элементами FinOrd.
42 Здесь и ниже мы используем понятие характеристической функции класса, определенное формулой 0.3.209 в
главе о теории MK. Именно оно дает формальную возможность определять функцию TrueT формулами типа (??),
(2.3.185) и т.д. В частности, для ϕ = (η, τ1 , ..., τn ) TrueT (M, ϕ, ε) совпадает с характеристической функцией множества
AM,η,ε = {(x1 , ..., xk ) : (τ1 (ε(x1 , ..., xk )), ..., τn (ε(x1 ), ..., ε(xk )) ∈ Mη }.
§ 3. Выразимость средствами теории множеств и семантизация 161
∃g ∈ M@A ∀y ∈ A y 6= x ⇒ g(y) = ε(y)
1,
TrueT (M, (∃, x, ϕ), ε) = & TrueT (M, ϕ, g) = 1
0, иначе
Но тогда
∀ε ∈ M@A TrueT (M, ¬ϕ, ε) = 1 − TrueT (M, ϕ, ε) = 1.
То есть, формула ¬ϕ истинна в реляционной структуре M .
• Моделью алгебраической теории T называется любая ее реляционная структура M ∈ StrT ,
у которой все аксиомы аксиомы теории T истинны в M :
Иными словами, нужно, чтобы для любой аксиомы ϕ ∈ AxT при любой оценке ε : A → M@
предикат истинности имеет значение 1:
Класс ModT всех моделей теории T образует подкласс в классе StrT реляционных структур
теории T .
Из леммы Линденбаума 2.3.11 следует
Теорема 2.3.13 (Гедель, Генкин). 43 Если алгебраическая теория T в MK, непротиворечива, то
у нее существует модель в теории MK.
Доказательство. Здесь будет существенно использоваться соображение, что из предположения о
непротиворечивости алгебраической теории T в MK следует, что MK также предполагается непро-
тиворечивой теорией. Действительно, если бы MK была противоречивой, то для любой формулы
ϕ в T вместе с ϕ в T выводилась бы и формула ¬ϕ. А это значит, что теория T должна быть
противоречивой.
1. Добавим к символам теории T счетное число новых констант {bn }. Мы получим новую тео-
рию, обозначим ее T0 , которая отличается от T только списком констант. Покажем, что теория T0
43 Э.Мендельсон, предложение 2.12, с.74.
162 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
непротиворечива (как и T ). Предположим, мы вывели в теории T0 некую формулу вида ϕ&¬ϕ. Это
значит, что в T0 имеется некое дерево Генцена G, являющееся выводом ϕ&¬ϕ. Это дерево Генцена
составлено из аксиом теории T (то есть имеет вершинами аксиомы теории T ) с возможными подста-
новками вместо переменных и констант теории T еще констант {bn }. Если bi — какая-то из таких
констант, то заменив всюду в дереве G букву bi на какую-нибудь переменную x, не встречающуюся
в G, мы по правилам (LK-0*)— (LK-15*) снова получим дерево Генцена в T0 , но уже без символа bi ,
причем это будет вывод в T0 формулы
ϕb =x &¬ ϕb =x .
i i
Если таким образом заменить все встречающиеся в G константы bn , то мы получим дерево Генцена
уже в теории T , причем это будет вывод в T формулы
e ϕ,
ϕ&¬ e
e — формула, получающаяся из ϕ заменой имеющихся в ней констант bn на переменные из T .
где ϕ
Это значит, что теория T тоже должна быть противоречива. А это противоречит условиям нашей
теоремы.
2. Итак, новая теория T0 непротиворечива. Пусть {χk ; k > 0} — нумерация всех ее формул,
содержащих не более одной свободной переменной, и пусть для каждого χk символ xk обозначает
входящую в χk переменную (а для замкнутых формул χk , не содержащих переменных, мы фиксиру-
ем отдельную переменную x0 и полагаем xk = x0 ). Выберем далее какую-нибудь последовательность
bnk присоединенных констант (из списка {bn }) так, чтобы выполнялись условия
1) для всякого k константа bnk не содержится в формулах {χ1 , ..., χn },
2) для всякого k константа bnk не содержится в списке констант {bn1 , ..., bnk−1 }.
Для всякого k определим формулу
Sk : ¬∀xk χk ⇒ ¬χk x . (2.3.189)
k =bnk
Пусть Tk — теория, получающаяся из T присоединением формул {S1 , ..., Sk } в качестве новых ак-
сиом. Индукцией по k покажем, что все теории Tk непротиворечивы.
Непротиворечивость T0 уже установлена. Предположим, мы установили непротиворечивость
Tk−1 для некоторого k > 1. Если теория Tk противоречива, то в ней выводима любая формула, в
частности,
⊢Tk ¬Sk . (2.3.190)
Теория Tk получается из теории Tk−1 добавлением аксиомы Sk . Поэтому выводимость секвенции
(2.3.190) (в Tk ) означает выводимость секвенции (в Tk−1 )
Sk ⊢Tk−1 ¬Sk . (2.3.191)
Подклеив ее вывод к вершине дерева
Sk ⊢Tk−1 ¬Sk
(LK-5*)
⊢Tk−1 ¬Sk , ¬Sk
(LK-2*)
⊢Tk−1 ¬Sk
мы получаем, что в Tk−1 выводима секвенция
⊢ ¬Sk . (2.3.192)
то есть секвенция
⊢ ¬ ¬∀xk χk ⇒ ¬χk x . (2.3.193)
k =bnk
Теперь в дереве
⊢ ¬ ¬∀xk χk ⇒ ¬χk x ¬ ¬∀xk χk ⇒ ¬χk x ⊢ ¬∀xk χk & ¬ ¬χk x
k =bnk k =bnk k =bnk
(LK-4*)
⊢ ¬∀xk χk & ¬ ¬χk x
k =bnk
(LK-4*)
⊢ ¬∀xk χk & χk x
k =bnk
§ 3. Выразимость средствами теории множеств и семантизация 163
левая вершина выводима, потому что это секвенция (2.3.193), а правая — потому что это частный
случай выведенной ранее секвенции (0.2.44). И мы теперь получаем, что в Tk−1 выводима секвенция
⊢ ¬∀xk χk & χk x =b . (2.3.194)
k nk
Рассмотрим теперь какой-нибудь вывод G в Tk−1 секвенции (2.3.196). Если в этом выводе G
заменить константу bnk на какую-то новую переменную y, не входящую ни в вывод G, ни в формулу
χk , то мы получим вывод в Tk−1 секвенции
⊢ χk x =y (2.3.197)
k
A. Пусть ϕ имеет вид ¬ψ для некоторой формулы ψ в J. Из того, что ϕ замкнута, следует, что
ψ тоже замкнута. Покажем, что ϕ истинна в M тогда и только тогда, когда она выводима
в J:
— Если формула ϕ = ¬ψ истинна в M , то есть
∀ε ∈ M@A True(M, ϕ, ε) = True(M, ¬ψ, ε) = 1
то
∀ε ∈ M@A True(M, ψ, ε) = 1 − True(M, ¬ψ, ε) = 0,
и, как следствие, формула ψ ложна в M . Поскольку ψ замкнута и является
собственной подформулой в ϕ, по предположению индукции, ψ не выводима в
J. Поскольку J полна, формула ¬ψ = ϕ наоборот, должна быть выводима в J.
— Наоборот, если формула ϕ = ¬ψ ложна в M , то есть
∃ε ∈ M@A True(M, ϕ, ε) = True(M, ¬ψ, ε) = 0
то
∃ε ∈ M@A True(M, ψ, ε) = 1 − True(M, ¬ψ, ε) = 1,
и, поскольку формула ψ замкнута, и значит, значения True(M, ψ, ε) не зависят
от оценки ε, мы получаем
∀ε ∈ M@A True(M, ψ, ε) = 1,
то есть формула ψ истинна в M . Поскольку ψ замкнута и является собственной
подформулой в ϕ, по предположению индукции, ψ выводима в J. Поскольку J
непротиворечива, формула ¬ψ = ϕ не выводима в J.
B. Пусть ϕ имеет вид χ ⇒ ψ для некоторых формул χ и ψ в J. Опять из того, что ϕ замкнута,
следует, что χ и ψ тоже замкнуты. Покажем, что ϕ ложна в M тогда и только тогда, когда
ϕ невыводима в J.
— Если ϕ ложна в M , то χ истинна в M , а ψ ложна в M . Значит, по предположению
индукции, χ выводима в J, а ψ не выводима в J. Поскольку J полна, второе
означает, что ¬ψ выводима в J, и мы получаем:
⊢J χ, ⊢J ¬ψ.
Отсюда следует, что
⊢J χ & ¬ψ
то есть, в силу эквивалентности (2.1.56),
⊢J ¬(χ ⇒ ψ)
Иными словами, в J выводима формула ¬ϕ = ¬(χ ⇒ ψ). Поскольку J непроти-
воречива, формула ϕ не может быть выводима в J.
— Наоборот, если ϕ не выводима в J, то, поскольку J полна, формула ¬ϕ = ¬(χ ⇒
ψ) выводима в J. Значит, выводима и эквивалентная ей в силу (2.1.56) формула
χ & ¬ψ, и поэтому выводимы формулы χ и ¬ψ. Поскольку они замкнуты и
являются подформулами в ϕ, по предположению индукции, χ и ¬ψ истинны в
M . Иными словами, χ истинна в M , а ψ ложна в M . Значит, ϕ ложна в M .
C. Пусть ϕ имеет вид ∀x ψ для некоторой формулы ψ в J. Поскольку формула ϕ замкнута,
формула ψ должна иметь не более одной свободной переменной. Значит, она представля-
ет собой одну из формул списка {χk ; k > 1}, составленного нами в пункте 2, когда мы
нумеровали такие формулы:
ψ = χk
для некоторого k > 1. Нам далее нужно рассмотреть два случая.
— Возможен вариант, когда переменная x не входит в χk свободно. Тогда для того,
чтобы ϕ была замкнутой формулой, нужно, чтобы χk тоже была замкнутой
формулой. В этом случае мы получаем такую цепочку равносильностей в MK:
ϕ истинна в M ⇔ χk истинна в M ⇔ ⊢ J χk ⇔ ⊢J ϕ.
§ 3. Выразимость средствами теории множеств и семантизация 165
А в обратную — цепочкой
Теорема Гильберта—Бернайса.
Теорема 2.3.14. Пусть T — алгебраическая теория в MK. Для всякой формулы ϕ в теории T
следующие условия эквивалентны:
(i) ϕ выводима в алгебраической теории T ;
(ii) ϕ истинна в алгебраической теории T :
Заметим теперь, что M будет моделью не только для теории T + ¬ϕ, но и для теории T (которая
отличается от T + ¬ϕ только тем, что в ней нет аксиомы ¬ϕ). При этом, из условия (2.3.200) следует
условие
∃ε ∈ M@A TrueT (M, ϕ, ε) 6= 1 (2.3.201)
(в этот момент мы используем предположение о непротиворечивости MK), поэтому формула ϕ не
может быть истинной формулой в модели M алгебраической теории T . Значит, ϕ не может быть
истинной формулой для алгебраической теории T .
AxS ⊆ FormL .
Возникающую пару (L, AxS ) ничто не мешает рассматривать как алгебраическую теорию (в том
смысле, в котором этот термин был определен на с.156). Эту теорию мы будем называть алгебраи-
ческой кодировкой формальной теории S и обозначать
S † = (L, AxS ).
При этом правило † можно доопределить на наборы формул, секвенции и деревья Генцена. Мы
получим, что
— для каждой формулы ϕ формальной теории S определена формула ϕ† алгебраической
теории S † ,
— каждому набору формул Γ формальной теории S поставлен в соответствие набор формул
Γ † алгебраической теории S † ,
— каждой секвенции Γ ⊢ ∆ формальной теории S поставлена в соответствие неая секвенция
(Γ ⊢ ∆)† алгебраической теории S † ,
— каждому дереву Генцена R формальной теории S поставлено в соответствие некое дерево
Генцена R† алгебраической теории S † .
! 2.3.15. На всякий случай полезно заметить, что не любая алгебраическая теория в MK является
алгебраической кодировкой некоторой формальной теории S, даже если ее язык состоит из под-
множеств в N, например, потому что в нашем определении формальной теории сигнатура теории S
§ 3. Выразимость средствами теории множеств и семантизация 167
должна быть конечна, а в определении алгебраической теории этого требования нет, там она может
быть бесконечна.
Заметим теперь, что после того, как мы это проделали, для всякой формулы ϕ в исходной теории
S у нас возникает три способа понимать ее выводимость:
1) прежде всего, формула ϕ может быть выводима в самой формальной теории S,
2) кроме того, ее алгебраизация ϕ† может быть выводима в алгебраической теории S † ,
3) наконец, соответствующий предикат PrMK (pϕq) может быть выводим в теории MK.
Очень важный момент в этих рассмотрениях состоит в том, что (независимо от предположе-
ний о теории MK) при подходящем выборе алгоритма кодировки последние два вида выводимости
эквивалентны: если, например, кодировка выбрана такой, как описывается на с.141, то выводи-
мость формулы ϕ† в алгебраической теории S † эквивалентна выводимости формулы PrMK (pϕq) в
теории MK. Это так, потому что существование вывода для ϕ† в S † и существование аргумента y
для которого выводима формула Prf MK (y, pϕq) описывается формулами одной и той же теории MK,
эквивалентность которых доказывается по индукции.
Однако эквивалентность первого вида выводимости последним двум неочевидна: выше в при-
мере 2.1.59 мы уже описывали результат Гудстейна, согласно которому формула ϕ в теории PA,
перевод которой в MK выводим, не обязана быть выводимой в PA. Так же как и в той ситуации, мы
не можем заключить автоматически, что формула ϕ выводима в S, если ее алгебраизация ϕ† выво-
дима в S † , или предикат PrMK (pϕq) выводим в MK. Следующая теорема показывает, что для этого
нужно использовать сложную технику, разработанную в § 2, с дополнительным предположением об
ω-непротиворечивости теории MK.
Теорема 2.3.16 (о выводимости в кодировке). Пусть формальная теория S закодирована в MK с
универсумом N по алгоритму, описанному на с.141. Тогда в предположении ω-непротиворечивости
MK для формулы ϕ в S следующие условия эквивалентны:
(i) формула ϕ выводима в формальной теории S,
(ii) формула ϕ† выводима в алгебраической теории S † .
(iii) формула PrMK (pϕq) выводима в теории MK.
Доказательство. 1. (i) ⇒ (ii): если формула ϕ выводима в формальной теории S, то это значит,
что существует некое дерево Генцена G, являющееся выводом для ϕ. Этому дереву Генцена G
соответствует некий граф G† в алгебраической теории S † , и, поскольку определение вывода в S и
в S † описываются одинаковыми правилами, граф G† будет выводом для формулы ϕ† в S † . То есть
формула ϕ† выводима в алгебраической теории S † .
2. (ii) ⇒ (iii): если формула ϕ† выводима в алгебраической теории S † , то мы уже отмечали, что
формула PrMK (pϕq) выводима в теории MK.
3. (ii) ⇒ (iii): если PrMK (pϕq) выводима в MK, то в предположении ω-непротиворечивости теории
MK мы оказываемся в ситуации, описанную в теореме 2.2.13: из выводимости PrMK (pϕq) в MK
следует формула ϕ выводима в S.
Эта установка — сводить все теории к семан- циальное расширение рабочей теории множеств,
тическим — настолько естественна для матема- а вопрос, нельзя ли ее представить как семанти-
тиков, что подавляющее большинство из них о зацию какой-то формальной теории, обычно во-
формальных теориях не задумывается. Считает- обще не возникает. Это оправдывается тем, что
ся, что теорию достаточно описать как дефини- такое представление очень часто, почти всегда
бывает чрезвычайно громоздким, а иногда и во- Это очень важная теория в тех частях матема-
все невозможным. Вот некоторые примеры та- тики, которые каким-то образом связаны с ана-
ких “трудноупрощаемых” и “неупрощаемых” се- лизом, но она, по-видимому, не представима как
мантических теорий. семантизация какой-то формальной теории.
⋄ 2.3.20. Общая топология. Топологическим про-
Это был пример, апеллирующий к общемате-
странством называется всякая пара (M, τ ), в ко-
матической эрудиции, а вот еще несколько при-
торой M — множество, а τ — система подмно-
меров теорий, описываемых в самом нашем учеб-
жеств в M , то есть множество
нике.
τ ⊆ 2M ,
⋄ 2.3.21. Теория вещественных чисел, как семан-
такое, что выполняются следующие условия, на- тическая теория, описывается на с.187.
зываемые аксиомами общей топологии:
∅ ∈ τ, (2.3.204) ⋄ 2.3.22. Теория векторных пространств, как се-
мантическая теория, описывается на с.738.
M ∈ τ, (2.3.205)
U, V ∈ τ ⇒ U ∩ V ∈ τ, (2.3.206) ⋄ 2.3.23. Теория евклидовых пространств, как се-
U ⊆τ ⇒ ∪U ∈τ (2.3.207) мантическая теория, описывается на с.822.
Класс таких объектов образует семантическую ⋄ 2.3.24. Теория инвариантной меры, как семан-
теорию в MK, называемую общая топология. тическая теория, описывается на с.971.
Аксиоматизации физических теорий. Вопрос о том, можно ли считать данную теорию фор-
мальной (или семантической, что, как мы теперь понимаем, эквивалентно), полезно обсуждать не
только в математике, но также и (по крайней мере) в тех науках, которые используют математику,
но формально не являются ее частью. Это приводит к любопытным и совсем неочевидным (по край-
ней мере, для неспециалиста по логике) выводам. Разговор об этом удобно начать с упоминания о
шестой проблеме Гильберта.
В 1900 году на II Математическом конгрессе Давид Гильберт предложил некий список перво-
очередных задач математики (так, как он их понимал), и среди них, между прочим, была такая:
аксиоматизировать физику.
Утверждается, что в момент своего выступления Гильберт сформулировал это как одну из 10 задач.
Позже он этот список расширил до 23-х, и в нем эта проблема получила номер 6. С тех пор она
называется 6-й проблемой Гильберта.
Во времена, когда она была поставлена, математическая логика еще не оформилась в строгую
дисциплину, и, в частности, что следует понимать под аксиоматизацией, еще не было толком понят-
но. Очевидно, по этой причине до сих пор не существует единого мнения о том, насколько далеко
продвинулись математики в решении этой задачи. Мнения сходятся только в том, что даже при
самом нетребовательном понимании аксиоматизации, которое можно встретить среди далеких от
логики математиков (и, в большей мере, физиков), эту проблему нельзя считать решенной (хотя
бы потому что “единой физической теории” пока не построено).
В свете того, что мы уже знаем про аксиоматические теории, задачу, поставленную Гильбер-
том, можно понимать либо как предписание построить формальную теорию (другими словами,
теорию 1 порядка), описывающую законы физики, и на уровне определений не связанную с теори-
ей множеств. Либо как семантическую теорию, то есть дефинициальное расширение какой-нибудь
рабочей теории множеств, например, теории MK. По теореме о семантизации 2.3.18 эти два решения
будут эквивалентны. С другой стороны, как показывают примеры на с.169, второе из них ближе к
традиции, и может считаться более удобным.
Как мы уже говорили, общей для всей физи- ские теории. Следующие примеры дают некото-
ки теории построить не удалось. Однако неко- рое представление о прогрессе в этой области.
торые конкретные области этой науки можно
⋄ 2.3.25. Классическая механика может считать-
считать аксиоматизированными, и именно в том
ся в настоящее время аксиоматизированной, по-
смысле, что они описаны ныне как семантиче-
скольку ее удалось описать как семантическую
48 См.: В.И.Арнольд. Математические методы классической механики. М.: Наука, 1974.
170 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
Русский перевод: А. Н. Колмогоров. Основные понятия теории вероятностей. — М.: Наука, 1974.
§ 4. Другие логические системы 171
ϕ ⇒ (χ ⇒ ϕ) (CQC-1)
(ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (CQC-2)
(ϕ & χ) ⇒ ϕ (CQC-3)
(ϕ & χ) ⇒ χ (CQC-4)
ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (CQC-5)
ϕ ⇒ (ϕ ∨ χ) (CQC-6)
χ ⇒ (ϕ ∨ χ) (CQC-7)
(ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (CQC-8)
(¬ϕ) ⇒ (ϕ ⇒ χ) (CQC-9)
(ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (CQC-10)
ϕ ∨ (¬ϕ) (CQC-11)
Исчисление Кетонена G3c. Еще одна аксиоматизация логики предикатов, так называемое ис-
числение G3c финского математика Оива Кетонена, была придумана как модификация генценов-
ской системы LK. В языке этой системы добавляются два символа: символ ⊥, означающий “абстракт-
ную ложь”, и символ ⊤, означающий “абстрактную истину”. Кроме того, отрицание ¬α понимается
как сокращение для формулы α ⇒ ⊥. Еще один важный момент — что наборы формул в секвенци-
ях здесь понимаются не как строки, а как “мультимножества”. Это означает, что в наборе формул
можно как угодно переставлять формулы (отделенные друг от друга запятыми), и при этом счита-
ется, что набор не меняется. Отсюда, в частности, следует, что генценовские правила перестановки
(LK-3*) в этой системе лишние.57
• Аксиомами исчисления G3c считаются следующие три вида секвенций:
Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (G3c-0)
• Правила вывода для исчисления G3c делятся на три группы. В первой группе перечисля-
ются бескванторные правила:
Γ, ϕ, χ ⊢ ∆ Γ ⊢ ϕ, ∆ Γ ⊢ χ, ∆
(G3c-1)
Γ, ϕ & χ ⊢ ∆ Γ ⊢ ϕ & χ, ∆
Γ, ϕ ⊢ ∆ Γ, χ ⊢ ∆ Γ ⊢ ϕ, χ, ∆
(G3c-2)
Γ, ϕ ∨ χ ⊢ ∆ Γ ⊢ ϕ ∨ χ, ∆
Γ ⊢ ϕ, ∆ Γ, χ ⊢ ∆ Γ, ϕ ⊢ χ, ∆
(G3c-3)
Γ, ϕ ⇒ χ ⊢ ∆ Γ ⊢ ϕ ⇒ χ, ∆
Во второй – правила с кванторами,
в которых x — произвольная переменная, τ — произ-
вольный терм, а подстановка ϕ корректна:
x=τ
Γ, ∀x ϕ, ϕ ⊢∆ Γ ⊢ ϕ , ∃x ϕ, ∆
x=τ x=τ
(G3c-4)
Γ, ∀x ϕ ⊢ ∆ Γ ⊢ ∃x ϕ, ∆
И в третьей – правила с кванторами, в которых на одну из переменных, y, накладывается
требование, что она не должна входить в формулы в нижних секвенциях, а подстановка
55 Для формулы (2.4.208) выводом может быть дерево
Здесь на вершинах ветвей находятся аксиомы (CQC-1) и (CQC-2), и при движении вниз входящие в них формулы
заменяются на формулы α или α ⇒ α, там указано как.
56 Для формулы (2.4.209) выводом может быть дерево
ϕ ⊢ ϕ. (LKp-0)
— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
(LKp-2)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
ϕ, χ, ψ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, χ, ψ
(LKp-3)
ϕ, ψ, χ, Γ ⊢ ∆ Γ ⊢ ∆, χ, ϕ, ψ
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
(LKp-4)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— пересечение сукцедентов:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
(LKp-5)
Γ ⊢ ∆, ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
(LKp-6)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— объединение в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
(LKp-7)
ϕ ∨ χ, Γ ⊢ ∆
— добавление в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
(LKp-8)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— объединение с импликацией:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
(LKp-9)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
(LKp-10)
Γ ⊢ ∆, ϕ ⇒ χ
ϕ ⇒ (χ ⇒ ϕ) (CQCp-1)
(ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (CQCp-2)
(ϕ & χ) ⇒ ϕ (CQCp-3)
(ϕ & χ) ⇒ χ (CQCp-4)
ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (CQCp-5)
ϕ ⇒ (ϕ ∨ χ) (CQCp-6)
χ ⇒ (ϕ ∨ χ) (CQCp-7)
(ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (CQCp-8)
(¬ϕ) ⇒ (ϕ ⇒ χ) (CQCp-9)
(ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (CQCp-10)
ϕ ∨ (¬ϕ) (CQCp-11)
Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (2.4.219)
что полученное дерево – не вывод, а исходная се- ⊲⊲ 2.4.12. Проверьте выводимость следующих
квенция невыводима. Приведем пример. формул в исчислении высказываний:
α,
f (α) = α
(на переменную α здесь нужно глядеть как на элемент множества {0, 1}),
2) для формулы
¬α
соответствующая функция истинности f : {0, 1} → {0, 1} обозначается тем же символом
¬ и определяется равенством
(
1, α = 0
f (α) = ¬α =
0, α = 1
3) для формулы
α&β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
& и определяется равенством
(
1, α = 1 и β = 1
f (α, β) = α & β =
0, иначе
4) для формулы
α∨β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
∨ и определяется равенством
(
0, α = 0 и β = 0
f (α, β) = α ∨ β =
1, иначе
§ 4. Другие логические системы 179
5) для формулы
α⇒β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇒ и определяется равенством
(
0, α = 1 и β = 0
f (α, β) = α ⇒ β =
1, иначе
6) для формулы
α⇔β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇔ и определяется равенством
(
1, (α = 1 и β = 1) или (α = 0 и β = 0)
f (α, β) = α ⇔ β = .
0, иначе
(α ∨ β) ⇒ γ (2.4.223) f (1, 0, 0) = (1 ∨ 0) ⇒ 0 = 1 ⇒ 0 = 0.
равну нулю на значениях α = 1, β = 0, γ = 0. По этому дереву можно сразу понять, при ка-
ких аргументах функция истинности для нашей
⋄ 2.4.16. Вспомним, что в примере 2.4.19 мы до- формулы
казали невыводимость формулы
f (α, β, γ) = (α ⇒ β) ⇒ (α ⇒ γ)
(α ⇒ β) ⇒ (α ⇒ γ)
будет обращаться в нуль: для этого надо рас-
Соответствующее дерево Генцена в G3cp выгля- смотреть вершину дерева, не являющуюся акси-
64 P.T.Johnstone, Notes on logic and set theory, 1987 (Proposition 3.7, Theorem 2.6).
180 Глава 2. МАТЕМАТИЧЕСКАЯ ЛОГИКА
ϕ ⊢ ϕ. (LJ-0*)
a. Структурные правила:
— ослабление:
Γ ⊢ω Γ ⊢
(LJ-1*)
ϕ, Γ ⊢ ω Γ ⊢ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ω
(LJ-2*)
ϕ, Γ ⊢ ω
— перестановка:
ϕ, χ, ψ, Γ ⊢ ω
(LJ-3*)
ϕ, ψ, χ, Γ ⊢ ω
— сечение:
Γ ⊢ ϕ ϕ, Π ⊢ ω
(LJ-4*)
Γ, Π ⊢ ω
Γ ⊢ϕ ϕ, Γ ⊢
(LJ-5*)
¬ ϕ, Γ ⊢ Γ ⊢ ¬ϕ
65 Читатель может заметить, что среди правил LJ отсутствуют сокращение справа и перестановка справа, поскольку
— конъюнкция в сукцеденте:
Γ ⊢ϕ Γ ⊢χ
(LJ-6*)
Γ ⊢ ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ω ϕ, Γ ⊢ ω
(LJ-7*)
ϕ &χ, Γ ⊢ ω χ &ϕ, Γ ⊢ ω
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ω χ, Γ ⊢ ω
(LJ-8*)
ϕ ∨ χ, Γ ⊢ ω
— добавление в сукцеденте:
Γ ⊢ϕ Γ ⊢ϕ
(LJ-9*)
Γ ⊢ ϕ∨χ Γ ⊢χ∨ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ϕ χ, Π ⊢ ω
(LJ-10*)
ϕ ⇒ χ, Γ, Π ⊢ ω
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ χ
(LJ-11*)
Γ ⊢ϕ⇒χ
— добавление квантора всеобщности в антецедент: если подстановка ϕx=τ кор-
ректна66 (здесь x — переменная, а τ – терм), то
ϕx=τ , Γ ⊢ ω
(LJ-12*)
∀x ϕ, Γ ⊢ ω
— добавление квантора всеобщности в сукцедент: если переменная y не входит
(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул Γ ,
ω, ∀x ϕ), то
Γ ⊢ ϕx=y
(LJ-13*)
Γ ⊢ ∀x ϕ
— добавление квантора существования в антецедент: если переменная y не входит
(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул
∃x ϕ, Γ , ω), то
ϕx=y , Γ ⊢ ω
(LJ-14*)
∃x ϕ, Γ ⊢ ω
— добавление квантора существования в сукцедент: если подстановка ϕx=τ кор-
ректна67 (здесь x — переменная, а τ – терм), то
Γ ⊢ ϕx=τ
(LJ-15*)
Γ ⊢ ∃x ϕ
ция не выводима (и это одна из причин, почему подклеить к нему сверху вывод секвенции
считается, что исчисление LJ формализует инту-
иционистскую логику). ⊢α
Во-первых, нужно заметить, что рассужде-
ние, использовавшееся в примере 0.2.30, здесь (а для этого нужно, чтобы такой вывод суще-
не проходит, потому что там сукцедент состо- ствовал), а второе точно так же можно превра-
ял из двух формул, а в LJ такое запрещено. А, тить в вывод, если подклеить к нему сверху вы-
во-вторых, среди правил вывода LJ-1—LJ-15 есть вод секвенции
только одно, содержащее логическую связку ∨ ⊢ ¬α
в сукцеденте, а именно, LJ-968 , и если с его по-
(и для этого тоже нужно, чтобы такой вывод су-
мощью пытаться достроить дерево вверх, то мы ществовал). Но если ни одна из этих секвенций
получим либо дерево не выводима (например, если формула α атомар-
⊢α на, и ни α, ни ¬α не входят в систему аксиом), то
(LJ-9*) (2.4.225) ни (2.4.225), ни (2.4.226) в вывод не превратишь.
⊢ α ∨ ¬α Это значит, что секвенция (2.4.224) не выво-
дима в LJ (по крайней мере) для атомарных фор-
либо дерево мул α, таких, что ни α, ни ¬α не входят в акси-
омы теории. Иными словами, если в теории над
⊢ ¬α
исчислением LJ существует хотя бы одна ато-
(LJ-9*) (2.4.226)
марная формула α, такая, что ни α, ни ¬α не
⊢ α ∨ ¬α
входят в систему ее аксиом, то в этой теории
Первое из них можно превратить в вывод, если секвенция (2.4.224) не выводима.
— объединение в антецеденте:
ϕ, Γ ⊢ ω χ, Γ ⊢ ω
(LJp-7)
ϕ ∨ χ, Γ ⊢ ω
— добавление в сукцеденте:
Γ ⊢ϕ Γ ⊢ϕ
(LJp-8)
Γ ⊢ ϕ∨χ Γ ⊢χ∨ϕ
— объединение с импликацией:
Γ ⊢ ϕ χ, Π ⊢ ω
(LJp-9)
ϕ ⇒ χ, Γ, Π ⊢ ω
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ χ
(LJp-10)
Γ ⊢ϕ⇒χ
В интерпретации Кетонена эта система приобретает следующий вид.
Интуиционистское исчисление высказываний G3ip:
• Аксиомами исчисления G3ip считаются следующие три вида секвенций:
Γ, ⊥ ⊢ ψ Γ, ϕ ⊢ ϕ Γ ⊢ ⊤. (G3ip-0)
ФУНКЦИИ ОДНОЙ
ВЕЩЕСТВЕННОЙ ПЕРЕМЕННОЙ
185
Глава 3
Понятие вещественного числа является естественным развитием идеи измерения по эталону, ухо-
дящей корнями в глубокую древность и опирающейся на следующие два фундаментальных допу-
щения.
1. Первое из них — возможность сравнивать с эталоном — заключается в том, что среди значений
физической величины можно выбирать эталонные, то есть такие, которыми можно (в целых
числах) оценивать все остальные значения этой величины. Например, имея эталон длины – метр
– можно длину x любого физического тела оценивать в метрах (то есть найти, сколько метров
в этой длине укладывается, а сколько – нет):
k 6 x < k + 1.
При этом важно, что организовать методы измерения можно так, чтобы результаты не зависели
от попыток.
2. Второе же — возможность измельчения эталона — предполагает, что любой эталон можно де-
лить на равные части (точнее, на произвольное фиксированное число равных частей), которые
также можно принимать за эталоны. Из этого принципа следует, что мы можем поделить наш
исходный эталон длины, скажем, на 10 равных частей, принять их длины за новые эталоны, и
после этого поглядеть, не войдут ли в оставшуюся часть длины x − k (куда уже не входит наш
исходный эталон) новые, меньшие эталоны:
l l+1
6x−k < .
10 10
Так мы получим уже оценку в десятых долях эталона (то есть можно будет сказать, сколько
десятых долей эталона укладывается в величине, которую мы измеряем):
l l+1
k+ 6x<k+
10 10
Поскольку (согласно второму допущению) измельчать эталон можно сколь угодно долго, мы
получаем, что физическую величину x можно оценивать сверху и снизу рациональными числами
(количеством долей эталона)
m m+1
6x< ,
n n
причем с любой точностью (то есть так, чтобы числа m m+1
n и n отличались друг от друга как угодно
мало). В этом состоит применяемый в естествознании алгоритм измерения физической величины по
эталону, и интерпретировать его удобнее всего, как приближение к некоему идеальному значению,
изначально имеющемуся у данной измеряемой величины x.
Разумеется, не всякая физическая величина допускает измерение по эталону так, как мы это
описали. Например, у векторных величин (таких, как скорость или сила) оценивать при измерении
необходимо не одну, а сразу несколько числовых характеристик (скажем, проекции данной величи-
ны на заранее выбранные координатные оси), а у целочисленных величин (таких, как количество
однотипных предметов в данном объеме пространства) допущение о делимости эталонов не будет
186
§ 1. Вещественные числа и числовые множества 187
справедливым. Более того, развитие физики показало, что даже для величин, измерение которых
традиционно организуется именно сравнением с эталоном (таких как длина, масса или объем), де-
ление эталона тоже не может быть бесконечным, потому что, когда Вы доходите до планковских
размеров, дальнейшее деление утрачивает смысл (то есть попросту становится непонятно, что зна-
чит делить дальше).
Тем не менее, вера в эти принципы (или, точнее сказать, невозможность на данном этапе разви-
тия науки заменить их чем-то более эффективным) приводит к тому, что физическая величина пред-
ставляется такой, что ее можно с любой точностью оценивать рациональными числами в эталонных
единицах измерения. Само по себе это еще не означает, что значения физической величины долж-
ны непременно описываться вещественными числами, какими их изображают в математическом
анализе (дело в том, что в математике имеются альтернативные теории, например, «нестандарт-
ный анализ», где числа описываются иначе). Но при некоторых дополнительных предположениях,
в частности, что величины могут быть отрицательными, и что в качестве эталона можно выбирать
любое ненулевое значение физической величины, математическая теория, формализующая идею
измерения по эталону, оказывается единственной, и ее аксиоматика выглядит следующим образом.
Аксиомы теории вещественных чисел. Под моделью вещественных чисел, понимается произ-
вольная шестерка3 (R, 0, 1, +, ·, 6), в которой R — некое множество, элементы которого называются
вещественными числами, 0 и 1 — его элементы, + и · — отображения R × R → R, называемые со-
ответственно сложением и умножением, а 6 — бинарное отношение, называемое порядком, такие
что выполняются следующие две группы требований I и II.
a+b=b+a (3.1.1)
(a + b) + c = a + (b + c) (3.1.2)
a·b=b·a (3.1.3)
(a · b) · c = a · (b · c) (3.1.4)
(a + b) · c = a · c + b · c (3.1.5)
a+0=a (3.1.6)
A7. Существование противоположного числа: для любого числа a существует такое чис-
ло −a (называемое противоположным числом к числу a) что
a + (−a) = 0 (3.1.7)
a·1=a (3.1.8)
A9. Существование обратного числа: для любого числа a 6= 0 существует такое число a−1
(называемое обратным числом к числу a), что
a · a−1 = 1 (3.1.9)
⋄ 3.1.1. Дедекиндовы сечения. Из теорем 1.1.24 построенного в главе 1, является моделью веще-
и 1.1.25 следует, что множество всех дедекиндо- ственных чисел. Из этого примера видно, что
вых сечений множества Q рациональных чисел, класс всех моделей вещественных чисел непуст.
Из аксиом A1 - A16 следуют все остальные свойства вещественных чисел (и, в частности, все
теоремы математического анализа).
Помимо отношения «меньше, либо равно» a 6 b на множестве вещественных чисел R вводятся
еще три отношения, а именно,
– «меньше» a < b, означающее, что a 6 b и одновременно a 6= b;
– «больше, либо равно» a > b означающее, что b 6 a;
– «больше» a > b, означающее, что b 6 a и одновременно b 6= a.
Из аксиомы линейности A13 следует, что множество вещественных чисел R удобно изображать
в виде прямой, а сами вещественные числа – в виде точек на ней. Именно так и делают математики:
−1 0 1
−0 = 0 (3.1.12) 0 · a = (0 + 0) · a = 0 · a + 0 · a
a + (−a) = 0 −1
a−1 =a (3.1.19)
⇓
(−a) + a = 0
⋄ 3.1.11. Справедливо тождество
⇓
a – противоположное число для −a
! (−a)−1 = −a−1 (3.1.20)
у −a не может
быть двух
⇓ противоположных
чисел
Доказательство.
a = −(−a)
3. Для (3.1.16) доказательство такое:
(−a−1 ) · (−a) = (3.1.17) = a−1 · a = 1
(A7)
⇓
в силу
1 + (−1) = 0 упражнения 3.1.9,
⇓ у −a не может
⇓ быть двух
обратных
чисел
(1 + (−1)) · a = 0 · a
⇓ (A5),(3.1.14)
1 · a + (−1) · a = 0
(−a)−1 = −a−1
⇓
a + (−1) · a = 0
⇓
(−1) · a – противоположное число для a
⇓
(−1) · a = −a ⊲ 3.1.12. Докажите следующие утверждения:
4. Докажем (3.1.17):
x<y =⇒ ∀a x+a<y+a (3.1.21)
(−a) · (−b) = (3.1.16) = ((−1) · a) · (−b) =
x · y = 0 =⇒ x = 0 ∨ y=0 (3.1.22)
= (A3) = (a · (−1)) · (−b) = (A4) =
x > 0 & y > 0 =⇒ x·y >0 (3.1.23)
= a · ((−1) · (−b)) = (3.1.16) =
x<0 & y<0 =⇒ x·y >0 (3.1.24)
= a · (−(−b)) = (3.1.15) = a · b
x<0 & y>0 =⇒ x·y <0 (3.1.25)
1>0 (3.1.26)
−1<0 (3.1.27)
⊲ 3.1.7. Докажите, по аналогии с примером
3.1.2, что единица 1, существование которой по- x<y =⇒ −x > −y (3.1.28)
стулируется в аксиоме A8, тоже единственна. −1
x>0 =⇒ x >0 (3.1.29)
−1
⊲ 3.1.8. Докажите равенство: x<0 =⇒ x <0 (3.1.30)
−1 −1
0<x<y =⇒ x >y (3.1.31)
1−1 = 1 (3.1.18) −1 −1
x<y<0 =⇒ x >y (3.1.32)
⊲ 3.1.9. По аналогии с примером 3.1.3 докажи- x<y & a>0 =⇒ a·x<a·y (3.1.33)
те, что для данного числа a 6= 0 обратное число x<y & a<0 =⇒ a·x>a·y (3.1.34)
a−1 (о котором идет речь в аксиоме A9), должно
a > 1 ⇐⇒ 0 < a < 1 (3.1.35)
быть единственно (то есть, не может существо-
вать двух чисел x и y со свойствами a · x = 1 и x > 0 & a > 1 =⇒ a · x > x (3.1.36)
a · y = 1). x>0 & 0<a<1 =⇒ a · x < x (3.1.37)
§ 1. Вещественные числа и числовые множества 191
Числа 2, ..., 10. Напомним, что обозначения 0, — здесь читателю предлагается самому дога-
1, 2, 3, 4, 5, 6, 7, 8, 9 были введены нами в тео- даться, какой должна быть подстановка, чтобы
рии MK в формулах (0.3.260)—(0.3.269). Сейчас можно было применить аксиому A2. Читатель
мы описываем теорию вещественных чисел, как теперь может самостоятельно расшифровать со-
дефинициальное расширение теории множеств, кращенную запись доказательства эквивалент-
для понимания которого такие детали как опре- ности определений числа 4:
деления (0.3.260)—(0.3.269) не нужны, и более то-
го, при желании читатель может вообще обхо- ((1 + 1) + 1) + 1 = (A2) = (1 + 1) + (1 + 1) =
диться наивным пониманием теории множеств. = (A2) = 1 + (1 + (1 + 1))
Поэтому помнить об определениях на с.49 не обя-
зательно, а если помнить, то то надо понимать, Что же касается числа 5, то нам теперь доста-
что определения тех же чисел от 0 до 9 в описы- точно сказать, что эквивалентность определений
ваемой теперь теории будет другим (и формаль- для него доказывается по аналогии.
но это будут другие объекты). Итак, одни и те же собственные обозначения
В частности, число 2 определяется равен- можно задавать формально по-разному, нуж-
ством но только следить, чтобы выписываемые тобой
2 := 1 + 1 (3.1.38) определения для одного и того же символа были
эквивалентны. Естественный (и самый распро-
Точно также, числа 3, 4, 5 можно определить ра-
страненный) способ вводить новые обозначения
венствами
– так называемый последовательный, в котором
3 := 1 + (1 + 1), при определении нового обозначения использу-
4 := 1 + (1 + (1 + 1)), (3.1.39) ются обозначения, введенные ранее. Например,
числа 3, 4, 5, 6, 7, 8, 9, 10 можно последователь-
5 := 1 + (1 + (1 + (1 + 1)))
но определить так:
Полезно заметить, что одно и то же число можно
3 := 2 + 1, 4 := 3 + 1,
определять по-разному. Например, 3, 4, 5 можно
иначе определить так: 5 := 4 + 1, 6 := 5 + 1,
7 := 6 + 1, 8 := 7 + 1,
3 := (1 + 1) + 1,
9 := 8 + 1, 10 := 9 + 1
4 := ((1 + 1) + 1) + 1, (3.1.40)
5 := (((1 + 1) + 1) + 1) + 1 Числа вида −a. Когда определены числа
1,...,10, их противоположные числа −1,...,−10
Строго говоря, это будут другие определения,
определять уже не нужно, поскольку они авто-
потому что записи в (3.1.39) и (3.1.40) не одина-
матически определяются аксиомой A7 о суще-
ковы (с точки зрения языка, последовательность
ствовании противоположного числа (дело в том,
символов 1 + (1 + 1) — совсем не то же самое, что
что, как мы отмечали в упражнении 3.1.3, из ак-
последовательность символов (1 + 1) + 1).
сиомы A7 и других аксиом следует, что противо-
Тем не менее, определения (3.1.39) и (3.1.40)
положное число определяется единственным об-
эквивалентны, потому что из аксиом A1 – A16
разом).
можно логическими средствами вывести, что
Вообще, всякий раз, когда мы дали собствен-
числа, определяемые формулами (3.1.39) — те
ное обозначение a какому-нибудь числу, аксиома
же самые, что числа, определяемые формулами
A7 определяет его противоположное число и да-
(3.1.40). Действительно, эквивалентность опре-
ет ему собственное обозначение −a.
делений для числа 3 получается подстановкой в
тождество из аксиомы A2 вместо a, b, c, символа
1: Числа вида a−1 . Точно также, всякий раз, ко-
гда мы даем собственное обозначение a какому-
нибудь числу (a 6= 0), аксиома A9 дает собствен-
(1 + 1) + 1 = (a + b) + c a = 1 = (A2) = ное обозначение обратному числу a−1 . В частно-
b=1 сти, обратные числа к 2, ..., 10 имеют собствен-
c=1
ные обозначения 2−1 ,...,10−1 .
= a + (b + c) a = 1 = 1 + (1 + 1)
Разность чисел определяется равенством
b=1
c=1
a − b := a + (−b) = (−b) + a.
(символ | означает подстановку, а фрагмент =
Можно заметить, например, что
(A2) = есть ссылка на аксиому A2, применяемую
в этот момент). Эту запись можно сократить так:
1 − 2 := 1 + (−2) = (3.1.16) = 1 + (−1) · 2 =
(1 + 1) + 1 = (A2) = 1 + (1 + 1) = (3.1.38) = 1 + (−1) · (1 + 1) = (A5) =
192 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
⋄ 3.1.15. Множества, определяемые явным (a, b] = x ∈ R : a<x6b
перечислением своих элементов. Это самый
[a, b) = x ∈ R : a6x<b
простой пример числовых множеств. Например,
запись (a, +∞) = x ∈ R : a<x
1 [a, +∞) = x ∈ R : a6x
−1; ; 3
2 (−∞, b) = x ∈ R : x<b
обозначает множество, состоящее из трех эле- (−∞, b] = x ∈ R : x6b
ментов: −1, 21 и 3.
Точнее, в этом списке множество (a, b) называ-
⋄ 3.1.16. Числовые множества, определяе- ется интервалом, [a, b] – отрезком, (a, b] – полу-
мые отношениями порядка. Отношения 6, < интервалом с замкнутым правым концом, [a, b)
, >, > определяют на прямой R множества, из- – полуинтервалом с замкнутым левым концом,
вестные как интервал, отрезок и полуинтервалы: (a, +∞) – открытым полуинтервалом с бесконеч-
ным правым концом, [a, +∞) – замкнутым полу-
(a, b) = x ∈ R : a < x < b интервалом с бесконечным правым концом, и так
[a, b] = x ∈ R : a 6 x 6 b далее.
X + a = {y ∈ R : ∃x ∈ X x + a = y}, (3.1.48)
X − a = {y ∈ R : ∃x ∈ X x − a = y} (3.1.49)
§ 1. Вещественные числа и числовые множества 193
a · X = X · a = {y ∈ R : ∃x ∈ X a · x = y}, (3.1.50)
— неравенство
a 6 X, (3.1.51)
означает, что любой элемент множества X не меньше числа a
∀x ∈ X a 6 x;
∀x ∈ X a < x, ∀x ∈ X x 6 a, ∀x ∈ X x<a
X + Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x + y = z} (3.1.52)
X − Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x − y = z} (3.1.53)
X · Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x · y = z} (3.1.54)
X x
= z ∈ R : ∃x ∈ X ∃y ∈ Y =z (3.1.55)
Y y
— неравенство
X 6Y
по определению означает, что любой элемент множества X не превосходит лю-
бого элемента множества Y :
∀x ∈ X ∀y ∈ Y x6y
а неравенство
X <Y
– что любой элемент множества X меньше любого элемента множества Y :
∀x ∈ X ∀y ∈ Y x<y
2.
3.
запись
inf X > −∞
принято использовать в случаях, когда нужно коротко дать понять, что множе-
ство X ограничено снизу.
• Точной верхней гранью (или точной верхней границей) sup X числового множества X
называется
— символ +∞, если X не ограничено сверху; опять же в этом случае точная ниж-
няя грань не является числом: запись
sup X = +∞
запись
sup X < +∞
принято использовать в случаях, когда множество X ограничено сверху.
§ 1. Вещественные числа и числовые множества 197
⋄ 3.1.27. Пусть X = (a, b) — интервал на веще- наибольшее из всех таких чисел, то есть число
ственной прямой R. A = a будет точной нижней гранью множества
X. Таким образом,
inf(a, b) = a sup(a, b) = b
a b
Точно так же для отрезка и полуинтервалов
Легко видеть, что любое число t > b ограничи-
вает множество X сверху. А наименьшее из всех inf[a, b] = inf(a, b] = inf[a, b) = a
таких чисел, то есть число B = b будет точной
верхней гранью множества X. С другой сторо-
ны, любое число s 6 a ограничивает X снизу. А sup[a, b] = sup(a, b] = sup[a, b) = b
Теорема 3.1.29 (о точной границе). Если X – непустое ограниченное снизу множество, то оно
имеет точную нижнюю грань. Аналогично, если X – непустое ограниченное сверху множество,
то оно имеет точную верхнюю грань.
Доказательство. Рассмотрим случай, когда X – непустое ограниченное сверху множество (слу-
чай, когда X ограничено снизу рассматривается аналогично). Обозначим буквой Y множество всех
чисел, ограничивающих X сверху:
Y = {y ∈ R : X 6 y} = {y ∈ R : ∀x ∈ X x 6 y}
(поскольку X ограничено сверху, хотя бы одно такое число y существует, и значит, Y – непустое
множество). Тогда
∀x ∈ X ∀y ∈ Y x 6 y
и по аксиоме непрерывности вещественной прямой A16, найдется такое число c, что
∀x ∈ X ∀y ∈ Y x6c6y
Первое неравенство здесь означает, что c ограничивает X сверху, то есть, что c ∈ Y . А второе – что
c есть наименьшее число, лежащее в Y . То есть c = min Y = min{y ∈ R : X 6 y} = sup X.
Доказательство. Здесь мы также докажем только первую половину каждого утверждения (пред-
ложив читателю самостоятельно по аналогии доказать вторую).
1. В первом случае получаем цепочку:
X⊆Y
198 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
⇓
∀c ∈ R c6Y =⇒ c 6 X
⇓
{c ∈ R : c 6 Y } ⊆ {c ∈ R : c 6 X}
⇓ (свойство 1◦ на с. 194 )
inf Y = max{c ∈ R : c 6 Y } 6 max{c ∈ R : c 6 X} = inf X
2. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : c 6 X + a}
Тогда получаем цепочку
3. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : −X 6 c}
Тогда получаем цепочку
c∈C ⇐⇒ −X 6 c ⇐⇒ −c 6 X ⇐⇒ −c ∈ B ⇐⇒ c ∈ −B
⇓
−B = C
⇓
− inf X = − max B =(свойство 3◦ на с. 194) = min − B = min C = sup(−X)
0∈X
∀x ∈ X x+1∈X
§ 2. Натуральные, целые и рациональные числа 199
Иными словами,
Тогда мы получим:
1) 0 ∈ N, потому что 0 лежит в любом индуктивном множестве X, и
2) если x ∈ N, то есть x ∈ X для всякого индуктивного множества X, то x+1 ∈ X (поскольку
X индуктивно); значит, x + 1 ∈ X для всякого индуктивного множества X, поэтому
x + 1 ∈ N.
Таким образом, N – индуктивное множество, то есть оно удовлетворяет условию (i). С другой
стороны, N содержится в любом множестве X, то есть, в любом другом индуктивном множестве.
Значит, N удовлетворяет условию (ii) на с.199.
2. Мы поняли, что множество N со свойствами (i) и (ii) существует. Теперь покажем, что такое
множество N единственно. Действительно, если бы нам было дано какое-то другое множество N e с
теми же свойствами, то мы получили бы, что, во-первых,
e
N⊆N
e и, во-вторых,
(потому что N содержится в любом индуктивном множестве, в частности, в N),
e ⊆N
N
e содержится в любом индуктивном множестве, в частности, в N). Вместе это означает,
(потому что N
что
e
N = N.
(a) 0∈E
(b) ∀n ∈ E n+1∈E
Тогда E = N.
Доказательство. С одной стороны, нам дано, что E ⊆ N. С другой же стороны, свойства (a), (b)
означают, что E является индуктивным множеством. Поэтому, в силу условия (ii) определения 3.2,
N содержится в E: N ⊆ E. Итак,
E⊆N & N⊆E
то есть, E = N.
На практике удобно пользоваться следующей переформулировкой принципа математической
индукции.
Теорема 3.2.3 (принцип математической индукции). Пусть дана последовательность утвержде-
ний
Φn n∈N (3.2.74)
со следующими свойствами:
(a′ ) первое утверждение Φ0 истинно;
(b′ ) если при каком-нибудь n ∈ N истинно утверждение Φn , то истинно и утверждение
Φn+1 .
Тогда все утверждения Φn истинны (для всех n ∈ N).
Доказательство. Обозначим через E множество всех таких чисел n ∈ N, для которых утверждение
Φn истинно. Тогда условие (a′ ) будет эквивалентно условию (a) теоремы 3.2.2, а условие (b′ ) будет
эквивалентно условию (b). Значит, E = N, то есть Φn истинно для каждого n ∈ N.
m+k ∈N
m + (k + 1) = (m + k) + 1 ∈ N
E = {n ∈ N : m · n ∈ N}
Нам нужно убедиться, что E = N. Это тоже делается индукцией. Сначала замечаем, что 0 ∈ E,
потому что из m ∈ N следует m · 0 = (3.1.14) = 0 ∈ N. Затем берем какое-нибудь k ∈ E, то есть
m·k ∈N
и замечаем, что тогда k + 1 ∈ E, потому что из только что доказанной замкнутости N относительно
сложения следует
m · k ∈ N =⇒ m · (k + 1) = (m · k) + m ∈ N
Снова по принципу индукции E = N.
Ниже нам понадобятся еще несколько утверждений об N.
§ 2. Натуральные, целые и рациональные числа 201
{m, ..., n} := {k ∈ N : m 6 k 6 n}
min N = 0 (3.2.75)
2◦ . Если n ∈ N и n 6= 0, то n − 1 ∈ N.
3◦ . Для любого n ∈ N множество чисел x ∈ N, больших n − 1, имеет наименьший элемент,
а именно n:
min{x ∈ N : n − 1 < x} = n (3.2.76)
4◦ . Каждое непустое подмножество M ⊆ N обладает минимальным элементом.
5◦ . Для любых m, n ∈ N справедливы импликации:
E = {0} ∪ (N + 1) = {x ∈ R : x=0 ∨ ∃n ∈ N x = n + 1}
Xn+1 = X +1 (3.2.80)
| {z } | n{z }
k k
{y ∈ N : n < y} {y ∈ R : ∃x ∈ Xn y = x + 1}
202 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
=⇒ ∃x ∈ N y =x+1&n−1<x =⇒ ∃x ∈ Xn y =x+1 =⇒ y ∈ Xn + 1
Теперь доказываем (3.2.76) по индукции. Во-первых, убеждаемся, что эта формула верна при
n = 1. Действительно,
1◦
x∈N =⇒ x>1>0 =⇒ x ∈ X1
| {z }
⇓
N ⊆ X1
⇓
X1 = N
⇓
min X1 = min N = 1
Далее предполагаем, что (3.2.76) верна при n = m:
min Xm = m (3.2.81)
1∈E
Действительно, если бы это было не так, то есть при любом n ∈ E мы получали бы, что из {1, ..., n} ⊆
E следует n + 1 ∈ E, то это означало бы, что E = N, то есть M = ∅.
Теперь, возвращаясь от E к M , условие (3.2.82) можно переформулировать так:
E = {0, ..., m} ∪ (N + m + 1)
Нам нужно убедиться, что min M = n+1: тогда получится, что {0, ..., n}∩M = ∅, то есть {0, ..., n} ⊆
I и значит I = {0, ..., n}.
Предположим, что это не так: min M 6= n + 1. Тогда min M < n + 1, и по свойству 5◦ min M 6 n.
/ M , и значит min M > 0, то есть по свойству 5◦ ,
С другой стороны, в силу (a), 0 ∈ I, поэтому 0 ∈
min M − 1 > 0, и
1 6 min M 6 n
Если теперь положить k = min M − 1, то получается вот что:
(b)
06k<n & k∈
/M =⇒ k∈I & k<n =⇒ {z ∈ I}
k + 1 = |min M
↑
невозможно,
потому что
M ∩I = ∅
M = {x ∈ N : x∈
/ E}
m = min M
n=m−1∈N
Тогда, во-первых, n ∈
/ M (потому что иначе число m = n + 1 не было бы минимумом для M ), и
значит n ∈ E, откуда в силу (b),
{0, ..., n} ⊆ E (3.2.83)
А, во-вторых, для x ∈ N справедлива импликация
x>n =⇒ x∈
/ E, (3.2.84)
n<x x∈E
⇓
(3.2.78) ⇓ (b)
m=n+16x {0, ..., x} ⊆ E
| {z }
⇓
m∈E
а это невозможно, поскольку m ∈ M . Утверждения (3.2.83) и (3.2.84) вместе означают, что {0, ..., n} =
E.
204 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
I = {k = 1, ..., n : ∀i 6 k x′i = xi }
⇓
k<n & ∀i 6 k x′i = xi
5И чтобы не доказывать изоморфизм между N, определенным в этой главе, и N из главы 0.
6 Напомним, что понятие бесконечной последовательности было определено на с.73.
§ 2. Натуральные, целые и рациональные числа 205
k+1∈I
Отсюда, по принципу конечной индукции (свойство 7◦ на с.201), I = {0, ..., n}, то есть, в частности,
x′n = xn .
Вторая теорема бывает нужна, когда нет гарантии, что определяемая тобой последовательность
будет бесконечной7 :
Теорема 3.2.6 (об определениях частной индукцией на N). Пусть X — произвольное множе-
ство (необязательно числовое) и дано отображение G, которое некоторым конечным последо-
вательностям элементов x0 , ..., xn ∈ X, n ∈ N, ставит в соответствие определенные элементы
G(x0 , ..., xn ) ∈ X. Тогда для всякого начального элемента x0 ∈ X это правило однозначно опре-
деляет (конечную или бесконечную) последовательность {xn } ⊆ X, содержащую x0 в качестве
первого элемента и удовлетворяющую условию
(если величина N конечна, то она представляет собой длину последовательности {xn }).
Доказательство. Здесь, как и в предыдущей теореме, можно считать, что X непусто, потому что
если оно пусто, то утверждение справедливо автоматически.
Зафиксируем x0 ∈ X и обозначим через E подмножество в N, от которого берется верхняя грань
в формуле (3.2.88)
N = sup E,
то есть состоящее из таких n ∈ N, для которых существует конечная последовательность x0 , ..., xn ∈
X (первым элементом которой является тот самый зафиксированный нами элемент x0 ) со следую-
щим свойством:
∀k = 1, ..., n G(x0 , ..., xk−1 ) = xk (3.2.89)
Это множество E будет удовлетворять условиям (a) и (b) свойства 8◦ на с.201:
(a) 0 ∈ E (потому что для n = 0 нужная последовательность должна состоять только из
одного элемента, и таким элементом будет x0 , а утверждение (3.2.89) будет выполняться
автоматически, потому что элементов x1 , ..., xn ∈ X нет), и
(b) ∀n ∈ E {0, ..., n} ⊆ E (потому что если n ∈ E, то есть существуют x0 , ..., xn ∈ X со
свойством (3.2.89), то для всякого k 6 n последовательность x0 , ..., xk будет обладать
теми же свойствами, только с заменой k на какое-нибудь i, а после этого n на k).
По свойству 8◦ на с.201 отсюда следует, что либо E = N, либо E = {0, ..., N } для некоторого N ∈
N. В обоих случаях мы получаем, что каждому n ∈ E можно поставить в соответствие некоторый
элемент xn по такому правилу: выбираем какую-нибудь конечную последовательность {x0 , ..., xn }
(c x0 фиксированным выше), подчиненную условию (3.2.86) (такая последовательность существует
поскольку n ∈ E), и в качестве xn берем ее последний элемент. Здесь нужно только убедиться, что
элемент xn определяется таким алгоритмом однозначно. Это делается в точности так же, как при
доказательстве теоремы 3.2.5.
7 Понятие конечной последовательности было определено на с.73.
206 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
N∗ := N \ {0} (3.2.90)
(если величина N конечна, то она представляет собой длину последовательности {xn }).
§ 2. Натуральные, целые и рациональные числа 207
an = |a · a {z
· ... · a} — если число n нечетно, то есть имеет вид
n множителей
n = 2m − 1, m ∈ N∗ , то
Теорема 3.2.5 позволяет придать точный 1!! = 1, (2m + 1)!! = (2m + 1) · (2m − 1)!! (3.2.100)
смысл этим словам: чтобы определить an для
Pn
любого n ∈ N, нужно зафиксировать число a ∈ R Индуктивная сумма
Qn k=0 ak и индуктив-
и рассмотреть отображение G, которое любой по- ное произведение k=0 ak элементов после-
следовательности (x0 , ..., xn ) чисел из R ставит в довательности {an } определяются индуктивны-
соответствие число ми правилами так:
!
G(x0 , ..., xn ) = a · xn . X 0 n+1
X X n
ak = a0 , ak = ak + an+1
Применив к этому отображению теорему 3.2.5, k=0 k=0 k=0
мы для начального значения (3.2.101)
0 n+1 n
!
x0 = 1 Y Y Y
ak = a0 , ak = ak · an+1
получим последовательность со свойствами k=0 k=0 k=0
(3.2.102)
x0 = 1, xn+1 = a · xn , n ∈ N. – здесь (последовательность {an } считается за-
ранее фиксированной, и) в первом случае отоб-
Если обозначить ражение G определяется формулой
an = xn , G(x0 , ..., xn ) = xn + an+1 ,
то эти свойства переписываются в виде
а во втором — формулой
0
a =1 (3.2.95)
G(x0 , ..., xn ) = xn · an+1 ;
n
X n
X m−1
X
Факториал n! и двойной факториал n!!.
ak = ak − ak
• Факториал числа n ∈ N определяется по ин- k=m k=0 k=0
дукции следующим правилом:
n
Y n
Y . m−1
Y
0! = 1, (n + 1)! = (n + 1) · n! (3.2.98) ak = ak ak (если ak 6= 0).
k=m k=0 k=0
– здесь отображение G определяется форму-
⊲⊲ 3.2.13. Найдите формулы для последователь-
лой
ностей, определяемых следующими отображени-
G(x0 , ..., xn ) = (n + 1) · xn ,
ями:
а начальным значением последовательности
1) G(x0 , ..., xn ) = a + xn , x0 = 0. (Ответ: xn =
xn будет единица:
a · n.)
xn a
x0 = 1. 2) G(x0 , ..., xn ) = n+1 , x0 = a. (Ответ: xn = n! .)
208 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
(
1
3) G(x0 , ..., xn ) = xn , x0 = a, a 6= 0. (Ответ: a, n ∈ 2N
n xn = .)
xn = a(−1) .) 1, n ∈ 2N + 1
x0
4) G(x0 , ..., xn ) = xn , x0 = a, a 6= 0. (Ответ:
6
6
| {z } | {z } 2 2k−1
k k
1 1 > 2 · 2k−1 = 2k = 2n−1
то есть в этом случае неравенство верно. Предпо-
ложим, что оно верно для какого-нибудь n = k,
то есть, что справедливо
⋄ 3.2.16. При n, m ∈ N справедливо неравенство
(1 + α)k > 1 + k · α (3.2.104)
(n + m)! > n! · (n + 1)m (3.2.106)
Тогда для n = k + 1 мы получаем
Мы получили, что из того, что (3.2.103) вы- Предположим, что оно верно при m = k:
полняется для какого-то n = k автоматически
следует, что оно выполняется для n = k + 1. Та- (n + k)! > n! · (n + 1)k
ким образом, (3.2.103) обладает свойствами (a′ )
и (b′ ) теоремы 3.2.8, и поэтому оно выполняется Тогда при m = k + 1 получаем:
для любых n ∈ N.
= n! · (n + 1)k+1 = n! · (n + 1)m
20
1! > |{z}
|{z}
1 1
k
X 1 − q k+1
qi = , (3.2.109)
i=0
1−q ⋄ 3.2.19. Бином Ньютона. Для любых a, b ∈ R
и n ∈ N∗ справедливо равенство
Тогда при n = k + 1 получаем:
n
X
k+1 k (a + b)n = Cnk · an−k · bk (3.2.112)
X X
i i k+1 k=0
q = q +q = (3.2.109) =
i=0 i=0
k+1
где Cnk – число сочетаний, определенное выше
1−q k+1 1 − q k+1 + q k+1 − q k+2 формулой (3.2.110).
= +q = =
1−q 1−q
Доказательство. Сначала проверяем ее при n =
1 − q k+2
=1: ,
1−q 1
X
1
что и есть формула (3.2.107) при n = k + 1. (a + b) = C1k · a1−k · bk
| {z }
k=0
2. После того, как (3.2.107) доказано, форму- k | {z }
ла (3.2.108) получается вычислением: a + b k
C10 · a1 · b0 + C11 · a0 · b1
n
X n
X m−1
X Затем предполагаем, что она верна при n = m
qi = qi − qi =
i=m i=0 i=0 m
X
1−q n+1
1−q m
q −q m n+1 (a + b)m = k
Cm · am−k · bk (3.2.113)
= − = k=0
1−q 1−q 1−q
и проверяем, что тогда она будет верна при n =
m + 1:
Число сочетаний Cnk . Для любых n, k ∈ N,
(a + b)m+1 = (a + b) · (a + b)m = (3.2.113) =
k 6 n число
m
X
k
k n n! = (a + b) · Cm · am−k · bk =
Cn = = , (0 6 k 6 n) k=0
k (n − k)! · k!
m
X m
X
(3.2.110) k
называется числом сочетаний из n элементов = Cm · am+1−k · bk + k
Cm · am−k · bk+1 =
k=0 k=0
по k элементов. | {z }
заменяем k на i − 1
Предложение 3.2.18. Справедливо следующее m
X m+1
X
тождество = k
Cm ·a m+1−k k
·b + i−1
Cm · am+1−i · bi =
k=0 i=1
Cnk + Cnk−1 = Cn+1
k
, (3.2.111) | {z }
заменяем i на k
m
X m+1
X
называемое тождеством Паскаля. k
= Cm · am+1−k · bk + k−1
Cm · am+1−k · bk =
Доказательство. Это доказывается простой k=0 k=1
проверкой: m
X
= am+1 + k
Cm · am+1−k · bk +
Cnk + Cnk−1 = k
Cn+1 k=1
m
X
k−1
m + Cm · am+1−k · bk + bm+1 =
k=1
n! n! (n + 1)!
+ = Xm
(n − k)!k! (n − k + 1)!(k − 1)! (n + 1 − k)!k! = am+1 + (C k + C k−1 ) ·am+1−k · bk + bm+1 =
| m {z m }
m (делим на n!) k=1
k
k
Cn+1 ,
1 1 n+1
+ = по тождеству
(n − k)!k! (n − k + 1)!(k − 1)! (n + 1 − k)!k! Паскаля (3.2.111)
210 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
m
X 1 1 1
2) n+1 + n+2 + ... + 3n+1 > 1
= am+1 + k
Cm+1 · am+1−k · bk + bm+1 = Pn 2
k=1 3) k=1 k(3k − 1) = n (n + 1)
m+1 1 1 1 11
X 4) n+1 + n+2 + ... + 2n > 24
k
= Cm+1 · am+1−k · bk Pn 1 n
5) k=1 (4k−3)·(4k+1) = 4n+1
k=0
Qn
1 n+2
6) k=1 1− (k+1)2 = 2n+2
7) 1 · 22 + 2 · 32 + ... + (n − 1) · n2 =
⊲ 3.2.20. Сумма отрезка арифметической n·(n2 −1)·(3n+2)
прогрессии. Докажите методом математиче- 12 (n > 2).
ской индукции формулу: ⊲⊲ 3.2.23. Докажите методом математической
Xn индукции8 (используя бином Ньютона):
n · (n + 1)
i= (3.2.114) 1) 1 · 3 · 5 · ... 2n−1 6 √ 1
2 2 4 6 2n 3n+1
i=1 √ Pn 1 √
2) n < k=1 k < 2 n (n > 2).
√
⊲ 3.2.21. Докажите следующие тождества для
двойного факториала: ⊲ 3.2.24. Докажите индукцией следующие тож-
дества:
n!! = n · (n − 2)!!, n > 2 (3.2.115)
Yn
n! = n!! · (n − 1)!!, n ∈ N∗ (3.2.116) an = a, a ∈ R, n ∈ N∗ (3.2.119)
m
(2m)!! = 2 · m!, m ∈ N (3.2.117) k=1
Y n
(2m − 1)!
(2m − 1)!! = m−1 , m∈N . ∗ n! = k, n ∈ N∗ (3.2.120)
2 · (m − 1)! k=1
(3.2.118) m
Y
(2m)!! = (2k), m∈N (3.2.121)
⊲⊲ 3.2.22. Докажите методом математической k=1
индукции: Ym
2 (2m − 1)!! = (2k − 1), m ∈ N∗ (3.2.122)
1) 12 + 32 + ... + (2n − 1)2 = n(4n3 −1) k=1
Принцип Архимеда.
∃ sup N = B ∈ R (3.2.123)
Поскольку B – точная верхняя грань (то есть наименьшее из чисел, ограничивающих N сверху),
число B − 1 не может ограничивать N сверху. Значит, существует какое-то n ∈ N, большее чем B − 1:
n > B − 1. То есть
B <n+1
Это означает, что B не может ограничивать N сверху (потому что B меньше некоторого числа n+1 ∈
N). Таким образом, мы получили противоречие с (3.2.123). Оно означает, что наше предположение
о том, что N ограничено сверху неверно.
Теорема 3.2.26 (принцип Архимеда). Для любого вещественного числа C ∈ R найдется нату-
ральное число n ∈ N такое, что n > C.
Конечные множества в R и N.
X = K ∪ {f (k + 1)},
Рассмотрим число
a = (min K) ∧ f (k + 1)
(напомним, что мы определили операцию ∧ формулой (3.1.62)). Это число a будет минимумом
множества X, потому что, во-первых,
⇓
a = min K ∨ a = f (k + 1)
⇓
a∈K ∨ a ∈ {f (k + 1)}
⇓
a ∈ K ∪ {f (k + 1)} = X
И, во-вторых,
a = (min K) ∧ f (k + 1) = min{min K, f (k + 1)}
⇓
a 6 min K & a 6 f (k + 1)
⇓
a6K & a 6 f (k + 1)
⇓
a 6 K ∪ {f (k + 1)} = X
Теорема 3.2.28. Множество A в N конечно тогда и только тогда, когда оно ограничено:
Доказательство. Первая половина этого утверждение следует из теоремы 3.2.27: если множество
A конечно, то оно либо пусто, и тогда ограничено, либо непусто, и тогда, по теореме 3.2.27, A имеет
максимум, и значит, ограничено сверху. С другой стороны, оно всегда ограничено снизу нулем 0, и
значит, оно просто ограничено.
Докажем, что, наоборот, если A ограничено, то оно конечно. Опять, если A пусто, то доказывать
ничего не нужно, поэтому мы будем считать, что A 6= ∅. Тогда, воспользовавшись свойством 4◦ на
с.201 и положив
a1 = min A,
212 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
(если множество A\{a1 , ..., ak } непусто, то такое число существует по свойству 4◦ на с.201). По теоре-
ме 3.2.6 об определениях частной индукцией, отображение G определяет некую последовательность
{an } ⊆ A, удовлетворяющую условию
Действительно, во-первых,
{1, ..., an−1 } ⊆ {1, ..., an−1 , an }
⇓
A \ {1, ..., an−1 } ⊇ A \ {1, ..., an−1 , an }
⇓ (3.1.59)
⇓
an ∈ A \ {1, ..., an },
что невозможно.
2. Из (3.2.124) следует условие
∀n n 6 an (3.2.125)
Его можно доказать индукцией. При n = 1 оно очевидно:
1 6 a1 .
k + 1 6 ak+1
То есть (3.2.125) будет верно и при n = k + 1.
3. Заметим теперь, что поскольку A ограничено, существует c ∈ R такое что
A6c
A6c<m
Отсюда следует, что последовательность {an } конечна. Действительно, если бы она была бесконеч-
ной, то мы получили бы, что ее элемент с номером m лежит в A
am ∈ A
A < m 6 am
§ 2. Натуральные, целые и рациональные числа 213
m<n
⇓
f (m) = am < an = f (n)
⇓
f (m) 6= f (n)
Нам остается проверить, что оно сюръективно. Действительно, если бы оказалось, что
A \ {a1 , ..., aN } 6= ∅,
то положив
aN +1 = min A \ {a1 , ..., aN }
мы получили бы, что N не может быть длиной последовательности {an }, определяемой отображе-
нием G по теореме 3.2.6:
⇓
n o
N + 1 6 sup n ∈ N∗ : ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak
⇓
n o
6 sup n ∈ N∗ :
N= ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak
x ∈ −N
Свойства множества Z:
1◦ . Сумма x + y двух целых чисел x и y, также является целым числом:
x, y ∈ Z =⇒ x+y ∈Z (3.2.127)
x∈Z =⇒ −x ∈ Z (3.2.128)
x, y ∈ Z =⇒ x·y ∈Z (3.2.129)
214 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
Теорема 3.2.31. Любое непустое ограниченное снизу (сверху) множество целых чисел E ⊆ Z
имеет минимальный (максимальный) элемент.
∃ min E (max E)
причем
n<E =⇒ n < min E (E < n =⇒ max E < n) (3.2.131)
Доказательство. Пусть E ограничено сверху. Тогда по принципу Архимеда 3.2.26, найдется нату-
ральное число n ∈ N ограничивающее E сверху. Теперь получаем:
E<n
⇓
−n < −E
§ 2. Натуральные, целые и рациональные числа 215
⇓
0 < −E + n (причем −E + n ⊆ Z, по свойствам 1◦ и 2◦ на с.213)
⇓ (3.2.126)
−E + n ⊆ N
⇓ (свойство 4◦ на с. 201)
∃ min(−E + n) ∈ N
| {z }
k (3.1.60)
min(−E) + n
⇓
∃ min(−E) ∈ Z
| {z }
k (3.1.61)
− max(E)
⇓
∃ max E ∈ Z
=
am · an ,
— если 0 < a < 1, то потенцирование посылка
индукции
с основанием a меняет знак нера-
(3.2.147)
венства: = am · an+1
m<n =⇒ am > an (3.2.146)
Для n ∈ −N∗ , то есть n = −k, где k ∈ N∗ , фор-
Доказательство. 1. Начнем с показательных за- мула (3.2.136) переписывается так:
конов. Формула (3.2.134) есть просто часть опре- am
деления (3.2.132) степени an с неотрицатель- am−k = am · a−k = (3.2.135) = k
a
ным показателем. Формула (3.2.135) доказыва-
ется рассмотрением трех случаев: если n ∈ N∗ , то есть так:
то am−k · ak = am
1
a−n = (3.2.133) = n
a Заменив m − k = l, мы получим:
если n = 0, то
al · ak = ak+l , l ∈ Z, k ∈ N∗
a−n = a0 = (3.2.134) = 1 =
Это просто иначе записанное равенство (3.2.136),
1 1 1
= = (3.2.134) = 0 = n в котором одна из степеней неотрицательна, и
1 a a для этого случая мы его уже доказали.
а если n ∈ −N∗ , то есть n = −k, k ∈ N∗ , то по- 2. Проверим степенные законы. Они все до-
скольку (3.2.135) уже доказано для положитель- казываются сначала для неотрицательных степе-
ных степеней, должно выполняться a−k = a1k , ней индукцией, а затем для отрицательных сте-
1
или, что то же самое, a−k = ak , поэтому пеней выводятся из уже доказанных формул. На-
пример, формулу (3.2.137) нужно доказать сна-
−n k 1 1 чала для n ∈ N индукцией:
a = a = −k = n
a a
Для доказательства (3.2.136) нам понадобит- 10 = (3.2.132) = 1,
ся следующее вспомогательное тождество: 1n+1 = (3.2.132) = |{z}
1n ·1 = 1 · 1 = 1
=
Точно так же формула (3.2.138) доказывается Это доказывает формулу (3.2.140) для случая
сначала для n ∈ N индукцией: m ∈ Z и n ∈ N. Если же n ∈ −N∗ , то есть n = k,
0 k ∈ N∗ , то мы получаем:
1 (3.2.132) 1 (3.2.132) 1
= 1= = ,
a 1 a0 здесь применяется
n+1 n (3.2.140),
1 (3.2.132) 1 1 1 1 (3.1.46) уже доказанное
= · = n· = для k > 0
a a a a a z }| {
| {z } 1 1 (3.2.135)
m n m −k (3.2.135)
(a ) = (a ) = = m·k =
=
1
an ,
(am )k a
посылка
индукции = a−m·k = am·(−k) = am·n
1 (3.2.132) 1
= = 4. Формулу (3.2.141) при n = 0 можно счи-
an · a an+1 тать следствием (3.2.134) (или можно сказать
А затем для n = −k, k ∈ N∗ мы получаем: что раньше мы отмечали это утверждение как
равенство (3.2.97)). А для остальных n ∈ N она
n −k
1 1 доказывается индукцией:
= = (3.2.135) =
a a
(3.2.96)
1 1 1 1 0n+1 = 0n · 0 = 0
= = 1 = (3.2.135) = −k = n
1 k a a
| a {z
ak
} Условие сохранения знака (3.2.142) для n ∈ N
здесь применяется доказывается индукцией:
(3.2.138),
уже доказанное (3.2.132)
для k > 0 a0 = 1 > 0,
(3.2.132) (3.1.23)
Ну и формула (3.2.139) тоже доказывается an+1 = an · |{z}
|{z} a > 0
сначала для n ∈ N индукцией:
<
<
0, 0
0 (3.2.132) (3.2.132) 0 0 посылка
(a · b) = 1=1·1 = a ·b , индукции
n+1 (3.2.132)
(a · b) = (a · b) ·(a · b) = an · bn · a · b =
n
А после этого для n ∈ −N∗ , то есть для n = k,
| {z }
k ∈ N∗ , мы получаем:
=
an · bn ,
посылка
индукции ak > 0 (уже доказано)
(3.2.132) ⇓ (3.1.29)
= an · a · b n · b = an+1 · bn+1
−k (3.2.135) 1
an = a = >0
А затем для n = −k, k ∈ N∗ , получается как ak
следствие из уже доказанного: 5. Импликация (3.2.143) доказывается индук-
цией по n ∈ N∗ . При n = 1 она становится тав-
(a · b)n = (a · b)−k = (3.2.135) = тологией (то есть в ней следствие является ча-
1 1 (3.1.46) 1 1 стью посылки, и поэтому утверждение будет оче-
= = k k = · =
(a · b)k a ·b ak b k видно настолько, что в обычной речи это звучало
| {z }
здесь применяется бы глупо):
(3.2.139),
уже доказанное 0<x<y =⇒ x<y
для k > 0
am·n , | {z }
посылка
индукции ⇓
(3.2.132) m·n+m m·(n+1) n k+1
= a =a x =x = x · x < x · y k < y · y k = y k+1 = y n
k
218 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
Когда (3.2.143) доказано, (3.2.144) становится его Когда (3.2.148) доказано, (3.2.145) становится его
следствием: если n < 0, то есть n = −k, k > 0, то следствием – при a > 1 получаем:
0<x<y m<n
⇓ (3.2.143) ⇓
xk < y k n−m>0
⇓ (3.1.31)
⇓ (3.2.148)
1 1 an−m > 1
xn = x−k = > k = y −k = y n
xk y ⇓
6. Импликацию (3.2.145) можно доказать, на- an−m − 1 > 0
пример, с помощью следующего вспомогательно-
го утверждения: ⇓
(3.1.23)
a>1 ⇒ ∀n ∈ N∗ an > 1 (3.2.148) an − am = am (an−m − 1) > 0
⇓
Оно доказывается индукцией: подставив n = 1
m
мы получим тавтологию, a < an
Наконец, из (3.2.145) выводится (3.2.146):
a>1 ⇒ a1 = a > 1
m<n 0<a<1
а если оно верно при каком-то n = k ⇓ (3.1.35)
⇓
1
−m > −n > 1
a>1 ⇒ ak > 1 | {z a }
то при n = k + 1 мы получим ⇓
−m −n
(3.1.36) m 1 (3.2.145) 1
n
a =a k+1 k
a · |{z}
= |{z} a > k
a >1 a = > = an
a a
<
<
0 1
[x + m] = [x] + m, x ∈ R, m ∈ Z (3.2.152)
0 ∈ {n ∈ Z : n 6 x} =⇒ 0 6 max{n ∈ Z : n 6 x} = [x]
а с другой –
(3.2.131)
{n ∈ Z : n 6 x} 6 x < 1 =⇒ [x] = max{n ∈ Z : n 6 x} < 1
То есть 0 6 [x] < 1. По следствию 3.2.30 это означает, что [x] = 0.
2. Обозначим E = {n ∈ Z : n 6 x}. Тогда, во-первых,
E = {n ∈ Z : n 6 x} 6 x =⇒ [x] = max E 6 x
[x + m] = max{n ∈ Z : n 6 x + m} = max{n ∈ Z : n − m 6 x} =
= max{k + m : k ∈ Z & k 6 x} = max{k ∈ Z : k 6 x} + m
• Дробной частью {x} вещественного числа x ∈ R называется разность между x и его целой
частью [x]:
{x} := x − [x] (3.2.155)
{x + m} = {x}, x ∈ R, m ∈ Z (3.2.158)
Десятичная запись целых чисел. Как из- называемая десятичной записью числа x ∈
вестно, натуральные числа n ∈ N (мы определи- −N∗ . Например, запись
ли N на с.199) можно записывать цифрами 0, 1,
2, 3, 4, 5, 6, 7, 8, 9. Например, записи 487 и 1204 x = −247
означают числа
расшифровывается как равенство
487 = 7 + 8 · 10 + 4 · 102 ,
−x = 2 · 102 + 4 · 101 + 7 · 101
1204 = 4 + 0 · 10 + 2 · 102 + 1 · 103 .
или, что эквивалентно, как равенство
Тот факт, что любое число n ∈ N можно запи-
сать таким образом, и что (при n 6= 0) такая x = −2 · 102 − 4 · 101 − 7 · 101
запись однозначно определяет число (то есть не
может случиться, чтобы разные числа записыва- Для доказательства теоремы 3.2.33 нам пона-
лись одинаково), следует из принципа Архиме- добятся три леммы.
да 3.2.26, принципа математической индукции и
свойств отображения x 7→ [x]. Здесь мы объяс- Лемма 3.2.34. Для всякого x ∈ R найдется на-
ним, почему это так. туральное число n ∈ N такое, что
индукции: (3.2.165)
9
m−1
X
10n − 1 10n − 1
= (3.2.107) = 9 · =9· = x − am · 10m = ak · 10k
10 − 1 9
k=0
= 10n − 1 < 10n
переносим am · 10m
⇓ в правую часть
⇓
m−1
X m
X
n−1
X
1 k x= ak · 10k + am · 10m = ak · 10k
06 n · ak · 10 < 1
10 k=0 k=0
k=0
2. Мы доказали, что x представимо в виде
⇓
(3.2.159). Теперь убедимся, что такое представ-
! ление единственно, с точностью до добавления
n−1
X
x 1 или исключения нулевых слагаемых (то есть сла-
= n· ak · 10k + an · 10n = гаемых со старшими коэффициентами an = 0).
10n 10
k=0
Пусть нам даны два разных представления:
n−1
1 X
= · ak · 10k + an n
X l
X
10n |{z} x= ak · 10k и x= bk · 10k
k=0
| {z }
∈
k=0 k=0
Z
∈
m
X m
X
ak · 10k = bk · 10k и это означало бы, что n − 1 ∈ E (то есть n не
k=0 k=0
может быть минимумом E).
a = b · q + r, (3.2.170)
Если вдобавок a ∈ Z и b ∈ N∗ , то r ∈ N.
Доказательство. Числа q и r можно определить формулами
hai nao
q= , r =b·
b b
Тогда по определению целой части q ∈ Z, а по определению дробной части, rb ∈ [0; 1), и значит
r ∈ [0, b). Нам остается доказать, что такие числа q и r единственны. Предположим, что существуют
два разложения одного числа a:
a = b · q + r = b · q̃ + r̃
Тогда
r r̃
= q̃ + q+
b b
Из этого следует, что q = q̃, потому что если бы это было не так, то есть например q < q̃, то, по
свойству (3.2.130), мы получили бы, что q + 1 6 q̃, и поскольку rb < 1,
r r̃
q+ < q + 1 6 q̃ 6 q̃ +
b b
А с другой стороны, равенство rb = q̃ − q + r̃b означает, что rb и q̃ − q + r̃b отличаются на целое число
q̃ − q, поэтому
r nro r̃ r̃
= = q̃ − q + = (3.2.158) = ,
b b b b
и отсюда r = r̃.
Остается заметить, что поскольку q ∈ Z, то при a ∈ Z и b ∈ N∗ число r = a − b · q должно быть
целым.
§ 2. Натуральные, целые и рациональные числа 223
a = m · b. Очевидно,
A▽ ... A (3.2.172)
В этом случае • Hаименьшее общее кратное множества A (то
— число a называется кратным числа b, есть наименьшее число среди всех x ∈ A▽ )
обозначается ▽(A):
— число b называется делителем числа a.
• Если A ⊆ N∗ и B ⊆ N∗ – множества, то записи ▽(A) := min A▽ =
= min{x ∈ N∗ : ∀a ∈ A x ... a} (3.2.173)
A ... b, a ... B, A ... B
В частном случае, когда A состоит из двух
означают соответственно, что a ... b выполня- элементов a и b, наименьшее общее кратное
ется для любого a ∈ A, для любого b ∈ B, и множества A называется наименьшим общим
для любых a ∈ A и b ∈ B. кратным чисел a и b и обозначается
∀a ∈ A a ... x, но
{2}△ ∪ {3}△ = {1, 2} ∪ {1, 3} = {1}.
коротко это записывается формулой
Предложение 3.2.45. Если A непусто (необя-
A ... x. зательно конечно), то A△ непусто и конечно, и
Множество всех общих делителей для A обо- поэтому существует наибольший общий дели-
значается A△ : тель △ (A).
Теорема 3.2.46. Следующие соотношения Поэтому нужно доказать только два крайних со-
справедливы для любого непустого конечного отношения:
A ⊆ N∗ :
A▽ ... ▽(A), △ (A) ... A△ .
▽(A) > maxA > min A >△ (A), (3.2.181)
Мы будем их доказывать вместе с соотношения-
▽ .. .
. .
. .
. △
A . ▽(A) . A . △ (A) . A , (3.2.182) ми (3.2.183) и (3.2.184), причем в следующей по-
△ (A) = ▽(A△ ), (3.2.183) следовательности:
▽(A) =△ (A▽ ). (3.2.184) A▽ ... ▽(A) (3.2.186)
Доказательство. 1. В цепочке (3.2.181) нужно ⇓
проверить два крайних неравенства.
△ (A) = ▽(A△ )
▽(A) > max A, min A >△ (A) ⇓
Они оба следуют из свойства 5◦ на с.223. Напри-
мер, первое: △ (A) ... A△ (3.2.187)
x ∈ A▽ ⇓
⇓ ▽(A) =△ (A▽ )
x ... A 3. Докажем первое звено в этой цепочке, то
есть формулу (3.2.186). Пусть x ∈ A▽ , то есть
⇓ 5◦ на с.223
x ... A. Нам нужно показать, что x ... ▽(A). Разде-
x>A лим x на ▽(A) с остатком: по теореме 3.2.37, су-
ществуют q ∈ Z и r ∈ Z такие, что
⇓
x > max A x = ▽(A) · q + r, 0 6 r < ▽(A)
Это верно для любого x ∈ A▽ , значит Если r = 0, то мы сразу получаем, что x ... ▽(A).
Если же r > 0, то для всякого a ∈ A мы получаем
▽(A) = min A▽ = min▽ x > max A, цепочку:
x∈A
▽(A) ... A (уже доказано)
И то же самое со вторым:
⇓
x ∈ A△
x ... a, ▽(A) · q ... a, x > ▽(A)
| {z }
⇓
⇓ 4◦ на с.223
A ... x
r = x − ▽(A) · q ... a
⇓ ◦
5 на с.223
Это верно для любого a ∈ A, значит r – общее
A>x кратное для A:
r ... A
⇓
или, что то же самое,
min A > x
r ∈ A▽
Это верно для любого x ∈ A△ , значит
С другой стороны,
min A > max△ x = max A△ =△ (A)
x∈A
r < ▽(A) = min A▽
2. В цепочке (3.2.182) середина очевидна:
Это противоречие означает, что наше предполо-
▽(A) ... A ... △ (A) (3.2.185) жение, что r > 0, было неверно.
4. Докажем (3.2.183), то есть второе звено в
– с одной стороны, нашей цепочке. Для этого расшифруем уже до-
казанную формулу (3.2.186) так:
▽ ..
| {z. A}
A ⇒ ▽(A) = min A▽ ... A
x ... A ⇒ x ... ▽(A) (3.2.188)
(3.2.172)
⇓ A▽ ... ▽(A)
▽(A△ ) > A△ ⇓
Вместе с (3.2.189) это означает, что
{a; b} ... ▽{a; b}
▽
a·b
△ (A▽ ) ∈ A▽ (3.2.191) x=
a▽b
С другой стороны, из (3.2.185) получаем:
и заметим, что x ∈ N∗ , потому что
A ... △ (A▽ )
▽
(a · b) ... a, (a · b) ... b
| {z }
⇓
A▽ >△ (A▽ ) ⇓ (3.2.192)
Вместе с (3.2.191) это означает, что (a · b) ... (a ▽ b)
Для этого отдельно докажем два неравенства • Числа a, b ∈ N∗ называются взаимно просты-
ми, если они имеют только один общий дели-
a △ b > x, x>a△b тель, а именно, число 1:
Первое из них доказывается такой цепочкой: {a, b}△ = {1}
a▽b a▽b
a=x· , b=x· Понятно, что это равносильно тому, что их
| b {z a }
наибольший общий делитель равен единице:
⇓ a △ b = 1.
.
a .. x, b ... x
| {z } Это в свою очередь означает, что
⇓ (3.2.193)
a ▽ b = a · b, (3.2.195)
(a △ b) ... x
⇓ поскольку
(3.2.194)
a△b>x (a ▽ b) · (a △ b) = a·b
| {z }
А второе так: 1
∃i ∈ {1, ..., k} pi = q1 N
= pn2 2 · ... · pnk k = p1m1 −n1 · q2m2 · ... · qlml
pn1 1
По той же причине среди чисел q1 , ..., ql какое-то
должно быть равно p1 : то есть произведение простых чисел p2 , ..., pk (с
разными степенями), делилось бы на простое
∃j ∈ {1, ..., l} qj = p1
число p1 , которое не принадлежит последова-
Поскольку числа p1 , ..., pk упорядочены по воз- тельности p2 , ..., pk (потому что p1 меньше лю-
растанию, получаем бого из этих чисел).
Итак, n1 = m1 , и поэтому разложение
p1 6 pi = q1 (3.2.199) можно переписать так:
С другой стороны, числа q1 , ..., ql тоже упорядо- N = pn1 1 · pn2 2 · ... · pnk k = pn1 1 ·q2n2 · ... · qlml
чены по возрастанию, и поэтому |{z}
q1 и m1
заменены
q1 6 qj = p1 на p1 и n1
Свойства множества Q:
1◦ . Сумма x + y двух рациональных чисел x и y, также является рациональным числом:
x, y ∈ Q =⇒ x+y ∈Q (3.2.201)
230 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
(3.2.151) [a · n] m [a · n] + 1 [a · n] 1
[a · n] 6 a·n =⇒ 6a<b6 = = + =⇒
n n n n n
[a · n] [a · n] 1 1 1
=⇒ [a, b] ⊆ , + ⇒ b−a6 =⇒ n6 ,
n n n n b−a
⇓
X = {x ∈ R : x>0 & x2 6 2}
6
ε,
6
6
1 1
3 так как
Действительно, если бы для каких-то x ∈ X и 0<ε61
y ∈ Y выполнялось обратное неравенство = c2 + ε = c2 + (2 − c2 ) = 2
x > y, То есть
ε ε 2
то, поскольку y > 0, по свойству степенного отоб- c+ >c>0 & c+ 62
ражения (3.2.143), мы получили бы 3c 3c
ε
и это значит, что число c + 3c наоборот лежит в
x2 > y 2
X. Это противоречие означает, что наше предпо-
при том что из условий x ∈ X и y ∈ Y следует ложение (3.2.208) было неверным.
Предположим, наоборот, что
x2 6 2 6 y 2 .
c2 > 2 (3.2.209)
Из неравенства X 6 Y , в силу аксиомы непре-
Тогда число ε = c2 − 2 будет положительно
рывности A16, следует, что найдется число c ∈ R,
лежащее между X и Y : ε = c2 − 2 > 0
X 6c6Y Отсюда сразу следует, что
Заметим сразу, что, поскольку 1 ∈ X и 2 ∈ Y , ε
c− <c6Y
число c должно удовлетворять условию 3c
ε
и поэтому число c− 3c не лежит в Y . Но с другой
16c62 (3.2.207)
стороны, во-первых,
2. Покажем, что ε c2 − 2 2c2 + 2
c− =c− = >0
c2 = 2 3c 3c 3c
И, во-вторых,
Предположим, что это не так, например, пусть
ε 2 2 · ε ε 2
2
c <2 (3.2.208) c− = c2 − + =
√
3c 3 3c
10 Читатель, конечно, узнает в числе c из примера 3.2.55 число 2. Мы не вставляем это в формулировку, потому
что понятие корня будет определено нами только в § 1 главы 5.
232 Глава 3. ЧИСЛА, КАК НЕЯВНАЯ КОНСТРУКЦИЯ
<
0 го множества X на число a:
То есть мы получаем
a · X = {y ∈ R : ∃x ∈ X a · x = y}
ε ε 2
c− >0 & c− >2
3c 3c формулой (3.1.49) – сдвиг множества
ε
и это значит, что число c − 3c наоборот лежит
в Y . Это противоречие говорит о том, что наше X − a = {y ∈ R : ∃x ∈ X x − a = y},
предположение (3.2.209) тоже было неверным.
3. Нам осталось доказать, что число c ирра- а формулой (3.1.55) – частное числовых мно-
ционально. Предположим, что оно рационально: жеств:
c∈Q X x
= z ∈ R : ∃x ∈ X ∃y ∈ Y =z
Тогда, поскольку c > 0, по теореме 3.2.54 это Y y
число можно представить в виде несократимой
Этого достаточно, чтобы сообразить, что пони-
дроби
m мается под множеством 2N∗Z−1 , о котором мы по-
c= , m△n=1 ведем речь здесь, но перед тем, как приступить
n
Мы получаем цепочку: собственно к изучению его свойств, мы рассмот-
рим несколько подготовительных примеров.
m2 2
=c =2
n2 ⋄ 3.2.56. Множество четных натуральных чисел
⇓ {2, 4, 6, 8, ...} = {2n; n ∈ N∗ } удобно записывать
2
m = 2·n 2 в виде
2N∗ .
⇓
m2 ... 2 Точно также множество нечетных натуральных
чисел {1, 3, 5, 7, ...} = {2n − 1; n ∈ N∗ } удобно
⇓
записывать в виде
в разложении (3.2.197) числа m2
имеется множитель 2s , s ∈ N∗ 2N∗ − 1.
⇓
в разложении (3.2.197) числа m ⋄ 3.2.57. Выше мы уже приводили формулу
t
имеется множитель 2 , t ∈ N ∗ (3.2.200)
Z
⇓ Q = ∗,
N
m ... 2 которую можно рассматривать, как определение
⇓ множества рациональных чисел Q.
m = 2 · k, k>1
⋄ 3.2.58. Непривычному взгляду не сразу будет
⇓ очевидной справедливость равенства
4 · k 2 = m2 = 2 · n 2
Z
⇓ Q= (3.2.210)
2N∗
2 2
2·k =n
Доказательство. Ясно, что выполняется вклю-
⇓
чение
n2 ... 2 Z
⊆Q
⇓ 2N∗
по тем же причинам, что и для m, Покажем, что верно и обратное включение:
в разложении (3.2.197) числа n
Z
должен быть множитель 2r , r ∈ N∗ Q⊆
2N∗
⇓
n ... 2 Действительно, если r = pq ∈ Q, p ∈ Z, q ∈ N∗ , то
положив m = 2p, мы получим:
Мы получаем, что оба числа m и n делятся на
2. Это противоречит тому, что у них наиболь- p m
r= = , m ∈ Z, q ∈ N∗
ший общий делитель равен 1. Это означает, что q 2q
наше предположение о рациональности c было
ошибочным. То есть r ∈ 2NZ∗ .
§ 2. Натуральные, целые и рациональные числа 233
⊲ 3.2.59. Докажите равенства: знаменатель (и, возможно, знак минус перед дро-
бью), утверждение 2◦ в этом списке не будет
2Z
=Q справедливо: равенство
2N∗
∗
N 1 1
= {r ∈ Q : r > 0} + =1
N∗ 2 2
⋄ 3.2.60. После примера 3.2.58 можно было бы означает, что множество таких чисел не замкну-
ожидать, что если заменить в (3.2.210) четные то относительно сложения. Однако, утвержде-
◦ ◦
числа 2N∗ на нечетные 2N∗ −1, то равенство оста- ния 1 и 3 для этого класса все же будут вы-
нется верным. Но это не так: полняться.
=
=
максимума двух чисел: 1 1 1
=
−1 1 −1
1
sgn2 x = (3.2.213) sgn2 (x · y) = sgn2 x ∨ sgn2 y,
sgn2 x | {z } | {z } | {z }
sgn2 (−x) = sgn2 x (3.2.214)
=
1 1 −1
sgn2 (x + y) = sgn2 x · sgn2 y (3.2.215)
2Z−1 2Z
sgn2 (x · y) = sgn2 x ∨ sgn2 y (3.2.216) 3) если x, y ∈ 2N ∗ −1 , то x + y ∈ 2N∗ −1 и
2Z−1
x · y ∈ 2N∗ −1 , поэтому
Доказательство. Здесь нужно просто рассмот-
реть несколько случаев. Для двух последних sgn (x + y) = sgn2 x · sgn2 y,
| 2 {z } | {z } | {z }
тождеств рассуждения выглядят так:
=
=
1) если x, y ∈ 2N2Z ∗ −1 , то x + y ∈
2Z
2N∗ −1 и
1 −1 −1
2Z
x · y ∈ 2N∗ −1 , поэтому sgn (x · y) = sgn x ∨ sgn2 y .
| 2{z } | {z2 } | {z }
sgn (x + y) = sgn2 x · sgn2 y ,
=
| 2 {z } | {z } | {z } −1 −1 −1
=
=
=
1 1 1
Глава 4
ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
§1 Числовые функции
(a) Определение функции и примеры
Понятие функции формализует в математике идею взаимной зависимости физических величин.
Идея же состоит в следующем.
Как мы уже говорили на с.187, физические величины, такие как расстояние, масса, скорость,
и так далее, поддаются количественной оценке в числах. Люди находят и устанавливают правила,
позволяющие измерять эти величины (сравнивая их с эталонами), то есть выражать их числами:
200 метров, 1,8 килограмма, и т.д. Собственно говоря, в этом состоит смысл самого понятия фи-
зической величины: параметр, существование которого предполагается теоретически, должен быть
снабжен системой правил, позволяющих его измерять и сравнивать значения в различных ситуа-
циях – только в этом случае он приобретает статус физической величины.
При этом очень важное наблюдение, с которого и начинаются технические науки, состоит в том,
что при фиксированных правилах измерений обнаруживается, что разные величины могут быть
связаны друг с другом довольно жесткими соотношениями (законами природы): если известны
результаты измерений какой-то величины, то это, как правило, означает, что можно вычислить
какие-то другие величины в рассматриваемой ситуации (без необходимости их измерять).
⋄ 4.1.1. Например, по результатам измерения ⋄ 4.1.2. Точно так же, зная (с достаточной точ-
диаметра окружности D, можно с достаточной ностью) массу тела m и плотность ρ материала,
точностью судить о том, какой будет ее длина l, из которого оно изготовлено, мы можем (опять
же, достаточно точно) определить объем V этого
l = πD, (4.1.1) тела по формуле
В этих примерах одна величина выражается через другую с помощью логических правил, поз-
воляющих проводить вычисления, то есть находить нужные значения, возможно приближенные,
пользуясь заранее разработанными алгоритмами. Инженер, привыкший пользоваться подобными
вычислениями на практике, обычно только так и понимает функциональную зависимость, но мате-
матику удобнее рассматривать эту зависимость в абстрактном виде, включая те ее разновидности,
для которых алгоритмы вычислений еще не построены. Эти соображения приводят к следующему
определению:
• Числовой функцией на вещественной прямой R называется произвольное отображение1
1 Понятие отображения было определено выше на с.39.
235
236 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
f : R ֒→ R
Y = {y ∈ R : ∃x ∈ D(f ) f (x) = y}
x
−2 −1 1 2
f (x) = xn
(b) Модуль
Модулем (или абсолютной величиной) вещественного числа x ∈ R называется число |x|, определя-
емое формулой (
x, если x > 0
|x| = (4.1.5)
−x, если x < 0
y
2
y = |x|
x
−2 −1 1 2
Понятно, что отображение x 7→ |x| является функцией. Свойства этой функции так часто ис-
пользуются в анализе, что их изучению мы посвятим целый раздел.
Это доказывает (4.1.7). Из (4.1.7) индукцией получается (4.1.8). Равенство (4.1.9) также следует из
(4.1.7):
|−x| = |(−1) · x| = |(−1)| · |x| = 1 · |x| = |x| .
y
y = f (x)
– нечетной, если
(1) для всякой точки x из области определения D(f ) функции f точка −x также лежит
в области определения,
∀ x ∈ D(f ) − x ∈ D(f )
(2) выполняется тождество
f (−x) = −f (x)
Эти условия означают, что график функции f должен быть симметричен относительно
начала координат:
y
y = f (x)
x
§ 1. Числовые функции 241
Доказательство. Заметим, что это достаточно 2. Предположим, что мы доказали это для
доказать для n > 0, потому что случай отрица- какого-то n = k:
тельных степеней получается отсюда в качестве
следствия: (−x)2k−1 = −x2k−1 (4.1.21)
= −x2k+1 = x2(k+1)−1
2. Предположим, что мы доказали это для
какого-то n = k:
<
>
x2k , x2 , 0 0
в силу (4.1.19) в силу (3.1.17)
| − x| = | − 0| = |0| = |x|
0 0
Доказательство. Как и в предыдущем приме-
ре, здесь достаточно доказать утверждение для
n > 0, потому что для n = −k, k ∈ N, это выво-
дится как следствие: ! 4.1.17. На всякий случай полезно заметить,
что функции не обязаны быть только четными
−2k−1 1 1 −2k−1 или нечетными. Например, функция
(−x) = = − 2k+1 = −x
(−x)2k+1 x
f (x) = 1 + x
Для n > 0 доказательство проводится по индук-
ции. не будет ни четной ни нечетной. Докажите это.
Периодические функции.
• Число T называется периодом числовой функции f , если
(a) оно положительно:
T > 0,
(b) область определения D(f ) функции f инвариантна относительно сдвигов на T вправо
и влево:
D(f ) − T = D(f ) = D(f ) + T
242 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
(то есть для любого x ∈ D(f ) числа x + T и x − T тоже лежат в D(f )),
(c) справедливо двойное тождество:
(здесь из-за условия (b) достаточно выполнения какого-нибудь одного из этих двух
равенств, например f (x) = f (x + T )).
• Число h называется полупериодом числовой функции f , если число 2h является периодом
функции f .
• Числовая функция f называется
— периодической, если она обладает каким-нибудь периодом T ,
— T -периодической, если число T является ее периодом,
⋄ 4.1.18. Непериодические функции. По- Можно заметить, что вообще любое натуральное
нятно, что не всякая функция будет периодиче- число n ∈ N∗ является периодом для x 7→ {x}:
ской. Например, функция
f (x) = x, x∈R {x + n} = {x}, x∈R
T = n · M + r, 06r<M
Если бы оказалось, что r > 0, то мы получили бы, что r = T − n · M – период функции f , меньший
M . То есть M в этом случае не могло бы быть наименьшим периодом. Значит r = 0, и это то, что
нам нужно.
Теорема 4.1.23. Если функция f является периодической, но не обладает наименьшим периодом
M , то
§ 1. Числовые функции 243
(ii) на любом непустом интервале I = (a, b) функция f принимает все свои значения:
f I ∩ D(f ) = f D(f ) (4.1.25)
(иными словами, каковы бы ни были a и b, a < b, для любой точки x ∈ D(f ) найдется
точка t ∈ (a, b) ∩ D(f ) такая, что f (t) = f (x)).
Доказательство. 1. Обозначим буквой P множество всех периодов для f , а его нижнюю грань
буквой α: n o
P = T > 0 : ∀x ∈ D(f ) f (x + T ) = f (x) , α = inf P
Если α ∈
/ P , то для всякого β > α найдется T ∈ P такое, что
α<T <β
α < T1 < α + ε
f (x + T ) = f (x + T1 − T2 ) = f (x + T1 ) = f (x)
С другой стороны, T1 и T2 лежат в интервале (α, α + ε) длины ε, поэтому их разность должна быть
меньше ε:
T = T1 − T2 < ε
Мы получили, что для всякого ε > 0 найдется период T ∈ P , меньший ε. Значит, α = inf P = 0
2. Рассмотрим сначала интервал I = (−ε, ε), ε > 0. В силу уже доказанной формулы (4.1.24),
найдется период T < ε. Возьмем произвольную точку x ∈ D(f ), и обозначим через n целую часть
числа Tx : hxi
n=
T
Тогда точка t = x − nT будет обладать нужными свойствами:
Действительно, последние два условия – t ∈ D(f ) и f (t) = f (x) – выполняются потому что T –
период. А первое следует из свойств целой части:
hxi
n=
T
⇓ (3.2.151)
x ε
n6 <n+1<n+
T T
⇓
nT 6 x < nT + ε
⇓
| −{znT} < ε
06x
t
⇓
244 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
t ∈ (−ε, ε)
3. Пусть, наконец, I = (a, b) – произвольный интервал. Положим ε = b−a 3 и, пользуясь формулой
(4.1.24), подберем период T так, чтобы
ε
>1
T
Тогда a + ε < b − ε, поэтому a+ε T < b−εT , причем расстояние между точками T
a+ε
и b−ε
T больше
единицы:
b−ε a+ε (b − ε) − (a + ε) (b − a) − 2ε 3ε − 2ε ε
− = = = = >1
T T T T T T
Значит, между ними лежит хотя бы одно целое число n ∈ Z:
a+ε b−ε
<n<
T T
Умножив на T мы получим:
a + ε < nT < b − ε
⇓
a < nT − ε & nT + ε < b
⇓
(−ε; ε) + nT = (nT − ε; nT + ε) ⊆ (a; b)
То есть (−ε; ε) – такой интервал, сдвиг которого на число nT , кратное периоду T , попадает в
интервал (a; b). Мы уже доказали, что для любой точки x ∈ D(f ) в интервале (−ε; ε) найдется
точка t, на которой функция f определена и принимает то же значение:
f (t) = f (x)
Положив s = t + nT , мы получим точку из интервала (nT − ε; nT + ε) ⊆ (a; b) с теми же свойствами:
f (s) = f (t + nT ) = f (t) = f (x)
• Точная нижняя грань множества f (E) называется точной нижней гранью функции f на
множестве E и обозначается inf x∈E f (x):
n o
inf f (x) = inf f (E) = inf f (x); x ∈ E (4.1.27)
x∈E
Если функция f ограничена снизу на множестве E, то есть существует число A такое, что
∀x ∈ E A 6 f (x)
(это эквивалентно тому, что множество f (E) ограничено снизу), то точная нижняя грань
f на E совпадает с наибольшим из таких чисел A:
inf f (x) = max{A ∈ R : ∀x ∈ E A 6 f (x)}.
x∈E
В таких случаях inf x∈E f (x) само является числом (а не символом −∞, как тоже иногда
бывает), и это коротко записывается формулой:
inf f (x) > −∞
x∈E
• Точная верхняя грань множества f (E) называется точной верхней гранью функции f на
множестве E и обозначается supx∈E f (x):
n o
sup f (x) = sup f (E) = sup f (x); x ∈ E (4.1.28)
x∈E
В таких случаях supx∈E f (x) является числом (а не символом +∞), и это коротко запи-
сывается формулой:
sup f (x) < +∞
x∈E
∀x ∈ E A 6 f (x) 6 B
2 ◦
Монотонность:
∀x ∈ E f (x) 6 g(x) =⇒ inf f (x) 6 inf g(x) & sup f (x) 6 sup g(x)
x∈E x∈E x∈E x∈E
3◦ Антиоднородность:
inf − f (x) = − sup f (x)
x∈E x∈E
(4.1.29)
sup − f (x) = − inf f (x)
x∈E x∈E
4◦ Полуаддитивность:
inf f (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E
(4.1.30)
sup f (x) + g(x) 6 sup f (x) + sup g(x)
x∈E x∈E x∈E
6◦ Связь с модулем:2
sup f (x) − f (y) = sup f (x) − f (y) (4.1.32)
x,y∈E x,y∈E
2 Это тождество понадобится нам на с.492.
246 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
{C : ∀x ∈ E C 6 f (x)} ⊆ {C : ∀x ∈ E C 6 g(x)}
⇓ (свойство 1◦ на стр. 197)
inf f (x) = max{C : ∀x ∈ E C 6 f (x)} 6 max{C : ∀x ∈ E C 6 g(x)} = inf g(x)
x∈E x∈E
3.
inf − f (x) = inf − f (E) = (свойство 3◦ на стр. 197) = − sup f (E) = − sup f (x)
x∈E x∈E
.
4.
(
∀x ∈ E f (x) > inf x∈E f (x)
=⇒ ∀x ∈ E f (x) + g(x) > inf f (x) + inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) x∈E x∈E
=⇒ inf f (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E
5.
(
∀x ∈ E f (x) > inf x∈E f (x) > 0
=⇒ ∀x ∈ E f (x) · g(x) > inf f (x) · inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) > 0 x∈E x∈E
=⇒ inf f (x) · g(x) > inf f (x) · inf g(x)
x∈E x∈E x∈E
После этого нужно убедиться, что это неравенство не может быть строгим. Предположим, что
sup f (x) − f (y) < sup f (x) − f (y)
x,y∈E x,y∈E
а, взяв x = b, y = a, получили бы
f (b) − f (a) < f (a) − f (b)
Вместе эти два неравенства выполняться не могут, потому что f (a) − f (b) равен либо f (a) − f (b),
либо f (b) − f (a).
§ 1. Числовые функции 247
Монотонные функции
• Числовая функция f называется
– возрастающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких
что x < y выполняется неравенство f (x) < f (y);
f (y)
f (x)
x y
f (x)
f (y)
x y
f (x)
f (y)
x y
248 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
f (y)
f (x)
x y
5◦ Композиция g ◦ f функций f и g
– возрастает (неубывает), если обе функции f и g возрастают (неубывают),
либо обе убывают (невозрастают),
– убывает (невозрастает), если одна из функций f и g возрастает (неубывает),
а другая убывает (невозрастает).
⋄ 4.1.24. Степенная функция x 7→ x2n , n ∈ N∗ , ле [0; +∞) следует из теоремы 3.2.32: в силу
— убывает на полуинтервале (−∞; 0], (3.2.143), функция x 7→ x2n возрастает на интер-
вале (0; +∞):
— возрастает на полуинтервале [0; +∞).
0<x<y ⇒ x2n < y 2n
Как следствие,
А случай x = 0 получается из условия сохране-
x 6= 0 =⇒ x2n > 0 (4.1.35) ния знака (3.2.142):
(3.2.141)
Доказательство. Возрастание на полуинтерва- 0<y ⇒ 02n = 0 < y 2n
§ 1. Числовые функции 249
2n−1
С другой стороны, в силу (4.1.18), наша функция x
| {z < 0} & 0 < y 2n−1
| {z }
четная: потому что потому что
(−x)2n = x2n x, 0 ∈ (−∞; 0] 0, y ∈ [0; +∞)
| {z }
Отсюда следует, что она убывает на полуинтер-
⇓
вале (−∞; 0]:
x<y60
x2n−1 < 0 < y 2n−1 (4.1.37)
⇓
Формулы (4.1.36) можно вывести из возрастания
0 6 −y < −x функции x 7→ x2n−1 , а можно объявить их след-
⇓ ствием уже доказанного неравенства (4.1.37).
2n
(−y) < (−x)2n ⋄ 4.1.26. Степенная функция x 7→ x−2n , n ∈ N∗ ,
| {z } | {z }
y 2n x2n — возрастает на интервале (−∞; 0),
⇓ — убывает на интервале (0; +∞).
2n При этом,
y < x2n
Для доказательства (4.1.35) нужно просто рас- x 6= 0 =⇒ x−2n > 0 (4.1.38)
смотреть два случая: x > 0 и x < 0.
Доказательство. Убывание на интервале
⋄ 4.1.25. Степенная функция x 7→ x2n−1 , n ∈ N∗ , (0; +∞) следует из условия монотонности
возрастает всюду на своей области определения (3.2.144) теоремы 3.2.32. Из него и условия чет-
(то есть на прямой R). Как следствие, ности (4.1.18) выводится возрастание на интер-
вале (−∞; 0) по аналогии с тем, как это делалось
x > 0 =⇒ x2n−1 > 0 в примере 4.1.24. Свойства (4.1.38) следуют из
2n−1
(4.1.36) из условия сохранения знака (3.2.142) теоремы
x < 0 =⇒ x <0
3.2.32 и условия четности (4.1.18).
Доказательство. Возрастание на полуинтерва- ⋄ 4.1.27. Степенная функция x 7→ x−(2n−1) ,
ле [0; +∞) здесь доказывается так же, как в n ∈ N∗ ,
предыдущем примере 4.1.24. Поскольку вдоба-
вок, в силу (4.1.20), наша функция нечетная, — убывает на интервале (−∞; 0),
— убывает на интервале (0; +∞).
(−x)2n−1 = −x2n−1 ,
При этом,
она должна возрастать и на полуинтервале
(−∞; 0]: x>0 =⇒ x−(2n−1) > 0
(4.1.39)
x<y60 x<0 =⇒ x−(2n−1) < 0
⇓
Доказательство. Как и в предыдущем приме-
0 6 −y < −x ре убывание на интервале (0; +∞) следует из
условия монотонности (3.2.144) теоремы 3.2.32.
⇓ Из него и условия нечетности (4.1.20) выводит-
(−y) 2n−1
< (−x)2n−1 ся убывание на интервале (−∞; 0) по аналогии с
| {z } | {z } тем, как это делалось в примере 4.1.25. Свойства
−y 2n−1 −x2n−1
(4.1.39) следуют из из условия сохранения зна-
⇓ ка (3.2.142) теоремы 3.2.32 и условия нечетности
2n−1 (4.1.20).
−y < −x2n−1
⇓ ⊲ 4.1.28. Нарисуйте график какой-нибудь функ-
ции f : R → R со следующими свойствами:
x2n−1 < y 2n−1
1) на интервале (−∞; −1) функция f убывает и
Остается заметить, что значения функции на ограничена;
полуинтервале (−∞; 0] меньше значений на 2) на интервале (−1; 0) функция f возрастает и
[0; +∞). Это следует из того, что эти интервалы ограничена;
имеют общую точку 0:
3) на интервале (0; 1) функция f убывает, огра-
x<0<y ничена снизу, но не ограничена сверху;
4) на интервале (1; +∞) функция f возрастает
⇓ и ограничена;
250 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Понятно, что эта задача имеет неединствен- 2) на интервале (−2; 0) функция f убывает,
ное решение. В качестве возможного ответа мы ограничена сверху, но не ограничена снизу;
предлагаем следующую картинку: 3) на интервале (0; 1) функция f возрастает и не
y ограничена ни сверху, ни снизу;
1 4) на интервале (1; +∞) функция f возрастает
и ограничена снизу.
−1 0 1 x Один из возможных ответов выглядит так:
y
1
⊲ 4.1.29. Нарисуйте график какой-нибудь функ-
ции f : R → R со следующими свойствами: −2 −1 0 1 x
1) на интервале (−∞; −2) функция f возрастает
и ограничена;
§2 Предел последовательности
Напомним, что понятие бесконечной последовательности было определено на с.73. В частном слу-
чае, когда значения последовательности являются числами, такая последовательность называется
числовой. Выпишем это определение для ссылок:
• Числовой последовательностью называется произвольное отображение x : N∗ → R (на-
турального ряда N∗ в множество R вещественных чисел). Значения такого отображения
принято записывать с помощью нижнего индекса
xn = x(n), n ∈ N∗ .
а само отображение – в виде семейства {xn ; n ∈ N∗ } или {xn }. (Понятно, что вместо x
может употребляться любая другая буква.)
в которой f – заранее определенная функция. или каких-то других операций (например, диф-
Например, следующие формулы явно задают ференцирования и интегрирования которые мы
последовательности, поскольку функции в пра- опишем ниже). Во всех этих случаях считается,
вых частях были уже нами определены: что формула задает последовательность явно.
1 ⋄ 4.2.2. Последовательности, заданные ре-
xn = , xn = n, xn = (−1)n .
n куррентно. Второй способ – задать последова-
тельность индуктивно с помощью теоремы 3.2.5
Естественно, под f в формуле (4.2.40) можно
(об определениях полной индукцией). В таких
также понимать какую-нибудь функцию, состав- случаях говорят также, что последовательность
ленную из уже определенных, с помощью явно
задана рекуррентно. Например, правило
описанных операций, например, операции ком-
позиции, 1 1
2 x1 = 2, xn+1 = xn +
xn = 2n 2 xn
или алгебраических операций, индуктивно задает некую числовую последова-
тельность (ниже в примере 4.2.60 мы будем изу-
xn = n2 − n чать ее свойства).
§ 2. Предел последовательности 251
1 2 3 4 5 6 7 ...
x1 x2 x3 x4 x5 x6 x7 ...
Поскольку ячеек у такой таблицы должно быть бесконечно много, всю ее нарисовать, конечно,
невозможно, однако в качестве зрительного образа, который можно держать в голове, когда речь
заходит о последовательностях, такое представление бывает полезно.
x
x1 x2 x4 x3 x5
Это можно представлять себе как движение “блохи, прыгающей по прямой”: сначала эта “блоха
находилась в точке x1 ”, затем “прыгнула в точку x2 ”, и так далее. Понятно, что и здесь всю систему
дуг нарисовать никогда не бывает возможно (потому что их тоже бесконечно много), однако как
зрительный образ такое представление оказывается удивительно полезным.
⋄ 4.2.4. xn = 1
n ⋄ 4.2.7. xn = (−1)n · n
0 1 1 1 1 −3 −1 2 4
4 3 2
1 2 3 4 −1 1
−1 − 13 0 1 1 1
4 2 3
Это эквивалентно тому, что свойство P выполняется для всех n ∈ N∗ , начиная с некото-
рого номера:
∃N ∈ N∗ ∀n > N P (4.2.43)
§ 2. Предел последовательности 253
A = {n ∈ N∗ : ¬P }, B = {n ∈ N∗ : P}
Тогда
(4.2.42)
m
card A < ∞
m теорема 3.2.28
∗
∃N ∈ N A ⊆ {1, ..., N }
m
∗
∃N ∈ N {n ∈ N∗ : n > N} ⊆ B
m
(4.2.43)
⋄ 4.2.10. Ясно, что почти все числа n ∈ N удо- выполняется для почти всех n ∈ N?
влетворяют неравенству Понятно, что это не так, потому что оно
выполняется только для четных чисел (n =
n>5
2, 4, 6, 8, ...), а для нечетных чисел (n =
потому что чисел n ∈ N, не удовлетворяющих 1, 3, 5, 7, ...) – которых бесконечно много – оно
этому неравенству имеется только конечное мно- неверно.
жество (а именно n ∈ {1, 2, 3, 4}).
⋄ 4.2.11. Наоборот, неверно, что почти все числа ⊲ 4.2.13. Верно ли, что обратное неравенство
n ∈ N удовлетворяют неравенству
(−1)n 6 0
n<5
потому что чисел n ∈ N, не удовлетворяющих выполняется для почти всех n ∈ N?
этому неравенству бесконечно много (а именно, Это, конечно, тоже не так, потому что это-
n = 5, 6, 7, 8, ...). му неравенству удовлетворяют только нечетные
⊲ 4.2.12. Сообразим, будет ли неравенство числа (n = 1, 3, 5, 7, ...), а для четных чисел
(n = 2, 4, 6, 8, ...) – которых бесконечно много –
(−1)n > 0 оно неверно.
Теорема 4.2.14 (Архимеда). Каково бы ни было число C ∈ R, почти все числа n ∈ N удовлетво-
ряют неравенству
n>C (4.2.44)
Доказательство. Это следует из принципа Архимеда (теорема 3.2.26). Выберем какое-нибудь N ∈
N так, чтобы N > C. Тогда все числа n, начиная с числа N , удовлетворяют неравенству (4.2.44),
потому что n > N > C.
⊲ 4.2.15. Следующая “абстрактная” задача мо- (A) все числа n ∈ N∗ лежат в множестве M (то
жет считаться тестом на понимание термина “по- есть M = N∗ );
чти все”. Пусть M какое-нибудь множество нату- (B) конечный набор чисел n ∈ N∗ не лежит в мно-
ральных чисел (M ⊆ N∗ ), рассмотрим пять воз- жестве M , а остальные числа n ∈ N∗ (кото-
можных ситуаций: рых – бесконечное множество) лежат в M ;
254 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
(C) бесконечный набор чисел n ∈ N∗ не лежит в 1) в каких из этих случаев почти все числа n ∈
множестве M , и одновременно бесконечный N∗ лежат в множестве M ?
набор чисел n ∈ N∗ лежит в M (такое быва- 2) в каких случаях почти все числа n ∈ N∗ не
ет, например, когда M – множество четных лежат в множестве M ?
чисел);
3) в каких случаях не верно ни то, ни другое?
(D) конечный набор чисел n ∈ N∗ лежит в множе-
стве M , а остальные числа n ∈ N∗ (которых Ответы:
– бесконечное множество) не лежат в M ; 1) (A) и (B) (чисел, лежащих в M больше, чем
(E) все числа n ∈ N∗ не лежат в множестве M (то остальных);
есть M = ∅). 2) (D) и (E) (чисел, не лежащих в M больше,
чем остальных);
Ответьте на вопросы: 3) (C).
⋄ 4.2.16. Проверим, что почти все элементы по- ⋄ 4.2.18. Верно ли, что почти все элементы по-
следовательности
{xn = n1 } лежат в интервале следовательности {xn = (−1)n } лежат в интер-
1
0; 4 . вале (0; 2)?
0 1 1 1 1
4 3 2
−1 0 1 2
Действительно,
ментов нашей последовательности будет неверно. Поэтому ответ для второй поло-
вины задачи выглядит так
Ответ для пункта (b): α < −1 и β > 1.
Окрестность точки.
• Окрестностью точки c ∈ R называется всякий интервал с центром в точке c, то есть
всякий интервал вида (c − ε; c + ε). Число ε при этом называется радиусом окрестности
(c − ε; c + ε).
c−ε c c+ε
Предложение 4.2.23. Всякая точка x произвольного интервала (a, b) содержится в нем вместе
с некоторой своей окрестностью:
Доказательство. Положим
ε = min{b − x; x − a}.
Тогда
( ( (
ε6b−x ε6b−x x+ε 6 b
=⇒ =⇒ =⇒
ε 6 x−a −ε > a − x x−ε > a
=⇒ a6x−ε<x<x+ε6b =⇒ x ∈ (x − ε, x + ε) ⊆ (a, b)
lim xn = c
n→∞
или
xn −→ c
n→∞
и поймем, что означает, что xn лежит в (1−ε; 1+ По теореме Архимеда 4.2.14, последнее нера-
ε): венство выполняется для почти всех n ∈ N. Это
§ 2. Предел последовательности 257
1
означает, что почти все числа xn содержатся в n+2 <ε
1
интервале (1 − ε; 1 + ε). ⇔ ⇔ <ε ⇔
Итак, мы получили, что любая окрестность
−
1
< ε n+2
n+2
(1 − ε; 1 + ε) точки c содержит почти все элемен-
ты последовательности {xn = n−1 ▼❇❇
n }. Это как раз
означает, что точка c = 1 является пределом по- поскольку ε > 0,
это неравенство выполняется автоматически для любого n ∈ N,
следовательности {xn = n−1 n }.
значит его можно отбросить
1 1
⋄ 4.2.25. Покажем, что ⇔ n+2> ⇔ n> −2
ε ε
1 6= lim (−1)n По теореме Архимеда 4.2.14, последнее неравен-
n→∞
ство выполняется для почти всех n ∈ N. Это
то есть что число c = 1 не является пределом означает, что почти все числа xn содержатся в
последовательности {xn = (−1)n }. интервале (2 − ε; 2 + ε).
Возьмем ε = 1 и рассмотрим соответствую- Итак, мы получили, что любая окрестность
щую окрестность (0; 2) точки c = 1. Тогда (2 − ε; 2 + ε) точки c = 2 содержит почти все
элементы последовательности {xn = 2n+3 n+2 }. Это
xn ∈ (0; 2) ⇔ означает, что точка c = 2 является пределом по-
0 < (−1)n следовательности {xn = 2n+3 n+2 }.
⇔ ⇔ 0 < (−1)n
(−1)n < 2 ⋄ 4.2.27. Покажем, что
▼❇❇ (−1)n
это неравенство выполняется автоматически для любого n ∈ N, lim =0
поэтому его можно отбросить n→∞ n
то есть что точка c = 0 является пределом по-
Последнее неравенство выполняется только для n
2n + 3
lim =2
n→∞ n+2
xn ∈ (−ε; ε) ⇔ (4.1.16) ⇔
то есть что точка c = 2 является пределом по- (−1)n
следовательности {xn = 2n+3 ⇔ |xn | < ε ⇔ <ε ⇔
n+2 }. n
Возьмем какую-нибудь окрестность (2 − ε; 2 +
⇔ (4.1.7), (4.1.8), (4.1.5) ⇔
ε) точки c = 2
| − 1|n 1 1
⇔ <ε ⇔ <ε ⇔ n>
n n ε
xn −→ a
n→∞
и
xn −→ b
n→∞
то
a=b
Доказательство. Предположим, что a 6= b, например a < b. Возьмем ε = b−a 2 , тогда мы получим,
что почти все xn лежат в двух непересекающихся интервалах – в (a − ε; a + ε) и в (b − ε; b + ε):
xn xn
n
n
↓ ↓ ↓ ↓
∞
∞
a−ε< a <a+ε=b−ε< b <b+ε
| {z } | {z }
⇓ ⇓
xn ∈ (a − ε, a + ε) xn ∈ (b − ε, b + ε)
для почти всех n ∈ N∗ для почти всех n ∈ N∗
Но это невозможно: если почти все xn лежат в (a − ε; a + ε), то вне (a − ε; a + ε) должен лежать
лишь конечный набор чисел xn . В частности, в (b − ε; b + ε) тоже должен лежать лишь конечный
набор чисел xn .
§ 2. Предел последовательности 259
если любой интервал (E; +∞) содержит почти все элементы {xn }.
– стремится к −∞
xn −→ −∞
n→∞
если всякое множество (−∞; −E) ∪ (E; +∞) содержит почти все элементы {xn };
нетрудно проверить, что это равносильно тому, что последовательность из мо-
дулей {|xn |} стремится к +∞:
|xn | −→ +∞
n→∞
lim n2 = +∞
n→∞
−1 0 1 1 2
3
xn ∈ (E; +∞) ⇔ xn > E ⇔ n2 > E xn ∈ (−∞; −1) ∪ (1; +∞) ⇔ |xn | > 1 ⇔
(−1)n
Заметим далее такую цепочку: ⇔ n >1 ⇔
применяем равенства
⇔ n = 2k − 1, ⇔
n > E верно для почти всех n ∈ N∗ (−1)n = (−1)2k−1 = −1
2
4n+1 n
1) limn→∞ 3n−2 6= +∞; 2) limn→∞ 1−2n = −∞;
n
3) limn→∞ (−1) · n = ∞.
|xn | −→ 0
n→∞
Доказательство. Здесь необходимо проверить, что условия (i) и (ii) действительно равносильны.
Для этого перепишем свойство модуля 20 пункта 0.6, подставив вместо x последовательность {xn }:
xn −→ 0
n→∞
m
для всякого ε > 0 соотношение xn ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
для всякого ε > 0 соотношение |xn | ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
|xn | −→ 0
n→∞
xn −→ ∞
n→∞
|xn | −→ ∞
n→∞
xn −→ ∞
n→∞
m
для всякого ε > 0 соотношение xn ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N
m (4.1.17)
для всякого ε > 0 соотношение |xn | ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N
m
|xn | −→ ∞
n→∞
§ 2. Предел последовательности 261
Доказательство.
{xn } – бесконечно малая
m
xn −→ 0
n→∞
m
∀ε > 0 |xn | < ε – верно для почти всех n ∈ N∗
m
1 1
∀ε > 0 > – верно для почти всех n ∈ N∗
xn ε
m
1
∀E > 0 >E – верно для почти всех n ∈ N∗
xn
m
1
−→ ∞
xn n→∞
m
1
– бесконечно большая.
xn
xn −→ a
n→∞
xn = a + αn
Доказательство. Положим
αn = xn − a
и заметим сразу, что
(
a − ε < xn
xn ∈ (a − ε; a + ε) ⇐⇒ a − ε < xn < a + ε ⇐⇒ ⇐⇒
xn < a + ε
(
−ε < xn − a
⇐⇒ ⇐⇒ −ε < xn − a < ε ⇐⇒ −ε < αn < ε ⇐⇒ αn ∈ (−ε; ε)
xn − a < ε
C · αn = 0 −→ 0
n→∞
m
αn −→ 0
n→∞
m
∀ε > o |αn | < ε – верно для почти всех n ∈ N∗
m
ε
∀ε > o |αn | < – верно для почти всех n ∈ N∗
|C|
m
∀ε > o |C · αn | < ε – верно для почти всех n ∈ N∗
m
{C · αn } – бесконечно малая
2. Пусть {αn } и {βn } – бесконечно малые последовательности, покажем что тогда {αn + βn } –
тоже бесконечно малая последовательность:
⇓
αn −→ 0, βn −→ 0
n→∞ n→∞
⇓
∀ε > o |αn | < ε & |βn | < ε – верно для почти всех n ∈ N∗
⇓
ε ε
∀ε > o |αn | < & |βn | < – верно для почти всех n ∈ N∗
2 2
⇓
ε ε
∀ε > o |αn + βn | 6 |αn | + |βn | < + – верно для почти всех n ∈ N∗
2 2
⇓
{αn + βn } – бесконечно малая
Точно так же рассматривается случай {αn − βn }.
3. Пусть снова {αn } и {βn } – бесконечно малые последовательности, покажем что {αn · βn } –
тоже бесконечно малая последовательность:
⇓
§ 2. Предел последовательности 263
αn −→ 0, βn −→ 0
n→∞ n→∞
⇓
∀ε > 0 |αn | < ε & |βn | < ε – верно для почти всех n ∈ N∗
⇓
∀ε ∈ (0; 1) |αn | < ε & |βn | < ε – верно для почти всех n ∈ N∗
⇓
∀ε ∈ (0; 1) |αn · βn | = |αn | · |βn | < ε2 < ε – верно для почти всех n ∈ N∗
⇓
∀ε > o |αn · βn | < ε – верно для почти всех n ∈ N∗
⇓
{αn · βn } – бесконечно малая.
⇓
D + |C| + 1
>
z}|{
∀D > 0 |yn +xn | > (4.1.11) > |yn | −|xn | > (D+|C|+1)−|C|−1 = D – верно для почти всех n ∈ N∗
| {z }
<
−|C| − 1
⇓
xn + yn −→ ∞
n→∞
⇓ 5◦ на с.263
⊲ 4.2.39. Какие из последовательностей явля-
ются бесконечно малыми, а какие – бесконечно
nk −→ ∞ большими?
n→∞
2. Пусть k < 0. Тогда −k > 0, и, по уже дока- 1) xn = 1
n,
занному, 1
n−k −→ ∞ 2) xn = n2 ,
n→∞
3) xn = n,
⇓ теорема 4.2.34
4) xn = (−1)n · n,
1
nk = −→ 0 5) xn = (−1)
n
n−k n→∞ n ,
2
7) xn = n .
20 . Если xn −→ a и yn −→ b, то xn + yn −→ a + b и xn − yn −→ a − b.
n→∞ n→∞ n→∞ n→∞
30 . Если xn −→ a и yn −→ b, то xn · yn −→ a · b.
n→∞ n→∞ n→∞
yn
40 . Если xn −→ a и yn −→ b, причем a 6= 0 и xn 6= 0 (при любом n), то −→ ab .
xn n→∞
n→∞ n→∞
xn −→ a
n→∞
⇓ теорема 4.2.35
xn = a + αn
|{z}
n
↓ ↓
∞
0
C · xn = C · a + C · αn
| {z }
n
↓ ↓ (свойство 10 на с.262)
∞
0
⇓ теорема 4.2.35
C · xn −→ C · a
n→∞
2. Свойство 20 :
xn −→ a, yn −→ b
n→∞ n→∞
⇓ теорема 4.2.35
xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
xn + yn = a + b + αn + βn
| {z }
n
↓ ↓ (свойство 20 на с.262)
∞
0
⇓ теорема 4.2.35
xn + yn −→ a + b
n→∞
⇓ теорема 4.2.35
xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
⇓
266 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
свойство 10
на с.262
0
∞
↑ ↑
n
z }| {
xn · yn = a · b + αn · b + a · βn + αn · βn
| {z } | {z }
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
свойство 10 свойство 30
на с.262 на с.262
| {z }
n
0
↓ ↓ (свойство 2 на с.262)
∞
0
⇓ теорема 4.2.35
xn · yn −→ a · b
n→∞
1 1
xn −→ a (xn 6= 0 & a 6= 0) =⇒ −→
n→∞ xn n→∞ a
Доказательство. По условию, a 6= 0, значит либо a < 0, либо a > 0.
1
1. Рассмотрим сначала случай, когда a > 0. Тогда в силу (3.1.29), a > 0. Выберем произвольное
ε такое, что
1
0<ε<
a
Тогда
ε · a > 0 > −ε · a
⇓
1+ε·a>1 > 1−ε·a
⇓
1 1
<1<
1+ε·a 1−ε·a
⇓
a a
<a<
1+ε·a 1−ε·a
⇓ предложение 4.2.23
a a
∃δ > 0 : <a−δ <a<a+δ <
1+ε·a 1−ε·a
Запомним это число δ и заметим теперь цепочку:
xn −→ a
n→∞
⇓
xn ∈ (a − δ, a + δ) – выполняется для почти всех n ∈ N∗
⇓
a a
< a − δ < xn < a + δ < – выполняется для почти всех n ∈ N∗
1+ε·a 1−ε·a
⇓
a a
< xn < – выполняется для почти всех n ∈ N∗
1+ε·a 1−ε·a
§ 2. Предел последовательности 267
⇓
1+ε·a 1 1−ε·a
> > – выполняется для почти всех n ∈ N∗
a xn a
⇓
1 1 1
+ε> > −ε – выполняется для почти всех n ∈ N∗
a xn a
⇓
1 1 1
∈ − ε, + ε – выполняется для почти всех n ∈ N∗
xn a a
Мы получили, что любая “маленькая” окрестность a1 − ε; a1 + ε точки a1 (радиуса ε < a1 ) содер-
жит почти все элементы последовательности x1n . Отсюда следует, что любая “большая” окрестность
1 1
1 1 1
a − ε; a + ε точки a (радиуса ε > a ) тоже содержит почти все элементы последовательности xn
(потому что в ней можно выбрать какую-нибудь “маленькую” окрестность, которая будет содержать
почти все x1n ). Вместе это означает, что x1n −→ a1 .
n→∞
2. Мы доказали нашу лемму для случая, когда a > 0. Рассмотрим теперь случай a < 0. Тогда
будет по уже доказанному свойству 10 с.264 последовательность yn = −xn стремиться к числу
−a > 0. Значит, в силу уже доказанного в нашей лемме,
1 1
−→
yn n→∞ −a
Доказательство свойства 40 .
0 0
6=
6=
xn −→ a, yn −→ b
n→∞ n→∞
лемма 4.2.40 ⇓
1
−→ a1
xn n→∞
| {z }
⇓ свойство 30 на с.264
yn 1 1 b
= · yn −→ ·b=
xn xn n→∞ a a
C x1 x2 x3 x4 D
268 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
⋄ 4.2.41. Проверьте, будут ли следующие после- n2 + 1 n2 + 1
xn = , xn = ,
довательности ограничены? n n
(−1)n lim n o
n→∞ 3 +5
lim =0 n − nn+5
n→∞ n
C ∞
= 0 = ∞ (4.2.53)
∞ C
C 0
= ∞, = 0 (4.2.54)
0 C
C +∞= ∞ C ·∞= ∞ (4.2.55)
∞+∞= ∞ ∞·∞= ∞ (4.2.56)
§ 2. Предел последовательности 269
∞ 0
=? =? (4.2.57)
∞ 0
∞−∞= ? 0·∞= ? (4.2.58)
Здесь у нас уже достаточно опыта, чтобы сооб- Доказательство. Начнем со случая k = l:
разить сразу, что первая попытка “подставить в
лоб” снова приведет к неопределенности, поэто- Cnk n!
му мы можем сразу перейти к преобразованию = k =
nk n · k! · (n − k)!
дроби: k множителей
z }| {
0 0 0 n · (n − 1) · ... · (n − k + 1)
✒ ✒ ✒ = =
5 1 1 |n · n{z· ... · n} ·k!
− 2 + 3
5n2 − n + 1 n n n k множителей
lim 3 2
= lim = 0 0
n→∞ n + n + 2 n→∞ 1 2
| {z } 1+
n
+ 3
n ✒ ✒
делим числитель 1 k−1
и знаменатель на ❘
❅ ❘
❅ 1− · ... · 1 −
0 0
n n 1
максимальную степень n, = −→
то есть на n3
k! n→∞ k!
0 0
А при k > l мы получим:
✒ ✒
1+
1
+
5 Cnk Ck
n4 + n2 + 5 n2 n4 l
= nk−l · kn −→ ∞
lim 3 = lim = n n n→∞
n→∞ n − 3n + 2 n→∞ 1 3 2 ❘
❅
| {z }
n
−
n3
+
n4
∞ ❅ 1
❘
делим числитель k!
и знаменатель на ❘0
❅ ❘0
❅ ❘0
❅
максимальную степень n,
то есть на n4
1+0+0 1 ⊲⊲ 4.2.51. Вычислите пределы
= = = ∞ 2−n
0−0+0 0 ↑ 1) limn→∞ 3n+4
(4.2.54)
n2 −3
2) limn→∞
⋄ 4.2.49. 3n−4n2
3+2n+n2
3) limn→∞ 4−9n+4n3
раскрываем скобки
z }| { n2 +1 3n2 +1
4) limn→∞ −
(n + 5)3 − n(n + 7)2 2n+1 6n+1
lim = n2 +2n+1
2 5) limn→∞
nn
n→∞ n+5
= lim n3 + 15n2 + 75n + 125− 6) limn→∞ n3 −n2 +1
n→∞ 5−n−n2
§ 2. Предел последовательности 271
xn 6 yn (4.2.60)
и сходятся
xn −→ a yn −→ b
n→∞ n→∞
a6b
a−b
Доказательство. Предположим, что b < a. Тогда можно взять ε = 2 . Из xn −→ a будет следо-
n→∞
вать, что почти все числа xn лежат в окрестности (a − ε; a + ε). То есть, для почти всех номеров
n ∈ N выполняется неравенство
a − ε < xn < a + ε
С другой стороны, из yn −→ a будет следовать, что почти все числа yn лежат в окрестности
n→∞
(b − ε; b + ε). То есть, для почти всех номеров n ∈ N выполняется неравенство
b − ε < yn < b + ε
Таким образом, у нас получается, что для почти всех номеров n ∈ N выполняются неравенства
yn < b + ε = a − ε < xn
Аналогично доказывается
xn 6 yn
тогда
— если xn −→ +∞, то yn −→ +∞;
n→∞ n→∞
— если yn −→ −∞, то xn −→ −∞.
n→∞ n→∞
xn 6 yn 6 zn
xn −→ C zn −→ C
n→∞ n→∞
yn −→ C
n→∞
3 Этот результат используется ниже в разных ситуациях, в частности, при доказательстве теоремы 4.3.20 о сохра-
нении знака непрерывной функцией
4 Эта теорема также используется довольно часто, например, при доказательстве теоремы Больцано-Вейерштрасса
4.2.68, при доказательстве непрерывности модуля, синуса и косинуса (предложение 5.1.49) и при доказательстве
замечательных пределов (теоремы 5.2.58 и 5.2.64).
272 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
x1 x2 x3 x4
§ 2. Предел последовательности 273
– убывающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...
x4 x3 x2 x1
– неубывающей, если
x1 6 x2 6 x3 6 ... 6 xn 6 xn+1 6 ...
x1 x2 x3 ; x4 x5
– невозрастающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...
x5 x3 ; x4 x2 x1
(−1)n
⋄ 4.2.56. Последовательность xn = 1
n монотонна ⋄ 4.2.58. Последовательность xn = n немо-
(точнее, убывает) и ограничена; нотонна, но ограничена;
0 1 1 1
3 2
1 2 3
lim xn = sup xn
n→∞ n∈N
lim xn = inf xn
n→∞ n∈N
5 Этот результат используется далее при доказательстве теоремы о вложенных отрезках 4.2.62 и при доказательстве
второго замечательного предела (лемма (c)).
274 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Доказательство. Если последовательность {xn } монотонна, то это значит, что она или неубываю-
щая, или невозрастающая. Докажем теорему для случая, когда {xn } – неубывающая (случай, когда
она невозрастающая рассматривается аналогично):
B − ε < xk 6 xn ,
B−ε B+ε
x1 x2 x3 x4 x5 B
Итак, получается, что любая окрестность (B−ε, B+ε) точки B содержит почти все точки последова-
тельности {xn }. Значит
lim xn = B.
n→∞
⋄ 4.2.60. Покажем, что последовательность, за- Поймем сначала, что означает это неравенство:
данная рекуррентно
умножаем на 2xn ;
поскольку xn > 0,
1 1 знак неравенства не меняется
x1 = 2, xn+1 = xn + ↓
2 xn
z }| {
1 1
сходится, и найдем ее предел. xn+1 6 xn ⇔ xn + 6 xn ⇔
2 xn
1. Вычислим сначала несколько первых эле-
ментов последовательности {xn }, и нарисуем ⇔ x2n + 1 6 2x2n ⇔ x2n > 1 ⇔ xn > 1
картинку:
Теперь докажем, последнее неравенство:
xn > 1 (4.2.64)
41 5 2
40 4
Это делается математической индукцией.
a) Сначала проверяем наше неравенство при
2. Заметим, что все числа {xn } положитель- n = 1:
ны:
x1 = 2 > 1
xn > 0
(это можно отдельно доказать индукцией). b) Предполагаем, что оно верно при n = k:
3. Из картинки видно, что на первых
xk > 1 (4.2.65)
нескольких элементах {xn } наша последователь-
ность невозрастает. Попробуем доказать, что она
невозрастает всегда: c) Доказываем, что тогда оно будет верно при
n = k + 1.
xn+1 6 xn (4.2.63) xk+1 > 1 (4.2.66)
§ 2. Предел последовательности 275
Действительно, получаем
умножаем на 2xk , 1 1 1 1
и, поскольку xn > 0, c = lim xn+1 = lim xn + = c+
знак неравенства не меняется n→∞ n→∞ 2 xn 2 c
↓
z }| { То есть c удовлетворяет уравнению
1 1
xk+1 > 1 ⇔ xk + >1 ⇔
2 xk 1 1
c= c+
⇔ x2k + 1 > 2xk ⇔ x2k − 2xk + 1 > 0 ⇔ 2 c
⇔ (xk − 1)2 > 0 решая которое мы получаем
а последнее неравенство выполняется всегда (по- 2c2 = c2 + 1 ⇔ c2 = 1
тому что квадрат любого числа неотрицателен).
Итак, мы доказали (4.2.63), а значит и рав- откуда (с учетом c > 0) имеем c = 1.
носильное ему условие (4.2.64). Эти неравенства Ответ: limn→∞ xn = 1
означают, что {xn } невозрастает и ограничена
сверху. Значит, по теореме Вейерштрасса 4.2.59 ⊲⊲ 4.2.61. Докажите, что последовательность,
она имеет предел. Обозначим его буквой c: заданная рекуррентно сходится, и найдите ее
предел:
lim xn = c 1) x = 3, x = 5xn ;
n→∞ 1 n+1 3xn +1
4xn
и заметим, что c > 0, поскольку xn > 0. Тогда из 2) x1 = 1, xn+1 = 2+x2n ;
формулы 3) x1 = −1, xn+1 = xn (xn +4)
;
1 1 2
xn+1 = xn + 4) x1 = 2, xn+1 = xn (6−xn )
.
2 xn 3
Теорема о вложенных отрезках. Пусть дана последовательность отрезков [an ; bn ] такая, что
каждый последующий содержится в предыдущем:
bn − an −→ 0 (4.2.68)
n→∞
A = lim an B = lim bn
n→∞ n→∞
то есть
A=B
Итак, мы получили, что можно взять C = A = B, и тогда будет выполняться (4.2.70). По теореме
Вейерштрасса 4.2.59, получаем
и это означает, что C принадлежит всем интервалам [an ; bn ]. Наконец, такая точка C (обладающая
свойством (4.2.69)), единственна, потому что если бы существовала какая-то другая точка C ′ с тем
же самым свойством (4.2.69), отличющаяся от C, например, большая, чем C, то мы получили бы,
цепочку неравенств
из которых следовало бы, что расстояние между концами любого отрезка [an ; bn ] не меньше чем
фиксированное число ∆ = C ′ − C
b n − an > C ′ − C = ∆ > 0
nk −→ +∞
k→∞
Тогда можно рассмотреть последовательность yk = xnk (зависящую от индекса k). Она называется
подпоследовательностью числовой последовательности xn .
⋄ 4.2.63. Пусть, скажем, нам дана последова- ⊲⊲ 4.2.65. Какую нужно взять последователь-
тельность ность индексов {nk }, чтобы последовательность
1 {yk } была подпоследовательностью последова-
xn =
n тельности {xn }?
Если взять
nk = k 2 1) xn = n1 , yk = k13
2) xn = (−1)n , yk = −1
то мы получим подпоследовательность
1 1 ⊲⊲ 4.2.66. Является ли данная последователь-
yk = xnk = = 2 ность {yk } подпоследовательностью последова-
nk k
тельности {xn }? (Если да, то указать соответ-
⋄ 4.2.64. Пусть ствующую последовательность индексов {nk }.)
n
xn = (−1) 1) xn = n, yk = k 2 ,
Если взять 2) xn = n2 , yk = k,
nk = 2k 3) xn = n, yk = 2.
то мы получим подпоследовательность
yk = xnk = (−1)nk = (−1)2k = 1
Свойства подпоследовательностей
1◦ . Если последовательность {xn } стремится к числу a, то любая ее подпоследователь-
ность {xnk } тоже стремится к числу a:
xn −→ a =⇒ xnk −→ a
n→∞ k→∞
§ 2. Предел последовательности 277
Nk = {n ∈ N∗ : n 6 k} 6= ∅
nk ∈ N k
7 Точнее, дважды: при доказательстве свойства 30 в этом списке и теоремы Больцано-Вейерштрасса 4.2.68 ниже.
278 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
xnk ∈
/ (a − ε, a + ε), k ∈ N∗
то есть
|xnk − a| > ε, k ∈ N∗
И, во-вторых,
nk > k, k ∈ N∗ ,
откуда по теореме 4.2.53 о предельном переходе в неравенстве, nk −→ +∞, то есть {xnk } –
k→∞
подпоследовательность в {xn }.
3. Как и в предыдущем случае, мы даем два доказательства свойства 30 : традиционное и с явной
ссылкой на аксиому (счетного) выбора.
а) Доказательство приемом бесконечнократного выбора. Пусть supn∈N |xn | = +∞, построим под-
последовательность xnk −→ ∞.
k→∞
1) Сначала выбирается индекс n1 . Это делается так: поскольку {xn } неограничена, найдется
такой номер n1 , что
|xn1 | > 1
Этот номер n1 фиксируется.
2) Затем выбирается индекс n2 : поскольку {xn } неограничена, найдется такой номер n2 , что
|xn2 | > 2
∀k ∈ N |xnk | > k
∀k ∈ N∗ {n ∈ N∗ : |xn | > k} 6= ∅
то есть
|xnk | > k, k ∈ N∗ .
Отсюда следует xnk −→ ∞.
k→∞
◦
4. Свойство 4 доказывается тем же приемом, только номера nk здесь нужно выбирать так,
чтобы выполнялись не одно, а два условия:
Можно заметить, что иногда получается, что, хотя данная последовательность {xn } расходится
(то есть не имеет предела), тем не менее, выбранная подпоследовательность {yk } сходится.
§ 2. Предел последовательности 279
n
⊲⊲ 4.2.67. Для данной последовательности {xn } 3) xn = n(−1) ,
укажите какую-нибудь сходящуюся подпоследо- 4) xn = (−1)n · n(−1)
n
−1
,
вательность {xnk }, если она существует. n
5) xn = n · (1 + (−1) ),
n
1) xn = (−1) · n, 2+(−1)n
6) xn = 2 − n1 ,
(−1)n 1+(−1)n n−1 3
2) xn = n + 2 , 7) xn = (−1) · 2+ n .
diam I = b − a
card{n ∈ N∗ : xn ∈ I} = ∞
card{n ∈ N∗ : xn ∈ J} = ∞
Доказательство. Это очевидно: разделим отрезок I на два равных (по длине) отрезка J и K. По
крайней мере в одном из них должно содержаться бесконечное число элементов {xn } (потому что
иначе получилось бы, что J и K содержат конечный набор элементов {xn }, и значит их объединение
I = J ∪ K тоже содержит конечный набор элементов.
Доказательство теоремы 4.2.68. В соответствии с обещанием на с.277, мы даем здесь два доказа-
тельства: приемом бесконечнократного выбора и с явной ссылкой на аксиому (счетного) выбора.
а) Доказательство приемом бесконечнократного выбора.
1) Последовательность {xn } ограничена, значит она лежит в некотором отрезке I1 = [a1 ; b1 ].
Положим n1 = 1, и заметим на будущее, что xn1 ∈ I1 = [a1 ; b1 ].
2) По лемме 4.2.69, в I1 содержится некий отрезок I2 = [a2 ; b2 ] вдвое меньшей длины,
diam I1
diam I2 = ,
2
также содержащий бесконечно много чисел {xn }. Выбираем какой-нибудь номер n2 > 2, такой
что xn2 ∈ I2 = [a2 ; b2 ] (такой номер n2 найдется, потому что xn ∈ [a2 ; b2 ] для бесконечного
количества номеров n).
3) Опять по лемме 4.2.69, в I2 содержится некий отрезок I3 = [a3 ; b3 ] вдвое меньшей длины,
diam I2
diam I3 = ,
2
также содержащий бесконечно много чисел {xn }. Выбираем какой-нибудь номер n3 > 3, такой
что xn3 ∈ I3 = [a3 ; b3 ] (такой номер n3 найдется, потому что xn ∈ [a3 ; b3 ] для бесконечного
количества номеров n).
Продолжая эту процедуру, мы получим последовательность отрезков Ik = [ak ; bk ] и чисел xnk
со следующими свойствами:
(теорема 4.2.70), а также при доказательстве теорем Вейерштрасса об ограниченности и об экстремумах (теоремы
4.3.23 и 4.3.28) и теоремы Кантора о равномерной ограниченности (теорема 4.3.32)
280 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Первые два свойства означают, что [ak ; bk ] – последовательность вложенных отрезков, значит,
по теореме 4.2.62 о вложенных отрезках, существует число C такое что
lim ak = C = lim bk
k→∞ k→∞
ak 6 xnk 6 bk
и поэтому мы можем применить теорему о двух милиционерах 4.2.54, из которой следует, что
lim xnk = C
k→∞
J ∈I ⇐⇒ J ⊆I & card{n ∈ N∗ : xn ∈ J} = ∞
(множество I непусто, потому что, например, I ∈ I). Пусть теперь I1 , I2 , ..., Ik – конечная по-
следовательность отрезков, удовлетворяющая таким условиям:
diam Ii
{I1 , ...Ik } ⊆ I, I1 ⊃ I2 ⊃ ... ⊃ Ik , ∀i < k diam Ii+1 = , (4.2.72)
2
Тогда по лемме 4.2.69, найдется отрезок J со свойствами:
diam Ik
J ∈ I, J ⊂ Ik , diam J = . (4.2.73)
2
Это наблюдение можно переформулировать таким хитрым образом: для любой последователь-
ности I1 , I2 , ..., Ik , удовлетворяющей условиям (4.2.72), множество J (I1 , I2 , ..., Ik ) всех отрезков
J, удовлетворяющих условиям (4.2.73), непусто:
diam Ik
J (I1 , I2 , ..., Ik ) = J ∈ I : J ⊂ Ik , diam J = 6= ∅
2
Теперь мы применяем аксиому выбора: должно существовать отображение (I1 , I2 , ..., Ik ) 7→ G(I1 , I2 , ..., Ik ),
которое каждой последовательности (I1 , I2 , ..., Ik ) отрезков, удовлетворяющих условиям (4.2.72),
ставит в соответствие отрезок G(I1 , I2 , ..., Ik ), принадлежащий J (I1 , I2 , ..., Ik ), то есть удовлетво-
ряющий условиям
diam Ik
G(I1 , I2 , ..., Ik ) ∈ I, G(I1 , I2 , ..., Ik ) ⊂ Ik , diam G(I1 , I2 , ..., Ik ) = . (4.2.74)
2
После этого мы применяем теорему 3.2.6 об определениях частной индукцией: если положить
I1 = I, то это определит последовательность {Ik } ∈ I, содержащую I1 в качестве первого эле-
мента и удовлетворяющую условию
Но здесь верхняя грань равна бесконечности, потому что наше отображение G было определено
на всех конечных последовательностях со свойствами (4.2.72). Поэтому последовательность {Ik },
определяемая теоремой 3.2.6 должна быть бесконечной.
Теперь каждый отрезок {Ik } содержит бесконечный набор элементов {xn }, поэтому
{n > k : xn ∈ Ik } 6= ∅
§ 2. Предел последовательности 281
Отсюда по аксиоме счетного выбора (с.251) следует, что существует последовательность номеров
nk ∈ {n > k : xn ∈ Ik }
pi −→ ∞, qi −→ ∞ (4.2.75)
i→∞ i→∞
xn −→ ∞
n→∞
Лемма 4.2.72. Если последовательность {xn } обладает свойством (i) теоремы 4.2.70, то она
ограничена.
Доказательство. Предположим, что это не так, то есть что {xn } – неограниченная последова-
тельность, обладающая свойством (i). Тогда по свойству 30 предыдущего параграфа, нашлась бы
подпоследовательность {xnk } такая что
xnk −→ ∞
k→∞
а по лемме 4.2.71 это означало бы, что можно выбрать подпоследовательность {xnki } последова-
тельности {xnk } такую что
xnki − xnki−1 −→ ∞
k→∞
pi = nki , qi = nki−1
Но это невозможно, потому что {xn } обладает свойством (i). Значит, наше исходное предположение
(о том, что {xn } – неограниченная последовательность) неверно. То есть {xn } обязательно ограни-
чена.
Доказательство теоремы 4.2.70. Убедимся сначала что условия (i) и (ii) действительно эквива-
лентны.
1. Импликация (i) ⇒ (ii) очевидна: если выполняется (i) то есть любые две подпоследователь-
ности {xpi } и {xqi } последовательности {xn } стремятся друг к другу
xpi − xqi −→ 0,
i→∞
то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение
2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(4.2.78). Возьмем какие-нибудь две бесконечно большие последовательности индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
Положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
xmax{pi ;qi } − xmin{pi ;qi } , если pi > qi xki +li − xki , если pi > qi
xpi − xqi = x − xmax{pi ;qi } , если pi < qi = xk − xki +li , если pi < qi
min{pi ;qi } i
0, если pi = qi 0, если pi = qi
Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {xn } сходится, то есть существует конечный
предел
lim xn = a
n→∞
то {xn } обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие по-
следовательности индексов {pi }, {qi } ⊆ N
pi −→ ∞, qi −→ ∞
i→∞ i→∞
xpi − xqi −→ a − a = 0
i→∞
xni −→ a (4.2.80)
i→∞
pi = i, qi = ni
n
⊲⊲ 4.2.73. Проверьте с помощью критерия Коши 1) xn = 3(−1) ;
сходимость последовательностей: 2
2) xn = { n n+1 }.
Теорема Штольца—Чезаро.
Теорема 4.2.74 (О.Штольц, Э.Чезаро). 10
Пусть {yn } и {zn } – две последовательности, причем
(i) {yn } строго монотонна:
y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ... (4.2.82)
zn − zn−1
lim =A (4.2.84)
n→∞ yn − yn−1
10 Otto Stolz (1842–1905), Ernesto Cesàro (1859 – 1906). Эта теорема используется при доказательстве правила Ло-
zn zn − zn−1
lim = lim =A (4.2.85)
n→∞ yn n→∞ yn − yn−1
сводится к случаю возрастающей заменой ỹn = −yn , (ỹ1 < ỹ2 < ... < ỹn < ...). Заодно можно счи-
тать, что все yn положительны:
0 < y1 < y2 < ... < yn < ... (4.2.86)
zn −zn−1
Из условия (iii) следует, что yn −yn−1 представимо в виде
zn − zn−1
= A + αn , (4.2.87)
yn − yn−1
где
αn −→ 0 (4.2.88)
n→∞
⇓
zn − zn−1 = αn · (yn − yn−1 ) + A · (yn − yn−1 )
z
n−1 − zn−2 = αn−1 · (yn−1 − yn−2 ) + A · (yn−1 − yn−2 )
...
zN +1 − zN = αN +1 · (yN +1 − yN ) + A · (yN +1 − yN )
⇓ (складываем уравнения)
⇓
zn − zN = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + A · (yn − yN )
⇓
zn − A · yn = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + zN − A · yN
§ 2. Предел последовательности 285
⇓
zn − A · yn = αn (yn − yn−1 ) + ... + αN +1 (yN +1 − yN ) + zN − A · yN 6
6 |αn | ·yn − yn−1 + ... + |αN +1 | ·yN +1 − yN + zN − A · yN <
|{z} | {z }
>
>
(4.2.89) (4.2.89)
ε ε
2 2
ε
ε
< · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2 | {z } 2 | {z }
<
<
(4.2.82) (4.2.82)
0 0
ε ε
= · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2 2
ε
= · yn − yn−1 + ... + yN +1 − yN + zN − A · yN =
2 | {z }
после сокращений остаются
только первое и последнее слагаемое
0
>
(4.2.86)
ε z}|{
ε ε
= · yn − yN + zN − A · yN < · yn + · yn = ε · yn
2 | {z } | {z } 2 2
>
> (4.2.90)
yn ε
2 · yn
⇓
zn − A · yn < ε · yn
⇓
z
n
− A < ε
yn
У нас получилось, что для всякого ε > 0 найдется M такое, что
z
n
∀n > M − A < ε
yn
То есть
zn
∀n > M −ε< −A<ε
yn
zn
Иными словами, для любого ε > 0 почти все числа yn − A лежат в интервале (−ε, ε). Значит,
zn
− A −→ 0
yn n→∞
то есть,
zn
−→ A
yn n→∞
⇓ то для N = m + 1 мы получаем:
m+1
X
[x · 10N ] a−k · 10−k =
x − xN = x − =
10N k=1
x · 10N [x · 10N ] x · 10N − [x · 10N ] xm
= N
− N
= = z }| {
10 10 10N Xm
{x · 10N } 1 = a−k · 10−k +a−m−1 · 10−m−1 =
= (3.2.155) = ∈ 0, N
10N 10 k=1
= xm + a−m−1 · 10−m−1 = (4.2.95) =
2. Докажем (4.2.96). Сначала заметим, что
= xm + (xm+1 − xm ) · 10m+1 · 10−m−1 =
∀k ∈ N∗ xk · 10k = [x · 10k ] ∈ Z = xm + (xm+1 − xm ) = xm+1
⇓
x1 , k=1
a−k = ∈Z
(xk − xk−1 ) · 10k , k>1 Из леммы 4.2.75 и теоремы 3.2.33 следует
Теперь для k = 1 получаем: Теорема 4.2.76. Всякое число x > 0 предста-
0<x<1 вимо в виде
n
X N
X
⇓
x= ak · 10k + lim a−k · 10−k (4.2.98)
N →∞
0 < x · 10 < 10 k=0 k=1
⇓ (3.2.154)
где n ∈ N, ai ∈ {0, 1, ..., 9}.
0 6 [x · 10] < 10
Доказательство. Разложим x в сумму целой и
⇓ дробной части:
a−1 = [x · 10] ∈ {0, 1, ..., 9}
x = [x] + {x}
Затем для k > 1 получаем:
1 Если [x] = 0, то в (4.2.98) нужно положить n = 0,
0 6 x − xk−1 < (4.2.92) a0 = 0, если же [x] 6= 0, то по теореме 3.2.33 [x]
10k−1
можно представить в виде
⇓
n
X
0 6 (x − xk−1 ) · 10k < 10 [x] = ak · 10k (ak ∈ {0, 1, ..., 9})
⇓ (3.2.154) k=0
N
[x·10k ]
− xk−1 · 10k
X
10k {x} = lim a−k · 10−k (a−k ∈ {0, 1, ..., 9}).
N →∞
=
k=1
(xk − xk−1 ) · 10k
=
a−k
§ 2. Предел последовательности 287
❯
❆ Наша задача – проверить, что E = e. С одной
0
стороны,
= lim yn ∈ R.
n→∞
n n
X
1 1
1+ = (3.2.112) = Cnk · k =
n n
k=0
Теорема 4.2.81. Число Непера e удовлетворя- n
X n! 1
ет соотношению: = · k =
k! · (n − k)! n
n k=0
X 1 k
n
X 1
e = lim (4.2.100) n! 1
n→∞ k! = · · =
k=0 k! (n − k)! n
k=0
причем для любого n ∈ N∗ справедливо двойное Xn
1 1 1
неравенство: = · n · ... · (n − k + 1) · · ... · =
k! | {z } |n {z n}
k=0
n k множителей
X 1 1 k множителей
0<e− 6 (4.2.101) n
X 1 n n−1 n−k+1
k! n! · n = · · · ... · =
k=0
k! n
| n {z n }
k=0
или, что то же самое двойное неравенство k множителей
Xn
n
X n
X 1 1 k−1
1 1 1 = ·1· 1− · ... · 1 − 6
<e6 + (4.2.102) k! n n
k! k! n! · n k=0 | {z }
k=0 k=0
k множителей, и все 6 1
Xn
Доказательство. Обозначим 1
6 = En
n
X k!
1 k=0
En =
k! ⇓
k=0
n
1
и докажем сначала равенство (4.2.100). e = lim 1+ 6 lim En = E
n→∞ n n→∞
1. Поскольку
А с другой – при любом m 6 n
n
X n
X
1 1 1 Pm 1
En = < + = Em = k=0 k!
k! k! (n + 1)! ↑ (n → ∞)
k=0 k=0
n+1 z }| {
X 1 Xm
= = En+1 , 1 1 k−1
k! ·1· 1− · ... · 1 − 6
k=0 k! n n
k=0
§ 2. Предел последовательности 289
Xn
1 1 k−1 ! 4.2.82. Двойное неравенство (4.2.102) позволя-
6 ·1· 1− · ... · 1 − =
k! n n ет оценивать число e. Для нахождения двух пер-
k=0
n вых знаков после запятой можно взять n = 7:
1
= 1+ 7
X 7
X
n 1 1 1
| {z } <e6 +
k! k! 7! · 7
↓ (n → ∞) k=0 k=0
e
Значения величин справа и слева можно при-
⇓ ближенно вычислить (на бумаге, или с помощью
калькулятора), получив оценки сверху и снизу,
Em 6 e (m ∈ N∗ ) из которых затем выводится оценка для e: с од-
⇓ ной стороны,
E = lim Em 6 e 1
= 0, 000198412698...
m→∞ 8!·8
⇓
2. Докажем теперь (4.2.101). Первое неравен- 1
0, 00019 < 8!·8 < 0, 0002
ство здесь следует из возрастания последова-
тельности En : с другой –
e = lim Em = sup Em > En+1 > En P8 1
m→∞ m∈N
= 2, 71827877...
k=0 k!
⇓
⇓ P8 1
2, 718 < k=0 k! < 2, 719
e − En > 0
И вместе это дает:
А второе – из неравенства (3.2.106): для любых
n, p ∈ N∗ мы получим 8
X 1
8
X 1 1
2, 718 < <e< + <
(n + m)! > n! · (n + 1)m (3.2.106) k! k! 8! · 8
k=0 k=0
n+p n n+p ⇓
X 1 X 1 X 1
En+p − En = − = =
k! k! k!
k=0 k=0 k=n+1 e = 2, 71... (4.2.104)
p
m = k − n X 1
= 6 Теорема 4.2.83. Число e иррационально:
k =
16m6p
m + n
= (n + m)!
m=1
Xp p m /Q
e∈
1 1 X 1
6 = · =
m=1
n! · (n + 1)m n! m=1 n + 1 Доказательство. Предположим, что оно рацио-
p+1 нально, то есть имеет вид
1 1
1 n+1 − n+1
= (3.2.108) = · 1 = m
n! 1 − n+1 e=
p p n
1 1
1 1 − n+1 1 1 − n+1 для некоторых m, n ∈ N∗ . Из оценки (4.2.103)
= · = ·
n! n+1−1 n! n следует, что n > 2 (потому что при n = 1 мы по-
лучили бы, что e целое). Запомним это. Из двой-
⇓ ного неравенства (4.2.101) мы получаем:
p
1
1 1− n
En+p − En 6 ·
n+1
m X 1 1
| {z } n! 0< − 6
| {z n } n k! n! · n
(p → ∞) ↓ k=n
↓ (p → ∞)
e − En 1
n!·n
⇓
⇓ n
m · n! X n! 1
1 0< − 6
e − En 6 n k! n
n! · n k=n
⇓
290 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
n
X Мы получаем, что в полуинтервале 0; 21 лежит
0 < m · (n − 1)! − n · (n − 1) · ... · (n − k) 6
| {z } | {z } какое-то целое число. Понятно, что это невоз-
k=n
|
целое
{z
целое
} можно, и значит наше предположение (о раци-
целое ональности e) было неверным.
1 1
6 6
n 2
§3 Непрерывные функции
(a) Что такое непрерывная функция?
Пусть нам дано уравнение, связывающее две физические величины,
y = f (x),
и мы говорим, что y непрерывно зависит от x. Что это означает? Интуитивный ответ очевиден:
непрерывная функция – это такая, у которой график – непрерывная линия.
x
y = x2
0
x −1
Однако, это соображение не может быть точным определением, потому что оно объясняет смысл
одного нового понятия (непрерывная функция) с помощью другого нового понятия (непрерывная
линия).
Математиками было найдено несколько способов решения этой проблемы, из которых самый
простой — объяснить суть дела, опираясь на известное нам уже (то есть, старое для нас) понятие
предела последовательности. Это делается с помощью следующей серии определений.
f (xn ) −→ f (a)
n→∞
§ 3. Непрерывные функции 291
f (a)
f (x3 )
f (x2 )
f (x1 )
0 x1 x2 x3 a x
6
f (xn )−→ f (a)
n→∞
f (x3 )
f (x2 )
f (x1 )
f (a)
0 x1 x2 x3 a x
⋄ 4.3.3. Функция f (x) = x2 будет непрерывна ⊲ 4.3.7. В каких точках непрерывна функция
на множестве E = R, потому что (по свойству f (x) = [x] (целая часть числа)?
30 сходящихся последовательностей на с.265) из
условия xn −→ a следует условие f (xn ) = ⊲ 4.3.8. Для следующих функций найдите точки
n→∞
(xn )2 −→ a2 = f (a). разрыва (если они есть) и докажите, что в этих
n→∞
точках функции действительно разрывны:
⋄ 4.3.4. Наоборот, функция сигнум f (x) = sgn x,
определенная выше формулой (4.1.3), разрывна 1 − x, если x > 0
на множестве E = R, точнее, в точке x = 0, по-
f (x) = −1 − x, если x < 0 ,
тому что если взять последовательность
0, если x = 0
1
xn = −→ 0
n n→∞
то окажется, что
0, если x < 0
g(x) = 2
f (xn ) = 1 −→ 1 6= 0 = f (0) x , если 0 6 x 6 1 ,
n→∞
0, если x > 1
Однако, в любой другой точке она непрерыв-
на. Например, в любой точке a > 0: если взять ⋄ 4.3.9. Непрерывность модуля Функция
ε = a > 0 и рассмотреть окрестность (0; 2a) = f (x) = |x| непрерывна.
(a − ε; a + ε), то для всякой последовательности
xn −→ a Доказательство. Для любой точки a ∈ R и лю-
n→∞
бой последовательности xn −→ a получаем це-
мы получим, что почти все числа xn лежат в ин- n→∞
почку следствий:
тервале (0; 2a), значит, для почти всех n ∈ N вы-
полняется неравенство
xn −→ a
n→∞
xn > 0
⇓ теорема 4.2.35
поэтому для почти всех n ∈ N xn − a −→ 0
n→∞
f (xn ) = sgn xn = 1 определение
⇓ бесконечно малой
на с.260
и следовательно,
|xn − a| −→ 0
n→∞
f (xn ) −→ 1 = f (a)
n→∞ ⇓ (4.1.12)
{xn } = (3.2.156) = xn −→ 1,
n→∞
⋄ 4.3.10. Непрерывность линейной функ-
то есть
ции. Функция вида
{xn } −→
6 0 = {1}.
n→∞
В силу периодичности функции f (x) = {x}, от- f (x) = kx + b, k, b ∈ R (4.3.105)
сюда следует, что она разрывна в любой точке
a ∈ Z. С другой стороны, нетрудно убедиться, называется линейной. Покажем, что она непре-
/ Z.
что она непрерывна в любой точке a ∈ рывна.
§ 3. Непрерывные функции 293
Доказательство. Ясно, что из (i) следует (ii), потому что если f непрерывна в a, то f (xn ) −→ f (a)
n→∞
для любой последовательности xn −→ a (необязательно монотонной). Докажем, что наоборот если
n→∞
(i) не выполняется, то не выполняется и (ii). Пусть f – разрывная функция на M , то есть существует
последовательность xn ∈ M такие что
xn −→ a & 6
f (xn )−→ f (a)
n→∞ n→∞
294 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
∀k ∈ N∗ f (xnk ) ∈
/ (f (a) − ε; f (a) + ε)
yk −→ a & ∀k ∈ N∗ f (yk ) ∈
/ (f (a) − ε; f (a) + ε)
k→∞
∀k ∈ N∗ yk 6= a
потому что иначе мы получили бы, что для некоторых k числа f (yk ) = f (a) лежат в интервале
(f (a) − ε; f (a) + ε). Отсюда следует, что либо бесконечный набор этих чисел лежит левее a, либо
бесконечный набор этих чисел лежит правее a. Будем для определенности считать, что выполняется
первое (второй случай рассматривается по аналогии):
yk < a.
∀i ∈ N∗ yki < a
i1 = 1, t1 = z 1
Затем, если для m = 1, ..., l числа im и tm определены, мы замечаем вот что. Поскольку zi < a,
zi −→ a и tl < a, найдется такое il+1 , что zil+1 лежит в интервале (tl ; a):
i→∞
zil+1 > tl
tm = zim −→ a
m→∞
∀m ∈ N∗ f (tm ) = f (zim ) ∈
/ (f (a) − ε; f (a) + ε)
0 0 0
Поэтому, в силу свойств 1 , 2 , 4 из (a), мы получаем
f (xn ) + g(xn ) −→ f (a) + g(a) f (xn ) − g(xn ) −→ f (a) − g(a) f (xn ) · g(xn ) −→ f (a) · g(a)
n→∞ n→∞ n→∞
Теорема 4.3.19 (о композиции непрерывных функций). Если функции f и g непрерывны (на обла-
сти определения), то их композиция h(x) = g(f (x)) тоже непрерывна (на области определения).
f (xn ) −→ f (a)
n→∞
Мы получили, что если xn −→ a, то h(xn ) = g(f (xn )) −→ g(f (a)). Это означает, что h(x) = g(f (x))
n→∞ n→∞
непрерывна в точке x = a. Поскольку точка a с самого начала выбиралась произвольной, получаем,
что h(x) = g(f (x)) непрерывна в произвольной точке, то есть всюду на области определения.
Доказательство. Пусть для определенности f (c) > 0, покажем что для некоторого δ > 0 выполня-
ется соотношение
∀x ∈ (c − δ; c + δ) f (x) > 0 (4.3.113)
11 Эта теорема используется далее в главе 6 при доказательстве теоремы 6.2.30 о точках перегиба.
§ 3. Непрерывные функции 297
y = f (x)
f (c)
f (x)
x c
0 x
∀δ > 0 ∃x ∈ (c − δ; c + δ) f (x) 6 0
1
Тогда, в частности, оно не выполняется для чисел δn = n:
1 1
∀n ∈ N ∃xn ∈ c − ; c + f (xn ) 6 0
n n
xn −→ c (4.3.114)
n→∞
для которой
f (xn ) 6 0 (4.3.115)
Поскольку f непрерывна в точке c, из (4.3.114) следует
f (xn ) −→ f (c)
n→∞
f (c) 6 0
Это противоречит предположению, что f (c) > 0. Значит, (4.3.113) все-таки должно выполняться
для какого-то δ > 0.
ϕ(c) = 0
y = ϕ(x)
ϕ(b)
a b
0 c x
ϕ(a)
298 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Разделим отрезок [a; b] пополам. Если значение функции в середине отрезка равно нулю, то теорема
доказана. Если же нет, то выберем из двух половинок ту, у которой на концах функция ϕ принимает
значения разных знаков, и обозначим ее [a1 ; b1 ]:
Проделаем то же самое с отрезком [a1 ; b1 ]: разделим его пополам, выберем ту половинку, на концах
которой ϕ(x) меняет знак, и обозначим ее [a2 ; b2 ]:
Затем поделим отрезок [a2 ; b2 ], и так далее. В результате у нас получится цепочка вложенных
отрезков, на концах которых функция меняет знак:
b−a
[a; b] ⊃ [a1 ; b1 ] ⊃ [a2 ; b2 ] ⊃ ... b n − an = −→ 0, ϕ(an ) < 0 < ϕ(bn )
2n n→∞
По теореме 4.2.62 о вложенных отрезках, существует единственная точка c, принадлежащая всем
отрезкам [an ; bn ], причем
lim an = c = lim bn
n→∞ n→∞
И следовательно, ϕ(c) = 0.
f (c) = C
ϕ(x) = f (x) − C
Она будет непрерывна на отрезке [a; b] (как разность непрерывных функций) и принимает на концах
этого отрезка значения разных знаков
ϕ(a) = f (a) − C < 0 < f (b) − C = ϕ(b) или ϕ(a) = f (a) − C > 0 > f (b) − C = ϕ(b)
Поэтому, по лемме 4.3.21, существует точка c ∈ [a; b] такая, что ϕ(c) = 0. Отсюда f (c) = ϕ(c) + C =
C.
Теоремы Вейерштрасса
Теорема Вейерштрасса об ограниченности. Напомним, что функция f называется
– ограниченной сверху на множестве E, если существует число B такое, что
∀x ∈ E f (x) 6 B
∀x ∈ E A 6 f (x)
12 Эта теорема используется далее на с.492 при доказательстве теоремы о среднем для определенного интеграла.
§ 3. Непрерывные функции 299
∀x ∈ E A 6 f (x) 6 B
Но с другой стороны, функция f непрерывна в любой точке отрезка [a; b], и в частности в точке
c ∈ [a; b], значит из (4.3.117) следует
Мы получили противоречие между (4.3.118) и (4.3.119), которое означает, что наше исходное пред-
положение было неверно. Значит, функция f все-таки ограничена.
∀x ∈ E f (x) 6 f (xmax )
∀x ∈ E f (xmin ) 6 f (x)
13 Эта теорема используется в следующем параграфе при доказательстве теоремы Вейерштрасса об экстремумах
4.3.28
300 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
⋄ 4.3.25. Пусть E = [−1; 1] и f (x) = x2 . чем точная нижняя грань (существует и) совпа-
дает с минимумом, а точная верхняя грань суще-
y ствует, но не совпадает с максимумом, которого
на множестве E = (−1; 1) нет (потому что нет
точек максимума):
min x2 = x2 =0= inf x2
x∈(−1;1) x=0 x∈(−1;1)
-1 0 1 x
sup x2 = 1 ∄ max x2
x∈(−1;1)
x∈(−1;1)
Тогда на множестве E у функции f имеется одна
точка минимума и две точки максимума, причем
минимум совпадает с точной нижней гранью, а ⋄ 4.3.27. Пусть E = R и f (x) = {x}.
максимум – с точной верхней гранью:
y
2 2 2
min x = x = 0 = inf x
x∈[−1;1] x=0 x∈[−1;1]
1
max x2 = x2 = x2 =1= sup x 2
x∈[−1;1] x=−1 x=1 x∈[−1;1]
y
Тогда на множестве E у функции f нет то-
чек максимума, хотя точная верхняя грань су-
ществует:
sup{x} = 1 ∄ max{x}
x∈R x∈R
-1 0 1 x
При этом минимум на этом множестве есть:
Тогда на множестве E у функции f имеется одна
точка минимума и нет точек максимума, при- inf {x} = min{x} = 0
x∈R x∈R
Это значит, что во-первых, все значения функции f на отрезке [a; b] не превосходят M
и во-вторых если взять любое число α < M , то обязательно оно окажется меньше, чем какое-то
значение f на отрезке [a; b]
∀α < M ∃x ∈ [a; b] α < f (x)
Возьмем в качестве α числа вида M − n1 . Тогда у нас получится целая последовательность {xn }:
1
∀n ∈ N ∃xn ∈ [a; b] M − < f (xn ) (4.3.121)
n
14 Эта теорема используется ниже на с.380 при доказательстве теоремы Ролля 6.1.32, на с.490 при доказательстве
теоремы об интегрируемости непрерывной функции 8.2.12, и на с.496 при доказательстве интегральной теоремы о
среднем (свойство 7◦ на с.492).
§ 3. Непрерывные функции 301
Поскольку последовательность {xn } лежит в отрезке [a; b], она ограничена. Значит по теореме
Больцано-Вейерштрасса 4.2.68, из нее можно выбрать сходящуюся подпоследовательность:
xnk −→ c (c ∈ [a; b])
k→∞
Поскольку f непрерывна в любой точке отрезка [a; b] и, в частности, в точке c ∈ [a; b], мы получаем
f (xnk ) −→ f (c)
k→∞
Покажем, что
R(f ) = [f (α), f (β)].
1. Будем считать для начала, что α < β. Тогда по теореме Коши 4.3.22, любая точка C ∈
(f (α), f (β)) является образом некоторой точки c ∈ (α, β). Значит, весь отрезок [f (α), f (β)] лежит в
R(f ) = f ([a, b]):
[f (α), f (β)] ⊆ R(f ).
Но с другой стороны, никакая точка y, лежащая выше [f (α), f (β)], не может принадлежать f ([a, b]),
потому что тогда мы получили бы, что f (β) — не максимум множества f ([a, b]). И таким же образом,
никакая точка y, лежащая ниже [f (α), f (β)], не может принадлежать f ([a, b]), потому что тогда мы
получили бы, что f (α) — не минимум множества f ([a, b]). Значит,
[f (α), f (β)] = R(f ).
2. В случае если α > β можно рассмотреть функцию
g(x) = f (−x)
и для нее мы получим, что
g(−α) = min g(x), g(−β) = max g(x)
x∈[−a,−b] x∈[−a,−b]
и
−α < −β.
Тогда, по уже доказанному,
R(g) = [g(−α), g(−β)],
и это можно дополнить до цепочки
R(f ) = R(g) = [g(−α), g(−β)] = [f (α), f (β)].
302 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
Рассмотрим последовательность
γn = f (αn ) − f (βn )
То, что она не стремится к нулю
γn −→
6 0
n→∞
означает, что найдется некоторая окрестность нуля (−ε; ε) которая не содержит бесконечное коли-
чество чисел {γn }. Значит можно выбрать подпоследовательность {γnk }, которая вообще не будет
заходить в окрестность (−ε; ε):
∀k |γnk | = |f (αn ) − f (βn )| > ε (4.3.123)
Рассмотрим теперь индексы {nk }. Им соответствует некоторая подпоследовательность {αnk } после-
довательности {αn }. Поскольку она ограничена (из-за того, что αnk ∈ [a; b]), по теореме Больцано-
Вейерштрасса 4.2.68 мы можем выбрать у нее некоторую сходящуюся подпоследовательность {αnkj }:
15 Эта теорема используется на с.490 при доказательстве теоремы об интегрируемости непрерывной функции.
§ 3. Непрерывные функции 303
а это противоречит условию (4.3.123), из которого видно, что расстояние между f (αnkj ) и f (βnkj )
не может быть меньше ε.
Итак, мы предположили, что f не является равномерно непрерывной на [a; b] и получили проти-
воречие. Это означает, что предположение неверно, и функция f все-таки равномерно непрерывна
на [a; b].
Теорема 4.3.33 (о монотонной функции на отрезке). Пусть функция f определена и строго мо-
нотонна на отрезке I = [a, b], и пусть J – отрезок с концами f (a) и f (b):
(
[f (a); f (b)], если f возрастает
J=
[f (b); f (a)], если f убывает.
Тогда:
(i) если f биективно отображает отрезок I на отрезок J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает отрезок I на отрезок J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.
Это противоречит утверждению 1◦ на с.248: поскольку f возрастает, она должна неубывать, значит
условие x1 > x2 должно влечь за собой условие f (x1 ) > f (x2 ), а у нас получается наоборот, f (x1 ) <
f (x2 ).
2. Покажем, что функция f : I → J непрерывна. Пусть xn −→ x, покажем что f (xn ) −→
n→∞ n→∞
f (x). По теореме 4.3.13, последовательность xn можно считать строго монотонной. Нам придется
рассмотреть два случая.
304 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
и то же для предела последовательности f (xn ) поскольку, в силу (4.3.124), она тоже воз-
растает:
lim f (xn ) = sup f (xn ) (4.3.126)
n→∞ n∈N∗
⇓
sup yn 6 f (x)
n∈N∗
f −1 sup yn 6 f −1 f (x) = x (4.3.127)
n∈N∗
⇓
x 6 f −1 sup yn (4.3.128)
n∈N∗
То есть
f (x) = sup yn = sup f (xn ) = (4.3.126) = lim f (xn )
n∈N∗ n∈N∗ n→∞
и то же для предела последовательности f (xn ) поскольку, в силу (4.3.124), она тоже воз-
растает:
lim f (xn ) = inf ∗ f (xn ) (4.3.130)
n→∞ n∈N
⇓
sup yn > f (x)
n∈N∗
f −1 inf ∗ yn > f −1 f (x) = x (4.3.131)
n∈N
⇓
x > f −1 inf ∗ yn (4.3.132)
n∈N
То есть
f (x) = inf ∗ yn = inf ∗ f (xn ) = (4.3.130) = lim f (xn )
n∈N n∈N n→∞
3. Покажем далее, что f сюръективно отображает I в J, то есть что f (I) = J. Для любого
C ∈ J = [f (a), f (b)] получаем:
— либо C лежит на левом конце отрезка J = [f (a), f (b)], то есть C = f (a), и тогда точка
x = a ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит на правом конце отрезка J = [f (a), f (b)], то есть C = f (b), и тогда точка
x = b ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит внутри отрезка J = [f (a), f (b)], то есть f (a) < C < f (b), и тогда по
теореме Коши о промежуточном значении 4.3.22 найдется точка x ∈ (a, b) такая, что
C = f (x).
4. Инъективность и сюръективность отображения f : I → J означают, что оно является биекци-
ей, и поэтому правило
f (x) = y ⇐⇒ x = f −1 (y)
определяет обратное к нему отображение f −1 : J → I.
5. Проверим, что функция f −1 : J → I строго монотонна. Пусть y1 < y2 – две точки из J.
Обозначим x1 = f −1 (y1 ) и x2 = f −1 (y2 ). Поскольку отображение f −1 биективно, x1 не может быть
равно x2 . Значит, либо x1 < x2 , либо x1 > x2 . Но второе, в силу строгого возрастания f , влечет за
собой неравенство y1 > y2 :
x1 > x2 =⇒ y1 = f (x1 ) > f (x2 ) = y2 ,
что противоречит исходному выбору y1 < y2 . Значит, x1 > x2 тоже невозможно. Мы получаем, что
возможно только неравенство x1 < x2 , и это означает, что функция f −1 строго возрастает:
y1 > y2 =⇒ x1 = f −1 (y1 ) > f −1 (y2 ) = x2 .
6. Осталось убедиться, что функция f −1 : J → I непрерывна. Предположим, что это не так, то
есть что существует последовательность yn ∈ J = [f (a), f (b)] такая что
yn −→ y & f −1 (yn ) −→
6 f −1 (y) (4.3.134)
n→∞ n→∞
306 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
xn = f −1 (yn ) −→
6 f −1 (y) = x
n→∞
и по свойству 2◦ на с.276, это означает, что существует подпоследовательность xnk , лежащая вне
некоторой окрестности (x − ε; x + ε) точки x:
xnk ∈
/ (x − ε; x + ε), ε>0 (4.3.135)
С другой стороны, последовательность xnk лежит в отрезке [a, b], поэтому по теореме Больцано-
Вейерштрасса 4.2.68, у нее должна быть сходящаяся подпоследовательность:
xnki −→ t
n→∞
t = f −1 (f (t)) = f −1 (y) = x
То есть t 6= x и одновременно t = x. Это противоречие означает, что наше предположение (4.3.134)
о разрывности функции f −1 было неверно.
Тогда:
(i) если f биективно отображает интервал I на интервал J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает интервал I на интервал J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.
! 4.3.35. В условиях теоремы из равенства f −1 (J) = I следуют две формулы, которые, несмотря
на свою очевидность, оказываются полезными:16
Доказательство. Как и в доказательстве предыдущей теоремы будем считать, что f строго воз-
растает.
Докажем (i). Пусть f биективно отображает интервал I на интервал J. Тогда у нее имеется
обратная функция f −1 : J → I.
1. Прежде всего, как и в теореме 4.3.33, без труда доказывается, что обратная функция f −1 :
J → I также возрастает.
2. Выберем отрезок [α, β] ⊆ I, и покажем, что f биективно отображает его на отрезок [f (α), f (β)] ⊆
J. Во-первых, из-за монотонности, f действительно отображает [α, β] в [f (α), f (β)]:
α = f −1 (A), β = f −1 (B)
α<β
и, опять мы это уже показали, функция f будет биективно (и строго монотонно) отображать отрезок
[α, β] на отрезок [A, B] = [f (α), f (β)]. Значит, по теореме 4.3.33, обратная функция f −1 : [A, B] →
[α, β] тоже должна быть непрерывной. Это верно для любого отрезка [A, B] ∈ J, поэтому функция
f −1 : J → I должна быть непрерывна.
Докажем (ii). Пусть f непрерывна на I.
1. Если x ∈ I = (a, b), то выбрав α и β так, чтобы x ∈ [α, β] ⊆ (a, b) = I. Тогда:
a<α<x<β<b
⇓
inf f (t) 6 f (α) < f (x) < f (β) 6 sup f (t)
x∈I x∈I
⇓
f (x) ∈ inf f (t), sup f (t) = J
x∈I x∈I
То есть f (I) ⊆ J.
2. Инъективность отображения f : I → J доказывается той же цепочкой (4.3.133), что и для
случая, когда I – отрезок.
3. Сюръективность отображения f : I → J. Пусть y ∈ J = (inf t∈I f (t), supt∈I f (t)). Тогда:
inf f (t) < y < sup f (t) =⇒ ∃t1 , t2 ∈ I : f (t1 ) < y < f (t2 ) =⇒
t∈I t∈I
=⇒ y ∈ [f (t1 ); f (t2 )] =⇒ ∃x ∈ [t1 ; t2 ] y = f (x)
теорема 4.3.33
f (x) = y ⇐⇒ x = f −1 (y)
308 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
§4 Предел функции
В задачах физики бывает важно уметь судить о поведении значений функции f (x) при приближе-
нии аргумента x к каким-то точкам a, то есть о поведении последовательностей f (xn ) при xn → a.
Поскольку не все функции непрерывны, последовательность f (xn ) совсем необязательно будет стре-
миться к значению f (a): возможна (и часто встречается) ситуация, когда
xn −→ a & f (xn ) −→
/ f (a)
n→∞ n→∞
(не говоря уже о том, что значение f (a) может вообще не существовать, если функция f не опре-
делена в точке a).
Это важно вот в каких задачах. Например, если функция f (x) описывает поведение динамиче-
ской системы, то есть считается, что параметр x обозначает время, то имеется качественная разница
между ситуацией, когда при стремлении xn к a значения f (xn ) стремятся к некоторому числу C,
не зависящему от выбора xn ,
∃C ∈ R ∀xn xn −→ a ⇒ f (xn ) −→ C
n→∞ n→∞
0 a x
∀xn xn −→ a ⇒ f (xn ) −→ ∞.
n→∞ n→∞
0 a x
Если, например, под f (x) понимается количество выработанной энергии к моменту времени x, то
первая ситуация означает, что при приближении x к a динамическая система ведет себя “регулярно”,
то есть в ней не происходит качественных изменений (только количественные), а вторая — наборот,
§ 4. Предел функции 309
что в системе происходит “взрыв”, и она должна разрушиться (потому что количество выработанной
энергии к моменту времени x = a становится бесконечным).
С другой стороны, обе эти ситуации качественно отличаются от картины, когда при каком-то
выборе xn → a последовательность f (xn ) вообще не имеет предела:
На языке физики это означает, что при приближении x к a динамическая система теряет устойчи-
вость: при малых изменениях аргумента значения функции f начинают меняться существенно, так
что приближенно найти значение f (x) становится невозможно.
Человечеством выработан способ просто и наглядно описывать все эти детали в поведении за-
данной функции f : для этого нужно построить ее график. В качестве примера можно рассмотреть
график функции f (x) = {x} (дробной части числа, определенной на с.236):
y
y = {x} 1
−2 −1 1 2 x
Пузыри на концах наклонных отрезков в этой картине объясняют, к чему стремится значение функ-
ции, когда аргумент стремится к целому числу слева. Например, если x стремится к 1 слева, то
f (x) стремится к числу 1 (которое не является значением функции f в точке 1),
f (x) −→ 1. (4.4.137)
x→1, x<1
При этом это соотношение понимается не как-нибудь, а именно как утверждение о последователь-
ностях: если последовательность xn стремится к 1 слева, то последовательность f (xn ) обязательно
стремится к 1,
xn −→ 1, xn < 1 =⇒ f (xn ) −→ 1, (4.4.138)
n→∞ n→∞
1
f (x3 )
f (x2 )
f (x1 )
0 x1 x2 x3 1 2 x
С другой стороны, жирные точки показывают, что при стремлении аргумента x к целому числу a
справа, значение функции f (x) стремится к ее значению в точке a. Например, если x стремится к
1 справа, то f (x) стремится к 0 = f (1),
f (x) −→ 0. (4.4.139)
x→1, x>1
lim f (x) = 1,
x→1−0
310 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
и в таких случаях говорят, что функция f имеет предел слева в точке 1. А условие (4.4.140) (рас-
шифровывающее запись (4.4.139)) принято записывать формулой
lim f (x) = 0,
x→1+0
и в таких случаях говорят, что функция f имеет предел справа в точке 1, равный 0.
В этом параграфе мы подробно обсудим понятие предела функции. Ниже в главе 6 будет дано
его важное применение: с его помощью определяется понятие производной, играющие центральную
роль во всем математическом анализе.
К этим 12 типам пределов следует добавть еще 12, соответствующих случаям, когда функция f
стремится к бесконечности с определенным знаком:
§ 4. Предел функции 311
Таким образом, чтобы определить предел функции, нужно формально сформулировать 24 раз-
ных определения. Чтобы не утомлять читателя такими вразумлениями, обычно поступают иначе.
Говорят так: пусть a и A обозначают числа, или символы бесконечности, возможно с определенным
знаком
a, A ∈ R или a, A = ∞, −∞, +∞
если
1) f определена в некоторой выколотой окрестности U величины a и
17 Генрих Гейне (1821-1881) – известный немецкий математик.
312 Глава 4. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ
f (xn ) −→ A
n→∞
если
1) f определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой последовательности xn ∈ U , стремящейся к a
xn −→ a xn 6= a
n→∞
f (xn ) −→ A
n→∞
y
A
f (a)
A 0 a x
то мы получим
2
xn + 2 1+ xn 1
A f (xn ) = = −→
1 n→∞
2xn − 1 2− xn
2
то мы получим
1
lim = (применяем теорему 4.2.34) = +∞ 3
n→∞ xn 1 применяем
lim f (xn ) = lim = теорему 4.2.34 = 0
n→∞ xn
Это верно для всякой последовательности n→∞
1
xn −→ 0 xn > 0, поэтому limx→0+0 = +∞.
n→∞ x Это верно для всякой последовательности
xn −→ ∞, поэтому limx→∞ x13 = 0.
⋄ 4.4.10. Покажем что n→∞
1
lim f (x) = 0 ⇐⇒ lim = ∞. (4.4.141)
x→a x→a f (x)
Доказательство. Это следует из теоремы 4.2.34 о связи между бесконечно большими и бесконеч-
но малыми последовательностями: если xn → a, то соотношение yn = f (xn ) → 0 эквивалентно
соотношению y1n = f (x1n ) → ∞.
⋄ 4.4.14. 1
(xn )k = −→ ∞
( (yn )k n→∞
0, если k > 0 Поскольку это верно для любой последователь-
lim xk = (4.4.142)
x→0 ∞, если k < 0 ности xn → ∞, мы получаем, что
xk −→ ∞ (k > 0)
Доказательство. 1. Пусть k > 0. Тогда x→∞
(xn )k −→ 0 ⇓ (4.4.141)
n→∞
1
Поскольку это верно для любой последователь- xk = m −→ 0
ности xn → 0, мы получаем, что x x→∞
xk −→ 0 (k > 0)
x→0 ⋄ 4.4.16. Для любого n ∈ N∗
2. Пусть k < 0. Тогда m = −k > 0, поэтому: lim x2n = +∞ (4.4.144)
x→−∞
m
x −→ 0 (уже доказано)
lim x2n = +∞ (4.4.145)
x→0 x→+∞
тогда и только тогда, когда A является пределом слева и пределом справа функции f в точке a:
lim f (x) = A = lim f (x)
x→a−0 x→a+0
тогда и только тогда, когда A является пределом функции f при x стремящимся к −∞ и к +∞:
lim f (x) = A = lim f (x)
x→−∞ x→+∞
то мы получим 1 1
lim = +∞ = lim
x→0−0 |x| x→0+0 |x|
1 |xn | = xn , 1
lim = потому что xn > 0 = lim = и это означает что
n→∞ |xn | n→∞ xn
применяем
= теорему 1
4.2.34 = +∞ lim = +∞
x→0 |x|
выполняется
f (xn ) −→ C (4.4.154)
n→∞
Доказательство. Ясно, что из (i) следует (ii), потому что если limx→b−0 f (x) = C, то f (xn ) −→
n→∞
C для любой последовательности xn −→ b, xn < b (необязательно монотонной). Докажем, что
n→∞
наоборот если (i) не выполняется, то не выполняется и (ii). Пусть limx→b−0 f (x) 6= C, то есть
существует точка последовательность xn ∈ M такая что
∀k ∈ N∗ f (xnk ) ∈
/ (C − ε; C + ε)
k1 = 1, t1 = y 1
Затем, если для m = 1, ..., l числа km и tm определены, мы замечаем вот что. Поскольку a < yk ,
yk −→ a и a < tl , найдется такое kl+1 , что ykl+1 лежит в интервале (a; tl ):
k→∞
ykl+1 < tl
tm ∈ (a, b)
18 Эта теорема используется ниже при доказательстве правила Лопиталя для раскрытия неопределенностей типа
∞
∞
.
§ 4. Предел функции 319
tm = ykm −→ a.
m→∞
∀m ∈ N∗ f (tm ) = f (zkm ) ∈
/ (C − ε; C + ε)
выполняется
f (xn ) −→ C
n→∞
— если f невозрастает, то
Доказательство. 1. (i) =⇒ (ii). Пусть функция f непрерывна в точке a, то есть для всякой по-
следовательности аргументов {xn }, стремящейся к точке a соответствующая последовательность
значений {f (xn )} стремится к значению f (a). Тогда, в частности, для всякой последовательности
xn −→ a, xn 6= a
n→∞
выполняется
f (xn ) −→ f (a)
n→∞
По определению предела это означает, что предел функции f в точке x = a равен f (a):
Это означает, что для любой последовательности аргументов {xn }, стремящейся к точке a, но не
попадающей в a, соответствующая последовательность значений {f (xn )} стремится к значению
f (a):
xn −→ a & ∀n xn 6= a ⇒ f (xn ) −→ f (a) (4.4.157)
n→∞ n→∞
Нам нужно проверить то же самое для последовательностей {xn }, у которых некоторые элементы
xn совпадают с a. Пусть {xn } – как раз такая последовательность, то есть xn −→ a, причем xn = a
n→∞
для некоторых n. Возможны три ситуации:
1) xn = a для конечного набора n ∈ N. В этом случае мы получаем, что xn 6= a для почти
всех n ∈ N, и поэтому предел limn→∞ f (xn ) будет таким же, как если бы xn 6= a было
верно для всех n ∈ N, и значит, в силу (4.4.157),
f (xn ) −→ f (a)
n→∞
f (xn ) −→ f (a)
n→∞
причем
∀x 6= a f (x) 6= b
Тогда
lim g(f (x)) = c
x→a
Тогда мы получим
f (xn ) −→ b, f (xn ) 6= b
n→∞
Поэтому
g(f (xn )) −→ c
n→∞
Поскольку это верно для всякой последовательности xn −→ a (xn 6= a), мы получаем, что
n→∞
limx→a g(f (x)) = c.
Эта теорема бывает полезна при вычислении предела от сложной функции. Если нам нужно
найти предел
lim g(f (x))
x→a
и известно, что f (x) −→ b причем f (x) 6= b при x 6= a, то можно сделать замену переменных:
x→a
f (x) = y
lim g(f (x)) = y −→ b = lim g(y)
x→a x→a y→b
y 6= b при x 6= a
2−0
= (подстановка) = =2
1 + 10 · 0
xn −→ a, xn 6= a
n→∞
⇓
f (xn ) −→ A, g(xn ) −→ B
n→∞ n→∞
используем свойство
⇓ 30 на с.265
f (xn ) · g(xn ) −→ A · B
n→∞
sn −→ a, tn −→ a,
n→∞ n→∞
f (tn ) − f (sn ) −→ 0
n→∞
sn −→ a, tn −→ a,
n→∞ n→∞
f (tn ) − f (sn ) −→ 0
n→∞
Доказательство. Эти две теоремы доказываются одинаково, поэтому мы докажем лишь вторую.
1. Легко проверяется, что из условия (i) следует условие (ii). Действительно, если существует
конечный предел limx→a−0 f (x) = C, то есть для всякой последовательности xn ∈ (α; a), xn −→ a
n→∞
выполняется соотношение
f (xn ) −→ C
n→∞
f (tn ) − f (sn ) −→ C − C = 0
n→∞
19 Этот результат понадобится при доказательстве критерия Коши сходимости несобственного интеграла (теорема
9.1.30).
§ 4. Предел функции 323
2. Теперь докажем, что из условия (ii) следует условие (i). Пусть выполняется (ii).
a) Покажем сначала, что тогда для любой последовательности xn ∈ (α; a), xn −→ a существует
n→∞
конечный предел
lim f (xn )
n→∞
Действительно, обозначим yn = f (xn ). Тогда если взять любые две последовательности индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
Это означает, что последовательность yn = f (xn ) удовлетворяет критерию Коши (то есть обладает
свойством (i) теоремы 4.2.70). Значит, yn = f (xn ) имеет конечный предел.
b) Мы показали, что для любой последовательности xn ∈ (α; a), xn −→ a существует конечный
n→∞
предел limn→∞ f (xn ). Теперь из условия (ii) следует, что все такие пределы совпадают, потому что
для любых двух последовательностей sn , tn ∈ (α; a) стремящихся к a
sn −→ a, tn −→ a
n→∞ n→∞
выполняется равенство
lim (f (tn ) − f (sn )) = 0
n→∞
и следовательно,
lim f (tn ) = lim f (sn )
n→∞ n→∞
lim f (xn ) = C
n→∞
lim f (x) = C
x→a−0
Мы убедились, что из условия (ii) следует условие (i). Теорема 1.1 доказана.
если
1) f определена в некоторой выколотой окрестности U величины a и
2) для любой окрестности V величины A найдется выколотая окрестность W ве-
личины a такая, что
∀x ∈ W f (x) ∈ V
Отдельно определяются односторонние пределы:
• Величина A называется пределом слева (справа) функции f в точке a
A = lim f (x) A = lim f (x)
x→a−0 x→a+0
если
1) f определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой окрестности V величины A найдется левая (правая) полуокрестность
W точки a такая, что
∀x ∈ W f (x) ∈ V
1) функция f определена на некотором ин- β > α такое что для любого x ∈ (β; +∞)
тервале вида (α; +∞), и выполняется включение f (x) ∈ (A − ε; A +
2) для всякого числа ε > 0 существует число ε).
Доказательство. Мы докажем эту теорему для конечных пределов слева, поскольку в каждом
случае доказательство отличается лишь несущественными деталями.
1. (i) ⇒ (ii). Пусть A является пределом по Коши функции f при x → a − 0, то есть для
всякого ε > 0 существует δ > 0 такое что для любого x ∈ [a − δ; a) выполняется включение f (x) ∈
(A − ε; A + ε). Покажем, что тогда A является пределом по Гейне f при x → a − 0, то есть что для
любой последовательности аргументов xn −→ a − 0 выполняется f (xn ) −→ A.
n→∞ n→∞
Возьмем произвольную такую последовательноть xn −→ a − 0. и зафиксируем какое-нибудь
n→∞
ε > 0. По предположению, для него можно выбрать δ > 0 так чтобы
∀x ∈ [a − δ; a) f (x) ∈ (A − ε; A + ε) (4.4.164)
xn −→ a − 0
n→∞
⇓
xn ∈ [a − δ; a) для почти всех n ∈ N
⇓
(применяем (4.4.164))
⇓
f (xn ) ∈ (A − ε; A + ε) для почти всех n ∈ N
Это верно для произвольного ε > 0. Значит, f (xn ) −→ A, а именно это нам и нужно было доказать.
/ / n→∞
2. (i) ⇒ (ii). Пусть наоборот, A не является пределом по Коши функции f при x → a − 0, то
есть существует такое ε > 0, что для любого δ > 0 найдется такой x ∈ [a − δ; a), для которого
выполняется f (x) ∈ / (A − ε; A + ε). Тогда, в частности, для любого числа вида δ = n1 мы получим,
что
1
∃xn ∈ [a − δ; a) = [a − ; a) такие что f (xn ) ∈
/ (A − ε; A + ε) (4.4.165)
n
Зафиксируем такие числа xn . Получается:
1
a− < xn < a
n
⇓
xn −→ a − 0
n→∞
xn − yn −→ 0
n→∞
Для этого возьмем ε > 0. В силу (4.4.166), должен существовать такой δ > 0, что
В частности,
1
∀n ∈ N∗ ∃xn , yn ∈ E |xn − yn | < & |f (xn ) − f (yn )| > ε
n
1
Мы получили последовательности xn и yn такие, что 0 6 |xn − yn | < −→
n n→∞ 0, и поэтому
xn − yn −→ 0
n→∞
СТАНДАРТНЫЕ ФУНКЦИИ
§1 Элементарные функции
Среди функций, используемых в точных науках, имеется несколько таких, которые служат глав-
ными моделями изучаемых явлений. Эти функции называются элементарными, и их свойства, а
также свойства функций, получаемых из них с помощью алгебраических операций и композиции
(такие функции мы будем называть стандартными) служат предметом изучения в разделе ана-
лиза, называемом Исчислением (что это мы объясним ниже в § 2). Список элементарных функций
выглядит так:1
обозначение:
название x область определения
7→
x ∈ R, b ∈ 2N∗N−1
∗
b x 6= 0, b ∈ − 2NN∗ −1
степенная функция x Z
x > 0, b ∈ (0, +∞) \ 2N∗ −1
Z
x > 0, b ∈ (−∞, 0) \ ∗
2N −1
x ∈ R,
a>0
x
показательная функция a x > 0, a=0
x ∈ Z
2N∗ −1
, a<0
π
тангенс tg x x∈
/ 2 + πZ
котангенс ctg x x∈
/ πZ
Как может заметить читатель, только одна из этих функций – xb – была определена нами к на-
стоящему моменту, и то только для целых значений параметра b (см. определения на с.215 и 215).
∗
Z
1 Смысл встречающихся в этой таблице обозначений типа , N
2N∗ −1 2N∗ −1
объяснялся выше на с.232.
327
328 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
Остальные функции в этом списке мы определим необычным приемом – с помощью двух так на-
зываемых избыточных аксиом.
Это вот что такое. Избыточной или зависимой аксиомой называется такая аксиома теории, про
которую впоследствии становится известно, что ее можно вывести из остальных аксиом этой теории.
Как следствие, избыточные аксиомы можно (и с точки зрения логической стройности правильнее)
оформлять не как аксиомы, а как теоремы этой теории. Однако в математике встречаются время от
времени ситуации, когда знакомство с теоремой бывает желательно задолго до того, как появляется
возможность эту теорему строго доказать. В таких случаях полезно объявить эту теорему аксиомой,
сообщив слушателям, что в действительности эта аксиома зависима.
Элементарные функции – как раз такой пример. Чисто логически ничто не мешает молчать о
них в курсе анализа до тех пор, пока не появится возможность аккуратно их определить и дока-
зать их характеристические свойства. Однако тогда возможность решать задачи с элементарными
функциями, отличными от рациональных, появится у преподавателя и у студентов только в кон-
це второго семестра. Поскольку выбрасывание из упражнений всех иррациональных элементарных
функций эквивалентно просто отказу от Исчисления в классическом его понимании, разумно по-
ступить по-другому. В этой главе мы сформулируем две избыточные аксиомы – Аксиому степеней
(аксиома B1 на с.328) и Аксиому тригонометрии (аксиома B2 на с.341). Доказательство их зависи-
мости (избыточности) мы сможем привести очень нескоро – лишь в § 3 главы 11. Отчасти поэтому,
но, в первую очередь в соответствии с общим принципом, согласно которому все, что связано с
Исчислением считается иллюстративным материалом, мы переносим эти утверждения вместе с их
следствиями, в двухколоночный текст.
P4 : для положительных оснований выполня- ! 5.1.4. Формула (5.1.8) для b > 0 вытекает из
ются следующие условия монотонно- остальных утверждений аксиомы: если b > 0, то
сти:
— если b > 0, то возведение в степень b 0·0=0
не меняет знак неравенства:
⇓
0<x<y =⇒ xb < y b (5.1.10)
нью числа a, определенной на странице 207. Как самостоятельно. В качестве подсказки мы сооб-
следствие, выполняется тождество щим только, что здесь удобно использовать тео-
рему о степенном отображении 3.2.32 и предло-
a1 = a. (5.1.15) жение 5.1.7 на с.330.
√ f (x) = x 2n−1
lim 2n−1 x = −∞ (5.1.21)
x→−∞ должна возрастать и быть непрерывной на своей
√
lim 2n−1 x = +∞ (5.1.22) области определения, то есть на множестве
x→+∞
— удовлетворяет следующему правилу, кото- inf g(y); sup g(y) =
рое может считаться его определением: y∈R y∈R
√ = lim g(y); lim g(y) =
y = 2n−1 x ⇐⇒ y 2n−1 = x (5.1.23) y→−∞ y→+∞
1 1 1
f (x) = x 2n−1 , g(y) = y 2n−1 lim x 2n−1 = (4.4.155) = inf x 2n−1 =
x→−∞ x∈R
1
⋄ 5.1.8. Предложение 5.1.7 дает достаточно ин- x 2n −→ +∞
x→+∞
формации для построения графика корня нечет-
ной степени, за исключением одной детали, 3. Равенство (5.1.25) следует из тождества
а именно свойства графика иметь выпуклость (5.1.8). √
вверх или вниз на разных участках. Смысл этих 4. Проверим, что функция x 7→ 2n x =
1
слов интуитивно очевиден, однако аккуратное x 2n возрастает на [0; +∞). Для подмножества
объяснение им удобно давать после того, как бу- (0; +∞) этот факт постулируется в условии мо-
дет определена производная, поэтому мы отло- нотонности (5.1.10). Поэтому нам нужно лишь
жим разговор о выпуклости до с.398. Если же проверить, что он будет верен для случая пары
не требовать здесь объяснений относительно вы- x, y ∈ [0; +∞), x < y, в которой x = 0. Здесь
пуклости, то в остальном из предложения 5.1.7 применяется (5.1.9):
следует, что по виду графика (то есть по тому, 1
0<y =⇒ 0 < (5.1.9) < y 2n .
где у графика имеются интервалы возрастания
и убывания, интервалы, где сохраняется выпук- 5. Докажем правило (5.1.27). В прямую сто-
лость, и какие функция имеет пределы на концах рону мы получаем: если
этих интервалов) все корни нечетной степени ве- √ 1
дут себя одинаково: y = 2n x = x 2n
√
— график функции x 7→ 2n−1 x выглядит как то, во-первых,
график любого представителя из этого семей- 1 2n 1
ства функций, например, как график кубиче- y 2n = x 2n = (5.1.7) = x 2n ·2n = x1 = x
ского корня
√ 1
и, во-вторых, по Аксиоме степеней B1 на с.328,
3
x = x3 (x ∈ R) 1
из того, что x 2n существует, следует, что x > 0.
Поэтому
1 (5.1.17)
y = x 2n > 0
Мы доказали импликацию
Предложение
√ 5.1.9. Корень четной степени √
x 7→ 2n x y = 2n x =⇒ y 2n = x & y>0
⇓ (5.1.13)
(5.1.9) 1 1 1 (5.1.25) m
0 < x 2n < x 2n+1 −→ 0 2n+1 = 0
x→0
| {z }
1 y = x = |x|
функция x 7→ x 2n+1
непрерывна
по предложению 5.1.7 В-третьих, если x < 0, то
⇓ √
1 y= x2
x 2n −→ 0
x→0
m
⋄ 5.1.10. Предложение 5.1.9 позволяет строить
графики корней четной степени. Опять если не y2 = x & y>0
интересоваться участками выпуклости (о кото-
рых мы упоминали в примере 5.1.8), мы получа- m
ем, что по виду графика все корни четной степе-
ни ведут себя одинаково:
√ y 2 − x2 = 0 & y>0
— график функции x 7→ 2n x выглядит как гра-
фик любого представителя из этого семейства
m
функций, например, как график квадратного
корня √ 1
x = x2 (x ∈ R) (y − x)(y + x) = 0 & y>0
Предложение 5.1.11. Справедливо тожде- y+x=0
& y>0
ство: y−x=0
√
|x| = x2 (5.1.28)
m
Доказательство. Здесь нужно рассмотреть
√ три
случая: во-первых, если x = 0, то x2 = 0 = |x|
– очевидно. Во-вторых, если x > 0, то получаем y = −x
& y>0
√ y=x
y = x2
▼❇❇
m невозможно,
потому что x < 0
2 2
y =x & y>0
m m
2 2
y −x =0 & y>0
m y = −x = |x|
Доказательство. Здесь с очевидными измене- что читателю будет понятно, если, забегая впе-
ниями мы применяем те же рассуждения, что и ред, сообщить ему, что при b > 1 график степен-
при доказательстве предложения 5.1.12. ной функции является выпуклым вниз на пря-
1. Поскольку b > 0, по Аксиоме степеней B1 мой R, а при 0 < b < 1 прямая разбивается на
на с.328, функция x 7→ xb действительно опреде- два полуинтервала (−∞, 0] и [0; +∞), на которых
лена на R. график является выпуклым вверх:
2m
2. Заметим, что для b = 2n−1 , m, n ∈ N∗ , сте- — в случае b > 1, b ∈ 2N2N
∗
∗ −1 , график функции
b
пенная функция h(x) = x является композицией x 7→ xb , выглядит как график любого пред-
1
степенных функций g(y) = y 2m и f (x) = x 2n−1 : ставителя из этого семейства функций, на-
пример, как квадратичная парабола, то есть
как график функции
h(x) = g(f (x)) = y 2m 1 =
y=x 2n−1
1 2m f (x) = x2 (x ∈ R)
= (x 2n−1 )2m = (5.1.7) = x 2n−1
2N∗ −1 , график
рывна на R по предложению 5.1.7, их компози- функции x 7→ xb , выглядит как график любо-
ция h = g◦f должна быть непрерывна по теореме
го представителя из этого семейства, напри-
4.3.19. мер, как парабола со степенью 32 , то есть как
4. Далее разберемся с монотонностью. Функ- график функции
1
ция f (x) = x 2n−1 возрастает на полуинтерва- 2
ле (−∞; 0] в силу предложения 5.1.7, а функция f (x) = x 3 (x ∈ R)
2m
g(y) = y убывает на полуинтервале (−∞; 0] ⊇
f ((−∞; 0]) в силу примера 4.1.24. Значит, по
свойству 5◦ на с.248, композиция h = g ◦ f убы-
вает на полуинтервале (−∞; 0]. ∗
1 Предложение 5.1.16. При b ∈ − 2N2N ∗ −1 степен-
Наоборот, функция f (x) = x 2n−1 возрастает b
на [0; +∞) в силу предложения 5.1.7, а функция ная функция x 7→ x
g(y) = y 2m возрастает на [0; +∞) ⊇ f ([0; +∞)) в – определена на множестве R \ {0},
силу примера 4.1.24. Значит, по свойству 5◦ на – непрерывна на R \ {0},
с.248, композиция h = g ◦ f также возрастает на
– возрастает на интервале (−∞; 0),
[0; +∞).
5. Равенство нулю в нуле следует из тожде- – убывает на интервале (0; +∞),
ства (5.1.8). – имеет следующие пределы в граничных точ-
6. Пределы (5.1.31)-(5.1.32) следуют из ках области определения и на бесконечно-
(5.1.21)-(5.1.22) и (4.4.144)-(4.4.145). Например, сти:
первый из них:
lim xb = +∞ (5.1.33)
x → −∞ x→−0
lim xb = +∞ (5.1.34)
⇓ (5.1.31) x→+0
1 lim xb = 0 (5.1.35)
f (x) = x 2n−1 → −∞ x→∞
∗
— если b ∈ − 2N2N b
∗ −1 , то график функции x 7→ x , – имеет бесконечный предел в бесконечности:
выглядит как график любого представителя
из этого семейства функций, например, как lim xb = +∞ (5.1.40)
x→+∞
квадратичная гипербола, то есть как график
функции Доказательство. Здесь мы с небольшими изме-
нениями повторяем рассуждения, применявшие-
f (x) = x−2 (x ∈ R) ся при доказательстве предложения 5.1.9.
1. Поскольку b > 0, по Аксиоме степеней B1
на с.328 функция x 7→ xb действительно опреде-
лена на [0; +∞).
2. Докажем соотношение (5.1.40). Для этого
2N∗ −1 1
подберем n ∈ N∗ так, чтобы b > 2n−1
Предложение 5.1.18. При b ∈ − 2N ∗ −1 степен- . Тогда при
ная функция x 7→ x b x > 1 мы получим:
– определена на множестве R \ {0}, 1
xb > (5.1.13) > x 2n−1 −→ +∞
x→+∞
– непрерывна на R \ {0},
– убывает на интервале (−∞; 0), ⇓
b
– убывает на интервале (0; +∞), x −→ +∞
x→+∞
– имеет следующие пределы в граничных точ-
3. Равенство (5.1.39) следует из тождества
ках области определения и на бесконечно-
(5.1.8).
сти:
4. Проверим, что наша функция возрастает
lim xb = −∞ (5.1.36) на [0; +∞). Для подмножества (0; +∞) этот факт
x→−0 постулируется в условии монотонности (5.1.10).
lim xb = +∞ (5.1.37) Поэтому нам нужно лишь проверить, что он бу-
x→+0
дет верен для случая пары x, y ∈ [0; +∞), x < y,
lim xb = 0 (5.1.38) в которой x = 0. Здесь применяется (5.1.9):
x→∞
Z
= y b ·b = y 1 = (5.1.15) = y
Предложение 5.1.20. При b ∈ (0; +∞) \ 2N∗ −1
степенная функция x 7→ xb 6. После этого можно воспользоваться заме-
чанием 4.3.36: функции f и g определены на по-
– определена на полуинтервале [0; +∞),
луинтервале [0; +∞), взаимно обратны, причем
– непрерывна на [0; +∞), функция f возрастает на нем (мы это уже дока-
– возрастает на [0; +∞), зали на первом шаге), поэтому они должны быть
– равна нулю в нуле, непрерывны.
Однако поскольку утверждение, упомянутое
0b = 0, (5.1.39) нами в замечании 4.3.36 мы не доказали, мы
336 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
для строгости поступим иначе. Сначала заме- композицией функции f (x) = xc , рассмотренной
тим, что функции f и g, если их считать опреде- в предложении 5.1.20 и функции g(y) = y −1 , рас-
ленными на интервале (0; +∞), взаимно обрат- смотренной в примерах 4.1.27 и 4.3.11. Все нуж-
ны, и строго монотонны (в силу условия моно- ные нам свойства функции x 7→ xb следуют из
тонности (5.1.10)). Значит, по теореме 4.3.34 они этих утверждений.
должны быть непрерывны на (0; +∞). Поэтому
для непрерывности на [0; +∞) нам остается до- ⋄ 5.1.23. Предложение 5.1.22 позволяет стро-
казать, что f непрерывна в нуле. Для этого снова ить график степенной функций с показателем
возьмем n ∈ N∗ так, чтобы 2n−1 1
< b. Тогда при b ∈ (−∞; 0) \ 2N∗Z−1 . Здесь вид графика (в тех
0 < x < 1 мы получим: деталях, которые мы здесь уже перечисляли) не
зависит от значения b:
1
0 < (5.1.9) < xb < (5.1.13) < x 2n−1 −→ 0 — при b ∈ (−∞; 0) \ 2N∗Z−1 , график функции
x→0
x 7→ xb , выглядит как график любого пред-
⇓ ставителя из этого семейства функций, на-
xb −→ 0 пример, как график функции
x→0
1
f (x) = x− 2 (x ∈ R)
Z
a>1
Предложение 5.1.22. При b ∈ (−∞; 0) \ 2N∗ −1
степенная функция x 7→ xb ⇓ (5.1.10)
1 1
– определена на интервале (0; +∞). a n >1 n = (5.1.4) = 1
– непрерывна на (0; +∞).
⇓
– убывает на (0; +∞) 1
xn = a − 1 > 0
n
– имеет следующие пределы на концах этого
интервала: И, во-вторых, в силу неравенства Бернулли
(3.2.103),
lim xb = +∞ (5.1.41)
x→+0
b
a = (1 + xn )n > (3.2.103) > 1 + n · xn
lim x = 0 (5.1.42)
x→+∞
⇓
Доказательство. Если обозначить c = −b, то a−1
∗
мы получим c ∈ 2N2N
∗ −1 , и наша функция будет
> xn
n
§ 1. Элементарные функции 337
Записав эти два неравенства вместе, мы получим Из (5.1.45) следует, что для данного N можно
оценку для xn , из которой получается первый из подобрать номер K такой, что
двух пределов (5.1.43):
1
∀k > K |xk | <
a−1 N
0 < xn 6
n Поэтому:
⇓
1 1
1
a − 1 = xn −→ 0
n
∀k > K − < xk <
n→∞
N N
⇓ ⇓ (5.1.12)
1 1
1 −N
a n −→ 1 ∀k > K 1−ε<a < ax k < a N < 1 + ε
n→∞
[x] 6 x (3.2.151)
Доказательство. 1. Пусть a > 1. Тогда в силу
(4.2.47), ⇓ (5.1.12)
lim ax = +∞
x→+∞
⋄ 5.1.29. Предложений 5.1.26, 5.1.27 и 5.1.28
После того, как оно доказано, первое выводится достаточно, чтобы построить график функции
как его следствие: x 7→ ax в тех случаях, когда это возможно, то
есть когда a > 0:
x y = −x −y
lim a = = lim a = – если a > 1, график выглядит так:
x→−∞ y → +∞ y→+∞
1
= lim y
= (4.4.141) = 0
y→+∞ a
❘ +∞
❅ – если a = 1, график становится прямой:
1
2. Пусть 0 < a < 1. Тогда, положив A = a,
мы получим A > 1, поэтому
– если 0 < a < 1, график выглядит так:
y = −x
lim ax = y → +∞ =
x→−∞
ax = A−x = Ay
= lim Ay = (5.1.47) = +∞
y→+∞
– если a = 0, график выглядит так:
и
y = −x
lim a = y → −∞ =
x
x→+∞ ⋄ 5.1.30. Отдельно нужно сказать, что при a <
ax = A−x = Ay
0, график изобразить невозможно, оттого, что он
= lim Ay = (5.1.47) = 0 становится разрывным в каждой точке. Можно
y→−∞
пытаться рисовать отдельные точки на нем, на-
пример
k
Предложение 5.1.34. Справедливы следующие (5.1.51)
k
соотношения: a
— если a > 1, то
lim loga x = −∞, lim loga x = +∞ Из него следует второе:
x→+0 x→+∞
(5.1.59) (5.1.61) (5.1.52)
logb (ax ) = logb (bx·logb a ) = x · logb a
— если 0 < a < 1, то
lim loga x = +∞, lim loga x = −∞ А из второго следует третье:
x→+0 x→+∞
(5.1.60)
(5.1.62)
Доказательство. Пусть a > 0. Если E > 0, то logb a · loga x = logb (aloga x ) = logb x
для любого x ∈ (0; a−E ) получаем в силу (5.1.54):
loga x < loga a−E = −E ⇓
Это означает, что справедливо первое соотноше-
ние в (5.1.59): logb x
loga x =
logb a
lim loga x = −∞
x→+0
= 2log2 {(limx→a f (x)) } = lim f (x)limx→a g(x) • Наименьший полупериод функции sin обозна-
limx→a g(x)
3, 14 < π < 3, 15
C ⇓
sin t < t < ε = <C
2
sin 0 = 0
Полученное противоречие означает, что наше (5.1.75)
cos 0 = 12
предположение (что у sin нет наименьшего пе-
риода) неверно. Но с другой стороны,
⇓ (5.1.70)
Предложение 5.1.49. Функции sin и cos непре-
| sin x| 6 |x| рывны на R.
346 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
Мы получили, что если xn −→ a, то sin xn −→ Но тогда снова по лемме 5.1.50 получается, что
n→∞ n→∞ число h должно быть полупериодом для функ-
sin a. Это означает, что функция f (x) = sin x ции sin, что невозможно, потому что h < x <
непрерывна в точке a ∈ R. Поскольку a – про- π, то есть h меньше наименьшего полупериода
извольная точка на R, функция sin непрерывна π.
всюду на R.
Для функции cos этот факт доказывается Предложение 5.1.52. На отрезке [0, π] коси-
аналогично, только нужно вместо неравенства нус строго убывает, а на отрезке [−π, 0] моно-
(5.1.93) применять (5.1.94). тонно возрастает:
Лемма 5.1.50. Если в некоторой точке h > 0 x, y ∈ [0, π], x<y =⇒ cos x > cos y
синус равен нулю, (5.1.97)
x, y ∈ [−π, 0], x<y =⇒ cos x < cos y
sin h = 0,
(5.1.98)
то h – полупериод для функций sin и cos. Доказательство. Заметим сначала, что из-за
Доказательство. тождества четности (5.1.80) здесь достаточно до-
казать только утверждение для отрезка [0, π].
0 Для него мы получаем такую цепочку:
z }|{
sin 2h = 2 · sin h · cos h = 0 x, y ∈ [0, π], x<y
2
cos 2h = 1 − 2 · sin
| {z h} = 1
0
⇓
x+y x−y
⇓ ∈ (0, π), ∈ (−π, 0)
2 2
1 0 (отрезок [0, π] превратился в интервалы (0, π) и (−π, 0)!)
z }| { z }| {
sin(x + 2h) = sin x · cos 2h + cos x · sin 2h = sin x ⇓
cos(x + 2h) = cos x · cos
| {z2h} − sin x · sin
| {z2h} = cos x
1 0
cos x − cos y = (5.1.89) =
x+y x−y
= −2 · sin · sin >0
| {z2 } | {z2 }
Предложение 5.1.51. На интервале (0, π) си-
<
>
π π π π π
sin = sin − = sin · cos − Индукцией из формул (5.1.99) и (5.1.100) вы-
4 2 4 | {z2} 4
водится
1
π π π
− cos · sin = cos Следствие 5.1.55. Справедливы тождества:
| {z 2} 4 4
0
cos(πn) = cos(−πn) = (−1)n ,
(5.1.107)
Отсюда получаем:
sin(πn) = sin(−πn) = 0. (5.1.108)
π π π π π 2 π
1 = sin = sin + = 2·sin ·cos = 2·sin
2 4 4 4 4 4 Предложение 5.1.56. На интервале − π , π
2 2
⇓ косинус положителен, а на интервале π2 , 3π
2 –
π 1 отрицателен:
sin2 =
4 2 π π
⇓ x∈ − , =⇒ cos x > 0 (5.1.109)
r 2 2
√
π 1 2 π 3π
sin = = x∈ , =⇒ cos x < 0 (5.1.110)
4 2 2 2 2
348 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
Предложение 5.1.57. На отрезке − π2 ,π2 си-
нус монотонно возрастает, а на отрезке π2 , 3π 2
монотонно убывает:
h π πi
x, y ∈ − , , x < y =⇒ sin x > sin y
2 2
(5.1.111)
π 3π А для косинуса так:
x, y ∈ , , x < y =⇒ sin x < sin y
2 2
(5.1.112)
π π
Доказательство. Для отрезка − 2 , 2 получа-
ем: h π πi
x, y ∈ − , , x<y
2 2
⇓
π π π π
x + , y + ∈ [0, π], x+ <y+
2 2 2 2
⇓ Тангенс и котангенс.
π π
cos x + > cos y + • Функции тангенс tg и котангенс ctg опреде-
2 2 ляются формулами
⇓ sin x π
tg x = x∈/ + πZ (5.1.113)
cos x 2
π cos x
sin x = (5.1.102) = − cos x + < ctg x = (x ∈
/ πZ) (5.1.114)
2 sin x
π
< − cos y + = (5.1.102) = sin y Предложение 5.1.59. Справедливы следующие
2 тождества:
π 3π
А для 2 , 2 : tg(x + π) = tg x, ctg(x + π) = ctg x
(5.1.115)
π 3π
x, y ∈ , , x<y π π
2 2 tg x − = − ctg x, ctg x − = − tg x
2 2
⇓ (5.1.116)
π π π π tg(−x) = − tg x, ctg(−x) = − ctg x
x + , y + ∈ (π, 2π), x+ <y+ (5.1.117)
2 2 2 2
§ 1. Элементарные функции 349
⇓
π π π π π π Теперь можно строить графики. Для танген-
x− ,y − ∈ − , , x− <y− са график выглядит так:
2 2 2 2 2 2
⇓
π π
tg x − < tg y −
2 2
⇓
π π
− ctg x = tg x − < tg y − = − ctg y
2 2
⇓
ctg x > ctg y
А для котангенса так:
350 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
h π πi
t = arcsin x ⇐⇒ x = sin t & t ∈ − ;
2 2
(5.1.122)
t = arccos x ⇐⇒ x = cos t & t ∈ [0; π] (5.1.123)
π π
t = arctg x ⇐⇒ x = tg t & t ∈ − ; ⋄ 5.1.70. Арккотангенс:
2 2
(5.1.124)
t = arcctg x ⇐⇒ x = ctg t & t ∈ (0; π) (5.1.125)
1
xn = −→ 0
3n n→∞
С другой стороны, очевидно, что некото- альных). Почти всегда это функции, получаю-
рые другие элементарные функции непрерывны. щиеся из элементарных с помощью алгебраиче-
Полный их список дает следующая теорема (ее ских операций (сумма, разность, произведение,
доказательство мы оставляем читателю в каче- частное) и операции композиции. Мы будем на-
стве упражнения): зывать такие функции стандартными (см. опре-
деление на с.357), чтобы отличать их от списка
Теорема 5.1.73. Следующие элементарные функций, перечисленных в § 1 этой главы и на-
функции (и только они) непрерывны в своей об- званных там элементарными.
ласти определения:
блемой интересовались. В частности, известный польский математик Альфред Тарский поставил так называемую
Проблему школьных тождеств (“High school identities”), которую можно считать упрощенным вариантом пробле-
мы равенств в Исчислении для частного случая, когда в сигнатуру теории включены только операции сложения,
умножения и возведения в степень (а в качестве модели рассматривается множество натуральных чисел N∗ ). Она
оказалась на удивление сложной и была решена в 1980 году Алексом Уилки, построившим знаменитый контрпример.
352 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
теоремой 5.2.9.
§ 2. Стандартные функции 353
! 5.2.4. При этом необязательно, чтобы все па- Семейство стандартных функций, опреде-
раметры из P и переменные из V действитель- ляемое числовым выражением. Если A –
но содержались в выражении H, нужно только, некое множество, и каждому его элементу a ∈ A
чтобы в H не было “лишних” параметров и пе- поставлена в соответствие некая функция fa :
ременных, то есть таких, которые √
не содержатся Rn ֒→ R, то такое отображение
в P и V . Например, выражение 2 вообще не
содержит переменных и параметров, но можно a 7→ fa
говорить, что это выражение над набором пере-
называется семейством функций, и для такого
менных V = (x, y, z) и параметров (a, b).
объекта используется запись
• Множество всех числовых выражений над
{fa ; a ∈ A}.
упорядоченными наборами параметров
(a1 , ..., am ) и переменных (x1 , ..., xn ) мы будем В частном случае, когда A представляет собой
обозначать символом EX(a1 , ..., am ; x1 , ..., xn ). некое подмножество в Rm , каждый элемент a ∈
A будет числовой строчкой (a1 , ..., am ), и семей-
⋄ 5.2.5. Запись
ство функций fa тогда записывается так:
xn ∈ EX(n; x). {fa1 ,...,am ; (a1 , ..., am ) ∈ A}.
означает, что в выражении xn буква n считается Теорема 5.2.9. Всякое числовое выражение
параметром, а буква x – переменной. Наоборот, H над упорядоченными наборами параметров
запись (a1 , ..., am ) и переменных (x1 , ..., xn )
xn ∈ EX(x; n).
H ∈ EX(a1 , ..., am ; x1 , ..., xn )
означает, что здесь x считается параметром, а n
– переменной. определяет некое семейство функций ha1 ,...,am
по формуле
⋄ 5.2.6. Точно так же запись
ha1 ,...,am (x1 , ..., xn ) = H. (5.2.134)
a · xn ∈ EX(a, n; x)
Доказательство. Смысл формулы (5.2.134)
следует понимать, как соглашение, что в выра- нуждается в прояснении, и мы проведем его ин-
жении a · xn буква a считается первым парамет- дукцией по сложности выражения H.
ром, буква n – вторым, а буква x – переменной. 0) Пусть сначала H — выражение сложности 0,
Наоборот, то есть не содержащее ни алгебраических опе-
a · xn ∈ EX(n, a; x), раций, ни символов элементарных функций.
Тогда
значит, что здесь n – первый параметр, a – вто-
рой, а x – переменная. — либо H вообще не содержит переменных,
и является просто собственным обозна-
⋄ 5.2.7. Запись чением какого-то неотрицательного цело-
го числа; тогда формула (5.2.134) задает
a · xn + y ∈ EX(a, n; x, y) функцию ha1 ,...,am : Rn → R, которая во
всех точках равна (одному и тому же) чис-
предполагает, что здесь a считается первым па- лу, описываемому выражением H;
раметром, n – вторым, x – первой переменной, а
— либо H представляет собой какую-то пе-
y – второй. Если бы мы записали
ременную из набора (x1 , ..., xn )
a · xn + y ∈ EX(a, n; y, x), H = xi , i = 1, ..., n;
то это означало бы, что для нас, по-прежнему, a в этом случае формула (5.2.134) интерпре-
– первый параметр, n – второй, но первой пере- тируется как тождество
менной считается y, а второй x.
ha1 ,...,am (x1 , ..., xn ) = xi , x ∈ R,
⋄ 5.2.8. В качестве упражнения полезно заме-
тить, что ни при каком соглашении о параметрах определяющее функцию ha1 ,...,am : Rn →
и переменных (и ни при каком их упорядочении) R, которая в каждой точке (x1 , ..., xn ) рав-
не могут получиться включения на значению переменной xi .
— либо H представляет собой какой-то пара-
a · xn ∈ EX(n; x), метр из набора (a1 , ..., am )
в этом случае формула (5.2.134) интерпре- D(fa1 ,...,am ) ∩ D(ga1 ,...,am ) становится воз-
тируется как тождество можным определить функцию
⋄ 5.2.29. Все же часто бывает так, что при при- ⊲ 5.2.33. Какие из последовательностей явля-
ведении стандартная функция не меняется, и, ются бесконечно малыми, а какие – бесконечно
как следствие, равенство большими?
1) xn = √1
b
H = H. n
√
2) xn = n
выполняется. Например, функция
⋄ 5.2.34. Проверьте, что следующие последова-
h(x) = logx sin x тельности ограничены:
Предел последовательности.
2) xn = sin 2πn
3 √ √
2. Заметим, что все числа {xn } неотрицатель-
(Ответ: α < − 3
2 , β> 3
2 ) ны (это можно доказать отдельно по индукции):
3) xn = cos πn
3 xn > 0
(Ответ: α < −1, β > 1)
4) xn = sin πn
3 3. Из картинки видно, что на первых несколь-
√ √
(Ответ: α < − 3
2 , β> 3
2 )
ких элементах {xn } наша последовательность
неубывает. Попробуем доказать, что она неубы-
⊲⊲ 5.2.31. Доказать что вает всегда:
1) 0 6= limn→∞ sin πn
3
xn 6 xn+1 (5.2.150)
5) limn→∞ (−1)n · n = ∞. ⇔ xn − 3 6 0 ⇔ xn 6 3
§ 2. Стандартные функции 361
b) Предполагаем, что оно верно при n = k: ⊲⊲ 5.2.39. Для данной последовательности {xn }
укажите какую-нибудь сходящуюся подпоследо-
xk 6 3 (5.2.152) вательность {xnk }, если она существует.
2πn
c) Доказываем, что тогда оно будет верно при 1) xn = cos 3
n = k + 1.
⊲⊲ 5.2.40. Проверьте с помощью критерия Коши
xk+1 6 3 (5.2.153)
сходимость последовательностей:
Действительно,
1) xn = sin πn
4 ;
√ πn
xk+1 6 3 ⇔ 6 + xk 6 3 ⇔ 2) xn = cos 7 ;
⇔ 6 + xk 6 9 ⇔ xk 6 3 3) xn = arctg(−1)n .
log2 (1+2nx )
23) f (x) = limn→∞ log2 (1+2n ) .
Рассмотрим примеры.
тов
1 Решение:
xn = π −→ 0
2 + 2πn n→∞
тогда мы получим lim (x2 − 2x + 3) = (подстановка) =
x→1
1 π = 12 − 2 · 1 + 3 = 1 − 2 + 3 = 2
f (xn ) = sin = sin + 2πn = 1 −→ 1
xn 2 n→∞
⊲⊲ 5.2.46. Вычислите пределы:
С другой стороны, если взять
1 1) limx→π/2 sin x
xn = −→ 0
π
− 2 + 2πn n→∞ 2) limx→0 arctg x − 1 + x3
√
x+1
то мы получим 3) limx→0 arcsin x−4
π 4) limx→√3 x2 −3
1 x4 +x2 +1 ,
f (xn ) = sin = sin − + 2πn = −1 −→ −1
xn 2 n→∞
Таким образом, мы получаем, что если взять од- Вычисление упрощением. Обсудим теперь
ну последовательность аргументов xn −→ 0, то ситуацию, когда, по-прежнему, требуется найти
n→∞
соотвествующая последовательность f (x ) будет предел
n
стремиться к одному числу (A = 1), а если взять lim G(x) =?
x→a
другую последовательность xn −→ 0, то f (xn )
n→∞
будет стремиться к другому числу (A = −1). но функция G(x) не определена в точке x = a
Это означает, что функция f (x) = sin x1 не (хотя, например, определена слева и справа от
имеет предела в точке x = 0, потому что иначе a). Тогда говорят, что имеется так называемая
f (xn ) должно было бы стремиться к этому кон- неопределенность, и алгоритм действий в таких
кретному пределу A, независимо от того, какую случаях состоит в том, чтобы подобрать новую
берешь последовательность xn −→ 0. функцию F (x), которая совпадала бы с G(x)
n→∞ вблизи точки a, и при этом была бы непрерывной
в точке a.
Принцип подстановки. Во-вторых, нужно Зрительно изобразить это руководство мож-
помнить, что если функция непрерывна, то по но так:
критерию непрерывности 4.4.30 ее предел равен
ее значению в точке:
lim G(x) = ...
x→a
Теорема 5.2.43 (принцип подстановки). Пусть !
подбираем функцию F (x)
G – непрерывная стандартная функция, опреде- совпадающую с G(x)
... = вблизи точки a = ...
ленная в некоторой окрестности точки a. То-
и непрерывную в точке a
гда предел функции G в точке x = a существу-
ет и равен ее значению в этой точке: ... = lim F (x) = F (a)
x→a
⋄ 5.2.47 (упрощение + сокращение). Найти пре- “уничтожает корни”. Оно называется сопряжен-
дел ным
√ радикалом,
√ и в нашем случае имеет вид
1 2 1 + x + 1 − x. Помножим числитель и знаме-
lim −
x→1 1 − x 1 − x2 натель дроби на сопряженный радикал:
При подстановке возникает неопределенность: √ √
1+x− 1−x
lim =
1 2 1 2 x→0 x
lim − = − =? √ √ √ √
x→1 1 − x 1 − x2 0 0 ( 1 + x − 1 − x) · ( 1 + x + 1 − x)
= lim √ √ =
x→0 x · ( 1 + x + 1 − x)
Значит, нужны преобразования. Попробуем √ 2 √ 2
упростить наше выражение: 1+x − 1−x
= lim √ √ =
x→0 x · ( 1 + x + 1 − x)
1 2 (1 + x) − (1 − x)
lim − = = lim √ √ =
x→1 1 − x 1 − x2
x→0 x · ( 1 + x + 1 − x)
1 2 2x
= lim − = = lim √ √ =
x→1 1 − x (1 − x)(1 + x) x→0 x · ( 1 + x + 1 − x)
1+x−2 x−1 2
= lim = lim = = lim √ √ = (подстановка) =
x→1 (1 − x)(1 + x) x→1 (1 − x)(1 + x)
x→0 1+x+ 1−x
−1 −1 2 2
= lim = lim = = √ √ = =1
x→1 1 + x x→1 1 + x
1+0+ 1−0 1+1
−1 1
= (подстановка) = =− В следующем примере снова используется со-
1+1 2
пряженный радикал.
⋄ 5.2.48 (разложение на множители). Найти
предел ⋄ 5.2.50. Вычислить предел
2
x −1 √3
lim 2 1 + x2 − 1
x→−1 x − x − 2 lim
x→0 x2
Здесь возникает неопределенность:
При подстановке имеем неопределенность:
2
x −1 1−1 0 √3
√
lim 2 = = =? 1 + x2 − 1 3
1+0−1 0
x→−1 x − x − 2 1+1−2 0 lim = =
x→0 x2 0 0
Это означает, что необходимы преобразования. В Значит нужны преобразования, которые здесь
данном случае они состоят в том, что числитель опять состоят в умножении на сопряженный ра-
и знаменатель нужно разложить на множители, дикал. В нашем примере радикалом является
√
после чего сократить дробь: выражение 3 1 + x2 − 1. Сопряженный же ради-
кал – то есть выражение, которое при умноже-
x2 − 1 (x − 1)(x + 1) нии на наш радикал “сокращает корни” – имеет
lim = lim = √ 2 √
x→−1 x2 − x − 2 x→−1 (x − 2)(x + 1)
вид 3 1 + x2 + 3 1 + x2 + 1. Умножим на него
x−1 −1 − 1 2 числитель и знаменатель:
= lim = (снова подстановка) = =
x→−1 x − 2 −1 − 2 3 √3
1 + x2 − 1
⋄ 5.2.49 (использование сопряженного радика- lim =
x→0 x2
ла). Вычислить предел √ √ √
( 3 1 + x2 − 1) ( 3 1 + x2 )2 + 3 1 + x2 + 1
√ √
1+x− 1−x = lim =
lim x→0
x2 (√ 3 2 √
1 + x2 ) + 3 1 + x2 + 1
x→0 x
При подстановке получается неопределенность: 1 + x2 − 1
= lim √ 2 √ =
x→0 2 3
√ √ x 1 + x2 + 3 1 + x2 + 1
1+x− 1−x 0
lim = x2
x→0 x 0 = lim √ =
x→0 2 3
2 √
Поэтому нужны какие-то преобразования. В x 1 + x2 + 3 1 + x2 + 1
примерах с корнями, как этот, в качестве такого 1
преобразования можно использовать домноже- = lim √ 2 √ =
x→0 3
1+x 2 + 3 1 + x2 + 1
ние на сопряженный радикал.
Под этим понимается вот что. В √ числите- 1
= (подстановка) = √ 2 √ =
√ имеется иррациональное выражение 1 + x −
ле 3
1+0 + 31+0+1
1 − x, называемое радикалом. Подберем такое 1 1
выражение, которое при умножении на него = =
1+1+1 3
364 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
cos2 x − 1 cos x = y,
1
1
lim = y −→ 1 = py p
x→0 cos2 x + 2 cos x − 3 = lim 1
= lim =
x→0 y→0−0 1 + 5y 2 y→0−0 − 1 + 5y 2
−y
y2 − 1 (y − 1)(y + 1) 1
= lim 2 = lim = = √ = −1
y→1 y + 2y − 3 y→1 (y − 1)(y + 3)
− 1+5·0
y+1 2 1
= lim = = ⊲⊲ 5.2.57. Найти пределы
y→1 y + 3 4 2
§ 2. Стандартные функции 365
И, во-вторых,
⊲⊲ 5.2.70. Найдите пределы
−2 sin2 x 2x
2 x
2 = z, x = 2z 1. limx→0 e x−1 ;
lim = z −→ 0 =
x→0 x2 x→0
2. limx→0 ln(1−3x)
;
2 x
1 sin z 1 5
= − lim =− 3. limx→∞ x e x − 1 ;
2 z→0 z 2
1
4. limx→∞ x ln x−1
x+1 ;
Мы получаем ответ:
ln(1−7ex )
5. limx→−∞ ;
1
− 21 1 ex
lim (cos x) x2 =e = √ . 6. 1−esin x
limx→−∞ 1−cos2 x .
x→0 e
368 Глава 5. СТАНДАРТНЫЕ ФУНКЦИИ
Глава 6
ПРОИЗВОДНАЯ
§1 Производная
Понятие производной появилось в анализе как инструмент для решения задач на экстремум (то есть
на максимум и минимум), поэтому обсуждение этой темы полезно начать с какого-нибудь простого
примера, иллюстрирующего эту связь.
f (x) = x2 − x4 (6.1.1)
x
и требуется найти ее наибольшее значение на 0 a
прямой R.
Нулями этой функции (то есть решениями
уравнения f (x) = 0) являются числа {−1, 0, 1},
поэтому легко сообразить, что график f будет
выглядеть примерно так: Как любая линейная функция (мы определи-
ли линейные функции формулой (4.3.105)), ка-
сательная описывается уравнением вида
y = k·x+b
y
y = x2 − x4 в котором k – угловой коэффициент, связанный
с углом наклона ϕ касательной формулой
−1 1 x k = tg ϕ
? 0 ? Если точку a сдвинуть в какое-нибудь другое ме-
сто, то угловой коэффициент k, вообще говоря,
изменится (как и вся касательная). Таким обра-
зом, мы получаем некую зависимость, или, точ-
нее сказать, функцию
a 7→ k(a)
Отсюда можно заключить, что f действительно которая каждой точке a ∈ R ставит в соответ-
будет иметь максимум в каких-то точках, лежа- ствие угловой коэффициент k = k(a) касатель-
щих на интервалах (−1, 0) и (0, 1), и нам нужно ной к графику функции f в точке a.
придумать, как найти эти точки. Заметим далее, что в точках максимума (а
также, минимума) касательная к графику функ-
Чтобы это понять, нарисуем касательную к ции f горизонтальна, то есть угловой коэффици-
графику функции f в какой-нибудь точке a ∈ R ент касательной равен нулю
(что такое касательная, мы надеемся, что чита-
тель знает по школе): k(a) = 0. (6.1.2)
369
370 Глава 6. ПРОИЗВОДНАЯ
Поэтому если б мы знали функцию a 7→ k(a), то задача будет решена в примере 6.1.3), и уравне-
решив уравнение (6.1.2), мы как раз смогли бы ние (6.1.2) решается так:
получить точки максимума.
Раздел анализа, называемый Дифференци- k(a) = 0 ⇔ 2a − 4a3 = 0 ⇔
альным исчислением (мы поговорим о нем на
1 1
с.382), как раз предоставляет алгоритм, позво- ⇔ a∈ − √ , 0, √ ,
ляющий найти функцию a 7→ k(a) по функции 2 2
x 7→ f (x). Для нашей функции f (x) = x2 − x4 После этого становится понятно, что максимум
соответствующая функция k имеет вид нашей функции достигается в точках ± √12 , и ра-
k(a) = 2a − 4a3 (6.1.3) вен
1 1 1 1
(почему это так станет понятно после § 1 настоя- f ± √ = − =
2 2 4 4
щей главы, а конкретно для функции (6.1.1) эта
k(a) = f ′ (a)
Это одно из главных понятий в математическом анализе, и, помимо нахождения экстремумов (мак-
симумов и минимумов), оно используется в разных других задачах, например,
– при построении графика функции (это описывается в (b) этой главы),
– при вычислении сложных пределов с помощью правила Лопиталя (см. (a) этой главы),
– при определении еще одного важного объекта в математическом анализе – неопределен-
ного интеграла (об этом речь пойдет в главе 8).
В этой главе мы дадим аккуратное определение этому понятию, научимся вычислять производные
стандартных функций и обсудим приложения производной.
f (a + t) − f (a)
lim = f ′ (a)
t→0 t
Отсюда следует цепочка
f (a + t) − f (a)
lim f (a + t) − f (a) = lim f (a + t) − lim f (a) = lim (f (a + t) − f (a)) = lim ·t =
t→0 t→0 t→0 t→0 t→0 t
f (a + t) − f (a)
= lim · lim t = f ′ (a) · 0 = 0,
t→0 t t→0
из которой мы получаем
lim f (x) = lim f (a + t) = f (a)
x→a t→0
По теореме 4.4.30 о связи между пределом и непрерывностью, это означает, что функция f непре-
рывна в точке a.
Геометрический смысл производной. У фициент (то есть тангенс угла наклона) секущей
производной имеется естественная геометриче- будет равен
ская интерпретация: число f ′ (a), определенное
формулой (6.1.4) как раз и есть угловой коэф- f (a + t) − f (a)
kt =
фициент касательной к графику функции f в t
точке a, о котором мы говорили в примере 6.1.1. Теперь “расфиксируем” число t и устремим его к
Чтобы понять, почему это так, зафиксируем сна- нулю. Тогда наша секущая тоже станет двигать-
чала число t и проведем секущую к графику ся, “приближаясь к касательной”, а “в пределе” –
функции f через точки (a; f (a)) и (a + t; f (a + t)): просто превратится в касательную.
y y
f (a + t) B
y = f (x) y = f (x)
f (a) A
C x f (a) x
0 a a+t 0 a
Из треугольника ABC видно, что угловой коэф- Угловой коэффициент (тангенс угла наклона)
372 Глава 6. ПРОИЗВОДНАЯ
этой касательной будет как раз равен производ- функции f (x) = | arctg x| производная в точ-
ной: ке x0 = 1 больше, чем в точке x1 = 2 (потому
f (a + t) − f (a) что угол наклона касательной в точке x0 = 1
k = lim = f ′ (a)
t→0 t больше, чем в точке x1 = 2):
y = | arctg(x)|
x
x 0 x0
0
x
0 a x
x0 0
но в точке x0 = 0 она не дифференцируема
(потому что в x0 = 0 однозначно определен-
ную касательную провести невозможно)
а если производная в x0 отрицательна
y
f ′ (x0 ) < 0
то касательная в x0 убывает
y
x
x
0 x0
– во-вторых, по графику функции можно сооб-
разить, в каких точках производная больше,
а в каких – меньше; например, у той же самой
§ 1. Производная 373
ey − 1 αs
= xα−1 · lim · lim s =
y→0 y s→0 e − 1
x
= выносим α из второго предела
и преобразуем этот предел =
0 1
−1
ey − 1 es − 1
= αxα−1 · lim · lim =
y→0 y s→0 s
= дважды применяем
формулу (5.2.162) =
определите, в каких точках она дифференциру-
ема, и будет ли она дифференцируемой = αxα−1 · 1 · 1−1 = αxα−1 .
1) на интервале (−∞; 1)?
А при x = 0 и α > 1 вычисления упростятся:
2) на интервале (−∞; 0)?
3) на интервале (1; +∞)? tα − 0 α tα
4) на интервале (0; 1)? f ′ (0) = lim = lim =
t→0 t t→0 t
= lim tα−1 = 0 = α · xα−1 x=0 .
t→0
Производные элементарных функций.
Вычислим теперь производные элементарных ⋄ 6.1.11. Производная показательной
функций (в тех случаях, когда это возможно). функции:
⋄ 6.1.9. Производная линейной функции: f (x) = ax =⇒ f ′ (x) = ax · ln a (6.1.9)
f (x) = kx + b =⇒ f ′ (x) = k (6.1.5) В частности,
Действительно, ax+t − ax at − 1
f ′ (x) = lim = ax · lim =
t→0 t t→0 t
f (x + t) − f (x) et ln a − 1
f ′ (x) = lim = применяем
= формулу = a x
· lim =
t→0 t (5.1.64) t→0 t
(k · (x + t) + b) − (k · x + b) s
e −1
= lim =
t→0 t = st == t lns a = ax ln a · lim =
ln a
s→0 s
k·t применяем x x
= lim = lim k = k = формулу (5.2.162) = a ln a · 1 = a ln a
t→0 t t→0
374 Глава 6. ПРОИЗВОДНАЯ
s −s · (x + ctg s)
= lim = = lim =
s→0 (cos s − 1) · x − sin s · sin(arccos x) s→0 1 + x2
используем формулу
= sin(arccos x) = √1 − x2 = s · (x · sin s + cos s)
= − lim =
s→0 (1 + x2 ) · sin s
s
= lim √ = x · sin s + cos s
s→0 (cos s − 1) · x − sin s · 1 − x2 = − lim =
s→0 (1 + x2 ) · sin s
1 s
= lim cos s−1 sin s
√ = x · lims→0 sin s + lims→0 cos s
s→0
s · x − s · 1 − x2 =− =
(1 + x2 ) · lims→0 sins s
1
= √ = x·0+1 1
lims→0 s · x − lims→0 sins s · 1 − x2
cos s−1 =− =−
(1 + x2 ) · 1 1 + x2
используем первый
= замечательный предел =
и формулу (6.1.14) Из этих примеров видно, что (как и в случае
1 1 с непрерывностью, о чем мы говорили в теореме
= √ = −√
0·x−1· 1−x2 1 − x2 5.1.73), не все элементарные функции дифферен-
цируемы на своей области определения:
⋄ 6.1.19. Производная арктангенса:
1 Теорема 6.1.21. Среди элементарных функций
f (x) = arctg x =⇒ f ′ (x) = (6.1.20)
1 + x2 все непрерывные1 (и только они) дифференциру-
Действительно, емы на всяком интервале в своей области опре-
деления.
f
а если, кроме того g(x) 6= 0 то функция g тоже дифференцируема в точке x, причем
′
f f ′ (x) · g(x) − f (x) · g ′ (x)
(x) = (6.1.26)
g g 2 (x)
′ f (x + t) + g(x + t) − f (x) + g(x)
f + g (x) = lim =
t→0
t
f (x + t) − f (x) + g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim + lim =
t→0 t t→0 t t→0 t
= f ′ (x) + g ′ (x)
′ f (x + t) − g(x + t) − f (x) − g(x)
f − g (x) = lim =
t→0
t
f (x + t) − f (x) − g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim − lim =
t→0 t t→0 t t→0 t
= f ′ (x) − g ′ (x)
f ′ f (x+t) f (x)
g(x+t) − g(x) f (x + t) · g(x) − f (x) · g(x + t) вычтем и прибавим
(x) = lim = lim = слагаемое f (x) · g(x) =
g t→0 t t→0 t · g(x + t) · g(x)
f (x + t) · g(x) − f (x) · g(x) + f (x) · g(x) − f (x) · g(x + t)
= lim =
t→0 t · g(x + t) · g(x)
f (x + t) · g(x) − f (x) · g(x) f (x) · g(x) − f (x) · g(x + t)
= lim + =
t→0 t · g(x + t) · g(x) t · g(x + t) · g(x)
f (x + t) − f (x) g(x + t) − g(x) 1
= lim · g(x) − f (x) · · =
t→0 t t g(x + t) · g(x)
§ 1. Производная 377
(g ◦ f )′ = (g ′ ◦ f ) · f ′ (6.1.28)
xn −→ a, xn 6= a (6.1.29)
n→∞
и убедиться, что
g(f (xn )) − g(f (a))
lim = g ′ (f (a)) · f ′ (a) (6.1.30)
n→∞ xn − a
Для этого нужно рассмотреть три случая:
– возможна ситуация, когда для почти всех n ∈ N выполняется неравенство f (xn ) 6= f (a);
– другая ситуация — когда для почти всех n ∈ N выполняется равенство f (xn ) = f (a);
– наконец, последний вариант — если неравенство f (xn ) 6= f (a) выполняется для беско-
нечного набора чисел n ∈ N и одновременно равенство f (xn ) = f (a) выполняется для
бесконечного набора чисел n ∈ N.
378 Глава 6. ПРОИЗВОДНАЯ
1. Рассмотрим сначала первый случай, то есть когда для почти всех n ∈ N выполняется нера-
венство f (xn ) 6= f (a). Тогда можно делить и умножать на f (xn ) − f (a) 6= 0, и мы получим
g(f (xn )) − g(f (a)) g(f (xn )) − g(f (a)) f (xn ) − f (a)
lim = lim · =
n→∞ xn − a n→∞ f (xn ) − f (a) xn − a
!
g(f (xn )) − g(f (a)) f (xn ) − f (a) в левом пределе делаем
= lim · lim = замену yn = f (xn ) −→ f (a) =
n→∞
n→∞ f (xn ) − f (a) n→∞ xn − a yn = f (xn ) 6= f (a)
2. Рассмотрим далее второй случай, когда для почти всех n ∈ N выполняется равенство f (xn ) =
f (a). Тогда мы получаем:
g(f (xn )) − g(f (a)) вспоминаем, что g(f (a)) − g(f (a)) 0
lim = f (xn ) = f (a) = lim = lim =0
n→∞ xn − a n→∞ xn − a n→∞ xn − a
А с другой стороны,
h(x) = sin(x2 ) = g(f (x)), g(y) = sin y, f (x) = x2 h(x) = sin2 x = g(f (x)), g(y) = y 2 , f (x) = sin x
Тогда Тогда
g ′ (y) = cos y, f ′ (x) = 2x g ′ (y) = 2y, f ′ (x) = cos x
Применяя формулу (6.1.56), получаем: и, применяя (6.1.56), получаем:
⋄ 6.1.29. Вычислим производную функции Для этого представим нашу функцию, как ком-
h(x) = earctg x . Для этого представим ее как ком- позицию двух функций с помощью формулы
позицию двух элементарных функций: (6.1.31):
или
f (ξ) = min f (x).
x∈(a,b)
f ′ (ξ) = 0
x
a ξ b
то есть
∀x ∈ (a, b) f (x) 6 f (ξ) (6.1.32)
Тогда, с одной стороны,
0
6
(6.1.32)
z }| {
f (x) − f (ξ) если предел существует, f (x) − f (ξ)
f ′ (ξ) = lim = то он равен пределу слева = lim >0
x→ξ x−ξ x→ξ−0 x−ξ
| {z }
>
(x < ξ)
0
А, с другой стороны,
0
6
(6.1.32)
z }| {
f (x) − f (ξ) f (x) − f (ξ)
если предел существует,
f ′ (ξ) = lim = то он равен пределу справа = lim 60
x→ξ x−ξ x→ξ+0 x−ξ
| {z }
<
(x > ξ)
0
Теорема Ролля.
Теорема 6.1.32 (Ролля). 3
Пусть функция f определена на отрезке [a, b], причем
(i) f непрерывна на отрезке [a, b],
(ii) f дифференцируема на интервале (a, b),
(iii) f (a) = f (b).
Тогда существует точка ξ ∈ (a, b), такая что
f ′ (ξ) = 0
x
a ξ b
2) Пусть m 6= M . Заметим, что тогда невозможна ситуация, когда обе точки xm или xM
лежат на концах отрезка [a, b],
xm ∈ {a, b} ∋ xM , (6.1.33)
(и это был бы случай 1). Из того, что (6.1.33) невозможно, следует, что либо xm , либо xM
лежит внутри отрезка [a, b]:
– либо a < xm < b,
– либо a < xM < b.
(и возможно, верно и то, и другое). Значит, функция f имеет экстремум на интервале
(a, b) (если a < xm < b — то минимум, а если a < xM < b — то максимум). Следовательно,
по теореме Ферма 6.1.31, найдется точка ξ ∈ (a, b) такая, что f ′ (ξ) = 0.
Мы получаем, что в любом случае найдется точка ξ ∈ (a, b) такая, что f ′ (ξ) = 0.
Теорема Лагранжа.
Теорема 6.1.33 (Лагранжа). 4
Пусть функция f определена на отрезке [a, b], причем
(i) f непрерывна на отрезке [a, b],
(ii) f дифференцируема на интервале (a, b).
Тогда существует точка ξ ∈ (a, b), такая что
f (b) − f (a)
f ′ (ξ) = (6.1.34)
b−a
f (b)
f (a)
x
a ξ b
Значит, по теореме Ролля 6.1.32, найдется такая точка ξ ∈ (a, b), что F ′ (ξ) = 0, и мы получаем:
f (b) − f (a)
0 = F ′ (ξ) = f ′ (ξ) − .
b−a
Иными словами,
f (b) − f (a)
f ′ (ξ) = .
b−a
Доказательство. Сначала нужно убедиться, что g(a) 6= g(b), то есть что формула (6.1.35) имеет
смысл. Действительно, если бы оказалось, что g(a) = g(b), то это означало бы, что g(x) удовле-
творяет всем трем условиям теоремы Ролля 6.1.32, поэтому нашлась бы точка ξ ∈ (a, b) такая, что
g ′ (ξ) = 0. Это невозможно по условию (iii) нашей теоремы.
Теперь перейдем к доказательству формулы (6.1.35). Рассмотрим вспомогательную функцию
f (b) − f (a)
F (x) = f (x) − f (a) − · (g(x) − g(a))
g(b) − g(a)
f (b) − f (a) ′
0 = F ′ (ξ) = f ′ (ξ) − · g (ξ).
g(b) − g(a)
неопределенностью 00 )
§ 1. Производная 383
ной функции h нам приходилось вводить новые 0) если выражение F не содержит переменной
обозначения для «более простых» функций, че- x, то его частная производная по x считается
рез которые h выражается алгебраически или в нулевой:
виде композиции. Например, чтобы вычислить ∂F
= 0, (6.1.37)
производную функции h(x) = sin(x2 ) в приме- ∂x
ре 6.1.27 нам пришлось рассмотреть функции 1) частная производная от переменной x по са-
g(y) = sin y и f (x) = x2 , выписать их производ- мой этой переменной x считается равной еди-
ные и подставить их в формулу (6.1.27). нице:
Этот способ вычислений выглядит довольно ∂x
= 1, (6.1.38)
громоздким в сравнении с приемами, употреб- ∂x
лявшимися для таких задач в школе, где, как, 2) выполняются равенства
наверное, помнит читатель, вычисление произ-
водной оформляется в виде цепочки равенств ∂ α
(иногда длинной цепочки, но все же гораздо ко- x = α · xα−1 (6.1.39)
∂x
роче, чем запись, которую приходится употреб- ∂ x
лять, следуя алгоритму действий, описанному на a = ln a · ax (a > 0) (6.1.40)
∂x
страницах 377 и 378). Например, для функции ∂ x
h(x) = sin(x2 ) можно (используя обозначение e = ex (6.1.41)
∂x
(5.2.133)) записать эту цепочку так: ∂ 1
loga x = (x > 0) (6.1.42)
′ ′ ∂x x · ln a
∂ 1
sin(x2 ) = sin y = ln x = (x > 0) (6.1.43)
y=x2 ∂x x
∂
= (sin y)′ 2
· (x2 )′ = cos x2 · 2x. (6.1.36) sin x = cos x (6.1.44)
y=x
∂x
∂
Естественно поэтому задуматься, отчего школь- cos x = − sin x (6.1.45)
ные приемы приводят к правильным результа- ∂x
там, и как их следует аккуратно описать, чтобы ∂ 1
tg x = (6.1.46)
грамотно использовать для вычислений. ∂x cos2 x
Раздел математического анализа, занимаю- ∂ 1
ctg x = − 2 (6.1.47)
щийся этими вопросами, называется Исчисление, ∂x sin x
и мы упоминали уже о нем в начале главы 5. ∂ 1
arcsin x = √ (6.1.48)
Его идея состоит в том, чтобы поглядеть на про- ∂x 1 − x2
изводную (и на интеграл, о котором мы пого- ∂ 1
ворим в следующей главе), как на формальную arccos x = − √ (6.1.49)
∂x 1 − x2
операцию над числовыми выражениями6 . Такой ∂ 1
отстраненный взгляд позволяет формализовать arctg x = (6.1.50)
∂x 1 + x2
приемы вычисления производной таким образом, ∂ 1
что цепочки вида (6.1.36) становятся результа- arcctg x = − (6.1.51)
∂x 1 + x2
том применения одного общего алгоритма, обос-
нованность которого отдельно доказывается, и 3) для произвольных числовых выражений F и
поэтому не вызывает сомнений. G
В этом параграфе мы опишем этот алгоритм ∂ ∂F ∂G
F +G = + (6.1.52)
(и докажем правомерность его применения), что- ∂x ∂x ∂x
бы иметь формальные основания пользоваться ∂ ∂F ∂G
им в примерах. F −G = − (6.1.53)
∂x ∂x ∂x
∂ ∂F ∂G
F ·G = ·G+F · (6.1.54)
Частная производная числового выраже- ∂x ∂x ∂x
ния. Напомним, что приведенные числовые ∂ F ∂F
· G − F · ∂G
выражения были определены нами на с.359. Вся- = ∂x ∂x
(6.1.55)
∂x G G2
кому приведенному числовому выражению F и
любой переменной x можно естественным обра- 4) если F и G — числовые выражения, причем
зом поставить в соответствие некое новое чис- G не содержит переменную x, то для выраже-
∂
ловое выражение, обозначаемое ∂x (F ) или ∂(F ) ния, полученного подстановкой, выполняется
∂x
(если это не приводит к недоразумениям, скоб- равенство
ки вокруг F могут не писаться) и называемое
∂ G
производным выражением таким образом, что- y=F ∂G ∂F
бы выполнялись следующие условия: = · (6.1.56)
∂x ∂y y=F ∂x
6 Числовые выражения были определены выше на с.352.
384 Глава 6. ПРОИЗВОДНАЯ
′ 1
loga x = (x > 0) (6.1.69)
x · ln a
′ 1
! 6.1.35. К этим правилам следует добавить, ln x = (x > 0) (6.1.70)
что операции дифференцирования выражений x
′
по другим переменным определяются по анало- sin x = cos x (6.1.71)
гии. ′
cos x = − sin x (6.1.72)
! 6.1.36. Из формул (6.1.52)-(6.1.56) следует,
′ 1
что область допустимых значений переменной tg x = (6.1.73)
для производного выражения подчиняется ра- cos2 x
′ 1
венствам: ctg x = − 2 (6.1.74)
sin x
∂(F + G) ∂F ∂G ′ 1
D =D ∩D (6.1.57) arcsin x = √ (6.1.75)
∂x ∂x ∂x 1 − x2
∂(F − G) ∂F ∂G ′ 1
D =D ∩D (6.1.58) arccos x = − √ (6.1.76)
∂x ∂x ∂x 1 − x2
′
∂(F · G) ∂F ∂G 1
D =D ∩D (6.1.59) arctg x = (6.1.77)
∂x ∂x ∂x 1 + x2
F ′ 1
∂( )
D ∂xG = arcctg x = − (6.1.78)
(6.1.60) 1 + x2
= D ∂F ∂G
∂x ∩ D ∂x \ {x : G = 0}
! 3) для произвольных выражений F и G от пере-
∂ G
D y=F
= менной x,
∂x
n o (6.1.61) ′
= x : F ∈ D ∂G ∩ D ∂F F + G = F ′ + G′ (6.1.79)
∂y ∂x
′
Из (6.1.54) и (6.1.37) следует F − G = F ′ − G′ (6.1.80)
′
Теорема 6.1.37. Если числовое выражение G не F · G = F ′ · G + F · G′ (6.1.81)
содержит переменной x, то ′
F F ′ · G − F · G′
= (6.1.82)
∂ ∂ G G2
G·F =G· F (6.1.62)
∂x ∂x
4) если F и G — числовые выражения, причем G
не сожержит переменную x, то для выраже-
Производная одноместного числового вы-
ния, полученного подстановкой, выполняется
ражения. Если F – одноместное числовое вы-
равенство
ражение, например, от переменной x, то частную
′
производную по этой переменной удобно обозна- ∂G
чать штрихом: G = · F ′. (6.1.83)
y=F ∂y y=F
∂
F′ = F (6.1.63)
∂x
Для этого случая правила вычисления полезно Теорема 6.1.38. Если выражение G не содер-
переписать отдельно: жит переменной x, то
0) если F – нульместное числовое выражение, ′
то его производная считается нулевой: G · F = G · F ′.
Производная стандартной функции. Объ- То же самое верно для случая разности и про-
ясним теперь, как связана производная число- изведения выражений. Для отношения получа-
P
вого выражения с производной порождаемой им ем: если F = Q , где P и Q – выражения слож-
стандартной функции. Эта связь выражается ности < k, то, во-первых, рассмотрев функции
следующей теоремой, оправдывающей определе- (6.1.89), мы снова по предположению индукции
ние на с.878. получим, что функции p и q дифференцируемы
на интервале (a, b), и их производные опреде-
Теорема 6.1.52. Пусть стандартная функция ляются тождествами (6.1.90). А, во-вторых, из
f определяется непрерывным числовым выра- условия (6.1.87) следует, что функция q вдоба-
жением7 F (при заданных значениях парамет- вок не равна нулю на интервале (a, b):
ров),
f (x) = F . (6.1.86) (a, b) ⊆ {x : q(x) = Q =
6 0}.
Тогда на всяком интервале (a, b) из области Вместе это означает, что функция
определения производной выражения F ,
p(x)
(a, b) ⊆ D(F ′ ). (6.1.87) f (x) =
q(x)
функция f дифференцируема и ее производная дифференцируема на интервале (a, b) и ее про-
определяется на (a, b) производной выражения изводная на этом множестве определяется про-
F: изводной выражения F :
f ′ (x) = F ′ , x ∈ (a, b). (6.1.88)
p′ (x) · q(x) − p(x) · q ′ (x)
Доказательство. Проведем индукцию по слож- f ′ (x) = (6.1.26) = =
q(x)2
ности выражения F . Прежде всего, для элемен- ′
тарных непрерывных выражений это очевидно. P ′ · Q − P · Q′ P
= 2
= (6.1.82) = = F ′.
Предположим, что это верно для выражений Q Q
сложности, меньшей некоторого k ∈ N∗ . Пусть
Остается рассмотреть (самый сложный) слу-
F – выражение сложности k. Тогда по определе-
чай композиции. Пусть
нию, F будет либо суммой, либо разностью, ли-
бо произведением, либо отношением, либо ком-
F = Q ,
позицией выражений сложности < k. Рассмот- y=P
рим каждый из этих случаев.
где Q – непрерывное элементарное выражение от
Если F = P + Q, где P и Q – выражения
переменной y, а P – непрерывное выражение от
сложности < k, то можно рассмотреть функции
переменной x сложности < k. Условие (6.1.87) в
p(x) = P, q(x) = Q (6.1.89) этом случае принимает вид
интервале (α, β), и ее производная должна опре- p(xn ) 6= 0. Тогда можно делить и умножать на
деляться выражением Q′ : p(xn ) − p(x0 ) 6= 0, и мы получим
а точка p(x0 ) при этом должна быть нулем: А для xnk получаем:
§2 Приложения производной
(a) Правило Лопиталя
Теоремы о дифференцируемых функциях позволяют доказать важное правило Лопиталя, с помо-
щью которого удается вычислять “сложные” пределы (которые иначе сосчитать бывает невозмож-
но).
f (x) f ′ (x)
lim = lim ′ (6.2.92)
x→a g(x) x→a g (x)
8 Эта теорема используется в главе 7 при доказательстве асимптотической формулы Тейлора-Пеано 7.2.35
§ 2. Приложения производной 389
f˜(xn ) f ′ (ξn )
= ′ , ξn ∈ (a, xn )
g̃(xn ) g (ξn )
Точно так же на каждом отрезке [xn , a] (с xn < a) существует точка ξn ∈ (xn , a), такая что
f˜(xn ) f ′ (ξn )
= ′ , ξn ∈ (xn , a)
g̃(xn ) g (ξn )
ξ ∈ (a, x ),
n n
f (xn ) ˜
f (xn ) ′
f (ξn ) ξ ∈или f ′ (ξ)
lim = lim = lim ′ = n (xn , a), = lim ′ =
n→∞ g(xn ) n→∞ g̃(xn ) n→∞ g (ξn ) поэтому ξ→a g (ξ)
ξn −→ a
n→∞
неважно, какая f ′ (x)
= буква стоит под = lim
знаком предела x→a g ′ (x)
f (x) f ′ (x)
lim = lim ′ (6.2.94)
x→∞ g(x) x→∞ g (x)
390 Глава 6. ПРОИЗВОДНАЯ
⋄ 6.2.3. Вычислим предел ln cos x 0 применяем
lim = = теорему 6.2.1 =
x→0 x2 0
sin 2x
lim (ln cos x)′ 1
x→0 arctg 3x cos x · (− sin x)
= lim = lim =
x→0 (x2 )′ x→0 2x
Для этого можно воспользоваться теоремой
− sin x 0 снова
6.2.1: = lim = = применяем =
x→0 2x cos x 0 теорему 6.2.1
sin 2x 0 применяем (− sin x)′ − cos x
lim = = теорему 6.2.1 = = lim = lim =
x→0 arctg 3x 0 x→0 (2x cos x) ′ x→0 2 cos x − 2x sin x
(sin 2x)′ cos 2x · 2 cos 0 · 2 −1 1
= lim = lim 3 = 3 = = =−
x→0 (arctg 3x)′ x→0 2−0 2
1+9x2 1+0
1·2 2
= = ⋄ 6.2.6. Теперь пример, где применяется теоре-
3 3
ма 6.2.2:
⋄ 6.2.4. Правило Лопиталя можно применять
π
несколько раз подряд. Покажем это на следую- 2 − arctg x 0 применяем
lim = = теорему 6.2.2 =
щем примере: x→+∞ ln 1 + x12 0
1
1 − cos x 0 применяем
( π2 − arctg x)′ − 1+x 2
lim = = = lim ′ = lim =
теорему 6.2.1 = x→+∞ ln 1 + 1 1
· − x23
x→0 x2 0 x2
x→+∞
1+ x12
(1 − cos x)′ sin x 0 1 x2 + 1 x3 x
= lim = lim = = = lim · · = lim = +∞
x→0 (x2 )′ x→0 2x 0 x→+∞ 1 + x2 x2 2 x→+∞ 2
снова (sin x)′ cos x 1
= применяем = lim = lim =
теорему 6.2.1 x→0 (2x)′ x→0 ⊲⊲ 6.2.7. Вычислите пределы:
2 2
1. limx→1 sin 3πx
sin 2πx .
⋄ 6.2.5. Еще один пример, где правило Лопита- tg x−x
ля применяется несколько раз: 2. limx→0 sin x−x2 .
tg x−x
3. limx→0 sin x−x .
∞
Раскрытие неопределенностей типа ∞.
∞
Теорема 6.2.8 (правило Лопиталя для предела в точке с неопределенностью ∞ ). Пусть функции
f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы в некоторой окрестности точки a,
(ii) limx→a f (x) = ∞ и limx→a g(x) = ∞,
(iii) g ′ (x) 6= 0 в некоторой выколотой окрестности точки a,
f ′ (x)
(iv) существует предел limx→a g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→a g(x) , причем
f (x) f ′ (x)
lim = lim ′ (6.2.95)
x→a g(x) x→a g (x)
§ 2. Приложения производной 391
f ′ (x)
Доказательство. 1. Рассмотрим сначала случай, когда предел limx→a g′ (x) конечен:
f ′ (x)
lim =A∈R (6.2.96)
x→a g ′ (x)
Зафиксируем интервал (a − δ, a), на котором g ′ (x) 6= 0. В силу теоремы 6.2.22, функция g(x) должна
быть строго монотонна на (a − δ, a). Поэтому, если взять возрастающую последовательность
x1 < x2 < ... < xn < ... < a, xn −→ a
n→∞
Положив
yn = g(xn ), zn = f (xn )
мы теперь получим, что последовательности yn и zn удовлетворяют всем условиям теоремы Штоль-
ца 4.2.74: во первых,
yn −→ ∞, y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ...
n→∞
и во вторых,
f (x)
lim =A
x→a−0 g(x)
Аналогично получаем
f (x)
lim =A
x→a+0 g(x)
′
Тогда fg′ (x)
(x)
6= 0 в некоторой выколотой окрестности точки a. (Это следует, например, из определения
предела по Коши.) Значит, f ′ (x) 6= 0 в некоторой выколотой окрестности точки a. Таким образом,
получается:
1) f ′ (x) 6= 0 в некоторой выколотой окрестности точки a, и
g′ (x)
2) limx→a f ′ (x) =0
То есть выполняется посылка теоремы, но только с переставленными символами f и g, и с условием,
что предел отношения производных конечен. Поскольку для случая конечного предела теорема уже
доказана, имеем
g(x) g ′ (x)
lim = 0 = lim ′
x→a f (x) x→a f (x)
откуда
f (x) f ′ (x)
lim = ∞ = lim ′
x→a g(x) x→a g (x)
392 Глава 6. ПРОИЗВОДНАЯ
∞
Теорема 6.2.9 (правило Лопиталя для предела в бесконечности с неопределенностью ∞ ). Пусть
функции f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы на некотором множестве (−∞, −E) ∪ (E, +∞),
(ii) limx→∞ f (x) = ∞ и limx→∞ g(x) = ∞,
(iii) g ′ (x) 6= 0 при x ∈ (−∞, −E) ∪ (E, +∞),
f ′ (x)
(iv) существует предел limx→∞ g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→∞ g(x) , причем
f (x) f ′ (x)
lim = lim ′ (6.2.97)
x→∞ g(x) x→∞ g (x)
ln(x−a)
2. limx→a ln(ex −ea ) .
Для этого воспользуемся теоремой 6.2.9:
ex +x2 +x
3. limx→+∞ x3 −ex .
2 2
x· ln cos x ln cos x
⋄ 6.2.14 (неопределенность вида 0 · ∞). = elimx→0 cos sin2 x = elimx→0 cos x·limx→0 sin2 x =
ln cos x
0
применяем
ln x ∞ = e1·limx→0 sin2 x = e 0 = теорему 6.2.1 =
lim x · ln x = (0 · ∞) = lim 1 = =
x→+0 x→+0 ∞ limx→0 (ln cos x)′ − sin x
cos x
x
1
=e (sin2 x)′ = elimx→0 2 sin x cos x =
применяем (ln x)′ 1
= теорему 6.2.8 = lim 1 ′
= lim x1 = −1
= elimx→0 2 cos2 x = e
−1
2 = √
x→+0 ( ) x→+0 − 2
x x e
= − lim x = 0
x→+0
⋄ 6.2.18 (неопределенность вида ∞0 ).
⋄ 6.2.15 (неопределенность вида ∞ − ∞).
1 1
lim (ln x) x = ∞0 = lim eln(ln x) x =
1 x→+∞ x→+∞
lim − tg x = (∞ − ∞) = ln(ln x) ln(ln x) ∞
x→ π2 cos x = lim e =e x x limx→+∞
= e∞ =
x→+∞
1 − sin x 0 применяем x))′
= limπ = = теорему 6.2.1 = применяем limx→+∞ (ln(ln(x)′
x→ 2 cos x 0 = теорему 6.2.9 = e =
(1 − sin x)′ − cos x 1
x ln x 1
= limπ ′
= limπ =0 = elimx→+∞ 1 = elimx→+∞ x ln x = e0 = 1
x→ 2 (cos x) x→ 2 − sin x
Доказательство. 1. Пусть выполняется (6.2.98). Тогда для любых x, y ∈ (a; b) таких что x < y
можно по теореме Лагранжа 6.1.33 подобрать точку ξ ∈ (x; y) такую, что
f (y) − f (x)
0 < f ′ (ξ) = ⇒ 0 < f (y) − f (x) ⇒ f (x) < f (y).
y−x
| {z }
<
2. Наоборот, если выполняется (6.2.99), то для любых x, y ∈ (a; b) таких что x < y можно по
394 Глава 6. ПРОИЗВОДНАЯ
f (y) − f (x)
0 > f ′ (ξ) = ⇒ 0 > f (y) − f (x) ⇒ f (x) > f (y).
y−x
| {z }
<
0
то, переходя при вычислении производной в точке x ∈ (a; b) к одностороннему пределу, мы получим:
0
>
z }| {
′ f (y) − f (x) f (y) − f (x)
f (x) = lim = lim >0
y→x y−x y→x+0 y−x
| {z }
<
Наоборот, если в любой точке x ∈ (a; b) производная неотрицательна, то для любых x, y ∈ (a; b)
таких, что x < y, подобрав по теореме Лагранжа 6.1.33 точку ξ ∈ (a; b) со свойством (6.1.34), мы
получим:
f (y) − f (x)
= f ′ (ξ) > 0 =⇒ f (y) − f (x) > 0 =⇒ f (x) 6 f (y)
y−x
| {z }
<
— либо, f ′ (x) < 0 всюду на (a, b), и в этом случае f убывает на (a, b):
∀x, y ∈ (a; b) x < y =⇒ f (x) > f (y) .
Лемма 6.2.23. В условиях теоремы 6.2.22 для любых трех точек x, y, z ∈ (a; b), связанных нера-
венством
x < y < z,
выполняется следующее:
(a) условие f (x) < f (z) влечет за собой условие f (x) < f (y) < f (z):
(b) условие f (x) > f (z) влечет за собой условие f (x) > f (y) > f (z):
Если это не так, то либо f (y) лежит ниже этого интервала, то есть f (y) 6 f (x), либо, наоборот,
выше, то есть f (y) > f (z). Убедимся, что ни то, ни другое невозможно.
1. Предположим, что f (y) 6 f (x). Если f (y) = f (x), то по теореме Ролля 6.1.32 найдется точка
ξ ∈ (x; y) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) < f (x). Тогда, если обозначить C = f (x), то мы получим
и, по теореме Коши о промежуточном значении 4.3.22, на интервале (y; z) должна найтись такая
точка c ∈ (y; z), что
f (c) = C = f (x)
Теперь опять по теореме Ролля 6.1.32 должна существовать точка ξ ∈ (x; c) такая, что
f ′ (ξ) = 0,
и это снова противоречит условию (6.2.100). Мы получаем, что неравенство f (y) 6 f (x) невозможно.
2. Проверим, что будет, если f (y) > f (z). Если f (y) = f (z), то по теореме Ролля 6.1.32 найдется
точка ξ ∈ (y; z) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) > f (z). Тогда, если обозначить C = f (z), то мы получим
и, по теореме Коши о промежуточном значении 4.3.22, на интервале (x; y) должна найтись такая
точка c ∈ (x; y), что
f (c) = C = f (z)
Теперь опять по теореме Ролля 6.1.32 должна существовать точка ξ ∈ (c; z) такая, что
f ′ (ξ) = 0,
и это снова противоречит условию (6.2.100). Мы получаем, что неравенство f (y) > f (x) тоже невоз-
можно.
Лемма 6.2.24. В условиях теоремы 6.2.22 пусть α, β ∈ (a, b) – произвольные точки, связанные
неравенством
α < β,
Тогда:
396 Глава 6. ПРОИЗВОДНАЯ
(a) если f (α) < f (β), то функция f возрастает на интервале (α; β):
f (α) < f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) < f (y)
(b) если f (α) > f (β), то функция f убывает на интервале (α; β):
f (α) > f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) > f (y)
a<x<α<β<y<b (6.2.101)
то снова по лемме 6.2.24 функция f должна быть строго монотонной на интервале (x; y). При
этом, как мы уже поняли, f возрастает на меньшем интервале (α; β), значит, она возрастает и на
большем интервале (x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (6.2.101),
мы получаем, что f возрастает на всем интервале (a; b).
Далее получается цепочка:
⇓ теорема 6.2.21(a)
′
f (x) > 0, x ∈ (a; b)
§ 2. Приложения производной 397
⇓ (6.2.100)
2. Пусть наоборот, f (α) > f (β). Тогда по лемме 6.2.24(b), функция f убывает на интервале
(α; β). Если теперь выбрать какие-нибудь точки x, y так, чтобы выполнялось (6.2.101), то снова по
лемме 6.2.24 функция f должна быть строго монотонной на интервале (x; y). При этом, как мы
уже поняли, f убывает на меньшем интервале (α; β), значит, она убывает и на большем интервале
(x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (6.2.101), мы получаем, что
f убывает на всем интервале (a; b).
Далее получается цепочка:
f убывает на интервале (a; b)
⇓ теорема 6.2.21(b)
f ′ (x) 6 0, x ∈ (a; b)
⇓ (6.2.100)
• Точка x0 называется
– точкой строгого локального максимума функции f , если в некоторой выколотой
окрестности (x0 − δ; x0 ) ∪ (x0 ; x0 + δ) точки x0 выполняется неравенство
Теорема 6.2.25 (необходимое условие локального экстремума). Если функция f имеет в точке
x0 локальный экстремум и дифференцируема в этой точке, то
f ′ (x0 ) = 0
Доказательство. Пусть при переходе через точку x0 производная меняет знак с − на +. Тогда
по теореме 6.2.22, на интервале (x0 − δ; x0 ) функция f строго убывает, а на интервале (x0 ; x0 + δ)
функция f строго возрастает, значит x0 – точка локального минимума.
Аналогично рассматривается случай, когда при переходе через точку x0 производная меняет
знак с − на +.
398 Глава 6. ПРОИЗВОДНАЯ
Выпуклость и перегиб. Пусть функция f определена на интервале (a; b) и пусть a < α < β < b.
Проведем хорду через точки (α; f (α)) и (β; f (β)) на графике функции f :
y
y = f (x)
x
a α β b
f (β) · (x − α) + f (α) · (β − x)
y=
β−α
f (β) · (x − α) + f (α) · (β − x)
f (x) < , a<α<x<β<b (6.2.102)
β−α
y
y = f (x)
x
a α β b
(ii) для любых двух точек α 6= β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство
• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вниз на интервале (a, b).
Доказательство. 1. (i)⇒(ii). Пусть выполнено (i) и пусть a < α < β < b. Зафиксируем λ ∈ (0, 1).
Тогда, положив
x = λ · α + (1 − λ) · β
мы получим:
β−x β − λ · α − (1 − λ) · β −λ · α + λ · β λ · (β − α)
= = = = λ,
β−α β−α β−α β−α
x−α λ · α + (1 − λ) · β − α (1 − λ) · β − (1 − λ) · α (1 − λ) · (β − α)
= = = = 1 − λ,
β−α β−α β−α β−α
поэтому
f (β) · (x − α) + f (α) · (β − x)
f (λ · α + (1 − λ) · β) = f (x) < (6.2.102) < =
β−α
x−α β−x
= ·f (β) + ·f (α) = λ · f (α) + (1 − λ) · f (β).
β−α β−α
| {z } | {z }
1−λ λ
§ 2. Приложения производной 399
Это доказывает неравенство (6.2.103) для случая α < β. Если β < α, то по уже доказанному мы
получим
f (λ · β + (1 − λ) · α) < λ · f (β) + (1 − λ) · f (α), λ ∈ (0, 1).
Обозначив t = 1 − λ, мы превратим это неравенство в такое:
y = f (x)
x
a α β
(ii) для любых двух точек α, β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство
• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вверх на интервале (a, b).
Теорема 6.2.29 (достаточное условие выпуклости). Пусть функция f дважды дифференцируема
на интервале (a; b). Тогда
– если f ′′ (x) < 0 при x ∈ (a; b), то функция f выпукла вверх на интервале (a; b);
400 Глава 6. ПРОИЗВОДНАЯ
– если f ′′ (x) > 0 при x ∈ (a; b), то функция f выпукла вниз на интервале (a; b).
Доказательство. 1. Пусть f ′′ (x) < 0 при x ∈ (a; b). Тогда для любых α, β, x таких, что
a < α < x < β < b,
мы получим:
f (β) · (x − α) + f (α) · (β − x) f (β) · (x − α) + f (α) · (β − x) − f (x) · (β − α)
− f (x) = =
β−α β−α
f (β) · (x − α) + f (α) · (β − x) − f (x) · (β − α) + f (x) · (x − x)
= =
β−α
[f (β) − f (x)] · (x − α) − [f (x) − f (α)] · (β − x)
= =
β−α
применяем теорему Лагранжа 6.1.33
для f на отрезках [x; β] и [α; x]:
= найдутся θ ∈ [x; β] и η ∈ [α; x]
′
=
такие что f (β) − f (x) = f (θ) · (β − x)
′
и f (x) − f (α) = f (η) · (x − α)
>
>
>
снова применяем теорему Лагранжа 6.1.33
! z }| { z }| { z }| {
но уже для f ′ (x) на отрезке [η; θ]: ′′ (θ − η) · (β − x) · (x − α)
= найдется ξ ∈ [η; θ] = f (ξ) · <0
такое что f ′ (θ) − f ′ (η) = f ′′ (ξ) · (θ − η)
| {z } β−α
| {z }
>
<
0
0
⇓
f (β) · (x − α) + f (α) · (β − x)
< f (x).
β−α
То есть функция f выпукла вверх на интервале (a; b).
2. Наоборот, если f ′′ (x) > 0 при x ∈ (a; b), то точно такими же выкладками мы получим
0 0 0
>
>
>
z }| { z }| { z }| {
f (β) · (x − α) + f (α) · (β − x) ′′ (θ − η) · (β − x) · (x − α)
− f (x) = ... = f (ξ) · >0
β−α | {z } β−α
| {z }
<
<
0
0
⇓
f (β) · (x − α) + f (α) · (β − x)
> f (x).
β−α
И это будет означать, что функция f выпукла вниз на интервале (a; b).
• Точка x0 называется точкой перегиба функции f , если при переходе через x0 выпуклость
вверх меняется на выпуклость вниз (или наоборот). Иными словами, имеется некоторая
окрестность (x0 − δ; x0 + δ) такая, что на интервале (x0 − δ; x0 ) функция f выпукла вверх,
а на интервале (x0 ; x0 + δ) она выпукла вниз (или наоборот, на (x0 − δ; x0 ) функция f
выпукла вниз, а на интервале (x0 ; x0 + δ) она выпукла вверх).
Теорема 6.2.30 (о точках перегиба). Пусть функция f дважды дифференцируема на интервале
(a; b), причем ее вторая производная f ′′ непрерывна на (a; b). Тогда если точка x0 ∈ (a; b) – точка
перегиба функции f , то f ′′ (x0 ) = 0.
Доказательство. Предположим, что f ′′ (x0 ) 6= 0, тогда либо f ′′ (x0 ) < 0, либо f ′′ (x0 ) > 0. Если
f ′′ (x0 ) < 0, то, по теореме о сохранении знака 4.3.20, f ′′ (x) < 0 для всех x из некоторой окрестности
(x0 − δ; x0 + δ) точки x0 . Поэтому по теореме 6.2.29 этой главы, f будет выпукла вверх всюду в
окрестности (x0 −δ; x0 +δ), и значит x0 не может быть точкой перегиба. Аналогично, если f ′′ (x0 ) > 0,
то по теореме о сохранении знака 4.3.20, f ′′ (x) > 0 для всех x из некоторой окрестности (x0 − δ; x0 +
δ) точки x0 . Поэтому по теореме 6.2.29 этой главы, f будет выпукла вверх всюду в окрестности
(x0 − δ; x0 + δ), и опять x0 не может быть точкой перегиба.
§ 2. Приложения производной 401
xn −→ x
n→∞
следует
f (xn ) −→ f (x).
n→∞
тоже верно для почти всех n ∈ N∗ . Это верно потому, что в цепочке
f (x + λn · h) = f (1 − λn ) · x + λn · (x + h) < (6.2.103) < (1 − λn ) · f (x) + λn · f (x + h) < f (x) + ε
↓ ↓
0 0
(6.2.109)
f (x) + ε
⇓
2f (x) < f (x − λn · h) + f (x) + ε
⇓
f (x) < f (x − λn · h) + ε
⇓
f (x) − ε < f (x − λn · h)
402 Глава 6. ПРОИЗВОДНАЯ
⇓ (6.2.108)
f (x) − ε < f (x − λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому
f (x − λn · h) −→ f (x).
n→∞
∗
И, во-вторых, для почти всех n ∈ N выполняются неравенства
>
(6.2.108)
f (x) + ε
⇓
2f (x) < f (x) + ε + f (x + λn · h)
⇓
f (x) < ε + f (x + λn · h)
⇓
f (x) − ε < f (x + λn · h)
⇓ (6.2.109)
f (x) − ε < f (x + λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому
f (x + λn · h) −→ f (x).
n→∞
Мы доказали (6.2.107).
⋄ 6.2.32. Выпуклая функция не обязана быть и [0, +∞), а потом нужно заметить, что хорда,
дифференцируемой. Например, функция соединяющая точки с аргументами, лежащими
справа и слева от нуля, α < 0 < β, будет лежать
f (x) = e|x|
выше двух хорд, соединяющих аргумент α с ар-
не дифференцируема в точке 0, но выпукла вниз. гументом 0, и 0 с β. И поэтому эта хорда будет
Это доказывается сначала для участков (−∞, 0] выше графика f на участке (α, β).
Тогда прямая
x = x0
называется вертикальной асимптотой функции f .
• Пусть функция f обладает следующим свойством:
Тогда прямая
y =k·x+b
называется наклонной асимптотой функции f (при x → +∞ или x → −∞).
§ 2. Приложения производной 403
и !
b = lim (f (x) − k · x) или b = lim (f (x) − k · x) (6.2.111)
x→+∞ x→−∞
Доказательство. Если
lim (f (x) − (k · x + b)) = 0
x→+∞
то
f (x) = (k · x + b) + α(x) где α(x) −→ 0
x→+∞
поэтому
f (x) b α(x)
lim = lim k+ + =k
x→+∞ x x→+∞ x x
и, кроме того,
lim (f (x) − k · x) = lim (b + α(x)) = b
x→+∞ x→+∞
Значит, прямая
b+ = lim [f (x) − k+ · x] =
+ √
− + √
− x
x→+∞ − 3 0 3
hp i
3
= lim x3 − 3x − 1 · x =
x→+∞
q q q
3 3
x − 3x − x ·
3
(x3 − 3x)2 + x ·
3 3
x − 3x + x2 6. Рисуем график:
= lim
x→+∞
q
3
q
3 3
=
(x3 − 3x)2 + x · x − 3x + x2
p y
3
(x3 − 3x)3 − x3
= lim p √ = y=
x
x→+∞ 3
(x3 − 3x)2 + x · 3 x3 − 3x + x2
√
−3x 3
2 √
= lim p √ = y= 3
x3 − 3x
x→+∞ 3 (x3 − 3x)2 + x · 3 x3 − 3x + x2 √ √ x
− 3 1 3
−1
−3
= lim q √ = √
x→+∞ 3 3 −32
(1 − x2 ) · (x3 − 3x) + 3 x3 − 3x + x
−3
= lim q q =0
x→+∞ 3 2 3
x · 3 (1 − x2 ) + 3
1− x2 +1
Значит, прямая y = x является асимптотой при ⊲⊲ 6.2.38. Постройте графики следующих функ-
x → +∞. Аналогично получаем, что k− = 1 и ций:
b− = 0, и поэтому та же прямая y = x является √
1. y = 3 x2 − x3 .
асимптотой при x → −∞.
x2
4. Находим производную: 2. y = x−1 .
q
x6
p ′ 3 ′ 3. y = 5 x−a .
′ 3 3
(x − 3x)
f (x) = x − 3x = √ 2 = x3
3 3 x3 − 3x 4. y = 4(x−2) 2.
p
3x2 − 3 x2 − 1 5. y = x 3 (x + 1)2 .
= √ 2 = 2 q
3 3 x3 − 3x (x3 − 3x) 3 3 −2x2
6. y = x x−3 .
406 Глава 6. ПРОИЗВОДНАЯ
2 5
7. y = x x−4 · e− 3x . 4. Производная:
8. y = x3 + 3x2 − 9x − 3. 1
√ f ′ (x) = (x2 · ln |x|)′ = 2x · ln |x| + x2 · =
9. y = x + x2 − 1. x
= x · (2 ln |x| + 1)
Четные и нечетные функции. Построение При x > 0 получаем f ′ (x) = 0 ⇔ 2 ln x + 1 =
графика упрощается, если функция обладает 1
0 ⇔ ln x = − 21 ⇔ x = e− 2 . Интервалы знакопо-
какими-то симметриями (то есть в каком-нибудь
стоянства производной:
смысле инвариантна относительно некоторых
преобразований прямой). Мы расмотрим три из
них: четность, нечетность и периодичность. − + x
Напомним, что четные и нечетные функции 0 − 21
e
мы определили на с.240 как удовлетворяющие
тождествам
5. Вторая производная:
f (−x) = f (x) (четность), ′ 2
f ′′ (x) = x·(2 ln |x|+1) = (2 ln |x|+1)+x· =
f (−x) = −f (x) (нечетность) x
= 2 ln |x| + 2 = 2(ln |x| + 1)
Там же отмечалось, что график четной функции
должен быть симметричен относительно оси ор- При x > 0 получаем f ′′ (x) = 0 ⇔ ln x + 1 = 0 ⇔
−1
динат, а график нечетной – центрально симмет- ln x = −1 ⇔ x = e . Интервалы знакопостоян-
ричен относительно начала координат. ства второй производной:
Отсюда следует, что если нам нужно постро-
ить график четной функции, то его достаточ- − + x
но построить на правой полуплоскости, а затем, −1
0 e
чтобы получить окончательный результат, отоб-
разить полученную картинку налево симметрич-
но относительно оси ординат. Точно так же гра- 6. График функции для x > 0:
фик нечетной функции достаточно строить на
правой полуплоскости, а потом отобразить цен- y
трально симметрично относительно начала коор-
динат. Здесь мы рассмотрим примеры.
⋄ 6.2.39. Постройте график функции:
f (x) = x2 · ln |x| 0 1 √1 x
e e
f (x) − e12
k+ = lim = lim x · ln |x| =
x→+∞ x x→+∞
1
= lim x · ln x = ∞ − 2e
x→+∞
− + − + − + x x
π π 5π 3π 0 π 2π
0 4 2 π 4 2 2π
−1
5. Вторая производная:
f ′′ (x) = (3 sin x cos x(sin x − cos x))′ = Сдвинув эту картинку несколько раз влево и
вправо на период T = 2π, мы получим полный
= 3 cos2 x(sin x − cos x) − 3 sin2 x(sin x − cos x)+ график нашей функции:
+ 3 sin x cos x(cos x + sin x) =
y
= 3(cos2 x − sin2 x)(sin x − cos x)+ y = sin3 x + cos3 x
+ 3 sin x cos x(cos x + sin x) =
= −3(cos x + sin x)(cos x − sin x)2 + −π π x
−2π 0 2π
+ 3 sin x cos x(cos x + sin x) =
= 3(cos x + sin x)[−(cos x − sin x)2 + sin x cos x] =
= 3(cos x + sin x)[− cos2 x − sin2 x + 3 sin x cos x] =
= 3(cos x + sin x)[3 sin x cos x − 1]
⊲⊲ 6.2.42. Постройте графики следующих функ-
При x ∈ [0; 2π] получаем ций:
x2 +2
1. y = 2x 2 +1 .
p p
f ′′ (x) = 0 ⇔ 2. y = 3 (x + 1)2 − 3 (x − 1)2 .
sin x+cos x
3. y = ep . p
⇔ 3(cos x + sin x)[3 sin x cos x − 1] = 0 ⇔
" # " # 4. y = (x + 1)2 + 3 (x − 1)2 .
3
⇔ 3 ⇔ 2 ⇔ 7. y = √xx2 +2 .
sin 2x = 1 sin 2x =
2 3 8. y = x ln |x|.
x∈
3π 7π
; 9. y = ln(sin x + cos x).
4 4 2
2
10. y = √x4x+1 2 −3
.
⇔ 2x = arcsin + 2πn ⇔
3
11. y = 2x − arctg x.
1
2
2x = π − arcsin + 2πn
12. y = sin x−cos x.
3
3π 7π
x∈
4
;
4 Экстремум функции одной переменной.
1 2
⇔ x = arcsin + πn ⇔
⋄ 6.2.43. Найти наибольшее и наименьшее зна-
2 3
π 1 2
чение функции
x= − arcsin + πn
2 2 3
оставляем только
f (x) = x3 − 6x2 + 9x + 1
⇔ те значения x, которые ⇔
лежат в отрезке [0; 2π] на следующих множествах:
n12 π 1 2 3π
⇔x∈ arcsin ; − arcsin ; ; 1) на отрезке [0, 2],
2 3 2 2 3 4
1 2 3π 1 2 7π o 2) на полуинтервале [−2, −1).
π + arcsin ; − arcsin ;
2 3 2 2 3 4 Решение. Найдем производную:
Интервалы знакопостоянства второй произ- f ′ (x) = 3x2 − 12x + 9 = 3(x − 1)(x − 3).
водной:
Она обращается в нуль в точках x = 1 и x = 3,
причем
− + − + − + − x – f ′ (x) > 0 при x ∈ (−∞, 1) ∪ (3, ∞), поэтому
0 3π 7π
2π функция f возрастает на интервалах (−∞, 1)
4 4
и (3, ∞),
– f ′ (x) < 0 при x ∈ (1, 3), поэтому функция f
6. График функции на отрезке x ∈ [0; 2π]: убывает на интервале (1, 3).
§ 2. Приложения производной 409
Теперь рассматриваем два заданных множе- ⋄ 6.2.45. Среди всех прямоугольников с дан-
ства. ным периметром P найти прямоугольник с мак-
1. На отрезке [0, 2] функция f имеет толь- симальной площадью.
ко одну критическую точку, x = 1, причем на Пусть x – одна из сторон прямоугольника. То-
интервале (0, 1) она возрастает, а на интервале гда другая сторона будет y = P2 − x, а площадь
(1, 2) – убывает. Одновременно
Px
f (0) = 1, f (1) = 5, f (2) = 3. S =x·y = − x2 .
2
Поэтому Дифференцируя по x мы получим:
max f (x) = f (1) = 5
x∈[0,2]
P P
и S ′ (x) = − 2x = 0 ⇐⇒ x= .
2 4
min f (x) = f (0) = 1.
x∈[0,2]
При этом
2. На полуинтервале [−2, −1) функция f не
– S ′ (x) > 0 при x ∈ 0, P4 , то есть на интервале
имеет критических точек и возрастает. Отсюда
0, P4 функция S возрастает,
следует, что
– S ′ (x) < 0 при x ∈ P4 , P2 , то есть на интерва-
min f (x) = f (−2) = −49,
x∈[−2,−1) ле P4 , P2 функция S убывает.
а Поэтому
max f (x)
x∈[−2,−1) P P2
не существует. max S(x) = S = .
x∈(0, P2 ) 4 16
⋄ 6.2.44. Найти максимальный объем цилиндра,
вписанного в данный конус. ⊲ 6.2.46. Найдите отношение катетов прямо-
Решение. Обозначим буквами R и H радиус и угольного треугольника, у которого площадь
высоту конуса, а буквами x и h радиус и высоту максимальна среди всех прямоугольных тре-
вписанного цилиндра. Тогда угольников, у которых сумма длин гипотенузы
и одного из катетов равна фиксированной вели-
H −h H чине c.
= ,
x R
поэтому ⊲ 6.2.47. Сечение тоннеля имеет форму пря-
xH моугольника, завершенного полукругом. Опре-
H −h= делить радиус полукруга, при котором площадь
R
и сечения будет наибольшей, если периметр сече-
xH H ния равен p.
h=H− = (R − x),
R R
а объем цилиндра получается ⊲ 6.2.48. Лист картона имеет форму прямо-
угольника со сторонами a и b. Вырезая по углам
πH этого прямоугольника квадраты и сгибая высту-
V (x) = · (Rx2 − x3 ).
R пающие части крестообразной фигуры, получим
Дифференцируея по x, мы получаем: открытую сверху коробку, высота которой рав-
ная стороне квадрата. Какой должна быть сто-
πH рона квадрата, чтобы объем коробки был наи-
V ′ (x) = · (2Rx − 3x2 ) = 0 ⇐⇒
R большим?
2R
⇐⇒ x ∈ 0, . ⊲ 6.2.49. Найти наибольший объем цилиндра,
3
периметр осевого сечения которого равен a.
Здесь видно, что x = 2R 3 – точка максимума для
V: ⊲ 6.2.50. Среди всех равнобедренных треуголь-
ников, вписанных в данный круг, найти тре-
2R угольник с наибольшим периметром.
max V (x) = V =
x∈[0,R] 3
2 3 ! ⊲ 6.2.51. Определить размеры закрытой короб-
πH 2R 2R ки объема v с квадратным основанием, на изго-
= · R − =
R 3 3 товление которой расходуется наименьшее коли-
3 чество материала.
πH 4R 8R3
= · − =
R 9 27 ⊲ 6.2.52. Среди всех прямоугольников данной
πH 12R3 8R3 4 площади S найти прямоугольник: 1) с наимень-
= · − = · πHR2 шим периметром, 2) с наименьшей диагональю.
R 27 27 27
410 Глава 6. ПРОИЗВОДНАЯ
⊲ 6.2.53. Найти наибольшую площадь прямо- ⊲ 6.2.57. Консервная банка имеет цилиндриче-
угольника, вписанного в круг радиуса R. скую форму. Найти наиболее выгодное отноше-
⊲ 6.2.54. Найти длину боковой стороны трапе- ние ее размеров (то есть отношение диаметра к
ции, имеющей наименьший периметр среди всех высоте, при котором ее объем станосится наи-
равнобедренных трапеций с заданной площадью большим при заданной полной площади поверх-
S и углом α между боковой стороной и нижним ности).
основанием. ⊲ 6.2.58. Найти наибольшую полную поверх-
⊲ 6.2.55. Вычислить наибольшую площадь тра- ность цилиндра, вписанного в шар радиуса R.
пеции, вписанной в полукруг радиуса R, у кото-
рой нижним основанием служит диаметр полу- ⊲ 6.2.59. Из кругового листа жести вырезают
круга. сектор и свертывают его в коническую воронку.
Каким должен быть угол сектора, чтобы ворон-
⊲ 6.2.56. Из трех досок одинаковой ширины ка имела наибольший объем?
нужно сколотить желоб. При какой угле накло-
на боковых стенок площадб поперечного сечения ⊲ 6.2.60. Найти наименьшую боковую поверх-
желоба будет наибольшей? ность конуса, имеющего объем V .
Глава 7
АСИМПТОТИЧЕСКИЕ МЕТОДЫ
Поведение функции при аргументе, стремящемся к некоторой величине, является предметом изуче-
ния специального раздела математического анализа, называемого асимптотическими методами.
По идеологии этой науки, свойство функции f иметь (или не иметь) предел при x → a – только
самое первое, поверхностное наблюдение, за которым скрывается гораздо более сложная картина,
которую если подходящим образом формализовать, то получаешь удивительно мощный инструмент
для решения самых разных задач, в том числе для вычисления самих пределов.
Чтобы было понятно, о чем идет речь, вспом- g(0) = earctg 0 − 1 − arctg(e0 − 1) = 0.
ним снова, как мы вычисляли пределы. После
Это значит, что можно применить правило Ло-
всех усилий, что мы потратили на изучение это-
питаля. Первые производные будут такие:
го вопроса в (c)(d) главы 5, а затем в § 2 главы 6,
для читателя может быть неожиданностью, что cos x cos ln(1 + x)
встречаются все же пределы, нахождение кото- f ′ (x) = − ,
1 + sin x 1+x
рых известными нам сейчас методами оказыва-
ется затруднительным или даже невозможным. earctg x ex
g ′ (x) = 2 − .
x +1 (1 − ex )2 + 1
⋄ 7.0.1. В качестве упражнения можно попро-
бовать найти следующий, простой на первый При подстановке x = 0 мы опять получаем нули:
взгляд, предел: cos 0 cos ln(1 + 0)
f ′ (0) = − = 0,
ln(1 + sin x) − sin ln(1 + x) 1 + sin 0 1+0
lim (7.0.1)
x→0 earctg x − 1 − arctg(ex − 1) earctg 0 e0
g ′ (0) = 2 − = 0.
Здесь, если пользоваться правилом Лопиталя, 0 +1 (1 − e0 )2 + 1
то его придется применять 4 раза, причем воз- И опять нужно дифференцировать. Вторые
никающие при дифференцировании выражения производные будут выглядеть так:
столь громоздки, что у обыкновенного человека
терпение истощается уже после первых двух ша- sin x sin ln(1 + x)
f ′′ (x) = − + −
гов. 1 + sin x (1 + x)2
Вот как выглядят эти вычисления, если по- cos2 x cos ln(1 + x)
следовательно находить производную от числи- − + ,
(1 + sin x)2 (1 + x)2
теля
411
412 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
1
Здесь применение правила Лопиталя превраща- sin(2− x2 ) 0 f ′ (x)
ется в бесконечный процесс (со все более слож- lim − sin12 x
= = lim ′ =
x→0 2 0 x→0 g (x)
ными вычислениями на каждом следующем ша-
0 f (n) (x) 0
ге), потому что числитель = = ... = lim (n) = =?
0 x→0 g (x) 0
1
f (x) = sin(2− x2 ) Эти примеры означают, что алгоритмы, ис-
пользуемые для вычисления пределов (в част-
и знаменатель
ности, в современных компьютерах), не могут
g(x) = 2 − sin12 x сводиться к применению одного только прави-
ла Лопиталя и должны использовать какие-то
стремятся к нулю при x → 0 вместе со всеми другие методы. И если ставить целью объясне-
своими производными. Сколько раз ни применяй ние интересующимся (в том числе, разработчи-
правило Лопиталя, ты получишь здесь неопреде- кам этих алгоритмов) сути этих методов, то огра-
ленность: ничиться тем, что уже сказано на эту тему, ко-
нечно, нельзя.
и
θ(x) −→ 1.
x→a
В частном случае, когда f2 (x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание о θ: тогда запись (7.1.3) просто эквивалентна условию
f1 (x)
−→ 1 (7.1.4)
f2 (x) x→a
a = +∞, то выколотой окрестностью a считается всякое множество (E, +∞), где E > 0. Если же a = −∞, то
выколотой окрестностью a считается всякое множество (−∞, −E), где E > 0.
414 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
и
f1 (x) 6= 0, x ∈ U̇ε (a) ⇐⇒ f2 (x) 6= 0, x ∈ U̇δ (a).
◦
2 . Рефлексивность: всегда
f1 (x) ∼ f1 (x)
x→a
◦
3 . Симметричность:
f1 (x) ∼ f2 (x) =⇒ f2 (x) ∼ f1 (x)
x→a x→a
4◦ . Транзитивность:
5◦ . Мультипликативность:
f1 (x) f2 (x)
f1 (x) ∼ f2 (x) & g1 (x) ∼ g2 (x) =⇒ f1 (x)·g1 (x) ∼ f2 (x)·g2 (x) & ∼
x→a x→a x→a g1 (x) x→a g2 (x)
f1 (x) f2 (x)
lim = lim lim f1 (x) · g1 (x) = lim f2 (x) · g2 (x)
x→a g1 (x) x→a g2 (x) x→a x→a
и
g1 (x) = τ (x) · g2 (x), τ (x) −→ 1
x→a
Запомним их, и поглядим, что можно сказать о пределах, о которых говорит теорема:
f1 (x) θ(x) · f2 (x) θ(x) f2 (x) θ(x) f2 (x) f2 (x)
lim = lim = lim · = lim · lim = lim
x→a g1 (x) x→a τ (x) · g2 (x) x→a τ (x) g2 (x) x→a τ (x) x→a g2 (x) x→a g2 (x)
| {z }
k
1
x x2
2 1 1
= lim = = lim 2 =
x→0 x · ln 2 2 ln 2 x→0 x2 2
Доказательство. Условие f1 (x) ∼ f2 (x) означает, что существуют функция θ, такая что
x→a
Положим
τ (t) = θ(ξ(t)).
Тогда, во-первых,
f1 (ξ(t)) = θ(ξ(t)) · f2 (ξ(t)) = τ (t) · f2 (ξ(t)),
И, во-вторых,
применяем теорему 4.4.32
о замене переменной
lim τ (t) = lim θ(ξ(t)) = под знаком предела: = lim θ(x) = 1.
t→c t→c x→a
x = ξ(t) −→ a
t→c
ξ(t) 6= a при t 6= c
или так
f (x) = o g(x)
x→a
и
α(x) −→ 0.
x→a
В частном случае, когда g(x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание об α: тогда запись (7.1.15) просто эквивалентна условию
f (x)
−→ 0
g(x) x→a
x2 ≪ x x ≪ x2
x→0 x→∞
x2 = o (x) x= o (x2 )
x→0 x→∞
x2 x 1
Действительно, x = x −→ 0. Действительно, x2 = −→
x x→∞ 0.
x→0
§ 1. Асимптотические отношения и формулы 417
2◦ Транзитивность:
3◦ Связь с эквивалентностью:
xλ 1 C ≪ loga x ≪ xλ ≪ ax
(C∈R) x→+∞ (a>1) x→+∞ (λ>0) x→+∞ (a>1)
µ
= µ−λ −→ 0
x x x→∞
(7.1.16)
и это означает, что x λ µ
≪ x . Наоборот, или, в других обозначениях,
x→∞
C= o (loga x) , если a > 1,
xµ x→+∞
= xµ−λ −→ 0
xλ x→0 loga x = o xλ , если a > 1, λ > 0
x→+∞
причем при x → a функция A0 (x) бесконечно велика по сравнению с любой другой функцией из
этого списка:
A1 (x) ≪ A0 (x), A2 (x) ≪ A0 (x), ..., An (x) ≪ A0 (x) (7.1.17)
x→a x→a x→a
A1 (x) = α1 (x) · A0 (x), A2 (x) = α2 (x) · A0 (x), ... An (x) = αn (x) · A0 (x),
где
α1 (x) −→ 0, α2 (x) −→ 0, ... αn (x) −→ 0
x→a x→a x→a
Поэтому
A0 (x) + A1 (x) + ... + An (x) = A0 (x) + α1 (x) · A0 (x) + ... + αn (x) · A0 (x) =
= 1 + α1 (x) + ... + αn (x) ·A0 (x) = θ(x) · A0 (x),
| {z }
обозначим это θ(x)
где
θ(x) = 1 + α1 (x) + ... + αn (x) −→ 1 + 0 + ... + 0 = 1.
x→a
причем известно, что A0 (x) является главным слагаемым в сумме A0 (x)+ A1 (x)+ A2 (x)+ ...+ An (x),
а B0 (x) является главным слагаемым в сумме B0 (x) + B1 (x) + B2 (x) + ... + Bn (x):
Тогда
A0 (x) + A1 (x) + A2 (x) + ... + An (x) ∼ A0 (x)
x→a
Рассмотрим примеры.
⋄ 7.1.18. В следующем примере снова использу- ⋄ 7.1.21. Здесь используется теорема 7.1.13 (о
ется шкала бесконечностей (теорема 7.1.14): сравнении показательных функций): поскольку
√ x → +∞, главными слагаемыми будут степени с
2 x + 2 log5 x + 5 наибольшим основанием:
lim √ =
x→+∞ cos x + x − 1
.
/ .
/ 2x−1 − 3x+1 1 x x
√ √ 2 ·2 −3·3
2 x + 2 log5 x + 5 2 x lim = lim =
x→+∞ 2x+1 + 3x−1 x→+∞ 2 · 2x + 1 · 3x
= lim .
/ √ .
/ = lim √ = 2 .
/ 3
x→+∞
cos x + x − 1 x→+∞ x 1 x
2 2· − 3 · 3x −3 · 3x
= lim .
/ = lim 1 x = −9
⋄ 7.1.19. Здесь используется теорема 7.1.12 (о
x→+∞
2 · 2x + 1 · 3x x→+∞ 3 · 33
сравнении степенных функций): поскольку x →
∞, главными слагаемыми будут максимальные ⋄ 7.1.22. Здесь дробь та же, что и в предыду-
степени у x: щем примере, но, поскольку x → −∞, главными
слагаемыми, по той же теореме 7.1.13, будут на-
√
5x + 3 x − 2x5 оборот, степени с наименьшим основанием:
lim 4
√ =
x→∞ x − 3x + 8 x
.
/ .
/ 2x−1 − 3x+1 1 x x
√ 2 ·2 −3·3
5x + 3 x − 2x5 −2x 5 lim
x→−∞ 2x+1 + 3x−1
= lim
x→−∞ 2 · 2x + 1 · 3x
=
= lim . / .
/
√ = lim = .
/ 3
x→∞ x→∞ −3x4
x − 3x4 + 8 x 1 x x
2 ·2 −3·3
1 x
.
/ 2 ·2 1
−2x = lim = lim x
=
x→−∞ x→−∞ 2 · 2 4
= lim
x→∞ −3
=∞ 2 · 2x + 13 · 3x
420 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
√
3
√
x+ x
⋄ 7.1.23. В следующем примере мы сначала вы- 3. limx→+0 √5
sin x+ x2
деляем главное слагаемое, а затем применяем √3 x+ x
√
теорему 7.1.4 об эквивалентной замене: 4. limx→+∞ √5
sin x+ x2
√
.
/
2 10 5. limx→0 x+
ex −1
x
2
5x + 3x 10 5x + 3x √
lim = lim /
. = 6. limx→+∞ x+ x
x→0 2x5 + 7 sin x2 x→0 ex −1
2x5 + 7 sin x2 x x
7. limx→0 2x2 +3
+x3
5x2 2 2 5x2 5 x
+3x
= lim = sin x ∼ x = lim = 8. limx→+∞ x2 2 +x
x→0 7 sin x2 x→0 x→0 7x2 7 3
2x +3x
⊲⊲ 7.1.24. 9. limx→−∞ x2 +x3
x 5 x+sin x
2 +x 10. limx→+∞ x+cos
1. limx→0 x2 +5x x
x
+x5
2. limx→+∞ x2 2 +5x
f1 (x) ∼ f2 (x)
x→a
Тогда
(i) модули этих функций тоже эквивалентны:
f2 (x) −→ +∞ (или + 0)
x→a
Доказательство.
Из этой теоремы следует, что при вычислении пределов с модулями, степенями или логариф-
мами также можно выделять главные слагаемые, но нужно только следить, чтобы аргументы у
логарифмов стремились к +∞ или к +0. Например,
α
(A0 (x) + A1 (x) + A2 (x) + ... + An (x))
lim =
x→a ln (B0 (x) + B1 (x) + B2 (x) + ... + Bn (x))
.
/ /
. .
/ α
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A (x)α
= lim .
/ .
/ / = lim 0
.
x→a x→a ln B0 (x)
ln B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)
.
/
⋄ 7.1.26. 2 ln(x2
+ x)
ln(x + x)
√ lim = lim .
/ =
| 3 x + 3x − 2x2 | x→+0 ln(x5 + x3 ) x→+0
ln(x5 + x3 )
lim √ =
x→+∞ x + x2 + x4
√./ .
/ ln x ln x 1
| 3 x + 3x − 2x2 | = lim = lim =
x→+0 ln x3 x→+0 3 ln x 3
= lim r. / .
/ =
x→+∞
2 4 ⋄ 7.1.30.
x +x +x
3 ln x + x − 2
| − 2x2 | 2x2 lim =
= lim √ = lim =2 x→+∞ ln |5 + x3 − e2x |
x→+∞ x4 x→+∞ x2 .
/ .
/
3 ln x + x − 2
⋄ 7.1.27. = lim .
/ .
/ =
√ x→+∞
ln 5 + x3 − e2x
| 3 x + 3x − 2x2 |
lim √ = x x 1
x→0 x + x2 + x4 = lim = lim =
√ .
/ .
/ x→+∞ 2x
ln |−e | x→+∞ 2x 2
| 3 x + 3x − 2x2 |
= lim r .
/ .
/ = ⊲⊲ 7.1.31. Вычислите пределы, обращая внима-
x→0
x + x2 + x4 ние на значение, к которому стремится аргумент
√ x: √
| 3 x| ln|x−2 ln x−3 x|
1. limx→+∞ √
1
= lim √ = lim x− 6 = ∞ 3 √
ln x+2x x−x2
x→0 x x→0 √
ln|x−2 ln x−3 x|
⋄ 7.1.28. 2. limx→0 √3 √
ln x+2x x−x2
√ √
.
/ ln(1+ x+ 3 x)
ln(x2
+ x) 3. limx→+∞ ln 1+ √ √
2
ln(x + x) ( 3 x+ 4 x)
lim = lim .
/ = √ √
ln(1+ x+ x) 3
x→+∞ ln(x5 + x3 ) x→+∞ 4. limx→0 ln 1+ √
ln(x5 + x3 ) ( 3 x+ 4 x)
√
√ √
ln( x+ x) 3
ln x2 2 ln x 2 5. limx→0 ln √ √
= lim = lim = ( 3
)
x+ 4 x
x→+∞ ln x5 x→+∞ 5 ln x 5 x
6. limx→+∞ ln(1+3x
ln(1+2 )
)
⋄ 7.1.29. ln(1+3x )
7. limx→0 ln(1+2x )
422 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
⋄ 7.1.35. Следующие записи являются асимпто- ⋄ 7.1.36. Следующие записи, наоборот, не явля-
тическими выражениями: ются асимптотическими выражениями:
o (x), o (x)
sin x, o (sin x), sin o (x) sin x→0 o (1)→0
x→0 x→0 x→0
К асимптотическим выражениям нужно относиться как к выражениям (в главе про логику они
назывались термами), описывающим семейства функций: когда вместо каждого входящего символа
o мы подставляем выражение, описывающее какую-то функцию (со свойством этого символа
x→a
x + o (x) = x + o (2x)
x→0 x→0 f (x) = o (x) + o (x2 ) ⇔
x→0 x→0
Действительно,
⇔ ∃α, β f (x) = α(x) ·x + β(x) ·x2 =
|{z } |{z}
f (x) = x+ o (x) ⇔ f (x)−x = o (x) ⇔ ↓ ↓
x→0 x→0 0 0
f (x) − x
⇔ −→ 0 ⇔ = α(x) + β(x) ·x ·x ⇔
x x→0 | {z} |{z} ↓
0
f (x) − x ↓ ↓
⇔ −→ 0 ⇔ 0 0
2x x→0 | {z }
⇔ f (x) − x = o (2x) ⇔ ⇓
x→0 γ(x) = α(x) + β(x) · x −→ 0
x→0
⇔ f (x) = x + o (2x). ⇔ ∃γ f (x) = γ(x) ·x ⇔
x→0
|{z}
⋄ 7.1.38. Покажем, что следующее равенство, ↓
0
наоборот, неверно: |{z}
⇓
x + o (x) = o (1) α(x) = γ(x) −→ 0
x→0
x→0 x→0
β(x) = 0 −→ 0
x→0
Для этого достаточно найти какую-нибудь функ-
⇔ f (x) = o (x)
цию f , которая принадлежала бы второму клас- x→0
су
f (x) = o (1) Предпоследнюю равносильность надо понимать
x→0
так, что из существования α и β с нужными свой-
но не первому:
ствами следует существование γ, в качестве ко-
f (x) 6= x + o (x). торой можно взять γ(x) = α(x)+β(x)·x, и наобо-
x→0
рот, из существования γ с нужными свойствами
Такой функцией будет, например, следует существование α и β, в качестве которых
√ можно взять α(x) = γ(x), β(x) = 0.
f (x) = 3 x.
Свойства символа o:
1o C · o f (x) = o C · f (x) = o f (x) , C 6= 0;
x→a x→a x→a
2o o f (x) ± o f (x) = o f (x) ;
x→a x→a x→a
§ 1. Асимптотические отношения и формулы 425
3o o f (x) · o g(x) = o f (x) · g(x) = f (x) · o g(x) ;
x→a x→a x→a x→a
4o o o f (x) = o f (x) .
x→a x→a x→a
5o o (f (x)) = f (x) · o (1);
x→a x→a
o
6 o (1) −→ 0;
x→a x→a
o
7 f (x) ∼ g(x) ⇒ o f (x) = o g(x) ;
x→a x→a x→a
µ
8o f (x) + o f (x) = f (x) + o f (x)µ , µ 6= 0.
µ
x→a x→a
u(x) = C· o (f (x)) ⇔ u(x) = C·α(x) ·f (x) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = o (C·f (x)),
x→a | {z } |{z } x→a
↓ ↓
0 0
и, во-вторых,
C6=0
u(x) = o (C·f (x)) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = C · α(x) ·f (x) ⇔ u(x) = o (f (x)).
x→a | {z} | {z } x→a
↓ ↓
0 0
2. Докажем 2o :
u(x) = o (f (x) ± o f (x) ⇔ u(x) = α(x) ·f (x) ± β(x) ·f (x) = α(x) ± β(x) ·f (x) ⇔
x→a x→a | {z } |{z} | {z }
↓ ↓
↓
0 0
0
| {z }
⇓
γ(x) = α(x) ± β(x) −→ 0
x→0
⇔ u(x) = γ(x) ·f (x) ⇔ u(x) = o f (x)
|{z} x→a
↓
0
|{z}
⇓
α(x) = γ(x) −→ 0
x→0
β(x) = 0 −→ 0
x→0
3. Докажем 3o : во-первых,
u(x) = o f (x) · o g(x) ⇔ u(x) = α(x) ·f (x) · β(x) ·g(x) = α(x) · β(x) ·f (x) · g(x) ⇔
x→a x→a | {z} |{z} | {z }
↓ ↓
↓
0 0
0
| {z }
⇓
γ(x) = α(x) · β(x) −→ 0
x→0
⇔ u(x) = γ(x) ·f (x) · g(x) ⇔ u(x) = o f (x) · g(x) ,
|{z} x→a
↓
0
|{z}
⇓
2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 13 −→ 0
x→0
и, во-вторых,
u(x) = o f (x) · g(x) ⇔ u(x) = α(x) ·f (x) · g(x) = f (x) · α(x) ·g(x) ⇔
x→a | {z} |{z }
↓ ↓
0 0
426 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
⇔ u(x) = f (x) · o g(x) .
x→a
o
4. Докажем 4 :
u(x) = o o f (x) ⇔ u(x) = α(x) · o f (x) ⇔
x→a x→a |{z } x→a
↓
0
⇔ u(x) = α(x) · β(x) ·f (x) = α(x) · β(x) ·f (x) ⇔
| {z} |{z} | {z }
↓ ↓
↓
0 0
0
| {z }
⇓
γ(x) = α(x) · β(x) −→ 0
x→0
⇔ u(x) = γ(x) ·f (x) ⇒ u(x) = o f (x)
|{z} x→a
↓
0
|{z}
⇓
2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 31 −→ 0
x→0
Тогда
u(x) = o f (x) ⇔ u(x) = α(x) ·f (x) = α(x) · θ(x) ·g(x) = α · θ(x) ·g(x) ⇔ u(x) = o g(x)
x→a |{z } | {z} |{z} | {z } x→a
↓ ↓ ↓ ↓
0 0 1 0
8.
µ
u(x) = f (x) + o f (x) ⇔
x→a
µ µ µ
⇔ u(x) = f (x) + α(x) ·f (x) = 1 + α(x) ·f (x) = 1 + α(x) ·f (x)µ ⇔
|{z } | {z } | {z }
↓
↓ ↓
0
1 1
Теорема 7.1.34
⇔ u(x) ∼ f (x)µ ⇔ u(x) = f (x)µ + o f (x)µ
x→a x→a
λk 6 µ,
xµ ≪ xλ , λ < µ, (7.1.29)
x→0
Если же λ < µ, то
o (xλ ) + C · xµ = o (xλ ). (7.1.32)
x→0 x→0
o (xµ )
x→0
−→ 0,
xλ x→0
428 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
o (xµ ) xµ · o (1)
x→0 x→0 µ−λ
= = |x {z } · o (1) −→ 0 .
xλ xλ x→0
| {z
x→0
}
ограничено
o
в окрестности свойство 6 на с. 425
нуля при
µ−λ> 0
u(x) = o (xλ ) + C · xµ ⇔
x→0
⇔ xµ−λ} ·xλ = α(x) + C · xµ−λ ·xλ
u(x) = α(x) ·xλ + C · xµ = α(x) ·xλ + |C · {z ⇔
| {z} |{z } | {z }
↓ ↓ ↓
0 ↓
0 0
(µ − λ > 0) 0
⋄ 7.1.43. Например, ↑
здесь применяется
следствие 7.1.42
2x + 4x2 − 2x3 + 5x4 + o (x2 ) =
x→0
.
/ .
/
= 2x + 4x − 2x + 5x4 + o (x2 ) =
2 3 Во-третьих, из (7.1.29) и (7.1.30) мы получаем
x→0
Следствие 7.1.46. Главный моном простого
= 2x + 4x + o (x2 )
2
x→0
асимптотического многочлена ak · xαk (если
Во-вторых, из (7.1.31) следует он существует) является главным слагаемым
Следствие 7.1.44. При сложении асимптоти- этого многочлена:
ческих многочленов меньшая асимптотическая
степень поглощает большую. ak ·xαk ≫ ai ·xαi (i 6= k), ak ·xαk ≫ o (xβ ).
x→0 x→0 x→0
§ 1. Асимптотические отношения и формулы 429
(и поэтому весь многочлен эквивалентен свое- x + x2 + o (x2 ) + o x + x2 + o (x2 ) =
x→0 x→0 x→0
му главному моному).
= (следствие 7.1.48) = x + x + o (x2 )+
2
⋄ 7.1.47. Например, .
/ .
/
x→0
2 2
+ o x + x + o (x ) =
2x + 4x2 − 2x3 + 5x4 + o (x2 ) ∼ 2x x→0 x→0
x→0 x→0
= x + x2 + o (x2 ) + o (x) = (следствие 7.1.44) =
x→0 x→0
Из следствия 7.1.46 и свойства 7o на с.425 мы .
/
получаем = x + x + o (x ) + o (x) = x + x2 + o (x) =
2 2
x→0 x→0 x→0
.
/
Следствие 7.1.48. При подстановке простого = (следствие 7.1.42) = x+x2+ o (x) = x+ o (x)
x→0 x→0
асимптотического многочлена A в символ o
x→0
возникающий асимптотический многочлен ра-
⋄ 7.1.51.
вен как асимптотическое выражение бесконеч-
но малому от главного монома: o (xαk ), где αk 2
x→0
– главная степень многочлена A. x + x2 + o (x2 ) =
x→0
⋄ 7.1.49. = x + x + o (x2 ) · x + x2 + o (x2 ) =
2
x→0 x→0
2
o 2x + 4x2 − 2x3 + 5x4 + o (x2 ) = 2
=x +x +4 2
o (x ) + 2x + x o (x ) + x2 o (x2 ) =
3 2
x→0 x→0 x→0 x→0 x→0
.
/ .
/ .
/ /
.
2 3 4 2
= o 2x + 4x − 2x + 5x + o (x ) = = x +x + o x +2x + o x + o x4 =
2 4 4 3 3
x→0 x→0 x→0 x→0 x→0
= o (x) = (следствие 7.1.44) =
x→0 .
/ .
/
= x + x + o x4 + 2x3 + o x3 + o x4 =
2 4
Теперь рассмотрим примеры, где применяет- x→0
x→0 x→0
ся много правил. 2 4 3 3
= x + x + 2x + o x = (следствие 7.1.42) =
x→0
⋄ 7.1.50. .
/
= x2 + x4+ 2x3 + o x3 = x2 + 2x3 + o x3
x→0 x→0
Последний пример особенно важен, и поэтому будет полезно найти более экономный способ
упрощать подобные выражения. Представим себе, что нам нужно упростить асимптотическое вы-
ражение
A0 xl + A1 xl+1 + ... + Ak xl+k + o xl+k · B0 xm + A1 xm+1 + ... + An xm+n + o xm+n
x→0 x→0
(7.1.33)
Для этого можно пользоваться следующим алгоритмом.
M = min{l + m + n, l + k + m}.
Это будет означать, что после упрощения наше выражение должно оканчиваться символом
o xM
x→0
2.
Последствию 7.1.42 все слагаемые со степенями µ > M при упрощении “съедаются” слагаемым
o xM :
x→0 .
/
xµ + o xM = o xM
x→0 x→0
= x + x + o (x2 ) · x + x2 + o (x2 ) ·
2
3. Выписываем результат:
x→0 x→0
· x + x + o (x2 )
2
1
x→0
x2 − x3 + o (x3 ) · 2x3 + x5 + o (x6 ) =
2 x→0 x→0
1. Сначала замечаем, что минимальная сте-
пень переменной x, стоящая под символом o, ко- = 2x5 − x6 + o (x6 )
x→0
торая может получиться при раскрытии скобок
равна 4. Это получается, когда два слагаемых x ⊲⊲ 7.1.55.
Упростите выражения:
2
2
умножаются на слагаемое o (x ). Значит, наше 1. −x2 + 32 x3 + o (x3 )
x→0 x→0
упрощенное выражение должно оканчиваться на 3
2. 2
−x + 3 x + o (x3 )
2 3
x→0
o x4 2
x→0 1 3
3. 3x + 5x + o (x4 )
x→0
2. Выписываем коэффициенты перед степе- 3
1 3
нями xi , i 6 4, которые получаются при раскры- 4. 3x + 5x + o (x4 )
x→0
тии скобок:
5. 3x2 + 1 3
4x + o (x3 ) · −2x + x2 + o (x2 )
при раскрытии скобок x→0 x→0
x0 : 0 степень x0 вообще ; 6. 3x2 + 1 3 3
· −2x + x2 + o (x3 )
получиться не может 4 x + o (x )
x→0 x→0
степень x1 тоже
x1 : 0 получиться не может ;
7. 3x2 + 1 3 4
4 x + o (x )
x→0
· −2x + x2 + o (x3 )
x→0
§ 1. Асимптотические отношения и формулы 431
8. 4x + 3x2 − 2x3 + x4 + o (x4 ) · · −x + x2 + x3 − x4 + o (x4 )
x→0 x→0
· −x + x2 + x3 − x4 + o (x4 )
x→0 10. 4x + 3x2 − 2x3 + x4 + o (x5 ) ·
x→0
9. 4x + 3x2 − 2x3 + x4 + o (x5 ) · · −x + x2 + x3 − x4 + o (x5 )
x→0 x→0
⋄ 7.1.56.
2 2
− x2 + o (x2 ) + o − x2
x→0 x→0
= lim =
arcsin 2x − sin x используем формулы x→0 x2 · ln 2 + o (x2 )
lim = (7.1.19) и (7.1.27) = x→0
x→0 x + ln(1 + 3x) 2
− x2 + o (x2 ) + o x2
используем x→0 x→0
2x + o (2x) − x + o (x) = свойство 1o = lim =
= lim x→0
x→0
= x→0 x2 · ln 2 + o (x2 )
x→0
x→0
x + 3x + o (3x) 2
x→0 − x2 + o (x2 )
снова x→0
x + o (x) − o (x) x + o (x) = используем 20 = lim =
= lim x→0 x→0
= lim x→0
=
x→0 x2 · ln 2 + o (x2 )
x→0
x→0 4x + o (x) x→0 4x + o (x) 2
x→0 x→0
− x2 + x2 o (1)
1 + o (1) после этого x→0
x→0 1+0 1 = свойство 6o = lim =
= lim = = x→0 x2 · ln 2 + x2 o (1)
x→0 4 + o (1) 4+0 4 x→0
x→0
− 21 + o (1)
делим все x→0
⋄ 7.1.57. = на x2 = lim =
x→0 ln 2 + o (1)
x→0
ln(cos x) используем формулы − 21 + 0 1
lim 2 = (7.1.21) и (7.1.24) = = применяем
= =−
x→0 2x − 1 свойство 7o
2
ln 2 + 0 2 ln 2
ln 1 − x2 + o (x2 )
= lim x→0
= ⋄ 7.1.58.
x→0 x2 · ln 2 + o (x2 )
x→0 1
x2
1 ln (x+ex ) x
lim (x + ex ) x = lim e
2
поскольку − 2 + o (x ) −→ 0, =
x→0 x→0
можно сделать замену x→0 x→0
2
y = − x2 + o (x2 ),
1 x limx→0 1
x ·ln(x+1+x+x→0
o (x))
= elimx→0 x ·ln(x+e )
=e =
x→0
и тогда получится, что y −→ 0,
x→0 limx→0 1
x ·ln(1+2x+x→0
o (x))
=
и по формуле
(7.1.22) мы будем
иметь =
=e =
2
ln 1 − x2 + o (x2 ) =
x→0 2x
∼
= ln(1 + y) = y + o (y) =
y→0 z }| {
2 2
= − x2 + o (x2 ) + o − x2 + o (x2 ) limx→0 1
x· 2x+ o (x)+ o
x→0 x→0
2x + o (x)
x→0 x→0
x→0
=e x→0 =
2 2
− x2 + o (x2 ) + o − x2 + o (x2 ) limx→0 1
x · 2x+ o (x)+ o (2x)
x→0 x→0 x→0
= lim = =e x→0 x→0
=
x→0 x2 · ln 2 + o (x2 )
x→0 1
limx→0 x · 2x+ o (x)+ o (x)
используем =e x→0 x→0
=
= свойство 3oo =
.
/ limx→0 1
x · 2x+ o (x)
2
− x2 + o (x2 ) + o
2
− x2 + o (x2 ) =e x→0
=
x→0 x→0 x→0
= lim = limx→0 1
x ·x· 2+ o (1)
x→0 x2 · ln 2 + o (x2 ) =e x→0
=
x→0
432 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
1 1 1 1
limx→0 2+ o (1) 4 o (x 4 ) + 3x 4 − 2( o (x 4 ) + o (x 4 ))
=e x→0
= e2+0 = e2 = lim x→0
2
x→0
2
x→0
2 =
1
x→0 o (x 7 )
2 x→0 + o (x 7 ) + x 7
x→0
⋄ 7.1.59. Вернемся теперь к примеру (7.1.34):
применяем
= свойства 10 и 20 §7 =
x6 · arctg4 x + sin5 sin tg x2
lim = 1 1 1
x→0 x2 · sin8 x + ln cos 3x5
4 5 o (x 4 ) + 3x 4 − 2( o (x 4 ))
x→0 x→0
= lim x6 · x + o (x) + sin tg x2 + o (sin tg x2 ) : = lim 2 2 =
(
x→0 x→0
!)
x→0 x→0 o (x 7 ) + x 7
8 5 2 x→0
: x2 · x + o (x) + ln 1−
(3x )
+ o (3x5 )2 =
применяем
x→0 2 x→0
= свойства 10 и 30 §7 =
(
6 4 4 1 1 1
= lim x · x + o (x ) + o (x 4 ) + 3x 4 − o (x 4 )
x→0 x→0
x→0 x→0
!5 ) = lim 2 2 =
+ tg x2 + o (tg x2 ) + o tg x2 + o (tg x2 ) :
x→0 o (x 7 ) + x 7
x→0 x→0 x→0 x→0
1 1
( !)
9x10 o (x 4 ) + 3x 4
: x2 · x8 + o (x8 ) + ln 1− + o 9x10 = x→0
x→0 2 x→0 = lim 2 2 =
5
x→0 o (x 7 ) + x 7
x→0
= lim x10 + o (x10 ) + tg x2 + o (tg x2 ) : 1 1
x→0
(
x→0 x→0
x 4 · o (1) + 3x 4
10 x→0
: x10 + o (x10 ) −
9x
+ o 9x10 +
= lim 2 2 =
x→0 2 x→0 x→0 x 7 · o (1) + x 7
!) x→0
9x10
+ o − + o 9x10 = o (1) + 3
x→0 2 x→0 x→0
(
= lim 1 1 =
10 10
x 28 · o (1) + x 28
x→0
= lim x + o (x )+ x→0
x→0 x→0
0+3
) по свойству 80 §7
5 = o (1) −→ 0 = =∞
+ x2 + o (x2 ) + o
x→0
x2 + o (x2 )
x→0
:
x→0
x→0 x→0 0·0+0
( )
10 10 9x10
10
⋄ 7.1.61.
: x + o (x ) − + o x =
x→0 2 x→0
√ √
5 4 3 x + 3 4 x − 2 sin x
x10 + o (x10 ) + x2 + o (x2 ) lim √7
=
= lim
x→0 x→0
=
x→∞ 1 − cos x + x2
10
x→0 − 7x2 + o (x10 ) 1 1
x→0 4x 3 + 3x 4 − 2 sin x
x10 + o (x10 ) + x10 + o (x10 )
= lim 2 =
x→0 x→0 x→∞ 1 − cos x + x 7
= lim
x→0 10
− 7x2 + o (x10 )
= 1 1
x→0 x4 = o (x 3 )
x→∞
2x10 + o (x10 ) 2 + o (1) sin x = o (x 31 )
x→0 x→0
= lim 10
= lim
− 72 + o (1)
= = x→∞
2 =
x→0 − 7x2 + o (x10 )
x→0
x→0
x→0
o (x 7 )
cos x = x→∞
2
2+0 4 1= o (x 7 )
= =− x→∞
− 72 + 0 7 1 1 1
4x 3 + 3 o (x 3 ) − 2 o (x 3 )
x→∞ x→∞
⋄ 7.1.60. = lim 2 2 2 =
x→∞ o (x 7 ) − o (x 7 ) + x 7
x→∞ x→∞
√ √ 1 1
4 3 x + 3 4 x − 2 sin x 4x 3 + o (x 3 )
lim √ = x→∞
x→0 1 − cos x + x2
7
= lim 2 2 =
x→∞ o (x 7 ) + x 7
= применяем формулы
(7.1.19) и (7.1.21) = x→∞
1 1
1 1
4x 3 + x 3 · o (1)
x→∞
4x + 3x − 2(x + o (x))
3 4 = lim 2 2 =
x→0 x→∞ x · o (1) + x 7
= lim 1 2 2 = 7
x→∞
x→0
2x + o (x2 ) + x 7
1 1
x→0
1 1
4x 21 + x 21 · o (1)
x→∞
x3 = o (x 4 )
x→0
= lim =
1 x→∞ o (1) + 1
= x = o (x 4 ) = x→∞
x→0
2 0
x2 = o (x 7 ) по свойству 8 §7
x→0 = o (1) −→ 0 =
n 1 1
x→∞ x→∞
= lim 4 o (x 4 ) + 3x 4 − 4 + o (1)
x→0 x→0 1 x→∞
1 1 o = lim x 21 ·
x→∞ o (1) + 1
=
− 2 o (x 4 ) + o ( o (x 4 )) : x→∞
x→0 x→0 x→0
n1 2 2 2
o 4+0
: o (x 7 ) + o ( o (x 7 )) + x 7 = = ∞· =∞
2 x→0 x→0 x→0 0+1
применяем
= свойство 6o §7 = ⊲⊲ 7.1.62. Вычислите пределы:
§ 2. Формулы Пеано и асимптотика 433
1−cos x 1
1. limx→0 ln(1+tg2 x) 3. limx→0 cos x + arctg2 x arcsin2 x
ln(1+x+x2 )+arcsin 3x−5x3
2. limx→0 sin 2x+tg2 x+(ex −1)5
Говорят, что функция f непрерывно дифференцируема порядка n ∈ N∗ на интервале (a, b), если
она дифференцируема n раз на (a, b), и все ее производные до порядка n непрерывны на (a, b). Это
эквивалентно существованию последовательности непрерывных функций g1 , ..., gn на (a, b) таких,
что
∀x ∈ (a, b) ∃f ′ (x) = g1 (x)
и
∀k 16k<n ⇒ ∀x ∈ (a, b) ∃gk′ (x) = gk+1 (x).
Асимптотические формулы (7.1.19) – (7.1.28), оказывается, являются частными случаями одной
общей формулы, которая описывается следующей теоремой:
n
X f (k) (x0 )
f (x) = · (x − x0 )k + o (x − x0 )n (7.2.35)
k! x→x0
k=0
• Эта формула называется формулой Тейлора3 с остаточным членом в форме Пеано4 по-
рядка (или точности) n для функции f в точке x0 .
и заметим, что
Tn (x0 ) = f (x0 ), Tn′ (x0 ) = f ′ (x0 ), Tn′′ (x0 ) = f ′′ (x0 ), ... Tn(n) (x0 ) = f (n) (x0 ) (7.2.36)
Действительно,
Затем,
f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )
Tn′ (x) = 0 + ·1+ · 2(x − x0 ) + ... + · n(x − x0 )n−1
1! 2! n!
3 Брук Тейлор (1685-1731) – английский математик.
4 Джузеппе Пеано (1858-1932) – итальянский математик.
434 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
и поэтому
f (n) (x0 )
Tn(n) (x) = 0 + 0 + ... + · n! = f (n) (x0 )
n!
и поэтому
Tn(n) (x0 ) = f (n) (x0 )
Формулы (7.2.36) позволяют вычислить следующий предел:
⋄ 7.2.2. Выпишем формулу Тейлора для функ- Можно увеличить точность, например, до n = 3,
ции f (x) = sin x в точке x0 = π4 с точностью и тогда получится
n = 2:
f ′ (x0 )
′
f (x0 ) sin x = f (x) = f (x 0 ) + · (x − x0 )+
sin x = f (x) = f (x0 ) + · (x − x0 )+ 1!
1! f ′′ (x0 ) f ′′′ (x0 )
f ′′ (x0 ) + · (x − x0 )2 + · (x − x0 )3 +
+ 2
· (x − x0 ) + o (x − x0 ) = 2 2! 3!
2! x→x0 π cos π4 π
π π + o ((x − x0 )3 ) = sin + · x− +
π cos 4 π − sin( 4 ) π 2 x→x0 4 1! 4
= sin + · x− + · x− +
4 1! 4 √ 2! 4 − sin( π4 ) π 2 − cos( π4 ) π 3
√ + · x − + · x − +
π 2 2 2 π 2! 4 3! √ 4
+ oπ x− = + · x− − √
x→ 4 4 2 2 4 π 3 2 2 π
√ + oπ x− = + · x− −
2 π 2 π 2 x→ 4 4 2 2 4
− · x− + oπ x− √ √
4 4 x→ 4 4 2 π 2 2 π 3 π 3
− · x− − · x− + oπ x−
4 4 12 4 x→ 4 4
Если убрать выкладки, получается следующий
результат: а без выкладок это будет выглядеть так:
√ √ √ √ √ √
2 2 π 2 π 2 2 2 π 2 π 2
sin x = + · x− − · x− + sin x = + · x − − · x − −
2 2 4 4 4 2√ 2 4 4 4
π 2 2 π 3 π 3
+ oπ x− − · x− + oπ x−
x→ 4 4 12 4 x→ 4 4
§ 2. Формулы Пеано и асимптотика 435
Формулы Маклорена-Пеано.
• При x0 = 0 формула Тейлора называется формулой Маклорена:
f ′ (0) f ′′ (0) 2 x2
cos x = f (x) = f (0) + ·x+ · x + o (x2 ) = 1 + 0 − + o (x2 )
1! 2! x→0 2 x→0
Для тех же функций, что и в (7.1.19) – (7.1.28) нетрудно выписать соответствующие формулы
с более высокой точностью, например, n = 3:
x3
sin x = x − + o (x3 ) (7.2.38)
6 x→0
3
x
tg x = x + + o (x3 ) (7.2.39)
3 x→0
x2
cos x = 1 − + o (x3 ) (7.2.40)
2 x→0
x2 x3
ln(1 + x) = x − + + o (x3 ) (7.2.41)
2 3 x→0
x x2 x3
loga (1 + x) = − + + o (x3 ) (7.2.42)
ln a 2 ln a 3 ln a x→0
x2 x3
ex = 1 + x + + + o (x3 ) (7.2.43)
2 6 x→0
2
x2
· ln a x3 · ln3 a
ax = 1 + x · ln a + + + o (x3 ) (7.2.44)
2 6 x→0
2
α(α − 1)x α(α − 1)(α − 2)x3
(1 + x)α = 1 + αx + + + o (x3 ) (7.2.45)
2 6 x→0
436 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
x3
arcsin x = x + + o (x3 ) (7.2.46)
6 x→0
x3
arctg x = x − + o (x3 ) (7.2.47)
3 x→0
x2 x3 − 76 + o (1) 7
=x− + + o (x3 )− = lim x→0
=−
2 3 x→0
x→0 2 + o (1) 4
3
x2 x3 x→0
− −x − − + o (x3 ) =
2 3 x→0 ⋄ 7.2.7.
√
2x3 ln x + 1 + x2 − x + x3
= 2x + + o (x3 ) lim 6
3 x→0
x→0 x − arcsin x
Далее, Здесь мы сразу применим формулы Маклорена
с точностью n = 3. Выпишем отдельно асимп-
earctg x = (применяем (7.2.43)) = тотическое представление некоторых фрагмен-
arctg2 x arctg3 x тов:
= 1 + arctg x + + + p
2 6 1
3
+ o (arctg x) = (применяем (7.2.47)) = ln x + 1 + x2 = ln x + (1 + x2 ) 2 =
x→0
1 1
2
x3 применяем 1 2 2 −1 x
=1+ x− 3
+ o (x ) + = (7.2.45) = ln x + 1 + x + +
3 x→0 2 2
§ 2. Формулы Пеано и асимптотика 439
!
1 1 1
2 2 −1 2 − 2 x3 3 местах точность мы будем брать разной. Выпи-
+ + o (x ) = шем получающиеся выражения:
6 x→0
1 1
1
3 − 2 x2 − 21 − 23 x3
= ln 1 + x + 2
+ 2
+ cos(xex ) = cos x · 1 + x + o (x) =
2 2 6
x→0
!
= cos x + x + o (x2 ) =
2
x→0
+ o (x3 ) =
x→0 1 2
=1− x + x + o (x2 ) +
2
2
x→0
3 x2 3x3 3
= ln 1 + x − + + o (x3 ) = 2 2
2 8 48 x→0 + o x + x + o (x ) =
x→0 x→0
применяем
= (7.2.41) = 1
= ... = 1 − x2 − x3 + o (x3 )
3 x2 3x3 2 x→0
3
= x− + + o (x ) −
2 8 48 x→0
2
x2 3x3
3
2 x − 8 + 48 + x→0 o (x3 ) cos(xex ) − ln(1 − x) − x =
− +
2 1 2 3 3
= 1 − x − x + o (x ) −
3 x2 3x3
3 2 x→0
2 x − 8 + 48 + x→0 o (x3 ) 2 3
+ + x x 3
3 − −x − − + o (x ) − x =
! 2 3 x→0
3
3 x2 3x3 3 2x3
+ o x− + + o (x ) = =1− + o (x3 )
x→0 2 8 48 x→0
3 x→0
упрощаем
x3
= ... = с 0помощью = ... = x − + o (x3 ) 1 1
1 − 90 §7 6 x→0 ctg x3 = 3
= 3
tg x x + o (x3 )
Теперь вычисляем предел: x→0
X k
x2 x4 x2k x2i
cos x = 1 − + − ... + (−1)k · + o (x2k ) = (−1)i · + o (x2k ) (7.2.49)
2! 4! (2k)! x→0 i=0
(2i)! x→0
X k
x2 x3 xk xi
ln(1 + x) = x − + + ... + (−1)k−1 · + o (xk ) = (−1)i−1 · + o (xk ) (7.2.50)
2 3 k x→0
i=1
i x→0
X xi k
x2 xk
ex = 1 + x + + ... + + o (xk ) = + o (xk ) (7.2.51)
2! k! x→0 i=0
i! x→0
x2 xk
(1 + x)α = 1 + α · x + α(α − 1) · + ... + α(α − 1)...(α − k + 1) · + o(xk ) =
2! k! x→0
k
X xi
=1+ α(α − 1)...(α − i + 1) · + o (xk ) (7.2.52)
i=1
i! x→0
X k
1
= 1 − x + x2 + ... + (−1)k · xk + o(xk ) = (−1)k · xi + o (xk ) (7.2.53)
1+x x→0 i=0
x→0
X k
1
= 1 + x + x2 + ... + xk + o(xk ) = xi + o (xk ) (7.2.54)
1−x x→0 i=0
x→0
X k
x3 x5 x2k+1 x2i+1
arctg x = x − + − ... + (−1)k · + o(xk ) = (−1)i · + o (xk ) (7.2.55)
3 5 2k + 1 x→0 i=0
2i + 1 x→0
⋄ 7.2.9. Вспомним о пределе (7.0.1), которым мы = x + o (x) + o x + o (x) −
x→0 x→0 x→0
начинали эту главу:
− x + o (x) + o x + o (x) =
ln(1 + sin x) − sin ln(1 + x) x→0 x→0 x→0
lim = o (x)
x→0 earctg x − 1 − arctg(ex − 1) x→0
Как уже говорилось, вычислять его с помощью И подстановка в предел ничего не дает:
правила Лопиталя слишком тяжело. С другой
стороны, применять теорему об эквивалентной ln(1 + sin x) − sin ln(1 + x)
замене или выделять главное слагаемое тут то- lim arctg x =
x→0 e − 1 − arctg(ex − 1)
же бесполезно.
Если применить асимптотические формулы o (x) x · o (1)
= lim x→0 = lim x→0
=
(7.1.19) – (7.1.28) (то есть формулы Маклорена с x→0 o (x) x→0 x · o (1)
x→0 x→0
точностью n = 1), то числитель разложится так:
o (1) 0
x→0
ln(1 + sin x) − sin ln(1 + x) = = lim = =?
x→0 o (1) 0
x→0
= применяем формулы
(7.1.22), (7.1.19) =
В соответствии с правилом (B), это означа-
= sin x + o (sin x)− ет, что нужно увеличить точность формул Ма-
x→0
клорена. Возьмем n = 3 (то есть воспользуемся
− ln(1 + x) + o (ln(1 + x)) =
x→0 формулами (7.2.38) – (7.2.47)). Тогда мы полу-
= x + o (x) + o x + o (x) − чим:
x→0 x→0 x→0
− x + o (x) + o x + o (x) = sin2 x sin3 x
x→0 x→0 x→0 ln(1 + sin x) = sin x − + +
= o (x) 2 3 3
x
x→0
+ o sin3 x = x − + o (x3 ) −
x→0 6 x→0
А знаменатель так: 2
3
1 x 3
− x− + o (x ) +
earctg x − 1 − arctg(ex − 1) = 2 6 x→0
3
= применяем формулы
= 1 x3
(7.1.24), (7.1.28) + x− + o (x3 ) +
3 6 x→0
= 1 + arctg x + o (arctg x) − 1 3 !
x→0
x3 3
+ o x− + o (x ) =
− ex − 1 + o (ex − 1) = x→0 6 x→0
x→0
§ 2. Формулы Пеано и асимптотика 441
x2 x3 x2 x3
= ... = x − + + o (x3 ) = ... = x + − + o (x3 )
2 6 x→0 2 6 x→0
и и поэтому
!
x2 x3 3
3 И опять при подстановке в предел получается
+ o x− + + o x = неопределенность:
x→0 2 3 x→0
(arctg x)2 x3
earctg x − 1 = 1 + arctg x + + sin x = x − + o (x4 )
2 6 x→0
(arctg x)3
+ + o (arctg x)3 − 1 = x2 x3 x4
6 x→0 ln(1 + x) = x − + − + o (x4 )
2 3 4 x→0
x3 3
= x− + o (x ) + x2 x3 x4
3 x→0 ex = 1 + x + + + + o (x4 )
2 2 6 30 x→0
1 x3 x3
+ x− + o (x3 ) + arctg x = x − + o (x4 )
2 3 x→0
3 x→0
3
3
1 x Тогда получим
+ x− + o (x3 ) +
6 3 x→0
3
3 ! sin2 x sin3 x sin4 x
x ln(1 + sin x) = sin x − + − +
+ o x− + o (x3 ) =
x→0 3 x→0 2 3 3 4
x
x2 x3 + o sin4 x = x − + o (x4 ) −
= ... = x + − + o (x3 ) x→0 3! x→0
2 6 x→0 2
1 x3 4
и − x− + o (x ) +
2 3! x→0
3
arctg(ex − 1) = 1 x3
+ x− + o (x4 ) −
x2 x3 3 3! x→0
= arctg x + + + o (x3 ) = 4
2 6 x→0 1 x3 4
− x− + o (x ) +
x2 x3 4 3! x→0
= x+ + + o (x3 ) − 4 !
2 6 x→0
x3
1 3 4
x2 x3 + o x− + o (x ) =
− · x+ + + o (x3 ) + x→0 3! x→0
3 2 6 x→0
3 x2 x3 x4
x2 x3 3 = ... = x − + − + o (x4 )
+ o x+ + + o (x ) = 2 6 12 x→0
x→0 2 6 x→0
442 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
1
и sin(2− x2 ) = sin y − 12 =
y=2 x
1
(ln(1 + x))
3 1
и ⇓
arctg(ex − 1) =
x2 x3 11x4 1 1 x2 2
2
=x+ − − + o (x4 ) = · 1 + + o (x ) =
2 6 24 x→0 sin2 x x2 6 x→0
Поэтому 1 x2 x4
= 2 · 1+ + + o (x4 ) =
x 3 36 x→0
earctg x − 1 − arctg(ex − 1) = 1 1 x2
= 2+ + + o (x2 )
7x4 11x4 x 3 36 x→0
=− + + o (x4 ) =
24 24 x→0
⇓
x4
= + o (x4 )
6 x→0 1 1 1 x2
− = − − − + o (x2 )
Теперь, подставляя в предел, мы получим: sin2 x x2 3 36 x→0
sin(2 − x12
) 2 − x2 + o 2 − x2
− x12 x→0
sin(2 ) lim = lim =
lim . x→0 − sin12 x x→0 − x12
2
− x36 + o (x2 )
x→0 − sin12 x 2 2 ·2 − 13 ·2 x→0
2
1 + o (1) 1+0 1 √
Здесь числитель можно записать так: = lim 2
x→0
= 1 = 23 =
3
2.
x→0
2− 3 · 2
1 − x36 + o (x2 )
x→0 2− 3 · 20
§ 2. Формулы Пеано и асимптотика 443
√
x 1+sin x− 12 ln(1+x2 )−x
⊲⊲ 7.2.11. Найдите пределы: 12. limx→0 3
√ tg x
1. limx→0 ln(1+x)−x
x2 13. limx→0 esin x − 1+x2 −x cos x
ln3 (1−x)
ex −1−x √
2. limx→0 x2 esin x ln cos x − 4 1+4x+x− 32 x2
2 14. limx→0 x sin x2
cos x−1− x2 1−cos
1
3. limx→0 x4 2 tg x x
arctg x−arcsin x 15. limx→0 x+sin x
4. limx→0 x2 1
xex +1 x2
5. limx→0 arctg x−arcsin x
tg x−sin x
16. limx→0 xπ x +1
6. limx→0 2 arcsin x−arcsin 2x √ 1
√ x3 17. limx→0 cos(sin x) + 21 arcsin2 x x2 ( 1+2x−1)
7. limx→0 √
5
1+2x−1
√ √ 1
4
1+x− 1−x
√
18. limx→2 3 − x + ln x2 sin2 (x−2)
1+x cos x− 1+2x
8. limx→0 1 1
ln(1+x)−x 19. limx→0 sin x arctg x − tg x arcsin x
x √
− 1+2x
9. limx→0 e ln cos x 20. limx→0 esin x −1−sin(ex −1)
√ arctg4 x
x−3 3 1+x
10. limx→0 3 cos x+arcsin
ln(1−x2 ) 21. sin x3
limx→0 ln cos x−cos ln(1+x)+1
3
sin x+2x cos x2 sin((1+x)α −1)−(1+sin x)α +1
11. limx→0 ln(1+x )−2 arctg x3 22. limx→0 tg4 x
(b) Асимптотика
Формула Тейлора-Пеано (7.2.35), с которой мы начинали этот параграф, является частным случаем
следующей общей конструкции.
Пусть a – какое-нибудь число или символ бесконечности.
• Последовательность функций {ϕn } называется асимптотической последовательностью
при x → a, если
∀k ∈ N ϕk (x) ≫ ϕk+1 (x) (7.2.56)
x→a
(если она верна). Из (7.2.56) следует, что коэффициенты λk ∈ R в формуле (7.2.57) опреде-
ляются однозначно (поэтому не бывает двух разных асимптотических разложений одного
порядка относительно данной асимптотической последовательности).
это просто формулы Маклорена (7.2.37), о ко- Асимптотические разложения вдоль этой после-
торых мы уже говорили выше: довательности обычно получаются заменой x =
1
n
X t с последующим применением формул Макло-
f (k) (0) k n рена. Объясним это на примерах.
f (x) = · x + o (x )
k! x→0
k=0
444 Глава 7. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
⋄ 7.2.12. Пусть нам нужно найти асимптотиче- и если эта формула верна, то будет верна и фор-
ское разложение порядка 3 при x → +∞ вдоль мула первого порядка:
степенной последовательности для функции √
p 3
x = λ0 + λ1 · x + o x (7.2.58)
f (x) = x2 + 1 x→0
√ q √
которое не может быть верно ни при каком
1 1
+1−1 1+t−1
e x2 +x−x
= tx→=+0
t
= e t2 t t = e t = λ1 .
= (7.2.52) = Приведенный пример 7.2.14 имеет целью под-
1+ 1 ·t+ 1 ·
2
( 12 −1)· t2! +t→+0
o (t2 )−1 1
готовить читателя к мысли, что асимптотиче-
2 2 − t + o (t)
=e t = e 2 8 t→+0 = скую последовательность {ϕn }, вдоль которой
1 − 8t + o (t) мы собираемся раскладывать данную функцию
= e2 · e t→+0
= (7.2.51) = f , бывает удобно выбирать отдельно, в зависи-
√
t
t
= e· 1 − + o (t) + o = − + o (t) мости от вида функции f .
8 t→+0 t→+0 8 t→+0
√
√ t √ t e ⋄ 7.2.15. Асимптотическое разложение функции
= e · 1 − + o (t) = e− + o (t) =
8 t→+0 8 t→+0 p
√ 3
f (x) = x + x2
√ e 1
= e− + o
8x x→+∞ x при x → 0 бессмысленно искать вдоль стандарт-
ной степенной последовательности
Другие асимптотические последователь-
ности. Не всегда данная функция f име- ϕk (x) = xk
ет асимптотическое разложение вдоль данной
асимптотической последовательности {ϕn }. потому что здесь возникает тот же эффект, что
в примере 7.2.14: никакая формула вида (7.2.57)
⋄ 7.2.14. Формула
не будет верна, если n > 0.
√ Xn Однако если взять последовательность
3
x= λk · xk + o xn
x→0 1 11 5k+1
k=0 x 3 ≫ x2 ≫ x 3 ≫ ... ≫ x 3 ≫ ...
x→0 x→0 x→0 x→0 x→0
не будет верна ни при каких n > 0 и λ0 , ..., λn ∈
R. то этот эффект исчезает, и разложение находит-
ся очень просто:
Доказательство. Это достаточно доказать для
n = 1, потому что любую формулу большего по- p3 1 5 1
11
11 t2
1x2 x3 1+ 1
3 ·t+ 1
3 · 1
3 −1 · 2! + o t2
=x +3 − +o x 3 t→0
3 9 = (7.2.52) = 2 =
x→0
t3
(одновременно из этих вычислений становит- t
1
t
4
2 3 3 4 = x1
ся понятно, откуда берется последовательность = t− 3 + − + o t 3 = xt → ∞ =
5k+1
3 9
t→0
ϕk (x) = x 3 ).
2 1 1 1
⋄ 7.2.16. Попробуем найти разложение той же = x3 + 1 − 4 + o 4
3 · x3 9 · x3 x3
функции p x→∞
3
f (x) = x + x2
при x → ∞. Как и в предыдущих случаях, когда Из вычислений видно, что разложение в этом
ищется асимптотика на бесконечности, начнем с случае удобно искать вдоль асимптотической по-
замены x = 1t : следовательности
p r1 1
1
(1 + t) 3
= 1t
x + x2 = xt →
3 3 2 1 4 2
0 = + = 2 = x 3 ≫ x− 3 ≫ x− 3 ≫ ... ≫ x 3 −k ≫ ...
t t2 t3 x→∞ x→∞ x→∞ x→∞ x→∞
Глава 8
ИНТЕГРАЛ
§1 Неопределенный интеграл
В главе 6 мы определили понятие производной F ′ функции F и изучали его приложения в мате-
матике. Неопределенный интеграл представляет собой конструкцию, придуманную для решения
обратной задачи: дана функция f , нужно найти такую функцию F , для которой f была бы произ-
водной,
F ′ = f.
Такая функция F называется первообразной для функции f .
Как и в случае с производной, эта конструкция оказывается полезной в самых разных областях
естествознания, в частности, в геометрии, при вычислении площадей и объемов. Но, в отличие от
производной, задача нахождения первообразной не имеет однозначного решения: здесь решением
будет целый класс функций, который и называется неопределенным интегралом функции f .
Еще одна неприятная деталь в этой теории, отличающая ее от теории дифференцирования, —
что неопределенный интеграл от стандартной функции не всегда является стандартной функцией.
Поэтому в некоторых случаях “вычислить” неопределенный интеграл в том смысле, который вкла-
дывался в эту задачу в дифференциальном исчислении, то есть, выразив результат в элементарных
функциях, бывает невозможно.
Из-за того, что неопределенный интеграл — не одна функция, а целый их класс, эту тему при-
ходится начинать с изучения классов функций1 . Наше изложение уместно начать с какого-нибудь
примера, который объяснит, почему в том, что мы будем говорить, встретятся такие неожиданно
сложные построения.
классами в смысле определения на с.29), но нам будет удобно называть их именно классами, чтобы не провоцировать
путаницы с числовыми множествами.
446
§ 1. Неопределенный интеграл 447
правой частей (это так по крайней мере в случа- и дифференцируемости функции на отрезках, и
ях, когда область определения имеет несколько почему мы так много времени тратим на их об-
связных компонент). И это объясняет, зачем ни- суждение: просто из-за своей новизны эти тер-
же мы вводим понятие тождества классов функ- мины требуют привыкания.
ций на отрезках, а затем понятия непрерывности
F = G,
если они равны как классы (или множества), то есть если включение f ∈ F эквивалентно включе-
нию f ∈ G:
f ∈ F ⇔ f ∈ G.
Понятно, что это эквивалентно выполнению соотношений
F ⊆G & G ⊆ F.
⋄ 8.1.4. Рассмотрим два класса функций, опи- Будут ли они равны? Чтобы это понять, нужно
санных в примере 8.1.2: проверить два включения:
F = sin x + A, G = cos x + B. F ⊆G
448 Глава 8. ИНТЕГРАЛ
Классы функций с общей областью определения. Будем говорить, что класс функций F
имеет общую область определения, если любые две функции из него имеют одинаковую область
определения:
∀f, g ∈ F D(f ) = D(g).
В этом случае множество D(f ), где f ∈ F (не зависящее от выбора f ∈ F ), называется областью
определения функций из F и обозначается D(F ):
D(F ) = D(f ) (f ∈ F ).
⋄ 8.1.7. Классы функций, рассматривавшиеся в тоже имеет общую область определения, которая
примерах 8.1.2 и 8.1.3, представляет собой прямую с выкинутой точкой
0:
sin x + A, cos x + B, sin(x + A), cos(x + B),
D(F ) = R \ {0}.
являются, конечно, классами с общей областью
определения, которая у них совпадает со всей ⋄ 8.1.9. Класс функций
прямой R.
1
⋄ 8.1.8. Класс функций F=
x+A
1
F = +A наоборот не имеет общей области определения.
x
Ограничение класса функций. Напомним, что понятие ограничения отображения было опре-
делено выше формулой (0.3.227) (с.43). Применительно к числовым функциям это определение
выглядит так: ограничением функции f : R ֒→ R на множество M ⊆ R называется функция f M ,
определенная правилами:
1) область определения f представляет собой пересечение M с областью определения f :
M
D(f M ) = M ∩ D(f ),
2) на множестве D(f M ) = M ∩ D(f ) функции f M и f совпадают:
∀x ∈ M ∩ D(f ) f M (x) = f (x).
Ограничением класса функций F на множество M называется класс функций F M , определен-
ный правилом
g ∈ F M ⇔ ∃f ∈ F f M = g.
450 Глава 8. ИНТЕГРАЛ
F = ln |x| + A. G = sgn x + B.
Можно заметить, что его ограничением на мно- Можно заметить, что при ограничении на мно-
жество M = (0, +∞) будет класс функций жество M = (0, +∞) получающиеся классы
функций совпадают, потому что
F (0,+∞) = ln x + A.
F (0,+∞) = A, x > 0,
⋄ 8.1.11. Рассмотрим класс функций
и
F =A G (0,+∞) = 1 + B, x > 0.
D(F ) = D(G);
(ii) на любом отрезке [a, b] из их области определения D(F ) = D(G) ограничения этих классов
совпадают:
F [a,b] = G [a,b] ([a, b] ⊆ D(F ) = D(G), a 6= b).
! 8.1.12. Понятно, что если классы функций F потому что, во-первых, области определения у
и G равны, то они тождественны на отрезках: них общие и совпадают
F =G ⇒ F ≡ G. D(F ) = D(G) = R \ {0},
Но обратное неверно: если F и G тождественны и, во-вторых, если отрезок [a, b] лежит в этой об-
на отрезках, то это не означает автоматически, ласти определения, то он полностью лежит либо
что они совпадают: на правой полупрямой
F ≡G 6 ⇒ F = G. [a, b] ⊆ (0, +∞),
В этом нас убеждает следующий пример. либо на левой полупрямой
⋄ 8.1.13. Рассмотрим следующие два класса
[a, b] ⊆ (−∞, 0),
функций:
1 и тогда значение функции sgn x на нем равно
F = + A,
x константе, и выражение sgn x + B в определении
и
1 G можно заменить на выражение A.
G = + sgn x + B.
x ⊲⊲ 8.1.14. Проверьте, выполняются ли следую-
Сами по себе они не совпадают щие тождества:
F 6= G, sin(x + A) ≡ cos(x + B),
потому что функции вида
A ≡ sgn x + B,
1 1 1
f (x) = + A ≡ + B,
x x+A x
не представимы в виде 1 1
1 + A ≡ + sgn(x − 1) + B,
g(x) = + sgn x + B x x
x 1 1
+ A ≡ + sgn x + A,
(и наоборот). Однако, эти классы функций тож- x x
дественны на отрезках, ex+A ≡ B · ex ,
F ≡ G, ex+A ≡ B · ex , B > 0.
§ 1. Неопределенный интеграл 451
Теорема 8.1.15. Если функции f и g имеют областью определения одно и то же связное мно-
жество M , то классы f (x) + A и g(x) + B тождественны на отрезках тогда и только тогда,
когда они совпадают, или, что эквивалентно, когда функции f и g отличаются на константу:
f (x) + A ≡ g(x) + B ⇔ f (x) + A = g(x) + B ⇔ f (x) = g(x) + C
Доказательство. Очевидно, что импликации справа налево выполняются автоматически
f (x) + A ≡ g(x) + B ⇐ f (x) + A = g(x) + B ⇐ f (x) = g(x) + C
поэтому важно только доказать импликацию
f (x) + A ≡ g(x) + B ⇒ f (x) = g(x) + C.
Зафиксируем для этого какой-нибудь отрезок [a, b] ⊆ M . Из тождества
f (x) + A ≡ g(x) + B (8.1.14)
следует, что на [a, b] функции f и g отличаются на некую константу C:
f (x) = g(x) + C, x ∈ [a, b]. (8.1.15)
Она единственна, и мы ее запоминаем. Теперь если [c, d] ⊆ M — какой-то другой отрезок, содержа-
щий [a, b],
[a, b] ⊆ [c, d], (8.1.16)
то опять из тождества (8.1.14) будет следовать, что f и g отличаются на некую константу C ′ теперь
на отрезке [c, d]:
f (x) = g(x) + C ′ , x ∈ [c, d]. (8.1.17)
При этом (8.1.15) и (8.1.17) вместе означают, что константы C и C ′ должны совпадать:
C = C′.
Мы получаем тождество
f (x) = g(x) + C, x ∈ [c, d], (8.1.18)
в котором C — константа, зафиксированная нами на этапе, когда мы выбрали отрезок [a, b] (и
отметили тождество (8.1.15)). И это выполняется для любого отрезка [c, d] со свойством [a, b] ⊆
[c, d] ⊆ M . Это эквивалентно утверждению, что f и g отличаются на константу на M .
! 8.1.16. Для произвольных классов функций F В качестве примера можно взять классы C(R)
и G с общей связной областью определения тео- непрерывных функций на R и C00 (R) непрерыв-
рема 8.1.15 не верна: из тождества ных функций с компактным носителем на R. Для
них
F ≡G
C(R) ≡ C00 (R),
формально не следует равенство
но
F =G C(R) 6= C00 (R)
Теорема 8.1.17. Нетривиальная линейная комбинация (то есть такая, чтобы хотя бы один из
коэффициентов α или β был ненулевым) классов f (x) + A и g(x) + B описывается формулой
∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (8.1.22)
∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (8.1.23)
D(f ) ⊇ D(h)
D(g) ⊇ D(h)
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (8.1.25)
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (8.1.26)
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]) (8.1.27)
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]). (8.1.28)
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀A ∈ R ∃B ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]) (8.1.29)
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀B ∈ R ∃A ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]). (8.1.30)
Эти два условия означают, что на всяком отрезке [a, b] ⊆ D(f ) = D(h)∩D(g) функция F представима
в виде f (x)+A тогда и только тогда, когда она представима в виде h(x)−(g(x)+B), и это в точности
тождество
f (x) + A ≡ h(x) − (g(x) + B).
R(f ) ⊆ D(G)
h∈G◦f ⇔ ∃g ∈ G h = g ◦ f.
и
G ≡ H, (8.1.32)
то
G◦f ≡H◦f (8.1.33)
Мы доказали вложение
G ◦ f [a,b] ⊆ H ◦ f [a,b] .
которое справедливо для всякого отрезка [a, b] ⊆ D(f ) = D(G ◦ f ) = D(H ◦ f ). Это доказывает
(8.1.33).
h(x) − h(a)
h′+ (a) := lim (8.1.34)
x→a+0 x−a
§ 1. Неопределенный интеграл 455
H(x) = C, x ∈ [a, b]
для некоторого C ∈ R.
Доказательство. Положим C = H(a). Для любого x ∈ (a, b] мы получим, что функция H
– дифференцируема на интервале (a; x) (потому что она дифференцируема на (a, b)), и
– непрерывна на отрезке [a; x] (по предложению 8.1.22)
поэтому, мы можем применить к функции H на отрезке [a; x] теорему Лагранжа 6.1.33, и тогда
получим, что существует такая точка ξ ∈ (a; x), что
H(x) − H(a)
= H ′ (ξ) = (8.1.39) = 0
x−a
отсюда
H(x) − H(a) = 0 =⇒ H(x) = H(a) = C
F (x) + C
поэтому любой интервал является интеграль- поэтому никакое дискретное множество не ин-
ным множеством. тегрально
⋄ 8.1.27. Интегральная часть последовательно-
⋄ 8.1.25. Интегральная часть (невырожденного) сти тоже всегда пуста, например,
отрезка [a, b] совпадает с ним самим:
´
1 ∗
; n∈N =∅
´
[a, b] = [a, b], n
2 Множество M называется дискретным, если каждая его точка x ∈ M обладает окрестностью U (x), в которой
ε
не содержится никаких других точек множества M .
§ 1. Неопределенный интеграл 457
f = F′ (8.1.42)
Наша задача — показать, что все функции fa,b являются ограничениями f[a,b] некоторой единой
функции f : D(F ) → R:
f [a,b] = fa,b .
Для этого нужно просто проверить, что для любых двух отрезков [a, b], [c, d] ⊆ D(F ) соответствую-
щие функции fa,b и fc,d совпадают на пересечении [a, b] ∩ [c, d]:
Действительно, если это пересечение [a, b] ∩ [c, d] непусто, то объединение отрезков [a, b] и [c, d]
представляет собой отрезок, содержащийся в D(F ):
Неопределенный интеграл.
• Функция F : R ֒→ R называется первообразной для функции f : R ֒→ R, если f является
производной для F на отрезках (в смысле определения на с.457). Это означает 3 вещи:
(i) область определения D(f ) функции f является интегральным множеством;
(ii) области определения функций F и f совпадают:
´
— и что на каждом отрезке [a, b] ⊆ D( f (x) d x) = D(F (x) + C) ограничения этих классов
совпадают: ˆ
f (x) d x [a,b] = F (x) + C [a,b] . (8.1.48)
´3. Теперь, чтобы доказать (8.1.48) остается проверить, что для всякого отрезка [a, b] ⊆ D(f ) =
D( f (x) d x) = D(F (x) + C) выполняется обратное включение:
ˆ
f (x) d x [a,b] ⊆ F (x) + C [a,b] . (8.1.51)
⇓
G — первообразная для f
⇓
G удовлетворяет (8.1.44) :
(G[a,b] )′ = f [a,b]
⇓ свойство 20 первообразных на отрезке (с.455)
G [a,b]
отличается от F [a,b] на константу:
∃C G[a,b] = F (x) + C [a,b]
dx
ˆ
Таблица интегралов. Неопределенные инте- ≡ ln |x| + C (8.1.54)
гралы элементарных функций подсчитаны, и вот x
их список.45 ax
ˆ
ax d x ≡ + C, (0 < a 6= 1) (8.1.55)
ln a
ˆ
ex d x ≡ ex + C
ˆ
(8.1.56)
A dx ≡ A ·x + C (8.1.52)
ˆ
xα+1 sin x d x ≡ − cos x + C (8.1.57)
ˆ
xα d x ≡ +C (α 6= −1) (8.1.53)
α+1
4 При α ∈ (−1, 0) в формуле (8.1.53) области определения левой и правой частей формально не совпадают, потому
что
/ D(xα )
0∈ & 0 ∈ D(xα+1 ).
Поэтому чтобы формула (8.1.53) в этом случае была верна, нужно ввести соглашение, что правая часть здесь счита-
ется определенной на области определения подынтегральной функции. Это также относится к формуле (8.1.62). В
остальных формулах это требование излишне, потому что области определения первообразной и подынтегральной
функции совпадают по определению.
5 В формулах (8.1.52), (8.1.53), (8.1.55), (8.1.61), (8.1.62), (8.1.63), (8.1.64) значения параметров A, α и a считаются
фиксированными, чтобы не получилось, что интеграл берется от целого класса функций. Это важно, потому что,
например, если в (8.1.53) считать, что α может меняться, то тождество классов функций можно будет понимать
более широко, так что в одной из частей можно будет заменить α на новую букву, например, β, и получающееся
тождество тоже придется признать верным.
460 Глава 8. ИНТЕГРАЛ
ˆ
cos x d x ≡ sin x + C (8.1.58) мер, из формулы
α+1
dx ∂ x (α + 1) · xα
ˆ
≡ tg x + C (8.1.59) = = xα
cos2 x ∂x α + 1 α+1
dx
ˆ
≡ − ctg x + C (8.1.60) следует, формула (8.1.53):
sin2 x
dx 1 x
ˆ
xα+1
ˆ
2 2
≡ arctg + C (8.1.61) xα d x ≡ +C
a +x a a α+1
dx x
ˆ
√ ≡ arcsin + C (8.1.62) В доказательстве формул (8.1.54), (8.1.63) и
2
a −x 2 a
(8.1.64) используется доказанная выше формула
dx 1
a + x + C
ˆ
≡ ln (8.1.63) (6.1.84).
2
a −x 2 2a a − x
dx p
(8.1.64) ! 8.1.35. Понятное дело, в качестве парамет-
ˆ
√ ≡ ln x + x2 + A + C
x2 + A ра можно выбирать любую букву, кроме тех,
что входят в интегрируемое выражение, необя-
Доказательство. Здесь всюду используется тео- зательно C. Например, можно писать
рема 8.1.34, и доказательство состоит в том, что-
бы проверить, что производная от правой части xα+1
ˆ
α
совпадает с подынтегральной функцией. Напри- x d x ≡ + D.
α+1
Доказательство. 1. В первом свойстве сначала нужно проверить, что левая и правая части имеют
одинаковые области определения. Действительно,
ˆ
D α · f (x) + β · g(x) d x = D α · f + β · g = D(f ) ∩ D(g) =
ˆ ˆ ˆ ˆ
= D α · f (x) d x ∩ D β · g(x) d x = D α · f (x) d x + β · g(x) d x .
С другой стороны,
D α · F + β · G = D(F ) ∩ D(G) = D(f ) ∩ D(g) = D α · f + β · g .
И, наконец, множество
D(f ) ∩ D(g) = D(α · f + β · g)
по условиям утверждения 1◦ интегрально. Вместе это значит, что функции α · F + β · G и α · f + β · g
удовлеторяют условиям (i)—(iii) определения первообразной на с.458, то есть функция α · F + β · G
является первообразной для функции α · f + β · g. Как следствие,
ˆ
α · f (x) + β · g(x) d x ≡ (8.1.46) ≡ (α · F + β · G)(x) + C = α · F (x) + β · G(x) + C =
ˆ ˆ
= (8.1.19) = α · (F (x) + A) + β · (G(x) + B) ≡ (8.1.46) ≡ α · f (x) d x + β · g(x) d x
D(f ′ ) = D(f ),
Отсюда, применяя теорему 8.1.21, мы можем заключить, что тождество (8.1.69) влечет за собой
тождество
ˆ
g(y) d y y=f (x) ≡ G(y) + C y=f (x) . (8.1.70)
⇓
′ ′
(G ◦ f ) [a,b] = (g ◦ f ) [a,b] · f [a,b] , [a, b] ⊆ D((g ◦ f ) · f ′ ) = D(f )
3. В тождестве (8.1.68) нужно опять сначала проверить, что девая и правая части имеют одну и
ту же область определения. Это следует из того, что функции f и g дифференцируемы на отрезках:
по этой причине выполняются равенства
а из них — цепочку
ˆ
D f (x) · g ′ (x) d x = D(f · g ′ ) = D(f ) ∩ D(g ′ ) = D(f ) ∩ D(g) =
ˆ
= D(f ) ∩ D(g) ∩ D(f ′ ) ∩ D(g) = D f (x) · g(x) − g(x) · f ′ (x) d x
Заметим далее, что для любого отрезка [a, b] ⊆ D(f ) ∩ D(g) справедливо равенство
′ ′ ′
(f · g)[a,b] = f [a,b] · g [a,b] + f [a,b] · g [a,b] .
С другой стороны,
D f · g = D(f ) ∩ D(f ) = D(f ′ ) ∩ D(g) ∩ D(f ) ∩ D(g ′ ) = D f ′ · g + f · g ′ .
И, наконец, множество
D(f ) ∩ D(g) = D(f ′ · g + f · g ′ )
по условиям утверждения 3◦ интегрально. Вместе это значит, что функции f · g и f ′ · g + f · g ′
удовлеторяют условиям (i)—(iii) определения первообразной на с.458, то есть функция f ·g является
первообразной для функции f ′ · g + f · g ′ . Как следствие,
ˆ
(f · g)(x) + C ≡ (8.1.46) ≡ f ′ (x) · g(x) + f (x) · g ′ (x) d x ≡ (8.1.65) ≡
ˆ ˆ
≡ f ′ (x) · g(x) d x + f (x) · g ′ (x) d x (8.1.72)
1 x4
ˆ
−5 d x = 2x+ +3 cos x−5 arctg x+C
Применение формулы линейности. Пока- 1+x 2 4
жем, как применяется формула (8.1.65). ⋄ 8.1.37.
§ 1. Неопределенный интеграл 463
ˆ
√ 2
ˆ
x+
1
d x ≡ x 2 d x+ Теперь покажем, чем может быть полезно вы-
cos2 x несение из-под знака дифференциала.
1 2 3
ˆ
+2 d x = x 2 + 2 tg x + C ⋄ 8.1.41.
cos2 x 3
y = 2x − 5
ˆ
10
(2x − 5) d x = =
x = y+5
Внесение под знак дифференциала и при- 2
менение формулы замены переменной. 1
ˆ ˆ
= y 10 d y+5
2 = y 10
dy =
Формулу (8.1.67) удобно применять, предвари- y=2x−5 2 y=2x−5
тельно договорившись о следующем обозначе- 1 1
нии: для всякой функции f пусть символ d f (x) = y 11 + C = (2x − 5)11 + C =
2 · 11 y=2x−5 2 · 11
обозначает выражение f ′ (x) d x: 1
= (2x − 5)11 + C
d f (x) = f ′ (x) · d x (8.1.73) 22
⋄ 8.1.42.
В частности, интеграл g(f (x))·f ′ (x) d x в левой y = 1 + √x
´
dx
ˆ
части (8.1.67) можно тогда переписать в таком √ = =
1 + x x = (y − 1)2
виде:
d (y − 1)2
ˆ
= √ =
ˆ ˆ
g(f (x)) · f ′ (x) d x = g(f (x)) d f (x). y y=1+ x
ˆ
2(y − 1)dy
= √ =
Если используя это обозначение переписать фор- y y=1+ x
мулу (8.1.67) ˆ
1
ˆ =2 1− dy √ ≡
ˆ
y y=1+ x
g(f (x)) d f (x) ≡ g(y) d y , (8.1.74)
y=f (x) ≡ 2y − 2 ln |y| + C √ =
y=1+ x
то переход в ней от правой части к левой можно √ √
= 2(1 + x) − 2 ln(1 + x) + C
будет интерпретировать как замену переменной.
⊲⊲ 8.1.43. Найдите неопределенные интегралы:
• Переход от левой части к правой в формуле 1. ´ cosxln x d x
´
(8.1.73) называется вынесением из-под знака 2. √ cos2 x dx
sin x+3
дифференциала, а переход от правой части к ´ 2x
левой — внесением под знак дифференциала. 3. 1+x4 d x
´ etg x
4. ´ cos 2x dx
Покажем, какую пользу может принести вне- 2x−1
5. √1−x+x dx
2
сение под знак дифференциала. ´ 3x2 3
6. x3 +1 ln(x + 1) d x
⋄ 8.1.38. ´ arcsin x
7. e√1−x2 d x
ˆ ˆ ´ ex
8. √4−e dx
esin x · cos x d x = esin x d sin x =
´ sin x 2x
9. √ dx
ˆ ´ cos√x
3
= ey d y = ey + C = esin x + C 10. x 2x4 − 3 d x
y=sin x y=sin x ´ x5
11. √7−x dx
´ cos x6
⋄ 8.1.39. 12. √3+sin x d x
1
ˆ ˆ
cos 3x d x = cos 3x · 3 d x = Интегрирование по частям. Прежде, чем
3
1
ˆ
1
ˆ перейти к обсуждению формулы (8.1.68), пере-
= cos 3x d 3x = cos y d y = пишем ее в следующем виде, используя формулу
3 3 y=3x
внесения под знак дифференциала (8.1.73):
1 1
= sin y + C = sin 3x + C ˆ ˆ
3 y=3x 3 f (x) d g(x) ≡ f (x)·g(x)− g(x) d f (x) (8.1.75)
⋄ 8.1.40.
⋄ 8.1.44.
sin x
ˆ ˆ ˆ
tg x d x = dx = ln x d x = интегрирование =
cos x по частям
− sin x d x d cos x
ˆ ˆ ˆ
=− dx = − = = ln x · x − x d ln x =
cos x cos x
d y
ˆ
1
ˆ ˆ
=− ≡ − ln |y| + C = = ln x · x − x · d x = ln x · x − 1 d x =
y y=cos x y=cos x x
= − ln | cos x| + C = ln x · x − x + C
464 Глава 8. ИНТЕГРАЛ
ˆ
⋄ 8.1.45. = x2 sin x − 2 x sin x d x =
ˆ ˆ ˆ
xex d xH = x d ex = интегрирование
по частям = = x sin x + 2 x d cos x = интегрирование
2
=
по частям
ˆ
= xex − ex d x = xex − ex + C
ˆ
= x2 sin x + 2 x cos x − cos x d x =
⋄ 8.1.46. = x2 sin x + 2 (x cos x − sin x − C1 ) =
ˆ ˆ = x2 sin x + 2x cos x − 2 sin x + C
xsin x d x = − x d cos x = интегрирование
по частям =
ˆ ⊲⊲ 8.1.51. Найдите интегралы:
= − x cos x + cos x d x = 1) x2 sin x d x
´
´ 2 −x
= − (x cos x + sin x + C1 ) = −x cos x − sin x + C 2) x e d x
3) x ln2 x d x
´
⋄ 8.1.47. 4) x3 d cos x,
´
5) cos x d x3 ,
´
1
ˆ ˆ
2 3 интегрирование
x ln x d @x = ln x d x = по частям = 6) x d ex .
´
3
1
ˆ
= ln x · x3 − x3 d ln x = Случается, что интегрирование по частям
3
приводит к исходным интегралам. В таких слу-
1 1
ˆ
== ln x · x3 − x3 · d x = чаях нужно поступать следующим образом.
3 x
1 ⋄ 8.1.52.
ˆ
= ln x · x3 − x2 d x =
3
ˆ ˆ
1 3 1 3 1 3 1 3 e sin x d > x = sin x d ex = интегрирование
x
=
= ln x · x − x + C = ln x·x − x +C по частям
3 3 3 9 ˆ
⊲⊲ 8.1.48. Найдите интегралы: = ex sin x − ex W d sin x =
´ ln x ˆ
x x
´
1) ´ x22xd x 6) sin2 x d x = e sin x − ex cos x d > x =
2) ´√
´ xe d x 7) x ln x d x ˆ
3) ´ arctg x d x ´ n = ex sin x − cos x d ex = интегрирование =
4) 8) x ln x d x по частям
´ x cos x d x ´ ˆ
5) x arctg x d x 9) arcsin x d x
= ex sin x − ex cos x − ex d cos x =
Иногда бывает необходимо применять фор- ˆ
x x
мулу интегрирования по частям несколько раз. = e sin x − e cos x + ex W d cos x =
⋄ 8.1.49.
ˆ
= ex sin x − ex cos x − ex sin x d x
ˆ ˆ
x2 ex d xH = x2 d ex = интегрирование
по частям =
ˆ ˆ Мы вернулись к исходному интегралу. Если те-
перь обозначить
= x2 ex − ex U d x2 = x2 ex − 2 ex x d xD =
ˆ ˆ
= x e − 2 x d ex = интегрирование
2 x
по частям = I= ex sin x d x,
ˆ
= x2 ex − 2 xex − ex d x = то мы получим уравнение
(8.1.76), которое мы получили, является равенством классов функций. Символ I обозначает в нем класс функций,
представимых в виде F (x) + A, где F — некоторая фиксированная первообразная для подынтегральной функции.
Равенство (8.1.76) поэтому формально означает высказывание
∀A ∃B ∀x F (x) + A = ex sin x − ex cos x − (F (x) + B),
В нем если выразить F (x) через все остальное, то мы получим высказывание
1 x
∀A ∃B ∀x F (x) = (e sin x − ex cos x) − A − B,
2
Из него следует, что любая первообразная F к функции ex sin x имеет вид
1 x
F (x) = (e sin x − ex cos x) − A − B
2
где A, B – какие-то константы. В частности, в качестве первообразной можно выбрать функцию
1 x
F (x) = (e sin x − ex cos x) .
2
И это нам дает ответ (8.1.77).
7 Здесь, как и в примере 8.1.52, в наших рассуждениях имеется небрежность, см. по этому поводу подстрочное
примечание 6.
466 Глава 8. ИНТЕГРАЛ
1 1
ˆ
= In − (x2 + a2 )−(n+1) ·x d (x6 2 + a2 ) = Интегрирование рациональных функций
a2 2a2
1 1
ˆ • Рациональной функцией называется всякая
2 2 −n интегрируем
= 2 In + x d(x +a ) = по частям = функция R(x), которую можно представить
a 2na2
в виде отношения двух многочленов:
1 1 2 2 −n
= 2 In + 2
x · (x + a ) −
a ˆ2na P (x)
1 2 2 −n
R(x) =
− (x + a ) d x = Q(x)
2na2
1 1 x 1 dx ⋄ 8.1.59. Например, функции
ˆ
= 2 In + 2 2 2 n
− 2 2 2 n
=
a 2na (x + a ) 2na (x + a )
1 1 x 1 x2 + x + 1 2x + 1
= 2 In + − I = , 3
, x5 − 2x + 1
a 2na2 (x2 + a2 )n 2na2
n x − 2 x −x+5
1 x 2n − 1 являются рациональными, а функции
= 2
· 2 2 n
+ · In
2na (x + a ) 2na2
x
sin x, √ , 2x
x−3
Теперь покажем, как применяется рекуррент- не являются рациональными.
ная формула (8.1.81).
В этом параграфе мы покажем, как вычисля-
⋄ 8.1.56. Вычислим, например, интеграл I2 . Для
ются интегралы от рациональных функций.
этого в формулу (8.1.81) подставим n = 1:
1
⋄ 8.1.61 (простейшая дробь 2 типа). Здесь так- 3y +
ˆ
2
= dy =
3
же можно найти общую формулу y2 + 4
y 1 1
ˆ ˆ
A y =x−a =3 d y + dy =
ˆ
dx = = 2
y +4 3 2 y + 43
2
(x − a)n x=y+a
в первом интеграле
A dy
ˆ ˆ
= вносим y под знак =
= d(y + a) = A ≡ дифференциала
yn y=x−a y n y=x−a
3 dy 2 1 1
ˆ ˆ
A A = + dy =
≡ +C = +C 2 y 2 + 34 2 y 2 + 43
(n − 1)y n−1 y=x−a (n − 1)(x − a)n−1
в первом интеграле
!
⋄ 8.1.62 (простейшая дробь 3 типа). Здесь, хо- =
делаем замену
=
y 2 = z − 34
тя и можно вывести общую формулу, но запом- z = y 2 + 43
нить ее уже будет вряд ли возможно. Поэтому
3 d z − 34 1 dy
ˆ ˆ
мы приведем лишь общий план действий. Чтобы = + =
вычислить интеграл 2 z y=z− 43 z=y+ 34 2 y 2 + 43
3 dz 1 dy
ˆ ˆ
ˆ
Bx + C = 2 3+ √ 2 =
dx (p2 − 4q < 0) 2 z z=y + 4 2
x2 + px + q y 2 + 23
применяем
нужно сначала выделить полный квадрат в зна- = формулы ≡
менателе, то есть переписать знаменатель так, (8.1.54) и (8.1.61)
3 1 2 2y
чтобы переменная x встречалась только один
≡ ln |z| + · √ · arctg √ + C =
раз: 2 z=y 2 + 43 2 3 3
3 3 1 2y
p p 2 p 2 = ln y 2 + + √ · arctg √ + C =
x2 + px + q = x2 + 2 · ·x+ − +q = 2 4 3 3
2 2
2 возвращаемся
p 2 p2 = к исходной =
= x+ + q− переменной x
2 4 2
3 1 3 1 2 x − 12
а затем выражение в скобках заменить на новую = ln x − + + √ ·arctg √ +C =
2 2 4 3 3
переменную:
p 3 1 2x − 1
x+ =y = ln x2 − x + 1 + √ · arctg √ +C =
2 2 3 3
Оказывается, что при этом мы получим таблич- всегда
= x2 − x + 1 > 0 =
ные интегралы.
Приведем иллюстрацию. Пусть требуется вы- 3 1 2x − 1
= ln x2 − x + 1 + √ · arctg √ +C
числить интеграл 2 3 3
ˆ
3x − 1 ⋄ 8.1.63 (простейшая дробь 4 типа). Для таких
d x дробей вывести общую формулу и вовсе невоз-
x2 − x + 1
можно. План действий же состоит в следующем.
Поскольку дискриминант знаменателя отрицате- Чтобы вычислить интеграл
лен, ˆ
Bx + C
p2 − 4q = 1 − 4 = −3 < 0 dx (n ∈ N, n > 1, p2 −4q < 0)
(x + px + q)n
2
выражение под интегралом действительно явля- нужно, как и в предыдущем случае, сначала вы-
ется простейшей дробью третьего типа. Выделим делить полный квадрат у квадратного трехчлена
полный квадрат в знаменателе: в знаменателе,
2 2 p p 2 p 2
2 2 1 1 1 x 2
+ px + q = x2
+ 2 · · x + − +q =
x −x+1 = x −2· ·x+ − +1 = 2 2
2 2 2 2
2 2 p 2 p2
1 1 1 3 = x + + q −
= x− + 1− = x− + 2 4
2 4 2 4
затем выражение в скобках заменить на новую
Теперь делаем замену переменной в интеграле: переменную:
p
x+ =y
ˆ
3x − 1
ˆ
3x − 1 2
dx = 2 dx = При этом получится несколько интегралов, из
x2 − x + 1 x − 21 + 43
ˆ которых одни окажутся табличными, а другие
y = x− 1 1
3 y + − 1 1 можно будет вычислить с помощью рекуррент-
= 2 = 2
d y+ =
x = y + 12 y 2 + 34 2 ных формул §7.
468 Глава 8. ИНТЕГРАЛ
x2 + 2x + 3 = x2 + 2 · 1 · x + 12 − 12 + 3 = (x + 1)2 + 2 x+1 x3 x2 − 2x + 1
, , ,
x2 +x+1 (x2 − 1)(x2 + 4) x3
Теперь делаем замену переменной в интеграле:
будут правильными, а дроби
x−1 x−1
ˆ ˆ
dx = dx = x2 + 1 x3 x2 − 2x + 1
(x2 + 2x + 3) 2 2 , , ,
((x + 1)2 + 2) x2 + x + 1 (x − 1)(x + 4) x
ˆ
y = x+1 y−2 – неправильными.
= = d(y − 1) =
x=y−1 (y 2 + 2)2
Для интегрирования правильных дробей
y−2 y dy dy
ˆ ˆ ˆ
= d y = −2 = нужно научиться пользоваться следующей клас-
(y 2 + 2)2 (y 2 + 2)2 (y 2 + 2)2 сической теоремой.
1 dy 2 dy
ˆ ˆ
= −2 = Теорема 8.1.66. Всякая правильная дробь одно-
2 (y 2 + 2)2 (y 2 + 2)2
значным образом раскладывается в сумму про-
1 d(z − 2) dy
ˆ ˆ
= 2 −2 = стейших дробей.
2 z2 z=y +2 (y 2 + 2)2
Мы не будем доказывать этот результат, а
1 dz dy
ˆ ˆ
= − 2 √ 2 2 = лишь объясним как он работает. Для этого по-
2 z 2 z=y2 +2 лезно запомнить следующие
y2 + 2
применяем 1 Правила разложения на простейшие дроби:
= формулы ≡− −
(8.1.53) и (8.1.82) 2z z=y2 +2
— если в разложении знаменателя Q(x) на мно-
y 1 y
−2 + √ · arctg √ + C = жители имеется множитель (x − a)n
4(y 2 + 2) 2( 2)3 2
1 Q(x) = ... · (x − a)n · ...
=− −
2(y 2 + 2) то в разложении правильной дро-
P (x)
y 1 y би в сумму простейших дробей
−2 + √ · arctg √ + C = Q(x)
4(y 2 + 2) 2( 2)3 2 должны присутствовать слагаемые вида
A1 A2 An
1 y 1 y x−a , (x−a)2 , ..., (x−a)n :
=− − − √ · arctg √ + C =
2(y 2 + 2) 2(y 2 + 2) 2 2 2
√ P (x) A1 A2 An
y+1 2 y = ...+ + 2
+...+ +...
=− − · arctg √ + C = Q(x) x − a (x − a) (x − a)n
2
2(y + 2) 4 2
— если в разложении знаменателя Q(x) на мно-
возвращаемся
= к исходной = жители имеется множитель (x2 +px+q)n (p2 −
переменной x
√ 4q < 0)
x+2 2 x+1
=− − · arctg √ + C Q(x) = ... · (x2 + px + q)n · ...
2(x2 + 2x + 3) 4 2
⊲⊲ 8.1.64. Вычислите интегралы: то в разложении правильной дро-
P (x)
би Q(x) в сумму простейших дробей
´ dx
1) x−7 ;
´ x dx
7) x2 +7x+13 ; должны присутствовать слагаемые вида
B1 x+C1 B2 x+C2 Bn x+Cn
x2 +px+q , (x2 +px+q)2 , ..., (x2 +px+q)n :
´ dx
8) 3x24x+8
´
2) 3−x ; +2x+5 d x;
9) 2x2x+5
´ dx ´
3) 1+5x ; +2x+3 d x; P (x) B1 x + C1 B2 x + C2
= ...+ 2 + 2 +...
´ dx ´ 5x−7
4) (3x+2)2 ; 10) 8x2 +x+1 d x; Q(x) x + px + q (x + px + q)2
3x+5
´
dx 11) (x2 +2x+2)2 d x;
´
5) x2 +2x+1 ; Bn x + Cn
´ dx
´ 3x+2
12) (x2 −3x+3) ... + 2 + ...
6) 4x2 −4x+1 ; 2 d x. (x + px + q)n
§ 1. Неопределенный интеграл 469
Покажем теперь на примерах, что эти прави-
A + B + C = 9
A + B + C = 9
ла означают. 2B − 2C = −2 ⇔ B − C = −1 ⇔
⋄ 8.1.67 (случай неповторяющихся множителей −4A = −8 A=2
первой степени). Рассмотрим интеграл
2 + B + C = 9 B + C = 7
ˆ
9x2 − 2x − 8 ⇔ B − C = −1 ⇔ B − C = −1 ⇔
dx
x3 − 4x A=2 A=2
Разложим знаменатель дроби на множители:
B + C = 7
B + C = 7
⇔ 2B = 6 ⇔ B=3 ⇔
x3 − 4x = x(x2 − 4) = x(x − 2)(x + 2)
A=2 A=2
В соответствии с первым правилом, это означа-
3 + C = 7
C = 4
ет, что в разложении нашей (правильной) дроби ⇔ B=3 ⇔ B=3
в сумму простейших дробей должны присутство-
A=2 A=2
вать следующие слагаемые:
A B C Мы нашли коэффициенты A, B, C методом
, ,
x x−2 x+2 неопределенных коэффициентов. Теперь пока-
жем, как их можно было найти по-другому, а
То есть,
именно методом частных значений.
9x2 − 2x − 8 A B C Еще раз рассмотрим равенство (8.1.67):
= + +
x3 − 4x x x−2 x+2
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2)
Теперь необходимо найти коэффициенты
A, B, C. Для этого приведем правую часть к
Оно должно выполняться при любом x. В част-
общему знаменателю
ности, при x = 0, x = 2 и x = −2. Посмотрим,
во что превращаются левая и правая части при
9x2 − 2x − 8
= этих значениях переменной:
x3 − 4x
A(x − 2)(x + 2) + Bx(x + 2) + Cx(x − 2) x = 0 : − 8 = −4A ⇒ A=2
=
x(x − 2)(x + 2)
x = 2 : 24 = 8B ⇒ B=3
Эти дроби действительно будут совпадать, если x = −2 : 32 = 8C ⇒ C =4
у них совпадают числители:
Эта запись означает, что при x = 0 равенство
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2)
(8.1.67) превращается в равенство −8 = −4A, от-
Далее коэффициенты A, B, C можно искать куда следует что A = 2, и т.д.
двумя разными методами. В общем, каким способом ни считай, получа-
Первый из них называется методом неопре- ется
деленных коэффициентов. Он состоит в следу-
A = 2
ющем. Сначала приведем подобные слагаемые B=3
справа:
C=4
9x2 − 2x − 8 = (A + B + C)x2 + (2B − 2C)x − 4A
Мы получаем, что
Слева и справа записаны многочлены от пере-
менной x. Они будут совпадать только если у них 9x2 − 2x − 8 2 3 4
= + +
совпадают коэффициенты: x3 − 4x x x−2 x+2
3x + 2 2 2
ˆ ˆ ˆ
⋄ 8.1.68 (случай повторяющихся множителей d x = d x − d x−
первой степени). Рассмотрим интеграл x(x + 1)3 x x+1
2 1
ˆ ˆ
ˆ
3x + 2 − 2
d x + dx ≡
dx (x + 1) (x + 1)3
x(x + 1)3 2 1
≡ 2 ln |x| − 2 ln |x + 1| + − +E
Знаменатель дроби уже разложен на множители: x + 1 2(x + 1)2
(E – постоянная интегрирования).
x(x + 1)3
⋄ 8.1.69 (случай неповторяющихся множителей
В соответствии с первым правилом, в разложе- второй степени). Рассмотрим интеграл
нии нашей (правильной) дроби в сумму простей-
x3 − 2x + 2
ˆ
ших дробей должны присутствовать следующие dx
слагаемые: (x − 1)2 (x2 + 1)
Знаменатель дроби уже разложен на множители:
A B C D
, , ,
x x+1 (x + 1)2 (x + 1)3 (x − 1)2 (x2 + 1)
3x + 2 x3 − 2x + 2 A B Cx + D
= 2 2
= + 2
+ 2
x(x + 1)3 (x − 1) (x + 1) x − 1 (x − 1) x +1
A(x + 1)3 + Bx(x + 1)2 + Cx(x + 1) + Dx Чтобы найти коэффициенты A, B, C, D, приве-
= дем правую часть к общему знаменателю
x(x + 1)3
x2 +x−1 dx
´ ´
Эти дроби совпадают, если у них совпадают чис- 1) x3 +x2 −6x d x;
7) (x2 +2)(x−1)2 ;
лители: ´ dx x3 +3x2 −3x+1
2) (x+1)(x−2) ;
´
8) (x+1)2 (x2 +1) d x;
xdx
´
x3 + 3 = A(x2 + 1)2 + 3) 3x2 −3x−2 ; 9)
´ 3 2
3x −x −4x+13
d x;
x2 (x2 −4x+13)
2x+11
´
2
+ (Bx + C)(x + 1)(x + 1) + (Dx + E)(x + 1) 4) (x2 +6x+13)2 d x; ´ 4x −8x2
10) (x−1)2 (x2 +1)2 d x;
x2 d x
´
5) (x+2)2 (x+4)2 ;
´ x 2
Теперь коэффициенты A, B, C, D, E ищем, 11) (x2 +2x+2)2 d x;
dx
´
комбинируя метод частных значений с методом 6) x3 (x−1) ;
´ 3 2
x +2x +3x+4
неопределенных коэффициентов. 12) x4 +x3 +2x2 d x.
x2 2x + 23
ˆ
Теперь надо подумать о том, как вычислить ин-
≡ + ln |x − 1| + 1 dx ≡
теграл от второго слагаемого (то есть от полу- 2 x2 + x + 2
ченной правильной дроби). Для этого разложим x2
знаменатель на множители: ≡ + ln |x − 1|+
2
2x3 − x − 1 = (x − 1)(2x2 + 2x + 1) 2x + 32
ˆ
+ 2 2 dx =
x2 + 2 · 21 x + 21 − 12 + 21
В соответствии с первым и вторым правилами,
x2 2x + 23
ˆ
в разложении нашей (правильной) дроби в сум- = + ln |x − 1| + dx =
2
му простейших дробей должны присутствовать 2 x + 12 + 41
следующие слагаемые:
y = x + 1 x2
= 2 = + ln |x − 1|+
A Bx + C x = y − 21 2
,
x−1 2x2 + 2x + 1 2 y − 12 + 32 1 x2
ˆ
+ 2 1 d y − = +
Значит, y +4 2 y=x+ 2 1
2
ˆ
2y + 12
6x2 + x − 2 A Bx + C
+ ln |x − 1| + d y =
= + y 2 + 41 y=x+ 12
2x3 − x − 1 x − 1 2x2 + 2x + 1
x2 2y d y
ˆ
Чтобы найти коэффициенты A, B, C, приведем = + ln |x − 1| + +
2 y 2 + 14 y=x+ 12
правую часть к общему знаменателю
1 dy x2
ˆ
6x2 + x − 2 A(2x2 + 2x + 1) + (Bx + C)(x − 1) + = + ln |x − 1|+
= 2 y 2 + 41 y=x+ 12 2
3
2x − x − 1 (x − 1)(2x2 + 2x + 1)
d y 2 + 14 1 dy
ˆ ˆ
+ 1 + 2 =
Эти дроби совпадают, если у них совпадают чис- 2
y +4 y=x+ 21
2 2
y + 2 1 y=x+ 21
лители:
применяем x2
= формулы = + ln |x − 1|+
6x2 + x − 2 = A(2x2 + 2x + 1) + (Bx + C)(x − 1) (8.1.54) и (8.1.61) 2
1
Теперь коэффициенты A, B, C ищем, комби- + ln y 2 + + arctg(2y) +D =
4 y=x+ 21 y=x+ 12
нируя метод частных значений с методом неопре- 2 !
деленных коэффициентов. x2 1 1
= + ln |x − 1| + ln x+ + +
2 2 4
x=1: 5 = 5A
2 1
x : 6 = 2A + B + arctg 2 x + +D =
2
0
x : −2=A−C
x2 2 1
= +ln |x−1|+ln x + x + +arctg(2x+1)+D
Получается система 2 2
A = 1
A = 1 (D – постоянная интегрирования).
2A + B = 6 ⇔ ... ⇔ B=4
⊲⊲ 8.1.76. Вычислите интегралы:
A − C = −2 C =3
x5 +x4 −8 x3 +x2 +x+3
´ ´
Значит, 1) x3 −4x d x; 4) (x+3)(x2 +x+1) d x;
3x3 +5x2 −25x−1 x9
´
2) d x;
´
(x+2)(x−1)2 5) (x4 −1)2 d x.
6x2 + x − 2 1 4x + 3 ´ x5 −2x2 +3
3
= + 2 3) x2 −4x+4 d x;
2x − x − 1 x − 1 2x + 2x + 1
Отсюда Интегрирование рациональных тригоно-
метрических функций
2x4 + 5x2 − 2
=
2x3 − x − 1 Рациональной функцией от двух переменных u и
6x2 + x − 2 1 4x + 3 v называется любая функция R, которую можно
=x+ 3 =x+ + 2 представить как дробь
2x − x − 1 x − 1 2x + 2x + 1
и теперь можно вычислять исходный интеграл: P (u, v)
R(u, v) = ,
Q(u, v)
2x4 + 5x2 − 2
ˆ ˆ
d x = x d x+
2x3 − x − 1 где P и Q — многочлены от двух переменных.
1 4x + 3 Это то же самое, что сказать, что выражение
ˆ ˆ
+ dx + dx ≡ R(u, v) составленно из u и v и констант с помо-
x−1 2x2 + 2x + 1
474 Глава 8. ИНТЕГРАЛ
(8.1.85)
ˆ
2dt 1 + t
x = arcsin t,
=
≡ ln +C
dt
1 − t2 1 − t dx = √1−t 2
§ 1. Неопределенный интеграл 475
2) cos5 x sin2 x d x
´
R(− sin x, − cos x) = R(sin x, cos x) ´ sin3 x
3) 1+cos 2x dx
то применима подстановка ´ cos3 x
4) 4 sin2 x−1 d x
tg x = t, dx
´
5) 3 cos2 x+4 sin2 x
t
sin x = √ , 6) 19 sin2 x−8dx
´
1+t2 sin x cos x−3
1 (8.1.86)
cos x = √1+t2 ,
x = arctg t,
Интегрирование тригонометрических про-
dt
dx = 1+t 2 изведений
⋄ 8.1.81. Для интегрирования некоторых специальных
тригонометрических функций полезно знать “до-
подынтегральная
ˆ
sin3 x функция нечетна полнительные хитрости”, которые мы обсудим в
d x = относительно sin x = этом параграфе.
cos x − 3 поэтому используем
подстановку cos x = t
√ 3
Интегрирование функций sin ax·cos bx, sin ax·
ˆ 2
1 − t2 dt t −1
ˆ
=− √ = dt =
t−3 1−t 2 t−3 sin bx, cos ax · cos bx Для интегрирования таких
ˆ 8
произведений применяются тригонометрические
= делим многочлены
с остатком = t + 3 + dt ≡ тождества (5.1.83)-(5.1.85). Рассмотрим приме-
t−3
ры.
t2
≡ + 3t + 8 ln |t − 3| + C = квозвращаемся
переменной x =
2 ⋄ 8.1.85.
cos2 x
= + 3 cos x + 8 ln | cos x − 3| + C ˆ
2
sin 4x sin 6x d x = (5.1.83) =
⋄ 8.1.82.
1
ˆ
= (cos(4x − 6x) − cos(4x + 6x)) d x =
подынтегральная
ˆ
cos x3 функция нечетна 2
относительно
dx = cos x = 1 1
ˆ ˆ
sin4 x поэтому используем = cos 2x d x − cos 10x d x =
подстановку sin x = t 2 2
√ 3 1
ˆ
1
ˆ
1 − t2 dt 1 − t2 = cos 2x d(2x) − cos 10x d(10x) =
ˆ ˆ
= √ = dt = 4 20
t4 1 − t2 t4
1 1
ˆ
1 1 1 1 = sin 2x − sin 10x + C
= − 2 dt = − 3 + + C = 4 20
t 4 t 3t t
1 1 ⊲⊲ 8.1.86. Найдите интегралы
возвращаемся
= к переменной x = − + +C
1) cos x3 sin x4 d x
´
3 sin x
3 sin x ´
⋄ 8.1.83. 2) cos 4x cos 7x d x
3) sin x3 sin x2 d x
´
dx
ˆ ´
= 4) sin 3x cos 10x d x
2
sin x − 4 sin x cos x + 5 cos2 x 5) sin 3x sin2 x d x
´
подынтегральная
функция четна
= относительно sin x и cos x =
поэтому используем Интегрирование функций sinα x·cosβ x Для
подстановку tg x = t интегрирования таких произведений нужно за-
ˆ dt помнить следующие правила:
1+t2
= 2 2 =
√ t −4· √ t · √ 1 +5 √ 1 — если α – нечетное положительное целое число
1+t2 1+t2 1+t2 1+t2 (то есть α ∈ 2N − 1), то делается подстановка
dt dt
ˆ ˆ
= = =
t2 − 4t + 5 (t − 2)2 + 1 cos x = t,
ˆ
t−2=y dy sin x = √1 − t2 ,
= =
= (8.1.87)
t=y+2 y 2 + 1 y=t−2 x = arccos t,
dt
= arctg y + C = arctg(t − 2) + C = d x = − √1−t 2
y=t−2
= квозвращаемся
переменной x = arctg(tg x − 2) + C — если β – нечетное положительное целое число
476 Глава 8. ИНТЕГРАЛ
2
(то есть β ∈ 2N − 1), то делается подстановка 1 − cos 2x 1 + cos 2x
ˆ
= · dx =
2 2
sin x = t, 1 − cos 2x 1 + 2 cos 2x + cos2 2x
ˆ
cos x = √1 − t2 ,
= · dx =
(8.1.88) 2 4
x = arcsin t, 1
ˆ
= (1 + cos 2x − cos2 2x − cos3 2x) d x =
dt
d x = √1−t 2 8
ˆ
1 1 + cos 4x 1 + cos 4x
= 1 + cos 2x − − cos 2x d x =
— если α + β – четное отрицательное целое чис- 8 2 2
ло (α + β ∈ −2N), то делается подстановка 1
ˆ
= (1 + cos 2x − cos 4x − cos 4x cos 2x) d x =
16
tg x = t,
применяем
= формулу
t (5.1.84) =
sin x = √1+t2 ,
1
ˆ
1
cos x = √1+t1
2,
(8.1.89) = 1 + cos 2x − cos 4x − (cos 2x + cos 6x) dx =
16 2
x = arctg t, 1
ˆ
= (2 + cos 2x − 2 cos 4x − cos 6x) d x =
dt
dx = 1+t 2 32
1 1 1 1
— если α и β – четные неотрицательные целые = 2x + sin 2x − sin 4x − sin 6x + C =
числа (α, β ∈ 2(N − 1)), то применяются фор- 32 2 2 6
мулы понижения степени: x sin 2x sin 4x sin 6x
= + − − +C
16 64 64 192
1 − cos 2x 1 + cos 2x
sin2 x = , cos2 x = ⊲⊲ 8.1.90. Найдите интегралы
2 2
⋄ 8.1.87. (8.1.90)
sin5 x cos4 x d x dx
´ ´
поскольку 1) 6) √ 4 3 x cos5 x
ˆ p 3 ´ sin
sin 5 x cos5 x d x 7) ´ cos2 x d x
´
3 = 3 ∈ 2N − 1, 2)
sin x cos x d x = β подстановка
2 3
=
3)
´
√ sin3 x
dx 8) ´ cos4 x d x
sin x = t 3
ˆ √ p 3
cos4 x 9) ´sin4 x d x
dt dx
´
=
3
t2 1 − t2 √ = 4) sin3 x cos x 10) ´ sin4 x cos2 x d x
1 − t2 dx
11) cos6 x d x
´
ˆ 5) √
ˆ
2 2 8
sin x cos3 x
= t 3 (1 − t2 ) d t = t3 − t3 d t =
Интегрирование некоторых алгебраиче-
3 5 3 11 ских иррациональностей.
= t 3 − t 3 + C = квозвращаемся
переменной x =
5 11 √
3 5 3 11
Интегрирование функций R(x, n x), n ∈ N.
= (sin x) 3 − (sin x) 3 + C = Если R(x, y) – рациональная функция от пере-
5 11 √
3p3 3 p3
менных x и y, то функция R(x, n x) интегриру-
= sin5 x − sin11 x + C ется заменой
5 11
√
⋄ 8.1.88. t= nx (x = tn , d x = ntn−1 dt)
поскольку ⋄ 8.1.91.
ˆ
dx α + β = − 72 − 12 =
√ = = −4 ∈ −2N, = √ √ 3
cos x sin x x ( 6 x)
ˆ ˆ
7 подстановка
tg x = t √3
dx = √ 4 dx =
x − x2 x − ( 6 x)
ˆ dt ˆ dt √ ˆ
= r 1+t2
= 1+t2 t= 6x t3
7
1
2 √ = = x = t65 = 6t5 dt =
√ 1 √ t 1+t2 t dx = 6t dt t − t4
6
1+t2 1+t2
t4 делим
ˆ
ˆ
1 + t2 =6 dt = многочлены =
ˆ
1 3
= √ dt = t− 2 + t 2 d t = t2 − 1 с остатком
t ˆ
1
1 2 5 =6 t2 + 1 + 2 dt =
= 2t 2 + t 2 + C = квозвращаемся
переменной x = t −1
5 q ˆ
√ 2 2 1
= 2 tg x + tg5 x + C =6 t +1+ dt =
5 (t − 1)(t + 1)
раскладываем
⋄ 8.1.89. = на простейшие =
дроби
ˆ
поскольку 1 1 1 1
ˆ α = 2 ∈ 2(N − 1), =6 2
t +1+ − dt =
2t−1 2t+1
sin2 x cos4 x d x = β = 4 ∈ 2(N − 1), =
применяем формулы
(8.1.90) = 2t3 + 6t + 3 ln |t − 1| − 3 ln |t + 1| + C =
§ 1. Неопределенный интеграл 477
√ 3 √
возвращаемся возвращаемся
= к переменной x = 2 6 x + 6 6 x+ = =
к переменной x
√ √ s
+ 3 ln 6 x − 1 − 3 ln 6 x + 1 + C
2
1 1 1 23
= √ ln x − + x− + + C =
⊲⊲ 8.1.92. Найдите интегралы 2 4 4 16
r
√ √
1 1 1 3
1)
´
√x
dx 3)
´ x
√ dx
1+ x 1+ 4
x = √ ln x − + x2 − x + + C
´ dx 2 4 2 2
2) √ √
(1+ 3 x)· x
q ⋄ 8.1.96.
Интегрирование функций R x, cx+d , n ∈ n ax+b
dx 1 dx
ˆ ˆ
N. Интегралы такого вида вычисляются заме- √ = √ q =
5 − 2x − 3x 2 3 5 2 2
ной r 3 − 3 x − x
n ax + b
t= 1 dx t = 1
+x
ˆ
cx + d =√ q = x = 3t − 31 =
3 16 1
2 dx = dt
⋄ 8.1.93. 9 − 3 +x
1 dt 1 3t
ˆ
q = √ q = √ arcsin + C =
r 1−x
1 1−x t = 1+x 3 2 3 4
ˆ
4
· d x = x = 1−t 2 = 3 − t2
(1 − x) 2 1+x 1+t2
dx = − (1+t4tdt 1 1 + 3x
= квозвращаемся
2 )2
переменной x = √ arcsin +C
1 4tdt 3 4
ˆ
=− 2 · t =
1−t2 (1 + t2 )2
1 − 1+t 2 ⊲⊲ 8.1.97. Найдите интегралы
2 2 2
(1 + t ) 4t dt dt 1
ˆ ˆ
=− =− = +C = 1) √5x2dx dx
´ ´
4 2 2 2 2) √2+3x−2x
4t (1 + t ) t t +3x+2 2
r1 + x √
= квозвращаемся
переменной x = +C Интегрирование функций R x, ax2 + bx + c
1−x Выделением полного квадрата и последующей
√
заменой функция R x, ax 2 + bx + c приводит-
⊲⊲ 8.1.94. Найдите интегралы
´ √1+x ся к виду
1) x dx p
´ √ 3
3x+4 R x, a 2 − x2 ,
2) 1+ √ 3
3x+4
dx
q p
1
3) (1−x)(1+x)2 · 1+x
´
1−x d x R x, x 2 + a2 ,
´ q
4) 3 1−x dx
1+x · (1+x)2 p
R x, x2 − a2
Интегрирование функций √ax2 +bx+c 1
После а затем делается тригонометрическая подстанов-
выделения полного квадрата под знаком радика- ка:
ла интегралы этого вида сводятся к следующим:
— для
— если a > 0, то получаем табличный ин-
ˆ p
R x, a2 − x2 d x
теграл
1
ˆ
√ dx используется подстановка
x2 + A
— если a < 0, то получаем табличный ин- x = a sin t (или x = a cos t)
теграл
1 — для
ˆ
√ dx ˆ p
2
B −x 2
R x, x2 + a2 d x
⋄ 8.1.95. используется подстановка
dx 1 dx
ˆ ˆ
= √ q = x = a tg t (или x = a ctg t)
2x2 − x + 3 2 x − 12 x + 32
2
— для
1 dx t = x − 41 p
ˆ ˆ
= √ q = x = t + 41 =
2 2 23 dx = dt R x, x2 − a2 d x
x − 14 + 16
r используется подстановка
1
ˆ
dt 1 23
a
=√ q 2
= √ ln t + t + + C =
2 2 16 a
t2 + 23
16
x= или x =
cos t sin t
478 Глава 8. ИНТЕГРАЛ
⋄ 8.1.98. ⋄ 8.1.100.
x= 1
dx
ˆ
dx x = 3 sin t cos t
ˆ
√ = 1 =
√ = t = arcsin x3 = 2
(x + 2) x − 1 2
t
dx
=
=
arccos
sin t
x
d t
(x2 + 16) 9 − x2 dx = 3 cos tdt cos 2 t
sin t
cos2 t d t cos t d t
ˆ ˆ
3 cos tdt
ˆ
= p = = q 1 =
1 + 2 cos2 t
=
(9 sin t + 16) 9 − 9 sin2 t
2 1
2
cos t + 2 2
cos t − 1
3 cos tdt ˆ
ˆ
cos t d t ds
ˆ
= = sin t = s
2
(9 sin t + 16)3 cos t = 2 = ds = cos tdt = =
3 − 2 sin t 3 − 2s2
применяем частную
1 1
ˆ
подстановку (8.1.86) применяем
ˆ
dt = q 2 d s = формулу (8.1.63) =
= = tg t = s
= 2 3
2
9 sin t + 16 sin t = √ s 2 2 − s2
1+s
dt = ds q
1+s2 3 + s
ds 1 2
ds = √ ln q + C = возвращаемся =
ˆ ˆ
1+s2
= 2 =
9s2 + 16(1 + s2 )
= 2 6 3 − s к переменной t
9 √ s + 16 2
1+s2 q
3 + sin t
ds 2
ˆ
1
= = = √ ln q + C = возвращаемся =
25s2 + 16 2 6 3 − sin t к переменной x
1 ds 1 5s 2
ˆ
= 2 = arctg +C = q
25 2
s + 5 4 20 4 3 + sin arccos 1
1 2 x
= √ ln q +C =
= квозвращаемся
1 5 tg t 2 6 3 − sin arccos 1
переменной t = arctg +C = 2 x
20 4
q q
1 5 tg arcsin x3 3 + 1− 1
= квозвращаемся
переменной x = arctg +C = 1 2 x 2
20 4 = √ ln q q +C =
x
2 6 3 − 1 − 12
5q 3 x 2 2 x
1 1−( 3 ) 1 5x √ √ √
= arctg +C = arctg √ +C
20 4 20 4 9 − x2 1 x 3 + 2 x2 − 1
= √ ln √ √ √ +C
2 6 x 3 − 2 x2 − 1
⋄ 8.1.99.
⊲⊲ 8.1.101. Найдите интегралы
x = ctg t
x2 − x + 1
ˆ
√ d x = t = arcctg x = dx x2
´ ´
1) 3 4) 3 dx
(x2 + 1) x2 + 1 dt
dx = − sin2t
2
(9+x ) 2 2
(x +5) 2
ctg2 t − ctg t + 1 2) √ dx 2 3 5) √ dx 2 3
´ ´
dt
ˆ
=− p · 2 =
(5−x ) (1+x+x )
2 2
(ctg t + 1) ctg t + 1 sin t ´ √
x2 −4
´ √
1+x2
3) x3 dx 6) 2+x2 d x
ctg2 t − ctg t + 1 dt
ˆ
=− · 2 =
dx
´
1
· 1
sin t 7) √
(x2 +4) 4x2 +1
dx
sin2 x sin x
ˆ
= − (ctg2 t − ctg t + 1) sin x d t = Интегрирование функций xm · (a + bxn )p ,
заметим, что
m, n, p ∈ Q. Интегралы от таких функций вы-
= ctg2 t + 1 = 12 = ражаются через элементарные функции только
sin t
ˆ если одно из чисел
1
=− − ctg t sin x d t = m+1 m+1
sin2 t p, , +p
ˆ n n
1
=− − cos t d t = является целым. В соответствии с этим следует
sin t
употреблять три различных подстановки:
dt первый интеграл
ˆ ˆ
=− + cos t d t = мы уже вычисляли = — если p целое отрицательное (p ∈ −N) и
sin t в примере 8.1.77
t
m = qs , n = rs , то используется подста-
= − ln tg + sin t + C = квозвращаемся
переменной x =
новка
2 x = ts
arcctg x
= − ln tg + sin arcctg x + C = — если m+1 целое ( m+1 ∈ Z), то исполь-
2 n n
зуется подстановка
применяем
= тригонометрические = a + bxn = t
тождества
1
p
— если m+1 m+1
n + p целое ( n + p ∈ Z), то
= √ + ln x + 1 + x2 + C используется подстановка
1 + x2
ax−n + b = t
§ 2. Определенный интеграл 479
√ √
⋄ 8.1.102. 1 t y= t
ˆ
=−
dt = t =y 2 =
4 (t − 1)2 dt = 2ydy
ˆ
3 2
x3 (1 − x2 )− 2 d x = 1 y 1 y
ˆ ˆ
=− 2 2
2ydy = − dy =
4 (y − 1) 2 (y − 1)2
2
здесь m = 3, n = 2, p = − 23
= раскладываем дробь
m+1
и n =2∈Z =
= поэтому применяем = на простейшие
подстановку !
t = 1 − x2 , xdx = − 1 dt 1 1 1 1 1
ˆ
4 4 4 4
2 =− + − + dy =
2 y−1 (y − 1)2 y+1 (y + 1)2
1 1
ˆ ˆ
− 23 3 1
=− (1 − t)t dt = − (t− 2 − t− 2 ) d t = =
1
ln |y − 1| −
1 1
+ ln |y + 1| +
1
+C =
2 2 8 8(y − 1) 8 8(y + 1)
1 1
= t− 2 + t 2 + C = квозвращаемся 1 y + 1 y
переменной x = = ln + +C =
8 y−1 2
4(y − 1)
1 p √ √
= √ + 1 − x2 + C 1 t + 1 t
1 − x2 = к переменной t = ln √
возвращаемся +
+C =
8 t − 1 4(t − 1)
⋄ 8.1.103.
= квозвращаемся
переменной x =
√ √
здесь m = 1, n = 4, p = 21
m+1 1 x−4 + 1 + 1 x−4 + 1
ˆ p и n +p=1∈Z
= ln √ + +C =
поэтому применяем 8 x−4 + 1 − 1 4x−4
x 1 + x4 d x = подстановку = √
1 1 + x4 + x2 x2 p
1
t = x−4 + 1, x = (t −5 1)− 4
−
dx = − 41 (t − 1) 4 dt
= ln √ + 1 + x4 + C
q 8 1 + x4 − x2 4
1
ˆ
1 1 5
=− (t − 1)− 4 1 + (t − 1)− 4 ·4 (t − 1)− 4 dt =
4 ⊲⊲ 8.1.104. Найдите интегралы
1 3p
ˆ
=− (t − 1)− 2 1 + (t − 1)−1 d t = ´ √
x
r 3
4 1) √ 2 dx ´ 4 1
√ (1+ 3 x) 5) 1 + x2 dx
1 t
ˆ
2
− 23 x√5 (1 + x2 ) 3
´
=− (t − 1) √ dt = 2) dx ´ √2− √
3 x
4 t−1 √
√ 3)
´ 4+ 3 x
√ dx 6) √
3
x
dx
3 2
1 t
ˆ
3
´ √ p
x
√
=− (t − 1)− 2 √ dt = √ dx
´
4) 3
3 3
x· 1 + 3 x2 d x 7) dx
4 t−1 x2 3
(1+x3 )2
§2 Определенный интеграл
Определенный интеграл функции f на отрезке [a; b] есть величина, геометрический смысл которой
– площадь криволинейной трапеции, ограничиваемой графиком функции f (при условии, что f
неотрицательна на [a; b]):
y = f (x)
S =?
x
a b
Точный смысл этих слов вряд ли может быть сейчас понятен читателю, поскольку в школьном
курсе геометрии не объясняется, что такое площадь фигуры (мы же даем соответствующие строгие
определения лишь в главе 16). Но всякий раз, когда вводится новое определение, полезно, чтобы
слушатель держал в голове какую-то геометрическую картинку, упрощающую понимание соот-
ветствующих формальных определений и математических результатов. В случае с определенным
интегралом такой картинкой, несомненно, будет площадь криволинейной трапеции (понимаемая
пока на интуитивном уровне).
480 Глава 8. ИНТЕГРАЛ
В этой главе мы даем формальное определение этому новому понятию, приводим способ его
вычисления и описываем некоторые приложения.
√
⋄ 8.2.1. Система точек τ = {0; 12 ; 1; 2; 2} яв- ⊲ 8.2.2. Проверьте, что следующие системы то-
ляется разбиением отрезка [0; 2], потому что эти чек являются разбиениями данных отрезков и
числа образуют строго возрастающую конечную найдите диаметр этих разбиений:
последовательность, у которой концы совпадают 1) τ = {0; 32 ; 54 ; 11
5 ; 3}, [a; b] = [0; 3]
с концами отрезка [0; 2]: 2) τ = {−1; − 21 ; − 14 ; 0; 14 ; 21 ; 1}, [a; b] = [−1; 1]
√ √
1 √ 3) τ = {1; 2; 3; 2}, [a; b] = [1; 2]
0< <1< 2<2
2
Диаметр этого разбиения равен
1 1 √ √ √
diam τ = max ; ; 2 − 1; 2 − 2 = 2 − 2
2 2
Понятно, что у любого отрезка имеется много всяких разбиений. Поэтому можно рассматривать
последовательности разбиений.
diam τ (n) −→ 0
n→∞
называется измельчающейся.
§ 2. Определенный интеграл 481
n
⊲ 8.2.4. Проверьте, будут ли следующие после- 2) τ (n) = 0; 21n ; 22n ; ...; 2in ; ...; 2 2−1
n ;1
y = f (x)
ξ1 ξ2 ξ3 ξ4 ξk−1
x
a x1 x2 x3 xk−1 b
Представим теперь, что разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] меняются, становясь все более
мелкими. Тогда площадь ступенчатой фигуры должна приближаться к числу, которое естественно
считать "площадью криволинейной трапеции о которой мы говорили в начале этой главы.
y = f (x)
x
a b
Это число называется определенным интегралом функции f на отрезке [a; b]. Более точное опреде-
ление выглядит так:
• Число I называется определенным интегралом функции f на отрезке [a; b], и обозначается
ˆ
I= f (x) d x
[a,b]
∈
[xi−1 ; xi ]
y
ξ1 ξ2 ξk−1
x
x1 x2 xk−1 1
C
Криволинейная трапеция в данном случае
представляет собой треугольник, поэтому отве-
том должна быть площадь треугольника S =
x 1 1
ξ ξ 1 ξ
2 2 · 1 · 1 = 2 (половина произведения основания на
k−1
a x1 x2 x b высоту).
k−1
ˆ k
X Заметим такую формулу:
f (x) d x = lim f (ξi ) · ∆xi =
diam τ →0 k
X
[a,b] i=1
k k
(xi−1 + xi ) · ∆xi = 1. (8.2.93)
X X i=1
= lim C · ∆xi = lim C· ∆xi =
diam τ →0 diam τ →0
i=1 i=1
| {z } Доказывается она так:
b−a
k
X
= lim C · (b − a) = C · (b − a)
diam τ →0 (xi−1 + xi ) · ∆xi =
Запишем вывод: i=1
ˆ k
X
C d x = C · (b − a) (8.2.92) = (xi + xi−1 ) · (xi − xi−1 ) =
[a,b] i=1
§ 2. Определенный интеграл 483
k
X k
X [0; 1] и любых точек ξi ∈ [xi−1 ; xi ]:
= (x2i − x2i−1 ) = (−x2i−1 + x2i ) =
k
i=1 i=1 X 1
0 1 f (ξi ) · ∆xi − 6 diam τ
2
=
k ↓ ↓ ↓ ↓ ↓ ↓ i=1
= (− x20 + x21 ) + (−x21 + x22 ) + ... +(−x2k−1 + x2k ) =
| {z } | {z } | {z }
Если
(n) (n) (n)
теперь τ (n) = {x0 ; x1 ; ...; xkn } –
i=1 i=2 i=k
какая-нибудь измельчающая последователь-
= 1. (n)
ность разбиений с выделенными точками ξi ∈
Теперь мы получим: (n) (n)
[xi−1 ; xi ], то мы получаем
Pk
1
· i=1 (xi−1 + xi ) · ∆xi
ξi 2 k(n)
X
=
(8.2.93)
1
=
0
0
⋄ 8.2.7. Интеграл от функции Дирихле. По-
1
Xk
= · (ξi − xi−1 ) + (ξi − xi ) · ∆xi 6 кажем, что определенный интеграл не всегда су-
i=1
2 ществует. Классическим примером здесь являет-
6 (4.1.11) 6 ся функция Дирихле, которую мы определили
Xk выше формулой (4.1.4):
1
6 · |ξi − xi−1 | + |ξi − xi | · ∆xi 6 (
2 | {z } | {z }
i=1 1, если x – рациональное число
>
>
D(x) =
∆xi , ∆xi , 0, если x – иррациональное число
поскольку поскольку
ξi ∈ [xi−1 ; xi ] ξi ∈ [xi−1 ; xi ]
k k
Попробуем понять, что будет интегралом этой
X ∆xi + ∆xi X
6 · ∆xi = ∆x ·∆xi 6 функции на произвольном отрезке [a; b]. Выбе-
2 |{z}i рем какое-нибудь разбиение τ = {x0 ; x1 ; ...; xk }
i=1 i=1
>
diam τ
отрезка [a; b].
Точки ξi ∈ [xi−1 ; xi ] можно выбирать по-
k
X разному, но нас будут интересовать два способа:
6 diam τ · ∆xi =
i=1 – первый способ заключается в том, чтобы
k
X в каждом отрезке [xi−1 ; xi ] выбрать какую-
= diam τ · ∆xi = diam τ нибудь рациональную точку ξi . Тогда полу-
i=1
| {z } чится D(ξi ) = 1, и интегральные суммы ока-
жутся равны b − a:
=
1
k
X k
X
Мы получили неравенство, справедливое для D(ξi ) · ∆xi = 1 · ∆xi = b − a
любого разбиения τ = {x0 ; x1 ; ...; xk } отрезка i=1 i=1
484 Глава 8. ИНТЕГРАЛ
– второй способ заключается в том, чтобы в а для второго способа получим, что они стремят-
каждом отрезке [xi−1 ; xi ] выбрать какую- ся к нулю:
нибудь иррациональную точку ξi . Тогда полу-
(n)
чится D(ξi ) = 0, и интегральные суммы ока- k
X (n) (n)
жутся равны 0: D(ξi ) · ∆xi = 0 −→ 0
n→∞
i=1
k
X k
X
D(ξi ) · ∆xi = 0 · ∆xi = 0
Спросим себя теперь: существует ли единое чис-
i=1 i=1 ло I, к которому бы стремились все интеграль-
Если теперь взять измельчающуюся последо- ные суммы, независимо от того, какая выбрана
(n) (n) (n)
вательность разбиений τ (n) = {x0 ; x1 ; ...; xk } измельчающаяся последовательность разбиений
(n)
отрезка [a; b], τ (n) = {x0 ; x1 ; ...; xk } и какие выбраны точки
(n) (n) (n)
diam τ (n) −→ 0 ξi ∈ [xi−1 ; xi ]? Понятно, что такого числа I
n→∞
´
(то есть интеграла [a,b] D(x) d x) не существует.
(n)
то выбрав точки ξi первым способом, мы полу- Значит, мы можем сделать
чим, что интегральные суммы стремятся к числу Вывод: функция Дирихле не интегрируема
b − a: ни на каком отрезке [a; b].
(n)
k
X (n) (n)
D(ξi ) · ∆xi = b − a −→ b − a
n→∞
i=1
Суммы Дарбу. Пусть функция f определена и ограничена на отрезке [a; b] и пусть τ = {x0 ; x1 ; ...; xk }
– какое-нибудь его разбиение. На каждом отрезке [xi−1 ; xi ] найдем нижнюю и верхнюю грань функ-
ции f
mi = inf f (ξ), Mi = sup f (ξ)
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
и обозначим
k
X k
X
sτ = mi · ∆xi , Sτ = Mi · ∆xi
i=1 i=1
τ ⊆σ
то
s τ 6 s σ 6 Sσ 6 Sτ (8.2.95)
(то есть, при добавлении к данному разбиению τ новых точек нижняя сумма Дарбу
увеличивается, а верхняя уменьшается).
20 . Для любых двух разбиений σ и τ данного отрезка выполняется неравенство
s σ 6 Sτ (8.2.96)
причем нижняя сумма Дарбу есть нижняя грань всех интегральных сумм при данном
разбиении, а верхняя сумма Дарбу – верхняя грань:
k
X k
X
sτ = inf f (ξi ) · ∆xi , Sτ = sup f (ξi ) · ∆xi (8.2.98)
ξi ∈[xi−1 ;xi ] ξi ∈[xi−1 ;xi ] i=1
i=1
40 . Если функция f интегрируема на [a, b], то для произвольного разбиения τ отрезка [a, b]
интеграл от f лежит между нижней и верхней суммами Дарбу:
ˆ
sτ 6 f (x) d x 6 Sτ (8.2.99)
[a,b]
x∗ ∈ [xj−1 ; xj ] (8.2.100)
и поэтому
k
X X X
sτ = mi · ∆xi = mj · ∆xj + mi · ∆xi = mj · (xj − xj−1 ) + mi · ∆xi = (8.2.100) =
i=1 i6=j i6=j
X
= inf f (ξ) ·(xj − x∗ ) + inf f (ξ) ·(x∗ − xj−1 ) + mi · ∆xi 6
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ]
| {z } | {z } i6=j
>
>
k
X X X
Sτ = Mi · ∆xi = Mj · ∆xj + Mi · ∆xi = Mj · (xj − xj−1 ) + Mi · ∆xi = (8.2.100) =
i=1 i6=j i6=j
X
= sup f (ξ) ·(xj − x∗ ) + sup f (ξ) ·(x∗ − xj−1 ) + Mi · ∆xi >
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ] i6=j
| {z } | {z }
6
σ ⊆ ρ, τ ⊆ρ
486 Глава 8. ИНТЕГРАЛ
k
X k
X k
X
sτ = inf f (ζi ) · ∆xi 6 f (ξi ) · ∆xi 6 sup f (ζi ) · ∆xi 6 Sτ ,
ζi ∈[xi−1 ;xi ]
i=1 i=1 i=1 ζi ∈[xi−1 ;xi ]
Поэтому, чтобы, например, доказать первое равенство в (8.2.98), достаточно доказать обратное
неравенство:
Xk
sτ > inf f (ξi ) · ∆xi (8.2.101)
ξi ∈[xi−1 ;xi ]
i=1
Для этого (зафиксировав разбиение τ = {x0 , ..., xk }) для каждого i = 1, ..., k выберем последова-
(n)
тельность точек ξi ∈ [xi−1 ; xi ] такую, что
(n)
f (ξi ) −→ inf f (ξi )
n→∞ ξi ∈[xi−1 ;xi ]
k
X k
X k
X
(n) (n)
inf f (ξi ) · ∆xi 6 inf f ξi · ∆xi = lim f ξi · ∆xi =
ξi ∈[xi−1 ;xi ] n→∞ n→∞
i=1 i=1 i=1
k
X k
X
(n)
= lim f ξi · ∆xi = inf f (ξi ) · ∆xi = sτ
n→∞ ξi ∈[xi−1 ;xi ]
i=1 i=1
(8.2.95) (8.2.97) k
X (8.2.97) (8.2.95)
sτ 6 sσ 6 f (ξi ) · ∆xi 6 Sσ 6 Sτ
i=1
[a,b]
f (x) d x
• Верхняя грань всех нижних сумм Дарбу для функции f на отрезке [a; b]
I∗ = sup sτ
τ
называется нижним интегралом Дарбу, а нижняя грань всех верхних сумм Дарбу
I ∗ = inf Sτ
τ
§ 2. Определенный интеграл 487
называется верхним интегралом Дарбу. Из неравенства (8.2.96) следует, что для любых
двух разбиений σ и τ данного отрезка выполняются неравенства
sσ 6 I∗ 6 I ∗ 6 Sτ (8.2.102)
Если вдобавок функция f интегрируема на [a, b], то эту цепочку можно дополнить так:
ˆ
sσ 6 I∗ 6 f (x) d x 6 I ∗ 6 Sτ (8.2.103)
[a,b]
Критерий интегрируемости.
Теорема 8.2.9 (критерий интегрируемости). 8 Ограниченная на отрезке [a; b] функция f тогда и
только тогда интегрируема на [a; b], когда для всякой измельчающейся последовательности τ (n)
разбиений отрезка [a; b]
diam τ (n) −→ 0
n→∞
соответствующие верхняя и нижняя суммы Дарбу стремятся друг к другу:
Sτ (n) − sτ (n) −→ 0 (8.2.104)
n→∞
В этом случае (для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b])
суммы Дарбу необходимо стремятся к интегралу от f на [a, b]:
ˆ
Sτ (n) −→ f (x) d x ←− sτ (n) (8.2.105)
n→∞ [a,b] ∞←n
Доказательство. 1. Необходимость. Пусть f интегрируема на [a; b], покажем что тогда выполняется
(8.2.104). Возьмем какую-нибудь измельчающуюся последовательность разбиений τ (n) отрезка [a; b].
Из левой формулы (8.2.98)
Xk
sτ = inf f (ξi ) · ∆xi ,
ξi ∈[xi−1 ;xi ]
i=1
(n)
следует, что для всякого n можно выбрать точки ξi ∈ [xi−1 ; xi ] так, чтобы
k
X 1
(n)
sτ − f ξi · ∆xi 6
n
i=1
Тогда мы получим
k
X
(n)
sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1
Теперь вспомним, что, по предположению, функция f интегрируема на [a; b], то есть существует
такое число I, что
Xk
(n)
f ξi · ∆xi −→ I (8.2.106)
n→∞
i=1
(n)
для всякой измельчающейся последовательности τ (n) и любой системы точек ξi ∈ [xi−1 ; xi ]. В
частности, это должно быть верно для нашей последовательности τ (n) и выбранной нами системы
(n)
точек ξi ∈ [xi−1 ; xi ]. Отсюда
!
k
X k
X
(n) (n)
sτ (n) = sτ (n) − f ξi · ∆xi + f ξi · ∆xi −→ 0 + I = I
n→∞
i=1 i=1
8 Эта теорема используется ниже при доказательстве теорем 8.2.10 и 8.2.11.
488 Глава 8. ИНТЕГРАЛ
k
X
Sτ = sup f (ξi ) · ∆xi ,
ξi ∈[xi−1 ;xi ] i=1
(n)
следует, что для всякого n можно выбрать (новые) точки ξi ∈ [xi−1 ; xi ] так, чтобы
Xk 1
(n)
Sτ − f ξi · ∆xi 6
n
i=1
Тогда мы получим
k
X
(n)
Sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1
sτ (n) −→ I, Sτ (n) −→ I
n→∞ n→∞
Sτ (n) − sτ (n) −→ 0
n→∞
I∗ = I ∗ ,
0 6 I ∗ − I∗ 6 Sτ (n) − sτ (n) −→ 0.
n→∞
Теперь положим
I = I∗ = I ∗
и покажем, что I является интегралом функции f на отрезке [a; b].
Для этого опять возьмем измельчающуюся последовательность τ (n) разбиений отрезка [a; b]. Из
неравенств (8.2.102) получаем две цепочки:
(n)
Теперь из формулы (8.2.97) при произвольном выборе точек ξi ∈ [xi−1 ; xi ] мы получаем
k
X (n) (n)
sτ (n) 6 f (ξi ) · ∆xi 6 Sτ (n)
| {z } | {z }
i=1
n n
↓ ↓ ↓ ↓
∞ ∞
I I
Это верно для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b] и любой
(n) (n) (n)
системы выделенных точек ξi ∈ [xi−1 ; xi ], значит I действительно является интегралом для f
на [a; b]. Это нам и нужно было доказать.
Теорема 8.2.10. Если функция f интегрируема на отрезке [a; b], то она ограничена на нем.
sup f (x) = +∞
x∈[a;b]
Мы получили, что для всякого разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] можно выбрать числа
ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M .
Значит, если взять измельчающуюся последовательность разбиений τ (n) , то для нее тоже можно
(n) (n) (n)
выбрать числа ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M :
(n)
k
X
f (ξi ) · ∆xi > M
i=1
490 Глава 8. ИНТЕГРАЛ
Отсюда следует, что интеграл (то есть предел таких интегральных сумм), если он существует, не
может быть меньше M :
(n)
k
X
I = lim f (ξi ) · ∆xi > M
n→∞
i=1
Но число M мы выбирали произвольным: получается, что число I должно быть больше какого
хочешь другого числа M , а это абсурд.
k
X k
X k
X
= (f (xi ) − f (xi−1 )) · ∆xi 6 (f (xi ) − f (xi−1 )) · diam
| {z τ} = diam τ · (f (xi ) − f (xi−1 )) =
|{z}
i=1 i=1 не зависит i=1
>
от индекса i,
diam τ поэтому можно
вынести за знак суммы
=
n ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ o
= diam τ · f (xk ) − f (xk−1 ) + f (xk−1 ) − f (xk−2 ) + ... +f (x2 ) − f (x1 ) + f (x1 ) − f (x0 ) =
| {z } | {z } | {z } | {z }
i=k i=k−1 i=2 i=1
= diam τ · {f (b) − f (a)}
Если теперь взять измельчающуюся последовательность разбиений τ (n) отрезка [a; b], то мы полу-
чим
0 6 Sτ (n) − sτ (n) 6 (8.2.108) 6 diam τ (n) · {f (b) − f (a)} −→ 0
n→∞
значит,
Sτ (n) − sτ (n) −→ 0
n→∞
Это верно для любой измельчающейся последовательности разбиений τ (n) , значит, по теореме 8.2.9,
f интегрируема на [a; b].
Обозначив теперь
α = ηj , β = θj
мы получим нужные числа: с одной стороны, поскольку α, β ∈ [xj−1 ; xj ], получается
|α − β| 6 ∆xj 6 ∆ τ
А, с другой стороны,
!
f (α) − f (β) = max f (ηi ) − f (θi ) = max sup f (x) − inf f (x) (8.2.113)
16i6k 16i6k x∈[xi−1 ;xi ] x∈[xi−1 ;xi ]
Поэтому
k k k
" #
X X X
Sτ −sτ = sup f (ξ)·∆xi − inf f (ξ)·∆xi = sup f (ξ) − inf f (ξ) ·∆xi 6
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1 ξ∈[xi−1 ;xi ] i=1 i=1 ξ∈[xi−1 ;xi ]
| {z }
>
(8.2.113)
f (α) − f (β)
Xk h i h i k
X h i
6 f (α) − f (β) ·∆xi = f (α) − f (β) · ∆xi = f (α) − f (β) · (b − a)
i=1 | {z } i=1
не зависит
| {z }
от индекса i длина отрезка [a,b]
Из первого условия следует, что последовательности α(n) и β (n) стремятся друг к другу:
α(n) − β (n) −→ 0
n→∞
Поэтому по теореме Кантора 4.3.32 (функция f непрерывна на [a; b], значит она должна быть
равномерно непрерывна на нем), получаем:
f (α(n) ) − f (β (n) ) −→ 0
n→∞
(n)
Это верно для любой измельчающейся последовательности разбиений τ , значит, по теореме 8.2.9,
f интегрируема на [a; b].
492 Глава 8. ИНТЕГРАЛ
то ˆ ˆ
f (x) d x 6 g(x) d x (8.2.118)
[a,b] [a,b]
70 . Непрерывность: если функция f интегрируема на отрезке [a; b], то для всякой точки
c ∈ [a, b]
ˆ ˆ
f (x) d x −→ f (x) d x (8.2.121)
[a,y] y→c [a,c]
ˆ ˆ
f (x) d x −→ f (x) d x (8.2.122)
[y,b] y→c [c;b]
Для всякого разбиения τ = {x0 , ..., xk } отрезка [a; b] и любой системы выделенных точек ξi ∈
[xi−1 ; xi ] мы получим:
k
X k
X k
X
α · f (ξi ) + β · g (ξi ) · ∆xi = α · f (ξi ) · ∆xi +β · g (ξi ) · ∆xi −→ α·F +β·G
diam τ →0
i=1 i=1 i=1
| {z } | {z }
diam τ diam τ
↓ ↓ ↓ ↓
0 0
F G
Это нужно понимать так: если взять последовательность разбиений τ (n) , диаметры которых стре-
(n)
мятся к нулю, то какую ни выбирай систему выделенных точек ξi , интегральная сумма функции
α·f +β ·g будет стремится к числу α·F +β ·G. То есть, функция α·f +β ·g получается интегрируемой,
и ˆ ˆ ˆ
α · f (x) + β · g(x) d x = α · F + β · G = α · f (x) d x + β · g(x) d x
[a,b] [a,b] [a,b]
3. Аддитивность. Пусть для начала нам дано, что функция f интегрируема на отрезках [a; b] и
[b; c]. Тогда по теореме 8.2.10, f ограничена на отрезках [a; b] и [b; c], а значит и на отрезке [a; c]:
Возьмем разбиение τ = {x0 , ..., xk } отрезка [a; c]. Точка b попадет в какой-то полуинтервал (xj−1 , xj ]:
τ = {a = x0 < x1 < ... < xj−1 < b 6 xj < xj+1 < ... < xk = c}
интегральная сумма
на отрезке [a; c]
z }| {
X k j−1
X k
X
f (ξi ) · ∆xi = f (ξi ) · ∆xi + f (ξj ) · ∆xj + f (ξi ) · ∆xi =
i=1 i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) + f (ξj ) − f (b) · ∆xj + f (ξi ) · ∆xi =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · ∆xj + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · (xj − xj−1 ) + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
xj − xj−1
k
j−1
X z }| { k
X
= f (ξi ) · ∆xi + f (b) · (b − xj−1 − b + xj ) + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · (b − xj−1 ) + f (b) · (xj − b) + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj
i=1 i=j+1
| {z } | {z }
интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]
интегральная сумма
на отрезке [a; c] интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]
z }| z }| {
z }| { !{
X k j−1
X Xk
f (ξi ) · ∆xi − f (ξi ) · ∆xi + f (b) · (b − xj−1 ) − f (b) · (xj − b) + f (ξi ) · ∆xi =
i=1 i=1 i=j+1
| {z } | {z }
diam τ
diam τ
↓ ↓
↓ ↓
0
0
A B
= f (ξj ) − f (b) · ∆xj 6 f (ξj ) + f (b) · ∆xj 6 2M · diam τ −→ 0
| {z } | {z } |{z} diam τ →0
>
>
>
M M diam τ
⇓
k
X
f (ξi ) · ∆xi −→ A+B
diam τ →0
i=1
Опять же, это нужно понимать так, что какую ни возьми последовательность разбиений τ (n) от-
(n)
резка [a, c], с диаметрами стремящимися к нулю, то при любом выборе выделенных точек ξi ,
интегральные суммы функции f на отрезке [a, c] будут стремиться к числу A + B. Это нам и нужно
было доказать.
Теперь для завершения доказательства свойства 20 нам еще нужно проверить, что из интегри-
руемости функции f на отрезке [a, c] следует ее интегрируемость на отрезках [a, b] и [b, c]. Мы
докажем это для отрезка [a, b] (для [b, c] это делается по аналогии). Итак, будем считать, что
(n) (n)
функция f интегрируема на отрезке [a, c]. Пусть τ (n) = {x0 , ..., xk(n) } – измельчающаяся после-
довательность разбиений отрезка [a; b]. Ее можно дополнить до какой-нибудь последовательности
(n) (n) (n) (n)
ρ(n) = {x0 , ..., xk(n) , xk(n) +1 , ..., xl(n) } разбиений отрезка [a, c] так, чтобы она тоже была измельчаю-
щейся. Мы тогда получим:
(n) (n)
k
X k
X
0 6 Sτ (n) − sτ (n) = sup f (ξ) · ∆xi − inf f (ξ) · ∆xi =
ξ∈[xi−1 ;xi ]
i=1 ξ∈[xi−1 ;xi ] i=1
§ 2. Определенный интеграл 495
k (n) ! l (n) !
X X
= sup f (ξ) − inf f (ξ) · ∆xi 6 sup f (ξ) − inf f (ξ) · ∆xi =
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1 i=1
(n) (n)
l
X l
X
= sup f (ξ) · ∆xi − inf f (ξ) · ∆xi = Sρ(n) − sρ(n) −→ 0.
ξ∈[xi−1 ;xi ] n→∞
i=1 ξ∈[xi−1 ;xi ] i=1
⇓
Sτ (n) − sτ (n) −→ 0
n→∞
(n) (n)
Это верно для любой измельчающейся последовательности τ (n) = {x0 , ..., xk(n) } разбиений отрезка
[a; b], поэтому по теореме 8.2.9, функция f интегрируема на [a; b].
4. Монотонность. Пусть функции f и g интегрируемы на отрезке [a; b], причем
Тогда для любых разбиений τ = {x0 , ..., xk } отрезка [a; c] и любых точек ξi ∈ [xi−1 ; xi ] мы получим
∀i f (ξi ) 6 g (ξi )
⇓
∀i f (ξi ) · ∆xi 6 g (ξi ) · ∆xi
⇓
ˆ k
X k
X ˆ
f (x) d x ←− f (ξi ) · ∆xi 6 g (ξi ) · ∆xi −→ g(x) d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1
⇓
ˆ ˆ
f (x) d x 6 g(x) d x
[a,b] [a,b]
Действительно:
k
!
X
Sτ (|f |) − sτ (|f |) = sup |f (η)| − inf |f (θ)| · ∆xi = (4.1.29) =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
!
k
X k
X
= sup |f (η)| + sup − |f (θ)| · ∆xi = sup |f (η)| − |f (θ)| · ∆xi 6
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
k
X k
X
6 (4.1.12) 6 sup |f (η) − f (θ)| · ∆xi = (4.1.32) = sup (f (η) − f (θ)) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
!
k
X
= sup f (η) + sup − f (θ) · ∆xi = (4.1.29) =
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
k
!
X
= sup f (η) − inf f (θ) · ∆xi = Sτ (f ) − sτ (f )
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
Если теперь функция f интегрируема на отрезке [a; b], то по критерию интегрируемости (теоре-
ма 8.2.9 этой главы), для любой измельчающейся последовательности τ (n) разбиений отрезка [a; b]
разность между верхними и нижними суммами Дарбу для функции f должна стремиться к нулю,
поэтому из (8.2.125) получаем:
откуда
Sτ (n) (|f |) − sτ (n) (|f |) −→ 0
n→∞
То есть функция |f | тоже должна быть интегрируема на отрезке [a; b]. Нам остается доказать нера-
венство (8.2.119):
ˆ
Xk k
X ˆ
f (x) d x ←− f (ξi ) · ∆xi 6 (4.1.14) 6 |f (ξi )| · ∆xi −→ |f (x)| d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1
⇓
ˆ ˆ
f (x) d x 6 |f (x)| d x
[a,b] [a,b]
6. Оценка сверху. Если функция f интегрируема на отрезке [a, b], то по теореме 8.2.10, она
ограничена. Обозначим C = supx∈[a,b] |f (x)|. Тогда
ˆ
ˆ ˆ
f (x) d x 6 (8.2.119) 6 |f (x)| d x 6 C d x = (8.2.92) = (b − a) · C
[a,b] [a,b] [a,b]
| {z }
⇑ (8.2.118)
|f (x)| 6 C
7. Непрерывность. Из двух формул (8.2.121) и (8.2.122) мы докажем первую, имея в виду, что
вторая доказывается по аналогии:
ˆ ˆ
f (x) d x −→ f (x) d x
[a,y] y→c [a,c]
>
(8.2.116)
f (x) d x + cy f (x) d x
´ ´
[a,c] supx∈[c,y] |f (x)|
>
теорема 8.2.10
∞
8. Теорема о среднем. Пусть f непрерывна на отрезке [a; b]. Тогда по теореме Вейерштрасса об
экстремумах (теорема 4.3.28), найдутся такие точки α, β ∈ [a; b], что
откуда
1
ˆ
f (α) 6 · f (x) d x 6 f (β)
b−a [a,b]
§ 2. Определенный интеграл 497
1
´
Таким образом, число M = b−a · [a,b] f (x) лежит между значениями f (α) и f (β) непрерывной
функции f на отрезке [α; β]. Значит, по теореме Коши о промежуточном значении (теорема 4.3.22),
найдется точка ξ ∈ [α; β] ⊆ [a; b] такая что
1
ˆ
f (ξ) = · f (x) d x
b − a [a,b]
Действительно,
|f (η) · g(η) − f (θ) · g(θ)| = |f (η) · g(η) − f (θ) · g(η) + f (θ) · g(η) − f (θ) · g(θ)| 6
6 |f (η) · g(η) − f (θ) · g(η)| + |f (θ) · g(η) − f (θ) · g(θ)| = |f (η) − f (θ)| · |g(η)| + |f (θ)| · |g(η) − g(θ)| 6
6 |f (η) − f (θ)| · B + A · |g(η) − g(θ)|
Теперь, чтобы доказать, что f · g интегрируема на [a; b], возьмем разбиение τ отрезка [a; b] и оценим
разность между верхними и нижними суммами Дарбу для функции f (x) · g(x):
k
!
X
Sτ (f · g) − sτ (f · g) = sup f (η) · g(η) − inf f (θ) · g(θ) · ∆xi =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
k
X
= sup f (η) · g(η) − f (θ) · g(θ) · ∆xi 6 (8.2.126) 6
i=1 η,θ∈[xi−1 ;xi ]
k
X
6 sup B · f (η) − f (θ) + A · g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ]
k
X k
X
=B· sup f (η) − f (θ) · ∆xi + A · sup g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
= B · Sτ (f ) − sτ (f ) +A · Sτ (g) − sτ (g) −→ 0
| {z } | {z } diam τ →0
←−
←−
diam τ diam τ
↓ ↓
0 0
0, 0,
поскольку f поскольку g
интегрируема интегрируема
Далее, функция ϕ строго монотонна, значит она либо возрастает, либо убывает. Будем считать для
начала, что ϕ возрастает. Тогда
ϕ(α) = a, ϕ(β) = b, ϕ′ (x) > 0, x ∈ [α, β]
Рассмотрим произвольное разбиение τ = {t0 , ..., ti , ..., tk } отрезка [α, β] с выделенной системой точек
ζi ∈ [ti−1 , ti ]. Положив xi = ϕ(ti ) и ξi = ϕ(ζi ), мы получим разбиение отрезка [a, b], причем по
теореме Лагранжа 6.1.33, для некоторых точек ηi ∈ [ti−1 , ti ] будет выполняться равенство
∆xi = xi − xi−1 = ϕ(ti ) − ϕ(ti−1 ) = (6.1.34) = ϕ′ (ηi ) · (ti − ti−1 ) = ϕ′ (ηi ) · ∆ti
Если теперь взять ε > 0, то по теореме Кантора 4.3.32 найдется δ > 0 такое, что для любых
s, t ∈ [α, β] выполняется импликация:
ε
|s − t| < δ =⇒ |ϕ′ (s) − ϕ′ (t)| <
M · (β − α)
Поэтому если диаметр разбиения τ меньше δ, мы получим
X k
Xk X k
f ϕ(ζi ) · |ϕ′ (ζi )| ·∆ti − f (ξi ) · ∆xi = f (ξi ) · ϕ′ (ζi ) − ϕ′ (ηi ) · ∆ti 6
| {z } | {z } |{z}
i=1 i=1 i=1
=
=
=
k
X Xk
ε
6 |f (ξi )| · ϕ′ (ζi ) − ϕ′ (ηi ) ·∆ti < M · · ∆ti = ε
| {z } | {z } M · (β − α) i=1
i=1
| {z }
>
>
supx∈[a,b] |f (x)| ε
=
M ·(β−α)
=
β−α
M
Это означает, что при стремлении к нулю диаметра разбиения τ отрезка [α, β] интегральные суммы
стремятся друг к другу:
k
X k
X
f ϕ(ζi ) · |ϕ′ (ζi )| · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1
С другой стороны, диаметр соответствующего разбиения ϕ(τ ) = {x0 , ..., xk } отрезка [a, b] тоже при
этом будет стремиться к нулю, потому что
diam ϕ(τ ) = max ∆xi = max ϕ′ (ηi ) · ∆ti 6 max ϕ′ (t) · max ∆ti = max ϕ′ (t) · diam τ −→ 0
i i t∈[α,β] i t∈[α,β] diam τ →0
P
Значит интегральные суммы ki=1 f (ξi ) · ∆xi должны стремиться к интегралу [a,b] f (x) d x, и мы
´
получаем:
Xk k
X
f ϕ(ζi ) · |ϕ′ (ζi )| · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1
| {z }
diam ϕ(τ )
↓ ↓
´ 0
[a,b]
f (x) d x
§ 2. Определенный интеграл 499
То есть
k
X
ˆ
f ϕ(ζi ) · |ϕ′ (ζi )| · ∆ti −→ f (x) d x
diam τ →0 [a,b]
i=1
Остается рассмотреть случай, когда ϕ убывает. Тогда возрастающая последовательность
α = t0 < ... < ti < ... < tk = β
превращается в убывающую
b = x0 > ... > xi > ... > xk = a
Поэтому в интегральной сумме величину ∆xi нужно определять как разность xi−1 − xi , чтобы она
получилась положительной:
∆xi = − xi − xi−1 = − ϕ(ti ) − ϕ(ti−1 ) = (6.1.34) = −ϕ′ (ηi ) · (ti − ti−1 ) = −ϕ′ (ηi ) · ∆ti
Таким образом, после взятия модуля ничто не меняется, и все рассуждения можно оставить преж-
ними.
q
X z}|{ z }| { z }|{ z}|{
an · bn = ap ·bp + ap+1 ·bp+1 + ... + aq−1 ·bq−1 + aq ·bq =
n=p
= Ap bp + (−Ap + Ap+1 )bp+1 + ... + (−Aq−2 + Aq−1 )bq−1 + (−Aq−1 + Aq )bq =
= Ap bp − Ap bp+1 + Ap+1 bp+1 + ... −Aq−2 bq−1 + Aq−1 bq−1 − Aq−1 bq +Aq bq =
| {z } | {z } | {z } | {z }
=
9В
PN
(8.2.129) можно ввести третий параметр, число M < p, и тогда в обозначении AN = n=M an формула примет
более привычный вид:
Xq q−1
X
an · bn = An · (bn − bn+1 ) + Aq · bq − Ap−1 · bp ,
n=p n=p
500 Глава 8. ИНТЕГРАЛ
удовлетворяют неравенствам
m 6 An 6 M, (8.2.130)
а числа bn неотрицательны и невозрастают
bp > bp+1 > ... > bn > bn+1 > ... > bq > 0, (8.2.131)
то
q
X
m · bp 6 an · b n 6 M · b p . (8.2.132)
n=p
q
X q−1
X q−1
X
an · bn = (8.2.129) = An · (bn − bn+1 ) + Aq · bq > m · (bn − bn+1 ) + m · bq =
n=p n=p n=p
X
q−1 ↓ ↓ ↓ ↓↓ ↓ ↓ ↓
=m· (bn − bn+1 ) + bq =m· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +bq = m · bp .
n=p
| {z } | {z } | {z }
n=p n=p+1 n=q−1
И, во-вторых, цепочка
q
X q−1
X q−1
X
an · bn = (8.2.129) = An · (bn − bn+1 ) + Aq · bq 6 M · (bn − bn+1 ) + M · bq =
n=p n=p n=p
X
q−1 ↓ ↓ ↓
↓↓ ↓ ↓ ↓
=M· (bn − bn+1 ) + bq =M· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +bq = M · bp .
n=p
| {z } | {z } | {z }
n=p n=p+1 n=q−1
Обозначим N
X
A = max |AN | = max an (8.2.137)
p6N 6q p6N 6q
n=p
Тогда:
§ 2. Определенный интеграл 501
q q−1 q−1
X X X
an · bn = (8.2.129) = An · (bn − bn+1 ) + Aq · bq 6 |An | ·|bn − bn+1 | + |Aq | ·|bq | 6
n=p n=p n=p |{z} |{z}
>
>
(8.2.137)
A A
0
>
X
q−1 z }| {
(8.2.136)
X
q−1
6A· | bn − bn+1 | +|bq | = A · (bn − bn+1 ) + |bq | =
n=p
| {z } n=p
=
bn − bn+1
↓ ↓ ↓
↓↓ ↓
=A· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +|bq | =
| {z } | {z } | {z }
n=p n=p+1 n=q−1
= A · (bp − bq + |bq |) 6 A · (|bp | + |bq | + |bq |) 6 3 · A · max{|bp |, |bq |}
Формула Бонне. Ниже при доказательстве теоремы 9.1.37 нам понадобится следующее утвер-
ждение:
Теорема 8.2.18. Если f – интегрируемая, а g – монотонная функции на отрезке [a, b], то най-
дется точка ξ ∈ [a, b] такая, что
ˆ ˆ ˆ
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x (8.2.138)
[a,b] [a,ξ] [ξ,b]
• Равенство (8.2.138) называется формулой Бонне10 , а теорему 8.2.18 иногда называют вто-
рой теоремой о среднем для интеграла.
Для его доказательства нам, в свою очередь, понадобятся две леммы.
Лемма 8.2.19. Если f – интегрируемая, а g – неотрицательная невозрастающая функции на
отрезке [a, b], то
ˆ ˆ ˆ
g(a) · min f (x) d x 6 f (x) · g(x) d x 6 g(a) · max f (x) d x (8.2.139)
ξ∈[a,b] [a,ξ] [a,b] ξ∈[a,b] [a,ξ]
Для этого заметим, что функция f , будучи интегрирроуемой по Риману на [a, b], ограничена на
этом отрезке:
|f (x)| 6 C, x ∈ [a, b] (8.2.141)
Поэтому
n
X ˆ ˆ
g(xi−1 ) · f (x) d x − f (x) · g(x) d x =
[x ,x
i−1 i ] [a,b]
i=1 ˆ
X n X n ˆ X n ˆ
= g(xi−1 ) · f (x) d x − g(x) · f (x) d x = g(xi−1 − g(x)) · f (x) d x 6
i=1 [xi−1 ,xi ] i=1 [xi−1 ,xi ] i=1 [xi−1 ,xi ]
X n ˆ Xn ˆ
6 g(xi−1 ) − g(x) · |f (x)| d x 6 C · g(xi−1 ) − g(x) d x =
i=1 [xi−1 ,xi ] [xi−1 ,xi ] |
i=1
{z }
6
n
X X
n n
X
=C· g(xi−1 ) − g(xi ) · ∆xi = C · g(xi−1 ) ·∆xi − g(xi ) ·∆xi =
| {z } | {z }
i=1 i=1 i=1
k k
sup g(x) inf g(x)
x∈[xi−1 ,xi ] x∈[xi−1 ,xi ]
| {z } | {z }
k k
Sτ sτ
(верхняя интегральная (нижняя интегральная
сумма Дарбу) сумма Дарбу)
= C · Sτ − s τ −→ 0
diam τ →0
2. Обозначим ˆ t
F (t) = f (x) d x, m = min F (ξ), M = max F (ξ).
a ξ∈[a,b] ξ∈[a,b]
из которого мы получаем
ˆ ˆ
f (x) · g(x) d x = 0 = g(a) · f (x) d x.
[a,b] [a,ξ]
Если же g(a) 6= 0, то поскольку g неотрицательна, это означает, что g(a) > 0, и поделив (8.2.139) на
число g(a), мы получим двойное неравенство
1
ˆ ˆ ˆ
min f (x) d x 6 · f (x) · g(x) d x 6 max f (x) d x (8.2.143)
ξ∈[a,b] [a,ξ] g(a) [a,b] ξ∈[a,b] [a,ξ]
Если обозначить ˆ t
F (t) = f (x) d x,
a
то (8.2.143) можно будет переписать так:
1
ˆ
min F (t) 6 · f (x) · g(x) d x 6 max F (t)
t∈[a,b] g(a) [a,b] t∈[a,b]
лежит между некоторыми значениями mint∈[a,b] F (t) и mint∈[a,b] F (t) непрерывной функции F на
отрезке [a, b]. По теореме Коши о промежуточном значении 4.3.22, найдется точка ξ ∈ [a, b] такая,
что
1
ˆ
F (ξ) = · f (x) · g(x) d x.
g(a) [a,b]
Это и есть формула (8.2.142).
Доказательство теоремы 8.2.18. 1. Будем считать для начала, что g — неубывающая функция.
Рассмотрим функцию
G(x) = g(b) − g(x).
Она будет невозрастающей и неотрицательной функцией. Поэтому по лемме 8.2.20 найдется точка
ξ ∈ [a, b] такая, что ˆ ˆ
f (x) · G(x) d x = G(a) · f (x) d x
[a,b] [a,ξ]
⇓
ˆ ˆ
f (x) · g(b) − g(x) d x = g(b) − g(a) · f (x) d x
[a,b] [a,ξ]
⇓
ˆ ˆ ˆ ˆ
g(b) · f (x) d x − f (x) · g(x) d x = g(b) · f (x) d x − g(a) · f (x) d x
[a,b] [a,b] [a,ξ] [a,ξ]
⇓
ˆ ˆ ˆ ˆ
−g(b) · f (x) d x + f (x) · g(x) d x = −g(b) · f (x) d x + g(a) · f (x) d x
[a,b] [a,b] [a,ξ] [a,ξ]
⇓
ˆ ˆ ˆ ˆ
f (x) · g(x) d x = g(b) · f (x) d x − g(b) · f (x) d x +g(a) · f (x) d x
[a,b] [a,b] [a,ξ] [a,ξ]
| {z }
k
´ ´
g(b) · [a,b]
f (x) d x − [a,ξ]
f (x) d x
´ k
g(b) · [ξ,b]
f (x) d x
⇓
ˆ ˆ ˆ
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x.
[a,b] [a,ξ] [ξ,b]
§3 Формула Ньютона-Лейбница
Между двумя независимыми на первый взгляд понятиями – производной и определенным интегра-
лом, – как оказывается, существует глубокая связь. Эта связь устанавливается знаменитой форму-
лой Ньютона-Лейбница, которая считается главной в интегральном исчислении. Здесь мы погово-
рим об этой формуле.
504 Глава 8. ИНТЕГРАЛ
1 1
ˆ
= · f (t) d t = · f (ξ) · (x − c) = f (ξ) −→ f (c)
x−c [c,x] x − c x→c+0
| {z } | {z }
⇑
=
(8.2.123)
f (ξ) · (x − c), ξ −→ c
x→c+0
ξ ∈ [c, x] ⇑
ξ ∈ [c, x]
Таким образом,
F (x) − F (c)
lim = f (c) (8.3.149)
x→c+0 x−c
11 Понятие гладкой функции на отрезке было определено на с.497.
§ 3. Формула Ньютона-Лейбница 505
1 1
ˆ
=− · f (t) d t =− · f (ξ) · (c − x) = f (ξ) −→ f (c)
x−c [x,c] x−c x→c−0
| {z } | {z }
⇑
=
(8.2.123)
f (ξ) · (c − x), ξ −→ c
x→c−0
ξ ∈ [x, c] ⇑
ξ ∈ [x, c]
Таким образом,
F (x) − F (c)
lim = f (c) (8.3.150)
x→c−0 x−c
Формулы (8.3.149) и (8.3.150) вместе дают
F (x) − F (c)
F ′ (c) = lim = f (c), c ∈ (a; b)
x→c x−c
2. Теперь рассмотрим случай, когда c = a. Тогда аналогично пункту a) получаем равенство
F (x) − F (a)
lim = f (a)
x→a+0 x−a
3. Остается случай, когда c = b, который нужно рассмотреть по аналогии с пунктом b), и тогда
получится формула
F (x) − F (b)
lim = f (b)
x→b−0 x−b
Формула Ньютона-Лейбница.
Теорема 8.3.3 (Ньютона-Лейбница). Пусть функция f непрерывна на отрезке [a; b] тогда для
любой ее первообразной Φ на этом отрезке выполняется равенство
ˆ
f (x) d x = Φ(b) − Φ(a) (8.3.151)
[a,b]
По теореме 8.3.1, она является первообразной для функции f на отрезке [a; b]. Значит, F и Φ – две
первообразные для одной и той же функции f на отрезке [a; b]. Поэтому, по свойству 20 на с.455,
эти функции отличаются друг от друга на какую-то константу:
То есть, ˆ
f (t) d t = Φ(x) + C, x ∈ [a; b] (8.3.152)
[a,x]
Взяв x = a, мы получим ˆ
0= f (t) d t = Φ(a) + C,
[a,a]
506 Глава 8. ИНТЕГРАЛ
откуда
C = −Φ(a),
поэтому, подставив это в (8.3.152), получаем
ˆ
f (t) d t = Φ(x) − Φ(a), x ∈ [a; b]
[a,x]
y = x2
1 (то есть площадь полукруга радиуса 1).
0 x 1
1
равна
ˆ
x3 1 1 x
S= x2 d x = (8.1.53) = + C = . −1 1
[0,1] 3 0 3
⋄ 8.3.5. Площадь фигуры, ограниченной аркой
синусоиды Здесь используется формула (8.1.78), кото-
(
06x6π рую мы вывели раньше. Подставляя ее в теорему
Ньютона-Лейбница, мы получаем:
0 6 y 6 sin x.
ˆ 1p
y 1 − x2 d x = (8.1.78) =
−1
1 p x=1
1 y = sin x
= x 1 − x2 + arcsin x =
2 x=−1
x 1
1 π π π
0 = (arcsin 1 − arcsin(−1)) = + =
2 2 2 2 2
Видно, что ответ здесь такой же, какой ожида-
ешь: площадь полукруга радиуса 1 равна π2 .
Ориентированные отрезки в R.
• Ориентированным отрезком на прямой R называется произвольная пара чисел (a, b),
a, b ∈ R (здесь важно, какое из чисел стоит на первом месте, а какое на втором: пары (a, b)
и (b, a) считаются разными). Чтобы не путать такую пару (a, b) и интервалом (a, b) = {x ∈
R : a < x < b}, вводится специальное обозначение:
−→
a; b = (a, b)
−→
Этому объекту приписывается некий геометрический образ: считается, что a; b представ-
ляет собой обычный отрезок с концами a и b, относительно крайних точек которого a и
b имеется соглашение, что a в этой паре служит началом, а b концом (при этом, необяза-
тельно, чтобы a 6 b, возможно и наоборот, a > b).
• Частный случай, когда a = b, также считается ориентированным отрезком, в котором
конец и начало совпадают, и такой ориентированный отрезок называется вырожденным.
−→ −→
• Носителем [a; b] ориентированного отрезка a; b называется тот же самый отрезок, но уже
обычный, неориентированный (то есть такой, у которого мы “забыли”, какая из его край-
них точек была началом, а какая концом). Понятно, что
[a, b], a < b
−→
[a; b] = {a}, a = b
[b, a], a > b
−→ −→
• Суммой ориентированных отрезков a; b и b; c называется ориентированный отрезок −
a;→c:
−→ −→
a; b ⊕ b; c := −
a;→c (8.3.153)
(подразумевается, что сумма определена только если конец предыдущего отрезка совпа-
дает с началом следующего).
−→ −→
• Противоположным отрезком к отрезку a; b называется отрезок b; a, и обозначается он
−→
символом ⊖a; b:
−→ −→
⊖a; b := b; a (8.3.154)
−→ −→ −→ −→
Сумму вида − a;→c ⊕ (⊖b; c) = −
a;→c ⊕ c; b = a; b принято записывать как −
a;→c ⊖ b; c и называть
−→ −→
разностью ориентированных отрезков a; c и b; c:
− −→ −→ −→ −→
a;→c ⊖ b; c := −
a;→c ⊕ (⊖b; c) = −
a;→c ⊕ c; b = a; b (8.3.155)
508 Глава 8. ИНТЕГРАЛ
−→
⋄ 8.3.8. Запись 0; 1 означает отрезок [0; 1], в ко- му
−→ −→
тором 0 считается началом, а 1 концом. Наобо- 1; 0 = ⊖0; 1
−→
рот, 1; 0 означает отрезок [0, 1], но в котором 0
считается концом, а 1 началом. Носители у этих ⋄ 8.3.9. Очевидно, справедливы равенства:
отрезков одинаковы −→ −→ −→
0; 1 ⊕ 1; 2 = 0; 2
−→ −→
[0; 1] = [0; 1] = [1; 0] −→ −→ −→
0; 2 ⊖ 1; 2 = 0; 1
−→ −→ −→
но ориентация у них противоположная, и поэто- 0; 1 ⊖ 2; 1 = 0; 2
по этим отрезкам:
ˆ b ˆ c ˆ c
f (x) d x + f (x) d x = f (x) d x (8.3.160)
a b a
а интеграл по разности равен разности интегралов:
ˆ c ˆ b ˆ c
f (x) d x − f (x) d x = f (x) d x (8.3.161)
a a b
−→
40 . Теорема о среднем: если функция f непрерывна на отрезке a; b, то найдется такая
−→
точка ξ ∈ a; b, что
ˆ b
f (x) d x = f (ξ) · (b − a) (8.3.162)
a
5◦ Формула Ньютона-Лейбница: интеграл от непрерывной функции по ориентирован-
ному отрезку равен скачку ее (произвольной) первообразной на этом отрезке:
ˆ b x=b
f (x) d x = Φ(x) (8.3.163)
a x=a
§ 3. Формула Ньютона-Лейбница 509
2. Второе свойство следует из (8.2.115), и для его доказательства нужно просто рассмотреть два
случая взаимного расположения точек a и b на прямой. Если a 6 b, то
ˆ b ˆ
α · f (x) + β · g(x) d x = (8.3.157) = α · f (x) + β · g(x) d x = (8.2.115) =
a [a,b]
ˆ ˆ ˆ b ˆ b
= α· f (x) d x + β · g(x) d x = (8.3.157) = α · f (x) d x + β · g(x) d x
[a,b] [a,b] a a
А если a > b, то
ˆ b ˆ
α · f (x) + β · g(x) d x = (8.3.157) = − α · f (x) + β · g(x) d x = (8.2.115) =
a [b,a]
ˆ ˆ ˆ b ˆ b
= −α · f (x) d x − β · g(x) d x = (8.3.157) = α · f (x) d x + β · g(x) d x
[b,a] [b,a] a a
Если же a > b, то
ˆ b ˆ
f (x) d x = − f (x) d x = (8.2.123) = −f (ξ) · (a − b) = f (ξ) · (b − a)
a [b,a]
Если же a > b, то
510 Глава 8. ИНТЕГРАЛ
ˆ b ˆ
f (x) d x = (8.3.157) = − f (x) d x = (8.3.151) =
a [b,a]
x=b
= − Φ(a) − Φ(b) = Φ(b) − Φ(a) = (8.3.156) = Φ(x)
x=a
6. Свойство 6◦ следует из (8.2.138): если a < b, то по теореме 8.2.18 для некоторой точки ξ ∈ [a, b]
выпоняется равенство
ˆ ˆ ˆ
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x
[a,b] [a,ξ] [ξ,b]
| {z } | {z } | {z }
´b ´ξ ´b
a
f (x)·g(x) d x g(a)· a
f (x) d x g(b)· ξ
f (x) d x
Если же a > b, то по теореме 8.2.18 для некоторой точки ξ ∈ [b, a] должно выполняться равенство
ˆ ˆ ˆ
f (x) · g(x) d x = g(b) · f (x) d x + g(a) · f (x) d x.
[b,a] [b,ξ] [ξ,a]
⋄ 8.3.10. ⋄ 8.3.11.
4 √ ˆ 4
1+ x 1 1
ˆ
π
d x = + √ dx = ˆ 2
1 x2 1 x2 x· x (1 + 2 cos x − sin x) d x = (8.3.159) =
ˆ 4 ˆ 4 0
3
−2
= (8.3.159) = x dx + x− 2 d x = ˆ π
2
ˆ π
2
ˆ π
2
1 1 = 1 dx + 2 · cos x d x − sin x d x =
1 x=4 1 x=4 0
π2 π2 π2
0 0
= (8.1.53) = − − √ = π
x x=1 2 x x=1 = x + 2 sin x − cos x = + 2 − 1 =
1 1 1 0 0 0 2
= − + 1 − + = 1. π
4 4 2 = + 1.
2
−→
⋄ 8.3.12 (интеграл по пути). Физический смысл R в зависимости от времени: для всякого x ∈ a; b
интеграла вдоль функции состоит в том, что под число g(x) представляет собой координату тела
ним понимается интегрирование по пути. Пред- на R в момент времени x (то есть, в частности,
−→
ставьте себе ситуацию, когда функция g : [a; b] → в начальный момент времени x = a координа-
R описывает положение некоего тела на прямой та нашего тела была g(a), а в конечный момент
§ 3. Формула Ньютона-Лейбница 511
времени x = b она была g(b)). И представим се- ся измерение). Тогда работа силы f по перемеще-
−→ нию нашего тела из точки g(a) в точку g(b) будет
бе, что для всякого x ∈ a; b число f (x) представ-
ляет собой силу, действующую на наше тело в равна интегралу от функции f вдоль функции g
−→
момент времени x (то есть в нашей задаче си- по ориентированному отрезку a; b
ла, действующая на тело, формально зависит
не от положения этого тела в пространстве,
ˆ b
Следствие 8.3.14. Функция g : [a, b] → R является гладкой тогда и только тогда, когда она пред-
ставима в виде интеграла с переменным верхним пределом от некоторой непрерывной функции
f : [a, b] → R:
ˆ x
g(x) = g(a) + f (t) d t
a
В вычислениях удобно переход от левой части и говорим при этом, что "вносим g ′ (x) под знак
к правой и наоборот в формуле (8.3.165) оформ- дифференциала".
лять специальной записью и сопровождать под-
ходящей речевой конструкцией. В качестве за-
писи в таких случаях используется стрелка над ⋄ 8.3.15. В этом пункте нам нужны примеры,
формулой, а речевых конструкций придумано иллюстрирующие формулу (8.3.165) как опреде-
две: "вынесение из-под знака дифференциала"и ление интеграла вдоль гладкой функции, поэто-
"внесение под знак дифференциала". Именно, му в вычислениях здесь мы будем выносить вы-
если нам нужно в (8.3.165) перейти от левой ча- ражения из-под знака дифференциала:
сти к правой, то мы рисуем стрелку от выраже-
ния под дифференциалом в пространство перед ˆ 1 ˆ 1
ним, x3
d x5 = x3 · 5x4 d x =
ˆ b ˆ b 0 0
f (x) d g(x) = f (x) · g ′ (x) d x, 1
5 8 x=1 5
ˆ
a a =5 x7 d x = x =
0 8 x=0 8
и говорим при этом, что "выносим g(x) из-под
знака дифференциала". А если наоборот, нам
нужно в (8.3.165) перейти от правой части к ле- ⋄ 8.3.16. Еще один такой же пример:
вой (такое тоже часто бывает нужно, см. приме-
ры, начиная с 8.3.20), то мы рисуем стрелку от
нужного выражения в пространство после знака ˆ π ˆ π
дифференциала, cos x d sin x =
cos2 x d x =
0 0
ˆ b ˆ b ˆ π
1 + cos 2x 1 1 π π
′
f (x) · g (x) d x = f (x) d g(x), = d x = · x + · sin 2x =
a a 0 2 2 4 0 2
512 Глава 8. ИНТЕГРАЛ
если
−−→ −→
(i) ϕ гладко отображает носитель α; β в носитель a; b:
−−→ −→
ϕ : [α; β] → [a; b] (8.3.169)
−−→
(это, в частности, означает, что для всякого t ∈ [α; β] значение ϕ(t) лежит в
−→
[a; b]);
(ii) ϕ сохраняет ориентацию в следующем смысле:
−−→
⋄ 8.3.17. Функция не будет преобразованием отрезка 0; 3π
2 в отрезок
−→
ϕ(t) = cos t 1; 0, хотя она по-прежнему гладкая, и сохраняет
ориентацию этих отрезков:
является преобразованием ориентированного от-
−→ −−−→ 3π
резка 0; π в ориентированный отрезок 1; −1: cos 0 = 1, cos =0
2
−→ −−−→
cos : 0; π → 1; −1
Дело в том, что эта функция не будет отображе-
потому что она гладко отображает носитель пер- нием носителя первого отрезка в носитель вто-
вого отрезка в носитель второго рого:
−→ −−−→ "−−−→#
cos : [0; π] = [0, π] → [−1; 1] = [1; −1] 3π 3π −→
cos : 0; = 0, −→[0; 1] = [1; 0]
и сохраняет ориентацию: 2 2
−−→
Тогда композиция F ◦ϕ будет первообразной для функции (f ◦ϕ)·ϕ′ , на отрезке [α; β], по формуле
(6.1.28):
−−→
(F ◦ ϕ)′ (t) = F ′ ( ϕ(t) ) · ϕ′ (t) = f (ϕ(t)) · ϕ′ (t), t ∈ [α; β] (8.3.173)
|{z}
∋
−→
[a; b]
k
D(F ′ )
Поэтому
ˆ β t=β
f (ϕ(t)) · ϕ′ (t) d t = (8.3.163) = (F ◦ ϕ)(t) =F ϕ(β) −F ϕ(α) =
α t=α | {z } | {z }
=
(8.3.170) (8.3.170)
b a
ˆ b
= F (b) − F (a) = (8.3.163) = f (x) d x
a
3 ˆ 3 2
(t2 − 1) d(t2 − 1) (t − 1) · 2t d t
ˆ
В противоположность примерам на с.511 те-
= = =
перь оказывается полезным вносить под знак 2 t 2 t
дифференциала. ˆ 3 3
t t=3
=2 (t2 − 1) d t = 2 · −t =
⋄ 8.3.20. 2 3 t=2
ˆ 2 ˆ 2 8 32
x2 1 2 = 2 (9 − 3) − −2 =
ex · 2x d x =
x · e dx = · 3 3
0 2 0
√
1 2 x2 x = t, t = x2
ˆ
= 2
e dx = −→ −→ = ⊲⊲ 8.3.23. Найдите определенные интегралы:
2 0 x ∈ 0; 2 ⇔ t ∈ 0; 4 ´1√
1) 0 4 − x2 d x
1 4 t 1 4 e4 − 1 ´ ln 5 x √ x
ˆ
= e d t = et = 2) 0 e exe+3−1 d x
2 0 2 0 2 ´a
3) 02 √adx2 −x2
⋄ 8.3.21. ´1 √
4) 0 x2 1 − x2 d x
ˆ π4 π
sin x
ˆ 4 ´ 1 dx
tg x d x = dx = 5) 0 ex +e −x
0 0 cos x ´ π2
ˆ π4 ˆ π4 6) 0 1+sindx x+cos x
− sin x d x d cos x ´π
=− dx = − = 7) 04 1+2dx
0 cos x 0 cos x sin2 x
x = arccos t, t = cos x ˆ 12
dy
− − → ⊲⊲ 8.3.24. Найдите определенные интегралы:
= −−→π 1 = − = ´1√
x ∈ 0; 4 ⇔ t ∈ 1; 2 1 y 1) 0 1 + x d x
21 1
´π
= − ln |y| = − ln + ln 1 = ln 2 2) 02 sin3 x d x
1 2 ´1
3) 0 (xx2 +1)
dx
3
⋄ 8.3.22. Иногда, однако, бывает удобно сразу ´ e 1+ln x
4) 1 x d x
заменять переменную, не внося ничего под знак ´ − π cos3 x
дифференциала: 5) − π4 √ 3
sin x
dx
´ 1 2 dx
ˆ 4 √ 7) 0 x2 +4x+5
x dx 1 + x = t, x = t2 − 1
√ = −→ −→ = ´1 dx
1 1+ x x ∈ 1; 4 ⇔ t ∈ 2; 3 8) 0 √3+2x−x 2
Интегрирование по частям.
Доказательство.
ˆ b ˆ b ˆ b ˆ b
f (x) d g(x) + g(x) d f (x) = (8.3.165) = f (x) · g ′ (x) d x + g(x) · f ′ (x) d x = (8.3.159) =
a a a a
ˆ b ˆ b x=b x=b
= f (x) · g ′ (x) + f ′ (x) · g(x) dx = (f ·g)′ (x) d x = (8.3.167) = (f ·g)(x) = f (x)·g(x)
a | {z } a x=a x=a
=
(f · g)′ (x)
⇓
´b
(переносим a
g(x) d f (x) направо)
ˆ b x=b ˆ b
f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
a x=a a
= ... = ·I1 =
0 (2k + 1) · (2k − 1) · ... · 1 (2k + 1)!!
Кусочно-непрерывные функции.
• Функция f на отрезке [a, b] называется кусочно-непрерывной, если
1) на [a, b] функция f непрерывна во всех точках, кроме, возможно, конечного
набора;
2) в каждой точке разрыва c ∈ R функция f имеет конечные левый и правый
предел
f (c − 0) = lim f (x), f (c + 0) = lim f (x) (8.3.176)
x→c−0 x→c+0
Теорема 8.3.32. Функция f кусочно-непрерывна на отрезке [a, b] тогда и только тогда, когда су-
ществует разбиение τ = {c0 , ..., ck } этого отрезка такое, что на каждом отрезке [ci−1 , ci ] можно
определить непрерывную функцию ϕi , совпадающую с f на интервале (ci−1 , ci ):
1
y= x
является кусочно-непрерывной на любом отрез-
ке [a, b]. 0 x
⊲ 8.3.34. Наоборот, функция
(
sgn sin x1 , x 6= 0
f (x) =
0, x = 0
с графиком
y
тоже не будет кусочно-непрерывной на отрезке
1 [0, 1], потому что имеет бесконечный предел в
точке 0.
− π1 1
− 2π 1
− 3π 1
3π
1
2π
1
π
x
−1
Доказательство. Заметим сразу, что обе функции f и ϕ должны быть ограничены на [a, b]: функ-
ция ϕ ограничена по теореме 8.2.10, как интегрируемая на [a, b], а функция f отличается от нее не
более чем в двух точках. Мы можем даже считать, что они ограничены одной константой:
интегральная интегральная
сумма для f сумма для ϕ
z }| { z }| {
X k X k
f (ξi ) · ∆xi − ϕ(ξi ) · ∆xi =
i=1 i=1
| {z }
diam τ
↓ ↓
0
´b
a
ϕ(x) d x
k−1
X k−1
X
= f (ξ1 ) · ∆x1 + f (ξi ) · ∆xi + f (ξk ) · ∆xk − ϕ(ξ1 ) · ∆x1 + ϕ (ξi ) · ∆xi +ϕ (ξk ) · ∆xk =
i=2 i=2
| {z } | {z }
↑ сокращаются, поскольку f (ξ) = ϕ(ξ) при ξ ∈ (a, b) ↑
= f (ξ1 ) − ϕ(ξ1 ) · ∆x1 + f (ξk ) − ϕ(ξk ) · ∆xk 6
6 f (ξ1 ) − ϕ(ξ1 ) · ∆x1 + f (ξk ) − ϕ(ξk ) · ∆xk 6 4M · diam τ −→ 0
| {z } |{z} | {z } |{z} diam τ →0
6
6
6
diam τ diam τ
|f (ξ1 )| − |ϕ(ξ1 )| |f (ξk )| − |ϕ(ξk )|
6
2M 2M
Отсюда получаем:
k
X ˆ b
f (ξi ) · ∆xi −→ ϕ(x) d x
diam τ →0 a
i=1
´b
Это значит, что функция f интегрируема на [a, b] и ее интеграл равен a ϕ(x) d x.
Доказательство теоремы 8.3.36. Подберем с помощью теоремы 8.3.32 разбиение отрезка [a, b]
такое, что на всяком интервале (ci−1 , ci ) функция f совпадает с некоторой функцией ϕi , непрерыв-
ной на отрезке [ci−1 , ci ]. Тогда по лемме 8.3.37, функция f будет интегрируемой на всяком отрезке
[ci−1 , ci ]. Значит, по свойству аддитивности интеграла (30 на с.492), f интегрируема на отрезке
[a, b] = [a, c1 ] ∪ [c1 , c2 ] ∪ ... ∪ [cn , b].
Кусочно-гладкие функции.
• Функция f на отрезке [a, b] называется кусочно-гладкой, если
1) на отрезке [a, b] она дифференцируема во всех точках, кроме, возможно, конеч-
ного набора;
2) в каждой точке c ∈ [a, b], где f дифференцируема, ее производная непрерывна,
′ f (x) − f (c − 0) f (x) − f (c + 0) ′
f− (c) = lim , f+ (c) = lim
x→c−0 x−c x−c x→c+0
(8.3.179)
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x)
′ ′
стремится соответственно к f− (c) или f+ (c):
′
f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (8.3.180)
x→c−0 x→c+0
Теорема 8.3.38. Функция f является кусочно-гладкой на отрезке [a, b] тогда и только тогда,
когда существует разбиение τ = {c0 , ..., ck } этого отрезка такое, что на каждом отрезке [ci−1 , ci ]
можно определить гладкую функцию ϕi , совпадающую с f на интервале (ci−1 , ci ):
Теорема 8.3.39. Пусть g – непрерывная кусочно-гладкая функция на отрезке [a, b]. Тогда
(i) произвольным образом доопределяя производную g ′ функции g в точках недифференци-
руемости g на [a, b], мы получим кусочно-непрерывную функцию на [a, b];
(ii) для любой интегрируемой функции f на [a, b] интеграл
ˆ b
f (x) · g ′ (x) d x
a
Целью наших рассмотрений здесь является обобщение теорем 8.3.40 и 8.3.25 об интегрировании
вдоль функции на случай, когда эта функция является непрерывной кусочно-гладкой (а не просто
гладкой).
Доказательство. Понятно, что здесь достаточно считать, что a < b, потому что противоположный
случай получается умножением равенства (8.3.183) на −1.
13 Объяснение, почему функцию g в определении интеграла ab f (x) d g(x) нужно брать непрерывной кусочно-
´
гладкой (а не просто кусочно-гладкой) заключается в том, что только тогда этот интеграл можно определить фор-
мулой (8.3.181). В общем случае эта конструкция называется интегралом Римана-Стилтьеса и определяется она
по аналогии с интегралом Римана но с заменой ∆xi = xi − xi−1 на ∆gi = g(xi ) − g(xi−1 ). Для сходимости частичных
сумм необходимо требовать, чтобы g была функцией ограниченной вариации. Подробности можно найти, например,
в учебнике: А.Н.Колмогоров, С.В.Фомин, Элементы теории функций и функционального анализа, М.: Наука, 1981.
§ 3. Формула Ньютона-Лейбница 519
=
(8.3.181) g(b) − g(a)
´β
α
g′ (x) d x здесь используется
´b ′ ↓ непрерывность g
a
g (x) d x
=
´b (8.3.181)
a
d g(x)
(8.3.181) (8.3.181)
´β x=b ´β
α
f (x) · g′ (x) d x f (x) · g(x) α
g(x) · f ′ (x) d x
↓ x=a ↓
´b здесь используется ´b
a
f (x) · g′ (x) d x непрерывность f и g a
g(x) · f ′ (x) d x
=
´b (8.3.181) ´b (8.3.181)
a
f (x) d g(x) a
g(x) d f (x)
520 Глава 8. ИНТЕГРАЛ
так, чтобы внутри каждого отрезка [ci−1 , ci ] функции f и g были дифференцируемы, и, по уже
доказанному, мы получим:
ˆ b k ˆ
X ci k
X x=ci k ˆ
X ci
f (x) d g(x) = f (x) d g(x) = f (x) · g(x) − g(x) d f (x) =
a ci−1 x=ci−1 ci−1
i=1 i=1 i=1
x=b ˆ b
= f (x) · g(x) − g(x) d f (x)
x=a a
Предложение 8.3.43. Для любой непрерывной функции f на интервале (α, β) и любой точки
c ∈ (α; β) формула ˆ x
F (x) = f (t) d t, x ∈ (α, β)
c
Более того, представив F тем же интегралом с x бегающим по отрезку [c, b], мы можем найти
правую производную F в точке c по формуле (8.3.147):
x
F (x) − F (c) 1
ˆ
F+′ (c) = lim = lim f (t) d t =
x→c+0 x−c x→c+0 x − c c
1
ˆ
= lim f (t) d t = (8.3.147) = f (c). (8.3.187)
x→c+0 x − c [c,x]
И представив F тем же интегралом с x бегающим по отрезку [a, c], мы можем найти левую произ-
водную F в точке c по формуле (8.3.148):
ˆ x
′ F (x) − F (c) 1
F− (c) = lim = lim f (t) d t =
x→c−0 x−c x→c−0 x − c c
ˆ c
1
= lim f (t) d t = (8.3.148) = f (c). (8.3.189)
x→c−0 c − x x
3. Теперь мы получаем, что формулы (8.3.187) и (8.3.189) вместе дают (8.3.185) для случая x0 = c,
а для всех остальных точек x0 6= c то же самое утверждается в формулах (8.3.186) и (8.3.188).
Из непрерывности функции f ′ следует, что функция g тоже непрерывна на [a, b]. Действительно,
пусть ε > 0. По теореме Кантора 4.3.32, найдется δ > 0 такое, что для любых x, y ∈ [a, b]
|x − y| < δ =⇒ |f ′ (x) − f ′ (y)| < ε
Поэтому справедлива цепочка:
|x − y| < δ
⇓
∀s ∈ [0, 1] (x − c) · s + c − (y − c) · s + c = (x − y) · s = |x − y| · |s| 6 |x − y| < δ
⇓
′
∀s ∈ [0, 1] f (x − c) · s + c − f ′ (y − c) · s + c < ε
⇓
ˆ 1 1
ˆ
|g(x) − g(y)| = ′
f (x − c) · s + c d s − f (y − c) · s + c d s =
′
0 0
ˆ
ˆ
′ ′
= f (x − c) · s + c d s − f (y − c) · s + c d s =
[0;1] [0;1]
ˆ
= f ′ (x − c) · s + c − f ′ (y − c) · s + c d s 6
[0;1]
ˆ
ˆ
′ ′
6 f (x − c) · s + c − f (y − c) · s + c d s < ε ds = ε
[0;1] | {z } [0;1]
>
y
(e) Приложения определенного
интеграла y=x
Площадь правильной области на плоско- −2 x
сти. Пусть функции f и g непрерывны на от- 1
резке [a, b] и удовлетворяют неравенству
y = 2 − x2
f (x) 6 g(x), x ∈ [a; b]
−a a x
y
2a
−b
x
Действительно, 0 πa 2πa
x2 y2
+ = cos2 t + sin2 t = 1
a b
⋄ 8.3.50 (астроида). Уравнения
( Область на плоскости можно определять па-
x = a cos3 t раметризованными кривыми. Например, систе-
, t∈R ма
y = b sin3 t (
задают на плоскости кривую, называемую аст- x = ϕ(t)
D: , t ∈ [α; β]
роидой. Для ее построения можно составить таб- 0 6 y 6 ψ(t)
лицу
задает на плоскости примерно такую область
t 0 ± π6 ± π4 ± π3 ± π2
√ √
x a 3 3
a 2
a 1
a 0 y
8 4√ 8√
y 0 ± 18 b ± 2
4 b ±383b ±b ψ(β)
ψ(α)
t ± 2π3 ± 3π ± 5π ±π
√4 √6
x − 18 a − 42 a −383a −a
√ √ x
y ±383b ± 42 b ± 18 b 0 ϕ(α) ϕ(β)
ψ(β)
x
ϕ(β) ϕ(α)
и соединить их “плавной линией”. Получится
картинка
y если ϕ убывает.
b
Теорема 8.3.52. Пусть
−a a x 1) ϕ – гладкая монотонная функция на
отрезке t ∈ [α; β], у которой производ-
ная не равна нулю на интервале (α; β):
−b
∀t ∈ (α; β) ϕ′ (t) 6= 0 (8.3.192)
524 Глава 8. ИНТЕГРАЛ
−b
−b
и найдем ее площадь:
ˆ π
Для этого выделим четвертинку этой области, 2
3 3
определяемую системой SD = b sin t d a cos t =
0
( ˆ π
x = a cos t π 2
D: , t ∈ [0; ] = 3ab sin4 t cos2 t d t =
0 6 y 6 b sin t 2 0
ˆ π
2 1 − cos 2t 2 1 + cos 2t
= 3ab d t =
0 2 2
ˆ π
3ab 2 2
= (1 − cos 2t) 1 − cos 2t d t =
8 0
ˆ π
3ab 2 1 + cos 4t
= (1 − cos 2t) 1 − d t =
8 0 2
ˆ π
и найдем ее площадь: 3ab 2
= (1 − cos 2t) (1 − cos 4t) d t =
ˆ π ˆ π 16 0
2 2 ˆ π
3ab 2
SD = b sin t d a cos t = ab sin2 t d t =
0 0 = (1 − cos 2t − cos 4t + cos 2t cos 4t) d t =
ˆ π 16 0
2 1 − cos 2t ab sin 2t
π
ˆ π
t−
2
3ab 2
= ab d t = =
0 2 2 2 0 = 1 − cos 2t − cos 4t+
16 0
πab
= 1
4
+ (cos 6t + cos 2t) d t =
2
Умножив это число на 4, получаем площадь эл- ˆ π
липса: 3ab 2
= (2 − cos 2t − 2 cos 4t + cos 6t) d t =
S = πab 32 0
15 Эта формула доказывается ниже на с.1054.
§ 3. Формула Ньютона-Лейбница 525
π
3ab 1 1 1 2 При этом, полярные координаты связаны с
= 2t − sin 2t − sin 4t + sin 6t =
32 6 2 6 0 декартовыми формулами
3abπ ( ( p
= x = ρ · cos ϕ ρ = x2 + y 2
32 , ,
y = ρ · sin ϕ tg ϕ = xy
Умножив это число на 4, получим площадь всей
фигуры: Как и в случае с декартовыми координатами,
3abπ
S= всякое уравнение, связывающее полярные коор-
8
динаты,
⋄ 8.3.55. Найдем площадь фигуры, ограничен- ρ = R(ϕ)
ной аркой циклоиды
( задает некоторую кривую на плоскости. Рас-
x = a(t − sin t) смотрим примеры.
D: , t ∈ [0; 2π]
0 6 y 6 a(1 − cos t) ⋄ 8.3.57 (кардиоида). Построим кривую, задан-
ную уравнением в полярных координатах
y
ρ = a · (1 + cos ϕ)
2a
Это можно сделать по точкам. Сначала состав-
ляется таблица
x
0 2πa ϕ 0 ±π ± π4 ± π3 ± π2
6√ √
ρ 2a a 1 + 23 a 1+ 2
2 3a
2 a
Вычисляем площадь: ϕ ± 2π
3 ± 3π ± 5π ±π
4√ 6
√
a
ˆ 2π ρ a 1 − 22 a 1− 3
0
2 2
SD = a(1 − cos t) d a(t − sin t) =
0
ˆ 2π Потом соответствующие точки строятся на плос-
2
=a (1 − cos t) d t =
2
кости:
0
ˆ 2π y
= a2 1 − 2 cos t + cos2 t d t = a
0
ˆ 2π
1 + cos 2t
= a2 1 − 2 cos t + d t = a 2a x
0 2
3 sin 2t 2π
= a2 t − 2 sin t + = 3πa2
2 4 0 −a
⊲⊲ 8.3.56. Найдите площади фигур, ограничен-
ных параметризованными кривыми (разные ва-
рианты петель): Эти точки соединяются плавной линией, и полу-
2 3
1) x = a(t + 1), y = b(t − 3t), чается кривая:
1 2 2
2) x = 3 (3 − t ), y = t , y
3) x = 2t − t2 , y = 2t2 − t3 . a
y
для данного значения ϕ соответсвующее значе-
a
ние параметра ρ не определено):
ϕ 0 ± π6 ± π4 ± π3 ± π2
a
ρ a √
2
0 ∄ ∄
x
ϕ ± 2π
3 ± 3π
4 ± 5π
6 ±π
ρ ∄ 0 √a a
2
В результате получается кривая:
−a a x x
β
ϕ −π − 3π − π2 − π4 0 α x
4
ρ 0 ∄ ∄ ∄ 0
ϕ π
4
π
2
3π
4 π вычисляется по формуле16
ρ √a a √a 0
2 2 β
1
ˆ
SD = R(ϕ)2 d ϕ (8.3.195)
2 α
(здесь знак ∄ мы пишем в случае, когда значение
ρ получается отрицательным; это должно озна- ⋄ 8.3.61. Вычислим площадь области, ограни-
чать, что при данном ϕ соответствующая точка ченной кардиоидой (линией, построенной нами в
не существует, поскольку ρ есть расстояние до примере 8.3.57):
нуля, и значит не может быть отрицательным).
Потом на плоскости строятся точки: ρ = a · (1 + cos ϕ)
16 Эта формула доказывается ниже на с.??.
§ 3. Формула Ньютона-Лейбница 527
y y
a a
2a x
x
−a
6
0
2π
t t t 2π x
ˆ
= 4a sin d = −4a cos = a b
0 2 2 2 0
= −4a(cos π − cos 0) = 8a.
2) χ – непрерывная неотрицательная
y функция на отрезке t ∈ [α; β]: χ(t) > 0,
ненулевая на интервале (α; β):
y
y
b
1
x
x
π
−a a
0 2
π
−b
−1
y
1
y
x
π π
x 0 2
a b
z −1
ˆ π ˆ π
2 2
sin2k+1 x d x < sin2k x d x <
0 0
По формуле (8.3.211) получаем площадь поло- ˆ π
2
винки равна < sin2k−1 x d x
0
S
= ⇓ (8.3.175)
2
q
ˆ π
2 (2k)!! (2k − 1)!! π (2k − 2)!!
= 2π 3
a sin t · (−3a cos2 t sin t)2 + (3a sin2 t cos t)2 d t = < · <
0
π
(2k + 1)!! (2k)!! 2 (2k − 1)!!
ˆ
2
p
= 2π a sin t ·
3
9a2 cos4 t sin2 t + 9a2 sin4 t cos2 t d t = ⇓
0
ˆ π
2 p 2 2
= 6a2 π sin3 t · | cos t sin t| cos2 t + sin2 t d t = 1 (2k)!! π 1 (2k)!!
· < < ·
0 2k + 1 (2k − 1)!! 2 2k (2k − 1)!!
ˆ π
2
| {z } | {z }
xk xk
= 6a π 2
sin3 t · cos t sin t · 1 · d t =
0
ˆ π
⇓
2
= 6a π 2
sin4 t · cos t d t = xk π xk
< <
0 2k + 1 2 2k
sin5 t π2
ˆ π
2
⇓
= 6a2 π sin4 t d sin t = 6a2 π =
0 5 0 2k π 2k xk xk π
6 · < · = <
= a2 π 2k + 1 |{z}
2 2k + 1 2k 2k + 1 2
5
>
xk
Отсюда полная площадь 2k
⇓
12 2
S= a π 2k π xk π
5 · < <
2k + 1 2 2k + 1 2
⊲⊲ 8.3.86. Найдите площади поверхностей, обра- | {z }
↓
зованных вращением следующих кривых вокруг 1
оси OX:
⇓
1) x = a cos t, y = b sin t xk π
2) x = a(t − sin t), y = a(1 − cos t), t ∈ [0; 2π] −→
2k + 1 k→∞ 2
ex +e−x
3) y = ch x = 2 ,x ∈ [a; b]
§ 3. Формула Ньютона-Лейбница 533
0
0 = · = (3.2.117) =
2k + 1 (2k − 1)!
1 k 2
⇓ подстановка: x = 1 2 · k! · 2k−1 · (k − 1)!
2n + 1 = · =
2k + 1 (2k − 1)!
1
1 1 + 2n+1 2 1 k 2
ln 1 + = ln 1 > = 1
1 2 · k! · 2k · k!
n 1 − 2n+1 2n + 1 n+ 2 = · =
2k + 1 2k · (2k − 1)!
⇓ 24k (k!)4 (8.3.214)
n+ 12 = · 2 ∼
1 1 1 2k + 1 k→∞
ln 1 + = n+ · ln 1 + >1 (2k)!
n 2 n 4
1
kk+ 2
⇓ a · 4k+2
24k ek 24k a4 · k e4k
n+ 21 ∼ · 2 = · 4k+1 =
1 k→∞ 2k
(2k)2k+ 2
1 2k a2 · (2k)4k
1+ >e a · e2k e
n
⇓ 24k a2 · k 4k+2 24k a2 · k 4k+2 a2
= · = · =
2k (2k)4k+1 2k 24k+1 · k 4k+1 4
n!·en 1
xn 1
nn+ 2 (n + 1)n+1+ 2 ⇓
= (n+1)!·en+1
= 1 =
xn+1 1 (n + 1) · nn+ 2 ·e 2π = a2
(n+1)n+1+ 2
1 n+ 12 ⇓
1 (n + 1)n+ 2 1 1
= · 1 = · 1 + >1 √
e nn+ 2 e n 2π = a
⇓ Это превращает (8.3.214) в (8.3.212).
Глава 9
НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ
И ЧИСЛОВЫЕ РЯДЫ
§1 Несобственные интегралы
Несобственный интеграл формализует в математическом анализе идею площади неограниченной
фигуры.
x
y = f (x) 1
y= √1
x
Ее площадь будет непонятно чему равна, потому
что определенный интеграл от неограниченной
функции не существует (по теореме 8.2.10).
Тем более неожиданным должно быть наблю- 1
дение, что у некоторых неограниченных криво-
линейных трапеций все-таки имеется конечная
площадь. Точнее, понятие площади можно обоб-
щить таким образом, что некоторые неограни- t x
1
ченные криволинейные трапеции будут иметь ко-
нечную площадь. Например, если Вы задумае-
тесь, чему должна быть равна площадь криволи-
нейной трапеции, ограниченной кривой y = √1x
534
§ 1. Несобственные интегралы 535
1
1 √ 1 ⋄ 9.1.3. Еще один пример – площадь криволи-
ˆ
S = lim √ d x = lim 2 x = 1
t→+0 t x t→+0 t нейной трапеции, ограниченной кривой y = 1+x 2
√ на полуинтервале [0; +∞):
= lim 2 − 2 t = 2
t→+0
y
⋄ 9.1.2. С другой стороны, если вместо кривой y= 1
1+x2
y = √1x взять ничем особенным, как будто, не
отличающуюся от нее кривую y = x1 ,
y 0 x
1
y= x Ее можно вычислить как предел площадей полу-
чающихся, когда x бегает по отрезкам [0, t], при
t → ∞,
y
1 1
y= 1+x2
t x
1
0 t x
то окажется, что соответствующая площадь, по- π
и оказывается, что она равна 2:
считанная тем же способом бесконечна:
+∞ t
1 dx dx
ˆ ˆ
1
1
ˆ
= lim =
S = lim d x = lim ln x = 0 1 + x2 t→+∞ 0 1 + x2
t→+0 t x t→+0 t t
π
= lim (ln 1 − ln t) = +∞ = lim arctg x = lim arctg t =
t→+0 t→+∞ 0 t→+∞ 2
После этих примеров естественно спросить, какой должна быть неограниченная криволинейная
трапеция, чтобы ее площадь была конечна? И чему равны площади конкретных неограниченных
криволинейных трапеций? Об этом мы поговорим в настоящей главе.
Если этот предел существует и конечен, то говорят, что несобственный интеграл схо-
дится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
• Аналогично, если f локально интегрируема на полуинтервале (−∞; b], то предел
ˆ b
lim f (x) d x
t→−∞ t
и опять если этот предел существует и конечен, то говорят, что несобственный интеграл
сходится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
Рассмотрим примеры.
+∞ t
⋄ 9.1.11.
ˆ ˆ
cos x d x = lim cos x d x =
ˆ +∞ ˆ t 0 t→+∞ 0
dx dx t
= lim =
1 x t→+∞ 1 x = lim sin x = lim sin t
t→+∞ 0 t→+∞
t | {z }
= lim ln x = lim ln t = ∞ предел не существует
t→+∞ 1 t→+∞
x1−α x=b ˆ +∞
dx
ˆ +∞
= lim = = x−α d x =
t→+0 (1 − α) x=t α
1−α a x a
b t1−α ˆ t
x1−α x=t
= lim − = = lim x−α d x = lim =
t→+0 (1 − α) (1 − α) t→+∞ a t→+∞ (1 − α) x=a
1 − α > 0 1−α
b1−α t a1−α 1−α>0
= поэтому = = lim − = 1−αпоэтому =∞
t1−α → 0 (1 − α) t→+∞ (1 − α) (1 − α) t →∞
2) Если α = 1, то интеграл расходится:
ˆ b ˆ b ˆ b
dx dx dx
α
= = lim = Теорема 9.1.17 (о несобственном интеграле от
0 x 0 x t→+0 t x показательной функции).
x=b
(
= lim ln x = lim {ln b − ln t} = ∞ ˆ +∞
t→+0 x=t t→+0
x сходится, если 0 < A < 1
A d x ←−
3) Если α > 1, то интеграл расходится: a расходится, если A > 1
ˆ b ˆ b ˆ b
dx −α Доказательство. Рассмотрим три случая.
α
= x d x = lim x−α d x =
0 x 0 t→+0 t 1) Если 0 < A < 1, то интеграл сходится:
x1−α x=b
= lim = ˆ +∞ ˆ t
t→+0 (1 − α) x=t
1−α Ax d x = lim Ax d x =
t→+∞
b t1−α 1−α<0 a a
= lim − = 1−α поэтому = Ax t 1
t→+0 (1 − α) (1 − α) t →∞ = lim = lim (At − Aa ) =
t→+∞ ln A a ln A t→+∞
=∞ 0 < A < 1
Aa
= поэтому = −
At → 0 ln A
Теорема 9.1.16 (о несобственном интеграле по
2) Если A = 1, то интеграл расходится:
бесконечному промежутку от степенной функ-
ции). ˆ +∞ ˆ +∞ ˆ t
ˆ +∞ ( Ax d x = 1 d x = lim 1 dx =
dx сходится, если α > 1 a a t→+∞ a
←−
a xα
расходится, если α 6 1 x t t−a
= lim = lim = +∞
t→+∞ ln A a t→+∞ ln A
Доказательство. Рассмотрим три случая.
1) Если α > 1, то интеграл сходится: 3) Если A > 1, то интеграл расходится:
ˆ +∞ ˆ +∞ ˆ t
dx −α +∞ t
x−α d x =
ˆ ˆ
= x d x = lim
a xα a t→+∞ a Ax d x = lim Ax d x =
t→+∞
x1−α x=t
a a
= lim = Ax t 1
t→+∞ 1 − α x=a = lim = lim (At − Aa ) =
1−α t→+∞ ln A a ln A t→+∞
t a1−α 1−α <0 A>1
= lim − = поэтому = = поэтому =∞
t→+∞ 1 − α 1−α t1−α → 0 t
A →∞
a1−α
=−
1−α
§ 1. Несобственные интегралы 539
⋄ 9.1.18. 2 t 2
= lim − 1 = lim 2 − 1 = 2
ˆ +∞ ˆ +∞ ˆ t t→+∞ x2 1 t→+∞ t2
1 1 1
√ d ln x = 3 dx = lim 3 dx =
1 x 1 x2 t→+∞ 1 x2
Тогда ˆ b ˆ β ˆ β
f (x) d x = f (ϕ(t)) d ϕ(t) = f (ϕ(t)) · ϕ′ (t) d t (9.1.1)
a α α
Доказательство. Здесь используется тот же прием, что и при доказательстве теоремы 8.3.19 о за-
мене переменной в определенном интеграле.2 Пусть F – первообразная функции f на полуинтервале
[a, b):
F ′ (x) = f (x), x ∈ [a, b) (9.1.2)
Например, в качестве F можно взять интеграл с переменным верхним пределом:
ˆ ˆ x
F (x) = f (t) d t = f (t) d t, x ∈ [a, b)
[a,x] a
(тогда по теореме 8.3.1 F будет первообразной для f на каждом отрезке [a, c] ⊆ [a, b), и значит,
на всем полуинтервале [a, b)). Композиция F ◦ ϕ будет первообразной для функции (f ◦ ϕ) · ϕ′ , на
полуинтервале [α, β), по формуле (6.1.28):
[a, b)
k
D(F ′ )
Поэтому
=
(8.3.170)
a
ˆ ϕ(T ) ˆ y ˆ b
= lim f (x) d x = lim f (x) d x = f (x) d x
T →β−0 a y→b−0 a a
⋄ 9.1.20. ⋄ 9.1.21.
+∞
dx x = 1t , t= x1
ˆ
√
√ = x = 2 ⇔ t = 12 = 1
dx t = 1 − x, x = 1 − t2
ˆ
x x2 − 1 x → +∞ ⇔ t → +0
√ = x=0⇔t=1 =
2
0 ˆ 21 12 0 (2 − x) 1 − x x → 1 − 0 ⇔ t → +0
− dt dt π
ˆ
ˆ 0 ˆ 1 1
= √ = √ = arcsin t = −t d t dt π
1 1−t 2
0 1−t 2 0 6 = 2
= 2
= arctg t =
1 t(t + 1) 0 t +1 2
2
0
и Вы увидите, что это нелегко. Поэтому часто бывает важно просто понять, сходится или нет
данный несобственный интеграл, не вычисляя его. Например, интеграл (9.1.4), как будет показано
в примере 9.1.25 сходится (хотя и непонятно, чему равен).
В этом параграфе мы приведем некоторые признаки сходимости несобственных интегралов.
´b
! 9.1.23. Условие справа (то есть утверждение, что интегралы a f (x) d x ограничены) принято
записывать неравенством
ˆ b
f (x) d x < ∞
a
´b
и, в силу теоремы 9.1.22, такая запись считается эквивалентной утверждению, что интеграл a f (x) d x
сходится (при неотрицательной f ).
Доказательство. Обозначим
ˆ t
F (t) = f (x) d x
a
и заметим, что это будет монотонно неубывающая функция, поскольку под интегралом стоит неот-
рицательная функция: если α 6 β, то
ˆ α ˆ α ˆ β ˆ β
F (α) = f (x) d x 6 f (x) d x + f (x) d x = f (x) d x = F (β)
a a
|α {z } a
6
m
ˆ t
F имеет конечный предел слева в b: lim F (t) = lim f (x) d x < ∞
t→b−0 t→b−0 a
| {z }
(применяем (4.4.156), поскольку F – неубывающая функция) k
sup F (t)
t∈[a,b)
m
ˆ t
sup f (x) d x = sup F (t) < ∞.
t∈[a,b) a t∈[a,b)
Тогда
542 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a f (x) d x: ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится
a a
´c
(ii) из расходимости меньшего интеграла a
f (x) d x следует расходимость большего инте-
´c
грала a g(x) d x:
ˆ c ˆ c
f (x) d x расходится =⇒ g(x) d x расходится
a a
Доказательство. Обозначим
ˆ t ˆ t
F (t) = f (x) d x, G(t) = g(x) d x
a a
и, во-вторых,
0 6 F (t) 6 G(t), t ∈ [a; c). (9.1.7)
1. Теперь мы получаем цепочку:
ˆ c
g(x) d x сходится
a
⇓ теорема 9.1.22
ˆ t
sup g(x) d x < ∞
t∈[a,b) a
| {z }
k
supt∈[a,b) G(t)
6
supt∈[a,b) F (t)
k´
supt∈[a,b) at f (x) d x
⇓
ˆ t
sup f (x) d x < ∞
t∈[a,b) a
⇓ теорема 9.1.22
ˆ c
f (x) d x сходится
a
´ c 2. Мы доказали утверждение (i). ´ c Утверждение (ii) является его следствием: если интеграл
a f (x) d x расходится, то интеграл g(x) d x не может сходиться (потому что иначе мы получили
´c ´c a
бы что a f (x) d x расходится, а a g(x) d x сходится, а это невозможно в силу уже доказанного
утверждения 2 (A)).
заметим, что подынтегральная функция поло- причем больший интеграл сходится по теореме
жительна и меньше функции √1x : 9.1.15. Значит, по теореме 9.1.24, наш исходный
интеграл тоже сходится.
2 1
´ 1 sin2 1
sin x 1 Вывод: интеграл 0 √xx d x сходится.
06 √ 6 √
x x
§ 1. Несобственные интегралы 543
´ +∞
⋄ 9.1.26. Для следующего интеграла Вывод: интеграл π
3+cos
√ x
x x
d x сходится.
ˆ 1
1
dx ⋄ 9.1.28. Снова рассмотрим интеграл по беско-
0 sin x нечному промежутку:
мы аналогичные рассуждения запишем более ко-
ротко: +∞ +∞
3 + cos x 2
ˆ ˆ
ˆ 1
1
ˆ 1
1 √ dx > √ dx =
dx > dx π x π x
0 sin x x ˆ +∞
| 0 {z } 1
=2 1 dx
расходится по π x 2
теореме 9.1.15 | {z }
´1 расходится по
1
Вывод: интеграл 0 sin x
d x расходится. теореме 9.1.16
+∞
3 + cos x +∞
4 ⊲⊲ 9.1.29. Исследуйте на сходимость интегралы:
ˆ ˆ
√ dx 6 √ dx =
π x x π x x
ˆ +∞ ´ +∞ sin2 x ´1 cos x 1
1 1) π x2 d x; 4) 0
√ 3 x d x;
=4 3 dx ´ +∞ ln x ´ 1 e x1
x2 }
| π {z 2) 3 x d x;
√
5)
e 0 x3 d x;
сходится по ´ +∞ arctg x ´ 0 e x1
теореме 9.1.16 3) 2
√
x x
d x; 6) −1 x3 d x
Теорема 9.1.30 (критерий Коши сходимости несобственного интеграла). 3 Пусть функция f ло-
кально интегрируема на полуинтервале [a; b). Тогда следующие условия эквивалентны:
(i) несобственный интеграл
ˆ b
f (x) d x
a
сходится;
(ii) для любых двух числовых последовательностей sn , tn ∈ [a; b), стремящихся к b
sn −→ b, tn −→ b,
n→∞ n→∞
−−−→
интеграл от функции f по направленному отрезку sn ; tn стремится к нулю при n → ∞:
ˆ tn
f (x) d x −→ 0
sn n→∞
m
существует конечный предел lim F (t)
t→b−0
3 Этот результат понадобится ниже при доказательстве признака абсолютной сходимости несобственного интеграла
(теорема 9.1.33)
544 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
m (теорема 4.4.37)
=
´ tn ´ sn
a
f (x) d x − a
f (x) d x
=
´ tn
sn
f (x) d x
m
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞
( 2 )
⋄ 9.1.31. Критерий Коши обычно бывает удобен 1 5π π 2
для доказательства расходимости несобственно- = + 2πn − + 2πn =
4 6 6
го интеграла (если он действительно расходит-
ся). Рассмотрим, например, интеграл 1 n 25π 2 5
= + π 2 n + π 2 · n2 −
ˆ +∞ 4 36 3
π2 1 2 o
x · sin x d x = − π n − π 2 · n2 =
0 36 3
Выберем следующие две числовые последова- 1 n 24π 2 4 o
= + π 2 n −→ ∞ = 6 0,
тельности: 4 36 3 n→∞
π 5π
sn = + 2πn, tn = + 2πn и по признаку Коши это означает, что наш инте-
6 6
грал расходится.
Тогда ´ +∞
Вывод: интеграл 0 x · sin x d x расходится.
1
∀x ∈ [sn ; tn ] sin x >
2
поэтому ⊲ 9.1.32. Проверьте по критерию Коши, что ин-
ˆ tn ˆ tn теграл
1 ˆ +∞
x · sin x d x > x · dx =
sn sn 2 x · cos x d x
2 5π +2πn 0
x 6
= = расходится.
4 π6 +2πn
Доказательство.
ˆ b
интеграл |f (x)| d x сходится
a
⇓ (теорема 9.1.30)
ˆ tn
∀sn −→ b, ∀tn −→ b |f (x)| d x −→ 0
n→∞ n→∞ sn n→∞
| {z }
6
´
tn
sn f (x) d x
6
⇓
§ 1. Несобственные интегралы 545
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ n→∞
sn
⇓
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞
⇓ (теорема 9.1.30)
ˆ b
несобственный интеграл f (x) d x сходится
a
Тогда интеграл
ˆ +∞
f (x) · g(x) d x
a
сходится.
546 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Доказательство. Обозначим ˆ t
C = sup f (x) d x < ∞
t>a a
и заметим, что ˆ t
∀s, t ∈ [a, ∞) f (x) d x 6 2C (9.1.10)
s
Действительно,
ˆ t ˆ t s ˆ t ˆ s
ˆ
f (x) d x= f (x) d x − f (x) d x 6 f (x) d x + f (x) d x 6 2C
s a a
| a {z } | a {z }
>
>
C C
´∞
Чтобы убедиться, что интеграл a f (x)·g(x) d x сходится, воспользуемся критерием Коши (теорема
9.1.30): выберем произвольные последовательности
sn −→ +∞, tn −→ +∞.
n→∞ n→∞
−−−→
По формуле Бонне (8.3.164), для любого n найдется точка ξn ∈ sn , tn такая, что
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x
sn sn ξn
−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x 6 |g(sn )| · f (x) d x + |g(tn )| · f (x) d x −→ 0
sn | {z } sn | {z } ξn n→∞
↓ | {z } ↓ | {z }
>
>
0 (9.1.10) 0 (9.1.10)
2C 2C
´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.
ˆ 1 ˆ 1
⋄ 9.1.39. Интеграл √
3 1 cos t
= t t · cos t d =− 2 dt =
ˆ +∞ √ +∞ t +∞ t 3
x2 = t, x = t ˆ +∞
x · sin x d x =
2 2
x=1⇔t=1 =
cos t
1 x → +∞ ⇔ t → +∞ = 2 dt
+∞ +∞
1 t3
√ sin t
ˆ ˆ
= t · sin t d t= √ dt тоже сходится по признаку Дирихле.
1 1 2 t
−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞
ограничена ограничена
ˆ tn z }| { ˆ ξn z }| { ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x −→ 0
sn sn ξn n→∞
| {z } | {z }
↓ теорема 9.1.30 ↓ теорема 9.1.30
0, 0,
´поскольку
∞ ´поскольку
∞
a
f (x) d x a
f (x) d x
сходится сходится
´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.
вспомним, что в примере (9.1.38) мы убедились, ⋄ 9.1.44. Следующий интеграл заменой пере-
что интеграл менных превращается в интеграл, который мож-
но исследовать по признаку Абеля:
ˆ +∞
sin x
dx
1 x ˆ 1 t= 1
arccos x 1 x
· cos d x = x = 1t =
сходится. Поскольку функция x 7→ arctg x мо- 0 x x d x = − d2t
нотонна, по
´ +∞признаку Абеля мы получаем, что t
sin x 1
1 d t
ˆ
интеграл 1 · arctg x d x тоже сходится.
x =− t · arccos · cos t · 2 =
+∞ t t
⋄ 9.1.43. Для исследования интеграла ˆ ∞
cos t 1
ˆ +∞ = · arccos d t
1 1 t t
x2 · sin x2 · cos d x
1 x ´∞
По признаку Дирихле интеграл 1 cost t d t схо-
вспомним, что в примере 9.1.39 мы доказали схо-
дится. А функция x 7→ arccos 1t монотонна и
димость интеграла
ограничена на [0, +∞).´Значит, по признаку Абе-
∞
ˆ +∞ ля, сходится интеграл 1 cost t ·arccos 1t d t, а вме-
2 2
x · sin x d x ´ 1
сте с ним и интеграл 0 arccos x
· cos x1 d x.
1 x
При этом,
(i) если эти интегралы сходятся, то справедливо следующее соотношение, показывающее,
что скорость их сходимости будет одинаковой:
ˆ c ˆ c
f (x) d x ∼ g(x) d x (9.1.12)
T T →c−0 T
! 9.1.46. Если интегралы (9.1.11) расходятся, то то соотношение (9.1.13) для сходящихся инте-
формула (9.1.12) утрачивает смыл, и поэтому пе- гралов возможно только, если подынтегральные
рестает быть верной. А если интегралы (9.1.11) функции совпадают. Действительно, из неравен-
сходятся, то формула (9.1.13), хотя и сохраняет ства g(x) > 0 следует, что интеграл от g не может
смысл, но также перестает работать. Например, быть нулевым,
x−1 1
∼ ˆ c ˆ T
x3 x→+∞ x2 g(x) d x = lim g(x) d x 6= 0
однако a T →c−0 a
ˆ T ˆ T
x−1 1 1 Поэтому соотношение (9.1.13), если оно выпол-
d x = − dx = няется, означает просто равенство пределов:
1 x3 1 x2 x3
T
1 1 1 1 1 ˆ T ˆ T
= − + 2 =− +1+ − ∼ lim f (x) d x = lim g(x) d x
x 2x T 2T 2 2 T →+∞ T →c−0 T →c−0
1 a a
T
1 1 1
∼ 6∼ 1 ∼ 1 − = − = Отсюда
T →+∞ 2 T →+∞ T →+∞ T x
1
ˆ T
1 0
= dx
>
x2 z }|
1 ˆ T {
То есть lim g(x) − f (x) d x =
T →c−0 a
T T
x−1 1
ˆ ˆ
T T
d x 6∼ dx
ˆ ˆ
1 x3 T →+∞ 1 x2 = lim g(x) d x − lim f (x) d x = 0
T →c−0 a T →c−0 a
Более того, можно заметить, что если одна из
функций не превосходит другую на интервале ⇓
интегрирования, например,
f (x) 6 g(x), x ∈ [a, c) f (x) = g(x), x ∈ [a, c)
Доказательство. Это следует из того, что интегралы по промежуткам [a; c) и [b; c) отличаются
друг от друга на константу
!
ˆ c ˆ t ˆ b ˆ t
f (x) d x = lim f (x) d x = lim f (x) d x + f (x) d x =
a t→c a t→c a b
ˆ b ˆ t ˆ b ˆ c
= f (x) d x + lim f (x) d x = f (x) d x + f (x) d x
a t→c b a b
Доказательство теоремы 9.1.45. . 1. Сначала докажем (9.1.11). Условие (b) означает, что
f (x)
−→ 1 (9.1.14)
g(x) x→c−0
f (x)
По определению предела Коши (с.324), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ ( 12 ; 23 ), то
есть
1 f (x) 3
∀x ∈ [b; c) < <
2 g(x) 2
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
1 3
∀x ∈ [b; c) g(x) < f (x) < g(x)
2 2
Перепишем это иначе: (
g(x) < 2f (x)
∀x ∈ [b; c) (9.1.15)
f (x) < 32 g(x)
Отсюда получаются две цепочки следствий. Во-первых,
ˆ c
интеграл f (x) d x сходится
a
Мы доказали (9.1.11).
2. Остается доказать (9.1.12) и (9.1.13). Обе эти формулы доказываются с помощью правила
Лопиталя. Сначала предположим, что оба интеграла сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a
Тогда
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
и поэтому
´c
T
f (x) d x 0 −f (T ) f (T )
lim ´ c = = (6.2.92) = lim = lim = (9.1.14) = 1
T →c−0 g(x) d x 0 T →c−0 −g(T ) T →c−0 g(T )
T
Тогда
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim = = (6.2.95) = lim = (9.1.14) = 1
T →c−0 T ∞ g(T )
´
g(x) d x T →c−0
a
⋄ 9.1.48. Чтобы понять, сходится ли интеграл Из формулы (9.1.13) можно вывести скорость
ˆ +∞ √ 2 расходимости:
x +1 ˆ T √ 2
dx x +1
ˆ T
1
1 x2 d x ∼ d x = ln T
x 2 T →+∞ x
1 1
заметим, что подынтегральная функция поло-
жительна, и подберем к ней эквивалентную: ⋄ 9.1.49. Рассмотрим интеграл
√ ˆ 1 √
x2 + 1 x 1 sin x
∼ = x
dx
x2 x→+∞ x2 x 0 e −1
Теперь по теореме 9.1.45 получаем, что сходи- Здесь особой точкой (x = 0) будет нижняя грани-
мость нашего интеграла эквивалентна сходимо- ца интегрирования, но теорема 9.1.45 применима
сти более простого интеграла: и к этому случаю, в очевидным образом пере-
формулированном виде. Опять подынтегральная
ˆ +∞ √ 2 ˆ +∞
x +1 1 функция положительна. Подберем к ней экви-
2
dx ∼ dx = валентную функцию при стремлении x к особой
1 x x→+∞ 1 x
+∞ точке: √ √
sin x x 1
= ln x = +∞ x
∼ = √
e − 1 x→0 x x
1
Мы получаем по теореме 9.1.45, что сходимость
Поскольку второй интеграл расходится, мы по- исходного интеграла эквивалентна сходимости
лучаем, что наш исходный интеграл тоже расхо- более простого интеграла
дится: ˆ +∞ √ 2 √
√ 1
ˆ 1 ˆ 1
x +1 sin x 1
d x = ∞ x
d x ∼ √ d x = 2 x
1 x2 0 e −1 0 0 x 0
§ 1. Несобственные интегралы 551
+∞ ˆ +∞
x + sin x x
ˆ
Второй интеграл сходится, значит, наш исходный
√ dx ∼ √ dx =
интеграл тоже сходится. Его скорость сходимо- 1 1+x 3 x→+∞ 1 x3
сти описывается формулой (9.1.12): √ +∞
ˆ +∞
1
√ = √ dx = 2 x
ˆ T
sin x
ˆ T
1 √ 1 x 1
x
d x ∼ √ dx = 2 T.
0 e −1 T →+0 0 x
Последний интеграл расходится, значит, наш ис-
⋄ 9.1.50. Те же самые рассуждения для инте- ходный интеграл тоже расходится. Скорость рас-
грала ходимсоти:
ˆ 1
1 − cos x
3
dx
0 ln(1 + x )
T ˆ T
x + sin x 1
ˆ
запишем короче: √ dx ∼ √ dx =
1 1 + x3 T →+∞ 1 x
1 1 x 2 √ T √ √
1 − cos x =2 x =2 T −2 ∼ 2 T
ˆ ˆ
2
dx ∼ dx = 1 T →+∞
0 ln(1 + x3 ) 0 0 x3
1 1
1 1 ⊲⊲ 9.1.53. Исследуйте на сходимость интегралы
ˆ
= d x = ln x
2 0 x 0 и оцените скорость сходимости и расходимости:
´ +∞ 1
Второй интеграл расходится, значит, наш исход- 1) 2 √ d x;
1+ x
ный интеграл тоже расходится. Скорость расхо- ´ +∞
2) 2 √1 d x;
димости описывается формулой 1+ x+x5
´ −2 1
ˆ 1 3) −∞ 1+x5 d x;
1 − cos x 1 11
ˆ
d x ∼ d x = − ln T ´1
3
T ln(1 + x ) T →+0 2 T x 4) 0 arctg√ x d x;
x3x
´ +∞ arctg x
⋄ 9.1.51. Снова интеграл по бесконечному про- 5) 1 √
x3x
d x;
межутку: ´ 1 arctg x
6) 0 √ 3
x
d x;
+∞ ˆ +∞
x + sin x x
ˆ ´ +∞ arctg x
√ dx ∼ √ dx = 7) 1 √3x d x;
1+x 6 x→+∞ x6
1 1 ´ 1 ex −1
ˆ +∞
x
ˆ +∞
1 1 +∞ 8) 0 x3 d x;
= d x = d x = − ´0 x
1 x3 1 x2 x 1 9) −1 e x−1 3 d x;
´1 1
Последний интеграл сходится, значит, наш ис- 10) 0 √x−1 d x;
ходный интеграл тоже сходится. Скорость схо- ´1 1
11) 0 √x−1 d x;
димости:
´1 1
ˆ +∞ ˆ +∞ 12) 0 ex −cos x d x;
x + sin x 1 1
√ dx ∼ 2
dx = ´ 1 ln(1+ √ 3 2
x )
T 1+x 6 T →+∞ T x T 13) 0 ex −1 d x;
´ +∞ ln(1+ x1 )
⋄ 9.1.52. Еще один интеграл по бесконечному 14) e x+ln x d x;
промежутку: ´ +∞ ln(1+ x1 +x)
15) e 1+ln x+sin x d x.
Тогда
552 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a f (x) d x: ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится, (9.1.16)
a a
f (x)
−→ 0. (9.1.20)
g(x) x→c−0
f (x)
По определению предела Коши (с.324), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ (−1; 1), то
есть
f (x)
∀x ∈ [b; c) − 1 < <1
g(x)
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
∀x ∈ [b; c) − g(x) < f (x) < g(x)
Перепишем это иначе:
∀x ∈ [b; c) |f (x)| < g(x) (9.1.21)
Отсюда получается следующая цепочка следствий:
ˆ c
интеграл g(x) d x сходится
a
⇓ лемма 9.1.47
ˆ c
интеграл g(x) d x сходится
b
⇓ теорема 9.1.33
ˆ c
интеграл f (x) d x сходится
b
2. Теперь вспомним о формулах (9.1.17) и (9.1.19). Они доказывается тем же приемом (с помощью
правила Лопиталя), что и формулы (9.1.12)-(9.1.13) выше. Сначала предположим, что оба интеграла
сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a
§ 1. Несобственные интегралы 553
Тогда
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
и поэтому
´c
T
f (x) d x 0 −f (T ) f (T )
lim c = = (6.2.92) = lim = lim = (9.1.20) = 0
T →c−0 −g(T )
´
T →c−0
T
g(x) d x 0 T →c−0 g(T )
Тогда
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim ´T = = (6.2.95) = lim = (9.1.20) = 0
T →c−0 g(x) d x ∞ T →c−0 g(T )
a
10
≫ e2
ˆ +∞ 10 x x→+∞
x sin x
dx Поэтому
0 ex
заметим, что ˆ +∞ x
e
ˆ +∞
x
x +∞
d x ≫ e 2 d x = 2e 2
10
dx ≫ e2 dx =
Поскольку больший интеграл (справа от ≪) схо- 1 x T →+∞ 1
дится, меньший (то есть наш исходный) интеграл T 1
= 2e 2 − 2e 2 ∼ 2e 2
T
1 ˆ +∞ ˆ 1
1 ˆ +∞ y
ln y ln y 1 −ey e
ˆ ˆ
y
=9 3
d y = −9 dy ≪ = e d = dy = dy ≫
+∞ y 1 y3 +∞ +∞ y +∞ y
2
1 y2 +∞
9 +∞
ˆ +∞ ˆ +∞ ˆ +∞ 2 ˆ +∞
y 1 y +∞
≪ −9 d y = −9 d y = ≫ dy = 1 dy = y
+∞ 1 y3 1 y2 y 1 +∞ 1 y 2
1 1
Последний интеграл сходится, значит меньший Последний интеграл расходится, значит боль-
(исходный) интеграл тоже сходится. Для скоро- ший (исходный) интеграл тоже расходится. Для
сти сходимости с помощью той же оценки полу- скорости расходимости получаем с помощью той
чается формула: же оценки формулу:
1 ˆ 1
ˆ T
ln x √3 = y, x = y13 ˆ 1 1
= y, x = y1 1
x e
1
d x =
x
= ey d ≫
√ d x = x → +0 ⇔ y → +∞ = x x = T ⇔ y = T1
0
3
x x = T ⇔ y = T1 T x=1⇔y=1 1
T
y T →+0
ˆ +∞
ln y
ˆ +∞
y
ˆ 1
y2 T1 1 1
T
= −9 3
d y ≪ −9 dy = ≫ 2
d y = y = −1 ∼
1
T
y T →+0 1
T
y3 T →+0 1 y 1 T T →+0 T
9 +∞ Применяя формулу
= 1 = 9T
y T
ey ≫ yε (ε > 0)
Сокращая константу 9, получаем: y→+∞
ˆ T
ln x можно добиться оценки
√ dx ≪ T
0
3
x T →+0 ˆ 1
1 1
ex dx ≫ (n ∈ N∗ )
Оценкой T T →+0 T n
x
sin t
ˆ
⋄ 9.1.62. Найдем асимптотику интеграла F (x) = d t = ... =
ˆ x 1 t2
sin t ˆ ∞
F (x) = dt (9.1.26) cos x cos t
1 t2 = A− 2 −2 dt =
x x t3
ˆ ∞
Прежде всего заметим, что существует конечный cos x d sin t
=A− 2 −2 =
предел x x t3
cos x 2 sin t ∞
ˆ ∞
ˆ ∞
sin t sin t
A = lim F (x) = dt =A− 2 − 3 − 6 dt =
t2 x t x t4
x→∞ 1 ˆ ∞x
cos x 2 sin x sin t
´∞ t =A− 2 + −6 dt =
– поскольку интеграл 1 sin t2 d t сходится абсо- x x 3 t4
| {z } x | {z}
лютно: o (
1
) ( t13 )
o
ˆ ∞ x→+∞ x
2
1 ∞
ˆ ∞ t→+∞
sin t 1 | {z }
dt 6 d t = − =1
t2 t2 t 1 o ( x12 )
x→+∞
1 1
Запомним это число A. Тогда, интегрируя по ча- cos x 1
= A− 2 + o
x x→+∞ x2
стям один раз, получим:
´∞ И так далее. Увеличивая число интегрирований
sin t
dt
1 t2
ˆ ∞ по частям, мы будем повышать точность асимп-
=
ˆ x
sin t sin t тотического разложения.
F (x) = 2
d t = A − dt =
1 t x t2
⋄ 9.1.63. Найдем асимптотику интеграла
cos t ∞
ˆ ∞ ˆ ∞
d cos t cos t
= A+ 2
= A+ 2 −2 dt = ˆ x
x t t x x t3 F (x) = tα · et d t, x → +∞
ˆ ∞
cos x cos t 1
=A− 2
+2 dt =
|x{z } x t3 }
| {z Интегрируя по частям, получаем:
o 1
x→+∞ x
( ) o
t→+∞
( )
1
t2
ˆ x ˆ x
| {z } F (x) = tα · e t d t = tα d e t =
o (x 1 1
x→+∞
1
) t=x ˆ x
1 = tα · e t − e t d tα =
t=1
=A+ o 1
x→+∞ x ˆ x
α x
=x ·e −e−α· (9.1.27) tα−1 · et d t
Это первое асимптотическое разложение. Если 1
проинтегрировать по частям два раза, получится Поглядим внимательно на последний интеграл:
более точная формула:
tα−1 · et ≪ tα · et
t→+∞
§ 2. Числовые ряды 557
⇓ (9.1.19) ⇓
ˆ x ˆ x
tα−1 · et d t ≪ tα · et d t = F (x)
1 x→+∞ 1 ˆ x
Мы получаем: tα · et d t = (9.1.27) =
1
ˆ x
F (x) = xα · ex −e + o (F (x)) α x
x→+∞ =x ·e −e−α· tα−1 · et d t = (9.1.29) =
| {z } 1
o (F (x))
x→+∞ α x α−1 x α−1 x
= x ·e −e−α· x ·e + o x ·e =
x→+∞
⇓
α x = xα · ex − α · xα−1 · ex −e + o xα−1 · ex =
F (x) = x · e + o (F (x)) |
x→+∞
{z }
x→+∞
o (xα−1 ·ex )
⇓ x→+∞
x = xα · ex − α · xα−1 · ex + o xα−1 · ex
ˆ
α t α x
F (x) = t ·e dt ∼ x ·e x→+∞
1 x→+∞
⇓ Получается разложение:
ˆ x
x
tα ·et d t = xα ·ex −α·xα−1 ·ex + xα−1 · ex
ˆ
α t
t · e dt = x · e + α x
o α x
(x · e ) (9.1.28) o
1 x→+∞
1 x→+∞
(9.1.30)
Это первое асимптотическое разложение. Из Здесь также можно заменить α на α − 1 и после
него можно выводить асимптотики более высо- этого подставить полученную формулу в (9.1.27)
кого порядка. Заменив в (9.1.28) α на α − 1, мы – тогда появится асимптотика более высокого по-
получим цепочку: рядка, и так далее. Понятно, что асимптотиче-
ˆ x
ская последовательность здесь берется такая:
tα−1 · et d t = xα−1 · ex + o xα−1 · ex
1 x→+∞
(9.1.29) xα · ex ≫ xα−1 · ex ≫ xα−2 · ex ≫ ...
x→+∞ x→+∞ x→+∞
§2 Числовые ряды
Представим, что у нас есть числовая последовательность {an } и нам захотелось сосчитать (беско-
нечную) сумму ее элементов:
∞
X
an = a1 + a2 + a3 + ...
n=1
В таких случаях говорят, что нужно вычислить сумму числового ряда. Интересное наблюдение, с
которого начинается вся теория рядов, состоит в том, что иногда такая бесконечная сумма оказы-
вается конечной величиной.
⋄ 9.2.1. Например, нетрудно убедиться (это сле- (мы это сделаем в замечании 12.2.30 на с.712). С
дует из приводимой ниже формулы (9.2.33)), что другой стороны, сумма может оказаться и беско-
X∞ нечной, например,
1
= 1
2n ∞
n=1 X 1
Труднее доказать, что =∞
n=1
n
X∞
1 π2
= (9.2.31)
n=1
n2 6 (это будет доказано в примере 9.2.19).
Тогда такая пара последовательностей {an } и {SN } называется числовым рядом и обо-
значается ∞
X
an = a1 + a2 + a3 + ...
n=1
P∞
Числа an называются слагаемыми ряда n=1 an , а числа SN – частичными суммами
этого ряда.
• Если частичные суммы стремятся к некоторому конечному пределу
SN −→ S, (S ∈ R)
N →∞
P∞
то этот предел S называется суммой ряда n=1 an , а сам ряд называется сходящимся
(или про него говорят, что он сходится). Коротко это записывают формулой
∞
X
an = S
n=1
6 ∃ lim SN ∈ R,
N →∞
P∞
то ряд n=1 an называется расходящимся (или про него говорят, что он расходится).
=
= −1 + 1 − 1 = −1 1
1−q
N
X
an = SN −→ S
N →∞
n=1
Поэтому
N
X N
X N
X
(an + bn ) = an + bn = AN + BN −→ A + B
N →∞
n=1 n=1 n=1
P∞ P∞ P∞
Это означает, что ряд n=1 (an + bn ) сходится, и его сумма равна A + B = n=1 an + n=1 bn , то
есть справедлива формула (9.2.36).
X∞ X∞ n n
⋄ 9.2.7. 2n + 3n 2 3
= + =
X∞ ∞ 5 n 5 5
5 5X 1 делаем замену n=1 n=1
= = n−1=k = X∞ n X∞ n
2n 2 n=1 2n−1 тогда k = 0, 1, 2, ... 2 3
n=1 = + = (9.2.33) =
∞ 5 5
5 X 1 5 1 n=1 n=1
= · = · 1 =5 1 1 5 5 25
2 2k 2 1− 2 = + = + =
k=0 2 3
1− 5 1− 5
3 2 6
⋄ 9.2.8.
X∞
1 π2
2
= ,
n=1
n 6
an −→ 0
i→∞
n=ki +1
562 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞
Доказательство. Рассмотрим частичные суммы ряда n=1 an :
N
X
SN = an
n=1
последовательность SN сходится
вспоминаем критерий Коши сходимости
m последовательности – теорему 4.2.70
!
замечаем, что
m Ski +li − Ski =
Pki +li
n=k +1 an
i
∀n ∈ N∗ an > 0
∞
X N
X N
X ∞
X
an = lim an = − lim bn = − an
N →+∞ N →+∞
n=1 n=1 n=1 n=1
an > 0, n ∈ N∗
P∞ PN
Тогда сходимость ряда n=1 an эквивалентна ограниченности его частичных сумм n=1 an , N ∈
N∗ :
∞
X N
X
an сходится ⇐⇒ sup an < ∞
n=1 N ∈N∗ n=1
PN
! 9.2.17. Условие справа (то есть утверждение, что частичные суммы n=1 an , N ∈ N∗ ограничены)
принято записывать неравенством
X∞
an < ∞
n=1
P∞
и, в силу теоремы 9.2.16, такая запись считается эквивалентной утверждению, что ряд n=1 an
сходится (при неотрицательных an ).
Доказательство. Поскольку an > 0, частичные суммы
N
X
SN = an
n=1
m
SN имеет конечный предел lim SN ∈ R
N →∞
m SN – монотонно неубывает
N
X
SN – ограничена сверху: sup an = sup SN < ∞.
N ∈N∗ n=1 N ∈N∗
P∞
• Число C в этой формуле называется постоянной Эйлера ряда n=1 f (n).
Как следствие,
∞
X ˆ ∞
ряд f (n) сходится ⇐⇒ интеграл f (x) d x сходится
n=1 1
• Такую связь между рядом и несобственным интегралом (когда сходимость одного экви-
валентна сходимости другого) коротко записывают формулой
∞
X ˆ ∞
f (n) ∼ f (x) d x.
n=1 1
P∞ ´∞
и говорят при этом, что ряд n=1 f (n) эквивалентен интегралу 1 f (x) d x.
564 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Доказательство. Заметим с самого начала, что нам достаточно рассмотреть случай ненулевой
невозрастающей функции f , потому что
— если f нулевая, то и ряд
∞
X
f (n),
n=1
и интеграл ˆ ∞
f (x) d x
1
оба сходятся,
— если же f ненулевая и неубывает,
то ни ряд
∞
X
f (n),
n=1
ни интеграл ˆ ∞
f (x) d x
1
и покажем, что она сходится. Для этого нужно просто заметить, что она ограничена и монотонна.
Действительно, во-первых,
∀x∈[n,n+1]
z }| {
f (n) > f (x) > f (n + 1)
⇓
ˆ n+1
f (n) > f (x) d x > f (n + 1) (9.2.38)
n
⇓
ˆ n+1
−f (n) 6 − f (x) d x 6 −f (n + 1)
n
ˆ n+1
0 6 f (n) − f (x) d x 6 f (n) − f (n + 1) (9.2.39)
n
FN
=
PN ´ N +1
n=1 f (n) − 1
f (x) d x
=
PN PN ´ n+1
n=1 f (n) − n=1 n
f (x) d x
=
z }| {
XN ˆ n+1 XN
06 f (n) − f (x) d x 6 f (n) − f (n + 1) =
n=1 n n=1
§ 2. Числовые ряды 565
↓ ↓ ↓ ↓ ↓ ↓
z}|{ z}|{ z}|{ z }| {
= f (1) − f (2) + f (2) − f (3) + ... + f (N ) −f (N + 1) = f (1) − f (N + 1) 6 f (1)
| {z } | {z } | {z } | {z }
n=1 n=2 n=N
6
0
⇓
0 6 FN 6 f (1)
И, во-вторых,
N +1
! N
!
X ˆ N +2 X ˆ N +1
FN +1 − FN = f (n) − f (x) d x − f (n) − f (x) d x =
n=1 1 n=1 1
N +1 N
! !
X X ˆ N +2 ˆ N +1 ˆ N +1 (9.2.39)
= f (n) − f (n) − f (x) d x − f (x) d x = f (N +1)− f (x) d x > 0
n=1 n=1 1 1 N
⇓
FN +1 > FN
Итак, FN монотонна и ограничена, и значит, имеет предел:
FN −→ A
N →∞
2. Заметим далее, что последовательность f (n) тоже монотонна и ограничена, и значит тоже
имеет предел:
f (n) −→ B
n→∞
´ n+1
(потому что n f (x) d x заключена между двумя милиционерами, стремящимися к B). Теперь
получаем:
N
X ˆ N N
X ˆ N +1 ˆ N +1
f (n) − f (x) d x = f (n) − f (x) d x + f (x) d x −→ A + B = C
1 1 N →∞
n=1 n=1
| {z } |N {z }
↓
=
B
FN
↓
A
N N
!
ˆ N X X ˆ N
f (x) d x = f (n) − f (n) − f (x) d x −→ S − C
1 1 N →∞
n=1 n=1
| {z } | {z }
↓ ↓
S C
ˆ N
f (x) d x −→ I
1 N →∞
566 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
и поэтому !
N
X N
X ˆ N ˆ N
f (n) = f (n) − f (x) d x + f (x) d x −→ C − I
1 N →∞
n=1
|
n=1
{z } |1 {z }
↓
↓
C I
PN
То есть, ряд n=1 f (n) сходится.
´N 1
dx
1 x
⋄ 9.2.21.
Это число привлекает внимание специалистов по
∞
X ∞
теории чисел тем, что за прошедшие с его от- 1 1
ˆ
крытия два с половиной века до сих пор так и не ∼ dx =
n=2
n ln n 2 x ln x
удалось понять, будет ли оно рациональным. ∞ ∞
1
ˆ
⋄ 9.2.20. Ряд Дирихле. Покажем, что = d ln x = ln ln x = ∞
2 ln x 2
∞
(
X 1 сходится, если α > 1 P ∞ 1
← Вывод: ряд n=2 n ln n расходится.
n α
n=1
расходится, если α 6 1
(9.2.41) ⋄ 9.2.22.
Этот ряд называется рядом Дирихле. При α > 0
∞
X ˆ ∞
к нему применима теорема 9.2.18, и в этом слу- 1 1
чае ему соответствуют постоянные Эйлера 2 ∼ dx =
n=2
n ln n 2 x ln2 x
X 1 ∞
N
ˆ ∞
1 N 1−α − 1 1 1
Cα = lim − (9.2.42) = 2 d ln x = − =
N →∞ n α 1−α 2 ln x ln x 2 ln 2
n=1 | {z }
P∞
=
´N 1
dx
Вывод: ряд n=2 n ln12 n сходится.
1 xα
Тогда
P∞ P∞
1) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :
∞
X ∞
X
an сходится ⇐= bn сходится
n=1 n=1
P∞ P∞
2) из расходимости меньшего ряда n=1 an следует расходимость большего ряда n=1 bn :
∞
X ∞
X
an расходится =⇒ bn расходится
n=1 n=1
P∞ P∞
Доказательство. Обозначим через AN и BN частичные суммы рядов n=1 an и n=1 bn :
N
X N
X
AN = an , BN = bn
n=1 n=1
Тогда
B1 6 B2 6 B3 6 ... 6 BN 6 ...
6
6
A1 6 A2 6 A3 6 ... 6 AN 6 ...
1. Теперь возникает логическая цепочка:
∞
X
ряд bn сходится
n=1
⇓ теорема 9.2.16
⋄ 9.2.25. ⋄ 9.2.26.
X∞ X∞
cos2 n 1 X∞
2 + cos n X∞
1
n
6 n >
n=1
2 n=1
2 n n
| {z } n=1 n=1
| {z }
сходится, расходится,
как сумма геометрической прогрессии в силу примера 9.2.19
со знаменателем |q| < 1
Больший ряд сходится, значит и меньший ряд Меньший ряд расходится, значит и больший ряд
сходится. расходится.
P∞ P∞
2
Вывод: ряд n=1 cos2n n сходится. Вывод: ряд n=1 2+cos
n
n
расходится.
568 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
X∞
⋄ 9.2.27. 1 1
= · √
X∞ ∞ ∞ arctg 4 n
2 + cos n X 3 X 1 n=1
| {z }
2
6 2
= 3 · 2
n=1
n n=1
n n=1
n расходится,
| {z } в силу примера 9.2.20
сходится,
в силу примера 9.2.20
P∞ 1
Вывод: ряд n=1
√
n·arctg(3+sin n)
расходится.
P∞ 2+cos n
Вывод: ряд n=1 n2 сходится. ⊲⊲ 9.2.29. Исследуйте на сходимость ряды:
⋄ 9.2.28. P P∞
1) P∞
n=1 e
−n2
; 4) n=1
4+cos n
nα ;
∞
X ∞
X ∞
2) n=1 √ ln n
; P∞
1 1 5) + sin n) ·
n=1 (2
3 2
√ > √ = P n
2n
n=1
n · arctg(3 + sin n) n=1
n · arctg 4 3) ∞n=1 n·3n ; nα .
Признак Даламбера.
Теорема 9.2.30 (признак Даламбера). Пусть an > 0, и
an+1
D = lim (9.2.44)
n→∞ an
Тогда
P∞
— если D < 1, то ряд n=1 an сходится;
P∞
— если D > 1, то ряд n=1 an расходится.
• Число
P∞ D, определяемое формулой (9.2.44), называется числом Даламбера ряда
n=1 a n .
Для доказательства нам понадобится следующая
P∞
Лемма 9.2.31 (лемма об остатке). Пусть n=1 an – числовой ряд, и M ∈ N – произвольное число.
Тогда
∞ ∞ ∞
!
X X X
ряд an сходится ⇐⇒ сходится ряд an называемый остатком ряда an
n=1 n=M n=1
Возьмем какое-нибудь число ε > 0 так чтобы D + ε < 1. Из (9.2.45) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
Если обозначить q = D + ε, то мы получим что q < 1 и
an+1
∀n > M <q
an
то есть
∀n > M an+1 < q · an
В частности,
aM+1 < q · aM
aM+2 < q · aM+1 < q · (q · aM ) = q 2 · aM
aM+3 < q · aM+2 < q · (q 2 · aM ) = q 3 · aM
...
aM+k < q · aM+k−1 < ... < q k · aM
Отсюда
∞
X ∞
X ∞
X ∞
X
an = aM+k < q k · aM = aM · qk
n=M k=0 k=0 k=0
Последний ряд сходится как
P∞геометрическая прогрессия со знаменателем q < 1. Значит, по признаку
P∞
сравнения, меньший ряд n=M an тоже сходится. Отсюда по лемме об остатке 9.2.31, ряд n=1 an
сходится.
2. Предположим, что наоборот,
an+1
D = lim >1 (9.2.46)
n→∞ an
Возьмем какое-нибудь число ε > 0 так чтобы D − ε > 1. Из (9.2.46) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
Если обозначить q = D − ε, то мы получим что q > 1 и
an+1
∀n > M q <
an
то есть
∀n > M an+1 > q · an
В частности,
aM+1 > q · aM
aM+2 > q · aM+1 > q · (q · aM ) = q 2 · aM
aM+3 > q · aM+2 > q · (q 2 · aM ) = q 3 · aM
...
aM+k > q · aM+k−1 > ... > q k · aM
Отсюда
∞
X ∞
X ∞
X ∞
X
an = aM+k > q k · aM = aM · qk
n=M k=0 k=0 k=0
Последний ряд расходится как P
геометрическая прогрессия со знаменателем q > 1. Значит, по при-
∞
знаку
P∞ сравнения, больший ряд n=M an тоже расходится. Отсюда по лемме об остатке 9.2.31, ряд
a
n=1 n расходится.
570 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
X∞
n · 2n (n+1)n+1
an+1 (n+1)!
3n D = lim = lim nn =
n=1 n→∞ an n→∞
n!
Тогда
P∞
— если C < 1, то ряд n=1 an сходится;
P∞
— если C > 1, то ряд n=1 an расходится.
P∞
• Число C, определяемое формулой (9.2.47), называется числом Коши ряда n=1 an .
Доказательство. 1. Предположим, что
√
C = lim n
an < 1 (9.2.48)
n→∞
Возьмем какое-нибудь число ε > 0 так чтобы C + ε < 1. Из (9.2.48) следует, что ε-окрестность числа
√
C содержит почти все числа n an , то есть
√
∃M ∀n > M C − ε < n an < C + ε
то есть
∀n > M an < q n
Отсюда
∞
X ∞
X
an < qn
n=M n=M
Возьмем какое-нибудь число ε > 0 так чтобы C − ε > 1. Из (9.2.49) следует, что ε-окрестность числа
√
C содержит почти все числа n an , то есть
√
∃M ∀n > M C −ε< n
an < C + ε
то есть
∀n > M an > q n
Отсюда
∞
X ∞
X
an > qn
n=M n=M
P∞ 2
⋄ 9.2.36. Чтобы исследовать на сходимость ряд Вывод: ряд 1+ 1 n
расходится.
n=1 n
X∞ n
n−1 ⊲⊲ 9.2.38. Исследуйте на сходимость ряды:
n=1
2n + 1 P∞ 1 2
1 n
1) n=1 2n · 1 + n ;
найдем его число Коши: P∞ 1 2
1 n
√ n−1 1 2) n=1 3n · 1 + n ;
C = lim n an = lim = <1 P∞
1 n
n→∞ 2n + 1 2 3) n=1 n · arcsin n ;
n→∞
P∞ n−1 n P∞ nn+ n1
Вывод: ряд n=1 2n+1 сходится. 4) n=1 (n+1)n (здесь признак Коши не дает ре-
⋄ 9.2.37. Рассмотрим ряд зультатов);
P∞ −n+sin n
X∞ n2 5) n=1 2 ;
1 P∞ 2+(−1)n
1+ 6) (этот ряд исследуется по при-
n=1
n n=1 2n
знаку Коши, но не по признаку Даламбера).
Его число Коши:
n
√ 1
C = lim n
an = lim 1 + =e>1
n→∞ n→∞ n
Доказательство.
∞
X
ряд |an | сходится
n=1
применяем критерий Коши
⇓ сходимости ряда – теорему 9.2.15
kX
i +li
∀ li , ki ∈ N ki −→ ∞ |an | −→ 0
n→∞ i→∞
n=ki +1
⇓
k +l k +l !
Xi i kX
i +li Xi i kX
i +li
06 an 6 |an | −→ 0 ⇒ an −→ 0 ⇒ an −→ 0
i→∞ i→∞ i→∞
n=ki +1 n=ki +1 n=ki +1 n=ki +1
572 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
⇓
kX
i +li
∀ li , ki ∈ N ki −→ ∞ an −→ 0
n→∞ i→∞
n=ki +1
снова применяем критерий Коши
⇓ сходимости ряда
∞
X
ряд an сходится
n=1
n=1
2n 2) n=1 (−1) 2 n3n .
S1 S3 S4 S2 S0
Ak = S2k−1 , Bk = S2k
A1 6 A2 6 A3 6 ... 6 b0 (9.2.53)
6
0
k
S2k−1
А, с другой, –
Ak = S2k−1 = b0 − (b1 − b2 ) − (b3 − b4 ) −... − b2k−1 6 b0
| {z } | {z } | {z }
6
6
0 0 0
0 6 ... 6 B2 6 B1 6 B0 (9.2.54)
0
k
S2k
А, с другой, –
Bk = S2k = (b0 − b1 ) + (b2 − b3 ) +... + (b2k−1 − b2k ) > 0
| {z } | {z } | {z }
6
0 0 0
При этом,
то есть
A = B,
и поэтому соотношения (9.2.55) удобно переписать так:
SN −→ S,
N →∞
574 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞ n
то есть ряд n=0 (−1) bn сходится. С другой стороны, из (9.2.56) следует двойное неравенство
и, во-вторых,
|S − SN | 6 bN +1 ,
((9.2.58) доказывает это неравенство для нечетных N , а (9.2.59) для четных). Это как раз и есть
неравенство (9.2.52).
можно представить в виде n=1 (−1)n bn , где Вывод: ряд n=1 (−1)n ln n сходится.
Действительно,
X X X p−1
q q p−1
X q X
a = a − a 6 a + a
n 6 2C
n n n n
n=p n=1 n=1 n=1 n=1
| {z } | {z }
>
>
C C
P∞
Чтобы убедиться, что ряд n=1 an · bn сходится, воспользуемся критерием Коши (теорема 9.2.15):
выберем произвольные последовательности li ∈ N и ki ∈ N (ki −→ ∞). По неравенству Абеля
n→∞
(8.2.135) получаем:
k +l N
X i i X n o
an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z } ↓ ↓
0 0
>
(9.2.60)
2C
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
Признак Дирихле часто используется для исследования рядов вида
∞
X ∞
X
bn · sin nx, bn · cos nx
n=1 n=1
монотонно
то мы получим bn −→ 0, и Ясно, что этот ряд
P∞сходится.
n→∞
Вывод: ряд n=1 sinnnx сходится при любом
XN XN x ∈ R.
sup an = sup sin nx =
N ∈N
n=1
N ∈N
n=1
⊲⊲ 9.2.51. Исследуйте на сходимость ряды:
= (9.2.61) = P∞ cos n
1) n=1 n ;
sin N x · sin N +1 x P ∞ cos nx
1 2)
= sup 2 2
6 n ;
x < +∞
n=1
x P
N ∈N sin 2
sin ∞ sin πn
2 3) n=1 ln n ;
12
Теорема 9.2.52 (признак Абеля). Пусть последовательности {an } и {bn } обладают следующими
свойствами:
P
(i) ряд ∞n=1 an сходится;
(ii) последовательность {bn } монотонна и ограничена.
P∞
Тогда ряд n=1 an · bn сходится.
P∞
Доказательство. Заметим, что из сходимости ряда n=1 an следует, что для произвольных после-
довательностей li ∈ N и ki ∈ N (ki −→ ∞) выполняется соотношение
n→∞
N
X
max an −→ 0 (9.2.62)
ki 6N 6ki +li i→∞
n=ki +1
то, переходя к подпоследовательности, мы получили бы, что для некоторого ε > 0 выполняется
соотношение N
X
max an > ε
ki 6N 6ki +li
n=ki +1
⇓
N
X i
∃Ni ∈ [ki , ki + li ] an > ε
n=ki +1
| {z }
здесь Ni > ki ,
потому что
иначе было бы
PN i
n=k +1 an = 0
i
⇓
k +m
iX i
∃mi = Ni − ki an > ε
n=ki +1
| {z }
↑
это невозможно,
потому что
по критерию Коши
P(теорема 9.2.15)
ki +mi
n=k +1 an −→ 0
i i→∞
§ 2. Числовые ряды 577
Теперь обозначим
B = sup |bn | < ∞
n∈N∗
P∞
Чтобы доказать сходимость ряда n=1 an · bn , снова воспользуемся критерием Коши (теоремой
9.2.15): для произвольных последовательностей li ∈ N и ki ∈ N (ki −→ ∞) по неравенству Абеля
n→∞
(8.2.135) мы получим
k +l N
X i i X n o
an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z }
>
>
↓ (9.2.62)
B B
0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
P∞ ln n
исследуется таким же образом. Если положить πn n
4) n=1 n · cos 12 · arccos − n+1 ;
sin nx · cos nx P∞ n(n+1) cos 1
an = , bn = arctg(nx) 5) n=1 (−1)
2 · √nn .
ln n
Это автоматически означает, что последовательность bn должна быть ненулевой, по крайней мере,
начиная с какого-то номера (потому что иначе делить на нее будет нельзя), и то же самое должно
быть справедливо для an (потому что иначе в пределе не получится единицы).
578 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
∞
X ∞
X
an сходится ⇐⇒ bn сходится
n=1 n=1
При этом,
(i) если эти ряды сходятся, то справедливо следующее соотношение, показывающее, что
скорость их сходимости будет одинаковой:
∞
X ∞
X
an ∼ bn (9.2.65)
N →∞
n=N n=N
(ii) если эти ряды расходятся, то справедливо следующее соотношение, показывающее, что
скорость их расходимости будет одинаковой:
N
X N
X
an ∼ bn (9.2.66)
N →∞
n=1 n=1
⇓
an
−→ 1
bn n→∞
⇓
an
∃L ∀n > L ∈ [1 − ε; 1 + ε]
bn
⇓
an
∃L ∀n > L 1 − ε 6 61+ε
bn
⇓
∃L ∀n > L (1 − ε) · bn 6 an 6 (1 + ε) · bn
⇓
∞
X ∞
X ∞
X
(1 − ε) · bn 6 an 6 (1 + ε) · bn (9.2.67)
n=L n=L n=L
(последнее двойное неравенство понимается как почленное сравнение рядов, определенное форму-
лой (9.2.43)). P∞ P∞
1. Покажем теперь, что сходимость ряда n=1 an эквивалентна сходимости ряда n=1 bn . С
одной стороны, справедлива такая цепочка:
∞
X
an сходится
n=1
§ 2. Числовые ряды 579
2. Теперь предположим, что оба ряда сходятся и докажем формулу (9.2.65). Из (9.2.67) получаем:
∞
X ∞
X ∞
X
∞
X ∞
X
∃L ∈ N∗ ∀N > L (1 − ε) · bn 6 an 6 (1 + ε) · bn здесь уже an и bn – числа
n=N n=N
n=N n=N n=N
⇓
P∞
an
∃L ∈ N∗ ∀N > L 1−ε 6 Pn=N
∞ 6 1+ε здесь ε ∈ (0; 1) с самого начала выбиралось произвольным
n=N bn
⇓
P∞
∗ an
∀ε ∈ (0, 1) ∃L ∈ N ∀N > L 1 − ε 6 Pn=N
∞ 61+ε
n=N bn
⇓
P∞
an
Pn=N
∞ −→ 1
n=N bn N →∞
3. Нам остается доказать (9.2.66) в предположении, что оба ряда расходятся. Здесь применяется
теорема Штольца 4.2.74. Из условия an ∼ bn следует, что, начиная с некоторого номера M , все
числа bn ненулевые (мы отмечали это при определении асимптотически эквивалентных последова-
тельностей на с.577), и поэтому положительны:
❆❯
0
То есть справедливо (9.2.66).
P∞ 1+n
P∞ ln(1+ n
1
) 8) n=1 α;
Вывод: ряд n=1 nα сходится при α > 0. ( n1 −sin n1 )
P∞ n 3 oα
⊲⊲ 9.2.61. Исследуйте на сходимость ряды: 9) n=1 1 + 1 2
n − 1 ;
P∞ √ 1+n2 2 P∞ α
(arctg n1 )
1) n=1 n · 1+n3 ; 10) n=1 1 .
1−cos
P∞ 1
n
2) n=1
√ ;
n(n+1)(n+2)
Тогда
P∞ P∞
(i) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :
∞
X ∞
X
an сходится ⇐= bn сходится (9.2.69)
n=1 n=1
∞
X ∞
X
an расходится =⇒ bn расходится (9.2.71)
n=1 n=1
an ≪ b n
n→∞
⇓
an
−→ 0
bn n→∞
582 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
⇓
|an |
−→ 0
bn n→∞
⇓
|an |
∃L ∀n > L <ε
bn
⇓
∃L ∀n > L |an | < ε · bn
⇓
∞
X ∞
X
|an | < ε · bn (9.2.73)
n=L n=L
⇓
∞
X
ряд ε · bn сходится
n=L
вспоминаем неравенство (9.2.73)
⇓ и признак сравнения рядов 9.2.24
∞
X
ряд |an | сходится
n=L
⇓
∞
X
ряд an сходится
n=1
⇓
P∞
|an |
∃L ∈ N∗ ∀N > L Pn=N
∞ <ε здесь ε > 0 с самого начала выбиралось произвольным
n=N bn
§ 2. Числовые ряды 583
⇓
P∞
|an |
∀ε > 0 ∃L ∈ N∗ ∀N > L Pn=N
∞ <ε
n=N bn
⇓
P∞
|an |
Pn=N
∞ −→ 0
n=N bn N →∞
⇓
P∞
an
Pn=N
∞ −→ 0
n=N bn N →∞
❆❯
0
То есть справедливо (9.2.72).
584 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
частичных сумм ряда в стандартных функциях. Первый результат на эту тему – очевидное след-
ствие теоремы 9.2.18:
Теорема 9.2.68. Пусть f – неотрицательная и невозрастающая функция на полуинтервале
[1; +∞). Тогда
XN ˆ N
f (n) = f (x) d x + C + o (1) (9.2.78)
1 N →∞
n=1
P∞ P∞
где C – постоянная Эйлера ряда n=1 f (n). Если вдобавок ряд n=1 f (n) расходится, то
N
X ˆ N
f (n) ∼ f (x) d x (9.2.79)
N →∞ 1
n=1
то, мы получим:
P
N
o n=1 f (n)
N →∞
!
=
N
X ˆ N z}|{ ˆ N XN
f (n) = f (x) d x + C + o (1) = f (x) d x + o f (n)
1 N →∞ 1 N →∞
n=1 | {z } n=1
=
P
N
o n=1 f (n)
N →∞
XN
1 где Cα – постоянные Эйлера (9.2.42). При 0 <
ln N +C + o (1)
= |{z} (9.2.80)
n N →∞ α < 1 этот ряд расходится, поэтому выполняется
n=1
=
´N 1
соотношение (9.2.79)
1 x dx
XN
где C – постоянная Эйлера (9.2.40). Мы отме- 1 N 1−α − 1
∼ .
чали в примере 9.2.19, и это видно из форму- n=1
nα N →∞ 1 − α
лы (9.2.80), что этот ряд расходится. Формула
Его можно немного упростить, воспользовав-
(9.2.79) для него принимает вид:
шись теоремой 7.1.34,
XN
1 N 1−α − 1 N 1−α 1 N 1−α
∼ ln N. = + ∼ ,
n N →∞ 1−α 1−α 1 − α N →∞ 1 − α
n=1 | {z } | {z }
⋄ 9.2.70. Частичные суммы ряда Дирихле
=
↓
∞ o (1)
X∞ N →∞
1
, и в результате мы получим
n=1
nα
XN
1 N 1−α
который мы рассматривали в примере 9.2.20, при α
∼ (0 < α < 1).
n N →∞ 1 − α
0 < α 6= 1 должны по теореме 9.2.68 удовлетво- n=1
586 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Теорема 9.2.71. Для любой гладкой функции f на отрезке [1, N ], N ∈ N∗ , справедлива формула:
N
X ˆ N ˆ N
f (n) = f (1) + f (x) d x + {x} · f ′ (x) d x (9.2.82)
n=1 1 1
! 9.2.72. Понятно, что выбор единицы в качестве нижнего предела суммирования здесь несуще-
ственен – сдвигом аргумента из (9.2.82) выводится, например, что для любой гладкой функции f
на отрезке [0, N ] справедлива формула
N
X ˆ N ˆ N
f (n) = f (0) + f (x) d x + {x} · f ′ (x) d x
n=0 0 0
[x]
X
F (x) = f (n) + {x} · f (x)
n=1
[x] k
X X
F (x) = f (n) + {x} · f (x) = f (n) + (x − k) · f (x) (9.2.83)
n=1 n=1
Отсюда видно, что на интервале (k, k + 1) функция F гладкая и имеет конечные односторонние
производные на концах.
2. Заметим далее (и это неожиданно), что функция F непрерывна. Мы уже показали, что на
каждом интервале (k, k + 1), k ∈ N∗ , она будет гладкой, поэтому ее непрерывность нужно проверить
только в целых точках. Зафиксируем какую-нибудь точку k ∈ N∗ и вычислим в ней значение F и
значения ее односторонних пределов:
[k] k
X X
F (k) = f (n) + {k} ·f (k) = f (n)
n=1
|{z} n=1
=
nX [x] o k−1
X k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 1 · f (k) = f (n)
x→k−0 x→k−0
n=1 n=1 n=1
nX [x] o k
X k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 0 · f (k) = f (n)
x→k+0 x→k+0
n=1 n=1 n=1
Видно, что эти три величины совпадают между собой, значит F непрерывна в k.
3. Заметим, что из формулы (9.2.83) следует, что на каждом интервале (k, k + 1), k ∈ N∗ , произ-
водная функции F имеет вид:
d X d
k
F ′ (x) = f (n) + (x − k) · f (x) = (x − k) · f (x) = 1 · f (x) + (x − k) · f ′ (x) = f (x) + {x} · f ′ (x)
d x n=1 dx
§ 2. Числовые ряды 587
f (1)
=
0
=
P1 z}|{
n=1 f (n) + {1} ·f (1)
=
z }| { ˆ N ˆ N ˆ N
′
F (N ) − F (1) = F (x) d x = f (x) d x + {x} · f ′ (x) d x
| {z } 1 1 1
PN =
n=1 f (n) + {N } ·f (N )
| {z }
=
0
=
PN
n=1 f (n)
⇓
N
X ˆ N ˆ N
f (n) − f (1) = f (x) d x + {x} · f ′ (x) d x
n=1 1 1
Интегралы
ˆ 1
εk = Ek (t) d t (9.2.86)
0
Доказательство. Кусочная гладкость и непрерывность при k > 0 следует из теоремы 8.3.41. Пе-
риодичность доказывается по индукции: для E0 (x) = {x} это верно, а если Ek−1 (x + 1) = Ek−1 (x),
то
ˆ x+1 ˆ x
Ek (x + 1) − Ek (x) = Ek−1 (t) d t − εk−1 · (x + 1) − Ek−1 (t) d t − εk−1 · x =
0 0
ˆ x+1 ˆ 1
= Ek−1 (t) d t − εk−1 = Ek−1 (t) d t − εk−1 = 0.
x 0
588 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
Для приложений будет полезно вычислить несколько первых чисел Эйлера и функций Эйлера
на периоде [0, 1).
Предложение 9.2.74. При x ∈ [0, 1) справедливы формулы:
1
E0 (x) = x, ε0 = (9.2.90)
2
x2 x 1
E1 (x) = − , ε1 = − (9.2.91)
2 2 12
x3 x2 x
E2 (x) = − + , ε2 = 0 (9.2.92)
6 4 12
Доказательство. При x ∈ [0, 1) получаем цепочку:
E0 (x) = {x} = x
⇓
1 1
1
ˆ ˆ
ε0 = E0 (t) d t = t dt =
0 0 2
⇓
x x
x x2 x
ˆ ˆ
E1 (x) = E0 (t) d t − ε0 · x = t dt − = −
0 0 2 2 2
⇓
1 1 1
t2 t t3 t2
= 1−1 =−1
ˆ ˆ
ε1 = E1 (t) d t = − dt = −
0 0 2 2 6 4 0 6 4 12
⇓
x x 2
t t x x3 x2 x
ˆ ˆ
E2 (x) = E1 (t) d t − ε1 · x = − dt+ = − +
0 0 2 2 12 6 4 12
⇓
1 1 1
3
t t t 2
t4 t3 t2
= 1 − 1 + 1 =0
ˆ ˆ
ε2 = E2 (t) d t = − + dt = − +
0 0 6 4 12 24 12 24 0 24 12 24
N
⋄ 9.2.75. В примере 9.2.69 мы нашли асимпто- X ˆ N ˆ N
1 dx {x}
тическую формулу для частичной суммы гармо- =1+ − dx =
n=1
n 1 x 1 x2
нического ряда: ˆ N
{x}
XN
1 = 1 + ln N − d x. (9.2.93)
= ln N + C + o (1) (9.2.80) 1 x2
n=1
n N →∞
Таким образом, нахождение асимптотики суммы
(C – постоянная Эйлера (9.2.40)). свелось к нахождению асимптотики интеграла
Покажем теперь, как с помощью формулы ˆ N ˆ N
Эйлера (9.2.82) можно эту асимптотику уточ- {t} E0 (t)
I(N ) = d t = d t (9.2.94)
нять. Взяв f (x) = x1 , мы по формуле Эйлера по- 1 t2 1 t2
лучим:
Он отличается от изучавшегося уже нами инте-
§ 2. Числовые ряды 589
XN ˆ N
грала (9.1.26) 1 {x}
ˆ x
sin t = 1 + ln N − dx =
dt n=1
n 1 x2
1 t2
1 1
тем, что синус sin t в подынтегральном выраже- = 1 + ln N − A + + o .
2N N →∞ N
нии заменен дробной частью {t}, а верхний пре-
дел стал дискретным. Метод нахождения асимп- Сравнив с (9.2.80), мы видим теперь, что посто-
тотики для (9.2.94) представляет собой модифи- янная A связана с постоянной Эйлера C равен-
кацию метода для (9.1.26). ством
Коротко идею можно сформулировать так: 1−A=C
здесь тоже нужно интегрировать по частям,
и поэтому полученную асимптотику можно пере-
но сначала нужно добиваться, чтобы в диффе-
писать так:
ренциале стояла функция Эйлера с подходящим
XN
индексом. А это достигается добавлением и вы- 1 1 1
читанием чисел Эйлера в периодической части = ln N + C + + o . (9.2.95)
n=1
n 2N N →∞ N
подынтегрального выражения.
Продемонстрируем это на интеграле (9.2.94). Это уточняет асимптотическую формулу
Прежде всего замечаем, что существует конеч- (9.2.80).
ный предел Ее можно и дальше уточнять. Для этого нуж-
ˆ ∞ но заметить, что, вычисляя асимптотику для
E0 (t)
A = lim I(N ) = dt I(N ), мы попутно вывели формулу
N →∞ 1 t2 ˆ ∞
1 E1 (t)
´∞
– поскольку интеграл 1 E0t2(t) d t сходится абсо- I(N ) = A − −2 dt
2N N t3
лютно:
ˆ ∞ Подставим ее в (9.2.93):
1 ∞
ˆ ∞
E0 (t) 1
dt 6 d t = − =1
t2 t2 t 1 XN ˆ N
1 1 1 {x}
= 1 + ln N − dx =
Запомним это число A. Тогда: n=1
n 1 x2
ˆ ∞
N
1 E1 (t)
E0 (t) = 1 + ln N − A + +2 dt =
ˆ
I(N ) = dt = 2N t3
1 t2 ˆ ∞N
ˆ ∞ ˆ ∞ 1 E1 (t)
E0 (t) E0 (t) = ln N + C + +2 d t (9.2.96)
= d t − dt = 2N N t3
t 2 t2
|1 {z } N
Отдельно найдем асимптотику последнего инте-
=
A
грала:
∞
ε0 + E0 (t) − ε0 ˆ ∞
ˆ
= A− dt = E1 (t)
t2 I2 (N ) = 2 dt =
N
ˆ ∞ ˆ ∞ N t3
1 E0 (t) − ε0 ˆ ∞
ε1 + E1 (t) + ε1
= A − ε0 d t − dt = =2 dt =
|{z} N t2 N t2 t3
ˆ ∞N
=
(9.2.90) ˆ ∞
1 1 E1 (t) − ε1
2
= 2 ε1 dt + 2 dt =
1 ∞ |{z} N t3 t3
ˆ ∞ ′
E1 (t) N
= A+ − dt =
=
(9.2.91)
2t N N t2 1
− 12
1 ∞
ˆ ∞ ˆ ∞
1 1 2 d E2 (t)
= A− − 2
d E1 (t) = (8.3.184) = = · 2 + 2 =
2N N t 2 · 12 t N N t3
E1 (t) ∞ 2E2 (t) ∞
ˆ ∞ ˆ ∞
1 E1 (t) 1 E2 (t)
=A− − 2 −2 dt = =− + + 6 dt =
2N t N N t3 12N 2 t 3 N t4
1 E1 (N )
ˆ ∞
E1 (t) ˆ ∞N
=A− + −2 dt = 1 2E2 (N ) E2 (t)
2N N 2 t3 } =− 2
− 3
+6 dt =
| {z } N | {z 12N | N{z } N t4 }
| {z
( t12 )
=
(9.2.89) o ( t13 )
=
t→∞
(9.2.89) o
0 | {z } 0 t→∞
| {z }
o (1) o ( N12 )
N →∞ N
N →∞
1 1 1 1
=A− + o =− + o
2N N →∞ N 12N 2 N →∞ N 2
Подставим это в (9.2.93): Подставив это в (9.2.96), получим:
590 Глава 9. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
XN ˆ ∞
1 1 E1 (t) Обозначим буквой A его значение:
= ln N + C + +2 dt =
n=1
n 2N N t3 ˆ ∞
E1 (x)
A= dx
1 1 1 1 x2
= ln N + C + − + o
2N 12N 2 N →∞ N 2
Тогда
Мы получили уточнение для формулы (9.2.95):
N
X
N 1
X 1 1 1 1 ln n = N · ln N − N + 1 + ln N +
= ln N + C + +− + o . n=1
2
n=1
n 2N 12N 2 N →∞ N 2 N
E1 (x) 1
ˆ
(9.2.97) + d x = N · ln N − N + 1 + ln N +
x 2 2
И так далее. Применяя функции Эйлера нуж- 1
ˆ ∞ ˆ ∞
ное число раз, можно добиться любой точности E1 (x) E1 (x)
+ dx− dx
асимптотического разложения. x2 | x
2
{z }
|1 {z } N
=
⋄ 9.2.76. Найдем асимптотику суммы
=
1
A o x
x→∞
N | {z }
X
=
ln n o (1)
N →∞
n=1
N 2 N →∞
x · ln x − 1N x d ln x n=1
´
1
=
0
z }| { (A определено выше). Понятно, что эту асимп-
=
N
X z}|{ N N
{x} тотику можно уточнять.
ˆ ˆ
ln n = ln 1 +ln x d x + dx =
n=1 1 1 x ⊲ 9.2.77. Уточните асимптотическую формулу
ˆ N
{x} (9.2.81) для частичных сумм ряда Дирихле:
= N · ln N − N + 1 + dx =
1 x X∞
ˆ N 1
E0 (x) α
, 0 < α 6= 1
= N · ln N − N + 1 + dx = n=1
n
1 x
ˆ N
ε0 + E0 (x) − ε0
= N · ln N − N + 1 + d x = Точное вычисление сумм. Неожиданное
1 x следствие формулы Эйлера состоит в том, что,
= N · ln N − N + 1+ если под знаком суммы стоит многочлен, то мы
ˆ N
dx
ˆ N
E0 (x) − ε0 можем в точности сосчитать частичную сумму
+ ε0 + dx = ряда.
|{z} 1 x 1 x
=
(9.2.90)
1 ⋄ 9.2.78. Выведем формулу для суммы
2
ˆ N
1 d E1 (x) XN
= N · ln N − N + 1 + ln N + dx = n2
2 1 x
1 E1 (x) N n=1
= N · ln N − N + 1 + ln N + +
2 | x{z 1} По формуле Эйлера получаем:
=
E1 (N ) E1 (1) N
X ˆ N ˆ N
N − 1
n2 = 1 + x2 d x + 2 {x} · x d x =
=
(9.2.89)
0 n=1 1 1
ˆ N
E1 (x) 1 N3 − 1
ˆ N
+ d x = N · ln N − N + 1 + ln N + =1+ +2 ε0 + E0 (x) − ε0 · x d x =
1 x2 2 3 1
ˆ N N
E1 (x) N3 − 1
ˆ
+ dx =1+ + 2 ε0 x d x+
1 x2 3 |{z} 1
=
(9.2.90)
Теперь заметим, что поскольку функция E1 1
2
ограничена на R, сходится абсолютно интеграл ˆ N
´ ∞ E1 (x)
1 x2 d x: +2 E0 (x) − ε0 · x d x =
1
ˆ ∞ ˆ ∞
E1 (x) M N3 − 1 N2 − 1
ˆ N
dx 6 dx < ∞ =1+ + +2 x d E1 (x) =
x2 x2 3 2
1 1 1
§ 2. Числовые ряды 591
N3 − 1 N2 − 1 N3 N2 N
=1+ + + = + +
3 2 3 2 6
N ˆ N
Вывод:
+ 2x · E1 (x) −2 E1 (x) d x =
1
| {z } | 1
{z } N
X N3 N2 N
=
2N · E1 (N ) − 2 · E1 (1) (N − 1)
´1
E1 (x) d x
n2 = + + (9.2.98)
0 3 2 6
=
(9.2.89) n=1
=
0 (N − 1) · ε1
⊲ 9.2.79. Найдите формулы для сумм:
=
(9.2.91)
− N12
−1
PN 3
1) n=1 n ,
N3 − 1 N2 − 1 N − 1 PN
=1+ + + = 2) 4
3 2 6 n=1 n .
Глава 10
ФУНКЦИОНАЛЬНАЯ
СХОДИМОСТЬ,
ФУНКЦИОНАЛЬНЫЕ РЯДЫ И
АППРОКСИМАЦИЯ
fn (x).
592
§ 1. Функциональные последовательности и функциональные ряды 593
fn (x) = nx
D = (−∞; 0]
nx −n−x
2) если x < 0, то f (x) = limn→∞ nx +n−x = ⊲⊲ 10.1.6. Постройте графики и найдите точки
2x
−1
limn→∞ nn2x +1 = 0−1
= −1; разрыва следующих функций:
0+1
— при |x| = 1 p
n! · x = n! · ∈Z
1
q
x2n ) n = 20 = 1,
f (x) = lim (1 + |{z}
n→∞ ⇓
k
1
cos 2π · n! · x = 1
— при |x| > 1
⇓
1
f (x) = lim (1 + x2n ) n =
n→∞
n1 cosm 2π · n! · x = 1
1
= lim x2 · 2n
+1 = x2 · 10 = x2 . ⇓
n→∞ x
|{z}
↓
0
lim cosm 2π · n! · x = 1
m→∞
§ 1. Функциональные последовательности и функциональные ряды 595
Это верно для n > q, то есть для почти всех n. | cos 2π · n! · x| < 1
Поэтому
⇓
m
lim lim cos 2π · n! · x = 1 = D(x) m
lim cos 2π · n! · x = 0
n→∞ m→∞ m→∞
N
X
∀x ∈ E an (x) −→ S(x). (10.1.5)
N →∞
n=1
∞
X
xn
n=1
X∞
будет, как мы уже отмечали в теореме 9.2.5, мно- 1
жество (−1; 1). Для наглядности в таких случаях n=1
nx
596Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
P∞ (−1)n
Вывод: областью сходимости ряда n=1 nx
является множество (0; +∞).
⋄ 10.1.11. Найдем область сходимости ряда 3. Нам остается посмотреть, что будет при
∞
X n x = − 17
9 :
(−1)
p
n· 3n · (x + 2)n ∞
X X∞
n=1 (−1)n (−1)n
p = q =
Для этого сразу заметим, что область определе- n (x + 2)n 1 n
n=1 n · 3 · 9 n=1 n · 3n ·
ния нашего ряда (то есть общая область опреде-
X∞ n X∞
ления слагаемых ряда) есть множество x > −2. (−1) (−1)n
1. Исследуем теперь ряд на абсолютную схо- = 1 =
n=1
n · 3n · 3n n=1
n
димость (то есть пробуем применить к нему тео-
рему 9.2.39): Этот ряд сходится по признаку Лейбница:
∞
X (−1)n
p =
n · 3n · (x + 2)n
n=1
∞
X 1
= p =
n=1 n· 3n · (x + 2)n
∞
X 1 Вывод: областью сходимости ряда
= √ n P∞
n· 3· x+2 (−1)n
n=1 n=1 n
√ n
является множество
17 n·3 · (x+2)
Находим число Коши: − 9 ; +∞ .
s
1 1 ⊲⊲ 10.1.12. Найдите область сходимости функ-
C = lim n
√ n = √
n→∞ n· 3· x+2 3· x+2 циональных рядов:
§ 1. Функциональные последовательности и функциональные ряды 597
P∞ cos nx
1) n=1 (признак Дирихле + необходимое
n условие сходимости);
P∞
условие сходимости); 6) n 1
(теорема об абсолютной
P∞ cos nx n=1 x + n·2n ·xn
2) n=1 n n (теорема об абсолютной сходимо-
√ сходимости + признак Даламбера + необхо-
сти); димое условие сходимости);
P∞ n! P∞ n
3) n x
n=1 xn (необходимое условие сходимости); 7) n=1 n+1 · 2x+1 (теорема об абсолютной
P∞ xn
4) n=1 1−xn (теорема об абсолютной сходи- сходимости + признак Даламбера + необхо-
мости + признак Даламбера + необходимое димое условие сходимости);
условие сходимости); P∞ n·32n n n
P∞ 2n ·sinn x 8) n=1 2n · x · (1 − x) (теорема об абсолют-
5) n=1 n2 (теорема об абсолютной сходи- ной сходимости + признак Даламбера + необ-
мости + признак Даламбера + необходимое ходимое условие сходимости).
D⊆E =⇒ kf kD 6 kf kE (10.1.12)
Доказательство. Все эти свойства напрямую следуют из свойств модуля. Например, полуаддитив-
ность доказывается так:
kf + gkE = sup |f (x) + g(x)| 6 (4.1.11) 6 sup |f (x)| + |g(x)| = (4.1.30) =
x∈E x∈E
= sup |f (x)| + sup |g(x)| = kf kE + kgkE
x∈E x∈E
598Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Доказательство.
x∈E
fn (x) ⇒ f (x)
n→∞
⇓
k fn (x) − f (x) kx∈E = sup |fn (x) − f (x)| −→ 0
x∈E n→∞
⇓
∀x ∈ E 0 6 |fn (x) − f (x)| 6 sup |fn (x) − f (x)| −→ 0
x∈E n→∞
⇓
∀x ∈ E |fn (x) − f (x)| −→ 0
n→∞
⇓
∀x ∈ E fn (x) − f (x) −→ 0
n→∞
⇓
∀x ∈ E fn (x) −→ f (x)
n→∞
⇓
x∈E
fn (x) −→ f (x)
n→∞
Это соотношение можно интерпретировать так, = max{ sup |xn − 0| , |1n − 1|} =
x∈(−1,1)
что функциональнгая последовательность .
= max{1, 0} = 1 −→ 0
fn (x) = xn , x ∈ (−1, 1], n→∞
§ 1. Функциональные последовательности и функциональные ряды 599
⋄ 10.1.16. Та же самая функциональная по- kfn (x) − f (x)kx∈[0;1] =
xn − xn+1
x∈[0;1] =
следовательность, рассмотренная на отрезке
1 1 = sup xn − xn+1
−2, 2 , x∈[0;1]
1 1 Это можно сделать, построив график функции
fn (x) = xn , x∈ − , , fn (x) = xn − xn+1 с помощью производной:
2 2
будет равномерно на нем стремиться к функции fn′ (x) = nxn−1 − (n + 1)xn =
f (x) = 0 (получающейся из функции (10.1.14) n−1 n
=x (n − (n + 1)x) = 0 ⇔ x ∈ 0;
ограничением на этот отрезок): n+1
Интервалы возрастания и убывания на отрезке
||fn (x) − f (x)||x∈E = ||xn − 0||x∈[− 1 ; 1 ] =
2 2 [0; 1]:
n
1
= sup |xn −0| = sup |xn | = −→ 0
x∈[− 12 ; 12 ] x∈[− 21 ; 12 ] 2 n→∞
⋄ 10.1.17. Последовательность
sin x
fn (x) = Значение функции в точке максимума:
n
стремится к функции f (x) = 0 поточечно на мно- n nn nn+1
fn = − =
жестве E = R: n+1 (n + 1)n (n + 1)n+1
sin x x∈R nn n nn 1
−→ 0, = 1 − = · =
n n→∞ (n + 1)n n+1 (n + 1)n n + 1
1 1
и эта сходимость равномерна на E = R: = n ·
1 + n1 n+1
sin x График:
||fn (x) − f (x)||x∈E =k − 0 kx∈R =
n
sin x 1 1
= sup − 0 = · sup | sin x| = −→ 0.
x∈R n n x∈R n n→∞
x
Проверим, будет ли это стремление равномер- k fn (x) − f (x) kx∈[−a;a] =k arctg kx∈[−a;a] =
n
ным:
x
r = sup arctg =
x∈[−a;a] n
1 ˆ
k fn (x) − f (x) kx∈R =k x2 + 2 − |x| kx∈R = x ′
n t
r = sup arctg d t =
1 домножаем на n
x∈[−a;a] −a t
= sup x2 + 2 − |x| = сопряженный = ˆ
x∈R n радикал x 1
n
q 2 = sup d t =
2 + 1 2 x∈[−a;a] −a 1 + n2
t2
x − |x|
n 2
= sup q = ˆ x 1
x∈R x2 + n12 + |x| = sup n
dt 6
t2
x∈[−a;a] −a 1 + n2
2 ˆ x 1
x + n12 − x2 1 n 1
= sup q = sup q
n2 =
6 sup d t = · (a − a) −→ 0
x∈R x∈[−a;a] −a 1 + 0 n n→∞
x2 + 12 + |x| x∈R x2 + 12 + |x|
n n
1 1 Вывод: последовательность fn (x) = arctg nx стре-
= 2· q =
n inf 1 мится к f (x) = 0 (поточечно и) равномерно на
x∈R x2 + n2 + |x|
множестве E = [−a; a]:
1
1 1 n2 1
= ·q = 1 = −→ 0 x x∈[−a;a]
n2 0 + n12 + 0 n
n n→∞ arctg ⇒ 0
n n→∞
q
⊲⊲ 10.1.22. Проверьте соотношения:
Вывод: последовательность fn (x) = x2 + n12
x∈R
стремится к f (x) = |x| (поточечно и) равномерно 1) arctg x ⇒ 0;
n
на множестве E = R: n→∞
r x∈[−a;a]
1 x∈R 2) sin nx ⇒ 0 (воспользоваться тем же приемом, что
x2 + 2 ⇒ |x| n→∞
n n→∞ и в примере 10.1.21);
x∈(−∞;0)
⋄ 10.1.21. Рассмотрим функциональную после- 3) nx ⇒ 0;
довательность n→∞
|x|< 43
x 1
4) ⇒ 1;
fn (x) = arctg 1+xn
n→∞
n
|x|<1
1
на множестве E = [−a; a]. Ясно, что она пото- 5) 1+xn ⇒ 1;
n→∞
чечно стремится к функции f (x) = 0: x>0
nx −n−x
6) nx +n−x ⇒ 1;
x x∈[−a;a] n→∞
arctg −→ arctg 0 = 0
n n→∞ |x|<1
7) sin2n x ⇒ 0;
Проверим, будет ли это стремление равномер- n→∞
|x|< π
ным: 2
8) sin2n x ⇒ 0;
n→∞
5◦ . Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке
[a, b], и хотя бы для одной точки c ∈ [a, b] существует конечный предел
f (xi ) −→ f (c)
i→∞
Для этого зафиксируем какой-нибудь ε > 0 и покажем, что почти все числа f (xi ) содержатся в
интервале (f (c) − ε, f (c) + ε), то есть, что для почти всех номеров i ∈ N выполняется неравенство
fN (xi ) −→ fN (c)
i→∞
Тогда функция f будет непрерывна в силу уже доказанного свойства 10 , поэтому для всякой точки
c ∈ (a, b) мы получим
lim lim fn (x) = lim f (x) = f (c) = lim fn (c) = lim lim fn (x)
x→c n→∞ x→c n→∞ n→∞ x→c
То есть ˆ b ˆ b
fn (x) d x − f (x) d x −→ 0
a a n→∞
или ˆ b ˆ b
fn (x) d x −→ f (x) d x
a n→∞ a
а это уже означает, что выполняется (10.1.16):
ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x
n→∞ a a n→∞
5. Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке [a, b]
к какой-то функции g,
x∈E
fn′ (x) ⇒ g(x), (10.1.20)
n→∞
и хотя бы для одной точки c ∈ [a, b] существует конечный предел (10.1.17):
H = lim fn (c).
n→∞
◦
Тогда, в силу доказанного уже свойства 2 , функция g непрерывна на отрезке [a, b]. Поэтому можно
рассмотреть функцию ˆ x
f (x) = H + g(t) d t, x ∈ [a, b] (10.1.21)
c
Покажем, что функции fn равномерно сходятся к функции f на отрезке [a, b]. Заметим, что
ˆ x ˆ x
|fn (x) − f (x)| = fn (c) + ′
fn (t) d x − H + g(t) d t =
ˆ x c ˆ x
c
ˆ x
= (fn (c) − H) + ′
fn (t) d x − g(t) d t 6 |fn (c) − H| + (fn′ (t) − g(t)) d t 6
ˆc x c
ˆ x c
′
6 |fn (c) − H| + |fn (t) − g(t)| d t 6 |fn (c) − H| + sup |fn′ (t) − g(t)| d t =
c c t∈[a,b]
= |fn (c) − H| + sup |fn′ (t) − g(t)| · |x − c| = |fn (c) − H| + k fn′ (t) − g(t) kt∈[a,b] ·|x − c|
t∈[a,b]
Отсюда
k fn (x) − f (x) kx∈[a,b] = sup |fn (x) − f (x)| = |fn (c) − H|+ k fn′ (t) − g(t) kt∈[a,b] · sup |x − c| 6
x∈[a,b] x∈[a,b]
То есть,
x∈E
fn (x) ⇒ f (x). (10.1.22)
n→∞
Теперь формула (10.1.18) становится очевидной:
′
′
lim fn = (10.1.22) = (f ) = (10.1.21) = g = (10.1.20) = lim fn′
n→∞ n→∞
§ 1. Функциональные последовательности и функциональные ряды 603
pi −→ ∞, qi −→ ∞ (10.1.23)
i→∞ i→∞
то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение
k fki +li (x) − fki (x) kx∈E =k fpi (x) − fqi (x) kx∈E −→ 0
i→∞
2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(10.1.26). Возьмем какие-нибудь две бесконечно большие последовательности индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
и положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
fmax{pi ;qi } (x) − fmin{pi ;qi } (x), если pi > qi
fpi (x) − fqi (x) = fmin{pi ;qi } (x) − fmax{pi ;qi } (x), если pi < qi =
0, если pi = qi
fki +li (x) − fki (x), если pi > qi
= fki (x) − fki +li (x), если pi < qi
0, если pi = qi
k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E
поэтому
k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E −→ 0
i→∞
604Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
и значит,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞
Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {fn (x)} сходится равномерно к некоторой функ-
ции f , то есть
k fn (x) − f (x) kx∈E −→ 0
i→∞
то {fn (x)} обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие
последовательности индексов {pi }, {qi } ⊆ N
pi −→ ∞, qi −→ ∞
i→∞ i→∞
Соответствующие подпоследовательности {fpi (x)} и {fqi (x)} тоже сходится равномерно к f (x), по-
тому что
k fpi (x) − f (x) kx∈E −→ 0, k fqi (x) − f (x) kx∈E −→ 0
i→∞ i→∞
поэтому
0 6k fpi (x) − fqi (x) kx∈E =k fpi (x) − f (x) + f (x) − fqi (x) kx∈E 6 (10.1.10) 6
6k fpi (x) − f (x) kx∈E + k f (x) − fqi (x) kx∈E −→ 0 + 0 = 0
i→∞
То есть,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞
и это значит, что {fn (x)} действительно должна обладать свойством (i).
4. Пусть выполнено (i), то есть для любых последовательностей индексов
pi −→ ∞, qi −→ ∞
i→∞ i→∞
выполняется соотношение
k fpi (x) − fqi (x) kx∈E −→ 0 (10.1.27)
i→∞
0 6 |fpi (a) − fqi (a)| 6 sup |fpi (x) − fqi (x)| =k fpi (x) − fqi (x) kx∈E −→ 0
x∈E i→∞
Это значит, что для всякой точки a ∈ E числовая последовательность {fn (a)} сходится по критерию
Коши 4.2.70. Обозначим через f (a) ее предел:
Предположим, что это не так, то есть что числовая последовательность cn =k fn (x) − f (x) kx∈E не
стремится к нулю:
cn =k fn (x) − f (x) kx∈E −→ 0 (10.1.29)
n→∞
0
Тогда, по свойству 2 на с.276, существуют подпоследовательность pi −→ ∞ и число ε > 0 такие,
i→∞
что
cpi > ε
То есть,
k fpi (x) − f (x) kx∈E = sup |fpi (x) − f (x)| > ε
x∈E
§ 1. Функциональные последовательности и функциональные ряды 605
то есть
fpi (ai ) − ε < f (ai ) < fpi (ai ) − ε
Вспомним теперь формулу (10.1.28): число f (ai ) является пределом последовательности fn (ai ) и
лежит в интервале (fpi (ai ) − ε, fpi (ai ) − ε) Значит, почти все числа fn (ai ) лежат в этом интервале:
а отсюда
k fpi (x) − fqi (x) kx∈E > |fpi (ai ) − fqi (ai )| > ε
Это противоречит формуле (10.1.27). Таким образом, наше предположение (5.7) неверно.
P
1◦ . Если ряд ∞n=1 an (x) равномерно сходится на множестве E, то равномерная норма его
частичных сумм ограничена:
XN
sup
an
< ∞.
n∈N∗
n=1 E
0
2 . Если функции an непрерывны на множестве E и ряд
∞
X
an (x)
n=1
непрерывна на множестве E.
30 . Если функции an непрерывны на интервале (a, b) и ряд
∞
X
an (x)
n=1
равномерно сходится на (a, b), то для всякой точки c ∈ (a, b) справедливо равенство
! ∞
X∞ X
lim an (x) = lim an (x) (10.1.31)
x→c x→c
n=1 n=1
равномерно сходится на отрезке [a, b], и хотя бы для одной точки c ∈ [a, b] сходится
числовой ряд
∞
X
an (c) (10.1.33)
n=1
равномерно сходится на отрезке [a, b], причем его сумма будет гладкой на [a, b], и ее
производную можно вычислить почленным дифференцированием:
∞
!′ ∞
X X
an = a′n (10.1.34)
n=1 n=1
Доказательство. 1. Свойство
P∞ 1◦ следует сразу из свойства 1◦ на с.600.
2. Пусть дан ряд n=1 an (x), коэффициенты которого an (x) – непрерывные функции на мно-
жестве E. Тогда частичные суммы
N
X
SN (x) = an (x)
n=1
будут непрерывны на множестве E (по теореме 4.3.14), как конечные суммы непрерывных функ-
ций). Если ряд сходится равномерно на E, то есть частичные суммы стремятся равномерно на E к
некоторой функции S(x)
x∈E
SN (x) ⇒ S(x),
N →∞
равномерно сходятся на интервале (a, b). Это значит, что его частичные суммы
N
X
SN (x) = an (x)
n=1
По свойству 3◦ на с.600, отсюда следует, что для всякой точки c ∈ (a, b) справедливо равенство
то есть равенство !
∞
X ∞
X
lim an (x) = lim an (x)
x→c x→c
n=1 n=1
608Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
PN
равномерно сходятся на отрезке [a, b]. Это означает, что частичные суммы ряда SN = n=1 an
непрерывны на [a, b] и стремятся равномерно на [a, b] к некоторой функции S
x∈(a,b)
SN (x) ⇒ S(x),
N →∞
то есть, ! !
ˆ b ∞
X ∞
X ˆ b
an (x) dx = an (x) d x
a n=1 n=1 a
равномерно сходятся на отрезке [a, b], и для какой-нибудь точки c ∈ [a, b] сходится ряд
∞
X
an (c)
n=1
P
Тогда частичные суммы SN = N n=1 an – гладкие функции на [a, b], последовательность их произ-
водных равномерно сходится на [a, b] к некоторой функции g(x)
x∈[a,b]
′
SN (x) ⇒ g(x),
N →∞
lim SN (c)
N →∞
По свойству 5◦ на с.601, отсюда следует, что функции SN равномерно на [a, b] сходится (к некоторой
гладкой функции S),
x∈[a,b]
SN (x) ⇒ S(x),
N →∞
причем ′
′
lim SN = lim SN
N →∞ N →∞
⋄ 10.1.27. Сумма членов геометрической про- потому что частичные суммы ряда не ограниче-
грессии, рассматривавшаяся в теореме 9.2.5, ны по равномерной норме на этом интервале:
представляетс собой функциональныцй ряд
N
∞
X
X n
xn kSN (x)kx∈(−1;1) = sup x >
x∈(−1;1) n=1
n=1
XN X N
сходящийся поточечно на интервале (−1, 1): > lim xn = 1n = N −→ ∞.
x→1 N →∞
∞ n=1 n=1
X 1
xn = , x ∈ (−1, 1).
1−x (а в силу свойства 1◦ на с.606 для сходимости
n=1
ряда эта последовательность должна быть огра-
Однако эта сходимость не равномерна на (−1, 1), ничена).
Теорема 10.1.28 (критерий Коши равномерной сходимости ряда). Пусть {an } – произвольная
последовательность функций, определенных на множестве x ∈ E. Тогда следующие условия экви-
валентны:
(i) функциональный ряд
∞
X
an
n=1
PN
Доказательство. Для частичных суммы SN (x) = n=1 an (x) мы получаем следующую логиче-
скую цепочку:
∞
X
ряд an (x) сходится равномерно на E
n=1
Необходимое условие равномерной сходимости ряда. Часто бывает, что частичные суммы
функционального ряда не поддаются вычислению, как, например, в случае с рядом
∞
X x
sin (10.1.35)
n=1
n2
Чтобы понять, сходится этот ряд равномерно, или нет, используются теоремы, называемые призна-
ками равномерной сходимости. Первый из них звучит так:
x∈E
an (x) ⇒ 0
n→∞
Доказательство. По критерию Коши (теорема 10.1.28), если этот ряд сходится равномерно на E,
то для последовательностей li = 1, и ki = i должно выполняться условие
k +l
Xi i X
i+1
an (x) = an (x) = ||ai+1 (x)||x∈E −→ 0
i→∞
n=ki +1 x∈E n=i+1 x∈E
⋄ 10.1.30. Рассмотрим ряд (10.1.35): Это можно сделать, например, с помощью фор-
∞
X мулы Ньютона-Лейбница: при x > 0 мы получа-
x ем
sin
n=1
n2
(5.1.129)
9.2.39), он сходится при любом x ∈ R: z }| { x
dt
ˆ
∞ | arctg x | = arctg x = 6
x
X X∞ X∞
x 1 0 1 + t2
sin 2 6 (5.1.92) 6 2 = |x|· <∞ ˆ x
n n n2
n=1 n=1 n=1 6 1 d t = x = |x|
0
Поймем, будет ли он сходиться равномерно на
множестве E = R. Для этого вычислим норму
общего члена: и отсюда уже для x < 0 получаем
x
x
sin 2
= sup sin 2 = 1 −→ 0
n x∈R x∈R n n→∞
0 0
<
>
(5.1.130)
Вывод: ряд сходится на R, но не равномерно. z }| { z}|{
arctg x = − arctg x = arctg( −x ) 6 −x = |x|
⊲ 10.1.31. Проверьте, будет ли ряд сходится рав-
номерно на множестве R:
∞ ⊲⊲ 10.1.32. Проверьте, будут ли данные ряды
X x
arctg 2 сходится равномерно на множестве E:
n=1
n P∞ n
1. x , E = (−1; 1);
Здесь предварительно нужно доказать формулу, Pn=1
∞ n n
аналогичную (5.1.92):
2. n=1 x · (1 − x ), E = [0; 1] (здесь необхо-
димо исследование функции xn · (1 − xn ) на
| arctg x| 6 |x|, x∈R (10.1.36) экстремум на множестве [0; 1]).
§ 1. Функциональные последовательности и функциональные ряды 611
||an (x)||x∈E −→ 0
i→∞
n=ki +1
Отсюда k +l
Xi i kX
i +li
0 6 an (x) 6 ||an (x)||x∈E −→ 0
i→∞
n=ki +1 x∈E n=ki +1
⇓
k +l
Xi i
an (x) −→ 0
i→∞
n=ki +1 x∈E
Поскольку это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), по критерию Ко-
i→∞
P∞
ши равномерной сходимости функционального ряда (теорема 10.1.28), ряд n=1 an (x) равномерно
сходится на множестве E.
⋄ 10.1.34. Проверим, будет ли ряд (10.1.35) схо- Вывод: ряд сходится равномерно на отрезке [0; 1].
диться равномерно на множестве [0; 1]:
⊲⊲ 10.1.35. Проверьте, будут ли данные ряды
X∞
x сходится равномерно на множестве E:
sin 2 P∞
n 1. 1
E = R;
n=1 n=1 x2 +n2 ,
P∞ n
Для этого вычислим норму общего члена: 2. n=1 x , E = − 21 ; 12 ;
P∞
x
x 1 3. x
n=1 1+n4 ·x2 , E = R (здесь необходимо ис-
sin 2
= sup sin 2 = sin 2
n x∈[0;1] x∈[0;1] n n следование функции 1+nx4 ·x2 на экстремум);
P∞ n·x
Теперь получаем 4. n=1 1+n5 ·x , E = R;
P∞ n n+1
∞
x x
X
x
X∞
1 5. n=1 n − n+1 , E = R;
sin 2
= sin 2 6 P∞ n2
n=1
n x∈[0;1] n=1 n 6. √ (xn + x−n ) , E = 1, 2 .
n=1 n! 2
X∞
1
6 (5.1.92) 6 2
<∞
n=1
n
Тогда
P∞ n
(a) функциональный ряд n=0 (−1) bn сходится равномерно на множестве E,
(b) его остаток оценивается сверху нормой своего первого члена:
∞
X
(−1)n bn (x) 6 ||bN +1 ||E (10.1.40)
n=N +1 x∈E
Доказательство. Из признака Лейбница сходимостиP числового ряда (теорема 9.2.43) следует, что
при каждом фиксированном x ∈ E числовой ряд ∞ n=0 (−1)n
b n (x) сходится. Обозначим через S(x)
его сумму, а через SN (x) его частичные суммы:
∞
X N
X
S(x) = (−1)n bn (x), SN (x) = (−1)n bn (x)
n=0 n=0
⇓
∞
X
n
||S(x) − SN (x)||x∈E = sup |S(x) − SN (x)| = sup (−1) bn (x) 6 ||bN +1 ||E
x∈E x∈E n=N +1
То есть справедлива оценка (10.1.40). Из нее сразу следует равномерная сходимость ряда:
⇓
||S(x) − SN (x)||x∈E −→ 0
N →∞
⇓
x∈E
SN (x) ⇒ S(x)
N →∞
Действительно,
q
q
q
p−1
X
X p−1
X
X
X
an (x)
=
an (x) − an (x)
6
an (x)
+
an (x)
6 2C
n=p
x∈E n=1 n=1 x∈E n=1 x∈E n=1 x∈E
| {z } | {z }
>
>
C C
>
>
bk (x)
x∈E
bki +li (x)
x∈E
>
i +1
P
N
n=ki +1 an (x)
x∈E
>
(10.1.42)
2C
⇓
k +l
Xi i
n o
an (x) · bn (x)
6 6 · C · max kbki +1 (x)kx∈E , kbki +li (x)kx∈E −→ 0
| {z } | {z } i→∞
n=ki +1 x∈E ↓ (10.1.41) ↓ (10.1.41)
0 0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
1. n=1
√
3 2
n +ex
, E = R;
|x| · (1 + |xN |) P∞
6 sup 6 cos 2πn
x∈(−1;0) |1 − x| 2. n=1
√ , E = R (здесь нужно применить
3
n2 +x2
supx∈(−1;0) |x| · (1 + |xN |) формулы (9.2.61));
2 P∞ sin x·sin nx
6 6 =2 3. √ , E = R (тоже нужны форму-
inf x∈(−1;0) |1 − x| 1 n=1 n+1
лы (9.2.61)).
614Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
>
B B
>
P
N
n=ki +1 an
E
⇓
k +l N
X i i X
an · bn 6 3B · max an −→ 0
ki 6N 6ki +li i→∞
n=ki +1 n=ki +1
| {z }
↓ (10.1.43)
0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится равномерно.
Всюду непрерывная, но нигде не диффе- мых этого ряда образуют сходящийся ряд
ренцируемая функция. X∞ X∞
bn kcos(an πx)kx∈R = bn < ∞
⋄ 10.1.41. Пусть числа a и b удовлетворяют n=0 n=0
условиям:
поэтому по признаку Вейерштрасса (теорема
∗ 3 10.1.33), функциональный ряд в (10.1.44) сходит-
0 < b < 1, a ∈ 2N − 1, ab > 1 + π
2 ся равномерно, и значит, определяет непрерыв-
ную функцию. Зафиксируем точку x ∈ R и убе-
Тогда функция
димся, что f не дифференцируема в ней.
X∞ Заметим прежде всего, что
f (x) = bn cos(an πx) (10.1.44) 3
n=0 ab > 1 + π
2
определена и непрерывна всюду на R, но не диф- ⇓
ференцируема ни в одной точке.
3 π
Доказательство. Равномерные нормы слагае- > (10.1.45)
2 ab − 1
§ 1. Функциональные последовательности и функциональные ряды 615
Далее рассмотрим три последовательности: k−1
X cos an π(x + h ) − cos(an πx)
n k
6 b · 6
hk
1 1 1 1 n=0
ξk = ak x + − ∈ − , k−1 k−1
2 2 2 2 X an πhk X
6 bn · =π· (ab)n =
1 hk
αk = ak x + = ak x − ξk ∈ Z n=0 n=0
2
k (ab)k − 1 πak bk
3 1 = (3.2.107) = π · 6
1 − ξk 2 − a x+ 2 ab − 1 ab − 1
hk = =
ak ak
После этого оценим R. Пусть n > k. Тогда,
(здесь [·] и {·} – целая и дробная части числа, во-первых,
определенные формулами (3.2.149) и (3.2.155)).
Очевидно, что ak · (x + hk ) = ak · x + ak · hk =
3 k 3 k 1
0 < hk 6 (10.1.46) =a ·x+ − a x+ =
2ak 2 2
1 1
⇓ = ak · x + − ak x + +1=
2 2
hk −→ 0,
1
k→∞ = ak x + + 1 = αk + 1
поэтому наша задача будет выполнена, если мы 2
докажем, что ⇓
f (x + hk ) − f (x)
−→ ∞ an · π · (x + hk ) = an−k · ak (x + hk ) · π =
hk k→∞
= an−k · (αk + 1) · π
Обозначим
⇓
k−1
X n n
n cos a π(x + hk ) − cos(a πx)
S= b ·
n=0
hk cos an ·π·(x+hk ) = cos an−k · (αk + 1) ·π =
∞ | {z }
X n n
n cos a π(x + hk ) − cos(a πx)
∋
R= b · . Z
hk
n=k
2N∗ − 1
∈
Тогда z }| {
n−k αk +1
= (−1) an−k ·(αk +1)
= (−1) a = (−1)αk +1
f (x + hk ) − f (x)
=
hk Во-вторых,
∞
X n n ak · x = αk + ξk
n cos a π(x + hk ) − cos(a πx)
= b · =
n=0
hk ⇓
∞ n n−k
k−1
X X a ·x=a · (αk + ξk )
= + =S+R
⇓
n=0 n=k
Сначала оценим сверху S: cos an πx = cos an−k · π · (αk + ξk ) =
cos an π(x + hk ) − cos(an πx) = = cos an−k παk + an−k πξk = (11.3.135) =
= cos an πx + an πhk − cos(an πx) = (5.1.89) = = cos an−k αk π · cos an−k πξk −
| {z }
2an πx + an πhk an πhk
=
n
= 2 sin
2 · sin 2 6 a πhk (−1)a
n−k ·α
k
| {z } | {z }
− sin an−k αk π · sin an−k πξk =
>
>
n (5.1.92)
1 a πhk
2 | {z }
=
an πhk
2
0
n−k
·αk
⇓ = (−1)a · cos an−k πξk =
2N∗ − 1
k−1
∈
X n n z }| {
n cos a π(x + hk ) − cos(a πx) n−k αk
|S| = b · 6
hk = (−1) a · cos an−k πξk =
n=0
616Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
= (−1)αk · cos an−k πξk 0
=
z }| {
Вместе мы получаем: 1 + cos a k − k πξ
k
> bk · =
hk
| {z }
cos an π(x + hk ) − cos(an πx) = n=k
αk +1 αk n−k
−π π
= (−1) − (−1) · cos a πξk = 2, 2
∈
z}|{
= (−1)αk +1 1 + cos an−k πξk 1 + cos πξk bk 2ak bk
k
=b · > (10.1.46) >
hk hk 3
⇓ Теперь получаем:
f (x + hk ) − f (x)
∞ > |R| − |S| >
X 1 + cos a n−k
πξk hk
|R| = (−1)αk · bn · =
hk 2ak bk πak bk
n=k
∞ > − =
X n 1 + cos an−k πξk 3 ab − 1
= b · =
hk 2 π
n=k | {z } = − (ab)k −→ ∞
3 ab − 1 k→∞
| {z }
6
<
(10.1.45)
∞ 0
X 1 + cos a n−k
πξk
= bn · >
hk
n=k
f0 = f, ∀k ∈ N ∃fk′ = fk+1 .
1
m
X m
X
(m) (m)
1
kf kE = kf (x)kx∈E := ·
f (k)
= · sup |f (k) (x)| (10.1.47)
k! E k! x∈I
k=0 k=0
§ 1. Функциональные последовательности и функциональные ряды 617
(m)
kf kE 6 kf kE
⋄⋄ 10.1.42. 1
+ · sup |2| = 4 + 4 + 1 = 9
2 x∈[0;2]
2
(0)
x
= sup |x2 | = 4 (1)
x∈[0;2] ksin xkx∈R = sup | sin x| + sup | cos x| = 1 + 1 = 2
x∈[0;2] x∈R x∈R
2
(1)
x
= sup |x2 | + sup |2x| = 4 + 4 = 8 (2)
ksin xkx∈R = sup | sin x| + sup | cos x|+
x∈[0;2]
x∈[0;2] x∈[0;2] x∈R x∈R
2
(2) 1 1
x
= sup |x2 | + sup |2x|+ + · sup | − sin x| = 1 + 1 + = 2, 5
x∈[0;2]
x∈[0;2] x∈[0;2] 2 x∈R 2
1◦ . Неотрицательность:
(m)
kf kE >0 (10.1.48)
причем
(m)
kf kE =0 ⇐⇒ ∀k = 0, ..., m ∀x ∈ E f (k) (x) = 0 (10.1.49)
2◦ . Однородность:
(m) (m)
kλ · f kE = |λ| · kλ · f kE , λ∈R (10.1.50)
3◦ . Полуаддитивность:
(m) (m) (m)
kf + gkE 6 kf kE + kgkE (10.1.51)
4◦ . Полумультпликативность:
(m) (m)
D⊆E =⇒ kf kD 6 kf kE (10.1.53)
(m) (n)
m6n =⇒ kf kE 6 kf kE (10.1.54)
Доказательство. Как и в случае со свойствами равномерной нормы на с.597, все эти утверждения
следуют напрямую из свойств модуля. Мы предоставляем читателю самостоятельно проверить их
справедливость.
618Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
pi −→ ∞, qi −→ ∞ (10.1.58)
i→∞ i→∞
Следующие две теоремы аналогичны теоремам 10.1.28 и 10.1.33, и доказывается так же:
Теорема 10.1.44 (критерий Коши равномерной по производным сходимости ряда). Для последо-
вательности функций an ∈ C m (E) следующие условия эквивалентны:
(i) функциональный ряд
∞
X
an (x)
n=1
что она является бесконечно гладкой в окрест- ⋄ 10.1.49. Для любой последовательности чи-
ности точки x = 0. Чтобы это понять, вычислим сел
сначала односторонние производные в этой точ- a<α<β<b
ке. Ясно, что левая производная равна нулю: существует бесконечно гладкая функция η ∈
′ C ∞ (R) со следующими свойствами:
f− (0) = 0
η(x) = 0, x∈/ (a, b)
Найдем правую:
η(x) = 1, x ∈ (α, β)
1 1
e− x = t 0 < η(x) < 1, x ∈ (a, α) ∪ (β, b)
′
f+ (0) = lim = x = lim te −t
= 0
x→+0 x t → +∞ t→+∞
Доказательство. Можно взять
Мы получили, что первая производная суще- η(x) = ha,α (x) + 1 − hβ,b (x),
ствует в каждой точке. Существование осталь-
ных проверяется по индукции. Предположим, где ha,α и hβ,b – функции из примера 10.1.48.
что мы доказали, что существует производная
порядка n. Очевидно, она имеет вид Лемма 10.1.50. Для любых ε > 0 и n ∈ N суще-
ствует гладкая функция ϕ ∈ C ∞ [−1; 1] со следу-
( P (x) 1
n −x
e , x>0 ющими свойствами:
f (n) (x) = Qn (x)
0, x60 1) в точке x = 0 все ее производные равны нулю,
кроме производной порядка n, которая равна
где Pn (x) и Qn (x) некоторые многочлены. Отсю- единице,
да получаем (
0, k 6= n
ϕ(k) (0) =
(n+1) Pn (x)e −x1
1, k = n
f+ (0) = lim =
x→+0 xQn (x)
1 2) ее равномерная норма на отрезке [−1, 1] по
= t Rn (t) −t производным до порядка n − 1 меньше ε,
= x = lim e =0
t → +∞ t→+∞ Sn (t)
(n−1)
kϕk[−1,1] < ε.
где Rn (t) и Sn (t) – некоторые новые многочле-
ны. Доказательство. Положим δ = εe (где e – чис-
ло Непера) и рассмотрим функцию η из примера
⋄ 10.1.47. Для любого интервала (a, b) на R 10.1.49 со следующими свойствами:
существует бесконечно гладкая функция g ∈
C ∞ (R) со следующими свойствами:
η(x) = 0, x∈/ (−δ, δ)
( η(x) = 1, x ∈ − δ2 , 2δ
ga,b (x) = 0, x ∈ / (a, b) 0 < η(x) < 1, – в остальных случаях
ga,b (x) > 0, x ∈ (a, b)
Рассмотрим последовательность функций fn ,
Доказательство. Можно положить определенную рекуррентными соотношениями:
f0 = η,
ga,b (x) = f (b − x) · f (x − a), (´ x
f
0 ´ m−1
(t) d t, x∈
/ [0, 1]
где f – функция из примера 10.1.46. fm (x) = 0 , m>1
− x fm−1 (t) d t, x∈
/ [−1, 0)
⋄ 10.1.48. Для любого интервала (a, b) на R су- По предложению 8.3.43, все функции fm явля-
ществует бесконечно гладкая функция ha,b ∈
ются гладкими на отрезке [−1, 1], причем
C ∞ (R) со следующими свойствами:
′
fm = fm−1 , m>1
ha,b (x) = 0, x6a
Отсюда следует формула:
0 < ha,b (x) < 1, x ∈ (a, b)
ha,b (x) = 1, x>b
fm−k , 06k<m
(k)
fm = η, k=m (10.1.64)
Доказательство. Этими свойствами будет обла-
(k−m)
η , k>m
дать функция
´x Из нее, в свою очередь, следует три важных для
ga,b (t) d t нас соотношения:
ha,b (x) = ´ab ,
g a,b (t) d t (
a
(k) 0, k 6= m
fm (0) = , (10.1.65)
где ga,b – функция из примера 10.1.47. 1, k = m
§ 1. Функциональные последовательности и функциональные ряды 621
>
если k = m, то δ,
по предположению
(k) индукции
fm (0) = η(0) = 1,
И вместе получается (10.1.66) для m:
и если же k > m, то
n o
(k)
fm (0) = η (k−m) (0) = 0. kfm k[−1,1] = max kfm k[−1,0] , kfm k[0,1] 6 δ
↑
постоянная Неравенство (10.1.67) доказывается вычисле-
на интервале
(− δ2 , 2δ ) нием:
1
m−1
X
Неравенство (10.1.66) доказывается индукци- (m−1)
(k)
ей. При m = 1 получаем, с одной стороны, kfm k[−1,1] = ·
fm
= (10.1.64) =
k! [−1,1]
k=0
ˆ x m−1
X 1
kf1 k[0,1] = sup |f1 (x)| = sup η(t) d t = = · kfm−k k[−1,1] 6 (10.1.66) 6
x∈[0,1] x∈[0,1] 0 k!
k=0
ˆ x ˆ δ m−1 ∞
!
X 1 X 1 ε
= sup η(t) d t = η(t) d t 6 6 ·δ < ·δ =e· =ε
x∈[0,1] 0 0 k! k! e
k=0 k=0
6 δ · sup η(x) = δ
x∈[0,δ] После того, как соотношения (10.1.65)–
(10.1.67) доказаны, нам остается положить
С другой стороны,
ϕ = fn
kf1 k[−1,0] = sup |f1 (x)| =
x∈[−1,0] и мы получим
ˆ
0
ˆ 0 (
= sup − η(t) d t = sup η(t) d t = (k) 0, k 6= n
x∈[−1,0] x x∈[−1,0] x ϕ = (10.1.65) =
ˆ 0
1, k = n
= η(t) d t 6 δ · sup η(x) = δ и
−δ x∈[−δ,0] (n−1)
kϕk[−1,1] < (10.1.67) < ε
Вместе это дает
n o
kf1 k[−1,1] = max kf1 k[−1,0] , kf1 k[0,1] 6 δ Теорема 10.1.51 (Борель). Для любой последо-
вательности чисел a = {an ; n ∈ N} существу-
Далее, если для m − 1 неравенство (10.1.66) уже ет гладкая функция f на R такая, что
доказано, то для m получаем: с одной стороны,
∀n ∈ N f (n) (0) = an (10.1.68)
kfm k[0,1] = sup |fm (x)| = Доказательство. Выберем последовательность
x∈[0,1]
ˆ x функций ϕn со следующими свойствами:
= sup fm−1 (t) d t 6 1) если an = 0, то ϕn = 0,
x∈[0,1] 0
2) если an 6= 0, то ϕn выбирается по лемме
6 sup (x − 0) · sup |fm−1 (x)| 6
x∈[0,1] x∈[0,1] 10.1.50 так, чтобы выполнялись условия:
6 1 · kfm−1 k[−1,1] 6δ (
| {z } 0, 6 n
k=
ϕ(k)
n = , (10.1.69)
1, k=n
>
δ,
по предположению (n−1) 1
индукции kϕn k[−1,1] < (10.1.70)
2n−1 · |an |
622Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Заметим, что функциональный ряд штрасса 10.1.45 следует, что его сумма
∞
X ∞
X
an · ϕn f= an · ϕn
n=0 n=0
(n−1)
n=0
kan · ϕn k[−1,1] ,
⇑ и отсюда
(10.1.55)
⇑
∞
X
k 6n−1
X f (k) (0) = an · ϕ(k) (0) = (10.1.69) = ak
=
(n−1)
|an | · kϕn k[−1,1] 6 (10.1.70) 6 | n{z }
n=0
↑
n>k+1 среди этих чисел
X 1 X 1 отлично от нуля
6 |an | · = <∞ только с индексом
2n−1 · |an | 2 n−1
n=k
n>k+1 n>k+1
ˆ
⋄⋄ 10.1.52.
´
ksin xkx∈[0,2π] = | sin x| d x =
2
´ x3 x=2 8 [0,2π]
ˆ
x
= |x2 | d x = = ˆ π ˆ 2π
x∈[0;2] 3 x=0 3
[0;2] = sin x d x − sin x d x =
0 π
x=π x=2π
´ ˆ
ksin xkx∈[0;π] = | sin x| d x = = − cos x + cos x =2+2=4
x=0 x=π
[0;π]
ˆ π x=π
= sin x d x = − cos x =2
0 x=0
2◦ . Пусть функции fn интегрально сходятся на отрезке [a, b], тогда интеграл их предела
совпадает с пределом интегралов:
ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x. (10.1.78)
a n→∞ n→∞ a
◦ ◦
Следующие свойства следуют из свойств 1 и 2 на с.623.
◦
P∞
2 . Пусть функциональный ряд n=1 an интегрально сходится на отрезке [a, b], тогда ин-
теграл его суммы совпадает с суммой интегралов:
ˆ b X ∞
! ∞ ˆ b
X
an (x) d x = an (x) d x. (10.1.80)
a n=1 n=1 a
N N
⋄ 10.1.55. Ряд X X
∞
X SN (x) = (1 − x) · xn = (xn − xn+1 ) =
n
x n=1 n=1
n=1 x∈[0;1]
= x − xN +1 −→ x = S(x)
не сходится интегрально на отрезке [0; 1], пото- N →∞
му что его частичные суммы не ограничены по
интегральной норме на этом отрезке: Интегральная норма остатка:
N
1X
ˆ ´
kSN (x) − S(x)kx∈[0;1] =
´
kSN (x)kx∈[0;1] = xn d x =
ˆ 1
0 n=1
= (x − xN +1 ) − x d x =
N ˆ
X 1 N
X 1 0
= xn d x = −→ ∞. 1
xN +2 1 1
ˆ
0 n + 1 N →∞ N +1
n=1 n=1 = x dx = = −→ 0
0 N +2 0 N + 2 N →∞
(а в силу замечания (d) для сходимости ряда эта
P
последовательность должна быть ограничена). Вывод: ряд ∞ n
n=1 (1 − x) · x сходится на отрезке
⋄ 10.1.56. Выясним, будет ли ряд [0; 1] интегрально к сумме S(x) = x.
∞
X ⊲⊲ 10.1.57. Выясните, будет ли данный ряд схо-
(1 − x) · xn диться интегрально на отрезке [0, 1]:
n=1
P∞ x
1) n=1 (nx−x+1)(nx+1) ;
сходиться интегрально на отрезке [0; 1]. В при- P∞ P∞ √ √
x √
мере 10.1.56 мы нашли поточечный предел его 2) n=1 nx+x+ nx =
√
n=1 nx + x − nx ;
частичных сумм: P∞ xn +(x+1)n P∞ 1 1
3) n=1 xn ·(x+1)n = n=1 (x+1)n + xn .
§2 Аппроксимация
(a) Приближение интегрируемых функций
Приближение интегрируемой функции кусочно постоянными.
• Функция g на отрезке [a, b] называется кусочно-постоянной, если существует разбиение
τ = {x0 , ..., xk } отрезка [a, b] такое, что на каждом интервале (xi−1 , xi ) функция g посто-
янна:
g(s) = g(t), s, t ∈ (xi−1 , xi )
Понятно, что всякая кусочно-постоянная функция g будет кусочно-гладкой, и значит, интегри-
руемой на [a, b]. Если через Ci обозначить значения g на интервалах постоянства (xi−1 , xi ),
g(x) = Ci , x ∈ (xi−1 , xi ),
то по лемме 8.3.37, интеграл по каждому отрезку [xi−1 , xi ] от g будет равен интегралу от Ci по
этому отрезку ˆ xi
g(x) d x = Ci · xi − xi−1
xi−1
§ 2. Аппроксимация 625
b k
X
ˆ
g(x) d x = Ci · xi − xi−1 (10.2.81)
a i=1
Теорема 10.2.1. Для любой интегрируемой функции f на отрезке [a, b] и любого ε > 0 можно
найти кусочно-постоянную функцию g на [a, b] такую, что
´ ˆ b
kf − gk[a,b] = |f (x) − g(x)| d x < ε (10.2.82)
a
Доказательство. Выберем разбиение τ = {x0 , ..., xk } отрезка [a, b] так, чтобы нижняя сумма Дарбу
sτ отличалась от интеграла меньше чем на ε:
ˆ b
06 f (x) d x − sτ < ε
a
(а в последней точке xk = b функцию g можно определить, например, положив g(b) = f (b)). Тогда
мы получим:
g(x) 6 f (x), x ∈ [a, b]
и поэтому
ˆ b ˆ b ˆ b ˆ b
| f (x) − g(x) | d x = f (x) − g(x) d x = f (x) d x − g(x) d x = (10.2.81) =
a | {z } a a a
6
0
ˆ b k
X ˆ b
= f (x) d x − inf f (x) · ∆xi = f (x) d x − sτ < ε
a x∈[xi−1 ,xi ] a
i=1
| {z }
=
sτ
Теорема 10.2.2. Для любой интегрируемой функции f на отрезке [a, b] и любого ε > 0 можно
найти непрерывную функцию g на [a, b] такую, что
´ ˆ b
kf − gk[a,b] = |f (x) − g(x)| d x < ε (10.2.84)
a
а также условие
g(a) = 0 = g(b) (10.2.86)
626Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
sup |g(x)| = max sup |gi (x)| 6 max sup |fi (x)| = sup |f (x)|
x∈[a,b] 16i6n x∈[a,b] 16i6n x∈[a,b] x∈[a,b]
3. Наконец, если f – произвольная интегрируемая функция, и ε > 0, то, подберем для нее по
теореме 10.2.1 кусочно-постоянную функцию, обозначим ее h, так, чтобы
b
ε
ˆ
|f (x) − h(x)| d x <
a 2
§ 2. Аппроксимация 627
Затем, по уже доказанному, мы можем подобрать для функции h непрерывную функцию g так,
чтобы ˆ b
ε
|h(x) − g(x)| d x <
a 2
И тогда мы получим:
ˆ b ˆ b ˆ b
|f (x) − g(x)| d x = |f (x) − h(x) + h(x) − g(x)| d x 6 |f (x) − h(x)| + |h(x) − g(x)| dx =
a a a
b b
ε ε
ˆ ˆ
= |f (x) − h(x)| d x + |h(x) − g(x)| d x < + =ε
a a 2 2
Если кроме того, h и g выбирались так, чтобы удовлетворять условиям (10.2.85) и (10.2.83), то мы
получим
(10.2.85) (10.2.83)
sup |g(x)| 6 sup |h(x)| 6 sup |f (x)|
x∈[a,b] x∈[a,b] x∈[a,b]
4. Последнее условие (10.2.86) можно обеспечить, поправив еще немного функцию g в окрестно-
сти точки a или b так, как мы это делали в пункте 1 (то есть линейно).
(b) Свертка
• Сверткой функций f : R → R и g : R → R называется функция f ∗g : R → R, определенная
формулой
ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y, y ∈ R (10.2.87)
−∞ A → −∞ A
B → +∞
Здесь в правой части стоит несобственный интеграл, который, конечно, не для любых f , g
и x существует, и поэтому свертка f ∗ g не всегда определена. Среди достаточных условий для
существования свертки нас будет интересовать только одно, а именно, то, в котором функции f и g
локально интегрируемы, причем одна из них финитна. Понятие локально интегрируемой функции
было введено нами на с.535, а что такое финитная функция объясняется в следующем определении:
• Функция f : R → R называется финитной, если существует отрезок [a, b], вне которого
функция f обращается в нуль:
∀x ∈
/ [a, b] f (x) = 0
0 0
ˆ b
= f (y) · g(x − y) d y
a
628Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Если же финитна функция g, и [a, b] = conv supp g – ее выпуклый носитель, то для всякого фик-
сированного x ∈ R функция y 7→ g(x − y) будет тоже финитной, и ее выпуклым носителем будет
отрезок [x − b, x − a]:
x−y ∈ [a, b] ⇔ a 6 x−y 6 b ⇔ −a > y−x > −b ⇔ x−a > y > x−b ⇔ y ∈ [x−b, x−a]
=
0 0
ˆ x−a
= f (y) · g(x − y) d y
x−b
Свойства свертки
◦
1 . Дистрибутивность:
(f + g) ∗ h = f ∗ h + g ∗ h (10.2.89)
2◦ . Коммутативность:
f ∗g =g∗f (10.2.90)
◦
3 . Перестановочность со сдвигом:
ˆ e
B ˆ +∞
= lim f (x − t) · g(t) d t = f (x − t) · g(t) d t = (g ∗ f )(x)
e → −∞
A e
A −∞
e → +∞
B
3. Перестановочность со сдвигами:
+∞ B
y + a = t
ˆ ˆ
(Ta f ) ∗ g(x) = Ta f (y) · g(x − y) d y = lim f (y + a) · g(x − y) d y = y = t − a = (8.2.128) =
−∞ A → −∞ A dy = dt
B → +∞
B+a
−→ −∞
α = A + a A→−∞
ˆ
= lim f (t) · g(x + a − t) d t = β = B + a −→ +∞ =
A → −∞ A+a B→+∞
B → +∞
ˆ β ˆ +∞
= lim f (t) · g(x + a − t) d t = f (t) · g(x + a − t) d t = (g ∗ f )(x + a) = Ta (g ∗ f ) (x)
α → −∞ α −∞
β → +∞
ˆ ∞ ˆ b
∀x ∈ [A, B] (f ∗ g)(x) =
f (x − y) · g(y) d y = f (x − y) · g(y) d y 6
−∞ |{z} a
↑
отлично от нуля
только при y ∈ [a, b]
[A − b, B − a]
⊆
[x − b, x − a]
∈
ˆ b z }| {
ˆ b
´
6 |f ( x − y )| ·g(y) d y 6 kf k[A−b,B−a] · g(y) d y = kf k[A−b,B−a] · kgk[a,b]
a | {z } a
>
kf k[A−b,B−a]
⇓
´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]
Теперь (10.2.93):
ˆ ∞
∀x ∈ [A, B] (f ∗ g)(x) = f (x − y) · g(y) d y =
−∞ |{z}
↑
отлично от нуля
только при y ∈ [a, b]
ˆ ˆ
b b
= f (x − y) · g(y) d y 6 f (x − y) · |g(y)| d y 6 (8.2.117) 6
a a | {z }
>
kgk[a,b]
b ˆ x−b
x−y = t
ˆ
6 f (x − y) d y · kgk[a,b] = y = x − t
d y = − d t = − kgk [a,b] · fn (t) − f (t) d t =
a x−a
ˆ x−a ˆ B−a
´
= f (t) d t · kgk[a,b] 6 f (t) d t · kgk[a,b] = kf k[A−b,B−a] · kgk[a,b]
x−b ↑ A−b
[x − b, x − a] ⊆ [A − b, B − a]
⇓
´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]
Лемма 10.2.4. Пусть f – непрерывная функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
kTsn f − f k[α,β] = kf (x + s) − f (x)kx∈[α,β] −→ 0 (10.2.94)
s→0
630Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Здесь при необходимости число δ можно уменьшить так, чтобы выполнялось дополнительное нера-
венство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
x + s ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1]
|(x + s) − x| = |s| < δ
⇓
|f (x + s) − f (x)| < ε
Поэтому
kTs f − f k[α,β] = sup |f (x + s) − f (x)| 6 ε (10.2.95)
x∈[α,β]
То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(10.2.95). Это и нужно было доказать.
Лемма 10.2.5. Пусть f – гладкая функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
Ts f − f
f (x + s) − f (x)
− f ′
=
− f ′
(x)
−→ 0 (10.2.96)
s
s
s→0
[α,β] x∈[α,β]
Опять замечаем, что при необходимости число δ можно уменьшить так, чтобы выполнялось допол-
нительное неравенство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
x + τ ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1]
|(x + τ ) − x| = |τ | 6 |s| < δ
1 ⇓
· f (x + s) − f (x) −f ′ (x) = |f ′ (x + τ ) − f (x)| < ε ′
s |
∋
{z } →
−
0s
=
(8.3.163)
´ x+s
x
f ′ (y) d y
=
´s
0
f ′ (x + t) d t
=
(8.3.162)
f ′ (x + τ ) · s,
→
−
τ ∈ 0s
Поэтому
Ts f − f
f (x + s) − f (x)
− f ′
= sup − f ′
(x)6ε (10.2.97)
s
s
[α,β] x∈[α,β]
То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(10.2.97). Это и нужно было доказать.
§ 2. Аппроксимация 631
|sn | 6 1
⇓
∀x ∈ R (f ∗ g)(x + sn ) −→ (f ∗ g)(x)
n→∞
∀x ∈ R (f ∗ g)(x + s) −→ (f ∗ g)(x)
s→0
Второе из этих условий означает, что функции gn можно продолжить нулем вне отрезка [a, b], и они
станут непрерывными функциями, определенными на всей прямой R, и, как и g, сосредоточенными
на отрезке [a, b], поэтому
∀n conv supp(gn − g) ⊆ [a, b]
После этого для всякого отрезка [A, B] ⊂ R мы получим:
´
kf ∗ gn − f ∗ gk[A,B] = (10.2.89) = kf ∗ (gn − g)k[A,B] 6 (10.2.92) 6 kf k[A−b,B−a] · kgn − gk[a,b] −→ 0
n→∞
⇓
x∈[A,B]
(f ∗ gn )(x) ⇒ (f ∗ g)(x)
n→∞
При этом, поскольку функции gn непрерывны, по уже доказанному, свертки f ∗ gn – тоже непрерыв-
ные функции. Значит, по свойству 1◦ на с.600, равномерный на отрезке [A, B] предел f ∗ g функций
f ∗ gn должен быть непрерывной функцией на [A, B]. Это верно для любого отрезка [A, B], значит
функция f ∗ g должна быть непрерывна всюду на R.
632Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
Теорема 10.2.6. Если одна из функций f или g является гладкой, то свертка f ∗g тоже является
гладкой, причем если гладкой является функция f , то
(f ∗ g)′ = f ′ ∗ g (10.2.99)
(f ∗ g)′ = f ∗ g ′ (10.2.100)
1
∀[α, β] ⊂ R
′
sn Tsn f − f − f
−→ 0
n→∞
(лемма 10.2.5)
[α,β]
(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R − (f ∗ g)(x) =
′
sn
1
1
= ′
(Tsn f ∗ g)(x) − (f ∗ g)(x) − (f ∗ g)(x) =
Tsn f ∗ g − f ∗ g − f ∗ g
′
=
sn sn
[x,x]
1
1
´
=
sn sn T f − f − f ′
∗ g
6 (10.2.92) 6
T
sn sn f − f − f ′
· kgk[a,b] −→ 0
n→∞
[x,x] [x−b,x−a]
| {z }
n
↓ ↓
∞
0
(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
sn n→∞
(f ∗ g)(x + s) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
s s→0
Следствие 10.2.7. Если одна из функций f или g является бесконечно гладкой, то их свертка
тоже будет бесконечно гладкой.
Доказательство. Пусть f бесконечно гладкая. Тогда по теореме 10.2.6 свертка f ∗ g будет гладкой,
причем
(f ∗ g)′ = f ′ ∗ g
Поскольку f ′ тоже гладкая, опять по теореме 10.2.6 получаем, что свертка f ′ ∗ g, то есть функция
(f ∗ g)′ , будет гладкой, причем
(f ∗ g)′′ = (f ′ ∗ g)′ = f ′′ ∗ g
И так далее.
§ 2. Аппроксимация 633
∀x ∈
/ [α, β] ∀n ∈ N∗ ∆n (x) = 0
если это верно, то в качестве [α, β] всегда можно выбрать отрезок вида [−D, D], где
D > 0, и тогда будет выполняться условие
∀x ∈ R |x| > D =⇒ ∀n ∈ N∗ ∆n (x) = 0 (10.2.101)
1
⋄ 10.2.8. Покажем, что функции 2
ˆ
= ´1 · (1 − x2 )n d x 6
2 n
( −1 (1 − x ) d x | δ {z }
´1 1
· (1 − x2 )n , |x| 6 1 | {z }
>
(1−x2 )n d x
∆n (x) =
>
−1 ´1
(1 − δ 2 )n d x
0, |x| > 1 n+1 δ
=
(10.2.106) (1 − δ 2 )n · (1 − δ)
образуют аппроксимативную единицу. Условия (4.2.61)
(i)-(iii) здесь очевидны. Докажем (iv). Для вся- 6 (n + 1) · (1 − δ 2 )n · (1 − δ) −→ 0
n→∞
кого δ > 0 мы получим:
⋄ 10.2.9. Покажем, что функции
1 1
( 1
· cos2n x2 , |x| 6 π
ˆ ˆ ´π
(1 − x2 )n d x = 2 (1 − x2 )n d x > cos2n x
2 dx
∆n (x) = −π
−1 0 0, |x| > π
1
(1 − x)n+1 x=1 2 (10.2.107)
ˆ
>2 (1−x)n d x = −2· =
0 n+1 x=0 n+1 образуют аппроксимативную единицу. Как и в
предыдущем примере, здесь нужно проверить
⇓ только условие (iv). Для всякого δ > 0 мы по-
лучим:
2 ˆ π x
6n+1 x =y
cos2n d x = 2 =
´1
−1 (1 − x2 )n d x 2 x = 2y
−π
ˆ π2 ˆ π2
⇓ =2 cos2n y d y = 4 cos2n y d y >
−π 2 0 | {z }
6
1 − 2y
π ,
ˆ ˆ 1 потому что
∆n (x) d x = 2 · ∆n (x) d x = cos – выпуклая
|x|>δ δ функция на 0, π
2
634Глава 10. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
2n
π
2y мы получим функцию со следующими свойства-
ˆ 2
>4 1− dy =
0 π ми:
2n+1 y= π2
2π 2y 2π
h(x) = 0, x∈/ (−1, 1)
=− 1− =
2n + 1 π 2n +1 h(x) > 0, x ∈ (−1, 1)
y=0
´ 1
⇓ −1 h(x) d x = 1
1 2n + 1 Теперь положив
´π x
6
−π cos
2n
2 dx 2π
⇓ ∆n (x) = n · h(nx)
ˆ ˆ π
мы получим последовательность неотрицатель-
∆n (x) d x = 2 ∆n (x) d x =
|x|>δ δ ных функций ∆n ∈ C ∞ (R), имеющих в качестве
1
ˆ π x 2n общего носителя отрезок [−1, 1]:
= ´π 2n x ·2 cos dx 6
−π cos 2 dx δ 2
| {z } x∈
/ (−1, 1) =⇒ nx ∈
/ (−1, 1) =⇒
>
cos δ, −∞ −∞
потому что ˆ ∞ ˆ ∞
cos убывает
= h(nx) d(nx) = h(y) d y = 1
на 0, π 2 −∞ −∞
ˆ π2
4n + 2
6 · cos2n δ d x = А для каждого δ > 0 и любого n > 1
мы полу-
π δ δ
4n + 2 2
n π (4.2.61) чим:
= · |cos
{z }δ · − δ −→ 0
π 2 n→∞
δ δ
>
ˆ ˆ
1 ∆n (x) d x = n · h(nx) d x =
−δ −δ
⋄ 10.2.10. Бесконечно гладкая аппроксима- ˆ δ ˆ nδ
тивная единица. Следуя примеру 10.1.47 по- = h(nx) d(nx) = h(y) d y =
строим гладкую функцию g ∈ C ∞ (R) со следую- −δ
|
−nδ
{z }
щими свойствами: nδ>1
( ˆ 1
g(x) = 0, x ∈
/ (−1, 1) = h(y) d y = 1
g(x) > 0, x ∈ (−1, 1) −1
Пусть далее ε > 0. Поскольку функция f непрерывна на R, она непрерывна и на отрезке [a−D, b+D].
По теореме Кантора 4.3.32 это означает, что f равномерно непрерывна на [a − D, b + D], поэтому
§ 2. Аппроксимация 635
для числа 2ε > 0 должно существовать δ > 0, которое можно подчинить дополнительному условию
δ < D, такое, что
ε
∀s, t ∈ [a − D, b + D] |s − t| < δ =⇒ |f (s) − f (t)| <
2
В частности, при t = x ∈ [a, b] и s = x − y, где y ∈ (−δ, δ), мы получим такое соотношение:
ε
∀x ∈ [a, b] ∀y ∈ (−δ, δ) |f (x − y) − f (x)| < (10.2.110)
2
Теперь для любого x ∈ [a, b] мы получаем:
f ∗ ∆n (x) 1
=
(10.2.87) (10.2.103)
zˆ }| { zˆ }| {
∞ ∞
f ∗ ∆n (x) − f (x) = f (x − y) · ∆n (y) d y −f (x) · ∆n (y) d y =
−∞
ˆ ∞ ˆ ∞ −∞ ˆ ∞
= f (x − y) · ∆n (y) d y −
f (x − y) · ∆n (y) d y = f (x − y) − f (x) · ∆n (y) d y =
−∞ −∞ −∞ | {z }
=
0,
при |y| > D
ˆ D ˆ D
= f (x − y) − f (x) · ∆n (y) d y 6 f (x − y) − f (x) · ∆n (y) d y 6
−D −D
ˆ δ ˆ
6 f (x − y) − f (x) ·∆n (y) d y + f (x − y) − f (x) ·∆n (y) d y 6
−δ | {z } |y|>δ | {z }
>
>
(10.2.110)
ε
2 |f (x − y)| + |f (x)|
> (10.2.109)
M +M
=
2M
δ
ε
ˆ ˆ
6 · ∆n (y) d y + 2M · ∆n (y) d y
2 −δ |y|>δ
И это верно для любого ε > 0. Мы получаем, что, какое ни возьми ε > 0, для почти всех n ∈ N∗
будет верно неравенство
kf ∗ ∆n − f k[a,b] < ε
То есть,
kf ∗ ∆n − f k[a,b] −→ 0,
n→∞
а это нам и нужно было доказать.
Следствие 10.2.13. Для любой непрерывной функции f : [a, b] → R можно подобрать последо-
вательность бесконечно гладких функций ϕn : [a, b] → R, равномерно сходящуюся к f на [a, b]:
x∈[a,b]
ϕn (x) ⇒ f (x) (10.2.112)
n→∞
Доказательство. 1. Прежде всего заметим, что линейной заменой переменной утверждение сво-
дится к случаю [a, b] ⊂ (0, 1). Например, функция
ϕ(t) = 3(b − a) · t + 2a − b
1 2
превращает отрезок 3, 3 в отрезок [a, b]:
1 2
ϕ , = [a, b]
3 3
А функция f в композиции с ϕ превращается в функцию f ◦ ϕ на отрезке 31 , 23 . Если мы сможем
построить последовательность многочленов gn , приближающую f ◦ ϕ равномерно на отрезке 31 , 32
(содержащимся в интервале (0, 1))
t∈[ 13 , 32 ]
gn (t) ⇒ f ϕ(t) ,
n→∞
−1
то функции fn = gn ◦ ϕ будут многочленами, приближающими f равномерно на [a, b]:
x∈[a,b]
fn (x) = gn ϕ−1 (x) ⇒ f ϕ ϕ−1 (x) = f (x)
n→∞
2. Итак, можно считать, что отрезок [a, b] лежит в интервале (0; 1):
[a, b] ⊂ (0, 1)
Тогда f можно доопределить непрерывно на всю прямую R так, чтобы ее выпуклым носителем был
отрезок [0, 1]. Например, можно на оставшихся кусках интервала (0, 1) доопределить функцию f
линейно, то есть положить
f (a)
a · x, x ∈ (0, a)
f (b)
f (x) = b−1 · (x − b) + f (b), x ∈ (b, 1)
0, x ∈ (−∞, 0] ∪ [1, +∞)
§ 2. Аппроксимация 637
Нам остается только заметить, что на отрезке [a, b] функции f ∗∆n представляют собой многочлены:
ˆ +∞ ˆ x+1
f ∗ ∆n (x) = f (y) · ∆n (x − y) d y = f (y) · ∆n (x − y) d y =
−∞ | {z } x−1
=
0,
при y ∈/ [x − 1, x + 1],
поскольку
conv supp ∆n = [−1, 1]
ˆ x+1 n ˆ 1 n
2
= Cn · f (y) · 1 − (x − y) d y = Cn · f (y) · 1 − (x − y)2 dy =
x−1 |{z} 0 | {z }
=
многочлен по y
0,
при y ∈
/ [0, +1],
причем
x−1 6 0 < 1 6 x+1
число
z }| {
ˆ 1 2n
X 2n
X ˆ 1
= Cn · f (y) · pk (x) · y n d y = Cn · f (y) · y n d y · pk (x)
0 0 | {z }
k=0 k=0
многочлен
по x
∋
=
0, [−π, π]
при y ∈/ [x − π, x + π],
поскольку
conv supp ∆n = [−π, π]
!
ˆ x+π N n
X o
по сдвинутому периоду
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) d y = интеграл
равен интегралу по периоду =
x−π k=1
| {z }
2π-периодическая функция от y
N n
!
ˆ +π X o
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) d y = (5.1.82), (5.1.81) =
−π k=1
ˆ +π N n
X o
= f (y) · C + Ak (x) · cos ky + Bk (x) · sin ky dy =
−π | {z } | {z }
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
число число число
zˆ }| { z }| { zˆ }| {
+π N n
X ˆ +π +π o
=C· f (y) d y + Ak (x) · f (y) · cos ky d y + Bk (x) · f (y) · sin ky d y
−π | {z } −π | {z } −π
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
Глава 11
СТЕПЕННЫЕ РЯДЫ И
АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Такие функции называются аналитическими (точное определение см. на с.666), и в этой главе мы
поговорим о них.
Теорема 11.1.1 (об области сходимости степенного ряда). Область сходимости D всякого сте-
пенного ряда
X∞
cn · (x − x0 )n (11.1.4)
n=0
639
640 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Тогда:
— если ряд (11.1.5) сходится в какой-то точке z = ζ, то он сходится также в любой
точке z = η по модулю меньшей ζ:
|η| < |ζ|
— если ряд (11.1.5) расходится в какой-то точке z = η, то он расходится также в любой
точке z = ζ по модулю большей η:
|η| < |ζ|.
Доказательство. 1. Докажем сначала первую часть. Здесь используется некий стандартный прием,
постоянно применяемый при изучении степенных рядов, и называемый логической цепочкой Абеля.
Он состоит в следующем.
Ряд (11.1.5) сходится в точке z = ζ
⇓
∞
X
числовой ряд cn · ζ n сходится
n=0
⇓
общий член стремится к нулю: cn · ζ n −→ 0
n→∞
⇓
∞
X
|cn · η n | − сходится, по признаку сравнения (теорема 9.2.24)
n=0
⇓
∞
X
cn · η n − сходится, по признаку абсолютной сходимости (теорема 9.2.39)
n=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 641
Доказательство теоремы 11.1.1. Заметим сразу, что нам достаточно рассмотреть ряд (11.1.5), по-
тому что ряд (11.1.4) превращается в него заменой переменной
x − x0 = z
Обозначим через D его область сходимости. Нам нужно доказать, что либо D = {0}, либо D = R,
либо существует такое число R > 0, что (−R, R) ⊆ D ⊆ [−R, R].
Ясно, что D 6= ∅, поскольку 0 ∈ D. Кроме того, из леммы Абеля 11.1.2 следуют утверждения:
и
если z ∈ R и ∃η ∈
/D: |η| < |z| то z ∈
/D (11.1.8)
Положим
R = sup{|ζ|; ζ ∈ D}
и рассмотрим несколько возможных случаев.
1. Если R = 0, то это означает, что область сходимости состоит из одной точки: D = {0}.
2. Если R = ∞, то это означает, что для всякой точки z ∈ R найдется ζ ∈ D такое, что |z| < |ζ|.
Поэтому, в силу (11.1.7), z принадлежит D. Это верно для любой z ∈ R, поэтому D = R.
3. Пусть 0 < R < ∞, тогда мы получим
– если z ∈ (−R, R), то есть |z| < R, то это означает, что найдется ζ ∈ D такое, что |z| < |ζ|,
поэтому, в силу утверждения (11.1.7), z ∈ D;
– если же z ∈ / [−R, R], то есть |z| > R, то это означает, что найдется η ∈
/ D такое, что
|z| > |η|, поэтому, в силу утверждения (11.1.8), z ∈
/ D;
Таким образом, мы получаем, что D содержит интервал (−R, R) и не содержит точек, не лежа-
щих в отрезке [−R, R]. То есть,
(−R, R) ⊆ D ⊆ [−R, R]
Это нам и нужно было доказать.
R=0
означает, что область сходимости D этого ряда имеет вид D = {x0 }, а равенство
R=∞
– что D = R.
642 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Доказательство. Достаточно рассмотреть ряды с нулевым центром, то есть рядов вида (11.1.5).
Мы докажем лишь первую формулу, сказав про вторую лишь, что она доказывается аналогично.
Пусть
cn
R = lim ,
n→∞ cn+1
то это означает, что существует такое число C > 1, что, для некоторого номера N выпол-
няется следующее:
cn+1 z
∀n > N >C
cn
⇓
∀n > N |cn+1 z| > C|cn |
⇓
∀n > N cn+1 z n+1 > C |cn z n |
Радиус сходимости в этом случае оказывается Вывод: Область сходимости D = [−1, 1).
равным бесконечности
⋄ 11.1.7. Рассмотрим ряд с ненулевым центром:
cn (n + 1)!
R = lim = lim = lim (n+1) = ∞ ∞
n→∞ cn+1 n→∞ n! n→∞ X (x + 1)n
поэтому область сходимости будет совпадать со n=1
2n
всей прямой R.
Вывод: Область сходимости D = R. Радиус сходимости:
⋄ 11.1.6. Рассмотрим ряд cn n+1
R = lim = lim 2 =2
∞ n→∞ cn+1 n→∞ 2n
X xn
n Картинка:
n=1
X∞ X∞
1n 1 pacx. cx. pacx. x
=
n n
n=1 n=1 -3 1
который расходится, в силу примера 9.2.19.
Таким образом, нашу картинку можно попра- Вывод: Область сходимости D = (−3, 1).
вить следующим образом:
⊲⊲ 11.1.8. Найдите область сходимости:
P (x−2)n P∞ xn
cx. pacx.
1. P ∞
n=1 n2 ;
5. n=1 nn .
∞
2. Pn=1 n2 · (x − 2)n ; P∞ (x+1)n
pacx. cx. pacx. x 6. n·3n .
∞
3. Pn=1 3n · (x + 2)n ; Pn=1
∞ (x+3)n
−1 1 ∞
4. n=1 nn · xn ;
7. n=1 n2
.
(1+ n1 )
сходится равномерно на каждом отрезке [a, b] внутри интервала сходимости (x0 − R, x0 + R).
x
x0 − R a x0 b x0 + R
Доказательство. Поскольку [a, b] ⊆ (x0 − R, x0 + R), можно найти число C > 0 такое, что
x
x0 − R x0 − C a x0 b x0 + C x0 + R
Наш ряд сходится в точке x0 + C ∈ (x0 − R, x0 + R), и это приводит к логической цепочке Абеля
(описывавшейся при доказательстве леммы 11.1.2):
∞
X
cn · C n − сходится
n=0
⇓
cn · C n −→ 0
n→∞
⇓
последовательность cn · C n ограничена :
n
n (x − x0 )
n n
||cn · (x − x0 ) ||x∈[a,b] = sup |cn · (x − x0 ) | = sup cn · C ·
Cn =
x∈[a,b] x∈[a,b]
(x − x0 )n
= |cn · C n | · sup 6 (применяем (11.1.10)) 6
x∈[a,b] Cn
!n
|x − x0 |
6 M · sup 6 (применяем (11.1.9)) 6 M · λn (где λ < 1)
x∈[a,b] C
⇓
∞
X ∞
X ∞
X
||cn · (x − x0 )n ||x∈[a,b] 6 M · λn = M · λn (где λ < 1)
n=0 n=0 n=0
⇓
§ 1. Степенные ряды, аналитические последовательности и производящие функции 645
∞
X
||cn · (x − x0 )n ||x∈[a,b] − сходится
n=0
вспоминаем признак Вейерштрасса
⇓ равномерной сходимости (теорему 10.1.33)
∞
X
cn · (x − x0 )n − сходится равномерно на отрезке [a, b]
n=0
Теорема 11.1.11. Радиусы (и интервалы) сходимости рядов (11.1.11), (11.1.12) и (11.1.13) совпа-
дают, и
(i) сумма ряда (11.1.11) является гладкой функцией на интервале сходимости, и ее произ-
водную на нем можно вычислить почленным дифференцированием:
!
∂ X
∞ ∞ ∞
∂ X n
X
cn · (x − x0 ) = cn · (x − x0 )n = cn · n · (x − x0 )n−1 (11.1.14)
∂x n=0 n=0
∂x n=1
Доказательство. 1. Убедимся сначала, что радиусы сходимости рядов (11.1.11), (11.1.12) и (11.1.13)
совпадают. Заметим прежде всего, что для этого нам достаточно проверить совпадение радиусов
сходимости для рядов (11.1.11) и (11.1.12). Это будет означать, что при дифференцировании сте-
пенного ряда его радиус сходимости не меняется, значит, поскольку ряд (11.1.11) тоже получается
из ряда (11.1.13) почленным дифференцированием, их радиусы сходимости тоже будут совпадать.
Сделаем после этого замену переменной
x − x0 = z
646 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
∞
X
cn · n · z n−1 (11.1.17)
n=1
⇓
cn · ζ n −→ 0
n→∞
⇓
∃M > 0 ∀n |cn · ζ n | 6 M
⇓
для всякого z : 0 < |z| < |ζ|
n n
n
n n z n z n z
|cn · n · z n−1 n
| = cn · ζ · · n = |cn · ζ | · · 6M· ·
z ζ |z| ζ |z| ζ
⇓
∞ n
∞ ∞ n
X zX X
n n z
|cn · n · z n−1
· = M ·
|6 M· ·
n=1
ζn=1
|z|
n=1
|z| ζ
z
− сходится по признаку Даламбера, поскольку < 1
ζ
⇓
∞
X
|cn · n · z n−1 | − сходится по признаку сравнения
n=1
⇓
∞
X
cn · n · z n−1 − сходится по признаку абсолютной сходимости
n=1
P∞
B) Теперь докажем, что R2 6 R1 . Это равносильно тому, чтоPесли ряд n=1 cn · n · ζ n−1 сходится
при каком-нибудь ζ, то при любом z : 0 < |z| < |ζ| сходится ряд ∞ n
n=0 cn ·z . Применяем логическую
цепочку Абеля:
X∞
cn · n · ζ n−1 − сходится
n=1
⇓
n−1
cn · n · ζ −→ 0
n→∞
⇓
∃M > 0 ∀n |cn · n · ζ n−1 | 6 M
⇓
для всякого z : 0 < |z| < |ζ|
n n
n−1 ζ z n |ζ| z |ζ| z
n
|cn · z | = cn · n · ζ · · n = |cn · n · ζ n−1
|· · 6M· ·
n ζ n ζ n ζ
§ 1. Степенные ряды, аналитические последовательности и производящие функции 647
⇓
∞ ∞ n ∞ n
X X |ζ| z X |ζ| z
n
|cn · z | 6 M· · =M· ·
n=0 n=0
n ζ n=0
n ζ
z
− сходится по признаку Даламбера, поскольку < 1
ζ
⇓
∞
X
|cn · z n | − сходится по признаку сравнения
n=0
⇓
∞
X
cn · z n − сходится по признаку абсолютной сходимости
n=0
Итак, мы доказали, что
R1 6 R2 6 R1
то есть
R1 = R2
2. Докажем далее тождество (11.1.14). Возьмем какие-нибудь точки a, b так чтобы
сходится в точке x0 , потому что все его члены, кроме нулевого равны нулю в этой точке:
∞
X
cn · n · (x − x0 )n = c0 · 1 + c1 · 0 + c2 · 0 + ...
x=x0
n=0
По свойству 50 на с.607, это означает, что сумма ряда (11.1.11) будет дифференцируема на [a, b], и
ее производную в каждой точке x ∈ [a, b] можно вычислить почленным дифференцированием:
!
∂ X
∞ ∞ ∞
∂ X X
cn · (x − x0 )n = cn · (x − x0 )n = cn · n · (x − x0 )n−1 , x ∈ [a, b]
∂x n=0 n=0
∂x n=1
То есть тождество (11.1.14) выполняется для x ∈ [a, b]. Поскольку числа a, b здесь выбирались
произвольными, удовлетворяющими условию x0 − R < a < x0 < b < x0 + R, мы получаем, что это
тождество выполняется при любом x ∈ (x0 − R, x0 + R).
3. Теперь докажем (11.1.15). Зафиксируем x из интервала сходимости (общего для рядов (11.1.11)
и (11.1.13)). По теореме 11.1.9, мы получим, что ряд
∞
X
cn · n · (t − x0 )n
n=0
сходится равномерно на отрезке [x0 , x]. Поэтому, по свойству 40 на с.606, должно выполняться
равенство
ˆ xX ∞ X∞ ˆ x X∞
n cn
cn · (t − x0 ) d t = cn · (t − x0 )n d t = · (x − x0 )n+1
x0 n=0 n=0 x 0 n=0
n + 1
Следствие 11.1.12. Сумма всякого степенного ряда является бесконечно гладкой функцией на
интервале сходимости (x0 − R, x0 + R) этого ряда, и производная порядка k этой функции вычис-
ляется по формуле
∞
! ∞
∂k X n
X n!
k
c n · (x − x0 ) = · cn · (x − x0 )n−k , x ∈ (x0 − R, x0 + R) (11.1.18)
∂x n=0
(n − k)!
n=k
По теореме 11.1.11, P дифференцируема на (x0 −R, x0 +R), причем ее производная является суммой
степенного ряда с тем же интервалом сходимости:
∞
X
P ′ (x) = cn · n · (x − x0 )n−1 , x ∈ (x0 − R, x0 + R)
n=1
Вычисление суммы степенного ряда. Тео- Наоборот, дифференцируя (11.1.19) при |x| <
рема 11.1.11 позволяет в некоторых случаях яв- 1, получаем:
но вычислить сумму степенного ряда. Здесь мы ∞
покажем на примерах, как это делается. X 1
n · xn−1 = , |x| < 1 (11.1.22)
Все начинается с формулы для суммы чле- n=1
(1 − x)2
нов бесконечной геометрической прогрессии, ко-
торую мы выписывали в примере 9.2.5: Точно так же, дифференцируя k раз, по индук-
ции получаем:
X∞
1
xn = , |x| < 1 (11.1.19) X∞
n! k!
n=0
1 − x · xn−k = , |x| < 1
(n − k)! (1 − x)k+1
n=k
Из нее выводится целый ряд других полезных (11.1.23)
формул для сумм степенных рядов. Прежде все- Далее, заменив в (11.1.20) x на x2 , мы полу-
го, заменой x на −x мы получаем тождество чим
∞
X ∞
1 X 1
(−1)n · xn = , |x| < 1 (11.1.20) (−1)n · x2n = , |x| < 1 (11.1.24)
n=0
1+x
n=0
1 + x2
Интегрируя его при |x| < 1 мы получаем Интегрируя (11.1.24) по теореме 11.1.11 (при
|x| < 1) мы получаем:
∞
X X∞
xn xn+1
(−1)n−1 · = (−1)n · = ∞
X x2n+1 X∞ ˆ x
n=1
n n=0
n+1 (−1) ·n
= (−1)n · t2n d t =
∞ ˆ x
2n + 1 0
X ˆ x
dt n=0 n=0
(−1)n · tn d t =
ˆ x
= = ln(1 + x) dt
n=0 0 0 1 +t = = arctg x
0 1 + t2
То есть, То есть
∞
X ∞
X
xn x2n+1
(−1)n−1 · = ln(1 + x), |x| < 1 (−1)n · = arctg x, |x| < 1
n=1
n n=0
2n + 1
(11.1.21) (11.1.25)
§ 1. Степенные ряды, аналитические последовательности и производящие функции 649
∞
X
Полученных формул уже достаточно, чтобы 1
n · xn−1 =
перейти к решению задач. (1 − x)2
n=1
⋄ 11.1.13. Предположим, нам нужно найти сум- Умножаем на x:
му степенного ряда
∞
X x
X∞
xn x· n · xn−1 =
(11.1.26) n=1
(1 − x)2
n=1
n
⇓
Рецепт решения заключается в том, чтобы сооб-
разить, как этот ряд можно получить из фор- Ответ:
X∞
мул (11.1.19)-(11.1.25) с помощью операций диф- x
n · xn =
ференцирования, интегрирования, замены пере- n=1
(1 − x)2
k
менной и умножения на x . Для данного ряда
последовательность действий выглядит следую- ⋄ 11.1.15. Найти сумму степенного ряда
щим образом. Сначала мы выписываем формулу ∞
X xn
(11.1.19): (−1) n
· , x > 0.
X ∞
n 1 n=0
2n + 1
x =
n=0
1−x
Здесь вычисления начинаются с формулы
Затем меняем в ней индекс n на k − 1: (11.1.25), которую мы перепишем с переменной
∞ t вместо x:
X 1
xk−1 = X∞
1−x t2n+1
k=1 (−1)n · = arctg t
n=0
2n + 1
После этого интегрируем:
∞ ∞ Мы делим ее на t
X xk
ˆ xX ˆ x
1
k−1
= t dt = d t = − ln(1−x) ∞
k 0 k=1 0 1−t 1 X t2n+1 arctg t
k=1 · (−1)n · =
t n=0 2n + 1 t
Остается увидеть, что полученный ряд отлича-
ется от (11.1.26) только индексом. Если теперь ⇓
поменять k на n, то получится
X∞
Ответ: t2n arctg t
X∞
xn (−1)n · =
= − ln(1 − x) n=0
2n + 1 t
n=1
n
Потом делаем замену переменной t2 = x (это
⋄ 11.1.14. Найти сумму степенного ряда можно, потому что x > 0) и получается
X∞ Ответ:
n · xn X∞ √
n xn arctg x
n=1 (−1) · = √ .
n=0
2n + 1 x
Снова выписываем формулу (11.1.19):
∞ ⊲⊲ 11.1.16.
P∞ Найдите сумму ряда:
X 1 2 n
n
x = 1. Pn=1 n · x ;
1−x 2. ∞ n n
n=0 n=1 2 · x ;
P∞ x3n
3. Pn=1 n ;
Дифференцируем ее:
4. ∞ n
n=1 n+1 · x ;
n
(∞ )′ ′ P ∞ n
X 1 5. Pn=1 x (1+x) n ;
xn = 6.
∞
n · x n
(1 + x);
1−x P∞ n=1 n
n=0 x (1+xn )
7. Pn=1 n ;
⇓ 8. ∞ n=1 n · x n
(1 + xn ).
an = n! 1
an =
n!
не будет аналитической, потому что в силу при-
мера 11.1.4, порождаемый ею ряд будет аналитической, потому что, как мы убеди-
лись в примере 11.1.5, порождаемый ею ряд
∞
X
n! · xn X∞
xn
n=1
n=1
n!
имеет нулевой радиус сходимости. К такому
же выводу можно прийти, используя критерий имеет радиус сходимости R = ∞ (для нас глав-
(11.1.28). ное, что R 6= 0). Критерий (11.1.28) дает то же
самое.
(−a)n := −an
∞ n
N X N
! N
! ∞
! ∞
!
X X X X X X
wn = lim uk · vn−k = lim uk · lim vl = uk · vl (11.1.35)
N →∞ N →∞ N →∞
n=0 n=0 k=0 k=0 l=0 k=0 l=0
652 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
<
∞ 0, 0, ∞
при N → ∞ при N → ∞
И поэтому
∞ 2N
" N
! N
!# ∞
! ∞
!
X X X X X X
wn = lim wn = lim uk · vl = uk · vl
N →∞ N →∞
n=0 n=0 k=0 l=0 k=0 l=0
Ассоциативность свертки:
n n k
!
X X X X
((a ∗ b) ∗ c)n = (a ∗ b)k · cn−k = ai · bk−i · cn−k = ai · bk−i · cn−k =
k=0 k=0 i=0 06k6n
06i6k
n n
!
X X X k − i = j, k =i+j
= ai · bk−i · cn−k = ai · bk−i · cn−k = =
i6k6n ⇔ 0 6 j 6 n − i
06i6n i=0 k=i
i6k6n
n
X Xn−i n
X
= ai · bj · cn−i−j = ai · (b ∗ c)n−i = (a ∗ (b ∗ c))n
i=0 j=0 i=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 653
=
(
1, k=n
0, k 6= n
Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.
5. Если |x| < min{ρ(a), ρ(b)}, то
n
!
X X X
n
Gena∗b (x) = lim (a ∗ b)n · x = lim ak · bn−k · xn =
N →∞ N →∞
n6N n6N k=0
n ∞
! ∞
!
X X X X
k n−k k l
= lim ak · x · bn−k · x = (11.1.35) = ak · x · bl · x = Gena (x) · Genb (x)
N →∞
n6N k=0 k=0 l=0
Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.
ω(a) = min{n ∈ N : an 6= 0}
⇓
∃k ∈ {0, ..., n} ak · bn−k 6= 0
⇓
(
ak 6= 0
∃k ∈ {0, ..., n}
bn−k 6= 0
⇓
(
k > ω(a)
∃k ∈ {0, ..., n}
n − k > ω(b)
⇓
654 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
(
k > ω(a)
∃k ∈ {0, ..., n}
n > ω(b) + k > ω(b) + ω(a)
⇓
n > ω(b) + ω(a)
Из нее получаем:
ω(a ∗ b) = min n ∈ N : (a ∗ b)n 6= 0 > ω(b) + ω(a)
a6b ⇐⇒ ∀n ∈ N an 6 b n
А равенство (11.1.42) доказывается двукратным применением логической цепочки Абеля (см. с.640).
С одной стороны,
0 < r < ρ(a)
§ 1. Степенные ряды, аналитические последовательности и производящие функции 655
⇓
∞
X
числовой ряд an · rn сходится
n=0
⇓
общий член стремится к нулю: an · rn −→ 0
n→∞
⇓
последовательность an · rn ограничена: sup |an · rn | = M < ∞
n∈N
⇓
σ n σ n σ
∀σ ∈ (0, r) =⇒ |an | · σ n = |an · rn | · 6 M · <1
r r r
⇓
∞
X
для всякого σ ∈ (0, r) числовой ряд |an | · σ n сходится
n=0
⇓
∞
X
радиус сходимости ряда |an | · xn не меньше r
n=0
⇓
ρ(|a|) > r ← верно для любого r ∈ (0, ρ(a))
⇓
ρ(|a|) > ρ(a)
А с другой стороны,
0 < r < ρ(|a|)
⇓
∞
X
числовой ряд |an | · rn сходится
n=0
⇓
общий член стремится к нулю: |an | · rn −→ 0
n→∞
⇓
последовательность |an | · rn ограничена: sup |an | · rn = M < ∞
n∈N
⇓
σ n σ n σ
∀σ ∈ (0, r) =⇒ |an · σ n | = |an · rn | · 6 M · <1
r r r
⇓
∞
X
для всякого σ ∈ (0, r) числовой ряд an · σ n сходится
n=0
⇓
∞
X
радиус сходимости ряда an · xn не меньше r
n=0
⇓
ρ(a) > r ← верно для любого r ∈ (0, ρ(|a|))
⇓
ρ(a) > ρ(|a|).
656 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Свойства степени:
1◦ . Модуль степени не превосходит степени модуля:
ω(bk ) > k, k ∈ N.
То есть
∀n < k (bk )n = 0
и это можно интерпретировать так, что при фиксированном номере n ∈ Z почти все числа
(bk )n ; k ∈ N равны нулю:
Доказательство. Пусть a, b ∈ A и ω(b) > 1. Выберем ε ∈ (0, ρ(|a|)), то есть ε > 0 такое, что
∞
X
Gen|a| (ε) = |an | · εm < ∞
n=0
Условие ω(b) > 1 означает, что b0 = 0, поэтому производящая функция последовательности |b| имеет
вид
∞
X ∞
X
m
Gen|b| (x) = |bm | · x = |bm | · xm
m=0 m=1
Теперь получаем:
∀k ∈ N |bk | 6 |b|k (11.1.44)
⇓ (11.1.37)
k
∀k ∈ N Gen|bk | (δ) 6 Gen|b| (δ) < εk
∀K, N ∈ N, K >N =⇒
N
X N X
X K N X
X K K X
X N
n
|(a ◦ b)n | · δ = ak · (b )n · δ n 6
k
|ak | · |(bk )n | · δ n = |ak | · |(bk )n | · δ n =
n=0 n=0 k=0 n=0 k=0 k=0 n=0
K
X N
X K
X ∞
X K
X K
X ∞
X
= |ak | · |(bk )n | · δ n 6 |ak | · |(bk )n | · δ n = |ak | · Gen|bk |(δ) < |ak | · εk 6 |ak | · εk =
k=0 n=0 k=0 n=0 k=0 k=0 k=0
| {z }
Gen|bk |(δ)
⇓
∞
X
Gen|a◦b| (δ) = |(a ◦ b)n | · δ n 6 Gen|a| (ε) < ∞
n=0
Свойства композиции:
(a + b) ◦ c = a ◦ c + b ◦ c (11.1.52)
Свойство 2◦ :
n
X n
X
((a + b) ◦ c)n = (11.1.48) = (a + b)k · (ck )n = (ak + bk ) · (ck )n =
k=0 k=0
n
X n
X
= ak · (ck )n + bk · (ck )n = (11.1.48) = (a ◦ c)n + (b ◦ c)n = (a ◦ c + b ◦ c)n
k=0 k=0
∞
X ∞ X
X ∞ ∞ X
X K
Gena◦b (x) = (a ◦ b)n · xn = ak · (bk )n · xn = (11.1.54) = ak · (bk )n · xn =
n=0 n=0 k=0 n=0 k=0
K
X ∞
X K
X K
X k
= ak · (bk )n · xn = ak · Genbk (x) = (11.1.45) = ak · Genb (x) =
k=0 n=0 k=0 k=0
| {z }
Genbk (x)
∞
X k
= ak · Genb (x) = Gena Genb (x)
k=0
После этого рассматривается общий случай. Для любой последовательности a ∈ A и для всякого
N ∈ N обозначим через PN a последовательность, определенную формулой
(
ak , k 6 K
(PK a)k =
0, k>K
Зафиксируем ε > 0 такое, что Gen|a| (ε) < ∞, и подберем δ > 0 такое, что | Gen|b| (δ)| < ε. Покажем,
что при x ∈ (−δ, δ) и K → ∞ равенство (11.1.55) превращается в (11.1.53):
GenPK a◦b (x) = GenPK a Genb (x) , x ∈ (−δ, δ) (11.1.56)
| {z } | {z }
(K → ∞) ↓
↓ (K → ∞)
Gena◦b (x)
Gena◦b (x)
⇓
GenPK a Genb (x) −→ Gena Genb (x) , x ∈ (−δ, δ)
K→∞
§ 2. Ряд Тейлора и аналитические функции 659
Докажем левый предельный переход. Для этого заметим прежде всего, что
(
0, k6K
ak − (PK a)k = (11.1.57)
ak , k > K
f0 = f,
! 11.2.2. Формулы (11.2.58) и (11.2.59) можно объединить в одну, усложнив формулировку тео-
ремы следующим образом:
пусть x0 и xобозначают концы отрезка [a, b], причем возможны оба
x0 = a x=a
варианта, как , так и ; тогда найдется точка ξ ∈ (a; b) такая, что
x=b x0 = b
n
X f (k) (x0 ) g(x) − g(x0 ) (n+1)
f (x) = · (x − x0 )k + ·f (ξ) · (x − ξ)n (11.2.60)
k! g ′ (ξ) · n!
k=0
x0 = a x=a
В такой формулировке случай превращает формулу (11.2.60) в (11.2.58), а при
x=b x0 = b
формула (11.2.60) превращается в (11.2.59).
Доказательство. 1. Для доказательства (11.2.58) рассмотрим вспомогательную функцию
n
X f (k) (t)
F (t) = f (b) − · (b − t)k
k!
k=0
Применим к паре функций F и g теорему Коши об отношении приращений 6.1.34: должна суще-
ствовать точка ζ ∈ (a; b) такая, что
Во-вторых,
n
X f (k) (a)
F (a) = f (a) − · (b − a)k
k!
k=0
И, в-третьих,
n
! n
!
∂ X f (k) (t) ∂ X f (k) (t)
′ k k
F (t) = f (b) − · (b − t) = f (b) − f (t) − · (b − t) =
∂t k! ∂t k!
k=0 k=1
X n
∂ f (k) (t)
′ k
= 0 − f (t) − · (b − t) =
∂t k!
k=1
Xn
∂ f (k) (t) f (k) (t) ∂
= −f ′ (t) − · (b − t)k + · (b − t)k =
∂t k! k! ∂t
k=1
Xn (k+1)
f (t) f (k) (t)
= −f ′ (t) − · (b − t)k + · k · (b − t)k−1 · (−1) =
k! k!
k=1
n
X X n
f (k+1) (t) f (k) (t)
= − f ′ (t) − · (b − t)k + · (b − t)k−1 =
| {z } k! (k − 1)!
k=1 k=1
k | {z }
f (1) (t) заменяем k − 1 на i
0! · (b − t)0
| {z }
объединяем в одну сумму
n
X n−1
X
f (k+1) (t) f (i+1) (t)
=− · (b − t)k + · (b − t)i =
k! i=0
i!
k=0
| {z }
отщепляем последнее слагаемое
§ 2. Ряд Тейлора и аналитические функции 661
n−1
X f (k+1) (t) n−1
X f (i+1) (t)
f (n+1) (t) f (n+1) (t)
=− · (b − t)n − · (b − t)k + · (b − t)i = − · (b − t)n
n! k! i=0
i! n!
k=0
| {z }
сокращаем
f (n+1) (ζ)
F ′ (ζ) = − · (b − ζ)n
n!
Теперь подставим полученные выражения в (11.2.61):
n
!
X f (k) (a) g(b) − g(a) f (n+1) (ζ)
k n
0 − f (a) − · (b − a) = · − · (b − ζ)
k! g ′ (ζ) n!
k=0
Тогда
n
X f (k) (b)
F (b) = f (a) − · (a − b)k
k!
k=0
n
X f (k) (a)
F (a) = f (a) − · (a − a)k = 0
k!
k=0
f (n+1) (t)
F ′ (t) = − · (a − t)n
n!
И при подстановке в (11.2.61) получается равенство, эквивалентное (11.2.59):
Xn
f (k) (b) g(b) − g(a) f (n+1) (ζ)
f (a) − · (a − b)k − 0 = · − · (a − ζ)n
k! g ′ (ζ) n!
k=0
n
X f (k) (x0 ) f (n+1) (ξ) (11.2.62)
f (x) = · (x − x0 )k + · (x − x0 )n+1
k! (n + 1)!
k=0
g(t) = (x − t)n+1
662 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
n
X f (k) (x0 ) f (n+1) (ξ) (11.2.63)
f (x) = · (x − x0 )k + · (x − ξ)n · (x − x0 )
k! n!
k=0
Доказательство. Это следует из теоремы 11.2.1, если в ней выбрать в качестве g функцию
g(t) = x − t
X∞
f (n) (x0 )
· (x − x0 )n (11.2.68)
n=0
n!
X∞
f (n) (0) n
·x (11.2.69)
n=0
n!
§ 2. Ряд Тейлора и аналитические функции 663
От ряда Тейлора естественно ожидать, что он будет сходиться к порождающей его функции
f хотя бы в некоторой окрестности (x0 − δ; x0 + δ) точки x0 , то есть что выполняется следующее
тождество, называемое разложением Тейлора функции f в окрестности (x0 − δ; x0 + δ):
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (11.2.70)
n=0
n!
В частном случае, когда x0 = 0, оно называется разложением Маклорена (в окрестности (−δ; δ)):
X∞
f (n) (0) n
f (x) = ·x , x ∈ (−δ; δ) (11.2.71)
n=0
n!
Часто так и бывает (мы приведем примеры такого рода на с.664). Но не всегда. В следующих
примерах мы увидим, что ряд Тейлора функции f необязательно сходится, а если сходится, то его
сумма необязательно совпадает с функцией f .
Всякий сходящийся степенной ряд есть ряд Тейлора своей суммы. Несмотря на отме-
ченное нами нерегулярное поведение ряда Тейлора, эта конструкция оказывается центральным
примером в теории степенных рядов из-за следующей теоремы:
Теорема 11.2.8. Если функция f является суммой какого-то степенного ряда в некоторой окрест-
ности его центра
∞
X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ, x0 + δ), (11.2.72)
n=0
f (n) (x0 )
cn =
n!
Доказательство. В силу следствия 11.1.12, функция f является гладкой на интервале (x0 −δ, x0 +δ),
и по формуле (11.1.18),
664 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
∞
X n!
f (k) (x) = · cn · (x − x0 )n−k =
(n − k)!
n=k
k! (k + 1)! (k + 2)!
= · ck · (x − x0 )0 + · ck+1 · (x − x0 )1 + · ck+2 · (x − x0 )2 + ... =
(k − k)! (k + 1 − k)! (k + 2 − k)!
(k + 1)! (k + 2)!
= k! · ck + · ck+1 · (x − x0 ) + · ck+2 · (x − x0 )2 + ..., x ∈ (x0 − R, x0 + R)
1! 2!
Подставив сюда x = x0 , получим
(k + 1)! (k + 2)!
f (k) (x0 ) = k! · ck + · ck+1 · 0 + · ck+2 · 0 + ... = k! · ck
1! 2!
f (k) (x0 )
То есть, ck = k!
P
! 11.2.9. Из этой теоремы следует, что если степенной ряд ∞ n
n=0 cn · (x − x0 ) сходится хотя бы в
одной точке x, отличной от его центра x0 , то автоматически
P∞ он является рядом Тейлора для неко-
торой функции f , а именно, для своей суммы f (x) = n=0 cn · (x − x0 )n (которая будет определена
как минимум в окрестности точки x0 радиуса δ = |x − x0 |).
Сходимость ряда Тейлора. Обсудим теперь, когда все-таки ряд Тейлора сходится к порожда-
ющей его функции. Удобное достаточное условие для этого выглядит так:
Предложение 11.2.10. Пусть функция f определена в δ-окрестности некоторой точки x0 , бес-
конечно гладкая на (x0 − δ; x0 + δ), и имеет ограниченные в совокупности производные:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n (11.2.74)
n=0
n!
Из него мы получаем:
n
X f (k) (x0 ) f (n+1) (ξ)
f (x) − · (x − x0 )k = · (x − x0 )n+1
k! (n + 1)!
k=0
⇓
n
X f (k) (x0 ) f (n+1) (ξ) δn
f (x) − · (x − x0 )k = · (x − x0 )n+1 6 M · −→ 0
k! (n + 1)! (n + 1)! n→∞
k=0
⇓
n
X f (k) (x0 )
· (x − x0 )k −→ f (x)
k! n→∞
k=0
1
⋄⋄ 11.2.11. Следующие разложения Маклорена = 1 + x + x2 + ... + xk + ... =
1−x
§ 2. Ряд Тейлора и аналитические функции 665
∞
X
= xn , (11.2.75)
|1 + ξ|α−1 6 max (1 − |x|)α−1 ; (1 + |x|)α−1
n=0
(11.2.82)
1
= 1 − x + x2 + ... + (−1)k · xk + ... = И, во-вторых,
1+x
∞
X |x − ξ| |x| − |ξ| 1 − |ξ| − (1 − |x|)
= (−1)n · xn (11.2.76) 6 = =
n=0 |1 + ξ| 1 − |ξ| 1 − |ξ|
x2 x3 xk 1 − |x| 1 − |x|
ln(1 + x) = x − + + ... + (−1)k · + ... = =1− 61− = |x| (11.2.83)
2 3 k 1 − |ξ| 1−0
X∞
xn
= (−1)n−1 · (11.2.77) Теперь остаток ряда Маклорена можно оценить
n=1
n так:
1
= 1 − x2 + x4 + ... + (−1)k · x2k + ... = X n
f (k) (0) k
1 + x2
f (x) − · x = (11.2.81) =
X∞ k!
k=0
= (−1)n · x2n (11.2.78) (n+1)
f (ξ)
n=0
= · (x − ξ) · x =
n
x3 x5 x2k+1 n!
arctg x = x − + − ... + (−1)k · +
3 5 2k + 1 α(α − 1)...(α − n) · (1 + ξ)α−n−1
= ·
X∞ 2n+1 n!
x
+ ... = (−1)n · (11.2.79) n
2n + 1 · |x − ξ| · |x| =
n=0 α α
2
x = α 1 − ... 1 − ·
(1 + x)α = 1 + α · x + α(α − 1) · + ... 2 n
2!
· |1 + ξ|α−n−1 · |x − ξ|n · |x| =
xk
... + α(α − 1)...(α − k + 1) · + ... = α α
k! = α 1 − ... 1 − ·
∞ 2
nn
X xn
=1+ α(α − 1)...(α − n + 1) · |x − ξ|
n! · |1 + ξ|α−1 · · |x| 6
n=1 |1 + ξ|
(11.2.80) 6 (11.2.82), (11.2.83) 6
α α
Доказательство. Тождества (11.2.75)-(11.2.79) 6 α 1 − ... 1 − ·
2 n
мы уже доказали на с.648, поэтому их доказы-
вать нет необходимости, нужно только заметить, · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1
что в силу теоремы 11.2.8 они будут разложени-
Обозначим последнюю величину Mn
ями Маклорена (поскольку центром ряда здесь
будет точка 0). α α
Таким образом, интерес в этом списке пред- Mn = α 1 − ... 1 − ·
2 n
ставляет лишь формула (11.2.80). Для ее доказа- · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1 .
α
тельства заметим, что функция f (x) = (1 + x)
имеет производные Нам нужно показать, что Mn стремится к нулю
при n → ∞. Зафиксируем какое-нибудь число q
f (n) (x) = α(α − 1)...(α − n + 1) · (1 + x)α−n такое, что
|x| < q < 1
Применим к этой функции теорему Тейлора-
Коши 11.2.4: для любого x ∈ (−1, 1) и любого (такое q найдется, поскольку |x| < 1). Теперь мы
n ∈ N∗ найдется точка ξ, лежащая между 0 и x получаем:
такая, что 1 − α −→ 1
n + 1 n→∞
Xn
f (k) (0) k ⇓
f (x) = ·x +
k! Mn+1
k=0
= 1 − α · |x| −→ |x| < q
f (n+1)
(ξ) Mn n + 1 n→∞
+ · (x − ξ)n · x (11.2.81)
n! ⇓
Заметим две вещи: во-первых, Mn+1
∃N ∈ N∗ ∀n > N <q
Mn
1 − |x| 6 1 − |ξ| 6 |1 + ξ| 6 1 + |ξ| 6 1 + |x|
⇓
⇓ ∀k ∈ N MN +k < MN · q k
666 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
x3 x5 x2k+1
sin x = x − + − ... + (−1)n · + ... = В силу предложения 11.2.10, это означает, функ-
3! 5! (2k + 1)! цию sin можно представить сходящимся на ин-
X∞ 2n+1
x тервале (−R, R) рядом (11.2.85). Поскольку это
= (−1)n · (11.2.85) верно для любого R > 0, мы получаем, что фор-
n=0
(2n + 1)!
мула (11.2.85) верна при любом x ∈ R.
x2 x4 k x2k 3. Производные функции cos
cos x = 1 − + − ... + (−1) · + ... =
2! 4! (2k)!
X∞
x2n
cos x, n = 4k, k ∈ N
= (−1)n · (11.2.86)
− sin x, n = 4k + 1, k ∈ N
n=0
(2n)! cos(n) x =
− cos x, n = 4k + 2, k ∈ N
Доказательство. 1. Из формулы для производ- sin x, n = 4k + 3, k ∈ N
ных функции ex
∂n x ограничены в совокупности на R. Поэтому функ-
e = ex ция cos удовлетворяет условию (11.2.73) на лю-
(∂x)n
бом интервале (−R, R), R > 0:
видно, что она удовлетворяет условию (11.2.73)
на любом интервале (−R, R), R > 0: sup sup | sin(n) (x)| 6 1 < ∞
n∈N x∈(−R,R)
sup sup |f (n) (x)| = В силу предложения 11.2.10, cos можно пред-
n∈N x∈(−R,R)
ставить сходящимся на интервале (−R, R) рядом
= sup sup |ex | = eR < ∞ (11.2.86). Поскольку это верно для любого R > 0,
n∈N x∈(−R,R)
равенство (11.2.86) будет выполняться для любо-
В силу предложения 11.2.10, это означает, что го x ∈ R.
функцию f (x) = ex представить сходящимся на
Аналитические функции.
• Функция f называется аналитической на интервале (a, b), если она определена на (a, b)
и удовлетворяет следующим равносильным условиям:
(i) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f представима в виде суммы степенного ряда:
∞
X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (11.2.87)
n=0
§ 2. Ряд Тейлора и аналитические функции 667
(ii) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f (является гладкой и) представима в виде суммы своего ряда Тейлора:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (11.2.89)
n=0
n!
f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ (x0 − δ; x0 + δ) (11.2.90)
n!
Доказательство. Равносильность условий (i) и (ii) следует из теоремы 11.2.8.
Теорема 11.2.13. Сумма всякого степенного ряда
∞
X
f (x) = cn · (x − x0 )n , x ∈ (x0 − R; x0 + R)
n=0
⇓
последовательность cn · rn ограничена: ∃M > 0 ∀n ∈ N |cn · rn | = |cn | · rn 6 M
M
∃M > 0 ∀n ∈ N |cn | 6 (11.2.91)
rn
Выберем δ < min{ρ − |x1 |; r − ρ}. Тогда для любой точки ξ ∈ (x1 − δ; x1 + δ) мы получим |ξ| < ρ,
поэтому
M
rn
6
∞ z}|{
X c · n! X∞
|cn | ·n!
∞
X n! M · ρn−k
(k) n n−k n−k
f (ξ) = (11.1.18) = ·ξ 6 · |ξ| 6 · =
(n − k)! (n − k)! | {z } (n − k)! rn
n=k n=k n=k
>
ρn−k
668 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
M X
∞
n! ρ n−k M · k! M · r · k!
= k
· · = (11.1.23) = k+1 =
r (n − k)! r ρ
rk · 1 − r (r − ρ)k+1
n=k
(n+1)
Xn
f (k) (x1 ) f (ξ)
k n+1
∀x ∈ (x1 − δ; x1 + δ) f (x) − · (x − x1 ) = (11.2.62) = · (x − x1 ) =
k! (n + 1)!
k=0
(n+1) n+1
f (ξ) M · r · (n + 1)! M ·r δ
= · |x − x1 |n+1 6 · δ n+1
= · −→ 0. (11.2.92)
(n + 1)! (n + 1)! · (r − ρ)n+2 r−ρ r−ρ n→∞
Выше на с.295 мы показывали, что сумма, разность, произведение, частное и композиция непре-
рывных функций снова является непрерывной функцией. Те же самые свойства для дифференци-
руемых функций доказывались нами на с.375: сумма, разность, произведение, частное и композиция
дифференцируемых функций снова является дифференцируемой функцией. Оказывается, что то
же самое верно и для аналитических функций.
G(F (x)) = g(f (x) − f (x0 ) + f (x0 )) = g(f (x)) = h(x), x∈U
ω(b) > 1.
Значит, определена композиция последовательностей a◦b, которая по теореме 11.1.22 тоже является
аналитической: a ◦ b ∈ A. А производящие функции этих последовательностей связаны формулой
(11.1.53), из которой получаем:
h(x) = (G ◦ F )(x) = G(F (x)) = Gena Genb (x − x0 ) = (11.1.53) = Gena◦b (x − x0 ), x ∈ Uδ (x0 )
Тогда
(f +g)(x) = f (x)+g(x) = Gena (x−x0 )+Genb (x−x0 ) = (11.1.33) = Gena+b (x−x0 ), x ∈ (x0 −δ, x0 +δ)
ствами: z }| {
X∞
f (n) (0) n
x = 0,
( n!
n=0
f (x) = 0, x 6 0
f (x) > 0, x > 0 не сходится к ней ни в какой окрестности нуля
(−δ, +δ), потому что при x > 0 наша функция от-
лична от нуля. Отсюда следует, что f не может
В примере 11.2.7 мы отмечали, что ряд Макло- быть аналитической в точке x = 0.
Целые функции.
• Функция f называется целой, если она определена всюду на R и удовлетворяет следующим
равносильным условиям:
(i)∗ f представима в виде суммы всюду сходящегося на R степенного ряда в нуле:
∞
X
f (x) = cn · xn , x∈R (11.2.93)
n=0
X∞
f (n) (0) n
f (x) = ·x , x∈R (11.2.97)
n=0
n!
f (n) (0)
f (x) = Genc (x), cn = , x∈R (11.2.98)
n!
(ii)∗∗ f является гладкой и всюду на R совпадает с суммой своего ряда Тейлора в
произвольной точке x0 ∈ R:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x∈R (11.2.99)
n=0
n!
f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ R. (11.2.100)
n!
Доказательство. Равносильности (i)∗ ⇔(ii)∗ и (i)∗∗ ⇔(ii)∗∗ следуют из теоремы 11.2.8. С другой
стороны, импликация (i)∗ ⇐(i)∗∗ очевидна, и поэтому остается доказать импликацию (i)∗ ⇒(ii)∗∗ .
Здесь используется тот же прием, что при доказательстве теоремы 11.2.13: поскольку параметры
r и ρ мы можем выбирать произвольными (так, чтобы выполнялась 0 < |x1 | < ρ < r), для всякой
точки x ∈ R можно найти r, ρ и δ так, чтобы x ∈ (x1 − δ, x1 + δ) и выполнялось (11.2.92).
Из теоремы 11.2.13 сразу следует
Теорема 11.2.17. Всякая целая функция является аналитической (и поэтому бесконечно глад-
кой) на R.
X∞
⋄ 11.2.18.
P∞ xВ примере 11.1.5 мы убедились, что (−1)n n
= n+1 · (x − x0 )
n
ряд n=1 n! сходится всюду на R. В соответ- n=0
x0
ствии с нашим определением, это означает, что
порождаемая им функция Таким образом, функция f аналитическая. Ее,
X∞ однако, нельзя считать целой хотя бы потому что
xn
f (x) = она определена не на всей прямой R. Более то-
n=1
n! го, ее нельзя продолжить до целой функции на
является целой. R, потому что по теореме 11.1.10 целая функция
должна быть непрерывна на R, а f не продол-
⋄ 11.2.19. Аналитическая, но не целая
жается до непрерывной функции на R из-за со-
функция. Покажем, что функция
отношения
1 lim f (x) = ∞.
f (x) = x→0
x
является аналитической (на области своего опре- ⋄ 11.2.20. Всюду определенная аналитиче-
деления x ∈ R \ {0}). Зафиксируем точку x0 6= 0. ская, но не целая функция. Функция
Тогда при |x−x0 | < |x0 | справедливо разложение 1
в степенной ряд: f (x) =
1 + x2
1 1 1 1 является аналитический по теореме 11.2.15, как
f (x) = = = · x − x0 =
x x0 + (x − x0 ) x0 1 + отношение двух аналитических функций. Но она
x не является целой, потому что ее ряд Маклорена
| {z0 }
по модулю ∞
меньше 1 X
единицы = (11.2.76) = (−1)n · x2n
1 + x2
∞ n n=0
1 X x − x0
= (11.2.76) = · (−1)n · = сходится только при |x| < 1.
x0 n=0 x0
§ 3. Приложения степенных рядов 671
(a, b) 7→ ab ,
вводилось нами в общем случае (то есть для необязательно целых показателей b) с помощью Акси-
омы степеней B1 на с.328, зависимость которой от других аксиом мы пообещали доказать позже.
Теперь, наконец, мы можем выполнить данное тогда обещание. Собственно доказательству этой
аксиомы (на с.676), мы предпошлем 16 вспомогательных утверждений (леммы 11.3.1-11.3.16). Все
это время читателю предлагается делать вид, что до сих пор он не глядел на текст в двух колонках
и, как следствие не знает ничего об отображении (a, b) 7→ ab , по крайней мере, для случая нецелого
b (случай целых степеней можно считать известным, поскольку для него все необходимые факты
были аккуратно доказаны нами еще в главе 3 в теореме о степенном отображении 3.2.32). Только
после приведенного здесь доказательства Аксиомы степеней все сказанное нами ранее на этот счет
вступит в законную силу, и этой цели посвящен настоящий раздел.
Функция exp. 1
exp(−x) = (11.3.104)
exp x
Лемма 11.3.1. Формула
exp(x + y) = exp x · exp y, (11.3.105)
∞
X n
x
exp x = (11.3.101) Доказательство. 1. Первое равенство доказы-
n=0
n! вается простым вычислением:
X∞
определяет функцию exp всюду на прямой R. 0n 00 01 02
exp 0 = = + + +... = 1
n! 0!
|{z} 1!
|{z} 2!
|{z}
Доказательство. Радиус сходимости этого сте- n=0
1 0 0
пенного ряда равен бесконечности:
2. Докажем затем последнее равенство. По
cn
R = lim = lim (n + 1)! = определению, функция exp является целой, и
n→∞ cn+1 n→∞ n! значит (по условию (ii)∗∗ на с.670), она совпада-
= lim (n + 1) = ∞ ет с суммой своего ряда Тейлора в произвольной
n→∞ точке a ∈ R:
поэтому ряд сходится всюду на R. X∞
exp(n) a n
exp(a + y) = ·y (11.3.106)
Лемма 11.3.2. Функция exp, определенная ря- n=0
n!
дом (11.3.101), имеет производную, причем
По лемме 11.3.2, производная функции exp равна
∂ самой этой функции, поэтому вторая, третья, и
exp x = exp x (11.3.102)
∂x все остальные производные exp тоже совпадают
с exp:
Доказательство. Продифференцируем ряд
exp(n) = exp
(11.3.101) с помощью теоремы 11.1.11:
Подставив это в (11.3.106), мы получим:
X∞ n X∞ n
∂ ∂ x ∂ x ∞ ∞
exp x = = = X exp(n) a n X exp a n
∂x ∂x n=0 n! n=0
∂x n! exp(a + y) = ·y = ·y =
∞ ∞ n=0
n! n=0
n!
X xn−1 X x k
= = = exp x X∞
(n − 1)! k! 1
n=1 k=0 = exp a · · y n = exp a · exp y
n=0
n!
⇓ Функция ln.
1
exp(−x) = Лемма 11.3.7. Функция exp, определенная ря-
exp x дом (11.3.101), биективно отображает прямую
R на интервал (0; +∞)
Лемма 11.3.4. Функция exp, определенная ря- exp : R → (0; +∞) (11.3.110)
дом (11.3.101), всюду положительна, а в нуле
равна единице: и поэтому правило
exp x > 0 (11.3.107)
t = ln x ⇐⇒ exp t = x (11.3.111)
Доказательство. Предположим, что в какой-то
точке a функция exp равняется нулю: корректно определяет функцию ln, обратную к
exp:
exp a = 0. ln : (0; +∞) → R (11.3.112)
Тогда: Доказательство. 1. Прежде всего, неравенство
(11.3.107) означает, что отображение exp дей-
1 = exp 0 = exp(a − a) = (11.3.105) = ствительно переводит R в (0; +∞).
= exp a · exp(−a) = 0, 2. Далее из условия возрастания (11.3.109)
| {z }
0 следует, что отображение exp инъективно.
3. Покажем, что exp сюръективно отобра-
что, конечно, невозможно. Таким образом, exp
жает R на (0; +∞). Пусть C ∈ (0; +∞). По-
– непрерывная функция, определенная всюду на
скольку limx→−∞ exp x = 0 (первое равенство в
прямой R, нигде не обращающаяся в нуль, а в
(11.3.109)), найдется x ∈ R такое, что exp x < C.
точке 0 равная единице. Такое возможно только
С другой стороны, limx→+∞ exp x = +∞ (второе
если exp всюду положительна.
равенство в (11.3.109)), поэтому найдется y ∈ R
Лемма 11.3.5. Функция exp, определенная ря- такое, что exp y > C. Мы получаем, что
дом (11.3.101), возрастает на R:
exp x < C < exp y
x<y =⇒ exp x < exp y (11.3.108)
причем exp – непрерывная функция по теореме
Доказательство. Производная этой функции 11.1.10. Значит, по теореме Коши о среднем зна-
всюду положительна чении 4.3.22, найдется точка c ∈ R такая, что
∂ exp c = C
exp x = (11.3.102) = exp x > (11.3.107) > 0,
∂x
поэтому по теореме 6.2.22 о строгой монотонно- Мы получили, что какое ни возьми C ∈ (0; +∞),
сти, эта функция должна возрастать. для него найдется точка c ∈ R, в которой функ-
ция exp принимает значение C. Это и означа-
Лемма 11.3.6. Функция exp, определенная ря- ет сюръективность exp как отображения из R в
дом (11.3.101), имеет следующие пределы на бес- (0; +∞).
конечности: 4. Инъективность и сюръективность вместе
означают биективность exp : R → (0; +∞).
lim exp x = 0 lim exp x = +∞ (11.3.109)
x→−∞ x→+∞
Лемма 11.3.8. Функция ln, определенная пра-
Доказательство. Второй предел следует из оче- вилом (11.3.111), возрастает:
видного неравенства:
0<x<y =⇒ ln x < ln y (11.3.113)
x2
∀x > 0 exp x = 1 + x + + ... > 1 + x
2 Доказательство. Если бы оказалось, что ln x >
ln y, то, в силу возрастания exp, мы получили бы
После того, как он доказан, первый предел полу-
чается заменой переменных: ln x > ln y
y = −x ⇓
lim exp x = = lim exp(−y) =
x→−∞ y → +∞ y→+∞
exp(ln x) > exp(ln y)
1 1 | {z } | {z }
= (11.3.104) = lim = = x y
y→+∞ exp y limy→+∞ exp y
⇓
1
= =0
+∞ x>y
§ 3. Приложения степенных рядов 673
Лемма 11.3.9. Функция ln, определенная пра- Доказательство. Если a > 0, то мы получаем:
вилом (11.3.111), удовлетворяет следующему
равенству и двум тождествам: ab = (11.3.117) = exp(b · ln a) =
z }| {
1
ln 1 = 0, (11.3.114) = sgn2 b ∨ sgn a · exp(b · ln |a| )
1 | {z } |{z}
ln = − ln x (11.3.115) 1
a
x
ln(x · y) = ln x + ln y, (11.3.116) Если же a < 0, то
опять b ∈ 2N∗Z−1 ); 0
y
Z = sgn2 x · exp(x · ln |a|) = (11.3.118) =
— наконец, если x < 0, y < 0, то b ∈ 2N∗ −1 , и | {z }
6=
0 0
>
z}|{
(x · y)b = (11.3.117) = exp(b · ln(x · y)) = = sgn2 y ∨ sgn sgn2 x · exp(x · ln |a|) ·
1 x·y | {z }
z }| { z }| { sgn2 x
= (sgn2 b)2 · exp(b · ln(|x| · |y|)) =
· exp y · ln sgn2 x · exp(x · ln |a|) =
= (11.3.116) = (sgn2 b)2 ·exp(b·ln |x|+b·ln |y|) = | {z }
= (11.3.105) = exp(x·ln |a|)
= sgn2 b · exp(b · ln |x|) · sgn2 b · exp(b · ln |y|) = = sgn2 y ∨ sgn2 x ·
| {z } | {z } | {z }
xb yb
=
(3.2.216)
= xb · y b
=
sgn2 (y · x)
Лемма 11.3.13. Отображение (a, b) 7→ ab , · exp y · ln exp(x · ln |a|) =
определенное формулой (11.3.117), удовлетворя- | {z }
ет накопительному закону (5.1.7):
=
x · ln |a|
x y x·y
(a ) = a (a > 0) (11.3.123) = sgn2 (y · x) · exp y · x · ln |a| = ay·x = ax·y
в следующих случаях:
— при a > 0 и x, y ∈ R, Лемма 11.3.14. Отображение (a, b) 7→ ab ,
— при a = 0 и x > 0, y > 0, определенное формулой (11.3.117), удовлетворя-
— при a < 0 и x, y ∈ 2N∗Z−1 . ет условию сохранения знака (3.2.142):
Значит ряд
определяют функции sin и cos всюду на прямой ∞
X yn
R. (−1)n ·
n=0
(2n)!
Доказательство. 1. Первый ряд перепишем в сходится при любом y. Как следствие, при под-
виде становке y = x2 получающийся ряд
∞ ∞ ∞
X
X x2n+1 X (x2 )n (x2 )n
(−1) · n
= x· (−1)n · = (−1)n ·
(2n + 1)! (2n + 1)! n=0
(2n)!
n=0 n=0
∞
X yn тоже должен сходиться, независимо от того, ка-
n
=x· (−1) · кое значение принимает x. Мы получаем, что
n=0
(2n + 1)!
y=x формула (11.3.130) определяет функцию cos всю-
2
∞
X
То есть ряд (−x)2n+1
sin(−x) = (11.3.129) = (−1)n · =
∞ (2n + 1)!
X yn n=0
(−1)n · ∞
X −(x2n+1 )
n=0
(2n + 1)! = (−1)n · =
n=0
(2n + 1)!
сходится при любом y. Значит при подстановке ∞
X
y = x2 получающийся ряд x2n+1
=− (−1)n · = (11.3.129) = − sin x
n=0
(2n + 1)!
∞
X
n (x2 )n
(−1) ·
(2n + 1)! ∞
X
n=0 (−x)2n
cos(−x) = (11.3.130) = (−1)n · =
тоже сходится независимо от того, какое значе- n=0
(2n)!
ние принимает x. После умножения на x получа- ∞
X 2n
ющийся ряд x
= (−1)n · = (11.3.130) = cos x
n=0
(2n)!
∞
X
n x2n+1
(−1) ·
n=0
(2n + 1)!
Лемма 11.3.19. Функции sin и cos, определен-
тоже должен сходиться в силу свойства 1◦ на ные рядами (11.3.129)-(11.3.130), удовлетворя-
с.559, каким бы ни был x. Все это означает, что ют равенствам:
формула (11.3.129) определяет функцию sin всю-
ду на прямой R. sin 0 = 0 cos 0 = 1 (11.3.132)
2. Второй ряд можно переписать так:
Доказательство.
∞
X ∞
X
x2n (x2 )n ∞
X 02n+1
(−1)n · = (−1)n · = sin 0 = (11.3.129) = (−1)n · =
n=0
(2n)! n=0 (2n)! (2n + 1)!
n=0
y n
∞
X ∞
n
X
= (−1) · = (−1)n · 0 = 0
n=0
(2n)!
y=x2 n=0
678 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
∞
X 02n Доказательство. Зафиксируем какое-нибудь
cos 0 = (11.3.130) = (−1)n · =
(2n)! число a ∈ R и рассмотрим три функции:
n=0
∞
X 2n
0 02·0 F (x) = sin(x + a) − sin x · cos a − cos x · sin a
= (−1)n · = (−1)0 · +
(2n)! (2 · 0)! G(x) = cos(x + a) − cos x · cos a + sin x · sin a
n=0 | {z }
1 H(x) = F (x)2 + G(x)2
∞
X 02n
+ (−1)n · =1 Заметим две вещи: во-первых,
n=1 |
(2n)!
{z } (
0 F (0) = sin a − sin 0 · cos a − cos 0 · sin a = 0
G(0) = cos a − cos 0 · cos a + sin 0 · sin a = 0
Лемма 11.3.20. Функции sin и cos, определен- ⇓
ные рядами (11.3.129)-(11.3.130), имеют следу-
ющие производные: H(0) = F (0)2 + G(0)2 = 0
∂ ∂ И, во-вторых,
sin x = cos x cos x = − sin x (11.3.133)
∂x ∂x ′
F (x) = cos(x + a) − cos x · cos a+
Доказательство.
+ sin x · sin a = G(x)
∂ ′
G (x) = − sin(x + a) + sin x · cos a+
sin x = (11.3.129) =
∂x + cos x · sin a = −F (x)
∞
∂ X x2n+1
= (−1)n · = ⇓
∂x n=0 (2n + 1)!
∞
X ∂ x2n+1
= (−1)n · = H ′ (x) = 2 · F (x) · F ′ (x) + 2 · G(x) · G′ (x) =
n=0
∂x (2n + 1)!
∞
= 2 · F (x) · G(x) − 2 · G(x) · F (x) = 0
X (2n + 1) · x2n
n
= (−1) · = Вместе это означает, что функция H должна
n=0
(2n + 1)!
быть тождественно равна нулю, а значит F и G
∞
X x2n тоже тождественно равны нулю:
= (−1)n · = cos x
(2n)!
n=0
H(x) = F (x)2 + G(x)2 ≡ 0
∂ ⇓
cos x = (11.3.130) = (
∂x
∞ F (x) ≡ 0
∂ X x2n
= (−1)n · = G(x) ≡ 0
∂x n=0 (2n)!
∞ Заменяя a на y, мы из последних тождеств по-
X ∂ x2n
= (−1) · n
= лучаем (11.3.134)-(11.3.135).
n=0
∂x (2n)!
∞
Лемма 11.3.22. Функции sin и cos, определен-
X (2n) · x2n−1
n
= (−1) · 0 + (−1) · n
= ные рядами (11.3.129)-(11.3.130), удовлетворя-
n=1
(2n)! ют тождеству:
X∞
n x2n−1 замена:
sin2 x + cos2 x = 1 (11.3.136)
= (−1) · = k = n − 1 =
n=1
(2n − 1)! n=k+1
∞
Доказательство. Подставив y = −x в
X x2k+1 (11.3.135), мы получим:
k+1
= (−1) · =
(2k + 1)!
k=1
∞
X 1 = (11.3.132) = cos 0 = cos(x − x) =
x2k+1
=− (−1)k · = − sin x = cos x · cos(−x) − sin x · sin(−x) =
(2k + 1)!
k=1
= (11.3.131) = cos2 x + sin2 x
x ∈ [0, 2]
cos x = 1−
⇓ X∞
x4k+2 x2
2 − · 1− 6
x 6 4 < (4k + 3) · (4k + 4) (k ∈ N) k=0
(4k + 2)! (4k + 3) · (4k + 4)
⇓ x2 x2
61− · 1−
x2 2! 3·4
<1 (k ∈ N)
(4k + 3) · (4k + 4)
В частности, при x = 2 получаем:
⇓
22 22
x2 cos 2 6 1 − · 1− =
1− >0 (k ∈ N) (11.3.137) 2! 3·4
(4k + 3) · (4k + 4)
2 1 1
=1− · 1− =− <0
Отсюда следует, что при x ∈ (0, 2) в полученном 2! 3 3
ряде все слагаемые тоже положительны, и зна-
чит С другой стороны, в силу (11.3.132),
X∞
x4k+1 x2 cos 0 = 1
sin x = · 1− >0
(4k + 1)! (4k + 3) · (4k + 4)
k=0
Мы получаем, что на отрезке [0, 2] функция cos
меняет знак. Значит, по теореме Коши о про-
межуточном значении 4.3.22, она обращается в
Лемма 11.3.24. Функция cos, определенная ря-
нуль в некоторой точке a ∈ (0, 2).
дом (11.3.130), имеет на промежутке (0, 2) ров-
но один нуль: Остается показать, что это единственный
нуль на (0, 2). Действительно, по лемме 11.3.23,
∃! a ∈ (0, 2) cos a = 0 (11.3.138) производная этой функции отрицательна на ин-
тервале (0, 2):
Доказательство. Перепишем ряд, определяю-
щий cos, иначе: ∂
cos x = − sin x < 0
∂x
X∞
x2n
cos x = (−1)n · = Значит, по теореме 6.2.22 cos монотонно убывает
(2n)!
n=0 на интервале (0, 2), и поэтому не может дважды
x2 x4 x6 x8 обращаться в нуль на нем.
=1− + − + − ... =
2! 4!
6! 8!
x2 x2 x6 x2
=1− · 1− − · 1− + ... = Лемма 11.3.25. Точка a ∈ (0, 2), определенная
2! 3·4 6! 7·8 условием (11.3.138), обладает следующими свой-
X∞ 4k+2
2
ствами:
x x
=1− · 1−
(4k + 2)! (4k + 3) · (4k + 4)
k=0 cos a = 0 sin a = 1 (11.3.139)
В силу (11.3.137), при x ∈ [0, 2] множитель в cos 2a = −1 sin 2a = 0 (11.3.140)
скобках в последнем ряде положителен, поэтому cos 4a = 1 sin 4a = 0 (11.3.141)
680 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
Доказательство. Первая строчка: x2 x5 x2
=x· 1− + · 1− + ... =
2 4! 5·6
cos a = 0
x2
=x· 1− +
⇓ 2
| {z }
<
sin2 a = 1 − cos2 a = 1 0,
при x ∈ (0, 1)
⇓ ∞
X x4k+1 x2
sin a = 1 + · 1− >0
(4k)! (4k + 1) · (4k + 2)
sin a = −1 ← невозможно, в силу леммы 11.3.23 k=1 | {z }
<
⇓ 0,
при x ∈ (0, 1)
sin a = 1
Вторая строчка: 2. Второе неравенство:
cos 2a = cos2 a − sin2 a = 0 − 1 = −1,
sin x − x · cos x =
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 X∞
x2n+1 X∞
x2n
= (−1)n · −x· (−1)n · =
Третья строчка: n=0
(2n + 1)! n=0
(2n)!
∞
X X∞
cos 4a = cos2 2a − sin2 2a = 0 − 1 = −1, x2n+1
n x2n+1
= (−1) · − (−1)n · =
n=0
(2n + 1)! n=0 (2n)!
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 ∞ 2n+1
X x x2n+1
n
= (−1) · − =
n=0
(2n + 1)! (2n)!
Лемма 11.3.26. Число 4a, где a ∈ (0, 2) опре- ∞
X x2n+1
делено условием (11.3.138), является периодом = (−1)n · · 1 − (2n + 1) =
n=0
(2n + 1)!
для функций sin и cos, определенных рядами
∞
X
(11.3.129)-(11.3.130): x2n+1
= (−1)n+1 · · 2n =
n=0
(2n + 1)!
sin(x + 4a) = sin x, cos(x + 4a) = cos x
3
x x5 x7 x9
=0+ ·2− ·4+ ·6− · 8 + ... =
Доказательство. Здесь просто применяется 3! 5! 7! 9!
(11.3.141): x3 x2 x7 x2
= · 2− + · 6− · 8 + ... =
3! 5 7! 9
sin(x + 4a) = sin x · cos
| {z4a} + cos x · sin
| {z4a} = sin x ∞
X x4k+3 x2
1 0 = · (4k + 2) − >0
(4k + 3)! 4k + 5
cos(x + 4a) = cos x · cos
k=0 | {z }
| {z4a} − sin x · sin
| {z4a} = cos x
<
1 0 0,
при x ∈ (0, 1)
x · cos x = x · (−1)n · = 0,
n=0
(2n)! при x ∈ (0, 1)
x3 x5 x7
=x− + − + ... =
2! 4! 6!
§ 3. Приложения степенных рядов 681
1
||bn ||[0,1] = −→ 0 ! 11.3.29. Как и в случае с числом Непера e,
2n + 1 n→∞
значение которого, как мы помним оценивались
То есть ряд (11.3.146) удовлетворяет условиям с помощью неравенства (4.2.102), значения π так-
теоремы 10.1.36 (признак Лейбница равномерной же можно оценивать, используя теперь неравен-
сходимости), и значит, он равномерно сходится ство (11.3.145), однако эти два случая качествен-
на отрезке [0, 1]. Обозначим его сумму буквой f : но различаются тем, что нужная точность для π
∞
достигается гораздо медленнее, чем для e. На-
X x2n+1
f (x) = (−1)n · , x ∈ [0, 1] пример, для вычисления первых двух знаков по-
n=0
2n + 1 сле запятой для π нужно брать сумму 1000 сла-
682 Глава 11. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
1000
X
гаемых: во-первых, (−1)n · 4 4
< − <π<
4 2n + 1 2 · 1000 + 3
= 0, 0019970...
2·1000+3
n=0
⇓ 1000
X (−1)n · 4 4
4
0, 001 < 2·1000+3 < 0, 002 < − <
n=0
2n + 1 2 · 1000 + 3
⇓
4
−0, 002 < − 2·1000+3 < −0, 001 < 3, 142 + 0, 002 = 3, 144
во-вторых, ⇓
P1000 n
(−1) ·4
n=0 = 3, 14259165...
2n+1
⇓ 3, 14 < π < 3, 15 (11.3.147)
P1000 (−1)n ·4
3, 142 < n=0 2n+1 < 3, 143
⇓
и вместе это дает
∞
X ∞
X
Напомним, что числа Фибоначчи определя-
= x1 ·s2 + xk−1 · sk + xk−2 · sk =
ются рекуррентными соотношениями (4.2.41): |{z}
k=3 k=3
=
1
x1 = x2 = 1, xn+2 = xn+1 + xn , n ∈ N∗
∞
X
= s2 + (xk−1 + xk−2 ) ·sk =
Предложение 11.3.30. Числа Фибоначчи опи- | {z }
k=3
сываются явно формулой xk
∞
X
" √ !n √ !n # 2
= −s + |s +
{zs} + xk · sk =
1 1+ 5 1− 5
xn = √ − k=3
=
5 2 2
x1 · s1 + x2 · s2
(11.3.149) ∞
X
= −s + xk · sk = −s + F (s)
Доказательство. Рассмотрим производящую k=1
функцию этой последовательности: ⇓
∞
X (s + s2 ) · F (s) = −s + F (s)
F (s) = xn · sn ⇓
n=1
s = (1 − s − s2 ) · F (s)
(суммирование начинается с номера n = 1; это ⇓
можно объяснить, например, так: мы будем счи-
тать, что x0 = 0). Помножив F (s) на многочлен s
F (s) = (11.3.150)
s + s2 , мы получим цепочку: 1 − s − s2
Разложим знаменатель на множители:
∞
X 1 − s − s2 = −(s − a)(s − b)
(s + s2 ) · F (s) = (s + s2 ) · xn · sn =
n=1 где √ √
∞
X ∞
X −1 − 5 −1 + 5
= xn · sn+1 + xn · sn+2 = a= , b=
2 2
n=1 n=1 Заметим попутно, что
| {z } | {z }
замена: n + 1 = k замена: n + 2 = k √ √
∞ ∞
−1 + 5 1 + 5 √
X X b−a= + = 5 (11.3.151)
= xk−1 · sk + xk−2 · sk = 2 2
k=2 k=3
§ 3. Приложения степенных рядов 683
√
1 2 2 · (1 − 5) s 1 1 1 1
=− √ =− √ √ = = · · s − · = (11.2.75) =
a 1+ 5 (1 + 5) · (1 − 5) b−a a 1− a b 1 − as
√ √ !
1 X s n 1 X s n
∞ ∞
2 · (1 − 5) 1− 5 s
=− = (11.3.152) = · · − · =
1−5 2 b−a a n=0 a b n=0 b
∞ ∞
!
√ s X sn X sn
1 2 2 · (1 + 5) = · − =
=− √ =− √ √ = b−a an+1 n=0 bn+1
b 1− 5 (1 − 5) · (1 + 5) n=0
√ √ ∞
2 · (1 + 5) 1+ 5 1 X 1 1
=− = (11.3.153) = · − ·sn+1 = |n + 1 = k| =
1−5 2 b − a n=0 an+1 bn+1
Тогда X∞
1 1 1
= · − k · sk =
s 1 b−a ak b
F (s) = = −s · = k=1
1 − s − s2 (s − a)(s − b) = (11.3.151), (11.3.152), (11.3.153) =
| {z }
раскладываем ∞ √ !k √ !k
1 X 1− 5 k
на простейшие дроби
= √ · 1+ 5 − ·s
по правилам на с.468
! 5 2 2
1 1 k=1
a−b s
b−a 1 1
= −s· + = · − =
s−a s−b b−a s−b s−a
s 1 1 Выделяя коэффициенты перед sk , мы теперь по-
= · − = лучим (11.3.149).
b−a a−s b−s
Глава 12
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
a0 X n πnx o
N
πnx
+ an · cos + bn · sin (12.0.1)
2 n=1
T T
a0 X n πnx o
∞
πnx
+ an · cos + bn · sin (12.0.2)
2 n=1
T T
1 T
ˆ
a0 = f (x) d x,
T −T
1 T πnx
ˆ
an = f (x) cos d x, (12.0.3)
T −T T
1 T πnx
ˆ
bn = f (x) sin dx
T −T T
a0 X n πnx o
N
πnx
SN (x) = + an · cos + bn · sin (12.0.4)
2 n=1
T T
684
§ 1. Сходимость ряда Фурье в среднем квадратичном 685
поэтому, если функция f является суммой своего ряда Фурье (12.0.5), то она тоже должна иметь
период 2T :
f (x + 2T ) = f (x)
Отсюда становится понятно, что предметом изучения для нас должны быть периодические функции
f , интегрируемые на отрезке [−T, T ], где T – период. Всякая такая функция будет интегрируема
не только на отрезке [−T, T ], но и вообще на любом отрезке [a, b] ⊂ R, поэтому нам будет удобно
употреблять для таких функций следующий термин:
• Функция f : R → R называется локально интегрируемой, если она интегрируема на
каждом отрезке [a, b] ⊂ R.
1 π 1 π 1 π
ˆ ˆ ˆ
a0 = f (x) d x, an = f (x) cos nx d x, bn = f (x) sin nx d x (12.1.7)
π −π π −π π −π
a0 X n o
N
SN (x) := + an cos nx + bn sin nx (12.1.8)
2 n=1
a0 X n o
∞
f (x) = + an cos nx + bn sin nx , (12.1.10)
2 n=1
1 π
ˆ
hf, gi = f (x) · g(x) d x (12.1.12)
π −π
Она называется скалярным произведением функций f и g. Перечислим некоторые
10 . Положительная полуопределенность:
hf, f i > 0
20 . Симметричность:
hf, gi = hg, f i
30 . Билинейность:
hα · f + β · g, hi = α · hf, hi + β · hg, hi
1 π n o 1 π n o
ˆ ˆ
hα · f + β · g, hi = α · f (x) + β · g(x) · h(x) d x = α · f (x) · h(x) + β · g(x) · h(x) d x =
π −π π −π
ˆ π
1 1 π
ˆ
=α· f (x) · h(x) d x + β · g(x) · h(x) d x = α · hf, hi + β · hg, hi
π −π π −π
§ 1. Сходимость ряда Фурье в среднем квадратичном 687
Теорема 12.1.3 (неравенство Коши-Шварца для функций). Для любых функций f, g ∈ R(π) спра-
ведливо следующее неравенство, называемое неравенством Коши-Шварца:
hf, gi 6 kf k · kgk (12.1.14)
Поскольку hf + tg, f + tgi > 0, этот многочлен должен при любом значении t быть неотрицателен:
2 2
p(t) = kf k + 2thf, gi + t2 kgk > 0, ∀t ∈ R
Значит, он не может иметь двух вещественных корней, и поэтому его дискриминант должен быть
неположительным:
2 2
D = 4hf, gi2 − 4 kf k · kgk 6 0
⇓
2 2
hf, gi2 6 kf k · kgk
⇓
hf, gi 6 kf k · kgk
kf + gk2 + kf − gk2 2 2
= kf k + kgk . (12.1.18)
2
Доказательство. Первые два свойства очевидны, докажем неравенство треугольника (12.1.17):
2 2
kf + gk 6 kf k+kgk ⇐= kf + gk 6 kf k + kgk ⇐= hf, gi 6 |hf, gi| 6 kf k · kgk
| {z } | {z } | {z }
k k ↑
hf + g, f + gi kf k2 + 2 · kf k · kgk + kgk2 неравенство
k k Коши-Шварца (12.1.14)
hf, f i + 2hf, gi + hg, gi hf, f i + 2 · kf k · kgk + hg, gi
kf − fn k −→ 0,
n→∞
Доказательство.
hf, gi − hfn , gi = hf − fn , gi 6 (12.1.14) 6 kf − fn k · kgk −→ 0
n→∞
∀i 6= j hfi , fj i = 0
Лемма 12.1.7. Коэффициенты ряда Фурье произвольной функции f ∈ R(π) связаны со скалярным
произведением следующими формулами:
D E D E D E
a0 = f, 1 , ak = f, cosk , bk = f, sink (12.1.24)
1 π 1 π
ˆ ˆ
hf, cosk i = (12.1.12) = f (x) · cosk (x) d x = f (x) · cos kx d x = ak .
π −π π −π
XN n o
a0
SN = ·1+ an · cosn +bn · sinn (12.1.25)
2 n=1
Доказательство. Действительно,
* N
+ N
a0 X a0
X
hSN , 1i = ·1+ an cosn +bn sinn , 1 = · 1, 1 + an · cosn , 1 + bn · sinn , 1 =
2 n=1
2 n=1
XN
a0
= (12.1.21) = ·2+ an · 0 + b n · 0 = a0
2 n=1
Аналогично, если k 6 N , то
* N
+
a0 X
hSN , cosk i = ·1+ an cosn +bn sinn , cosk =
2 n=1
N
a0
X
= · 1, cosk + an · cosn , cosk + bn · sinn , cosk =
2 n=1
XN
a0 0, если n 6= k
= (12.1.21), (12.1.22) = ·0+ an · + b n · 0 = ak
2 1, если n = k
n=1
λ0 X n o
N
P = + λn · cos nx + µn · sin nx , λn , µn ∈ R.
2 n=1
v
u
a2 X n 2 o
u N
min kf − P k = kf − SN k = thf, f i − 0 − an + b2n (12.1.27)
P 2 n=1
λ0 X n o a0 X n o
N N
P = + λn cosn +µn sinn , SN = + an cosn +bn sinn
2 n=1
2 n=1
XN n o XN n o
λ20
= hf, f i+ ·h1, 1i+ λ2n ·hcosn , cosn i+µ2n ·hsinn , sinn i −λ0 · hf, 1i −2· λn · hf, cosn i +µn · hf, sinn i =
4 | {z } | {z } | {z }
n=1 n=1
(12.1.26) k (12.1.26) k (12.1.26) k
a0 an bn
λ20 X n 2 o
N XN n o
= hf, f i + + λn + µ2n − λ0 · a0 − 2 · λn · an + µn · bn =
2 n=1 n=1
a2 X 2 X
N N a2 X N n o
λ20
= hf, f i+ − λ0 · a0 + 0 + λn − 2 · λn · an + a2n + µ2n − 2 · µn · bn + b2n − 0 − a2n +b2n =
|2 {z 2} n=1 | {z } n=1 | {z } 2 n=1
k k k
(λ0 −a0 )2 (λn − an )2 (µn − bn )2
2
a2 X n 2 o
N N N
(λ0 − a0 )2 X X
= hf, f i + + (λn − an )2 + (µn − bn )2 − 0 − an + b2n >
2 n=1 n=1
2 n=1
| {z }
достигает минимума при λn = an , µn = bn
то есть при P = SN
§ 1. Сходимость ряда Фурье в среднем квадратичном 691
a20 X n 2
N o
> hf, f i − − an + b2n = kf − P k2 = kf − SN k2
2 n=1
P =SN
Лемма 12.1.10. Для всякой функции f ∈ R(π) и любого ε > 0 найдется тригонометрический
многочлен P , расстояние от которого до f меньше ε:
kf − P k < ε (12.1.28)
Доказательство. Обозначим
M= sup |f (x)|
x∈[−π,π]
Воспользуемся сначала теоремой 10.2.2, и подберем непрерывную функцию g на [−π, π] так, чтобы
выполнялись условия:
π
π · ε2
ˆ
|f (x) − g(x)| d x < , sup |g(x)| 6 M, g(−π) = g(π)
−π 8M x∈[−π,π]
Тогда
π π
1 1
ˆ ˆ
2
kf − gk = |f (x) − g(x)|2 d x = |f (x) − g(x)| ·|f (x) − g(x)| d x 6
π −π π −π | {z }
>
|f (x)| + |g(x)|
>
2M
π
2M 2M π · ε2 ε2
ˆ
6 |f (x) − g(x)| d x < · =
π −π π 8M 4
⇓
ε
kf − gk <
2
Далее заметим, что поскольку функция g непрерывна на [−π, π] и принимает одинаковые значения
на концах этого отрезка, ее можно продолжить до непрерывной 2π-периодической функции на всю
прямую R. Тогда воспользовавшись теоремой 10.2.15 мы сможем подобрать тригонометрический
многочлен P так, чтобы
ε
sup |g(x) − P (x)| < √
x∈[−π,π] 2 2
Для него мы получим:
π π
1 1 ε2 ε2
ˆ ˆ
2
kg − P k = |g(x) − P (x)|2 d x 6 dx =
π −π | {z } π −π 8 4
>
ε2
8
⇓
ε
kg − P k <
2
Вместе получается:
ε ε
kf − P k = k(f − g) + (g − P )k 6 (12.1.17) 6 kf − gk + kg − P k < + =ε
2 2
692 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
Неравенство Бесселя.
Лемма 12.1.11. Пусть an и bn – коэффициенты Фурье (12.1.24) функции f ∈ R(π). Тогда числовой
ряд
a20 X n 2 o
∞
+ an + b2n
2 n=1
a20 X n 2 o
∞
1 π
ˆ
+ an + b2n 6 hf, f i = f (x)2 d x (12.1.29)
2 n=1
π −π
a20 X n 2 o
N
hf, SN i = hSN , SN i = + an + b2n (12.1.30)
2 n=1
a0 D E Xn D N E D Eo a2 X n 2
No
= · f, 1 + ak · f, cosk + bk · f, sink = (12.1.24) = 0 + an + b2n
2 2 n=1
k=1
А с другой,
* N n
+
a0 X o
hSN , SN i = SN , ·1+ ak · cosk +bk · sink =
2
k=1
a0 D E XN n D E D Eo a2 X n 2 o
N
= · SN , 1 + ak · SN , cosk + bk · SN , sink = (12.1.26) = 0 + an + b2n
2 2 n=1
k=1
2. Обозначим
RN = f − SN
и заметим, что SN и RN ортогональны:
D E
SN , RN =0 (12.1.31)
Действительно,
D E D E D E D E
SN , RN = SN , f − SN = SN , f − SN , SN = (12.1.30) = 0
Действительно,
D E D E D E D E
f, f = SN + RN , SN + RN = SN + RN , SN + SN + RN , RN =
D E D E D E D E D E D E
= SN , SN + RN , SN + SN , RN + RN , RN = SN , SN + RN , RN
| {z }
k
0
в силу (12.1.31)
4. Из (12.1.32) следует:
D E D E D E D E a2 X n 2
N o
f, f = (12.1.32) = SN , SN + RN , RN > SN , SN + 0 = (12.1.30) = 0 + an + b2n
| {z } 2 n=1
свойство 10
>
0
§ 1. Сходимость ряда Фурье в среднем квадратичном 693
то есть,
a20 X n 2 o D E
N
+ an + b2n 6 f, f (12.1.33)
2 n=1
a20 P∞ n 2 2
o
Это верно при любом N ∈ N, поэтому ряд 2 + n=1 a n + b n сходится. При этом, автоматически
выполняется (12.1.29):
!
a20 X n 2 o a20 X n 2 o
∞ N π
1
ˆ
+ an + b2n = lim + an + b2n 6 (12.1.33) 6 hf, f i = f (x)2 d x
2 n=1
N →∞ 2 n=1
π −π
Равенство Парсеваля.
Лемма 12.1.12. Для всякой функции f ∈ R(π) выполняется следующее равенство, называемое
равенством Парсеваля:
a20 X n 2 o
∞ π
1
ˆ
+ an + b2n = hf, f i = f (x)2 d x (12.1.34)
2 n=1
π −π
Доказательство. По лемме 12.1.11, ряд в левой части этой формулы должен сходиться, причем
его сумма, обозначим ее C, не превосходит величины hf, f i:
a20 X n 2 o
∞
+ an + b2n = C 6 hf, f i
2 n=1
Наша задача – убедиться, что C > hf, f i. Зафиксируем ε > 0 и по лемме 12.1.10 подберем тригоно-
метрический многочлен P , для которого выполняется (12.1.28):
kf − P k < ε
(12.1.27)
kf − SN k2
=
(12.1.27)
a2 PN n o
hf, f i − 0
2 − n=1 a2n + b2n
a20 X n 2 o
N
hf, f i − − an + b2n < ε2
2 n=1
a20 X n 2 o a2 X n 2 o
N ∞
hf, f i < + an + b2n + ε2 6 0 + an + b2n + ε2 = C + ε2
2 n=1
2 n=1
hf, f i < C + ε2
=
(12.1.34)
hf, f i
А вторая лемма утверждает, что если какой-то тригонометрический ряд сходится в среднем
квадратичном к некоторой функции f ∈ R(π), то это будет в точности ряд Фурье этой функции:
Лемма 12.1.14. Пусть an и bn – две последовательности чисел и
a0 X n o
N
PN = + an · cosn +bn · sinn
2 n=1
a0 X n o
N
+ an cos nx + bn sin nx −→ f (x)
2 n=1
N →∞
nxo 2π
⋄ 12.2.1. Рассмотрим функцию 1
ˆ
bn = · sin nx d x =
nxo π0 2π
f (x) = 1 2π x
ˆ
2π = · sin nx d x =
x π 0 2π
(взятие дробной части от 2π ). Она локально ин- ˆ 2πn
тегрируема и имеет период 2π. Вычислим ее ко- 1
=− 2 x d cos nx =
эффициенты Фурье: 2π n 0
1 2π 1
ˆ 2π
nxo
1 π
1 2π n x o = − 2 · x · cos nx + 2 cos nx d x =
ˆ ˆ
a0 = dx = dx = 2π n | {z 0 } 2π n 0
π −π 2π π 0 2π
=
1 2π x x2 x=2π
ˆ
2π
= dx = =1 2π
π 0 2π 4π 2 x=0 1 1 1
=− + 2 2 · sin nx = −
πn 2π n | {z 0 } πn
nxo
=
2π
1
ˆ
an = · cos nx d x = 0
π0 2π
1 2π x
ˆ
Ряд Фурье получается такой:
= · cos nx d x =
π 0 2π
∞
1 X 1
ˆ 2π
1
= x d sin nx = − · sin nx
2π 2 n 0 2 n=1 πn
1 2π 1
ˆ 2π
= · x · sin nx − 2 sin nx d x = и в точке x = 0 он сходится не к значению f (0):
2π 2 n | {z 0 } 2π n 0
=
N
0
1 X 1 1
1 2π − · sin 0 −→ 6= 0 = f (0)
2 n=1 πn N →∞ 2
= · cos nx = 0
2π 2 n2 0 | {z = }
0
Уже из этого примера видно, что если мы хотим, чтобы ряд Фурье сходился к функции f
поточечно, то нужно как-то сузить класс изучаемых функций, перейдя от класса R(π) (локально
интегрируемых функций с полупериодом π) к каким-то его подклассам. В этом параграфе мы
рассмотрим два таких подкласса, для которых поточечная сходимость ряда Фурье сохраняется, хотя
и в разных смыслах: это классы кусочно-непрерывных и кусочно-гладких функций с полупериодом
π. Попутно мы сформулируем для них теоремы о равномерной сходимости ряда Фурье.
— кусочно-гладкой (на R), если она кусочно гладкая на любом отрезке2 [a, b] ⊂ R; это
означает выполнение следующих условий:
(1) на любом отрезке [a, b] она дифференцируема во всех точках, кроме, возможно,
конечного набора;
(2) в каждой точке c ∈ R, где f дифференцируема, ее производная непрерывна,
′ f (x) − f (c − 0) ′ f (x) − f (c + 0)
f− (c) = lim , f+ (c) = lim (12.2.40)
x→c−0 x−c x→c+0 x−c
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x) стремится
′ ′
соответственно к f− (c) или f+ (c):
′
f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (12.2.41)
x→c−0 x→c+0
⊲ 12.2.4. Функция
хотя и 2π-периодическая, но не кусочно-гладкая,
f (x) = arcsin sin x
потому что в точке x ∈ πZ не имеет односторон-
с графиком них производных.
y
x
− 3π −π − π2 π π 3π
2 2 2
−1 −1
a0 X n o
∞
f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R. (12.2.43)
2 2 n=1
a0 X n o
∞
f (x) = + an cos nx + bn sin nx , x ∈ R. (12.2.44)
2 n=1
Кроме того,
(i) если f – непрерывная (и по-прежнему, кусочно-гладкая и 2π-периодическая) функция на
R, то ряд (12.2.44) сходится к ней на прямой R равномерно:3
a0 X n
N o
f (x) − − an cos nx + bn sin nx
−→ 0; (12.2.45)
2
N →∞
n=1 x∈R
Доказательство этого факта мы разобьем на несколько лемм, и посвятим ему оставшуюся часть
этого пункта.
Лемма Римана.
=
x=b
−C
p · cos px
x=a
=
ˆ ˆ z }| {
b b |C|
=
W (x) · sin px d x = C · sin px d x · cos p a − cos p b 6
a a p
|C| |C|
6 · | cos p a| + | cos p b| 6 · 2 −→ 0
p p p→+∞
W (x) = Ci , x ∈ (xi−1 , xi )
>
´b ε
a
|W (x) − g(x)| · | sin px| d x 2
>
´b
a
|W (x) − g(x)| d x
>
ε
2
Ядро Дирихле.
• Ядром Дирихле называется функция
N
1 X
DN (t) := + cos nt (12.2.48)
2 n=1
1 N
X N N
t t X t t X 1 1
+ cos nt ·2 sin = sin + 2 cos nt·sin = sin + − sin n − t + sin n + t =
2 n=1 2 2 n=1 2 2 n=1 2 2
t t 3t 3t 5t 1 1
= sin + − sin + sin + − sin + sin + ... + − sin N − t + sin N + t =
| {z2} | {z 2} | {z2} | {z 2} | {z2} | {z 2 } 2
↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑
1
= sin N + t
2
Интегралы Дирихле.
1 π
ˆ
SN (x) = f (x + t) · DN (t) d t, x∈R (12.2.51)
π −π
1
ˆ π n o
SN (x) = f (x + t) + f (x − t) · DN (t) d t, x∈R (12.2.52)
π 0
a0 X n o
N
SN (x) = + ak cos kx + bk sin kx = (12.1.7) =
2
k=1
ˆ π XN
1 1 1 π 1 π
ˆ ˆ
= · f (y) d y + cos kx f (y) cos ky d y + sin kx f (y) sin ky d y =
2 π −π π −π π −π
k=1
( N
) ( N
)
1 π 1 X 1 π 1 X
ˆ ˆ
= f (y) + cos kx · cos ky + sin kx · sin ky d y = f (y) + cos k(y − x) d y =
π −π 2 π −π 2
k=1 k=1
1 π y − x = t, y = x + t, d y = d t 1 π−x
ˆ ˆ
= f (y) · D(y − x) d y = = f (x + t) · D(t) d t =
π −π y ∈ [−π, π] ⇔ t ∈ [−π − x, π − x] π −π−x
700 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
π
интеграл от периодической 1
ˆ
= функции по периоду равен = f (x + t) · DN (t) d t
интегралу по “сдвинутому периоду” π −π
1 π 1 0 1 π
ˆ ˆ ˆ
SN (x) = f (x + t) · DN (t) d t = f (x + t) · DN (t) d t + f (x + t) · DN (t) d t =
π −π π −π π 0
в первом интеграле 1 0 1 π
ˆ ˆ
= делаем замену =− f (x − s) · DN (−s) d s + f (x + t) · DN (t) d t =
t = −s π π π 0
вспоминием, что DN 1 0 1 π
ˆ ˆ
= – четная функция: = − f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
DN (−s) = DN (s) π π π 0
в первом интеграле 1 π 1 π
ˆ ˆ
= переворачиваем = f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
пределы интегрирования π 0 π 0
в первом интеграле 1 π 1 π
ˆ ˆ
= делаем замену = f (x − t) · DN (t) d t + f (x + t) · DN (t) d t =
s=t π 0 π 0
1 πn o
ˆ
= f (x + t) + f (x − t) · DN (t) d t
π 0
Поточечная сходимость ряда Фурье. Мы можем теперь доказать ту часть теоремы 12.2.8, где
речь идет о поточечной сходимости:
a0 X n o
∞
f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R.
2 2 n=1
Они должны быть кусочно-непрерывны на отрезке [0, π], потому что в точке t = 0 они непрерывны,
а при t ∈ (0, π] они получаются умножением кусочно-непрерывных функций g(t) = f (x+t)−f (x+0)
и h(t) = f (x − t) − f (x − 0) на непрерывную функцию 1t .
Кроме того, если рассмотреть функцию
( )
t
2 sin 2t t ∈ (0, π]
C(t) =
1, t = 0
f (x + 0) + f (x − 0)
SN (x) − =
ˆ π n2 o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · DN (t) d t − · DN (t) d t =
π 0 2 π 0
| {z } | {z }
=
(12.2.52) (12.2.49)
SN (x) 1
§ 2. Поточечная и равномерная сходимость ряда Фурье 701
1
ˆn π o 1 πn
ˆ o
= f (x + t) + f (x − t) · DN (t) d t − f (x + 0) + f (x − 0) · DN (t) d t =
π 0 π 0
ˆ πn o
1
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · DN (t) d t =
π
ˆ 0
1 π nh i h io
= f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · DN (t) d t =
π 0
1 π nh
ˆ i h io sin N + 1 t
2
= (12.2.50) = f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · dt =
π 0 2 sin 2t
ˆ
1 π f (x + t) − f (x + 0) f (x − t) − f (x − 0) t 1
= − · · sin N + t dt =
π 0 | t
{z } | −t
{z } 2 sin 2t 2
| {z }
=
=
A(t) B(t) C(t)
| {z }
=
W (t)
π
1 1
ˆ
= W (t) · sin N + t d t −→ 0
π 0 2 N →∞
a0 X n o α0 X n o
N N
′
SN [f ](x) = + an cos nx + bn sin nx , SN [f ](x) = + αn cos nx + βn sin nx
2 n=1
2 n=1
Действительно,
702 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
!
′ a0 X n
N o ′ X N n o
SN [f ] (x) = + an cos nx + bn sin nx = − n · an sin nx + n · bn cos nx =
2 n=1 n=1
XN n o α XN n o
α0 0
= (12.2.54) = + βn sin nx + αn cos nx = + αn cos nx + βn sin nx = SN [f ′ ](x)
2
|{z} n=1
2 n=1
=
0
0,
потому что cosn и f –
2π-периодические
функции
и
π
1 1 π
ˆ ˆ
′
βn = f (x) · sin nx d x = sin nx d f (x) = (8.3.184) =
π −π π −π
1 x=π 1 π
ˆ
1 π
ˆ
= · sin nx · f (x) − f (x) d sin nx = −n · f (x) · cos nx d x = −n · an
π x=−π π −π π −π
| {z }
=
0,
потому что sinn и f –
2π-периодические
функции
⇓
∞
X ∞ n
X o ∞ n
X o
kan cos nx + bn sin nxkx∈R 6 kan cos nxkx∈R + kbn sin nxkx∈R = |an | + |bn | < ∞
n=1 n=1 n=1
∞ n
X o
ряд an cos nx + bn sin nx сходится равномерно на R
n=1
Мы получили, что ряд Фурье функции f сходится равномерно к некоторой функции S. Но с другой
стороны, по лемме 12.2.11 этот ряд должен поточечно сходиться к функции f . Значит, S = f , и ряд
Фурье этой функции сходится к ней равномерно.
(k) XN n o
a0
SN [f (k) ](x) = + a(k) (k)
n cos nx + bn sin nx ,
2 n=1
π π π
1 1 1
ˆ ˆ ˆ
(k) (k)
α0 = f (x) d x, αn(k) = f (k)
(x) · cos nx d x, βn(k) = f (k) (x) · sin nx d x.
π −π π −π π −π
Формула (12.2.55), применительно к функции f (k) , означает, что SN [f (k+1) ] получается из SN [f (k) ]
дифференцированием:
′
SN [f (k+1) ] = SN [f (k) ]
Отсюда по индукции можно заключить, что SN [f (k) ] есть просто производная порядка k из SN [f ]
(частичной суммы ряда Фурье исходной функции f ):
(k)
SN [f (k) ] = SN [f ] (12.2.56)
Теперь заметим, что каждая функция f (k) является гладкой и 2π-периодической, поэтому по лемме
12.2.14 ее ряд Фурье должен сходиться к ней равномерно на R, то есть
(k)
f − SN [f (k) ]
−→ 0
R N →∞
В силу (12.2.56) это можно интерпретировать, как равномерное стремление к нулю производной
порядка k от разности f − SN [f ]:
(k)
(k)
f − SN [f ]
=
f (k) − SN [f ]
= (12.2.56) =
f (k) − SN [f (k) ]
−→ 0
R N →∞
R R
(k) m
(k)
X 1
f − SN [f ]
= (10.1.47) =
·
f − SN [f ]
−→ 0
R k!
N →∞
k=0 R
704 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
a0 X n o
N
SN (x) = + an cos nx + bn sin nx
2 n=1
Кроме того,
(i) если f – непрерывная (и, по-прежнему, 2π-периодическая) функция на R, то то много-
члены Фейера сходятся к ней на прямой R равномерно:5
kf (x) − σN (x)kx∈R −→ 0; (12.2.60)
N →∞
Как и в случае с теоремой 12.2.8, доказательство этого факта мы разобьем на несколько лемм.
Ядро Фейера.
• Ядром Фейера называется арифметическое среднее ядер Дирихле
N −1 N −1 n
!
1 X 1 X 1 X
ΦN (t) = Dn (x) = + cos kt (12.2.62)
N n=0 N n=0 2
k=1
Эта функция обладает свойствами, похожими на свойства ядра Дирихле, но главная разница
заключается в том, что ядро Фейера оказывается неотрицательной функцией (что оказывается
очень полезно для дальнейших выводов).
4◦ . Для всякого δ > 0 равномерная норма функции Φ на отрезке [δ, π] стремится к нулю
при N → ∞:
kΦN (t)kt∈[δ,π] = max ΦN (t) −→ 0 (12.2.65)
t∈[δ,π] N →∞
◦ ◦
Доказательство. Свойства 1 и 2 вытекают сразу же из свойств ядра Дирихле на с.698, за исклю-
чением неотрицательности ΦN , которая, в свою очередь, является следствием тождества (12.2.64).
Поэтому для доказательства 1◦ , 2◦ и 3◦ достаточно проверить (12.2.64). Для точек t = 2πk мы
получаем:
N −1 N −1 N −1
1 X 1 X 1 1 X N N −1 1 N
ΦN (2πk) = Dn (2πk) = n+ = n + = + =
N n=0 | {z } N n=0 2 N n=1
2N 2 2 2
| {z }
=
(12.2.50)
1
n+ 2
= (3.2.114)
(N −1)·N
2
N −1 N −1
t 1 X t X 1 t
ΦN (t) · 2N sin2 = Dn (x) ·2N sin2 =2 sin n + t · sin =
2 N n=0 | {z } 2 n=0 |
2 2
{z }
=
(12.2.50)
=
sin n+ 1 t (5.1.83)
2
t 1
2 sin
2 2 cos nt − cos(n + 1)t
N
X −1
= cos nt − cos(n + 1)t = cos 0 − cos
| {z } |{z} t + cos t − cos
|{z} | {z } 2t + ... + cos(N − 1)t − cos N t =
| {z }
n=0 ↑ ↑ ↑ ↑ ↑
=
↑
1
N +1
= 1 − cos N t = (5.1.74) = sin2 t
2
Поделив это на 2N sin2 2t , мы получим нижнюю строчку в (12.2.64).
После того, как (12.2.64) доказано, свойство (12.2.65) становится его следствием:
sin2 N t maxt∈[δ,π] sin2 N2 t 1
2
kΦN (t)kt∈[δ,π] = max ΦN (t) = max 2 6 2 t = −→ 0
t∈[δ,π] t∈[δ,π] 2N · sin t
2
2N · min t∈[δ,π] sin 2 2N · sin2 δ N →∞
2
Интеграл Фейера.
Лемма 12.2.17. Для всякой 2π-периодической локально интегрируемой функции f ее многочлен
Фейера σN выражается через ядро Фейера ΦN формулами
1 π
ˆ
σN (x) = f (x + t) · ΦN (t) d t, x∈R (12.2.66)
π −π
1
ˆ π n o
σN (x) = f (x + t) + f (x − t) · ΦN (t) d t, x∈R (12.2.67)
π 0
706 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
Доказательство. Это следует из формул для интеграла Дирихле (12.2.51) и (12.2.52): во-первых,
Sn (x)
=
(12.2.51)
N −1 N −1
z ˆ }| {
1 X 1 X 1 π
σN (x) = Sn (x) = f (x + t) · Dn (t) d t =
N n=0 N n=0 π −π
N −1
1 π 1 X 1 π
ˆ ˆ
= f (x + t) · Dn (t) d t = f (x + t) · ΦN (t) d t,
π −π N n=0 π −π
| {z }
=
(12.2.62)
ΦN (t)
и, во-вторых,
Sn (x)
=
(12.2.52)
z ˆ }| {
1 X 1 πn o
N −1 N −1
1 X
σN (x) = Sn (x) = f (x + t) + f (x − t) · Dn (t) d t =
N n=0 N n=0 π 0
1 πn o 1 πn o
N −1
1 X
ˆ ˆ
= f (x + t) + f (x − t) · Dn (t) d t = f (x + t) + f (x − t) · ΦN (t) d t.
π 0 N n=0 π 0
| {z }
=
(12.2.62)
ΦN (t)
f (x − 0) + f (x + 0)
= lim σN (x), x ∈ R.
2 N →∞
(это всегда можно сделать, в силу (12.2.65)). Тогда для всех N > N0 мы получим:
ˆ π
f (x + t) − f (x + 0) · ΦN (t) d t =
0
§ 2. Поточечная и равномерная сходимость ряда Фурье 707
ˆ δ ˆ π
= f (x + t) − f (x + 0) ·ΦN (t) d t + f (x + t) − f (x + 0) ·ΦN (t) d t 6
0 | {z } δ | {z }
>
>
ε |f (x + t)| + |f (x + 0)|
>
2M
δ π
π·ε π·ε
ˆ ˆ
6ε· ΦN (t) d t +2M · ΦN (t) d t 6 + = π·ε
2 2
|0 {z } |δ {z }
>
>
´π
0
ΦN (t) d t (π − δ) · maxt∈[δ,π] ΦN (t)
>
(12.2.63) (12.2.68)
π ε
2 (π − δ) · 4M
>
π·ε
4M
Таким образом,
1
ˆ π
∀N > N0 · f (x + t) − f (x + 0) · ΦN (t) d t < ε (12.2.69)
π 0
1
ˆ π
∀N > N0 · f (x − t) − f (x − 0) · ΦN (t) d t < ε (12.2.70)
π 0
f (x+0)+f (x−0)
Теперь оценим разность между 2 и многочленом Фейера:
σN (x) − f (x + 0) + f (x − 0) =
2
ˆ πn o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · ΦN (t) d t − · DN (t) d t =
π 2 π
| 0 {z } | 0 {z }
=
=
(12.2.67) (12.2.63)
σN (x) 1
ˆ πn o
1 1 πn o
ˆ
= f (x + t) + f (x − t) · ΦN (t) d t − f (x + 0) + f (x − 0) · ΦN (t) d t =
π 0 π 0
ˆ πn o
1
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · ΦN (t) d t =
π 0
ˆ
1 π h i ˆ πh i
= · f (x + t) − f (x + 0) · ΦN (t) d t + f (x − t) − f (x − 0) · ΦN (t) d t 6
π 0 0
ˆ π ˆ π
1 1
6 · f (x + t) − f (x + 0) · ΦN (t) d t + · f (x − t) − f (x − 0) · ΦN (t) d t < 2ε
π 0 π 0
| {z } | {z }
>
>
(12.2.69) (12.2.70)
ε ε
Мы получили, что для произвольной точки x ∈ R и любого ε > 0 можно подобрать такое N0 ∈ N∗ ,
что для любого N > N0 выполняется соотношение:
σN (x) − f (x + 0) + f (x − 0) < 2ε
2
f (x + 0) + f (x − 0)
∀x ∈ R σN (x) −→
N →∞ 2
=
(12.2.63) (12.2.66)
1 σN (x)
ˆ π
1 1 π
ˆ
= f (x) − f (x + t) · ΦN (t) d t 6 f (x) − f (x + t) · ΦN (t) d t =
π −π π −π
1 −δ 1 δ
ˆ ˆ
= f (x) − f (x + t) ·ΦN (t) d t + f (x) − f (x + t) ·ΦN (t) d t+
π −π | {z } π −δ | {z }
>
>
ε
(12.2.72)
|f (x)| + |f (x + t)| 3
>
(12.2.71)
2M
ˆ π
1
+ f (x) − f (x + t) ·ΦN (t) d t 6
π δ | {z }
>
|f (x)| + |f (x + t)|
>
(12.2.71)
2M
−δ ˆ δ
2M ε 2M π
ˆ ˆ
6 ΦN (t) d t + ΦN (t) d t + ΦN (t) d t =
π−π 3π −δ π δ
| {z } | {z }
↑ ↑
ˆ δ ˆ π
ε 4M ε 4M πε ε 2ε
= · ΦN (t) d t + · ΦN (t) d t < ·π+ · = + =ε
3π −δ π δ 3π π 6M 3 3
| {z } | {z }
>
>
´π
ΦN (t) d t (π − δ) · kΦN (t)kt∈[δ,π]
−π
>
=
(12.2.63) (12.2.73)
ε
π (π − δ) · 6M
>
πε
6M
Отсюда
∀N > N0 kf (x) − σN (x)kx∈R = sup f (x) − σN (x) 6 ε
x∈R
следует, что при фиксированных m ∈ N и ε > 0 существует N0 такое, что при N > N0 выполняется
(m)
kf − SN kR <ε
(d) Примеры 1 0 1 π
ˆ ˆ
=− sin nx d x + sin nx d x =
π −π π 0
В следующих примерах нас будет интересовать x=0 x=π
поточечная сходимость, поэтому они будут ил- 1 1
= cos nx − cos nx =
люстрациями к теореме 12.2.8. πn x=−π πn x=0
1 1
= {1 − cos(−πn)} − {cos(πn) − 1} =
Разложение Фурье произвольной 2π- πn πn
периодической функции. 2 2
= {1 − cos(πn)} = {1 − (−1)n }
πn πn
⋄ 12.2.21. Найдем разложение Фурье функции
Вывод:
1, x ∈ (2πn, π + 2πn) X∞
2
f (x) = sgn sin x = 0, x = πn sgn sin x = {1 − (−1)n } · sin nx
πn
n=1
−1, x ∈ (−π + 2πn, 2πn)
⋄ 12.2.22. Вычислим разложение 2π-
Для этого нужно просто вычислить коэффици- периодической функции f , удовлетворяющей
енты Фурье: тождеству Лебега и заданной на интервале
(−π, π) формулой
1 π 1 0
ˆ ˆ
a0 = sgn sin x d x = (−1) d x+
π −π π −π
1, x ∈ (0, π)
1
ˆ π
π π f (x) = 12 , x = 0
+ 1 dx = − + = 0
π 0 π π 0, x ∈ (−π, 0)
1 π
ˆ
an = sgn sin x · cos nx d x =
π −π
1 0 1 π
ˆ ˆ
= (−1) · cos nx d x + 1 · cos nx d x =
π −π π 0
1 0 1 π
ˆ ˆ
=− cos nx d x + cos nx d x =
π −π π 0
1 x=0 1 x=π
Вычисляем коэффициенты Фурье:
=− sin nx + sin nx = 0+0 = 0
πn x=−π πn x=0
π
1
ˆ
a0 = f (x) d x =
π
π −π
1
ˆ
0 π
bn = sgn sin x · sin nx d x = 1 1 π
ˆ ˆ
π −π = 0 dx + 1 dx = =1
0 π
π −π π 0 π
1 1
ˆ ˆ
= (−1) · sin nx d x + 1 · sin nx d x =
π −π π 0
710 Глава 12. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
1 π 1 π 1 π
ˆ
an = f (x) · cos nx d x = =− {cos(πn) − cos } = {cos − (−1)n }
π −π πn 2 πn 2
1 0 1 π Вывод:
ˆ ˆ
= 0 · cos nx d x + 1 · cos nx d x =
π −π π 0
1 X n sin πn
∞
1 x=π f (x) = + 2
· cos nx+
= sin nx =0 4 n=1 πn
πn x=0
1 π o
{cos − (−1)n } · sin nx
+
πn 2
1 π
ˆ
bn = f (x) · sin nx d x = ⊲⊲ 12.2.24. Разложите в ряд Фурье 2π-
π −π периодические функции, заданные на интервале
1 0 1 π
ˆ ˆ
(−π, π) формулами:
= 0 · sin nx d x + 1 · sin nx d x =
π −π π 0 1) f (x) = e(x
1 x=π 1 x, x ∈ (0, π)
=− cos nx = − {cos(πn) − 1} = 2) f (x) =
πn x=0 πn 0, x ∈ (−π, 0)
1 (
= {1 − (−1)n } 0, x ∈ (0, π)
πn 3) f (x) =
x, x ∈ (−π, 0)
Вывод:
x, x ∈ (0, π)
1 X 1
∞ 4) f (x) = π2 , x = 0
f (x) = + {1 − (−1)n } · sin nx
2 n=1 πn π, x ∈ (−π, 0)
1 π
ˆ
1 x=π sin πn 1
ˆ 0
1
ˆ π
2
= 1 · cos nx d x = sin nx π = = f (−t) sin(−nt) d(−t)+ f (x) sin nx d x =
π π2 πn x= 2 πn π π | {z } π 0
=
(12.2.74)
f (t)
0 π
1 π 1 1
ˆ ˆ ˆ
bn = f (x) · sin nx d x = = f (t) sin nt d t + f (x) sin nx d x = 0
π −π π π π 0
x=π | {z }
1 π 1
ˆ
=
= 1 · sin nx d x = − cos nx π = 1
−π
´π
f (t) sin nt d t
π π2 πn x= 2 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 711
π
1
ˆ
Докажем формулы (12.2.76): во-первых, a0 = f (x) d x =
π −π
π
1
ˆ
0 π
1 1
ˆ ˆ
a0 = f (x) d x = = f (x) d x + f (x) d x =
π −π π π
−π 0
0 π | {z }
1 1
ˆ ˆ
= f (x) d x + f (x) d x = замена: x = −t
π −π π 0 1
ˆ 0
1
ˆ π
| {z } = f (−t) d(−t) + f (x) d x =
замена: x = −t π π | {z } π 0
0 π
=
1 1 (12.2.77)
ˆ ˆ
= f (−t) d(−t) + f (x) d x = −f (t)
π π | {z } π 0 0 π
1 1
ˆ ˆ
=
(12.2.74)
f (t) = f (t) d t + f (x) d x = 0
π π π 0
0 π π | {z }
1 1 2
ˆ ˆ ˆ
=
=− f (t) d t + f (x) d x = f (x) d x ´π
π π π 0 π 0
1
−π 0
f (t) d t
| {z }
=
1
´π а для коэффициентов an ,
π 0
f (t) d t
1 π
ˆ
и, во-вторых, an = f (x) cos nx d x =
π −π
1 π
ˆ
1 0 1 π
ˆ ˆ
an = f (x) cos nx d x = = f (x) cos nx d x + f (x) cos nx d x =
π −π π −π π 0
| {z }
1 0 1 π
ˆ ˆ
= f (x) cos nx d x + f (x) cos nx d x = замена: x = −t
π −π π 0 ˆ 0
1
| {z } = f (−t) cos(−nt) d(−t)+
замена: x = −t π π | {z }
ˆ 0
=
1 (12.2.77)
= f (−t) cos(−nt) d(−t)+ −f (t)
π π | {z } ˆ π
1
=
1
´π Докажем формулу (12.2.79):
π 0
f (t) cos nt d t
π π
2
ˆ
1
ˆ
= f (x) cos nx d x bn = f (x) sin nx d x =
π 0 π −π
0 π
1 1
ˆ ˆ
= f (x) sin nx d x + f (x) sin nx d x =
π −π π 0
Предложение 12.2.26. Если 2π-периодическая | {z }
замена: x = −t
функция f нечетна ˆ 0
1
= f (−t) sin(−nt) d(−t)+
f (−x) = −f (x) (12.2.77) π π | {z }
=
(12.2.77)
то в ее ряде Фурье отсутствуют свободное сла- −f (t)
ˆ π
гаемое и слагаемые с косинусами: 1
+ f (x) sin nx d x =
∞ π 0
X
0 π
f (x) = bn sin nx (12.2.78) 1 1
ˆ ˆ
n=1
=− f (t) sin nt d t + f (x) sin nx d x =
π π π 0
| {z }
а коэффициенты bn можно вычислять по фор-
=
1
´π
мулам π 0
f (t) sin nt d t
π
2
ˆ
2 π = f (x) sin nx d x
ˆ
bn = f (x) sin nx d x (12.2.79) π 0
π 0
2 n=1 πn2 0
π
4
ˆ
⋄ 12.2.28. Найдем разложение нечетной 2π- = · x d cos nx =
периодической функции f , удовлетворяющей πn2 0
4 n π ˆ π o
тождеству Лебега и заданной на интервале (0, π)
= · x · cos nx − cos nx d x =
формулой πn2 0 0
f (x) = x 4 n 1 π o (−1)n
n
= · π · (−1) − · sin nx = 4 ·
График здесь имеет вид πn2 |n {z 0
} n2
=
y 0
π
Вывод:
∞
x π2 X (−1)n
f (x) = +4· · cos nx (12.2.80)
−3π −2π −π π 2π 3π 3 n2
n=1
ФУНКЦИИ НЕСКОЛЬКИХ
ВЕЩЕСТВЕННЫХ ПЕРЕМЕННЫХ
714
Глава 13
ЛИНЕЙНАЯ АЛГЕБРА
В § 1 главы 3 мы говорили, что вещественные числа появляются в науке как идея, упрощающая
понимание алгоритмов измерения по эталону. Физические величины, для измерения которых доста-
точно указать эталон и алгоритм сравнения по нему, называются скалярными. Таковыми, например,
являются длина, объем, масса, заряд и т.д. Помимо них есть и другие, для измерения которых нуж-
но дополнительно фиксировать систему координат. Такие величины называются векторными.
⋄ 13.0.1. Типичный пример векторной величи- ной точке. По определению, это дробь
ны – положение тела в пространстве. Если ука-
зан эталон длины и система координат в про- F
E=
странстве, то положение тела (точнее, матери- q
альной точки) однозначно описывается тремя ко-
где F – сила, действующая на пробный заряд ве-
ординатами. Точно так же скорость тела или си-
личиной q, помещенный в данную точку. Знаме-
ла, действующая на него являются векторными
нитые уравнения Максвелла связывают эту ве-
величинами.
личину с еще тремя векторными величинами: на-
⋄ 13.0.2. Еще один пример векторной величины пряжённостью H магнитного поля, электриче-
– напряженность электрического поля E в дан- ской индукцией B и магнитной индукцией D.
Если для данной векторной величины заданы эталон, алгоритм сравнения по нему и система
координат, то результат измерения этой величины в каждой конкретной ситуации будет конечной
последовательностью чисел фиксированной длины n. Напомним определение главы 3 (с.73):
• Конечной последовательностью элементов множества S (необязательно, числового) на-
зывается произвольное отображение a : {1, ..., k} → S из какого-нибудь отрезка {1, ..., k}
натурального ряда N∗ . Значения такого отображения часто записывают с помощью ин-
дексов
ai = a(i), i ∈ {1, ..., k}.
а само это отображение – в виде семейства {ai ; i ∈ N∗ } или {ai }. Число k при этом
называется длиной последовательности {ai ; i ∈ N∗ }.
• В частном случае, когда S = R – множество чисел, последовательность {ai ; i ∈ N∗ }
принято называть (конечной) числовой последовательностью.
• Напомним, что до сих пор мы записывали конечные числовые последовательности в виде
строк
x = x1 , x2 , ..., xn .
Такие объекты в математике принято также называть числовыми строками (длины n ∈
N∗ ). Множество всех числовых строк длины n называется координатным пространством
размерности n и обозначается Rn :
x ∈ Rn ⇔ x = x1 , x2 , ..., xn , xi ∈ R
Элементы этого множества, то есть строки, называются также точками или векторами
пространства Rn .
715
716 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
(при этом индексы у элементов последовательности мы будем писать справа вверху). Та-
кие объекты принято называть числовыми столбцами (длины n ∈ N∗ ).1 Множество всех
числовых столбцов длины n также называется координатным пространством размерно-
сти n и обозначается Rn :
1
x
x2
x ∈ Rn ⇔ x = i
... , x ∈ R
xn
Элементы этого множества, то есть столбцы, тоже называются точками или векторами
пространства Rn .
Координатные пространства Rn и Rn играют в изучении векторных величин ту же роль, что и
множество R вещественных чисел при изучении скалярных. Однако система фактов об Rn и Rn ,
необходимых для доказательства нужных утверждений, намного более сложна и менее очевидна,
чем в случае с R. В этой главе мы обсудим те свойства Rn и Rn , которые вытекают из наличия на
этих множествах естественных алгебраических операций.
§1 Комбинаторика
Разговор о пространствах Rn и Rn полезно начать с обсуждения свойств конечных последователь-
ностей, причем не только числовых. Это понадобится нам в дальнейшем, например, при описании
свойств определителя2 , многочленов и полилинейных форм (§ 3, (a) и § 5 этой главы3 ) а также
главы 154 . Область математики, где рассматриваются объекты такого типа, называется комбина-
торика. Свой предмет эта наука определяет, как изучение конечных множеств5. В этом параграфе
мы опишем некоторые ее результаты.
Область математики, изучающая конечные множества, называется комбинаторикой. Результа-
ты этого параграфа понадобятся нам ниже в главах 6 и 13.
{1, ..., n} в R. Однако для удобства вычислений с матрицами, о которых пойдет речь ниже в § 3, удобно различать
строки и столбцы, и на формальном языке это различие можно представлять как дополнительную метку, приписыва-
емую данной конечной последовательности x, скажем, 0, если эту последовательность мы представляем как строку, и
1, если как столбец. Иными словами, парой (x, 0) мы записываем последовательность x, представляемую как строку, а
парой (x, 1) ту же последовательность, представляемую как столбец. Далее в тексте мы, однако, такое представление
строк и столбцов использовать не будем, просто удовлетворившись тем, что формальный способ выразить разницу
между ними существует.
2 Группа перестановок Σ используется в самом определении определителя матрицы на с.768.
n
3 Это алгебраические результаты, но они применяются затем в анализе, например, в теореме 15.1.43 ниже.
4 Например, понятие мультииндекса используется при определении мультистепени элементарного дифференциала
на с.889.
5 Напомним, что конечные множества мы определили на с.69.
§ 1. Комбинаторика 717
и поэтому
k+1
Y Y
k Y
k
card Xi = card Xi × Xk+1 = (1.1.50) = card Xi · card Xk+1 = (13.1.2) =
i=1 i=1 i=1
Y
k k+1
Y
= card Xi · card Xk+1 = (3.2.102) = card Xi .
i=1 i=1
⋄ 13.1.3. Сколько слов длины 3 можно соста- собами, второй – двумя. Значит маршрут можно
вить из алфавита, состоящего из двух букв X = выбрать
{a, b}? 3·2=6
Решение. Первую букву в слове можно вы-
брать двумя способами, вторую – тоже двумя способами.
способами, третью – тоже двумя. Получается по
теореме 13.1.2 все слово можно составить ⋄ 13.1.5. Сколько четырехзначных чисел можно
составить из цифр 0, 1, 2, 3, 4, 5, если
2·2·2 =8
1) цифры не повторяются,
способами. 2) цифры могут повторяться,
3) цифры могут повторяться, и получающееся
⋄ 13.1.4. Из пункта A в пункт C можно добрать-
число должно быть нечетным.
ся через пункт B следующими видами транспор-
та: Какова в каждом случае вероятность, что полу-
чающееся число оканчивается на 0?
1) сначала из A в B: автобусом, поездом или па-
роходом, Решение.
1. В первом случае (когда цифры не повторя-
2) потом B в C: пароходом, или самолетом.
ются):
Сколькими способами можно выбрать маршрут
— первую цифру можно выбрать 5 способами
из A в C?
(среди цифр 1, 2, 3, 4, 5),
Решение. Составить маршрут – это все равно
что составить последовательность из двух эле- — после того, как первая цифра выбрана, вто-
ментов: на первом месте должен быть какой-то рую цифру можно выбрать снова 5 способами
вид транспорта при путешествии от A до B, а (среди 0 и оставшихся 4 цифр из 1, 2, 3, 4, 5),
на втором – при путешествиии от B до C. Пер- — после того, как первые две цифры выбраны,
вый вид транспорта можно выбрать тремя спо- третью цифру можно выбрать 4 способами,
718 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
— после того, как первые три цифры выбраны, (теперь понятно, почему). Вероятность, что в
четвертую цифру можно выбрать 3 способа- этом случае выбранное число оканчивается на 0,
ми. будет равна
180 1
Всего по теореме 13.1.2 в этом случае полу- P = = .
1080 6
чается
5 · 5 · 4 · 3 = 120 3. В третьем случае (когда цифры могут по-
вторяться и последняя должна быть нечетной):
вариантов выбора. Среди этих 120 чисел име-
ется некоторое количество оканчивающихся на — первую цифру можно выбрать 5 способами
0. Чтобы их сосчитать, снова применим теорему (среди цифр 1, 2, 3, 4, 5),
13.1.2. Здесь выбрать число – это выбрать только — после того, как первая цифра выбрана, вто-
первые три цифры, потому что последняя цифра рую цифру можно выбрать 6 способами (сре-
будет 0. Получаем: ди цифр 0, 1, 2, 3, 4, 5),
— первую цифру можно выбрать 5 способами — после того, как первые две цифры выбраны,
(среди цифр 1, 2, 3, 4, 5), третью цифру можно выбрать 6 способами
— после того, как первая цифра выбрана, вто- (среди цифр 0, 1, 2, 3, 4, 5),
рую цифру можно выбрать 4 способами (сре- — после того, как первые три цифры выбраны,
ди оставшихся 4 цифр из 1, 2, 3, 4, 5), четвертую цифру можно выбрать 3 способа-
— после того, как первые две цифры выбраны, ми (среди цифр 1, 3, 5).
третью цифру можно выбрать 3 способами. Всего по теореме 13.1.2 в этом случае полу-
Всего в первом случае чисел, оканчивающих- чается
ся на 0, имеется 5 · 6 · 6 · 3 = 540
вариантов. Из них ни одно число не оканчивает-
5 · 4 · 3 = 60.
ся на 0. Поэтому вероятность получения такого
Вероятность, что в первом случае выбранное числа нулевая:
число оканчивается на 0, будет равна 0
P = = 0.
60 1 540
P = = .
120 2 ⋄ 13.1.6. Подбрасываются две игральные кости.
2. Во втором случае (когда цифры могут по- Найдите вероятность того, что
вторяться): 1) выпадут одинаковые цифры,
— первую цифру можно выбрать 5 способами 2) выпадут четные цифры.
(среди цифр 1, 2, 3, 4, 5),
Решение. Всего вариантов выпадения двух
— после того, как первая цифра выбрана, вто- костей имеется по теореме 13.1.2
рую цифру можно выбрать 6 способами (сре-
ди цифр 0, 1, 2, 3, 4, 5), 6 · 6 = 36
— после того, как первые две цифры выбраны,
третью цифру можно выбрать 6 способами (потому что первую цифру можно выбрать 6 спо-
(среди цифр 0, 1, 2, 3, 4, 5), собами, как и вторую). Количество вариантов, в
которых цифры одинаковые, равно 6. Поэтому
— после того, как первые три цифры выбраны, вероятность в первом случае равна
четвертую цифру можно выбрать 6 способа-
ми (среди цифр 0, 1, 2, 3, 4, 5). 6 1
P = = .
Всего по теореме 13.1.2 в этом случае полу- 36 6
чается Во втором случае количество вариантов будет
5 · 6 · 6 · 6 = 1080 равно
вариантов выбора, то есть четырехзначных чи- 3·3=9
сел, составленных из цифр 0, 1, 2, 3, 4, 5. Из них
и вероятность этого
оканчивающихся на 0 будет
9 1
5 · 6 · 6 = 180 P = = .
36 4
∀i 6= j ∈ {1, ..., k} xi 6= xj
n!
Akn = (13.1.3)
(n − k)!
Теорема 13.1.7. Мощность множества AkS всех размещений длины k в (конечном) множестве
S, мощности n (также конечна и) равна числу размещений Akn из n по k:
n!
card AkS = Akn = (13.1.4)
(n − k)!
n!
n · (n − 1) · (n − 2) · ... · (n − (k − 1)) =
(n − k)!
вариантов.
Подмножества (сочетания).
Теорема 13.1.12. Если (конечное) множество S состоит из n элементов, то множество 2S
всех подмножеств в множестве S (также конечно и) состоит из 2n элементов.
Доказательство. Занумеруем элементы S:
S = {x1 , ..., xn }.
Задать подмножество M в S – то же, что присвоить каждому элементу xi число ai , равное 1, если
xi ∈ M , и 0, если xi ∈
/ M . Это то же самое, что выбрать последовательность (a1 , ..., an ) из чисел 0
и 1. Таких последовательностей по теореме 13.1.2 имеется
· ... · 2} = 2n
|2 · 2 {z
n множителей
(потому что первое число a1 можно выбрать 2 способами, второе a2 – тоже 2 способами, и так
далее).
Для всякого множества S и любого натурального числа k ∈ N сочетанием в множестве S по
k элементов называется произвольное подмножество X в S мощности k:
X ⊆ S, card X = k.
E · k! (13.1.8)
⋄ 13.1.14. Сколько экзаменационных комиссий когда мы такое подмножество выберем, его оста-
из 7 человек можно составить из 14 преподава- нется упорядочить по убыванию, и получится
телей? Какова вероятность, что в выбранной ко- число с нужным свойством). Таких подмножеств
миссии окажется данный человек? имеется
Пусть S – множество преподавателей (мощ-
ности 14), из которого выбирается комиссия. Вы- 4 10! 10 · 9 · 8 · 7
C10 = = = 10 · 3 · 7.
брать комиссию из 7 человек – это то же самое, 4! · 6! 4·3·2
что выбрать подмножество в S мощности 7. Та- Всего четырехзначных чисел по правилу комби-
ких подмножеств по теореме 13.1.13 имеется наторного умножения (теорема 13.1.2) имеется
7 14!
C14 = 9 · 10 · 10 · 10.
(7!)2
– и это ответ на первый вопрос. Вероятность, что выбранное наугад четырех-
Далее найдем число комиссий, в которые вхо- значное число будет таким, как нам надо, равна
дит данный человек. Выбрать такую комиссию –
все равно, что добавить к этому человеку еще 6 4
C10 10 · 3 · 7
из 13 оставшихся. А это то же самое, что выбрать P = = =
9 · 10 · 10 · 10 9 · 10 · 10 · 10
подмножество мощности 6 из множества мощно- 7 7
сти 13. Таких подмножеств по теореме 13.1.13 = =
3 · 10 · 10 300
имеется
6 13! ⊲ 13.1.16. В партии из 10 изделий 3 бракованы.
C13 =
6! · 7! Наудачу выбираются 3 изделия. Какова вероят-
Теперь верояность, что в выбранной комиссии ность, что
окажется данный человек равна
1) все выбранные изделия бракованы?
6 13!
C13 6!·7! 7! 1 2) все выбранные изделия качественные?
P = 7 = 14!
= =
C14 (7!)2
6! · 14 2 3) хотя бы одно из выбранных изделий бракова-
но?
⋄ 13.1.15. Сколько имеется четырехзначных чи-
4) ровно 2 из выбранных изделий браковано?
сел, у которых каждая следующая цифра мень-
ше предыдущей? Какова вероятность, что вы- Ответы:
бранное наугад четырехзначное число будет та- 1
ким? 1) 3 ,
C10
Решение. Выбрать четырехзначное чис- 2)
C73
3 ,
C10
ло, у которого каждая следующая цифра
3
меньше предыдущей – все равно что вы- C10 −C73
3) 3
C10
,
брать подмножество мощности 4 в множестве
C32 ·C71
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} всех цифр (потому что 4) C103 .
n−1 m (m + n − 1)!
card Mn [m] = Cm+n−1 = Cm+n−1 = (13.1.13)
m! · (n − 1)!
Заметим, что каждая такая последовательность порождает некоторый мультииндекс k : {1, ..., n} →
N объема m по такому правилу:
1) k1 – число единиц в ε до первого нуля,
2) k2 – число единиц в ε между первым и вторым нулями,
...)
i) ki – число единиц в ε между i − 1-м и i-м нулями,
...)
n) kn – число единиц в ε после последнего нуля.
Более того, это правило устанавливает биекцию между мультииндексами k : {1, ..., n} → N
объема m и последовательностями ε ∈ E. Поэтому количество таких мультииндексов равно чилу
элементов в E. А задать последовательность в E – то же самое, что описать куда поставить n − 1
нулей в строке из m + n − 1 элементов. То есть выбрать подмножество мощности n − 1 в множестве
n−1
мощности m + n − 1. По теореме 13.1.13 таких подмножеств имеется Cm+n−1 .
card(nS ) = nm (13.1.14)
Это будет взаимно однозначным отображением между разбиениями K = {K1 , ..., Kn } ∈ nS и функ-
циями f ∈ {1, ..., n}S . Поэтому мощность множества разбиений nS совпадает с мощностью множе-
ства функций {1, ..., n}S :
card(nS ) = card({1, ..., n}S )
Остается проверить, что второе число равно nm . Для этого заметим, что если заменить множество
S на равномощное ему множество {1, ..., m}, то получающиеся множества функций будут равно-
мощны:
card({1, ..., n}S ) = card({1, ..., n}{1,...,m})
Теперь заметим, что функция f ∈ {1, ..., n}{1,...,m} — это строка длины m из элементов множества
{1, ..., n}:
f = (f (1), f (2), ..., f (m)), f (i) ∈ {1, ..., n}.
Выбрать первый элемент f (1) такой строки можно n способами, второй, f (2), — тоже n способами,
и так далее до последнего, f (m), который тоже можно выбрать n способами. Поэтому по теореме
13.1.2 (по правилу комбинаторного умножения) выбрать функцию f можно nm способами. Это
значит, что
card({1, ..., n}{1,...,m}) = nm .
Пусть далее S — по-прежнему, множество мощности m, и путь нам дан некий мультииндекс
k = (k1 , ..., kn ) объема m:
|k| = k1 + k2 + ... + kn = m.
724 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
Множество всех разбиений множества S типа k = (k1 , ..., kn ) обозначается CSk1 ,...,kn .
Теорема 13.1.22. Число разбиений типа (k1 , ..., kn ) конечного множества S мощности m равно6
k1 ,...,kn m m!
Cm = = (13.1.15)
k1 , ..., kn k1 ! · ... · kn !
k1 k2 k3 m−1 k
Cm · Cm−k1
· Cm−k1 −k2
· ... · Cm−k1 −k2 −...−km−2
·1 =
m! (m − k1 )! (m − k1 − k2 )! (m − k1 − k2 − ... − kn−1 )!
= · · · ... · =
k1 !(m − k1 )! k2 !(m − k1 − k2 )! k3 !(m − k1 − k2 − k3 )! kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )!
m! m!
= =
k1 ! · k2 ! · k3 ! · ... · kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )! k1 ! · k2 ! · k3 ! · ... · kn−1 ! · kn !
⋄ 13.1.25. В ящике имеется k1 + k2 + ... + kn = m множества мест (индексов) {1, 2, 3, 4, 5}. Напри-
кубиков разных цветов: мер, последовательность
— k1 кубиков первого цвета, (1, 1, 3, 3, 6) (13.1.16)
— k2 кубиков второго цвета,
... порождает такое разбиение множества мест:
— kn кубиков n-го цвета. {1, 2}, {3, 4}, {5}.
Случайным образом кубики раскладываются в
– здесь первое множество, {1, 2}, показывает, что
ряд. Какова вероятность, что первые k1 кубиков
на первых двух местах в (13.1.16) стоят едини-
окажутся первого цвета?
цы, второе множество, {3, 4} – что на третьем и
Решение. Разложить кубики в ряд – все четвертом месте стоят тройки, а последнее мно-
равно, что разбить множество {1, 2, ..., m} на
жество – что на пятом месте стоит шестерка.
подмножества (K1 , K2 , ..., Kn ) типа (k1 , k2 , ..., kn )
Наоборот, если дано, например, разбиение
(потому что каждое такое разбиение показывает,
какой цвет имеет кубик с данным номером). Та- {2, 4}, {1, 5}, {3}.
ких разбиений имеется
то ему соответствует последовательность выпвв-
k1 ,...,kn m! ших цифр
Cm = .
k1 ! · ... · kn ! (3, 1, 6, 1, 3).
Среди них имеются разбиения, у которых эле- Таким образом, описать распределение вы-
менты первого множества K1 находятся на пер- павших костей с 2 единицами, 2 тройками и 1 ше-
вых k1 местах. Выбрать такое разбиение – стеркой – то же самое, что задать разбиение типа
все равно что выбрать расположение остальных (2, 2, 1) множества мест (индексов) {1, 2, 3, 4, 5}.
множеств K2 , ..., Kn , то есть выбрать разбиение Получается, что между нужными распределе-
множества {k1 + 1, ..., m} (из m − k1 элементов) ниями выпавших костей и разбиенями имеется
по типу (k2 , ..., kn ). Таких разбиений имеется взаимно однозначное соответствие. А по теореме
13.1.22 таких разбиений имеется
k2 ,...,kn (m − k1 )!
Cm−k = . 5!
1
k2 ! · ... · kn ! C52,2,1 = = 5 · 3 · 2 = 30.
2! · 2! · 1!
Вероятность, что попадется именно такое разби-
Теперь вероятность выпадения нужного распре-
ение равна отношению числа таких разбиений к
деления
числу всех разбиений: 30 5
P = 5 = 4.
(m−k1 )! 6 6
C k2 ,...,kn
(m − k1 )! · k1 !
P = m−k 1
k1 ,...,kn
= k2 !·...·kn !
m!
= . 2. Во втором вопросе благоприятным исходом
Cm k !·...·k !
m! является размещение длины 5 из элементов мно-
1 n
a) сначала считаем, что 1-й игрок получил все e) наконец, остается вариант, когда 1-й игрок не
4 туза, а 2-й (и остальные) – ни одного; то- получает тузов, и 2-й получает все 4 туза; то-
гда оставшиеся 48 карт распределятся в про- гда оставшиеся 48 карт распределятся в про-
порции (9, 13, 13, 13), и число таких вариантов порции (13, 9, 13, 13), и число таких вариантов
будет будет
9,13,13,13
C48 , 13,9,13,13
C48 .
b) затем рассматриваем ситуацию, когда 1-й иг-
рок получил 3 туза, а 2-й – 1 туз; тогда остав-
Эти множества исходов не пересекаются (то есть
шиеся 48 карт распределятся в пропорции
не может быть, чтобы какое-то распределение
(10, 12, 13, 13), и число таких вариантов будет
карт подходило, например, под случай a и од-
10,12,13,13
C48 , новременно под случай b). Поэтому общее число
таких исходов равно сумме чисел в каждом ва-
c) затем считаем, что 1-й игрок получил 2 ту-
рианте:
за, и 2-й – 2 туза; тогда оставшиеся 48 карт
распределятся в пропорции (11, 11, 13, 13), и
9,13,13,13 10,12,13,13 11,11,13,13
число таких вариантов будет C48 + C48 + C48 +
11,11,13,13 12,10,13,13 13,9,13,13
C48 , + C48 + C48 .
⋄ 13.1.29. В примере 13.1.18 предположим, что равно что выбрать представление мультииндекса
выборка пирожных была такой: (4, 3, 1) (то есть 4 (2, 2) (первая двойка означает, что в нашем слове
одного вида, 3 другого и еще 1 третьего). Сколь- две буквы “а”, а вторая — что две буквы “м”). По
кими способами их можно распределить между теореме 13.1.28 таких представлений всего
8 людьми за столом?
4!
Здесь распределить пирожные между людь- = 6.
ми – то же самое, что задать разбиение людей 2! · 2!
типа (4, 3, 1). Таких разбиений будет по теореме 2. Выбрать перестановку слова “математика”
13.1.22 (или по теореме 13.1.28) C84,3,1 = 4!·3!·1!
8!
. — все равно что выбрать представление мульти-
индекса (3, 1, 1, 2, 2) (3 буквы “а”, 1 буква “е”, 1
⋄ 13.1.30. Сколько разных слов можно полу- буква “к”, 2 буквы “м”, 2 буквы “т”). По теореме
чить перестановками слов 13.1.28 таких представлений всего
1) “мама”,
9!
2) “математика”, = 9 · 8 · 7 · 6 · 5.
3! · 1! · 1! · 2! · 2!
3) “комбинаторика”?
3. Выбрать перестановку слова “комбинато-
1. Выбрать перестановку слова “мама” — все рика” — все равно что выбрать представление
728 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
(b) Перестановки
• Перестановкой длины n ∈ N∗ называется произвольное биективное отображение началь-
ного интервала {1, ..., n} натурального ряда в себя:
Число перестановок.
card Sn = n! (13.1.19)
Доказательство. Каждую перестановку σ : {1, ..., n} → {1, ..., n} можно представлять себе как
размещение длины n в множестве мощности n. По формуле (13.1.4) число таких размещений будет
равно
n!
Ann = = n!.
(n − n)!
Пусть τ : {1, ..., m} → {1, ..., n} – произвольное отображение. Условимся говорить, что переста-
новка σ : {1, ..., m} → {1, ..., m} не меняет отображение τ , если
τ ◦ σ = τ.
Теорема 13.1.32. Число перестановок σ : {1, ..., m} → {1, ..., m} не меняющих отображение τ :
{1, ..., m} → {1, ..., n} равно
n
Y
card{σ ∈ Sm : τ ◦ σ = τ } = card τ −1 (i)!. (13.1.20)
i=1
Доказательство. Выбрать такую перестановку σ – все равно что сначала выбрать перестановку
индексов, лежащих в множестве τ −1 (1) (таких перестановок имеется card τ −1 (1)!), затем выбрать
перестановку индексов, лежащих в множестве τ −1 (2) (таких перестановок имеется card τ −1 (2)!), и
так далее. Вместе по правилу комбинаторного умножения имеется card τ −1 (1)! · card τ −1 (2)! · ... ·
card τ −1 (n)! перестановок.
§ 1. Комбинаторика 729
Множество Sn всех перестановок образует группу относительно этой операции, Это означает, что,
во-первых, выполняется тождество ассоциативности,
(σ ◦ τ ) ◦ υ = σ ◦ (τ ◦ υ), σ, τ, υ ∈ Sn ,
характеризуемый условием
σ ◦ e = σ = e ◦ σ, σ ∈ Sn ,
и, в третьих, у любой перестановки σ ∈ Sn существует обратная перестановка σ −1 ∈ Sn (обратное
отображение8 для биекции σ), характеризуемая условием
σ ◦ σ −1 = e = σ −1 ◦ σ.
Циклы. Говорят, что перестановка σ ∈ Sn оставляет неподвижным элемент k множества {1, ..., n},
если
σ(k) = k.
В противном случае, если
σ(k) 6= k,
говорят, что перестановка σ ∈ Sn сдвигает элемент k.
Говорят, что перестановка σ ∈ Sn связывает два элемента k и l множества {1, ..., n}, если для
некоторого m ∈ Z
σ m (k) = l.
Циклом или циклической перестановкой длины n ∈ N∗ называется всякая перестановка σ ∈ Sn ,
которая связывает любые два сдвигаемых ею элемента k, l ∈ {1, ..., n}:
σ(k) 6= k & σ(l) 6= l =⇒ ∃m ∈ Z σ m (k) = l.
Всякая последовательность попарно различных элементов {a1 , ..., ar } множества {1, ..., n} опре-
деляет цикл, обозначаемый символом (a1 a2 ... ar ), по формуле
k, k∈/ {a1 , ..., ar }
(a1 a2 ... ar )(k) = ai+1 , k = ai , i < r . (13.1.24)
a1 , k = ar
(отличие от записи (13.1.18) в том, что здесь элементы строки ai разделяются пробелами, а не
запятыми).
Доказательство. Для любых двух элементов k и l множества {1, ..., n} условимся писать k ∼ l
если перестановка σ связывает эти элементы. Нетрудно видеть, что отношение ∼ является отно-
шением эквивалентности на {1, ..., n}. Поэтому оно разбивает {1, ..., n} на классы эквивалентности.
Обозначим их I1 , ..., Ip . Для каждого q = 1, ..., p положим
(
σ(k), k ∈ Iq
τq (k) =
k, k∈/ Iq
7 Напомним, что композиция отображений была определена на с.39 части I.
8 Обратное отображение определялось на с.41.
730 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
Ip Ip−1
6=
6=
Iq Iq
∈
(τ1 ◦ ... ◦ τq ◦ ... ◦ τp )( k ) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τp−1 )( k ) = ... = (τ1 ◦ ... ◦ τq )(k) =
= (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−1 )(σ(k)) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−2 )(σ(k)) = τ1 (σ(k)) = σ(k)
∋
Iq Iq Iq
6=
6=
6=
Iq−1 Iq−2 I1
(мы здесь для наглядности считаем, что 2 < q < p − 1). То есть композиция циклов τq совпадает с
σ:
τ1 ◦ ... ◦ τp = σ
(при этом можно заметить, что последовательность перемножения циклов τq здесь не важна, при
любой их перестановке результатом все равно будет σ).
Транспозиции.
• Транспозицией называется цикл, сдвигающий ровно два элемента, то есть перестановка,
меняющая местами два числа i 6= j, а остальные оставляющая на месте:
k, k ∈/ {i, j}
(i j)(k) = j, k = i . (13.1.25)
i, k = j
(a b) ◦ (a c) = (a c) ◦ (b c) (13.1.26)
π = τm ◦ ... ◦ τ1 (13.1.27)
(в частном случае, когда σ = e это утверждение следует понимать так, что в правой части
стоит пустое множество транспозиций).
Доказательство. По теореме 13.1.33 достаточно доказать это утверждение для циклов. Пусть σ –
какой-нибудь цикл. Выберем какой-нибудь элемент a1 ∈ {1, ..., n}, который σ сдвигает. Положим
затем
ai+1 = σ(ai ),
для всех i, меньших общего числа r сдвигаемых элементов. Тогда
затем для a2
(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a3 ) = a3 ,
§ 1. Комбинаторика 731
затем для a3
(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a1 ) = a4 ,
(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(ar ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(ar ) = (a1 ar )(ar ) = a1 .
Остается заметить, что все остальные элементы, то есть не лежащие в множестве {a1 , ..., ar } явля-
ются неподвижными как для σ, так и для всех транспозиций (a1 ai ).
π = τp ◦ ... ◦ τ1 (13.1.29)
число
sgn π = (−1)p (13.1.30)
не зависит от выбора разложения (13.1.29).
σ ◦ τ = σ′ ◦ τ ′ , σ ′ (i) 6= i, τ ′ (i) = i.
σ ◦ τ = (k l) ◦ (i j) = (i j) ◦ (k l),
— σ = (i k), где k ∈
/ {i, j}, и в этом случае
σ ◦ τ = (i k) ◦ (i j) = (13.1.26) = (i j) ◦ (j k),
— σ = (j k), где k ∈
/ {i, j}, и в этом случае
σ ◦ τ = (j k) ◦ (i j) = (13.1.26) = (i k) ◦ (j k).
Доказательство. Заметим сразу, что p не может быть единицей, потому что иначе мы получили
бы, что тождественная перестановка сама является транспозицией:
e = τ.
732 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
Предположим далее, что мы доказали, что p не может быть нечетным числом в интервале между
1 и некоторым P . Пусть p = P + 2 (то есть нечетное число, следующее за P ). Если в разложении
(13.1.31) какие-то две рядом стоящие транспозиции одинаковы
τi+1 = τi ,
то в композиции они дают e, и поэтому на них можно сократить, и мы опять получим равенство
(13.1.31), в котором p = P , и это равенство будет невозможно по предположению индукции.
Поэтому можно считать, что никакие две рядом стоящие транспозиции в (13.1.31) неодинаковы.
Выберем теперь элемент i, сдвигаемый транспозицией τ1 . По лемме 13.1.37 существуют транспози-
ции τ2′ и τ1′ такие, что
τ2 ◦ τ1 = τ2′ ◦ τ1′ , τ2′ (i) 6= i, τ1′ (i) = i.
После этого опять по лемме 13.1.37 существуют транспозиции τ3′ и τ2′′ такие, что
И так далее. В конце этой процедуры мы получим (вернув в обозначениях где нужно один штрих
вместо двух) равенство
e = τp′ ◦ ... ◦ τ1′
в котором последняя перестановка τp′ сдвигает элемент i, а первые p − 1 перестановок τ1′ , ..., τp−1
′
π = τp ◦ ... ◦ τ1 = σq ◦ ... ◦ σ1
Тогда
e = π ◦ π −1 = (τp ◦ ... ◦ τ1 ) ◦ (σq ◦ ... ◦ σ1 )−1 = τp ◦ ... ◦ τ1 ◦ σ1−1 ◦ ... ◦ σq−1 = τp ◦ ... ◦ τ1 ◦ σ1 ◦ ... ◦ σq
По лемме 13.1.38 число сомножителей здесь p + q должно быть четно. Поэтому либо оба числа p и
q четны, либо оба они нечетны. В каждом из вариантов
(−1)p = (−1)q .
Свойства перестановок:
sgn e = 1 (13.1.32)
⋄ 13.1.39. Индуцированный порядок на зательно задавать таким способом (то есть ин-
множестве чисел. Если N – подмножество в дуцируя его из R). Например, если выбрать про-
множестве чисел R, то на нем можно рассмот- извольную инъективную последовательность чи-
реть линейный порядок, индуцированный из R, сел x1 , ..., xk (то есть размещение, определенное
то есть такой, при котором неравенство a b вы- на с.718), то в ней порядок можно определить
полняется, если оно верно, как неравенство чисел как порядок индексов:
(в линейно упорядочнном множестве R):
xi xj ⇐⇒ i 6 j.
ab ⇐⇒ a 6 b.
⋄ 13.1.40. Порядок, заданный нумераци- (Понятно, что это необязательно то же самое,
ей. Но порядок на числовом множестве необя- что xi 6 xj .)
Ниже из линейно упорядоченных множеств нас будут интересовать только конечные. Справед-
лива
734 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
Теорема 13.1.41. Всякий линейный порядок на конечном множестве N задается некоторой ну-
мерацией элементов этого множества: существует биективное отображение
τN : {1, ..., n} → N
ι(x) = x, x ∈ N, (13.1.36)
τN τN ′
{1, ..., n} o σ
{1, ..., n}
в которой {1, ..., n}′ обозначает множество {1, ..., n} с новым порядком 6′ , а τ ′ – нумерация его
элементов по возрастанию. Здесь ι – тождественное отображение из (13.1.36), поэтому мы получаем,
что в этом случае перестановка σ, соответствующая смене порядка, просто совпадает с нумерацией
τ ′:
σ = τ ′.
• Если K и L – два непересекающихся линейно упорядоченных конечных множества (с
порядками K и L ), то на их объединении K ⊔ L можно задать линейный порядок ,
положив a b в случае, если выполняется одно из трех:
§ 1. Комбинаторика 735
— либо a, b ∈ K и a K b,
— либо a, b ∈ L и a L b,
— либо a ∈ K и b ∈ L.
Множество K ⊔ L с заданным таким образом линейным порядком называется склейкой
линейнго упорядоченных множеств K и L и обозначается K ⊳ L.
Понятно, что операция склеивания не коммутативна
K ⊳ L 6= L ⊳ K,
но ассоциативна
(K ⊳ L) ⊳ M = K ⊳ (L ⊳ M ).
• Рассмотрим частную ситуацию, когда K и L образуют разбиение отрезка натурального
ряда:
K ⊔ L = {1, ..., n}, n ∈ N∗ .
Множества K и L мы будем считать линейно упорядоченными (с линейным порядком,
индуцированным из N∗ ). Их склейка K ⊳ L представляет собой то же самое множество
K ⊔ L = {1, ..., n}, только с новым линейным порядком, поэтому согласно замечанию
13.1.43, переход от K ⊔ L = {1, ..., n} к K ⊳ L можно себе представлять как перестановку σ
элементов {1, ..., n}, которая совпадает с отображением τK⊳L нумерации по возрастанию
элементов множества τK⊳L , потому что диаграмма (13.1.38) принимает здесь вид
ι
{1, ..., n} = K ⊔ L / K ⊳L
O (13.1.39)
O
ι τK⊳L
σ(1) < σ(2) < ... < σ(k), σ(k + 1) < σ(k + 2) < ... < σ(k + l) (13.1.40)
Наоборот, если какая-то перестановка σ ∈ Sk+l удовлетворяет условиям (13.1.40), то она явля-
ется отображением склейки σ = τK⊳L для множеств (13.1.41).
Предложение 13.1.45. Пусть {1, ..., k + l} = K ⊔ L, k = card K, l = card L и для некоторого
i ∈ {1, ..., k + l} множество K содержит ровно одно из чисел i и i + 1,
i∈K & i+1∈L ∨ i+1∈K & i∈L .
K ′ = (i i + 1)(K), L′ = (i i + 1)(L).
θ ◦ σ = σ′ ,
i+1 ∈
/K
⇓
′ ′
σ(1) < ... < σ(i − 1) < σ(i ) = i 6 i + 1 < σ(i′ + 1) < ... < σ(k)
|{z} | {z } | {z } | {z } |{z}
k k k k k
θ σ(1) θ σ(i′ − 1) θ(i) θ σ(i′ + 1) θ σ(k)
k
θ σ(i′ )
⇓
θ σ(1) < ... < θ σ(i′ − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)
И, во-вторых,
i∈K
⇓
′
σ(k + 1) < ... < σ(j − 1) < i
|{z} < i + 1 = σ(j ′ ) < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z }
k k k k k
θ(i + 1)
θ σ(k + 1) θ σ(j ′ − 1) θ σ(j ′ + 1) θ σ(k + l)
k
θ σ(j ′ )
⇓
θ σ(k + 1) < ... < θ σ(j ′ − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)
2) Если же i ∈
/ K и i + 1 ∈ K, то, во-первых,
i∈
/K
⇓
σ(1) < ... < σ(i′ − 1) < i
|{z} < i + 1 = σ(i′ ) < σ(i′ + 1) < ... < σ(k)
|{z} | {z } | {z } |{z}
k k k k k
θ(i + 1)
θ σ(1) θ σ(i′ − 1) θ σ(i′ + 1) θ σ(k)
k
θ σ(i′ )
⇓
θ σ(1) < ... < θ σ(i − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)
′
И, во-вторых,
i+1∈K
⇓
′ ′
σ(k + 1) < ... < σ(j − 1) < σ(j ) = i 6 i| +
{z 1} < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z }
k k k k k
θ σ(k + 1) θ σ(j ′ − 1) θ(i) θ σ(j ′ + 1) θ σ(k + l)
k
θ σ(j ′ )
⇓
θ σ(k + 1) < ... < θ σ(j − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)
′
Свойства склейки:
10 . Если {1, ..., n} = K ⊔ L, то
τL⊳K τK⊳L
{1, ..., n} j / {1, ..., n} o {1, ..., n}
Поэтому
−1
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(τL⊳K ◦ τK⊳L ) = sgn(υ).
А последнюю величину легко вычислить: чтобы переставить множества A = {1, ..., k} и B = {k +
1, ..., k + l}, нужно сначала последовательно передвигать первый элемент b1 = k + 1 множества B
влево, так, чтобы он встал перед A, на это уйдет ровно k транспозиций соседних элементов (по
числу элементов множества A), затем точно так же нужно передвинуть второй элемент b2 = k + 2
множества B, так, чтобы он встал между b1 и множеством A, и на это опять уйдет k транспозиций.
И так далее, и в конце концов мы передвинем l элементов множества B, и на каждую операцию
уйдет k транспозиций. Значит, всего понадобится kl транспозиций, и мы получаем
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(υ) = (−1)kl .
2. Пусть {1, ..., n} = K ⊔ L ⊔ M . Построение склейки (K ⊳ L) ⊳ M можно представить как после-
довательность трех действий:
1) сначала строится склейка (K⊔L)⊳M , это эквивалентно построению отображения τ(K⊔L)⊳M :
{1, ..., n} → {1, ..., n}, которое первые k + l индексов {1, ..., k + l} тратит на нумерацию
элементов множества K ⊔ L, а оставшиеся m индексов {k + l + 1, ..., n} – на нумерацию
элементов M ;
2) после того, как это сделано, упорядоченное множество K ⊔ L оказывается занумеровано
индексами {1, ..., k + l}; обозначим
−1 −1
K ′ = τ(K⊔L)⊳M (K), L′ = τ(K⊔L)⊳M (L).
и построим новую склейку, K” ⊳ L′ , или, иными словами, отображение τK ′ ⊳L′ : {1, ..., k +
l} → {1, ..., k + l}, которое первые k индексов трати на нумерацию элементов K ′ , а остав-
шиеся l индексов на нумерацию L′ ;
3) когда построено τK ′ ⊳L′ , мы полагаем
(
τK ′ ⊳L′ (i), i 6 k + l
σ(i) =
i, i>k+l
и это будет перестановка σ : {1, ..., n} → {1, ..., n}, композиция которой с τ(K⊔L)⊳M дает
τ(K⊳L)⊳M :
τ(K⊳L)⊳M = τ(K⊔L)⊳M ◦ σ. (13.1.45)
Наглядно это можно изобразить диаграммой
ι ι
K ⊔ LO ⊔ M / (K ⊔ L) ⊳ M / (K ⊳ L) ⊳ M
O O
ι τ(K⊔L)⊳M τ(K⊳L)⊳M
τ(K⊔L)⊳M σ
{1, ..., n} ol {1, ..., n} o {1, ..., n}
τ(K⊳L)⊳M
Из (13.1.45) мы получаем
sgn τ(K⊳L)⊳M = sgn τ(K⊔L)⊳M · sgn σ = sgn τ(K⊔L)⊳M · sgn τK⊳L ,
738 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
§2 Векторные пространства
Важное свойство векторных величин (из которых затем, при дополнительном предположении ко-
нечномерности, формально следуют все остальные их свойства) заключается в том, что их можно
складывать друг с другом и умножать на число. В математике эти свойства формализуются кон-
струкцией векторного пространства, и в этом параграфе мы объясним, что это такое.
(x + y) + z = x + (y + z) (13.2.47)
x + 0 = x, x∈X (13.2.48)
x + (−x) = 0 (13.2.49)
(λ · µ) · x = λ · (µ · x) (13.2.50)
λ · (x + y) = λ · x + λ · y (13.2.52)
∃λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi = λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,
∀λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi 6= λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,
λ1 · x1 + ... + λk · xk = 0 (13.2.57)
λ1 = ... = λk = 0
Доказательство. 1. Пусть равенство (13.2.57) выполняется для набора коэффициентов, среди ко-
торых есть какой-то ненулевой:
λi 6= 0.
Тогда можно выразить слагаемое λi · xi через все остальные
Базис и размерность.
• Система векторов b1 , ..., bn векторного пространства X называется (конечным) базисом
этого пространства, если
1) она линейно независима, и
2) любой вектор x ∈ X представим в виде некоторой линейной комбинации векто-
ров b1 , ..., bn :
∃β 1 , ..., β n ∈ R x = β 1 · b1 + ... + β n · bn , (13.2.58)
(это свойство называется линейной полнотой системы b1 , ..., bn ).
x = β 1 · b1 + ... + β n · bn = λ1 · b1 + ... + λn · bn ,
где
∃k = 1, ..., n β k 6= λk .
Тогда
(β 1 − λ1 ) · b1 + ... + (β n − λn ) · bn = β 1 · b1 + ... + β n · bn − λ1 · b1 + ... + λn · bn = x − x = 0
Лемма 13.2.6. Длина любой линейно независимой системы a1 , ..., am в векторном пространстве
X не превосходит длины базиса b1 , ..., bn этого пространства (если он существует):
m 6 n.
m > n.
Покажем, что тогда векторы a1 , ..., an (то есть первые n векторов в последовательности a1 , ..., am )
образуют базис пространства X. Это делается индукцией.
1. Заметим сначала, что, перенумеровав, если нужно, векторы b1 , b2 , ..., bn , можно добиться, что-
бы система a1 , b2 , ..., bn (получающаяся заменой b1 на a1 ) была базисом в X.
Поскольку b1 , ..., bn – базис, вектор a1 выражается как линейная комбинация векторов b1 , ..., bn :
a1 = λ1 · b1 + ... + λn · bn ,
для некоторых λ1 , ..., λn ∈ R. При этом по свойству 1◦ на с.739 вектор a1 (будучи элементом линейно
независимой системы) не может быть нулевым:
0 6= a1 = λ1 · b1 + ... + λn · bn .
Поэтому какой-то из коэффициентов λi тоже должен быть ненулевым. Перенумеровав, если нужно
векторы b1 , ..., bn (вместе с коэффициентами λ1 , ..., λn ), мы можем считать, что ненулевым коэффи-
циентом в этой комбинации будет λ1 :
λ1 6= 0
Тогда мы получим, что b1 выражается через векторы a1 , b2 , ..., bn :
λ1 ·b1 + λ2 · b2 + ... + λn · bn ,
a1 = |{z} (13.2.61)
6=
⇓
2
1 λ λn
· a 1 = b 1 + · b 2 + ... + · bn ,
λ1 λ1 λ1
⇓
1 λ2 λn
·b1 =
a 1 − · b 2 − ... − · bn ,
λ1 λ1 λ1
Отсюда следует, что вообще любой вектор x ∈ X выражается через векторы a1 , b2 , ..., bn :
x = β 1 · b1 + β 2 · b2 + ... + β n · bn ,
1 λ2 λn
x = β1 · 1
· a1 − 1 · b2 − ... − 1 · bn + β 2 · b2 + ... + β n · bn =
λ λ λ
β1 β 1 · λ2 β 1 · λn
= 1 · a1 + β 2 − · b 2 + ... + β 2
− · bn .
λ λ1 λ1
Покажем теперь, что система a1 , b2 , ..., bn должна быть линейно независима. Действительно,
пусть для каких то γ 1 , ..., γ n выполняется равенство
γ 1 · a1 + γ 2 · b2 + ... + γ n · bn = 0,
γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1
6=
⇓
742 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
γ2 γn
a1 = · b 2 + ... + · bn
γ1 γ1
⇓ (вычитаем из (13.2.61))
γ2 γn
λ1 ·b1 + λ2 − 1 · b2 + ... + λn − 1 · bn ,
0 = |{z}
γ γ
6=
0
означающая, что система b1 , ..., bn линейно зависима (чего не может быть, поскольку b1 , ..., bn –
базис).
А из γ 1 = 0 затем следует, что все остальные γ i тоже равны нулю:
γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1
=
0
⇓
γ · b2 + ... + γ n · bn = 0,
2
⇓
γ = ... = γ n = 0,
2
является базисом в X. Покажем теперь, что перенумеровав если нужно векторы br+1 , ..., bn , можно
добиться, чтобы система
a1 , ..., ar , ar+1 , br+2 , ..., bn
была базисом в X.
Выразим ar+1 через базис a1 , ..., ar , br+1 , ..., bn :
Заметим, что в этой линейной комбинации какой-то из коэффициентов λr+1 , ..., λn должен быть
ненулевым, потому что иначе мы получили бы, что ar+1 выражается через a1 , ..., ar
ar+1 = λ1 · a1 + ... + λr · ar ,
(то есть получилось бы, что система a1 , ..., am должна быть линейно зависима, а это невозможно,
потому что она – базис). Перенумеровав, если нужно векторы br+1 , ..., bn (вместе с коэффициентами
λr+1 , ..., λn ), мы можем считать, что ненулевым коэффициентом в этой комбинации будет λr+1 :
λr+1 6= 0
Теперь теми же рассуждениями, что в пункте 1, показываем, что система a1 , ..., ar , ar+1 , br+2 , ..., bn
– базис в X.
Описанная индукция доказывает, что подходящей перенумерацией векторов b1 , ..., bn , а затем по-
следовательной заменой bi на ai , мы получим систему базисов пространства X, в которой последним
будет базис a1 , ..., an :
b1 , b2 , b3 , ..., bn
7→
a1 , b2 , b3 , ..., bn
7→
a1 , a2 , b3 , ..., bn
§ 2. Векторные пространства 743
7→
...
7→
a1 , a2 , a3 , ..., an .
Отсюда следует, в частности, что вектор am (как любой другой вектор пространства X) должен
выражаться через векторы базиса a1 , ..., an :
am = λ1 · a1 + ... + λn · an
То есть система a1 , ..., an , ..., am должна быть линейно зависима. Это противоречие означает, что
наше исходное предположение, что m > n было неверно.
Теорема 13.2.7. Любые два базиса a1 , ..., am и b1 , ..., bn векторного пространства X (если они
существуют) имеют одинаковую длину:
m = n.
Доказательство. Поскольку a1 , ..., am – линейно независимая система, а b1 , ..., bn – базис в X, по
лемме 13.2.6 получаем
m 6 n.
С другой стороны, b1 , ..., bn – линейно независимая система, а a1 , ..., am – базис в X, поэтому опять
по лемме 13.2.6 получаем
n 6 m.
Вместе это дает равенство m = n.
• Векторное пространство X называется конечномерным, если оно обладает конечным ба-
зисом, и бесконечномерным, если конечного базиса в нем нет. Из теоремы 13.2.7 следует,
что если в X есть конечный базис b1 , ..., bn , то любой другой базис должен иметь то же
самое число элементов n. Это число n называется размерностью векторного пространства
X и обозначается dim X.
Лемма 13.2.8. Если a1 , ..., ak – линейно независимая система в векторном пространстве X,
не являющаяся базисом этого пространства, то найдется вектор ak+1 такой, что система
a1 , ..., ak , ak+1 также будет линейно независимой.
Доказательство. Поскольку a1 , ..., ak – не базис в X, найдется какой-то вектор ak+1 ∈ X, который
не выражается через вектора a1 , ..., ak :
ak+1 ∈
/ span{a1 , ..., ak }.
то, во-первых, должно быть λk+1 = 0, потому что иначе мы получили бы, что ak+1 линейно выра-
жается через a1 , ..., ak :
λ1 · a1 + ... + λk · ak + |λk+1
{z } ·ak+1 = 0,
6=
⇓
1
λ λk
ak+1 = − · a 1 − ... − · ak .
λk+1 λk+1
А, во-вторых, из λk+1 = 0 следует равенство
λ1 · a1 + ... + λk · ak = 0,
которое может выполняться только если все коэффициенты λ1 , ..., λk равны нулю (потому что си-
стема a1 , ..., ak линейно независима):
λ1 = ... = λk = 0.
744 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
m 6 dim X. (13.2.62)
и эта система тогда и только тогда является базисом, когда ее длина равна размерности этого
пространства:
m = dim X. (13.2.63)
Доказательство. 1. Неравенство (13.2.62) – непосредственное следствие леммы 13.2.6.
2. Если a1 , ..., am – базис, то по определению размерности длина m последовательности векторов
a1 , ..., am должна быть равна размерности X, то есть выполняется (13.2.63).
3. Наоборот, если a1 , ..., am – не базис, то по лемме 13.2.8 найдется элемент am+1 такой, что систе-
ма a1 , ..., an , am+1 снова будет линейно независимой. Но тогда по лемме 13.2.6 должно выполняться
неравенство
m + 1 6 dim X,
из которого следует, что (13.2.63) неверно.
Теорема 13.2.10. Если пространство X конечномерно, то в нем всякая линейно независимая си-
стема векторов a1 , ..., am дополняется до некоторого базиса a1 , ..., am , am+1 , ..., an (где n = dim X).
Доказательство. По теореме 13.2.9, длина системы a1 , ..., am не превышает размерности простран-
ства X:
m 6 n.
Если m = n, то по теореме 13.2.9 a1 , ..., am уже является базисом, и доказывать нечего. Поэтому
интересен случай, когда
m < n.
Тогда по теореме 13.2.9 a1 , ..., am – не базис, и значит по лемме 13.2.8, найдется вектор am+1 такой,
что система a1 , ..., am , am+1 снова является линейно независимой. Если m + 1 < n, то опять по по
теореме 13.2.9 a1 , ..., am , am+1 – не базис, и снова по лемме 13.2.8, найдется вектор am+2 такой, что
система a1 , ..., am , am+1 , am+2 также является линейно независимой, и так далее.
Действуя так по индукции, мы в какой-то момент получим линейно независимую систему
a1 , ..., am , am+1 , ..., an длины n = dim X, и по теореме 13.2.9 она будет базисом в X.
Подпространства.
• Подмножество Y в векторном пространстве X называется подпространством в X, если
оно замкнуто относительно операций взятия суммы и умножения на скаляр, то есть
∀x, y ∈ Y x+y ∈Y
и
∀y ∈ Y ∀λ ∈ R λ·y ∈Y
Свойства подпространств:
1◦ . В конечномерном векторном пространстве X любое подпространство Y тоже конеч-
номерно, причем
dim Y 6 dim X, (13.2.64)
и равенство dim Y = dim X достигается только в случае, если Y = X.
◦
2 . Если Y и Z – два подпространства в векторном пространстве X, то
(a) пересечение Y ∩ Z подпространств Y и Z является подпространством в X,
(b) множество
Y + Z = {y + z; y ∈ Y, z ∈ Z}
всех векторов вида y + z, где y ∈ Y и z ∈ Z образует подпространство в X
(называемое алгебраической суммой подпространств Y и Z),
(c) если вдобавок X конечномерно, то
m 6 dim X
a1 , ..., ak , y1 , ..., ym ∈ Y.
С другой стороны, последовательность a1 , ..., ak можно считать системой векторов в Z, и там она
тоже будет линейно независимой. Поэтому по теореме 13.2.10 ее можно дополнить до некоторого
базиса в Z:
a1 , ..., ak , z1 , ..., zn ∈ Z.
Теперь покажем, что система векторов a1 , ..., ak , y1 , ..., ym , z1 , ..., zn будет базисом в Y + Z.
1. Сначала убедимся, что эта система линейно независима. Пусть
Обозначим
z = γ 1 · z1 + ... + γ n · zn .
Тогда с одной стороны, поскольку z1 , ..., zn ∈ Z,
z ∈ Z.
А, с другой стороны,
z = −α1 · a1 − ... − αk · ak − β 1 · y1 − ... − β m · ym
где a1 , ..., ak , y1 , ..., ym ∈ Y , и поэтому
z ∈ Y.
Как следствие,
z ∈ Y ∩ Z,
и поскольку a1 , ..., ak – базис в Y ∩ Z, должны существовать числа λ1 , ..., λk такие, что
z = λ1 · a1 + ... + λk · ak .
γ 1 · z1 + ... + γ n · zn = z = λ1 · a1 + ... + λk · ak .
⇓
γ 1 · z1 + ... + γ n · zn − λ1 · a1 − ... − λk · ak = 0.
⇓ (a1 , ..., ak , z1 , ..., zn – базис в Z )
746 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
γ 1 = ... = γ n = λ1 = ... = λk = 0.
⇓ подставляем γ i = 0 в (13.2.66)
=
0
⇓
α · a1 + ... + α · ak + β 1 · y1 + ... + β m · ym = 0
1 k
– базис в Y ∩ Z – базис в Y
z }| { z }| {
dim(Y ∩ Z) + dim(Y + Z) = 2k + m + n = dim Y + dim
| {z Z}
| {z }
a a1 , ..., ak , z1 , ..., zn
=
z1 , ..., zn
– базис в Y + Z k+n
k+m+n
n
X n
X
= αi · xi , x ∈ Rn (13.2.68) = xi · αi = α · x
i=1 i=1
(
0, 6 j
i= αn
1, i=j
αi = f (ei ) (13.2.71)
И наоборот, если f : Rn → R – линейный функ-
ционал, то из (13.2.69)
e1
где e = ... – стандартный базис в Rn .
αi = f (ei )
en
следует (13.2.68):
Теорема 13.2.14. Формулы (13.2.70) и (13.2.71)
n
! n
устанавливают взаимно однозначное соответ-
X X
f (x) = f xi · ei = xi · f (ei ) = ствие между числовыми столбцами α ∈ Rn и
i=1 i=1
линейными функционалами f : Rn → R.
Столбец коэффициентов.
• Пусть X – векторное пространство и (b1 , ..., bn ) – его базис. Коэффициенты β i в раз-
ложении (13.2.58) вектора x по заданному базису (b1 , ..., bn ) мы условимся обозначать
h ii i
x
специальным символом b1 ,...,bn
или xb :
n h ii
X n
X i
x x
x= · bi = · bi (13.2.72)
i=1
b i=1
b1 , ..., bn
i h x ii
По теореме 13.2.5 числа xb = b1 ,...,bn
определяются однозначно. Их удобно представ-
лять как столбец (соответствующий произвольному вектору x при фиксированном базисе
b = (b1 , ..., bn )):
x 1
h x i xb 2
= b
...
.
b
x n
b
2◦ . Аддитивность: h i h i
x+y x y
= + (13.2.74)
b b b
Мы получаем, что один и тот же вектор λ · x двумя способами разложен по базису b1 , ..., bn :
Xn i Xn h x ii
λ·x
· bi = λ · x = λ· · bi
i=1
b i=1
b
2. Равенство (13.2.74) доказывается так же: сначала подставив в (13.2.72) вместо x вектор x + y,
мы получим
Xn i
x+y
x+y = · bi
i=1
b
Затем, сложив (13.2.72) с тем же равенством, только выписанном для вектора y, мы получим
n h ii
X n h ii
X n h ii
X h y ii n h i
X h y ii
x y x x
x+y = · bi + · bi = + · bi = + · bi
i=1
b i=1
b i=1
b b i=1
b b
| {z } | {z }
x y
В результате один и тот же вектор x + y оказывается двумя способами разложен по базису b1 , ..., bn :
Xn i Xn h i h y ii
x+y x
· bi = x + y = + · bi
i=1
b i=1
b b
Im A = {y ∈ Y : ∃x ∈ X Ax = y} (13.2.83)
750 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
! 13.2.18. Понятно, что оператор A : X → Y то- Несколько менее очевидно, что оператор A :
гда и только тогда будет сюръективным, когда X → Y тогда и только тогда будет инъектив-
его образ совпадает с Y : ным, когда его ядро состоит из одного нуля:
Im A = Y Ker A = {0}.
X/ Ker A ∼
= Im A.
Доказательство. Здесь достаточно доказать эквивалентность условий (i) и (ii). Это делается сле-
дующей цепочкой:
A сюръективен
m
Im A = Y
m свойство 1◦ на с.744
dim Ker A = 0
m
Ker A = {0}
m
A инъективен
В частности,
dim End(X) = (dim X)2 (13.2.89)
B · A = IX , A · B = IY .
• Для всякого векторного пространства X его Заметим, что для всякого базиса a =
вторым сопряженным пространством X ∗∗ (a1 , ..., an ) в векторном пространстве X базис 11 ,
a
называется пространство сопряженное к про- сопряженный к сопряженному базису a1 к a пред-
странству X ∗ : ставляет собой просто образ базиса a под дей-
ствием отображения ιX :
X ∗∗ := (X ∗ )∗
i
1
Естественным отображением из X в X ∗∗ на- 1 := ιX (ai ), i = 1, ..., n. (13.2.97)
a
зывается отображение ιX : X → X ∗∗ , дей-
ствующее по формуле Теорема 13.2.23. Для всякого конечномерно-
го векторного пространства X естественное
ιX (x)(f ) := f (x), x ∈ X, f ∈ X ∗. отображение ιX : X → X ∗∗ является изомор-
(13.2.96) физмом.
A∗ (f ) = f ◦ A, f ∈ Y ∗, (13.2.98)
X = Y ⊕ Z,
Y ∩ Z = {0}
X =Y +Z
Свойства проекторов:
1◦ . Если P – проектор в X, то I − P – тоже проектор в X, причем
X = Y ⊕ Z,
(I − P )2 = (I − P ) · (I − P ) = |{z}
I 2 − |P{z· I} − I| {z P 2 = I − P − P + P = I − P.
· P} + |{z}
=
I P P P
а, во-вторых,
Вместе они дают равенство Ker(I −P ) = Im P (верное для любого проектора P ). Если в нем заменить
проектор P на проектор I − Q, мы получим равенство Ker Q = Im(I − Q) (верное для любого
проектора Q), то есть второе равенство в (13.2.100).
2. Пусть P – проектор в X. Тогда, во-первых,
(
P (y) = 0
y ∈ Ker P ∩ Im P =⇒ =⇒ 0 = P (y) = P (P (x)) = P (x) = y,
∃x ∈ X : y = P (x)
∋
Z
Z Z
А для любых x, x′ ∈ X
(13.2.101)
x − P (x) ∈ Y & x′ − P (x′ ) ∈ Y =⇒ x + x′ − P (x) + P (x′ ) ∈ Y =⇒
| {z } | {z } | {z }
∋
Z Z Z
=⇒ P (x + x′ ) = P (x) + P (x′ ).
Заметим далее следующую цепочку, из которой следует, что P является проектором:
(13.2.101)
x − P (x) − 0 ∈ Y =⇒ P (x − P (x)) = 0 =⇒ P (x) − P (P (x)) = 0 =⇒ P (P (x)) = P (x).
∋
И, наконец, что Im P = Z:
(13.2.101)
z ∈ Im P ⇐⇒ ∃x ∈ X P (x) = z ⇐⇒ ∃x ∈ X x−z ∈Y ⇐⇒ z ∈ Z.
∋
Полилинейные формы.
• В частном случае, когда Y = R, полилинейное отображение
ϕ : X1 × · · · × Xk → R
называется полилинейной формой на последовательности пространств X1 , ..., Xk (при k =
2 – билинейной формой на паре пространств (X1 , X2 )). Множество всех полилинейных
форм на последовательности векторных пространств X1 , ..., Xk обозначается символом
L(X1 , ..., Xk ). В частном случае, когда пространства X1 , ..., Xk совпадают, мы будем ис-
пользовать обозначение
Lk (X) = L(X, ..., X). (13.2.102)
| {z }
k аргументов
Теорема 13.2.27. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , и в соответствии
i j
с (13.2.78) a1 и 1b – сопряженные базисы в X ∗ и Y ∗ . Тогда билинейные формы
i j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
образуют базис в пространстве L(X, Y ) билинейных форм на X × Y . Разложение всякой билиней-
ной формы ϕ : X × Y → R по этому базису имеет вид
k X
X l i j
1 1
ϕ= ϕ(ai , bj ) · ⊠ (13.2.105)
i=1 j=1
a b
! 13.2.28. Этот результат очевидным образом обобщается на случай пространства L(X1 , ..., Xk ) с
произвольной последовательностью аргументов (X1 , ..., Xk ).
Доказательство. Сначала убедимся, что эта система линейно независима. Пусть для некоторых
скаляров λi,j выполняется равенство
k X
X l i j
1 1
λi,j · ⊠ = 0.
i=1 j=1
a b
⋄ 13.2.29. Для любого числового семейства ет, что всякая билинейная форма α : Rn ×Rn → R
{αi,j ; i, j ∈ {1, ..., n}} ⊆ R формула имеет вид (13.2.106), где семейство чисел αi,j
X n определяется формулой
α(x, y) = αi,j · xi · y j , x, y ∈ Rn ,
i,j=1 αi,j = α(ei , ej ), (13.2.107)
(13.2.106)
очевидно, определяет билинейную форму α : в которой ei – стандартный базис в Rn , опреде-
Rn ×Rn → R. Наоборот, из теоремы 13.2.27 следу- ленный в (13.2.59).
потому что если a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , то в L(X, Y ) число элементов
в базисе i j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
равно k · l. В общем случае те же рассуждения опираются на замечание 13.2.28.
Тензоры.
• Тензором в последовательности конечномерных векторных пространств X1 , ..., Xk назы-
вается всякий линейный функционал
T : L(X1 , ..., Xk ) → R
Теорема 13.2.32. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y . Тогда тензоры
ai ⊗ b j ; i = 1, ..., k, j = 1, ..., l
Доказательство. Опять начнем с того, что убедимся, что эта система линейно независима. Пусть
для некоторых скаляров λi,j выполняется равенство
k X
X l
λi,j · ai ⊗ bj = 0.
i=1 j=1
1 i 1 j
Пусть в соответствии с (13.2.78) a и b – сопряженные базисы в X ∗ и Y ∗ . Для всякой пары
индексов (p, q) мы получим
p q p q p q (
1 1 1 1 1 1 0, (i, j) 6= (p, q)
ai ⊗ b j ⊠ = ⊠ (ai , bj ) = (ai ) · (bj ) = ,
a b a b a b 1, (i, j) = (p, q)
поэтому
k X
X l p q
i,j 1 1
0= λ · ai ⊗ b j ⊠ = λp,q .
i=1 j=1
a b
Xk X l i j !
1 1
= ai ⊗ bj (ϕ) · T ⊠
i=1 j=1
a b
ai ⊗ b j , i = 1, ..., k, j = 1, ..., l
образуют базис в пространстве L(X ∗ , Y ∗ ). При этом по уже доказанной формуле (13.2.113), при
отображении @ первый базис превращается во второй:
Теорема 13.2.36. Для всякого набора конечномерных векторных пространств X1 , ..., Xk , Y и вся-
кого полилинейного отображения ϕ : X1 ×...×Xk → Y найдется единственный линейный оператор
ϕ⊗ : X1 ⊗ ... ⊗ Xk → Y , замыкающий диаграмму
X1 × ... × Xk
♦♦ ❖❖❖
⊗ ♦♦♦♦ ❖❖❖
♦♦ ❖❖ϕ❖ .
♦♦♦ ❖❖❖
w♦♦ ❖❖❖
'
X1 ⊗ ... ⊗ Xk ❴ ❴ ❴ ❴ ❴ ❴ ❴ ⊗❴ ❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ
Доказательство. Каждому функционалу f ∈ Y ∗ поставим в соответствие полилинейную форму
на X1 , ..., Xk по формуле
ψ(f ) = f ◦ ϕ.
У нас получился линейный оператор
ψ : Y ∗ → L(X1 , ..., Xk ).
Рассмотрим отображение ιY : Y → Y ∗∗ , определенное формулой (13.2.96). По теореме 13.2.23 оно
является изоморфизмом, поэтому определено обратное отображение ι−1
Y :Y
∗∗
→ Y . Положим
ϕ⊗ = ι−1 ∗ ∗
Y ◦ ψ : L(X1 , ..., Xk ) → Y
ιY (ϕ⊗ (⊗(x1 , ..., xk )))(f ) = ψ ∗ (⊗(x1 , ..., xk ))(f ) = ψ ∗ (x1 ⊗...⊗xk )(f ) = (13.2.98) = (x1 ⊗...⊗xk )(ψ(f )) =
= (x1 ⊗...⊗xk )(f ◦ϕ) = (13.2.110) = (f ◦ϕ)(x1 , ..., xk ) = f (ϕ(x1 , ..., xk )) = (13.2.96) = ιY (ϕ(x1 , ..., xk ))(f )
⇓
⊗
ιY (ϕ (⊗(x1 , ..., xk ))) = ιY (ϕ(x1 , ..., xk ))
⇓
⊗
ϕ (⊗(x1 , ..., xk )) = ϕ(x1 , ..., xk )
⇓
⊗
ϕ ◦ ⊗ = ϕ.
§3 Матрицы и определители
(a) Матрицы
Напомним, что начальным интервалом натурального ряда N∗ мы условились называть (см. опре-
деление на с.201) произвольное множество вида
{1, ..., n} = {k ∈ N∗ : k 6 n}
• Матрицей размера m × n, где m, n ∈ N∗ , называется произвольная вещественнознач-
ная функция на декартовом произведении {1, ..., m} × {1, ..., n} начальных интервалов
{1, ..., m} и {1, ..., n}, то есть отображение вида
M : {1, ..., m} × {1, ..., n} → R
Значение такой функции в точке (i, j) ∈ {1, ..., m}×{1, ..., n} удобно обозначать с помощью
индексов:
Mij := M (i, j)
а всю матрицу удобно изображать в виде таблицы, в которой нижний индекс обозначает
номер столбца, а верхний – номер строки:
1
M1 M21 ... Mm1
M12 M22 ... Mm2
M = ...
... ... ...
M1n M2n ... Mmn
Числа Mij в этой таблице (то есть значения функции M в точках (i, j)) называются эле-
ментами матрицы M , число m называется ее длиной, а число n – ее высотой.
760 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
• Множество всех матриц размера m × n (то есть длиной m и высотой n) мы будем обозна-
чать Rnm .
• Матрицы, у которых длина равна высоте, называются квадратными матрицами.
• Матрицы, у которых высота равна 1, можно отождествить со строками, которые мы
определили на с.715.
• Двойственным образом, матрицы, у которых длина равна 1 отождествляются со столб-
цами, определенными на с.716.
(M ⊤ )ji := Mji
или, что эквивалентно, строка (y1 , ..., ym ), элементы которой определяются формулой
n
X
yi = xj · Mij ,
j=1
• Если (b1 , ..., bn ) – базис в векторном пространстве X, а (x1 , ..., xm ) – произвольная по-
следовательность элементов X, то мы можем разложить каждый элемент xi по базису
(b1 , ..., bn ),
n h
X xi ij
xi = · bj ,
j=1
b
=
(13.2.72) (13.2.72)
x1 xm
называется матрицей перехода от базиса (a1 , ..., an ) к базису (b1 , ..., bn ). Коротко ее опре-
деление записывается формулой
h a ij h a ij
i
:= , i, j = 1, ..., n (13.3.121)
b i b
Из теоремы 13.3.1 следует
762 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
Теорема 13.3.2. Базисы (a1 , ..., an ) и (b1 , ..., bn ) в векторном пространстве X связаны между
собой через матрицу перехода по следующей формуле:
hai
(a1 , ..., an ) = (b1 , ..., bn ) · (13.3.122)
b
Теорема 13.3.3. Если (a1 , ..., an ) и (b1 , ..., bn ) – два базиса в векторном пространстве X, то
hai hxi hxi
· = , x∈X (13.3.123)
b a b
hai b b hai
· =I= · (13.3.124)
b a a b
h a i−1 b
= (13.3.125)
b a
(где I – единичная матрица размера n × n).
Доказательство. 1. Равенство (13.3.123) выводится из цепочки
!
Xn h i h ij Xn Xn h ij h ii X n h ii Xn h ij
a x a x x a
· · bj = · · bj = · · bj =
j=1
b a j=1 i=1
b i a i=1
a j=1
b i
X n h ii Xn h ij X n h ii Xn h ij
x ai x x
= · · bj = · ai = x = · bj
i=1
a j=1
b i=1
a j=1
b
n
" Pn bi k #j n j n
X · ak X bi X
= k=1 a
· bj = · bj = bi = Iij · bj
j=1
b j=1
b j=1
⇓
h i j
a b
· = Iij
b a i
⇓
hai b
· =I
b a
А после этого второе равенство в (13.3.124) тоже можно считать доказанным, потому что оно по-
лучается из первого перестановкой букв a и b.
3. Равенство (13.3.125) теперь – следствие (13.3.124).
n h ii
! n h ii n h ii X n j
X x X x X x Aa
Ax = A · ai = · Aai = (13.3.128) = · · bj =
i=1
a i=1
b i=1
b j=1
b i
n j h i ! n j
Aa h x i Aa h x i
Xn X X
Aa x i
= · ·bj = (13.3.114) = · ·bj = (13.3.115) = (b1 , ..., bn )· ·
j=1 i=1
b i b j=1
b b b a
⇓
j j
b Aa Aa
· =
c b i c i
764 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
⇓
h ij j
Aa c Ac
· =
b a i b i
И это доказывает (13.3.134).
и
α(x, λ1 · y1 + λ2 · y2 ) = λ1 · α(x, y1 ) + λ2 · α(x, y2 ), x, y1 , y2 ∈ X, λ1 , λ2 ∈ R.
• Если α : X × X → R – билинейная форма на векторном пространстве X и a = (a1 , ..., an )
– какой-нибудь базис в X, то матрицей билинейной формы α в базисе a = (a1 , ..., an )
называется матрица, определяемая формулой
Следствие 13.3.12. Для всякого фиксированного базиса a = (a1 , ..., an ) в векторном пространстве
X тождества
h x i⊤ hyi
α(x; y) = ·M · , x, y ∈ X (13.3.146)
a a
M = α[a; a] (13.3.147)
Теорема 13.3.13. Если a1 , ..., an и b1 , ..., bn – два базиса в векторном пространстве X, то для
всякой билинейной формы α на X справедливо равенство
⊤
b b
α[b, b] = · α[a, a] · (13.3.148)
a a
Доказательство.
⊤ !k Xn ⊤ ! k i X n i X n j
Ab Ab Ab Ab Ab Ab
· α[b; b] · = · α[b; b] · = · α[b; b]ij · =
b b i=1
b b l i=1
b k j=1
b l
l i
n
X i j Xn i j
Ab Ab (Ab)k (Ab)l
= α[b; b]ij · · = α[bi ; bj ] · · = (13.3.145) =
i,j=1
b k b l i,j=1
b b
Если a = (a1 , ..., an ) – строка элементов векторного пространства X и M ∈ Rnm – матрица, то,
напомним, формулой (13.3.115) мы определили внешнее действие матрицы M на строку векторов
a = (a1 , ..., an ):
a · M = (a1 , ..., an ) · M := a1 · M11 + ... + an · M1n , ..., a1 · Mm
1 n
+ ... + an · Mm
Теорема 13.3.15. Если a = (a1 , ..., an ) – базис векторного пространства X и M ∈ Rnn – обратимая
матрица, то матрица билинейной формы α в преобразованном базисе a · M = (a1 , ..., an ) · M имеет
вид:
α[a · M, a · M ] = M ⊤ · α[a, a] · M (13.3.150)
768 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
Доказательство.
X
m m
X
α[a · M, a · M ]ij = α (a · M )i , (a · M )j = (13.3.115) = α ak · Mik , al · Mjl =
k=1 l=1
!
m
X m
X m
X m
X m
X i k
= Mik · α(ak , al ) · Mjl = Mik · α[a; a]kl · Mjl = M⊤ k
· α[a, a] · M =
j
k=1 l=1 k=1 l=1 k=1
i
= M ⊤ · α[a, a] · M
j
(b) Определитель
Определитель матрицы, как полилинейная кососимметрическая форма.
• Определителем квадратной матрицы A порядка n называется число
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n (13.3.151)
σ∈Sn
Понятно, что любую матрицу N ∈ Rnm можно представить как строку из таких столбцов
N = [x1 , ..., xm ], xi ∈ Rn ,
det : Rn × ... × Rn → R
| {z }
n множителей
y y
⇓
2λ = 0
⇓
λ=0
770 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
Лемма 13.3.19. При перестановке аргументов кососимметрическая форма меняет знак в соот-
ветствии с четностью этой перестановки:
Доказательство. Это следует из теоремы 13.1.34: для транспозиций эта формула представляет со-
бой просто определение кососимметрической формы. А затем применяется индукция: если формула
(13.3.158) доказана для перестановок σ, которые можно разложить в композицию k транспозиций,
то добавляя еще одну транспозицию τ , мы получим:
f (xσ(τ (1)) , ..., xσ(τ (n)) ) = sgn σ · f (xτ (1) , ..., xτ (n) ) = sgn σ · sgn τ · f (x1 , ..., xn ) =
= (13.1.33) = sgn(σ ◦ τ ) · f (x1 , ..., xn )
n n
!
X X X
f (x1 , ..., xn ) = f xσ1 1 · eσ1 , ..., xσnn · eσn = xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
σ1 =1 σn =1 σ1 ,...,σn ∈{1,...,n}
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) + xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
| {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}
=
∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 13.3.18
↑
сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) = (13.3.158) = xσ1 1 · ... · xσnn · sgn σ · f (e1 , ..., en ) =
| {z }
σ∈Sn σ∈Sn
λ
X
=λ· sgn σ · xσ1 1 · ... · xσnn = λ · det[x1 , ..., xn ]
σ∈Sn
Правило Крамера.
Теорема 13.3.20. Для последовательности (a1 , ..., an ) ⊂ Rn числовых столбцов высотой n следу-
ющие условия эквивалентны:
§ 3. Матрицы и определители 771
(i) уравнение
[a1 , ..., an ] · x = b (13.3.159)
разрешимо в Rn при любой правой части b ∈ Rn ;
(ii) уравнение
[a1 , ..., an ] · x = 0 (13.3.160)
имеет только одно решение x = 0 ∈ Rn ;
(iii) столбцы a1 , ..., an линейно независимы (то есть образуют базис) в векторном простран-
стве Rn ;
(iv) определитель матрицы [a1 , ..., an ] отличен от нуля:
Лемма 13.3.21. Пусть a1 , ..., an , x, b ∈ Rn – числовые столбцы высотой n. Тогда если выполняется
равенство (13.3.159), то для всякого i = 1, ..., n справедливо равенство
x1 · a1 + ... + xn · an = b
Теперь вычислим определитель в правой части (13.3.163) (здесь неявно предполагается, что 1 6= i 6=
n, но нетрудно переписать выкладки для i = 1 и i = n):
0, det[a1 , ..., an ] 0,
по лемме 13.3.18, по лемме 13.3.18,
поскольку поскольку
a1 повторяется an повторяется
в аргументе дважды в аргументе дважды
= xi · det[a1 , ..., an ]
Доказательство теоремы 13.3.20. Заметим сразу, что здесь нужно только доказать эквивалент-
ность условий (i)-(iv), потому что из (iv) и формулы (13.3.163) сразу же следует формула (13.3.162).
(i)⇔(ii). Рассмотрим оператор A : Rn → Rn , действующий по формуле
Ax = [a1 , ..., an ] · x, x ∈ Rn .
x1 = ... = xn = 0.
Но это (в силу теоремы 13.2.3) как раз и есть условие линейной независимости векторов a1 , ..., an .
(iii)⇔(iv). 1. Пусть сначала столбцы a1 , ..., an линейно зависимы, то есть
для некоторого x 6= 0 ∈ Rn . Тогда по лемме 13.3.21 для любого i = 1, ..., n выполняется равенство
Поскольку x 6= 0, найдется индекс i такой, что xi 6= 0. Для него тоже верно (13.3.164). Значит,
det[a1 , ..., an ] = 0.
2. Пусть наоборот столбцы a1 , ..., an линейно независимы (то есть образуют базис) в Rn . Тогда
каждый базисный вектор ei представим в виде линейной комбинации векторов a1 , ..., an :
h e i1 h e in
i i
ei = · a1 + ... + · an
a a
x j
(напомним, что обозначения a вводились выше формулой (13.2.72)). Отсюда мы получаем такую
цепочку:
n h
" #
e1 iσ1
n h
X X en iσn
1 = det[e1 , ..., en ] = det · aσ1 , ..., · aσn = (13.3.154) =
σ =1
a σ =1
a
1 n
n
X h e iσ1 h e iσn
1 n
= · ... · · det[aσ1 , ..., aσn ] =
σ1 ,...,σn =1
a a
X h e iσ1 h e iσn X h e iσ1 h e iσn
1 n 1 n
= · ... · · det[aσ1 , ..., aσn ] + · ... · · det[aσ1 , ..., aσn ] =
a a a a | {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}
=
∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 13.3.18
↑
сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X h e1 iσ1 h e iσn
n
X h e1 iσ1 h e iσn
n
= ·...· ·det[aσ1 , ..., aσn ] = (13.3.158) = ·...· ·sgn σ·det[a1 , ..., an ] =
a a a a
σ∈Sn σ∈Sn
X h e iσ1 h e iσn hei
1 n
= det[a1 , ..., an ] · sgn σ · · ... · = det[a1 , ..., an ] · det
a a a
σ∈Sn
⇓
hei
1 = det[a1 , ..., an ] · det
a
det[a1 , ..., an ] 6= 0.
§ 3. Матрицы и определители 773
∃M −1 ⇐⇒ det M 6= 0
Доказательство. 1. Пусть матрица A треугольна, то есть Aji 6= 0 только если i > j. Тогда можно
показать, что в сумме (13.3.151) ненулевым будет только одно слагаемое, а именно, то, которое
соответствует тривиальной перестановке:
σ(1)
A1 6= 0
σ(1) = 1
σ(1) 6 1
Aσ(2) 6= 0
σ(2) = 2
σ(2) 6 2
σ(1) σ(2)
A1 · A2 · ... · Aσ(n)
n 6= 0 ⇐⇒ 2
⇐⇒ ⇐⇒
...
...
...
σ(n)
An 6= 0 σ(n) = n σ(n) 6 n
(13.3.169)
В этой цепочке лишь последняя эквивалентность требует некоторых объяснений. Она доказывается
последовательной расшифровкой условий σ(i) 6 i:
1) первое неравенство σ(1) 6 1, вместе с условием σ(1) ∈ N∗ сразу же дает σ(1) = 1;
2) после того, как мы это поняли, второе неравенство σ(2) 6 2 будет означать σ(2) = 2,
поскольку σ(2) ∈ N∗ и σ(2) 6= σ(1) = 1;
...
n) так по индукции мы к n-му шагу доказываем равенство σ(i) = i для любых i < n, и тогда
на n-м шаге неравенство σ(n) 6 n будет означать, что σ(n) = n, поскольку, σ(n) ∈ N∗ и
σ(n) 6= σ(i) = i при i = 1, ..., n − 1.
Из (13.3.169) следует, что в формуле (13.3.151) для матрицы A только одно слагаемое может быть
отлично от нуля – то, которое соответствует тождественной подстановке:
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n = sgn(1, 2, ..., n) ·A11 · A22 · ... · Ann = A11 · A22 · ... · Ann
| {z }
σ∈Sn
k
1
где
λ = f (e1 , ..., en ) = det[A · e1 , ..., A · en ] = det A · [e1 , ..., en ] = det(A · I) = det A (13.3.171)
| {z }
↑
единичная
матрица I
Поэтому
det(A·B) = det A·(B1 , ..., Bn ) = f (B1 , ..., Bn ) = (13.3.170) = λ·det(B1 , ..., Bn ) = (13.3.171) = det A·det B.
M = [a1 , ..., an ]
однозначно разрешимо в Rn при любой правой части b ∈ Rn . По теореме 13.3.20 это эквивалентно
тому, что определитель M отличен от нуля:
det M 6= 0.
Далее из равенства
I = M · M −1
1
det M −1 = = (det M )−1
det M
§ 3. Матрицы и определители 775
Определитель оператора.
• Пусть X – конечномерное векторное пространство, a = (a1 , ..., an ) – произвольный базис
в X, и A : X → X – произвольный оператор. Число
Aa
det A = det (13.3.172)
a
| {z }
↑
матрица оператора A
в базисе a
det I = 1 (13.3.173)
∃A−1 ⇐⇒ det A 6= 0,
Ax = λx.
Число λ при этом называется собственным значением для собственного вектора x оператора A.
fA (λ) = 0
⋄ 13.4.1. Из формулы (13.4.179) видно, что если метризацией формы η 1 ⊠· · ·⊠η m является форма
η 1 , . . . , η m – произвольная последовательность η 1 ⊓ · · · ⊓ η m :
длины m линейных функционалов на X, то сим-
Sym(η 1 ⊠ · · · ⊠ η m ) = η 1 ⊓ · · · ⊓ η m (13.4.188)
|k| = m = |l|,
справедливо равенство
⊓k (
k!
1 , k=l
(al ) = m! . (13.4.191)
a 0, k 6= l
1 X 1 σ(1) σ(m)
1
= · (aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) (13.4.192)
m! a a
ρ∈Sm
Пусть теперь k 6= l. Тогда ki 6= li для некоторого i ∈ {1, ..., n}, и поэтому при любом ρ ∈ Sm
(то есть чтобы перестановка ρ не меняла отображение τ ) и в этом случае все произведение будет
равно единице:
σ(1) σ(m)
1 1
(aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) = 1.
a a
Таких перестановок ρ, которые не меняют τ по теореме 13.1.32 имеется ровно k!. Поэтому вся сумма
в конце (13.4.192) будет равна k!.
X
1 X τk ρ(1)
X λk X X
0= λk · · η ⊠ ... ⊠ η τk ρ(m)
= · η τ (1) ⊠ ... ⊠ η τ (m) =
m! m!
|k|=m ρ∈Sm |k|=m τ ∈Rep(k) σ∈Sm : τ ◦σ=τ
X λk X
= · card{σ ∈ Sm : τ ◦ σ = τ } ·η τ (1) ⊠ ... ⊠ η τ (m) =
m! | {z }
|k|=m τ ∈Rep(k)
k (13.1.21)
k!
X λk X
= · k! · η τ (1) ⊠ ... ⊠ η τ (m)
m!
|k|=m τ ∈Rep(k)
Теперь мы получаем, что в последнем выражении векторы η τ (1) ⊠ ... ⊠ η τ (m) не повторяются (при
изменении k и τ ∈ Rep(k)). А по замечанию 13.2.28 векторы вида η i1 ⊠ ... ⊠ η im (is ∈ {1, ..., n})
образуют базис в пространстве L(X, ..., X) всех полилинейных форм степени m на X. Значит, век-
торы η τ (1) ⊠ ... ⊠ η τ (m) должны быть линейно независимы (при изменении k и τ ∈ Rep(k)). Значит,
равенство нулю суммы означает равенство нулю клоэффициентов:
λk
∀k · k! = 0.
m!
или
∀k λk = 0.
2. Теперь докажем полноту. Если ω – какая-нибудь симметрическая форма, то, поскольку в
силу замечания 13.2.28 формы вида η i1 ⊠ ... ⊠ η ik (is ∈ {1, ..., n}) образуют базис в L(X, ..., X), ω
представима как их линейная комбинация:
X
ω= λi1 ,...,im · η i1 ⊠ ... ⊠ η im
is ∈{1,...,n}
782 Глава 13. ЛИНЕЙНАЯ АЛГЕБРА
X ⊓k
1
ω= λk · .
a
k : {1, ..., n} → N :
|k| = m
То есть
m!
λl = · ω(al ).
l!
f (x) = λ, x∈X
является многочленом на X;
1) всякий линейный функционал f : X → R является многочленом на X;
2) если f : X → R и g : X → R – многочлены на X, то их произведение f ·g : X → R
тоже является многочленом на X;
3) если f : X → R и g : X → R – многочлены на X, то их сумма f + g : X → R
тоже является многочленом на X.
• Многочлен f : X → R называется однородным степени m, если выполняется тождество
f (λ · x) = λm · f (x), x ∈ X, λ ∈ R. (13.4.196)
называемую k-мономом последовательности η 1 , ..., η n . Понятно, что всякая такая функция явля-
ется однородным многочленом на X степени m = |k| (равной объему мультииндекса k).
12 Понятие мультииндекса было определено на с.721.
§ 4. Симметрические формы и однородные многочлены 783
@ : Pm (X ∗ ) → Σm (X)∗ .
и заметим, что это число не зависит от выбора σ ∈ Rep(k). Действительно, если σ ′ – какое-то другое
представление мультииндекса k, то от σ оно отличается некоторой перестановкой аргументов
σ ′ = σ ◦ υ, υ ∈ Sm .
Поэтому
"a #τ (1) "a #τ (m)
X h aσ′ (1) iτ (1) ha ′
σ (m)
iτ (m) X σ υ(1) σ υ(m)
· ... · = · ... · =
b b b b
τ ∈Rep(l) τ ∈Rep(l)
| {z }
если заменить τ на τ ◦ υ, то сумма не изменится
"a #τ υ(1) "a #τ υ(m)
X σ υ(1) σ υ(m) X h aσ(1) iτ (1) ha
σ(m)
iτ (m)
= · ... · = · ... ·
b b b b
τ ∈Rep(l) τ ∈Rep(l)
| {z }
k
ha iτ (1) ha iτ (m)
σ(1) σ(m)
b · ... · b
n
X ha ij1 ha ijn
σ(1) σ(1)
= · ... · · bj1 · ... · bjn =
j1 ,...,jn =1
b b
X X h aσ(1) iτ (1) ha
σ(1)
iτ (n) X h ak il
= · ... · · bτ (1) , ..., bτ (m) = · bl
b b b
|l|=m τ ∈Rep(l) |l|=m
Отсюда следует, что если многочлен f раскладывается по базису a формулой (13.4.200), то в раз-
ложении по базису b он принимает вид
X X X h ak il X X h a il
k
X
f= λk · ak = λk · · bl = λk · · bl = µl · b l
b b
|k|=m |k|=m |l|=m |l|=m |k|=m |l|=m
где
X h a il
k
µl = λk · .
b
|k|=m
Если теперь обозначить символами @a f (ω) и @b f (ω) действия многочлена f на форму ω опреде-
ленные правилом (13.4.201) примененном к базисам a и b соответственно,
X X
@a f (ω) = λk · ω(ak ), @b f (ω) = λl · ω(bl ).
|k|=m |l|=m
X n
X ha ij1 ha ijn
σ(1) σ(1)
= λk · · ... · · ω(bj1 , ..., bjn ) =
j1 ,...,jn =1
b b
|k|=m
X X X h aσ(1) iτ (1) ha
σ(1)
iτ (n)
= λk · · ... · · ω(bτ (1) , ..., bτ (m) ) =
b b
|k|=m |l|=m τ ∈Rep(l)
X X h a il X
k
= λk · · ω(bl ) = µl · ω(bl ) = @b f (ω).
b
|l|=m |k|=m |l|=m
§ 4. Симметрические формы и однородные многочлены 785
2. Пусть ω 6= 0. Тогда эта форма отлична от нуля на какой-то последовательности aσ(1) , ..., aσ(m)
базисных векторов:
ω(aσ(1) , ..., aσ(m) ) 6= 0.
Последовательность σ(1), ..., σ(m) является представлением некоторого мультииндекса k, и поэтому
мы получаем
ω(ak ) 6= 0.
То есть @f (ω) 6= 0 при f = ak .
3. Наоборот, пусть f 6= 0. По тореме 13.4.4 многочлен f раскладывается по базису ak :
X
f= λk · ak .
|k|=m
X X l l
1 1
@f (ω) = λk · ω(ak ) = λk · (ak ) = (13.4.191) = λl · (al ) = λl · l! 6= 0.
a a
|k|=m |k|=m
• Отображение X X
Π:f = λk · η k 7→ ω= λk · η ⊓k (13.4.204)
|k|=m |k|=m
Π(η k ) = η ⊓k .
и отмечается, что они не зависят от выбора представления σ ∈ Rep(k). Отсюда следует, что если
многочлен f раскладывается по базису η k формулой (13.4.203), то в разложении по базису θl он
принимает вид X X
f= λk · η k = µl · θ l (13.4.207)
|k|=m |l|=m
где
X ηk
µl = λk · .
θ l
|k|=m
Если теперь для многочлена (13.4.207) обозначить символом Πη (f ) форму, определенную правилом
(13.4.204), а символом Πθ (f ) форму, определенную тем же правилом (13.4.204), но а заменой η на
θ, X X
Πη (f ) = λk · η ⊓k , Πθ (f ) = µl · θ⊓l ,
|k|=m |l|=m
X n
X σ(1)
η η σ(1)
= λk · · ... · · θj1 ⊓ ... ⊓ θjn =
j1 ,...,jn =1
θ j1 θ jn
|k|=m
X X X η σ(1) σ(1)
η
= λk · · ... · · θτ (1) ⊓ ... ⊓ θτ (m) =
θ τ (1) θ τ (n)
|k|=m |l|=m τ ∈Rep(l)
X X l X
ηk
= λk · · θl = µl · θl = Πθ (f ).
θ
|l|=m |k|=m |l|=m
ω(x, ..., x) = η ⊓k (x, ..., x) = (13.4.190) = (η σ(1) ⊓ ... ⊓ η σ(m) )(x, ..., x) = (13.4.178) =
1 X
= · η σ(τ (1)) (x) · ... · η σ(τ (m)) (x) = η k (x) = Π −1 (η ⊓k )(x) = Π −1 (ω)(x)
m! | {z }
τ ∈Sm
k
η σ(1) (x) · ... · η σ(m) (x)
k
η k (x)
X × ... × X
t ❏❏
⊔m tt
tt ❏❏
❏❏ ϕ
ttt ❏❏
❏❏ .
ttt ❏❏
zt ❏$
Pm (X ∗ ) ❴ ❴ ❴ ❴ ❴ ❴ ⊔❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ
ψ : Y ∗ → Σm (X).
ψ ∗ : Σm (X)∗ → Y ∗∗ .
ψ∗
Σm (X)∗ / Y ∗∗
O
@ ι=1
Pm (X) ⊔
/Y
ϕ
⇓
⊔
ϕ ⊔m (x1 , ..., xm ) = ϕ(x1 , ..., xm )
⇓
⊔
ϕ ◦ ⊔m = ϕ.