Вы находитесь на странице: 1из 119

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ

ФЕДЕРАЦИИ

УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ


УНИВЕРСИТЕТ

В. А. Густомесов

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

Учебное пособие

Екатеринбург 2005
УДК 517.5

ББК 22.162

НАУЧНЫЙ РЕДАКТОР:
доктор физико-математических наук, профессор Т. Ф. Филиппова

РЕЦЕНЗЕНТ:
доктор физико-математических наук Б. И. Ананьев

Густомесов В. А. Функции нескольких переменных. Учебное пособие / Урал. гос.


пед. ун-т. – Екатеринбург, 2005. – 118 с.

ISBN

Излагается раздел «Функции нескольких переменных», входящий в базовый курс


математического анализа. Изложение базируется на теории функций одной переменной
и на теории функций на метрических пространствах. Предназначено для студентов
дневного и заочного отделений математических факультетов педагогических вузов.

Библиогр.: 10 назв.
Оглавление

Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1 Функции на метрических пространствах 5


1.1 Определение метрического пространства. Шары и сферы . . . . . . . . . 5
1.2 Линейные нормированные пространства, их связь с метрическими про-
странствами . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Евклидовы пространства, их связь с линейными нормированными и мет-
рическими пространствами . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Открытые и замкнутые множества в метрических пространствах . . . . . 13
1.5 Предел последовательности точек метрического пространства . . . . . . 17
1.5.1 Определение и свойства . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.2 Смысл сходимости в пространстве Rm . . . . . . . . . . . . . . . . 19
1.5.3 Смысл сходимости в пространстве C[a, b] . . . . . . . . . . . . . . . 21
1.5.4 Критерий предельной точки . . . . . . . . . . . . . . . . . . . . . . 22
1.6 Предел функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.7 Непрерывность функции. Локальные свойства непрерывных функций . . 26
1.8 Глобальные свойства непрерывных функций . . . . . . . . . . . . . . . . . 28
1.8.1 Функции, непрерывные на линейно связных множествах . . . . . . 28
1.8.2 Функции, непрерывные на компактных множествах . . . . . . . . 29

2 Дифференциальное исчисление функций нескольких переменных 33


2.1 Приращение функции. Определение непрерывности функции на языке
приращений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2 Частные производные . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2.1 Частные производные первого порядка . . . . . . . . . . . . . . . 34
2.2.2 Частные производные высших порядков . . . . . . . . . . . . . . . 35
2.3 Дифференцируемость функции . . . . . . . . . . . . . . . . . . . . . . . . 38
2.3.1 Дифференцируемость и дифференциал . . . . . . . . . . . . . . . 38
2.3.2 Необходимые условия дифференцируемости . . . . . . . . . . . . 40
2.3.3 Достаточные условия дифференцируемости . . . . . . . . . . . . . 41
2.4 Геометрический и физический смысл частных производных первого по-
рядка. Геометрический смысл дифференцируемости и дифференциала . 42
2.5 Вычисление производных и частных производных сложных функций . . 43
2.6 Дифференциалы функции нескольких переменных . . . . . . . . . . . . . 45
2.7 Формула Тейлора для функции нескольких переменных . . . . . . . . . . 49
2.8 Производная функции нескольких переменных по направлению . . . . . 52
2.9 Экстремумы функции нескольких переменных, необходимые условия экс-
тремума . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.10 Достаточные условия экстремума . . . . . . . . . . . . . . . . . . . . . . . 55

3
2.11 Нахождение наименьшего и наибольшего значений функции нескольких
переменных на компактном множестве . . . . . . . . . . . . . . . . . . . . 58
2.12 Неявные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.12.1 Неявные функции одной и нескольких переменных . . . . . . . . . 59
2.12.2 Системы неявных функции нескольких переменных . . . . . . . . 62
2.13 Условные экстремумы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

3 Кратные интегралы 66
3.1 Квадрируемые фигуры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2 Определение двойного интеграла . . . . . . . . . . . . . . . . . . . . . . . 68
3.3 Существование двойного интеграла . . . . . . . . . . . . . . . . . . . . . . 70
3.4 Свойства двойного интеграла . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.5 Вычисление двойного интеграла сведением к повторному . . . . . . . . . 75
3.6 Замена переменных в двойных интегралах . . . . . . . . . . . . . . . . . 79
3.7 Геометрический смысл двойного интеграла . . . . . . . . . . . . . . . . . 82
3.8 Тройные интегралы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.9 Приложения кратных интегралов . . . . . . . . . . . . . . . . . . . . . . . 86
3.9.1 Вычисление площадей плоских фигур и объемов тел . . . . . . . . 86
3.9.2 Определение и вычисление площади поверхности . . . . . . . . . 86
3.9.3 Физические приложения кратных интегралов . . . . . . . . . . . . 89

4 Криволинейные интегралы 92
4.1 Криволинейные интегралы первого рода . . . . . . . . . . . . . . . . . . . 92
4.1.1 Определение криволинейного интеграла первого рода . . . . . . . 92
4.1.2 Существование и вычисление криволинейного интеграла первого
рода . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.1.3 Физические приложения криволинейных интегралов первого рода 95
4.2 Определение, свойства, существование криволинейных интегралов второ-
го рода . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.3 Физический смысл криволинейных интегралов второго рода . . . . . . . 101
4.4 Формула Грина . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.5 Выражение площади плоской фигуры в прямоугольных и криволинейных
координатах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.6 Условия независимости криволинейного интеграла от пути интегрирования107
4.7 Первообразная дифференциальной формы, ее физический смысл . . . . 111

4
Предисловие
Учебное пособие «Функции нескольких переменных» предназначено для студентов
очного и заочного отделений математических факультетов педагогических вузов. В
нем излагаются разделы базового курса математического анализа, посвященные диф-
ференциальному и интегральному исчислению функций нескольких действительных
переменных. Пособие соответствует государственному стандарту подготовки специали-
стов (специальность 032100 «Математика»). При написании книги использован опыт
автора по преподаванию курса математического анализа на математическом факуль-
тете Уральского государственного педагогического университета.
Студенты педвузов изучают многомерный математический анализ сразу после зна-
комства с одномерным анализом. Идеология обеих ветвей одинакова: математический
анализ иcследует функции различной природы методом пределов. Однако многомер-
ность делает изложение многих вопросов существенно сложнее.
В первой главе пособия рассмотрена теория предела и непрерывности функций,
заданных на метрических пространствах. Вторая глава посвящена дифференциаль-
ному исчислению функций нескольких переменных. Значительное внимание уделено
экстремальным задачам (локальные экстремумы, глобальные экстремумы на компакт-
ных множествах, условные экстремумы). В третьей и четвертой главах рассмотрены
двойные и криволинейные интегралы соответственно. Для углубленного изучения ма-
териала можно рекомендовать учебники [1]-[7] и методическую разработку [8]. Задачи
по данному разделу можно найти в книгах [9, 10].
Автор признателен научному редактору д. ф.-м. н., проф. Т. Ф. Филипповой и ре-
цензенту д. ф.-м. н. Б. И. Ананьеву за внимание к работе и ценные замечания.

5
Глава 1

Функции на метрических
пространствах

Читатель, открывая эту книгу, уже познакомился с первым большим разделом клас-
сического математического анализа, связанным с функциями одной переменной. Впере-
ди — рассмотрение еще одного классического раздела, посвященного изучению функ-
ций нескольких переменных. Однако перед этим мы изучим важную, более общую главу
современного анализа — основы теории метрических (в частности, линейных нормиро-
ванных) пространств, а также функций, аргументами и значениями которых являются
элементы таких пространств 1 . Здесь мы поставим целью обобщить теорию предела и
непрерывности, построенную применительно к функциям одной переменной, на доста-
точно широкий класс функций f : X → Y 2 . Поскольку названная теория базируется на
понятии предела, которое вводится, исходя из понятия расстояния между точками, то
предварительно вводятся и изучаются метрические пространства (МП), наделенные
отношением расстояния между их элементами. Мы выделим важный класс МП – ли-
нейные нормированные пространства (ЛНП) и, в частности, евклидовы пространства
– ЛНП со скалярным произведением. Все эти пространства вводятся аксиоматически.
Используется геометрическая терминология, понимаемая обобщенно.
Теория метрических пространств в основном была построена в первые десятилетия
XX века. Определение метрического пространства дано Фреше 3 в 1906 году.

1.1 Определение метрического пространства. Шары и


сферы

Определение 1.1. Пусть X — непустое множество и на нем задана функция ρ


(ρ : X × X → R) со следующими свойствами:
10 . ∀ x, y ∈ X ρ(x, y) > 0, ρ(x, y) = 0 ⇔ x = y (аксиома неотрицательности
метрики);
20 . ∀ x, y ∈ X ρ(x, y) = ρ(y, x) (аксиома симметрии);
1
Напомним, что классический этап развития математического анализа как науки в основном завер-
шился в XIX веке, современный этап охватывает более позднее время.
2
Эта символика означает, что рассматриваемая функция f имеет область определения X, а ее зна-
чения содержатся во множестве Y ; функция не обязательно инъективна.
3
Морис Фреше (Maurice Rene Frechet, 1878-1973) — французский математик.

6
30 . ∀ x, y, z ∈ X ρ(x, z) 6 ρ(x, y) + ρ(y, z) (аксиома треугольника).
Тогда пара (X, ρ) называется метрическим пространством. Множество X называется
носителем метрического пространства (X, ρ), его элементы — точками этого простран-
ства. Число ρ(x, y) называют метрикой (расстоянием) между точками x, y.
Замечание 1.1. На множестве X можно задать разные метрики; поэтому возможны
различные МП с одним носителем.
Замечание 1.2. Если (X, ρ) — метрическое пространство и X1 ⊂ X, то пара (X1 , ρ)
также образует метрическое пространство.
Задание 1.1. Доказать, что свойство

∀ x, y ∈ X ρ(x, y) > 0 (1.1)

вытекает из аксиомы 30 треугольника.


Задание 1.1 показывает, что стандартная система аксиом метрического пространства
несколько избыточна.
Пример 1.1. X = R, ρs (x, y) = |x − y|.
Убедимся, что (R, ρs ) — метрическое пространство. Запишем аксиому 10 в нашем
случае:
∀ x, y ∈ R |x − y| > 0, |x − y| = 0 ⇔ x = y.
Но это прямо следует из свойств модуля вещественного числа.
На свойствах модуля основывается проверка и остальных аксиом. Действительно,

20 . ∀ x, y ∈ R |x − y| = |y − x|;

30 . ∀ x, y, z ∈ R |x − z| 6 |x − y| + |y − z|. •
Метрика ρs нам уже знакома; будем ее называть стандартной метрикой, заданной
на числовой прямой R.
Задание 1.2. X 6= ∅ — произвольное непустое множество,
½
0, если x = y ,
ρt (x, y) = (1.2)
1, если x 6= y .

(тривиальная метрика). Доказать, что пара (X, ρt ) образует МП.


Замечание 1.3. Любое непустое множество может быть носителем метрического
пространства.
Дадим ряд необходимых определений.
Пусть x0 ∈ X, ε > 0.
Определение 1.2. Открытым шаром с центром в точке x0 радиуса ε, или
ε−окрестностью точки x0 называется множество

U (x0 , ε) : = {x ∈ X| ρ(x, x0 ) < ε}.

Определение 1.3. Замкнутым шаром с центром в точке x0 радиуса ε называется


множество
U (x0 , ε) : = {x ∈ X| ρ(x, x0 ) 6 ε}.
Определение 1.4. Сферой с центром в точке x0 радиуса ε называется множество

S(x0 , ε) : = U (x0 , ε) \ U (x0 , ε) = {x ∈ X| ρ(x, x0 ) = ε}.

7
В дальнейшем мы введем в метрических пространствах открытые и замкнутые мно-
жества и убедимся, что открытый (замкнутый) шар — открытое (замкнутое) множе-
ство.
Структура шаров и сфер в различных метрических пространствах существенно раз-
лична; она зависит как от носителя X, так и от выбранной на нем метрики ρ. Для любо-
го метрического пространства (X, ρ) справедливы включения (необязательно строгие)

U (x0 , ε) ⊂ U (x0 , ε), S(x0 , ε) ⊂ U (x0 , ε),

при ε1 < ε2 U (x0 , ε1 ) ⊂ U (x0 , ε2 ), U (x0 , ε1 ) ⊂ U (x0 , ε2 ).

1.2 Линейные нормированные пространства, их связь


с метрическими пространствами

Часто в математической практике приходится работать с линейными (векторными)


пространствами X. Напомним определение линейного пространства над произволь-
ным полем K.
Определение 1.5. Линейным (векторным) пространством над полем K называется
множество X, состоящее из элементов, называемых векторами, в котором определены
операции сложения элементов и умножения элементов на числа из поля K, удовлетво-
ряющие следующим условиям (x, y, z ∈ X, α, β ∈ K) :
1) x + y = y + x;
2) (x + y) + z = x + (y + z);
3) существует нулевой вектор θ ∈ X такой, что ∀ x ∈ X x + θ = x;
4) для любого вектора x существует противоположный ему вектор y такой, что x+ y = θ;
5) 1 · x = x;
6) α(βx) = (αβ)x;
7) (α + β)x = αx + βx;
8) α(x + y) = αx + αy.
Будем рассматривать линейные пространства над полем действительных чисел R.
Убедимся, что линейное пространство X становится метрическим, если удается вве-
сти норму (длину) ||x|| элементов пространства.
Определение 1.6. Говорят, что на линейном пространстве X задана норма, если
каждому элементу x ∈ X сопоставлено вещественное число ||x|| такое, что
1) ∀ x ∈ X ||x|| > 0; ||x|| = 0 ⇔ x = θ (неотрицательность нормы);
2) ∀ x ∈ X ∀ λ ∈ R ||λx|| = |λ| · ||x|| (однородность нормы);
3) ∀ x, y ∈ X ||x + y|| 6 ||x|| + ||y|| (неравенство треугольника).
В этом случае число ||x|| называют нормой элемента x ∈ X, пару (X, ||x||) — линей-
ным нормированным пространством (ЛНП).

Теорема 1.1 Линейное нормированное пространство становится метрическим, если


положить
ρ(x, y) : = ||x − y||. (1.3)

Доказательство. Проверим, что из аксиом 1)-3) ЛНП и формулы (1.3) вытекают ак-
сиомы 10 − 30 МП.
1) 1)
10 . ρ(x, y) = ||x − y|| > 0, ρ(x, y) = 0 ⇔ ||x − y|| = 0 ⇔ x − y = θ ⇔ x = y.

8
2)
20 . ρ(y, x) = ||y − x|| = || − 1 · (x − y)|| = | − 1| · ||x − y|| = ρ(x, y).
3)
30 . ρ(x, z) = ||x − z|| = ||x − z ∓ y|| = ||(x − y) + (y − z)|| 6 ||x − y|| + ||y − z|| =
ρ(x, y) + ρ(y, z). •
Отметим следующие свойства метрики (1.3):
1. ρ(x, θ) = ||x||, то есть ||x|| — расстояние между x, θ;
2. a) ∀ x, y, a ∈ X ∀ λ ∈ R ρ(x + a, y + a) = ρ(x, y); b) ρ(λx, λy) = |λ| · ρ(x, y).
Следствие 1.1. ∀ x0 ∈ X ∀ ε > 0 U (x0 , ε) = {x0 + x |x ∈ U (θ, ε)}.
Доказательство вытекает из равенства ρ(x, x0 ) = ρ(x−x0 , θ) и определения окрест-
ности точки.
Следствие 1.2. ∀ ε > 0 ∀ λ > 0 U (θ, λε) = {λ · x|x ∈ U (θ, ε)}.
Таким образом, окрестности точек в ЛНП имеют одинаковую структуру. Можно
поэтому рассматривать, например, окрестность θ.
Пример 1.1 (продолжение). Вернемся к МП (R, ρs ). R — линейное простран-
ство, введем в нем норму
||x|| : = |x|. (1.4)
Справедливость аксиом 1)-3) сразу следует из свойств модуля. Применив теорему 1.1,
приходим к нашему МП (R, ρs ). Таким образом, стандартная метрика на числовой пря-
мой порождена нормой (1.4).
Рассмотрим важное для дальнейшего линейное пространство Rn (n > 1) n-мерных
векторов (n-ок) вещественных чисел над полем R. Пусть

x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn .

Напомним, что операции сложения и умножения на скаляр в пространстве Rn вводятся


покоординатно:

x + y : = (x1 + y1 , . . . , xn + yn ), λx : = (λx1 , . . . , λxn ).

Рассмотрим две различные нормы в пространстве Rn — кубическую ||x||C и евклидову


||x||E (вторую норму определим ниже с использованием другого понятия, см. пример
1.4).
Пример 1.2. (пространство Rn с кубической нормой). Пусть

||x||C : = max |xi |. (1.5)


16i6n

Убедимся в справедливости свойств нормы, используя свойства максимума.

1) max |xi | > 0; max |xi | = 0 ⇔ |xi | = 0 (1 6 i 6 n) ⇔ x = θ.


16i6n 16i6n

2) ||λx|| = max |λxi | = |λ| max |xi | = |λ| · ||x||C .


16i6n 16i6n

3) Вначале зафиксируем произвольно индекс i, 1 6 i 6 n и оценим по модулю i-ую


координату n−ки x + y :

|xi + yi | 6 |xi | + |yi | 6 max |xi | + max |yi | = ||x||C + ||y||C .


16i6n 16i6n

Мы видим, что каждое из чисел

|xi + yi | (1 6 i 6 n) (1.6)

9
не превышает величины ||x||C + ||y||C . Поэтому и наибольшее из чисел (1.6) не превы-
шает ее:
(1.5)
max |xi + yi | = ||x + y||C 6 ||x||C + ||y||C .
16i6n
n
Таким образом, (R , ||x||C ) — линейное нормированное пространство. Оно порождает
метрическое пространство (Rn , ρC ), где

ρC (x, y) = max |xi − yi |. (1.7)


16i6n

Определим в этих пространствах вид шаров и сфер.


Пусть вначале n = 2, тогда пространство Rn = R2 можно интерпретировать как
множество точек плоскости. Выделим сферу S(θ, ε) = {x ∈ R2 | max{|x1 |, |x2 |} = ε} с
центром в начале координат θ. Условие |x1 | = |x2 | определяет на плоскости биссек-
трисы координатных углов x2 = ±x1 . Они разбивают плоскость на 4 множества (уг-
ла). При этом |x1 | > |x2 | в двух углах, примыкающих к оси x1 , и |x1 < |x2 | в двух
других углах. Проводя в первых двух углах отрезки |x1 | = ε, а в остальных углах
— отрезки |x2 | = ε соответственно, убеждаемся, что сфера S(θ, ε) представляет собой
квадрат с центром в точке θ со сторонами длиной 2ε, параллельными координатным
осям. Но тогда открытый шар U (θ, ε) — внутренность этого квадрата, а при перехо-
де к замкнутому шару U (θ, ε) добавляется и сам квадрат. Если же взять множества
S(x0 , ε), U (x0 , ε), U (x0 , ε), то, в силу следствий 1.1- 1.2 они отличаются от уже рас-
смотренных множеств S(θ, ε), U (θ, ε), U (θ, ε) лишь тем, что их центром будет точка x0 ,
а не θ.
Вообще, в пространстве (Rn , ||x||C ) (n > 2) сфера S(x0 , ε) — n-мерный куб с ребра-
ми длиной 2ε, грани которого параллельны координатным плоскостям, открытый шар
U (x0 , ε) — внутренность этого куба, замкнутый шар U (x0 , ε), помимо точек открытого
шара, включает и сам куб. Удобно иметь и аналитические описания этих множеств.
Пусть x0 = (x01 , . . . , x0n ), тогда

S(x0 , ε) = {x ∈ Rn | |xi − x0i | = ε, 1 6 i 6 n};

U (x0 , ε) = {x ∈ Rn | |xi − x0i | < ε, 1 6 i 6 n};


U (x0 , ε) = {x ∈ Rn | |xi − x0i | 6 ε, 1 6 i 6 n}.
Существенной особенностью пространства Rn с кубической нормой (метрикой ) яв-
ляется однотипность вхождения в шары и сферы всех координат xi их точек. Поэтому,
если n = m + k, m, k ∈ N, то
Rn = Rm × Rk
4
и

S(a, ε)×S(b, ε) = S((a, b), ε); U (a, ε)×U (b, ε) = U ((a, b), ε); U (a, ε)×U (b, ε) = U ((a, b), ε).

Здесь a ∈ Rm , b ∈ Rk . Таким образом, декартово произведение сфер, открытых и


замкнутых шаров точек a ∈ Rm , b ∈ Rk радиуса ε есть соответственно сфера, от-
крытый и замкнутый шар радиуса ε точки (a, b) ∈ Rm+k . •
Сейчас рассмотрим очень важный пример функционального ЛНП, элементами (точ-
ками) которого являются функции.
Пример 1.3. (пространство C[a,b] функций, непрерывных на отрезке [a,b],
с чебышевской нормой). Пусть X = X[a, b] — множество функций, непрерывных на
4
Полагаем R1 = R.

10
[a, b]. Оно представляет собой линейное пространство над полем R : если x = x(t), y =
y(t) — элементы множества X[a, b], то
x + y = (x + y)(t) : = x(t) + y(t), λx : = λx(t);
нулевой элемент θ = 0 — функция, равная нулю в точках отрезка. Докажем, что ли-
нейное пространство X[a, b] становится нормированным, если положить
||x|| : = max |x(t)|. (1.8)
t∈[a,b]

Прежде всего, для всякой непрерывной на отрезке [a, b] функции x(t) число
max |x(t)| существует (по теореме Вейерштрасса, обосновать!).
t∈[a,b]
Справедливость аксиом нормы 1)-3) следует из свойств модуля и операции нахож-
дения максимума множества.
1) ||x(t)|| = max |x(t)| > 0; max |x(t)| = 0 ⇔ ∀ t ∈ [a, b] |x(t)| = 0 ⇔
t∈ [a,b] t∈ [a,b]
∀ t ∈ [a, b] x(t) = 0 ⇔ x = θ.
2) ∀λ ∈ R ||λ · x|| = max |λx(t)| == |λ| · max |x(t)| = |λ| · ||x||.
t∈[a,b] t∈[a,b]
3) Зафиксируем произвольно точку t ∈ [a, b] и оценим сверху |x(t) + y(t)| :
|x(t) + y(t)| 6 |x(t)| + |y(t)| 6 max |x(t)| + max |y(t)| = ||x|| + ||y||.
t∈[a,b] t∈[a,b]

Так как непрерывная функция |x(t) + y(t) принимает в некоторой точке t0 ∈ [a, b]
наибольшее значение (почему?), то
max |x(t) + y(t)| = |x(t0 ) + y(t0 )| 6 ||x|| + ||y||
t∈[a,b]

и, значит, ||x + y|| 6 ||x|| + ||y||.


Таким образом, (X[a, b], ||x||) — ЛНП. Его обозначают символом C[a, b]. Как следует
из формулы (1.8), чебышевская норма функции есть наибольшее отклонение от нуля
функции x(t) на отрезке [a, b] 5 .
Конечно, пространство C[a, b] является и метрическим, с метрикой
ρ(x, y) = max |x(t) − y(t)|. (1.9)
t∈[a,b]

Расстояние между функциями x(t), y(t) в пространстве C[a, b] есть наибольшее откло-
нение функции x(t) от функции y(t) на отрезке [a, b].
Укажем геометрический смысл шаров и сфер в пространстве C[a, b]. Пусть
x0 (t) ∈ C[a, b], ε > 0. Рассмотрим на плоскости (t, x) ε-полоску
Π(x0 , ε) : = {(t, x) ∈ R2 | t ∈ [a, b], |x − x0 (t)| < ε}
и замкнутую ε-полоску
Π(x0 , ε) : = {(t, x) ∈ R2 | t ∈ [a, b], |x − x0 (t)| 6 ε}
графика функции x0 (t). Открытый шар U (x0 , ε) (замкнутый шар U (x0 , ε)) составлен
из непрерывных функций, графики которых содержатся в Π(x0 , ε) (Π(x0 , ε) ). Сфера
S(x0 , ε) образована теми функциями из Π(x0 , ε), графики которых пересекаются хотя
бы с одной из граничных кривых x = x0 (t) ± ε, t ∈ [a, b]. •
5
Русский математик П.Л.Чебышев (1821-1894) за несколько десятилетий до построения теории мет-
рических и линейных нормированных пространств применял величину ||x|| при изучении вопросов
аппроксимации функций.

11
1.3 Евклидовы пространства, их связь с линейными
нормированными и метрическими пространства-
ми

Рассмотрим важный способ введения нормы в ЛНП — через скалярное произведе-


ние.
Определение 1.7. Говорят, что на линейном пространстве X над полем R зада-
но скалярное произведение, если определена функция, сопоставляющая каждым двум
элементам x, y из X вещественное число (x, y) так, что выполнены следующие условия
(аксиомы скалярного произведения):
a) ∀ x ∈ X (x, x) > 0; (x, x) = 0 ⇔ x = θ;
b) ∀ x, y ∈ X (x, y) = (y, x);
c) ∀ λ ∈ R ∀ x, y ∈ X (λx, y) = λ · (x, y);
d) ∀ x, y, z ∈ X (x + y, z) = (x, z) + (y, z).
Линейное пространство со скалярным произведением называют евклидовым.
В дальнейшем окажутся полезными следующие следствия аксиом евклидового про-
странства:
Следствие 1.3. ∀ x ∈ X (θ, x) = 0.
Следствие 1.4. ∀ λ, µ ∈ R ∀ x, y, z ∈ X (λx + µy, z) = λ(x, z) + µ(y, z),
(x, λy + µz) = λ(x, y) + µ(x, z).
c)
Доказательство следствия 1.3. 0 · x = θ, (θ, x) = (0 · x, x) = 0 · (x, x) = 0.
Задание 1.3. Доказать следствие 1.4.
Теорема 1.2 В любом евклидовом пространстве X справедливо неравенство Коши-
Буняковского
∀ x, y ∈ X (x, y)2 6 (x, x) · (y, y). (1.10)
Доказательство. 1) Как вытекает из следствия 1.3, при x = θ неравенство (1.10)
верно: (θ, y)2 = 0 6 0 · (y, y) = 0.
2) Зафиксируем произвольно x, y ∈ X, x 6= θ и рассмотрим функцию относительно λ

ϕ(λ) : = (λx + y, λx + y).

Она представляет собой квадратный трехчлен: по следствию 1.4

ϕ(λ) = (x, x) · λ2 + 2(x, y) · λ + (y, y),


a) a)
но (x, x) 6= 0. С другой стороны, ϕ(λ) > 0. Поэтому дискриминант квадратного трехчле-
на неположителен: 4((x, y)2 −4(x, x)·(y, y)) 6 0. Отсюда и следует требуемое неравенство
(1.10). •

Теорема 1.3 Евклидово пространство X становится нормированным, если поло-


жить p
∀ x ∈ X ||x|| : = (x, x). (1.11)

Доказательство. Проверим для функции (1.11) справедливость аксиом 1)-3) нормы,


при этом последняя проверка потребует привлечения неравенства Коши-Буняковского.
p a) p a)
1) (x, x) > 0; (x, x) = 0 ⇔ x = θ.

12
p p
2) ||λx|| = (λx, λx) = λ2 (x, x) = |λ| · (x, x) = |λ| · ||x||.
3) Вначале оценим сверху
· (1.10) p
¸
2 (1.11)
p
||x+y|| = (x+y, x+y) = (x, x)+2(x, y)+(y, y) = (x, y) 6 |(x, y)| 6 (x, x) · (y, y) 6

p p ³p p ´2
6 (x, x) + 2 (x, x) · (y, y) + (y, y) = (x, x) + (y, y) = (||x|| + ||y||)2 ,

откуда и следует справедливость аксиомы 3). •


В условиях последней теоремы мы будем говорить, что норма (1.11) порождена ска-
лярным произведением. В свою очередь, по теореме 1.1 эта норма определяет метрику
p
ρ(x, y) = (x − y, x − y). (1.12)

Пример 1.4. Введем в пространстве Rn скалярное произведение формулой


n
X
(x, y) : = xi y i . (1.13)
i=1

Справедливость аксиом легко проверяется (сделать это!). Запишем неравенство Коши-


Буняковского (1.10) для нашего евклидова пространства:
à n !2 n n
X X X
xi yi 6 x2i · yi2 .
i=1 i=1 i=1

Согласно теоремам 1.3, 1.1, мы приходим к нормированному, а также к метрическо-


му пространствам с евклидовой нормой
v
u n
uX
||x||E = t x2i (1.14)
i=1

и евклидовой метрикой v
u n
uX
ρE (x, y) = t (xi − yi )2 . (1.15)
i=1

Теперь шары и сферы имеют «привычный» вид. Именно, в МП (Rn , ρE ) U (x0 , ε) —


n-мерный шар, U (x0 , ε) — его внутренность, S(x0 , ε) − n-мерная сфера. У всех этих
множеств центром является точка x0 , радиусом — число ε. •
Пример 1.5. Введем в линейном пространстве X[a, b] непрерывных на отрезке [a, b]
функций (см. пример 1.3) скалярное произведение
Z b
(x, y) : = x(t)y(t) dt.
a

Справедливость аксиом скалярного произведения проверяется. Неравенство Коши-


Буняковского теперь запишется через интегралы:
µZ b ¶2 Z b Z b
2
x(t)y(t) dt 6 x (t) dt · y 2 (t) dt.
a a a

13
Укажем метрику, отвечающую нашему евклидову пространству:
Z b
ρ1 (x, y) = (x(t) − y(t))2 dt. (1.16)
a

В метрическом пространстве (X[a, b], ρ1 ) близкими будут функции, для которых инте-
гралы (1.16) близки (ср. пример 1.3 ). •
Замечание 1.4. Мы выделили важные классы метрических пространств – линей-
ные нормированные пространства, евклидовы пространства. В свою очередь, метриче-
ские пространства входят в более общую совокупность топологических пространств [7,
с. 18].

1.4 Открытые и замкнутые множества в метрических


пространствах

Введем несколько важных понятий, связанных с множествами в метрических про-


странствах (некоторые из них рассматривались ранее применительно к МП (R, ρs )).
Пусть (X, ρ) — метрическое пространство, A ⊂ X, x0 ∈ X (в некоторых случаях
x0 ∈ A, обращайте на это внимание!).
Определение 1.8. Проколотой ε−окрестностью точки x0 ∈ X называется множе-
ство ◦
U (x0 , ε) : = U (x0 , ε) \ {x0 } = {x ∈ X| 0 < ρ(x, x0 ) < ε}.
Определение 1.9. Точка x0 ∈ X называется предельной точкой множества A, если
в любой ее проколотой окрестности найдется хотя бы одна точка этого множества, то
есть если ◦
∀ ε > 0 U (x0 , ε) ∩ A 6= ∅.
Замечание 1.5. Предельная точка множества может и не быть точкой этого мно-
жества.
Замечание 1.6. Точка x0 ∈ X не является предельной точкой множества A тогда
и только тогда, когда

∃ ε > 0 U (x0 , ε) ∩ A = ∅.
Определение 1.10. Точка x0 ∈ A называется внутренней точкой множества A,
если она входит в A вместе с некоторой своей окрестностью, то есть если

∃ε > 0 : U (x0 , ε) ⊂ A.

Замечание 1.7. Всякая внутренняя точка множества A является его предельной


точкой.
Определение 1.11. Множество называется открытым, если все его точки — внут-
ренние точки этого множества.
Определение 1.12. Множество называется замкнутым, если оно содержит все
свои предельные точки.
Определение 1.13. Точка x0 ∈ X называется граничной точкой множества A,
если в каждой ее окрестности найдется как точка множества A, так и точка, не при-
надлежащая A. Множество всех граничных точек множества называется его границей
∂A.

14
Замечание 1.8. Любая точка множества — либо его внутренняя, либо граничная
точка. При этом внутренние точки обязательно входят во множество, а граничные —
не всегда.
Пример 1.6. Изучим свойства конечных промежутков на числовой прямой R (ра-
зумеется, выбрана стандартная метрика ρs ). Пусть A1 = (a, b), A2 = [a, b], A3 = [a, b).
Рассмотрим вначале наименьший из этих промежутков — интервал A1 . Все его точки
являются внутренними точками множества (доказать!), поэтому интервал — откры-
тое множество. Чтобы выяснить, является ли интервал и замкнутым множеством,
найдем его предельные точки. По замечанию 1.7 все точки интервала A1 — предель-
ные для A1 . Но в силу замечания 1.5 множество может иметь предельные точки, и не
входящие в него. Точки a, b суть предельные точки множества A1 (доказать!). Точки
множества R \ [a, b] по замечанию 1.6 — уже не предельные для A1 . Итак, предельные
точки интервала (a, b) заполняют отрезок [a, b]. Отсюда следует также, что интервал
(a, b) — не замкнутое множество. Действительно, его предельная точка a не входит в
него. Наконец, ∂A = {a, b}; обе граничные точки интервала не содержатся в нем.
Перейдем к отрезку A2 , отличающемуся от интервала A1 добавлением точек a, b.
Поскольку они, очевидно, не внутренние для A2 , то отрезок не является открытым
множеством. Далее, множества предельных точек интервала (a, b) и отрезка [a,b]
совпадают. Это следует из того, что в определении предельной точки участвуют лишь
ее проколотые окрестности. Таким образом, два множества — точек отрезка и предель-
ных точек отрезка равны. Отрезок — замкнутое множество. Кроме того, ∂A2 = {a, b},
но теперь ∂A2 ⊂ A2 .
Что касается полуинтервала A3 , то он не является открытым множеством: его точка
a — не внутренняя для A3 . Предельные точки множества A3 , как и промежутков A1,2 ,
заполняют отрезок [a, b], поэтому полуинтервал — не замкнутое множество. Действи-
тельно, b — предельная точка множества A3 , но b 6∈ A3 . Далее, ∂A3 = {a, b}, при этом
a ∈ A3 , b 6∈ A3 . •
Напомним некоторые свойства операции дополнения множества. Обозначим допол-
нение множества A ⊂ X (до множества X) через CA :

CA : = X \ A.

Рассмотрим семейство множеств Aα , α ∈ B, B — множество индексов (конечное или


бесконечное). Тогда справедливы законы де Моргана, связывающие операции ∪, ∩, \ :
à ! à !
[ \ \ [
C Aα = CAα , C Aα = CAα . (1.17)
α α α α

Теорема 1.4 Пусть (X, ρ) — метрическое пространство, A ⊂ X.


1) Множество A открыто тогда и только тогда, когда множество CA замкнуто.
2) Объединение любой совокупности открытых множеств — открытое множе-
ство.
3) Пересечение конечного числа открытых множеств — открытое множество.
4) Пересечение любой совокупности замкнутых множеств — замкнутое множе-
ство.
5) Объединение конечного числа замкнутых множеств — замкнутое множество.
Доказательство. 1. Пусть множество A открыто. Докажем замкнутость его до-
полнения CA. Выберем произвольную точку x ∈ A; в силу открытости A существует

окрестность U (x, ε) ⊂ A, но тогда U (x, ε) ∩ CA = ∅ и тем более U (x, ε) ∩ CA = ∅.

15
По замечанию 1.6 x — не предельная точка множества CA, поэтому предельные точки
множества CA содержатся в нем и CA — замкнутое множество.
Пусть теперь множество CA замкнуто, докажем открытость множества A. Выбе-
рем x ∈ A, тогда x — не предельная точка дополнения CA и снова по замечанию 1.6
◦ ◦
U (x, ε) ∩ CA = ∅, то есть U (x, ε) ⊂ A. Поскольку и точка x принадлежит множеству
A, то U (x, ε) ⊂ A, поэтому
S x — внутренняя точка множества A и оно открыто.
2. Пусть A = Aα , где каждое из множеств Aα , α ∈ B открыто. Выберем про-
α∈B
извольную точку x множества A. По определению операции объединения множеств
существует такое множество Aα0 , α0 ∈ B, что x ∈ Aα0 . В силу открытости этого мно-
жества существует окрестность U (x, ε) ⊂ Aα0 ⊂ A. По определению 1.11 множество A
открыто.
Tn
3. Пусть теперь A = Ak , где каждое из множеств Ak открыто. Выберем произ-
k=1
вольную точку x множества A. По определению операции пересечения множеств точка
содержится во всех множествах Ak . В силу их открытости существуют окрестности
U (x, εk ) ⊂ Ak . Пусть ε : = min εk , тогда U (x, ε) ⊂ U (x, εk ) ⊂ Ak при всех k, 1 6 k 6 n.
T
n
Значит, U (x, ε) ⊂ ak = A. Поэтому x — внутренняя точка множества A и оно откры-
k=1
то.
4. Опираемся на доказанные
S утверждения 1-2 теоремы и законы де Моргана. Рас-
смотрим множество A = Aα , где каждое из множеств Aα , α ∈ B замкнуто. Тогда
α∈B

(1.17) \
CA = CAα .
α∈B

По утверждению 1 каждое из множеств CAα открыто, откуда в силу утверждения 2


следует открытость дополнения CA, но тогда (опять по утверждению 1) множество
A = C(CA) замкнуто.
5. Это утверждение доказывается аналогично утверждению 4. •
Задание 1.4. Доказать утверждение 5 теоремы.
Следствие 1.5. Если A — замкнутое множество, а B ⊂ A — открытое множество,
то их разность A \ B — замкнутое множество.
Доказательство следует из теоремы и формулы A \ B = A ∩ CB, поскольку
множество CB замкнуто.
Замечание 1.9. а) Пересечение бесконечной совокупности открытых множеств мо-
жет не быть открытым множеством. б) Объединение бесконечной совокупности замкну-
тых множеств может не быть замкнутым множеством.
Обоснованием утверждения а) может служить следующий
Пример 1.7. Рассмотрим в метрическом пространстве (R, ρs ) бесконечную сово-
купность открытых множеств
µ ¶
1
Ak = 1, 2 + , k ∈ N.
k
T

Пусть A = Ak . Так как (1, 2] ⊂ Ak при всех k ∈ N, то (1, 2] ⊂ A. Но любая точка x > 2
k=1
уже не входит в A, поскольку lim 1/k = 0 и при достаточно больших k 2 + 1/k < x
k→∞
и поэтому x 6∈ Ak , x 6∈ A. Окончательно, A = (1, 2], но множество A не открыто (см.
пример 1.6). •

16
Задание 1.5. Доказать утверждение б) замечания 1.9.
Рассмотрим интересный пример замкнутого множества на числовой прямой (конеч-
но, в метрическом пространстве (R, ρs )).
Пример 1.8. (канторово множество P ). Это множество получается удалени-
ем из отрезка [0, 1] бесконечной совокупности попарно непересекающихся интервалов.
Процесс удаления интервалов состоит из бесконечного множества этапов.
На первом этапе исходный отрезок [0, 1] разбивается на 3 промежутка длиной 1/3 и
средний интервал (1/3, 2/3) удаляется. В итоге остается замкнутое множество [0, 1/3] ∪
[2/3, 1], состоящее из двух отрезков первого этапа длиной 1/3.
На втором этапе с каждым из отрезков первого этапа происходит аналогичная опе-
рация — удаляется средний интервал длиной 1/9. В результате получается замкнутое
множество [0, 1/9] ∪ [2/9, 1/3] ∪ [2/3, 7/9] ∪ [8/9, 1], составленное из 4 отрезков второго
этапа.
Такой процесс продолжается бесконечно. В итоге и получаем канторово множество
P. Его замкнутость вытекает из построения множества и следствия 1.5. •

Теорема 1.5 Пусть (X, ρ) — метрическое пространство, x0 ∈ X, ε > 0. Тогда


открытый шар U (x0 , ε) — открытое множество, замкнутый шар U (x0 , ε) и сфера
S(x0 , ε) — замкнутые множества.

Доказательство. 1) Обозначим A : = U (x0 , ε). Выберем произвольно x0 ∈ U (x0 , ε),


тогда ρ(x0 , x0 ) = ε − α, α > 0. Докажем, что

U (x0 , α) ⊂ A, (1.18)

откуда будет следовать открытость множества A. Выберем теперь x ∈ U (x0 , α), при
этом ρ(x, x0 ) < α. Нужно проверить, что x ∈ A, то есть что ρ(x, x0 ) < ε. По аксиоме
треугольника 30 метрического пространства

ρ(x, x0 ) 6 ρ(x, x0 ) + ρ(x0 , x0 ) < α + (ε − α) = ε.

2) Для доказательства замкнутости замкнутого шара U (x0 , ε) достаточно убедиться


в открытости его дополнения

A1 : = CU (x0 , ε) = {x ∈ X| ρ(x, x0 ) > ε}.

Пусть x0 ∈ A1 , тогда ρ(x0 , x0 ) = ε + α, α > 0. Выясним, что

U (x0 , α) ⊂ A1 ,

откуда и будет следовать справедливость теоремы для множества U (x0 , ε). Зафикси-
руем произвольно точку x ∈ U (x0 , α), при этом ρ(x, x0 ) < α. Нужно проверить, что
ρ(x, x0 ) > ε. Для этого оценим сверху по аксиоме треугольника 30 расстояние ρ(x0 , x0 ) :

ρ(x0 , x0 ) 6 ρ(x0 , x) + ρ(x, x0 ),

но тогда

ρ(x, x0 ) > ρ(x0 , x0 ) − ρ(x0 , x) = [−ρ(x0 , x) > −α] > (ε + α) − α = ε.

3) Сфера S(x0 , ε) = C(A ∪ A1 ) замкнута по теореме 1.4 в силу открытости множеств


A, A1 . •

17
1.5 Предел последовательности точек метрического
пространства
1.5.1 Определение и свойства
Рассмотрим метрическое пространство (X, ρ).
Определение 1.14. Множество A ⊂ X называется ограниченным в метрическом
пространстве (X, ρ), если оно содержится в некотором замкнутом шаре, то есть если
существуют x0 ∈ X, ε > 0 такие, что

A ⊂ U (x0 , ε). (1.19)

Замечание 1.10. Свойство ограниченности множества не зависит от выбора центра


замкнутого шара: если множество содержится в замкнутом шаре с центром в точке x0 ,
то оно содержится в некотором замкнутом шаре с центром в любой другой точке x1 ∈ X.
Действительно, если A ⊂ U (x0 , ε) , то есть если справедливо неравенство ρ(x, x0 ) 6 ε
при всех x ∈ A, то
30
ρ(x, x1 ) 6 ρ(x, x0 ) + ρ(x0 , x1 ) 6 ε + ρ(x0 , x1 ).

Это означает, что A ⊂ U (x1 , ε + ρ(x0 , x1 )).


Из замечания следует, что при исследовании множества X на ограниченность в
качестве центра замкнутого шара, содержащего множество, можно выбирать любую
удобную точку множества X.
Преобразуем условие (1.19) ограниченности множества применительно к МП (R, ρs ),
выбирая x0 = 0 :
∃ ε > 0 A ⊂ U (0, ε),
∃ ε > 0 ∀ x ∈ A |x| 6 ε. (1.20)
Пришли к известному определению ограниченного числового множества. Поэтому
определение ограниченности множеств в МП (R, ρs ) эквивалентно данному ранее.
Пусть {xn } — последовательность точек метрического пространства (X, ρ), a —
точка этого пространства.
Определение 1.15. Говорят, что последовательность {xn } сходится к точке a :

lim xn = a или xn → a,
n→∞

если
∀ ε > 0 ∃ N ∈ N ∀n ∈ N (n > N ⇒ xn ∈ U (a, ε)). (1.21)
Геометрический смысл сходимости: все члены последовательности, начиная с неко-
торого номера, содержатся в произвольной, сколь угодно малой окрестности точки a.
Оказывается, свойство xn → a равносильно бесконечной малости числовой после-
довательности {ρ(xn , a)}, то есть свойству ρ(xn , a) → 0 (в метрическом пространстве
(R, ρs )).

Теорема 1.6 xn → a ⇔ ρ(xn , a) → 0.

Доказательство. По определению предела числовой последовательности


lim ρ(xn , a) = 0 тогда и только тогда, когда
n→∞

∀ ε > 0 ∃ N ∈ N ∀ n ∈ N (n > N ⇒ |ρ(xn , a) − 0| = ρ(xn , a) < ε).

18
Но это и есть условие (1.21). •
Из этой теоремы и теоремы 1.1 вытекает
Следствие 1.6. Если на множестве X введена норма ||x||, то xn → a тогда и
только тогда, когда ||xn − a|| → 0.
Используя теорему 1.6, следствие 1.6 и доказанные ранее свойства пределов число-
вых последовательностей, установим свойства пределов последовательностей в метри-
ческих пространствах, а также в линейных нормированных пространствах ( последние
связаны с операциями сложения и умножения на действительное число).

Теорема 1.7 Пусть {xn }, {yn } — последовательности в МП (X, ρ), a, b — точки


этого пространства.
1) Если xn → a, то последовательность {xn } ограничена.
2) Если xn → a, xn → b, то a = b.
3) Если xn → a и {xnk } — произвольная подпоследовательность последовательно-
сти {xn }, то xnk → a при k → ∞.
Предположим дополнительно, что метрика на X порождена нормой ||x|| и
(X, ||x||) — ЛНП.
4) Если xn → a, yn → b, то xn + yn → a + b.
5) Если xn → a, то при любом λ ∈ R λxn → λ · a.

Доказательство. 1) Пусть xn → a, тогда по теореме 1.6 ρ(xn , a) → 0. Числовая


последовательность {ρ(xn , a)} сходится и поэтому ограничена. По определению (1.20)
ограниченного числового множества

∃ ε > 0 ∀ n ∈ N ρ(xn , a) 6 ε,

а это означает, что {xn } ⊂ U (a, ε).


2) Из условий xn → a, xn → b и теоремы 1.6 следует, что
ρ(xn , a) → 0, ρ(xn , b) → 0. Но тогда

ρ(xn , a) + ρ(xn , b) → 0 (1.22)

(почему?). Оценим ρ(a, b) :


30
0 6 ρ(a, b) 6 ρ(xn , a) + ρ(xn , b).

Учитывая соотношение (1.22) и то обстоятельство, что постоянная (состоящая из ну-


лей) последовательность 0 → 0, по теореме о пределе зажатой (числовой) последова-
тельности получаем, что другая постоянная последовательность ρ(a, b) → 0. Но тогда
ρ(a, b) = 0 и по аксиоме 10 МП a = b.
3) Доказывается аналогично утверждению 1 теоремы.
Доказательства утверждений 4, 5 опираются на следствие 1.6.
4) Поскольку по следствию 1.6 ||xn − a|| → 0, ||yn − b|| → 0, то

||xn − a|| + ||yn − b|| → 0. (1.23)

Преобразуем
3
||(xn + yn ) − (a + b)|| = ||(xn − a) + (yn − b)|| 6 ||xn − a|| + ||yn − b||.

Поэтому
∀ n ∈ N 0 6 ||(xn + yn ) − (a + b)|| 6 ||xn − a|| + ||yn − b||

19
и по теореме о пределе зажатой последовательности с учетом соотношения (1.23)

||(xn + yn ) − (a + b)|| → 0.

В силу следствия 1.6 xn + yn → a + b.


5) Используется соотношение

0 6 ||λx − λa|| = |λ| · ||x − a||. •

Задание 1.6. 1) Сформулировать теоремы о пределах числовых последовательно-


стей, на которые опирается доказательство теоремы 1.7.
2) Доказать теорему 1.7 полностью.
Замечание 1.11. Если одновременно рассматривается несколько метрических про-
странств с носителем X, то сходимость последовательности в метрическом пространстве
ρ
(X, ρ) обозначают так: xn → a.

1.5.2 Смысл сходимости в пространстве Rm

В пространстве Rm ранее введены 6 две нормы (кубическая и евклидова)


v
u m
uX
||x||C = max |xi |, ||x||E = t x2i ,
16i6m
i=1

а тем самым и две метрики


v
u m
uX
ρC (x, y) = max |xi − yi |, ρE (x, y) = t (xi − yi )2 .
16i6m
i=1

Докажем их эквивалентность в смысле следующего определения.


Определение 1.16. Пусть (X, ρ1 ), (X, ρ2 ) — метрические пространства с носителем
X. Говорят, что метрики ρ1 , ρ2 эквивалентны, если
ρ1 ρ2
∀ {xn } ∈ X xn → a ⇔ xn → a.

Предварительно докажем лемму, связывающую ||x||C , ||x||E .

Лемма 1.1 √
∀ x ∈ Rm ||x||C 6 ||x||E 6 m · ||x||C . (1.24)

Доказательство. Достаточно проверить. что

∀ x ∈ Rm ||x||2C 6 ||x||2E 6 m · ||x||2C . (1.25)

Докажем вначале левое из неравенств (1.25), оценив ||x||2E снизу:


µ ¶2
||x||2E = x21 + ··· + x2m > max x2i 2
= max |xi | = max |xi | = ||x||2C .
16i6m 16i6m 16i6m

6
Мы теперь пишем Rm , поскольку символ n используется для обозначения аргумента последова-
тельностей.

20
При оценивании снизу мы оставили лишь наибольшее из неотрицательных слагаемых
x2i , отбросив остальные, а затем воспользовались очевидным свойством максимума
µ ¶2
max x2i = max |xi | . (1.26)
16i6m 16i6m

Действительно, множества неотрицательных чисел {|xi |}, {x2i }, 1 6 i 6 m имеют


наибольшие элементы при одинаковом значении k индекса i (если |xi | 6 |xk |, то x2i 6 x2k ,
и наоборот). Поэтому
max |xi | = |xk |, max x2i = x2k .
16i6m 16i6m

Теперь оценим ||x||2E сверху, заменив каждое слагаемое наибольшим:


(1.26)
||x||2E = x21 + · · · + x2m 6 max x2i + · · · + max x2i = m · ||x||2C . •
16i6m 16i6m

Замечание 1.12. В кубической окрестности точки a ∈ Rm содержится евклидова


окрестность точки a и, наоборот, в евклидовой окрестности точки a содержится ее
кубическая окрестность. Поэтому при работе с пространством Rm можно выбирать
любой из этих видов окрестностей.
Рассмотрим в пространстве Rm последовательность {xn } и точку a = (a1 , . . . , am ),
при этом xn = (xn1 , . . . , xnm ).

Теорема 1.8 Метрики ρC , ρE в пространстве Rm эквивалентны и порождают поко-


ординатную сходимость, то есть

 xn1 → a1
ρC ρE
xn → a ⇔ xn → a⇔ ........

xnm → am

(здесь {xn1 }, . . . , {xnm } — числовые последовательности, сходящиеся в метрическом


пространстве (R, ρs )).

Доказательство опирается на лемму 1.1 и теорему о пределе зажатой последова-


тельности. Оно состоит из двух этапов.
1. Докажем эквивалентность метрик ρC , ρE .
ρC
a) Пусть xn → a. По следствию 1.6

||xn − a||C → 0. (1.27)

Оценим ||xn − a||E :


(1.24) √
0 6 ||xn − a||E 6 m · ||xn − a||C .
По теореме о пределе зажатой последовательности с учетом (1.27) отсюда следует, что
ρE
||xn − a||E → 0, но тогда xn → a.
ρE
b) Пусть теперь, наоборот, xn → a и, значит, ||xn − a||E → 0. Оценим ||xn − a||C :
(1.24)
0 6 ||xn − a||C 6 ||xn − a||E ,
C ρ
поэтому ||xn − a||C → 0 и xn → a.

21
2. Докажем, что 
xn1 → a1
ρE
xn → a ⇔ ........

xnm → am .
E ρ
a) Пусть xn → a. Зафиксируем произвольно номер i, 1 6 i 6 m. Оценим снизу

||xn − a||2E = (xn1 − a1 )2 + · · · + (xnm − am )2 > (xni − ai )2 .

Поэтому 0 6 (xni − ai )2 6 ||xn − a||2E ,

0 6 |xni − ai | 6 ||xn − a||E . (1.28)

Поскольку ||xn − a||E → 0, то


|xni − ai | → 0 ⇔ xni − ai → 0 ⇔ xni → ai .

b) Пусть последовательность {xn } сходится покоординатно, то есть

xn1 → a1 , . . . , xnm → am .

Тогда для любого i, 1 6 i 6 m


xni − ai → 0, |xni − ai | → 0, (xni − ai )2 → 0.
P
m
Отсюда из теоремы о пределе суммы числовых последовательностей (xni − ai )2 → 0,
i=1
но тогда v
u m
uX
t (xni − ai )2 = ||xn − a||E → 0. •
i=1

1.5.3 Смысл сходимости в пространстве C[a, b]


Докажем, что сходимость последовательности xn → y в метрическом пространстве
C[a, b] непрерывных на отрезке [a, b] функций есть равномерная сходимость функцио-
нальной последовательности {xn (t)} к предельной функции y(t) на отрезке [a, b]. Этот
факт сразу вытекает из соответствующих определений.
Напомним, что в пространстве C[a, b] определены норма и метрика соотношениями

||x(t)|| = max |x(t)|, ρ(x(t), y(t)) = max |x(t) − y(t)|


t∈[a,b] t∈[a,b]

соответственно. Поэтому

xn → y ⇔ ∀ ε > 0 ∃ N ∈ N ∀ n (n > N ⇒ max |xn (t) − y(t)| < ε).


t∈[a,b]

С другой стороны, по определению равномерной сходимости [1, с. 447]


[a,b]
xn (t) =⇒ y(t) ⇔ ∀ ε > 0 ∃ N ∈ N ∀ n > N ∀ t ∈ [a, b] |xn (t) − y(t)| < ε.

Но из определения максимума и теоремы Вейерштрасса вытекает эквивалентность

max |xn (t) − y(t)| < ε ⇔ ∀ t ∈ [a, b] |xn (t) − y(t)| < ε. (1.29)
t∈[a,b]

Задание 1.7. Доказать соотношение (1.29).

22
1.5.4 Критерий предельной точки
Укажем характеристическое свойство предельной точки множества, связанное с
последовательностями.
Пусть (X, ρ) — метрическое пространство, A ⊂ X, {xn } ⊂ A, a ∈ A.

Теорема 1.9 Точка a является предельной для множества A тогда и только тогда,
когда во множестве A\{a} существует последовательность {xn } такая, что xn → a.

Доказательство. 1) Пусть a — предельная точка множества A. Тогда



∀ ε > 0 ∃ x ∈ U (a, ε) ∩ A. (1.30)

Выберем последовательность {εn } положительных чисел такую, что εn → 0. Как выте-


кает из (1.30),
∀ n ∈ N ∃ xn ∈ A 0 < ρ(xn , a) < εn .
Тем самым выделена последовательность {xn } ⊂ A \ {a}. По теореме о пределе зажатой
последовательности из последнего двойного неравенства следует, что ρ(xn , a) → 0 и,
значит, xn → a.
2) Пусть существует последовательность {xn } ⊂ A \ {a} такая, что xn → a. Зада-
димся числом ε > 0. Тогда

∃N ∈ N ∀n > N 0 < ρ(xn , a) < ε.



При всех натуральных n > N xn ∈ U (a, ε). Мы доказали, что в проколотой окрест-

ности U (a, ε) содержатся точки множества A и поэтому a — предельная точка этого
множества. •
Замечание 1.13. Утверждение теоремы 1.9 оправдывает название «предельная точ-
ка множества».
Замечание 1.14. Наряду с теоремой 1.9, справедливо следующее утверждение:
точка a является предельной для множества A тогда и только тогда, когда в каждой ее
проколотой окрестности существует бесконечное множество точек, содержащихся в A.
Задание 1.8. Доказать сформулированный в замечании 1.14 критерий предельной
точки. Воспользоваться тем, что одно из его утверждений, по существу, содержится в
доказательстве теоремы 1.9, 2.

1.6 Предел функции

Рассмотрим два (вообще говоря, различных) метрических пространства


(X, ρX ), (Y, ρY ) и функцию
f :X→Y
с областью определения X и со значениями в метрическом простанстве Y. Будем мно-
жество X обозначать также через D(f ).
Если точки множеств X, Y обозначать символами x, y соответственно, то функцию
f : X → Y можно записать и так:

y = f (x), x ∈ X, y ∈ Y.

23
Впрочем, если множества X, Y фиксированы, то часто будем говорить кратко: функ-
ция f.
Определение 1.17. Графиком Γ(f ) функции f называется множество

Γ(f ) : = {(x, y) ∈ X × Y | x ∈ X, y = f (x)}.

Однако далеко не во всех случаях (в отличие от функций f : R → R) график Γ(f )


допускает удобную геометрическую интерпретацию.
Пример 1.9. Пусть X = C1 [a, b] ⊂ C[a, b] — множество непрерывно дифференциру-
емых на отрезке [a, b] функций с метрикой (1.8), Y = C[a, b], f : x(t) → x0 (t). Например,
f (t3 ) = 3t2 , f (et ) = et . •
Если точками МП (X, ρX ), (Y, ρY ) являются функции, то функцию f : X → Y
иногда называют оператором. Функцию f примера 1.9 естественно назвать оператором
дифференцирования.
Выделим важный класс числовых функций, значения которых — действительные
числа.
Определение 1.18. Если Y = R, то функция f : X → Y называется числовой.
Пример 1.10. X = C[a, b], f : x(t) → max x(t). f — функция, сопоставляющая
t∈[α,β]
каждой точке x(t) пространства C[a, b], то есть непрерывной на отрезке [a, b] функции
ее наибольшее значение на этом отрезке. Например,

f (ln t) = ln b, f (log1/2 t) = log1/2 a. •

Поскольку R — поле, то на нем введены бинарные арифметические операции сложе-


ния, вычитания, умножения действительных чисел, а на множестве R\{0} — и операция
деления таких чисел. Эти свойства поля R порождают арифметические операции над
числовыми функциями.
Пусть f, g — числовые функции, определенные на множестве X. Вводятся функции
f ± g, f · g, f /g — сумма, разность, произведение, частное функций f, g соотношениями

(f ± g)(x) : = f (x) ± g(x), (f · g)(x) : = f (x) · g(x), (f /g)(x) : = f (x)/g(x),

D(f ± g) = D(f · g) : = X, D(f /g) : = X \ {x ∈ X| g(x) = 0}.


Мы подробно рассмотрели числовые функции действительного переменного, то есть
числовые функции в случае X ⊂ R. В ближайшее время мы займемся изучением их
обобщений — числовых функций нескольких переменных 7 .
Определение 1.19. Числовая функция f : X → R называется функцией m пере-
менных ( m ∈ N, m > 1), если X ⊂ Rm .
График Γ(f ) функции m переменных есть некоторая поверхность в (m + 1)-мерном
пространстве Rm+1 . В случае функции двух переменных 8 (m = 2) график можно пред-
ставить достаточно наглядно. Аргумент таких функций — точку на плоскости R2 удобно
обозначать через (x, y), их значения — символом z. Таким образом, говорят о функции
z = f (x, y) двух переменных, при этом составляющие x, y пары (x, y) называют аргу-
ментами функции. Ее график

Γ(f (x, y)) = {(x, y, z) ∈ R3 | (x, y) ∈ D(f ), z = f (x, y)}.


7
Числовые функции одной и нескольких переменных — основной объект изучения в классическом
математическом анализе.
8
Этот самый простой случай будет для нас основным при построении теории функций нескольких
переменных.

24
Пусть теперь заданы две функции f : X → Y, g : X → Y, где Y — линейное
нормированное пространство. На множестве Y введены бинарные операции сложения,
вычитания и операция умножения на вещественный скаляр. Поэтому над функциями
f, g на множестве X определяются операции сложения и вычитания (f ± g)(x) (так же,
как для числовых функций) и операция умножения на действительное число

∀x ∈ X (λ · f )(x) : = λ · f (x).

Важным и достаточно простым классом функций являются отображения отрезка


I = [α, β] ⊂ R
ϕ : I → Y. (1.31)
Такое отображение наглядно называют (ориентированным) путем, точки ϕ(α), ϕ(β)
— началом и концом пути.
Часто рассматриваются пути (1.31) в случае Y = Rm . Тогда говорят также о вектор-
функции
~r(t) = (a1 (t), . . . , am (t)), t ∈ [α, β].
Вектор-функция определяет в пространстве Rm параметрически заданную кривую (с
параметром t).
Введем два определения предела функции f : X → Y в точке — по Коши и по
Гейне, обобщив соответствующие определения относительно числовых функций одной
переменной.
Пусть a — предельная точка множества X, b ∈ Y.
Определение 1.20. (определение предела функции по Коши). Говорят, что
lim f (x) = b, если
x→a


∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ x ∈ X (x ∈ U X (a, δ)) ⇒ f (x) ∈ UY (b, ε)). (1.32)

Импликацию в определении можно уточнить, записав через неравенства следующим


образом:
0 < ρX (x, a) < δ ⇒ ρY (f (x), b) < ε.
Определение 1.21. (определение предела функции по Гейне). Говорят, что
lim f (x) = b, если
x→a
X ρ Y ρ
∀ {xn } ⊂ X \ {a} (xn → a ⇒ f (xn ) → b). (1.33)
Из критериев предельной точки (теорема 1.9, замечание 1.14) следует, что импли-
кации в обоих определениях предела функции нетривиальны.
Теорема 1.10 Определения 1.20, 1.21 предела функции f : X → Y в точке a рав-
носильны, то есть lim f (x) = b по определению 1.20 тогда и только тогда, когда
x→a
lim f (x) = b по определению 1.21.
x→a

Доказательство теоремы 1.10 проводится так же, как и в случае числовых функ-
циий одной переменной.
Задание 1.9. Доказать теорему (см. [8, с. 22]).
Свойство функции f иметь предел в точке a (или не иметь предела) — локальное
свойство функции, оно полностью определяется поведением функции в сколь угодно
малой проколотой окрестности точки a.
Определение 1.22. Числовая функция f называется бесконечно малой (БМ) в
точке a, если lim f (x) = 0.
x→a

25
Запишем определение предела по Коши для функции двух переменных z = f (x, y).
Удобно выбирать кубическую окрестность 9 рассматриваемой точки (a, b)

2
U c ((a, b), δ) = {(x, y) ∈ R | 0 < |x − a| < δ, 0 < |y − b| < δ}.
Далее,
ρY (x, y) = ρs (x, y) = |x − y|.
Определение 1.23. (определение предела функции двух переменных по
Коши). Говорят, что lim f (x, y) = B, если
(x,y)→(a,b)

∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ (x, y) ∈ D(f ) (0 < |x − a| < δ, 0 < |y − b| < δ ⇒ |f (x) − B| < ε).
(1.34)
Часто вместо lim f (x, y) пишут lim f (x, y).
(x,y)→(a,b) x→a
y→b
Пример 1.11. Доказать по определению Коши, что
lim (2x − 3y) sin xy = 0.
x→0
y→0

Нужно проверить, что


∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ (x, y) ∈ R2 (0 < |x| < δ, 0 < |y| < δ ⇒ |(2x − 3y) sin xy| < ε).
Выберем произвольно ε > 0. Преобразуем и оценим сверху
|(2x−3y) sin xy| = |2x−3y|·| sin xy| 6 [| sin xy| 6 1] 6 |2x−3y| = |2x+(−3y)| 6 2|x|+3|y| < ε.
Поэтому, если |x| < ε/5, |y| < ε/5, то |(2x − 3y) sin xy| < ε. Можно выбрать, например,
δ : 0 < δ 6 ε/5. •
Пример 1.12. Доказать, что предел
x2 − y 2
lim
x→0 x2 + y 2
y→0

не существует. Он представляет собой неопределенность типа [0/0]. Функция


x2 − y 2
f (x, y) =
x2 + y 2
рациональна относительно x, y.
Воспользуемся определением предела по Гейне. Чтобы убедиться в отсутствии пре-
дела, нужно найти такие две последовательности точек плоскости
(xn , yn ) → (0, 0), (x0n , yn0 ) → (0, 0),
что
lim f (xn , yn ) 6= lim f (x0n , yn0 ).
n→∞ n→∞
1) Выберем xn = 1/n, yn = 0, тогда xn → 0, yn → 0 и по теореме 1.8 (xn , yn ) → (0, 0).
Находим
1/n2
f (xn , yn ) = = 1, lim f (xn , yn ) = 1.
1/n2 n→∞

2) Пусть теперь x0n = yn0 = 1/n. Вычисляем


(x0n , yn0 ) → (0, 0), f (x0n , yn0 ) = 0 → 0 6= 1. •
9
См. замечание 1.12.

26
Теорема 1.11 (свойства пределов функций) Рассмотрим метрические про-
странства (X, ρX ), (Y, ρY ) и функции f : X → Y, g : X → Y.
1) Если lim f (x) = b1 , lim f (x) = b2 , то b1 = b2 .
x→a x→a
Пусть Y — линейное нормированное пространство и существуют пределы
lim f (x) = b, lim g(x) = c. Тогда
x→a x→a
2) существует lim (f + g))(x) = b + c,
x→a
3) при любом λ ∈ R существует lim λ · f (x) = λ · b.
x→a
Пусть теперь Y = R. Тогда
4) существует lim (f · g)(x) = b · c,
x→a
5) при c 6= 0 существует lim (f /g)(x) = b/c,
x→a
6) функция f · g является БМ в точке a, если функция f ограничена в некоторой
проколотой окрестности точки a, функция g — БМ в этой точке.

Доказательство вытекает из определения предела функции по Гейне 1.21 и соот-


ветствующих свойств последовательностей: при доказательстве утверждений 1-3 при-
меняется теорема 1.7, при доказательстве остальных утверждений — свойства числовых
последовательностей, известные из начальных разделов курса.
Докажем, для примера, утверждение 4. Нужно проверить, что
X ρ
∀ {xn } ⊂ X \ {a} (xn → a ⇒ (f · g)(xn ) → bc).

Зафиксируем произвольно последовательность {xn } с требуемым свойством:



{xn } ⊂ X \ {a}, xn → a. (1.35)

Так как lim f (x) = b ∈ R, то по определению 1.21 из условий (1.35 ) вытекает, что
x→a

f (xn ) → b. (1.36)

Так как lim g(x) = c ∈ R, то из условий (1.35 ) вытекает также, что


x→a

g(xn ) → c. (1.37)

Из соотношений (1.36), (1.37) по теореме о пределе произведения числовых последова-


тельностей
f (xn ) · g(xn ) = (f · g)(xn ) → bc. •

1.7 Непрерывность функции. Локальные свойства


непрерывных функций

Пусть (X, ρX ), (Y, ρY ) — метрические пространства, точка a ∈ X — предельная точка


множества X, задана функция f : X → Y.
Определение 1.24. (основное определение непрерывности). Функция f на-
зывается непрерывной в точке a, если

lim f (x) = f (a). (1.38)


x→a

27
Учитывая определения 1.20, 1.21 предела, получаем новые определения непрерыв-
ности функции в точке, эквивалентные определению 1.24.
Определение 1.25. (определение непрерывности по Коши). Функция f на-
зывается непрерывной в точке a, если
∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ x ∈ X (x ∈ UX (a, δ)) ⇒ f (x) ∈ UY (f (a), ε)).
Как и в случае числовой функции одной переменной, мы теперь не отбрасы-
ваем точку a, поскольку a ∈ X и последнее включение при x = a истинно:
ρY (f (a), f (a)) = 0 < ε.
Определение 1.26. (определение непрерывности по Гейне). Функция f на-
зывается непрерывной в точке a, если
ρX Y ρ
∀ {xn } ⊂ X (xn → a ⇒ f (xn ) → f (a)).
Теорема 1.12 (непрерывность композиции непрерывных функций)
Пусть (X, ρX ), (Y, ρY ), (Z, ρZ ) — метрические пространства и заданы функции
f : X → Y, g : Y → Z, причем функция f непрерывна в точке a, функция g непре-
рывна в соответствующей точке f (a). Тогда их композиция (сложная функция)
g ◦ f : X → Z непрерывна в точке a.
Доказательство опирается на определение 1.26 непрерывности по Гейне и прово-
дится по схеме доказательства теоремы 1.11, 4. Нужно проверить, что
Xρ Z ρ
∀ {xn } ⊂ X (xn → a ⇒ (g ◦ f )(xn ) → (g ◦ f )(a)).
Зафиксируем произвольную последовательность {xn } с требуемыми свойствами. То-
гда
X ρ Y ρ
xn → a [f непрерывна в точке a] =⇒ f (xn ) → f (a) [g непрерывна в точке f (a)] =⇒
Z ρ
g(f (xn )) = (g ◦ f )(xn ) → g(f (a)) = (g ◦ f )(a). •
Теперь установим локальные свойства непрерывных функций, связанные с арифме-
тическими операциями (включая операцию умножения точки ЛНП на скаляр). Конеч-
но, они формулируются лишь для тех классов функций, где такие операции определены.
Теорема 1.13 Рассмотрим функции f : X → Y, g : X → Y, где (X, ρX ) — МП, Y —
ЛНП, и функции f, g непрерывны в точке a. Тогда
1) функция f + g непрерывна в точке a,
2) при любом λ ∈ R функция λ · f непрерывна в точке a.
Если, вдобавок, Y = R, то
3) функция f · g непрерывна в точке a,
4) при g(a) 6= 0 функция f /g непрерывна в точке a.
Доказательство вытекает из основного определения непрерывности 1.24 и теоре-
мы 1.11 о свойствах предела функции. Докажем, например, утверждение 1. Поскольку
функции f, g в точке a непрерывны, то по определению 1.24 lim f (x) = f (a), lim g(x) =
x→a x→a
g(a). Но тогда из теоремы 1.11, 2 вытекает, что lim (f + g)(x) = f (a) + g(a) = (f + g)(a).
x→a
Это и означает (опять по определению 1.24) непрерывность в точке a функции f +g. •
Иногда полезно следующее замечание, вытекающее из определения непрерывности
1.25.
Замечание 1.15. Если числовая функция f непрерывна и положительна (отрица-
тельна) в точке a, то она положительна (отрицательна) в некоторой окрестности этой
точки.
Задание 1.10. Доказать утверждение замечания 1.15.

28
1.8 Глобальные свойства непрерывных функций

Определение 1.27. Функция f : X → Y называется непрерывной на множестве


A ⊂ X, если она непрерывна в каждой его точке.
В теории числовых функций одной переменной важными являются следующие свой-
ства функций, непрерывных на отрезке: теорема Больцано-Коши о промежуточных
значениях [1, с. 126], теоремы Вейерштрасса [1, с. 125], Кантора [1, с. 268]. Однако они
опираются на разные свойства отрезка на числовой прямой — линейная связность
и компактность. Введем эти понятия для метрических пространств и, используя их,
рассмотрим обобщения названных выше теорем.

1.8.1 Функции, непрерывные на линейно связных множествах

Пусть (X, ρ) — метрическое пространство, A ⊂ X.


Определение 1.28. Множество A называется линейно связным в МП (X, ρ), если
для любых различных точек x1 , x2 множества X существует непрерывное отображение
отрезка [0, 1]
ϕ : [0, 1] → A
такое, что ϕ(0) = x1 , ϕ(1) = x2 .
Любую пару точек линейно связного множества A можно во множестве A связать
непрерывным путем. Определение особенно наглядно при X = Rm : тогда линейная
связность множества A есть возможность соединения произвольной пары его точек
непрерывной кривой, содержащейся во множестве.
Пример 1.13. 1.X = R. Промежутки < a, b > — линейно связные множества.
Оказывается, других линейно связных множеств на прямой не существует (см. [1, с.
29]). В то же время, например, объединение двух интервалов A = (0, 1) ∪ (2, 3) — уже
не линейно связное множество.
2. X = R2 . Круг, полуплоскость, прямая — линейно связные множества, гипербола
— не линейно связное множество. •
Важно, что свойство линейной связности сохраняется при непрерывных отображе-
ниях.
Теорема 1.14 Пусть (X, ρX ), (Y, ρY ) — метрические пространства, A ⊂ X, функция
f : X → Y непрерывна на линейно связном множестве A. Тогда его образ f (A) —
линейно связное множество.
Доказательство. Докажем линейную связность множества f (A) по определению,
опираясь на теорему 1.12.
Выберем произвольно точки y1 , y2 ∈ f (A). По построению множества f (A) существу-
ют точки x1 , x2 ∈ X такие, что f (x1 ) = y1 , f (x2 ) = y2 . Так как множество A линейно
связно, то существует отображение ϕ : [0, 1] → A со свойствами ϕ(0) = x1 , ϕ(1) = x2 .
Тогда сложная функция (f ◦ϕ)(t) по теореме 1.12 непрерывна на отрезке [0, 1], при этом
f ◦ ϕ : [0, 1] → f (A). Находим
(f ◦ ϕ)(0) = f (x1 ) = y1 , (f ◦ ϕ)(1) = f (x2 ) = y2 . •
Теорема доказана для произвольной непрерывной функции. Теперь рассмотрим чис-
ловые функции и распространим на них теорему о промежуточных значениях числовых
функций одной переменной.

29
Теорема 1.15 (о промежуточных значениях числовой функции) Пусть (X, ρ)
— метрическое пространство, числовая функция f : X → R непрерывна на линейно
связном множестве A ⊂ X, x1 , x2 — точки множества A и f (x1 ) < f (x2 ). Тогда для
каждого значения C ∈ (f (x1 ), f (x2 )) существует такая точка x ∈ A, что f (x) = C.
Доказательство. В силу линейной связности множества A существует непрерыв-
ный путь
ϕ : [0, 1] → A,
соединяющий точки x1,2 : ϕ(0) = x1 , ϕ(1) = x2 . Зафиксируем произвольно число
C ∈ (f (x1 ), f (x2 )). Рассмотрим сложную функцию

F (t) : = f (ϕ(t)), t ∈ [0, 1].

Это — числовая функция одной переменной t. Она непрерывна на отрезке [0, 1] (поче-
му?) и принимает на его концах разные значения:

F (0) = f (ϕ(0)) = f (x1 ), F (1) = f (ϕ(1)) = f (x2 ).

Для нее выполнены условия теоремы о промежуточных значениях для функции одной
переменной и поэтому существует на интервале (0, 1) точка t такая, что F (t) = C, но
F (t) = f (ϕ(t)) = f (x) ∈ A. •

1.8.2 Функции, непрерывные на компактных множествах


Напомним, что доказательство теорем Вейерштрасса и Кантора для числовых
функций одной переменной опирается на теорему Больцано-Вейерштрасса, которую
можно сформулировать так.
Теорема 1.16 (теорема Больцано-Вейерштрасса для R) Если числовая последо-
вательность {xn } содержится в отрезке [a, b], то из нее можно выделить подпосле-
довательность {xnk }, сходящуюся к точке этого отрезка.
Это свойство отрезка лежит в основе понятия компактного множества в МП.
Определение 1.29. Пусть (X, ρ) — метрическое пространство, A ⊂ X. Множество
A называется компактным в МП (X, ρ), если для всякой последовательности точек
{xn }, содержащейся во множестве A, существует подпоследовательность {xnk }, сходя-
щаяся к точке x0 этого множества:

∀ {xn } ⊂ A ∃ {xnk } ∃ x0 ∈ A xnk → x0 .

Замечание 1.16. Для метрических пространств это определение компактности эк-


вивалентно следующему определению компактного множества в топологическом про-
странстве: множество A компактно, если из любого открытого покрытия этого множе-
ства (то есть семейства открытых множеств, покрывающих A) можно выделить конеч-
ное подпокрытие (то есть конечное подсемейство, покрывающее A)[5, с. 27].
Установим свойства компактных множеств и укажем компактные множества в про-
странствах Rm .
Пример 1.14. X = R. Отрезок [a, b] — компактное множество по теореме 1.16.
Интервал (a, b) не компактен, поскольку из последовательности {a + (b − a)/n} нель-
зя выделить подпоследовательности, сходящейся к точке интервала (почему?). Далее,
бесконечный интервал (a, +∞) также не компактен (доказать, рассмотрев последова-
тельность {a + n}). Полуинтервал (a, b] некомпактен (доказать).

30
Теорема 1.17 (необходимые условия компактности) Если множество ком-
пактно, то оно 1) ограничено, 2) замкнуто.

Доказательство. 1) Проверим, что неограниченное множество A не компактно.


Пусть a ∈ A. Множество A в силу неограниченности не может полностью содер-
жаться в замкнутом шаре U (a, n) при любом n ∈ N. Поэтому существуют точки
xn 6∈ U (a, n), xn ∈ A, n ∈ N. Тем самым определена последовательность {xn } ⊂ A
такая, что ρ(xn , a) > n. Но тогда ρ(xn , a) → +∞ (почему?) и, значит, любая ее подпо-
следовательность {xnk } обладает свойством ρ(xnk , a) → +∞. Поэтому все подпоследо-
вательности {xnk } последовательности {xn } не ограничены и в силу теоремы 1.7, 1 не
сходятся, но тогда множество A не компактно.
2) Пусть x0 — предельная точка множества A. Из критерия предельной точки 1.9
следует существование такой последовательности {xn } ⊂ A, что xn → x0 . В силу ком-
пактности множества A найдутся ее подпоследовательность{xnk } и точка x0 ∈ A такие,
что xnk → x0 . Однако по теореме 1.7, 3 о пределе подпоследовательности x0 = x0 и,
значит, x0 ∈ A. Поэтому множество A замкнуто. •

Теорема 1.18 (теорема Больцано-Вейерштрасса для Rm ) Всякая ограниченная


последовательность {xn } ⊂ Rm (m ∈ N) содержит сходящуюся подпоследователь-
ность {xnk }.

Доказательство проведем для случая m = 2. Пусть последовательность


2
{(xn , yn )} ⊂ R ограничена, тогда она содержится в замкнутом шаре U C (θ, ε). Поэтому

∀ n ∈ N |xn | 6 ε, |yn | 6 ε

и, значит, числовые последовательности {xn }, {yn } ограничены. По теореме 1.16

∃ {xnk }, ∃x0 ∈ [−ε, ε] xnk → x0 . (1.39)

В свою очередь, для ограниченной числовой последовательности {ynk } существуют под-


последовательность {ynkl } и точка y0 ∈ [−ε, ε] такие, что ynkl → y0 при l → ∞. Из (1.39)
следует, что xnkl → x0 . Поэтому в силу теоремы 1.8 (xnkl , ynkl ) → (x0 , y0 ). •

Теорема 1.19 (критерий компактности в Rm ) Множество A ⊂ Rm (m ∈ N) ком-


пактно тогда и только тогда, когда оно ограничено и замкнуто.

Доказательство. Необходимость вытекает из теоремы 1.17.


Достаточность. Пусть множество A ⊂ Rm ограничено и замкнуто. Выберем про-
извольно последовательность {xn } ⊂ A. Требуется выделить из нее подпоследователь-
ность, сходящуюся к точке множества A. Рассмотрим отдельно 2 случая:
1) множество E значений последовательности {xn } конечно,
2) множество E бесконечно.
1) Хотя бы одно из значений α ∈ E повторяется у последовательности {xn } бес-
конечно много раз (если бы все значения принимались последовательностью лишь
конечное число раз, то она имела бы конечное число членов). Поэтому существует
подпоследовательность{xnk } последовательности {xn } такая, что xnk = α, k ∈ N, но
тогда xnk = α → α ∈ E ⊂ A.
2) Так как последовательность{xn } ограничена вместе с A, то по теореме 1.18

∃ {xnk } ∃ x0 ∈ Rm xn k → x0 .

31
Если xnk 6= x0 (k ∈ N), то в силу критерия 1.9 x0 — предельная точка множества A;
из его замкнутости вытекает, что x0 ∈ A.
Если же некоторые члены последовательности {xnk } совпадают с x0 , то рассмотрим
ее подпоследовательность{xnkl } : xnkl 6= x0 , l ∈ N (так как множество E бесконечно,
то после отбрасывания точек последовательности xnk = x0 остается бесконечное мно-
жество членов, и образующее подпоследовательность{xnkl } ). При этом по теореме о
пределе подпоследовательности xnkl → x0 . Так как {xnkl } ⊂ A \ {x0 }, то, вновь при-
меняя критерий 1.9, убеждаемся, что x0 — предельная точка множества A, поэтому
x0 ∈ A. •

Теорема 1.20 Пусть (X, ρX ), (Y, ρY ) — метрические пространства и функция f :


X → Y непрерывна на компактном множестве A ⊂ X. Тогда множество f (A) также
компактно.

Доказательство. Рассмотрим произвольную последовательность {yn } ⊂ f (A).


Для каждой точки yn множества f (A) существует точка xn множества A с условием
f (xn ) = yn . Тем самым определена последовательность {xn } ⊂ A. В силу компактно-
сти множества A существует такая ее подпоследовательность {xnk }, что она сходится к
некоторой точке x0 множества A : xnk → x0 . Поскольку f непрерывна в этой точке, то
последнее соотношение влечет f (xnk ) → f (x0 ) ∈ Y (почему?). Значит, множество f (A)
компактно. •

Теорема 1.21 (обобщенная теорема Вейерштрасса) Пусть (X, ρ) — метриче-


ское пространство, числовая функция f : X → R непрерывна на компактном мно-
жестве A. Тогда функция f
1) ограничена на этом множестве,
2) принимает на множестве A наименьшее и наибольшее значения (то есть до-
стигает на множестве своих точной нижней границы и точной верхней границы).

Доказательство. 1) Так как по предыдущей теореме множество f (A) компактно,


то в силу теоремы 1.17 оно ограничено, то есть функция f ограничена на множестве A.
2) Поскольку функция f числовая, то f (A) ⊂ R. Обозначим m : = inf f (A), M :
= sup f (A). Из утверждения 1 нашей теоремы вытекает, что m ∈ R, M ∈ R. Нужно
доказать, что
∃ x0,1 ∈ A : f (x0 ) = M, f (x1 ) = m. (1.40)
Докажем свойство (1.40) для числа M.
По определению супремума числового множества число M − 1/n при любом n ∈ N
уже не является верхней границей множества f (A), поэтому существует точка xn ∈ A
такая, что f (xn ) > M − 1/n. С другой стороны, f (xn ) 6 M. Итак, определена такая
последовательность{xn } ⊂ A, что
1
∀n ∈ N M − < f (xn ) 6 M. (1.41)
n
По теореме о пределе зажатой последовательности из (1.41) вытекает, что

f (xn ) → M. (1.42)

В силу компактности множества A существуют подпоследовательность{xnk } ⊂ A и


точка x0 ∈ A такие, что
xn k → x0 . (1.43)

32
Поскольку функция f непрерывна в точке x0 , то соотношение (1.43) влечет

f (xnk ) → f (x0 ). (1.44)

Но из (1.42) по теореме 1.7, 3) (о пределе подпоследовательности) f (xnk ) → M. Учиты-


вая еще и (1.44), в силу теоремы 1.7, 1) убеждаемся, что f (x0 ) = M. •
Задание 1.11. Доказать соотношение (1.40) для числа m.
Снова рассмотрим общий случай функции f : X → Y, где (X, ρX ), (Y, ρY ) — метри-
ческие пространства.
Определение 1.30. Функция f называется равномерно непрерывной на множестве
A ⊂ X, если

∀ ε > 0 ∃ δ > 0 ∀ x1,2 ∈ A (ρX (x1 , x2 ) < δ ⇒ ρY (f (x1 ), f (x2 )) < ε).

Из равномерной непрерывности функции на множестве вытекает ее непрерывность на


этом множестве (почему?); обратное утверждение неверно.

Теорема 1.22 (обобщенная теорема Кантора) Если функция f непрерывна на


компактном множестве A ⊂ X, то она на нем равномерно непрерывна.

Доказательство проводится аналогично доказательству теоремы Кантора для чис-


ловых функций одной переменной.
Задание 1.12. Доказать обобщенную теорему Кантора.

33
Глава 2

Дифференциальное исчисление
функций нескольких переменных

Основные понятия темы «Дифференциальное исчисление функций одной перемен-


ной» — дифференцируемость, производные и дифференциалы различных порядков –
обобщаются на случай функции нескольких переменных. Построенный аппарат приме-
няется для исследования таких функций.
Существенно, что при фиксировании у функции нескольких переменных всех аргу-
ментов, кроме одного, она становится функцией лишь этого аргумента, то есть функ-
цией одного переменного.
Для компактности записей основное внимание здесь будет уделено функциям двух
переменных z = f (x, y).

2.1 Приращение функции. Определение непрерывно-


сти функции на языке приращений

Пусть M0 (x0 , y0 )— внутренняя точка области определения D(f ) функции z = f (x, y).
Введем ненулевой вектор приращения (смещения ) точки M0
∆M = (∆x, ∆y) (∆x2 + ∆y 2 6= 0).
Его координатами являются приращения ∆x, ∆y аргументов x, y функции f. Вектор
∆M связан лишь тем ограничением, чтобы новая точка
M : = M0 + ∆M (x0 + ∆x, y0 + ∆y)
содержалась во множестве D(f ). Разность
∆z = ∆f (M0 , ∆M ) : = f (x0 + ∆x, y0 + ∆y) − f (x0 , y0 ) (2.1)
называется приращением функции f в точке M0 , отвечающим вектору прираще-
ний ∆M . Таким образом, приращение ∆z функции f полностью определяется точкой
M0 (x0 , y0 ) и вектором ∆M (∆x, ∆y), то есть является функцией четырех вещественных
переменных x0 , y0 , ∆x, ∆y.
Рассмотрим евклидову норму вектора ∆M
p
ρ : = ||∆M ||E = ∆x2 + ∆y 2 . (2.2)

34
Для дальнейшего важно, что
½
∆x → 0
∆M → θ ⇔ ⇔ ρ → 0. (2.3)
∆y → 0

Переход от точки M0 к точке M возможен по любому направлению. Если, в част-


ности, двигаться по направлениям осей координат Ox, Oy (тогда ∆y = 0, ∆x = 0
соответственно), то придем к частным приращениям функции f в точке M0 по коор-
динатам x, y

∆x z = f (x0 + ∆x, y0 ) − f (x0 , y0 ), ∆y z = f (x0 , y0 + ∆y) − f (x0 , y0 ).

Согласно основному определению непрерывности 1.24, функция x = f (x, y) называ-


ется непрерывной в точке M0 (x0 , y0 ), если

lim f (x, y) = f (x0 , y0 ). (2.4)


x→x0
y→y0

Преобразуем это условие:

lim (f (x, y) − f (x0 , y0 )) = 0,


x→x0
y→y0

lim ∆z = 0. (2.5)
∆x→0
∆y→0

Поскольку соотношения (2.4),(2.5) равносильны, приходим к следующему определению


непрерывности функции двух переменных в точке на языке приращений.
Определение 2.1. Функция z = f (x, y) называется непрерывной в точке M0 (x0 , y0 ),
если справедливо соотношение (2.5), то есть бесконечно малым приращениям аргумен-
тов x, y отвечает бесконечно малое приращение функции.

2.2 Частные производные

2.2.1 Частные производные первого порядка


Обобщая понятие производной с функции одной переменной на функции несколь-
ких переменных, приходим к понятию частных производных (ЧП) по различным пере-
менным.
Пусть, как и ранее, M0 (x0 , y0 )— внутренняя точка области определения D(f ) функ-
ции z = f (x, y).
1) Зафиксировав y = y0 , рассмотрим функцию

f (x, y0 )

переменной x.
Определение 2.2. Частной производной по переменной x функции z = f (x, y) в
точке M0 (x0 , y0 ) называется производная функции f (x, y0 ) при x = x0 :
¯
∂f (x0 , y0 ) d f (x, y0 ) ¯¯
:= . (2.6)
∂x d x ¯x=x0

35
Применяют также следующие обозначения этой частной производной:
∂z
, zx0 , fx0 (M0 ).
∂x
Обязательно указание в каждом из этих символов переменной x, по которой вычисля-
ется частная производная; например, запись z 0 лишена смысла.
2) Зафиксировав теперь x = x0 , рассмотрим функцию

f (x0 , y)

переменной y.
Определение 2.3. Частной производной по переменной y функции z = f (x, y) в
точке M0 (x0 , y0 ) называется производная функции f (x0 , y) при y = y0 :
¯
∂f (x0 , y0 ) d f (x0 , y) ¯¯
:= ¯ . (2.7)
∂y dy y=y0

Другие обозначения частной производной по переменной y:


∂z
, zy0 , fy0 (M0 ).
∂y
Вспоминая определение производной функции одной переменной, приходим к опре-
делению частных производных первого порядка (ЧП-1) через предел:

∂f (x0 , y0 ) ∆x z ∂f (x0 , y0 ) ∆y z
: = lim , : = lim . (2.8)
∂x ∆x→0 ∆x ∂y ∆y→0 ∆y

2.2.2 Частные производные высших порядков

Частные производные высших порядков функции нескольких переменных вводятся


индуктивно: ЧП n-го порядка определяются как частные производнык от ЧП (n−1)- го
порядка.
00 00 00 00
Введем частные производные второго порядка zxx , zxy , zyx , zyy :
00
zxx : = (zx0 )0x , zxy
00
: = (zx0 )0y , zyx
00
: = (zy0 )0x , zyy
00
: = (zy0 )0y .

Аналогично задаются частные производные более высоких порядков; например,


000
zxyx : = ((zx0 )0y )0x .

Используются и более объемные обозначения ЧП высших порядков:

00 ∂ 2z 00 ∂ 2 z 000 ∂ 3z
zxy = , z = , z =
∂x ∂y xx ∂x2 xyx ∂x ∂y∂x

и т.д 1 .
Частные производные высших порядков, взятые по разным переменным, называют-
ся смешанными.
1
Иногда, особенно в технической литературе, при строчном обозначении частных производных верх-
ние индексы опускаются, например, zx , fxyx . Такая символика принята в учебнике [1].

36
Пример 2.1. Найдем ЧП-1 и ЧП-2 функции f (x, y) = x2 y 3 :
zx0 = [y = const] = 2xy 3 , zy0 = [x = const] = 3x2 y 2 .
00
zxx = (2xy 3 )0x = 2y 3 , zxy
00
= (2xy 3 )0y = 6xy 2 , zyx
00
= (3x2 y 2 )0x = 6xy 2 , zyy
00
= (3x2 y 2 )0y = 6x2 y.
Аналогично вводятся частные производные различных порядков функции m пере-
менных f (x1 , . . . , xm ), m > 2.
Определение 2.4. Говорят, что f (x1 , . . . , xm ) — функция класса
C (n) = C (n) (D) (n ∈ N ∪ {0}), если она имеет на множестве D ⊂ Rm непре-
рывные частные производные порядков до n включительно. В этом случае пишут
f ∈ C (n) (D). Функция класса C 1 (D) называется гладкой на множестве D. Говорят, что
f — функция класса C (∞) = C (∞) (D), если
∀ n ∈ N f ∈ C (n) (D).
Поскольку частные производные нулевого порядка функции f совпадают с самой
функцией, то символика f ∈ C (0) (D) означает, что функция f непрерывна на множе-
стве D.
Пример 2.2. Рассмотрим функцию двух переменных
f (x, y) = x|x|,
постоянную по переменной y. Поэтому
∂ n f (x, y)
∀ n ∈ N ∀(x, y) ∈ R2 = 0.
∂y n
Так как функция одной переменной |x| не имеет производной в точке x = 0, а при
x 6= 0 |x|0x = sign x, то
∂f
∀ (x, y) 6= (0, y) = (x|x|)0x = |x| + x · sign x = 2|x|.
∂x
Если же x = 0, то ¯
∂f (0, y) d(x|x|) ¯¯ ∆x|∆x|
= ¯ = lim = 0.
∂x dx x=0 ∆x→0 ∆x
Поэтому рассматриваемая функция имеет на R2 непрерывные ЧП-1
∂f ∂f
= 2|x|, = 0.
∂x ∂y
2
Однако в любой точке (0, y) ∂∂xf2 не существует, поскольку функция одной пере-
менной 2|x| не имеет производной в нуле. Таким образом, f (x, y) ∈ C (1) (R2 ), но
f (x, y) 6∈ C (2) (R2 ).
Задание 2.1. Доказать, что g(x, y) = x2 |x| ∈ C (2) (R2 ).
Пример 2.3. Рассмотрим многочлен степени (порядка) n ∈ N от m переменных
(относительно x1 , . . . , xm )
X
Pn (x1 , . . . , xm ) = ai1 ,...,im xi11 · · · · ximm ,
i1 +···+im 6n

при этом существует слагаемое с условием i1 + · · · + im = n. Так, функция примера 2.1


— многочлен пятой степени относительно x, y.
При вычислении частной производной степень многочлена уменьшается на единицу.
Поэтому любой многочлен — функция класса C (∞) (Rm ). Однако все ее ЧП порядков
выше n — нулевые функции.

37
Теорема 2.1 (достаточное условие равенства смешанных ЧП-2) Если смешан-
00 00
ные частные производные второго порядка fxy , fyx функции z = f (x, y)
1) существуют в некоторой окрестности точки (x0 , y0 ),
00 00
2) в точке (x0 , y0 ) непрерывны, то fxy (x0 , y0 ) = fyx (x0 , y0 ).

Доказательство основано на неоднократном применении теоремы Лагранжа, при-


чем всякий раз возникает число θi , удовлетворяющее неравенствам

0 < θi < 1. (2.9)

Существует такое положительное число h, что указанная в формулировке теоремы


окрестность точки M0 (x0 , y0 ) включает квадрат

[ x0 , x0 + h] × [y0 , y0 + h].

Введем функцию от h, содержащую значения функции f в вершинах квадрата:

δ(h) : = f (x0 + h, y0 + h) − f (x0 , y0 + h) + f (x0 , y0 ) − f (x0 + h, y0 ). (2.10)

Докажем,что
δ(h) 00
lim
= fxy (x0 , y0 ), (2.11)
h→0 h2

δ(h) 00
lim 2 = fyx (x0 , y0 ), (2.12)
h→0 h

откуда и будет следовать теорема. Из существования в окрестности точки M0 смешан-


00 00
ных ЧП-2 fxy , fyx вытекает существование в этой окрестности ЧП-1 fx0 , fy0 (почему?).
1) Рассмотрим функцию аргумента x, x0 6 x 6 x0 + h

ϕ(x) : = f (x, y0 + h) − f (x, y0 ).

Она имеет на отрезке [x0 , x0 + h] производную

ϕ0 (x) : = fx0 (x, y0 + h) − fx0 (x, y0 ). (2.13)

Объединив крайние и средние члены правой части формулы (2.10), представим


функцию δ(h) в виде приращения функции ϕ(x) на отрезке [x0 , x0 + h], а к послед-
ней применим теорему Лагранжа:

δ(h) = (f (x0 + h, y0 + h) − f (x0 + h, y0 )) − (f (x0 , y0 + h) − f (x0 , y0 )) = ϕ(x0 + h) − ϕ(x0 ) =


(2.13)
= ϕ0 (x0 + θ1 h) · h = (fx0 (x0 + θ1 h, y0 + h) − fx0 (x0 + θ1 h, y0 )) · h.
Поскольку выражение в скобках есть приращение функции от y fx0 (x0 + θ1 h, y) на
00
отрезке [y0 , y0 +h], а ее производная — функция fxy (x0 +θ1 h, y), то по теореме Лагранжа
00
δ(h) = fxy (x0 + θ1 h, y0 + θ2 h) · h2 .

Найдем
δ(h) 00
lim
2
= lim fxy (x0 + θ1 h, y0 + θ2 h).
h→0 h h→0

Так как с учетом неравенств (2.9)

lim (x0 + θ1 h, y0 + θ2 h) = (x0 , y0 ),


h→0

38
00
а функция fxy в точке (x0 , y0 ) непрерывна (см. условие 2) теоремы), то приходим к
равенству (2.11).
2) Доказательство формулы (2.12) аналогично, только теперь переменные x, y ме-
няются ролями.
Введем функцию переменной y, y ∈ [y0 , y0 + h]

ψ(y) : = f (x0 + h, y) − f (x0 , y).

Ее производная
ψ 0 (y) : = fy0 (x0 + h, y) − fy0 (x0 , y). (2.14)
Убедимся, что функция δ(h) представима в виде приращения функции ψ(x) на от-
резке [y0 , y0 + h], и вновь применим теорему Лагранжа:

δ(h) = (f (x0 + h, y0 + h) − f (x0 , y0 + h)) − (f (x0 + h, y0 ) − f (x0 , y0 )) = ψ(y0 + h) − ψ(y0 ) =


(2.14)
= ψ 0 (y0 + θ3 h) · h = (fy0 (x0 + h, y0 + θ3 h) − fy0 (x0 , y0 + θ3 h)) · h.
Воспользуемся теоремой Лагранжа теперь применительно к функции переменной
x fy0 (x, y0 + θ3 h), x ∈ [x0 , x0 + h], производная которой равна fyx
00
(x, y0 + θ3 h) :
00
δ(h) = fyx (x0 + θ4 h, y0 + θ3 h) · h2 .

Поэтому
δ(h) 00 00
lim = lim fyx (x0 + θ4 h, y0 + θ3 h) = fyx (x0 , y0 ). •
h→0 h2 h→0

Замечание 2.1. Методом математической индукции доказывается, что у функции


f класса C (n) (D), где D ⊂ Rm — открытое множество, смешанные частные производные
порядков не выше n не зависят от порядка вычисления частных производных, то есть,
например,
000 000 000
zxyy = zyxy = zyyx .

2.3 Дифференцируемость функции

2.3.1 Дифференцируемость и дифференциал

Пусть M0 (x0 , y0 ) — внутренняя точка области определения D(f ) функции


z = f (x, y).
Определение 2.5. Функция z = f (x, y) называется дифференцируемой в точке
M0 , если ее произвольное приращение в этой точке ∆z представимо в виде

∆z = A∆x + B∆y + α(M0 , ∆M )ρ, (2.15)

где A, B не зависят от ∆x, ∆y,

lim α(M0 , ∆M ) = 0. (2.16)


ρ→0

39
Линейная относительно ∆x, ∆y часть приращения ∆z называется дифференциалом
функции z = f (x, y) в точке M0

dz = d f (M0 , ∆M ) : = A∆x + B∆y. (2.17)

Более развернутый символ дифференциала d f (M0 , ∆M ) подчеркивает, что диффе-


ренциал (а не функция f !) зависит как от точки M0 (x0 , y0 ), так и от вектора приращений
∆M = (∆x, ∆y); подробнее — от x0 , y0 , ∆x, ∆y. Напомним, что от этих же вещественных
переменных зависит и приращение ∆z = ∆ f (M0 , ∆M ) функции двух переменных f.
Убедимся, что выражение α(M0 , ∆M )ρ есть бесконечно малая функция более высо-
кого порядка, чем ρ, при ρ → 0 2 , то есть что

α(M0 , ∆M )ρ = o(ρ), ρ → 0. (2.18)

Действительно,
α(M0 , ∆M )ρ (2.16)
lim = lim α(M0 , ∆M ) = 0.
ρ→0 ρ ρ→0

Поэтому формулу (2.15) можно представить более кратко:

∆z = dz + o(ρ), ρ → 0. (2.19)

В этом смысле дифференциал dz — главная линейная часть приращения ∆z функции.


Смысл дифференцируемости: приращение функции в окрестности точки M0 «по-
чти линейно», то есть является с точностью до слагаемого o(ρ) линейной функцией
приращений ∆x, ∆y ее аргументов.
В некоторых случаях удобна более подробная, чем (2.15), форма приращения диф-
ференцируемой функции, содержащая, наряду с дифференциалом, два слагаемых.

Лемма 2.1 Функция z = f (x, y) дифференцируема в точке M0 (x0 , y0 ) тогда и только


тогда, когда существуют такие функции ε1,2 (M0 , ∆M ), обладающие свойством

lim ε1,2 (M0 , ∆M ) = 0, (2.20)


∆x→0
∆y→0

что приращение ∆z функции в точке M0 имеет вид

∆z = A∆x + B∆y + ε1 (M0 , ∆M )∆x + ε2 (M0 , ∆M )∆y. (2.21)

Доказательство состоит в построении по функции α функций ε1,2 и, наоборот,


по функциям ε1,2 — функции α. При преобразованиях соответствующих выражений
происходит умножение и деление на ρ; учитывается также тот факт, что в силу (2.2)

|∆x| |∆y|
6 1, 6 1. (2.22)
ρ ρ

1) Пусть функция f дифференцируема в точке M0 , ρ 6= 0. Преобразуем


µ ¶ µ ¶
ρ2 (2.2) ∆x ∆y
α·ρ=α· = α ∆x + α ∆y.
ρ ρ ρ
2
Символика g = o(f ), x → a, где функции одного переменного f, g БМ при x → a, означает, что
lim f (x)/(g(x)) = 0.
x→a

40
Поэтому при ∆M 6= θ
∆x ∆y
ε1 (M0 , ∆M ) : = α(M0 , ∆M ) · , ε2 (M0 , ∆M ) : = α(M0 , ∆M ) · .
ρ ρ
Учитывая (2.3), (2.16), (2.22) и теорему 1.11, 6), находим
∆x
lim ε1 (M0 , ∆M ) = lim α(M0 , ∆M ) = 0.
∆x→0 ρ→0 ρ
∆y→0

Аналогично проверяется, что


lim ε2 (M0 , ∆M ) = 0.
∆x→0
∆y→0

Если же ρ = 0, то есть ∆M = θ, то положим ε1,2 (M0 , θ) : = 0.


2) Пусть справедливы формулы (2.21), (2.20). Преобразуем при ρ 6= 0
ρ ∆x ∆y
(ε1 ∆x + ε2 ∆y) · = (ε1 + ε2 ) · ρ.
ρ ρ ρ
Поэтому полагаем при ∆M 6= θ
∆x ∆y
α(M0 , ∆M ) : = ε1 (M0 , ∆M ) · + ε2 (M0 , ∆M ) · .
ρ ρ
Тогда
(2.20)
lim α(M0 , ∆M ) = 0.
ρ→0

Наконец, полагаем α(M0 , θ) : = 0. •


Задание 2.2. Дать определение дифференцируемости функции m переменных
(m > 2) z = f (x1 , . . . , xm ) в точке M0 (x01 , . . . , x0m ).

2.3.2 Необходимые условия дифференцируемости

Установим два важных необходимых условия дифференцируемости функции


нескольких переменных.
Теорема 2.2 Если функция z = f (x, y) дифференцируема в точке M0 (x0 , y0 ), то в
этой точке существуют ее ЧП-1, причем
∂f (M0 ) ∂f (M0 )
A= , B= . (2.23)
∂x ∂y
Доказательство. Докажем первую из формул (2.23). Выберем вектор приращений
∆M : = (∆x, 0), тогда ∆y = 0, ∆z = ∆x z = f (x0 + ∆x, y0 ) − f (x0 , y0 ) и формула (2.21)
упрощается:
∆x z = A∆x + ε1 ∆x.
(2.20)
При этом lim ε1 = 0. Поэтому существует
∆x→0
(∆y=0)

∆x z (2.8) ∂f (M0 )
lim = lim (A + ε1 ∆x) = A = . •
∆x→0 ∆x ∆x→0 ∂x
Задание 2.3. Доказать вторую из формул (2.23).
Следствие 2.1. Если в точке (x0 , y0 ) не существует хотя бы одной из ЧП-1 функции
z = f (x, y), то она в ней недифференцируема.

41
Теорема 2.3 Если функция z = f (x, y) дифференцируема в точке M0 (x0 , y0 ), то она в
этой точке непрерывна.

Доказательство. Так как


(2.21) (2.20)
lim ∆z = lim (A∆x + B∆y + ε1 (M0 , ∆M )∆x + ε2 (M0 , ∆M )∆y) = 0,
∆x→0 ∆x→0
∆y→0 ∆y→0

то по определению 2.1 функция f непрерывна в точке M0 . •


Следствие 2.2. Если функция z = f (x, y) разрывна в точке (x0 , y0 ), то она в ней
недифференцируема.
Замечание 2.2. В теоремах 2.2, 2.3 указаны лишь необходимые условия диффе-
ренцируемости функции нескольких переменных, не являющиеся достаточными. По-
строим соответствующие контрпримеры.
1) Пусть ½
0, если xy = 0 ,
f (x, y) =
1, если xy 6= 0 .
Так как вдоль осей координат f (x, y) = 0, то

∆x f (θ) = f (∆x, 0) − f (0, 0) = 0, ∆y f (θ) = 0

и поэтому fx0 (θ) = fy0 (θ) = 0. В то же время функция разрывна в точке θ, поскольку
в любой ее окрестности она принимает значения 0, 1. Но тогда по следствию 2.2 она
недифференцируема в рассматриваемой точке.
2) Рассмотрим теперь непрерывную функцию
p
g(x, y) = x2 + y 2 . (2.24)

Поскольку g(x, 0) = |x|, g(o, y) = |y|, то не существуют gx0 (θ), gy0 (θ), но тогда функция
недифференцируема в точке θ.

2.3.3 Достаточные условия дифференцируемости

Теорема 2.4 Если частные производные первого порядка fx0 , fy0 функции z = f (x, y)
1) существуют в окрестности U (M0 , δ) точки M0 (x0 , y0 ),
2) непрерывны в точке M0 ,
то функция дифференцируема в этой точке.

Доказательство. Достаточно проверить условия (2.21), (2.20) (см. лемму 2.1).


Пусть (x0 + ∆x, y0 + ∆y) ∈ U (M0 , δ), тогда и (x0 , y0 + ∆y) ∈ U (M0 , δ). Преобразуем
∆z к сумме разностей функций одной переменной
(2.1)
∆z = f (x0 +∆x, y0 +∆y)−f (x0 , y0 )±f (x0 , y0 +∆y) = (f (x0 +∆x, y0 +∆y)−f (x0 , y0 +∆y))+

+(f (x0 , y0 + ∆y) − f (x0 , y0 )).


Применим к каждой разности теорему Лагранжа:

∆z = fx0 (x0 + θ1 ∆x, y0 + ∆y) · ∆x + fy0 (x0 , y0 + θ2 ∆y) · ∆y; (2.25)

42
здесь величины θ1,2 вновь удовлетворяют неравенствам (2.9) (обосновать формулу
(2.25)!). Поскольку

lim (x0 + θ1 ∆x, y0 + ∆y) = lim (x0 , y0 + θ2 ∆y) = (x0 , y0 ),


∆x→0 ∆x→0
∆y→0 ∆y→0

а ЧП-1 fx0 , fy0 непрерывны в точке (x0 , y0 ), то

lim fx0 (x0 + θ1 ∆x, y0 + ∆y) = fx0 (x0 , y0 ), lim fy0 (x0 , y0 + θ2 ∆y) = fy0 (x0 , y0 ). (2.26)
∆x→0 ∆x→0
∆y→0 ∆y→0

Введем функции

ε1 : = fx0 (x0 + θ1 ∆x, y0 + ∆y) − fx0 (x0 , y0 ), ε2 : = fy0 (x0 , y0 + θ2 ∆y) − fy0 (x0 , y0 ).

В силу (2.26) lim ε1,2 = 0. Но тогда из (2.25) вытекает, что


∆x→0
∆y→0

∆z = (fx0 (x0 , y0 ) + ε1 )∆x + (fy0 (x0 , y0 ) + ε2 )∆y.

Таким образом, соотношения (2.21), (2.20) справедливы. •


Внимательный читатель безусловно заметил идейную близость доказательств этой
теоремы и теоремы 2.1.
Задание 2.4. Переформулировать лемму 2.1 и теоремы 2.2-2.4 на случай функции
f (x1 , . . . , xm ) m переменных.
Следствие 2.3. Функция f, гладкая на открытом множестве D ⊂ Rm , дифферен-
цируема в каждой точке этого множества.

2.4 Геометрический и физический смысл частных


производных первого порядка. Геометрический
смысл дифференцируемости и дифференциала

Укажем геометрический смысл частной производной fx0 (x0 , y0 ) функции двух пере-
менных z = f (x, y), опираясь на определение 2.2. Рассекая график функции плоскостью
y = y0 , получим кривую z = f (x, y0 ). Проводя касательную Tx к ней в точке

(x0 , y0 , f (x0 , y0 )) (2.27)

(она также лежит в этой плоскости), найдем угол α между Tx и положительным на-
правлением оси Ox. Тогда
fx0 (x0 , y0 ) = tg α.
Иначе говоря. fx0 (x0 , y0 ) — угловой коэффициент касательной Tx к кривой z = f (x, y0 ).
Аналогично, fy0 (x0 , y0 ) — угловой коэффициент касательной Ty к кривой z = f (x0 , y),
проведенной в точке (2.27).
Физический смысл ЧП-1. Частная производная по x fx0 (M0 ) есть скорость изме-
нения функции z = f (x, y) в точке M0 в направлении координатного орта ~i = (1, 0).
Аналогично, частная производная по y fy0 (M0 ) есть скорость изменения функции в
точке M0 в направлении координатного орта ~j = (0, 1).

43
Геометрический смысл дифференцируемости функции связан с понятием касатель-
ной плоскости к ее графику.
Пусть функция z = f (x, y) дифференцируема в точке M0 , тогда приращение функ-
ции в этой точке представимо формулой (2.19). Запишем ее подробнее:

f (x, y) = f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ) + o(ρ), ρ → 0. (2.28)

Определение 2.6. Касательной плоскостью к графику функции z = f (x, y) в точке


(2.27) называется плоскость

T : z = f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ). (2.29)

Таким образом, касательная плоскость T характеризуется тем свойством, что точка


(x, y, f (x, y)) графика функции уклоняется от точки (x, y, z) ∈ T на величину o(ρ).
Геометрический смысл дифференцируемости. Функция z = f (x, y) дифференциру-
ема в точке (x0 , y0 ) тогда и только тогда, когда к ее графику можно провести в точке
(2.27) касательную плоскость.
Можно доказать, что касательная плоскость T образована касательными к кривым,
проходящим на графике функции через точку (2.27) [4, с. 472].
Так как
fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ) = dz,
то из формулы (2.29) вытекает равенство

dz = z − f (x0 , y0 ). (2.30)

Поэтому дифференциал функции равен приращению аппликаты касательной плоско-


сти T. В этом заключается геометрический смысл дифференциала функции двух пере-
менных.
Посмотрим теперь на дифференцируемую функции с точки зрения аппроксимации
(приближения) функций. Дифференцируемая в точке M0 функция z = f (x, y) допус-
кает линеаризацию в ее окрестности. Точнее, она представима с погрешностью o(ρ)
линейной функцией

z = f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ), (2.31)

графиком которой является касательная T. При этом линейная функция с названным


свойством единственна.
На практике часто, отбрасывая в формуле (2.19) слагаемое o(ρ), полагают прибли-
женно
∆z ≈ dz. (2.32)
Более подробно,

f (x, y) ≈ f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ). (2.33)

Формулы (2.32), (2.33) применяются для приближенного вычисления значений функции


в точках, близких к точке M0 .

44
2.5 Вычисление производных и частных производных
сложных функций
Формулы, которые мы выведем в этом пункте, специфичны для функций несколь-
ких переменных.
Пусть функции z = f (x, y), x = ϕ(t), y = ψ(t) образуют сложную функцию
z = F (t) : = f (ϕ(t), ψ(t)) одного переменного t.

Теорема 2.5 Если функции x = ϕ(t), y = ψ(t) имеют производные в точке t0 , а функ-
ция z = f (x, y) дифференцируема в соответствующей точке (x(t0 ), y(t0 )), то сложная
функция z = f (ϕ(t), ψ(t)) имеет производную в точке t0 , вычисляемую по формуле

dz ∂z dx ∂z dy
= · + · . (2.34)
dt ∂x dt ∂y dt
Доказательство. Придадим переменной t такое приращение ∆t в точке t0 , чтобы
t0 + ∆t ∈ D(F ). Тогда и функции x = ϕ(t), y = ψ(t) испытают приращения

∆x = ϕ(t0 + ∆t) − ϕ(t0 ), ∆y = ψ(t0 + ∆t) − ψ(t0 ).

Так как внешняя функция z = f (x, y) дифференцируема в точке (x0 , y0 ), то ее при-


ращение представимо в виде
∂z ∂z
∆z = ∆x + ∆y + ε1 ∆x + ε2 ∆y.
∂x ∂y
Но тогда
∆z ∂z ∆x ∂z ∆y ∆x ∆y
= + + ε1 + ε2 . (2.35)
∆t ∂x ∆t ∂y ∆t ∆t ∆t
Поскольку функции x = ϕ(t), y = ψ(t) имеют производные в точке t0 , то

∆x dx ∆y dy
lim = ϕ0 (t0 ) = , lim = ψ 0 (t0 ) = .
∆t→0 ∆t dt ∆t→0 ∆t dt
Отсюда следует также, что эти функции непрерывны в точке t0 , но тогда по определе-
нию непрерывности функции одной переменной на языке приращений

lim ∆x = 0, lim ∆y = 0.
∆t→0 ∆t→0

(2.20)
Так как lim ε1,2 = 0, то и lim ε1,2 = 0. Поэтому существует предел при ∆t → 0
∆x→0 ∆t→0
∆y→0
выражения, стоящего в правой части формулы (2.35):
µ ¶
∂z ∆x ∂z ∆y ∆x ∆y ∂z dx ∂z dy
lim + + ε1 + ε2 = · + · .
∆t→0 ∂x ∆t ∂y ∆t ∆t ∆t ∂x dt ∂y dt

Переходя к пределу в равенстве (2.35) при ∆t → 0, и приходим к формуле (2.34). •


Следствие 2.4. Производная сложной функции z = f (x, g(x)) вычисляется по
формуле
dz ∂z ∂z dy
= + · . (2.36)
dx ∂x ∂y dx

45
Доказательство. Теперь t = x, поэтому
dx
= 1. •
dt
Следствие 2.5. Частные производные первого порядка сложной функции несколь-
ких переменных

z = f (ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk )) (k ∈ N, k > 1)

определяются следующим образом:


∂z ∂z ∂x ∂z ∂y ∂z ∂z ∂x ∂z ∂y
= · + · ,..., = · + · . (2.37)
∂t1 ∂x ∂t1 ∂y ∂t1 ∂tk ∂x ∂tk ∂y ∂tk

Предполагается, что функции x = ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk ) имеют ЧП-1 в точке


(t01 , . . . , t0k ), а внешняя функция z = f (x, y) дифференцируема в соответствующей точке
(x0 , y0 ) такой. что x0 = ϕ(t01 , . . . , t0k ), y0 = ψ(t01 , . . . , t0k ).
Доказательство. При нахождении частных производных сложной функции по
каждому аргументу ti (1 6 i 6 k) остальные аргументы фиксируются и рассматрива-
ется функция лишь одной переменной ti . Поэтому приходим к формулам типа (2.34),
только теперь все производные становятся частными. •
Замечание 2.3. Формулы (2.34), (2.37) обобщаются на случай, когда внешняя
функция зависит от m (m > 2) переменных:

z = f (x1 , . . . , xm ), x1 = ϕ1 (t1 , . . . , tk ), . . . , xm = ϕm (t1 , . . . , tk ).

Задание 2.5. Записать указанные обобщения формул (2.34), (2.37).

2.6 Дифференциалы функции нескольких перемен-


ных
Перейдем к рассмотрению дифференциалов функции нескольких переменных раз-
личных порядков. Важно, что дифференциал функции некоторого порядка объединяет
все ее частные производные этого порядка.
Пусть функция z = f (x, y) дифференцируема в каждой точке открытого множества
D ⊂ D(f ). Тогда в каждой точке M (x, y) ∈ D она имеет и дифференциал
∂z ∂z
dz = d f (M, ∆M ) = · ∆x + · ∆y.
∂x ∂y
Чтобы получить однотипную символику, введем дифференциалы аргументов

dx : = ∆x, dy : = ∆y.

Тогда приходим к следующей основной формуле


∂z ∂z
dz = d f (M, dM ) = · dx + · dy. (2.38)
∂x ∂y
Здесь
dM : = ∆M = (dx, dy) = (∆x, ∆y)

46
— вектор, составленный из дифференциалов аргументов.
Иногда дифференциал (2.38) функции z = f (x, y) называют полным, в отличие от
∂z ∂z
ее частных дифференциалов ∂x · dx, ∂y · dy по переменным x, y соответственно.
Формула (2.38) обобщается на функции m переменных

∂z ∂z
dz = d f (M, dM ) = · dx1 + · · · + · dxm , (2.39)
∂x1 ∂xm
где
M (x1 , . . . , xm ), dM : = ∆M = (dx1 , . . . , dxm ) = (∆x1 , . . . , ∆xm ).
Как и в случае функции одной переменной, формы (2.38), (2.39) дифференциала
функций двух и m переменных инвариантны относительно замены переменных. Сфор-
мулируем и докажем это свойство применительно к функциям двух переменных.
Свойство инвариантности формы дифференциала. Пусть z = f (x, y) — глад-
кая функция на открытом множестве D ⊂ R2 , а

x = ϕ(t1 , . . . , tk ), y = ψ(t1 , . . . , tk ) (k ∈ N, k > 1)

— гладкие функции на открытом множестве T ⊂ Rk , где определена сложная функция


z = f (ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk )). Тогда она дифференцируема на T, причем ее диффе-
ренциал вычисляется по формуле (2.38).
Доказательство. Рассматриваемая сложная функция по следствию 2.5 имеет ЧП-
1, определяемые формулами (2.37). Так как эти ЧП являются суммами произведений
непрерывных функций (каких?), то они непрерывны на T. Поэтому в силу теоремы
2.4 сложная функция дифференцируема на T и, значит, имеет дифференциал. Он, в
соответствии с общей формулой (2.39), определяется так:

∂z ∂z
dz = · dt1 + · · · + · dtk .
∂t1 ∂tk
Преобразуем, применяя формулы (2.37):
µ ¶ µ ¶
∂z ∂x ∂z ∂y ∂z ∂x ∂z ∂y
dz = · + · · dt1 + · · · + · + · · dtk =
∂x ∂t1 ∂y ∂t1 ∂x ∂tk ∂y ∂tk
µ ¶ µ ¶
∂z ∂x ∂x ∂z ∂y ∂y ∂z ∂z
= · · dt1 + · · · + · dtk + · · dt1 + · · · + · dtk = · dx + · dy.
∂x ∂t1 ∂tk ∂y ∂t1 ∂tk ∂x ∂y
Пришли к той же форме дифференциала. Однако здесь dx, dy — не произвольные
приращения аргументов, а дифференциалы функций x = ϕ(t1 , . . . , tk ), y = ψ(t1 , . . . , tk ).
Действительно, по формулам (2.39)

∂x ∂x ∂y ∂y
dx = · dt1 + · · · + · dtk , dy = · dt1 + · · · + · dtk . •
∂t1 ∂tk ∂t1 ∂tk
Следствие 2.6. (правила нахождения дифференциалов). Пусть

u = u(x1 , . . . , xm ), v = v(x1 , . . . , xm ) (2.40)

— дифференцируемые функции m переменных (m > 1), c — константа. Тогда


10 . d(cu) = c · du;
20 . d(u ± v) = du ± dv;

47
30 . d(uv) = du · v + dv · u;
³ u ´ du · v − dv · u
0
4 .d = .
v v2
Доказательство. Докажем, например, свойство 40 . Пусть вначале u, v — независи-
мые переменные, то есть рассмотрим функцию z = u/v. Тогда по формуле (2.38)
³ u ´ ³ u ´0 ³ u ´0 1 ³ u´ du · v − dv · u
d = · du + · dv = · du + − 2 · dv = .
v v u v v v v v2
Значит, для рассматриваемой частной ситуации получили нуж-
ную формулу. Но в силу свойства инвариантности она сохранит-
ся и в случае, когда u, v — дифференцируемые функции (2.40). •
Дифференциалы высших порядков функций нескольких переменных
Дифференциалы высших порядков функции f m переменных, как и производные
высших порядков, определяются индуктивно (рекуррентно). Осложняющая дело специ-
фика дифференциалов заключается в том, что они зависят как от аргументов функции
f, так и от их приращений, являясь, по существу, функциями уже 2m переменных.
Пусть m = 2. Будем предполагать, что z = f (x, y) — функция класса C (n) (D) на
открытом множестве D ⊂ R2 при всех рассматриваемых n, но тогда по замечанию 2.1,
с. 38 ее смешанные ЧП высших порядков не зависят от порядка вычисления частных
производных.
Будем исходить из формулы (2.38) (первого) дифференциала функции.
Определение 2.7. Дифференциал n-го порядка (n > 1), или n-ый дифференциал
функции z = f (x, y) определяется соотношением

dn z : = d(dn−1 )z (2.41)

в предположении, что
dx = const, dy = const. (2.42)
Отталкиваясь от формулы (2.38) и используя свойства дифференциалов, найдем
формулу вычисления дифференциала второго порядка:
µ ¶ µ ¶
2 ∂z ∂z (2.42),10 ,20 ∂z
d z = d(dz) = d · dx + · dy = d · dx+
∂x ∂y ∂x
µ ¶ µ 2 ¶ µ 2 ¶
∂z (2.38) ∂ z ∂ 2z ∂ z ∂ 2z
+d · dy = dx + dy · dx + dx + 2 dy · dy =
∂y ∂x2 ∂x ∂y ∂y∂x ∂y
· 2 2
¸ 2 2 2
∂ z ∂ z ∂ z ∂ z ∂ z
= = = 2
· dx2 + 2 · dx dy + 2 · dy 2 .
∂x∂y ∂y∂x ∂x ∂x∂y ∂y
Таким образом,
∂ 2z ∂ 2z ∂2z
d2 z = · dx 2
+ 2 · dx dy + · dy 2 . (2.43)
∂x2 ∂x∂y ∂y 2
Задание 2.6. Доказать формулу вычисления дифференциала третьего порядка
∂3z ∂ 3z ∂ 3z ∂ 3z
d3 z = · dx 3
+ 3 · dx 2
dy + 3 · dx dy 2
+ · dy 3 . (2.44)
∂x3 ∂x2 ∂y ∂x ∂y 2 ∂y 3
Замечание 2.4. Методом математической индукции можно доказать следующую
формулу для дифференциала произвольного n-ого порядка:
∂ nz n ∂ nz ∂ nz
dn z = n
dx + n n−1
dx n−1
dy + Cn
2
n−2 2
dxn−2 dy 2 + · · · +
∂x ∂x ∂y ∂x ∂y

48
µ ¶n
∂nz ∂nz ∂ nz n ∂ ∂
+Cnk dx n−k
dy k
+ · · · + n dx dy n−1
+ dy : = dx + dy z.
∂xn−k ∂y k ∂x ∂y n−1 ∂y n ∂x ∂y
(2.45)
Здесь
n(n − 1) . . . (n − k + 1)
Cnk = (1 6 k 6 n), Cn0 = 1.
k!
В случае функции m переменных (m > 2)
z = f (M ) = f (x1 , . . . , xm ) (2.46)
формулы вычисления дифференциалов высших порядков усложняются. Так,
X m
2 2 ∂ 2 f (M )
d z = d f (M, dM ) = dxi dxj , (2.47)
i,j=1
∂xi ∂xj
m
X
n n ∂ n f (M )
d z = d f (M, dM ) = dxi1 . . . dxin (ik ∈ N ∪ {0}) . (2.48)
i1 ,...,in =1
∂xi1 . . . ∂xin
Сумма, стоящая в правой части формулы (2.48), содержит много одинаковых слага-
емых, поскольку смешанные частные производные не зависят от порядка дифференци-
рования. Этим формула (2.48) отличается от аналогичной формулы (2.45) для функции
двух переменных.
Определение 2.8. Функция (2.46) называется однородной степени однородности
α ∈ R, если
∀ M ∈ D(f ) ∀ t ∈ R : tM ∈ D(f ) f (tM ) = tα · f (M ). (2.49)
Пример 2.4. Функции
x+y √
2 2
, x+y
x +y
являются однородными степеней (−1), 1/2 соответственно. •
Важным классом однородных функций являются однородные многочлены (формы)
нескольких переменных степени однородности n ∈ N
X
Pn (M ) = Pn (x1 , . . . , xm ) = ai1 ...im xi11 . . . ximm (ik ∈ N ∪ {0}). (2.50)
i1 +···+im =n

Сумма показателей степеней i1 , . . . , im при переменных x1 , . . . , xm у каждого слагаемого,


входящего в многочлен Pn , в точности равна n.
Как видно из формулы (2.48), n-ый дифференциал dn f (M, dM ) относительно диф-
ференциалов переменных dx1 , . . . , dxm является однородным многочленом степени од-
нородности n. В частности, первый дифференциал (2.39) — однородный многочлен
первой степени (линейная форма), а второй дифференциал (2.47) — однородный мно-
гочлен второй степени (квадратичная форма) относительно dx1 , . . . , dxm .
Замечание 2.5. Дифференциалы высших порядков функции нескольких перемен-
ных, вообще говоря, не обладают свойством инвариантности формы относительно за-
мены переменных. Убедимся в этом для d2 z, рассматривая функцию двух переменных.
Пусть
z = f (x, y), x = ϕ(t1 , . . . , tk ), y = ψ(t1 , . . . , tk )
и все эти функции класса C (2) на соответствующих множествах. Тогда существуют
дифференциалы dz, d2 z, причем dz обладает свойством инвариантности формы:
∂z ∂z
dz = d f (ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk )) = · dx + dy.
∂x ∂y

49
Здесь dx = dϕ(t1 , . . . , tk ), dy = dψ(t1 , . . . , tk ). Находим
µ ¶ µ ¶ µ ¶
2 ∂z ∂z 20 ,30 ∂z ∂z ∂z 2 ∂z 2
d z=d dx + dy = d dx + d dy + d x+ dy=
∂x ∂y ∂x ∂y ∂x ∂y

∂2z 2 ∂ 2z ∂ 2 z 2 ∂z 2 ∂z 2
= 2
dx + 2 dx dy + 2
dy + d x+ d y.
∂x ∂x∂y ∂y ∂x ∂y
Так как
d2 x = d2 ϕ(t1 , . . . , tk ), d2 y = d2 ψ(t1 , . . . , tk )
— вторые дифференциалы функций ϕ, ψ, то они, вообще говоря, ненулевые функции
своих аргументов. Таким образом, d2 z теперь определяется по более сложной, чем
(2.43), формуле.
Замечание 2.6. Дифференциалы высших порядков функции двух переменных
z = f (x, y) обладают свойством инвариантности формы относительно линейной замены
переменных

x = a1 t1 + · · · + ak tk + ak+1 , y = b1 t1 + · · · + bk tk + bk+1 (ai , bi − const).

Подробнее, если f ∈ C (n) (D), то сложная функция аргументов t1 , . . . , tk

f (a1 t1 + · · · + ak tk + ak+1 , b1 t1 + · · · + bk tk + bk+1 )

имеет на соответствующем множестве D1 ⊂ Rk дифференциалы порядков до n вклю-


чительно, определяемые по формулам (2.45).
Задание 2.7. Доказать этот факт методом математической индукции по числу n.
Задание 2.8. Обобщить утверждение задания 2.6 на случай функции m переменных
(2.46).

2.7 Формула Тейлора для функции нескольких пере-


менных
Будем исходить из формулы Тейлора для функции одной переменной y = f (x). Если
в окрестности точки x0 функция имеет производные порядков до (n + 1) включительно
(n ∈ N∪{0}), то в каждой точке x = x0 +∆x окрестности справедлива формула Тейлора
с остаточным членом в форме Лагранжа

f 0 (x0 ) f 00 (x0 ) 2 f (n) (x0 )


f (x) = f (x0 ) + (x − x0 ) + (x − x0 ) + · · · + (x − x0 )n +
1! 2! n!
f (n+1) (x0 + θ(x − x0 ))
+ (x − x0 )n+1 ,
(n + 1)!
где 0 < θ < 1 [1, с. 475]. Преобразуем эту формулу, записав ее через приращение и
дифференциалы функции. Поскольку

f (x) − f (x0 ) = ∆y = ∆f (x0 , ∆x), f (k) (x0 )(x − x0 )k = d k f (x0 , ∆x),

то приходим к формуле
1 2 1
∆ f (x0 , ∆x) = d f (x0 , ∆x) + d f (x0 , ∆x) + · · · + d n f (x0 , ∆x)+
2! n!

50
1
+ d n+1 f (x0 + θ∆x, ∆x). (2.51)
(n + 1)!
Формула Тейлора в дифференциалах (2.51) и обобщается на функции нескольких пере-
менных.
Теорема 2.6 Пусть (2.46) — функция класса C (n+1) (U (M0 , δ)) (n ∈ N ∪ {0}). Тогда
для каждой точки M = M0 + ∆M ∈ U (M0 , δ) найдется такое число θ, 0 < θ < 1, что
1 2 1
∆ f (M0 , ∆M ) = d f (M0 , ∆M ) + d f (M0 , ∆M ) + · · · + d n f (M0 , ∆M )+
2! n!
1
+ d n+1 f (M0 + θ∆M, ∆M ). (2.52)
(n + 1)!
Доказательство проведем для случая функции двух переменных z = f (x, y). Вы-
берем произвольную точку M (x0 + ∆x, y0 + ∆y) ∈ U (M0 , δ). Соединим точки M0 , M
отрезком прямой [M0 , M ]
½
x(t) = x0 + t∆x,
[M0 , M ] : t ∈ [0, 1]
y(t) = y0 + t∆y,

и рассмотрим сужение функции f на отрезке [M0 , M ] — функцию одной переменной t

F (t) : = f (x0 + t∆x, y0 + t∆y). (2.53)

При этом F (0) = f (M0 ), F (1) = f (M ). Поэтому приращение функции f есть в то же


время приращение функции F, где ∆t = 1 − 0 = 1 :

∆f (M0 , ∆M ) = ∆F (0, 1). (2.54)

Как следует из замечания 2.6, при всех t ∈ [0, 1] существуют дифференциалы функции
F всех порядков до (n + 1) включительно и

∀ t ∈ [0, 1] ∀ k 1 6 k 6 n + 1 d k F (t, 1) = d k f (M0 + t · ∆M, ∆M ). (2.55)

Значит, на отрезке [0, 1] существуют производные функции F этих порядков, но тогда


по формуле Тейлора (2.51) для функции одной переменной при некотором 0 < θ < 1
1 2 1 1
∆F (0, 1) = d F (0, 1) + d F (0, 1) + · · · + d n F (0, 1) + d n+1 F (θ, 1).
2! n! (n + 1)!
Возвращаясь в силу равенств (2.54), (2.55) к функции f, и приходим к требуемой фор-
муле (2.52). •
Замечание 2.7. Отбрасывая в формуле Тейлора (2.52) остаточный член
1
Rn (M0 , ∆M ) = d n+1 f (M0 + θ∆M, ∆M ),
(n + 1)!
получаем приближенное равенство
1 2 1
∆ f (M0 , ∆M ) ≈ d f (M0 , ∆M ) + d f (M0 , ∆M ) + · · · + d n f (M0 , ∆M ). (2.56)
2! n!
Тем самым мы функцию f приближаем многочленом n-ой степени относительно
∆x1 , . . . , ∆xn . Его называют многочленом наилучшего приближения функции f в
окрестности точки M0 .

51
Следствие 2.7. (обобщенная формула Лагранжа). Полагая в формуле (2.52)
n = 0, приходим к формуле

∆f (M0 , ∆M ) = df (M0 + θ∆M, ∆M ).

Запишем ее более подробно:

f (M ) = f (M0 )+fx0 1 (M0 +θ(M −M0 ))(x1 −x01 )+· · ·+fx0 m (M0 +θ(M −M0 ))(xm −x0m ). (2.57)

Здесь предполагается гладкость функции f на множестве U (x0 , δ).


Из обобщенной формулы Лагранжа (2.57) вытекает следующая важная
Теорема 2.7 (критерий постоянства функции нескольких переменных)
Пусть функция (2.46) является гладкой на открытом линейно связном множестве
D ⊂ Rm . Она постоянна на множестве D тогда и только тогда, когда

∀M ∈ D fx0 1 (M ) = · · · = fx0 m (M ) = 0. (2.58)

Доказательство. Если функция (2.46) постоянна на множестве D, то условия (2.58)


справедливы. Докажем обратное утверждение.
1) Проверим вначале, что функция f постоянна на любом открытом шаре

U (M0 , δ) ⊂ D.

Зафиксируем такой шар и выберем произвольную точку M = M0 + ∆M ∈ U (M0 , δ).


Применим формулу (2.57): f (M ) = f (M0 ) + 0 = f (M0 ). Значит, в каждой точке шара
функция принимает постоянное значение f (M0 ).
2) Теперь докажем постоянство функции f на всем множестве D. Нужно проверить,
что
∀ M0 , M1 ∈ D f (M0 ) = f (M1 ). (2.59)
Зафиксируем произвольно точки M1 , M2 ∈ D. В силу линейной связности их можно
соединить непрерывным путем ϕ : [0, 1] → D таким, что ϕ(0) = M0 , ϕ(1) = M1 . Иначе
говоря, на множестве D задана непрерывная ориентированная кривая

L : M (t) = ϕ(t), t ∈ [0, 1]

с началом в точке M0 и с концом в точке M1 .


В силу открытости множества D существует открытый шар U (M0 , δ) ⊂ D. Из дока-
занного в 1) следует, что

∀ M ∈ U (M0 , δ) f (M ) = f (M0 ). (2.60)

Так как кривая L непрерывна, то ее часть, примыкающая к начальной точке M0 , со-


держится в открытом шаре; подробнее, существует число τ > 0 такое, что

{ϕ(t), 0 6 t 6 τ } ⊂ U (M0 , δ).

Тогда, как вытекает из (2.60),

∀ t ∈ [0, τ ] f (ϕ(t)) = f (M0 ). (2.61)

Введем число
T : = sup τ,

52
где верхняя граница берется по всем числам τ ∈ (0, 1], удовлетворяющим условию
(2.61). Из непрерывности функции f (ϕ(t)) в точке t = T следует, что можно переходить
в равенстве (2.61) к пределу при τ → T :

f (ϕ(T )) = f (M0 ). (2.62)

Для проверки условия (2.59) нужно убедиться, что T = 1. Докажем это от против-
ного. Пусть T < 1 и поэтому ϕ(T ) 6= M1 , f (M1 ) 6= f (M0 ). Тогда существует такое число
∆t > 0, что
(2.62)
∀ t ∈ [T, T + ∆t] f (ϕ(t)) = f (ϕ(T )) = f (M0 ).
Но это противоречит выбору числа T. •
Замечание 2.8. Условия (2.58) можно записать более компактно следующим обра-
зом:
∀ M ∈ D d f (M ) = 0. (2.63)
Определение 2.9. Градиентом функции (2.46) в точке M называется вектор
µ ¶
∂f (M ) ∂f (M )
grad f (M ) = ∇f (M ) : = ,..., . (2.64)
∂x1 ∂xm
Понятие градиента — одно из основных в теории функций нескольких переменных.
Оно, в частности, позволяет записать дифференциал функции f через скалярное про-
изведение:
d f (M, ∆M ) = (grad f (M ), ∆M ). (2.65)
Наряду с градиентом grad f (M ), полезно иногда говорить об антиградиенте
(−grad f (M )).
Важное свойство градиента рассмотрим в следующем пункте.

2.8 Производная функции нескольких переменных по


направлению
Пусть ~s = (s1 , . . . , sm ) — единичный вектор в пространстве Rm .
Определение 2.10. Производной функции (2.46) по направлению ~s в точке M0
называется конечный предел
∂f (M0 ) f (M0 + ρ~s) − f (M0 )
: = lim ∈ R. (2.66)
∂~s ρ→0 ρ
Производная по направлению (2.66) характеризует скорость изменения функции
в точке M0 по направлению вектора ~s. Если она положительна (отрицательна), то
функция в точке M0 в данном направлении возрастает (убывает).
Понятие производной функции по направлению — обобщение понятия ЧП-1. Дей-
∂f (M0 ) ∂f (M0 )
ствительно, если ~s — k-ый координатный орт: ~s = ~ek , то = .
∂~s ∂xk
Теорема 2.8 Если функция (2.46) дифференцируема в точке M0 , то она имеет в этой
точке производную по любому направлению ~s
∂f (M0 )
= (grad f (M0 ), ~s). (2.67)
∂~s

53
Доказательство. Из дифференцируемости функции (2.46) в точке M0 в силу ра-
венства (2.19)
f (M0 + ∆M ) − f (M0 ) = d f (M0 , ∆M ) + o(ρ), ρ → 0.
Выберем нужный вектор приращений ∆M = ρ~s :
(2.65)
f (M0 + ρ~s) − f (M0 ) = d f (M0 , ρ~s) + o(ρ) = (grad f (M0 ), ρ~s) + o(ρ), ρ → 0.
Отсюда
f (M0 + ρ~s) − f (M0 ) o(ρ)
= (grad f (M0 ), ~s) + , ρ → 0. (2.68)
ρ ρ
Переходя в равенстве (2.68) к пределу при ρ → 0 и учитывая, что
o(ρ)
lim = 0,
ρ→0 ρ
получаем равенство (2.67). Значит, производная по направлению (2.66) существует и
определяется формулой (2.67). •
Следствие 2.8. Если grad f (M0 ) 6= θ, то функция (2.46) в точке M0 имеет наиболь-
шую, притом положительную производную по направлениию градиента, наименьшую,
притом отрицательную производную по направлению антиградиента. Таким образом,
скорость изменения функции в точке наибольшая (наименьшая) в направлении гра-
диента (антиградиента) 3 .
На этом свойстве градиента основаны численные методы поиска экстремума функ-
ции нескольких переменных, называемые градиентными. Мы сейчас рассмотрим ана-
литический способ нахождения экстремума.

2.9 Экстремумы функции нескольких переменных,


необходимые условия экстремума

В теории экстремума будем рассматривать дифференцируемые функции нескольких


переменных.
Пусть M0 (x01 , . . . , x0m ) — внутренняя точка области определения D(f ) функции (2.46).
Определение 2.11. Точка M0 называется точкой локального минимума функции
(2.46), если существует такая ее окрестность U (M0 , δ), что
∀ M ∈ U (M0 , δ) f (M ) > f (M0 ). (2.69)
Точка M0 называется точкой локального максимума функции (2.46), если существует
такая ее окрестность U (M0 , δ), что
∀ M ∈ U (M0 , δ) f (M ) 6 f (M0 ). (2.70)
Если при M 6= M0 неравенства в соотношениях (2.69), (2.70) строгие, то говорят о
строгом локальном минимуме и о строгом локальном максимуме соответственно. Точ-
ки локального минимума и максимума функции называются точками ее локального
экстремума.
3
Термин «градиент» принадлежит английскому физику Джеймсу Максвеллу (James Clerk Maxwell,
1831-1879), создателю математической теории электромагнитного поля, и происходит от латинского
слова gradior — расти.

54
Эпитет «локальный» ради краткости будем опускать, но надо все время иметь в
виду локальный характер этого свойства функции (2.46).
Замечание 2.9. При переходе от функции f к функции (−f ) ее точки эстремума
сохраняются, но точка минимума становится точкой максимума и наоборот.
Неравенства в соотношениях (2.69), (2.70) можно записать через приращение
∆ f (M0 , ∆M ) функции (2.46) в точке M0 :

∆f (M0 , ∆M ) 6 0, ∆f (M0 , ∆M ) > 0.

Отсюда вытекает важное


Замечание 2.10. Точка M0 является точкой минимума (максимума) функции (2.46)
тогда и только тогда, когда приращение ∆f (M0 , ∆M ) при ∆M ∈ U (θ, δ) неотрица-
тельно (неположительно). Точка M0 является точкой строгого минимума (строгого
максимума) функции (2.46) тогда и только тогда, когда это приращение положительно

(отрицательно) при ∆M ∈U (θ, δ).

Теорема 2.9 (обобщенная теорема Ферма) Пусть M0 точка экстремума функ-


ции (2.46) и в ней существуют ЧП-1. Тогда

∂f (M0 ) ∂f (M0 )
= 0, . . . , = 0. (2.71)
∂x1 ∂xm
Доказательство вытекает из теоремы Ферма для функций одной переменной [1, с.
168]. Пусть, ради определенности, M0 — точка минимума функции (2.46) и, стало быть,
справедливо условие (2.69). Докажем, что

∂f (M0 )
= 0. (2.72)
∂x1
Зафиксировав переменные x2 = x02 , . . . , xm = x0m , придем к функции одной переменной
g(x1 ) : = f (x1 , x02 , . . . , x0m ). Из (2.69) получаем, в частности, что

∀ x1 ∈ (x01 − δ, x01 + δ) g(x1 ) > g(x01 ).

Но это означает по определению, что x01 — точка минимума функции g(x1 ). Так как
существует
∂f (M0 )
g 0 (x01 ) = ,
∂x1
то по теореме Ферма g 0 (x01 ) = 0, что и означает выполнение условия (2.72). Проверка
остальных равенств системы (2.71) проводится аналогично. •
Следствие 2.9. (геометрический смысл теоремы при m = 2). Если M0 (x0 , y0 )
— точка экстремума функции z = f (x, y), дифференцируемой в этой точке, то каса-
тельная плоскость к графику функции в точке (x0 , y0 , f (x0 , y0 )) параллельна плоскости
xOy. •
Доказательство. Так как fx0 (M0 ) = fy0 (M0 ) = 0, то уравнение (2.29) касательной
плоскости записывается в виде z = f (x0 , y0 ).
Замечание 2.11. Необходимые условия (2.71) не являются достаточными услови-
ями экстремума. Обоснуем это, рассмотрев следующий
Пример 2.5. Пусть f (x, y) = xy. Тогда fx0 = y, fy0 = x. Система (2.71) имеет
единственное решение x0 = y0 = 0. Но в точке θ = (0, 0) нет экстремума функции,
поскольку при xy > 0 f (x, y) > f (0, 0) = 0, а при xy < 0 f (x, y < f (0, 0)) и в

55
любой окрестности точки θ ни одно из условий (2.69), (2.70) не выполнено. Так как
рассматриваемая функция всюду имеет ЧП-1, то по доказанной теореме она не имеет
точек экстремума. •
Определение 2.12. Внутренняя точка M0 (x01 , . . . , x0m ) области определения D(f )
функции (2.46), являющаяся решением системы

 ∂ f (x1 , . . . , xm )

 = 0,
 ∂x1
... ................ (2.73)

 ∂ f (x , . . . , x )

 1 m
= 0,
∂xm
называется стационарной точкой функции.
Замечание 2.12. Систему (2.73) можно записать одним векторным равенством

grad f (M ) = θ. (2.74)

Если функция (2.46) всюду имеет ЧП-1, то из теоремы 2.9 следует, что все ее точ-
ки экстремума содержатся среди стационарных точек. В силу замечания 2.11 каждую
стационарную точку надлежит подвергнуть дальнейшему исследованию посредством
достаточных условий экстремума.

2.10 Достаточные условия экстремума


При доказательстве сформулированных ниже достаточных условий экстремума
функции (2.46) основную роль играет проверка знака ее второго дифференциала
d2 f (M, ∆M ), являющегося квадратичной формой относительно ∆x1 , . . . , ∆xm . Поэтому
предварительно напомним аппарат изучения квадратичных форм.
Квадратичная форма (однородный многочлен второй степени) относительно пере-
менных h1 , . . . , hm представима в виде
m
X
P2 (H) = P2 (h1 , . . . , hm ) = ai,j hi hj . (2.75)
i,j=1

Она полностью определяется матрицей квадратичной формы (2.75)


 
a11 a12 . . . a1m
 a21 a22 . . . a2m 
A = (aij ) = 
 ... ... ... ... .

am1 am2 . . . amm


A — квадратная матрица порядка m, она является симметричной (aij = aji ). Для любой
квадратичной формы
P2 (0, . . . , 0) = P2 (θ) = 0.
Определение 2.13. Матрица A квадратичной формы (2.75) называется
1) положительно определенной, если

∀ H 6= θ P2 (H) > 0;

2) отрицательно определенной, если

∀ H 6= θ P2 (H) < 0;

56
3) знакопеременной, если квадратичная форма P2 (H) принимает как положительные,
так и отрицательные значения.
Замечание 2.13. Квадратичная форма с матрицей A отрицательно определена
тогда и только тогда, когда квадратичная форма с матрицей (−A) положительно опре-
делена.
Рассмотрим главные миноры
¯ ¯
¯ a11 a12 . . . a1k ¯
¯ ¯
¯ a21 a22 . . . a2k ¯
dk = ¯¯ ¯ (1 6 k 6 m)
¯
¯ ... ... ... ... ¯
¯ ak1 ak2 . . . akk ¯

матрицы A. При этом d1 = a11 , dm = detA.


Замечание 2.14. Главный минор k-ого порядка матрицы (−A) определяется фор-
мулой (−1)k dk .
Задание 2.9. Доказать замечание, опираясь на соответствующее свойство опреде-
лителя.
Приведем без доказательства следующую теорему [1, с. 300].

Теорема 2.10 (критерий Сильвестра) Матрица квадратичной формы положи-


тельно определена тогда и только тогда, когда все ее главные миноры положительны.

Рассмотрим теперь квадратичную форму (2.75), матрица которой составлена из


частных производных второго порядка функции (2.46):
µ 2 ¶
∂ f (M )
A(M ) : = . (2.76)
∂xi ∂xj

Элементы матрицы (2.76) — функции m переменных x1 , . . . , xm .

Лемма 2.2 Пусть функция (2.46) принадлежит классу C (2) (G), где G ⊂ Rm — от-
крытое множество, и матрица (2.76) положительно определена в точке M0 ∈ G.
Тогда существует окрестность U (M0 , δ) точки M0 такая, что матрица A(M ) поло-
жительно определена при M ∈ U (M0 , δ).

Доказательство. Из положительной определенности матрицы A(M0 ) и из крите-


рия Сильвестра следует положительность ее главных миноров:

dk (M0 ) > 0 (1 6 k 6 m).

Так как функции dk (M ) определяются через арифметические операции над ЧП-2 функ-
ции (2.46), которые непрерывны на множестве G, то и сами функции dk (M ) непрерывны
на G. Поэтому по замечанию 1.15

∃δk > 0 ∀ M ∈ U (M0 , δk ) dk (M ) > 0.

Выберем δ : = min{δk }, тогда

∀ M ∈ U (M0 , δ) dk (M ) > 0.

Снова применяя критерий Сильвестра, убеждаемся в положительной определенности


матрицы A(M ) в каждой точке M ∈ U (M0 , δ). •

57
Теорема 2.11 (достаточное условие строгого экстремума) Пусть M0 — стаци-
онарная точка функции (2.46) и функция в некоторой окрестности точки M0 при-
надлежит классу C (2) . Тогда,
1) если A(M0 ) — положительно определенная матрица, то M0 — точка строгого
минимума функции f ;
2) если матрица A(M0 ) отрицательно определена, то M0 — точка строгого мак-
симума функции;
3) если A(M0 ) — знакопеременная матрица, то M0 не является точкой экстрему-
ма функции f.

Доказательство вытекает из формулы Тейлора (2.52) при n = 1 :


1 2
∆ f (M0 , ∆M ) = d f (M0 , ∆M ) + d f (M0 + θ∆M, ∆M ), 0 < θ < 1. (2.77)
2
Равенство (2.77) справедливо в каждой точке M той окрестности точки M0 , о которой
шла речь в формулировке теоремы.
Так как M0 — стационарная точка функции, то в ней все ее ЧП-1 обращаются в
нуль и поэтому d f (M0 , ∆M ) = 0. Напомним, что второй дифференциал функции в
каждой точке M рассматриваемой окрестности есть квадратичная форма относительно
приращений ∆x1 , . . . , ∆xm с матрицей A(M ) :
X m
2 ∂ 2 f (M )
d f (M ) = ∆xi ∆xj .
i,j=1
∂xi ∂xj

Поэтому равенство (2.77) преобразуется к виду


m
1 X ∂f (M0 + θ∆M )
∆ f (M0 , ∆M ) = ∆xi ∆xj . (2.78)
2 i,j=1 ∂xi ∂xj

1) Пусть матрица A(M0 ) положительно определена. В силу леммы 2.2 найдется та-
кое число δ > 0, что при M ∈ U (M0 , δ) матрица A(M ) также положительно опре-
делена. Если M0 + ∆M ∈ U (M0 , δ), то отрезок [M0 M ] ⊂ U (M0 , δ) и поэтому точка
M0 + θ∆M ∈ U (M0 , δ). Значит, и матрица A(M0 + θ∆M ) положительно определена, но
тогда из (2.78) следует, что

∀ ∆M ∈ U (M0 , δ) ∆f (M0 , ∆M ) > 0.

Поэтому в силу замечания 2.10 M0 — точка строгого минимума функции f.


2) Если матрица A(M0 ) отрицательно определена, то матрица (−A(M0 )), построен-
ная для функции (−f ), положительно определена, тогда по замечанию 2.9 и в силу
доказанного в утверждении 1) M0 — точка строгого минимума функции (−f ) и точка
строгого максимума функции f.
3) Пусть A(M0 ) — знакопеременная матрица. Тогда существуют такие векторы при-
ращений ∆M1 , ∆M2 , что

d2 f (M0 , ∆M1 ) > 0, d2 f (M0 , ∆M2 ) < 0. (2.79)

Введем функции m переменных x1 , . . . , xm

g1 (M ) : = d2 f (M, ∆M1 ), g2 (M ) : = d2 f (M, ∆M2 ).

58
Так как они непрерывны в рассматриваемой окрестности точки M0 , а
(2.79)
g1 (M0 ) = d2 f (M0 , ∆M1 ) > 0, g2 (M0 ) < 0,

то в силу замечания 1.15 существует число δ > 0 такое, что при


(2.78)
M ∈ U (M0 , δ) g1 (M ) > 0, g2 (M ) < 0. Поэтому ∀ ∆M ∈ U (θ, δ) ∆f (M0 , ∆M1 ) =
1 2
2
d f (M0 + θ∆M1 , ∆M1 ) > 0, ∆f (M0 , ∆M2 ) = 12 d2 f (M0 + θ∆M2 , ∆M2 ) < 0 и, стало
быть, в точке M0 не выполнены условия определения 2.11 точки экстремума. •
Следствие 2.10. (достаточные условия строгого экстремума функции двух
переменных). Пусть M0 (x0 , y0 )— стационарная точка функции z = f (x, y). Построим
новую функцию
µ 2 ¶2
∂ 2 f (x, y) ∂ 2 f (x, y) ∂ f (x, y)
∆(x, y) = detA(x, y) = − .
∂x2 ∂y 2 ∂x ∂y

1) Если ∆(M0 ) > 0, то M0 — точка строгого экстремума функции: строгого мини-


∂ 2 f (M0 ) ∂ 2 f (M0 )
мума при > 0 и строгого максимума при < 0.
∂x2 ∂x2
2) Если ∆(M0 ) < 0, то в точке M0 нет экстремума функции f.
Доказательство. Из критерия Сильвестра и замечания 2.14 вытекают такие необ-
ходимые и достаточные условия положительной (отрицательной) определенности мат-
рицы A(M0 ) в случае m = 2 :

d1 (M0 ) > 0, d2 (M0 ) > 0 (d1 (M0 ) < 0, d2 (M0 ) > 0).

При этом
∂ 2 f (M )
d2 (M ) = det A(M ), d1 (M ) = . •
∂x2

2.11 Нахождение наименьшего и наибольшего значе-


ний функции нескольких переменных на ком-
пактном множестве
Задача нахождения экстремумов функции нескольких переменных (2.46) — зада-
ча ее локального исследования. Но в математике и ее приложениях часто возникают
глобальные экстремальные задачи, связанные с нахождением наименьшего и/или наи-
большего значений функции (2.46), стесненной некоторыми ограничениями. Назван-
ные ограничения могут быть различной структуры. Сейчас рассмотрим случай, когда
ограничения накладываются на множество, где рассматривается функция.
Задача. Найти наименьшее и наибольшее значение функции (2.46) на множестве
G ⊂ D(f ) ⊂ Rm .
Если множество G компактно, а функция дифференцируема на G, то задача имеет
единственное решение.
Так как дифференцируемая на множестве G функция (2.46) непрерывна на нем, то
в силу компактности G по обобщенной теореме Вейерштрасса 1.21, с. 31 она принимает
на G наименьшее значение k и наибольшее значение K. Укажем целесообразный путь
их нахождения.
1) Вычисляют значения функции (2.46) в ее стационарных точках, находящихся
внутри множества G.

59
2) Вычисляют наименьшее и наибольшее значения функции на границе ∂G множе-
ства G.
3) Среди чисел, найденных в пунктах 1), 2), выделяют наименьшее k и наиболь-
шее K.
В пункте 2) дело часто сводится к нахождению наименьшего и наибольшего зна-
чения некоторых функций одной переменной на отрезках. Такая задача решается в
рамках темы «Дифференциальное исчисление функций одной переменной».

2.12 Неявные функции

Рассмотрим важный способ задания функции y = f (x) посредством уравнения

F (x, y) = θ. (2.80)

Определение 2.14. Пусть задана функция F : X × Y → Z, где


X ⊂ Rm , Y ⊂ Rn , Z ⊂ Rn (m, n ∈ N), причем θ ∈ Z, здесь θ — нуль про-
странства Rn . Если существуют такие непустые множества D ⊂ X, E ⊂ Y, что при
каждом x ∈ D уравнение (2.80) имеет единственное решение y = f (x) ∈ E, то говорят,
что уравнение (2.80) определяет неявную функцию

y = f (x), x ∈ D, y ∈ E. (2.81)

При этом
∀x ∈ D F (x, f (x)) = θ (2.82)
или, что то же самое,

∀(x, y) ∈ D × E (F (x, f (x)) = θ ⇔ y = f (x)). (2.83)

Нас будет интересовать локальная задача существования неявной функции в


окрестности точки (x0 , y0 ), удовлетворяющей уравнению (2.80), а также способ ее диф-
ференцирования.

2.12.1 Неявные функции одной и нескольких переменных

Рассмотрим вначале простейший случай m = n = 1. Тогда x, y — вещественные


числа, а уравнение (2.80) принимает вид

F (x, y) = 0. (2.84)

Геометрический смысл неявной функции одной переменной. Уравнение (2.84) за-


дает на плоскости множество Γ, во многих случаях это – некоторая кривая. Пусть
F (x0 , y0 ) = 0, то есть точка M0 (x0 , y0 ) ∈ Γ. Уравнение (2.84) определяет в некоторой
окрестности точки M0 единственную неявную функцию тогда и только тогда, когда
часть кривой Γ, лежащая в этой окрестности, является графиком функции.

Теорема 2.12 (существования дифференцируемой неявной функции) Пусть

X = U (x0 , a), Y = U (y0 , b) (a, b > 0),

60
1) функция F (x, y) является гладкой на множестве X × Y,
2) F (x0 , y0 ) = 0,
3) Fy0 (x0 , y0 ) 6= 0.
Тогда существуют множества

D = U (x0 , δ), E = [y0 − h, y0 + h] (0 < δ 6 a, 0 < h < b)

такие, что при x ∈ D уравнение (2.84) определяет единственную неявную функцию


(2.81), удовлетворяющую условию f (x0 ) = y0 . Неявная функция имеет на множестве
D непрерывную производную
F 0 (x, y)
f 0 (x) = − x0 . (2.85)
Fy (x, y)
Доказательство. Уточняя условие 3) теоремы, будем предполагать, что

Fy0 (x0 , y0 ) > 0. (2.86)

I. Существование неявной функции. Так как функция Fy0 в силу условия 1) непре-
рывна на X × Y, то по замечанию 1.15 из (2.86) следует существование квадрата

K = [x0 − h, x0 + h] × [y0 − h, y0 + h] ⊂ X × Y

с центром в точке M0 такого, что

∀ (x, y) ∈ K Fy0 (x, y) > 0. (2.87)

Зафиксировав произвольно x ∈ [x0 − h, x0 + h], рассмотрим функцию от y

F (x, y), y ∈ [y0 − h, y0 + h]. (2.88)


(2.87)
Поскольку ее производная Fy0 (x, y) > 0 при y ∈ [y0 − h, y0 + h], то функция (2.88)
строго возрастает. В частности, является строго возрастающей на отрезке [y0 − h, y0 + h]
2)
и функция F (x0 , y). Так как F (x0 , y0 ) = 0, то

F (x0 , y) < 0 при y ∈ [y0 − h, y0 ), F (x0 , y) > 0 при y ∈ (y0 , y0 + h].

Поэтому
F (x0 , y0 − h) < 0, F (x0 , y0 + h) > 0. (2.89)
Рассмотрим теперь функции переменного x ∈ [x0 −h, x0 +h] F (x, y0 −h), F (x, y0 +h).
Они непрерывны на отрезке [x0 − h, x0 + h] и, согласно (2.89), при x = x0 принимают
отрицательное и положительное значения соответственно. В силу замечания 1.15 суще-
ствует число δ > 0 такое, что на интервале D = (x0 − δ, x0 + δ) они сохраняют тот же
знак:
∀ x ∈ D F (x, y0 − δ) < 0, F (x, y0 + δ) > 0. (2.90)
Докажем, что на множестве D уравнение (2.84) определяет единственную неявную
функцию. Выберем произвольную точку x ∈ D. Функция (2.88) непрерывна, строго
возрастает на отрезке E = [y0 − h, y0 + h] и, согласно (2.90), при y = y0 − h, y =
y0 + h принимает отрицательное и положительное значения соответственно. По теореме
Больцано-Коши [1, с. 126] она принимает в некоторой точке y ∈ E нулевое значение,
причем в силу строгого возрастания функции точка y единственна. Таким образом,

∀x ∈ D ∃!y ∈ E F (x, y) = 0.

61
Существование единственной неявной функции (2.81) доказано.
II. Непрерывность и непрерывная дифференцируемость неявной функции.
Докажем непрерывность и дифференцируемость неявной функции в произвольной
точке x ∈ D.
Выберем приращение ∆x такое, что x + ∆x ∈ D. Пусть

f (x) = y, f (x + ∆x) = y + ∆y,

при этом
F (x, y) = 0, F (x + ∆x, y + ∆y) = 0.
Поэтому приращение функции F в точке (x, y) F (x+∆x, y +∆y)−F (x, y) равно нулю.
С другой стороны, по обобщенной формуле Лагранжа (2.57)

F (x+∆x, y+∆y)−F (x, y) = Fx0 (x+θ∆x, y+θ∆y)∆x+Fy0 (x+θ∆x, y+θ∆y)∆y, 0 < θ < 1.

Поэтому
Fx0 (x + θ∆x, y + θ∆y)∆x + Fy0 (x + θ∆x, y + θ∆y)∆y = 0,
откуда
∆y F 0 (x + θ∆x, y + θ∆y)
= − x0 , (2.91)
∆x Fy (x + θ∆x, y + θ∆y)
Fx0 (x + θ∆x, y + θ∆y)
∆y = − ∆x. (2.92)
Fy0 (x + θ∆x, y + θ∆y)
Докажем, исходя из формулы (2.92), что

lim ∆y = 0,
∆x→0

откуда будет следовать непрерывность неявной функции (почему?). Для этого, согласно
теореме 1.11,6), достаточно проверить ограниченность функции

Fx0 (x, y)
(2.93)
Fy0 (x, y)

на множестве K. Так как на этом множестве функции Fx0 (x, y), Fy0 (x, y) непрерывны, а
Fy0 (x, y) 6= 0, то и функция (2.93) на K непрерывна и в силу компактности множества
K по обобщенной теореме Вейерштрасса 1.21 ограничена.
Убедимся теперь по определению, что неявная функция имеет в точке x производ-
ную. Докажем возможность перехода к пределу в равенстве (2.91) при ∆x → 0. Так
как
lim (x + θ∆x, y + θ∆y) = (x, y),
∆x→0

то в силу непрерывности функций Fx0 , Fy0 на множестве K

lim Fx0 (x + θ∆x, y + θ∆y) = Fx0 (x, y), lim Fy0 (x + θ∆x, y + θ∆y) = Fy0 (x, y) 6= 0
∆x→0 ∆x→0

и поэтому существует
∆y F 0 (x, y)
lim = − x0 .
∆x→0 ∆x Fx (x, y)
Тем самым существование производной неявной функции на множестве D и формула
(2.85) доказаны.

62
В правой части формулы (2.85) символом y обозначено значение в точке x неявной
функции (2.81):
F 0 (x, f (x))
∀ x ∈ D f 0 (x) = − x0 . (2.94)
Fy (x, f (x))
Из этой формулы, непрерывности на множестве D функций Fx0 (x, f (x))), Fy0 (x, f (x)) и
положительности последней функции вытекает непрерывность функции f 0 (x) на мно-
жестве D. •
Замечание 2.15. Теорема лишь доказывает существование неявной функции, но
не дает способа ее нахождения. Неявная функция может и не быть элементарной. При-
ведем исторический пример. Уравнение Кеплера (1609) 4

y − e sin y − x = 0 (0 < e < 1)

играет важную роль в нахождении эллиптических орбит планет. Оно определяет неяв-
ную функцию y = f (x). Действительно, теперь F (x, y) = y − e sin y − x и

Fy0 = 1 − e cos y 6= 0.

Однако функция f (x), определяемая уравнением Кеплера, не является элементарной.


Эта функция играет важную роль в астрономии, ее представляют в виде суммы функ-
ционального ряда.
Замечание 2.16. (дифференцирование неявной функции). Для нахождения
производной неявной функции удобнее, вместо прямого применения формулы (2.85),
дифференцировать уравнение (2.84) по x, считая y функцией от x :
Fx0
F (x, y(x)) = 0, Fx0 + Fy0 · y 0 = 0, y 0 = − .
Fy0

Пришли снова к формуле (2.85).


Пример 2.6. Найти производную функции, неявно заданной уравнением

x2 ln y = y 2 ln x.

Дифференцируем его по x в предположении y = y(x) :

y0 1 y(2x2 ln y − y 2 )
2x ln y + x2 · = 2yy 0 ln x + y 2 · , y 0 = .
y x x(2y 2 ln x − x2 )
Замечание 2.17. Если в формулировке теоремы условие 3) заменить условием
Fx0 (M0 ) 6= 0, то в некоторой окрестности точки M0 уравнение (2.84) будет определять
единственную неявную функцию от y x = g(y).
Следствие 2.11. (существование дифференцируемой неявной функции
нескольких переменных) Теорема 2.12 обобщается на случай m > 1, теперь
x = (x1 , . . . , xm ), при этом рассматривается кубическая окрестность точки x0 :
U (x0 , a) = UC (x0 , a). Последнее предложение в формулировке теоремы теперь зву-
чит так. Неявная функция является гладкой на множестве D и ее ЧП-1 вычисляются
по формулам
∂f (x) Fx0 (x, y)
= − 0k (1 6 k 6 m).
∂xk Fy (x, y)
4
Иоганн Кеплер (Johann Kepler, 1571-1630) – немецкий астроном и математик, открывший законы
движения планет.

63
2.12.2 Системы неявных функции нескольких переменных

Рассмотрим, наконец, неявные функции общего вида (m > 1, n > 1). Предваритель-
но введем некоторые понятия, связанные с функциями (отображениями)

y = f (x), x ∈ D ⊂ Rm , y ∈ Rn . (2.95)

Так как
∀x ∈ D f (x) ∈ Rn ,
то
f (x) = (f1 (x), . . . , fn (x)); (2.96)
здесь
fi (x) = fi (x1 , . . . , xm ) (1 6 i 6 n)
— функции m переменных, называемые координатными функциями отбражения
(2.95).
Если
fi (x) ∈ C (k) (G), 1 6 i 6 n, G ⊂ D,
то будем говорить, что f ∈ C (k) (G). В частности, при k = 1 отображение f называется
гладким на G. Введем матрицу Якоби гладкого отображения f
 ∂f (x) ∂f (x) ∂f1 (x)

1 1
. . .
µ ¶  ∂f∂x 1
2 (x)
∂x2
∂f2 (x)
∂xm
∂f2 (x) 
∂fi (x)  ∂x . . . ∂xm 
J = Jf (x) : = = 1 ∂x2 . (2.97)
∂xj  ... ... ... ... 
∂fn (x) ∂fn (x)
∂x1 ∂x2
. . . ∂f∂xn m
(x)

Она состоит из n строк и m столбцов, ее строки составлены из градиентов координатных


функций fi отображения f.
Если m = n, то матрица Якоби становится квадратной. Ее определитель называется
якобианом системы функций f1 , . . . , fn

D(f1 , . . . , fn )
: = detJ. (2.98)
D(x1 , . . . , xn )

Якобиан является обобщением производной функции одной переменной на случай си-


стемы n функций n переменных (2.96). Действительно, при n = 1 якобиан упрощается
df (x)
и становится равным .
dx
Однако, согласно определению 2.14, мы рассматриваем функцию F : X × Y → Z, то
есть отображение
F (x, y) = (F1 (x, y), . . . , Fn (x, y))
с координатными функциями

Fi (x, y) = Fi (x1 , . . . , xm , y1 , . . . , yn ) (1 6 i 6 n),

каждая из которых является функцией m + n переменных.

64
Теорема 2.13 Пусть

X = UC (x0 , a) ⊂ Rm , Y = UC (y0 , b) ⊂ Rn (a, b > 0),

1) функция F (x, y) является гладкой на множестве X × Y,


2) F (x0 , y0 ) = θ,
3) в точке (x0 , y0 )
D(F1 , . . . , Fn )
6= 0.
D(y1 , . . . , yn )
Тогда существуют множества

D = UC (x0 , δ), E = UC (y0 , h) (0 < δ 6 a, 0 < h 6 b)

такие, что при x ∈ D уравнение (2.84) определяет единственную неявную функцию


(2.81), удовлетворяющую условию f (x0 ) = y0 и гладкую на множестве D.
Доказательство может быть проведено методом математической индукции по чис-
лу n [1, с. 312-315]. Другое доказательство теоремы см. в [7, с. 139-141].

2.13 Условные экстремумы


Кратко рассмотрим важную для приложений задачу нахождения точек (локально-
го) экстремума функции (2.46) при выполнении условий типа равенств

ϕ1 (x1 , . . . , xm ) = 0, . . . , ϕn (x1 , . . . , xm ) = 0 (1 6 n < m). (2.99)

Определение 2.15. Множество Ω ⊂ Rm решений системы (2.99) называется мно-


гообразием, порожденным функциями ϕ1 , . . . , ϕn . Многообразие Ω называют невырож-
денным, если матрица Якоби µ ¶
∂ϕi (M )
J= (2.100)
∂xj
имеет в каждой точке M ∈ Ω максимальный ранг n.
Определение 2.16. Пусть M0 ∈ Ω. Говорят, что функция (2.46) имеет в точке M0
условный минимум (максимум) на многообразии Ω, если существует такое число δ > 0,
что
∀ M ∈ U (M0 , δ) ∩ Ω f (M ) > f (M0 ) (f (M ) 6 f (M0 )).
Если же при M 6= M0 неравенства строгие, то приходим к строгому условному мини-
муму (строгому условному максимуму).
Пусть M0 — точка условного экстремума. Поскольку многообразие Ω невырожден-
ное, то существует минор n-го порядка матрицы Якоби (2.100), отличный в точке M0
от нуля. Пусть это якобиан
D(ϕ1 , ϕ2 , . . . , ϕn )
(M0 ) 6= 0. (2.101)
D(xm−n+1 , xm−n+2 , . . . , xm )
Введем обозначения

x : = (x1 , . . . , xm−n ) ∈ Rm−n , y : = (xm−n+1 , . . . , xm ) ∈ Rn ,

тогда M = (x, y). Систему уравнений (2.99) можно записать кратко одним уравнением

ϕ(x, y) = θ, (2.102)

65
где ϕ = (ϕ1 , . . . , ϕn ). Из (2.101) и теоремы 2.13 в окрестности точки x0 уравнение (2.102)
определяет единственную неявную функцию y = g(x). При этом для каждой точки
названной окрестности, принадлежащей многообразию Ω, исходная функция преобра-
зуется в сложную функцию m − n переменных:

f (M )|Ω = f (x, y)|Ω = f (x, g(x)).

Поэтому возможны два пути решения рассматриваемой задачи на условный экстре-


мум.
1) В простых случаях, когда уравнение (2.102) явно разрешимо относительно x и
мы сможем работать аналитически с функцией f (x, g(x)), дело сводится к нахождению
точек экстремума этой функции меньшего числа переменных.
2) К сожалению, подход 1) применим далеко не всегда: неявную функцию g(x),
существование которой доказано, часто явным образом получить не удается. В этом,
общем случае применяется метод множителей Лагранжа, сводящий задачу на услов-
ный экстремум к задаче на безусловный экстремум функции Лагранжа

L(M, λ) = L(x1 , . . . , xm , λ1 , . . . , λn ) : = f + λ1 ϕ1 + · · · + λn ϕn . (2.103)

Теорема 2.14 (необходимые условия условного экстремума) Пусть M0 — точ-


ка условного экстремума функции (2.46) на невырожденном многообразии Ω. Тогда
существует такой набор множителей Лагранжа λ0 = (λ01 , . . . , λ0n ), что (M0 , λ0 ) —
критическая точка функции Лагранжа L(M, λ).

Доказательство этой теоремы мы опускаем [1, с. 321-323].


Следствие 2.12. Для нахождения m+n неизвестных величин x1 , . . . , xm , λ1 , . . . , λn
имеем систему также из m + n уравнений (2.99),

∂L(M, λ)
= 0, 1 6 i 6 m. (2.104)
∂xi
Замечание 2.18. Как и в теории безусловного экстремума, знак ∆L(M0 , λ0 ) совпа-
дает со знаком второго дифференциала функции Лагранжа

d2 L(M0 , λ0 ). (2.105)

Поэтому достаточным условием условного экстремума является определенность (поло-


жительная или отрицательная) квадратичной формы (2.105). В ней учитываются связи
между дифференциалами переменных x1 , . . . , xm , которые находятся дифференцирова-
нием равенств (2.99).

66
Глава 3

Кратные интегралы

Теперь переходим к изучению раздела «Интегральное исчисление функций несколь-


ких переменных». В главах 3,4 построим различные обобщения определенных интегра-
лов — кратные (в частности, двойные и тройные) интегралы, криволинейные интегра-
лы, установим связь между ними. Все эти типы интегралов вводятся как пределы со-
ответствующих интегральных сумм. Укажем важные приложения построенной теории
в математике и физике.
Напомним определение и условия существования определенного интеграла (Рима-
на). Для функции одной переменной f (x), определенной на отрезке [a, b], вводится раз-
биение τ отрезка [a, b] на n ∈ N частичных отрезков [xi−1 , xi ] :
n
[
τ : [a, b] = [xi−1 , xi ].
i=1

Оно производится точками x1 , . . . , xn−1 такими, что


a = x0 < x1 < ... < xi−1 < xi < ... < xn−1 < xn = b.
Ранг λτ разбиения τ есть наибольшая из длин ∆xi = xi − xi−1 всех частичных отрезков.
Каждому разбиению τ (в случае ограниченности функции f ) отвечает нижняя сум-
ма Дарбу sτ (f ) и верхняя сумма Дарбу Sτ (f )
n
X n
X
sτ (f ) = mi · ∆xi , Sτ (f ) = Mi · ∆xi .
i=1 i=1

Здесь
mi := inf f (x), Mi := sup f (x).
x∈[xi−1 ,xi ] x∈[xi−1 ,xi ]

Для введения интегральной суммы нужно выбрать произвольно на каждом частичном


отрезке [xi−1 , xi ] точку ξi , тогда
n
X
στ,ξ (f ) = f (ξi )∆xi .
i=1

Интеграл Римана функции f на отрезке [a, b] определяется как конечный предел ее


интегральных сумм при λτ → 0 :
Zb
f (x)dx := lim στ,ξ (f ) ∈ R.
λτ →0
a

67
В этом случае функция f называется интегрируемой (по Риману) на отрезке [a, b.]
В курсе математического анализа ранее доказано следующее необходимое условие
интегрируемости: если функция f интегрируема на отрезке [a, b], то она ограничена на
нем.
Для выделения достаточных условий интегрируемости используется аппарат сумм
Дарбу. Выясняется, что нижняя сумма Дарбу sτ (f ) и верхняя сумма Дарбу Sτ (f ) явля-
ются точными границами множества {στ,ξ (f )}τ интегральных сумм с фиксированным
разбиением τ. Кроме того, множество нижних сумм Дарбу {sτ (f )} функции f распо-
ложено на числовой прямой левее множества ее верхних сумм Дарбу {Sτ (f )}. Доказы-
вается следующий
Критерий интегрируемости. Функция f интегрирума на отрезке [a, b] тогда и
только тогда, когда
lim (Sτ (f ) − sτ (f )) = 0 ⇔
λτ →0

∀ε > 0 ∃δ > 0 ∀τ (λτ < δ ⇒ Sτ (f ) − sτ (f ) < ε).


Этот критерий позволил установить следующие достаточные условия интегрируемости
функции на отрезке: 1) непрерывность, 2) монотонность.

3.1 Квадрируемые фигуры

Несколько углубим теорию квадрируемости и кубируемости, построенную ранее.


Напомним, что плоская фигура P называется квадрируемой (измеримой по Жордану),
если ее верхняя площадь s∗ (P ) и нижняя площадь s∗ (P ) совпадают, при этом площадь
фигуры есть их общее значение: s(P ) : = s∗ (P ) = s∗ (P ). Здесь

s∗ (P ) = sup AP , s∗ (P ) = inf BP .

Множество AP состоит из площадей многоугольников q ⊂ P, а множество BP — из


площадей многоугольников Q ⊃ P.
Вырожденный многоугольник — точка; его площадь равна нулю. Невырожденный
многоугольник — замкнутое множество, ограниченное одной или несколькими замкну-
тыми ломаными; его площадь есть сумма площадей треугольников, на которые он раз-
бивается.
В теории кратных интегралов часто будем рассматривать компактные множества
пространств Rm , то есть ограниченные замкнутые множества. Установим связь между
квадрируемостью плоского множества P ⊂ R2 и площадью его границы ∂P .
Определение 3.1. Плоская кривая L называется кривой нулевой площади, если
для любого числа ε > 0 найдется такой многоугольник r ⊃ L, что s(r) < ε.
Замечание 3.1. Объединение конечного числа кривых нулевой площади есть также
кривая нулевой площади.
Теорема 3.1 1) Если функция y = f (x) непрерывна на отрезке [a, b], то ее график —
кривая нулевой площади. 2) Если функция x = g(y) непрерывна на отрезке [c, d], то ее
график — кривая нулевой площади.
Доказательство вытекает из критерия интегрируемости функции через суммы
Дарбу. Проведем его для утверждения 1) теоремы. Напомним. что график Γf функ-
ции f
Γf : = {(x, y)|x ∈ [a, b], y = f (x)}.

68
Зафиксируем произвольно положительное число ε. Так как функция f непрерывна
на отрезке [a, b], то она на нем интегрируема. Как вытекает из критерия интегрируемо-
сти, для выбранного ε найдется такое число δ > 0, что при любом разбиении τ отрезка
с условием λτ < δ Sτ − sτ < ε.
Выберем любое разбиение τ с рангом λτ < δ. Но разность
n
X
Sτ − sτ = (Mi − mi )∆xi
i=1

есть площадь s(r) многоугольника r ⊃ Γf , составленного из прямоугольников с длинами


оснований ∆xi и высотами Mi −mi . Поэтому s(r) < ε и для кривой Γf выполнено условие
определения 3.1. •
Следствие 3.1. Если граница ∂P множества P ⊂ R2 состоит из конечного числа
кривых, указанных в теореме 3.1, то она имеет нулевую площадь.

Теорема 3.2 Компактное множество P ⊂ R2 квадрируемо тогда и только тогда,


когда его граница L = ∂P имеет нулевую площадь.

Доказательство опирается на критерий квадрируемости.


1) Пусть компактное плоское множество P квадрируемо. Зададимся произвольно
числом ε > 0. По критерию квадрируемости существуют такие многоугольники q, Q,
что q ⊂ P ⊂ Q и
s(Q) − s(q) < ε. (3.1)
Многоугольник Q, содержащий многоугольник q, можно представить в виде объеди-
нения многоугольников q, r, не имеющих общих внутренних точек, причем ∂P ⊂ r.
По свойству аддитивности площади s(Q) = s(q) + s(r), но тогда из неравенства (3.1)
следует, что s(r) < ε. Это и означает по определению 3.1, что кривая ∂P имеет нулевую
площадь.
2) Пусть теперь, наоборот, для кривой ∂P выполнено условие определения 3.1. Вы-
берем произвольно число ε > 0 и найдем такой многоугольник r ⊃ ∂P, что

s(r) < ε. (3.2)

При этом можем считать, что этот многоугольник не покрывает всей фигуры P . Тогда
из точек множества P, не содержащихся в r, образуется некоторое непустое открытое
множество. Присоединяя к нему граничные точки, получим многоугольник q такой, что
q ∪ r = Q, q ⊂ P ⊂ Q. Тогда s(Q) = s(q) + s(r). Поэтому из неравенства (3.2) следует,
что
s(r) = s(Q) − s(q) < ε. •
В теории двойных интегралов будем рассматривать лишь компактные множества,
границы которых имеют нулевую площадь. В силу теоремы 3.2 они квадрируемы.

3.2 Определение двойного интеграла


Пусть функция двух переменных f (x, y) определена на компактном квадрируемом
множестве P ⊂ R2 .

69
Определение 3.2. Разбиением τ компактного множества P называется его пред-
ставление в виде такого объединения конечного числа квадрируемых компактных мно-
жеств n
[
τ: P = Pi ,
i=1
что различные множества Pi не имеют общих внутренних точек. Компактные множе-
ства Pi назовем ячейками разбиения τ.
Строить разбиение τ удобно посредством выделения на множестве P нескольких
кривых нулевой площади. При этом по свойству аддитивности площади
n
X
s(P ) = s(Pi ); (3.3)
i=1

предполагается, что s(P ) > 0, s(Pi ) > 0.


Определение 3.3. Пусть (X, ρ) — метрическое пространство, множество A ⊂ X
ограничено. Диаметром d(A) множества A называется число
d(A) : = sup ρ(x, x0 ).
x,x0 ∈A

Расстоянием между множествами B ⊂ X, C ⊂ X называется число


ρ(B, C) : = inf ρ(x, y).
x∈B,y∈C

Определение 3.4. Рангом λτ разбиения τ называется наибольший из диаметров


его ячеек:
λτ : = max d(Pi ).
Выбрав в каждой ячейке Pi произвольным образом точку Mi (ξi , ηi ), составляем инте-
гральную сумму функции f
n
X
στ,Mi (f ) = σ := f (Mi ) · s(Pi ).
i=1

Она определяется разбиением τ и набором {Mi } отмеченных точек Mi , что и выражено


в ее полном обозначении.
Определение 3.5. Говорят, что существует конечный предел I интегральных сумм
στ,Mi (f ) при λτ → 0, если для любого положительного числа ε найдется такое положи-
тельное число δ, что для всякого разбиения τ такого, что λτ < δ, независимо от выбора
отмеченных точек справедливо неравенство |στ,Mi (f ) − I| < ε, то есть
∀ ε > 0 ∃ δ > 0 ∀τ (λτ < δ ⇒ |στ,Mi (f ) − I| < ε). (3.4)
Смысл определения: все интегральные суммы, отвечающие любому разбиению с
достаточно малым рангом, отличаются от числа I сколь угодно мало.
Определение 3.6. (основное определение). Если существует конечный предел I
интегральных сумм функции f (x, y) на множестве P при λτ → 0, то функцию называют
интегрируемой (по Риману) на множестве P, а числоRRI называют двойным интегралом
функции f на множестве P и обозначают символом f (x, y) dx dy :
P
ZZ
f (x, y) dx dy := lim στ,Mi (f ) ∈ R. (3.5)
λτ →0
P

70
Сразу же сможем вычислить важный двойной интеграл. Пусть f (x, y) = 1, P —
любое (квадрируемое) компактное множество положительной площади. Тогда произ-
вольная интегральная сумма
n
X (3.3)
στ,Mi (1) = 1 · s(Pi ) = s(P ).
i=1

Поэтому условие (3.4) выполнено при I = s(P ) и, значит,


ZZ
s(P ) = dx dy. (3.6)
P

Получили универсальную формулу нахождения площади компактной плоской фигуры.


В дальнейшем рассматриваются такие вопросы теории двойного интеграла: 1) су-
ществование, 2) свойства, 3) вычисление. Многие утверждения и доказательства,
связанные с проблемами 1) и 2), практически полностью переносятся из раздела «Ин-
теграл Римана». Это связано с тем, что основная работа идет здесь со значениями
функции, а не с аргументами. В то же время задача вычисления двойного интеграла
сводится к нахождению двух определенных интегралов, взятых по разным переменным,
так что основное внимание будет уделено этой проблеме.

3.3 Существование двойного интеграла

Теорема 3.3 (необходимое условие существования двойного интеграла) Если


функция f (x, y) интегрируема на квадрируемом компактном множестве P, то она
на нем ограничена.
Доказательство проводится методом от противного. Предположение неограничен-
ности функции f на P приводит к тому, что множество {στ,Mi (f )}τ интегральных сумм
функции f, отвечающих любому фиксированному разбиению τ, неограничено. Но тогда
условие (3.4) не выполнено ни при каком I ∈ R.
Задание 3.1. Дать полное доказательство теоремы.
Из теоремы 3.3 следует, что неограниченная на множестве P функция f не интегри-
руема на нем. Поэтому будем рассматривать лишь ограниченные функции.
Как и в теории определенных интегралов, введем суммы Дарбу ограниченной на
множестве P функции f . Пусть τ — произвольное разбиение множества P. Функция
ограничена на каждой ячейке Pi , 1 6 i 6 n разбиения и поэтому существуют
mi : = inf f (x, y), Mi : = sup f (x, y). (3.7)
(x,y)∈Pi (x,y)∈Pi

Тогда нижняя сумма Дарбу sτ = sτ (f ) и верхняя сумма Дарбу Sτ = Sτ (f ) функции f,


отвечающие разбиению τ, определяются равенствами
n
X n
X
sτ (f ) = mi · s(Pi ), Sτ (f ) = Mi · s(Pi ).
i=1 i=1

Укажем следующие основные свойства сумм Дарбу.


1. ∀ τ sτ (f ) = inf{στ,Mi (f )}τ ; Sτ (f ) = sup{στ,Mi (f )}τ .
2. ∀ τ ∀ τ1 sτ (f ) 6 Sτ1 (f ).

71
Теорема 3.4 (критерий интегрируемости) Функция f (x, y), ограниченная на квад-
рируемом компактном множестве P, интегрируема на нем тогда и только тогда,
когда
lim (Sτ (f ) − sτ (f )) = 0,
λτ →0
то есть когда
∀ε > 0 ∃δ > 0 ∀τ (λτ < δ ⇒ Sτ (f ) − sτ (f ) < ε). (3.8)
Следствие 3.2. Если функция f интегрируема на множестве P, то
ZZ ZZ
lim sτ (f ) = f (x, y) dx dy, lim Sτ (f ) = f (x, y) dx dy. (3.9)
λτ →0 λτ →0
P P

Доказательства указанных утверждений проводятся по той же схеме, что и для


определенных интегралов.
Отметим, что ZZ
f (x, y) dx dy = sup{sτ (f )} = inf{Sτ (f )}
P
и поэтому ZZ
∀τ sτ (f ) 6 f (x, y) dx dy 6 Sτ (f ). (3.10)
P

Теорема 3.5 (достаточное условие существования двойного интеграла) Если


функция f (x, y) непрерывна на квадрируемом компактном множестве P, то она на
нем интегрируема.
Доказательство опирается на обобщенную теорему Кантора 1.22 и критерий ин-
тегрируемости 3.4.
Зафиксируем любое число ε > 0. По обобщенной теореме Кантора для числа
ε/s(P ) > 0 найдется такое число δ > 0, что
µ ¶
0 0 0 0 0 0 ε
∀ (x, y) ∈ P ∀ (x , y ) ∈ P ρ((x, y), (x , y )) < δ ⇒ |f (x, y) − f (x , y )| < . (3.11)
s(P )
Выберем произвольно разбиение τ со свойством λτ < δ. Пусть Pi , 1 6 i 6 n
— произвольная ячейка этого разбиения. Если (x, y), (x0 , y 0 ) — любые ее точки, то
ρ((x, y), (x0 , y 0 )) 6 d(Pi ) 6 λτ < δ и в силу (3.11) |f (x, y) − f (x0 , y 0 )| < ε/s(P ). Выбирая
точки (x, y) ∈ Pi , (x0 , y 0 ) ∈ Pi так, чтобы
f (x, y) = Mi , f (x0 , y 0 ) = mi
(почему это возможно?), приходим к неравенствам
ε
∀ i 1 6 i 6 n Mi − mi < . (3.12)
s(P )
Но тогда
n
X n
X n
X n
(3.12) ε X
Sτ (f ) − sτ (f ) = Mi · s(Pi ) − mi · s(Pi ) = (Mi − mi ) · s(Pi ) < · s(Pi ) =
i=1 i=1 i=1
s(P ) i=1
ε
= · s(P ) = ε.
s(P )
Выполнено условие (3.8) критерия интегрируемости 3.4. •
Докажем, что при изменении значений функции в точках кривой нулевой площади
интегрируемость функции не нарушается и значение двойного интеграла не меняется.

72
Теорема 3.6 Пусть функции f (x, y), g(x, y) ограничены на квадрируемом компакт-
ном множестве P, L — кривая нулевой площади (L ⊂ P ),

∀ (x, y) ∈ P \ L f (x, y) = g(x, y) (3.13)

и функция f (x, y) интегрируема на множестве P. Тогда функция g(x, y) также ин-


тегрируема на этом множестве и
ZZ ZZ
f (x, y) dx dy = g(x, y) dx dy. (3.14)
P P

Доказательство. Так как функции f, g ограничены на множестве P, то существует


такое число K > 0, что

∀ (x, y) ∈ P |f (x, y)| 6 K, |g(x, y)| 6 K. (3.15)

В силу интегрируемости функции f на множестве P


ZZ
lim στ,Mi (f ) = f (x, y) dx dy = I. (3.16)
λτ →0
P

Нужно убедиться в том, что существует

lim στ,Mi (g) = I,


λτ →0

то есть что
∀ ε > 0 ∃ δ > 0 ∀τ (λτ < δ ⇒ |στ,Mi (g) − I| < ε). (3.17)
Зафиксировав произвольное разбиение τ множества P, преобразуем интегральные
суммы функций f, g. Ячейки разбиения τ разделяются на две группы

{Pi }, 1 6 i 6 l, {Pj }, l + 1 6 j 6 n

так, что
Pi ∩ L = ∅, Pj ∩ L 6= ∅
(возможно, потребуется перенумерация ячеек). Тогда
l
X n
X
0 00 0 00
στ,Mi (f ) = σ (f ) + σ (f ), σ (f ) = f (Mi )s(Pi ), σ (f ) = f (Mj )s(Pj ). (3.18)
i=1 j=l+1

Аналогично преобразуются и интегральные суммы функции g (соответствующие фор-


мулы получаются из (3.18) заменой символа f на символ g). Так как, в силу условия
(3.13), на множестве
[l
Pi
i=1

функции f, g совпадают, то
0 0
σ (f ) = σ (g). (3.19)
Преобразуем и оценим сверху выражение |στ,Mi (g)−I|, стремясь выделить слагаемое
|στ,Mi (f ) − I| :
0 00 (3.19) 0 00 00
|στ,Mi (g) − I| = |σ (g) + σ (g) − I| = |σ (f ) + σ (g) − I ± σ (f )| =

73
0 00 00 00 0 00 00 00
= |(σ (f ) + σ (f ) − I) − σ (f ) + σ (g)| 6 |σ (f ) + σ (f ) − I| + |σ (f )| + |σ (g)| =
00 00
= |στ,Mi (f ) − I| + |σ (f )| + |σ (g)|.
Зафиксируем произвольно число ε > 0. Для доказательства свойства (3.17) про-
верим, что при разбиениях множества P с достаточно малым рангом каждое из трех
слагаемых
00 00
|στ,Mi (f ) − I|, |σ (f )|, |σ (g)|
меньше ε/3.
1) Из (3.16) следует, что для числа ε/3 > 0 найдется такое положительное число
δ1 , что при любом разбиении τ множества P с условием λτ < δ1 независимо от выбора
точек Mi справедливо неравенство
ε
|στ,Mi (f ) − I| < . (3.20)
3
2) Поскольку L — кривая нулевой площади, то она покрывается многоугольником
сколь угодно малой площади. Но множество
n
[
PL : = Pj
j=l+1

также покрывает кривую L, поэтому при достаточно малом ранге λτ разбиения τ его
площадь
n
X
s(PL ) = s(Pj )
j=l+1

тоже сколь угодно мала. Значит, существует такое число δ2 > 0, что
³ ε ´
∀ τ λτ < δ2 ⇒ s(PL ) < . (3.21)
3K
00
Оценим по модулю слагаемое σ (f ) интегральной суммы στ,Mi (f ), отвечающее множе-
ству PL , предполагая, что λτ < δ2 :
n
X n
X n
X
00
(3.15) (3.21) ε
|σ (f )| = | f (Mj )s(Pj )| 6 |f (Mj )s(Pj )| 6 K s(Pj ) = K · s(PL ) < .
j=l+1 j=l+1 j=l+1
3
00
Так же оценивается |σ (g)|. Таким образом,
00 ε 00 ε
|σ (f )| < , |σ (g)| < , (3.22)
3 3
если ранг разбиения τ меньше δ2 .
Выберем δ : = min{δ1 , δ2 }. Тогда при любом разбиении τ с условием λτ < δ
00 00 (3.20),(3.22) ε ε ε
|στ,Mi (g) − I| < |στ,Mi (f ) − I| + |σ (f )| + |σ (g)| < + + = ε.
3 3 3
Таким образом, условие (3.17) выполнено. •
Следствие 3.3. Если ограниченная на множестве P функция f (x, y) не является
непрерывной (разрывна) лишь вдоль линии L ⊂ P нулевой площади, то она интегри-
руема на множестве P.
Замечание 3.2. Утверждение, аналогичное теореме 3.6, доказывается и для опре-
деленных интегралов. Справедлива

74
Теорема 3.7 Если функции f (x), g(x), ограниченные на отрезке [a, b], отличаются
лишь в конечном числе точек отрезка и функция f (x) интегрируема на отрезке, то
на нем интегрируема и функция g(x), причем
Zb Zb
f (x) dx = g(x) dx.
a a

3.4 Свойства двойного интеграла


Мы дадим лишь формулировки свойств двойного интеграла, вполне аналогичные
свойствам определенного интеграла.
Свойство 10 (линейность). Если на множестве P интегрируемы функции f, g,
то при любых вещественных числах α, β на этом множестве интегрируема функция
αf + βg, причем
ZZ ZZ ZZ
(αf (x, y) + βg(x, y)) dx dy = α f (x, y) dx dy + β g(x, y) dx dy.
P P P
0 00
Свойство 20 (аддитивность). Если множество P представимо в виде P = P ∪ P ,
0 00
P , P — квадрируемые компактные множества без общих внутренних точек и функция
0 00
f интегрируема на множестве P, то она интегрируема на множествах P , P и
ZZ ZZ ZZ
f (x, y) dx dy = f (x, y) dx dy + f (x, y) dx dy. (3.23)
P P0 P 00

Свойство 30 (неотрицательность). Если функция f интегрируема и неотрица-


тельна на множестве P, то ZZ
f (x, y) dx dy > 0.
P
0
Свойство 4 (почленное интегрирование неравенств). Если функции f, g ин-
тегрируемы на множестве P и
∀ (x, y) ∈ P f (x, y) 6 g(x, y),
то ZZ ZZ
f (x, y) dx dy 6 g(x, y) dx dy. (3.24)
P P
0
Свойство 5 (оценка интеграла). Если функция f интегрируема на множестве
P и
∀ (x, y) ∈ P m 6 f (x, y) 6 M,
то ZZ
m · s(P ) 6 f (x, y) dx dy 6 M · s(P ). (3.25)
P
0
Свойство 6 (оценка модуля интеграла). Если функция f интегрируема на
множестве P, то на этом множестве интегрируема функция |f | и
¯ ¯
¯Z Z ¯ ZZ
¯ ¯
¯ f (x, y) dx dy ¯6 |f (x, y)| dx dy. (3.26)
¯ ¯
¯ ¯
P P

75
Свойство 70 (теорема о среднем для двойных интегралов). Если функ-
ция f непрерывна на линейно связном компактном множестве P, то существует точка
M (x, y) ∈ P такая, что ZZ
f (x, y) dx dy = f (x, y)s(P ). (3.27)
P

3.5 Вычисление двойного интеграла сведением к по-


вторному
Мы уже отмечали, что вычисление двойного интеграла сводится к повторному инте-
гралу, то есть к последовательному нахождению двух определенных интегралов, взятых
по различным аргументам функции f (x, y). Пределы интегрирования в определенных
интегралах полностью определяются конфигурацией множества P.
Утверждение 1 Утверждение 2
Пусть функция f (x, y) непрерывна на множестве
½ ½
a 6 x 6 b, c 6 y 6 d,
P : (3.27a) P : (3.27b)
ϕ1 (x) 6 y 6 ϕ2 (x), ψ1 (y) 6 x 6 ψ2 (y),
причем функции
ϕ1 (x), ϕ2 (x) (x ∈ [a, b]) ψ1 (y), ψ2 (y) (y ∈ [c, d])
непрерывны на соответствующих отрезках. Тогда

à ! à !
RR Rb ϕR
2 (x) RR Rd ψR
2 (y)
f (x, y) dx dy = dx f (x, y)dy .(I) f (x, y) dx dy = dy f (x, y)dx .(II)
P a ϕ1 (x) P c ψ1 (y)

Опишем процедуру применения формулы (I). Вначале находится внутренний опре-


деленный интеграл по переменной y ∈ [ϕ1 (x), ϕ2 (x)] (при этом считаем x = const), в
результате чего определяется функция аргумента x
ϕZ2 (x)

f (x, y) dy.
ϕ1 (x)

Затем остается вычислить внешний интеграл от этой функции по переменной x ∈ [a, b].
Если же применяется формула (II), то внутренний интеграл вычисляется по переменной
x, а внешний — по y. Ради компактности записи скобок в правых частях формул (I),
(II) обычно не ставят.
Важно понять, что расстановка пределов в каждом повторном интеграле (I), (II)
и выбор переменных интегрирования полностью определяются формулами (3.27a),
(3.27b) соответственно, задающими множество P через неравенства.
Доказательство утверждения 1.
1) Докажем утверждение вначале для простого случая, когда множество интегри-
рования P — прямоугольник со сторонами, параллельными осям координат: P = G,
½
a 6 x 6 b,
G: (3.28)
c 6 y 6 d.

76
Нужно доказать формулу
 
ZZ Zb Zd
f (x, y) dx dy = dx  f (x, y) dy  . (3.29)
G a c

Непрерывная
RR на прямоугольнике G функция f на нем интегрируема, обозначим
f (x, y) dx dy = I. Так как при любом фиксированном x ∈ [a, b] функция f (x, y)
G
переменной y непрерывна на отрезке [c, d], то определена функция

Zd
Φ(x) : = f (x, y) dy, x ∈ [a, b]. (3.30)
c

Для доказательства формулы (3.29) достаточно проверить, что существует

Zb
Φ(x) dx = I. (3.31)
a

Рассмотрим произвольные разбиения τx , τy отрезков [a, b], [c, d]


n
[ l
[
τx : [a, b] = [xi−1 , xi ]; τy : [c, d] = [yj−1 , yj ].
i=1 j=1

Они порождают разбиение τ прямоугольника G


[
G= Pij ,
i,j

ячейками которого являются также прямоугольники:

Pij = [xi−1 , xi ] × [yj−1 , yj ], 1 6 i 6 n, 1 6 j 6 l.

Существуют наименьшее и наибольшее значения функции f на каждой ячейке Pij

mij = min f (x, y), Mij = max f (x, y)


(x,y)∈Pij (x,y)∈Pij

(почему?).
Оценим сверху и снизу произвольную интегральную сумму функции Φ
n
X
στx ,ξ (Φ) = Φ(ξi )∆xi , ξi ∈ [xi−1 , xi ].
i=1

Зафиксируем номер i, 1 6 i 6 n и выберем произвольно точку ξi ∈ [xi−1 , xi ]. Рассмот-


рим при любом j, 1 6 j 6 l функцию f (ξi , y) переменной y ∈ [yj−1 , yj ]. Так как она
Ryj
непрерывна, то существует f (ξi , y) dy. Поскольку
yj−1

∀ y ∈ [yj−1 , yj ] mij 6 f (ξi , y) 6 Mij ,

77
то по свойству оценки определенного интеграла для любых возможных i, j
Zyj
mij ∆yj 6 f (ξi , y) dy 6 Mij ∆yj .
yj−1

Суммируем эти неравенства по всем j, 1 6 j 6 l :


l
X l
X Zyj l
X
mij ∆yj 6 f (ξi , y) dy 6 Mij ∆yj .
j=1 j=1 y j=1
j−1

Преобразуем среднюю часть полученного неравенства:

l
X Zyj Zd
(3.30)
f (ξi , y) dy = f (ξi , y) dy = Φ(ξi ).
j=1 y c
j−1

Таким образом,
l
X l
X
mij ∆yj 6 Φ(ξi ) 6 Mij ∆yj .
j=1 j=1

Умножим почленно это неравенство на ∆xi и просуммируем по всем i, 1 6 i 6 n :


X n
X X
mij ∆xi ∆yj 6 Φ(ξi )∆xi 6 Mij ∆xi ∆yj . (3.32)
i,j i=1 i,j

Так как ∆xi · ∆yj = s(Pij ), то крайние части двойного неравенства (3.32) — суммы
Дарбу функции f (x, y) ; средняя его часть есть интегральная сумма функции Φ(x) :

sτ (f ) 6 στx ,ξ (Φ) 6 Sτ (f ). (3.33)

Из следстия 3.2 вытекает, что

lim sτ (f ) = lim Sτ (f ) = I. (3.34)


λτ →0 λτ →0

Поскольку в случае λτ → 0 также и λτx → 0, то из соотношений (3.33), (3.34) следует,


что существует
lim στx ,ξ (Φ) = I.
λτx →0

Значит, функция Φ(x) интегрируема на отрезке [c, d], причем справедлива формула
(3.31).
2) Докажем теперь утверждение 1 для произвольного множества P (3.27a), опираясь
на теоремы 3.6, 3.7 и свойства аддитивности двойного и определенного интегралов.
Дополним множество P до прямоугольника. Пусть

c : = min ϕ1 (x), d : = max ϕ2 (x).


x∈[a,b] x∈[a,b]

Тогда прямоугольник G (3.28) содержит множество P. Введем на G функцию


½
f (x, y) при (x, y) ∈ P,
g(x, y) = (3.35)
0 при (x, y) ∈ G \ P.

78
Она разрывна разве лишь в точках кривых
L1,2 : y = ϕ1,2 (x), x ∈ [a, b]
нулевой площади и по теореме 3.6 интегрируема на прямоугольнике G.
Рассмотрим компактные множества
½ ½
a 6 x 6 b, a 6 x 6 b,
P1 : P2 :
c 6 y 6 ϕ1 (x), ϕ2 (x) 6 x 6 d.
Тогда
G = P ∪ P1 ∪ P2
и по свойству аддитивности для двойных интегралов
ZZ ZZ ZZ ZZ
g(x, y) dx dy = g(x, y) dx dy + g(x, y) dx dy + g(x, y) dx dy.
G P P1 P2

Но ZZ Z ZZ
(3.35)
g(x, y) dx dy = f (x, y) dx dy.
P P
Далее, снова по теореме 3.6
ZZ ZZ
g(x, y) dx dy = 0 · dx dy = 0,
Pk Pk

(k = 1, 2), поскольку функция g(x, y) не принимает нулевые значения на множествах


Pk лишь вдоль кривых Lk . Поэтому
ZZ ZZ Zb Zd
(3.29)
f (x, y) dx dy = g(x, y) dx dy = dx g(x, y) dy. (3.36)
P G a c

Rd
Осталось преобразовать внутренний интеграл g(x, y) dy. По свойству аддитивности
c
определенных интегралов при фиксированном x ∈ [a, b]
Zd ϕZ1 (x) ϕZ2 (x) Zd
g(x, y) dy = g(x, y) dy + g(x, y) dy + g(x, y) dy =
c c ϕ1 (x) ϕ2 (x)

ϕZ2 (x) ϕZ2 (x)


(3.35)
= g(x, y) dy = f (x, y) dy. (3.37)
ϕ1 (x) ϕ1 (x)

Здесь учтено, что по теореме 3.7


ϕZ1 (x) Zd
g(x, y) dy = g(x, y) dy = 0.
c ϕ2 (x)

Из соотношений (3.36), (3.37) следует формула (I). •


Замечание 3.3. Внутренние пределы в повторном интеграле постоянны тогда и
только тогда, когда P — прямоугольник со сторонами, параллельными осям координат.
Замечание 3.4. Если формулы (I), (II) неприменимы, то может оказаться полез-
ным свойство 20 аддитивности (множество P разбивается на несколько множеств одного
из типов (3.27a), (3.27b)).

79
3.6 Замена переменных в двойных интегралах
Будем отталкиваться от известной формулы замены переменной в определенном
интеграле
Zb Zβ
f (x) dx = [x = ϕ(t)] = f (ϕ(t))ϕ0 (t) dt.
a α

Видно, что при замене x = ϕ(t)


1) подынтегральная функция f (x) преобразуется в сложную функцию f (ϕ(t)),
2) dx преобразуется в dϕ(t) = ϕ0 (t) dt,
3) отрезок интегрирования [a, b] преобразуется
RR в отрезок [α, β], причем ϕ : [α, β] → [a, b].
Перейдем теперь в двойном интеграле f (x, y) dx dy от переменных x, y к новым
P
переменным u, v по формулам ½
x = ϕ1 (u, v),
(3.38)
y = ϕ2 (u, v).
0
Рассмотрим две координатные плоскости Π, Π с прямоугольными декартовыми коор-
0 0
динатами x, y и u, v. Формулы (3.38) задают отображение множества P ⊂ Π на мно-
жество P ⊂ Π. Точнее, функции ϕ1 (u, v), ϕ2 (u, v) являются координатными функциями
0
отображения ϕ : P → P.
0
Определение 3.7. Отображение ϕ называется регулярным на множестве P , если
0
1) оно является гладким на P ,
0
2) оно биективно (взаимно однозначно) на P ,
0
3) ∀(u, v) ∈ P J(u, v) 6= 0.
Здесь ¯ ¯
D(ϕ1 , ϕ2 ) ¯¯ x0u x0v ¯¯
J(u, v) = =¯ 0
D(u, v) yu yv0 ¯
— определитель, являюшийся якобианом отображения ϕ.
Свойства регулярного отображения
1) Существует обратное к ϕ отображение

ψ(x, y) = (ψ1 (x, y), ψ2 (x, y));


0
отображение ψ биективно переводит множество P на множество P .
0
2) При отображении ϕ внутренняя (граничная) точка множества P переходит во
внутреннюю (граничную) точку множества P [7, с. 180-181].
Пусть M0 (x0 , y0 )— точка множества P. Ей отвечает единственная точка
0 0
ψ(M0 ) = M0 (u0 , v0 ) множества P . В силу биективности отображения ψ точка M0
однозначно определяется каждой упорядоченной парой вещественных чисел

(x0 , y0 ), (u0 , v0 ).

При этом x0 , y0 — прямоугольные декартовы координаты точки M0 , (u0 , v0 ) — криво-


линейные координаты этой точки.
Найдем образы при отображении ϕ отрезков прямых u = u0 , v = v0 , лежащих во
множестве P 0 .
Образом отрезка u = u0 является некоторая кривая, проходящая через точку M0 .
Для всех ее точек значение первой криволинейной координаты u равно u0 . Аналогично,

80
образом отрезка v = v0 при отображении ϕ является другая кривая, проходящая через
точку M0 . Для всех ее точек значение второй криволинейной координаты v равно v0 .
Таким образом, на множестве P возникает два семейства кривых
{u = const}, {v = const}, причем через каждую точку множества проходит
единственная кривая каждого семейства. Эти семейства задают на множестве P сетку
криволинейных координатных линий.
Определение 3.8. Плоская кривая
½
x = x(t),
Γ: t ∈ [α, β]
y = y(t),
называется гладкой, если функции x(t), y(t) имеют на отрезке [α, β] непрерывные про-
изводные, одновременно не обращающиеся в нуль.
Определение 3.9. Непрерывная плоская кривая называется кусочно-гладкой, если
она составлена из конечного числа гладких кривых.
Доказывается, что кусочно-гладкая плоская кривая имеет нулевую площадь. Об-
разом кусочно-гладкой кривой при регулярном отображении также является кусочно-
гладкая кривая.

Теорема 3.8 Пусть функция f (x, y) непрерывна на компактном множестве P с


0
кусочно-гладкой границей, а отображение ϕ регулярно на множестве P . Тогда
ZZ ZZ
f (x, y) dx dy = f (ϕ1 (u, v), ϕ2 (u, v)) |J(u, v)| du dv. (3.39)
P P0

Доказательство. Функция

F (u, v) : = f (ϕ1 (u, v), ϕ2 (u, v)) |J(u, v)| (3.40)


0
непрерывна на множестве P (обосновать!), поэтому двойные интегралы формулы (3.39)
существуют. Докажем их равенство, исходя из определения двойного интеграла. При
доказательстве используется также следующая формула вычисления площади плоской
фигуры через криволинейные координаты:
ZZ
s(P ) = |J(u, v)| du dv. (3.41)
0
P

Она выведена в следующей главе «Криволинейные интегралы» (см. параграф 4.5).


0 0
Зафиксируем произвольное разбиение τ множества P
n
[
0 0 0
τ : P = Pi .
i=1

S
n
0
Тем самым определяется разбиение τ исходного множества: P = Pi , здесь Pi = ϕ(Pi ).
i=1
Рассмотрим интегральную сумму στ,Mi (f ) функции f, отвечающую произвольному на-
бору отмеченных точек
{Mi }, Mi ∈ Pi . (3.42)

81
Позже мы выберем эти точки специальным образом (напомним, что предел интеграль-
ных сумм не зависит от выбора отмеченных точек (3.42)). Преобразуем
 
n
X n Z Z
(3.41) X  
στ,Mi (f ) = f (Mi )s(Pi ) = f (Mi )  |J(u, v)| du dv  .
i=1 i=1 0
Pi

По свойству 70 (теореме о среднем) для двойных интегралов


ZZ
0
|J(u, v)| du dv = |J(ui , vi )| · s(Pi ),
0
Pi

0 0
здесь Mi (ui , vi ) ∈ Pi . Теперь сможем выбрать точки (3.42):
0
Mi = ϕ(Mi ) = (ϕ1 (ui , vi ), ϕ2 (ui , vi )).

Тогда исходная интегральная сумма преобразуется в интегральную сумму функции F :


n
X n
X
0 0
στ,Mi (f ) = f (ϕ1 (ui , vi ), ϕ2 (ui , vi ))|J(ui , vi )| · s(Pi ) = F (ui , vi )s(Pi ) = στ 0 ,M 0 (F ).
i
i=1 i=1

Поскольку
λτ → 0 ⇔ λτ 0 → 0,
то
lim στ,Mi (f ) = lim στ 0 ,M 0 (F ),
λτ →0 λ 0 →0 i
τ

откуда и следует формула (3.39). •


Замечание 3.5. Теорема 3.8 остается справедливой, если регулярность отображе-
ния ϕ нарушается па множестве нулевой площади.
Замечание 3.6. Криволинейные координаты u, v обычно выбирают с тем расчетом,
чтобы кривые, составляющие ∂P, имели простые уравнения в криволинейных коорди-
натах 1 .
0
Замечание 3.7. На практике часто нецелесообразно работать с плоскостью Π и
0
множеством P . Достаточно построить множество P ⊂ Π и описать его через неравен-
ства в криволинейных координатах.
Замена переменных в полярных координатах
Часто в качестве криволинейных выступают полярные координаты

r, ϕ (r > 0, ϕ ∈ [0, 2π]) 2 .

Тогда формулы (3.38) принимают вид


½
x = r cos ϕ,
(3.43)
y = r sin ϕ.
Вычислим якобиан
¯ 0 ¯ ¯ ¯
¯ xr x0ϕ ¯ ¯ cos ϕ −r sin ϕ ¯
¯
J(r, ϕ) = ¯ 0 ¯=¯ ¯ = r(cos2 ϕ + sin2 ϕ) = r > 0.
yr yϕ0 ¯ ¯ sin ϕ r cos ϕ ¯
1
Желательно, чтобы они были координатными линиями.
2
Вместо отрезка [0, 2π] иногда удобнее выбрать другой отрезок длиной 2π, например, [−π, π].

82
Поэтому |J(r, ϕ)| = r. В случае полярных координат координатные линии r = const
— окружности с центром в точке O(0, 0), а координатные линии ϕ = const — лучи,
выходящие из этой точки.
Формула (3.39) теперь преобразуется к виду
ZZ ZZ
f (x, y) dx dy = f (r cos ϕ, r sin ϕ) r dr dϕ. (3.44)
P P0

Сводя полученный двойной интеграл в полярных координатах к повторному, внешнее


интегрирование обычно проводят по переменной ϕ. Если, например, P можно задать в
полярных координатах следующим образом:
½
α 6 ϕ 6 β,
P : (3.45)
r1 (ϕ) 6 r 6 r2 (ϕ),

то приходим к формуле

ZZ Zβ rZ
2 (ϕ)

f (x, y) dx dy = dϕ f (r cos ϕ, r sin ϕ)r dr. (3.46)


P α r1 (ϕ)

Пример 3.1. Вычислить ZZ


2 +y 2
ex dx dy,
P
где
P : 1 6 x2 + y 2 6 4, y > 0.
Граница множества P состоит из частей координатных линий, поэтому
½
0 6 ϕ 6 π,
P :
1 6 r 6 2.

Пределы изменения обеих полярных координат для множества P постоянны, приходим


к простому повторному интегралу:

ZZ Zπ Z2
x2 +y 2 (3.46) 2
e dx dy = dϕ er r dr =
P 0 1

Zπ Z2 Zπ Zπ
1 r2 12 2 1 e(e3 − 1)
= dϕ e d(r ) = er |21 dϕ = 4
(e − e) dϕ = · π. •
2 2 2 2
0 1 0 0

3.7 Геометрический смысл двойного интеграла


Известно, что определенный интеграл от функции f (x), непрерывной и неотрица-
тельной на отрезке [a, b], равен площади криволинейной трапеции

D : {(x, y) ∈ R2 |x ∈ [a, b], 0 6 y 6 f (x)}, (3.47)

83
то есть
Zb
s(D) = f (x) dx. (3.48)
a

Обобщим формулу (3.48) на функции двух переменных. Поскольку теперь речь пойдет
об объемах, приведем некоторые факты теории кубируемости тел T ⊂ R3 . Для любого
ограниченного тела T вводятся понятия нижнего объема v∗ (T ) = sup{v(u)} и верхнего
объема v ∗ (T ) = inf{v(U )}. Здесь u, U — многогранники, u ⊂ T ⊂ U, v(u) — объем
многогранника u. Множество T называется кубируемым, если его верхний и нижний
объемы совпадают, тогда его объем v(T ) = v∗ (T ) = v ∗ (T ).
Говорят, что множество q ⊂ R3 имеет нулевой объем, если для каждого числа ε > 0
найдется такой многогранник u ⊃ q, что v(u) < ε. Если поверхность q — график непре-
рывной функции z = f (x, y), (x, y) ∈ P, P – квадрируемое компактное множество, то q
имеет нулевой объем.

Лемма 3.1 Прямой цилиндр T0 высоты h с квадрируемым основанием P — кубируемое


тело и
v(T0 ) = s(P )h.

Теорема 3.9 Тело T кубируемо тогда и только тогда, когда

∀ε > 0 ∃ кубируемые тела T1 , T2 , T1 ⊂ T ⊂ T2 v(T2 ) − v(T1 ) < ε. (3.49)

Пусть функция двух переменных f (x, y) непрерывна и неотрицательна на квадри-


руемом компактном множестве P. Аналогом понятия криволинейной трапеции (3.47)
является цилиндрический брус

T : = {(x, y, z) ∈ R3 | (x, y) ∈ P, 0 6 z 6 f (x, y)}. (3.50)

Сверху он ограничен графиком функции f (x, y), снизу — множеством P, лежащим в


координатной плоскости Oxy, сбоку — цилиндрической поверхностью, направляющей
которой является ∂P, а образующие параллельны оси z.

Теорема 3.10 Цилиндрический брус T — кубируемое тело и


ZZ
v(T ) = f (x, y) dx dy. (3.51)
P

Доказательство включает 1) проверку кубируемости тела T (по критерию ку-


бируемости 3.9, при этом тела T1 , T2 составляются из прямых цилиндров), 2) вывод
формулы (3.51) (по следствию 3.2, с. 71).
1) Зафиксировав произвольно разбиение τ множества P — основания цилиндриче-
ского бруса T, выявим геометрический смысл сумм Дарбу
n
X n
X
sτ (f ) = mi · s(Pi ), Sτ (f ) = Mi · s(Pi ).
i=1 i=1

Проведем через границы ∂Pi ячеек Pi разбиения цилиндрические поверхности, парал-


лельные оси z. Тогда цилиндрический брус T разобьется на n столбиков

Ti : = {(x, y, z) ∈ R3 | (x, y) ∈ Pi , 0 6 z 6 f (x, y)}.

84
По лемме 3.1 mi · s(Pi ) (Mi · s(Pi )) — объем прямого цилиндра с основанием Pi и
высотой mi (Mi ), содержащегося в Ti (содержащего Ti ). Составим из всех меньших
(больших) цилиндров тело T1 (T2 ). При этом

T1 ⊂ T ⊂ T2 , (3.52)

v(T1 ) = sτ (f ), v(T2 ) = Sτ (f ). (3.53)


Так как функция f (x, y) непрерывна на множестве P, то она на нем интегрируема
и по критерию интегрируемости 3.4

∀ε > 0 ∃δ > 0 ∀τ (λτ < δ ⇒ Sτ (f ) − sτ (f ) < ε).

Зафиксировав произвольно число ε > 0, найдем соответствующее ему число δ > 0 и


выберем любое разбиение τ множества P с рангом λτ < δ. Учитывая равенства (3.53),
приходим к условию (3.49). Значит, тело T по теореме 3.9 кубируемо. Из соотношений
(3.52) и свойства монотонности объема

∀τ sτ (f ) 6 v(T ) 6 Sτ (f ). (3.54)

2) По следствию 3.2
ZZ
lim sτ (f ) = lim Sτ (f ) = f (x, y) dx dy.
λτ →0 λτ →0
P

Поэтому, переходя в двойном неравенстве (3.54) к пределу при λτ → 0, приходим к


искомой формуле (3.51). •

3.8 Тройные интегралы

Пусть функция трех переменных f (x, y, z) определена на кубируемом компактном


множестве T ⊂ R3 . Рассмотрим произвольное разбиение τ множества T на кубируемые
компактные ячейки Ti без общих внутренних точек
n
[
τ: T = Ti ,
i=1

введем ранг λτ = max d(Ti ) разбиения τ и зафиксируем некоторый набор отмеченных


точек
{Mi }, Mi ∈ Ti .
Определим интегральную сумму функции f на множестве T
n
X
σ = στ,Mi (f ) : = f (Mi )v(Ti ).
i=1

Определение 3.10. Если существует конечный предел интегральных сумм функ-


ции f (x, y, z) на множестве T при λτ → 0, то его называют тройным интегралом функ-
ции на этом множестве:
ZZZ
f (x, y, z) dx dy dz = lim στ,Mi (f ) ∈ R;
λτ →0
T

85
функцию f (x, y, z) в этом случае называют интегрируемой на множестве T.
Задание 3.2. Дать определение конечного предела интегральных сумм функции
f (x, y, z) при λτ → 0.
Если f (x, y, z) = 1, то все интегральные суммы функции равны v(T ) :
n
X
στ,Mi (1) = v(Ti ) = v(T )
i=1

и поэтому ZZZ
v(T ) = dx dy dz. (3.55)
T

Пришли к универсальной формуле вычисления объема тела.


Всякая интегрируемая на множестве функция ограничена на нем. Из непрерывности
функции на множестве следует существование тройного интеграла. В то же время изме-
нение значений ограниченной интегрируемой функции на множестве нулевого объема
не влияет на величину тройного интеграла.
Задание 3.3. Сформулировать свойства тройного интеграла, полностью аналогич-
ные свойствам двойного интеграла.
Вычисление тройного интеграла сводится к последовательному нахождению
нескольких интегралов меньшей размерности — двойного и определенного интеграла
или трех определенных интегралов. Приведем одну из таких формул. Определим мно-
жество T через неравенства относительно координат x, y, z (именно в таком порядке).
Пусть проекция P тела T на координатную плоскость xOy задается неравенствами
½
a 6 x 6 b,
P :
ϕ1 (x) 6 y 6 ϕ2 (x),

где функции ϕ1,2 (x) непрерывны на отрезке [a, b]. Пусть, далее, прямая, параллельная
оси Oz и проходящая через любую точку (x, y, 0), (x, y) ∈ P, пересекает ∂T не более
чем в двух точках и аппликаты всех ее точек, лежащих в T, удовлетворяют условиям

z1 (x, y) 6 z 6 z2 (x, y).

Здесь z1,2 (x, y) — функции, непрерывные на множестве P. Таким образом, тело задается
через неравенства следующим образом:

 a 6 x 6 b,
T : ϕ1 (x) 6 y 6 ϕ2 (x), (3.56)

z1 (x, y) 6 z 6 z2 (x, y).

Если при этом функция f (x, y, z) непрерывна на множестве T, то справедлива формула

ZZZ Zb ϕZ2 (x) z2Z(x,y)

f (x, y, z) dx dy dz = dx dy f (x, y, z) dz. (3.57)


T a ϕ1 (x) z1 (x,y)

Пример 3.2. Вычислить тройной интеграл


ZZZ
I= y dx dy dz,
T

86
где T — тетраэдр, ограниченный плоскостями x = 0, y = 0, z = 0, x + y + z = 1. Тело
T через неравенства записывается так:

 0 6 x 6 1,
T : 0 6 y 6 1 − x,

0 6 z 6 1 − x − y.

Применим формулу (3.57):

Z1 Z1−x Z
1−x−y Z1 Z1−x Z1 Z1−x
z=1−x−y
I= dx dy y dz = dx y dy(z|z=0 )= dx ((1 − x)y − y 2 ) dy =
0 0 0 0 0 0 0

Z1 µ ¶¯ Z1 µ ¶ Z1
y2 y3 ¯y=1−x 1 1 1
= dx (1 − x) − ¯y=0 = (1 − x)3 − dx = − (1 − x)3 d(1 − x) =
2 3 ¯ 2 3 6
0 0 0

1 (1 − x)4 1 1 1
=− · |0 = − (0 − 1) = . •
6 4 24 24

3.9 Приложения кратных интегралов

3.9.1 Вычисление площадей плоских фигур и объемов тел


Напомним выведенные ранее формулы:
• площади плоской фигуры (с. 70, (3.6))
ZZ
s(P ) = dx dy;
P

• объема тела (с. 85, (3.55))


ZZZ
v(T ) = dx dy dz;
T

• объема цилиндрического бруса (с. 83, (3.51))


ZZ
v(T ) = f (x, y) dx dy.
P

3.9.2 Определение и вычисление площади поверхности


Рассмотрим поверхность

F : z = f (x, y), (x, y) ∈ P,

являющуюся графиком функции f (x, y), дифференцируемой на квадрируемом ком-


пактном множестве P.

87
Определим площадь поверхности F через предел, локально приближая ее частями
касательных плоскостей (через предел площади «чешуйчатого покрытия» поверхно-
сти).
Sn
Рассмотрим произвольное разбиение τ : P = Pi множества P. Тогда и поверх-
i=1
S
n
ность F также можно представить в виде объединения F = Fi частей Fi , не имеющих
i=1
общих внутренних точек. Множество Fi проектируется на ячейку Pi . Зафиксировав
любой индекс i, 1 6 i 6 n, выберем произвольно точку Mi (xi , yi ) ∈ Pi и построим
касательную плоскость Ti к поверхности F в точке (xi , yi , f (xi , yi )). Ее уравнение (см.
(2.29))
Ti : z = f (Mi ) + fx0 (Mi )(x − xi ) + fy0 (Mi )(y − yi ). (3.58)
Обозначим через ti часть касательной плоскости Ti , проектирующуюся на Pi (отметим,
что ti , Pi — плоские фигуры). Из квадрируемости Pi следует квадрируемость и множе-
ства ti .
Проведя указанное построение при любом i, в итоге приходим к поверхности
n
[
t= ti ,
i=1

которая и представляет собой «чешуйчатое покрытие» поверхности F. Введем сумму


n
X
Aτ : = s(ti ), (3.59)
i=1

являющуюся суммарной площадью всех частей ti множества t.


Определение 3.11. Если существует конечный предел сумм Aτ при λτ → 0, не
зависящий от выбора разбиений τ и отмеченных точек Mi , то его называют площадью
поверхности F :
s(F ) : = lim Aτ . (3.60)
λτ →0

Теорема 3.11 Если функция f (x, y) гладкая на квадрируемом компактном множе-


стве P, то поверхность F имеет площадь, вычисляемую по формуле
ZZ q
s(F ) = 1 + fx02 (x, y) + fy02 (x, y) dx dy. (3.61)
P

Доказательство. Так как функция


q
h(x, y) : = 1 + fx02 (x, y) + fy02 (x, y)

непрерывна на множестве P (почему?), то она интегрируема и двойной интеграл, стоя-


щий в правой части равенства (3.61), существует. Преобразуем сумму Aτ к виду инте-
гральной суммы функции h(x, y).
Поскольку Pi — проекция ti , то 3

s(Pi ) = s(ti ) cos γi , (3.62)


3
Формула (3.62) выведена в элементарной математике для многоугольников; опираясь на этот факт,
формулу можно доказать и в общем случае (с использованием теории квадрируемости).

88
где γi — острый угол между касательной поскостью Ti и координатной плоскостью xOy

− − →
или, что то же самое, между их нормальными единичными векторами n0i , k . Из курса
геометрии известно, что координаты единичного вектора — направляющие косинусы,


поэтому cos γi — третья координата единичного вектора n0i . Преобразовав уравнение
(3.58) касательной плоскости Ti к виду

Ti : −fx0 (Mi )(x − xi ) − fy0 (Mi )(y − yi ) + z − f (Mi ) = 0,

убеждаемся, что


n i : = (−fx0 (Mi ), −fy0 (Mi ), 1)
— нормальный вектор к Ti . Так как его длина
q


| ni | = 1 + fx02 (Mi ) + fy02 (Mi ),

то −


→0 ni 1
ni = −→ = (−fx0 (Mi ), −fy0 (Mi ), 1)
| ni | |n~i |
и поэтому
1
cos γi = q . (3.63)
1 + fx02 (Mi ) + fy02 (Mi )
Преобразуем теперь

(3.62) s(Pi ) q
s(ti ) = = 1 + fx02 (Mi ) + fy02 (Mi )s(Pi ) = h(Mi )s(Pi ).
cos γi
Но тогда
n
X n
X
Aτ = s(ti ) = h(Mi )s(Pi ) = στ,Mi (h). (3.64)
i=1 i=1

В силу интегрируемости функции h(x, y) на множестве P существует


ZZ
lim στ,Mi (h) = h(x, y) dx dy.
λτ →0
P

Поэтому можно перейти в равенстве (3.64) к пределу при λτ → 0 :


ZZ
lim Aτ = lim στ,Mi (h) = h(x, y) dx dy.
λτ →0 λτ →0
P

Таким образом, поверхность F по определению 3.11 имеет площадь, определяемую фор-


мулой (3.61). •
Замечание 3.8. Справедливо более общее утверждение, чем теорема 3.11. Если
гладкая поверхность F задана, как в дифференциальной геометрии, параметрически

F : −

r =−

r (u, v), (u, v) ∈ P,

где P — квадрируемое компактное множество на плоскости параметров u, v и



→ − → −
→ → − −
→ − →
E = ru0 · ru0 , F = ru0 · rv0 , G = rv0 · rv0

89
— коэффициенты ее первой квадратичной формы, то поверхность F имеет площадь
ZZ √
s(F ) = EG − F 2 du dv.
P

Пример 3.3. Найти площадь части параболоида x2 + y 2 = 2z, вырезаемого цилин-


дром x2 + y 2 = 1.
Рассматриваемая поверхность определяется уравнением
1
F : z = (x2 + y 2 ), (x, y) ∈ P,
2
где P : x2 + y 2 6 1 — единичный круг на плоскости xOy. Находим
1
zx0 = (x2 + y 2 )0x = x, zy0 = y, 1 + zx2 + zy02 = 1 + x2 + y 2 .
2
Поэтому ZZ p
(3.61)
s(F ) = 1 + x2 + y 2 dx dy.
P

Двойной интеграл вычислим, переходя к полярным координатам:


Z2π Z1 √ Z2π Z1 √
1
s(F ) = dϕ 1+ r2 r dr = dϕ 1 + r2 d(1 + r2 ) =
2
0 0 0 0

Z2π µ ¶
1 2 ¯
2 3/2 ¯1 1 √ ¯2π 2π √
= dϕ (1 + r ) 0 = · (2 2 − 1) · ϕ ¯ 0 = (2 2 − 1) . •
2 3 3 3
0

3.9.3 Физические приложения кратных интегралов


Основное внимание уделим приложениям двойных интегралов. Будем рассматри-
вать материальные фигуры — «тяжелые» плоские фигуры, вдоль которых непрерывно
распределены массы.
Пусть P — квадрируемая компактная материальная фигура. Распределение масс
вдоль нее характеризуется поверхностной плотностью — непрерывной неотрицатель-
ной функцией ρ(x, y), (x, y) ∈ P. В случае ρ(x, y) = const материальная фигура
называется однородной. Понятие материальной фигуры является удобной математи-
ческой моделью тонких пластинок. Средствами интегрального исчисления вводятся
важные физические характеристики материальных фигур, например, масса, центр
масс, статические моменты, моменты инерции. Остановимся на первых трех понятиях.
Масса материальной фигуры
Введем понятие массы материальной фигуры, исходя из того, что масса однородной
фигуры P с постоянной поверхностной плотностью ρ выражается формулой

m(P ) = ρ · s(P ). (3.65)

Зафиксируем некоторое разбиение τ множества P и точки Mi ∈ Pi , 1 6 i 6 n. При


малых λτ непрерывная функция ρ(x, y) во всех точках каждой ячейки Pi будет близка
к ρ(Mi ) :
∀ (x, y) ∈ Pi ρ(x, y) ≈ ρ(Mi ) = const,

90
а масса ячейки в силу формулы (3.65) близка к произведению

ρ(Mi )s(Pi ). (3.66)

Поэтому приближенное значение массы всей материальной фигуры P определяется


суммой
Xn
ρ(Mi )s(Pi ). (3.67)
i=1

Определение 3.12. Если существует конечный предел сумм (3.67) при λτ → 0,


не зависящий от выбора разбиений τ и отмеченных точек Mi , то его называют массой
m(P ) материальной фигуры P .
Поскольку сумма (3.67) является интегральной суммой интегрируемой функции
ρ(x, y) :
Xn
ρ(xi , yi )s(Pi ) = στ,Mi (ρ),
i=1
то существует
n
X ZZ
lim ρ(xi , yi )s(Pi ) = lim στ,Mi (ρ) = ρ(x, y) dx dy.
λτ →0 λτ →0
i=1 P

Тем самым пришли к формуле вычисления массы материальной фигуры


ZZ
m(P ) = ρ(x, y) dx dy. (3.68)
P

Статические моменты и центр масс материальной фигуры


Будем опираться на понятие статического момента системы материальных точек
относительно оси. Пусть на плоскости расположены ось l и система n материальных
точек Mi (xi , yi ) с массами mi . Тогда статическим моментом системы относительно оси
l называется сумма
Xn
mi di , (3.69)
i=1

где di — ориентированное расстояние от точки Mi до оси (оно снабжено знаком (+) или
(-) в зависимости от того, с какой стороны от оси находится данная точка).
Введем понятия статических моментов материальной фигуры
P M omx (P ), M omy (P ) относительно осей координат Ox, 0y соответственно.
Снова зафиксируем разбиение τ и точки Mi ∈ Pi . Заменим материальную фигуру
системой n материальных точек {Mi }, предполагая, что масса каждой ячейки Pi ,
определяемая по приближенной формуле (3.66), сосредоточена в точке Mi . Формулы
(3.69) позволяют записать такие приближенные значения рассматриваемых моментов
M omx (P ), M omy (P ) :
n
X n
X
yi ρ(Mi )s(Pi ), xi ρ(Mi )s(Pi ). (3.70)
i=1 i=1

Определение 3.13. Статическими моментами материальной фигуры P относи-


тельно осей координат Ox, Oy называются конечные пределы сумм (3.70) соответ-
ственно при λτ → 0.

91
Поскольку (3.70) — интегральные суммы непрерывных функций yρ(x, y), xρ(x, y),
то существуют
Xn ZZ n
X ZZ
lim yi ρ(Mi )s(Pi ) = yρ(x, y) dx dy, lim xi ρ(Mi )s(Pi ) = xρ(x, y) dx dy.
λτ →0 λτ →0
i=1 P i=1 P

Поэтому
ZZ ZZ
M omx (P ) = yρ(x, y) dx dy, M omx (P ) = xρ(x, y) dx dy. (3.71)
P P

Центр масс M (x, y) материальной фигуры P определяется как такая точка, что
если в ней сосредоточить массу m(P ) всей фигуры, то статические моменты точки M
относительно обеих осей координат совпадут со статическими моментами относительно
этих осей фигуры.
Отсюда вытекают следующие равенства:
m(P )x = M omy (P ), m(P )y = M omx (P ).
Поэтому ZZ ZZ
1 1
x= xρ(x, y) dx dy, y= yρ(x, y) dx dy. (3.72)
m(P ) m(P )
P P
В частном случае однородной материальной фигуры эти формулы упрощаются:
RR RR
x dx dy y dx dy
P P
x= , y= . (3.73)
s(P ) s(P )
Пример 3.4. Найти центр масс однородного полукруга P : x2 + y 2 6 R2 , y > 0.
Применим формулы (3.73). Так как в полярных координатах
½
0 6 ϕ 6 π,
P :
0 6 r 6 R,
то находим
ZZ Zπ ZR Zπ
r 3 R R3
x dx dy = dϕ r cos ϕ r dr = cos ϕ dϕ | = (sin ϕ)|π0 = 0,
3 0 3
P 0 0 0

ZZ Zπ ZR Zπ
2 r 3 R R3 R3 2R3
y dx dy = dϕ r sin ϕ dr = sin ϕ dϕ |0 = (− cos ϕ)|π0 = − (−1−1) = .
3 3 3 3
P 0 0 0
2
Поскольку s(P ) = πR /2, то
2R3 · 2 4
x = 0, y =
2
= · R ≈ 0.4244 R. •
3 · πR 3π
Замечание 3.9. Аналогичным образом, но с применением тройных интегралов
определяются и вычисляются физические характеристики материального простран-
ственного тела T по известной пространственной плотности распределения его масс
ρ(x, y, z). Например, масса материального тела T находится по формуле
ZZZ
m(T ) = ρ(x, y, z) dx dy dz.
T

92
Глава 4

Криволинейные интегралы

4.1 Криволинейные интегралы первого рода

4.1.1 Определение криволинейного интеграла первого рода


^
Пусть функция f (x, y) задана вдоль спрямляемой плоской кривой Γ =AB (здесь
A — начало, B — конец кривой, случай замкнутой кривой A = B не исключается).
Задавшись натуральным числом n, разобъем произвольно кривую Γ на n частичных
дуг Mi−1 Mi . Для этого, двигаясь от точки A к точке B, вставим между A, B произвольно
новые точки:
A = M0 , M1 , . . . , Mi−1 , Mi , . . . , Mn−1 , Mn = B.
Тем самым определяется разбиение
n
[
τ : Γ= Mi−1 Mi .
i=1

На каждой частичной дуге Mi−1 Mi выберем точку Mi∗ . Тогда сможем записать инте-
гральную сумму функции f (x, y) вдоль кривой Γ
n
X
σ(f ) = σ τ,Mi∗ (f ) : = f (Mi∗ )l(Mi−1 Mi ). (4.1)
i=1

Здесь l(Mi−1 Mi ) — длина частичной дуги Mi−1 Mi . Зададим ранг разбиения


τ λτ : = max l(Mi−1 Mi ).
Определение 4.1. Говорят, что существует конечный предел I интегральных сумм
στ,Mi∗ (f ) при λτ → 0, если
∀ε > 0 ∃δ > 0 ∀τ (λτ < δ ⇒ |στ,Mi∗ (f ) − I| < ε). (4.2)
Определение 4.2. Если существует конечный предел I интегральных сумм στ,Mi∗ (f )
при λτ → 0, то его называют криволинейным интегралом первого рода (КИ-1) от функ-
ции f (x, y) вдоль кривой Γ :
Z
I = f (x, y) dl : = lim στ,Mi (f ) ∈ R.
λτ →0
Γ

93
Найдем произвольную интегральную сумму функции f (x, y) = 1 :
n
X
στ,Mi :∗ (1) = 1 · l(Mi−1 Mi ) = l(Γ).
i=1

Поэтому условие (4.2) выполнено при I = l(Γ) и, значит,


Z
l(Γ) = dl. (4.3)
Γ

Специфическим свойством криволинейного интеграла первого рода является его


независимость от ориентации кривой Γ. Множества интегральных сумм функции f
^
вдоль кривых Γ и Γ− =BA совпадают. Действительно, взяв произвольную интеграль-
ную сумму (4.1) и перейдя к кривой Γ− , можно выбрать те же граничные точки ча-
стичных дуг, их длины также сохраняются (l(Mi−1 Mi ) = l(Mi Mi−1 )); правда, слагаемые
интегральной суммы
R теперь запишутся в противоположном
R порядке.
R Поэтому в случае
существования f (x, y) dl существует также и f (x, y) dl = f (x, y) dl.
Γ Γ− Γ

4.1.2 Существование и вычисление криволинейного интеграла


первого рода
Криволинейные интегралы сводятся к определенным интегралам. Формулы пере-
хода к определенным интегралам зависят от вида параметрического задания (парамет-
ризации) кривой Γ.
Будем считать, что функция f (x, y) непрерывна вдоль кривой Γ.
Пусть вначале параметром произвольной точки M (x, y) кривой Γ является длина
дуги, отсчитываемой от начальной точки A :
^
s = l(AM ).

Кривая задается соотношениями


½
x = x(s),
Γ: s ∈ [0, l(Γ)], (4.4)
y = y(s),

где функции x(s), y(s) непрерывны на отрезке [0, l(Γ)]. Символами si , s∗i обозначим зна-
чения параметра s, отвечающие точкам Mi , Mi∗ соответственно, тогда

Mi (x(si ), y(si )), Mi∗ (x(s∗i ), y(s∗i )).

Обозначим также
s0 = 0, sn = l(Γ), ∆si = si − si−1 .
Разбиение τ кривой Γ порождает разбиение T отрезка [0, l(Γ)]
n
[
T : [0, l(Γ)] = [si−1 , si ].
i=1

Отрезок [0, l(Γ)] есть результат спрямления кривой Γ, при этом

λτ = λT .

94
Вдоль кривой Γ функция f (x, y) становится сложной функцией от s

F (s) : = f (x(s), y(s)), s ∈ [0, l(Γ)].

Функция F (s) непрерывна на отрезке [0, l(Γ)].


Преобразуем
n
X n
X
στ,Mi∗ (f ) = f (Mi∗ )l(Mi−1 Mi ) = f (x(s∗i ), y(s∗i ))∆si = στs ,s∗i (F ).
i=1 i=1

Таким образом, интегральная сумма функции f для криволинейного интеграла в то же


время есть интегральная сумма функции F для определенного интеграла, поэтому

Z Zl(Γ)
∃ lim στ,M (∗i ) (f ) = f (x, y) dl ⇔ ∃ lim στs ,s∗i (F ) = F (s) ds .
λτ →0 λT →0
Γ 0

Значит, в случае (4.4) справедлива формула

Z Zl(Γ)
f (x, y) dl = f (x(s), y(s)) ds, (4.5)
Γ 0

причем существование одного из интегралов, входящих в нее, влечет существование


другого интеграла.
Так как криволинейный интеграл первого рода сводится к определенному интегралу,
то на него переносятся свойства определенных интегралов. Укажем лишь следующее
важное свойство.
Свойство аддитивности. Если Γ = Γ1 ∪ Γ2 , то
Z Z Z
f (x, y) dl = f (x, y) dl + f (x, y) dl.
Γ Γ1 Γ2

Пусть теперь Γ — произвольная гладкая (см определение 3.8 ) спрямляемая кривая:


½
x = ϕ(t),
Γ: t ∈ [α, β] (4.6)
y = ψ(t),

(α < β). Тогда


A(ϕ(α), ψ(α)), B(ϕ(β), ψ(β)).
Выберем произвольно (переменную) точку

M (ϕ(t), ψ(t)), t ∈ [α, β]


^
кривой Γ. Длина s(t) = l(AM ) переменной дуги AM вычисляется так [1, с. 384]:

Zt p
s(t) = ϕ02 (τ ) + ψ 02 (τ ) dτ. (4.7)
α

95
Тем самым через интеграл с переменным верхним пределом определена функция
s = s(t), t ∈ [α, β]. Поскольку подынтегральная функция в формуле (4.7) непрерывна,
то по соответствующей теореме [1, с. 367] в каждой точке t ∈ [α, β] существует
p
s0 (t) = ϕ02 (t) + ψ 02 (t). (4.8)

Перейдем в определенном интеграле формулы (4.5) к новой переменной t :

Zl(Γ) Zβ Zβ p
0 (4.8)
f (x(s), y(s)) ds = f (ϕ(t), ψ(t))s (t) dt = f (ϕ(t), ψ(t)) ϕ02 (t) + ψ 02 (t) dt.
0 α α

Таким образом, выведена общая формула вычисления криволинейного интеграла пер-


вого рода от непрерывной функции, отвечающая произвольной параметризации (4.6)
гладкой кривой Γ:

Z Zβ p
f (x, y) dl = f (ϕ(t), ψ(t)) ϕ02 (t) + ψ 02 (t) dt. (4.9)
L α

Замечание 4.1. Формула (4.9) справедлива и в случае кусочно-гладкой кривой Γ


(это доказывается с привлечением свойства аддитивности криволинейных интегралов).
Следствие 4.1. Если кусочно-гладкая кривая Γ является графиком функции g(x)
на отрезке [a, b] и
Γ : y = g(x), x ∈ [a, b], (4.10)
то параметром становится переменная x и формула (4.9) упрощается:

Z Zb p
f (x, y) dl = f (x, g(x)) 1 + g 02 (x) dx. (4.11)
L a

Следствие 4.2. Если же кусочно-гладкая кривая Γ является графиком функции


h(y) на отрезке [c, d] и
Γ : x = h(y), y ∈ [c, d], (4.12)
то t = y и приходим к формуле

Z Zd p
f (x, y) dl = f (h(y), y) 1 + h02 (y) dy. (4.13)
L c

4.1.3 Физические приложения криволинейных интегралов пер-


вого рода
Приложения КИ-1 в первую очередь связаны с физикой. Продолжая тему п. 3.9.3,
рассмотрим теперь материальные кривые.
Материальная кривая Γ — плоская кусочно-гладкая спрямляемая кривая, вдоль ко-
торой непрерывно распределены массы с линейной плотностью ρ(x, y). Здесь ρ(x, y) —
непрерывная и неотрицательная на Γ функция. Если ρ(x, y) = const, то материаль-
ная фигура однородна. Как и в п. 3.9.3, вводятся понятия массы m(Γ) материальной
фигуры Γ, ее статических моментов относительно осей координат M omx (Γ), M omy (Γ),

96
центра масс M (x, y). Приведем соответствующие формулы вычисления этих физиче-
ских карактеристик через криволинейные интегралы первого рода:
Z
m(Γ) = ρ(x, y) dl; (4.14)
Γ
Z Z
M omx (Γ) = yρ(x, y) dl, M omy (Γ) = xρ(x, y) dl; (4.15)
Γ Γ
Z Z
1 1
x= xρ(x, y) dl, y= yρ(x, y) dl. (4.16)
m(Γ) m(Γ)
Γ Γ

Если кривая Γ однородна, то формулы (4.16) упрощаются:


Z Z
1 1
x= x dl, y = y dl. (4.17)
l(Γ) l(Γ)
Γ Γ

Задание 4.1. Дать определения указанных выше понятий и вывести формулы


(4.14)-(4.17).
Пример 4.1. Найти центр масс однородной полуокружности Γ : x2 + y 2 = R2 , y > 0
(ср. с примером 3.4). Применим формулы (4.17). Параметризуем кривую Γ:
½
x = R cos t,
Γ: t ∈ [0, π].
y = R sin t,

Предварительно преобразуем
p p
ϕ02 (t) + ψ 02 (t) = (−R sin t)2 + (R cos t)2 = R.

Вычислим
Z Zπ
(4.9)
x dl = R cos tR dt = R2 (sin t)|π0 = 0,
Γ 0
Z Zπ
y dl = R sin tR dt = R2 (− cos t)|π0 = −R2 (−1 − 1) = 2R2 .
Γ 0

Поскольку l(Γ) = πR, то

2R2 2
x = 0, y = = · R ≈ 0.637 R. •
πR π

4.2 Определение, свойства, существование криволи-


нейных интегралов второго рода
^
Пусть вдоль спрямляемой плоской кривой Γ =AB заданы функции P (x, y), Q(x, y).
Как и при определении КИ-1, разобъем произвольно кривую Γ на n ∈ N частичных дуг
Mi−1 Mi точками Mi (xi , yi )
n
[
τ : Γ= Mi−1 Mi .
i=1

97
Рангом λτ разбиения τ будем и теперь считать наибольшую из длин частичных дуг:
λτ = max l(Mi−1 Mi ). На каждой частичной дуге Mi−1 Mi отметим точку Mi∗ . Введем
проекции на координатные оси частичных дуг Mi−1 Mi

∆xi : = xi − xi−1 , ∆yi : = yi − yi−1 ,

интегральную сумму функции P (x, y) по координате x


n
X
σx (P ) = σx,τ,Mi∗ (P ) : = P (Mi∗ )∆xi (4.18)
i=1

и интегральную сумму функции Q(x, y) по координате y


n
X
σy (Q) = σy,τ,Mi∗ (Q) : = Q(Mi∗ )∆yi . (4.19)
i=1

Определение 4.3. Говорят, что существует конечный предел I интегральных сумм


σx (P ) при λτ → 0, если

∀ε > 0 ∃δ > 0 ∀τ (λτ < δ ⇒ |σx,τ,Mi∗ (P ) − I| < ε). (4.20)

Аналогично вводится понятие конечного предела интегральных сумм σy (Q) при λτ → 0.


Определение 4.4. Если существуют конечные пределы интегральных сумм
σx (P ), σy (Q) при λτ → 0, то их называют криволинейными интегралами вдоль кри-
вой Γ — от функции P (x, y) по координате x и от функции Q(x, y) по координате y
соответственно:
Z Z
P (x, y) dx : = lim σx (P ) ∈ R, Q(x, y) dy : = lim σy (Q) ∈ R.
λτ →0 λτ →0
Γ Γ

В случае существования обоих криволинейных интегралов их сумма называется кри-


волинейным интегралом второго рода (КИ-2) вдоль кривой Γ от дифференциальной
формы
P (x, y)dx + Q(x, y)dy : (4.21)
Z Z Z
P (x, y) dx + Q(x, y) dy : = P (x, y) dx + Q(x, y) dy.
Γ Γ Γ

Свойства криволинейных интегралов второго рода


Свойство 10 . Если существует криволинейный интеграл второго рода вдоль кри-
вой Γ Z
P (x, y) dx + Q(x, y) dy, (4.22)
Γ

то существует КИ-2 от этой же дифференциальной формы вдоль Γ− и


Z Z
P (x, y)dx + Q(x, y)dy = − P (x, y) dx + Q(x, y) dy. (4.23)
Γ− Γ

Доказательство проведем, например, для криволинейного интеграла по коорди-


нате x. Каждая из интегральных сумм σx (P ) при переходе от Γ к Γ− — при сохра-
нении наборов точек Mi , Mi∗ — лишь изменит знак, поскольку вместо частичной дуги

98
Mi−1 Mi появится дуга Mi Mi−1 . Поэтому вместо разности (xi −xi−1 ) в интегральной сум-
R возникнет противоположная разность (xi−1 − xi ). Значит, в случае существования
ме
P (x, y)dx существует также и
Γ
Z Z
P (x, y)dx = − P (x, y)dx. •
Γ− Γ

Замечание 4.2. Криволинейный интеграл второго рода — интеграл вдоль ориен-


тированной кривой (как, впрочем, и определенный интеграл).
R
Свойство 20 (аддитивности). Если существует P (x, y) dx + Q(x, y) dy и
Γ
Γ = Γ1 ∪ Γ2 , то
Z Z Z
P (x, y) dx + Q(x, y) dy = P (x, y) dx + Q(x, y) dy + P (x, y) dx + Q(x, y) dy.
Γ Γ1 Γ2

Замечание 4.3. Если кривая Γ замкнута: A = B, то существует два противопо-


ложных направления ее обхода. За положительное выбирают то из направлений, при
движении вдоль которого внутренность замкнутой кривой остается слева. В дальней-
шем будем замкнутые кривые по умолчанию считать ориентированными положительно.
Перейдем к вычислению криволинейного интеграла второго рода по заданной пара-
метризации (4.6) кривой Γ. Подчеркнем, что теперь не обязательно α < β; при движе-
нии вдоль кривой Γ в направлении, определяемым ее ориентацией, параметр t изме-
няется от α до β. КИ-2 сводится к определенному интегралу по отрезку [α, β], причем
в дифференциальной форме (4.21) происходит стандартный переход к переменной t в
соответствии с формулами (4.6).

Теорема 4.1 Если функции P (x, y), Q(x, y) непрерывны вдоль кусочно-гладкой кривой
Γ с параметризацией (4.6), то криволинейный интеграл (4.22) существует и вычис-
ляется по формуле

Z Zβ
P (x, y) dx + Q(x, y) dy = (P (ϕ(t), ψ(t)) · ϕ0 (t) + Q(ϕ(t), ψ(t)) · ψ 0 (t)) dt. (4.24)
Γ α

Доказательство. Достаточно проверить, что

Z Zβ Z Zβ
0
P (x, y) dx = P (ϕ(t), ψ(t))·ϕ (t) dt, Q(x, y) dy = Q(ϕ(t), ψ(t))·ψ 0 (t) dt. (4.25)
Γ α Γ α


Докажем первое из равенств (4.25), исходя из определения 4.3, где I = P (ϕ(t), ψ(t)) ·
α
ϕ0 (t) dt. В достаточно громоздких преобразованиях, связанных с переходом к парамет-
ру t, существенно используются свойства определенного интеграла. Вторая из формул
(4.25) доказывается аналогично.
Рассмотрим произвольную интегральную сумму σx (P ) = σx,τ,Mi∗ (P ). Пусть точкам
Mi , Mi∗ отвечают значения ti , t∗i параметра t соответственно. Тогда t∗i ∈ [ti−1 , ti ],

Mi (x(ti ), y(ti )), Mi∗ (x(t∗i ), y(t∗i )).

99
Обозначим также
t0 = α, tn = β, ∆ti = ti − ti−1 .
Разбиение τ кривой Γ порождает разбиение T отрезка [α, β]
n
[
T : [α, β] = [ti−1 , ti ].
i=1

При этом
λτ → 0 ⇔ λT → 0. (4.26)
Это вытекает из неравенств
m · λT 6 λτ 6 M · λT . (4.27)
Здесь
p p
m := min ϕ02 (t) + ψ 02 (t) > 0, M := max ϕ02 (t) + ψ 02 (t) > m. (4.28)
t∈[α,β] t∈[α,β]

Действительно, для любого индекса i, 1 6 i 6 n по свойству оценки определенного


интеграла
(4.28)
Zti p (4.28)
m∆ti 6 l(Mi−1 Mi ) = ϕ02 (t) + ψ 02 (t) dt 6 M ∆ti ,
ti−1

откуда и следует (4.27).


Требуется доказать, что

∀ε > 0 ∃δ > 0 ∀T (λT < δ ⇒ |σx (P ) − I| < ε) . (4.29)

(перешли от λτ к λT , учитывая (4.26) ). Обозначим для компактности записей

A(t) : = P (ϕ(t), ψ(t)).

Преобразуем

n
X n
X n
X Zti
σx (P ) = P (Mi∗ )∆xi = P ((ϕ(t∗i ), ψ(t∗i ))(ϕ(ti ) − ϕ(ti−1 )) = A(t∗i ) ϕ0 (t) dt.
i=1 i=1 i=1 ti−1

Используя свойства модуля и определенного интеграла, оценим сверху


¯ ¯ ¯ ¯
¯X n Zti Zβ ¯ ¯X n Zti ¯
¯ ¯ ¯ ¯
|σx (P ) − I| = ¯¯ ∗
A(ti ) 0
ϕ (t) dt − A(t) · ϕ (t) dt¯¯ = ¯¯
0
(A(ti ) − A(t))ϕ (t) dt¯¯ 6
∗ 0

¯ i=1 ¯ ¯ i=1 ¯
ti−1 α ti−1
¯ ¯
Xn ¯ Zti ¯ n Zti
X
¯ ¯
6 ¯ (A(t∗i ) − A(t))ϕ0 (t) dt¯¯ 6 |A(t∗i ) − A(t)| · |ϕ0 (t)| dt.
¯
i=1 ¯ ti−1
¯ i=1
ti−1

Зафиксируем произвольно ε > 0. Чтобы доказать (4.29), достаточно проверить, что


 
n Zti
X
∃ δ > 0 ∀ T λT < δ ⇒ |A(t∗i ) − A(t)| · |ϕ0 (t)| dt < ε . (4.30)
i=1 t
i−1

100
Поскольку функция ϕ0 (t) непрерывна на отрезке [α, β], то по теореме Вейерштрасса
она ограничена на этом отрезке и

∃ K > 0 ∀ t ∈ [α, β] |ϕ0 (t)| 6 K. (4.31)

Так как, далее, функция A(t) также непрерывна на отрезке [α, β], то по теореме Кантора
она равномерно непрерывна на нем и потому
µ ¶
0 00 0 00 0 00 ε
∃ δ > 0 ∀ t , t ∈ [α, β] |t − t | < δ ⇒ |A(t ) − A(t )| < . (4.32)
2K|β − α|

Докажем, что найденное в соответствии с (4.32) число δ является искомым. Выберем


разбиение T такое, что λT < δ. Из включений t ∈ [ti−1 , ti ], t∗i ∈ [ti−1 , ti ] следуют оценки

|t − t∗i | 6 |∆ti | 6 λτ < δ.

Поэтому в силу (4.32)


ε
∀ i, 1 6 i 6 n ∀ t ∈ [ti−1 , ti ] |A(t∗i ) − A(t)| < ,
2K|β − α|
но тогда
(4.31) ε
|A(t∗i ) − A(t)||ϕ0 (t)| 6 .
2|β − α|
По свойству оценки определенного интеграла

Zti
ε
|A(t∗i ) − A(t)| · |ϕ0 (t)| dt 6 · |∆ti |,
2|β − α|
ti−1

откуда

n Zti
X n
X
ε ε ε
|A(t∗i ) 0
− A(t)| · |ϕ (t)| dt 6 · |∆ti | = · |β − α| = < ε.
i=1 t
2|β − α| i=1 2|β − α| 2
i−1

Свойство (4.30) справедливо. •


Замечание 4.4. Теорема верна и в случае кусочно-гладкой кривой Γ .
Следствие 4.3. Если кусочно-гладкая кривая Γ является графиком функции g(x)
на отрезке [a, b] и
Γ : y = g(x), x ∈ [a, b],
то t = x и формула (4.24) упрощается:

Z Zb
P (x, y) dx + Q(x, y) dy = (P (x, g(x)) + Q(x, g(x))g 0 (x)) dx. (4.33)
Γ a

Следствие 4.4. Если же кусочно-гладкая кривая Γ является графиком функции


h(y) на отрезке [c, d] и
Γ : x = h(y), y ∈ [c, d],

101
то t = y и приходим к формуле

Z Zd
P (x, y) dx + Q(x, y) dy = (P (h(y), y)h0 (y) + Q(h(y), y)) dy. (4.34)
Γ c

Пример 4.2. Вычислить криволинейный интеграл от дифференциальной формы

2xy dx + x2 dy

вдоль кривых
Γk : y = xk , 0 6 x 6 1 (k ∈ N),
соединяющих точки (0, 0), (1, 1).
Воспользуемся формулой (4.33):

Z Z1 Z1
2 k 2 k−1 xk+2 ¯¯1
2xy dx + x dy = (2x · x + x · kx ) dx = (k + 2)xk+1 dx = (k + 2) · = 1.
k+2 0
Γk 0 0

Интересно, что значение рассматриваемого КИ-2 одинаково для всех кривых Γk . В


дальнейшем выделим КИ-2, не зависящие от вида кривых, соединяющих две фиксиро-
ванные точки.

4.3 Физический смысл криволинейных интегралов


второго рода
Пусть на множестве G ⊂ R2 заданы непрерывные функции P (x, y), Q(x, y). Будем


их считать координатными функциями вектор-функции F (x, y) :


F (x, y) : = (P (x, y), Q(x, y)).

Введенная вектор-функция определяет на множестве G плоское силовое поле. Пусть




материальная точка единичной массы движется под действием силового поля F вдоль
кусочно-гладкой кривой Γ ⊂ G. Определим и вычислим работу A(Γ) поля при таком
движении.
Будем исходить из формулы работы постоянного поля при движении материальной
точки по отрезку прямой [AB] через скалярное произведение

→ −−→
A = F · AB. (4.35)

Рассмотрим разбиение
n
[
τ : Γ= Mi−1 Mi
i=1

кривой Γ и выделим на каждой частичной дуге Mi−1 Mi точку Mi∗ .


Найдем приближенно работу Ai векторного поля вдоль частичной дуги Mi−1 Mi по
формуле (4.35) при следующих допущениях:

→ −

• в точках частичной дуги Mi−1 Mi поле постоянно: F (x, y) = F (Mi∗ ),

102
• вместо дуги Mi−1 Mi материальная точка движется по отрезку [Mi−1 Mi ].

Тогда

→ −−−−−→
Ai = F (Mi∗ ) · Mi−1 Mi .

→ −−−−−→
Поскольку F (Mi∗ ) = (P (Mi∗ ), Q(Mi∗ )), Mi−1 Mi = (∆xi , ∆yi ), то приходим к формуле

Ai = P (Mi∗ )∆xi + Q(Mi∗ )∆yi .

Поэтому приближенное значение работы поля вдоль всей кривой Γ определяется сум-
мой n
X
(P (Mi∗ )∆xi + Q(Mi∗ )∆yi ). (4.36)
i=1

Определение 4.5. Если существует конечный предел сумм (4.36) при λτ → 0, не


зависящий от выбора разбиений τ и отмеченных точек Mi∗ , то его называют работой
A(Γ) силового поля при перемещении материальной точки вдоль кривой Γ.
Поскольку сумма (4.36) сводится к интегральным суммам функций P (x, y), Q(x, y)
по координатам x, y соответственно:
n
X
(P (Mi∗ )∆xi + Q(Mi∗ )∆yi ) = σx (P ) + σy (Q),
i=1

то существует
n
X Z
lim (P (Mi∗ )∆xi + Q(Mi∗ )∆yi ) = P (x, y) dx + Q(x, y) dy.
λτ →0
i=1 Γ

Тем самым пришли к формуле вычисления работы


Z
A(Γ) = P (x, y) dx + Q(x, y) dy. (4.37)
Γ

4.4 Формула Грина


Эта важная формула устанавливает связь между двойным интегралом по множе-
ству G и криволинейным интегралом по его границе ∂G.

Теорема 4.2 Пусть 1) граница ∂G квадрируемого компактного множества G любой


прямой, параллельной каждой оси координат, пересекается не более чем в двух точ-
ках,
2) функции P (x, y), Q(x, y) непрерывны на множестве G вместе со своими частными
∂Q ∂P
производными , . Тогда справедлива формула Грина 1
∂x ∂y
ZZ µ ¶ Z
∂Q ∂P
− dx dy = P dx + Qdy. (4.38)
∂x ∂y
G ∂G

1
Джордж Грин (George Green, 1793-1841) — английский математик и физик.

103
Доказательство. Достаточно проверить справедливость равенств
ZZ Z
∂Q
dx dy = Qdy, (4.39)
∂x
G ∂G
ZZ Z
∂P
dx dy = − P dx. (4.40)
∂y
G ∂G

Для этого входящие в них двойные и криволинейные интегралы сведем к определенным


интегралам. Как вытекает из условия 1) теоремы, для вычисления двойных интегралов
можно использовать любую из формул (3.27a)-(3.27b); будем выбирать такую, чтобы
вычислились внутренние интегралы.
При доказательстве формулы (4.39) будем работать с заданием множества G в фор-
ме ½
c 6 y 6 d,
G:
ψ1 (y) 6 x 6 ψ2 (y).
∂Q
Здесь функции ψ1,2 (y) непрерывны на отрезке [c, d]. Так как — первообразная функ-
∂x
ции Q(x, y) при y = const, то, применяя формулу (3.27b) и формулу Ньютона-Лейбница,
преобразуем

ZZ Zd ψZ2 (y) Zd ³ ¯ ´
∂Q ∂Q ¯x=ψ (y)
dx dy = dy dx = dy Q(x, y) ¯x=ψ12 (y) =
∂x ∂x
G c ψ1 (y) c

Zd
= (Q(ψ2 (y), y) − Q(ψ1 (y), y)) dy. (4.41)
c

Для нахождения криволинейного интеграла формулы (4.39) представим замкнутую


кривую ∂G = Γ в виде объединения Γ = Γ1 ∪ Γ2 , где

Γ1 : x = ψ2 (y), y ∈ [c, d]; Γ2 : x = ψ1 (y), y ∈ [d, c].

Используем формулу (4.34):

Z Zd Z Zc
Q(x, y)dy = Q(ψ2 (y), y) dy, Q(x, y)dy = Q(ψ1 (y), y) dy.
Γ2
Γ1 c d

Поэтому, применяя свойство аддитивности КИ-2 и формулу (4.34), находим

Z Z Z Zd Zc
Q(x, y)dy = Q(x, y)dy + Q(x, y)dy = Q(ψ2 (y), y) dy + Q(ψ1 (y), y) dy =
Γ Γ1 Γ2 c d

Zd
= (Q(ψ2 (y), y) − Q(ψ1 (y), y))) dy.
c

Пришли к определенному интегралу, стоящему в правой части соотношения (4.41). Тем


самым формула (4.39) доказана.

104
Множество G представим теперь в виде
½
a 6 x 6 b,
G:
ϕ1 (x) 6 y 6 ϕ2 (x)

с непрерывными на отрезке [a, b] функциями ϕ1,2 (x). Тогда

ZZ Zb ϕZ2 (x) Zb
∂P ∂P
dx dy = dx dy = (P (x, ϕ2 (x)) − P (x, ϕ1 (x))) dx.
∂y ∂y
G a ϕ1 (x) a

С другой стороны, представим Γ = L1 ∪ L2 , где

L1 : y = ϕ2 (x), x ∈ [b, a]; L2 : y = ϕ1 (x), x ∈ [a, b].

Находим последовательно:

Z Za Z Zb
(4.33)
P (x, y)dx = P (x, ϕ2 (x)) dx, P (x, y)dx = P (x, ϕ1 (x)) dx,
L1 b L2 a

Z Zb
− P (x, y)dx = (P (x, ϕ2 (x)) − P (x, ϕ1 (x))) dx.
Γ a

Пришли к тому же определенному интегралу. Формула (4.40) доказана. •


Следствие 4.5. Формула Грина справедлива и в случаях, когда множество G
разбивается на m > 2 множеств, удовлетворяющих условию 1) теоремы.
Доказательство следствия проведем для ситуации m = 2 : G = G1 ∪ G2 , причем
^
множества G1,2 отделяются линией AB⊂ G, соединяющей две точки A, B замкнутой
кривой ∂G.
Для каждого из множеств G1 , G2 формула Грина справедлива:
ZZ µ ¶ Z ZZ µ ¶ Z
∂Q ∂P ∂Q ∂P
− dx dy = P dx + Qdy, − dx dy = P dx + Qdy.
∂x ∂y ∂x ∂y
G1 ∂G1 G2 ∂G2

Складывая эти равенства, приходим к соотношению


ZZ µ ¶ ZZ µ ¶ Z Z
∂Q ∂P ∂Q ∂P
− dx dy+ − dx dy = P dx+Qdy+ P dx+Qdy. (4.42)
∂x ∂y ∂x ∂y
G1 G2 ∂G1 ∂G2

Оно и позволит нам доказать формулу Грина для всего множества G. Действительно,
по свойству аддитивности двойных интегралов
ZZ µ ¶ ZZ µ ¶ ZZ µ ¶
∂Q ∂P ∂Q ∂P ∂Q ∂P
− dx dy + − dx dy = − dx dy.
∂x ∂y ∂x ∂y ∂x ∂y
G1 G2 G

Запишем границы множеств G, G1 , G2 :


^ ^
∂G = Γ1 ∪ Γ2 , ∂G1 = Γ1 ∪ AB, ∂G2 = Γ2 ∪ BA .

105
Применив свойства КИ-2, преобразуем правую часть формулы (4.42):
   
Z Z Z Z Z Z Z Z Z Z Z Z Z
   
+ = + + + = + + + = + =
∂G1 ∂G2 Γ1 ^ Γ2 ^ Γ1 Γ2 ^ ^ Γ1 Γ2 ∂G.
AB BA AB BA

Для компактности записи мы опустили одинаковое подынтегральное выражение кри-


волинейных интегралов — дифференциальную форму (4.21).
Замечание 4.5. Формулу Грина можно доказать для произвольного множества G
с кусочно-гладкой границей ∂G (она может состоять из нескольких замкнутых кривых).
Замечание 4.6. Формула Грина является своеобразным обобщением формулы
Ньютона-Лейбница, поскольку точки a, b составляют границу отрезка [a, b] на числовой
прямой R. В полных курсах анализа рассматриваются и другие ее обобщения, связы-
вающие различные типы интегралов (формулы Гаусса-Остроградского, Стокса).

4.5 Выражение площади плоской фигуры в прямо-


угольных и криволинейных координатах
Формула Грина (4.39) упрощает решение ряда задач, связанных с вычислением
двойных интегралов. Укажем удобные способы нахождения площади плоской фигуры
через криволинейный интеграл. Будем исходить из универсальной формулы
ZZ
s(G) = dx dy. (4.43)
G

(см. (3.6)). Подбирая пары функций P (x, y), Q(x, y) так, чтобы
∂Q ∂P
− = 1, (4.44)
∂x ∂y
сможем записать Z
s(G) = P dx + Qdy.
∂G

Функции P (x, y), Q(x, y) с условием (4.44) можно выбирать различными способами,
например, так:
a) P (x, y) = 0, Q(x, y) = x;
b) P (x, y) = −y, Q(x, y) = 0;
y x
c) P (x, y) = − , Q(x, y) = .
2 2
Поэтому получаем следующие формулы вычисления площади плоской фигуры G :
Z Z Z
1
s(G) = xdy = − ydx = xdy − ydx. (4.45)
2
∂G ∂G ∂G

Напомним, что здесь граница ∂G множества G имеет положительную ориентацию.


Теперь сможем доказать уже примененную в п. 3.6 формулу площади плоской фи-
гуры через криволинейные координаты u, v
ZZ
s(G) = |J(u, v)| du dv. (4.46)
G0

106
Связь между координатами x, y u, v определяется соотношениями
½
x = ϕ1 (u, v),
y = ϕ2 (u, v),

причем отображение ϕ(u, v) = (ϕ1 (u, v), ϕ2 (u, v)) регулярно на множестве G0 , G = ϕ(G0 ).
∂ 2y
Будем также предполагать, что смешанная ЧП-2 непрерывна на G0 . Из регуляр-
∂u ∂v
ности отображения ϕ следует, что якобиан J(u, v) сохраняет на множестве G0 знак.
Действительно, J(u, v) — непрерывная, не обращающаяся на G0 в нуль функция.
Пусть Γ0 , Γ = ϕ(Γ0 ) – границы множеств G0 , G соответственно. Это — кусочно-
гладкие кривые (возможно, имеющие разные ориентации). Будем считать, что кривая
Γ0 ориентирована положительно; она задана параметрически уравнениями
½
0 u = u(t),
Γ : t ∈ [α, β]. (4.47)
v = v(t),

Тогда кривая Γ определится так:


½
x = ϕ1 (u(t), v(t)),
Γ: t ∈ [α, β]. (4.48)
y = ϕ2 (u(t), v(t)),

Обозначим ½
1, если ориентации Γ, Γ0 одинаковы,
ε := (4.49)
−1, если ориентации Γ, Γ0 противоположны.
При выводе равенства (4.46) будем исходить из формулы
Z
s(G) = ε · x dy, (4.50)
Γ

вытекающей из (4.45), (4.49). 1) Вначале преобразуем криволинейный интеграл фор-


мулы (4.50) в криволинейный интеграл по кривой Γ0 , уже в координатах u, v; 2) новый
криволинейный интеграл преобразуем к двойному по формуле Грина.
1) Перейдем в криволинейном интеграле равенства (4.50) к определенному, опираясь
на формулу (4.24) и параметризацию (4.48) кривой Γ :


ϕ1 (u(t), v(t)) · ϕ02 (u(t), v(t)) dt.
α

Преобразуем по формуле (2.34) производной сложной функции второй множитель


подынтегрального выражения:

∂ϕ2 (u(t), v(t)) 0 ∂ϕ2 (u(t), v(t)) 0


ϕ02 (u(t), v(t)) = · u (t) + · v (t).
∂u ∂v
Приходим к формуле

Zβ µ ¶
∂ϕ2 (u(t), v(t)) 0 ∂ϕ2 (u(t), v(t)) 0
s(G) = ε · ϕ1 (u(t), v(t)) · · u (t) + · v (t) dt. (4.51)
∂u ∂v
α

107
Введем дифференциальную форму
P (u, v)du + Q(u, v)dv,
где
∂ϕ2 ∂ϕ2
P (u, v) : = ϕ1 (u, v) ·
, Q(u, v) : = ϕ1 (u, v) · . (4.52)
∂u ∂v
Снова применяя формулу (4.24) (теперь справа налево), убеждаемся, что определенный
интеграл формулы (4.51) есть
Z
P (u, v)du + Q(u, v)dv.
Γ0

Поэтому Z
s(G) = ε · P (u, v)du + Q(u, v)dv. (4.53)
Γ0
2) Для применения формулы Грина преобразуем разность
∂Q ∂P (4.52) ∂ϕ1 ∂ϕ2 ∂ 2 ϕ2 ∂ϕ1 ∂ϕ2 ∂ 2 ϕ2 ∂ϕ1 ∂ϕ2 ∂ϕ1 ∂ϕ2
− = · +ϕ1 · − · −ϕ1 · = · − · = J(u, v)
∂u ∂v ∂u ∂v ∂v ∂u ∂v ∂u ∂u ∂v ∂u ∂v ∂v ∂u
(при преобразованиях учтено равенство смешанных ЧП-2). Поэтому, окончательно,
ZZ ZZ ZZ
s(G) = ε · J(u, v) du dv = ε · J(u, v) du dv = [s(G) > 0] = |J(u, v)| du dv. •
G0 G0 G0

Замечание 4.7. Попутно выявлен смысл знака якобиана при регулярном отобра-
жении: если J(u, v) > 0 (J(u, v) < 0), то сохраняется (изменяется) ориентация за-
мкнутых кривых при переходе от координат x, y к координатам u, v.

4.6 Условия независимости криволинейного интегра-


ла от пути интегрирования

Определение 4.6. Говорят, что криволинейный интеграл


Z
P dx + Q dy (4.54)
Γ

не зависит на линейно связном множестве G от пути интегрирования, если его


^
значение одинаково вдоль всех кусочно-гладких кривых AB⊂ G, соединяющих две
произвольные фиксированные точки A(x0 , y0 ), B(x, y) множества G. В этом случае
применяют обозначения
ZB Z
(x,y)

P dx + Q dy, P dx + Q dy.
A (x0 ,y0 )

Определение 4.7. Линейно связное множество G ⊂ R2 называется односвязным,


если внутренность любой кусочно-гладкой замкнутой кривой Γ без точек самопересе-
чения, лежащей во множестве G, также принадлежит этому множеству.
Не односвязные плоские множества имеют хотя бы одну «дырку», возможно, точеч-
ную; примеры таких множеств – кольцо, плоскость с выколотой точкой.

108
∂P ∂Q
Теорема 4.3 Пусть функции P (x, y), Q(x, y), , непрерывны на односвязном
∂y ∂x
открытом множестве G. Тогда следующие условия равносильны:
10 ) криволинейный интеграл (4.54) не зависит на множестве G от пути инте-
грирования;
20 ) дифференциальная форма (4.21) является на множестве G (полным) диффе-
ренциалом некоторой функции U (x, y) :
∀ (x, y) ∈ G P (x, y) dx + Q(x, y) dy = dU (x, y); (4.55)
∂P ∂Q
30 ) ∀ (x, y) ∈ G = ; (A)
∂y ∂x
40 ) вдоль любой кусочно-гладкой замкнутой кривой Γ ⊂ G
Z
P x + Q dy = 0. (4.56)
Γ

Доказательство проведем по схеме 10 ⇒ 20 ⇒ 30 ⇒ 40 ⇒ 10 .


10 ⇒ 20 . Так как дифференциал функции U (x, y) определяется формулой
∂U ∂U
dU (x, y) = dx + dy,
∂x ∂y
то нужно доказать, что при выполнении условия 10 на множестве G существует такая
дифференцируемая функция U (x, y), что
∂U ∂U
∀ (x, y) ∈ G = P (x, y), = Q(x, y). (4.57)
∂x ∂y
Пусть A(x0 , y0 ) ∈ G, B(x, y) ∈ G. Введем криволинейный интеграл
Z
(x,y)

P dx + Q dy.
(x0 ,y0 )

Зафиксировав начальную точку (x0 , y0 ), а конечную точку (x, y) считая, наоборот, пе-
ременной, приходим к функции
Z
(x,y)

U (x, y) : = P dx + Q dy. (4.58)


(x0 ,y0 )

Убедимся, что функция (4.58) является искомой. Докажем, исходя из определения ЧП-1
через предел, что справедливо первое из равенств (4.57). Второе равенство доказыва-
ется аналогично.
Выбрав точку B(x, y) ∈ G, убедимся, что существует
∂U (x, y)
.
∂x
Для этого возьмем новую точку C(x + ∆x, y) так, чтобы отрезок [BC] ⊂ G, и преобра-
зуем разность
Z
(x+∆x,y) Z
(x,y)
(4.58)
U (x + ∆x, y) − U (x, y) = P dx + Q dy − P dx + Q dy.
(x0 ,y0 ) (x0 ,y0 )

109
В силу условия 10 рассматриваемые криволинейные интегралы можно вычислить вдоль
любых кусочно-гладких кривых, содержащихся в G и соединяющих начальную и конеч-
ную точки. Поэтому второй из криволинейных интегралов рассмотрим вдоль некоторой
^
выделенной кусочно-гладкой кривой Γ =AB⊂ G, а первый — вдоль кривой Γ ∪ [BC].
Тогда по свойствам криволинейных интегралов
Z Z
U (x + ∆x, y) − U (x, y) = P dx + Q dy − P dx + Q dy =
Γ∪[BC] Γ

Z Z Z Z
= P dx + Q dy + P dx + Q dy − P dx + Q dy = P dx + Q dy.
Γ [BC] Γ [BC]

Так как
[BC] : y = const, t ∈ [x, x + ∆x],
то по формуле (4.24) и теореме о среднем для определенных интегралов

Z
x+∆x

U (x + ∆x, y) − U (x, y) = P (t, y) dt = P (x + ϑ · ∆x) · ∆x (0 6 ϑ 6 1).


x

Поскольку при ∆x → 0 (x + ϑ · ∆x, y) → (x, y), то в силу непрерывности функции P


на множестве G существует
U (x + ∆x, y) − U (x, y) P (x + ϑ · ∆x, y) · ∆x
lim = lim = lim P (x+ϑ·∆x, y) = P (x, y).
∆x→0 ∆x ∆x→0 ∆x ∆x→0

20 ⇒ 30 . По условию 20 дифференциальная форма (4.21) есть дифференциал функ-


ции U (x, y), а ее ЧП-1 удовлетворяют равенствам (4.57). Преобразуем разность
³ ´
∂U ¡ ¢
∂Q ∂P (4.57) ∂ ∂y ∂ ∂U ∂ 2U ∂ 2U
∂x
− = − = − .
∂x ∂y ∂x ∂y ∂y ∂x ∂x ∂y
Так как смешанные ЧП-2 функции U (x, y) на открытом множестве G непрерывны (по-
чему?), то они совпадают. Поэтому
∂Q ∂P
∀ (x, y) ∈ G − = 0,
∂x ∂y
что и означает справедливость условия (A).
30 ⇒ 40 . Зафиксируем некоторую замкнутую кусочно-гладкую кривую Γ ⊂ G.
В силу односвязности множества G замкнутое множество D, ограниченное кривой Γ,
содержится в исходном множестве G. Поэтому справедлива формула Грина
ZZ µ ¶ Z
∂Q ∂P
− dx dy = P dx + Q dy. (4.59)
∂x ∂y
D Γ

Так как по условию 30 подынтегральная функция двойного интеграла обращается в


нуль на множестве D, то оба интеграла формулы (4.59) равны нулю.
40 ⇒ 10 . Убедимся, что при выполнении условия 40 криволинейный интеграл (4.54)
не зависит на множестве G от пути интегрирования. Зафиксируем произвольно точки

110
A, B ∈ G и рассмотрим две кусочно-гладкие кривые Γ0 ⊂ G, Γ00 ⊂ G, соединяющие
выбранные точки. Для завершения доказательства теоремы нужно проверить, что
Z Z
P dx + Qdy = P dx + Qdy. (4.60)
Γ0 Γ00

1) Рассмотрим вначале простой случай, когда кривые Γ0 , Γ00 не имеют, кроме конеч-
ных, других общих точек. Тогда замкнутая кусочно-гладкая кривая

Γ : = Γ0 ∪ Γ00−

не имеет точек самопересечения и в силу условия 40


Z
P dx + Qdy = 0.
Γ

Используем свойства криволинейных интегралов:


Z Z Z Z Z
0 = P dx + Qdy = P dx + Qdy + P dx + Qdy = P dx + Qdy − P dx + Qdy.
Γ Γ0 Γ00

Γ0 Γ00

Формула (4.60) доказана.


2) В случаях, когда кривые пересекаются в m (m ∈ N) точках, отличных от A, B,
доказательство формулы (4.60) аналогично, только теперь возникает m + 1 замкнутая
кривая с условием 40 . Достаточно рассмотреть ситуацию m = 1.
Пусть Γ0 ∩ Γ00 = {A, B, M }. Вводя на кривых Γ0 , Γ00 новые точки, представим

Γ0 = AK 0 M ∪ M L0 B, Γ00 = AK 00 M ∪ M L00 B.

Рассмотрим кусочно-гладкие кривые без самопересечений

Γ1 := AK 0 M ∪ M K 00 A, Γ2 := M L0 B ∪ BL00 M.

По условию 40 Z Z
= 0, = 0,
Γ1 Γ2
откуда Z Z
+ = 0.
Γ1 Γ2

Преобразуем последнее равенство:


Z Z Z Z Z Z Z Z Z Z
0= + = + + + = − + − =
Γ1 Γ2 AK 0 M M K 00 A M L0 B BL00 M AK 0 M AK 00 M M L0 B M L00 B
   
Z Z Z Z Z Z
= + − + = − .
AK 0 M M L0 B AK 00 M M L00 B Γ0 Γ00

Одинаковое подынтегральное выражение криволинейных интегралов — дифференци-


альную форму (4.21) мы опустили. •

111
Замечание 4.8. Соотношение (A) является удобным аналитическим условием спра-
ведливости каждого из утверждений 10 , 20 , 40 теоремы.
Замечание 4.9. Условие односвязности множества G в теореме является суще-
ственным. Обоснуем это, рассматривая криволинейный интеграл
Z
x dy − y dx
I= (4.61)
x2 + y 2
Γ

вдоль окружности
Γ : x2 + y 2 = R 2 (R > 0).
Здесь
y x
P (x, y) = − , Q(x, y) = 2 , G = R2 \ {(0, 0)}.
x2 +y 2 x +y 2

Так как
∂Q x2 + y 2 − 2x2 y 2 − x2 ∂P x2 + y 2 − 2y 2 y 2 − x2 ∂Q
= = , =− = = ,
∂x (x2 + y 2 )2 (x2 + y 2 )2 ∂y 2
(x + y ) 2 2 2
(x + y )2 2 ∂x
то соотношение (A) справедливо. Поскольку окружность Γ охватывает «дырку» — точ-
ку (0, 0), то формулу (4.56) применить нельзя. Вычислим интеграл (4.61) непосред-
ственно, используя стандартную параметризацию окружности
½
x = R cos t,
Γ: t ∈ [α, 2π] :
y = R sin t,

Z2π Z2π
R cos t · R cos t + R sin t · R sin t
I= dt = dt = 2π 6= 0.
R2
0 0

Интересно, что величина интеграла оказалась не зависящей от радиуса R окружно-


сти Γ.
Пусть теперь Γ = Γ1 , где Γ1 — замкнутая кусочно-гладкая кривая, не охватываю-
щая точки (0, 0) и не проходящая через нее. Тогда существует односвязное открытое
множество G1 ⊂ G, внутри которого находится новая кривая Γ1 . Поэтому на множестве
G1 теорема верна и в силу утверждения 40
Z
x dy − y dx
= 0. •
x2 + y 2
Γ1

4.7 Первообразная дифференциальной формы, ее фи-


зический смысл
Теперь будем отталкиваться от утверждения 20 теоремы 4.3. Соотношение (4.55)
можно рассматривать как обобщение на функции двух переменных равенства

dF (x) = f (x) dx,

определяющего функцию F (x) как первообразную функции f (x). Поэтому естествен-


ным является следующее
Определение 4.8. Если выполнено условие (4.55), то функция U (x, y) называется
первообразной дифференциальной формы (4.21) на множестве G.

112
В то время как первообразная F (x) существует для любой непрерывной на проме-
жутке функции f (x), функция двух переменных U (x, y) является первообразной диф-
ференциальной формы (4.21) лишь при выполнении условия (A).

Теорема 4.4 Если функция U (x, y) является первообразной дифференциальной формы


(4.21) на линейно связном открытом множестве G, то совокупность всех первооб-
разных этой дифференциальной формы на множестве G задается равенством

U (x, y) + C, C ∈ R. (4.62)

Доказательство. 1) Если U (x, y) — первообразная дифференциальной формы


(4.21) на множестве G и, значит, справедливы соотношения (4.57), то при C = const

∂U (x, y) ∂(U (x, y) + C) ∂U (x, y) ∂(U (x, y) + C)


= , =
∂x ∂x ∂y ∂y

Поэтому каждая из функций (4.62) также является первообразной той же дифферен-


циальной формы на множестве G.
2) Пусть U (x, y), V (x, y) — первообразные дифференциальной формы (4.21) на мно-
жестве G. Тогда, наряду с (4.57), справедливы соотношения

∂V ∂V
∀ (x, y) ∈ G = P (x, y), = Q(x, y). (4.63)
∂x ∂y
Введем функцию
h(x, y) : = V (x, y) − U (x, y).
Из (4.57), (4.63) следуют равенства

∂h ∂h
∀ (x, y) ∈ G = 0, = 0.
∂x ∂y
Тогда по теореме 2.7 об условиях постоянства функций нескольких переменных

∀ (x, y) ∈ G h(x, y) = const = C0 .

Поэтому и функция V (x, y) = U (x, y) + C0 содержится во множестве (4.62). •


Следствие 4.6. (обобщенная формула Ньютона-Лейбница). Если U (x, y) —
первообразная дифференциальной формы (4.21) на линейно связном открытом множе-
стве G и (x0 , y0 ) ∈ G, (x1 , y1 ) ∈ G, то
(xZ1 ,y1 )

P dx + Qdy = U (x1 , y1 ) − U (x0 , y0 ). (4.64)


(x0 ,y0 )

Доказательство. При доказательстве теоремы 4.3 мы убедились, что функция 2

Z
(x,y)

V (x, y) : = P dx + Qdy (4.65)


(x0 ,y0 )

2
Из методических соображений нам теперь удобнее обозначить эту функцию символом V (x, y).

113
— также первообразная дифференциальной формы на множестве G. При этом
V (x0 , y0 ) = 0 (почему?). По теореме 4.4 найдется такая константа C0 , что

∀ (x, y) ∈ G U (x, y) = V (x, y) + C0 . (4.66)

Полагаем в формуле (4.66) (x, y) = (x0 , y0 ) :

U (x0 , y0 ) = V (x0 , y0 ) + C0 = C0 ,

откуда находим C0 = U (x0 , y0 ). Подставляем теперь в формулу (4.66) (x, y) = (x1 , y1 ) :

U (x1 , y1 ) = V (x1 , y1 ) + U (x0 , y0 ),

поэтому
V (x1 , y1 ) = U (x1 , y1 ) − U (x0 , y0 ).
Отсюда уже следует искомая формула (4.64), поскольку
(xZ1 ,y1 )
(4.65)
V (x1 , y1 ) = P dx + Qdy. •
(x0 ,y0 )

Формула (4.64) позволяет вычислять криволинейные интегралы (конечно, только в


случае их независимости от пути интегрирования) через первообразную U (x, y).
Обратимся теперь к нахождению первообразной. Общий способ уже известен и за-
ключается в определении функции U (x, y) посредством формулы (4.58). Фиксируя раз-
личные точки (x0 , y0 ), приходим к разным первообразным, отличающимся на постоян-
ные слагаемые. Вычислять интеграл

Z
(x,y)

P dx + Qdy
(x0 ,y0 )

можно вдоль любой кусочно-гладкой кривой Γ ⊂ G, соединяющей точки (x0 , y0 ), (x, y).
Во многих случаях удобно двигаться вдоль отрезков двух прямых, параллельных осям
координат. Пусть, например, Γ = [AM ] ∪ [M B], M (x, y0 ). Тогда

Z
(x,y) Z Z
P dx + Qdy = P dx + Qdy + P dx + Qdy.
(x0 ,y0 ) [AM ] [M B]

Так как в точках отрезка [AM ] y = y0 = const, то dy = 0 и


Z Zx
P dx + Qdy = P (x, y0 ) dx.
[AM ] x0

Вдоль отрезка [M B], наоборот, x = const. Поэтому


Z Zy
P dx + Qdy = Q(x, y) dy
[M B] y0

114
и приходим к формуле 3
Zx Zy
U (x, y) = P (x, y0 ) dx + Q(x, y) dy. (4.67)
x0 y0

Замечание 4.10. Координаты начальной точки (x0 , y0 ) целесообразно выбирать


достаточно простыми; если возможно, то следует полагать x0 = y0 = 0.
Задание 4.2. Решить пример 4.2, опираясь на понятие первообразной дифферен-
циальной формы.
Дадим физическую интерпретацию материала, изложенного в пунктах 4.6-4.7. Как
и в пункте 4.3, рассматриваем плоское силовое поле


F (x, y) = (P (x, y), Q(x, y)).

Напомним, что работа A(Γ) поля




F (x, y)
^
вдоль кривой Γ =BC определяется криволинейным интегралом (4.37).
Определение 4.9. Если существует такая дифференцируемая функция U (x, y),


что справедливо соотношение (4.55), то силовое поле F (x, y) называется потенциаль-
ным (или консервативным), а функция U (x, y) называется потенциальной функцией
(потенциалом) поля.
Так как для потенциального поля выполнены условия (4.57), то


F (x, y) = (P (x, y), Q(x, y)) = grad U (x, y);

поэтому потенциальное поле есть поле градиента потенциальной функции U (x, y).
Сама потенциальная функция задается с точностью до постоянного слагаемого. Соот-


ношение (A) есть удобное аналитическое условие потенциальности поля F (x, y).
Как вытекает из утверждений 10 , 40 теоремы 4.3, работа потенциального поля обла-
дает специфическими свойствами.
1) Она не зависит от вида кривой, соединяющей точки точки B(x0 , y0 ), C(x1 , y1 ).
Названная работа вычисляется либо через криволинейный интеграл
(xZ1 ,y1 )

A= P dx + Q dy, (4.68)
(x0 ,y0 )

либо через потенциальную функцию

A = U (x1 , y1 ) − U (x0 , y0 ) (4.69)


3
Она записана не вполне корректно, поскольку в ее правой части одинаковыми символами обозна-
чены и верхние пределы, и переменные интегрирования определенных интегралов. Этого недостатка
лишена такая версия той же формулы:
Zx Zy
U (x, y) = P (t, y0 ) dt + Q(x, t) dt;
x0 y0

она, однако, менее удобна для применения.

115
как разность значений потенциальной функции в конечной и начальной точках.
2) Работа потенциального поля вдоль любой замкнутой кусочно-гладкой кривой
Γ ⊂ G равна нулю.
Рассмотрим важное для приложений потенциальное поле — поле ньютоновского
притяжения.
Пример 4.3. Пусть в начале координат O(0, 0) плоскости R2 находится материаль-
ная точка массой m. Она создает в каждой точке M (x, y) 6= (0, 0) силу притяжения

→ µm p
F (x, y). Эта сила направлена к точке O, ее величина F = 2 . Здесь r = x2 + y 2 —
r
(евклидово) расстояние между точками M, O, µ = const.


Найдем функции P (x, y) как проекции вектора F (x, y) на оси координат. Будем
считать, что x > 0, y > 0, тогда P (x, y) 6 0, Q(x, y) 6 0. Пусть α — угол между
−−→ −
→ −−→
векторами OM , ~i, F (x, y) = M K, D(x, 0), E — такая точка отрезка [M D], что
KE⊥M D. Из прямоугольного треугольника ODM находим
x y
cos α = , sin α = .
r r
Рассмотрим теперь подобный ему треугольник KEM, где ∠M KE = α :
x y
|KE| = |P (x, y)| = F cos α = µm 3
, |M E| = |Q(x, y)| = F sin α = µm 3 .
r r
Поэтому
x x y y
P (x, y) = −µm = −µm q , Q(x, y) = −µm = −µm q .
r3 r3
(x2 + y 2 )3 (x2 + y 2 )3

Так как µ ¶
∂Q 3 xy
= −µmy − (x2 + y 2 )−5/2 (2x) = 3µm 2 ,
∂x 2 (x + y 2 )5/2
µ ¶
∂P 3 xy ∂Q
= −µmx − (x2 + y 2 )−5/2 (2y) = 3µm 2 2 5/2
= ,
∂y 2 (x + y ) ∂x
то поле потенциально. Найдем потенциальную функцию по формуле (4.67), полагая
x 1
x0 = 1, y0 = 0. Поскольку P (x, y0 ) = P (x, 0) = −µm 3 = −µm 2 , то
x x
Zx Zy µ ¶ Zy
1 dx ydy 1 x 1
U (x, y) = − − = | − (y 2 + x2 )−3/2 d(y 2 + x2 ) =
µm x2 (x + y 2 )3/2
2 x 1 2
1 0 0

1 1 ¯ 1 1 1 1
= − 1 − (−2)(y 2 + x2 )−1/2 ¯y=y
y=0 = −1+ p − = − 1.
x 2 x 2
x +y 2 x r
Отбрасывая постоянное слагаемое, приходим к формуле
µm
U (x, y) = .
r
^
Поэтому работа рассматриваемого поля вдоль кривой Γ =BC определяется рассто-
яниями q q
r0 = x0 + y0 , r1 = x21 + y12
2 2

116
ее начальной и конечной точек до точки O и выражается формулой
µ ¶
1 1
A = µm − .
r1 r0

Задание 4.3. Доказать потенциальность поля силы тяжести




F = (0, −g),

найти формулу работы этого поля.


Замечание 4.11. Построенная здесь теория двойных интегралов и криволиней-
ных интегралов вдоль плоских кривых обобщается на произвольный n-мерный случай
(n > 2). При этом вводятся также поверхностные интегралы первого и второго рода.

117
Библиографический список

[1] Кудрявцев Л.Д. Краткий курс математического анализа. М.: Наука, 1989. 735 с.

[2] Фихтенгольц Г.М. Основы математического анализа. Т. 1. М.: Наука, 1968. 440 с.
Т. 2. М.: Наука, 1964. 463 с.

[3] Уваренков И.М., Маллер М.З. Курс математического анализа. Т.2. М.: Просвеще-
ние, 1976. 479 с.

[4] Зорич В.А. Математический анализ. Т. 1. М.: Наука, 1981. 543 с.

[5] Зорич В.А. Математический анализ. Т. 2. М.: Наука, 1984. 640 с.

[6] Бохан К.А., Егорова И.А., Лащенов К.В. Курс математического анализа. Т.2. М.:
Просвещение, 1966. 380 с.

[7] Райков Д.А. Многомерный математический анализ. М.: Высшая школа, 1981. 271 с.

[8] Метрические пространства: Метод. разработка/ Сост. С.П.Охезин. -Свердловск,


СГПИ, 1985. 46 с.

[9] Берман Г.Н. Сборник задач по курсу математического анализа. М.: Наука, 1969.
439 с.

[10] Демидович Б.П. Сборник задач и упражнений по математическому анализу. М.:


Наука, 1972. 544 c.

118
Подписано в печать Формат 60х84/16.
Бумага для множ. аппаратов. Печать на ризографе. Усл. печ. л.
Тираж 00 экз. Заказ
Оригинал-макет изготовлен и отпечатан в отделе множительной техники
Уральского государственного педагогического университета
620017 Екатеринбург, просп. Космонавтов, 26
E-mail: uspu@dialup.utk.ru