Вы находитесь на странице: 1из 284

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение


высшего профессионального образования
«Нижегородский государственный архитектурно-строительный университет»

В.П. Важдаев, М.М. Коган,


М.И. Лиогонький, Л.А. Протасова

64 ЛЕКЦИИ ПО МАТЕМАТИКЕ

Книга 1 (лекции 1-39)


Утверждено редакционно-издательским советом университета
в качестве учебного пособия

Нижний Новгород ННГАСУ


2012
Лекции по математике в двух книгах написаны преподавателями ка-
федры математики Нижегородского государственного архитектурно-
строительного университета для студентов различных «нематематиче-
ских» специальностей:будущихинженеров-строителей, экологов, экономи-
стови других. Первая книгавключает в себя основные понятия и методы
линейной алгебры, аналитической геометрии, математического анализа,
дифференциального и интегрального исчислений.

Лекции по математике в двух книгах написаны преподавателями ка-


федры математики Нижегородского государственного архитектурно-
строительного университета для студентов различных «нематематиче-
ских» специальностей: будущих инженеров-строителей, экологов, эконо-
мистов и других. Вторая книга включает в себя основные понятия теории-
дифференциальных уравнений, кратные и криволинейные интегралы, тео-
рию рядов, а также элементы теории множеств, теории графов и математи-
ческой логики.

Важдаев Виктор Петрович


Коган Марк Михайлович
Лиогонький Марк Израилевич
Протасова Людмила Анатольевна
Содержание
Введение ...................................................................................................................... 8

Раздел 1. Матрицы и системы линейных уравнений

Лекция 1.Введение в матричную алгебру


1.1. Основные понятия ........................................................................................... 10
1.2. Сложение матриц и умножение на число ..................................................... 10
1.3. Умножение матриц ......................................................................................... 11
1.4. Матрицы и линейные преобразования .......................................................... 12
Лекция 2.Правило Крамера и определители матриц
2.1. Системы двух уравнений с двумя неизвестными ........................................ 16
2.2. Системы трех уравнений с тремя неизвестными ......................................... 19
Лекция 3.Системы и определители матриц n -го порядка
3.1. Матричная запись системы линейных уравнений ....................................... 22
3.2. Определители матриц порядка n и их свойства ........................................ 23
3.3. Обратная матрица ........................................................................................... 27
Лекция 4. Системы m уравнений с n неизвестными
4.1. Ранг матрицы ................................................................................................... 31
4.2. Теорема Кронекера-Капелли ......................................................................... 31

Раздел 2. Векторная алгебра

Лекция 5.Векторы и линейные операции над ними


5.1. Основные понятия и определения ................................................................. 36
5.2. Линейные операции над векторами .............................................................. 36
5.3. Проекция вектора на ось ................................................................................ 39
Лекция 6.Линейная комбинация векторов. Системы координат
6.1. Линейная комбинация векторов .................................................................... 43
6.2. Разложение вектора по базису. Координаты вектора .................................. 45
6.3. Декартова система координат ........................................................................ 46
6.4. Полярная система координат ......................................................................... 47
Лекция 7.Скалярное произведение
7.1. Скалярное произведение двух векторов ....................................................... 50
7.2. Скалярное произведение в прямоугольных координатах ........................... 52
7.3. Деление отрезка в заданном отношении ....................................................... 54
Лекция 8.Векторное и смешанное произведения векторов
8.1. Векторное произведение ................................................................................ 56
8.2.Смешанное произведение ............................................................................... 60

Раздел 3. Аналитическая геометрия. Прямые и плоскости

Лекция 9.Прямая линия на плоскости


9.1. Общее уравнение прямой ............................................................................... 65
9.2. Уравнение прямой с угловым коэффициентом ............................................ 68
9.3. Параметрические и канонические уравнения прямой ................................. 68

3
Лекция 10. Задачи, связанные с прямыми на плоскости
10.1. Взаимное расположение двух прямых ........................................................ 70
10.2. Пучок прямых, определяемый двумя пересекающимися прямыми ........ 74
10.3. Расстояние от точки до прямой ................................................................... 74
10.3Линейные неравенства .................................................................................... 76
Лекция 11.Плоскость
11.1. Различные виды уравнения плоскости ....................................................... 78
11.2. Взаимное расположение двух плоскостей .................................................. 82
11.3. Расстояние от точки до плоскости .............................................................. 84
Лекция 12. Прямая линия в пространстве
12.1. Различные виды уравнений прямой ............................................................ 86
12.2. Проекция точки на прямую и
расстояние от точки до прямой в пространстве .................................................. 90
12.3.Пересечение прямых в пространстве ........................................................... 91
12.4. Расстояние между двумя прямыми ............................................................. 93
Лекция 13. Взаимное расположение прямых и плоскостей
13.1. Угол между прямыми ................................................................................... 95
13.2. Угол между прямой и плоскостью .............................................................. 96
13.3. Пересечение прямой с плоскостью ............................................................. 98
Лекция 14.Другие задачи о прямых и плоскостях ........................ 100

Раздел 4. Математический анализ. Дифференциальное исчисление

Лекция 15.Функция
15.1. Функция и способы её задания .................................................................. 106
15.2. Обратная функция ....................................................................................... 107
15.3. Предел последовательности ....................................................................... 109
Лекция 16.Свойства пределов. Второй замечательный предел
16.1. Свойства сходящихся последовательностей ............................................ 111
16.2. Второй замечательный предел ................................................................... 115
16.3. Раскрытие неопределённостей .................................................................. 116
Лекция 17.Предел функции. Непрерывность
17.1. Предел функции .......................................................................................... 119
17.2. Первый замечательный предел .................................................................. 121
17.3. Непрерывность функции ............................................................................ 122
17.4. Свойства непрерывных функций ............................................................... 124
Лекция 18.Производная
18.1. Физический, геометрический и математический смысл производной .. 128
18.2. Вычисление производных .......................................................................... 130
18.3. Уравнение касательной. Угол между кривыми ...................................... 132
18.4. Правила дифференцирования .................................................................... 133
Лекция 19.Производная (продолжение)
19.1. Дифференцирование сложной и обратной функций ............................... 135
19.2. Дифференцирование функций, заданных параметрически.
Касательная к параметрически заданной кривой ............................................. 137
19.3. Производная функции, заданной неявно.
Касательная к неявно заданной кривой ............................................................. 139
19.4. Логарифмическое дифференцирование .................................................... 140
4
19.5. Сводка формул производных и правил дифференцирования ................ 141
19.6. Производные высших порядков ................................................................ 142

Лекция 20.Вектор-функция
20.1. Вектор-функция и её задание .................................................................... 144
20.2. Предел, непрерывность и производная вектор-функции ........................ 145
20.3. Уравнения касательной к пространственной кривой и
уравнение нормальной плоскости ...................................................................... 147
Лекция 21.Дифференциал
21.1. Дифференциал функции ............................................................................. 150
21.2. Правило Лопиталя ....................................................................................... 154
Лекция 22.Исследование функций и построение их графиков
22.1. Формула Лагранжа ...................................................................................... 157
22.2. Признак монотонности функции ............................................................... 158
22.3. Экстремумы ................................................................................................. 159
Лекция 23.Исследование функций и построение их графиков
(продолжение)
23.1. Выпуклость .................................................................................................. 163
23.2. Точки перегиба ............................................................................................ 165
23.3. Асимптоты ................................................................................................... 166
23.4. Примерный план исследования функции ................................................. 169
Лекция 24.Кривизна. Приближённое решение уравнений
24.1. Понятие кривизны ....................................................................................... 171
24.2. Вычисление кривизны плоской кривой .................................................... 171
24.3. Геометрический смысл кривизны ............................................................. 172
24.4. Приближённое решение уравнений .......................................................... 173

Раздел 5. Аналитическая геометрия. Кривые и поверхности


второго порядка

Лекция 25. Линии второго порядка


25.1. Эллипс .......................................................................................................... 178
25.2. Гипербола ..................................................................................................... 180
Лекция 26. Парабола. Приведение кривых к каноническому виду
26.1. Парабола ...................................................................................................... 185
26.2. Вырожденные случаи ................................................................................. 186
26.3. Приведение уравнения линии второго порядка к каноническому виду 187
26.4. Параллельный перенос осей координат .................................................... 187
26.5. Преобразование поворота системы координат ........................................ 189
Лекция 27.Поверхности второго порядка
27.1. Цилиндрические поверхности ................................................................... 195
27.2. Поверхности вращения ............................................................................... 197
Лекция 28.Канонические уравнения поверхностей
второго порядка
28.1. Эллипсоиды ................................................................................................. 200
28.2. Гиперболоиды ............................................................................................. 202
28.3. Конусы ......................................................................................................... 205
28.4. Параболоиды ............................................................................................... 206
5
Раздел 6. Математический анализ. Интегральное исчисление

Лекция 29.Неопределенный интеграл


29.1. Первообразная функция и неопределённый интеграл ............................ 209
29.2. Интегрирование методами подстановки и замены переменной ............ 213
Лекция 30.Методы интегрирования (продолжение)
30.1. Интегрирование простейших иррациональностей .................................. 216
30.2. Интегрирование по частям ......................................................................... 217
30.3. Интегрирование тригонометрические выражений .................................. 218
Лекция 31.Комплексные числа
31.1. Введение ....................................................................................................... 222
31.2. Геометрическая интерпретация комплексных чисел .............................. 223
31.3. Тригонометрическая форма комплексного числа .................................... 223
31.4. Операции над комплексными числами ..................................................... 224
Лекция 32.Решение алгебраических уравнений
32.1. Извлечение корня из комплексного числа ................................................ 228
32.2. Квадратное уравнение ................................................................................ 230
32.3. Разложение многочлена на множители .................................................... 231
32.4. Разложение на простые дроби и интегрирование
дробно-рациональных функций ......................................................................... 232
Лекция 33. Определённый интеграл
33.1. Задачи, приводящие к понятию определённого интеграла ..................... 235
33.2. Понятие определённого интеграла ............................................................ 238
33.3. Существование первообразной функции ................................................. 239
33.4. Формула Ньютона - Лейбница ................................................................. 240
Лекция 34. Вычисление определённого интеграла
34.1. Интегрирование по частям и замена переменной .................................... 242
34.2. Вычисление площади фигуры в полярной системе координат .............. 245
34.3. Вычисление площади фигуры, ограниченной кривыми,
заданными параметрически ................................................................................ 247
Лекция 35. Другие приложения определённого интеграла
35.1. Объём тела с известной площадью поперечного сечения ...................... 249
35.2. Вычисление объёмов тел вращения .......................................................... 250
35.3. Несобственные интегралы ......................................................................... 251

Раздел 7 . Математический анализ. Дифференциальное


исчисление функций многих переменных

Лекция 36. Функции многих переменных


36.1. Понятие функции двух переменных ......................................................... 256
36.2. Предел и непрерывность функции двух переменных ............................. 257
36.3. Частные производные, производная по направлению ........................... 259
Лекция 37.Производные сложных функций
37.1. Дифференцирование сложных функций ................................................... 263
37.2. Вычисление производной по направлению .............................................. 264
37.3. Дифференцирование неявных функций ................................................... 265
37.4. Градиент ....................................................................................................... 265
6
37.5. Касательная плоскость и нормаль к поверхности ................................... 269

Лекция 38. Дифференциал и экстремумы функции двух


переменных
38.1. Дифференцируемость функции двух переменных. Дифференциал ...... 272
38.2. Производные и дифференциалы высших порядков ................................ 275
38.3. Экстремумы функции многих переменных .............................................. 276
Лекция 39. Условный экстремум
39.1. Понятие условного экстремума ................................................................. 280
39.2. Метод множителей Лагранжа .................................................................... 281

7
Даже плавая на поверхности
океана знаний,можно достичь
его глубин.
Френсис Бэкон

Введение

Лекции написаны преподавателями кафедры математики Нижего-


родского государственного архитектурно-строительного университета
(ННГАСУ) для студентов различных «нематематических» специальностей:
будущих инженеров-строителей, экологов, экономистов и других. Общий
объем материала ограничивался количеством часов, которое отводится
изучению математики современными образовательными стандартами этих
специальностей, а его «глубина» определялась педагогическим опытом ав-
торов. Лекции изданы в двух книгах, которые содержат материал, излагае-
мый в ННГАСУ на первом и втором курсах соответственно. По стилю из-
ложения и по структуре это действительно лекции: весь материал разбит
на части, излагаемые примерно за полтора часа и расположенные в том по-
рядке (не единственно возможном), который соответствует читаемому в
ННГАСУ курсу. Лекции включают в себя основные понятия и методы ли-
нейной алгебры, аналитической геометрии, математического анализа,
дифференциального и интегрального исчислений, дифференциальных
уравнений, теории рядов, а также элементы теории множеств, теории гра-
фов и математической логики.
Следует заметить, что существующие классические учебники мате-
матики достаточно сложны для студентов нематематических специально-
стей, а учебные пособия, появившиеся в последнее время, носят, как пра-
вило, справочный характер: в них формулируются определения и приво-
дятся соответствующие формулы для вычислений. По мнению авторов,
сейчас востребована учебная литература, которая в доступной форме рас-
крывает содержание основных математических понятий и методов, сочетая
математическую строгость и простоту изложения. В соответствии с этим
основная задача, которую ставили перед собой авторы, – повысить об-
щую математическую культуру студентов, обучить их простейшим на-
выкам математического моделирования, развить умение устанавливать
причинно-следственные связи и рационально мыслить. Это как раз то,
что требуется для эффективной деятельности в любой сфере.

8
Усилия авторского коллектива распределялись следующим образом:
доцент В.П. Важдаев и профессор М.М. Коган написали лекции по алгеб-
ре, геометрии, функциям одной и нескольких переменных, дифференци-
альному и интегральному исчислениям, дифференциальным уравнениям,
рядам Фурье (лекции 1–24, 29–48, 60,61),доцент М.И. Лиогонький–по кри-
волинейным интегралам, теории рядов, элементам математической логики,
теории множеств и теории графов (лекции 54–59, 62–64), доцент Л.А. Про-
тасова – по кривым и поверхностям второго порядка, кратным интегралам
(лекции 25–28, 49–53). Рисунки к лекциям выполнили В.П. Важдаев, М.И.
Лиогонький,Г.Л. Пугач (кривые и поверхности второго порядка, кратные
интегралы). Общее редактирование лекций осуществили В.П. Важдаев и
М.М. Коган. Авторы будут благодарны за любую (положительную или от-
рицательную) «обратную связь»(например, по электронной почте
mkogan@nngasu.ru).

9
Раздел 1. Матрицы и системы линейных уравнений

Лекция 1. Введение в матричную алгебру

Теорию матриц можно справедливо считать


Арифметикой высшей математики.
Ричард Беллман (1920-1984 гг.)

Матрицы широко применяются в различных разделах математики, фи-


зики и других дисциплинах; они находят широкое применение при исследо-
ваниях экономических проблем. В матричной записи легко и наглядно обна-
руживаются те или иные особенности решаемой задачи, а теория матриц да-
ет инструмент для ее эффективного решения.

1.1. Основные понятия. Таблица чисел вида

 a11 a12 … a1n 


a a22 … a2n 

A= … …
21
,
 … 
 am1 am 2 … amn 
 
состоящаяиз m строк и n столбцов, называется матрицей A размера ( m × n )
(читается « m » на « n »). Числа m и n не обязаны быть одинаковыми. Если
m = n , то матрица называется квадратной, а число n называют её поряд-
ком. Более компактная форма записи матрицы имеет вид

A =|| aij ||, i = 1,2,..., m; j = 1, 2,..., n ,

где элемент матрицы ai j расположен в i -й строке и j -м столбце.


Частные случаи: A = (a11 a12 … a1n ) – матрица-строка,
 a11 
a 
A =  21  – матрица-столбец.
 ⋮ 
 am1 

Понятие равенства двух матриц естественно вводится для матриц оди-


наковых размеров. Две матрицы называются равными, если равны их соот-
ветствующие элементы:

A = B ⇔ || aij || = || bij || ⇔ aij = bij , ∀i, j ,

10
где символ ⇔ означает «тогда и только тогда», а ∀ читается «для всех».

1.2. Сложение матриц и умножение на число. Сумма (разность) двух


матриц A и B одинакового размера определяется следующим образом

A ± B =|| aij ± bij || .

Поскольку введенные операции сводятся к соответствующим операци-


ям над элементами матриц, то следующие законы сложения очевидны:

A + B = B + A , A + ( B + C ) = ( A + B) + C , A + 0 = A ,

где символом « 0 » обозначена нулевая матрица соответствующего размера,


все элементы которой равны нулю.
Для умножения матрицы на число нужно каждый элемент матрицы
умножить на это число:

a a   λa λa12 
λ  11 12  =  11  , A ⋅ λ = λ ⋅ A = λ aij .
a
 21 a 22  λ a
 21 λ a 22 

Если все элементы матрицы имеют общий множитель, то его можно выно-
сить за знак матрицы. При умножении матрицы на нуль получается нулевая
матрица. Имеют место следующие свойства операции умножения матрицы
на число:
1 ⋅ A = A , 0 ⋅ A = 0 , λ1 ( λ 2 A ) = λ 2 ( λ1 A ) = ( λ1λ 2 ) A ,

λ ( A + B ) = λA + λ B , ( λ 1 + λ 2 ) A = λ 1 A + λ 2 A .

1.3. Умножение матриц. Произведением матрицы A из m строк и k


столбцов на матрицу B из k строк и n столбцов называется матрица
C = A⋅ B

 a11 a12 … a2 k 
b1n   11
c ⋯ c1 j ⋯ c1n 
 a21 a22 … a2 k   b11 … b1 j …
⋯ ⋯ ⋯ ⋯ ⋯
… … … …   b21 … b2 j … b2 n  
cin  ,
 ⋅ = c
aik   …
⋯ cij ⋯
 ai1 ai 2 … … … … …   i1 
⋯ ⋯ ⋯ ⋯ ⋯
 … … … …   bk1 … bkj … bkn  
⋯ ⋯ cmn 
amk   cm1 cmj
 am1 am 2 …

имеющая m строк и n столбцов, элемент которой cij , стоящий на


11
пересечении строки i со столбцом j , равен сумме произведений элементов
строки i матрицы A на соответствующие элементы столбца j матрицы B

cij = ai1b1 j + ai 2b2 j + … + aik bkj .

Обратим внимание на то, что число столбцов первого сомножителя долж-


но равняться числу строк второго сомножителя.

 1 2   5 6   1 ⋅ 5 + 2 ⋅ 7 1 ⋅ 6 + 2 ⋅ 8   19 22 
Пример.  ⋅ = = ,
 3 4   7 8   3 ⋅ 5 + 4 ⋅ 7 3 ⋅ 6 + 4 ⋅ 8   43 50 

 5 6   1 2   5 ⋅ 1 + 6 ⋅ 3 5 ⋅ 2 + 6 ⋅ 4   23 34 
 7 8  ⋅  3 4  =  7 ⋅ 1 + 8 ⋅ 3 7 ⋅ 2 + 8 ⋅ 4  =  31 46  .
       

Отсюда видно, что A ⋅ B ≠ B ⋅ A . И, вообще, из существования произведения


A ⋅ B совсем не следует существование произведения B ⋅ A .
Единичная матрица порядка n – это квадратная матрица

1 0 ... 0 0
0 1 ... 0 0
E =  ... ... ... ... ...  ,
 
 0 0 ... 1 0
0 0 ... 0 1 

где на главной диагонали стоят единицы, а все остальные элементы равны


нулю, играет роль «единицы» в алгебре матриц, ибо A ⋅ E = E ⋅ A , например:

 a11 a12   1 0   a11 a12 


 ⋅ = .
 a21 a22   0 1   a21 a22 

1.4. Матрицы и линейные преобразования. Для «оправдания» опре-


деления операции умножения матриц рассмотрим связь между матрицами и
линейными преобразованиями.
Пусть на плоскости задана декартова прямоугольная система координат
xOy . Поставим в соответствие произвольной точке плоскости с координата-
ми ( x, y ) точку ( x′, y′ ) плоскости x′O ′y′, координаты которой определяются
следующими линейными соотношениями

12
 x′ = a11 x + a12 y
 ,
 y′ = a21 x + a22 y

Задающими так называемое линейное преобразование плоскости. Очевид-


но, что такое преобразование однозначно определяется его матрицей

 a11 a12 
A=
 a21 a22 
.
 

Рассмотрим несколько примеров таких преобразований. Пусть преобра-


зование задано следующим образом:

 x′ = x  x′ = 1 ⋅ x + 0 ⋅ y
 или, подробнее,  .
 y ′ = β y  y ′ = 0 ⋅ x + β ⋅ y

1 0 
Соответствующая ему матрица A =   . Это преобразование – «сжатие»
 0 β 
вдоль оси Oy (или к оси Ox ) с коэффициентом β > 1 (см. рис. 1.1).

y y′

1 1

x x′
O O′ 1
1

Рис. 1.1

 x′ = αx α 0
Преобразование  с матрицей A =   является «сжатием»
 y′ = y  0 1
вдоль оси Ox (или к оси Oy ).
α 0
Матрица A =   соответствует «деформации» плоскости одновре-
 0 β
менно вдоль оси Ox и Oy .

13
1 0
Единичная матрица E =  задает тождественное преобразование
 0 1 
плоскости {
x′ = x
y′ = y
.

В качестве упражнения напишите формулы преобразования, которое


произвольную точку «переводит» в точку, симметричную ей относительно
начала координат, и получите соответствующую матрицу.
Аналогичным образом можно интерпретировать линейные преобразо-
вания для трех переменных

 x′ = a11 x + a12 y + a13 z



 y′ = a21 x + a22 y + a23 z .

 z′ = a31 x + a32 y + a33 z

Правило умножения матриц естественным образом возникает при ре-


шении следующей задачи. Пусть линейное преобразование

 x′ = b11 x + b12 y

 y′ = b21 x + b22 y
b b 
с матрицей B =  11 12  переводит точку ( x, y ) в точку ( x′, y′ ) , а линейное
 b21 b22 
преобразование
 x′′ = a11 x′ + a12 y′

 y′′ = a21 x′ + a22 y′

a a 
с матрицей A =  11 12  переводит точку ( x′, y′ ) в точку ( x′′, y′′ ) . Эти два
 a21 a22 
преобразования, проведенные друг за другом, переводят точку ( x, y ) в точку
( x′′, y′′) . Очевидно, что результат этих преобразований тоже линейное преоб-
разование. Какова его матрица?
Выразим координаты точки ( x′′, y′′ ) через координаты исходной точки
( x, y )

 x′′ = a11 ( b11 x + b12 y ) + a12 ( b21 x + b22 y ) = ( a11b11 + a12b21 ) x + ( a11b12 + a12b22 ) y

 y′′ = a21 ( b11 x + b12 y ) + a22 ( b21 x + b22 y ) = ( a21b11 + a22b21 ) x + ( a21b12 + a22b22 ) y

14
Таким образом, матрица результирующего преобразования равна произведе-
нию матриц A ⋅ B исходных преобразований, взятых в соответствующем
порядке, т.е.
 a11 a12   b11 b12   a11b11 + a12b21 a11b12 + a12b22 
 ⋅ = .
 a21 a22   b21 b22   a21b11 + a22b21 a21b12 + a22b22 

Введенные выше матричные операции обладают следующими свой-


ствами:
( A ⋅ B) ⋅ C = A ⋅ ( B ⋅ C )
α ( A ⋅ B ) = ( αA) ⋅ B = A ⋅ ( α ⋅ B )
( A + B) ⋅ C = A ⋅ C + B ⋅ C .
Определим операцию транспонирования матрицы как замену в ней
строк на соответствующие столбцы и наоборот

 a11 a12 … a1n   a11 a21 … am1 


   
 a21 a22 … a2 n   a12 a22 … am 2 
A= , A =
T
.
… … …  … … … 
 am1 am 2 … amn   a1n a2 n … amn 
   
   

Матричные операции позволяют, в частности, компактно записывать


так называемые квадратичные формы, т.е. выражения вида

 x1   x1 
2 2 2  
x + x + x = ( x1 x2 x3 ) x2 = X X , X = x2 
T
1 2 3
  x 
 x3   3
или
 a b  x  a b  x
ax 2 + 2bxy + cy 2 = ( x y )    = X T AX , A =   X =  .
 b c  y  b c  y

Далее мы продолжим изложение матричной алгебры и определим опе-


рацию обращения квадратной матрицы, но прежде нам потребуется ввести
понятие определителя матрицы.

15
Лекция 2. Правило Крамера и определители матриц

Удачные обозначения обладают утончённостью


и будят мысль, порой делая это, кажется почти
так же, как искусный учитель.
Бертран Рассел (1872-1970гг.)

2.1. Системы двух уравнений с двумя неизвестными.Уже при ре-


шении уравнения первой степени
a⋅x =b
возможны три случая:
• если a ≠ 0 , то уравнение имеет единственное решение x = b ;
a
• если a = 0 и b ≠ 0 , то уравнение не имеет решения;
• если a = 0 и b = 0 , то уравнение имеет бесчисленное множество ре-
шений, т.к. равенство 0 ⋅ x = 0 выполняется при любых значениях x .
Оказывается, что такие же случаи имеют место при решении системы
уравнений с большим числом неизвестных. В стандартной записи система
двух линейных уравнений с двумя неизвестными имеет вид

 a1 x + b1 y = c1
 , (2.1)
a
 2 x + b2 y = c 2

где коэффициенты a1 , a2 и b1 , b2 при неизвестных x и y , а также правые час-


ти уравнений c1 и c 2 – заданные действительные числа.
Решением системы (2.1) называется такая пара чисел x = α , y = β ,
которая оба уравнения системы (2.1) обращает в тождества. В этом случае
говорят, что пара чисел (α,β) «удовлетворяет» системе уравнений (2.1), а
система уравнений называется совместной. Если система уравнений не
имеет решений, то она называется несовместной. Эта терминология отно-
сится к системам произвольного числа уравнений.
Существует несколько способов нахождения решения системы, если
оно существует. Проделаем следующие операции:

 a1 x + b1 y = c1 ⋅ b2
− .
a
 2 x + b2 y = c2 ⋅ b1

В результате получим
x ( a1b2 − a2b1 ) = c1b2 − c2b1 .

Если число a1b2 − a2b1 ≠ 0 , то


16
c1b2 − c2b1
x= (2.2)
a1b2 − a2b1

Аналогичным образом, исключая из системы неизвестное x (проверьте!),


получим
a c − a2c1
y= 1 2 . (2.3)
a1b2 − a2b1
Формулы (2.2) и (2.3) достаточно громоздки, и от их вида «в глазах
рябит». Вот здесь и приходят на помощь те «удачные обозначения», о ко-
торых говорил Б. Рассел. Выпишем коэффициенты при неизвестных в виде
следующей матрицы:
 a b1 
A= 1 .
 a2 b2 

Число ∆ ( A) = a1b2 − a2b1 называется определителем матрицы A и обозна-


чается следующим образом:

a1 b1
= ∆ ( A) = a1b2 − a2b1 .
a2 b2

Для удобства в обозначение определителя включена матрица, которой он


соответствует.
Вычислим ещё два определителя матриц, полученных из матрицы A
путем замены ее первого и соответственно второго столбца на столбец
правой части системы, т.е.

c1 b1 a1 c1
∆x = = c1b2 − c2b1 , ∆ y = = a1c2 − c1a2 .
c2 b2 a2 c2

Тогда формулы (2.2) и (2.3) в случае, когда ∆ ≠ 0 , можно представить в ви-


де

c1 b1 a1 c1
c b ∆ a c ∆
x= 2 2 = x , y= 2 2 = y .
a1 b1 ∆ a1 b1 ∆
a2 b2 a2 b2

17
Эти формулы связаны с именем швейцарского математика Г. Крамера
(1704-1752гг.). Сама идея определителя появилась ещё у Г. Лейбница
(1646-1716гг.), а название дал в 1812г. О. Коши (1789-1857гг.). Это назва-
ние довольно естественно: определители ∆ , ∆ x и ∆ y полностью
определяются системой уравнений и, наоборот, по заданным определите-
лям (в принятых обозначениях) можно «восстановить» систему уравнений.
Исследуем полученные формулы. Будем предполагать, что не все ко-
эффициенты при неизвестных одновременно равны нулю. В противном
случае система (2.1) примет вид

0 ⋅ x + 0 ⋅ y = c1
 .(2.4)
 0 ⋅ x + 0 ⋅ y = c 2

Тогда, если c1 = c2 = 0 , то решением является любая пара чисел; если же


хотя бы одно из чисел c1 или c2 отлично от нуля, то система (2.4) не имеет
решений и называется несовместной.
Учитывая принятые обозначения для определителей, имеем два урав-
нения
 ∆ ⋅ x = ∆x
 ,
 ∆ ⋅ y = ∆ y

при условии, что не все входящие в эти уравнения определители равны ну-
лю, или одно из этих уравнений, если все эти определители равны нулю.
Отсюда получаем следующие утверждения:
• если определитель ∆ ≠ 0 , то система имеет единственное решение,
определяемое по формулам Крамера

∆x ∆
x= ,y= y ;
∆ ∆

• если определитель ∆ = 0 и хотя бы один из определителей ∆ x или


∆ y отличен от нуля, то система несовместна (пусть, для определённости,
∆ = 0 и ∆ x ≠ 0 , тогда получим противоречивое равенство 0 ⋅ x = ∆ x ≠ 0 );
• если все три определителя системы равны нулю, то система имеет
бесчисленное множество решений: x – любое, а y выражается через x из
любого уравнения исходной системы или наоборот: y – любое, а x выра-
жается через y из любого уравнения системы.
Отметим, что определитель обращается в нуль, когда a1b2 − a2b1 = 0 ,
т.е. элементы какой-то строки (столбца) равны нулю или элементы строк
(столбцов) пропорциональны

18
a1 b1
= .
a2 b2

С учетом этого переформулируем приведенные выше утверждения в


терминах коэффициентов системы:
• если коэффициенты при неизвестных не пропорциональны, т.е.
a1 b1
≠ или a1b2 − a2b1 ≠ 0 , то система имеет единственное решение;
a2 b2
• если коэффициенты при неизвестных пропорциональны, но не про-
порциональны свободным членам,
a1 b1 c1
= ≠ ( ∆ = 0, ∆ x ≠ 0 ) , или ∆ y ≠ 0 или оба не равны нулю,
a2 b2 c2
то система несовместна;
• если коэффициенты при неизвестных пропорциональны и пропор-
циональны свободным членам,
a1 b1 c1
= = ( ∆ = 0, ∆ x = 0, ∆ y = 0 ) ,
a2 b2 c2
то система имеет бесчисленное множество решений.
Эти утверждения становятся очевидными, если вспомнить, что каждое
уравнение первой степени задаёт прямую в плоскости xOy , и решить сис-
тему (2.1), значит найти общие точки двух прямых. В первом случае
прямые пересекаются в одной точке, координаты которой и будут решени-
ем системы, во втором – прямые параллельны (решения нет) и, наконец, в
третьем случае прямые совпадают, и координаты любой точки на этой об-
щей прямой будут решением системы.

2.2. Системы трех уравнений с тремя неизвестными. Выше мы по-


казали, как вычисляется определитель матрицы второго порядка

a1 b1
∆ ( A) = = a1b2 − a2b1 .
a2 b2

Для вычисления определителя матрицы третьего порядка

 a11 a12 a13 


A =  a21 a22 a23 
a a33 
 31 a32

нам потребуются понятия минора и алгебраического дополнения.

19
Пусть мы выбрали некоторый элемент aij (этот элемент стоит на пере-
сечении строки i со столбцом j ; пара (i j ) его «адрес» в матрице).
Вычеркнем теперь строку i и столбец j , где стоит этот элемент, и полу-
чим определитель второго порядка. Его называют дополнительным
минором элемента aij (или просто минором) и обозначают M ij . Алгеб-
раическим дополнением элемента aij назовем величину

Aij = (−1)i + j M ij .

Таким образом, алгебраическое дополнение – это минор с соответст-


вующим знаком (+) или (–). Знаки алгебраических дополнений элементов
определителя легко определяются просто «глядя» на этот определитель.
При этом полезно иметь в виду следующую схему

+ − +
− + − ,
+ − +

где знаком (+) отмечены места тех элементов, алгебраические дополнения


которых равны минорам, взятым с их собственными знаками.
Теперь мы можем дать правило вычисления определителя матри-
цы третьего порядка

a11 a12 a13


a21 a22 a23 = ∆ ( A) = ai1 Ai1 + ai 2 Ai 2 + ai 3 Ai 3 , i = 1, 2,3 ,
a31 a32 a33

т.е. определитель равняется сумме произведений элементов любой строки


на их алгебраические дополнения. Это правило называют разложением
определителя по элементам строки.
Оказывается, что разложение по столбцам дает тот же результат:

a11 a12 a13


a21 a22 a23 = ∆( A) = a1 j A1 j + a2 j A2 j + a3 j A3 j , j = 1,2,3 .
a31 a32 a33

Где гарантия, что в результате будет получаться одно и то же число? Ока-


зывается, что справедливо следующее утверждение.

20
Для каждой квадратной матрицы порядка n сумма произведений
элементов какой-либо строки или столбца на соответствующие им ал-
гебраические дополнения есть величина постоянная.
Вот это число и называется определителем, а способов его вычисле-
ния существует много и тот, который даётся введённым выше
определением, просто один из них. Этот способ называется разложением
по элементам строки или столбца.
Если в любой из приведенных формул вычислить алгебраические до-
полнения и произвести указанные действия, то получится другая формула
вычисления определителя третьего порядка

∆ ( A) = a11a22 a33 + a12 a23a31 + a21a32 a13 − a31a22 a13 − a21a12 a33 − a32 a23a11 .

Заметим, что определитель равен алгебраической сумме произведений


элементов, взятых по одному из каждой строки и каждого столбца.
Решение системы трех уравнений с тремя неизвестными

a 1 x + b1 y + c1 z = d1

a2 x + b2 y + c2 z = d 2
a3 x + b3 y + c3 z = d3

выражается через определители третьего порядка по аналогичным форму-


лам Крамера:

d1 b1 c1 a1 d1 c1 a1 b1 d1
d2 b2 c1 a2 d 2 c2 a2 b2 d 2
d b3 c3 ∆ x a3 d3 c3 ∆ y a3 b3 d3 ∆ z
x= 3 = ;y= = ; z= =
a1 b1 c1 ∆ a1 b1 c1 ∆ a1 b1 c1 ∆
a2 b2 c1 a2 b2 c1 a2 b2 c1
a3 b3 c3 a3 b3 c3 a3 b3 c3

в предположении, что определитель матрицы системы ∆ не равен нулю.


Отметим, что ∆ x , ∆ y , ∆ z – определители матриц, получаемых из матрицы
системы путем замены столбца коэффициентов при соответствующей не-
известной на столбец правых частей. Если ∆ = 0 и существует хотя бы
один из определителей ∆ x , ∆ y , ∆ z , отличный от нуля, то система несовме-
стна. Рассмотрение оставшегося случая ∆ = ∆ x = ∆ y = ∆ z = 0 мы отложим до
введения понятия ранга матрицы.

21
Лекция 3. Системы и определители матриц n -го порядка

При изучении наук примеры не менее


поучительны, нежели правила.
И. Ньютон

3.1. Матричная запись системы линейных уравнений. Систему n


линейных уравнений c n неизвестными

a11x1 + a12 x2 + ⋯ + a1n xn = b1


a x + a x + ⋯ + a x = b
 21 1 22 2 2n n 2

⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
an1x1 + an 2 x2 + ⋯ + ann xn = bn
после введения матриц

 a11 a12 a1n   b1   x1 


a a22 a2 n  b  x 
A=  21
, B =  2 , X = 2
⋯ ⋯ ⋯  ⋮  ⋮ 
a  b  x 
 n1 an 2 ann   n  n

можно записать кратко

A⋅ X = B . (3.1)

Решить систему – значит найти матрицу неизвестных X .


Оставим пока вопросы о том, существуют ли решения системы (3.1)
и сколько их, и вспомним, как решалось уравнение первой степени

a⋅x =b .
b
Решение x = получается умножением обеих частей уравнения на число,
a
1
обратное числу a , то есть на число = a −1
a
b
a −1 ⋅ a ⋅ x = a −1 ⋅ b ⇒ 1 ⋅ x = .
a

Эти соображения приводят к мысли найти такую матрицу (в дальней-


шем будем её обозначать A−1 ), которая при умножении на данную матрицу
A давала бы единичную матрицу. Тогда система (3.1) была бы решена
следующим образом:

22
A − 1 ⋅ A ⋅ X = A − 1 ⋅ B ⇒ E ⋅ X = A − 1 ⋅ B ⇒ X = A− 1 ⋅ B .

Поэтому естественным будет следующее определение.


Обратной матрицей к данной квадратной матрице A называется
матрица A−1 , которая при умножении как справа, так и слева на матрицу A
, даёт единичную матрицу

A−1 ⋅ A = A ⋅ A−1 = E .

С учетом этого определения решение системы (3.1) имеет вид

X = A−1 ⋅ B . (3.2)

Заметим, что определение обратной матрицы ещё не гарантирует её


существования и не дает способа ее отыскания. Для нахождения обратной
матрицы нам потребуется понятие определителя матрицы порядка n .

3.2. Определители матриц порядка n и их свойства. Теперь мы в


состоянии ввести понятие определителя матрицы n -го порядка

a11 a12 … a1 j … a1n


a21 a22 … a2 j … a2 n
… … … … … …
.
ai1 ai 2 … aij … ain
… … … … … …
an1 an 2 … anj … ann

Если aij – выбранный элемент, то минор M ij – это определитель мат-


рицы порядка (n − 1) , получаемой после вычеркивания в исходной матрице
строки i и столбца j , а Aij = (-1)i + j M ij –соответствующее алгебраическое
дополнение.
Определителем n -го порядка (n > 1) называется число, равное
сумме произведений элементов какой-либо строки (столбца) на соответст-
вующие им алгебраические дополнения, то есть:

∆ = ai1 Ai1 + ai 2 Ai 2 + ... + ain Ain , i = 1, ... , n


.
∆ = a1 j A1 j + a2 j A2 j + ... + anj Anj , j = 1, ... , n

Естественно, возникает вопрос о корректности такого определения. Для


n = 2 легко проверяется
23
a11 a12
= a11a22 − a12 a21 = a11 A11 + a12 A12 =
a21 a22

(разложение по элементам первой строки),или

= a11a22 − a21a12 = a11 A11 + a21 A21

(разложение по элементам первого столбца). Два оставшихся варианта


проверьте самостоятельно.
Для краткости изложения доказывать или иллюстрировать формули-
руемые ниже свойства определителей мы будем на примере определителей
второго порядка.
Свойство 1. При транспонировании матрицы величина определителя
не меняется
∆( AT ) = ∆( A) .

Это свойство следует из определения.


Так как при транспонировании матрицы столбцы переходят в строки и
наоборот, то все свойства определителя, формулируемые в терминах
столбцов, остаются справедливыми и для строк. Поэтому далее мы будем
говорить только о строках (или о столбцах).
Свойство 2. Определитель изменит знак, если поменять местами две
строки матрицы.
Убедимся в справедливости этого свойства для n = 2

a1 b1 a2 b2
=− .
a2 b2 a1 b1

Действительно, «раскрывая» определители, имеем:

a1b2 − a2b1 = −( a2b1 − a1b2 ) .

Свойство 3. При умножении элементов строки матрицы на число λ ее


определитель умножается на λ .

λa1 λb1 a1 b1

a2 b2 a2 b2

Это свойство в данном случае ( n = 2 ) легко проверяется, а для любого


n следует из разложения определителя по элементам строки, где λ будет
24
общим множителем всех элементов строки и его можно вынести за знак
суммы. Это свойство удобнее запомнить в «обратной» формулировке: если
элементы строки матрицы имеют общий множитель, то его можно вынести
за знак определителя. Отметим, что умножение матрицы на число проис-
ходит по-другому
a a   λa λa12 
λ  11 12  =  11 .
 a21 a22   λa21 λa22 

Свойство 4. Если все элементы какой-то строки матрицы равны ну-


лю, то определитель равен нулю.
Чтобы убедится в этом, достаточно разложить определитель по эле-
ментам этой строки.
Свойство 5. Определитель матрицы с двумя одинаковыми строками
равен нулю.
Действительно, поменяем местами эти одинаковые строки. По свойст-
ву 2 определитель должен сменить знак, то есть ∆ = −∆ , а с другой сторо-
ны, в нём ничего не изменилось, то есть ∆ = ∆ . Есть единственное число,
для которого одновременно выполняются эти условия; это число равно ну-
лю. Итак, ∆ = 0 .
Свойство 6. Определитель матрицы с двумя пропорциональными
строками равен нулю.
Вынося общий множитель элементов строки (коэффициент пропор-
циональности) за знак определителя, мы получаем определитель матрицы
с двумя одинаковыми строками.
Свойство 7. Если каждый элемент какого-то столбца матрицы пред-
ставляет собой сумму двух слагаемых, то для определителя этой матрицы
верно равенство
a1′ + a1′′ b1 a1′ b1 a′′ b
= + 1 1 .
a2′ + a′′2 b2 a′2 b2 a2′′ b2
Проверяем:
(a1′ + a1′′)b2 − (a′2 + a′′2 )b1 = a1′b2 + a1′′b2 − a2′ b1 − a2′′b1 =
= a1′b2 − a′2b1 + (a1′′b2 − a2′′b1 ).

Свойство 8. Если к элементам некоторого столбца прибавить соот-


ветствующие элементы другого столбца, умноженные на одно и то же чис-
ло, то величина определителя при этом не изменится

a1 + λb1 b1 a1 b1 b1 b1 a1 b1
= +λ = .
a2 + λb2 b2 a2 b2 b2 b2 a2 b2

25
Этим свойством удобно пользоваться для «получения нулей» в опре-
делителе (чем больше нулей в строке или столбце, тем легче вычисляется
определитель). Например, определитель четвёртого порядка матрицы так
называемого треугольного вида вычисляется следующим образом:

a11 a12 a13 a14


a22 a23 a24
0 a22 a23 a24 a a
= a11 ⋅ 0 a33 a34 = a11 ⋅ a22 33 34 = a11a22 a33a44
0 0 a33 a34 0 a44
0 0 a44
0 0 0 a44

(разложили по элементам первых столбцов).


Свойство 9. Если элементы какой-либо строки являются линейными
комбинациями соответствующих элементов остальных строк, т.е. пред-
ставимы в виде суммы их произведений на некоторые числа, то определи-
тель равен нулю.
Например, определитель матрицы

 a11 a12 a13 



A= a21 a22 a23 

 αa + β a αa12 + βa22 αa13 + βa23 
 11 21

равен нулю. Это следует из того, что согласно свойству 7 этот определи-
тель равен
a11 a12 a13 a11 a12 a13
∆( A) = a21 a22 a23 + a21 a22 a23
αa11 αa12 αa13 β a21 β a22 β a23

Заметим, что верно и обратное утверждение: если определитель равен


нулю, то любая строка является линейной комбинацией остальных строк
(доказательство этого утверждения отложим до изучения векторов).
Свойство 10. Сумма произведений элементов i -й строки на алгеб-
раические дополнения соответствующих элементов j -й (i ≠ j ) строки
равна нулю.
Например, для матрицы
 a11 a12 a13 
A =  a21 a22 a23 
 
 a31 a32 a33 
выполняется
a11 A21 + a12 A22 + a13 A23 = 0 . (3.3)

26
Для доказательства этого факта рассмотрим матрицу с двумя одина-
ковыми строками
 a11 a12 a13 
a a12 a13  .
 11 
 a31 a32 a33 

С одной стороны, ее определитель равен нулю, а с другой стороны, рас-


кладывая ее определитель по элементам второй строки, получим равенство
(3.3).
Заметим, что для вычисления определителя порядка n необходимо
вычислить n определителей порядка ( n − 1) , каждый из которых, в свою
очередь, вычисляется через ( n − 1) определитель порядка ( n − 2) и т.д.
Следовательно, определитель порядка n есть алгебраическая сумма n!
слагаемых, каждое из которых есть произведение n сомножителей.

3.3. Обратная матрица. Напомним, что обратной матрицей к данной


квадратной матрице A называется матрица A−1 , которая при умножении,
как справа, так и слева, на матрицу A даёт единичную матрицу

A−1 ⋅ A = A ⋅ A−1 = E .

Теорема. Если определитель матрицы ∆( A) отличен от нуля, то мат-


рица имеет единственную обратную матрицу A−1 .
По ходу доказательства теоремы мы получим один из способов вы-
числения обратной матрицы. Действительно, по определению A−1

 a11 a12 a13  d11 d12 d13   1 0 0 


 a a a  d d d  =  0 1 0 
 21 22 23  21 22 23   , (3.4)
 a a a  d d d   0 0 1 
 31 32 33  31 32 33   

где элементы обратной матрицы dij нужно отыскать. Найдём сначала эле-
менты первого столбца d11 , d 21 и d31 . По правилу умножения матриц имеем

a11d11 + a12 d 21 + a13d31 = 1



a21d11 + a22 d 21 + a23d31 = 0 .
a31d11 + a32 d 21 + a33d31 = 0

По формулам Крамера получим

27
1 a12 a13
1 +1 a22 a23 A
d11 = 0 a22 a23 = = 11 ,
∆ ( A) ∆ ( A) a32 a33 ∆ ( A )
0 a32 a33

a11 1 a13
1 −1 a21 a23 A
d 21 = a21 0 a23 = = 12 ,
∆ ( A) ∆ ( A) a31 a33 ∆ ( A)
a31 0 a33

a11 a12 1
1 +1 a21 a22 A
d31 = a21 a22 0 = = 13 ,
∆ ( A) ∆ ( A) a31 a32 ∆ ( A)
a31 a32 0

где Aij – соответствующие алгебраические дополнения. Аналогичным об-


разом получаем
A A
d i 2 = 2i , di 3 = 3i , i = 1,2,3 .
∆ ( A) ∆ ( A)

Таким образом, обратная матрица имеет вид

A A A 
−1 1  11 21 31 
A = A12 A22 A32 .(3.5)
∆ ( A)  
 A13 A23 A33 

Следует обратить внимание на то, что матрица в правой части (3.5) полу-
чена путем транспонирования матрицы алгебраических дополнений к эле-
ментам исходной матрицы A . Из формулы (3.5) видно, что для существо-
вания обратной матрицы необходимо, чтобы её определитель не обращал-
ся в нуль. Матрицы с определителем равным нулю называются вырож-
денными.
Итак, правило нахождения обратной матрицы (обращение матри-
цы):
• вычисляем определитель ∆ ( A ) . Если ∆ ( A ) = 0 , то A−1 не сущест-
вует.
• вычисляем матрицу алгебраических дополнений (обозначим Aɶ ).
• транспонируем матрицу Aɶ .
1
• умножаем матрицу Aɶ T на и получаем обратную матрицу.
∆( A)

28
Приведем другое обоснование формулы (3.5), определяющей обрат-
ную матрицу. Действительно, по определению обратной матрицы с учетом
свойства 10для определителей получим

 a a a  A A A 
−1 1  11 12 13  11 21 31 
AA = a21 a22 a23 A12 A22 A32 =
det A   
 a31 a32 a33  A13 A23 A33 

 det A 0 0  1 0 0
1 
= 0 det A 0  =  0 1 0  ,
det A    
 0 0 det A   0 0 1 

что и требовалось доказать.


1 2 0
Пример. Обратим матрицу A =  1 1 1  .
 
2 0 1

Вычисляем определитель матрицы ∆ ( A ) = 3 .Составляем матрицу алгебраи-


ческих дополнений

 1 1 −2 
ɶA =  −2 1 4  .
 
 2 −1 −1 
Транспонируем её
 1 −2 2 
Aɶ =  1 1 −1
T
 
 − 2 4 −1 

и получаем обратную матрицу


 1 −2 2 
1 ɶT 1 
−1
A = A = 1 1 −1  .
∆ 3  
 −2 4 −1

Таким образом, решение системы n уравнений с n неизвестными в слу-


чае невырожденной матрицы имеет вид

X = A−1 ⋅ B .(3.6)

29
Алгоритм получения решения сводится к нахождению обратной матрицы
A−1 и умножению её слева на матрицу-столбец правых частей B . Заметим,
что матрица B начинает «работать» лишь на этапе умножения.
Установим связь на примере системы третьего порядка между пра-
вилом Крамера и нахождением решения с помощью обратной матрицы.
Для этого заметим, что из (3.3) и (3.4) с учетом формулы разложения опре-
делителя по столбцу и использованных выше обозначений следует

 A11 A21 A31   b1   b1 A11 + b2 A21 + b3 A31   ∆x 


1 
A12 A22 A32  ⋅  b2  = b A + b A + b A  = ∆ 
1 1
X=   3 32 
∆ ( A)  ∆ ( A)  ∆ ( A)  
1 12 2 22 y
   
 A13 A23 A33   b3   b1 A13 + b2 A23 + b3 A33   ∆z 

что совпадает с формулами Крамера.


Пример. Основываясь на формуле (3.6), решим систему уравнений

 x + 2 y = b1 1 2 0  x  b1 

 x + y + z = b2 A = 1 1 1 , X = y , B =  b2  .
   
2 x + z = b3      
 2 0 1  z
   b3 

 1 −2 2 
1
Обратная матрица была найдена ранее A = 1 − 1 −1  .
−1

3 
 −2 4 −1 

Не следует «торопиться» делить каждый элемент матрицы на определи-


тель ∆ ( A ) . Вычисляем матрицу-столбец неизвестных

 1 −2 2   b1   b − 2b2 + 2b3 
1    1 1
X= 1 −1 −1 ⋅ b2 = b1 − b2 − b3  .
3    3 
 −2 4 −1  b3   −2b1 + 4b2 − b3 

 x  1
Пусть, например, b1 = 1 , b2 = 2 , b3 = 3 , тогда X =  y  =  0  .
   
 z  1

30
Лекция 4. Системы m уравнений с n неизвестными

4.1. Ранг матрицы. Мы рассматривали систему n уравнений с n не-


известными, у которой матрица невырожденная. А как быть, если матрица
вырожденная (∆( A) = 0) или m ≠ n , то есть число неизвестных не совпада-
ет с числом уравнений?
Для того чтобы ответить на этот вопрос, нам понадобится понятие
ранга матрицы. Это некоторая числовая характеристика матрицы. Вводит-
ся она следующим образом. Выберем некоторые k строк и k столбцов и
образуем матрицу порядка k , которая состоит из элементов, стоящих на их
пересечении. Определитель этой матрицы будем называть минором
k -го порядка.
Рангом матрицы A называется число r ( A) , равное наибольшему из
порядков её миноров, отличных от нуля. Если все миноры равны нулю, что
возможно только для нулевой матрицы, то r = 0 .
Очевидно, что ранг — это число, удовлетворяющее неравенству

0 ≤ r ≤ min ( m, n ) ,

где m и n – размеры матрицы. Например,

1 2 1 1 1
A= , r ( A) = 2 ; B =   , r ( B ) = 1,
 3 4   2 2 2 

так как все миноры второго порядка равны нулю.


Если матрица квадратная и невырожденная, то её ранг равен порядку
матрицы.
Один из способов вычисления ранга – это «идти снизу», последова-
тельно находя неравные нулю миноры первого, второго и следующих по-
рядков.

4.2.Теорема Кронекера-Капелли. Выше при рассмотрении системы


линейных уравнений мы ограничивались случаем, когда число уравнений
совпадало с числом неизвестных и когда матрица системы была невырож-
денной. В этом случае система имеет единственное решение. Сейчас мы
рассмотрим общий случай системы m уравнений с n неизвестными

a11x1 + a12 x2 + ⋯ + a1n xn = b1


a x + a x + ⋯ + a x = b
21 1 22 2 2n n 2

⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
am1x1 + am2 x2 + ⋯ + amn xn = bm

31
или в матричной форме
A⋅ X = B. (4.1)

Образуем так называемую «расширенную» матрицу Bɶ , полученную


присоединением к матрице A столбца из свободных членов уравнений
системы

 a11 a12 … a1n b1 


a a22 … a2 n b2 
B =  21
ɶ .
… … … … …
 
 am1 am 2 … amn bm 

Очевидно, что rang A ≤ rang Bɶ .

Вопрос о совместности системы решает теорема Кронекера-Капелли


(Леопольд Крóнекер (1823-1891г.г.) – немецкий математик и Альфредо
Капелли (1855-1910 г.г.) – итальянский математик).
Теорема Кронекера-Кaпелли. Система линейных уравнений (4.1)
совместна тогда и только тогда, когда

rang A = rang Bɶ

(принимаем без доказательства).


Проиллюстрируем эту теорему в случае системы трех уравнений с
тремя неизвестными
a 1 x + b1 y + c1 z = d1

a2 x + b2 y + c2 z = d 2 .
a3 x + b3 y + c3 z = d3
 a1 b1 c1 d1 
Рассмотрим расширенную матрицу Bɶ =  a2 b2 c2 d 2  .
 
a b c d 
 3 3 3 3 

Если det A ≠ 0 , то rang Bɶ = rang A = 3 и, следовательно, система совместна.


Если det A = 0 и существует отличный от нуля определитель третьего по-
рядка, составленный из столбцов матрицы Bɶ , то rang Bɶ = 3, rang A < 3 , и,
значит, система несовместна. И, наконец, если ∆ = ∆ x = ∆ y = ∆ z = 0 , то
rang Bɶ < 3, rang A < 3 и, следовательно, в соответствии с теоремой Кро-

32
некера-Капелли система будет совместна тогда и только тогда, когда вы-
полняется условие
rang A = rang Bɶ .

x + y + z = 6

Пример 1.  2 x − y + z = 3 ∆ ( A ) = −5 ≠ 0
 x − y + 2 z = 5
rang A = 3, rang Bɶ = 3 ,

так как ранг не может быть больше числа строк. Система совместна. Най-
дите её единственное решение.

5 x − y + 2 z = 7 5 −1 2

Пример 2.  2 x + y + 4 z = 1 ∆ ( A ) = 2 1 4 = 0 ,
 x − 3 y − 6 z = 0 1 3 −6

(проверьте!), но есть минор второго порядка, отличный от нуля. Из расши-


ренной матрицы образуем минор

5 −1 7
2 1 1 = −35
1 −3 0

(проверьте!). Значит, rang Bɶ = 3 и, следовательно, эта система несовместна.


Из теоремы Кронекера-Капелли следует, что система n уравнений с
n неизвестными с отличным от нуля определителем всегда совместна. Её
единственное решение можно получить по правилу Крамера. В частности,
однородная система уравнений, у которой все правые части равны нулю,
а определитель не равен нулю, имеет единственное так называемое триви-
альное решение.
Совместная система m уравнений с n неизвестными обладает единст-
венным решением тогда и только тогда, когда ранг матрицы системы равен
числу неизвестных. Поясним это на следующем примере.

x + y − z = 0
 2 x − y + z = 3 1 1 −1
Пример 3.  Минор 2 −1 1 = 3 ≠ 0 ,
 x − 3 y + 2 z = 1
1 −3 2
 2 x − 5 y + 4 z = 4

33
поэтому rang A = 3 . Вычислим минор четвёртого порядка расширенной
матрицы Bɶ
1 1 −1 0
2 −1 1 3
=
1 −3 2 1
2 −5 4 4

(сложим третий столбец последовательно с первым, вторым столбцами)

0 0 −1 0 3 0 3
3 0 1 3
= = − 3 −1 1 =
3 −1 2 1
6 −1 4
6 −1 4 4

(вычитая из первого столбца третий, получим)

0 0 3
2 −1
= − 2 −1 1 = − 3 = 0,
2 −1
2 −1 4

значит, rang Bɶ = 3 . Система совместна и число неизвестных совпадает с


рангом. Как найти ее решения? Нужно выписать те уравнения системы,
которые дают отличный от нуля минор третьего порядка (так называемый
базисный минор). В данном случае это три первых уравнения. Проверьте,
что единственным решением системы этих уравнений будет (1, 2, 3) и оно
удовлетворяет и оставшемуся уравнению. Это следует из того, что опре-
делитель расширенной матрицы равен нулю и, следовательно, элементы ее
четвертой строки являются линейными комбинациями соответствующих
элементов первых трех строк (см. свойство 9 определителей).

x − 2 y + z = 3

Пример 4.  x + 3 y − z = 1 , ∆ ( A) = 0 , rang A = 2 .
3 x + 4 y − z = 5

Из расширенной матрицы можно составить три минора третьего порядка


(столбец свободных членов последовательно подставляется вместо коэф-
фициентов при неизвестных). Убедитесь, что все они равны нулю. Значит,
rang Bɶ = 2 . Система совместна, но ранг матрицы A меньше числа неиз-
вестных, поэтому система имеет бесчисленное множество решений. Как их
найти? Выписываем уравнения, «дающие» базисный минор, оставляя в ле-

34
вой части число неизвестных, равное рангу матрицы (причём оставляем те
неизвестные, которые «входят» в базисный минор)

x − 2 y = −z + 3

x + 3y = 1 + z

Решаем эту систему, считая z произвольным параметром

1 − z +3 −2 11 − z
x= ⋅ =
5 1 +z 3 5

1 1 3 − z 2 ( z − 1)
y= ⋅ =
5 1 1 +z 5

Сформулируем теперь общее правило, по которому решается совме-


стная система линейных уравнений. Пусть rang A= r .
• Отыскиваем базисный минор порядка r (он получается при на-
хождении ранга матрицы).
• Выбираем r уравнений, «породивших» базисный минор (ос-
тальные отбрасываем).
• Неизвестные, «входящие» в базисный минор, оставляем слева, а
остальные ( n − r ) называем свободными и переносим в правые
части уравнений.
• Решаем полученную систему r уравнений r с неизвестными.
Из этого правила следует, что в случае, когда ранг совместной систе-
мы меньше, чем число неизвестных, то эта система имеет бесконечно мно-
го решений. В частности, однородная система n уравнений с n неизвест-
ными и равным нулю определителем, т.е. когда

rang A = rang Bɶ < n ,

кроме тривиального имеет ненулевые решения.

35
Раздел 2. Векторная алгебра

Лекция 5. Векторы и линейные операции над ними

5.1.Основные понятия и определения. Понятие вектора сформиро-


валось в физике, точнее в механике. Скорость, ускорение, сила определя-
ются величиной и направлением и называются векторными величинами.
Масса, объем, температура и т.п. определяются численным значением и
называются скалярами или скалярными величинами. Вектор  – это на-
правленный отрезок. Обозначается вектор символом a или AB , где точ-

ка A – начало, а B – конец.

A
Рис 5.1.

Длиной или модулем вектора  называется расстояние между его на-
чалом и концом и обозначается | AB | или | a |.

Если начало и конец вектора совпадают, то он называется нулевым
вектором 0 .
 
Векторы называются коллинеарными a || b , если они параллельны
одной прямой.
Векторы называются компланарными, если они параллельны одной
плоскости (очевидно, что
 любые два вектора компланарны).
Два вектора a и b равны, если они коллинеарны , одинаково направ-

  
лены a ↑↑ b и их длины равны | a |=| b | . Отсюда следует, что при пере-

мещении вектора параллельно самому себе получим равный ему вектор.
Единичным вектором или ортом называется вектор, модуль кото-
рого равен единице (| a |= 1) .


5.2. Линейные операции над  векторами. Произведением вектора


a на число k называется вектор b = k a , который:
 

• имеет длину | b |=| k | ⋅ | a |

  
• коллинеарен вектору a ( b a );

36

• если k > 0 , то b ↑↑ a ;

• если k < 0 , то b ↑↓ a ;

• если k = 0 , то b = 0.

Рис 5.2

Свойства этой операции: 1) k a = a k ; 2) k (la ) = ( kl ) a ;


   
  
3) ( k + l ) a = ka + la ; 4) k ( a + b) = ka + kb .Последнее свойство иллюст-
   
рирует следующий рисунок, где k = 2 .


2a   
a b 2b
 
a b

b
   
a+b a+b
 
2( a + b )

Рис. 5.3

Вектор b = ( −1) a = − a называется противоположным вектору a .
  

По определению операции умножения вектора на число вектор b = k a

коллинеарен вектору a . Покажем, что имеет место обратное утвержде-

 
ние: если два вектора коллинеарны ( a || b ), то существует такое число

k ≠ 0 , что b = k a , и это число с точностью до знака равно отношению


длин этих векторов. Действительно, в случае, если a ↑↑ b , возьмем

 
k =| b | / | a | . Тогда векторы b и k a направлены в одну сторону и их длины
 
  
равны, т.е. b = k a . В случае a ↑↓ b выберем k = − | b | / | a | .
  

37
   
Суммой двух векторов a и b называется вектор c = a + b , получае-

мый по одному из следующих правил. 
Правило треугольника: начало вектора b совмещается с концом
вектора a , тогда начало
 вектора c совпадает с началом вектора a , а конец
  
– с концом вектора b (рис 5.4).

 

b b a
 
a+b  
b+a
 
a b

a

Рис. 5.4

Из рисунка ясно, что порядок слагаемых может быть любой, т.е.


   
a +b=b+a.

Отсюда следует правило параллелограмма: на векторах a и b ,

имеющих общее начало, строится параллелограмм, тогда начало вектора

c
 
совпадает с общим началом векторов a и b , а конец – с противоположной
вершиной параллелограмма (рис.5.5).

Рис.5.5

     
Для суммы справедлив сочетательный закон ( a + b) + c = a + (b + c ) .
Заметим, что векторы не обязаны быть расположенными в одной
плоскости (см. рис. 5.6).

38
Рис.5.6

Отметим также операцию сложения с нуль-вектором


    
a +0=0+a =a

Разность векторов a и b определяется через введенные выше опера-

ции следующим образом
   
a − b = a + ( −b)

Рис.5.7

5.3. Проекция вектора на ось. Напомним, что проекцией точки M


на ось L в пространстве называется точка M 1 пересечения оси L и плос-
кости, проходящей через точку M перпендикулярно этой оси (рис. 5.8).

39
L
M

M1

Рис.5.8
 
Проекцией вектора AB на ось L называется число ПрL AB , равное

по модулю расстоянию между проекциями начала и конца вектора
 AB на
ось L , и взятого со знаком плюс, если направление вектора A′B′ совпада-
ет с направлением оси, и со знаком минус, если они направлены в проти-
воположные стороны.

A ϕ
L′

L
A′ B′

Рис.5.9

Из рисунка ясно, что ось L и вектор AB можно считать расположен-
ными в одной плоскости П. Далее будем считать её совпадающей
 с плос-
костью чертежа. Под углом ϕ между осью L и вектором AB будем пони-
мать меньший из углов, который отсчитывается от направления оси до на-
правления вектора. При этом луч, совмещающий направление оси с на-
правлением вектора поворачивается на угол 0 ≤ ϕ ≤ 1800 .

Теорема. Пусть вектор AB составляет с направлением оси L угол ϕ .
Тогда верна формула
 
ПрL AB = AB cos ϕ .

40
Доказательство. В случае, когда угол ϕ острый, утверждение оче-
видно. В случае тупого угла имеем (см. рис. 5.10)
   
Пр L AB = − | A1 B1 | = − | AB | cos( π − ϕ) =| AB | cos ϕ

B B

ϕ
A ϕ

A
L L
A1 B1 B1 A1

Рис. 5.10

Отметим следующие важные свойства проекции векторов.


Свойство 1. Проекция суммы векторов на ось равна сумме их проек-
ций на эту ось (см. рис. 5.11 и 5.12). Точки A1 , B1 и C1 – проекции точек
A, B и C на ось L .

C L

C1
A

A1 B

Рис. 5.11
  
AC = AB + BC
  
Пр L AC = A1C1 = A1 B1 + B1C1 = Пр L AB + Пр L BC

41
C
L

C1
B1
A

B
A1

Рис. 5.12
  
AB = AC + CB
  
Пр L AB = A1B1 = A1C1 − C1 B1 = Пр L AC + Пр L CB .

Свойство 2. Если вектор умножается на число, то его проекция ум-


ножается на это же число

ПрL (ka ) = k ПрL a .


 

42
Лекция 6.Системы координат

6.1. Линейная комбинация векторов. Выше вектор был определен


как геометрический объект – направленный отрезок. Перейдем теперь к
эквивалентному его описанию в виде упорядоченного набора чисел. Для
этого дадим следующие определения.
  
Линейной комбинацией векторов a1 , a1 , … , am с коэффициентами
k1 , k 2 , … , k m называется вектор вида
m
k1a1 + k 2 a2 + … + k m am = ∑ ki ai .
   
i =1
Линейная комбинация называется тривиальной,  если все ее коэффи-
циенты равны нулю. Будем говорить, что вектор b выражается в виде ли-
  
нейной комбинации векторов a1 , a1 , … , am , если он представим в виде

 m 
b = ∑ ki ai .
i =1


Теорема. Любой вектор a на плоскости единственным образом пред-
ставим в виде линейной комбинации двух данных неколлинеарных векто-
 
ров e1 и e2 этой плоскости.
Доказательство. Поместим начала всех трех векторов в некоторую

точку O (см. рис. 6.1). Из конца вектора a проведем прямые, параллель-
 
ные векторам e1 и e2 , и обозначим через P и Q точки их пересечения с
 
осями, «проходящими» через векторы e1 и e2 , соответственно. По прави-
  
лу сложения векторов имеем a = OP + OQ .


Q a


e2

O 
e1 P
Рис.6.1
   
Так как OP || e1 и OQ || e2 , то существуют такие числа a1 и a2 , что
   
OP = a1e1 , OQ = a2e2 .

43
  
Таким образом, получим a = a1e1 + a2e2 .
Покажем теперь, что такое представление единственно. Пусть это не
  
так, т.е. a = a1′e1 + a′2e2 .Тогда после вычитания получим
 
( a1 − a1′ )e1 + ( a2 − a′2 )e2 = 0 .
 
Если хотя бы один из коэффициентов при векторах e1 и e2 , не равен нулю,
то отсюда будет следовать их коллинеарность, что противоречит предпо-
ложению. Таким образом, указанное
 представление единственно.
Теорема. Любой вектор a в пространстве единственным образом
представим в виде линейной комбинации трех данных некомпланарных
  
векторов e1 , e2 и e3 .
Доказательство этой теоремы проводится аналогично доказательству
предыдущей теоремы (см. рис.6.2)

a
R
Q
e2
e3
O
e1
P
Рис. 6.2

Введем свойство линейной зависимости векторов, обобщающее


свойства коллинеарности и компланарности на случай произвольного чис-
  
ла векторов. Векторы a1 , a1 , … , am называются линейно зависимыми, если
хотя бы один из них выражается в виде линейной комбинации остальных,
то есть
m
a j = ∑ ki ai
 
(6.1)
i =1( i ≠ j )

В противном случае эти векторы называются линейно независимыми.


Из этих определений следует, что любые два коллинеарных вектора
   
линейно зависимы, так как из условия a1 || a2 следует, что a2 = ka1 , и что
любые три вектора на плоскости также линейно зависимы. Таким образом,
приведенные выше теоремы можно переформулировать следующим обра-
зом: любой вектор на плоскости единственным образом представим в виде
линейной комбинации двух заданных линейно независимых векторов, а

44
любой вектор в пространстве – в виде линейной комбинации трех задан-
ных линейно независимых векторов.
Возможность такого представления любого вектора приводит к мысли
определять вектор и его положение набором коэффициентов его линейной
комбинации. Естественно возникают задачи определения положения век-
тора и его длины через этот набор коэффициентов. Эти задачи решаются с
помощью операции скалярного умножения векторов.

6.2. Разложение вектора по базису. Координаты вектора. Базисом


  
{e1 , e2 , e3} называются взятые в определенном порядке линейно независи-
мые векторы. Термин базис (гр. basis – основание) отражает тот факт, что
через эти векторы можно выразить любой вектор. Если базисные векторы
взаимно перпендикулярны, то базис называется ортогональным, а если
плюс к этому базисные векторы имеют единичную длину, то – ортонор-
мированным.

Выражение данного вектора a в виде линейной комбинации базис-
ных векторов называется его разложением в данном базисе (или по бази-
су):
   
a = a1e1 + a2e2 + a3e3 .

Коэффициенты разложения {a1 , a2 , a3} называются координатами векто-



ра a в данном базисе, и записывается это так:

a = { a1 , a2 , a3} .


Таким образом, теперь вектор – это упорядоченная тройка чисел (на


плоскости – пара чисел).
Операции над векторами в координатной форме
 
• a = b тогда и только тогда, когда ai = bi , ∀i ;
 
• a + b = { a1 + b1 , a2 + b2 , a3 + b3} ;
λ ⋅ a = { λ a1 , λ a2 , λ a3 ,}


непосредственно следуют из определения. Например,
       
a + b = ( a1e1 + a2e2 + a3e3 ) + (b1e1 + b2 e2 + b3e3 ) =
  
= ( a1 + b1 )e1 + ( a2 + b2 )e2 + ( a3 + b3 )e3 ) = {a1 + b1 , a2 + b2 , a3 + b3 }.

45
Условие коллинеарности двух векторов «в координатах» получается
   
следующим образом: a || b тогда и только тогда, когда b = λ ⋅ a или
bi = λ ⋅ ai ∀i , т.е. их соответствующие координаты пропорциональны:

b1 b2 b3
= = .
a1 a1 a3

6.3. Декартова система координат. Декартовой системой коорди-


нат называется совокупность фиксированной точки O (начала координат)
  
и базиса векторов {e1 , e2 , e3} , исходящих из точки O . Оси, проходящие че-
рез базисные векторы, называют соответственно осью абсцисс (ось Ox ),
осью ординат (ось Oy ) и осью аппликат (ось Oz ). Плоскости, проходящие
через две какие-либо оси, называют координатными плоскостями.
Если базис ортогональный, то такая система координат называется
декартовой прямоугольной системой координат. В ортонормированном
  
базисе единичные базисные векторы принято обозначать через i , j , k .
Очевидно, что «в координатах» эти векторы записываются следующим
образом: 
 
i = {1, 0, 0}, j = {0, 1, 0}, k = {0, 0, 1} .

Радиус-вектором произвольной точки M называют вектор OM , а
его координаты называют координатами этой точки. Если даны координа-
  
ты точек A( x1 , y1 , z1 ) и B ( x2 , y2 , z2 ) , то в силу того, что AB = OB − OA

,координаты вектора AB равны

AB = { x2 − x1 , y2 − y1 , z2 − z1} .

Для произвольной точки M в декартовой системе координат с орто-


нормированным базисом в разложении вектора
   
OM = x ⋅ i + y ⋅ j + z ⋅ k

его координаты x, y, z являются проекциями вектора OM на оси
Ox, Oy, Oz , соответственно (см. рис. 6.3).

46
  
OM = x i + y j + z k
z 
k
γ
β y
x 
j
α
i
P
Q

Рис.6.3

Обозначим через α, β, γ углы между положительными направле-


 
ниями осей координат и вектором OM . Тогда проекции вектора OM вы-
ражаются следующим образом:  
x = PrOX OM =| OM | cos α ,
 
y = PrOY OM =| OM | cos β ,
 
z = PrOZ OM =| OM | cos γ .
 
В частности, если вектор OM = e единичной длины, то его координаты яв-
ляются косинусами углов, которые этот вектор образует с осями коорди-
нат, то есть

e = {cos α, cos β, cos γ} .

В связи с этим координаты единичного вектора называют направляющи-


ми косинусами этого вектора.
Длина вектора может быть найдена по теореме Пифагора: из двух
прямоугольных треугольников △OMQ и △OPQ следует, что

| OM |= x 2 + y 2 + z 2 .

Таким образом, углы, которые вектор образует с осями координат, связаны


следующим соотношением
2
e = co s 2 α + cos 2 β + cos 2 γ = 1 .

6.4.Полярная система координат. Кроме декартовой, возможны и


другие системы координат. Рассмотрим полярную систему координат.
47
Пусть наплоскости
 зафиксирована точка O (полюс) и выбран луч (поляр-
ная ось OP ) с началом в полюсе (см.рис.6.4)

, φ ,

 , φ
r r
φ φ
 

Рис. 6.4

Тогда положение произвольной точки M на плоскости  можно однозначно


охарактеризовать двумя числами (r , ϕ) , где r =| OM | – расстояние этой

точки от полюса и ϕ – угол между полярной осью и вектором OM , отсчи-
тываемый от полярной оси против часовой стрелки (см. рис. 6.4).
Выберем на плоскости две системы координат – декартову прямо-
угольную и полярную – так, что полюс находится в начале декартовой сис-
темы координат, а полярная ось направлена вдоль положительного на-
правления оси абсцисс. Тогда любая точка M будет иметь декартовы ко-
ординаты ( x, y ) и полярные (r , ϕ) . Из рис. 6.4 непосредственно следуют
соотношения между полярными и декартовыми координатами (предпола-
гается, что линейный масштаб одинаковый в обеих системах координат)

 x = r cos ϕ r = x 2 + y 2
 
 y = r sin ϕ ,  y .
 tg ϕ =
 x

В полярной системе координат удобнее изображать кривую, рас-


стояние точки которой от начала координат (полюса) определяется как
функция направления (полярного угла). Например, так называемая «спи-
раль Архимеда» определяется следующим образом: расстояние её точки до
полюса пропорционально величине угла между полярной осью и радиу-
сом-вектором этой точки. В соответствии с этим запишем уравнение этой
кривой в полярной системе координат

r = a⋅ϕ, a > 0

и построим ее график Спираль Архимеда можно рассматривать как тра-


екторию движения точки, равномерно перемещающейся вдоль прямой, в
48
то время как эта прямая равномерно вращается против часовой стрелки от-
носительно полюса. На рис. 6.5 приведена часть этой спирали, соответст-
вующая изменению полярного угла в пределах одного оборота.

Рис. 6.5

49
Лекция 7. Скалярное произведение

7.1. Скалярное произведение двух векторов. Скалярным произве-


 
дением векторов a и b называется число, равное произведению модулей
   
этих векторов на косинус угла между ними < a , b > =| a | ⋅ | b | cos ϕ


b

ϕ 
a

Рис. 7.1

Под углом между двумя векторами будем понимать наименьший из двух


углов между ними.
   
Скалярное произведение обозначается символом a ⋅ b или < a , b > .
Обратим внимание на то, что результат этой операции может быть выра-
жен через проекцию одного из векторов на другой. Действительно, так как
 
Пр a b = | b |cos ϕ , Пр b a = | a |cos ϕ ,
 

     
то (см. рис. 7.2) < a , b > = | a | ⋅ Пр 
a b =| b | ⋅ Пр b a


b

Пр b a


Пр а b

a

Рис. 7.2

С этой операцией в физике связано вычисление работы силы F при пе-
ремещении материальной точки по направлению вектора S , когда угол
между этими векторами равен ϕ . Тогда работа вычисляется по формуле

50
   
A = | F || S |cos ϕ = < F , S > .

Операция скалярного произведения позволяет выразить проекцию


вектора на вектор и угол между векторами следующим образом:
 
 < a, b > < a, b >

Пр b a =
  , cos ϕ =   ,
|b | | a |⋅ | b |

причем, если скалярное произведение векторов положительно, то угол ме-


жду ними острый, а если отрицательно – тупой. В частности, скалярное
произведение ненулевых векторов равно нулю тогда и только тогда, когда
эти векторы перпендикулярны (ортогональны)
 
a⊥b.

< a,b > = 0 ⇔

Из определения скалярного произведения следует коммутативность


этой операции

< a, b > = < b , a > ,


а из свойств проекций векторов вытекают следующие ее свойства:


          
< ka , b > = < a , kb > = k ⋅ < a , b > , < a , b + c > = < a , b > + < a , c > .
 

Докажем последнее из них


        
< a , b + c > = | a | ( Прa (b + c ) =| a | ( Пр a b + Пр a c ) =
       
| a | Прa b + | a | Пр a c =< a ,b > + < a ,c > .

Интересно отметить, что скалярное произведение вектора на себя дает

< a , a > = | a | ⋅ | a | cos0 0 = | a |2 ,


    

поэтому модуль вектора выражается через скалярное произведение сле-


дующим образом
a = < a , a > . (7.1)
  

Пример.В параллелограмме ABCD одна из сторон вдвое больше


другой и острый угол между ними равен 600 . Найти острый угол между
диагоналями параллелограмма и проекцию малой диагонали на большую.
51
Введём декартову систему 
координат, взяв за начало точку A и вы-
брав базис {e1 , e2 } ≡ {0.5 AB, AD } (см. рис.7.3). Пусть длины базисных век-
 
торов для определённости равны единице.

D C
 ?
e2
?

A 
e1 B

Рис. 7.3

В этом базисе диагонали параллелограмма имеют разложение


   
d1 = DB = 2e1 − e2 , d 2 = AC = 2e1 + e2 .
   

Искомые величины выражаются через скалярное произведение


   
< d1 , d 2 >  < d1 , d 2 >
cos (∠BO1C ) =   , Прd d1 =  .
| d1 | ⋅ | d 2 | 2
| d2 |

Вычисляем скалярное произведение, применяя более компактное по напи-


санию обозначение
 
d1 ⋅ d 2 = ( 2e1 − e2 ) ⋅ ( 2e1 + e2 ) = 4e1 ⋅ e1 − e2 ⋅ e2 = 3 .
       

Модули векторов вычисляем по формуле (7.1):


  
| d1 |= d1 ⋅ d1 = ( 2e1 − e2 ) 2 = 4e12 − 4e1e2 + e22 = 5 − 4cos60 0 = 3
    


| d 2 |= (2e1 + e2 ) 2 = 4e12 + 4e1e2 + e22 = 5 + 4cos 60 0 = 7 .
    

 
 < d1 , d 2 > 3
Итак, Прd d1 =  = ≈ 1.13
2
| d2 | 7

3
cos(∠BO1C ) = ≈ 0.65 ⇒ ∠BO1C ≈ arccos0.65 ≈ 49 0
3⋅ 7

52
7.2. Скалярное произведение в прямоугольных координатах. Вы-
разим скалярное произведение через координаты его сомножителей. Пусть
задана декартова прямоугольная система координат с ортонормированным
{ }
i , j , k и два вектора a = { ax , a y , az } и b = { bx , by , bz } . Тогда,
   
базисом


учитывая свойства скалярного произведения, получим


            
< a , b > = < ax i + a y j + az k , bx i + by j + bz k > =

    
= axbx < i , i > + a xby < i , j > + axbz < i , k > +

     
+ a ybx < j , i > + a yby < j , j > + a ybz < j , k > +
     
+ az bx < k , i > + az by < k , j > + a z bz < k , k > =

= a xbx + a yby + a z bz .

Итак, скалярное произведение равно сумме произведений одноимённых


координат сомножителей:
 
< a , b > = axbx + a y by + az bz .

Теперь мы в состоянии выразить полученные выше формулы для


модуля вектора, проекции вектора на вектор и угла между векторами в
координатах данных векторов. А именно,

a = < a , a > = a x2 + a y2 + a z2 ,
  

 
 < a , b > axbx + a yby + az bz
Прb a =  = ,
|b | bx2 + by2 + bz2

 
< a, b > axbx + a yby + az bz
cos ϕ =   = .
| a | ⋅| b | ax2 + a y2 + az2 bx2 + by2 + bz2

В частности, условие ортогональности двух векторов выражается че-


рез их координаты следующим образом:

axbx + a y by + az b = 0 .

53
Продемонстрируем, как в декартовой системе координат решаются
некоторые задачи.

7.3. Деление отрезка в заданном отношении: найти координаты точки


C ( x, y, z ) , которая делит отрезок, соединяющий точки A( x1 , y1 , z1 ) и B ( x2 , y2 , z2 )
(внутренним или внешним образом), в отношении λ (см. рис. 7.4).

 

  ,  ,    


0 , , 


  

0
, ,   ,  ,  


 ,  ,  
 ,  ,  

Рис. 7.4

Для её решения отметим, что векторы AC = { x − x1 , y − y1 , z − z1} и
  
CB = {x2 − x, y2 − y , z2 − z} коллинеарны, то есть AC = λ CB . Запишем это
векторное равенство в координатах:

x − x1 = λ ( x2 − x ) , y − y1 = λ ( y2 − y ) , z − z1 = λ ( z2 − z ) ,

откуда найдем координаты точки C

x1 + λ x2 y + λ y2 z + λz2
x= , y= 1 , z= 1 .
1+ λ 1+ λ 1+ λ

Покажем в заключение этого раздела, как векторная алгебра объясня-


ет действие так называемого уголкового отражателя, представляющего
собой комбинацию из трёх взаимно перпендикулярных зеркал. Многочис-
ленные применения этого прибора связаны с его способностью менять на-
правление света на строго противоположное независимо от того, с какого
направления свет на него падает. Пусть луч света сначала попадает, на-
пример, на плоскость xOy и направляющий вектор этого луча

a = {ax , a y , az } . Спрашивается, каков будет направляющий вектор a1 для


отражённого луча? Оба эти вектора одинаковой длины и расположены в


плоскости, перпендикулярной к плоскости xOy . Очевидно, что у направ-

54
ляющего вектора отражённого луча третья проекция сменит знак, а пер-
вые две проекции останутся прежними, т.е. a1 = {ax , a y , −az } (см. рис. 7.5).


z y

a az

a1
− az
O
x
Рис. 7.5

Таким образом, отразившись от трёх координатных плоскостей, луч света


будет иметь направление, противоположное первоначальному
a3 = {−ax , − a y , −az } = − a .
 

Следующий рисунок иллюстрирует «работу» уголкового отражателя


на конкретном примере.

2.5

1.5

0.5
0
0
0 1
1
2 2
3
4 3

Рис. 7.6

Уголковые отражатели применяются для точного измерения расстояний,


обеспечения безопасности движения транспорта и в военном деле.

55
Лекция 8. Векторное и смешанное произведения векторов

8.1. Векторное произведение векторов. Векторным произведением-


       
векторов a и b называется вектор c = [a × b ] или просто c = a × b такой,
что:
   
•c ⊥a и c ⊥b
  
• упорядоченная тройка векторов {a , b , c} правоориентированная
  
• c = a ⋅ b ⋅ sin ϕ , где ϕ –угол между векторами.
Упорядоченная тройка векторов называется правоориентированной
или правой, если после приведения их к общему началу с конца третьего
 
вектора
 c кратчайший поворот от первого вектора a ко второму вектору
b виден происходящим против часовой стрелки. В противном случае –
тройка называется левоориентированной или левой. При перестановке
местами любых двух векторов или при замене одного из векторов на про-
тивоположный тройка меняет ориентацию.

 
c c
 
b a


a 
b

Рис. 8.1

  
С этим расположением векторов a , b , c связаны правоориентиро-
ванная и левоориентированная декартовы прямоугольные системы коор-
динат.

 
k k

 
j i
 
i j

Рис. 8.2

56
Обратим внимание на то, что значение модуля векторного произве-
дения
  
c = a ⋅ b ⋅ sin ϕ

равно площади параллелограмма, построенного на этих векторах

a
Рис. 8.3

В механике с помощью этой операции вычисляется момент силы.


Пусть, например, O – одна неподвижная  точка некоторого тела, к другой
точке A которого приложена сила F . Момент этой силы  относительно
  
неподвижной точки выражается
 
векторным
произведением M = OA × F ,

а его модуль равен M =| F | ⋅| OA | sin ϕ =| F | d – «произведению силы | F |

на плечо d =| OA |sin ϕ ».

M   

d
φ
 Место для формулы
 

Рис. 8.4

Рассмотрим основные свойства операции векторного произведения.


Во-первых, эта операция позволяет выяснить
 коллинеарны или нет два за-

данных вектора. А именно, векторы a и b коллинеарны тогда и только то-
гда, когда их векторное произведение равно нулю
   
a || b ⇔ a × b = 0 .
   
Действительно, это следует из равенства | a × b | = | a | ⋅ | b | sin 0 = 0 .
  
Что произойдет, если в векторном произведении c = a × b переста-  
вить местами сомножители, т.е. что собой представляет вектор d = b × a ?

57
  
Очевидно, что вектор d перпендикулярен векторам a и b , его модуль
   
равен модулю вектора c , но тройка {b , a , c} стала левой, а, значит, тройка
        
{b , a , −c} будет правой. Таким образом, d = −c или [ a × b ] = −[b × a ] .


c

b
O

 
d a

Рис. 8.5

Умножение одного из сомножителей векторного произведения на


число приводит к умножению результата на это число, т.е.
     
[ ka × b ] = [ a × kb ] = k [a × b ] .

В выражениях, содержащих векторное произведение и сложение,


скобки «раскрываются» так же, как и при обычном умножении и сложе-
нии, т.е.
      
[(a + b ) × c ] = [a × c ] + [b × c ] .

Как найти векторное произведение, если  его сомножители заданы



своими координатами? Пусть векторы a и b в ортонормированном бази-
  
се векторов { i , j , k } , образующих правую тройку, имеют следующее раз-
ложение:
       
a = ax i + a y j + az k , b = bx i + by j + bz k .

Вначале приведем таблицу векторного умножения базисных векторов,


где в левом столбце находится первый сомножитель, в верхней строке –
второй, а на пересечении строки и столбца соответствующее произведение.

58
Таблица 1.
Вычисление векторного произведения координатных ортов в
правоориентированной системе координат

  
× i j k
   
i 0 k -j
   
j -k 0 i
   
k j -i 0

Теперь, используя эту таблицу и приведенные выше правила раскры-


тия скобок, получим:
       
[ a × b ] = [ ( a x i + a y j + a z k ) × ( bx i + by j + bz k )] =
     
= axbx [i × i ] + a ybx [ j × i ] + az bx [k × i ] +
     
+ a x by [ i × j ] + a y by [ j × j ] + a z by [ k × j ] +
     
+ axbz [i × k ] + a y bz [ j × k ] + az bz [k × k ] =
  
= i (a ybz − az by ) − j (axbz − az bx ) + k (axby − a ybx ) =

 a a  a a  a a
=i y z − j x z +k x y
by bz bx bz bx by
Чтобы запомнить, как вычисляются координаты векторного произве-
дения, заметим, что
  
i j k
 
[ a × b ] = ax ay az ,
bx by bz
где в правой части равенства стоит символический определитель, раскры-
вая который по элементам первой строки, получим приведенное выше вы-
ражение векторного произведения через координаты сомножителей. Такое
представление векторного произведения позволяет обнаружить те его
свойства, о которых говорилось выше. Например, при смене порядка со-
множителей в определителе поменяются местами две строки, что приводит
к смене знака определителя, а, значит, к смене знака векторного произве-
дения. Любознательный читатель может таким образом проверить спра-
ведливость и других свойств векторного произведения.
59
Полученное выражение векторного произведения через координаты
сомножителей дает возможность вычислить площадь треугольника по ко-
ординатам его вершин
C ( x3 , y3 , z 3 )

b

a
A( x 1 , y 1 , z 1 ) B ( x2 , y2 , z 2 )

Рис. 8.6

Образуя какую-нибудь пару векторов, например,

a = AB = { x2 − x1 , y2 − y1 , z2 − z1} = { a1 , a2 , a3 } и



b = AC = { x3 − x1 , y3 − y1 , z3 − z1} = { b1 , b2 , b3 }

найдём
  
i j k
1   1
S∆ = |  a × b  |= | a1 a2 a3 | .
2 2
b1 b2 b3

  
8.2. Смешанным произведением векторов a , b , c называется чис-
ло, равное
  
< a × b,c > , (8.1)
  
т.е. сначала находится вектор d = a × b , а затем он умножается скалярно на

вектор c . Поэтому смешанное произведение иногда называют векторно-
скалярным произведением векторов. Отметим, что смешанное произведе-
ние выражается через скалярное и векторное произведения и не является
какой-то «новой» операцией над векторами. Как мы сейчас увидим, знак
смешанного произведения говорит о взаимной ориентации данных трех
векторов (правую или левую тройку они образуют), а его модуль дает объ-
ем параллелепипеда, построенного на этих векторах.

60
Действительно, рассмотрим рисунки с правой и левой тройками век-
торов
c

d c
θ b
a
θ
b
a d

Рис. 8.7

     
Из рисунков видно, что в случае правой тройки {a , b , c} вектор d = a × b

образует с вектором c острый угол θ , а в случае левой тройки – этот угол
тупой. С учетом того, что
    
< a × b , c > = | d | ⋅ | c | cos θ ,

мы получим, что в первом случае знак смешанного произведения будет


положительным, а во втором – отрицательным. Таким образом, знак сме-
шанного произведения «говорит» о взаимной ориентации тройки векторов
в пространстве.
А что означает равенство нулю смешанного произведения? Очевид-
но, что это будет тогда и только тогда, когда cos θ = 0 , т.е. θ = π / 2 и, сле-
 
довательно, вектор c должен лежать в плоскости векторов a и b . Итак,
обращение в нуль смешанного произведения эквивалентно компланарно-
сти данной тройки векторов.

 
90




Рис. 8.8

61
Теперь, что касается модуля смешанного произведения. Рассмотрим
рисунок

 
a×b 
c


θ h b

ϕ

a

Рис. 8.9

и запишем
     
| < a × b , c > | = | a | ⋅ | b | ⋅ | sin ϕ | ⋅ | c | ⋅ | cos θ | = S▱ h = V

  
гдеV – объем параллелепипеда, построенного на векторах a , b , c .
Итак, смешанное произведение некомпланарных векторов по модулю
равно объему параллелепипеда, построенного на этих векторах.
Нам осталось только научиться вычислять смешанное произведение
векторов, заданных своими координатами. Пусть

a = {a x , a y , a z } , b = {bx , by , bz } , с = {cx , c y , cz }.
  

Тогда
  
 i j k  a a  a a  ax a y
 
d =  a × b  = ax a y a z = i
y z
− j x z +k
by bz bx bz bx by
bx by bz
и
   a y az  ax az  ax a y   
< d ,c > = < i − j +k , cx i + c y j + c z k > =
by bz bx bz bx by
a x a y az
a2 a3 a1 a3 a1 a2
= c1 − c2 + c3 = bx by bz
b2 b3 b1 b3 b1 b2
cx c y cz

62
Итак, мы получили выражение смешанного произведения через координа-
координ
ты сомножителей
ax a y az
  
< a × b , c > = bx by bz .
cx c y cz
 
Следовательно, объём параллелепипеда, построенного на векторах a , b ,

c вычисляется по формуле
ax a y az
V = | bx by bz | .
cx c y c z
Часто возникает задача вычисления объема пирамиды поп координа-
там ее вершин. Сведем эту задачу к вычислению объема параллелепипеда.
Для этого разделим параллелепипед диагональным сечением на две равно-
равн
великих призмы


c

b


a

Рис. 8.10

В свою очередь каждую из полученных призм можно разделить на три


равновеликих пирамиды.

Рис. 8.11

63
Таким образом, объем пирамиды равен 1/ 6 от объема параллелепипеда,
построенного на этих же векторах, т.е.

a a2 a3
1 1
Vпир = | b1 b2 b3 | .
6
c1 c2 c3

В заключение этой темы обратимся к геометрической интерпретации


однородных систем линейных уравнений. Однородная система линейных
уравнений всегда совместна, поскольку ранг расширенной матрицы совпа-
дает с рангом основной матрицы. Одно из её решений очевидно. Это нуле-
вое решение. Его называют тривиальным. Естественно возникает вопрос
о существовании других решений. В «солидных» курсах алгебры доказы-
вается, что для существования нетривиальных решений необходимо и дос-
таточно, чтобы определитель системы однородных уравнений был равен
нулю. Это утверждение становится очевидным (в трёхмерном случае), ес-
ли сформулировать задачу на «языке» векторной алгебры.
Действительно, так как линейное уравнение вида a1 x1 + a2 x2 + a3 x3 = 0
означает, что скалярное произведение векторов a = {a1 , a2 , a3} и


x = { x1 , x2 , x3} равно нулю, т.е. они ортогональны, то решить систему




a1 x1 + a2 x2 + a3 x3 = 0

b1 x1 + b2 x2 + b3 x3 = 0 (8.2)
c x + c x + c x = 0
1 1 2 2 3 3

это, значит, найти такой вектор x = { x1 , x2 , x3} , который был бы перпенди-




кулярен к трём векторам



a = {a1 , a2 , a3} , b = {b1 , b2 , b3 } , c = {c1 , c2 , c3 } .
 


Очевидно, что такой ненулевой вектор x существует тогда и только тогда,
  
когда векторы a , b , c лежат в одной плоскости, то есть они компланарны.
А равенство нулю определителя этой системы

a1 a2 a3
b1 b2 b3 = 0
c1 c2 c3

и есть условие компланарности этих векторов.


64
Раздел 3. Аналитическая геометрия. Прямые и плоскости

Лекция 9. Прямая линия на плоскости

Любая точка на плоскости однозначно определяется упорядоченной


парой чисел – ее декартовыми координатами. Также и вектор на плоско-
сти задается парой своих декартовых координат. В этой и ближайших лек-
циях мы получим аналитические представления для таких геометрических
объектов, как прямая на плоскости, плоскость и прямая в пространстве.

9.1. Общее уравнение прямой.Пусть на плоскости с декартовой пря-


моугольной системой координат проведена прямая L , и мы хотим полу-
чить уравнение, связывающее координаты любой точки, принадлежащей
этой прямой.
y

N
L

M0 M
x
O

Рис. 9.1

Для этого зафиксируем какую-нибудь точку M 0 ( x0 , y0 ) ∈ L и возьмем век-


тор N = { A, B } , перпендикулярный (ортогональный, нормальный) к этой


прямой L . Очевидно, что для произвольной точки M ( x, y ) ∈ L векторы


M 0 M = { x − x0 ; y − y0 } и N перпендикулярны, т.е. их скалярное произведе-


ние обращается в ноль < N , M 0 M > = 0 или в координатах




A( x − x0 ) + B ( y − y0 ) = 0 (9.1)

Таким образом, уравнение (9.1) – уравнение прямой L , проходящей че-


рез заданную точку M 0 ( x0 , y0 ) перпендикулярно заданному вектору
N = { A, B } .


Раскрывая в (9.1) скобки, получим уравнение

Ax + By + C = 0 , (9.2)

65
где для краткости обозначено C = − Ax0 − By0 .
Уравнение (9.2) называют общим уравнением прямой на плоскости.
Обратим внимание, что уравнение прямой на плоскости является линей-
ным уравнением относительно переменных x и y , а коэффициенты при
них
 – соответствующие координаты нормального к этой прямой вектора
N = { A, B } .
Обратно, покажем, что уравнение вида (9.2)определяет прямую на
плоскости и построим эту прямую. По данным числам A и B образуем-
вектор N = { A, B } и введём вектор r = { x, y } . Тогда уравнение (9.2) мож-
но представить в виде < N , r > +C = 0 или | N | Пр N r = −C .Отсюда
   

Пр N r = − C | N | ,
 

т.е. все радиус-векторы r = { x, y } , координаты которых удовлетворяют




уравнению (9.2),имеют одну и ту же проекцию на фиксированный вектор


N = { A, B } . Это означает, что точки M ( x, y ) принадлежат прямой, перпен-


дикулярной вектору N = { A, B } и отстоящей от начала координат на рас-




стояние | p | , где
C C
p=−  =− .
|N | A2 + B 2

Отсюда следует алгоритм построения прямой по заданному уравнению


(9.2). Через начало координат проведем прямую в направлении вектора
N = { A, B } и отложим на ней от начала координат отрезок длиной


N = { A, B } в направлении вектора N = { A, B } , если p > 0 , или в проти-


 

воположном направлении, если p < 0 . Через конец P этого отрезка прово-


дим перпендикулярно ему требуемую прямую L .
y

N
P
p
M ( x, y)
x

O
L

Рис. 9.2

66
Построение прямой производится гораздо проще, если воспользо-
ваться так называемым уравнением прямой в отрезках

x y
+ = 1, (9.3)
a b

где (a,0) и (0, b) – точки пересечения прямой L с осями абсцисс и орди-


нат, соответственно.
Действительно, из (9.2) следует Ax + By = − С и далее, предполагая,
что A ≠ 0, B ≠ 0, C ≠ 0 (т.е. прямая не проходит через начало координат и не
параллельна координатным осям) и разделив обе части этого уравнения на
C C
−C , получим уравнение (9.3), в котором a = − и b = − величины от-
A A
резков, которые прямая«отрезает» от осей координат (см. рис. 9.3).
y

L
b
x
a O

Рис. 9.3

9.2.Уравнение прямой с угловым коэффициентом. Иногда уравне-


ние прямой удобно представить в другом виде. Пусть прямая L пересека-
ет ось ординат в точке (0, b) и образует с положительным направлением
оси абсцисс угол α , тангенс которого обозначим через k = tgα .

y L

y−b
b α
x
α x
O

Рис. 9.4

67
Из рисунка следует, что для любой точки M ( x, y ) ∈ L выполняется равен-
ство
y−b
= tg α = k ,
x

из которого следует уравнение прямой с угловым коэффициентом

y = kx + b . (9.4)

Пусть точка M 0 ( x0 , y0 ) ∈ L , тогда y0 = kx0 + b .Выражая отсюда b и


подставляя в (9.4), получим уравнение прямой с угловым коэффициен-
том k , проходящей через заданную точку, в виде

y = y0 = k ( x − x0 ) . (9.5)

Заметим, что меняя в уравнении (9.5) величину k , мы получим множество


прямых, проходящих через данную точку. Это множество прямых называ-
ется пучком прямых, проходящих через заданную точку.

9.3. Параметрические и канонические уравнения прямой. Уравне-


ние прямой L можно получить, задавая точку M 0 ( x0 , y0 ) и её направ-
ляющий вектор S = {m, n } (см. рис. 9.5).



S M
L
M0

Рис. 9.5

Пусть M ( x, y ) ∈ L – произвольная точка. В силу коллинеарности векторов


S и M 0 M = { x − x0 ; y − y0 } имеем равенство M 0 M = t ⋅ S .В координатах это
   

равенство примет вид

 x = x0 + m ⋅ t
y = y + n⋅t − ∞ < t < + ∞ . (9.6)
 0

Это так называемые параметрические уравнения прямой. Ясно, что при


изменении значения параметра t в пределах от −∞ до +∞ точка M ( x, y )
68
«пробегает» всю прямую L . Очевидно, что точке M 0 ( x0 , y0 ) соответствует
значение параметра t = 0 . Исключая из этих уравнений параметр t , полу-
чим канонические уравнения прямой на плоскости

x − x0 y − y0
= . (9.7)
m n

В частности, если одна из координат направляющего вектора равна


нулю, например, S = {m,0} , то получаем уравнение прямой y = y0 .


В качестве следствия из уравнения (9.7) получим уравнение прямой,


проходящей через две заданные точки M 1 ( x1 , y1 ) и M 2 ( x2 , y2 ) . Как извест-
но, прямая определяется двумя своими точками. Нетрудно понять, что век-
тор
M 1M 2 = { x2 − x1 ; y 2 − y1}


можно считать направляющим вектором данной прямой. Отсюда получим


уравнение прямой, проходящей через две заданные точки

x − x1 y − y1
= .
x2 − x1 y2 − y1

69
Лекция 10. Прямые линии на плоскости

10.1. Взаимное расположение двух прямых. Пусть сначала две пря-


мые заданы уравнениями с угловым коэффициентом:

y = k1 x + b1 , y = k2 x + b2 .

Найдем наименьший положительный угол ϕ между прямыми L1 и L2 .

y L2
ϕ
ϕ L1

α2
α1 ϕ
O x

Рис. 10.1

Пусть α1 и α 2 — углы между положительным направлением оси Ox и


прямыми L2 и L2 соответственно. Тогда α 2 = α1 + ϕ (внешний угол тре-
угольника равен сумме внутренних углов, с ним не смежных). Отсюда сле-
дует, что ϕ = α 2 − α1 ,
tg α 2 − tg α1
tg ϕ = tg ( α 2 − α1 ) = .
1 + tg α1 ⋅ tg α 2
Так как
tg α1 = k1 , tg α 2 = k 2 , то

k2 − k1
tg ϕ = . (10.1)
1 + k1 ⋅ k2

По этой формуле вычисляется положительный угол ϕ , который отсчиты-


вается от прямой y = k1x + b1 до прямой y = k2 x + b2 . Поскольку тангенс
этого угла может быть и отрицательным, то угол ϕ между прямыми равен

k1 − k2
ϕ =| arctg | .
1 + k1k2

70
Иногда по заданному углу между прямыми и известному угловому
коэффициенту одной из прямых нужно найти угловой коэффициент другой
прямой. Поэтому нужно быть внимательными при применении формулы
(10.1). Чтобы подчеркнуть, какой угол вычисляется по этой формуле, в ней
ставят стрелку, показывающую, что угол отсчитывается от прямой с угло-
вым коэффициентом k1 до прямой с угловым коэффициентом k2 .
Пример. В плоскости луч света направлен по прямой
L1 : x − 2 y + 5 = 0 и дойдя до прямой L2 : 3 x − 2 y + 7 = 0 от неё отразился.
Получить уравнение прямой, по которой направлен отражённый луч.
3 1

Вычисляем тангенс угла «падения» tg ϕ = 2 2 = 4 (см. рис. 10.2)
3 1 7
1+ ⋅
2 2
k3 = ?
3
k2 =
2
L1 α
ϕ 1
k1 =
M0 2
L2

Рис. 10.2

Из аналогичной формулы для тангенса угла «отражения» α

4  3  3 
tg α = =  k3 −   1 + k3 
7  2  2 

получаем угловой коэффициент k3 = 29 / 2 прямой, по которой направлен


отражённый луч. Находим координаты точки M 0 ( −1, 2) пересечения пря-
мых L1 и L2 , решив систему уравнений

3x − 2 y + 7 = 0
 .
 x − 2 y + 5 = 0

Из уравнения пучка прямых y − y0 = k ( x − x0 ) получаем уравнение иско-


мой прямой 29 x − 2 y + 33 = 0 .

71
Вернемся к формуле (10.1) и получим условия перпендикулярности
и параллельности двух прямых y = k1 x + b1 , y = k2 x + b2 , выраженные
через их угловые коэффициенты:

1
L1 ⊥ L2 ⇔ k2 = − ; L1 L2 ⇔ k1 = k 2 .
k1

В последнем случае, если дополнительно b1 = b2 , то прямые L1 и L2 сов-


падают.
Пусть теперь прямые L1 и L2 заданы общими уравнениями

A1 x + B1 y + C1 = 0 , A2 x + B2 y + C2 = 0 . (10.2)

Сведём вычисление угла α между прямыми к вычислению угла ϕ между


нормальными векторами к этим прямым. Заметим, что угол между прямы-
ми может быть только острым, а угол между векторами
 может
 быть и ту-
пым. Поэтому, если угол ϕ между векторами N1 = { A1 , B 1} и N 2 = { A2 , B 2 }
острый, то α = ϕ (см. рис.10.3).

y L2
N1
α
ϕ L1
N2

O x

Рис. 10.3

Если же угол ϕ между нормальными векторами тупой, то α = π − ϕ (см.


рис. 10.4). Поскольку cos α = − cos ϕ , то cos α = | cos ϕ | . Таким образом, для
вычисления угла между прямыми получаем формулу

| A1 A2 + B1 B2 |
cos α =
A12 + B12 A2 2 + B2 2

72

N2 L1
α

ϕ α
L2


N1

Рис. 10.4

В частности:
L1 ⊥ L2 ⇔ A1 A2 + B1 B2 = 0 ;

A1 B1
L1 L2 ⇔ = .
A2 B2

В последнем случае, если дополнительно выполняется равенство

A1 B1 C1
= = , (10.3)
A2 B2 C2
то эти прямые совпадают.
Обратим внимание на связь полученных условий взаимного располо-
жения прямых с условиями разрешимости системы (10.2) двух линейных
уравнений с двумя неизвестными. Определитель этой системы

A1 B1
∆= = A1B2 − A2 B1 .
A2 B2

Если ∆ ≠ 0 , то, как известно, система имеет единственное решение,


которому соответствует точка пересечения прямых L1 и L2 . Если ∆ = 0 ,
то выполнено условие параллельности этих прямых. При этом возможны
два случая. В первом, когда выполнено условие (10.3), прямые совпадают,
и система имеет бесконечное множество решений (координаты любой точ-
ки прямой дают решение системы). Отметим, что условие (10.3) означает,
что ранг расширенной матрицы совпадает с рангом матрицы системы, т.е.

A B1 C1   A1 B1 
rang  1  = rang   = 1,
 A2 B2 C2   A2 B2 

73
и согласно теореме Кронекера-Капелли система совместна. Во втором слу-
чае, когда в условии (10.3) не выполнено второе равенство, прямые парал-
лельны, ранг расширенной матрицы больше ранга матрицы системы, и
система несовместна.

10.2. Пучок прямых, определяемый двумя пересекающимися


прямыми. Иногда при решении задач не следует спешить с нахождением
точки пересечения двух прямых, решая систему уравнений (10.2), а лучше
воспользоваться понятием пучка прямых, проходящих через точку пе-
ресечения этих прямых (в частности, когда нужно найти прямую, прохо-
дящую через точку пересечения данных прямых, и удовлетворяющую не-
которому дополнительному условию). Уравнение пучка прямых, прохо-
дящих через точку пересечения двух заданных прямых

A1 x + B1 y + C1 = 0 , A2 x + B2 y + C2 = 0
имеет вид
( A1 x + B1 y + C1 ) + λ ( A2 x + B2 y + C2 ) = 0 . (10.4)

Действительно, уравнение (10.4) – уравнение прямой. Так как точка


пересечения этих прямых M 0 ( x0 , y0 ) принадлежит каждой из этих прямых,
то ее координаты обращают в ноль обе скобки в (10.4), а, значит, при лю-
бом λ прямая (10.4) проходит через точку M 0 .

10.3. Расстояние от точки до прямой. Пусть требуется вычислить


расстояние отточки M 0 ( x0 , y0 ) до прямой Ax + By + C = 0 .

‫ݕ‬
ሬԦ
ܰ
‫ܮ‬ d ‫ܯ‬଴

݀
‫ܯ‬ଵ x
ܱ
Рис. 10.5

Пусть M 1 ( x1 , y1 ) – проекция точки M 0 на прямую (см. рис. 10.5). Иско-



мое расстояние равно абсолютной величине проекции вектора M 1M 0 на

направление нормального вектора N = { A, B } .

74
 
 < N ,M M > A( x0 − x1 ) + B( y0 − y1 )
d = Пр N M 1M 0 = 1 0 =  =
|N| |N|
Ax0 + By0 − Ax1 − By1
=  .
|N|

Так как точка M 1 ( x1 , y1 ) принадлежит прямой, то Ax1 + By1 = −C ,


поэтому окончательно получим

Ax0 + By0 + C
d= . (10.5)
A +B
2 2

Найдём координаты точки M 1 ( x1 , y1 ) . Для этого выразим вектор


  
M 1M 0 через найденное расстояние d и единичный вектор N / | N | , нормаль-
ный кпрямой
 d 
M 1M 0 = ±  N .(10.6)
|N|

Из формулы (10.5) видно, что знак проекции вектора M 1M 0 определяется-
знаком выражения Ax0 + By0 + C , т.е., если Ax0 + By0 + C > 0 , то
 
M 1M 0 ↑↑ N и в формуле (10.6) нужно взять знак плюс.
Пример. Найти проекцию точки M 0 (1, 8) на прямую 3 x − 4 y + 4 = 0
Вычисляем расстояние точки M 0 до прямой

3 ⋅1 − 4 ⋅ 8 + 4 | −25 |
d= = = 5.
32 + 42 5
 
Попутно выясняется, что M 1M 0 ↑↓ N , поэтому формула (10.6) даёт равен-
ство
 5
M 1M 0 = {1 − x1; 8 − y1} = − {3; 4} .
5
Отсюда, приравнивая координаты векторов, получаем координаты точки
M 1 ( 4, 4) (см. рис. 10.6).

75
M 0 (1,8)


M 1 (?,?) N = {3; −4}

Рис. 10.6

10.4. Линейные неравенства. В заключение этой лекции выясним геомет-


рический смысл неравенства

Ax + By + C > 0 . (10.7)Построим прямую


Ax + By + C = 0 (10.8)

и нормальный к ней вектор N = { A, B } .Нас интересует множество точек
M ( x, y ) , координаты которых удовлетворяют неравенству (10.7). Возьмём
на прямой (10.8) произвольную, но фиксированную точку M 0 ( x0 , y0 ) .


N

ϕ
M ( x, y)
M0

Рис. 10.7

Поскольку Ax0 + By0 + C = 0 , то, выражая отсюда C и подставляя в (10.7),


получим, что левая часть этого неравенства (10.7)равна скалярному про-


изведению вектора N = { A, B } на вектор M 0 M

76
 
< N , M 0 M > = A( x − x0 ) + B ( y − y0 ) > 0 .

Итак, неравенству (10.7) удовлетворяют


  все точки плоскости, для ко-
торых угол между векторами N и M 0 M – острый. Из рисунка 10.7 вид-
но, что все такие точки принадлежат одной полуплоскости. Чтобы выяс-
нить, какая из двух полуплоскостей «отвечает» неравенству (10.7), доста-
точно проверить его выполнение для какой-нибудь одной точки из любой
полуплоскости. Если координаты этой точки ему удовлетворяют, то и ко-
ординаты всех точек полуплоскости, в которой выбрана «пробная» точка,
будут его решениями, если нет – то нужная полуплоскость – другая.

77
Лекция 11. Плоскость

11.1. Различные виды уравнения плоскости. Перейдем теперь к


изучению уравнений плоскости в пространстве. Пусть в трехмерном про-
странстве с декартовой прямоугольной системой координат имеем плос-
кость П , и мы хотим получить уравнение, связывающее координаты лю-
бой точки, принадлежащей этой плоскости.


N

M0 900

Рис.11.1

Для этого зафиксируем какую-нибудь точку M 0 ( x0 , y0 , z0 ) ∈ П и возь-


мем вектор, перпендикулярный(ортогональный, нормальный) к этой плос-
кости. Пусть это будет вектор N = { A, B, C} . Очевидно, что для произволь-
 
ной точки M ( x, y, z ) ∈ П векторы M 0 M = { x − x0 ; y − y0 ; z − z0 } и N пер-
пендикулярны, т.е. их скалярное произведение равно нулю
 
< N , M 0M > = 0
или в координатах
A( x − x0 ) + B( y − y0 ) + C ( z − z0 ) = 0 . (11.1)

Это и есть уравнение плоскости П , проходящей через  заданную


точку M 0 ( x0 , y0 , z0 ) перпендикулярно заданному вектору N = { A, B, C}
.Раскрывая в (11.1) скобки, получим уравнение

Ax + By + Cz + D = 0 , (11.2)

где для краткости обозначено D = − Ax0 − By0 − Cz0 . Уравнение (11.2) назы-
вают общим уравнением плоскости. Обратим внимание, что уравнение
плоскости является линейным уравнением относительно переменных
x, y, z , а коэффициенты при них – соответствующие координаты нормаль-
ного вектора к этой плоскости.
78
Обратно, покажем, что уравнение вида(11.2) определяет  плоскость и
построим её. По данным числам A, B, C построим вектор N = { A, B, C} и

введем радиус-вектор r = { x, y , z} . Тогда уравнение (11.2) можно предста-
вить в виде    
< N , r > + D = 0 или | N | ПрN r = − D .
Отсюда
 D
Пр N r = −  ,
|N|

т.е. все радиус-векторы r = { x, y,z} , координаты которых удовлетворяют

уравнению (11.2), имеют одну и ту же проекцию на вектор N = { A, B , C } .
Это означает, что точки M ( x, y, z ) принадлежат плоскости, перпендику-

лярной вектору N = { A, B , C } и отстоящей от начала координат на рас-
стояние | p | , где
D D
p=−  =− .
|N| A + B2 + C 2
2

Отсюда следует алгоритм построения плоскости по заданному урав-


нению (11.2).
 Через начало координат проведем прямую в направлении
вектора N = { A, B , C } и отложим на ней от начала координат отрезок OP

длиной | p | в направлении вектора N = { A, B , C } , если p > 0 , или в про-
тивоположном направлении, если p < 0 . Через конец этого отрезка P про-
водим перпендикулярно ему требуемую плоскость.

z

P N

p M
 y
O r
x

Рис. 11.2

Рассмотрим некоторые частные случаи общего уравнения плоскости.


Пусть один из коэффициентов перед переменными в уравнении (11.2) ра-
вен нулю (например, C = 0 ). Тогда нормальный вектор этой плоскости
79

N = { A, B ,0} . Это значит, что он перпендикулярен оси O z , а плоскость па-
раллельна этой оси
z

O
y

x N = { A, B,0}

Рис. 11.3

Теперь пусть два каких-нибудь коэффициента перед переменными в


уравнении(11.2)
 равны нулю (например, A = B = 0 ). Тогда нормальный
вектор N = {0,0, C} перпендикулярен плоскости xO y , а плоскость парал-
лельна этой координатной плоскости

z N = {0,0, C}

O
y

x
Рис. 11.4

Рассмотрим ещё случай, когда в уравнении (11.2) D = 0 . Это означает,


что точка (0,0,0) принадлежит плоскости

Ax + By + Cz = 0

или, другими словами, эта плоскость проходит через начало координат.


Для наглядного представления расположения этой плоскости найдем
её следы, т.е. линии пересечения с координатными плоскостями (см. рис.
11.5).

80
 Ax + By = 0  Ax + Cz = 0  By + Cz = 0
 ,  ,  .
 z=0  y=0  x=0

Рис. 11.5

Из общего уравнения плоскости легко получить так называемое


уравнение плоскости в отрезках
x y z
+ + = 1, (11.3)
a b c

где (a,0,0) , (0, b,0) и (0,0, c) – точки пересечения плоскости с координат-


ными осями. Действительно, из (11.2) следует Ax + By + Cz = − D и далее,
предполагая, что D ≠ 0 (т.е. плоскость не проходит через начало коорди-
нат) и разделив обе части этого уравнения на − D , получим уравнение
D D D
(11.3), в котором a = − , b = − и c=− величины отрезков, которые
A B C
плоскость «отрезает» от осей координат(см. рис. 11.6).

z
c

b
y
a
x
Рис. 11.6

81
Получим уравнение плоскости, проходящей через три заданные
точки M 1 ( x1 , y1 , z1 ) , M 2 ( x2 , y2 , z2 ) , M 3 ( x3 , y3 , z3 ) . Пусть M ( x, y, z ) – произ-
вольная точка плоскости П .

M2
M
M1
M3

Рис. 11.7
  
Тогда три вектора M 1M , M 1M 2 , M 1M 3 будут компланарными и, следова-
тельно, их смешанное произведение равно нулю

x − x1 y − y1 z − z1
x2 − x1 y2 − y1 z2 − z1 = 0 .
x3 − x1 y3 − y1 z3 − z1

Раскладывая этот определитель по элементам первой строки, приведем его


к линейному уравнению относительно x, y, z вида (11.2).

11.2. Взаимное расположение двух плоскостей. Пусть заданы две


плоскости П1 и П 2 уравнениями(см. рис. 11.8).

A1 x + B1 y + C1 z + D1 = 0 , A2 x + B2 y + C2 z + D2 = 0 .

 
a) N1 b) N1
 α
П2 ϕ N2 ϕ

α α
П1 П1
 П2
α N2 α

Рис. 11.8

82
Найдем угол между ними в предположении, что они пересекаются.
Пересекаясь, плоскости образуют две пары равных двугранных углов. Уг-
лом α между плоскостями П1 и П 2 будем считать меньший из этих дву-
гранных углов (см. рис. 11.8).Выразим угол α между плоскостями через
угол ϕ между нормальными к ним векторами N 1 = { A1 , B1 , C1} и

N 2 = { A2 , B2 , C2 } . Если угол ϕ острый, то α = ϕ (как углы с взаимно пер-
пендикулярными сторонами). Если же угол ϕ – тупой, то α = π − ϕ (см.
рис. 11.8 b) ), поэтому cos α = − cos ϕ . В итоге для вычисления угла α
между плоскостями имеем формулу
 
|< N 1 , N 2 >| | A1 A2 + B1B2 + C1C2 |
cos α =   = .
| N 1 | ⋅| N 2 | A12 + B12 + C12 A12 + B12 + C12

В частности, условие перпендикулярности и условие параллельно-


сти двух плоскостей имеют вид

П1 ⊥ П 2 ⇔ A1 A2 + B1B2 + С1С2 = 0 ;

A1 B1 С1
П1  П 2 ⇔ = = .
A2 B2 С2

В последнем случае, если дополнительно выполняется равенство

A1 B1 C1 D1
= = = , (11.4)
A2 B2 C2 D2
то эти плоскости совпадают.
Аналогично понятию пучка прямых на плоскости существует понятие
пучка плоскостей, проходящих через линию пересечения двух задан-
ных плоскостей. В частности, им удобно пользоваться, когда нужно най-
ти плоскость, проходящую через линию пересечения данных плоскостей и
удовлетворяющую некоторому дополнительному условию. Уравнение
пучка плоскостей имеет вид

( A1 x + B1 y + C1 z + D1 ) + λ ( A2 x + B2 y + C2 z + D2 ) = 0 . (11.5)

Действительно, уравнение (11.5) – уравнение плоскости. Так как ко-


ординаты любой точки, принадлежащей линии пересечения П1 и П 2 , об-
ращают в ноль обе скобки в (11.5), то при любом λ эта плоскость проходит
через линию пересечения этих плоскостей.

83
11.3. Расстояние от точки до плоскости. Пусть требуется вычислить
расстояние отточки M 0 ( x0 , y0 , z0 ) до плоскости Ax + By + Cz + D = 0 .

d 
N

M0

O M1

Рис. 11.9

Пусть M 1 ( x1 , y1 , z1 ) – проекция точки M 0 на данную плоскость (см. рис.


11.9).
 Искомое расстояние равно абсолютной величине проекции вектора

M 1M 0 на направление нормального вектора N = { A, B } :
 
 |< N ,M M >| A( x0 − x1 ) + B( y0 − y1 ) + C( z 0 − z1 )
d = Пр N M 1M 0 = 1 0 =  =
|N| |N|

Ax0 + By0 + Cz 0 − Ax1 − By1 − Cz1


= 
|N|

Так как точка M 1 ( x1 , y1 , z1 ) принадлежит плоскости, то


Ax1 + By1 + Cz1 = − D ,поэтому

Ax0 + By0 + Cz0 + D


d= . (11.6)
A2 + B 2

Найдём координаты точки M 1 ( x1 , y1 , z1 ) . Для этого выразим вектор


 1 
M 1M 0 через найденное расстояние d и единичный вектор  N , нормаль-
|N|
ный к плоскости
 d 
M 1M 0 = ±  N .(11.7)
|N|

84

Из формулы (11.6) видно, что знак проекции вектора M 1M 0 определяется-
знаком выражения Ax0 + By0 + Cz 0 + D , т.е., если Ax0 + By0 + Cz0 + D > 0 ,
 
то M 1M 0 ↑↑ N , и в формуле (11.7) нужно взять знак «плюс».
Пример. Найти проекцию начала координат на плоскость

3x − 2 y − z + 7 = 0 .

Пусть M 1 ( x1 , y1 , z1 ) – проекция точки (0,0,0) на данную плоскость(см.


рис.11.10). Вычисляем расстояние точки (0,0,0) до плоскости

3 ⋅ 0 − 2 ⋅ 0 − 1⋅ 0 + 7 7
d= = ≈ 1 .9
1+ 4 + 9 14
 
Отсюда следует, что M 1O = {− x1 , − y1 , − z1} ↑↑ N = {3, −2, −1}


N
M1
d
y
x O

Рис. 11.10

Из равенства (11.7), взятого со знаком плюс, имеем

7 {3, −2, −1}


{− x1 , − y1 , − z1} = .
14 14

Отсюда находим M 1 ( −1.5,1,0.5) .

85
Лекция 12. Прямая линия в пространстве

12.1. Различные виды уравнений прямой. Пусть в трехмерном про-


странстве с декартовой прямоугольной системой координат имеем прямую
L , и мы хотим получить уравнение, связывающее координаты любой её
точки. Пусть M 0 ( x0 , y0 , z0 ) – некоторая фиксированная точка этой прямой
и S = {m, n, p} – вектор, параллельный прямой L , называемый направ-


ляющим вектором этой прямой

z

S
M0
 y
r0

r M
x

Рис. 12.1

Возьмем на прямой L произвольную точку M ( x, y, z ) . Рассмотрим



следующие векторы M 0 M = {x − x0 , y − y0 , z − z0 }, r = {x0 , y0 , z0 } и r = { x, y , z} .
 
 
Очевидно, что векторы M 0 M и S коллинеарны, поэтому существует число
 
t такое, что M 0 M = t S , т.е.

r − r0 = t S . (12.1)
 

Записывая равенство (12.1) в координатах, получим так называемые пара-


метрические уравнения прямой в пространстве

 x = x0 + mt

 y = y0 + nt (12.2)
 z = z + pt
 0

Ясно, что при изменении значения параметра t в пределах от −∞ до +∞


точка M ( x, y, z ) «пробегает»всю прямую L . В частности, при t = 0 урав-
нения (12.2) дают координаты точки M 0 ( x0 , y0 , z0 ) .

86
Выразим параметр t из каждого уравнения (12.2), приравняем друг
другу полученные выражения и придем к так называемым каноническим
уравнениям прямой в пространстве

x − x0 y − y0 z − z0
= = . (12.3)
m n p

Заметим, что на плоскости xOy каноническое уравнение прямой, прохо-



дящей через точку M 0 ( x0 , y0 ) с направляющим вектором S = {m, n} , имеет
вид
x − x0 y − y0
= .(12.4)
m n

Обратим внимание, что уравнения (12.3) представляют собой крат-


кую запись трёх равенств. Рассмотрим, например, одно из них(12.4). Это
уравнение плоскости, параллельной оси O z . Так как координаты любой
точки прямой (12.3) удовлетворяют уравнению (12.4), то прямая L лежит
в этой плоскости
z
L

y
O

Рис.12.2

Линия пересечения плоскости (12.4) с плоскостью xOy является проекци-


ей прямой L на эту координатную плоскость.
Рассматривая совместно пару равенств из (12.3) , например,

 x − x0 y − y0
 m = n
x−x z − z
,
 0
= 0

 m p

получим уравнение прямой L в виде линии пересечения двух плоскостей.

87
В общем случае уравнения прямой как линии пересечения двух
непараллельных плоскостей П1 и П 2 имеют вид

 A1 x + B1 y + C1 z + D1 = 0
 (12.5)
 A2 x + B2 y + C2 z + D2 = 0

Приведём конкретный пример задания прямой в таком виде (см.рис. 2.3).

z
 3 x + 4 y + 2 z − 12 = 0
L:
 3x + y + 2 z − 6 = 0

Рис. 12.3

Выше был показан переход от канонических уравнений прямой к


уравнениям вида (12.5). Покажем, как из уравнений (12.5) получить кано-
нические уравнения этой прямой. Для этого надо найти какую-нибудь одну
точку прямой L и её направляющий вектор. Для нахождения координат
точки решим систему двух уравнений (12.5) относительно двух перемен-
ных, коэффициенты перед которыми образуют базисный минор, фиксируя
при этом третью переменную. Совместность этой системы уравнений, а
значит, и наличие такого минора, гарантируется предположением о том,
что плоскости П1 и П 2 не параллельны. Пусть, например,

A1 B1
∆= ≠ 0,
A2 B2
тогда
C1 z + D1 B1 A1 C1 z + D1
C2 z + D2 B2 A2 C2 z + D2
x=− , y=− . (12.6)
∆ ∆

Раскрывая определители в этих выражениях, представим решения системы


(12.5) в виде
x = αz + β , y = γz + δ .
88
Будем рассматривать переменную z в качестве параметра, выразим её из
полученных равенств и запишем их в виде

x−β y −δ z
= = . (12.7)
α γ 1

Таким образом, координаты точек прямой L , заданной уравнениями


(12.5),удовлетворяют уравнениям (12.7), которые можно рассматривать как
канонические уравнения этой прямой. В частности, точка (β, δ,0) лежит на

этой прямой, а S = {α, γ ,1} – её направляющий вектор.
Возможен и другой путь получения канонических уравнений прямой
из уравнений прямой как линии пересечения двух плоскостей П1 и П 2 , за-
данных уравнениями (12.5)

N1
П2

N2

П1 
S

Рис. 12.4

Очевидно, что в качестве направляющего вектора S = {m, n, p} прямой

L можно взять векторное произведение векторов N1 = { A1 , B1 , C1} и

N 2 = { A2 , B2 , C2 } , т.е.
  
   i j k   
S = N1 × N 2 = A1 B1 C1 = mi + n j + pk ,
A2 B2 C2

а координаты какой-нибудь точки этой прямой получим, решая систему


(12.5) при фиксированном значении переменной z (например, z = 0 ).
Получим уравнения прямой в пространстве, проходящей через две
заданные точки M 1 ( x1 , y1 , z1 ) и M 2 ( x2 , y2 , z2 ) . Очевидно, что направляю-
щим
 вектором этой прямой может служить вектор
M1M 2 = {x2 − x1, y2 − y1, z2 − z1} , и тогда канонические уравнения примут вид

89
x − x1 y − y1 z − z1
= = .(12.8)
x2 − x1 y2 − y1 z2 − z1

12.2. Проекция точки на прямую и расстояние от точки до пря-


мой в пространстве. Пусть прямая задана каноническими уравнениями

x − x1 y − y1 z − z1
= = .
m n p

Обозначим через M 2 ( x2 , y2 , z2 ) проекцию точки M 0 на данную прямую


(см. рис. 12.5). Напомним, что проекцией точки M на ось L в простран-
стве называется точка M 1 пересечения оси L и плоскости, проходящей
через точку M 0 перпендикулярно этой оси.

M2

S L


M1

M0

Рис.12.5

Требуется найти координаты точки M 2 и расстояние от точки M 0 ( x0 , y0 , z0 )


до этой прямой. Искомая точка будет найдена, если мы найдем вектор
 
M 1M 2 , который коллинеарен вектору S = {m, n, p} и имеет длину, равную
 
модулю проекции вектора M 1M 0 = {x0 − x1 , y0 − y1 , z0 − z1} на вектор S . Так
как
 
 < M M , S >
ПрS M 1M 0 = 1
0 ,
|S |
то
  
 < M M , S > S
M 1M 2 = 1
0  .(12.9)
|S| |S|

90
Поэтому искомое расстояние вычисляется по формуле
 
   < M M , S > 
d =| M 1M 0 − M 1M 2 | = | M 1M 0 − 1
 02 ⋅ S |.
|S|

Пример. Вычислить расстояние точки M 0 (2, −1,3) до прямой

x y+7 z−2
= =
3 5 2

и найти её проекцию на эту прямую. 


Выберем точку на прямой M 1 (0, −7,2) , тогда M 1M 0 = {2,6,1} . Вычис-
 
лим скалярное произведение < M 1M 0 , S > = 38 ,квадрат модуля | S |2 = 38


направляющего вектора S = {3,5, 2} , и по формуле (12.9)получим

M 1M 2 = {3,5,2} :
     
d =| 2i + 6 j + k − (3i + 5 j + 2k ) |=| −i + j − k |= 3 .
  

Координаты проекции точки M 2 ( x2 , y2 , z 2 ) находим из равенства



M 1M 2 = {x2 − 0, y2 + 7, z2 − 2} = M 2 (3, −2, 4) , поэтому окончательно получаем
M 2 (3, −2, 4) .
В частности, таким способом можно находить расстояние между па-
раллельными прямыми в пространстве как расстояние от точки, взятой на
одной прямой, до другой прямой.

12.3.Пересечение прямых в пространстве. Пусть две прямые L1 и L2


заданы каноническими уравнениями

x − x1 y − y1 z − z1 x − x2 y − y2 z − z2
L1 : = = , L2 : = = .
m1 n1 p1 m2 n2 p2

Выясним условия пересечения этих прямых. Предполагаем, что направ-


 
ляющие векторы этих прямых S1 = {m1 , n1 , p1} и S 2 = {m2 , n2 , p2 } не колли-
неарны, что исключает случаи параллельности или совпадения этих пря-
мых, и, кроме того, точки M 1 ( x1 , y1 , z1 ) и M 2 ( x2 , y2 , z2 ) различные (см.
рис.12.6).

91
M2 L2
L1
M0

 S1
S2 M1

Рис. 12.6

Ясно, что прямые будут принадлежать одной плоскости, а значит пе-


 
ресекаться в точке M 0 , тогда и только тогда, когда три вектора S1 , S 2 и

M1M 2 = {x2 − x1, y2 − y1, z2 − z1} компланарны. В координатной форме это
условие выглядит так
x2 − x1 y2 − y1 z2 − z1
m1 n1 p1 = 0 .
m2 n2 p2

Как найти координаты точки пересечения прямых? Проведём через


каждую прямую плоскость, проецирующую эту прямую на какую-нибудь
из координатных плоскостей. Например, рассмотрим плоскости, проеци-
рующие эти прямые на плоскость xOy . Пересечение этих плоскостей –
это прямая, перпендикулярная плоскости xOy . Координаты точки пере-
сечения этой прямой с плоскостью xOy совпадают с соответствующими
координатами точки пересечения данных прямых (см. рис. 12.7).

z L2
L1
M0

x ( x0 , y0 )

Рис.12.7

Нахождение координат точки ( x0 , y0 ) сводится к решению системы

92
 x − x1 y − y1
 m = n
1 1
 x−x y − y
,
 2
= 2

 m2 n2

а третья координата может быть найдена из уравнения прямой L1 или L2 .


Пример. Доказать, что прямые

x+5 y−4 z+5 x + 5 y − 16 z + 6


L1 : = = , L2 : = =
3 −6 2 4 −12 3

пересекаются и найти координаты точки их пересечения M 0 ( x0 , y0 , z0 ) Про-


 
веряем компланарность тройки векторов S1 = {3, −6, 2} , S 2 = {4, −12,3} и

M1M 2 = {0,12, −1} , вычисляя определитель:

0 12 −1
−6 2 3 −6
3 −6 2 = −12 − = 0.
−12 3 4 −12
4 −12 3

Следовательно, эти прямые пересекаются. Координаты точки пересечения


находим, решая, например, систему

x +5 y −4
 3 = −6
 .
 x + 5 y − 16
=
 4 −12

Её решение x0 = 7, y0 = −20 . Из уравнения, допустим, первой прямой най-


дем третью координату z0 = 3 . Итак, точка пересечения этих прямых
M 0 (7, −20,3).

12.4. Расстояние между двумя прямыми. Случай параллельных


прямых мы рассматривали в п.12.2. Поэтому пусть прямые скрещиваю-
щиеся, следовательно, расположены в параллельных плоскостях (см. рис.
12.8), расстояние между которыми и будет искомым расстоянием между
прямыми.

93


 



 

Рис.12.8

Пусть прямые заданы каноническими уравнениями

x − x1 y − y1 z − z1 x − x2 y − y2 z − z2
L1 : = = , L2 : = =
m1 n1 p1 m2 n2 p2

  


проекции вектора   на вектор     .
Кратчайшее расстояние между прямыми найдём как абсолютную величину

Пример. Найти расстояние между прямыми

1  1  1 2


 :   ;  :   ;
1 1 2 1 3 4

Вектор
   1, 1, 1. Находим векторное произведение

  

    1 1  .
2  2  2  2
1 3 4

  1, 1, 1, коллинеарный век-


Удобнее находить проекцию на вектор 
тору . Тогда

 · 
 
  |1  1  1|
  Пр# 
    ' 0.58.

 √3

94
Лекция 13. Взаимное расположение прямых и плоскостей

13.1.Угол между прямыми в пространстве. Пусть заданы две пря-


мые L1 и L2 своими каноническими уравнениями

x − x1 y − y1 z − z1
L1 : = =
m1 n1 p1
x − x2 y − y2 z − z2
L2 : = = .
m2 n2 p2
m1 n1 p1
Если = = , что означает коллинеарность направляющих векторов
m2 n2 p2
 
S1 = {m1 , n1 , p1} и S 2 = {m2 , n2 , p2 } , то прямые L1 и L2 параллельны и угол
между ними полагают равным нулю. Параллельные прямые, очевидно,
принадлежат одной плоскости.
Под углом между пересекающимисяпрямыми будемпонимать  угол
ϕ между их направляющими векторами S1 = {m1 , n1 , p1} и S 2 = {m2 , n2 , p2 } ,
если он острый, и угол α = π − ϕ в противном случае. Следовательно,
 
|< S , S2 >| | m1 ⋅ m2 + n1 ⋅ n2 + p1 ⋅ p2 |
cos α =| cos ϕ |= 1   = . (13.1)
S1 ⋅ S 2 m12 + n12 + p12 ⋅ m2 2 + n2 2 + p2 2

Прямые, не лежащие в одной плоскости, называются скрещиваю-


щимися прямыми. Определим понятие угла между скрещивающимися
прямыми. Под углом α между двумя прямыми L1 и L2 будем понимать
наименьший из углов между пересекающимися прямыми L1′ и L2′ , им
параллельными (см. рис.13.1).

L2′ α
L2

S1 L1
L1′

S2

S2
ϕ

S1
Рис. 13.1
В частности, условие перпендикулярности двух прямых имеет вид
95
L1 ⊥ L2 ⇔ m1m2 + n1n2 + p1 p2 = 0 .

13.2. Угол между прямой иплоскостью. Найдем теперь угол между


прямой

x − x0 y − y0 z − z0
L: = = (13.2)
m n p

и плоскостью П : Ax + By + Cz + D = 0 . Напомним, что под углом между


прямой и плоскостью понимают наименьший положительный угол α
между проекцией L′ прямой L на плоскость П и прямой L (см. рис.
13.2).

N L

N
L
ϕ

S
α ϕ
L′ L′
α

S
Рис. 13.2

Вычисление угла α можно свести к вычислению угла ϕ между



направляющим вектором S = {m, n, p} прямой L и нормальным к
плоскости П вектором N = { A, B, C} . В случае острого угла 0 < ϕ < π / 2


имеем
 
< N,S >
sin α = cos ϕ =   .
| N |⋅| S |
π
В случае тупого угла π / 2 < ϕ < π , так как ϕ = + α (см. рис. 13.2), по-
2
π
лучим sin α = sin(ϕ − ) = − cos ϕ .Таким образом, для вычисления угла ме-
2
жду прямой и плоскостью получаем формулу

| mA + nB + pC |
sin α =| cos ϕ |= .
A + B +C ⋅ m +n + p
2 2 2 2 2 2

В частности, условие перпендикулярности и условие параллель-


ности прямой и плоскости имеют вид
96
A B C
L⊥ П ⇔ = = ;
m n p

L || П ⇔ Am + Bn + Cp = 0 .

В последнем случае, если дополнительно выполняется равенство

Ax0 + By0 + Cz0 + D = 0 ,

которое означает, что точка ( x0 , y0 , z0 ) прямой L принадлежит плоскости


П , то прямая лежит в этой плоскости. Таким образом, принадлежность
прямой, заданной каноническими уравнениями (13.2), плоскости
П : Ax + By + Cz + D = 0 определяется выполнением условий

{ Am + Bn + Cp = 0
Ax0 + By0 + Cz0 + D = 0
.

Если прямая L задана как линия пересечения двух плоскостей

 A1 x + B1 y + C1 z + D1 = 0
 ,
 A2 x + B2 y + C2 z + D2 = 0

то ее направляющий вектор может быть получен как векторное произведе-


ние нормальных векторов этих плоскостей (см. рис. 12.3), т.е.
  
S = N1 × N 2 ,
и задача нахождения угла между прямой и плоскостью сводится к преды-
дущей. В этом случае

< N1 × N 2 , N >
     
( N1 , N 2 , N )
sin ϕ =    =    .
| N1 × N 2 | ⋅ | N | | N1 × N 2 | ⋅ | N |

13.3.Пересечение прямой с плоскостью. Вычислим теперь коорди-


x − x0 y − y0 z − z0
наты точки пересечения прямой L : = = и плоскости
m n p
П : Ax + By + Cz + D = 0 при условии, что они пересекаются. Перейдём от
канонических уравнений прямой к параметрическим

97
 x = mt + x0
x − x0 y − y0 z − z0 
= = = t ⇒  y = nt + y0
m n p  z = pt + z0

Найдем значение параметра t1 , при котором соответствующая точка пря-


мой принадлежит плоскости, т.е. удовлетворяет уравнению

A ( mt + x0 ) + B ( nt + y0 ) + C ( pt + z0 ) + D = 0
или, что тоже,

( Am + Bn + Cp )t = −( Ax0 + By0 + Cz0 + D ) . (13.2)

Если Am + Bn + Cp = 0 и Ax0 + By0 + Cz0 + D ≠ 0 , то это уравнение не имеет


решений. Эти условия соответствуют тому, как мы выяснили выше, что
прямая и плоскость параллельны и, следовательно, не пересекаются. Если
Am + Bn + Cp = 0 и Ax0 + By0 + Cz0 + D = 0 , то уравнение (13.2) имеет бес-
численное множество решений, т.е. прямая принадлежит плоскости. И, на-
конец, если Am + Bn + Cp ≠ 0 , то
Ax + By0 + Cz0 + D
t1 = − 0 .
Am + Bn + Cp

Подставим это значение в параметрические уравнения прямой и найдем


x1 , y1 , z1 – координаты точки пересечения прямой L с плоскостью П .
Если прямая L задана как линия пересечения двух плоскостей

 A1 x + B1 y + C1 z + D1 = 0
 ,
 A2 x + B2 y + C2 z + D2 = 0

а плоскость задана уравнением Ax + By + Cz + D = 0 , то координаты точки


их пересечения находим, решая следующую систему трех линейных урав-
нений:
 Ax + By + Cz + D = 0

 A1 x + B1 y + C1 z + D1 = 0 .
A x + B y + C z + D = 0
 2 2 2 2

Здесь возможны варианты. Если определитель матрицы этой системы


не равен нулю, то искомая точка пересечения единственна и находится,
например, по правилу Крамера. Если определитель матрицы этой системы
равен нулю, что означает компланарность нормальных векторов к этим
плоскостям, то система может быть несовместна (см., например, рис. 13.3)
98
Рис. 13.3

или иметь бесчисленное множество решений, когда эти три плоскости пе-
ресекаются по одной прямой(см. рис. 13.4).

Рис. 13.4

99
Лекция 14. Другие задачи о прямых и плоскостях

Рассмотрим несколько типичных задач получения уравнений прямых


или плоскостей, обладающих заданными свойствами.

Задача 1. Составить уравнения прямой L , проходящей через данную


точку M ( x0 , y0 , z0 ) перпендикулярно к данной плоскости
П : Ax + By + Cz + D = 0 .


, , 

  ,  ,  

Рис. 14.1

Очевидно, что в качестве направляющего вектора прямой можно взять


 
нормальный вектор к плоскости, т.е. S = N = { A, B , C} . Отсюда следует, что
уравнения искомой прямой имеют вид

x − x0 y − y0 z − z0
= = . (14.1)
A B C

Задача 2. Составить уравнение плоскости П , проходящей через данную


точку M 1 ( x1 , y1 , z1 ) перпендикулярно к данной прямой L

x − x0 y − y0 z − z0
= = .
m n p

Очевидно (см. рис. 14.2), что в качестве нормального


  вектора плоско-
сти можно взять направляющий вектор прямой, т.е. N = s = { m, n, p } . От-
сюда следует, что уравнения искомой плоскости имеет вид

m ( x − x1 ) + n ( y − y1 ) + p ( z − z1 ) = 0 . (14.2)

100
M 0 ( x0 , y0 , z0 )
M 1 ( x1 , y1 , z1 )
s = { m , n, p }


Рис. 14.2

Задача 3.Найти проекцию точки M 0 ( x0 , y0 , z0 ) на плоскость

П : Ax + By + Cz + D = 0 .

Напомним, что проекцией точки M 0 на плоскость называют основа-


ние перпендикуляра M 1 , опущенного из этой точки на плоскость (см.
рис.14.3). Очевидно, что эта проекция будет точкой пересечения плоскости
П и прямой (14.1), проходящей через точку M 0 перпендикулярно к этой
плоскости.

N = { A, B, C }


M 0 ( x0 , y0 , z0 )

M 1 ( x1 , y1 , z1 )

Рис. 14.3

Задача 4.Найти проекцию точки M 1 ( x1 , y1 , z1 ) на прямую L

x − x0 y − y0 z − z0
= = .
m n p

Проекцией точки M 1 на прямую L в пространстве служит точка M 2 пересе-


чения прямой L и плоскости, проходящей через данную точку M 1 перпен-
дикулярно прямой L (см. рис. 14.4).

101
L

M1 
90 0 S = {m, n, p}
M2

Рис.14.4

Это подсказывает и путь решения задачи: искомая проекция M 2 находится


как точка пересечения плоскости (14.2) и прямой L .

Задача 5.Написать уравнение плоскости, проходящей через заданную точ-


ку M 0 ( x0 , y0 , z0 ) параллельно двум неколлинеарным векторам a = {a1 , a2 , a3}


и b = {b1 , b2 , b3} .








Рис. 14.5

Ясно, что в качестве нормального вектора к требуемой плоскости


можно взять векторное произведение данных векторов, т.е.
  
i j k
  
N = a × b = a1 a2 a3 = { A, B, C} .
b1 b2 b3

Тогда уравнение искомой плоскости имеет вид

A( x − x0 ) + B ( y − y0 ) + C ( z − z0 ) = 0 .

Эту же задачу можно решить и другим способом. Пусть M ( x, y, z ) –


  
произвольная точка требуемой плоскости. Тогда три вектора M 0 M , a, b –

102
компланарны, и уравнение плоскости получается из условия их компла-
нарности, а именно
x − x0 y − y0 z − z0
a1 a2 a3 = 0.
b1 b2 b3

Задача 6.Составить уравнение пучка плоскостей, проходящих через дан-


ную прямую. Пусть прямая L задана уравнениями

 A1 x + B1 y + C1 z + D1 = 0,

 A2 x + B2 y + C2 z + D2 = 0.

Уравнение пучка плоскостей будет иметь вид

( A1 x + B1 y + C1 z + D1 ) + λ ( A2 x + B2 y + C2 z + D2 ) = 0 , (14.3)

в котором λ – некоторый параметр. Действительно, если точка лежит на


данной прямой L , то её координаты обращают в ноль оба уравнения, кото-
рыми задана прямая, а, значит, удовлетворяют уравнению (14.3) при лю-
бом λ . Меняя значения λ , будем получать различные плоскости, прохо-
дящие через эту прямую.
Выберем, например, из этого пучка плоскость, перпендикулярную
данной плоскости П

A3 x + B3 y + C3 z + D3 = 0 . (14.4)

Рис. 14.9

Для этого представим уравнение пучка в виде

( A1 + λA2 ) x + ( B1 + λB2 ) y + (C1 + λC2 ) z + ( D1 + λD2 ) = 0 . (14.5)


103
Из перпендикулярности плоскостей (14.4) и (14.5) следует, что их нор-
мальные векторы взаимно перпендикулярны, т.е.

( A1 + λA2 ) A3 + ( B1 + λB2 ) B3 + ( C1 + λC2 ) C3 = 0 .


Отсюда находим значение λ , соответствующее искомой плоскости.

Задача 7.Написать уравнение плоскости, проходящей через заданную точ-


ку M 1 ( x1 , y1 , z1 ) и прямую.
Если прямая задана каноническими уравнениями

x − x0 y − y0 z − z0
L: = = ,
m n p

то задача сводится к предыдущей, если в качестве вектора 
b взять

на-
правляющий вектор прямой, а в качестве другого – вектор a = M 0 M 1 .



N

s = { m , n, p }

M0
M1

Рис. 14.6

Если же прямая задана как пересечение двух плоскостей

 A1 x + B1 y + C1 z + D1 = 0
 ,
 A2 x + B2 y + C2 z + D2 = 0

то естественнее воспользоваться уравнением пучка плоскостей «порож-


дённых» этой прямой

( A1 x + B1 y + C1 z + D1 ) + λ ( A2 x + B2 y + C2 z + D2 ) = 0 .
Неизвестное значение λ определяется из условия прохождения одной из
плоскостей этого пучка через данную точку (см.рис.14.7).

104
( A1 x1 + B1 y1 + C1 z1 + D1 ) + λ ( A2 x1 + B2 y1 + C2 z1 + D2 ) = 0.




П
П П

Рис. 14.7

Задача 8.Составить уравнение плоскости, проходящей через две па-


раллельные прямые

x − x0 y − y0 z − z0 x − x1 y − y1 z − z1
= = , = = .
m n p m n p




 , , 





Рис. 14.8

Эта задача также сводится к задаче об уравнении плоскости, прохо-


дящей через заданную точку M 0 параллельно двум неколлинеарным век-
торам a = M 0 M 1 и s = { m, n, p } .
 

105
Раздел 4. Математический анализ.
Дифференциальное исчисление

Лекция 15.Функция

Этот раздел математики изучает функциональные зависимости, кото-


рые в окружающем нас мире встречаются на каждом шагу: температура
как функция времени, давление как функция высоты и т.д. Так что же та-
кое функция в математическом смысле?

15.1. Функция и способы её задания. Пусть заданы два множества


X и Y произвольной природы. Допустим, что каждому элементу x неко-
торого подмножества D ⊆ X поставлен в соответствие определенный
элемент y ∈ Y . Это соответствие (отображение) называют функцией y от
x и обозначают y = f ( x) . За символом f «скрывается» конкретный вид
соответствия. Множество D называется областью определения функции,
а множество всех элементов y , которые соответствуют элементам множе-
ства D , называется областью значений этой функции. Будем называть x
аргументом функции, а y – значением функции.

f
X x1 Y
f y1
‫ ܦ‬x2
x3 y2
f

Рис. 15.1

Далее мы будем рассматривать числовые множества X и N . Приме-


ром функции служит зависимость y = x , где X и N – множества всех
действительных чисел, а область определения и область значения – все
неотрицательные числа. В этой функции соответствие f задано операцией
извлечения квадратного корня.
Если функция задана на множестве натуральных чисел, то такая
функция называется последовательностью и обозначается символом {an } ,
который указывает элемент an , соответствующий n . Например, функция
факториал an = n! = 1 ⋅ 2 ⋅ … ⋅ (n − 1) ⋅ n каждому натуральному числу n
ставит в соответствие число, равное произведению всех натуральных чисел
от 1 до n .

106
Последовательность кроме задания формулой своего общего члена an
может быть задана иначе. Например, указывается несколько её первых
членов, а остальные определяются этими заданными членами по тому или
иному правилу. Так определяются знаменитые числа Фибоначчи (назван-
ные в честь итальянского математика Леонардо Пизанского (1180–1240),
которого называли также Фибоначчи (Fibonacci – сокращённое filiusBonac-
ci, т.е. сын Боначчи)
1,1, 2, 3, 5, 8,13, 21,…
Первые два члена этой последовательности a1 = 1, a2 = 1 , а каждый сле-
дующий определяется как сумма двух предыдущих, т.е.

an + 2 = an +1 + an .

Функция может быть задана аналитически с помощью одной или не-


скольких формул, например,
 x2 , − ∞ < x ≤ 1
y= .
 2 − x , 1 < x < + ∞

Также может быть указан алгоритм, по которому для данного элемен-


та x находится соответствующий ему элемент y (например, E ( x) – «це-
лая часть числа x »: её значения легко находятся E (2) = 2 , E ( 2) = 1,
E (π) = 3 , хотя никакой формулой не задаются), или соответствие задано в
виде таблицы (например, меню в ресторане), или, наконец, функция может
быть задана графически. Под графиком функции в декартовой системе ко-
ординат понимается множество точек ( x, f ( x)) .

15.2. Обратная функция. Для данной функции введем понятие об-


ратной функции как такого соответствия f −1 из множества N в множе-
ство X , что в результате последовательного выполнения отображений f и
f −1 получим тождественное преобразование f −1 ( f ( x)) = x (см. рис. 15.2)

f
x
y
f −1

Рис. 15.2

107
Интуитивно ясно, что не любые функции имеют обратные, а только
те, у которых различным элементам x1 ≠ x2 соответствуют различные эле-
менты f ( x1 ) ≠ f ( x2 ) , т.е. не должно быть ситуации, показанной на рис.
15.1.Если функция не имеет обратной функции во всей области определе-
ния, то она может иметь обратную функцию на некотором подмножестве
области определения. Так, функция y = x 2 не имеет обратной во всей об-
ласти определения, но имеет обратную функцию x = y в области неотри-
цательных чисел (см. рис. 15.3).
y y = x2
x= y

y= x

y= x
x

Рис. 15.3

Ясно, что график обратной функции, у которой аргументом является


y , а значением – x , совпадает с графиком данной функции. Однако при
построении графика привычно считать аргументом x , а значением – y .

1.5
arcsinx
1

0.5
sinx
0

-0.5

-1

-1.5 arcsin(-1) = -pi/2

-2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

Рис.15.4

108
В этом случае график обратной функции окажется симметричным
графику исходной функции относительно прямой y = x . В качестве при-
мера рассмотрим функцию y = sin x , имеющую обратную на интервале
−π / 2 ≤ x ≤ π / 2 . Обратную к ней называют, как известно, функцию
y = arcsin x , ее график представлен на рис. 15.4.

15.3. Предел последовательности. Рассмотрим важное понятие пре-


дела функции и введем его сначала для функции натурального аргумента,
т.е. для последовательности.
Пределом последовательности { xn } называется конечное число a ,
если для любого сколь угодно малого числа ε > 0 существует такое нату-
ральное число N , что для всех членов последовательности с номерами
n > N выполняется неравенство xn − a < ε . В краткой символической за-
писи это выглядит так:

lim xn = a ⇔ (∀ε > 0) (∃N ) (∀n > N ) (| xn − a |< ε) .


n→∞

Обозначение предела ввёл И.Ньютон в 1686г. Символ lim является


сокращением латинского слова limes – граница, граничный камень.
Определим ε -окрестность точки a как множество всех x , удовле-
творяющих неравенству xn − a < ε , что эквивалентно двойному неравен-
ству (см. рис.15.5 )

a−ε< x<a+ε

x2 xn +1 xn x3 x1
a−ε a a+ε

Рис. 15. 5

Тогда понятие предела геометрически означает, что какую бы малую


ε -окрестность точки a мы не взяли, найдется такой номер N , начиная с
которого все последующие члены последовательности будут находиться в
этой окрестности (см. рис.15.5). Последовательность, имеющая конечный
предел, называется сходящейся или стремящейся к этому пределу, а не-
имеющая конечного предела –расходящейся.Часто «стремление» после-
довательности { xn } к своему пределу a мы будем обозначать более
краткой записью xn → a .

109
Заметим, что
lim xn = a ⇔ lim | xn − a |= 0 ,
n →∞ n →∞
т.е. последовательность модулей отклонения члена последовательности x n
от своего предела a стремится к нулю с увеличением номера n (модуль –
лат.modulus –мера).
Примером сходящейся последовательности служит xn = 1 / n . Дейст-
вительно, для любого ε > 0 имеем 1 n − 0 < ε , когда n > N = E( 1 / ε ) . Зна-
чит,
1
lim = 0 .
n→ ∞ n

Примером расходящейся последовательности служит последова-


тельность xn = (−1)n .
Выше было дано определение предела как некоторого числа, к кото-
рому сходится последовательность. Определим так называемые бесконеч-
ные пределы. Последовательность называется бесконечно большой, если
для любого сколь угодно большого числа M > 0 существует такое нату-
ральное число N , что для всех членов последовательности с номерами
n > N выполняется неравенство xn > M . В краткой символической запи-
си это выглядит так:

lim | xn |= + ∞ ⇔ (∀M > 0)(∃N ) (∀n > N ) (| xn |> M ) .


n→∞

Среди бесконечно больших последовательностей будем различать по-


следовательности, стремящиеся к бесконечности определённого знака.
Дадим в краткой символической форме определения таких последова-
тельностей:

lim xn = + ∞ ⇔ (∀M > 0)(∃N )(∀n > N ) ( xn > M ) ,


n→∞

lim xn = −∞ ⇔ (∀M > 0)(∃N ) (∀n > N )( xn < − M ) .


n→∞

Здесь для краткости употребляется тот же символ lim и слово «пре-


→∞
n→∞
дел», хотя следует всегда помнить, что символы + ∞ , − ∞ не являются чис-
лами, а введены лишь для упрощения записи.
Последовательность, стремящуюся к бесконечности, принято назы-
вать бесконечно большой, а последовательность, сходящуюся к нулю, –
бесконечно малой.

110
Лекция 16.Свойства пределов. Второй замечательный предел

16.1.Свойства сходящихся последовательностей. Определение пре-


дела последовательности не даёт способа его нахождения. Поэтому мы
сейчас изучим основные свойства сходящихся последовательностей, кото-
рые значительно упростят задачу нахождения пределов.

1. Если последовательность имеет предел, то он единственный.


Действительно, если предположить обратное, т.е. существуют два предела
a1 и a2 , и взять непересекающиеся ε -окрестности этих точек (см. рис.
16.1), то, начиная с некоторого номера, все члены последовательности
должны одновременно находиться в обеих ε -окрестностях, что невозмож-
но.
a1 a2

a1 − ε a1 + ε a2 − ε a2 + ε

Рис. 16.1

2. Сходящаяся к конечному пределу последовательность – огра-


ничена.Это следует из того, что начиная с некоторого N все последую-
щие члены последовательности лежат в ε -окрестности точки a , поэтому
| xn |< a + ε ∀n > N , а среди конечного числа первых N членов последова-
тельности, не входящих в эту окрестность, есть наиболее удалённый от
точки a . Пусть он находится от точки a на расстоянии M =| xk − a | . То-
гда все члены последовательности будут находиться в промежутке
[ a − M ; a + M ] (см. рис.16.2).
M M

xk x2 xN x n +1 xn x3 x1

a−ε a a+ε

Рис. 16.2

3. В неравенствах для членов двух сходящихся последователь-


ностей можно переходить к пределу, т.е.

lim xn = a, lim yn = b, xn ≤ yn ⇒ a ≤ b .
n→∞ n→∞

111
Допустим обратное, т.е. a > b (см. рис. 16.3). Рассмотрим непересе-
кающиеся ε -окрестности точек a и b , ε < (a − b) / 2 . Тогда, начиная с не-
которого номера N , члены последовательности xn будут находиться в
ε -окрестности точки a , а члены последовательности yn будут находиться
в ε -окрестности точки b , т.е.
xn − a < ε 
∀n > N :  ⇒ xn > yn ,
yn − b < ε 

что противоречит предположению xn ≤ yn .

yn xn

b−ε b b+ε a−ε a a+ε

Рис. 16.3

Заметим, что из строгого неравенства для членов последовательности сле-


дует, вообще говоря, нестрогое неравенство для их пределов: например,

1 3
xn = < yn = , но lim xn = lim yn
n n n→∞ n→∞

Следствие для трех последовательностей:

lim xn = a, lim yn = a, xn ≤ zn ≤ yn ⇒ lim zn = a .


n→∞ n→∞ n→∞
αn
Пример. Рассмотрим последовательность xn = , где α n n -я цифра
n
числа π в его десятичном представлении. Предел этой последовательности
равен нулю так как
0 αn 9
≤ ≤ ,
n n n

т.е. она заключена между двумя последовательностями, имеющими общий


предел равный нулю.

4. Предел суммы (разности) двух сходящихся к конечным пре-


делам последовательностей равен сумме (разности) их преде-
лов

lim( xn ± yn ) = a ± b.
n→∞

112
Действительно, поскольку lim xn = a , то для заданного ε 2 найдётся
n→∞

такой номер N1 последовательности xn , что ∀n > N1 ⇒ xn − a < ε 2 .


Аналогично для последовательности yn ∃N 2 : ∀n > N 2 ⇒ yn − b < ε 2 .
Тогда ∀n > N = max{N1 , N 2 } выполняется неравенство
ε ε
| ( xn + yn ) − (a + b) |=| ( xn − a) + ( yn − b) |≤| xn − a | + | yn − b |< + =ε,
2 2

что и доказывает указанное свойство. Здесь мы применили замечательное


неравенство
| x + y | ≤ | x | + | y |,

которое для любого числа слагаемых формулируется так: абсолютная ве-


личина суммы не превосходит суммы абсолютных величин слагае-
мых.
Докажем это неравенство для двух слагаемых. Сложив очевидные не-
равенства
− | x | ≤ x ≤| x |
,
− | y |≤ y ≤ | y |
получим
−(| x | + | y |) ≤ x + y ≤ | x | + | y | .

Это двойное неравенство эквивалентно доказываемому неравенству.

5. Предел произведения двух сходящихся к конечным пределам


последовательностей равен произведению их пределов

lim xn yn = ab .
n→∞

Это свойство следует из неравенств

| xn yn − ab |=| xn yn + xnb − xnb − ab |=| xn ( yn − b) + b( xn − a) |≤

ε ε
≤| xn | ⋅ | yn − b | + | b | ⋅ | xn − a |≤ M + | b | = ε1 .
2 2

6. Предел частного двух сходящихся к конечным пределам по-


следовательностей при условии, что предел делителя отличен
от нуля, равен частному их пределов

113
xn a
= ( b ≠ 0 ).
lim
n →∞ y b
n
Доказательство следует из следующей оценки разности

xn a x b − yn a x b − ab + ab − yn a
| − |=| n |=| n |≤
yn b byn byn
1 a
≤ (| xn − a | + | | ⋅ | yn − b |).
| yn | b

7. Неубывающая и ограниченная сверху последовательность


имеет предел(см. рис.16.4). Невозрастающая и ограниченная
снизу последовательность имеет предел.

0.8

0.6

0.4

0.2

0
0 1 2 3 4 5 6 7 8 9 10 11

Рис. 16.4

Это свойство будем считать интуитивно ясным и поэтому ограничим-


ся его геометрической иллюстрацией и простым примером. Например, по-
1
следовательность xn = 1 − n возрастает и ограничена сверху, значит
2
1
lim(1 − n ) = 1.
n→∞ 2

Произведение ограниченной последовательности на бесконечно


малую есть бесконечно малая последовательность.
Пусть последовательность xn ограничена, т.е. ∀n | xn |< M , а yn → 0 .
Тогда неравенство
0 ≤ | xn yn | ≤ M | yn |→ 0 ,

и следствие из свойства 3 всё и доказывают.

114
16.2. Второй замечательный предел. Применим понятие предела
последовательности для определения одного замечательного числа. Рас-
смотрим последовательность
n
 1
xn =  1 +  .
 n

Непосредственные вычисления нескольких первых членов последо-


вательности показывают их рост с увеличением номера:

x1 = 2; x2 = 2.25; x3 = 2.37; x4 = 2.44; x5 = 2.49; x6 = 2.52; …

Можно доказать, что xn –возрастающая последовательность и огра-


ничена сверху, например, xn < 3, ∀n . Согласно свойству 7 она имеет
предел при n → ∞ . Предел этой последовательности оказался числом ир-
рациональным, но настолько важным для математики и её приложений,
что получил собственное имя

e ≈ 2.718281828459045…
По традиции предел
n
 1
lim  1 +  = e (16.1)
n →∞
 n

называют вторым замечательным пределом. Из (16.1) следует, что

1
lim (1 + α n ) αn = e, (16.2)
n→∞
1
где α n – последовательность, стремящаяся к нулю ( α n = > 0 ).
n
Покажем одну из задач, в которой возникает столь необычный пре-
дел. Пусть в банк помещён вклад a0 и по нему выплачивается k % в год.
Через год величина вклада с учетом начисленных процентов будет сле-
дующей:
k  k 
a1 = a0 + a0 = a0  1 + ,
100  100 
 k 
т.е. через один год каждая денежная единица возрастает в 1 +  раз,
 100 
поэтому через два года вклад примет вид
2
 k   k 
a2 = a1  1 +  = a0  1 +  ,
 100   100 

115
n
 k 
а через n лет an = a0  1 +  .
 100 
Это формула сложных процентов, её название сложилось историче-
ски, а в самой формуле нет ничего «сложного». Однако начисление про-
центов по этой формуле имеет определённые неудобства: начисление про-
центов по вкладу производится только в конце года. А если вкладчик по-
требует свой вклад через полгода или через месяц? Нужно чаще начислять
проценты. Так, если проценты начислять ежеквартально, то в конце года
величина вклада будет равна
4
 k 1
a0  1 +  .
 100 4 

Было замечено, что в этом случае вклад растёт быстрее. Рассмотрим


упрощённый пример. Пусть начальный вклад равен 100 р. при 100% го-
довых. Если процентные деньги прибавлять один раз в конце года, то
вклад превратится в 200 р. Если это делать поквартально, то в конце пер-
вого квартала вклад будет равен 100(1+0.25)=125 р., через полгода
125(1.25)=156.25 р., а в конце года ≈ 244.14 p . А если начисление процен-
тов производить ещё чаще? Например, при ежедневном начислении про-
центов каждая денежная единица будет умножаться на величину
365
 1 
 1 + 365  ≈ 2.715 .
 

При непрерывном начислении процентов, т.е. при n → ∞ мы получаем

n
 1
lim  1 +  = e .
n →∞
 n

Таким образом, даже при таком «фантастическом» проценте(к =100%) в


конце года вклад увеличится приблизительно в 2.7 раза.

16.3. Раскрытие неопределённостей. Приведенные выше свойст-


ва пределов последовательностей позволяют находить предел, минуя об-
ращение к его определению. Однако на этом пути возникают трудности,
связанные с невозможностью непосредственного применения этих
свойств. Поясним на примерах. Пусть требуется найти предел отношения
двух последовательностей, сходящихся к бесконечности

xn
lim . (16.3)
n →∞ yn
116
Мы не можем непосредственно применить свойство о пределе частного
двух последовательностей. Предварительно необходимо преобразовать это
выражение к виду, допускающему применение указанных свойств. В связи
∞
с этим выражение типа (16.3) называется неопределенностью   , а его
∞
преобразование к виду, позволяющему найти предел, – раскрытием не-
определенности.
Заметим, что предел (16.3) может оказаться равным 0 (например, ко-
гда xn = n , yn = n 2 ), равным конечному числу (например, когда xn = n ,
yn = 7n ) и равным ∞ (например, когда xn = n3 , yn = 7n ), а также этот пре-
дел может вообще не существовать (например, когда xn = (−1) n n , yn = n ).
Самым распространенным приемом раскрытия неопределенности
∞
  ,когда числитель и знаменатель представляют собой комбинации сте-
∞
пенных функций, является деление того и другого на такую степень n ,
чтобы неопределенность исчезла. Например,

1
1+
n +1
2
n2 = 1 .
lim = lim
n→∞ 3n − 2 n →∞ 2 3
3−
n
0
Неопределенность   обозначает выражение типа (16.3), когда по-
0
следовательности в числителе и знаменателе стремятся к нулю.
Неопределенность ( ∞ − ∞ ) раскрывается, например, следующим об-
разом:
n +1− n
lim( n + 1 − n ) = lim = 0.
n →∞ n →∞ ( n +1 + n)

Неопределенность (0 ⋅ ∞) легко сводится к неопределённостям вида


0 ∞
  или   , так как произведение можно представить в виде частного
0 ∞
x y
xn ⋅ yn = n = n .
1 1
yn xn
Неопределенность (1 ) связана со вторым замечательным пределом,

она появляется, когда нужно найти предел выражения xn yn ,в котором по-


следовательность xn → 1 (но не тождественно равна 1!), а последователь-

117
ность yn стремится к ∞ . Приведем пример раскрытия такой неопределен-
ности:
2
 1 
4n
 1  
2n

lim  1 +  = lim  1 +   = e2 ,
n→∞
 2n  n →∞
 2n  

где применён предел (16.1).


( )
Заметим, что неопределенность 1∞ может быть сведена к неопреде-
ленности (∞ ⋅ 0) путем логарифмирования: сначала находим

a = limln( xn yn ) = lim( yn ln xn ) ,
n→∞ n→∞

∞
затем сводим неопределенность (0 ⋅ ∞) к неопределенности вида   или
∞
0
  , затем, раскрывая их, находим a , и, наконец, получаем
0

lim ( xn yn ) = ea .
n→∞

Неопределенности ( 0 ) и ( ∞ ) раскрывается также путем предвари-


0 0

тельного логарифмирования.

118
Лекция 17. Предел функции. Непрерывность

17.1. Предел функции. Понятие предела функции служит для иссле-


дования функции в окрестностях точек, в которых непосредственное вы-
числение значения функции вызывает трудности, а также при больших
значениях аргумента (в окрестности бесконечности).Интуитивно, предел
функции – это определенное число (или бесконечность), к которому неог-
раниченно приближается последовательность значений функции, когда
последовательность значений аргумента стремится к некоторому числу
или к бесконечности. Поэтому предел функции определим через уже изу-
ченное понятие предела последовательности.
Пределом функции y = f ( x) , когда x стремится к x0 , называется
число A , если для любой последовательности значений аргумента { xn } ,
сходящейся к x0 , последовательность соответствующих значений функции
yn = f ( xn ) стремится к A . Это определение как частный случай включает
в себя возможность каждому из чисел x0 и A быть бесконечностью.
Согласно определению для вычисления предела функции требуется
найти предел последовательности

lim f ( xn ) ,
n→ ∞

1
когда { xn } – любая последовательность, lim xn = 0 . Например, lim = ∞ ,
n→∞ x→ 0 x

1
т.к. lim = ∞ для любой последовательности xn такой, что lim xn = 0 .
n→∞ x n n→ ∞

Функция может быть не определена в точке x0 . Например,

x2 − 4
lim = lim( x + 2) = 4 .
x→ 2 x − 2 x→ 2

Если найдутся две последовательности xn (1) и xn (2) , обе стремящиеся


к x0 , такие, что соответствующие им последовательности f ( xn (1) ) и
f ( xn (2) ) сходятся к разным пределам (включая случай, когда один из них
не существует), то функция не имеет предела в данной точке. Например,
x
для функции y = (см. рис.17.1) не существует предела в точке x0 =0, т.к.
| x|
1 1
для стремящихся к нулю последовательностей xn(1) = и xn (2) = − полу-
n n
чим

119
1 1
lim (1)
= 1 , lim (2) = −1 .
n→ ∞ x n→ ∞ x
1 n

yn(1) y2(1) y1(1)


1

x1( 2) x1( 2) x n( 2)
0,5 1
−1 0,5
x n(1) x 2(1) x1(1)

−1
(2) (2) (2)
y 1
y 2 y n

Рис. 17.1

В последнем примере видно, что для любой положительной последо-


вательности xn > 0 , стремящейся к нулю, соответствующая последователь-
ность значений функции стремится к 1, а для любой отрицательной после-
довательности xn < 0 , стремящейся к нулю, соответствующая последова-
тельность значений функции сходится к -1. Это наводит на мысль опреде-
лить так называемые односторонние пределы функции, а именно предел
слева и предел справа.
Пределом функции y = f ( x) слева (справа) в точке x0 , называется
число A (число B ), если для любой последовательности значений аргу-
мента xn < x0 ( xn > x0 ) , сходящейся к x0 , последовательность соответст-
вующих значений функции yn = f ( xn ) стремится к A (к B ). Обозна-
чаются эти пределы так:

lim f ( x) = A , lim f ( x) = B .
x → x0 − 0 x→ x0 + 0

В соответствии с этим определением имеем

x x 1 1
lim = −1 , lim = 1 , lim = −∞ , lim = +∞ .
x →0 − 0 | x | x → 0+ 0 | x | x → 0− 0 x x → 0+ 0 x

Непосредственное вычисление пределов функций осуществляется на


основе свойств пределов последовательностей, подробно изложенных в
предыдущей лекции. В частности, предел суммы, разности, произведения,

120
частного двух функций равен сумме, разности, произведению, частному их
пределов (в случае частного предел знаменателя должен быть отличен от
нуля). Эти свойства используются для раскрытия неопределенностей при
нахождении предела функции аналогично тому, как это делалось при на-
хождении пределов последовательностей.

17.2. Первый замечательный предел. Продемонстрируем в качест-


ве примера нахождение так называемого первого замечательного преде-
ла
sin x
lim = 1.(17.1)
x →0 x
0
В данном случае мы имеем неопределенность вида . Поскольку
0
функция f ( x) = sin x – чётная и нас интересует её поведение при x → 0,
x
то значение аргумента x , измеряемое в радианах, будем считать положи-
тельным и малым. Рассмотрим часть дуги окружности AFC единичного
радиуса.

OA = OC = 1 A B
AD = sin x
DC = 1 − cos x F

O D C

Рис. 17.2

Площадь сегмента AFC меньше площади прямоугольника ABCD


,поэтому для них имеем неравенство:

0 < S AFC < S ABCD .(17.2)

Площадь сегмента найдём как разность площадей сектора OAFC и тре-


угольника OAC
1 1
S AFC = x − sin x > 0 .
2 2

121
Отсюда следует неравенство sin x < x ( x > 0 ). Полезно представить его
графическую иллюстрацию (см. рис. 17.3). Применим это неравенство для
оценки площади прямоугольника ABCD

x
2 x2 x3
S ABCD = sin x (1 − cos x) = 2sin sin x < 2 x =
2 4 2

1
y=x
0.8

0.6

0.4
y=sinx

0.2

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

Рис. 17.3

Тогда неравенство (17.2) примет вид

1 1 x3 sin x
0 < x − sin x < или 0 < 1− < x2 .
2 2 2 x

sin x
Когда x → 0 , то 1 − → 0 , а это и означает (17.1).
x

Второй замечательный предел, когда аргумент принимает вещест-


венные значения, имеет вид
x
 1
lim  1 +  = e .
x →+∞
 x

17.3. Непрерывность функции. Понятие предела функции позволяет


сформулировать такое важное свойство функции как ее непрерывность в
данной точке. Интуитивно ясно, что непрерывной зависимости соответст-
вует ситуация, когда «малое» изменение аргумента вызывает «малое» из-
менение значения функции. Геометрически это означает, что график этой
функции рисуется, не отрывая карандаша от бумаги, т.е. непрерывно. Ма-
тематически это понятие определяется следующим образом.
122
Функция f ( x) непрерывна в точке x0 , если эта точка вместе с неко-
торой ее окрестностью входит в область определения функции и

lim f ( x) = f ( x0 ) . (17.3)
x→ x0

Фактически условие (17.3) означает, что

lim f ( x) = f (lim x) ,
x→x0 x→x0

т.е. при нахождении предела непрерывной функции знак предела и знак


функции можно менять местами. Пример использования этого свойства
непрерывной функции рассмотрим в связи с отысканием следующего пре-
дела
−6 −6
3n  − 
n
 − 
n
 2  ( −2)  2  ( −2)  2
lim 1 −  = lim 1 +   =  lim  1 +   = e−6
n→∞
 n n →∞  n    
n →∞ n  
   

Здесь мы поменяли местами порядок взятия предела и вычисления функ-


ции и применили второй замечательный предел.
Условие (17.3) также может быть записано в эквивалентном виде

lim [ f ( x) − f ( x0 )] = 0 ,
x − x0 →0

означающее, что приращение непрерывной функции ∆f = f ( x) − f ( x0 )


стремится к нулю, когда приращение аргумента ∆x = x − x0 стремится к
нулю, т.е.
lim ∆ f = 0 .
∆x →0

Из определения следует, что для непрерывной в точке функции пре-


дел слева равен пределу справа и равен значению функции в этой точке

lim f ( x) = lim f ( x) = f ( x0 ) .(17.4)


x→ x0 −0 x → x0 +0

Если нарушается хотя бы одно из этих равенств и оба односторонних


предела существуют и конечны, то говорят, что в данной точке функция
имеет разрыв первого рода. В остальных случаях нарушения условий не-
прерывности, т.е. когда хотя бы один из односторонних пределов не суще-
ствует или равен бесконечности, у функции в этой точке разрыв второго

123
x
рода. Например, функция y = непрерывна во всех точках области оп-
| x|
ределения, а в точке x0 = 0 «терпит» разрыв первого рода.
Отметим так называемый устранимый разрыв, когда односторон-
ние пределы в точке конечны и равны, а в самой точке функция или не оп-
ределена или ее значение не совпадает с односторонними пределами. В
этом случае можно или доопределить или изменить значение функции в
этой точке так, чтобы ее значение было равно односторонним пределам
(17.4), тем самым получив непрерывную функцию. Например, функция
sin x
y= не определена в точке x0 = 0 . Учитывая первый замечательный
x
предел, доопределим её до непрерывной функции следующим образом:

 sin x
 , x≠0
y= x
 1, x = 0

Это непрерывная в точке x = 0 функция (см. рис. 17.4).


0

0.75

0.5

0.25
X

-9 -6 -3 0 3 6 9
-0.25

Рис. 17.4

17.4. Свойства непрерывных функций. Функция называется непре-


рывной в данном интервале, если она непрерывна во всех точках этого
интервала. Все элементарные функции непрерывны в областях их опреде-
ления. Соответствующие свойства предела функции позволяют утвер-
ждать, что сумма, произведение, частное (когда знаменатель не равен ну-
лю) непрерывных функций есть непрерывная функция.
Покажем, что сложная функция, представляющая собой суперпози-
цию непрерывных функций, является непрерывной. Пусть y = f (u ) и
u = ϕ( x) – непрерывные функции своих аргументов. Тогда

124
lim f (ϕ( x)) = f (lim ϕ( x)) = f (ϕ( x0 )) ,
x→ x0 x→ x0

т.е. сложная функция f (ϕ( x)) – непрерывна.


Очевидно также, что обратная к непрерывной функции тоже непре-
рывна (напомним, что графики взаимно обратных функций симметричны
относительно биссектрисы первого координатного угла).
Если непрерывная функция на концах замкнутого промежутка
принимает значения разных знаков, то внутри этого промежутка най-
дется, по крайней мере, одна точка, в которой функция обращается в
ноль (см. рис.17.5).

f (b) > 0
y = f ( x)
a

x1 x2 x3 b
f ( a) < 0

Рис.17.5

Это свойство применяется для поиска решения уравнения f ( x) = 0 в


заданном промежутке. Обычно задают допустимую погрешность ε , с ко-
торой этот корень нужно вычислить. Это значит, что нужно найти такой
промежуток [a, b] , содержащий корень ξ ( f ( ξ ) = 0 ), что его длина
b − a < ε .Предполагается, что вычисление значений функции f ( x ) про-
блемы не составляет. Рассмотрим метод поиска корня на примере уравне-
ния
f ( x) = x 3 − 3x 2 + 3 = 0 .

Функция f ( x) всюду непрерывна. То, что это уравнение имеет, по


крайней мере, один корень, видно из следующего представления этой
функции
3 3
f ( x) = x3 (1 − + 2 ) .
x x
При больших по абсолютной величине значениях x знак функции f ( x)
определяется первым из множителей. Поэтому при x → − ∞ , f ( x) < 0 , а
при x → + ∞ , f ( x) < 0 . Значит, график непрерывной функции, по крайней
мере, один раз пересечёт ось абсцисс. Сделаем попытку графического ре-
шения уравнения, представив его следующим образом: x 3 = 3( x 2 − 1) .

125
Видно, что в пределах чертежа обнаружились два корня, являющиеся
абсциссами точек пересечения графиков функций y = 3( x 2 − 1) и y = x 3 (см.
рис.17.6). Так как y = x 3 при x > 0 растет быстрее, чем y = 3( x 2 − 1) , то
графики этих функций пересекутся еще раз. Действительно, вычислив зна-
чения f (2) = −1 < 0 и f (3) = 3 > 0 , убеждаемся, что этот корень нахо-
дится в промежутке 2 < x < 3 .
5

4
2
y=3(x 2 -1)
3

1
-1<x<0.5
0

-1
1<x<1.5
-2
y=x3
-3

-4
-1.5 -1 -0.5 0 0.5 1 1.5 2

Рис.17.6

Вычислим с точностью до0,1корень уравнения из промежут-


ка[1;1,5].Воспользуемся так называемым методом деления пополам. Под-
считаем значения функции в «средней» точке этого промежутка
f (1,3) = 0,127 > 0 и на одном из его концов f (1,5) = −0,375 < 0 . Следова-
тельно, корень находится в промежутке1,3 < x < 1,5 .Снова находя значение
функции в средней точке f (1,4) = −0,136 < 0 , убеждаемся, что корень нахо-
дится в промежутке 1,3 < x < 1,4 . Таким образом, поставленная задача ре-
шена. В дальнейшем мы познакомимся с более совершенными методами
вычисления корней, где для достижения цели не требуется столь частого
вычисления значений функции.

y
M

x1 x2

m a b

Рис. 17.7

126
Непрерывная функция ограничена на замкнутом промежутке и
принимает свои наименьшее и наибольшее значения в этом проме-
жутке m = f ( x1 ) ≤ f ( x) ≤ f ( x2 ) = M .
Если функция определена на открытом промежутке, то она может
быть неограниченной в этом промежутке. Например, функция f ( x) = 1/ x
не ограничена в промежутке (0,1) . В открытом промежутке функция, бу-
дучи даже ограниченной, может не иметь ни наименьшего, ни наибольше-
го значений. Например, функция f ( x) = x в промежутке (0,1) (см. рис.
17.8 a ).
Если промежуток замкнут, но функция имеет разрыв в некоторой точ-
ке x0 , то функция может быть как неограниченной (в случае разрыва вто-
рого рода), так и может не иметь ни наименьшего, ни наибольшего значе-
ний в заданном замкнутом промежутке (см. рис. 17.8 b ).
y

1
f ( x) = x
a) b)
f ( x0 )

O 1 x a x0 b
Рис. 17.8

Если непрерывная функция положительна (отрицательна) в не-


которой точке, то существует окрестность этой точки, в которой
функция сохраняет знак.
На рис. 17.7 в точке x1 функция отрицательна и существует некото-
рая окрестность этой точки, в которой знак функции сохраняется. Для раз-
рывной функции, как это видно из следующего рисунка, это не так.

f ( x0 )
x0

Рис. 17.9

Значение функции в точке x0 положительно, но в любой малой окрестно-


сти этой точки функция принимает только отрицательные значения.
127
Лекция 18. Производная

18.1. Физический, геометрический и математический смысл про-


изводной. Одним из основных понятий математического анализа является
понятие производной функции. Прежде чем привести его математическое
определение, рассмотрим несколько задач, приводящих к этому понятию.
Первая задача связана с определением мгновенной скорости движу-
щейся точки. Пусть известен закон движения точки x (t ) , движущейся по
прямой O x . Если точка движется равномерно, т.е. за равные промежутки
времени она проходит одинаковые расстояния, то ее скорость равна

x(t ) − x(0)
v(t ) = = const .
t

Если точка движется неравномерно, то что мы будем понимать под скоро-


стью точки?
За промежуток времени [t , t + ∆t ] точка проходит расстояние
∆x = x(t + ∆t ) − x(t ) . Если величина ∆t достаточно мала, то можно считать,
что в этом промежутке точка движется равномерно и тогда приближенно
ее скорость равна
∆x
v (t ) ≈ .
∆t

Величина v(t ) тем ближе к скорости в момент времени t , чем меньше


∆t .Скоростью точки в момент времени t назовем предел этого отноше-
ния, когда длина интервала времени ∆t стремится к нулю, т.е.

x(t + ∆t ) − x(t )
v(t ) = lim .
∆t →0 ∆t

Вторая задача связана с понятием плотности массы тонкого неодно-


родного стержня. Пусть поперечное сечение стержня мало по сравнению с
его длиной. Тогда плотность массы ρ( x) этого стержня в точке с координа-
той x определим как предел отношения массы ∆ m = m( x + ∆ x) − m( x) части
стержня [ x, x + ∆ x] к ее длине x , т.е.

m ( x + ∆x ) − m ( x )
ρ ( x ) = lim .
∆x→0 ∆x

128
Третья задача связана с проведением касательной прямой к заданной
кривой.

y = f (x)
M ( x, y )

∆y
M0
∆x
α0 α(∆x)

Рис. 18.1

Под касательной к графику функции y = f ( x) в точке M 0 будем


понимать предельное положение секущей M 0 M , когда точка M движет-
ся вдоль кривой к точке M 0 или, другими словами, ∆ x → 0 (если это пре-
дельное положение существует). Нормалью назовем прямую, проходя-
щую через данную точку перпендикулярно касательной. Пусть касательная
образует с положительным направлением оси O x угол α 0 , а секущая –
α( ∆ x) . Тогда по определению
∆y
lim tg α(∆ x) = lim = tgα0 ,
∆ x →0 ∆ x→0 ∆ x

т.е. тангенс угла наклона касательной равен пределу отношения прираще-


ния функции к приращению аргумента.
Отвлечемся теперь от конкретных задач и для произвольной функции
y = f ( x) дадим аргументу x приращение x . Тогда функция получит при-
ращение ∆ y = f ( x + ∆ x) − f ( x) . Рассмотрим предел отношения прираще-
ния функции ∆ y к приращению аргумента x , когда приращение аргумен-
та стремится к нулю, т.е.
∆y
lim .
∆x →0 ∆ x

Если этот предел существует, то он называется производной функции


f ( x) в точке x и обозначается f ′( x) .Поскольку производная в точке x яв-
ляется функцией x , то, чтобы подчеркнуть этот факт, пользуются терми-

129
ном производная функция ( f ′( x) – производная функция функции f ( x) ,
кратко: f ′( x) – производная f ( x) ).
Согласно этому определению скорость движения точки есть произ-
водная пути по времени v (t ) = x′(t ) , плотность массы стержня – производ-
ная массы по координате ρ( x) = m′( x) , а тангенс угла α 0 между положи-
тельным направлением оси O x и касательной к графику функции в дан-
ной точке равен значению производной функции в этой точке f ′( x0 ) = tg α 0 .

18.2. Вычисление производных. Операция нахождения производной


функции называется дифференцированием. Функция, имеющая произ-
водную в данной точке, называется дифференцируемой в этой точке.
Пример недифференцируемой в точке x = 0 функции y = | x | приведен на
рис. 18.2

y = −x y=x

Рис. 18.2

Действительно, для этой функции имеем

∆y ∆y
lim =1 , lim = −1 ,
∆ x →+0 ∆ x ∆ x →−0 ∆ x

а, значит, предел этого отношения не существует когда ∆ x → 0 произ-


вольным образом.
Если производная в данной точке существует и конечна, т. е. отно-
шения ∆ y к ∆ x стремится к конечной величине, когда ∆ x → 0 , то от-
сюда следует, что ∆ y → 0 . Таким образом, дифференцируемая в данной
точке функция будет непрерывной в этой точке. Обратное утверждение не
верно, как показывает приведенный выше пример (см. рис. 18.2). В точке
x = 0 функция y = | x | непрерывна, но недифференцируема.
Итак, непрерывность функции в данной точке – необходимое условие
её дифференцируемости. Другими словами, если функция дифференци-
руема в данной точке, то она непрерывна в этой точке. Ввиду важности
этого утверждения приведём его формальное доказательство.
130
∆y ∆y
lim ∆y = lim ∆x = lim lim ∆x = f ′( x) ⋅ 0 = 0.
∆x→0 ∆ x →0 ∆x ∆ x →0 ∆x ∆ x→0

Как мы видим, из существования производной f ′( x) следует равенство


lim ∆y = 0 , означающее непрерывность функции в данной точке.
∆ x →0

Согласно определению теперь мы можем находить производные раз-


личных функций. Например,

( x + ∆ x) 2 − x 2 2 x∆ x + (∆ x) 2
( x )′ = lim
2
= lim = 2x ,
∆ x→0 ∆x ∆ x →0 ∆x

∆x ∆x
sin ( x + ∆x ) − sin x 2sin cos( x + )
(sin x)′ = lim = lim 2 2 = cos x .
∆ x →0 ∆x ∆ x →0 ∆x
2⋅
2

Здесь мы использовали первый замечательный предел и свойство непре-


рывности функции y = cos x , перейдя к пределу под знаком функции. Итак,
(sin x)′ = cos x .Следующую формулу (cos x)′ = − sin x получите самостоя-
тельно.
Несколько сложнее найти производную логарифмической функции

1
ln( x + ∆ x) − ln x  ∆ x ∆ x
(ln x)′ = lim = lim ln 1 +  =
∆ x→0 ∆x ∆ x →0
 x 

Применим второй замечательный предел в следующей форме



lim 1 α  

x x
1  ∆x ∆x 1  ∆ x ∆ x 1  1
 1
= lim ln 1 +  = ln( lim 1 +  ) = ln  lim (1 + α ) α
=
x ∆ x→0  x  x ∆ x→0  x  x  α→0  x

∆x
Здесь α = → 0 ,когда ∆x → 0 .
x

18.3. Уравнение касательной. Угол между кривыми. Исходя из


геометрического смысла производной, можно получить уравнение каса-
тельной к кривой в данной точке. Задача сводится к выбору из уравнения
131
пучка прямых y − y0 = k ( x − x0 ) конкретного значения углового коэффи-
циента k = f ′( x0 ) . Таким образом, уравнение касательной к графику
функции y = f ( x) в точке M 0 ( x0 , y0 ) имеет вид

y − y0 = f ′( x0 )( x − x0 ) ,
а уравнение нормали
1
y − y0 = − ( x − x0 ) .
f ′( x0 )

Под углом между кривыми в точке их пересечения естественно по-


нимать наименьший из углов между касательными к кривым в этой точке.
Тогда угол может быть вычислен как угол между двумя прямыми с задан-
ными угловыми коэффициентами по формуле

k2 − k1
tg ϕ = .
1 + k1k2

В качестве примера найдем, под каким углом пересекаются синусоида


и косинусоида. Задача сводится к нахождению значений производных
функций f1 ( x) = cos x и f 2 ( x ) = sin x при x = π / 4 (см. рис. 18.3).

y
y1 = cos x y2 = sin x
1
ϕ ≈ 700

x
π π
4 2

Рис. 18.3

Вычисляем угловые коэффициенты касательных к заданным кривым в


точке их пересечения

π 2 π 2
k1 = f1′ ( x) |x=π / 4 = − sin( ) = − , k2 = f 2′ ( x) |x =π / 4 = cos( ) = .
4 2 4 2
Отсюда
132
2 2+ 2 2
tg ϕ = = 2 2 ⇒ ϕ ≈ 700 .
1 − 0.5

18.4. Правила дифференцирования. Непосредственное нахождение


производных некоторых функций представляет собой трудоемкую задачу.
Поэтому выведем правила дифференцирования, которые значительно уп-
ростят ее.
Производная суммы конечного числа дифференцируемых функ-
ций равна сумме производных этих функций

(u ( x) + v( x ))′ = u′( x) + v′( x ) .

Действительно, приращение суммы равно

∆y = u ( x + ∆x) + v( x + ∆x) − u ( x) − v( x) = u ( x + ∆x) − u ( x) + v( x + ∆x) − v( x) ,

т.е. ∆ y = ∆u + ∆v .Следовательно,

∆y  ∆u ∆v   ∆u   ∆v 
y′ = lim = lim  +  = lim   + lim   = u′ + v′ ,
∆x →0 ∆x ∆x →0 ∆x ∆x  ∆x→0  ∆x  ∆x→0  ∆x 

так как предел суммы равен сумме пределов и последние пределы сущест-
вуют в силу предположения о дифференцируемости слагаемых.

Производная произведения двух дифференцируемых функций


равна сумме произведений каждой функции на производную другой
функции
(u ( x )v( x))′ = u ( x )v′( x) + v ( x )u′( x) . (18.1)

Действительно, дадим приращение аргументу ∆x . Тогда сомножите-


ли получат приращения ∆u и ∆v соответственно и приращение функции
равно
∆ y = ( u + ∆u )( v + ∆v ) − uv = u ⋅ ∆ v + v ⋅∆ u + ∆ u ⋅ ∆ v .

Следовательно,
∆y ∆u ∆v ∆u
y′ = lim = v lim + u lim + lim lim ∆v .
∆x →0 ∆x ∆x→0 ∆x ∆x →0 ∆x ∆x →0 ∆x ∆x →0

133
Так как функция v( x) – дифференцируемая, то она непрерывная, по-
этому последнее слагаемое в этой формуле равняется нулю и мы прихо-
дим к формуле (18.1).
В качестве следствия получим следующее правило: постоянный
множитель при дифференцировании выносится за знак производной

(cf ( x ))′ = cf ′( x ) .

Применим это правило для нахождения производной логарифмиче-


ской функции с произвольным основанием  0,   1

′  ln x ′ 1 1 1
( log a x ) =   = ( ln x )′ = ⋅ .
 ln a  ln a ln a x

Производная частного вычисляется по следующей формуле:

 u ′ u′v − v′u
  =
v v2
при условии, что знаменатель в данной точке не обращается в ноль. Дейст-
вительно, выразим приращение частного через приращения делимого и де-
лителя
u + ∆u u v ∆u − u ∆v
∆y = − = .
v + ∆v v v ( v + ∆v )

∆u ∆v
v lim − u lim
∆y ∆x → 0 ∆ x ∆x → 0 ∆ x u′v − v′u
Тогда lim = = .
∆x → 0 ∆ x lim v ( v + ∆v ) v2
∆x → 0

Найдём, например, производную функции y = tg x

 sin x ′ (sin x)′ cos x − (cos x)′ sin x sin x + cos x


2 2
1
(tg x)′ =   = 2
= 2
= 2
.
 cos x  cos ( x ) cos x cos x

Получите самостоятельно производную функции y = ctg x .

134
Лекция 19. Производная (продолжение)

19.1. Дифференцирование сложной и обратной функций. Часто


приходится находить производную так называемой сложной функции,
представляющей собой «функцию от функции». Например,
2
x 2 + 1, sin(2 x + 3), e− x
или в общем виде
y = f (ϕ( x)) = F ( x) .

Эта функция представлена как суперпозиция (композиция)двух функций

y = f (u ), u = u ( x) ,

где «внешняя» функция f (u ) – дифференцируемая функция промежуточ-


ной переменной u , а «внутренняя» функция u ( x) – дифференцируемая
функция независимой переменной x . Оказывается, что производная
сложной функции по независимой переменной равна произведению
производной функции по промежуточной переменной на производную
промежуточной переменной по независимой переменной

y′x = fu′(u ( x))u′( x) .

Это так называемое цепное правило доказывается следующим обра-


зом. Используя определение производной, получим

∆y ∆y ∆u
y′x = lim = lim ⋅ lim .
∆ x→0 ∆ x ∆ x →0 ∆ u ∆ x →0 ∆ x

В силу непрерывности функции u ( x) из условия ∆ x → 0 следует, что


∆ u → 0 . Отсюда вытекает указанная формула в предположении, что
∆u ≠ 0 .
Если же окажется, что ∆u = u( x + ∆x) − u( x) = 0 , т.е. u( x + ∆x) = u( x) то
∆y = f (u(x + ∆x)) − f (u(x)) = 0 . Значит, u′(x) = 0 и y′(x) = 0 и формула диф-
ференцирования сложной функции 0 = fu′(u ( x)) ⋅ 0 справедлива и в этом
случае. Далее, многие элементарные функции определены как обратные
функции к другим функциям, например, y = arcsin x , y = ln x .
Возникает вопрос: нельзя ли найти производную обратной функции,
зная производную исходной функции? Оказывается, можно. А именно, ес-
ли для функции y = f ( x) (например, для y = arcsin x ) существует обратная
135
функция x = ϕ( y ) ( x = sin y , −π / 2 ≤ y ≤ π / 2 ), которая в рассматриваемой
точке y имеет производную ϕ′( y ) ≠ 0 (в нашем примере, cos y ), то в со-
ответствующей точке x функция y = f ( x) имеет производную, вычисляе-
мую по правилу
1
f ′( x) = , (19.1)
ϕ′( y)

в котором y = f ( x) . В нашем примере

1 1 1 1
(arcsin x)′ = = = = ,
(sin y )′ cos y + 1 − sin 2 y 1 − x2

где знак « + » взят в силу того, что в промежутке −π / 2 ≤ y ≤ π / 2 , в кото-


ром обратная функция существует, cos y положителен.
Для доказательства формулы (19.1) продифференцируем равенство
x = ϕ( y ) по переменной x , применяя правило дифференцирования сложной
функции (считая y функцией x ):
1 = x y' ⋅ y x' ,
откуда следует
1
y′x = .
x′y

Геометрический смысл этой формулы виден из рис. 19.1

y x = ϕ ( y)
y
β y = f ( x)

α x
x
Рис. 19.1

Касательная к кривой y = f ( x) образует с положительным направле-


нием оси Ox угол α . Касательная к той же кривой x = ϕ( y ) образует
угол β с положительным направлением оси Oy . Согласно геометриче-
скому смыслу производной f ′( x) = tg α и ϕ′( y ) = tgβ . Но углы α и β

136
дополняют друг друга до π / 2 , поэтому tgα ⋅ tgβ = 1 . Это соотношение и
выражает формулу дифференцирования обратной функции.
Найдём производную показательной функции y = a x , a > 0 . Обрат-
ная для неё функция x = log a y . Применяя формулу (19.1)имеем

1 1
(a x )′ = = = y ln a = a x ln a
(log a y )′ 1 1
ln a y

Применяя это правило, найдите самостоятельно производные функций

arccos x , arctgx .

Применим формулу производной показательной функции


( a )′ = a ln a для вывода производной степенной функции
x x

1
( x α )′ = (eα ln x )′ = eα ln x α = αx α−1 .
x

19.2.Дифференцированиефункций, заданных параметрически. Ка-


сательная к параметрически заданной кривой. Получим теперь правило
нахождения производной параметрически заданной функции. Такая
функция, например, возникает в задаче о траектории фиксированной точки
M окружности радиуса r , катящейся без скольжения по оси Ox .

OP = ∪MP = r t
C
 r x = OP − NP = r t − r sin t
t
M K y = r − KC = r − r cos t
x

O N P
2π r

Рис. 19.2

Пусть в начальный момент точка M находится в начале координат. В


качестве параметра возьмем угол t , на который повернется радиус окруж-
ности O1O , приняв положение CM . Выразим координаты точки M ( x, y )
как функции параметра t . Из рисунка видно, что длина дуги MP равна

137
длине отрезка OP и равна rt . Следовательно, из треугольника MKC най-
дём

 x = r (t − sin t )
 0 ≤ t ≤ 2π .
 y = r (1 − cos t )

Выбранные границы изменения параметра соответствуют одному


обороту окружности. Таким образом, мы получили зависимость перемен-
ной y от переменной x , выраженную не явно, а через промежуточный па-
раметр t . График этой зависимости представлен на рис. 19.2, а кривая на-
зывается циклоидой. Название циклоида означает: «напоминающая о кру-
ге». Его дал Галилео Галилей (1564–1642).Конечно, можно связать x и
y непосредственно, исключив параметр t . Однако эта функция будет
иметь достаточно сложный вид, поэтому возникает необходимость в нахо-
ждении производной y как функции переменной x на основе параметри-
ческого задания функции.
Рассмотрим задачу в общем виде. Пусть функция y = f ( x) задана
параметрически
 x = ϕ (t )
 , α ≤ t ≤β,
 y = ψ (t )

где функции ϕ ( t ) и ψ ( t ) – дифференцируемы и функция ϕ ( t ) имеет об-


ратную. Тогда по определению производной имеем

∆y ∆y
lim lim
∆y ∆x→0 ∆t ∆t →0 ∆t ψ′t
y′x = lim = = = .
∆x → 0 ∆ x ∆x ∆x ϕ′t
lim lim
∆x → 0 ∆ t ∆t →0 ∆t

Здесь мы использовали то, что в силу непрерывности обратной функции к


ϕ ( t ) из ∆x → 0 следует ∆t → 0 .
Задача. Получить уравнение касательной к циклоиде. Пусть окруж-
ность радиуса r = 1 совершила одну шестую часть оборота. Найдем урав-
нение касательной в соответствующей точке траектории. Одна шестая
часть оборота окружности соответствует значению параметра t0 = π / 3 , а
координаты точки: x0 = x(t0 ) = (t − sin t ) t =π / 3 = π / 3 − 3 / 2 ,
y0 = y (t0 ) = 1 − cos t t =π / 3 = 0,5 . Производную y′x находим как производную
функции заданной параметрически

138
t t
sin t 2sin cos
y′x = = 2 2 = ctg t
1 − cos t 2sin 2
t 2
2
t π
В данной точке циклоиды она равна y′x = ctg 0 = ctg = 3 . Поэтому
2 6
уравнение касательной в этой точке y = 3x + 2 − π / 3 (см. рис.19.2).

2.5 y=sqrt3*x+2-pi/sqrt3

1.5

1 x = t - sint
y =1 - cost
0.5
0 < t < pi
X: 0.18
Y: 0.498
0

-0.5
-0.5 0 0.5 1 1.5 2 2.5 3 3.5

Рис. 19.3

19.3. Производная функции, заданной неявно. Касательная к не-


явно заданной кривой. Рассмотрим случай, когда функция задана неяв-
но. Пример такой функции y = f ( x) дается уравнением

x2 y 2
+ = 1 ( y > 0 ).
a2 b2

Графиком этой функции служит верхняя половина эллипса. Покажем, как


находить производную этой функции, не выражая явно y через x (для не-
которых неявно заданных функций такое вообще невозможно). Продиффе-
ренцируем это уравнением по переменной x , считая, что переменная y
является функцией x
1 1 b2 x
2 x + 2 yy ′ = 0  y ′ = −
a2 b2 a2 y

139
В общем случае неявно заданной функции нужно действовать анало-
гичным образом.
Задача. Получить уравнение касательной к эллипсу в точке M 0 ( x0 , y0 )
.Уравнение касательной
b 2 x0
y − y0 = − ( x − x0 )
a 2 y0

y0 x0 y0
после умножения на примет вид x + y = 1.
b2 a2 b2

x2 y 2
Для эллипса + = 1 в точке M 0 (3,1.6) уравнение касатель-
25 4
ной 3x + 10 y − 25 = 0 (см. рис.19.4).

3
X: 0
Y: 2.5
2.5

2
X: 3
Y: 1.6

1.5
3x
+1
1 0y
-2
5=
0
0.5 1/25x2 + 1/4y2 = 1

-0.5
-1 0 1 2 3 4 5 6 7 8 9

Рис. 19.4

19.4. Логарифмическое дифференцирование. Применим метод на-


хождения производной неявно заданной функции к выводу производной
показательно-степенной функции вида

y = u ( x)v ( x ) .

Прологарифмируем обе части этого равенства, опуская для краткости ар-


гумент
ln y = v ln u .

Найдем теперь y′( x ) как производную неявно заданной функции

140
1 1
y′ = v′ ln u + v u′
y u
и отсюда
1
y′ = u v (v′ ln u + v u′) = u v ln u v′ + vu v −1u′ .
u

Этот прием, называемый логарифмическим дифференцированием,


применим также для упрощения нахождения производных. Например,

( x + 1) x − 1 ,
2
1
y= ln y = 2ln ( x + 1) + ln ( x − 1) − 3ln ( x + 4 ) − x,
( x + 4) ex
3
2
1 2 1 3
y′ = + − − 1,
y x + 1 2 ( x − 1) x + 4
( x + 1) x − 1  2 + 1 − 3 − 1
2

y′ =  
( x + 4 ) e x  ( x + 1) 2 ( x − 1) x + 4 
3

19.5. Сводка формул производных и правил дифференцирования.


Сведём в одном месте формулы производных элементарных функций

′ ′
1
( x )′ = αx
α α−1 1
,   =− 2,
 x x
( x ) = 21x
′ ′
( sin x ) = cos x, ( cos x ) = − sin x

′ 1 ′ 1
( tgx ) = , ( ctgx ) =−
cos2 x sin 2 x

′ ′ 1
( a rc s in x ) =
1
, ( arccos x ) =− ,
1− x 2 1− x 2

′ ′ 1
( arctgx ) =
1
, ( arcctgx ) = − ,
1+ x 2 1 + x 2

′ 1 1 ′ 1
( log a x ) = ⋅ , ( ln x ) = ,
ln a x x

141
′ ′
(a ) x
= a x ln a , (e ) x
= ex ,

а также формулы, выражающие правила дифференцирования:

′ ′ ′
(u ± v) = u′ ± v′, (u ⋅ v) = u′v + v′u , (c ⋅ f ) = cf ′, c = const ,


 u  u′v − v′u  x = x(t ) yt′
[ f (u( x))]x = fu′u′x ,
'
  = ,  y′x = .
v v2  y = y (t ) xt′

19.6. Производные высших порядков. Выше речь шла о понятии


производной или первой производной функции. Производные высших по-
рядков определяются по индукции.
Производной n -го порядка называется производная от ( n − 1) -ой
производной. Так, вторая производная функции y = f ( x) равна

f ′′( x) = ( f ′( x ))′ .

Отметим физический смысл второй производной в случае, когда задан


закон изменения пути как функция времени, т.е. s = s(t ) . Тогда s′(t ) есть
скорость, а s′′(t ) – ускорение в момент времени t .
Если функция задана явно, то вычисление ее высших производных
сводится к повторному дифференцированию. Если функция y задана не-
явно F ( x, y ) = 0 , то для отыскания её n -ой производной нужно соответст-
вующее число раз продифференцировать определяющее ее уравнение,
помня, что y и все её производные есть функции независимой переменной
x . Например,
x
x 2 + y 2 = 1 ⇒ 2 x + 2 yy′ = 0 ⇒ y′ = − .
y
Дифференцируя второй раз, получим

1 + y ′2 x2 + y 2
2 + 2 y′ ⋅ y′ + 2 y ⋅ y′′ = 0 ⇒ y′′ = − =− .
y y3

 x = x (t )
В случае параметрического задания функции  ,α ≤ t ≤ β
 y = y (t )

142
y′(t )
первая производная равна y′x = .Для нахождения второй производной
x′(t )
продифференцируем это равенство по x , имея ввиду, что t есть функция
x
'
 y′ ( t )  1 yx − xy
ɺɺɺ ɺɺ
y = ( y′x )t ⋅ t = 
'
 ⋅ =
" '
,
xx x
 x ′ ( t ) t x ′(t ) x
ɺ 3

где точка сверху обозначает производную по t .


Например,
 x = a cos t b cos t b
 , yx' = = − ctg t ,
 y = b sin t −a sin t a

'
 b  1 b 1 b
y =  − ctg t  ⋅ =
''
⋅ = − .
t xɺ a sin t − a sin t
xx 2
 a a 2 sin 3 t

Аналогично можно найти производные более высоких порядков.

143
Лекция 20. Вектор-функция

20.1. Вектор-функция и её задание. К понятию вектор-функции


или векторной функции скалярного аргумента мы приходим, изучая пере-
менный вектор. С переменным вектором мы уже имели дело, когда запи-
сывали уравнение прямой в пространстве в векторной форме (см. рис. 20.1)

z
s = { m, n, p}

M
t ⋅s


s M0

r (t ) = { x (t ), y (t ), z (t )}

r0

y

Рис. 20.1

r (t ) = r0 + t s = ( x0 + t m)i + ( y0 + t n) j + ( z0 + t p ) k , − ∞ < t < +∞ .
    

Суть в том, что координаты радиус-вектора r (t ) есть некоторые функции



переменного t . Поэтому естественно следующее определение вектор-
функции: если каждому значению вещественного переменного t из неко-
торого промежутка по определённому закону поставлен в соответствие
вектор

r (t ) = x (t )i + y (t ) j + z (t ) k ,
  

то будем говорить, что в промежутке α ≤ t ≤ β задана вектор-функция


r (t ) .


Вектор r (t ) будем считать выходящим из начала координат, т.е. это




радиус-вектор. При этом конец вектора M ( x(t ), y(t ), z (t )) будет описывать


некоторую линию L(годограф), параметрические уравнения которой да-
ются формулами
 x = x(t ),

 y = y (t ), α ≤ t ≤ β
 z = z (t ),

144
Таким образом, задание вектор-функции эквивалентно заданию трёх ска-
лярных функций, являющихся координатами её радиус-вектора. Название
– годограф происходит от греческих слов hodos – путь и grapho – пишу.
Началом всех векторов для построения годографа может служить любая
фиксированная точка плоскости.

20.2. Предел, непрерывность и производная вектор-функции. По-


нятия предела, непрерывности и производной вектор-функции введём «по-
координатно»,а именно: вектор-функция

r (t ) = x(t )i + y (t ) j + z (t ) k
  

в некоторой точке t0 имеет предел, непрерывна, дифференцируема, если


соответственно имеют предел, непрерывны и дифференцируемы в этой
точке функции x(t ), y(t ), z (t ) . При этом полагают

lim r (t ) = lim x(t ) ⋅ i + lim y (t ) ⋅ j + lim x(t ) ⋅ k
  
t → t0 t → t0 t → t0 t → t0


dr dx d y  dz 
= i+ j+ k.
dt dt dt dt

Производной вектор-функции r (t ) в точке t0 называется предел



отношения приращения ∆r к приращению ∆t , когда последнее стремит-

ся к нулю. В математической символике это определение записывается из-
вестным образом:
∆r r (t0 + ∆t ) − r (t0 ) dr
   
r ′(t0 ) = lim = lim =

.
∆t → 0 ∆t ∆t → 0 ∆t dt

Геометрический смысл производной векторной функции скалярного


аргумента близок к геометрическому смыслу производной числовой функ-
ции. Будем предполагать, что годограф вектор-функции в точке

M 0 ( x0 , y0 , z0 ) = M 0 ( x (t0 ), y (t0 ), z (t0 ))

имеет касательную, определяемую как предельное положение секущей


M 0 M . Направление движения точки соответствующее возрастанию пара-
метра t обозначим на рисунке стрелкой (см. рис. 20.2). Рассмотрим два
случая, когда значение аргумента t0 получает как положительное, так и от-
рицательное приращение ∆t . Вектор ∆r = r (t0 + ∆t ) − r (t0 ) – это хорда
  

(греч. χορδη – струна). В случае положительного приращения ∆t > 0 он на-


145
правлен по секущей в сторону, соответствующую возрастанию аргумента
∆r

t0 , а в случае ∆t < 0 в противоположном направлении. Вектор же
∆t
будучи коллинеарным вектору ∆r в любом случае будет направлен вдоль

секущей в сторону, соответствующую возрастанию параметра t .Поскольку
секущая при ∆t → 0 примет положение касательной к годографу, то вектор

dr ∆r
 
= lim
dt ∆t →0 ∆t

будет касательным вектором к годографу в данной точке. Итак, производ-


ная вектор-функции в данной точке – это вектор касательный к её годо-
графу и направленный в сторону возрастания параметра.

 ∆
∆
 ∆ 
∆
   
∆
 ∆ (t 
   
∆
(t 
∆t)
 ∆  0
∆ 0 

Рис. 20.2

Пример. Годограф вектор-функции

r (t ) = (t − sin t ) ⋅ i + (1 − cos t ) ⋅ j
  

это циклоида, т.е. траектория фиксированной точки окружности единично-


го радиуса, катящейся по оси Ox без скольжения. Пусть t – время и ок-
ружность делает полный оборот за 2π секунд. Тогда вектор-функция

r (t ) = (t − sin t ) ⋅ i + (1 − cos t ) ⋅ j
  

задаёт не только траекторию движения точки, но и закон движения.


На рис.20.3 в точках траектории через каждые 2π /10 сек. построены
векторы скорости точки

146
r ′(t ) = (1 − cos t ) ⋅ i + sin t ⋅ j .
  

Самая большая скорость точки будет в момент времени t = π . Построен


также годограф скорости точки. В одной из точек построен вектор ускоре-
ния. Это вектор касательный к годографу скорости в соответствующей
точке.

2.5

1.5

0.5

-0.5

-1

-1.5
0 1 2 3 4 5 6

Рис.20.3

20.3. Уравнения касательной и нормальной плоскости к про-


странственной кривой. Пусть кривая L задана параметрическими уравне-
ниями

 x = x(t ),

 y = y (t ), α≤t ≤β
 z = z (t ),

и имеет в рассматриваемой точке M 0 ( x0 , y0 , z0 ) = M 0 ( x (t0 ), y (t0 ), z (t0 )) каса-


тельную. Это значит, что у вектор-функции

r (t ) = x (t )i + y (t ) j + z (t )k
  

существует производная в этой точке

 dr 

r ′(t0 ) =   = { x′(t0 ), y′(t0 ), z′(t0 )} .

 dt 0

147
Нормальной плоскостью к данной кривой L в точке M 0 называют
плоскость, проходящую через точку M 0 перпендикулярно касательной к
кривой в этой точке (см. рис. 20.4).
Пусть K ( X ,Y , Z ) – произвольная точка касательной к кривой L в
точке M 0 , а N (u, v, w) – точка нормальной плоскости к кривой в этой же
точке.
N (u, v, w)
r ′(t0 )


M0
M ( x, y , z )
K ( X ,Y , Z )

Рис.20.4

У нас есть все данные, чтобы написать уравнения касательной, например в


канонической форме
X − x0 Y − x0 Z − x0
= = .
x′(t0 ) y′(t0 ) z′(t0 )

Соответственно, уравнение нормальной плоскости будет иметь вид

x′(t0 )(u − x0 ) + y′(t0 )(v − x0 ) + z ′(t0 )( w − x0 ) = 0

Пример. Написать уравнения касательной к кривой

 x = cos t , π

 y = sin t , 0 ≤ t ≤ π в точке M 0 ( 0,1, )
 z = t / 2, 4

Точке M 0 соответствует значение параметра t0 = π / 2 . Для вектор-


функции

 t 
r (t ) = cost ⋅ i + sin t ⋅ j + k
 
2

148
 1
r′(t ) = − sin t ⋅ i + cos t ⋅ j + k ,
 
вычисляем касательный вектор
2

r ′(t0 ) = r ′( π / 2) = { − 1, 0, 0.5}
 

Записываем уравнения касательной в канонической форме

x − 0 y −1 z − π/ 4
= =
−1 0 0.5
 y = 1,
или в виде пересечения двух плоскостей  .
2 x + z − π = 0
Уравнение нормальной плоскости

−1( x − 0) + 0( y − 1) + 0.5( z − π / 4) = 0

или 8 x − 4 z + π = 0 (см.рис. 20.5)

Рис. 20.5

149
Лекция 21. Дифференциал

21.1. Дифференциал. Прежде, чем ввести понятие дифференциала,


рассмотрим следующую задачу: пусть скорость велосипедиста в данный
момент
10 м
v0 = 12 км = .
час 3 сек

Какое расстояние он проедет за следующие 30 секунд? Ответ, очевидно,


не однозначный:

1) если он продолжает двигаться с той же скоростью, то пройденный


путь
∆ S = v0 ⋅ ∆ t = 100 м ;

2) если он «ускорился» (или движется под гору), то расстояние

∆ S > 100 м ;

3) если устал (или движется в гору), то пройденное им расстояние

∆ S < 100 м .

Самый реальный прогноз (лучше иметь какую-то информацию, чем неоп-


ределённость)
∆ S = v0 ∆ t = S ′(t0 )∆t ,

причём этот прогноз тем точнее, чем меньше промежуток времени ∆ t


.Например, за время ∆ t = 3 cek. велосипедист проедет расстояние
∆ S = 10 м, и эта величина «почти» точная, даже если велосипедист созна-
тельно начнёт менять скорость своего движения.
Теперь рассмотрим математическую задачу. Пусть задана некоторая
функция y = f ( x) , и мы умеем вычислять её значение в точке x0 , т.е.
f ( x0 ) известно, а требуется найти её значение в точке x0 + ∆ x при за-
данном ∆ x . Допустим, что процедура «прямого» вычисления значения
функции f ( x0 + ∆ x ) нам недоступна. Например, нужно найти
arctg1.02 , зная значение arctg1 = π ≈ 0.7854 . Возникает естественное же-
4
лание: в равенстве

150
f ( x0 + ∆ x ) = f ( x0 ) + ∆ y
найти, хотя бы приближённо, приращение функции ∆ y . Оказывается, это
можно сделать, если данная функция дифференцируема в точке x0
.Действительно, в этом случае в точке ( x0 , f ( x0 )) существует касательная
к графику функции y = f ( x) . Тогда приращение функции ∆ y можно при-
ближённо заменить приращением ординаты касательной dy (см. рис. 21.1)

∆ y ≈ dy = f ′( x0 )∆ x

y = f ( x)

α( ∆ x )
∆y
dy

∆x

x0 x0 + ∆ x

Рис. 21.1

Таким образом, приращение функции ∆ y представлено в виде двух


слагаемых
∆ y = f ′( x0 )∆ x + α(∆ x) . (21.1)

Первое из них называют дифференциалом функции в данной точке и


обозначают символом
dy = f ′( x0 ) ∆x .

Ввиду важности этого понятия, только что определённого кратко с помо-


щью формулы (21.1), приведём его словесную формулировку, акценти-
рующую внимание на наиболее характерных свойствах дифференциала.
Дифференциалом функции в данной точке называется главная
часть приращения функции в этой точке, линейная относительно прира-
щения независимой переменной ∆x .
Второе слагаемое (заметим, что оно может быть любого знака) пред-
ставляет собой бесконечно малую величину более высокого порядка, чем
∆x .Напомним, что есть специальный символ α(∆x ) = o(∆x ) (читает-

151
ся: α равно o - малое от ∆x ).Действительно, сравнивая бесконечно малые
α(∆ x) = ∆ y − f ′( x0 )∆ x и ∆x , имеем

α ( ∆ x) ∆y 
lim = lim  − f ′( x0 )  = f ′( x0 ) − f ′( x0 ) = 0 .
∆x→ 0 ∆ x ∆x→ 0 ∆ x
 

Сравним теперь бесконечно малые ∆ y и dy

∆y  f ′( x0 )∆x + α(∆x)  1 α(∆x)


lim = lim   = 1+ lim =1
∆x →0 dy ∆x →0
 f ′ ( x0 ) ∆x  f ′ ( x0 ) ∆x →0 ∆x

Другими словами, обе бесконечно малые ∆ y и dy эквивалентны. В связи


с этим дифференциал называют главной частью приращения функции.
Убедимся на следующем примере, что дифференциал действительно
составляет «львиную» долю приращения функции. Площадь квадрата со
стороной x равна S ( x ) = x 2 . Вычислим приращение этой функции

∆ S = ( x + ∆ x)2 − x 2 = 2 x ⋅ ∆ x + (∆ x)2 .

α(∆x)

x
S=x 2

x ∆x

Рис. 21.2

Из рисунка видно, что первое слагаемое, представляющее собой диффе-


ренциал, равно площади двух прямоугольников, а второе равно площади
квадрата со стороной ∆ x .
Заменяя приращение функции дифференциалом, мы получаем уни-
версальную формулу для вычисления значения функции в точке близкой к
точке x0
f ( x0 + ∆x ) ≈ f ( x0 ) + f ′( x0 )∆ x .(21.2)

152
Применим её к поставленной выше задаче вычисления arctg 1.02

 1 
arctg (1 + 0.02) ≈ π +  ∆x = 0.7854 + 0.5 ⋅ 0.02 ≈ 0.79 .
4 1 + x2 
 0 

Отметим еще раз геометрическое содержание приближённого равен-


ства (21.2), переписав его в других обозначениях

y − y0 ≈ f ′( x0 )( x − x0 ) .

Отбрасывая в приращении функции бесконечно малую величину более


высокого порядка, чем ∆ x , мы заменяем кривую в окрестности точки x0
её касательной в этой точке, т.е. линеаризуем данную функцию, заменяя
её линейной функцией.
Заметим, что дифференциал независимой переменной равен её-
приращению, т.е.
d x = ∆x.

Пусть f ( x) = x , тогда d f ( x) = d x = f ′( x)∆ x = x′∆ x = ∆ x .

Таким образом, дифференциал функции вычисляется по формуле

d f ( x) = f ′( x)d x .

Отсюда получаем выражение производной через дифференциалы

dy
f ′( x) = .
dx

Отметим еще так называемое свойство инвариантности дифферен-


циала. Пусть сначала имеем функцию y = f (u ) , где u – независимая пере-
менная. Тогда по определению
dy = f ′(u )du .

В случае же, когда u = ϕ( x) , используя формулу производной сложной


функции, получим

dy = f ′(u )ϕ′( x)dx = f ′(u )du .

153
Таким образом, выражение для дифференциала не зависит от того, явля-
ется ли аргумент независимой или зависимой переменной.
Дифференциалы высших порядков определяются по индукции: диф-
ференциал n -го порядка равен дифференциалу от дифференциала (n − 1)
-го порядка
d n x = d ( d n −1 x ) .
Для n = 2 имеем
d 2 y = d ( dy ) =  f ′ ( x ) d x ′ d x = f ′′ ( x ) d x 2 .

( dx – единый символ, поэтому в равенстве ( dx ) 2 = dx 2 скобки опускают).


Отсюда получим
d2y
f ′′( x) = 2 .
dx

21.2. Правило Лопиталя. Франсуа маркиз де Лопиталь (1661-1704)


математик-любитель, ученик Иоганна Бернулли, автор первого печатного
учебника курса дифференциального исчисления.
Под «правилом Лопиталя» понимают один из способов вычисления
некоторых пределов. Пусть речь идёт о вычислении предела отношения

f ( x)
lim ,
x → x0 g ( x)
причём известно, что

lim f ( x) = f ( x0 ) = 0 , lim g ( x) = g ( x0 ) = 0 .
x → x0 x → x0

Предположим, что функции f ( x) и g ( x) имеют в точке x0 непрерыв-


ные производные и g ′( x0 ) ≠ 0 . Рассмотрим разности ∆ f и ∆ g , выделив
их главные части:

∆ f = f ( x) − f ( x0 ) = f ′( x0 )∆ x + α(∆ x) ,

∆ g = g ( x) − g ( x0 ) = g ′( x0 )∆ x + β(∆ x) ,

где ∆ x = x − x0 , а α и β бесконечно малые более высокого порядка,


чем ∆ x , т.е.
α ( ∆x ) β(∆x)
lim = 0 , lim =0 .
x → x0 ∆x x→ x0 ∆x

154
f ( x) f ( x) − f ( x0 )
Следовательно, lim = lim =
x → x0 g ( x) x→ x0 g ( x) − g ( x0 )

f ′( x0 )∆x + α(∆x ) f ′( x0 ) + α(∆x)


= lim = lim ∆x = f ′( x0 ) = lim f ′( x) .
g ′( x0 ) + β(∆x )
x → x0 g ′ ( x ) ∆x + β( ∆x ) x → x0 g ′( x0 ) ∆ x→0 g ′( x )
0
∆x

Последнее равенство следует из непрерывности производных (предел не-


прерывной функции в точке равен её значению в этой точке). Отсюда по-
0
лучаем правило Лопиталя для неопределённости вида  
0
f ( x) f ′( x)
lim = lim .
x→ x0 g ( x) x → x0 g ′( x)

Отметим, что это правило остаётся справедливым при x0 = ± ∞ и в случае


∞
неопределённости вида   .
∞
Если окажется, что f ′ ( x0 ) = g ′ ( x0 ) = 0 и вторые производные непре-
рывны, то правило Лопиталя можно применить к нахождению предела от-
ношения производных. Например,

e x − e− x − 2 x  0  e x + e− x − 2  0 
lim =   = lim = =
x →0 x − sin x  0  x→0 1 − cos x 0
e x − e− x  0  e x + e− x
= lim =   = lim =2
x →0 sin x
 0  x→0 cos x

Подчеркнем, что правило Лопиталя применимо только к раскрытию


0 ∞
неопределенностей вида   или   . Остальные виды неопределенно-
0 ∞
стей
[∞ − ∞] , [0 ⋅ ∞] , [1∞ ] , [00 ] , [∞ 0 ]

могут быть приведены к указанным выше.

155
Например,
1
ln x  ∞ 
lim x ln x = [0 ⋅ ∞ ] = lim 1 =   = lim x = 0 .
x →0 x →0
x  ∞  x →0 − 1
x2

Неопределенности последних трех видов сводятся к неопределенности


[0 ⋅ ∞] с помощью логарифмирования. Например, получим второй замеча-
x
 1
тельный предел lim 1 +  . Найдем предел логарифма этого выражения
x →∞
 x

 1 1
ln 1 + 
x  0 (1 + 1 x)  1 
lim  =   = lim − 2  =1 .
x→∞ 1  0  x→∞  − 1   x 
 2
x  x 
Следовательно, искомый предел равен

x
 1
lim  1 +  = e1 = e .
x→∞
 x

156
Лекция 22. Исследование функций и построение их графиков

В аналитическом выражении, которым чаще всего бывает задана


функция, содержится вся информация о её свойствах. График функции де-
лает эти свойства легко обозримыми. Поэтому нужно уметь строить гра-
фик функции по формуле, которой она задана. Самый простейший приём –
это построение «по точкам». Однако он требует большого объёма вычис-
лений и при этом могут быть потеряны характерные особенности иссле-
дуемой функции. Приёмы исследования, основанные на дифференциаль-
ном исчислении, позволяют именно эти особенности и уловить. Так, на-
пример, один факт существования производной функции в точке x0 даёт
возможность линеаризовать функцию в окрестности этой точки. Диффе-
ренцируемость функции, как мы выяснили ранее, равносильна представле-
нию её приращения в виде
∆y = f ′( x0 )∆x + α(∆x) ,

где α(∆ x) – бесконечно малая более высокого порядка, чем ∆ x . Заменяя


приращение функции ∆y дифференциалом dy = f ′( x0 ) ∆x , т.е. полагая

f ( x ) − f ( x0 ) ≈ f ′( x0 )( x − x0 ) ,

мы заменяем в окрестности точки x0 кривую y = f ( x) касательной к ней в


этой точке. Нельзя ли это приближённое равенство превратить в точное?
Такое равенство, выражающее приращение дифференцируемой функции
через приращение её аргумента, было получено Лагранжем (1736-1813гг).

22.1. Формула Лагранжа имеет вид

f ( x ) − f ( x0 ) = f ′(ξ)( x − x0 ) , x0 < ξ < x . (22.1)

За знак равенства в ней мы «заплатили» тем, что не знаем точного положе-


ния точки ξ . Эту формулу называют также формулой конечных прира-
щений.
Из (22.1) следует, что на интервале ( x0 , x ) существует точка ξ , в кото-
рой
f ( x) − f ( x0 )
f ′(ξ) = = tg α ,
x − x0

157
т.е. касательная в этой точке параллельна прямой AB (см. рис. 22.1). Из
рисунка видно, что ξ является абсциссой точки P , полученной переме-
щением прямой AB параллельно себе. Формулу конечных приращений
или формулу Лагранжа (22.1) мы будем неоднократно применять в даль-
нейшем.

B1

P
A1 B

f ( x ) − f ( x0 )

A α
x − x0

ξ x

Рис. 22.1

22.2. Признак монотонности функции. Применим формулу Лагран-


жа к исследованию поведения функции на некотором промежутке ( a , b ) .
Напомним, что функция называется возрастающей в этом промежутке,
если для любых значений x1 < x2 выполняется неравенство f ( x1 ) < f ( x2 ) .
Выясним, каков же признак того, что функция возрастает.
Пусть производная функции положительна во всех точках промежут-
ка ( a , b ) . Для произвольных x1 < x2 из этого промежутка применим фор-
мулу конечных приращений

f ( x2 ) − f ( x1 ) = f ′(ξ)( x2 − x1 ) , x1 < ξ < x2 .

Поскольку правая часть этого равенства положительна, то f ( x2 ) > f ( x1 ) ,


т.е. f ( x) – возрастающая функция. В предположении, что производная не-
отрицательна ( f ′( x ) ≥ 0) , получим, что функция – неубывающая в этом
промежутке, т.е. f ( x2 ) ≥ f ( x1 ) .
Аналогичным образом можно получить признаки убывающей и не-
возрастающей функций: f ′( x ) < 0 и f ′( x ) ≤ 0 .
Геометрически эти признаки означают, что в точках возрастания
функции касательная к кривой составляет острый угол с положительным

158
направлением оси абсцисс, а в точках убывания – тупой. В качестве при-
мера найдем промежутки возрастания и убывания функции
1
y= .
1 + x2

2x ≥ 0, x ≤ 0
Найдем производную y′ = − = 
(1 + x 2 )2 < 0, x > 0

Рис. 22.2

Следовательно, в промежутке (−∞,0) эта функция возрастает, а в проме-


жутке (0, ∞) – убывает.

22.3. Экстремумы. Под экстремумом функции в точке понимают её


максимальное или минимальное значение в некоторой окрестности этой
точки. Говорят, что точка x0 – точка максимума (минимума), если в неко-
торой ε − окрестности этой точки ( x − x0 < ε ) выполняется неравенство

f ( x ) ≤ f ( x0 ) , ( f ( x) ≥ f ( x0 ) ) .

Как находить экстремумы, зная аналитическое выражение функции?


Заметим, что точки экстремумов разделяют интервалы возрастания и убы-
вания функции (точки максимумов) и наоборот (точки минимумов). Исхо-
дя из приведенных выше условий монотонности функции, естественно
предположить, что в точках экстремумов производная функции обращает-
ся в ноль или не существует. Для дифференцируемых функций имеет ме-
сто следующее.
Необходимое условие экстремума. Пусть функция имеет конечную
производную в (a, b) и x0 – точка максимума (для определенности). То-
гда производная в этой точке равна нулю f ′( x0 ) = 0 , т.е. касательная в точ-

159
ке экстремума горизонтальна (такие точки иногда называют стационар-
ными).Действительно, по определению производной

f ( x0 + ∆ x) − f ( x0 )  ≥ 0, ∆ x < 0
f ′( x0 ) = lim = ⇒ f ′( x0 ) = 0 .
∆x → 0 ∆x  ≤ 0, ∆ x > 0

f ′( x0 ) = 0

f ( x0 ) f ( x0 + ∆x)

x0

Рис.22.3

Следующий пример показывает, что обратное утверждение не верно.


Так, для функции y = x 3 производная в начале координат равна нулю, ка-
сательная совпадает с осью абсцисс, но экстремума в этой точке нет.

y y = x3

Рис.22.4

Другие точки, в которых могут быть экстремумы, это точки, в кото-


рых производная либо не существует, либо обращается в бесконечность. В
совокупности со стационарными эти точки называют критическими. При-
меры критических точек такого рода дают функции y = x и y = 3
x2 .

160
2 2

1.5 1.5

1 1

0.5 0.5

0 0
-2 -1 0 1 2 -2 -1 0 1 2

Рис. 22.5

Необходимые условия позволяют выделить точки, «подозрительные»


на экстремум. Далее для каждой из них следует выяснить, есть ли экстре-
мум в данной точке и, если есть, то каков он. Для этого существует сле-
дующие условия.
Достаточные условия экстремума. Если при «переходе» слева на-
право через критическую точку производная меняет знак с плюса на ми-
нус, то в этой точке максимум, а если с минуса на плюс, то минимум. Для
дважды дифференцируемой функции это эквивалентно тому, что, если в
стационарной точке x0 вторая производная отрицательна f ′′( x0 ) < 0 , то это
точка максимума, а если вторая производная положительна f ′′( x0 ) > 0 , то
это точка минимума.
В самом деле, смена знака производной означает переход функции
от возрастания к убыванию или наоборот, что соответствует экстремуму.
Для дважды дифференцируемой функции смена знака производной, на-
пример, с плюса на минус при переходе через стационарную точку означа-
ет, что первая производная функции убывает в некоторой окрестности этой
точки. Следовательно, производная от первой производной, т.е. вторая
производная f ′′( x ) , должна быть отрицательной в этой окрестности, а зна-
чит и в самой точке, т.е. f ′′( x0 ) < 0 (см. рис.22.6).

f ( x) f ′( x ) x0
+
_
x0 f ′′( x0 ) < 0
x0
Рис. 22.6

161
Верно и обратное: если вторая производная отрицательна в точке x0 ,
то она, будучи непрерывной в этой точке, отрицательна в некоторой её
окрестности. Значит, существует окрестность точки x0 , где её производ-
ная, переходя через ноль ( f ′( x0 ) = 0 ), меняет знак с плюса на минус. Сле-
довательно, в точке x0 функция f ( x) имеет максимум. В тех случаях, ко-
гда вычисление второй производной проще, чем решение неравенства для
первой производной, второе условие предпочтительнее.
Пример. Найти экстремумы функции y = f ( x) = x3 − 3x + 1 .
Функция определена на всей числовой прямой. Её производная

f ′( x) = 3( x 2 − 1) = 3( x + 1)( x − 1)

всюду существует, поэтому абсциссы точек подозрительных на экстремум


это те значения переменной, при которых производная равна нулю, т. е.
x = −1 и x = 1 . Отметим на следующей схеме знаки производной в соот-
ветствующих интервалах

+ _
+
−1 1
Рис. 22.7

Отсюда видно, что в интервале (−∞, −1) функция возрастает, а в интервале


(−1,1) – убывает, следовательно, при x = −1 функция имеет максимум
ymax = f ( −1) = 3 . Соответственно ymin = f (1) = −1 . На основе этих данных-
можно построить график этой функции (см. рис. 22.8). «Попутно» мы вы-
яснили, что уравнение x3 − 3x + 1 = 0 имеет три корня

−2 < x1 < −1, 0 < x2 < 1, 1 < x3 < 2 .


4
X: -1
Y: 3
3

-1
X: 1
Y: -1
-2

-3

-4
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5

162
Рис. 22.8

Лекция 23. Исследование функций и построение их графиков


(продолжение)

23.1. Выпуклость. Понятие выпуклости – одно из важнейших поня-


тий всей математики. Мы ограничимся применением этого понятия к ис-
следованию выпуклости графика функции. Обратимся к рисунку.

y
f2 ( x)

f1 ( x)
x
ܽ ܾ
Рис. 23.1

Пусть в промежутке (a, b) заданы две дифференцируемые функции. Их


графики – это непрерывные кривые, имеющие в каждой точке касатель-
ную. Обе функции возрастают в этом промежутке. Но график одной из них
обращен «горбом» вниз, а у другой – в противоположную сторону. Это
свойство кривой называют выпуклостью. Как описать это свойство в ма-
тематических терминах?
В математике есть понятие выпуклой функции, применяемое к более
широкому классу функций, чем класс дифференцируемых функций. Мы
определим это понятие именно для дифференцируемых функций. Будем
называть функцию y = f ( x) выпуклой (вниз) в промежутке (a, b) , если её
график лежит выше касательной в любой точке из этого промежутка (см.
рис.23.2).
В противном случае функцию называют вогнутой (выпуклой вверх).
Аналитически это свойство выразится следующим неравенством

f ( x ) ≥ f ′( x0 )( x − x0 ) + f ( x0 ) ,

правая часть которого представляет собой значение ординаты касательной.

163
y
y = f ( x) R ( x) = y − Y ( x)

R( x) = y − Y ( x)

x0
x
a x b

Рис. 23.2

Условие выпуклости. Если функция y = f ( x) имеет в промежутке


( a, b) положительную вторую производную f ′′( x ) > 0 , то кривая
y = f ( x) выпукла (вниз).
Для обоснования возьмём любую точку x ∈ (a, b) и рассмотрим
функцию
R ( x ) = f ( x) − f ( x0 ) − f ′( x0 )( x − x0 ) .

Применим формулу Лагранжа к разности f ( x) − f ( x0 ) и получим

R ( x) = f ′(ξ)( x − x0 ) − f ′( x0 )( x − x0 ) = ( f ′(ξ) − f ′( x0 ))( x − x0 ) ,

где точка ξ расположена между точками x и x0 .К разности производ-


ных f ′(ξ) − f ′( x0 ) опять применим формулу Лагранжа

R ( x) = f ′′(η)(ξ − x0 )( x − x0 ) ,

причём точка η находится между точками ξ и x0 . Покажем, что произ-


ведение (ξ − x0 )( x − x0 ) положительно независимо от расположения точки
x по отношению к точке x0 . Пусть сначала точка x располагается левее
точки x0 (рис. 23.3). Тогда, очевидно, ξ − x0 < 0 и x − x0 < 0 .
ξ η

a x x0 b

Рис. 23.3

164
Если же точка x расположена правее точки x0 (рис. 23.4), то картина
будет следующей:
η ξ

a x0 x b

Рис. 23.4

В этом случае ξ − x0 > 0 и x = x0 > 0 . Таким образом,


(ξ − x0 )( x − x0 ) > 0 в любом случае и знак разности
R ( x ) = f ′′(η)(ξ − x0 )( x − x0 ) определяется только знаком второй производ-
ной, откуда и следует доказываемое утверждение.
Например, для функции y = arctg x имеем:

1 −2 x  > 0, x < 0
y′ = , y ′′ = , y ′′ 
1 + x2 (1 + x )  < 0, x > 0
2 2

Поэтому график этой функции обращён выпуклостью вниз при отрица-


тельных значениях аргумента и выпуклостью вверх при его положитель-
ных значениях.
2

-1

-2
-10 -8 -6 -4 -2 0 2 4 6 8 10

Рис. 23.5

23.2. Точки перегиба. Точки графика функции, в которых направле-


ние выпуклости меняется на противоположное, называют точками пере-
гиба. Например, у синусоиды это точки пересечения её графика с осью
абсцисс. Необходимым условием существования точки перегиба графика
дважды дифференцируемой функции является равенство нулю её второй
производной в некоторой точке, а достаточным – перемена знака второй

165
производной при «переходе» через эту точку. Найдем, например, точки
перегиба кривой
1
y= .
1 + x2
Для этой функции имеем
−2 x 3x 2 − 1
y′ = ′′
, y = .
(1 + x 2 )2 (1 + x 2 )3

Следовательно, точками перегиба могут быть только точки

 1 3
P1,2 =  ∓ , .
 3 4
При переходе через каждую из них вторая производная меняет знак, зна-
чит эти точки – точки перегиба (см. рис. 22.2).
При построении графиков полезно вычислить значение первой про-
изводной в точке перегиба, дающее направление касательной, относитель-
но которой происходит перегиб. В нашем примере y′( P1,2 ) ≈ ± 0,65 .Кроме
того заметим, что в точках перегиба вторая производная может и не суще-
ствовать, что видно на графике следующей функции

 1 2 1 
y = 3 x ,  y′ = > 0, y′′ = −  .
 3 3 x2 9 x 3 x2
 
1

0.5

-0.5

-1
-1 -0.5 0 0.5 1

Рис. 23.6

23.3. Асимптоты. Иногда кривая, имеющая бесконечную ветвь, при


удалении её точек в бесконечность «как бы выпрямляется» и приближается
к некоторой прямой. Эту прямую называют асимптотой кривой (греч.
166
asymptotos – несливающаяся). Если авторы этого термина подчеркивали
то, что кривая не сливается с прямой, то мы обращаем внимание на то, что
расстояние точки кривой ( x, f ( x)) до прямой – асимптоты стремится к
нулю при движении точки вдоль кривой к бесконечности. Пример кривой,
имеющей асимптоты, даёт график функции y = 1 x

M ( x, y )

d=x y =1 x

N ( x, y )
d=y

Рис. 23.7

Рассмотрим одну из ветвей этой кривой. Когда точка M ( x, y ) стре-


мится к бесконечности, то расстояние её до оси Oy , равное d = x , стре-
мится к нулю. Значит прямая x = 0 – вертикальная асимптота. Если
N ( x, y ) → ∞ , то d = y → 0 . Следовательно, прямая y = 0 –горизонтальная
асимптота. Как найти вертикальные асимптоты кривой, заданной урав-
нением y = f ( x)? Необходимым условием для этого является существова-
ние точек разрыва функции. Достаточным условием будет одно из сле-
дующих:
lim f ( x) = ± ∞ ,
x→ x0 ± 0

где x 0 точка разрыва.


Горизонтальные асимптоты кривых, определённых в бесконечном
промежутке, определяются существованием конечных пределов:

lim f ( x) = a , lim f ( x) = b .
x →+∞ x →−∞

В этом случае прямые y = a и y = b – горизонтальные асимптоты. На-


пример, график функции y = arctg x при x → + ∞ имеет асимптоту
y = π 2 , а при x → − ∞ асимптоту y = − π 2 (см. рис. 23.5).
Пусть кривая, заданная уравнением y = f ( x) , имеет наклонную
асимптоту y = k x + b . Как найти величины k и b ? Ограничимся рас-
смотрением случая, когда x → + ∞ .
167
y = f ( x)
N

α
d = MN cos α
M
α

x
Рис. 23.8

Заметим, что d = MN cos α , поэтому d и MN стремятся одновременно


к нулю при x → + ∞ , т.к. α = const . Значит, если кривая y = f ( x) имеет
асимптоту y = k x + b , то

lim MN = lim [ f ( x) − k x − b ] = 0 .(23.1)


x →+∞ x →+∞

Преобразуем это выражение к виду


 f ( x) b
lim x  − k −  = 0.
x →+∞
 x x

Для того чтобы произведение двух сомножителей, один из которых стре-


мится к бесконечности, стремилось к нулю, необходимо стремление к ну-
лю второго сомножителя, откуда имеем

f ( x)
k = lim . (23.2)
x→+∞ x

При найденном k из (23.1) получим

b = lim [ f ( x) − k x ] .(23.3)
x→+∞

Если при x → − ∞ также существует наклонная асимптота, то ее пара-


метры находятся по аналогичным формулам с заменой x → + ∞ на
x → − ∞ . Если один из пределов не существует или равен ∞ , то соответст-
вующей асимптоты нет. Например, функция y = x 2 не имеет асимптот. Или
другой пример: для функции y = x + ln x имеем

168
ln x
k = lim (1 + ) = 1 , b = lim ln x = +∞ ,
x→+∞ x x →+∞

т.е. у этой кривой нет наклонной асимптоты. Теперь приведем пример кри-
вой, имеющей наклонную асимптоту
x2 + 2x − 1
y= .
x
Для этой функции найдем

x2 + 2x − 1  x2 + 2x − 1 
k = lim 2
= 1 , b = lim  − x = 2
x→±∞ x x →±∞ x
 

и приведем графики функции и её наклонной асимптоты y = x + 2


Используя свойство асимптоты, найдем

x2 + 2x − 1
≈ ( x + 2) x=2012 = 2014.
x x = 2012

12
10
x2 + 2 x − 1
8 y=
x
6 y=x+2
4

-2

-4

-6

-8
-4 -3 -2 -1 0 1 2 3 4

Рис. 23.9

169
23.4.Примерный план исследования функции. Приведём краткий
перечень вопросов, на которые нужно ответить при исследовании функ-
ции.

1. Область определения. Чётность, нечётность, периодичность. Ис-


следование в окрестности точек разрыва (возможны вертикальные
асимптоты). Точки пересечения с осями, поведение на бесконечно-
сти (возможны горизонтальные асимптоты).
2. Экстремумы. Интервалы возрастания и убывания (различать
«гладкие» экстремумы и «остриё» или излом).
3. Точки перегиба, интервалы выпуклости (полезно вычислить произ-
водную в точке перегиба)
4. Наклонные асимптоты.

Заметим, что перечисленный порядок вопросов совсем не обязатель-


ный.

170
Лекция 24. Кривизна. Приближённое решение уравнений

24.1.Понятие кривизны. Одна и та же кривая в разных точках ис-


кривлена по-разному. Например, синусоида в точках пересечения с осью
абсцисс почти прямая, а в вершинах дуг наиболее искривлена. Более того,
на различных участках она искривлена в разном направлении. Нельзя ли
как-то определить кривизну в данной точке кривой? Оказывается можно.
Для этого определим сначала среднюю кривизну некоторого участка кри-
вой.
Пусть при перемещении точки по кривой из положения M 1 в поло-
жение M 2 касательный вектор повернётся на угол ∆α . Обозначим прой-
денное расстояние через ∆s . Ясно, что ∆α есть функция ∆s (см. рис.
24.1).

∆α

M2

∆s

M1 α

Рис. 24.1

Отношение
∆α
= kcp
∆s

назовём средней кривизной участка кривой ∆s .


Рассмотрим некоторые примеры. Перемещение точки вдоль прямой
на расстояние ∆s не меняет направления касательного вектора, т.е.
∆α = 0 . Таким образом, средняя кривизна любого участка прямой линии
равна нулю, что не противоречит здравому смыслу.
Пусть теперь точка «прошла» некоторую дугу ∆s окружности радиуса
R . Поскольку длина дуги окружности с центральным углом ∆α равна
∆s = R∆α , то средняя кривизна любой части окружности равна

171
∆α ∆α 1
kcp = = =
∆s R∆s R

∆α

∆s
O ∆α

Рис. 24.2

Естественно теперь ввести понятие кривизны в данной точке как


предел средней кривизны, когда длина участка ∆s стремится к нулю

∆α d α
k = lim = ,
∆s →0 ∆s ds

т.е. кривизна равна производной угла поворота касательного вектора по


длине кривой.

24.2. Вычисление кривизны плоской кривой. Для вывода форму-


лы кривизны кривой y = f ( x) продифференцируем по переменной s равен-
ство, выражающее геометрический смысл ее производной

α(s) = arctg y′x .

Пользуясь правилом дифференцирования сложной функции, получим

d α ds y′′
= .
ds dx 1 + y′2

dα y′′
Поскольку ds = 1 + y′2 dx , то k= = .
ds (1 + y′2 ) 3 2
Как показывает эта формула, для существования кривизны необходи-
мо, чтобы функция y = f ( x) была дважды дифференцируема. Кроме того,

172
эта формула показывает, что кривая имеет положительную кривизну для
выпуклых функций.
Пример. Найдем кривизну параболы y = x 2
2
k= 3
.
(1 + 4 x )
2 2

Из этой формулы видно, что при больших значениях x кривизна парабо-


лы близка к нулю, т.е. парабола «выпрямляется», а наибольшая кривизна
будет в начале координат и равна 2 .

24.3. Геометрический смысл кривизны. Назовем радиусом кривиз-


1
ны для кривой в заданной точке величину R = . Используя формулу кри-
k
1
визны k = для окружности радиуса R , дадим следующую геометриче-
R
скую интерпретацию радиуса кривизны произвольной кривой. Пусть кри-
визна в данной точке равна k . Через эту точку проведем окружность той
же кривизны с центром на нормали к кривой в этой точке. Радиус этой ок-
ружности R = 1/ k и принимается за радиус кривизны кривой в этой точке.
На следующем рисунке приведён график функции y = cos x и соот-
ветствующая окружность. Кривизна в любой точке вычисляется по форму-
ле
− cos x
k ( x) = 3
.
(1 + sin x )
2 2

1.2

0.8

0.6

0.4

0.2

0
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

Рис. 24.3

В начале координат k (0) = −1 . Кривизна отрицательна, так как кривая вы-


пукла вверх. Радиус окружности кривизны R = 1/ −1 = 1 . Центр окружно-
сти расположен в начале координат.
173
Свойство кривизны изменять своё значение вдоль кривой использует-
ся, например, при сопряжении прямолинейных участков железнодорожных
путей с закруглениями. Допустим, что прямолинейный участок примыкает
к участку, имеющему вид дуги окружности. Причем они в точке соедине-
ния имеют общую касательную, т. е. соединение гладкое. Но при движе-
нии поезда в этой точке мгновенно возникнет центробежная сила, создавая
резкий толчок, что нежелательно. Поэтому такие участки соединяют с по-
мощью некоторой переходной кривой. Вдоль неё кривизна постепенно на-
растает от нулевого значения до величины обратной радиусу закругления.
Аналогичная ситуация наблюдается при конструировании различного ро-
да зубчатых зацеплений.

24.4. Приближённое решение уравнений. Задача точного решения


уравнения f ( x) = 0 для произвольной функции, как правило, неразреши-
ма. Например, написав для уравнения x 2 − 2 = 0 формулу для одного из его
корней x1 = 2 , мы только указали математическую операцию, с помо-
щью которой этот корень можно вычислить. Поэтому возникает необхо-
димость приближённого вычисления корня данной функции. Обычно за-
дают допустимую погрешность ε , с которой этот корень нужно вычис-
лить. Это значит нужно найти такой промежуток [a, b] , содержащий ко-
рень ξ ( f (ξ ) = 0 ), что его длина b − a < ε .Предполагается, что вычисле-
ние значений функции f ( x) проблемы не составляет.
Рассмотрим несколько методов поиска корней на примере уравнения

f ( x) = x 3 + x − 1 = 0 .

Функция f ( x) всюду непрерывна. Вычислив f (0) = −1 < 0 и f (1) = 1 > 0 ,


убеждаемся, что в промежутке [ 0,1] есть, по крайней мере, один корень
нашего уравнения. Покажем, что других корней в этом промежутке нет.
Производная функции f ′( x) = 3x 2 + 1 > 0 положительна, поэтому график
функции один раз пересечёт ось Ox , переходя от отрицательного значения
к положительному значению. Иногда эту процедуру «отделения» корня
производят графически. Построим графики функций y1 = x3 и y2 = 1 − x .
Абсцисса точки их пересечения и есть искомый корень (см. рис. 24.4). В
нашем случае из рисунка видно, что корень расположен в промежутке
0,6 < ξ < 0,8 , т. е. мы ещё сузили промежуток, где находится корень. Далее
применим так называемый метод деления отрезка. Вычисляем значение
функции в средине отрезка f (0,7) = 0,343 − 0,300 = 0,043 > 0 и на одном

174
из его концов, например, f (0,6) = 0,36 ⋅ 0,6 − 0,4 = −0,184 < 0 . Следова-
тельно, корень находится в промежутке 0,6 < ξ < 0,7 , т. е. корень вычислен
с точностью до 0,1. Ясно, что эту процедуру уточнения значения корня
можно продолжить, но она требует слишком большого количества вычис-
лений.

1.4
y=x3
1.2

1
y=1-x
0.8

0.6

0.4

0.2

-0.2
0 0.2 0.4 0.6 0.8 1 1.2 1.4

Рис. 24.4

Познакомимся с методами, которые быстрее ведут к цели. Но для их


применения нужна дополнительная информация о поведении функции в
промежутке, на котором изолирован корень. Заметим, что вторая произ-
водная функции f ′′( x ) = 6 x > 0 положительна, следовательно, график функ-
ции в промежутке 0,6 < x < 0,7 имеет вид (см. рис. 24.5)
B
хорда
f (b) = 0.043
a = 0.6

b = 0.7
f ( x)
f (a) = −0.184
касательная

A
Рис. 24.5

175
Если провести хорду АВ , то точка a1 пересечения хорды с осью Ox даст
очередное приближение к искомому корню слева. Приближение справа
можно получить, найдя точку пересечения b1 касательной (проходящей
через точку В ) с осью Ox . Запишем уравнение хорды АВ как уравнение
прямой, проходящей через две точки

y − f (a) x−a
= ,
f (b) − f (a) b − a

которое в данном случае примет вид

y + 0,184 x − 0,6
= .
0,227 0,1

Отсюда при y = 0 получаем a1 ≈ 0,681 . Уравнение касательной в точке


В имеет вид
y − f (b) = f ′(b)( x − b)
или
y − 0,043 = 2,47( x − 0,7) .

Полагая y = 0 , получаем b1 ≈ 0,683 . Проверим, не «потеряли ли» мы ко-


рень, взяв приближенные значения a1 и b1 . Для этого подсчитаем значе-
ния функции в этих приближённых значениях

f (0,681) = −0,003… < 0, f (0,683) = 0,002… > 0 .

Значения функции на концах промежутка [0,681; 0,683] оказались разных


знаков. Значит, мы вычислили корень с точностью ε = 0,002 . Если же в
качестве приближённого значения корня взять среднее арифметическое
ξ = ( a1 + b1 ) / 2 = 0,682 , то корень будет вычислен с точностью ε = 0,001.

176
f′<0
f′>0
f ′′ > 0
f ′′ > 0

a b

a
b

f′<0
f′>0
f ′′ < 0
f ′′ < 0
a b

b a

Рис. 24.6

Эту процедуру уточнения корня методом хорд и касательных можно


продолжить, однако с методом касательных нужно быть внимательнее.
Построив касательную не в той точке промежутка, можно не приблизиться
к корню, а удалиться от него (см. рис 24.6). На рисунке хорды проведены
пунктирной линией. Анализ возможных ситуаций показывает, что каса-
тельную нужно проводить из той точки кривой y = f ( x) , в которой знак
функции совпадает со знаком второй производной.

177
Раздел 5. Аналитическая геометрия.
Кривые и поверхности второго порядка

Лекция 25. Линии второго порядка

До сих пор в аналитической геометрии мы изучали прямые и плоско-


сти, в уравнения которых переменные x , y и z входят в первой степени.
Сейчас переходим к рассмотрению кривых на плоскости, задаваемых бо-
лее сложными алгебраическими уравнениями, включающими вторые сте-
пени текущих координат x и y или их взаимное произведение.
Уравнение вида
Ax2 2Bxy Cy 2 2Dx 2Ey F 0 (25.1)

называется общим уравнением линии (кривой) второго порядка. В нѐм


коэффициенты A , B , C , D , E и F — любые действительные числа, для
которых A2 B2 C 2 0 , т.е. по крайней мере, одно из чисел A , B или
C отлично от нуля. Например, уравнение x2 + xy + y 2 - y - 5 = 0 отно-
сится к классу уравнений второго порядка и получается из общего вида
(25.1) при конкретном значении коэффициентов.
Простейшим примером кривой, задаваемой уравнением (25.1), являет-
ся окружность. Окружность определяется как множество точек плоскости,
равноудалѐнных от заданной точки (центра). Вводим на плоскости прямо-
угольную декартову систему координат, совместив еѐ начало с центром
окружности. Координаты произвольной точки M , лежащей на окружно-
сти, обозначим x и y . Эти координаты связаны между собой равенством
x2 + y 2 = R2 , которое и представляет собой уравнение окружности. Ему
удовлетворяют координаты каждой точки окружности и не удовлетворяют
координаты любой другой точки плоскости, не лежащей на ней. Видим,
что это уравнение является уравнением второго порядка.
К другим линиям, задаваемым уравнением (25.1), относятся эллипс,
гипербола и парабола. В некоторых случаях получаются пара пересекаю-
щихся или параллельных прямых, одна прямая или точка. Изучение этих
классических линий мы, как и для окружности, будем начинать с их опре-
деления. Дальше будем ставить задачу вывести уравнение, которому удов-
летворяют координаты точек в том и только том случае, когда точки лежат
на рассматриваемой линии. Для получения уравнения будем вводить сис-
тему координат, располагая еѐ по отношению к линии так, чтобы уравне-
ние в этой системе имело простейший вид, называемый каноническим
уравнением линии.

178
25.1. Эллипс. Эллипсом называется множество всех точек M плоско-
сти, сумма расстояний каждой из которых до двух данных точек F1 и F2
есть величина постоянная (еѐ принято обозначать 2a ). В этих обозначени-
ях можно коротко записать определение эллипса в виде равенства
MF1 MF2 2a . Точки F1 и F2 называются фокусами эллипса. Расстоя-
ние F1F2 между фокусами обозначают 2c .
Из определения непосредственно вытекает способ построения: если
концы нерастяжимой нити длины 2a закрепить в точках F1 и F2 , затем на-
тянуть нить остриѐм карандаша, то при движении острия оно будет вычер-
чивать выпуклую замкнутую линию (овал). Сумма расстояний от произ-
вольной точки M до двух фиксированных точек F1 и F2 не может быть
меньше расстояния между точками F1 и F2 : MF1 MF2 F1F2 . Будем
предполагать, что это неравенство строгое, т.е. 2a 2c или a c .
Выведем теперь уравнение эллипса. Для этого введѐм прямоугольную
декартову систему координат. В качестве оси абсцисс мы возьмѐм прямую,
проходящую через F1 и F2 , считая еѐ направленной от F1 к F2 , начало
системы координат поместим в середине отрезка F1F2 (рис. 25.1).

Рис. 25.1

В этой системе координат для произвольной точки M координаты


обозначим через x и y . Фокусы, оказавшись теперь на оси Ox симмет-
рично относительно начала, будут иметь координаты F1 c;0 и F2 c;0 .
Расстояния MF1 и MF2 между точками заменим их выражениями через ко-
ординаты. Получим

2 2
x c y2 x c y2 2a .

179
По существу, это соотношение представляет собой уравнение эллип-
са.Ему удовлетворяют координаты точек в том и только том случае, когда
точки лежат на эллипсе. Проведѐм алгебраические преобразования, упро-
щающие эту запись. Для этого уединим в уравнении первый радикал, воз-
ведѐм в квадрат обе части полученного равенства

2 2 2
x c y2 4a 2 4a x c y2 x c y2

2
и приведѐм его к виду a x c y2 a2 cx . Возведя в квадрат обе
части последнего равенства, найдѐм

a2 c2 x2 a2 y2 a2 a2 c2 .

Мы отмечали, что a c , значит a 2 c 2 0 , и можно ввести в рассмотрение


новую величину b a 2 c 2 (при этом b a ). Тогда уравнению можно
придать вид b2 x2 a2 y 2 a2b2 или
x2 y2
1. (25.2)
a2 b2

Это уравнение называется каноническим уравнением эллипса. Осо-


бенностью уравнения является то, что оно содержит x и y только в чѐт-
ных степенях, поэтому если точка x, y принадлежит эллипсу, то ему
принадлежат и точки x; y , x; y , x, y . Отсюда следует, что эллипс
симметричен относительно осей Ox и Oy , также относительно начала ко-
ординат. Оси симметрии эллипса называются его осями, а точка пересече-
ния осей – центром эллипса. Точки, в которых эллипс пересекает свои
оси, называются его вершинами. Положив y 0 в уравнении (25.2), най-
дѐм две вершины A1 a;0 и A2 a;0 на оси Ox . Положив x 0 , найдѐм
две точки пересечения эллипса с осью Oy : B1 0; b и B2 0; b (рис. 25.1).
Итак, эллипс имеет четыре вершины A1, A2 , B1, B2 , которые ограничивают
на осях отрезки A1 A2 2a и B1B2 2b (эти отрезки тоже принято называть
осями эллипса), а ОA1 a и ОB1 b называются соответственно большой
и малой полуосями эллипса.
Исследовав форму эллипса путѐм анализа его канонического уравне-
ния, можно теперь непосредственно построить в первой четверти график
b 2
функции y a x 2 и, отразив его симметрично относительно осей
a
координат, получить овальную замкнутую кривую, изображѐнную на ри-
180
сунке 25.1. Отметим, что при этом все точки эллипса лежат внутри прямо-
угольника, образованного прямыми x a , x a, y b, y b.
Введѐм ещѐ одну величину, характеризующую форму эллипса. Отно-
шение расстояния между фокусами эллипса к длине его большой оси на-
c
зывается эксцентриситетом эллипса: . Величина эксцентриситета
a
2
c2 a 2 b2 b
0 1 , так как a c 0 . Поскольку 2
1 , то
a2 a2 a
2
b b
1 , 1 2 . Видим, что эксцентриситет определяется соот-
a a
ношением осей эллипса. В случае 0 (если a b ) эллипс превращается в
окружность с уравнением x y a . Чем ближе эксцентриситет к едини-
2 2 2

b
це, тем меньше отношение и тем больше эллипс вытянут.
a

25.2. Гипербола. Множество всех точек M плоскости, разность рас-


стояний которых до двух данных точек F1 и F2 есть величина постоянная,
называется гиперболой. Указанная разность берѐтся по абсолютному зна-
чению и обозначается 2a . Точки F1 и F2 называются фокусами гипербо-
лы. Как и ранее, 2c F1F2 - расстояние между фокусами. Таким образом,
если точка M гиперболы находится ближе к фокусу F2 (рис. 25.2), выпол-
няется равенство MF1 MF2 2a , а если M находится ближе к фокусу F1 ,
то MF2 MF1 2a . Из рассмотрения суммы длин сторон треугольника
MF1F2 видим, что MF1 MF2 F1F2 и MF2 MF1 F1F2 . Поэтому, в зависи-
мости от расположения точки M по отношению к фокусам,
MF1 MF2 F1F2 или MF2 MF1 F1F2 . В наших обозначениях получаем
2a 2c или a c .
Для получения уравнения вводим систему координат так, чтобы фо-
кусы F1 и F2 лежали на оси Ox , а начало координат совпадало с серединой
отрезка F1F2 (рис. 25.2). В этой системе координаты произвольной точки
M обозначим x и y , а координаты фокусов будут соответственно:
F1 c;0 , F2 c;0 . Заменив расстояние MF1 и MF2 между точками их вы-
ражениями через координаты, получим

2 2
x c y2 x c y2 2a .

После преобразований, аналогичных тем, которые были проделаны


для уравнения эллипса, соотношение приобретает вид

181
2
xc a 2 a x c y2 .

Возведя в квадрат и упростив, получим c2 a2 x2 a2 y2 a2 c2 a2 .


Учитывая, что, в отличие от эллипса, для гиперболы a c , можно ввести
b 2 c 2 a 2 . Тогда уравнение примет вид b2 x2 a2 y 2 a2b2 или

x2 y2
1. (25.3)
a2 b2

Это уравнение называется каноническим уравнением гиперболы.


Так как уравнение (25.3) содержит x и y только в чѐтных степенях, то ги-
пербола симметрична относительно осей Ox и Oy , а также относительно
начала координат. Оси симметрии гиперболы называются еѐ осями, а точ-
ка пересечения осей – центром гиперболы. Положив y 0 в уравнении
(25.3), найдѐм две точки пересечения гиперболы с осью Ox : A1 a;0 ,
A2 a;0 , которые называются вершинами гиперболы. Если взять x 0 в
уравнении (25.3), то получим y 2 b2 . Следовательно, с осью Oy гипер-
бола не пересекается. Отрезок A1 A2 2a принято называть действитель-
ной осью гиперболы (а ОA1 a – действительной полуосью); отрезок
B1B2 2b , соединяющий точки B1 0; b и B2 0; b , называется мнимой
осью ( ОB1 b – мнимой полуосью). Прямоугольник со сторонами 2a и
2b называется основным прямоугольником гиперболы (рис. 25.3).
Из уравнения (25.3) следует, что если x a , то y не имеет действи-
тельных значений, то есть, нет точек гиперболы с абсциссами a x a .
x2
Должно выполняться условие 2 1 или x a . Это означает, что гипер-
a
бола состоит из двух частей: еѐ точки расположены справа от прямой
x a , образуя правую ветвь, и слева от прямой x a , образуя левую
ветвь. Наконец, из уравнения (25.3) видно, что с возрастанием x возрас-
x2 y 2
тает и y , так как разность 2 сохраняет постоянное значение. Тем
a b2
самым приходим к заключению: если y 0 , то точка M x, y при возрас-
тании x , начиная от x a , движется всѐ время «вправо» и «вверх»; если
y 0 , то M x, y движется «вправо» и «вниз». Так образуется неограни-
ченная правая ветвь. При x от значения x a получается левая не-
ограниченная ветвь гиперболы (рис. 25.2).

182
Рис. 25.2

Присмотримся более внимательно к тому, как именно точка M «ухо-


дит в бесконечность». В лекциях по математическому анализу было введе-
но понятие наклонной асимптоты графика функции. Из уравнения (25.3)
b 2
выразим переменную y x a 2 . Далее для полученных двух функ-
a
ций используем формулы нахождения коэффициентов уравнения y kx d
наклонной асимптоты при x

2
f x b a b
k lim lim 1 ;
x x x a x a

b 2 b
d lim f x kx lim x a2  x
x x a a

b x2 a2 x x2 a2 x b a2
lim lim 0.
ax x 2
a 2
x ax x 2
a 2
x
b
Следовательно, прямые y x являются наклонными асимптотами пра-
a
вой ветви гиперболы при x . Для левой ветви из соображений сим-
метрии при x получаются те же асимптоты.
Итак, построение гиперболы по каноническому уравнению (25.3) сле-
дует начинать с изображения основного прямоугольника, продолжая диа-

183
гонали которого мы получим асимптоты. Обе бесконечные ветви рисуем
неограниченно приближающимися к ним (рис. 25.2). Фокусы находятся на
расстоянии c a 2 b2 от начала координат.
Гипербола с равными полуосями a b называется равносторонней,
еѐ каноническое уравнение имеет вид x2 y 2 a2 . Основной прямоуголь-
ник равносторонней гиперболы становится квадратом; прямые y x и
y x являются асимптотами, перпендикулярными друг к другу.
Отношение расстояния между фокусами к расстоянию между верши-
нами гиперболы называется эксцентриситетом гиперболы и обозначается
c
буквой : . Для гиперболы 1 , так как c a . Поскольку
a
2 2
c2 a 2 b2 b b b
2
2 2
1 , то 1 , 2
1 . Следовательно,
a a a a a
как и для эллипса, эксцентриситет гиперболы определяется отношением еѐ
осей. Он характеризует форму основного прямоугольника гиперболы. Чем
b
меньше эксцентриситет, тем меньше отношение , то есть основной пря-
a
моугольник более вытянут в направлении действительной оси. Для равно-
сторонней гиперболы 2.

184
Лекция 26. Парабола.
Приведение кривых к каноническому виду

26.1. Парабола. Множество всех точек плоскости, равноудалѐнных от


данной точки F (фокуса) и данной прямой L (директрисы), называется
параболой. Расстояние от фокуса до директрисы параболы принято обо-
значать через p (рис. 26.1). Величину p называют фокальным парамет-
ром параболы.
Для получения уравнения параболы необходимо ввести систему коор-
динат на плоскости. Проведѐм ось абсцисс через фокус параболы перпен-
дикулярно директрисе, будем считать еѐ направленной от директрисы к
фокусу; начало координат расположим посередине между фокусом и ди-
ректрисой (рис. 26.1). Тогда координаты фокуса F p / 2;0 , а уравнение
p
директрисы в этой системе координат имеет вид x .
2

Рис. 26.1

Координаты произвольной точки M параболы обозначим x и y , за-


2
p
пишем расстояние MF x y 2 . Расстояние от точки M до ди-
2
ректрисы равно MQ , где Q – основание перпендикуляра, опущенного из
p
M на директрису. Поскольку Q имеет координаты ; y , то
2
p
MQ x . Тогда для параболы получаем
2
2
p p
x y2 x .
2 2

185
Возведя обе части равенства в квадрат получим каноническое уравнение
параболы
y 2 2 px . (26.1)

Как для эллипса и гиперболы, уравнение параболы тоже является ча-


стным случаем уравнения второго порядка. Оно получается из (25.1) при
A B D F 0.
Уравнение (26.1) содержит переменную y только в чѐтной степени,
что доказывает симметрию параболы относительно оси Ox . Так как p 0 ,
то переменная x должна быть неотрицательной. Это означает, что парабо-
ла расположена справа от оси Oy . Если x 0 , получаем y 0 . При возрас-
тании x возрастает и y (причѐм, если x , то y ). Построив в
первой четверти график функции y 2 px и отразив его симметрично
относительно оси Ox , получим геометрическое изображение параболы
(рис. 26.1). Ось симметрии параболы (в данном случае совпадающая с
осью Ox ) называется еѐ осью. Точка, в которой парабола пересекает свою
ось, называется еѐ вершиной (в нашем случае вершина совпадает с нача-
лом координат). Для описания геометрического смысла фокального пара-
метра p можно взять какое-либо значение абсциссы, например, x 1 . Из
уравнения (26.1) найдѐм соответствующие ему значения ординаты:
y 2 p . Это даѐт на параболе две точки M1 1; 2 p и M 2 1; 2 p , рас-
стояние между которыми равно 2 2 p . Тем самым, чем больше p , тем
больше расстояние M1M 2 . Следовательно, параметр p характеризует
«ширину» области, ограниченной параболой.
Кроме рассмотренных классических кривых, уравнение линии второ-
го порядка может привести ещѐ к нескольким геометрическим случаям,
называемым вырожденными.

26.2. Вырожденные случаи. Если в уравнении линии второго поряд-


ка
Ax2 2Bxy Cy 2 2Dx 2Ey F 0 (26.2)

коэффициенты B D E F 0 , то остаѐтся только два слагаемых, т.е.


Ax2 Cy 2 0 . При одинаковых знаках A и C уравнению соответствует на
плоскости одна точка – начало координат. При разных знаках A и C – па-
A
ра пересекающихся прямых y x.
C
Если в уравнении (26.2) остаются ненулевыми два других слагаемых,
например, оно имеет вид Cy2 F 0 , то возможны две ситуации: при

186
одинаковых знаках коэффициентов C и F решений нет, а при разных зна-
ках C и F получаются две параллельные прямые.
Если из уравнения (26.2) остаѐтся одно слагаемое Cy 2 0 или Ax2 0 ,
то на плоскости получается одна прямая. Если B D E 0 и в уравнении
Ax 2 Cy 2 F 0 коэффициенты A 0, С 0, F 0 , то опять ему не удовле-
творяют координаты ни одной точки плоскости.

26.3. Приведение уравнения линии второго порядка к канониче-


скому виду. Мы рассмотрели все геометрические ситуации, к которым
может привести общее уравнение линии второго порядка (п. 26.2). В зада-
чах аналитической геометрии обычно задаѐтся вид уравнения второго по-
рядка с конкретными числовыми коэффициентами. В нѐм могут присутст-
вовать произведение координат x и y (т.е. B 0 ) или переменные x и y
без квадратов ( D 0 или Е 0 ). Это будет означать, что в исходной сис-
теме координат уравнение не является каноническим. Нужно перейти к
другой системе координат, в которой уравнение будет иметь канонический
вид. Это даст возможность определить, к какому из рассмотренных случа-
ев относится заданное уравнение. После этого легко будет построить гра-
фик заданной кривой.
Для приведения уравнения линии второго порядка к каноническому
виду используются только те преобразования системы координат, которые
не изменяют расстояния между точками, то есть не деформируют кривую.
К таким преобразованиям, в частности, относятся параллельный перенос и
поворот осей координат. Этих преобразований достаточно для решения
поставленных в этой лекции задач. Разберѐм далее, что происходит с урав-
нениями при том или ином преобразовании координат.

26.4. Параллельный перенос осей координат. Рассмотрим на плос-


кости прямоугольную декартову систему координат xO y . Выберем начало
вспомогательной системы координат в точке O x0 ; y0  . Оси Ox и Oy 
расположим параллельно соответствующим осям O x и O y , одинаково с
ними направив. Масштаб сохраняем. Такой переход от системы xO y к
системе O xy  называется параллельным переносом осей координат.

187
Рис. 26.2

Для произвольной точки M координаты относительно исходных осей


обозначим через  x; y  , а координаты по отношению к «новым» осям обо-
значим  x; y  . Поскольку имеет место векторное равенство
OM  OO  OM (рис. 26.2), то можно записать в координатах


 x  x  x0

 (26.3)


 y  y   y0

Формулы (26.3) позволяют находить исходные координаты  x; y  по из-


вестным  x; y  при параллельном переносе. «Новые» координаты выра-
жаются через исходные следующим образом:


 x  x  x0

 , (26.4)


 y   y  y0

Пусть, например, исходное уравнение имеет вид

 x 1  4 y  2  25 .
2 2
x2  2 x  4 y 2 16 y  8 или

После выполнения параллельного переноса, задаваемого формулами



 x  x  1
 ,


 y   y  2
оно приобретѐт вид

188
x2 y2
1.
25 25/ 4

Видим, что в новых координатах получилось каноническое уравнение эл-


липса с полуосями a  5 и b 5/ 2 с центром в начале координат O  .

Рис. 26.3

Из формул (26.4) ясно, что точка O  в исходной системе имеет координа-


ты 1;2 . На рисунке 26.3 отражено построение, соответствующее такому
преобразованию.

26.5. Преобразование поворота системы координат. Повернѐм ис-


ходную систему координат xO y вокруг начала координат на угол  (по-
ложительным считается поворот против часовой стрелки) в положение
Oxy  (рис. 26.4).

Рис. 26.4

Пусть точка M имеет в исходной системе координаты  x; y  и коор-


динаты  x; y  в «новой» системе координат O x y  . Чтобы установить
связь между исходными и новыми координатами точки M , выполним до-

189
полнительные построения. Через A и B обозначим проекции точки M на
координатные оси O x и O y , а через D и C — проекции еѐ на оси O x  и
O y  (рис. 26.4). Из точки D опустим перпендикуляры на отрезок AM (ос-
нование перпендикуляра — точка F ) и ось O x (основание перпендикуля-
ра – точка D ). Тогда из геометрических соображений получаем, что

x  OA  OD   AD   OD   FD 
 OD cos   MD sin   x  cos   y  sin ,

y  AM  AF  FM  DD   MF 
 OD sin   MD cos   x  sin   y  cos .

Таким образом, формулы, выражающие исходные координаты  x; y 


произвольной точки M через еѐ новые координаты при повороте осей на
угол  , имеют вид


 x  x cos   y  sin 
 (26.5)


 y  x  sin   y  cos 

Исходная система xO y получается поворотом новой системы O x y 


на угол . Поэтому, если в равенствах (26.5) поменять местами исход-
ные и новые координаты, заменяя одновременно  на , то можно
выразить новые координаты точки M через еѐ исходные координаты



 x  x cos   y sin 
 .


 y    x sin   y cos 
x2 y 2
Рассмотрим, например, уравнение эллипса   1. Оно не яв-
2 4
ляется каноническим, поскольку в нѐм a b . Чтобы поменять оси местами,
выполним поворот на угол   900 и перейдѐм к системе координат Оxy 
(рис. 26.5). В формулы (26.5) подставим cos 0 и sin 1:


 x   y
 .


 y  x 

Теперь, действительно, получилось каноническое уравнение

x 2 y  2
 1.
4 2
190
Рис. 26.5

Аналогично рассмотренному примеру для приведения уравнения


2
y x2
2 2
1 к каноническому виду тоже выполним поворот на угол   900
b a
x2 y2
В новой системе координат уравнение приобретѐт вид 1. Оно
b2 a 2
определяет гиперболу, вершины и фокусы которой лежат на оси Oy . Эта
гипербола называется сопряжѐнной по отношению к гиперболе (25.3).
Они имеют одинаковые асимптоты (рис. 26.6).

Рис. 26.6
191
Для знакомого по школьной программе уравнения параболы y  x2
выполним тот же поворот на угол   900 (рис.26.7) и получим в новых
координатах каноническое уравнение x  y2 .

Рис. 26.7

Для приведения уравнения xy 3 к каноническому виду рассмотрим


2
поворот на угол   450 . Подставив в формулы (26.5) cos 450 sin 450
2
и проделав соответствующие преобразования, получим в новой системе ко-
x 2 y  2
ординат каноническое уравнение равносторонней гиперболы   1.
6 6
Еѐ асимптотами являются исходные оси координат O x и Oy (рис. 26.8).
Итак, преобразования поворота и (или) параллельного переноса осей
координат используются для того, чтобы уравнение (26.2) в новой системе
координат приобрело канонический вид. Проанализируем возникающие си-
туации. Для этого рассмотрим коэффициенты A и C при квадратах пере-
менных в канонических уравнениях основных линий и найдѐм их произве-
1 1
дение. Для канонического уравнения эллипса A , C , т.е. произве-
a2 b2
1 1
дение AC 0 ; для гиперболы A , C , т.е. AC 0 ; для параболы
a2 b2
A 0 , C 1 , т.е. AC 0 . Остальные виды канонических уравнений можно
распределить по типам таким образом, чтобы для каждого из уравнений
первого типа число AC было положительно, отрицательно для второго и
равно нулю для уравнений третьего типа.

192
Рис. 26.8

Тогда получаем классификацию:

I. Эллиптический тип
x2 y 2
1) 2  2  1 (эллипс),
a b
2
x y2
2) 2  2  0 (точка),
a b
2
x y2
3) 2  2  1 (пустое множество).
a b

II. Гиперболический тип


x2 y 2
4) 2  2  1 (гипербола),
a b
2
x y2
5) 2  2  0 (пара пересекающихся прямых).
a b

III. Параболический тип


6) y 2  2 px (парабола),
7) y 2  a2 (пара параллельных прямых),
8) y 2  0 (прямая),
9) y 2  a 2 (пустое множество).

193
Полученную классификацию можно использовать в любой задаче,
связанной с уравнением второго порядка – даже если, например, в нѐм
B 0 . Оказывается, по исходным коэффициентам уравнения (26.2), кото-
рые присутствуют в конкретной задаче, можно сразу определить, к какому
типу относится линия, задаваемая этим уравнением:
I. Если AC B2 0 , то уравнение задаѐт линию, относящуюся к
эллиптическому типу.
II. Если AC B2 0 , то уравнение задаѐт линию, относящуюся к
гиперболическому типу.
III. Если AC B2 0 , то уравнение задаѐт линию, относящуюся к
параболическому типу.

Например, уравнение xy 3 , в котором A C 0, 2B 1 , задаѐт ли-


1
нию гиперболического типа, так как в этом случае AC B 2 0.
4
Итак, мы проделали необходимую работу, чтобы полностью разо-
браться с построением линий во всех ситуациях, к которым приводит
уравнение второго порядка (26.2). Сначала определяем тип линии, зада-
ваемой уравнением. Далее приводим его к каноническому виду, выполняя
рассмотренные преобразования координат.

194
Лекция 27. Поверхности второго порядка

Переходим к изучению поверхностей в трехмерном пространстве. Бу-


дем рассматривать поверхности, задаваемые уравнениями, включающими
вторые степени текущих координат x , y и z или их взаимное произведе-
ние. Уравнение вида
Ax2 By 2 Cz 2 2Dxy 2Exz 2Fyz 2Gx 2Hy 2Kz L 0 , (27.1)

где коэффициенты A, B, C , D, E , F ,G , H , K и L — любые действительные


числа, но, по крайней мере, одно из чисел A, B или C отлично от нуля (т.е.
A2 B2 C 2 0 ), называется общим уравнением поверхности второго
порядка.
Также как и для кривых второго порядка, для поверхностей второго
порядка существует полная классификация. С помощью подходящего па-
раллельного переноса и поворота осей координат (теперь уже выполняе-
мых в пространстве) любое уравнение второго порядка может быть приве-
дено к одному из семнадцати видов. Этим уравнениям в пространстве от-
вечают классические поверхности: эллипсоид, однополостный и двуполо-
стный гиперболоиды, конус, эллиптический и гиперболический парабо-
лоиды, а также целая группа поверхностей, называемых цилиндрическими.

27.1. Цилиндрические поверхности. Поверхность, состоящая из па-


раллельных прямых (так называемых образующих), проходящих через
каждую точку заданной линии L (направляющей), называется цилинд-
рической поверхностью. Образно можно представить, что цилиндриче-
ские поверхности образуются движением прямой, которая перемещается в
пространстве вдоль кривой L , сохраняя постоянное направление (рис.
27.1).
В качестве направляющей цилиндрической поверхности рассмотрим
расположенную в плоскости xOy линию L , которая задаѐтся уравнением
F ( x, y ) 0 . Пусть M 0 ( x0 , y0 ,0) – произвольная точка направляющей (рис.
27.1). Тогда F ( x0 , y0 ) 0 . Если рассматривать цилиндрическую поверх-
ность, образующие которой параллельны координатной оси Oz , то уравне-
ние образующей, проходящей через точку M 0 ( x0 , y0 ,0) ,примет вид

x x0
.
y y0

Рассмотрим произвольную точку M ( x0 , y0 , z0 ) этой образующей. Еѐ


координаты удовлетворяют уравнению F ( x, y ) 0 при любом значении
переменной z . Точка M 0 ( x0 , y0 ,0) выбиралась произвольно, поэтому можно
195
утверждать, что координаты всех точек цилиндрической поверхности
удовлетворяют уравнению F ( x, y ) 0 .

Рис. 27.1

Ясно, что уравнение вида F ( x, z ) 0 задаѐт цилиндрическую поверх-


ность с образующими, параллельными оси Oy , а уравнение вида
F ( y, z ) 0 задаѐт цилиндрическую поверхность с образующими, парал-
лельными оси O x .

Рис. 27.2

Если направляющей цилиндрической поверхности является кривая


второго порядка, то поверхность называется цилиндрической поверхно-
стью второго порядка (или цилиндром второго порядка). В зависимости
от конкретного вида уравнения получаются различные типы цилиндров
второго порядка. Их названия соответствуют названиям направляющих
линий L .
196
x2 y 2
Например, уравнение 2 1 задаѐт в пространстве цилиндриче-
a b2
скую поверхность с образующими, параллельными оси Oz .Его направ-
ляющей является эллипс, а поверхность, задаваемая этим уравнением, на-
зывается эллиптическим цилиндром (рис. 27.2). Частным случаем эллип-
тического цилиндра является круговой цилиндр. Его уравнение в канони-
ческом виде имеет вид x2  y 2  R2 .
Уравнение вида x2 2 py определяет в пространстве параболиче-
ский цилиндр (рис. 27.2).
y 2 x2
Уравнение вида 2 1 определяет в пространстве гиперболиче-
b a2
ский цилиндр (рис. 27.3).

Рис. 27.3

27.2. Поверхности вращения образуются вращением какой-либо


плоской линии L (образующей) вокруг прямой (оси поверхности враще-
ния), расположенной в плоскости этой линии. Примером служит сфера: еѐ
можно рассмотреть как поверхность, образованную вращением полуок-
ружности вокруг еѐ диаметра. Покажем, как можно получить уравнение
поверхности вращения, исходя из уравнения образующей (лежащей в од-
ной из координатных плоскостей) и уравнения оси вращения (совпадаю-
щей с одной из координатных осей, расположенных в той же плоскости).
Будем вращать расположенный в плоскости yOz эллипс с уравнени-
y2 z2
ем 2 1 вокруг координатной оси Oz . Полученную поверхность
b c2
рассечѐм плоскостью, параллельной координатной плоскости xOy и про-
ходящей через фиксированную точку O (0, 0, z ) (рис. 27.4).

197
Рис. 27.4

Пусть M ( x, y, z ) – произвольная точка поверхности вращения, лежа-


щая в плоскости сечения. Рассмотрим в плоскости yOz точку поверхности
M (0, y , z) . Еѐ ордината по абсолютной величине равна радиусу окружно-
сти, на которой лежит точка M ( x, y, z ) , т.е. O M O M , поэтому
x2 y 2 y 2 . Находящаяся в плоскости yOz точка M (0, y , z) принадле-
жит и плоскости сечения, и исходному эллипсу. Это означает, что еѐ коор-
y2 z2
динаты удовлетворяют уравнению 1 .Подставляя в это уравне-
b2 c2
x2 y 2 z 2
ние выражение y через x и y , получим 1 . Это и есть иско-
b2 b2 c 2
мое уравнение поверхности вращения, называемой эллипсоидом враще-
ния.

Рис. 27.5

198
y2 z2
Если вращать эллипс 2 1 вокруг оси Oy , получится другой
b c2
x2 y 2 z 2
эллипсоид вращения (рис. 27.5) с уравнением 1.
с 2 b2 c 2
От этих примеров нетрудно перейти к алгоритму получения уравнения
поверхности вращения по уравнению исходной кривой, если осью враще-
ния служит одна из координатных осей. В уравнении кривой слагаемое с
переменной, наименование которой совпадает с наименованием оси вра-
щения, останется без изменения, а квадрат другой переменной заменяется
на сумму квадратов этой переменной и переменной, отсутствовавшей в
уравнении.

199
Лекция 28. Канонические уравнения поверхностей
второго порядка

Теперь перейдем к другим поверхностям второго порядка, определяе-


мым общим уравнением

Ax2 By 2 Cz 2 2Dxy 2Exz 2Fyz 2Gx 2Hy 2Kz L 0.

Каждая поверхность может быть построена по еѐ уравнению методом


сечений. Проследим, как образуются поверхности второго порядка, прояв-
ляясь постепенно по мере стыковки разных сечений.

28.1. Эллипсоиды. Начнѐм с уравнения эллипсоида

x2 y2 z2
1. (28.1)
a2 b2 c2

Уравнение сечения этой поверхности координатной плоскостью xOz по-


x2 z 2
лучается, если в исходном уравнении (28.1) принять y 0 : 1 . По
a2 c2
виду уравнения мы узнаѐм эллипс и можем изобразить его в соответст-
вующей плоскости (рис. 28.1).

Рис. 28.1

При x 0 из (28.1) получаем уравнение другого эллипса, распола-


гающегося в плоскости yOz и имеющего те же точки пересечения с осью
y2 z2
Oz , что и первый эллипс: 1. Рисунок дополняется эллипсом в
b2 c2
плоскости xOy (рис. 28.2).
200
Рис. 28.2

Рассмотрим произвольную плоскость z h (где h – любое число), па-


раллельную xOy . Сечение исходной поверхности (28.1) этой плоскостью
задаѐтся уравнением

x2 y2 h2 x2 y2
1 2 или 1.
a2 b2 c 2 h2 2h2
a (1 2 ) b (1 2 )
c c

То есть при всех h c в сечении эллипсоида(28.1) плоскостями z h по-


h2 h2
лучаются эллипсы с полуосями ah a 1 2 и bh b 1 2 . Если h c ,
c c
то ah a , bh b . При уменьшении h полуоси ah и bh увеличиваются, дос-
тигая наибольших значений ah a и bh b ,если h 0 . Таким образом,
«самый крупный» эллипс образуется в сечении координатной плоскостью
xOy . Аналогичная картина получается в сечениях поверхности (28.1)
плоскостями, параллельными координатным плоскостям xOz и yOz .
Отметим, что на плоскости нет точек, отвечающих условию z c .
Т.е. у поверхности, которую мы строим, нет пересечения с плоскостями
z h при h c , как и с плоскостями x h при h a или y h при
h b Сечение поверхности плоскостями z c или z c даѐт точку, так
.
x2 y2
как в уравнении при этом получается 2 0 . Общий вид поверхности
a b2
201
отражаем рисунком 28.2. Вполне естественно, что эта поверхность носит
название «эллипсоид» – по названиям сечений.
Эллипсоид обладает тремя взаимно перпендикулярными плоскостями
симметрии (при данном выборе осей они совпадают с координатными
плоскостями). Величины a , b и c называются полуосями эллипсоида. Ес-
ли две из трѐх полуосей одинаковы, то, эллипсоид становится эллипсоидом
вращения. Если a b c , то уравнение (28.1) определяет сферу.

28.2. Гиперболоиды. Рассмотрим уравнение однополостного гипер-


болоида
x2 y 2 z 2
1. (28.2)
a 2 b2 c 2

В сечениях координатными плоскостями xOz и yOz поверхности, опре-


деляемой этим уравнением, получаются гиперболы, а в сечениях, парал-
лельных координатной плоскости xOу – эллипсы. В целом поверхность
выглядит, как бесконечная трубка, расширяющаяся в обе стороны от гор-
лового эллипса (рис. 28.3).

Рис. 28.3

Однополостный гиперболоид обладает тремя плоскостями симметрии


(при данном выборе осей они совпадают с координатными плоскостями).
Величины a , b и c называются полуосями однополостного гиперболоида.
Если a b , то однополостный гиперболоид становится поверхностью
y2 z2
вращения и может быть получен вращением гиперболы 2 1вокруг
b c2
оси Oz , которую она не пересекает.

202
Однополостный гиперболоид обладает интересным геометрическим
свойством, которое можно обнаружить, если представить уравнение (28.2)
в виде
x2 z 2 y2
1 2
a2 c2 b
или, эквивалентно,
x z x z y y
1 1 . (28.3)
a c a c b b

Наряду с этим уравнением рассмотрим систему линейных уравнений

x z y
1 ,
a c b
(28.4)
x z y
1 .
a c b

В ней и - некоторые числа, не равные одновременно нулю. При


фиксированных значениях и уравнения (28.4) задают в пространстве
конкретную прямую как пересечение плоскостей. Меняя и , мы полу-
чаем бесконечную систему прямых. Если перемножить уравнения (28.4),
то получится уравнение (28.3) Это означает, что каждая из прямых лежит
целиком на однополостном гиперболоиде. Можно доказать, что через каж-
дую точку однополостного гиперболоида проходит прямая, определяемая
системой (28.4). То есть прямые (называемые прямолинейными образую-
щими однополостного гиперболоида) покрывают его поверхность цели-
ком. Поверхности, составленные из прямых, называют линейчатыми. Яс-
но, что конусы и цилиндры относятся к этому классу. Но для однополост-
ного гиперболоида геометрически такое свойство не очевидно. Тем не ме-
нее, как мы убедились, однополостный гиперболоид является линейчатой
поверхностью. Более того, он обладает двумя системами прямолинейных
образующих. В этом случае говорят, что поверхность является линейчатой
поверхностью второго порядка (рис. 28.3).
Вторую систему уравнений прямолинейных образующих однополост-
ного гиперболоида можно получить по аналогии с системой (28.4):

x z y
1 ,
a c b
x z y
1 .
a c b

203
Знаменитый русский инженер Владимир Григорьевич Шухов (1853 -
1939) использовал в строительной технике возможность образования од-
нополостного гиперболоида прямыми линиями. Ему принадлежит идея
создания металлических конструкций из балок, расположенных по прямо-
линейным образующим однополостного гиперболоида вращения. Эти кон-
струкции обладают большой жѐсткостью, прочностью и малым весом. Они
применяются для устройства водонапорных башен и высоких радиомачт.
В 1896 году на Всероссийской промышленной и художественной вы-
ставке в Нижнем Новгороде были выставлены сетчатые конструкции, из-
готовленные по проекту В.Г. Шухова: павильоны с висячими покрытиями
и павильоны с сетчатыми оболочками, а также гиперболоидная водона-
порная башня. Это было моментом рождения рациональной архитектуры,
использовавшей новаторские конструктивные формы. В Нижегородской
области сохранились подлинные сооружения В.Г. Шухова, являющиеся
памятниками инженерного искусства мирового уровня.
Рассмотрим далее уравнение двуполостного гиперболоида

x2 y2 z2
1. (28.5)
a2 b2 c2

В сечениях координатными плоскостями xOz и yOz поверхности,


определяемой этим уравнением, получаются гиперболы, пересекающиеся с
осью Oz . В сечениях z h , параллельных координатной плоскости xOу ,
при h c будут эллипсы.

Рис. 28.4

Но если рассмотреть сечение координатной плоскостью xOу , то по-


x2 y2
лучается уравнение 2 1, не имеющее решений. Это означает, что
a b2
204
поверхность не пересекается с координатной плоскостью xOу , также как
со всеми плоскостями z h при h c . Следовательно, она состоит из двух
отдельных «полостей», имеющих вид бесконечных выпуклых чаш (рис.
28.4).
Двуполостный гиперболоид обладает тремя плоскостями симметрии
(при данном выборе осей они совпадают с координатными плоскостями).
Величины a , b и c называются полуосями двуполостного гиперболоида.
Если a b , то двуполостный гиперболоид становится поверхностью вра-
z2 y2
щения и может быть получен вращением гиперболы 2 1 вокруг оси
c b2
Oz , которую она пересекает.
Можно получить двуполостный гиперболоид вращения с уравнением
2
x y2 z2 y2 z2
1 , если вращать гиперболу 1 вокруг оси Oy .
с2 b2 c 2 b2 c2

28.3. Конус. Рассмотрим уравнение конуса второго порядка

x2 y2 z2
0.
a2 b2 c2

В сечениях координатными плоскостями xOz и yOz поверхности,


определяемой этим уравнением, получаются пересекающиеся прямые, а в
сечениях, параллельных координатной плоскости xOу – эллипсы
(рис.28.5). Эта поверхность называется конусом.

Рис. 28.5

205
Если a b , то конус становится поверхностью вращения (в этом слу-
чае он называется круговым конусом) и может быть получен вращением
вокруг оси Oz прямой z
c . Если ту же прямую закрутить вокруг оси
y
b
x2 y 2 z 2
Oy , то получится круговой конус с уравнением 2 0.
c b2 c 2
Особенностью конуса является то, что любое его сечение плоскостью,
не проходящей через вершину, есть эллипс, гипербола или парабола (в за-
висимости от наклона секущей плоскости). Поэтому эти классические ли-
нии со времѐн Древней Греции называют коническими сечениями. Часто
встречаясь в явлениях природы и деятельности человека, эти линии приоб-
рели особое значение после открытия, сделанного из наблюдений
И.Кеплером в 1609 году и теоретически обоснованного И.Ньютоном в
1687 году: планеты и кометы Солнечной системы движутся по коническим
сечениям, в одном из фокусов которого находится Солнце.

28.4. Параболоиды. Рассмотрим уравнение эллиптического пара-


болоида
x2 y 2
2z ,
p q

где параметры p и q положительны. В сечениях координатными плос-


костями xOz и yOz поверхности, определяемой этим уравнением, полу-
чаются параболы, а в сечениях z h при h 0 –эллипсы (рис. 28.6).

Рис. 28.6
206
Эллиптический параболоид обладает двумя плоскостями симметрии
(при данном выборе осей они совпадают с координатными плоскостями
xOz и yOz ). При p q параболоид становится поверхностью вращения
(в этом случае он называется параболоидом вращения) и может быть полу-
чен вращением параболы вокруг своей оси.
Рассмотрим уравнение гиперболического параболоида

x2 y2
2z , (28.6)
p q

где параметры p и q положительны. В сечении координатной плоско-


стью xOz поверхности, определяемой этим уравнением, получается «вос-
ходящая» парабола с уравнением x2 2 pz . В сечении координатной плос-
костью yOz получается «нисходящая» парабола с уравнением y 2 2qz .
Аналогично, каждая плоскость y h пересекает поверхность по «восхо-
дящей» параболе, а каждая плоскость x h – по «нисходящей» параболе.
В сечениях, параллельных координатной плоскости xOy , получаются ги-
перболы. Гиперболический параболоид обладает двумя плоскостями сим-
метрии (при данном выборе осей они совпадают с координатными плоско-
стями xOz и yOz ) и имеет вид «седла» (рис. 28.7).
Поверхность гиперболического параболоида можно также получить
«механическим» образом. Пусть одна парабола z x2 расположена в
плоскости xOz , а другая парабола z y 2 – в перпендикулярной ей
плоскости yOz . «Заставим» теперь нижнюю параболу скользить верши-
ной по верхней параболе, перемещаясь параллельно плоскости yOz . Эта
скользящая парабола и образует гиперболический параболоид.

Рис. 28.7
207
Интересно, что гиперболический параболоид, как и однополостный
гиперболоид, является линейчатой поверхностью – его можно сформиро-
вать из прямых (рис. 28.8).

Рис. 28.8

Гиперболический параболоид с уравнением (28.6) имеет две системы


прямолинейных образующих, определяемых уравнениями

x z x y
2 z, 2 z,
p q p q
и
x z x z
. .
p q p q

208
Раздел 6. Математический анализ.
Интегральное исчисление

Лекция 29. Неопределенный интеграл

Наряду с задачей дифференцирования функции, в которой для задан-


ной функции f ( x) требуется найти ее производную f ′( x) , часто приходит-
ся решать обратную задачу, называемую интегрированием функции: для
заданной функции f ( x) найти такую функцию F ( x) , производная которой
совпадает с функцией f ( x) , т.е. F ′( x ) = f ( x ) . Например, предполагая, что
известно уравнение движения S = S (t ) , т.е. закон изменения пути с течени-
ем времени, можно найти скорость v(t ) = S ′(t ) . Если, напротив, задана ско-
рость как функция времени v = v(t ) , то возникает задача об определении
пройденного пути S в зависимости от времени, т.е. по функции v = v(t )
«восстановить» функцию S (t ) , для которой v = v(t ) является производной
S ′(t ) = v(t ) . В данной лекции рассмотрим решение этой обратной задачи.
Происхождение термина интегрирование связано с именем Я. Бернулли
(1654-1705). Вероятно, он произвёл термин от латинского integro – приво-
дить в прежнее состояние, восстанавливать.

29.1. Первообразная функция и неопределённый интеграл. Функ-


ция F ( x) называется первообразной функции f ( x) на промежутке ( a, b) ,
если для любого x ∈ ( a, b) выполняется равенство
dF ( x)
= f ( x) .
dx
К сожалению, это определение не даёт способа нахождения первооб-
разной F ( x) данной функции f ( x) . Однако для основных элементарных
функций эта задача разрешима, поскольку известны их производные. На-
пример, легко видеть, чтопервообразнойфункции f ( x) = cos x будет
функция F ( x ) = sin x ,так как (sin x)' = cos x . Но для функции f ( x) = cos x
есть и другие первообразные.Например, F ( x) = sin x + 1, F ( x) = sin x + 2 и,
вообще, F ( x) = sin x + C , где C – любое число.
Из этого примера следует, что одна и та же функция имеет множество
первообразных. Возникает вопрос – как найти всё это множество?
Покажем, что множество функций F ( x) + C , где F ( x) – некоторая

209
первообразная функции f ( x) , а C – произвольная постоянная, исчерпывает
все первообразныефункции f ( x) .
Теорема.Если F1 ( x) и F2 ( x) – двепервообразные функции f ( x) ,то
F1 ( x) = F2 ( x) + C , где C –некоторая постоянная.
Доказательство. Рассмотрим функцию ϕ( x) = F1 ( x ) − F2 ( x) . Так как
для любого x имеем

ϕ′( x) = F1′( x) − F2′( x) = f ( x) − f ( x) = 0 ,

то по формуле Лагранжа конечных приращений получаем, что ϕ( x) ≡ C , и,


следовательно, F1 ( x ) − F2 ( x) = C .
Таким образом, достаточно найти одну первообразную F ( x) данной
функции f ( x) , чтобы знать всё множество её первообразных { F ( x ) + C} .
Для обозначения рассматриваемой операции – нахождения функции F ( x)
из равенства
dF ( x) = f ( x) dx ,

был введён символ ∫ , применение которого к указанному равенству вос-


станавливает множество всех первообразных данной функции f ( x) (по-
добно тому, как знак обозначает операцию нахождения квадратного
корня). Для краткости совокупность всех первообразных функции f ( x) на-
зывается её неопределенным интегралом и обозначается так

∫ f ( x) dx = F ( x) + C ,
где C –некоторая постоянная. Операция нахождения неопределенного
интеграла называется интегрированием.При этом функция f ( x)
называетсяподынтегральной функцией, f ( x ) dx –подынтегральным
выражением,а знак ∫ – знаком интеграла.
Поставим вопрос: для всякой ли функции f ( x) существует первооб-
разная, а, следовательно, и неопределенный интеграл? Сформулируем без
доказательства достаточное условие интегрируемости: если функция
f ( x) непрерывна на интервале (a, b) ,то на этом множестве у функции f ( x)
существует первообразная, а, значит, и неопределённый интеграл. Ниже
будем говорить об интегралах непрерывных функций, которые заведомо
существуют.
210
Из определения неопределенного интеграла непосредственно следуют
формулы, подчёркивающие, что операции интегрирования и дифференци-
рования с точностью до постоянной взаимно обратные

( ) ( )
∫ f ( x)dx = f ( x ) , d ∫ f ( x ) dx = f ( x ) dx ,

∫ f ′( x)dx = f ( x) + C , ∫ df ( x) = f ( x) + C .
Это аналогично тому, как операции возведения в целую степень и извлече-
ние корня, проведённые последовательно друг за другом, оставляют без
изменения число, к которому они применялись

( n a ) n = a, n
a n = a, a > 0 .

Отметим два свойства, непосредственно вытекающие из соответст-


вующих правил дифференцирования: постоянный множитель можно
выносить за знак интеграла, т.е.

∫ k ⋅ f ( x) dx = k ⋅ ∫ f ( x)dx ( k = const ) ,
и неопределённый интеграл суммы или разности конечного числа функций
равен соответствующей сумме (разности) интегралов этих функций,т.е.

∫ ( f ( x) ± g ( x))dx = ∫ f ( x)dx ± ∫ g ( x)dx .


Для нахождения производной функции, полученной из основных эле-
ментарных функций с помощью алгебраических операций или суперпози-
ции, применялись таблица производных основных элементарных функций
и правила дифференцирования. Формально, таблица интегралов элемен-
тарных функций может быть получена, если переписать справа налево
таблицу производных. Однако для практического применения целесооб-
разнее привести таблицу интегралов в следующем виде:

x α+1 dx
∫ x dx = ∫ x = ln x + C
α
+C ( α ≠ −1) ,
α +1

ax
∫ a dx = ln a + C (a > 0, a ≠ 1) , ∫ e dx = e +C
x x x

211
∫ sin x dx = − cos x + C ∫ cos x dx = sin x + C
dx dx
∫ cos 2
x
= tgx + C ∫ sin 2
x
= −ctgx + C

dx x dx x π
∫ sin x = ln | tg 2 | +C ∫ cos x = ln | tg ( 2 + 4 ) | +C
dx 1 x dx
∫a 2
+x 2
= arctg + C ∫
a a 1 + x2
= arctg x + C

dx x dx
∫ a −x2 2
= arcsin
a
+C ∫ 1− x 2
= arcsin x + C

dx 1 a+x dx 1 1+ x
∫ a − x 2a a − x ∫ 1 − x 2 ln 1 − x + C
2 2
= ln + C 2
=

dx dx
∫ x2 ± a2
= ln x + x 2 ± a 2 + C ∫ x2 ± 1
= ln x + x 2 ± 1 + C

В некоторых формулах здесь стоят знаки абсолютных величин. Это


расширяет применение формул и на отрицательные значения выражений,
стоящих под знаком модуля. Проверим, например, формулу

dx
∫ x
= ln | x | +C .

При x > 0 она очевидна. Если x < 0 , то


1 1
(ln x + C )' = ( ln(− x ) ) =
'
(−1) = .
−x x

Умение находить первообразные элементарных функций, или, как


ещё говорят, умение «брать интегралы» – своего рода искусство. Суть ме-
тодов интегрирования сводится к преобразованию данного интеграла к
табличному виду.
dx
Например, найдем интеграл ∫ 2 . Согласно тождеству
sin x ⋅ cos 2 x
sin 2 x + cos 2 x = 1 получим
212
dx sin 2 x + cos 2 x  1 1 
∫ sin 2 x ⋅ cos2 x = ∫ sin 2 x ⋅ cos2 x dx = ∫  cos2 x + sin 2 x  dx =
dx dx
=∫
cos 2 x ∫ sin 2 x
+ = tg x − ctg x + C ,

где при вычислении интеграла суммы нескольких функций сумма произ-


вольных постоянных, которая при этом получается, заменена одной посто-
янной.
Следует отметить, что некоторые интегралы не могут быть выражены
через элементарные функции. В частности, это касается интегралов сле-
дующих функций:
sin x cos x 1 2
, , , e− x .
x x ln x

29.2.Интегрирование методами подстановки и замены перемен-


ной. Еще одно важное свойство неопределенного интеграла, основанное на
инвариантности формы первого дифференциала, позволяет находить инте-
гралы функций, не входящих в таблицу.
Пусть
∫ f ( x) dx = F ( x) + C
и формально подставим в эту формулу функцию x = ϕ(t ) ,производная ко-
торой непрерывна. Тогда получим так называемую формулу подстановки

∫ f (ϕ(t ))ϕ′(t )dt = ∫ f (ϕ(t ))d ϕ(t ) = F (ϕ(t )) + C .(29.1)


Покажем, что формула (29.1), действительно, верна. Для этого найдём
производную по переменной t правой части этого выражения

Fx′(ϕ(t ))ϕ′(t ) = f (ϕ(t ))ϕ′(t ) .

Таким образом, правая часть в (29.1) является первообразной подынте-


грального выражения слева.
Применение этой формулы позволяет находить интегралы сложных
функций, используя таблицу основных интегралов. Например, найдем
∫ cos(3 x + 2)dx .
213
Зная, что
∫ cos udu = sin u + C
и делая вэтойформулеподстановку u = 3x + 2 , получим

∫ cos(3x + 2)d (3x + 2) = sin(3x + 2) + C ,


откуда найдем
1
∫ cos(3 x + 2) dx =
3
sin(3x + 2) + C .

Этот прием, основанный на подстановке некоторой функции в готовую


формулу табличного интеграла, называют методом подстановки.
Рассмотрим теперь приём интегрирования с помощью замены пе-
ременной. Предположим, что нужно найти интеграл ∫ f ( x)dx . Заменяем
переменную интегрирования некоторой дифференцируемой функцией
x = ϕ(t ) , имеющей обратную функцию t = ψ ( x) . Предположим также, что
ϕ′(t ) непрерывна. Тогда справедлива формула замены переменной в не-
определенном интеграле

∫ f ( x)dx = ∫ f (ϕ(t ))ϕ′(t )dt , t = ψ ( x) . (29.2)

Действительно, пусть F ( x) первообразная f ( x ) . Тогда по форму-


ле подстановки правая часть этого выражения равна

∫ f (ϕ(t ))ϕ′(t )dt = F (ϕ(t )) + C = F ( x) + C


при x = ϕ(t ) , что подтверждает справедливость формулы (29.2).
Прием замены переменной состоит в том, чтобы сделать такую заме-
ну, при которой для подынтегральной функции в полученном интеграле
справа в (29.2)может быть найдена первообразная.
Например, для нахожденияинтеграла ∫ a 2 − x 2 dx сделаем замену
переменной x = a sin t так, что

a2 − x2 = a2 − a2 sin 2 t = a cos t , dx = a cos t dt .

Следовательно,

214
1 + cos 2t
∫ a 2 − x 2 dx = a 2 ∫ cos 2 tdt = a 2 ∫
2
dt =

a2  1  a2
=  t + sin 2t  + C = ( t + sin t cos t ) + C .
2 2  2

Перейдём от переменной t к переменной x . В промежутке −a ≤ x ≤ a


x
существует обратная функция t = arcsin , поэтому
a
x2 a2 − x2
cos t = 1 − sin t = 1 − 2 =
2
.
a a

Окончательно получаем
a2 x x a2 − x2
∫ a − x dx = arcsin + +C .
2 2

2 a 2

Заметим в заключение этой темы, что в некоторых случаях замену пе-


ременной непосредственно не осуществляют, а применяют так называе-
мую операцию «внесения под дифференциал». Заменяя выражение
ϕ′( x)dx дифференциалом d ϕ( x) , получают

∫ f (ϕ( x))d ϕ( x) = ∫ f (ϕ)d ϕ .


Например,
1 ( 3x − 7 )
11
1
∫ ( ) ( ) ( )
3∫
10 10
3 x − 7 dx = 3 x − 7 d 3 x − 7 = ⋅ +C.
3 11

215
Лекция 30. Методы интегрирования (продолжение)

30.1.Интегрирование простейших иррациональностей. Рассмотрим


только простейшие случаи иррациональных подынтегральных функций.
Если интеграл содержит иррациональность вида n ax + b ( a ≠ 0 ) , то приме-
няют подстановку ax + b = t n .
1
Пример.Найти интеграл ∫ dx .
x −1
Сделаем замену или x = t 2 . Тогда dx = 2tdt и

1 2t dt t −1+1
∫ x −1
dx = ∫
t −1
= 2∫
t −1
dt =

 1 
= 2∫  t + dt = 2 ( t + ln t − 1 ) + C = 2( x + ln x − 1) + C .
 t −1

Если подынтегральное выражение содержит иррациональности вида


n
ax + b и m ax + b , где m ≠ n , то применяют подстановку ax + b = t p с p ,
равным наименьшему общему кратному чисел m и n .
Рассмотрим интегралы вида
dx ( Mx + N ) dx .
∫ Ax 2 + Bx + C ∫ Ax2 + Bx + C
и

Первый из них сводится к табличному интегралу выделением полного


квадрата в подкоренном выражении. Для нахождения второго интеграла
следует в числителе выделить дифференциал квадратного трехчлена
d ( Ax 2 + Bx + C ) = (2 Ax + D ) dx .

Пример. Найтиинтеграл I = ∫
( x − 2 ) dx .
3 − 2x − x2

В числителе дроби получим дифференциал подкоренного выражения


d (3 + 2 x − x 2 ) = (2 − 2 x ) dx и разобьём интеграл на два интеграла

1 (2 − 2 x) + 2 1 (2 − 2 x)dx dx
I =− ∫
2 3 + 2x − x2
dx = − ∫
2 3 + 2x − x2
−∫
3 + 2x − x2
=

1 d (3 + 2 x − x 2 ) dx x −1
2 ∫ 3 + 2 x − x 2 ∫ 4 − ( x − 1) 2
=− − = − 3 + 2 x − x 2
− arcsin +C
2
216
В интегралах вида ∫ a 2 − x 2 dx , ∫ a 2 + x 2 dx , ∫ x 2 − a 2 dx освобож-
даются от иррациональности применением тригонометрических подста-
новок. Для первого интеграла применяется замена x = a sin t (можно
x = a cos t ) и используется тождество sin 2 t + cos 2 t = 1 ; для второго – за-
1
мена x = a tg t и применяется соотношение 1 + tg 2 t = ; для третьего –
cos 2 t
a a
замена x = или x = .
cos t sin t

30.2. Интегрирование по частям. Рассмотрим метод интегрирования,


который позволит нахождение одного интеграла заменить нахождением
другого, «более простого». В основу этого метода положено следующее
рассуждение. Пусть u ( x) и v( x) – две функции, имеющие непрерывные
производные на некотором интервале. Найдем дифференциал d (u ⋅ v) от
произведения этих функций
d (u ⋅ v) = u ⋅ dv + v ⋅ du ,

где dv = v′( x ) ⋅ dx, du = u′( x ) ⋅ dx . Перепишем это выражение в виде

u dv = d (u ⋅ v) − v ⋅ du

и проинтегрируем обе его части. Учитывая, что ∫ d (u ⋅ v) = u ⋅ v , получим


формулу интегрирования по частям

∫ u ( x) ⋅ dv( x) = u ( x) ⋅ v( x) − ∫ v( x) ⋅ du ( x) .
Метод интегрирования по частям состоит в представлении интеграла

∫ f ( x)dx
в виде ∫ u ( x) dv( x) так, чтобы интеграл ∫ v( x) du ( x) в правой части форму-
лы интегрирования по частям оказался «более простым». При нахождении
функции v ( x) можно произвольную постоянную C , возникающую при
этом интегрировании, положить равной нулю.
Найдем интеграл ∫ x ⋅ e − x dx . Введем обозначения: u ( x) = x ,

dv( x ) = e − x dx . Тогда du ( x) = dx и v( x) = − ∫ e− x d (− x) = −e− x .

217
Применяя формулу интегрирования по частям, получим

∫x⋅e
−x
dx =x ⋅ ( −e − x ) − ∫ −e − x dx = − x ⋅ e − x − e − x + C .

Формула интегрирования по частям предполагает разбиение подын-


тегрального выражения на два множителя u ( x) и dv( x) , причем при пере-
ходе к правой части первый дифференцируется, а второй интегрируется.
Нужно стараться, во-первых, чтобы интегрирование дифференциала dv не
представляло трудностей и, во-вторых, чтобы интеграл ∫ v ( x ) du ( x ) имел
более простое подынтегральное выражение. Так, в предыдущем примере
было бы «неразумно» положить u = e − x , а dv = xdx . Действительно, в
этом случае
x2 − x 1 2 − x
∫ x ⋅ e dx = 2 ⋅ e − 2 ∫ x ⋅ e dx ,
−x

мы получили более сложный интеграл, чем первоначально данный.


Заметим, что если мы имеем интегралы вида ∫ Pn ( x)sin kxdx ,

∫ P ( x)cos kxdx , ∫ P ( x)e


n n
kx
dx , ( Pn ( x ) – многочлен n -ой степени), то следует
выбрать u ( x) = Pn ( x) . При этом интегрирование по частям проводится
столько раз, какова степень многочлена Pn ( x) . Если же имеем интегралы
вида
∫ Pn ( x)arcsin kx dx , ∫ Pn ( x)arccos kx dx , ∫ Pn ( x)arctg kx dx ,
∫ P ( x)arcctg kx dx , ∫ P ( x)log
n n a kx dx ,

то выбираем в качестве функции u ( x) либо обратную тригонометрическую


функцию, либо логарифм.

30.3. Интегрирование выражений, содержащих тригонометриче-


ские функции. Разнообразие тригонометрических функций и особенно
формул, их связывающих, приводит к большому выбору методов вычисле-
ния интегралов, содержащих тригонометрические функции. Рассмотрим
некоторые из этих методов интегрирования.
Для нахождения интегралов вида ∫ sin αx cos βx dx , ∫ sin αx sin βx dx ,

∫ cosα x cos β x dx , где α , β – действительные числа, следует преобразовать


произведения тригонометрических функций в суммы по формулам
218
1
sin αx ⋅ cos βx =
2
( sin ( α − β) x + sin ( α + β) x ) ,
1
sin αx ⋅ sin βx = ( cos ( α − β ) x − cos ( α + β ) x ) ,
2
1
cos αx ⋅ cos βx = ( cos ( α − β ) x + cos ( α + β ) x ) .
2

Пример. Найти интеграл I = ∫ sin3x ⋅ cos7 xdx .

I=
1
2
( 1
)1
− ∫ sin 4 xdx + ∫ sin10 xdx = cos 4 x − cos10 x + C .
8 20

Рассмотрим несколько случаев нахождения интегралов вида

∫ sin
α
x cosβ x dx

в зависимости от различных значений чисел α и β .Если хотя бы одно из


чисел α или β –положительное целое нечетное число, то поступают сле-
дующим образом: отделяют от тригонометрической функции в нечетной
степени функцию в первой степени и вносят ее под знак дифференциала.
Оставшуюся четную степень тригонометрической функции преобразуют с
использованием формулы sin 2 x + cos 2 x = 1 .

sin 3 x
Пример. Найти интеграл ∫ 3
cos x2
dx .

Здесь α – положительное нечетное число. Следовательно,

sin 3 x (1 − cos x ) sin x dx = 


2
t = cos x  ( )
1 − t 2 dt
∫ 3
cos 2 x
dx = ∫
3
cos 2 x
 dt = − sin xdx  = − ∫ 3 2
  t
=

1 7
2 4
− t 3
t 3 3
= − ∫ t dt + ∫ t dt = −
3 3
+ + C = −3 3 cos x + cos 2 x ⋅ 3 cos x + C .
1 7 7
3 3

Если α и β –четные неотрицательные числа, то степени синуса и


косинуса понижаются посредством перехода к двойному аргументу с по-
мощью формул:
219
1 + cos 2 x 1 − cos 2 x
cos 2 x = ; sin 2 x = .
2 2
Пример. Найти интеграл ∫ cos 4 x dx . Понизим степень косинуса

2
 1 + cos 2 x  1
cos x = ( cos x )  = (1 + 2cos 2 x + cos 2 x ) =
2
4 2
= 2

 2  4

1 1 + cos 4 x  1  3 1 
= 1 + 2cos 2 x +  =  + 2cos 2 x + cos 4 x  .
4 2  4 2 2 

Следовательно,
1 3 1 
∫ cos ∫
x dx =
 + 2cos 2 x + cos 4 x  dx =
4

4 2 2 
1 3 1 
=  x + sin 2 x + sin 4 x  + C .
4 2 8 

Если под интегралом функции sin x и cos x содержатся только в чет-


ных степенях, то используется подстановка t = tg x с применением формул
t2 1 dt
sin x =
2
, cos 2 x = , dx = .
1+ t 2
1+ t 2
1+ t2
dx
Пример. Вычислить интеграл I = ∫ .
1 − 5sin 2 x
Сделаем замену t = tg x . Тогда
dt
dt 1 d 2t 1 1 + 2t 1 1 + 2 tg x
I = ∫ 1+ t 2 = ∫
2

1 − 4t 2 2 ∫ 1 − ( 2t )2 4 1 − 2t
= = ln + C = ln +С
t 4 1 − 2 tg x
1− 5
1+ t2
.
Интеграл вида ∫ R ( sin x,cos x ) dx , где R(sin x,cos x) – рациональная
функция синуса и косинуса, можно привести к интегралу рациональной
дроби (правильной или неправильной)с помощью универсальной триго-
нометрической подстановки
x
t = tg , ( −π < x < π ) .
2

В этом случае sin x и cos x выражаются по известным тригонометрическим


формулам через новую переменную t следующим образом:

220
2t 1− t2
sin x = , cos x = ,
1+ t2 1+ t2
x x 2dt
а из соотношения t = tg следует, что = arctg t и dx = .
2 2 1+ t2
dx
Пример. Найти интеграл I = ∫ .
4cos x + 3sin x + 5
x
Применяя универсальную подстановку t = tg , получаем
2
2dt
1+ t2 dt 2 2
I =∫ = 2∫ =− +C =− +C.
1− t ( ) +
2 2
2t t + 3 t 3 x
4⋅ + 3⋅ +5 tg + 3
1+ t 2
1+ t 2
2

Заметим, что применение универсальной подстановки часто приводит


к достаточно громоздким выражениям, поэтому использовать ее нужно
только после того, как исчерпаны другие возможности.

221
Лекция 31. Комплексные числа

31.1. Введение. Вспомним, как развивалось понятие числа, начиная


от чисел натуральных до чисел действительных. Если операция сложе-
ния во множестве натуральных чисел выполнима без ограничений, то опе-
рация обратная сложению, т.е. решение уравнения a + x = b , выполнима
только при b > a . Если отказаться от этого ограничения, то получатся
«новые» числа – отрицательные. Так «родились» целые числа, во множе-
стве которых сохранены все свойства суммы и обратная операция – раз-
ность, результатом которой является число x = b − a .
Во множестве натуральных чисел также не всегда разрешима задача,
обратная операции умножения, т.е. решение уравнения a ⋅ x = b . Для её
решения необходимо и достаточно, чтобы b было кратно a . Возникла
необходимость расширения множества целых чисел до чисел рациональ-
ных. В этом множестве обратная операция – деление, результатом кото-
рой является число x = b : a , разрешима с ограничением a ≠ 0 . Для ра-
циональных чисел сохраняются свойства операций сложения и умножения.
Оказалось, что во множестве рациональных чисел не всегда разре-
шима задача извлечения квадратного корня из положительного числа, на-
пример, неразрешимо уравнение x 2 − 2 = 0 . Число 2 , которым мы при-
вычно обозначаем один из корней этого уравнения, число – иррациональ-
ное. Это число «должно» бы выражать длину диагонали квадрата со сто-
роной равной единице. Но среди известных чисел, с помощью которых
можно выразить длину диагонали, такого числа не нашлось. Такие числа
назвали иррациональными, т.е. невыразимыми. Это открытие было сдела-
но во времена Пифагора (580–500 г. до н.э.). Позднее, примерно через
1000 лет, латинские слова рациональный и иррациональный стали связы-
вать со словом рацио – разум. В средневековой математической культуре
возник новый термин вместо «иррациональный» – surdus (глухой или не-
мой), т.е. такое число, когда немой его не может высказать другому, а вто-
рой (глухой) не может выслушать первого. Сопротивление «разума» ис-
чезло, когда стали интерпретировать иррациональные числа бесконечны-
ми десятичными непериодическими дробями.
Комплексные числа, о которых пойдет речь, возникли из необходи-
мости извлечения квадратного корня из отрицательного числа. Определим
«новое» число –«мнимую единицу» i , квадрат которого равен −1, т.е.
i 2 = −1 . Расширим множество действительных чисел, вводя числа вида
z = x + iy , которые будем называть комплексными. Число
x = Re z = Re( x + iy) называют действительной (лат. realis– действитель-
ный) частью комплексного числа, а число y = Im z = Im(x + iy) его мнимой
(лат. imaginarius – мнимый) частью.
222
31.2. Геометрическая интерпретация комплексных чисел. Ком-
плексные числа удобно изображать точками плоскости xOy , с декартовой
системой координат, которую в этом случае называют комплексной
плоскостью. Ось абсцисс этой плоскости называют действительной осью
– ей отвечают действительные числа z = x , а ось ординат – мнимой осью.
Числа z = iy , лежащие на мнимой оси, называют чисто мнимыми.
Два комплексных числа z1 = x1 + iy1 и z2 = x2 + iy2 равны тогда и только
тогда, когда x1 = x2 и y1 = y2
Сопряжённым к данному комплексному числу z = x + iy назовем
число z = x − iy , которое обычно помечается чертой сверху. Сопряжённые
комплексные числа отличаются знаком мнимой части. Если z = x − iy , то
z = x + iy . Сопряжённые числа симметричны относительно действитель-
ной оси (см. рис. 31.1).
z1 = x1 + iy1
z2 = x2 + iy2
i y2

x2

z2 = x2 − iy2
z1 = x1 − iy1

Рис. 31.1

31.3.Тригонометрическая форма комплексного числа. Наряду с


алгебраической формой комплексного числа z = x + iy введем его триго-
нометрическую форму. Будем интерпретировать комплексное число
z = x + iy как радиус-вектор точки ( x, y ) .Модулем r комплексного числа
z = x + iy называют длину этого вектора r =| z | = x 2 + y 2 (см. рис. 31.2).
Модуль – это расстояние от начала координат до точки z = ( x, y ) .
Угол ϕ между положительным направлением оси Ox и радиус-
вектором z называется аргументом комплексного числа. Поскольку этот
угол определяется с точностью до числа, кратного 2π ,то выделим его
главную ветвь 0 ≤ argz < 2π . Значение ϕ = arg z определяется как решение
системы уравнений
x y
cosϕ = ; sin ϕ = ; 0 ≤ ϕ < 2π .
x +y
2 2
x +y
2 2

223
z = x + iy 5
ϕ= π
−1 4
r
y
ϕ
−i
x z = −1 − i

Рис. 31.2

От алгебраической формы комплексного числа легко перейти к его


тригонометрической форме

z = x + i ⋅ y = r cos ϕ + ir sin ϕ = r (cos ϕ + i sin ϕ) .

Пример. Представить число z = −1 − i в тригонометрической форме.


Модуль r = − 1 − i = (−1) 2 + (−1) 2 = 2 . Аргумент находим, выбирая из
решений уравнений
−1 2 −1 2
cosϕ = =− ; sin ϕ = =−
2 2 2 2
5
то, которое попадает в промежуток 0 ≤ ϕ < 2π . Это угол ϕ = π = 2250
4
(см. рис. 31.2). Таким образом,
5 5
z = −1 − i = 2(cos π + i sin π) .
4 4

31.4. Операции над комплексными числами. Начнем со сложения.


Суммой (разностью) двух комплексных чисел z1 = x1 + iy1 и z2 = x2 + iy2
называется комплексное число z = z1 ± z2 = ( x1 ± x2 ) + i ( y1 ± y2 )

y
( x1 + x2 , y1 + y2 )
( x2 , y2 )

( x1 , y1 )
x

Рис. 31.3
224
Заметим, что это соответствует правилу сложения векторов (см. рис. 31.3).

Произведением комплексных чисел называется число

( x1 + iy1 ) ⋅ ( x2 + iy2 ) = ( x1 x2 − y1y 2 ) + i ( x1 y2 + x2 y1 ) .

Найдём произведение двух комплексных чисел, заданных в тригонометри-


ческой форме
z1 ⋅ z2 = r1 (cos ϕ1 + i sin ϕ1 ) ⋅ r2 (cos ϕ2 + i sin ϕ2 ) =

= r1 ⋅ r2 (cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 + i (sin ϕ1 cos ϕ2 + cos ϕ1 sin ϕ2 )) =

= r1r2 (cos( ϕ1 + ϕ2 ) + i (sin(ϕ1 + ϕ2 )) .

Таким образом, при умножении комплексных чисел в тригонометриче-


ской форме их модули нужно перемножить, а аргументы сложить.
Геометрический смысл умножения на комплексное число

z = r (cos ϕ + i sin ϕ)

состоит в том, что происходит «растяжение» плоскости с коэффициентом


r и поворот на угол ϕ . Благодаря этим свойствам комплексных чисел с их
помощью удаётся решать задачи теории упругости, связанные с деформа-
цией твёрдых тел, а также изучать движение жидкостей и газов.
Пример. Найти произведение чисел z1 = 2(cos(30 + i sin 30 ) и
z2 = 2(cos(120 + i sin120 ) .Умножение в тригонометрической форме даёт

3 1
z1 z2 = 4(cos(1500 + i sin1500 ) = 4(− + i ) = −2 3 + 2i .
2 2
90
120 60
3
4
z = − 2 3 + 2i 1 +i 3
2 = −
  
3   z  30
150

1 = +i
1
z
 3
2
180 0

Рис. 31.4
225
В результате умножения вектора z1 на вектор z2 длина вектора z1 уве-
личилась в два раза и он «повернулся» на угол 120 (см. рис. 31.4).
После этого становится понятными правила умножения отрицатель-
ных чисел. Почему, например, (−1) ⋅ (−1) = 1 ? Действительно, представляя
−1 в тригонометрической форме, получаем

(−1)(−1) = (cos π + i sin π) ⋅ (cos π + i sin π) = (cos 2π + i sin 2π) = 1 .

Также перестаёт быть «таинственной» формула i 2 = −1 , поскольку

π π π π
i ⋅ i = (cos + i sin )(cos + i sin ) = (cos π + i sin π) = −1 .
2 2 2 2

Чтобы получить частное двух комплексных чисел, нужно умно-


жить и числитель и знаменатель дроби на число сопряжённое знаменателю
и отделить вещественную и мнимую части.

z1 x1 + iy1 ( x1 + iy1 )( x2 − iy2 ) x1 x2 + y1 y2 x y −xy


z= = = = + i 2 21 12 2 .
z2 x2 + iy2 ( x2 + iy2 )( x2 − iy2 ) x2 + y2
2 2
x2 + y2

Найдём частное двух комплексных чисел, заданных в тригонометри-


ческой форме

z1 r1 (cos ϕ1 + i sin ϕ1 ) r1
= = (cos ϕ1 + i sin ϕ1 )(cos ϕ2 − i sin ϕ2 ) =
z2 r2 (cos ϕ2 + i sin ϕ2 ) r2
r
= 1 (cos ϕ1 cos ϕ2 + sin ϕ1 sin ϕ2 + i (sin ϕ1 cos ϕ2 − cosϕ1 sin ϕ2 )) =
r2
r
= 1 (cos(ϕ1 − ϕ2 ) + i sin(ϕ1 − ϕ2 )).
r2
Итак, модуль частного двух комплексных чисел равен частному их моду-
лей, а аргумент частного равен разности аргументов делимого и делителя.
Пример. Найти частное чисел z1 = −2 3 − 2 ⋅ i и z 2 = 1 + i 3 . Пред-
ставим каждое из этих чисел в тригонометрической форме:

z1 = 4(cos 2100 + i sin 2100 ) , z2 = 4(cos 600 + i sin 600 ) .

Тогда частное равно z1 / z2 = 2(cos1500 + i sin1500 ) = − 3 + i (см. рис. 31.5).

226
90
120 60
3

2
150 30
z2
z1 1
z2
180 0

z1
210 330
ис. 5.

240 300

Рис. 31.5

Определим операцию возведения в степень комплексного числа.


По правилу умножения комплексных чисел в тригонометрической форме
для всякого натурального числа n имеем

z n = r n (cos nϕ + i sin nϕ) .

В частном случае, когда модуль числа равен единице, получается


формула, носящая имя английского математика А.Муавра (1667-1754)

(cos ϕ + i sin ϕ) n = cos nϕ + i sin nϕ .

Эта формула служит источником для получения многих замечатель-


ных соотношений, связывающих тригонометрические функции. Например,
при n = 2 имеем равенство

cos 2ϕ + 2i sin ϕ cos ϕ − sin 2ϕ = cos 2ϕ + i sin 2ϕ .

Приравнивая действительные и мнимые части, получаем известные фор-


мулы для синуса и косинуса двойного аргумента

cos 2ϕ = cos 2ϕ − sin 2 ϕ , sin 2ϕ = 2sin ϕ cos ϕ .

227
Лекция 32. Решение алгебраических уравнений

32.1.Извлечение корня из комплексного числа. Число z называется


корнем n -ой степени из комплексного числа a , если z n = a . Эта опе-
рация –обратная возведению комплексного числа в целую положительную
степень. Во множестве вещественных (действительных) чисел эта задача
равносильна задаче нахождения корней уравнения x n − a = 0 и мы решали
её, раскладывая многочлен x n − a на множители. Иногда это удавалось.
Например, уравнение x 2 − 4 = 0 даёт два корня x1,2 = ± 2 , а уравнение
x 2 + 1 = 0 корней не имеет.
Итак, пусть дано комплексное число a =| a | (cos α + i sin α) и урав-
нение z n = a . Будем искать корни этого уравнения среди комплексных
чисел, выраженных в тригонометрической форме z = r (cos ϕ + i sin ϕ) , r = ? ,
ϕ = ? В этой форме уравнение примет вид

r n (cos ϕ + i sin ϕ) n =| a | (cos α + i sin α )


или
r n (cos nϕ + i sin nϕ) =| a | (cos α + i sin α ) .

Два комплексных числа в тригонометрической форме равны тогда и


только тогда, когда их модули равны, а аргументы отличаются на число,
кратное 2π , т.е.
r n =| a |, nϕ = α + 2πk , k = 0, ± 1, ± 2,… .
Поэтому все корни имеют один и тот же модуль r = n | a | , а аргументы
этих корней определяются по формуле
α 2π
ϕ= + k , k = 0, ± 1, ± 2,… .
n n

Убедимся, что число корней конечно и равно показателю n степени


уравнения. Действительно, представляя искомые корни в тригонометриче-
ской форме
 α 2π α 2π 
zk = n | a |  cos( + k ) + i sin( + k)  ,
 n n n n 
видим, что в силу периодичности тригонометрических функций достаточ-
но ограничиться значениями k = 0, ± 1, ± 2,…, n − 1 . Если k целое отрица-
тельное, то мы не получим новых корней, так как

z− k = zn−k , k = 1,2,…, n − 1 .

228
В этом легко убедиться, прибавив 2π к значению аргумента корня z− k ,
что не меняет значений синуса и косинуса. Например,

 α 2π   α 2π 
cos ϕ− k = cos  + (− k ) + 2π  = cos  + (n − k )  = cos ϕn−k .
n n  n n 

Итак, мы получили n корней n -й степени из комплексного числа. Это –


комплексные числа, модули которых равны r = n | a | , а аргументы опре-
α 2π
деляются формулой ϕ = + k , k = 0, 1, 2, … , n − 1 . Особенно наглядна
n n
их геометрическая интерпретация: все корни расположены на окружности,

радиус которой r = n | a | , и угол между соседними корнями равен .
n
Например, уравнение z 3 + 8 = 0 имеет три корня, расположенных на ок-
ружности радиуса r = 3 | −8 | = 3 8 = 2 . Поскольку arg( −8) = π , то аргумен-
π 2π
ты корней соответственно равны ϕ k = + k , k = 0, 1, 2 .
3 3
90 2
120 60
1.5 z0 = 1 + i 3
150 1 30

0.5

z2 = −2 180 0

210 330

240 300
z3 = 1 − i 3
270

Рис. 32.1

В области действительных чисел символ (⋅) был «закреплён» за


положительным корнем из положительного числа. Если расширить его
применение для изображения корня из комплексного числа, то он потеряет
однозначность. Например,
 −2
± , 3 −8 = 
−1 = ±i .
1 ± i 3
229
32.2. Квадратное уравнение. Рассмотрим квадратное уравнение
ax + bx + c = 0 , коэффициенты которого действительные числа. Формаль-
2

но написанная формула для вычисления его корней

−b ± b 2 − 4ac
x1,2 = (32.1)
2a

во множестве действительных чисел не имеет смысла, если подкоренное


выражение ∆ = b 2 − 4ac отрицательно. Но теперь мы умеем находить
квадратные корни из отрицательных чисел. Пусть − d , (d > 0) некоторое
отрицательное число. Его тригонометрическая форма − d = d (cosπ + i sin π) .
Поэтому
π π
− d = d (cos ( + πk ) + i sin( + πk )), k = 0,1 ⇒ − d = ± i d
2 2

Следовательно, если дискриминант уравнения отрицателен, то

b 2 − 4ac = −(4ac − b 2 ) = ±i | b 2 − 4ac | .

Формула вычисления корней квадратного уравнения принимает вид

 −b ± b 2 − 4ac
 , b 2 − 4ac ≥ 0
 2a
x1,2 = 
 −b ± i | b 2 − 4ac |
 , b 2 − 4ac < 0
2a

В случае приведённого квадратного уравнения x 2 + px + q = 0 форму-


лы имеют более компактный вид

 p p 2 p 2
− ± ( ) − q , ( ) − q ≥ 0
 2 2 2
x1,2 =  (32.2)
− ± i | ( )2 − q | , ( )2 − q < 0
p p p
 2 2 2

Пример. Решить уравнение z 3 + 8 = 0 . После разложения левой части


уравнения на множители

230
( x + 2)( x 2 − 2 x + 4) = 0

становится очевидным действительный корень уравнения x1 = −2 , а два


комплексно сопряжённых корня находятся по формуле (32.2)

x2,3 = 1 ± 1 − 4 = 1 ± −3 = 1 ± i 3 .

Геометрическая интерпретация корней данного уравнения дана на рис.


32.1.

32.3.Разложение многочлена на множители. Рассмотрим многочлен


степени n
Pn ( z ) = a0 z n + a1 z n −1 + … + an −1 z + an .

Число z1 , обращающее этот многочлен в нуль ( Pn ( z1 ) = 0 ), называют


корнем уравнения Pn ( z ) = 0 .На протяжении многих веков делались по-
пытки получить формулы для вычисления корней уравнений Pn ( z ) = 0 сте-
пени n ≥ 3 . В 1545 г. итальянский математик, философ и врач Д. Кардано
(1501-1576) опубликовал формулы решения кубического уравнения. Воз-
ник спор о приоритете с другим итальянским математиком Николло Тар-
талья (1499-1557). Ученик Кардано Л.Феррари (1522-1565) нашёл способ
решения уравнений четвёртой степени путём сведения к решению кубиче-
ского уравнения. Норвежский математик Нильс Абель (1802-1829) дока-
зал, что алгебраические уравнения степени n > 4 неразрешимы в радика-
лах. Это надо понимать в том смысле, что корни уравнения не выражаются
через его коэффициенты ak с помощью конечного числа операций сложе-
ния, вычитания, умножения, деления и извлечения корня.
Важный результат о существовании корней алгебраического урав-
нения носит название основной теоремы алгебры. Эта теорема гласит,
что всякий многочлен Pn ( z ) степени n ≥ 1 имеет по крайней один ком-
плексный корень. Эта теорема впервые (не вполне строго) была доказана
французским учёным Ж. Даламбером (1717-1783).Строгое доказательство
дал Карл Гаусс (1777-1855) в 1799 году. Основная теорема алгебры даёт
возможность представления многочлена в виде произведения множителей,
содержащих его корни

Pn ( z ) = a0 ( z − z1 )( z − z2 )⋯ ( z − zn ) ,

откуда следует, что всякое алгебраическое уравнение имеет ровно n кор-


ней.
231
Некоторые из корней могут совпадать. Их называют кратными в от-
личие от простых, т.е. неповторяющихся корней. Кратность корня – это
число его повторений в разложении многочлена на множители. С учётом
кратности корней получим разложение многочлена

Pn ( z ) = a0 ( z − z1 )r1 ( z − z2 ) r2 ⋯( z − zk ) rk ,

где z1 ,…, zk – различные корни уравнения Pn ( z ) = 0 , а r1 ,…, rk – их кратно-


сти, причём r1 + … + rk = n . Указанные разложения справедливы для много-
членов, как с вещественными, так и с комплексными коэффициентами.
Отметим без доказательства, что если многочлен имеет вещественные
коэффициенты, то наряду с комплексным корнем z = α + iβ многочлен
обладает сопряжённым корнем z = α − iβ , причём той же кратности. Объе-
диняя в разложении многочлена такие пары, получаем

( z − z )( z − z ) = ( z − α − iβ)( z − α + iβ) = z 2 − 2αz + α 2 + β2 = z 2 + pz + q .

Таким образом, многочлен с вещественными коэффициентами рас-


кладывается на линейные множители с вещественными корнями и квадра-
тичные множители с парой комплексно сопряжённых корней. Переменную
в случае многочлена с вещественными коэффициентами будем обозначать
буквой x .Итак, многочлен с вещественными коэффициентами имеет раз-
ложение
Pn ( x) = a0 ( x − x1 )r1 ⋯( x − xk )rr ( x 2 + p1x + q1 ) s1 ⋯( x 2 + pl x + ql ) sl ,

где r1 + … + rk + 2( s1 + … + sl ) = n .

32.4. Разложение правильных дробей на простые дроби. Разложе-


ние многочлена на множители связано с задачей разложения правильной
рациональной дроби

Qm ( z )
(32.3)
Pn ( z )
на простые дроби следующих видов;

A Mx + N
и ( k ≥ 1 и целое);
( x − a)k ( x 2 + px + q)k

232
где A, M , N , a, p, q –действительные числа, а квадратный трёхчлен
x 2 + px + q не имеет действительных корней. Оказывается, что всякую
правильную рациональную дробь можно представить в виде суммы ко-
нечного числа простейших дробей. Этот алгебраический факт мы примем
без доказательства.
Рациональная дробь называется правильной, если степень много-
члена, стоящего в числителе, меньше степени многочлена, стоящего в зна-
менателе ( m < n ). В противном случае ( m ≥ n ) рациональная дробь называ-
ется неправильной. Всякую неправильную рациональную дробь можно
представить в виде суммы многочлена степени m − n (целая часть) и пра-
вильной рациональной дроби, т.е.

Qm ( x ) R( x)
= Gm − n ( x ) + ,
Pn ( x) Pn ( x )

где степень многочлена R ( x ) меньше n . Для этого надо разделить чис-


литель на знаменатель по правилу деления многочленов. Это деление
осуществим «уголком», причем делим до тех пор, пока показатель степе-
ни x в остатке не окажется меньше показателя степени x делителя.
Вид разложения дроби (32.3) определяется корнями многочлена
Pn ( x) .Если знаменатель Pn ( x) имеет только действительные простые
корни, то

Qm ( x ) Qm ( x) A1 A2 An
= = + + ... +
Pn ( x ) an ( x − x1 )( x − x2 ) ⋅ ... ⋅ ( x − xn ) x − x1 x − x2 x − xn

где A1 , A2 ,..., An –действительные числа, которые следует найти.


Если действительный корень xi знаменателя дроби имеет кратность
ki ,то в разложении правильной дроби на простейшие этому корню соот-
ветствует число дробей, равное ki :

A1 A2 Ak
+ + ... + .
x − xi ( x − xi ) 2
( x − xi ) ki

Если знаменатель содержит множителем квадратный трехчлен


x + px + q , не имеющий действительных корней, то при разложении
2

на простейшие дроби этому множителю соответствует дробь вида

233
Mx + N
.
x 2 + px + q

Если знаменатель дроби имеет кратные комплексные корни, то мно-


жителю ( x 2 + px + q )l с комплексно сопряженными корнями соответству-
ют l дробей:

M 1 x + N1 M 2 x + N2 M l x + Nl
+ + ... + .
x + px + q ( x 2 + px + q )
2 2
( x + px + q )
2 l

234
Лекция 33. Определённый интеграл

33.1.Задачи, приводящие к понятию определённого интеграла.


Одной из первых задач, с которой началось формирование понятия инте-
грала, была задача вычисления площадей фигур, ограниченных кривыми.
Задача Архимеда. Найдём площадь под параболой y = x 2 , заданной
на отрезке [0, a ] . Эту задачу решил в своё время Архимед. Разобьём отре-
зок [0, a ] на n равных частей ∆x = a / n . Искомая площадь приближённо
равна площади ступенчатой фигуры (см.рис.33.1).

y=x2 y=x2
h=a/n h=a/2n

0 a 0 a

Рис.33.1

Следует ожидать, что с увеличением n её площадь будет прибли-


жаться к площади под параболой. Площадь ступенчатой фигуры равна
сумме площадей прямоугольников с основанием ∆x и высотой, равной
значению функции в точках дробления y = ( k ∆x) 2 , k = 1, 2,… , n .
Итак,
S ≈ [( ∆x ) 2 + (2∆x ) 2 + … + ( n∆x) 2 ]∆x = (1 + 2 2 + 32 + … + n 2 )( ∆x )3

Для суммы квадратов натуральных чисел известна формула

n(n + 1)(2n + 1)
1 + 22 + 32 + … + n2 =
6
Находя предел, получаем

n( n + 1)(2n + 1) a 3 a 3  1  1  a3
S = lim = lim  1 +  2 +  = .
n →∞ 6 n3 6 n→∞  n  n 3

Площадь криволинейной трапеции. Пусть на отрезке [ a, b ] задана


непрерывная положительная функция y = f ( x) . Фигуру, ограниченную
осью Ox , прямыми x = a , x = b и графиком функции, называют криволи-
нейной трапецией. Для приближенного вычисления площади этой криво-
235
линейной трапеции разобьём промежуток [ a, b ] произвольным образом на
n частей (см. рис. 33.2)

y = f ( x)

Pk
a = x0 x1 xk xk +1 xn = b

Рис. 33.2

В каждом интервале длиной ∆xk = xk − xk −1 произвольно выберем точку


pk . Тогда площадь прямоугольника с основанием ∆xk и высотой f ( pk )
будет равна f ( pk )∆xk , а площадь под кривой приближенно равна сумме
n
S ≈ Sn = ∑ f ( pk )∆xk . (33.1)
k =1

С увеличением n точность этого приближения будет возрастать при усло-


вии, что длины всех отрезков ∆xk будут уменьшаться. Назовем площадью
криволинейной трапеции предел последовательности Sn , если он сущест-
вует и не зависит от способа разбиения и выбора точек.
33.2. Понятие определённого интеграла. Во всех приведенных выше
задачах мы осуществляли следующую процедуру: брали некоторую функ-
цию f ( x) , разбивали интервал её определения на n частей, в каждой части
выбирали некоторую точку pk , составляли так называемую интегральную
сумму(33.1) и, наконец, находили предел последовательности этих сумм
при n → ∞ , когда длина наибольшего из отрезков дробления стремится к
нулю. Получающийся при этом предел носит название определенного ин-
теграла.
Определённым интегралом функции f ( x) на промежутке [ a, b ] на-
зывается конечный предел интегральных сумм

n b
lim ∑ f ( pk )∆xk = ∫ f ( x)dx, (λ = max ∆xk → 0) ,(33.2)
n→∞ k
k =1 a

236
если он существует и не зависит ни от способа разбиения промежутка
[ a, b ] , ни от выбора точек pk .
Ценность этого математического понятия состоит в том, что функцию
f ( x) можно «наполнять» разным содержанием: это может быть функция,
определяющая границу криволинейной трапеции, и тогда определенный
интеграл выражает площадь трапеции, или это может быть функция, опре-
деляющая линейную плотность неоднородного стержня, и тогда опреде-
ленный интеграл выражает массу стержня.
Для существования определенного интеграла функция f ( x) должна
обладать некоторыми свойствами. Например, она должна быть ограничен-
ной на[ a, b ] . В противном случае интегральную сумму за счёт выбора то-
чек pk можно сделать как угодно большой. Оказывается, что достаточным
условием существования определённого интеграла служит непрерывность
f ( x) на [ a, b ] .
Теорема. Если функция f ( x) непрерывна на отрезке [ a, b ] , то опре-
деленный интеграл существует.
Примем ее без доказательства.
33.3. Основные свойства определённого интеграла. Обозначение
определённого интеграла было введено Лейбницем. Знак интеграла – это
стилизация первой буквы латинского слова summa.
Если подынтегральная функция отрицательна на всем промежутке
интегрирования или на его части, то соответствующий множитель, входя-
щий в интегральную сумму будет отрицательным. Если интеграл интер-
претировать как площадь, то части кривой, расположенной под осью абс-
цисс будем приписывать отрицательную площадь (см. рис. 33.3).
b

∫ f ( x ) dx = S
a
1 + (− S 2 ) + S3

S1 S3

a − S2 b

Рис. 33.3

Если отказаться от допущения a < b и принять a > b , то в инте-


гральной сумме все разности ∆xk будут отрицательными. Поэтому
b a

∫ f ( x)dx = −∫ f ( x)dx
a b
a
В качестве определения полагаем также ∫ f ( x)dx = 0 .
a

237
Укажем основные свойства определённого интеграла, легко полу-
чаемые из его определения:
b b b
• ∫ [ f ( x) ± g ( x)]dx = ∫ f ( x)dx ± ∫ g ( x)dx
a a a
b b
• ∫ kf ( x)dx = k ∫ f ( x)dx,
a a
k = const
b c b
• ∫ f ( x)dx = ∫ f ( x)dx + ∫ g ( x)dx,
a a c
a<c<b
b
• m(b − a ) ≤ ∫ f ( x)dx ≤ M (b − a ), m ≤ f ( x) ≤ M
a

Последнее свойство проиллюстрируем рисунком (см. рис. 33.4).


y
M
f ( x)

m
x

a b

Рис. 33.4

Иногда важно не столько найти точное значение интеграла, сколько полу-


чить его оценку. Указанное неравенство геометрически соответствует то-
му факту, что существует прямоугольник весь расположенный внутри
криволинейной трапеции и прямоугольник – содержащий эту фигуру.
Среднее значение функции. Если даны n чисел a1 , a2 , …, an , то
их средним (средним арифметическим) называют число

a1 + a2 + … + an
aср = .
n

Что следует понимать под средним значением функции f ( x) на от-


резке [ a, b ] ? Существует, например, понятие средней плотности неодно-
родного тела (например, средняя плотность Земли примерно равна 5,5 ).
Разделим отрезок [ a, b ] на n равных частей ∆x1 = ∆x2 = … = ∆xn = (b − a ) / n ,
возьмем в каждой части по точке Pk и составим сумму

238
f ( P1 ) + f ( P2 ) + … + f ( P1 ) 1 n

n
=
b−a

k =1
f ( Pk )∆xk

Перейдём в этой сумме к пределу

n b
1 1
lim ∑ f ( Pk )∆xk = ∫ f ( x)dx = f
b − a n→∞ k =1 b−a
ñð .
a

Таким образом, под средним значением функции на отрезке [ a, b ] пони-


мают отношение интеграла функции по этому отрезку к длине этого от-
резка. Геометрический смысл среднего значения функции становится яс-
ным, если его определение записать в виде

b
f ср. (b − a ) = ∫ f ( x)dx
a

Поскольку интеграл справа выражает площадь криволинейной трапеции,


то левую часть равенства можно трактовать как площадь прямоугольника.
Итак, среднее значение функции равно высоте прямоугольника, в основа-
нии которого лежит отрезок [ a, b ] , равновеликого по площади криволи-
нейной трапеции (см. рис. 33.7).

y = f ( x)

f ср. f (P0)

a P0 b
Рис. 33.5

Особенно важно, что в силу непрерывности функции на отрезке [ a, b ]


найдётся такая точка P0 , что f ср . = f ( P0 ) . Это даёт возможность выразить
значение интеграла через длину промежутка интегрирования и значение
подынтегральной функции в некоторой (правда неопределённой) точке
этого промежутка.
b

∫ f ( x)dx = f ( P )(b − a),


a
0 P0 ∈ [a, b]

Этот результат называют теоремой о среднем в интегральном исчислении.

239
33.3. Существование первообразной функции. В предыдущей лек-
ции мы отметили, что интеграл непрерывной на [ a, b ] функции сущест-
вует. Наша цель– связать понятия определённого и неопределённого инте-
гралов и, тем самым, показать, как вычисляется определенный интеграл
без вычисления интегральных сумм.
Рассмотрим интеграл с переменным верхним пределом
x
F ( x ) = ∫ f (t ) d t ,
a

где подынтегральная функция f ( x) непрерывна в промежутке [ a, b ] . На-


помним, что переменная интегрирования – «немая», т.е. может быть обо-
значена любой буквой. Написанный нами интеграл – это некоторая функ-
ция F ( x) верхнего предела x , и её геометрический смысл ясен из сле-
дующего рисунка:
f ( P0 )

f ( x)

∆F
F ( x)
P0
x
a x x + ∆x b

Рис. 33.6

Применяя теорему о среднем значении функции, запишем приращение


в виде
x +∆x
∆F = ∫
x
f (t ) d t = f ( P0 ( ∆x )) ⋅ ∆x ,

где точка P0 (∆x) ∈ [ x, x + ∆ x] , которое показывает, что lim ∆F = 0 , т.е.


∆x→0
функция F ( x) непрерывна. Оказывается, что функция F ( x) не только
непрерывна, но и дифференцируема. Действительно,

lim
∆F
∆x → 0 ∆ x
= lim
∆x → 0
f ( P0 ( ∆ x )) ⋅ ∆ x
∆x ∆x → 0 ∆x → 0
( )
= lim f ( P0 ( ∆ x )) = f lim P0 ( ∆ x ) = f ( x ) .

В последнем равенстве мы существенно использовали свойство не-


прерывности функции f ( x) , поменяв местами знак предела и знак функ-
ции. Таким образом, мы пришли к замечательному факту: производная
от интеграла по переменному верхнему пределу равна значению по-
дынтегральной функции от этого предела
240
x ′
 ∫ f (t )d t  = f ( x)
 
a x

Другими словами: это означает, что интеграл с переменным верхним


пределом интегрирования является первообразной для подынтегральной
функции. Этот, казалось бы, частный факт имеет принципиальное значе-
ние. Во-первых, отсюда следует, что всякая непрерывная функция имеет
первообразную, а во-вторых, даже для «неберущихся» интегралов мы име-
ем теперь инструмент для её представления. Например, для функции
2
f ( x ) = e − x среди элементарных функций нет первообразной. Теперь мы
можем представить её первообразную через определённый интеграл
x
2
−t
∫e d t .
0

33.4. Формула Ньютона-Лейбница. Вычисление определённого ин-


теграла как предела интегральной суммы, т.е. по формуле (33.2),–
довольно сложная задача. Оказывается, что ее можно легко решить, имея
одну из первообразных подынтегральной функции. Этот факт выражается
основной формулой интегрального исчисления –формулой Ньютона –
Лейбница
b
b
∫ f ( x)d x = Φ( x) a = Φ(b) − Φ(a) ,
a
в которой Φ ( x) означает одну из первообразных функции f ( x) .
Действительно, ранее мы выяснили, что интеграл с переменным
верхним пределом
x
F ( x) = ∫ f (t ) d t
a
является первообразной подынтегральной функции f ( x) , непрерывной в
промежутке a ≤ x ≤ b . Пусть Φ ( x) любая другая первообразная f ( x) .
x
Поскольку F ( x) = ∫ f (t ) d t = Φ ( x) + C и F ( a ) = 0 ,то C = −Φ ( a ) .Поэтому
a
x
имеем ∫ f (t ) d t = Φ ( x ) − Φ ( a ) .Полагая в последнем равенстве x=b
a
,получаем
b

∫ f (t )d t = F (b) − F (a) .
a
241
Лекция 34. Вычисление определённого интеграла

34.1.Интегрирование по частям и замена переменной. Пусть u ( x) и


v ( x ) – функции, непрерывные вместе со своими производными в проме-
жутке [ a , b ] . Тогда функция F ( x) u ( x) v( x) является первообразной для
своей производной
F ( x ) u ( x) v( x) v ( x) u ( x ) .

По формуле Ньютона – Лейбница имеем

b
b
(u ( x)v( x) v ( x)u ( x))d x u ( x)v( x) a
a
откуда
b b
b
u ( x )v ( x ) d x u ( x )v ( x ) a v( x)u ( x)d x .
a a

Учитывая, что v ( x)d x d v и u ( x)d x d u , полученную формулу за-


пишем более компактно, помня, что u и v функции переменной x , изме-
няющейся в промежутке [ a , b ] :
b b
b
udv uv a vdu .
a a

Это и есть формула интегрирования по частям в определѐнном инте-


грале. Как и в случае неопределѐнного интеграла, еѐ целесообразно приме-
нять, если интеграл справа будет «проще», чем исходный интеграл.
Пример. Найти площадь фигуры, ограниченной линией y ln x ,
осью абсцисс и прямой x e . Искомая площадь (см. рис. 34.1) выражает-
e
ся интегралом S ln x d x
1

y
y ln x

x
1
e

Рис. 34.1

242
1
Интегрируем по частям u ln x, du dx, dv dx, v x
x
e
e 1 e
S x ln x 1 x d x e x1 e e 1 1.
1
x

Формула Ньютона – Лейбница даѐт возможность установить правило


замены переменной в определённом интеграле. Пусть требуется вычис-
лить интеграл
b
f ( x)d x ,
a

где функция f ( x ) непрерывна в промежутке [ a , b ] . Пусть функция


x (t ) удовлетворяет следующим условиям: 1) (t ) непрерывна вместе
со своей производной (t ) в некотором промежутке [ , ] ; 2) сложная
функция f ( (t )) должна быть определена в этом промежутке (для этого
достаточно, например, потребовать, чтобы (t ) была монотонна); 3)концам
промежутка [ , ] соответствуют концы промежутка [ a , b ] ,т.е. ( ) a,
( ) b или ( ) b , ( ) a (см. рис. 34.2).
x x

b b
x (t )

x (t )
a a

t t

Рис. 34.2

При этих условиях имеют место формулы

b
f ( x) d x f ( (t )) (t )d t
a
(34.1)
b
f ( x)d x f ( (t )) (t )d t
a

243
Приведѐм доказательство первой из них. Пусть F ( x ) – одна из пер-
вообразных функции f ( x ) . Тогда F ( (t )) – первообразная функции
f ( (t )) (t ) . Действительно,

Ft ( (t )) F ( (t )) (t ) f ( (t )) (t ) .

Применяя формулу Ньютона – Лейбница к обоим интегралам в первом из


b
равенств (34.1), получим, с одной стороны, f ( x)d x F (b) F (a ) ,а с дру-
a
гой

f ( (t )) (t )d t F ( (t ) F ( ( )) F ( ( )) F (b) F (a) .

Аналогично можно убедиться в справедливости второго равенства в (34.1).


Следует заметить, что, в отличие от замены переменной в неопреде-
лѐнном интеграле, здесь нет необходимости возвращаться к «старой» пе-
ременной. Если вычислены правые из интегралов (34.1), то, тем самым,
вычислены и левые интегралы. Излишне упоминать, что не каждая подста-
новка ведѐт к упрощению: какую замену переменной следует применять –
это может подсказать лишь опыт.
Пример. Вычислить площадь, ограниченную эллипсом, заданным
x2 y 2
уравнением 2 1 . Ясно, что достаточно вычислить площадь четвѐр-
a b2
той части фигуры. Задача приводит к вычислению интеграла

a
x2
S эл 4b 1 dx .
0
a2

Опыт вычисления неопределѐнных интегралов «подсказывает» замену пе-


ременной x(t ) a sin t . Она удовлетворяет перечисленным выше услови-
ям:
x(t ) и x (t ) a cos t непрерывны в промежутке [0, / 2]
x(0) 0, x( / 2) a
функция 1 x 2 (t ) a 2 1 sin 2 t cos t определена в [0, / 2] .
Произведя эту замену, получаем

2 2
2
Sэл 4b cos t dt 2ab (1 cos 2t )dt ab .
0 0

244
34.2. Вычисление площади фигуры в полярной системе коорди-
нат. Аналогом криволинейной трапеции в полярной системе координат
будет криволинейный сектор. Это фигура, ограниченная лучами ,
и кривой AB , заданной уравнением ( ) , определяющим для ка-
ждого значения угла расстояние от начала координат до соответствую-
щей точки кривой AB (см. рис. 34.3).

k 1

B
k

A O
R

Рис. 34.3

Предполагается, что функция ( ) непрерывна в промежутке


, . Будем сначала решать задачу вычисления площади криволинейного
сектора OAB приближѐнно. Для этого разобьѐм отрезок , на n час-
тей
1 2  n n 1 .

Тогда «большой» криволинейный сектор разобьѐтся на n «узеньких» сек-


торов. Обозначим k k 1 k . Заменим каждый «узенький» криволи-
нейный сектор круговым сектором, радиус которого примем равным
( k ), k [ k , k 1 ] . Площадь кругового сектора радиуса R и с цен-
тральным углом равна
1 2
Sсект. R .
2

Поэтому площадь сектора OAB приближѐнно выражается интегральной


суммой
1 n 2
S ( k) k .
2k1

Переходя к пределу при n , причѐм так, что длина максимального из


частичных отрезков max( k ) стремится к нулю, получаем
k

245
1 n 2 1 2
S lim ( k) k ( )d .
n 2k 1 2
0

Замечание. Если начало координат находится внутри области, огра-


ниченной замкнутой кривой ( ), 0 2 , то площадь вычисляет-
ся по формуле
2
1 2
S ( )d .
20

Пример 1. Вычислить площадь круга, граница которого задана урав-


нением x2 y 2 R2 .Ясно, что достаточно найти площадь четверти круга
(см. рис.34.4).
y

y R2 x 2

x
O R
Рис. 34.4

Если вычисления проводить в декартовой системе координат, то по-


лучается «плохой» интеграл
R
1
S kp R 2 x 2 dx .
4 0

Перейдѐм к полярным координатам по формулам: x cos , y sin .


Уравнение четвѐртой части окружности x2 y 2 R2 в полярных коорди-
натах примет вид R, 0 2 . Поэтому

1 1 2
2 1 2 2 R2
Skp R d R S kp R2.
4 2 0
2 0 4

Пример 2. Вычислить площадь, ограниченную одним витком спи-


рали Архимеда и полярной осью. Спираль Архимеда можно рассматривать
как траекторию точки, равномерно движущуюся по лучу, исходящему из
полюса, в то время как этот луч равномерно вращается вокруг полюса. В
полярной системе координат еѐ уравнение имеет вид a ,

246
a 0, a const . Один виток спирали получается при повороте луча на
угол 2 .Искомая площадь выражается интегралом
2 3 2
1 a2 4 2 3
S (a ) 2 d a .
20 2 3 0
3

P
O

Рис. 34.5

34.3. Вычисление площади фигуры, ограниченной кривыми, за-


данными параметрически. Интерпретируя определѐнный интеграл пло-
щадью криволинейной трапеции, мы предполагали, что кривая y f ( x)
задана в явном виде. А как быть, если границы фигуры заданы параметри-
ческими уравнениями? Заметим, что задание кривой в явном виде – это ча-
стный случай еѐ параметрического задания, когда в качестве параметра из-
брана переменная x :
x x
a x b.
y f ( x)

В выборе параметра мы располагаем большой свободой. Например,


при вычислении площади эллипса мы представляли его уравнение в пара-
метрическом виде следующим образом:
x a sin t
0 t .
y b cos t 2
Таким образом, замена переменной в определѐнном интеграле – это, по су-
ти, переход к другой параметризации кривой y f ( x) . Поэтому, если
часть кривой, площадь под которой нас интересует, задана параметриче-
ски, то применяется формула

b
x x(t )
S y ( x)dx y (t ) x (t )dt , где t .
a
y y (t )
247
Пример 3. Найти площадь, ограниченную астроидой, заданной урав-
нениями
x a cos3 t
0 t 2
y a sin 3 t

Астроиду можно рассматривать как траекторию фиксированной точки ок-


ружности, катящейся изнутри по окружности радиуса a и имеющей ра-
диус a / 4 (см. рис. 34.6).В силу симметрии фигуры, вычисляем четвѐртую
часть еѐ площади

a 0 2
1 3 2 2
S y ( x)dx a sin t 3acos t ( sin t )dt 3a sin 2 t cos 2t sin 2 tdt
4 0 2 0

Y
t=pi/2

t=0 X
0 a

Рис. 34.6

После применения формул понижения степени тригонометрических функ-


ций получим
2 2 2
1 3 2 2 3 2 2 3 2
S a sin 2t (1 cos 2t )dt a sin 2t dt a sin 2 2t cos 2tdt
4 8 0
8 0
8 0

2 2 2
3 2 3 2 2 3 2 3 2 2
a (1 cos 4t )dt a sin 2t d sin 2t at a sin 4t 0
16 0
16 0
16 0 64

1 2 3 2 3 2 3 2
a sin 2t a S a .
16 0 32 8

248
Лекция 35. Другие приложения определённого интеграла

В предыдущей лекции мы применили определенный интеграл к вы-


числению площадей фигур. Здесь будут рассмотрены другие его приложе-
ния.
35.1. Вычисление объёма тела с известной площадью поперечного
сечения. Пусть некоторое тело в направлении оси абсцисс находится в
пределах отрезка [ a, b ] . Как обычно, разбиваем этот отрезок на n частей
и через точки деления проводим плоскости P , перпендикулярные оси
Ox . Эти плоскости рассекут тело на «дольки». На рисунке изображена од-
на из них.

S ( xk ) S ( xk +1 )
P

x
a xk +1 b
xk ∆ x k

Рис. 35.1

Предполагается, что для каждого значения x известна площадь сечения


S ( x ) . Предполагается, что это непрерывная функция. Объём каждой
«дольки» можно приближённо вычислить как объём цилиндра с площадью
основания S ( xk ) и высотой ∆ xk . Поэтому объём тела приближённо равен
сумме объёмов таких цилиндров
n
V ≈ ∑ S ( xk )∆ xk
k =1
Точное значение объёма получим, увеличивая число n точек деления от-
резка [ a, b ] . При этом длина наибольшего из отрезков λ = max( ∆ xk ) долж-
k
на стремиться к нулю, т.е. находим предел интегральной суммы

n b
V = lim ∑ S ( xk )∆ xk = ∫ S ( x)d x
n→∞
λ →0 k =1 a

Пример. Найти объём части кругового цилиндра x 2 + y 2 = R 2 , отсе-


h
чённого плоскостями x = 0, z = 0, z = y .
R
249
z
h
z= y
R
h
y
R
x h
R R2 − x2
R
x R2 − x2

Рис. 35.2

Через фиксированную точку x ∈ [ 0, R ] проводим плоскость, перпендику-


лярно оси Ox . Сечение тела представляет собой прямоугольный тре-
угольник, площадь которого

1 h h
S ( x) = R 2 − x2 R2 − x2 = (R2 − x2 ) .
2 R 2R
Отсюда объём
R R R
h h x3 1
V = ∫ S ( x)d x = ∫ ( R − x )d x =
2 2
( R x − ) = hR 2 .
2

0
2R 0 2R 3 0 3

35.2.Вычисление объёмов тел вращения. Пусть криволинейная тра-


пеция, ограниченная кривой y = f ( x) , a ≤ x ≤ b , вращается относительно
оси Ox . Найдём объём полученного тела вращения.
y = f ( x)

a b

Рис. 35.3

Поскольку нам известна площадь поперечного сечения тела для каждого


значения x , а именно (сечение – круг): S ( x ) = π f 2 ( x ) ,то
b b
Vx = ∫ S ( x ) d x = π ∫ f 2 ( x ) d x .
a a

250
Пример. Найти объём тора («баранки»). Тор можно получить, вра-
щая относительно оси Ox окружность x 2 + ( y − a ) 2 = r 2

y
y2 = a + r 2 − x 2

y1 = a − r 2 − x 2
a

r
x

Рис. 35.4

Интересующий нас объём равен разности объёмов, полученных при вра-


щении кривых y1 и y2 . Поскольку фигура симметричная, то можно вы-
числять половину объёма

r r r
1
V = π∫ ( y22 − y12 ) d x = π∫ ( y1 + y2 )( y1 − y2 ) d x = 4aπ ∫ r 2 − x 2 d x
2 0 0 0

Применим подстановку x = r sin t . Тогда будем иметь

π π
2 2
1
V = 4aπ r ∫ cos (t ) d t = 2 aπ r ∫ (1 + cos 2t ) dt =
2 2 2

2 0 0
π
1 2
= 2aπ r 2 (t + sin 2t ) = aπ2 r 2 . Vтора = 2π2 ar 2 .
2 0

35.3. Несобственные интегралы. Вводя определённый интеграл как


предел интегральных сумм

b n

∫ f ( x)dx = nlim
→∞
∑ f ( xk )∆xk , λ = max ∆xk ,(35.1)
k
a λ→0 k =1

251
мы предполагали, что подынтегральная функция f ( x) непрерывна, а
промежуток интегрирования [ a, b ] конечной длины. Распространим поня-
тие определённого интеграла на более широкий класс функций. Пусть
функция имеет в промежутке [ a, b ] разрывы первого рода. В этом случае
под интегралом функции следует понимать сумму интегралов

b c b

∫ f ( x)dx = ∫ f ( x)dx + ∫ f ( x)dx ,


a a c

взятых по отдельным интервалам, в которых функция остаётся непрерыв-


ной (см. рис. 35.5).

f ( x)

a c b
Рис. 35.5

При этом и геометрическое значение интеграла как площади остаётся в си-


ле.
Иначе обстоит дело, когда функция имеет разрыв второго рода в ка-
кой либо точке внутри интервала интегрирования или на одном из его кон-
цов. Начнём с примера. Так, формально написанный интеграл

1
dx
∫ 0 x
(35.2)

не существует в обычном смысле, т.к. подынтегральная функция «уходит в


бесконечность» на левом конце промежутка интегрирования (см. рис.
35.6).Попытаемся придать вполне определённый смысл интегралу (35.2), а
значит, и понятию площади соответствующей бесконечной фигуры. Про-
ведем прямую x = ε и рассмотрим полученную криволинейную трапецию.
Ее площадь равна интегралу
1
dx
∫ x.
ε

252
y

1
f ( x) =
x
1
ε

O ε 1

Рис. 35.6

Определим интересующую нас площадь бесконечной фигуры с помощью


предельного перехода

1 1
dx
lim ∫ = lim 2 x = lim 2(1 − ε ) = 2 .
ε→0 x ε→0 ε ε→0
ε

В нашем примере предел оказался конечным. Таким образом, мы придали


смысл интегралу

1 1
dx dx

0 x
= lim ∫
ε→0
ε x
= 2.

Прежде чем дать общее определение интеграла от функции с беско-


нечными разрывами, заметим, что достаточно рассматривать только точки
разрыва на одном из концов промежутка интегрирования: если разрыв
внутри интервала, то интересующий нас интеграл разбивается в сумму
двух несобственных интегралов с точками разрывов, лежащих на концах.
Если в промежутке [ a, b ] функция f ( x) непрерывна, за исключени-
ем крайней точки (пусть для определённости это будет точка b ), то несоб-
ственный интеграл с бесконечными разрывами определяется как пре-
дел
b b −ε

∫ f ( x)dx = ε→
lim ∫
0
f ( x) dx, ε > 0 .
a a

В случае существования этого предела несобственный интеграл называют


сходящимся. В противном случае говорят, что несобственный интеграл не
существует или расходится.
Для сходимости несобственного интеграла разрывной функции не-
обходимо, чтобы эта функция «достаточно быстро» стремилась к беско-

253
нечности, когда аргумент стремится к точке разрыва. Что такое «достаточ-
но быстро» поясним на следующем примере. Рассмотрим несобственные
1
dx
интегралы вида ∫ p с параметром p > 0. Найдем
0
x
 1 1− p 1 1 (1 − p ), p < 1
lim x =  ∞,
dx 1 − p ε→0 p >1
1
ε 
lim ∫ p = 
ε→0 x
ε  1
lim
 ε→0 ln x ε
= ∞, p = 1

Таким образом, при p < 1 интеграл сходится, а при p ≥ 1 – расходится.


Этот пример показывает, что несобственный интеграл с бесконечным раз-
рывом оказывается сходящимся, если подынтегральная функция «уходит»
в бесконечность не медленнее, чем функция x − p с p < 1 .
Следующее важное обобщение понятия определённого интеграла за-
ключается в том, что один или оба из пределов интегрирования являются
бесконечными. Такие несобственные интегралы с бесконечными пре-
делами интегрирования определяются с помощью предельных переходов
следующим образом
∞ A

∫ f ( x)dx = Alim
→∞ ∫
f ( x) dx, a < A < +∞ ,
a a
b b

∫ f ( x ) dx = lim
B→ − ∞ ∫ f ( x)dx, − ∞ < B < b,
−∞ B
+∞ c +∞

∫ f ( x ) dx = ∫ f ( x ) dx + ∫ f ( x ) dx .
−∞ −∞ c

Если такие пределы существуют, то интегралы называют сходящимися, в


противном случае – расходящимися.
Пример 1. Найдем площадь фигуры, заключённой между кривой
y = 1/(1 + x 2 ) и осью абсцисс (см. рис. 35.7).

1.5 A
dx
1 ∫1+ x
0
2
2
y=1/(1+x )
0.5

-4 -3 -1 0 1 A 3 4

254
Рис. 35.7

Задача сводится к вычислению несобственного интеграла

+∞ +∞ A A
dx dx dx
∫ 1 + x 2 ∫ 1 + x 2 A→ ∞ ∫ 1 + x 2 = 2 Alim
= 2 = 2 lim
→∞
arctgx = 2 lim arctgA = π.
0 A→ ∞
−∞ 0 0

Интеграл оказался сходящимся, поэтому можно считать, что площадь этой


бесконечной фигуры равна π ≈ 3.14 кв.ед.
Пример 2.
+∞ A
dx dx A
∫ x A→+∞ ∫ x A→+∞ 0 = 2 Alim
= lim = lim 2 x
→+∞
A = +∞.
0 0

Этот несобственный интеграл – расходящийся.


Для сходимости несобственного интеграла с бесконечным пределом
необходимо, чтобы подынтегральная функция «достаточно быстро» стре-
милась к нулю, когда аргумент стремится к бесконечности. Что такое

dx
«достаточно быстро», показывают несобственные интегралы вида ∫ p
1
x
с параметром p > 0. Найдем

 1 1− p A 1 ( p − 1), p >1
= 
dx 
A lim x
lim ∫ p = 1 − p A→∞
1
∞, p < 1
A→∞ x
1  lim ln x A = ∞, p = 1
 A→∞ 1

Итак, при p > 1 интеграл сходится, а при p ≤ 1 – расходится. Таким обра-


зом, несобственный интеграл с бесконечным пределом оказывается схо-
дящимся, если подынтегральная функция стремится к нулю не медленнее,
чем функция x − p с p > 1 .

255
Раздел 7 . Математический анализ. Дифференциальное
исчисление функций многих переменных

Лекция 36. Функции многих переменных

36.1. Понятие функции многих переменных. До сих пор мы изучали


функции одной переменной. Теперь перейдём к изучению функций мно-
гих независимых переменных. Во-первых, к этому нас вынуждают практи-
ческие приложения, так как почти во всех взаимосвязях, встречающихся в
природе, функции, описывающие эти связи, зависят не от одного аргумен-
та, а от многих. Во-вторых, и с чисто математической точки зрения суще-
ствует необходимость в изучении свойств функций многих переменных.
При этом большей частью достаточно рассматривать функции только двух
переменных, поскольку для распространения результатов на функции трёх
и более аргументов не возникает необходимости в существенно новых рас-
суждениях. Поэтому для простоты формулировок и краткости записей ог-
раничимся случаем двух переменных там, где существо дела не зависит от
их числа.
Если каждой точке ( x , y ) , принадлежащей некоторому множеству
D плоскости xOy , поставлено в соответствие единственное действи-
тельное число z , то говорят, что на множестве D задана функция
двух независимых переменных f ( x , y ) .
В символической записи это выглядит следующим образом:

z = f ( x, y ), ( x, y ) ∈ D .

Множество D называется областью определения этой функции, а множе-


ство соответствующих значений z называется областью значений функ-
ции.
Пусть S – площадь прямоугольника с размерами x и y . Тогда
можно определить функцию двух переменных
S = x ⋅ y, D = {( x, y) : x > 0, y > 0} .
Пусть функция определена формулой z = 1 − x 2 − y 2 . Если функ-
ция задается формулой без указания области определения, то предполага-
ется «естественная» область определения, т.е. та область, где данная фор-
мула существует. В данном случае это замкнутый круг x 2 + y 2 ≤ 1 .
Если функцию одной переменной изображают графически с помощью
кривой, то функцию двух переменных представляют с помощью поверх-
ности. Иногда это легко сделать, как в приведённом выше примере функ-
ции
z = 1 − x2 − y2 .
256
Эта функция легко получается из уравнения сферы x 2 + y 2 + z 2 = 1 ,поэтому
её геометрический образ – полусфера радиуса R = 1 с центром в начале
координат, расположенная над плоскостью xOy .
Часто, особенно в картографии, функцию двух переменных изобра-
жают с помощью линий уровня. В плоскости xOy выделяют те точки, в
которых функция принимает одно и то же значение. Множество таких то-
чек и представляет собой линию уровняC , т.е. кривую, уравнение которой

f ( x, y ) = C , C = const .

Эта кривая есть проекция на плоскость xOy точек пересечения поверхно-


сти z = f ( x, y ) и плоскости z = C .По картине линий уровня можно полу-
чить представление о поверхности. Например, если линии уровня замкну-
ты в окрестности некоторой точки, то в этом месте поверхность имеет ли-
бо вершину, либо впадину. По «густоте» линий уровня можно судить о
крутизне склонов поверхности (см. рис. 36.1).

10

-5

-10
4
2 4
0 2
0
-2 -2
-4 -4

Рис. 36.1

36.2. Предел и непрерывность функции двух переменных. Приве-


дем предварительно определение ε -окрестности точки M 0 ( x0 , y0 ) как со-
вокупность точек M ( x, y ) , удовлетворяющих неравенству
( x − x0 ) 2 + ( y − y0 )2 < ε 2 .
Будем говорить, что последовательность точек

( x1 , y1 ),( x2 , y2 ),…,( xn , yn ),…

стремится или сходится к точке M 0 ( x0 , y0 ) , если расстояние


257
( xn − x0 ) 2 + ( yn − y0 ) 2

между n -м членом этой последовательности и точкой M 0 стремится к ну-


лю при n → ∞ .
Отметим, что в дальнейшем мы будем применять одну их эквивалент-
ных записей
 x → x0 ∆x → 0
 ⇔  ⇔ M → M0 .
 y → y 0  ∆y → 0

Определение предела функции двух переменных по форме ничем не


отличается от определения предела функции одной переменной: число A
называется пределом функции z = f ( x, y ) если для любой последова-
тельности точек ( x1 , y1 ),( x2 , y2 ),…,( xn , yn ),… сходящейся к точке ( x0 , y0 ) ,
соответствующая последовательность значений функции zn = f ( xn , yn )
сходится к A . Символически это записывается так

lim f ( x, y ) = A .
x → x0
y → y0

2xy
В качестве примера приведем функцию z = ,у которой не су-
x + y2
2

ществует предела в начале координат.

Рис.36.2

258
Действительно, пусть точка ( x, y ) движется к началу координат по
прямой y = kx, 0 < k < +∞ . Тогда
2 xkx 2k
lim 2 = ,
x →0 x + ( kx ) 2 1 + k 2
y →0

т.е. при стремлении аргументов к началу координат по разным направле-


ниям получаются различные «предельные» значения функции (см. рис.
36.2).
Понятие предела даёт возможность определить непрерывность функ-
ции в данной точке. А именно, функция z = f ( x, y ) непрерывна в точке
( x0 , y0 ) , если
lim f ( x, y ) = f ( x0 , y0 ) .
x → x0
y → y0

Если подробно «прочесть» это равенство, то непрерывность означает, что

• функция определена в данной точке и некоторой её окрестности;


• существует предел функции в этой точке;
• предел функции равен значению функции в этой точке.

При нарушении хотя бы одного из этих условий, говорят, что функция


имеет разрыв в данной точке. Свойство непрерывности через приращения
выражается так
lim[ f ( x0 + ∆x, y0 + ∆y ) − f ( x0 , y0 )] = 0 ,
∆x → 0
∆y → 0

т.е. непрерывность означает, что «малым» изменениям аргументов соот-


ветствуют «малые» изменения функции. Ясно, что эти понятия легко рас-
пространить на функции многих переменных.
Если функция непрерывна в любой точке некоторой области, то гово-
рят, что она непрерывна в этой области. Убедитесь, пользуясь определени-
ем непрерывности, что функция z = x 2 + y 2 непрерывна в любой точке
плоскости.
36.3. Частные производные, производная по направлению. Для
функции одной переменной производная в данной точке равна пределу от-
ношения приращения функции к приращению аргумента, когда последнее
стремится к нулю. В случае функции двух переменных приращения аргу-
ментов (∆x, ∆y ) из данной точки M 0 ( x0 , y0 ) в точку M ( x0 + ∆x, y0 + ∆y ) мо-
гут быть сделаны в любом направлении на плоскости. Это приводит к по-
нятию производной функции по направлению, которая характеризует ско-
рость изменения функции в выбранном направлении.

259
Начнем с простейшего случая, когда приращения происходят в на-
правлении оси абсцисс, т.е. когда ∆x ≠ 0, ∆y = 0 . В этом случае предел

f ( x0 + ∆x, y0 ) − f ( x0 , y0 ) ∂ f ( x0 , y0 )
lim = = f x′( x0 , y0 )
∆x →0 ∆x ∂x

называется частной производной функции f ( x, y ) по переменной x в


точке M 0 ( x0 , y0 ) . Аналогично можно определить частную производную по
переменной y
f ( x0 , y0 + ∆y ) − f ( x0 , y0 ) ∂ f ( x0 , y0 )
lim = = f y′( x0 , y0 ) .
∆y → 0 ∆y ∂y

Из этих определений непосредственно следует, что для нахождения


частной производной по данной переменной остальные переменные фик-
сируются и по обычным правилам дифференцирования отыскивается про-
изводная функции этой переменной. Например,

x ∂z 1 ∂z x
z= , = , =− 2 .
y ∂x y ∂y y

Выясним геометрический смысл частных производных. Пусть в не-


которой окрестности точки M 0 ( x0 , y0 ) задана функция z = f ( x, y ) , у кото-
рой в этой точке существуют частные производные. Зафиксируем одну из
переменных, например, переменную x .
z
z ( x) = f ( x, y0 )
z = f ( x, y )

z ( y ) = f ( x0 , y )
M0
y

B β
( x0 , y0 )

α
x A
Рис. 36.3

260
Тогда в плоскости x = x0 (см. рис. 36.3) мы получаем функцию одной пе-
ременной z ( y ) = f ( x0 , y ) . График этой функции – это сечение поверхности
z = f ( x, y ) плоскостью x = x0 . Значение её производной при y = y0 равно
значению частной производной по y функции f ( x, y ) в точке M 0 ( x0 , y0 )

dz ( y ) ∂f ( x0 , y ) ∂f ( x0 , y0 )
= = = tgβ ,
dy y = y0
∂y y = y0
∂y

где β – угол между касательной BM 0 к кривой z ( y ) = f ( x0 , y ) в точке M 0


и плоскостью xOy . Аналогичные рассуждения приводят к тому, что

∂f ( x0 , y0 )
= tg α ,
∂y

где α – угол между касательной AM 0 к кривой z ( x) = f ( x, y0 ) в точке


M 0 и плоскостью xOy .
Рассмотрим теперь понятие производной по направлению. Пусть в
области D , в которой определена функция z = f ( x, y ) , в некоторой внут-

ренней точке M 0 ( x0 , y0 ) задано направление вектором l (см. рис. 36.4).
Нас интересует поведение функции при движении точки M ( x, y ) в этом
направлении. Пусть t расстояние между точками M0 и M , а

e = cos α i + sin α j – единичный вектор заданного направления l . Тогда
  

координаты точки M ( x, y ) равны: x = x0 + t cos α , y = y0 + t sin α . Если


точка M стремится к точке M 0 в заданном направлении, то t → 0 .

y 
l
 D
e M ( x, y )
α

M 0 ( x0 , y0 )
x

Рис. 36.4

261
Производной функции z = f ( x, y ) в точке M 0 ( x0 , y0 ) в заданном

направлении l называется предел

f ( x0 + t cos α , y0 + t sin α ) − f ( x0 , y0 ) ∂f
lim =  . (36.1)
t →0 t ∂l

∂z ∂z
В частности, частные производные ; это производные по
∂x ∂y
направлению координатных осейOx и Oy соответственно. Оказывается,
что для функции, имеющей непрерывные частные производные, произ-
водная по направлению выражается через частные производные в данной
точке. Чтобы это доказать, нам необходимо научиться находить частные
производные сложных функций.

262
Лекция 37. Производные сложных функций

37.1. Дифференцирование сложных функций. Будем предполагать,


что функция z = f ( x, y ) имеет непрерывные частные производные в об-
ласти D , а функции x(t ) и y (t ) имеют непрерывные производные в про-
межутке α ≤ t ≤ β . Тогда функция z = f ( x(t ), y(t )) – сложная функция од-
dz
ной переменной t . Для производной этой функции справедлива сле-
dt
дующая формула
dz ∂f dx ∂f dy
= + .(37.1)
dt ∂x dt ∂y dt

Для доказательства рассмотрим приращение

∆z = f ( x, y ) − f ( x0 , y0 ) = f ( x, y ) − f ( x0 , y ) + f ( x0 , y ) − f ( x0 , y0 ) .

В первой из разностей изменяется только x , а во второй – только y ,


т.е.каждая из этих разностей – это функция одной переменной. Применим
к ним формулу Лагранжа (формулу конечных приращений)

∆z = f x′(ξ, y )( x − x0 ) + f y′ ( x0 , η)( y − y0 ) ,

где ξ лежит в интервале между x и x0 , а η – между y и y0 . К разно-


стям x − x0 и y − y0 опять применим формулу Лагранжа

x − x0 = x (t ) − x (t0 ) = x′(t1 )(t − t0 ) = x′(t1 ) ∆t

y − y0 = y (t ) − y (t0 ) = y′(t2 )(t − t0 ) = y′(t2 ) ∆t ,

где t1 , t2 расположены между t и t0 . Таким образом,

∆z
= f x′(ξ, y ) x′(t1 ) + f y′( x0 , η) y′(t2 ) .
∆t

Переходя в этом равенстве к пределу и замечая, что при ∆t → 0 имеем

t → t0 ⇒ t1 , t 2 → t0 ⇒ x → x0 , y → y0 ⇒ ξ → x0 ,η → y0 ,

с учетом непрерывности всех, входящих в это равенство функций, получа-


ем

263
 dz 
  = f x′( x0 , y0 ) x′(t0 ) + f y′( x0 , y0 ) y′(t0 ) .
 dt t0
В силу произвольности значения t0 приходим к формуле (37.1).
Заметим, что это естественное обобщение формулы производной
сложной функции одной переменной. В случае большего числа перемен-
ных, например, если z = f (u (t ), v(t ), w(t )) , то
dz ∂f du ∂f dv ∂f dw
= + + .
dt ∂u dt ∂v dt ∂w dt

37.2. Вычисление производной по направлению. Теперь мы можем


получить формулу для вычисления производной по направлению. В самом
деле, согласно определению (37.1) производная по направлению совпадает
с производной от сложной функцией z = f ( x, y ) , где
x (t ) = x0 + t cos α, y (t ) = y0 + t sin α . Применяя формулу (37.1), получаем

∂z ∂f ∂f
 = cos α + sin α . (37.2)
∂l ∂x ∂y

Обратим только внимание на тот факт, что в определении производной по


направлению мы приближаемся к данной точке с одной стороны, т.е. име-
ем односторонний предел. Например, частная производная по отрицатель-
ному направлению оси абсцисс отличается знаком от частной производной
по переменной x .
Аналогичным образом вводится понятие производной по направле-
нию для функции трёх переменных u = F ( x, y, z )

∂u ∂F ∂F ∂F
= cos α + cos β + cos γ,
∂l ∂x ∂y ∂z

где e = cos α i + cosβ j + cos γ k – единичный вектор заданного направления
  

l , а α, β, γ – углы между осями координат и этим вектором.




Приведём без доказательства формулы для производной сложной


функции z = f (u, v) , u = u ( x, y ), v = v( x, y ) . В итоге

z = f (u ( x, y ), v( x, y )) = Φ( x, y)

будет функцией двух переменных и ее частные производные находятся по


формулам
∂z ∂f ∂u ∂f ∂v ∂z ∂f ∂u ∂f ∂v
= + , = + .
∂x ∂u ∂x ∂v ∂x ∂y ∂u ∂y ∂v ∂y
264
37.3. Дифференцирование неявных функций. Полученные нами
правила дифференцирования сложных функций позволяют более просто,
чем ранее, находить производные функций, заданных неявно. Пусть урав-
нение F ( x, y ) = 0 определяет y = ϕ( x) как некоторую дифференцируемую
функцию. Тогда имеем тождество F ( x, ϕ ( x)) ≡ 0 .
Дифференцируем его по переменной x , рассматривая левую часть
x = x
как сложную функцию одной переменной, где  .
 y = ϕ( x)

∂F dx ∂F dy dy ∂F ∂F
+ =0 ⇒ =− . (37.3)
∂x dx ∂y dx dx ∂x ∂y

Пусть теперь уравнение F ( x, y, z ) = 0 определяет z = z ( x, y ) как не-


которую функцию двух переменных, у которой существуют частные про-
изводные. Как их найти?
Продифференцируем тождество F ( x, y, z ( x, y)) ≡ 0 по переменной x ,
рассматривая его левую часть как сложную функцию F (u, v, w) , где «про-
межуточные» функции имеют вид: u = x , v = y , z = z ( x, y ) :

∂F dx ∂F dy ∂F ∂z
+ + = 0.
∂x dx ∂y dx ∂z ∂x
dy
Поскольку x и y независимые переменные, то = 0 и, следовательно,
dx
∂z ∂F ∂F
=− .
∂x ∂x ∂z
Аналогично, из равенства
∂F dx ∂F dy ∂F ∂z
+ + =0
∂x dy ∂y dy ∂z ∂y
получаем
∂z ∂F ∂F
=− .
∂y ∂y ∂z

37.4. Градиент. При исследовании поведения функции двух перемен-


ных в данной точке естественно задаться вопросом: в каком направлении
производная самая большая? Другими словами, в каком направлении у по-
верхности z = f ( x, y ) в данной точке самый крутой склон?
Для ответа на этот вопрос введем следующий вектор
 ∂f  ∂f 
grad z = i + j,
∂x ∂y
265
называемый градиентом. Предполагаем, что этот вектор не нулевой. Тогда
согласно (37.2) производная по направлению в данной точке равна скаляр-
ному произведению градиента в этой точке на единичный вектор заданно-
го направления
∂z ∂f ∂f  
 = cos α + sin α = ( gradz , e ) .
∂l ∂x ∂y
Из равенства
∂z    
 = ( gradz, e ) = gradz ⋅ e cos ϕ ,
∂l

где ϕ – угол между векторами, видно, что направление наибольшего воз-


растания функции должно совпадать с направлением градиента функции в
данной точке, т.к. наибольшее значение правой части этого равенства дос-
тигается при ϕ = 0 . Теперь становится понятным геометрический смысл
градиента.
Градиент – это вектор, указывающий направление наибольшего воз-
растания функции в данной точке. Название происходит от латинского

gradior – идти вперёд. Термин и обозначение grad f ввёл Максвелл, по-
заимствовав его из метеорологии. При первом появлении (1873г.) он наме-
ревался дать название «скат» или «склон» скалярной функции f , исполь-
зуя слово slope, чтобы указать направление наиболее быстрого убывания
функции f . Это свойство градиента применяется для численного поиска
экстремумов функции многих переменных.
В трёхмерном случае градиент определяется как вектор, координаты
которого есть частные производные скалярной функции u = F ( x, y, z )

 ∂F  ∂F  ∂F 
gradF = i+ j+ k.
∂x ∂y ∂z

Выясним геометрический смысл модуля градиента функции двух пе-


ременных. Пусть e – единичный вектор направления наибольшего воз-

растания функции в данной точке. Тогда производная по этому направле-
нию равна
∂z   
 = ( gradz, e ) = gradz = z′x + z′y .
2 2

∂e
отсюда следует, что модуль градиента – это «скорость» изменения функ-
ции в направлении наибольшего возрастания функции в данной точке. Как
характеризует величина этой «скорости» поверхность z = f ( x, y ) в окрест-
ности данной точки? Рассмотрим сечение поверхности вертикальной
плоскостью, проходящей через точку M ( x0 , y0 ) и вектор e (см. рис. 37.1).


266
z = f ( x, y )

M1


e

α M 0 ( x0 , y0 )
B
Рис. 37.1

Касательная BM 1 к сечению поверхности в точке M 1 ( x0 , y0 , z0 ) составляет


с вектором e , а значит и с плоскостью xOy , угол α , тангенс которого


равен
∂z 
tgα =  = gradz = z′x 2 + z′y 2 .
∂e

Эту величину называют крутизной подъёма поверхности в данной точке.


Теперь убедимся в том, что в каждой точке градиент направлен по
нормали к линии уровня f ( x, y) = C , проходящей через данную точку.
Пусть функция z = f ( x, y ) имеет непрерывные частные производные, а её
линия уровня, проходящая через точку M 0 ( x0 , y0 ) , имеет касательную в
этой точке. Обозначим направление этой касательной единичным векто-
ром e . Тогда производная по этому направлению в точке M 0 из интуи-


тивных соображений должна быть равна нулю. Убедимся в этом.


Угловой коэффициент k1 касательной к линии уровня f ( x, y) = C с
учетом формулы (1.4) дифференцирования неявно заданной функции ра-
вен
dy ∂f ∂f
k1 = =− .
dx ∂x ∂y

С другой стороны, угловой коэффициент k 2 прямой «в направлении гра-


∂f ∂f
диента» равен k2 = . Так как k1k2 = −1 , то эти прямые взаимно пер-
∂y ∂x
пендикулярны (см. рис. 37.2), т.е. производная в направлении касательной
к линии уровня равна нулю

267
∂z  
 gradz , e ) = 0 .
= (
∂e


e gradz
f ( x, y ) = C 90o

M0
k1 = tg α
k2 = tgβ
α
β

Рис.37.2

Пример. Найти направление наибольшего возрастания функции

z = 4 − x 2 − 0,25 y 2

и крутизну подъёма её графика в точке M 0 (1, 2) .


Искомое направление будет указывать градиент этой функции в дан-
ной точке. Находим его (см. рис. 37.3)

grad z = −2x ⋅ i − 0,5y ⋅ j = − 2i − j
   
x=1
y=2

y
β
α

M 0 (1, 2)

Рис.37.3

Крутизна подъёма поверхности в данной точке равна (см. рис. 37.4)

tg ϕ = −2i − j = 5 ⇒ ϕ ≈ 660 .
 

268
z

Рис. 37.4

37.5. Касательная плоскость и нормаль к поверхности. Пусть по-


верхность задана уравнением F ( x, y, z ) = 0 . Будем предполагать, что в
 ∂F   ∂F 
точке поверхности M 0 ( x0 , y0 ,z0 ) частные производные   ,   ,
 ∂x 0  ∂y 0
 ∂F 
  существуют, непрерывны и хотя бы одна из них отлична от нуля.
 ∂z 0
Рассмотрим на поверхности некоторую кривую L , проходящую через
точку M 0 . Пусть она задана параметрическими уравнениями

 x = x(t )

 y = y (t ) , M 0 ( x0 , y0 , z0 ) = M 0 ( x (t0 ), y (t0 ), z (t0 )) .
 z = z (t )

Будем предполагать, что функции x(t ), y(t ), z (t ) дифференцируемы при


значении параметра t = t0 , соответствующем точке M 0 . Поскольку кри-
вая L принадлежит поверхности, то имеем тождество F ( x(t ), y (t ), z (t )) ≡ 0 ,
левая часть которого дифференцируема в точке t = t0 как сложная функция.
Дифференцируя это тождество, получаем

∂F dx ∂F dy ∂F dz
+ + ≡ 0. (37.4)
∂x dt ∂y dt ∂z dt

269
Рассмотрим два вектора
 ∂F    ∂F    ∂F  
gradF ( x0 , y0 , z0 ) =   i +  j +  k
 ∂x 0  ∂y 0  ∂x 0

и l = x′(t0 )i + y′(t0 ) j + z′(t0 ) k . Вектор l это касательный вектор к кри-


    

вой L в точке M 0 . Тождество (1.5) показывает, что эти два вектора


перпендикулярны, т.к. их скалярное произведение равно нулю. Очевидно,
что тождество (37.4) будет выполняться для любой кривой, лежащей на
поверхности и проходящей через точку M 0 . Итак, касательный вектор к
любой кривой на поверхности, проходящей через точку M 0 , перпендику-
лярен к фиксированному вектору gradF ( x0 , y0 , z0 ) . Поэтому все эти векто-
ры лежат в одной плоскости. Эта плоскость называется касательной
плоскостью к поверхности в данной точке (см. рис. 37.5).

( gradF )0


l1

M0

L1 
L2 l2

Рис. 37.5

Уравнение касательной плоскости к поверхности, заданной уравнени-


ем F ( x, y, z ) = 0 , имеет вид
 ∂F   ∂F   ∂F 
  ( x − x0 ) +   ( y − y0 ) +   ( z − z0 ) = 0 .
 ∂x 0  ∂y 0  ∂z 0

Прямая, перпендикулярная к касательной плоскости к поверхности и


проходящая через точку касания, называется нормалью к поверхности.
Заметим, что вектор gradF ( x0 , y0 , z0 ) можно рассматривать в качестве на-
правляющего вектора нормали. Напишем её канонические уравнения

270
x − x0 y − y0 z − z0
= = .
 ∂F   ∂F   ∂F 
   ∂y   
 ∂x 0  0  ∂z 0

Если поверхность задана в виде z = f ( x, y ) , то уравнения касатель-


ной плоскости и нормали приобретают вид

 ∂f   ∂f 
  ( x − x ) +   ( y − y0 ) − ( z − z0 ) = 0 ,
 ∂x  0  ∂y 0
0

x − x0 y − y0 z − z0
= = .
 ∂F   ∂F  −1
   
 ∂x 0  ∂x 0

271
Лекция 38. Дифференциал и экстремумы функции двух
переменных

38.1. Дифференцируемость функции двух переменных. Диффе-


ренциал. Вспомним, что дифференцируемость функции одной перемен-
ной y = f ( x) в данной точке означает существование производной функ-
ции в этой точке. Если функция y = f ( x) дифференцируема в точке x0 ,
то её приращение в этой точке может быть представлено в виде

∆y = f ′( x0 ) ⋅ ∆x + α(∆x)∆x ,

где α(∆x) → 0 при ∆x → 0 . Более подробная запись этой формулы

y − y0 = f ′( x0 )( x − x0 ) + α( ∆x) ∆x

«раскрывает» и геометрическое содержание свойства дифференцируемо-


сти: в окрестности точки x0 кривая y = f ( x) отличается от своей каса-
тельной в этой точке
Y = y0 + f ′( x0 )( x − x0 )

на бесконечно малую величину более высокого порядка, чем ∆x (см. рис.


38.1).
y y = f ( x)

( x, y ) касательная

( x, Y )

x
x0 x0 + ∆x
Рис. 38.1

Как перенести это свойство на функции двух переменных? Нельзя


ли функцию z = f ( x, y ) , имеющую в точке ( x0 , y0 ) непрерывные частные
производные, представить приближённо в виде линейной функции двух
переменных, т.е. чтобы её приращение в точке ( x0 , y0 ) имело вид

 ∂f   ∂f 
∆z =   ∆x +   ∆y + α ( ∆x, ∆y ) ∆ρ , (38.1)
 ∂x  0  ∂y  0
272
где ∆ρ = ∆x 2 + ∆y 2 , а величина α(∆x, ∆y ) → 0 при ∆x → 0 и ∆y → 0 , т.е.
при ∆ρ → 0 . Другими словами, нельзя ли в окрестности точки ( x0 , y0 ) по-
верхность z = f ( x, y ) «приблизить» плоскостью

 ∂f   ∂f 
  ( x − x0 ) +   ( y − y0 ) − ( z − z0 ) = 0 ?
 ∂x  0  ∂y 0

Оказывается, можно, если функция «достаточно хороша».


Дадим теперь определение дифференцируемой функции двух пере-
менных. Функция z = f ( x, y ) дифференцируема в точке ( x0 , y0 ) , если её
приращение в этой точке может быть представлено в виде (38.1). Ясно, что
из дифференцируемости следует непрерывность. Действительно, перейдя в
равенстве (38.1) к пределу, получим lim ∆z = 0 , что и означает свойство
∆ρ →0

непрерывности.
Покажем, что существование частных производных в данной точке не
влечёт за собой дифференцируемости функции в этой точке. Если в точке
 ∂f   ∂f 
( x0 , y0 ) существуют частные производные   ,   , то формально
 ∂x 0  ∂y 0
уравнение плоскости можно написать, но назвать её касательной плоско-
стью в указанном выше смысле нельзя. Например, непрерывная функция

z= | x |⋅| y |

имеет в начале координат частные производные равные нулю.

| ∆x | ⋅0 − 0 0⋅ | ∆y | − 0
f x′ = lim = 0, f y′ = lim = 0.
∆x →0 ∆x ∆y →0 ∆y
Приращение этой функции в начале координат равно ∆z = ∆x ⋅ ∆y . Но
эта величина не является бесконечно малой более высокого порядка, чем
∆ρ = ∆x 2 + ∆y 2 . Действительно, если ∆x = ∆y , то отношение

| ∆x | ⋅ | ∆y | 1
=
∆x 2 + ∆y 2 2

не стремится к нулю при ∆ρ → 0 . Поэтому плоскость z = 0 нельзя счи-


тать касательной плоскостью к этой поверхности в точке (0,0) (см. рис.
38.2).
273
Рис. 1.12
2

1.5

0.5

0
1

0.5

x 0 1
0.5
-0.5 0

-1
-0.5 y
-1

Рис. 38.2

Дифференциалом функции z = f ( x, y ) в точке M 0 ( x0 , y0 ) называют


главную, линейную относительно приращений аргументов ∆x и ∆y
часть приращения функции ∆z в этой точке

 ∂f   ∂f 
( dz ) 0 =   ∆x +   ∆y .
 ∂x 0  ∂y 0

Поскольку точка M 0 ( x0 , y0 ) произвольная, то запишем формулу для диф-


ференциала, опуская нижний индекс. Учтём также, что дифференциалы
независимых переменных равны их приращениям. Итак,

∂f ∂f
dz = dx + dy .
∂x ∂y

Геометрический смысл дифференциала функции двух переменных


виден из следующего рисунка, на котором изображена поверхность и каса-
тельная плоскость к ней в некоторой точке, где дифференциал равен при-
ращению аппликаты касательной плоскости.
Отметим также, что дифференциал функции двух переменных при-
меняется, как и дифференциал функции одной переменной, для прибли-
женных вычислений по формуле

274
 ∂f   ∂f 
∆z ≈ (dz ) 0 =   ∆x +   ∆y .
 ∂x 0  ∂y 0

z = f ( x, y)
z
M ( x, y , z )

N ( x, y , Z )
M0
MP = ∆z
P ( x, y , z 0 ) NP = dz

y
z0
( x0 , y 0 )
x
( x, y )

Рис. 38.3

38.2. Производные и дифференциалы высших порядков. Для


функции двух переменных производные и дифференциалы высших поряд-
ков определяются аналогично соответствующим понятиям для функции
одной переменной. А именно, вторая частная производная, например, по x
определяется как частная производная по x от частной производной по x ,
т.е.
∂ 2 z ∂  ∂z 
=  .
∂x 2 ∂x  ∂x 

Читается это так: «дэ два зет по дэ икс квадрат». Последовательность, в


которой вычисляются смешанные производные, если они существуют и
непрерывны, не имеет значения. Например,

∂2 z ∂  ∂z  ∂  ∂z  ∂ 2 z
=  =  = .
∂x∂y ∂x  ∂y  ∂y  ∂x  ∂y∂x

Дифференциал второго порядка определяется как дифференциал от


дифференциала, т.е.
 ∂f ∂f 
d 2 z = d ( dz ) = d  dx + dy  .
 ∂x ∂y 
Отсюда следует, что

275
∂2 z 2 ∂2 z ∂2 z 2
d z = 2 dx + 2
2
dxdy + 2 dy
∂x ∂x∂y ∂y

при условии, что смешанные производные непрерывны. Аналогично опре-


деляются дифференциалы более высоких порядков.

38.3. Экстремумы функции многих переменных. Рассмотрим сна-


чала функцию двух независимых переменных z = f ( x, y ) , определённую в
области D , и изобразим её наглядно поверхностью в декартовой системе
координат xyz . Мы будем говорить, что функция имеет максимум в неко-
торой внутренней точке ( x0 , y0 ) ∈ D, если значения функции во всех точ-
ках некоторой ε -окрестности точки ( x0 , y0 ) меньше, чем значение функ-
ции в этой точке, т.е.
f ( x, y ) < f ( x0 , y0 ) .

Геометрически такому максимуму соответствует вершина на поверх-


ности (см. рис. 38.4)

zmax=f(x0,y0)

z=f(x,y)

(x0,y0)

Рис. 38.4

Аналогично минимум определяется неравенством f ( x, y ) > f ( x0 , y0 )


в некоторой окрестности точки ( x0 , y0 ) и соответствует «ямке» на поверх-
ности (см. рис. 38.4).
Для функции большего числа переменных понятия максимума и ми-
нимума определяется аналогично, только уже нельзя дать геометрической
иллюстрации. Функция u = f ( x, y,…) имеет в точке ( x0 , y0 ,…) максимум

276
(минимум), если она в некоторой окрестности этой точки принимает всюду
значения, меньшие (большие), чем в самой точке ( x0 , y0 ,…)
Как ив случае функции одной переменной, наряду со словами мак-
симум и минимум будем пользоваться термином экстремум, объеди-
няющим эти два понятия. Сформулируем теперь необходимые условия
существования экстремума, т.е. такие условия, которые непременно долж-
ны быть выполнены в точке M 0 ( x0 , y0 ,…), если функция имеет в этой точ-
ке экстремум.
Для того, чтобы дифференцируемая функция u = f ( x, y, z,…)
имела экстремум в точке M 0 ( x0 , y0 ,…), необходимо, чтобы все ее част-
ные производные обращались в этой точке в ноль, т.е. чтобы выпол-
нялись следующие равенства:

 f x′( x0 , y0 , z0 ,…) = 0
 f ′( x , y , z ,…) = 0
 y 0 0 0
 (38.2)
f ′( x
 z 0 0 0 , y , z ,…) = 0
 ⋯⋯⋯⋯⋯⋯⋯⋯

Эти условия легко получаются из известного необходимого условия экс-


тремума дифференцируемой функции одной переменной. В самом деле,
зафиксируем, например, переменные y = y0 , z = z0 , … и будем рассмат-
ривать функцию в окрестности точки M 0 как функцию f ( x, y0 , z0 ,…), за-
висящую только от x . Тогда она имеет экстремум при x = x0 , а необхо-
димым условием такого экстремума является равенство

f x′( x0 , y0 , z0 ,…) = 0 .

В случае дифференцируемой функции двух переменных z = f ( x, y )


z = f ( x, y ) это необходимое условие имеет простой геометрический
смысл: функция может иметь в точке M 0 ( x0 , y0 ) экстремум лишь в том
случае, если поверхность z = f ( x, y ) имеет в этой точке касательную
плоскость, параллельную плоскости xOy. Рассмотрим, например, функ-
цию z = xy . Необходимые условия показывают, что начало координат –
точка, подозрительная на экстремум. Однако в окрестности этой точки
функция принимает как положительные, так и отрицательные значении,
смотря по тому, в какой четверти берётся точка. Стало быть, в точке (0,0)
функция экстремума не имеет.
Точки, в которых выполняются необходимые условия экстремума
(38.2), называют, как и в случае функции одной переменной, стационар-
277
ными. Другие точки, в которых могут быть экстремумы, – это точки, в ко-
торых частные производные либо не существуют, либо обращаются в бес-
конечность. В совокупности со стационарными эти точки называют крити-
ческими. Например, рассмотрим функции z = x2 + y 2 , z = 3 x 2 + y 2 ,графики
которых получаются при вращении вокруг оси Oz кривых z =| y | и
z = 3 y 2 , соответственно (см. рис. 38.5). Очевидно, что обе эти функции
имеют минимум в начале координат.

y y
x
x
Рис. 38.5

Вместе с тем, частные производные в начале координат не существуют у


первой функции и обращаются в бесконечность у второй функции. Таким
образом, экстремумы могут находиться и в таких точках.
Пример. Дана система n материальных точек M k ( xk , yk , zk ) с мас-
сами mk . Из физических соображений ясно, что момент инерции этой сис-
темы имеет минимум относительно некоторой точки. Требуется найти эту
точку. Задача сводится к нахождению минимума функции трёх перемен-
ных
n
I ( x, y , z ) = ∑ mk  ( x − xk ) 2 + ( y − yk ) 2 + ( z − zk ) 2  .
k =1

Необходимое условие экстремума даёт возможность найти координа-


ты этой точки. Для этого нужно решить систему уравнений

 I x′ = 2∑ mk ( x − xk ) = 0

 I ′y = 2∑ mk ( y − yk ) = 0

 I z′ = 2∑ mk ( z − zk ) = 0

278
Убеждаемся, что искомая точка является центром масс (центром тяжести)
данной совокупности материальных точек

x= ∑m xk k
, y= ∑m y
k k
, z= ∑m z
k k
.
∑m k ∑m k ∑m k

Ясно, что суммирование в этих формулах производится по всем точкам.


Во многих случаях специальный характер решаемой задачи позволяет
судить о том, будет ли в стационарной точке экстремум и какой конкретно.
Например, в предыдущей задаче из физических соображений было ясно,
что есть точка пространства, где момент инерции системы материальных
точек принимает наименьшее значение. Желательно было бы иметь, как и
в случае функции одной переменной достаточные условия экстремума,
позволяющие различать среди стационарных точек те, где есть экстремум,
и определять, каков он: максимум или минимум.
Рассмотрим стационарную точку ( x0 , y0 ) функции z = f ( x, y ) , т.е.
точку в которой обращаются в нуль обе частные производные f x′ и f y′ .
Вычислим вторые производные в этой точке и введём, для краткости, сле-
дующие обозначения:
∂ 2 f ( x0 , y0 ) ∂ 2 f ( x0 , y0 ) ∂ 2 f ( x0 , y0 )
= A, = B , =C.
∂x 2 ∂x∂y ∂y 2
Примем без доказательства следующее правило:
• если в стационарной точке выполняется неравенство
AC − B 2 > 0 , то в этой точке функция z = f ( x , y ) имеет экстремум; при
этом, если A < 0 , то f ( x 0 , y 0 ) – максимум, если A > 0 , то f ( x 0 , y 0 ) –
минимум
• если в стационарной точке AC − B 2 < 0 ,то функция не имеет
экстремума в этой точке
• случай AC − B 2 = 0 требует дополнительного исследования.

Пример 1.Исследовать на экстремум функцию


z = 5 − 2 x + 6 y − 2 xy − x 2 .
Находим стационарные точки, решая систему

 z′x = −2 − 2 y − 2 x = 0
 ′ ⇒ M 0 (3, 4) .
zy = 6 − 2x

Вычисляем вторые производные в этой точке: A = −2, B = −2, C = 0 .


AC − B 2 = −4 < 0 , поэтому экстремума нет.
279
Лекция 39.Условный экстремум

39.1. Понятие условного экстремума. Весьма часто возникает задача


не просто найти экстремум функции n переменных u = f ( x, y,...) ,а найти её
экстремум при дополнительных условиях, связывающих переменные по-
средством m уравнений связей ( m < n )

g k ( x, y ,...) = 0, k = 1,..., m .

Такие экстремумы называют условными. Например, пусть требуется най-


ти минимум функции
f ( x, y ) = x 2 + y 2

при дополнительном условии x + y = 1 . Следующий рисунок делает ре-


шение задачи очевидным.
z

x + y =1

z ( x) = 2 x 2 − 2 x + 1
y
1
1
1zmin = 0, 5 (0,5;0,5)
x
Рис. 39.1

С учётом уравнения связи мы на самом деле имеем функцию одной пере-


менной
f ( x, 1 − x ) = 2 x 2 − 2 x + 1

и её экстремум легко находится. Следовательно, функция

f ( x, y ) = x 2 + y 2

имеет условный минимум f min = 0,5 в точке (0,5; 0,5) .


Таким образом, задача нахождения условных экстремумов не являет-
ся принципиально новой. Разрешая уравнения связи относительно m не-
280
известных и подставляя их в исходную функцию, мы получаем задачу
отыскания безусловного экстремума функции меньшего ( n − m ) числа
переменных. Если задача разрешения уравнений связи не вызывает труд-
ностей, то так и следует поступать. Но весьма часто это либо трудоёмкая
задача, либо принципиально неразрешимая (вспомним, что не всегда
можно перейти от неявного задания функции к её явному заданию).

39.2. Метод множителей Лагранжа. Представляется важным найти


некоторую универсальную формулировку необходимых условий условно-
го экстремума. Такая формулировка была предложена французским учё-
ным Лагранжем (1736–1813 гг.).
Пусть требуется найти экстремумы функции

u = f ( x1, x2 , ... , xn ) ,

причём её n аргументов подчинены m уравнениям связей ( m < n ) :

gk ( x1, x2 , ... , xn ) = 0, k = 1, ... , m .

Введём m так называемых неопределённых множителей Лагранжа


λ1 , λ 2 ,⋯ , λ m и образуем функцию Лагранжа

F = f + λ1 g1 + λ 2 g 2 + ... + λ m g m .

Эта функция зависит от n + m переменных: x1 , ... , xn , λ 1 , ... , λ m . Запишем


для нее необходимые условия экстремума

∂F ∂F ∂F ∂F
= 0 ,…, = 0, = 0 ,…, = 0. (39.1)
∂ x1 ∂ xn ∂ λ1 ∂ λm

Заметим, что последние m уравнений в (39.1) совпадают с уравне-


ниями связей. Оказывается, что необходимые условия экстремума функ-
ции Лагранжа являются одновременно необходимыми условиями условно-
го экстремума исходной функции.
Чтобы в какой-то мере «оправдать» метод множителей Лагранжа
ограничимся нахождением экстремума функции двух переменных с одним
уравнением связи. Допустим, что уравнение связи g ( x, y ) = 0 изображает-
ся гладкой кривой, т.е. кривой, в каждой точке которой существует каса-
тельная. Мы должны найти экстремум функции z = f ( x, y ) , когда точки
( x, y ) лежат на этой кривой. Двигаясь вдоль кривой g ( x, y ) = 0 , например,
281
слева направо, мы последовательно пересекаем линии уровня
f ( x, y ) = C . В точке ( x0 , y0 ) , где кривая g ( x, y ) = 0 касается одной из ли-
ний уровня f ( x, y ) = C* , следует ожидать максимума, т.к. при переходе
через эту точку возрастание C сменяется убыванием.

grad f

gradg

( x0 , y0 )
g ( x, y ) = 0

f ( x, y ) = C

Рис. 39.2

Тогда нормальные векторы в этой точке к кривой g ( x, y ) = 0 и к соответ-


ствующей линии уровня f ( x, y ) = C* коллинеарны. Эти векторы являются
градиентами функций f и g в точке касания:

 ∂ f ( x0 ,y0 ) ∂ f ( x0 , y0 ) 

∂ x
;
∂ y
 = f x′; f y′ { }
 
 ∂ g ( x0 ,y0 ) ∂ g ( x0 , y0 ) 

∂x
;
∂y
 = g ′x ; g ′y { }
 
f′ f′
Из условия коллинеарности этих векторов x = y = −λ
g ′x g ′y
следуют равенства
 f x′ + λ g ′x = 0
 ′ (39.2)
 f y + λ g ′y = 0

Таким образом, условия (39.2) выражают необходимые условия ус-


ловного экстремума. Образовав функцию Лагранжа

F ( x, y , λ ) = f ( x, y ) + λ g ( x, y ) ,

убеждаемся, что условия (39.2) совпадают с необходимыми условиями


экстремума этой функции.
282
Пример. Найти экстремумы функции f ( x, y ) = x 2 + y 2 при условии,
что её аргументы связаны соотношением 5 x 2 − 6 xy + 5 y 2 − 32 = 0 .
Образуем функцию Лагранжа

F ( x, y, λ) = x 2 + y 2 + λ( 5 x 2 − 6 xy + 5 y 2 − 32) .

Приравнивая к нулю её частные производные, получаем следующую сис-


тему для нахождения координат стационарных точек

 x + λ(5 x − 3 y ) = 0

 y + λ ( −3 x + 5 y ) = 0
 5 x 2 − 6 xy + 5 y 2 − 32 = 0

Исключаем из первых двух уравнений параметр λ , разделив одно из них


на другое
−3 + 5k y
k= , k= 0.
5 − 3k x0

Откуда k = ±1 или y0 = ± x0 . Третье уравнение системы даёт возмож-


ность найти конкретные значения координат стационарных точек. В случае
y0 = x0 находим точки ( 2 2; 2 2; − 0,5 ), ( − 2 2; − 2 2; − 0,5 ) . А если
y0 = − x0 , то получаем точки ( 2; − 2; − 1 8 ) , ( − 2; 2; − 1 8 ) .
Мы не касаемся вопроса о достаточных условиях экстремума в об-
щем случае. Его исследование завело бы нас слишком далеко. Как и в слу-
чае безусловного экстремума, в практических приложениях обыкновенно
заранее известно, что экстремум существует и каков его характер. Так, на-
пример, если на нашу задачу посмотреть с геометрической точки зрения
(см. рис. 39.3), то мы находим на эллипсе

5 x 2 − 6 xy + 5 y 2 − 32 = 0

точки, наиболее удалённые от начала координат и наиболее близкие к не-


му, т.к. функция
f ( x, y ) = x 2 + y 2

это квадрат искомого расстояния.


Очевидно, что в точках A ( 2 2; 2 2 ) и B ( −2 2; − 2 2 ) дости-
гается максимум f max = OA = OB = 4 , и отрезок AB = 8 это большая ось

283
эллипса. В точках C ( 2; − 2 ) и D ( − 2; 2 ) расстояние от начала ко-
ординат до точек эллипса минимально f min = OC = OD = 2 , и отрезок
CD = 4 является малой осью эллипса. Более того, мы знаем направление
осей эллипса. Большая ось эллипса образует угол α = 450 с осью абсцисс.
Таким образом, в системе координат x1Oy1 уравнение эллипса имеет вид

x12 y12
+ =1 .
16 4

Решая задачу на условный экстремум, мы «попутно» привели уравне-


ние эллипса 5 x 2 − 6 xy + 5 y 2 − 32 = 0 к каноническому виду.

y x1

y1 A
D
x

Рис. 39.3

284

Вам также может понравиться