Вы находитесь на странице: 1из 476

УДК 512.83+519.

6
ББК 22.143
Т 93

Т ы р т ы ш н и к о в Е. Е. Матричный анализ и линейная ал-


гебра. — М.: ФИЗМАТЛИТ, 2007. — 480 с. — ISBN 978-5-9221-0778-5.
В книге излагаются основы матричного анализа, линейной алгебры
и аналитической геометрии, при этом раскрываются глубокие связи
предмета с другими разделами математики и дается представление
о современных тенденциях его развития и приложениях к задачам
численного анализа.
Для студентов и преподавателей факультетов прикладной матема-
тики, математики и механики, физических и инженерных специально-
стей, а также лиц, профессионально применяющих методы матричного
анализа и линейной алгебры.
Рекомендовано Министерством образования и науки Российской
Федерации в качестве учебного пособия для студентов высших учеб-
ных заведений, обучающихся по направлениям подготовки «Математи-
ка», «Прикладная математика и информатика».


c ФИЗМАТЛИТ, 2007
ISBN 978-5-9221-0778-5 
c Е. Е. Тыртышников, 2007
ОГЛАВЛЕНИЕ

Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Лекция 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.1. Линейные отображения и матрицы . . . . . . . . . . . . . . . . . . . 23
1.2. Умножение матриц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3. Ассоциативность умножения матриц . . . . . . . . . . . . . . . . . . 24
1.4. Некоммутативность умножения матриц . . . . . . . . . . . . . . . . 25
1.5. Сложение матриц и умножение на число . . . . . . . . . . . . . . . 25
1.6. Умножение блочных матриц . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7. Вычислительный аспект умножения матриц. . . . . . . . . . . . . 26
1.8. Хороша ли программа? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.9. Метод Винограда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.10. Метод Штрассена . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.11. Рекурсия для (n × n)-матриц. . . . . . . . . . . . . . . . . . . . . . . . 28

Лекция 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1. Множества и элементы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2. Отображения, функции, операторы . . . . . . . . . . . . . . . . . . . 31
2.3. Алгебраические операции . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4. Ассоциативность и скобки . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5. Ассоциативность при умножении матриц . . . . . . . . . . . . . . . 33
2.6. Группы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7. Примеры абелевых групп. . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.8. Группа невырожденных диагональных матриц . . . . . . . . . . . 34
2.9. Группа невырожденных треугольных матриц . . . . . . . . . . . . 35
2.10. Подгруппы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4 Оглавление

2.11. Степени элемента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36


2.12. Циклические группы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Лекция 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.1. Система линейных алгебраических уравнений . . . . . . . . . . . 37
3.2. Линейные комбинации . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3. Линейная зависимость . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4. Линейная независимость . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.5. Транзитивность линейной зависимости . . . . . . . . . . . . . . . . 40
3.6. Монотонность числа линейно независимых векторов . . . . . . 40
3.7. Базис и размерность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.8. Дополнение до базиса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.9. Существование базиса. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.10. Совместность системы линейных алгебраических уравнений 43

Лекция 4 . . . . . . . . . . . . . . . . . . . . . . .......... . . . . . . . 44
4.1. Индикатор линейной зависимости . . . .......... . . . . . . . 44
4.2. Подстановки и перестановки . . . . . . . .......... . . . . . . . 44
4.3. Циклы и транспозиции . . . . . . . . . . . .......... . . . . . . . 46
4.4. Четность подстановки . . . . . . . . . . . . .......... . . . . . . . 47
4.5. Единственность индикатора линейной зависимости . . . . . . . 49
4.6. Определитель . . . . . . . . . . . . . . . . . . .......... . . . . . . . 50

Лекция 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.1. Определитель транспонированной матрицы . . . . . . . . . . . . . 52
5.2. Определитель как функция столбцов (строк) матрицы . . . . . 53
5.3. Существование индикатора линейной зависимости. . . . . . . . 54
5.4. Подматрицы и миноры. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.5. Замечание о подстановках . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.6. Разбиение множества подстановок на подмножества . . . . . . 56
5.7. Теорема Лапласа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.8. Определитель блочно-треугольной матрицы . . . . . . . . . . . . . 59

Лекция 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.1. Обратная матрица . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Оглавление 5

6.2. Критерий обратимости матрицы. . . . . . . . . . . . . . . . . . . . . . 61


6.3. Обращение и транспонирование. . . . . . . . . . . . . . . . . . . . . . 62
6.4. Группа обратимых матриц . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.5. Обращение невырожденной матрицы . . . . . . . . . . . . . . . . . . 63
6.6. Правило Крамера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6.7. Определитель произведения матриц. . . . . . . . . . . . . . . . . . . 64
6.8. Обратимость и невырожденность . . . . . . . . . . . . . . . . . . . . . 65

Лекция 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.1. Разделение переменных и матрицы . . . . . . . . . . . . . . . . . . . 67
7.2. Скелетное разложение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.3. Ранг матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
7.4. Окаймление обратимой подматрицы. . . . . . . . . . . . . . . . . . . 69
7.5. Теорема о базисном миноре . . . . . . . . . . . . . . . . . . . . . . . . . 70
7.6. Ранги и матричные операции. . . . . . . . . . . . . . . . . . . . . . . . 71
7.7. Однородная система линейных алгебраических уравнений . . 73
7.8. Теорема Кронекера–Капелли . . . . . . . . . . . . . . . . . . . . . . . . 75
7.9. Общее решение системы линейных алгебраических уравне-
ний . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7.10. Неустойчивость ранга . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

Лекция 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.1. Исключение неизвестных . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.2. Элементарные матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.3. Ступенчатые матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8.4. Приведение к ступенчатой форме . . . . . . . . . . . . . . . . . . . . 80
8.5. Приведение к диагональной форме . . . . . . . . . . . . . . . . . . . 81
8.6. Эквивалентные матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.7. Метод Гаусса и LU -разложение. . . . . . . . . . . . . . . . . . . . . . 82
8.8. LU -разложение и строго регулярные матрицы . . . . . . . . . . . 83

Лекция 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
9.1. Метод координат. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
9.2. Направленные отрезки . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
9.3. Отношение эквивалентности . . . . . . . . . . . . . . . . . . . . . . . . 87
9.4. Свободный вектор . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6 Оглавление

9.5. Линейные операции над векторами . . . . . . . . . . . . . . . . . . . 89


9.6. Координаты вектора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
9.7. Изоморфизм и линейная зависимость . . . . . . . . . . . . . . . . . 91
9.8. Коллинеарные и компланарные векторы. . . . . . . . . . . . . . . . 92
9.9. Прямая на плоскости. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.10. Плоскость в пространстве . . . . . . . . . . . . . . . . . . . . . . . . . . 94
9.11. Преобразование координат . . . . . . . . . . . . . . . . . . . . . . . . . 95
9.12. Полуплоскости и полупространства . . . . . . . . . . . . . . . . . . . 96

Л е к ц и я 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
10.1. Скалярное произведение геометрических векторов . . . . . . . . 98
10.2. Скалярное произведение и координаты . . . . . . . . . . . . . . . . 99
10.3. Об обобщениях . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
10.4. Ориентация системы векторов . . . . . . . . . . . . . . . . . . . . . . . 100
10.5. Векторное и смешанное произведения . . . . . . . . . . . . . . . . . 101
10.6. Векторное произведение в декартовых координатах . . . . . . . 103
10.7. Смешанное произведение в декартовых координатах . . . . . . 104
10.8. Нормали к прямой и плоскости . . . . . . . . . . . . . . . . . . . . . . 105
10.9. Расстояние от точки до прямой на плоскости. . . . . . . . . . . . 105
10.10. Расстояние от точки до плоскости . . . . . . . . . . . . . . . . . . . . 106
10.11. Критерии параллельности вектора прямой и плоскости. . . . . 106

Л е к ц и я 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
11.1. Линейные пространства. . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
11.2. Примеры бесконечномерных линейных пространств . . . . . . . 110
11.3. Примеры конечномерных линейных пространств . . . . . . . . . 111
11.4. Базис и размерность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
11.5. Подпространства линейного пространства . . . . . . . . . . . . . . 113
11.6. Сумма и пересечение подпространств . . . . . . . . . . . . . . . . . 114

Л е к ц и я 12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
12.1. Разложение по базису . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
12.2. Изоморфизм линейных пространств . . . . . . . . . . . . . . . . . . . 117
12.3. Пространство многочленов . . . . . . . . . . . . . . . . . . . . . . . . . 118
12.4. Прямая сумма подпространств. . . . . . . . . . . . . . . . . . . . . . . 120
Оглавление 7

12.5. Дополнительные пространства и проекции. . . . . . . . . . . . . . 122


12.6. Вычисление подпространства. . . . . . . . . . . . . . . . . . . . . . . . 123

Л е к ц и я 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
13.1. Линейные многообразия . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
13.2. Аффинные множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
13.3. Гиперплоскости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
13.4. Полупространства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
13.5. Выпуклые множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

Л е к ц и я 14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
14.1. Комплексные числа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
14.2. Комплексная плоскость . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
14.3. Преобразования плоскости . . . . . . . . . . . . . . . . . . . . . . . . . 135
14.4. Корни из единицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
14.5. Группа корней степени n из единицы . . . . . . . . . . . . . . . . . 138
14.6. Матрицы с комплексными элементами. . . . . . . . . . . . . . . . . 139

Л е к ц и я 15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
15.1. Кольца и поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
15.2. Делители нуля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
15.3. Кольцо вычетов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
15.4. Вложения и изоморфизмы . . . . . . . . . . . . . . . . . . . . . . . . . . 144
15.5. Число элементов в конечном поле . . . . . . . . . . . . . . . . . . . . 145
15.6. Поле частных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

Л е к ц и я 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
16.1. Линейные пространства над полем . . . . . . . . . . . . . . . . . . . 148
16.2. Многочлены над полем . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
16.3. Кольцо многочленов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
16.4. Деление с остатком . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
16.5. Наибольший общий делитель . . . . . . . . . . . . . . . . . . . . . . . 153
16.6. Значения многочлена и корни . . . . . . . . . . . . . . . . . . . . . . . 154
16.7. Присоединение корня . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8 Оглавление

Л е к ц и я 17 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
17.1. Комплексные многочлены . . . . . . . . . . . . . . . . . . . . . . . . . . 157
17.2. Последовательности комплексных чисел . . . . . . . . . . . . . . . 157
17.3. Непрерывные функции на комплексной плоскости . . . . . . . . 158
17.4. Свойства модуля многочлена . . . . . . . . . . . . . . . . . . . . . . . . 159
17.5. Основная теорема алгебры. . . . . . . . . . . . . . . . . . . . . . . . . . 160
17.6. Разложение комплексных многочленов. . . . . . . . . . . . . . . . . 161
17.7. Разложение вещественных многочленов. . . . . . . . . . . . . . . . 162

Л е к ц и я 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
18.1. Формулы Виета . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
18.2. Многочлены от n переменных . . . . . . . . . . . . . . . . . . . . . . . 165
18.3. Лексикографическое упорядочение. . . . . . . . . . . . . . . . . . . . 166
18.4. Симметрические многочлены . . . . . . . . . . . . . . . . . . . . . . . . 167
18.5. Ньютоновы суммы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

Л е к ц и я 19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
19.1. Алгебраические многообразия . . . . . . . . . . . . . . . . . . . . . . . 170
19.2. Квадратичные многочлены от двух переменных . . . . . . . . . . 171
19.3. Поворот декартовой системы координат . . . . . . . . . . . . . . . . 171
19.4. Сдвиг декартовой системы координат . . . . . . . . . . . . . . . . . 173
19.5. Эллипс . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
19.6. Гипербола . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
19.7. Парабола . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

Л е к ц и я 20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
20.1. Квадратичные многочлены от трех переменных . . . . . . . . . . 181
20.2. Декартовы системы и ортогональные матрицы . . . . . . . . . . . 181
20.3. Метод вращений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
20.4. Вложенные подпоследовательности . . . . . . . . . . . . . . . . . . . 184
20.5. Диагонализация в пределе. . . . . . . . . . . . . . . . . . . . . . . . . . 185
20.6. Диагонализация вещественных симметричных матриц . . . . . 186

Л е к ц и я 21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
21.1. Приведенные уравнения поверхности второго порядка . . . . . 189
Оглавление 9

21.2. Эллипсоид . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190


21.3. Однополостный гиперболоид . . . . . . . . . . . . . . . . . . . . . . . . 191
21.4. Линейчатая поверхность . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
21.5. Двуполостный гиперболоид . . . . . . . . . . . . . . . . . . . . . . . . . 193
21.6. Эллиптический конус . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
21.7. Эллиптический параболоид . . . . . . . . . . . . . . . . . . . . . . . . . 193
21.8. Гиперболический параболоид . . . . . . . . . . . . . . . . . . . . . . . . 194
21.9. Цилиндрические поверхности . . . . . . . . . . . . . . . . . . . . . . . 194

Л е к ц и я 22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
22.1. Нормированное пространство . . . . . . . . . . . . . . . . . . . . . . . 195
22.2. Выпуклые функции и неравенства . . . . . . . . . . . . . . . . . . . . 196
22.3. Неравенства Гёльдера и Минковского . . . . . . . . . . . . . . . . . 197
22.4. Нормы Гёльдера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
22.5. Зачем нужны нормы?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
22.6. Нормы в бесконечномерном пространстве . . . . . . . . . . . . . . 200
22.7. Метрическое пространство . . . . . . . . . . . . . . . . . . . . . . . . . 201
22.8. Пределы и полнота . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

Л е к ц и я 23 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
23.1. Множества в метрическом пространстве . . . . . . . . . . . . . . . 203
23.2. Компактность и непрерывность . . . . . . . . . . . . . . . . . . . . . . 204
23.3. Компактность единичной сферы. . . . . . . . . . . . . . . . . . . . . . 205
23.4. Эквивалентные нормы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
23.5. Компактность замкнутых ограниченных множеств . . . . . . . . 207
23.6. Наилучшие приближения . . . . . . . . . . . . . . . . . . . . . . . . . . 208

Л е к ц и я 24 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
24.1. Евклидово пространство . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
24.2. Унитарное пространство . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
24.3. Билинейные и полуторалинейные формы . . . . . . . . . . . . . . . 211
24.4. Длина вектора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
24.5. Тождество параллелограмма . . . . . . . . . . . . . . . . . . . . . . . . 213
24.6. Ортогональность векторов . . . . . . . . . . . . . . . . . . . . . . . . . . 215
24.7. Ортогональность множеств . . . . . . . . . . . . . . . . . . . . . . . . . 216
10 Оглавление

24.8. Ортогональная сумма подпространств . . . . . . . . . . . . . . . . . 216

Л е к ц и я 25 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
25.1. Матрица Грама . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
25.2. Скалярное произведение в конечномерном пространстве. . . . 219
25.3. Перпендикуляр и проекция . . . . . . . . . . . . . . . . . . . . . . . . . 220
25.4. Ортогональные системы . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
25.5. Процесс ортогонализации . . . . . . . . . . . . . . . . . . . . . . . . . . 223
25.6. Дополнение до ортогонального базиса . . . . . . . . . . . . . . . . . 224
25.7. Биортогональные системы . . . . . . . . . . . . . . . . . . . . . . . . . . 224
25.8. QR-разложение матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . 225

Л е к ц и я 26 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
26.1. Линейные функционалы . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
26.2. Сопряженное пространство . . . . . . . . . . . . . . . . . . . . . . . . . 229
26.3. Примеры линейных функционалов . . . . . . . . . . . . . . . . . . . . 230
26.4. Размерность дополнительного пространства . . . . . . . . . . . . . 230
26.5. Линейные функционалы и гиперплоскости. . . . . . . . . . . . . . 231
26.6. Опорные гиперплоскости . . . . . . . . . . . . . . . . . . . . . . . . . . . 232

Л е к ц и я 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
27.1. Линейные операторы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
27.2. Непрерывность и ограниченность . . . . . . . . . . . . . . . . . . . . 236
27.3. Операторная норма . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
27.4. Матричная норма . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
27.5. Норма Фробениуса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
27.6. Сохранение норм. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
27.7. Унитарно инвариантные нормы . . . . . . . . . . . . . . . . . . . . . . 241
27.8. Сингулярное разложение матрицы . . . . . . . . . . . . . . . . . . . . 242

Л е к ц и я 28 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
28.1. Матрица линейного оператора . . . . . . . . . . . . . . . . . . . . . . . 245
28.2. Произведение линейных операторов. . . . . . . . . . . . . . . . . . . 246
28.3. Переход к другим базисам. . . . . . . . . . . . . . . . . . . . . . . . . . 247
28.4. Преобразование подобия . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
Оглавление 11

28.5. Инвариантные подпространства . . . . . . . . . . . . . . . . . . . . . . 249


28.6. Ядро и образ линейного оператора. . . . . . . . . . . . . . . . . . . . 250
28.7. Обратный оператор . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
28.8. Ортогональные дополнения ядра и образа . . . . . . . . . . . . . . 252

Л е к ц и я 29 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
29.1. Диагонализуемые матрицы . . . . . . . . . . . . . . . . . . . . . . . . . 254
29.2. Собственные значения и собственные векторы . . . . . . . . . . . 255
29.3. Собственные векторы для различных собственных значений 256
29.4. Характеристическое уравнение . . . . . . . . . . . . . . . . . . . . . . 257
29.5. Алгебраическая кратность собственного значения . . . . . . . . 258
29.6. Характеристический многочлен и подобие . . . . . . . . . . . . . . 258
29.7. Приведение к почти треугольной матрице . . . . . . . . . . . . . . 259
29.8. Матрицы Фробениуса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
29.9. Вычисление характеристического многочлена. . . . . . . . . . . . 261

Л е к ц и я 30 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
30.1. Одномерные инвариантные подпространства . . . . . . . . . . . . 263
30.2. Геометрическая кратность собственного значения . . . . . . . . 264
30.3. Матричное выражение инвариантности . . . . . . . . . . . . . . . . 264
30.4. Сужение оператора на подпространство . . . . . . . . . . . . . . . . 265
30.5. Инвариантные пространства и сдвиги . . . . . . . . . . . . . . . . . 265
30.6. Треугольная форма матрицы . . . . . . . . . . . . . . . . . . . . . . . . 265
30.7. Спектральный радиус . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
30.8. Теорема Шура . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
30.9. Делители и подпространства . . . . . . . . . . . . . . . . . . . . . . . . 269

Л е к ц и я 31 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
31.1. Многочлены от матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
31.2. Корневые пространства . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
31.3. Нильпотентные операторы . . . . . . . . . . . . . . . . . . . . . . . . . . 272
31.4. Корневое разложение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
31.5. Блочно-диагональная форма матрицы . . . . . . . . . . . . . . . . . 273
31.6. Теорема Гамильтона–Кэли . . . . . . . . . . . . . . . . . . . . . . . . . . 274
12 Оглавление

Л е к ц и я 32 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
32.1. Минимальное инвариантное подпространство . . . . . . . . . . . 276
32.2. Жордановы цепочки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
32.3. Жорданова форма матрицы . . . . . . . . . . . . . . . . . . . . . . . . . 277
32.4. Индекс собственного значения. . . . . . . . . . . . . . . . . . . . . . . 278
32.5. Жорданов базис в корневом пространстве . . . . . . . . . . . . . . 279
32.6. Существование и единственность жордановой формы. . . . . . 280
32.7. Инвариантные подпространства для вещественных матриц 281
32.8. Вещественный аналог жордановой формы . . . . . . . . . . . . . . 282
32.9. Вычисление жордановой формы . . . . . . . . . . . . . . . . . . . . . . 283

Л е к ц и я 33 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
33.1. Нормальные матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
33.2. Унитарные матрицы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
33.3. Матрицы отражения и вращения . . . . . . . . . . . . . . . . . . . . . 288
33.4. Эрмитовы матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
33.5. Эрмитово разложение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
33.6. Неотрицательная и положительная определенность . . . . . . . 290
33.7. Квадратный корень . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
33.8. Блочно-диагональная форма вещественной нормальной мат-
рицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
33.9. Блочно-диагональная форма ортогональной матрицы . . . . . . 292

Л е к ц и я 34 . . . . . . . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . 294
34.1. Матрица Фурье. . . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . 294
34.2. Циркулянтные матрицы. . . . . . . . . . . . . . . .... . . . . . . . . . 295
34.3. Алгебры матриц . . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . 297
34.4. Одновременное приведение к треугольному виду . . . . . . . . . 298
34.5. Быстрое преобразование Фурье . . . . . . . . . .... . . . . . . . . . 299

Л е к ц и я 35 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
35.1. Сингулярные числа и сингулярные векторы . . . . . . . . . . . . . 302
35.2. Полярное разложение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
35.3. Выводы из сингулярного разложения . . . . . . . . . . . . . . . . . . 304
35.4. Сингулярное разложение и решение систем . . . . . . . . . . . . . 305
Оглавление 13

35.5. Метод наименьших квадратов . . . . . . . . . . . . . . . . . . . . . . . 305


35.6. Псевдообратная матрица . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
35.7. Наилучшие аппроксимации с понижением ранга . . . . . . . . . 307
35.8. Расстояние до множества вырожденных матриц. . . . . . . . . . 309

Л е к ц и я 36 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
36.1. Квадратичные формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
36.2. Конгруэнтность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
36.3. Канонический вид квадратичной формы. . . . . . . . . . . . . . . . 311
36.4. Закон инерции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
36.5. Эрмитова конгруэнтность . . . . . . . . . . . . . . . . . . . . . . . . . . 313
36.6. Канонический вид пары квадратичных форм . . . . . . . . . . . . 313
36.7. Метод Лагранжа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
36.8. Метод квадратного корня . . . . . . . . . . . . . . . . . . . . . . . . . . 315
36.9. Критерий положительной определенности . . . . . . . . . . . . . . 318

Л е к ц и я 37 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
37.1. Разделение собственных значений эрмитовой матрицы. . . . . 319
37.2. Вариационные свойства собственных значений . . . . . . . . . . 321
37.3. Возмущения собственных значений . . . . . . . . . . . . . . . . . . . 322
37.4. Соотношения разделения. . . . . . . . . . . . . . . . . . . . . . . . . . . 323
37.5. Критерий неотрицательной определенности . . . . . . . . . . . . . 325
37.6. Вариационные свойства сингулярных чисел . . . . . . . . . . . . . 326
37.7. Разделение сингулярных чисел . . . . . . . . . . . . . . . . . . . . . . 327

Л е к ц и я 38 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
38.1. Сопряженный оператор . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
38.2. Матрица сопряженного оператора . . . . . . . . . . . . . . . . . . . . 330
38.3. Нормальный оператор . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
38.4. Самосопряженный оператор. . . . . . . . . . . . . . . . . . . . . . . . . 331
38.5. Минимизация на подпространствах . . . . . . . . . . . . . . . . . . . 332
38.6. Метод сопряженных градиентов . . . . . . . . . . . . . . . . . . . . . 333
38.7. Двучленные формулы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
14 Оглавление

Л е к ц и я 39 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
39.1. Спектральные задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
39.2. Непрерывность корней многочлена . . . . . . . . . . . . . . . . . . . 336
39.3. Возмущение спектра матрицы . . . . . . . . . . . . . . . . . . . . . . . 339
39.4. Преобразования отражения и вращения . . . . . . . . . . . . . . . . 339
39.5. Приведение к треугольному виду. . . . . . . . . . . . . . . . . . . . . 340
39.6. Приведение к почти треугольному виду . . . . . . . . . . . . . . . . 341
39.7. Приведение к двухдиагональному виду . . . . . . . . . . . . . . . . 341
39.8. Вычисление сингулярных чисел . . . . . . . . . . . . . . . . . . . . . . 342

Л е к ц и я 40 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
40.1. Многомерные массивы и матрицы . . . . . . . . . . . . . . . . . . . . 344
40.2. Трехмерные массивы и трилинейные разложения . . . . . . . . . 345
40.3. Сечения трехмерного массива . . . . . . . . . . . . . . . . . . . . . . . 345
40.4. Примеры трилинейных разложений . . . . . . . . . . . . . . . . . . . 346
40.5. Все не так. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
40.6. Эквивалентные трилинейные разложения. . . . . . . . . . . . . . . 348
40.7. Единственность с точностью до эквивалентности. . . . . . . . . 349
40.8. Тензорный ранг и умножение матриц. . . . . . . . . . . . . . . . . . 351

Дополнение к лекции 1 . . . . . . . . . . . . . . . . . . . ... . . 354


D 1.1. Параллельная форма алгоритма . . . . . . . . . . . . . . . . . ... . . 354
D 1.2. Схема сдваивания и параллельное умножение матриц ... . . 354
D 1.3. Матрицы и рекуррентные вычисления . . . . . . . . . . . . ... . . 355
D 1.4. Модели и реальность . . . . . . . . . . . . . . . . . . . . . . . . ... . . 356

Дополнение к лекции 2 . . . . . . . . . ............ . . . 357


D 2.1. Конечные группы . . . . . . . . . . . . . . . . . ............ . . . 357
D 2.2. Смежные классы, нормальные делители, фактор-группы . . . 358
D 2.3. Изоморфизмы групп . . . . . . . . . . . . . . . ............ . . . 358
D 2.4. Гомоморфизмы групп. . . . . . . . . . . . . . . ............ . . . 359
D 2.5. Избыточность в определении группы . . . ............ . . . 360

Д о п о л н е н и е к л е к ц и и 4 . . . . . . . . . . . . . . . . . . . . . . . . 361
D 4.1. Знакопеременная группа . . . . . . . . . . . . . . . . . . . . . . . . . . . 361
Оглавление 15

D 4.2. Подгруппы симметрической группы . . . . . . . . . . . . . . . . . . . 362


D 4.3. Четность без инверсий . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

Дополнение к л е к ц и и 5 . . . . . . . . . . . . . . . . . . . . . . . . 364
D 5.1. Функциональное доказательство теоремы Лапласа. . . . . . . . 364
D 5.2. Определители с нулевыми членами . . . . . . . . . . . . . . . . . . . 365

Дополнение к л е к ц и и 6 . . . . . . . . . . . . . . . . . . . . . . . . 367
D 6.1. Матрицы с диагональным преобладанием . . . . . . . . . . . . . . 367
D 6.2. Определитель и возмущения . . . . . . . . . . . . . . . . . . . . . . . . 368

Дополнение к л е к ц и и 8 . . . . . . . . . . . . . . . . . . . . . . . . 369
D 8.1. Выбор ведущего элемента . . . . . . . . . . . . . . . . . . . . . . . . . . 369
D 8.2. Вычисление обратной матрицы . . . . . . . . . . . . . . . . . . . . . . 371

Дополнение к л е к ц и и 13 . . . . . . . . . . . . . . . . . . . . . . . 373
D 13.1. Аффинная независимость . . . . . . . . . . . . . . . . . . . . . . . . . . 373
D 13.2. Линейные неравенства и минимизация . . . . . . . . . . . . . . . . 374

Дополнение к л е к ц и и 14 . . . . . . . . . . . . . . . . . . . . . . . 376
D 14.1. Квадратные уравнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
D 14.2. Кубические уравнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
D 14.3. Уравнения четвертой степени. . . . . . . . . . . . . . . . . . . . . . . . 377

Дополнение к л е к ц и и 16 . . . . . . . . . . . . . . . . . . . . . . . 379
D 16.1. Мультипликативная группа поля вычетов . . . . . . . . . . . . . . 379
D 16.2. Результант . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
D 16.3. Построения циркулем и линейкой . . . . . . . . . . . . . . . . . . . . 381
D 16.4. Конечные расширения полей . . . . . . . . . . . . . . . . . . . . . . . . 383
D 16.5. Круговые многочлены простой степени . . . . . . . . . . . . . . . . 384
D 16.6. Правильные n-угольники . . . . . . . . . . . . . . . . . . . . . . . . . . 386
D 16.7. Эндоморфизмы и автоморфизмы . . . . . . . . . . . . . . . . . . . . . 387
D 16.8. Алгебраические числа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389
16 Оглавление

Д о п о л н е н и е к л е к ц и и 17 . . . . . . . . . . . . . . . . . . . . . . . 391
D 17.1. Кратные корни и производные . . . . . . . . . . . . . . . . . . . . . . . 391
D 17.2. Разностные уравнения с постоянными коэффициентами . . . . 392
D 17.3. Поле разложения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394
D 17.4. Корни многочленов над произвольным полем . . . . . . . . . . . . 395

Д о п о л н е н и е к л е к ц и и 18 . . . . . . . . . . . . . . . . . . . . . . . 397
D 18.1. Еще одно доказательство основной теоремы алгебры . . . . . . 397
D 18.2. Нормальные поля и поля разложения . . . . . . . . . . . . . . . . . 398
D 18.3. Радикальные расширения . . . . . . . . . . . . . . . . . . . . . . . . . . 399
D 18.4. Автоморфизмы и расширения . . . . . . . . . . . . . . . . . . . . . . . 400
D 18.5. Расширения Галуа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
D 18.6. Промежуточные поля и подгруппы . . . . . . . . . . . . . . . . . . . 401
D 18.7. Разрешимость алгебраических уравнений . . . . . . . . . . . . . . 402
D 18.8. Нормальные делители симметрической группы . . . . . . . . . . 403
D 18.9. Группы при построении правильных многоугольников . . . . . 404

Д о п о л н е н и е к л е к ц и и 19 . . . . . . . . . . . . . . . . . . . . . . . 406
D 19.1. Классификация линий второго порядка . . . . . . . . . . . . . . . . 406
D 19.2. Инварианты линии второго порядка. . . . . . . . . . . . . . . . . . . 406
D 19.3. Определение типа линии . . . . . . . . . . . . . . . . . . . . . . . . . . . 407

Д о п о л н е н и е к л е к ц и и 22 . . . . . . . . . . . . . . . . . . . . . . . 409
D 22.1. Пополнение пространства . . . . . . . . . . . . . . . . . . . . . . . . . . 409

Д о п о л н е н и е к л е к ц и и 23 . . . . . . . . . . . . . . . . . . . . . . . 411
D 23.1. Подпространства и замкнутость . . . . . . . . . . . . . . . . . . . . . 411
D 23.2. Единичная сфера в бесконечномерном пространстве. . . . . . . 411
D 23.3. Геометрические свойства единичных шаров . . . . . . . . . . . . . 412
D 23.4. Топологические пространства . . . . . . . . . . . . . . . . . . . . . . . 413
D 23.5. Компактные множества в топологическом пространстве . . . . 414

Д о п о л н е н и е к л е к ц и и 25 . . . . . . . . . . . . . . . . . . . . . . . 416
D 25.1. Потеря ортогональности при вычислениях . . . . . . . . . . . . . . 416
Оглавление 17

D 25.2. Обобщение теоремы о перпендикуляре. . . . . . . . . . . . . . . . . 417

Дополнение к л е к ц и и 26 . . . . . . . . . . . . . . . . . . . . . . . 419
D 26.1. Строение выпуклых множеств . . . . . . . . . . . . . . . . . . . . . . . 419
D 26.2. Линейные неравенства . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
D 26.3. Поиск точки в пересечении гиперплоскостей . . . . . . . . . . . . 421
D 26.4. Линейные функционалы и скалярные произведения . . . . . . . 422
D 26.5. Дуальные нормы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423

Дополнение к л е к ц и и 27 . . . . . . . . . . . . . . . . . . . . . . . 426
D 27.1. Выбор базиса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
D 27.2. Базисы в пространстве многочленов . . . . . . . . . . . . . . . . . . 427

Дополнение к л е к ц и и 32 . . . . . . . . . . . . . . . . . . . . . . . 429
D 32.1. Минимальный многочлен матрицы . . . . . . . . . . . . . . . . . . . 429
D 32.2. Жорданова форма: прямое доказательство по индукции . . . . 430

Дополнение к л е к ц и и 34 . . . . . . . . . . . . . . . . . . . . . . . 432
D 34.1. Свертки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
D 34.2. Сложность преобразования Фурье . . . . . . . . . . . . . . . . . . . . 433
D 34.3. Быстрые приближенные вычисления . . . . . . . . . . . . . . . . . . 434

Дополнение к л е к ц и и 35 . . . . . . . . . . . . . . . . . . . . . . . 437
D 35.1. Общий вид унитарно инвариантных норм . . . . . . . . . . . . . . 437

Дополнение к л е к ц и и 36 . . . . . . . . . . . . . . . . . . . . . . . 438
D 36.1. Гиперповерхности второго порядка . . . . . . . . . . . . . . . . . . . 438
D 36.2. Геометрические свойства гиперповерхностей . . . . . . . . . . . . 439

Дополнение к л е к ц и и 37 . . . . . . . . . . . . . . . . . . . . . . . 442
D 37.1. Эрмитово возмущение заданного ранга . . . . . . . . . . . . . . . . 442
D 37.2. Собственные значения и сингулярные числа . . . . . . . . . . . . 443
D 37.3. Мажоризация и неравенства . . . . . . . . . . . . . . . . . . . . . . . . 444
18 Оглавление

Д о п о л н е н и е к л е к ц и и 38 . . . . . . . . . . . . . . . . . . . . . . . 448
D 38.1. Число итераций. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448
D 38.2. Как убывают нормы невязок . . . . . . . . . . . . . . . . . . . . . . . . 448
D 38.3. Оценка с помощью многочленов Чебышёва . . . . . . . . . . . . . 449
D 38.4. Предобусловленный метод сопряженных градиентов. . . . . . . 451
D 38.5. Обобщения метода сопряженных градиентов . . . . . . . . . . . . 452

Д о п о л н е н и е к л е к ц и и 39 . . . . . . . . . . . . . . . . . . . . . . . 456
D 39.1. Локализация собственных значений . . . . . . . . . . . . . . . . . . 456
D 39.2. Расстояние между спектрами нормальных матриц . . . . . . . . 457

Д о п о л н е н и е к л е к ц и и 40 . . . . . . . . . . . . . . . . . . . . . . . 460
D 40.1. Преобразования массивов с помощью матриц . . . . . . . . . . . 460
D 40.2. Ортогональные преобразования массивов. . . . . . . . . . . . . . . 460
D 40.3. Разложение Таккера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461
Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464
Предметный указатель . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466
Предисловие

Данная книга возникла в ходе чтения лекций студентам пер-


вого курса факультета вычислительной математики и киберне-
тики Московского государственного университета им. М. В. Ло-
моносова. Ее главы появлялись почти синхронно с лекциями
и становились доступными студентам благодаря интернету. По-
сле этого первоначальный текст постоянно менялся — помимо
исправления опечаток, автору хотелось найти такой стиль из-
ложения, который позволил бы получить необходимые основы
предмета и в то же время дал бы возможность наиболее заин-
тересованным читателям пойти дальше, иногда очень далеко —
вплоть до обсуждения нетривиальных приложений, которыми
очень сильна линейная алгебра.
Данный замысел потребовал определенной структуры от кни-
ги. Она содержит несколько пластов. Прежде всего это основ-
ной, обязательный материал — его можно читать без ссылок
на дополнения, а многие читатели могут им и ограничиться.
Цель автора по отношению к таким читателям — оставить у
них ощущение красивой и простой науки, каковой и является
линейная алгебра. Но меньше всего хотелось бы оставить впечат-
ление науки, завершившей свое развитие. Для этого и написаны
дополнения, в которых линейная алгебра предстает уже не очень
простой наукой, ведущей своими методами к интересным и часто
знаменитым результатам в других разделах математики и ее
приложениях.
Честолюбивый читатель, возможно, будет стремиться про-
честь книгу от корки до корки. Автор должен предупредить,
что это может потребовать больших усилий и, вполне возможно,
к каким-то местам лучше вернуться после завершения первого
года обучения. Везде указано, какой материал считается допол-
нительным. Более того, дополнительный материал также имеет
два уровня — то, что набрано мелким шрифтом, должно считать-
ся «более дополнительным».
О том, чем данная книга отличается от традиционных учеб-
ников, можно судить уже по названию: понятия и теоремы
линейной алгебры во многих случаях представлены читателю
как факты матричного анализа. В какой-то степени это делает
20 Предисловие

изложение «менее абстрактным», позволяет освободиться от не


очень существенных деталей и одновременно познакомить чита-
теля с матричным анализом как относительно самостоятельной
дисциплиной. Курс естественным образом включает в себя также
основы аналитической геометрии.
Отметим другие особенности книги и причины, по которым
она может оказаться полезной.
Во-первых, в определенной степени книгу можно рассматри-
вать как расширенный конспект лекций. Отсюда лаконичность,
свойственная лекциям. По этой же причине в книге нет «длин-
ных» ссылок и присутствуют неизбежные в лекциях напомина-
ния и повторения.
Во-вторых, изложение совершенно классических вопросов
обычно имеет продолжение в дополнительной части, откуда вид-
но, что изучаемая нами наука является живой и прочно свя-
занной со многими другими разделами математики. Как только
появляется возможность сказать об особо впечатляющих дости-
жениях, я это делаю. Но в каждом таком случае считаю важ-
ным избегать чисто декларативного описания — если уж что-то
обсуждается, то всегда с ясными формулировками и полными
(почти всегда) доказательствами.
В-третьих, в книге идет одновременное развитие нескольких
тем — подобно тому, как это бывает в полифоническом музы-
кальном произведении. Главная тема, конечно, — это все, что
связано с концепцией линейной зависимости векторов. В ка-
честве побочной (хотя и не менее значимой) темы в самом
начале возникает понятие алгебраической операции и группы.
Эта тема впоследствии приводит к важным понятиям кольца и
поля, а затем и к своеобразной точке «контрапункта» (в той же
музыкальной аналогии), когда свойства линейного пространства
применяются к изучению расширений полей.
В дополнительных частях в сжатом и в то же время замкну-
том виде изложены весьма нетривиальные результаты, иногда
выходящие за рамки собственно линейной алгебры (например,
вопросы о построении правильных n-угольников и разрешимости
алгебраических уравнений). Общеизвестно, однако, что значение
и сила линейной алгебры обусловлены прежде всего ее много-
численными приложениями.
Безусловно, линейной алгебре не следует учить «слишком
абстрактно». Почти все можно объяснить, работая с простыми
для понимания объектами — матрицами, а не с абстрактными
элементами линейных пространств. В то же время определенная
доза абстрактных понятий уместна и даже полезна на самой
Предисловие 21

ранней стадии обучения: вряд ли можно считать чрезмерными


усилия, затраченные на освоение всего лишь определения груп-
пы и простейших ее свойств. Если же это сделать на раннем
этапе обучения, то в дальнейшем находится много поводов для
возвращения к этому понятию в связи с примерами групп, кото-
рые естественным образом возникают в разных местах курса.
Мне кажется, что упрощение формы изложения все же мо-
жет сочетаться с более наполненным содержанием. По крайней
мере я стремился к этому. Линейная алгебра и ее приложения
настолько фундаментальны и важны, что нет никаких оснований
для сокращения объема обязательных базовых знаний в данной
области.
В нашем курсе предмет линейной алгебры понимается в рас-
ширенном смысле, довольно часто мы оказываемся на террито-
рии смежных дисциплин — математического анализа, вычисли-
тельных методов и, конечно, общей алгебры. Границы являются
условностью, как и в жизни. Особенно часто они пересекаются
при разработке современных информационных и вычислитель-
ных технологий.
Например, одна из главных обязательных тем первого семест-
ра — теория и методы исследования и решения систем линейных
алгебраических уравнений. Материал вполне элементарный и,
возможно, оставляющий впечатление абсолютной завершенно-
сти. Однако практическая необходимость решения систем с мил-
лионами уравнений и неизвестных и появление вычислительной
техники с параллельным выполнением операций дали импульс
к изучению новых свойств алгоритмов. В данном случае успехи
прямо связаны с ростом мощи компьютеров. В то же время —
и об этом сказать особенно приятно — выход на радикально но-
вый уровень возможностей был сделан благодаря новому матема-
тическому знанию, а не росту производительности компьютеров.
Более того, для данной вполне классической задачи линейной
алгебры потребовалось дальнейшее изучение фундаментальных
вопросов из области математического анализа и теории прибли-
жений.
Отдельные места в книге содержат материал, который вооб-
ще нельзя найти ни в каких учебниках и даже монографиях.
В частности, это относится к теореме об обобщениях методов
сопряженных градиентов. В еще большей степени — ко всему
материалу заключительной лекции, посвященной многомерным
массивам, тензорным рангам и полилинейным обобщениям син-
гулярного разложения матрицы.
22 Предисловие

К дополнительному материалу, вероятно, следует отнести и


включенные в текст лекций задачи. Это именно задачи, а не
упражнения. Как правило, не самые легкие задачи — но всегда
с подсказкой: нужно учесть само расположение задачи. Конечно,
для активного освоения линейной алгебры нужны и упражнения,
и задачи разного уровня сложности. Их можно найти в различ-
ных разделах существующих задачников (например, [11, 17, 20,
25]).
В те времена, когда факультет ВМиК только появился,
математики-вычислители часто сетовали на то, что в обязатель-
ных курсах мехмата ничего не говорилось о возникших перед
ними проблемах. В настоящее время можно уже говорить о
том, что математикам-вычислителям часто не хватает знаний из
традиционных именно для мехмата разделов математики. Можно
привести примеры рекордно эффективных вычислительных тех-
нологий, возникших на основе идей и аппарата, казалось бы,
далеких от приложений областей — например, алгебраической
топологии. Конечно, в этой книге последние заявления останутся
все же лишь декларациями, к сожалению автора и читателей. Но
ведь это лишь начало пути!
В любом деле очень важен начальный импульс. Для данной
книги его генератором был В. А. Ильин, пригласивший меня про-
читать лекции на ВМиК.
В Институте вычислительной математики Российской акаде-
мии наук, где я имею честь работать, это предложение было го-
рячо поддержано В. В. Воеводиным, В. П. Дымниковым, а также
Г. И. Марчуком, попросившим меня в то же самое время помочь
в организации на ВМиК новой кафедры — вычислительных
технологий и моделирования, — которой он стал заведовать.
Мне оставалось только согласиться и попытаться сделать
то, о чем я, скорее всего, уже думал — попробовать расска-
зать студентам о матричном анализе и линейной алгебре то,
что мне самому хотелось бы услышать, когда я был студентом.
По крайней мере самому мне это все пока нравится. Поэто-
му всем названным лицам выражаю искреннюю благодарность.
Хочу поблагодарить также С. А. Горейнова, Н. Л. Замарашкина,
Х. Д. Икрамова, Г. Д. Ким, В. С. Панферова, В. Н. Чугунова и
всех тех, кто уже сделал или еще сделает замечания по тексту
лекций.
Лекция 1

1.1. Линейные отображения и матрицы


В математике и других науках постоянно изучается зависи-
мость одних величин от других. Обычно зависимость описывает-
ся различного типа функциями (отображениями, операторами).
Простейший случай — линейные отображения. Строгие опреде-
ления мы дадим позже. А пока предположим, что переменные
y1 , . . . , ym выражаются через x1 , . . . , xn следующим образом:

⎨ y1 = a11 x1 + . . . + a1n xn ,
...................... (∗)

ym = am1 x1 + . . . + amn xn ,
где коэффициенты считаются заданными постоянными величи-
нами. Соберем все постоянные коэффициенты в прямоугольную
таблицу и обозначим ее буквой A; составим также таблицы-
столбцы из величин x1 , . . . , xn и y1 , . . . , ym :
     
a11 . . . a1n x1 y1
A = ... ... ... , x = ... , y = ... .
am1 . . . amn xn ym
Такие таблицы и называются матрицами. Мы имеем целых три
матрицы: размеров m × n, n × 1 и m × 1. Соотношения (∗),
описывающие зависимость y от x, запишем символически таким
образом:
y = Ax. (∗∗)
Возникает впечатление, что матрица A умножается на матрицу-
столбец x, в результате чего появляется матрица-столбец y .
Так оно и будет, если мы скажем, что соотношения (∗) суть
определение операции (∗∗) умножения A на x.
Если m = n, то матрица называется квадратной. Квадратная
матрица размеров n × n называется также матрицей порядка n.
24 Лекция 1

1.2. Умножение матриц


Пусть y1 , . . . , ym выражаются через x1 , . . . , xn и при этом
x1 , . . . , xn выражаются через z1 , . . . , zk следующим образом:
⎧ ⎧
⎨ y1 = a11 x1 + . . . + a1n xn , ⎨ x1 = b11 z1 + . . . + b1k zk ,
...................... ....................
⎩ ⎩
ym = am1 x1 + . . . + amn xn , xn = bn1 z1 + . . . + bnk zk ,
Ясно, что y1 , . . . , ym выражаются через z1 , . . . , zk аналогичным
образом. Матрицу из постоянных коэффициентов этой зависи-
мости обозначим через C . Тогда
y = Ax, x = Bz и y = Cz.
Чтобы получить коэффициенты матрицы C , нужно подставить
выражения для x1 , . . . , xn через z1 , . . . , zk в формулы, выражаю-
щие y1 , . . . , ym через x1 , . . . , xn , и собрать коэффициенты при
величинах z1 , . . . , zk . Получится вот что:

n
C = [cij ], где cij = ail blj . (∗)
l=1
Определение. Матрица C вида (∗) называется произведением
матриц A и B и обозначается C = AB .
Следствие. y = A(Bz) = (AB)z .
Часто говорят, что матрицы умножаются по правилу «строка
на столбец». Число столбцов в первом сомножителе обязано,
конечно, совпадать с числом строк во втором. Если мы пишем
C = AB , то автоматически имеем в виду, что матрицы A и B не
совсем уж произвольные.

1.3. Ассоциативность умножения матриц


Теорема. (AB)C = A(BC).
Доказательство. Пусть A, B , C имеют размеры m × n, n × k ,
k × l. Тогда
 n

k 
k 
{(AB)C}ij = {AB}ip cpj = aiq bqp cpj =
p=1 p=1 q=1
 k

n 
= aiq bqp cpj = {A(BC)}ij .
q=1 p=1
1.6. Умножение блочных матриц 25

1.4. Некоммутативность умножения матриц

В общем случае AB = BA даже для квадратных матриц.


Например,



0 1 0 0 1 0
0 0 1 0
= 0 0
,




0 0 0 1 0 0
= .
1 0 0 0 0 1

1.5. Сложение матриц и умножение на число


Матрица C = [cij ] называется суммой матриц A = [aij ] и B =
= [bij ], если
cij = aij + bij для всех i, j.
Матрицы A, B и C = A + B одинаковых размеров. Операция
сложения матриц обладает сразу двумя приятными свойствами:

A + (B + C) = (A + B) + C (ассоциативность),
A + B = B + A (коммутативность).
Полезно ввести также операцию умножения матрицы на чис-
ло. Если α — число, то матрица C = αA определяется как
матрица тех же размеров с элементами cij = αaij .

1.6. Умножение блочных матриц


Предположим, что матрицы A и B составлены из блоков Aij
и Bij :
   
A11 . . . A1q B11 . . . B1r
A = ... ... ... , B= ... ... ... ,
Ap1 . . . Apq Bq1 . . . Bqr
где Aij — mi × nj , Bij — ni × kj . Тогда произведение C =
= AB существует и его можно вычислять, используя операции
умножения и сложения матриц-блоков:
 
C11 . . . C1r q
C= . . . . . . . . . , где Cij = Ail Blj — mi × kj .
Cp1 . . . Cpr l=1
Докажите!
26 Лекция 1

Можно сказать, что блочные матрицы умножаются по пра-


вилу «блочная строка на блочный столбец». Мы очень скоро
увидим, какую пользу может дать блочное умножение.

1.7. Вычислительный аспект умножения матриц


Пусть заданы (n × n)-матрицы A и B и требуется вычислить
их произведение C = AB . Вот классический алгоритм (програм-
ма на неком подобии алгоритмического языка Фортран):
DO i = 1, n
DO j = 1, n
DO k = 1, n
cij = cij + aik bkj
END DO
END DO
END DO.

Конечно, предварительно следует занулить элементы cij .

1.8. Хороша ли программа?


Ответить на этот вопрос не очень просто. Прежде всего
нужен какой-то критерий — пусть это будет время исполнения
программы. Но время зависит не только от типа компьютера.
В строгом смысле, оно привязано к отдельно взятому компьютеру
и зависит от его состояния на данный момент, от операционной
системы и, конечно, от особенностей транслятора.
Чтобы что-то здесь понять, нужно отбросить очень много
деталей и оставить нечто главное. Если все операции выпол-
няются последовательно, то время работы можно считать про-
порциональным числу операций. Мы пойдем дальше и будем
подсчитывать лишь арифметические операции. Общее их число
будем называть арифметической сложностью алгоритма.
Легко найти, что арифметическая сложность классического
алгоритма умножения матриц равна 2n3 (n3 умножений и n3
сложений). Но хорошо ли это? Уверены ли мы в том, что это
наилучший алгоритм?
Само понятие «наилучший» предполагает наличие некого
множества возможных алгоритмов. Будем полагать, что алго-
ритм — это последовательность элементарных операций из ко-
нечного фиксированного набора элементарных операций. Для
1.10. Метод Штрассена 27

определенности пусть это будут четыре арифметических дей-


ствия.
Итак, математическая задача поставлена. Еще в недавнем
прошлом многим казалось, что классический алгоритм является
наилучшим. Теперь уже ясно, что это не так.

1.9. Метод Винограда


Попробуйте-ка перемножить матрицы как-либо иначе — не
по классическому алгоритму. Вероятно, впервые это сделал Ви-
ноград (в начале 60-х). Он догадался использовать следующее
тождество:

2m 
m
aik bkj = (ai 2k−1 + b2k j )(b2k−1 j + ai 2k ) −
k=1 k=1


m 
m
− ai 2k−1 ai 2k − b2k j b2k−1 j .
k=1 k=1

Пусть n = 2m. Ясно, что вторую и третью суммы для всех


1  i, j  n можно найти, затратив 2nm = n2 умножений и
1
2nm = n2 сложений. Для первой суммы потребуется n2 m = n3
2
3
умножений и 3n2 m = n3 сложений.
2
В итоге — по-прежнему, 2n3 операций (без учета порядка
1 3
n2  n3 операций), но теперь n3 умножений и n3 сложений!
2 2
Поскольку умножение — операция более сложная, чем сложение,
метод Винограда может представлять практический интерес.

1.10. Метод Штрассена


В 1965 г. Штрассен нашел способ умножения (2 × 2)-матриц
с помощью всего лишь семи умножений (в классическом методе
8 умножений). То, что придумал Штрассен, получается посред-
ством вычисления тензорного ранга «многомерных матриц». Об
этом мы поговорим в заключительной лекции курса. А пока
давайте посмотрим на изобретение Штрассена «без комментари-
ев»: 1)
1)
См. задачу 5.4.21 из «Задачника по линейной алгебре» Х. Д. Икрамова.
28 Лекция 1

α1 = (a11 + a22 )(b11 + b22 ),


α2 = (a21 + a22 )b11 ,
c11 = α1 + α4 − α5 + α7 ,
α3 = a11 (b12 − b22 ),
c12 = α3 + α5 ,
α4 = a22 (b21 − b11 ),
c21 = α2 + α4 ,
α5 = (a11 + a12 )b22 ,
c22 = α1 + α3 − α2 + α6 .
α6 = (a21 − a11 )(b11 + b12 ),
α7 = (a12 − a22 )(b21 + b22 ),
Только очень ленивый человек не сможет проверить, что две
матрицы порядка 2 умножаются правильно.

1.11. Рекурсия для (n × n)-матриц


От метода умножения (2 × 2)-матриц с семью умножениями
довольно легко перейти к методу умножения (n × n)-матриц,
требующему не более 7 nlog2 7 операций. Поскольку

7nlog2 7
→0 при n → ∞,
n3
метод Штрассена асимптотически лучше классического метода.

Предположим, что n = 2L , и будем рассматривать A и B как


блочные (2 × 2)-матрицы:



A11 A12 B11 B12 n n
A= , B= , Aij , Bij — × .
A21 A22 B21 B22 , 2 2

Замечательно, что в штрассеновском методе умножения


(2 × 2)-матриц коммутативность не используется. Поэтому метод
годится и для умножения блочных (2 × 2)-матриц!

Итак, задача размера n сводится к семи аналогичным за-


дачам размера n/2. Для формирования этих семи задач и для
получения окончательного результата после решения этих семи
задач требуется 18 раз сложить блоки порядка n/2.
«Раскрутив» указанную рекурсию до конца, получим

7log2 n = nlog2 7
1.11. Рекурсия для (n × n)-матриц 29

умножений на последнем этапе. Общее число сложений на всех


этапах составит
L

L n 2 18 2
7
−1
18 7 k−1
= n 4  6 · 7L = 6 nlog2 7
2k 4 7
−1
k=1 4
(нужно учесть, что 4L = n2 и 7L = nlog2 7 ).
При практическом применении рекурсию не обязательно рас-
кручивать до конца. Это вредно: 7 nlog2 7 > 2n3 даже при n = 512.
Но при n = 1024 неравенство меняется в пользу Штрассена.
К настоящему времени придуманы и более быстрые (асимпто-
тически) методы, чем метод Штрассена. Уже существуют методы
с числом операций O (nα ), где α < 2.42. Никто не знает, каков
минимальный показатель в таких оценках. Ясно лишь, что α  2.
Лекция 2

2.1. Множества и элементы


Понятие множества вводится для обозначения совокупности
элементов, объединенных каким-то общим признаком. Считает-
ся, что оно относится к первичным понятиям, которым не дается
формального определения.
Запись a ∈ M означает, что элемент a принадлежит мно-
жеству M . Запись X ⊂ Y означает, что каждый элемент мно-
жества X принадлежит множеству Y . При этом X называется
подмножеством Y . Особо выделяется множество, в котором нет
ни одного элемента. Оно называется пустым и обозначается
символом ∅. По определению ∅ ⊂ M ∀ M .
При описании множеств иногда возникают логические проти-
воречия. Например, рассмотрим множество M , состоящее из од-
ного числа, которое определяется как «наименьшее целое число,
которое нельзя определить при помощи фразы, имеющей менее
ста русских слов». Такое число должно существовать, поскольку
число допустимых фраз, имеющих менее ста слов, конечно. В то
же время оно определяется приведенной выше фразой, а в ней
менее ста слов! 1)
В нашем курсе, к счастью, противоречий такого рода при
задании множеств возникать не будет. Но даже при полной
ясности с определением множества (например, множество корней
уравнения) не всегда легко установить, сколько в нем элементов
и будет ли оно вообще непустым.
Довольно часто множества будут задаваться перечислением
своих элементов. Например, M = {1, 2, 3} — множество, состоя-
щее из трех чисел: 1, 2, 3.
Кроме того, новые множества можно конструировать с помо-
щью уже имеющихся множеств X и Y следующим образом:
• A = X ∪ Y ≡ {a : a ∈ X или a ∈ Y } (объединение мно-
жеств);
1)
Пример из учебника В. В. Воеводина «Линейная алгебра». — Наука, 1980.
2.3. Алгебраические операции 31

• B = X ∩ Y ≡ {b : b ∈ X и b ∈ Y } (пересечение множеств);
• C = X\Y ≡ {c : c ∈ X , c ∈/ Y } (разность множеств);
• D = X × Y ≡ {d = (a, b) : a ∈ X , b ∈ Y } (декартово произ-
ведение множеств).

2.2. Отображения, функции, операторы


Все три слова в названии этого пункта означают одно и то
же — речь идет о правиле, по которому каждому элементу x
множества X ставится в соответствие однозначно определенный
элемент y = f (x) множества Y . Задание правила равносильно
выбору подмножества
Γ = {(x, f (x)) : x ∈ X} ⊂ X × Y ,
называемого графиком отображения (функции, оператора) f .
Элемент y = f (x) называется образом элемента x, а x —
прообразом элемента y при отображении f . Чтобы подчеркнуть,
что f действует из X в Y , пишут так: f : X → Y .
Множество f (X) ≡ {y : y = f (x) для некоторого x ∈ X}
называется образом (множеством значений) отображения f .
Если M ⊂ Y , то множество f −1 (M ) ≡ {x : f (x) ∈ M } на-
зывается полным прообразом множества M . Если M = {y}, то
пишут таким образом: f −1 (y) = f −1 (M ).
Отображение f : X → Y называется обратимым, если суще-
ствует отображение g : Y → X такое, что f (g(y)) = y ∀ y ∈ Y
и g(f (x)) = x ∀ x ∈ X . При этом g называют обратным отоб-
ражением для f и пишут g = f −1 .
Отображение f называется взаимно-однозначным, если для
любого y ∈ Y полный прообраз f −1 (y) состоит ровно из одного
элемента. Легко показать, что обратимость равносильна взаим-
ной однозначности.

2.3. Алгебраические операции


Отображение f : X × X → X называется алгебраической
операцией на X . Пусть для обозначения такой операции ис-
пользутся символ ∗. Тогда запись c = a ∗ b означает, что
(a, b) ∈ X × X и c = f ((a, b)).
Если задано отображение f : M → X на непустом подмноже-
стве M ⊂ X × X , то f называется частичной алгебраической
операцией на X . Таковой, в частности, является операция умно-
жения матриц на множестве всех матриц.
32 Лекция 2

Cимвол ∗ часто опускается, при этом пишут ab = a ∗ b, на-


зывают операцию умножением, а элемент ab (если он существу-
ет) — произведением элементов a и b.

2.4. Ассоциативность и скобки


Частичная алгебраическая операция на X называется ассо-
циативной, если для любых a, b, c ∈ X из существования про-
изведений ab и bc вытекает существование произведений a(bc),
(ab)c и равенство
a(bc) = (ab)c.
В этом случае естественно убрать скобки и писать abc ≡ a(bc) =
= (ab)c.
Теорема. Пусть на X задана ассоциативная частичная ал-
гебраическая операция и x1 , . . . , xn — произвольные элемен-
ты из X , для которых существуют произведения x1 x2 ,
x2 x3 , . . . , xn−1 xn . Тогда существует расстановка скобок, опре-
деляющая элемент
x = x1 x2 . . . xn ,
при этом любая расстановка скобок дает один и тот же
элемент x.
Доказательство. Проведем индукцию по n. Докажем сна-
чала существование некоторой расстановки скобок, определя-
ющей x. Согласно индуктивному предположению существует
произведение (x1 . . . xn−2 )xn−1 . По условию теоремы существу-
ет также произведение xn−1 xn . Таким образом, можно приме-
нить определение ассоциативности по отношению к элементам
a = x1 . . . xn−2 , b = xn−1 , c = xn .
Пусть элементы a и b получаются при разных расстановках
скобок. В любом случае имеем

a = (x1 . . . xk )(xk+1 . . . xn ), b = (x1 . . . xm )(xm+1 . . . xn ).


Пусть k < m. Тогда, в силу ассоциативности,

a = (x1 . . . xk )((xk+1 . . . xm )(xm+1 . . . xn )) =


= ((x1 . . . xk )(xk+1 . . . xm ))(xm+1 . . . xn ) =
= (x1 . . . xm )(xm+1 . . . xn ) = b. 
2.6. Группы 33

2.5. Ассоциативность при умножении матриц


Пусть нужно вычислить произведение трех прямоугольных
матриц размеров 1 × n, n × 1 и 1 × n:
 
c11
A = BCD = [b11 . . . b1n ] . . . [d11 . . . d1n ].
cn1
В данном случае есть два варианта расстановки скобок:
 
c11 d11 . . . c11 d1n
A = B(CD) = [b11 . . . b1n ] ... ... ... , (1 )
cn1 d11 . . . cn1 d1n
A = (BC)D = [(b11 c11 + . . . + b1n cn1 )] [d11 . . . d1n ]. (2 )
Варианты (1) и (2) приводят к двум разным алгоритмам
вычисления матрицы A. В силу ассоциативности результаты
должны быть одинаковыми. Но арифметическая работа будет
разная! Применяя правило «строка на столбец», получаем 2n2
умножений в случае (1) и всего 2n умножений в случае (2).

2.6. Группы
Непустое множество G с ассоциативной алгебраической опе-
рацией называется группой, если:
(1) существует элемент e ∈ G такой, что ae = ea = a для
любого элемента a ∈ G;
(2) для любого элемента a ∈ G существует элемент b ∈ G
такой, что ab = ba = e.
Элемент e определяется свойством (1) однозначно: если e1
и e2 — два таких элемента, то e1 = e1 e2 = e2 . Он называется
единичным.
Элемент b из свойства (2) однозначно определяется по a: если
b1 и b2 — два таких элемента, то b1 = b1 (ab2 ) = (b1 a)b2 = b2 .
Элемент b называется обратным для a. Обозначение: b = a−1 .
Для любых фиксированных a, b ∈ G можно рассмотреть урав-
нения ax = b (относительно x) и ya = b (относительно y ). Оба
уравнения однозначно разрешимы: x = a−1 b и y = ba−1 .
Группа называется абелевой (коммутативной), если ab = ba
для всех a, b ∈ G.
2 Е. Е. Тыртышников
34 Лекция 2

2.7. Примеры абелевых групп


1. G = R — множество вещественных чисел, операция — сло-
жение чисел. Роль единичного элемента играет число 0.
2. G = R\{0} — множество ненулевых вещественных чисел,
операция — умножение чисел. Роль единичного элемента играет
число 1.
3. G = Q — множество рациональных чисел, операция — сло-
жение чисел. Роль единичного элемента играет число 0.
4. G = Q\{0} — множество ненулевых рациональных чисел,
операция — умножение чисел. Роль единичного элемента играет
число 1. √
5. G — множество ненулевых вещественных чисел вида a + b 2 ,
где a, b — рациональные числа. Операция — умножение чисел.
Прежде всего докажем, что произведение чисел из G принад-
лежит G:
√ √ √
(a + b 2 )(c + d 2 ) = (ac + 2bd) + (ad + bc) 2 ,
из рациональности чисел a, b, c, d вытекает рациональность чи-
сел ac + 2bd и ad√+ bc. Далее, единичным элементом
√ является
число 1 = 1 + 0 · 2 . Обратный элемент для a + b 2 , как легко
проверить, имеет вид
   √
a −b
+ 2.
a − 2b
2 2
a − 2b
2 2

Задача 1. Пусть G — группа с единицей e. Докажите, что если


a2 = e для любого a ∈ G, то группа G абелева.

2.8. Группа невырожденных диагональных матриц


Матрица A = [aij ] размеров n × n называется диагональной,
если aij = 0 при i = j . Диагональная матрица A называется
невырожденной, если aii = 0 при всех 1  i  n.
Множество невырожденных диагональных (n × n)-матриц с
вещественными элементами и операцией умножения матриц яв-
ляется абелевой группой. Роль единичного элемента играет мат-
рица ⎡ ⎤
1
I=⎣ ..
. ⎦.
1
2.10. Подгруппы 35

Она называется единичной матрицей.


Задача 1. Матрица A порядка n коммутирует со всеми матрицами
порядка n: AB = BA для всех матриц B порядка n. Докажите, что
A — диагональная матрица с равными элементами на диагонали. 1)

2.9. Группа невырожденных треугольных матриц


Матрица A = [aij ] размеров n × n назывется нижней тре-
угольной, если aij = 0 при i < j , и верхней треугольной, если
aij = 0 при i > j . Треугольная матрица называется невырожден-
ной, если aii = 0 при всех 1  i  n.
Множество невырожденных нижних (верхних) треугольных
матриц с вещественными элементами и операцией умножения
матриц является группой (некоммутативной).
Доказательство состоит из трех этапов:
• проверить, что произведение невырожденных нижних
(верхних) треугольных матриц является также нижней
(верхней) треугольной матрицей;
• проверить, что роль единичного элемента играет единичная
матрица I ;
• проверить, что для невырожденной нижней (верхней) тре-
угольной матрицы A разрешимы уравнения AX = I и
Y A = I , при этом обе матрицы X и Y являются нижними
(верхними) треугольными. После этого равенство X = Y
является уже очевидным.

2.10. Подгруппы
Подмножество H ⊂ G называется подгруппой группы G, если
оно является группой относительно операции, действующей в G.
Для этого необходимо и достаточно, чтобы
• ab ∈ H для любых элементов a, b ∈ H ;
• a−1 ∈ H для любого элемента a ∈ H .
Например, группа невырожденных диагональных матриц яв-
ляется подгруппой группы невырожденных нижних (верхних)
треугольных (n × n)-матриц.

1)
Такие матрицы называются скалярными.

2*
36 Лекция 2

2.11. Степени элемента


Зафиксируем произвольный элемент a в группе G и рассмот-
рим минимальную содержащую a подгруппу H(a) ⊂ G. Мини-
мальность означает, что H(a) ⊂ H для любой подгруппы H ,
содержащей a. Легко видеть, что
H(a) = {ak : k — целое число}.
По определению, a0 = e, ak = a . . . a (a повторяется k раз) при
целом положительном k , a−k = (a−1 )k . Непосредственно из опре-
деления вытекает, что
ak+m = ak am для любых целых k , m.

2.12. Циклические группы


Группа H(a) называется циклической группой, порожденной
элементом a. Минимальное целое k > 0 такое, что ak = e, назы-
вается порядком элемента a. Если ak = e при всех k > 0, то a
называется элементом бесконечного порядка.
Теорема. Любая подгруппа циклической группы является цик-
лической.
Доказательство. Подгруппа H ⊂ H(a) состоит из каких-то
степеней элемента a:
H = {ai1 , ai2 , . . . }.
Пусть m — наименьшее целое положительное число среди
i1 , i2 , . . . Тогда ясно, что H содержит все элементы вида amk .
Докажем, что в H не может быть других степеней элемента a.
Пусть an ∈ H . Разделим n с остатком на m:
n = qm + r, q , r — целые, 0  r  m − 1.
Тогда ar = an a−qm ∈ H . В случае r > 0 получаем противоречие
с минимальностью m. Поэтому r = 0. 
Задача 1. Найти все подгруппы группы целых чисел Z относи-
тельно операции сложения чисел.
Лекция 3

3.1. Система линейных алгебраических уравнений


Система уравнений вида

⎨ a11 x1 + . . . + a1k xk = b1 ,
.................... (1)

an1 x1 + . . . + ank xk = bn
относительно неизвестных величин x1 , . . . , xk называется систе-
мой линейных алгебраических уравнений. Мы уже знаем, что
с помощью матричных обозначений ее можно записать в виде
     
a11 . . . a1k x1 b1
Ax = b, A = ... ... ... , x = ... , b = ... .
an1 . . . ank xk bn
Множество матриц размеров n × k с элементами aij ∈ R,
где R — множество вещественных чисел, обозначим Rn×k .
В согласии с этим обозначением Rn×1 и Rk×1 — множества
матриц-столбцов, имеющих n и k элементов соответственно. Для
краткости будем писать Rn = Rn×1 и Rk = Rk×1 и называть
матрицы-столбцы векторами.
Матрица A ∈ Rn×k называется матрицей коэффициентов,
вектор b ∈ Rn — правой частью, а вектор x ∈ Rk — решением
системы (1).

3.2. Линейные комбинации


Для понимания сути дела исключительно полезна следующая
интерпретация системы (1). Согласно определению умножения
матрицы на число, если α ∈ R, то
   
b1 αb1
α ... ≡ ... .
bn αbn
38 Лекция 3

Пусть a1 , . . . , ak — столбцы матрицы A:


A = [a1 , . . . , ak ], a1 , . . . , ak ∈ Rn .
Тогда соотношения (1) равносильны равенству между векторами
x1 a1 + . . . + xk ak = b. (2)
Выражение x1 a1 + . . . + xk ak называется линейной комби-
нацией векторов a1 , . . . , ak , а числа x1 , . . . , xk называются коэф-
фициентами линейной комбинации. Множество всевозможных
линейных комбинаций векторов a1 , . . . , ak
L(a1 , . . . , ak ) = {α1 a1 + . . . + αk ak : α1 , . . . , αk ∈ R}
называется линейной оболочкой векторов a1 , . . . , ak .
Таким образом, равенство (2) означает, что
b ∈ L(a1 , . . . , ak ). (3 )
Другими словами, система (1) имеет решение (совместна) тогда
и только тогда, когда правая часть b принадлежит линейной
оболочке (является линейной комбинацией) столбцов матрицы
коэффициентов.

3.3. Линейная зависимость


Векторы, все элементы которых равны нулю, называют ну-
левыми векторами, а иногда просто нулями. Любой нулевой
вектор будем обозначать символом 0.
Линейная комбинация векторов называется нетривиальной,
если хотя бы один из ее коэффициентов отличен от нуля. Си-
стема (другими словами, непустая упорядоченная совокупность
конечного числа) векторов называется линейно зависимой, если
для них существует нетривальная линейная комбинация, равная
нулевому вектору.
Лемма 1. Если a1 , . . . , ak — линейно зависимая система k > 1
ненулевых векторов, то в ней существует вектор am , m > 1,
являющийся линейной комбинацией предыдущих векторов:

am ∈ L(a1 , . . . , am−1 ).

Доказательство. Рассмотрим равную нулю нетривиальную ли-


нейную комбинацию
α1 a1 + . . . + αk ak = 0,
3.4. Линейная независимость 39

и пусть m — наибольший номер такой, что αm = 0. Если m =


= 1, то α1 a1 = 0 и, поскольку α1 = 0, получаем: a1 = 0, что
противоречит условию леммы. Следовательно, m > 1. Тогда

α1 a1 + . . . + αm am = 0 ⇒
α α
⇒ am = − 1 a1 + . . . + − m−1 am−1 . 
αm αm

3.4. Линейная независимость


Система векторов называется линейно независимой, если она
не является линейно зависимой. Таким образом, если векторы
a1 , . . . , ak линейно независимы, то

α1 a1 + . . . + αk ak = 0 ⇒ α1 = . . . = αk = 0.

Лемма 2. Любая подсистема линейно независимой системы


является линейно независимой.
Доказательство. Предположим, что подсистема линейно зави-
сима. Значит, существует нетривиальная линейная комбинация
векторов данной подсистемы, равная нулю. Тогда линейная ком-
бинация векторов исходной системы с теми же коэффициентами
при векторах из подсистемы и нулевыми коэффициентами при
других векторах является нетривиальной линейной комбинацией,
равной нулю. Получаем противоречие с линейной независимо-
стью исходной системы. 
Лемма 3. Если вектор является линейной комбинацией линей-
но независимых векторов, то коэффициенты этой линейной
комбинации определены единственным образом.
Доказательство. Пусть векторы a1 , . . . , ak линейно независи-
мы и
b = α1 a1 + . . . + αk ak = β1 a1 + . . . + βk ak .

Отсюда

(α1 − β1 )a1 + . . . + (αk − βk )ak = 0 ⇒


⇒ α1 − β1 = . . . = αk − βk = 0. 
Задача 1. Для каждого n найдите все значения параметра a, при
которых столбцы трехдиагональной матрицы
40 Лекция 3
⎡ ⎤
a 1
⎢−1 a 1 ⎥
⎢ ⎥

A=⎢ . .. .. .. ⎥
. .

⎣ −1 a 1⎦
−1 a
порядка n линейно независимы.
Задача 2. Матрица размеров (n + 1) × n имеет элементы aij > 0
при i = j и aij < 0 при i = j . Докажите, что при n = 3 ее столбцы
линейно независимы. Верно ли это при n = 4?

3.5. Транзитивность линейной зависимости


Важное (хотя и очевидное) свойство: если
L(c1 , . . . , cr ) ⊂ L(b1 , . . . , bm ) и L(b1 , . . . , bm ) ⊂ L(a1 , . . . , ak ),
то
L(c1 , . . . , cr ) ⊂ L(a1 , . . . , ak ).

3.6. Монотонность числа линейно независимых


векторов
Лемма 4. Пусть каждая из систем векторов b1 , . . . , bm
и a1 , . . . , ak линейно независима, и предположим, что
L(b1 , . . . , bm ) ⊂ L(a1 , . . . , ak ). (∗)
Тогда m  k .
Доказательство. Согласно (∗) система
b1 , a1 , . . . , ak
линейно зависима. В силу леммы 1 существует вектор, являю-
щийся линейной комбинацией предыдущих векторов, пусть это
будет вектор
ak ∈ L(b1 , a1 , . . . , ak−1 ).
Отсюда следует, что
L(a1 , . . . , ak ) ⊂ L(b1 , a1 , . . . , ak−1 ).
В силу транзитивности линейной зависимости
L(b1 , . . . , bm ) ⊂ L(b1 , a1 , . . . , ak−1 ),
поэтому система
b2 , b1 , a1 , . . . , ak−1
3.7. Базис и размерность 41

линейно зависима. В силу леммы 1 и в этой системе существует


вектор, линейно выражающийся через предыдущие, причем тако-
вым не может быть вектор b1 (векторы b1 , b2 линейно независимы
как подсистема линейно независимой системы (лемма 2)). Не
ограничивая общности, будем считать, что
ak−1 ∈ L(b2 , b1 , a1 , . . . , ak−2 ).
Предположим, что m > k . Тогда, продолжая предыдущие
построения, на k -м шаге получаем
L(a1 , . . . , ak ) ⊂ L(bk , bk−1 , . . . , b1 ).
Следовательно, bk+1 ∈ L(bk , bk−1 , . . . , b1 ), а это противоречит
предположению о линейной независимости векторов b1 , . . . , bm .
Полученное противоречие доказывает, что m  k . 
Заметим, что лемма остается в силе и без предположения о
линейной независимости системы a1 , . . . , ak — докажите!

3.7. Базис и размерность


Линейно независимая система векторов b1 , . . . , bm ∈ V =
= L(a1 , . . . , ak ) называется базисом линейной оболочки V , если
L(b1 , . . . , bm ) = V .
Теорема о базисах. Любые базисы линейной оболочки V со-
держат одно и то же число векторов.
Доказательство. Пусть b1 , . . . , bm и c1 , . . . , cr — два базиса
данной линейной оболочки. Ясно, что
L(b1 , . . . , bm ) = L(c1 , . . . , cr ).
Применяя лемму 4 два раза, получаем два неравенства: m  r
и r  m. Отсюда m = r. 
Определение. Число векторов в базисах линейной оболочки V
называется ее размерностью и обозначается dim V .
Теорема о размерности линейной оболочки :
dim L(a1 , . . . , ak )  k.
Доказательство. Достаточно заметить, что в качестве базиса
линейной оболочки заданной системы векторов можно выбрать
их максимальную линейно независимую подсистему. 
В качестве базиса в линейной оболочке L(a1 , . . . , an ) всегда
можно выбрать некоторую подсистему векторов a1 , . . . , an . Мак-
симальная линейно независимая подсистема называется базой
данной системы.
Утверждение. Для того чтобы подсистема векторов a1 , . . .
. . . , an являлась базисом в L = L(a1 , . . . , an ), необходимо и до-
статочно, чтобы она была базой.
42 Лекция 3

Доказательство. Не ограничивая общности, будем считать, что


подсистему образуют первые k векторов a1 , . . . , ak . Если это
база, то каждый из векторов ak+1 , . . . , an линейно выражается
через a1 , . . . , ak ⇒ L ⊂ L(a1 , . . . , ak ) ⊂ L ⇒ L = L(a1 , . . .
. . . , ak ). Таким образом, система a1 , . . . , ak есть базис в L.
Если выбранная подсистема является базисом в L, то в силу
предыдущего рассуждения и теоремы о базисах никакая база не
может иметь бо́льшее число векторов. 
Задача 1. Векторы a1 , . . . , ak+1 линейно независимы. Доказать,
что в линейной оболочке L(a1 , . . . , ak+1 ) существует базис, не содер-
жащий ни одного вектора из линейной оболочки L(a1 , . . . , ak ).

3.8. Дополнение до базиса


Лемма о дополнении до базиса. Любая линейно независимая
система векторов b1 , . . . , bm ∈ L(a1 , . . . , ak ) является подси-
стемой некоторого базиса данной линейной оболочки.
Доказательство. Достаточно рассмотреть случай, когда век-
торы a1 , . . . , ak линейно независимы. Система векторов b1 , . . .
. . . , bm , a1 , . . . , ak линейно зависима. В силу леммы 1 в ней
существует вектор, линейно выражающийся через предыдущие.
Уберем этот вектор и рассмотрим оставшуюся подсистему. Если
она линейно независима, то и является базисом линейной обо-
лочки L(a1 , . . . , ak ). Если нет, в ней имеется вектор, линейно
выражающийся через предыдущие. Исключим и его из систе-
мы, рассмотрим оставшуюся подсистему и т. д. В итоге система
векторов b1 , . . . , bm будет дополнена до базиса некоторыми из
векторов a1 , . . . , ak . 

3.9. Существование базиса


Для любой ли линейной оболочки существует базис? Соглас-
но лемме о дополнении до базиса, базис существует, если в
линейной оболочке существует линейно независимая подсистема
векторов. Так будет, если существует хотя бы один ненулевой
вектор.
Таким образом, базиса нет только в случае нулевой линейной
оболочки, содержащей единственный вектор — нулевой. По опре-
делению размерность нулевой линейной оболочки равна нулю.
3.10. Совместность системы линейных алгебраических уравнений 43

3.10. Совместность системы линейных


алгебраических уравнений
Теорема 1.Система линейных алгебраических уравнений Ax =
= b, A = [a1 , . . . , ak ], совместна тогда и только тогда, когда
L(a1 , . . . , ak ) = L(a1 , . . . , ak , b).
Доказательство. В любом случае имеем
L(a1 , . . . , ak ) ⊂ L(a1 , . . . , ak , b). (∗)
Если система совместна, то b ∈ L(a1 , . . . , ak ). Следовательно,
L(a1 , . . . , ak , b) ⊂ L(a1 , . . . , ak ). (∗∗)
Включения (∗) и (∗∗) доказывают равенство двух линейных обо-
лочек. Если имеет место (∗∗), то очевидно, что b ∈ L(a1 , . . . , ak ),
а это и означает совместность системы Ax = b. 
Теорема 2. Если n = k , то в случае линейной независимости
векторов a1 , . . . , an система линейных алгебраических уравне-
ний Ax = b совместна и имеет единственное решение.
Доказательство. Очевидно, что
a1 , . . . , an ∈ L(e1 , . . . , en ),
где e1 , . . . , en — столбцы единичной матрицы размеров n × n (на
i-м месте в векторе ei находится 1, а все остальные элементы
равны 0). В силу теоремы о дополнении до базиса существует
базис из r  n векторов, содержащий векторы a1 , . . . , an . В силу
теоремы о размерности линейной оболочки r  n. По той же
причине векторы a1 , . . . , an образуют базис в L(a1 , . . . , an , b).
Поэтому b ∈ L(a1 , . . . , an ), что и доказывает совместность систе-
мы. Единственность решения вытекает из леммы 3. 
Задача 1. Система линейных алгебраических уравнений вида
    
a 0 a 1 a 2 x1 1
a 1 a 0 a 1 x2 = 0
a 2 a 1 a 0 x3 0

имеет решение, причем x1 = 0. Докажите, что столбцы матрицы коэф-


фициентов линейно независимы.
Лекция 4

4.1. Индикатор линейной зависимости


Рассмотрим систему векторов a1 , . . . , an ∈ Rn и попробуем
сконструировать индикатор линейной зависимости — функцию
f (a1 , . . . , an ), которая равна нулю в случае линейной зависимо-
сти данной системы. При этом функция f должна иметь как
можно более простой вид: пусть f будет линейна по каждому
аргументу при фиксированных значениях остальных аргументов.
Дадим точную формулировку требований к функции f :
A) для любого 1  i  n функция линейна по i-му аргументу
(функция должна иметь «простой вид»):
f (a1 , . . . , ai−1 , αa + βb, ai+1 , . . . an ) =
= α f (a1 , . . . , ai−1 , a, ai+1 , . . . , an ) +
+ β f (a1 , . . . , ai−1 , b, ai+1 , . . . , an )
для любых векторов a, b ∈ Rn и чисел α, β ∈ R;
B) если система векторов a1 , . . . , an линейно зависима, то
f (a1 , . . . , an ) = 0;
C) функция принимает заданное ненулевое значение на задан-
ной линейно независимой системе (условие нормировки):
f (e1 , . . . , en ) = 1,
где e1 , . . . , en — столбцы единичной матрицы порядка n.
Функцию f с указанными свойствами будем называть инди-
катором линейной зависимости. Для ее построения нам понадо-
бится понятие подстановки.

4.2. Подстановки и перестановки


Обратимое отображение σ : N → N, где N = {1, 2, . . . , n},
называется подстановкой (иногда также перестановкой) сте-
4.2. Подстановки и перестановки 45

пени n. Для обозначения подстановки σ часто используется


таблица  
1 2 ... n
σ= ,
σ(1) σ(2) . . . σ(n)
в которой числа σ(1), σ(2), . . . , σ(n) образуют перестановку чи-
сел 1, 2, . . . , n (это равносильно обратимости отображения σ ).
Определим произведение подстановок a и b как отображение,
получаемое последовательным выполнением (композицией) отоб-
ражений b и a:
(ab)(i) = a(b(i)), i ∈ N.
Это алгебраическая операция на множестве всех подстановок
степени n, относительно которой оно является группой. В самом
деле, ассоциативность очевидна (этим свойством всегда облада-
ет композиция отображений). Роль единичного элемента играет
тождественное отображение
 
1 2 ... n
e= ,
1 2 ... n
а обратным элементом для σ является обратное отображе-
ние σ −1 .
Группа подстановок степени n называется симметрической
группой степени n и обозначается Sn . Это один из важ-
нейших примеров конечных групп (групп с конечным числом
элементов; при этом число элементов называется порядком
группы). Нетрудно проверить, что порядок группы Sn равен
n! = 1 · 2 · . . . · n.
Название симметрической группы навеяно определени-
ем симметрических функций: так называется функция
F (x1 , . . . , xn ), если она инвариантна относительно любых
подстановок своих аргументов:
F (x1 , . . . , xn ) = F (xσ(1) , . . . , xσ(n) ) ∀ σ ∈ Sn .
Пример симметрической функции (определяемой числовым пара-
метром k ):
n
Fk (x1 , . . . , xn ) = xki .
i=1
Задача. 1. Даны две системы чисел: x1 x2  . . . xn и y1 y2  . . .
. . . yn . Доказать, что для любой подстановки σ ∈ Sn выполняется
неравенство
n n

|xi − yi |  |xi − yσ(i) |.
i=1 i=1
46 Лекция 4

4.3. Циклы и транспозиции


Подстановка a ∈ Sn называется циклом длины k , если име-
ется k попарно различных номеров i1 , . . . , ik ∈ N таких, что
1) a(i1 ) = i2 , a(i2 ) = i3 , . . . , a(ik−1 ) = ik , a(ik ) = i1 ,
2) a(i) = i ∀ i ∈ N \ {i1 , i2 , . . . , ik }.
Для обозначения цикла a удобно использовать запись
a = (i1 , . . . , ik ).
Цикл длины 2 называется также транспозицией.
Циклы a = (i1 , . . . , ik ) и b = (j1 , . . . , jm ) называются незави-
симыми, если
{i1 , . . . , ik } ∩ {j1 , . . . , jm } = ∅.
1) Любые независимые циклы a и b коммутируют: ab = ba.
2) Любая подстановка σ ∈ Sn представима в виде произве-
дения независимых циклов однозначно с точностью до
порядка сомножителей.
3) Любой цикл длины k представим в виде произведения
k − 1 транспозиций.
4) Любая подстановка представима в виде произведения
транспозиций.
Утверждение (1) проверяется непосредственно: в случае неза-
висимых циклов a = (i1 , . . . , ik ) и b = (j1 , . . . , jm ) находим
(ab)(i) = (ba)(i) = a(i) при i ∈ {i1 , . . . , ik },
(ab)(i) = (ba)(i) = b(i) при i ∈ {j1 , . . . , jm },
(ab)(i) = (ba)(i) = i при i ∈ / {i1 , . . . , ik } ∪ {j1 , . . . , jm }.
Чтобы доказать (2), возьмем произвольный номер j и рас-
смотрим последовательность номеров j , σ(j), σ 2 (j), . . . Имеется
только n различных значений — поэтому для каких-то k < l
должно быть σ k (j) = σ l (j), откуда получаем: σ l−k (j) = j . Пусть
k — наименьший номер такой, что σ k (j) = j . Тогда получаем
цикл
a = (j , σ(j), σ 2 (j), . . . , σ k−1 (j)),
для которого
σ(i) = a(i) при i ∈ {j , σ(j), σ 2 (j), . . . , σ k−1 (j)}.
Ясно, что подстановка σ1 = σa−1 оставляет на месте индексы
i ∈ {j , σ(j), σ 2 (j), . . . , σ k−1 (j)}.
4.4. Четность подстановки 47

Далее, возьмем j1 ∈
/ {j , σ(j), σ 2 (j), . . . , σ k−1 (j)} и аналогичным
образом построим цикл b, выполняющий преобразования вида
j1 → σ1 (j1 ) → σ12 (j1 ) → . . .
(Заметим, что σ1l (j1 ) = σ l (j1 ) для всех l.) Продолжая подобные
построения, мы неизбежно придем к тождественной подстановке
σ a−1 b−1 . . . c−1 = e,
откуда
σ = c . . . ba.
По построению циклы a, b, . . . , c независимы.
Утверждение (3) доказывается проверкой, например, следую-
щего равенства:
(i1 , . . . , ik ) = (i1 , i2 )(i2 , i3 ) . . . (ik−1 , ik ).
Утверждение (4), очевидно, вытекает из (2) и (3).
Задача 1. Докажите, что все множество подстановок степени n
можно упорядочить таким образом, что каждая следующая подста-
новка будет получаться из предыдущей путем умножения справа на
некоторую транспозицию.

4.4. Четность подстановки


Подстановка может быть разложена в произведение транспо-
зиций многими способами. Например,
 
1 2 3 4 5 6 7
=
7 5 3 1 2 4 6
= (1, 7) (7, 6) (6, 4) (2, 5) = (1, 7) (7, 6) (6, 4) (7, 2) (7, 5) (7, 2).
Однако число транспозиций в любом разложении одной и той же
подстановки обладает следующим важным свойством.
Лемма о числе транспозиций. Четность числа транспозиций
не зависит от способа представления подстановки в виде
произведения транспозиций.
Доказательство. Для заданной подстановки σ ∈ Sn
 
1 2 ... n
σ=
σ(1) σ(2) . . . σ(n)
назовем инверсией пару (i, j), если i < j , но σ(i) > σ(j). Пусть
δ(σ) — общее число инверсий для σ . Докажем, что для любой
48 Лекция 4

транспозиции τ разность δ(στ ) − δ(σ) будет нечетным числом.


Пусть τ = (i, j), i < j . Тогда
 
1 ... i − 1 i i + 1 ... j − 1 j j + 1 ... n
στ = σ(1) . . . σ(i − 1) σ(j) σ(i + 1) . . . σ(j − 1) σ(i) σ(j + 1) . . . σ(n) .

Предположим, что подстановка σ имеет k инверсий среди пар


вида
(i, l), где l ∈ {i + 1, i + 2, . . . , j − 1}, (∗)
m инверсий среди пар вида
(l, j), где l ∈ {i + 1, i + 2, . . . , j − 1} (∗∗)
и еще s инверсий среди любых других пар. Тогда στ будет
иметь j − i − 1 − k инверсий среди пар вида (∗) и j − i − 1 − m
инверсий среди пар вида (∗∗). Кроме того, среди любых других
пар подстановка στ будет иметь s + 1 инверсий, если пара (i, j)
не была инверсией, и s − 1 инверсий в противном случае. Таким
образом,
δ(σ) = k + m + s,
δ(στ ) = (i − j − 1 − k) + (i − j − 1 − m) + s ± 1.
Отсюда
δ(στ ) − δ(σ) = 2(i − j − 1 − k − m) ± 1. 
Следствие. Четность числа транспозиций в разложении под-
становки совпадает с четностью ее числа инверсий.
Определение. Подстановка называется четной, если она яв-
ляется произведением четного числа транспозиций, и нечетной
в противном случае.
Замечание. Рассмотрим функцию

Δ(x1 , . . . , xn ) = (xj − xi ).
i<j

Тогда для любой подстановки σ ∈ Sn выполнено одно из двух:


Δ(x1 , . . . , xn ) = Δ(xσ(1) , . . . , xσ(n) )
либо
Δ(x1 , . . . , xn ) = −Δ(xσ(1) , . . . , xσ(n) ).
Четные подстановки и только они знак сохраняют (первый слу-
чай), нечетные и только они знак меняют (второй случай).
4.5. Единственность индикатора линейной зависимости 49

Множество всех четных подстановок в Sn образует подгруп-


пу (докажите!), которая называется знакопеременной группой
степени n и обозначается An .
Задача 1. Докажите, что любую четную подстановку степени n 
 3 можно представить в виде произведения циклов длины 3.

4.5. Единственность индикатора линейной


зависимости
Вернемся к построению индикатора линейной зависимости —
функции f (a1 , . . . , an ) от векторов
⎡ ⎤ ⎡ ⎤ ⎡ ⎤
a11 a12 a1n
⎢a ⎥ ⎢a ⎥ ⎢a ⎥
a1 = ⎣ 21 ⎦ , a2 = ⎣ 22 ⎦ , . . . , an = ⎣ 2n ⎦ ,
... ... ...
an1 an2 ann
удовлетворяющей требованиям (A), (B), (C). Легко видеть, что

n 
n 
n
a1 = ai1 1 ei1 , a2 = ai1 2 ei2 , . . . , an = ain n ein ,
i1 =1 i2 =1 in =1

где e1 , e2 , . . . , en — столбцы единичной матрицы размеров n × n.


Если искомая функция f существует, то свойство (A) линей-
ности по каждому аргументу приводит к выражению

n 
n
f (a1 , . . . , an ) = ... ai1 1 ai2 2 . . . ain n f (ei1 , ei2 , . . . , ein ).
i1 =1 in =1

Согласно требованию (B), f = 0 на любой линейно за-


висимой системе векторов. Очевидно, что система векторов
ei1 , ei2 , . . . , ein будет линейно зависимой в том и только том
случае, когда среди этих векторов есть равные (если все эти век-
торы попарно различны, то они образуют перестановку столбцов
единичной матрицы). Следовательно, исключая из суммирования
заведомые нули, находим

f (a1 , . . . , an ) = aσ(1)1 aσ(2)2 . . . aσ(n)n ×
σ∈Sn

× f (eσ(1) , eσ(2) , . . . , eσ(n) ).


Далее, из требований (A) и (B) вытекает, что f должна
менять знак при перестановке любых двух аргументов. Докажем
50 Лекция 4

это, например, для первого и второго аргументов. Учтем, что


f = 0 в случае равных аргументов, и воспользуемся линейностью
по каждому аргументу:

0 = f (a1 + a2 , a1 + a2 , a3 , . . . , an ) =
= f (a1 , a1 , a3 , . . . , an ) + f (a1 , a2 , a3 , . . . , an ) +
+ f (a2 , a1 , a3 , . . . , an ) + f (a2 , a2 , a3 , . . . , an ).
Первое и четвертое слагаемые имеют совпадающие векторы
и поэтому равны нулю. Отсюда

f (a1 , a2 , a3 , . . . , an ) = −f (a2 , a1 , a3 , . . . , an ).
Следовательно, если подстановка σ является транспозицией, то

f (eσ(1) , eσ(2) , . . . , eσ(n) ) = −f (e1 , e2 , . . . , en ) = −1.


В общем случае подстановку σ можно разложить в про-
изведение транспозиций. Пусть δ(σ) есть число транспозиций
в каком-либо из разложений. Тогда

f (eσ(1) , eσ(2) , . . . , eσ(n) ) = (−1)δ(σ) .


По лемме о числе транспозиций четность числа δ(σ) не зависит
от конкретного разложения в произведение транспозиций, поэто-
му величина (−1)δ(σ) зависит только от σ . Назовем ее знаком
подстановки и обозначим через sgn(σ). Окончательно:

f (a1 , . . . , an ) = sgn(σ) aσ(1)1 aσ(2)2 . . . aσ(n)n . (∗)
σ∈Sn

Мы доказали важное
Утверждение. Если функция–индикатор линейной зависимо-
сти существует, то она определяется формулой (∗).

4.6. Определитель
Определение. Функция вида (∗) называется определителем
(детерминантом) матрицы A со столбцами a1 , a2 , . . . , an и обо-
значается det A или |A|.
Таким образом, если A = [aij ] — матрица размеров n × n, то
4.6. Определитель 51
 
 a11 . . . a1n 
 
det A = |A| =  . . . . . . . . .  =
a 
n1 . . . ann

= sgn(σ) aσ(1)1 aσ(2)2 . . . aσ(n)n . ()
σ∈Sn
Частные случаи:
 
 a11 a12 
  = a11 a22 − a21 a12 ,
 a21 a22 
 
 a11 a12 a13 
 
 a21 a22 a23  = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 −
a a a 
31 32 33
− a13 a22 a31 − a12 a21 a33 − a11 a23 a32 .
В общем случае сумма () содержит n! членов, в каждом из
них перемножаются n элементов матрицы, причем никакие два
элемента в одном произведении не принадлежат одной строке
или одному столбцу.
Несмотря на то что определитель вводится как функция от
матрицы, исторически понятие определителя сформировалось в
XVIII веке (сначала в трудах Лейбница и Крамера, затем теория
определителей была развита в работах Вандермонда, Лапласа,
Коши и К. Якоби) — намного раньше понятия матрицы, вве-
денного в алгебру Гамильтоном и Кэли в середине XIX века.
Конечно, с самого начала определитель связывался с квадрат-
ной таблицей n × n чисел (поэтому говорили об определителе
порядка n). Это были, в частности, таблицы коэффициентов
«квадратной» системы линейных алгебраических уравнений. Но
такие таблицы стали называть матрицами позже — когда для
них ввели операцию умножения.
Лекция 5

5.1. Определитель транспонированной матрицы


Пусть имеется прямоугольная матрица размеров m × n:

A = [aij ], 1  i  m, 1  j  n.
Если поменять местами строки и столбцы, то получается новая
матрица — размеров n × m. Она называется транспонированной
по отношению к A и обозначается A :

A = [aji ], 1  j  n, 1  i  m.

Утверждение. Для любой квадратной матрицы det A =


= det A.
Доказательство. Согласно определению транспонированной
матрицы и формуле () из лекции 4 для определителя матрицы
порядка n

det A = sgn(σ) a1 σ(1) . . . an σ(n) =
σ∈Sn

= sgn(σ) aσ−1 (1) 1 . . . aσ−1 (n) n =
σ∈Sn

= sgn(σ −1 ) aσ−1 (1) 1 . . . aσ−1 (n) n = det A.
σ −1 ∈Sn

В последнем равенстве было принято во внимание, что


sgn(σ −1 ) = sgn(σ). 
Задача 1. Докажите, что столбцы вещественной прямоугольной
матрицы A линейно независимы тогда и только тогда, когда линейно
независимы столбцы матрицы A A.
5.2. Определитель как функция столбцов (строк) матрицы 53

5.2. Определитель как функция столбцов (строк)


матрицы
1) Определитель как функция столбцов матрицы является
линейной функцией относительно каждого столбца: если A =
= [a1 , . . . , an ] и ai = αp + βq — линейная комбинация столбцов
p и q , то
det A = α det Ap + β det Aq ,
где матрицы Ap и Aq получаются из A заменой столбца ai
на p и q соответственно.
Доказательство. В соответствии с определением

det A = sgn(σ) aσ(1)1 aσ(2)2 . . . aσ(i)i . . . aσ(n)n =
σ∈Sn

= sgn(σ)aσ(1)1 aσ(2)2 . . . (αpσ(i)i + βqσ(i)i ) . . . aσ(n)n =
σ∈Sn

=α sgn(σ)aσ(1)1 aσ(2)2 . . . pσ(i)i . . . aσ(n)n
σ∈Sn

+β sgn(σ)aσ(1)1 aσ(2)2 . . . qσ(i)i . . . aσ(n)n =
σ∈Sn

= α det Ap + β det Aq . 
2) Определитель меняет знак при перестановке двух столб-
цов.
Доказательство. Пусть матрица B = [bij ] отличается от A
перестановкой столбцов ak и al . Тогда для любой подстановки
σ ∈ Sn
aσ(1)1 . . . aσ(n)n = b(στ )(1)1 . . . b(στ )(n)n ,
где τ = (k , l), и, поскольку транспозиция меняет знак подстанов-
ки,
sgn (στ ) = −sgn (σ).
Легко видеть, что отображение σ → στ задает взаимно-
однозначное соответствие между подстановками. Каждый
член суммы вида () определяется одной и только одной
подстановкой. Подстановки σ и στ в разложениях det A и det B
определяют члены с произведением одних и тех же элементов
(в разном порядке), но с противоположными знаками. Значит,
det A = − det B . 
54 Лекция 5

3) Если столбцы матрицы линейно зависимы, то ее опреде-


литель равен нулю.
Доказательство. Прежде всего заметим, что определитель с
двумя равными столбцами равен нулю, поскольку в силу утвер-
ждения (2) он равен себе самому с противоположным знаком.
Если столбцы a1 , a2 , . . . , an линейно зависимы, то хотя бы
один из них линейно выражается через остальные. Пусть

ai = αk ak .
k=i

Обозначим через B матрицу, полученную из A заменой столбца


ai на 
ai − αk ak = 0.
k=i

Опираясь на уже установленное свойство (1), находим



0 = det B = det A − αk det Ak ,
k=i

где матрица Ak получается из A заменой i-го столбца на ak .


Ясно, что в Ak равны i-й и k -й столбцы, поэтому det Ak = 0.
Таким образом, det A = det B = 0. 
4) Определитель как функция строк матрицы обладает свой-
ствами, аналогичными (1), (2), (3).
Доказательство. Достаточно учесть, что det A = det A , и рас-
смотреть det A как функцию столбцов матрицы A . 
Задача 1. Даны матрицы-столбцы u1 , . . . , uk , v1 , . . . , vk ∈ Rn и
A = u1 v1 + ... + uk vk . Доказать, что det A = 0, если k < n.
Задача 2. Пусть u, v ∈ Rn и I — единичная матрица. Докажите,
что det(I + uv  ) = 1 + v  u.

5.3. Существование индикатора линейной зависимости


Теорема. Индикатор линейной зависимости (функция, на-
деленная свойствами (A), (B), (C) из п. 4.1) существует,
единствен и является определителем.
Свойства (A) и (B) индикатора линейной зависимости сов-
падают с установленными выше свойствами определителя (1)
и (3). Свойство (C) означает, что определитель единичной мат-
рицы равен 1, и является следствием следующего более общего
утверждения.
5.4. Подматрицы и миноры 55

Утверждение. Определитель диагональной матрицы равен


произведению элементов ее диагонали:
⎡ ⎤
a11 0
det ⎣ .. ⎦ = a11 · . . . · ann .
.
0 ann
Доказательство. Для диагональной матрицы в сумме () для
ее определителя есть только одно ненулевое слагаемое, равное
произведению элементов главной диагонали. 

5.4. Подматрицы и миноры


Для заданной матрицы A = [aij ] можно выбрать какие-то из
ее строк и столбцов и составить таблицу элементов, расположен-
ных на пересечении выбранных строк и столбцов. Такая таблица
называется подматрицей матрицы A.
Пусть A — квадратная матрица порядка n. Чтобы за-
дать квадратную подматрицу порядка k , нужно указать но-
мера содержащих ее строк 1  i1 < . . . < ik  n и столб-
цов 1  j1 < . . . < jk  n. Обозначим через Nk множество
всех систем номеров (i1 , . . . , ik ), упорядоченных по возрастанию:
1  i1 < . . . < ik  n. Тогда задание подматрицы равносильно
выбору двух конкретных систем номеров
I = (i1 , . . . , ik ) ∈ Nk , J = (j1 , . . . , jk ) ∈ Nk .
Подматрица на строках с номерами из I и столбцах с номерами
из J обозначается
A(I , J) = [aip jq ], 1  p  k, 1  q  k.
I
Пусть = (i1 , . . . , im )
— еще одна система номеров, упорядо-
ченных по возрастанию: 1  i1 < . . . < im  n. Назовем систему
I  дополнительной для I = (i1 , . . . , ik ), если
{i1 , . . . , ik } ∩ {i1 , . . . , im } = ∅,
{i1 , . . . , ik } ∪ {i1 , . . . , im } = {1, . . . , n}.
Очевидно, что в этом случае k + m = n.
Пусть заданы системы строчных и столбцовых номеров
I , J ∈ Nk , и пусть I  и J  — дополнительные системы для I и J
соответственно. Подматрица A(I  , J  ) порядка m = n − k назы-
вается дополнительной подматрицей по отношению к подматрице
A(I , J) порядка k .
56 Лекция 5

Определитель подматрицы порядка k называется также ми-


нором порядка k , а определитель соответствующей дополнитель-
ной подматрицы — дополнительным минором.

5.5. Замечание о подстановках


Как мы знаем, подстановка σ степени n задается таблицей
 
1 2 ... n
σ= .
σ(1) σ(2) . . . σ(n)
Поскольку отображение полностью определяется указанием со-
ответствий i → σ(i), порядок столбцов в этой таблице не имеет
значения. Другими словами, для любой подстановки π ∈ Sn таб-
лица  
π(1) π(2) . . . π(n)
 = σ(π(1)) σ(π(2)) . . . σ(π(n))
σ

однозначно определяет ту же самую подстановку σ = σ .


При этом очевидно, что четность числа инверсий для σ сов-
падает с четностью суммы числа инверсий для подстановок π
и σπ (поскольку четность числа инверсий для произведения σπ
совпадает с четностью суммы числа инверсий для σ и π ). Отсюда
ясно, что если подстановка задана таблицей вида
 
s(1) s(2) . . . s(n)
t(1) t(2) . . . t(n) , s, t ∈ Sn ,

то ее знак равен произведению знаков подстановок s и t.

5.6. Разбиение множества подстановок


на подмножества
Пусть J = (j1 , . . . , jk ) — фиксированная система номеров и
(j1 , . . . , jm
 ) — система дополнительных номеров. Таким образом,
m = n − k . Возьмем любую систему номеров I = (i1 , . . . , ik ) ∈ Nk
с дополнительной системой номеров (i1 , . . . , im ) и рассмотрим
подстановки степени n вида
  
j1 . . . jk j1 . . . jm
σ = σI ,J (π , τ ) = i   , π ∈ Sk , τ ∈ Sm . (∗)
π(1) . . . iπ(k) iτ (1) . . . iτ (m)

Множество всех таких подстановок при фиксированных I , J обо-


значим
Sn (I , J) = {σI ,J (π , τ ) : π ∈ Sk , τ ∈ Sm }.
5.6. Разбиение множества подстановокна подмножества 57

Любой системе номеров I = (i1 , . . . , ik ) ∈ Nk поставим в соответ-


ствие число
ν(I) = i1 + . . . + ik .
Лемма. При фиксированной системе J подмножества Sn (I , J)
не пересекаются при разных I ∈ Nk и их объединение дает
множество всех подстановок степени n. Кроме того,
sgn(σI ,J (π , τ )) = sgn(π) sgn(τ ) (−1)ν(I)+ν(J) .
Доказательство. Первое утверждение леммы о разбиении Sn
на непересекающиеся подмножества вида Sn (I , J) очевидно.
В силу сделанного выше замечания о подстановках знак
подстановки σI ,J (π , τ ), определяемой таблицей (∗), есть произ-
ведение знаков подстановок вида
 
1 ... k k + 1 ... k + m
j1 . . . jk j1 
. . . jm
и  
1 ... k k + 1 ... k + m
iπ(1) . . . iπ(k) iτ (1) . . . iτ (m) .

Подсчитаем число инверсий для первой подстановки. Принимая


во внимание упорядоченность номеров в системах (j1 , . . . , jk ),
(j1 , . . . , jm
 ) и их взаимную дополнительность, приходим к выводу
о том, инверсию могут образовывать только пары вида
(p, q), где p ∈ {1, . . . , k}, q ∈ {k + 1, . . . , k + m}. (∗∗)
При этом ясно, что j1 порождает j1 − 1 инверсий, j2 порождает
j2 − 2 инверсий и т. д.: общее число инверсий, таким образом,
равно
(j1 − 1) + (j2 − 2) + . . . + (jk − k).
Число инверсий для второй подстановки включает три слагае-
мых:
1) число инверсий среди пар вида вида (∗∗);
2) число инверсий среди пар вида (p, q), где p, q ∈ {1, . . . , k};
3) число инверсий среди пар вида (p, q), где p, q ∈ {k + 1, . . .
. . . , k + m}.
Первое число равно, по аналогии с рассмотренным выше случа-
ем,
(i1 − 1) + (i2 − 2) + . . . + (ik − k),
второе — числу инверсий δ(π) для подстановки π ∈ Sk , третье —
числу инверсий δ(τ ) для подстановки τ ∈ Sm . Таким образом,
58 Лекция 5

четность числа инверсий для подстановки σ(π , τ ) совпадает


с четностью числа
δ(π) + δ(τ ) + (i1 + . . . + ik ) + (j1 + . . . + jk ) =
= δ(π) + δ(τ ) + ν(I) + ν(J). 

5.7. Теорема Лапласа


Теорема Лапласа. Пусть A — квадратная матрица поряд-
ка n. Зафиксируем любую систему k столбцов, выбрав J ∈ Nk .
Тогда вычисление определителя матрицы A сводится к вы-
числению миноров на фиксированных k столбцах и их допол-
нительных миноров:

det A = det A(I , J) det A(I  , J  ) (−1)ν(I)+ν(J) .
I∈Nk

Доказательство. Опираясь на результат предыдущей леммы,


находим

  
det A = (aiπ(1) j1 . . . aiπ(k) jk ) ×
I∈Nk π∈Sk τ ∈Sm

× (aiτ (1) j1 . . . aiτ (m) jm
 )sgn(σ(π , τ )) =


  
= (aiπ(1) j1 . . . aiπ(k) jk ) ×
I∈Nk π∈Sk τ ∈Sm

× (aiτ (1) j1 . . . aiτ (m) jm
 ) sgn(π) sgn(τ )) (−1)ν(I)+ν(J) =


 
= (aiπ(1) j1 . . . aiπ(k) jk ) sgn(π) ×
I∈Nk π∈Sk


× (aiτ (1) j1 . . . aiτ (m) jm
 ) sgn(τ )) (−1)ν(I)+ν(J) .
τ ∈Sm

Остается заметить, что первая и вторая скобки дают


det A(I , J) и det A(I  , J  ) соответственно. 
5.8. Определитель блочно-треугольной матрицы 59

Величину det A(I  , J  )(−1)ν(I)+ν(J) называют алгебраи-


ческим дополнением минора det A(I , J). Таким образом,
теорема Лапласа утверждает, что при выборе любой системы
столбцов определитель матрицы равен сумме всевозможных
расположенных на заданных столбцах миноров, умноженных
на их алгебраические дополнения.
Поскольку det A = det A , имеет место и такой вариант тео-
ремы Лапласа: при выборе любой системы строк определи-
тель матрицы равен сумме всевозможных расположенных на
данных строках миноров, умноженных на их алгебраические
дополнения.
Задача 1. Матрица B с определителем b = det B получена из
матрицы A с определителем a = det A прибавлением числа c = 0 к
каждому элементу. Найти суммы алгебраических дополнений всех
элементов (подматриц порядка 1) для A и для B .
Задача 2. В (n × n)-матрице имется единственный минор порядка
r < n, отличный от нуля. Докажите, что все миноры порядка k  r + 1
равны нулю.
Задача 3. Пусть A — матрица порядка n с элементами aij = ±1.
Докажите, что если n = 4, то | det A|  16, и постройте матрицу, для
которой det A = 16. 1)

5.8. Определитель блочно-треугольной матрицы


Рассмотрим блочно-треугольную матрицу порядка n:


P R
A= , P ∈ Rk×k , Q ∈ Rm×m , k + m = n.
0 Q
Применение теоремы Лапласа к системе первых k столбцов (или
строк) сразу же дает полезную формулу
det A = det P det Q.

1)
В общем случае можно доказать, что если |aij |  1, то | det A|  nn/2 (см.
п. 25.8). Матрицы с элементами ±1, для которых | det A| = nn/2 , называются
матрицами Адамара. Нетрудно установить, что матрицы Адамара существуют
не для всех n. Имеется гипотеза о том, что матрицы Адамара существуют для
всех n, кратных 4.
Лекция 6

6.1. Обратная матрица


Матрица A порядка n называется обратимой, если суще-
ствует матрица X порядка n такая, что
AX = XA = I ,
где I — единичная матрица порядка n; X называется обратной
матрицей для A.
Может существовать только одна обратная матрица: если
AX = XA = I и AY = Y A = I , то X = X(AY ) = (XA)Y = Y .
Обозначение для обратной матрицы: X = A−1 .
Задача 1. Пусть A, B — произвольные матрицы порядка n; I и
0 — единичная и нулевая матрицы порядка n. Доказать, что
 −1  
I A 0 I −A AB
0 I B = 0 I −B .
0 0 I 0 0 I
(Отсюда следует, что любой алгоритм вычисления обратной матрицы
порядка n с числом операций s(n) порождает алгоритм умножения
матриц порядка n с числом операций s(3n)).
Задача 2. Дана квадратная матрица A такая, что A3 = 0. Дока-
жите, что матрица I − A обратима.
Задача 3. Найти все обратимые матрицы A порядка n, для кото-
рых все элементы A и A−1 неотрицательны. Доказать, что множество
всех таких матриц образует группу относительно операции умножения
матриц.
Задача 4. Даны матрицы P1 , . . . , Pn порядка n, каждая отлича-
ется от единичной матрицы перестановкой столбцов (такие матрицы
называются матрицами перестановки). Пусть P1 + ... + Pn = E , где
E — матрица, все элементы которой равны 1. Кроме того, пусть
Pi Pj = Pj Pi для всех i, j . Докажите, что множество матриц P1 , . . . , Pn
образует группу относительно операции умножения матриц.
6.2. Критерий обратимости матрицы 61

6.2. Критерий обратимости матрицы


Теорема. Квадратная матрица обратима тогда и только
тогда, когда ее столбцы образуют линейно независимую сис-
тему.
Доказательство. Пусть матрица A порядка n имеет линейно
независимые столбцы. Согласно результатам лекции 3 о совмест-
ности систем линейных алгебраических уравнений, каждая из
систем
Ax1 = e1 , Ax2 = e2 , . . . , Axn = en ,

где e1 , e2 , . . . , en — столбцы единичной матрицы, имеет един-


ственное решение. Пусть X = [x1 , x2 , . . . , xn ]. Тогда AX = I .
Столбцы матрицы X линейно независимы. В самом деле,
пусть некоторая линейная комбинация этих столбцов равна ну-
лю:
α1 x1 + α2 x2 + . . . + αn xn = 0.

Это означает, что ⎡ ⎤


α1
⎢α ⎥
X ⎣ 2 ⎦ = 0.
...
αn
Следовательно,
⎡ ⎤ ⎡ ⎤
α1 α1
⎢α ⎥ ⎢ α2 ⎥
AX ⎣ 2 ⎦ = ⎣
... ⎦
= 0.
...
αn αn
Отсюда α1 = α2 = . . . = αn = 0. Таким образом, для X существу-
ет матрица Y такая, что XY = I . Докажем, что Y = A. В самом
деле, A = A(XY ) = (AX)Y = Y. 1)
Теперь предположим, что A = [a1 , . . . , an ] — обратимая мат-
рица, и рассмотрим равную нулю линейную комбинацию ее
столбцов:
α1 a1 + α2 a2 + . . . + αn an = 0.

1)
По существу, здесь воспроизводится часть доказательства более общего
утверждения, связанного с избыточностью рассмотренного нами определения
группы (см. дополнение к лекции 2).
62 Лекция 6

Данное равенство запишем в следующем виде:


⎡ ⎤
α1
⎢α ⎥
A ⎣ . .2. ⎦ = 0.
αn
Умножая обе части слева на A−1 , находим: α1 = . . . = αn = 0.
Следовательно, столбцы a1 , . . . , an линейно независимы. 

6.3. Обращение и транспонирование


Утверждение. (AB) = B  A . 
Доказательство. (AB)ij = (A)ik (B)kj = (B)kj (A)ik =
  k k
= (B )jk (A )ki = (B  A )ji . 
k
Из равенства AX = XA = I получаем: X  A = A X  = I .
Таким образом, матрица обратима тогда и только тогда,
когда обратима ее транспонированная матрица. При этом
X  = (A )−1 = (A−1 ) .
Обозначение: A− ≡ (A−1 ) .
Как следствие получаем «строчный» аналог критерия обра-
тимости матрицы: обратимость квадратной матрицы равно-
сильна линейной независимости ее строк.

6.4. Группа обратимых матриц


Множество обратимых (n × n)-матриц относительно опера-
ции умножения образует группу. Для доказательства есть все,
кроме факта обратимости произведения обратимых матриц. Но
он проверяется непосредственно: если A и B обратимы, то
(B −1 A−1 )(AB) = B −1 (A−1 A)B = B −1 I B = I ,
(AB)(B −1 A−1 ) = A(BB −1 )A−1 = A−1 I A = I.
Отсюда
(AB)−1 = B −1 A−1 .

Задача 1. Пусть H — группа невырожденных верхних треуголь-


ных матриц порядка n, G — группа всех обратимых матриц порядка n.
Верно ли, что ABA−1 ∈ H для любых матриц B ∈ H и A ∈ G (в этом
случае подгруппа H называется нормальным делителем группы G)?
6.5. Обращение невырожденной матрицы 63

6.5. Обращение невырожденной матрицы


Квадратная матрица с отличным от нуля определителем на-
зывается невырожденной.
Пусть A = [Aij ] — матрица порядка n, в которой элемент Aij
есть алгебраическое дополнение элемента aij в матрице A. Мат-
рица A называется присоединенной для матрицы A.
Теорема. Если матрица A порядка n невырожденная, то она
обратима и при этом
1 
A−1 = A ,
det A
 — присоединенная матрица для A.
где A
Доказательство. Заметим, что
n 
det A, k = i,
aij Akj = 0, k = i. (∗)
j=1

При k = i равенство (∗) получается применением теоремы Лапла-


са при разложении определителя матрицы A по k -й строке. При
k = i левая часть равенства (∗) представляет собой разложение
по k -й строке определителя матрицы, полученной из A заменой
k -й строки на i-ю. Такой определитель равен нулю — как опреде-
литель матрицы с двумя одинаковыми строками. Например, если
n = 3, i = 1, k = 2, то
a11 A21 + a12 A22 + a13 A23 =
       
a12 a13  a11 a13  a11 a12 
= a11 −    
+ a12   + a13 −   =
a32 a33  a31 a33  a31 a32 
 
a11 a12 a13 
 
= a11 a12 a13  = 0.
a a a 
31 32 33

Далее,

n 
n
aij Akj = aij (A  )jk , 1  i, k  n.
j=1 j=1

Поэтому, в силу соотношений (∗),


⎡ det A ⎤

AA =⎣ .. ⎦ = det A · I.
.
det A
64 Лекция 6

Используя теорему Лапласа для разложения определителя по


k -му столбцу, находим
n 
det A, k = j ,
aij Aik = 0, k = j ⇒
i=1
⎡ ⎤
det A 0
⇒ A  A = ⎣ ..
. ⎦ = det A · I. 
0 det A

Задача 1. Докажите, что любую невырожденную матрицу можно


сделать вырожденной, изменив лишь один из ее элементов.

6.6. Правило Крамера


Теорема. Пусть A — невырожденная матрица порядка n.
Тогда система линейных алгебраических уравнений Ax = b
имеет и притом единственное решение x c компонентами
det Ai
xi = , 1  i  n,
det A
где Ai — матрица, получаемая из A заменой i-го столбца
на b.
Доказательство. Согласно теореме об обращении невырожден-
ной матрицы,

1 1 
n
x=A−1
b=  
A b ⇒ xi = Aji bj , 1  i  n.
det A det A
j=1


n
Остается заметить, что сумма Aji bj есть разложение по i-му
j=1
столбцу определителя матрицы Ai . 

6.7. Определитель произведения матриц


Теорема. Определитель произведения квадратных матриц
равен произведению их определителей.
Доказательство. Пусть A = [a1 , . . . , an ] — матрица порядка n
со столбцами a1 , . . . , an и B = [bij ]. Тогда любой столбец матри-
6.8. Обратимость и невырожденность 65

цы AB есть линейная комбинация столбцов матрицы A с коэф-


фициентами из соответствующего столбца матрицы B :
 n 
 
n
AB = bi1 1 ai1 , . . . , bin n ain .
i1 =1 in =1

Используя линейность определителя по каждому столбцу, полу-


чаем
n 
n
det(AB) = ... bi1 1 . . . bin n det[ai1 , . . . , ain ] =
i1 =1 in =1

= bσ(1)1 . . . bσ(n)n det[aσ(1) , . . . , aσ(n) ] =
σ∈Sn


= bσ(1)1 . . . bσ(n)n sgn(σ) det A =
σ∈Sn
= det B · det A. 

Задача 1. Пусть P — обратимая матрица порядка n. Докажите,


что для любых столбцов u, v ∈ Rn×1 выполняется равенство det(I +
+ uv  ) = det(I + (P u)(P − v) ).
Задача 2. Докажите, что определитель трехдиагональной матри-
цы не изменится, если каждый наддиагональный элемент умножить,
а каждый поддиагональный элемент поделить на одно и то же число.

6.8. Обратимость и невырожденность


Теорема. Квадратная матрица обратима тогда и только
тогда, когда она является невырожденной.
Доказательство. Пусть для матрицы A существует обратная
матрица A−1 . Тогда AA−1 = I и, в силу теоремы об определителе
произведения матриц,
det A · det A−1 = det I = 1 ⇒ det A = 0.
Если det A = 0, то A обратима по теореме об обращении невы-
рожденной матрицы. 
Следствие. Столбцы матрицы A линейно независимы тогда
и только тогда, когда det A = 0.
Задача 1. Пусть In и Im — единичные матрицы порядка n и m
соответственно. Докажите, что для любых матриц A размеров m × n
и B размеров n × m из обратимости Im − AB вытекает обратимость
3 Е. Е. Тыртышников
66 Лекция 6

In − BA. Докажите также, что обратимость каждой из этих матриц


равносильна обратимости матрицы порядка m + n с блочным разбие-
нием вида  
Im A
B In .

Задача 2. Даны числа a и b такие, что 1 − ab = 0. Докажите, что


матрица ⎡ ⎤
1 a a2 ... an
⎢b 1 a ... an−1 ⎥
⎢ ⎥
A = ⎢ b2 b 1 ... an−2 ⎥
⎣ ... ... ... ... ... ⎦
bn bn−1 bn−2 ... 1
обратима и обратная к ней матрица является трехдиагональной.
Задача 3. Пусть в условии предыдущей задачи a и b — квадратные
блоки порядка n, а 1 заменяется единичной матрицей I того же поряд-
ка. Докажите, что если блок I − ab является обратимой матрицей, то
блочная матрица A с блоками порядка n обратима и при этом обратная
к ней матрица является блочно-трехдиагональной.
Лекция 7

7.1. Разделение переменных и матрицы


При изучении функций двух переменных особую роль играют
функции с разделенными переменными, f (x, y) = u(x)v(y), или
суммы таких функций: 1)
f (x, y) = u1 (x)v1 (x) + . . . + ur (x)vr (y).
Пусть дана (m × n)-матрица A. Ее элемент aij можно рассмат-
ривать как функцию дискретных переменных i ∈ {1, . . . , m},
j ∈ {1, . . . , n}. В данном случае разделение переменных означа-
ет, что
aij = ui vj , 1  i  m, 1  j  n.
Отсюда легко вывести, что A есть произведение столбца и стро-
ки: 2)    
u1 v1

A = uv , u = ... , v = ... .
um vn

7.2. Скелетное разложение


Теперь предположим, что aij = ui1 vj 1 + . . . + uir vjr , 1  i  m,
1  j  n. В этом случае A является суммой r матриц вида
«столбец на строку»:
   
 r u1k v1k
A= uk vk , uk = . . . , vk = . . . .
k=1 umk vnk

1)
Разделение переменных с большим успехом применяется для приближе-
ния функций общего вида.
2)
Матрица uv  иногда называется внешним произведением векторов u ∈
∈ Cm и v ∈ Cn .

3*
68 Лекция 7

Это же равенство, записанное в виде произведения двух матриц:


  
u11 . . . u1r v11 . . . vn1

A = UV = ... ... ... ... ... ... , (∗)
um1 . . . umr v1r . . . unr
U = [u1 , . . . , ur ], V = [v1 , . . . , vr ],
называется скелетным разложением матрицы A. Оно означа-
ет, что каждый столбец матрицы A есть линейная комбинация
столбцов матрицы U , а каждая строка матрицы A есть линейная
комбинация строк матрицы V  . Отсюда сразу же вытекает
Теорема. Размерность линейной оболочки, натянутой на
столбцы матрицы A, совпадает с размерностью линейной
оболочки, натянутой на ее строки:
a , ... , 
dim L(a1 , . . . , an ) = dim L( a ),
⎡ 1 ⎤ m

a1
A = [a1 , . . . , an ] = ⎣ . . . ⎦ .
a
 m
Доказательство. Пусть столбцы матрицы U образуют базис
линейной оболочки L(a1 , . . . , an ), а j -й столбец матрицы V 
состоит из коэффициентов их линейной комбинации, дающей
столбец aj . Тогда, очевидно, A = U V  . В силу предваряющего
теорему замечания размерность линейной оболочки строк матри-
цы A не выше числа строк матрицы V  , которое равно, по по-
строению, размерности линейной оболочки столбцов матрицы A.
Противоположное неравенство доказывается аналогично — роль
столбцов и строк меняется транспонированием. 

7.3. Ранг матрицы


Размерность линейной оболочки столбцов (строк) матрицы
иногда называется ее столбцовым (строчным) рангом. Поскольку
столбцовый и строчный ранги совпадают, их общее значение
было бы естественно называть просто рангом матрицы. Из про-
веденного нами доказательства этого факта вытекает также, что
это значение равно наименьшему числу матриц вида «столбец на
строку», дающих в сумме данную матрицу.
Тем не менее обычно дается другое определение: рангом
матрицы называется наивысший порядок ее отличных от ну-
ля миноров. Соответствующие минор и подматрица называются
базисным минором и базисной подматрицей. В силу уже уста-
новленной эквивалентности обратимости и невырожденности,
7.4. Окаймление обратимой подматрицы 69

ранг матрицы равен наивысшему порядку обратимых подматриц


в данной матрице. Обозначение: rank A.
Два очевидных свойства ранга матрицы A размеров m × n:
rank A  min(m, n), rank A = rank A .
Менее очевидно, что: наивысший порядок отличных от ну-
ля миноров матрицы совпадает с ее столбцовым и строчным
рангом. Давайте это докажем.

7.4. Окаймление обратимой подматрицы


Начнем с полезного вспомогательного предложения. Пусть
матрица Q порядка k + 1 имеет блочный вид:


P v
Q= , P ∈ Rk×k , u, v ∈ Rk×1 .
u c
В этом случае Q называется окаймлением подматрицы P .
Лемма о необратимом окаймлении. Если подматрица P об-
ратима, а ее окаймление Q является необратимой матрицей,
то последний столбец матрицы Q есть линейная комбинация
первых k столбцов.
Доказательство. Используя правило умножения блочных мат-
риц (см. лекцию 1), легко проверить справедливость равенства




I 0 P v P v
= 0 γ , γ = c − u P −1 v.
−u P −1 1 u c
Обозначим матрицу в правой части через M . Как произведение
обратимой и необратимой матриц, M не может быть обратимой
матрицей. Но она имеет блочно-треугольный вид, и если бы
блоки P и γ были оба обратимы, то M имела бы обратную
матрицу вида
−1
−1 P −P −1 vγ −1
M = .
0 γ −1
(Равенство M M −1 = I проверяется непосредственно.) Поскольку
M не является обратимой матрицей, непременно
γ = c − u P − 1 v = 0 ⇒ c = u P −1 v.
Следовательно,


P −1 v
(P v) = . 
u c
70 Лекция 7

7.5. Теорема о базисном миноре


Теорема. Столбцы (строки), содержащие базисный минор,
являются линейно независимыми, при этом любой столбец
(любая строка) данной матрицы является их линейной ком-
бинацией.
Доказательство. Не ограничивая общности, предположим, что
базисная подматрица P порядка k расположена в левом верхнем
углу матрицы A размеров m × n. Таким образом,
⎡ P vk+1 ... vn ⎤
⎢ u a . . . ak+1 n ⎥
A = ⎣ k+1 k+1 k+1
... ... ⎦
,
... ...

um am k+1 . . . amn

uk+1 , . . . , um , vk+1 , . . . , vn ∈ Rk×1 .


По условию теоремы любая подматрица порядка k + 1 вида


P vj
M= , i, j > k ,
u
i aij

является необратимой. По лемме о необратимом окаймлении


обратимой подматрицы последний столбец в M есть линейная
комбинация первых k столбцов. При этом коэффициенты данной
линейной комбинации не зависят от i (поскольку определяются
вектором P −1 vj ). Значит, j -й столбец матрицы A при j > k
есть линейная комбинация первых k столбцов. Линейная неза-
висимость первых k столбцов доказывается следующим образом:
пусть их линейная комбинация с коэффициентами α1 , . . . , αk
равна 0, тогда
   
α1 α1
P ... = 0 ⇒ . . . = 0.
αk αk
Утверждение теоремы относительно строк доказывается перехо-
дом к транспонированной матрице. 
Следствие 1. Матрица имеет ранг r тогда и только тогда,
когда некоторый минор порядка r отличен от нуля, а все
окаймляющие его миноры порядка r + 1 равны нулю.
Следствие 2. Ранг матрицы совпадает с ее строчным
и столбцовым рангом.
7.6. Ранги и матричные операции 71

Замечание. Теорема о базисном миноре не использует доказан-


ной ранее теоремы о равенстве столбцового и строчного рангов.
По существу она дает еще одно доказательство этого факта.
Задача 1. Путь A — (n × n)-матрица ранга k, а B — любая
невырожденная подматрица порядка k. Обозначим через R подматрицу
размеров k × n, состоящую из строк матрицы A, содержащих подматри-
цу B , а через C — подматрицу размеров n × k, состоящую из столбцов,
содержащих B . Доказать, что
A = CB −1 R.

Задача 2. Докажите, что подматрица, расположенная на пересече-


нии r линейно независимых строк и r линейно независимых столбцов
матрицы ранга r , является невырожденной.
Задача 3. Известно, что A = −A. Докажите, что ранг матри-
цы A — число четное.

7.6. Ранги и матричные операции


Утверждение 1. Ранг суммы матриц не превосходит суммы
их рангов:
rank (A + B)  rank A + rank B.

Доказательство. Очевидно, что A и B должны иметь одинако-


вое число столбцов:
A = [a1 , . . . , an ], B = [b1 , . . . , bn ].
Ясно, что L(a1 + b1 , . . . , an + bn ) ⊂ L(a1 , . . . , an , b1 , . . . , bn ).
В меньшей линейной оболочке выберем какую-либо систему век-
торов, образующую базис. Согласно лемме о дополнении до ба-
зиса, базис в большей линейной оболочке можно получить путем
дополнения данной системы какими-то векторами из большей
линейной оболочки. Поэтому
rank (A + B) = dim L(a1 + b1 , . . . , an + bn ) 
 dim L(a1 , . . . , an , b1 , . . . , bn ).
Пусть p = rank A, q = rank B , и предположим, не огра-
ничивая общности, что базис в L(a1 , . . . , an ) образуют первые
p векторов, а базис в L(b1 , . . . , bn ) — первые q векторов. То-
гда L(a1 , . . . , an , b1 , . . . , bn ) = L(a1 , . . . , ap , b1 , . . . , bq ) ⇒
dim L(a1 , . . . , an , b1 , . . . , bn )  p + q. 
72 Лекция 7

Утверждение 2. Ранг произведения матриц не превосходит


ранга каждого из сомножителей:

rank (AB)  min (rank A, rank B).

Доказательство. Достаточно заметить, что каждый из столбцов


матрицы AB является линейной комбинацией столбцов матри-
цы A. Поэтому линейная оболочка столбцов матрицы AB содер-
жится в линейной оболочке столбцов матрицы A. Следовательно,
rank (AB)  rank A. Далее,

rank (AB) = rank (AB) = rank (B  A )  rank B  =


= rank B. 
Утверждение 3. Ранг матрицы не изменяется при умножении
ее слева или справа на обратимую матрицу.
Доказательство. Пусть B = P AQ, где P и Q — обратимые
матрицы. 1) В силу предыдущего утверждения rank B  rank A.
В то же время A = P −1 BQ−1 ⇒ rank A  rank B . 
Данное утверждение полезно при вычислении ранга. Обычно
это делается с помощью элементарных преобразований строк
и столбцов, упрощающих вид матрицы путем исключения ее
элементов; эти преобразования сводятся к умножению матрицы
слева и справа на некоторые обратимые матрицы (специального
вида) и поэтому сохраняют ранг.
Утверждение 4. При изменении k строк (столбцов) матрицы
ее ранг не может измениться больше чем на k .
Доказательство. Достаточно рассмотреть случай k = 1. Пусть
ранг равен r, а столбцы aj1 , . . . , ajr являются базисными. Если
столбец aj совпадает с одним из этих столбцов, то при любом
его изменении данная система столбцов будет иметь линейно
независимую подсистему с числом столбцов r − 1. Поэтому ранг
новой матрицы не меньше чем r − 1 и, конечно, не больше r.
Если столбец aj не совпадает ни с одним из выбранных базисных
столбцов, то любой столбец новой матрицы линейно выражается
через столбцы aj1 , . . . , ajr , aj , поэтому ее ранг не больше чем
r + 1 и не меньше чем r, так как имеется система из r линейно
независимых столбцов aj1 , . . . , ajr . 

1)
Конечно, порядок P равен числу строк, а порядок Q — числу столбцов
матрицы A.
7.7. Однородная система линейных алгебраических уравнений 73

Следствие. При добавлении (изъятии) k столбцов ранг мат-


рицы не может измениться более чем на k .
Задача 1. Пусть A и B — матрицы ранга 1. Докажите, что если
 0, то ранг матрицы A + B не больше 1.
AB =
Задача 2. Заданы столбцы x, y ∈ Rn , причем x = 0. Докажите,
что существует симметричная матрица A ∈ Rn×n такая, что rankA  2
и Ax = y .
Задача 3. Матрица A имеет r столбцов, а матрица B имеет r
строк. Докажите, что r  rank(A) + rank(B) − rank(AB).
Задача 4. Докажите, что любую матрицу ранга r с неотрица-
тельными элементами можно представить в виде разности матриц
с неотрицательными элементами и рангом, не превышающим 2r .

7.7. Однородная система линейных алгебраических


уравнений
Система линейных алгебраических уравнений с нулевой пра-
вой частью
Ax = 0 (∗)
называется однородной. Пусть в данной системе имеется m
уравнений и n неизвестных. Тогда матрица коэффициентов A
имеет размеры m × n. Рассмотрим A как систему столбцов
A = [a1 , . . . , an ] и предположим, что ее ранг равен r. Не огра-
ничивая общности, будем считать, что базисная подматрица в A
расположена на первых r столбцах — будем называть их ба-
зисными. Отвечающие базисным столбцам компоненты реше-
ния x1 , . . . , xr будем также называть базисными, а оставшие-
ся компоненты xr+1 , . . . , xn — свободными. Таким образом,
вектор-решение имеет вид
⎡ ⎤
x1
⎢ ... ⎥
⎢ ⎥
⎢ xr ⎥
x=⎢ ⎢x
⎥.

⎢ r+1 ⎥
⎣ ... ⎦
xn
Система (∗) равносильна равенству
x1 a1 + . . . + xr ar = −xr+1 ar+1 − . . . − xn an . (∗∗)
74 Лекция 7

По теореме о базисной подматрице столбцы ar+1 , . . . , an при-


надлежат линейной оболочке столбцов a1 , . . . , ar . Поэтому при
любом выборе значений свободных неизвестных значения базис-
ных неизвестных, удовлетворяющих равенству (∗∗), существуют
и определяются однозначно. Таким образом, существуют n − r
векторов вида
⎡ ⎤ ⎡ ⎤ ⎡ ⎤
x11 x12 x1 n−r
⎢ ... ⎥ ⎢ ... ⎥ ⎢ ... ⎥
⎢x ⎥ ⎢x ⎥ ⎢x ⎥
⎢ r1 ⎥ ⎢ r2 ⎥ ⎢ r n−r ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
v1 = ⎢ 1 ⎥ , v2 = ⎢ 0 ⎥ , . . . , vn−r = ⎢ 0 ⎥ ,
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ 0 ⎥ ⎢ 1 ⎥ ⎢ 0 ⎥
⎣ ⎦ ⎣ ⎦ ⎣ ⎦
... ... ...
0 0 1
каждый из который является решением системы (∗):
Av1 = 0, . . . , Avn−r = 0.
Векторы v1 , . . . , vn−r линейно независимы:
⎡ ⎤

⎢ ... ⎥
⎢ ∗ ⎥
⎢ ⎥
⎢ ⎥
α1 v1 + . . . + αn−r vn−r = ⎢ α1 ⎥ = 0 ⇒ α1 = . . . = αn−r = 0.
⎢ ⎥
⎢ α2 ⎥
⎣ ⎦
...
αn−r
Кроме того, любая линейная комбинация этих векторов является
решением системы (∗) и, более того, если x есть произвольное
решение системы (∗), то
x = xr+1 v1 + . . . + xn vn−r .
Таким образом, мы доказали следующее важное утверждение.
Теорема. Множество решений однородной системы линейных
алгебраических уравнений (∗) совпадает с линейной оболочкой
L(v1 , . . . , vn−r ) линейно независимых векторов v1 , . . . , vn−r .
Следствие. dim L(v1 , . . . , vn−r ) = n − r.
Линейно независимую систему решений w1 , . . . , wk системы
Ax = 0 называют фундаментальной системой, если ее линей-
ная оболочка L(w1 , . . . , wk ) совпадает с множеством всех реше-
ний однородной системы Ax = 0.
Следствие. Число векторов в любой фундаментальной систе-
ме решений для Ax = 0 равно n − r, где r = rank A.
7.9. Общее решение системы линейных алгебраических уравнений 75

Для доказательства достаточно заметить, что линейная обо-


лочка векторов фундаментальной системы решений имеет базис
из построенных выше векторов v1 , . . . , vn−r .
Задача 1. Даны матрицы A и B порядка n такие, что AB = 0
и при этом матрица A + B невырожденная. Доказать, что rankA +
+ rankB = n.

7.8. Теорема Кронекера–Капелли


Рассмотрим систему линейных алгебраических уравнений
Ax = b с (m × n)-матрицей A = [a1 , . . . , an ]. Матрица [A, b] =
= [a1 , . . . , an , b] называется расширенной матрицей данной си-
стемы.
Теорема. Система Ax = b совместна тогда и только тогда,
когда ранг матрицы коэффициентов совпадает с рангом рас-
ширенной матрицы:
rankA = rank[A, b].

Доказательство. Мы уже знаем (см. лекцию 3), что совмест-


ность системы Ax = b равносильна равенству линейных обо-
лочек L(a1 , . . . , an ) = L(a1 , . . . , an , b). Остается заметить, что
rank A = dim L(a1 , . . . , an ) и rank [A, b] = dim L(a1 , . . . , an , b). 

7.9. Общее решение системы линейных


алгебраических уравнений
Если U и V — два множества векторов из Rn , то суммой U +
+ V называется множество, составленное из всевозможных сумм
векторов вида u + v , где u ∈ U , v ∈ V .
Теорема. Предположим, что система Ax = b совместна, и за-
фиксируем произвольное частное решение u (Au = b). Тогда
множество всех решений системы Ax = b имеет вид u + V , где
V — множество всех решений соответствующей однородной
системы Ax = 0.
Доказательство. Пусть x — произвольное решение системы
Ax = b. Тогда, очевидно, A(x − u) = 0 ⇒ x − u ∈ V ⇒
x ∈ u + V . Далее, возьмем произвольный вектор x ∈ u + V ⇒
x = u + v , v ∈ V ⇒ A(u + v) = Au + Av = b + 0 = b. 
Следствие. Общее решение совместной системы Ax = b имеет
вид
x = u + c1 v1 + . . . + cn−r vn−r ,
76 Лекция 7

где u — произвольное частное решение данной системы,


v1 , . . . , vn−r — линейно независимые решения соответству-
ющей однородной системы, r = rank A, а коэффициенты
c1 , . . . , cn−r — произвольные числа.
Задача 1. Что можно сказать о матрице и правой части системы
Ax = b относительно вектора x ∈ Rn , если ее решением является любой
вектор из Rn ?

7.10. Неустойчивость ранга


Матрица называется матрицей полного ранга, если ее ранг
совпадает с одним из ее размеров (т. е. имеет максимально
возможное значение). В противном случае говорят о матрице
неполного ранга.
Можно доказать, что если A есть (m × n)-матрица полного
ранга, то при всех достаточно малых ε > 0 матрица A + F ,
где все элементы матрицы–возмущения F по модулю меньше ε,
будет также матрицей полного ранга. Для этого достаточно за-
метить, что любой минор можно рассматривать как функцию его
элементов, и это будет непрерывная функция. Если при неко-
торых значениях переменных непрерывная функция отлична от
нуля, то она будет отлична от нуля также в некоторой достаточно
малой окрестности этих значений.
В то же время, если A имеет неполный ранг, то для лю-
бого сколь угодно малого ε существует матрица–возмущение F
с элементами по модулю не больше ε и такая, что A + F будет
матрицей полного ранга. Например, матрица
 
1 0 0 0
A= 0 1 0 0
0 0 0 0
имеет ранг 2, но для любого ε = 0 матрица
 
1 0 0 0
A= 0 1 0 0
0 0 ε 0
имеет, очевидно, ранг 3.
Лекция 8

8.1. Исключение неизвестных


Если задана система линейных алгебраических уравнений
Ax = b и требуется найти ее общее решение или установить
несовместность, то это удобнее всего сделать путем последова-
тельного исключения неизвестных: если в каком-то уравнении
коэффициент при x1 отличен от нуля, то можно исключить x1
из всех других уравнений путем вычитания данного уравнения,
предварительно умноженного на подходящим образом выбран-
ные коэффициенты; если среди уравнений, уже не содержащих
x1 , имеется уравнение с ненулевым коэффициентом при x2 , то x2
можно аналогичным образом исключить из всех других уравне-
ний, кроме данного и первого уравнения, содержащего x1 , и т. д.
На каждом шаге исключения получается новая система, ко-
торая, очевидно, равносильна исходной. Если возникло уравне-
ние, в котором все коэффициенты при неизвестных равны нулю,
а в правой части получилось отличное от нуля число, то система
не имеет решений. В противном случае система совместна и
описанный способ позволяет с легкостью выписать ее общее
решение.

8.2. Элементарные матрицы


Каждый шаг описанного выше исключения неизвестных
преобразует систему Ax = b в равносильную систему вида
(P A)x = P b, где P — некоторая обратимая матрица. Если по-
требовалось k шагов, то в итоге возникает последовательность
равносильных систем
Ax = b, (P1 A)x = P1 b, (P2 P1 A)x = P2 P1 b, . . .
. . . , (Pk . . . P2 P1 A)x = Pk . . . P2 P1 b.
78 Лекция 8

Матрица коэффициентов последней системы имеет настолько


простой вид, что решение соответствующей системы осуществ-
ляется уже очевидным образом.
Цель каждого шага — получение дополнительных нулей, или,
как часто говорят, исключение элементов в матрице преобразо-
ванной системы. Чтобы пояснить, как это делается, рассмотрим
матрицу A размеров 4 × 6, заведомо нулевые элементы будем
обозначать «ноликом», произвольные элементы — «крестиком»,
а заведомо ненулевые элементы — «крестиком в рамочке». Если
a11 = 0, то из каждой строки с номером i > 1 можно вычесть
первую с коэффициентом, дающим нуль в позиции (i, 1):
⎡ ⎤ ⎡ ⎤
 × × × × ×  × × × × ×
⎢ × × × × × ×⎥ ⎢ 0 × × × × ×⎥
⎣ × × × × × ×⎦ → ⎣ 0 × × × × ×⎦ .
× × × × × × 0 × × × × ×
В дальнейшем первые строка и столбец остаются без изменений.
Если во втором столбце имеется ненулевой элемент, делаем
соответствующую строку второй и с ее помощью исключаем все
остальные элементы второго столбца:
⎡ ⎤ ⎡ ⎤
 × × × × ×  × × × × ×
⎢ 0  × × × ×⎥ ⎢ 0  × × × ×⎥
⎣ 0 × × × × ×⎦ → ⎣ 0 0 × × × ×⎦ .
0 × × × × × 0 0 × × × ×
Первые два столбца и первые две строки меняться больше не
будут. Может случиться так, что у нас получились «внеплано-
вые» нулевые столбцы. Например, если оставшиеся «крестики»
в третьем и четвертом столбцах оказались нулями, то следует
проводить исключение с помощью ненулевого элемента в пятом
столбце (если таковой есть):
⎡ ⎤ ⎡ ⎤
 × × × × ×  × × × × ×
⎢ 0  × × × ×⎥ ⎢ 0  × × × ×⎥
⎣ 0 0 0 0  ×⎦ → ⎣ 0 0 0 0  ×⎦ .
0 0 0 0 × × 0 0 0 0 0 ×
Кажый шаг, очевидно, сводится к умножению матрицы слева
на некоторую матрицу Pl . При этом каждая из матриц Pl , 1  l 
 k , может быть представлена как произведение двух матриц:
Pl = Zl Πl ,
8.2. Элементарные матрицы 79

где Zl отличается от I (единичной матрицы) только в позициях


ниже главной диагонали какого-то одного (пусть j -го) столбца:
⎡ ⎤
1
⎢ .. ⎥
⎢ . ⎥
⎢ ⎥
⎢ 1 ⎥
Zl = ⎢ ⎥,
⎢ (Zl )j+1 j ⎥
⎢ . ⎥
⎣ ... . . ⎦
(Zl )nj 1

а Πl получается из I перестановкой столбцов (или строк). Мат-


рицы Πl и Zl указанного специального вида будем для краткости
называть элементарными матрицами; матрица Πl называет-
ся матрицей перестановки, а Zl — матрицей модификации
строк. Их роль в процессе исключения объясняется следующи-
ми фактами:
• матрица Πl A отличается от A перестановкой строк;
• если Zl отличается от единичной матрицы j -м столбцом, то
матрица Zl A имеет те же первые j строк, что и в матри-
це A, а i-я строка при i > j есть сумма i-й строки и взятой
с некоторым коэффициентом j -й строки матрицы A.
Утверждение 1. Любая матрица перестановки Π обратима
и при этом
Π−1 = Π .

Утверждение 2. Любая матрица модификации строк Z = Zl


обратима и при этом обратная матрица получается из Z
изменением знаков поддиагональных элементов:
⎡ ⎤
1
⎢ .. ⎥
⎢ . ⎥
⎢ ⎥
⎢ 1 ⎥
Z −1 = ⎢ −(Zl )j+1 j ⎥.
⎢ ⎥
⎢ . ⎥
⎣ ... .. ⎦
−(Zl )nj 1

Доказательство сводится к непосредственной проверке равенств


ΠΠ−1 = I , ZZ −1 = I .
80 Лекция 8

8.3. Ступенчатые матрицы


Будем говорить, что матрица S = [sij ] размеров m × n являет-
ся верхней ступенчатой с числом ступеней k , если существуют
номера 1  j1 < . . . < jk  m, для которых:
• если 1  i  k , то sij = 0 при j = ji и sij = 0 при всех
1  j  ji − 1;
• если k + 1  i  m, то sij = 0 при всех 1  j  n.
Матрица S называется нижней ступенчатой с числом ступе-
ней k , если S  является верхней ступенчатой с числом ступе-
ней k .
Утверждение. Ранг ступенчатой матрицы с числом ступе-
ней k равен k .
Доказательство. Рассмотрим верхнюю ступенчатую матрицу S
и докажем, что ее строчный ранг (размерность линейной оболоч-
ки строк) равен числу ступеней k . Ясно, что S имеет ровно k
ненулевых строк, поэтому мы не ограничим общности, предпо-
ложив, что k = m. Докажем, что строки S линейно независимы.
Приравняем нулю их линейную комбинацию с коэффициентами
α1 , . . . , αk :
[α1 , . . . , αk ]S = [0, . . . , 0].
Отсюда
α1 s1j1 = 0 ⇒ α1 = 0.
Далее,
0 · s1 j2 + α2 s2 j2 = 0 ⇒ α2 = 0.
Продолжая подобным образом, находим α1 = . . . = αk = 0. В слу-
чае нижней ступенчатой матрицы S ее столбцовый ранг, очевид-
но, совпадает со строчным рангом верхней ступенчатой матри-
цы S  . 

8.4. Приведение к ступенчатой форме


Теорема 1. Для любой (m × n)-матрицы A ранга r существу-
ет обратимая матрица P, представимая в виде произведения
конечного числа элементарных матриц и такая, что матрица
S = P A является верхней ступенчатой с числом ступеней r.
Доказательство. Обозначим через j1 номер первого столбца
матрицы A, в котором есть хотя бы один ненулевой элемент.
(Если таковой столбец отсутствует, то A = 0 и теорема уже
доказана.) С помощью умножения слева на некоторую матрицу
перестановки Π1 ненулевой элемент можно переместить в пози-
цию (1, j1 ). Далее с помощью умножения слева на некоторую
8.5. Приведение к диагональной форме 81

матрицу модификации строк Z1 можно получить матрицу с ну-


лями в поддиагональных позициях j1 -го столбца и сохранением
нулей в предыдущих столбцах. Очевидно, что преобразованная
матрица имеет блочный вид (через 0p×q мы обозначаем нулевой
блок размеров p × q ):


01×(i1 −1) u
Z1 Π1 A = , u ∈ R(n−i1 +1)×1 .
0(m−1)×(i1 −1) B

Сделаем индуктивное предположение о существовании матри-


цы Q, являющейся произведением элементарных матриц порядка
m − 1 и такой, что QB имеет верхнюю ступенчатую форму.
Рассмотрим матрицу


1 0
P = Z1 Π1 .
0 Q

Легко видеть, что P есть произведение элементарных матриц


и при этом S = P A имеет верхнюю ступенчатую форму. Пусть
число ступеней равно k . Значит, строчный ранг матрицы S равен
k ⇒ k = rank S = rank A = r. 
Теорема 2. Для любой (m × n)-матрицы A ранга r существу-
ет обратимая матрица Q, представимая в виде произведения
конечного числа элементарных матриц и такая, что матрица
AQ является нижней ступенчатой с числом ступеней r.
Доказательство. Достаточно применить теорему 1 к матрице
A и заметить, что если матрица QA — верхняя ступенчатая,
то матрица (QA ) = AQ будет нижней ступенчатой.

8.5. Приведение к диагональной форме


Теорема. Для любой (m × n)-матрицы A ранга r существуют
обратимые матрицы P и Q, представимые в виде произве-
дения конечного числа элементарных матриц и такие, что
матрица B = P AQ имеет ненулевые элементы b11 , . . . , brr ,
а все остальные ее элементы равны нулю.
Доказательство. Сначала приведем A к верхней ступенчатой
форме S = P A, а затем заметим, что нижняя ступенчатая форма
SQ , получаемая согласно построениям теоремы 2, будет иметь
требуемую диагональную форму. 
82 Лекция 8

8.6. Эквивалентные матрицы


Матрицы A и B называются эквивалентными, если суще-
ствуют обратимые матрицы P и Q такие, что B = P AQ.
Теорема. Матрицы A и B эквивалентны тогда и только
тогда, когда они имеют одинаковые размеры и одинаковые
ранги.
Доказательство. В силу теоремы о приведении к диагональной
форме каждая из матриц A и B эквивалентна прямоугольной
диагональной матрице — обозначим их через DA и DB . При
этом очевидно, что DA и DB эквивалентны тогда и только тогда,
когда они имеют одинаковое число ненулевых диагональных эле-
ментов. Последнее означает, что rank DA = rank DB . Остается
учесть, что rank A = rank DA и rank B = rank DB . 

8.7. Метод Гаусса и LU -разложение


Рассмотренный выше метод исключения неизвестных обычно
называют методом Гаусса. Пусть он применяется к системе
Ax = b с невырожденной матрицей A. В данном случае верхняя
ступенчатая матрица, к которой приводится матрица A, оказы-
вается верхней треугольной матрицей.
Метод исключения неизвестных можно трактовать как метод
исключения элементов матрицы с целью приведения ее к более
простому виду. Если можно обойтись без перестановки уравне-
ний (строк матрицы), то метод Гаусса для матрицы порядка n
состоит в последовательном исключении элементов в столбцах
от 1-го до (n − 1)-го и приводит к равносильной системе
(Zn−1 . . . Z2 Z1 A)x = Zn−1 . . . Z2 Z1 b, (∗)
где Z1 , . . . , Zn−1 — матрицы модификации строк, причем Zi
отличается от I в точности i-м столбцом. Каждая из матриц
Z1 , . . . , Zn−1 является нижней треугольной, поэтому их произве-
дение
 = Zn−1 . . . Z1
L
является также нижней треугольной матрицей. Матрица коэф-
фициентов системы (∗)
A
U = Zn−1 . . . Z1 A = L
является верхней треугольной. Матрица L = L −1 является ниж-
ней треугольной. Следовательно, метод Гаусса порождает разло-
8.8. LU -разложение и строго регулярные матрицы 83

жение матрицы A в произведение нижней и верхней треугольной


матриц:
A = LU.
При этом L имеет на главной диагонали единицы, а U является
невырожденной матрицей (в силу невырожденности A). Такое
разложение называется LU -разложением.
Подсчитаем число арифметических операций при приведении
A к верхней треугольной матрице U . На i-м шаге требуется полу-
чить n − i нулей ниже диагонали в i-м столбце. При получении
нуля на пересечении i-го столбца и l-й строки при l > i из l-й
строки вычитается i-я строка, предварительно умноженная на
коэффициент, выбор которого и обеспечивает получение данного
нуля. Поскольку в рассматриваемых строках может быть только
n − i ненулевых элементов, число умножений (и вычитаний) при
получении нулей в i-м столбце равно (n − i)2 . Всего потребуется
1
(n − 1)2 + (n − 2)2 + . . . + 12 = n3 + O(n2 )
3
умножений и столько же вычитаний; через O(n2 ) обозначен
многочлен от n степени 2.
Чтобы найти решение системы Ax = b, требуется выполнить
еще два действия:
• вычислить вектор Zn−1 . . . Z1 b;
• найти решение системы с верхней треугольной матрицей U .
Каждое из этих действий требует лишь O(n2 ) арифметических
операций — на порядок меньше, чем приведение к верхнему
треугольному виду.
Задача 1. Невырожденная матрица и обратная к ней разбиты на
блоки одинаковых размеров:
   
A A B B
A = A11 A12 , A−1 = B11 B12 .
21 22 21 22

Доказать, что блок A11 невырожден тогда и только тогда, когда невы-
рожден блок B22 .

8.8. LU -разложение и строго регулярные матрицы


Допустим, что невырожденная матрица A имеет
LU -разложение: A = LU . Обозначим через Ak , Lk , Uk
подматрицы порядка k , расположенные в левом верхнем углу
84 Лекция 8

матриц A, L, U соответственно, и рассмотрим равенство блочных


матриц



Ak P Lk 0 Uk W
A≡ = k .
Q Ak V L k 0 U
Отсюда вытекает, что
Ak = Lk Uk , k = 1, . . . , n.
Очевидно, что матрицы Lk и UK невырожденные (как треуголь-
ные матрицы с ненулевой диагональю). Поэтому подматрица
Ak должна быть невырожденной. Матрица A, в которой все
подматрицы Ak невырожденные, называется строго регулярной.
Таким образом, для существования LU -разложения невырож-
денной матрицы A необходимо, чтобы она была строго регу-
лярной.
Можно доказать, что это условие является также и доста-
точным. В самом деле, пусть уже построено LU -разложение для
подматрицы Ak = Lk Uk . Тогда




L−
k
1
0 Ak P Uk L −1
P k − QA−1 P.
k = 0 , W =A
k
−QA− k
1
I Q A W k
(#)
Блок W называется дополнением по Шуру блока Ak в матри-
це A. Из равенства (#) и строгой регулярности A можно выве-
сти, что W является также строго регулярной матрицей. Пред-
положим, что для W уже построено LU -разложение W = L k Uk .
Тогда положим




Lk 0 I 0 Uk L−
k
1
P
L= k , U= .
QA− 1
k Lk I 0 L 0 Uk
Полученная таким образом матрица L — верхняя треугольная.
Равенство LU = A проверяется прямым вычислением.
Задача 1. Пусть A — невырожденная матрица порядка n и
A(I , J) — ее невырожденная подматрица на строках и столбцах,
определенных системами номеров I = (i1 , . . . , ik ) и J = (j1 , . . . , jk )
соответственно. Пусть k < n, а I  и J  — дополнительные системы
номеров. Доказать, что

det A−1 (I  , J  ) = (−1)i1 +...+ik +j1 +...+jk det A(I , J)/ det A.
Лекция 9

9.1. Метод координат


Нашим исследованиям линейной зависимости и линейных
оболочек векторов (матриц-столбцов) можно дать наглядную
геометрическую интерпретацию. Как скоро выяснится, опреде-
литель также имеет замечательный геометрический смысл. При
этом «алгебраизация» геометрических понятий дает мощный ал-
гебраический инструмент для решения задач геометрии.
К основным объектам геометрии относятся точки, прямые и
плоскости в геометрическом пространстве. Если A и B — точки
прямой, то пусть [AB] обозначает отрезок прямой — множество
точек данной прямой, расположенных между точками A и B ;
|AB| — длина отрезка [AB].
Будем опираться на то, что между вещественными числами
и точками прямой существует взаимно-однозначное соответствие
x ↔ P (x), которое полностью определяется заданием двух точек
P (0), P (1) и обладает следующими свойствами:
• если x = 0 и точки P (x) и P (1) находятся по одну сторону
от точки P (0), то x > 0; в противном случае x < 0;
• |P (0)P (x)| = |x| |P (0)P (1)|.
Прямую, для которой установлено указанное соответствие, будем
называть числовой осью, а число x — координатой точки P (x).
Заметим, что при выборе произвольного веществен-
ного числа a соответствие x ↔ P (x + a) будет также
взаимно-однозначным. Это позволяет переносить точку P (0)
в любую заданную точку данной прямой.
Рассмотрим прямые l1 , l2 , l3 , проходящие через общую точ-
ку O и не лежащие в одной плоскости. Пусть каждая из этих
прямых является числовой осью с соответствиями
x ↔ P1 (x), y ↔ P2 (y), z ↔ P3 (z),
дающими общую точку P1 (0) = P2 (0) = P3 (0) = O. Пусть
(x, y , z) — система трех вещественных чисел, определяющих
86 Лекция 9

точки X = P1 (x), Y = P2 (y), Z = P3 (z) на прямых l1 , l2 , lz


соответственно. Рассмотрим три плоскости:
• π1 — плоскость, проходящая через точку X параллельно
прямым l2 и l3 ;
• π2 — плоскость, проходящая через точку Y параллельно
прямым l1 и l3 ;
• π3 — плоскость, проходящая через точку Z параллельно
прямым l1 и l2 .
Легко видеть, что плоскости π1 , π2 , π3 пересекаются в одной
точке M = M (x, y , z). Таким образом устанавливается взаимно-
однозначное соответствие
(x, y , z) ↔ M (x, y , z).
Точки X , Y , Z называются проекциями точки M на прямые l1 ,
l2 , l3 параллельно плоскостям π1 , π2 , π3 соответственно. Числа
x, y , z называются координатами точки M = M (x, y , z), а систе-
ма числовых осей l1 , l2 , l3 — аффинной системой координат.
Точка O называется началом (или центром) системы координат.
Эпитет «аффинная» по отношению к системе координат озна-
чает только то, что углы между осями могут не быть прямыми,
а длины отрезков [OP1 (1)], [OP2 (1)], [OP3 (1)] не обязательно
равные. Если углы между осями прямые, а длины указанных
отрезков равны 1, то система координат называется декартовой.

9.2. Направленные отрезки


Любую упорядоченную пару точек A, B будем называть на-
правленным отрезком с началом в точке A и концом в точке B .
−→
Обозначение: AB .
Если имеется система координат с началом в точке O, то
−→
направленный отрезок вида OA называется радиус-вектором
точки A. Координаты точки A называются также координатами
−→
радиус-вектора OA .
Точка A = B разбивает прямую AB на два луча: луч [AB),
состоящий из точек данной прямой, лежащих вместе с B по
одну сторону от A, и дополнительный луч, состоящий из точек,
лежащих по другую сторону (точка A для двух лучей является
общей). Два луча на одной прямой называются одинаково на-
правленными, если их пересечение является лучом (и противопо-
ложно направленными, если их пересечение является отрезком).
Если прямые AB и CD не совпадают, то лучи [AB) и [CD)
9.3. Отношение эквивалентности 87

называются одинаково направленными, если эти прямые парал-


лельны и точки B и D лежат по одну сторону от прямой AC .
−→
Предположим, что A = B . Рассмотрим отрезок AB , и пусть
C — произвольная точка. Проведем через C прямую, параллель-
ную прямой AB или совпадающую с ней в случае C ∈ AB .
На этой прямой можно найти ровно две точки D1 и D2 та-
кие, что |CD1 | = |CD2 | = |AB|. Выберем из них такую точку
D ∈ {D1 , D2 }, для которой лучи [AB) и [CD) одинаково направ-
−→ −→
лены. Направленный отрезок CD будем считать равным AB .
−→ −→
(Часто говорят также, что CD получается из AB параллельным
переносом.)
Данным построением не охвачен случай A = B . Направлен-
−→ −→
ные отрезки AA и CC будем считать равными по определению
и называть их нулевыми.
Отметим формальную «несимметричность» в данном опре-
−→ −→ −→ −→
делении: CD равен AB , но будет ли AB равен CD? Ответ,
к счастью, положительный — в силу того что направленный
−→ −→
отрезок AB получается из CD с помощью точно такого же
построения.
Заметим, что все случаи при определении равенства направ-
ленных отрезков можно свести к одному случаю, если принять
формально другое (и притом «симметричное») определение: на-
−→ −→
зовем направленные отрезки AB и CD равными, если середи-
ны отрезков [AD] и [BC] совпадают. Эквивалентность нового
определения предыдущему вытекает из общеизвестных свойств
параллелограмма.
Обратим внимание на то, что при фиксированной системе ко-
ординат любой направленный отрезок равен некоторому и только
одному радиус-вектору.
9.3. Отношение эквивалентности
Любое непустое подмножество M ⊂ X × X определяет на
множестве X бинарное отношение между его элементами:
M
x∼y ⇔ (x, y) ∈ M.
ПРИМЕР. X — множество всех матриц, M — множество
таких пар матриц (A, B), для которых существует произведе-
ние AB . Ясно, что имеются пары матриц, не входящие в M .
M M
Кроме того, если A ∼ B , то отсюда не следует, что B ∼ A.
88 Лекция 9

Бинарное отношение M на X называется отношением экви-


валентности, если выполняются следующие три свойства:
M
• x ∼ x для всех элементов x ∈ X (рефлексивность);
M M
• если x ∼ y , то y ∼ x (симметричность);
M M M
• если x ∼ y и y ∼ z , то x ∼ z (транзитивность).
M
Если на X задано отношение эквивалентности M и x ∼ y , то x
и y называются эквивалентными элементами. Множество всех
элементов из X , эквивалентных некоторому элементу a ∈ X ,
называется классом эквивалентности, порожденным элемен-
том a.
Теорема. Непустое множество X с отношением экви-
валентности является объединением непересекающихся
подмножеств, каждое из которых состоит из элементов,
эквивалентных между собой и не эквивалентных ни одному
из элементов других подмножеств.
Доказательство. Пусть X(a) обозначает класс эквивалент-
ности, порожденный элементом a ∈ X . Выберем произвольный
элемент a и рассмотрим его класс эквивалентности X(a). Ес-
ли b, c ∈ X(a), то каждый из них эквивалентен a, а зна-
чит, в силу транзитивности, b и c эквивалентны между собой
(b ∼ a, a ∼ c ⇒ b ∼ c). Ясно также, что X(b) = X(c) = X(a)
(т. е. класс эквивалентности порождается любым своим предста-
вителем).
По определению X(a) содержит абсолютно все элементы, эк-
вивалентные a. Поэтому если b ∈ / X(a), то b не является эквива-
лентным a. Отсюда следует, что классы эквивалентности  X(a) и
X(b) не пересекаются: если бы имелся элемент c ∈ X(a) X(b),
то это бы означало, что b ∈ X(a) ⇒ X(a) = X(b).
Таким образом, для произвольных элементов a и b классы
эквивалентности X(a) и X(b)либо не пересекаются, либо сов-
падают. Очевидно, что X = X(a). Для завершения доказа-
a∈X
тельства остается исключить из этого объединения совпадающие
классы эквивалентности. 
ПРИМЕР 1. Пусть G — произвольная (не обязательно
абелева) группа. Элементы a, b ∈ G называются сопряженными,
если для некоторого h ∈ G (зависящего от a и b) выполняется
равенство a = hbh−1 . Сопряженность элементов — это бинарное
отношение на G, которое, как легко проверить, является отно-
шением эквивалентности.
ПРИМЕР 2. Пусть Z — множество целых чисел, а p — неко-
торое натуральное (целое положительное) число. Целые числа
9.5. Линейные операции над векторами 89

x и y называются сравнимыми по модулю p, если они имеют


одинаковые остатки при делении на p (это означает, что разность
x − y делится нацело на p, т. е. x − y = kp для некоторого
целого k ). Обозначение: x = y (mod p).
Пусть x ∼ y ⇔ x − y (mod p). Это бинарное отношение на Z
является отношением эквивалентности. В данном случае имеется
ровно p различных классов эквивалентности
Z(0), Z(1), . . . , Z(p − 1),
называемых обычно вычетами по модулю p.

9.4. Свободный вектор


Утверждение. Отношение равенства направленных отрезков
является отношением эквивалентности.
Доказательство непосредственно вытекает из определения
равенства направленных отрезков.
Определение. Любой класс эквивалентности направленных от-
резков называется свободным вектором или, короче, вектором.
Согласно определению свободный вектор a содержит все эк-
вивалентные между собой направленные отрезки. При этом для
любой точки A существует единственная точка B такая, что
−→
AB ∈ a. В частности, при фиксированной системе координат
всегда имеется один и только один радиус-вектор, принадлежа-
щий a.
Пусть V — множество всех точек геометрического простран-
ства. Тогда вектор a задает следующее взаимно-однозначное
отображение V → V : точка A ∈ V переходит в точку B ∈ V та-
−→
кую, что AB ∈ a. Такое отображение называется параллельным
переносом или сдвигом на вектор a.
Традиционно допускаемый элемент вольности в обозначени-
−→ −→
ях: вместо AB ∈ a принято писать a = AB (вектор как класс
эквивалентности отождествляется с любым его представителем).

9.5. Линейные операции над векторами


−→ −→
Сумма векторов: пусть AB ∈ a и BC ∈ b, тогда c = a + b опре-
−→
деляется как вектор, порожденный направленным отрезком AC .
Важно, что получаемый таким образом вектор c не зависит
−→ −→
от выбора точки A. В самом деле, пусть P Q ∈ a и QR ∈ b.
90 Лекция 9

Тогда из равенства треугольников ABC и P QR вытекает


−→
равенство длин и сонаправленность направленных отрезков AC
−→
и P R , а значит и их равенство.
Множество свободных векторов относительно операции сло-
жения векторов образует абелеву группу. Роль единичного эле-
−→ −→
мента играет нулевой вектор 0 = AA . Для a = AB обратным эле-
−→
ментом является b = BA. В данном контексте вектор b назывет-
ся противоположным вектором для a и обозначается b = −a.
−→
Умножение вектора на число: пусть AB ∈ a, тогда α a опре-
−→
деляется как вектор, порождаемый направленным отрезком AC ,
который имеет длину |AC| = |α| |AB| и, если α = 0, является
−→
одинаково направленным с AB при α > 0 и противоположно
направленным при α < 0. Несложно убедиться в том, что вектор
α a не зависит от выбора точки A.
Можно проверить, что α (β a) = (αβ) a для любых веществен-
ных чисел α, β . Полезно также заметить, что 1 · a = a, а вектор
(−1) · a является противоположным для a.
Кроме того, операции сложения векторов и умножения век-
тора на число связаны следующими законами дистрибутивности:
(α + β) a = (α a) + (β a), α (a + b) = (α a) + (α b).

9.6. Координаты вектора


Пусть фиксирована некоторая аффинная система координат.
Как уже отмечалось, каждому свободному вектору соответствует
один и только один радиус-вектор. Его координаты и будем
называть координатами данного свободного вектора.
Пусть точка O — начало системы координат с числовыми ося-
ми l1 , l2 , l3 и точками X ∈ l1 , Y ∈ l2 , Z ∈ l3 , соответствующими
числу 1 на данных осях. Система векторов
−→ −→ −→
e1 = OX , e2 = OY , e3 = OZ
называется для даннной системы координат базисной (иногда
также реперной).
Непосредственно из определения координат точки и линей-
ных операций над векторами вытекает следующее
−→
Утверждение 1. Пусть x, y , z — координаты вектора a = OA
в системе координат с базисными векторами e1 , e2 , e3 .
9.7. Изоморфизм и линейная зависимость 91

В этом и только в этом случае имеет место разложение


a = x e 1 + y e2 + z e 3 .

Векторы x e1 , y e2 , z e3 называются проекциями вектора a на


прямые l1 , l2 , l3 (они, как легко видеть, не зависят от способа
превращения прямых в числовые оси).
Утверждение 2. Пусть xa , ya , za и xb , yb , zb — координаты
−→ −→
векторов a = OA и b = OB соответственно. Тогда вектор
c = a + b имеет координаты
xc = xa + xb , yc = ya + yb , zc = za + zb ,
а вектор d = α a для любого вещественного числа α имеет
координаты
xd = α xa , yd = α ya , z d = α za .

Для доказательства достаточно установить, что проекция


суммы векторов для каждой оси есть сумма проекций данных
векторов, а проекция вектора, умноженного на число, есть умно-
женная на это число проекция данного вектора.
Задача 1. Пусть A1 , . . . , An — вершины правильного n-угольника,
−→
вписанного в окружность с центром в точке O . Докажите, что OA1 + . . .
−→
. . . + OAn = 0.
−→
Задача 2. В тетраэдре ABCD найдите точку M такую, что M A +
−→ −→ −→
+ M B + M C + M D = 0.

9.7. Изоморфизм и линейная зависимость


Пусть V — множество всех свободных векторов. Каждый
свободный вектор можно отождествить с соответствующим ему
−→
радиус-вектором, а каждый радиус-вектор вида OA — с точкой A
геометрического пространства.
Утверждение 2 позволяет установить такое взаимно-
однозначное соответствие между множеством свободных
векторов V и множеством матриц-столбцов R3 , при котором
сохраняются операции сложения векторов и умножения вектора
на число: если a ↔ a ∈ R3 и b ↔ b ∈ R3 , то
a + b ↔ a + b, α a ↔ α a.
92 Лекция 9

Взаимно-однозначное отображение, сохраняющее операции, при-


нято называть изоморфизмом, а множества, между которыми
такое соответствие установлено, изоморфными. Таким образом,
множество свободных векторов V изоморфно R3 .
Понятия линейной зависимости и линейной независимости
систем свободных векторов вводятся точно так же, как и
для матриц-столбцов. То же относится к понятию линейных
оболочек. Учитывая изоморфизм, в случае свободных векто-
ров мы можем использовать результаты уже выполненного для
матриц-столбцов исследования линейной зависимости и связан-
ных с ней понятий базиса и размерности линейной оболочки.
Легко видеть, что введенные выше базисные векторы e1 , e2 , e3
являются линейно независимыми, а все множество свободных
векторов есть их линейная оболочка:
V = L(e1 , e2 , e3 ), dim V = 3.

9.8. Коллинеарные и компланарные векторы


Определение 1. Векторы называются коллинеарными, если
cреди порождающих их направленных отрезков имеются отрез-
ки, принадлежащие одной прямой.
Определение 2. Векторы называются компланарными, если
среди порождающих их направленных отрезков имеются отрез-
ки, принадлежащие одной плоскости.
Линейная оболочка любой системы коллинеарных векторов,
содержащей хотя бы один ненулевой вектор, имеет размер-
ность 1. Верно и обратное: все векторы из линейной оболочки
размерности 1 являются коллинеарными.
Линейная оболочка любой системы компланарных векторов,
в которой имеется хотя бы одна пара неколлинеарных векторов,
имеет размерность 2. Все векторы из линейной оболочки размер-
ности 2 являются компланарными.
Будем отождествлять свободные векторы с порождающими
их радиус-векторами. Тогда множество всех векторов, коллине-
арных заданному вектору, представляет собой прямую, проходя-
щую через начало координат. Множество всех векторов, компла-
нарных заданной паре неколлинеарных векторов, представляет
собой проходящую через начало кооординат плоскость.
Прямая l, проходящая через точки A и B , представляет собой
множество точек (радиус-векторов) следующего вида:
−→ −→ −→
l = {M : OM = OA + tAB , t ∈ R}. (1)
9.9. Прямая на плоскости 93
−→
Вектор AB (параллельный прямой l) называется направляющим
вектором для l.
Плоскость π , проходящая через три не лежащие на одной
прямой точки A, B , C , есть множество точек (радиус-векторов)
вида
−→ −→ −→ −→
π = {M : OM = OA + uAB + v AC , u, v ∈ R}. (2)

9.9. Прямая на плоскости


В качестве геометрического пространства часто рассматри-
вается плоскость. В этом случае система координат состоит из
двух осей и устанавливает взаимно-однозначное соответствие
между системами двух вещественных чисел (x, y) и точками
(радиус-векторами) плоскости.
Пусть A и B — вещественные числа, не равные нулю одно-
временно. Уравнение вида
Ax + By + C = 0 (∗)
называется общим уравнением прямой на плоскости.
Теорема. Пусть на плоскости фиксирована аффинная система
координат. Множество точек с координатами x, y , удовлетворя-
ющими уравнению (∗), представляет собой прямую, и при этом
любая прямая может быть задана уравнением вида (∗).
Доказательство. Пусть l — прямая, проходящая через точки
(x0 , y0 ) и (x1 , y1 ). Тогда, согласно (1), прямая l состоит из точек
(x, y) таких, что 
x = x0 + tpx ,
y = y0 + tpy , (∗∗)

где t ∈ R и px = x1 − x0 , py = y1 − y0 . Отсюда (как определи-


тель с линейно зависимыми столбцами)


x − x0 px
det = 0.
y − y0 py
⇒ Ax + by + C = 0,
где
A = py , B = −px , C = −py x0 + px y0 .
Теперь рассмотрим множество точек (x, y), удовлетворяющих
уравнению (∗). Очевидно, что оно совпадает с множеством всех
94 Лекция 9

решений системы линейных алгебраических уравнений, состоя-


щей из одного уравнения


x
[A B] y = −C.

Поскольку хотя бы одно из чисел A, B отлично от нуля, ранг мат-


рицы коэффициентов равен 1. Поэтому общее решение данной
системы имеет вид (∗∗), где (x0 , y0 ) — любое фиксированное
частное решение, а вектор (px , py ) образует фундаментальную
систему решений соответствующей однородной системы (в дан-
ном случае состоящей из одного вектора). 1) 

9.10. Плоскость в пространстве


Пусть A, B , C — вещественные числа, не равные нулю
одновременно. Уравнение вида
Ax + By + Cz + D = 0 (#)
называется общим уравнением плоскости.
Теорема. Пусть в пространстве фиксирована аффинная система
координат. Множество точек с координатами x, y , z , удовлетво-
ряющими уравнению (#), представляет собой плоскость, и при
этом любая плоскость может быть задана уравнением вида (#).
Доказательство. Пусть π — плоскость, проходящая через точ-
ки (x0 , y0 , z0 ), (x1 , y1 , z1 ), (x2 , y2 , z2 ). Тогда, согласно (2), плос-
кость π состоит из точек (x, y , z) таких, что
x = x0 + upx + vqx ,
y = y0 + upy + vqy , (##)
z = z0 + upz + vqz ,
где u, v — произвольные вещественные числа,
(px , py , pz ) = (x1 − x0 , y1 − y0 , z1 − z0 ),
(qx , qy , qz ) = (x2 − x0 , y2 − y0 , z2 − z0 ).
Отсюда  
x − x0 px qx
det y − y0 py qy = 0.
z − z0 pz qz
Это уравнение имеет вид (#), как уравнение относительно x, y ,z .
1)
Конечно, в данном частном случае этот факт легко доказывается и без
ссылок на общую теорию.
9.11. Преобразование координат 95

Теперь рассмотрим множество точек (x, y , z), удовлетворяю-


щих уравнению (#). Оно совпадает с множеством всех решений
системы линейных алгебраических уравнений, состоящей из од-
ного уравнения:  
x
[A B C] y = 0.
z
Отличие от нуля хотя бы одного из чисел A, B , C означает, что
матрица коэффициентов имеет ранг 1. Значит, общее решение
имеет вид (##), где (x0 , y0 , z0 ) — некоторое частное решение,
а векторы (px , py , pz ) и (qx , qy , qz ) образуют фундаментальную
систему решений соответствующей однородной системы. 

9.11. Преобразование координат


Пусть имеются две аффинные системы координат: первая
с центром в точке O и базисными векторами e1 , e2 , e3 , вторая —
с центром в точке O и базисными векторами e1 , e2 , e3 . Запишем
e1 = p11 e1 + p21 e2 + p31 e3 ,
e2 = p12 e1 + p22 e2 + p32 e3 ,
e3 = p13 e1 + p23 e2 + p33 e3
и образуем так называемую матрицу перехода (от первой ба-
зисной системы ко второй)
 
p11 p12 p13
P = p21 p22 p23 .
p31 p32 p33
Если имеется какая-то третья система базисных векторов и век-
торы ei , ei рассматриваются как столбцы из координат разложе-
ний по данной третьей системе, то справедливо равенство
[e1 , e2 , e3 ] = [e1 , e2 , e3 ]P.
Отсюда следует невырожденность матрицы P .
Пусть точка M имеет координаты (x, y , z) в первой системе и
−→ −→ −→
(x , y  , z  ) — во второй системе. Очевидно, что OM = OO + O M .
Пусть координаты точки O в первой системе равны (x0 , y0 , z0 ).
Тогда
xe1 + ye2 + ze3 = (x0 e1 + y0 e2 + z0 e3 ) + x (p11 e1 + p21 e2 +
+ p31 e3 ) + y  (p12 e1 + p22 e2 + p32 e3 ) + z  (p13 e1 + p23 e2 + p33 e3 ) =
96 Лекция 9

= (x0 + p11 x + p12 y  + p13 z  )e1 + (y0 + p21 x + p22 y  + p23 z  )e2 +
+ (z0 + p31 x + p32 y  + p33 z  )e3 .
Следовательно, координаты одной и той же точки в первой и вто-
рой системах координат связаны следующим соотношением:
     
x x0 x
y = y0 + P y  .
z z0 z
Отсюда легко понять, например, как связаны общие урав-
нения одной и той же плоскости в разных аффинных системах
координат. Если в первой системе координат имеем уравнение
Ax + By + Cz + D = 0, то, записывая его в матричном виде,
находим
      
x x0 x
[A B C] y = −D ⇔ [A B C] y0 + P y  = −D.
z z0 z
Таким образом, уравнение той же плоскости во второй системе
приобретает вид
 
x
[A B  C  y
] = −D ,
z
[A B  C  ] = [A B C] P , D = D − (Ax0 + By0 + Cz0 ).

9.12. Полуплоскости и полупространства


Пусть на плоскости дана прямая l : Ax + By + C = 0. Тогда
любая точка P = (x, y) на плоскости принадлежит одному из
трех множеств
l = {(x, y) : Ax + By + C = 0},
π + = {(x, y) : Ax + By + C > 0},
π − = {(x, y) : Ax + By + C < 0}.
Говорят, что прямая l делит плоскость на две полуплоскости:
π+ и π−.
Возьмем две точки: P = (x1 , y1 ) и Q = (x2 , y2 ), тогда любая
точка отрезка P Q имеет координаты
x = x1 + t(x2 − x1 ) = (1 − t)x2 + tx1 ,
y = y1 + t(y2 − y1 ) = (1 − t)y2 + ty1 , 0  t  1.
9.12. Полуплоскости и полупространства 97

Отсюда ясно, что если обе точки P и Q принадлежат одному


из множеств π + или π − , то все точки отрезка P Q принадлежат
тому же множеству.
Множество точек, содержащее вместе с любыми двумя точ-
ками все точки соединяющего их отрезка, называется выпук-
лым. Таким образом, каждое из множеств l, π + , π − является
выпуклым.
Теперь предположим, что P ∈ π + , но Q ∈ π − . Тогда уравнение
A(x1 + (t(x2 − x1 )) + B(y1 + t(y2 − y1 )) + C = 0
выполняется при
Ax1 + By1 + C
t= ,
(Ax1 + By1 + C) − (Ax2 + By2 + C)
откуда видно, что 0 < t < 1. Следовательно, некоторая точка
отрезка P Q принадлежит прямой l.
Итак, две точки принадлежат одной полуплоскости отно-
сительно заданной прямой l в том и только том случае, когда
соединяющий их отрезок не имеет общих точек с прямой l.
Аналогично, плоскость π : Ax + By + Cz + D = 0 делит про-
странство на два полупространства
π + = {(x, y , z) : Ax + By + Cz + D > 0},
π − = {(x, y , z) : Ax + By + Cz + D < 0}.
При этом две точки принадлежат одному полупространству
относительно заданной плоскости π в том и только том слу-
чае, когда соединяющий их отрезок не пересекается с плос-
костью π .
Задача 1. Пусть на плоскости имеется треугольник ABC и O —
произвольная точка этой же плоскости. Докажите, что для любой точ-
ки M , принадлежащей данному треугольнику, справедливо равенство
−→ −→ −→ −→
OM = α OA + β OB + γ OC ,

в котором α + β + γ = 1 и α, β , γ  0. Докажите также, что числа


α, β , γ с указанными ограничениями определены однозначно. 1)

1)
Они называются барицентрическими координатами точки M . Если
в пространстве задан тетраэдр ABCD и принадлежащая ему точка M , то,
аналогично, для любой точки O найдутся неотрицательные α, β , γ , δ такие, что
−→ −→ −→ −→ −→
OM = α OA + β OB + γ OC + δ OD, α + β + γ + δ = 1.

4 Е. Е. Тыртышников
Л е к ц и я 10

10.1. Скалярное произведение геометрических


векторов
Длиной вектора a называется длина порождающего его на-
правленного отрезка (направленные отрезки, порождающие один
и тот же вектор, равны и поэтому имеют одинаковую длину).
Обозначение для длины: |a|. Углом ϕ(a, b) между ненулевыми
−→ −→
векторами a = OA, b = OB называется угол между сторонами
OA и OB в треугольнике OAB .
Скалярным произведением векторов a и b называется вели-
чина

|a| |b| cos ϕ(a, b), a = 0 и b = 0,
(a, b) =
0, a = 0 или b = 0.
В силу определения очевидно, что
(a, a) > 0 при a = 0; (a, a) = 0 ⇔ a = 0. (1)
Также очевидно, что
(a, b) = (b, a) ∀ a, b. (2 )
−→ −→
Если векторы a = OA, b = OB неколлинеарны, то в плоскости,
проходящей через точки O, A, B можно ввести декартову систе-
му координат с началом в точке O и первой осью, совпадающей с
прямой OB и дающей точке B положительную координату. Тогда
величина |a| cos ϕ(a, b) будет в точности координатой точки A
на данной оси. Отсюда сразу же вытекают важные свойства
линейности скалярного произведения по первому аргументу:
(a + b, c) = (a, c) + (b, c) ∀ a, b, (3 )
(α a, b) = α (a, b) ∀ a, b, ∀ α ∈ R. (4)
Свойство (2) сразу же дает аналогичные свойства линейности
скалярного произведения и по второму аргументу.
10.3. Об обобщениях 99

Векторы называются ортогональными, если их скалярное


произведение равно нулю.

10.2. Скалярное произведение и координаты


Пусть задана декартова система координат с базисными век-
торами e1 , e2 , e3 . Тогда

0, i = j ,
(ei , ej ) = (∗)
1, i = j.
Теорема. Пусть в заданной декартовой системе координат
вектор a имеет координатами a1 , a2 , a3 , а вектор b — коор-
динаты b1 , b2 , b3 . Тогда имеет место формула
(a, b) = a1 b1 + a2 b2 + a3 b3 . (#)

Доказательство. Запишем
a = a1 e1 + a2 e2 + a3 e3 , b = b1 e1 + b2 e2 + b3 e3 .
Опираясь на свойства скалярного произведения (2)–(4) и соот-
ношения (∗), находим
(a, b) = (a1 e1 + a2 e2 + a3 e3 , b1 e1 + b2 e2 + b3 e3 ) =

3 
3
= ai bj (ei , ej ) = a1 b1 + a2 b2 + a3 b3 . 
i=1 j=1

Замечание 1. Если в некоторой системе координат скалярное


произведение любых векторов a и b вычисляется по формуле
(#), то данная система координат декартова.
Замечание 2. В случае декартовой системы координат для
векторов на плоскости формула (#) приобретает вид
(a, b) = a1 b1 + a2 b2 .

10.3. Об обобщениях
Формула (#) и свойства (1)–(4) дают основу для введения
скалярного произведения в более общих случаях — для объек-
тов, уже не являющихся векторами в геометрическом простран-
стве.
4*
100 Лекция 10

Например, если a = [a1 , . . . , an ] , b = [b1 , . . . , bn ] — матрицы-


столбцы из Rn , то можно определить их скалярное произведение
по аналогии с формулой (#):
(a, b) = a1 b1 + . . . + an bn . (∗)
Есть и другая идея, имеющая более общий характер — взять
за основу свойства (1)–(4) и называть скалярным произведением
любую функцию от матриц-столбцов a, b, удовлетворяющую ак-
сиомам (1)–(4).
Для геометрических векторов скалярное произведение опре-
делялось на основе таких понятий, как длина вектора и угол
между векторами. В более общих случаях проще ввести каким-
то образом скалярное произведение и уже с его помощью вводить
понятия длины и угла:
! (a, b)
|a| = (a, a) , cos ϕ(a, b) = .
|a| |b|
Например, опираясь на (∗), можно ввести таким образом
длину и угол для векторов a, b ∈ Rn . При этом важно, что
! !
|(a, b)|  (a, a) (b, b) .
Это неравенство (известное как неравенство Коши–
Буняковского–Шварца) легко выводится из (∗), но в действи-
тельности оно справедливо для всех мыслимых способов задания
скалярного произведения — подробный разговор на эту тему
будет позже.

10.4. Ориентация системы векторов


Понятие ориентации для тройки (системы из трех) некомпла-
нарных векторов вводится в буквальном смысле слова «на паль-
цах»: тройка векторов называется правой, если их можно рас-
положить как большой, несогнутый 1) указательный и средний
пальцы правой руки; тройка векторов называется левой, если
их можно расположить как большой, несогнутый указательный
и средний пальцы левой руки.
Очевидно, может возникнуть желание освободиться от ана-
томической компоненты этого определения. Например, таким
образом: тройка векторов называется правой, если кратчай-
ший поворот от первого вектора ко второму происходит против
часовой стрелки при наблюдении из конца третьего вектора.
1)
Если указательный палец согнуть, то получится совсем не то.
10.5. Векторное и смешанное произведения 101

Конечно, остается чувство неудовлетворения по поводу обоих


определений. Но оно имеет неустранимый характер — в силу
фундаментальных причин. Дело в том, что любые тройки неком-
планарных векторов могут иметь ровно два типа ориентации,
а фиксация одного из них, вообще говоря, произвольна. 1)
Можно выбрать произвольную декартову систему координат
и объявить, что тройка ее базисных векторов имеет, скажем,
«правильную ориентацию». Пусть вектор a имеет координаты
a1 , a2 , a3 , вектор b — координаты b1 , b2 , b3 , вектор c — коорди-
наты c1 , c2 , c3 . Тройку векторов a, b, c можно назвать тройкой
«правильной ориентации», если
 
a1 b1 c1
det a2 b2 c2 > 0.
a3 b3 c3
Если определитель меньше нуля, то это будет тройка «непра-
вильной ориентации». Таким образом, определение ориентации
зависит от объявления типа ориентации для исходной системы
координат.
Аналогичным образом можно ввести понятие ориентации для
пар векторов на плоскости и даже для систем n матриц-столбцов
из Rn .

10.5. Векторное и смешанное произведения


Векторным произведением неколлинеарных векторов a и b
называется вектор c такой, что:
• вектор c ортогонален a и b;
• тройка векторов a, b, c является правой;
• |c| = |a| |b| sin ϕ(a, b).
Если a и b коллинеарны, то c = 0. Обозначение: c = [a, b].
−→ −→
Если a = OA, b = OB , то длина вектора c, очевидно, равна
площади параллелограмма со сторонами OA и OB .
Число, равное скалярному произведению векторов [a, b] и c,
называется смешанным произведением векторов a, b, c. Обо-
значение:
(a, b, c) = ([a, b], c).

1)
Как утверждает М. М. Постников, в старые времена правыми называли
как раз сегодняшние левые тройки.
102 Лекция 10

Теорема. Пусть векторы a, b, c некомпланарны и V — объем


параллелепипеда, натянутого на приведенные к общему на-
чалу векторы a, b, c. Тогда

V , если тройка a, b, c правая;
(a, b, c) =
−V — в противном случае.
Если векторы a, b, c компланарны, то
(a, b, c) = 0.
−→ −→
Доказательство. Предположим, что a = OA , b = OB , c =
−→ −→
= OC , и пусть OD = [a, b]. Согласно определению смешанного
произведения,
−→ −→ −→ −→
(a, b, c) = |OD| γ , где γ = |OC| cos ϕ(OD, OC).
Ясно, что |γ| есть длина перпендикуляра, опущенного из точки C
на плоскость OAB (высота параллелепипеда). При этом γ > 0,
если точки D и C находятся по одну сторону от плоскости OAB ,
и γ < 0, если эти точки оказались по разные стороны от данной
−→ −→ −→
плоскости. В первом случае тройка векторов OA, OB , OC
правая, во втором — левая. 
Следствие 1.
(a, b, c) = (b, c, a) = (c, a, b) = −(b, a, c) = −(a, c, b) =−(c, b, a).
Доказательство. Достаточно заметить, что тройки векторов
{a, b, c}, {b, c, a}, {c, a, b}
имеют одинаковую ориентацию, противоположную ориентации
троек векторов
{b, a, c}, {a, c, b}, {c, b, a}. 
Следствие 2. Смешанное произведение (a, b, c) линейно по
каждому аргументу.
Доказательство. Из свойств скалярного произведения сразу же
вытекает линейность по третьему аргументу. Остается заметить,
что тройки {a, b, c}, {b, c, a}, {c, a, b} имеют одинаковую
ориентацию. Поэтому
(a, b, c) = (b, c, a) = (c, a, b).
10.6. Векторное произведение в декартовых координатах 103

Следовательно, имеет место линейность по первому и второму


аргументам. 

Утверждение 1. Векторное произведение антисимметрично:

[a, b] = −[b, a].


Доказательство вытекает непосредственно из определения
векторного произведения. Вот еще одно формальное доказа-
тельство с использованием смешанных произведений: пусть
d = [a, b] + [b, a], тогда (d, d) = (a, b, d) + (b, a, d) = 0 ⇒ d = 0.

Утверждение 2. Векторное произведение линейно по каждому


аргументу.
Доказательство. Докажем, что [a + b, c] = [a, c] + [b, c]. Для
этого рассмотрим вектор

d = [a + b, c] − [a, c] − [b, c].


Используя линейность смешанного произведения по каждому
аргументу, находим

(d, d) = (a + b, c, d) − (a, c, d) − (b, c, d) = 0 ⇒ d = 0.


Аналогично, если d = [α a, b] − α [a, b], то (d, d) = (α a, b, d) −
− α (a, b, d) = 0 ⇒ d = 0. Линейность по второму аргументу
вытекает из свойства антисимметричности векторного произве-
дения. 
Сформулируем также два простых, но полезных предложе-
ния.
Критерий коллинеарности. Векторы a, b коллинеарны
тогда и только тогда, когда [a, b] = 0.
Критерий компланарности. Векторы a, b, c компланарны
тогда и только тогда, когда (a, b, c) = 0.

10.6. Векторное произведение в декартовых


координатах
Пусть e1 , e2 , e3 — базисные векторы декартовой системы
координат. Легко проверить, что

[e1 , e2 ] = e3 , [e2 , e3 ] = e1 , [e3 , e1 ] = e2 .


104 Лекция 10

Для векторов a = a1 e1 + a2 e2 + a3 e3 , b = b1 e1 + b2 e2 + b3 e3
получаем
[a, b] = a1 b1 [e1 , e1 ] + a1 b2 [e1 , e2 ] + a1 b3 [e1 , e3 ] +
+ a2 b1 [e2 , e1 ] + a2 b2 [e2 , e2 ] + a2 b3 [e2 , e3 ] +
+ a3 b1 [e3 , e1 ] + a3 b2 [e3 , e2 ] + a3 b3 [e3 , e3 ] =
= (a2 b3 − a3 b2 ) e1 − (a1 b3 − a3 b1 ) e2 + (a1 b2 − a2 b1 ) e3 .
Полученный результат легче всего запомнить, увидев в нем
формальное применение теоремы Лапласа для разложения опре-
делителя по первой строке:
 
e 1 e2 e3
[a, b] = det a1 a2 a3 .
b1 b2 b3

Задача 1. Доказать, что для произвольных векторов a, b, c выпол-


няется равенство

[a, [b, c]] = (a, c) b − (a, b) c.

Задача 2. Доказать, что уравнение [a, x] + [b, x] = [a, b] имеет


решение для любых векторов a и b. Найти все решения x для заданных
a и b.

10.7. Смешанное произведение в декартовых


координатах
Пусть a = a1 e1 + a2 e2 + a3 e3 , b = b1 e1 + b2 e2 + b3 e3 , c =
= c1 e1 + c2 e2 + c3 e3 . Используя только что полученные выраже-
ния для координат векторного произведения и правило вычисле-
ния скалярного произведения в декартовой системе, находим
(a, b, c) = ([a, b], c) = ((a2 b3 − a3 b2 ) e1 − (a1 b3 − a3 b1 ) e2 +
+ (a1 b2 − a2 b1 ) e3 , (c1 e1 + c2 e2 + c3 e3 )) = c1 (a2 b3 − a3 b2 ) −
 
a1 b1 c1
− c2 (a1 b3 − a3 b1 ) + c3 (a1 b2 − a2 b1 ) = det a2 b2 c2 .
a3 b3 c3
Последнее равенство получается из теоремы Лапласа при разло-
жении определителя по последнему столбцу.
10.9. Расстояние от точки до прямой на плоскости 105

Следствие. Определитель по абсолютной величине — это


объем параллелепипеда, натянутого на векторы, определяе-
мые его столбцами.
Замечание. Вывод о том, что смешанное произведение (a, b, c)
есть определитель, можно сделать сразу же: мы уже доказали,
что смешанное произведение линейно по каждому аргументу и
равно нулю в случае линейно зависимых векторов; выполнив
одно единственное вычисление (e1 , e2 , e3 ) = 1 для базисных
векторов декартовой системы, заключаем, что смешанное про-
изведение является индикатором линейной зависимости своих
аргументов и, следовательно, определителем.

10.8. Нормали к прямой и плоскости


Ненулевой вектор, ортогональный прямой, называется ее нор-
малью. Если прямая на плоскости с декартовой системой коор-
динат задана общим уравнением
Ax + By + C = 0,
то вектор n = (A, B) ортогонален любому вектору на данной
прямой. В самом деле, любой вектор на прямой имеет вид l =
= (x2 − x1 , y2 − y1 ), где (x1 , y1 ) и (x2 , y2 ) — две точки на данной
прямой. Подставляя координаты точек в общее уравнений прямой
на плоскости, находим
A(x2 − x1 ) + B(y2 − y1 ) = 0 ⇔ (n, l) = 0.
Аналогично, ненулевой вектор, ортогональный плоскости, на-
зывается нормалью для данной плоскости. Если плоскость в
пространстве с декартовой системой координат задана общим
уравнением
Ax + By + Cz + D = 0,
то вектор n = (A, B , C) — ее нормаль.
Используя векторное произведение, нормаль можно постро-
ить, имея пару неколлинеарных векторов a и b, принадлежащих
плоскости: вектор [a, b] ортогонален плоскости векторов a и b.
(Конечно, нормаль к плоскости определена однозначно с точно-
стью до ненулевого коэффициента.)

10.9. Расстояние от точки до прямой на плоскости


Рассмотрим прямую l : Ax + By + C = 0 на плоскости с
декартовой системой координат и точку M0 = (x0 , y0 ) ∈
/ l. Для
того чтобы найти расстояние ρ(M0 , l) от точки M0 до прямой l,
нужно выполнить такие действия:
106 Лекция 10

• провести через точку M0 прямую l0 , ортогональную пря-


мой l;
• найти точку M1 = (x1 , y1 ) пересечения прямых l0 и l;
• вычислить длину отрезка M0 M1 .
Мы уже знаем, что вектор n = (A, B) ортогонален прямой l.
Поэтому прямая l0 есть множество точек вида
l0 = {(x, y) : x = x0 + At, y = y0 + Bt, t ∈ R}.
Найдем значение параметра t, при котором (x, y) ∈ l:
Ax0 + By0 + C
A(x0 + At) + B(y0 + Bt) + C = 0 ⇒ t = − .
A2 + B 2
−→
Далее, M0 M1 = (At, Bt) ⇒
−→ |Ax0 + By0 + C|
ρ(M0 , l) = |M0 M1 | = ! .
A2 + B 2

10.10. Расстояние от точки до плоскости


Рассмотрим плоскость π : Ax + By + Cz + D = 0 в геометри-
ческом пространстве с декартовой системой координат и точку
M0 = (x0 , y0 , z) ∈
/ π . Расстояние ρ(M0 , l) от точки M0 до плоско-
сти π вычисляется в полной аналогии со случаем точки и прямой
на плоскости:
|Ax0 + By0 + Cz0 + D|
ρ(M0 , π) = ! .
A2 + B 2 + C 2

10.11. Критерии параллельности вектора прямой


и плоскости
Пусть на плоскости заданы прямая l : Ax + By + C = 0 и
вектор v = (v1 , v2 ). Если система координат декартова, то вектор
n = (A, B) является нормалью к прямой l. Поэтому вектор v
параллелен прямой l тогда и только тогда, когда (v, n) = 0. Учи-
тывая вид скалярного произведения в декартовых координатах,
получаем
v  l ⇔ Av1 + Bv2 = 0. (1)
Для плоскости π : Ax + By + Cz + D = 0 и вектора v =
= (v1 , v2 , v3 ) в пространстве с декартовой системой координат
получаем аналогичный критерий параллельности:
vπ ⇔ Av1 + Bv2 + Cv3 = 0. (2)
10.11. Критерии параллельности вектора прямойи плоскости 107

Заметим, что критерии параллельности (1) и (2) остаются


в силе и в случае произвольной аффинной системы координат.
В самом деле, пусть вектор v параллелен плоскости π : Ax +
+ By + Cz + D = 0. Возьмем произвольную точку A(x0 , y0 , z0 )
этой плоскости и определим точку B(x1 , y1 , z1 ) таким образом,
−→ −→
что AB = v . Тогда параллельность вектора v плоскости π
равносильна тому, что B ∈ π ⇔ Ax1 + By1 + Cz1 + D = 0.
Учитывая равенство Ax0 + By0 + Cz0 + D = 0, находим: A(x1 −
− x0 ) + B(y1 − y0 ) + C(z1 − z0 ) = 0 ⇔ Av1 + Bv2 + Cv3 = 0.
То же самое можно получить путем перехода от заданной
аффинной к какой-нибудь декартовой системе. Мы знаем, что в
любой декартовой системе координат с тем же началом плоскость
π задана уравнением
 
x
[A B  C  ] y  = −D, [A B  C  ] = [A B C] P ,
z 

где P — матрица перехода от заданной аффинной системы к де-


картовой (см. п. 9.11). Координаты (v1 , v2 , v3 ) вектора v в декар-
товой системе и его координаты (v1 , v2 , v3 ) в исходной аффинной
системе связаны равенством
  ⎡ ⎤ ⎡ ⎤  
v1 v1 v1 v1
v2 = P ⎣v2 ⎦ ⇔ ⎣v2 ⎦ = P −1 v2 .
v3 v3 v3 v3
Условие параллельности в декартовой системе, как мы уже вы-
яснили, имеет вид
  
v1
A v1 + B  v2 + C3 v3 = 0 ⇔ [A B C] P P −1 v2 ⇔
v3
⇔ Av1 + Bv2 + Cv3 = 0.
Л е к ц и я 11

11.1. Линейные пространства


При изучении линейной зависимости векторов, линейных
оболочек, базисов, размерностей в предыдущих лекциях мы по-
лагали, что векторы — это матрицы-столбцы с вещественными
элементами. Впрочем, при изучении ранга матрицы речь уже
заходила также о линейной зависимости и независимости строк
матрицы. Конечно, с формальной точки зрения строки можно
транспонировать и снова иметь дело с матрицами-столбцами.
Однако все перечисленные выше понятия и многие полученные
факты без всяких изменений можно применять и в случае, когда
под векторами понимаются матрицы каких-либо фиксированных
размеров. Уже одно это заставляет подумать о введении более
общего (и более абстрактного) понятия вектора.
Кроме того, изучая базисы и размерности, мы имели дело
исключительно с линейными оболочками векторов, а это не
всегда удобно: например, множество всех решений однородной
системы линейных алгебраических уравнений Ax = 0 является,
конечно, линейной оболочкой векторов фундаментальной систе-
мы решений, но было бы полезно иметь право изучать свойства
этого множества без упоминания об образующей его системе
векторов.
Давайте скажем, что векторы — это элементы некоторого
непустого множества V , на котором определены две операции:
сложение векторов (если a, b ∈ V , то a + b ∈ V ) и умножение
векторов на вещественные числа (если a ∈ V и α ∈ R, то αa ∈
∈ V ) . Потребуем, чтобы данные операции обладали следующими
свойствами:
• (a + b) + c = a + (b + c) ∀ a, b, c ∈ V (ассоциативность
сложения векторов);
• существует особый вектор 0, называемый нулевым векто-
ром, такой что
a + 0 = 0 + a = a ∀a ∈ V ;
11.1. Линейные пространства 109

• для любого вектора a ∈ V существует вектор b ∈ V такой,


что
a + b = b + a = 0;

• a + b = b + a ∀ a, b ∈ V (коммутативность сложения
векторов);
• α(β a) = (αβ) a ∀ α, β ∈ R, ∀ a ∈ V ;
• (α + β) a = αa + βa ∀ α, β ∈ R, ∀a ∈ V (дистрибутив-
ность);
• α(a + b) = αa + αb ∀ α ∈ R, ∀ a, b ∈ V (дистрибутив-
ность);
• 1 · a = a ∀ a ∈ V . 1)
Множество V , обладающее всеми этими свойствами, называ-
ется вещественным линейным пространством. Часто встречаю-
щийся термин-синоним — векторное пространство.
Заметим, что множество V относительно операции сложения
векторов является абелевой группой. Роль единичного элемента
играет нулевой вектор. Вектор b такой, что a + b = b + a = 0,
называется противоположным вектору a и обозначается b = −a.
Некоторые привычные свойства введенных нами операций,
ранее свободно применявшихся к матрицам-столбцам, в рассмот-
ренном более абстрактном случае нуждаются в доказатель-
ствах.
Утверждение 1. 0 · a = 0 ∀ a ∈ V .
Доказательство. В силу дистрибутивности

0 · a = (0 + 0) · a = (0 · a) + (0 · a).

Далее, пусть b = −(0 · a) (вектор, противоположный вектору


0 · a). Тогда 0 = b + (0 · a) = (b + (0 · a)) + (0 · a) ⇒ 0 = 0 · a. 
Утверждение 2. α · 0 = 0 ∀ α ∈ R.
Доказательство. α · 0 = α(0 + 0) = α · 0 + α · 0 ⇒ α · 0 = 0. 
Утверждение 3. (−1) · a = −a ∀ a ∈ V .
Доказательство. В силу утверждения 1 и дистрибутивности,
0 = 0 · a = (1 + (−1)) · a = (1 · a) + ((−1) · a) = a + ((−1) · a). 
Утверждение 4. Если α · a = 0, то либо α = 0, либо a = 0.

1)
Данное свойство равносильно тому, что каждый вектор a можно пред-
ставить в виде a = αb для некоторого вектора b и некоторого числа α.
В самом деле, если это свойство выполнено, то можно взять b = a и α = 1.
С другой стороны, пусть выполнение этого свойства не предполагается, но
известно, что a = αb. Тогда, используя аксиому α(β a) = (αβ) a, получаем
1 · (αb) = (1 · α) · b = αb ⇒ 1 · a = a.
110 Лекция 11

Доказательство. 1) Пусть α = 0. Тогда


1 1 1
a=1·a= α ·a= (α · a) = · 0 = 0. 
α α α
Как и раньше, для любых чисел α1 , . . . , αn вектор w вида
w = α1 a1 + . . . + αn an
называется линейной комбинацией векторов a1 , . . . an , а множе-
ство всех линейных комбинаций со всеми возможными значения-
ми коэффициентов α1 , . . . , αn называется линейной оболочкой
векторов a1 , . . . , an и обозначается L(a1 , . . . , an ).
В дальнейшем число 0 и нулевой вектор 0 будут обозначаться
одним и тем же символом 0.

11.2. Примеры бесконечномерных линейных


пространств
1) Множество функций с вещественными значениями на
отрезке [0, 1].
Сумма f + g функций f и g определяется как функция
со значениями (f + g)(x) = f (x) + g(x). При умножении
функции на число получается функция αf , определяемая
правилом (αf )(x) = αf (x). Роль нулевого вектора выпол-
няет функция, тождественно равная нулю.
2) Множество бесконечных последовательностей {xk }∞ k=1 .
Сумма последовательностей {xk } и {yk } определяется как
последовательность {zk } с членами zk = xk + yk . Произве-
дение последовательности {xk } на число α определяется
как последовательность {zk } с членами zk = αxk . Роль
нулевого вектора выполняет последовательность, в которой
все элементы равны нулю.
3) Множество сходящихся последовательностей {xk }∞ k=1 .
Операции определяются так же, как и в случае произволь-
ных бесконечных последовательностей. Необходимо лишь
заметить, что сумма сходящихся последовательностей оста-
нется сходящейся последовательностью, а умножение схо-
дящейся последовательности на число также дает сходя-
щуюся последовательность.
1)
Утверждение нельзя получить без аксиомы 1 · a = a. В самом деле, возь-
мем любую абелеву группу V с нулевым элементом 0 и определим умножение
на число правилом αa = 0 для всех чисел α и векторов a ∈ V . При этом будут
выполнены все аксиомы линейного пространства, кроме данной.
11.3. Примеры конечномерных линейных пространств 111

Примеры (1)–(3) замечательны тем, что соответствующие ли-


нейные пространства не являются линейной оболочкой какого-то
конечного числа своих векторов. Такие линейные пространства
называются бесконечномерными.
Докажем, например, бесконечномерность пространства функ-
ций. Предположим, от противного, что оно совпадает с линейной
оболочкой каких-либо функций f1 , . . . , fn . Тогда любая функция
f имеет вид
f (x) = α1 f1 (x) + . . . + αn fn (x). (∗)
Выберем n попарно различных точек x1 , . . . , xn ∈ [0, 1] и для про-
извольно выбранной функции f рассмотрим систему уравнений
α1 (f ) f1 (x1 ) + . . . + αn (f ) fn (x1 ) = f (x1 ),
... ... ... ...
α1 (f ) f1 (xn ) + . . . + αn (f ) fn (xn ) = f (xn ).
Это есть система линейных алгебраических уравнений относи-
тельно α1 (f ), . . . , αn (f ). Если матрица коэффициентов данной
системы необратима, то решение заведомо существует не для
любой правой части. Тогда равенство (∗) не выполняется хотя
бы для одной функции f . Следовательно, матрица коэффициен-
тов должна быть обратимой. Поэтому для заданной функции f
коэффициенты α1 (f ), . . . , αn (f ) определены однозначно.
Пусть теперь точка x∗ ∈ [0, 1] не совпадает ни с одной
из точек x1 , . . . , xn . Заведомо существует функция g такая,
что g(xi ) = f (xi ) при i = 1, . . . , n, но g(x∗ ) = f (x∗ ). Ясно, что
αi (f ) = αi (g) при i = 1, . . . , n, откуда f = g , чего быть не может,
поскольку f (x∗ ) = g(x∗ ). 
Задача 1. Доказать, что для линейной независимости функций
f1 (x), . . . , fn (x) необходимо и достаточно, чтобы для некоторых чисел
x1 , . . . , xn матрица [fi (xj )]nij=1 была обратимой.

11.3. Примеры конечномерных линейных пространств


Линейные пространства, представляющие собой линейную
оболочку некоторого конечного числа своих векторов, называют-
ся конечномерными.
1) Множество многочленов порядка n.
Многочленом (полиномом) от x порядка n называется вы-
ражение вида
f (x) = an−1 xn−1 + an−2 xn−2 + . . . + a1 x + a0 .
112 Лекция 11

Если ak = 0 и ak+1 = . . . = an−1 = 0, то k называется сте-


пенью многочлена f (x). Выражения вида axi называются
одночленами или мономами.
Будем рассматривать f (x) как функцию от x. Тогда сумма
многочленов и умножение многочлена на число определя-
ются так же, как в случае функций общего вида. При этом
ясно, что результаты этих операций остаются многочлена-
ми. Очевидно, что линейное пространство всех многочле-
нов порядка n является линейной оболочкой одночленов
вида
xn−1 , xn−2 , . . . , x1 , x0 ≡ 1.
2) Множество (m × n)-матриц с фиксированными размера-
ми m и n.
В данном случае сложение векторов определяется как сло-
жение матриц, а умножение вектора на число — как умно-
жение матрицы на число.
Обозначим через E kl = [(E kl )ij ] матрицу размеров m × n
с элементами вида 
kl 1, i = k , j = l,
(E )ij =
0 — иначе.
Таких матриц ровно mn, и очевидно, что все пространство
(m × n)-матриц является их линейной оболочкой.
3) Множество всех решений однородной системы линейных
алгебраических уравнений Ax = b.
Если ранг (m × n)-матрицы A равен r, то фундаменталь-
ная система решений данной однородной системы содер-
жит n − r векторов, а все множество решений совпадает
с их линейной оболочкой. Данное линейное пространство
называется нуль-пространством или ядром матрицы A.
Обозначение: ker A (в некоторых книгах null A).
4) Множество всех столбцов вида y = Ax (для заданной
матрицы A).
Это хорошо знакомое нам множество, совпадающее с ли-
нейной оболочкой столбцов матрицы A. Оно называется
образом матрицы A. Обозначение: imA.

11.4. Базис и размерность


Пусть V — конечномерное пространство. По определению,
оно является линейной оболочкой конечного числа своих векто-
ров:
V = L(a1 , . . . , an ).
11.5. Подпространства линейного пространства 113

Понятия линейно зависимой и линейно независимой систем век-


торов в абстрактном случае ничем не отличаются от тех же поня-
тий в случае матриц-столбцов. То же справедливо в отношении
базиса и размерности:
• V можно представить как линейную оболочку некоторой
линейно независимой подсистемы векторов a1 , . . . , an ;
• базис в пространстве V определяется как любая линейно
независимая система векторов, для которой V является ли-
нейной оболочкой; любые два базиса в V содержат одина-
ковое число векторов; число векторов в базисе называется
размерностью пространства V и обозначается dim V ;
• любую линейно независимую систему векторов из V можно
достроить до базиса V ; более того, это можно сделать
с помощью части векторов a1 , . . . , an .
Доказательства этих предложений повторяют доказательства из
лекции 3 для частного случая линейных пространств — когда
под векторами подразумевались матрицы-столбцы.

11.5. Подпространства линейного пространства


Непустое множество W ⊂ V называется подпространством
линейного пространства V , если оно само является линейным
пространством относительно операций, действующих в V . Ясно,
что для того чтобы W было подпространством, необходимо и до-
статочно, чтобы для любых векторов a, b ∈ W и любого числа α
имели место включения a + b ∈ W и αa ∈ W .
Если векторы a1 , . . . , an принадлежат подпространству W , то
L(a1 , . . . , an ) ⊂ W.
ПРИМЕР. Рассмотрим множество V всех свободных векто-
ров на плоскости с системой координат с началом в точке O. По-
скольку каждый свободный вектор порождается одним и только
одним радиус-вектором, любое подмножество свободных векто-
−→
ров можно отождествлять с подмножеством радиус-векторов OA
или их концов — точек A.
Множество V , очевидно, является линейным пространством.
Любая прямая, проходящая через начало координат, является
подпространством в V . В то же время, если l — прямая, не
проходящая через начало координат, то она подпространством не
−→ −→ −→
является: пусть A, B ∈ l и OC = OA + OB ; ясно, что C ∈ / l.
114 Лекция 11

Задача 1. Докажите, что линейное пространство Rn нель-


зя представить в виде объединения конечного числа множеств,
каждое из которых не совпадает с Rn и является его подпро-
странством.

11.6. Сумма и пересечение подпространств


Пусть P и Q — подпространства линейного пространства V .
Под суммой P + Q понимается множество всех векторов вида
w = p + q , где p ∈ P , q ∈ Q. Под пересечением P ∩ Q понимается
обычное пересечение множеств.
Утверждение. Множества P + Q и P ∩ Q являются подпро-
странствами в V .
Доказательство.
1) Рассмотрим произвольную линейную комбинацию векто-
ров w1 , w2 ∈ P + Q. По определению множества P + Q имеем:
w1 = p1 + q1 и w2 = p1 + q2 , где p1 , p2 ∈ P и q1 , q2 ∈ Q. Тогда
α1 w1 + α2 w2 = (α1 p1 + α2 p2 ) + (α1 q1 + α2 q2 ) ∈ P + Q,
поскольку вектор в первой скобке принадлежит P , а вектор вто-
рой скобки принадлежит Q (P и Q — подпространства, поэтому
они содержат все линейные комбинации своих векторов).
2) Аналогично, рассмотрим линейную комбинацию векторов
w1 , w2 ∈ P ∩ Q:
αw1 + α2 w2 ∈ P и одновременнно α1 w1 + α2 w2 ∈ Q
⇒ αw1 + α2 w2 ∈ P ∩ Q. 
Заметим, что любые два подпространства имеют непустое
пересечение: каждое из них содержит по крайней мере нулевой
вектор.
Теорема Грассмана. Пусть W1 и W2 — конечномерные подпро-
странства линейного пространства V . Тогда
dim(W1 + W2 ) = dim W1 + dim W2 − dim(W1 ∩ W2 ).

Доказательство. Рассмотрим базис g1 , . . . , gr подпространства


W1 ∩ W2 и дополним его сначала до базиса W1 :
g1 , . . . , gr , p1 , . . . , pk , r + k = dim W1 ,
а затем до базиса W2 :
g1 , . . . , gr , q1 , . . . , qm , r + m = dim W2 .
11.6. Сумма и пересечение подпространств 115

Очевидно, что
W1 + W2 = L(g1 , . . . , gr , p1 , . . . , pk , q1 , . . . , qm ).
Поэтому остается доказать линейную независимость векторов,
порождающих данную линейную оболочку. Пусть
α1 g1 + . . . + αr gr + β1 p1 + . . . + βk pk + γ1 q1 + . . . + γm qm = 0.
Отсюда
α1 g1 + . . . + αr gr + β1 p1 + . . . + βk pk =
= −(γ1 q1 + . . . + γm qm ) ∈ W1 ∩ W2 .
Поскольку W1 ∩ W2 = L(g1 , . . . , gr ), для некоторых коэффи-
циентов δ1 , . . . , δr имеем
δ1 g1 + . . . + δr gr = −(γ1 q1 + . . . + γm qm ),
что равносильно равенству
δ1 g1 + . . . + δr gr + γ1 q1 + . . . + γm qm = 0 ⇒
⇒ δ1 = . . . = δr = γ1 = . . . = γm = 0 ⇒
⇒ α1 = . . . = αr = β1 = . . . = βm = 0. 

Задача 1. Найдите размерность суммы подпространства (n × n)-


матриц с нулевой суммой элементов в каждой строке и подпростран-
ства (n × n)-матриц с нулевой суммой элементов в каждом столбце.
Л е к ц и я 12

12.1. Разложение по базису


Пусть V — вещественное линейное пространство размерно-
сти n и f1 , . . . , fn — некоторый его базис. Тогда любой вектор
v ∈ V имеет однозначное разложение по данному базису:
v = x1 f1 + . . . + xn fn .
Коэффициенты x1 , . . . , xn называются координатами вектора v
в данном базисе. Понятно, что между элементами линейного
пространства V и множества столбцов Rn имеется взаимно-
однозначное соответствие:
 
x1
v ↔ x = ... .
xn
При выборе другого базиса g1 , . . . , gn возникает еще одно
взаимно-однозначное соответствие между теми же множествами:
 
y1
v = y1 g1 + . . . + yn gn ↔ y = . . . .
yn
Рассмотрим разложения
f1 = p11 g1 + . . . + pn1 gn ,
... ... ... (∗)
fn = p1n g1 + . . . + pnn gn
и введем (n × n)-матрицу P = [pij ]. Подставив (∗) в разложение
вектора v по базису f1 , . . . , fn , находим
y = P x. (∗∗)
Это соотношение позволяет переходить от координат вектора
в базисе {fi } к координатам того же вектора в базисе {gi }.
В силу (∗∗) матрицу P логично было бы называть матрицей
перехода от базиса {fi } к базису {gi }. Но она все же называется
12.2. Изоморфизм линейных пространств 117

обычно матрицей перехода от базиса {gi } к базису {fi }: если


fi и gi — столбцы из координат соответствующих векторов в
каком-то третьем базисе, то согласно (∗) [f1 , . . . , fn ] = [g1 , . . .
. . . , gn ]P (отсюда вытекает обратимость матрицы P и то, что
P −1 есть матрица перехода от {fi } к {gi }). Впрочем, дело не в
названии — важно, чтобы матрица P правильно использовалась
при пересчете координат!

12.2. Изоморфизм линейных пространств


Два вещественных линейных пространства V и W называют-
ся изоморфными, если существует взаимно-однозначное отобра-
жение Φ : V → W , сохраняющее операции в следующем смысле:
Φ(a + b) = Φ(a) + Φ(b), Φ(α a) = α Φ(a) ∀ a, b ∈ V , ∀ α ∈ R.
Само отображение Φ называется при этом изоморфизмом.
Заметим, что операции сложения векторов и умножения на
число в левой и правой частях данных равенств, вообще говоря,
разные! Операции слева действуют в V , а операции справа —
в W . Тем не менее, если установлено, что пространства изоморф-
ны, то это означает их неразличимость с точки зрения свойств
операций.
Утверждение. Φ(0) = 0, Φ(−a) = −Φ(a) ∀ a ∈ V .
Доказательство. Φ(0) = Φ(0 + 0) = Φ(0) + Φ(0). Прибавим
к обеим частям вектор b = −Φ(a) (вектор, противоположный
Φ(a)):
0 = b + Φ(0) = (b + Φ(0)) + Φ(0) = 0 + Φ(0) = Φ(0) ⇒ Φ(0) = 0.
Очевидно, что на множестве всех вещественных линейных
пространств изоморфизм порождает отношение эквивалентно-
сти. Важно, что исследования, выполненные для одного про-
странства V , сразу же переносятся на любое изоморфное ему
пространство. Например, векторы a1 , . . . , an ∈ V линейно зави-
симы тогда и только тогда, когда линейно зависимы векторы
Φ(a1 ), . . . , Φ(an ).
Теорема. Любое вещественное линейное пространство V раз-
мерности n = dim V изоморфно Rn .
Доказательство. Выберем какой-нибудь базис a1 , . . . , an в про-
странстве V и определим отображение Φ следующим образом:
 
x1
Φ(v) = . . . ,
xn
118 Лекция 12

где x1 , . . . , xn — коэффициенты разложения вектора v по данному


базису:
v = x1 a1 + . . . + xn an .
Сохранение операций проверяется очевидным образом. 
Следствие. Любые конечномерные вещественные простран-
ства одинаковой размерности изоморфны.

12.3. Пространство многочленов


Пусть Pn — линейное пространство многочленов порядка n
с вещественными коэффициентами. Докажем, что Pn изоморф-
но Rn .
Любой многочлен p(x) порядка n имеет вид
p(x) = pn−1 xn−1 + . . . + p1 x + p0 . (∗)
Поэтому кажется, что с определением изоморфизма Φ нет про-
блем:  
p0
Φ(p(x)) = ... .
pn−1
Действительно, это отображение сохраняет операции. Но будет
ли оно взаимно-однозначным?
Если под многочленом понимается формальное выражение
вида (∗) и при этом равенство многочленов определяется как
равенство всех коэффициентов при одинаковых степенях x, то
взаимная однозначность очевидна.
Если же под многочленом понимается функция от x ви-
да (∗), то равенство многочленов определяется как равенство
функций. В этом случае требуется доказать, что коэффициенты
в представлении (∗) определяются по функции p(x) однозначно.
Для этого достаточно установить линейную независимость одно-
членов
x0 , x1 , . . . , xn−1
как функций от x.
Предположим, от противного, что данные одночлены линейно
зависимы. Поскольку это ненулевые функции, существует одна
из них, линейно выражающаяся через предыдущие:
xk = α0 + α1 x + . . . + αk−1 xk−1 .
Понятно, что такого быть не может, если эти функции рассмат-
риваются как функции на всей оси (−∞, ∞): поделим обе части
12.3. Пространство многочленов 119

на xk и перейдем в обеих частях к пределу при x → ∞; слева


получится 1, а справа 0.
Как быть, если эти функции рассматриваются на конечном
отрезке, например, на [0, 1]? Предположим, что
p0 + p1 x + . . . + pn−1 xn−1 = 0 ∀ x ∈ [0, 1]. (#)
В этом случае можно поступить следующим образом. Выбе-
рем произвольные попарно различные числа x1 . . . , xn ∈ [0, 1].
Равенство (#) имеет место при всех x ∈ [0, 1], поэтому мы
имеем право рассмотреть его только для выбранных значений
x = x1 , . . . , xn :

⎨ p0 · 1 + p1 · x1 + . . . + pn−1 · x1n−1 = 0,
...

p0 · 1 + p1 · xn + . . . + pn−1 · xn−
n
1 = 0.

Это однородная система линейных алгебраических уравнений


с матрицей коэффициентов
⎡ ⎤
1 x1 . . . x1n−1
A = ⎣ ... ... ... ... ⎦ .
1 xn . . . xn−
n
1

Матрица такого вида называется транспонированной матрицей


Вандермонда, а матрица A — матрицей Вандермонда поряд-
ка n для чисел x1 , . . . , xn . Обозначение: A = V (x1 , . . . , xn ).
Утверждение. Определитель матрицы Вандермонда V (x1 , . . .
. . . , xn ) равен

det V (x1 , . . . , xn ) = (xj − xi ).
1i<j n

Доказательство. Определитель
⎡ ⎤
1 1 ... 1
⎢ x1 x2 . . . xn ⎥
det V (x1 , . . . , xn ) = ⎣ . . . ... ... ... ⎦
x1n−1 x2n−1 . . . xn−
n
1

не изменится, если из i-й строки вычесть (i − 1)-ю, умноженную


на xn . При этом в последнем столбце i-й элемент станет нулем.
Указанные действия выполним последовательно для строк с но-
мерами i = n, n − 1, . . . , 2. В результате находим
120 Лекция 12

det V (x1 , . . . , xn ) =
⎡ 1 1 ... 1 1

⎢ x 1 − xn x 2 − xn ... xn−1 − xn 0⎥
= det⎣ ... ... ... ⎦.
x1n−2 (x1 − xn ) x2n−2 (x2 − xn ) . . . xn−
n−1 (xn−1 − xn ) 0
2

Применим теорему Лапласа для разложения определителя по


последнему столбцу:
det V (x1 , . . . , xn ) =
= (−1)n+1 (x1 −xn )(x2 −xn ) · . . . · (xn−1 −xn ) det V (x1 , . . . , xn−1 ) =
= (xn − x1 )(xn − x1 ) · . . . · (xn − xn−1 ) det V (x1 , . . . , xn−1 ).
Доказательство завершается по индукции. 
Следствие 1. Определитель Вандермонда в случае попарно
различных чисел отличен от нуля.
Следствие 2. Если функция вида (∗) равна нулю для n попарно
различных значений x, то
p0 = p1 = . . . = pn−1 = 0.

Отсюда вытекает линейная независимость одночленов как


функций на любом фиксированном отрезке.
Задача 1. Даны попарно различные числа x1 , . . . , xn , y1 , . . . , yn
и известно, что для каких-то чисел u1 , . . . , un многочлен
n
 n
 uj
f (x) = (x − yk )
x − yj
k=1 j=1

обращается в нуль при x = x1 , . . . , xn . Доказать, что u1 = . . . = un =


= 0. Вывести отсюда невырожденность (n × n)-матрицы с элементами
1/(xi − yj ).

12.4. Прямая сумма подпространств


В линейном пространстве наряду с разложениями векторов
по базису часто представляют интерес также разложения векто-
ров по некоторым системам подпространств.
Пусть W1 , . . . , Wm — подпространства в линейном простран-
стве V . Множество
W = W1 + . . . +Wm ≡ {w = w1 + . . . +wm : w1 ∈ W1 , . . . , wm ∈ Wm }
12.4. Прямая сумма подпространств 121

называется суммой подпространств W1 , . . . , Wm . Конечно, W


является подпространством в V (доказательство для суммы двух
подпространств легко адаптируется и к случаю суммы m под-
пространств).
В случае если для любого вектора w ∈ W1 + . . . + Wm в раз-
ложении
w = w1 + . . . + wm , w1 ∈ W1 , . . . , wm ∈ Wm ,
векторы w1 ∈ W1 , . . . , wm ∈ Wm определяются однозначно, сум-
ма данных подпространств называется прямой суммой. Ненуле-
вые подпространства, сумма которых является прямой, называ-
ются линейно независимыми.
Если e1 , . . . , en — любая линейно независимая система век-
торов, то сумма их линейных оболочек
W = L(e1 ) + . . . + L(en )
является прямой суммой. Это наблюдение обобщается следую-
щим образом.
Теорема. Пусть V — конечномерное пространство и W1 , . . .
. . . , Wm — его ненулевые подпространства. Сумма
W = W 1 + . . . + Wn
является прямой суммой тогда и только тогда, когда объеди-
нение произвольно выбранных базисов для W1 , . . . , Wm дает
базис подпространства W .
Доказательство. Пусть W является прямой суммой. Предполо-
жим, что dim Wi = ni , и рассмотрим W1 , . . . , Wm как линейные
оболочки своих базисов:
W1 = L(v11 , . . . , vn1 1 ), ... , Wm = L(v1m , . . . , vnm m ).
Докажем, что объединение базисов образует базис в V . Ясно,
что W есть линейная оболочка объединения базисов:
W = L(v11 , . . . , vn1 1 , . . . , v1m , . . . , vnm m ).
Поэтому остается лишь убедиться в линейной независимо-
сти векторов объединения базисов. Пусть w — произволь-
ная линейная комбинация этих векторов. Запишем w виде
w = w1 + . . . + wm , где wi ∈ Wi , i = 1, . . . , m. Если w = 0, то
в силу единственности векторов w1 ∈ W1 , . . . , wm ∈ Wm данного
разложения получаем: w1 = . . . = wm = 0. Отсюда следует, что
все коэффициенты в разложении w = 0 по объединенной системе
v11 , . . . , vn1 1 , . . . , v1m , . . . , vnm m равны нулю.
122 Лекция 12

Пусть теперь объединение базисов подпространств W1 , . . .


. . . , Wm дает базис W . Единственность разложения вектора по
базису означает единственность векторов w1 ∈ W1 , . . . , wm ∈ Wm
в разложении w = w1 + . . . + wm . 
Задача 1. Докажите, что пространство матриц Rn×n являет-
ся прямой суммой подпространств симметричных матриц (таких, что
A = A) и кососимметричных матриц (таких, что A = −A).

12.5. Дополнительные пространства и проекции


Если линейное пространство V явлется прямой суммой своих
подпространств:
L+M =V,
то M называется дополнительным пространством для L. В си-
лу симметрии суммы очевидно, что L является дополнительным
для M .
В таких случаях для любого вектора v ∈ V существует един-
ственное разложение
v = x + y, где x ∈ L, y ∈ M.
Вектор x называется проекцией вектора v на подпространство
L параллельно (вдоль подпространства) M , а y — проекцией
вектора v на M параллельно L.
Утверждение. Сумма двух подпространств L + M является
прямой тогда и только тогда, когда L ∩ M = {0}.
Доказательство. Пусть сумма прямая и x ∈ L ∩ M . Тогда мы
имеем два разложения: x = x + 0 и x = 0 + x, в которых первый
вектор из L, а второй из M . В силу единственности компонент
разложения x = 0.
Пусть теперь L ∩ M = {0}, и пусть x1 + y1 = x2 + y2 , x1 , x2 ∈
∈ L, y1 , y2 ∈ M . Отсюда x1 − x2 = −(y1 − y2 ) ∈ L ∩ M ⇒
x1 − x2 = −(y1 − y2 ) = 0 ⇒ x1 = x2 , y1 = y2 . 
ПРИМЕР. В линейном пространстве V всех свободных век-
торов (радиус-векторов) рассмотрим плоскость L и прямую M ,
проходящие через начало координат. Если прямая лежит в плос-
кости, то сумма L + M равна L и не является прямой. Во
всех других случаях имеем прямую сумму V = L + M и можем
−→
рассматривать проекции радиус-вектора OA (точки A) на дан-
ную плоскость параллельно прямой и на прямую параллельно
плоскости.
12.6. Вычисление подпространства 123

12.6. Вычисление подпространства


Под вычислением конечномерного подпространства W в ли-
нейном пространстве V обычно понимается построение какого-
либо его базиса — линейно независимой системы векторов
w1 , . . . , wk такой, что W = L(w1 , . . . , wk ), k = dim W .
ПРИМЕР. Пусть подпространства W1 , W2 ⊂ R5 определя-
ются следующим образом:
• W1 — множество всех решений однородной системы

x1 + x2 + x3 + x4 + x5 = 0,
x4 + x5 = 0;
• W2 — множество всех решений однородной системы
x1 + x2 + x3 + x4 + x5 = 0,
2x3 + x4 + 2x5 = 0,
x5 = 0 .
Требуется
 вычислить подпространства W1 , W2 , W1 + W2
и W1 W2 .
Обозначим матрицы коэффициентов данных систем через A
и B . Тогда

 
1 1 1 1 1
1 1 1 1 1
A= 0 0 0 1 1 , B= 0 0 2 1 2 ;
0 0 0 0 1
W1 = ker A, W2 = ker B.
Матрицы A и B имеют верхнюю ступенчатую форму с числом
ступеней 2 и 3 соответстввенно. Поэтому
rankA = 2, rankB = 3 ⇒
dim W1 = 5 − 2 = 3, dim W2 = 5 − 3 = 2.
(Размерности определяются теоремой о строении множества
решений однородной системы линейных алгебраических урав-
нений.)
Далее, в матрице A базисными являются, например, столбцы
с номерами 1, 4. Поэтому в качестве базисных можно выбрать
неизвестные x1 , x4 ; остальные неизвестные x2 , x3 , x5 будут сво-
бодными:
x2 = 1, x3 = 0, x5 = 0 ⇒ x1 = −1, x4 = 0;
x2 = 0, x3 = 1, x5 = 0 ⇒ x1 = −1, x4 = 0;
x2 = 0, x3 = 0, x5 = 1 ⇒ x1 = 0, x4 = −1.
124 Лекция 12

Таким образом,
⎡ ⎤ ⎡ ⎤ ⎡ ⎤
−1 −1 0
⎢ 1 ⎥ ⎢ 0 ⎥ ⎢ 0 ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
W1 = L(p1 , p2 , p3 ), где p1 = ⎢ 0 ⎥ , p2 = ⎢ 1 ⎥ , p3 = ⎢ 0 ⎥.
⎣ 0 ⎦ ⎣ 0 ⎦ ⎣ −1 ⎦
0 0 1
В матрице B базисными являются, например, столбцы с но-
мерами 1, 3, 5. Неизвестные x1 , x3 , x5 — базисные, а неизвестные
x2 , x4 — свободные:
x2 = 1, x4 = 0 ⇒ x1 = −1, x3 = 0, x5 = 0;
x2 = 0, x4 = 1 ⇒ x1 = −1/2, x3 = −1/2, x5 = 0.
Таким образом,
⎡ ⎤ ⎡ ⎤
−1 −1/2
⎢ 1 ⎥ ⎢ 0 ⎥
⎢ ⎥ ⎢ ⎥
W2 = L(q1 , q2 ), где q1 = ⎢ 0 ⎥ , q2 = ⎢ −1/2 ⎥.
⎣ 0 ⎦ ⎣ 1 ⎦
0 0
Далее, W1 + W2 = L(p1 , p2 , p3 , q1 , q2 ) = im C , где
⎡ ⎤
−1 −1 0 −1 −1/2
⎢ 1 0 0 1 0 ⎥
⎢ ⎥
C = [p1 , p2 , p3 , q1 , q2 ] = ⎢ 0 1 0 0 −1/2 ⎥.
⎣ 0 0 −1 0 1 ⎦
0 0 1 0 0
Простое вычисление показывает, что rank C = 4, а базисными
являются, например, столбцы с номерами 1, 2, 3, 5. Поэтому век-
торы p1 , p2 , p3 , q2 линейно независимы и
W1 + W2 = L(p1 , p2 , p3 , q2 ),
dim(W1 + W2 ) = 4.

Наконец, в силу теоремы Грассмана, dim W1 W2 = 3 + 2 −
− 4 = 1.В данном случае можно заметить, что p1 = q1 ⇒
p1 ∈ W1 W2 . Следовательно,
"
W1 W2 = L(p1 ).
Конечно, для поиска пересечения в данномслучае можно также
заметить, что вектор x принадлежит W1 W2 тогда и только
тогда, когда Ax = 0 и Bx = 0. Таким образом,
" " 

#
A 0
W1 W2 = ker A ker B = x : x= .
B 0
12.6. Вычисление подпространства 125

В общем случае вычисление пересечения подпространств


"
W = L(a1 , . . . , ak ) L(b1 , . . . , bm )
сводится к решению однородной системы линейных алгебраиче-
ских уравнений
x1 a1 + . . . + xk ak + y1 b1 + . . . + ym bm = 0 (∗)
с неизвестными x1 , . . . , xk , y1 , . . . , ym . Из равенства (∗) ясно, что
v = x1 a1 + . . . + xk ak = −(y1 b1 + . . . + ym bm ) ∈ W.
Пусть r = rank[a1 , . . . , ak , b1 , . . . , bm ]. Тогда фундаментальная си-
стема векторов для (∗) состоит из k + m − r векторов вида
⎡ ⎤ ⎡ ⎤
s11 s1 k+m−r
⎢ ... ⎥ ⎢ ... ⎥
⎣ s ⎦ , ... , ⎣ s ⎦,
k1 k k+m−r
... ...
где компоненты s1j , . . . , skj соответствуют неизвестным x1 , . . .
. . . , xk . После того как фундаментальная система построена, по-
лучаем
W = L(v1 , . . . , vk+m−r ),
vj = s1j a1 + . . . + skj ak ,
j = 1, . . . , k + m − r.
Предположим, что
dim L(a1 , . . . , ak ) = k , L(b1 , . . . , bm ) = m.
Тогда в силу теоремы Грассмана dim W = k + m − r, поэтому
векторы v1 , . . . , vk+m−r будут линейно независимы.
Л е к ц и я 13

13.1. Линейные многообразия


Пусть W — подпространство в линейном пространстве V
и x — некоторый вектор из V . Множество векторов вида
M = {v = x + w : w ∈ W }
называется линейным многобразием в V . Обозначение: M = x +
+ W.
Подпространство W называется направляющим простран-
ством для M и определяется по множеству M однозначно.
В самом деле, пусть
M = x1 + W1 = x2 + W2 .

Отсюда x1 − x2 ∈ W1 W2 . Пусть y ∈ W1 . Тогда y + (x1 − x2 ) ∈
∈ W2 ⇒ y ∈ W2 . Аналогично, если y ∈ W2 , то y + (x2 − x1 ) ∈
∈ W 1 ⇒ y ∈ W1 . 
Для M = x + W вектор x называется вектором сдвига.
В качестве вектора сдвига можно взять любой вектор из M :
M =x+W =y+W ∀ y ∈ M.
Действительно, пусть y = x + w0 для какого-то w0 ∈ W . Тогда,
если z = x + w при некотором w ∈ W , то z = y + (x − y) + w =
= y + (−w0 + w). Значит, x + W ⊂ y + W . Обратное включение
доказывается аналогично. 
Если W — конечномерное пространство, то его размерность
называется также размерностью линейного многообразия M =
= x + W.
ПРИМЕР 1. Множество решений системы Ax=b с (m×n)-
матрицей ранга r представляет собой линейное многобразие v +
+ W , где v — частное решение данной системы и W = ker A.
ПРИМЕР 2. Прямая на плоскости или в трехмерном про-
странстве — это линейное многообразие размерности 1. Плос-
кость в трехмерном пространстве — это линейное многообразие
размерности 2.
13.2. Аффинные множества 127

При изучении линейных многообразий элементы векторного


пространства обычно называют точками. По аналогии с гео-
метрическим пространством можно думать о векторах как о
радиус-векторах, отложенных от общей начальной точки, отож-
дествляемой с нулевым вектором.
Задача 1. Докажите, что два линейных многообразия a1 + L1 и
a2 + L2 с направляющими подпространствами L1 и L2 пересекаются
тогда и только тогда, когда a1 − a2 ∈ L1 + L2 .

13.2. Аффинные множества


Пусть x = y — две точки в линейном пространстве V . Мно-
жество точек вида
l = {z = x + t(y − x), t ∈ R}
называется прямой, проходящей через точки x и y . Множество
M ⊂ V называется аффинным множеством, если вместе с лю-
быми двумя точками x = y оно содержит все точки проходящей
через них прямой.
Утверждение. Линейные многообразия и только они являются
аффинными множествами.
Доказательство. Пусть M = x0 + L — линейное многообразие
с направляющим пространством L и вектором сдвига x0 . Пусть
x = x0 + u, u ∈ L и y = x0 + v , v ∈ L. Тогда v − u ∈ L и поэтому
x + t(y − x) = x0 + t(v − u) ∈ L для любых t.
Теперь предположим, что M — аффинное множество. Зафик-
сируем точку x0 ∈ M и рассмотрим множество
L = {z ∈ V : z = x − x0 , x ∈ M }.
Докажем, что L — линейное подпространство. Во-первых, если
z ∈ L, то
αz = (x0 + α(x − x0 )) − x0 ∈ L.
Во-вторых, если z1 = x1 − x0 ∈ L и z2 = x2 − x0 ∈ L, то z1 + z2 =
x + x2
= 2z , где z = 1 − x0 . Остается заметить, что
2
x1 + x2 x2 − x1
= x1 + ∈ M ⇒ z ∈ L ⇒ 2z ∈ L ⇒ z1 + z2 ∈ L. 
2 2
Любое множество точек S содержится, конечно, в некотором
аффинном множестве (например, в V ). Пусть M — пересечение
всех таких аффинных множеств.Ясно, что M будет тоже аффин-
128 Лекция 13

ным множеством, причем наименьшим аффинным множеством,


содержащим S . Оно называется аффинной оболочкой множе-
ства S .

13.3. Гиперплоскости
Пусть V — вещественное линейное пространство размерно-
сти n. Любое линейное многообразие M = v0 + L ⊂ V размерно-
сти n − 1 называется гиперплоскостью.
Поскольку V изоморфно Rn , давайте считать, что V = Rn ,
и рассмотрим уравнение относительно вещественных неизвест-
ных x1 , . . . , xn :
c1 x1 + . . . + cn xn = b, (∗)
где хотя бы одно из чисел ci отлично от нуля.
Утверждение 1. Множество всех векторов из Rn с коорди-
натами x1 , . . . , xn , удовлетворяющими уравнению (∗), есть
гиперплоскость. Кроме того, любая гиперплоскость может
быть задана как множество решений некоторого уравнения
вида (∗).
Доказательство. Уравнение (∗) — это частный случай систе-
мы линейных алгебраических уравнений, состоящей их одного
уравнения. Матрица коэффициентов имеет размеры (1 × n), и,
поскольку не все ci равны нулю, ее ранг равен 1. Очевидно,
что система совместна. Обозначим через v1 , . . . , vn−1 векторы
фундаментальной системы решений, и пусть v0 — произвольное
частное решение. Тогда множество решений системы (∗) имеет
вид v0 + L(v1 , . . . , vn−1 ) и поэтому является гиперплоскостью.
Пусть M = v0 + L(v1 , . . . , vn−1 ) — произвольная гиперплос-
кость. Образуем [n × (n − 1)]-матрицу B = [v1 , . . . , vn−1 ] и рас-
смотрим уравнение  
c1
B  . . . = 0.
cn
Ранг матрицы коэффициентов равен n − 1 ⇒ система имеет
нетривиальное решение c = [c1 , . . . , cn ] . Очевидно, что
M = {x = v0 + Bz , z ∈ Rn−1 }.
Умножив обе части равенства x = v0 + Bz слева на матрицу-
строку c , находим
c x = c v0 + (c B)z = c v0 ⇒ c1 x1 + . . . + cn xn = b, b = c v0 .
13.4. Полупространства 129

Остается заметить, что v0 есть частное решение полученной


системы, а столбцы матрицы B образуют фундаментальную си-
стему решений для соответствующей однородной системы. 
Утверждение 2. Любое линейное многообразие размерности k
является пересечением n − k гиперплоскостей.
Доказательство. Пусть данное многообразие имеет вид M =
= v0 + L(v1 , . . . , vk ). Тогда x ∈ M есть вектор вида x = v0 + Bz ,
где B = [v1 , . . . , vk ], z ∈ Rk . Рассмотрим уравнение

B  y = 0.
Поскольку rankB = k , фундаментальная система решений содер-
жит n − k векторов. Обозначим их через a1 , . . . , an−k . Далее,

a   
i x = ai v0 + (ai B)z = ai v0 .

Следовательно, x принадлежит пересечению гиперплоскостей


a
i x = bi , bi = a
i v0 , 1  i  n − k.
В то же время пересечение этих гиперплоскостей есть линейное
многообразие той же размерности. 
Заметим, что системы n − k гиперплоскостей, дающие в пере-
сечении M , можно выбрать многими способами. Из доказатель-
ства видно, что их столько, сколько имеется фундаментальных
систем решений уравнения B  y = 0.

13.4. Полупространства
Любая гиперплоскость π : c1 x1 + . . . + cn xn = b (c  x = b )
выделяет в Rn два подмножества:
π− = {x : c x  b}, π+ = {x : c x  b}, π− ∩ π+ = π.
Эти подмножества называются («отрицательным» и «положи-
тельным») полупространствами. В случае плоскости в трехмер-
ном пространстве они уже изучались в п. 7.12.
Утверждение. Точки x, y ∈ / π принадлежат разным полупро-
странствам тогда и только тогда, когда x + t(y − x) ∈ π при
некотором 0 < t < 1.
Доказательство. Пусть для определенности x ∈ π− и y ∈ π+ .
Тогда уравнение
c (x + t(y − x)) = b
5 Е. Е. Тыртышников
130 Лекция 13

имеет решение
b − c x b − c x
t= = ,
c (y − x) (b − c x) − (b − c y)
причем с очевидностью 0 < t < 1. Если же x, y ∈ π− (π+ ), то при
любом 0  t  1 находим: x + t(y − c) ∈ π− (π+ ). 

13.5. Выпуклые множества


Пусть V — линейное пространство и x, y ∈ V . Множество
точек вида x + t(y − x) = (1 − t)x + ty , 0  t  1, называется
отрезком, соединяющим x и y . Множество M ⊂ V называется
выпуклым, если вместе с любыми двумя точками оно содержит
все точки соединяющего их отрезка. Точки, получаемые при 0 <
< t < 1, называются внутренними точками отрезка.
Любые полупространства в Rn — выпуклые множества. То
же верно и для пересечения любого числа полупространств.
Это следствие более общего и очевидного факта: пересечение
любого числа выпуклых множеств является выпуклым мно-
жеством.
Пусть v1 , . . . , vk ∈ V . Тогда вектор
v = t1 v1 + . . . + tk vk , ti  0, t1 + . . . + tk = 1,
называется выпуклой комбинацией векторов v1 , . . . , vk . Множе-
ство всех возможных выпуклых комбинаций заданных векторов
называется их выпуклой оболочкой.
Утверждение 1. Выпуклая оболочка векторов является вы-
пуклым множеством.
Доказательство. Пусть x = α1 v1 + . . . + αk vk и y = β1 v1 + . . .
. . . + βk vk . Тогда при 0  t  1 получаем

k
(1 − t)x + ty = ((1 − t)αi + tβi )vi .
i=1
 
Если αi = βi = 1 и αi , βi  0, то, очевидно,

k
((1 − t)αi + tβi ) = 1, (1 − t)αi + tβi  0. 
i=1
Например, в трехмерном пространстве выпуклая оболочка
трех точек, не лежащих на одной прямой, представляет собой
треугольник с вершинами в этих точках. Выпуклая оболочка
четырех точек, не лежащих в одной плоскости, есть тетраэдр.
13.5. Выпуклые множества 131

Утверждение 2. Пусть M — выпуклое множество. Тогда


вместе с любой системой точек M содержит целиком и их
выпуклую оболочку.
Доказательство. Если t1 > 0, то
 k
k  ti 
k
ti
ti vi = t1 v1 + (1 − t1 ) vi , = 1.
1 − t1 1 − t1
i=1 i=2 i=2
Далее проводим индукцию по числу точек k . 
Любое (в том числе и бесконечное) множество точек S содер-
жится в некотором выпуклом множестве (достаточно учесть, что
любое аффинное множество является выпуклым). Пересечение
всех таких множеств будет наименьшим выпуклым множеством,
содержащим S . Оно называется выпуклой оболочкой множе-
ства S . Легко видеть, что если S — конечная система точек, то
ее выпуклая оболочка совпадает с выпуклой оболочкой множе-
ства S .
Задача 1. Матрица A ∈ Rn×n называется двоякостохастической,
если все ее элементы неотрицательны, а сумма элементов в каждой
строке и каждом столбце равна 1. Доказать, что множество всех
двоякостохастических матриц порядка n является выпуклым, и найти
все его угловые точки (так называются точки множества, не являю-
щиеся внутренними ни для одного отрезка, принадлежащего данному
множеству).

5*
Л е к ц и я 14

14.1. Комплексные числа


Как известно, квадратное уравнение с вещественными ко-
эффициентами может не иметь вещественных решений. Фор-
мально положение легко поправить, введя для обозначения
несуществующих решений некие «абстрактные числа». Но од-
них обозначений, конечно, мало. Важно определить операции
сложения и умножения для новых чисел таким образом, чтобы
остались в силе привычные свойства этих операций над веще-
ственными числами.
В качестве «абстрактных чисел» рассмотрим (2 × 2)-матрицы
специального вида


a −b
z = z(a, b) = , a, b ∈ R. (∗)
b a
Обозначим через C множество всех таких матриц. Операции
сложения и умножения «абстрактных чисел» определим как со-
ответствующие операции над матрицами. Элементарно проверя-
ется, что они обладают следующими свойствами.
1) Если u, v ∈ C, то u + v ∈ C и uv ∈ C.
2) Любая ненулевая матрица z = z(a, b) ∈ C обратима,
а соответствующая обратная матрица имеет вид


−1 c −d a −b
z = , c= 2 , d= 2 .
d c a +b2
a + b2

3) Множество C относительно операции сложения мат-


риц является абелевой группой.
4) Множество C\{0} относительно операции умножения
матриц является абелевой группой.
5) Имеет место дистрибутивность: z(u + v) = zu +
+ zv ∀ u, v , z ∈ C.
Если в утверждениях (3)–(5) заменить C на R, то получатся
основные свойства операций над вещественными числами. По-
14.2. Комплексная плоскость 133

этому элементы множества C логично рассматривать как числа.


Это и будут так называемые комплексные числа.
Вещественные числа a и b называются соответственно ве-
щественной и мнимой частью комплексного числа z = z(a, b).
Обозначение: Re(z) = a, Im(z) = b. Рассмотрим две специальные
матрицы вида (∗):



1 0 0 −1
e= 0 1 , i= 1 0 .
Легко видеть, что
z = z(a, b) = ae + bi, a, b ∈ R. (∗∗)
Матрица e выполняет роль единичного элемента относительно
операции умножения. Матрицу вида ae естественно отожде-
ствить с вещественным числом a. Тогда e = 1 · e отождествится
с числом 1, а соотношение (∗∗) примет вид
z = a + bi,
и при этом, как легко проверить,
i2 = −1 (−1 отождествляется с матрицей −e).
Несложно проверить, что уравнение z 2 = −1 имеет на множе-
стве C в точности два решения: z = ±i. Отсюда можно вывести,
что любое квадратное уравнение с вещественными коэффици-
ентами имеет два (иногда совпадающих) решения из C. Мы
скоро увидим, что то же верно и для квадратных уравнений
с комплексными коэффициентами.
Конечно, комплексные числа можно было бы ввести без ис-
пользования матриц — сказав, что это пары (a, b) вещественных
чисел, для которых операции определяются правилами
(a, b) + (c, d) = (a + c, b + d), (a, b)(c, d) = (ac − db, ad + bc).
Придется изменить лишь некоторые детали доказательства
свойств (3)–(5).
Наш интерес к использованию матриц вида (∗) объясняется
тем, что они представляют искомые «абстрактные числа» как
уже знакомые объекты с хорошо изученными свойствами.

14.2. Комплексная плоскость


Рассмотрим плоскость с декартовой системой координат.
Пусть (a, b) — точка (радиус-вектор) с координатами a, b. Оче-
видно, что (a, b) ↔ z = a + bi есть взаимно-однозначное соот-
ветствие между точками (радиус-векторами) плоскости и ком-
134 Лекция 14

плексными числами. Плоскость, точки (радиус-векторы) которой


используются для изображения комплексных чисел, называется
комплексной плоскостью.
Рассмотрим комплексное число √ z = a + bi. Длина отвечаю-
щего ему радиус-вектора, равная a2 + b2 , называется модулем
комплексного числа z и обозначается |z|. Угол ϕ называется
аргументом комплексного числа z = 0, если при повороте по
часовой стрелке на угол ϕ направление радиус-вектора числа z
совпадает с положительным направлением оси абсцисс. Обозна-
чение: ϕ = arg z . Конечно, аргумент определен с точностью до
слагаемого, кратного 2π .
Числу z = 0 можно приписать любое значение аргумента.
Очевидно, что
z = |z| (cos ϕ + i sin ϕ), ϕ = arg z.
Такая форма представления комплексного числа называется его
тригонометрической формой.
Заметим, что сумме комплексных чисел соответствует сумма
соответствующих радиус-векторов. Отсюда получаем очень по-
лезное неравенство (неравенство треугольника)
|u + v|  |u| + |v| ∀ u, v ∈ C
и его не менее полезное следствие
| |u| − |v| |  |u − v| ∀ u, v ∈ C.
При умножении z на комплексное число
w = |w| (cos ψ + i sin ψ), ψ = arg w,
получается
zw = |z| |w| (cos ϕ + i sin ϕ) (cos ψ + i sin ψ) =
= |z| |w| ((cos ϕ cos ψ − sin ϕ sin ψ) + i (cos ϕ sin ψ +
+ sin ϕ cos ψ)) =
= |z| |w| (cos(ϕ + ψ) + i sin(ϕ + ψ)).
Таким образом, при умножении комплексных чисел модули
перемножаются, а аргументы складываются.
Отметим удобное обозначение: eiϕ = cos ϕ + i sin ϕ. 1) Тогда
eiϕ eiψ = ei(ϕ+ψ) (в полном согласии с формальным применением
известных свойств экспоненциальной функции).
Комплексное число a − bi называется сопряженным к числу
z = a + bi. Обозначение: z = a − bi. На комплексной плоскости
1)
В теории функций комплексного переменного дается специальное опре-
деление функции в левой части, а данное равенство называется формулой
Эйлера и доказывается с использованием этого определения.
14.3. Преобразования плоскости 135

радиус-вектор для z получается из радиус-вектора для z симмет-


ричным отражением относительно первой оси. Заметим также,
что z z = |z|2 .
Отмеченные свойства комплексных чисел упрощают получение
некоторых интересных формул. Например,
 n чтобы
 вычислить сумму
n  k
Sn = cos kϕ, заметим, что Sn = Re z , где z = cos ϕ + i sin ϕ.
k=1 k=1
Таким образом, задача
 n+1 сводится
 с суммированию геометрической про-
z −z
грессии: Sn = Re .
z−1

14.3. Преобразования плоскости


С помощью комплекных чисел можно задавать взаимно-
однозначные отображения плоскости на себя. Например, фик-
сируем w ∈ C и рассмотрим отображение z → z + w. Это
параллельный перенос (сдвиг) точек на вектор, заданный ком-
плексным числом w.
Далее, рассмотрим отображение z → wz в предположении,
что |w| = 1. В силу того что |w| = 1, находим: |wz| = |z|. При
этом радиус-вектор для wz получается поворотом радиус-вектора
для z на угол ϕ = arg w. Таким образом, умножение комплексных
чисел на фиксированное комплексное число w с модулем 1 задает
поворот на угол, равный аргументу числа w.
Умножение на вещественное число ρ > 0 задает гомоте-
тию: каждый радиус-вектор умножается на ρ (растягивается
в ρ раз).
Поскольку в случае w = 0 можно записать w = |w| w , где
 = w/|w| и, следовательно, |w|
w  = 1, умножение на произвольное
комплексное число w = 0 сводится к композиции (последователь-
ному выполнению) двух отображений: поворота и гомотетии.
Преобразование вида z → z также является взаимно-
однозначным. Это симметричное отражение относительно первой
оси. Но оно уже не представимо в виде композиции поворотов,
гомотетий и параллельных переносов. Сказанное означает, что
ни для каких комплексных чисел a, b нельзя получить равенство
z = a + bz , верное для всех z ∈ C. Докажите!
Утверждение. Множество T отображений комплексной плос-
кости вида
Φ(z) = a + bz или Φ(z) = a + bz , где a, b ∈ C, |b| = 1,
образует группу относительно композиции отображений.
136 Лекция 14

Доказательство. Композиция отображений ΦΨ определяется


следующим правилом: (ΦΨ)(z) = Φ(Ψ(z)). Пусть Φ(z) = a + bz
и Ψ(z) = c + dz принадлежат T . Это означает, что |b| = |d| = 1.
Тогда
Φ(Ψ(z)) = a + b(c + dz) = (c + bc) + (bd)z.
Поскольку |bd| = |b||d| = 1, данное отображение также принад-
лежит T . Роль единичного элемента выполняет тождественное
отображение z → z , которое, очевидно, принадлежит T . Далее,
если w = a + bz , то z = a − bw. Поскольку | − b| = 1, отображе-
ние, обратное к Φ, также принадлежит T .
Теперь заменим Φ на Φ или Ψ на Ψ. Композиция таких
отображений и обратные к ним также принадлежат T — для
проверки нужны выкладки, аналогичные предыдущим. 
Взаимно-однозначное отображение плоскости z → Φ(z)
называется движением, если оно сохраняет расстояние между
точками: |Φ(z1 ) − Φ(z2 )| = |z1 − z2 | ∀ z1 , z2 ∈ C.
Из наших предыдущих рассуждений понятно, что любое
отображение из T является композицией параллельных перено-
сов, поворотов и симметричных отражений. Каждое из данных
отображений специального вида является движением. Поэтому
любое отображение из T есть движение. Верно и обратное, что
является весьма примечательным фактом, дающим полное описа-
ние всех мыслимых движений (и требующим более обстоятель-
ного доказательства, на котором мы не будем останавливаться).
Пример более сложного отображения: z → 1/z . Оно
не определено при z = 0, но является взаимно-однозначным
на множестве C\{0}. Часто к комплексной плоскости добав-
ляется абстрактная бесконечно удаленная точка ∞, в ре-
 чего появляется расширенная комплексная плоскость
зультате
C = C {∞}. Тогда отображение z → 1/z можно превратить
во взаимно-однозначное отображение на C, приняв соглашение
о том, что 0 переходит в ∞, а ∞ переходит в 0. Отображение
z → 1/z представляет собой частный случай так называемых
дробно-линейных отображений вида
a + bz
z → Φ(z) = ,
c + dz
где a, b, c, d — фиксированные комплексные числа, причем пред-
полагается, что Φ(z) не является тождественной константой:
ad − bc = 0.
Если d = 0, то дробно-линейное отображение сводится к
рассмотренному выше. Предположим, что d = 0. Тогда Φ(z) не
14.4. Корни из единицы 137

определено при z = −c/d. Если условиться, что Φ(−c/d) = ∞ и


Φ(∞) = −c/d, то Φ будет взаимно-однозначным отображением
на расширенной комплексной плоскости. Дробно-линейные отоб-
ражения обладают рядом замечательных геометрических свойств
(например, они переводят окружности и прямые в окружности
или прямые — докажите!) и играют важную роль в теории
функций комплексного переменного.
Задача 1. Доказать, что дробно-линейное отображение
z−b
z → a , |a| = 1, Im(b) < 0,
z−b
переводит точки (комплексные числа) верхней полуплоскости в точки
единичного круга с центром в начале координат.
Задача 2. Доказать, что дробно-линейное отображение
z−b
z → a , |a| = 1, |b| < 1,
1 − zb
переводит точки (комплексные числа) единичного круга с центром
в начале координат в точки того же множества.

14.4. Корни из единицы


Комплексное число z называется корнем степени n из едини-
цы, если z n = 1.
Формула Муавра. Если z = |z| (cos ϕ + i sin ϕ), то
z n = |z|n (cos(nϕ) + i sin(nϕ)).
Доказательство. Достаточно учесть, что при умножении ком-
плексных чисел модули перемножаются, а аргументы складыва-
ются. 
Следствие. Существует ровно n различных корней из единицы
степени n. Это комплексные числа вида
2πk
2π k 2π k
zk = ei n = cos + i sin , k = 0, 1, . . . , n − 1.
n n
Доказательство. Пусть z = |z| (cos ϕ + i sin ϕ) есть корень из
единицы степени n. Тогда, согласно формуле Муавра, |z| = 1
и cos(nϕ) = 1 (⇒ sin(nϕ) = 0). Отсюда
2π k
ϕ= , k = 0, ±1, ±2, . . .
n
Следовательно, при любом целом k комплексное число вида
2π k 2π k
zk = cos + i sin
n n
138 Лекция 14

является корнем степени n из единицы. В силу периодичности


синуса и косинуса очевидно, что zk = zl , если l = k + m n, m =
= 0, ±1, ±2, . . . Если же 0  k , l  n − 1, то равенство zk = zl
возможно лишь при k = l — достаточно заметить, что комплекс-
ные числа z0 , z1 , . . . , zn−1 расположены в вершинах правильного
n-угольника, вписанного в единичную окружность. 

14.5. Группа корней степени n из единицы


Введем обозначение Kn для множества корней степени n из
единицы. Мы только что доказали, что Kn содержит ровно n
комплексных чисел.
Множество Kn является, как легко видеть, группой отно-
сительно операции умножения комплексных чисел. Более того,
Kn является циклической группой. В самом деле, zk = εk , где
ε = cos(2π/n) + i sin(2π/n) = z1 .
Корень zm = εm называется первообразным корнем степе-
ни n из единицы, если

Kn = {(εm )0 , (εm )1 , ..., (εm )n−1 }.

Предположим, что εm — первообразный корень. Тогда равен-


ство εmp = 1 в случае 0 < p  n влечет за собой равенство p = n
(если εp = 1, то степени числа ε не могут породить более чем p
чисел).
Утверждение 1. Корень из единицы εm ∈ Kn при m  1 явля-
ется первообразным тогда и только тогда, когда числа m
и n взаимно просты (наибольший общий делитель этих чисел
равен 1).
Доказательство. Предположим, что εm является первообраз-
ным корнем, но числа m и n все же имеют наибольший общий
делитель d > 1: n = dp и m = dq при целых p, q и d > 1. Тогда
(εm )p = εmp = εdqp = εqn = 1 при 0 < p < n ⇒ степени числа
εm не могут породить более чем p < n чисел ⇒ корень εm не
может быть первообразным.
Пусть теперь m и n взаимно просты. Докажем, что εm явля-
ется первообразным корнем. Для этого достаточно установить,
что если εk = εl при 0  k , l  n − 1, то k = l. В самом деле,
m(k − l) должно нацело делиться на n. Поскольку m и n взаимно
просты, k − l должно делиться на n ⇒ k = l. 
14.6. Матрицы с комплексными элементами 139

В теории чисел количество чисел от 1 до n, взаимно проcтых


с n, обозначается ϕ(n), а функция ϕ(n) называется функцией
Эйлера. 1)
Утверждение 2. Сумма всех корней степени n из единицы
равна нулю.
Доказательство. Поскольку zk = εk , требуется найти сумму
членов геометрической прогрессии:

n−1 1
n−
εn − 1
zk = εk = = 0. 
ε−1
k=0 k=0

1
n−
Задача 1. Доказать, что (x + εk y)n = n(xn + y n ), где ε =
k=0
= cos(2π/n) + i sin(2π/n).
Задача 2. Используя комплексные числа, доказать, что
n−
1
а) x2n − 1 = (x2 − 1) (x2 − 2x cos(πk/n) + 1);
k=1
n−
1 √
πk n
б) sin = .
k=1
2n 2n−1

14.6. Матрицы с комплексными элементами


Множество матриц размеров m × n с комплексными элемен-
тами обозначается Cm×n . Если A = [aij ] ∈ Cm×n , то матрица тех
же размеров с заменой элементов на комплексно сопряженные
к ним часто обозначается через A = [aij ].

Матрица A называется сопряженной к A матрицей. Обо-

значение: A∗ = A .
Отметим некоторые свойства сопряженных матриц:
• (AB)∗ = B ∗ A∗ ;
• det A∗ = det A;
• матрица A обратима тогда и только тогда, когда обратима
сопряженная матрица A∗ , при этом (A∗ )−1 = (A−1 )∗ (ино-
гда используется обозначение A−∗ = (A∗ )−1 ).

1)
Функция Эйлера обладает рядом замечательных свойств. Например,
ϕ(ab) = ϕ(a)ϕ(b) для любых взаимно простых чисел a и b — докажите!
Л е к ц и я 15

15.1. Кольца и поля


В процессе развития математики постоянно находились при-
чины для того, чтобы вводить все более общие понятия числа.
Общеизвестна, по крайней мере, такая цепочка расширений:
N ⊂ Z ⊂ Q ⊂ R ⊂ C,
N = {1, 2, . . . } — натуральные числа; 1)
Z = {0, ±1, ±2, . . . } — целые числа,
Q = {p/q , p ∈ Z, q ∈ N} — рациональные числа,
R — вещественные числа,
C — комплексные числа.
Множество целых чисел Z послужило прототипом для понятия
кольца, а множества Q, R, C — для понятия поля.
Пусть на непустом множестве K действуют две алгебраиче-
ские операции: сложение (обозначаемое знаком +) и умножение
(обозначаемое точкой или «пустым местом»), и пусть эти опера-
ции обладают следующими свойствами:
• множество K относительно операции сложения является
абелевой группой;
• выполняются законы дистрибутивности:
a(b + c) = ab + ac, (b + c)a = ba + ca ∀ a, b, c ∈ K ;
• операция умножения ассоциативна.
В таких случаях множество K называется (ассоциативным)
кольцом. (В некоторых книгах по алгебре в определение кольца
ассоциативность умножения не включается.)
Единичный элемент относительно операции сложения в коль-
це называется нулевым и обозначается символом 0. Элемент,
обратный относительно сложения для a, называется противопо-
ложным элементу a и обозначается −a.
1)
По словам Кронекера, «Бог создал натуральные числа, все остальное
придумал человек».
15.2. Делители нуля 141

Утверждение 1. 0 · a = a · 0 = 0 ∀ a ∈ K .
Доказательство. Пусть b = −(0 · a) (элемент, противоположный
0 · a). В силу дистрибутивности, 0 · a = (0 + 0) · a = (0 · a) +
+ (0 · a). Прибавим b к обеим частям: 0 = b + (0 · a) = (b + 0 · a) +
+ (0 · a) = 0 + (0 · a)0 · a. 
Если умножение коммутативно, то K называется коммута-
тивным кольцом. Если существует единичный элемент отно-
сительно операции умножения, то кольцо называется кольцом
с единицей.
Пусть P — коммутативное кольцо с единицей, для которого
множество P \{0} относительно операции умножения является
абелевой группой. В таких случаях множество P называется
полем.
Группа P \{0} по умножению называется мультипликатив-
ной группой поля P .
Единичный элемент кольца с единицей или поля относитель-
но операции умножения обозначается обычно символом 1.
Утверждение 2. Если K — кольцо с единицей, то
(−1) · a = −a ∀ a ∈ K.
Доказательство.
0 = (1 + (−1)) · a = 1 · a + (−1) · a = a + (−a). 
Задача 1. Пусть a и b — элементы кольца с единицей e. Дока-
жите, что из обратимости элемента e − ab в данном кольце вытекает
обратимость элемента e − ba.

15.2. Делители нуля


В некоторых кольцах существуют ненулевые элементы a, b
такие, что ab = 0. Такие элементы a, b называются делителями
нуля.
Утверждение 3. В поле не может быть делителей нуля: ab = 0
⇒ a = 0 или b = 0.
Доказательство. Пусть ab = 0. Если a = 0, то утверждение
доказано. Предположим, что a = 0. Тогда для a существует
обратный элемент a−1 (a−1 a = aa−1 = 1). В силу утверждения 1
и ассоциативности умножения,
0 = a−1 · 0 = a−1 (ab) = (a−1 a) b = 1 · b = b. 
ПРИМЕРЫ:
1) K — множество четных целых чисел. Операции — сложе-
ние и умножение целых чисел. Это коммутативное кольцо
без единицы. Кольцо не имеет делителей нуля.
142 Лекция 15

2) K = Rn×n (множество всех (n × n)-матриц). Операции —


сложение и умножение матриц. Это некоммутативное коль-
цо с единицей. Кольцо имеет делители нуля. Например,
в случае n = 2 находим



1 1 1 1
1 1 −1 −1 = 0.

3) K — множество всех чисел вида a + b 2 , где a, b ∈ Q.
Операции — сложение и умножение вещественных чисел.
Ясно, что сумма чисел такого вида и их произведения
√ что K —
будут числами такого же вида. Поэтому очевидно,
коммутативное кольцо с единицей: 1 = 1 + 0 · 2 .
В данном случае K является полем: множество K\{0} от-
носительно операции умножения чисел является абелевой
группой (см. пример абелевой группы из лекции 2).

15.3. Кольцо вычетов


Напомним, что вычеты по модулю p — это специальные
подмножества целых чисел, имеющих один и тот же остаток при
делении на p (см. п. 9.3).
Зафиксируем целое число p > 1. Для любого a ∈ Z обозначим
через Z(a) множество всех целых чисел, имеющих при делении
на p такой же остаток, как и число a (сравнимых с a по моду-
лю p). Множества Z(a) называются вычетами по модулю p.
Множество всех вычетов по модулю p обозначается Zp . Всего
имеется ровно p различных вычетов по модулю p:
Zp = {Z(0), Z(1), . . . , Z(p − 1)}.
Определения операций сложения и умножения вычетов:
Z(a) + Z(b) = Z(a + b), Z(a)Z(b) = Z(ab).
Данные определения корректны в силу следующего элементар-
ного наблюдения:
Z(c + d) = Z(a + b), Z(cd) = Z(ab) ∀ c ∈ Z(a), ∀ d ∈ Z(b).
Столь же элементарно проверяется, что относительно операций
сложения и умножения множество вычетов Zp является комму-
тативным кольцом с единицей.
Теорема. В случае простого p и только в этом случае кольцо
вычетов по модулю p является полем.
15.3. Кольцо вычетов 143

Доказательство. Пусть p не является простым числом ⇒


p = ab при 1 < a, b < p ⇒ Z(a) Z(b) = Z(ab) = Z(p) = Z(0) = 0.
Значит, Zp имеет делители нуля, и, согласно утверждению 3, Zp
не может быть полем при составном p.
Теперь предположим, что p — простое число. Докажем, что
для любого вычета Z(a) при 1  a  p − 1 существует вычет
Z(b) такой, что Z(a)Z(b) = Z(1) = 1. Для этого рассмотрим числа
вида ka и их остатки от деления на p:
1 · a = pq1 + r1 , 2 · a = pq2 + r2 , . . . , (p − 1) · a = pqp−1 + rp−1 , (1)
q1 , r1 , . . . , qp−1 , rp−1 ∈ Z, 0  r1 , . . . , rp−1  p − 1.
Ни один из остатков r1 , . . . , rp−1 не равен нулю, иначе a делилось
бы на p. Кроме того, среди них нет совпадающих. Предположим,
что rk = rm . Тогда (k − m)a = p(q k − qm ). Поскольку a и p
взаимно простые, k − m делится на p.
Однако при k , m = 1, 2, . . . , p − 1 очевидно, что |k − m| < p
⇒ k − m = 0. Таким образом,
{r1 , r2 , . . . , rp−1 } = {1, 2, . . . , p − 1}. (2)
Значит, при некотором k непременно rk = 1 ⇒ Z(a) Z(rk ) =
= Z(1) = 1. 
Замечание. В проведенных рассуждениях фактически содер-
жится доказательство «малой» теоремы Ферма: если p — про-
стое число и a взаимно просто с p, то число ap−1 − 1 делится
на p. В самом деле, перемножая равенства (1) и учитывая (2),
получаем, что (p − 1)! (ap−1 − 1) делится на p. Поскольку (p − 1)!
и p взаимно просты, на p обязано делиться число ap−1 − 1.
Как видим, кольца Zp дают примеры конечных колец, а при
простом p — также примеры конечных полей (т. е. колец и полей
с конечным числом элементов).
Конечные поля играют важную роль в прикладных вопросах
математики — например, в теории кодирования. В частности, ко-
ды Хэмминга, позволяющие обнаруживать и исправлять ошибки
при передаче информации, представляют собой решения однород-
ной системы уравнений Ax = 0, где A ∈ P m×n , x ∈ P n и P = Z2 .
Если m = 3 и n = 7, то P m содержит ровно 23 − 1 ненулевых
векторов — из них составляются столбцы матрицы A ⇒
фундаментальная система решений содержит 4 вектора. Кодиро-
вание происходит таким образом: 4-битовое слово (c1 , c2 , c3 , c4 ),
ci ∈ Z2 , кодируется 7-битовым словом x, получаемым как ли-
нейная комбинация фиксированных векторов фундаментальной
системы с коэффициентами c1 , c2 , c3 , c4 . Замечательно то, что
144 Лекция 15

ошибка в произвольном — но только одном! — значении xi легко


обнаруживается: достаточно проверить равенство Ax = 0. Более
того, любая такая ошибка легко исправляется!
В криптографии кольца вычетов используются как множе-
ства, на которых определяются шифрующие функции. Вот за-
мечательный пример: x → y = xe и x, xe ∈ Zn . Данный шифр,
появившийся в 1977 г. и названный RSA 1), определяется на-
туральными числами n и e, где n = pq — произведение двух
разных простых чисел p, q > 2, а e взаимно просто с числом
m = (p − 1)(q − 1). Нетрудно доказать, что при данных предпо-
ложениях существует натуральное число d такое, что ed имеет
остаток 1 при делении на m. Отсюда вытекает следующее прави-
ло дешифрования: x = y d . Зная n и e, легко проводить шифрова-
ние. Но для дешифровки нужно знать d. Конечно, d определяется
по n и e — но если p и q держатся в секрете, то получение d при
больших n оказывается алгоритмически очень трудной задачей
(сводящейся к разложению n на простые множители).
Задача 1. Докажите, что любое конечное коммутативное кольцо
без делителей нуля является полем.

15.4. Вложения и изоморфизмы


Пусть M — непустое подмножество в K . Если K — кольцо,
то M называется его подкольцом, если оно является кольцом
относительно операций, действующих в K . Если K — поле, то M
называется его подполем, если оно является полем относительно
тех же операций, которые действуют в K . В таких случаях
говорят, что M вложено в K , или K является расширением
кольца (поля) M .
В различных построениях могут возникать кольца или по-
ля, неразличимые с точки зрения свойств действующих в них
операций. Одинаковость свойств операций в L и M означает
существование взаимно-однозначного отображения Φ : L → M ,
сохраняющего операции:
Φ(a + b) = Φ(a) + Φ)b), Φ(ab) = Φ(a) Φ(b) ∀ a, b ∈ L.
Такое отображение Φ называется изоморфизмом, а L и M —
изоморфными.

1)
По заглавным буквам фамилий трех его авторов: R. L. Rivest, A. Shamir,
L. Adleman.
15.5. Число элементов в конечном поле 145

Обычно K называют расширением кольца (поля) L и в тех


случаях, когда L изоморфно некоторому его подкольцу (подпо-
лю) M .
Пусть 1 — единичный элемент поля P . Рассмотрим суммы,
состоящие из p слагаемых, вида
p · 1 = 1 + . . . + 1.
Подчеркнем, что правая часть есть определение выражения p · 1
(p не является элементом нашего поля и, стало быть, речь не
идет об умножении двух элементов поля). Минимальное p такое,
что p · 1 = 0, называется характеристикой поля P . Говорят, что
поле имеет характеристику 0, если p · 1 = 0 при всех p  1.

Утверждение 1. Если поле имеет характеристику p  1, то


число p простое.
Доказательство. Предположим, от противного, что p = mk .
Тогда 0 = (mk) · 1 = (m · 1)(k · 1). Это невозможно, так как в
поле не бывает делителей нуля. 

Утверждение 2. Любое поле характеристики p  1 может


рассматриваться как расширение поля вычетов Zp .
Доказательство. В поле характеристики p имеется по крайней
мере p различных элементов вида k · 1, k = 1, . . . , p. Лег-
ко проверяется, что составленное из них множество является
подполем. Изоморфизм данного подполя с Zp устанавливается
отображением Φ(k · 1) = Z(k). 
Следствие. Любое конечное поле может рассматриваться как
расширение некоторого поля вычетов.
Задача 1. Пусть P — числовое поле и при этом R ⊂ P ⊂ C.
Докажите, что P = R либо P = C.
Задача 2. Найдите все поля, вложенные в поле Q.

15.5. Число элементов в конечном поле


Утверждение 3. В конечном поле число элементов обяза-
тельно имеет вид n = pm , где p — простое, m — натуральное
число.
Доказательство. Если p — характеристика конечного поля F ,
то, согласно утверждению 2, F является расширением поля вы-
четов по простому модулю p: Zp ⊂ F . По аналогии с нашими ис-
следованиями в случае вещественного линейного пространства,
элементы a1 , . . . , am ∈ F назовем линейно независимыми над
146 Лекция 15

Zp , если из равенства α1 a1 + . . . + αm am = 0 с коэффициентами


α1 , . . . , αm ∈ Zp вытекает, что α1 = . . . = αm = 0. Пусть m —
максимально возможное число элементов, линейно независимых
над Zp . Тогда любой элемент v ∈ F имеет вид
v = α1 a1 + . . . + αm am , α1 , . . . , αm ∈ Zp .
Для каждого из коэффициентов αi возможно p различных зна-
чений ⇒ n = pm . 

Конечные поля принято называть также полями Галуа. Мы


доказали, что для существования поля Галуа необходимо, чтобы
число его элементов имело вид n = pm . Но существуют ли
поля Галуа для произвольного n такого вида? Ответ положитель-
ный, но на конструировании таких полей мы останавливаться
не будем.
Задача 1. Докажите существование поля из четырех элементов.

15.6. Поле частных


Теорема. Любое коммутативное кольцо без делителей ну-
ля может быть вложено в поле.
Доказательство. Пусть K — коммутативное кольцо без делите-
лей нуля. Чтобы расширить его до поля, рассмотрим формальные
частные вида a/b, где a, b ∈ K и b = 0. Назовем формальные
a c
частные и равными, если ad = bc. Данное отношение равен-
b d a a
ства является, очевидно, рефлексивным ( = ) и симметрич-
b b
ным. Но оно также транзитивно. В самом деле,
a c c p
= ⇔ ad = bc, = ⇔ cq = dp.
b d d q
Отсюда (aq − bp)(cd) = 0 и, в силу отсутствия делителей нуля,
aq − bp = 0 ⇒ a p
aq = bp ⇔ = .
b q
Следовательно, отношение равенства является на множестве все-
возможных формальных частных отношением эквивалентности.
Поэтому все множество формальных частных разбивается на
непересекающиеся
a классы эквивалентности.
Пусть K обозначает класс эквивалентности, порождае-
b a
мый формальным частным . Как мы уже знаем, класс эквива-
b
лентности однозначно определяется любым своим представите-
15.6. Поле частных 147

c
a c a
лем: если ∈ K , то K =K ; поэтому традиционно
d b d b
он отождествляется с любым своим представителем.
Операции сложения и умножения классов эквивалентности
формальных частных определим по аналогии с заданием опера-
ций для рациональных чисел:
a c ad + bc a c
ac
K +K =K , K ) K( =K .
b d bd b d bd
Проверка того, что результаты этих операций не зависят a от вы-

c
бора представителей в классах эквивалентности K иK ,
b d
осуществляется вполне рутинным образом.
Легко видеть, что множество формальных
a частных есть ком-
0
мутативное кольцо с единицей 1 = K . При этом 0 = K .
a a a
Любой ненулевой элемент имеет вид K , где a = 0. Очевидно,
b b
что элемент K будет к нему обратным.
a a
Итак, множество классов K есть поле. Почему оно мо-
b
жет считаться расширением кольца K ? Рассмотрим взаимно-
ac
однозначное соответствие a ↔ K и заметим, что оно
c
сохраняет операции:
ac bc ac bc
a+b ↔ K +K , ab ↔ K K .
c c c c
Остается договориться об отождествлении
ac элемента a ∈ K с
классом эквивалентности K (конечно, не зависящим от
c
выбора c = 0). 
Построенное поле формальных частных является минималь-
ным полем, содержащим K , — в том смысле, что любое поле,
содержащее K , должно содержать и данное поле частных (это
очевидно — вместе с любыми двумя элементами поле содержит
также их частное).
Л е к ц и я 16

16.1. Линейные пространства над полем


Пусть P — произвольное поле, элементы которого называ-
ются числами, и V — непустое множество, элементы которого
называются векторами.
Предположим, что на V определены две операции: сложение
векторов и умножение векторов на числа (элементы из поля P ),
и пусть эти операции удовлетворяют тем же требованиям (ак-
сиомам), которые были сформулированы при определении веще-
ственного линейного пространства — с тем только отличием, что
всюду под числом подразумевается элемент из поля P . В таких
случаях V называется линейным пространством над полем P
или векторным пространством над полем P .
Понятия линейной зависимости и независимости векторов
линейного пространства над полем P вводятся так же, как
и в случае вещественного линейного пространства. Точно так
же вводятся понятия линейной оболочки, базиса, размерности,
подпространства (суммы подпространств, пересечения и т. д.).
Сохраняются все факты, полученные ранее при исследовании
этих понятий.
Заметим, что иногда одно и то же множество векторов V
можно рассматривать как линейное пространство над разными
полями. Соответствующие линейные пространства должны счи-
таться разными.
ПРИМЕРЫ:
1) V — множество комплексных чисел (в роли векторов),
P = R — поле вещественных чисел. Сложение векторов
определяется как сложение комплексных чисел. Операция
умножения векторов на числа из поля R определяется как
умножение двух чисел — комплексного и вещественного.
Это конечномерное линейное пространство над полем R.
Как легко видеть, dim V = 2.
2) V — множество комплексных чисел, P = Q — поле ра-
циональных чисел. Сложение векторов определяется как
16.1. Линейные пространства над полем 149

сложение комплексных чисел. Операция умножения векто-


ров на числа из поля Q определяется как умножение двух
чисел — комплексного и рационального.
Данное линейное пространство является бесконечномер-
ным. Возьмем, например, простые числа 1 < p1 < . . . < pn и
в качестве векторов из V рассмотрим логарифмы log p1 , . . .
. . . , log pn . Пусть

α1 log p1 + . . . + αn log pn = 0, αi = si /ti , si , ti ∈ Z.

Умножив обе части линейной комбинации на произведение


знаменателей t = t1 · . . . · tn , уже для целых коэффициентов
βi = αi t находим

β1 log p1 + . . . + βn log pn = 0 ⇒

⇒ log(pβ1 1 . . . pβnn ) = 0 ⇒ pβ1 1 . . . pβnn = 1.

Предположим, что не все βi равны нулю. Тогда среди них


имеются как положительные, так и отрицательные. Если
βi βi
βi1 , . . . , βik > 0 и βj < 0, то целое число pi1 1 . . . pik k должно
делиться на pj . Ясно, что этого быть не может, поэтому

β1 = ... = βn = 0 ⇒ α1 = ... = αn = 0.

Таким образом, для любого n предъявлена линейно неза-


висимая система из n векторов.
3) V — множество (m × n)-матриц с элементами из про-
извольного поля P . Обозначение: V = P m×n . Сложение
векторов — это сложение матриц: [aij ] + [bij ] = [aij + bij ].
Умножение вектора на число α ∈ P определяется как умно-
жение матрицы на число: α[aij ] = [α aij ]. В данном случае
V — конечномерное линейное пространство над полем P ;
dim V = mn.
Задача 1. Докажите линейную независимость функций sin x,
sin 2x, sin 3x, . . . , sin nx как элементов вещественного линейного про-
странства функций на произвольном заданном отрезке [a, b].
Задача 2. Докажите, что группа целых чисел с операцией сложе-
ния не может быть аддитивной группой линейного пространства над
каким-либо полем.
Задача 3. Существует ли линейное пространство из 10 векторов?
150 Лекция 16

16.2. Многочлены над полем


Многочлены от x над полем P — это формальные выражения
вида

p(x) = a0 + a1 x + . . . + an xn , a0 , a1 , . . . , an ∈ P. (∗)

В данном случае x — всего лишь символ. Если an = 0,


то говорят, что p(x) — многочлен степени n. Обозначение:
deg p(x) = n. Многочлены нулевой степени называются констан-
тами и обычно отождествляются с элементами поля P . Много-
член, все коэффициенты которого равны 0, называется нулевым.
Для нулевого многочлена степень не определена.
Конечно, можно было бы, как и в случае вещественных
коэффициентов, рассматривать p(x) как функцию от x ∈ P .
Мы не делаем это по следующей причине. Пусть, например,
P = Z2 = {0, 1}. Тогда x = x2 ∀ x ∈ Z2 . Как видим, мно-
гочлены с разными коэффициентами могут оказаться равными
как функции, а нам все же кажется полезным иметь такое
определение, при котором они будут различными.
Итак, в случае произвольного поля P мы рассматриваем мно-
гочлены именно как формальные выражения от какой-то буквы.
При использовании буквы x множество всех многочленов любых
степеней обозначается через P [x].
Определение. Будем говорить, что многочлен p(x) вида (∗)
имеет коэффициент ai при степени xi для всех i от 0 до n и ко-
эффициент 0 при любой степени xi , где i  n + 1. Многочлены от
x над полем P называются равными, если они имеют одинаковые
коэффициенты при одинаковых степенях x.
Таким образом, многочлены x и x2 над полем Z2 считаются
различными (хотя и совпадают как функции от x ∈ Z2 ).
Рассмотрим два многочлена из множества P [x]:

p(x) = a0 + a1 x + . . . + anp xnp , ai = 0 при i  np + 1,

q(x) = b0 + b1 x + . . . + bnq xnq , bi = 0 при i  nq + 1.

Суммой многочленов называется многочлен p(x) + q(x) = s0 +


+ s1 x + . . . , в котором коэффициент при xi равен

si = ai + bi , i  0.
16.3. Кольцо многочленов 151

Произведением многочленов называется многочлен p(x) q(x) =


= t0 + t1 x + . . . , в котором коэффициент при xi равен

i
ti = ak bl , i  0.
k+l=i
Именно такой многочлен получится, если привычным способом
раскрыть скобки и привести подобные члены в выражении
(a0 + a1 x + . . . + anp xnp )(b0 + b1 x + . . . + bnq xnq ) = (a0 b0 ) +
+ (a1 b0 + a0 b1 )x + (a2 b0 + a1 b1 + a0 b2 )x2 + . . .
. . . + (anp bnq )xnp +nq .
Важное (хотя и очевидное) наблюдение:
deg(p(x) q(x)) = deg p(x) + deg q(x). (#)

16.3. Кольцо многочленов


Утверждение. Множество многочленов P [x] относительно
операций сложения и умножения многочленов является ком-
мутативным кольцом с единицей. Делителей нуля в P [x] нет.
Доказательство. Ввиду очевидности того, что сложение превра-
щает P [x] в абелеву группу, перейдем сразу к изучению свойств
операции умножения. Наряду с p(x) и q(x), рассмотрим еще один
многочлен
r(x) = c0 + c1 x + . . . + cnr xnr , ci = 0 при i  nr + 1.
Пусть (p(x)q(x))r(x) = u0 + u1 x + . . . ; p(x)(q(x)r(x)) = v0 +
+ v1 x + . . . Тогда, согласно определению операции умножения,

  
ui = ak bl cm = ak bl cm =
j+m=i k+l=j k+l+m=i

 
= ak bl c m = vi .
k+j=i l+m=j

Таким образом, умножение многочленов ассоциативно. Дис-


трибутивность проверяется очевидным образом. Коммутатив-
ность умножения также очевидна. Роль единицы выполняет мно-
гочлен 1. Отсутствие делителей нуля вытекает из свойства (#).

152 Лекция 16

Заметим, что P [x] можно рассматривать и как линейное


пространство над полем P (сложение векторов определяется
как сложение многочленов, умножение векторов на элементы
поля P — как умножение многочленов на нулевой многочлен
и многочлены нулевой степени, отождествляемые с элементами
поля P ).
Линейное пространство P [x] бесконечномерно (при опреде-
лении многочлена как формальной суммы одночленов линейная
независимость любой системы одночленов с разными степенями
очевидна). Множество многочленов Pn [x] степени n или ниже
является подпространством размерности n + 1.

16.4. Деление с остатком


Утверждение. Для любой пары многочленов f (x), g(x) ∈ P [x]
в случае g(x) = 0 существуют и единственны многочлены
q(x), r(x) ∈ P [x] такие, что
f (x) = g(x)q(x) + r(x), deg r(x) < deg g(x) либо r(x) = 0. (∗)
Доказательство. Пусть f (x)=an xn + . . . +a0 , g(x) = bm xm + . . .
. . . + b0 , причем bm = 0. Если deg f (x) < deg g(x), то существо-
вание доказано: q(x) = 0 и r(x) = f (x). Если deg f (x)  deg g(x),
то положим
a
n n−m
f1 (x) = f (x) − x g(x) ⇒
bm
⇒ deg f1 (x) < deg f (x) либо f1 (x) = 0.
Воспользуемся индукцией по степени f (x). Если уже найдено
представление
f1 (x) = g(x)q1 (x) + r1 (x), deg r1 (x) < deg g(x) либо r1 (x) = 0,
то (∗) получается при выборе
an n−m
q(x) = x + q1 (x), r(x) = r1 (x).
bm
Докажем единственность. Пусть имеется еще одна пара мно-
гочленов q(x) и r(x), удовлетворяющих соотношению (∗). Тогда
−g(x)(q(x) − q(x)) = r(x) − r(x).
Если q(x) − q(x) = 0, то степень многочлена в левой части не
меньше степени g(x) ⇒ deg(r(x) − r(x))  deg g(x). Это
невозможно, потому что при вычитании многочленов степень
16.5. Наибольший общий делитель 153

результата не выше степени каждого из них ⇒ q(x) = q(x)


⇒ r(x) = r(x). 
Многочлен r(x) из равенства (∗) называется остатком,
а q(x) — неполным частным при делении многочлена f (x) на
g(x) = 0. Если r(x) = 0, то говорят, что f (x) делится на g(x)
или g(x) является делителем многочлена f (x).

16.5. Наибольший общий делитель


Пусть многочлен d(x) ∈ P [x] является общим делителем мно-
гочленов f (x) и g(x) из P [x]. Он называется наибольшим общим
делителем, если любой общий делитель этих многочленов яв-
ляется также и его делителем. Обозначение: d(x) = (f (x), g(x)).
Многочлены называются взаимно простыми над полем P , если
их наибольший общий делитель имеет нулевую степень.
Из определения ясно, что наибольший общий делитель мно-
гочленов определен однозначно с точностью до ненулевого мно-
жителя (многочлена нулевой степени), принадлежащего полю P .
В случае взаимно простых многочленов f (x) и g(x) всегда можно
считать, что (f (x), g(x)) = 1.
Предположим, что deg f (x)  deg g(x). Наибольший общий
делитель многочленов f (x) и g(x) можно найти с помощью
алгоритма Евклида, представляющего собой цепочку делений
с остатком следующего вида:
f (x) = g(x)q1 (x) + r1 (x), deg r1 (x) < deg g(x),
g(x) = r1 (x)q2 (x) + r2 (x), deg r2 (x) < deg r1 (x),
r1 (x) = r2 (x)q3 (x) + r3 (x), deg r3 (x) < deg r2 (x),
.........................................
rk−2 (x) = rk−1 (x)qk (x) + rk (x), deg rk (x) < deg rk−1 (x),
rk−1 (x) = rk (x)qk+1 (x).
При последовательном делении с остатком степень остатка по-
нижается на каждом шаге. В данной цепочке rk (x) — последний
ненулевой остаток.
Утверждение. rk (x) = (f (x), g(x)).
Доказательство. Просматривая данные равенства снизу вверх,
легко убедиться в том, что rk (x) является общим делителем

многочленов f (x) и g(x). Пусть d(x) — любой общий делитель
для f (x) и g(x). Просматривая те же равенства сверху вниз,
154 Лекция 16

 является делителем для rk (x). Следовательно,


получаем, что d(x)
rk (x) = (f (x), g(x)). 
Теорема о наибольшем общем делителе. Для любых многочле-
нов f (x), g(x) ∈ P [x] существуют многочлены ϕ(x), ψ(x) ∈ P [x]
такие, что
f (x)ϕ(x) + g(x)ψ(x) = d(x), d(x) = (f (x), g(x)).

Доказательство. Искомые многочлены конструктивно получа-


ются на основе алгоритма Евклида. Если уже получены равен-
ства
ri−2 (x) = f (x) ϕi−2 (x) + g(x) ψi−2 (x),
ri−1 (x) = f (x) ϕi−1 (x) + g(x) ψi−1 (x),
то из них нетрудно вывести, что ri (x) = f (x) ϕi (x) + g(x) ψi (x),
где
ϕi (x) = ϕi−2 (x) − ϕi−1 (x) qi (x), ψi (x) = ψi−2 (x) − ψi−1 (x) qi (x).
Требуемое равенство получается при i = k . 
Следствие. Для взаимно простых многочленов f (x), g(x) ∈
∈ P [x] существуют многочлены ϕ(x), ψ(x) ∈ P [x] такие, что
f (x) ϕ(x) + g(x) ψ(x) = 1.
Замечание. Любой ненулевой многочлен вида f (x)ϕ(x) +
+ g(x)ψ(x) делится на d(x) = (f (x), g(x)) (поэтому, в частности,
его степень не меньше степени d(x)).

16.6. Значения многочлена и корни


Пусть f (x) = a0 + a1 x + . . . + an xn ∈ P [x] и ϑ ∈ P . Определим
f (ϑ) естественным образом: f (ϑ) = a0 + a1 ϑ + . . . + an ϑn . Число
f (ϑ) ∈ P называется значением многочлена f (x) при x = ϑ.
Элемент ϑ называется корнем многочлена f (x), если f (ϑ) = 0.
Теорема Безу. Если f (x) ∈ P [x] и f (ϑ) = 0 для некоторого
ϑ ∈ P , то f (x) делится на x − ϑ. 1)
Доказательство. Выполнив деление с остатком, находим f (x) =
= (x − ϑ)q(x) + r(x), где r(x) = 0 либо deg r(x) = 0. Если
r(x) = 0, то все доказано. Случай deg r(x) = 0 ведет к противо-
речию: 0 = f (ϑ) = (ϑ − ϑ) q(ϑ) + r(ϑ) = r(ϑ) ⇒ r(x) = 0. В то

1)
Данное предложение обычно приводится в качестве главного следствия
из теоремы Безу — утверждения о том, что r(ϑ) = f (ϑ) для остатка r(x) от
деления f (x) на x − ϑ.
16.7. Присоединение корня 155

же время, согласно нашим определениям, многочлен нулевой


степени не может быть равен нулевому многочлену. 
Ненулевой многочлен f (x) ∈ P [x] называется разложимым
над P , если существуют многочлены ненулевой степени
p(x), q(x) ∈ P [x] такие, что f (x) = p(x)q(x). В противном случае
многочлен f (x) называется неразложимым или неприводимым
над P .
Из теоремы Безу вытекает, что неразложимый над P много-
член степени 2 и выше не может иметь корней из P , а произ-
вольный многочлен степени n над P не может иметь более n
корней.
Задача 1. Докажите, что над любым конечным полем существует
бесконечно много неразложимых многочленов.
Задача 2. Докажите, что для многочленов над полем вычетов Zp
по простому модулю p имеет место равенство (z − 1)p = z p − 1.

16.7. Присоединение корня


Нередко приходится рассматривать многочлены над полем P ,
не имеющие корней из P . Такие многочлены могут, тем не менее,
иметь корень в каком-либо расширении F поля P . Элемент ϑ ∈ F
называется алгебраическим над полем P , если он является кор-
нем многочлена над P . Многочлен над P минимальной степени
с корнем ϑ называется минимальным многочленом для ϑ над
полем P .
Будем рассматривать только такие расширения поля P , кото-
рые вложены в F . Пусть ϑ ∈ F . Поле называется минимальным
ϑ-расширением поля P , если оно содержит ϑ и вложено в любое
поле, содержащее P и ϑ. Обозначение: P (ϑ).
В более общем случае, если ϑ1 , . . . , ϑk ∈ F , то через P (ϑ1 , . . .
. . . , ϑk ) обозначается минимальное поле, содержащее P и элемен-
ты ϑ1 , . . . , ϑk . Минимальность означает, что данное поле вложено
в любое поле, содержащее P и ϑ1 , . . . , ϑk .
Если ϑ ∈ / P , то говорят, что поле P (ϑ) получено из P при-
соединением элемента ϑ. Расширение такого типа называется
простым алгебраическим, если ϑ является корнем некоторого
многочлена из P [x].

Теорема о присоединении корня. Минимальный многочлен


для ϑ определяется однозначно с точностью до ненуле-
156 Лекция 16

вого множителя. Если n — его степень, то минимальное


ϑ-расширение поля P имеет вид
P (ϑ)={s∈F : s=a0 +a1 ϑ+ . . . +an−1 ϑn−1, a0 , a1 , . . . , an−1 ∈P }. (∗)
Доказательство. Предположим, что f (x) и g(x) — два мини-
мальных многочлена для ϑ (оба степени n). Тогда их наибольший
общий делитель d(x) ∈ P [x] имеет вид
d(x) = f (x)ϕ(x) + g(x)ψ(x), где ϕ(x), ψ(x) ∈ P [x].
Отсюда d(ϑ) = 0. Поэтому deg d(x) = n ⇒ каждый из
многочленов f (x) и g(x) отличается от d(x) лишь ненулевым
множителем.
Обозначим через M множество, определенное правой ча-
стью (∗). Очевидно, что M ⊂ P (ϑ). Поэтому остается только
доказать, что M — подполе.
Возьмем произвольный многочлен p(x) над полем P и заме-
тим, что p(ϑ) ∈ M . Для доказательства разделим p(x) с остатком
на минимальный многочлен f (x):
p(x) = f (x)q(x) + r(x) ⇒ p(ϑ) = r(ϑ).
Ясно, что r(ϑ) есть сумма элементов 1, ϑ, . . . , ϑn−1 с коэффи-
циентами из поля P . Поэтому r(ϑ) ∈ M .
Произведение двух элементов из M является, очевидно, зна-
чением некоторого многочлена p(x) ∈ P [x] при x = ϑ. Поэтому
оно принадлежит M . Далее, любой элемент из M имеет вид
p(ϑ), где многочлен p(x) ∈ P [x] имеет степень не выше n − 1.
Пусть p(x) = 0. Многочлен f (x), очевидно, неразложим, поэто-
му многочлены p(x) и f (x) взаимно просты. По следствию из
теоремы о наибольшем общем делителе, существуют многочлены
ϕ(x), ψ(x) ∈ P [x] такие, что
f (x)ϕ(x) + p(x)ψ(x) = 1 ⇒ p(ϑ)ψ(ϑ) = 1. 

Задача 1. Поле P — минимальное


√ числовое поле, содержащее по-
5
ле рациональных чисел Q и 2. Докажите, что поле P есть линейное
пространство над полем Q, и найдите его размерность.
√ √
Задача 2. Докажите, что квадратные корни p1 , . . . , pn из про-
стых чисел p1 < . . . < pn линейно независимы как элементы линейного
пространства вещественных чисел над полем рациональных чисел.
Л е к ц и я 17

17.1. Комплексные многочлены


Замечательно, что в наиболее интересных случаях, а именно
для комплексных многочленов (многочленов с комплексными
коэффициентами), можно получить точное утверждение о суще-
ствовании корней: любой многочлен степени n > 1 имеет корень,
являющийся комплексным числом. Данное утверждение тради-
ционно называется основной теоремой алгебры.
Оно занимает действительно особое место в ряде разделов
математики — многие из них имеют свои собственные доказа-
тельства этой теоремы. Все известные доказательства в той или
иной мере используют понятие непрерывности. Мы изложим
доказательство, основанное на методе Даламбера 1) и требующее
от нас наименьшей подготовительной работы.
Мы будем рассматривать многочлен f (z) ∈ C[z] как функцию
от z ∈ C. При этом равенство многочленов как функций влечет за
собой также их равенство как формальных выражений от степе-
ней буквы z . Для доказательства можно практически повторить
рассуждение, проведенное в случае вещественных многочленов.
А можно это сделать и так: из теоремы Безу ясно, что многочлен
степени n не может иметь более чем n корней; если f (z) = g(z)
для всех z , то многочлен f (z) − g(z) имеет бесконечно много
корней, поэтому он обязан быть нулевым многочленом.

17.2. Последовательности комплексных чисел


Пусть задана последовательность комплексных чисел zk ,
k = 1, 2, . . . Она называется сходящейся к точке z0 , если для лю-
бого ε > 0 существует номер N = N (ε) такой, что для всех k  N
выполняется неравенство |zk − z0 |  ε. (Согласно определению,
понятие сходимости для комплексных последовательностей сво-
1)
Заметим, что Даламбер не мог дать полного доказательства, так как в его
время не было строгого понятия непрерывной функции.
158 Лекция 17

дится к сходимости к нулю вещественной последовательности


|zk − z|.) Обозначение: lim zk = z0 или zk → z0 .
k→∞
Теорема Больцано–Вейерштрасса. Для произвольной после-
довательности zk точек прямоугольника Π = [A, B] × [C , D]
существует подпоследовательность zki , сходящаяся к неко-
торой точке z0 ∈ Π.
Доказательство. Запишем zk = xk + i yk , xk , yk ∈ R. Очевид-
но, что xk ∈ [A, B] и yk ∈ [C , D]. В силу теоремы Больцано–
Вейерштрасса для вещественных последовательностей на от-
резке, существует подпоследовательность xki , сходящаяся к
вещественному числу x0 ∈ [A, B]. Рассмотрим соответствую-
щую подпоследовательность точек zki = xki + i yki . Посколь-
ку yki ∈ [C , D], по той же причине найдется подпоследователь-
ность ykij , сходящаяся к вещественному числу y0 ∈ [C , D]. При
этом xkij → x0 (как подпоследовательность сходящейся последо-
вательности). Пусть z0 = x0 + i y0 . Тогда
|zkij − z0 |  |xkij − x0 | + |ykij − y0 | → 0. 

17.3. Непрерывные функции на комплексной


плоскости
Рассмотрим функцию Φ(z), определенную при всех z ∈ C
и принимающую вещественные значения. Функция Φ(z) назы-
вается непрерывной в точке z0 , если для для любой последо-
вательности zk , сходящейся к z0 , последовательность значений
Φ(zk ) сходится к Φ(z0 ).
Теорема Вейерштрасса. Пусть функция Φ(z) непрерывна во
всех точках прямоугольника Π = [A, B] × [C , D]. Тогда суще-
ствуют точки z∗ , z ∗ ∈ Π такие, что
Φ(z∗ )  Φ(z)  Φ(z ∗ ) ∀z ∈ Π.
Доказательство. Докажем существование точки z ∗ . Прежде
всего убедимся в том, что функция Φ(z) ограничена сверху.
Если это не так, то существует последовательность zk со свой-
ством Φ(zk ) > k . По теореме Больцано–Вейерштрасса она обла-
дает сходящейся подпоследовательностью zki → z0 ∈ Π. В силу
непрерывности Φ(zki ) → Φ(z0 ), а это противоречит неравенствам
Φ(zki ) > ki , выполняющимся при всех ki . Поэтому существует
вещественное число M такое, что Φ(z)  M для всех z ∈ Π.
Число M называется верхней гранью для Φ(z).
17.4. Свойства модуля многочлена 159

Рассмотрим множество вещественных чисел Φ(Π) = {x : x =


= Φ(z), z ∈ Π}. Поскольку оно ограничено сверху, то для него
существует точная верхняя грань M ∗ — такая верхняя грань,
которая либо принадлежит множеству, либо к ней сходится
некоторая последовательность отличных от нее чисел из данного
множества. 1) Итак, пусть zk ∈ Π и Φ(zk ) → M ∗ . По теоре-
ме Больцано–Вейерштрасса имеется подпоследовательность zki ,
сходящаяся к некоторой точке z ∗ ∈ Π. В силу непрерывности
M ∗ = lim Φ(zki ) = Φ(z ∗ ).
k→∞
Очевидно, что функция Ψ(z) = −Φ(z) ограничена сверху то-
гда и только тогда, когда Φ(z) ограничена снизу. Значит, нами
доказано также существование нижней грани для Φ(z). Опирась
на уже доказанное утверждение, заключаем, что для Ψ(z) су-
ществует точка z∗ ∈ Π такая, что Ψ(z)  Ψ(z∗ ) для всех z ∈ Π.
Отсюда Φ(z∗ )  Φ(z) для всех z ∈ Π. 

17.4. Свойства модуля многочлена


Рассмотрим произвольный многочлен
f (z) = a0 + a1 z + . . . + an−1 z n−1 + z n (#)
с комплекными коэффициентами и старшим коэффициентом
an = 1, n  1.
Лемма о непрерывности модуля многочлена. Функция Φ(z) =
= |f (z)| непрерывна при всех z ∈ C.
Доказательство. Для доказательства непрерывности Φ(z) в
точке z = z0 достаточно установить непрерывность функции
Φ(z0 + h) от h ∈ C в точке h = 0. Ясно, что f (z0 + h) есть
многочлен от h:
f (z0 + h) = b0 + b1 h + . . . + bn−1 hn−1 + hn , где b0 = f (z0 ).
Отсюда находим
|Φ(z0 + h) − Φ(z0 )| = ||f (z0 + h)| − |f (z0 )||  |f (z0 + h) −
− f (z0 )|  |b1 h + . . . + bn−1 hn−1 + hn |  |b1 ||h| + . . .
. . . + |bn−1 ||h|n−1 + |h|n . 
Лемма о росте модуля многочлена. Для любого числа M > 0
существует R > 0 такое, что если |z|  R, то |f (z)|  M .
1)
Данный факт доказывается в курсе математического анализа.
160 Лекция 17

Доказательство. Учитывая, что |z i | = |z|i , получаем


|f (z)|  |z n | − |a0 + a1 z + . . . + an−1 z n−1 | 
 |z|n − |a0 | − |a1 ||z| − . . . − |an−1 ||z|n−1 .
Обозначим через A максимальное из чисел |a0 |, . . . , |an−1 |. Тогда
при |z|  1 находим
 
nA
|f (z)|  |z| 1 −
n
.
|z|
Для любого заданного M > 0 положим

n
R = max{1, 2nA, 2M }.
Легко видеть, что если |z|  R, то
nA
2M
|f (z)|  Rn 1 − = R n /2  = M. 
2nA 2

17.5. Основная теорема алгебры


Пусть f (z) — произвольный многочлен вида (#).
Лемма Даламбера. Если в некоторой точке z ∈ C выполняет-
ся неравенство |f (z)| > 0, то найдется h ∈ C такое, что
|f (z + h)| < |f (z)|.
Доказательство. Утверждение очевидно в случае n = 1. По-
этому предположим, что n  2. Фиксируем z ∈ C и рассмотрим
f (z + h) как многочлен от h:
f (z + h) = f (z) + b1 h + . . . + bn−1 hn−1 + hn .
Пусть bm — первый ненулевой коэффициент (⇒ b1 = . . . = bm−1 =
= 0). Тогда
f (z + h) = f (z) + bm hm + g(h)hm+1 ,
g(h) = bm+1 + . . . + bn−1 hn−m−2 + hn−m−1 .
Определим комплексное число ζ равенством ζ m = −f (z)/bm
и будем искать h в виде
h = ζt, t > 0.
Ясно, что
|f (z) + bm hm | = |f (z)(1 − tm )| =
= |f (z)|(1 − tm ) < |f (z)| при t > 0.
17.6. Разложение комплексных многочленов 161

При этом на отрезке 0  t  1 для некоторого B > 0 имеем


|g(ζt) (ζt)m+1 |  Btm+1 .
Следовательно, если 0 < t  1, то
|f (z + ζt)|  |f (z)|(1 − tm ) + Btm+1 = |f (z)| + (Bt − |f (z)|) tm.
При 0 < t < min(1, |f (z)|/B) получаем: |f (z + ζt)| < |f (z)|.

Основная теорема алгебры. Любой многочлен с комплексны-
ми коэффициентами степени выше нулевой имеет хотя бы
один комплексный корень.
Доказательство. Пусть M = |f (0)|. Если M = 0, то все доказа-
но. Предположим, что M > 0. Cогласно лемме о росте модуля
многочлена, при всех |z|  R имеем: |f (z)|  M . Рассмотрим
квадрат Π = [−R, R] × [−R, R]. Функция |f (z)| непрерывна при
всех z ∈ C и, в частности, при всех z ∈ Π. По теореме Вейер-
штрасса существует z∗ ∈ Π такое, что |f (z∗ )|  |f (z)| при всех
z ∈ Π. Очевидно, что |f (z∗ )|  M и, кроме того, M  |f (z)| для
любых точек z ∈/Π ⇒
|f (z∗ )|  |f (z)| ∀ z ∈ C. (∗)
Если |f (z∗ )| > 0, то по лемме Даламбера при некотором h ∈ C
получаем: |f (z∗ + h)| < |f (z)|, что противоречит неравенствам
(∗). Таким образом, |f (z∗ )| = 0 ⇒ f (z∗ ) = 0. 

17.6. Разложение комплексных многочленов


Многочлены первой степени называют также линейными
многочленами.
Теорема. Любой комплексный многочлен f (z) степени n > 0
разлагается в C[z] на n линейных множителей:
f (z) = a (z − z1 ) · . . . · (z − zn ), a, z1 , . . . , zn ∈ C. (∗)
Данное разложение единственно с точностью до порядка со-
множителей.
Доказательство. По основной теореме алгебры f (z) имеет хотя
бы один комплексный корень — пусть это будет z1 . Согласно
теореме Безу многочлен f (z) делится на линейный многочлен
z − z1 : f (z) = (z − z1 )f1 (z). Если deg f1 (z) = 0, то искомое раз-
ложение уже получено. Если deg f1 (z) > 0, то и этот многочлен
имеет хотя бы один корень — пусть это будет z2 . Таким образом,
f (z) = (z − z1 )(z − z2 )f2 (z). Если deg f2 (z) = 0, то разложение
6 Е. Е. Тыртышников
162 Лекция 17

получено. Если нет, то f2 (z) также имеет комплексный корень,


и т. д. Ясно, что число a равно старшему коэффициенту много-
члена f (z).
Теперь предположим, что имеются два разложения:
f (z) = a (z − z1 ) · . . . · (z − zn ) = 
a (z − z1 ) · . . . · (z − zm ).
Степень многочлена в правой части, очевидно, равна m ⇒
m = n. Кроме того, a =  a (это старший коэффициент многочлена
f (z)). Далее, (z1 − z1 ) · . . . · (z1 − zn ) = 0 ⇒ хотя бы одна из
скобок равна нулю ⇒ z1 совпадает с каким-то из чисел zi .
После перенумерации всегда можно считать, что z1 = z1 . Итак,
(z − z1 ) ( (z − z2 ) · . . . · (z − zn ) − (z − z2 ) · . . . · (z − zn )) = 0.
Отсутствие в C[z] делителей нуля означает, что
(z − z2 ) · . . . · (z − zn ) = (z − z2 ) · . . . · (z − zn ).
Рассуждая аналогичным образом, приходим (после перенумера-
ции корней) к равенству z2 = z2 и т. д. 
Следствие. Любой комплексный многочлен f (x) степени n > 0
имеет единственное разложение вида
f (z)=a (z−ζ1 )k1 · . . . · (z−ζm )km , k1 , . . . , km > 0, k1 + . . . +km = n,
(∗∗)
ζi = ζj при i = j , a, ζ1 , . . . , ζm ∈ C.
Разложение вида (∗∗) иногда называется комплексным ка-
ноническим разложением многочлена f (z). Число ki называется
кратностью корня ζi . Корень ζi называется кратным, если
ki > 1, и простым, если ki = 1.
Согласно (∗∗) многочлен f (z) имеет m попарно различных
корней. В разложении (∗) некоторые из чисел z1 , . . . , zm могут
совпадать: если zi = ζj , то имеется ровно kj чисел, равных ζj .
Нередко полученную выше теорему формулируют таким обра-
зом: любой комплексный многочлен степени n > 0 имеет ровно
n комплексных корней с учетом кратностей.

17.7. Разложение вещественных многочленов


Рассмотрим вещественный многочлен (многочлен с веще-
ственными коэффициентами) f (x) = a0 + a1 x + . . . + an xn и
предположим, что число z ∈ C является его корнем. Тогда ком-
17.7. Разложение вещественных многочленов 163

плексно сопряженное число z также является корнем (в силу


вещественности коэффициентов ai = ai для всех i):

f (z) = a0 + a1 z + . . . + an z n = a0 + a1 z + . . . + an z n = f (z) = 0.

Если z = z , то квадратичный многочлен (многочлен степени 2)

ϕ(x) = (x − z)(x − z) = x2 − (z + z) x + |z|2

имеет, очевидно, вещественные коэффициенты и является нераз-


ложимым в R[x].
Теорема. Любой вещественный многочлен f (x) степени n > 0
разлагается в R[x] на линейные и неразложимые квадратич-
ные множители:

f (x) = a(x − x1 ) · . . . · (x − xM ) ϕ1 (x) · . . . · ϕN (x), M + 2N = n,

a, x1 , . . . , xM ∈ R,

ϕi (x) = x2 + si x + ti , si , ti ∈ R, i = 1, . . . , N.

Данное разложение единственно с точностью до порядка со-


множителей.
Доказательство. Многочлен f (x) имеет n комплексных корней
z1 , . . . , zn с учетом кратностей. Пусть ровно M из них являются
вещественными. Тогда остальные n − M корней разбиваются на
пары комплексно сопряженных чисел ( ⇒ число n − M долж-
но быть четным: n − M = 2N ). Вещественные корни дают M
линейных множителей, а пары комплексно сопряженных чисел
дают N неразложимых квадратичных множителей. Тем самым
существование искомого разложения доказано. Допустим, что
имеются два разложения такого вида:

f (x) = a(x − x1 ) · . . . · (x − xM ) ϕ1 (x) · . . . · ϕN (x) =


=
a(x − x
1 ) · . . . · (x − x
M  )ϕ
1 (x) · . . . · ϕ
N  (x).

Ясно, что a = 
a (это старший коэффициент f (x)). Далее,
полный набор комплексных корней с учетом кратностей опреде-
лен однозначно ⇒ вещественные корни с учетом кратностей
определены однозначно ⇒
6*
164 Лекция 17

a(x − x1 ) · . . . · (x − xM ) = 
a(x − x
1 ) · . . . · (x − x
M  ),
 
M =M ⇒ N =N .
Поскольку в R[x] делителей нуля нет, получаем
ϕ1 (x) · . . . · ϕN (x) = ϕ
1 (x) · . . . · ϕ
N (x).
Пусть ϕ1 (z) = 0 ⇒ ϕ1 (x) = (x − z)(x − z). Далее, ϕ1 (z) × . . .
... × ϕ
N (z) = 0 ⇒ хотя бы один из множителей равен нулю.
1 (z) = 0 ⇒ ϕ
Пусть, например, ϕ 1 (x) = (x − z)(x − z). Таким
образом,
1 (x)
ϕ1 (x) = ϕ ⇒ ϕ2 (x) · . . . · ϕN (x) = ϕ
2 (x) · . . . · ϕ
N (x).
Далее по индукции. 
Следствие. Любой вещественный многочлен нечетной степе-
ни имеет хотя бы один вещественный корень.
Замечание. Последнее утверждение можно было бы доказать и
непосредственно — без использования основной теоремы алгеб-
ры. Достаточно доказать, что при положительном старшем ко-
эффициенте f (x) (как функция от x ∈ R) имеет положительный
знак при достаточно больших положительных x и отрицательный
знак при достаточно больших отрицательных x. После этого
использовать непрерывность f (x).
Л е к ц и я 18

18.1. Формулы Виета


Рассмотрим комплексный многочлен f (x) степени n со стар-
шим коэффициентом 1 и его разложение на линейные множите-
ли:
f (x) = a0 + a1 x + . . . + an−1 xn−1 + xn = (x − x1 ) · . . . · (x − xn ).
Раскрывая скобки в правой части и приравнивая коэффициенты
при одинаковых степенях x, получаем формулы Виета:
an−1 = −(x1 + x2 + . . . + xn ),
an−2 = (x1 x2 + x1 x3 + . . . + xn−1 xn ),
an−3 = −(x1 x2 x3 + x1 x2 x4 + . . . + xn−2 xn−1 xn ),
.........................................

an−k = (−1)k xi1 · . . . · xik ,
1i1 < ... < ik n
.........................................
a0 = (−1)n x1 · . . . · xn .
Выражения вида

σk = σk (x1 , . . . , xn ) = xi1 · . . . · xik , k = 1, . . . , n,
1i1 < ... < ik n
(∗)
называются элементарными симметрическими многочленами
от x1 , . . . , xn . Таким образом, коэффициенты многочлена f (x)
выражаются через элементарные симметрические многочлены от
его корней x1 , . . . , xn :
an−k = (−1)k σk , k = 1, . . . , n.

18.2. Многочлены от n переменных


Формальное выражение xα1 1 . . . xαnn , где α1 , . . . , αn — неот-
рицательные целые степени, называется одночленом степени
α1 + . . . + αn от переменных x1 , . . . , xn . Равенство αi = 0 допус-
кается (в этом случае одночлен не содержит xi ).
166 Лекция 18

Многочленом от переменных x1 , . . . , xn над полем P


называется формальная сумма одночленов от x1 , . . . , xn
с коэффициентами из поля P . Степенью многочлена называется
наивысшая степень входящих в него одночленов с ненулевыми
коэффициентами. Например, многочлен
f (x1 , x2 , x3 ) = x31 x22 x3 + x21 x32 x3 + x1 x2 x43 + x1 x2 + x3
имеет степень 6. Как видим, в состав f (x1 , x2 , x3 ) входят 3
одночлена наивысшей степени.
Полагаем xα1 1 . . . xαnn = xβ1 1 . . . xβnn , если αi = βi для всех i.
Один и тот же многочлен допускает много формально различных
представлений в виде суммы одночленов с коэффициентами из
поля P . Однако мы всегда можем перейти к стандартному
представлению, в котором каждый одночлен встречается только
один раз — процедура перехода называтся приведением подоб-
ных членов и заключается в замене всех одинаковых одночленов
с какими-то коэффициентами одним одночленом с коэффици-
ентом, равным сумме этих коэффициентов, а затем исключе-
нии из суммы всех одночленов с нулевыми коэффициентами.
Многочлены f и g называются равными, если они имеют рав-
ные коэффициенты для равных одночленов в своих стандартных
представлениях.
Суммой многочленов f + g называется многочлен с коэффи-
циентами, равными сумме коэффициентов для соответствующих
одночленов,
 входящих в f и g . Произведением многочленов
f = aα1 ,...,αn xα1 1 . . . xαnn и g = bβ1 ,...,βn xβ1 1 . . . xβnn называется
многочлен f g , состоящий из всех членов вида
(aα1 ,...,αn bβ1 ,...,βn ) xα1 1 +β1 . . . xαnn +βn .
Таким образом, умножение многочленов выполняется по привыч-
ным правилам раскрытия скобок и приведения подобных членов.
Множество всех многочленов от x1 , . . . , xn над полем P обо-
значается через P [x1 , . . . , xn ]. Относительно операций сложения
и умножения многочленов оно является коммутативным кольцом
с единицей и без делителей нуля.

18.3. Лексикографическое упорядочение


При изучении многочленов от x1 , . . . , xn часто используется
лексикографическое (словарное) упорядочение входящих в них
одночленов:
xα1 1 . . . xαnn старше (выше) xβ1 1 . . . xβnn ,
18.4. Симметрические многочлены 167

если для некоторого 1  k  n выполняются соотношения


α1 = β1 , . . . , αk−1 = βk−1 , αk > βk .
В дальнейшем под старшим членом многочлена будет по-
ниматься взятый с соответствующим ненулевым коэффициен-
том одночлен, являющийся наивысшим при лексикографическом
упорядочении одночленов стандартного представления данного
многочлена. Очевидно, что старший член определен однозначно.
Легко проверяется, что старший член произведения двух мно-
гочленов равен произведению их старших членов.

18.4. Симметрические многочлены


Многочлен f (x1 , . . . , xn ) называется симметрическим, если
для любой подстановки σ степени n
f (x1 , . . . , xn ) = f (xσ(1) , . . . , xσ(n) ).
Важными примерами симметрических многочленов являются
элементарные симметрические многочлены σk , присутствующие
в формулах Виета.
Теорема о симметрических многочленах. Для любого сим-
метрического многочлена f (x1 , . . . , xn ) существует и един-
ствен многочлен g от n переменных такой, что
f (x1 , . . . , xn ) = g(σ1 , . . . , σn ),
где σk = σk (x1 , . . . , xn ) — элементарные симметрические мно-
гочлены вида (∗).
Доказательство. Пусть a xα1 1 . . . xαnn — старший член много-
члена f (x1 , . . . , xn ). Тогда в случае симметрического многочлена
обязательно выполняются неравенства α1  . . .  αn . Если бы
это было не так, то данный член не был бы старшим: в сим-
метрическом многочлене вместе с одночленом xα1 1 . . . xαnn должны
присутствовать все одночлены вида xασ(11) . . . xασ(n)
n
для любой под-
становки σ .
Рассмотрим многочлен
−αn αn
ϕ(σ1 , . . . , σn ) = a σ1α1 −α2 . . . σn−
α n−1
1 σn . (1 )
Его можно рассматривать также как многочлен от x1 , . . . , xn , для
которого старший член будет, очевидно, равен
168 Лекция 18

a xα1 1 −α2 (x1 x2 )α2 −α3 . . . (x1 . . . xn−1 )αn−1 −αn (x1 . . . xn−1 xn )αn =
= a xα1 1 . . . xαnn . (2)

Поэтому старший член многочлена

f1 (x1 , . . . , xn ) = f (x1 , . . . , xn ) − ϕ(σ1 , . . . , σn )

будет младше старшего члена для f (x1 , . . . , xn ). Аналогичным об-


разом от f1 можно перейти к многочлену f2 с меньшим старшим
членом и т. д. В силу конечности общего числа членов данная
процедура должна на каком-то шаге дать нулевой многочлен.
Для доказательства единственности многочлена g достаточ-
но показать, что если g(σ1 , . . . , σn ) = 0, то и f (x1 , . . . , xn ) = 0.
Другими словами, нужно проверить, что после замены σk на
соответствующие многочлены от x1 , . . . , xn и приведения подоб-
ных членов останется хотя бы один ненулевой член. Любой
член многочлена g можно записать в виде (1) с показателями
α1  . . .  αn . Как многочлен от x1 , . . . , xn , многочлен ϕ имеет
своим старшим членом (2). Старшим членом для g , как мно-
гочлена от x1 , . . . , xn , будет наивысший из членов такого вида.
Он определен однозначно и поэтому не может сократиться при
приведении подобных членов. 
Следствие. Значение любого симметрического многочлена
ϕ(x1 , . . . , xn ) при замене переменных на корни многочлена
f (x) = a0 + a1 x + . . . + an−1 xn−1 + xn над полем P является
элементом поля P .
Доказательство. Симметрический многочлен является мно-
гочленом от элементарных симметрических многочленов. Если
считать переменные корнями для f (x), то, в силу формул Виета,
ϕ будет многочленом над тем же полем P от коэффициентов
a0 , . . . , an−1 , которые являются элементами поля P . 
Задача 1. Пусть z1 , ..., zn — все корни (с учетом кратностей)
многочлена f (x) с рациональными коэффициентами. Доказать, что
$
произведение D = (zi − zj ) является рациональным числом.
i=j

Задача 2. Пусть z1 , . . . , zn — все корни n-й степени из единицы,


а f (x1 , . . . , xn ) — симметрический многочлен с целыми коэффициен-
тами. Доказать, что значение f при xi = zi является целым числом.
18.5. Ньютоновы суммы 169

18.5. Ньютоновы суммы


Пусть задан многочлен f (x) = a0 + a1 x + . . . + an−1 xn−1 + xn ,
и пусть x1 , . . . , xn — все его корни с учетом кратностей. Выра-
жения
sk = xk1 + xk2 + . . . + xkn , k = 1, 2, . . . ,
называются ньютоновыми суммами для f (x).
Ясно, что sk — симметрический многочлен от корней x1 , . . .
. . . , xn . Поэтому sk есть значение многочлена от элементарных
симметрических многочленов и, следовательно, от коэффициен-
тов a0 , . . . , an−1 . Таким образом, ньютоновы суммы конструк-
тивно выражаются через коэффициенты многочлена f (x) — их
можно найти, не зная корни.
На вычислении ньютоновых сумм легко построить также
некоторый метод приближенного вычисления корней многочлена
f (x). 1) Предположим, что
|x1 | > |x2 |  . . .  |xn |.
Тогда
k+1
x2 xn k+1
sk+1 1+ + ... +
x1 x1
= x1 k k → x1 при k → ∞.
sk x2 xn
1+ + ... +
x1 x1

Задача 1. Доказать, что многочлен f (x) = 1 + x + ... + xn имеет n


различных комплексных корней z1 , ..., zn . Вычислить ньютонову сумму
sk = z1k + ... + znk при k = 7.
Задача 2. Найти многочлен 3-й степени, корнями которого явля-
ются квадраты корней многочлена z 3 − 2z − 5.

1)
На практике для этой цели все же используются другие методы — с более
быстрой сходимостью.
Л е к ц и я 19

19.1. Алгебраические многообразия


Пусть f (x1 , . . . , xn ) — многочлен степени k от переменных
x1 , . . . , xn . Множество
M = {x = [x1 , . . . , xn ] : f (x1 , . . . , xn ) = 0}
называется алгебраическим многообразием 1) порядка k . Оче-
видно, что это понятие обобщает понятие линейного многообра-
зия в n-мерном пространстве.
В общем случае строение множества M весьма сложно. Од-
нако при его изучении часто помогает очень простая идея —
давайте попытаемся упростить вид уравнения f = 0 с помощью
замены переменных x = P y , где P — невырожденная матрица
порядка n. Замена переменных связана с переходом к другому
базису в том же n-мерном пространстве.
Утверждение. Пусть P — произвольная невырожденная мат-
риц порядка n и g(y1 , . . . , yn ) = f (x1 , . . . , xn ), где [x1 , . . . , xn ] =
= P [y1 , . . . , yn ] . Тогда степень многочлена g равна степени
многочлена f .
Доказательство. Пусть P = [pij ]. Тогда
 n k1  n kn
k1
 
x1 · . . . · x n =
kn
p1j yj · ... · pnj yj .
j=1 j=1

Отсюда ясно, что степень g не выше степени f . Противополож-


ное неравенство доказывается с помощью замены y = P −1 x. 

1)
Подробным изучением алгебраических многообразий занимается алгеб-
раическая геометрия.
19.3. Поворот декартовой системы координат 171

19.2. Квадратичные многочлены от двух переменных


Рассмотрим квадратичный многочлен с вещественными ко-
эффициентами
f (x, y) = a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33
как функцию от декартовых координат x, y на плоскости и иссле-
дуем строение множества точек (x, y), удовлетворяющих уравне-
нию f (x, y) = 0.
Многочлен f (x, y) имеет три типа слагаемых:
f (x, y) = f2 (x, y) + f1 (x, y) + f0 ,
f2 (x, y) = a11 x2 + 2a12 xy + a22 y 2 — квадратичная часть,
f1 (x, y) = 2a13 x + 2a23 y — линейная часть, f0 = a33 —
свободный член. Квадратичная и линейная части записываются
с помощью матричных операций таким образом:




a11 a12 x x
f2 (x, y) = [ x y ] a a
, f1 (x, y) = 2 [ 13 23 ] .
a12 a22 y y
Кроме того, легко проверяется, что
  
a11 a12 a13 x
f (x, y) = [ x y 1 ] a12 a22 a23 y .
a13 a23 a33 1
Попробуем найти такую декартову систему, в которой уравнение
f (x, y) = 0 получит более простой вид. Множество его решений
принято называть линией (кривой) второго порядка.

19.3. Поворот декартовой системы координат


Исходную декартову систему координат повернем против ча-
совой стрелки на угол ϕ. Тогда базисные векторы e1 , e2 перейдут
в новые базисные векторы:

e1 = cos ϕ e1 + sin ϕ e2 , 
e2 = − sin ϕ e1 + cos ϕ e2 .
Старые координаты x, y будут выражаться через новые коорди-
, y следующим образом:
наты x




x cos ϕ − sin ϕ 
x
=x
e1 + y 
e2 = .
y sin ϕ cos ϕ y
172 Лекция 19

Легко проверяется, что

−1

cos ϕ − sin ϕ cos ϕ sin ϕ
= ⇒
sin ϕ cos ϕ − sin ϕ cos ϕ





x cos ϕ sin ϕ x
⇒ = .
y − sin ϕ cos ϕ y
В новых координатах квадратичная часть f2 (x, y) принимает
вид





cos ϕ sin ϕ a11 a12 cos ϕ − sin ϕ 
x
x y]
f2 = [ .
− sin ϕ cos ϕ a12 a22 sin ϕ cos ϕ y
 = Q AQ,
Матрица в скобках есть произведение трех матриц: A
причем A — симметричная матрица: A = A. Отсюда
 = (Q AQ) = Q A (Q ) = Q AQ = A.
A 

Значит, A = [
aij ] остается симметричной матрицей.
Попытаемся выбрать угол ϕ так, чтобы матрица A  приобрела
диагональный вид:





cos ϕ sin ϕ a11 a12 cos ϕ − sin ϕ λ1 0
= .
− sin ϕ cos ϕ a12 a22 sin ϕ cos ϕ 0 λ2
(∗)
Таким образом, требуется занулить элемент

a12 = 
a21 = (cos2 ϕ − sin2 ϕ) a12 − sin ϕ cos ϕ (a11 − a22 ) =
a11 − a22
= cos(2ϕ) a12 − sin(2ϕ) = 0.
2
Если a12 = 0, то можно взять ϕ = 0. Если a12 = 0, то надо
решить уравнение
a − a22
ctg (2ϕ) = 11 .
2a12
Очевидно, что решение существует. Поэтому всегда найдется ϕ
такое, что имеет место равенство (∗). Кроме того, при любом
выборе ϕ получаем
λ1 = cos2 ϕ a11 + 2 cos ϕ sin ϕ a12 + sin2 ϕ a22 ,
λ2 = sin2 ϕ a11 − 2 cos ϕ sin ϕ a12 + cos2 ϕ a22 .
Отсюда λ1 + λ2 = a11 + a22 . В то же время, используя равенство
(∗) и тот факт, что определитель произведения матриц равен
19.4. Сдвиг декартовой системы координат 173

произведению определителей, находим: λ1 λ1 = a11 a22 − a212 . Сле-


довательно, λ1 и λ2 суть корни квадратного уравнения 1)
λ2 − (a11 + a22 )λ + (a11 a22 − a212 ) = 0. (#)
Доказано следующее
Утверждение. С помощью поворота исходной декартовой си-
стемы координат на некоторый угол ϕ уравнение f (x, y) = 0
преобразуется в новых координатах к виду
2 + λ2 y2 + 2b13 x
λ1 x  + 2b23 y + b33 = 0,
где

cos ϕ − sin ϕ
[ b13 b23 ] = [ a13 a23 ] sin ϕ cos ϕ , b33 = a33 ,
а λ1 и λ2 являются корнями квадратного уравнения (#).

19.4. Сдвиг декартовой системы координат


Естественно предположить, что квадратичная часть f2 не
является тождественным нулем. Значит, λ1 и λ2 не равны нулю
одновременно.
Случай 1: λ1 = 0, λ2 = 0. Выделим в квадратичной части
полные квадраты:
  2 2 b2
b13 b213 b b
λ1 x +2b13 x
2
 = λ1 x  +2 x
2
+ 2 − 132 = λ1 x  + 13 − 132 ,
 λ1 λ1  λ1 λ1 λ1
b b 2
b 2 b
2 b2
λ2 y2 + 2b23 y = λ2 y2 +2 23 y+ 232 − 232 = λ2 y + 23 − 232 .
λ2 λ2 λ2 λ2 λ2
 и y,
Осуществим сдвиг декартовой системы с координатами x
поместив ее начало в точку
b b

O = − 13 , − 23 .
λ1 λ2
Новые координаты x и y  и y следующим
выражаются через x
образом:
b13 b23
x = x
+ , y  = y + .
λ1 λ2
1)

Заметим, что левая часть уравнения (#) есть в точности
a −λ a12
det 11a a22 − λ . Это многочлен от λ, называемый характеристическим
21


a11 a12
многочленом матрицы
a21 a22 . Многочлен такого же вида естественным
образом возникает при изучении ряда важных задач для произвольных (не
обязательно симметричных) матриц произвольного порядка (см. лекцию 29).
174 Лекция 19

В новых координатах уравнение f (x, y) = 0 теряет линейную


часть и принимает вид
λ1 (x )2 + λ2 (y  )2 + c = 0, (1 )
b213 b223
c = b33 − − .
λ21 λ22
Случай 2: λ1 = 0, λ2 = 0. Переносим начало координат в
точку
b
O = 0, − 23 .
λ2
В новых координатах
b23
=x
x , y = y +
λ2
уравнение f (x, y) = 0 получает вид
b223
λ2 y2 + 2b x
 + c = 0, b = b23 , c = b33 − .
λ22
Если b = 0, выполним еще один перенос начала системы коорди-
нат — в точку (−c/b, 0). В новых координатах
c
x = x
+ , y  = y
2b
уравнение f (x, y) = 0 приобретает форму
λ2 (y  )2 + 2b x = 0. (2 )
Если b = 0, получаем уравнение (положим для унификации x =
=x, y  = y)
λ2 (y  )2 + c = 0. (3 )
Случай λ1 = 0, λ2 = 0 сводится к случаю 2 дополнительным
поворотом системы координат на угол π/2. Доказана следующая
Теорема. С помощью поворота и сдвига исходной системы
координат уравнение f (x, y) = 0 приводится в новых коорди-
натах к виду (1), (2) или (3).
Если уравнение f (x, y) = 0 в какой-либо декартовой системе
координат имеет вид (1), то ни в какой другой декартовой систе-
ме оно не может иметь вид (2) или (3). Аналогично, уравнение
вида (2) при переходе к другой декартовой системе не может
стать уравнением вида (1) или (3), а уравнение вида (3) —
уравнением вида (1) или (2). Доказательство следует, например,
из сравнения рассмотренных ниже геометрических свойств мно-
жеств решений уравнений (1), (2) и (3).
19.5. Эллипс 175

19.5. Эллипс
Пусть в некоторой декартовой системе координат уравнение
f (x, y) = 0 имеет вид (1), где λ1 и λ2 — ненулевые числа
одинакового знака. Уберем штрихи и рассмотрим новую систему
в качестве исходной.
Не ограничивая общности, можно считать, что 0 < λ1  λ2
(если оба числа отрицательны, то можно поменять знак в обе-
их частях уравнения; если λ1 > λ2 , то можно поменять их
местами с помощью поворота на угол π/2). Если при этом
c > 0, то изучаемое множество пусто. Если c = 0, в нем толь-
! точка (0,!
ко одна 0). Предположим, что c < 0. Тогда, положив
a = −c/λ1 , b = −c/λ2 , уравнение (1) можно записать в виде
x2 y2
2
+ 2 = 1, a  b > 0. (1 )
a b
Определение 1. Множество точек (x, y), удовлетворяющих
уравнению (1 ), называется эллипсом с полуосями a и b.

Точки F− = (−c, 0) и F+ = (c, 0), где c = a2 − b2  0,
называются отрицательным и положительным фокусами эллип-
са соответственно. Число e = c/a называется эксцентрисите-
том эллипса. Заметим, что 0  e < 1. Прямые l− : x = −a/e
и l+ : x = a/e называются отрицательной и положительной ди-
ректрисами эллипса.
Пусть точка M = (x, y) удовлетворяет уравнению (1 ). Най-
дем сумму расстояний от нее до фокусов:
% %
|M F− | + |M F+ | = (x + c)2 + y 2 + (x − c)2 + y 2 =
%
= x2 (1 − b2 /a2 ) + 2xc + b2 + c2 +
%
+ x2 (1 − b2 /a2 ) − 2xc + b2 + c2 .
Заметим, что 1 − b2 /a2 = e2 и b2 + c2 = (c/e)2 = a2 . Кроме того,
|ex|  a. Поэтому
%
|M F− | + |M F+ | = (ex)2 + 2(ex)(c/e) + (c/e)2 +
%
+ (ex)2 − 2(ex)(c/e) + (c/e)2
= |a + ex| + |a − ex| = (a + ex) + (a − ex) = 2a.
176 Лекция 19

Таким образом, сумма расстояний от любой точки эллипса


(1 ) до его фокусов постоянна и равна 2a.
Определение 2. Множество тех и только тех точек плоскости,
для которых сумма расстояний до заданных точек постоянна,
называется эллипсом.
Мы уже выяснили, что все точки эллипса как множества
из определения 1 принадлежат множеству из определения 2.
Рассмотрим теперь эллипс как множество, данное определени-
ем 2. Выберем декартову систему, в которой заданные точки F−
и F+ получают координаты (−c, 0) и (c, 0). Постоянную сумму
расстояний будем считать равной 2a. Тогда
% 2  % 2
(x − c) + y
2 2 = 2a − (x + c) + y
2 2 ⇒
%
⇒a (x + c)2 + y 2 = a2 + xc.

Еще одно возведение в квадрат дает b2 x2 + a2 y 2 = a2 b2 ⇒


(1 ). Следовательно, определения 1 и 2 эквивалентны.
В случае e = 0 эллипс есть окружность радиуса a = b. Пусть
e > 0. Выше мы получили равенства
|M F− |
|M F− | = |a + ex| = e|x + (a/e| ⇒ = e,
|x + (a/e)|

|M F+ |
|M F+ | = |a − ex| = e|x − (a/e)| ⇒ = e.
|x − (a/e)|

Возводя каждое из последних равенств в квадрат, получаем (1 ).


Таким образом, доказано следующее
Утверждение. Множество тех и только тех точек плоско-
сти, для которых отношение расстояний до заданной точки
и заданной прямой постоянно и равно 0 < e < 1, является
эллипсом.
Ясно, что для выбора точки (фокуса) и соответствующей пря-
мой (директрисы), определяющих один и тот же эллипс, имеются
в точности две возможности.
Задача 1. Написать общее уравнение прямой, проходящей через
точку M (x0 , y0 ) эллипса x2 /a2 + y 2 /b2 = 1 и имеющей с ним единствен-
ную общую точку (такая прямая называется касательной к эллипсу
в точке M ). Доказать, что прямая, ортогональная данной прямой
19.6. Гипербола 177

и проходящая через точку M , является биссектрисой угла AM B , где


A и B — фокусы эллипса.
1
Задача 2. Докажите, что преобразование z → (z + z −1 ) ком-
2
плексной плоскости 1) переводит точки окружности радиуса r > 1 с
центром в начале координат в точки некоторого эллипса.
Задача 3. Докажите, что точки эллипса x2 /a2 + y 2 /b2 = 1 допус-
кают параметрическое представление x = a cos ϕ, y = b sin ϕ, 0  ϕ <
< 2π .
Задача 4. Докажите, что геометрическое место точек пересечения
взаимно ортогональных касательных к эллипсу x2 /a2 + y 2 /b2 = 1 есть
окружность x2 + y 2 = a2 + b2 .

19.6. Гипербола
По-прежнему, пусть в декартовой системе координат урав-
нение f (x, y) = 0 принимает вид (1), но λ1 и λ2 имеют разные
знаки. Если при этом свободный член оказался равен нулю,
то получаем пару прямых, проходящих через начало координат.
Предположим, что свободный член отличен от нуля. Ясно, что
в этом случае уравнение можно записать в виде
x2 y2
− = 1, (1 )
a2 b2
где a, b — некоторые положительные числа (возможно, для этого
потребуется дополнительно повернуть систему координат на угол
π/2).
Определение 1. Множество точек (x, y), удовлетворяющих
уравнению (1 ), называется гиперболой с полуосями a и b.
Легко видеть, что точки (x, y) гиперболы (1 ) находятся в
объединении двух непересекающихся областей плоскости (как
говорят, распадаются на две ветви):
D+ = {(x, y) : x  a, |y|  (b/a)|x|},
D− = {(x, y) : x  −a, |y|  (b/a)|x|}.
Прямые h+ : y = (b/a)x и h− : y = −(b/a)x называются асимп-
тотами гиперболы.

1 & '
1)
Функция z → z + z −1 называется функцией Жуковского и широко
2
применяется при решении задач гидро- и аэродинамики.
178 Лекция 19

Пусть x > 0 и y = y(x) — единственное значение для y


такое, что y > 0 и точка (x, y) удовлетворяет уравнению (1 ).
Очевидно, что расстояние от точки (x, y((x)) до асимптоты h+
не превышает
b2
|(b/a)x − y(x)| = → 0 при x → +∞.
|(b/a)x + y(x)|
При x > 0 и y < 0 соответствующие точки (x, y(x)) гиперболы
приближаются к асимптоте h− . Аналогичные наблюдения спра-
ведливы также для точек гиперболы при x < 0. √
Точки F− = (−c, 0) и F+ = (c, 0), где c = a2 + b2 > 0,
называются отрицательным и положительным фокусами гипер-
болы соответственно. Число e = c/a называется эксцентриси-
тетом гиперболы. Заметим, что в случае гиперболы e > 1.
Прямые l−1 : x = −a/e и l+ : x = a/e называются отрицательной
и положительной директрисами гиперболы соответственно.
Найдем расстояния от произвольной точки M = (x, y), удо-
влетворяющей (1 ), до фокусов (выкладки проводятся в полной
аналогии со случаем эллипса):
%
|M F− | = (x + c)2 + y 2 = |a + ex|, (A)
%
|M F+ | = (x − c)2 + y 2 = |a − ex|. (B)
Поскольку |x|  a и e > 1, получаем

(ex + a) − (ex − a) = 2a, x > 0,
|a + ex| − |a − ex| =
−(ex + a) + (ex − a) = −2a, x < 0.
Таким образом, абсолютная величина разности расстояний
от любой точки гиперболы (1 ) до ее фокусов постоянна
и равна 2a.
Определение 2. Множество тех и только тех точек плоскости,
для которых абсолютная величина разности расстояний до двух
заданных точек постоянна, называется гиперболой.
Пусть точка (x, y) принадлежит множеству из определения 2.
Введем декартовы координаты таким образом, что заданные точ-
ки получают координаты (−c, 0) и (c, 0). Постоянную абсолют-
ную величину разности расстояний обозначим через 2a. Тогда
% % 
 
 (x + c)2 + y 2 − (x − c)2 + y 2  = 2a ⇒
 
 % 2
(x + c) + y = 2a − (x − c)2 + y 2
2 2
⇒ (1 ).
19.7. Парабола 179

Таким образом, определения 1 и 2 эквивалентны.


Формулы (A) и (B) делают очевидным также следующее
Утверждение. Множество тех и только тех точек плоско-
сти, для которых отношение расстояний до заданной точки
и заданной прямой постоянно и равно e > 1, является гипер-
болой.
Из наших построений следует, что имеются ровно две воз-
можности для выбора точки (фокуса) и соответствующей прямой
(директрисы), определяющих одну и ту же гиперболу.
Задача 1. Написать общее уравнение прямой, проходящей через
точку M (x0 , y0 ) гиперболы x2 /a2 − y 2 /b2 = 1 и имеющей с ней един-
ственную общую точку в области точек (x, y) с координатой x того же
знака, что и x0 (такая прямая называется касательной к гиперболе).
Доказать, что данная прямая является биссектрисой угла AM B , где A
и B — фокусы гиперболы.
Задача 2. Докажите, что никакая прямая не может иметь ровно
одну общую точку с каждой ветвью гиперболы.
Задача 3. Докажите, что точки ветви гиперболы x2 /a2 − y 2 /b2 = 1
при x > 0 допускают параметрическое представление x = a ch (ϕ), y =
= b sh (ϕ), −∞ < ϕ < +∞. По определению,

1 1
ch (ϕ) = (eϕ + e−ϕ ), sh (ϕ) = (eϕ − e−ϕ ).
2 2

19.7. Парабола
Пусть уравнение f (x, y) имеет вид (2). Можно считать, что
λ2 > 0 и b < 0 (этого всегда можно добиться умножением уравне-
ния на (−1) и дополнительным поворотом системы координат на
угол π ). Уберем штрихи, рассматривая новую систему в качестве
исходной. Положив p = −b/λ2 , получаем уравнение
y 2 = 2px, p > 0. (2  )
Определение 1. Множество точек (x, y), удовлетворяющих
уравнению (2 ), называется параболой с фокальным парамет-
ром p.
Точка F = (p/2, 0) называется фокусом параболы (2 ). Пря-
мая l : x = −p/2 называется директрисой параболы (2 ).
Пусть M = (x, y) — произвольная точка параболы. Расстоя-
ние от нее до фокуса имеет вид
180 Лекция 19
% %
|M F | = (x − p/2)2 + y 2 = x2 − px + (p/2)2 + 2px =
%
= x2 + 2x(p/2) + (p/2)2 = |x + p/2|.
Итак, расстояние от любой точки параболы до фокуса |F |
равно расстоянию от этой точки до директрисы l.
Определение 2. Множество тех и только тех точек, для ко-
торых расстояние до заданной точки F равно расстоянию до
заданной прямой l, называется параболой.
Пусть расстояние от заданной точки до заданной пря-
мой равно p. Выберем систему координат таким образом, что
F = (p/2, 0) и l : x = −p/2. Если |M F | = |x + p/2|, то, возводя
это равенство в квадрат, получаем (2 ). Таким образом, опреде-
ления 1 и 2 действительно эквивалентны.
Задача 1. Написать общее уравнение прямой, проходящей через
точку M (x0 , y0 ) параболы y 2 = 2px и имеющей с ней единственную
общую точку (такая прямая называется касательной к параболе).
Доказать, что прямая, ортогональная данной прямой и проходящая
через точку M , делит пополам угол между прямой F M , где точка F —
фокус параболы, и прямой, параллельной оси x и проходящей через
точку M .
Задача 2. Докажите, что геометрическое место точек пересечения
взаимно ортогональных касательных к параболе совпадает с ее дирек-
трисой.
Задача 3. Отрезок, соединяющий две точки кривой, называет-
ся ее хордой. Докажите, что для эллипса, гиперболы или параболы
середины всех хорд, параллельных произвольной заданной хорде, рас-
положены на одной прямой.
Задача 4. Кривая S — это эллипс, одна из ветвей гиперболы
или парабола, E — произвольная фиксированная точка на S . Для
произвольных точек A и B на S прямая l(A, B) определяется как
прямая AB в случае A = B и как касательная в точке A в случае
A = B . Докажите, что прямая, проведенная через точку E параллельно
l(A, B), имеет с S не более одной общей точки C , помимо E . Пусть
C = E , если общая точка только одна. Таким образом, любой паре
точек A, B ставится в соответствие точка C — назовем ее суммой
точек A и B . Докажите, что множество S относительно этой операции
является абелевой группой.
Л е к ц и я 20

20.1. Квадратичные многочлены от трех переменных


Рассмотрим вещественный квадратичный многочлен
f (x, y , z) = a11 x2 + 2a12 xy + 2a13 xz + a22 y 2 +
+ 2a23 yz + a33 z 2 + 2a14 x + 2a24 y + 2a34 z + a44
от декартовых координат x, y , z в геометрическом пространстве
и исследуем множество решений уравнения f (x, y , z) = 0 — его
принято называть поверхностью второго порядка.
Легко проверить, что
⎡ ⎤⎡ ⎤
a11 a12 a13 a14 x
⎢ a a a a ⎥⎢ y ⎥
f (x, y , z) = [ x y z 1 ] ⎣ 12 22 23 24 ⎦ ⎣ ⎦ ,
a13 a23 a33 a34 z
a14 a24 a34 a44 1
а квадратичная часть многочлена f (x, y , z) имеет вид
  
a11 a12 a13 x
f2 (x, y , z) = [ x y z ] a 12 a22 a23 y .
a13 a23 a33 z
Как и в случае двух переменных, попробуем перейти к более
удобной декартовой системе координат.

20.2. Декартовы системы и ортогональные матрицы


Пусть e1 , e2 , e3 и e1 , e2 , e3 — базисные векторы двух де-
картовых систем координат с общим началом. Выразим векторы
второй системы в виде линейных комбинаций векторов первой
системы:
e1 = p11 e1 + p21 e2 + p31 e3 ,
e2 = p12 e1 + p22 e2 + p32 e3 ,
e3 = p13 e1 + p23 e2 + p33 e3 ,
182 Лекция 20

и заметим, что
  
p11 p21 p31 p11 p12 p13
p12 p22 p32 p21 p22 p23 =
p13 p23 p33 p31 p32 p33
   
e1 , e1 ) (
( e1 , e2 ) (
e1 , e3 ) 1 0 0
= ( e2 , e1 ) (
e2 , e2 ) (
e2 , e3 ) = 0 1 0 .
e3 , e1 ) (
( e3 , e2 ) (
e3 , e3 ) 0 0 1
Таким образом, матрица перехода P для базисов двух декарто-
вых систем координат удовлетворяет матричному равенству
P  P = I. (∗)
Ясно и то, что если матрица перехода обладает свойством (∗), то
декартова система переходит в декартову.
Определение. Квадратная вещественная матрица P , удовлетво-
ряющая равенству (∗), называется ортогональной.
Ортогональные матрицы порядка 2 осуществляют переход
между базисами декартовых систем на плоскости. Таковы,
в частности, матрицы перехода, реализующие поворот (см. лек-
цию 19).
Данное нами определение применимо и для матриц, порядок
которых больше 3. Согласно (∗) для ортогональных матриц про-
извольного порядка обращение сводится к транспонированию:
P −1 = P  .
Кроме того, произведение двух ортогональных матриц
остается ортогональной матрицей: если P  P = Q Q = I ,
то (P Q) (P Q) = Q (P P )Q = Q I Q = Q Q = I . Очевидно,
   
что единичная матрица I является ортогональной матрицей.
Следовательно, множество всех ортогональных матриц
фиксированного порядка относительно операции умножения
матриц образует группу.
Утверждение. Пусть y = P x, где P — произвольная орто-
гональная матрица порядка n и x ∈ Rn×1 . Тогда сумма квад-
ратов элементов матрицы-столбца y равна сумме квадратов
элементов матрицы-столбца x.
Доказательство.
y12 + . . . + yn2 = y  y = (P x) (P x) =
= x (P  P ) x = x x = x21 + . . . + x2n . 
Следствие. Пусть B = P AQ, где P , Q — произвольные ор-
тогональные матрицы порядка n и A — произвольная веще-
20.3. Метод вращений 183

ственная матрица порядка n. Тогда сумма квадратов элемен-


тов матрицы B равна сумме квадратов элементов матри-
цы A.

20.3. Метод вращений


Попробуем упростить квадратичную часть f2 (x, y), используя
ту же идею поворота системы координат, как и в случае плос-
кости. Однако теперь у нас есть три координатные плоскости,
порождаемые тремя парами координатных осей. Цель враще-
ния — получить нуль вместо какой-нибудь одной пары элементов
aij = aji при i = j . Рассмотрим три возможности:
   
cos ϕ sin ϕ 0 a11 a12 a13 cos ϕ − sin ϕ 0
− sin ϕ cos ϕ 0 a12 a22 a23 sin ϕ cos ϕ 0 =
0 0 1 a13 a23 a33 0 0 1
 

a11 0  a13
= 0 a22 a23 , (1)

a13 
a23 a33
   
cos ϕ 0 sin ϕ a11 a12 a13 cos ϕ 0 − sin ϕ
0 1 0 a12 a22 a23 0 1 0 =
− sin ϕ 0 cos ϕ a13 a23 a33 sin ϕ 0 cos ϕ
 

a11 
a12 0
=  a12 
a22 
a23 , (2)
0 
a23 
a33
   
1 0 0 a11 a12 a13 1 0 0
0 cos ϕ sin ϕ a12 a22 a23 0 cos ϕ − sin ϕ =
0 − sin ϕ cos ϕ a13 a23 a33 0 sin ϕ cos ϕ
 

a11 
a12 
a13
=  a12 
a22 0 . (3)

a13 0 a33

Обозначим через d0 , h0 и d1 , h1 суммы квадратов диаго-


нальных и внедиагональных элементов исходной и новой матриц
в каждом из трех случаев:
d0 = a211 + a222 + a233 , h0 = 2a212 + 2a213 + 2a223 ,
d1 = 
a211 + 
a222 + 
a233 , h1 = 2
a212 + 2
a213 + 2
a223 .
184 Лекция 20

Согласно отмеченным выше свойствам ортогональных матриц,


d1 + h1 = d0 + h0 ⇒ h1 = h0 − (d1 − d0 ).
По той же причине в случае (1) имеем: a211 + a222 + 2a212 =  a211 +
+a222 и, поскольку a33 =  a33 , d1 − d0 = 2a212 . В случае (2) d1 −
− d0 = 2a13 , а в случае (3) d1 − d0 = 2a223 .
2
Пусть индексы i, j определяют координатную плоскость, в ко-
торой проводится вращение (и указывают на то, какое из соотно-
шений (1), (2) или (3) имеет место). Выберем их таким образом,
чтобы исключаемый элемент aij был максимальным по модулю.
Тогда, очевидно,
2
d1 − d0 = 2a2ij  2(h0 /6) = h0 /3 ⇒ h1  h .
3 0
Пусть A0 = [aij ] и A1 = [aij ]. Рассматривая A1 в качестве но-
вой исходной матрицы, выберем в ней максимальный по модулю
внедиагональный элемент и, занулив его с помощью вращения,
получим матрицу A2 . Продолжая действовать таким же обра-
(k)
зом и далее, построим последовательность матриц Ak = [aij ],
k = 0, 1, . . .
Пусть hk обозначает сумму квадратов внедиагональных эле-
ментов матрицы Ak . Тогда
2 k
hk  h0 → 0 при k → ∞.
3
Следовательно, при любых фиксированных i = j последователь-
(k)
ность внедиагональных элементов aij сходится к нулю при
k → ∞.

20.4. Вложенные подпоследовательности


Лемма об ограниченных последовательностях. Пусть
имеется конечное число ограниченных последовательностей
(k) (k)
{s1 }, . . . , {sm }, k = 1, 2, . . . Тогда можно выбрать
последовательность номеров k1 < k2 < . . . таким образом,
(k ) (k )
что каждая из подпоследовательностей {s1 l }, . . . , {sml },
l = 1, 2, . . . , будет сходящейся.
(k)
Доказательство. Из ограниченной последовательности {s1 }
(k )
выбираем сходящуюся подпоследовательность {s1 l } и вместо
исходных последовательностей рассматриваем подпоследователь-
(k ) (k )
ности {s1 l }, . . . , {sml }, l = 1, 2, . . . Они остаются,
конечно, ограниченными, и при этом первая из них будет
20.5. Диагонализация в пределе 185

сходящейся. Теперь уже из ограниченной последовательности


{sk2l } выберем сходящуюся подпоследовательность (подпоследо-
вательность подпоследовательности — по отношению к исход-
ной последовательности) и переходим к подпоследовательностям
(kl ) (kl )
{s1 i }, . . . , {sm i }, i = 1, 2, . . . Полученные вложенные подпо-
следовательности будут по-прежнему ограниченными, но сходя-
щимися являются уже первые две. И т. д. 

20.5. Диагонализация в пределе


Вернемся к методу вращений. Будут ли сходиться к ко-
нечным пределам последовательности диагональных элементов
(k)
aii — для нашей ближайшей цели не очень важно. Каждая
из них является ограниченной и поэтому обладает сходящейся
подпоследовательностью. Более того, по лемме об ограниченных
последовательностях имеется подпоследовательность матриц Ak ,
в которой каждая из последовательностей диагональных элемен-
тов сходится к какому-то пределу.
Чтобы не загромождать обозначения, будем считать, что Ak
и есть та самая подпоследовательность, для которой все после-
(k)
довательности aij являются сходящимися (как мы знаем, при
i = j к нулю). Пусть
(k)
lim aii = λi , i = 1, 2, 3.
k→∞
Понятно, что
Ak = Pk A0 Pk , k = 1, 2, . . . , (#)
(k)
где матрицы Pk = [pij ] являются произведениями использован-
ных матриц вращения (из соотношений (1), (2) или (3)). По-
этому при любом k матрица Pk является ортогональной (как
произведение ортогональных матриц). Следовательно, сумма
квадратов всех элементов матрицы Pk при любом k одинакова
(k)
(и равна 3). Значит, каждая последовательность pij является
ограниченной при k → ∞ и поэтому обладает сходящейся подпо-
следовательностью.
По лемме об ограниченных последовательностях существует
подпоследовательность матриц Pk , в которой каждая последова-
(k)
тельность pij будет сходящейся. Для упрощения обозначений
будем считать, что Pk и есть именно такая подпоследователь-
186 Лекция 20

ность. Пусть
(k)
lim pij = pij , i, j = 1, 2, 3.
k→∞
При каждом k выполняется равенство (#). Переходя к пределу
в соответствующих поэлементных равенствах, получаем
 
λ1 0 0
Λ ≡ 0 λ2 0 = P  A0 P.
0 0 λ3
Кроме того, для каждого k имеем: Pk Pk = I ⇒ P  P = I . В итоге
доказана следующая важная
Теорема. Для любой вещественной симметричной матрицы A
порядка 3 существуют ортогональная матрица P и диаго-
нальная матрица Λ такие, что
Λ = P  AP.

Следствие. Существует декартова система координат, в ко-


торой уравнение поверхности второго порядка имеет вид
x, y, z) = λ1 x
f ( 2 + λ2 y2 + λ3 z2 + 2b1 x
 + 2b2 y + 2b3 z + a = 0.

Замечание. В силу ортогональности матрицы P , равенство


Λ = P  AP выполняется в том и только том случае, когда
AP = P Λ. Последнее означает, что j -й столбец pj матрицы P
удовлетворяет уравнению Apj = λj pj ⇔ (A − λj I)pj = 0.
Учитывая, что pj = 0, находим: det(A − λj I) = 0. Таким об-
разом, числа λ1 , λ2 , λ3 — это корни кубического многочлена
f (λ) = det(A − λI). Если они уже найдены, то столбец pj можно
получить как решение однородной системы линейных алгебраи-
ческих уравнений (A − λj I)pj = 0.

20.6. Диагонализация вещественных симметричных


матриц
В действительности тот же метод вращений позволяет полу-
чить более общую теорему.
Теорема о диагонализации вещественных симметричных
матриц. Вещественная симметричная матрица A произволь-
ного порядка n приводится к диагональной матрице Λ с по-
мощью некоторой ортогональной матрицы P :
Λ = P  AP.
20.6. Диагонализация вещественных симметричных матриц 187

Доказательство. Начиная с A0 = A, построим последователь-


(k)
ность матриц Ak = [aij ], k = 0, 1, . . . , в которой Ak получается
из Ak−1 путем умножения слева и справа на матрицы вращения:
Ak = Rk Ak−1 Rk , (∗)
где Rk отличается от единичной матрицы I лишь четырьмя
элементами (2 × 2)-подматрицы, раположенной на пересечении
строк и столбцов с номерами i < j и равной


cos ϕ − sin ϕ
.
sin ϕ cos ϕ
Матрица Rk осуществляет поворот на угол ϕ в координатной
плоскости, определяемой номерами i = j . Любая матрица враще-
ния такого вида является, очевидно, ортогональной.
Ясно, что симметричность матрицы A0 = A наследуется все-
ми матрицами Ak . Из предыдущих исследований мы уже знаем,
(k) (k)
что ϕ можно выбрать таким образом, что aij = aji = 0. Обо-
значим через dk и hk суммы квадратов диагональных и внедиа-
гональных элементов матрицы Ak . Тогда

(k) 2 (k) 2 (k−1) 2 (k−1) 2 (k−1) 2
aii + ajj = aii + ajj + 2 aij ⇒

(k−1) 2
⇒ dk − dk−1 = 2 aij .

Для каждого k будем выбирать плоскость вращения (номе-


(k−1)
ра i < j ) таким образом, чтобы исключаемый элемент aij
был максимальным по модулю среди всех внедиагональных эле-
ментов матрицы Ak−1 . Общее число внедиагональных элементов
равно n2 − n. Поэтому

(k−1) 2 h
aij  2k−1 .
n −n
Отсюда, учитывая равенство dk + hk = dk−1 + hk−1 , получаем
 k
2 2
hk  hk−1 − 2 hk−1  1 − 2 h0 → 0 при k → ∞.
n −n n −n
Из соотношений (∗) вытекает, что
Ak = Pk APk , k = 1, 2, . . . ,
(k)
где для всех k матрицы Pk = [pij ] являются ортогональными
(как произведения ортогональных матриц).
188 Лекция 20

(k) (k)
Для любых фиксированных i, j последовательности aij , pij
являются ограниченными. По лемме об ограниченных последо-
вательностях существует последовательность номеров k1 <k2 < . . .
(k ) (k )
такая, что каждая из подпоследовательностей aij l , pij l будет
(k )
сходящейся. Заметим, что aij l → 0 при i = j . Пусть
(k ) (k )
lim aii l = λi , i = 1, . . . , n, lim pij l = pij , i, j = 1, . . . , n.
l→∞ l→∞
Введем матрицы
⎡ ⎤
λ1
Λ=⎣ ..
. ⎦, P = [pij ].
λn
Для всех l = 1, 2, . . . имеем: Akl = Pkl APkl . Переходя к пределу
в поэлементных равенствах, получаем
Λ = P  AP.
Из условий ортогональности Pkl Pkl = I вытекает, что в пределе
P  P = I . Значит, матрица P является ортогональной. 
Мы только что получили один из важнейших результатов —
как для самой теории матриц, так и для ее многочисленных при-
ложений. В нашем курсе мы еще вернемся к его обсуждению в
связи с рядом фундаментальных понятий линейной алгебры. На-
ше доказательство замечательно своей конструктивностью: оно
дает одновременно и метод приближенного вычисления матриц Λ
и P . Это один из ранних практических методов вычислительной
алгебры, предложенный К. Якоби в 1846 г. . 1)
Задача 1. Дана симметричная матрица A ∈ Rn×n с ненулевой
суммой элементов главной диагонали. Доказать существование ортого-
нальной матрицы Q ∈ Rn×n такой, что в матрице Q AQ все элементы
главной диагонали одинаковы.

1)
Последние результаты по изучению метода вращений принадлежат со-
всем недавнему прошлому: в 1990-х годах были обнаружены его особые воз-
можности, связанные с высокоточным вычислением малых по модулю элемен-
тов матрицы Λ.
Л е к ц и я 21

21.1. Приведенные уравнения поверхности второго


порядка
При изучении линий второго порядка мы установили, что
любая из них в какой-либо декартовой системе координат опи-
сывается одним из основных (как иногда говорят, приведенных)
уравнений:
(1) λ1 x2 + λ2 y 2 + c = 0, (2) λ2 y 2 + 2bx = 0, (3) λ2 y 2 + c = 0,
в которых все коэффициенты ненулевые, за исключением, быть
может, c. В случае поверхности второго порядка исходной точ-
кой для вывода приведенных уравнений является возникающее
в некоторой декартовой системе уравнение вида
λ1 x2 + λ2 y 2 + λ3 z 2 + 2b1 x + 2b2 y + 2b3 z + a = 0.
Если λ1 , λ2 , λ3 = 0, то с помощью переноса начала координат
(сдвига) можно получить уравнение вида
λ1 x2 + λ2 y 2 + λ3 z 2 + c = 0.
Пусть λ1 , λ2 = 0, λ3 = 0. Тогда в линейной части с помощью
сдвига можно убрать члены, содержащие x и y . В результате
появится уравнение вида λ1 x2 + λ2 y 2 + 2bz + c = 0. Если b = 0,
то сдвиг позволяет перейти к более простому уравнению λ1 x2 +
+ λ2 y 2 + 2bz = 0. Если же b = 0, то получается уравнение вида
λ1 x2 + λ2 y 2 + c = 0.
Теперь предположим, что λ1 = 0, λ2 = λ3 = 0. После исклю-
чения члена с x в линейной части (путем сдвига) получим урав-
нение λ1 x2 + 2b2 y + 2b3 z + c = 0. Далее, с помощью поворота
в плоскости координат y и z в линейной части можно избавиться
от члена, содержащего z :


cos ϕ − sin ϕ
[b2 b3 ] = [b 0] .
sin ϕ cos ϕ
В самом деле, выберем ϕ так, чтобы −b2 sin ϕ + b3 cos ϕ = 0.
Таким образом, имеется декартова система координат, в которой
190 Лекция 21

заданная поверхность описывается уравнением λ1 x2 + 2by + c =


= 0. Если b = 0, то с помощью сдвига легко перейти к уравнению
λ1 x2 + 2by = 0. Если b = 0, то получается уравнение λ1 x2 + c = 0.
В итоге доказано следующее
Утверждение. Для произвольной поверхности второго поряд-
ка в некоторой декартовой системе координат получается
приведенное уравнение одного из пяти типов:

1) λ1 x2 + λ2 y 2 + λ3 z 2 + c = 0,
2) λ1 x2 + λ2 y 2 + 2bz = 0,
3) λ1 x2 + λ2 y 2 + c = 0,
4) λ1 x2 + 2by = 0,
5) λ1 x2 + c = 0.

Все коэффициенты ненулевые, кроме, возможно, свободного


члена c.

21.2. Эллипсоид
Пусть в приведенном уравнении типа (1) коэффициенты
λ1 , λ2 , λ3 имеют одинаковый знак, противоположный знаку
свободного члена c. Тогда уравнение приводится к виду
x2 y2 z2
2
+ 2 + 2 = 1, a, b, c > 0.
a b c
Множество точек (x, y , z), удовлетворяющих этому уравнению,
называется эллипсоидом с полуосями a, b, c.
Заметим, что эллипсоид целиком содержится в параллелепи-
педе
|x|  a, |y|  b, |z|  c.

Ясно, что в сечении поверхности второго порядка плоскостью


получается некоторая линия второго порядка. Легко проверяет-
ся, что для эллипсоида в любом сечении плоскостью возникает
эллипс (вырождающийся в точку, когда плоскость касается эл-
липсоида).
Задача 1. Написать общее уравнение плоскости, проходящей че-
рез точку эллипсоида x2 /a2 + y 2 /b2 + z 2 /c2 = 1 и имеющей с ним
21.4. Линейчатая поверхность 191

ровно одну общую точку (такая плоскость называется касательной


плоскостью).
Задача 2. Доказать, что геометрическое место точек пересечения
взаимно ортогональных касательных плоскостей к эллипсоиду x2 /a2 +
+ y 2 /b2 + z 2 /c2 = 1 есть сфера x2 + y 2 + z 2 = a2 + b2 + c2 .

21.3. Однополостный гиперболоид


Пусть приведенное уравнение имеет тип (1) с отличным от
нуля свободным членом. Предположим, что знак одного из коэф-
фициентов при квадратах равен знаку свободного члена и проти-
воположен знаку двух других коэффициентов. Тогда в некоторой
декартовой системе координат получается уравнение вида:
x2 y2 z2
+ − = 1, a, b, c > 0.
a2 b2 c2
Множество удовлетворяющих ему точек (x, y , z) называется од-
нополостным гиперболоидом.
В любом сечении однополостного гиперболоида плоскостью
x + D = 0 или y + D = 0 возникает гипербола.
По отношению к однополостному гиперболоиду множество
всех точек пространства разбивается на три части:
x2 y2 z2
+ − =1 (точки поверхности),
a2 b2 c2
x2 y2 z2
+ − < 1 (внутренние точки),
a2 b2 c2
x2 y2 z2
+ − > 1 (внешние точки).
a2 b2 c2
Множество внутренних точек является связным: вместе с лю-
быми двумя точками оно целиком содержит все точки некоторой
соединяющей их ломаной (состоящей из конечного числа отрез-
ков) линии. Отсюда и название — «однополостный».

21.4. Линейчатая поверхность


Интересно отметить, что однополостный гиперболоид явля-
ется примером линейчатой поверхности. Так называются по-
верхности, состоящие из всех точек некоторого бесконечного
множества прямых.
192 Лекция 21

Утверждение. Через каждую точку однополостного гипербо-


лоида S проходят в точности две различные прямые, все
точки которых принадлежат S .
Доказательство. Изменив масштаб, перейдем к аффинной си-
стеме координат, в которой уравнение поверхности S будет иметь
вид x2 + y 2 − z 2 = 1. Пусть прямая l описывается параметриче-
скими уравнениями
x = x0 + p1 t, y = y0 + p2 t, z = z0 + p3 t,
а направляющий вектор (p1 , p2 , p3 ) выбирается так, чтобы все
точки этой прямой принадлежали поверхности S :
(x0 + p1 t)2 + (y0 + p2 t)2 − (z0 + p3 t)2 = 1 ∀ t ∈ R ⇔

⎨ p21 + p22 − p23 = 0,
⇔ p1 x0 + p2 y0 − p3 z0 = 0,
⎩ 2
x0 + y02 − z02 = 1.
Легко видеть, что p3 = 0. Поэтому направляющий вектор можно
нормировать, взяв p3 = 1. Тогда p21 + p22 = 1, p1 x0 + p2 y0 = z0 .
Предположим, что y0 = 0 ⇒ p2 = (z0 − p1 x0 )/y0 ⇒ p21 +
+ (z0 − p1 x0 )2 /y02 = 1. Таким образом,
(x20 + y02 )p21 − 2(x0 z0 )p1 + (z02 − y02 ) = 0.
Вычисляем дискриминант: D = x20 z02 − (x20 + y02 )(z02 − y02 ) =
= y02 (x20 + y02 − z02 ) = y02 . Поскольку y0 = 0, для p1 получаем
в точности два различных значения. Поскольку p3 = 1, соот-
ветствующие направляющие векторы, очевидно, неколлинеарны.
Они дают две различные прямые, целиком принадлежащие S
и проходящие через точку (x0 , y0 , z0 ). Случай x0 = 0 разбирается
аналогично. 
Замечание. Для поиска тех же самых прямых на поверхности S
можно записать ее уравнение в виде
x z x z y
y

− + = 1− 1+
a c a c b b
и рассмотреть два семейства пар плоскостей:
x z y
x z y

α − =β 1− , β + =α 1+ ;
ax cz b
y
a
x
c
z
y
b
γ − =δ 1+ , δ + =γ 1− ,
a c b a c b
определяемых парами не равных одновременно нулю параметров
α, β и γ , δ . Можно доказать, что для каждой пары плоскостей
в пересечении получается прямая, целиком принадлежащая S .
21.7. Эллиптический параболоид 193

21.5. Двуполостный гиперболоид


Пусть в приведенном уравнении типа (1) знак одного из
коэффициентов при квадратах противоположен знаку свободного
члена и знаку двух других коэффициентов. Тогда оно приводится
к виду
x2 y2 z2
2
+ 2
− 2
= −1, a, b, c > 0.
a b c
Множество точек (x, y , z), удовлетворяющих данному уравне-
нию, называется двуполостным гиперболоидом.
Легко видеть,что двуполостный гиперболоид не имеет точек
в полосе |z| < c. Множество его внутренних точек, определяемое
x2 y2 z2
неравенством 2 + 2 − 2 < −1, разбивается на два связных
a b c
множества. Отсюда и название — «двуполостный».

21.6. Эллиптический конус


Если в приведенном уравнении типа (1) знак одного из ко-
эффициентов при квадратах противоположен знаку двух других
коэффициентов, а свободный член равен нулю, то уравнение
можно записать в виде
x2 y2 z2
+ − = 0.
a2 b2 c2
Множество удовлетворяющих ему точек (x, y , z) называется эл-
липтическим конусом.
Задача 1. Даны плоскость Ax + By + Cz + D = 0 при условии
D = 0 и круговой конус x2 + y 2 − z 2 = 0. Докажите, что в сечении ко-
нуса данной плоскостью получается эллипс, гипербола, парабола в том
и только том случае, когда A2 + B 2 < C 2 , A2 + B 2 > C 2 , A2 + B 2 = C 2
соответственно.

21.7. Эллиптический параболоид


Теперь рассмотрим приведенное уравнение типа (2). Предпо-
ложим, что λ1 и λ2 имеют одинаковые знаки. Тогда в некоторой
декартовой системе данная поверхность описывается уравнением
x2 y2
+ = z, a, b > 0.
a2 b2
Множество удовлетворяющих ему точек называется эллиптиче-
ским параболоидом.
7 Е. Е. Тыртышников
194 Лекция 21

Название навеяно рассмотрением сечений в плоскостях z +


+ D = 0 (эллипсы) и в плоскостях x + D = 0 или y + D = 0
(параболы).

21.8. Гиперболический параболоид


Если в приведенном уравнении типа (2) коэффициенты при
квадратах имеют разные знаки, то получается уравнение
x2 y2
− = z, a, b > 0,
a2 b2
которое определяет гиперболический параболоид.
Название объясняется видом кривых, получаемых в сечениях
плоскостями z + D = 0 (гиперболы) и плоскостями x + D = 0
или y + D = 0 (параболы).
Это еще один пример линейчатой поверхности: каждая точ-
ка гиперболического параболоида принадлежит двум различ-
ным прямым, целиком принадлежащим данной поверхности.
Доказательство проводится по аналогии со случаем однополост-
ного гиперболоида.

21.9. Цилиндрические поверхности


Приведенные уравнения типов (3)–(5) не зависят от z . Поэто-
му кривые второго порядка в сечениях любой плоскостью вида
z + D = 0 одинаковы. Соответствующие поверхности называются
цилиндрическими.
Л е к ц и я 22

22.1. Нормированное пространство


В дальнейшем любые линейные пространства будут предпо-
лагаться вещественными или комплексными. Наша ближайшая
цель — ввести важное обобщение понятия длины геометрическо-
го вектора и модуля комплексного числа.
Пусть V — линейное пространство над полем P , где P = R
или P = C. Каждому вектору x ∈ V припишем вещественное
число ||x|| так, чтобы выполнялись следущие свойства:
1) ||x||  0 ∀ x ∈ V , ||x|| = 0 ⇔ x = 0;
2) ||αx|| = |α| ||x|| ∀ x ∈ V , ∀ α ∈ P (положительная одно-
родность);
3) ||x + y||  ||x|| + ||y|| ∀ x, y ∈ V (неравенство треуголь-
ника).
Число ||x|| называется нормой вектора x. Линейное простран-
ство V , снабженное нормой, называется нормированным про-
странством.
В одном и том же линейном пространстве норму можно
ввести очень многими способами. Например, пусть V = Cn
и λ1 , . . . , λn — произвольные положительные числа. Если x =
= [x1 , . . . , xn ] , то пусть

n
||x|| ≡ λi |xi |.
i=1
Легко проверить, что соответствие x → ||x|| обладает свойствами
(1), (2), (3).
Чтобы построить другие, наиболее популярные примеры норм
в Cn , нам понадобятся некоторые неравенства, опирающиеся на
свойства выпуклых функций.
Задача 1. Можно ли ввести норму на R2 так, чтобы множество
всех векторов x с нормой ||x||  1 имело форму треугольника?
7*
196 Лекция 22

22.2. Выпуклые функции и неравенства


Вещественная функция f (x) называется выпуклой на интер-
вале I = (a, b), если для любых x, y ∈ I и любого числа 0  t  1
выполняется неравенство
f (tx + (1 − t)y)  tf (x) + (1 − t)f (y). (∗)
Функция g(x) называется вогнутой на I , если f (x) ≡ −g(x)
выпукла на I .
Теорема. Пусть функция f (x) дважды дифференцируема на I
и f  (x) — ее вторая производная. Если f  (x)  0 при всех
x ∈ I , то f (x) выпукла на I .
Доказательство. При x = y неравенство (∗) превращается в ра-
венство. При t = 0 или t = 1 равенство получается при любых
x, y . Поэтому предположим, что a < x < y < b и 0 < t < 1. Тогда
для z = tx + (1 − t)y имеем: x < z < y . По теореме Лагранжа из
математического анализа, существуют точки ξ и η такие, что
f (z) − f (x)
= f  (ξ), x < ξ < z,
z−x
f (y) − f (z)
= f  (η), z < η < y.
y−z
По той же теореме для некоторой точки ζ получаем
f (y) − f (z) f (z) − f (x)
− = f  (ζ) (η − ξ)  0, ξ < ζ < η.
y−z z−x
Остается учесть, что t = (y − z)/(y − x), и заметить, что левая
часть имеет вид
f (x)(y − z) + f (y)(z − x) − f (z)(y − x)
=
(y − z)(z − x)
tf (x) + (1 − t)f (y) − f (z)
= (y − x). 
(y − z)(z − x)
Следствие. Функция ln x является вогнутой.
Доказательство. (ln x) = −1/x2 < 0. 
Отсюда, например, можно сразу же вывести неравенство между
средним арифметическим и средним геометрическим чисел x1 , . . .
. . . , xn > 0:

n x . . . x  x1 + . . . + xn .
1 n
n
В самом деле, используя вогнутость логарифма, находим

x + . . . + xn ln x1 + . . . + ln xn
ln 1   ln n x1 . . . xn . 
n n
22.3. Неравенства Гёльдера и Минковского 197

22.3. Неравенства Гёльдера и Минковского


Лемма. Пусть положительные числа p, q таковы, что
1 1
+ = 1. Тогда
p q
ap bq
ab  + ∀ a, b  0.
p q

Доказательство. В силу вогнутости логарифма


ln ap ln bq
ap bq
ln (ab) = +  ln + . 
p q p q
Неравенство Гёльдера. В условиях леммы для любых ком-
плексных чисел x1 , . . . , xn и y1 , . . . , yn справедливо неравен-
ство  n   n 1/p  n 1/q
   
 
 xi yi   |xi | p
|yi | q
.
 
i=1 i=1 i=1

Доказательство. Пусть
 n 1/p  n 1/q
 
a= |xi |p , b= |yi |q .
i=1 i=1
В случае a = 0 или b = 0 неравенство очевидно. Если a = 0
и b = 0, то, используя лемму для чисел |xi |/a и |yi |/b, находим
|xi |p /ap |y |q /bq
(|xi |/a) (|yi |/b)  + i , i = 1, . . . , n.
p q
Складывая эти неравенства, получаем
 n
 1 1
|xi yi | /(ab)  + = 1. 
p q
i=1
Неравенство Минковского. Пусть p  1, x1 , . . . , xn и y1 , . . .
. . . , yn — произвольные комплексные числа. Тогда
 n 1/p  n 1/p  n 1/p
  
|xi + yi | p
 |xi | p
+ |yi | p
.
i=1 i=1 i=1
Доказательство. При p = 1 неравенство проверяется очевид-
ным образом. В случае p > 1 имеем
198 Лекция 22


n 
n 
n
|xi + yi | 
p
|xi + yi | p−1
|xi + yi |  |xi | |xi + yi |p−1 +
i=1 i=1 i=1


n
+ |yi | |xi + yi |p−1 .
i=1

Для каждой из сумм справа применим неравенство Гёльдера,


1 1
взяв q = p/(p − 1) ⇒ + = 1. Получаем
p q


n
|xi + yi |p 
i=1
⎛ 1/p  n 1/p ⎞  n 1/q
n  
⎝ |xi | p
+ |yi | p ⎠ |xi + yi | (p− 1)q
.
i=1 i=1 i=1

Остается заметить, что (p − 1)q = p и 1 − 1/q = 1/p. 

22.4. Нормы Гёльдера


Пусть x = [x1 , . . . , xn ] ∈ Cn . При p  1 положим
 n 1/p

||x||p = |xi | p
.
i=1

Заметим также, что при фиксированном x величина ||x||p при


p → ∞ имеет предел, равный max |xi |. Поэтому разумно при-
1in
нять обозначение
||x||∞ = max |xi |.
1in

Величины ||x||p называются p-нормами или нормами Гёльдера.


Неравенства Гёльдера и Минковского сохраняют силу при
p = ∞ (в этом случае q = 1). Для доказательства достаточно
перейти к пределу при p → ∞.
Теорема. При любом p  1, включая p = ∞, величина ||x||p
является нормой на Cn .
22.5. Зачем нужны нормы? 199

Доказательство. Свойства (1) и (2) нормы очевидны. Неравен-


ство треугольника есть не что иное, как неравенство Минков-
ского. 
Задача 1. Многие нормы на Rn как функции координат вектора
x = [x1 , . . . , xn ] обладают свойством f (x1 , . . . , xn ) = f (|x1 |, . . . , |xn |).
Приведите пример нормы, которая этим свойством не обладает.

22.5. Зачем нужны нормы?


Прежде всего это удобный инструмент для изучения пределов
в линейном пространстве.
Последовательность векторов xk ∈ V называется сходящейся
к вектору x ∈ V , если числовая последовательность ||xk − x||
сходится к нулю при k → ∞. Вектор x называется пределом
последовательности xk . Обозначения: x = lim xk или xk → x
k→∞
при x → ∞.
Последовательность, сходящаяся к какому-нибудь вектору,
называется просто сходящейся. Это оправдано, поскольку двух
различных пределов быть не может. Если xk → x и xk → y , то
||x − y|| = ||(x − xk ) − (y − xk ||  ||x − xk || +
+ ||y − xk || → 0 ⇒ x = y. 
В конечномерном пространстве V при изучении сходимо-
сти можно, в принципе, обойтись и без норм. Фиксировав
какой-нибудь базис e1 , . . . , en ∈ V , мы могли бы рассмотреть
разложения
n
k
x = xki ei
i=1

и называть последовательность векторов xk сходящейся, если


сходятся координатные последовательности xki при всех i. Такое
понятие сходимости не будет зависеть от выбора базиса (до-
кажите!). Легко видеть также, что из покоординатной сходи-
мости в конечномерном пространстве вытекает сходимость
по любой
 норме. Действительно, пусть xki → xi . Тогда, взяв
x = xi ei , получаем
i

n
||xk − x||  |xki − xi | ||ei ||. 
i=1
200 Лекция 22

Более того, имеет место и менее очевидный факт: в конечно-


мерном пространстве из сходимости по любой норме вытекает
покоординатная сходимость. Мы скоро это докажем.
Тем не менее даже в конечномерном пространстве исследо-
вать сходимость с помощью норм очень удобно: все сводится
к изучению лишь одной числовой последовательности ||xk − x||.
Это тем более важно, когда пространство бесконечномерно!

22.6. Нормы в бесконечномерном пространстве


ПРИМЕР 1. Пусть C[a, b] — линейное пространство функ-
ций, непрерывных на отрезке [a, b]. Для функции f ∈ C[a, b]
наиболее часто используется норма
||f ||C = max |f (x)|,
axb
называемая C -нормой (иногда также равномерной или чебы-
шёвской 1)).
ПРИМЕР 2. Пусть C 1 [a, b] — линейное пространство функ-
ций, непрерывных на отрезке [a, b] вместе с первой производ-
ной 2). В данном случае норму можно ввести, например, так:
||f ||C 1 = max (|f (x)| + |f  (x)|).
axb
Заметим, что сходимость последовательности функций из
C 1 [a, b] по норме C 1 влечет за собой сходимость по норме C .
Обратное, однако, не верно: последовательность функций
sin kx
f k (x) = √
k
принадлежит C 1 [a, b]
и сходится по норме C к нулю, но не
1
сходится по норме C , так как не является ограниченной по этой
норме.
Таким образом, в бесконечномерных пространствах разные
нормы определяют, вообще говоря, разные типы сходимости.
В этом отношении конечномерные пространства отличаются
принципиально: в них сходимость по какой-либо норме равно-
сильна сходимости по любой другой норме — это фундаменталь-
ный факт, который скоро будет доказан. Он, казалось бы, озна-
1)
В честь знаменитого русского математика Пафнутия Львовича Чебышёва
(1821–1894).
2)
Чтобы рассматривать f  (x) в точках a и b, можно считать функцию f (x)
определенной и дифференцируемой на более широком интервале, накрываю-
щем [a, b].
22.8. Пределы и полнота 201

чает, что в конечномерных пространствах можно ограничиться


изучением какой-нибудь одной нормы. Тем не менее это не так!
В огромном числе вопросов конечномерные пространства воз-
никают как подпространства бесконечномерного нормированного
пространства. Поэтому нормы в них должны порождаться нор-
мой соответствующего бесконечномерного пространства. А мы
только что выяснили, что для бесконечномерных пространств
разные нормы могут различаться существенным образом.
Задача 1. Докажите, что последовательность функций f k (x) =
= sin kx/k не является сходящейся по норме C 1 .

22.7. Метрическое пространство


В понятии предела аксиомы линейного пространства исполь-
зуются, на самом деле, не очень существенным образом — норма
разности двух векторов легко заменяется более общим понятием
расстояния между двумя векторами.
Пусть M — непустое множество и ρ(x, y) — вещественная
функция от элементов x, y ∈ M , обладающая следующими свой-
ствами:
1) ρ(x, y)  0 ∀ x, y ∈ M , ρ(x, y) = 0 ⇔ x = y ;
2) ρ(x, y) = ρ(y , x) ∀ x, y ∈ M ;
3) ρ(x, y)  ρ(x, z) + ρ(z , y) ∀ x, y , z ∈ M .
В таких случаях M называется метрическим пространством,
а ρ(x, y) — расстоянием между элементами x и y .
Любое нормированное пространство является метрическим
пространством с расстоянием
ρ(x, y) = ||x − y||.
Однако метрическое пространство в общем случае не пред-
полагает наличия каких-либо операций над его элементами. На-
пример, произвольное непустое множество M будет метрическим
пространством, если ρ(x, y) = 0 при x = y и ρ(x, y) = 1 при
x = y .

22.8. Пределы и полнота


Пусть M — метрическое пространство. Последовательность
элементов xk ∈ M называется сходящейся в M , если суще-
ствует элемент x ∈ M такой, что числовая последовательность
ρ(xk , x) сходится к нулю при k → ∞. Как и в нормированном
202 Лекция 22

пространстве, двух разных пределов быть не может: если xk → x


и xk → y , то
ρ(x, y)  ρ(x, xk ) + ρ(xk , y) → 0 ⇒ x = y.
Последовательность xk ∈ M называется фундаментальной
последовательностью или последовательностью Коши 1), если
для любого ε > 0 существует номер N = N (ε) такой, что при
k , l > N выполняется неравенство ρ(xk , xl ) < ε.
Из неравенства ρ(xk , xl )  ρ(xk , x) + ρ(x, xl ) следует, что
любая сходящаяся последовательность является последова-
тельностью Коши. Обратное в общем случае не верно. На-
пример, любой интервал M = (a, b) вещественной оси мож-
но рассматривать как метрическое пространство с расстоянием
ρ(x, y) = |x − y|. Последовательность xk = a + (b − a)/k является
фундаментальной, но не может сходиться ни к какому элементу
из M (ее пределом должно бы быть число a, но a ∈ / M ).
Метрическое пространство называется полным, если в нем
любая фундаментальная последовательность является схо-
дящейся.
В начальных курсах математического анализа обычно до-
казывается, что фундаментальные последовательности чисел из
R являются сходящимися в R — таким образом, метрическое
пространство R с расстоянием ρ(x, y) = |x − y| является полным.
Все понятия и факты, полученные для метрических про-
странств, переносятся на произвольные нормированные про-
странства. При этом всегда предполагается, что расстояние в них
вводится с помощью нормы: ρ(x, y) = ||x − y||. Полное нормиро-
ванное пространство называется также банаховым. 2)
Задача 1. Докажите, что функция ρ(x, y) = |x − y|/(1 + |x − y|)
задает расстояние в вещественном пространстве R. Порождается ли
оно какой-либо нормой? Будет ли пространство полным?

Еще одно (красивое, но редко используемое) название — сходящаяся


1)

в себе.
2)
В честь польского математика, профессора Львовского университета Сте-
фана Банаха (1892–1945).
Л е к ц и я 23

23.1. Множества в метрическом пространстве


Пусть M — метрическое пространство, a ∈ M и r > 0. Мно-
жества
M (a, r) = {x ∈ M : ρ(a, x) < r}, M (a, r) = {x ∈ M : ρ(a, x)  r}
называются соответственно открытым шаром и замкнутым
шаром радиуса r с центром в точке a.
Пусть S — какое-либо множество точек в метрическом про-
странстве M . Множество S называется ограниченным, если оно
целиком содержится в некотором шаре.
Точка a ∈ S называется внутренней для S , если она содер-
жится в S вместе с некоторым открытым шаром. Множество S
называется открытым в M , если любая его точка является
внутренней. Пустое множество по определению считается от-
крытым.
Пусть x ∈ M и существует последовательность точек xk ∈ S ,
сходящаяся к x. В этом случае x называется точкой прикосно-
вения для S . Если xk = x для всех k , то x называется предельной
точкой для S . Очевидно, что любая точка прикосновения, не
принадлежащая множеству S , является для него предельной.
Замыканием множества S называется его объединение со
всеми его предельными точками. Обозначение: [S]. Множество S
называется замкнутым, если оно содержит все свои предельные
точки: [S] = S . Несложно проверить, что S замкнуто в том
и только в том случае, когда дополнительное в M множество
O = M \S является открытым.
Задача 1. Всегда ли замыкание открытого шара совпадает с за-
мкнутым шаром с тем же центром и радиусом?
Задача 2. Пусть M = N, а расстояние между натуральными чис-
лами m, n определяется как ρ(m, n) = 1 + min{1/m, 1/n} при m = n
204 Лекция 23

и 0 при m = n. Докажите, что M — полное метрическое пространство.


Докажите также, что замкнутые шары
M (1, 1 + 1/2) ⊃ M (2, 1 + 1/3) ⊃ M (3, 1 + 1/4) ⊃ ...

вложены, но имеют пустое пересечение.


Множество S называется компактным, если из любой по-
следовательности точек xk ∈ S можно выделить подпоследова-
тельность, сходящуюся к некоторой точке x ∈ S .
Ясно, что компактное множество обязано быть замкнутым.
Обратное не верно: например, S = M всегда является замкну-
тым множеством, но может и не быть компактным. Заметим
также, что любое компактное множество S является ограничен-
ным (неограниченная последовательность не может быть схо-
дящейся).
В начальных курсах анализа рассматривается метрическое
пространство R с расстоянием ρ(x, y) = |x − y|, а компактным
принято называть любое замкнутое и ограниченное множество
точек из R. В данном случае это определение равносильно наше-
му определению компактности. Более того, мы скоро докажем,
что эти два определения равносильны и в случае произвольных
конечномерных нормированных пространств. Однако в бесконеч-
номерных пространствах замкнутость и ограниченность недоста-
точны для выделения сходящейся подпоследовательности.
Говоря о расстоянии в линейных пространствах, мы всегда
будем полагать, что оно вводится с помощью какой-либо нормы.
Задача 3. Верно ли, что замыкание выпуклого множества являет-
ся выпуклым? Верно ли, что множество внутренних точек выпуклого
множества будет выпуклым?

23.2. Компактность и непрерывность


Вещественная функция f (x), определенная для точек x мет-
рического пространства M , называется непрерывной в точке
x ∈ M , если для любой последовательности xk , сходящейся к x,
последовательность значений f (xk ) сходится к f (x).
Теорема Вейерштрасса. Для любой вещественной функции
f (x), непрерывной во всех точках компактного множества S ,
существуют точки xmin , xmax ∈ S такие, что f (xmin )  f (x) 
 f (xmin ) для всех x ∈ S .
Доказательство. Если предположить, что f (xk ) > k для некото-
рой последовательности точек xk ∈ S , то возникает противоречие
с возможностью выделения сходящейся подпоследовательности:
23.3. Компактность единичной сферы 205

если xki → x, то f (xki ) → f (x), но f (xki ) не может сходиться,


так как не является ограниченной. Поэтому f (x) ограничена
сверху. Пусть cmax — точная верхняя грань множества значений
{f (x), x ∈ S}. Тогда для каждого k найдется точка xk ∈ S такая,
что cmax − 1/k  f (xk )  cmax . Выберем сходящуюся подпосле-
довательность xki → x и перейдем в последних неравенствах
к пределу ⇒ f (x) = cmax .
Ограниченность снизу и существование точки минимума до-
казывается переходом к g(x) = −f (x). 

23.3. Компактность единичной сферы


Рассмотрим единичную сферу в пространстве Cn относитель-
но 2-нормы:

n

S2 = {x ∈ C : ||x||2 = 1} = {x = [x1 , . . . , xn ] :
n
|x|2i = 1}.
i=1
Лемма 1. Единичная сфера S2 в пространстве Cn компактна
относительно 2-нормы.
Доказательство. Рассмотрим произвольную последовательность
векторов
xk = [xk1 , . . . , xkn ] ∈ S2 .
Соответствующие координатные последовательности удовлетво-
ряют неравенствам
|xk1 |  1, |xk2 |  1, . . . , |xkn |  1.
Согласно лемме об ограниченных последовательностях
(см. п. 20.4), существует подпоследовательность номеров
k1 < k2 < . . . такая, что каждая из координатных последователь-
ностей xki l будет сходиться и удовлетворять равенству

n
|xki l |2 = 1. (∗)
i=1

Пусть xi = lim xki l и x = [x1 , . . . , xn ] . Тогда


l→∞
 n 1/2

||xkl − x||2 = |xki l − xi |2 → 0.
i=1
Переходя в (∗) пределу, получаем x ∈ S2 . 
206 Лекция 23

Лемма 2. Для произвольной нормы || · || в пространстве


Cn функция f (x) = ||x|| является непрерывной относительно
2-нормы.
Доказательство. Пусть xk = [xk1 , . . . , xkn ] → x = [x1 , . . . , xn ] .
Тогда, используя неравенство треугольника для норм, находим

|f (xk ) − f (x)| = | ||xk || − ||x|| |  ||xk − x||  |xki − xi | ||ei ||,
1in

где ei = [0, . . . , 1, . . . , 0] — вектор из нулей, кроме i-й компонен-


ты, равной 1. Правая часть стремится к нулю при
 n 1/2

||xk − x||2 = |xki − xi |2 → 0. 
i=1

Лемма 3. Для любой нормы || · || на Cn существуют констан-


ты c1 , c2 > 0 такие, что
c1  ||x||  c2 ∀ x ∈ S2 .
При этом c1 = ||x1 ||, c2 = ||x2 || для некоторых векторов x1 ,
x2 ∈ S2 .
Доказательство. Достаточно заметить, что функция f (x) = ||x||
непрерывна относительно 2-нормы на множестве S2 , компактном
относительно 2-нормы. 

23.4. Эквивалентные нормы


Две нормы || · ||(a) и || · ||(b) на одном и том же линейном
пространстве V называются эквивалентными, если существуют
константы c1 , c2 > 0 такие, что
c1 ||x||(a)  ||x||(b)  c2 ||x||(a) ∀ x ∈ V.
Теорема. Если V конечномерно, то любые нормы на нем экви-
валентны.
Доказательство. Прежде всего заметим, что любая норма || · ||
на Cn эквивалентна || · ||2 . Пусть x ∈ Cn ⇒ x/||x||2 ∈ S2 .
По лемме 3, c1  x/||x||2   c2 ⇒
c1 ||x||2  ||x||  c2 ||x||2 ∀ x ∈ Cn .
Отсюда легко вывести эквивалентность любых двух норм на Cn .
23.5. Компактность замкнутых ограниченных множеств 207

В случае произвольного конечномерного пространства V


с нормой || · ||V фиксируем в нем произвольный базис e1 , . . . , en
и рассмотрим взаимно-однозначное соответствие

n

v ↔ [x1 , . . . , xn ] , v= xi ei .
i=1
Используя его, введем норму на Cn следующим образом:
, n ,
, ,
, ,
||[x1 , . . . , xn ] ||V ≡ , xi ei , .
, ,
i=1 V
Свойства нормы проверяются непосредственно. Введем также
еще одну норму на V :
, n ,
, ,
, ,
, xi ei , ≡ ||[x1 , . . . , xn ] ||2 .
, ,
i=1 2
Уже установленная эквивалентность любых двух норм на Cn
доказывает эквиваленость данных (а значит, и любых) норм
в пространстве V . 
Следствие. Сходимость по любой норме в конечномерном про-
странстве равносильна поокоординатной сходимости.
Заметим, что нам уже встречались нормы, которые не могут
быть эквивалентными: это C -норма и C 1 -норма в пространстве
C 1 [a, b] функций, непрерывных на отрезке [a, b] вместе с первой
производной:
||f ||C = max |f (x)|, ||f ||C 1 = max (|f (x)| + |f  (x)|).
axb axb

В самом деле, последовательность функций f k (x) = sin kx/ k
является сходящейся в норме C , но расходится в норме C 1 .
Отсюда, кстати, получаем (не очень прямое!) доказательство
бесконечномерности линейного пространства C 1 [a, b].

23.5. Компактность замкнутых ограниченных


множеств
Теорема. В конечномерном нормированном пространстве мно-
жество является компактным тогда и только тогда, когда
оно замкнуто и ограничено.
Доказательство. Мы уже знаем, что компактное множество
в метрическом пространстве всегда является замкнутым и огра-
ниченным. Пусть множество S замкнуто и ограничено относи-
тельно какой-либо нормы в Cn . В силу эквивалентности норм
208 Лекция 23

в конечномерном пространстве, S также замкнуто и ограниче-


но относительно 2-нормы. Поэтому любая последовательность
векторов из S имеет ограниченные координатные последова-
тельности. По лемме об ограниченных последовательностях мы
можем выбрать подпоследовательность, сходящуюся в 2-норме
к какому-то вектору x ∈ S . Эта же подпоследовательность будет
сходиться и относительно любой другой нормы. 
Отсюда вытекает, например, компактность единичной сферы
и компактность замкнутого шара в любом конечномерном про-
странстве относительно любой нормы.

23.6. Наилучшие приближения


Пусть x ∈ V и L — непустое множество векторов из V .
Величину
γ = inf ||x − z||
z∈L
называют расстоянием между x и L. Вектор z0 ∈ L называется
элементом наилучшего приближения для x на L, если
γ = ||x − z0 ||.
Лемма о наилучшем приближении. Пусть L — конечномерное
подпространство в нормированном пространстве V . Тогда
для любого x ∈ V существует вектор z0 ∈ L такой, что
||x − z0 ||  ||x − z|| ∀ z ∈ L.
Доказательство. Фиксируем ε > 0 и рассмотрим любой век-
тор z такой, что ||x − z||  γ + ε. Отсюда ||z||  R ≡ γ + ε + ||x||.
Поэтому очевидно, что
γ= inf ||x − z||.
z∈L, ||z||R
Функция f (z) = ||x − z|| непрерывна на замкнутом шаре ||z|| 
 R конечномерного пространства L. По теореме Вейерштрасса
γ = ||x − z0 || для некоторого z0 ∈ L. 
Заметим, что существование элемента наилучшего прибли-
жения очевидно также для компактных множеств L.
Из леммы о наилучшем приближении вытекает, в частности,
что для всякой непрерывной функции f (x) на отрезке [a, b] суще-
ствует многочлен pn (x) степени не выше n такой, что для любого
многочлена gn (x) степени не выше n имеет место неравенство
||f (x) − pn (x)||C[a,b]  ||f (x) − gn (x)||C[a,b] .
Многочлены pn (x) называются многочленами наилучшего рав-
номерного приближения для f (x) и впервые были изучены
23.6. Наилучшие приближения 209

П. Л. Чебышёвым (кстати, в связи с практической задачей меха-


ники). 1)
Задача 1. Докажите, что функция Tn (x) = cos(n arccos x) при
−1  x  1 является многочленом степени n со старшим коэффи-
циентом 2n−1 . Докажите, что для любого многочлена pn (x) степе-
ни n с тем же старшим коэффициентом выполняется неравенство
||Tn (x)||C[−1,1]  ||pn (x)||C[−1,1] . 2)

1)
В частности, многочлен pn−1 (x) для функции f (x) = xn ∈ C[−1, 1] имеет
вид pn−1 (x) = xn − 21−n cos(n arccos x), −1  x  1.
2)
Говорят, что многочлены Tn (x) наименее уклоняются от нуля (среди
всех многочленов той же степени и с тем же старшим коэффициентом).
Многочлены Tn (x) называются многочленами Чебышёва.
Л е к ц и я 24

24.1. Евклидово пространство


Пусть V — вещественное линейное пространство, на котором
каждой упорядоченной паре векторов x, y ∈ V поставлено в со-
ответствие вещественное число (x, y) таким образом, что:
1) (x, x)  0 ∀ x ∈ V ; (x, x) = 0 ⇔ x = 0;
2) (x, y) = (y , x) ∀ x, y ∈ V ;
3) (x + y , z) = (x, z) + (y , z) ∀ x, y , z ∈ V ;
4) (αx, y) = α(x, y) ∀ α ∈ R, ∀ x ∈ V .
Число (x, y) называется скалярным произведением векторов x
и y . Вещественное линейное пространство со скалярным произ-
ведением называется евклидовым.
В Rn скалярное произведение векторов x = [x1 , . . . , xn ] , y =
= [y1 , . . . , yn ] часто вводится как сумма парных произведений
координат:

n
(x, y) = xi yi = y  x. (∗)
i=1
Оно называется естественным скалярным произведением на Rn .
Но на Rn скалярное произведение можно ввести и многи-
ми другими способами: например, если фиксировать числа
λ1 , . . . , λn > 0, то выражение
⎡ ⎤
n λ1 0
(x, y) = λi xi yi = y  ⎣ ..
. ⎦x
i=1 0 λn
обладает свойствами (1)–(4) и, следовательно, задает скалярное
произведение.

24.2. Унитарное пространство


В Cn выражение (∗), очевидно, уже не является скалярным
произведением: пусть n = 2 и x = [1, i] , тогда (x, x) = 12 + i2 =
= 0. Вообще, в ненулевом комплексном пространстве аксиомы
24.3. Билинейные и полуторалинейные формы 211

(1), (4) не совместимы с аксиомой (2): (ix, ix) = −(x, x) ⇒


если (x, x) > 0, то (ix, ix) < 0.
Пусть V — комплексное линейное пространство. Теперь при
определении скалярного произведения (x, y) предполагается, что
число (x, y) в общем случае комплексное, а набор аксиом моди-
фицируется таким образом:
1 ) (x, x)  0 ∀ x ∈ V ; (x, x) = 0 ⇔ x = 0;
2 ) (x, y) = (y , x) ∀ x, y ∈ V (черта означает комплексное
сопряжение);
3 ) (x + y , z) = (x, z) + (y , z) ∀ x, y , z ∈ V ;
4 ) (αx, y) = α(x, y) ∀ α ∈ C, ∀ x ∈ V .
Комплексное линейное пространство со скалярным произведени-
ем называется унитарным.
Аксиомы евклидова и унитарного пространств отличаются
лишь комплекным сопряжением во второй аксиоме и, конеч-
но, тем, что в вещественном пространстве все числа и само
скалярное произведение вещественны. Заметим, что в любом
случае скалярный квадрат (x, x) обязан быть неотрицательным
вещественным числом.
В отличие от (∗), в Cn естественное скалярное произведение
векторов x = [x1 , . . . , xn ] , y = [y1 , . . . , yn ] вводится так:
n
(x, y) = xi yi = y ∗ x.
i=1

24.3. Билинейные и полуторалинейные формы


В аксиомах скалярного произведения свойства (3), (4) отра-
жают линейность функции (x, y) от векторов x и y по первому
аргументу. В евклидовом пространстве аксиома (2) дает нам
линейность и по второму аргументу.
Функция f (x, y) с числовыми значениями называется били-
нейной формой, если она линейна по каждому из аргументов:
f (αx + βy , z) = αf (x, z) + βf (y , z),
f (z , αx + βy) = αf (z , x) + βf (z , y) ∀ x, y , z ∈ V , ∀ α, β.
Таким образом, скалярное произведение в евклидовом простран-
стве является билинейной формой с дополнительными условиями
(1) и (2) из определения в п. 24.1.
Функция f (x, y) с числовыми значениями называется полу-
торалинейной формой, если
f (αx + βy , z) = αf (x, z) + βf (y , z),
f (z , αx + βy) = αf (z , x) + βf (z , y) ∀ x, y , z ∈ V , ∀ α, β ∈ C.
212 Лекция 24

Очевидно, что скалярное произведение в унитарном простран-


стве является полуторалинейной формой с дополнительными
условиями (1 ) и (2 ).

24.4. Длина вектора


Пусть V — произвольное пространство со скалярным произ-
ведением. Величина !
|x| = (x, x)
называется длиной вектора x ∈ V .
Неравенство Коши–Буняковского–Шварца. Для любых век-
торов x, y ∈ V
|(x, y)|  |x| |y|, (∗)
причем равенство достигается в том и только том случае,
когда x и y линейно зависимы.
Доказательство. Комплексное число (x, y) запишем в тригоно-
метрической форме
(x, y) = |(x, y)| ξ , ξ = cos ϕ + i sin ϕ.
Если y = 0, то в (∗) имеет место равенство. Пусть y = 0. Для
произвольного t ∈ R рассмотрим выражение
(x + tξy , x + tξy) = (x, x) + tξ(x, y) + tξ(x, y) + ξξ(y , y) =
= t2 |y|2 + 2t|(x, y)| + |x|2  0.
Неотрицательность квадратного трехчлена от переменной t озна-
чает неположительность его дискриминанта:
D = |(x, y)|2 − |x|2 |y|2  0 ⇒ |(x, y)|  |x| |y|.
Предположим, что при y = 0 в (∗) имеет место равенство
⇒ D = 0 ⇒ для некоторого вещественного t получаем
(x + tξy , x + tξy) = 0 ⇒ x + tξy = 0.
Очевидно также, что если y = 0 или x = αy , то (∗) обращается
в равенство. 
Следствие. Длина является векторной нормой на V .
Доказательство. Первые два свойства нормы очевидны,
а неравенство треугольника вытекает из неравенства Коши–
Буняковского–Шварца:
|x + y|2 = |x|2 + |y|2 + (x, y) + (y , x) 
 |x|2 + |y|2 + 2|x| |y| = (|x| + |y|)2 . 
24.5. Тождество параллелограмма 213

Пространство со скалярным произведением, полное относитель-


но нормы || · || = | · |, обычно называется гильбертовым.
Задача 1. Для двух векторов x, y ∈ Rn выполнено равенство ||x +
+ y||2 = ||x||2 + ||y||2 . Докажите, что x и y линейно зависимы. Верно
ли это в случае равенства ||x + y||p = ||x||p + ||y||p для нормы Гёльдера
при p = 2?
Задача 2. Для матриц A, B ∈ Rn×n квадрат суммы диагональных
элементов матрицы A B равен произведению сумм диагональных эле-
ментов матриц A A и B  B . Докажите, что A и B отличаются лишь
скалярным множителем.
Задача 3. Пусть V — линейное пространство вещественных
непрерывных на [0, 1] функций. Докажите, что выражение (f , g) =
1
= f (t)g(t)dt задает скалярное произведение, но получаемое при этом
0
евклидово пространство V не является гильбертовым.

24.5. Тождество параллелограмма


Итак, любое пространство со скалярным произведением об-
ладает специальной нормой, порожденной скалярным произведе-
нием. Зададим вопрос: какие нормы на V могут порождаться
каким-либо скалярным произведением?
Ответ связан со следующим тождеством параллелограмма:
||x + y||2 + ||x − y||2 = 2(||x||2 + ||y||2 ) ∀ x, y ∈ V.
Легко проверить, что длина вектора ||x|| = |x| (т. е. норма, по-
рожденная скалярным произведением) удовлетворяет данному
тождеству. Но верно и обратное.
Теорема. Норма || · || порождается каким-то скалярным про-
изведением в том и только том случае, когда для нее выпол-
няется тождество параллограмма.
Доказательство. Пусть V — пространство со скалярным про-
изведением. Запишем (x, y) = a + ib, где a, b ∈ R. Тогда если
||x|| = |x|, то
||x+y||2 = (x, x)+(x, y)+(y , z)+(y , y) = ||x||2 +||y||2 +2a,
||x + iy||2 = (x, x)+i(y , x)−i(x, y)+(y , y) = ||x||2 +||iy||2 +2b.
Отсюда a = f (x, y) и b = g(x, y), где
1
f (x, y) = (||x + y||2 − ||x||2 − ||y||2 ),
2
1
g(x, y) = (||x + iy||2 − ||x||2 − ||iy||2 ).
2
214 Лекция 24

Теперь предположим, что V — нормированное пространство,


в котором норма удовлетворяет тождеству параллелограмма. Ес-
ли норма порождается скалярным произведением, то последнее
обязано иметь вид
(x, y) = f (x, y) + ig(x, y). (∗)
Рассмотрим (∗) как определение функции (x, y) и докажем, что
она обладает всеми свойствами скалярного произведения.
Легко видеть, что (x, x) = ||x||2 . Поэтому первая аксиома
очевидна. Так же легко проверяется, что (x, y) = (y , x): равенство
f (x, y) = f (y , x) очевидно, а равенство g(x, y) = −g(y , x) получа-
ется с помощью тождества параллелограмма.
Теперь докажем, что функция (x, y) линейна по первому
аргументу (третья и четвертая аксиомы). Для этого достаточ-
но доказать линейность по первому аргументу функции f (x, y)
(линейность g(x, y) по первому аргументу будет очевидным след-
ствием).
Докажем сначала, что f (x + y , z) = f (x, z) + f (y , z). Из опре-
деления f и тождества параллелограмма видно, что
1
f (x, z) = (||x + z||2 − ||x − z||2 ),
4
1
f (y , z) = (||y + z||2 − ||y − z||2 ).
4
Запишем
x + z = u + v, y+z =u−v ⇒
1 1
⇒ u = (x + y + 2z), v = (x − y).
2 2
В силу тождества параллелограмма для векторов u и v
1 1
||x + z||2 + ||y + z||2 = (||(x + y + z) + z||2 + ||x − y||2 .
2 2
Аналогично,
1 1
||x − z||2 + ||y − z||2 = (||(x + y − z) − z||2 + ||x − y||2 .
2 2
По тому же тождеству параллелограмма для x + y + z и z
1 1
(||(x + y + z) + z||2 = ||x + y + z||2 + ||z||2 − ||x + y||2 ,
2 2
1 1
(||(x + y − z) − z||2 = ||x + y − z||2 + ||z||2 − ||x + y||2 .
2 2
Отсюда
1
f (x, z) + f (y , z) = (||x + y + z||2 − ||x + y − z||2 ) = f (x + y , z).
4
24.6. Ортогональность векторов 215

Теперь докажем, что f (αx, y) = α f (x, y) для любого α ∈ R.


m
Пусть α = — рациональное число. Тогда, пользуясь уже дока-
n
занным свойством, находим
1 1 1 1
nf x, y =f (n x), y =f (x, y) ⇒ f x, y = f (x, y) ⇒
n n n n
m 1 1 m
⇒f x, y =f (m x, y =m f x, y = f (x, y).
n n n n
Произвольное вещественное α представим как предел последо-
вательности рациональных αk → α. Несложно убедиться в том,
что функция f (x, y) непрерывна по x. Поэтому в равенствах
f (αk x, y) = αk f (x, y) можно перейти к пределу при k → ∞.
Таким образом, мы доказали равенство (αx, y) = (αx, y) по-
ка только для вещественных α. Оно будет верно для любых
комплексных α, если мы установим, что (ix, y) = i(x, y). Это
вытекает непосредственно из определения (∗), вида функций
f (x, y) и g(x, y) и тождества параллелограмма. 
Задача 1. По определению ||f (x)||C[a,b] ≡ max |f (x)|. Докажите,
axb
что эта норма в пространстве C[a, b] функций, непрерывных на [a, b],
не порождается никаким скалярным произведением.
Задача 2. Найдите все p  1, при которых норма Гёльдера || · ||p
порождается некоторым скалярным произведением.

24.6. Ортогональность векторов


Скалярное произведение позволяет ввести общее понятие ор-
тогональности векторов: x и y называются ортогональными,
если (x, y) = 0. Обозначение: x⊥y .
Заметим, что в одном и том же пространстве скалярное про-
изведение можно ввести многими разными способами, и векторы,
ортогональные для какого-то скалярного произведения, могут
не быть ортогональными по отношению к другому скалярному
произведению.
В евклидовом пространстве можно ввести также общее поня-
тие угла ϕ = ϕ(x, y) между векторами x и y . По определению
(x, y)
cos ϕ = .
|x| |y|
Нужно заметить, что правая часть по модулю не больше 1 (в си-
лу неравенства Коши–Буняковского–Шварца). Для ортогональ-
ных векторов ϕ = π/2. По понятной причине данное определение
216 Лекция 24

угла не переносится на случай унитарных пространств. Но


понятие ортогональности работает, конечно, и там.
Теорема Пифагора. Если x⊥y , то |x + y|2 = |x|2 + |y|2 .
Доказательство. Пусть (x, y) = 0. Тогда (x + y , x + y) = (x, x) +
+ (x, y) + (y , x) + (y , y) = (x, x) + (y , y). 
Замечание. В евклидовом (но не в унитарном!) пространстве
теорему Пифагора можно обратить: если |x + y|2 = |x|2 + |y|2 , то
(x, y) = 0 — это очевидно, поскольку (x, y) + (y , x) = 2(x, y). Од-
нако последнее не верно для произвольных векторов в унитарном
пространстве.

24.7. Ортогональность множеств


Пусть V — пространство со скалярным произведением и L ⊂
⊂ V — произвольное непустое подмножество векторов. Вектор
x ∈ V называется ортогональным множеству L, если (x, y) = 0
для всех y ∈ L. Обозначение: x⊥L. По определению множе-
ства L и M ортогональны, если (x, y) = 0 для любых x ∈ L
и y ∈ M . Обозначение: L⊥M .
Множество M всех векторов из V , каждый из которых орто-
гонален заданному множеству L, называется его ортогональным
дополнением в пространстве V . Обозначение: M = L⊥ .
Утверждение. Для любого множества L его ортогональное
дополнение L⊥ является подпространством. При этом L ⊂
⊂ (L⊥ )⊥ .
Доказательство. Пусть x, y ∈ L⊥ . Тогда (x, z) = (y , z) =
= 0 ∀ z ∈ L ⇒ (αx + βy , z) = α(x, z) + β(y , z) = 0 ∀ z ∈ L
⇒ αx + βy ∈ L⊥ .
По определению множество (L⊥ )⊥ содержит все векторы,
ортогональные L⊥ , а значит и все векторы из множества L. 

24.8. Ортогональная сумма подпространств


Напомним, что суммой подпространств L1 , L2 , . . . , Lm на-
зывается множество L всех векторов вида x = x1 + x2 + . . . + xm ,
где xi ∈ Li для всех i. Элементарно проверяется, что L — под-
пространство. Обозначение: L = L1 + . . . + Lm .
Напомним также, что L называется прямой суммой, если
подпространства Li ненулевые и каждый вектор x ∈ L имеет
единственное разложение вида x = x1 + . . . + xm , где xi ∈ Li
(если x = x1 + . . . + xm и xi ∈ Li ∀ i, то непременно xi = xi ∀ i).
24.8. Ортогональная сумма подпространств 217

Сумма L = L1 + . . . + Lm ненулевых подпространств называ-


ется ортогональной суммой, если Li ⊥Lj при i = j . Обозначе-
ние: L = L1 ⊕ . . . ⊕ Lm .
Утверждение. Ортогональная сумма подпространств L =
= L1 ⊕ . . . ⊕ Lm является прямой суммой. Кроме того, если
xi ∈ Li , то
|x1 + . . . + xm |2 = |x1 |2 + . . . + |xm |2 . (∗)

Доказательство. Докажем сначала (∗). Учитывая, что (xi , xj ) =


= 0 при i = j , находим

m 
m 
m 
m
|x1 + . . . + xm | =
2
(xi , xj ) = (xi , xi ) = |xi |2 .
i=1 j=1 i=1 i=1
Далее, пусть x1 + . . . + xm = x1+ ... + xm , где xi , xi ∈ Li ∀ i .
Тогда
0 = |(x1 − x1 ) + . . . + (xm − xm )|2 =
= |x1 − x1 |2 + . . . + |xm − xm |2 ⇒ xi = xi ∀ i. 
Следствие 1. Конечная система ненулевых попарно ортого-
нальных векторов является линейно независимой.
Доказательство. Пусть векторы x1 , . . . , xm попарно ортого-
нальны и отличны от нуля. Тогда сумма линейных оболо-
чек L(x1 ), . . . , L(xm ) является ортогональной суммой и, если
α1 x1 + . . . + αm xm = 0, то согласно (∗)
0 = |α1 x1 + . . . + αm xm |2 =
= |α1 |2 |x1 |2 + . . . + |αm |2 |xm |2 ⇒ α1 = . . . = αm = 0. 
Следствие 2. Если ненулевые подпространства L1 , . . . , Lm ко-
нечномерны и попарно ортогональны, то
dim(L1 ⊕ . . . ⊕ Lm ) = dim L1 + . . . + dim Lm .

Достаточно вспомнить, что для прямой суммы конечномер-


ных подпространств Li базис получается объединением базисов
в подпространствах Li (см. лекцию 12).
Л е к ц и я 25

25.1. Матрица Грама


Пусть дана система векторов v1 , . . . , vn , и пусть
x = α1 v1 + . . . + αn vn , y = β1 v1 + . . . + βn vn .
Тогда прямое вычисление дает
 n
 n 
(x, y) = βj (vj , vi )αj = b∗ Ga, (∗)
j=1 i=1
где  
(v1 , v1 ) . . . (vn , v1 )
G = G(v1 , . . . , vn ) = ... ... ... ,
(v1 , vn ) . . . (vn , vn )
   
α1 β1
a = ... , b = ... .
αn βn
Матрица G из скалярных произведений системы векторов назы-
вается ее матрицей Грама. 1)
Теорема о матрице Грама. Система векторов v1 , . . . , vn линей-
но зависима тогда и только тогда, когда ее матрица Грама
является вырожденной.
Доказательство. Пусть x = α1 v1 + . . . + αn vn . Используя (∗)
при x = y , находим
(x, x) = a∗ Ga, a = [α1 , . . . , αn ] . (#)
Если G — вырожденная матрица, то существует столбец a = 0
такой, что Ga = 0 ⇒ x = 0 ⇒ система векторов v1 , . . . , vn
линейно зависима.
Обратно, если эта система линейно зависима, то x = 0 при
некотором a = 0. Легко видеть, что Ga = [(x, v1 ), . . . , (x, vn )] = 0
1)
Обратим внимание на то, что элемент в позиции i, j имеет вид (vj , vi ).
Часто матрицей Грама называют G (в вещественном случае, конечно, G =
= G).
25.2. Скалярное произведение в конечномерном пространстве 219

есть равная нулю нетривиальная линейная комбинация столбцов


матрицы G ⇒ столбцы G линейно зависимы ⇒ G вырож-
денная. 
Задача 1. В пространстве со скалярным произведением даны две
системы векторов: u1 , . . . , um и v1 , . . . , vm . При этом L⊥ ∩ M = {0},
где L и M — линейные оболочки векторов первой и второй системы.
Докажите, что хотя бы одна из этих систем линейно зависима в том
и только том случае, когда (m × m)-матрица A с элементами aij =
= (vj , ui ) вырожденная.

25.2. Скалярное произведение в конечномерном


пространстве
Пусть v1 , . . . , vn — базис в n-мерном пространстве V . Тогда
скалярное произведение векторов x = α1 v1 + . . . + αn vn и y =
= β1 v1 + . . . + βn vn имеет вид (∗), где G — матрица Грама, a =
= [α1 , . . . , αn ] , b = [β1 , . . . , βn ] .
Какими свойствами должна обладать матрица, чтобы являть-
ся матрицей Грама для линейно независимой системы?
Во-первых, любая матрица Грама обладает свойством G∗ = G.
Матрицы с таким свойством называются самосопряженными
или эрмитовыми. 1) В вещественном случае G∗ = G , а матрицы
со свойством G = G называются симметричными.
Во-вторых, согласно (#), a∗ Ga > 0 для всех a = 0, причем
если V — вещественное пространство, то a ∈ Rn , а если ком-
плексное, то a ∈ Cn . Любая матрица с таким свойством в случае
a ∈ Cn называется положительно определенной. Вещественная
матрица с тем же свойством, когда a ∈ Rn , называется веще-
ственной положительно определенной.
Итак, любая матрица Грама в случае унитарного простран-
ства является эрмитовой положительно определенной. Но верно
и обратное. Пусть G — произвольная эрмитова положительно
определенная матрица. Тогда легко проверяется, что функция
f (a, b) = b∗ Ga, a, b ∈ Cn , (!)
задает скалярное произведение на C и G является матрицей
n
Грама системы стандартных базисных векторов e1 , . . . , en (ei име-
ет 1 на i-м месте и 0 в остальных позициях). Таким образом,
формула (!) определяет общий вид скалярного произведения
в пространстве Cn .
1)
В честь французского математика Шарля Эрмита (1822–1901).
220 Лекция 25

Соответствия a ↔ x, b ↔ y (задающие изоморфизм V и Cn )


позволяют с помощью f (a, b) ввести скалярное произведение
и на V .
Задача 1. Может ли определитель матрицы Грама быть числом
отрицательным?
Задача 2. Пусть ρ(x) — произвольная непрерывная положитель-
ная функция при 0  x  1. Докажите, что (n × n)-матрица A с эле-
1
ментами aij = xi+j ρ(x)dx является невырожденной.
0

25.3. Перпендикуляр и проекция


Пусть V — пространство со скалярным произведением и L
— его подпространство размерности m. Мы уже знаем, что
для любого x ∈ V существует элемент наилучшего приближения
z0 ∈ L — такой, что |x − z0 |  |x − z| для всех z ∈ L. В дан-
ном специальном случае — для нормы, порожденной скалярным
произведением — имеет место единственность z0 и есть очень
простой способ его получения.
Исходим из того, что в L задан базис z1 , . . . , zm . Тогда
z0 = α1 z1 + . . . + αm zm .
Найдем коэффициенты α1 , . . . , αm из условия
x − z0 ⊥ L ⇔ (x − z0 , z1 ) = 0, . . . , (x − z0 , zm ) = 0 ⇔


⎪ α1 (z1 , z1 ) + . . . + αm (zm , z1 ) = (x, z1 ),
⎨α (z , z ) + . . . + α (z , z ) = (x, z ),
1 1 2 m m 2 2

⎪ ...............................

α1 (z1 , zm ) + . . . + αm (zm , zm ) = (x, zm ).
Очевидно, имеем систему линейных алгебраических уравнений,
для которой матрица коэффициентов совпадает с матрицей Грама
G = G(z1 , . . . , zm ) системы векторов z1 , . . . , zm . По теореме о
матрице Грама для линейно независимой системы она невырож-
денная ⇒ система относительно α1 , . . . αm имеет и притом
единственное решение ⇒ вектор z0 , подчиненный условию
x − z0 ⊥ L, существует и единствен.
Вектор h ≡ x − z0 в случае h ⊥ L, z0 ∈ L называется пер-
пендикуляром, опущенным из x на L, а z0 — ортогональной
проекцией вектора x на L.
25.3. Перпендикуляр и проекция 221

Теорема о перпендикуляре. Для любого вектора x и конеч-


номерного подпространства L существуют и единственны
перпендикуляр h ⊥ L и проекция z0 ∈ L такие, что x = z0 + h.
При этом

|h| = |x − z0 | < |x − z| ∀ z ∈ L, z = z0 .

Доказательство. Остается доказать лишь то, что z0 — одно-


значно определенный элемент наилучшего приближения на L
для вектора x. Пусть z — произвольный вектор из L. Тогда
x − z = (x − z0 ) + (z0 − z), где x − z0 ⊥ L и z0 − z ∈ L. Отсюда
вытекает, что x − z0 и z0 − z суть перпендикуляр и ортогональная
проекция на L для вектора x − z . По теореме Пифагора

|x−z|2 =|x−z0 |2 +|z0 −z|2 ⇒ |x−z0 | < |x−z| ∀ z = z0 . 

Следствие. Если L — конечномерное подпространство, то L =


= (L⊥ )⊥ .
Доказательство. Мы уже знаем, что L ⊂ (L⊥ )⊥ . Возьмем x ∈
∈ (L⊥ )⊥ и опустим из него перпендикуляр h на L. Согласно
определению ортогонального дополнения, h ∈ L⊥ . В то же время
h ⊥ L⊥ ⇒ (h, h) = 0 ⇒ h = 0. Значит, x ∈ L ⇒ (L⊥ )⊥ ⊂ L. 
Задача 1. Пусть L и M — подпространства в конечномерном про-
странстве V со скалярным произведением. Равносильны ли равенства
L⊥ ∩ M = {0} и L ∩ M ⊥ = {0}?
Задача 2. В n-мерном евклидовом пространстве векторы a1 , . . .
. . . , an+1 таковы, что (ai , aj ) < 0 при i = j . Докажите, что любые n из
них линейно независимы.
Задача 3. Докажите, что в n-мерном евклидовом пространстве
любая система из n + 2 векторов содержит пару векторов, для которых
скалярное произведение неотрицательно.
Задача 4. Пусть Pn — линейное пространство всех веществен-
ных многочленов степени не выше n со скалярным произведением
1
(f , g) = f (t)g(t)dt. Докажите, что расстояние от многочлена xn до
−1 √
подпространства Pn−1 не превосходит 2 /2n .
222 Лекция 25

25.4. Ортогональные системы


Система ненулевых векторов x1 , . . . , xn называется ортого-
нальной, если
(xi , xj ) = 0, i = j , (∗)

и ортонормированной, если, дополнительно, |x1 | = . . . = |xn | =


= 1. Таким образом, матрица Грама для ортогональной системы
является диагональной с положительными диагональными эле-
ментами, а для ортонормированной — единичной матрицей.
Рассмотрим пространство Cn с естественным скалярным про-
изведением и ортонормированную систему вектор-столбцов:
   
x11 x1n
x1 = . . . , . . . , xn = . . . ∈ Cn .
xn 1 xnn

Составим из них (n × n)-матрицу


 
x11 . . . x1n
X = [x1 , . . . , xn ] = . . . . . . . . .
xn1 . . . xnn

и заметим, что соотношения (∗) равносильны матричному равен-


ству
 
(x1 , x1 ) . . . (xn , x1 )
X ∗X = ... ... ... = I.
(x1 , xn ) . . . (xn , xn )

Матрица X ∈ Cn×n со свойством X ∗ X = I называется уни-


тарной. Таким образом, любая квадратная матрица с ортонор-
мированной системой столбцов является унитарной, а любая
унитарная матрица имеет ортонормированную систему столбцов.
Ясно также, что для унитарности матрицы необходимо и до-
статочно, чтобы она имела ортонормированную систему строк
(докажите!).
Вещественная унитарная матрица называется ортогональ-
ной. Ранее мы уже отмечали, что множество всех ортогональ-
ных матриц порядка n является группой относительно операции
умножения матриц. То же справедливо и по отношению к мно-
жеству всех унитарных матриц порядка n.
25.5. Процесс ортогонализации 223

25.5. Процесс ортогонализации


Из теоремы о перпендикуляре сразу же вытекает, что в лю-
бом конечномерном пространстве V существует ортонормирован-
ный базис.
В самом деле, возьмем в V произвольный базис v1 , . . . , vn
и предположим, что в линейной оболочке Ln−1 = L(v1 , . . . , vn−1 )
уже построен ортонормированный базис из векторов q1 , . . . , qn−1
(конечно, Ln−1 = L(q1 , . . . , qn−1 )). Пусть hn — перпендикуляр,
опущенный из вектора vn на Ln−1 . Ясно, что hn = 0 (иначе
vn ∈ Ln−1 ⇒ система v1 , . . . , vn линейно зависима). Положим
qn = hn /|hn |. Тогда система q1 , . . . , qn и будет искомым ортонор-
мированным базисом в V .
Заметим, что в построенном базисе для любого k = 1, . . . , n
первые k векторов q1 , . . . , qk образуют ортонормированный базис
в линейной оболочке Lk = L(v1 , . . . , vk ). Таким образом,
L(q1 , . . . , qk ) = L(v1 , . . . , vk ), k = 1, . . . , n.
Реальные вычисления начинаются с получения вектора q1 =
= v1 /|v1 |. Затем из вектора v2 опускается на L1 перпендикуляр
h2 и нормируется: q2 = h2 /|h2 |. И т. д. Опуская перпендикуляр
на Lk , разумно искать разложение соответствующей проекции не
по исходной системе v1 , . . . , vk , а по уже построенной ортонор-
мированной системе q1 , . . . , qk . Выгода очевидна: матрица Грама
для q1 , . . . , qk является единичной!
Данный алгоритм называется процессом ортогонализации
Грама–Шмидта. Вот его формальное описание:

k−1
hk = vk − (vk , qi ) qi , qk = hk /|hk |, k = 1, . . . , n.
i=1

Задача 1. В пространстве вещественных многочленов скалярное


произведение (f , g) определено произвольным образом, но так, что для
любых многочленов f (x) и g(x) выполняется равенство 1)

(xf (x), g(x)) = (f (x), xg(x)),

и пусть при применении процесса ортогонализации Грама–Шмидта


к системе многочленов 1, x, x2 , ..., xn получены многочлены

1)
Проверьте, что оно выполняется, например, если скалярное произведение
1
задано формулой (f , g) = f (x)g(x)dx. В этом случае полученные ортого-
−1
нальные многочлены называются многочленами Лежандра.
224 Лекция 25

L0 (x), L1 (x), ..., Ln (x). Докажите, что имеют место трехчленные


соотношения

Lk (x) = ak xLk−1 (x) + bk Lk−1 (x) + ck Lk−2 (x),

2  k  n, ak , bk , ck ∈ R.

25.6. Дополнение до ортогонального базиса


Пусть V — пространство размерности n со скалярным произ-
ведением.
Лемма о дополнении до ортогонального базиса. Любая орто-
гональная (ортонормированная) система векторов v1 , . . . , vk ∈
∈ V может быть достроена какими-либо векторами из V до
ортогонального (ортонормированного) базиса в V .
Доказательство. Дополним v1 , . . . , vk какими-нибудь векторами
до базиса в V , а затем к полученному базису применим процесс
ортогонализации. 
Следствие. Если Lk — подпространство размерности k , то
dim L⊥
k = n − k . При этом
V = L k ⊕ L⊥
k.

Доказательство. В V существует ортонормированный базис


q1 , . . . , qn такой, что Lk = L(q1 , . . . , qk ). При этом очевидно, что
любой вектор, ортогональный Lk , есть линейная комбинация
векторов qk+1 , . . . , qn . 

25.7. Биортогональные системы


Пусть V — линейное пространство со скалярным произведе-
нием (· , ·). Системы векторов u1 , . . . , um и v1 , . . . , vm называют-
ся биортогональными, если

1, i = j ,
(ui , vj ) =
0, i = j.
Говорят также, что каждая из систем является биортогональной
для другой системы.
Если ui и vj — векторы-столбцы из координат векторов ui
и vj в каком-либо фиксированном ортонормированном базисе, то
биортогональность равносильна матричному равенству
V ∗ U
 = I, U
 = [ m ], V = [
u1 , ..., u v1 , ..., 
vm ]. (∗)
25.8. QR-разложение матрицы 225

В случае dim L(u1 , ..., um ) = dim L(v1 , ..., vm ) = m отсюда ясно,


что V = (U
 −1 )∗ .

Утверждение 1. В случае биортогональности каждая из си-


стем u1 , . . . , um и v1 , . . . , vm является линейно независимой.

Доказательство. Пусть z ≡ α1 u1 + . . . + αm um = 0. Используя


биортогональность, находим: (z , vi ) = αi = 0. 

Утверждение 2. Пусть L, M ⊂ V — подпространства размер-


ности m такие, что L⊥ ∩ M = {0}. Тогда для любой линейно
независимой системы u1 , . . . , um ∈ L существует единствен-
ная биортогональная система v1 , . . . , vm ∈ M .
Доказательство. Фиксируем какой-либо ортонормированный
базис в пространстве L + M . Тогда задача сводится к нахож-
дению матрицы V из уравнения (∗). Пусть матрица Q  имеет
столбцы, составленные из коэффициентов разложений векторов
какого-либо базиса в M по данному фиксированному базису
в L + M . Тогда V = QZ
 для некоторой матрицы Z порядка m,
которая должна удовлетворять матричному уравнению
∗U
Z ∗Q  = I.

Столбцы квадратной матрицы Q ∗ U


 линейно независимы. В са-
мом деле, если Q∗U
 x = 0, то U
 x ∈ L⊥ ∩ M ⇒ U  x = 0. В силу

линейной независимости столбцов матрицы U , x = 0. Поэтому
матрица Q∗ U
 невырожденная ⇒ Z ∗ = (Q ∗U
 ) −1 . 

25.8. QR-разложение матрицы


Пусть A ∈ Cn×m имеет линейно независимые столбцы a1 , . . .
. . . , am ∈ Cn , и к ним применяется процесс ортогонализации
Грама–Шмидта с использованием естественного скалярного про-
изведения.. Пусть в результате получаются ортонормированные
векторы q1 , . . . , qm ∈ Cm .
Соотношения ak ∈ L(q1 , . . . , qk ) выполняются при k = 1, . . . , m
и означают, что для каких-то чисел rik имеют место равенства

k
ak = rik qi , k = 1, . . . , m,
i=1

8 Е. Е. Тыртышников
226 Лекция 25

или, в матричном виде,


⎡ ⎤
r11 r12 . . . r1m
⎢ r22 . . . r2m ⎥
A = QR, Q = [q1 , . . . , qm ], R=⎢

⎥.
. ... ⎦
..
0 rmm

Определение. Разложение A = QR, где Q имеет ортонормиро-


ванные столбцы, а R — верхняя треугольная матрица, называет-
ся QR-разложением матрицы A.
Таким образом, мы только что доказали, что для любой
прямоугольной матрицы с линейно независимыми столбцами
существует QR-разложение. В частности, оно существует для
любой невырожденной матрицы. В действительности справедли-
ва более общая
Теорема. Любая прямоугольная матрица, в которой число
строк не меньше числа столбцов, обладает QR-разложением
с верхней ступенчатой матрицей R.
Доказательство. Пусть ai1 — первый ненулевой столбец матри-
цы A, ai2 — первый столбец такой, что ai2 ∈ / L(ai1 ), ai3 — первый
столбец такой, что ai3 ∈
/ L(ai1 , ai2 ), и т. д. В итоге получаем в A
базисную систему столбцов

ai1 , . . . , air , i 1 < i2 < . . . < ir ,

обладающую такими свойствами:

aj = 0 при j < i1 ;
aj ∈ L(ai1 , . . . , ail ) при il < j < il+1 , l = 1, . . . , r − 1;
aj ∈ L(ai1 , . . . , air ) при ir < j.

Найдем QR-разложение:

[ai1 , . . . , air ] = [qi1 , . . . , qir ]Rr .

Систему столбцов qi1 , . . . , qir дополним до ортонормированно-


го базиса в n-мерном пространстве столбцов и из полученных
столбцов составим матрицу Q, сохранив первоначальные столб-
цы в позициях i1 , . . . , ir .
25.8. QR-разложение матрицы 227

Записав A = QR, видим, что в матрице R первые r элементов


il -го столбца те же, что в l-м столбце матрицы Rr . В то же время
j -й столбец при il < j < il+1 имеет нули в позициях ниже il -й.

Задача 1. Пусть A ∈ Cn×n имеет столбцы a1 , . . . , an ∈ C n . Дока-
жите неравенство
n

| det A|  ||aj ||2 .
j=1

Задача 2. Пусть A — матрица порядка n с элементами aij = ±


± 1. Докажите, что если | det A| = nn/2 (такие матрицы называются
матрицами Адамара) и n  3, то n делится на 4.

8*
Л е к ц и я 26

26.1. Линейные функционалы


Пусть V — линейное пространство над числовым полем P
и f (x) — функция от вектора x ∈ V с числовыми значениями.
Такие функции принято называть функционалами. Если выпол-
няется свойство линейности
f (αx + βy) = αf (x) + βf (y) ∀ α, β ∈ P , ∀ x, y ∈ V ,
то функция f называется линейным функционалом или линей-
ной формой.
Пусть теперь V — нормированное пространство 1). Линейный
функционал называется ограниченным, если для некоторой кон-
станты c > 0
|f (x)|  c||x||V ∀ x ∈ V. (∗)
Утверждение 1. Для ограниченности линейного функционала
необходима и достаточна его непрерывность.
Доказательство. Если выполняется (∗), то из сходимости ||xk −
− x||V → 0 при k → ∞ следует, что |f (xk ) − f (x)| = |f (xk − x)| 
 c||xk − x||V → 0.
Если линейный функционал f (x) непрерывен, то покажем,
что он ограничен на единичной сфере S = {x : ||x||V = 1}. Если
это не так, то для некоторой последовательности векторов xk ∈ S
имеем: |f (xk )| → ∞.
Отсюда ||xk /|f (xk )| ||V → 0 ⇒ xk /|f (xk )| → 0. В силу
непрерывности f (xk /|f (xk )|) → f (0) = 0, что невозможно, так
как |f (xk /|f (xk )|)| = |f (xk )|/|f (xk )| = 1.
Итак, |f (x)|  c для всех x таких, что ||x||V = 1. Следова-
тельно,
|f (x/||x||V )|  c ⇒ |f (x)|  c||x||V ∀ x ∈ V. 

1)
Значит, P = C или P = R.
26.2. Сопряженное пространство 229

Замечание. Для линейного функционала непрерывность


в какой-то одной точке равносильна непрерывности во всех
точках пространства.
Утверждение 2. Если V конечномерно, то любой линейный
функционал на V является ограниченным.
Доказательство. Пусть v1 , . . . , vn — базис в V . Если x =
= x1 v1 + . . . + xn vn , то

n 
n
|f (x)|  |xi | |f (vi )|  c |xi |, c ≡ max |f (vi )|.
1in
i=1 i=1

В конечномерном пространстве из сходимости по норме вытекает


покоординатная сходимость. Поэтому если xk → 0 при k → ∞,
то xki → 0. Отсюда |f (xk )| → 0. Значит, функционал непрерывен
при x = 0. 
Задача 1. Линейный функцонал f определен на пространстве век-
торов вида Ax, где A ∈ Rm×n и x ∈ Rn . Докажите, что f (Ax) = y  Ax
для некоторого y ∈ Rm , не зависящего от x.

26.2. Сопряженное пространство


Операции сложения и умножения на число для линейных
функционалов определяются естественным образом.
Пусть f (x) и g(x) — линейные функционалы на V . Тогда их
суммой называется функция h = f + g : V → C, определенная
правилом h(x) ≡ f (x) + g(x). Для α ∈ C функция h = αf : V → C
определяется правилом h(x) ≡ αf (x).
Элементарно проверяется, что f + g и αf остаются линейны-
ми функционалами. Таким образом, множество всех линейных
функционалов на V превращается в линейное пространство.
Особый интерес представляет множество всех ограниченных
линейных функционалов. Оно тоже является линейным про-
странством, поскольку сложение и умножение на число непре-
рывных функций сохраняют свойство непрерывности.
Линейное пространство всех ограниченных линейных функ-
ционалов на V называется сопряженным пространством для V .
Обозначение: V ∗ .
Нормой функционала f ∈ V ∗ называется величина
||f || = sup |f (x)|.
||x||V =1
230 Лекция 26

Конечность ||f || вытекает из ограниченности f . Свойства вектор-


ной нормы проверяются очевидным образом.
Задача 1. Пусть ϕ — линейный функционал на сопряженном
пространстве V ∗ для конечномерного пространства V . Докажите, что
ϕ(f ) = f (x0 ), где x0 ∈ V — некоторый фиксированный вектор, завися-
щий от ϕ и не зависящий от f ∈ V ∗ .

26.3. Примеры линейных функционалов


1) Пусть P — линейное пространство всех веществен-
ных многочленов на отрезке [−1, 1] с C -нормой
||p||C = sup |p(x)|. Пусть p (x) обозначает производную
−1x1
многочлена p(x) (ясно, что p ∈ P ). Функционал f : P → R,
заданный правилом
f (p) ≡ p (1), p ∈ P ,
является, очевидно, линейным, но не ограниченным: если
pn (x) = xn , то ||pn ||C = 1 и f (pn ) = n.
Задача 1. Докажите, что функционал f (p) = p (0) также не
будет ограниченным.
2) В том же пространстве P функционал f (p) = p(0) является
ограниченным линейным функционалом.
1
3) Функционал f (p) = p(x)dx является линейным и огра-
−1
ниченным на P .
4) Рассмотрим пространство Cn с любой нормой, и пусть даны
числа c1 , . . . , cn . Пусть x = [x1 , . . . , xn ] ∈ Cn и f (x) =
= c1 x1 + . . . + cn xn . Это ограниченный линейный функцио-
нал на Cn .

26.4. Размерность дополнительного пространства


Множество L = {x ∈ V : f (x) = 0} называется ядром или
нуль-пространством линейного функционала f : V → C. Обо-
значение: L = ker f . Легко видеть, что L — подпространство.
Если dim V = n и функционал не равен нулю тождественно,
то dim L = n − 1 (докажите!). Мы собираемся доказать, что
в бесконечномерном случае конечной (и равной 1) оказывается
размерность так называемого дополнительного подпространства.
Подпространство L в пространстве V называется дополни-
тельным для подпространства L, если разложение V = L + L
26.5. Линейные функционалы и гиперплоскости 231

является прямой суммой. Размерность дополнительного про-


странства называется коразмерностью подпространства L.
Если V конечномерно, то его базис можно получить объеди-
нением базисов в L и L . Поэтому dim L = dim V − dim L ⇒
коразмерность одна и та же для любого дополнительного про-
странства. То же верно и в бесконечномерном случае.
Скажем, что a ∼ b, если a − b ∈ L. Это отношение эквива-
лентности на V . Поэтому V разбивается на множество непересе-
кающихся классов эквивалентности.
Пусть классы [a] и [b] порождены векторами a и b. Естествен-
ные определения операций сложения и умножения на число,
[a] + [b] = [a + b], α[a] = [αa],
корректны, так как их результаты не зависят от выбора предста-
вителей в классах эквивалентности. Таким образом, множество
классов эквивалентности превращается в линейное простран-
ство над тем же полем, что и пространство V . Оно называется
фактор-пространством. Обозначение: V /L.
Утверждение. Любое дополнительное для L подпространство
изоморфно фактор-пространству V /L.
Доказательство. Для a ∈ L положим Φ(a) = [a]. Очевидно,
что отображение Φ : L → V /L сохраняет операции и Φ(L ) =
= V /L. Кроме того, если Φ(a) = Φ(b), то a ∼ b ⇒ a − b ∈
∈ L и одновременно a − b ∈ L ⇒ a − b = 0. Значит, Φ —
сохраняющее операции взаимно-однозначное отображение L на
V /L, другими словами — изоморфизм. 
Следствие. Для любых двух разложений в прямую сумму V =
= L + L = L + L размерности дополнительных пространств
L и L одинаковы.

26.5. Линейные функционалы и гиперплоскости


Пусть L = ker f . Если L = V , то функционал тождественно
равен нулю (и поэтому называется нулевым или тривиальным).
Пусть L = V . Тогда существует вектор x0 , для которого
f (x0 ) = 0. Для произвольного вектора x ∈ V находим
f (x − αx0 ) = 0 при α = f (x)/f (x0 ) ⇒ x = z + αx0 , z ∈ L.
Очевидно, что α однозначно определяется условием z ∈ L. По-
этому V есть прямая сумма подпространств L и L(x0 ). Таким
образом, ядро нетривиального линейного функционала имеет
коразмерность, равную 1.
232 Лекция 26

Теперь рассмотрим множество Mc = {x ∈ V : f (x) = c}. Ес-


ли f (x0 ) = c, то, очевидно, Mc = x0 + L. Таким образом, Mc
есть линейное многообразие с направляющим пространством L
коразмерности 1. В таких случаях линейное многообразие назы-
вается гиперплоскостью. Легко видеть, что отображение f (x) →
→ M (f ) = {x ∈ V : f (x) = 1} является взаимно-однозначным
соответствием между линейными функционалами и гиперплос-
костями.
Пусть dim V = n и e1 , . . . , en — базис в V . В данном случае
ясно, что любой линейный функционал имеет вид f (x1 e1 + . . .
. . . + xn en ) = c1 x1 + . . . + cn xn , где ci = f (ei ). Таким образом,
любая гиперплоскость в n-мерном пространстве имеет вид
c1 x1 + . . . + cn xn = c, (∗)
где x1 , . . . , xn — координаты разложения вектора по выбранному
базису.

26.6. Опорные гиперплоскости


Уравнение гиперплоскости (∗) в Rn удобно записывать в виде
(x, h) = c, где h = [c1 , . . . , cn ] .
Гиперплоскость, проходящая через точку x0 , задается уравнени-
ем (x, h) = (x0 , h). Под скалярным произведением здесь понима-
ется естественное скалярное произведение в Rn .
Пусть M ⊂ Rn — некоторое множество. Точка x0 ∈ M назы-
вается граничной для M , если в любой ее окрестности имеются
точки u ∈ M и v ∈ / M . Для определенности под окрестностью
точки можно понимать шар относительно 2-нормы (важно, что
метрика должна порождаться нормой, а все нормы на Rn экви-
валентны).
Гиперплоскость π : (x, h) = (x0 , h), проходящая через гра-
ничную точку x0 ∈ M , называется опорной гиперплоскостью
для M , если (x, h)  (x0 , h) ∀ x ∈ M .
Задача 1. Докажите, что множество всех внутренних точек
выпуклого множества в нормированном пространстве является выпук-
лым.
Задача 2. Докажите, что любая внутренняя точка замыкания
выпуклого множества S в конечномерном нормированном пространстве
принадлежит S . Верно ли это в случае произвольного множества S ?
Задача 3. Пусть M — выпуклое множество. Докажите, что гипер-
плоскость, проходящая через его граничную точку, является опорной
26.6. Опорные гиперплоскости 233

для M тогда и только тогда, когда она не содержит ни одной внутрен-


ней точки множества M .
Лемма о наилучшем приближении на выпуклом множе-
стве. Пусть M ⊂ Rn — замкнутое выпуклое множество. Тогда
для любой точки x ∈ / M существует единственная точка
z0 ∈ M такая, что
|x − z0 | = ρ ≡ inf |x − z|.
z∈M
При этом (x − z0 , z − z0 )  0 ∀ z ∈ M .
Доказательство. 1) Пусть |x − zk | → ρ, zk ∈ M . В си-
лу ограниченности длин |zk | найдется подпоследовательность
zkl → z0 ∈ M . Положим h = x − z0 . С помощью предельного
перехода получаем: |h| = ρ. Далее, если z ∈ M и v ≡ z − z0 ,
то, в силу выпуклости M , z0 + εv ∈ M для всех 0  ε  1.
Следовательно,
ρ2  |x − (z0 + εv)|2 = (h − εv , h − εv) = ρ2 − 2ε(h, v) + ε2 |v|2 ⇒
(h, v)  ε|v|2 /2 ∀ 0<ε1 ⇒ (h, v)  0.
Если |x − (z0 + v)| = ρ, то |v|2 = 2(h, v)  0 ⇒ v = 0. 
Теорема 1. Через любую граничную точку замкнутого вы-
пуклого множества M ⊂ Rn проходит хотя бы одна опорная
гиперплоскость для M .
Доказательство. Любая граничная точка x0 ∈ M есть пре-
дел некоторой последовательности внешних для M точек: xk →
→ x0 , xk ∈ / M . В силу леммы для каждой точки xk существует
элемент наилучшего приближения zk ∈ M : |xk − zk |  |xk − z|
и (xk − zk , z − zk )  0 ∀ z ∈ M . Отсюда (pk , z)  (pk , zk ),
где pk = hk /|hk |, hk = xk − zk . Из последовательности векторов
pk выберем подпоследовательность, сходящуюся к некоторому
вектору p; очевидно, что |p| = 1. Кроме того, |zk − x0 |  |zk −
− xk | + |xk − x0 |  2|xk − x0 | ⇒ zk → x0 . Поэтому для любой
точки z ∈ M выполняется неравенство (z , p)  (x0 , p). 
Теорема 2. Пусть L, M ⊂ R — выпуклые множества и при
n
этом множество внутренних точек для L не пусто 2) и не

1)
Другое доказательство, справедливое для замкнутых выпуклых мно-
жеств в произвольных (в том числе, бесконечномерных) гильбертовых про-
странствах (т. е. полных пространствах со скалярным произведением), фак-
тически содержится в доказательстве обобщения теоремы о перпендикуляре
в дополнении к лекции 25 (п. D25.2).
2)
Выпуклое множество, имеющее хотя бы одну внутреннюю точку, назы-
вается выпуклым телом.
234 Лекция 26

пересекается с M . Тогда существует гиперплоскость (x, h) =


= c такая, что

(u, h)  c  (v , h) ∀ u ∈ L, ∀ v ∈ M.

Доказательство. Пусть L0 — множество внутренних точек


для L. Легко проверить, что множество K = L0 − M = {z ∈
∈ Rn : z = u − v , u ∈ L, v ∈ M } выпукло и при этом 0 ∈/ K.
Отсюда можно заключить, что точка 0 не является внутренней
точкой для замыкания множества K . Если 0 является граничной
точкой для K , искомой является проходящая через 0 опорная
гиперплоскость для K . Если 0 является внешней точкой для
замыкания K , то нужная гиперплоскость строится с помощью
леммы о наилучшем приближении на выпуклом множестве. 
Замечание. Говорят, что выпуклые множества L и M разделя-
ются с помощью линейного функционала f (x), если f (x)  f (y)
для любых x ∈ L и y ∈ M . Теорема 2 утверждает, что функцио-
нал с таким свойством существует. В такой формулировке она
не использует скалярные произведения и остается верной без
предположения о конечномерности пространства. 1)
Задача 4. Дано замкнутое выпуклое множество M ⊂ Rn
и x0 ∈
/ M . Доказать, что существует гиперплоскость (x, h) = (x0 , h)
такая, что (x, h) < (x0 , h) ∀ x ∈ M .
Задача 5. Множество называется выпуклым конусом, если вме-
сте с любыми двумя точками x и y оно содержит все точки вида
αx + βy при произвольных α, β  0. Докажите, что любая опорная
гиперплоскость для выпуклого конуса проходит через 0.
Задача 6. В пространстве Rn с естественным скалярным про-
изведением (x, y) = y  x дано компактное выпуклое множество M
и для него построено множество K всех векторов y ∈ Rn таких, что
(x, y)  0 для всех x ∈ M . Докажите, что K — замкнутый выпуклый
конус. Докажите также, что для любой его опорной гиперплоскости
с нормальным вектором h проходящая через 0 прямая с направляющим
вектором h содержит точку из M .
Задача 7. В Rn с естественным скалярным произведением ком-
пактные выпуклые множества L и M таковы, что для всякого x ∈ M

1)
В этом случае доказательство требует особой техники, связанной с во-
просами продолжения линейных функционалов и теоремами Хана–Банаха.
26.6. Опорные гиперплоскости 235

с каким-то y = y(x) ∈ L выполняется неравенство (x, y)  0. Докажите,


что можно выбрать y0 ∈ L, для которого (x, y0 )  0 для всех x ∈ M .
Задача 8. Даны компактные выпуклые множества L ⊂ Rm , M ⊂
⊂ Rn и матрица A ∈ Rm×n . Доказать, что

max min y  Ax = min max y  Ax.


x∈M y∈L y∈L x∈M

Задача 9. Пусть a1 , . . . , am ∈ Rn . Докажите, что пересечение


полупространств
a 
1 x  c1 , . . . , am x  cm

пусто тогда и только тогда, когда для некоторых α1 , . . . , αm  0 вы-


полняются равенства

α1 a1 + . . . + αm am = 0, α1 c1 + . . . + αm cm = −1.
Л е к ц и я 27

27.1. Линейные операторы


Любую матрицу A ∈ Cm×n можно естественным образом рас-
сматривать как оператор, отображающий вектор x ∈ Cn в вектор
Ax ∈ Cm . Очевидно, что этот оператор обладает свойством ли-
нейности 1):
A(αx + βy) = αAx + βAy ∀ α, β ∈ C, ∀ x, y ∈ Cn .
Свойство линейности выполняется для многих очень важных
отображений в линейных пространствах, элементами которых
являются функции, объединенные каким-либо общим призна-
ком (непрерывность, дифференцируемость и т.п.). Прежде всего
нужно сказать об отображениях, связанных с дифференцирова-
нием и интегрированием функций. Таким образом, у нас есть
достаточно поводов к тому, чтобы изучить свойство линейности
с более общих позиций.
Определение. Пусть V и W — произвольные линейные про-
странства над одним и тем же полем P . Отображение A : V → W
со свойством
A(αx + βy) = αA(x) + βA(y) ∀ α, β ∈ P , ∀ x, y ∈ V
называется линейным оператором из V в W . В случае линей-
ных операторов аргумент принято писать без скобок: A(x) = Ax.

27.2. Непрерывность и ограниченность


Пусть V и W — нормированные пространства. Отображение
A : V → W называется непрерывным в точке x ∈ V , если для

1)
Это свойство можно также рассматривать как свойство сохранения опе-
раций при отображении одного линейного пространства в другое пространство
над тем же полем. Такие отображения называются гомоморфизмами.
27.3. Операторная норма 237

любой последовательности xk ∈ V такой, что xk → x при k → ∞,


последовательность образов A(xk ) сходится к A(x):
||xk − x||V → 0 ⇒ ||A(xk ) − A(x)||W → 0.
Отображение называется непрерывным на V , если оно непре-
рывно для всех x ∈ V .
Линейный оператор A : V → W называется ограниченным,
если для некоторой константы c > 0
||Ax||W  c||x||V ∀ x ∈ V.
Теорема. Для непрерывности линейного оператора необходи-
ма и достаточна его ограниченность.
Доказательство. Достаточность очевидна из неравенства
||Axk − Ax||W = ||A(xk − x)||W  c||xk − x||V .
Чтобы доказать необходимость, рассмотрим множество значений
нормы ||Ax||W на единичной сфере S = {x : ||x||V = 1}. Пред-
положим, что это множество не является ограниченным. Тогда
существует последовательность xk ∈ S такая, что ||Axk ||W → ∞.
Положим yk = xk /||Axk ||W и заметим, что
||yk ||V = 1/||Axk ||W → 0 ⇒ ||Ayk ||W → 0.
Последнее невозможно, так как ||Ayk ||W = 1 для всех k . Значит,
для какого-то c > 0
||Ax||W  c ∀ x ∈ S ⇒ ||Ax||W  c||x||V ∀ x ∈ V. 

27.3. Операторная норма


Утверждение 1. Множество L(V , W ) всех ограниченных ли-
нейных операторов из V в W является линейным простран-
ством (над общим для V и W полем).
Доказательство. Пусть ||Ax||W  c1 ||x||V , ||Bx||W  c2 ||x||V .
Тогда для любых чисел α и β
||(αA + βB)x||W  c||x||V , c = |α|c1 + |β|c2 . 

Утверждение 2. Величина
||A|| ≡ sup ||Ax||W , A ∈ L(V , W ), (∗)
||x||V =1
является нормой на линейном пространстве L(V , W ).
Доказательство. Очевидно, что величина ||A|| имеет конеч-
ное значение и, конечно, неотрицательна. Если ||A|| = 0, то
||Ax||W = 0 на единичной сфере ||x||V = 1. Отсюда ||Ax||W = 0
238 Лекция 27

∀ x ∈ V ⇒ Ax = 0 ∀ x ∈ V ⇒ A = 0. Положительная
однородность следует из равенства
||αAx||W = |α| ||Ax||W ,
а неравенство треугольника — из неравенства
||(αA + βB)x||W  |α| ||Ax||W + |β| ||Bx||W . 
Определение. Норма (∗) для операторов A ∈ L(V , W ) называ-
ется операторной нормой или нормой, подчиненной векторным
нормам || · ||V , || · ||W .

Утверждение 3. Если V — конечномерное пространство, то


любой линейный оператор A : V → W является ограниченным
и ||A|| = ||Ax0 ||W для некоторого (зависящего от A) вектора
x0 ∈ V с нормой ||x0 ||V = 1.

n
Доказательство. Пусть e1 , . . . , en — базис в V и x = αi ei .
i=1

n
Тогда ||x||(e) ≡ |αi | есть норма на V , эквивалентная любой
i=1
другой норме, в том числе и норме ||x||V . Поэтому для какого-то
c>0
||x||(e)  c||x||V ∀ x ∈ V.
Следовательно,

||Ax||W  |αi | max ||Aei ||W = ||x||(e) max ||Aei ||W 
1in 1in
i=1
 (c max ||Aei ||W ) ||x||V ∀ x ∈ V.
1in

Чтобы доказать существование x0 , достаточно учесть компакт-


ность единичной сферы в конечномерном пространстве, непре-
рывность на ней функции ||Ax||W и теорему Вейерштрасса. 
Если фиксировано 1  p  ∞ и в качестве нормы в про-
странстве Cn выбрана p-норма Гёльдера, то соответствующую
операторную норму матрицы A принято обозначать ||A||p .
Задача 1. Пусть A = [aij ] — матрица размеров m × n. Докажите,
что
n
 m

||A||∞ = max |aij |, ||A||1 = max |aij |.
1im 1jn
j=1 i=1

Задача 2. Пусть u, v ∈ Cn . Докажите, что ||uv  ||2 = ||u||2 ||v||2 .


27.5. Норма Фробениуса 239

27.4. Матричная норма


Пусть каждой комплексной матрице A поставлено в соответ-
ствие неотрицательное число f (A) таким образом, что:
1) f (A) является нормой на Cm×n для всех m, n;
2) f (AB)  f (A)f (B) для любых матриц A и B , допускающих
умножение.
В таких случаях f (A) называется матричной нормой.
Утверждение. Пусть для каждого n задана векторная норма
на Cn , и пусть для каждых m, n и каждой матрицы A ∈ Cm×n
норма ||A|| определена как операторная норма, порожденная
данными векторными нормами. Тогда ||A|| является матрич-
ной нормой.
Доказательство. Пусть ||x||∗ обозначает векторную норму для
x ∈ Cn при любом n. Для любых матриц A и B , допускающих
умножение, существует вектор x0 единичной нормы такой, что

||AB|| = ||ABx0 ||∗  ||A|| ||Bx0 ||∗ 


 ||A|| ||B|| ||x0||∗ = ||A|| ||B||. 

Задача 1. Может ли норма подматрицы быть больше нормы мат-


рицы?
Задача 2. Дана обратимая матрица A ∈ Cn×n , выбирается про-
извольная матрица X0 ∈ Cn×n и строится последовательность матриц
Xk+1 = 2Xk − Xk AXk , k = 0, 1, . . . Доказать, что если для некото-
рой матричной нормы ||I − AX0 || < 1, то Xk → A−1 при k → ∞.

27.5. Норма Фробениуса


Пусть A = [aij ] — матрица размеров m × n. Величина
.
/
/m  n
||A||F = 0 |aij |2
i=1 j=1

называется нормой Фробениуса или евклидовой нормой матри-


цы A.
Утверждение. Норма Фробениуса является матричной нор-
мой.
Доказательство. Для каждых m, n норма Фробениуса является
нормой на линейном пространстве Cm×n (как 2-норма на про-
240 Лекция 27

странстве Cmn , изоморфном Cm×n ). Пусть a1 , . . . , an — столбцы


матрицы A, а b 
1 , . . . , bn — строки матрицы B . Тогда
AB = a1 b 
1 + . . . + an bn .
Используя неравенство треугольника, легко проверяемые равен-
ства ||ai b
i ||F = ||ai ||F ||bi ||F и неравенство Коши–Буняковского–
Шварца, находим
n  n

||AB||F  ||ai bi ||F = ||ai ||F ||bi ||F 
i=1 i=1
 1/2  n 1/2

n 
 ||ai ||2F ||bi ||2F = ||A||F ||B||F . 
i=1 i=1
Замечание. Норма Фробениуса не может быть операторной нор-
мой на Cm×n ни при каком выборе векторных норм в простран-
ствах Cn и Cm : дело в том, что операторная норма единичной
матрицы должна быть равна 1.
Задача 1. Доказать, что при любом фиксированном c > 1 величи-
на
 
a a
||A|| = max{|a11 | + c|a12 |, |a22 | + c|a21 |}, A = a11 a12 ,
21 22

определяет в пространстве (2 × 2)-матриц норму с неравенством


||AB||  ||A||||B||, справедливым для любых (2 × 2)-матриц A и B .
Является ли она операторной нормой?

27.6. Сохранение норм


Линейный ограниченный оператор A : V → V со свойством
||Ax|| = ||x|| ∀ x ∈ V
называется изометрическим или сохраняющим норму. Сразу
же заметим, что сохранение какой-то одной нормы не означает
сохранение другой нормы.
Пусть в Cn задана какая-либо норма, а матрица A ∈ Cn×n
(как линейный оператор из Cn в Cn ) ее сохраняет. Такую матри-
цу будем называть изометрической относительно данной нормы.
Утверждение. Множество всех комплексных (n × n)-матриц,
изометрических относительно гёльдеровской 2-нормы, совпа-
дает с множеством унитарных матриц порядка n.
Доказательство. Очевидно, что 2-норма порождается есте-
ственным скалярным произведением в Cn . Из наших исследо-
27.7. Унитарно инвариантные нормы 241

ваний, связанных с тождеством параллелограмма, вытекает, что


сохранение длин влечет за собой сохранение скалярных произ-
ведений:
(Ax, Ay) = (x, y) ⇔ y ∗ (A∗ A)x = y ∗ x ∀ x, y ∈ Cn .
Отсюда y ∗ (A∗ A − I)x = 0 ∀ x, y ∈ Cn . Выбирая в качестве x и y
векторы стандартного базиса, приходим к выводу о том, что все
элементы матрицы A∗ A − I равны нулю. Таким образом, сохра-
нение 2-нормы равносильно условию A∗ A = I , определяющему
унитарную матрицу. 
Замечание. Множество матриц, сохраняющих p-норму в случае
p = 2, значительно беднее. Попробуйте доказать, что для всех
p = 2 оно одно и то же и совпадает с множеством матриц вида
DP , где D — диагональная унитарная матрица, а P — матрица
перестановки.

27.7. Унитарно инвариантные нормы


Матричная норма || · || называется унитарно инвариантной,
если ||P AQ|| = ||A|| для любой матрицы A и любых унитарных
матриц P и Q, допускающих умножение.
Утверждение 1. Норма Фробениуса является унитарно инва-
риантной.
Доказательство. Пусть Q — унитарная матрица и A = [a1 , . . .
. . . , an ]. Тогда
||Qaj ||2 = ||aj ||2 , j = 1, . . . , n.
Отсюда
 n n
||QA||F =
2
||Qaj ||2 =
2
||aj ||22 = ||A||2F . 
j=1 j=1
Заметим, что при изучении метода вращений (в связи с упро-
щением вида уравнений для поверхностей 2-го порядка) мы
уже использовали факт сохранения суммы квадратов элементов
вещественной матрицы при умножении ее слева и справа на
ортогональные матрицы.
Рассмотрим еще одну матричную норму — подчиненную
гёльдеровской 2-норме:
||A|| = sup ||Ax||2 .
||x||2 =1
Данная норма называется спектральной нормой матрицы
(смысл названия через некоторое время прояснится). Обозначе-
ние: ||A||2 .
242 Лекция 27

Утверждение 2. Спектральная норма матрицы является уни-


тарно инвариантной.
Доказательство. Пусть Q — унитарная матрица и A = [a1 , . . .
. . . , an ]. По определению
||A||2 = sup ||Ax||2 = sup ||(QA)x||2 = ||QA||2 .
||x||2 =1 ||x||2 =1
Кроме того,
||AQ||2 = sup ||(AQ)x||2 = sup ||(AQ)(Q∗ x)||2 =
||x||2 =1 ||Q∗ x||2 =1

= sup ||Ax||2 = ||A||2 . 


||x||2 =1

27.8. Сингулярное разложение матрицы


В 70-х годах XIX века независимо и почти одновременно
Бельтрами (1873) и Жордан (1874) открыли, что любую квадрат-
ную матрицу можно привести к диагональному виду с помощью
умножения слева и справа на унитарные матрицы. Различные
вопросы, связанные с данным открытием, в том числе его обоб-
щения, стали затем предметом целого ряда исследований. Не бу-
дет сильным преувеличением сказать, что данный факт оказал-
ся потрясающе полезным и одним из наиболее востребованных
в теории матриц и приложениях линейной алгебры.
В действительности то же верно и для прямоугольной мат-
рицы. С помощью умножения на унитарные матрицы она при-
водится к прямоугольной матрице тех же размеров, имеющей
всюду нули, кроме элементов с индексами i = j . Такие матрицы
будем называть диагональными прямоугольными матрицами.
Итак, речь идет о разложении вида
A = V ΣU ∗ , (∗)
где A — заданная (m × n)-матрица, U и V — унитарные матрицы
порядка m и n соответственно, а Σ — диагональная прямо-
угольная (m × n)-матрица, имеющая в позициях (1, 1), (2, 2), . . .
неотрицательные числа
σ1  σ2  . . .  σmin(m,n) .
Разложение (∗) называется сингулярным разложением матри-
цы A. Числа σi называются сингулярными числами матрицы A.
Теорема. Сингулярное разложение A = V ΣU ∗ существует
для любой комплексной прямоугольной матрицы A. Если A
27.8. Сингулярное разложение матрицы 243

вещественная, то матрицы U и V можно выбрать веще-


ственными.
Доказательство. Случай A = 0 тривиален, поэтому будем
считать, что A = 0. Положим σ1 = ||A||2 = sup ||Ax||2 /||x||2 .
x=0
В силу компактности единичной сферы в Cn , непрерывности
нормы и теоремы Вейершрасса, найдется вектор x1 такой, что
||Ax1 ||2 = ||A||2 и ||x1 ||2 = 1. Пусть y1 = Ax1 /||Ax1 ||2 . Таким
образом,
Ax1 = σ1 y1 , ||x1 ||2 = ||y1 ||2 . (#)
Дополним x1 и y1 до ортонормированных базисов и образуем
унитарные матрицы
U1 = [x1 , x2 , . . . , xn ], V1 = [y1 , y2 , . . . , ym ].
Согласно (#), матрица A1 ≡ V1∗ AU1 имеет в первом столбце
только один ненулевой элемент, равный σ1 :


∗ σ1 z ∗
A1 = V1 AU1 = .
0 A2
В силу унитарной инвариантности спектральной нормы, ||A1 || =
= σ1 . Поэтому
,
, ,
,
, σ1 , , ,
σ1 , ,  , A1 σ1 ,  σ12 + ||z||2 ⇒ σ12  σ12 + ||z||2 ⇒
, z , , z ,2 2 2
2


σ1 0
⇒ z = 0 ⇒ A1 = .
0 A2
Далее будем рассуждать по индукции. Если для A2 уже
имеется сингулярное разложение A2 = V2∗ Σ2 U2 , то сингулярное
разложение для A находится с легкостью. Для этого достаточно
взять


1 0 1 0
U = U1 0 U , V = V1 0 V ,
2 2

заметить, что матрицы U и V унитарные (как произведение уни-


тарных матриц), и убедиться в том, что выполняется равенство


∗ σ1 0
V AU = .
0 Σ2
Остается заметить, что индукция начинается с построения
сингулярного разложения для матриц, представляющих собой
один столбец либо одну строку.
244 Лекция 27

Пусть A = [a] ∈ Cm×1 — матрица-столбец. В этом случае най-


дем в Cm ортонормированный базис v1 , . . . , vm , начинающийся
с v1 = a/||a||2 . Тогда
A = V ΣU ∗ , V = [v1 , . . . , vm ],
Σ = [||a||2 , 0, . . . , 0] , U = [1] ∈ C1×1 .
Для матрицы-строки сингулярное разложение получается транс-
понированием. 
Следствие 1. Спектральная норма матрицы равна ее старше-
му сингулярному числу.
Следствие 2. Пусть матрица A обратима и σn — ее младшее
сингулярное число. Тогда ||A−1 ||2 = 1/σn .
Теперь ясно, что старшее сингулярное число матрицы и млад-
шее сингулярное число обратимой матрицы определены одно-
значно. То же верно для всего набора сингулярных чисел, но
это мы докажем позже. Сингулярное разложение и его важные
следствия заслуживают более обстоятельного обсуждения, к ко-
торому мы вернемся в лекции 35.

Задача 1. Доказать неравенство ||A||F  rankA ||A||2 .

Задача 2. Докажите, что max ||A||2 /||A||1 = n .
A∈Cn×n , A=0

Задача 3. Пусть A = [aij ] и D = [dij ] — комплексные матрицы


порядка n, при этом D — диагональная матрица с элементами dii = aii
при 1  i  n. Докажите, что если ||A||2 = ||D||2 , то нулевых элементов
в матрице A не меньше чем 2n − 2.
Задача 4. Пусть L — нижняя треугольная матрица с нижней
треугольной частью, взятой из матрицы A ∈ Cn×n . Докажите, что

||L||2  log2 2n ||A||2 .


Л е к ц и я 28

28.1. Матрица линейного оператора


Рассмотрим линейный оператор A : Vn → Vm , где Vn и Vm —
линейные пространства размерности n и m (над общим полем P ).
Фиксируем какой-нибудь базис e1 , . . . , en в Vn и какой-
нибудь базис f1 , . . . , fm в Vm . В силу линейности оператора A
A(x1 e1 + . . . + xn en ) = x1 (Ae1 ) + . . . + xn (Aen ). (1 )
Поэтому A полностью определяется своим действием на базис-
ных векторах e1 , . . . , en . Разложим образы базисных векторов по
базису пространства образов:
Aej = a1j f1 + . . . + amj fm , j = 1, . . . , n. (2)
Из (1) и (2) получаем
A(x1 e1 + . . . + xn en ) = (a11 x1 + . . . + a1n xn ) f1 + . . .
. . . + (am1 x1 + . . . + amn xn ) fm .
Следовательно,
A(x1 e1 + . . . + xn en ) = y1 f1 + . . . + ym fm ⇔
    
y1 a11 . . . a1n x1
⇔ ... = ... ... ... ... .
ym am1 . . . amn xn
Матрица, возникшая справа, называется матрицей линейного
оператора A в паре базисов {ej } и {fi }.
Таким образом, любая фиксированная пара базисов порожда-
ет три изоморфизма:
Vn ↔ P n , Vm ↔ P m , L(Vn , Vm ) ↔ P m×n ,
где L(Vn , Vm ) — линейное пространство всех линейных опе-
раторов, действующих из пространства Vn в пространство Vm ,
а P (m×n) — линейное пространство всех (m × n)-матриц с эле-
246 Лекция 28

ментами из поля P . Отсюда, в частности, видно, что размерность


пространства линейных операторов L(Vn , Vm ) равна mn.
П РИМЕР. Пусть D : V → W — оператор дифференцирования на
пространстве многочленов V = W степени 2 и ниже. Рассмотрим базис
e1 = 1 + t, e2 = 1 − t, e3 = t2 в V и базис f1 = 1, f2 = t, f3 = t2 в W .
Очевидно, что

D(1 + t) = 1, D(1 − t) = −1, D(t2 ) = 2t.

Поэтому в паре базисов e = {ei } и f = {fi } матрица линейного опера-


тора D имеет вид
 
1 −1 0
Aef = 0 0 2 .
0 0 0

Какой будет матрица того же оператора, если в W = V выбрать тот же


базис e1 , e2 , e3 ? Для этого нужно найти разложения образов векторов
e1 , e2 , e3 по тем же векторам e1 , e2 , e3 :

1 1
D(1 + t) = (1 + t) + (1 − t), ⎪
⎪  
2 2 ⎪
⎬ 1/2 −1/2 1
D(1 − t) = − (1 + t) − (1 − t), ⎪ ⇒ Aee =
1 1 1/2 −1/2 −1 .
2 2 ⎪
⎪ 0 0 0

D(t2 ) = (1 + t) − (1 − t)

28.2. Произведение линейных операторов


Произведение линейных операторов A : Vn → Vm и B : Vm →
→ Vk определяется как композиция отображений: BA — это
оператор из Vn в Vk , заданный правилом (BA)(x) = B(Ax). Эле-
ментарно проверяется, что произведение линейных операторов
является линейным оператором.
Пусть A — матрица линейного оператора A в паре базисов
{ej } и {fi }, а B — матрица линейного оператора в паре базисов
{fi } и {gl }. Тогда произведение матриц BA есть матрица
произведения операторов BA в паре базисов {ej } и {gl }.
Доказательство сводится к прямой проверке. Заметим, что
наш курс, собственно, начался с определения произведения мат-
риц и фактически с обсуждения композиции линейных отобра-
жений!
28.3. Переход к другим базисам 247

28.3. Переход к другим базисам


Пусть Aef — матрица линейного оператора A в паре базисов
e = {ej } и f = {fi }. Как найти матрицу Agh того же оператора
в другой паре базисов: g = {gj } и h = {hi }?
Рассмотрим равенства
A(x1 e1 + . . . + xn en ) = y1 f1 + . . . + ym fm ,
A(z1 g1 + . . . + zn gn ) = u1 h1 + . . . + um hm .
Согласно определению матриц Aef и Agh , находим
Aef x = y , Agh z = u,
       
x1 y1 z1 u1
x = ... , y = ... , z = ... , u = ... .
xn ym zn um
Далее запишем
gj = s1j e1 + . . . + snj en , 1  j  n,
hi = t1i f1 + . . . + tmi fm , 1  i  m,
и введем матрицы перехода
   
s11 . . . s1n t11 . . . t1m
S = ... ... ... , T = ... ... ... .
sn1 . . . snn tm1 . . . smm
Тогда x = Sz и y = T u. Следовательно, Aef (Sz) = T u ⇒
(T −1 Aef S)z = u ⇒