Вы находитесь на странице: 1из 134

Алгебра

лекции для студентов потока «Программная инженерия»


2020/21 учебный год

Андрей Смоленский
4 июня 2021 г.

Содержание
1 Основы теории множеств 3
1.1 Множества и операции над ними . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Упорядоченные пары, кортежи и декартово произведение . . . . . . . . . . . . . 5
1.3 Бинарные отношения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Отношения эквивалентности и разбиения . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6 Фактор‐множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Отношения порядка и математическая индукция . . . . . . . . . . . . . . . . . . . 14

2 Алгебраические структуры и элементарная теория чисел 18


2.1 Бинарные операции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Группы и кольца . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3 Делимость в коммутативном кольце . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Делимость целых чисел . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Взаимная простота . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6 Линей ные диофантовы уравнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7 Простые числа и основная теорема арифметики . . . . . . . . . . . . . . . . . . . . 29
2.8 Сравнения и кольца классов вычетов . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.9 Двоичная арифметика конечной разрядности . . . . . . . . . . . . . . . . . . . . . 33
2.10 Функция Эй лера, теорема Эй лера и малая теорема Ферма . . . . . . . . . . . . . . 34
2.11 Китай ская теорема об остатках . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.12 Криптографические протоколы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3 Поля и многочлены 39
3.1 Поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Многочлены одной переменной . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3 Деление и вычисление значений многочленов . . . . . . . . . . . . . . . . . . . . . 42
3.4 Алгоритмические аспекты деления многочленов . . . . . . . . . . . . . . . . . . . 44
3.5 Комплексные числа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6 Геометрическая интерпретация комплексных чисел . . . . . . . . . . . . . . . . . 48
3.7 Дробно‐линей ные преобразования . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.8 Полиномиальные уравнения комплексной переменной . . . . . . . . . . . . . . . 54

1
3.9 Производная и кратные корни . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.10 Интерполяция . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.11 Поле частных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.12 Рациональные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4 Основы линейной алгебры 64


4.1 Векторные пространства и базисы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2 Подпространства и фактор‐пространства . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3 Линей ные отображения и матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4 Матрица перехода между базисами . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5 Образ и ранг . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.6 Системы линей ных уравнений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.7 Элементарные преобразования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.8 Метод Гаусса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.9 Перестановки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.10 Определители . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.11 Свой ства определителя . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.12 Формулы Крамера и присоединенная матрица . . . . . . . . . . . . . . . . . . . . . 91
4.13 Определитель Вандермонда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

5 Линейные операторы 94
5.1 Определитель оператора, собственные числа и собственные векторы . . . . . . 94
5.2 Спектр графа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3 Диагонализация и жорданова форма . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4 Приложения жордановой формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

6 Билинейная алгебра 107


6.1 Билиней ные формы и скалярные произведения . . . . . . . . . . . . . . . . . . . . 107
6.2 Квадратичные формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.3 Диагонализация билиней ных и квадратичных форм . . . . . . . . . . . . . . . . . 109
6.4 Классификация . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.5 Диагонализация ортогональным преобразованием . . . . . . . . . . . . . . . . . . 114

7 Теория полей 116


7.1 Простые расширения полей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2 Степень расширения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.3 Алгебраические расширения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7.4 Конечные поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.5 Строение конечных полей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

8 Коды с коррекцией ошибок 125


8.1 Линей ные коды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.2 Исправление ошибок в линей ных кодах . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.3 Код Хэмминга . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
8.4 Циклические коды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
8.5 Коды Боуза—Чоудхури—Хоквингема . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

Предметный указатель 132

2
1 Основы теории множеств
1.1 Множества и операции над ними
Множества понимаются как «собрания элементов» в том смысле, что для любого объекта x
(какой бы природы он ни был) и для любого множества X либо этот объект является его
элементом (этот факт мы обозначаем записью x ∈ X), либо не является (тогда x ∈
/ X). Мно‐
жество однозначно определяется своими элементами. Это означает, что два множества A и
B совпадают, если у них одинаковые элементы, то есть всякий элемент множества A обяза‐
тельно является также элементом множества B, и наоборот.
Мы не будем строго строить теорию множеств и давать точное аксиоматическое опреде‐
ление понятия множества, но обозначим некоторые свой ства, которым это понятие должно
удовлетворять, чтобы не наткнуться на известные парадоксы (см. ниже).
• Простей ший способ задать множество — перечислить его элементы в виде явного спис‐
ка, например, X = {1, 2, 3, 99}. При этом
– множество, состоящее из одного элемента, отличается от этого элемента: {x} 6= x,
{{x}} 6= {x} и так далее;
– не учитываются повторы, то есть {x, x} = {x};
– не учитывается порядок элементов в списке: {x, y} = {y, x};
– список может не содержать ни одного элемента — такое множество называется
пустым и обозначается символом ∅;
– пустое множество — самостоятельная сущность, которая может быть элементом
какого‐то множества, и там самым, в частности ∅ 6= {∅} и {x, ∅} 6= {x}.
• Постулируется существование бесконечного множества натуральных чисел, которое
можно неформально записать в виде N = {1, 2, 3, . . .}. Подразумевается, что при виде
такой надписи читающий ее понимает, какие именно элементы имеются в виду. Мы
иногда будем пользоваться подобными неформальными записями, например, множе‐
ство всех четных целых чисел в таком стиле можно записать как {. . . , −4, −2, 0, 2, 4, . . .}.
Далее мы увидим, как можно строго построить их на основе множества натуральных
чисел.
• Если множества A и B таковы, что все элементы A являются также элементами B, то
мы говорим, что A является подмножеством B (также, что A содержится в B). Для та‐
кой ситуации мы используем запись A ⊆ B. С таким обозначением можно сказать, что
A = B тогда и только тогда, когда A ⊆ B и B ⊆ A. Обратите внимание, что запись
A ⊆ B не исключает случая A = B. Если хочется подчеркнуть, что A ⊆ B, но A 6= B,
то пишут A ( B (или A j B) и говорят, что A строго содержится в B (или является
собственным подмножеством). Часто в литературе можно также встретить для таких
случаев обозначение A ⊂ B (по аналогии с < и 6), но оно иногда используется как
эквивалент ⊆, так что мы постараемся его избегать.
Свой ство включения множеств обладает следующими простыми свой ствами:
– Для любого множества A имеем ∅ ⊆ A.
– Если A ⊆ B и B ⊆ C, то A ⊆ C.

• Множества можно объединять: если A и B это два множества, то их объединением на‐


зывается такое множество A ∪ B, что x ∈ A ∪ B тогда и только тогда, когда x ∈ A или

3
x ∈ B (возможно, что в обоих сразу). Разумеется, объединение можно определить и
для большего количества множеств. Если объединяемых множеств конечное число, то
в дополнительном определении смысла немного, так как для любых трех множеств A,
B и C выполнено (A∪B)∪C = A∪(B ∪C). Поэтому если A1 , A2 , . . . , An — множества, то
A1 ∪ . . . ∪ An можно определить рекуррентно как (A1 ∪ . . . ∪ An−1 ) ∪ An — но скобки тут,
разумеется, можно расставить как угодно. Отметим некоторые тривиальные свой ства
объединения:
A ∪ B = B ∪ A, A ∪ A = A, A ∪ ∅ = A.
Последние два свой ства являютс частными случаями более общего свой ства: если B ⊆
A, то A ∪ B = A.
• В уже существующем множестве можно выделять подмножества посредством какого‐
либо предиката. А имменно, пусть P (a) — некоторое суждение, которое, в зависимости
от параметра a, может либо истинным, либо ложным. Тогда для уже имеющегося мно‐
жества A можно сформировать новое множество B = {a ∈ A | P (A)}, состоящее в точ‐
ности из тех элементов a множества A, для которых суждение P (a) истинно. Например,
если A = {1, 2, 3, 4, 5}, то {a ∈ A | a нечетно} = {1, 3, 5}. Аналогично, множество всех
четных натуральных чисел строится как {a ∈ N | a четно}.
Очень существенно, что выделение при помощи предиката производится из некоторо‐
го уже построенного множества, то есть элементы берутся не «из воздуха».
Рассмотрим «множество» X всех множеств, которые не являются собственными элементами. Является ли
само множество X элементом множества X? Если да, то по определению X оно не должно быть его элемен‐
том, если же нет, то должно — оба варианта противоречивы. Это явление известно как парадокс Рассела—
Цермело. Чтобы разрешить его, аксиоматика теории множеств не допускает подобных конструкций — в
частности, нет «множества всех множеств».

• С операцией выделения с помощью предиката можно удобным образом определить


некоторые другие важные операции над множествами:
– Пересечением множеств A и B называется множество A ∩ B, состоящее из тех эле‐
ментов, которые принадлежат одновременно A и B. Его же можно определить и
менее симметричным образом, а именно

A ∩ B = {x ∈ A | x ∈ B} = {x ∈ B | x ∈ A}.

Все три определения задают, разумеется, одно и то же множество, и операция об‐


ладает следующими простей шими свой ствами:

A ∩ B = B ∩ A, (A ∩ B) ∩ C = A ∩ (B ∩ C), ∀B ⊆ A A ∩ B = B.

– Разностью множеств A и B называется A \ B = {x ∈ A | x ∈


/ B}.
– Симметрической разностью множеств A и B называется множество A4B тех эле‐
ментов, которые принадлежат только одному из этих двух множеств:

A 4 B = (A ∪ B) \ (A ∩ B) = (A \ B) ∪ (B \ A).

• Для любого множества A существует множество B, элементами которого являются все


подмножества множества A. То есть x ∈ B тогда и только тогда, когда x ⊆ A. Обозна‐
чается такое множество символом 2A (обоснование такого обозначения см. ниже).

4
• Операции объединения и пересечения можно распространить на бесконечные наборы
множеств. А именно, если A — такое множество,
S что все его элементы сами являются
множествами, то существует множество a∈A a, элементы которого это в точности те
объекты, которые являются элементами хотя бы одного a ∈ A. Аналогично определя‐
ется пересечение, хотя для него не требуется специального нового определения, так
как, выбрав некоторый a0 ∈ A, можно положить
\
a = {x ∈ a0 | ∀a ∈ A x ∈ a},
a∈A

и результат, конечно, не зависит от выбора конкретного a0 . Обратите внимание, что


объединение определено в том числе и в случае A = ∅ (тогда оно тоже пустое), в то
время как пересечение пустого набора множеств не определено.
Если во множестве A имеется лишь конечное число элементов, то будем обозначать их ко‐
личество |A|. Если множество A бесконечное, то будем писать |A| = ∞. Заметим, что для
конечных множеств A и B если A ⊆ B, то |A| 6 |B| (строгое доказательство этого фак‐
та нетривиально, поскольку требует как минимум более строгого определения того, какие
множества являются конечными). Кроме того, если A ⊆ B и |A| = |B| 6= ∞, то A = B.

1.2 Упорядоченные пары, кортежи и декартово произведение


Как было отмечено выше, множество не помнит порядка своих элементов, в частности, {x, y} =
{y, x}. Однако оказывается край не полезным порядок все‐таки помнить.
Определение 1.2.1. Упорядоченная пара (x, y) это «двухэлементное множество», в котором
один из элементов отмечен как первый , а другой как второй .
С этим определением связано несколько трудностей . Во‐первых, непонятно, что значит,
что элемент «отмечен». Во‐вторых, неясно, что делать в случае, когда первый и второй эле‐
мент совпадают. В любом случае, должно иметь место
Свойство 1.2.2. Две упорядоченные пары равны, если равны их первые компоненты и рав‐
ны вторые. То есть (a, b) = (x, y) тогда и только тогда, когда a = x и b = y.
По существу только это свой ство упорядоченных пар и имеет значение.
Один из способов формально сконструировать упорядоченные пары — определить их как (x, y) = {{x}, {x, y}}.
Такая модель упорядоченной пары называется конструкцией Куратовского.
Для начала отметим, что в случае x = y имеем (x, x) = {{x}, {x, x}} = {{x}, {x}} = {{x}}, а при x 6= y пара
(x, y) имеет как множество два различных элемента.
Покажем, что модель Куратовского дей ствительно задает упорядоченные пары, то есть такие объекты обладают
Свой ством 1.2.2. Дей ствительно, если a = x и b = y, то (a, b) = (x, y) просто по построению. Обратно, пусть (a, b) =
(x, y). Это означает, что каждый элемент первого множества является элементом второго. В частности, {a} ∈ (x, y)
— то есть либо {a} = {x}, либо {a} = {x, y}. Второй вариант возможен только в том случае, если x = y, но тогда
(x, y) состоит из одного элемента, а тогда и (a, b) является одноэлементным, и тогда a = b = x = y. Если же
{a} = {x} (и a = x), но x 6= y, то точно так же a 6= b. Тогда {a, b} ∈ (x, y) влечет {a, b} = {x, y}, откуда b = y.
Существуют и другие модели понятия упорядоченной пары, например:
• Модель Винера: (x, y) = {{{a}, ∅}, {{b}}};
• Модель Хаусдорфа: (x, y) = {{x, 1}, {y, 2}}, где 1 и 2 это два различных объекта, отличных от x и y — рабо‐
тает, если заранее оговорено множество, и которого берутся элементы x и y.
• Короткая модель Куратовского: (x, y) = {x, {x, y}} — даже при x = y является двухэлементным множе‐
ством, но доказательство Свой ства 1.2.2 сложнее и требует так называемой аксиомы регулярности (в акси‐
оматике Цермело—Френкеля все объекты являются множествами, аксиома регулярности утверждает, что
любое непустое множество x содержит элемент, имеющий с ним пустое пересечение).

5
Аналогично можно определить и упорядоченные наборы из более чем двух элементов.

Определение 1.2.3. Упорядоченной n‐кой (или кортежем длины n, или тупелем (от англ.
tuple)) называется набор (x1 , x2 , . . . , xn ), и равенство двух наборов определяется равенством
элементов на соответствующих позициях:

(a1 , . . . , an ) = (x1 , . . . , xn ) ⇔ a1 = x1 , a2 = x2 , . . . , an = xn .

Один из формальных способов определить кортеж длины больше 2 — рекуррентный , на‐


пример, положить (a, b, c) = ((a, b), c) и, более общо, (a1 , . . . , an ) = ((a1 , . . . , an−1 ), an ), но мы
для удобства будем такую конструкцию игнорировать и считать кортежи определенными
посредством своего характеристического свой ства.
Определение 1.2.4. Декартовым произведением множеств A и B называется множество A×
B всевозможных упорядоченных пар, первый элемент которых принадлежит A, а второй B:

A × B = {(a, b) | a ∈ A, b ∈ B}.
Формально определение выше не вполне корректно, потому что не удовлетворяет тре‐
бованиям, предъявляемым к процедуре выделения подмножества при помощи предиката.
Для практических целей существование такого множества можно постулировать в качестве
аксиомы.
Если же подходить к этому вопросу строго, то можно воспользоваться какой ‐нибудь из моделей упорядоченной
пары. Например, в модели Куратовского упорядоченная пара (a, b) состоит из двух множеств {a} и {a, b}, которые
оба являются подмножествами множества A ∪ B, или, что то же самое, элементами множества 2A∪B . Это означает,

2A∪B
что набор множеств {{a}, {a, b}} является подмножеством 2A∪B , то есть элементом множества 2 . В этом
множестве декартово произведение уже выделяется при помощи предиката:
 
A∪B

A×B = x∈2 2 ∃a ∈ A, b ∈ B т. ч. x = (a, b) .

Аналогично можно определить декартово произведения большего количества множеств:

A1 × . . . × An = {(a1 , . . . , an ) | ∀i = 1, . . . , n ai ∈ Ai }.

Обратите внимание, что формально все три множества

A × B × C, (A × B) × C и A × (B × C)

различны (хотя первые два совпадают, если мы принимаем рекуррентное определение упо‐
рядоченной трой ки).
Для декартова произведения множества с собой мы будем использовать обозначение A2 =
A × A. Аналогично, An = A × . . . × A (n раз).
Отметим некоторые свой ства декартова произведения.
• A × ∅ = ∅ × A = ∅;
• (A ∪ B) × C = (A × C) ∪ (B × C), (A ∩ B) × C = (A × C) ∩ (B × C) и аналогичные
формулы для A × (B ∪ C) и A × (B ∩ C);
• (A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D) — для объединения аналогичной формулы нет.

6
1.3 Бинарные отношения
Определение 1.3.1. Бинарным отношением R между элементами множеств A и B называ‐
ется подмножество их декартова произведения: R ⊆ A × B. В случае, если A = B, будем
говорить, что R ⊆ A2 это бинарное отношение на A.
Примеры 1.3.2. Во многих случаях бинарное отношение выделяется в декартовом произ‐
ведении при помощи предиката, выражающего какое‐то соотношение между элементами
упорядоченной пары.
1. R = {(x, y) ∈ R2 | x 6 y};
2. R = {(x, y) ∈ N2 | x делится на y};
3. R = {(x, y) ∈ A × 2A | x ∈ y};
4. R = {(x, y) ∈ 2A × 2A | x ⊆ y};
5. R = {(x, y) ∈ 2A × 2A | |x| = |y|};
6. Пусть Ln — множество прямых в n‐мерном пространстве, и
a) R = {(x, y) ∈ L22 | x k y},
b) R = {(x, y) ∈ L22 | x ⊥ y},
c) R = {(x, y) ∈ L33 | x и y скрещивающиеся}.
Обратите внимание, что в большинстве примеров выше предикат выражается каким‐то
уже имеющимся символом, что мотивирует следующее
Определение 1.3.3. Будем говорить, что x находися в отношении R с y (или что x и y нахо‐
дятся в отношении R), если (x, y) ∈ R, и обозначать это посредством xRy.
С учетом этого обозначения мы могли бы сразу обозначить бинарное отношение из при‐
мера 1 символом 6, а примеры 3, 4, 6a и 6b соответственно посредством ∈, ⊆, k и ⊥. С дру‐
гой стороны, полезно иметь и альтернативные обозначения, потому что иначе для указания
связей между различными бинарными отношениями пришлось бы использовать несколько
неуклюжие формулы наподобие

< ⊂ 6, = ∩ < = ∅, 6 ∩ > = =.

Хотя три указанные выше формулы верны (первая утверждает, что из строгого неравенства
следует нестрогое; вторая показывает, что равенство противоречит строгому неравенству;
третья соответствует тому, что два разнонаправленных неравенства выполняются одновре‐
менно только для равных элементов, то есть антисимметричность), мы постараемся не зло‐
употреблять возникающими лингвистическими возможностями.
Впрочем, далее мы увидим, что многие естественные примеры бинарных отношений име‐
ют другую природу.
Теперь определим некоторые свой ства, которыми могут обладать бинарные отношения
на множестве.
Определение 1.3.4. Пусть R ⊂ A2 — бинарное отношение на A. Мы будем говорить, что R
• рефлексивно, если ∀x ∈ A xRx;
• симметрично, если ∀x, y ∈ A из xRy следует yRx;

7
• антисимметрично, если ∀x, y ∈ A из xRy и yRx следует x = y;

• транзитивно, если ∀x, y, z ∈ A из xRy и yRz следует xRz.


Среди примеров выше рефлексивными являются примеры 1, 2, 4, 5, 6a (если считать, что
прямая параллельна сама себе).
Симметричными являются примеры 5, 6a, 6b, 6c, а антисимметричными примеры 1, 2, 4.
Обратите внимание, что отношения строгого неравенства < и строгого включения ( тоже
являются антисимметричными, хотя в них ситуации вроде x < y и y > x одновременно не
случаются.
Транзитивными являются примеры 1, 2, 4, 5, 6a.
Отдельно отметим, что пустое отношение ∅ является симметричным, антисимметричным
и транзитивным, но не является рефлексивным (кроме случая, когда оно рассматривается
как отношение на ∅), а отношение A2 на множестве A рефлексивно, симметрично и транзи‐
тивно, но не антисимметрично.
Некоторые из приведенных примеров бинарных отношений (конкретно, 1, 2, 4) выражают
идею того, что один элемент меньше другого (подмножество меньше объемлющего множе‐
ства, делитель меньше делимого). Подобные бинарные отношения называются отношени‐
ями порядка (см. ниже).

1.4 Отношения эквивалентности и разбиения


Следующее определение выражает идею схожести элементов.

Определение 1.4.1. Бинарное отношение называется отношением эквивалентности, если


оно рефлексивно, симметрично и транзитивно.
Дей ствительно, естественно полагать, что всякий объект схож сам с собой (рефлексив‐
ность) и что если x схож с y, то y схож с x (симметричность). Свой ство транзитивности утвер‐
ждает, что можно сколь угодно долго переходить от одного объекта к сходному с ним, и все
это время рассматриваемые объекты будут сходны с начальным. Это, в частности, означа‐
ет, что отношение эквивалентности не отражает идею близости объектов. Например, если
ε > 0 — некоторое фиксированное число, то отношение xRy ⇔ |x − y| < ε не является
транзитивным.
Примеры 1.4.2.

1. Отношение равенства размеров множеств (пример 5 выше).


2. Параллельность прямых.
3. Равенство треугольников (иногда еще называемое конгруэнтностью). Хотя треуголь‐
ники, именуемые в школьном курсе геометрии равными, не являются буквально рав‐
ными как подмножества плоскости, а только лишь совмещаются друг с другом посред‐
ством движения плоскости, они обладают, тем не менее, идентичными свой ствами.
4. Подобие треугольников (треугольники полагаются подобными, если они могут быть
совмещены движением плоскости и гомотетией ).
5. Отношения равносоставленности и равновеликости на множестве всех многоугольни‐
ков.

6. Для фиксированного целого m отношение {(x, y) ∈ Z2 | x − y делится на m}.

8
7. {(α, β) ∈ R2 | α − β = 2πk для некоторого k ∈ Z} — эквивалентность величин углов.
Теперь мы дадим другое описание отношений эквивалентности.
Определение 1.4.3. Разбиением множества A называется набор B подмножеств A (т.е. B ⊆
2A ), удовлетворяющий следующим условиям:
• ∅∈
/ B;
• ∀b, c ∈ B если b 6= c, то b ∩ c = ∅;
S
• A = b∈B b.

Определение 1.4.4. Отношением эквивалентности, отвечающим разбиению B множества


A, называется бинарное отношение ∼B на множестве A, задаваемое следующим образом:
x ∼B y тогда и только тогда, когда существует такой элемент b ∈ B, что x, y ∈ b.
Замечание 1.4.5. ∼B является отношением эквивалентности.
Доказательство. Это отношение является рефлексивным, так как каждый элемент множе‐
ства A попадает в какой ‐то элемент разбиения. Симметричность очевидна. Чтобы доказать
транзитивность, предположим, что x ∼B y и y ∼B z. Это означает, что най дутся такие b, c ∈
B, что x, y ∈ b и y, z ∈ c. Но тогда y ∈ b ∩ c и b ∩ c 6= ∅, так что b = c, откуда x, z ∈ b, то есть
x ∼B z.
Определение 1.4.6. Пусть ∼ это отношение эквивалентности на множестве A. Классом эк‐
вивалентности элемента x ∈ A относительно ∼ называется множество
[x]∼ = {y ∈ A | x ∼ y}.
Разбиением A, отвечающим ∼, называется множество классов эквивалентности
B∼ = {[x]∼ | x ∈ A}.
В дальней шем в обозначении классов эквивалентности мы часто будем опускать знак от‐
ношения и просто писать [x] или x.
Замечание 1.4.7. B∼ является разбиением.
Доказательство. Пустое множество не принадлежит B∼ по построению, так как каждый
класс эквивалентности S непуст. АSименно, x ∈ [x] в силу рефлексивности отношения ∼. По
той же причине A = x∈A [x] = b∈B b. Покажем, что пересекающиея классы совпадают. В
самом деле, если для некоторых x, y ∈ A нашелся элемент z ∈ [x] ∩ [y], то x ∼ z и y ∼ z, отку‐
да z ∼ y в силу симметричности и x ∼ y по транзитивности, откуда [y] ⊆ [x]. Точно таким же
образом [x] ⊆ [y], так что два класса дей ствительно равны.
Вместе эти два замечания показывают, что задать отношение эквивалентности это то же
самое, что задать разбиение, в том смысле, что по одному можно восстановить другое и на‐
оборот. Формально это выражает следующая
Теорема 1.4.8. Если ∼ это отношение эквивалентности на A, то ∼B∼ = ∼. Если B это разби‐
ение, то B∼B = B.
Доказательство. Посмотреть и осознать.
 
x ∼B∼ y ⇔ ∃b ∈ B∼ x, y ∈ B ⇔ ∃z ∈ A x, y ∈ [z]∼ ⇔ x ∼ y ⇒ ∼B∼ = ∼;
 
b ∈ B∼B ⇔ ∃x ∈ A b = [x]∼B ⇔ ∃c ∈ B b = c ⇒ B∼B = B.

9
1.5 Функции
Неформально говоря, функция из множества A в множество B это некое «правило сопостав‐
ления» элементов B элементам A. Это означает, что каждому элементу множества A соот‐
ветствует однозначно определенный элемент множества B. Поскольку не все интересую‐
щие нас функции удобно задаются формулами (если задаются вообще!), мы формализуем
понятие функции с помощью понятия бинарного отношения.
Определение 1.5.1. Бинарное отношение Γ ⊆ A×B называется графиком, если для любого
a ∈ A существует ровно один такой b ∈ B, что aΓb.
Это понятие отвечает привычному понятию графика функции. Например, функции, возво‐
дящей вещественное число x в квадрат, отвечает подмножество плоскости {(x, x2 ) | x ∈ R},
которое, очевидно, является графиком в смысле определения выше.
Определение 1.5.2. Функцией из множества A в множество B называется упорядоченная
трой ка f = (A, B, Γ), где Γ — график.
Обозначение 1.5.3. Если f — функция из A в B, то мы будем это записывать как f : A → B.
Замечание 1.5.4. Две функции f : A → B и g : C → D равны, если равны их области опреде‐
ления (A = C), области прибытия (B = D), а также совпадают графики (то есть для любого
x ∈ A выполнено f (x) = g(x)).
Введем некоторые обозначения и необходимую терминологию.
• Если b ∈ B таков, что aΓb (такой b существует и единственный ), то b называется обра‐
зом a под дей ствием f (или значением f в/на a) и обозначается f (a).
• Множество A называется областью определения, а B областью прибытия.
• Если C ⊆ A, то f (C) = {f (a) | a ∈ C} называется образом C. При этом f (A) иногда
называется областью значений.
• Если b ⊆ B, то f −1 (b) = {a ∈ A | f (a) = b} называется (полным) прообразом C, а
всякий его элемент — прообразом b. Естественным способом определяется прообраз
подмножества C ⊆ B, а именно f −1 (C) = {a ∈ A | f (a) ∈ C}.
Определение 1.5.5. Пусть f : A → B. Функция f называется
• инъективной (или инъекцией), если для любых a, b ∈ A если a 6= b, то f (a) 6= f (b);
• сюръективной (или сюръекцией), если для любого b ∈ B существует такой a ∈ A, что
f (a) = b;
• биективной (или биекцией), если она инъективна и сюръективна, то есть для любого
b ∈ B существует ровно один такой a ∈ A, что f (a) = b.
Иными словами, функция инъективна, если полный прообраз любого элемента содержит не
более одного элемента, сюръективна, если содержит хотя бы один, и биективна, если ровно
один.
Пример 1.5.6. Обозначим через R>0 = {x ∈ R | x > 0} множество неотрицательных веще‐
ственных чисел и рассмотрим четыре функции

f1 : R → R, f2 : R → R>0 , f3 : R>0 → R, f4 : R>0 → R>0 ,

10
все задаваемые одной и той же формулой fi (x) = x2 (различаются только область опре‐
деления и область прибытия). Тогда функция f1 не инъективна и не сюръективна (так как
f1−1 (1) = {1, −1} и f1−1 (−1) = ∅), функция f2 не инъективна, но сюръективна, функция f3
инъективна, но не сюръективна, а f4 биективна.
Определение 1.5.7. Сужением или ограничением функции f : A → B на подмножество C ⊆
A называется функция f |C : C → B, дей ствующая по правилу f |C (x) = f (x). Формально,
если f = (A, B, Γ), то f |C = (C, B, Γ ∩ (C × B)).
В примере выше f3 = f1 |R>0 и f4 = f2 |R>0 .
Можно вычислять значение одной функции на значении другой функции.
Определение 1.5.8. Пусть f : A → B и g : B → C, тогда композицией функций g и f называ‐
ется функция g ◦ f : A → C, дей ствующая по правилу (g ◦ f )(x) = g(f (x)).
Предложение 1.5.9. Композиция функций ассоциативна, то есть если f : A → B, g : B → C
и h : C → D, то обе композиции h ◦ (g ◦ f ) и (h ◦ g) ◦ f определены и совпадают.
Доказательство. g ◦ f есть функция из A в C, так что композиция h и g ◦ f определена и
является функцией из A в D. Аналогично, h◦g : B → D, а тогда (h◦g)◦f : A → D определена.
Проверим теперь, что совпадают значения во всех точках. Пусть a ∈ A, тогда
  
h ◦ (g ◦ f ) (a) = h (g ◦ f )(a) = h g(f (a)) ,
 
(h ◦ g) ◦ f (a) = (h ◦ g)(f (a)) = h g(f (a)) .
Замечание 1.5.10. Композиция функций не коммутативна, то есть не обязательно f ◦ g =
g ◦ f.
Дей ствительно, даже если композиция в одном порядке определена, композиция в другом
не обязательно существует. Чтобы обе композиции существовали, требуется, чтобы f : A →
B и g : B → A. Но даже в этом случае, если A 6= B, получаются функции с различающими
областями определения и прибытия, а именно g ◦ f : A → A, но f ◦ g : B → B. Наконец,
даже если A = B, легко привести пример функций , у которых две композиции не совпадают.
Например, положим f : R → R, f (x) = x + 1, и g : R → R, g(x) = x2 — тогда (g ◦ f )(x) =
x2 + 2x + 1, но (f ◦ g)(x) = x2 + 1.
Предложение 1.5.11. Композиция инъективных (сюръективных, биективных) функций инъ‐
ективна (сюръективна, биективна).
Доказательство. Пусть f : A → B и g : B → C. Предположим сначала, что f и g инъективны
и рассмотрим значения (g ◦ f ) на каких‐нибудь точках x, y ∈ A. Если g(f (x)) = g(f (y)), то по
инъективности g получаем, что f (x) = f (y), откуда в силу инъективности f имеем x = y, так
что g ◦ f также инъективна.
Пусть теперь f и g сюръективны. Если c ∈ C, то по сюръективности g най дется такой
b ∈ B, что g(b) = c. Но в силу сюръективности f существует такой a ∈ A, что f (a) = b. Тогда
(g ◦ f )(a) = g(f (a)) = g(b) = c.
Предложение 1.5.12. Пусть f : A → B и g : B → C. Если g ◦ f инъективна, то f инъективна.
Если g ◦ f сюръективна, то g сюръективна.
Доказательство. Пусть g ◦ f инъективна. Рассмотрим значения g ◦ f на двух точках x, y ∈ A.
Если x 6= y, то g(f (x)) 6= g(f (y)), а тогда f (x) 6= f (y) (иначе применение к ним g давало бы
равные значения), так что f инъективна.
Если g ◦ f сюръективна, то для любого c ∈ C най дется такой a ∈ A, что (g ◦ f )(a) = c. Тогда
положим b = f (a) — это искомый прообраз c относительно g, так что g сюръективна.

11
Определение 1.5.13. Тождественной функцией на множестве A называется функция idA : A →
A, дей ствующая по правилу idA (x) = x.
Замечание 1.5.14. Для любой функции f : A → B выполнено idB ◦f = f и f ◦ idA = f .
Сей час мы определим три важных понятия, тесно связанных с инъективностью и сюръек‐
тивностью.

Определение 1.5.15. Пусть f : A → B и g : B → A. Будем говорить, что


• g является левой обратной для f , если g ◦ f = idA ;
• g является правой обратной для f , если f ◦ g = idB ;
• g является (двусторонней) обратной для f , если она одновременно левая и правая об‐
ратная.
Будем говорить, что f обратима слева (справа), если у нее имеется левая (правая) обратняа.
Если у f имеется двусторонняя обратная, будем говорить, что f обратима.
Замечание 1.5.16. Если у функции f : A → B одновременно существуют левая и правая об‐
ратные, то они совпадают. В частности, в таком случае левая и правая обратные единствен‐
ные, а f обратима.
Доказательство. Пусть g, h : B → A — левая и правая обратные, то есть g ◦ f = idA и f ◦ h =
idB . Тогда
g = g ◦ idB = g ◦ (f ◦ h) = (g ◦ f ) ◦ h = idA ◦h = h.

Теорема 1.5.17. Пусть f : A → B.


1. Пусть A 6= ∅. f инъективна тогда и только тогда, когда f обратима слева.
2. f сюръективна тогда и только тогда, когда f обратима справа.
3. f биективна тогда и только тогда, когда она обратима.

Доказательство. Если f обратима слева, то есть для некоторого g : B → A выполнено g ◦


f = idA , то в силу инъективности idA по Предложению 1.5.12 получаем, что f инъективна.
Обратно, пусть f инъективна. Выберем какой ‐нибудь один элемент a0 ∈ A и рассмотрим
функцию (
a, если b = f (a),
g(b) =
a0 , если b ∈
/ f (A).
Эта функция корректно определена, потому что для любого b ∈ B либо b ∈ f (A) — и тогда в
силу инъективности у такого b существует ровно один прообраз a — либо b ∈ / f (A).
Если f обратима справа, то есть f ◦g = idB для некоторого g : B → A, то в силу сюръектив‐
ности idB по Предложению 1.5.12 получаем, что f сюръективна. Обратно, пусть f сюръектив‐
на. Поскольку для любого b ∈ B его полный прообраз непуст, можно выбрать по одному эле‐
менту a в каждом таком полном прообразе и определить g(b) = a. Тогда f (g(b)) = f (a) = b, и
тем самым g является правым обратным для f .
Конструкция выше хорошо работает, если множество B конечное — тогда для построения функции g требуется
сделать конечное число выборов. Если же множество B бесконечно, то, вообще говоря, для возможности такого
одновременного выбора требуется постулировать еще одну дополнительную аксиому, называемую аксиомой вы‐
бора.

12
Если f обратима, то она обратима слева и справа, а тогда по уже доказанным пунктам инъ‐
ективна и сюръективна. Обратно, если f биективна, то обратная функция строится так же,
как и выше, только на этот раз не требуется делать никаких выборов, так как прообраз един‐
ственный . Формально, если обозначить через extr функцию, которая по одноэлементному
подмножеству A возвращает его единственный элемент, то обратная функция g задается
формулой g(b) = extr f −1 (b) .
Обозначение 1.5.18. Если функция, обратная к f , существует, она обозначается символом
f −1 . Тогда запись f −1 (b) может означать как образ под дей ствием обратной функции, так
и полный прообраз относительно f (состоящий из одного элемента). Смысл всегда будет
однозначно восстанавливаться из контекста.
Замечание 1.5.19. Если f и g обратимы, то (g ◦ f )−1 = f −1 ◦ g −1 .
Обозначение 1.5.20. Множество всех функций из множества A в множество B будем обо‐
значать B A .

Чтобы строго обосновать, почему B A является множеством, заметим, что функция f : A → B является трой кой
(A, B, Γf ) и, тем самым, элементом множества {A} × {B} × 2A×B , из которого множество всех функций уже вы‐
деляется предикатом, а именно B A = {f ∈ {A} × {B} × 2A×B | ∃Γ ⊆ A × B — график, т. ч. f = (A, B, Γ)}. Более
короткий способ записать то же самое: B A = {A} × {B} × {Γ ∈ 2A×B | Γ — график}.

Замечание 1.5.21. (
∅ A 0, если A 6= ∅,
A = 1, ∅ = .
1, еслиA = ∅.

Доказательство. Пусть область определения функции f : ∅ → A пуста. Тогда ее график яв‐


ляется подмножеством ∅ × A = ∅, то есть тоже пустое множество. То есть такая функция
имеет вид (∅, A, ∅) — это дей ствительно функция, условие на график является тавтологи‐
чески верным. Такая функция называется пустой и является единственным элементом мно‐
жества A∅ .
Если же f : A → ∅, то для непустого A не существует ни одного графика, так что ∅A = ∅
(случай A = ∅ уже разобран, в этом случае есть только одна функция id∅ = (∅, ∅, ∅)).
Предложение 1.5.22. Если A и B конечные, то B A тоже конечное и |B A | = |B||A| .
Доказательство. Пусть A = {a1 , . . . , ak }. Для b ∈ B обозначим XS b = {f ∈ B
A
| f (a1 ) = b},
A
тогда для различных b множества Xb не пересекаются и B = b∈B Xb . При этом размер
всех множеств Xb одинаков и равен |B A\{a1 } |, так как {f |A\{a1 } | f ∈ Xb } = B A\{a1 } . Тем
самым |B A | = |B| · |B A\{a1 } |. Применяя ту же процедуру ко второму сомножителю, получаем
|B A | = |B|2 · |B A\{a1 ,a2 } |, а после k повторов получаем |B A | = |B|k · |B ∅ | = |B||A| .

С использованием метода математической индукции (см. ниже) это доказательство можно сократить примерно
в два раза (все заканчивается на переходе к |B A\{a1 } |).

Определение 1.5.23. Пусть A — некоторое множество. Характеристической функцией под‐


множества B ⊆ A называется χB : A → {0, 1}, дей ствующая по правилу
(
1, если a ∈ A,
χB (a) =
0, если a ∈ / A.

13
Замечание 1.5.24. Отображение 2A → {0, 1}A , переводящее B ⊆ A в χB , является биекцией .
Доказательство. Обратное отображение переводит функцию f : A → {0, 1} в f −1 (1).
В частности, для конечного множества A имеет место равенство |2A | = 2|A| .
Еще одна причина, почему для обозначения множества всех функций f : A → B выбрано
обозначение B A , кроме изложенных в Предложении 1.5.22 и Замечании 1.5.24, связана с де‐
картовыми степенями. А именно, имеется естественная биекция между An = A × . . . × A (n
раз) и A{1,...,n} , переводящая кортеж (a1 , . . . , an ) в функцию f (i) = ai .
Если полагать функцию исходным понятием, можно определять упорядоченные пары и более длинные кортежи
длины n как функции из фиксированного 2‐ или n‐элементного множества.

1.6 Фактор‐множества
Пусть ∼ — отношение эквивалентности на множестве A.
Определение 1.6.1. Фактор‐множеством A по отношению ∼ называется

A/∼ = {[a]∼ | a ∈ A}.

Как множество это совпадается в уже встречавшимся нам разбиением множества A на


классы (см. Определение 1.4.6), с тем отличием, что для разбиения существенно, разбиением
какого множества оно является, а элементы фактор‐множества мы рассматриваем как но‐
вые независимые сущности (хотя нам и придется порой обращаться к их внутренней струк‐
туре).
Естественное отображение π : A → A/∼ называют канонической проекцией.
Понятие фактор‐множества (или что‐то очень похожее) в скрытой форме встречается уже
в начальной школе. А именно, под словами «треугольник с данными сторонами/углами»
подразумевается не конкретный треугольник на плоскости, а абстрактный треугольник, то
есть, по существу, все такие треугольники разом — формально это класс треугольников по
отношению равенства треугольников (с точностью до движения). Аналогично, счет при по‐
мощи чисел можно рассматривать как переход к фактор‐множеству по отношению равен‐
ства размеров/количества — так, число 1 понимается как абстракция, включающая и 1 апель‐
син, и 1 яблоко, и 1 что угодно.

1.7 Отношения порядка и математическая индукция


Определение 1.7.1. Бинарное отношение называется отношением (частичного) порядка,
если оно рефлексивно, антисимметрично и транзитивно. Множество вместе с отношением
частичного порядка на нем называется частично упорядоченным.
Примеры 1.7.2.
1. 6 и > на любом подмножестве R;
2. ⊆ и ⊇ на любом подмножестве 2A ;
3. «делит» и «делится на» на N (но не на Z — нарушается антисимметричность);
4. лексико‐графический порядок на множестве слов;
5. если 4 и l
− — отношения порядка на множествах A и B, то на A × B естественным
образом возникают два порядка:

14
• (a, b) 6 (a′ , b′ ) ⇔ a 4 a′ и b l ′
−b;
• (a, b) 6 (a′ , b′ ) ⇔ a ≺ a′ или a = a′ и b l ′
−b;
6. если A и B — два непересекающихся множества с порядками 4 и l−, то можно опреде‐
лить следующий порядок на A ∪ B:
  
x 6 y ⇐⇒ x, y ∈ A и x 4 y или x, y ∈ B и x l
− y или x ∈ A и y ∈ B ;

7. отношение «матрешка» на каком‐нибудь множестве геометрических фигур: фигура X


считатся меньше фигуры Y , если некоторым движением X можно поместить внутрь
Y — для прямоугольников на плоскости или параллелепипедов в трехмерном про‐
странстве этот порядок можно еще назвать «упаковкой коробок» (доказательство ан‐
тисимметричности для такого отношения не совсем тривиально, если понимать тер‐
мин «фигура» широко).

Обратите внимание, что отношение R на множестве A, сформированное по принципу aRb


в случае f (a) 6 f (b) для некоторой фиксированной функции f : A → R (или в другое упоря‐
доченное множество), обычно само отношением порядка не является — хотя и используется
повсеместно для сортировки! Дей ствительно, для неинъективных функций такое отноше‐
ние не обладает свой ством антисимметричности.
Вообще говоря, в частично упорядоченном множестве не про любые два элемента можно
сказать, что один из них меньше другого.
Определение 1.7.3. Говорят, что x и y сравнимы, если x 6 y или y 6 x. Если в частично
упорядоченном множеством любые два элемента сравнимы, то такой порядок называется
линейным.

Не всякий порядок линеен, так что понятие «самого маленького» элемента подмножества
распадается на два.
Определение 1.7.4. Пусть (A, 6) — частично упорядоченное множество, и B ⊆ A — непу‐
стое. Элемент x ∈ B называется

• наименьшим, если для любого b ∈ B выполнено x 6 b;


• минимальным, если в B не существует элементов, меньших x (то есть для любого b ∈ B
неравенство b 6 x влечет b = x). Аналогичным образом определяются наибольший и
максимальный элементы.
Пример 1.7.5. Пусть A = 2X относительно ⊆. Тогда у множества A имеется наименьший
элемент ∅, а у множества всех непустых подмножеств X, то есть A \ {∅}, наименьшего эле‐
мента нет, а минимальным является любое одноэлементное подмножество X.
Замечание 1.7.6.
• Если наименьший элемент существует, то он единственный ;

• Наименьший элемент является минимальным;


• Если порядок линеен, то минимальный элемент является наименьшим.
Доказательство. Антисимметричность.

15
Определение 1.7.7. Частично упорядоченное множество A называется вполне упорядочен‐
ным, а порядок полным, если любое непустое подмножество B ⊆ A содержит наименьший
элемент.
Замечание 1.7.8. Полный порядок является линей ным.
Доказательство. Пусть x, y два элемента. Рассмотрим множество {x, y} — в нем имеется
наименьший элемент, скажем, a. Обозначим оставший ся элемент b (если x 6= y, иначе поло‐
жим b = x = y), тогда a 6 b и тем самым x и y сравнимы.
Факт 1.7.9. Множество натуральных чисел N относительно естественного порядка является
вполне упорядоченным.

Строго говоря, в рамках аксиоматики теории множество по Цермело—Френкелю указанный факт входит в опре‐
деление множества натуральных чисел. А именно, постулируется существование вполне упорядоченного множе‐
ства, которое не является конечным (не изоморфно себе с инвертированным порядком) и которое можно инъек‐
тивно отобразить в любое бесконечное [вполне упорядоченное].

Следствие 1.7.10 (Принцип математической индукции).


Пусть P (n) — некоторое высказывание о натуральном числе n. Предположим, что такие
утверждения обладают двумя свой ствами:
1. P (1) истинно (база индукции);
2. Для любого n ∈ N из истинности P (n) следует истинность P (n + 1) (индукционный
переход).
Тогда P (n) истинно для любого n ∈ N.
Доказательство. Обозначим X = {n ∈ N | P (n) ложно}. Если это множество непусто, то у
него существует наименьший элемент n0 . Если n0 = 1, то P (1) ложно, что противоречит базе
индукции. Значит, n0 > 1. Так как все натуральные числа, меньшие n0 , в том числе n0 − 1,
не принадлежат X, получаем, что P (n0 − 1) истинно, а тогда по индукционному переходу
истинно и P (n0 ), а тогда n0 ∈
/ X, противоречие. Значит, на самом деле множество X пусток,
откуда получаем, что P (n) истинно для всех натуральных n.
На самом деле P (n) не обязательно воспринимать как утверждение о свой ствах натураль‐
ного числа n или как формулу, зависящую от n, — это могут быть просто какие‐то суждения,
занумерованные натуральными числами.
Существуют многочисленные вариации на тему принципа математической индукции, мы
отметим следующие два (доказательство их абсолютно аналогично приведенному выше).
Предложение 1.7.11 (Принцип сильной математической индукции).
Если для P (n) выполнены следующие два свой ства:
1. P (1) истинно;
2. Истинность P (i) для всех i 6 n влечет истинность P (n + 1);
то P (n) истинно для всех n ∈ N.
Предложение 1.7.12 (Принцип математической индукцией с базой длины k).
Если для P (n) выполнены следующие два свой ства:
1. P (1), P (2), . . . , P (k) истинны;

16
2. Истинность P (n − i) для всех 0 6 i < k влечет истинность P (n + 1);

то P (n) истинно для всех n ∈ N.


Принцип сильной математической индукции назван так не потому, что он позволяет до‐
казывать какие‐то более сильные и сложные теоремы, а потому что в индукционном перехо‐
де используется более сильная гипотеза. По своей доказательной силе все три изложенных
выше способа равны.
Замечание 1.7.13. Доказательство при помощи одного из методов индукции из трех выше
можно превратить в доказательство при помощи любого другого.
Доказательство. Понятно, что доказательство при помощи обычного принципа математи‐
ческой индукции (ПМИ), можно рассматривать как доказательство при помощи принципа
сильной математической индукции (ПСМИ), а именно, усиление индукционного предполо‐
жения не ослабляет индукционного перехода (используются не все условия). Обратно, дока‐
зательство P (n) при помощи ПСМИ можно рассматривать как доказательство посредством
ПМИ, но примененное к другому утверждению P ′ (n), а именно, P ′ (n) = P (1)&(2)& . . . &P (n).
Точно так же, доказательство P (n) при помощи принципа математической индукции с ба‐
зой длины k можно рассматривать как доказательство P ′′ (n) с использованием ПМИ, где
P ′′ (n) = P (n)&P (n − 1)& . . . &P (n − k + 1).
В качестве иллюстрации использования метода математической индукции докажем сле‐
дующее полезное утверждение.
Теорема 1.7.14 (Принцип Дирихле). Если |A| = |B| < ∞, то для f : A → B инъективность
эквивалентна сюръективности (и, тем самым, биективности).

Доказательство. Индукция по |A| = |B|. База тривиальна.


Пусть f инъективна. Тогда определена функция g : A \ {a} → B \ {f (a)}, дей ствующая
по правилу g(x) = f (x). Дей ствительно, по инъективности f нет таких x ∈ A \ {a}, что
f (x) = f (a). По индукционному предположению g биективна, а тогда биективна и f .
Если же f сюръективна, то она обратима справа, и ее правая обратная h : B → A, в свою
очередь, обратима слева, то есть инъективна и по уже доказанному является биекцией . А
тогда биективна и f .

17
2 Алгебраические структуры и элементарная теория чисел
2.1 Бинарные операции
Определение 2.1.1. Бинарной операцией на множестве A называется функция φ : A×A → A.
Обозначение 2.1.2. Бинарные операции часто записывают при помощи инфиксной записи,
то есть символ операции вставляется между аргументами, например, φ(x, y) = x ∗ y;
Примеры 2.1.3.
1. x + y на множестве N, Z, Q, R;
2. x · y на N, Z, R, R>0 , R \ {0};
3. x − y на R;
4. φ(x, y) = xy на R>0 ;
5. φ(x, y) = max(x, y) на R;
6. φ(x, y) = x;
7. f ◦ g на AA ;
8. Векторное произведение в трехмерном пространстве;
9. X ∪ Y , X ∩ Y , X \ Y и X 4 Y на 2A ;

Кроме функциональной и инфиксной записи распространены также префиксная и постфиксная запись. Пре‐
фиксная запись иногда именуется «польской нотацией », особенно если пишется без скобок и запятых — в ней вы‐
ражение (1 + 2) · (3 + 4) запишется как ∗ + 1 2 + 3 4 (если известна арность операций , то скобки не требуются).
Аналогичная форма постфиксной записи называется «обратной польской » и используется в стековых машинах (и,
например, в языке описания страниц Postscript). В математике постфиксная запись используется в основном для
унарных операций , таких, как дифференцирование: f ′ . Вообще говоря, бинарные операции записываются самыми
разными способами, например, xy , xy
, [x, y] для векторного произведения или, более общно, коммутатора, x + y
mod m для сложения по модулю m.

Определение 2.1.4. Если φ — бинарная операция на A, B ⊆ A, и φ(B × B) ⊆ B, то огра‐


ничением φ на B называется бинарная операция ψ : B × B → B, дей ствующая по правилу
ψ(x, y) = φ(x, y).
Определение 2.1.5. Операция ∗ на множестве A называется ассоциативной, если для любых
x, y, z ∈ A выполнено (x ∗ y) ∗ z = x ∗ (y ∗ z).
Среди примеров выше ассоциативными являются примеры 1, 2, 5, 6, 7, а также все опера‐
ции в примере 9, кроме разности множеств.
Теорема 2.1.6 (Обобщенная ассоциативность). Если операция ∗ ассоциативна, то результат
вычисления выражения x1 ∗ x2 ∗ . . . ∗ xn не зависит от расстановки скобок.
Доказательство. Индукция по n. База n = 3 является определением ассоциативности. Пред‐
положим, что n > 3 и утверждение теоремы уже доказано для всех меньших натуральных
чисел (то есть для всех более коротких произведений ). Покажем, что тогда результат вычис‐
ления при любой расстановке скобок совпадает с результатом при так называемой «лево‐
нормированной » расстановке:

(. . . ((x2 ∗ x2 ) ∗ x3 ) ∗ . . . ∗ xn ).

18
Рассмотрим произвольную расстановку скобок — в ней последнее выполняемое дей ствие
состоит в перемножении произведений (каждое с какой ‐то расстановкой скобок)

(x1 ∗ . . . ∗ xk ) ∗ (xk+1 ∗ . . . ∗ xn ).

Если k = n − 1, то можно применить индукционное предположение к произведению x1 ∗ . . . ∗


xn−1 , выбрав в нем лево‐нормированную расстановку скобок — тогда приписывание справа
xn дает лево‐нормированную расстановку скобок на x1 ∗ . . . ∗ xn .
Если же k < n − 1, то заметим, что во втором множителе (то есть в xk+1 ∗ . . . ∗ xn ) по
край ней мере 2 элемента, но меньше, чем n. По индукционному предположению мы можем
расставить в нем скобки лево‐нормированным способом:

(x1 ∗ . . . ∗ xk ) ∗ (xk+1 ∗ . . . ∗ xn−1 ) ∗ xn
| {z } | {z }
X Y

Применим ассоциативность к произведению X ∗ (Y ∗ xn ) = (X ∗ Y ) ∗ xn , тогда наше произ‐


ведение перепишется в виде

x ∗ . . . ∗ xk ∗ xk+1 ∗ . . . ∗ xn−1 ∗ xn ,
| 1 {z } | {z }
X Y

что сводит задачу к уже разобранному случаю k = n − 1.


Определение 2.1.7. Операция ∗ на множестве A называется коммутативной, если для лю‐
бых x, y ∈ A выполнено x ∗ y = y ∗ x.
Если операция некоммутативна, то естественное понятие, обобщающее 0 относительно
сложения и 1 относительно умножения, разделяется на два.
Определение 2.1.8. Элемент e ∈ A называется

• левым нейтральным, если для любого a ∈ A выполнено e ∗ a = a;


• правым нейтральным, если для любого a ∈ A выполнено a ∗ e = a;
• нейтральным, если он одновременно левый и правый ней тральный .
Замечание 2.1.9. Если e — левый ней тральный , а f — правый , то они равны. В частности,
тогда левый и правый ней тральный являются двусторонне ней тральным элементом и един‐
ственны.
Доказательство. f = e ∗ f = e.
Примеры 2.1.10.

• 0 является ней тральным относительно +;


• 1 является ней тральным относительно ·;
• 0 является единственным правым ней тральным относительно −, а левых ней траль‐
ных нет;

• 1 является единственным правым ней тральным относительно возведения в степень,


а левых ней тральных нет;

19
• относительно взятия максимума ней трального элемента нет (но если ограничить эту
операцию на [a, b], то a будет для нее ней тральным);
• для операции φ(x, y) = x любой элемент является правым ней тральным, а левый ней ‐
тральный существует только если операция задана на одноэлементном множестве;
• id является ней тральным относительно композиции;

• для теоретико‐множественных операций , заданных на 2A :


– ∅ является ней тральным относительно ∪;
– A является ней тральным относительно ∩;
– ∅ является ней тральным для 4;
– ∅ является единственным правым обратным относительно \, а левых ней траль‐
ных нет.
Определение 2.1.11. Пусть x, y ∈ A таковы, что x ∗ y = e, гду e — ней тральный элемент от‐
носительно ∗. Тогда x называется левым обратным для y, а y называется правым обратным
для x. Элемент z называется обратным к w, если он одновременно левый и правый обрат‐
ный для w, то есть z ∗ w = w ∗ z = e.

Замечание 2.1.12. Пусть операция ∗ ассоциативна. Если у элемента x одновременно суще‐


ствуют левый и правый обратные, то они совпадают. В частности, тогда левый и правый
обратные являются обратным элементом и единственны.
Доказательство. Дословно как для композиции.

Выясним теперь, когда бинарная операция задает естественным образом бинарную опе‐
рацию на фактор‐множестве. А именно, пусть ∼ это отношение эквивалентности на множе‐
стве A и ∗ — бинарная операция на A, тогда естественно определить.

[a]∼ ∗ [b]∼ = [a ∗ b]∼

Такая операция называется индуцированной операцией ∗.


Чтобы это определение было корректным, необходимо, чтобы результат не зависел от вы‐
бора представителей a и b соответствующих классов эквивалентности, то есть чтобы было
выполнено следующее условие:

если [a] = [a′ ] и [b] = [b′ ], то [a ∗ b] = [a′ ∗ b′ ],

или, что то же самое, a ∼ a′ и b ∼ b′ вместе влекут a ∗ b ∼ a′ ∗ b′ . Такие отношения эквива‐


лентности называются отношениями конгруэнтности для ∗.
Пример 2.1.13. Пусть m ∈ Z. Тогда отношение ∼ на Z, задаваемое правилом

a∼b ⇐⇒ a − b = km для некоторого k ∈ Z,

является конгруэнтностью для сложения и умножения целых чисел. Дей ствительно, если
a ∼ a′ и b ∼ b′ , то для каких‐то k, l ∈ Z имеем a′ = a + km и b′ = b + lm, тогда

a′ + b′ = (a + b) + (k + l)m ⇒ a′ + b′ ∼ a + b,
a′ b′ = ab + (kb + la + klm)m ⇒ a′ b′ ∼ ab.

20
2.2 Группы и кольца
Определение 2.2.1. Пусть G — множество, а ∗ — бинарная операция на G. Пара (G, ∗) назы‐
вается (абстрактной) группой, если выполнены следующие три условия:
• операция ∗ ассоциативна;
• существует элемент e ∈ G, ней тральный относительно ∗;
• у каждого элемента a ∈ G существует обратный элемент b ∈ G.
Допуская вольность речи, мы будем говорить, что G является группой относительно ∗. Эле‐
мент, обратный к a ∈ G, будем обозначать a−1 .
Примеры 2.2.2.
1. (R, +), (Q, +), (Z, +) — но не (N, +);
2. (R>0 , ·), (R \ {0}, ·) — но не (R, ·) и не (Z \ {0}, ·);
3. множество всех биекций A → A относительно композиции (если A 6= ∅), а также все‐
возможные множества биекций , сохраняющих какую‐то структуру (так как компози‐
ция таких преобразований это снова биекция, сохраняющая структуру, тождественное
и обратное к данному преобразования тоже ее сохраняют), например:
• все повороты вокруг начала координат;
• все параллельные переносы;
• все движения;
• все симметрии фиксированной геометрической фигуры;
• все автоморфизмы графа, то есть биекции на множестве вершин, переводящие со‐
единенные ребром в соединенные ребром;
• все строго монотонно возрастающие функции [0, 1] → [0, 1];
• все строго монотонные функции [0, 1] → [0, 1] (как возрастающие, так и убываю‐
щие);
• все биекции, переводящие эквивалентные элементы в эквивалентные (относи‐
тельно некоторого фиксированного отношения эквивалентности);
4. (2A , 4) — здесь ней тральным элементом выступает ∅, а обратный X −1 = A \ X;
5. для двух групп (G, ∗) и (H, ⋆) множество G × H относительно операции (a, x) • (b, y) =
(a ∗ b, x ⋆ y) — ней тральным элементом является пара (eG , eH ), а обратный к (a, x) вы‐
числяется как (a−1 , x−1 );
6. для группы (G, ∗) и множества A множество GA относительно поточечного примене‐
ния ∗, то есть для f, g : A → G полагаем (f ⋆ g)(a) = f (a) ∗ g(a).
Определение 2.2.3. Группа (G, ∗) называется коммутативной, или абелевой, если операция
∗ коммутативна.
Определение 2.2.4. Пусть R — множество, а + и · две бинарные операции на R. Тогда трой ка
(R, +, ·) называется кольцом (или, более точно, ассоциативным кольцом с 1), если
• (G, +) — абелева группа;

21
• операция · ассоциативна;
• существует элемент 1 ∈ R, ней тральный относительно ·;
• операция · дистрибутивна относительно +, то есть для любых x, y, z ∈ R выполнено

(x + y) · z = (x · z) + (y · z) и x · (y + z) = (x · y) + (x · z).

Обычно операции + и · называют сложением и умножением, как и подсказывают обозна‐


чения.
Примеры 2.2.5.
1. Z, Q, R относительно обычных сложения и умножения;
2. если A — множество, то RA относительно поточечных сложения и умножения, а также
различные подмножества, в частности
• Rn (полагая A = {1, . . . , n});
• многочлены {a0 + a1 x + a2 x2 + . . . + an xn | n ∈ N, a1 , . . . , an ∈ R};
• непрерывные/дифференцируемые/k‐дифференцируемые/бесконечно дифферен‐
циремые/аналитические функции R → R;
Pn
• тригонометрические многочлены {a0 + k=1 ak cos(kx) + bk sin(kx) | ai , bi ∈ R}
— здесь нетривиально проверить замкнутость относительно умножения (посред‐
ством тригонометрических формул для произведения тригонометрических функ‐
ций );
3. пример нечисловой природы: (2A , 4, ∩) — ней тральным отноcительно ∩ является A, а
дистрибутивность проверяется непосредственно;
4. если m ∈ Z, а ∼ отношение эквивалентности, задаваемое как x ∼ y ⇔ x−y делится на m,
то фактор‐множество Z/∼ относительно операций , индуцированных сложением и умно‐
жением целых чисел, тоже является кольцом (это кольцо мы еще будем очень подроб‐
но изучать в дальней шем);
P∞
5. формальные степенные ряды { k=0 ak xk | ak ∈ R} с умножением
X
∞  X
∞  X∞ X
ak xk ∗ bk x k = ck x k , где ck = ai bj
k=0 k=0 k=0 i,j>0
i+j=k

(при попытке наивно «раскрыть скобки» в левой части получается бесконечная сумма,
но при каждом xk в качестве коэффициента в итоге получается конечная сумма ck ).
Определение 2.2.6. Кольцо называется коммутативным, если операция умножения ком‐
мутативна.
Все примеры выше являются коммутативными, но в дальней шем мы увидим важные при‐
меры некоммутативных колец.
Обозначение 2.2.7. Элемент, обратный к a ∈ R относительно +, будем обозначать −a, а
обратный относительно ∗, если он существует, a−1 .
Обозначение 2.2.8. Множество обратимых элементов кольца R будем обозначать R∗ .

22
Замечание 2.2.9. Если a, b ∈ R∗ , то ab ∈ R∗ и (ab)−1 = b−1 a−1 .
Доказательство. Прямая проверка:

(ab)(b−1 a−1 ) = a(bb−1 ) a−1 = (a · 1)a−1 = aa−1 = 1 и b−1 a−1 ab = b−1 b = 1.

Следствие 2.2.10. (R∗ , ·) является группой (она называется мультипликативной группой


кольца R).
/ R∗ .
Замечание 2.2.11. 0 ∈
/ R∗ .
Доказательство. Для любого x ∈ R имеем 0 · x = 0 6= 1, так что 0 ∈

2.3 Делимость в коммутативном кольце


Определение 2.3.1. Пусть R — коммутативное кольцо, a, b ∈ R. Если существует такой
.
r ∈ R, что a = br, то говорят, что a делится на b (обозначается a .. b) или что b делит a
(обозначение: b | a).
Предложение 2.3.2. Для любых a, b, c, d ∈ R выполнено:
.
1. a .. a (рефлексивность);
.
2. если a обратим, то b .. a;
. . .
3. если a .. b и b .. c, то a .. c (транзитивность);
. . .
4. если a .. c и b .. c, то a + b .. c;
. . .
5. если a .. b и c .. d, то ac .. bd;
Доказательство.
1. a = a · 1;
2. b = a · (a−1 b);
3. если a = br и b = cs, то a = (cs)r = c(sr);
4. если a = cr и b = cs, то a + b = c(r + s);
5. если a = br и c = ds, то ac = brds = (bd)(rs).
. .
Следствие 2.3.3. Если ε ∈ R обратим, то a .. b влечет a .. (εb).
Определение 2.3.4. Если a, b ∈ R, a, b 6= 0, таковы, что ab = 0, то a и b называются делите‐
лями нуля. Кольцо называется областью целостности, если в нем нет делителей нуля.
Не все примеры колец выше являются областями целостности. Например, в (2A , 4, ∩) лег‐
ко предъявить два непустых множества, имеющих пустое пересечение. Аналогично, легко
предъявить две ненулевых функции, имеющих нулевое поточечное произведение (множе‐
ства точек, где их значения не равны нулю, не должны пересекаться).
/ R∗ .
Замечание 2.3.5. Если a — делитель нуля, то a ∈
Доказательство. Пусть a, b 6= 0 таковы, что ab = 0. Предположим, что a обратим, так что
най дется такой u ∈ R, что ua = 1. Тогда b = 1·b = (ua)b = u(ab) = u·0 = 0, противоречие.

23
.
Предложение 2.3.6. Пусть R — область целостности, a, b, c ∈ R и c 6= 0. Тогда ac .. bc равно‐
..
сильно a . b.
. . .
Доказательство. Если a .. b, то, поскольку c .. c, получаем, что ac .. bc. Обратно, пусть ac = (bc)r,
.
тогда (a − br)c = 0, откуда по условию теоремы a − br = 0, то есть a = br и a .. b.
.
Отношение .. является рефлексивным и транзитивным, но, вообще говоря, не антисиммет‐
рично. Установим, насколько оно далеко от антисимметричного.
. .
Определение 2.3.7. Пусть R — область целостности, a, b, ∈ R. Если a .. b и b .. a, то будем
говорить, что a и b ассоциированы.
Замечание 2.3.8. Элементы a, b ∈ R ассоциированы тогда и только тогда, когда существует
такой ε ∈ R∗ , что a = εb.

Доказательство. Если a = br и b = as, то a = a(rs). Тогда a(1 − rs) = 0, откуда a = 0 или


1 = rs. Во втором случае r обратим и можно взять ε = r. В первом случае b = as = 0 и можно
положить ε = 1 (или любой другой обратимый элемент).
Обратно, если a = εb, то b = ε−1 a.
Определение 2.3.9. Пусть a, b ∈ R. Элемент d ∈ R называется наибольшим общим делите‐
лем a и b, если
. .
• a .. d и b .. d;
. . .
• для любого d′ ∈ R если a .. d′ и b .. d′ , то d .. d′ .
Замечание 2.3.10. Наибольший общий делитель определен с точностью до ассоциирован‐
ности, то есть
• если d — наибольший общий делитель a и b, то то же верно для εd для любого ε ∈ R∗ ;
• если d и d′ — два наибольших общих делителя a и b, то они ассоциированы.

2.4 Делимость целых чисел


Сосредоточимся теперь на свой ствах кольца целых чисел Z. Кроме арифметических опера‐
ций на Z имеется дополнительная структура — порядок, хорошо согласованный с арифмети‐
ческими операциями. Вообще говоря, эта согласованность относится ко всем вещественным
числам (свой ства вроде «сумма и произведение положительных чисел положительны»), но
для кольца вещественных чисел понятие делимости тривиально (так как все ненулевые эле‐
менты обратимы). Для целых чисел делимость весьма нетривиальна и тесно связана с по‐
рядком.
Теорема 2.4.1 (о делении с остатком). Пусть a, b ∈ Z, b 6= 0. Тогда существуют такие одно‐
значно определенные q, r ∈ Z, называемые неполным частным и остатком, что

a = bq + r, 0 6 r < |b|.

Доказательство. Рассмотрим сначала случай , когда a, b > 0. Доказательство проведем ин‐


дукцией по a.
В качестве базы будем использовать случай a < b — тогда a = b · 0 + a. Индукционный
переход: пусть a > b, рассмотрим a′ = a − b. По‐прежнему a′ > 0, но a′ < a, так что можно

24
применить индукционное предположение: существуют такие q ′ , r′ , что a′ = bq ′ + r′ и 0 6
r′ < b. Но тогда a = a′ + b = b(q ′ + 1) + r — искомое представление.
Пусть теперь a < 0, b > 0. Тогда −a > 0 и в силу уже доказанного существуют такие q ′ , r′ ,
что −a = bq ′ + r′ и 0 6 r′ < b. Тогда a = −bq ′ − r′ . Если r′ = 0, то q = −q ′ , r = 0. Если же r′ 6= 0,
то a = b(−q ′ ) − b + b − r′ = b(−q ′ − 1) + (b − r′ ). Положим q = q ′ − 1, r = b − r′ — тогда 1 6 r < b
и a = bq + r.
Остается случай b < 0. Тогда −b > 0 и существуют такие q ′ , r′ , что a = (−b)q ′ + r′ и 0 6 r′ <
−b. Отсюда a = b(−q ′ ) + r′ , причем 0 6 r′ < |b|.
Докажем теперь единственность q и r. Пусть a = bq + r = bq ′ + r′ , где 0 6 r, r′ < |b|. Тогда
b(q − q ′ ) = (r − r′ ). Если q 6= q ′ , то левая часть по модулю > |b|, в то время как правая < |b|.
Значит, q = q ′ , откуда также r = r′ .

Вопрос существования неполного частного и остатка можно решить прямым обращением к полной упорядочен‐
ности N. А именно, рассмотрим множество {a − bq | q ∈ Z} ∩ Z>0 — оно непусто и потому содержит наименьший
элемент r. Если r > |b|, то r − |b| снова является элементом того же множества, но меньше r, противоречие.

Замечание 2.4.2. Для целых чисел наибольший общий делитель определен с точностью до
знака. Поэтому можно выбрать из двух вариантов один и в дальней шем всегда считать, что
наибольший общий делитель двух целых чисел a и b неотрицательный — мы будем обозна‐
чать его gcd(a, b).
Теорема 2.4.3. Для любых ненулевых a, b ∈ Z их наибольший общий делитель существует
и является наименьшим элементом множества Xa,b = {ax + by | x, y ∈ Z} ∩ N всех положи‐
тельных целочисленных линей ных комбинаций a, b.

Доказательство. Множество Xa,b непусто, так как по край ней мере содержит |a|. Обозначим
наименьший элемент множества Xa,b через d. Тогда для каких‐то целых x0 , y0 имеем d =
ax0 + by0 . Поделим a на d с остатком: a = dq + r, где 0 6 r < d, откуда a = (ax0 + by0 )q + r,
то есть r = a(1 − x0 1) + b(−y0 q). Если r 6= 0, то r ∈ Xa,b является элементом, меньшим
. .
наименьшего, что невозможно. Значит, r = 0 и a = dq, так что a .. d. Аналогично, b .. d.

Пусть теперь d — какой ‐то общий делитель a и b. Тогда он является делителем любого
элемента множества X, в частности, d, так что d дей ствительно является наибольшим общим
делителем a и b.
Замечание 2.4.4. gcd(a, 0) = gcd(0, a) = a.
Следствие 2.4.5. Для любых a, b ∈ Z существуют такие x0 , y0 ∈ Z, что ax0 + by0 = gcd(a, b).
Такое выражение называется линейным представлением НОД.
Лемма 2.4.6. Пусть a, b, k ∈ R. Тогда gcd(a, b) = gcd(a, b + ak). В частности, при замене b на
остаток от деления b на a НОД не меняется.
Доказательство. Докажем, что Xa,b = Xa,b+ak . Дей ствительно,

ax + by = a(x − ky) + (b + ak)y ⇒ Xa,b ⊆ Xa,b+ak ,


ax + (b + ak)y = a(x + ky) + by ⇒ Xa,b+ak ⊆ Xa,b .

Изложенное выше подсказывает пусть к вычислению наибольшего общего делителя: за‐


менять пару чисел a, b на пару меньших чисел, имеющих тот же НОД, пока не придем к паре
чисел, одно из которых делится на другое.
Алгоритм 2.4.7 (Алгоритм Эвклида).

25
1. Полагаем r0 = a, r1 = b;
2. Делим с остатком: r0 = r1 q1 + r2 , где 0 6 r2 < |r1 |;
3. Повторяем: ri−1 = ri qi + ri+1 ;
4. Если rk+1 = 0, то rk = gcd(a, b).
Этот процесс вычисляет gcd(a, b), но не дает его линей ного продставления. Конечно, мож‐
но подняться по цепочке делений с остатком и выразить каждый ri+1 в виде линей ной ком‐
бинации ri и ri−1 , в итоге получив выражение в виде линей ной комбинации a и b, но это
требует хранить в памяти все остатки и все неполные частные. Оказывается, есть модифика‐
ция алгоритма Эвклида, которая позволяет с минимальными дополнительными усилиями
получить одновременно НОД и его линей ное представление.
Алгоритм 2.4.8 (Расширенный алгоритм Эвклида).
1. Положим r0 = a, r1 = b, s0 = 1, s1 = 0, t0 = 0, t1 = 1;
2. Вычисляем

ri+1 = ri−1 − qi ri , где 0 6 ri+1 < |ri |,


si+1 = si−1 − qi si ,
ti+1 = ti−1 − qi ti ;

3. Если rk+1 = 0, то gcd(a, b) = rk = ask + btk .


Предложение 2.4.9. Расширенный алгоритм Эвклида корректно вычисляет линей ное пред‐
ставление НОД.
Доказательство. Достаточно доказать, что для любого i выполнено равенство ri = asi +bti .
Доказательство будем вести индукцией по i (с базой длины 2).
База индукции: случаи i = 0, 1. Для i = 0 доказываемое равенство означает просто, что
r0 = a = a · 1 + b · 0 = as0 + bt0 , а для i = 1 это r1 = b = a · 0 + b · 1 = as1 + bt1 .
Индукционный переход: пусть равенство уже доказано для i и i − 1. Рассмотрим

ri+1 = ri−1 − ri qi
= (asi−1 + bti−1 ) − (asi + bti )qi
= (asi−1 − asi qi ) + (bti−1 − bti qi )
= asi+1 + bti+1 .

Определение 2.4.10. Элемент d ∈ R называется наибольшим общим делителем a1 , . . . , an ∈


R, если
. .
1. a1 .. d, . . . , an .. d;
. . .
2. для любого такого d′ , что a1 .. d′ , . . . , an .. d′ выполнено d .. d′ .
Для набора целых чисел НОД существует и определен однозначно с точностью до знака.
Положительное значение будем обозначать gcd(a1 , . . . , an ).
Предложение 2.4.11.
.
1. gcd(a, b) = |a| тогда и только тогда, когда b .. a.

26
2. gcd(gcd(a, b), c) = gcd(a, gcd(b, c)) = gcd(a, b, c).
3. gcd(ab, ac) = a · gcd(b, c).
. .
Доказательство. 1. Если gcd(a, b) = |a|, то b .. a. Обратно, если b .. a, то a должен делить
..
d = gcd(a, b). При этом a . d, так что a и d ассоциированы, так что d = |a|.
2. Пусть d1 = gcd(gcd(a, b), c) и d2 = gcd(a, gcd(b, c)). Тогда
. . . .
gcd(a, b) .. d1 , c .. d1 , a .. d2 , gcd(b, c) .. d2 ,
. . .
откуда a, b, c .. d1 , d2 , так что gcd(a, b) .. d2 и gcd(b, c) .. d1 . Но по определению НОД для лю‐
. .
бого такого d′ , что gcd(a, b), c .. d′ , выполнено d1 .. d′ , в частности, это верно для d′ = d2 .
. .
Аналогично, для любого такого d′′ , что a gcd(b, c) .. d′′ выполнено d2 .. d′′ , в частности,
. .
для d′′ = d1 . Итого получаем, что d1 .. d2 и d2 .. d1 , а так как они одного знака, то совпа‐
дают.
3. Если a = 0, то в обеих частях равенства стоит 0. Пусть a 6= 0. Обозначим d = gcd(b, c).
. . . .
Тогда b, c .. d, откуда ab, ac .. ad, то есть gcd(ab, ac) .. ad. С другой стороны, ab, ac .. a, так что
.. ..
gcd(ab, ac) . a, то есть gcd(ab, ac) = ak для некоторого k, и ab, ac . ak. Поскольку a 6= 0,
. . . .
получаем, что b, c .. k, откуда gcd(b, c) .. k и a · gcd(b, c) .. ak. Итого a · gcd(b, c) .. gcd(ab, ac)
..
и gcd(ab, ac) . a · gcd(b, c), так что они равны.
Предложение выше позволяет вычислить НОД любого конечного набора чисел:

gcd(a1 , a2 , . . . , an ) = gcd(gcd(a1 , a2 ), a3 , . . . , an ),

но эта процедура может оказаться неэффективной (она может сработать очень быстро, ес‐
ли, скажем, gcd(a1 , a2 ) = 1 или gcd(a1 , a2 ) = gcd(a1 , . . . , an ), но не в общем случае). Имеется
модификация алгоритма Эвклида, в которой вместо шага (a, b) (b, r) производятся следу‐
ющие дей ствия:
Алгоритм 2.4.12 (Алгоритм Эвклида для n чисел).
1. Рассмотрим кортеж (a1 , . . . , an ) и най дем его наименьший (по модулю) ненулевой эле‐
мент ak .
2. Поделим все остальные элементы на ak с остатком: ai = ak qi + ri , 0 6 ri < |ak |.
3. Заменим (a1 , . . . , an ) на (r1 , . . . , rk−1 , ak , rk+1 , . . . , rn ).
4. Будем повторять, пока в кортеже сохраняется хотя бы один ненулевой элемент. По‐
следнее ненулевое значение и будет равно gcd(a1 , . . . , an ).
При этом наименьший элемент набора на следующем шаге можно находить уже в процессе
вычисления остатков.

2.5 Взаимная простота


Определение 2.5.1. Целые числа a и b называются взаимно простыми, если у них нет нетри‐
виальных общих делителей (то есть отличных от 1 и −1). Иными словами, если gcd(a, b) = 1.
Обозначение 2.5.2. Отношение взаимной простоты будем обозначать символом a ⊥ b.
Предложение 2.5.3. Пусть a, b, c ∈ Z.

27
1. a ⊥ b тогда и только тогда, когда существуют такие x, y ∈ Z, что ax + bt = 1.
2. Если a ⊥ b и a ⊥ c, то a ⊥ bc.
. .
3. Если ab .. c и a ⊥ c, то b .. c.
. . .
4. Если a .. b, a .. c и b ⊥ c, то a .. bc.
Доказательство. 1. В силу Теоремы 2.4.3.
2. По предыдущему пункту ax + by = 1 и az + cw = 1 для некоторых x, y, z, w ∈ Z. Тогда
перемножая эти два равенства, получаем a · (axz + cxw + byz) + bc · yw = 1.
3. Существуют такие x, y ∈ Z, что ax + cy = 1. Домножим на b, получим abx + bcy = b.
. . .
Поскольку ab .. c и bc .. c, то же верно и для суммы, то есть b .. c.
.
4. a = bk для некоторого k ∈ Z. При этом bk = a .. c, но b ⊥ c, так что по предыдущему
..
пункту k . c, то есть k = cm для какого‐то m ∈ Z. Тогда a = bk = b(cm) = (bc)m.
Следствие 2.5.4. Если a1 , . . . , am , b1 , . . . , bn ∈ Z таковы, что ai ⊥ bj для любых i = 1, . . . , m и
j = 1, . . . , n, то a1 · . . . · am ⊥ b1 · . . . · bn . В частности, если a ⊥ b, то am ⊥ bn .
Доказательство. По предыдущей теореме ai ⊥ b1 · . . . · bn , а тогда a1 · . . . · am ⊥ b1 · . . . · bn .
Следствие 2.5.5. Если a ∈ N неявляется n‐й степенью натурального числа, то a не является
n‐й степенью рационального числа. Иными словами, нецелые корни из натуральных чисел
являются иррациональными.
Доказательство. Пусть x/y ∈ Q. Можно считать, что x ⊥ y и что y > 1. Тогда (x/y)n = xn/y n

не является целым числом (так как xn не делится на y n ).

2.6 Линейные диофантовы уравнения


Пусть a, b, c ∈ Z. Рассмотрим линей ное уравнение ax + by = c от двух переменных x, y. Очень
полезно выяснить, какие у этого уравнения целочисленные решения.
Если a = b = 0, то решений либо нет (если c 6= 0), либо все целые числа являтся реше‐
ниями (если c = 0). В дальней шем будем полагать, что хотя бы один из коэффициентов при
переменных не равен 0.
Предложение 2.6.1. Целочисленные решения уравнения ax + by = c существуют тогда и
.
только тогда, когда c .. gcd(a, b). Все решения имеют вид x = x0 + b′ k, y = y0 − a′ k для k ∈ Z,
где x0 , y0 — какое‐то одно решение, a′ = a/ gcd(a, b), b′ = b/ gcd(a, b), и для каждого k такие
x, y являются решением.
. .
Доказательство. Если x, y — какое‐то решение, то ax + by .. gcd(a, b), так что c .. gcd(a, b).
.. ′
Обратно, если c . gcd(a, b), то c = c · gcd(a, b). Линей ное представление НОД гарантирует
существование таких x, y ∈ Z, то ax + by = gcd(a, b), а тогда a(c′ x) + b(c′ y) = c′ · gcd(a, b) = c.
.
Пусть теперь c .. gcd(a, b). Поделив обе части уравнения на gcd(a, b) (что не изменяет мно‐
жества решений ), можем считать, что требуется решить уравнение ax + by = c, где a ⊥ b.
Пусть x0 , y0 — фиксированное решение, а x, y — какое‐то другое решение. Вычитая ax0 +
by0 = c из ax + by = c, получаем, что a(x − x0 ) + b(y − y0 ) = 0, или a(x − x0 ) = b(y0 − y). Так
. .
как a(x − x0 ) .. b и a ⊥ b, получаем, что x − x0 .. b. Значит, x − x0 = bk, откуда abk = b(y0 − y) и
y − y0 = ak. Итого x = x0 + bk, y = y0 − ak. Проверка того, что всякая пара (x0 + bt, y0 − at)
дает решение, осуществляется прямой подстановкой .

28
Замечание 2.6.2. Если b = 0, то уравнение ax+by = c разрешимо тогда и только тогда, когда
.
c .. a. Решениями в таком случае являются x = c/a вместе с произвольным y.
Предложение 2.6.3. Линей ное диофантово уравнение a1 x1 + . . . + an xn = b от n целочис‐
.
ленных переменных x1 , . . . , xn разрешимо тогда и только тогда, когда b .. gcd(a1 , . . . , an ).
Доказательство. Если решение существует, то левая часть делится на d = gcd(a1 , . . . , an ), а
. .
тогда и b .. d. Докажем обратное. Пусть b .. d. Доказывать будем индукцией по n.
База n = 2 выполнена по предыдущему утверждению.
Пусть n > 3. Рассмотрим уравнение gcd(a1 , a2 )y1 +a3 y3 +. . .+an yn = b от n−1 переменной
y1 , y3 , . . . , yn . По индукционному предположению оно разрешимо тогда и только тогда, когда
.
b делится на gcd(gcd(a1 , a2 ), a3 , . . . , an ) = gcd(a1 , . . . , an ) = d. По условию b .. d, так что реше‐
ние (y1 , y3 , . . . , yn ) существует. Рассмотрим еще одно уравнение a1 x1 + a2 x2 = gcd(a1 , a2 )y1
.
относительно переменных x1 , x2 . Так как gcd(a1 , a2 )y1 .. gcd(a1 , a2 ), оно разрешимо, так что
a1 x1 + a2 x2 + a3 y3 + . . . + an xn = gcd(a1 , a2 )y1 + a3 y3 + . . . + an yn = b.

2.7 Простые числа и основная теорема арифметики


Определение 2.7.1. Натуральное число называется простым, если оно имеет ровно два на‐
туральных делителя.
. .
Так как для любого n ∈ N выполнено n .. 1 и n .. n, то можно сказать, что простое число
в качестве натуральных делителей имеет только себя и 1. С другой стороны, у 1 нет других
натуральных делителей , кроме 1. Поэтому альтернативно можно определить простое число
следующим образом: натуральное число p простое, если p 6= 1 и у p нет натуральных дели‐
телей , отлинxых от 1 и p.
Предложение 2.7.2. Пусть p — простое число.
1. Если n ∈ N и p - n, то p ⊥ n.

2. Различные простые числа взаимно просты.


. . .
3. Если m, n ∈ Z и mn .. p, то m .. p или n .. p.
. .
4. Если n1 · . . . · nk .. p, то ni .. p для какого‐то i.
5. Если n ∈ Z таково, что |n| > 1, то n делится хотя бы на одно простое.

6. Простых чисел бесконечно много.


. .
Доказательство. 1. Пусть d = gcd(p, n). Раз p .. d, то d = p или d = 1. В первом случае n .. p,
а во втором p ⊥ n.
. .
2. Если p1 и p2 не взаимно просты, то p1 .. p2 и p2 .. p1 , а тогда p1 = p2 .

3. Можно считать что m, n ∈ N. Предположим, что p - m и p - n, тогда по предыдущему


пункту p ⊥ m и p ⊥ n, а тогда по Предложению 2.5.3(2) p ⊥ mn.
4. Индукция по числу множителей k. База k = 2 это предыдущий пункт. Переход: обозна‐
чим m = n1 · . . . · nk−1 и рассмотрим m · nk — это произведение делится на p, так что
. .
nk .. p или m .. p, и во втором случае можно применить индукционное предположение.

29
5. Достаточно доказать для натуральных n. Проведем полную индукцию по n. Если n про‐
.
стое, то n .. n и все доказано. Иначе у n имеется натуральный делитель m, меньший n.
По предположению индукции у m имеется простой делитель, который тогда является
и делителем n.
6. Если простых лишь конечное число, то можно составить список их всех: P = {p1 , . . . , pk }.
Рассмотрим число n = p1 ·. . .·pk +1. По предыдущему пункту у n есть простой делитель
— он обязан быть элементом P, скажем, pi . Но тогда 1 = n − p1 · . . . · pk тоже делится на
pi , противоречие. Значит, список всех простых не полон.
Теорема 2.7.3 (Основная теорема арифметики). Каждое натуральное число n может быть
представлено в виде произведения простых чисел, причем такое представление единствен‐
но с точностью до порядка сомножителей .

Доказательство. Существование разложения докажем индукцией по n. База: если n = 1, то


оно является произведением пустого набора простых чисел. Пусть теперь n > 1. По преды‐
дущему утверждению най дется такое простое число p1 , что n = p1 m для некоторого m < n.
По индукционному предположению существуют такие простые p2 , . . . , pk , что m = p2 ·. . .·pk ,
откуда n = p1 · . . . · pk .
Для доказательства единственности снова воспользуемся индукцией по n. База n = 1 оче‐
видна (в этом случае возможно только тривиальное разложение с 0 множителей ). Переход:
.
пусть n = p1 · . . . · pk = q1 · . . . · qm — два таких разложения. Тогда, поскольку n .. p1 , какой ‐то
из множителей qi делится на p1 , а тогда равен ему. Поделив на p1 = qi обе части, получа‐
ем два разложения для n/p1 , а они совпадают с точностью до перестановки множителей по
индукционному предположению.

Среди множителей в таком разложении могут встречать равные. Их можно объединить,


переписав тем самым натуральное число n в виде n = pd11 ·. . .·pdkk , где p1 , . . . , pk — различные
простые, а d1 , . . . , dk ∈ N. Такое представление называется каноническим разложением числа
n на простые множители.
Удобно бывает также допускать в разложении на простые нулевые степени — в этом слу‐
чае теряется единственность разложения (это можно обой ти, говоря о единственности толь‐
ко для тех простых множителей , которые входят с положительной степенью).
Еще один способ обой ти указанное выше препятствие — ввести понятия формально бесконечных суммы и про‐
изведения. А именно, рассмотрим P f : A → R, что f (a) 6= 0 лишь для конечного числа элементов
Pтакую функцию
a ∈ A. Тогда можно определить a∈A f (a) = a∈A\f −1 (0) f (a), то есть просто как конечную сумму всех ненуле‐
вых значений . Точно
Q так же, еслиQf : A → R такова, что f (a) 6= 1 только для конечного числа элементов a ∈ A, то
можно положить a∈A f (a) = a∈A\f −1 (1) f (a).
Для канонического разложения на простые это значит следующее. Обозначим P множество всех простых чисел.
Тогда для n ∈ N и p ∈ P существует такое однозначно определенное dp ∈ Z>0 , что pdp | n, но pdp +1 - n. Функция
P → N, переводящая
Q p в pdp , принимает отличное от 1 значение лишь в конечном числе точек, так что можно
записать n = p∈P pdp .

Следствие 2.7.4. Если a = pd11 ·. . .·pdkk и b = pe11 ·. . .·pekk — разложения на простые, di , ei ∈ Z>0
.
и pi 6= pj при i 6= j, то a .. b тогда и только тогда, когда di > ei для всех i.
. .
Доказательство. Если a .. b, то a .. pei i для каждого i. Но так как pj ⊥ pi для j 6= i, то pj j ⊥ pei i
d
.
и, как следствие, pdi i .. pei i , что возможно только при di > ei .

Обратно, если di > ei для всех i, то a = b · pd11 −e1 · . . . · pkdk −ek — здесь второй множитель
является целым числом.

30
Вообще говоря, каноническое разложение можно распространить и на (ненулевые) рациональные числа. Для
начала определим каноническое разложение целого числа m как произведение знака m на каноническое разложе‐
ние |m|. Затем, представляя рациональное число x в виде несократимой дроби x = m/n, где m, n ∈ Z, n > 0 и
m ⊥ n, мы видим, что каждое простое может входить в каноническое разложение лишь одного из чисел m, n (или
не входит ни в одно), так что если m = ±pd11 · . . . · pkk , а n = q1e1 · . . . · qses , то m/n = ±pd11 · . . . · pkk · q1−e1 · . . . · qs−es .
d d

То есть теперь в каноническом разложении допускаются также отрицательные степени.

Следствие 2.7.5. Если a = pd11 · . . . · pdkk и все pi различны, то количество натуральных дели‐
телей a равно (d1 + 1) · . . . · (dk + 1).
Доказательство. Выбрать делитель a это то же самое, что выбрать степени ei , с которыми pi
входит в каноническое разложение этого делителя. При этом 0 6 ei 6 d, то есть для каждого
простого pi имеется di +1 различных вариантов, а так как выборы производятся независимо,
всего способов выбрать все ei имеется (d1 + 1) · . . . · (dk + 1).
Следствие 2.7.6. Если a = pd11 · . . . · pdkk и b = pe11 · . . . · pekk , di , ei ∈ Z>0 и pi 6= pj при i 6= j, то
min(d ,e ) min(d ,e )
gcd(a, b) = p1 1 1 · . . . · pk k k
Доказательство. Указанная величина является общим делителем a и b, так как min(di , ei ) 6
di , ei . У любого другого общего делителя показатели степеней будут не больше этого, так что
это и в самом деле НОД.

2.8 Сравнения и кольца классов вычетов


Определение 2.8.1. Пусть m ∈ N. Будем говорить, что целые числа a и b сравнимы по модулю
.
m, если (a − b) .. m (обозначается a ≡ b (mod m) или a ≡m b).
Эквивалентно можно сказать, что a ≡m b тогда и только тогда, когда a и b дают одинаковые
остатки при делении на m.
Отметим некоторые свой ства сравнений .
Предложение 2.8.2.
1. Отношение ≡m является отношением эквивалентности;
2. Отношение ≡m является отношением конгруэнтности относительно + и ·;
3. Каждое целое число сравнимо по модулю m ровно с одним из чисел 0, 1, . . . , m − 1;
4. Если ac ≡ bc (mod m) и c ⊥ m, то a ≡ b (mod m).
Доказательство.
. .
1. Рефлексивность: 0 = a − a .. m, так что a ≡m a. Симметричность: если a − b .. m, то
..
b − a = −(a − b) . m. Транзитивность: если a = b + km и b = c + lm, то a = c + (k + l)m.
2. Было доказано ранее в конце раздела 2.1.
3. Теорема 2.4.1 о делении с остатком дает существование такого сравнимого с a числа
(а именно, остаток при делении a на m). Покажем, что среди 0, 1, . . . , m − 1 нет других
.
сравнимых с a чисел. Если x, y — два таких числа, то x ≡m y и x − y .. m. Если x − y 6= 0,
то |x − y| > m и они не могут одновременно лежать в указанном интервале.
.
4. Если (a − b)c = ac − bc .. m и c ⊥ m, то, поскольку левая часть должна делиться на m,
..
получаем a − b . m (пункт 3 Предложения 2.5.3).

31
Определение 2.8.3. Фактор‐множество Z/≡m с операциями, индуцированными на нем сло‐
жением и умножением целых чисел, называется кольцом классов вычетом по модулю m и
обозначается Z/mZ.
Элементами Z/mZ являются классы вычетов по модулю m, то есть множества вида [a] =
{b ∈ Z | b ≡ a (mod m)} (классы эквивалентности относительно ≡m ). Эти классы можно
описать и иначе: [a] = a + mZ = {a + km | k ∈ Z}. Любой элемент b ∈ [a] называется
представителем класса [a] (и тогда [b] = [a]).
Напомним, операции на классах устроены следующим образом:

[a] + [b] = [a + b], [a] · [b] = [ab].

Операции определены корректно (то есть зависят от классов [a] и [b], а не от конкретного
выбора представителей a и b), так как ≡m является отношением конгруэнтности.
В дей ствительности можно выписать полный список классов, образующих кольцо Z/mZ,
а именно,
Z/mZ = {[a] | a = 0, . . . , m − 1}.
Другой способ смотреть на кольцо классов вычетов — для a = 0, . . . , m − 1 определить
объекты a и задать на множестве {0, 1, . . . , m − 1} бинарные операции следующим образом:

a + b = r, где r — остаток при делении a + b на m,


a · b = s, где s — остаток при делении ab на m.

Более общо, можно вместо набора чисел 0, 1, . . . , m − 1 рассматривать и другие.


Определение 2.8.4. Полной системой вычетов по модулю m называется множество целых
чисел X, пересекающее каждый класс вычетов ровно по одному элементу, то есть для любо‐
го a ∈ Z выполнено |X ∩ (a + mZ)| = 1. Иными словами, для любого целого числа най дется
ровно один элемент множества X, сравнимый с ним.
Примеры 2.8.5.
1. {0, 1, . . . , m − 1} является полной системой вычетов по пункту 3 Предложения 2.8.2;

2. {1, 2, . . . , m};
3. Если m = 2k + 1, то {−k, −k + 1, . . . , −1, 0, 1, . . . , k − 1, k} — полная система вычетов,
4. Если m = 2k, то {−k, . . . , k − 1}.

Кольцо Z/mZ, вообще говоря, не является областью целостности для произвольного m. А


именно, если m = kn, то [k] · [n] = [kn] = [m] = [0], то есть для непростых m в Z/mZ имеются
делители 0.
Предложение 2.8.6. Линей ное сравнение ax ≡ b (mod m) разрешимо тогда и только тогда,
.
когда b .. gcd(a, m).
.
Доказательство. Если x — решение этого сравнения, то ax − b .. m, то есть существует та‐
кой k ∈ Z, что ax − b = mk. Переписывая в виде ax − mk = b, видим, что вопрос о суще‐
ствовании таких x и k является вопросом о разрешимости линей ного диофантова уравне‐
ния от двух переменных. По Предложению 2.6.1 оно разрешимо тогда и только тогда, когда
.
b .. gcd(a, −m) = gcd(a, m).

32
Следствие 2.8.7. Сравнение ax ≡ 1 (mod m) разрешимо тогда и только тогда, когда a ⊥ m.
Определение 2.8.8. Решение сравнения ax ≡ 1 (mod m) будем называть модулярным об‐
ратным для a. Модулярный обратный всегда можно выбрать в промежутке от 0 до m − 1.
Следствие 2.8.9. (Z/mZ)∗ = {[a] | a ⊥ m}.
Доказательство. Элемент [a] ∈ Z/mZ обратим, если существует такой [b] ∈ Z/mZ, что [a] ·
[b] = [1], то есть ab ≡ 1 (mod m), что выполнимо только при a ⊥ m.

2.9 Двоичная арифметика конечной разрядности


В компьютерных системах целые числа задаются в двоичной форме. Для начала рассмотрим
представление неотрицательных чисел, так называемую беззнаковую форму.
А именно, последовательности (bn−1 , bn−2 , . . . , b1 , b0 ) битовых значений (0 и 1) длины n
соответствует целое число b0 + 2b1 + . . . + 2n−1 bn−1 , и всякое целое число в интервале от 0
до 2n−1 представляется в таком виде (единственным образом).
Для чисел, записанных в двоичной форме (еще говорят, в позиционной системе счисления
по основанию 2), имеются стандартные способы их складывать и умножать «в столбик».
Однако если мы ограничимся теми целыми числами, которые можно записать при помощи
n двоичных бит, то при сложении и умножении «перенос разряда» может выводить за преде‐
лы допустимых разрядов. В этом случае получающиеся старшие биты просто выбрасывают‐
ся. Такое на первый взгляд варварское отношение к результатам вычислений на самом деле
означает просто, что все вычисления проделываются по модулю 2n , то есть в дей ствительно‐
сти двоичные числа с разрядностью n следует воспринимать не как неотрицательные целые
числа, а как элементы кольца Z/2n Z, записываемые посредством полной системы вычетов
0, 1, . . . , 2n − 1.
Отметим, что некоторые операции в двой чной записи проделываются особенно легко:
1. Умножение на 2 выполняется посредством сдвига влево, то есть 2·(bn−1 , bn−2 , . . . , b1 , b0 ) =
(bn−2 , bn−3 , . . . , b0 , 0);
2. Деление на 2 (вычисление неполного частного, если число не делится нацело) осуществ‐
ляется сдвигом вправо: (0, bn−1 , . . . , b1 );
3. Вычисление остатка при делении на 2k реализуется маской , то есть отбрасыванием
(обнулением) всех старших бит: (0, . . . , 0, bk−1 , . . . , b0 );
4. Нахождение обратного по сложению в Z/2n Z производится инверсией всех бит и при‐
бавлением единицы: (1 − bn−1 , . . . , 1 − b0 ) + (0, . . . , 0, 1).
Деление с остатком на число m, не являющееся степенью 2, является трудоемким, поэтому
желательно иметь метод, ускоряющий наивный подход. Особенно это актуально для вычис‐
ления произведения по модулю m. Одним из способов решить последнюю задачу является
редукция по Монтгомери.
Алгоритм 2.9.1 (Редукция по Монтгомери).
Будем обозначать посредством (x mod y) остаток при делении x на y.
Пусть даны целые числа 0 6 a, b < m − 1, требуется вычислить (ab mod m).
1. Выберем какое‐нибудь число r, большее m и взаимно простое с ним. В наилучшем слу‐
чае можно выбрать в качестве r степень двой ки (если m нечетно). Тогда можно най ти
r′ — модулярный обратный для r по модулю m, так что rr′ ≡ 1 (mod m).

33
2. Положим k = (rr′ − 1)/m (делится нацело), так что 1 + km = rr′ .

3. Переводим числа a и b в форму Монтгомери: e a = (ar mod m), eb = (br mod m). Будем
искать c ≡m ab в форме Монтгомери: e
c = (cr mod m) = (abr mod m).

4. Вычисляем произведение целых чисел e a и eb: e


a · eb ≡m abr2 ≡m e
c · r, причем 0 6 e a · eb < m2 .

c = R e
5. Редукция: e a · eb , где функция редукции R : {0, . . . , m2 − 1} → {0, . . . , m − 1}

эффективно вычисляет R(x) = (xr′ mod m) — в таком случае R e a · eb = (abr mod m).
Функция R дей ствует следующим образом:
a) Положим s = (xk mod r). При r степени 2 это вычисление производится быстро,
особенно если сначала заменить x на (x mod r), что не меняет значения s. Заме‐
тим, что 0 6 s < r.
b) Положим t = x + sm, так что t ≡m x. Заметим, что раз 0 6 x < m2 < rm и
.
0 6 sm < rm, выполнено 0 6 t < 2rm. Кроме того, t .. r. Дей ствительно,

x + sm ≡r x + xkm ≡r x(1 + km) ≡r x · rr′ ≡r 0.

c) Положим u = t/r (делится нацело). u ≡m urr′ ≡m tr′ , откуда u ≡m xr′ .


d) Так как 0 6 t < 2rm, имеем 0 6 u < 2m. Если u < m, то положим R(x) = u, иначе
R(x) = u − m.

cr′ mod m).


6. Вычисляем искомое число c по его форме Монтгомери: c = (e
На первый взгляд кажется, что никакого выигрыша нет — вместо одного вычисления остат‐
ка (ab mod m) мы проводим три: (ar mod m), (br mod m), (ecr′ mod m), не считая большего
количества умножений и нахождения модулярного обратного. Эффективность редукции по
Монтгомери проявляется при вычислении степеней — перевод в форму Монтгомери и об‐
ратно требуется только в начале и конце вычисления, в то время как шаги 4 и 5, которые и
реализуют умножение чисел в форме Монтгомери, работают значительно быстрее (все де‐
ления — на степени 2).

2.10 Функция Эйлера, теорема Эйлера и малая теорема Ферма


Для модулярного возведения в большую степень полезным оказывается следующее заме‐
чание. Пусть имеется элемент x ∈ Z/mZ, и рассматриваются его степени x, x2 , x3 , . . . — по‐
скольку все они являются элементами конечного множества Z/mZ, то в этом списке в какой ‐
то момент возникнут повторы, скажем, xk = xn для некоторого n < k. Если x обратим, то
тогда xn−k = 1. Это означает, что для a ⊥ m существует такое натуральное число k, что
ak ≡ 1 (mod m). В таком случае для числа n = qk + r выполнено an ≡ ar (mod m), что
позволяет свести вычисление большой степени к вычислению малой степени. Укажем один
способ находить такое число k.
Определение 2.10.1. Функцией Эйлера называется функция φ : N → N, дей ствующая по пра‐
вилу φ(n) = |(Z/nZ)∗ |, то есть φ(n) это количество натуральных чисел от 1 до n, взаимно
простых с n.
Теорема 2.10.2 (Теорема Эй лера). Если a ⊥ m, то aφ(m) ≡ 1 (mod m).

34
Доказательство. Пусть x1 , . . . , xk — полный список всех обратимых элементов Z/mZ. То‐
гда, поскольку [a] также обратим, все произведения [a]x1 , . . . , [a]xk обратимы. При этом все
они различны, так как отображение x 7→ [a]x обратимо (обратное отображение реализуется
как домножение на элемент, обратный к [a]). Значит, [a]x1 , . . . , [a]xk — снова полный список
обратимых элементов, возможно, в другом порядке. Рассмотрим произведение всех обрати‐
мых элементов:
x1 · . . . · xk = [a]x1 · . . . · [a]xk = [a]k · x1 · . . . · xn .
Поскольку x1 · . . . · xk снова обратимо, можно домножить на обратный и получить [a]k = 1,
что и требовалось.

Значение функции Эй лера φ(m) не всегда является наименьшим натуральным числом k, при котором ak ≡m 1
для всех a ⊥ m. Наименьшим таким k является значение функции Кармай кла, вычисляемое следующим образом:
( 
 φ pd , если p > 3 или d 6 2,    
λ pd = 1  λ pd11 · . . . · pds s = lcm λ pd11 , . . . , λ pds s .
2
φ pd если p = 2 и d > 3,

Замечание 2.10.3. Если p простое, то φ(pk ) = pk−1 (p − 1). В частности, φ(p) = p − 1.


Доказательство. Число взаимно просто с pk только когда оно не делится на p. Всего чисел
от 1 до pk имеется pk , из них pk−1 делящихся на p, так что φ(pk ) = pk − pk−1 = pk−1 (p − 1).
Следствие 2.10.4 (Малая теорема Ферма). Если p простое и p - a, то ap−1 ≡ 1 (mod p).

Существуют такие непростые числа n, что an−1 ≡ 1 (mod n) для всех a ⊥ n. Такие числа называются числами
Кармай кла, их бесконечно много, каждое имеет по край ней мере 3 простых делителя. Натуральное число n явля‐
ется числом Кармай кла тогда и только тогда, когда оно свободно от квадратов и для каждого простого делителя p
.
выполнено n − 1 .. p − 1. Наименьшим числом Кармай кла является 561 = 3 · 11 · 17.

Следствие 2.10.5. Если p простое и a ∈ Z, то ap ≡ a (mod p).


.
Доказательство. Если a .. p, то обе части сравнимы с 0 по модулю p, а иначе результат полу‐
чается из утверждения малой теоремы Ферма домножением на a.

2.11 Китайская теорема об остатках


Редукция по Монтгомери (для двоичных чисел) работает быстро, если модуль нечетен. Для
четного m можно выделить максимальную степень 2, то есть записать m = 2k · m′ , где m′
нечетное. Вычислив остатки при делении на m′ и на 2k , требуется как‐то восстановить оста‐
ток по модулю m. В дей ствительности, можно задуматься и о более общем вопросе: как, зная
остатки при делении на набор попарно взаимно простых модулей m1 , . . . , mn , восстановить
остаток при делении на m1 · . . . · mn — и когда это возможно?
Теорема 2.11.1 (Китай ская теорема об остатках). Пусть m1 , . . . , mn — попарно взаимно про‐
стые натуральные числа (то есть mi ⊥ mj при i 6= j), а r1 , . . . , rn — какие‐то целые числа.
Тогда система линей ных сравнений


 x ≡ r1 (mod m1 ),

..
 .

x ≡ r
n (mod mn )
имеет целочисленное решение, единственное по модулю m1 · . . . · mn .

35
Доказательство. Рассмотрим следующий частный случай : r2 = . . . = rn = 0, а r1 произволь‐
ный . Тогда решение x системы сравнений должно делиться нацело на m2 , . . . , mn и, посколь‐
ку модули попарно взаимно просты, на их произведение. С другой стороны, m2 ·. . .·mn ⊥ m1 ,
так что сравнение m2 · . . . · mn · y ≡ r1 (mod m1 ) разрешимо — пусть y1 это его решение. По‐
ложим x1 = y1 · m2 · . . . · mn , тогда x1 ≡ r1 (mod m1 ) и x1 ≡ 0 (mod mi ) при i 6= 1. Аналогично
можно най ти решения xi для систем сравнений с rj = 0 при j 6= i.
Положим x = x1 + . . . + xn , тогда x ≡ xi ≡ ri (mod mi ). Это доказывает существование
решения.
.
Пусть теперь x, y — два возможных решения. Тогда x − y .. mi , и в силу взаимной простоты
..
модулей x − y . m1 · . . . · mn , что и доказывает единственность.
Пусть m1 , . . . , mn ∈ N. Рассмотрим следующее коммутативное кольцо:

Z/m1 Z × . . . × Z/mn Z,

в котором операции дей ствуют покомпонентно, то есть

(a1 , . . . , an ) + (b1 , . . . , bn ) = (a1 + b1 , . . . , an + bn )

и аналогично для умножения. Тогда есть естественно определенное отображение

θ : Z/m1 . . . mn Z → Z/m1 Z × . . . × Z/mn Z,

дей ствующее по следующему правилу: класс [a] по модулю m1 · . . . · mn переводится в кортеж


классов вычетов числа a по модулям m1 , . . . , mn .

Следствие 2.11.2. Если числа mi попарно взаимно просты, то θ является биекцией .


Доказательство. Отображение θ сюръективно, так как у элемента ([r1 ], . . . , [rn ]) есть прооб‐
раз, а именно класс вычетов x, где x — решение системы сравнений x ≡ ri (mod mi ). Инъ‐
ективность следует из единственности такого x.

В дей ствительности китай скую теорему об остатках можно доказать даже более коротким образом. А именно,
аргумент о единственности решения системы сравнений показывает, что отображение θ инъективно. Но размеры
области определения и области прибытия совпадают, так что по принципу Дирихле θ биективна.

Китай ская теорема об остатках позволяет, кроме прочего, вычислять значение функции
Эй лера на произвольных натуральных числах.

Лемма 2.11.3. Пусть m1 , . . . , mn попарно взаимно просты. Тогда x ∈ Z/m1 . . . mn Z обратим


в том и только том случае, когда θ(x) обратим в Z/m1 Z × . . . × Z/mn Z.
Доказательство. Достаточно доказать для случая n = 2. Если [a] ∈ Z/mkZ обратим, обо‐
значим [b] = [a]−1 . Тогда ab ≡ 1 (mod mk), откуда ab ≡ 1 (mod m) и ab ≡ 1 (mod k).
Обратно, пусть b — представитель класса, обратного к классу a в Z/mZ, а c — в Z/kZ. По
сюръективности θ най дется такой [d] ∈ Z/mkZ, что θ(d) = ([b], [c]). Это значит, что d ≡ b
(mod m) и d ≡ c (mod k), а тогда ad ≡ 1 (mod m) и ad ≡ 1 (mod k). По китай ской теореме об
остатках существует единственный (по модулю mk) x, дающий при делении на m и k остаток
1. Числа ad и 1 оба удовлетворяют этим сравнениям, так что ad ≡ 1 (mod mk), то есть [a]
обратим в Z/mkZ.
Предложение 2.11.4. Функция Эй лера мультипликативна в следующем смысле: если m ⊥
n, то φ(mn) = φ(m)φ(n)

36
Доказательство.

|(Z/mnZ)∗ | = |(Z/mZ × Z/nZ)∗ | = |(Z/mZ)∗ × (Z/nZ)∗ | = |(Z/mZ)∗ | · |(Z/nZ)∗ | .

Следствие 2.11.5. Если n = pd11 · . . . · pdkk — каноническое разложение на простые, то

φ(n) = pd11 −1 (p1 − 1) · . . . · pdkk −1 (pk − 1).

2.12 Криптографические протоколы


Пусть Алиса (А) и Боб (Б) — два участника коммуникации, и требуется наладить защищен‐
ный канал связи между ними, то есть договориться о способе передавать сообщения таким
образом, чтобы никто, кроме самих участников, не мог получить истинное содержание. Со‐
общения защищаются шифрованием при помощи ключа, без знания которого невозможно
(или по край ней мере очень сложно) восстановить исходное сообщение. Теория чисел позво‐
ляет создать такие схемы шифрования, что участникам не требуется заранее согласовывать
ключ шифрования.
Один из способов это реализовать — согласовать общий секретный ключ, обмениваясь
незашифрованными сообщениями по открытому каналу (в предположении, что сообщения
доходят правильному адресату и не подменяются посредником). Примером такой схемы яв‐
ляется протокол Диффи—Хеллмана—Меркла. Он основан на сложности решения задачи дис‐
кретного логарифмирования.
Определение 2.12.1. Пусть p — простое число, а g — первообразный корень по модулю p,
то есть такое g = 2, . . . , p − 1, что g k 6≡ 1 (mod p) для 1 6 k < p − 1. Тогда для любого
a = 1, . . . , p − 1 существует единственное такое k = 1, . . . , p − 1, что g k ≡ a (mod p). Такое k
называется дискретным логарифмом a по основанию g и модулю p.
Алгоритм 2.12.2 (Протокол Диффи—Хеллмана—Меркла).
1. Участники договариваются о простом числе p и первообразном корне g. Например, (А)
генерирует их и посылает (Б) по открытому каналу — эта пара чисел является обще‐
доступной информацией .
2. Участники генерируют свои закрытые ключи — большие случай ные числа a и b. За‐
тем (A) вычисляет число A = (g a mod p), а (Б) вычисляет B = (g b mod p). Участники
обмениваются вычисленными значениями.
3. (А) вычисляет (B a mod p), а (Б) вычисляет (Ab mod p) — итого оба участника получают
одно и то же число K = (g ab mod p), которое можно использовать в качестве общего
секретного ключа.
Даже если злоумышленник перехватил числа A и B, вычисление K для него требует нахож‐
дения дискретного логарифма A или B по основанию g, что является вычислительно труд‐
ной задачей .
Другая вычислительно сложная задача — задача факторизации, то есть нахождения раз‐
ложения натурального числа на простые множители. На этом основан протокол RSA.
Алгоритм 2.12.3 (Протокол Ривеста—Шамира—Адлемана).
1. (А) создает ключи для шифровки и дешифровки:
a) Генерируются два различных простых числа p и q.

37
b) Вычисляются n = pq и φ(n) = (p − 1)(q − 1).
c) Выбирается целое число e = 2, . . . , φ(n), взаимно простое с φ(n) — оно называется
открытой экспонентой.
d) Вычисляется d — обратный к e по модулю φ(n), так что ed ≡ 1 (mod φ(n)). Это
число называется секретной экспонентой.
e) Пара (e, n) отправляется (Б) и служит открытым ключом, а пара (d, n) — закры‐
тым ключом.
2. (Б) рассматривает исходной сообщение как число m = 0, . . . , n − 1 и шифрует его, ис‐
пользуя полученный от (А) открытый ключ: c = (me mod n). Полученное зашифрован‐
ное сообщение c отправляется (А).

3. (А) использует свой закрытый ключ для дешифровки: (cd mod n) = (med mod n) = m.
Замечание 2.12.4. Дешифрование происходит корректно, то есть для любого m = 0, . . . , n−
1 выполнено med ≡ m (mod n).
Доказательство. Предположим сначала, что m ⊥ p. Так как ed ≡ 1 (mod φ(n)), то ed = 1 +
k(p − 1)(q − 1) для некоторого целого k, а тогда (по малой теореме Ферма)
k(q−1)
med = m1+k(p−1)(q−1) = m · mp−1 ≡p m · 1k(q−1) = m.
.
Если m .. p, то med ≡p 0 ≡p 0. Итого med ≡ m (mod p), и аналогично med ≡ m (mod q). Тогда
по китай ской теореме об остатках med ≡ m (mod n).

38
3 Поля и многочлены
3.1 Поля
Определение 3.1.1. Коммутативное кольцо с единицей F называется полем, если в нем лю‐
бой ненулевой элемент обратим, т.е. F ∗ = F \ {0}, и 1 6= 0.

Последнее требование добавлено, чтобы исключить из рассмотрения так называемое ну‐


левое кольцо R = {0}, поскольку формально в нем есть элемент, ней тральный по умноже‐
нию, и все ненулевые элементы обратимы.
Примеры 3.1.2.

1. Рациональные числа Q.
2. Вещественные числа R.
3. Кольцо классов вычетов Z/pZ по простому модулю p.
√ √
4. Пусть k ∈ N не является квадратом. Тогда Q[ k] = {a + b k | a, b ∈ Q} — поле. В самом
деле, это кольцо, поскольку
√ √ √
(a + b k) + (c + d k) = (a + c) + (b + d) k,
√ √ √
(a + b k) · (c + d k) = (ac + kbd) + (ad + bc k),
√ √ √ √
0 = 0 + 0 k ∈ Q[ k], 1 = 1 + 0 k ∈ Q[ k].
√ √
Чтобы показать, что Q[ k] является полем, най дем обратный к a + b k:
√ √
1 a−b k a−b k
√ = √ √ = 2
a+b k (a + b k)(a − b k) a − kb2

Если знаменатель a2 − kb2 ненулевой , то получается элемент Q[ k]. Предположим, что
a2 − kb2 = 0. Ясно, что либо a = b = 0, либо оба числа a, b ненулевые. Во втором случае
k = a2 /b2 , что противоречит предположению о числе k, см. Следствие 2.5.5.

5. В этом разделе мы формально и строго построим еще два важных примера: комплекс‐
ные числа C и рациональные функции F (x).
Замечание 3.1.3. Поле является областью целостности.
Доказательство. По Замечанию 2.3.5 делители нуля не могут быть обратимы, но в поле нет
отличных от 0 необратимых элементов.
Замечание 3.1.4. Кольцо вычетов Z/mZ для составного модуля m не является полем.

3.2 Многочлены одной переменной


Пусть R — коммутативное ассоциативное кольцо с 1. Многочленом над R называется вы‐
ражение вида a0 + a1 x + a2 x2 + . . . + an xn , где все ai ∈ R. Многочлены можно складывать,
«приводя подобные слагаемые», и умножать, «раскрывая скобки». Однако все еще непонят‐
но, какой природы эти объекты. Ясно, что они однозначно задаются набором своих коэффи‐
циентов a0 , a1 , . . . , an , и сей час мы формализуем это соображение.

39
Определение 3.2.1. Бесконечная последовательность (a0 , a1 , a2 , . . . , an , . . .) элементов коль‐
ца R называется финитарной, если начиная с некоторого места все ее элементы равны 0, то
есть существует такое N , что для любого k > N выполнено ak = 0. Иными словами, в этой
последовательности лишь конечное число ненулевых значений . Если рассматривать после‐
довательность ai как функцию
a : Z>0 → R (принимающую значения a(i) = ai ), то это можно
кратко записать в виде a−1 (R \ {0}) < ∞.
Обратите внимание, что требуется именно конечность числа позиций (индексов), в которых принимается
нену‐
левое значение, а не сами ненулевые значения. Такое требование выглядело бы как a(Z>0 ) \ {0} < ∞ (что, разу‐
меется, эквивалентно конечности образа a(Z>0 )).

Определение 3.2.2. Кольцом многочленов R[x] одной переменной x над кольцом R называ‐
ется множество всех финитарных последовательностей со значениями в R с покомпонент‐
ным сложением, то есть
(a0 , a1 , a2 , . . .) + (b0 , b1 , b2 , . . .) = (a0 + b0 , a1 + b1 , a2 + b2 , . . .),
и умножением, задаваемым сверткой, то есть
(a0 , a1 , a2 , . . .) · (b0 , b1 , b2 , . . .) = (a0 b0 , a0 b1 + a1 b0 , a0 b2 + a1 b1 + a2 b0 , . . .)
— в общем случае на k‐й позиции произведения стоит
X
(a · b)k = a0 bk + a1 bk−1 + a2 bk−2 + . . . + ak b0 = i,j>0 ai bj .
i+j=k

Предложение 3.2.3. Определение выше задает коммутативное ассоциативное кольцо с 1.


Доказательство. Проверим сначала, что операции заданы корректно. Пусть a, b ∈ R[x], a =
(a0 , a1 , a2 , . . .), b = (b0 , b1 , b2 , . . .), и обозначим через M и N такие натуральные числа, что
для любого k > M выполнено ak = 0 и для любого k > N выполнено bk = 0. Тогда для
k > max(M, N ) выполнено ak + bk = 0, так что a + b тоже финитарная последовательность.
Аналогично для умножения: пусть k > M + N , тогда если i + j = k, то i > M или j > N
(иначе k = i+j 6 M +N ), так что в выражении для (a·b)k все слагаемые (вида ai bj ) нулевые.
Проверка свой ств сложения тривиальна, так как оно задается покомпонентно (ней траль‐
ным элементом служит 0 = (0, 0, 0, . . .), а −(a0 , a1 , a2 , . . .) = (−a0 , −a1 , −a2 , . . .)).
Проверим ассоциативность умножения:
X X  X  X
((ab)c)k = (ab)i · cj = ar bs · cj = ar bs cj ,
i+j=k i+j=k r+s=i r+s+j=k
X X  X  X
(a(bc))k = ai · (bc)j = ai · br cs = ai br cs .
i+j=k i+j=k r+s=j i+r+s=k

Ясно, что несмотря на различные обозначения индексов, выражения в правых частях равны.
Коммутативность умножения тоже проста:
X X
(ab)k = ai bj = bj ai = (ba)k .
i+j=k j+i=k

Дистрибутивность проверяется аналогично:


X X X
((a + b)c)k = (a + b)i · cj = (ai + bi ) · cj = ai cj + bi cj =
i+j=k i+j=k i+j=k
X X
= ai cj + bi cj = (ac)k + (bc)k = (ac + bc)k .
i+j=k i+j=k

40
В качестве единицы выступает 1 = (1, 0, 0, . . .). Дей ствительно, в выражении для (a · 1)k
имеется только одно ненулевое слагаемое ak · 10 = ak .
Обозначение 3.2.4. Мы будем отождествлять элемент r базового кольца R и соответству‐
ющий многочлен r = (r, 0, 0, . . .).
Обозначение 3.2.5. Обозначим x = (0, 1, 0, 0, . . .) ∈ R[x]. Тогда xn = (0, . . . , 0, 1, 0, . . .). Заме‐
| {z }
n
тим, что rxn = (0, . . . , 0, r, 0, . . .), и тогда

(a0 , a1 , a2 , . . . , an , 0, 0, . . .) = (a0 , 0, . . .) + (0, a1 , 0, . . .) + . . . + (0, . . . , 0, an , 0, . . .)


= a0 + a1 x + a2 x2 + . . . + an xn .

Такое представление называется канонической записью многочлена.

Определение 3.2.6. Степенью многочлена f = a0 +a1 x+. . .+an xn называется наибольшее


такое d ∈ Z>0 , что ad 6= 0, и −∞, если такого d нет (то есть если f = 0). Обозначение: d =
deg(f ). Таким образом, для r ∈ R \ {0} имеет место deg(r) = 0, и deg(rxn ) = n.
Коэффициент a0 называется свободным членом, а adeg(f ) старшим коэффициентом много‐
члена f = a0 + a1 x + . . . + ad xd .
Заметим, что deg(f +g) 6 max(deg(f ), deg(g)). Из доказательства Предложения 3.2.3 видно
также, что deg(f ·g) 6 deg(f )+deg(g). Легко привести пример, когда это неравенство строгое:
если R = Z/4Z, а f = g = 2x, то deg(f ) = deg(g) = 1, в то время как deg(f g) = deg(0) = −∞.
Предложение 3.2.7. Если R — область целостности, то deg(f g) = deg(f ) + deg(g).
Доказательство. Если a и b — старшие коэффициенты f и g, то коэффициент при xdeg(f )+deg(g)
в произведении f g вычисляется как ab, и он не равен 0, так как a, b 6= 0 и R — область це‐
лостности.
Если же старший коэффициент одного из многочленов най ти невозможно, то есть f = 0
или g = 0, то в обоих частях доказываемого равенства стоит −∞.
Следствие 3.2.8. Если R — область целостности, то R[x] тоже область целостности.
Доказательство. Если хотя бы один из многочленов f, g ∈ R[x] не является константой , то
deg(f g) = deg(f ) + deg(g) > 0, в частности, f g 6= 0. Если же f, g ∈ R, то f g 6= 0 как элементы
области целостности R.
Следствие 3.2.9. Если R — область целостности, то R[x]∗ = R∗ . Иными словами, среди мно‐
гочленов обратимы только обратимые константы.

Доказательство. Пусть f · g = 1. Так как f, g 6= 0, имеем deg(f ), deg(g) > 0. Тогда, так как
0 = deg(f g) = deg(f )+deg(g), обе степени deg(f ) и deg(g) равны 0. Отсюда f, g ∈ R, так что ни
один многочлен f положительной степени не является обратимым и никакая необратимая
константа из R не получает в R[x] обратного элемента.
Замечание 3.2.10. Если R = Z/4Z, то 1 + 2x ∈ R[x]∗ . Дей ствительно, (1 + 2x)(1 + 2x) =
1 + (2 + 2)x + (2 · 2)x2 = 1.

41
3.3 Деление и вычисление значений многочленов
Теорема 3.3.1. (о делении многочленов с остатком) Пусть R — область целостности, а мно‐
гочлены f, g ∈ R[x] таковы, что g 6= 0 и его старший коэффициент обратим. Тогда существу‐
ют единственные многочлены q, r ∈ R[x], для которых f = qg + r и deg(r) < deg(g).
Доказательство. Докажем существование такие q, r индукцией по deg(f ). Если deg(f ) <
deg(g), то можно положить q = 0 и r = f .
Пусть deg(f ) > deg(g). Запишем f и g в их канонической форме:

f = a0 + . . . + am xm , g = b0 + . . . + bn x n , где am , bn 6= 0.

По предположению m > n и bn ∈ R∗ . Тогда рассмотрим многочлен f ′ = f − g · am b−1


n x
m−n

двух слагаемых совпадают степени:

deg(g · am b−1
n x
m−n
) = deg(g) + (m − n) = m = deg(f )

и старшие коэффициенты (оба равны am ), то есть deg(f ′ ) < deg(f ). По индукционному пред‐
положению най дутся такие q ′ , r′ , что f ′ = q ′ g + r и deg(r′ ) < deg(g). Тогда

f = f ′ + g · am b−1 n x
m−n
= q ′ + am b−1
n x
m−n
· g + r′

— искомое представление.
Чтобы доказать единственность, предположим, что f = q1 g + r1 = q2 g + rs — два таких
представления. Тогда r1 − r2 = (q2 − q1 )g. Степень многочлена в левой части меньше deg(g),
а если q2 6= q1 , то степень многочлена в правой части > deg(g). Отсюда q2 = q1 и r1 = r2 .
Замечание 3.3.2. Если R — поле, то старший коэффициент всегда обратим, так что в таком
случае делить с остатком можно на любой ненулевой многочлен.
Кольцо многочленов обладает дополнительной структурой — возможностью вычислять
значение многочленов.
Определение 3.3.3. Пусть f = a0 + a1 x + . . . + an xn ∈ R[x] и c ∈ R. Тогда элемент a0 + a1 c +
. . . + an cn ∈ R называется значением многочлена f в точке c и обозначается f (c).

Тем самым с каждым многочленом f ∈ R[x] связана полиномиальная функция fe: R → R,


дей ствующая по правилу fe(c) = f (c). Отметим сразу, что различным многочленам может
соответствовать одна и та же полиномиальная функция. Например, если R = Z/pZ, то мно‐
гочлену xp −x ∈ R[x] соответствует по малой теореме Ферма функция c 7→ 0, и та же функция
получается из нулевого многочлена. Далее мы выясним, в каких случаях такого не происхо‐
дит.
Отметим некоторые свой ства значений многочленов.
Предложение 3.3.4. Пусть f, g ∈ R[x] и c ∈ R. Тогда
1. (f + g)(c) = f (c) + g(c);
2. (f g)(c) = f (c) · g(c);
3. если f = r ∈ R, то f (c) = r.
Доказательство. Пусть f = a0 + a1 x + . . . + an xn и g = b0 + b1 x + . . . + bn xn — запись с
одинаковым числом слагаемых (в частности, an и bn могут быть нулевыми).

42
Pn Pn Pn Pn
1. (f + g)(c) = i=0 (ai + bi )ci =ai ci + bi ci = i=0 ai ci + i=0 bi ci = f (c) + g(c).
i=0
P2n P
2. deg(f g) 6 deg(f ) + deg(g) 6 2n, так что f g = k=0 i+j=k ai bj xk и
X
n  X
n  X
n X
2n X
f (c) · g(c) = ai c ·
j j
bj c = ai bj ci+j = ai bj ck = (f g)(c).
i=0 j=0 i,j=0 k=0 i,j>0
i+j=k

3. Если f = r + 0 · x + . . ., то f (c) = r + 0 · c + . . . = r.
Определение 3.3.5. Если f (c) = 0, то говорят, что c является корнем многочлена f .
Предложение 3.3.6 (Малая теорема Безу). Остаток при делении многочлена f на x−c равен
.
f (c). В частности, c ∈ R является корнем многочлена тогда и только тогда, когда f .. (x − c).
Доказательство. Поделим f на x − c с остатком (что возможно, поскольку старший коэф‐
фициент x − c обратим): f = q · (x − c) + r, причем deg(r) < deg(x − c) = 1, так что r ∈ R.
Вычислим значение в точке c для многочленов в левой и правой частях:

f (c) = (q · (x − c) + r)(c) = q(c) · (c − c) + r(c) = q(c) · 0 + r = r.


. .
Если остаток f (c) = 0, то остаток нулевой и f .. (x−c). Если же f .. (x−c), то r = 0 и f (c) = 0.
Следствие 3.3.7. Пусть R — область целостности, f ∈ R[x] и f 6= 0. Тогда

f = (x − c1 ) · . . . · (x − ck ) · g,

где c1 , . . . , ck — все корни f (не обязательно различные), а g ∈ R[x] не имеет корней .


Доказательство. Индукция по deg(f ). База: deg(f ) = 0, то есть f ∈ R \ {0}, и тогда разложе‐
ние состоит из одного множителя g = f .
Пусть теперь deg(f ) > 0. Если у f нет корней , то снова g = f . Если у f имеется корень
.
c, то f .. (x − c), то есть f = (x − c)h для некоторого h ∈ R[x], который имеет меньшую
степень и к которому применимо индукционное предположение, откуда получается искомое
разложение для f .
Тем самым имеется разложение f = (x − c1 ) · . . . · (x − ck ) · g для каких‐то ci ∈ R и какого‐то
g ∈ R[x], не имеющего корней . Ясно, что f (ci ) = 0. Покажем, что у f нет других корней . Если
c — корень f , то 0 = f (c) = (c − c1 ) · . . . · (c − ck ) · g(c). Так как R — область целостности, один
из множителей равен 0, причем это не g(c), так что c = ci для какого‐то i.
Замечание 3.3.8. Условие целостности существенное. Например, если R = Z/4Z, то (x −
0)2 = (x − 2)2 или даже (x − 1) · 2 = (x − 3) · 2, так что существуют различные разложения,
включающие не все корни. С другой стороны, x · (x2 + 2x + 2) = (x − 2) · (x2 + 2), так что
множитель g тоже определен неоднозначно.
Следствие 3.3.9. Если R — область целостности, то количество корней ненулевого много‐
члена не превосходит его степени.
Доказательство. Пусть f = (x − c1 ) · . . . · (x − ck ) · g, где g не имеет корней . Тогда количество
корней не превосходит k, в то время как deg(f ) = k · deg(g) > k.
Замечание 3.3.10. Здесь условие целостности тоже важно — все для того же кольца R =
Z/4Z у многочлена 2x2 + 2x степени 2 корнями являются все 4 элемента R.

43
Определение 3.3.11. Многочлены f, g ∈ R[x] называются функционально равными, если
равны соответствующие полиномиальные функции fe и ge. Иными словами, если для любого
c ∈ R выполнено f (c) = g(c). Обычное равенство многочленов (как последовательностей
коэффициентов) иногда, чтобы подчеркнуть разницу с функциональным равенство, назы‐
вают формальным равенством.
Замечание 3.3.12. Выше мы уже приводили пример двух формально различных, но функ‐
ционально равных многочленов: f = xp − x и g = 0 над полем Z/pZ, для которых fe = ge = 0.
Ясно, что из формального равенства многочленов следует функциональное. Выясним, ко‐
гда имеет место обратная импликация.
Предложение 3.3.13. Пусть R — область целостности, f, g ∈ R[x]. Если количество элемен‐
тов R больше, чем deg(f ) и deg(g), то функциональное равенство fe = ge влечет формальное
равенство f = g. В частности, для бесконечного поля функциональное равенство влечет
формальное для любых многочленов.
Доказательство. Рассмотрим многочлен h = f − g. Для любого c ∈ R выполнено h(c) =
f (c) − g(c) = 0. Если h 6= 0, то число его корней не превосходит его степени, но deg(h) 6
max(deg(f ), deg(g)) < |R|, противоречие. Значит, h = 0 и f = g.

3.4 Алгоритмические аспекты деления многочленов


Зай мемся теперь вычислительной стороной деления многочленов с остатком. Нам уже из‐
вестно, что любой многочлен делится с остатком на x − c, причем остаток равен f (c). Вы‐
числение неполного частного и остатка можно в этом случае реализовать в виде следующей
процедуры, известной как схема Горнера или правило Руффини.
Алгоритм 3.4.1 (Схема Горнера).
Пусть f = a0 + a1 x + . . . + an xn , тогда f = (x − c) · q + r. Будем искать q в виде q0 + q1 x +
. . . + qn−1 xn−1 (поскольку известна его степень). Раскроем в правой части скобки:

(x − c) · (q0 + q1 x + . . . + qn−1 xn−1 ) + r = qn−1 xn + (qn−2 − cqn−1 )xn−1 + . . . + (q0 − cq1 )x − cq0 + r.

Приравнивая коэффициенты при xk к ak , получаем набор равенств

qn−1 = an ,
qn−2 = an−1 + cqn−1 ,
..
.
qn−i−1 = an−i + cqn−i ,
..
.
q0 = a1 + cq1 ,
r = a0 + cq0 .

Видно, что для вычисления qk достаточно знать qk+1 и ak+1 (а для r требуются q0 и a0 ), так
что коэффициенты неполного частного qn−1 , . . . , q1 , q0 и остаток r вычисляются последова‐
тельно.

44
Замечание 3.4.2. Это вычисление остатка r = f (c) можно трактовать как нахождение зна‐
чения с помощью представления многочлена f в виде
  

f = a0 + x · a1 + x · a2 + x · . . . + x · (an−1 + xan ) . . .

и последующего вычисления при x = c от внутренних скобок ко внешним.


Для целей вычислений от руки схему Горнера можно реализовать в виде заполнения сле‐
дующей таблицы в соответствии с описанными ниже правилами.

f an an−1 ... a1 a0
c an

Вторая строка заполняется слева направо, на первую незаполненную позицию i (столбцы


нумеруются от n до 0) ставится c · v + ai , где v — значение последней заполненной ячей ки.
Тогда в столбце с номером i оказывается qi−1 , а в столбце 0 в итоге получается f (c).
Схема Горнера допускает обобщение, позволяющее эффективно проводить деление на мно‐
гочлен произвольной степени.
Алгоритм 3.4.3 (Синтетическое деление).
Пусть f = a0 + a1 x + . . . + an xn и g = b0 + b1 x + . . . + bm xm . Предполагается, что n > m и что
старший коэффициент bm обратим. Тогда существуют такие многочлены q, r, что f = gq + r,
причем deg(q) 6 n − m, а deg(r) 6 m − 1. Будем искать q в виде q0 + q1 x + . . . + qn−m xn−m , а
r в виде r0 + r1 x + . . . + rm−1 xm−1 .
Вычисляя напрямую коэффициенты gq + r и приравнивая их к соответствующим коэффи‐
циентам f , получаем, что
X
an−k = bm−i qn−m−j + rn−k ,
i+j=k

где rn−k при n − k > m полагается равным 0. Отсюда видно, что при k 6 n − m
X
qn−m−k · bm = an−k − bm−i qn−m−j ,
i+j=k
j<k

то есть коэффициенты qn−m−k можно вычислить, если известны коэффициенты q при сте‐
пенях выше n − m − k.
Затем, когда все коэффициенты неполного частного q най дены, легко вычислить коэффи‐
циенты остатка r.
Вычисление коэффициентов qn−m , . . . , q0 , rm−1 , . . . , r0 производится единообразно, как и
в схеме Горнера. В целом всю процедуру можно реализовать следующим образом:
1. Инициализируем переменные tn = an , . . . , t0 = a0 .
2. Для каждого индекса k = n − m, . . . , 0 проделаем следующее:
a) Нормируем tk , то есть записываем tk ← tk /bm .
b) Для каждого индекса i = 1, . . . , m добавляем к tk−i величину −tk · bm−i .
3. Возвращаем неполное частное qj = tj+m и остаток rj = tj (первые n−m+1 и последние
m элементов последовательности tn , . . . , t0 соответственно).

45
Для вычислений от руки синтетическое деление также можно реализовать в виде запол‐
нения таблицы. Для простоты будем предполагать, что старший коэффициент bm = 1.

an an−1 an−2 ... an−m ... a0


−b0 −an b0
. .
.. ..
−bm−2 −an bm−2
−bm−1 −an bm−1
an

Таблица заполняется по диагоналям от левого нижнего угла к правому верхнему. В ячей ‐


ки на диагонали ставится произведение элемента этой диагонали на последней строки и
конэффициента g, стоящего в соответствующей строке. В таблице выше уже заполнена пер‐
вая диагональ (начиная со значения an ). После заполнения диагонали в первую незаполнен‐
ную ячей ку последней строки ставится сумма значений во всех ячей ках этого столбца — в
таблице выше это будет an−1 − an bm−1 — после чего заполняется очередная диагональ. Так
продолжается до тех пор, пока не будет заполнена последняя из диагоналей длины m, то
есть пока не появится запись в ячей ке под a0 . В этот момент в первых n − m + 1 ячей ках
последней строки оказываются коэффициенты неполного частного q, начиная со старшего.
Если затем в оставшиеся m ячеек последней строки записать суммы по столбцам, то будут
получены коэффициенты остатка.
Если g = x−c, то схему Горнера можно трактовать как синтетическое деление с опущенной
средней строкой таблицы.

3.5 Комплексные числа


Определение 3.5.1. Будем говорить, что два многочлена f, g сравнимы по модулю много‐
.
члена h, если (f − g) .. h. Если допустимо деление на h с остатком, то можно сказать, что два
многочлена сравнимы по модулю h, если их остатки при делении на h совпадают. Обозначе‐
ние: f ≡ g (mod h) или f ≡h g.
Замечание 3.5.2. Бинарное отношение ≡h является отношением эквивалентности и кон‐
груэнтности относительно сложения и умножения многочленов.
Доказательство. Так же, как и для отношения ≡m на множестве целых чисел.
Определение 3.5.3. Положим h = x2 + 1 ∈ R[x] и рассмотрим отношение конгруэнтности
≡h на R[x]. Фактор‐множество R[x]/≡h вместе с индуцированным операциями сложения и
умножения называется кольцом комплексных чисел.
Лемма 3.5.4. В каждом классе эквивалентности относительно ≡h существует единствен‐
ный представитель степени 6 1.
Доказательство. Рассмотрим многочлен f ∈ R[x] и поделим его с остатком на h: f = h·q +r,
где deg(r) < deg(h) = 2. Но тогда f ≡h r и [f ] = [r], причем остаток определен однозначно.

Выясним теперь, как факторизация по ≡h повлияла на правила сложения и умножения.


Для этого достаточно рассмотреть сложение и умножение на уровне представителей степе‐
ни 6 1. Начнем со сложения:

[a + bx] + [c + dx] = [(a + c) + (b + d)x]

46
Представитель (a + c) + (b + d)x уже степени 6 1. Обратимся теперь к умножению:

[a + bx] · [c + dx] = [(a + bx) · (c + dx)] = [ac + (ad + bc)x + bdx2 ].

Представитель последнего класса имеет, возможно, степень 2, но

(ac + (ad + bc)x + bdx2 ) − bd(x2 + 1) = (ac − bd) + (ad + bc)x,

так что (a + bx) · (c + dx) ≡h (ac − bd) + (ad + bc)x и

[a + bx] · [c + dx] = [(ac − bd) + (ad + bc)x].

Тем самым, сложение и умножение элементов R[x]/≡h можно определить напрямую в тер‐
мимах коэффициентов представителей . А именно, зафиксируем следующие обозначения.

Обозначение 3.5.5. Будем отождествлять вещественное число a ∈ R с классом [a] ∈ R[x]/≡h


соответствующего многочлена. Обозначим также i = [x] — этот класс будем называть мни‐
мой единицей. При таком отождествлении можно сказать, что i2 = [x2 ] = [−1] = −1.
Замечание 3.5.6. Каждый элемент R[x]/≡h можно единственным образом представить в
виде a + bi, где a, b ∈ R. Такое представление называется алгебраической формой комплекс‐
ного числа.
Доказательство. Каждый класс относительно ≡h имеет единственного представителя сте‐
пени 6 1. Но [a + bx] = [a] + [b][x] = a + bi.
Все вместе это позволяет описать кольцо комплексных чисел C как

C = {a + bi | a, b ∈ R}

вместе с операциями

(a + bi) + (c + di) = (a + c) + (b + d)i, (a + bi) · (c + di) = (ac − bd) + (ad + bc)i.

Можно быть бы сразу определить C как множество упорядоченных пар вещественных чисел
с так введенными операциями, но тогда пришлось бы отдельно проверять свой ства, опреде‐
ляющие кольцо, которые в нашем определении унаследованы от кольца многочленов.
Определение 3.5.7. Для комплексного числа z = a + bi вещественные числа a и b называют‐
ся соответственно вещественной и мнимой частями и обозначаются Re(z) = a и Im(z) = b.

Определение 3.5.8. Для комплексного числа z = a + bi определим его комплексно сопря‐


женное как z = a − bi.
Предложение 3.5.9. Пусть z, w ∈ C.
1. z + w = z + w;

2. z · w = z · w;
3. z = z;
4. z = z тогда и только тогда, когда z ∈ R.

47
Доказательство. Первое равенство тривиально, для доказательства второго положим z =
a + bi и w = c + di, тогда

(a + bi)(c + di) = (ac − bd) + (ad + bc)i = (ac − bd) − (ad + bc)i,
a + bi · c + di = (a − bi) · (c − di) = (ac − bd) − (ad + bc)i.

Третье и четвертое утверждения очевидны.


Замечание 3.5.10. Для любого z ∈ C число z · z вещественное и равно Re(z)2 + Im(z)2 (в
частности, неотрицательное).

Доказательство. Если z = a + bi, то zz = (a + bi)(a − bi) = a2 + b2 .



Определение 3.5.11. Неотрицательный квадратный корень z · z называется модулем (или
нормой) комплексного числа z и обозначается |z|.
Замечание 3.5.12. |z| = 0 тогда и только тогда, когда z = 0.

Предложение 3.5.13. Пусть z, w ∈ C, тогда |z · w| = |z| · |w|.


√ √ √ √ √
Доказательство. |zw| = zw · zw = z · w · z · w = zz · ww = zz · ww = |z| · |w|.
Предложение 3.5.14. Кольцо комплексных чисел C является полем.
Доказательство. Если z 6= 0, то |z| 6= 0 и обратим как вещественное число, а тогда обратный
1 1 1
к z можно вычислить как 2 z. Дей ствительно, 2 z · z = 2 |z|2 = 1.
|z| |z| |z|
1 a−bi a −b
Замечание 3.5.15. В терминах алгебраической формы a+bi = a2 +b2 = a2 +b2 + a2 +b2 i.

3.6 Геометрическая интерпретация комплексных чисел


Комлексное число a + bi однозначно задается парой вещественных чисел a, b, что позволяет
изображать компексные числа в виде точек плоскости. А именно, выбор декартовой системы
координат на евклидовой плоскости задает отождествление плоскости с R2 , а элементы R2
отождествлятся с элементами C. Традиционно это изображают следующим образом:

Im
z = a + bi
b

0 a Re

Полученная геометрическая интерпретация называется комплексной плоскостью. Веще‐


ственные числа отождествляются с точками на оси абсцисс, называемой по этой причине ве‐
щественной осью. Ось ординат состоит из чисто мнимых чисел и называется мнимой осью. С

48
каждым комплексным числом z связывается радиус‐вектор, соединяющий начало коорди‐
нат 0 с z. Тогда сумма комплексных чисел может быть реализована как сложение соответ‐
ствующих векторов:
z
z+w

Частный случай , когда векторы направлены соответственно вдоль вещественной и мнимой


оси, отвечает тому, разумеется, что a + bi = (a + 0i) + (0 + bi). Комплексное сопряжение
дей ствует как отражение относительно вещественной оси.
Кроме того, теорема Пифагора дает также интерпретацию модулю комплексного числа. А
именно, модуль комплексного числа z это длина соответствующего радиус‐вектора или, что
то же самое, расстояние от 0 до z:

z = a + bi
|z |

Расстояние между точками, отвечающими комплексным числам z и w, вычисляется как дли‐


на соединяющего их вектора, то есть |z − w| = |w − z|:

z
w−z

Замечание 3.6.1. Расстояние можно так и определять — тогда растояние неотрицательно,


равно 0 только между равными точками и удовлетворяет неравенству треугольника, то есть
для трех комплексных чисел z1 , z2 , z3 ∈ C выполнено |z1 − z3 | 6 |z1 − z2 | + |z2 − z3 |.
Доказательство. Первые два свой ства очевидно следуют из свой ств модуля, для доказа‐
тельства третьего достаточно доказать, что для произвольных z, w ∈ C выполнено |z + w| 6
|z| + |w| (и применить к z = z1 − z2 , w = z2 − z3 ).
Возведем обе части доказываемого неравенства в квадрат, так как они нетрицательны,
получится эквивалентное неравенство |z + w|2 6 (|z| + |w|)2 . Левую часть можно переписать
как (z + w)(z + w) = zz + ww + zw + zw = |z|2 + |w|2 + 2 Re(zw), а правую как |z|2 + |w|2 +
2|z||w|. Тогда неравенство принимает (после сокращения и деления на 2) вид Re(zw) 6 |z||w|,
которое выполнено, так как |z||w| = |z||w| = |zw| и вещественная часть числа всегда не
превосходит его модуля.

49
Кроме декартовых координат на плоскости можно также ввести так называемые поляр‐
ные. Для этого фиксируется один луч R0 с началом в точке P0 — тогда каждая точка плоско‐
сти P лежит на каком‐то луче R с началом в P0 , причем для P 6= P0 этот луч определен од‐
нозначно. Точку P можно задать двумя параметрами: расстоянием от P0 до P и углом между
лучами R0 и R.
На комплексной плоскости есть один естественный способ выбрать такой луч, а именно
множество неотрицательных чисел R>0 с началом в точке 0. Тогда каждая точка z комплекс‐
ной плоскости кодируется расстоянием до 0 (то есть |z|) и углом между радиус‐вектором
точки z и лучом R>0 . Этот угол называется аргументом комплексного числа z и обозначает‐
ся arg(z).
Поскольку модуль комплексного числа мультипликативен, то для любого z ∈ C существу‐
ет такое z ′ ∈ C, что z = |z| · z ′ и |z ′ | = 1, а именно, z ′ = z/|z| (или z ′ = 0, если z = 0).
Комплексные числа модуля 1 лежат на окружности радиуса 1 с центром в точке 0.

|z| sin θ z

z′
sin θ
θ 1
cos θ |z| cos θ

На изображении выше аргумент числа z равен θ (и ему же равен arg(z ′ )). Вещественная и
мнимая части z ′ это в точности cos θ и sin θ.
Отсюда мы видим, что любое комплексное число представляется в виде

z = r · (cos θ + i sin θ),

где r = |z| и θ = arg(z). Такая запись называется тригонометрической формой z. Сравне‐


ние модулей , вещественных и мнимых частей показывает, что тригонометрическая форма
определена однозначно.
Выясним теперь, как геометрически описать умножение комплексных чисел. Зафиксиру‐
ем комплексное число z и рассмотрим функцию умножения на z, то есть функцию mz : C →
C, дей ствующую по правилу mz (x) = z · x.
Отметим, что для z, w ∈ C выполнено равенство mz ◦ mw = mzw . Дей ствительно,

(mz ◦ mw )(x) = mz (wx) = z(wx) = (zw)x = mzw (x).

Изучим сперва случай , когда |z| = 1. В таком случае mz является движением, так как со‐
храняет расстояния между точками. Дей ствительно,

|mz (x) − mz (y)| = |zx − zy| = |z(x − y)| = |z| · |x − y| = |x − y|.

Кроме того, mz (0) = z · 0 = 0, так что это движение плоскости является либо поворотом
вокруг точки 0, либо отражением относительно некоторой прямой , проходящей через 0. Если
mz является отражением, то тогда m2z = idC . Но m2z = mz2 , так что это бывает только в случае
z = ±1 (в C у многочлена x2 − 1 только два корня), но в обоих случаях mz это вращение (на 0
в случае z = 1 и на π в случае z = −1). Значит, mz это поворот — остается только выяснить,

50
на какой угол. Но для этого достаточно най ти угол между радиус‐векторами одной точки и
ее образа, например, 1 и mz (1) = z. Этот угол по определению равен arg(z).
С другой стороны, если z ∈ R>0 , то mz это гомотетия с центром в 0 и коэффициентом
z. Используя тригонометрическую форму комплексного числа, видим, тем самым, что для
произвольного z ∈ C функция mz дей ствует посредством поворота на arg(z) и гомотетии с
коэффициентом |z|.
Мультипликативность, то есть свой ство mz ◦ mw = mzw , означает, что числа, записанные
в тригонометрической форме, легко умножать.
Предложение 3.6.2. Если z, w ∈ C, то arg(zw) = arg(z) + arg(w). Иными словами,
 
r · (cos φ + i sin φ) · s · (cos ψ + i sin ψ) = (rs) · (cos(φ + ψ) + i sin(φ + ψ)).
Доказательство. Дей ствительно, если z = r·(cos φ+i sin φ) и w = s·(cos ψ+i sin ψ), то |zw| =
|z||w| = rs. Умножение на z дей ствует как поворот на φ и растяжение в r раз, а умножение на
w как поворот на ψ и растяжение в s раз, тогда композиция mz ◦ mw дей ствует как поворот
на φ + ψ и растяжение в rs раз. Но так же дей ствует умножение на число с модулем rs и
аргументом φ + ψ.
Следствие 3.6.3. Для любых φ, ψ выполнено
cos(φ + ψ) = cos φ cos ψ − sin φ sin ψ, sin(φ + ψ) = cos φ sin ψ + sin φ cos ψ.
Доказательство. Вычислим двумя способами произведение двух комплексных чисел на еди‐
ничной окружности, имеющих аргументы φ и ψ, и сравним получающиеся вещественные и
мнимые части:
cos(φ + ψ) + i sin(φ + ψ) = (cos φ + i sin φ) · (cos ψ + i sin ψ)
= (cos φ cos ψ − sin φ sin ψ) + i(cos φ sin ψ + sin φ cos ψ).
Формула arg(zw) = arg(z) + arg(w) требует некоторых пояснений . Если мы полагаем, что
углы измеряются вещественными числами из полуинтервала [0, 2π), то надо как‐то учесть
случай , когда arg(z) + arg(w) > 2π. Один из способов — переопределить сложение углов,
например, следующим образом:
(
φ + ψ, если φ + ψ < 2π,
eψ=
φ+
φ + ψ − 2π, если φ + ψ > 2π.
Однако иногда бывает удобно считать величину некоторого углу отрицательной — но для
углов в полуинтервале (−π, π] подобная формула для сложения устроена еще сложнее, а ведь
можно выбрать и другой интервал, например, [−π, π). Поэтому продуктивнее другой подход
— переопределить, что такое мера угла. Будем отождествлять углы, отличающиеся на цело‐
численное кратное 2π. Для этого рассмотрим следующее бинарное отношение на R:
φ ≡2π ψ ⇐⇒ ∃k ∈ Z т. ч. φ − ψ = 2πk.
Отношение ≡2π является эквивалентностью и конгруэнтностью относительно сложения,
так что на фактор‐множестве T = R/≡2π определена бинарная операция, индуцированная
сложением вещественных чисел — это и есть сложение углов. Получившееся множество с
бинарной операцией является группой , называемой группой углов. Можно считать, что ар‐
гумент комплексного числа это элемент T, а формула arg(zw) = arg(z) + arg(w) понимается
как вычисление в T.
В дей ствительности группу T относительно сложения углов можно отождествить с груп‐
пой комплексных чисел модуля 1 относительно комплексного умножения.
n
Следствие 3.6.4 (Формула Муавра). r · (cos θ + i sin θ) = rn · (cos nθ + i sin nθ).

51
3.7 Дробно‐линейные преобразования
Рассмотрим следующее отображение:

az + b
f (z) = , где a, b, c, d ∈ C.
cz + d
Если c 6= 0, то такое отображение определено на C \ {−d/c}. Определим расширенную ком‐
плексную плоскость C = C∪{∞}, и доопределим функцию f следующим образом: f (−d/c) =
∞ и f (∞) = a/c. Если же c = 0, то доопределим f (∞) = ∞. Тогда f можно рассматривать как
отображение C → C — такое отображение называется дробно‐линейным преобразованием,
или преобразованием Мебиуса.
Частными случаями являются аффинные преобразования z 7→ az+b (в том числе вращения‐
растяжения ma и сдвиги z 7→ z + b) и обращение z 7→ 1/z.

Предложение 3.7.1. Дробно‐линей ные преобразования замкнуты относительно компози‐


ции.
az + b a′ z + b′
Доказательство. Пусть f (z) = и g(z) = ′ , тогда
cz + d c z + d′
a′ z + b′
a· +b a · (a′ z + b′ ) + b · (c′ z + d′ ) (aa′ + bc′ )z + (ab′ + bd′ )
(f ◦ g)(z) = c′ z + d′ = = .
′ ′ ′ ′ ′ ′
az+b c · (a z + b ) + d · (c z + d ) (ca′ + dc′ )z + (cb′ + dd′ )
c· ′ +d
c z + d′
Остается только проверить случаи, в которых функция была доопределена.
Предложение 3.7.2. Дробно‐линей ное преобразование реализуется как композиция сдви‐
гов, поворотов, растяжений и обращения. А именно, если при c 6= 0 положить

d 1 bc − ad a
f1 (z) = z + , f2 (z) = , f3 (z) = z, f4 = z + ,
c z c2 c
то f = f4 ◦ f3 ◦ f2 ◦ f1 .
Доказательство. Случай c = 0 очевиден (тогда f аффинное — вида f (z) = az + b — и реа‐
лизуется как композиция ma и сдвига на b). Проверим теперь выражение для случая c 6= 0.
Дей ствительно, преобразуем выражение для f :

az + b acz + bc acz + ad − ad + bc a · (cz + d) bc − ad a bc − ad 1


= = = + = + · .
cz + d c · (cz + d) c · (cz + d) c · (cz + d) c · (cz + d) c c2 z + dc

Полученное выражение это в точности формула для (f4 ◦ f3 ◦ f2 ◦ f1 )(z). Остается сверить
значения в доопределенных точках:

d f1 f2 f3 f4
− 7−−→ 0 7−−→ ∞ 7−−→ ∞ 7−−→ ∞,
c
f1 f2 f3 f4 a
∞ 7−−→ ∞ 7−−→ 0 7−−→ 0 7−−→ .
c
Предложение 3.7.3. Если ad − bc = 0, то соответствующее дробно‐линей ное преобразова‐
ние отображает все точки C в a/c, в противном случае оно обратимо.

52
Доказательство. В разложении выше при ad−bc = 0 функция f3 принимает только нулевые
значения на C, откуда следует, что f (z) = f4 (0) = a/c. Если же ad − bc 6= 0, то все функции
f1 , f2 , f3 , f4 обратимы; обратные задаются следующими формулами:

d 1 c2 z a
f1−1 (z) = z − , f2−1 (z) = , f3−1 (z) = , f4−1 (z) = z − .
c z bc − ad c
Функция, обратная к f , вычисляется как композиция обратных в обратном порядке, то есть
f −1 = f1−1 ◦ f2−1 ◦ f3−1 ◦ f4−1 , и дей ствует на комплексном числе z по правилу

f −1 a cz − a
z 7−−4−→ z − =
c c
f3−1 c2 cz − a c · (cz − a)
7−−−→ · =
bc − ad c bc − ad
f2−1 bc − ad
7−−−→
c · (cz − a)
f1−1 bc − ad d bc − ad − d · (cz − a) −dcz + bc −dz + b
7−−−→ − = = = .
c · (cz − a) c c · (cz − a) c · (cz + a) cz − a

Конечно, когда формула f −1 (z) = −dz+b


cz−a получена, ее можно доказать прямой проверкой (по
правилу вычисления композиции дробно‐линей ных преобразований ).
Следствие 3.7.4. Обратимые дробно‐линей ные преобразования образуют группу относи‐
тельно композиции. Эта группа называется группой Мебиуса.
Дробно‐линей ные преобразования сохраняют важную структуру на комплексной плоско‐
сти — множество прямых и окружностей . Прямые можно трактовать как «окружности бес‐
конечного радиуса» или как окружности на расширенной комплексной плоскости (если ее
отождествить со сферой ). Определим сначала, как задать прямые и окружности уравнения‐
ми.
Предложение 3.7.5. Прямые и окружности на комплексной плоскости задаются уравнени‐
ями вида Azz + Bz + Bz + C = 0, где A, C ∈ R и AC < |B|2 . Прямым отвечает случай A = 0.
Доказательство. Начнем с прямых. Отметим для начала, что всякая прямая подходящим по‐
воротом вокруг 0 может быть переведена в вертикальную. Вертикальная прямая характери‐
зуется вещественной частью своих точек и потому может быть задана уравнением z + z = d
(тогда Re(z) = d/2). То есть существуют такие B ∈ C и C ∈ R, что Bz + Bz + C = 0 задает
исходную прямую.
Окружность радиуса r с центром в точке w задается уравнением |z − w| = r. Возводя обе
части в квадрат, получаем

r2 = |z − w|2 = (z − w) · (z − w) = zz − zw − zw + ww = r2 .

Полагая A = 1, B = −w и C = ww − r2 , получаем требуемое уравнение, причем если r > 0,


то AC = ww − r2 < ww = |B|2 .
Проводя указанные выше вычисления в обратном порядке, получаем, что все такие урав‐
нения задают прямые и окружности.
Предложение 3.7.6. Обратимые дробно‐линей ные преобразования сохраняют множество
всех прямых и окружностей , то есть образом прямой или окружности может быть только
прямая или окружность.

53
Доказательство. В силу Предложения 3.7.2 это утверждение достаточно доказать для функ‐
ций вида z 7→ z + a, z 7→ az и z 7→ 1/z. Для первых двух это очевидно следует из геометриче‐
ского истолкования суммы и произведения комплексных чисел, докажем для обращения.
Пусть Azz + Bz + Bz + C = 0, и положим w = 1/z. Тогда подставляя z = 1/w, получаем
1 1 1 1
A +B +B +C =0 ⇒ A + Bw + Bw + Cww = 0.
ww w w
Замечание 3.7.7. Под дей ствием обращения прямые, проходящие через 0 (случай A = C =
0), переходят в прямые, проходящие через 0. Окружности, не проходящие через 0 (случай
A, C 6= 0), переходятв такие же окружности. Прямые, не проходящие через 0 (случай A =
0, C 6= 0), и окружности, проходящие через 0 (случай A 6= 0, C = 0), переходят друг в друга.
Пример 3.7.8. Одним из важных примеров дробно‐линей ного преобразования является пре‐
образование Кэли, задаваемое формулой
z−i
f (z) = .
z+i
Это преобразование переводит верхнюю полуплоскость Im(z) > 0 в единичный круг |z| 6 1.

3.8 Полиномиальные уравнения комплексной переменной


Присоединение к полю вещественных чисел квадратного корня из −1 позволяет, кроме то‐
го, извлекать√квадратный корень из любого вещественного числа, а именно, для λ ∈ R>0
выполнено ( λ · i)2 = −λ. В дей ствительности в поле комплексных чисел можно извлекать
корни любой степени из любого комплексного числа.
Пусть n ∈ N. Изучим корни n‐й степени из комплексного числа w. Ясно, что их не больше
n, так как они являются корнями многочлена xn − w степени n. Пусть z1 , z2 два таких корня,
то есть z1n = z2n = w. Тогда (z1 /z2 )n = z1n /z2n = w/w = 1, то есть два корня n‐й степени из
w отличаются одно от друго на множитель, являющий ся корнем n‐й степени из 1. Поэтому
чтобы определить множество всех корней n‐й степени из w, надо най ти один такой корень
z0 , а затем рассмотреть всевозможные произведения z0 · z, где z — корень n‐й степени из 1.
Формула Муавра (Следствие√ 3.6.4) позволяет легко най ти один корень из w. А именно, если
w = r · (cos θ + i sin θ), то z0 = n r · (cos(θ/n) + i sin(θ/n)) при возведении в степень n дает w.
Вычислим теперь корни степени n из единицы. Обозначим множество всех таких корней
µn , то есть µn = {z ∈ C | z n = 1}. Ясно, что это множество состоит из не более чем n
элементов и замкнуто относительно умножения. По сказанному выше там имеется элемент
ξ1 = cos 2π 2π
n + i sin n , а также все его степени:

2πk 2πk
ξk = ξ1k = cos + i sin , k = 1, . . . , n.
n n
Все они различны, так как различаются их аргументы, и потому µn = {1, ξ, ξ 2 , . . . , ξ n−1 }.
Предложение 3.8.1. Корни из 1 степени n обладают следующими свой ствами:
1. Они располагаются в вершинах правильного n‐угольника, вписанного в единичную
окружность таким образом, что одна из вершин совпадает с точкой 1.
2. Если z ∈ µn , то z = z −1 ∈ µn .
3. µn — группа.

54
Ясно, что возможность извлекать квадратные корни из произвольных комплексных чисел
сразу дает возможность решать любые квадратичные уравнения по стандартной формуле.
В дей ствительности имеет место гораздо более общий результат, который мы приведем без
доказательства.
Теорема 3.8.2 (Основная теорема алгебры).
Если f ∈ C[x] и deg(f ) > 1, то существует c ∈ C — корень f .

Следствие 3.8.3. Если f ∈ C[x] и deg(f ) > 1, то f = a · (x − c1 ) · . . . · (x − cn ) для некоторых


a, c1 , . . . , cn ∈ C. Такое разложение единственно (с точностью до перестановки множите‐
лей ). Иными словами, любой многочлен с комплексными коэффициентами раскладывается
на линей ные множители (определенные однозначно с точностью до ассоциированности —
или же все имеющие старшие коэффициенты 1, но появляется дополнительный множитель‐
константа).
Доказательство. По Следствию 3.3.7 из малой теоремы Безу существует разложение f =
(x − c1 ) · . . . · (x − ck ) · h, где h ∈ C[x] не имеет корней . Но по основной теореме алгебры тогда
h ∈ C — константа, а сравнение степеней показывает, что k = n.
Следствие 3.8.4. Если f ∈ R[x] и deg(f ) > 1, то f раскладывается в произведение линей ных
множителей и квадратичных множителей с отрицательным дискриминантом. Такое разло‐
жение единственно (с точностью до перестановки и ассоциированности).
Доказательство. Если рассматривать f ∈ R[x] как многочлен с комплексными коэффици‐
ентами, то f = a · (x − c1 ) · . . . · (x − cn ). Заметим, что все мнимые корни ci встречаются парами
комплексно сопряженных. Дей ствительно, если f = a0 + a1 x + . . . + an xn и все ai ∈ R, то из
равенства 0 = f (c) = a0 +a1 c+. . .+an cn комплексным сопряжением обеих частей получаем,
что 0 = f (c) = f (c). Иными словами, указанное выше разложение для f можно переписать в
виде
f = a · (x − b1 ) · . . . · (x − bk ) · (x − d1 )(x − d1 ) · . . . · (x − dm )(x − dm ),
где bi ∈ R и di ∈ C \ R. Но (x − d)(x − d) = x2 − (d + d)x + dd ∈ R[x]. Дискриминант этого
многочлена равен (d + d)2 − 4dd = (d − d)2 , что является отрицательным вещественным
числом, так как d − d чисто мнимое.
Покажем теперь, как решать кубические уравнения. Оказывается, даже в случае, когда все
корни вещественного многочлена степени 3 являются вещественными, формула для их на‐
хождения использует комплексные числа.
Рассмотрим многочлен f = x3 + ax2 + bx + c ∈ C[x]. Ясно, что достаточно научиться
находить корни многочленов со старшим коэффициентом 1. Сделаем замену x = t − a3 :
 a 3  a 2  a  a2   2a2 ab 
f = t− +a t− + t− + c = t3 + b − t+ − +c .
3 3 3 3 27 3
Если обозначить p = 13 (3b − a2 ) и q = 27
1
(2a2 − 9ab + 27c), то исходное уравнение примет вид
3
t + pt + q = 0 относительно новой переменной t.
Сделаем теперь еще одну замену t = w − 3w p
:
 p 3  p  p3
f = w− +p w− + q = w3 + q − .
3w 3w 27w3

55
p3
Домножение на w3 дает уравнение w6 + qw3 + 27 = 0, или, что то же самое, квадратичное
3
уравнение W + qW − = 0 относительно переменной W = w3 . Корнями этого квадратич‐
2 p
27
ного уравнения являются r
q p3 q2
W1,2 = − ± + .
2 27 4
Если w1 , w2 , w3 — три кубических корня из W , то w1 − 3wp 1 , w2 − 3wp 2 , w3 − 3wp 3 — корни
приведенного кубического уравнения t3 + pt + q = 0.
Заметим, что по формуле Виета W1 W2 = −p −p3
3

27 , так что W2 = 27W и значения выражений


wi − 3wi не зависят от того, являются w1 , w2 , w3 кубическими корнями из W1 или изи W2 .
p

Если известны решения уравнения t3 + pt + q = 0, то легко восстанавливаются решения


исходного уравнения x3 + ax2 + bx + c = 0, а именно x = t − a3 .

3.9 Производная и кратные корни


Пусть R — область целостности.

Определение 3.9.1. Пусть c ∈ R — корень многочлена f ∈ R[x]. Говорят, что c является кор‐
нем кратности m, если f делится на (x − c)m , но не делится на (x − c)m+1 . Корень кратности
1 также иногда называется простым, а кратности > 1 — кратным.
Замечание 3.9.2. Корень c ∈ R многочлена f ∈ R[x] имеет кратность m тогда и только
тогда, когда f = (x − c)m · g, где g ∈ R[x] таков, что g(c) 6= 0.
.
Доказательство. Если c — корень кратности m, то f .. (x − c)m и f = (x − c)m · g для неко‐
торого g. Если g(c) = 0, то g = (x − c) · h для некоторого h, а тогда f = (x − c)m+1 · h, что
противоречит тому, что f не делится на (x − c)m+1 .
Если же имеется разложение f = (x − c)m · g, g(c) 6= 0, то x — корень кратности m. В самом
.
деле, пусть f .. (x − c)m+1 , то есть f = (x − c)m+1 · h для какого‐то h. Но тогда (x − c)m · g =
(x − c)m+1 · h, откуда (x − c)m · (g − (x − c)h) = 0. Так как R — область целостности, то
R[x] тоже область целостности, откуда получаем, что g − (x − c)h = 0, так что g(c) = 0,
противоречие.
Следствие 3.9.3. Многочлен f ∈ R[x] представляется в виде f = (x − c1 )m1 · . . . · (x − ck )mk · g,
где g ∈ R[x] не имеет корней , а c1 , . . . , ck — различные корни f . В частности, сумма кратно‐
стей всех корней многочлена не превосходит его степени.
Обозначение 3.9.4. Пусть R — кольцо с 1. Для n ∈ N будем обозначать через n элемент
кольца R, полученный сложением 1 с собой n раз. При таких обозначениях в кольце Z/mZ
имеет место равенство m = 0. Аналогично, можно обозначить посредством −n число, про‐
тивоположное по сложению элементу n ∈ R, или же сумму −1 с собой n раз. Это позволяет
рассматривать целые числа как элементы кольца (но различным целым числам могут соот‐
ветствовать одинаковые элементы).
Определение 3.9.5. Пусть f = a0 + a1 x + . . . + an xn ∈ R[x]. Производной f называется
многочлен f ′ = a1 + 2a2 x + . . . + nan xn−1 .
Предложение 3.9.6. Пусть f, g ∈ R[x], c ∈ R, m ∈ N. Тогда

1. (f + g)′ = f ′ + g ′ (аддитивность);
2. (cf )′ = cf ′ ;

56
3. (f g)′ = f ′ g + f g ′ (правило Лей бница);
4. (f m )′ = mf m−1 f ′ .
Доказательство. Обозначим f = a0 + a1 x + . . . + an xn , g = b0 + b1 x + . . . + bn xn .
Pn Pn Pn
1. (f + g)′ = k=1 k(ak + bk )xk−1 = k=1 kak xk−1 + k=1 kbk xk−1 = f ′ + g ′ .
Pn Pn
2. (cf )′ = k=1 kcak xk−1 = c k=1 kak xk−1 = cf ′ .
3. Рассмотрим сначала случай , когда f и g — мономы, то есть f = axi и f = bxj . В этом
случае f g = abxi+j и (f g)′ = (i + j)abxi+j−1 . С другой стороны, f ′ g + f g ′ = iaxi−1 · bxj +
axi · jbxj−1 = iabxi+j−1 + jabxi+j−1 = (f g)′ .
Произвольный многочлен можно Pnзаписать в виде суммы мономов: f = f1 + . . . + fn ,
g = g1 + . . . + gn , и тогда f g = i,j=1 fi gj . Воспользуемся уже доказанным свой ством
аддитивности:
X
n X
n X
n X
n
(f g)′ = (fi gj )′ = (fi′ gj + fi gj′ ) = fi′ gj + fi gj′ = f ′ g + f g ′ .
i,j=1 i,j=1 i,j=1 i,j=1

4. Индукция по m. База тривиальна. Если m > 1, то


(f m )′ = (f · f m−1 )′
= f ′ · f m−1 + f · (f m−1 )′
= f m−1 f ′ + f · (m − 1)f m−2 f ′

= f m−1 + f · (m − 1)f m−2 · f ′
= mf m−1 f ′ .

Предложение 3.9.7. Элемент c ∈ R является кратным корнем многочлена f ∈ R[x] тогда и


только тогда, когда f (c) = f ′ (c) = 0.
.
Доказательство. Если c — кратный корень, то f .. (x − c)2 . Раз f = (x − c)2 · g, то f ′ =
 ′
(x − 2)2 g + (x − c)2 g ′ = 2(x − c)g + (x − c)2 g ′ и f ′ (c) = 0.
Если f (c) = f ′ (c) = 0, то f = (x − c)g и f ′ = (x − c)h для каких‐то g, h. При этом f ′ =
(x − c)′ g + (x − c)g ′ = g + (x − c)g ′ , откуда (x − c)(h − g ′ ) = g, то есть f = (x − c)2 (h − g ′ ) и c
— кратный корень.
Предположим теперь, что базовое кольцо K является полем, и кроме того, что Q ⊆ K (то
есть ни одна из сумм 1 + . . . + 1 и ненулевого числа слагаемых не обращается в 0, иными
словами, n 6= 0 как элемент K ни для какого n ∈ N). Примерами таких полей являются Q, R
и C, а поля вычетов Z/pZ — не являются.
Предложение 3.9.8. Пусть f ∈ K[x] и c ∈ K — корень f , m ∈ N. Элемент c является корнем
f кратности m тогда и только тогда, когда c является корнем f ′ кратности m − 1.
Доказательство. Если c — корень f кратности m, то f = (x − c)m · g и g(c) 6= 0. Тогда

f ′ = (x − c)m · g ′ + m(x − c)m−1 g = (x − c) (x − c)g ′ + mg .
Рассмотрим h = (x − c)g ′ + mg. Так как h(c) = mg(c) и m 6= 0, получаем, что h(c) 6= 0. Значит,
c — корень f ′ кратности m − 1.
Если c — корень f ′ кратности m − 1, то обозначим через n кратность c как корня f . Тогда
по уже доказанному кратность c как корня f ′ равна n − 1, то есть n − 1 = m − 1 и n = m.

57
Следствие 3.9.9. Пусть f ∈ K[x], c ∈ K и m > 1. Кратность c как корня f равна m тогда и
только тогда, когда f (c) = f ′ (c) = . . . = f (m−1) (c) = 0 и f (m) (c) 6= 0.
Доказательство. Если c — корень f кратности m, то он является корнем f ′ кратности m − 1,
откуда кратность как корня f (2) равна m − 2, и так далее, вплоть до f (m−1) с кратностью 1, и
f (m) 6= 0.
Пусть теперь f (c) = f ′ (c) = . . . = f (m−1) (c) = 0 и f (m) (c) 6= 0. Воспользуемся индукцией
по m. База m = 1 следует из Предложения 3.9.7. Индукционный переход: у многочлена f ′
первые m − 2 производных имеют в c значение 0, а (f ′ )(m−1) (c) 6= 0, то есть c — корень f ′
кратности m − 1, откуда c — корень f кратности m.
Замечание 3.9.10. Утверждение выше можно распространить и на случай m = 1, если эле‐
менты, не являющиеся корнями, называть «корнями крастности 0».

Отметим еще одно применение производной — формулу Тей лора.


1 (k)
Замечание 3.9.11. Пусть f = a0 + a1 + . . . + an xn . Тогда ak = k! f (0).
Доказательство. Дей ствительно, свободный член многочлена равен его значению в 0, а сво‐
бодный член f (k) равен k! · ak .
Pn f (k) (c)
Предложение 3.9.12 (Формула Тей лора). Если f ∈ F [x] и c ∈ F , то f = k=0 (x − c)k .
k!
Доказательство. Случай c = 0 напрямую следует из предыдущего замечания. Формула для
произвольного c получается заменой x 7→ x − c.

3.10 Интерполяция
Пусть K — поле, x1 , . . . , xn ∈ K попарно различны и y1 , . . . , yn . Задачей интерполяции на‐
зывается проблема отыскания некоторой функции, принимающей в каждой из точек xi зна‐
чение yi . Нас будет интересовать полиномиальная интерполяция, то есть мы будем искать
такую функцию среди многочленов. Более строго, такой типа интерполяции называется по‐
линомиальной интерполяцией с n простыми узлами.
Предложение 3.10.1. Задача полиномиальной интерполяции с n простыми узлами имеет
единственное решение в классе многочленов степени 6 n − 1.
Доказательство. Докажем сперва, что решение, если существует, является единственным.
Пусть f, g ∈ K[x] таковы, что f (xi ) = g(xi ) = yi для всех i = 1, . . . , n и deg(f ), deg(g) 6 n − 1.
Рассмотрим многочлен h = f − g. С одной стороны, deg(h) 6 n − 1, с другой , h(xi ) = 0 для
любого i = 1, . . . , n, так что у него имеется n различных корней . Это означает, что h = 0, а
тогда f = g.
Докажем существование искомого многочлена f при помощи явной конструкции. Дей ‐
ствовать будем аналогично доказательству китай ской теоремы об остатках (Теорема 2.11.1).
А именно, рассмотрим случай , когда y2 = y3 = . . . = yn = 0, а y1 произвольный . Если
.
f1 ∈ K[x] таков, что f1 (xi ) = yi , то f .. (x − x2 ) · . . . · (x − xn ) — это уже многочлен сте‐
пени n − 1. Остается только домножить его на подходящий скаляр, чтобы получить нужное
значение в x1 . Для этого сначала поделим на его значение в x1 , а затем домножим на y1 :

(x − x2 ) · . . . · (x − xn )
f1 = y1 · .
(x1 − x2 ) · . . . · (x1 − xn )

58
Аналогично можно построить многочлены fi , принимающие значение yi в xi и 0 в остальных
узлах интерполяции. Тогда для f = f1 + . . . + fn выполнено: f (xi ) = fi (xi ) = yi . Итого,
искомый интерполяционный многочлен имеет вид
n 
X Y x − xj 
f= yi · .
i=1
xi − xj
j̸=i

Построенный многочлен называется интерполяционным многочленом в форме Лагранжа.


Имеется альтернативный способ построения интерполяционного многочлена, особенно
удобный , когда узлы интерполяции добавляются последовательно. А именно, можно постро‐
ить последовательность таких многочленов f1 , f2 , . . . , fn , что fk решает интерполяционную
задачу для точек x1 , . . . , xk .
В качестве f1 положим многочлен нулевой степени y1 . Если многочлен fk уже построен,
то многочлен fk+1 можно построить в виде fk + c · (x − x1 ) · . . . · (x − xk ) — таким образом
значения в x1 , . . . , xk останутся теми же, а значение в xk+1 можно сделать равным yk+1 по‐
средством выбора параметра c. Подстановка xk+1 в выражение для fk+1 и приравнивание к
yk+1 показывает, что
yk+1 − fk (xk+1 )
c= .
(xk+1 − x1 ) · . . . · (xk+1 − xk )
Многочлен fn , полученный такой процедурой , называется интерполяционным многочленом
в форме Ньютона.
Полиномиальная интерполяция позволяет восстановить многочлен, если известны его
значения в достаточном числе точек. Это можно применить к задаче разделения секрета, ко‐
торая формулируется следующим образом: как разделить между n участниками части неко‐
торого секрета так, чтобы его можно было восстановить только имея все части (более общо,
любые k из n частей для некоторого заранее оговоренного k).

Алгоритм 3.10.2 (Схема разделения секрета по Шамиру).


Предположим, что разделяемый секрет представляет собой натуральное число M .
1. Выберем простое число p > M , которое можно сообщить всем участникам.
2. Выберем случай ным образом многочлен f = ak−1 xk−1 + ak−2 xk−2 + . . . + a1 x + M ∈
Z/pZ. Всем участникам сообщается его степень k − 1.
3. Выберем n различных ненулевых элементов Z/pZ (в предположении, что n < p), на‐
пример, 1, 2, . . . , n. Вычислим значения ki = f (i) ∈ Z/pZ и сообщим i‐му участнику
пару (i, ki ).

4. Для восстановления секрета M теперь необходимо вычислить f (0), что можно сделать,
восстановив многочлен F по любым k его значениям.
При этом знание любых k − 1 из этих значений не дает никакого знания об f (0), так как
возможные значения равномерно распределены в Z/pZ.

3.11 Поле частных


Следующая конструкция позволяет по любой области целостности R построить некоторое
поле, «содержащее» R. В целом эта конструкция аналогична построению поля рациональных
чисел Q по кольцу целых числе Z.

59
Итак, пусть R — область целостности с единицей . Будем полагать, что R 6= {0} и, в част‐
ности, 0 6= 1. Рассмотрим множество R × (R \ {0}) и введем на нем следующее отношение
эквивалентности:
(a, r) ∼ (b, s) ⇐⇒ as = br.
Моральный смысл этого определения состоит в том, что если мы представляем дроби ar и sb
в виде пар (a, r) и (b, s), то равенство дробей ar = sb равносильно, после домножения обеих
частей на rs, равенству as = br.
Лемма 3.11.1. Это отношение эквивалентности.
Доказательство. Рефлексивность очевидна: (a, r) ∼ (a, r) ⇔ ar = ar. Симметричность:
(a, r) ∼ (b, s) ⇔ as = br ⇔ (b, s) = (a, r). Транзитивность: если (a, r) ∼ (b, s) и (b, s) ∼ (c, t), то
as = br и bt = cs, откуда ast = brt и brt = crs. Вычитая, получаем, что 0 = ast−crs = s(at−cr).
Так как R — область целостности, at − cr = 0 и (a, r) ∼ (c, t).

Обозначение 3.11.2. Обозначим Q(R) = R × (R \ {0}) /∼ , а класс пары (a, r) будем обозна‐
чать ar .
Замечание 3.11.3. Для любого s 6= 0 имеется равенство a
r = as
rs .

Определение 3.11.4. Кольцом частных области целостности R будем называть множество


Q(R) вместе с бинарными операциями

a b as + br a b ab
+ = , · = .
r s rs r s rs
Лемма 3.11.5. Введенные операции определены корректно.
a a′ b b′
Доказательство. Требуется проверить, что если r = r′ и s = s′ , то

a b a′ b′ a b a′ b′
+ = ′ + ′, · = ′ · ′.
r s r s r s r s
Условия означают, что ar′ = a′ r и bs′ = b′ s. Выпишем
a b as + br a′ b′ a′ s′ + b′ r′
+ = и ′
+ ′ = .
r s rs r s r′ s′
Проверим, что пары, отвечающие дробям в правых частях, эквивалентны:

(as + br) · r′ s′ = ar′ ss′ + brr′ s′ = a′ rss′ + b′ rr′ s = (a′ s′ + b′ r′ ) · rs.

Аналогично для произведения:

a b ab a′ b′ a′ b′
· = и · = .
r s rs r′ s′ r′ s′
Равенство правых частей имеет место, так как abr′ s′ = a′ b′ rs.
Лемма 3.11.6. Q(R) относительно введенных операций образует кольцо.
Доказательство. Ассоциативность сложения:
   
a b c as + br c ast + brt + crs a b c a bt + cs ast + brt + crs
+ + = + = , + + = + = .
r s t rs t rst r s t r st rst

60
Коммутативность сразу следует из определения:

a b as + br br + as b a
+ = = = + .
r s rs sr s r
В качестве ней трального по сложению выступает 01 :

a 0 a·1+0·r a
+ = = .
r 1 r·1 r
Заметим, кроме того, что 01 = 0r для любого r ∈ R \ {0}.
−a
Противоположный к ar по сложению вычисляется как r :

a −a ar − ar 0 0
+ = 2
= 2 = .
r r r r 1
Ассоциативность умножения:
   
a b c ab c abc a bc a b c
· · = · = = · = · · .
r s t rs t rst r st r s t

Коммутативность умножения очевидна. В качестве ней трального элемента относительно


умножения выступает 11 (равный rr для любого r ∈ R \ {0}).
Дистрибутивность:
 
a b c as + br c acs + bcr acst + bcrt ac bc a c b c
+ · = · = = = + = · + · .
r s t rs t rst rst2 rs st r s s t

Предложение 3.11.7. Q(r) является полем.

r 6= 0. Так как в таком случае a 6= 0, то можно рассмотреть элемент


a
Доказательство. Пусть
a ∈ Q(R), а тогда r · a = ra = 1 . При этом 1 6= 1 , так как их равенство означало бы, что 0 = 1
r a r ar 1 0 1

в кольце R.
Элементы исходного кольца R можно отождествить с элементами Q(R) посредством отоб‐
ражения a 7→ a1 . При этом различные элементы переходят в раздичные элементы (так как
a b
1 = 1 влечет a = b), а сложение и умножение таких дробей происходит так же, как и у исход‐
ных элементов:
a b a+b a b ab
+ = и · = .
1 1 1 1 1 1
Пример 3.11.8. Q(Z) = Q.

3.12 Рациональные функции


Как мы уже выяснили, для области целостности R (например, для поля) кольцо многочле‐
нов R[x] тоже является областью целостности, так что можно рассмотреть соответствующее
поле частных.
Определение 3.12.1. Полем рациональных функций над полем F называется поле F (x) =
Q(F [x]). Иными словами,  
f
F (x) = | f, g ∈ F [x], g 6= 0 .
g

61
f
Хотя мы и используем слово «функция», значение такой дроби (понимаемое как g (c) =
f (c)
g(c) )
определено не во всех точках c (с этим мы уже встречались при рассмотрении дробно‐
линей ных функций ). Более того, так как существуют ненулевые многочлены, принимающие
нулевые значения во всех точках, существуют и рациональные функции, значение которых
не определено ни в одной точкой , например, xp1−x ∈ (Z/pZ)(x).
Еще одно препятствие состоит в том, что подобная попытка определить значение рацио‐
нальной зависит от выбора представителя — домножение числителя и знаменателя на мно‐
гочлен f удаляет из области определения корни f . Это можно было бы обой ти, выделяя в
каждом классе дробей представителя, имеющего взаимно простые числитель и знамена‐
тель (тогда область определения максимальна), либо, как делают в анализе, определеить
значение как предел в тех точках, где он конечен (так мы поступали с дробно‐линей ными
преобразованиями, но над произвольным полем такой подход недоступен).
Определение 3.12.2. Рациональная функция f
g ∈ F (x) называется правильной (дробью),
если deg(f ) < deg(g).
Замечание 3.12.3. Это определение не зависит от выбора представителей , то есть если gf11 =
f2
g2 и deg(f1 ) < deg(g1 ), то deg(f2 ) < deg(g2 ).

Доказательство. Если gf11 = gf22 , то f1 g2 = f2 g1 , а тогда deg(f1 g2 ) = deg(f2 g1 ), то есть deg(f1 )+


deg(g2 ) = deg(f2 ) + deg(g1 ) или deg(g2 ) − deg(f2 ) = deg(g1 ) − deg(f1 ) > 0
Предложение 3.12.4. Сумма, разность и произведение правильных дробей — правильные
дроби.
Доказательство. Пусть gf11 и gf22 — правильные дроби, тогда deg(f1 ) < deg(g1 ) и deg(f2 ) <
deg(g2 ). Рассмотрим числитель и знаменатель их суммы: f1 g2 + f2 g1 и g1 g2 . Тогда для их сте‐
пеней имеет место неравенство

deg(f1 g2 + f2 g1 ) 6 max deg(f1 g2 ), deg(f2 g1 ) =

= max deg(f1 ) + deg(g2 ), deg(f2 ) + deg(g1 ) < deg(g1 ) + deg(g2 ) = deg(g1 g2 ).

Для разности и произведения аналогично.


Замечание 3.12.5. Среди многочленов только нулевой является правильной дробью.
Доказательство. Пусть f ∈ F [x]. Так как f = f1 и правильность дроби не зависит от выбора
представителей , дробь f1 правильная тогда и только тогда, когда deg(f ) < deg(1) = 0, то есть
deg(f ) = −∞ и f = 0.
Предложение 3.12.6. Для любой рациональной функции fg ∈ F (x) существует единствен‐
ное представление в виде h + rs , где h ∈ F [x], а rs — правильная дробь. Кроме того, можно
выбрать s = g.
Доказательство. Поделим f на g с остатком: f = qg+r, где deg(r) < deg(g). Тогда fg = qg+r g =
qg r q r
g + g = 1 + g . Положим h = q, r = r и s = g.
Докажем единственность. Если h1 + sr11 = h2 + sr22 — два таких представления, то h1 − h2 =
s2 − s1 . В левой части стоит многочлен, а в правой правильная дробь, так что обе части равны
r2 r1

0.
Определение 3.12.7. Многочлен называется неприводимым, если его нельзя представить в
виде произведения двух многочленов меньших степеней .

62
Пример 3.12.8. Как мы уже видели, в C[x] неприводимыми являются только линей ные мно‐
гочлены, а в R[x] линей ные и квадратичные с отрицательным дискриминантом.
Отметим следующие свой ства многочленов, аналогичные свой ствам целых чисел.
Предложение 3.12.9. 1. Если f ⊥ g, то существуют такие u, v, что f u + gv = 1.
2. Для любого f ∈ F [x] существуют такие неприводимые многочлены f1 , . . . , fk , что f =
f1 · . . . · fk . Эти множители определены однозначно с точностью до перестановки и
ассоциированности.
Определение 3.12.10. Рациональная функция называется простейшей, если ее можно пред‐
ставить в виде pfm , где f, p ∈ F [x], p неприводимый , deg(f ) < deg(p), m ∈ N.
Лемма 3.12.11. Пусть f
gh ∈ F (x) — правильная дробь, причем g ⊥ h. Тогда существует пред‐
f a b
ставление gh = g + h в виде суммы двух правильных дробей .
Доказательство. Раз g ⊥ h, то существуют такие u, v, что gu + hv = 1. Тогда f = g · f u +
h · f v, откуда gh
f
= gf u+hf
gh
v
= fhu + fgv . Каждое из этих слагаемых представляется в виде
f
суммы многочлена и правильной дроби, итого gh = c+ ag + hb . Так как исходная рациональная
функция является правильной дробью, получаем c = 0.
f
Лемма 3.12.12. Правильную дробь вида pm можно представить в виде суммы
f a1 a2 am
m
= + 2 + ... + m,
p p p p
где ai ∈ F [x] и deg(ai ) < deg(p).
Доказательство. Индукция по m. База тривиальна. При m > 1 поделим с остатком f = pq+r,
deg(r) < deg(p). Тогда
f pq + r pq r q r
m
= m
= m + m = m−1 + m ,
p p p p p p
и к первому слагаемому можно применить индукционное предположение.
Теорема 3.12.13. Пусть f
g ∈ F (x) — правильная дробь, g = pm
1 · . . . · pk — разложение на
1 mk

неприводимые (pi ⊥ pj при i 6= j). Тогда fg представляется в виде суммы простей ших дробей ,
mk
в знаменателях которых стоят p1 , p21 , . . . , pm
1 , p 2 , . . . , pk .
1

Доказательство. Последовательно применяя Лемму 3.12.11, получаем сначала разложение


f f1 fk
= m1 + . . . + mk ,
g p1 pk
fi
а затем каждое из слагаемых m
pi i
с помощью Леммы 3.12.12 переписываем в виде суммы
простей ших со знаменателями pi , . . . , pm
i .
i

Замечание 3.12.14. В дей ствительности такое разложение единственно с точностью до пе‐


рестановки.
Следствие 3.12.15.
1. Правильная дробь из C(x) представляется в виде суммы дробей вида a
(x−c)m , где a, c ∈
C и m ∈ N.
2. Правильная дробь из R(x) представляется в виде суммы дробей вида a
(x−c)m , где a, c ∈
R и m ∈ N, и дробей вида (x2 +cx+d)
ax+b
m , где a, b, c, d ∈ R, c < 4d и m ∈ N.
2

63
4 Основы линейной алгебры
4.1 Векторные пространства и базисы
Мы уже видели, как абстрактные понятия вроде группы, кольца и поля позволяют рассмат‐
ривать на первый взгляд совершенно различные структуры единообразно, выделяя самые
существенные их свой ства. Базовой структурой в линей ной алгебре является векторное про‐
странство — понятие, реализующее основные свой ства множества всех векторов в евклидо‐
вом пространстве.
Определение 4.1.1. Пусть F — поле. Множество V вместе с бинарной операцией + : V ×
V → V и операцией · : F × V → V называется векторным пространством над полем F , если
выполнены следующие свой ства:
1. (V, +) является абелевой группой ;
2. для любых u, v ∈ V и λ, µ ∈ F верны равенства
a) λ · (u + v) = (λ · u) + (λ · v),
b) (λ + µ) · v = (λ · v) + (µ · v),
c) λ · (µ · v) = (λµ) · v,
d) 1 · v = v.
Элементы V называются векторами, а элементы базового поля F называются скалярами.
Операции на V называются векторным сложением и умножением на скаляр.
Примеры 4.1.2.
1. Множество всех векторов евклидова пространства (для простоты можно рассматри‐
вать случай плоскости), имеющих началом некоторую фиксированную точку O, отно‐
сительно сложения по правилу параллелограма и растяжений относительно точки O в
качестве домножения на вещественные скаляры.
u+v

λv
u
v

2. Декартова степень базового поля F n вместе с покомпонентными операциями сложе‐


ния и умножения на скаляр — векторное пространство над F . По причинам, которые
будут прояснены позже, мы будем записывать элементы F n в виде столбцов, а само F n
называть пространством столбцов.
3. Комплексные числа C — векторное пространство над R.
4. Многочлены F [x] — векторное пространство над F . Также можно рассматривать мно‐
жество всех многочленов степени не выше данной :
F [x]6d = {f ∈ F [x] | deg(f ) 6 d}.
Дей ствительно, при домножении на скаляр степень многочлена сохраняется, а при сум‐
мировании многочленов не повышается.

64
5. Рациональные функции над данным полем F , а также множество всех правильных дро‐
бей .
6. Для данного множества A множество всех его подмножеств 2A — векторное простран‐
ство над Z/2Z относительно симметрической разности в качестве сложения и есте‐
ственным образом определенного умножения на скаляр: 1 · X = X, 0 · X = ∅.
Замечание 4.1.3. Отметим некоторые очевидные следствия из определения векторного
пространства.
1. В V имеется ней тральный элемент относительно сложения, который мы будем обо‐
значать 0 (от нулевого элемента базового поля отличается по контексту).
2. λ · 0 = 0 для любого λ ∈ F .
3. 0 · v = 0 для любого v ∈ V .
4. −v = (−1) · v.
В примерах выше каждый элемент векторного пространства однозначно задавался неко‐
торым набором «параметров», имеющим для всех векторов одинаковый размер:
• для векторов на евклидовой плоскости это координаты концов векторов (в некоторой
фиксированной декартовой системе координат);
• для векторов F n это компоненты кортежа;
• для комплексных чисел это вещественная и мнимая часть;
• для многочленов — их коэффициенты;
• для подмножеств данного множества — значения характеристической функции.
В каждом случае эти параметры являются независимыми, причем сумме векторов отвечают
суммы параметров. Для формализации этого наблюдения используется понятие базиса.
Определение 4.1.4. Набор векторов v1 , . . . , vn ∈ V называется линейной независимым, если
для любых λ1 , . . . , λn ∈ F из равенства λ1 v1 + . . . + λn vn = 0 следует, что λ1 = . . . = λn = 0.
В противном случае набор v1 , . . . , vn называется линей но зависимым, а соотношение λ1 v1 +
. . . + λn vn = 0, где не все λi нулевые, — линей ной зависимостью.
Замечание 4.1.5. Набор векторов v1 , . . . , vn линей но независим тогда и только тогда, когда
никакой из этих векторов нельзя представить в виде линей ной комбинации остальных.
Доказательство. Пусть v1 = µ2 v2 + . . . + µn vn . Тогда (−1)v1 + µ2 v2 + . . . + µn vn = 0 — нетри‐
виальная линей ная комбинация, обращающаяся в ноль, и набор v1 , . . . , vn линей но зависим.
Если же λ1 v1 + λn vn = 0 — нетривиальная линей ная зависимость, то один из коэффици‐
ентов, скажем, λ1 , не равен 0, и тогда v1 = µ2 v2 + . . . + µn vn , где µi = −λ
λ1 .
i

Замечание 4.1.6. В линей но независимом наборе векторов нет нулевого вектора.


Замечание 4.1.7. Любой поднабор линей но независимого набора векторов тоже линей но
независим.
Пример 4.1.8. Набор, состоящий из одного ненулевого вектора, линей но независим.
Дей ствительно, если v 6= 0 и λv = 0 при λ 6= 0, то 0 = λ−1 · (λv) = (λ−1 λ) · v = 1 · v = v.

65
Пример 4.1.9. Рассмотрим пространство V = F n и следующий набор вектором в нем:
       
v1,1 v2,1 vk,1 vn,1
 0  v2,2   .   
     ..   
   0     
    vk,k  .
v1 =  .  , v 2 =  .  , . . . , v k =   , . . . , vn =  . 
 .
,
 ..   ..   0   
       
     .   
 .. 
0 0 0 vn,n

и предположим, что vi,i 6= 0.


Набор v1 , . . . , vn является линей но независимым. В самом деле, пусть λ1 , . . . , λn ∈ F та‐
ковы, что v = λ1 v1 + . . . + λn vn = 0. Тогда в последней строке v стоит λn vn,n . Так как эта
величина должна быть равна 0, а vn,n 6= 0, получаем, что λn = 0, так что линей ная зависи‐
мость имеет меньшую длину, и можно рассмотреть ту же задачу для меньшего n. Повторяя
это рассуждение, получаем, что λ1 = . . . = λn = 0.

Определение 4.1.10. Набор v1 , . . . , vn ∈ V называется порождающим, если для любого v ∈


V существует такой набор коэффициентов λ1 , . . . , λn ∈ F , что v = λ1 v1 + . . . + λn vn .
Обозначение 4.1.11. hv1 , . . . , vn i = {λ1 v1 + . . . + λn vn | λ1 , . . . , λn ∈ F } — множество всевоз‐
можных линей ных комбинаций векторов v1 , . . . , vn .

При таком обозначении можно сказать, что набор v1 , . . . , vn является порождающим, если
hv1 , . . . , vn i = V .
Определение 4.1.12. Линей но независимый порождающий набор называется базисом.
Примеры 4.1.13.

1. 1, i — базис C как векторного пространства над R;


2. 1, x, x2 , . . . , xd — базис F [x]6d ;
3. {a}, a ∈ A — базис 2A .
Теорема 4.1.14. Пусть v1 , . . . , vn ∈ V . Следующие определения базиса эквивалентны:

1. v1 , . . . , vn — линей но независимый порождающий набор.


2. v1 , . . . , vn — максимальный по включению линей но независимый набор.
3. v1 , . . . , vn — минимальный по включению порождающий набор.

4. Для любого v ∈ V существует единственный такой набор коэффициентов λ1 , . . . , λn ,


что v = λ1 v1 + . . . + λn vn
Доказательство. (1) ⇒ (3): Предположим, что линей но независимый порождающий набор
v1 , . . . , vn не является минимальным порождающим, то есть все векторы пространства V
представляются в виде линей ных комбинаций какого‐то поднабора. Без ограничения общ‐
ности можно считать, что этот поднабор равен v2 , . . . , vn . Но тогда v1 тоже выражается в виде
линей ной комбинации векторов v2 , . . . , vn , что противоречит альтернативному определе‐
нию линей ной независимости, обеспеченному Замечанием 4.1.5.

66
(3) ⇒ (4): Так как набор порождающий , утверждение о существовании выполнено. Пред‐
положим, что у какого‐то вектора v существует два различных представления в виде линей ‐
ной комбинации:
v = λ1 v1 + . . . + λn vn = µ1 v1 + . . . + µn vn .
Если λi 6= µi , то (λ1 − µ1 )v1 + . . . + (λn − µn )vn = 0 — нетривиальная линей ная комбинация,
так что снова по Замечанию 4.1.5 вектор vi представляется в виде линей ной комбинации
остальных векторов набора, а тогда исходный набор не является минимальным порождаю‐
щим.
(4) ⇒ (2): Поскольку у вектора 0 существует только одно представление в виде линей ной
комбинации v1 , . . . , vn , а именно 0 = 0·v1 +. . .+0·vn , то этот набор линей но независим. Пред‐
положим, что он не является максимальным по включению среди линей но независимых.
Это значит, что существует такой вектор u ∈ V , что набор v1 , . . . , vn , u линей ное независим.
Но вектор u представляется в виде линей ной комбинации v1 , . . . , vn , так что этот набор не
можкт быть линей ной независим.
(2) ⇒ (1): Если набор v1 , . . . , vn является максимальным линей ной независимым, то для
любого u ∈ V набор v1 , . . . , vn , u является линей но зависимым, то есть существуют такие
коэффициенты µ1 . . . , µn , ν ∈ F , что µ1 v1 + . . . + µn vn + νu = 0. Заметим, что ν 6= 0 — в
противном случае получалась бы нетривиальная линей ная зависимость между векторами
v1 , . . . , vn . Но тогда u = λ1 v1 + . . . + λn vn для λi = −µ
ν , и набор v1 , . . . , vn порождающий .
i

Лемма 4.1.15. Пусть v1 , . . . , vn — порождающий набор. Если v1 представляется в виде ли‐


ней ной комбинации векторов v2 , . . . , vn , то v2 , . . . , vn — порождающий набор.
Доказательство. По условию существуют такие коэффициенты λ2 , . . . , λn ∈ F , что

v1 = λ 2 v2 + . . . λ n vn .

Пусть v ∈ V — произвольный вектор. Он представляется в виде

v = µ 1 v1 + µ 2 v2 + . . . + µ n vn

для каких‐то коэффициентов µi . Подставляя сюда выражение для v1 , получаем

v = (µ2 + µ1 λ2 )v2 + . . . + (µn + µ1 λn )vn ,

то есть всякий вектор v выражается в виде линей ной комбинации v2 , . . . , vn .


Предложение 4.1.16. Пусть в векторном пространстве V существует конечный порождаю‐
щий набор. Тогда в этом наборе най дется поднабор, являющий ся базисом V .
Доказательство. Для начала заметим, что из любого порождающего набора можно удалить
все нулевые векторы, и набор останется порождающим.
Если порождающий набор v1 , . . . , vn , состоящий из ненулевых векторов, не является ли‐
ней но независимым, то один из векторов vi выражается в виде линей ной комбинации осталь‐
ных, скажем, v1 . Тогда набор v2 , . . . , vn являются порождающим набором меньшего размера,
к которому можно применить то же рассуждение — тогда в какой ‐то момент будет получен
порождающий поднабор, являющий ся линей но независимым (каждый раз размер набора
уменьшается на 1, а набор из одного ненулевого вектора линей но независим).
Определение 4.1.17. Векторное пространство называется конечномерным, если в нем су‐
ществует конечный порождающий набор. Эквивалентно, пространство конечномерно, если
в нем существует конечный базис.

67
Предложение 4.1.18. В конечномерном векторном пространстве любой линей но независи‐
мый набор можно дополнить до базиса.
Доказательство. Пусть v1 , . . . , vm — линей но независимый набор. Поскольку пространство
конечномерно, существует порождающий набор u1 , . . . , un . Если набор vi не является порож‐
дающим, то какой ‐то из uj не представляется в виде линей ной комбинации vi — скажем,
u1 . Тогда v1 , . . . , vm , u1 снова линей но независимый , и к нему можно применить то же рас‐
суждение. В какой ‐то момент не останется векторов uj , не представимых в виде линей ных
комбинаций vi — в таком случае набор vi является порождающим. Поскольку на предыду‐
щем шаге он еще не был порождающим, он является минимальным порождающим, то есть
базисом.
Лемма 4.1.19 (Лемма Штей ница о замене). Пусть u1 , . . . , um — линей но независимый набор,
а v1 , . . . , vn — порождающий набор. Тогда m 6 n и набор u1 , . . . , um , vm+1 , . . . , vn порождаю‐
щий , возможно, после некоторой перенумерации набора vi .
Доказательство. Докажем индукцией по k = 0, . . . , m, что утверждение верно для поднабо‐
ра u1 , . . . , uk . В качестве базы рассмотрим случай k = 0, в котором нечего доказывать.
Предположим теперь, что утверждение уже доказано для некоторого k < m. По индукци‐
онному предположению набор u1 , . . . , uk , vk+1 , . . . , vn является порождающим, так что най ‐
дутся такие коэффициенты λ1 , . . . , λn ∈ F , что
uk+1 = λ1 u1 + . . . + λk uk + λk+1 vk+1 + . . . + λn vn .
Хотя бы один из коэффициентов λk+1 , . . . , λn должен быть ненулевым, иначе выражение вы‐
ше дает нетривиальную линей ную зависимость между векторами u1 , . . . , uk+1 . В частности,
отсюда k + 1 6 n. Переупорядочивая, если необходимо, векторы vk+1 , . . . , vn , можем считать,
что λk+1 6= 0, а тогда
1 
vk+1 = uk+1 − λ1 u1 − . . . − λk uk − λk+1 vk+2 − . . . − λn vn .
λk+1
Значит, набор u1 , . . . , uk+1 , vk+2 , . . . , vn — порождающий .
Утверждение леммы это в точности случай k = m.
Предложение 4.1.20. Если V — конечномерное векторное пространство, то во всех его ба‐
зисах одинаковое количество элементов.
Доказательство. Пусть имеются два базиса размеров m и n соответственно. Так как первый
из них является линей но независимым набором векторов, а второй порождающим набором,
m 6 n. Аналогично, n 6 m. Значит, m = n.
Определение 4.1.21. Размерностью векторного пространства V называется количество эле‐
ментов в каком‐нибудь (любом) его базисе. Обозначение: dim(V ) = n, если существует базис
из n элементов, и dim(V ) = ∞, если V не является конечномерным.
Последнее из четырех эквивалентных определений базиса показывает, что любое конеч‐
номерное пространство можно отождествить с пространством столбцов однозначно опреде‐
ленной высоты. А именно, если e1 , . . . , en — базис V , то для каждого вектора v ∈ V существу‐
ют такие однозначно определенные коэффициенты λ1 , . . . , λn ∈ F , что v = λ1 v1 + . . . + λn vn .
Кортеж из этих коэффициентов (λ1 , . . . , λn ), рассматриваемый как элемент пространства
столбцов F n , называется столбцов координат вектора v в базисе e и обозначается ve . Тем
самым задано отображение
v 7→ ve : V → F n .

68
Отметим, что в силу единственности набора λi это отображение инъективно, при этом легко
предъявить для любого столбца вектор, имеющий этот столбец в качестве столюца коорди‐
нат. В дей ствительно таким образом задается обратное отображение

(λ1 , . . . , λn ) 7→ λ1 v1 + . . . + λn vn : F n → V.

Сопоставление v 7→ ve не только позволяет записывать каждый вектор в виде набора ска‐


ляров, но и сохраняет операции, заданные на пространстве V . А именно, легко проверить,
что для любых двух векторов u, v ∈ V и для любого скаляра λ ∈ F имеют место равенства
(u + v)e = ue + ve и (λv)e = λ · ve .
При таком сопоставлении (ei )e = (0, . . . , 0, 1, 0, . . . , 0), где 1 стоит на i‐й позиции.

4.2 Подпространства и фактор‐пространства


Определение 4.2.1. Подмножество U ⊆ V векторного пространства V над полем F назы‐
вается подпространством (обозначается U 6 V ), если оно является векторным простран‐
ством относительно тех же операций . Иными словами, U ⊆ V является подпространством,
если U 6= ∅ и для любых u, v ∈ U и λ, µ ∈ F обязательно λu + µv ∈ U .

Замечание 4.2.2. Условие U 6= ∅ гарантирует, что в U имеется хотя бы один элемент v, а


тогда там же лежит и вектор 1 · v + (−1) · v = 0. Существование в U вектора, обратного к v по
сложению, обеспечивается равенство −v = 0 + (−1) · v.
Примеры 4.2.3.

1. В любом векторном пространстве V подпространствами являются само V и {0}. По‐


следнее, допуская вольность речи, также обозначают 0.
2. R 6 C как векторного пространства над R (более общо, zR 6 C).
3. Если c 6 d, то F [x]6c 6 F [x]6d .

4. Если B ⊆ A, то 2B ⊆ 2A .
Замечание 4.2.4. Если {Ui }i∈I — семей ство подпространств V , то U = ∩i∈I Ui 6 V .
Доказательство. Если u, v ∈ U , λ, µ ∈ F , то, так как u, v ∈ Ui для каждого i ∈ I, то λu + µv ∈
Ui для всех i, а тогда λu + µv ∈ U . Так как 0 ∈ Ui для всех i, также 0 ∈ U и U 6= ∅.

Мы уже встречались со множеством всех линей ных комбинаций hv1 , . . . , vn i. Оказывается,


это тоже подпространство. Более общо,
Определение 4.2.5. Пусть X ⊆ V . Тогда подпространством, порожденным X, называется
\
hXi = U.
U 6V
X⊆U

Предложение 4.2.6. hXi = {λ1 v1 + . . . + λn vn | n ∈ N, v1 , . . . , vn ∈ X, λ1 , . . . , λn ∈ F }.

Доказательство. Обозначим множество в правой части через W . Ясно, что если v1 , . . . , vn ∈


X и λ1 , . . . , λn ∈ F , то λ1 v1 +. . .+λn vn ∈ U для любого подпространства U 6 V , содержащего

69
X, так что W ⊆ hXi. Обратно, заметим, что W является подпространством V . Дей ствитель‐
но, если u = λ1 u1 + . . . + λn un ∈ W и v = µ1 v1 + . . . + µm vm ∈ W (где ui , vj ∈ X), то для
любых λ, µ ∈ F линей ная комбинация

λu + µv = (λλ1 )u1 + . . . + (λλn )un + (µµ1 )v1 + . . . + (µµm )vm ∈ W.

При этом ясно, что X ⊆ W , так что W является одним из пересекаемых подпространств в
определении hXi, откуда hXi ⊆ W .
Предложение 4.2.7. Если V конечномерно и U 6 V , то U тоже конечномерно и dim(U ) 6
dim(V ).
Доказательство. Если u1 , . . . , um — линей но независимый набор векторов U , то он продол‐
жается до некоторого базиса пространства V , и поэтому m 6 dim(V ). Значит, U конечно‐
мерно, а тогда оценка на размер всех линей но независимых наборов дает оценку на размер
максимального, то есть dim(U ) 6 dim(V ).
Предложение 4.2.8. Если U 6 V и dim(U ) = dim(V ) < ∞, то U = V .
Доказательство. Если u1 , . . . , un — базис U , то он является также и базисом V (иначе его
можно было бы продолжить до базиса V , и получился бы базис V размера большего, чем
dim(V )). Но так как hu1 , . . . , un i = U , то U = V .
Пересечение подпространсв является подпространством, а вот объединение обычно под‐
пространством не является (простей ший пример — пара прямых на плоскости). Для подпро‐
странств операцией , двой ственной пересечению, является сумма.
P
Определение 4.2.9. Если {Ui }i∈I — семей ство подпространств V , то i∈I Ui = h∪i∈I Ui i.
Иными словами X
Ui = {u1 + . . . + un | n ∈ N, uk ∈ Uik }.
i∈I

Наиболее важен случай |I| < ∞. Тогда можно определить напрямую

U1 + . . . + Un = {u1 + . . . + un | ui ∈ Ui }.

Легко проверить, что сумма подпространств является подпространством.

Теорема 4.2.10. Если U, V — подпространства некоторого объемлющего векторного про‐


странства, то
dim(U + V ) + dim(U ∩ V ) = dim(U ) + dim(V ).
Доказательство. Выберем базис w1 , . . . , wm подпространства U ∩ V . Его можно дополнить
векторами u1 , . . . , un до базиса U и векторами v1 , . . . , vk до базиса V . В частности, при таких
обозначения dim(U ) = m + n и dim(V ) = m + k. При этом объединенный набор

w1 , . . . , w m , u 1 , . . . , u n , v 1 , . . . , v k

является порождающим для U +V (любой элемент U +V является суммой u+v для каких‐то
u ∈ U и v ∈ V , которые оба выражаются через этот набор).
Покажем, что этот набор является линей но независимым. Предположим, что

λw1 + . . . + λm wm + µ1 u1 + . . . + µn un + η1 v1 + . . . + ηk vk = 0.

70
Тогда X X
η1 v1 + . . . + ηk vk = − λi wi − µi ui .
Заметим, что левая часть является элементом V , а права элементом U . Тогдв обе они лежат
в U ∩ V , в частности,
η1 v1 + . . . + ηk vk = θ1 w1 + . . . + θm wm
для каких‐то коэффициентов θi . Но тогда
X X
θ1 w1 + . . . + θm wm = − λi wi − µi ui

— линей ная зависимость на линей но независимый набор векторов w1 , . . . , wm , u1 , . . . , un .


Она должна быть тривиальной , так что, в частности, µ1 = . . . = µn = 0. Но тогда пред‐
положение о линей ной зависимости набора w1 , . . . , wm , u1 , . . . , un , v1 , . . . , vk превращается в
утверждение о линей ной зависимости набор w1 , . . . , wm , v1 , . . . , vk , противоречие.
Суммируя размеры базисов — (m + n + k) + m и (m + n) + (m + k) — получаем утверждение
теоремы.
Замечание 4.2.11. Наивное обобщение этого утверждения на сумму большего количества
пространств неверно. А именно, в общем случае

dim(U + V + W ) 6= dim(U ) + dim(V ) + dim(W )


− dim(U ∩ V ) − dim(U ∩ W ) − dim(V ∩ W )
+ dim(U ∩ V ∩ W ).

Простей ший пример — три прямых на плоскости.


Определение 4.2.12. Сумма подпространств U1 +. . .+Un называется прямой (обозначается
U1 ⊕ . . . ⊕ Un ), если для любых u1 ∈ U1 , . . . , un ∈ Un равенство u1 + . . . + un = 0 влечет
u1 = . . . = un = 0.
Предложение 4.2.13. Пусть V = U1 + . . . + Un . Следующие утверждения эквивалентны:
1. V = U1 ⊕ . . . ⊕ Un ;
2. Для любого v ∈ V существуют единственные такие u1 ∈ U1 , . . . , un ∈ Un , что v =
u1 + . . . + un ;
P 
3. Ui ∩ j̸=i Uj = 0 для любого i.

Доказательство. (1) ⇒ (2): Пусть v = u1 + . . . + un = u′1 + . . . + u′n — два таких разложения.


Но тогда (u1 − u′1 ) + . . . + (un − u′n ) = 0, причем ui − u′i ∈ Ui , так что все разности равны 0.
(2) ⇒ (3): Для упрощения обозначений будем считать, что i = 1. Предположим, что на‐
шелся ненулевой вектор u ∈ U1 ∩ (U2 + . . . + Un ). Но тогда для u существуют два различных
разложения в суммы элементов U1 , . . . , Un :

u = u + 0 + . . . + 0, u = 0 + u2 + . . . + un .

(3) ⇒ (1): Предположим, что нашлись такие u1 ∈ U1 , . . . , un ∈ Un , не все нулевые (скажем,


6 0), что u1 + . . . + un = 0. Тогда u1 = −u2 − . . . − un ∈ U2 + . . . + Un .
u1 =
Следствие 4.2.14. V = U1 ⊕ U2 ⇔ V = U1 + U2 и U1 ∩ U2 = 0.

71
Следствие 4.2.15. Если V = U1 + . . . + Un и dim(V ) = dim(U1 ) + . . . + dim(Un ), то сумма
прямая.
Доказательство. В случае n = 2 это прямо следует из Теоремы 4.2.10. В общем случае это
легко доказывается индукцией , так как U1 + . . . + Un = U1 + (U2 + . . . + Un ).
С каждой парой (V, U ) из векторного пространства V и подпространства U 6 V связано
еще одно важное векторное пространство, элементами которого являются параллельные
сдвиги U .
Определение 4.2.16. Пусть U 6 V . Рассмотрим следующее отношение эквивалентности на
V:
u ∼ v ⇔ u − v ∈ U.
Тогда фактор‐множество V /∼ относительно операций

[u] + [v] = [u + v], λ · [u] = [λu]

называется фактор‐пространством V по U и обозначается V /U .


Предложение 4.2.17. Фактор‐пространство определено корректно и является векторным
пространством.
Доказательство. Начнем с проверки того, что ∼ является отношением эквивалентности.
Рефлексивность: u − u = 0 ∈ U , так что u ∼ u. Симметричность: если u − v ∈ U , то v − u =
−(u − v) ∈ U . Транзитивность: если u − v ∈ U и v − w ∈ U , то u − w = (u − v) + (v − w) ∈ U .
Далее проверим корректность операций на V /∼. Дей ствительно, если u1 ∼ u2 и v1 ∼ v2 ,
то u1 = u2 + u и v1 = v2 + v для некоторых u, v ∈ V . Но тогда u1 + v1 = (u2 + v2 ) + (u + v),
то есть (u1 + v1 ) − (u2 + v2 ) ∈ U и u1 + v1 ∼ u2 + v2 . Аналогично для умножения на скаляр:
λu1 = λu2 + λu, а тогда λu1 ∼ λu2 .
Все свой ства в определении векторного пространства наследуются со свой ств V .
Элементами фактор‐пространства V /U являются аффинные подпространства, параллель‐
ные U , то есть подмножества вида v + U = {v + u | u ∈ U }. В частности, нулем пространства
V /U служит U .
Предложение 4.2.18. dim(V /U ) = dim(V ) − dim(U ).

Доказательство. Пусть u1 , . . . , um — базис U . Дополним его векторами vm+1 , . . . , vn до ба‐


зиса V , тогда набор векторов
vm+1 + U, . . . , vn + U
является порождающим для V /U (так как если v = λ1 u1 + . . . + λm um + λm+1 vm+1 , . . . + λn vn ,
то v + U = λm+1 vm+1 + . . . + λn vn + U ). С другой стороны, этот же набор является линей но
независимым. Дей ствительно, если µm+1 vm+1 + . . . + µn vn + U = U , то µm+1 vm+1 + . . . +
µn vn является элементом U , а тогда выражается в виде линей ной комбинации u1 , . . . , um ,
что противоречит выбору vi .

4.3 Линейные отображения и матрицы


Определение 4.3.1. Пусть U и V — векторные пространства над полем F . Отображение
φ : U → V называется линейным, если для любых u, v ∈ U и λ, µ ∈ F имеется равенство
φ(λu + µv) = λφ(u) + µφ(v).

72
Примеры 4.3.2.
1. Если V — евклидово пространство, то повороты вокруг начала координат O, отраже‐
ния относительно прямых, прходящих через O, а также растяжения — линей ные отоб‐
ражения V → V .
2. Умножение на комплексное число v 7→ zw и комплексное сопряжение z 7→ z — линей ‐
ные отображения C → C как векторным пространств над R.
3. Дифференцирование f 7→ f ′ — линей ное отображение F [x]6d → F [x]6d−1 .
4. Если c ∈ F , то эвалюация f 7→ f (c) — линей ное отображение F [x] → F .
5. Если U 6 V , то отображение вложения U → V — линей ное. Проекция v 7→ v + U —
линей ное отображение V → V /U .
6. Если e1 , . . . , en — базис V , то отображение v 7→ ve — линей ное из V в F n .
Обозначение 4.3.3. Множество всех линей ных отображений из U в V будем обозначать
Hom(U, V ). Если требуется подчеркнуть, что U и V рассматриваются как векторные про‐
странства над полем F , будем писать HomF (U, V ).
Замечание 4.3.4. Композиция линей ных отображений — линей ное отображение.
Поскольку мы уже установили, что всякое конечномерное векторное пространство мож‐
но отождествить с пространством столбцов, для выяснения структуры всех линей ных отоб‐
ражений полезно выяснить, как устроены линей ные отображения между пространствами
столбцов.
Рассмотрим семей ство линей ных отображений πi : F m → F , задаваемое правилом

πi (a1 , . . . , am ) = ai .

Тогда если φ : F n → F m — линей ное отображение, то πi ◦ φ : F n → F — тоже линей ное. С


другой стороны, если φ1 , . . . , φm : F n → F — семей ство линей ных отображений , то отобра‐
жение 
v 7→ φ1 (v), . . . , φm (v) : F n → F m
тоже линей ное. Вместе эти два наблюдения показывают, что всякое линей ное отображение
F n → F m конструируется указанным выше способом из m линей ных отображений F n → F .
Выясним теперь, как устроены линей ные отображения φ : F n → F . Обозначим

ei = (0, . . . , 0, 1, 0, . . . , 0),

где 1 стоит на i‐й позиции, и обозначим ai = φ(ei ). Тогда для произвольного вектора v =
(x1 , . . . , xn ) выполнено v = x1 e1 + . . . + xn en и в силу линей ности φ

φ(v) = φ(x1 e1 + . . . + xn en ) = x1 φ(e1 ) + . . . + xn φ(en ) = a1 x1 + . . . + an xn .

Итого линей ное отображение F n → F однозначно задается набором скаляров (a1 , . . . , an ).


Введем более удобный способ работать с так задаваемыми линей ными отображениями.
С этого момента нам будет важно различать пространства строк и столбцов. Будем запи‐
сывать векторы‐строки в виде (x1 , . . . , xn ), а соответствующее пространство обозначать n F .
Векторы‐столбцы будем записывать либо в виде столбцов, либо в виде (x1 , . . . , xn )⊤ — это
обозначение вскоре обретет дополнительный более общий смысл. Пространство столбцов,
как и ранее, будем обозначать F n .

73
Определение 4.3.5. Пусть a = (a1 , . . . , an ) ∈ n F , а b = (b1 , . . . , bn ) ∈ F n . Тогда произведени‐
ем строки a на столбец b будем называть скаляр a1 b1 + a2 b2 + . . . + an bn ∈ F .
В таких терминах рассуждения выше доказывают следующее
Предложение 4.3.6. Все отображения F n → F являются отображениями умножения слева
на строку из n F .

Возвращаясь к отображениям F n → F m , мы с учетом изложенного выше получаем, что


такое отображение задается как набор из m отображений F n → F , где каждое из них зада‐
ется строкой из n F . Итого линей ное отображение F n → F m задается набором из m строк
длины n.
Определение 4.3.7. Матрицей размера m × n называется набор скаляров ai,j , занумерован‐
ных парой индексов i = 1, . . . , m, j = 1, . . . , n.
Обозначение 4.3.8. Традиционно матрицы записывают в виде таблицы, где элемент ai,j
стоит на пересечении i‐й строки и j‐го столбца. Будем обозначать i‐ю строку ai,∗ , а j‐й стол‐
бец a∗,j (то есть ∗ означает, что в качестве соответствующего индекса берутся все возмож‐
ные значения). Множество матриц размера m × n над полем F будем обозначать M (m, n, F ).
В случае m = n это обозначение будет сокращаться до M (n, F ).
Определение 4.3.9. Произведением матрицы A = (ai,j ) и столбца b = (b1 , . . . , bn )⊤ ∈ F n
называется столбец высоты m, у которого в позиции i стоит произведение i‐й строки A на
столбец b, то есть
Ab = (a1,∗ b, a2,∗ b, . . . , am,∗ b)⊤ .

В таких обозначениях получается, что всякое линей ное отображение F n → F m это отоб‐
ражения умножения слева на матрицу из M (m, n, F ).
Замечание 4.3.10. Если линей ное отображение φ : F n → F m задается матрицей A = (ai,j ) ∈
M (m, n, F ), то ее столбцы есть в точности образы элементов естественного базиса ei про‐
странства F n , то есть a∗,j = φ(ej ).

Доказательство. Дей ствительно, если ei = (0, . . . , 0, 1, 0, . . . , 0)⊤ , то ai,∗ ej = ai,j . Тогда по


определению

φ(ej ) = Aej = (a1,∗ ej , . . . , am,∗ ej )⊤ = (a1,j , . . . , am,j )⊤ = a∗,j .

Следствие 4.3.11. Такое споставление Hom(F n , F m ) → M(m, n, F ) является биективной


функцией .
Доказательство. Столбцы матрицы, задающей линей ное отображение, определены одно‐
значно и для различных линей ных отображений различаются, так что отображение инъек‐
тивно. С другой , каждая матрица задает какое‐то линей ное отображение, так что оно сюръ‐
ективно.

Выясним теперь, как это описание линей ных отображений между пространствами столб‐
цов переносится на произвольное конечномерное векторное пространство при отождеств‐
лении посредством выбора базиса.
Пусть e1 , . . . , en — базис U , f1 , . . . , fm — базис V , а φ : U → V — линей ное отображение.
Обозначим через βe : U → F n и βf : V → F m линей ные отображения, сопоставляющие век‐
торам U и V их столбцы координат в базисах e и f соответственно, то есть βe (u) = ue и

74
βf (v) = vf . Тогда, как мы уже выяснили, βe обратимо и βe−1 тоже линей ное. Тогда компози‐
ция линей ных отображений

α = βf ◦ φ ◦ βe−1 : F n → F m

является линей ным отображением между пространствами столбцов, и потому является до‐
множением на некоторую матрицу A ∈ M (m, n, F ), то есть α(b) = Ab. Отсюда получаем
равенство функций α ◦ βe = βf ◦ φ, что в применении к вектору u ∈ U дает

(α ◦ βe )(u) = (βf ◦ φ)(u),


α(βe (u)) = βf (φ(u)),
α(ue ) = (φ(u))f ,
A · ue = (φ(u))f .

Иными словами, чтобы най ти столбец координат вектора φ(u) относительно базиса f , надо
домножить столбец координат вектора u относительно базиса e на некоторую однозначно
определенную матрицу.
Определение 4.3.12. Пусть φ : U → V — линей ное отображение, а e1 , . . . , en и f1 , . . . , fm —
базисы U и V . Тогда матрица A ∈ M (m, n, F ) называется матрицей линейного отображения
φ относительно пары базисов e и f , если для любого u ∈ U выполнено A · ue = (φ(u))f .
Обозначение 4.3.13. A = φe,f , то есть φe,f ue = φ(u)f .
Замечание 4.3.14. Если A = φe,f , то столбцы A это столбцы координат образов базисных
векторов, то есть A∗,j = φ(ej )f .
Обозначение 4.3.15. Наиболее важным случаем являются линей ные отображения φ : V →
V . В таком случае в V можно выбрать один базис e1 , . . . , en и называть φe,e матрицей отоб‐
ражения φ относительно базиса e и обозначать ее φe .
Примеры 4.3.16.
1. Пусть V — евклидова плоскость, а e1 , e2 — стандартный базис (то есть e1 ⊥ e2 ). Пусть
φ : V → V — отображение поворота вокруг начала координат на угол θ.

e2
sin θ φ(e1 )
φ(e2 )

e1
cos θ

Несложно вычислить координаты образа e1 и e2 под дей ствием φ. Дей ствительно, по


определению тригонометрических функций
     
cos θ − sin θ cos θ − sin θ
φ(e1 )e = , φ(e2 )e = , φe = .
sin θ cos θ sin θ cos θ

75
2. Пусть V = C — векторное пространство над R. Относительно базиса 1, i матрица отоб‐
ражения умножения на комплексное число z = a + bi имеет вид
 
a −b
,
b a

так как z · 1 = a + bi и z · i = −b + ai.


Как и сопоставление вектору столбца его координат, сопоставление линей ному отобра‐
жению матрицы сохраняет дополнительные структуры.
Для начала заметим, что множество Hom(U, V ) всех линей ных отображений из U в V само
является векторным пространством относительно поточечных операций сложения и умно‐
жения на скаляр, то есть

(φ + ψ)(u) = φ(u) + ψ(u), (λ · φ) = λ · (φ(u)).

Разумеется, как частный случай Hom(F n , F m ) тоже является векторным пространством. При
этом, как мы уже знаем, линей ные отображения F n → F m это в точности домножения на
матрицы из M(m, n, F ). Выясним, как указанные операции выражаются в терминах матриц.
Столбцы матрицы A это в точности образы векторов стандартного базиса F n , так что
поточечная сумма φ + ψ переводит базисный вектор ej в сумму образов φ(ej ) + ψ(ej ), то
есть матрица, отвечающая сумме отображений составлена из сумм столбцов соответствую‐
щих матриц. Поскольку столбцы складываются покомпонентно, сумме отображений отвеча‐
ет сумма матриц: если A, B ∈ M(m, n, F ), то (A+B)i,j = Ai,j +Bi,j . Аналогично, домножение
на скаляр реализуется покомпонентным умножением: (λ · A)i,j = λ · Ai,j .
В общем случае те же соображения показывают, что относительно базисов e и f пространств
U иV
(φ + ψ)e,f = φe,f + ψe,f , (λ · φ)e,f = λ · φe,f .
Это означает, что выбор пары базисов e, f задает линей ное отображение

φ 7→ φe,f : Hom(U, V ) → M(dim(V ), dim(U ), F ),

причем это отображение является обратимым — то есть каждая матрица задает некоторое
линей ное отображение.
Линей ные отображения обладают еще одной структурой — можно находить их компози‐
ции. А именно, если U, V, W — три векторных пространства, а φ ∈ Hom(U, V ) и ψ ∈ Hom(V, W ),
то определена композиция ψ ◦ φ ∈ Hom(U, W ).
Пусть e, f, g — базисы пространств U, V, W . Выясним, как най ти матрицу (ψ ◦ φ)e,g . В пози‐
ции (i, j) у этой матрицы стоит i‐я координата образа ej в базисе g. Но
     
(ψ ◦ φ)(ej ) = ψ φ(ej ) = ψf,g · φ(ej ) f = ψf,g · φe,f ∗,j .
g g

Получается, что в позиции (i, j) матрицы (ψ ◦ φ)e,g стоит произведение i‐й строки ψf,g и j‐
го столбца матрицы φe,f . Заведем для матрицы, составленной таким образом, специальное
определение.

Определение 4.3.17. Пусть A ∈ M(m, n, F ), B ∈ M(n, k, F ). Произведением матриц A и B


называется такая матрица A · B ∈ M(m, k, F ), что (A · B)i,j = Ai,∗ · B∗,j . Иными словами

A · B = C, где Ci,j = Ai,1 B1,j + Ai,2 B2,j + . . . + Ai,n Bn,j .

76
Итого мы показали, что
(ψ ◦ φ)e,g = ψf,g · φe,f .
Следствие 4.3.18. Умножение матриц ассоциативно.
Доказательство. Умножение матриц соответствует композиции соответствующих линей ‐
ных отображений (достаточно рассматривать отображения между пространствами столб‐
цов), а композиция ассоциативна.
Замечание 4.3.19.
1. Отображению v 7→ 0 соответствует матрица, составленная из нулей (нулевая матрица).
Это отображение и эта матрица служат ней тральными элементами по сложению для
Hom(U, V ) и M(m, n, F ).
2. Отображению id : v 7→ v соответствует матрица, составленная из столбцов стандартно‐
го базиса пространства столбцов. Иными словами, в позиции (i, j) в ней стоит 1, если
i = j, и 0 в ином случае. Такая матрица называется единичной и обозначается I (ес‐
ли требуется явно указать размер, то In ). Это отображение и эта матрица служат ней ‐
тральным элементов относительно композиции в Hom(V, V ) и умножения в M(n, F )
соответственно.
Замечание 4.3.20. Множество матриц M(n, F ) относительно сложения и умножения матриц
образует ассоциативное кольцо с 1. Это кольцо не является коммутативным в случае n > 1.
Доказательство. Дей ствительно, все свой ства кольца уже либо были проверены выше, ли‐
бо сразу следуют из соответствия между матрицами и линей ными отображениями. Ожидать
от объектов, кодирующих функции относительно композиции, коммутативности было бы
странно. Однако некоммутативность для матриц такова, что произведение в одном порядке
может быть ненулевым, а в другом нулевым, например
         
1 0 0 1 0 1 0 1 1 0 0 0
= , = .
0 0 0 0 0 0 0 0 0 0 0 0

Определение 4.3.21. Пусть A ∈ M(n, F ). Матрицей , обратной к A, называется элемент, об‐


ратный по умножению к A (если такой существует). Обозначение: A−1 .
Замечание 4.3.22. Матрица обратима тогда и только тогда, когда задаваемое ею линей ное
отображение обратимо. При этом обратное отображение тоже является линей ным, а обрат‐
ная матрица есть матрица обратного отображения.
Доказательство. Пусть φ ∈ Hom(V, V ) обратимо. Тогда оно биективно и для любых v1 , v2 ∈
V най дутся такие u1 , u2 ∈ V , что vi = φ(ui ). Тогда для обратного преобразования выполнено

φ−1 (λ1 v1 + λ2 v2 ) = φ−1 λ1 φ(u1 ) + λ2 φ(u2 )

= φ−1 φ(λ1 u1 + λ2 u2 )
= λ1 u1 + λ2 u2
= λ1 φ−1 (v1 ) + λ2 φ−1 (v2 ).

Определение 4.3.23. Ядром линей ного отображения φ ∈ Hom(U, V ) называется Ker(φ) =


{u ∈ U | φ(u) = 0}, то есть прообраз 0.
Замечание 4.3.24. Ker(φ) 6 U .

77
Доказательство. Если u, v ∈ Ker(φ) и λ, µ ∈ F , то φ(λu + µv) = λφ(u) + µφ(v) = λ0 + µ0 = 0,
так что λu + µv ∈ ker(φ).
Предложение 4.3.25. φ ∈ Hom(U, V ) инъективно тогда и только тогда, когда Ker(φ) = 0.
Доказательство. Если φ инъективно, то у 0 не больше одного прообраза, причем φ(0) = 0,
так что Ker(φ) = 0.
Обратно, пусть Ker(φ) = 0. Если φ(u) = φ(v), то φ(u − v) = φ(u) − φ(v) = 0, откуда u − v ∈
ker(φ) и −v = 0.
Предложение 4.3.26. Пусть dim(U ) = dim(V ), φ ∈ Hom(U, V ). Отображение φ инъективно
тогда и только тогда, когда оно сюръективно.
Доказательство. Заметим, что инъективное линей ное отображение никакой ненулевой век‐
тор не переводит в 0, так что любая нетривиальная линей ная комбинация элементов базиса
не переходит в 0. При этом линей ная комбинация переходит в линей ную комбинацию, так
что свой ство линей ной независимости сохраняется, и базис переходит в базис — в частно‐
сти, остается порождающим семей ством, так что отображение также сюръективно.
Если отображение φ сюръективно, то у каждого вектора есть прообраз — в частности, у
всех векторов какого‐нибудь базиса. Но тогда эти прообразы образую линей но независимый
набор (раз их образы линей но независимы), который в силу своего размера является бази‐
сом. Если какая‐то их линей ная комбинация переходит в 0, то соответствующая линей ная
комбинация образов равна 0, что противоречит их линей ной независимости.
Замечание 4.3.27. Линей ное отображение φ ∈ Hom(V, V ) обратимо слева тогда и только
тогда, когда оно обратимо справа. В частности, для квадратных матриц A, B, C если AB =
AC = I или BA = CA = I, то B = C.
Доказательство. φ обратимо слева тогда и только тогда, когда, то оно инъективно, и обра‐
тимо справа тогда и только тогда, когда сюръективно.
Определение 4.3.28. Пусть A ∈ M(m, n, F ). Транспонированной матрицей для матрицы A
называется A⊤ ∈ M(n, m, F ), задаваемая по правилу (A⊤ )i,j = Aj,i .
В частности, если рассматривать столбцы из F n и строки из n F как матрицы n × 1 и 1 × n
соответственно, то транспонирование переводит столюцы в строки и наоборот.
Предложение 4.3.29.
1. Если A, B ∈ M(m, n, F ), то (A + B)⊤ = A⊤ + B ⊤ .
2. Если A ∈ M(m, n, F ) и λ ∈ F , то (λA)⊤ = λA⊤ .
3. Если A ∈ M(m, n, F ) и B ∈ M(n, k, F ), то (AB)⊤ = B ⊤ A⊤ .
4. Если A ∈ M(n, F ) обратима, то A⊤ тоже обратима и (A−1 )⊤ = (A⊤ )−1 .
Доказательство. Первые два свой ства очевидны.
Докажем второе. В позиции (i, j) матрицы (AB)⊤ стоит
(AB)j,i = Aj,1 B1,i + . . . + Aj,n Bn,i ,
⊤ ⊤
в то время как у B A на той же позиции
⊤ ⊤ ⊤
Bi,1 A1,j + . . . + Bi,n A⊤
n,j = B1,i Aj,1 + . . . + Bn,i Aj,n ,

что является тем же самым выражением.


Формула для обратной матрицы:
A⊤ (A−1 )⊤ = (A−1 A)⊤ = I ⊤ = I.

78
4.4 Матрица перехода между базисами
Пусть теперь в пространстве V выюраны два базиса e1 , . . . , en и f1 , . . . , fn . Выясним, как свя‐
заны для произвольного вектора v столбцы координат ve и vf .
Обозначим β : V → F n и γ : V → F n линей ные отображения β(v) = ve и γ(v) = vf . Оба
эти отображения обратимы, обратные линей ны, так что линей ная композиция δ = γ ◦ β −1 .
С другой стороны, для произвольного вектора v ∈ V выполнено δ(ve ) = vf , то есть соответ‐
ствие между столбцами координат в разных базисах реализуется линей ным оотображением
из Hom(F n , F n ). Это отображение задается матрицей C ∈ M(n, F ), то есть для любого v ∈ V
имеет место равенство Cve = vf . Ясно, как построить такую матрицу C — ее столбцы это
образы векторов стандартного базиса F n . При отображении β −1 это векторы переходят в
векторы базиса e1 , . . . , en , а их образ под дей ствием γ это (e1 )f , . . . , (en )f . Иными словами,
C∗,i = (ei )f .
Определение 4.4.1. Матрицей перехода между базисами e1 , . . . , en и f1 , . . . , fn пространства
V называется такая матрица Ce→f ∈ M(n, F ), что для любого вектора v ∈ V выполнено
Ce→f ve = vf . Столбцы этой матрицы — столбцы координат векторов базиса e в базисе f .
Предложение 4.4.2.
1. Если e, f, g — три базиса V , то Ce→g = Cf →g Ce→f .
−1
2. Матрица перехода Ce,f обратима, и Ce,f = Cf,e .
Доказательство. Cf →g Ce→f ve = Cf →g vf = vg . Второе свой ство следует из обратимости
отображений соспоставления вектору столбца координат вместе с первым утверждением и
тем, что Ce→e = I.
Выясним теперь, как меняется матрица линей ного отображения при замене базисов.

Предложение 4.4.3. Пусть φ ∈ Hom(U, V ), e, e′ — базисы U , а f, f ′ — базисы V . Тогда

φe′ ,f ′ = Cf →f ′ φe,f Ce′ →e .

Доказательство. Для произвольного u ∈ U выполнено φe,f · ue = φ(u)f . При этом ue =


Ce′ →e · ue′ , а для произвольного v ∈ V выполнено Cf ′ →f · vf ′ = vf , в том числе для v = φ(u).
Подставляя эти выражения в соотношение выше, получаем

φe,f · Ce′ →e · ue′ = Cf ′ →f · vf ′ ,

что после домножения слева на Cf →f ′ дает

Cf →f ′ φe,f Ce′ →e · u′e = φ(u)f ′ .

Это соотношение является характеристическим свой ством матрицы φe′ ,f ′ , откуда в силу ее
единственности получаем требуемое утверждение.
−1
Следствие 4.4.4. Если φ ∈ Hom(V, V ), а e, f — базисы V , то φf = Ce→f φe Ce→f = Cf−1
→e φe Cf →e .

Покажем теперь, что при подходящем выборе базисов e и f матрица линей ного отображе‐
ния φe,f может принимать особенно простой вид.

79
Предложение 4.4.5 (Канонический вид матрицы линей ного отображения). Для любого φ ∈
Hom(U, V ) най дутся такой базис e пространства U и такой базис f пространства V , что φe,f
имеет вид  
Ik 0
∈ M(dim V, dim U, F ).
0 0
для некоторого k ∈ Z>0 , а блоки из нулей имеют соответствующие размеры.
Доказательство. Выберем v1 , . . . , vm — базис Ker(φ) (возможно, пустой , если φ инъектив‐
но), а затем дополним его векторами u1 , . . . , uk до базиса U . Базисом e будет служить набор
u1 , . . . , uk , v1 , . . . , vm . Затем положим fi = φ(ei ) при i = 1, . . . , k — это линей но независимый
набор (так как на he1 , . . . , ek i отображение φ инъективно и потому сохраняет линей ную неза‐
висимость). Дополним его какими‐то векторами fk+1 , . . . , fdim V до базиса. Тогда φe,f имеет
искомый вид.

4.5 Образ и ранг


Определение 4.5.1. Образом линей ного отображения φ ∈ Hom(U, V ) будем называть ее об‐
ласть значений , то есть Im(φ) = {φ(u) | u ∈ U }.
Предложение 4.5.2. Im(φ) 6 V .
Доказательство. Если v1 , v2 ∈ Im(φ), то существуют такие u1 , u2 ∈ U , что vi = φ(ui ). Но
тогда λ1 v1 + λ2 v2 = φ(λ1 u1 + λ2 u2 ) ∈ Im(φ).
Замечание 4.5.3. φ(hXi) = hφ(X)i, в частности, Im(φ) порождается образом любого порож‐
дающего набора.
Определение 4.5.4. Рангом линей ного отображения φ называется размерность его образа:
rk(φ) = dim Im(φ).
Определение 4.5.5. Столбцовым рангом матрицы A ∈ M(m, n, F ) называется ранг соответ‐
ствующего линей ного отображения, то есть rk(A) = dimhA∗,1 , . . . , A∗,n i. По аналогии, строч‐
ным рангом A называется dimhA1,∗ , . . . , Am,∗ i (как подпространства в n F ).
Лемма 4.5.6. Ранг линей ного отображения не меняется при композиции (слева или справа)
с обратимым линей ным отображением.
Доказательство. Обратимое линей ное отображение φ(V1 , V2 ) сохраняет размерность, то есть
для любого W 6 V1 выполнено dim φ(W ) = dim W (обратимое линей ное преобразование со‐
храняет линей ную независимость и переводит порождающий набор в порождающий набор
для образа, так что базис W переходит в базис φ(W )).
Пусть теперь φ ∈ Hom(U, V ), а α ∈ Hom(U ′ , U ) и β ∈ Hom(V, V ′ ) обратимы. Тогда для
θ = β ◦ φ ◦ α : U ′ → V ′ выполнено
    
dim θ(U ′ ) = dim (β ◦ φ ◦ α)(U ′ ) = dim β(φ(α(U ′ ))) = dim β(φ(U )) = dim φ(U ) .

Предложение 4.5.7. Строчный и столбцовый ранги матрицы совпадают.


Доказательство. Свяжем с матрицей A ∈ M(m, n, F ) два линей ных отображения:

LA : F n → F m : v 7→ Av, RA : m
F → n F : u 7→ uA.

Тогда столбцовый ранг A это ранг LA , а строчный равен rk(RA ).

80
Теперь воспользуемся Предложением 4.4.5 о каноническом виде линей ного отображения:
най дутся такие обратимые матрицы C ∈ M(m, F ) и D ∈ M(n, F ), что
 
Ik 0
CAD = .
0 0

Заметим теперь, что LCAD = LC LA LD и RCAD = RD RA RC , причем LC , LD , RC , RD обрати‐


мы. Значит, rk LA = rk LCAD и rk RA = rk RCAD . Но ранги rk LCAD = k = rk RCAD .
Определение 4.5.8. Рангом матрицы называется ее столбцовый или строчный ранг.
Теорема 4.5.9. Пусть φ ∈ Hom(U, V ). Тогда dim Ker(φ) + dim Im(φ) = dim(U ).
Доказательство. Обозначим n = dim(U ) и пусть e, f — базисы U и V , реализующие канони‐
ческий вид φ, то есть φe,f = I0k 00 . Иными словами, φ(e1 ), . . . , φ(ek ) линей но независимы, а
ek+1 , . . . , en — базис Ker(φ). Тогда dim Im(φ) = k, а dim Ker(φ) = n − k.

В дей ствительности эта теорема отвечает следующему обстоятельству. Рассмотрим отображение


u + Ker(φ) 7→ φ(u) : U / Ker(φ) → Im(φ).
Оно корректно определено и является линей ной биекцией . Теорема тогда следует из сравнения размерностей .

Предложение 4.5.10. Пусть φ ∈ Hom(U, V ) и ψ ∈ Hom(V, W ). Тогда



rk(ψ ◦ φ) 6 min rk(ψ), rk(φ) .

Доказательство. Заметим для начала, что для размерность векторного пространства под
дей ствием линей ного отображения не может возрасти. Например, dim(ψ(V ′ )) 6 dim(V ′ ) для
любого V ′ 6 V . В частности, для V ′ = φ(U ) получаем, что dim(ψ(φ(U ))) 6 dim(φ(U )), что
означает в точности rk(ψ ◦ φ) 6 rk(φ).
С другой стороны, так как φ(U ) 6 V , получаем ψ(φ(U )) 6 ψ(V ), так что dim(ψ(φ(U ))) 6
dim(ψ(V )), то есть rk(ψ ◦ φ) 6 rk(ψ).

4.6 Системы линейных уравнений


Под системой линей ных уравнений (СЛУ) мы будем понимать набор уравнений вида


 a1,1 x1 + . . . + a1,n xn = b1 ,


a2,1 x1 + . . . + a2,n xn = b2 ,
 ..

 .


am,1 x1 + . . . + am,n xn = bm

относительно набора переменных x1 , . . . , xn . Более компактно это можно записать в виде

Ax = b,

где A = (ai,j ) ∈ M(m, n, F ), b = (b1 , . . . , bm )⊤ ∈ F m , x = (x1 , . . . , xn )⊤ ∈ F n . Матрица A назы‐


вается матрицей системы линей ных уравнений , а матрица (A|b) ∈ M(m, n+1, F ) называется
расширенной матрицей системы.
СЛУ называется однородной, если b = 0, и неоднородной в противном случае.
Столбец v ∈ F n называется решением СЛУ, если Av = b.
Рассмотрим сначала случай однородной СЛУ.

81
Замечание 4.6.1. Решения однородной СЛУ образуют подпространство в F n .

Доказательство. Множество решений однородной СЛУ непусто, так как A0 = 0, то есть 0 —


решение. Если u, v ∈ F n — решения, то для любых λ, µ ∈ F столбец λu + µv тоже решение,
так как A(λu + µv) = λAu + µAv = 0.
Предложение 4.6.2. Размерность пространства решений однородной СЛУ с матрицей A ∈
M(m, n, F ) равна dim Ker(A) = n − rk(A).
Доказательство. Определение решения СЛУ и теорема о размерностях ядра и образа.
Обратимся теперь к структуре множества решений неоднородной системы Ax = b. Пусть
v1 , v2 — два решения. Тогда A(v1 −v2 ) = Av1 −Av2 = b−b = 0, то есть разность двух решений
неоднородной СЛУ это решение соответствующей однородной СЛУ. Это означает, что если
нашлось одно решение v0 , то все остальные из него получаются прибавлением элементов
Ker(A). Итого получаем слудеющее
Предложение 4.6.3. Пусть Av0 = b. Тогда множество решений СЛУ Ax = b имеет вид

v0 + Ker(A) = {v0 + v | v ∈ F n , Av = 0}.

Остается открытым вопрос, когда существует такой v0 . Рассмотрим внимательнее, что та‐
кое Ax при x = (x1 , . . . , xn )⊤ . По определению

Ax = x1 A∗,1 + . . . + xn A∗,n .

Тогда существование такого x, что Ax = b, эквивалентно тому, что b выражается в виде ли‐
ней ной комбинации столбцов матрицы A (иными словами, b ∈ Im(A)).
Теорема 4.6.4 (Кронекера—Капелли). СЛУ Ax = b имеет решение тогда и только тогда, ко‐
гда rk(A) = rk(A|b), то есть когда ранг матрицы системы равен рангу расширенной матрицы.
Доказательство. Рассмотрим пространства U = hA∗,1 , . . . , A∗,n i и V = hA∗,1 , . . . , A∗,n , bi.
Ясно, что U 6 V и оба утверждения эквивалентны тому, что U = V .

Предложение 4.6.5. Пусть A ∈ M(m, n, F ). Решение СЛУ Ax = b единственно (или не суще‐


ствует) тогда и только тогда, когда rk(A) = n.
Доказательство. Решение единственно тогда и только тогда, когда Ker(A) = 0. Это эквива‐
лентно тому, что линей ное отображение, отвечающее A, инъективно, то есть размерность
образа совпадает с размерностью области определения, rk(A) = n.

4.7 Элементарные преобразования


Определение 4.7.1. Стандартными матричными единицами называются матрицы eij , от‐
личающиеся от нулевой матрицы только в позиции (i, j), где стоит 1. Здесь подразумевается,
что размер матриц зафикисрован.
Замечание 4.7.2. Стандартные матричные единицы образуют базис P векторного простран‐
ства M(m, n, F ). Дей твительно, если A = (Aij ) ∈ M(m, n, F ), то A = i,j aij eij .
Рассмотрим некоторые особенно простые линей ные отображения на пространстве столб‐
цов и опишем соответствующие матрицы.

82
• Пусть ε ∈ F . Дилатацией называется преобразование di (ε) ∈ Hom(F n , F n ), дей ствую‐
щее по правилу
(x1 , . . . , xi , . . . , xn )⊤ 7−→ (x1 , . . . , εxi , . . . , xn )⊤ .
Отображение di (ε) обратимо тогда и только тогда, когда ε 6= 0, в таком случае обратное
отображение равно di (1/ε). Отображение di (ε) задается диагональной матрицей

I + (ε − 1)eii = e11 + . . . + εeii + . . . + enn .

• Перестановкой строк называется отображение wij , дей ствующее по правилу

(x1 , . . . , xi , . . . , xj , . . . , xn )⊤ 7−→ (x1 , . . . , xj , . . . , xi , . . . , xn )⊤

(меняются только два элемента). Отображение wij обратимо и является обратным к


самому себе. оно задается матрицей

I − eii − ejj + eij + eji .

• Элементарной трансвекцией называется преобразование tij (λ), i 6= j, дей ствующее по


правилу

(x1 , . . . , xi , . . . , xj , . . . , xn )⊤ 7−→ (x1 , . . . , xi + λxj , . . . , xj , . . . , xn )⊤ .


−1
Оно обратимо, tij (λ) = tij (−λ). Соответствующая матрица равна I + λeij .
Перечисленные выше три типа (обратимых) линей ных отображений называются элемен‐
тарными преобразованиями.
Рассмотрим матрицу A ∈ M(m, n, F ), составленную из столбцов a1 = A∗,1 , . . . , an = A∗,n ,
символически это можно записать в виде

A = (a1 | . . . |an ).

Тогда если C ∈ M(k, m, F ), то


CA = (Ca1 | . . . |Can ).
В частности, если C ∈ M(m, F ) — матрица элементарного преобразования, то домножение
на нее слева производит со строками матрицы A соответствующие дей ствия: домножает на
скаляр, переставляет, прибавляет одну к другой с коэффициентом.
Это соображение, кроме прочего, дает еще один простой способ восстановить вид матри‐
цы элементарного преобразования: если C — такая матрица, то C = CI, а CI находится как
применение указанных преобразований к строкам единичной матрицы.
С другой стороны, домножение на матрицу элементарного преобразования справа про‐
изводит аналогичные дей ствия со столбцами. Это можно увидеть, непосредственно прове‐
рив, как дей ствуют матрицы элементарных преобразований при домножении на них строки
справа. Альтернативный способ состоит в том, чтобы перей ти к транспонированным матри‐
цам:
⊤
AC = C ⊤ A⊤ ,
а C ⊤ — снова матрица элементарного преобразования.

83
4.8 Метод Гаусса
Опишем теперь один способ решать системы линей ных уравнений . Пусть СЛУ задается в
матричном виде
Ax = b,
где A ∈ M(m, n, F ), b ∈ F m , то есть имеется m уравнений от n переменных.
Заметим, что если C ∈ M(m, F ) обратима, то множества рашений систем Ax = b и (CA)x =
Cb совпадают. Дей ствительно, для произвольной C∈ M(m, F ) из Ax = b следует (CA)x = Cb,
остается применить это же наблюдение к C −1 и СЛУ (CA)x = Cb.
Мы будем упрощать матрицу A посредством элементарных преобразований строк, что,
как мы видели, реализуется в виде домножения на некоторые обратимые матрицы слева.

Лемма 4.8.1. Ненулевой столбец a ∈ F m можно элементарными преобразованиями приве‐


сти к виду (1, 0, . . . , 0)⊤ .
Доказательство. Раз столбец ненулевой , в нем най дется ненулевой элемент ai . Применяя
w1,i , получаем столбец a′ с ненулевым первым элементом. Дей ствуя d1 (1/a′1 ), делаем этот
элемент равным 1. Затем последовательно домножая на ti,1 (−a′i ), i = 2, . . . , m, получаем ис‐
комый столбец (1, 0, . . . , 0)⊤ .
Лемма 4.8.2. Матрицу A 6= 0 можно привести элементарными преобразованиями к трапе‐
циевидной форме, то есть такой , что в каждой строке имеется такой ненулевой элемент (на‐
зываемый ведущим), что во всех позициях левее и/или ниже его стоят нули, а все нулевые
строки расположены в нижней части матрицы. При этом ведущие элементы можно сделать
равными 1.
Доказательство. Так как A 6= 0, най дется ненулевой столбец с наименьшим номером j. По
предыдущей лемме его можно сделать при помощи элементарных преобразований равным
(1, 0, . . . , 0)⊤ . Так как j наименьший , все столбцы слева от него нулевые, то есть в позиции
(1, j) стоит ведущий элемент. Теперь рассмотрим подматрицу A′ , полученную из A вычер‐
киванием первой строки. К ней можно применить те же рассуждения, причем применяемые
линей ные преобразования не будут затрагивать первую строку матрицы A, а все нулевые
столбцы останутся нулевыми. Если матрица A′ приведена к трапециевидной форме, то и
матрица A трапециевидная. Если же A′ оказалась нулевой , то делать ничего не надо и мат‐
рица A уже какая требуется.
Лемма 4.8.3. Матрицу A 6= 0 можно привести к строчной эшелонированной форме, то есть к
трапециевидной форме, где выше каждого ведущего элемента расположены только нули.
Доказательство. Если A приведена к трапециевидной форме с единицами в качестве ве‐
дущих элементов, то прибавления вверх позволяют обнулить все элементы, стоящие над
ними.
Построенная процедура приведения матрицы к строчной эшелонированной форме позво‐
ляет решать СЛУ. Этот способ называется методом Гаусса.
Предложение 4.8.4. Пусть расширенная матрицы СЛУ (A|b) приведена к строчной эшело‐
нированной форме. Обозначим через J = {j1 , . . . , jk } номера столбцов, в которых находятся
ведущие элементы, так что ведущие элементы находятся в позициях (1, j1 ), . . . , (k, jk ).

1. Система имеет решение тогда и только тогда, когда в последнем столбце нет ведущего
элемента.

84
2. Если решение (x1 , . . . , xn )⊤ существует, то оно имеет вид
X
xj произвольные при j ∈
/J и x j i = bi − ai,j xj .
j ∈J
/
j>ji

Доказательство. Если в последнем столбце есть ведущий элемент, то соответствующая стро‐


ка расширенной матрицы отвечает уравнению 0x1 +. . .+0xn = 1, которое не имеет решений .
Предположим теперь, что ведущего элемента в последнем столбце нет. Рассмотрим нену‐
левую строку с номером i. Она имеет вид
(0, . . . , 0, 1, ai,ji +1 , . . . , ai,n |bi )
и отвечает уравнению X
xji + ai,j xj = bi .
j>ji
При этом при j ∈ J, j > ji условие эшелонированности дает равенство ai,j = 0. С другой сто‐
роны, переменная xji участвует только в этом уравнении, так что определяется однозначно
по указанной в формулировке формуле.
Остается показать, что переменные xj , j ∈
/ J, могут принимать произвольные значения.
Дей ствительно, какие бы им ни были присвоены значения, уравнение, соответствующее i‐й
строке уравнение удовлетворяется, если положить xji равным значению, указанному в фор‐
мулировке.
Пусть A ∈ M(n, F ) — обратимая матрица. Сей час мы выясним, как использовать метод
Гаусса для нахождения A−1 .
Замечание 4.8.5. Если A ∈ M(n, F ) обратима, то rk(A) = n.
Доказательство. Если A обратима, то соответствующее линей ное отображение сюръектив‐
но, так что размерноость образа равна размерности области определения, то есть rk(A) =
n.
Замечание 4.8.6. Строчная эшелонированная форма обратимой матрицы равна единичной
матрице.
Доказательство. При приведении к строчной эшелонированной форме обратимость мат‐
рицы не нарушается (так как реализуется домножением на обратимые матрицы). У обрати‐
мой матрицы не может быть нулевых строк или столбцов (иначе ранг меньше размера). Зна‐
чит, количество ведущих элементов равно количеству строк и равно количеству столбцов.
Это возможно только если ведущие элементы стоят на диагонали, а тогда строчная эшело‐
нированная форма равна единичной матрице.
Предложение 4.8.7. Пусть A ∈ M(n, F ) обратима. Рассмотрим матрицу (A|In ) ∈ M(n, 2n, F ).
Ее строчная эшелонированная форма равна (In |A−1 ).
Доказательство. Пусть приведение A к строчной эшелонированной форме реализуется при
помощи обратимой матрицы C, тогда CA = In , то есть C = A−1 . Но тогда также C(A|In ) =
(CA|CIn ) = (In |C).
Следствие 4.8.8. Любая обратимая матрица представляется в виде произведения матриц
элементарных преобразований .
Доказательство. Из доказательства предыдущего предложения видно, что A−1 может быть
най дена в виде произведения матриц элементарных преобразований , скажем, A−1 = Ck ·. . .·
C1 . Но тогда A = C1−1 · . . . · Ck−1 , а Ci−1 — снова матрицы элементарных преобразований .

85
4.9 Перестановки
Обозначение 4.9.1. Обозначим n = {1, . . . , n}.

Определение 4.9.2. Перестановкой на n точках называется биекция множества X из n эле‐


ментов на себя. Обычно в качестве множества X выбирают n, и обозначают множество всех
перестановок X через 
Sn = σ : n → n | σ — биекция .
Замечание 4.9.3. Sn является группой относительно композиции.

Доказательство. Ассоциативность имеет место, так как операция — композиция функций .


Ней тральным элементом выступает тождественное отображение, а обратный элемент су‐
ществут, так как всякая биекция обратима (и обратная функция — тоже биекция).
Композицию перестановок будем называть произведением (и обозначать соответствую‐
щим образом).
Определение 4.9.4. Числом инверсий inv(σ) перестановки σ ∈ Sn называется количество
таких пар (i, j) ∈ n2 , что i < j, но σ(i) > σ(j).
Определение 4.9.5. Знаком перестановки σ называется sgn(σ) = (−1)inv(σ) . Перестановки
знака 1 называются четными, а знака −1 нечетными.

Каким образом можно описывать перестановки? Простей ший способ записи — таблич‐
ный :  
1 2 ... n
σ= .
σ(1) σ(2) . . . σ(n)
Простей шими нетривиальными перестановками являются транспозиции: биекции, меняю‐
щие местами два элемента, а все остальные оставляющие на месте. Будем обозначать τij
транспозицию, меняющую местами i и j. При записи τij мы всегда будем подразумевать, что
i 6= j.

Предложение 4.9.6. Пусть σ ∈ Sn . Тогда sgn(τij · σ) = − sgn(σ).


Доказательство. Если i и j соседние, то количество инверсий при композиции с τij меняет‐
ся ровно на 1, и четность меняется.
Для произвольных различных i, j обозначим через s количество лежащих между ними эле‐
ментов. Тогда τij может быть реализована как последовательность 2s + 1 транспозиций со‐
седних элементов: сначала переставляем i с соседними элементами, перемещая в сторону j,
затем переставляем i и j, после чего переставляем j со всеми промежуточными элементами.
Смена знака произвой дет нечетное число раз.
Предложение 4.9.7. Любая перестановка может быть записана в виде произведения транс‐
позиций .

Доказательство. Сортировка пузырьком.


Следствие 4.9.8. Если σ = τk . . . τ1 — произведение транспозиций , то sgn(σ) = (−1)k .

86
4.10 Определители
Определение 4.10.1. Определителем матриц размера n называется отображение

det : M(n, F ) → F,

удовлетворяющее следующим трем свой ствам:


1. Линей ность по столбцам, то есть для каждого i
  
det a1 | . . . |λai + µbi | . . . |an = λ · det a1 | . . . |ai | . . . |an + µ · det a1 | . . . |bi | . . . |an ;

2. Значение на матрице с двумя одинаковыми столбцами равно 0;


3. Значение на единичной матрице In равно 1.

Нашей ближай шей целью будет показать, что такое отображение существует и единствен‐
но.
Замечание 4.10.2. При перестановке двух столбцов определитель меняет знак.
Доказательство. Фиксируем все столбцы, кроме двух с номерами i и j, рассмотрим сужение
определителя на множество таких матриц и будем рассматривать его как функцию f от пары
столбцов. Из первых двух свой ств следует, что

0 = f (u + v, u + v) = f (u, u) + f (v, v) + f (u, v) + f (v, u) = f (u, v) + f (v, u).

Построим определитель рекуррентно. А именно, ясно, что для n = 1 имеется только один
способ:
det(a) = det(a · I1 ) = a · det(I1 ) = a.
Далее, предположим, что определитель для матриц размера n − 1 уже построен и положим

X
n
det(A) = (−1)1+j a1,j det(A1,j ),
j=1

где A1,j ∈ M(n − 1, F ) — матрица, полученная из A удалением первой строки и j‐го столбца.
Предложение 4.10.3. Эта конструкция удовлетворяет свой ствам определителя.
Доказательство. Линей ность достаточно проверять для каждого слагаемого отдельно. Пред‐
положим, что i‐й столбец A∗,i раскладывается в линеную комбинацию. Если i 6= j, то a1,j не
меняется, а det(A1,j зависит от i‐го столбца линей но. Если же i = j, то наоборот a1,j зависит
от i‐го столбца линей ной , а A1,j не меняется.
Пусть теперь у матрицы A столбцы с номерами i, j совпадают. Тогда

det(A) = (−1)1+i a1,i det(A1,i ) + (−1)1+j a1,j det(A1,j ),

потому что при k 6= i, j у матрицы A1,k имеется два одинаковых столбца, и соответствующее
слагаемое равно 0. Для определенности будем считать, что i < j. Тогда матрица A1,i получа‐
ется из матрицы A1,j последовательной перестановкой столбцов i и i + 1, i + 1 и i + 2, …, j − 2
и j − 1. Поэтому det(A1,i ) = (−1)j−i−1 det(A1,j ), а значит, det(A) = 0.
Третье свой ство проверяется непосредственно: det(In ) = 1 · det(In−1 ) = 1.

87
Предложение 4.10.4. Отображение определителя единственно.

Доказательство. Обозначим посредством e1 , . . . , en вектора стандартного базиса простран‐


ства столбцов F n и представим первый столбец матрицы A в виде следующей линей ной
комбинации:
A∗,1 = a1,1 e1 + a2,1 e2 + . . . + an,1 en .

Тогда по первому свой ству определителя для det(A) = det A∗,1 |A∗,2 | . . . |A∗,n выполнено
 
det(A) = a1,1 · det e1 |A∗,2 | . . . |A∗,n + . . . + an,1 · det en |A∗,2 | . . . |A∗,n

Рассмотрим теперь отдельное слагаемое ak,1 · det(ek |A∗,2 | . . . |A∗,n ). Можно точно таким же
образом разложить второй столбец, тогда
X 
 n

ak,1 · det ek |A∗,2 | . . . |A∗,n = ak,1 · ai,2 · det ek |ei |A∗,3 | . . . |A∗,n ,
i=1

причем слагаемое с i = k нулевое (дважды встречается столбец ek ).


Продолжая подобным образом, мы получаем, что det(A) выражается как сумма всех воз‐
можных слагаемых вида

ai1 ,1 ai2 ,2 . . . ain ,n · det ei1 |ei2 | . . . |ein ,

где все индексы набора i1 , . . . , in различны. Иными словами, для некоторой перестановки
σ ∈ Sn верно ij = σ(j), то есть
X 
det(A) = aσ(1),1 . . . aσ(n),n det eσ(1) | . . . |eσ(n) .
σ∈Sn

Если σ = τk . . . τ1 — произведение транспозиций , то матрица eσ(1) | . . . |eσ(n) получается из
In последовательностью перестановок столбцов, отвечающих транспозициям τ1 , . . . , τk , так
что ее определитель равен (−1)k = sgn(σ). Итого получаем, что значение отображения det
на каждой матрице A определено однозначно.

Замечание 4.10.5. В дей ствительности мы доказали даже чуть более общее утверждение:
если функция матриц линей на по столбцам и обращается в ноль при равенстве двух столб‐
цов, то она определена однозначно с точностью до умножения на фиксированный скаляр,
равный значению на единичной матрице.
Полученная формула
X
det(A) = sgn(σ) · aσ(1),1 . . . aσ(n),n
σ∈Sn

называется формулой полного развертывания. Рассмотрим, что эта формула дает в случаях
n = 2 и n = 3.
В случае n = 2 существует только две перестановки двух элементов — тождественное
отображение и одна транспозиция, соответственно знаков 1 и −1. Тогда

a b

c d = ad − cb.

88
В случае n = 3 имеется 6 перестановок:

σ id τ12 τ13 τ23 ( 13 21 32 ) ( 12 23 31 )


sgn(σ) 1 −1 −1 −1 1 1

Применяя формулу полного развертывания, получаем



a11 a12 a13

a21 a22 a23 = a11 a22 a33 + a31 a12 a23 + a21 a32 a13 − a21 a12 a33 − a31 a22 a13 − a11 a32 a23 .

a31 a32 a33

4.11 Свойства определителя


Предложение 4.11.1. det(A⊤ ) = det(A).
Доказательство. Пусть A = (aij ) ∈ M(n, F ) и A⊤ = (bij ), bij = aji . Рассмотрим формулу
полного развертывания для A⊤ :
X
det(A⊤ ) = sgn(σ) · bσ(1),1 . . . bσ(n),n
σ∈Sn
X
= sgn(σ) · b1,σ−1 (1) . . . bn,σ−1 (n)
σ∈Sn
X
= sgn(σ) · aσ−1 (1),1 . . . aσ−1 (n),n = det(A).
σ∈Sn

Здесь мы воспользовались тем, что sgn(σ −1 ) = sgn(σ) (сочетание Следствия 4.9.8 и Замеча‐
ния 1.5.19).
Следствие 4.11.2. Формулу полного развертывания можно переписать следующим обра‐
зом: X
det(A) = sgn(σ) · a1,σ(1) . . . an,σ(n)
σ∈Sn

Следствие 4.11.3. При перестановке двух строк матрицы определитель меняет знак.
Доказательство. Перестановка строк матрицы может быть реализована как последователь‐
ность из транспонирования, перестановки столбцов и еще одного транспонирования.
Следствие 4.11.4 (Разложение определителя по строке и по столбцу).
X
n X
n
det(A) = (−1)i+j aij det(Aij ) = (−1)i+j aij det(Aij ),
j=1 i=1

где Aij получается из A удалением i‐й строки и j‐го столбца.


Доказательство. Применить конструкцию определителя (совпадающую с разложением по
первой строке) к матрице, полученной из данной переносом i‐й строки наверх (при пере‐
становке со строками с номерами i − 1, i − 2, …, 1 смена знака происходит i − 1 раз). Вторая
формула получается за счет Предложения 4.11.1.
Предложение 4.11.5. Определитель матрицы не меняется при применении к ней элемен‐
тарных трансвекций , то есть при прибавлении одного столбца к другому с коэффициентом
(аналогично для строк).

89

Доказательство. Пусть A = . . . |ai | . . . |aj | . . . , тогда в силу линей ности по столбцам
 
det . . . |a + λaj | . . . |aj | . . . = det(. . . |ai | . . . |aj | . . .) + λ · det . . . |aj | . . . |aj | . . . .
Первое слагаемое равно det(A), а второе равно 0, поскольку дважды встречается столбец aj .
Аналогичный результат для строк достигается транспонированием.
Замечание 4.11.6. При домножении строки или столбца на скаляр λ определитель домно‐
жается на λ.
Предложение 4.11.7. Матрица A ∈ M(n, F ) обратима тогда и только тогда, когда det(A) 6= 0.
Доказательство. Матрицу A можно привести к строчной эшелонированной форме посред‐
ством элементарных преобразований . При этом определитель только домножается на нену‐
левые скаляры. Если матрица A обратима, то по Замечанию 4.8.6 ее строчная эшелонирован‐
ная форма равна единичной матрице, которая имеет определитель 1. У необратимой матри‐
цы в строчной эшелонированной форме есть нулевая строка, так что ее определитель тоже
равен 0.
Предложение 4.11.8. Пусть A ∈ M(m, F ), B ∈ M(n, F ), X ∈ M(m, n, F ). Тогда определитель
B ) равен det(A) · det(B).
блочной матрицы ( A0 X
Доказательство. Фиксируем матрицы X и B и рассмотрим функцию
 
A X
f : M(m, F ) → F, f (A) = det
0 B
Ясно, что эта функция линей ная по столбцам и обращается в ноль при равенстве двух сто‐
люцов матрицы A. Значит, она единственна с точностью до домножения на скаляр, то есть
определяется значением на какой ‐то одной фиксированной матрице, например, единичной :
f (A) = det(A) · f (Im ).
Остается вычислить f (Im ). По определению
 
I X
f (Im ) = det m .
0 B
Разложение по первому столбцу дает равенство
   
Im X I X′
det = det m−1 ,
0 B 0 B
где X ′ получается из X вычеркиванием первой строки. Повторяя так m раз, получаем, что
f (Im ) = det(B).
Предложение 4.11.9. Определитель мультипликативен, то есть det(AB) = det(A) · det(B)
для A, B ∈ M(n, F ).
Доказательство. Фиксируем матрицу A и рассмотрим функцию
f : M(n, F ) → F, f (B) = det(AB).
Если у матрицы B совпадают столбцы с номерами i и j, то есть B∗,i = B∗,j , то то же самое
верно и для матрицы AB, так как (AB)∗,k = A · B∗,k . Если в матрице B столбец с номером
i имеет вид λa + µb, то в матрице AB столбец с тем же номером имеет вид λAa + µAb. По‐
этому функция f линей на по столбцами и обращается в ноль при равенстве столбцов. Сле‐
довательно, она пропорциональна определителю: f (B) = det(B) · f (In ). Но по определению
f (In ) = det(A).
Следствие 4.11.10. Если матрица A обратима, то det(A−1 ) = det(A)−1 .

90
4.12 Формулы Крамера и присоединенная матрица
Рассмотрим систему линей ных уравнений Ax = b с квадратной матрицей A ∈ M(n, F ). Пусть
матрица A составлена из столбцов A = a1 | . . . |an , и пусть x = (x1 , . . . , xn )⊤ — решение.
Теорема 4.12.1 (Формулы Крамера).

xi · det(A) = det a1 | . . . |ai−1 |b|ai+1 | . . . |an .

Доказательство.
 X 
det a1 | . . . |ai−1 |b|ai+1 | . . . |an = det a1 | . . . |ai−1 | xj aj |ai+1 | . . . |an
j
X 
= xj · det a1 | . . . |ai−1 |aj |ai+1 | . . . |an
j

= xi · det a1 | . . . |ai−1 |ai |ai+1 | . . . |an = xi · det(A).

При det(A) 6= 0 эти соотношения позволяют явно описать решения СЛУ, в частности, до‐
ставляют формулу для обратной матрицы.
Пусть A ∈ M(n, F ) обратима. Обозначим A−1 = (cij ). Тогда j‐й столбец A−1 это решение
СЛУ Ax = (In )∗,j = ej . Формулы Крамера дают тогда соотношения

cij · det(A) = det a1 | . . . |ai−1 |ej |ai+1 | . . . |an .

Разложение определителя в правой части по i‐му столбцу (равному ej ) дает равенство

cij · det(A) = (−1)i+j det(Aji ).

Определение 4.12.2. Присоединенной матрицей для A ∈ M(n, F ) называется матрица adj(A) ∈


M(n, F ), задаваемая правилом adj(A)ij = (−1)i+j det(Aji ).
Рассуждения выше можно теперь сформулировать следующим образом:
Следствие 4.12.3. Если матрица A обратима, то A−1 = 1
det(A) adj(A).
Следствие 4.12.4. В частности,
 −1  
a b 1 d −b
= .
c d ad − bc −c a

Формулу для обращения матрицы 2 × 2 мы уже видели в другом контексте — в связи с нахождением преобразо‐
вания, обратного к дробно‐линей ному. В дей ствительно, дробно‐линей ные преобразования можно рассматривать
как комплексные матрицы размера 2 с точностью до умножения на скаляр (и формула для композиции дробно‐
линей ных преобразований тогда превращается в умножение матриц). Обратимые дробно‐линей ные преобразова‐
ния тогда задаются обратимыми матрицами (обратимость не зависит от домножения на ненулевой скаляр), а обра‐
тимость матрицы отвечает необращению определителя в 0, см. Предложение 3.7.3. Предложение 3.7.2 тоже можно
истолковать в матричных терминах: всякая матрица 2 × 2 записывается в виде произведения четырех матриц эле‐
ментарных преобразований (с точностью до умножения на скаляр): например, при c 6= 0
      3   
c a bc − ad 0 0 1 c d ac bc3 a b
= = c 3
· .
0 c 0 c2 1 0 0 c c4 dc3 c d
В случае c = 0 такое представление выглядит еще проще:
    
1 b a 0 a b
= .
0 d 0 1 0 d

Однако верно и более общее утверждение.

91
Предложение 4.12.5. A · adj(A) = adj(A) · A = det(A) · In .

Доказательство. Понятно, что достаточно доказывать только одну из формул (вторая по‐
лучается транспонированием первой формулы для транспонированных матриц).
Зафиксируем пару индексов i, j и проверим, что (A · adj(A))ij = δij · det(A). Дей ствительно,

X
n X
n
(A · adj(A))ij = aik · adj(A)kj = aik · (−1)k+j det(Ajk ).
k=1 k=1

При i = j выражение в правой части совпадает с разложением по i‐й строке и дает det(A).
При i 6= j рассмотрим матрицу A′ = (a′ij ), полученную заменой j‐ю строки матрицы A на ее
i‐ю строку. Тогда для любых индексом j, k имеется равенство A′jk = Ajk (измененная строка
удалена). С другой стороны, det(A′ ) = 0, а разложение по j‐й строке дает

X
n X
0= (−1)j+k a′jk det(A′jk ) = (−1)j+k aik det(Ajk ).
k=1 k=1

4.13 Определитель Вандермонда


Определение 4.13.1. Определитель Вандермонда

1 x1 x21 . . . xn−1
1
1 x2 x22 n−1
. . . x2

V (x1 , . . . , xn ) = . .. .. .. .. .
.. . . . .

1 xn x2 . . . xn−1
n n
Q
Теорема 4.13.2. V (x1 , . . . , xn ) = i>j (xi − xj ).
Доказательство. Индукция по n. При n = 2 формула очевидна:

1 x1

V (x1 , x2 ) = = x2 − x1 .
1 x2

Пусть n > 2. Вычтем из последнего столбца предпоследний , умноженный на x1 , затем из


предпоследнего предшествующий ему, домноженный на x1 , и так далее. В результате в пер‐
вой строке все элементы, кроме первого, станут равными 0. Более точно, получили равен‐
ство
1 x1 x21 . . . xn−1 1 0 0 ... 0
1
1 x2 x22 . . . xn−1 1 x2 − x1 x2 (x2 − x1 ) . . . xn−2 (x − x )
2 2 2 1
. . . . . = .. . . . . .
.. .. .. .. .. . .. .. .. ..

1 xn x2 . . . xn−1 1 xn − x1 xn (xn − x1 ) . . . xn−2 (xn − x1 )
n n n

Раскладывая определитель в правой части по первой строке и вынося из каждой строки об‐
щий множитель, получаем
Y
V (x1 , . . . , xn ) = (xi − x1 ) · V (x2 , . . . , xn ).
i>1

Определитель Вандермонда возникает во множестве приложений , например, в связи с ин‐


терполяционной задачей .

92
Пусть x0 , x1 , . . . , xn — различные элементы поля F , и пусть заданы y0 , y1 , . . . , yn ∈ F . Ин‐
терполяционная задача состоит в отыскании такого многочлена f ∈ F [x], что deg(f ) 6 n и
для всех i имеется равенство f (xi ) = yi . Запишем

f = ξ0 + ξ1 x + ξ2 x2 + . . . + ξn xn .

Подставляя x = xi , получаем n + 1 линей ное уравнение на коэффициенты ξj :

ξ0 + ξ1 xi + . . . + ξn xni = yi .

Определитель этой СЛУ это в точности определитель Вандермонда V (x0 , . . . , xn ). Так как все
xi различны, этот определитель не равен 0, так что матрица системы обратима и СЛУ имеет
единственное решение.

93
5 Линейные операторы
Сфокусируемся теперь на изучении структуры линейных операторов, то есть линей ных отоб‐
ражений векторного пространства в себя. Будем обозначать Hom(V ) = Hom(V, V ).

5.1 Определитель оператора, собственные числа и собственные векторы


Определение 5.1.1. Определителем оператора φ ∈ Hom(V ) будем называть определитель
его матрицы по отношению к какому‐нибудь базису, то есть det(φ) = det(φe ).
Замечание 5.1.2. Определитель оператора не зависит от выбора базиса.
Доказательство. Пусть e и f — два базиса V . Обозначим C = Cf →e . Тогда φf = C −1 φe C и
det(φf ) = det(C −1 φe C) = det(C)−1 det(φe ) det(C) = det(φe ).
Замечание 5.1.3. det(φ ◦ ψ) = det(φ) det(ψ).
Определение 5.1.4. Если для некоторого v ∈ V , v 6= 0, и λ ∈ F выполнено равенство φ(v) =
λv, то v называется собственным вектором, а λ — собственным числом оператора φ.
Если известно какое‐то собственное число λ, то най ти соответствующие собственные век‐
торы несложно. А именно, после выбора базиса e1 , . . . , en равенство φ(v) = λv превращается
в равенство φe ve = λve или, что то же самое, (λIn − φe )ve = 0, то есть задача сводится к
решению однородной СЛУ.
Остается понять, как най ти собственные числа, то есть те λ ∈ F , для которых такая си‐
стема имеет ненулевое решение. Это эквивалентно поиску таких λ, что Ker(λ id −φ) 6= 0, то
есть для которых оператор λ id −φ необратим (в силу Предложений 4.3.25 и 4.3.26). Но по
Предложению 4.11.7 оно необратимо только когда det(λ id −φ) = 0.
Ясно, что вычисление det(λ id −φ) можно проводить в любом базисе.
Замечание 5.1.5. Пусть A ∈ M(n, F ). Тогда det(tIn − A) выражается как многочлен от t с
коэффициентами в F .
Доказательство. Формула полного развертывания для матрицы, элементы которой явля‐
ются многочленами от t.
Определение 5.1.6. Характеристическим многочленом матрицы A ∈ M(n, F ) называется
χA ∈ F [t], задаваемый формулой χA (t) = det(tIn − A). Характеристическим многочленом
оператора φ ∈ Hom(V ) называется характеристический многочлен его матрицы в каком‐
нибудь (любом) базисе, то есть χφ (t) = det(t id −A).
Замечание 5.1.7. Пусть φ ∈ Hom(V ). Тогда deg(χφ ) = dim(V ).
Доказательство. Пусть dim(V ) = n и A = (aij ) ∈ M(n, F ) — матрица φ в каком‐нибудь ба‐
зисе. Рассмотрим формулу полного развертывания для det(A − tIn ). Слагаемое, отвечающее
тождественной перестановке, равно (t − a11 ) · . . . · (t − ann ) и имеет степень n, а у всех осталь‐
ных слагаемых степень меньше, так как хотя бы один множитель внедиагональный , то есть
является константой .
Соображения, приводящие к понятию характеристического многочлена, можно оформить
в следующей форме.
Предложение 5.1.8. Собственные числа линей ного оператора это в точности корни его ха‐
рактеристического многочлена, в частности, их количество не превосходит размерности про‐
странства.

94
Пример 5.1.9. Пусть V — евклидова плоскость с базисом e1 , e2 , а φ — поворот на угол θ (про‐
тив часовой стрелки), тогда
 
cos θ − sin θ
φe = ,
sin θ cos θ

t − cos θ sin θ
χφ = = (t − cos θ)2 + sin2 θ = t2 − 2t cos θ + 1.
− sin θ t − cos θ

Корнями характеристического многочлена являются


1 p 
λ1 , 2 = cos θ ± 4 cos2 θ − 4 = cos θ ± i sin θ.
2
Остается для каждого собственного числа λi най ти соответствующие собственные векторы.
Матрица соответствующей однородной СЛУ имеет вид
 
±i sin θ sin θ
.
− sin θ ±i sin θ

В случае sin θ 6= 0 она приводится элементарными строчными преобразованиями к виду


 
1 ±i
0 0

На деле это вычисление проделывать не требуется, так как известно, что ранг этой матри‐
цы не максимален (не превосходит 2) и не равен 0, так что обязательно равен единице и
тем самым можно просто оставить одну строку. Решением СЛУ с такой матрицей служат все
векторы вида
 
±ia
, a ∈ C соответственно для с.ч. λ = cos θ ± sin θ.
a

Ясно, что никакой такой столбец не может быть вещественными, поэтому в строгом смыс‐
ле у оператора φ нет собственных вектором и собственных чисел, но часто полезно иметь
информацию о собственных числах и векторах в таком расширенном смысле.
В случае sin θ = 0 отображение φ это либо тождественное преобразование, либо поворот
на угол π, то есть отражение относительно начала координат. В этом случае единственное
собственное число это соответственно 1 или −1, и все ненулевые векторы являются соб‐
ственными.
Обратите также внимание, что собственное число матрицы поворота оказалось равным комплексному числу,
домножение на которое дей ствует как поворот на тот же угол. Это связано с тем, что комплексные числа можно
реализовать как вещественные матрицы 2 × 2 специального вида, а именно,
 
a b
a + bi ! .
−b a
Легко проверить, что сумме и произведению комплексных чисел отвечает сумма и произведение таких матриц,
комплексное сопряжение реализуется как транспонирование, а квадрат модуля вычисляется как определитель.

В некоторых случаях, впрочем, можно гарантировать, что все собственные числа окажутся
вещественными.
Предложение 5.1.10. Пусть A ∈ M(n, R) симметрическая, то есть A⊤ = A. Тогда все соб‐
ственные числа A вещественные.

95
Доказательство. Для матриц X ∈ M(m, n, C) (в частности, для столбцов) будем обозна‐
чать через X результат покомпонентного применения комплексного сопряжения. Ясно, что

X = X ⊤ и для любой матрицы Y подходящего размера XY = X · Y .
Заметим, что для любого u ∈ Cn число u⊤ · u вещественное: если u = (z1 , . . . , un )⊤ , то
u⊤ · u = z1 z1 + . . . + zn zn = |z1 |2 + . . . + |zn |2 ∈ R.
При этом эта величина неотрицательная и равна 0 только для u = 0.
Пусть теперь v 6= 0 — собственный вектор, отвечающий собственному числу λ, то есть
Av = λv. Тогда

Av · Av = v ⊤ A⊤ Av = v ⊤ · A2 v = λ2 · v ⊤ v.
Тем самым λ2 выражается как частное двух неотрицательных вещественных чисел, а тогда
λ вещественное.
Характеристический многочлен доставляет также средство находить линей ные зависи‐
мости между степенями данной квадратной матрицы.
Определение 5.1.11. Пусть f ∈ F [x] и A ∈ M(n, F ). Значением f = c0 + c1 x + . . . + cm xm на
A называется
f (A) = c0 In + c1 A + . . . + cm Am .
Ясно, что как и для обычного значения многочлена, (f + g)(A) = f (A) + g(A), (f g)(A) =
f (A)g(A) и (λf )(A) = λf (A) (для доказательства необходимо дополнительно воспользо‐
ваться тем, что Ar As = As Ar ).
Теорема 5.1.12 (Гамильтона—Кэли). χA (A) = 0.
Доказательство. Пусть A ∈ M(n, F ) и χA (t) = tn + cn−1 tn−1 + . . . + c1 t + c0 . Положим B =
adj(tIn − A), тогда
(tIn − A) · B = det(tIn − A) · In = χA · In .
Элементы матрицы B — многочлены от переменной t, причем их степени не превосходят
n − 1. Дей ствительно, каждый элемент B это, с точностью до знака, определитель матрицы
порядка n−1, составленной из многочленов степени 6 1, причем в каждой строке не больше
одного не‐константного многочлена. Тогда можно представить B в виде
B = B0 + tB1 + . . . + tn−1 Bn−1 , где Bi ∈ M(n, F ).
Тогда формула выше может быть переписаа следующим образом:

χA · In = (tIn − A) · B = (tIn − A) · (B0 + tB1 + . . . + tn−1 Bn−1 ) =


= tn Bn−1 + tn−1 (Bn−2 − ABn−1 ) + . . . + t(B0 − AB1 ) − AB0 .
С другой стороны,
χA · In = tn In + tn−1 cn−1 In + . . . + tc1 In + c0 In .
Сравнивая слагаемые при соответствующих степенях, получаем следующие соотношения:
Bn−1 = In , Bi−1 − ABi = ci In , i = 1, . . . , n − 1, −AB0 = c0 In .
Умножим слева равенство, отвечающее ti , на Ai , и сложим все полученные:
An Bn−1 + An−1 (Bn−2 − ABn−1 ) + . . . + A(B0 − AB1 ) − AB0 = An + cn−1 An−1 + . . . + c1 A + c0 In .
Все слагаемые в левой части сокращаются, а в правой части стоит χA (A).

96
Следствие 5.1.13. Пусть A ∈ M(n, F ), тогда dimhIn , A, A2 , . . .i 6 n.
Доказательство. Покажем, что In , A, A2 , . . . , An−1 — порождающий набор для данного под‐
пространства. Это в точности означает, что Ak выражается в виде f (A) для некоторого f ∈
F [x] степени 6 n−1. Поделим xk на χA с остатком: xk = χA ·q +r, deg(r) < deg(χA ) = n. Тогда
вычисление значений на A дает Ak = χA (A) · q(A) + r(A) — по теореме Гамильтона—Кэли
Ak = r(A), то есть можно положить f = r.
Определение 5.1.14. Алгебраической кратностью собственного числа λ оператора φ назы‐
вается его кратность как корня χφ . Геометрической кратностью называется размерность
Ker(λ id −φ), то есть максимальное количество линей но независимых собственных ветко‐
ров, отвечающих λ.
Предложение 5.1.15. Геометрическая кратность собственного числа λ оператора φ не пре‐
восходит его алгебраической кратности.
Доказательство. Пусть геометрическая кратность равна k, то есть существуют k линей но
независимых собственных вектором v1 , . . . , vk , отвечающих λ. Дополним их векторами vk+1 , . . .
до базиса всего пространства, тогда матрица оператора φ в базисе v имеет вид
 
λIk B
φv = .
C
Тогда χφ = χφv = χλIk · χC = (t − λ)k · χC и алгебраическая кратность λ не меньше k.
Определение 5.1.16. Следом матрицы A ∈ M(n, F ) называется сумма ее диагональных эле‐
ментов: tr(A) = a11 + a22 + . . . + ann .
Предложение 5.1.17. След матрицы равен сумме ее собственных чисел с учетом кратности.
Более точно, если A ∈ M(n, F ) и λ1 , . . . , λn — ее собственные числа (возможно, с повторами),
то tr(A) = λ1 + . . . + λn .
Доказательство. Рассмотрим характеристический многочлен χA . Так как собственные чис‐
ла это его корни, χA = (t−λ1 ) . . . (t−λn ), так что коэффициент при tn−1 равен −(λ1 +. . .+λn ).
С другой стороны, прямое вычисление показывает, что
χA = det(tIn − A) = tn − tn−1 (a11 + a22 + . . . + ann ) + слагаемые меньших степеней .
Дей ствительно, в формуле полного развертывания имеется слагаемое вида
(t − a11 )(t − a22 ) . . . (t − ann ),
а все остальные слагаемые имеют степень не больше n − 2, так как выбор одного внедиа‐
гонального элемента исключает из произведения диагональные элементы в соответству‐
ющих строке и столбце. Сравнивая два выражения для коэффициента при tn−1 , получаем
искомое утверждение.
Лемма 5.1.18. Пусть A⊤ = A ∈ M(n, R), а λ ∈ R — собственное число A. Если (A − λI)k x = 0,
то (A − λI)x = 0.
Доказательство. Если (A − λI)2 x = 0, то
⊤
0 = x⊤ · (A − λI)2 x = A − λI)x · (A − λI)x,
так что (A − λI)x = 0. Для k > 2 положим y = (A − λI)k−2 x, и по предыдущему рассуждению
получаем, что (A − λI)y = 0, то есть (A − λI)k−1 x = 0. Продолжаем, пока не дой дем до
(A − λI)x = 0.

97
Предложение 5.1.19. Пусть A ∈ M(n, R), A⊤ = A, а λ1 , . . . , λs ∈ R — все ее различные
собственные числа. Положим f = (t − λ1 ) . . . (t − λs ). Тогда f (A) = 0.
Доказательство. По теореме Гамильтона—Кэли χA (A) = 0, причем

χA = (t − λ1 )m1 . . . (t − λs )ms .

Рассмотрим произвольный столбец v, тогда

(A − λ1 I)m1 (A − λ2 I)m2 . . . (A − λs )ms v = 0.

Применим предыдущую лемму для x = (A−λ2 I)m2 . . . (A−λs I)ms v, получим, что (A−λ1 I)x =
0. Теперь, поскольку все матрицы в этом произведении коммутируют, переставим множи‐
тель (A − λ1 I) в конец и повторим для λ2 . Продолжая так, получаем, что f (A) = 0.

5.2 Спектр графа


Определение 5.2.1. Графом Γ будем называть пару из множества вершин V Γ и множества
ребер EΓ, то есть (неупорядоченных) пар вершин. Мы будем считать, что у графа нет петель,
то есть каждое ребро соединяет две различные вершины, и нет кратных ребер, то есть нет
двух ребер, соединяющих одни и те же вершины. Мы будем рассматривать только неориен‐
тированные графы, то есть ребра {a, b} и {b, a} равны.
Пусть вершины графа Γ занумерованы числами 1, . . . , n. Матрицей смежности графа Γ
называется (
1, если {i, j} ∈ EΓ,
AΓ = (aij ) ∈ M(n, Z), где aij =
0, иначе.

Заметим, что так как граф неориентированный , матрица смежности симметрическая.


Определение 5.2.2. Спектром графа Γ будем называть множество собственных чисел AΓ
вместе с (алгебраическими) кратностями. Если λ1 > λ2 > . . . > λs — различные собствен‐
ные числа (все вещественные) кратностей m1 , . . . , ms , то будем писать
 
λ1 λ2 . . . λs
Spec Γ = .
m1 m2 . . . ms

Собственные числа матрицы смежности часто называют просто собственными числами гра‐
фа.

В дей ствительности для вещественных симметрических матриц геометрическая кратность собственных чисел
всегда совпадает с алгебраической .

Пример 5.2.3. Рассмотрим Kn — полный граф на n точках, имеющий n вершин, где любые
две различные вершины соединены ребром. Тогда
 
n−1 −1
Spec Kn = .
1 n−1

Дей ствительно, матрица смежности AKn имеет нули на диагонали и единицы на всех вне‐
диагональных позициях. Тогда (1, . . . , 1)⊤ — собственный вектор для собственного числа

98
n − 1, а      
−1 0 0
 1  −1  .. 
     . 
0 1  
 , ,..., 0 
 ..   0   
 .    −1
..
0 . 1
доставляют n − 1 линей но независимыый собственный вектор для собственного числа −1.
Определение 5.2.4. Характеристическим многочленом χΓ графа Γ называется характери‐
стический многочлен его матрицы смежности AΓ .
Предложение 5.2.5. Пусть χΓ = tn + cn−1 tn−1 + cn−2 tn−2 + . . . + c0 . Тогда cn−1 = 0 и cn−2 =
−|EΓ|.
Доказательство. Все собственные числа AΓ вещественные, так что χΓ = (t − λ1 )m1 . . . (t −
λs )ms . Тогда сумма m1 λ1 + . . . + ms λs равна следу матрицы смежности, но tr(AΓ ) = 0, так как
у графа нет петель.
Рассмотрим теперь коэффициент cn−2 при tn−2 . В формуле полного развертывания слага‐
емые степени > n − 2 возникают только двумя способами: либо

(t − a11 )(t − a22 ) . . . (t − ann ),

отвечающее тождественной перестановке (что для AΓ равно tn ), либо отвечающие транспо‐


зиции τij и имеющие вид Y
−aij aji · (t − akk ),
k̸=i,j
P
что для AΓ равно −aij 2 tn−2 . Итого коэффициент при tn−2 равен − i̸=j a2ij , то есть, при aij =
1 или 0 в зависимости от наличия ребра {i, j} в Γ, в точности −|EΓ|.
Пока что мы не пользовались тем, что матрицу смежности можно умножать на себя. Ока‐
зывается, степени матрицы смежности тоже говорят что‐то о графе.
Определение 5.2.6. Путем длины ℓ в графе Γ называется такая последовательность вер‐
шин v0 , . . . , vℓ , что {vi−1 , vi } ∈ EΓ для i = 1, . . . , ℓ.
Предложение 5.2.7. Количество путей длины ℓ между вершинами с номерами i и j, равно
элементу в позиции (i, j) матрицы AℓΓ .
Доказательство. Результат очевидно верен для ℓ = 1, далее индукция по ℓ. Предположим,
что утверждение уже доказано для данного ℓ. Заметим, что множество путей длины ℓ + 1
из вершины i в вершину j находится в биективном соответствии со множеством путей из
вершины i в вершины, смежные с вершиной j. Тогда их количество равно
X X
n
(AℓΓ )ik = (AℓΓ )ik · akj = (Aℓ+1
Γ )ij .
k : {j,k}∈EΓ k=1

Определение 5.2.8. Диаметром (связного) графа называется наибольшее такое d ∈ N, что


между какими‐то двумя вершинами существует путь длины d, но не существует более ко‐
роткого пути.
Предложение 5.2.9. Если диаметр графа Γ равен d, то у Γ не меньше d + 1 различного соб‐
ственного числа.

99
Доказательство. Пусть A = AΓ , рассмотрим матрицы I, A, A2 , . . . , Ad . Докажем, что они ли‐
ней но независимы. Пусть
µ0 I + µ1 A + . . . + µd Ad = 0.
Поскольку диаметр Γ равен d, существует некий путь длины d, который нельзя укоротить.
Пусть он проходит по вершинам с номерами i0 , i1 , . . . , id . Тогда у матрицы Ad в позиции (i0 , id )
стоит ненулевой элемент, а у меньших степеней A там стоит ноль (так как нет более корот‐
кого пути, соединяющего эти вершины). Значит, µd A = 0. Аналогично, в позиции (i0 , id−1 )
матрицы Ad−1 стоит ненулевое число, а у меньших степеней ноль, так что µd−1 = 0. Продол‐
жая таким же образом, получаем, что все µi = 0.
Отсюда мы заключаем, что если f (A) = 0 для какого‐то ненулевого f ∈ F [x], то deg(f ) >
d + 1.
С другой стороны, если λ1 , . . . , λs — полный список различных собственных чисел A, то по
предыдущей лемме для g(t) = (t − λ1 ) . . . (t − λs ) выполнено g(A) = 0, так что s > d + 1.
Определение 5.2.10. Граф Γ называется двудольным, если V Γ = V1 ∪ V2 , V1 ∩ V2 = ∅, вер‐
шины из V1 могут быть соединены только с вершинами из V2 и наоборот.

Предложение 5.2.11. Если граф двудолен, то его спектр симметричен относительно 0.


Доказательство. Пусть |V1 | = k, |V2 | = l. Пронумеровав вершины так, что 1, . . . , k — номера
вершин из V1 , а k + 1, . . . , k + l — из V2 , получаем, что AΓ = B0⊤ B0 для некоторой матрицы
B ∈ M(k, l, R). Будем рассматривать столбцы высоты k + l как состоящие из двух частей ,
высоты k и l соответственно. Тогда уравнение на собственное число λ и соответствующий
собственный вектор принимает вид
    
0 B u u
= λ .
B⊤ 0 v v

При этом правая часть может быть вычислена следующим образом:


    
0 B u Bv
= .
B⊤ 0 v B⊤u

Покажем, что замена знака у второй половины собственного вектора дает собственный век‐
тор, отвечающий −λ:
        
0 B u −Bv −λu u
= = = −λ .
B⊤ 0 −v B⊤u λv −v

В дей ствительности верно и обратно утверждение: если спектр симметричен относитель‐


но 0, то граф двудольный .

5.3 Диагонализация и жорданова форма


Если у оператора φ ∈ Hom(V ), дей ствующего на векторном пространстве V размерности n,
имеется n различных собственных чисел, то каждому такому собственному числу λi можно
сопоставить какой ‐то собственный вектор vi . Тогда набор v1 , . . . , vn образует базис V , а φv =
diag(λ1 , . . . , λn ). Если же какое‐то собственное число имеет алгебраическую кратность > 1,
то возможны варианты.

100
Определение 5.3.1. Оператор называется диагонализируемым, если его матрица в каком‐
то базисе диагональна. Матрица такого оператора в любом базисе также называется диаго‐
нализируемой . Иными словами, матрица A называется диагонализиуемой , если существует
такая обратимая матрица C, что C −1 AC диагональная.
Диагональные матрицы хороши, кроме прочего, тем, что их очень просто подставлять в
многочлены, а именно, если A = diag(a1 , . . . , an ), то f (A) = diag(f (a1 ), . . . , f (an )). Это можно
применить и к диагонализируемым матрицам: если D = C −1 AC диагональна, то f (A) =
f (CDC −1 ) = Cf (D)C −1 .
Сей час мы выясним, что можно сказать о недиагонализиуемых матрицах. Задачу можно
разбить на две части: как най ти хорошо устроенную матрицу, сопряженную с данной , и как
эффективно проводить вычисления с такими матрицами.

Определение 5.3.2. Жордановой клеткой называется квадратная матрица


 
λ 1
 λ 1 
 
 . . 
Jk (λ) =  .. ..  ∈ M(k, F ).
 
 λ 1
λ

Жордановой матрицей называется блочно‐диагональная матрица, диагональные блоки ко‐


торой являются жордановыми клетками.
Если v1 , . . . , vn — такой базис пространства V , что матрица φv оператора φ ∈ Hom(V ) яв‐
ляется жордановой матрицей , то v1 , . . . , vn называется жордановым базисом.
Лемма 5.3.3. Пусть α ∈ Hom(U, V ), β ∈ Hom(V, W ). Тогда

dim(Im α ∩ Ker β) = dim Im(α) − dim Im(β ◦ α) = dim Ker(β ◦ α) − dim Ker(α).

Доказательство. Обозначим γ сужение β на Im(α). Тогда по Теореме 4.5.9

dim Ker(γ) + dim Im(γ) = dim Im(α),


а следовательно,
dim(Im α ∩ Ker β) + dim Im(β ◦ α) = dim Im(α).

Второе равенство следует из того, что

dim Im(β ◦ α) = dim V − dim Ker(β ◦ α) и dim Im(α) = dim V − dim Ker(α).

Теорема 5.3.4 (о жордановой форме). Пусть V — конечномерное векторное пространство


над полем F , φ ∈ Hom(V ), и все собственные числа φ принадлежат F (то есть χφ расклады‐
вается над F на линей ные множители). Тогда в V существует жорданов базис оператора φ,
причем соответствующая жорданова матрица определена однозначно с точностью до пере‐
становки жордановых клеток.

Доказательство. Начнем с доказательства существования жорданова базиса. Доказатель‐


ство будем вести индукцией по n = dim(V ).
При n = 1 утверждение очевидно (любая матрица 1 × 1 диагональна).
Пусть теперь n > 1 и λ — какое‐то из собственных чисел φ. Рассмотрим оператор ψ =
φ − λ · id. Ясно, что жорданов базис ψ будет также жордановым базисом для φ (их матрицы в

101
этом базисе будут отличаться на скалярную матрицу λIn ). Рассмотрим последовательность
подпространств
V = Im ψ 0 > Im ψ 1 > Im ψ 2 > . . .
Так как пространство V конечномерно, в какой ‐то момент эта последовательность стабили‐
зируется, то есть най дется такое m, что Im ψ m+1 = Im ψ m 6= Im ψ m−1 — как только простран‐
ства Im ψ m и Im ψ m+1 совпали, совпадут и все последующие, так как Im ψ m+1 = ψ(Im ψ m ).
Тогда
Im ψ m ∩ Ker ψ = 0 и Im ψ m−1 ∩ Ker ψ 6= 0
(это отвечает инъективности и неинъективности сужения ψ на Im ψ m и на Im ψ m−1 , см. Пред‐
ложения 4.3.25 и 4.3.26). В частности, ψ m (Im ψ m ) = Im ψ m .
Пусть Ui = Im ψ i−1 ∩ Ker ψ. Тогда

Ker ψ = U1 > U2 > . . . > Um 6= 0 и Um+1 = 0.

Выберем в пространстве Um базис x11 , . . . , x1np . Так как x1i ∈ Im ψ m−1 , то x1i = ψ m−1 (xm
i ) для
m k m−k m
некоторого вектора xi . Определим векторы xi = ψ (xi ).
Дополним теперь векторы x1i до базиса Um−1 векторами y11 , . . . , yn1 m−1 . Для каждого j най ‐
дем такой вектор yjm−1 , что yj1 = ψ m−2 (yjm−1 ), и положим yjk = ψ m−k−1 (yjm−1 ). Затем допол‐
ним x1i , yj1 до базиса Um−2 векторами z11 , . . . , zn1 m−2 и так далее. Итого получаем следующую
конфигурацию векторов:

xm
i

xm−1
i yjm−1
↓ ↓
xm−2
i yjm−2 zkm−2
↓ ↓ ↓
.. .. .. ..
. . . .
↓ ↓ ↓ ···
x2i yj2 zk2 ··· a2s
↓ ↓ ↓ ··· ↓
x1i yj1 zk1 ··· a1s b1t
↓ ↓ ↓ ··· ↓ ↓
0 0 0 ··· 0 0

Здесь каждый столбец отвечает сразу набору цепочек векторов, занумерованному индексом
i, j, k, . . . , s, t соответственно, а стрелки обозначают применение оператора ψ.
Если индекс i изменяется от 1 до I, индекс j в пределах от 1 до J и так далеее, то общее
количество векторов равно

mI + (m − 1)J + (m − 2)K + . . . + 2S + T =
= I + (I + J) + (I + J + K) + . . . + (I + J + . . . + S + T ) =
= dim Um + dim Um−1 + dim Um−2 + . . . + dim U1 .

102
Так как по Лемме 5.3.3

dim(Im ψ i−1 ∩ Ker ψ) = dim Ker ψ i − dim Ker ψ i−1 ,


то
X
m
dim Ui = dim Ker ψ m .
i=1

Дополним выбранные векторы базисом пространства Im ψ m и покажем, что получился ба‐


зис пространства V . Так как их колчество совпадает с размерностью V , достаточно прове‐
рить линей ную независимость. Предположим, что
X X X X
f+ αi xm
i + βi xm−1
i + ... + γj yjm−1 + . . . + δt b1t = 0,

где f ∈ Im ψ m . Применив к этому равенству ψ m , получим ψP m


(f ) = 0, а значит, f = 0, так
m m m m−1
как ψ (Im ψ ) = Im ψ . ПрименивP теперь ψ P , получим αi x1i = 0, значит, все αi = 0.
m−2 1 1
Применение ψ показывает, что βi x i + γj yj = 0, откуда все βi и γj нулевые, и так
далее.
По предположению индукции в пространстве Im ψ m 6= V най дется жорданов базис опера‐
тора φ (точнее, его сужения на это подпространство). Дополнив его выбранными векторами,
получаем жорданов базис в пространстве V .
Для доказательства единственности жордановой формы достаточно проверить, что коли‐
чество и размер клеток, отвечающих собственному числу 0, определено однозначно (тогда
для произвольного собственного числа λ можно перей ти к оператору φ−λ·id). Этим клеткам
можно сопоставить диаграмму выше, так что количество клеток размера k равно

dim Uk − dim Uk+1 = (dim Ker ψ k − dim Ker ψ k−1 ) − (dim Ker ψ k+1 − dim Ker ψ k )
= 2 dim Ker ψ k − dim Ker ψ k−1 − dim Ker ψ k+1
= rk ψ k−1 − 2 rk ψ k + rk ψ k+1 .

Единственность жордановой формы означает, кроме прочего, что сопряженность комплекс‐


ных матриц определяется совпадением их жордановых форм. Сей час мы покажем, что ве‐
щественная сопряженность вещественных матриц не является более тонким отношением
эквивалентности.

Предложение 5.3.5. Пусть A, B ∈ M(n, R) таковы, что A = P BP −1 для некоторой матрицы


P ∈ M(n, C)∗ . Тогда существует такая матрица Q ∈ M(n, R)∗ , что A = QBQ−1 .
Доказательство. Требуется доказать, что у матричного уравнения AX = XB существует
обратимое вещественное решение. Поскольку это уравнение можно переписать в виде си‐
стемы однородных линей ных уравнений на матричные элементы, множество всех его (ком‐
плексных) решений образуется подпространство W 6 M(n, C) (над C). Подпространство W
нетривиально, так как содержит P . Выберем в нем базис C1 , . . . , Cm ∈ M(n, C). Представим
теперь Cj = Xj +iYj , где Xj , Yj ∈ M(n, R). Тогда равенство ACj = Cj B влечет (при сравнении
вещественных и мнимых частей ) AXj = Xj B и AYj = Yj B (так как A и B вещественные),
так что
W = hC1 , . . . , Cm iC = hX1 , . . . , Xm , Y1 , . . . , Ym iC .
Выделим в этом порождающем наборе базис Z1 , . . . , Zk ∈ M(n, R). Покажем, что среди их
линей ных комбинаций най дется обратимая матрица. Для этого рассмотрим матрицу t1 Z1 +

103
. . . + tk Zk , зависящую от параметров t1 , . . . , tk . Ее обратимость при данных значениях пара‐
метров эквивалентна необращению в ноль определителя. Положим
f (t1 , . . . , fk ) = det(t1 Z1 + . . . + tk Zk ) ∈ R[t1 , . . . , tk ].
Многочлен f принимает какие‐то ненулевые значения при подходящих комплексных значе‐
ниях переменных (так как P ∈ W ), следовательно, многочлен не является нулевым и при‐
нимает ненулевые значения и при вещественных значениях переменных.

Покажем формально, что многочлен f ∈ R[t1 , . . . , tk ], принимающий ненулевые значения при каких‐то ком‐
плексных значениях переменных, не обращается тождественно в 0 при вещественных значениях переменных. Про‐
ведем индукцию по k. База доставляется малой теоремой Безу. При k > 1 рассмотрим ;а; как многочлен одной
переменной t1 с коэффициентами в поле рациональных функций о переменных t2 , . . . , tk :
f ∈ R(t2 , . . . , tk )[t1 ].
Так как многочлен ненулевой , у него есть ненулевое значение (в R(t2 , . . . , tk )) при каком‐то вещественном зна‐
чении t1 (иначе по теореме об интерполяции f был бы нулевым — также снова можно воспользоваться малой
теоремой Безу). К полученному ненулевому значению (зависящему от k − 1 переменной ) можно применить индук‐
ционное предположение.

Более точно, для вещественных матриц имеет место «вещественная жорданова форма». А
именно, определим Jk∗ (λ) как матрицу 2k × 2k, полученную из Jk (λ) заменой каждого ком‐
x y
плексного числа x + iy блоком −y x . Тогда для любой матрицы A ∈ M(n, R) най дется такая
C ∈ M(n, R)∗ , что CAC −1 блочно‐диагональная с блоками либо вида Jk (λ), λ ∈ R, либо вида
Jk∗ (λ), λ ∈ C \ R.

5.4 Приложения жордановой формы


Выясним теперь, как использовать жорданову форму для вычисления степеней матрицы.
Так как
(CAC −1 )n = CAn C −1 ,
а блочно‐диагональные матрицы с одинаковыми размерами блоков умножаются и склады‐
ваются поблочно, задача сводится к вычислению степени жордановой клетки.
Рассмотрим сначала случай клетки, отвечающей собственному числу 0. Матрица Jk (0) за‐
дается оператор на пространстве столбцов F k , дей ствующий на элементах стандартного ба‐
зиса следующим образом:
e1 7−→ 0, ei 7−→ ei−1 при i = 2, . . . , k.
Отсюда видно, что Jk (0)m дей ствует на базисных векторах по правилу
ei 7−→ 0 при i = 1, . . . , m, ei 7→ ei−m при i = m + 1, . . . , k.
В терминах матриц это означает, что Jk (0)m имеет нули везде, кроме m‐й верхней диагонали.
Для общего случая воспользуемся биномом Ньютона. А именно, если a, b — коммутирую‐
щие элементы кольца R (то есть ab = ba), то имеет место равенство
Xn  
n i n−i
(a + b)n = ab .
i=0
i

Обозначим N = Jk (0) и заметим, что Jk (λ) = λIk + N , причем слагаемые коммутируют.


Значит,
Xn  
n n−i i
Jk (λ)n = (λIk + N )n = λ N .
i=0
i

104
Таким образом, Jk (λ)n верхне‐треугольная, на каждой из диагоналей все элементы совпада‐
ют, а первая строка имеет вид
   
 n
Jk (λ)n 1,∗ = λn , nλn−1 , n(n − 1)/2 · λn−2 , . . . , λn−k+1 .
k−1

Вообще для аналитической функции f (то есть совпадающей со своим рядом Тей лора, на‐
пример, для многочлена) из формулы Тей лора следует следующее широкое обобщение: мат‐
рица f (Jk (λ)) верхне‐треугольная, на каждой из диагоналей все элементы совпадают, а пер‐
вая строка равна
  
 f ′′ (λ) f (k−1) (λ)
f Jk (λ) = f (λ), f ′ (λ), ,..., .
1,∗ 2 (k − 1)!

Следствие 5.4.1. Пусть f ∈ F [x], A ∈ M(n, F ) имеется собственные числа λ1 , . . . , λn ∈ F .


Тогда f (A) имеет собственные числа f (λ1 ), . . . , f (λn ).
Доказательство. Собственные числа не меняются при сопряжении, а для верхне‐треугольной
матрицы собственные числа это в точности диагональные элементы. Поэтому можно снача‐
ла привести матрицу к жордановой форме, а затем воспользоваться формулой выше.

Это следствие легко доказать и непосредственно, не обращаясь к жордановой форме. А именно, если det(λI −
A) = 0, то det(f (λ)I −f (A)) = det(f (λI)−f (A)) = 0. Чтобы это увидеть, покажем, что f (λI)−f (A) = (λI −A)g(A)
для некоторого многочлена g. Это условие является линей ным, а для мономов проверяется напрямую:
(λI)n − An = (λI − A)(An−1 + λAn−2 + . . . + λn−1 I).

Ранее мы уже видели, что у каждой матрицы A есть нетривиальный многочлен, ее анну‐
лирующий , а именно χA (см. Теорему 5.1.12). С другой стороны, иногда, как, например, для
вещественных симметрических матриц, есть и многочлен меньше степени, см. Предложе‐
ние 5.1.19.
Определение 5.4.2. Нетривиальный многочлен со старшим коэффициентом 1, аннулирую‐
щий данную матрицу и имеющий наименьшую возможную степень, называется минималь‐
ным многочленом данной матрицы.
Замечание 5.4.3. Минимальный многочлен существует и единственный .

Доказательство. Существование следует из существования аннулирующего многочлена и


полной упорядоченности натуральных чисел. Предположим, что существует два различных
аннулирующих многочлена f и g наименьшей степени. Тогда h = f − g имеет степень еще
меньше и тоже аннулирующий .

Обозначение 5.4.4. Минимальный многочлен матрицы A обозначается µA .


Предложение 5.4.5. Пусть λ1 , . . . , λk — полный список различных собственных чисел A, а
m1 , . . . , mk — наибольшие размеры соответствующих им жордановых клеток, встречающих‐
ся в жордановой форме A. Тогда

µA = (t − λ1 )m1 · . . . · (t − λk )mk .

Удивительно, но для следующего утверждения неизвестно доказательства, не использу‐


ющего так или иначе жорданову форму.

105
Предложение 5.4.6. Пусть A ∈ M(n, C). Тогда A и A⊤ сопряжены.

Доказательство. Если CAC −1 = J жорданова, то C −1 JC = A, откуда C ⊤ J ⊤ (C −1 )⊤ = A⊤ .


Так как (C −1 )⊤ = (C ⊤ )−1 , достаточно доказать, что J и J ⊤ сопряжены. Так как они имеют
одинаковую блочно‐диагональную структуру, достаточно доказать утверждение для жор‐
дановых клеток. Но для  
1
 . 
Sk =  ..  ∈ M(k, C)
1
выполнено Sk Jk (λ)Sk−1 ⊤
= Jk (λ) .

106
6 Билинейная алгебра
6.1 Билинейные формы и скалярные произведения
В евклидовой геометрии скялярное произведение двух векторов u, v определяется как |u| ·
|v| · cos θ, где θ — угол между u и v. Это понятие оказывается весьма полезным, но требует
для своего определения и понятие длины вектора, и понятие угла между векторами (точнее,
косинуса этого угла). Альтернативный путь — сначала определить скалярное произведение,
а уже на его основе ввести длину и угол.
Определение 6.1.1. Билинейной формой на векторном пространстве V (над полем F ) назы‐
вается отображение B : V × V → F , линей ное по каждому из аргументов, то есть

B(λu + µv, w) = λB(u, w) + µB(v, w) и B(u, λv + µw) = λB(u, v) + µB(u, w).

Примеры 6.1.2.
1. (u, v) 7→ |u||v| cos θ из обсуждения выше;

2. Если φ, ψ ∈ Hom(V, F ), то (u, v) 7→ φ(u) · ψ(v);


3. Для V = F n отображение (u, v) 7→ u⊤ · v.
Определение 6.1.3. Билиней ная форма B называется симметрической, если B(u, v) = B(v, u).
Среди перечисленных выше форм первая и третья являются симметрическими, а вторая
симметричная в случае, когда φ = ψ или когда один из множителей нулевой .
Линей ные отображения задавались при помощи матриц. Выясним, как задать билиней ‐
ную форму конечным набором данных. Для этого, как обычно, перей дем к пространству
столбцов.
Пусть e1 , . . . , en — базис V , и пусть u = x1 e1 + . . . + xn en , v = y1 e1 + . . . + yn en . Тогда в силу
билиней ности

B(u, v) = y1 B(u, e1 ) + . . . + yn B(u, en ) = B(u, e1 ), . . . , B(u, en ) · (y1 , . . . , yn )⊤ .

Рассмотрим внимательнее элементы возникшей строки:


⊤
B(u, ei ) = x1 B(e1 , ei ) + . . . + xn B(en , ei ) = (x1 , . . . , xn ) · B(e1 , ei ), . . . , B(en , ei ) .

Итого строка B(u, e1 ), . . . , B(u, en ) является результатом умножения строки (x1 , . . . , xn ) на
n
матрицу Be = B(ei , ej ) i,j=1 , и тогда

B(u, v) = u⊤
e · B e · ve .

Матрица Be называется матрицей Грама формы B относительно базиса e.


Замечание 6.1.4. Для данной формы B существует только одна такая матрица A, что для
любых u, v имеет место равенство B(u, v) = u⊤
e Av, а именно, A = Be .

Доказательство. При подстановке u = ei , v = ej получаем, что Ai,j = B(ei , ej ).

Замечание 6.1.5. Симметричность билиней ной формы эквивалентна симметричности ее


матрицы Грама в каком‐нибудь (любом) базисе.

107
Предложение 6.1.6. Пусть e, f — два базиса V . Тогда Bf = Cf⊤→e · Be · Cf →e .

Доказательство. По определению Be для любых векторов u, v выполнено B(u, v) = u⊤ e B e ve .


С другой стороны, ue = Cf →e uf и ve = Cf →e vf — подставляя эти выражения в предыдущее
равенство, получаем, что B(u, v) = u⊤ ⊤
f Cf →e Be Cf →e vf . В силу единственности матрицы Гра‐
ма Bf , получаем искомое равенство.
Определение 6.1.7. Симметрическая билиней ная форма B на векторном пространстве над
R называется скалярным произведением, если она положительно определена, то есть для лю‐
бого v 6= 0 выполнено B(v, v) > 0.
Замечание 6.1.8. Положительная определенность эквивалентна одновременному выпол‐
нению следующих двух условий :
• Положительная полуопределенность: B(v, v) > 0 для любого v;
• Определенность: B(v, v) = 0 только для v = 0.
Если на вещественном векторном пространстве
p задано скалярное произведение B, то дли‐
ну вектора можно определить как |v| = B(v, v), а угол θ между векторами u, v определяется
посредством равенства cos θ = B(u,v)
|u|·|v| .

6.2 Квадратичные формы


С каждой билиней ной формой B можно связать отображение QB : v 7→ B(v, v). Такое отобра‐
жение является однородным степени 2, то есть QB (λv) = λ2 QB (v). В таких случаях говорят,
что это квадратичное отображение.
Заметим сразу, что разным билиней ным формам может соответствовать одно и то же отоб‐
ражение, например, для билиней ных форм с матрицами ( 10 11 ) и ( 11 01 ). Дей ствительно, если
вектор v задается столбцом (x, y)⊤ , то
     
1 1 x 2 2 1 0 x
(x, y) = x + xy + y = (x, y) .
0 1 y 1 1 y

С другой стороны, если 2 6= 0 в базовом поле F , то симметрическая такая билиней ная форма
BQ восстанавливается по Q = QB однозначно, а именно
1 
BQ (u, v) = Q(u + v) − Q(u) − Q(v) .
2
Такая билиней ная форма называется поляризацией квадратичного отображения Q.
BQ билиней ная, так как ее можно выразить через исходную форму B следующим образом:
1  1 
BQ (u, v) = B(u + v, u + v) − B(u, u) − B(v, v) = B(u, v) + B(v, u) .
2 2

С другой стороны BQ (v, v) = 12 Q(2v) − 2Q(v) = Q(v).
Докажем единственность. Пусть B(v, v) = C(v, v) для всех v. В частности, B(u + v, u +
v) = C(u + v, u + v), иными словами (после раскрытия по билиней ности и использования
симметричности)

B(u, u) + 2B(u, v) + B(v, v) = C(u, u) + 2C(u, v) + C(v, v),

откуда B(u, v) = C(u, v).

108
Определение 6.2.1. Отображение Q : V → F называется квадратичной формой, если оно
квадратично и его поляризация является билиней ной формой .
Определение 6.2.2. Матрицей Грама квадратичной формы называется матрица Грама ее
поляризации.
Выше мы видели, что с квадратичным отображением связано также полиномиальное вы‐
ражение. После выбора в пространстве V (размерности n) базиса можно отождествить квад‐
ратичную форму Q с однородным многочленом степени 2 (от n переменных) следующим
образом.
Пусть B — матрица грама Q в базисе e. Положим
X
n
q(x1 , . . . , xn ) = Bi,j xi xj .
i,j=1

Ясно, что в этом определении можно использовать любую матрицу, но ее всегда можно по‐
лагать симметрической , заменив при необходимости на (B + B ⊤ )/2 — многочлен при этом
не изменится. При этом для вектора v со столбцом координат (a1 , . . . , an )⊤ значение Q(v)
можно вычислить как q(a1 , . . . , an ).
 
2 2 1 1/2
Пример 6.2.3. Однородному многочлену x + xy + y соответствует матрица 1 .
/2 1
Пример 6.2.4. Пусть V = R2 . Отображение (x, y)⊤ 7→ max(xy, 0) является квадратичным, но
не является квадратичной формой .

6.3 Диагонализация билинейных и квадратичных форм


Определение 6.3.1. Если базис e1 , . . . , en таков, что матрица Грама Be диагональная, то ба‐
зис e называется ортогональным, а форма диагонализированной. Иными словами, базис ор‐
тогонален, если любые два его различных элемента ортогональные, то есть B(ei , ej ) = 0 при
i 6= j.
Аналогично определяется диагонализированная квадратичная форма. В терминах одно‐
родных многочленов квадратичная форма от переменных x1 , . . . , xn является диагональной ,
если она выражается как линей ная комбинация квадратов переменных:
q(x1 , . . . , xn ) = λ1 x21 + . . . + λn x2n .
Естественным образом возникает вопрос, как для данной билиней ной или квадратичной
формы най ти базис или замену переменных, приводящие к диагональному виду. Начнем с
процедуры диагонализации квадратичной формы, известной как метод Лагранжа.
Алгоритм 6.3.2 (Диагонализация
Pn квадратичной формы методом Лагранжа).
Пусть q(x1 , . . . , xn ) = i,j=1 Aij xi xj , причем матрица A симметрическая, то есть A⊤ = A.
Ищем такую линей ную замену x = Cy, что q(x) = qe(y) = λ1 y12 + . . . + λn yn2 .
1. Проверяем, най дется ли в матрице A ненулевой диагональный элемент Aii 6= 0. Если
такого элемента нет, то най дем слагаемое вида 2Aij xi xj , Aij 6= 0 (двой ка появляется
из‐за наличия равных слагаемых Aij xi xj и Aji xj xi ), и сделаем замену
xi = yi + yj , x j = yi − yj , xk = yk при k 6= i, j.
При такой замене слагаемое 2Aij xi xj перей дет в 2Aij (yi2 −yj2 ), то есть в терминах новых
переменных появится ненулевой диагональный элемент.

109
2. Пусть теперь Aii 6= 0, чего всегда можно добиться с помощью предыдущего шага. Для
удобства обозначений будем считать, что i = 1 (кроме того, можно перенумеровать
переменные). Рассмотрим слагаемые, содержащие x1 , и выделим полный квадрат:
1
A11 x21 + 2A12 x1 x2 + . . . + 2A1n x1 xn = (A11 x1 + . . . + A1n xn )2 − q ′ ,
A11

где q ′ не содержит квадратов и переменной x1 .


3. Процедуру повторить для квадратичной формы q ′ от переменных x2 , . . . , xn .
В терминах матрицы A эта процедура может быть истолкована следующим образом. При
замене базиса e на базис f матрица Грама преобразуется по правилу Be 7→ Bf = Cf⊤→e Be Cf →e .
Цель состоит в нахождении такого базиса f , что Bf диагональная. Можно искать его по‐
средством нахождения матрицы перехода Cf →e . Поскольку всякая обратимая матрица пред‐
ставляется в виде произведения матриц элементарных преобразований , разумно искать по‐
следовательность элементарных преобразований , реализующих диагонализацию. При этом
матрица Грама будет домножаться справа на матрицу элементарного преобразования C, а
слева на C ⊤ .
Второй шаг диагонализации по Лагранжу тогда представляется как прибавление перво‐
го столбца ко всем остальным с такими коэффициентами, чтобы в первой строке все эле‐
менты, кроме первого, обратились в ноль. Если матрица A имеет в качестве первой строки
(A11 , A12 , . . . , A1n ) с A11 6= 0, то такое прибавление реализуется домножением справа на мат‐
рицу, отличающуюся от единичной только в первой строке, равной
 
−A12 −A1n
1, ,..., .
A11 A11

Домножение слева на матрицу, транспонированную к данной , обнуляет все элементы пер‐


вого столбца, кроме A11 (например, потому что при преобразовании A 7→ C ⊤ AC симметри‐
ческая матрица остается симметрической , а домножение слева на такую матрицу не меняет
первой строки).
Если же A11 = A22 = 0, но A12 6= 0 (индексы 1 и 2 выбраны для удобства), то простая
замена также приведет к предыдущему случаю:
     
1 1 0 a 1 1 2a 0
= .
1 −1 a 0 1 −1 0 −2a

В итоге матрица приведена к блочно‐диагональному виду с двумя блоками размеров 1 и


n−1, и процесс можно повторить для большого блока, что не изменит уже полученных нулей
в первых строке и столбце.
Предложенный выше способ построения ортогонального базиса начинает с некоторого
уже най денного базиса e и модифицирует его. Вообще же для невырожденной симметриче‐
ской билиней ной формы можно с самого начала строить ортогональный базис. Для этого
требуется понятие ортогонального дополнения.
Определение 6.3.3. Пусть B — симметрическая билиней ная форма на векторном простран‐
стве V , и U 6 V . Тогда ортогональным дополнением U (относительно B) называется

U ⊥ = {v ∈ V | ∀u ∈ U v ⊥ u} .

Замечание 6.3.4. U ⊥ 6 V .

110
Доказательство. Если v, w ∈ U ⊥ , то для любых λ, µ ∈ F и для любого u ∈ U выполнено
B(λv + µw, u) = λB(v, u) + µB(w, u) = 0.
Замечание 6.3.5. Если B невырожденная, то U ∩ U ⊥ = 0.
Предложение 6.3.6. Если B — невырожденная симметрическая билиней ная форма на ко‐
нечномерном пространстве B, то V = U ⊕ U ⊥ .
Доказательство. Пусть u1 , . . . , uk — базис U . Тогда v ∈ U ⊥ тогда и только тогда, когда B(v, u1 ) =
. . . = B(v, uk ) = 0. Это позволяет выразить U ⊥ как ядро линей ного отображения V 7→ F k :
 ⊤ 
U ⊥ = Ker v 7→ B(v, u1 ), . . . , B(v, uk ) .

Заметим, что это отображение сюръективно (для каждого i существует такой v, что B(v, ui ) 6=
0 и B(v, uj ) = 0 при j 6= i, то есть стандартный базис F k лежит в образе). Тогда по теореме
о размерности ядра и образа dim(U ) + dim(U ⊥ ) = dim(V ). Поскольку в силу предыдущего
замечания U ∩ U ⊥ = 0, сумма U + U ⊥ прямая и потому имеет размерность, равную сумме
размерностей слагаемых, так что совпадает со всем V .
Теорема 6.3.7. Для любой симметрической билиней ной формы B на конечномерном про‐
странстве V существует ортогональный базис.
Доказательство. Сначала сведем задачу к случаю невырожденной формы. Для этого рас‐
смотрим подпространство V ⊥ (называемое радикалом формы B). Дополним его прямым сла‐
гаемым U , тогда объединение ортогонального базиса U и любого базиса V ⊥ дает ортого‐
нальный базис V . Тем самым достаточно най ти ортогональный базис U относительно невы‐
рожденной формы B|U .
Будем теперь считать, что B невырожденная. Будем вести доказательство индукцией по
n = dim(V ). Случай n = 1 тривиален (любой базис одномерного пространства ортогонален).
Предположим, что n > 1. Поскольку B 6≡ 0, то най дется такой вектор e1 , что B(e1 , e1 ) 6= 0.
Тогда V = he1 i ⊕ he1 i⊥ . По индукционному предположению в пространстве he1 i⊥ (имеющем
размерность n − 1) най дется ортогональный базис e2 , . . . , en . Тогда e1 , e2 , . . . , en — ортого‐
нальный базис V .
Пусть e1 , . . . , en — базис V , и обозначим A = Be . Рассмотрим подпространства Vk = he1 , . . . , ek i
(в частности, V0 = 0). Тогда (B|Vk )e = (Aij )ki,j=1 = Ak (то есть подматрица A размера k × k,

раcположенная в левом верхнем углу). В частности, An = A и A1 = B(e1 , e1 ) .
Обозначим ∆k = det(Ak ) (в частности, ∆0 = 1). Эти определители называются угловыми
минорами.
Теорема 6.3.8 (диагонализация по Якоби).
Если ∆1 , ∆2 , . . . , ∆n 6= 0, то существует такой ортогональный базис f1 , . . . , fn , что fk ∈
ek + Vk−1 и B(fk , fk ) = ∆∆k−1k
.

Доказательство. Индукция по n = dim(V ). В случае n = 1 положим f1 = e1 , B(f1 , f1 ) =


∆1
∆1 = ∆ 0
.
Пусть теперь n > 1. Применим индукционное предположение к e1 , . . . , en−1 (базису Vn−1 ):
най дется такой ортогональный базис f1 , . . . , fn−1 пространства Vn−1 , что B(fk , fk ) = ∆∆k−1
k
и
fk ∈ ek + Vk−1 . Будем строить fn в виде
X
n−1
fn = e n + λi fi .
i=1

111
Поскольку искомый базис должен быть ортогональным, должны выполняться равенства

X
n−1
0 = B(fn , fi ) = B(en , fi ) + λj B(fj , fi ) = B(en , fi ) + λi B(fi .fi ).
j=1

Отсюда получаем, что λi = −B(e n ,fi )


B(fi ,fi ) . Поскольку fn ∈ / Vn−1 , векторы f1 , . . . , fn образуют базис
Vn .
Пусть C — матрица перехода от e1 , . . . , en к f1 , . . . , fn . Так как fk ∈ ek + . . . e1 , . . . , ek−1 i, она
верхне‐треугольная с 1 на диагонали, так что det(C)  = 1. Значит det(Bf ) = det(Be ) = ∆n . С
другой стороны, Bf = diag B(f1 , f1 ), . . . , B(fn , fn ) , так что det(Bf ) = B(f1 , f1 )·. . .·B(fn , fn ).

При этом ∆n−1 = det B|Vn−1 f = B(f1 , f1 ) · . . . · B(fn−1 , fn−1 ), откуда B(fn , fn ) = ∆∆n−1 n
.

Процесс построения базиса f1 , . . . , fn можно истолковать в геометрических терминах. А


именно, рассмотрим пару векторов e1 , e2 , и попробуем най ти пару ортогональных векторов
f1 , f2 , порождающих то же самое подпространство.

e2 − pre1 (e2 )
e2

f2 = pre1 (e2 )e1 = f1

Можно положить f1 = e1 , тогда для получения нужного вектора f2 можно вычесть из e2 его
проекцию на прямую, порожденную e1 . Проекция pre1 (e2 ) определяется как такое кратное
e1 , что при вычитании его из e2 получается вектор, ортогональный e1 . То есть pre1 (e2 ) = λe1 ,
B(e1 ,e2 )
где λ таково, что B(e1 , e2 − λe1 ) = 0 — отсюда λ = B(e 1 ,e1 )
.
Аналогично, если имеется три вектора e1 , e2 , e3 , из вектора e3 легко получить вектор, ор‐
тогональный e1 , e2 и находящий ся в том же трехмерном подпространстве — надо просто вы‐
честь из e3 его проекцию на плоскость he1 , e2 i. Последнее особенно просто, если e1 ⊥ e2 (чего
мы можем добиться, не меняя плоскость!) — надо вычесть из e3 проекции на e1 и e2 . Понятно,
как эта схема переносится на большее количество векторов. Такая интерпретация изложен‐
ной процедуры построения ортогонального базиса называется ортогонализацией Грама—
Шмидта. Как видно из теоремы о диагонализации по Якоби, для ее выполнимости требует‐
ся, чтобы в исходном базисе e1 , . . . , en все угловые миноры матрицы Грама были ненулевыми
— в частности, это выполнено, если билиней ная форма является скалярным произведением
(см. следующий раздел, хотя по процедуре и так видно, что делить надо только на B(v, v)).
Рассмотрим теперь, что описанная процедура означает в терминах матрицы Грама. Если в
диагонализации по Лагранжу на k‐м шаге подвергались изменениям все базисные векторы,
кроме первых k, то теперь, наоборот, на k‐м шаге меняется только k + 1‐й базисный вектор.
При этом обнуляться будут не элементы очередных строки и столбца, а только лишь часть
строки и столбца, принадлежащие угловой подматрице.

6.4 Классификация
Изучим теперь вопрос, однозначно ли определены диагональные элементы матрицы Гра‐
ма диагонализированной билиней ной формы. Вообще говоря, ответ на этот вопрос отрица‐
тельный — как минимум можно изменить порядок, в котором базисные векторы входят в

112
базис (что меняет порядок следования диагональных элементов), и домножить любой ба‐
зисный вектор на ненулевой скаляр λ (тогда соответствующий диагональный элемент до‐
множится на λ2 ).
В некоторых случаях указанных возможностей хватает, чтобы однозначно описать (с точ‐
ностью до замены базиса) все квадратичные формы. Например, если F = C, то любой скаляр
либо равен 0, либо является квадратом комплексного числа.

Предложение 6.4.1. Любая квадратичная форма над C приводится к сумме квадратов, то


есть имеет в некотором базисе матрицу Грама diag(1, . . . , 1, 0, . . . , 0), причем количество еди‐
ниц определено однозначно.
Доказательство. Соображения выше доказывают все, кроме однозначности такого пред‐
ставления. Заметим, что замена базиса не меняет ранг матрицы Грама (поскольку та до‐
множается слева и справа на обратимые матрицы), а у диагональной матрицы ранг равен
количеству ненулевых диагональных элементов.
В случае F = R для всякого скаляра x либо x = 0, либо x = y 2 , либо x = −y 2 для некоторо‐
го положительного y. Это означает, что выбором подходящего базиса матрицу Грама можно
сделать равной
diag(1, . . . , 1, −1, . . . , −1, 0, . . . , 0),
| {z } | {z }
k l

причем количество ненулевых элементов k + l определено однозначно и равно рангу мат‐


рицы Грама.
Такое представление для вещественных и комплексных квадратичных форм называется
нормальным видом.
Чтобы установить однозначность чисел k и l, надо воспользоваться понятием положи‐
тельной определенности.

Замечание 6.4.2. Положительно определенная квадратичная форма имеет нормальный вид


x21 + . . . + x2n .
Доказательство. Наличие −1 или 0 в диагонализации означало бы, что на соответствую‐
щем базисном векторе квадратичная форма принимает неположительное значение.
Теорема 6.4.3. Число k единиц в нормальном виде квадратичной формы Q является макси‐
мальной размерностью такого подпространства U 6 V , что Q|U положительно определена.
Доказательство. Если базис e таков, что Qe = diag(1, . . . , 1, −1, . . . , −1, 0, . . . , 0), то Q|⟨e1 ,...,ek ⟩
положительно определена. Покажем, что не существует такого подпространства большей
размерности. Предположим, что U 6 V таково, что Q|U положительно определена. Обозна‐
чим W = hek+1 , . . . , en i. Тогда для любого v ∈ W имеет место Q(v) 6 0. Это означает, что
U ∩ W = 0, откуда dim(U ) 6 k (так как dim(W ) = n − k и dim(U ) + dim(W ) = dim(U + W ) 6
n).
Следствие 6.4.4 (закон инерции вещественных квадратичных форм).
Числа k и l не зависят от выбора базиса для нормального вида вещественной квадратич‐
ной формы.

Доказательство. Число k определяется по предыдущей теореме как максимальная размер‐


ность подпространство, ограничение формы на которое положительно определено, а тогда
l однозначно восстанавливается как rk(Q) − k.

113
Определение 6.4.5. Числа k и l называются положительным и отрицательным индексами
инерции формы Q, а пара (k, l) — сигнатурой.

Можно также сказать, что отрицательный индекс инерции опредяется как максимальная размерность подпро‐
странства, ограничение на которое формы Q отрицательно определено, или, что то же самое, как положительный
индекс инерции формы −Q.

Теорема 6.4.6 (Якоби). Если ∆1 , . . . , ∆n 6= 0, то отрицательный индекс инерции равен ко‐


личеству перемен знака в последовательности 1, ∆1 , . . . , ∆n .
Доказательство. Количество перемен знака в последовательности угловых миноров мат‐
рицы Грама равно количеству отрицательных элементов внормальном виде квадратичной
формы.
Следствие 6.4.7 (критерий Сильвестра). Вещественная квадратичная форма является по‐
ложительно определенной тогда и только тогда, когда ∆1 , . . . , ∆n > 0.
Доказательство. Если квадратичная форма положительно определена, то положительно
определено и ее сужение на любое подпространство, в частности, на Vk = he1 , . . . , ek i. Но
∆k = det ((Q|Vk )e ) > 0.
Обратная импликация очевидна по теореме Якоби (или из теоремы о диагонализации ме‐
тодом Якоби).

6.5 Диагонализация ортогональным преобразованием


Ранее было доказано, что вещественный линей ный оператор, задаваемый симметрической
матрицей , диагонализируем. Иными словами, если A⊤ = A, то най дется такая обратимая
матрица C, что C −1 AC диагональна. Можно объединить это утверждение с результатами,
полученными выше для билиней ных форм, которые тоже задаются симметрическими мат‐
рицами.
Определение 6.5.1. Матрица O ∈ M(n, R) называется ортогональной, если O−1 = O⊤ .
Иными словами, матрица ортогональна, если ее столбцы попарно ортогональны и имеют
норму 1 относительно стандартного скалярного произведения на Rn . Дей ствительно, рас‐
смотрим, что означает равенство O⊤ · O = I:

(O⊤ · O)i,j = (O⊤ )i,∗ · O∗,j = (O∗,i )⊤ · O∗,j = δij .

Теорема 6.5.2. Если A ∈ M(n, R), A⊤ = A, то существует такая ортогональная матрица O,


что O−1 AO диагональна.
Доказательство. Столбцы такой матрицы O образуют базис из собственных векторов мат‐
рицы A.
Покажем, что собственные векторы, отвечающие различным собственным числам, орто‐
гональны. дей ствительно, пусть Au = λu и Av = µv, λ 6= µ. Тогда (u, Av) = µ(u, v) и (Au, v) =
λ(u, v). Но
(u, Av) = u⊤ Av = u⊤ A⊤ v = (Au)⊤ v = (Au, v),
откуда λ(u, v) = µ(u, v) и поэтому (u, v) = 0.
Если теперь для каждого собственного числа λ в подпространстве, образованном соответ‐
ствующим собственными векторами, выбрать ортогональный базис и каждый вектор от‐
нормировать к длине 1, то составленная из таких векторов матрица будет ортогональна.

114
Геометрический смысл состоит в том, что домножение на ортогональную матрицу дей ‐
ствует как движение, сохраняющее начало координат, то есть поворотами и отражениями.
Это значит, что вещественную квадратичную форму можно привести к диагональному виду
одними только поворотами. Такая процедура называется приведением к главным осям.

115
7 Теория полей
7.1 Простые расширения полей
Определение 7.1.1. Пусть F и K такие поля, что F ⊆ K. Тогда поле K называется расшире‐
нием поля F .

Примеры 7.1.2. Q ⊂ R ⊂ C, Q ⊂ Q[ 2], F ⊂ F (x).
Определение 7.1.3. Пусть f
g ∈ F (x). Можно считать, что f, g ∈ F [x] таковы, что f ⊥ g. Если
a ∈ F таково, что g(a) 6= 0, то определено значение f
g в точке a:
 
f f (a)
(a) = .
g g(a)

Определение 7.1.4. Пусть F ⊆ K — расширение полей , и α ∈ K. Определим поле, получен‐


ное присоединением α к F , как
 
f (α) f
F (α) = ∈ F (x), g(α) 6
= 0 ⊆ K.
g(α) g

Замечание 7.1.5. F (α) — поле.


Доказательство. Очевидно, что это подмножество поля K является кольцом (так как за‐
мкнуто относительно взятия сумм и произведений ). Остается показать, что всякий ненуле‐
вой элемент в нем обратим.
Если fg(α)
(α)
6= 0, то f (α) 6= 0, а тогда определено значение fg(α) f (α) g(α)
(α) , причем g(α) · f (α) = 1.

Обозначение 7.1.6. F (α) называется простым расширением поля F , порожденным α. Это


поле является наименьшим расширением поля F , содержащим α. Обратите внимание, что
результат не зависит от выбора конкретного расширения K, содержащего α.
√ √
Примеры 7.1.7. 1. C = R(i), 2. Q[ 2] = Q( 2).

Определение 7.1.8. Пусть F ⊆ K — расширение полей , и α ∈ K. Элемент α называется


алгебраическим над F , если существует такой f ∈ F [x], f 6= 0, то f (α) = 0. Если же элемент
α не является корнем никакого нетривиального многочлена с коэффициентами в F , то α
называется трансцендентным.
√ √
Примеры 7.1.9. π, π — трансцендентные над Q, но π — алгебраический над Q(π).
Замечание 7.1.10. Пусть α трансцендентен над F . Тогда для любой дроби f
∈ F (x) значе‐
  g
ние fg (α) определено, так как g(α) 6= 0.

f1 (α) f2 (α) f1 f2
Замечание 7.1.11. Пусть α трансцендентный . Если g1 (α) = g2 (α) , то g1 = g2 .

Доказательство. f1 (α)g2 (α) = f2 (α)g1 (α), откуда (f1 g2 − f2 g1 )(α) = 0, что возможно только
при f1 g2 − f2 g1 = 0, то есть gf11 = gf22 .

Следствие 7.1.12. Если α трансцендентный над F , то F (α) ∼


= F (x).

116
Это означает, что рациональные функции одно переменной представляют универсальную
модель для всех простых расширений , порожденных трансцендентными элементами. Такие
расширения называются простыми трансцендентными расширениями. В частности, с точ‐
ностью до изоморфизма нет разницы, какой именно трансцендентный элемент выбирать.
Для простых расширений , порожденных алгебраическими элементами, такой общей модели
нет, но все же есть способ описывать их, не вводя предварительно расширение K, в котором
выбирается алгебраический элемент.

Определение 7.1.13. Пусть α — алгебраический над F . Тогда многочлен f ∈ F [x], f 6= 0


называется минимальным многочленом α над F , если f (α) = 0 и степень f наименьшая воз‐
можная.
Замечание 7.1.14. Минимальный многочлен существует и единственный с точностью до
умножения на скаляр.
Доказательство. Предположить, что существуют два таких многочлена, отнормировать так,
чтобы старшие коэффициенты были равны 1, рассмотреть разность — это будет аннулиру‐
ющий многочлен меньшей степени.
Обозначение 7.1.15. Минимальный многочлен α над F обозначается µα,F или, если поле F
ясно из контекста, просто µα .
Примеры 7.1.16. 1. µi,R = x2 + 1, 2. µ√2,Q = x2 − 2.

Если рассматривать F (α) как векторное пространство над F , то минимальный многочлен элемента α совпадает
с минимальным многочленом линей ного оператора x 7→ αx, дей ствующего на F (α).

Замечание 7.1.17. µα,F неприводим над F .


Доказательство. Дей ствительно, если µα,F = f g, где f, g ∈ F [x], то либо один из f и g кон‐
станта, либо они имеют степень, меньшую deg µα,F , но при этом f (α)g(α) = µα,F (α) = 0, так
что один из них аннулирует α, что противоречит минимальности µα,F .
.
Замечание 7.1.18. Если f (α) = 0, то f .. µα .
Доказательство. gcd(f, µα ) = µα .

Определение 7.1.19. Степенью алгебраического элемента α называется deg(α) = deg(µα,F ).


Предложение 7.1.20. Если α алгебраический над F , то F (α) = {f (α) | f ∈ F [x]}.
Доказательство. Дей ствительно, если fg такая несократимая дробь, что g(α) 6= 0, то g ⊥ µα .
Тогда по теореме о линей ном представлении НОД най дутся такие A, B ∈ F [x], что gA+µα F =
1. Вычислим значение левой и правой частей на α: g(α)A(α) + µα (α)B(α) = 1, откуда A(α) =
1 f (α)
g(α) и тем самым g(α) = f (α)A(α).

Выясним теперь, когда значения двух многочленов на α совпадают. Если f (α) = g(α), то
f − g аннулирует α и потому f ≡ g (mod µα ).
Следствие 7.1.21. Элементы F (α) находятся в биективном соответствии с классами много‐
членов в F [x] относительно ≡µα .

Примеры 7.1.22. 1. C ∼ = R[x]/≡x2 +1 , 2. Q( 2) ∼
= Q[x]/≡x2 −2 .

117
Обозначение 7.1.23. Пусть F — поле, f ∈ F [x]. Положим

F [x]/(f ) = {[g] | g ∈ F [x]}, где [g] = [g]≡f = {h ∈ F [x] | h ≡ g (mod f )}.

Это коммутативное кольцо с 1 относительно операций

[g] + [h] = [g + h], [g][h] = [gh].



Примеры 7.1.24. 1. C ∼
= R[x]/(x2 +1) , 2. Q( 2) ∼
= Q[x]/(x2 −2) .
Пример 7.1.25. Рассмотрим поле F = F2 = Z/2Z из двух элементов. Над F2 есть только один
неприводимый многочлен степени 2, а именно, f = x2 +x+1. Дей ствительно, x2 +x−(x+1)x,
x2 + 1 = (x + 1)2 и x2 приводимы, а других произведений многочленов степени 1 нет.
Тогда F2 [x]/(f ) = 0, 1, ρ, ρ + 1 — поле из 4 элементов. Здесь ρ = [x], а умножение устроено
следующим образом:

ρ2 = [x]2 = [x2 ] = [x + 1] = [x] + [1] = ρ + 1,


ρ · (ρ + 1) = ρ2 + ρ = ρ + 1 + ρ = 1,
(ρ + 1)2 = ρ2 + 1 = ρ + 1 + 1 = ρ.

Предложение 7.1.26. Если f ∈ F [x] неприводим над F , то F [x]/(f ) является полем.


Чтобы доказать это предложение, нужна некоторая подготовка.

Определение 7.1.27. Класс [g] в F [x]/(f ) называется примитивным, если gcd(g, f ) = 1 (об‐
ратите внимание, что это не зависит от выбора конкретного представителя g).
Теорема 7.1.28. В F [x]/(f ) обратимы примитивные классы и только они.
Доказательство. Пусть gcd(g, f ) = 1, тогда най дутся такие A, B ∈ F [x], что gA + f B = 1.
Это означает, что gA ≡ 1 (mod f ) и [A] = [g]−1 .
Пусть теперь [g] обратим, то есть существует такой A ∈ F [x], что [g][A] = 1. Это означает,
что [gA] = 1, или, что то же самое, gA ≡ 1 (mod f ). Значит, существует такой B ∈ F [x], что
gA + f B = 1, откуда gcd(g, f ) = 1.
Доказательство Предложения. Если f неприводим, то для любого g ∈ F [x], не делящегося
на f , непременно g ⊥ f , то есть [g] примитивен и потому обратим.

Следствие 7.1.29. Если α алгебраический над F , то F (α) ∼


= F [x]/(µα,F ) .

7.2 Степень расширения


Определение 7.2.1. Пусть F ⊆ K — расширение полей . Тогда K можно рассматривать как
векторное пространство над F . Степенью расширения называется [K : F ] = dimF K. Расши‐
рение называется конечным, если оно имеет конечную степень.

Примеры 7.2.2. 1. [C : R] = 2, 2. [Q[ 2] : Q] = 2, 3. [F2 [x]/(x2 +x+1) : F2 ] = 2, 4. [F (x) : F ] = ∞,
5. [R : Q] = ∞.

Предложение 7.2.3. Пусть F ⊆ K ⊆ L — цепока расширений . Если [K : F ], [L : K] < ∞, то


[L : F ] = [L : K][K : F ].

118
Доказательство. Пусть α1 , . . . , αn — базис L над K, а β1 , . . . , βm — базис K над F . В частно‐
сти, в этих обозначениях n = [L : K] и m = [K : F ].
Рассмотрим произвольный элемент α ∈ L и разложим его по базису L над K:

α = γ1 α1 + . . . + γn αn ,

где γi — некоторые элементы поля K. Но теперь каждый из γi можно разложить по базису


K над F :
γi = λi,1 β1 + λi,2 β2 + . . . + λi,m βm ,
где λi,j ∈ F . Подставляя эти выражения для γi , получаем

X
n X
m
α= λi,j · βj αi .
i=1 j=1

Это означает, что набор {βj αi } i=1,...,n является порождающим для L как векторного про‐
j=1,...,m
странства над F . Покажем, что это базис — для этого проверим линей ную независимость.
Предположим, что для некоторых коэффициентов ci,j
n X
X m
ci,j · βj αi = 0.
i=1 j=1

Но можно сгруппировать слагаемые, имеющие множитель αi :


 
Xn X
m
 ci,j βj  · αi = 0.
i=1 j=1

Поскольку αi образуют базис L над K, в все коэффициенты такой линей ной комбинации
должны быть нулевыми:
X m
ci,j βj = 0.
j=1

Но так как βj сами линей но независимы над F , в каждой из таких линей ных комбинаций все
коэффициенты должны быть нулевыми, то есть ci,j = 0.

7.3 Алгебраические расширения


Определение 7.3.1. Расширение F ⊆ K называется алгебраическим, если все элементы K
алгебраичны над F .

Примеры 7.3.2. R ⊂ C, F2 ⊂ F2 [x]/(x2 +x+1) .


Теорема 7.3.3. Конечное расширение алгебраично.
Доказательство. Пусть [K : F ] = n < ∞. Тогда для α ∈ K элементы 1, α, α2 , . . . , αn линей но
зависимы над F (так как их количество превосходит размерность). Это означает, что суще‐
ствуют такие c0 , c1 , . . . , cn ∈ F , не все равные 0, что c0 ·1+c1 α+. . .+cn αn = 0, иными словами,
элемент α является корнем многочлена c0 + c1 x + . . . + cn xn и потому алгебраичен.

119
Замечание 7.3.4. Обратное неверно. Например, можно рассмотреть поле Q = {α ∈ C |
α алгебраично над Q} (то, что это поле, надо доказывать отдельно!). Поскольку существу‐
ют неприводимые многочлены над Q сколь угодно большой степени, [Q : Q] = ∞.
Другой пример — положить F2 = Q и Fn = Fn−1 (εn ), где εn — первообразный корень из
1 степени n. Тогда возникает цепочка нетривиальных расширений F2 ⊂ F3 ⊂ F4 ⊂ . . . Ясно,
что F = ∪∞ n=2 — тоже поле, причем [F : Q] = ∞, хотя расширение алгебраическое.

Теорема 7.3.5 (структура простых алгебраических расширений ).


Пусть α — алгебраический над F степени n, µα — его минимальный многочлен над F .
Тогда
1. F (α) ∼
= F [x]/(µα ) ,
2. [F (α) : F ] = n и 1, α, α2 , . . . , αn−1 — базис F (α) над F ,
.
3. Для любого β ∈ F (α) выполнено n .. deg(β).
Доказательство. Первый пункт уже доказан.
Второй пункт: дей ствительно, 1, α, α2 , . . . , αn−1 порождают F (α), так как у всякого f ∈
F [x] най дется такой g ∈ F [x], что f ≡ g (mod µα ) и deg(g) < n (остаток от деления f на µα ),
и потому f (α) = g(α), в то время как g(α) ∈ h1, α, . . . , αn−1 i. Линей ная независимость ука‐
занных элементов следует из того, что максимальная входящая в набор степень α меньше
степени минимального многочлена.
Для доказательства третьего пункта рассмотрим цепочку расширений F ⊆ F (β) ⊆ F (α),
тогда n = [F (α) : F ] = [F (α) : F (β)][F (β) : F ], но второй множитель по второму пункту
равен deg(β).
Замечание 7.3.6. Пусть f ∈ F [x] неприводим, а α и β — корни f . Тогда F (α) ∼
= F (β) посред‐
ством изоморфизма φ, дей ствующего тождественно на F (т.е. φ|F = idF ) и переводящего α
в β (φ(α) = β).
Доказательство. Оба поля изоморфны F [x]/(f ) посредством изоморфизмов, переводящих
α и β в [x]≡f .
Определение 7.3.7. Полем, полученным из F присоединением элементов α1 , . . . , αn , будем
называть
 
f (α1 , . . . , αn )
F (α1 , . . . , αn ) = f, g ∈ F [x1 , . . . , xn ], g(α1 , . . . , αn ) 6= 0 .
g(α1 , . . . , αn )

Альтернативно, можно определить такое расширение рекуррентной формулой F (α1 , . . . , αn ) =


F (α1 , . . . , αn−1 )(αn ).
Определение 7.3.8. Пусть F ⊆ K — расширение полей , f ∈ F [x], deg(f ) > 0. Говорят, что
f разложим над K, если существут такие α1 , . . . , αn ∈ K (не обязательно различные), что
f = a · (x − α1 ) · . . . · (x − αn ), где a ∈ F — старший коэффициент f .
K называется полем разложения f , если f разложим над K и, кроме того, K = F (α1 , . . . , αn ).
Смысл этого определения в том, что поле разложения является наименьшим расширени‐
ем, в котором данный многочлен оказывается разложим: если F ⊆ E ⊆ K и f разложим
также над E, то E = K (поскольку уже содержит все корни f ).
Теорема 7.3.9. Поле разложения f ∈ F [x] существует и единственно (с точностью до изо‐
морфизма, переставляющего корни и дей ствующего тождественно на F ).

120
Доказательство. Разложим f на неприводимые множители над F : f = f1 · . . . · fk , fi ∈ F [x]
неприводимы. Положим F1 = F [x]/(f1 ). Рассматривая f1 как многочлен в F1 [x], получаем

f = (x − α1 ) · . . . · (x − αm ) · g1 · . . . · gl ,

где gi ∈ F1 [x] неприводимы. Теперь положим F2 = F1 [x]/(g1 ) и снова выделим линей ные
множители, отвечающие g1 . Будем продолжать таким же образом, пока не получим разло‐
жение f = a · (x − α1 ) · . . . · (x − αn ). Хотя на каждом шаге количество неприводимых множи‐
телей может увеличиваться, суммарная степень множителей степени больше 1 (то есть не
линей ных, которые требуется разложить) строго убывает, поэтому процесс будет завершен
за конечное число шагов (альтернативно: у f не может получиться корней больше, чем его
степень — это дает еще и ограничение на число шагов).
Единственность следует из Замечания 7.3.6 и рекуррентного определения для таких рас‐
ширений .

7.4 Конечные поля


Нам уже известны некоторые примеры конечных полей : Fp = Z/pZ для простого p (состоит
из p элементов) и F2 [x]/(x2 + x + 1) — поле из 4 элементов. Ясно также, что любое конечное
расширение конечного поля снова является конечным полем. Цель настоящего раздела —
классифицировать и описать все конечные поля.
Определение 7.4.1. Характеристикой поля F называется наименьшее натуральное n, что
сумма n единиц поля F равно 0 — или 0, если такого n не существует. Обозначение: char(F ).

Пример 7.4.2. char(Fp ) = p.


Замечание 7.4.3. Если F ⊆ K, то char(K) = char(F ).
Замечание 7.4.4. Если char(F ) > 0, то это простое число.

Доказательство. Пусть char(F ) = m · n, где m, n 6= 1. Тогда

0 = 1 + . . . + 1 = 1 + . . . + 1 + . . . + 1 + . . . + 1 = (1 + . . . + 1) · (1 + . . . + 1),
| {z } | {z } | {z } | {z } | {z }
mn m m m n
| {z }
n

и оба множителя не равны 0 (число слагаемых меньше характеристики).

Определение 7.4.5. Пусть F поле. Тогда E ⊆ F называется простым подполем, если E не


содержит подполей .
Замечание 7.4.6. Простое подполе F это либо Q, либо Fp , в зависимости от char(F ).
Доказательство. Пусть E — простое подполе F . Тогда 1 ∈ F . Если char(F ) = p > 0, то
{1, 2, 3, . . . , p − 1, 0} ⊆ E, а это уже Fp . Если же char(F ) = 0, то для любого n ∈ N соответству‐
ющий элемент F не равен 0. Это означает, что в E вкладывается кольцо целых чисел Z, а
тогда вместе с каждой парой ненулевых целых чисел m, n в E попадает и их частное, а тогда
Q ⊆ E.
Следствие 7.4.7. Если поле F конечное, что char(F ) > 0.

Лемма 7.4.8. Пусть |K| < ∞, F ⊆ K, |F | = q. Тогда |K| = q m , где m = [K : F ].

121
Доказательство. K является конечномерным векторным пространством над F , то есть как
векторное пространство изоморфно F m . Количество элементов последнего равно q m .
В качестве моментального следствия из уже полученных результатов получаем следую‐
щий фундаментальный результат.
Теорема 7.4.9. Пусть F — конечное поле. Тогда най дутся такое простое p и натуральное n,
то |F | = pn .
Доказательство. p = char(F ), а n — степень F над его простым подполем.
Следующая наша задача — классифицировать все конечные поля данного размера. Нач‐
нем с нескольких вспомогательных утверждений . Следующий результат является прямым
обобщением малой теоремы Ферма.
Лемма 7.4.10. Пусть |F | = q. Тогда для любого a ∈ F выполнено aq = a.
Доказательство. Если a = 0, то все ясно. Пусть a 6= 0. Рассмотрим цепочку степеней a, начи‐
ная с нулевой :
1, a, a2 , a3 , . . .
В какой ‐то момент начнутся повторы (так как все происходит внутри конечного множества).
Если ak = al с k > l, то ak−l = 1, так что первый повтор — единица. Обозначим полученное
множество степеней A:
A = {1, a, a2 , . . . , ak−1 },
где ak = 1. Введем следующее отношение эквивалентности на F ∗ = F \ {0}:
x
x∼y ⇔ ∈ A.
y

Это дей ствительно эквивалентность: 1 ∈ A (рефлексивность); так как a−1 = ak−1 , из xy ∈ A


следует xy ∈ A (симметричность); A замкнуто относительно умножения, так что из xy , yz ∈ A
следует xz ∈ A (транзитивность). Значит, F ∗ разбивается в объединение непересекающихся
классов эквивалентности.
Заметим, что все классы имеют одинаковый размер. Дей ствительно, между классами [x]∼
и [y]∼ легко построить биекцию, а именно z 7→ xy z (это биекция, потому что есть обратное
отображение z 7→ xy z). Значит, |[x]∼ | = |[1]∼ | = |A| = k, так что |F ∗ | делится на k. Поскольку
|F ∗ | = q − 1 и ak = 1, получаем, что aq−1 = 1.
Определение 7.4.11. Для a ∈ F ∗ положим ord(a) = min{n ∈ N | an = 1} — порядок a.
Замечание 7.4.12. Если |F | = q, то ord(a) | q − 1.
Лемма 7.4.13.
Q Если |F | = q, E ⊆ F , то xq −x ∈ E[x] раскладывается на линей ные множители
x − x = a∈F (x − a) и F — поле разложения xq − x.
q

Доказательство. По предыдущей лемме каждый элемент F является корнем xq − x, в то


время как по теореме Безу у xq − x не больше q корней (и все они перечислены в указанном
разложении). Ясно также, что поле F можно получить присоединением всех его элементов
к полю E (хватит и меньшего их количества).
Теорема 7.4.14 (существование и единственность конечных полей ).
Для любого простого p и любого натурального n существует поле F из q = pn элементов.
Любое поле из pn элементов является полем разложения xq − x над Fp .

122
Доказательство. Докажем сначала существование. Пусть F — поле разложения xq − x над
Fp . Многочлен xq − x имеет q различных корней , так как его производная (xq − x)′ = qxq−1 −
1 = −1 не имеет общих корней с xq − x.
Положим S = {a ∈ F | aq − a = 0} — это подполе F . Дей ствительно, 0, 1 ∈ S, (a − b)q =
a − bq = a − b (так что a − b ∈ S), (ab−1 )q = aq · (b−1 )q = aq · (bq )−1 = ab−1 (так что ab−1 ∈ S).
q

xq − x разложим в S, следовательно, S = F , так что |F | = q.


Единственность следует по Лемме из того, что |F | = pn и Fp ⊆ F .
Обозначение 7.4.15. Для q = pn будем обозначать Fq поле из q элементов. Часто Fq еще
обозначают GF (q) и называют полем Галуа.

7.5 Строение конечных полей


Теорема 7.5.1. Пусть |F | = q = pn . Любое подполе поля F состоит из pm элементов, где m | n.
Обратно, если m | n, то существует подполе порядка pm , причем только одно.
Доказательство. Если Fp ⊆ E ⊆ F , то |E| = pm , где m = [E : Fp ], и n = [F : Fp ] = [E :
Fp ] · [F : E].
Обратно, заметим, что (x − 1) | (xk − 1), так как xk − 1 = (x − 1)(xk−1 + xk−2 + . . . + 1). Если
m | n, то pm − 1 | pn − 1 (если n = mk, подставим x = pm в соотношение для многочленов).
Если a | b, то xa − a | xb − 1 (если a = bc, подставим xa в соотношение для многоченов).
Совмещая два наблюдения, получам, что xp −1 − 1 | xp −1 − 1, откуда xp − x | xp − x.
m n m n

m m
Следовательно, всякий корень xp −x является корнем xp −x = xq −x, а значит, Fq содержит
m
поле разложения xp − x над Fp , которое состоит из pm элементов.
Если есть два таких подполя, то вместе они содержат больше чем pm корней многочлена
pm
x − x, противоречие.
Пример 7.5.2. На диaграмме ниже представлены все подполя поля из 230 элементов.

GF (230 )

GF (26 ) GF (210 ) GF (215 )

GF (22 ) GF (23 ) GF (25 )

GF (2)

Теорема 7.5.3. F∗q — циклическая группа, то есть существует такой a ∈ Fq , что

F∗q = {1, a, a2 , . . . , aq−2 }.

Доказательство. Случай q = 2 ясен. Пусть q > 3. Обозначим h = |F∗q | = q − 1 и разложим его


на простые множители: h = pr11 · . . . · prmm . Для каждого i = 1, . . . , m многочлен xn/pi − 1 имеет
не больше n/pi корней в Fq . Так как n/pi < h, най дется элемент ai ∈ Fq , не являющий ся
r r
h/pi i (pi i )
корнем xn/pi − 1. Положим bi = ai , так что bi = 1. Тогда, в частности, ord(bi )|pri i , то
ri −1
p h/p
есть ord(bi ) = psi i для некоторого si = 1, . . . , ri . Поскольку bi i = ai i 6= 1, получаем, что в
ri
дей ствительности si = ri и ord(bi ) = pi .
Положим b = b1 · . . . · bm . Докажем, что ord(b) = h. Так как по построению bh = 1, имеем
ord(b) | h. Пусть ord(b) < h. Най дется такой индекс i, что ord(b) | h/pi , скажем, i = 1. Тогда

123
h/p1 h/p1 h/p1 r h/p1
1 = bh/p1 = b1 · b2 · . . . · bm . Если j = 2, . . . , m, то pj j | h/p1 , следовательно, bi = 1,
h/p
откуда b1 1 = 1, то есть ord(b1 ) | h/p1 . Но ord(b1 ) = pr11 , противоречие. Значит, в качестве
искомого элемента a можно выбрать b.
Определение 7.5.4. Такой элемент a называется примитивным элементом поля Fq .

Следствие 7.5.5. Fq ⊆ Fr — простое расширение, и для любого примитивного элемента ξ


поля Fr выполнено Fr = Fq (ξ).
Следствие 7.5.6. Для любого конечного поля Fq и для любого n ∈ N существует неприво‐
димый f ∈ Fq [x], deg(f ) = n.

Доказательство. Пусть Fq ⊆ Fr — расширение степени n, |Fr | = q n . Тогда Fr = Fq (ξ) и,


следовательно, µξ,Fq ∈ Fq [x] имеет степень [Fr : Fq ] = n и неприводим.

124
8 Коды с коррекцией ошибок
8.1 Линейные коды
Код с коррекцией ошибок это способ так представить сообщение, чтобы при передаче его
по ненадежному каналу связи возникающие ошибки, если они не слишком многочисленны,
можно было обнаружить и, в идеале, исправить на стороне приемника. Мы всегда будем по‐
лагать, что сообщение представлено последовательностью бит, каждый из которых прини‐
мает одно из q значений , которые мы трактуем как элементы поля из q элементов — в про‐
стей шем и наиболее важном случае q = 2 биты принимают два значения 0 и 1 (такие коды
называют двоичными).
В дальней шем мы будем трактовать запись b1 b2 . . . bm как вектор‐столбец (b1 , b2 , . . . , bm )⊤ ∈
Fq .
m

Код мы будем понимать как отображение кодирования Fkq → Fnq , сопоставляющее каждо‐
му сообщению из k бит кодовое слово из n бит.

Примеры 8.1.1. Простей шие примеры кодирования доставляются стуледующими двумя


примерами.
1. Код с одной проверкой четности: сообщению b1 b2 . . . bk сопоставляется b1 b2 . . . bk bk+1 ,
где bk+1 = b1 + . . . + bk (сумма в поле Fq ). В случае q = 2 последний бит содержит
информацию о четности количества единиц в исходном сообщении — если при пере‐
даче произой дет одна ошибка (или, более общно, нечетное число ошибок), то послед‐
ний бит принятого сообщения не будет равен сумме предыдущих, но установить, ка‐
кой именно бит принят неверно, невозможно. В общем случае такой код следовало бы
называть скорее кодом с одной контрольной суммой , но здесь и далее почти вся тер‐
минология отражает особенности двоичного случая.

2. Код с повторениями: сообщению из одного бита b сопоставляется bb . . . b (n повторе‐


ний ) — здесь правильное исходное сообщение восстанавливается как значение, при‐
сутствующее в наибольшем числе бит принятого сообщения.
Нас будет интересовать главным образом не процедура кодирования, а множество кодо‐
вых слов — предполагается, что соответствие между исходными сообщениями и кодовыми
словами известно обоим сторонам, и задача состоит в правильном восстановлении кодово‐
го слова по принятому сообщению. Нас будут интересовать коды, в которых кодирование
задается линей ным отображением. Мы всегда предполагаем, что отображение кодирования
инъективно (иначе приемник даже с правильным кодовым словом не сможет восстановить
исходной сообщение).
Определение 8.1.2. Код C называется линейным, если он является подпространством про‐
странства принимаемых сообщений Fnq . Тогда он является инъективным образом простран‐
ства исходных сообщений Fkq , и тем самым имеет размерность k.
Число n называется длиной кода C, k — размерностью C, а сам C в таком случае называ‐
ется (n, k)‐кодом.

Поскольку C является подпространством, оно выделяется набором однородных линей ‐


ных уравнений , то есть
C = {x ∈ Fnq | Hx = 0}
для некоторой матрицы H ∈ M(n − k, n, Fq ). Такая матрица H называется проверочной мат‐
рицей линей ного кода C.

125
Простей ший способ построить линей ный код — прямое обобщение кода с одной провер‐
кой четности — формировать кодовое слово в виде

a1 a2 . . . ak bk+1 . . . bn .
исходное проверочные
сообщение символы

Тогда всякое кодовое слово такого вида удовлетворяет системе линей ных уравнений с мат‐
рицей H = (A|In−k ), где A ∈ M(n − k, k, Fq ). А именно,

(A|In−k ) · (a1 , . . . , ak , bk+1 , . . . , bn )⊤ = A · (a1 , . . . , ak )⊤ + In−k · (bk+1 , . . . , bn )⊤ .

Если проверочные символы определяются через символы исходного сообщения посредством


линей ного отображения
(bk+1 , . . . , bn )⊤ = B · (a1 , . . . , ak )⊤ ,
то при A = −B указанная H дей ствительно является проверочной матрицей для такого
кода.

Примеры 8.1.3.
1. Для кода с одной проверкой четности

H = −1 −1 ... −1 1 .

2. Для кода с повторениями  


−1 1
 .. .. 
H= . . .
−1 1

Поскольку строчные преобразования не меняют пространства решений , одному коду со‐


ответствуют различные проверочные матрицы. Более того, всегда можно выбрать прове‐
рочную матрицу в приведенной эшелонированной форме, то есть как в примере выше: H =
(A|In−k ). Такая форма проверочной матрицы называется каноническим видом.
Наряду с проверочной матрицей можно также определить порождающую матрицу линей ‐
ного кода, а именно, это в точности матрицы линей ного отображения кодирования. Если мы
рассматриваем код как множество кодовых слов и забываем про процедуру кодирования, то
порождающую матрицу можно определить как такую G ∈ M(n, k, Fq ), то C = Im(G) = {Gx |
x ∈ Fkq }. В качестве G можно выбрать матрицу, составленную из любых k линей но незави‐
симых векторов кода C.

Замечание 8.1.4. HG = 0.
В случае, когда проверочная матрица H = (A|In−k ) записана в каноническом виде, можно
явно выбрать порождающую матрицу в виде
 
Ik
G= .
−A

Линей ность кода C означает, кроме прочего, что вместе с любыми x, y ∈ C также x + y ∈ C
и λx ∈ C для любого λ ∈ Fq .

126
8.2 Исправление ошибок в линейных кодах
Пусть исходное сообщение преобразовано в кодовое слово x = x1 . . . xn , а приемник получил
сообщение y = y1 . . . yn . Внесенные при передаче ошибки описваются вектором ошибок e =
y − x = e1 . . . en . Процесс исправления ошибок должен по принятому сообщению y най ти
наиболее вероятное кодовое слово x — предполагая, что вектор ошибок «мал». Для начала
надо определить, в каком смысле вектор ошибок мал и в каком смысле сообщения близки.
Определение 8.2.1. Расстоянием Хэмминга между векторами x = x1 . . . xn и y = y1 . . . yn
называется число позиций , в которых они различаются: dist(x, y) = |{i | xi 6= yi }|.
Замечание 8.2.2. Для двоичных кодов dist(x, y) = dist(y − x, 0).
Определение 8.2.3. Вес Хэмминга wt(z) = dist(z, 0) — количество ненулевых элементов
вектора z.
С каждым кодом связана важная характеристика, выражающая, насколько плотно распо‐
ложены в пространстве принимаемых сообщений кодовые слова.
Определение 8.2.4. Минимальное расстояние кода C
d = dmin = min{dist(x, y) | x, y ∈ C, x 6= y}.
Для двоичных кодов dmin = min{wt(x) | x ∈ C, x 6= 0}.
Код длины n, размерности k и с минимальным расстоянием d называется (n, k, d)‐кодом.
Теорема 8.2.5. Код с минимальным расстоянием d исправляет b d−1
2 c ошибок. Если d четное,
то код, кроме того, обнаруживает d2 ошибок.
Доказательство. Если d = 2m или d = 2m + 1, то все векторы, отстоящие от кодового слова
x на расстояние Хэмминга не больше m, находятся ото всех других кодовых слов на большем
расстоянии. Если d = 2m, то вектор, находящий ся на расстоянии m от двух кодовых слов x
и y, не может являться кодовым словом и находится от других кодовых слов на не меньшем
расстоянии.
Рассмотрим теперь вопрос о том, как най ти кодовое слово, ближай шее к данному приня‐
тому сообщению.
Определение 8.2.6. Смежным классом вектора a ∈ Fnq называется
a + C = {a + x | x ∈ C}.
С этим понятием уже встречалось под названием «аффинное подпространство» (см. Опре‐
деление 4.2.16 и далее). В частности, принадлежность к одному смежному классу — отноше‐
ние эквивалентности.
В каждом смежном классе имеются векторы наименьшего веса Хэмминга — выберем в
каждом смежном классе по одному такому и назовем его лидером смежного класса. Итого все
пространство принимаемых сообщений разбивается в дизъюнктное объединение конечно‐
го набора смежных классов a0 +C, . . . , ar +C. Без ограничения общности можно считать, что
a0 = 0 соответствующий смежный класс состоит из кодовых слов. Если принятое сообщение
y попало в смежный класс ai + C, то есть y = ai + x для некоторого x ∈ C, то возможные
векторы ошибок лежат в том же смежном классе:
e = y − x′ = ai + x − x′ ∈ ai + C.
Расположим все принимаемые сообщения в следующей таблице, именуемой стандартным
расположением:

127
Кодовое слово x(1) = 0 x(2) ... x(m)
Смежный класс a1 a1 + x(1) = a1 a1 + x(2) ... a1 + x(m)
.. .. .. ..
. . . .
Смежный класс ai ai + x(1) = ai ai + x(2) ... ai + x(m)
.. .. .. ..
. . . .

Для нахождения правильного кодового слова x достаточно отыскать в данной таблице при‐
нятое сообщение y — тогда в первой строке соответствующего столбца будет стоять x.
Для ускорения этой процедуры можно использовать следующее обстоятельноство: с каж‐
дым принимаемым сообщением y можно связать вектор Hy — и если y = x + e, то Hy =
Hx + He = He, то есть эта величина зависит не от самого y, а от соответствующего смеж‐
ного класса. Hy = He называется синдромом ошибки (обозначается S(y)) и позволяет, бу‐
дучи единожды наденным для каждого смежного класса, сразу находить строку стандарт‐
ного расположения, в которой находится принятое сообщение y.
Замечание 8.2.7.
1. S(y) = 0 тогда и тольк тогда, когда y ∈ C и сообщение передано без ошибок.
2. Векторы принадлежат одному смежному классу тогда и только тогда, когда их синдро‐
мы равны.
3. Пусть код с проверочной матрицей H двоичный . Если ошибки допущены в позициях
i1 , . . . , il , то He = H∗,i1 + . . . + H∗,il .

8.3 Код Хэмминга


Последнее замечание показывает, что при одиночной ошибке в двоичном коде синдром ошиб‐
ки будетстолбцом проверочной матрицы. Таким образом, для исправления одиночной ошиб‐
ки достаточно, чтобы столбцы проверочной матрицы находились в биективном соответ‐
ствии с возможными позициями ошибок. Вскоре мы построим такой код, но сперва устано‐
вим некоторые пределы, связывающие длину, размерность и исправляющую способность
кода.
Теорема 8.3.1 (Граница Хэмминга).
Пусть C — двоичный линей ный (n, k)‐код, исправляющий t ошибок. Тогда
      
n n n
2 · 1+
k
+ + ... + 6 2n .
1 2 t
Доказательство. Шары радиуса  t с центрами в кодовых словах не пересекаются, в каждом
таком шаре содержится 1 + n1 + n2 + . . . + nt векторов, всего таких шаров 2k , а векторов
в объемлющем пространстве 2n . Результат получается сравнением суммарного количества
векторов во всех этих шарах и размера пространства.
Выберем теперь такую матрицу H, чтобы все ее столбцы были отличны от нуля и раз‐
личны. Если мы рассматриваем матрицы высоты r > 2, то при выборе максимальной такой
матрицы получим H ∈ M(r, 2r − 1, F2 ). Код с такой проверочной матрицей называется кодом
Хэмминга и исправляет одну ошибку (d = 3).
Значение минимального расстояния получено из Теоремы 8.2.5 и наличия кодового слова
веса 3.

128
Замечание 8.3.2. Для кода Хэмминга в границе Хэмминга достигается равенство (при t = 1).
Доказательство. Длина кода Хэмминга вычисляется как n = 2r − 1, а размерность k = 2r −
1 − r. В каждом шаре радиуса 1 содержится n + 1 = 2r вектором, итого 2k · 2r = 22 −1−r · 2r =
r

22 −1 = 2n .
r

8.4 Циклические коды


Определение 8.4.1. Код C называется циклическим, если вместе с любым вектором содер‐
жит все его циклические сдвиги, то есть из c1 . . . cn ∈ C следует cl . . . cn c1 . . . cl−1 ∈ C.
Сопоставим каждому вектору c = c0 . . . cn−1 ∈ Fnq многочлен c(x) = c0 + c1 x + . . . +
cn−1 xn−1 ∈ Fq [x]. Можно пой ти чуть дальше и рассматривать такие многочлены степени
меньше n как элементы кольца Rn = Fq [x]/(xn − 1). В нем умножение на [x] соответствует
циклическому сдвигу:

[c0 + c1 x + . . . + cn−1 xn−1 ] · [x] = [cn−1 + c0 x + c1 x2 + . . . + cn−2 xn−1 ],

так как (c0 + c1 x + . . . + cn−1 xn−1 ) · x ≡xn −1 cn−1 + c0 x + c1 x2 + . . . + cn−2 xn−1 . Код C можно
рассматривать как подпространство векторного пространства Rn над полем Fq . Тогда алгеб‐
раическая структура кольца позволяет выразить цикличность кода:
Замечание 8.4.2. Код C 6 Rn циклический , если xC ⊆ C. Эквивалентно, f C ⊆ C для любого
f ∈ Rn .
Пример 8.4.3. Пусть g ∈ Rn . Положим C = (g) = gRn = {gf | f ∈ Rn }. Тогда для любого h ∈
Rn выполнено h · (f g) = (hf )g ∈ (g), то есть код циклический . В таком случае g называется
порождающим многочленом кода C.
Теорема 8.4.4.
1. Каждый циклический код содержит нетривиальный многочлен g наименьшей степе‐
ни, причем если потребовать, чтобы старший коэффициент был равен 1, то такой g бу‐
дет единственным.
2. C = (g).
3. g | xn − 1.
4. Для любого c ∈ C най дется единственный такой f ∈ Fq [x], что c = f g и deg(f ) <
n − deg(g) (тогда равенство можно рассматривать уже в Fq [x], а не в Rn ).
Доказательство. Первый пункт очевиден, второй следует из возможности деления много‐
членов с остатком и цикличности кода.
Для доказательства пункта (3) поделим xn − 1 на g с остатком: xn − 1 = q(x)g(x) + r(x), где
deg(r) < deg(g). Но тогда r ∈ C, что в силу минимальности степени g влечет r = 0. Значит, g
делит xn − 1. Обозначим h = (xn − 1)/g.
Пусть теперь c ∈ C. В силу второго пункта c ≡ qg (равенство в Rn ) для некоторого мно‐
гочлена q. Рассмотрим произведение qg как многочлен над Rq и поделим его с остатком на
xn − 1:
qg = u · (xn − 1) + v = uhg + v.
Поскольку qg и uhg делятся на g, то v тоже, то есть v = wg для некоторого w. При этому
deg(v) < n, так что deg(w) < n−deg(g). Итого qg = (uh+w)·g ≡ wg. Значит, можно положить
f = w.

129
Следствие 8.4.5. Циклический код C с порождающим многочленом g состоит из многочле‐
нов f g, где deg(f ) < n − deg(g), а кодирование осуществляется отображением f 7→ f g.
Если порождающий многочлен имеет вид g = g0 +g1 x+. . .+gr xr , то порождающая матрица
соотвествующего кода имеет вид
 
g0
g1 g0 
 
 .. . 
 . g1 . . 
  
 . . .. g 
G = gr ..  = g|xg| . . . |xn−r−1 g .
 0 
 gr g1 
 
 .. .
 . .. 
gr

Многочлен h = (xn − 1)/g называется проверочным многочленом, так как для c ∈ C выпол‐
нено c = f g и, следовательно, ch = f gh ≡ 0.
Определенный ранее код Хэмминга с параметром r длины 2r − 1 имеет проверочной мат‐
рицей матрицу, составленную из всех ненулевых двоиных столбцов высоты r. Пусть α —
примитивный элемент поля GF (2r ), тогда все элементы 1, α, α2 , . . . , α2 −2 различны и мо‐
r

гут быть представлены (по отношению к какому‐нибудь базису e векторного пространства


GF (2r ) над GF (2)) как различные двоичные столбцы высоты r. Тогда проверочная матрица
может быть записана в виде 
H = 1e |αe | . . . |αe2 −2 .
r

Вектор c = c0 . . . cn−1 является кодовым словом тогда и только тогда, когда

X
n−1
Hc = 0 ⇔ ci αi = 0 ⇔ c(α) = 0.
i=0

Нетривиальный многочлен наименьшей степени, аннулирующий α, называется его мини‐


мальным многочленом, так что код Хэмминга с параметром r является циклическим с по‐
рождающим многочленом µα,F2 , где α — примитивный элемент GF (2r ).

8.5 Коды Боуза—Чоудхури—Хоквингема


Пусть n ⊥ q. Рассмотрим многочлен xn −1. Рассмотрим GF (q m ) — поле разложения xn −1 над
GF (q). Производная (xn − 1)′ = nxn−1 взаимна проста с xn − 1, так как n и q взаимно просты.
Следовательно, xn − 1 не имеет кратных корней . Значит, в GF (q m ) имеется n различных
элементов α0 = 1, α1 , . . . , αn−1 , образующих множество всех корней степени n из 1.
Обозначим β примитивный элемент GF (q m ). Тогда αi = β di для каких‐то di . Положим d =
gcd(d0 , . . . , dn−1 ). Тогда по теореме о линей ном представлении НОД d = a0 d0 + . . . + an−1 dn−1
для каких‐то целых ai . Рассмотрим α = β d . Тогда
a
β d = β a0 d0 +...+an−1 dn−1 = (β d0 )a0 · . . . · (β dn−1 )an−1 = α0a0 · . . . · αn−1
n−1

и потому α является корнем степени n из 1. При этом αi = αdi /d , то есть все корни степени n
из 1 выражаются как степени α. Такой элемент α называется примитивным корнем степени
n из 1 над Fq .

130
Теорема 8.5.1 (граница БЧХ).
Пусть α — примитивный корень степени n из 1 над Fq . Пусть C — циклический код с таким
порождающим многочленом g, что для некоторых b > 0 и δ > 1 выполнено
g(αb ) = g(αb+1 ) = . . . = g(αb+δ−2 ) = 0.
Тогда dmin > δ.
Доказательство. Если c = c0 . . . cn−1 ∈ C, то, поскольку как многочлены все элементы C
делятся на g,
c(αb ) = c(αb+1 ) = . . . = c(αb+δ−2 ) = 0.
Иными словами, если положить
 
1 αb α2b ... α(n−1)b
1 αb+1 α2(b+1) ... α(n−1)(b+1) 
 
H′ =  . .. .. .. ,
 .. . . . 
1 αb+δ−2 α2(b+δ−2) ... α(n−1)(b+δ−2)
то H ′ c = 0. Тем самым матрица H ′ является частью истинной проверочной матрицы ко‐
да C (которая отличается, возможно, добавлением еще каких‐то строк, выражающих допол‐
нительные уравнения, которым удовлетворяют кодовые слова). Чтобы показать, что любое
ненулевое кодовое слово кода C имеет вес по край ней мере δ, покажем, что удовлетворяю‐
щее уравнению H ′ c = 0 сообщение обязательно нулевое.
Итак, пусть c — вектор веса wt(c) = w 6 δ − 1. Это значит, что можно выделить w позиций ,
в которых c отличен от 0, иными словами, ci 6= 0 только если i ∈ {i1 , . . . , iw }. Рассмотрим
матрицу  
αi1 b α i2 b ... α iw b
 αi1 (b+1) αi2 (b+1) ... 
αiw (b+1) 

A= .. .. .. . ,
 . . . .. 
αi1 (b+w−1) αi2 (b+w−1) ... αiw (b+w−1)
то есть подматрицу H ′ , составленную из пересечения первых w строк и столбцов с индекса‐
ми i1 , . . . , iw (могут включать 0). Если обозначить c′ = (ci1 , . . . , ciw )⊤ , то Ac′ = 0. Если c′ 6= 0,
то A не может быть обратимой , то есть det(A) = 0. Но

1 1 ... 1

αi1 α i2
. . . α iw

det(A) = α(i1 +...+iw )b · .. .. . . ,
. . . . .
.

αi1 (w−1) αi2 (w−1) . . . αiw (w−1)

а эта величина не равна 0 как произведение ненулевого элемента поля и определителя Ван‐
дермонда для различных элементов αi1 , . . . , αiw (различны, так как α примитивный ). Зна‐
чит, c′ = 0 и c = 0.
Определение 8.5.2. Кодом БЧХ с конструктивным расстоянием δ называется циклический
код с порождающим многочленом вида

g = lcm µαb ,Fp , µαb+1 ,Fp , . . . , µαb+δ−2 ,Fp .
По определению наименьшего общего кратного и минимального многочлена такой мно‐
гочлен g аннулирует αb , . . . , αb+δ−2 , поэтому соответствующий код имеет минимальное рас‐
стояние не меньше δ.

131
Предметный указатель
алгебраическая форма, 47 дробно‐линей ное преобразование, см. функ‐
алгоритм Эвклида, 25 ция дробно‐линей ная
для n чисел, 27 дробь
расширенный , 26 правильная, 62
аргумент комплексного числа, 50, 51 простей шая, 63
ассоциированность, 24 закон инерции, 113
базис, 66 знак перестановки, 86
жорданов, 101 значение многочлена, 42
ортогональный , 109 индукция, см. математическая индукция
билиней ная форма, 107 интерполяция
положительно определенная, 108 по Лагранжу, 59
бинарная операция, 18 по Ньютону, 59
ассоциативная, 18 с простыми узлами, 58
индуцированная, 20 квадратичная форма, 109
коммутативная, 19 класс
бинарное отношение, 7 вычетов, 32
антисимметричное, 8 эквивалентности, 9
конгруэнтности, 20 код
порядка, 14 БЧХ, 131
линей ное, 15 Хэмминга, 128
полное, 16 линей ный , 125
рефлексивное, 7 циклический , 129
симметричное, 7 кольцо, 21
транзитивное, 8 классов вычетов, 32
эквивалентности, 8 коммутативное, 22
вещественная часть, 47 многочленов, 40
взаимная простота, 27 комплексная плоскость, 48
группа, 21 расширенная, 52
абелева, 21 комплексное сопряжение, 47
мультипликативная кольца, 23 композиция
углов, 51 функций , 11
декартово произведение координаты вектора, 68
множеств, 6 корень
деление с остатком комплексный из 1, 54
многочленов, 42 кратный , 56
синтетическое, 45 многочлена, 43
целых чисел, 24 первообразный по модулю p, 37
делимость, 23 простой , 56
делитель нуля, 23 кортеж, 6
диагонализация кратность
ортогональным преобразованием, 114 корня многочлена, 56
по Лагранжу, 109 криптографический протокол
по Якоби, 111 Диффи—Хеллмана—Меркла, 37
дилатация, 83 Ривеста—Шамира—Адлемана, 37
дискретный логарифм, 37 критерий Сильвестра, 114
линей ная независимость, 65

132
линей ное отображение, 72 множеств, 4
линей ное представление НОД, 25 перестановка, 86
линей ное сравнение, 32 подпространство, 69
математическая индукция, 16 порожденное подмножеством, 69
матрица, 74 поле, 39
Грама, 107 комплексных чисел, 46
диагонализируемая, 101 разложения многочлена, 120
единичная, 77 рациональных функций , 61
жорданова, 101 частных, 60
линей ного отображения, 75 порождающий набор, 66
нулевая, 77 правило Руффини, см. схема Горнера
обратная, 77 преобразование Мебиуса, см. функция дробно‐
перехода, 79 линей ная
присоединенная, 91 приведение к главным осям, 115
проверочная кода, 125, 126 принцип Дирихле, 17
транспонированная, 78 производная многочлена, 56
метод Гаусса, 84 прообраз, 10
мнимая часть, 47 простое подполе, 121
многочлен, 40 пространство
минимальный матрицы, 105 векторное, 64
минимальный элемента поля, 117 конечномерное, 67
неприводимый , 62 столбцов, 64
порождающий кода, 129
проверочный кода, 130 разбиение множества, 9
характеристический , 94 разложение
множество, 3 натурального на простые множители,
бесконечное, 5 30
всех подмножеств, 4 размерность, 68
конечное, 5 ранг
пустое, 3 линей ного отображения, 80
модуль матрицы, 81
комплексного числа, 48 расширение полей , 116
наибольший общий делитель, 24, 26 алгебраическое, 119
неполное частное, 24 простое, 116
область редукция
значений , 10 по Монтгомери, 33
определения, 10 свободный член, 41
прибытия, 10 сигнатура квадратичной формы, 114
область целостности, 23 синтетическое деление, 45
образ, 10 система вычетов, 32
образ линей ного отображения, 80 система линей ных уравнений , 81
определитель однородная, 81
матрицы, 87 скалярное произведение, 108
ортогонализация Грама—Шмидта, 112 собственные векторы и числа, 94
ортогональное дополнение, 110 сравнимость по модулю, 31, 46
остаток стандартные матричные единицы, 82
при делении многочленов, 42 старший коэффициент, 41
при делении целых чисел, 24 степень
пересечение многочлена, 41

133
расширения, 118 число
сужение функции, 11 комплексное, 46
сумма подпространств, 70 простое, 29
прямая, 71 элемент
схема левый ней тральный , 19
Горнера, 44 левый обратный , 20
разделения секрета по Шамиру, 59 максимальный , 15
теорема минимальный , 15
Гамильтона—Кэли, 96 модулярный обратный , 33
Кронекера—Капелли, 82 наибольший , 15
Эй лера, 34 наименьший , 15
Якоби, 114 ней тральный , 19
китай ская об остатках, 35 обратный , 20
малая Безу, 43 правый ней тральный , 19
малая Ферма, 35 правый обратный , 20
основная алгебры, 55 примитивный , 124
основная арифметики, 30 элементарные преобразования, 83
трансвекция, 83
транспозиция, 86
тригонометрическая форма, 50
тупель, см. кортеж
упорядоченная n‐ка, см. кортеж
упорядоченная пара, 5
уравнение
линей ное диофантово, 28
фактор‐множество, 14
фактор‐пространство, 72
финитарная последовательность, 40
форма матрицы
жорданова, 101
строчная эшелонированная, 84
трапециевидная, 84
формула
Крамера, 91
Муавра, 51
Тей лора, 58
полного развертывания, 88
функция, 10
Эй лера, 34
биективная, 10
дробно‐линей ная, 52
инъективная, 10
обратимая, 12
обратная, 12, 13
полиномиальная, 42
сюръективная, 10
тождественная, 12
характеристическая, 13
характеристика поля, 121

134