171 Algebra Lectures

Алгебра
лекции для студентов потока «Программная инженерия»

2020/21 учебный год
Андрей Смоленский
4 июня 2021 г.
Содержание
1 Основы теории множеств 3
1.1 Множества и операции над ними . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Упорядоченные пары, кортежи и декартово произведение . . . . . . . . . . . . . 5
1.3 Бинарные отношения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Отношения эквивалентности и разбиения . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6 Фактор‐множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Отношения порядка и математическая индукция . . . . . . . . . . . . . . . . . . . 14
2 Алгебраические структуры и элементарная теория чисел 18

2.1 Бинарные операции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Группы и кольца . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3 Делимость в коммутативном кольце . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Делимость целых чисел . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Взаимная простота . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6 Линей ные диофантовы уравнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7 Простые числа и основная теорема арифметики . . . . . . . . . . . . . . . . . . . . 29
2.8 Сравнения и кольца классов вычетов . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.9 Двоичная арифметика конечной разрядности . . . . . . . . . . . . . . . . . . . . . 33
2.10 Функция Эй лера, теорема Эй лера и малая теорема Ферма . . . . . . . . . . . . . . 34
2.11 Китай ская теорема об остатках . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.12 Криптографические протоколы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Поля и многочлены 39
3.1 Поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Многочлены одной переменной . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3 Деление и вычисление значений многочленов . . . . . . . . . . . . . . . . . . . . . 42
3.4 Алгоритмические аспекты деления многочленов . . . . . . . . . . . . . . . . . . . 44
3.5 Комплексные числа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6 Геометрическая интерпретация комплексных чисел . . . . . . . . . . . . . . . . . 48
3.7 Дробно‐линей ные преобразования . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.8 Полиномиальные уравнения комплексной переменной . . . . . . . . . . . . . . . 54
1
3.9 Производная и кратные корни . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.10 Интерполяция . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.11 Поле частных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.12 Рациональные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4 Основы линейной алгебры 64

4.1 Векторные пространства и базисы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2 Подпространства и фактор‐пространства . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3 Линей ные отображения и матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4 Матрица перехода между базисами . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5 Образ и ранг . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.6 Системы линей ных уравнений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.7 Элементарные преобразования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.8 Метод Гаусса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.9 Перестановки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.10 Определители . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.11 Свой ства определителя . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.12 Формулы Крамера и присоединенная матрица . . . . . . . . . . . . . . . . . . . . . 91
4.13 Определитель Вандермонда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5 Линейные операторы 94
5.1 Определитель оператора, собственные числа и собственные векторы . . . . . . 94
5.2 Спектр графа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3 Диагонализация и жорданова форма . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4 Приложения жордановой формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6 Билинейная алгебра 107

6.1 Билиней ные формы и скалярные произведения . . . . . . . . . . . . . . . . . . . . 107
6.2 Квадратичные формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.3 Диагонализация билиней ных и квадратичных форм . . . . . . . . . . . . . . . . . 109
6.4 Классификация . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.5 Диагонализация ортогональным преобразованием . . . . . . . . . . . . . . . . . . 114
7 Теория полей 116

7.1 Простые расширения полей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2 Степень расширения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.3 Алгебраические расширения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7.4 Конечные поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.5 Строение конечных полей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8 Коды с коррекцией ошибок 125

8.1 Линей ные коды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.2 Исправление ошибок в линей ных кодах . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.3 Код Хэмминга . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
8.4 Циклические коды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
8.5 Коды Боуза—Чоудхури—Хоквингема . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Предметный указатель 132
2
1 Основы теории множеств
1.1 Множества и операции над ними
Множества понимаются как «собрания элементов» в том смысле, что для любого объекта x
(какой бы природы он ни был) и для любого множества X либо этот объект является его
элементом (этот факт мы обозначаем записью x ∈ X), либо не является (тогда x ∈
/ X). Мно‐
жество однозначно определяется своими элементами. Это означает, что два множества A и
B совпадают, если у них одинаковые элементы, то есть всякий элемент множества A обяза‐
тельно является также элементом множества B, и наоборот.
Мы не будем строго строить теорию множеств и давать точное аксиоматическое опреде‐
ление понятия множества, но обозначим некоторые свой ства, которым это понятие должно
удовлетворять, чтобы не наткнуться на известные парадоксы (см. ниже).
• Простей ший способ задать множество — перечислить его элементы в виде явного спис‐
ка, например, X = {1, 2, 3, 99}. При этом
– множество, состоящее из одного элемента, отличается от этого элемента: {x} 6= x,
{{x}} 6= {x} и так далее;
– не учитываются повторы, то есть {x, x} = {x};
– не учитывается порядок элементов в списке: {x, y} = {y, x};
– список может не содержать ни одного элемента — такое множество называется
пустым и обозначается символом ∅;
– пустое множество — самостоятельная сущность, которая может быть элементом
какого‐то множества, и там самым, в частности ∅ 6= {∅} и {x, ∅} 6= {x}.
• Постулируется существование бесконечного множества натуральных чисел, которое
можно неформально записать в виде N = {1, 2, 3, . . .}. Подразумевается, что при виде
такой надписи читающий ее понимает, какие именно элементы имеются в виду. Мы
иногда будем пользоваться подобными неформальными записями, например, множе‐
ство всех четных целых чисел в таком стиле можно записать как {. . . , −4, −2, 0, 2, 4, . . .}.
Далее мы увидим, как можно строго построить их на основе множества натуральных
чисел.
• Если множества A и B таковы, что все элементы A являются также элементами B, то
мы говорим, что A является подмножеством B (также, что A содержится в B). Для та‐
кой ситуации мы используем запись A ⊆ B. С таким обозначением можно сказать, что
A = B тогда и только тогда, когда A ⊆ B и B ⊆ A. Обратите внимание, что запись
A ⊆ B не исключает случая A = B. Если хочется подчеркнуть, что A ⊆ B, но A 6= B,
то пишут A ( B (или A j B) и говорят, что A строго содержится в B (или является
собственным подмножеством). Часто в литературе можно также встретить для таких
случаев обозначение A ⊂ B (по аналогии с < и 6), но оно иногда используется как
эквивалент ⊆, так что мы постараемся его избегать.
Свой ство включения множеств обладает следующими простыми свой ствами:
– Для любого множества A имеем ∅ ⊆ A.
– Если A ⊆ B и B ⊆ C, то A ⊆ C.
• Множества можно объединять: если A и B это два множества, то их объединением на‐

зывается такое множество A ∪ B, что x ∈ A ∪ B тогда и только тогда, когда x ∈ A или
3
x ∈ B (возможно, что в обоих сразу). Разумеется, объединение можно определить и
для большего количества множеств. Если объединяемых множеств конечное число, то
в дополнительном определении смысла немного, так как для любых трех множеств A,
B и C выполнено (A∪B)∪C = A∪(B ∪C). Поэтому если A1 , A2 , . . . , An — множества, то
A1 ∪ . . . ∪ An можно определить рекуррентно как (A1 ∪ . . . ∪ An−1 ) ∪ An — но скобки тут,
разумеется, можно расставить как угодно. Отметим некоторые тривиальные свой ства
объединения:
A ∪ B = B ∪ A, A ∪ A = A, A ∪ ∅ = A.
Последние два свой ства являютс частными случаями более общего свой ства: если B ⊆
A, то A ∪ B = A.
• В уже существующем множестве можно выделять подмножества посредством какого‐
либо предиката. А имменно, пусть P (a) — некоторое суждение, которое, в зависимости
от параметра a, может либо истинным, либо ложным. Тогда для уже имеющегося мно‐
жества A можно сформировать новое множество B = {a ∈ A | P (A)}, состоящее в точ‐
ности из тех элементов a множества A, для которых суждение P (a) истинно. Например,
если A = {1, 2, 3, 4, 5}, то {a ∈ A | a нечетно} = {1, 3, 5}. Аналогично, множество всех
четных натуральных чисел строится как {a ∈ N | a четно}.
Очень существенно, что выделение при помощи предиката производится из некоторо‐
го уже построенного множества, то есть элементы берутся не «из воздуха».
Рассмотрим «множество» X всех множеств, которые не являются собственными элементами. Является ли
само множество X элементом множества X? Если да, то по определению X оно не должно быть его элемен‐
том, если же нет, то должно — оба варианта противоречивы. Это явление известно как парадокс Рассела—
Цермело. Чтобы разрешить его, аксиоматика теории множеств не допускает подобных конструкций — в
частности, нет «множества всех множеств».
• С операцией выделения с помощью предиката можно удобным образом определить

некоторые другие важные операции над множествами:
– Пересечением множеств A и B называется множество A ∩ B, состоящее из тех эле‐
ментов, которые принадлежат одновременно A и B. Его же можно определить и
менее симметричным образом, а именно
A ∩ B = {x ∈ A | x ∈ B} = {x ∈ B | x ∈ A}.
Все три определения задают, разумеется, одно и то же множество, и операция об‐

ладает следующими простей шими свой ствами:
A ∩ B = B ∩ A, (A ∩ B) ∩ C = A ∩ (B ∩ C), ∀B ⊆ A A ∩ B = B.
– Разностью множеств A и B называется A \ B = {x ∈ A | x ∈

/ B}.
– Симметрической разностью множеств A и B называется множество A4B тех эле‐
ментов, которые принадлежат только одному из этих двух множеств:
A 4 B = (A ∪ B) \ (A ∩ B) = (A \ B) ∪ (B \ A).
• Для любого множества A существует множество B, элементами которого являются все

подмножества множества A. То есть x ∈ B тогда и только тогда, когда x ⊆ A. Обозна‐
чается такое множество символом 2A (обоснование такого обозначения см. ниже).
4
• Операции объединения и пересечения можно распространить на бесконечные наборы
множеств. А именно, если A — такое множество,
S что все его элементы сами являются
множествами, то существует множество a∈A a, элементы которого это в точности те
объекты, которые являются элементами хотя бы одного a ∈ A. Аналогично определя‐
ется пересечение, хотя для него не требуется специального нового определения, так
как, выбрав некоторый a0 ∈ A, можно положить
\
a = {x ∈ a0 | ∀a ∈ A x ∈ a},
a∈A
и результат, конечно, не зависит от выбора конкретного a0 . Обратите внимание, что

объединение определено в том числе и в случае A = ∅ (тогда оно тоже пустое), в то
время как пересечение пустого набора множеств не определено.
Если во множестве A имеется лишь конечное число элементов, то будем обозначать их ко‐
личество |A|. Если множество A бесконечное, то будем писать |A| = ∞. Заметим, что для
конечных множеств A и B если A ⊆ B, то |A| 6 |B| (строгое доказательство этого фак‐
та нетривиально, поскольку требует как минимум более строгого определения того, какие
множества являются конечными). Кроме того, если A ⊆ B и |A| = |B| 6= ∞, то A = B.
1.2 Упорядоченные пары, кортежи и декартово произведение

Как было отмечено выше, множество не помнит порядка своих элементов, в частности, {x, y} =
{y, x}. Однако оказывается край не полезным порядок все‐таки помнить.
Определение 1.2.1. Упорядоченная пара (x, y) это «двухэлементное множество», в котором
один из элементов отмечен как первый , а другой как второй .
С этим определением связано несколько трудностей . Во‐первых, непонятно, что значит,
что элемент «отмечен». Во‐вторых, неясно, что делать в случае, когда первый и второй эле‐
мент совпадают. В любом случае, должно иметь место
Свойство 1.2.2. Две упорядоченные пары равны, если равны их первые компоненты и рав‐
ны вторые. То есть (a, b) = (x, y) тогда и только тогда, когда a = x и b = y.
По существу только это свой ство упорядоченных пар и имеет значение.
Один из способов формально сконструировать упорядоченные пары — определить их как (x, y) = {{x}, {x, y}}.
Такая модель упорядоченной пары называется конструкцией Куратовского.
Для начала отметим, что в случае x = y имеем (x, x) = {{x}, {x, x}} = {{x}, {x}} = {{x}}, а при x 6= y пара
(x, y) имеет как множество два различных элемента.
Покажем, что модель Куратовского дей ствительно задает упорядоченные пары, то есть такие объекты обладают
Свой ством 1.2.2. Дей ствительно, если a = x и b = y, то (a, b) = (x, y) просто по построению. Обратно, пусть (a, b) =
(x, y). Это означает, что каждый элемент первого множества является элементом второго. В частности, {a} ∈ (x, y)
— то есть либо {a} = {x}, либо {a} = {x, y}. Второй вариант возможен только в том случае, если x = y, но тогда
(x, y) состоит из одного элемента, а тогда и (a, b) является одноэлементным, и тогда a = b = x = y. Если же
{a} = {x} (и a = x), но x 6= y, то точно так же a 6= b. Тогда {a, b} ∈ (x, y) влечет {a, b} = {x, y}, откуда b = y.
Существуют и другие модели понятия упорядоченной пары, например:
• Модель Винера: (x, y) = {{{a}, ∅}, {{b}}};
• Модель Хаусдорфа: (x, y) = {{x, 1}, {y, 2}}, где 1 и 2 это два различных объекта, отличных от x и y — рабо‐
тает, если заранее оговорено множество, и которого берутся элементы x и y.
• Короткая модель Куратовского: (x, y) = {x, {x, y}} — даже при x = y является двухэлементным множе‐
ством, но доказательство Свой ства 1.2.2 сложнее и требует так называемой аксиомы регулярности (в акси‐
оматике Цермело—Френкеля все объекты являются множествами, аксиома регулярности утверждает, что
любое непустое множество x содержит элемент, имеющий с ним пустое пересечение).
5
Аналогично можно определить и упорядоченные наборы из более чем двух элементов.
Определение 1.2.3. Упорядоченной n‐кой (или кортежем длины n, или тупелем (от англ.
tuple)) называется набор (x1 , x2 , . . . , xn ), и равенство двух наборов определяется равенством
элементов на соответствующих позициях:
(a1 , . . . , an ) = (x1 , . . . , xn ) ⇔ a1 = x1 , a2 = x2 , . . . , an = xn .
Один из формальных способов определить кортеж длины больше 2 — рекуррентный , на‐

пример, положить (a, b, c) = ((a, b), c) и, более общо, (a1 , . . . , an ) = ((a1 , . . . , an−1 ), an ), но мы
для удобства будем такую конструкцию игнорировать и считать кортежи определенными
посредством своего характеристического свой ства.
Определение 1.2.4. Декартовым произведением множеств A и B называется множество A×
B всевозможных упорядоченных пар, первый элемент которых принадлежит A, а второй B:
A × B = {(a, b) | a ∈ A, b ∈ B}.
Формально определение выше не вполне корректно, потому что не удовлетворяет тре‐
бованиям, предъявляемым к процедуре выделения подмножества при помощи предиката.
Для практических целей существование такого множества можно постулировать в качестве
аксиомы.
Если же подходить к этому вопросу строго, то можно воспользоваться какой ‐нибудь из моделей упорядоченной
пары. Например, в модели Куратовского упорядоченная пара (a, b) состоит из двух множеств {a} и {a, b}, которые
оба являются подмножествами множества A ∪ B, или, что то же самое, элементами множества 2A∪B . Это означает,

2A∪B
что набор множеств {{a}, {a, b}} является подмножеством 2A∪B , то есть элементом множества 2 . В этом
множестве декартово произведение уже выделяется при помощи предиката:

A∪B

A×B = x∈2 2 ∃a ∈ A, b ∈ B т. ч. x = (a, b) .

Аналогично можно определить декартово произведения большего количества множеств:
A1 × . . . × An = {(a1 , . . . , an ) | ∀i = 1, . . . , n ai ∈ Ai }.
Обратите внимание, что формально все три множества
A × B × C, (A × B) × C и A × (B × C)
различны (хотя первые два совпадают, если мы принимаем рекуррентное определение упо‐
рядоченной трой ки).
Для декартова произведения множества с собой мы будем использовать обозначение A2 =
A × A. Аналогично, An = A × . . . × A (n раз).
Отметим некоторые свой ства декартова произведения.
• A × ∅ = ∅ × A = ∅;
• (A ∪ B) × C = (A × C) ∪ (B × C), (A ∩ B) × C = (A × C) ∩ (B × C) и аналогичные
формулы для A × (B ∪ C) и A × (B ∩ C);
• (A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D) — для объединения аналогичной формулы нет.
6
1.3 Бинарные отношения
Определение 1.3.1. Бинарным отношением R между элементами множеств A и B называ‐
ется подмножество их декартова произведения: R ⊆ A × B. В случае, если A = B, будем
говорить, что R ⊆ A2 это бинарное отношение на A.
Примеры 1.3.2. Во многих случаях бинарное отношение выделяется в декартовом произ‐
ведении при помощи предиката, выражающего какое‐то соотношение между элементами
упорядоченной пары.
1. R = {(x, y) ∈ R2 | x 6 y};
2. R = {(x, y) ∈ N2 | x делится на y};
3. R = {(x, y) ∈ A × 2A | x ∈ y};
4. R = {(x, y) ∈ 2A × 2A | x ⊆ y};
5. R = {(x, y) ∈ 2A × 2A | |x| = |y|};
6. Пусть Ln — множество прямых в n‐мерном пространстве, и
a) R = {(x, y) ∈ L22 | x k y},
b) R = {(x, y) ∈ L22 | x ⊥ y},
c) R = {(x, y) ∈ L33 | x и y скрещивающиеся}.
Обратите внимание, что в большинстве примеров выше предикат выражается каким‐то
уже имеющимся символом, что мотивирует следующее
Определение 1.3.3. Будем говорить, что x находися в отношении R с y (или что x и y нахо‐
дятся в отношении R), если (x, y) ∈ R, и обозначать это посредством xRy.
С учетом этого обозначения мы могли бы сразу обозначить бинарное отношение из при‐
мера 1 символом 6, а примеры 3, 4, 6a и 6b соответственно посредством ∈, ⊆, k и ⊥. С дру‐
гой стороны, полезно иметь и альтернативные обозначения, потому что иначе для указания
связей между различными бинарными отношениями пришлось бы использовать несколько
неуклюжие формулы наподобие
< ⊂ 6, = ∩ < = ∅, 6 ∩ > = =.
Хотя три указанные выше формулы верны (первая утверждает, что из строгого неравенства
следует нестрогое; вторая показывает, что равенство противоречит строгому неравенству;
третья соответствует тому, что два разнонаправленных неравенства выполняются одновре‐
менно только для равных элементов, то есть антисимметричность), мы постараемся не зло‐
употреблять возникающими лингвистическими возможностями.
Впрочем, далее мы увидим, что многие естественные примеры бинарных отношений име‐
ют другую природу.
Теперь определим некоторые свой ства, которыми могут обладать бинарные отношения
на множестве.
Определение 1.3.4. Пусть R ⊂ A2 — бинарное отношение на A. Мы будем говорить, что R
• рефлексивно, если ∀x ∈ A xRx;
• симметрично, если ∀x, y ∈ A из xRy следует yRx;
7
• антисимметрично, если ∀x, y ∈ A из xRy и yRx следует x = y;
• транзитивно, если ∀x, y, z ∈ A из xRy и yRz следует xRz.

Среди примеров выше рефлексивными являются примеры 1, 2, 4, 5, 6a (если считать, что
прямая параллельна сама себе).
Симметричными являются примеры 5, 6a, 6b, 6c, а антисимметричными примеры 1, 2, 4.
Обратите внимание, что отношения строгого неравенства < и строгого включения ( тоже
являются антисимметричными, хотя в них ситуации вроде x < y и y > x одновременно не
случаются.
Транзитивными являются примеры 1, 2, 4, 5, 6a.
Отдельно отметим, что пустое отношение ∅ является симметричным, антисимметричным
и транзитивным, но не является рефлексивным (кроме случая, когда оно рассматривается
как отношение на ∅), а отношение A2 на множестве A рефлексивно, симметрично и транзи‐
тивно, но не антисимметрично.
Некоторые из приведенных примеров бинарных отношений (конкретно, 1, 2, 4) выражают
идею того, что один элемент меньше другого (подмножество меньше объемлющего множе‐
ства, делитель меньше делимого). Подобные бинарные отношения называются отношени‐
ями порядка (см. ниже).
1.4 Отношения эквивалентности и разбиения

Следующее определение выражает идею схожести элементов.
Определение 1.4.1. Бинарное отношение называется отношением эквивалентности, если

оно рефлексивно, симметрично и транзитивно.
Дей ствительно, естественно полагать, что всякий объект схож сам с собой (рефлексив‐
ность) и что если x схож с y, то y схож с x (симметричность). Свой ство транзитивности утвер‐
ждает, что можно сколь угодно долго переходить от одного объекта к сходному с ним, и все
это время рассматриваемые объекты будут сходны с начальным. Это, в частности, означа‐
ет, что отношение эквивалентности не отражает идею близости объектов. Например, если
ε > 0 — некоторое фиксированное число, то отношение xRy ⇔ |x − y| < ε не является
транзитивным.
Примеры 1.4.2.
1. Отношение равенства размеров множеств (пример 5 выше).

2. Параллельность прямых.
3. Равенство треугольников (иногда еще называемое конгруэнтностью). Хотя треуголь‐
ники, именуемые в школьном курсе геометрии равными, не являются буквально рав‐
ными как подмножества плоскости, а только лишь совмещаются друг с другом посред‐
ством движения плоскости, они обладают, тем не менее, идентичными свой ствами.
4. Подобие треугольников (треугольники полагаются подобными, если они могут быть
совмещены движением плоскости и гомотетией ).
5. Отношения равносоставленности и равновеликости на множестве всех многоугольни‐
ков.
6. Для фиксированного целого m отношение {(x, y) ∈ Z2 | x − y делится на m}.
8
7. {(α, β) ∈ R2 | α − β = 2πk для некоторого k ∈ Z} — эквивалентность величин углов.
Теперь мы дадим другое описание отношений эквивалентности.
Определение 1.4.3. Разбиением множества A называется набор B подмножеств A (т.е. B ⊆
2A ), удовлетворяющий следующим условиям:
• ∅∈
/ B;
• ∀b, c ∈ B если b 6= c, то b ∩ c = ∅;
S
• A = b∈B b.
Определение 1.4.4. Отношением эквивалентности, отвечающим разбиению B множества

A, называется бинарное отношение ∼B на множестве A, задаваемое следующим образом:
x ∼B y тогда и только тогда, когда существует такой элемент b ∈ B, что x, y ∈ b.
Замечание 1.4.5. ∼B является отношением эквивалентности.
Доказательство. Это отношение является рефлексивным, так как каждый элемент множе‐
ства A попадает в какой ‐то элемент разбиения. Симметричность очевидна. Чтобы доказать
транзитивность, предположим, что x ∼B y и y ∼B z. Это означает, что най дутся такие b, c ∈
B, что x, y ∈ b и y, z ∈ c. Но тогда y ∈ b ∩ c и b ∩ c 6= ∅, так что b = c, откуда x, z ∈ b, то есть
x ∼B z.
Определение 1.4.6. Пусть ∼ это отношение эквивалентности на множестве A. Классом эк‐
вивалентности элемента x ∈ A относительно ∼ называется множество
[x]∼ = {y ∈ A | x ∼ y}.
Разбиением A, отвечающим ∼, называется множество классов эквивалентности
B∼ = {[x]∼ | x ∈ A}.
В дальней шем в обозначении классов эквивалентности мы часто будем опускать знак от‐
ношения и просто писать [x] или x.
Замечание 1.4.7. B∼ является разбиением.
Доказательство. Пустое множество не принадлежит B∼ по построению, так как каждый
класс эквивалентности S непуст. АSименно, x ∈ [x] в силу рефлексивности отношения ∼. По
той же причине A = x∈A [x] = b∈B b. Покажем, что пересекающиея классы совпадают. В
самом деле, если для некоторых x, y ∈ A нашелся элемент z ∈ [x] ∩ [y], то x ∼ z и y ∼ z, отку‐
да z ∼ y в силу симметричности и x ∼ y по транзитивности, откуда [y] ⊆ [x]. Точно таким же
образом [x] ⊆ [y], так что два класса дей ствительно равны.
Вместе эти два замечания показывают, что задать отношение эквивалентности это то же
самое, что задать разбиение, в том смысле, что по одному можно восстановить другое и на‐
оборот. Формально это выражает следующая
Теорема 1.4.8. Если ∼ это отношение эквивалентности на A, то ∼B∼ = ∼. Если B это разби‐
ение, то B∼B = B.
Доказательство. Посмотреть и осознать.

x ∼B∼ y ⇔ ∃b ∈ B∼ x, y ∈ B ⇔ ∃z ∈ A x, y ∈ [z]∼ ⇔ x ∼ y ⇒ ∼B∼ = ∼;

b ∈ B∼B ⇔ ∃x ∈ A b = [x]∼B ⇔ ∃c ∈ B b = c ⇒ B∼B = B.
9
1.5 Функции
Неформально говоря, функция из множества A в множество B это некое «правило сопостав‐
ления» элементов B элементам A. Это означает, что каждому элементу множества A соот‐
ветствует однозначно определенный элемент множества B. Поскольку не все интересую‐
щие нас функции удобно задаются формулами (если задаются вообще!), мы формализуем
понятие функции с помощью понятия бинарного отношения.
Определение 1.5.1. Бинарное отношение Γ ⊆ A×B называется графиком, если для любого
a ∈ A существует ровно один такой b ∈ B, что aΓb.
Это понятие отвечает привычному понятию графика функции. Например, функции, возво‐
дящей вещественное число x в квадрат, отвечает подмножество плоскости {(x, x2 ) | x ∈ R},
которое, очевидно, является графиком в смысле определения выше.
Определение 1.5.2. Функцией из множества A в множество B называется упорядоченная
трой ка f = (A, B, Γ), где Γ — график.
Обозначение 1.5.3. Если f — функция из A в B, то мы будем это записывать как f : A → B.
Замечание 1.5.4. Две функции f : A → B и g : C → D равны, если равны их области опреде‐
ления (A = C), области прибытия (B = D), а также совпадают графики (то есть для любого
x ∈ A выполнено f (x) = g(x)).
Введем некоторые обозначения и необходимую терминологию.
• Если b ∈ B таков, что aΓb (такой b существует и единственный ), то b называется обра‐
зом a под дей ствием f (или значением f в/на a) и обозначается f (a).
• Множество A называется областью определения, а B областью прибытия.
• Если C ⊆ A, то f (C) = {f (a) | a ∈ C} называется образом C. При этом f (A) иногда
называется областью значений.
• Если b ⊆ B, то f −1 (b) = {a ∈ A | f (a) = b} называется (полным) прообразом C, а
всякий его элемент — прообразом b. Естественным способом определяется прообраз
подмножества C ⊆ B, а именно f −1 (C) = {a ∈ A | f (a) ∈ C}.
Определение 1.5.5. Пусть f : A → B. Функция f называется
• инъективной (или инъекцией), если для любых a, b ∈ A если a 6= b, то f (a) 6= f (b);
• сюръективной (или сюръекцией), если для любого b ∈ B существует такой a ∈ A, что
f (a) = b;
• биективной (или биекцией), если она инъективна и сюръективна, то есть для любого
b ∈ B существует ровно один такой a ∈ A, что f (a) = b.
Иными словами, функция инъективна, если полный прообраз любого элемента содержит не
более одного элемента, сюръективна, если содержит хотя бы один, и биективна, если ровно
один.
Пример 1.5.6. Обозначим через R>0 = {x ∈ R | x > 0} множество неотрицательных веще‐
ственных чисел и рассмотрим четыре функции
f1 : R → R, f2 : R → R>0 , f3 : R>0 → R, f4 : R>0 → R>0 ,
10
все задаваемые одной и той же формулой fi (x) = x2 (различаются только область опре‐
деления и область прибытия). Тогда функция f1 не инъективна и не сюръективна (так как
f1−1 (1) = {1, −1} и f1−1 (−1) = ∅), функция f2 не инъективна, но сюръективна, функция f3
инъективна, но не сюръективна, а f4 биективна.
Определение 1.5.7. Сужением или ограничением функции f : A → B на подмножество C ⊆
A называется функция f |C : C → B, дей ствующая по правилу f |C (x) = f (x). Формально,
если f = (A, B, Γ), то f |C = (C, B, Γ ∩ (C × B)).
В примере выше f3 = f1 |R>0 и f4 = f2 |R>0 .
Можно вычислять значение одной функции на значении другой функции.
Определение 1.5.8. Пусть f : A → B и g : B → C, тогда композицией функций g и f называ‐
ется функция g ◦ f : A → C, дей ствующая по правилу (g ◦ f )(x) = g(f (x)).
Предложение 1.5.9. Композиция функций ассоциативна, то есть если f : A → B, g : B → C
и h : C → D, то обе композиции h ◦ (g ◦ f ) и (h ◦ g) ◦ f определены и совпадают.
Доказательство. g ◦ f есть функция из A в C, так что композиция h и g ◦ f определена и
является функцией из A в D. Аналогично, h◦g : B → D, а тогда (h◦g)◦f : A → D определена.
Проверим теперь, что совпадают значения во всех точках. Пусть a ∈ A, тогда

h ◦ (g ◦ f ) (a) = h (g ◦ f )(a) = h g(f (a)) ,

(h ◦ g) ◦ f (a) = (h ◦ g)(f (a)) = h g(f (a)) .
Замечание 1.5.10. Композиция функций не коммутативна, то есть не обязательно f ◦ g =
g ◦ f.
Дей ствительно, даже если композиция в одном порядке определена, композиция в другом
не обязательно существует. Чтобы обе композиции существовали, требуется, чтобы f : A →
B и g : B → A. Но даже в этом случае, если A 6= B, получаются функции с различающими
областями определения и прибытия, а именно g ◦ f : A → A, но f ◦ g : B → B. Наконец,
даже если A = B, легко привести пример функций , у которых две композиции не совпадают.
Например, положим f : R → R, f (x) = x + 1, и g : R → R, g(x) = x2 — тогда (g ◦ f )(x) =
x2 + 2x + 1, но (f ◦ g)(x) = x2 + 1.
Предложение 1.5.11. Композиция инъективных (сюръективных, биективных) функций инъ‐
ективна (сюръективна, биективна).
Доказательство. Пусть f : A → B и g : B → C. Предположим сначала, что f и g инъективны
и рассмотрим значения (g ◦ f ) на каких‐нибудь точках x, y ∈ A. Если g(f (x)) = g(f (y)), то по
инъективности g получаем, что f (x) = f (y), откуда в силу инъективности f имеем x = y, так
что g ◦ f также инъективна.
Пусть теперь f и g сюръективны. Если c ∈ C, то по сюръективности g най дется такой
b ∈ B, что g(b) = c. Но в силу сюръективности f существует такой a ∈ A, что f (a) = b. Тогда
(g ◦ f )(a) = g(f (a)) = g(b) = c.
Предложение 1.5.12. Пусть f : A → B и g : B → C. Если g ◦ f инъективна, то f инъективна.
Если g ◦ f сюръективна, то g сюръективна.
Доказательство. Пусть g ◦ f инъективна. Рассмотрим значения g ◦ f на двух точках x, y ∈ A.
Если x 6= y, то g(f (x)) 6= g(f (y)), а тогда f (x) 6= f (y) (иначе применение к ним g давало бы
равные значения), так что f инъективна.
Если g ◦ f сюръективна, то для любого c ∈ C най дется такой a ∈ A, что (g ◦ f )(a) = c. Тогда
положим b = f (a) — это искомый прообраз c относительно g, так что g сюръективна.
11
Определение 1.5.13. Тождественной функцией на множестве A называется функция idA : A →
A, дей ствующая по правилу idA (x) = x.
Замечание 1.5.14. Для любой функции f : A → B выполнено idB ◦f = f и f ◦ idA = f .
Сей час мы определим три важных понятия, тесно связанных с инъективностью и сюръек‐
тивностью.
Определение 1.5.15. Пусть f : A → B и g : B → A. Будем говорить, что

• g является левой обратной для f , если g ◦ f = idA ;
• g является правой обратной для f , если f ◦ g = idB ;
• g является (двусторонней) обратной для f , если она одновременно левая и правая об‐
ратная.
Будем говорить, что f обратима слева (справа), если у нее имеется левая (правая) обратняа.
Если у f имеется двусторонняя обратная, будем говорить, что f обратима.
Замечание 1.5.16. Если у функции f : A → B одновременно существуют левая и правая об‐
ратные, то они совпадают. В частности, в таком случае левая и правая обратные единствен‐
ные, а f обратима.
Доказательство. Пусть g, h : B → A — левая и правая обратные, то есть g ◦ f = idA и f ◦ h =
idB . Тогда
g = g ◦ idB = g ◦ (f ◦ h) = (g ◦ f ) ◦ h = idA ◦h = h.
Теорема 1.5.17. Пусть f : A → B.

1. Пусть A 6= ∅. f инъективна тогда и только тогда, когда f обратима слева.
2. f сюръективна тогда и только тогда, когда f обратима справа.
3. f биективна тогда и только тогда, когда она обратима.
Доказательство. Если f обратима слева, то есть для некоторого g : B → A выполнено g ◦

f = idA , то в силу инъективности idA по Предложению 1.5.12 получаем, что f инъективна.
Обратно, пусть f инъективна. Выберем какой ‐нибудь один элемент a0 ∈ A и рассмотрим
функцию (
a, если b = f (a),
g(b) =
a0 , если b ∈
/ f (A).
Эта функция корректно определена, потому что для любого b ∈ B либо b ∈ f (A) — и тогда в
силу инъективности у такого b существует ровно один прообраз a — либо b ∈ / f (A).
Если f обратима справа, то есть f ◦g = idB для некоторого g : B → A, то в силу сюръектив‐
ности idB по Предложению 1.5.12 получаем, что f сюръективна. Обратно, пусть f сюръектив‐
на. Поскольку для любого b ∈ B его полный прообраз непуст, можно выбрать по одному эле‐
менту a в каждом таком полном прообразе и определить g(b) = a. Тогда f (g(b)) = f (a) = b, и
тем самым g является правым обратным для f .
Конструкция выше хорошо работает, если множество B конечное — тогда для построения функции g требуется
сделать конечное число выборов. Если же множество B бесконечно, то, вообще говоря, для возможности такого
одновременного выбора требуется постулировать еще одну дополнительную аксиому, называемую аксиомой вы‐
бора.
12
Если f обратима, то она обратима слева и справа, а тогда по уже доказанным пунктам инъ‐
ективна и сюръективна. Обратно, если f биективна, то обратная функция строится так же,
как и выше, только на этот раз не требуется делать никаких выборов, так как прообраз един‐
ственный . Формально, если обозначить через extr функцию, которая по одноэлементному
подмножеству A возвращает его единственный элемент, то обратная функция g задается
формулой g(b) = extr f −1 (b) .
Обозначение 1.5.18. Если функция, обратная к f , существует, она обозначается символом
f −1 . Тогда запись f −1 (b) может означать как образ под дей ствием обратной функции, так
и полный прообраз относительно f (состоящий из одного элемента). Смысл всегда будет
однозначно восстанавливаться из контекста.
Замечание 1.5.19. Если f и g обратимы, то (g ◦ f )−1 = f −1 ◦ g −1 .
Обозначение 1.5.20. Множество всех функций из множества A в множество B будем обо‐
значать B A .
Чтобы строго обосновать, почему B A является множеством, заметим, что функция f : A → B является трой кой
(A, B, Γf ) и, тем самым, элементом множества {A} × {B} × 2A×B , из которого множество всех функций уже вы‐
деляется предикатом, а именно B A = {f ∈ {A} × {B} × 2A×B | ∃Γ ⊆ A × B — график, т. ч. f = (A, B, Γ)}. Более
короткий способ записать то же самое: B A = {A} × {B} × {Γ ∈ 2A×B | Γ — график}.
Замечание 1.5.21. (
∅ A 0, если A 6= ∅,
A = 1, ∅ = .
1, еслиA = ∅.
Доказательство. Пусть область определения функции f : ∅ → A пуста. Тогда ее график яв‐

ляется подмножеством ∅ × A = ∅, то есть тоже пустое множество. То есть такая функция
имеет вид (∅, A, ∅) — это дей ствительно функция, условие на график является тавтологи‐
чески верным. Такая функция называется пустой и является единственным элементом мно‐
жества A∅ .
Если же f : A → ∅, то для непустого A не существует ни одного графика, так что ∅A = ∅
(случай A = ∅ уже разобран, в этом случае есть только одна функция id∅ = (∅, ∅, ∅)).
Предложение 1.5.22. Если A и B конечные, то B A тоже конечное и |B A | = |B||A| .
Доказательство. Пусть A = {a1 , . . . , ak }. Для b ∈ B обозначим XS b = {f ∈ B
A
| f (a1 ) = b},
A
тогда для различных b множества Xb не пересекаются и B = b∈B Xb . При этом размер
всех множеств Xb одинаков и равен |B A\{a1 } |, так как {f |A\{a1 } | f ∈ Xb } = B A\{a1 } . Тем
самым |B A | = |B| · |B A\{a1 } |. Применяя ту же процедуру ко второму сомножителю, получаем
|B A | = |B|2 · |B A\{a1 ,a2 } |, а после k повторов получаем |B A | = |B|k · |B ∅ | = |B||A| .
С использованием метода математической индукции (см. ниже) это доказательство можно сократить примерно
в два раза (все заканчивается на переходе к |B A\{a1 } |).
Определение 1.5.23. Пусть A — некоторое множество. Характеристической функцией под‐

множества B ⊆ A называется χB : A → {0, 1}, дей ствующая по правилу
(
1, если a ∈ A,
χB (a) =
0, если a ∈ / A.
13
Замечание 1.5.24. Отображение 2A → {0, 1}A , переводящее B ⊆ A в χB , является биекцией .
Доказательство. Обратное отображение переводит функцию f : A → {0, 1} в f −1 (1).
В частности, для конечного множества A имеет место равенство |2A | = 2|A| .
Еще одна причина, почему для обозначения множества всех функций f : A → B выбрано
обозначение B A , кроме изложенных в Предложении 1.5.22 и Замечании 1.5.24, связана с де‐
картовыми степенями. А именно, имеется естественная биекция между An = A × . . . × A (n
раз) и A{1,...,n} , переводящая кортеж (a1 , . . . , an ) в функцию f (i) = ai .
Если полагать функцию исходным понятием, можно определять упорядоченные пары и более длинные кортежи
длины n как функции из фиксированного 2‐ или n‐элементного множества.
1.6 Фактор‐множества
Пусть ∼ — отношение эквивалентности на множестве A.
Определение 1.6.1. Фактор‐множеством A по отношению ∼ называется
A/∼ = {[a]∼ | a ∈ A}.
Как множество это совпадается в уже встречавшимся нам разбиением множества A на

классы (см. Определение 1.4.6), с тем отличием, что для разбиения существенно, разбиением
какого множества оно является, а элементы фактор‐множества мы рассматриваем как но‐
вые независимые сущности (хотя нам и придется порой обращаться к их внутренней струк‐
туре).
Естественное отображение π : A → A/∼ называют канонической проекцией.
Понятие фактор‐множества (или что‐то очень похожее) в скрытой форме встречается уже
в начальной школе. А именно, под словами «треугольник с данными сторонами/углами»
подразумевается не конкретный треугольник на плоскости, а абстрактный треугольник, то
есть, по существу, все такие треугольники разом — формально это класс треугольников по
отношению равенства треугольников (с точностью до движения). Аналогично, счет при по‐
мощи чисел можно рассматривать как переход к фактор‐множеству по отношению равен‐
ства размеров/количества — так, число 1 понимается как абстракция, включающая и 1 апель‐
син, и 1 яблоко, и 1 что угодно.
1.7 Отношения порядка и математическая индукция

Определение 1.7.1. Бинарное отношение называется отношением (частичного) порядка,
если оно рефлексивно, антисимметрично и транзитивно. Множество вместе с отношением
частичного порядка на нем называется частично упорядоченным.
1. 6 и > на любом подмножестве R;
2. ⊆ и ⊇ на любом подмножестве 2A ;
3. «делит» и «делится на» на N (но не на Z — нарушается антисимметричность);
4. лексико‐графический порядок на множестве слов;
5. если 4 и l
− — отношения порядка на множествах A и B, то на A × B естественным
образом возникают два порядка:
14
• (a, b) 6 (a′ , b′ ) ⇔ a 4 a′ и b l ′
−b;
• (a, b) 6 (a′ , b′ ) ⇔ a ≺ a′ или a = a′ и b l ′
−b;
6. если A и B — два непересекающихся множества с порядками 4 и l−, то можно опреде‐
лить следующий порядок на A ∪ B:

x 6 y ⇐⇒ x, y ∈ A и x 4 y или x, y ∈ B и x l
− y или x ∈ A и y ∈ B ;
7. отношение «матрешка» на каком‐нибудь множестве геометрических фигур: фигура X

считатся меньше фигуры Y , если некоторым движением X можно поместить внутрь
Y — для прямоугольников на плоскости или параллелепипедов в трехмерном про‐
странстве этот порядок можно еще назвать «упаковкой коробок» (доказательство ан‐
тисимметричности для такого отношения не совсем тривиально, если понимать тер‐
мин «фигура» широко).
Обратите внимание, что отношение R на множестве A, сформированное по принципу aRb

в случае f (a) 6 f (b) для некоторой фиксированной функции f : A → R (или в другое упоря‐
доченное множество), обычно само отношением порядка не является — хотя и используется
повсеместно для сортировки! Дей ствительно, для неинъективных функций такое отноше‐
ние не обладает свой ством антисимметричности.
Вообще говоря, в частично упорядоченном множестве не про любые два элемента можно
сказать, что один из них меньше другого.
Определение 1.7.3. Говорят, что x и y сравнимы, если x 6 y или y 6 x. Если в частично
упорядоченном множеством любые два элемента сравнимы, то такой порядок называется
линейным.
Не всякий порядок линеен, так что понятие «самого маленького» элемента подмножества
распадается на два.
Определение 1.7.4. Пусть (A, 6) — частично упорядоченное множество, и B ⊆ A — непу‐
стое. Элемент x ∈ B называется
• наименьшим, если для любого b ∈ B выполнено x 6 b;

• минимальным, если в B не существует элементов, меньших x (то есть для любого b ∈ B
неравенство b 6 x влечет b = x). Аналогичным образом определяются наибольший и
максимальный элементы.
Пример 1.7.5. Пусть A = 2X относительно ⊆. Тогда у множества A имеется наименьший
элемент ∅, а у множества всех непустых подмножеств X, то есть A \ {∅}, наименьшего эле‐
мента нет, а минимальным является любое одноэлементное подмножество X.
Замечание 1.7.6.
• Если наименьший элемент существует, то он единственный ;
• Наименьший элемент является минимальным;

• Если порядок линеен, то минимальный элемент является наименьшим.
Доказательство. Антисимметричность.
15
Определение 1.7.7. Частично упорядоченное множество A называется вполне упорядочен‐
ным, а порядок полным, если любое непустое подмножество B ⊆ A содержит наименьший
элемент.
Замечание 1.7.8. Полный порядок является линей ным.
Доказательство. Пусть x, y два элемента. Рассмотрим множество {x, y} — в нем имеется
наименьший элемент, скажем, a. Обозначим оставший ся элемент b (если x 6= y, иначе поло‐
жим b = x = y), тогда a 6 b и тем самым x и y сравнимы.
Факт 1.7.9. Множество натуральных чисел N относительно естественного порядка является
вполне упорядоченным.
Строго говоря, в рамках аксиоматики теории множество по Цермело—Френкелю указанный факт входит в опре‐
деление множества натуральных чисел. А именно, постулируется существование вполне упорядоченного множе‐
ства, которое не является конечным (не изоморфно себе с инвертированным порядком) и которое можно инъек‐
тивно отобразить в любое бесконечное [вполне упорядоченное].
Следствие 1.7.10 (Принцип математической индукции).

Пусть P (n) — некоторое высказывание о натуральном числе n. Предположим, что такие
утверждения обладают двумя свой ствами:
1. P (1) истинно (база индукции);
2. Для любого n ∈ N из истинности P (n) следует истинность P (n + 1) (индукционный
переход).
Тогда P (n) истинно для любого n ∈ N.
Доказательство. Обозначим X = {n ∈ N | P (n) ложно}. Если это множество непусто, то у
него существует наименьший элемент n0 . Если n0 = 1, то P (1) ложно, что противоречит базе
индукции. Значит, n0 > 1. Так как все натуральные числа, меньшие n0 , в том числе n0 − 1,
не принадлежат X, получаем, что P (n0 − 1) истинно, а тогда по индукционному переходу
истинно и P (n0 ), а тогда n0 ∈
/ X, противоречие. Значит, на самом деле множество X пусток,
откуда получаем, что P (n) истинно для всех натуральных n.
На самом деле P (n) не обязательно воспринимать как утверждение о свой ствах натураль‐
ного числа n или как формулу, зависящую от n, — это могут быть просто какие‐то суждения,
занумерованные натуральными числами.
Существуют многочисленные вариации на тему принципа математической индукции, мы
отметим следующие два (доказательство их абсолютно аналогично приведенному выше).
Предложение 1.7.11 (Принцип сильной математической индукции).
Если для P (n) выполнены следующие два свой ства:
1. P (1) истинно;
2. Истинность P (i) для всех i 6 n влечет истинность P (n + 1);
то P (n) истинно для всех n ∈ N.
Предложение 1.7.12 (Принцип математической индукцией с базой длины k).
Если для P (n) выполнены следующие два свой ства:
1. P (1), P (2), . . . , P (k) истинны;
16
2. Истинность P (n − i) для всех 0 6 i < k влечет истинность P (n + 1);
то P (n) истинно для всех n ∈ N.

Принцип сильной математической индукции назван так не потому, что он позволяет до‐
казывать какие‐то более сильные и сложные теоремы, а потому что в индукционном перехо‐
де используется более сильная гипотеза. По своей доказательной силе все три изложенных
выше способа равны.
Замечание 1.7.13. Доказательство при помощи одного из методов индукции из трех выше
можно превратить в доказательство при помощи любого другого.
Доказательство. Понятно, что доказательство при помощи обычного принципа математи‐
ческой индукции (ПМИ), можно рассматривать как доказательство при помощи принципа
сильной математической индукции (ПСМИ), а именно, усиление индукционного предполо‐
жения не ослабляет индукционного перехода (используются не все условия). Обратно, дока‐
зательство P (n) при помощи ПСМИ можно рассматривать как доказательство посредством
ПМИ, но примененное к другому утверждению P ′ (n), а именно, P ′ (n) = P (1)&(2)& . . . &P (n).
Точно так же, доказательство P (n) при помощи принципа математической индукции с ба‐
зой длины k можно рассматривать как доказательство P ′′ (n) с использованием ПМИ, где
P ′′ (n) = P (n)&P (n − 1)& . . . &P (n − k + 1).
В качестве иллюстрации использования метода математической индукции докажем сле‐
дующее полезное утверждение.
Теорема 1.7.14 (Принцип Дирихле). Если |A| = |B| < ∞, то для f : A → B инъективность
эквивалентна сюръективности (и, тем самым, биективности).
Доказательство. Индукция по |A| = |B|. База тривиальна.

Пусть f инъективна. Тогда определена функция g : A \ {a} → B \ {f (a)}, дей ствующая
по правилу g(x) = f (x). Дей ствительно, по инъективности f нет таких x ∈ A \ {a}, что
f (x) = f (a). По индукционному предположению g биективна, а тогда биективна и f .
Если же f сюръективна, то она обратима справа, и ее правая обратная h : B → A, в свою
очередь, обратима слева, то есть инъективна и по уже доказанному является биекцией . А
тогда биективна и f .
17
2 Алгебраические структуры и элементарная теория чисел
2.1 Бинарные операции
Определение 2.1.1. Бинарной операцией на множестве A называется функция φ : A×A → A.
Обозначение 2.1.2. Бинарные операции часто записывают при помощи инфиксной записи,
то есть символ операции вставляется между аргументами, например, φ(x, y) = x ∗ y;
1. x + y на множестве N, Z, Q, R;
2. x · y на N, Z, R, R>0 , R \ {0};
3. x − y на R;
4. φ(x, y) = xy на R>0 ;
5. φ(x, y) = max(x, y) на R;
6. φ(x, y) = x;
7. f ◦ g на AA ;
8. Векторное произведение в трехмерном пространстве;
9. X ∪ Y , X ∩ Y , X \ Y и X 4 Y на 2A ;
Кроме функциональной и инфиксной записи распространены также префиксная и постфиксная запись. Пре‐
фиксная запись иногда именуется «польской нотацией », особенно если пишется без скобок и запятых — в ней вы‐
ражение (1 + 2) · (3 + 4) запишется как ∗ + 1 2 + 3 4 (если известна арность операций , то скобки не требуются).
Аналогичная форма постфиксной записи называется «обратной польской » и используется в стековых машинах (и,
например, в языке описания страниц Postscript). В математике постфиксная запись используется в основном для
унарных операций , таких, как дифференцирование: f ′ . Вообще говоря, бинарные операции записываются самыми
разными способами, например, xy , xy
, [x, y] для векторного произведения или, более общно, коммутатора, x + y
mod m для сложения по модулю m.
Определение 2.1.4. Если φ — бинарная операция на A, B ⊆ A, и φ(B × B) ⊆ B, то огра‐

ничением φ на B называется бинарная операция ψ : B × B → B, дей ствующая по правилу
ψ(x, y) = φ(x, y).
Определение 2.1.5. Операция ∗ на множестве A называется ассоциативной, если для любых
x, y, z ∈ A выполнено (x ∗ y) ∗ z = x ∗ (y ∗ z).
Среди примеров выше ассоциативными являются примеры 1, 2, 5, 6, 7, а также все опера‐
ции в примере 9, кроме разности множеств.
Теорема 2.1.6 (Обобщенная ассоциативность). Если операция ∗ ассоциативна, то результат
вычисления выражения x1 ∗ x2 ∗ . . . ∗ xn не зависит от расстановки скобок.
Доказательство. Индукция по n. База n = 3 является определением ассоциативности. Пред‐
положим, что n > 3 и утверждение теоремы уже доказано для всех меньших натуральных
чисел (то есть для всех более коротких произведений ). Покажем, что тогда результат вычис‐
ления при любой расстановке скобок совпадает с результатом при так называемой «лево‐
нормированной » расстановке:
(. . . ((x2 ∗ x2 ) ∗ x3 ) ∗ . . . ∗ xn ).
18
Рассмотрим произвольную расстановку скобок — в ней последнее выполняемое дей ствие
состоит в перемножении произведений (каждое с какой ‐то расстановкой скобок)
(x1 ∗ . . . ∗ xk ) ∗ (xk+1 ∗ . . . ∗ xn ).
Если k = n − 1, то можно применить индукционное предположение к произведению x1 ∗ . . . ∗

xn−1 , выбрав в нем лево‐нормированную расстановку скобок — тогда приписывание справа
xn дает лево‐нормированную расстановку скобок на x1 ∗ . . . ∗ xn .
Если же k < n − 1, то заметим, что во втором множителе (то есть в xk+1 ∗ . . . ∗ xn ) по
край ней мере 2 элемента, но меньше, чем n. По индукционному предположению мы можем
расставить в нем скобки лево‐нормированным способом:

(x1 ∗ . . . ∗ xk ) ∗ (xk+1 ∗ . . . ∗ xn−1 ) ∗ xn
| {z } | {z }
X Y
Применим ассоциативность к произведению X ∗ (Y ∗ xn ) = (X ∗ Y ) ∗ xn , тогда наше произ‐

ведение перепишется в виде

x ∗ . . . ∗ xk ∗ xk+1 ∗ . . . ∗ xn−1 ∗ xn ,
| 1 {z } | {z }
X Y
что сводит задачу к уже разобранному случаю k = n − 1.

Определение 2.1.7. Операция ∗ на множестве A называется коммутативной, если для лю‐
бых x, y ∈ A выполнено x ∗ y = y ∗ x.
Если операция некоммутативна, то естественное понятие, обобщающее 0 относительно
сложения и 1 относительно умножения, разделяется на два.
Определение 2.1.8. Элемент e ∈ A называется
• левым нейтральным, если для любого a ∈ A выполнено e ∗ a = a;

• правым нейтральным, если для любого a ∈ A выполнено a ∗ e = a;
• нейтральным, если он одновременно левый и правый ней тральный .
Замечание 2.1.9. Если e — левый ней тральный , а f — правый , то они равны. В частности,
тогда левый и правый ней тральный являются двусторонне ней тральным элементом и един‐
ственны.
Доказательство. f = e ∗ f = e.
• 0 является ней тральным относительно +;

• 1 является ней тральным относительно ·;
• 0 является единственным правым ней тральным относительно −, а левых ней траль‐
ных нет;
• 1 является единственным правым ней тральным относительно возведения в степень,

а левых ней тральных нет;
19
• относительно взятия максимума ней трального элемента нет (но если ограничить эту
операцию на [a, b], то a будет для нее ней тральным);
• для операции φ(x, y) = x любой элемент является правым ней тральным, а левый ней ‐
тральный существует только если операция задана на одноэлементном множестве;
• id является ней тральным относительно композиции;
• для теоретико‐множественных операций , заданных на 2A :

– ∅ является ней тральным относительно ∪;
– A является ней тральным относительно ∩;
– ∅ является ней тральным для 4;
– ∅ является единственным правым обратным относительно \, а левых ней траль‐
ных нет.
Определение 2.1.11. Пусть x, y ∈ A таковы, что x ∗ y = e, гду e — ней тральный элемент от‐
носительно ∗. Тогда x называется левым обратным для y, а y называется правым обратным
для x. Элемент z называется обратным к w, если он одновременно левый и правый обрат‐
ный для w, то есть z ∗ w = w ∗ z = e.
Замечание 2.1.12. Пусть операция ∗ ассоциативна. Если у элемента x одновременно суще‐

ствуют левый и правый обратные, то они совпадают. В частности, тогда левый и правый
обратные являются обратным элементом и единственны.
Доказательство. Дословно как для композиции.
Выясним теперь, когда бинарная операция задает естественным образом бинарную опе‐
рацию на фактор‐множестве. А именно, пусть ∼ это отношение эквивалентности на множе‐
стве A и ∗ — бинарная операция на A, тогда естественно определить.
[a]∼ ∗ [b]∼ = [a ∗ b]∼
Такая операция называется индуцированной операцией ∗.

Чтобы это определение было корректным, необходимо, чтобы результат не зависел от вы‐
бора представителей a и b соответствующих классов эквивалентности, то есть чтобы было
выполнено следующее условие:
если [a] = [a′ ] и [b] = [b′ ], то [a ∗ b] = [a′ ∗ b′ ],
или, что то же самое, a ∼ a′ и b ∼ b′ вместе влекут a ∗ b ∼ a′ ∗ b′ . Такие отношения эквива‐

лентности называются отношениями конгруэнтности для ∗.
Пример 2.1.13. Пусть m ∈ Z. Тогда отношение ∼ на Z, задаваемое правилом
a∼b ⇐⇒ a − b = km для некоторого k ∈ Z,
является конгруэнтностью для сложения и умножения целых чисел. Дей ствительно, если
a ∼ a′ и b ∼ b′ , то для каких‐то k, l ∈ Z имеем a′ = a + km и b′ = b + lm, тогда
a′ + b′ = (a + b) + (k + l)m ⇒ a′ + b′ ∼ a + b,
a′ b′ = ab + (kb + la + klm)m ⇒ a′ b′ ∼ ab.
20
2.2 Группы и кольца
Определение 2.2.1. Пусть G — множество, а ∗ — бинарная операция на G. Пара (G, ∗) назы‐
вается (абстрактной) группой, если выполнены следующие три условия:
• операция ∗ ассоциативна;
• существует элемент e ∈ G, ней тральный относительно ∗;
• у каждого элемента a ∈ G существует обратный элемент b ∈ G.
Допуская вольность речи, мы будем говорить, что G является группой относительно ∗. Эле‐
мент, обратный к a ∈ G, будем обозначать a−1 .
1. (R, +), (Q, +), (Z, +) — но не (N, +);
2. (R>0 , ·), (R \ {0}, ·) — но не (R, ·) и не (Z \ {0}, ·);
3. множество всех биекций A → A относительно композиции (если A 6= ∅), а также все‐
возможные множества биекций , сохраняющих какую‐то структуру (так как компози‐
ция таких преобразований это снова биекция, сохраняющая структуру, тождественное
и обратное к данному преобразования тоже ее сохраняют), например:
• все повороты вокруг начала координат;
• все параллельные переносы;
• все движения;
• все симметрии фиксированной геометрической фигуры;
• все автоморфизмы графа, то есть биекции на множестве вершин, переводящие со‐
единенные ребром в соединенные ребром;
• все строго монотонно возрастающие функции [0, 1] → [0, 1];
• все строго монотонные функции [0, 1] → [0, 1] (как возрастающие, так и убываю‐
щие);
• все биекции, переводящие эквивалентные элементы в эквивалентные (относи‐
тельно некоторого фиксированного отношения эквивалентности);
4. (2A , 4) — здесь ней тральным элементом выступает ∅, а обратный X −1 = A \ X;
5. для двух групп (G, ∗) и (H, ⋆) множество G × H относительно операции (a, x) • (b, y) =
(a ∗ b, x ⋆ y) — ней тральным элементом является пара (eG , eH ), а обратный к (a, x) вы‐
числяется как (a−1 , x−1 );
6. для группы (G, ∗) и множества A множество GA относительно поточечного примене‐
ния ∗, то есть для f, g : A → G полагаем (f ⋆ g)(a) = f (a) ∗ g(a).
Определение 2.2.3. Группа (G, ∗) называется коммутативной, или абелевой, если операция
∗ коммутативна.
Определение 2.2.4. Пусть R — множество, а + и · две бинарные операции на R. Тогда трой ка
(R, +, ·) называется кольцом (или, более точно, ассоциативным кольцом с 1), если
• (G, +) — абелева группа;
21
• операция · ассоциативна;
• существует элемент 1 ∈ R, ней тральный относительно ·;
• операция · дистрибутивна относительно +, то есть для любых x, y, z ∈ R выполнено
(x + y) · z = (x · z) + (y · z) и x · (y + z) = (x · y) + (x · z).
Обычно операции + и · называют сложением и умножением, как и подсказывают обозна‐

чения.
1. Z, Q, R относительно обычных сложения и умножения;
2. если A — множество, то RA относительно поточечных сложения и умножения, а также
различные подмножества, в частности
• Rn (полагая A = {1, . . . , n});
• многочлены {a0 + a1 x + a2 x2 + . . . + an xn | n ∈ N, a1 , . . . , an ∈ R};
• непрерывные/дифференцируемые/k‐дифференцируемые/бесконечно дифферен‐
циремые/аналитические функции R → R;
Pn
• тригонометрические многочлены {a0 + k=1 ak cos(kx) + bk sin(kx) | ai , bi ∈ R}
— здесь нетривиально проверить замкнутость относительно умножения (посред‐
ством тригонометрических формул для произведения тригонометрических функ‐
ций );
3. пример нечисловой природы: (2A , 4, ∩) — ней тральным отноcительно ∩ является A, а
дистрибутивность проверяется непосредственно;
4. если m ∈ Z, а ∼ отношение эквивалентности, задаваемое как x ∼ y ⇔ x−y делится на m,
то фактор‐множество Z/∼ относительно операций , индуцированных сложением и умно‐
жением целых чисел, тоже является кольцом (это кольцо мы еще будем очень подроб‐
но изучать в дальней шем);
P∞
5. формальные степенные ряды { k=0 ak xk | ak ∈ R} с умножением
X
∞ X
∞ X∞ X
ak xk ∗ bk x k = ck x k , где ck = ai bj
k=0 k=0 k=0 i,j>0
i+j=k
(при попытке наивно «раскрыть скобки» в левой части получается бесконечная сумма,
но при каждом xk в качестве коэффициента в итоге получается конечная сумма ck ).
Определение 2.2.6. Кольцо называется коммутативным, если операция умножения ком‐
мутативна.
Все примеры выше являются коммутативными, но в дальней шем мы увидим важные при‐
меры некоммутативных колец.
Обозначение 2.2.7. Элемент, обратный к a ∈ R относительно +, будем обозначать −a, а
обратный относительно ∗, если он существует, a−1 .
Обозначение 2.2.8. Множество обратимых элементов кольца R будем обозначать R∗ .
22
Замечание 2.2.9. Если a, b ∈ R∗ , то ab ∈ R∗ и (ab)−1 = b−1 a−1 .
Доказательство. Прямая проверка:

(ab)(b−1 a−1 ) = a(bb−1 ) a−1 = (a · 1)a−1 = aa−1 = 1 и b−1 a−1 ab = b−1 b = 1.
Следствие 2.2.10. (R∗ , ·) является группой (она называется мультипликативной группой

кольца R).
/ R∗ .
Замечание 2.2.11. 0 ∈
/ R∗ .
Доказательство. Для любого x ∈ R имеем 0 · x = 0 6= 1, так что 0 ∈
2.3 Делимость в коммутативном кольце

Определение 2.3.1. Пусть R — коммутативное кольцо, a, b ∈ R. Если существует такой
.
r ∈ R, что a = br, то говорят, что a делится на b (обозначается a .. b) или что b делит a
(обозначение: b | a).
Предложение 2.3.2. Для любых a, b, c, d ∈ R выполнено:
.
1. a .. a (рефлексивность);
.
2. если a обратим, то b .. a;
. . .
3. если a .. b и b .. c, то a .. c (транзитивность);
. . .
4. если a .. c и b .. c, то a + b .. c;
. . .
5. если a .. b и c .. d, то ac .. bd;
Доказательство.
1. a = a · 1;
2. b = a · (a−1 b);
3. если a = br и b = cs, то a = (cs)r = c(sr);
4. если a = cr и b = cs, то a + b = c(r + s);
5. если a = br и c = ds, то ac = brds = (bd)(rs).
. .
Следствие 2.3.3. Если ε ∈ R обратим, то a .. b влечет a .. (εb).
Определение 2.3.4. Если a, b ∈ R, a, b 6= 0, таковы, что ab = 0, то a и b называются делите‐
лями нуля. Кольцо называется областью целостности, если в нем нет делителей нуля.
Не все примеры колец выше являются областями целостности. Например, в (2A , 4, ∩) лег‐
ко предъявить два непустых множества, имеющих пустое пересечение. Аналогично, легко
предъявить две ненулевых функции, имеющих нулевое поточечное произведение (множе‐
ства точек, где их значения не равны нулю, не должны пересекаться).
/ R∗ .
Замечание 2.3.5. Если a — делитель нуля, то a ∈
Доказательство. Пусть a, b 6= 0 таковы, что ab = 0. Предположим, что a обратим, так что
най дется такой u ∈ R, что ua = 1. Тогда b = 1·b = (ua)b = u(ab) = u·0 = 0, противоречие.
23
.
Предложение 2.3.6. Пусть R — область целостности, a, b, c ∈ R и c 6= 0. Тогда ac .. bc равно‐
..
сильно a . b.
. . .
Доказательство. Если a .. b, то, поскольку c .. c, получаем, что ac .. bc. Обратно, пусть ac = (bc)r,
.
тогда (a − br)c = 0, откуда по условию теоремы a − br = 0, то есть a = br и a .. b.
.
Отношение .. является рефлексивным и транзитивным, но, вообще говоря, не антисиммет‐
рично. Установим, насколько оно далеко от антисимметричного.
. .
Определение 2.3.7. Пусть R — область целостности, a, b, ∈ R. Если a .. b и b .. a, то будем
говорить, что a и b ассоциированы.
Замечание 2.3.8. Элементы a, b ∈ R ассоциированы тогда и только тогда, когда существует
такой ε ∈ R∗ , что a = εb.
Доказательство. Если a = br и b = as, то a = a(rs). Тогда a(1 − rs) = 0, откуда a = 0 или

1 = rs. Во втором случае r обратим и можно взять ε = r. В первом случае b = as = 0 и можно
положить ε = 1 (или любой другой обратимый элемент).
Обратно, если a = εb, то b = ε−1 a.
Определение 2.3.9. Пусть a, b ∈ R. Элемент d ∈ R называется наибольшим общим делите‐
лем a и b, если
. .
• a .. d и b .. d;
. . .
• для любого d′ ∈ R если a .. d′ и b .. d′ , то d .. d′ .
Замечание 2.3.10. Наибольший общий делитель определен с точностью до ассоциирован‐
ности, то есть
• если d — наибольший общий делитель a и b, то то же верно для εd для любого ε ∈ R∗ ;
• если d и d′ — два наибольших общих делителя a и b, то они ассоциированы.
2.4 Делимость целых чисел

Сосредоточимся теперь на свой ствах кольца целых чисел Z. Кроме арифметических опера‐
ций на Z имеется дополнительная структура — порядок, хорошо согласованный с арифмети‐
ческими операциями. Вообще говоря, эта согласованность относится ко всем вещественным
числам (свой ства вроде «сумма и произведение положительных чисел положительны»), но
для кольца вещественных чисел понятие делимости тривиально (так как все ненулевые эле‐
менты обратимы). Для целых чисел делимость весьма нетривиальна и тесно связана с по‐
рядком.
Теорема 2.4.1 (о делении с остатком). Пусть a, b ∈ Z, b 6= 0. Тогда существуют такие одно‐
значно определенные q, r ∈ Z, называемые неполным частным и остатком, что
a = bq + r, 0 6 r < |b|.
Доказательство. Рассмотрим сначала случай , когда a, b > 0. Доказательство проведем ин‐

дукцией по a.
В качестве базы будем использовать случай a < b — тогда a = b · 0 + a. Индукционный
переход: пусть a > b, рассмотрим a′ = a − b. По‐прежнему a′ > 0, но a′ < a, так что можно
24
применить индукционное предположение: существуют такие q ′ , r′ , что a′ = bq ′ + r′ и 0 6
r′ < b. Но тогда a = a′ + b = b(q ′ + 1) + r — искомое представление.
Пусть теперь a < 0, b > 0. Тогда −a > 0 и в силу уже доказанного существуют такие q ′ , r′ ,
что −a = bq ′ + r′ и 0 6 r′ < b. Тогда a = −bq ′ − r′ . Если r′ = 0, то q = −q ′ , r = 0. Если же r′ 6= 0,
то a = b(−q ′ ) − b + b − r′ = b(−q ′ − 1) + (b − r′ ). Положим q = q ′ − 1, r = b − r′ — тогда 1 6 r < b
и a = bq + r.
Остается случай b < 0. Тогда −b > 0 и существуют такие q ′ , r′ , что a = (−b)q ′ + r′ и 0 6 r′ <
−b. Отсюда a = b(−q ′ ) + r′ , причем 0 6 r′ < |b|.
Докажем теперь единственность q и r. Пусть a = bq + r = bq ′ + r′ , где 0 6 r, r′ < |b|. Тогда
b(q − q ′ ) = (r − r′ ). Если q 6= q ′ , то левая часть по модулю > |b|, в то время как правая < |b|.
Значит, q = q ′ , откуда также r = r′ .
Вопрос существования неполного частного и остатка можно решить прямым обращением к полной упорядочен‐
ности N. А именно, рассмотрим множество {a − bq | q ∈ Z} ∩ Z>0 — оно непусто и потому содержит наименьший
элемент r. Если r > |b|, то r − |b| снова является элементом того же множества, но меньше r, противоречие.
Замечание 2.4.2. Для целых чисел наибольший общий делитель определен с точностью до
знака. Поэтому можно выбрать из двух вариантов один и в дальней шем всегда считать, что
наибольший общий делитель двух целых чисел a и b неотрицательный — мы будем обозна‐
чать его gcd(a, b).
Теорема 2.4.3. Для любых ненулевых a, b ∈ Z их наибольший общий делитель существует
и является наименьшим элементом множества Xa,b = {ax + by | x, y ∈ Z} ∩ N всех положи‐
тельных целочисленных линей ных комбинаций a, b.
Доказательство. Множество Xa,b непусто, так как по край ней мере содержит |a|. Обозначим
наименьший элемент множества Xa,b через d. Тогда для каких‐то целых x0 , y0 имеем d =
ax0 + by0 . Поделим a на d с остатком: a = dq + r, где 0 6 r < d, откуда a = (ax0 + by0 )q + r,
то есть r = a(1 − x0 1) + b(−y0 q). Если r 6= 0, то r ∈ Xa,b является элементом, меньшим
. .
наименьшего, что невозможно. Значит, r = 0 и a = dq, так что a .. d. Аналогично, b .. d.
′
Пусть теперь d — какой ‐то общий делитель a и b. Тогда он является делителем любого
элемента множества X, в частности, d, так что d дей ствительно является наибольшим общим
делителем a и b.
Замечание 2.4.4. gcd(a, 0) = gcd(0, a) = a.
Следствие 2.4.5. Для любых a, b ∈ Z существуют такие x0 , y0 ∈ Z, что ax0 + by0 = gcd(a, b).
Такое выражение называется линейным представлением НОД.
Лемма 2.4.6. Пусть a, b, k ∈ R. Тогда gcd(a, b) = gcd(a, b + ak). В частности, при замене b на
остаток от деления b на a НОД не меняется.
Доказательство. Докажем, что Xa,b = Xa,b+ak . Дей ствительно,
ax + by = a(x − ky) + (b + ak)y ⇒ Xa,b ⊆ Xa,b+ak ,

ax + (b + ak)y = a(x + ky) + by ⇒ Xa,b+ak ⊆ Xa,b .
Изложенное выше подсказывает пусть к вычислению наибольшего общего делителя: за‐

менять пару чисел a, b на пару меньших чисел, имеющих тот же НОД, пока не придем к паре
чисел, одно из которых делится на другое.
Алгоритм 2.4.7 (Алгоритм Эвклида).
25
1. Полагаем r0 = a, r1 = b;
2. Делим с остатком: r0 = r1 q1 + r2 , где 0 6 r2 < |r1 |;
3. Повторяем: ri−1 = ri qi + ri+1 ;
4. Если rk+1 = 0, то rk = gcd(a, b).
Этот процесс вычисляет gcd(a, b), но не дает его линей ного продставления. Конечно, мож‐
но подняться по цепочке делений с остатком и выразить каждый ri+1 в виде линей ной ком‐
бинации ri и ri−1 , в итоге получив выражение в виде линей ной комбинации a и b, но это
требует хранить в памяти все остатки и все неполные частные. Оказывается, есть модифика‐
ция алгоритма Эвклида, которая позволяет с минимальными дополнительными усилиями
получить одновременно НОД и его линей ное представление.
Алгоритм 2.4.8 (Расширенный алгоритм Эвклида).
1. Положим r0 = a, r1 = b, s0 = 1, s1 = 0, t0 = 0, t1 = 1;
2. Вычисляем
ri+1 = ri−1 − qi ri , где 0 6 ri+1 < |ri |,

si+1 = si−1 − qi si ,
ti+1 = ti−1 − qi ti ;
3. Если rk+1 = 0, то gcd(a, b) = rk = ask + btk .

Предложение 2.4.9. Расширенный алгоритм Эвклида корректно вычисляет линей ное пред‐
ставление НОД.
Доказательство. Достаточно доказать, что для любого i выполнено равенство ri = asi +bti .
Доказательство будем вести индукцией по i (с базой длины 2).
База индукции: случаи i = 0, 1. Для i = 0 доказываемое равенство означает просто, что
r0 = a = a · 1 + b · 0 = as0 + bt0 , а для i = 1 это r1 = b = a · 0 + b · 1 = as1 + bt1 .
Индукционный переход: пусть равенство уже доказано для i и i − 1. Рассмотрим
ri+1 = ri−1 − ri qi
= (asi−1 + bti−1 ) − (asi + bti )qi
= (asi−1 − asi qi ) + (bti−1 − bti qi )
= asi+1 + bti+1 .
Определение 2.4.10. Элемент d ∈ R называется наибольшим общим делителем a1 , . . . , an ∈

R, если
. .
1. a1 .. d, . . . , an .. d;
. . .
2. для любого такого d′ , что a1 .. d′ , . . . , an .. d′ выполнено d .. d′ .
Для набора целых чисел НОД существует и определен однозначно с точностью до знака.
Положительное значение будем обозначать gcd(a1 , . . . , an ).
Предложение 2.4.11.
.
1. gcd(a, b) = |a| тогда и только тогда, когда b .. a.
26
2. gcd(gcd(a, b), c) = gcd(a, gcd(b, c)) = gcd(a, b, c).
3. gcd(ab, ac) = a · gcd(b, c).
. .
Доказательство. 1. Если gcd(a, b) = |a|, то b .. a. Обратно, если b .. a, то a должен делить
..
d = gcd(a, b). При этом a . d, так что a и d ассоциированы, так что d = |a|.
2. Пусть d1 = gcd(gcd(a, b), c) и d2 = gcd(a, gcd(b, c)). Тогда
. . . .
gcd(a, b) .. d1 , c .. d1 , a .. d2 , gcd(b, c) .. d2 ,
. . .
откуда a, b, c .. d1 , d2 , так что gcd(a, b) .. d2 и gcd(b, c) .. d1 . Но по определению НОД для лю‐
. .
бого такого d′ , что gcd(a, b), c .. d′ , выполнено d1 .. d′ , в частности, это верно для d′ = d2 .
. .
Аналогично, для любого такого d′′ , что a gcd(b, c) .. d′′ выполнено d2 .. d′′ , в частности,
. .
для d′′ = d1 . Итого получаем, что d1 .. d2 и d2 .. d1 , а так как они одного знака, то совпа‐
дают.
3. Если a = 0, то в обеих частях равенства стоит 0. Пусть a 6= 0. Обозначим d = gcd(b, c).
. . . .
Тогда b, c .. d, откуда ab, ac .. ad, то есть gcd(ab, ac) .. ad. С другой стороны, ab, ac .. a, так что
.. ..
gcd(ab, ac) . a, то есть gcd(ab, ac) = ak для некоторого k, и ab, ac . ak. Поскольку a 6= 0,
. . . .
получаем, что b, c .. k, откуда gcd(b, c) .. k и a · gcd(b, c) .. ak. Итого a · gcd(b, c) .. gcd(ab, ac)
..
и gcd(ab, ac) . a · gcd(b, c), так что они равны.
Предложение выше позволяет вычислить НОД любого конечного набора чисел:
gcd(a1 , a2 , . . . , an ) = gcd(gcd(a1 , a2 ), a3 , . . . , an ),
но эта процедура может оказаться неэффективной (она может сработать очень быстро, ес‐
ли, скажем, gcd(a1 , a2 ) = 1 или gcd(a1 , a2 ) = gcd(a1 , . . . , an ), но не в общем случае). Имеется
модификация алгоритма Эвклида, в которой вместо шага (a, b) (b, r) производятся следу‐
ющие дей ствия:
Алгоритм 2.4.12 (Алгоритм Эвклида для n чисел).
1. Рассмотрим кортеж (a1 , . . . , an ) и най дем его наименьший (по модулю) ненулевой эле‐
мент ak .
2. Поделим все остальные элементы на ak с остатком: ai = ak qi + ri , 0 6 ri < |ak |.
3. Заменим (a1 , . . . , an ) на (r1 , . . . , rk−1 , ak , rk+1 , . . . , rn ).
4. Будем повторять, пока в кортеже сохраняется хотя бы один ненулевой элемент. По‐
следнее ненулевое значение и будет равно gcd(a1 , . . . , an ).
При этом наименьший элемент набора на следующем шаге можно находить уже в процессе
вычисления остатков.
2.5 Взаимная простота

Определение 2.5.1. Целые числа a и b называются взаимно простыми, если у них нет нетри‐
виальных общих делителей (то есть отличных от 1 и −1). Иными словами, если gcd(a, b) = 1.
Обозначение 2.5.2. Отношение взаимной простоты будем обозначать символом a ⊥ b.
Предложение 2.5.3. Пусть a, b, c ∈ Z.
27
1. a ⊥ b тогда и только тогда, когда существуют такие x, y ∈ Z, что ax + bt = 1.
2. Если a ⊥ b и a ⊥ c, то a ⊥ bc.
. .
3. Если ab .. c и a ⊥ c, то b .. c.
. . .
4. Если a .. b, a .. c и b ⊥ c, то a .. bc.
Доказательство. 1. В силу Теоремы 2.4.3.
2. По предыдущему пункту ax + by = 1 и az + cw = 1 для некоторых x, y, z, w ∈ Z. Тогда
перемножая эти два равенства, получаем a · (axz + cxw + byz) + bc · yw = 1.
3. Существуют такие x, y ∈ Z, что ax + cy = 1. Домножим на b, получим abx + bcy = b.
. . .
Поскольку ab .. c и bc .. c, то же верно и для суммы, то есть b .. c.
.
4. a = bk для некоторого k ∈ Z. При этом bk = a .. c, но b ⊥ c, так что по предыдущему
..
пункту k . c, то есть k = cm для какого‐то m ∈ Z. Тогда a = bk = b(cm) = (bc)m.
Следствие 2.5.4. Если a1 , . . . , am , b1 , . . . , bn ∈ Z таковы, что ai ⊥ bj для любых i = 1, . . . , m и
j = 1, . . . , n, то a1 · . . . · am ⊥ b1 · . . . · bn . В частности, если a ⊥ b, то am ⊥ bn .
Доказательство. По предыдущей теореме ai ⊥ b1 · . . . · bn , а тогда a1 · . . . · am ⊥ b1 · . . . · bn .
Следствие 2.5.5. Если a ∈ N неявляется n‐й степенью натурального числа, то a не является
n‐й степенью рационального числа. Иными словами, нецелые корни из натуральных чисел
являются иррациональными.
Доказательство. Пусть x/y ∈ Q. Можно считать, что x ⊥ y и что y > 1. Тогда (x/y)n = xn/y n
не является целым числом (так как xn не делится на y n ).
2.6 Линейные диофантовы уравнения

Пусть a, b, c ∈ Z. Рассмотрим линей ное уравнение ax + by = c от двух переменных x, y. Очень
полезно выяснить, какие у этого уравнения целочисленные решения.
Если a = b = 0, то решений либо нет (если c 6= 0), либо все целые числа являтся реше‐
ниями (если c = 0). В дальней шем будем полагать, что хотя бы один из коэффициентов при
переменных не равен 0.
Предложение 2.6.1. Целочисленные решения уравнения ax + by = c существуют тогда и
.
только тогда, когда c .. gcd(a, b). Все решения имеют вид x = x0 + b′ k, y = y0 − a′ k для k ∈ Z,
где x0 , y0 — какое‐то одно решение, a′ = a/ gcd(a, b), b′ = b/ gcd(a, b), и для каждого k такие
x, y являются решением.
. .
Доказательство. Если x, y — какое‐то решение, то ax + by .. gcd(a, b), так что c .. gcd(a, b).
.. ′
Обратно, если c . gcd(a, b), то c = c · gcd(a, b). Линей ное представление НОД гарантирует
существование таких x, y ∈ Z, то ax + by = gcd(a, b), а тогда a(c′ x) + b(c′ y) = c′ · gcd(a, b) = c.
.
Пусть теперь c .. gcd(a, b). Поделив обе части уравнения на gcd(a, b) (что не изменяет мно‐
жества решений ), можем считать, что требуется решить уравнение ax + by = c, где a ⊥ b.
Пусть x0 , y0 — фиксированное решение, а x, y — какое‐то другое решение. Вычитая ax0 +
by0 = c из ax + by = c, получаем, что a(x − x0 ) + b(y − y0 ) = 0, или a(x − x0 ) = b(y0 − y). Так
. .
как a(x − x0 ) .. b и a ⊥ b, получаем, что x − x0 .. b. Значит, x − x0 = bk, откуда abk = b(y0 − y) и
y − y0 = ak. Итого x = x0 + bk, y = y0 − ak. Проверка того, что всякая пара (x0 + bt, y0 − at)
дает решение, осуществляется прямой подстановкой .
28
Замечание 2.6.2. Если b = 0, то уравнение ax+by = c разрешимо тогда и только тогда, когда
.
c .. a. Решениями в таком случае являются x = c/a вместе с произвольным y.
Предложение 2.6.3. Линей ное диофантово уравнение a1 x1 + . . . + an xn = b от n целочис‐
.
ленных переменных x1 , . . . , xn разрешимо тогда и только тогда, когда b .. gcd(a1 , . . . , an ).
Доказательство. Если решение существует, то левая часть делится на d = gcd(a1 , . . . , an ), а
. .
тогда и b .. d. Докажем обратное. Пусть b .. d. Доказывать будем индукцией по n.
База n = 2 выполнена по предыдущему утверждению.
Пусть n > 3. Рассмотрим уравнение gcd(a1 , a2 )y1 +a3 y3 +. . .+an yn = b от n−1 переменной
y1 , y3 , . . . , yn . По индукционному предположению оно разрешимо тогда и только тогда, когда
.
b делится на gcd(gcd(a1 , a2 ), a3 , . . . , an ) = gcd(a1 , . . . , an ) = d. По условию b .. d, так что реше‐
ние (y1 , y3 , . . . , yn ) существует. Рассмотрим еще одно уравнение a1 x1 + a2 x2 = gcd(a1 , a2 )y1
.
относительно переменных x1 , x2 . Так как gcd(a1 , a2 )y1 .. gcd(a1 , a2 ), оно разрешимо, так что
a1 x1 + a2 x2 + a3 y3 + . . . + an xn = gcd(a1 , a2 )y1 + a3 y3 + . . . + an yn = b.
2.7 Простые числа и основная теорема арифметики

Определение 2.7.1. Натуральное число называется простым, если оно имеет ровно два на‐
туральных делителя.
. .
Так как для любого n ∈ N выполнено n .. 1 и n .. n, то можно сказать, что простое число
в качестве натуральных делителей имеет только себя и 1. С другой стороны, у 1 нет других
натуральных делителей , кроме 1. Поэтому альтернативно можно определить простое число
следующим образом: натуральное число p простое, если p 6= 1 и у p нет натуральных дели‐
телей , отлинxых от 1 и p.
Предложение 2.7.2. Пусть p — простое число.
1. Если n ∈ N и p - n, то p ⊥ n.
2. Различные простые числа взаимно просты.

. . .
3. Если m, n ∈ Z и mn .. p, то m .. p или n .. p.
. .
4. Если n1 · . . . · nk .. p, то ni .. p для какого‐то i.
5. Если n ∈ Z таково, что |n| > 1, то n делится хотя бы на одно простое.
6. Простых чисел бесконечно много.

. .
Доказательство. 1. Пусть d = gcd(p, n). Раз p .. d, то d = p или d = 1. В первом случае n .. p,
а во втором p ⊥ n.
. .
2. Если p1 и p2 не взаимно просты, то p1 .. p2 и p2 .. p1 , а тогда p1 = p2 .
3. Можно считать что m, n ∈ N. Предположим, что p - m и p - n, тогда по предыдущему

пункту p ⊥ m и p ⊥ n, а тогда по Предложению 2.5.3(2) p ⊥ mn.
4. Индукция по числу множителей k. База k = 2 это предыдущий пункт. Переход: обозна‐
чим m = n1 · . . . · nk−1 и рассмотрим m · nk — это произведение делится на p, так что
. .
nk .. p или m .. p, и во втором случае можно применить индукционное предположение.
29
5. Достаточно доказать для натуральных n. Проведем полную индукцию по n. Если n про‐
.
стое, то n .. n и все доказано. Иначе у n имеется натуральный делитель m, меньший n.
По предположению индукции у m имеется простой делитель, который тогда является
и делителем n.
6. Если простых лишь конечное число, то можно составить список их всех: P = {p1 , . . . , pk }.
Рассмотрим число n = p1 ·. . .·pk +1. По предыдущему пункту у n есть простой делитель
— он обязан быть элементом P, скажем, pi . Но тогда 1 = n − p1 · . . . · pk тоже делится на
pi , противоречие. Значит, список всех простых не полон.
Теорема 2.7.3 (Основная теорема арифметики). Каждое натуральное число n может быть
представлено в виде произведения простых чисел, причем такое представление единствен‐
но с точностью до порядка сомножителей .
Доказательство. Существование разложения докажем индукцией по n. База: если n = 1, то

оно является произведением пустого набора простых чисел. Пусть теперь n > 1. По преды‐
дущему утверждению най дется такое простое число p1 , что n = p1 m для некоторого m < n.
По индукционному предположению существуют такие простые p2 , . . . , pk , что m = p2 ·. . .·pk ,
откуда n = p1 · . . . · pk .
Для доказательства единственности снова воспользуемся индукцией по n. База n = 1 оче‐
видна (в этом случае возможно только тривиальное разложение с 0 множителей ). Переход:
.
пусть n = p1 · . . . · pk = q1 · . . . · qm — два таких разложения. Тогда, поскольку n .. p1 , какой ‐то
из множителей qi делится на p1 , а тогда равен ему. Поделив на p1 = qi обе части, получа‐
ем два разложения для n/p1 , а они совпадают с точностью до перестановки множителей по
индукционному предположению.
Среди множителей в таком разложении могут встречать равные. Их можно объединить,

переписав тем самым натуральное число n в виде n = pd11 ·. . .·pdkk , где p1 , . . . , pk — различные
простые, а d1 , . . . , dk ∈ N. Такое представление называется каноническим разложением числа
n на простые множители.
Удобно бывает также допускать в разложении на простые нулевые степени — в этом слу‐
чае теряется единственность разложения (это можно обой ти, говоря о единственности толь‐
ко для тех простых множителей , которые входят с положительной степенью).
Еще один способ обой ти указанное выше препятствие — ввести понятия формально бесконечных суммы и про‐
изведения. А именно, рассмотрим P f : A → R, что f (a) 6= 0 лишь для конечного числа элементов
Pтакую функцию
a ∈ A. Тогда можно определить a∈A f (a) = a∈A\f −1 (0) f (a), то есть просто как конечную сумму всех ненуле‐
вых значений . Точно
Q так же, еслиQf : A → R такова, что f (a) 6= 1 только для конечного числа элементов a ∈ A, то
можно положить a∈A f (a) = a∈A\f −1 (1) f (a).
Для канонического разложения на простые это значит следующее. Обозначим P множество всех простых чисел.
Тогда для n ∈ N и p ∈ P существует такое однозначно определенное dp ∈ Z>0 , что pdp | n, но pdp +1 - n. Функция
P → N, переводящая
Q p в pdp , принимает отличное от 1 значение лишь в конечном числе точек, так что можно
записать n = p∈P pdp .
Следствие 2.7.4. Если a = pd11 ·. . .·pdkk и b = pe11 ·. . .·pekk — разложения на простые, di , ei ∈ Z>0
.
и pi 6= pj при i 6= j, то a .. b тогда и только тогда, когда di > ei для всех i.
. .
Доказательство. Если a .. b, то a .. pei i для каждого i. Но так как pj ⊥ pi для j 6= i, то pj j ⊥ pei i
d
.
и, как следствие, pdi i .. pei i , что возможно только при di > ei .

Обратно, если di > ei для всех i, то a = b · pd11 −e1 · . . . · pkdk −ek — здесь второй множитель
является целым числом.
30
Вообще говоря, каноническое разложение можно распространить и на (ненулевые) рациональные числа. Для
начала определим каноническое разложение целого числа m как произведение знака m на каноническое разложе‐
ние |m|. Затем, представляя рациональное число x в виде несократимой дроби x = m/n, где m, n ∈ Z, n > 0 и
m ⊥ n, мы видим, что каждое простое может входить в каноническое разложение лишь одного из чисел m, n (или
не входит ни в одно), так что если m = ±pd11 · . . . · pkk , а n = q1e1 · . . . · qses , то m/n = ±pd11 · . . . · pkk · q1−e1 · . . . · qs−es .
d d
То есть теперь в каноническом разложении допускаются также отрицательные степени.
Следствие 2.7.5. Если a = pd11 · . . . · pdkk и все pi различны, то количество натуральных дели‐
телей a равно (d1 + 1) · . . . · (dk + 1).
Доказательство. Выбрать делитель a это то же самое, что выбрать степени ei , с которыми pi
входит в каноническое разложение этого делителя. При этом 0 6 ei 6 d, то есть для каждого
простого pi имеется di +1 различных вариантов, а так как выборы производятся независимо,
всего способов выбрать все ei имеется (d1 + 1) · . . . · (dk + 1).
Следствие 2.7.6. Если a = pd11 · . . . · pdkk и b = pe11 · . . . · pekk , di , ei ∈ Z>0 и pi 6= pj при i 6= j, то
min(d ,e ) min(d ,e )
gcd(a, b) = p1 1 1 · . . . · pk k k
Доказательство. Указанная величина является общим делителем a и b, так как min(di , ei ) 6
di , ei . У любого другого общего делителя показатели степеней будут не больше этого, так что
это и в самом деле НОД.
2.8 Сравнения и кольца классов вычетов

Определение 2.8.1. Пусть m ∈ N. Будем говорить, что целые числа a и b сравнимы по модулю
.
m, если (a − b) .. m (обозначается a ≡ b (mod m) или a ≡m b).
Эквивалентно можно сказать, что a ≡m b тогда и только тогда, когда a и b дают одинаковые
остатки при делении на m.
Отметим некоторые свой ства сравнений .
1. Отношение ≡m является отношением эквивалентности;
2. Отношение ≡m является отношением конгруэнтности относительно + и ·;
3. Каждое целое число сравнимо по модулю m ровно с одним из чисел 0, 1, . . . , m − 1;
4. Если ac ≡ bc (mod m) и c ⊥ m, то a ≡ b (mod m).
. .
1. Рефлексивность: 0 = a − a .. m, так что a ≡m a. Симметричность: если a − b .. m, то
..
b − a = −(a − b) . m. Транзитивность: если a = b + km и b = c + lm, то a = c + (k + l)m.
2. Было доказано ранее в конце раздела 2.1.
3. Теорема 2.4.1 о делении с остатком дает существование такого сравнимого с a числа
(а именно, остаток при делении a на m). Покажем, что среди 0, 1, . . . , m − 1 нет других
.
сравнимых с a чисел. Если x, y — два таких числа, то x ≡m y и x − y .. m. Если x − y 6= 0,
то |x − y| > m и они не могут одновременно лежать в указанном интервале.
.
4. Если (a − b)c = ac − bc .. m и c ⊥ m, то, поскольку левая часть должна делиться на m,
..
получаем a − b . m (пункт 3 Предложения 2.5.3).
31
Определение 2.8.3. Фактор‐множество Z/≡m с операциями, индуцированными на нем сло‐
жением и умножением целых чисел, называется кольцом классов вычетом по модулю m и
обозначается Z/mZ.
Элементами Z/mZ являются классы вычетов по модулю m, то есть множества вида [a] =
{b ∈ Z | b ≡ a (mod m)} (классы эквивалентности относительно ≡m ). Эти классы можно
описать и иначе: [a] = a + mZ = {a + km | k ∈ Z}. Любой элемент b ∈ [a] называется
представителем класса [a] (и тогда [b] = [a]).
Напомним, операции на классах устроены следующим образом:
[a] + [b] = [a + b], [a] · [b] = [ab].
Операции определены корректно (то есть зависят от классов [a] и [b], а не от конкретного
выбора представителей a и b), так как ≡m является отношением конгруэнтности.
В дей ствительности можно выписать полный список классов, образующих кольцо Z/mZ,
а именно,
Z/mZ = {[a] | a = 0, . . . , m − 1}.
Другой способ смотреть на кольцо классов вычетов — для a = 0, . . . , m − 1 определить
объекты a и задать на множестве {0, 1, . . . , m − 1} бинарные операции следующим образом:
a + b = r, где r — остаток при делении a + b на m,

a · b = s, где s — остаток при делении ab на m.
Более общо, можно вместо набора чисел 0, 1, . . . , m − 1 рассматривать и другие.

Определение 2.8.4. Полной системой вычетов по модулю m называется множество целых
чисел X, пересекающее каждый класс вычетов ровно по одному элементу, то есть для любо‐
го a ∈ Z выполнено |X ∩ (a + mZ)| = 1. Иными словами, для любого целого числа най дется
ровно один элемент множества X, сравнимый с ним.
1. {0, 1, . . . , m − 1} является полной системой вычетов по пункту 3 Предложения 2.8.2;
2. {1, 2, . . . , m};
3. Если m = 2k + 1, то {−k, −k + 1, . . . , −1, 0, 1, . . . , k − 1, k} — полная система вычетов,
4. Если m = 2k, то {−k, . . . , k − 1}.
Кольцо Z/mZ, вообще говоря, не является областью целостности для произвольного m. А

именно, если m = kn, то [k] · [n] = [kn] = [m] = [0], то есть для непростых m в Z/mZ имеются
делители 0.
Предложение 2.8.6. Линей ное сравнение ax ≡ b (mod m) разрешимо тогда и только тогда,
.
когда b .. gcd(a, m).
.
Доказательство. Если x — решение этого сравнения, то ax − b .. m, то есть существует та‐
кой k ∈ Z, что ax − b = mk. Переписывая в виде ax − mk = b, видим, что вопрос о суще‐
ствовании таких x и k является вопросом о разрешимости линей ного диофантова уравне‐
ния от двух переменных. По Предложению 2.6.1 оно разрешимо тогда и только тогда, когда
.
b .. gcd(a, −m) = gcd(a, m).
32
Следствие 2.8.7. Сравнение ax ≡ 1 (mod m) разрешимо тогда и только тогда, когда a ⊥ m.
Определение 2.8.8. Решение сравнения ax ≡ 1 (mod m) будем называть модулярным об‐
ратным для a. Модулярный обратный всегда можно выбрать в промежутке от 0 до m − 1.
Следствие 2.8.9. (Z/mZ)∗ = {[a] | a ⊥ m}.
Доказательство. Элемент [a] ∈ Z/mZ обратим, если существует такой [b] ∈ Z/mZ, что [a] ·
[b] = [1], то есть ab ≡ 1 (mod m), что выполнимо только при a ⊥ m.
2.9 Двоичная арифметика конечной разрядности

В компьютерных системах целые числа задаются в двоичной форме. Для начала рассмотрим
представление неотрицательных чисел, так называемую беззнаковую форму.
А именно, последовательности (bn−1 , bn−2 , . . . , b1 , b0 ) битовых значений (0 и 1) длины n
соответствует целое число b0 + 2b1 + . . . + 2n−1 bn−1 , и всякое целое число в интервале от 0
до 2n−1 представляется в таком виде (единственным образом).
Для чисел, записанных в двоичной форме (еще говорят, в позиционной системе счисления
по основанию 2), имеются стандартные способы их складывать и умножать «в столбик».
Однако если мы ограничимся теми целыми числами, которые можно записать при помощи
n двоичных бит, то при сложении и умножении «перенос разряда» может выводить за преде‐
лы допустимых разрядов. В этом случае получающиеся старшие биты просто выбрасывают‐
ся. Такое на первый взгляд варварское отношение к результатам вычислений на самом деле
означает просто, что все вычисления проделываются по модулю 2n , то есть в дей ствительно‐
сти двоичные числа с разрядностью n следует воспринимать не как неотрицательные целые
числа, а как элементы кольца Z/2n Z, записываемые посредством полной системы вычетов
0, 1, . . . , 2n − 1.
Отметим, что некоторые операции в двой чной записи проделываются особенно легко:
1. Умножение на 2 выполняется посредством сдвига влево, то есть 2·(bn−1 , bn−2 , . . . , b1 , b0 ) =
(bn−2 , bn−3 , . . . , b0 , 0);
2. Деление на 2 (вычисление неполного частного, если число не делится нацело) осуществ‐
ляется сдвигом вправо: (0, bn−1 , . . . , b1 );
3. Вычисление остатка при делении на 2k реализуется маской , то есть отбрасыванием
(обнулением) всех старших бит: (0, . . . , 0, bk−1 , . . . , b0 );
4. Нахождение обратного по сложению в Z/2n Z производится инверсией всех бит и при‐
бавлением единицы: (1 − bn−1 , . . . , 1 − b0 ) + (0, . . . , 0, 1).
Деление с остатком на число m, не являющееся степенью 2, является трудоемким, поэтому
желательно иметь метод, ускоряющий наивный подход. Особенно это актуально для вычис‐
ления произведения по модулю m. Одним из способов решить последнюю задачу является
редукция по Монтгомери.
Алгоритм 2.9.1 (Редукция по Монтгомери).
Будем обозначать посредством (x mod y) остаток при делении x на y.
Пусть даны целые числа 0 6 a, b < m − 1, требуется вычислить (ab mod m).
1. Выберем какое‐нибудь число r, большее m и взаимно простое с ним. В наилучшем слу‐
чае можно выбрать в качестве r степень двой ки (если m нечетно). Тогда можно най ти
r′ — модулярный обратный для r по модулю m, так что rr′ ≡ 1 (mod m).
33
2. Положим k = (rr′ − 1)/m (делится нацело), так что 1 + km = rr′ .
3. Переводим числа a и b в форму Монтгомери: e a = (ar mod m), eb = (br mod m). Будем
искать c ≡m ab в форме Монтгомери: e
c = (cr mod m) = (abr mod m).
4. Вычисляем произведение целых чисел e a и eb: e

a · eb ≡m abr2 ≡m e
c · r, причем 0 6 e a · eb < m2 .

c = R e
5. Редукция: e a · eb , где функция редукции R : {0, . . . , m2 − 1} → {0, . . . , m − 1}

эффективно вычисляет R(x) = (xr′ mod m) — в таком случае R e a · eb = (abr mod m).
Функция R дей ствует следующим образом:
a) Положим s = (xk mod r). При r степени 2 это вычисление производится быстро,
особенно если сначала заменить x на (x mod r), что не меняет значения s. Заме‐
тим, что 0 6 s < r.
b) Положим t = x + sm, так что t ≡m x. Заметим, что раз 0 6 x < m2 < rm и
.
0 6 sm < rm, выполнено 0 6 t < 2rm. Кроме того, t .. r. Дей ствительно,
x + sm ≡r x + xkm ≡r x(1 + km) ≡r x · rr′ ≡r 0.
c) Положим u = t/r (делится нацело). u ≡m urr′ ≡m tr′ , откуда u ≡m xr′ .

d) Так как 0 6 t < 2rm, имеем 0 6 u < 2m. Если u < m, то положим R(x) = u, иначе
R(x) = u − m.
cr′ mod m).

6. Вычисляем искомое число c по его форме Монтгомери: c = (e
На первый взгляд кажется, что никакого выигрыша нет — вместо одного вычисления остат‐
ка (ab mod m) мы проводим три: (ar mod m), (br mod m), (ecr′ mod m), не считая большего
количества умножений и нахождения модулярного обратного. Эффективность редукции по
Монтгомери проявляется при вычислении степеней — перевод в форму Монтгомери и об‐
ратно требуется только в начале и конце вычисления, в то время как шаги 4 и 5, которые и
реализуют умножение чисел в форме Монтгомери, работают значительно быстрее (все де‐
ления — на степени 2).
2.10 Функция Эйлера, теорема Эйлера и малая теорема Ферма

Для модулярного возведения в большую степень полезным оказывается следующее заме‐
чание. Пусть имеется элемент x ∈ Z/mZ, и рассматриваются его степени x, x2 , x3 , . . . — по‐
скольку все они являются элементами конечного множества Z/mZ, то в этом списке в какой ‐
то момент возникнут повторы, скажем, xk = xn для некоторого n < k. Если x обратим, то
тогда xn−k = 1. Это означает, что для a ⊥ m существует такое натуральное число k, что
ak ≡ 1 (mod m). В таком случае для числа n = qk + r выполнено an ≡ ar (mod m), что
позволяет свести вычисление большой степени к вычислению малой степени. Укажем один
способ находить такое число k.
Определение 2.10.1. Функцией Эйлера называется функция φ : N → N, дей ствующая по пра‐
вилу φ(n) = |(Z/nZ)∗ |, то есть φ(n) это количество натуральных чисел от 1 до n, взаимно
простых с n.
Теорема 2.10.2 (Теорема Эй лера). Если a ⊥ m, то aφ(m) ≡ 1 (mod m).
34
Доказательство. Пусть x1 , . . . , xk — полный список всех обратимых элементов Z/mZ. То‐
гда, поскольку [a] также обратим, все произведения [a]x1 , . . . , [a]xk обратимы. При этом все
они различны, так как отображение x 7→ [a]x обратимо (обратное отображение реализуется
как домножение на элемент, обратный к [a]). Значит, [a]x1 , . . . , [a]xk — снова полный список
обратимых элементов, возможно, в другом порядке. Рассмотрим произведение всех обрати‐
мых элементов:
x1 · . . . · xk = [a]x1 · . . . · [a]xk = [a]k · x1 · . . . · xn .
Поскольку x1 · . . . · xk снова обратимо, можно домножить на обратный и получить [a]k = 1,
что и требовалось.
Значение функции Эй лера φ(m) не всегда является наименьшим натуральным числом k, при котором ak ≡m 1
для всех a ⊥ m. Наименьшим таким k является значение функции Кармай кла, вычисляемое следующим образом:
(
φ pd , если p > 3 или d 6 2,
λ pd = 1 λ pd11 · . . . · pds s = lcm λ pd11 , . . . , λ pds s .
2
φ pd если p = 2 и d > 3,
Замечание 2.10.3. Если p простое, то φ(pk ) = pk−1 (p − 1). В частности, φ(p) = p − 1.

Доказательство. Число взаимно просто с pk только когда оно не делится на p. Всего чисел
от 1 до pk имеется pk , из них pk−1 делящихся на p, так что φ(pk ) = pk − pk−1 = pk−1 (p − 1).
Следствие 2.10.4 (Малая теорема Ферма). Если p простое и p - a, то ap−1 ≡ 1 (mod p).
Существуют такие непростые числа n, что an−1 ≡ 1 (mod n) для всех a ⊥ n. Такие числа называются числами
Кармай кла, их бесконечно много, каждое имеет по край ней мере 3 простых делителя. Натуральное число n явля‐
ется числом Кармай кла тогда и только тогда, когда оно свободно от квадратов и для каждого простого делителя p
.
выполнено n − 1 .. p − 1. Наименьшим числом Кармай кла является 561 = 3 · 11 · 17.
Следствие 2.10.5. Если p простое и a ∈ Z, то ap ≡ a (mod p).

.
Доказательство. Если a .. p, то обе части сравнимы с 0 по модулю p, а иначе результат полу‐
чается из утверждения малой теоремы Ферма домножением на a.
2.11 Китайская теорема об остатках

Редукция по Монтгомери (для двоичных чисел) работает быстро, если модуль нечетен. Для
четного m можно выделить максимальную степень 2, то есть записать m = 2k · m′ , где m′
нечетное. Вычислив остатки при делении на m′ и на 2k , требуется как‐то восстановить оста‐
ток по модулю m. В дей ствительности, можно задуматься и о более общем вопросе: как, зная
остатки при делении на набор попарно взаимно простых модулей m1 , . . . , mn , восстановить
остаток при делении на m1 · . . . · mn — и когда это возможно?
Теорема 2.11.1 (Китай ская теорема об остатках). Пусть m1 , . . . , mn — попарно взаимно про‐
стые натуральные числа (то есть mi ⊥ mj при i 6= j), а r1 , . . . , rn — какие‐то целые числа.
Тогда система линей ных сравнений


 x ≡ r1 (mod m1 ),

..
 .

x ≡ r
n (mod mn )
имеет целочисленное решение, единственное по модулю m1 · . . . · mn .
35
Доказательство. Рассмотрим следующий частный случай : r2 = . . . = rn = 0, а r1 произволь‐
ный . Тогда решение x системы сравнений должно делиться нацело на m2 , . . . , mn и, посколь‐
ку модули попарно взаимно просты, на их произведение. С другой стороны, m2 ·. . .·mn ⊥ m1 ,
так что сравнение m2 · . . . · mn · y ≡ r1 (mod m1 ) разрешимо — пусть y1 это его решение. По‐
ложим x1 = y1 · m2 · . . . · mn , тогда x1 ≡ r1 (mod m1 ) и x1 ≡ 0 (mod mi ) при i 6= 1. Аналогично
можно най ти решения xi для систем сравнений с rj = 0 при j 6= i.
Положим x = x1 + . . . + xn , тогда x ≡ xi ≡ ri (mod mi ). Это доказывает существование
решения.
.
Пусть теперь x, y — два возможных решения. Тогда x − y .. mi , и в силу взаимной простоты
..
модулей x − y . m1 · . . . · mn , что и доказывает единственность.
Пусть m1 , . . . , mn ∈ N. Рассмотрим следующее коммутативное кольцо:
Z/m1 Z × . . . × Z/mn Z,
в котором операции дей ствуют покомпонентно, то есть
(a1 , . . . , an ) + (b1 , . . . , bn ) = (a1 + b1 , . . . , an + bn )
и аналогично для умножения. Тогда есть естественно определенное отображение
θ : Z/m1 . . . mn Z → Z/m1 Z × . . . × Z/mn Z,
дей ствующее по следующему правилу: класс [a] по модулю m1 · . . . · mn переводится в кортеж

классов вычетов числа a по модулям m1 , . . . , mn .
Следствие 2.11.2. Если числа mi попарно взаимно просты, то θ является биекцией .

Доказательство. Отображение θ сюръективно, так как у элемента ([r1 ], . . . , [rn ]) есть прооб‐
раз, а именно класс вычетов x, где x — решение системы сравнений x ≡ ri (mod mi ). Инъ‐
ективность следует из единственности такого x.
В дей ствительности китай скую теорему об остатках можно доказать даже более коротким образом. А именно,
аргумент о единственности решения системы сравнений показывает, что отображение θ инъективно. Но размеры
области определения и области прибытия совпадают, так что по принципу Дирихле θ биективна.
Китай ская теорема об остатках позволяет, кроме прочего, вычислять значение функции
Эй лера на произвольных натуральных числах.
Лемма 2.11.3. Пусть m1 , . . . , mn попарно взаимно просты. Тогда x ∈ Z/m1 . . . mn Z обратим

в том и только том случае, когда θ(x) обратим в Z/m1 Z × . . . × Z/mn Z.
Доказательство. Достаточно доказать для случая n = 2. Если [a] ∈ Z/mkZ обратим, обо‐
значим [b] = [a]−1 . Тогда ab ≡ 1 (mod mk), откуда ab ≡ 1 (mod m) и ab ≡ 1 (mod k).
Обратно, пусть b — представитель класса, обратного к классу a в Z/mZ, а c — в Z/kZ. По
сюръективности θ най дется такой [d] ∈ Z/mkZ, что θ(d) = ([b], [c]). Это значит, что d ≡ b
(mod m) и d ≡ c (mod k), а тогда ad ≡ 1 (mod m) и ad ≡ 1 (mod k). По китай ской теореме об
остатках существует единственный (по модулю mk) x, дающий при делении на m и k остаток
1. Числа ad и 1 оба удовлетворяют этим сравнениям, так что ad ≡ 1 (mod mk), то есть [a]
обратим в Z/mkZ.
Предложение 2.11.4. Функция Эй лера мультипликативна в следующем смысле: если m ⊥
n, то φ(mn) = φ(m)φ(n)
36
|(Z/mnZ)∗ | = |(Z/mZ × Z/nZ)∗ | = |(Z/mZ)∗ × (Z/nZ)∗ | = |(Z/mZ)∗ | · |(Z/nZ)∗ | .
Следствие 2.11.5. Если n = pd11 · . . . · pdkk — каноническое разложение на простые, то
φ(n) = pd11 −1 (p1 − 1) · . . . · pdkk −1 (pk − 1).
2.12 Криптографические протоколы

Пусть Алиса (А) и Боб (Б) — два участника коммуникации, и требуется наладить защищен‐
ный канал связи между ними, то есть договориться о способе передавать сообщения таким
образом, чтобы никто, кроме самих участников, не мог получить истинное содержание. Со‐
общения защищаются шифрованием при помощи ключа, без знания которого невозможно
(или по край ней мере очень сложно) восстановить исходное сообщение. Теория чисел позво‐
ляет создать такие схемы шифрования, что участникам не требуется заранее согласовывать
ключ шифрования.
Один из способов это реализовать — согласовать общий секретный ключ, обмениваясь
незашифрованными сообщениями по открытому каналу (в предположении, что сообщения
доходят правильному адресату и не подменяются посредником). Примером такой схемы яв‐
ляется протокол Диффи—Хеллмана—Меркла. Он основан на сложности решения задачи дис‐
кретного логарифмирования.
Определение 2.12.1. Пусть p — простое число, а g — первообразный корень по модулю p,
то есть такое g = 2, . . . , p − 1, что g k 6≡ 1 (mod p) для 1 6 k < p − 1. Тогда для любого
a = 1, . . . , p − 1 существует единственное такое k = 1, . . . , p − 1, что g k ≡ a (mod p). Такое k
называется дискретным логарифмом a по основанию g и модулю p.
Алгоритм 2.12.2 (Протокол Диффи—Хеллмана—Меркла).
1. Участники договариваются о простом числе p и первообразном корне g. Например, (А)
генерирует их и посылает (Б) по открытому каналу — эта пара чисел является обще‐
доступной информацией .
2. Участники генерируют свои закрытые ключи — большие случай ные числа a и b. За‐
тем (A) вычисляет число A = (g a mod p), а (Б) вычисляет B = (g b mod p). Участники
обмениваются вычисленными значениями.
3. (А) вычисляет (B a mod p), а (Б) вычисляет (Ab mod p) — итого оба участника получают
одно и то же число K = (g ab mod p), которое можно использовать в качестве общего
секретного ключа.
Даже если злоумышленник перехватил числа A и B, вычисление K для него требует нахож‐
дения дискретного логарифма A или B по основанию g, что является вычислительно труд‐
ной задачей .
Другая вычислительно сложная задача — задача факторизации, то есть нахождения раз‐
ложения натурального числа на простые множители. На этом основан протокол RSA.
Алгоритм 2.12.3 (Протокол Ривеста—Шамира—Адлемана).
1. (А) создает ключи для шифровки и дешифровки:
a) Генерируются два различных простых числа p и q.
37
b) Вычисляются n = pq и φ(n) = (p − 1)(q − 1).
c) Выбирается целое число e = 2, . . . , φ(n), взаимно простое с φ(n) — оно называется
открытой экспонентой.
d) Вычисляется d — обратный к e по модулю φ(n), так что ed ≡ 1 (mod φ(n)). Это
число называется секретной экспонентой.
e) Пара (e, n) отправляется (Б) и служит открытым ключом, а пара (d, n) — закры‐
тым ключом.
2. (Б) рассматривает исходной сообщение как число m = 0, . . . , n − 1 и шифрует его, ис‐
пользуя полученный от (А) открытый ключ: c = (me mod n). Полученное зашифрован‐
ное сообщение c отправляется (А).
3. (А) использует свой закрытый ключ для дешифровки: (cd mod n) = (med mod n) = m.
Замечание 2.12.4. Дешифрование происходит корректно, то есть для любого m = 0, . . . , n−
1 выполнено med ≡ m (mod n).
Доказательство. Предположим сначала, что m ⊥ p. Так как ed ≡ 1 (mod φ(n)), то ed = 1 +
k(p − 1)(q − 1) для некоторого целого k, а тогда (по малой теореме Ферма)
k(q−1)
med = m1+k(p−1)(q−1) = m · mp−1 ≡p m · 1k(q−1) = m.
.
Если m .. p, то med ≡p 0 ≡p 0. Итого med ≡ m (mod p), и аналогично med ≡ m (mod q). Тогда
по китай ской теореме об остатках med ≡ m (mod n).
38
3 Поля и многочлены
3.1 Поля
Определение 3.1.1. Коммутативное кольцо с единицей F называется полем, если в нем лю‐
бой ненулевой элемент обратим, т.е. F ∗ = F \ {0}, и 1 6= 0.
Последнее требование добавлено, чтобы исключить из рассмотрения так называемое ну‐

левое кольцо R = {0}, поскольку формально в нем есть элемент, ней тральный по умноже‐
нию, и все ненулевые элементы обратимы.
1. Рациональные числа Q.
2. Вещественные числа R.
3. Кольцо классов вычетов Z/pZ по простому модулю p.
√ √
4. Пусть k ∈ N не является квадратом. Тогда Q[ k] = {a + b k | a, b ∈ Q} — поле. В самом
деле, это кольцо, поскольку
√ √ √
(a + b k) + (c + d k) = (a + c) + (b + d) k,
√ √ √
(a + b k) · (c + d k) = (ac + kbd) + (ad + bc k),
√ √ √ √
0 = 0 + 0 k ∈ Q[ k], 1 = 1 + 0 k ∈ Q[ k].
√ √
Чтобы показать, что Q[ k] является полем, най дем обратный к a + b k:
√ √
1 a−b k a−b k
√ = √ √ = 2
a+b k (a + b k)(a − b k) a − kb2
√
Если знаменатель a2 − kb2 ненулевой , то получается элемент Q[ k]. Предположим, что
a2 − kb2 = 0. Ясно, что либо a = b = 0, либо оба числа a, b ненулевые. Во втором случае
k = a2 /b2 , что противоречит предположению о числе k, см. Следствие 2.5.5.
5. В этом разделе мы формально и строго построим еще два важных примера: комплекс‐
ные числа C и рациональные функции F (x).
Замечание 3.1.3. Поле является областью целостности.
Доказательство. По Замечанию 2.3.5 делители нуля не могут быть обратимы, но в поле нет
отличных от 0 необратимых элементов.
Замечание 3.1.4. Кольцо вычетов Z/mZ для составного модуля m не является полем.
3.2 Многочлены одной переменной

Пусть R — коммутативное ассоциативное кольцо с 1. Многочленом над R называется вы‐
ражение вида a0 + a1 x + a2 x2 + . . . + an xn , где все ai ∈ R. Многочлены можно складывать,
«приводя подобные слагаемые», и умножать, «раскрывая скобки». Однако все еще непонят‐
но, какой природы эти объекты. Ясно, что они однозначно задаются набором своих коэффи‐
циентов a0 , a1 , . . . , an , и сей час мы формализуем это соображение.
39
Определение 3.2.1. Бесконечная последовательность (a0 , a1 , a2 , . . . , an , . . .) элементов коль‐
ца R называется финитарной, если начиная с некоторого места все ее элементы равны 0, то
есть существует такое N , что для любого k > N выполнено ak = 0. Иными словами, в этой
последовательности лишь конечное число ненулевых значений . Если рассматривать после‐
довательность ai как функцию
a : Z>0 → R (принимающую значения a(i) = ai ), то это можно
кратко записать в виде a−1 (R \ {0}) < ∞.
Обратите внимание, что требуется именно конечность числа позиций (индексов), в которых принимается
нену‐
левое значение, а не сами ненулевые значения. Такое требование выглядело бы как a(Z>0 ) \ {0} < ∞ (что, разу‐
меется, эквивалентно конечности образа a(Z>0 )).
Определение 3.2.2. Кольцом многочленов R[x] одной переменной x над кольцом R называ‐
ется множество всех финитарных последовательностей со значениями в R с покомпонент‐
ным сложением, то есть
(a0 , a1 , a2 , . . .) + (b0 , b1 , b2 , . . .) = (a0 + b0 , a1 + b1 , a2 + b2 , . . .),
и умножением, задаваемым сверткой, то есть
(a0 , a1 , a2 , . . .) · (b0 , b1 , b2 , . . .) = (a0 b0 , a0 b1 + a1 b0 , a0 b2 + a1 b1 + a2 b0 , . . .)
— в общем случае на k‐й позиции произведения стоит
X
(a · b)k = a0 bk + a1 bk−1 + a2 bk−2 + . . . + ak b0 = i,j>0 ai bj .
i+j=k
Предложение 3.2.3. Определение выше задает коммутативное ассоциативное кольцо с 1.

Доказательство. Проверим сначала, что операции заданы корректно. Пусть a, b ∈ R[x], a =
(a0 , a1 , a2 , . . .), b = (b0 , b1 , b2 , . . .), и обозначим через M и N такие натуральные числа, что
для любого k > M выполнено ak = 0 и для любого k > N выполнено bk = 0. Тогда для
k > max(M, N ) выполнено ak + bk = 0, так что a + b тоже финитарная последовательность.
Аналогично для умножения: пусть k > M + N , тогда если i + j = k, то i > M или j > N
(иначе k = i+j 6 M +N ), так что в выражении для (a·b)k все слагаемые (вида ai bj ) нулевые.
Проверка свой ств сложения тривиальна, так как оно задается покомпонентно (ней траль‐
ным элементом служит 0 = (0, 0, 0, . . .), а −(a0 , a1 , a2 , . . .) = (−a0 , −a1 , −a2 , . . .)).
Проверим ассоциативность умножения:
X X X X
((ab)c)k = (ab)i · cj = ar bs · cj = ar bs cj ,
i+j=k i+j=k r+s=i r+s+j=k
X X X X
(a(bc))k = ai · (bc)j = ai · br cs = ai br cs .
i+j=k i+j=k r+s=j i+r+s=k
Ясно, что несмотря на различные обозначения индексов, выражения в правых частях равны.
Коммутативность умножения тоже проста:
X X
(ab)k = ai bj = bj ai = (ba)k .
i+j=k j+i=k
Дистрибутивность проверяется аналогично:

X X X
((a + b)c)k = (a + b)i · cj = (ai + bi ) · cj = ai cj + bi cj =
i+j=k i+j=k i+j=k
X X
= ai cj + bi cj = (ac)k + (bc)k = (ac + bc)k .
i+j=k i+j=k
40
В качестве единицы выступает 1 = (1, 0, 0, . . .). Дей ствительно, в выражении для (a · 1)k
имеется только одно ненулевое слагаемое ak · 10 = ak .
Обозначение 3.2.4. Мы будем отождествлять элемент r базового кольца R и соответству‐
ющий многочлен r = (r, 0, 0, . . .).
Обозначение 3.2.5. Обозначим x = (0, 1, 0, 0, . . .) ∈ R[x]. Тогда xn = (0, . . . , 0, 1, 0, . . .). Заме‐
| {z }
n
тим, что rxn = (0, . . . , 0, r, 0, . . .), и тогда
(a0 , a1 , a2 , . . . , an , 0, 0, . . .) = (a0 , 0, . . .) + (0, a1 , 0, . . .) + . . . + (0, . . . , 0, an , 0, . . .)

= a0 + a1 x + a2 x2 + . . . + an xn .
Такое представление называется канонической записью многочлена.
Определение 3.2.6. Степенью многочлена f = a0 +a1 x+. . .+an xn называется наибольшее

такое d ∈ Z>0 , что ad 6= 0, и −∞, если такого d нет (то есть если f = 0). Обозначение: d =
deg(f ). Таким образом, для r ∈ R \ {0} имеет место deg(r) = 0, и deg(rxn ) = n.
Коэффициент a0 называется свободным членом, а adeg(f ) старшим коэффициентом много‐
члена f = a0 + a1 x + . . . + ad xd .
Заметим, что deg(f +g) 6 max(deg(f ), deg(g)). Из доказательства Предложения 3.2.3 видно
также, что deg(f ·g) 6 deg(f )+deg(g). Легко привести пример, когда это неравенство строгое:
если R = Z/4Z, а f = g = 2x, то deg(f ) = deg(g) = 1, в то время как deg(f g) = deg(0) = −∞.
Предложение 3.2.7. Если R — область целостности, то deg(f g) = deg(f ) + deg(g).
Доказательство. Если a и b — старшие коэффициенты f и g, то коэффициент при xdeg(f )+deg(g)
в произведении f g вычисляется как ab, и он не равен 0, так как a, b 6= 0 и R — область це‐
лостности.
Если же старший коэффициент одного из многочленов най ти невозможно, то есть f = 0
или g = 0, то в обоих частях доказываемого равенства стоит −∞.
Следствие 3.2.8. Если R — область целостности, то R[x] тоже область целостности.
Доказательство. Если хотя бы один из многочленов f, g ∈ R[x] не является константой , то
deg(f g) = deg(f ) + deg(g) > 0, в частности, f g 6= 0. Если же f, g ∈ R, то f g 6= 0 как элементы
области целостности R.
Следствие 3.2.9. Если R — область целостности, то R[x]∗ = R∗ . Иными словами, среди мно‐
гочленов обратимы только обратимые константы.
Доказательство. Пусть f · g = 1. Так как f, g 6= 0, имеем deg(f ), deg(g) > 0. Тогда, так как
0 = deg(f g) = deg(f )+deg(g), обе степени deg(f ) и deg(g) равны 0. Отсюда f, g ∈ R, так что ни
один многочлен f положительной степени не является обратимым и никакая необратимая
константа из R не получает в R[x] обратного элемента.
Замечание 3.2.10. Если R = Z/4Z, то 1 + 2x ∈ R[x]∗ . Дей ствительно, (1 + 2x)(1 + 2x) =
1 + (2 + 2)x + (2 · 2)x2 = 1.
41
3.3 Деление и вычисление значений многочленов
Теорема 3.3.1. (о делении многочленов с остатком) Пусть R — область целостности, а мно‐
гочлены f, g ∈ R[x] таковы, что g 6= 0 и его старший коэффициент обратим. Тогда существу‐
ют единственные многочлены q, r ∈ R[x], для которых f = qg + r и deg(r) < deg(g).
Доказательство. Докажем существование такие q, r индукцией по deg(f ). Если deg(f ) <
deg(g), то можно положить q = 0 и r = f .
Пусть deg(f ) > deg(g). Запишем f и g в их канонической форме:
f = a0 + . . . + am xm , g = b0 + . . . + bn x n , где am , bn 6= 0.
По предположению m > n и bn ∈ R∗ . Тогда рассмотрим многочлен f ′ = f − g · am b−1

n x
m−n
.У
двух слагаемых совпадают степени:
deg(g · am b−1
n x
m−n
) = deg(g) + (m − n) = m = deg(f )
и старшие коэффициенты (оба равны am ), то есть deg(f ′ ) < deg(f ). По индукционному пред‐
положению най дутся такие q ′ , r′ , что f ′ = q ′ g + r и deg(r′ ) < deg(g). Тогда

f = f ′ + g · am b−1 n x
m−n
= q ′ + am b−1
n x
m−n
· g + r′
— искомое представление.
Чтобы доказать единственность, предположим, что f = q1 g + r1 = q2 g + rs — два таких
представления. Тогда r1 − r2 = (q2 − q1 )g. Степень многочлена в левой части меньше deg(g),
а если q2 6= q1 , то степень многочлена в правой части > deg(g). Отсюда q2 = q1 и r1 = r2 .
Замечание 3.3.2. Если R — поле, то старший коэффициент всегда обратим, так что в таком
случае делить с остатком можно на любой ненулевой многочлен.
Кольцо многочленов обладает дополнительной структурой — возможностью вычислять
значение многочленов.
Определение 3.3.3. Пусть f = a0 + a1 x + . . . + an xn ∈ R[x] и c ∈ R. Тогда элемент a0 + a1 c +
. . . + an cn ∈ R называется значением многочлена f в точке c и обозначается f (c).
Тем самым с каждым многочленом f ∈ R[x] связана полиномиальная функция fe: R → R,

дей ствующая по правилу fe(c) = f (c). Отметим сразу, что различным многочленам может
соответствовать одна и та же полиномиальная функция. Например, если R = Z/pZ, то мно‐
гочлену xp −x ∈ R[x] соответствует по малой теореме Ферма функция c 7→ 0, и та же функция
получается из нулевого многочлена. Далее мы выясним, в каких случаях такого не происхо‐
дит.
Отметим некоторые свой ства значений многочленов.
Предложение 3.3.4. Пусть f, g ∈ R[x] и c ∈ R. Тогда
1. (f + g)(c) = f (c) + g(c);
2. (f g)(c) = f (c) · g(c);
3. если f = r ∈ R, то f (c) = r.
Доказательство. Пусть f = a0 + a1 x + . . . + an xn и g = b0 + b1 x + . . . + bn xn — запись с
одинаковым числом слагаемых (в частности, an и bn могут быть нулевыми).
42
Pn Pn Pn Pn
1. (f + g)(c) = i=0 (ai + bi )ci =ai ci + bi ci = i=0 ai ci + i=0 bi ci = f (c) + g(c).
i=0
P2n P
2. deg(f g) 6 deg(f ) + deg(g) 6 2n, так что f g = k=0 i+j=k ai bj xk и
X
n X
n X
n X
2n X
f (c) · g(c) = ai c ·
j j
bj c = ai bj ci+j = ai bj ck = (f g)(c).
i=0 j=0 i,j=0 k=0 i,j>0
i+j=k
3. Если f = r + 0 · x + . . ., то f (c) = r + 0 · c + . . . = r.
Определение 3.3.5. Если f (c) = 0, то говорят, что c является корнем многочлена f .
Предложение 3.3.6 (Малая теорема Безу). Остаток при делении многочлена f на x−c равен
.
f (c). В частности, c ∈ R является корнем многочлена тогда и только тогда, когда f .. (x − c).
Доказательство. Поделим f на x − c с остатком (что возможно, поскольку старший коэф‐
фициент x − c обратим): f = q · (x − c) + r, причем deg(r) < deg(x − c) = 1, так что r ∈ R.
Вычислим значение в точке c для многочленов в левой и правой частях:
f (c) = (q · (x − c) + r)(c) = q(c) · (c − c) + r(c) = q(c) · 0 + r = r.

. .
Если остаток f (c) = 0, то остаток нулевой и f .. (x−c). Если же f .. (x−c), то r = 0 и f (c) = 0.
Следствие 3.3.7. Пусть R — область целостности, f ∈ R[x] и f 6= 0. Тогда
f = (x − c1 ) · . . . · (x − ck ) · g,
где c1 , . . . , ck — все корни f (не обязательно различные), а g ∈ R[x] не имеет корней .

Доказательство. Индукция по deg(f ). База: deg(f ) = 0, то есть f ∈ R \ {0}, и тогда разложе‐
ние состоит из одного множителя g = f .
Пусть теперь deg(f ) > 0. Если у f нет корней , то снова g = f . Если у f имеется корень
.
c, то f .. (x − c), то есть f = (x − c)h для некоторого h ∈ R[x], который имеет меньшую
степень и к которому применимо индукционное предположение, откуда получается искомое
разложение для f .
Тем самым имеется разложение f = (x − c1 ) · . . . · (x − ck ) · g для каких‐то ci ∈ R и какого‐то
g ∈ R[x], не имеющего корней . Ясно, что f (ci ) = 0. Покажем, что у f нет других корней . Если
c — корень f , то 0 = f (c) = (c − c1 ) · . . . · (c − ck ) · g(c). Так как R — область целостности, один
из множителей равен 0, причем это не g(c), так что c = ci для какого‐то i.
Замечание 3.3.8. Условие целостности существенное. Например, если R = Z/4Z, то (x −
0)2 = (x − 2)2 или даже (x − 1) · 2 = (x − 3) · 2, так что существуют различные разложения,
включающие не все корни. С другой стороны, x · (x2 + 2x + 2) = (x − 2) · (x2 + 2), так что
множитель g тоже определен неоднозначно.
Следствие 3.3.9. Если R — область целостности, то количество корней ненулевого много‐
члена не превосходит его степени.
Доказательство. Пусть f = (x − c1 ) · . . . · (x − ck ) · g, где g не имеет корней . Тогда количество
корней не превосходит k, в то время как deg(f ) = k · deg(g) > k.
Замечание 3.3.10. Здесь условие целостности тоже важно — все для того же кольца R =
Z/4Z у многочлена 2x2 + 2x степени 2 корнями являются все 4 элемента R.
43
Определение 3.3.11. Многочлены f, g ∈ R[x] называются функционально равными, если
равны соответствующие полиномиальные функции fe и ge. Иными словами, если для любого
c ∈ R выполнено f (c) = g(c). Обычное равенство многочленов (как последовательностей
коэффициентов) иногда, чтобы подчеркнуть разницу с функциональным равенство, назы‐
вают формальным равенством.
Замечание 3.3.12. Выше мы уже приводили пример двух формально различных, но функ‐
ционально равных многочленов: f = xp − x и g = 0 над полем Z/pZ, для которых fe = ge = 0.
Ясно, что из формального равенства многочленов следует функциональное. Выясним, ко‐
гда имеет место обратная импликация.
Предложение 3.3.13. Пусть R — область целостности, f, g ∈ R[x]. Если количество элемен‐
тов R больше, чем deg(f ) и deg(g), то функциональное равенство fe = ge влечет формальное
равенство f = g. В частности, для бесконечного поля функциональное равенство влечет
формальное для любых многочленов.
Доказательство. Рассмотрим многочлен h = f − g. Для любого c ∈ R выполнено h(c) =
f (c) − g(c) = 0. Если h 6= 0, то число его корней не превосходит его степени, но deg(h) 6
max(deg(f ), deg(g)) < |R|, противоречие. Значит, h = 0 и f = g.
3.4 Алгоритмические аспекты деления многочленов

Зай мемся теперь вычислительной стороной деления многочленов с остатком. Нам уже из‐
вестно, что любой многочлен делится с остатком на x − c, причем остаток равен f (c). Вы‐
числение неполного частного и остатка можно в этом случае реализовать в виде следующей
процедуры, известной как схема Горнера или правило Руффини.
Алгоритм 3.4.1 (Схема Горнера).
Пусть f = a0 + a1 x + . . . + an xn , тогда f = (x − c) · q + r. Будем искать q в виде q0 + q1 x +
. . . + qn−1 xn−1 (поскольку известна его степень). Раскроем в правой части скобки:
(x − c) · (q0 + q1 x + . . . + qn−1 xn−1 ) + r = qn−1 xn + (qn−2 − cqn−1 )xn−1 + . . . + (q0 − cq1 )x − cq0 + r.
Приравнивая коэффициенты при xk к ak , получаем набор равенств
qn−1 = an ,
qn−2 = an−1 + cqn−1 ,
..
.
qn−i−1 = an−i + cqn−i ,
..
.
q0 = a1 + cq1 ,
r = a0 + cq0 .
Видно, что для вычисления qk достаточно знать qk+1 и ak+1 (а для r требуются q0 и a0 ), так
что коэффициенты неполного частного qn−1 , . . . , q1 , q0 и остаток r вычисляются последова‐
тельно.
44
Замечание 3.4.2. Это вычисление остатка r = f (c) можно трактовать как нахождение зна‐
чения с помощью представления многочлена f в виде

f = a0 + x · a1 + x · a2 + x · . . . + x · (an−1 + xan ) . . .
и последующего вычисления при x = c от внутренних скобок ко внешним.

Для целей вычислений от руки схему Горнера можно реализовать в виде заполнения сле‐
дующей таблицы в соответствии с описанными ниже правилами.
f an an−1 ... a1 a0
c an
Вторая строка заполняется слева направо, на первую незаполненную позицию i (столбцы

нумеруются от n до 0) ставится c · v + ai , где v — значение последней заполненной ячей ки.
Тогда в столбце с номером i оказывается qi−1 , а в столбце 0 в итоге получается f (c).
Схема Горнера допускает обобщение, позволяющее эффективно проводить деление на мно‐
гочлен произвольной степени.
Алгоритм 3.4.3 (Синтетическое деление).
Пусть f = a0 + a1 x + . . . + an xn и g = b0 + b1 x + . . . + bm xm . Предполагается, что n > m и что
старший коэффициент bm обратим. Тогда существуют такие многочлены q, r, что f = gq + r,
причем deg(q) 6 n − m, а deg(r) 6 m − 1. Будем искать q в виде q0 + q1 x + . . . + qn−m xn−m , а
r в виде r0 + r1 x + . . . + rm−1 xm−1 .
Вычисляя напрямую коэффициенты gq + r и приравнивая их к соответствующим коэффи‐
циентам f , получаем, что
X
an−k = bm−i qn−m−j + rn−k ,
i+j=k
где rn−k при n − k > m полагается равным 0. Отсюда видно, что при k 6 n − m
X
qn−m−k · bm = an−k − bm−i qn−m−j ,
i+j=k
j<k
то есть коэффициенты qn−m−k можно вычислить, если известны коэффициенты q при сте‐
пенях выше n − m − k.
Затем, когда все коэффициенты неполного частного q най дены, легко вычислить коэффи‐
циенты остатка r.
Вычисление коэффициентов qn−m , . . . , q0 , rm−1 , . . . , r0 производится единообразно, как и
в схеме Горнера. В целом всю процедуру можно реализовать следующим образом:
1. Инициализируем переменные tn = an , . . . , t0 = a0 .
2. Для каждого индекса k = n − m, . . . , 0 проделаем следующее:
a) Нормируем tk , то есть записываем tk ← tk /bm .
b) Для каждого индекса i = 1, . . . , m добавляем к tk−i величину −tk · bm−i .
3. Возвращаем неполное частное qj = tj+m и остаток rj = tj (первые n−m+1 и последние
m элементов последовательности tn , . . . , t0 соответственно).
45
Для вычислений от руки синтетическое деление также можно реализовать в виде запол‐
нения таблицы. Для простоты будем предполагать, что старший коэффициент bm = 1.
an an−1 an−2 ... an−m ... a0

−b0 −an b0
. .
.. ..
−bm−2 −an bm−2
−bm−1 −an bm−1
an
Таблица заполняется по диагоналям от левого нижнего угла к правому верхнему. В ячей ‐

ки на диагонали ставится произведение элемента этой диагонали на последней строки и
конэффициента g, стоящего в соответствующей строке. В таблице выше уже заполнена пер‐
вая диагональ (начиная со значения an ). После заполнения диагонали в первую незаполнен‐
ную ячей ку последней строки ставится сумма значений во всех ячей ках этого столбца — в
таблице выше это будет an−1 − an bm−1 — после чего заполняется очередная диагональ. Так
продолжается до тех пор, пока не будет заполнена последняя из диагоналей длины m, то
есть пока не появится запись в ячей ке под a0 . В этот момент в первых n − m + 1 ячей ках
последней строки оказываются коэффициенты неполного частного q, начиная со старшего.
Если затем в оставшиеся m ячеек последней строки записать суммы по столбцам, то будут
получены коэффициенты остатка.
Если g = x−c, то схему Горнера можно трактовать как синтетическое деление с опущенной
средней строкой таблицы.
3.5 Комплексные числа

Определение 3.5.1. Будем говорить, что два многочлена f, g сравнимы по модулю много‐
.
члена h, если (f − g) .. h. Если допустимо деление на h с остатком, то можно сказать, что два
многочлена сравнимы по модулю h, если их остатки при делении на h совпадают. Обозначе‐
ние: f ≡ g (mod h) или f ≡h g.
Замечание 3.5.2. Бинарное отношение ≡h является отношением эквивалентности и кон‐
груэнтности относительно сложения и умножения многочленов.
Доказательство. Так же, как и для отношения ≡m на множестве целых чисел.
Определение 3.5.3. Положим h = x2 + 1 ∈ R[x] и рассмотрим отношение конгруэнтности
≡h на R[x]. Фактор‐множество R[x]/≡h вместе с индуцированным операциями сложения и
умножения называется кольцом комплексных чисел.
Лемма 3.5.4. В каждом классе эквивалентности относительно ≡h существует единствен‐
ный представитель степени 6 1.
Доказательство. Рассмотрим многочлен f ∈ R[x] и поделим его с остатком на h: f = h·q +r,
где deg(r) < deg(h) = 2. Но тогда f ≡h r и [f ] = [r], причем остаток определен однозначно.
Выясним теперь, как факторизация по ≡h повлияла на правила сложения и умножения.

Для этого достаточно рассмотреть сложение и умножение на уровне представителей степе‐
ни 6 1. Начнем со сложения:
[a + bx] + [c + dx] = [(a + c) + (b + d)x]
46
Представитель (a + c) + (b + d)x уже степени 6 1. Обратимся теперь к умножению:
[a + bx] · [c + dx] = [(a + bx) · (c + dx)] = [ac + (ad + bc)x + bdx2 ].
Представитель последнего класса имеет, возможно, степень 2, но
(ac + (ad + bc)x + bdx2 ) − bd(x2 + 1) = (ac − bd) + (ad + bc)x,
так что (a + bx) · (c + dx) ≡h (ac − bd) + (ad + bc)x и
[a + bx] · [c + dx] = [(ac − bd) + (ad + bc)x].
Тем самым, сложение и умножение элементов R[x]/≡h можно определить напрямую в тер‐
мимах коэффициентов представителей . А именно, зафиксируем следующие обозначения.
Обозначение 3.5.5. Будем отождествлять вещественное число a ∈ R с классом [a] ∈ R[x]/≡h

соответствующего многочлена. Обозначим также i = [x] — этот класс будем называть мни‐
мой единицей. При таком отождествлении можно сказать, что i2 = [x2 ] = [−1] = −1.
Замечание 3.5.6. Каждый элемент R[x]/≡h можно единственным образом представить в
виде a + bi, где a, b ∈ R. Такое представление называется алгебраической формой комплекс‐
ного числа.
Доказательство. Каждый класс относительно ≡h имеет единственного представителя сте‐
пени 6 1. Но [a + bx] = [a] + [b][x] = a + bi.
Все вместе это позволяет описать кольцо комплексных чисел C как
C = {a + bi | a, b ∈ R}
вместе с операциями
(a + bi) + (c + di) = (a + c) + (b + d)i, (a + bi) · (c + di) = (ac − bd) + (ad + bc)i.
Можно быть бы сразу определить C как множество упорядоченных пар вещественных чисел
с так введенными операциями, но тогда пришлось бы отдельно проверять свой ства, опреде‐
ляющие кольцо, которые в нашем определении унаследованы от кольца многочленов.
Определение 3.5.7. Для комплексного числа z = a + bi вещественные числа a и b называют‐
ся соответственно вещественной и мнимой частями и обозначаются Re(z) = a и Im(z) = b.
Определение 3.5.8. Для комплексного числа z = a + bi определим его комплексно сопря‐

женное как z = a − bi.
Предложение 3.5.9. Пусть z, w ∈ C.
1. z + w = z + w;
2. z · w = z · w;
3. z = z;
4. z = z тогда и только тогда, когда z ∈ R.
47
Доказательство. Первое равенство тривиально, для доказательства второго положим z =
a + bi и w = c + di, тогда
(a + bi)(c + di) = (ac − bd) + (ad + bc)i = (ac − bd) − (ad + bc)i,
a + bi · c + di = (a − bi) · (c − di) = (ac − bd) − (ad + bc)i.
Третье и четвертое утверждения очевидны.

Замечание 3.5.10. Для любого z ∈ C число z · z вещественное и равно Re(z)2 + Im(z)2 (в
частности, неотрицательное).
Доказательство. Если z = a + bi, то zz = (a + bi)(a − bi) = a2 + b2 .

√
Определение 3.5.11. Неотрицательный квадратный корень z · z называется модулем (или
нормой) комплексного числа z и обозначается |z|.
Замечание 3.5.12. |z| = 0 тогда и только тогда, когда z = 0.
Предложение 3.5.13. Пусть z, w ∈ C, тогда |z · w| = |z| · |w|.

√ √ √ √ √
Доказательство. |zw| = zw · zw = z · w · z · w = zz · ww = zz · ww = |z| · |w|.
Предложение 3.5.14. Кольцо комплексных чисел C является полем.
Доказательство. Если z 6= 0, то |z| 6= 0 и обратим как вещественное число, а тогда обратный
1 1 1
к z можно вычислить как 2 z. Дей ствительно, 2 z · z = 2 |z|2 = 1.
|z| |z| |z|
1 a−bi a −b
Замечание 3.5.15. В терминах алгебраической формы a+bi = a2 +b2 = a2 +b2 + a2 +b2 i.
3.6 Геометрическая интерпретация комплексных чисел

Комлексное число a + bi однозначно задается парой вещественных чисел a, b, что позволяет
изображать компексные числа в виде точек плоскости. А именно, выбор декартовой системы
координат на евклидовой плоскости задает отождествление плоскости с R2 , а элементы R2
отождествлятся с элементами C. Традиционно это изображают следующим образом:
Im
z = a + bi
b
0 a Re
Полученная геометрическая интерпретация называется комплексной плоскостью. Веще‐

ственные числа отождествляются с точками на оси абсцисс, называемой по этой причине ве‐
щественной осью. Ось ординат состоит из чисто мнимых чисел и называется мнимой осью. С
48
каждым комплексным числом z связывается радиус‐вектор, соединяющий начало коорди‐
нат 0 с z. Тогда сумма комплексных чисел может быть реализована как сложение соответ‐
ствующих векторов:
z
z+w
Частный случай , когда векторы направлены соответственно вдоль вещественной и мнимой

оси, отвечает тому, разумеется, что a + bi = (a + 0i) + (0 + bi). Комплексное сопряжение
дей ствует как отражение относительно вещественной оси.
Кроме того, теорема Пифагора дает также интерпретацию модулю комплексного числа. А
именно, модуль комплексного числа z это длина соответствующего радиус‐вектора или, что
то же самое, расстояние от 0 до z:
z = a + bi
|z |
Расстояние между точками, отвечающими комплексным числам z и w, вычисляется как дли‐

на соединяющего их вектора, то есть |z − w| = |w − z|:
z
w−z
Замечание 3.6.1. Расстояние можно так и определять — тогда растояние неотрицательно,

равно 0 только между равными точками и удовлетворяет неравенству треугольника, то есть
для трех комплексных чисел z1 , z2 , z3 ∈ C выполнено |z1 − z3 | 6 |z1 − z2 | + |z2 − z3 |.
Доказательство. Первые два свой ства очевидно следуют из свой ств модуля, для доказа‐
тельства третьего достаточно доказать, что для произвольных z, w ∈ C выполнено |z + w| 6
|z| + |w| (и применить к z = z1 − z2 , w = z2 − z3 ).
Возведем обе части доказываемого неравенства в квадрат, так как они нетрицательны,
получится эквивалентное неравенство |z + w|2 6 (|z| + |w|)2 . Левую часть можно переписать
как (z + w)(z + w) = zz + ww + zw + zw = |z|2 + |w|2 + 2 Re(zw), а правую как |z|2 + |w|2 +
2|z||w|. Тогда неравенство принимает (после сокращения и деления на 2) вид Re(zw) 6 |z||w|,
которое выполнено, так как |z||w| = |z||w| = |zw| и вещественная часть числа всегда не
превосходит его модуля.
49
Кроме декартовых координат на плоскости можно также ввести так называемые поляр‐
ные. Для этого фиксируется один луч R0 с началом в точке P0 — тогда каждая точка плоско‐
сти P лежит на каком‐то луче R с началом в P0 , причем для P 6= P0 этот луч определен од‐
нозначно. Точку P можно задать двумя параметрами: расстоянием от P0 до P и углом между
лучами R0 и R.
На комплексной плоскости есть один естественный способ выбрать такой луч, а именно
множество неотрицательных чисел R>0 с началом в точке 0. Тогда каждая точка z комплекс‐
ной плоскости кодируется расстоянием до 0 (то есть |z|) и углом между радиус‐вектором
точки z и лучом R>0 . Этот угол называется аргументом комплексного числа z и обозначает‐
ся arg(z).
Поскольку модуль комплексного числа мультипликативен, то для любого z ∈ C существу‐
ет такое z ′ ∈ C, что z = |z| · z ′ и |z ′ | = 1, а именно, z ′ = z/|z| (или z ′ = 0, если z = 0).
Комплексные числа модуля 1 лежат на окружности радиуса 1 с центром в точке 0.
|z| sin θ z
z′
sin θ
θ 1
cos θ |z| cos θ
На изображении выше аргумент числа z равен θ (и ему же равен arg(z ′ )). Вещественная и
мнимая части z ′ это в точности cos θ и sin θ.
Отсюда мы видим, что любое комплексное число представляется в виде
z = r · (cos θ + i sin θ),
где r = |z| и θ = arg(z). Такая запись называется тригонометрической формой z. Сравне‐

ние модулей , вещественных и мнимых частей показывает, что тригонометрическая форма
определена однозначно.
Выясним теперь, как геометрически описать умножение комплексных чисел. Зафиксиру‐
ем комплексное число z и рассмотрим функцию умножения на z, то есть функцию mz : C →
C, дей ствующую по правилу mz (x) = z · x.
Отметим, что для z, w ∈ C выполнено равенство mz ◦ mw = mzw . Дей ствительно,
(mz ◦ mw )(x) = mz (wx) = z(wx) = (zw)x = mzw (x).
Изучим сперва случай , когда |z| = 1. В таком случае mz является движением, так как со‐
храняет расстояния между точками. Дей ствительно,
|mz (x) − mz (y)| = |zx − zy| = |z(x − y)| = |z| · |x − y| = |x − y|.
Кроме того, mz (0) = z · 0 = 0, так что это движение плоскости является либо поворотом
вокруг точки 0, либо отражением относительно некоторой прямой , проходящей через 0. Если
mz является отражением, то тогда m2z = idC . Но m2z = mz2 , так что это бывает только в случае
z = ±1 (в C у многочлена x2 − 1 только два корня), но в обоих случаях mz это вращение (на 0
в случае z = 1 и на π в случае z = −1). Значит, mz это поворот — остается только выяснить,
50
на какой угол. Но для этого достаточно най ти угол между радиус‐векторами одной точки и
ее образа, например, 1 и mz (1) = z. Этот угол по определению равен arg(z).
С другой стороны, если z ∈ R>0 , то mz это гомотетия с центром в 0 и коэффициентом
z. Используя тригонометрическую форму комплексного числа, видим, тем самым, что для
произвольного z ∈ C функция mz дей ствует посредством поворота на arg(z) и гомотетии с
коэффициентом |z|.
Мультипликативность, то есть свой ство mz ◦ mw = mzw , означает, что числа, записанные
в тригонометрической форме, легко умножать.
Предложение 3.6.2. Если z, w ∈ C, то arg(zw) = arg(z) + arg(w). Иными словами,

r · (cos φ + i sin φ) · s · (cos ψ + i sin ψ) = (rs) · (cos(φ + ψ) + i sin(φ + ψ)).
Доказательство. Дей ствительно, если z = r·(cos φ+i sin φ) и w = s·(cos ψ+i sin ψ), то |zw| =
|z||w| = rs. Умножение на z дей ствует как поворот на φ и растяжение в r раз, а умножение на
w как поворот на ψ и растяжение в s раз, тогда композиция mz ◦ mw дей ствует как поворот
на φ + ψ и растяжение в rs раз. Но так же дей ствует умножение на число с модулем rs и
аргументом φ + ψ.
Следствие 3.6.3. Для любых φ, ψ выполнено
cos(φ + ψ) = cos φ cos ψ − sin φ sin ψ, sin(φ + ψ) = cos φ sin ψ + sin φ cos ψ.
Доказательство. Вычислим двумя способами произведение двух комплексных чисел на еди‐
ничной окружности, имеющих аргументы φ и ψ, и сравним получающиеся вещественные и
мнимые части:
cos(φ + ψ) + i sin(φ + ψ) = (cos φ + i sin φ) · (cos ψ + i sin ψ)
= (cos φ cos ψ − sin φ sin ψ) + i(cos φ sin ψ + sin φ cos ψ).
Формула arg(zw) = arg(z) + arg(w) требует некоторых пояснений . Если мы полагаем, что
углы измеряются вещественными числами из полуинтервала [0, 2π), то надо как‐то учесть
случай , когда arg(z) + arg(w) > 2π. Один из способов — переопределить сложение углов,
например, следующим образом:
(
φ + ψ, если φ + ψ < 2π,
eψ=
φ+
φ + ψ − 2π, если φ + ψ > 2π.
Однако иногда бывает удобно считать величину некоторого углу отрицательной — но для
углов в полуинтервале (−π, π] подобная формула для сложения устроена еще сложнее, а ведь
можно выбрать и другой интервал, например, [−π, π). Поэтому продуктивнее другой подход
— переопределить, что такое мера угла. Будем отождествлять углы, отличающиеся на цело‐
численное кратное 2π. Для этого рассмотрим следующее бинарное отношение на R:
φ ≡2π ψ ⇐⇒ ∃k ∈ Z т. ч. φ − ψ = 2πk.
Отношение ≡2π является эквивалентностью и конгруэнтностью относительно сложения,
так что на фактор‐множестве T = R/≡2π определена бинарная операция, индуцированная
сложением вещественных чисел — это и есть сложение углов. Получившееся множество с
бинарной операцией является группой , называемой группой углов. Можно считать, что ар‐
гумент комплексного числа это элемент T, а формула arg(zw) = arg(z) + arg(w) понимается
как вычисление в T.
В дей ствительности группу T относительно сложения углов можно отождествить с груп‐
пой комплексных чисел модуля 1 относительно комплексного умножения.
n
Следствие 3.6.4 (Формула Муавра). r · (cos θ + i sin θ) = rn · (cos nθ + i sin nθ).
51
3.7 Дробно‐линейные преобразования
Рассмотрим следующее отображение:
az + b
f (z) = , где a, b, c, d ∈ C.
cz + d
Если c 6= 0, то такое отображение определено на C \ {−d/c}. Определим расширенную ком‐
плексную плоскость C = C∪{∞}, и доопределим функцию f следующим образом: f (−d/c) =
∞ и f (∞) = a/c. Если же c = 0, то доопределим f (∞) = ∞. Тогда f можно рассматривать как
отображение C → C — такое отображение называется дробно‐линейным преобразованием,
или преобразованием Мебиуса.
Частными случаями являются аффинные преобразования z 7→ az+b (в том числе вращения‐
растяжения ma и сдвиги z 7→ z + b) и обращение z 7→ 1/z.
Предложение 3.7.1. Дробно‐линей ные преобразования замкнуты относительно компози‐

ции.
az + b a′ z + b′
Доказательство. Пусть f (z) = и g(z) = ′ , тогда
cz + d c z + d′
a′ z + b′
a· +b a · (a′ z + b′ ) + b · (c′ z + d′ ) (aa′ + bc′ )z + (ab′ + bd′ )
(f ◦ g)(z) = c′ z + d′ = = .
′ ′ ′ ′ ′ ′
az+b c · (a z + b ) + d · (c z + d ) (ca′ + dc′ )z + (cb′ + dd′ )
c· ′ +d
c z + d′
Остается только проверить случаи, в которых функция была доопределена.
Предложение 3.7.2. Дробно‐линей ное преобразование реализуется как композиция сдви‐
гов, поворотов, растяжений и обращения. А именно, если при c 6= 0 положить
d 1 bc − ad a
f1 (z) = z + , f2 (z) = , f3 (z) = z, f4 = z + ,
c z c2 c
то f = f4 ◦ f3 ◦ f2 ◦ f1 .
Доказательство. Случай c = 0 очевиден (тогда f аффинное — вида f (z) = az + b — и реа‐
лизуется как композиция ma и сдвига на b). Проверим теперь выражение для случая c 6= 0.
Дей ствительно, преобразуем выражение для f :
az + b acz + bc acz + ad − ad + bc a · (cz + d) bc − ad a bc − ad 1

= = = + = + · .
cz + d c · (cz + d) c · (cz + d) c · (cz + d) c · (cz + d) c c2 z + dc
Полученное выражение это в точности формула для (f4 ◦ f3 ◦ f2 ◦ f1 )(z). Остается сверить
значения в доопределенных точках:
d f1 f2 f3 f4
− 7−−→ 0 7−−→ ∞ 7−−→ ∞ 7−−→ ∞,
c
f1 f2 f3 f4 a
∞ 7−−→ ∞ 7−−→ 0 7−−→ 0 7−−→ .
c
Предложение 3.7.3. Если ad − bc = 0, то соответствующее дробно‐линей ное преобразова‐
ние отображает все точки C в a/c, в противном случае оно обратимо.
52
Доказательство. В разложении выше при ad−bc = 0 функция f3 принимает только нулевые
значения на C, откуда следует, что f (z) = f4 (0) = a/c. Если же ad − bc 6= 0, то все функции
f1 , f2 , f3 , f4 обратимы; обратные задаются следующими формулами:
d 1 c2 z a
f1−1 (z) = z − , f2−1 (z) = , f3−1 (z) = , f4−1 (z) = z − .
c z bc − ad c
Функция, обратная к f , вычисляется как композиция обратных в обратном порядке, то есть
f −1 = f1−1 ◦ f2−1 ◦ f3−1 ◦ f4−1 , и дей ствует на комплексном числе z по правилу
f −1 a cz − a
z 7−−4−→ z − =
c c
f3−1 c2 cz − a c · (cz − a)
7−−−→ · =
bc − ad c bc − ad
f2−1 bc − ad
7−−−→
c · (cz − a)
f1−1 bc − ad d bc − ad − d · (cz − a) −dcz + bc −dz + b
7−−−→ − = = = .
c · (cz − a) c c · (cz − a) c · (cz + a) cz − a
Конечно, когда формула f −1 (z) = −dz+b

cz−a получена, ее можно доказать прямой проверкой (по
правилу вычисления композиции дробно‐линей ных преобразований ).
Следствие 3.7.4. Обратимые дробно‐линей ные преобразования образуют группу относи‐
тельно композиции. Эта группа называется группой Мебиуса.
Дробно‐линей ные преобразования сохраняют важную структуру на комплексной плоско‐
сти — множество прямых и окружностей . Прямые можно трактовать как «окружности бес‐
конечного радиуса» или как окружности на расширенной комплексной плоскости (если ее
отождествить со сферой ). Определим сначала, как задать прямые и окружности уравнения‐
ми.
Предложение 3.7.5. Прямые и окружности на комплексной плоскости задаются уравнени‐
ями вида Azz + Bz + Bz + C = 0, где A, C ∈ R и AC < |B|2 . Прямым отвечает случай A = 0.
Доказательство. Начнем с прямых. Отметим для начала, что всякая прямая подходящим по‐
воротом вокруг 0 может быть переведена в вертикальную. Вертикальная прямая характери‐
зуется вещественной частью своих точек и потому может быть задана уравнением z + z = d
(тогда Re(z) = d/2). То есть существуют такие B ∈ C и C ∈ R, что Bz + Bz + C = 0 задает
исходную прямую.
Окружность радиуса r с центром в точке w задается уравнением |z − w| = r. Возводя обе
части в квадрат, получаем
r2 = |z − w|2 = (z − w) · (z − w) = zz − zw − zw + ww = r2 .
Полагая A = 1, B = −w и C = ww − r2 , получаем требуемое уравнение, причем если r > 0,

то AC = ww − r2 < ww = |B|2 .
Проводя указанные выше вычисления в обратном порядке, получаем, что все такие урав‐
нения задают прямые и окружности.
Предложение 3.7.6. Обратимые дробно‐линей ные преобразования сохраняют множество
всех прямых и окружностей , то есть образом прямой или окружности может быть только
прямая или окружность.
53
Доказательство. В силу Предложения 3.7.2 это утверждение достаточно доказать для функ‐
ций вида z 7→ z + a, z 7→ az и z 7→ 1/z. Для первых двух это очевидно следует из геометриче‐
ского истолкования суммы и произведения комплексных чисел, докажем для обращения.
Пусть Azz + Bz + Bz + C = 0, и положим w = 1/z. Тогда подставляя z = 1/w, получаем
1 1 1 1
A +B +B +C =0 ⇒ A + Bw + Bw + Cww = 0.
ww w w
Замечание 3.7.7. Под дей ствием обращения прямые, проходящие через 0 (случай A = C =
0), переходят в прямые, проходящие через 0. Окружности, не проходящие через 0 (случай
A, C 6= 0), переходятв такие же окружности. Прямые, не проходящие через 0 (случай A =
0, C 6= 0), и окружности, проходящие через 0 (случай A 6= 0, C = 0), переходят друг в друга.
Пример 3.7.8. Одним из важных примеров дробно‐линей ного преобразования является пре‐
образование Кэли, задаваемое формулой
z−i
f (z) = .
z+i
Это преобразование переводит верхнюю полуплоскость Im(z) > 0 в единичный круг |z| 6 1.
3.8 Полиномиальные уравнения комплексной переменной

Присоединение к полю вещественных чисел квадратного корня из −1 позволяет, кроме то‐
го, извлекать√квадратный корень из любого вещественного числа, а именно, для λ ∈ R>0
выполнено ( λ · i)2 = −λ. В дей ствительности в поле комплексных чисел можно извлекать
корни любой степени из любого комплексного числа.
Пусть n ∈ N. Изучим корни n‐й степени из комплексного числа w. Ясно, что их не больше
n, так как они являются корнями многочлена xn − w степени n. Пусть z1 , z2 два таких корня,
то есть z1n = z2n = w. Тогда (z1 /z2 )n = z1n /z2n = w/w = 1, то есть два корня n‐й степени из
w отличаются одно от друго на множитель, являющий ся корнем n‐й степени из 1. Поэтому
чтобы определить множество всех корней n‐й степени из w, надо най ти один такой корень
z0 , а затем рассмотреть всевозможные произведения z0 · z, где z — корень n‐й степени из 1.
Формула Муавра (Следствие√ 3.6.4) позволяет легко най ти один корень из w. А именно, если
w = r · (cos θ + i sin θ), то z0 = n r · (cos(θ/n) + i sin(θ/n)) при возведении в степень n дает w.
Вычислим теперь корни степени n из единицы. Обозначим множество всех таких корней
µn , то есть µn = {z ∈ C | z n = 1}. Ясно, что это множество состоит из не более чем n
элементов и замкнуто относительно умножения. По сказанному выше там имеется элемент
ξ1 = cos 2π 2π
n + i sin n , а также все его степени:
2πk 2πk
ξk = ξ1k = cos + i sin , k = 1, . . . , n.
n n
Все они различны, так как различаются их аргументы, и потому µn = {1, ξ, ξ 2 , . . . , ξ n−1 }.
Предложение 3.8.1. Корни из 1 степени n обладают следующими свой ствами:
1. Они располагаются в вершинах правильного n‐угольника, вписанного в единичную
окружность таким образом, что одна из вершин совпадает с точкой 1.
2. Если z ∈ µn , то z = z −1 ∈ µn .
3. µn — группа.
54
Ясно, что возможность извлекать квадратные корни из произвольных комплексных чисел
сразу дает возможность решать любые квадратичные уравнения по стандартной формуле.
В дей ствительности имеет место гораздо более общий результат, который мы приведем без
доказательства.
Теорема 3.8.2 (Основная теорема алгебры).
Если f ∈ C[x] и deg(f ) > 1, то существует c ∈ C — корень f .
Следствие 3.8.3. Если f ∈ C[x] и deg(f ) > 1, то f = a · (x − c1 ) · . . . · (x − cn ) для некоторых

a, c1 , . . . , cn ∈ C. Такое разложение единственно (с точностью до перестановки множите‐
лей ). Иными словами, любой многочлен с комплексными коэффициентами раскладывается
на линей ные множители (определенные однозначно с точностью до ассоциированности —
или же все имеющие старшие коэффициенты 1, но появляется дополнительный множитель‐
константа).
Доказательство. По Следствию 3.3.7 из малой теоремы Безу существует разложение f =
(x − c1 ) · . . . · (x − ck ) · h, где h ∈ C[x] не имеет корней . Но по основной теореме алгебры тогда
h ∈ C — константа, а сравнение степеней показывает, что k = n.
Следствие 3.8.4. Если f ∈ R[x] и deg(f ) > 1, то f раскладывается в произведение линей ных
множителей и квадратичных множителей с отрицательным дискриминантом. Такое разло‐
жение единственно (с точностью до перестановки и ассоциированности).
Доказательство. Если рассматривать f ∈ R[x] как многочлен с комплексными коэффици‐
ентами, то f = a · (x − c1 ) · . . . · (x − cn ). Заметим, что все мнимые корни ci встречаются парами
комплексно сопряженных. Дей ствительно, если f = a0 + a1 x + . . . + an xn и все ai ∈ R, то из
равенства 0 = f (c) = a0 +a1 c+. . .+an cn комплексным сопряжением обеих частей получаем,
что 0 = f (c) = f (c). Иными словами, указанное выше разложение для f можно переписать в
виде
f = a · (x − b1 ) · . . . · (x − bk ) · (x − d1 )(x − d1 ) · . . . · (x − dm )(x − dm ),
где bi ∈ R и di ∈ C \ R. Но (x − d)(x − d) = x2 − (d + d)x + dd ∈ R[x]. Дискриминант этого
многочлена равен (d + d)2 − 4dd = (d − d)2 , что является отрицательным вещественным
числом, так как d − d чисто мнимое.
Покажем теперь, как решать кубические уравнения. Оказывается, даже в случае, когда все
корни вещественного многочлена степени 3 являются вещественными, формула для их на‐
хождения использует комплексные числа.
Рассмотрим многочлен f = x3 + ax2 + bx + c ∈ C[x]. Ясно, что достаточно научиться
находить корни многочленов со старшим коэффициентом 1. Сделаем замену x = t − a3 :
a 3 a 2 a a2 2a2 ab
f = t− +a t− + t− + c = t3 + b − t+ − +c .
3 3 3 3 27 3
Если обозначить p = 13 (3b − a2 ) и q = 27
1
(2a2 − 9ab + 27c), то исходное уравнение примет вид
3
t + pt + q = 0 относительно новой переменной t.
Сделаем теперь еще одну замену t = w − 3w p
:
p 3 p p3
f = w− +p w− + q = w3 + q − .
3w 3w 27w3
55
p3
Домножение на w3 дает уравнение w6 + qw3 + 27 = 0, или, что то же самое, квадратичное
3
уравнение W + qW − = 0 относительно переменной W = w3 . Корнями этого квадратич‐
2 p
27
ного уравнения являются r
q p3 q2
W1,2 = − ± + .
2 27 4
Если w1 , w2 , w3 — три кубических корня из W , то w1 − 3wp 1 , w2 − 3wp 2 , w3 − 3wp 3 — корни
приведенного кубического уравнения t3 + pt + q = 0.
Заметим, что по формуле Виета W1 W2 = −p −p3
3
27 , так что W2 = 27W и значения выражений

wi − 3wi не зависят от того, являются w1 , w2 , w3 кубическими корнями из W1 или изи W2 .
p
Если известны решения уравнения t3 + pt + q = 0, то легко восстанавливаются решения

исходного уравнения x3 + ax2 + bx + c = 0, а именно x = t − a3 .
3.9 Производная и кратные корни

Пусть R — область целостности.
Определение 3.9.1. Пусть c ∈ R — корень многочлена f ∈ R[x]. Говорят, что c является кор‐
нем кратности m, если f делится на (x − c)m , но не делится на (x − c)m+1 . Корень кратности
1 также иногда называется простым, а кратности > 1 — кратным.
Замечание 3.9.2. Корень c ∈ R многочлена f ∈ R[x] имеет кратность m тогда и только
тогда, когда f = (x − c)m · g, где g ∈ R[x] таков, что g(c) 6= 0.
.
Доказательство. Если c — корень кратности m, то f .. (x − c)m и f = (x − c)m · g для неко‐
торого g. Если g(c) = 0, то g = (x − c) · h для некоторого h, а тогда f = (x − c)m+1 · h, что
противоречит тому, что f не делится на (x − c)m+1 .
Если же имеется разложение f = (x − c)m · g, g(c) 6= 0, то x — корень кратности m. В самом
.
деле, пусть f .. (x − c)m+1 , то есть f = (x − c)m+1 · h для какого‐то h. Но тогда (x − c)m · g =
(x − c)m+1 · h, откуда (x − c)m · (g − (x − c)h) = 0. Так как R — область целостности, то
R[x] тоже область целостности, откуда получаем, что g − (x − c)h = 0, так что g(c) = 0,
противоречие.
Следствие 3.9.3. Многочлен f ∈ R[x] представляется в виде f = (x − c1 )m1 · . . . · (x − ck )mk · g,
где g ∈ R[x] не имеет корней , а c1 , . . . , ck — различные корни f . В частности, сумма кратно‐
стей всех корней многочлена не превосходит его степени.
Обозначение 3.9.4. Пусть R — кольцо с 1. Для n ∈ N будем обозначать через n элемент
кольца R, полученный сложением 1 с собой n раз. При таких обозначениях в кольце Z/mZ
имеет место равенство m = 0. Аналогично, можно обозначить посредством −n число, про‐
тивоположное по сложению элементу n ∈ R, или же сумму −1 с собой n раз. Это позволяет
рассматривать целые числа как элементы кольца (но различным целым числам могут соот‐
ветствовать одинаковые элементы).
Определение 3.9.5. Пусть f = a0 + a1 x + . . . + an xn ∈ R[x]. Производной f называется
многочлен f ′ = a1 + 2a2 x + . . . + nan xn−1 .
Предложение 3.9.6. Пусть f, g ∈ R[x], c ∈ R, m ∈ N. Тогда
1. (f + g)′ = f ′ + g ′ (аддитивность);
2. (cf )′ = cf ′ ;
56
3. (f g)′ = f ′ g + f g ′ (правило Лей бница);
4. (f m )′ = mf m−1 f ′ .
Доказательство. Обозначим f = a0 + a1 x + . . . + an xn , g = b0 + b1 x + . . . + bn xn .
Pn Pn Pn
1. (f + g)′ = k=1 k(ak + bk )xk−1 = k=1 kak xk−1 + k=1 kbk xk−1 = f ′ + g ′ .
Pn Pn
2. (cf )′ = k=1 kcak xk−1 = c k=1 kak xk−1 = cf ′ .
3. Рассмотрим сначала случай , когда f и g — мономы, то есть f = axi и f = bxj . В этом
случае f g = abxi+j и (f g)′ = (i + j)abxi+j−1 . С другой стороны, f ′ g + f g ′ = iaxi−1 · bxj +
axi · jbxj−1 = iabxi+j−1 + jabxi+j−1 = (f g)′ .
Произвольный многочлен можно Pnзаписать в виде суммы мономов: f = f1 + . . . + fn ,
g = g1 + . . . + gn , и тогда f g = i,j=1 fi gj . Воспользуемся уже доказанным свой ством
аддитивности:
X
n X
n X
n X
n
(f g)′ = (fi gj )′ = (fi′ gj + fi gj′ ) = fi′ gj + fi gj′ = f ′ g + f g ′ .
i,j=1 i,j=1 i,j=1 i,j=1
4. Индукция по m. База тривиальна. Если m > 1, то

(f m )′ = (f · f m−1 )′
= f ′ · f m−1 + f · (f m−1 )′
= f m−1 f ′ + f · (m − 1)f m−2 f ′

= f m−1 + f · (m − 1)f m−2 · f ′
= mf m−1 f ′ .
Предложение 3.9.7. Элемент c ∈ R является кратным корнем многочлена f ∈ R[x] тогда и

только тогда, когда f (c) = f ′ (c) = 0.
.
Доказательство. Если c — кратный корень, то f .. (x − c)2 . Раз f = (x − c)2 · g, то f ′ =
′
(x − 2)2 g + (x − c)2 g ′ = 2(x − c)g + (x − c)2 g ′ и f ′ (c) = 0.
Если f (c) = f ′ (c) = 0, то f = (x − c)g и f ′ = (x − c)h для каких‐то g, h. При этом f ′ =
(x − c)′ g + (x − c)g ′ = g + (x − c)g ′ , откуда (x − c)(h − g ′ ) = g, то есть f = (x − c)2 (h − g ′ ) и c
— кратный корень.
Предположим теперь, что базовое кольцо K является полем, и кроме того, что Q ⊆ K (то
есть ни одна из сумм 1 + . . . + 1 и ненулевого числа слагаемых не обращается в 0, иными
словами, n 6= 0 как элемент K ни для какого n ∈ N). Примерами таких полей являются Q, R
и C, а поля вычетов Z/pZ — не являются.
Предложение 3.9.8. Пусть f ∈ K[x] и c ∈ K — корень f , m ∈ N. Элемент c является корнем
f кратности m тогда и только тогда, когда c является корнем f ′ кратности m − 1.
Доказательство. Если c — корень f кратности m, то f = (x − c)m · g и g(c) 6= 0. Тогда

f ′ = (x − c)m · g ′ + m(x − c)m−1 g = (x − c) (x − c)g ′ + mg .
Рассмотрим h = (x − c)g ′ + mg. Так как h(c) = mg(c) и m 6= 0, получаем, что h(c) 6= 0. Значит,
c — корень f ′ кратности m − 1.
Если c — корень f ′ кратности m − 1, то обозначим через n кратность c как корня f . Тогда
по уже доказанному кратность c как корня f ′ равна n − 1, то есть n − 1 = m − 1 и n = m.
57
Следствие 3.9.9. Пусть f ∈ K[x], c ∈ K и m > 1. Кратность c как корня f равна m тогда и
только тогда, когда f (c) = f ′ (c) = . . . = f (m−1) (c) = 0 и f (m) (c) 6= 0.
Доказательство. Если c — корень f кратности m, то он является корнем f ′ кратности m − 1,
откуда кратность как корня f (2) равна m − 2, и так далее, вплоть до f (m−1) с кратностью 1, и
f (m) 6= 0.
Пусть теперь f (c) = f ′ (c) = . . . = f (m−1) (c) = 0 и f (m) (c) 6= 0. Воспользуемся индукцией
по m. База m = 1 следует из Предложения 3.9.7. Индукционный переход: у многочлена f ′
первые m − 2 производных имеют в c значение 0, а (f ′ )(m−1) (c) 6= 0, то есть c — корень f ′
кратности m − 1, откуда c — корень f кратности m.
Замечание 3.9.10. Утверждение выше можно распространить и на случай m = 1, если эле‐
менты, не являющиеся корнями, называть «корнями крастности 0».
Отметим еще одно применение производной — формулу Тей лора.

1 (k)
Замечание 3.9.11. Пусть f = a0 + a1 + . . . + an xn . Тогда ak = k! f (0).
Доказательство. Дей ствительно, свободный член многочлена равен его значению в 0, а сво‐
бодный член f (k) равен k! · ak .
Pn f (k) (c)
Предложение 3.9.12 (Формула Тей лора). Если f ∈ F [x] и c ∈ F , то f = k=0 (x − c)k .
k!
Доказательство. Случай c = 0 напрямую следует из предыдущего замечания. Формула для
произвольного c получается заменой x 7→ x − c.
3.10 Интерполяция
Пусть K — поле, x1 , . . . , xn ∈ K попарно различны и y1 , . . . , yn . Задачей интерполяции на‐
зывается проблема отыскания некоторой функции, принимающей в каждой из точек xi зна‐
чение yi . Нас будет интересовать полиномиальная интерполяция, то есть мы будем искать
такую функцию среди многочленов. Более строго, такой типа интерполяции называется по‐
линомиальной интерполяцией с n простыми узлами.
Предложение 3.10.1. Задача полиномиальной интерполяции с n простыми узлами имеет
единственное решение в классе многочленов степени 6 n − 1.
Доказательство. Докажем сперва, что решение, если существует, является единственным.
Пусть f, g ∈ K[x] таковы, что f (xi ) = g(xi ) = yi для всех i = 1, . . . , n и deg(f ), deg(g) 6 n − 1.
Рассмотрим многочлен h = f − g. С одной стороны, deg(h) 6 n − 1, с другой , h(xi ) = 0 для
любого i = 1, . . . , n, так что у него имеется n различных корней . Это означает, что h = 0, а
тогда f = g.
Докажем существование искомого многочлена f при помощи явной конструкции. Дей ‐
ствовать будем аналогично доказательству китай ской теоремы об остатках (Теорема 2.11.1).
А именно, рассмотрим случай , когда y2 = y3 = . . . = yn = 0, а y1 произвольный . Если
.
f1 ∈ K[x] таков, что f1 (xi ) = yi , то f .. (x − x2 ) · . . . · (x − xn ) — это уже многочлен сте‐
пени n − 1. Остается только домножить его на подходящий скаляр, чтобы получить нужное
значение в x1 . Для этого сначала поделим на его значение в x1 , а затем домножим на y1 :
(x − x2 ) · . . . · (x − xn )
f1 = y1 · .
(x1 − x2 ) · . . . · (x1 − xn )
58
Аналогично можно построить многочлены fi , принимающие значение yi в xi и 0 в остальных
узлах интерполяции. Тогда для f = f1 + . . . + fn выполнено: f (xi ) = fi (xi ) = yi . Итого,
искомый интерполяционный многочлен имеет вид
n
X Y x − xj
f= yi · .
i=1
xi − xj
j̸=i
Построенный многочлен называется интерполяционным многочленом в форме Лагранжа.

Имеется альтернативный способ построения интерполяционного многочлена, особенно
удобный , когда узлы интерполяции добавляются последовательно. А именно, можно постро‐
ить последовательность таких многочленов f1 , f2 , . . . , fn , что fk решает интерполяционную
задачу для точек x1 , . . . , xk .
В качестве f1 положим многочлен нулевой степени y1 . Если многочлен fk уже построен,
то многочлен fk+1 можно построить в виде fk + c · (x − x1 ) · . . . · (x − xk ) — таким образом
значения в x1 , . . . , xk останутся теми же, а значение в xk+1 можно сделать равным yk+1 по‐
средством выбора параметра c. Подстановка xk+1 в выражение для fk+1 и приравнивание к
yk+1 показывает, что
yk+1 − fk (xk+1 )
c= .
(xk+1 − x1 ) · . . . · (xk+1 − xk )
Многочлен fn , полученный такой процедурой , называется интерполяционным многочленом
в форме Ньютона.
Полиномиальная интерполяция позволяет восстановить многочлен, если известны его
значения в достаточном числе точек. Это можно применить к задаче разделения секрета, ко‐
торая формулируется следующим образом: как разделить между n участниками части неко‐
торого секрета так, чтобы его можно было восстановить только имея все части (более общо,
любые k из n частей для некоторого заранее оговоренного k).
Алгоритм 3.10.2 (Схема разделения секрета по Шамиру).

Предположим, что разделяемый секрет представляет собой натуральное число M .
1. Выберем простое число p > M , которое можно сообщить всем участникам.
2. Выберем случай ным образом многочлен f = ak−1 xk−1 + ak−2 xk−2 + . . . + a1 x + M ∈
Z/pZ. Всем участникам сообщается его степень k − 1.
3. Выберем n различных ненулевых элементов Z/pZ (в предположении, что n < p), на‐
пример, 1, 2, . . . , n. Вычислим значения ki = f (i) ∈ Z/pZ и сообщим i‐му участнику
пару (i, ki ).
4. Для восстановления секрета M теперь необходимо вычислить f (0), что можно сделать,
восстановив многочлен F по любым k его значениям.
При этом знание любых k − 1 из этих значений не дает никакого знания об f (0), так как
возможные значения равномерно распределены в Z/pZ.
3.11 Поле частных

Следующая конструкция позволяет по любой области целостности R построить некоторое
поле, «содержащее» R. В целом эта конструкция аналогична построению поля рациональных
чисел Q по кольцу целых числе Z.
59
Итак, пусть R — область целостности с единицей . Будем полагать, что R 6= {0} и, в част‐
ности, 0 6= 1. Рассмотрим множество R × (R \ {0}) и введем на нем следующее отношение
эквивалентности:
(a, r) ∼ (b, s) ⇐⇒ as = br.
Моральный смысл этого определения состоит в том, что если мы представляем дроби ar и sb
в виде пар (a, r) и (b, s), то равенство дробей ar = sb равносильно, после домножения обеих
частей на rs, равенству as = br.
Лемма 3.11.1. Это отношение эквивалентности.
Доказательство. Рефлексивность очевидна: (a, r) ∼ (a, r) ⇔ ar = ar. Симметричность:
(a, r) ∼ (b, s) ⇔ as = br ⇔ (b, s) = (a, r). Транзитивность: если (a, r) ∼ (b, s) и (b, s) ∼ (c, t), то
as = br и bt = cs, откуда ast = brt и brt = crs. Вычитая, получаем, что 0 = ast−crs = s(at−cr).
Так как R — область целостности, at − cr = 0 и (a, r) ∼ (c, t).

Обозначение 3.11.2. Обозначим Q(R) = R × (R \ {0}) /∼ , а класс пары (a, r) будем обозна‐
чать ar .
Замечание 3.11.3. Для любого s 6= 0 имеется равенство a
r = as
rs .
Определение 3.11.4. Кольцом частных области целостности R будем называть множество

Q(R) вместе с бинарными операциями
a b as + br a b ab
+ = , · = .
r s rs r s rs
Лемма 3.11.5. Введенные операции определены корректно.
a a′ b b′
Доказательство. Требуется проверить, что если r = r′ и s = s′ , то
a b a′ b′ a b a′ b′
+ = ′ + ′, · = ′ · ′.
r s r s r s r s
Условия означают, что ar′ = a′ r и bs′ = b′ s. Выпишем
a b as + br a′ b′ a′ s′ + b′ r′
+ = и ′
+ ′ = .
r s rs r s r′ s′
Проверим, что пары, отвечающие дробям в правых частях, эквивалентны:
(as + br) · r′ s′ = ar′ ss′ + brr′ s′ = a′ rss′ + b′ rr′ s = (a′ s′ + b′ r′ ) · rs.
Аналогично для произведения:
a b ab a′ b′ a′ b′
· = и · = .
r s rs r′ s′ r′ s′
Равенство правых частей имеет место, так как abr′ s′ = a′ b′ rs.
Лемма 3.11.6. Q(R) относительно введенных операций образует кольцо.
Доказательство. Ассоциативность сложения:

a b c as + br c ast + brt + crs a b c a bt + cs ast + brt + crs
+ + = + = , + + = + = .
r s t rs t rst r s t r st rst
60
Коммутативность сразу следует из определения:
a b as + br br + as b a
+ = = = + .
r s rs sr s r
В качестве ней трального по сложению выступает 01 :
a 0 a·1+0·r a
+ = = .
r 1 r·1 r
Заметим, кроме того, что 01 = 0r для любого r ∈ R \ {0}.
−a
Противоположный к ar по сложению вычисляется как r :
a −a ar − ar 0 0
+ = 2
= 2 = .
r r r r 1
Ассоциативность умножения:

a b c ab c abc a bc a b c
· · = · = = · = · · .
r s t rs t rst r st r s t
Коммутативность умножения очевидна. В качестве ней трального элемента относительно

умножения выступает 11 (равный rr для любого r ∈ R \ {0}).
Дистрибутивность:

a b c as + br c acs + bcr acst + bcrt ac bc a c b c
+ · = · = = = + = · + · .
r s t rs t rst rst2 rs st r s s t
Предложение 3.11.7. Q(r) является полем.
r 6= 0. Так как в таком случае a 6= 0, то можно рассмотреть элемент

a
Доказательство. Пусть
a ∈ Q(R), а тогда r · a = ra = 1 . При этом 1 6= 1 , так как их равенство означало бы, что 0 = 1
r a r ar 1 0 1
в кольце R.
Элементы исходного кольца R можно отождествить с элементами Q(R) посредством отоб‐
ражения a 7→ a1 . При этом различные элементы переходят в раздичные элементы (так как
a b
1 = 1 влечет a = b), а сложение и умножение таких дробей происходит так же, как и у исход‐
ных элементов:
a b a+b a b ab
+ = и · = .
1 1 1 1 1 1
Пример 3.11.8. Q(Z) = Q.
3.12 Рациональные функции

Как мы уже выяснили, для области целостности R (например, для поля) кольцо многочле‐
нов R[x] тоже является областью целостности, так что можно рассмотреть соответствующее
поле частных.
Определение 3.12.1. Полем рациональных функций над полем F называется поле F (x) =
Q(F [x]). Иными словами,
f
F (x) = | f, g ∈ F [x], g 6= 0 .
g
61
f
Хотя мы и используем слово «функция», значение такой дроби (понимаемое как g (c) =
f (c)
g(c) )
определено не во всех точках c (с этим мы уже встречались при рассмотрении дробно‐
линей ных функций ). Более того, так как существуют ненулевые многочлены, принимающие
нулевые значения во всех точках, существуют и рациональные функции, значение которых
не определено ни в одной точкой , например, xp1−x ∈ (Z/pZ)(x).
Еще одно препятствие состоит в том, что подобная попытка определить значение рацио‐
нальной зависит от выбора представителя — домножение числителя и знаменателя на мно‐
гочлен f удаляет из области определения корни f . Это можно было бы обой ти, выделяя в
каждом классе дробей представителя, имеющего взаимно простые числитель и знамена‐
тель (тогда область определения максимальна), либо, как делают в анализе, определеить
значение как предел в тех точках, где он конечен (так мы поступали с дробно‐линей ными
преобразованиями, но над произвольным полем такой подход недоступен).
Определение 3.12.2. Рациональная функция f
g ∈ F (x) называется правильной (дробью),
если deg(f ) < deg(g).
Замечание 3.12.3. Это определение не зависит от выбора представителей , то есть если gf11 =
f2
g2 и deg(f1 ) < deg(g1 ), то deg(f2 ) < deg(g2 ).
Доказательство. Если gf11 = gf22 , то f1 g2 = f2 g1 , а тогда deg(f1 g2 ) = deg(f2 g1 ), то есть deg(f1 )+

deg(g2 ) = deg(f2 ) + deg(g1 ) или deg(g2 ) − deg(f2 ) = deg(g1 ) − deg(f1 ) > 0
Предложение 3.12.4. Сумма, разность и произведение правильных дробей — правильные
дроби.
Доказательство. Пусть gf11 и gf22 — правильные дроби, тогда deg(f1 ) < deg(g1 ) и deg(f2 ) <
deg(g2 ). Рассмотрим числитель и знаменатель их суммы: f1 g2 + f2 g1 и g1 g2 . Тогда для их сте‐
пеней имеет место неравенство

deg(f1 g2 + f2 g1 ) 6 max deg(f1 g2 ), deg(f2 g1 ) =

= max deg(f1 ) + deg(g2 ), deg(f2 ) + deg(g1 ) < deg(g1 ) + deg(g2 ) = deg(g1 g2 ).
Для разности и произведения аналогично.

Замечание 3.12.5. Среди многочленов только нулевой является правильной дробью.
Доказательство. Пусть f ∈ F [x]. Так как f = f1 и правильность дроби не зависит от выбора
представителей , дробь f1 правильная тогда и только тогда, когда deg(f ) < deg(1) = 0, то есть
deg(f ) = −∞ и f = 0.
Предложение 3.12.6. Для любой рациональной функции fg ∈ F (x) существует единствен‐
ное представление в виде h + rs , где h ∈ F [x], а rs — правильная дробь. Кроме того, можно
выбрать s = g.
Доказательство. Поделим f на g с остатком: f = qg+r, где deg(r) < deg(g). Тогда fg = qg+r g =
qg r q r
g + g = 1 + g . Положим h = q, r = r и s = g.
Докажем единственность. Если h1 + sr11 = h2 + sr22 — два таких представления, то h1 − h2 =
s2 − s1 . В левой части стоит многочлен, а в правой правильная дробь, так что обе части равны
r2 r1
0.
Определение 3.12.7. Многочлен называется неприводимым, если его нельзя представить в
виде произведения двух многочленов меньших степеней .
62
Пример 3.12.8. Как мы уже видели, в C[x] неприводимыми являются только линей ные мно‐
гочлены, а в R[x] линей ные и квадратичные с отрицательным дискриминантом.
Отметим следующие свой ства многочленов, аналогичные свой ствам целых чисел.
Предложение 3.12.9. 1. Если f ⊥ g, то существуют такие u, v, что f u + gv = 1.
2. Для любого f ∈ F [x] существуют такие неприводимые многочлены f1 , . . . , fk , что f =
f1 · . . . · fk . Эти множители определены однозначно с точностью до перестановки и
ассоциированности.
Определение 3.12.10. Рациональная функция называется простейшей, если ее можно пред‐
ставить в виде pfm , где f, p ∈ F [x], p неприводимый , deg(f ) < deg(p), m ∈ N.
Лемма 3.12.11. Пусть f
gh ∈ F (x) — правильная дробь, причем g ⊥ h. Тогда существует пред‐
f a b
ставление gh = g + h в виде суммы двух правильных дробей .
Доказательство. Раз g ⊥ h, то существуют такие u, v, что gu + hv = 1. Тогда f = g · f u +
h · f v, откуда gh
f
= gf u+hf
gh
v
= fhu + fgv . Каждое из этих слагаемых представляется в виде
f
суммы многочлена и правильной дроби, итого gh = c+ ag + hb . Так как исходная рациональная
функция является правильной дробью, получаем c = 0.
f
Лемма 3.12.12. Правильную дробь вида pm можно представить в виде суммы
f a1 a2 am
m
= + 2 + ... + m,
p p p p
где ai ∈ F [x] и deg(ai ) < deg(p).
Доказательство. Индукция по m. База тривиальна. При m > 1 поделим с остатком f = pq+r,
deg(r) < deg(p). Тогда
f pq + r pq r q r
m
= m
= m + m = m−1 + m ,
p p p p p p
и к первому слагаемому можно применить индукционное предположение.
Теорема 3.12.13. Пусть f
g ∈ F (x) — правильная дробь, g = pm
1 · . . . · pk — разложение на
1 mk
неприводимые (pi ⊥ pj при i 6= j). Тогда fg представляется в виде суммы простей ших дробей ,
mk
в знаменателях которых стоят p1 , p21 , . . . , pm
1 , p 2 , . . . , pk .
1
Доказательство. Последовательно применяя Лемму 3.12.11, получаем сначала разложение

f f1 fk
= m1 + . . . + mk ,
g p1 pk
fi
а затем каждое из слагаемых m
pi i
с помощью Леммы 3.12.12 переписываем в виде суммы
простей ших со знаменателями pi , . . . , pm
i .
i
Замечание 3.12.14. В дей ствительности такое разложение единственно с точностью до пе‐

рестановки.
Следствие 3.12.15.
1. Правильная дробь из C(x) представляется в виде суммы дробей вида a
(x−c)m , где a, c ∈
C и m ∈ N.
2. Правильная дробь из R(x) представляется в виде суммы дробей вида a
(x−c)m , где a, c ∈
R и m ∈ N, и дробей вида (x2 +cx+d)
ax+b
m , где a, b, c, d ∈ R, c < 4d и m ∈ N.
2
63
4 Основы линейной алгебры
4.1 Векторные пространства и базисы
Мы уже видели, как абстрактные понятия вроде группы, кольца и поля позволяют рассмат‐
ривать на первый взгляд совершенно различные структуры единообразно, выделяя самые
существенные их свой ства. Базовой структурой в линей ной алгебре является векторное про‐
странство — понятие, реализующее основные свой ства множества всех векторов в евклидо‐
вом пространстве.
Определение 4.1.1. Пусть F — поле. Множество V вместе с бинарной операцией + : V ×
V → V и операцией · : F × V → V называется векторным пространством над полем F , если
выполнены следующие свой ства:
1. (V, +) является абелевой группой ;
2. для любых u, v ∈ V и λ, µ ∈ F верны равенства
a) λ · (u + v) = (λ · u) + (λ · v),
b) (λ + µ) · v = (λ · v) + (µ · v),
c) λ · (µ · v) = (λµ) · v,
d) 1 · v = v.
Элементы V называются векторами, а элементы базового поля F называются скалярами.
Операции на V называются векторным сложением и умножением на скаляр.
1. Множество всех векторов евклидова пространства (для простоты можно рассматри‐
вать случай плоскости), имеющих началом некоторую фиксированную точку O, отно‐
сительно сложения по правилу параллелограма и растяжений относительно точки O в
качестве домножения на вещественные скаляры.
u+v
λv
u
v
2. Декартова степень базового поля F n вместе с покомпонентными операциями сложе‐

ния и умножения на скаляр — векторное пространство над F . По причинам, которые
будут прояснены позже, мы будем записывать элементы F n в виде столбцов, а само F n
называть пространством столбцов.
3. Комплексные числа C — векторное пространство над R.
4. Многочлены F [x] — векторное пространство над F . Также можно рассматривать мно‐
жество всех многочленов степени не выше данной :
F [x]6d = {f ∈ F [x] | deg(f ) 6 d}.
Дей ствительно, при домножении на скаляр степень многочлена сохраняется, а при сум‐
мировании многочленов не повышается.
64
5. Рациональные функции над данным полем F , а также множество всех правильных дро‐
бей .
6. Для данного множества A множество всех его подмножеств 2A — векторное простран‐
ство над Z/2Z относительно симметрической разности в качестве сложения и есте‐
ственным образом определенного умножения на скаляр: 1 · X = X, 0 · X = ∅.
Замечание 4.1.3. Отметим некоторые очевидные следствия из определения векторного
пространства.
1. В V имеется ней тральный элемент относительно сложения, который мы будем обо‐
значать 0 (от нулевого элемента базового поля отличается по контексту).
2. λ · 0 = 0 для любого λ ∈ F .
3. 0 · v = 0 для любого v ∈ V .
4. −v = (−1) · v.
В примерах выше каждый элемент векторного пространства однозначно задавался неко‐
торым набором «параметров», имеющим для всех векторов одинаковый размер:
• для векторов на евклидовой плоскости это координаты концов векторов (в некоторой
фиксированной декартовой системе координат);
• для векторов F n это компоненты кортежа;
• для комплексных чисел это вещественная и мнимая часть;
• для многочленов — их коэффициенты;
• для подмножеств данного множества — значения характеристической функции.
В каждом случае эти параметры являются независимыми, причем сумме векторов отвечают
суммы параметров. Для формализации этого наблюдения используется понятие базиса.
Определение 4.1.4. Набор векторов v1 , . . . , vn ∈ V называется линейной независимым, если
для любых λ1 , . . . , λn ∈ F из равенства λ1 v1 + . . . + λn vn = 0 следует, что λ1 = . . . = λn = 0.
В противном случае набор v1 , . . . , vn называется линей но зависимым, а соотношение λ1 v1 +
. . . + λn vn = 0, где не все λi нулевые, — линей ной зависимостью.
Замечание 4.1.5. Набор векторов v1 , . . . , vn линей но независим тогда и только тогда, когда
никакой из этих векторов нельзя представить в виде линей ной комбинации остальных.
Доказательство. Пусть v1 = µ2 v2 + . . . + µn vn . Тогда (−1)v1 + µ2 v2 + . . . + µn vn = 0 — нетри‐
виальная линей ная комбинация, обращающаяся в ноль, и набор v1 , . . . , vn линей но зависим.
Если же λ1 v1 + λn vn = 0 — нетривиальная линей ная зависимость, то один из коэффици‐
ентов, скажем, λ1 , не равен 0, и тогда v1 = µ2 v2 + . . . + µn vn , где µi = −λ
λ1 .
i
Замечание 4.1.6. В линей но независимом наборе векторов нет нулевого вектора.

Замечание 4.1.7. Любой поднабор линей но независимого набора векторов тоже линей но
независим.
Пример 4.1.8. Набор, состоящий из одного ненулевого вектора, линей но независим.
Дей ствительно, если v 6= 0 и λv = 0 при λ 6= 0, то 0 = λ−1 · (λv) = (λ−1 λ) · v = 1 · v = v.
65
Пример 4.1.9. Рассмотрим пространство V = F n и следующий набор вектором в нем:
       
v1,1 v2,1 vk,1 vn,1
 0  v2,2   .   
     ..   
   0     
    vk,k  .
v1 =  .  , v 2 =  .  , . . . , v k =   , . . . , vn =  . 
 .
,
 ..   ..   0   
       
     .   
 .. 
0 0 0 vn,n
и предположим, что vi,i 6= 0.

Набор v1 , . . . , vn является линей но независимым. В самом деле, пусть λ1 , . . . , λn ∈ F та‐
ковы, что v = λ1 v1 + . . . + λn vn = 0. Тогда в последней строке v стоит λn vn,n . Так как эта
величина должна быть равна 0, а vn,n 6= 0, получаем, что λn = 0, так что линей ная зависи‐
мость имеет меньшую длину, и можно рассмотреть ту же задачу для меньшего n. Повторяя
это рассуждение, получаем, что λ1 = . . . = λn = 0.
Определение 4.1.10. Набор v1 , . . . , vn ∈ V называется порождающим, если для любого v ∈

V существует такой набор коэффициентов λ1 , . . . , λn ∈ F , что v = λ1 v1 + . . . + λn vn .
Обозначение 4.1.11. hv1 , . . . , vn i = {λ1 v1 + . . . + λn vn | λ1 , . . . , λn ∈ F } — множество всевоз‐
можных линей ных комбинаций векторов v1 , . . . , vn .
При таком обозначении можно сказать, что набор v1 , . . . , vn является порождающим, если
hv1 , . . . , vn i = V .
Определение 4.1.12. Линей но независимый порождающий набор называется базисом.
1. 1, i — базис C как векторного пространства над R;

2. 1, x, x2 , . . . , xd — базис F [x]6d ;
3. {a}, a ∈ A — базис 2A .
Теорема 4.1.14. Пусть v1 , . . . , vn ∈ V . Следующие определения базиса эквивалентны:
1. v1 , . . . , vn — линей но независимый порождающий набор.

2. v1 , . . . , vn — максимальный по включению линей но независимый набор.
3. v1 , . . . , vn — минимальный по включению порождающий набор.
4. Для любого v ∈ V существует единственный такой набор коэффициентов λ1 , . . . , λn ,

что v = λ1 v1 + . . . + λn vn
Доказательство. (1) ⇒ (3): Предположим, что линей но независимый порождающий набор
v1 , . . . , vn не является минимальным порождающим, то есть все векторы пространства V
представляются в виде линей ных комбинаций какого‐то поднабора. Без ограничения общ‐
ности можно считать, что этот поднабор равен v2 , . . . , vn . Но тогда v1 тоже выражается в виде
линей ной комбинации векторов v2 , . . . , vn , что противоречит альтернативному определе‐
нию линей ной независимости, обеспеченному Замечанием 4.1.5.
66
(3) ⇒ (4): Так как набор порождающий , утверждение о существовании выполнено. Пред‐
положим, что у какого‐то вектора v существует два различных представления в виде линей ‐
ной комбинации:
v = λ1 v1 + . . . + λn vn = µ1 v1 + . . . + µn vn .
Если λi 6= µi , то (λ1 − µ1 )v1 + . . . + (λn − µn )vn = 0 — нетривиальная линей ная комбинация,
так что снова по Замечанию 4.1.5 вектор vi представляется в виде линей ной комбинации
остальных векторов набора, а тогда исходный набор не является минимальным порождаю‐
щим.
(4) ⇒ (2): Поскольку у вектора 0 существует только одно представление в виде линей ной
комбинации v1 , . . . , vn , а именно 0 = 0·v1 +. . .+0·vn , то этот набор линей но независим. Пред‐
положим, что он не является максимальным по включению среди линей но независимых.
Это значит, что существует такой вектор u ∈ V , что набор v1 , . . . , vn , u линей ное независим.
Но вектор u представляется в виде линей ной комбинации v1 , . . . , vn , так что этот набор не
можкт быть линей ной независим.
(2) ⇒ (1): Если набор v1 , . . . , vn является максимальным линей ной независимым, то для
любого u ∈ V набор v1 , . . . , vn , u является линей но зависимым, то есть существуют такие
коэффициенты µ1 . . . , µn , ν ∈ F , что µ1 v1 + . . . + µn vn + νu = 0. Заметим, что ν 6= 0 — в
противном случае получалась бы нетривиальная линей ная зависимость между векторами
v1 , . . . , vn . Но тогда u = λ1 v1 + . . . + λn vn для λi = −µ
ν , и набор v1 , . . . , vn порождающий .
i
Лемма 4.1.15. Пусть v1 , . . . , vn — порождающий набор. Если v1 представляется в виде ли‐

ней ной комбинации векторов v2 , . . . , vn , то v2 , . . . , vn — порождающий набор.
Доказательство. По условию существуют такие коэффициенты λ2 , . . . , λn ∈ F , что
v1 = λ 2 v2 + . . . λ n vn .
Пусть v ∈ V — произвольный вектор. Он представляется в виде
v = µ 1 v1 + µ 2 v2 + . . . + µ n vn
для каких‐то коэффициентов µi . Подставляя сюда выражение для v1 , получаем
v = (µ2 + µ1 λ2 )v2 + . . . + (µn + µ1 λn )vn ,
то есть всякий вектор v выражается в виде линей ной комбинации v2 , . . . , vn .

Предложение 4.1.16. Пусть в векторном пространстве V существует конечный порождаю‐
щий набор. Тогда в этом наборе най дется поднабор, являющий ся базисом V .
Доказательство. Для начала заметим, что из любого порождающего набора можно удалить
все нулевые векторы, и набор останется порождающим.
Если порождающий набор v1 , . . . , vn , состоящий из ненулевых векторов, не является ли‐
ней но независимым, то один из векторов vi выражается в виде линей ной комбинации осталь‐
ных, скажем, v1 . Тогда набор v2 , . . . , vn являются порождающим набором меньшего размера,
к которому можно применить то же рассуждение — тогда в какой ‐то момент будет получен
порождающий поднабор, являющий ся линей но независимым (каждый раз размер набора
уменьшается на 1, а набор из одного ненулевого вектора линей но независим).
Определение 4.1.17. Векторное пространство называется конечномерным, если в нем су‐
ществует конечный порождающий набор. Эквивалентно, пространство конечномерно, если
в нем существует конечный базис.
67
Предложение 4.1.18. В конечномерном векторном пространстве любой линей но независи‐
мый набор можно дополнить до базиса.
Доказательство. Пусть v1 , . . . , vm — линей но независимый набор. Поскольку пространство
конечномерно, существует порождающий набор u1 , . . . , un . Если набор vi не является порож‐
дающим, то какой ‐то из uj не представляется в виде линей ной комбинации vi — скажем,
u1 . Тогда v1 , . . . , vm , u1 снова линей но независимый , и к нему можно применить то же рас‐
суждение. В какой ‐то момент не останется векторов uj , не представимых в виде линей ных
комбинаций vi — в таком случае набор vi является порождающим. Поскольку на предыду‐
щем шаге он еще не был порождающим, он является минимальным порождающим, то есть
базисом.
Лемма 4.1.19 (Лемма Штей ница о замене). Пусть u1 , . . . , um — линей но независимый набор,
а v1 , . . . , vn — порождающий набор. Тогда m 6 n и набор u1 , . . . , um , vm+1 , . . . , vn порождаю‐
щий , возможно, после некоторой перенумерации набора vi .
Доказательство. Докажем индукцией по k = 0, . . . , m, что утверждение верно для поднабо‐
ра u1 , . . . , uk . В качестве базы рассмотрим случай k = 0, в котором нечего доказывать.
Предположим теперь, что утверждение уже доказано для некоторого k < m. По индукци‐
онному предположению набор u1 , . . . , uk , vk+1 , . . . , vn является порождающим, так что най ‐
дутся такие коэффициенты λ1 , . . . , λn ∈ F , что
uk+1 = λ1 u1 + . . . + λk uk + λk+1 vk+1 + . . . + λn vn .
Хотя бы один из коэффициентов λk+1 , . . . , λn должен быть ненулевым, иначе выражение вы‐
ше дает нетривиальную линей ную зависимость между векторами u1 , . . . , uk+1 . В частности,
отсюда k + 1 6 n. Переупорядочивая, если необходимо, векторы vk+1 , . . . , vn , можем считать,
что λk+1 6= 0, а тогда
1
vk+1 = uk+1 − λ1 u1 − . . . − λk uk − λk+1 vk+2 − . . . − λn vn .
λk+1
Значит, набор u1 , . . . , uk+1 , vk+2 , . . . , vn — порождающий .
Утверждение леммы это в точности случай k = m.
Предложение 4.1.20. Если V — конечномерное векторное пространство, то во всех его ба‐
зисах одинаковое количество элементов.
Доказательство. Пусть имеются два базиса размеров m и n соответственно. Так как первый
из них является линей но независимым набором векторов, а второй порождающим набором,
m 6 n. Аналогично, n 6 m. Значит, m = n.
Определение 4.1.21. Размерностью векторного пространства V называется количество эле‐
ментов в каком‐нибудь (любом) его базисе. Обозначение: dim(V ) = n, если существует базис
из n элементов, и dim(V ) = ∞, если V не является конечномерным.
Последнее из четырех эквивалентных определений базиса показывает, что любое конеч‐
номерное пространство можно отождествить с пространством столбцов однозначно опреде‐
ленной высоты. А именно, если e1 , . . . , en — базис V , то для каждого вектора v ∈ V существу‐
ют такие однозначно определенные коэффициенты λ1 , . . . , λn ∈ F , что v = λ1 v1 + . . . + λn vn .
Кортеж из этих коэффициентов (λ1 , . . . , λn ), рассматриваемый как элемент пространства
столбцов F n , называется столбцов координат вектора v в базисе e и обозначается ve . Тем
самым задано отображение
v 7→ ve : V → F n .
68
Отметим, что в силу единственности набора λi это отображение инъективно, при этом легко
предъявить для любого столбца вектор, имеющий этот столбец в качестве столюца коорди‐
нат. В дей ствительно таким образом задается обратное отображение
(λ1 , . . . , λn ) 7→ λ1 v1 + . . . + λn vn : F n → V.
Сопоставление v 7→ ve не только позволяет записывать каждый вектор в виде набора ска‐

ляров, но и сохраняет операции, заданные на пространстве V . А именно, легко проверить,
что для любых двух векторов u, v ∈ V и для любого скаляра λ ∈ F имеют место равенства
(u + v)e = ue + ve и (λv)e = λ · ve .
При таком сопоставлении (ei )e = (0, . . . , 0, 1, 0, . . . , 0), где 1 стоит на i‐й позиции.
4.2 Подпространства и фактор‐пространства

Определение 4.2.1. Подмножество U ⊆ V векторного пространства V над полем F назы‐
вается подпространством (обозначается U 6 V ), если оно является векторным простран‐
ством относительно тех же операций . Иными словами, U ⊆ V является подпространством,
если U 6= ∅ и для любых u, v ∈ U и λ, µ ∈ F обязательно λu + µv ∈ U .
Замечание 4.2.2. Условие U 6= ∅ гарантирует, что в U имеется хотя бы один элемент v, а

тогда там же лежит и вектор 1 · v + (−1) · v = 0. Существование в U вектора, обратного к v по
сложению, обеспечивается равенство −v = 0 + (−1) · v.
1. В любом векторном пространстве V подпространствами являются само V и {0}. По‐

следнее, допуская вольность речи, также обозначают 0.
2. R 6 C как векторного пространства над R (более общо, zR 6 C).
3. Если c 6 d, то F [x]6c 6 F [x]6d .
4. Если B ⊆ A, то 2B ⊆ 2A .
Замечание 4.2.4. Если {Ui }i∈I — семей ство подпространств V , то U = ∩i∈I Ui 6 V .
Доказательство. Если u, v ∈ U , λ, µ ∈ F , то, так как u, v ∈ Ui для каждого i ∈ I, то λu + µv ∈
Ui для всех i, а тогда λu + µv ∈ U . Так как 0 ∈ Ui для всех i, также 0 ∈ U и U 6= ∅.
Мы уже встречались со множеством всех линей ных комбинаций hv1 , . . . , vn i. Оказывается,

это тоже подпространство. Более общо,
Определение 4.2.5. Пусть X ⊆ V . Тогда подпространством, порожденным X, называется
\
hXi = U.
U 6V
X⊆U
Предложение 4.2.6. hXi = {λ1 v1 + . . . + λn vn | n ∈ N, v1 , . . . , vn ∈ X, λ1 , . . . , λn ∈ F }.
Доказательство. Обозначим множество в правой части через W . Ясно, что если v1 , . . . , vn ∈

X и λ1 , . . . , λn ∈ F , то λ1 v1 +. . .+λn vn ∈ U для любого подпространства U 6 V , содержащего
69
X, так что W ⊆ hXi. Обратно, заметим, что W является подпространством V . Дей ствитель‐
но, если u = λ1 u1 + . . . + λn un ∈ W и v = µ1 v1 + . . . + µm vm ∈ W (где ui , vj ∈ X), то для
любых λ, µ ∈ F линей ная комбинация
λu + µv = (λλ1 )u1 + . . . + (λλn )un + (µµ1 )v1 + . . . + (µµm )vm ∈ W.
При этом ясно, что X ⊆ W , так что W является одним из пересекаемых подпространств в
определении hXi, откуда hXi ⊆ W .
Предложение 4.2.7. Если V конечномерно и U 6 V , то U тоже конечномерно и dim(U ) 6
dim(V ).
Доказательство. Если u1 , . . . , um — линей но независимый набор векторов U , то он продол‐
жается до некоторого базиса пространства V , и поэтому m 6 dim(V ). Значит, U конечно‐
мерно, а тогда оценка на размер всех линей но независимых наборов дает оценку на размер
максимального, то есть dim(U ) 6 dim(V ).
Предложение 4.2.8. Если U 6 V и dim(U ) = dim(V ) < ∞, то U = V .
Доказательство. Если u1 , . . . , un — базис U , то он является также и базисом V (иначе его
можно было бы продолжить до базиса V , и получился бы базис V размера большего, чем
dim(V )). Но так как hu1 , . . . , un i = U , то U = V .
Пересечение подпространсв является подпространством, а вот объединение обычно под‐
пространством не является (простей ший пример — пара прямых на плоскости). Для подпро‐
странств операцией , двой ственной пересечению, является сумма.
P
Определение 4.2.9. Если {Ui }i∈I — семей ство подпространств V , то i∈I Ui = h∪i∈I Ui i.
Иными словами X
Ui = {u1 + . . . + un | n ∈ N, uk ∈ Uik }.
i∈I
Наиболее важен случай |I| < ∞. Тогда можно определить напрямую
U1 + . . . + Un = {u1 + . . . + un | ui ∈ Ui }.
Легко проверить, что сумма подпространств является подпространством.
Теорема 4.2.10. Если U, V — подпространства некоторого объемлющего векторного про‐

странства, то
dim(U + V ) + dim(U ∩ V ) = dim(U ) + dim(V ).
Доказательство. Выберем базис w1 , . . . , wm подпространства U ∩ V . Его можно дополнить
векторами u1 , . . . , un до базиса U и векторами v1 , . . . , vk до базиса V . В частности, при таких
обозначения dim(U ) = m + n и dim(V ) = m + k. При этом объединенный набор
w1 , . . . , w m , u 1 , . . . , u n , v 1 , . . . , v k
является порождающим для U +V (любой элемент U +V является суммой u+v для каких‐то
u ∈ U и v ∈ V , которые оба выражаются через этот набор).
Покажем, что этот набор является линей но независимым. Предположим, что
λw1 + . . . + λm wm + µ1 u1 + . . . + µn un + η1 v1 + . . . + ηk vk = 0.
70
Тогда X X
η1 v1 + . . . + ηk vk = − λi wi − µi ui .
Заметим, что левая часть является элементом V , а права элементом U . Тогдв обе они лежат
в U ∩ V , в частности,
η1 v1 + . . . + ηk vk = θ1 w1 + . . . + θm wm
для каких‐то коэффициентов θi . Но тогда
X X
θ1 w1 + . . . + θm wm = − λi wi − µi ui
— линей ная зависимость на линей но независимый набор векторов w1 , . . . , wm , u1 , . . . , un .

Она должна быть тривиальной , так что, в частности, µ1 = . . . = µn = 0. Но тогда пред‐
положение о линей ной зависимости набора w1 , . . . , wm , u1 , . . . , un , v1 , . . . , vk превращается в
утверждение о линей ной зависимости набор w1 , . . . , wm , v1 , . . . , vk , противоречие.
Суммируя размеры базисов — (m + n + k) + m и (m + n) + (m + k) — получаем утверждение
теоремы.
Замечание 4.2.11. Наивное обобщение этого утверждения на сумму большего количества
пространств неверно. А именно, в общем случае
dim(U + V + W ) 6= dim(U ) + dim(V ) + dim(W )

− dim(U ∩ V ) − dim(U ∩ W ) − dim(V ∩ W )
+ dim(U ∩ V ∩ W ).
Простей ший пример — три прямых на плоскости.

Определение 4.2.12. Сумма подпространств U1 +. . .+Un называется прямой (обозначается
U1 ⊕ . . . ⊕ Un ), если для любых u1 ∈ U1 , . . . , un ∈ Un равенство u1 + . . . + un = 0 влечет
u1 = . . . = un = 0.
Предложение 4.2.13. Пусть V = U1 + . . . + Un . Следующие утверждения эквивалентны:
1. V = U1 ⊕ . . . ⊕ Un ;
2. Для любого v ∈ V существуют единственные такие u1 ∈ U1 , . . . , un ∈ Un , что v =
u1 + . . . + un ;
P
3. Ui ∩ j̸=i Uj = 0 для любого i.
Доказательство. (1) ⇒ (2): Пусть v = u1 + . . . + un = u′1 + . . . + u′n — два таких разложения.

Но тогда (u1 − u′1 ) + . . . + (un − u′n ) = 0, причем ui − u′i ∈ Ui , так что все разности равны 0.
(2) ⇒ (3): Для упрощения обозначений будем считать, что i = 1. Предположим, что на‐
шелся ненулевой вектор u ∈ U1 ∩ (U2 + . . . + Un ). Но тогда для u существуют два различных
разложения в суммы элементов U1 , . . . , Un :
u = u + 0 + . . . + 0, u = 0 + u2 + . . . + un .
(3) ⇒ (1): Предположим, что нашлись такие u1 ∈ U1 , . . . , un ∈ Un , не все нулевые (скажем,

6 0), что u1 + . . . + un = 0. Тогда u1 = −u2 − . . . − un ∈ U2 + . . . + Un .
u1 =
Следствие 4.2.14. V = U1 ⊕ U2 ⇔ V = U1 + U2 и U1 ∩ U2 = 0.
71
Следствие 4.2.15. Если V = U1 + . . . + Un и dim(V ) = dim(U1 ) + . . . + dim(Un ), то сумма
прямая.
Доказательство. В случае n = 2 это прямо следует из Теоремы 4.2.10. В общем случае это
легко доказывается индукцией , так как U1 + . . . + Un = U1 + (U2 + . . . + Un ).
С каждой парой (V, U ) из векторного пространства V и подпространства U 6 V связано
еще одно важное векторное пространство, элементами которого являются параллельные
сдвиги U .
Определение 4.2.16. Пусть U 6 V . Рассмотрим следующее отношение эквивалентности на
V:
u ∼ v ⇔ u − v ∈ U.
Тогда фактор‐множество V /∼ относительно операций
[u] + [v] = [u + v], λ · [u] = [λu]
называется фактор‐пространством V по U и обозначается V /U .

Предложение 4.2.17. Фактор‐пространство определено корректно и является векторным
пространством.
Доказательство. Начнем с проверки того, что ∼ является отношением эквивалентности.
Рефлексивность: u − u = 0 ∈ U , так что u ∼ u. Симметричность: если u − v ∈ U , то v − u =
−(u − v) ∈ U . Транзитивность: если u − v ∈ U и v − w ∈ U , то u − w = (u − v) + (v − w) ∈ U .
Далее проверим корректность операций на V /∼. Дей ствительно, если u1 ∼ u2 и v1 ∼ v2 ,
то u1 = u2 + u и v1 = v2 + v для некоторых u, v ∈ V . Но тогда u1 + v1 = (u2 + v2 ) + (u + v),
то есть (u1 + v1 ) − (u2 + v2 ) ∈ U и u1 + v1 ∼ u2 + v2 . Аналогично для умножения на скаляр:
λu1 = λu2 + λu, а тогда λu1 ∼ λu2 .
Все свой ства в определении векторного пространства наследуются со свой ств V .
Элементами фактор‐пространства V /U являются аффинные подпространства, параллель‐
ные U , то есть подмножества вида v + U = {v + u | u ∈ U }. В частности, нулем пространства
V /U служит U .
Предложение 4.2.18. dim(V /U ) = dim(V ) − dim(U ).
Доказательство. Пусть u1 , . . . , um — базис U . Дополним его векторами vm+1 , . . . , vn до ба‐

зиса V , тогда набор векторов
vm+1 + U, . . . , vn + U
является порождающим для V /U (так как если v = λ1 u1 + . . . + λm um + λm+1 vm+1 , . . . + λn vn ,
то v + U = λm+1 vm+1 + . . . + λn vn + U ). С другой стороны, этот же набор является линей но
независимым. Дей ствительно, если µm+1 vm+1 + . . . + µn vn + U = U , то µm+1 vm+1 + . . . +
µn vn является элементом U , а тогда выражается в виде линей ной комбинации u1 , . . . , um ,
что противоречит выбору vi .
4.3 Линейные отображения и матрицы

Определение 4.3.1. Пусть U и V — векторные пространства над полем F . Отображение
φ : U → V называется линейным, если для любых u, v ∈ U и λ, µ ∈ F имеется равенство
φ(λu + µv) = λφ(u) + µφ(v).
72
1. Если V — евклидово пространство, то повороты вокруг начала координат O, отраже‐
ния относительно прямых, прходящих через O, а также растяжения — линей ные отоб‐
ражения V → V .
2. Умножение на комплексное число v 7→ zw и комплексное сопряжение z 7→ z — линей ‐
ные отображения C → C как векторным пространств над R.
3. Дифференцирование f 7→ f ′ — линей ное отображение F [x]6d → F [x]6d−1 .
4. Если c ∈ F , то эвалюация f 7→ f (c) — линей ное отображение F [x] → F .
5. Если U 6 V , то отображение вложения U → V — линей ное. Проекция v 7→ v + U —
линей ное отображение V → V /U .
6. Если e1 , . . . , en — базис V , то отображение v 7→ ve — линей ное из V в F n .
Обозначение 4.3.3. Множество всех линей ных отображений из U в V будем обозначать
Hom(U, V ). Если требуется подчеркнуть, что U и V рассматриваются как векторные про‐
странства над полем F , будем писать HomF (U, V ).
Замечание 4.3.4. Композиция линей ных отображений — линей ное отображение.
Поскольку мы уже установили, что всякое конечномерное векторное пространство мож‐
но отождествить с пространством столбцов, для выяснения структуры всех линей ных отоб‐
ражений полезно выяснить, как устроены линей ные отображения между пространствами
столбцов.
Рассмотрим семей ство линей ных отображений πi : F m → F , задаваемое правилом
πi (a1 , . . . , am ) = ai .
Тогда если φ : F n → F m — линей ное отображение, то πi ◦ φ : F n → F — тоже линей ное. С

другой стороны, если φ1 , . . . , φm : F n → F — семей ство линей ных отображений , то отобра‐
жение
v 7→ φ1 (v), . . . , φm (v) : F n → F m
тоже линей ное. Вместе эти два наблюдения показывают, что всякое линей ное отображение
F n → F m конструируется указанным выше способом из m линей ных отображений F n → F .
Выясним теперь, как устроены линей ные отображения φ : F n → F . Обозначим
ei = (0, . . . , 0, 1, 0, . . . , 0),
где 1 стоит на i‐й позиции, и обозначим ai = φ(ei ). Тогда для произвольного вектора v =
(x1 , . . . , xn ) выполнено v = x1 e1 + . . . + xn en и в силу линей ности φ
φ(v) = φ(x1 e1 + . . . + xn en ) = x1 φ(e1 ) + . . . + xn φ(en ) = a1 x1 + . . . + an xn .
Итого линей ное отображение F n → F однозначно задается набором скаляров (a1 , . . . , an ).

Введем более удобный способ работать с так задаваемыми линей ными отображениями.
С этого момента нам будет важно различать пространства строк и столбцов. Будем запи‐
сывать векторы‐строки в виде (x1 , . . . , xn ), а соответствующее пространство обозначать n F .
Векторы‐столбцы будем записывать либо в виде столбцов, либо в виде (x1 , . . . , xn )⊤ — это
обозначение вскоре обретет дополнительный более общий смысл. Пространство столбцов,
как и ранее, будем обозначать F n .
73
Определение 4.3.5. Пусть a = (a1 , . . . , an ) ∈ n F , а b = (b1 , . . . , bn ) ∈ F n . Тогда произведени‐
ем строки a на столбец b будем называть скаляр a1 b1 + a2 b2 + . . . + an bn ∈ F .
В таких терминах рассуждения выше доказывают следующее
Предложение 4.3.6. Все отображения F n → F являются отображениями умножения слева
на строку из n F .
Возвращаясь к отображениям F n → F m , мы с учетом изложенного выше получаем, что

такое отображение задается как набор из m отображений F n → F , где каждое из них зада‐
ется строкой из n F . Итого линей ное отображение F n → F m задается набором из m строк
длины n.
Определение 4.3.7. Матрицей размера m × n называется набор скаляров ai,j , занумерован‐
ных парой индексов i = 1, . . . , m, j = 1, . . . , n.
Обозначение 4.3.8. Традиционно матрицы записывают в виде таблицы, где элемент ai,j
стоит на пересечении i‐й строки и j‐го столбца. Будем обозначать i‐ю строку ai,∗ , а j‐й стол‐
бец a∗,j (то есть ∗ означает, что в качестве соответствующего индекса берутся все возмож‐
ные значения). Множество матриц размера m × n над полем F будем обозначать M (m, n, F ).
В случае m = n это обозначение будет сокращаться до M (n, F ).
Определение 4.3.9. Произведением матрицы A = (ai,j ) и столбца b = (b1 , . . . , bn )⊤ ∈ F n
называется столбец высоты m, у которого в позиции i стоит произведение i‐й строки A на
столбец b, то есть
Ab = (a1,∗ b, a2,∗ b, . . . , am,∗ b)⊤ .
В таких обозначениях получается, что всякое линей ное отображение F n → F m это отоб‐
ражения умножения слева на матрицу из M (m, n, F ).
Замечание 4.3.10. Если линей ное отображение φ : F n → F m задается матрицей A = (ai,j ) ∈
M (m, n, F ), то ее столбцы есть в точности образы элементов естественного базиса ei про‐
странства F n , то есть a∗,j = φ(ej ).
Доказательство. Дей ствительно, если ei = (0, . . . , 0, 1, 0, . . . , 0)⊤ , то ai,∗ ej = ai,j . Тогда по

определению
φ(ej ) = Aej = (a1,∗ ej , . . . , am,∗ ej )⊤ = (a1,j , . . . , am,j )⊤ = a∗,j .
Следствие 4.3.11. Такое споставление Hom(F n , F m ) → M(m, n, F ) является биективной

функцией .
Доказательство. Столбцы матрицы, задающей линей ное отображение, определены одно‐
значно и для различных линей ных отображений различаются, так что отображение инъек‐
тивно. С другой , каждая матрица задает какое‐то линей ное отображение, так что оно сюръ‐
ективно.
Выясним теперь, как это описание линей ных отображений между пространствами столб‐
цов переносится на произвольное конечномерное векторное пространство при отождеств‐
лении посредством выбора базиса.
Пусть e1 , . . . , en — базис U , f1 , . . . , fm — базис V , а φ : U → V — линей ное отображение.
Обозначим через βe : U → F n и βf : V → F m линей ные отображения, сопоставляющие век‐
торам U и V их столбцы координат в базисах e и f соответственно, то есть βe (u) = ue и
74
βf (v) = vf . Тогда, как мы уже выяснили, βe обратимо и βe−1 тоже линей ное. Тогда компози‐
ция линей ных отображений
α = βf ◦ φ ◦ βe−1 : F n → F m
является линей ным отображением между пространствами столбцов, и потому является до‐
множением на некоторую матрицу A ∈ M (m, n, F ), то есть α(b) = Ab. Отсюда получаем
равенство функций α ◦ βe = βf ◦ φ, что в применении к вектору u ∈ U дает
(α ◦ βe )(u) = (βf ◦ φ)(u),

α(βe (u)) = βf (φ(u)),
α(ue ) = (φ(u))f ,
A · ue = (φ(u))f .
Иными словами, чтобы най ти столбец координат вектора φ(u) относительно базиса f , надо
домножить столбец координат вектора u относительно базиса e на некоторую однозначно
определенную матрицу.
Определение 4.3.12. Пусть φ : U → V — линей ное отображение, а e1 , . . . , en и f1 , . . . , fm —
базисы U и V . Тогда матрица A ∈ M (m, n, F ) называется матрицей линейного отображения
φ относительно пары базисов e и f , если для любого u ∈ U выполнено A · ue = (φ(u))f .
Обозначение 4.3.13. A = φe,f , то есть φe,f ue = φ(u)f .
Замечание 4.3.14. Если A = φe,f , то столбцы A это столбцы координат образов базисных
векторов, то есть A∗,j = φ(ej )f .
Обозначение 4.3.15. Наиболее важным случаем являются линей ные отображения φ : V →
V . В таком случае в V можно выбрать один базис e1 , . . . , en и называть φe,e матрицей отоб‐
ражения φ относительно базиса e и обозначать ее φe .
1. Пусть V — евклидова плоскость, а e1 , e2 — стандартный базис (то есть e1 ⊥ e2 ). Пусть
φ : V → V — отображение поворота вокруг начала координат на угол θ.
e2
sin θ φ(e1 )
φ(e2 )
e1
cos θ
Несложно вычислить координаты образа e1 и e2 под дей ствием φ. Дей ствительно, по

определению тригонометрических функций

cos θ − sin θ cos θ − sin θ
φ(e1 )e = , φ(e2 )e = , φe = .
sin θ cos θ sin θ cos θ
75
2. Пусть V = C — векторное пространство над R. Относительно базиса 1, i матрица отоб‐
ражения умножения на комплексное число z = a + bi имеет вид

a −b
,
b a
так как z · 1 = a + bi и z · i = −b + ai.

Как и сопоставление вектору столбца его координат, сопоставление линей ному отобра‐
жению матрицы сохраняет дополнительные структуры.
Для начала заметим, что множество Hom(U, V ) всех линей ных отображений из U в V само
является векторным пространством относительно поточечных операций сложения и умно‐
жения на скаляр, то есть
(φ + ψ)(u) = φ(u) + ψ(u), (λ · φ) = λ · (φ(u)).
Разумеется, как частный случай Hom(F n , F m ) тоже является векторным пространством. При
этом, как мы уже знаем, линей ные отображения F n → F m это в точности домножения на
матрицы из M(m, n, F ). Выясним, как указанные операции выражаются в терминах матриц.
Столбцы матрицы A это в точности образы векторов стандартного базиса F n , так что
поточечная сумма φ + ψ переводит базисный вектор ej в сумму образов φ(ej ) + ψ(ej ), то
есть матрица, отвечающая сумме отображений составлена из сумм столбцов соответствую‐
щих матриц. Поскольку столбцы складываются покомпонентно, сумме отображений отвеча‐
ет сумма матриц: если A, B ∈ M(m, n, F ), то (A+B)i,j = Ai,j +Bi,j . Аналогично, домножение
на скаляр реализуется покомпонентным умножением: (λ · A)i,j = λ · Ai,j .
В общем случае те же соображения показывают, что относительно базисов e и f пространств
U иV
(φ + ψ)e,f = φe,f + ψe,f , (λ · φ)e,f = λ · φe,f .
Это означает, что выбор пары базисов e, f задает линей ное отображение
φ 7→ φe,f : Hom(U, V ) → M(dim(V ), dim(U ), F ),
причем это отображение является обратимым — то есть каждая матрица задает некоторое
линей ное отображение.
Линей ные отображения обладают еще одной структурой — можно находить их компози‐
ции. А именно, если U, V, W — три векторных пространства, а φ ∈ Hom(U, V ) и ψ ∈ Hom(V, W ),
то определена композиция ψ ◦ φ ∈ Hom(U, W ).
Пусть e, f, g — базисы пространств U, V, W . Выясним, как най ти матрицу (ψ ◦ φ)e,g . В пози‐
ции (i, j) у этой матрицы стоит i‐я координата образа ej в базисе g. Но

(ψ ◦ φ)(ej ) = ψ φ(ej ) = ψf,g · φ(ej ) f = ψf,g · φe,f ∗,j .
g g
Получается, что в позиции (i, j) матрицы (ψ ◦ φ)e,g стоит произведение i‐й строки ψf,g и j‐
го столбца матрицы φe,f . Заведем для матрицы, составленной таким образом, специальное
определение.
Определение 4.3.17. Пусть A ∈ M(m, n, F ), B ∈ M(n, k, F ). Произведением матриц A и B

называется такая матрица A · B ∈ M(m, k, F ), что (A · B)i,j = Ai,∗ · B∗,j . Иными словами
A · B = C, где Ci,j = Ai,1 B1,j + Ai,2 B2,j + . . . + Ai,n Bn,j .
76
Итого мы показали, что
(ψ ◦ φ)e,g = ψf,g · φe,f .
Следствие 4.3.18. Умножение матриц ассоциативно.
Доказательство. Умножение матриц соответствует композиции соответствующих линей ‐
ных отображений (достаточно рассматривать отображения между пространствами столб‐
цов), а композиция ассоциативна.
1. Отображению v 7→ 0 соответствует матрица, составленная из нулей (нулевая матрица).
Это отображение и эта матрица служат ней тральными элементами по сложению для
Hom(U, V ) и M(m, n, F ).
2. Отображению id : v 7→ v соответствует матрица, составленная из столбцов стандартно‐
го базиса пространства столбцов. Иными словами, в позиции (i, j) в ней стоит 1, если
i = j, и 0 в ином случае. Такая матрица называется единичной и обозначается I (ес‐
ли требуется явно указать размер, то In ). Это отображение и эта матрица служат ней ‐
тральным элементов относительно композиции в Hom(V, V ) и умножения в M(n, F )
соответственно.
Замечание 4.3.20. Множество матриц M(n, F ) относительно сложения и умножения матриц
образует ассоциативное кольцо с 1. Это кольцо не является коммутативным в случае n > 1.
Доказательство. Дей ствительно, все свой ства кольца уже либо были проверены выше, ли‐
бо сразу следуют из соответствия между матрицами и линей ными отображениями. Ожидать
от объектов, кодирующих функции относительно композиции, коммутативности было бы
странно. Однако некоммутативность для матриц такова, что произведение в одном порядке
может быть ненулевым, а в другом нулевым, например

1 0 0 1 0 1 0 1 1 0 0 0
= , = .
0 0 0 0 0 0 0 0 0 0 0 0
Определение 4.3.21. Пусть A ∈ M(n, F ). Матрицей , обратной к A, называется элемент, об‐

ратный по умножению к A (если такой существует). Обозначение: A−1 .
Замечание 4.3.22. Матрица обратима тогда и только тогда, когда задаваемое ею линей ное
отображение обратимо. При этом обратное отображение тоже является линей ным, а обрат‐
ная матрица есть матрица обратного отображения.
Доказательство. Пусть φ ∈ Hom(V, V ) обратимо. Тогда оно биективно и для любых v1 , v2 ∈
V най дутся такие u1 , u2 ∈ V , что vi = φ(ui ). Тогда для обратного преобразования выполнено

φ−1 (λ1 v1 + λ2 v2 ) = φ−1 λ1 φ(u1 ) + λ2 φ(u2 )

= φ−1 φ(λ1 u1 + λ2 u2 )
= λ1 u1 + λ2 u2
= λ1 φ−1 (v1 ) + λ2 φ−1 (v2 ).
Определение 4.3.23. Ядром линей ного отображения φ ∈ Hom(U, V ) называется Ker(φ) =

{u ∈ U | φ(u) = 0}, то есть прообраз 0.
Замечание 4.3.24. Ker(φ) 6 U .
77
Доказательство. Если u, v ∈ Ker(φ) и λ, µ ∈ F , то φ(λu + µv) = λφ(u) + µφ(v) = λ0 + µ0 = 0,
так что λu + µv ∈ ker(φ).
Предложение 4.3.25. φ ∈ Hom(U, V ) инъективно тогда и только тогда, когда Ker(φ) = 0.
Доказательство. Если φ инъективно, то у 0 не больше одного прообраза, причем φ(0) = 0,
так что Ker(φ) = 0.
Обратно, пусть Ker(φ) = 0. Если φ(u) = φ(v), то φ(u − v) = φ(u) − φ(v) = 0, откуда u − v ∈
ker(φ) и −v = 0.
Предложение 4.3.26. Пусть dim(U ) = dim(V ), φ ∈ Hom(U, V ). Отображение φ инъективно
тогда и только тогда, когда оно сюръективно.
Доказательство. Заметим, что инъективное линей ное отображение никакой ненулевой век‐
тор не переводит в 0, так что любая нетривиальная линей ная комбинация элементов базиса
не переходит в 0. При этом линей ная комбинация переходит в линей ную комбинацию, так
что свой ство линей ной независимости сохраняется, и базис переходит в базис — в частно‐
сти, остается порождающим семей ством, так что отображение также сюръективно.
Если отображение φ сюръективно, то у каждого вектора есть прообраз — в частности, у
всех векторов какого‐нибудь базиса. Но тогда эти прообразы образую линей но независимый
набор (раз их образы линей но независимы), который в силу своего размера является бази‐
сом. Если какая‐то их линей ная комбинация переходит в 0, то соответствующая линей ная
комбинация образов равна 0, что противоречит их линей ной независимости.
Замечание 4.3.27. Линей ное отображение φ ∈ Hom(V, V ) обратимо слева тогда и только
тогда, когда оно обратимо справа. В частности, для квадратных матриц A, B, C если AB =
AC = I или BA = CA = I, то B = C.
Доказательство. φ обратимо слева тогда и только тогда, когда, то оно инъективно, и обра‐
тимо справа тогда и только тогда, когда сюръективно.
Определение 4.3.28. Пусть A ∈ M(m, n, F ). Транспонированной матрицей для матрицы A
называется A⊤ ∈ M(n, m, F ), задаваемая по правилу (A⊤ )i,j = Aj,i .
В частности, если рассматривать столбцы из F n и строки из n F как матрицы n × 1 и 1 × n
соответственно, то транспонирование переводит столюцы в строки и наоборот.
1. Если A, B ∈ M(m, n, F ), то (A + B)⊤ = A⊤ + B ⊤ .
2. Если A ∈ M(m, n, F ) и λ ∈ F , то (λA)⊤ = λA⊤ .
3. Если A ∈ M(m, n, F ) и B ∈ M(n, k, F ), то (AB)⊤ = B ⊤ A⊤ .
4. Если A ∈ M(n, F ) обратима, то A⊤ тоже обратима и (A−1 )⊤ = (A⊤ )−1 .
Доказательство. Первые два свой ства очевидны.
Докажем второе. В позиции (i, j) матрицы (AB)⊤ стоит
(AB)j,i = Aj,1 B1,i + . . . + Aj,n Bn,i ,
⊤ ⊤
в то время как у B A на той же позиции
⊤ ⊤ ⊤
Bi,1 A1,j + . . . + Bi,n A⊤
n,j = B1,i Aj,1 + . . . + Bn,i Aj,n ,
что является тем же самым выражением.

Формула для обратной матрицы:
A⊤ (A−1 )⊤ = (A−1 A)⊤ = I ⊤ = I.
78
4.4 Матрица перехода между базисами
Пусть теперь в пространстве V выюраны два базиса e1 , . . . , en и f1 , . . . , fn . Выясним, как свя‐
заны для произвольного вектора v столбцы координат ve и vf .
Обозначим β : V → F n и γ : V → F n линей ные отображения β(v) = ve и γ(v) = vf . Оба
эти отображения обратимы, обратные линей ны, так что линей ная композиция δ = γ ◦ β −1 .
С другой стороны, для произвольного вектора v ∈ V выполнено δ(ve ) = vf , то есть соответ‐
ствие между столбцами координат в разных базисах реализуется линей ным оотображением
из Hom(F n , F n ). Это отображение задается матрицей C ∈ M(n, F ), то есть для любого v ∈ V
имеет место равенство Cve = vf . Ясно, как построить такую матрицу C — ее столбцы это
образы векторов стандартного базиса F n . При отображении β −1 это векторы переходят в
векторы базиса e1 , . . . , en , а их образ под дей ствием γ это (e1 )f , . . . , (en )f . Иными словами,
C∗,i = (ei )f .
Определение 4.4.1. Матрицей перехода между базисами e1 , . . . , en и f1 , . . . , fn пространства
V называется такая матрица Ce→f ∈ M(n, F ), что для любого вектора v ∈ V выполнено
Ce→f ve = vf . Столбцы этой матрицы — столбцы координат векторов базиса e в базисе f .
1. Если e, f, g — три базиса V , то Ce→g = Cf →g Ce→f .
−1
2. Матрица перехода Ce,f обратима, и Ce,f = Cf,e .
Доказательство. Cf →g Ce→f ve = Cf →g vf = vg . Второе свой ство следует из обратимости
отображений соспоставления вектору столбца координат вместе с первым утверждением и
тем, что Ce→e = I.
Выясним теперь, как меняется матрица линей ного отображения при замене базисов.
Предложение 4.4.3. Пусть φ ∈ Hom(U, V ), e, e′ — базисы U , а f, f ′ — базисы V . Тогда
φe′ ,f ′ = Cf →f ′ φe,f Ce′ →e .
Доказательство. Для произвольного u ∈ U выполнено φe,f · ue = φ(u)f . При этом ue =

Ce′ →e · ue′ , а для произвольного v ∈ V выполнено Cf ′ →f · vf ′ = vf , в том числе для v = φ(u).
Подставляя эти выражения в соотношение выше, получаем
φe,f · Ce′ →e · ue′ = Cf ′ →f · vf ′ ,
что после домножения слева на Cf →f ′ дает
Cf →f ′ φe,f Ce′ →e · u′e = φ(u)f ′ .
Это соотношение является характеристическим свой ством матрицы φe′ ,f ′ , откуда в силу ее
единственности получаем требуемое утверждение.
−1
Следствие 4.4.4. Если φ ∈ Hom(V, V ), а e, f — базисы V , то φf = Ce→f φe Ce→f = Cf−1
→e φe Cf →e .
Покажем теперь, что при подходящем выборе базисов e и f матрица линей ного отображе‐
ния φe,f может принимать особенно простой вид.
79
Предложение 4.4.5 (Канонический вид матрицы линей ного отображения). Для любого φ ∈
Hom(U, V ) най дутся такой базис e пространства U и такой базис f пространства V , что φe,f
имеет вид
Ik 0
∈ M(dim V, dim U, F ).
0 0
для некоторого k ∈ Z>0 , а блоки из нулей имеют соответствующие размеры.
Доказательство. Выберем v1 , . . . , vm — базис Ker(φ) (возможно, пустой , если φ инъектив‐
но), а затем дополним его векторами u1 , . . . , uk до базиса U . Базисом e будет служить набор
u1 , . . . , uk , v1 , . . . , vm . Затем положим fi = φ(ei ) при i = 1, . . . , k — это линей но независимый
набор (так как на he1 , . . . , ek i отображение φ инъективно и потому сохраняет линей ную неза‐
висимость). Дополним его какими‐то векторами fk+1 , . . . , fdim V до базиса. Тогда φe,f имеет
искомый вид.
4.5 Образ и ранг

Определение 4.5.1. Образом линей ного отображения φ ∈ Hom(U, V ) будем называть ее об‐
ласть значений , то есть Im(φ) = {φ(u) | u ∈ U }.
Предложение 4.5.2. Im(φ) 6 V .
Доказательство. Если v1 , v2 ∈ Im(φ), то существуют такие u1 , u2 ∈ U , что vi = φ(ui ). Но
тогда λ1 v1 + λ2 v2 = φ(λ1 u1 + λ2 u2 ) ∈ Im(φ).
Замечание 4.5.3. φ(hXi) = hφ(X)i, в частности, Im(φ) порождается образом любого порож‐
дающего набора.
Определение 4.5.4. Рангом линей ного отображения φ называется размерность его образа:
rk(φ) = dim Im(φ).
Определение 4.5.5. Столбцовым рангом матрицы A ∈ M(m, n, F ) называется ранг соответ‐
ствующего линей ного отображения, то есть rk(A) = dimhA∗,1 , . . . , A∗,n i. По аналогии, строч‐
ным рангом A называется dimhA1,∗ , . . . , Am,∗ i (как подпространства в n F ).
Лемма 4.5.6. Ранг линей ного отображения не меняется при композиции (слева или справа)
с обратимым линей ным отображением.
Доказательство. Обратимое линей ное отображение φ(V1 , V2 ) сохраняет размерность, то есть
для любого W 6 V1 выполнено dim φ(W ) = dim W (обратимое линей ное преобразование со‐
храняет линей ную независимость и переводит порождающий набор в порождающий набор
для образа, так что базис W переходит в базис φ(W )).
Пусть теперь φ ∈ Hom(U, V ), а α ∈ Hom(U ′ , U ) и β ∈ Hom(V, V ′ ) обратимы. Тогда для
θ = β ◦ φ ◦ α : U ′ → V ′ выполнено

dim θ(U ′ ) = dim (β ◦ φ ◦ α)(U ′ ) = dim β(φ(α(U ′ ))) = dim β(φ(U )) = dim φ(U ) .
Предложение 4.5.7. Строчный и столбцовый ранги матрицы совпадают.

Доказательство. Свяжем с матрицей A ∈ M(m, n, F ) два линей ных отображения:
LA : F n → F m : v 7→ Av, RA : m
F → n F : u 7→ uA.
Тогда столбцовый ранг A это ранг LA , а строчный равен rk(RA ).
80
Теперь воспользуемся Предложением 4.4.5 о каноническом виде линей ного отображения:
най дутся такие обратимые матрицы C ∈ M(m, F ) и D ∈ M(n, F ), что

Ik 0
CAD = .
0 0
Заметим теперь, что LCAD = LC LA LD и RCAD = RD RA RC , причем LC , LD , RC , RD обрати‐

мы. Значит, rk LA = rk LCAD и rk RA = rk RCAD . Но ранги rk LCAD = k = rk RCAD .
Определение 4.5.8. Рангом матрицы называется ее столбцовый или строчный ранг.
Теорема 4.5.9. Пусть φ ∈ Hom(U, V ). Тогда dim Ker(φ) + dim Im(φ) = dim(U ).
Доказательство. Обозначим n = dim(U ) и пусть e, f — базисы U и V , реализующие канони‐
ческий вид φ, то есть φe,f = I0k 00 . Иными словами, φ(e1 ), . . . , φ(ek ) линей но независимы, а
ek+1 , . . . , en — базис Ker(φ). Тогда dim Im(φ) = k, а dim Ker(φ) = n − k.
В дей ствительности эта теорема отвечает следующему обстоятельству. Рассмотрим отображение

u + Ker(φ) 7→ φ(u) : U / Ker(φ) → Im(φ).
Оно корректно определено и является линей ной биекцией . Теорема тогда следует из сравнения размерностей .
Предложение 4.5.10. Пусть φ ∈ Hom(U, V ) и ψ ∈ Hom(V, W ). Тогда

rk(ψ ◦ φ) 6 min rk(ψ), rk(φ) .
Доказательство. Заметим для начала, что для размерность векторного пространства под
дей ствием линей ного отображения не может возрасти. Например, dim(ψ(V ′ )) 6 dim(V ′ ) для
любого V ′ 6 V . В частности, для V ′ = φ(U ) получаем, что dim(ψ(φ(U ))) 6 dim(φ(U )), что
означает в точности rk(ψ ◦ φ) 6 rk(φ).
С другой стороны, так как φ(U ) 6 V , получаем ψ(φ(U )) 6 ψ(V ), так что dim(ψ(φ(U ))) 6
dim(ψ(V )), то есть rk(ψ ◦ φ) 6 rk(ψ).
4.6 Системы линейных уравнений

Под системой линей ных уравнений (СЛУ) мы будем понимать набор уравнений вида


 a1,1 x1 + . . . + a1,n xn = b1 ,


a2,1 x1 + . . . + a2,n xn = b2 ,
 ..

 .


am,1 x1 + . . . + am,n xn = bm
относительно набора переменных x1 , . . . , xn . Более компактно это можно записать в виде
Ax = b,
где A = (ai,j ) ∈ M(m, n, F ), b = (b1 , . . . , bm )⊤ ∈ F m , x = (x1 , . . . , xn )⊤ ∈ F n . Матрица A назы‐

вается матрицей системы линей ных уравнений , а матрица (A|b) ∈ M(m, n+1, F ) называется
расширенной матрицей системы.
СЛУ называется однородной, если b = 0, и неоднородной в противном случае.
Столбец v ∈ F n называется решением СЛУ, если Av = b.
Рассмотрим сначала случай однородной СЛУ.
81
Замечание 4.6.1. Решения однородной СЛУ образуют подпространство в F n .
Доказательство. Множество решений однородной СЛУ непусто, так как A0 = 0, то есть 0 —

решение. Если u, v ∈ F n — решения, то для любых λ, µ ∈ F столбец λu + µv тоже решение,
так как A(λu + µv) = λAu + µAv = 0.
Предложение 4.6.2. Размерность пространства решений однородной СЛУ с матрицей A ∈
M(m, n, F ) равна dim Ker(A) = n − rk(A).
Доказательство. Определение решения СЛУ и теорема о размерностях ядра и образа.
Обратимся теперь к структуре множества решений неоднородной системы Ax = b. Пусть
v1 , v2 — два решения. Тогда A(v1 −v2 ) = Av1 −Av2 = b−b = 0, то есть разность двух решений
неоднородной СЛУ это решение соответствующей однородной СЛУ. Это означает, что если
нашлось одно решение v0 , то все остальные из него получаются прибавлением элементов
Ker(A). Итого получаем слудеющее
Предложение 4.6.3. Пусть Av0 = b. Тогда множество решений СЛУ Ax = b имеет вид
v0 + Ker(A) = {v0 + v | v ∈ F n , Av = 0}.
Остается открытым вопрос, когда существует такой v0 . Рассмотрим внимательнее, что та‐
кое Ax при x = (x1 , . . . , xn )⊤ . По определению
Ax = x1 A∗,1 + . . . + xn A∗,n .
Тогда существование такого x, что Ax = b, эквивалентно тому, что b выражается в виде ли‐
ней ной комбинации столбцов матрицы A (иными словами, b ∈ Im(A)).
Теорема 4.6.4 (Кронекера—Капелли). СЛУ Ax = b имеет решение тогда и только тогда, ко‐
гда rk(A) = rk(A|b), то есть когда ранг матрицы системы равен рангу расширенной матрицы.
Доказательство. Рассмотрим пространства U = hA∗,1 , . . . , A∗,n i и V = hA∗,1 , . . . , A∗,n , bi.
Ясно, что U 6 V и оба утверждения эквивалентны тому, что U = V .
Предложение 4.6.5. Пусть A ∈ M(m, n, F ). Решение СЛУ Ax = b единственно (или не суще‐

ствует) тогда и только тогда, когда rk(A) = n.
Доказательство. Решение единственно тогда и только тогда, когда Ker(A) = 0. Это эквива‐
лентно тому, что линей ное отображение, отвечающее A, инъективно, то есть размерность
образа совпадает с размерностью области определения, rk(A) = n.
4.7 Элементарные преобразования

Определение 4.7.1. Стандартными матричными единицами называются матрицы eij , от‐
личающиеся от нулевой матрицы только в позиции (i, j), где стоит 1. Здесь подразумевается,
что размер матриц зафикисрован.
Замечание 4.7.2. Стандартные матричные единицы образуют базис P векторного простран‐
ства M(m, n, F ). Дей твительно, если A = (Aij ) ∈ M(m, n, F ), то A = i,j aij eij .
Рассмотрим некоторые особенно простые линей ные отображения на пространстве столб‐
цов и опишем соответствующие матрицы.
82
• Пусть ε ∈ F . Дилатацией называется преобразование di (ε) ∈ Hom(F n , F n ), дей ствую‐
щее по правилу
(x1 , . . . , xi , . . . , xn )⊤ 7−→ (x1 , . . . , εxi , . . . , xn )⊤ .
Отображение di (ε) обратимо тогда и только тогда, когда ε 6= 0, в таком случае обратное
отображение равно di (1/ε). Отображение di (ε) задается диагональной матрицей
I + (ε − 1)eii = e11 + . . . + εeii + . . . + enn .
• Перестановкой строк называется отображение wij , дей ствующее по правилу
(x1 , . . . , xi , . . . , xj , . . . , xn )⊤ 7−→ (x1 , . . . , xj , . . . , xi , . . . , xn )⊤
(меняются только два элемента). Отображение wij обратимо и является обратным к

самому себе. оно задается матрицей
I − eii − ejj + eij + eji .
• Элементарной трансвекцией называется преобразование tij (λ), i 6= j, дей ствующее по

правилу
(x1 , . . . , xi , . . . , xj , . . . , xn )⊤ 7−→ (x1 , . . . , xi + λxj , . . . , xj , . . . , xn )⊤ .

−1
Оно обратимо, tij (λ) = tij (−λ). Соответствующая матрица равна I + λeij .
Перечисленные выше три типа (обратимых) линей ных отображений называются элемен‐
тарными преобразованиями.
Рассмотрим матрицу A ∈ M(m, n, F ), составленную из столбцов a1 = A∗,1 , . . . , an = A∗,n ,
символически это можно записать в виде
A = (a1 | . . . |an ).
Тогда если C ∈ M(k, m, F ), то

CA = (Ca1 | . . . |Can ).
В частности, если C ∈ M(m, F ) — матрица элементарного преобразования, то домножение
на нее слева производит со строками матрицы A соответствующие дей ствия: домножает на
скаляр, переставляет, прибавляет одну к другой с коэффициентом.
Это соображение, кроме прочего, дает еще один простой способ восстановить вид матри‐
цы элементарного преобразования: если C — такая матрица, то C = CI, а CI находится как
применение указанных преобразований к строкам единичной матрицы.
С другой стороны, домножение на матрицу элементарного преобразования справа про‐
изводит аналогичные дей ствия со столбцами. Это можно увидеть, непосредственно прове‐
рив, как дей ствуют матрицы элементарных преобразований при домножении на них строки
справа. Альтернативный способ состоит в том, чтобы перей ти к транспонированным матри‐
цам:
⊤
AC = C ⊤ A⊤ ,
а C ⊤ — снова матрица элементарного преобразования.
83
4.8 Метод Гаусса
Опишем теперь один способ решать системы линей ных уравнений . Пусть СЛУ задается в
матричном виде
Ax = b,
где A ∈ M(m, n, F ), b ∈ F m , то есть имеется m уравнений от n переменных.
Заметим, что если C ∈ M(m, F ) обратима, то множества рашений систем Ax = b и (CA)x =
Cb совпадают. Дей ствительно, для произвольной C∈ M(m, F ) из Ax = b следует (CA)x = Cb,
остается применить это же наблюдение к C −1 и СЛУ (CA)x = Cb.
Мы будем упрощать матрицу A посредством элементарных преобразований строк, что,
как мы видели, реализуется в виде домножения на некоторые обратимые матрицы слева.
Лемма 4.8.1. Ненулевой столбец a ∈ F m можно элементарными преобразованиями приве‐

сти к виду (1, 0, . . . , 0)⊤ .
Доказательство. Раз столбец ненулевой , в нем най дется ненулевой элемент ai . Применяя
w1,i , получаем столбец a′ с ненулевым первым элементом. Дей ствуя d1 (1/a′1 ), делаем этот
элемент равным 1. Затем последовательно домножая на ti,1 (−a′i ), i = 2, . . . , m, получаем ис‐
комый столбец (1, 0, . . . , 0)⊤ .
Лемма 4.8.2. Матрицу A 6= 0 можно привести элементарными преобразованиями к трапе‐
циевидной форме, то есть такой , что в каждой строке имеется такой ненулевой элемент (на‐
зываемый ведущим), что во всех позициях левее и/или ниже его стоят нули, а все нулевые
строки расположены в нижней части матрицы. При этом ведущие элементы можно сделать
равными 1.
Доказательство. Так как A 6= 0, най дется ненулевой столбец с наименьшим номером j. По
предыдущей лемме его можно сделать при помощи элементарных преобразований равным
(1, 0, . . . , 0)⊤ . Так как j наименьший , все столбцы слева от него нулевые, то есть в позиции
(1, j) стоит ведущий элемент. Теперь рассмотрим подматрицу A′ , полученную из A вычер‐
киванием первой строки. К ней можно применить те же рассуждения, причем применяемые
линей ные преобразования не будут затрагивать первую строку матрицы A, а все нулевые
столбцы останутся нулевыми. Если матрица A′ приведена к трапециевидной форме, то и
матрица A трапециевидная. Если же A′ оказалась нулевой , то делать ничего не надо и мат‐
рица A уже какая требуется.
Лемма 4.8.3. Матрицу A 6= 0 можно привести к строчной эшелонированной форме, то есть к
трапециевидной форме, где выше каждого ведущего элемента расположены только нули.
Доказательство. Если A приведена к трапециевидной форме с единицами в качестве ве‐
дущих элементов, то прибавления вверх позволяют обнулить все элементы, стоящие над
ними.
Построенная процедура приведения матрицы к строчной эшелонированной форме позво‐
ляет решать СЛУ. Этот способ называется методом Гаусса.
Предложение 4.8.4. Пусть расширенная матрицы СЛУ (A|b) приведена к строчной эшело‐
нированной форме. Обозначим через J = {j1 , . . . , jk } номера столбцов, в которых находятся
ведущие элементы, так что ведущие элементы находятся в позициях (1, j1 ), . . . , (k, jk ).
1. Система имеет решение тогда и только тогда, когда в последнем столбце нет ведущего
элемента.
84
2. Если решение (x1 , . . . , xn )⊤ существует, то оно имеет вид
X
xj произвольные при j ∈
/J и x j i = bi − ai,j xj .
j ∈J
/
j>ji
Доказательство. Если в последнем столбце есть ведущий элемент, то соответствующая стро‐

ка расширенной матрицы отвечает уравнению 0x1 +. . .+0xn = 1, которое не имеет решений .
Предположим теперь, что ведущего элемента в последнем столбце нет. Рассмотрим нену‐
левую строку с номером i. Она имеет вид
(0, . . . , 0, 1, ai,ji +1 , . . . , ai,n |bi )
и отвечает уравнению X
xji + ai,j xj = bi .
j>ji
При этом при j ∈ J, j > ji условие эшелонированности дает равенство ai,j = 0. С другой сто‐
роны, переменная xji участвует только в этом уравнении, так что определяется однозначно
по указанной в формулировке формуле.
Остается показать, что переменные xj , j ∈
/ J, могут принимать произвольные значения.
Дей ствительно, какие бы им ни были присвоены значения, уравнение, соответствующее i‐й
строке уравнение удовлетворяется, если положить xji равным значению, указанному в фор‐
мулировке.
Пусть A ∈ M(n, F ) — обратимая матрица. Сей час мы выясним, как использовать метод
Гаусса для нахождения A−1 .
Замечание 4.8.5. Если A ∈ M(n, F ) обратима, то rk(A) = n.
Доказательство. Если A обратима, то соответствующее линей ное отображение сюръектив‐
но, так что размерноость образа равна размерности области определения, то есть rk(A) =
n.
Замечание 4.8.6. Строчная эшелонированная форма обратимой матрицы равна единичной
матрице.
Доказательство. При приведении к строчной эшелонированной форме обратимость мат‐
рицы не нарушается (так как реализуется домножением на обратимые матрицы). У обрати‐
мой матрицы не может быть нулевых строк или столбцов (иначе ранг меньше размера). Зна‐
чит, количество ведущих элементов равно количеству строк и равно количеству столбцов.
Это возможно только если ведущие элементы стоят на диагонали, а тогда строчная эшело‐
нированная форма равна единичной матрице.
Предложение 4.8.7. Пусть A ∈ M(n, F ) обратима. Рассмотрим матрицу (A|In ) ∈ M(n, 2n, F ).
Ее строчная эшелонированная форма равна (In |A−1 ).
Доказательство. Пусть приведение A к строчной эшелонированной форме реализуется при
помощи обратимой матрицы C, тогда CA = In , то есть C = A−1 . Но тогда также C(A|In ) =
(CA|CIn ) = (In |C).
Следствие 4.8.8. Любая обратимая матрица представляется в виде произведения матриц
элементарных преобразований .
Доказательство. Из доказательства предыдущего предложения видно, что A−1 может быть
най дена в виде произведения матриц элементарных преобразований , скажем, A−1 = Ck ·. . .·
C1 . Но тогда A = C1−1 · . . . · Ck−1 , а Ci−1 — снова матрицы элементарных преобразований .
85
4.9 Перестановки
Обозначение 4.9.1. Обозначим n = {1, . . . , n}.
Определение 4.9.2. Перестановкой на n точках называется биекция множества X из n эле‐

ментов на себя. Обычно в качестве множества X выбирают n, и обозначают множество всех
перестановок X через
Sn = σ : n → n | σ — биекция .
Замечание 4.9.3. Sn является группой относительно композиции.
Доказательство. Ассоциативность имеет место, так как операция — композиция функций .

Ней тральным элементом выступает тождественное отображение, а обратный элемент су‐
ществут, так как всякая биекция обратима (и обратная функция — тоже биекция).
Композицию перестановок будем называть произведением (и обозначать соответствую‐
щим образом).
Определение 4.9.4. Числом инверсий inv(σ) перестановки σ ∈ Sn называется количество
таких пар (i, j) ∈ n2 , что i < j, но σ(i) > σ(j).
Определение 4.9.5. Знаком перестановки σ называется sgn(σ) = (−1)inv(σ) . Перестановки
знака 1 называются четными, а знака −1 нечетными.
Каким образом можно описывать перестановки? Простей ший способ записи — таблич‐
ный :
1 2 ... n
σ= .
σ(1) σ(2) . . . σ(n)
Простей шими нетривиальными перестановками являются транспозиции: биекции, меняю‐
щие местами два элемента, а все остальные оставляющие на месте. Будем обозначать τij
транспозицию, меняющую местами i и j. При записи τij мы всегда будем подразумевать, что
i 6= j.
Предложение 4.9.6. Пусть σ ∈ Sn . Тогда sgn(τij · σ) = − sgn(σ).

Доказательство. Если i и j соседние, то количество инверсий при композиции с τij меняет‐
ся ровно на 1, и четность меняется.
Для произвольных различных i, j обозначим через s количество лежащих между ними эле‐
ментов. Тогда τij может быть реализована как последовательность 2s + 1 транспозиций со‐
седних элементов: сначала переставляем i с соседними элементами, перемещая в сторону j,
затем переставляем i и j, после чего переставляем j со всеми промежуточными элементами.
Смена знака произвой дет нечетное число раз.
Предложение 4.9.7. Любая перестановка может быть записана в виде произведения транс‐
позиций .
Доказательство. Сортировка пузырьком.

Следствие 4.9.8. Если σ = τk . . . τ1 — произведение транспозиций , то sgn(σ) = (−1)k .
86
4.10 Определители
Определение 4.10.1. Определителем матриц размера n называется отображение
det : M(n, F ) → F,
удовлетворяющее следующим трем свой ствам:

1. Линей ность по столбцам, то есть для каждого i

det a1 | . . . |λai + µbi | . . . |an = λ · det a1 | . . . |ai | . . . |an + µ · det a1 | . . . |bi | . . . |an ;
2. Значение на матрице с двумя одинаковыми столбцами равно 0;

3. Значение на единичной матрице In равно 1.
Нашей ближай шей целью будет показать, что такое отображение существует и единствен‐
но.
Замечание 4.10.2. При перестановке двух столбцов определитель меняет знак.
Доказательство. Фиксируем все столбцы, кроме двух с номерами i и j, рассмотрим сужение
определителя на множество таких матриц и будем рассматривать его как функцию f от пары
столбцов. Из первых двух свой ств следует, что
0 = f (u + v, u + v) = f (u, u) + f (v, v) + f (u, v) + f (v, u) = f (u, v) + f (v, u).
Построим определитель рекуррентно. А именно, ясно, что для n = 1 имеется только один
способ:
det(a) = det(a · I1 ) = a · det(I1 ) = a.
Далее, предположим, что определитель для матриц размера n − 1 уже построен и положим
X
n
det(A) = (−1)1+j a1,j det(A1,j ),
j=1
где A1,j ∈ M(n − 1, F ) — матрица, полученная из A удалением первой строки и j‐го столбца.
Предложение 4.10.3. Эта конструкция удовлетворяет свой ствам определителя.
Доказательство. Линей ность достаточно проверять для каждого слагаемого отдельно. Пред‐
положим, что i‐й столбец A∗,i раскладывается в линеную комбинацию. Если i 6= j, то a1,j не
меняется, а det(A1,j зависит от i‐го столбца линей но. Если же i = j, то наоборот a1,j зависит
от i‐го столбца линей ной , а A1,j не меняется.
Пусть теперь у матрицы A столбцы с номерами i, j совпадают. Тогда
det(A) = (−1)1+i a1,i det(A1,i ) + (−1)1+j a1,j det(A1,j ),
потому что при k 6= i, j у матрицы A1,k имеется два одинаковых столбца, и соответствующее
слагаемое равно 0. Для определенности будем считать, что i < j. Тогда матрица A1,i получа‐
ется из матрицы A1,j последовательной перестановкой столбцов i и i + 1, i + 1 и i + 2, …, j − 2
и j − 1. Поэтому det(A1,i ) = (−1)j−i−1 det(A1,j ), а значит, det(A) = 0.
Третье свой ство проверяется непосредственно: det(In ) = 1 · det(In−1 ) = 1.
87
Предложение 4.10.4. Отображение определителя единственно.
Доказательство. Обозначим посредством e1 , . . . , en вектора стандартного базиса простран‐

ства столбцов F n и представим первый столбец матрицы A в виде следующей линей ной
комбинации:
A∗,1 = a1,1 e1 + a2,1 e2 + . . . + an,1 en .

Тогда по первому свой ству определителя для det(A) = det A∗,1 |A∗,2 | . . . |A∗,n выполнено

det(A) = a1,1 · det e1 |A∗,2 | . . . |A∗,n + . . . + an,1 · det en |A∗,2 | . . . |A∗,n
Рассмотрим теперь отдельное слагаемое ak,1 · det(ek |A∗,2 | . . . |A∗,n ). Можно точно таким же
образом разложить второй столбец, тогда
X
n

ak,1 · det ek |A∗,2 | . . . |A∗,n = ak,1 · ai,2 · det ek |ei |A∗,3 | . . . |A∗,n ,
i=1
причем слагаемое с i = k нулевое (дважды встречается столбец ek ).

Продолжая подобным образом, мы получаем, что det(A) выражается как сумма всех воз‐
можных слагаемых вида

ai1 ,1 ai2 ,2 . . . ain ,n · det ei1 |ei2 | . . . |ein ,
где все индексы набора i1 , . . . , in различны. Иными словами, для некоторой перестановки
σ ∈ Sn верно ij = σ(j), то есть
X
det(A) = aσ(1),1 . . . aσ(n),n det eσ(1) | . . . |eσ(n) .
σ∈Sn

Если σ = τk . . . τ1 — произведение транспозиций , то матрица eσ(1) | . . . |eσ(n) получается из
In последовательностью перестановок столбцов, отвечающих транспозициям τ1 , . . . , τk , так
что ее определитель равен (−1)k = sgn(σ). Итого получаем, что значение отображения det
на каждой матрице A определено однозначно.
Замечание 4.10.5. В дей ствительности мы доказали даже чуть более общее утверждение:
если функция матриц линей на по столбцам и обращается в ноль при равенстве двух столб‐
цов, то она определена однозначно с точностью до умножения на фиксированный скаляр,
равный значению на единичной матрице.
Полученная формула
X
det(A) = sgn(σ) · aσ(1),1 . . . aσ(n),n
σ∈Sn
называется формулой полного развертывания. Рассмотрим, что эта формула дает в случаях
n = 2 и n = 3.
В случае n = 2 существует только две перестановки двух элементов — тождественное
отображение и одна транспозиция, соответственно знаков 1 и −1. Тогда

a b

c d = ad − cb.
88
В случае n = 3 имеется 6 перестановок:
σ id τ12 τ13 τ23 ( 13 21 32 ) ( 12 23 31 )

sgn(σ) 1 −1 −1 −1 1 1
Применяя формулу полного развертывания, получаем

a11 a12 a13

a21 a22 a23 = a11 a22 a33 + a31 a12 a23 + a21 a32 a13 − a21 a12 a33 − a31 a22 a13 − a11 a32 a23 .

a31 a32 a33
4.11 Свойства определителя

Предложение 4.11.1. det(A⊤ ) = det(A).
Доказательство. Пусть A = (aij ) ∈ M(n, F ) и A⊤ = (bij ), bij = aji . Рассмотрим формулу
полного развертывания для A⊤ :
X
det(A⊤ ) = sgn(σ) · bσ(1),1 . . . bσ(n),n
σ∈Sn
X
= sgn(σ) · b1,σ−1 (1) . . . bn,σ−1 (n)
σ∈Sn
X
= sgn(σ) · aσ−1 (1),1 . . . aσ−1 (n),n = det(A).
σ∈Sn
Здесь мы воспользовались тем, что sgn(σ −1 ) = sgn(σ) (сочетание Следствия 4.9.8 и Замеча‐
ния 1.5.19).
Следствие 4.11.2. Формулу полного развертывания можно переписать следующим обра‐
зом: X
det(A) = sgn(σ) · a1,σ(1) . . . an,σ(n)
σ∈Sn
Следствие 4.11.3. При перестановке двух строк матрицы определитель меняет знак.
Доказательство. Перестановка строк матрицы может быть реализована как последователь‐
ность из транспонирования, перестановки столбцов и еще одного транспонирования.
Следствие 4.11.4 (Разложение определителя по строке и по столбцу).
X
n X
n
det(A) = (−1)i+j aij det(Aij ) = (−1)i+j aij det(Aij ),
j=1 i=1
где Aij получается из A удалением i‐й строки и j‐го столбца.

Доказательство. Применить конструкцию определителя (совпадающую с разложением по
первой строке) к матрице, полученной из данной переносом i‐й строки наверх (при пере‐
становке со строками с номерами i − 1, i − 2, …, 1 смена знака происходит i − 1 раз). Вторая
формула получается за счет Предложения 4.11.1.
Предложение 4.11.5. Определитель матрицы не меняется при применении к ней элемен‐
тарных трансвекций , то есть при прибавлении одного столбца к другому с коэффициентом
(аналогично для строк).
89

Доказательство. Пусть A = . . . |ai | . . . |aj | . . . , тогда в силу линей ности по столбцам

det . . . |a + λaj | . . . |aj | . . . = det(. . . |ai | . . . |aj | . . .) + λ · det . . . |aj | . . . |aj | . . . .
Первое слагаемое равно det(A), а второе равно 0, поскольку дважды встречается столбец aj .
Аналогичный результат для строк достигается транспонированием.
Замечание 4.11.6. При домножении строки или столбца на скаляр λ определитель домно‐
жается на λ.
Предложение 4.11.7. Матрица A ∈ M(n, F ) обратима тогда и только тогда, когда det(A) 6= 0.
Доказательство. Матрицу A можно привести к строчной эшелонированной форме посред‐
ством элементарных преобразований . При этом определитель только домножается на нену‐
левые скаляры. Если матрица A обратима, то по Замечанию 4.8.6 ее строчная эшелонирован‐
ная форма равна единичной матрице, которая имеет определитель 1. У необратимой матри‐
цы в строчной эшелонированной форме есть нулевая строка, так что ее определитель тоже
равен 0.
Предложение 4.11.8. Пусть A ∈ M(m, F ), B ∈ M(n, F ), X ∈ M(m, n, F ). Тогда определитель
B ) равен det(A) · det(B).
блочной матрицы ( A0 X
Доказательство. Фиксируем матрицы X и B и рассмотрим функцию

A X
f : M(m, F ) → F, f (A) = det
0 B
Ясно, что эта функция линей ная по столбцам и обращается в ноль при равенстве двух сто‐
люцов матрицы A. Значит, она единственна с точностью до домножения на скаляр, то есть
определяется значением на какой ‐то одной фиксированной матрице, например, единичной :
f (A) = det(A) · f (Im ).
Остается вычислить f (Im ). По определению

I X
f (Im ) = det m .
0 B
Разложение по первому столбцу дает равенство

Im X I X′
det = det m−1 ,
0 B 0 B
где X ′ получается из X вычеркиванием первой строки. Повторяя так m раз, получаем, что
f (Im ) = det(B).
Предложение 4.11.9. Определитель мультипликативен, то есть det(AB) = det(A) · det(B)
для A, B ∈ M(n, F ).
Доказательство. Фиксируем матрицу A и рассмотрим функцию
f : M(n, F ) → F, f (B) = det(AB).
Если у матрицы B совпадают столбцы с номерами i и j, то есть B∗,i = B∗,j , то то же самое
верно и для матрицы AB, так как (AB)∗,k = A · B∗,k . Если в матрице B столбец с номером
i имеет вид λa + µb, то в матрице AB столбец с тем же номером имеет вид λAa + µAb. По‐
этому функция f линей на по столбцами и обращается в ноль при равенстве столбцов. Сле‐
довательно, она пропорциональна определителю: f (B) = det(B) · f (In ). Но по определению
f (In ) = det(A).
Следствие 4.11.10. Если матрица A обратима, то det(A−1 ) = det(A)−1 .
90
4.12 Формулы Крамера и присоединенная матрица
Рассмотрим систему линей ных уравнений Ax = b с квадратной матрицей A ∈ M(n, F ). Пусть
матрица A составлена из столбцов A = a1 | . . . |an , и пусть x = (x1 , . . . , xn )⊤ — решение.
Теорема 4.12.1 (Формулы Крамера).

xi · det(A) = det a1 | . . . |ai−1 |b|ai+1 | . . . |an .
X
det a1 | . . . |ai−1 |b|ai+1 | . . . |an = det a1 | . . . |ai−1 | xj aj |ai+1 | . . . |an
j
X
= xj · det a1 | . . . |ai−1 |aj |ai+1 | . . . |an
j

= xi · det a1 | . . . |ai−1 |ai |ai+1 | . . . |an = xi · det(A).
При det(A) 6= 0 эти соотношения позволяют явно описать решения СЛУ, в частности, до‐
ставляют формулу для обратной матрицы.
Пусть A ∈ M(n, F ) обратима. Обозначим A−1 = (cij ). Тогда j‐й столбец A−1 это решение
СЛУ Ax = (In )∗,j = ej . Формулы Крамера дают тогда соотношения

cij · det(A) = det a1 | . . . |ai−1 |ej |ai+1 | . . . |an .
Разложение определителя в правой части по i‐му столбцу (равному ej ) дает равенство
cij · det(A) = (−1)i+j det(Aji ).
Определение 4.12.2. Присоединенной матрицей для A ∈ M(n, F ) называется матрица adj(A) ∈

M(n, F ), задаваемая правилом adj(A)ij = (−1)i+j det(Aji ).
Рассуждения выше можно теперь сформулировать следующим образом:
Следствие 4.12.3. Если матрица A обратима, то A−1 = 1
det(A) adj(A).
Следствие 4.12.4. В частности,
−1
a b 1 d −b
= .
c d ad − bc −c a
Формулу для обращения матрицы 2 × 2 мы уже видели в другом контексте — в связи с нахождением преобразо‐
вания, обратного к дробно‐линей ному. В дей ствительно, дробно‐линей ные преобразования можно рассматривать
как комплексные матрицы размера 2 с точностью до умножения на скаляр (и формула для композиции дробно‐
линей ных преобразований тогда превращается в умножение матриц). Обратимые дробно‐линей ные преобразова‐
ния тогда задаются обратимыми матрицами (обратимость не зависит от домножения на ненулевой скаляр), а обра‐
тимость матрицы отвечает необращению определителя в 0, см. Предложение 3.7.3. Предложение 3.7.2 тоже можно
истолковать в матричных терминах: всякая матрица 2 × 2 записывается в виде произведения четырех матриц эле‐
ментарных преобразований (с точностью до умножения на скаляр): например, при c 6= 0
3
c a bc − ad 0 0 1 c d ac bc3 a b
= = c 3
· .
0 c 0 c2 1 0 0 c c4 dc3 c d
В случае c = 0 такое представление выглядит еще проще:

1 b a 0 a b
= .
0 d 0 1 0 d
Однако верно и более общее утверждение.
91
Предложение 4.12.5. A · adj(A) = adj(A) · A = det(A) · In .
Доказательство. Понятно, что достаточно доказывать только одну из формул (вторая по‐
лучается транспонированием первой формулы для транспонированных матриц).
Зафиксируем пару индексов i, j и проверим, что (A · adj(A))ij = δij · det(A). Дей ствительно,
X
n X
n
(A · adj(A))ij = aik · adj(A)kj = aik · (−1)k+j det(Ajk ).
k=1 k=1
При i = j выражение в правой части совпадает с разложением по i‐й строке и дает det(A).
При i 6= j рассмотрим матрицу A′ = (a′ij ), полученную заменой j‐ю строки матрицы A на ее
i‐ю строку. Тогда для любых индексом j, k имеется равенство A′jk = Ajk (измененная строка
удалена). С другой стороны, det(A′ ) = 0, а разложение по j‐й строке дает
X
n X
0= (−1)j+k a′jk det(A′jk ) = (−1)j+k aik det(Ajk ).
k=1 k=1
4.13 Определитель Вандермонда

Определение 4.13.1. Определитель Вандермонда

1 x1 x21 . . . xn−1
1
1 x2 x22 n−1
. . . x2

V (x1 , . . . , xn ) = . .. .. .. .. .
.. . . . .

1 xn x2 . . . xn−1
n n
Q
Теорема 4.13.2. V (x1 , . . . , xn ) = i>j (xi − xj ).
Доказательство. Индукция по n. При n = 2 формула очевидна:

1 x1

V (x1 , x2 ) = = x2 − x1 .
1 x2
Пусть n > 2. Вычтем из последнего столбца предпоследний , умноженный на x1 , затем из

предпоследнего предшествующий ему, домноженный на x1 , и так далее. В результате в пер‐
вой строке все элементы, кроме первого, станут равными 0. Более точно, получили равен‐
ство
1 x1 x21 . . . xn−1 1 0 0 ... 0
1
1 x2 x22 . . . xn−1 1 x2 − x1 x2 (x2 − x1 ) . . . xn−2 (x − x )
2 2 2 1
. . . . . = .. . . . . .
.. .. .. .. .. . .. .. .. ..

1 xn x2 . . . xn−1 1 xn − x1 xn (xn − x1 ) . . . xn−2 (xn − x1 )
n n n
Раскладывая определитель в правой части по первой строке и вынося из каждой строки об‐
щий множитель, получаем
Y
V (x1 , . . . , xn ) = (xi − x1 ) · V (x2 , . . . , xn ).
i>1
Определитель Вандермонда возникает во множестве приложений , например, в связи с ин‐

терполяционной задачей .
92
Пусть x0 , x1 , . . . , xn — различные элементы поля F , и пусть заданы y0 , y1 , . . . , yn ∈ F . Ин‐
терполяционная задача состоит в отыскании такого многочлена f ∈ F [x], что deg(f ) 6 n и
для всех i имеется равенство f (xi ) = yi . Запишем
f = ξ0 + ξ1 x + ξ2 x2 + . . . + ξn xn .
Подставляя x = xi , получаем n + 1 линей ное уравнение на коэффициенты ξj :
ξ0 + ξ1 xi + . . . + ξn xni = yi .
Определитель этой СЛУ это в точности определитель Вандермонда V (x0 , . . . , xn ). Так как все
xi различны, этот определитель не равен 0, так что матрица системы обратима и СЛУ имеет
единственное решение.
93
5 Линейные операторы
Сфокусируемся теперь на изучении структуры линейных операторов, то есть линей ных отоб‐
ражений векторного пространства в себя. Будем обозначать Hom(V ) = Hom(V, V ).
5.1 Определитель оператора, собственные числа и собственные векторы

Определение 5.1.1. Определителем оператора φ ∈ Hom(V ) будем называть определитель
его матрицы по отношению к какому‐нибудь базису, то есть det(φ) = det(φe ).
Замечание 5.1.2. Определитель оператора не зависит от выбора базиса.
Доказательство. Пусть e и f — два базиса V . Обозначим C = Cf →e . Тогда φf = C −1 φe C и
det(φf ) = det(C −1 φe C) = det(C)−1 det(φe ) det(C) = det(φe ).
Замечание 5.1.3. det(φ ◦ ψ) = det(φ) det(ψ).
Определение 5.1.4. Если для некоторого v ∈ V , v 6= 0, и λ ∈ F выполнено равенство φ(v) =
λv, то v называется собственным вектором, а λ — собственным числом оператора φ.
Если известно какое‐то собственное число λ, то най ти соответствующие собственные век‐
торы несложно. А именно, после выбора базиса e1 , . . . , en равенство φ(v) = λv превращается
в равенство φe ve = λve или, что то же самое, (λIn − φe )ve = 0, то есть задача сводится к
решению однородной СЛУ.
Остается понять, как най ти собственные числа, то есть те λ ∈ F , для которых такая си‐
стема имеет ненулевое решение. Это эквивалентно поиску таких λ, что Ker(λ id −φ) 6= 0, то
есть для которых оператор λ id −φ необратим (в силу Предложений 4.3.25 и 4.3.26). Но по
Предложению 4.11.7 оно необратимо только когда det(λ id −φ) = 0.
Ясно, что вычисление det(λ id −φ) можно проводить в любом базисе.
Замечание 5.1.5. Пусть A ∈ M(n, F ). Тогда det(tIn − A) выражается как многочлен от t с
коэффициентами в F .
Доказательство. Формула полного развертывания для матрицы, элементы которой явля‐
ются многочленами от t.
Определение 5.1.6. Характеристическим многочленом матрицы A ∈ M(n, F ) называется
χA ∈ F [t], задаваемый формулой χA (t) = det(tIn − A). Характеристическим многочленом
оператора φ ∈ Hom(V ) называется характеристический многочлен его матрицы в каком‐
нибудь (любом) базисе, то есть χφ (t) = det(t id −A).
Замечание 5.1.7. Пусть φ ∈ Hom(V ). Тогда deg(χφ ) = dim(V ).
Доказательство. Пусть dim(V ) = n и A = (aij ) ∈ M(n, F ) — матрица φ в каком‐нибудь ба‐
зисе. Рассмотрим формулу полного развертывания для det(A − tIn ). Слагаемое, отвечающее
тождественной перестановке, равно (t − a11 ) · . . . · (t − ann ) и имеет степень n, а у всех осталь‐
ных слагаемых степень меньше, так как хотя бы один множитель внедиагональный , то есть
является константой .
Соображения, приводящие к понятию характеристического многочлена, можно оформить
в следующей форме.
Предложение 5.1.8. Собственные числа линей ного оператора это в точности корни его ха‐
рактеристического многочлена, в частности, их количество не превосходит размерности про‐
странства.
94
Пример 5.1.9. Пусть V — евклидова плоскость с базисом e1 , e2 , а φ — поворот на угол θ (про‐
тив часовой стрелки), тогда

cos θ − sin θ
φe = ,
sin θ cos θ

t − cos θ sin θ
χφ = = (t − cos θ)2 + sin2 θ = t2 − 2t cos θ + 1.
− sin θ t − cos θ
Корнями характеристического многочлена являются

1 p
λ1 , 2 = cos θ ± 4 cos2 θ − 4 = cos θ ± i sin θ.
2
Остается для каждого собственного числа λi най ти соответствующие собственные векторы.
Матрица соответствующей однородной СЛУ имеет вид

±i sin θ sin θ
.
− sin θ ±i sin θ
В случае sin θ 6= 0 она приводится элементарными строчными преобразованиями к виду

1 ±i
0 0
На деле это вычисление проделывать не требуется, так как известно, что ранг этой матри‐
цы не максимален (не превосходит 2) и не равен 0, так что обязательно равен единице и
тем самым можно просто оставить одну строку. Решением СЛУ с такой матрицей служат все
векторы вида

±ia
, a ∈ C соответственно для с.ч. λ = cos θ ± sin θ.
a
Ясно, что никакой такой столбец не может быть вещественными, поэтому в строгом смыс‐
ле у оператора φ нет собственных вектором и собственных чисел, но часто полезно иметь
информацию о собственных числах и векторах в таком расширенном смысле.
В случае sin θ = 0 отображение φ это либо тождественное преобразование, либо поворот
на угол π, то есть отражение относительно начала координат. В этом случае единственное
собственное число это соответственно 1 или −1, и все ненулевые векторы являются соб‐
ственными.
Обратите также внимание, что собственное число матрицы поворота оказалось равным комплексному числу,
домножение на которое дей ствует как поворот на тот же угол. Это связано с тем, что комплексные числа можно
реализовать как вещественные матрицы 2 × 2 специального вида, а именно,

a b
a + bi ! .
−b a
Легко проверить, что сумме и произведению комплексных чисел отвечает сумма и произведение таких матриц,
комплексное сопряжение реализуется как транспонирование, а квадрат модуля вычисляется как определитель.
В некоторых случаях, впрочем, можно гарантировать, что все собственные числа окажутся
вещественными.
Предложение 5.1.10. Пусть A ∈ M(n, R) симметрическая, то есть A⊤ = A. Тогда все соб‐
ственные числа A вещественные.
95
Доказательство. Для матриц X ∈ M(m, n, C) (в частности, для столбцов) будем обозна‐
чать через X результат покомпонентного применения комплексного сопряжения. Ясно, что
⊤
X = X ⊤ и для любой матрицы Y подходящего размера XY = X · Y .
Заметим, что для любого u ∈ Cn число u⊤ · u вещественное: если u = (z1 , . . . , un )⊤ , то
u⊤ · u = z1 z1 + . . . + zn zn = |z1 |2 + . . . + |zn |2 ∈ R.
При этом эта величина неотрицательная и равна 0 только для u = 0.
Пусть теперь v 6= 0 — собственный вектор, отвечающий собственному числу λ, то есть
Av = λv. Тогда
⊤
Av · Av = v ⊤ A⊤ Av = v ⊤ · A2 v = λ2 · v ⊤ v.
Тем самым λ2 выражается как частное двух неотрицательных вещественных чисел, а тогда
λ вещественное.
Характеристический многочлен доставляет также средство находить линей ные зависи‐
мости между степенями данной квадратной матрицы.
Определение 5.1.11. Пусть f ∈ F [x] и A ∈ M(n, F ). Значением f = c0 + c1 x + . . . + cm xm на
A называется
f (A) = c0 In + c1 A + . . . + cm Am .
Ясно, что как и для обычного значения многочлена, (f + g)(A) = f (A) + g(A), (f g)(A) =
f (A)g(A) и (λf )(A) = λf (A) (для доказательства необходимо дополнительно воспользо‐
ваться тем, что Ar As = As Ar ).
Теорема 5.1.12 (Гамильтона—Кэли). χA (A) = 0.
Доказательство. Пусть A ∈ M(n, F ) и χA (t) = tn + cn−1 tn−1 + . . . + c1 t + c0 . Положим B =
adj(tIn − A), тогда
(tIn − A) · B = det(tIn − A) · In = χA · In .
Элементы матрицы B — многочлены от переменной t, причем их степени не превосходят
n − 1. Дей ствительно, каждый элемент B это, с точностью до знака, определитель матрицы
порядка n−1, составленной из многочленов степени 6 1, причем в каждой строке не больше
одного не‐константного многочлена. Тогда можно представить B в виде
B = B0 + tB1 + . . . + tn−1 Bn−1 , где Bi ∈ M(n, F ).
Тогда формула выше может быть переписаа следующим образом:
χA · In = (tIn − A) · B = (tIn − A) · (B0 + tB1 + . . . + tn−1 Bn−1 ) =

= tn Bn−1 + tn−1 (Bn−2 − ABn−1 ) + . . . + t(B0 − AB1 ) − AB0 .
С другой стороны,
χA · In = tn In + tn−1 cn−1 In + . . . + tc1 In + c0 In .
Сравнивая слагаемые при соответствующих степенях, получаем следующие соотношения:
Bn−1 = In , Bi−1 − ABi = ci In , i = 1, . . . , n − 1, −AB0 = c0 In .
Умножим слева равенство, отвечающее ti , на Ai , и сложим все полученные:
An Bn−1 + An−1 (Bn−2 − ABn−1 ) + . . . + A(B0 − AB1 ) − AB0 = An + cn−1 An−1 + . . . + c1 A + c0 In .
Все слагаемые в левой части сокращаются, а в правой части стоит χA (A).
96
Следствие 5.1.13. Пусть A ∈ M(n, F ), тогда dimhIn , A, A2 , . . .i 6 n.
Доказательство. Покажем, что In , A, A2 , . . . , An−1 — порождающий набор для данного под‐
пространства. Это в точности означает, что Ak выражается в виде f (A) для некоторого f ∈
F [x] степени 6 n−1. Поделим xk на χA с остатком: xk = χA ·q +r, deg(r) < deg(χA ) = n. Тогда
вычисление значений на A дает Ak = χA (A) · q(A) + r(A) — по теореме Гамильтона—Кэли
Ak = r(A), то есть можно положить f = r.
Определение 5.1.14. Алгебраической кратностью собственного числа λ оператора φ назы‐
вается его кратность как корня χφ . Геометрической кратностью называется размерность
Ker(λ id −φ), то есть максимальное количество линей но независимых собственных ветко‐
ров, отвечающих λ.
Предложение 5.1.15. Геометрическая кратность собственного числа λ оператора φ не пре‐
восходит его алгебраической кратности.
Доказательство. Пусть геометрическая кратность равна k, то есть существуют k линей но
независимых собственных вектором v1 , . . . , vk , отвечающих λ. Дополним их векторами vk+1 , . . .
до базиса всего пространства, тогда матрица оператора φ в базисе v имеет вид

λIk B
φv = .
C
Тогда χφ = χφv = χλIk · χC = (t − λ)k · χC и алгебраическая кратность λ не меньше k.
Определение 5.1.16. Следом матрицы A ∈ M(n, F ) называется сумма ее диагональных эле‐
ментов: tr(A) = a11 + a22 + . . . + ann .
Предложение 5.1.17. След матрицы равен сумме ее собственных чисел с учетом кратности.
Более точно, если A ∈ M(n, F ) и λ1 , . . . , λn — ее собственные числа (возможно, с повторами),
то tr(A) = λ1 + . . . + λn .
Доказательство. Рассмотрим характеристический многочлен χA . Так как собственные чис‐
ла это его корни, χA = (t−λ1 ) . . . (t−λn ), так что коэффициент при tn−1 равен −(λ1 +. . .+λn ).
С другой стороны, прямое вычисление показывает, что
χA = det(tIn − A) = tn − tn−1 (a11 + a22 + . . . + ann ) + слагаемые меньших степеней .
Дей ствительно, в формуле полного развертывания имеется слагаемое вида
(t − a11 )(t − a22 ) . . . (t − ann ),
а все остальные слагаемые имеют степень не больше n − 2, так как выбор одного внедиа‐
гонального элемента исключает из произведения диагональные элементы в соответству‐
ющих строке и столбце. Сравнивая два выражения для коэффициента при tn−1 , получаем
искомое утверждение.
Лемма 5.1.18. Пусть A⊤ = A ∈ M(n, R), а λ ∈ R — собственное число A. Если (A − λI)k x = 0,
то (A − λI)x = 0.
Доказательство. Если (A − λI)2 x = 0, то
⊤
0 = x⊤ · (A − λI)2 x = A − λI)x · (A − λI)x,
так что (A − λI)x = 0. Для k > 2 положим y = (A − λI)k−2 x, и по предыдущему рассуждению
получаем, что (A − λI)y = 0, то есть (A − λI)k−1 x = 0. Продолжаем, пока не дой дем до
(A − λI)x = 0.
97
Предложение 5.1.19. Пусть A ∈ M(n, R), A⊤ = A, а λ1 , . . . , λs ∈ R — все ее различные
собственные числа. Положим f = (t − λ1 ) . . . (t − λs ). Тогда f (A) = 0.
Доказательство. По теореме Гамильтона—Кэли χA (A) = 0, причем
χA = (t − λ1 )m1 . . . (t − λs )ms .
Рассмотрим произвольный столбец v, тогда
(A − λ1 I)m1 (A − λ2 I)m2 . . . (A − λs )ms v = 0.
Применим предыдущую лемму для x = (A−λ2 I)m2 . . . (A−λs I)ms v, получим, что (A−λ1 I)x =
0. Теперь, поскольку все матрицы в этом произведении коммутируют, переставим множи‐
тель (A − λ1 I) в конец и повторим для λ2 . Продолжая так, получаем, что f (A) = 0.
5.2 Спектр графа

Определение 5.2.1. Графом Γ будем называть пару из множества вершин V Γ и множества
ребер EΓ, то есть (неупорядоченных) пар вершин. Мы будем считать, что у графа нет петель,
то есть каждое ребро соединяет две различные вершины, и нет кратных ребер, то есть нет
двух ребер, соединяющих одни и те же вершины. Мы будем рассматривать только неориен‐
тированные графы, то есть ребра {a, b} и {b, a} равны.
Пусть вершины графа Γ занумерованы числами 1, . . . , n. Матрицей смежности графа Γ
называется (
1, если {i, j} ∈ EΓ,
AΓ = (aij ) ∈ M(n, Z), где aij =
0, иначе.
Заметим, что так как граф неориентированный , матрица смежности симметрическая.

Определение 5.2.2. Спектром графа Γ будем называть множество собственных чисел AΓ
вместе с (алгебраическими) кратностями. Если λ1 > λ2 > . . . > λs — различные собствен‐
ные числа (все вещественные) кратностей m1 , . . . , ms , то будем писать

λ1 λ2 . . . λs
Spec Γ = .
m1 m2 . . . ms
Собственные числа матрицы смежности часто называют просто собственными числами гра‐
фа.
В дей ствительности для вещественных симметрических матриц геометрическая кратность собственных чисел
всегда совпадает с алгебраической .
Пример 5.2.3. Рассмотрим Kn — полный граф на n точках, имеющий n вершин, где любые
две различные вершины соединены ребром. Тогда

n−1 −1
Spec Kn = .
1 n−1
Дей ствительно, матрица смежности AKn имеет нули на диагонали и единицы на всех вне‐
диагональных позициях. Тогда (1, . . . , 1)⊤ — собственный вектор для собственного числа
98
n − 1, а      
−1 0 0
 1  −1  .. 
     . 
0 1  
 , ,..., 0 
 ..   0   
 .    −1
..
0 . 1
доставляют n − 1 линей но независимыый собственный вектор для собственного числа −1.
Определение 5.2.4. Характеристическим многочленом χΓ графа Γ называется характери‐
стический многочлен его матрицы смежности AΓ .
Предложение 5.2.5. Пусть χΓ = tn + cn−1 tn−1 + cn−2 tn−2 + . . . + c0 . Тогда cn−1 = 0 и cn−2 =
−|EΓ|.
Доказательство. Все собственные числа AΓ вещественные, так что χΓ = (t − λ1 )m1 . . . (t −
λs )ms . Тогда сумма m1 λ1 + . . . + ms λs равна следу матрицы смежности, но tr(AΓ ) = 0, так как
у графа нет петель.
Рассмотрим теперь коэффициент cn−2 при tn−2 . В формуле полного развертывания слага‐
емые степени > n − 2 возникают только двумя способами: либо
(t − a11 )(t − a22 ) . . . (t − ann ),
отвечающее тождественной перестановке (что для AΓ равно tn ), либо отвечающие транспо‐

зиции τij и имеющие вид Y
−aij aji · (t − akk ),
k̸=i,j
P
что для AΓ равно −aij 2 tn−2 . Итого коэффициент при tn−2 равен − i̸=j a2ij , то есть, при aij =
1 или 0 в зависимости от наличия ребра {i, j} в Γ, в точности −|EΓ|.
Пока что мы не пользовались тем, что матрицу смежности можно умножать на себя. Ока‐
зывается, степени матрицы смежности тоже говорят что‐то о графе.
Определение 5.2.6. Путем длины ℓ в графе Γ называется такая последовательность вер‐
шин v0 , . . . , vℓ , что {vi−1 , vi } ∈ EΓ для i = 1, . . . , ℓ.
Предложение 5.2.7. Количество путей длины ℓ между вершинами с номерами i и j, равно
элементу в позиции (i, j) матрицы AℓΓ .
Доказательство. Результат очевидно верен для ℓ = 1, далее индукция по ℓ. Предположим,
что утверждение уже доказано для данного ℓ. Заметим, что множество путей длины ℓ + 1
из вершины i в вершину j находится в биективном соответствии со множеством путей из
вершины i в вершины, смежные с вершиной j. Тогда их количество равно
X X
n
(AℓΓ )ik = (AℓΓ )ik · akj = (Aℓ+1
Γ )ij .
k : {j,k}∈EΓ k=1
Определение 5.2.8. Диаметром (связного) графа называется наибольшее такое d ∈ N, что

между какими‐то двумя вершинами существует путь длины d, но не существует более ко‐
роткого пути.
Предложение 5.2.9. Если диаметр графа Γ равен d, то у Γ не меньше d + 1 различного соб‐
ственного числа.
99
Доказательство. Пусть A = AΓ , рассмотрим матрицы I, A, A2 , . . . , Ad . Докажем, что они ли‐
ней но независимы. Пусть
µ0 I + µ1 A + . . . + µd Ad = 0.
Поскольку диаметр Γ равен d, существует некий путь длины d, который нельзя укоротить.
Пусть он проходит по вершинам с номерами i0 , i1 , . . . , id . Тогда у матрицы Ad в позиции (i0 , id )
стоит ненулевой элемент, а у меньших степеней A там стоит ноль (так как нет более корот‐
кого пути, соединяющего эти вершины). Значит, µd A = 0. Аналогично, в позиции (i0 , id−1 )
матрицы Ad−1 стоит ненулевое число, а у меньших степеней ноль, так что µd−1 = 0. Продол‐
жая таким же образом, получаем, что все µi = 0.
Отсюда мы заключаем, что если f (A) = 0 для какого‐то ненулевого f ∈ F [x], то deg(f ) >
d + 1.
С другой стороны, если λ1 , . . . , λs — полный список различных собственных чисел A, то по
предыдущей лемме для g(t) = (t − λ1 ) . . . (t − λs ) выполнено g(A) = 0, так что s > d + 1.
Определение 5.2.10. Граф Γ называется двудольным, если V Γ = V1 ∪ V2 , V1 ∩ V2 = ∅, вер‐
шины из V1 могут быть соединены только с вершинами из V2 и наоборот.
Предложение 5.2.11. Если граф двудолен, то его спектр симметричен относительно 0.

Доказательство. Пусть |V1 | = k, |V2 | = l. Пронумеровав вершины так, что 1, . . . , k — номера
вершин из V1 , а k + 1, . . . , k + l — из V2 , получаем, что AΓ = B0⊤ B0 для некоторой матрицы
B ∈ M(k, l, R). Будем рассматривать столбцы высоты k + l как состоящие из двух частей ,
высоты k и l соответственно. Тогда уравнение на собственное число λ и соответствующий
собственный вектор принимает вид

0 B u u
= λ .
B⊤ 0 v v
При этом правая часть может быть вычислена следующим образом:

0 B u Bv
= .
B⊤ 0 v B⊤u
Покажем, что замена знака у второй половины собственного вектора дает собственный век‐
тор, отвечающий −λ:

0 B u −Bv −λu u
= = = −λ .
B⊤ 0 −v B⊤u λv −v
В дей ствительности верно и обратно утверждение: если спектр симметричен относитель‐

но 0, то граф двудольный .
5.3 Диагонализация и жорданова форма

Если у оператора φ ∈ Hom(V ), дей ствующего на векторном пространстве V размерности n,
имеется n различных собственных чисел, то каждому такому собственному числу λi можно
сопоставить какой ‐то собственный вектор vi . Тогда набор v1 , . . . , vn образует базис V , а φv =
diag(λ1 , . . . , λn ). Если же какое‐то собственное число имеет алгебраическую кратность > 1,
то возможны варианты.
100
Определение 5.3.1. Оператор называется диагонализируемым, если его матрица в каком‐
то базисе диагональна. Матрица такого оператора в любом базисе также называется диаго‐
нализируемой . Иными словами, матрица A называется диагонализиуемой , если существует
такая обратимая матрица C, что C −1 AC диагональная.
Диагональные матрицы хороши, кроме прочего, тем, что их очень просто подставлять в
многочлены, а именно, если A = diag(a1 , . . . , an ), то f (A) = diag(f (a1 ), . . . , f (an )). Это можно
применить и к диагонализируемым матрицам: если D = C −1 AC диагональна, то f (A) =
f (CDC −1 ) = Cf (D)C −1 .
Сей час мы выясним, что можно сказать о недиагонализиуемых матрицах. Задачу можно
разбить на две части: как най ти хорошо устроенную матрицу, сопряженную с данной , и как
эффективно проводить вычисления с такими матрицами.
Определение 5.3.2. Жордановой клеткой называется квадратная матрица

 
λ 1
 λ 1 
 
 . . 
Jk (λ) =  .. ..  ∈ M(k, F ).
 
 λ 1
λ
Жордановой матрицей называется блочно‐диагональная матрица, диагональные блоки ко‐

торой являются жордановыми клетками.
Если v1 , . . . , vn — такой базис пространства V , что матрица φv оператора φ ∈ Hom(V ) яв‐
ляется жордановой матрицей , то v1 , . . . , vn называется жордановым базисом.
Лемма 5.3.3. Пусть α ∈ Hom(U, V ), β ∈ Hom(V, W ). Тогда
dim(Im α ∩ Ker β) = dim Im(α) − dim Im(β ◦ α) = dim Ker(β ◦ α) − dim Ker(α).
Доказательство. Обозначим γ сужение β на Im(α). Тогда по Теореме 4.5.9
dim Ker(γ) + dim Im(γ) = dim Im(α),

а следовательно,
dim(Im α ∩ Ker β) + dim Im(β ◦ α) = dim Im(α).
Второе равенство следует из того, что
dim Im(β ◦ α) = dim V − dim Ker(β ◦ α) и dim Im(α) = dim V − dim Ker(α).
Теорема 5.3.4 (о жордановой форме). Пусть V — конечномерное векторное пространство

над полем F , φ ∈ Hom(V ), и все собственные числа φ принадлежат F (то есть χφ расклады‐
вается над F на линей ные множители). Тогда в V существует жорданов базис оператора φ,
причем соответствующая жорданова матрица определена однозначно с точностью до пере‐
становки жордановых клеток.
Доказательство. Начнем с доказательства существования жорданова базиса. Доказатель‐

ство будем вести индукцией по n = dim(V ).
При n = 1 утверждение очевидно (любая матрица 1 × 1 диагональна).
Пусть теперь n > 1 и λ — какое‐то из собственных чисел φ. Рассмотрим оператор ψ =
φ − λ · id. Ясно, что жорданов базис ψ будет также жордановым базисом для φ (их матрицы в
101
этом базисе будут отличаться на скалярную матрицу λIn ). Рассмотрим последовательность
подпространств
V = Im ψ 0 > Im ψ 1 > Im ψ 2 > . . .
Так как пространство V конечномерно, в какой ‐то момент эта последовательность стабили‐
зируется, то есть най дется такое m, что Im ψ m+1 = Im ψ m 6= Im ψ m−1 — как только простран‐
ства Im ψ m и Im ψ m+1 совпали, совпадут и все последующие, так как Im ψ m+1 = ψ(Im ψ m ).
Тогда
Im ψ m ∩ Ker ψ = 0 и Im ψ m−1 ∩ Ker ψ 6= 0
(это отвечает инъективности и неинъективности сужения ψ на Im ψ m и на Im ψ m−1 , см. Пред‐
ложения 4.3.25 и 4.3.26). В частности, ψ m (Im ψ m ) = Im ψ m .
Пусть Ui = Im ψ i−1 ∩ Ker ψ. Тогда
Ker ψ = U1 > U2 > . . . > Um 6= 0 и Um+1 = 0.
Выберем в пространстве Um базис x11 , . . . , x1np . Так как x1i ∈ Im ψ m−1 , то x1i = ψ m−1 (xm
i ) для
m k m−k m
некоторого вектора xi . Определим векторы xi = ψ (xi ).
Дополним теперь векторы x1i до базиса Um−1 векторами y11 , . . . , yn1 m−1 . Для каждого j най ‐
дем такой вектор yjm−1 , что yj1 = ψ m−2 (yjm−1 ), и положим yjk = ψ m−k−1 (yjm−1 ). Затем допол‐
ним x1i , yj1 до базиса Um−2 векторами z11 , . . . , zn1 m−2 и так далее. Итого получаем следующую
конфигурацию векторов:
xm
i
↓
xm−1
i yjm−1
↓ ↓
xm−2
i yjm−2 zkm−2
↓ ↓ ↓
.. .. .. ..
. . . .
↓ ↓ ↓ ···
x2i yj2 zk2 ··· a2s
↓ ↓ ↓ ··· ↓
x1i yj1 zk1 ··· a1s b1t
↓ ↓ ↓ ··· ↓ ↓
0 0 0 ··· 0 0
Здесь каждый столбец отвечает сразу набору цепочек векторов, занумерованному индексом
i, j, k, . . . , s, t соответственно, а стрелки обозначают применение оператора ψ.
Если индекс i изменяется от 1 до I, индекс j в пределах от 1 до J и так далеее, то общее
количество векторов равно
mI + (m − 1)J + (m − 2)K + . . . + 2S + T =
= I + (I + J) + (I + J + K) + . . . + (I + J + . . . + S + T ) =
= dim Um + dim Um−1 + dim Um−2 + . . . + dim U1 .
102
Так как по Лемме 5.3.3
dim(Im ψ i−1 ∩ Ker ψ) = dim Ker ψ i − dim Ker ψ i−1 ,

то
X
m
dim Ui = dim Ker ψ m .
i=1
Дополним выбранные векторы базисом пространства Im ψ m и покажем, что получился ба‐

зис пространства V . Так как их колчество совпадает с размерностью V , достаточно прове‐
рить линей ную независимость. Предположим, что
X X X X
f+ αi xm
i + βi xm−1
i + ... + γj yjm−1 + . . . + δt b1t = 0,
где f ∈ Im ψ m . Применив к этому равенству ψ m , получим ψP m

(f ) = 0, а значит, f = 0, так
m m m m−1
как ψ (Im ψ ) = Im ψ . ПрименивP теперь ψ P , получим αi x1i = 0, значит, все αi = 0.
m−2 1 1
Применение ψ показывает, что βi x i + γj yj = 0, откуда все βi и γj нулевые, и так
далее.
По предположению индукции в пространстве Im ψ m 6= V най дется жорданов базис опера‐
тора φ (точнее, его сужения на это подпространство). Дополнив его выбранными векторами,
получаем жорданов базис в пространстве V .
Для доказательства единственности жордановой формы достаточно проверить, что коли‐
чество и размер клеток, отвечающих собственному числу 0, определено однозначно (тогда
для произвольного собственного числа λ можно перей ти к оператору φ−λ·id). Этим клеткам
можно сопоставить диаграмму выше, так что количество клеток размера k равно
dim Uk − dim Uk+1 = (dim Ker ψ k − dim Ker ψ k−1 ) − (dim Ker ψ k+1 − dim Ker ψ k )
= 2 dim Ker ψ k − dim Ker ψ k−1 − dim Ker ψ k+1
= rk ψ k−1 − 2 rk ψ k + rk ψ k+1 .
Единственность жордановой формы означает, кроме прочего, что сопряженность комплекс‐

ных матриц определяется совпадением их жордановых форм. Сей час мы покажем, что ве‐
щественная сопряженность вещественных матриц не является более тонким отношением
эквивалентности.
Предложение 5.3.5. Пусть A, B ∈ M(n, R) таковы, что A = P BP −1 для некоторой матрицы

P ∈ M(n, C)∗ . Тогда существует такая матрица Q ∈ M(n, R)∗ , что A = QBQ−1 .
Доказательство. Требуется доказать, что у матричного уравнения AX = XB существует
обратимое вещественное решение. Поскольку это уравнение можно переписать в виде си‐
стемы однородных линей ных уравнений на матричные элементы, множество всех его (ком‐
плексных) решений образуется подпространство W 6 M(n, C) (над C). Подпространство W
нетривиально, так как содержит P . Выберем в нем базис C1 , . . . , Cm ∈ M(n, C). Представим
теперь Cj = Xj +iYj , где Xj , Yj ∈ M(n, R). Тогда равенство ACj = Cj B влечет (при сравнении
вещественных и мнимых частей ) AXj = Xj B и AYj = Yj B (так как A и B вещественные),
так что
W = hC1 , . . . , Cm iC = hX1 , . . . , Xm , Y1 , . . . , Ym iC .
Выделим в этом порождающем наборе базис Z1 , . . . , Zk ∈ M(n, R). Покажем, что среди их
линей ных комбинаций най дется обратимая матрица. Для этого рассмотрим матрицу t1 Z1 +
103
. . . + tk Zk , зависящую от параметров t1 , . . . , tk . Ее обратимость при данных значениях пара‐
метров эквивалентна необращению в ноль определителя. Положим
f (t1 , . . . , fk ) = det(t1 Z1 + . . . + tk Zk ) ∈ R[t1 , . . . , tk ].
Многочлен f принимает какие‐то ненулевые значения при подходящих комплексных значе‐
ниях переменных (так как P ∈ W ), следовательно, многочлен не является нулевым и при‐
нимает ненулевые значения и при вещественных значениях переменных.
Покажем формально, что многочлен f ∈ R[t1 , . . . , tk ], принимающий ненулевые значения при каких‐то ком‐
плексных значениях переменных, не обращается тождественно в 0 при вещественных значениях переменных. Про‐
ведем индукцию по k. База доставляется малой теоремой Безу. При k > 1 рассмотрим ;а; как многочлен одной
переменной t1 с коэффициентами в поле рациональных функций о переменных t2 , . . . , tk :
f ∈ R(t2 , . . . , tk )[t1 ].
Так как многочлен ненулевой , у него есть ненулевое значение (в R(t2 , . . . , tk )) при каком‐то вещественном зна‐
чении t1 (иначе по теореме об интерполяции f был бы нулевым — также снова можно воспользоваться малой
теоремой Безу). К полученному ненулевому значению (зависящему от k − 1 переменной ) можно применить индук‐
ционное предположение.
Более точно, для вещественных матриц имеет место «вещественная жорданова форма». А
именно, определим Jk∗ (λ) как матрицу 2k × 2k, полученную из Jk (λ) заменой каждого ком‐
x y
плексного числа x + iy блоком −y x . Тогда для любой матрицы A ∈ M(n, R) най дется такая
C ∈ M(n, R)∗ , что CAC −1 блочно‐диагональная с блоками либо вида Jk (λ), λ ∈ R, либо вида
Jk∗ (λ), λ ∈ C \ R.
5.4 Приложения жордановой формы

Выясним теперь, как использовать жорданову форму для вычисления степеней матрицы.
Так как
(CAC −1 )n = CAn C −1 ,
а блочно‐диагональные матрицы с одинаковыми размерами блоков умножаются и склады‐
ваются поблочно, задача сводится к вычислению степени жордановой клетки.
Рассмотрим сначала случай клетки, отвечающей собственному числу 0. Матрица Jk (0) за‐
дается оператор на пространстве столбцов F k , дей ствующий на элементах стандартного ба‐
зиса следующим образом:
e1 7−→ 0, ei 7−→ ei−1 при i = 2, . . . , k.
Отсюда видно, что Jk (0)m дей ствует на базисных векторах по правилу
ei 7−→ 0 при i = 1, . . . , m, ei 7→ ei−m при i = m + 1, . . . , k.
В терминах матриц это означает, что Jk (0)m имеет нули везде, кроме m‐й верхней диагонали.
Для общего случая воспользуемся биномом Ньютона. А именно, если a, b — коммутирую‐
щие элементы кольца R (то есть ab = ba), то имеет место равенство
Xn
n i n−i
(a + b)n = ab .
i=0
i
Обозначим N = Jk (0) и заметим, что Jk (λ) = λIk + N , причем слагаемые коммутируют.

Значит,
Xn
n n−i i
Jk (λ)n = (λIk + N )n = λ N .
i=0
i
104
Таким образом, Jk (λ)n верхне‐треугольная, на каждой из диагоналей все элементы совпада‐
ют, а первая строка имеет вид

n
Jk (λ)n 1,∗ = λn , nλn−1 , n(n − 1)/2 · λn−2 , . . . , λn−k+1 .
k−1
Вообще для аналитической функции f (то есть совпадающей со своим рядом Тей лора, на‐
пример, для многочлена) из формулы Тей лора следует следующее широкое обобщение: мат‐
рица f (Jk (λ)) верхне‐треугольная, на каждой из диагоналей все элементы совпадают, а пер‐
вая строка равна

f ′′ (λ) f (k−1) (λ)
f Jk (λ) = f (λ), f ′ (λ), ,..., .
1,∗ 2 (k − 1)!
Следствие 5.4.1. Пусть f ∈ F [x], A ∈ M(n, F ) имеется собственные числа λ1 , . . . , λn ∈ F .

Тогда f (A) имеет собственные числа f (λ1 ), . . . , f (λn ).
Доказательство. Собственные числа не меняются при сопряжении, а для верхне‐треугольной
матрицы собственные числа это в точности диагональные элементы. Поэтому можно снача‐
ла привести матрицу к жордановой форме, а затем воспользоваться формулой выше.
Это следствие легко доказать и непосредственно, не обращаясь к жордановой форме. А именно, если det(λI −
A) = 0, то det(f (λ)I −f (A)) = det(f (λI)−f (A)) = 0. Чтобы это увидеть, покажем, что f (λI)−f (A) = (λI −A)g(A)
для некоторого многочлена g. Это условие является линей ным, а для мономов проверяется напрямую:
(λI)n − An = (λI − A)(An−1 + λAn−2 + . . . + λn−1 I).
Ранее мы уже видели, что у каждой матрицы A есть нетривиальный многочлен, ее анну‐
лирующий , а именно χA (см. Теорему 5.1.12). С другой стороны, иногда, как, например, для
вещественных симметрических матриц, есть и многочлен меньше степени, см. Предложе‐
ние 5.1.19.
Определение 5.4.2. Нетривиальный многочлен со старшим коэффициентом 1, аннулирую‐
щий данную матрицу и имеющий наименьшую возможную степень, называется минималь‐
ным многочленом данной матрицы.
Замечание 5.4.3. Минимальный многочлен существует и единственный .
Доказательство. Существование следует из существования аннулирующего многочлена и

полной упорядоченности натуральных чисел. Предположим, что существует два различных
аннулирующих многочлена f и g наименьшей степени. Тогда h = f − g имеет степень еще
меньше и тоже аннулирующий .
Обозначение 5.4.4. Минимальный многочлен матрицы A обозначается µA .

Предложение 5.4.5. Пусть λ1 , . . . , λk — полный список различных собственных чисел A, а
m1 , . . . , mk — наибольшие размеры соответствующих им жордановых клеток, встречающих‐
ся в жордановой форме A. Тогда
µA = (t − λ1 )m1 · . . . · (t − λk )mk .
Удивительно, но для следующего утверждения неизвестно доказательства, не использу‐

ющего так или иначе жорданову форму.
105
Предложение 5.4.6. Пусть A ∈ M(n, C). Тогда A и A⊤ сопряжены.
Доказательство. Если CAC −1 = J жорданова, то C −1 JC = A, откуда C ⊤ J ⊤ (C −1 )⊤ = A⊤ .

Так как (C −1 )⊤ = (C ⊤ )−1 , достаточно доказать, что J и J ⊤ сопряжены. Так как они имеют
одинаковую блочно‐диагональную структуру, достаточно доказать утверждение для жор‐
дановых клеток. Но для  
1
 . 
Sk =  ..  ∈ M(k, C)
1
выполнено Sk Jk (λ)Sk−1 ⊤
= Jk (λ) .
106
6 Билинейная алгебра
6.1 Билинейные формы и скалярные произведения
В евклидовой геометрии скялярное произведение двух векторов u, v определяется как |u| ·
|v| · cos θ, где θ — угол между u и v. Это понятие оказывается весьма полезным, но требует
для своего определения и понятие длины вектора, и понятие угла между векторами (точнее,
косинуса этого угла). Альтернативный путь — сначала определить скалярное произведение,
а уже на его основе ввести длину и угол.
Определение 6.1.1. Билинейной формой на векторном пространстве V (над полем F ) назы‐
вается отображение B : V × V → F , линей ное по каждому из аргументов, то есть
B(λu + µv, w) = λB(u, w) + µB(v, w) и B(u, λv + µw) = λB(u, v) + µB(u, w).
1. (u, v) 7→ |u||v| cos θ из обсуждения выше;
2. Если φ, ψ ∈ Hom(V, F ), то (u, v) 7→ φ(u) · ψ(v);

3. Для V = F n отображение (u, v) 7→ u⊤ · v.
Определение 6.1.3. Билиней ная форма B называется симметрической, если B(u, v) = B(v, u).
Среди перечисленных выше форм первая и третья являются симметрическими, а вторая
симметричная в случае, когда φ = ψ или когда один из множителей нулевой .
Линей ные отображения задавались при помощи матриц. Выясним, как задать билиней ‐
ную форму конечным набором данных. Для этого, как обычно, перей дем к пространству
столбцов.
Пусть e1 , . . . , en — базис V , и пусть u = x1 e1 + . . . + xn en , v = y1 e1 + . . . + yn en . Тогда в силу
билиней ности

B(u, v) = y1 B(u, e1 ) + . . . + yn B(u, en ) = B(u, e1 ), . . . , B(u, en ) · (y1 , . . . , yn )⊤ .
Рассмотрим внимательнее элементы возникшей строки:

⊤
B(u, ei ) = x1 B(e1 , ei ) + . . . + xn B(en , ei ) = (x1 , . . . , xn ) · B(e1 , ei ), . . . , B(en , ei ) .

Итого строка B(u, e1 ), . . . , B(u, en ) является результатом умножения строки (x1 , . . . , xn ) на
n
матрицу Be = B(ei , ej ) i,j=1 , и тогда
B(u, v) = u⊤
e · B e · ve .
Матрица Be называется матрицей Грама формы B относительно базиса e.

Замечание 6.1.4. Для данной формы B существует только одна такая матрица A, что для
любых u, v имеет место равенство B(u, v) = u⊤
e Av, а именно, A = Be .
Доказательство. При подстановке u = ei , v = ej получаем, что Ai,j = B(ei , ej ).
Замечание 6.1.5. Симметричность билиней ной формы эквивалентна симметричности ее

матрицы Грама в каком‐нибудь (любом) базисе.
107
Предложение 6.1.6. Пусть e, f — два базиса V . Тогда Bf = Cf⊤→e · Be · Cf →e .
Доказательство. По определению Be для любых векторов u, v выполнено B(u, v) = u⊤ e B e ve .

С другой стороны, ue = Cf →e uf и ve = Cf →e vf — подставляя эти выражения в предыдущее
равенство, получаем, что B(u, v) = u⊤ ⊤
f Cf →e Be Cf →e vf . В силу единственности матрицы Гра‐
ма Bf , получаем искомое равенство.
Определение 6.1.7. Симметрическая билиней ная форма B на векторном пространстве над
R называется скалярным произведением, если она положительно определена, то есть для лю‐
бого v 6= 0 выполнено B(v, v) > 0.
Замечание 6.1.8. Положительная определенность эквивалентна одновременному выпол‐
нению следующих двух условий :
• Положительная полуопределенность: B(v, v) > 0 для любого v;
• Определенность: B(v, v) = 0 только для v = 0.
Если на вещественном векторном пространстве
p задано скалярное произведение B, то дли‐
ну вектора можно определить как |v| = B(v, v), а угол θ между векторами u, v определяется
посредством равенства cos θ = B(u,v)
|u|·|v| .
6.2 Квадратичные формы

С каждой билиней ной формой B можно связать отображение QB : v 7→ B(v, v). Такое отобра‐
жение является однородным степени 2, то есть QB (λv) = λ2 QB (v). В таких случаях говорят,
что это квадратичное отображение.
Заметим сразу, что разным билиней ным формам может соответствовать одно и то же отоб‐
ражение, например, для билиней ных форм с матрицами ( 10 11 ) и ( 11 01 ). Дей ствительно, если
вектор v задается столбцом (x, y)⊤ , то

1 1 x 2 2 1 0 x
(x, y) = x + xy + y = (x, y) .
0 1 y 1 1 y
С другой стороны, если 2 6= 0 в базовом поле F , то симметрическая такая билиней ная форма
BQ восстанавливается по Q = QB однозначно, а именно
1
BQ (u, v) = Q(u + v) − Q(u) − Q(v) .
2
Такая билиней ная форма называется поляризацией квадратичного отображения Q.
BQ билиней ная, так как ее можно выразить через исходную форму B следующим образом:
1 1
BQ (u, v) = B(u + v, u + v) − B(u, u) − B(v, v) = B(u, v) + B(v, u) .
2 2

С другой стороны BQ (v, v) = 12 Q(2v) − 2Q(v) = Q(v).
Докажем единственность. Пусть B(v, v) = C(v, v) для всех v. В частности, B(u + v, u +
v) = C(u + v, u + v), иными словами (после раскрытия по билиней ности и использования
симметричности)
B(u, u) + 2B(u, v) + B(v, v) = C(u, u) + 2C(u, v) + C(v, v),
откуда B(u, v) = C(u, v).
108
Определение 6.2.1. Отображение Q : V → F называется квадратичной формой, если оно
квадратично и его поляризация является билиней ной формой .
Определение 6.2.2. Матрицей Грама квадратичной формы называется матрица Грама ее
поляризации.
Выше мы видели, что с квадратичным отображением связано также полиномиальное вы‐
ражение. После выбора в пространстве V (размерности n) базиса можно отождествить квад‐
ратичную форму Q с однородным многочленом степени 2 (от n переменных) следующим
образом.
Пусть B — матрица грама Q в базисе e. Положим
X
n
q(x1 , . . . , xn ) = Bi,j xi xj .
i,j=1
Ясно, что в этом определении можно использовать любую матрицу, но ее всегда можно по‐
лагать симметрической , заменив при необходимости на (B + B ⊤ )/2 — многочлен при этом
не изменится. При этом для вектора v со столбцом координат (a1 , . . . , an )⊤ значение Q(v)
можно вычислить как q(a1 , . . . , an ).

2 2 1 1/2
Пример 6.2.3. Однородному многочлену x + xy + y соответствует матрица 1 .
/2 1
Пример 6.2.4. Пусть V = R2 . Отображение (x, y)⊤ 7→ max(xy, 0) является квадратичным, но
не является квадратичной формой .
6.3 Диагонализация билинейных и квадратичных форм

Определение 6.3.1. Если базис e1 , . . . , en таков, что матрица Грама Be диагональная, то ба‐
зис e называется ортогональным, а форма диагонализированной. Иными словами, базис ор‐
тогонален, если любые два его различных элемента ортогональные, то есть B(ei , ej ) = 0 при
i 6= j.
Аналогично определяется диагонализированная квадратичная форма. В терминах одно‐
родных многочленов квадратичная форма от переменных x1 , . . . , xn является диагональной ,
если она выражается как линей ная комбинация квадратов переменных:
q(x1 , . . . , xn ) = λ1 x21 + . . . + λn x2n .
Естественным образом возникает вопрос, как для данной билиней ной или квадратичной
формы най ти базис или замену переменных, приводящие к диагональному виду. Начнем с
процедуры диагонализации квадратичной формы, известной как метод Лагранжа.
Алгоритм 6.3.2 (Диагонализация
Pn квадратичной формы методом Лагранжа).
Пусть q(x1 , . . . , xn ) = i,j=1 Aij xi xj , причем матрица A симметрическая, то есть A⊤ = A.
Ищем такую линей ную замену x = Cy, что q(x) = qe(y) = λ1 y12 + . . . + λn yn2 .
1. Проверяем, най дется ли в матрице A ненулевой диагональный элемент Aii 6= 0. Если
такого элемента нет, то най дем слагаемое вида 2Aij xi xj , Aij 6= 0 (двой ка появляется
из‐за наличия равных слагаемых Aij xi xj и Aji xj xi ), и сделаем замену
xi = yi + yj , x j = yi − yj , xk = yk при k 6= i, j.
При такой замене слагаемое 2Aij xi xj перей дет в 2Aij (yi2 −yj2 ), то есть в терминах новых
переменных появится ненулевой диагональный элемент.
109
2. Пусть теперь Aii 6= 0, чего всегда можно добиться с помощью предыдущего шага. Для
удобства обозначений будем считать, что i = 1 (кроме того, можно перенумеровать
переменные). Рассмотрим слагаемые, содержащие x1 , и выделим полный квадрат:
1
A11 x21 + 2A12 x1 x2 + . . . + 2A1n x1 xn = (A11 x1 + . . . + A1n xn )2 − q ′ ,
A11
где q ′ не содержит квадратов и переменной x1 .

3. Процедуру повторить для квадратичной формы q ′ от переменных x2 , . . . , xn .
В терминах матрицы A эта процедура может быть истолкована следующим образом. При
замене базиса e на базис f матрица Грама преобразуется по правилу Be 7→ Bf = Cf⊤→e Be Cf →e .
Цель состоит в нахождении такого базиса f , что Bf диагональная. Можно искать его по‐
средством нахождения матрицы перехода Cf →e . Поскольку всякая обратимая матрица пред‐
ставляется в виде произведения матриц элементарных преобразований , разумно искать по‐
следовательность элементарных преобразований , реализующих диагонализацию. При этом
матрица Грама будет домножаться справа на матрицу элементарного преобразования C, а
слева на C ⊤ .
Второй шаг диагонализации по Лагранжу тогда представляется как прибавление перво‐
го столбца ко всем остальным с такими коэффициентами, чтобы в первой строке все эле‐
менты, кроме первого, обратились в ноль. Если матрица A имеет в качестве первой строки
(A11 , A12 , . . . , A1n ) с A11 6= 0, то такое прибавление реализуется домножением справа на мат‐
рицу, отличающуюся от единичной только в первой строке, равной

−A12 −A1n
1, ,..., .
A11 A11
Домножение слева на матрицу, транспонированную к данной , обнуляет все элементы пер‐

вого столбца, кроме A11 (например, потому что при преобразовании A 7→ C ⊤ AC симметри‐
ческая матрица остается симметрической , а домножение слева на такую матрицу не меняет
первой строки).
Если же A11 = A22 = 0, но A12 6= 0 (индексы 1 и 2 выбраны для удобства), то простая
замена также приведет к предыдущему случаю:

1 1 0 a 1 1 2a 0
= .
1 −1 a 0 1 −1 0 −2a
В итоге матрица приведена к блочно‐диагональному виду с двумя блоками размеров 1 и

n−1, и процесс можно повторить для большого блока, что не изменит уже полученных нулей
в первых строке и столбце.
Предложенный выше способ построения ортогонального базиса начинает с некоторого
уже най денного базиса e и модифицирует его. Вообще же для невырожденной симметриче‐
ской билиней ной формы можно с самого начала строить ортогональный базис. Для этого
требуется понятие ортогонального дополнения.
Определение 6.3.3. Пусть B — симметрическая билиней ная форма на векторном простран‐
стве V , и U 6 V . Тогда ортогональным дополнением U (относительно B) называется
U ⊥ = {v ∈ V | ∀u ∈ U v ⊥ u} .
Замечание 6.3.4. U ⊥ 6 V .
110
Доказательство. Если v, w ∈ U ⊥ , то для любых λ, µ ∈ F и для любого u ∈ U выполнено
B(λv + µw, u) = λB(v, u) + µB(w, u) = 0.
Замечание 6.3.5. Если B невырожденная, то U ∩ U ⊥ = 0.
Предложение 6.3.6. Если B — невырожденная симметрическая билиней ная форма на ко‐
нечномерном пространстве B, то V = U ⊕ U ⊥ .
Доказательство. Пусть u1 , . . . , uk — базис U . Тогда v ∈ U ⊥ тогда и только тогда, когда B(v, u1 ) =
. . . = B(v, uk ) = 0. Это позволяет выразить U ⊥ как ядро линей ного отображения V 7→ F k :
⊤
U ⊥ = Ker v 7→ B(v, u1 ), . . . , B(v, uk ) .
Заметим, что это отображение сюръективно (для каждого i существует такой v, что B(v, ui ) 6=
0 и B(v, uj ) = 0 при j 6= i, то есть стандартный базис F k лежит в образе). Тогда по теореме
о размерности ядра и образа dim(U ) + dim(U ⊥ ) = dim(V ). Поскольку в силу предыдущего
замечания U ∩ U ⊥ = 0, сумма U + U ⊥ прямая и потому имеет размерность, равную сумме
размерностей слагаемых, так что совпадает со всем V .
Теорема 6.3.7. Для любой симметрической билиней ной формы B на конечномерном про‐
странстве V существует ортогональный базис.
Доказательство. Сначала сведем задачу к случаю невырожденной формы. Для этого рас‐
смотрим подпространство V ⊥ (называемое радикалом формы B). Дополним его прямым сла‐
гаемым U , тогда объединение ортогонального базиса U и любого базиса V ⊥ дает ортого‐
нальный базис V . Тем самым достаточно най ти ортогональный базис U относительно невы‐
рожденной формы B|U .
Будем теперь считать, что B невырожденная. Будем вести доказательство индукцией по
n = dim(V ). Случай n = 1 тривиален (любой базис одномерного пространства ортогонален).
Предположим, что n > 1. Поскольку B 6≡ 0, то най дется такой вектор e1 , что B(e1 , e1 ) 6= 0.
Тогда V = he1 i ⊕ he1 i⊥ . По индукционному предположению в пространстве he1 i⊥ (имеющем
размерность n − 1) най дется ортогональный базис e2 , . . . , en . Тогда e1 , e2 , . . . , en — ортого‐
нальный базис V .
Пусть e1 , . . . , en — базис V , и обозначим A = Be . Рассмотрим подпространства Vk = he1 , . . . , ek i
(в частности, V0 = 0). Тогда (B|Vk )e = (Aij )ki,j=1 = Ak (то есть подматрица A размера k × k,

раcположенная в левом верхнем углу). В частности, An = A и A1 = B(e1 , e1 ) .
Обозначим ∆k = det(Ak ) (в частности, ∆0 = 1). Эти определители называются угловыми
минорами.
Теорема 6.3.8 (диагонализация по Якоби).
Если ∆1 , ∆2 , . . . , ∆n 6= 0, то существует такой ортогональный базис f1 , . . . , fn , что fk ∈
ek + Vk−1 и B(fk , fk ) = ∆∆k−1k
.
Доказательство. Индукция по n = dim(V ). В случае n = 1 положим f1 = e1 , B(f1 , f1 ) =

∆1
∆1 = ∆ 0
.
Пусть теперь n > 1. Применим индукционное предположение к e1 , . . . , en−1 (базису Vn−1 ):
най дется такой ортогональный базис f1 , . . . , fn−1 пространства Vn−1 , что B(fk , fk ) = ∆∆k−1
k
и
fk ∈ ek + Vk−1 . Будем строить fn в виде
X
n−1
fn = e n + λi fi .
i=1
111
Поскольку искомый базис должен быть ортогональным, должны выполняться равенства
X
n−1
0 = B(fn , fi ) = B(en , fi ) + λj B(fj , fi ) = B(en , fi ) + λi B(fi .fi ).
j=1
Отсюда получаем, что λi = −B(e n ,fi )

B(fi ,fi ) . Поскольку fn ∈ / Vn−1 , векторы f1 , . . . , fn образуют базис
Vn .
Пусть C — матрица перехода от e1 , . . . , en к f1 , . . . , fn . Так как fk ∈ ek + . . . e1 , . . . , ek−1 i, она
верхне‐треугольная с 1 на диагонали, так что det(C) = 1. Значит det(Bf ) = det(Be ) = ∆n . С
другой стороны, Bf = diag B(f1 , f1 ), . . . , B(fn , fn ) , так что det(Bf ) = B(f1 , f1 )·. . .·B(fn , fn ).

При этом ∆n−1 = det B|Vn−1 f = B(f1 , f1 ) · . . . · B(fn−1 , fn−1 ), откуда B(fn , fn ) = ∆∆n−1 n
.
Процесс построения базиса f1 , . . . , fn можно истолковать в геометрических терминах. А

именно, рассмотрим пару векторов e1 , e2 , и попробуем най ти пару ортогональных векторов
f1 , f2 , порождающих то же самое подпространство.
e2 − pre1 (e2 )
e2
f2 = pre1 (e2 )e1 = f1
Можно положить f1 = e1 , тогда для получения нужного вектора f2 можно вычесть из e2 его
проекцию на прямую, порожденную e1 . Проекция pre1 (e2 ) определяется как такое кратное
e1 , что при вычитании его из e2 получается вектор, ортогональный e1 . То есть pre1 (e2 ) = λe1 ,
B(e1 ,e2 )
где λ таково, что B(e1 , e2 − λe1 ) = 0 — отсюда λ = B(e 1 ,e1 )
.
Аналогично, если имеется три вектора e1 , e2 , e3 , из вектора e3 легко получить вектор, ор‐
тогональный e1 , e2 и находящий ся в том же трехмерном подпространстве — надо просто вы‐
честь из e3 его проекцию на плоскость he1 , e2 i. Последнее особенно просто, если e1 ⊥ e2 (чего
мы можем добиться, не меняя плоскость!) — надо вычесть из e3 проекции на e1 и e2 . Понятно,
как эта схема переносится на большее количество векторов. Такая интерпретация изложен‐
ной процедуры построения ортогонального базиса называется ортогонализацией Грама—
Шмидта. Как видно из теоремы о диагонализации по Якоби, для ее выполнимости требует‐
ся, чтобы в исходном базисе e1 , . . . , en все угловые миноры матрицы Грама были ненулевыми
— в частности, это выполнено, если билиней ная форма является скалярным произведением
(см. следующий раздел, хотя по процедуре и так видно, что делить надо только на B(v, v)).
Рассмотрим теперь, что описанная процедура означает в терминах матрицы Грама. Если в
диагонализации по Лагранжу на k‐м шаге подвергались изменениям все базисные векторы,
кроме первых k, то теперь, наоборот, на k‐м шаге меняется только k + 1‐й базисный вектор.
При этом обнуляться будут не элементы очередных строки и столбца, а только лишь часть
строки и столбца, принадлежащие угловой подматрице.
6.4 Классификация
Изучим теперь вопрос, однозначно ли определены диагональные элементы матрицы Гра‐
ма диагонализированной билиней ной формы. Вообще говоря, ответ на этот вопрос отрица‐
тельный — как минимум можно изменить порядок, в котором базисные векторы входят в
112
базис (что меняет порядок следования диагональных элементов), и домножить любой ба‐
зисный вектор на ненулевой скаляр λ (тогда соответствующий диагональный элемент до‐
множится на λ2 ).
В некоторых случаях указанных возможностей хватает, чтобы однозначно описать (с точ‐
ностью до замены базиса) все квадратичные формы. Например, если F = C, то любой скаляр
либо равен 0, либо является квадратом комплексного числа.
Предложение 6.4.1. Любая квадратичная форма над C приводится к сумме квадратов, то

есть имеет в некотором базисе матрицу Грама diag(1, . . . , 1, 0, . . . , 0), причем количество еди‐
ниц определено однозначно.
Доказательство. Соображения выше доказывают все, кроме однозначности такого пред‐
ставления. Заметим, что замена базиса не меняет ранг матрицы Грама (поскольку та до‐
множается слева и справа на обратимые матрицы), а у диагональной матрицы ранг равен
количеству ненулевых диагональных элементов.
В случае F = R для всякого скаляра x либо x = 0, либо x = y 2 , либо x = −y 2 для некоторо‐
го положительного y. Это означает, что выбором подходящего базиса матрицу Грама можно
сделать равной
diag(1, . . . , 1, −1, . . . , −1, 0, . . . , 0),
| {z } | {z }
k l
причем количество ненулевых элементов k + l определено однозначно и равно рангу мат‐

рицы Грама.
Такое представление для вещественных и комплексных квадратичных форм называется
нормальным видом.
Чтобы установить однозначность чисел k и l, надо воспользоваться понятием положи‐
тельной определенности.
Замечание 6.4.2. Положительно определенная квадратичная форма имеет нормальный вид

x21 + . . . + x2n .
Доказательство. Наличие −1 или 0 в диагонализации означало бы, что на соответствую‐
щем базисном векторе квадратичная форма принимает неположительное значение.
Теорема 6.4.3. Число k единиц в нормальном виде квадратичной формы Q является макси‐
мальной размерностью такого подпространства U 6 V , что Q|U положительно определена.
Доказательство. Если базис e таков, что Qe = diag(1, . . . , 1, −1, . . . , −1, 0, . . . , 0), то Q|⟨e1 ,...,ek ⟩
положительно определена. Покажем, что не существует такого подпространства большей
размерности. Предположим, что U 6 V таково, что Q|U положительно определена. Обозна‐
чим W = hek+1 , . . . , en i. Тогда для любого v ∈ W имеет место Q(v) 6 0. Это означает, что
U ∩ W = 0, откуда dim(U ) 6 k (так как dim(W ) = n − k и dim(U ) + dim(W ) = dim(U + W ) 6
n).
Следствие 6.4.4 (закон инерции вещественных квадратичных форм).
Числа k и l не зависят от выбора базиса для нормального вида вещественной квадратич‐
ной формы.
Доказательство. Число k определяется по предыдущей теореме как максимальная размер‐

ность подпространство, ограничение формы на которое положительно определено, а тогда
l однозначно восстанавливается как rk(Q) − k.
113
Определение 6.4.5. Числа k и l называются положительным и отрицательным индексами
инерции формы Q, а пара (k, l) — сигнатурой.
Можно также сказать, что отрицательный индекс инерции опредяется как максимальная размерность подпро‐
странства, ограничение на которое формы Q отрицательно определено, или, что то же самое, как положительный
индекс инерции формы −Q.
Теорема 6.4.6 (Якоби). Если ∆1 , . . . , ∆n 6= 0, то отрицательный индекс инерции равен ко‐

личеству перемен знака в последовательности 1, ∆1 , . . . , ∆n .
Доказательство. Количество перемен знака в последовательности угловых миноров мат‐
рицы Грама равно количеству отрицательных элементов внормальном виде квадратичной
формы.
Следствие 6.4.7 (критерий Сильвестра). Вещественная квадратичная форма является по‐
ложительно определенной тогда и только тогда, когда ∆1 , . . . , ∆n > 0.
Доказательство. Если квадратичная форма положительно определена, то положительно
определено и ее сужение на любое подпространство, в частности, на Vk = he1 , . . . , ek i. Но
∆k = det ((Q|Vk )e ) > 0.
Обратная импликация очевидна по теореме Якоби (или из теоремы о диагонализации ме‐
тодом Якоби).
6.5 Диагонализация ортогональным преобразованием

Ранее было доказано, что вещественный линей ный оператор, задаваемый симметрической
матрицей , диагонализируем. Иными словами, если A⊤ = A, то най дется такая обратимая
матрица C, что C −1 AC диагональна. Можно объединить это утверждение с результатами,
полученными выше для билиней ных форм, которые тоже задаются симметрическими мат‐
рицами.
Определение 6.5.1. Матрица O ∈ M(n, R) называется ортогональной, если O−1 = O⊤ .
Иными словами, матрица ортогональна, если ее столбцы попарно ортогональны и имеют
норму 1 относительно стандартного скалярного произведения на Rn . Дей ствительно, рас‐
смотрим, что означает равенство O⊤ · O = I:
(O⊤ · O)i,j = (O⊤ )i,∗ · O∗,j = (O∗,i )⊤ · O∗,j = δij .
Теорема 6.5.2. Если A ∈ M(n, R), A⊤ = A, то существует такая ортогональная матрица O,

что O−1 AO диагональна.
Доказательство. Столбцы такой матрицы O образуют базис из собственных векторов мат‐
рицы A.
Покажем, что собственные векторы, отвечающие различным собственным числам, орто‐
гональны. дей ствительно, пусть Au = λu и Av = µv, λ 6= µ. Тогда (u, Av) = µ(u, v) и (Au, v) =
λ(u, v). Но
(u, Av) = u⊤ Av = u⊤ A⊤ v = (Au)⊤ v = (Au, v),
откуда λ(u, v) = µ(u, v) и поэтому (u, v) = 0.
Если теперь для каждого собственного числа λ в подпространстве, образованном соответ‐
ствующим собственными векторами, выбрать ортогональный базис и каждый вектор от‐
нормировать к длине 1, то составленная из таких векторов матрица будет ортогональна.
114
Геометрический смысл состоит в том, что домножение на ортогональную матрицу дей ‐
ствует как движение, сохраняющее начало координат, то есть поворотами и отражениями.
Это значит, что вещественную квадратичную форму можно привести к диагональному виду
одними только поворотами. Такая процедура называется приведением к главным осям.
115
7 Теория полей
7.1 Простые расширения полей
Определение 7.1.1. Пусть F и K такие поля, что F ⊆ K. Тогда поле K называется расшире‐
нием поля F .
√
Примеры 7.1.2. Q ⊂ R ⊂ C, Q ⊂ Q[ 2], F ⊂ F (x).
Определение 7.1.3. Пусть f
g ∈ F (x). Можно считать, что f, g ∈ F [x] таковы, что f ⊥ g. Если
a ∈ F таково, что g(a) 6= 0, то определено значение f
g в точке a:

f f (a)
(a) = .
g g(a)
Определение 7.1.4. Пусть F ⊆ K — расширение полей , и α ∈ K. Определим поле, получен‐

ное присоединением α к F , как

f (α) f
F (α) = ∈ F (x), g(α) 6
= 0 ⊆ K.
g(α) g
Замечание 7.1.5. F (α) — поле.

Доказательство. Очевидно, что это подмножество поля K является кольцом (так как за‐
мкнуто относительно взятия сумм и произведений ). Остается показать, что всякий ненуле‐
вой элемент в нем обратим.
Если fg(α)
(α)
6= 0, то f (α) 6= 0, а тогда определено значение fg(α) f (α) g(α)
(α) , причем g(α) · f (α) = 1.
Обозначение 7.1.6. F (α) называется простым расширением поля F , порожденным α. Это

поле является наименьшим расширением поля F , содержащим α. Обратите внимание, что
результат не зависит от выбора конкретного расширения K, содержащего α.
√ √
Примеры 7.1.7. 1. C = R(i), 2. Q[ 2] = Q( 2).
Определение 7.1.8. Пусть F ⊆ K — расширение полей , и α ∈ K. Элемент α называется

алгебраическим над F , если существует такой f ∈ F [x], f 6= 0, то f (α) = 0. Если же элемент
α не является корнем никакого нетривиального многочлена с коэффициентами в F , то α
называется трансцендентным.
√ √
Примеры 7.1.9. π, π — трансцендентные над Q, но π — алгебраический над Q(π).
Замечание 7.1.10. Пусть α трансцендентен над F . Тогда для любой дроби f
∈ F (x) значе‐
g
ние fg (α) определено, так как g(α) 6= 0.
f1 (α) f2 (α) f1 f2
Замечание 7.1.11. Пусть α трансцендентный . Если g1 (α) = g2 (α) , то g1 = g2 .
Доказательство. f1 (α)g2 (α) = f2 (α)g1 (α), откуда (f1 g2 − f2 g1 )(α) = 0, что возможно только
при f1 g2 − f2 g1 = 0, то есть gf11 = gf22 .
Следствие 7.1.12. Если α трансцендентный над F , то F (α) ∼

= F (x).
116
Это означает, что рациональные функции одно переменной представляют универсальную
модель для всех простых расширений , порожденных трансцендентными элементами. Такие
расширения называются простыми трансцендентными расширениями. В частности, с точ‐
ностью до изоморфизма нет разницы, какой именно трансцендентный элемент выбирать.
Для простых расширений , порожденных алгебраическими элементами, такой общей модели
нет, но все же есть способ описывать их, не вводя предварительно расширение K, в котором
выбирается алгебраический элемент.
Определение 7.1.13. Пусть α — алгебраический над F . Тогда многочлен f ∈ F [x], f 6= 0

называется минимальным многочленом α над F , если f (α) = 0 и степень f наименьшая воз‐
можная.
Замечание 7.1.14. Минимальный многочлен существует и единственный с точностью до
умножения на скаляр.
Доказательство. Предположить, что существуют два таких многочлена, отнормировать так,
чтобы старшие коэффициенты были равны 1, рассмотреть разность — это будет аннулиру‐
ющий многочлен меньшей степени.
Обозначение 7.1.15. Минимальный многочлен α над F обозначается µα,F или, если поле F
ясно из контекста, просто µα .
Примеры 7.1.16. 1. µi,R = x2 + 1, 2. µ√2,Q = x2 − 2.
Если рассматривать F (α) как векторное пространство над F , то минимальный многочлен элемента α совпадает
с минимальным многочленом линей ного оператора x 7→ αx, дей ствующего на F (α).
Замечание 7.1.17. µα,F неприводим над F .

Доказательство. Дей ствительно, если µα,F = f g, где f, g ∈ F [x], то либо один из f и g кон‐
станта, либо они имеют степень, меньшую deg µα,F , но при этом f (α)g(α) = µα,F (α) = 0, так
что один из них аннулирует α, что противоречит минимальности µα,F .
.
Замечание 7.1.18. Если f (α) = 0, то f .. µα .
Доказательство. gcd(f, µα ) = µα .
Определение 7.1.19. Степенью алгебраического элемента α называется deg(α) = deg(µα,F ).

Предложение 7.1.20. Если α алгебраический над F , то F (α) = {f (α) | f ∈ F [x]}.
Доказательство. Дей ствительно, если fg такая несократимая дробь, что g(α) 6= 0, то g ⊥ µα .
Тогда по теореме о линей ном представлении НОД най дутся такие A, B ∈ F [x], что gA+µα F =
1. Вычислим значение левой и правой частей на α: g(α)A(α) + µα (α)B(α) = 1, откуда A(α) =
1 f (α)
g(α) и тем самым g(α) = f (α)A(α).
Выясним теперь, когда значения двух многочленов на α совпадают. Если f (α) = g(α), то
f − g аннулирует α и потому f ≡ g (mod µα ).
Следствие 7.1.21. Элементы F (α) находятся в биективном соответствии с классами много‐
членов в F [x] относительно ≡µα .
√
Примеры 7.1.22. 1. C ∼ = R[x]/≡x2 +1 , 2. Q( 2) ∼
= Q[x]/≡x2 −2 .
117
Обозначение 7.1.23. Пусть F — поле, f ∈ F [x]. Положим
F [x]/(f ) = {[g] | g ∈ F [x]}, где [g] = [g]≡f = {h ∈ F [x] | h ≡ g (mod f )}.
Это коммутативное кольцо с 1 относительно операций
[g] + [h] = [g + h], [g][h] = [gh].

√
Примеры 7.1.24. 1. C ∼
= R[x]/(x2 +1) , 2. Q( 2) ∼
= Q[x]/(x2 −2) .
Пример 7.1.25. Рассмотрим поле F = F2 = Z/2Z из двух элементов. Над F2 есть только один
неприводимый многочлен степени 2, а именно, f = x2 +x+1. Дей ствительно, x2 +x−(x+1)x,
x2 + 1 = (x + 1)2 и x2 приводимы, а других произведений многочленов степени 1 нет.
Тогда F2 [x]/(f ) = 0, 1, ρ, ρ + 1 — поле из 4 элементов. Здесь ρ = [x], а умножение устроено
следующим образом:
ρ2 = [x]2 = [x2 ] = [x + 1] = [x] + [1] = ρ + 1,

ρ · (ρ + 1) = ρ2 + ρ = ρ + 1 + ρ = 1,
(ρ + 1)2 = ρ2 + 1 = ρ + 1 + 1 = ρ.
Предложение 7.1.26. Если f ∈ F [x] неприводим над F , то F [x]/(f ) является полем.

Чтобы доказать это предложение, нужна некоторая подготовка.
Определение 7.1.27. Класс [g] в F [x]/(f ) называется примитивным, если gcd(g, f ) = 1 (об‐
ратите внимание, что это не зависит от выбора конкретного представителя g).
Теорема 7.1.28. В F [x]/(f ) обратимы примитивные классы и только они.
Доказательство. Пусть gcd(g, f ) = 1, тогда най дутся такие A, B ∈ F [x], что gA + f B = 1.
Это означает, что gA ≡ 1 (mod f ) и [A] = [g]−1 .
Пусть теперь [g] обратим, то есть существует такой A ∈ F [x], что [g][A] = 1. Это означает,
что [gA] = 1, или, что то же самое, gA ≡ 1 (mod f ). Значит, существует такой B ∈ F [x], что
gA + f B = 1, откуда gcd(g, f ) = 1.
Доказательство Предложения. Если f неприводим, то для любого g ∈ F [x], не делящегося
на f , непременно g ⊥ f , то есть [g] примитивен и потому обратим.
Следствие 7.1.29. Если α алгебраический над F , то F (α) ∼

= F [x]/(µα,F ) .
7.2 Степень расширения

Определение 7.2.1. Пусть F ⊆ K — расширение полей . Тогда K можно рассматривать как
векторное пространство над F . Степенью расширения называется [K : F ] = dimF K. Расши‐
рение называется конечным, если оно имеет конечную степень.
√
Примеры 7.2.2. 1. [C : R] = 2, 2. [Q[ 2] : Q] = 2, 3. [F2 [x]/(x2 +x+1) : F2 ] = 2, 4. [F (x) : F ] = ∞,
5. [R : Q] = ∞.
Предложение 7.2.3. Пусть F ⊆ K ⊆ L — цепока расширений . Если [K : F ], [L : K] < ∞, то

[L : F ] = [L : K][K : F ].
118
Доказательство. Пусть α1 , . . . , αn — базис L над K, а β1 , . . . , βm — базис K над F . В частно‐
сти, в этих обозначениях n = [L : K] и m = [K : F ].
Рассмотрим произвольный элемент α ∈ L и разложим его по базису L над K:
α = γ1 α1 + . . . + γn αn ,
где γi — некоторые элементы поля K. Но теперь каждый из γi можно разложить по базису

K над F :
γi = λi,1 β1 + λi,2 β2 + . . . + λi,m βm ,
где λi,j ∈ F . Подставляя эти выражения для γi , получаем
X
n X
m
α= λi,j · βj αi .
i=1 j=1
Это означает, что набор {βj αi } i=1,...,n является порождающим для L как векторного про‐
j=1,...,m
странства над F . Покажем, что это базис — для этого проверим линей ную независимость.
Предположим, что для некоторых коэффициентов ci,j
n X
X m
ci,j · βj αi = 0.
i=1 j=1
Но можно сгруппировать слагаемые, имеющие множитель αi :

 
Xn X
m
 ci,j βj  · αi = 0.
i=1 j=1
Поскольку αi образуют базис L над K, в все коэффициенты такой линей ной комбинации
должны быть нулевыми:
X m
ci,j βj = 0.
j=1
Но так как βj сами линей но независимы над F , в каждой из таких линей ных комбинаций все
коэффициенты должны быть нулевыми, то есть ci,j = 0.
7.3 Алгебраические расширения

Определение 7.3.1. Расширение F ⊆ K называется алгебраическим, если все элементы K
алгебраичны над F .
Примеры 7.3.2. R ⊂ C, F2 ⊂ F2 [x]/(x2 +x+1) .

Теорема 7.3.3. Конечное расширение алгебраично.
Доказательство. Пусть [K : F ] = n < ∞. Тогда для α ∈ K элементы 1, α, α2 , . . . , αn линей но
зависимы над F (так как их количество превосходит размерность). Это означает, что суще‐
ствуют такие c0 , c1 , . . . , cn ∈ F , не все равные 0, что c0 ·1+c1 α+. . .+cn αn = 0, иными словами,
элемент α является корнем многочлена c0 + c1 x + . . . + cn xn и потому алгебраичен.
119
Замечание 7.3.4. Обратное неверно. Например, можно рассмотреть поле Q = {α ∈ C |
α алгебраично над Q} (то, что это поле, надо доказывать отдельно!). Поскольку существу‐
ют неприводимые многочлены над Q сколь угодно большой степени, [Q : Q] = ∞.
Другой пример — положить F2 = Q и Fn = Fn−1 (εn ), где εn — первообразный корень из
1 степени n. Тогда возникает цепочка нетривиальных расширений F2 ⊂ F3 ⊂ F4 ⊂ . . . Ясно,
что F = ∪∞ n=2 — тоже поле, причем [F : Q] = ∞, хотя расширение алгебраическое.
Теорема 7.3.5 (структура простых алгебраических расширений ).

Пусть α — алгебраический над F степени n, µα — его минимальный многочлен над F .
Тогда
1. F (α) ∼
= F [x]/(µα ) ,
2. [F (α) : F ] = n и 1, α, α2 , . . . , αn−1 — базис F (α) над F ,
.
3. Для любого β ∈ F (α) выполнено n .. deg(β).
Доказательство. Первый пункт уже доказан.
Второй пункт: дей ствительно, 1, α, α2 , . . . , αn−1 порождают F (α), так как у всякого f ∈
F [x] най дется такой g ∈ F [x], что f ≡ g (mod µα ) и deg(g) < n (остаток от деления f на µα ),
и потому f (α) = g(α), в то время как g(α) ∈ h1, α, . . . , αn−1 i. Линей ная независимость ука‐
занных элементов следует из того, что максимальная входящая в набор степень α меньше
степени минимального многочлена.
Для доказательства третьего пункта рассмотрим цепочку расширений F ⊆ F (β) ⊆ F (α),
тогда n = [F (α) : F ] = [F (α) : F (β)][F (β) : F ], но второй множитель по второму пункту
равен deg(β).
Замечание 7.3.6. Пусть f ∈ F [x] неприводим, а α и β — корни f . Тогда F (α) ∼
= F (β) посред‐
ством изоморфизма φ, дей ствующего тождественно на F (т.е. φ|F = idF ) и переводящего α
в β (φ(α) = β).
Доказательство. Оба поля изоморфны F [x]/(f ) посредством изоморфизмов, переводящих
α и β в [x]≡f .
Определение 7.3.7. Полем, полученным из F присоединением элементов α1 , . . . , αn , будем
называть

f (α1 , . . . , αn )
F (α1 , . . . , αn ) = f, g ∈ F [x1 , . . . , xn ], g(α1 , . . . , αn ) 6= 0 .
g(α1 , . . . , αn )
Альтернативно, можно определить такое расширение рекуррентной формулой F (α1 , . . . , αn ) =

F (α1 , . . . , αn−1 )(αn ).
Определение 7.3.8. Пусть F ⊆ K — расширение полей , f ∈ F [x], deg(f ) > 0. Говорят, что
f разложим над K, если существут такие α1 , . . . , αn ∈ K (не обязательно различные), что
f = a · (x − α1 ) · . . . · (x − αn ), где a ∈ F — старший коэффициент f .
K называется полем разложения f , если f разложим над K и, кроме того, K = F (α1 , . . . , αn ).
Смысл этого определения в том, что поле разложения является наименьшим расширени‐
ем, в котором данный многочлен оказывается разложим: если F ⊆ E ⊆ K и f разложим
также над E, то E = K (поскольку уже содержит все корни f ).
Теорема 7.3.9. Поле разложения f ∈ F [x] существует и единственно (с точностью до изо‐
морфизма, переставляющего корни и дей ствующего тождественно на F ).
120
Доказательство. Разложим f на неприводимые множители над F : f = f1 · . . . · fk , fi ∈ F [x]
неприводимы. Положим F1 = F [x]/(f1 ). Рассматривая f1 как многочлен в F1 [x], получаем
f = (x − α1 ) · . . . · (x − αm ) · g1 · . . . · gl ,
где gi ∈ F1 [x] неприводимы. Теперь положим F2 = F1 [x]/(g1 ) и снова выделим линей ные
множители, отвечающие g1 . Будем продолжать таким же образом, пока не получим разло‐
жение f = a · (x − α1 ) · . . . · (x − αn ). Хотя на каждом шаге количество неприводимых множи‐
телей может увеличиваться, суммарная степень множителей степени больше 1 (то есть не
линей ных, которые требуется разложить) строго убывает, поэтому процесс будет завершен
за конечное число шагов (альтернативно: у f не может получиться корней больше, чем его
степень — это дает еще и ограничение на число шагов).
Единственность следует из Замечания 7.3.6 и рекуррентного определения для таких рас‐
ширений .
7.4 Конечные поля

Нам уже известны некоторые примеры конечных полей : Fp = Z/pZ для простого p (состоит
из p элементов) и F2 [x]/(x2 + x + 1) — поле из 4 элементов. Ясно также, что любое конечное
расширение конечного поля снова является конечным полем. Цель настоящего раздела —
классифицировать и описать все конечные поля.
Определение 7.4.1. Характеристикой поля F называется наименьшее натуральное n, что
сумма n единиц поля F равно 0 — или 0, если такого n не существует. Обозначение: char(F ).
Пример 7.4.2. char(Fp ) = p.

Замечание 7.4.3. Если F ⊆ K, то char(K) = char(F ).
Замечание 7.4.4. Если char(F ) > 0, то это простое число.
Доказательство. Пусть char(F ) = m · n, где m, n 6= 1. Тогда
0 = 1 + . . . + 1 = 1 + . . . + 1 + . . . + 1 + . . . + 1 = (1 + . . . + 1) · (1 + . . . + 1),
| {z } | {z } | {z } | {z } | {z }
mn m m m n
| {z }
n
и оба множителя не равны 0 (число слагаемых меньше характеристики).
Определение 7.4.5. Пусть F поле. Тогда E ⊆ F называется простым подполем, если E не

содержит подполей .
Замечание 7.4.6. Простое подполе F это либо Q, либо Fp , в зависимости от char(F ).
Доказательство. Пусть E — простое подполе F . Тогда 1 ∈ F . Если char(F ) = p > 0, то
{1, 2, 3, . . . , p − 1, 0} ⊆ E, а это уже Fp . Если же char(F ) = 0, то для любого n ∈ N соответству‐
ющий элемент F не равен 0. Это означает, что в E вкладывается кольцо целых чисел Z, а
тогда вместе с каждой парой ненулевых целых чисел m, n в E попадает и их частное, а тогда
Q ⊆ E.
Следствие 7.4.7. Если поле F конечное, что char(F ) > 0.
Лемма 7.4.8. Пусть |K| < ∞, F ⊆ K, |F | = q. Тогда |K| = q m , где m = [K : F ].
121
Доказательство. K является конечномерным векторным пространством над F , то есть как
векторное пространство изоморфно F m . Количество элементов последнего равно q m .
В качестве моментального следствия из уже полученных результатов получаем следую‐
щий фундаментальный результат.
Теорема 7.4.9. Пусть F — конечное поле. Тогда най дутся такое простое p и натуральное n,
то |F | = pn .
Доказательство. p = char(F ), а n — степень F над его простым подполем.
Следующая наша задача — классифицировать все конечные поля данного размера. Нач‐
нем с нескольких вспомогательных утверждений . Следующий результат является прямым
обобщением малой теоремы Ферма.
Лемма 7.4.10. Пусть |F | = q. Тогда для любого a ∈ F выполнено aq = a.
Доказательство. Если a = 0, то все ясно. Пусть a 6= 0. Рассмотрим цепочку степеней a, начи‐
ная с нулевой :
1, a, a2 , a3 , . . .
В какой ‐то момент начнутся повторы (так как все происходит внутри конечного множества).
Если ak = al с k > l, то ak−l = 1, так что первый повтор — единица. Обозначим полученное
множество степеней A:
A = {1, a, a2 , . . . , ak−1 },
где ak = 1. Введем следующее отношение эквивалентности на F ∗ = F \ {0}:
x
x∼y ⇔ ∈ A.
y
Это дей ствительно эквивалентность: 1 ∈ A (рефлексивность); так как a−1 = ak−1 , из xy ∈ A

следует xy ∈ A (симметричность); A замкнуто относительно умножения, так что из xy , yz ∈ A
следует xz ∈ A (транзитивность). Значит, F ∗ разбивается в объединение непересекающихся
классов эквивалентности.
Заметим, что все классы имеют одинаковый размер. Дей ствительно, между классами [x]∼
и [y]∼ легко построить биекцию, а именно z 7→ xy z (это биекция, потому что есть обратное
отображение z 7→ xy z). Значит, |[x]∼ | = |[1]∼ | = |A| = k, так что |F ∗ | делится на k. Поскольку
|F ∗ | = q − 1 и ak = 1, получаем, что aq−1 = 1.
Определение 7.4.11. Для a ∈ F ∗ положим ord(a) = min{n ∈ N | an = 1} — порядок a.
Замечание 7.4.12. Если |F | = q, то ord(a) | q − 1.
Лемма 7.4.13.
Q Если |F | = q, E ⊆ F , то xq −x ∈ E[x] раскладывается на линей ные множители
x − x = a∈F (x − a) и F — поле разложения xq − x.
q
Доказательство. По предыдущей лемме каждый элемент F является корнем xq − x, в то

время как по теореме Безу у xq − x не больше q корней (и все они перечислены в указанном
разложении). Ясно также, что поле F можно получить присоединением всех его элементов
к полю E (хватит и меньшего их количества).
Теорема 7.4.14 (существование и единственность конечных полей ).
Для любого простого p и любого натурального n существует поле F из q = pn элементов.
Любое поле из pn элементов является полем разложения xq − x над Fp .
122
Доказательство. Докажем сначала существование. Пусть F — поле разложения xq − x над
Fp . Многочлен xq − x имеет q различных корней , так как его производная (xq − x)′ = qxq−1 −
1 = −1 не имеет общих корней с xq − x.
Положим S = {a ∈ F | aq − a = 0} — это подполе F . Дей ствительно, 0, 1 ∈ S, (a − b)q =
a − bq = a − b (так что a − b ∈ S), (ab−1 )q = aq · (b−1 )q = aq · (bq )−1 = ab−1 (так что ab−1 ∈ S).
q
xq − x разложим в S, следовательно, S = F , так что |F | = q.

Единственность следует по Лемме из того, что |F | = pn и Fp ⊆ F .
Обозначение 7.4.15. Для q = pn будем обозначать Fq поле из q элементов. Часто Fq еще
обозначают GF (q) и называют полем Галуа.
7.5 Строение конечных полей

Теорема 7.5.1. Пусть |F | = q = pn . Любое подполе поля F состоит из pm элементов, где m | n.
Обратно, если m | n, то существует подполе порядка pm , причем только одно.
Доказательство. Если Fp ⊆ E ⊆ F , то |E| = pm , где m = [E : Fp ], и n = [F : Fp ] = [E :
Fp ] · [F : E].
Обратно, заметим, что (x − 1) | (xk − 1), так как xk − 1 = (x − 1)(xk−1 + xk−2 + . . . + 1). Если
m | n, то pm − 1 | pn − 1 (если n = mk, подставим x = pm в соотношение для многочленов).
Если a | b, то xa − a | xb − 1 (если a = bc, подставим xa в соотношение для многоченов).
Совмещая два наблюдения, получам, что xp −1 − 1 | xp −1 − 1, откуда xp − x | xp − x.
m n m n
m m
Следовательно, всякий корень xp −x является корнем xp −x = xq −x, а значит, Fq содержит
m
поле разложения xp − x над Fp , которое состоит из pm элементов.
Если есть два таких подполя, то вместе они содержат больше чем pm корней многочлена
pm
x − x, противоречие.
Пример 7.5.2. На диaграмме ниже представлены все подполя поля из 230 элементов.
GF (230 )
GF (26 ) GF (210 ) GF (215 )
GF (22 ) GF (23 ) GF (25 )
GF (2)
Теорема 7.5.3. F∗q — циклическая группа, то есть существует такой a ∈ Fq , что
F∗q = {1, a, a2 , . . . , aq−2 }.
Доказательство. Случай q = 2 ясен. Пусть q > 3. Обозначим h = |F∗q | = q − 1 и разложим его

на простые множители: h = pr11 · . . . · prmm . Для каждого i = 1, . . . , m многочлен xn/pi − 1 имеет
не больше n/pi корней в Fq . Так как n/pi < h, най дется элемент ai ∈ Fq , не являющий ся
r r
h/pi i (pi i )
корнем xn/pi − 1. Положим bi = ai , так что bi = 1. Тогда, в частности, ord(bi )|pri i , то
ri −1
p h/p
есть ord(bi ) = psi i для некоторого si = 1, . . . , ri . Поскольку bi i = ai i 6= 1, получаем, что в
ri
дей ствительности si = ri и ord(bi ) = pi .
Положим b = b1 · . . . · bm . Докажем, что ord(b) = h. Так как по построению bh = 1, имеем
ord(b) | h. Пусть ord(b) < h. Най дется такой индекс i, что ord(b) | h/pi , скажем, i = 1. Тогда
123
h/p1 h/p1 h/p1 r h/p1
1 = bh/p1 = b1 · b2 · . . . · bm . Если j = 2, . . . , m, то pj j | h/p1 , следовательно, bi = 1,
h/p
откуда b1 1 = 1, то есть ord(b1 ) | h/p1 . Но ord(b1 ) = pr11 , противоречие. Значит, в качестве
искомого элемента a можно выбрать b.
Определение 7.5.4. Такой элемент a называется примитивным элементом поля Fq .
Следствие 7.5.5. Fq ⊆ Fr — простое расширение, и для любого примитивного элемента ξ

поля Fr выполнено Fr = Fq (ξ).
Следствие 7.5.6. Для любого конечного поля Fq и для любого n ∈ N существует неприво‐
димый f ∈ Fq [x], deg(f ) = n.
Доказательство. Пусть Fq ⊆ Fr — расширение степени n, |Fr | = q n . Тогда Fr = Fq (ξ) и,

следовательно, µξ,Fq ∈ Fq [x] имеет степень [Fr : Fq ] = n и неприводим.
124
8 Коды с коррекцией ошибок
8.1 Линейные коды
Код с коррекцией ошибок это способ так представить сообщение, чтобы при передаче его
по ненадежному каналу связи возникающие ошибки, если они не слишком многочисленны,
можно было обнаружить и, в идеале, исправить на стороне приемника. Мы всегда будем по‐
лагать, что сообщение представлено последовательностью бит, каждый из которых прини‐
мает одно из q значений , которые мы трактуем как элементы поля из q элементов — в про‐
стей шем и наиболее важном случае q = 2 биты принимают два значения 0 и 1 (такие коды
называют двоичными).
В дальней шем мы будем трактовать запись b1 b2 . . . bm как вектор‐столбец (b1 , b2 , . . . , bm )⊤ ∈
Fq .
m
Код мы будем понимать как отображение кодирования Fkq → Fnq , сопоставляющее каждо‐
му сообщению из k бит кодовое слово из n бит.
Примеры 8.1.1. Простей шие примеры кодирования доставляются стуледующими двумя

примерами.
1. Код с одной проверкой четности: сообщению b1 b2 . . . bk сопоставляется b1 b2 . . . bk bk+1 ,
где bk+1 = b1 + . . . + bk (сумма в поле Fq ). В случае q = 2 последний бит содержит
информацию о четности количества единиц в исходном сообщении — если при пере‐
даче произой дет одна ошибка (или, более общно, нечетное число ошибок), то послед‐
ний бит принятого сообщения не будет равен сумме предыдущих, но установить, ка‐
кой именно бит принят неверно, невозможно. В общем случае такой код следовало бы
называть скорее кодом с одной контрольной суммой , но здесь и далее почти вся тер‐
минология отражает особенности двоичного случая.
2. Код с повторениями: сообщению из одного бита b сопоставляется bb . . . b (n повторе‐

ний ) — здесь правильное исходное сообщение восстанавливается как значение, при‐
сутствующее в наибольшем числе бит принятого сообщения.
Нас будет интересовать главным образом не процедура кодирования, а множество кодо‐
вых слов — предполагается, что соответствие между исходными сообщениями и кодовыми
словами известно обоим сторонам, и задача состоит в правильном восстановлении кодово‐
го слова по принятому сообщению. Нас будут интересовать коды, в которых кодирование
задается линей ным отображением. Мы всегда предполагаем, что отображение кодирования
инъективно (иначе приемник даже с правильным кодовым словом не сможет восстановить
исходной сообщение).
Определение 8.1.2. Код C называется линейным, если он является подпространством про‐
странства принимаемых сообщений Fnq . Тогда он является инъективным образом простран‐
ства исходных сообщений Fkq , и тем самым имеет размерность k.
Число n называется длиной кода C, k — размерностью C, а сам C в таком случае называ‐
ется (n, k)‐кодом.
Поскольку C является подпространством, оно выделяется набором однородных линей ‐

ных уравнений , то есть
C = {x ∈ Fnq | Hx = 0}
для некоторой матрицы H ∈ M(n − k, n, Fq ). Такая матрица H называется проверочной мат‐
рицей линей ного кода C.
125
Простей ший способ построить линей ный код — прямое обобщение кода с одной провер‐
кой четности — формировать кодовое слово в виде
a1 a2 . . . ak bk+1 . . . bn .
исходное проверочные
сообщение символы
Тогда всякое кодовое слово такого вида удовлетворяет системе линей ных уравнений с мат‐
рицей H = (A|In−k ), где A ∈ M(n − k, k, Fq ). А именно,
(A|In−k ) · (a1 , . . . , ak , bk+1 , . . . , bn )⊤ = A · (a1 , . . . , ak )⊤ + In−k · (bk+1 , . . . , bn )⊤ .
Если проверочные символы определяются через символы исходного сообщения посредством

линей ного отображения
(bk+1 , . . . , bn )⊤ = B · (a1 , . . . , ak )⊤ ,
то при A = −B указанная H дей ствительно является проверочной матрицей для такого
кода.
1. Для кода с одной проверкой четности

H = −1 −1 ... −1 1 .
2. Для кода с повторениями  

−1 1
 .. .. 
H= . . .
−1 1
Поскольку строчные преобразования не меняют пространства решений , одному коду со‐

ответствуют различные проверочные матрицы. Более того, всегда можно выбрать прове‐
рочную матрицу в приведенной эшелонированной форме, то есть как в примере выше: H =
(A|In−k ). Такая форма проверочной матрицы называется каноническим видом.
Наряду с проверочной матрицей можно также определить порождающую матрицу линей ‐
ного кода, а именно, это в точности матрицы линей ного отображения кодирования. Если мы
рассматриваем код как множество кодовых слов и забываем про процедуру кодирования, то
порождающую матрицу можно определить как такую G ∈ M(n, k, Fq ), то C = Im(G) = {Gx |
x ∈ Fkq }. В качестве G можно выбрать матрицу, составленную из любых k линей но незави‐
симых векторов кода C.
Замечание 8.1.4. HG = 0.
В случае, когда проверочная матрица H = (A|In−k ) записана в каноническом виде, можно
явно выбрать порождающую матрицу в виде

Ik
G= .
−A
Линей ность кода C означает, кроме прочего, что вместе с любыми x, y ∈ C также x + y ∈ C
и λx ∈ C для любого λ ∈ Fq .
126
8.2 Исправление ошибок в линейных кодах
Пусть исходное сообщение преобразовано в кодовое слово x = x1 . . . xn , а приемник получил
сообщение y = y1 . . . yn . Внесенные при передаче ошибки описваются вектором ошибок e =
y − x = e1 . . . en . Процесс исправления ошибок должен по принятому сообщению y най ти
наиболее вероятное кодовое слово x — предполагая, что вектор ошибок «мал». Для начала
надо определить, в каком смысле вектор ошибок мал и в каком смысле сообщения близки.
Определение 8.2.1. Расстоянием Хэмминга между векторами x = x1 . . . xn и y = y1 . . . yn
называется число позиций , в которых они различаются: dist(x, y) = |{i | xi 6= yi }|.
Замечание 8.2.2. Для двоичных кодов dist(x, y) = dist(y − x, 0).
Определение 8.2.3. Вес Хэмминга wt(z) = dist(z, 0) — количество ненулевых элементов
вектора z.
С каждым кодом связана важная характеристика, выражающая, насколько плотно распо‐
ложены в пространстве принимаемых сообщений кодовые слова.
Определение 8.2.4. Минимальное расстояние кода C
d = dmin = min{dist(x, y) | x, y ∈ C, x 6= y}.
Для двоичных кодов dmin = min{wt(x) | x ∈ C, x 6= 0}.
Код длины n, размерности k и с минимальным расстоянием d называется (n, k, d)‐кодом.
Теорема 8.2.5. Код с минимальным расстоянием d исправляет b d−1
2 c ошибок. Если d четное,
то код, кроме того, обнаруживает d2 ошибок.
Доказательство. Если d = 2m или d = 2m + 1, то все векторы, отстоящие от кодового слова
x на расстояние Хэмминга не больше m, находятся ото всех других кодовых слов на большем
расстоянии. Если d = 2m, то вектор, находящий ся на расстоянии m от двух кодовых слов x
и y, не может являться кодовым словом и находится от других кодовых слов на не меньшем
расстоянии.
Рассмотрим теперь вопрос о том, как най ти кодовое слово, ближай шее к данному приня‐
тому сообщению.
Определение 8.2.6. Смежным классом вектора a ∈ Fnq называется
a + C = {a + x | x ∈ C}.
С этим понятием уже встречалось под названием «аффинное подпространство» (см. Опре‐
деление 4.2.16 и далее). В частности, принадлежность к одному смежному классу — отноше‐
ние эквивалентности.
В каждом смежном классе имеются векторы наименьшего веса Хэмминга — выберем в
каждом смежном классе по одному такому и назовем его лидером смежного класса. Итого все
пространство принимаемых сообщений разбивается в дизъюнктное объединение конечно‐
го набора смежных классов a0 +C, . . . , ar +C. Без ограничения общности можно считать, что
a0 = 0 соответствующий смежный класс состоит из кодовых слов. Если принятое сообщение
y попало в смежный класс ai + C, то есть y = ai + x для некоторого x ∈ C, то возможные
векторы ошибок лежат в том же смежном классе:
e = y − x′ = ai + x − x′ ∈ ai + C.
Расположим все принимаемые сообщения в следующей таблице, именуемой стандартным
расположением:
127
Кодовое слово x(1) = 0 x(2) ... x(m)
Смежный класс a1 a1 + x(1) = a1 a1 + x(2) ... a1 + x(m)
.. .. .. ..
. . . .
Смежный класс ai ai + x(1) = ai ai + x(2) ... ai + x(m)
.. .. .. ..
. . . .
Для нахождения правильного кодового слова x достаточно отыскать в данной таблице при‐
нятое сообщение y — тогда в первой строке соответствующего столбца будет стоять x.
Для ускорения этой процедуры можно использовать следующее обстоятельноство: с каж‐
дым принимаемым сообщением y можно связать вектор Hy — и если y = x + e, то Hy =
Hx + He = He, то есть эта величина зависит не от самого y, а от соответствующего смеж‐
ного класса. Hy = He называется синдромом ошибки (обозначается S(y)) и позволяет, бу‐
дучи единожды наденным для каждого смежного класса, сразу находить строку стандарт‐
ного расположения, в которой находится принятое сообщение y.
1. S(y) = 0 тогда и тольк тогда, когда y ∈ C и сообщение передано без ошибок.
2. Векторы принадлежат одному смежному классу тогда и только тогда, когда их синдро‐
мы равны.
3. Пусть код с проверочной матрицей H двоичный . Если ошибки допущены в позициях
i1 , . . . , il , то He = H∗,i1 + . . . + H∗,il .
8.3 Код Хэмминга

Последнее замечание показывает, что при одиночной ошибке в двоичном коде синдром ошиб‐
ки будетстолбцом проверочной матрицы. Таким образом, для исправления одиночной ошиб‐
ки достаточно, чтобы столбцы проверочной матрицы находились в биективном соответ‐
ствии с возможными позициями ошибок. Вскоре мы построим такой код, но сперва устано‐
вим некоторые пределы, связывающие длину, размерность и исправляющую способность
кода.
Теорема 8.3.1 (Граница Хэмминга).
Пусть C — двоичный линей ный (n, k)‐код, исправляющий t ошибок. Тогда

n n n
2 · 1+
k
+ + ... + 6 2n .
1 2 t
Доказательство. Шары радиуса t с центрами в кодовых словах не пересекаются, в каждом
таком шаре содержится 1 + n1 + n2 + . . . + nt векторов, всего таких шаров 2k , а векторов
в объемлющем пространстве 2n . Результат получается сравнением суммарного количества
векторов во всех этих шарах и размера пространства.
Выберем теперь такую матрицу H, чтобы все ее столбцы были отличны от нуля и раз‐
личны. Если мы рассматриваем матрицы высоты r > 2, то при выборе максимальной такой
матрицы получим H ∈ M(r, 2r − 1, F2 ). Код с такой проверочной матрицей называется кодом
Хэмминга и исправляет одну ошибку (d = 3).
Значение минимального расстояния получено из Теоремы 8.2.5 и наличия кодового слова
веса 3.
128
Замечание 8.3.2. Для кода Хэмминга в границе Хэмминга достигается равенство (при t = 1).
Доказательство. Длина кода Хэмминга вычисляется как n = 2r − 1, а размерность k = 2r −
1 − r. В каждом шаре радиуса 1 содержится n + 1 = 2r вектором, итого 2k · 2r = 22 −1−r · 2r =
r
22 −1 = 2n .
r
8.4 Циклические коды

Определение 8.4.1. Код C называется циклическим, если вместе с любым вектором содер‐
жит все его циклические сдвиги, то есть из c1 . . . cn ∈ C следует cl . . . cn c1 . . . cl−1 ∈ C.
Сопоставим каждому вектору c = c0 . . . cn−1 ∈ Fnq многочлен c(x) = c0 + c1 x + . . . +
cn−1 xn−1 ∈ Fq [x]. Можно пой ти чуть дальше и рассматривать такие многочлены степени
меньше n как элементы кольца Rn = Fq [x]/(xn − 1). В нем умножение на [x] соответствует
циклическому сдвигу:
[c0 + c1 x + . . . + cn−1 xn−1 ] · [x] = [cn−1 + c0 x + c1 x2 + . . . + cn−2 xn−1 ],
так как (c0 + c1 x + . . . + cn−1 xn−1 ) · x ≡xn −1 cn−1 + c0 x + c1 x2 + . . . + cn−2 xn−1 . Код C можно
рассматривать как подпространство векторного пространства Rn над полем Fq . Тогда алгеб‐
раическая структура кольца позволяет выразить цикличность кода:
Замечание 8.4.2. Код C 6 Rn циклический , если xC ⊆ C. Эквивалентно, f C ⊆ C для любого
f ∈ Rn .
Пример 8.4.3. Пусть g ∈ Rn . Положим C = (g) = gRn = {gf | f ∈ Rn }. Тогда для любого h ∈
Rn выполнено h · (f g) = (hf )g ∈ (g), то есть код циклический . В таком случае g называется
порождающим многочленом кода C.
Теорема 8.4.4.
1. Каждый циклический код содержит нетривиальный многочлен g наименьшей степе‐
ни, причем если потребовать, чтобы старший коэффициент был равен 1, то такой g бу‐
дет единственным.
2. C = (g).
3. g | xn − 1.
4. Для любого c ∈ C най дется единственный такой f ∈ Fq [x], что c = f g и deg(f ) <
n − deg(g) (тогда равенство можно рассматривать уже в Fq [x], а не в Rn ).
Доказательство. Первый пункт очевиден, второй следует из возможности деления много‐
членов с остатком и цикличности кода.
Для доказательства пункта (3) поделим xn − 1 на g с остатком: xn − 1 = q(x)g(x) + r(x), где
deg(r) < deg(g). Но тогда r ∈ C, что в силу минимальности степени g влечет r = 0. Значит, g
делит xn − 1. Обозначим h = (xn − 1)/g.
Пусть теперь c ∈ C. В силу второго пункта c ≡ qg (равенство в Rn ) для некоторого мно‐
гочлена q. Рассмотрим произведение qg как многочлен над Rq и поделим его с остатком на
xn − 1:
qg = u · (xn − 1) + v = uhg + v.
Поскольку qg и uhg делятся на g, то v тоже, то есть v = wg для некоторого w. При этому
deg(v) < n, так что deg(w) < n−deg(g). Итого qg = (uh+w)·g ≡ wg. Значит, можно положить
f = w.
129
Следствие 8.4.5. Циклический код C с порождающим многочленом g состоит из многочле‐
нов f g, где deg(f ) < n − deg(g), а кодирование осуществляется отображением f 7→ f g.
Если порождающий многочлен имеет вид g = g0 +g1 x+. . .+gr xr , то порождающая матрица
соотвествующего кода имеет вид
 
g0
g1 g0 
 
 .. . 
 . g1 . . 
 
 . . .. g 
G = gr ..  = g|xg| . . . |xn−r−1 g .
 0 
 gr g1 
 
 .. .
 . .. 
gr
Многочлен h = (xn − 1)/g называется проверочным многочленом, так как для c ∈ C выпол‐
нено c = f g и, следовательно, ch = f gh ≡ 0.
Определенный ранее код Хэмминга с параметром r длины 2r − 1 имеет проверочной мат‐
рицей матрицу, составленную из всех ненулевых двоиных столбцов высоты r. Пусть α —
примитивный элемент поля GF (2r ), тогда все элементы 1, α, α2 , . . . , α2 −2 различны и мо‐
r
гут быть представлены (по отношению к какому‐нибудь базису e векторного пространства

GF (2r ) над GF (2)) как различные двоичные столбцы высоты r. Тогда проверочная матрица
может быть записана в виде
H = 1e |αe | . . . |αe2 −2 .
r
Вектор c = c0 . . . cn−1 является кодовым словом тогда и только тогда, когда
X
n−1
Hc = 0 ⇔ ci αi = 0 ⇔ c(α) = 0.
i=0
Нетривиальный многочлен наименьшей степени, аннулирующий α, называется его мини‐

мальным многочленом, так что код Хэмминга с параметром r является циклическим с по‐
рождающим многочленом µα,F2 , где α — примитивный элемент GF (2r ).
8.5 Коды Боуза—Чоудхури—Хоквингема

Пусть n ⊥ q. Рассмотрим многочлен xn −1. Рассмотрим GF (q m ) — поле разложения xn −1 над
GF (q). Производная (xn − 1)′ = nxn−1 взаимна проста с xn − 1, так как n и q взаимно просты.
Следовательно, xn − 1 не имеет кратных корней . Значит, в GF (q m ) имеется n различных
элементов α0 = 1, α1 , . . . , αn−1 , образующих множество всех корней степени n из 1.
Обозначим β примитивный элемент GF (q m ). Тогда αi = β di для каких‐то di . Положим d =
gcd(d0 , . . . , dn−1 ). Тогда по теореме о линей ном представлении НОД d = a0 d0 + . . . + an−1 dn−1
для каких‐то целых ai . Рассмотрим α = β d . Тогда
a
β d = β a0 d0 +...+an−1 dn−1 = (β d0 )a0 · . . . · (β dn−1 )an−1 = α0a0 · . . . · αn−1
n−1
и потому α является корнем степени n из 1. При этом αi = αdi /d , то есть все корни степени n
из 1 выражаются как степени α. Такой элемент α называется примитивным корнем степени
n из 1 над Fq .
130
Теорема 8.5.1 (граница БЧХ).
Пусть α — примитивный корень степени n из 1 над Fq . Пусть C — циклический код с таким
порождающим многочленом g, что для некоторых b > 0 и δ > 1 выполнено
g(αb ) = g(αb+1 ) = . . . = g(αb+δ−2 ) = 0.
Тогда dmin > δ.
Доказательство. Если c = c0 . . . cn−1 ∈ C, то, поскольку как многочлены все элементы C
делятся на g,
c(αb ) = c(αb+1 ) = . . . = c(αb+δ−2 ) = 0.
Иными словами, если положить
 
1 αb α2b ... α(n−1)b
1 αb+1 α2(b+1) ... α(n−1)(b+1) 
 
H′ =  . .. .. .. ,
 .. . . . 
1 αb+δ−2 α2(b+δ−2) ... α(n−1)(b+δ−2)
то H ′ c = 0. Тем самым матрица H ′ является частью истинной проверочной матрицы ко‐
да C (которая отличается, возможно, добавлением еще каких‐то строк, выражающих допол‐
нительные уравнения, которым удовлетворяют кодовые слова). Чтобы показать, что любое
ненулевое кодовое слово кода C имеет вес по край ней мере δ, покажем, что удовлетворяю‐
щее уравнению H ′ c = 0 сообщение обязательно нулевое.
Итак, пусть c — вектор веса wt(c) = w 6 δ − 1. Это значит, что можно выделить w позиций ,
в которых c отличен от 0, иными словами, ci 6= 0 только если i ∈ {i1 , . . . , iw }. Рассмотрим
матрицу  
αi1 b α i2 b ... α iw b
 αi1 (b+1) αi2 (b+1) ... 
αiw (b+1) 

A= .. .. .. . ,
 . . . .. 
αi1 (b+w−1) αi2 (b+w−1) ... αiw (b+w−1)
то есть подматрицу H ′ , составленную из пересечения первых w строк и столбцов с индекса‐
ми i1 , . . . , iw (могут включать 0). Если обозначить c′ = (ci1 , . . . , ciw )⊤ , то Ac′ = 0. Если c′ 6= 0,
то A не может быть обратимой , то есть det(A) = 0. Но

1 1 ... 1

αi1 α i2
. . . α iw

det(A) = α(i1 +...+iw )b · .. .. . . ,
. . . . .
.

αi1 (w−1) αi2 (w−1) . . . αiw (w−1)
а эта величина не равна 0 как произведение ненулевого элемента поля и определителя Ван‐
дермонда для различных элементов αi1 , . . . , αiw (различны, так как α примитивный ). Зна‐
чит, c′ = 0 и c = 0.
Определение 8.5.2. Кодом БЧХ с конструктивным расстоянием δ называется циклический
код с порождающим многочленом вида

g = lcm µαb ,Fp , µαb+1 ,Fp , . . . , µαb+δ−2 ,Fp .
По определению наименьшего общего кратного и минимального многочлена такой мно‐
гочлен g аннулирует αb , . . . , αb+δ−2 , поэтому соответствующий код имеет минимальное рас‐
стояние не меньше δ.
131
Предметный указатель
алгебраическая форма, 47 дробно‐линей ное преобразование, см. функ‐
алгоритм Эвклида, 25 ция дробно‐линей ная
для n чисел, 27 дробь
расширенный , 26 правильная, 62
аргумент комплексного числа, 50, 51 простей шая, 63
ассоциированность, 24 закон инерции, 113
базис, 66 знак перестановки, 86
жорданов, 101 значение многочлена, 42
ортогональный , 109 индукция, см. математическая индукция
билиней ная форма, 107 интерполяция
положительно определенная, 108 по Лагранжу, 59
бинарная операция, 18 по Ньютону, 59
ассоциативная, 18 с простыми узлами, 58
индуцированная, 20 квадратичная форма, 109
коммутативная, 19 класс
бинарное отношение, 7 вычетов, 32
антисимметричное, 8 эквивалентности, 9
конгруэнтности, 20 код
порядка, 14 БЧХ, 131
линей ное, 15 Хэмминга, 128
полное, 16 линей ный , 125
рефлексивное, 7 циклический , 129
симметричное, 7 кольцо, 21
транзитивное, 8 классов вычетов, 32
эквивалентности, 8 коммутативное, 22
вещественная часть, 47 многочленов, 40
взаимная простота, 27 комплексная плоскость, 48
группа, 21 расширенная, 52
абелева, 21 комплексное сопряжение, 47
мультипликативная кольца, 23 композиция
углов, 51 функций , 11
декартово произведение координаты вектора, 68
множеств, 6 корень
деление с остатком комплексный из 1, 54
многочленов, 42 кратный , 56
синтетическое, 45 многочлена, 43
целых чисел, 24 первообразный по модулю p, 37
делимость, 23 простой , 56
делитель нуля, 23 кортеж, 6
диагонализация кратность
ортогональным преобразованием, 114 корня многочлена, 56
по Лагранжу, 109 криптографический протокол
по Якоби, 111 Диффи—Хеллмана—Меркла, 37
дилатация, 83 Ривеста—Шамира—Адлемана, 37
дискретный логарифм, 37 критерий Сильвестра, 114
линей ная независимость, 65
132
линей ное отображение, 72 множеств, 4
линей ное представление НОД, 25 перестановка, 86
линей ное сравнение, 32 подпространство, 69
математическая индукция, 16 порожденное подмножеством, 69
матрица, 74 поле, 39
Грама, 107 комплексных чисел, 46
диагонализируемая, 101 разложения многочлена, 120
единичная, 77 рациональных функций , 61
жорданова, 101 частных, 60
линей ного отображения, 75 порождающий набор, 66
нулевая, 77 правило Руффини, см. схема Горнера
обратная, 77 преобразование Мебиуса, см. функция дробно‐
перехода, 79 линей ная
присоединенная, 91 приведение к главным осям, 115
проверочная кода, 125, 126 принцип Дирихле, 17
транспонированная, 78 производная многочлена, 56
метод Гаусса, 84 прообраз, 10
мнимая часть, 47 простое подполе, 121
многочлен, 40 пространство
минимальный матрицы, 105 векторное, 64
минимальный элемента поля, 117 конечномерное, 67
неприводимый , 62 столбцов, 64
порождающий кода, 129
проверочный кода, 130 разбиение множества, 9
характеристический , 94 разложение
множество, 3 натурального на простые множители,
бесконечное, 5 30
всех подмножеств, 4 размерность, 68
конечное, 5 ранг
пустое, 3 линей ного отображения, 80
модуль матрицы, 81
комплексного числа, 48 расширение полей , 116
наибольший общий делитель, 24, 26 алгебраическое, 119
неполное частное, 24 простое, 116
область редукция
значений , 10 по Монтгомери, 33
определения, 10 свободный член, 41
прибытия, 10 сигнатура квадратичной формы, 114
область целостности, 23 синтетическое деление, 45
образ, 10 система вычетов, 32
образ линей ного отображения, 80 система линей ных уравнений , 81
определитель однородная, 81
матрицы, 87 скалярное произведение, 108
ортогонализация Грама—Шмидта, 112 собственные векторы и числа, 94
ортогональное дополнение, 110 сравнимость по модулю, 31, 46
остаток стандартные матричные единицы, 82
при делении многочленов, 42 старший коэффициент, 41
при делении целых чисел, 24 степень
пересечение многочлена, 41
133
расширения, 118 число
сужение функции, 11 комплексное, 46
сумма подпространств, 70 простое, 29
прямая, 71 элемент
схема левый ней тральный , 19
Горнера, 44 левый обратный , 20
разделения секрета по Шамиру, 59 максимальный , 15
теорема минимальный , 15
Гамильтона—Кэли, 96 модулярный обратный , 33
Кронекера—Капелли, 82 наибольший , 15
Эй лера, 34 наименьший , 15
Якоби, 114 ней тральный , 19
китай ская об остатках, 35 обратный , 20
малая Безу, 43 правый ней тральный , 19
малая Ферма, 35 правый обратный , 20
основная алгебры, 55 примитивный , 124
основная арифметики, 30 элементарные преобразования, 83
трансвекция, 83
транспозиция, 86
тригонометрическая форма, 50
тупель, см. кортеж
упорядоченная n‐ка, см. кортеж
упорядоченная пара, 5
уравнение
линей ное диофантово, 28
фактор‐множество, 14
фактор‐пространство, 72
финитарная последовательность, 40
форма матрицы
жорданова, 101
строчная эшелонированная, 84
трапециевидная, 84
формула
Крамера, 91
Муавра, 51
Тей лора, 58
полного развертывания, 88
функция, 10
Эй лера, 34
биективная, 10
дробно‐линей ная, 52
инъективная, 10
обратимая, 12
обратная, 12, 13
полиномиальная, 42
сюръективная, 10
тождественная, 12
характеристическая, 13
характеристика поля, 121
134

171 Algebra Lectures

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

171 Algebra Lectures

Загружено:

Авторское право:

Доступные форматы

Алгебра

лекции для студентов потока «Программная инженерия»

2 Алгебраические структуры и элементарная теория чисел 18

4 Основы линейной алгебры 64

6 Билинейная алгебра 107

7 Теория полей 116

8 Коды с коррекцией ошибок 125

Предметный указатель 132

• Множества можно объединять: если A и B это два множества, то их объединением на‐

• С операцией выделения с помощью предиката можно удобным образом определить

Все три определения задают, разумеется, одно и то же множество, и операция об‐

– Разностью множеств A и B называется A \ B = {x ∈ A | x ∈

• Для любого множества A существует множество B, элементами которого являются все

и результат, конечно, не зависит от выбора конкретного a0 . Обратите внимание, что

1.2 Упорядоченные пары, кортежи и декартово произведение

Один из формальных способов определить кортеж длины больше 2 — рекуррентный , на‐

Аналогично можно определить декартово произведения большего количества множеств:

Обратите внимание, что формально все три множества

< ⊂ 6, = ∩ < = ∅, 6 ∩ > = =.

• транзитивно, если ∀x, y, z ∈ A из xRy и yRz следует xRz.

1.4 Отношения эквивалентности и разбиения

Определение 1.4.1. Бинарное отношение называется отношением эквивалентности, если

1. Отношение равенства размеров множеств (пример 5 выше).

6. Для фиксированного целого m отношение {(x, y) ∈ Z2 | x − y делится на m}.

Определение 1.4.4. Отношением эквивалентности, отвечающим разбиению B множества

f1 : R → R, f2 : R → R>0 , f3 : R>0 → R, f4 : R>0 → R>0 ,

Определение 1.5.15. Пусть f : A → B и g : B → A. Будем говорить, что

Теорема 1.5.17. Пусть f : A → B.

Доказательство. Если f обратима слева, то есть для некоторого g : B → A выполнено g ◦

Доказательство. Пусть область определения функции f : ∅ → A пуста. Тогда ее график яв‐

Определение 1.5.23. Пусть A — некоторое множество. Характеристической функцией под‐

A/∼ = {[a]∼ | a ∈ A}.

Как множество это совпадается в уже встречавшимся нам разбиением множества A на

1.7 Отношения порядка и математическая индукция

7. отношение «матрешка» на каком‐нибудь множестве геометрических фигур: фигура X

Обратите внимание, что отношение R на множестве A, сформированное по принципу aRb

• наименьшим, если для любого b ∈ B выполнено x 6 b;

• Наименьший элемент является минимальным;

Следствие 1.7.10 (Принцип математической индукции).

то P (n) истинно для всех n ∈ N.

Доказательство. Индукция по |A| = |B|. База тривиальна.

Определение 2.1.4. Если φ — бинарная операция на A, B ⊆ A, и φ(B × B) ⊆ B, то огра‐

Если k = n − 1, то можно применить индукционное предположение к произведению x1 ∗ . . . ∗

Применим ассоциативность к произведению X ∗ (Y ∗ xn ) = (X ∗ Y ) ∗ xn , тогда наше произ‐

что сводит задачу к уже разобранному случаю k = n − 1.

• левым нейтральным, если для любого a ∈ A выполнено e ∗ a = a;

• 0 является ней тральным относительно +;

• 1 является единственным правым ней тральным относительно возведения в степень,

• для теоретико‐множественных операций , заданных на 2A :

Замечание 2.1.12. Пусть операция ∗ ассоциативна. Если у элемента x одновременно суще‐

[a]∼ ∗ [b]∼ = [a ∗ b]∼

Такая операция называется индуцированной операцией ∗.

если [a] = [a′ ] и [b] = [b′ ], то [a ∗ b] = [a′ ∗ b′ ],

или, что то же самое, a ∼ a′ и b ∼ b′ вместе влекут a ∗ b ∼ a′ ∗ b′ . Такие отношения эквива‐

a∼b ⇐⇒ a − b = km для некоторого k ∈ Z,

Обычно операции + и · называют сложением и умножением, как и подсказывают обозна‐

Следствие 2.2.10. (R∗ , ·) является группой (она называется мультипликативной группой

2.3 Делимость в коммутативном кольце

Доказательство. Если a = br и b = as, то a = a(rs). Тогда a(1 − rs) = 0, откуда a = 0 или

2.4 Делимость целых чисел

Доказательство. Рассмотрим сначала случай , когда a, b > 0. Доказательство проведем ин‐

ax + by = a(x − ky) + (b + ak)y ⇒ Xa,b ⊆ Xa,b+ak ,

Изложенное выше подсказывает пусть к вычислению наибольшего общего делителя: за‐

ri+1 = ri−1 − qi ri , где 0 6 ri+1 < |ri |,