Вы находитесь на странице: 1из 132

Высшая алгебра.

I семестр
Валерий Авдеевич Чуркин
12.01.2012

Содержание
1 Математическая символика 4
1.1 Логические связки . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Отображения или функции . . . . . . . . . . . . . . . . . . . 5
1.3.1 Инъекция . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2 Сюръекция . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.3 Биекция . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.4 Мощность множеств . . . . . . . . . . . . . . . . . . . 7

2 Алгебраические операции, структуры и изоморфизм. 7


2.1 Алгебраические операции . . . . . . . . . . . . . . . . . . . . 7
2.2 Алгебраические структуры . . . . . . . . . . . . . . . . . . . 8
2.3 Изоморфизм . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3 Основные алгебраические структуры 10


3.1 Группы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.2 Изоморфизм групп . . . . . . . . . . . . . . . . . . . . . . . 12
3.3 Поля и кольца . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4 Подгруппы, подкольца, подполя . . . . . . . . . . . . . . . . 15

4 Комплексные числа 17
4.1 Поле комплексных чисел . . . . . . . . . . . . . . . . . . . . 17
4.2 Геометрическое описание поля C . . . . . . . . . . . . . . . 21

5 Подстановки 24
5.1 Группы подстановок . . . . . . . . . . . . . . . . . . . . . . . 24
5.2 Разложение на циклы . . . . . . . . . . . . . . . . . . . . . . 27
5.3 Четность и разложение на транспозиции . . . . . . . . . . . 29

1
6 Матрицы и определители 31
6.1 Кольцо матриц . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6.1.1 Разложение в произведение диагональной и транс-
векций . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
6.2 Определитель и обратимость матрицы . . . . . . . . . . . . 38
6.2.1 Свойства определителя . . . . . . . . . . . . . . . . . 39
6.2.2 Определитель произведения матриц . . . . . . . . . . 43
6.2.3 Критерий обратимости матрицы . . . . . . . . . . . . 43
6.2.4 Разложение определителя по строке (столбцу) . . . . 44
6.2.5 Формула для обратной матрицы . . . . . . . . . . . . 46
6.3 Крамеровы системы линейных уравнений . . . . . . . . . . 46
6.4 Общая линейная группа . . . . . . . . . . . . . . . . . . . . 47

7 Векторные пространства 50
7.1 Векторные пространства и подпространства . . . . . . . . . 50
7.2 Линейная зависимость, теорема о замене . . . . . . . . . . . 53
7.3 Базис, ранг, размерность . . . . . . . . . . . . . . . . . . . . 56
7.4 Изоморфизмы векторных пространств . . . . . . . . . . . . 59
7.5 Замена базиса и замена координат . . . . . . . . . . . . . . 60
7.6 Сумма и пересечение подпространств . . . . . . . . . . . . . 61
7.7 Фактор-пространство и его размерность . . . . . . . . . . . 64
7.8 Ранг матрицы и теорема о ранге . . . . . . . . . . . . . . . . 67
7.9 Ранг произведения матриц . . . . . . . . . . . . . . . . . . . 69
7.10 Критерий совместности системы линейных уравнений . . . 70
7.11 Общее решение системы линейных уравнений . . . . . . . . 70
7.12 Связь между решениями неоднородных и однородных систем 73
7.13 Фундаментальные системы решений . . . . . . . . . . . . . 74
7.14 Задание линейных многообразий . . . . . . . . . . . . . . . 75
7.15 Базисы суммы и пересечения линейных многообразий . . . 76
7.16 Геометрическое описание множества решений над R . . . . 78
7.17 Теоремы Фредгольма . . . . . . . . . . . . . . . . . . . . . . 79

8 Многочлены от одной переменной 80


8.1 Кольцо многочленов . . . . . . . . . . . . . . . . . . . . . . . 80
8.2 Деление с остатком . . . . . . . . . . . . . . . . . . . . . . . 84
8.3 Корни, значения и формулы Виета . . . . . . . . . . . . . . 85
8.4 Кратные корни и производная . . . . . . . . . . . . . . . . . 87
8.5 Формула Тейлора . . . . . . . . . . . . . . . . . . . . . . . . 88
8.6 Интерполяционные формулы Лагранжа и Ньютона . . . . . 90
8.7 Алгебраическая замкнутость поля C . . . . . . . . . . . . . 92
8.8 Корни вещественных многочленов . . . . . . . . . . . . . . . 96

2
8.9 Евклидовы кольца и НОД . . . . . . . . . . . . . . . . . . . 97
8.10 Критерий разрешимости уравнения ax + by = c . . . . . . . 100
8.11 Свойства взаимно простых элементов . . . . . . . . . . . . . 101
8.12 Общее решение уравнения ax + by = c . . . . . . . . . . . . 102
8.13 Единственность разложения на множители в евклидовом
кольце . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.14 Разложение на множители в Z[x] и Q[x] . . . . . . . . . . . 105
8.15 Вложение целостного кольца в поле частных . . . . . . . . 106
8.16 Рациональные функции и простейшие дроби . . . . . . . . . 110
8.17 Гомоморфизмы колец, идеалы и фактор-кольца . . . . . . . 111
8.18 Теорема Кронекера о существовании корня . . . . . . . . . 117

9 Многочлены от многих переменных 119


9.1 Кольцо многочленов от нескольких переменных . . . . . . . 119
9.1.1 Упорядочение одночленов . . . . . . . . . . . . . . . 120
9.2 Симметрические многочлены . . . . . . . . . . . . . . . . . . 121
9.3 Дискриминант . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9.4 Результант . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.5 Результант и дискриминант . . . . . . . . . . . . . . . . . . 129
9.6 Результант и системы полиномиальных уравнений . . . . . 129
9.7 Теорема Гильберта о базисе . . . . . . . . . . . . . . . . . . 131

3
1 Математическая символика
Обычно используются латинский алфавит Aa, ..., Zz и греческий ал-
фавит α, ..., ω, а также специальные знаки для логических связок, мно-
жеств и отображений.

1.1 Логические связки

¬ — знак «отрицание»,
∧ — связка «и»,
∨ — связка «или»,
⇒ — «следует»,
⇔ — «равносильно»,
∀ — «для всякого»,
∃ — «существует»,
∃! — «существует только один»,
= — знак «равенство»,
:= — «равенство по определению».

4
1.2 Множества
Множества состоят из элементов. Обозначения:

a ∈ A — элемент a принадлежит множеству A,


a∈/ A — элемент a не принадлежит множеству A,
∅ — пустое множество (без элементов),
A = {a1 , a2 , . . . , an } — задание множества перечислением элементов,
A ⊂ B — множество A является подмножеством (частью) множества B,
A = {a ∈ B | P (a)} — задание множества свойством P его элементов,
A ∪ B = {x | (x ∈ A) ∨ (x ∈ B)} — объединение двух множеств,
∪i∈I Ai — объединение семейства множеств,
A ∩ B = {x | (x ∈ A) ∧ (x ∈ B)} — пересечение двух множеств,
∩i∈I Ai — пересечение семейства множеств,
A \ B = A − B = {x ∈ A | x ∈ / B} — разность множеств,
A × B = {(a, b) | a ∈ A, b ∈ B} — декартово произведение двух множеств,
состоящее из упорядоченных пар (a, b), при этом
(a, b) = (a0 , b0 ) ⇔ (a = a0 ∧ b = b0 ),
A1 × . . . × An = {(a1 , . . . , an ) | a1 ∈ A1 , . . . , an ∈ An } —
декартово произведение множеств A1 , . . . , An ,
An = A | ×A× {z. . . × A} — n-ая декартова степень множества A,
n
N, Z, Q, R, C — соответственно множества натуральных, целых,
рациональных, вещественных и комплексных чисел,
Z+ — множество неотрицательных целых чисел.

1.3 Отображения или функции


Отображение f множества A в множество B — это правило, в со-
ответствии с которым всякому элементу x ∈ A поставлен в соответствие
единственный элемент y ∈ B. Такое отображение называют также
функцией с областью определения A и областью значениий B. Исполь-
зуются обозначения
f
f : A → B или A → B,
y = f (x) или f : x 7→ y.

Если y = f (x), то говорят, что элемент y — образ x относительно f , а

5
элемент x — прообраз y относительно f . Образ всегда один, а проообразов
может быть много.
Если X ⊂ A, то множество f (X) = {f (x) | x ∈ X} ⊂ B — называ-
ется образом множества X относительно f . Множество Im A := f (A)
называется образом отображения f : A → B.
Если Y ⊂ B, то f −1 (Y ) = {x ∈ A | f (x) ∈ Y } — полный прообраз
множества Y относительно f . Прообраз непустого подмножества может
быть и пустым, поскольку не всякий элемент из B может иметь прообраз
в A относительно f .
Определение 1.1. Множество
Γf = {(x, f (x)) | x ∈ A} ⊂ A × B
называется графиком отображения f : A → B. Как подмножества декар-
това произведения графики отображений характеризуются следующим
свойством:
Γf ⊂ A × B : ∀x ∈ A ∃!y ∈ B ((x, y) ∈ Γf ).

1.3.1 Инъекция
Определение 1.2. Отображение f : A → B называется вложением или
инъективным отображением, если
x1 6= x2 ⇒ f (x1 ) 6= f (x2 ). (1)
Иначе говоря, каждый образ имеет ровно один прообраз.

1.3.2 Сюръекция
Определение 1.3. Отображение f называется отображением множе-
ства A на B или сюръективным отображением, если
∀y ∈ B∃x ∈ A : f (x) = y. (2)
Иначе говоря, каждый элемент области значений имеет хотя бы один
прообраз.

1.3.3 Биекция
Определение 1.4. Отображение f : A → B называется взаимно одно-
значным или биективным отображением, если оно одновременно инъек-
тивно и сюръективно. Иначе говоря, каждый элемент области значений
имеет ровно один прообраз. Будем говорить также, что f : A → B —
взаимно однозначное соответствие.

6
1.3.4 Мощность множеств
Определение 1.5. Множества A и A0 называются равномощными и пи-
шут |A| = |A0 |, если между ними можно установить некоторое взаимно
однозначное соответствие f . Обозначения:
f
a ↔ a0 , a ∈ A, a0 ∈ A0 или a ↔ a0 , a0 = f (a).

2 Алгебраические операции, структуры и изо-


морфизм.
2.1 Алгебраические операции
Определение 2.1. Пусть A — непустое множество и n — натуральное
число. Тогда n-арная алгебраическая операция f на множестве A —
это отображение f : An → A.
Другими словами, операция f любому набору n элементов-аргументов
из A сопоставляет единственный элемент-значение снова из A:

∀a1 , . . . an ∈ A f : (a1 , . . . , an ) 7→ f (a1 , . . . , an ) ∈ A. (3)

При n = 1, 2, 3, ... операция называется соответственно унарной,


бинарной, тернарной,... Чаще всего в алгебре используются бинарные
операции.
1) Унарная операция "следующее натуральное число":

A = N; f : a 7→ a + 1.

2) Бинарная операция сложения натуральных чисел:

A = N; f (a, b) = a + b.

3) Множество — плоскость, тернарная операция — взятие центра тя-


жести трех вершин треугольника (точнее, фигуры из трех точек).
Замечание. Бинарная операция f (a, b) может быть записана в более
краткой форме af b, например, a + b, a ∗ b. Знак операции мы выбираем
сами. Поскольку операцию используют много раз, а смысл краткой фор-
мулы осознать легче, писать ее быстрее, то лучше использовать простые
обозначения: плюс, косой крест, звездочка, кружочек, точка и т. д. Знак
бинарной операции можно вообще опустить, если смысл восстанавлива-
ется однозначно.

7
Бинарную операцию на конечном множестве можно задать с помо-
щью аналога школьной таблицы умножения, где на пересечении строки,
соответствующей a, и столбца, соответствующего b, стоит результат опе-
рации f (a, b).
Упражнение. Найти количество бинарных операций на множестве
из n элементов.

2.2 Алгебраические структуры


Определение 2.2. Алгебраическая структура (A; Σ) — это непустое
множество A с заданным на нем набором Σ = {f1 , . . . , fs } алгебраических
операций с числом аргументов n1 > . . . > ns . Множество A называется
носителем структуры (A; Σ), множество Σ — сигнатурой, а последова-
тельность (n1 , . . . , ns ) называется типом структуры.

Примеры:

• (N; +, ·) — тип (2, 2),

• (N; НОД(a, b)) — тип (2).

2.3 Изоморфизм
Определение 2.3. Пусть (A; Σ) и (A0 ; Σ0 ) — алгебраические струк-
туры одного типа и задано взаимно однозначное соответствие f ↔ f 0
между сигнатурами, сохраняющее число аргументов. Структуры назы-
ваются изоморфными, если между множествами A и A0 можно уста-
новить такое взаимно однозначное соответствие a ↔ a0 , что для любых
соответствующих n-арных операций

f ∈ Σ, f 0 ∈ Σ0

из соответствия любых наборов аргументов

a1 ↔ a01 , ... , an ↔ a0n

следует соответствие значений операций

f (a1 , a2 , . . . an ) ↔ f 0 (a01 , a02 , . . . , a0n ).

В этом случае пишут (A; Σ) ' (A0 ; Σ0 ) и указанное соответствие назы-


вают изоморфизмом.

8
Другими словами, указанное соответствие-изоморфизм между эле-
ментами носителей должно сохраняться при действии соответствующих
операций. Смысл состоит в том, что в алгебре важно как действует алгеб-
раическая операция, природа элементов носителя алгебраической струк-
туры часто не имеет значения.
Пример. Утверждается, что (R>0 ; ·) ' (R; +). Таким образом, слож-
ную операцию умножения вещественных чисел можно отождествить с
относительно простой операцией сложения при подходящем соответствии.
Это взаимно однозначное соответствие — логарифм по заданному поло-
жительному неединичному основанию — найдено в эпоху великих аст-
рономических открытий, когда были открыты законы тяготения и вы-
явлены все планеты солнечной системы, при этом для предсказания или
проверки приходилось осуществлять вручную вычисления с десятичны-
ми дробями с достаточно большой точностью. Действительно,

(a ↔ ln a, b ↔ ln b) ⇒ (ab ↔ ln(ab) = ln a + ln b).

Замечание. Долгое время cчиталось, что алгебра как наука занима-


ется решением алгебраических уравнений, а ее главный продукт — точ-
ные формулы, отражающие алгоритмы решения таких уравнений, если
только они существуют. Но со времен революции в математике, произве-
денной Эваристом Галуа, признается, что предмет алгебры гораздо шире
— к прежнему прибавляется изучение алгебраических структур с точно-
стью до изоморфизма или, иначе, свойств алгебраических операций, а
также изучение соответствий между классами структур.
Естественно, прежде всего интересны совершенно конкретные струк-
туры, возникающие из практики или из других математических дисци-
плин. Основной метод исследования — аксиоматический. Создается си-
стематическая теория отдельных структур и классов структур, заданных
свойствами алгебраических операций. Она заканчивается либо класси-
фикацией, либо осознанием степени сложности исследуемых объектов.
Упражнение. Пусть bn — максимальное число попарно неизоморф-
ных алгебраических структур с одной бинарной операцией на множестве
из n элементов.
1) Покажите, что
2
nn
bn > .
n!
В частности, b2 > 8, b3 > 3281. Очевидно, что bn число растет прямо
взрывным образом с ростом n.
2) Найдите точное значение b2 .

9
3 Основные алгебраические структуры
3.1 Группы
Определение 3.1. Группа (мультипликативная) — это алгебраическая
структура (G; ·) с одной бинарной операцией (обозначаемой точкой и
называющейся умножением), удовлетворяющей аксиомам ассоциативно-
сти, существования единицы и существования обратного элемента:
1. ∀a, b, c ∈ G : (ab)c = a(bc),
2. ∃e ∈ G ∀a ∈ G : ae = ea = a,
3. ∀a ∈ G ∃a0 ∈ G : aa0 = a0 a = e.
Если групповая операция удовлетворяет дополнительно аксиоме комму-
тативности
∀a, b ∈ G : ab = ba,
то группа называется коммутативной или абелевой.
Замечание. Если операция обозначается плюсом и называется сло-
жением, то группа называется аддитивной, единичный элемент называ-
ется нулевым, а обратный — противоположным. Как правило, такой знак
операции используется в случае абелевых групп. В общем случае, когда
операция обозначается, например, звездочкой, единичный элемент ино-
гда называется нейтральным, а обратный — симметричным. По умолча-
нию мы будем использовать для операции группы мультипликативную
запись.
Следствие. В группе произведение n > 3 элементов a1 a2 . . . an не зави-
сит от расстановки скобок, определяющих последовательность умно-
жений.
Доказательство. Используем математическую индукцию по n. При n =
3 это просто аксиома ассоциативности. Пусть n > 3. Предположим, что
утверждение верно для < n множителей.
Пусть даны два произведения:
P = (a1 . . . ak )(ak+1 . . . an ) 1 6 k < n,
Q = (a1 . . . al )(al+1 . . . an ) 1 6 l < n.
Если k = l, то по предположению индукции P = Q. Пусть k < l. Пере-
пишем P и Q ввиду предположения индукции:
P = (a1 . . . ak )((ak+1 . . . al )(al+1 . . . an )),

10
Q = ((a1 . . . ak )(ak+1 . . . al ))(al+1 . . . an ).
Обозначим через a = a1 . . . ak , b = ak+1 . . . al , c = al+1 . . . an . Тогда:

P = a(bc),

Q = (ab)c.
Ввиду аксиомы ассоциативности P = Q.
Следствие. Единица в группе только одна.
Доказательство. Пусть в группе две единицы: e и e0 . Тогда

e0 = ee0 = e.

Следствие. Для любого элемента в группе существует единственный


обратный элемент.
Доказательство. Пусть a0 и a00 — обратные элементы к элементу a. То-
гда
a0 a = aa0 = e,
a00 a = aa00 = e.
Отсюда
(a0 a)a00 = ea00 = a00 ,
a0 (aa00 ) = a0 e = a0 .
Ввиду аксиомы ассоциативности a00 = a0 .
Замечание. Обычно обратный элемент к a обозначается как a−1 .
Таким образом, отображение a ↔ a−1 — унарная операция обращения в
группе. Степень элемента a с целым показателем n задается формулой


 aa . . . a},
| {z если n > 0,

 n

an = e, если n = 0,
−1 −1 −1

a| a {z. . . a }, если n < 0.



−n

Легко проверить, что am an = am+n .


Для аддитивной абелевой группы элемент, противоположный к a,
обозначается через −a, элемент a − b := a + (−b) называется разностью
элементов a и b. Аналогично степени определяется и n-кратное na эле-
мента a для целого n, при этом ma + na = (m + n)a.

11
Следствие. В группе уравнения ax = b и ya = b имеют единственное
решения для любых a и b.

Доказательство. Очевидно, что

x = a−1 b

y = ba−1
решения заданных уравнений.
Наоборот, если ax = b для некоторого x, то

a−1 b = a−1 (ax) = (a−1 a)x = ex = x.

Если ya = b, то аналогично

ba−1 = (ya)a−1 = y(aa−1 ) = ye = y.

Пример 3.1. 1. (R>0 ; ·) — мультипликативная абелева группа с


единичным элементом 1 и обратным a−1 = 1/a.

2. (R; +) — аддитивная абелева группа с нулевым элементом 0 и


противоположным для a элементом −a.

3. (Z; +) — аддитивная абелева группа.

4. (Z; ·) — не группа! Для двойки нет обратного элемента!

5. (N; +) — не группа! Нет нуля, для единицы нет противополож-


ного элемента!

3.2 Изоморфизм групп


Определение 3.2. Группы (G; ∗) и (G0 ; ◦) изоморфны, если меж-
ду ними можно установить взаимно однозначное соответствие a ↔ a0 ,
которое сохраняется операцими ∗ и ◦.

∀a, b ∈ G : ( a ↔ a0 ∧ b ↔ b0 ) ⇒ (a ∗ b ⇔ a0 ◦ b0 ) (4)

Пример 3.2 (Изоморфизм групп).

(R>0 ; ·) ' (R; +) (5)

12
3.3 Поля и кольца
Определение 3.3. Поле — алгебраическая структура (K; +, ·) с двумя
бинарными операциями, обычно обозначаемыми + (сложение) и · (умно-
жение), которые удовлетворяют следующим аксиомам:

∀a, b, c ∈ K : (a + b) + c = a + (b + c) (6)

∀a, b ∈ K : a + b = b + a (7)
∃0 ∈ K ∀a ∈ K : a + 0 = 0 + a = a (8)
∀a ∈ K ∃(−a) ∈ K : a + (−a) = (−a) + a = 0 (9)
∀a, b, c ∈ K : a(b + c) = ab + ac ∧ (a + b)c = ac + bc (10)
∀a, b, c ∈ K : (ab)c = a(bc) (11)
∀a, b ∈ K : ab = ba (12)
∃1 ∈ K ∀a ∈ K : a · 1 = 1 · a = a, 1 6= 0 (13)
∀a ∈ K \ {0} ∃a−1 ∈ K : aa−1 = a−1 a = 1 (14)
Определение 3.4. Кольцо — алгебраическая структура с двумя би-
нарными операциями (K; +, ·), которая удовлетворяет первым пяти ак-
сиомам поля: 6, 7, 8, 9, 10.
Определение 3.5. Если операция · ассоциативна, то K — ассоциатив-
ное кольцо.
Определение 3.6. Если операция · коммутативна, то K — коммута-
тивное кольцо.
Определение 3.7. Если 1 ∈ K , то K — кольцо с единицей.
Определение 3.8. Если выполняются аксиомы 13 и 14, то K — кольцо
с обращением (или делением).
Определение 3.9. Тело — алгебраическая структура с двумя бинар-
ными операциями (K; +, ·), которая удовлетворяет всем аксиомам поля,
кроме 12 (т. е. умножение некоммутативно).
Пример 3.3. 1. (Q; +, ·) — поле.

2. (R; +, ·) — поле.

3. (Z; +, ·) — ассоциативное коммутативное кольцо с единицей, но


не поле!

13
4. Множество F (X, K) всех функций, определенных на множестве
X со значениями в кольце K, образует кольцо относительно обыч-
ных операций сложения функций и умножения функций. При |X| >
2 кольцо F (X, K) не поле, даже если K поле.

5. Множество K из двух элементов 0, 1 образует поле, если поло-


жить по определению 1 + 1 = 0, а остальные правила сложения
и умножения задаются обычными свойствами нуля и единицы.
Теорема 3.1. В кольце

a(b − c) = ab − ac, a(−c) = −ac,

(a − b)c = ac − bc, (−b) = −bc,


a · 0 = 0 · a = 0.
Доказательство.

a(b − c) + ac = a((b − c) + c) = ab.

a
Замечание 3.1. Деление в поле обычно обозначается = ab−1 = b−1 a
b
при b 6= 0. При b 6= 0, d 6= 0 получаем обычное правило сложения дробей:
a c ad + bc
+ = ab−1 + cd−1 = (ad + cb) · b−1 d−1 = .
b d bd
Определение 3.10. Если в кольце

a 6= 0, b 6= 0, ab = 0,

то элементы a и b называются делителями нуля, a —- левым, а b —


правым.
Пример 3.4. Пусть |X| > 2, A и B — непустые непересекающиеся под-
множества из X и пусть K — поле. Пусть f — характеристическая
функция множества A, т. е. f равна 1 на A и 0 вне A. Пусть g —
характеристическая функция множества B. Тогда f и g — делители
нуля: f 6= 0, g 6= 0, f g = 0.
Теорема 3.2. В поле нет делителей нуля.
Доказательство. Если ab = 0, a 6= 0, то умножая на a−1 , получим b =
0.

14
3.4 Подгруппы, подкольца, подполя
Определение 3.11. (A; Σ) — алгебраическая структура. Непустое под-
множество B из A замкнуто относительно операции f , если резуль-
тат применения операции f к элементам подмножества B снова содер-
жится в B. В этом случае операция f на A может быть сужена до опе-
рации на B.
Например, для бинарной операции ∗ замкнутость B означает

a, b ∈ B ⇒ a ∗ b ∈ B.

Определение 3.12. Подмножество H из мультипликативной группы


G называется подгруппой, если H замкнуто относительно всех груп-
повых операций: произведения элементов, взятия обратного элемента и
единичного элемента.
1. e ∈ H,
2. a ∈ H ⇒ a−1 ∈ H,
3. a, b ∈ H ⇒ a · b ∈ H.
Обозначение: H 6 G или H < G.
Легко заметить, что в этом и только этом случае H будет группой
относительно операции, суженной из группы G.
Пример 3.5 (Подгруппы относительно сложения:).

Z < Q < R.

Следствие. 1) Пересечение любого семейства подгрупп данной группы


образует подгруппу.
2) Если A — непустое подмножество группы G, то множество все-
возможных произведений элементов из A и обратных к ним

hAi := {a11 · a22 · . . . · ann | n ∈ N, ai ∈ A, i = ±1, i = 1, . . . , n} (15)

образует наименьшую подгруппу группы G, содержащую подмноже-


ство A. Она называется подгруппой, порожденной множеством A.
Пример 3.6. Если операция — сложение, то

h1i = Z,

h2, 3i = Z.

15
\ 1) Пусть Hi , i ∈ I, — семейство подгрупп группы G,
Доказательство.
обозначим H = Hi .
i∈I
Проверим, что H замкнуто относительно групповых операций, ис-
пользуя условие: Hi — подгруппа. Имеем

∀i : e ∈ Hi ⇒ e ∈ H,

a, b ∈ H ⇒ ∀i : a, b ∈ Hi ⇒ a−1 , ab ∈ H.
2) Проверим, что hAi — подгруппа.

A 6= ∅ ⇒ ∃a ∈ A ⇒ e = aa−1 ∈ hAi,

a11 . . . ann ∈ hAi ⇒ (a11 . . . ann )−1 = a−


n
n
. . . a−
1
1
∈ hAi,
a11 . . . ann , bδ11 . . . bδmm ∈ hAi ⇒ a11 . . . ann bδ11 . . . bδmm ∈ hAi.
Ясно, что hAi ⊃ A. Если H — подгруппа группы G и H ⊃ A, то H ⊃ hAi.
Следовательно, hAi — наименьшая подгруппа группы G, содержащая
подмножество A.

Определение 3.13. Подмножество L кольца K — его подкольцо если


L замкнуто относительно всех кольцевых операций — сложения, взятия
противоположного элемента и нуля, а также умножения:

1. 0 ∈ L,

2. a ∈ L ⇒ −a ∈ L,

3. a, b ∈ L ⇒ a + b ∈ L,

4. a, b ∈ L ⇒ ab ∈ L.

Обозначение: L 6 K, L < K.

Легко проверить, что только в этом случае (L; +, ·) — кольцо относи-


тельно операций, суженных из K.

Определение 3.14. Подмножество L поля K — его подполе, если L за-


мкнуто относительно всех операций поля — сложения, взятия нулевого и
противоположного элемента, произведения, взятия единицы и обратного
элемента:

1. 0 ∈ L,

2. a ∈ L ⇒ −a ∈ L,

16
3. a, b ∈ L ⇒ a + b ∈ L,

4. a, b ∈ L ⇒ ab ∈ L,

5. 1 ∈ L,

6. a ∈ L \ {0} ⇒ a−1 ∈ L.

Обозначение: L 6 K, L < K.

Пример 3.7. Z < Q — подкольцо, Q < R — подполе.

Теорема 3.3. 1) Пересечение любого семейства подполей данного поля


— его подполе.
2) Пусть K — поле, A ⊂ K, A 6= ∅. Тогда существует наименьшее
подполе из K, содержащее A. Оно состоит из всевозможных элемен-
p
тов вида , где p и q — суммы произведений элементов из A и проти-
q
воположных к ним, причем q 6= 0.

Доказательство. Остаётся читателю в качестве упражнения.

4 Комплексные числа
4.1 Поле комплексных чисел
Определение 4.1. Поле C называется полем комплексных чисел, если

1. C ⊃ R как подполе,

2. ∃i ∈ C : i2 = −1,

3. C — наименьшее среди своих подполей с условиями 1 и 2.

Замечание 4.1. Свойство 3 означает, что если L — подполе C и L ⊃ R,


L 3 i, то L = C.

Теорема 4.1. C точностью до изоморфизма существует единственное


поле комплексных чисел.
Всякое комплексное число имеет единственную алгебраическую за-
пись вида a+bi, где a, b ∈ R, сложение и умножение комплексных чисел
задается формулами

(a + bi) + (c + di) = (a + c) + (b + d)i, (a + bi)(c + di) = (ac − bd) + (ad + bc)i.

17
Доказательство. 1) Единственность.
Пусть C — некоторое поле комплексных чисел. Докажем, что оно
определяется однозначно через R и i.
Пусть L := {a + bi | a, b ∈ R} ⊂ C. Покажем, что L — подкольцо c
единицей:

1. 0 = 0 + 0i ∈ L, если 0 ∈ R,

2. −(a + bi) = (−a) + (−b)i ∈ L, если a, b ∈ R,

3. (a + bi) + (c + di) = (a + c) + (b + d)i ∈ L, если a, b, c, d ∈ R,

4. (a + bi)(c + di) = (ac − bd) + (ad + bc)i ∈ L, если a, b, c, d ∈ R,

5. 1 = 1 + 0i ∈ L.

Покажем единственность алгебраической записи. Пусть a + bi = 0, a, b ∈


a
R. Если b 6= 0, то i = − ∈ R, что невозможно, так как квадрат веще-
b
ственного числа неотрицателен. Значит, b = 0 и тогда a = 0. Отсюда

a + bi = c + di ⇔ (a − c) + (b − d)i = 0 ⇔ a − c = b − d = 0 ⇔ (a = c, b = d.)

Может быть L — подполе? Надо проверить замкнутость L относи-


тельно обращения ненулевых элементов. Имеем

a + bi 6= 0 ⇔ (a 6= 0 или b 6= 0) ⇔ a2 + b2 > 0.

Так как i2 = −1, то

(a + bi)(a − bi) = a2 + b2

Разделив на a2 + b2 , получим

(a + bi)(a − bi)
= 1.
a2 + b 2
Следовательно,
a b
(a + bi)−1 = − 2 i ∈ L.
a2 +b 2 a + b2
Таким образом, L — подполе поля C. Также L ⊇ R, L 3 i. Ввиду
минимальности
C = L = {a + bi | a, b ∈ R}.

18
Представление в алгебраической форме однозначно. Значит, опера-
ции в C определяются однозначно операциями поля R и потому поле C
единственно с точностью до изоморфизма.
Докажем теперь существование поля комплексных чисел. Из един-
ственности видна структура поля C. Ввиду соответствия (a + bi) ↔ (a, b)
естественно задать на множестве пар R2 = {(a, b) | a, b ∈ R} операции по
правилам
(a, b) + (c, d) = (a + c, b + d) (16)
(a, b) · (c, d) = (ac − bd, ad + bc) (17)
Проверим аксиомы поля. Ассоциативность сложения (С1):

(a, b) + (c, d)) + (e, f ) = (a, b) + ((c, d) + (e, f )

(a + c, b + d) + (e, f ) = (a, b) + (c + d, e + f )
((a + c) + e, (b + d) + f ) = (a + (c + e), b + (d + f ))
Ккоммутативность сложения (С2):

(a, b) + (c, d) = (c, d) + (a, b)

(a + c, b + d) = (c + a, d + b
Существование нулевого элемента (С3):

0 = (0, 0)

(a, b) + (0, 0) = (a + 0, b + 0) = (a, b)


Аксиома наличия противоположного элемента (С4):

−(a, b) = (−a, −b)

Правая дистрибутивность (СУ):

[(a, b) + (c, d)](e, f ) = (a, b)(e, f ) + (c, d)(e, f )

[(a, b)+(c, d)](e, f ) = (a+c, b+d)(e, f ) = ((a+c)e−(b+d)f, (a+c)f +(b+d)e)

(a, b)(e, f ) + (c, d)(e, f ) = (ae − bf, af + bc) + (ce − df, cf + de)
= ((a + c)e − (d + b)f, (a + c)f + (b + d)e)

Левая дистрибутивность следует из коммутативности умножения и пра-


вой дистрибутивности.

19
Ассоциативность умножения (У1):

((a, b)(c, d))(e, f ) = (ac − bd, ad + bc)(e, f )


= (ace − bde − adf − bcd, acf − bdf + ade + bcd)

(a, b)((c, d)(e, f )) = (a, b)(ce − df, cf + de)


= (ace − adf − bcf − bde, acf + ade + bce − bdf )

Коммутативность умножения (У2):

(a, b)(c, d) = (ac − bd, ad + bc)

(c, d)(a, b) = (ca − db, cb + da)


Существование единичного элемента (У3):

1 = (1, 0)

(1, 0)(a, b) = (a − 0)(b + 0) = (a, b)


Существование обратного элемента (У4):

(a, b) 6= 0 ⇔ a2 + b2 > 0
 
−1 a −b
(a, b) = ,
a2 + b 2 a2 + b 2
a2 b2
 
ab −ab
(a, b) · (a, b)−1 = + , + = (1, 0)
a2 + b 2 a2 + b 2 a2 + b 2 a2 + b 2
Таким образом, (R2 ; +, ·) удовлетворяет аксиомам поля. Проверим
для него свойства 1)–3) поля комплексных чисел.
Пусть
R0 = {(a, 0) | a ∈ R} ⊂ C. (18)
Покажем, что соответствие (a, 0) ↔ a является изоморфизмом

R0 ' R.

Действительно, соответствие взаимно однозначно и сохраняется опера-


циями:
(a, 0) + (c, 0) = (a + c, 0),
(a, 0)(c, 0) = (ac, 0)

20
Значит, поле R2 содержит изоморфную копию R0 поля R как подполе.
Поскольку мы не различаем изоморфные структуры, то свойство 1) вы-
полнено.
Проверим свойство 2). Пусть i := (0, 1). Тогда
i2 = (0, 1)(0, 1) = (0 − 1, 0 + 0) = (−1, 0) = −(1, 0) = −1.
Проверим свойство 3). Пусть L 6 R2 — подполе и пусть L ⊇ R0 , i.
Покажем, что L = R2 . Действительно,
(a, b) = (a, 0) + (0, b) = (a, 0) + (b, 0)(0, 1) = a + bi ∈ L.

4.2 Геометрическое описание поля C


Зададим на евклидовой плоскости прямоугольную декартову систему
координат Oxy. Комплексное число в алгебраической форме с использо-
ванием координат можно изобразить точкой плоскости
z = a + bi ↔ (a, b) a, b ∈ R
или радиус-вектором, соединяющим начало координат с данной точкой.
Назовем число a = Re z вещественной частью числа z, а число bi = Im z
— мнимой частью z. Тогда подполе вещественных чисел отождествляется
с координатной осью Ox. Все другие комплексные числа называются
мнимыми, а числа на оси Oy — чисто мнимыми.
Число z = a − bi называется комплексно сопряженным к числу z =
a + bi. Отображение z 7→ z — отражение относительно вещественной оси
Ox. Поскольку (−i)2 = −1, то комплексное сопряжение — изоморфизм
поля C на себя (автоморфизм). В частности,
z + w = z + w, zw = zw, z = z ⇔ z ∈ R.

Число |z| = a2 + b2 называется модулем числа z. Геометрически это
длина радиус-вектора, изображающего число z.
Сложение комплексных чисел осуществляется по правилу
(a, b) + (c, d) = (a + c, b + d)
и соответствует сложению двух радиус-векторов по правилу параллело-
грамма либо по правилу треугольника. Отсюда получаем неравенства
треугольника
|z ± w| 6 |z| + |w|, |z ± w| > ||z| − |w||.

21
Геометрический смысл умножения комплексных чисел

(a, b)(c, d) = (ac − bd, bc + ad),

можно увидеть в полярной системе координат.


Полярная система координат на плоскости задается выбором луча
Ox, масштаба и направления обхода вокруг начала координат O. Обычно
она дополняется до прямоугольной декартовой системы координат Oxy и
выбирается направление обхода против часовой стрелки по ближайшему
пути от луча Ox до луча Oy.
Каждому ненулевому комплексному числу z = a + bi сопоставляется
пара чисел (r, ϕ), где r — длина радиус-вектора, изображающего число
z, а ϕ — угол между лучом Ox и радиус-вектором, изображающим число
z. Таким образом,

z ↔ (r, ϕ), r > 0, 0 6 ϕ < 2π,



r = a2 + b 2 ,
a a
a = r cos ϕ ⇒ cos ϕ = = √ ,
r a2 + b2
b b
b = r sin ϕ ⇒ sin ϕ = = √ ,
r a + b2
2

√ a b
z 6= 0 ⇒ z = a + bi = a2 + b2 ( √ + i√ ) = r(cos ϕ + i sin ϕ)
a2 + b 2 a2 + b 2
(19)
Запись z = r(cos ϕ + i sin ϕ) называется
√ тригонометрической формой
комплексного числа z. При этом r = a2 + b2 — это модуль |z| числа z.
Число ϕ называется аргументом z и обозначается arg z. Удобно считать,
что аргумент ϕ представляется произвольным вещественным числом по
модулю 2π, т. е. с точностью до слагаемого 2kπ, k ∈ Z.
Замечание 4.2. Тригонометрическая форма комплексного числа един-
ственна.
Доказательство. Пусть

r(cos ϕ + i sin ϕ) = r0 (cos ϕ0 + i sin ϕ0 ), r, r0 > 0.

Тогда
r cos ϕ = r0 cos ϕ0 ,
r sin ϕ = r0 sin ϕ0 ,
2
r2 = r0 ⇒ r = r0 ,

22
cos ϕ = cos ϕ0 ,
sin ϕ = sin ϕ0 ,
ϕ ≡ ϕ0 (mod 2π) ⇒ ϕ = ϕ0 + 2kπ, k ∈ Z.

Теорема 4.2. При умножении комплексных чисел их модули перемно-


жаются, а аргументы складываются по модулю 2π.

Доказательство. Действительно, используя школьные формулы коси-


нуса и синуса суммы получаем

r(cos ϕ + i sin ϕ) · r0 (cos ϕ0 + i sin ϕ0 ) = rr0 ((cos ϕ cos ϕ0 − sin ϕ sin ϕ0 )+


i(sin ϕ cos ϕ0 + cos ϕ sin ϕ0 )) = (rr0 )(cos(ϕ + ϕ0 ) + i sin(ϕ + ϕ0 )), rr0 ≥ 0.

Ввиду единственности тригонометрической формы

|zz 0 | = rr0 = |z||z 0 |, arg(zz 0 ) ≡ ϕ + ϕ0 = arg z + arg z 0 (mod 2π).

Легко видеть, что отсюда следуют правило деления комплексных чи-


сел
r(cos ϕ + i sin ϕ0 ) r
0 0 0
= 0 (cos(ϕ − ϕ0 ) + i sin(ϕ − ϕ0 )),
r (cos ϕ + i sin ϕ ) r
тождество Эйлера

(a2 + b2 )(c2 + d2 ) = (ac − bd)2 + (ad + bc)2 ,

формула Муавра

(r(cos ϕ + i sin ϕ))n = rn (cos(nϕ) + i sin(nϕ)).

Теорема 4.3. Из ненулевого комплексного числа извлекается ровно n


корней степени n по следующей формуле:

 
p
n n
ϕ + 2kπ ϕ + 2kπ
r(cos ϕ + i sin ϕ) = r cos + i sin ,
n n

k = 0, 1, 2, . . . , n − 1

23
Доказательство. Пусть
n
(r0 (cos ϕ0 + i sin ϕ0 )) = r(cos ϕ + i sin ϕ).

Тогда по формуле Муавра

(r0 )n = r, nϕ0 ≡ ϕ (mod 2π),



r0 = n r > 0,
nϕ0 − ϕ = 2kπ, k∈Z
ϕ + 2kπ
ϕ0 = ,
n
Предположим, что ϕ0 имеет другое представление по модулю 2π:
ϕ + 2kπ ϕ + 2lπ
= + 2mπ, k, l, m ∈ Z.
n n
Тогда

ϕ + 2kπ = ϕ + 2lπ + 2mnπ ⇒ k = l + mn ⇒ n|(k − l).

Это означает, что числа k и l дают одинаковый остаток при делении на n.


Следовательно, количество различных корней совпадает с количеством
остатков при делении на n. Кроме того,
ϕ + 2kπ ϕ 2π
= + k, k = 0, 1, . . . , n − 1.
n n n
Отсюда видно, что все корни расположены в вершинах подходящего пра-
вильного n-угольника с центром в начале координат.

5 Подстановки
5.1 Группы подстановок
Определение 5.1. Подстановка ( или перестановка) — взаимно одно-
значное отображение конечного множества на себя. Природа элементов
несущественна. Будем считать, что множество — отрезок натурального
ряда X = {1, 2, 3 . . . , n − 1, n}. Подстановку можно задать таблицей с
двумя строками:
 
1 2 3 ... n
π= , где π : k 7→ ik , k = 1, . . . , n.
i1 i2 i3 . . . in

24
Числа i1 , i2 , i3 , . . . , in — это числа от 1 до n, записанные, вообще говоря, в
другом порядке. Порядок столбцов в записи подстановки можно менять:
   
1 2 3 2 3 1
= .
3 2 1 2 1 3

Подстановку представляется наглядно с помощью направленного гра-


фа отображения π : X → X.
направленный граф задается множеством вершин, множеством ре-
бер и функциями, указывающими для всякого ребра его начальную и
конечную вершину. Формально это четверка Γ = (X, E, α, ω), где

• X — множество "вершин"графа,

• E — множество "ребер"графа,

• α и ω — отображения из E в X, α(e), ω(e) — соответственно начало


и конец ребра e.

Пример 5.1. Если π : X → X — подстановка, то она задает граф отоб-


ражения, для которого множество вершин совпадает с X, а множе-
ство ребер E, функции начала и конца ребра задаются правилами

E = {(x, π(x))|x ∈ X},

e = (x, π(x)), α(e) := x, ω(e) := π(x).


Так, если  
1 2 3
,
3 1 2
то соответствующий граф — треугольник с вершинами 1, 2, 3 и реб-
рами, направленными от 1 к 3, от 2 к 1, от 3 к 2.

Определение 5.2. Зададим на множестве Sn = S(X) всех подстано-


вок на n-элементном множестве X умножение по правилу композициии
отображений :
(σπ)(x) = σ(π(x)), x ∈ X.
Легко проверяется, что σπ — также взаимно однозначное отображение
множества X на себя.

25
Пример 5.2.
     
1 2 3 1 2 3 1 2 3
· = ,
3 1 2 2 1 3 1 3 2
     
1 2 3 1 2 3 1 2 3
· =
2 1 3 3 1 2 3 2 1
Теорема 5.1. Множество Sn всех подстановок относительно указан-
ной операции умножения образует группу порядка n! = n(n − 1) . . . 1.
При n > 3 эта группа некоммутативна.
Доказательство. Проверим аксиомы группы. Пусть ρ, σ, π ∈ Sn .
1. Ассоциативность умножения:
(ρσ)π = ρ(σπ) ⇔ ((ρσ)π)(x) = (ρ(σπ))(x), ∀x ∈ X.
((ρσ)π)(x) = (ρσ)(π(x)) = ρ(σ(π(x))),
(ρ(σπ))(x) = ρ((σπ)(x)) = ρ(σ(π(x))).
2. Единица группы — тождественное отображение:
(x) = x ∀x ∈ X
(π)(x) = (π(x)) = π(x), ∀x ∈ X
(π)(x) = π((x)) = π(x), ∀x ∈ X
(π) = (π) = π
3. Обратное отображение существует:
π : x 7→ π(x) ⇒ π −1 : π(x) 7→ x,
   
1 2 ... n −1 i1 i2 . . . in
π= ⇒π = ⇒ ππ −1 = π −1 π = .
i1 i2 . . . in 1 2 ... n
Докажем некоммутативность при n > 3:
 
1 2 3 4 ... n
σ= ,
2 3 1 4 ... n
 
1 2 3 4 ... n
π= ,
2 1 2 4 ... n
σπ 6= πσ.
Найдем число элементов в Sn . Пусть π : k 7→ ik , k = 1, . . . , n, —
подстановка. В качестве i1 можно взять любое натуральное число от 1
до n. Это дает n возможностей. При выбранном i1 мы можем выбрать
i2 уже (n − 1) способами. Продолжая выбор, получим n! = n(n − 1) . . . 1
подстановок.

26
5.2 Разложение на циклы
Пусть π ∈ Sn . Обозначим

Fπ = {x ∈ X | π(x) = x}

— множество неподвижных символов подстановки π,

Tπ = {x ∈ X | π(x) 6= x}

— множество перемещаемых символов подстановки π. Очевидно,

X = Fπ ∪ Tπ ,

Fπ ∩ Tπ = ∅,
π(Fπ ) = Fπ ,
π(Tπ ) = Tπ .
Определение 5.3. Подстановки называются независимыми, если они
не имеют общих перемещаемых элементов:

π, σ независимы ⇒ Tπ ∩ Tσ = ∅.

Лемма 5.2. Независимые подстановки коммутируют:


Доказательство. Если σ и π независимы, то

 π(x), если x ∈ Tπ

(σπ)(x) = σ(x), если x ∈ Tσ

 x, если x ∈
/ Tπ ∪ Tσ

Отсюда σπ = πσ.
Определение 5.4. Цикл длины s — это подстановка σ, множество
перемещаемых элементов которой допускает такую нумерацию

Tσ = {i1 , i2 , . . . is },

что
σ : i1 7→ i2 , i2 7→ i3 , . . . , is−1 7→ is , is 7→ i1 .
Краткая запись цикла:
σ = (i1 , i2 , . . . , is ).
Неподвижную точку можно считать циклом длины 1.

27
Теорема 5.3. Всякая подстановка разлагается в произведение попарно
независимых циклов единственным способом с точностью до порядка
множителей. Такое разложение называется каноническим разложени-
ем подстановки.
Пример 5.3.  
1 2 3 4 5
= (1 2) · (3) · (4 5)
2 1 3 5 4
Доказательство. Докажем существование разложения подстановки π
индукцией по числу элементов в X.
Если n = 1, то π = (1).
Индукционный переход < n ⇒ n. Для тождественной подстановки
разложение очевидно:
 = (1)(2)(3) . . . (n).
Если π 6= , то существуют перемещаемые элементы,

π(i1 ) = i2 6= i1 .

Продолжая действовать с помощью π на i2 и учитывая конечность мно-


жества X, получим на некотором шаге s:

π(is−1 ) = is 6= i1 , i2 , . . . is−1 ,

π(is ) = ik , 1 6 k 6 s.
Покажем, что is не может отобразиться ни в один элемент, кроме i1 . Если
k > 1, то
π(ik−1 ) = ik = π(is ), ik−1 6= is .
Получили противоречие c взаимной однозначностью подстановки π. Сле-
довательно, k = 1.
Положим
σ = (i1 , i2 , i3 , . . . , ik ),
π 0 := σ −1 π.
Тогда
π 0 (ik ) = ik , 1 6 k 6 s,
число неподвижных символов для π 0 на s меньше, чем для π. По индук-
ции π 0 — произведение независимых циклов. Тогда и

π = σπ 0

— тоже произведение независимых циклов.

28
Теперь докажем единственность разложения.
Пусть для подстановки π возможны два разложения в произведение
независимых циклов:

π = σ1 σ2 . . . σk = σ1 0 σ2 0 . . . σl 0 .

Пусть k 6 l и σi , σj 0 — циклы длины > 2. Надо доказать, что k = l и


σ1 0 = σ1 , . . . , σk 0 = σk после подходящей нумерации множителей правой
части равенства.
Используем индукцию по k. Если k = 0, то l = 0 ввиду леммы.
Индукционный переход k − 1 ⇒ k, k > 0. Пусть

σ1 = (i1 , i2 , . . . , is ).

Тогда π(i1 ) = i2 6= i1 по лемме. Значит i1 входит в запись одного из


циклов справа, можно считать после перенумерации, что это цикл σ1 0 .
Пусть
σ1 0 = (i1 0 , i2 0 . . . it 0 ), i1 0 = i1 .
Теперь по лемме i2 0 = π(i1 ) = i2 . Продолжая, получим σ1 0 = σ1 . Отсюда
σ2 . . . σk = σ2 0 . . . σl 0 . По предположению индукции для k − 1 получаем
k = l и σ2 = σ2 0 , . . . , σk = σk 0 после перенумерации.

5.3 Четность и разложение на транспозиции


Определение 5.5. Декремент подстановки — это разность между
числом перемещаемых символов и числом независимых циклов длины
> 2 в каноническом разложении подстановки или, равносильно, разность
между числом всех элементов множества и числом независимых циклов
(включая одноэлементные) в каноническом разложении подстановки.
Если декремент чётен, то подстановка называется чётной. В против-
ном случае, подстановка называется нечётной.
Пример 5.4.
 
1 2 3 4 5 6 7
σ= = (1 4 2) (3) (5 6) (7)
4 1 3 2 6 5 7

Декремент
d(σ) = 7 − 4 = 5 − 2 = 3
Определение 5.6. Транспозиция — это цикл длины 2:

τ = (k l) = (l k).

29
Теорема 5.4. При умножении подстановки на транспозицию её чет-
ность меняется.
Доказательство. Пусть τ = (k l) — транспозиция, π — некоторая под-
становка. Символы k и l входят либо в один цикл в разложении π, либо
в два цикла. Рассмотрим оба случая.
1.
π = (k a b . . . l x y . . .)(. . .) . . .
πτ = (k x y . . .)(l a b . . .)(. . .) . . .

2.
π = (k a b . . .)(l x y . . .)(. . .) . . .
πτ = (k x y . . . l a b . . .)(. . .) . . .

Число независимых циклов либо увеличивается на 1, либо уменьшается


на 1. Тогда d(πτ ) = d(π) ∓ 1, четность декремента меняется.
Теорема 5.5. Всякая подстановка разлагается в произведение транспо-
зиций, это разложение неоднозначно, но четность числа сомножителей-
транспозиций совпадает с четностью подстановки.
Доказательство. Достаточно доказать, что циклы разлагаются в про-
изведение транспозиций. Легко проверить, что

(i1 , i2 . . . is ) = (i1 , i2 )(i2 , i3 ) . . . (is−1 , is )

Пусть π = τ1 τ2 τ3 . . . τk , где τi — транспозиция. Тогда по теореме 5.4


τ1 = τ1 нечетна, τ1 τ2 четна, τ1 τ2 τ3 нечетна, . . . . В итоге четность τ1 τ2 . . . τk
совпадает с четностью k.
Определение 5.7. Знак подстановки π определяется следующим равен-
ством: (
1, если π чётна,
sgn π =
− 1, если π нечётна.

Следствие. 1. sgn(σπ) = (sgn σ)(sgn π).

2. sgn(π −1 ) = sgn π.

3. Множество An всех четных подстановок из Sn образует подгруп-


пу в Sn .
n!
4. |An | = при n > 2.
2
30
Доказательство. 1. Пусть σ = τ1 . . . τk , π = τ1 0 . . . τl 0 , где τi , τj 0 транспо-
зиции. Тогда
σπ = τ1 . . . τk τ1 0 . . . τl 0 ,
sgn(σπ) = (−1)k+l = (−1)k · (−1)l = sgn σ · sgn π.
2. Пусть π = τ1 . . . τk , где τi — транспозиции. Тогда π −1 = τk . . . τ1 ,
количество транспозиций в разложениях одинаково.
3. Ввиду 1 и 2 произведение четных подстановок четно, обратная к
четной подстановке четна, тождественная подстановка четна.
4. Пусть n > 2 и τ — некоторая транспозиция из Sn . Пусть Bn = Sn \
An — множество нечетных подстановок. Установим взаимно однозначное
соответствие между An и Bn по правилу

π ↔ πτ.

Если σ нечётная, то подстановка π = στ четная и

π ↔ πτ = στ τ = σ.

Следовательно,
|Sn | n!
|An | = |Bn |, |An | = = .
2 2

6 Матрицы и определители
6.1 Кольцо матриц
Определение 6.1. Матрица размера s × n над кольцом K — это "пря-
моугольная таблица"  
a11 a12 . . . a1n
a21 a22 . . . a2n 
 
. . . . . . . . . . . . 
as1 as2 . . . asn
с элементами из aij из K, состоящая из s строк длины n вида (ai1 , ai2 , . . . ain , )
и n столбцов высоты s вида  
a1j
a2j 
 .
. . .
asj

31
Краткое обозначение для матрицы A = (aij ), 1 6 i 6 s, 1 6 j 6 n.
Если s = n, то матрица называется квадратной порядка n.
Более точно, если

Is,n = {(i, j) | 1 6 i 6 s, 1 6 j 6 n}

— множество пар индексов, то матрица — это отображение

A : Is,n → K по правилу A : (i, j) 7→ aij .

Матрицы можно складывать и умножать при определенных ограни-


чениях на их размеры. Складывать можно только матрицы одинакового
размера как складывают функции:

A = (aij ), B = (bij ) ⇒ A + B = (aij + bij ).

перемножать можно только матрицы, где количество столбцов первой


матрицы равно количеству строк второй матрицы:
n
X
AB = C = (cij ), cij = aik bkj .
k=1

Можно сказать, что на месте (i, j) в произведении матриц A и B стоит


"скалярное"произведение i-й строки A на j-й столбец B как векторов,
заданных равным количеством координат.

Пример 6.1.      
1 2 −1 0 0 −6
· =
3 4 2 −3 5 −12

Теорема 6.1. Множество Mn (K) всех квадратных матриц порядка n


над кольцом K само образуют кольцо относительно указанных опера-
ций.
Если K — ассоциативное кольцо с единицей, то и Mn (K) — ассоци-
ативное кольцо с единицей.

Доказательство. Проверим аксиомы кольца для Mn (K).


Как множество всех функций со значениями в кольце Mn (K) образует
абелеву группу относительно операции сложения. Можно проверить это
непосредственно. Пусть даны матрицы A = (aij ), B = (bij ), C = (cij )
над K.

32
1. (A + B) + C = A + (B + C)

(aij ) + (bij ) + (cij ) = (aij + bij ) + (cij )

= (aij + bij ) + cij = (aij + bij + cij ) = (A + B) + C


(aij ) + (bij ) + (cij ) = (aij ) + (bij + cij )

= aij + (bij + cij ) = (aij + bij + cij ) = A + (B + C)

2. A + B = B + A ⇔ (aij + bij ) = (bij + aij )

3. Нулевой элемент.
 
0 0 0 ... 0
0 0 0 ... 0 
0=
. . . . . . . . .

. . . . . .
0 0 0 ... 0

4. −A = (−aij )

5. (A + B)C = AC + BC и A(B + C) = AB + AC
n
X n
X n
X n
X
(aik + bik )ckj = (aik ckj + bik ckj ) = aik ckj + bik ckj
k=1 k=1 k=1 k=1

6. Если 1 — единица в кольце K, то единица в кольце матриц Mn (K)


— следующая матрица
 
1 0 0 ... 0
0 1 0 ... 0 
 
E= 0 0 1 ... 0  
. . . . . . . . . . . . . . .
0 0 0 ... 1
(
1 при i = j,
E = (eij ), где eij =
0 при i 6= j.
Действительно,
n
X
cij = aik ekj = aij ejj = aij ⇒ AE = EA = C.
k=1

33
7. Пусть умножение в K ассоциативно. Покажем, что (AB)C = A(BC).
Обозначим AB = P, Q = P C — левая часть доказываемого равен-
ства, BC = R, S = AR — правая часть. Покажем, что Q = S.
Имеем:
!
X X X XX
qij = pik ckj = ail blk ckj = ail blk ckj ,
k k l k l
!
X X X XX XX
sij = aik rkj = aik bkl clj = aik bkl clj = ail blk ckj .
k k l k l l k

Тогда qij = sij ввиду ассоциативности умножения в K и следующей


после окончания доказательства леммы о двойном суммировании.

ЛеммаP 6.2. P P суммировании Пусть X = {xij } — матрица.


P О двойном
Тогда k l xkl = l k xkl
Доказательство. Обе части равенства — это просто сумма всех элемен-
тов матрицы X. Ввиду коммутативности и ассоциативности сложения
сумма не зависит от внутренних перестановок слагаемых.
Замечание 6.1. Если 0 6= 1 ∈ K, n > 2, то умножение в Mn (K) некомму-
тативно.     
1 0 0 1 0 1
=
0 0 0 0 0 0
    
0 1 1 0 0 0
=
0 0 0 0 0 0
Замечание 6.2. Ненулевая матрица из Mn (K) может быть необратима в
Mn (K).     
1 0 x y x y
= 6= E ∀x, y, z, t ∈ K
0 0 z t 0 0
Замечание 6.3. Над полем удобно ввести операцию (унарную) умноже-
ния матрицы на элемент поля (скаляр):

A = (aij ) ⇒ λA = (λaij ).

Она связана со сложением и умножением матриц свойствами:

λ(A + B) = λA + λB,

(λ + µ)A = λA + µA,

34
(λµ)A = λ(µA),
1A = A,
λ(AB) = (λA)B = A(λB).
Кольцо матриц над полем с такой дополнительной операцией называется
алгеброй матриц.
Замечание 6.4. Из доказательства следует, что указанные свойства опе-
раций сложения и умножения матриц (С1-С4, СУ, У1), а также умноже-
ния на скаляр, верны и в случае прямоугольных матриц. Нужно только
требовать, чтобы матрицы имели согласованные размеры для осуществ-
ления операций.

6.1.1 Разложение в произведение диагональной и трансвекций


Определение 6.2. Пусть K — поле, A — матрица из Mn (K) и a1 , . . . , an
— её строки. Следующие преобразования системы строк назовем элемен-
тарными.
1. Прибавление к строке ar строки as , умноженной на λ (s 6= r):
ar 7→ ar + λas ,
ai 7→ ai , ∀i 6= r.

2. Перестановка строк:
ai 7→ aπ(i) , π ∈ Sn .

3. Умножение строки на обратимый элемент из K:


ar 7→ λar , λ 6= 0
ai 7→ ai ∀i 6= r.

Аналогично определяются элементарные преобразования системы столб-


цов. Элементарные преобразования матрицы — это элементарные преоб-
разования или системы строк, или системы столбцов матрицы. Можно
рассматривать элементарные преобразования и прямоугольных матриц.
Определение 6.3. Матрица D = (dij ) называется диагональной, если
все её элементы вне главной диагонали равны нулю:
dij = 0, ∀i 6= j.
Обозначая λj := djj пишем кратко D = Diag (λ1 , λ2 , . . . , λn ).

35
Теорема 6.3. Всякая матрица над полем приводится к диагональному
виду с помощью элементарных преобразований первого рода.

Доказательство. Пусть K — поле и A ∈ Mn (K). Используем индукцию


по n.
При n = 1 утверждение очевидно.
Индукционный переход n − 1 ⇒ n. Поскольку нулевая матрица явля-
ется диагональной, то считаем A 6= 0. Тогда существует элемент aij 6= 0.
Случай 1. α = a11 6= 0. Если ∃β = ai1 6= 0 при i > 1, то прибавим к
β
i-й строке первую строку, домноженную на λ = − . После применения
α
для i = 2, . . . , n получаем матрицу:
 
α ... ...
 0 . . . . . .
 
 .. .. .. 
. . . 
0 ... ...

Если β = a1j 6= 0 при j > 1, то прибавим к j-му столбцу первый столбец,


β
домноженный на λ = − . После применения для j = 2, . . . , n получаем
α
матрицу:  
α 0 ... 0
 0 . . . . . . . . .
 
 ..
 . . . . A 0 . . .

0 ... ... ...
Матрица A0 имеет меньший размер и по индуктивному предположе-
нию приводится к диагональному виду элементарными преобразования-
ми первого рода. Тогда и A приводится к диагональному виду.
Случай 2. a11 = 0 и ∃ai1 6= 0 при i > 1. Прибавим к первой строке
i-тую строку. Переходим к случаю 1.
Случай 3. ∀i ai1 = 0, но ∃a1j 6= 0 при j > 1. Прибавим к первому
столбцу j-тый столбец. Перейдем к случаю 1.
Случай 4. ∀i, j ai1 = 0, a1j = 0. Используем индуктивное предполо-
жение для матрицы меньшего размера как в конце случая 1.

Определение 6.4. Трансвекция (элементарная) — это матрица, от-


личающаяся от единичной матрицы только одним ненулевым элементом

36
на месте (r, s), r 6= s. Обозначение:
 
1 0 λ ... 0
0 1 0 ... 0 
 
0 0 1
Trs (λ) =  ... 0   = E + λErs ,
. . . . . . . . . . . . . . .
0 0 0 ... 1
 
0 0 1 ... 0
0 0 0 ... 0 
 
0 0 0
Ers =  ... 0  .
. . . . . . . . . . . . . . .
0 0 0 ... 0
Теорема 6.4. Всякая матрица над полем разлагается в произведение
диагональной и нескольких трансвекций.

Доказательство. Достаточно заметить, что элементарное преобразова-


ние 1 рода над строками матрицы равносильно умножению матрицы на
трансвекцию Trs (λ) слева, а над столбцами — на Tsr (λ) справа. Действи-
тельно:
Trs (λ)A = (E + λErs )A = A + λErs A,
 
   0 0 ... 0
0 0 ... 0 ... ... ... ...
 0 1 . . . 0  as1 as2 . . . asn   . . . . . . . . . . . . 
 
. . . . . . . . . . . .  . . . . . . . . . . . .  = as1 as2 . . . asn 
Ers A =     
. . . . . . . . . . . . 
0 0 ... 0 ... ... ... ...
0 0 ... 0
Таким образом, r-ая строка Trs (λ)A получается из r-ой строке A прибав-
лением s-ой строки, умноженной на λ.
Аналогично доказывается и для столбцов ATsr (λ).
По теореме 6.3 матрицу A элементарными преобразованиями перво-
го рода можно привести к диагональному виду. Заменим элементарные
преобразования умножениями на трансвекции. Получим

Ls . . . L2 L1 AR1 R2 . . . Rt = D.

Здесь Li , Rj — трансвекции, а D — диагональная матрица.

Лемма 6.5.
Trs (λ)Trs (µ) = Trs (λ + µ) (20)
(Trs (λ))−1 = Trs (−λ) (21)

37
Доказательство. Доказательство следует из связи умножения на транс-
векцию и элементарных преобразований первого рода. Отсюда:

A = L−1 −1 −1 −1 −1 −1
1 . . . Ls−1 Ls DRt Rt−1 . . . R1

6.2 Определитель и обратимость матрицы


Как узнать, обратима матрица над полем K или нет?
Здесь мы укажем функцию

det : Mn (K) → K

со свойством: матрица A обратима в Mn (K), если и только если det A 6= 0.

Определение 6.5. Определитель или детерминант квадратной матри-


цы A = (aij ) порядка n над полем K задается следующей формулой:
X
det A := sgn π · a1π(1) a2π(2) . . . anπ(n) .
π∈Sn

Здесь суммирование идет по подстановкам


 
1 2 3 ... n
π= ,
π(1) π(2) π(3) . . . π(n)

из Sn , всего слагаемых n!.

Пример 6.2.  
a11 a12
n = 2, A =
a21 a22

π sgn πa1π(1) a2π(2)


(1)(2) a11 a22
(1, 2) −a12 a21
det A = a11 a22 − a12 a21

Пример 6.3.  
a11 a12 a13
n = 3, A = a21 a22 a23  ,
a31 a32 a33

38
π sgn πa1π(1) a2π(2) a3π(3)
(1)(2)(3) a11 a22 a33
(1, 2, 3) a12 a23 a31
(1, 3, 2) a13 a21 a32
(1, 2)(3) −a12 a21 a33
(1, 3)(2) −a13 a22 a31
(2, 3)(1) −a11 a23 a32

det A = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a12 a21 a33 − a13 a22 a31 − a11 a23 a32 .

6.2.1 Свойства определителя


Лемма 6.6. При транспонировании матрицы её определитель не ме-
няется.

Доказательство. Матрица B = (bij ) называется траспонированной к


матрице A = (aij ), если bij = aji , ∀i, j.
X X
det B = sgn σ b1σ(1) . . . bnσ(n) = sgn σ aσ(1)1 . . . aσ(n)n =
σ∈Sn σ∈Sn
X X
−1
= sgn σ a1σ−1 (1) . . . anσ−1 (n) = sgn πa1π(1) . . . anπ(n) .
σ∈Sn π∈Sn

Здесь  
−1 σ(1) σ(2) . . . σ(n)
π=σ = ,
1 2 ... n
соответствие
σ ↔ σ −1 = π
взаимно однозначно.

Следствие. Cвойство определителя в терминах строк верно и в тер-


минах столбцов.

Определение 6.6. Функция f : K n → K называется линейной, если


∀a, b ∈ K n , λ ∈ K:

f (a + b) = f (a) + f (b) — аддитивность,

f (λb) = λf (a) — однородноть.

Пример 6.4. f (x1 , . . . , xn ) = c1 x1 +. . .+cn xn линейна при фиксированных


c1 , . . . , cn ∈ K.

39
Определение 6.7. Функция n аргументов называется полилинейной,
если она линейна по каждому аргументу при фиксированных остальных.

Лемма 6.7. Определитель — полилинейная функция системы строк


матрицы.

Доказательство. Зададим номер строки i и фиксируем остальные n − 1


строк. Тогда
X
det A = sgn πa1π(1) . . . aiπ(i) . . . anπ(n)
π∈Sn
 !
n
X X Y n
X
=  sgn π akπ(k) = cj aij ,
j=1 π(i)=j (π∈Sn ) k6=i j=1

!
X Y
cj = sgn π akπ(k) .
π(i)=j (π∈Sn ) k6=i

Определение 6.8. Функция n > 2 аргументов называется кососиммет-


рической, если она обращается в нуль при равенстве двух аргументов.

Лемма 6.8. Определитель — кососимметрическая функция системы


строк матрицы порядка n > 2 .

Доказательство. Пусть 1 6 r < s 6 n, arj = asj ∀j (две строки сов-


падают). Пусть π — чётная подстановка, τ = (rs) — транспозиция, ме-
няющая местами r и s. Тогда πτ = π 0 нечетна и произвольная нечетная
подстановка имеет такой вид. Поэтому
X X
det A = a1π(1) . . . anπ(n) + (−1)a1π0 (1) . . . anπ0 (n)
π∈An π 0 ∈Sn \An
X 
= a1π(1) . . . arπ(r) . . . asπ(s) . . . anπ(n) − a1π(1) . . . arπ(s) . . . asπ(r)...anπ(n) = 0.
π∈An

Следствие. Определитель меняет знак при перестановке двух строк


(столбцов) матрицы.

40
Доказательство. Это верно для любой полилинейной кососимметриче-
ской функции f . Можно считать, что аргументов всего два. Тогда

0 = f (a + b, a + b) = f (a, a) + f (a, b) + f (b, a) + f (b, b),

f (a, a) = 0, f (b, b) = 0,
f (a, b) + f (b, a) = 0, f (b, a) = −f (a, b).

Лемма 6.9. Определитель матрицы не меняется при элементарных


преобразованиях первого рода.

Доказательство.
       
a1 + λai a1 ai a1
 a2   a2   a2   a2 
 . . .  = det . . . + λ det . . . = det . . .
det         (i 6= 1)
an an an an

Следствие. Если некоторая строка матрицы — линейная комбинация


остальных строк матрицы, то ее определитель равен нулю.

Доказательство. Пусть a1 = λ2 a2 + . . . + λn an . Тогда


   
a1 − (λ2 a2 + . . . + λn an ) 0

 a2 
  a2 
 
det 
 a3  = det  a3  = 0
  
 ...  . . . 
an an

Следствие. Если матрица A = L1 . . . Lk DR1 . . . Rl , где Li и Rj — транс-


векции, а D — диагональная матрица, то det A = det D.

Доказательство. Умножение на трансвекции равносильно элементар-


ным преобразованиям первого рода.

Лемма 6.10. Определитель треугольной матрицы равен произведению


элементов главной диагонали матрицы.

41
Доказательство. Матрица A = (aij ) называется (верхне)треугольной,
если aij = 0 при i > j. Обозначая aii = λi , получаем вид
 
λ1 . . . . . .
 0 λ2 . . . 
A= 
. . . . . . . . .
0 0 λn
Тогда X
det A = sgn π a1π(1) . . . anπ(n) .
π∈Sn

Если i > π(i), то aiπ(i) = 0 и соответствующее слагаемое определителя


равно нулю. Можно считать
π(i) > i, ∀i.
Pn Pn
Если π(i) > i при некотором i, то i=1 π(i) > i=1 i. Но эти суммы
равны. Противоречие доказывает, что π(i) = i, ∀i, π — тождественная
подстановка и
det A = λ1 λ2 . . . λn .

Лемма 6.11. Определитель полураспавшейся матрицы равен произве-


дению определителей её диагональных клеток.
Доказательство. Матрица A = (aij ) называется полураспавшейся, если
существует такое r, 1 6 r < n, что aij = 0 при i > r, j 6 r.
 
P R
A= .
0 Q
Надо докаазать, что
det A = det P · det Q.
Преобразуем A в треугольную при помощи элементарных преобразова-
ний первого рода со строками, сначала верхнюю половину, а потом ниж-
нюю. При этом определитель не изменится и получим
 
λ1 . . . . . . . . . . . . . . .
..
0
 . ... ... ... ...  
 0 0 λr . . . . . . . . . 
 
det   = λ1 . . . λr µ1 . . . µn−r = det P · det Q
 0 0 0 µ1 . . . . . . 
 0 0 0 0 ... . . . 
 

0 0 0 0 0 µn−r

42
6.2.2 Определитель произведения матриц
Лемма 6.12. При умножении матрицы на диагональную слева i-я стро-
ка матрицы умножается на i-й элемент диагонали. При умножении
матрицы на диагональную справа j-й столбец матрицы умножается
на j-й элемент диагонали.

Доказательство. Пусть D = (dij ) = Diag(λ1 , . . . , λn ) и C = DA. Тогда


n
X
cij = dik akj = dii aij = λi aij .
k

Пусть C = AD. Тогда


n
X
cij = aik dkj = aij djj = aij λj .
k

Отметим, что ввиду полилинейности определителя после умножения


матрицы на диагональную ее определитель умножится на произведение
элементов главной диагонали, т. е. на определитель диагональной мат-
рицы.

Теорема 6.13.
det(AB) = det A · det B. (22)

Доказательство. Пусть A = L1 . . . Lk DR1 . . . Rl , где Li , Rj — трансвек-


ции, а D = Diag(λ1 , . . . , λn ) — диагональная матрица. Тогда

det(AB) = det(L1 . . . Lk DR1 . . . Rl B) = det(DR1 . . . Rl B)


= (λ1 . . . λn ) det(R1 . . . Rl B) = (λ1 . . . λn ) det B = det A · det B.

6.2.3 Критерий обратимости матрицы


Теорема 6.14. Для матрицы A порядка n над полем K следующие
утверждения равносильны:

1. ∃X ∈ Mn (K) : AX = XA = E,

2. ∃Y ∈ Mn (K) : AY = E,

43
3. ∃Z ∈ Mn (K) : ZA = E,

4. det A 6= 0.

При этом всегда X = Y = Z.

Доказательство. 1 ⇒ 2 Можно взять Y = X.


1 ⇒ 3 Можно взять Z = X.
2 ⇒ 4 Если AY = E, то

1 = det E = det A det Y, det A 6= 0.

3 ⇒ 4 Если XA = E, то

1 = det E = det X det A, det A 6= 0.

4 ⇒ 1 Пусть A = L1 . . . Lk DR1 . . . Rl , где Li , Rj — трансвекции, а


D = Diag(λ1 . . . λn ), det A 6= 0. Тогда

det A = det D = λ1 . . . λn 6= 0,

∀i : λi 6= 0 ⇒ ∃(λi )−1 ∈ K
Значит, существует матрица D−1 = Diag(λ−1 −1
1 . . . λn ) — обратная к D.
Тогда
X = Rl−1 . . . R1−1 D−1 L−1 −1
k . . . L1 .

Единственность обратной:

Z = ZE = Z(AY ) = (ZA)Y = EY = Y.

6.2.4 Разложение определителя по строке (столбцу)


Определение 6.9. Пусть A = (aij ) ∈ Mn (K). Тогда дополнительная
матрица Mij к месту (i, j) получается из A вычеркиванием i-й строки
и j-го столбца.

Определение 6.10. Ее определитель det Mij — это дополнительный


минор к месту (i, j) в матрице A.

Определение 6.11. Скаляр Aij = (−1)i+j det Mij называется алгебра-


ическим дополнением к месту (i, j) в матрице A.

44
Теорема 6.15. В предыдущих обозначениях:
n
(
X det A при i = k
aij Akj =
j=1
0 при i 6= k

Доказательство. Случай 1: i = k. Разложим i-ю строку


n
X
(ai1 , ai2 , . . . , ain ) = (0, . . . , 0, aij , 0, . . . , 0).
j=1

Ввиду линейности определителя по i-той строке разложим det A в сумму


по j слагаемых вида
 
X ... Y
det 0 . . . 0 aij 0 . . . 0 .
Z ... T

Переставим в матрице i-ю строку последовательно с (i − 1)-й, (i − 2)-й


, . . . , с 1-й, а затем j-й столбец — с (j − 1)-м, (j − 2)-м, . . . , c 1-м. Знак
изменится i − 1 + j − 1 раз. Получим j-е слагаемое с полураспавшейся
матрицей
 
aij 0 . . .
 .
(−1)i+j−2 det  .. X Y  = (−1)i+j aij det Mij = aij Aij .

..
. Z T

В итоге n
X
det A = aij Aij .
j=1

Случай 2: i 6= k.
Пусть матрица B получена из A заменой k-й строки на i-ю. Таким об-
разом, в матрице B две одинаковые строки: k-я совпадает с i-й. Поэтому
det B = 0.
С другой стороны, разложим det B по k-й строке, используя доказан-
ную формулу:
Xn
det B = aij Akj = 0.
j=1

45
6.2.5 Формула для обратной матрицы
Теорема 6.16. Пусть A = (aij ) — матрица порядка n над полем K и
det A 6= 0. Тогда
 
A11 A21 . . . An1
1  A12 A22 . . . An2 
A−1 =

.
det A  . . . . . . . . . ... 
A1n A2n . . . Ann

Можно сказать, что A−1 составлена из алгебраических дополнений к


местам матрицы A в транспонированном порядке, делённых на det A.
A
Доказательство. Обозначим Y = (yij ), где yij = detjiA . Проверим, что
AY = E — единичная матрица. Действительно,
n n n
! (
X X Ajk 1 X 1, если i = j
aik ykj = aik = aik Ajk =
k=1 k=1
det A det A k=1 0, если i 6= j

ввиду формулы разложения определителя по столбцу.


Пример 6.5.
   
a b −1 1 d −b
A= , det A = ad − bc 6= 0 ⇒ A =
c d det A −c a

6.3 Крамеровы системы линейных уравнений


Пусть дана система s линейных уравнений от n переменных x1 , x2 , . . . , xn
над полем K: 

 a11 x1 + a12 x2 + · · · + a1n xn = b1

a x + a x + ··· + a x = b
21 1 22 2 2n n 2
(23)

 . . .

as1 x1 + as2 x2 + · · · + asn xn = bs

Здесь aij , bi — заданные элементы из K —- коэффициенты при пере-


менных и правые части. Тогда A = (aij ) — это матрица системы 23,
 x1   b1 
x= .
.. — столбец переменных, а b = .. — столбец правых
xn
.
bn
частей или столбец свободных членов системы. Матрица (A | b) назы-
вается расширенной матрицей системы 23. Тогда система 23 имеет
краткую матричную запись Ax = b.
Система 23 называется совместной над K, если существует такой
столбец x0 ∈ K n , что Ax0 = b. Иначе x0 — решение системы 23 в поле K.

46
Система 23 называется крамеровой, если число уравнений равно
числу неизвестных и матрица системы невырождена:

s = n, det A 6= 0. (24)

Теорема 6.17. Крамерова система линейных уравнений имеет един-


ственное решение. Оно дается формулами:
det Ai
x0i = , i = 1, . . . , n, (25)
det A
где матрица Ai получается из матрицы A заменой i-го столбца на
столбец правых частей b.
Доказательство. Единственность решения. Пусть Ax0 = b. По условию
матрица системы обратима. Тогда

x0 = Ex0 = (A−1 A)x0 = A−1 (Ax0 ) = A−1 b.

Существование решения. Положим x0 := A−1 b. Тогда

Ax0 = A(A−1 b) = (AA−1 )b = Eb = b.

Вид решения. Поскольку x0 = A−1 b и известна формула для элемен-


тов обратной матрицы, то
n
X
bj Aji
n n
0
X
−1
X Aji j=1 det Ai
xi = (A )ij bj = bj = = .
j=1 j=1
det A det A det A

Действительно, ввиду формул разложения определителя матрицы Ai по


i-му столбцу
 
. . . b1 . . .
det Ai = det . . . ... . . . = b1 A1i + b2 A2i + · · · + bn Ani .
 
. . . bn . . .

6.4 Общая линейная группа


Определение 6.12. Пусть K — поле, а n — натуральное число. Обо-
значим
GLn (K) := {A ∈ Mn (K) | det A 6= 0}, (26)

47
SLn (K) := {A ∈ Mn (K) | det A = 1}, (27)
On (K) := {A ∈ Mn (K) | A−1 = AT }, (28)
T
Un (K) := {A ∈ Mn (K) | A−1 = A }. (29)

В последнем случае предполагается, что поле K, подобно полю ком-


плексных чисел, имеет автоморфизм α 7→ α со свойствами

α = α,

α + β = α + β,
α · β = α · β.
Используется обозначение

A = (aij ) ⇒ A := (aij ).

Лемма 6.18.
(AB)> = B > A> ,
(A−1 )> = (A> )−1 .

Доказательство.
X
(AB)>

ij
= (AB)ji = ajk bki ,
k
X X X
(B > A> )ij = b> >
ik akj = bki ajk = ajk bki ,
k k k

E = E = (AA ) = (A ) A> ,
> −1 > −1 >

(A> )−1 = (A−1 )> .

Лемма 6.19. 1. AB = A · B,

2. A−1 = (A)−1 ,

3. (A)> = A> .

Доказательство. 1.
X X
(AB)ij = aik bkj = aik bkj = (A · B)ij .
k k

48
2.
1 = 1, 0 = 0 ⇒ E = E,
E = E = A · A−1 = A · A−1 ,
(A)−1 = A−1 .

3.
A = (aij ) ⇒ A = (aij ) ⇒ (A)> = (aji ),
A> = (aji ) ⇒ A> = (aji ).

Теорема 6.20. Множества матриц GLn (K), SLn (K), On (K), Un (K)
образуют группы относительно умножения матриц. Они называются
соответственно общей линейной группой, специальной линейной груп-
пой, ортогональной группой и унитарной группой.

Доказательство. Ассоциативность следует из ассоциативности умноже-


ния произвольных матриц над полем. Осталось проверить замкнутость
относительно умножения, обращения и существования единицы.

1. GLn (K) — группа:

det E = 1 6= 0 ⇒ E ∈ GLn (K),

det A 6= 0 det B 6= 0 ⇒ det(AB) = det A · det B 6= 0,


поскольку в поле нет делителей нуля.

det A 6= 0 ⇒ ∃A−1 : AA−1 = E,

det E = det A · det A−1 = det(AA−1 ),


1
det A−1 = 6= 0.
det A
2. SLn (K) — группа:

det E = 1 ⇒ E ∈ SLn (K),

det A = det B = 1 ⇒ det(AB) = det A · det B = 1,


1
det A = 1 ⇒ det A−1 = = 1.
det A

49
3. On (K) — группа:

(E)−1 = E = E > ⇒ E ∈ On (K),

(A−1 = A> , B −1 = B > ) ⇒ (AB)−1 = B −1 A−1 = B > A> = (AB)> ,


A−1 = A> ⇒ (A−1 )−1 = (A> )−1 = (A−1 )> .

4. Un (K) — группа:
>
E = E −1 ⇒ E ∈ Un (K),

> >
(A−1 = A , B −1 = B ) ⇒
> >
⇒ (AB)−1 = B −1 A−1 = B · A = (A · B)> = (AB)> ,
> > >
A−1 = A ⇒ (A−1 )−1 = (A )−1 = A−1 .

7 Векторные пространства
7.1 Векторные пространства и подпространства
Определение 7.1. Пусть K — поле, V — абелева группа по сложению
и задано отображение

K ×V →V (λ, a) 7→ λa

со следующими свойствами (∀a, b ∈ V, ∀λ, µ ∈ K):

λ(a + b) = λa + λb, (30)

(λ + µ)a = λa + µa, (31)


(λµ)a = λ(µa), (32)
1 · a = a. (33)
Тогда V называется векторным (или линейным) пространством
над полем K. Элемент из V называется вектором, элемент из K —
скаляром.

50
Следствие.

λ(a − b) = λa − λb λ0 = 0 λ(−b) = −λb

Доказательство.

λa = λ(a − b + b) = λ(a − b) + λb

λa − λb = λ(a − b)
a = b ⇒ λ0 = 0 λ(−b) = −(λb)

Следствие.

(λ − µ)a = λa − µa 0a = 0 (−µ)a = −(µa)

Доказательство.

λa = (λ − µ + µ)a = (λ − µ)a + µa

λa − µa = (λ − µ)a
λ = µ ⇒ 0a = 0 (−µ)a = −(µa)

Пример 7.1. 1) Геометрический: K = R, V — множество геометри-


ческих векторов из аналитической геометрии.
2) Алгебраический: K — произвольное поле, V = K n Пространство
столбцов (строк) длины n с коэффициентами из K.
         
α1 β1 α 1 + β1 α1 λα1
 ..   ..   ..
 . + . = λ  ...  =  ... 
    
. 
αn βn α n + βn αn λαn

3) Функциональный: K — произвольное поле, X — некоторое мно-


жество, V состоит из функций на X со значениями в K:

V = F (X, K) = {f : X → K},

(f + g)(x) := f (x) + g(x),


(λf )(x) := λf (x).

51
Алгебраический пример — частный случай функционального при X =
{1, 2, 3, . . . , n}, вектор-столбец — это функция

1 → α1

2 → α2
...
n → αn
Замечание 7.1. F (X, K) — векторное пространство над K (проверьте
аксиомы).

Определение 7.2. Подмножество U векторного пространства V над


полем K называется подпространством пространства V , если оно за-
мкнуто относительно взятия нуля, сложения векторов, умножения на
любой скаляр из поля:

0 ∈ U, a, b ∈ U ⇒ a + b ∈ U, λ ∈ K, a ∈ U ⇒ λa ∈ U.

Равносильное утверждение:

U 6= ∅, λ, µ ∈ K a, b ∈ U ⇒ λa + µb ∈ U.

Обозначение: U 6 V, U < V.

Пример 7.2. 1) V — пространство геометрических векторов, U —


множество векторов, параллельных данной прямой (или данной плос-
кости).
2) V — произвольное пространство. Тогда U = {0} и U = V — три-
виальные подпространства.

Лемма 7.1. 1) Пересечение любого семейства подпространств данного


пространства образует подпространство.
3) Пусть A — непустое подмножество векторного пространства
V над полем K. Тогда множество

hAi = {λ1 a1 + · · · + λs as | λi ∈ K, ai ∈ A}

является наименьшим подпространством пространства V , содержа-


щим A.

52
Доказательство. 1) Очевидно.
2) Проверим аксиомы:

a ∈ A, 0 ∈ K ⇒ 0 = 0a ∈ hAi,
! !
X X X
λ i ai + µ i ai = (λi + µi )ai ∈ hAi,
i=1 i=1 i=1
!
X X
λ λi ai = (λλi ) ai ∈ hAi,
i=1 i=1

a = 1a ∈ hAi ⇒ hAi ⊃ A.
Таким образом, hAi — подпространство пространства V , содержащее
множество A. Пусть теперь U — подпространство V и U ⊃ A. Тогда
так как U — подпространство, то:
X
λi ai ∈ U ∀ai ∈ A, λi ∈ K
i=1

Значит hAi ⊆ U .

Определение 7.3. Множество hAi называется линейной оболочкой


множества A.

Например, если A = {a}, то

hAi = {λa|λ ∈ K},

т. е. это либо прямая, проходящая через вектор a 6= 0, либо нулевое


подпространство.

Определение 7.4. 7.2 Линейная зависимость, теорема о


замене
Система векторов a1 , a2 , . . . , as пространства V — это отображение
множества натуральных чисел {1, 2, 3, . . . , s} в пространство V (иначе
последовательность или набор векторов). X
Выражение вида λ1 a1 +· · ·+λs as = λi ai — линейная комбинация
i
векторов a1 , . . . , as с коэффициентами λ1 , . . . , λs .
В случае, если λ1 = λ2 = · · · = λs = 0, то комбинация называется
тривиальной.

53
Система векторов a1 , . . . , as называется линейно независимой, если
из равенства λ1 a1 + · · · + λs as = 0 следует, что λ1 = λ2 = · · · = λs = 0.
Система векторов a1 , . . . , as называется линейно зависимой, если
существует нетривиальная линейная комбинация этих векторов, равная
нулю:
∃λ1 , . . . , λs ∈ K : λ1 a1 + · · · + λs as = 0 ∃λi 6= 0
Лемма 7.2. 1. Система из одного вектора линейно зависима тогда
и только тогда, когда вектор нулевой.

2. Система из двух и более векторов линейно зависима тогда и толь-


ко тогда, когда некоторый вектор системы является линейной
комбинацией предыдущих векторов системы.
Доказательство. 1. ⇒ Предположим, что

∃λ 6= 0, λa = 0.

Так как λ ∈ K и K — поле, то для λ существует обратный элемент,

(λ−1 λ)a = λ−1 0,

1a = 0 ⇒ a = 0.
⇐ Нулевой вектор образует линейно зависимую систему, поскольку

1 · 0 = 0, 1 6= 0.

2. ⇒ Пусть s > 2 и a1 , . . . , as — линейно зависимая система. Значит,

∃λi ∈ K : λ1 a1 + · · · + λs as = 0, ∃λj 6= 0.

Тогда существует такое наибольшее m, что а) λm 6= 0, б) λ1 a1 + · · · +


λm am = 0. Отсюда
1 X −λi
am = (−λ1 a1 − · · · − λm−1 am−1 ) = ai .
λm i<m
λm

⇐ Пусть X
∃m : am = µ i ai .
i<m

Тогда X X
µi ai + (−1)am + 0ai = 0.
i<m i>m

и система векторов линейно зависима.

54
Определение 7.5. Система векторов a1 , . . . , ar линейно выражается
через b1 , . . . , bs , если всякий вектор ai — линейная комбинация векторов
b1 , . . . , bs . Равносильно,

ha1 , . . . , ar i ⊆ hb1 , . . . bs i.

Две системы векторов называются линейно эквивалентными, если


первая выражается через вторую, а вторая — через первую. Равносильно,

ha1 , . . . , ar i = hb1 , . . . bs i.

Лемма 7.3. Пусть даны три системы векторов в пространстве V над


полем K. Если первая линейно выражается через вторую и вторая —
через третью, то первая линейно выражается через третью.

Доказательство. Утверждение очевидно с учетом линейных оболочек


систем.

Теорема 7.4 (о замене). Пусть в векторном пространстве V над полем


K даны две системы векторов:

(1 ) a1 , . . . , ar ; (2 ) b1 , · · · , bs

Предположим, что (1) линейно независима и линейно выражается че-


рез (2).
Тогда r 6 s и некоторые r векторов системы (2) можно заменить
на векторы системы (1), так, что получится система (2’), линейно
эквивалентная системе (2).

Доказательство. Используем по сути индукцию. Пусть k > 1 и пусть


уже удалось так заменить k−1 векторов системы (2), что получена систе-
ма (3): a1 , . . . , ak−1 , bk , . . . , bs , линейно эквивалентная (2). Сделаем еще
один шаг, заменяя некоторый вектор bj (j > k) на вектор на ak с сохра-
нением линейной эквивалентности. По условию ak линейно выражается
через (2), а (2) линейно эквивалентна (3). По лемме 7.3 вектор ak линейно
выражается через (3):
X X
ak = λ i ai + λ j bj . (*)
i<k j≥k
P
Если ak = i<k λi ai , то (1) P
линейно зависима. Противоречие с условием
теоремы. Поэтому k 6 s и j≥k λj bj 6= 0. Таким образом, ∃j 6 k : λj 6=

55
0. Перенумеруем bk , . . . , bs таким образом, что λk = 6 0. Тогда bk можно
выразить из равенства (*):
!
1 X X
bk = ak − λ i ai − λ j bj . (**)
λk i<k j>k

Утверждается, что система (4): a1 , . . . , ak , bk+1 , . . . , bs линейно эквива-


лентна (3). Это следует из равенств (*) и (**). Система (4) линейно экви-
валентна (3), которая в свою очередь линейно эквивалентна (2). Поэтому
система (4) линейно эквивалентна (2). В итоге, после r шагов замены мы
получим искомую систему (2’).

7.3 Базис, ранг, размерность


Определение 7.6. Базис векторного пространства V над полем K
— это максимальная по включению линейно независимая система векто-
ров из V .

Лемма 7.5. Всякий вектор пространства выражается через базис про-


странства единственным образом в виде линейной комбинации.

Доказательство. Пусть e1 , e2 , . . . , en — базис пространства V над по-


лем K. Пусть a ∈ V . Тогда система e1 , e2 , . . . , en , a линейно зависима.
По лемме некоторый вектор линейно выражается через предыдущие. Но
e1 , e2 , . . . , en линейно независимы. Значит, a выражается через e1 , e2 , . . . , en :

a = α1 e1 + · · · + αn en αi ∈ K ∀i ≤ n.

Предположим, что a представляется не единственным образом:

a = α10 e1 + · · · + αn0 en .

Тогда
0 = (α1 − α10 )e1 + · · · + (αn − αn0 )en ,
α1 = α10 , . . . , αn = αn0

Определение 7.7. Пространство называется конечномерным, если оно


имеет конечный базис.

Теорема 7.6. Любые два базиса конечномерного векторного простран-


ства равномощны.

56
Определение 7.8. Число векторов в базисе векторного пространства V
называется размерностью и обозначается dim V .

Доказательство. Пусть (1): e1 , e2 , . . . , en и (2): f1 , f2 , . . . , fm — два ко-


нечных базиса. Всякий вектор системы (2) линейно выражается через
(1). По теореме о замене n ≤ m. Аналогично m ≤ n. Значит m = n.
Предположим, что система (2) — бесконечна и всякая её конечная
подсистема линейно независима. Предположим, что (1) — конечная си-
стема. Тогда система (3): f1 , f2 , . . . , fn , fn+1 линейно независима и линей-
но выражается через (1). По теореме о замене n + 1 6 n. Противоречие.
Значит если (1) конечна, то и (2) конечна.
Замечание 7.2. Можно доказать (с использованием леммы Цорна или
трансфинитной индукции), что любое векторное пространство имеет ба-
зис, и теорема верна и в бесконечномерном случае. Мы будем, в основ-
ном, рассматривать случай конечномерного пространства с конечным
базисом.

Определение 7.9. Базис системы векторов — это максимальная по


включению линейно независимая подсистема данной системы векторов.

Определение 7.10. Число векторов в базисе системы называется ран-


гом системы и для системы векторов A = (a1 , a2 , . . . , as ) обозначается
rk A.

Замечание 7.3. Ранг — это размерность линейной оболочки.

A = (a1 , . . . , as ) U =< a1 , . . . , as >

rk A = dim U
Доказательство. Действительно, базис системы векторов является ба-
зисом линейной оболочки, поскольку всякий вектор линейной оболочки
выражается через систему, а система — через базис системы.

Теорема 7.7. Пусть U — подпространство конечномерного простран-


ства V над полем K. Тогда

1. U имеет конечный базис и dim U 6 dim V ,

2. всякий базис U можно включить в базис V ,

3. U < V ⇒ dim U < dim V .

57
Доказательство. 1 и 2. Если U = {0} — нулевое подпространство, то U
не имеет базиса. Значит, dim U = 0 6 dim V . Если — ненулевое подпро-
странство, то выберем ненулевой вектор f1 из U . Тогда hf1 i ⊆ U . Если
hf1 i = U , то f1 — базис U . Если hf1 i ( U , то существует такой f2 ∈ U
, что f2 ∈ / hf1 i. Тогда f1 , f2 линейно независимы и hf1 , f2 i ⊆ U . Если
hf1 , f2 i = U , то f1 , f2 — базис U . Если hf1 , f2 i ( U , то существует
такой f3 ∈ U , что f3 ∈ / hf1 , f2 i. Тогда f1 , f2 , f3 линейно независимы
и hf1 , f2 , f3 i ⊆ U . Если hf1 , f2 , f3 i = U , то f1 , f2 , f3 — базис U . Если
hf1 , f2 , f3 i ( U , то ... и т. д.
Число векторов в линейно независимой системе векторов простран-
ства V не больше, чем размерность V . Поэтому указанный процесс обяза-
тельно оборвется на конечном шаге, т. е. будет построен базис f1 , f2 . . . fm
подпространства U и dim U = m 6 dim V .
3. Пусть f1 , . . . , fm — базис подпространства U и U < V . Тогда суще-
ствует такой вектор fm+1 ∈ V , что fm+1 ∈ / U . Если hf1 , . . . , fm , fm+1 i = V ,
то f1 , . . . , fm , fm+1 — базис V . Если hf1 , . . . , fm , fm+1 i ( V , то существу-
ет fm+2 ∈ V \ hf1 , . . . , fm+1 i ... и т. д. В итоге получаем базис V вида
f1 , . . . , fm , fm+1 , . . . , fn . Значит, dim U = m < n = dim V .
Замечание 7.4. В бесконечномерном пространстве базис подпростран-
ства можно дополнить до базиса пространства. Докажите — если V име-
ет счетный базис, то dim U 6 dim V .

Следствие. Пусть даны две системы векторов в пространстве V над


полем K:
A = (a1 , . . . ar ), B = (b1 , . . . , bs ).
Предположим, что система A линейно выражается через B. Тогда
rk A 6 rk B.

Доказательство. Пусть U = ha1 , . . . , ar i, а W = hb1 , . . . , bs i. Так как


векторы системы A выражаются через B, то U 6 W и

rk A = dim U 6 dim W = rk B.

Следствие. Ранги линейно эквивалентных систем равны.

Доказательство. См. предыдущее следствие.

58
7.4 Изоморфизмы векторных пространств
Определение 7.11. Два векторных пространства V и V 0 над полем
K называются изоморфными, если существует взаимно однозначное
соответствие между V и V 0 , которое сохраняется операциями:
a ↔ a0 , b ↔ b0 ⇒ a + b ↔ a0 + b0 , λa ↔ λa0 , ∀a, b ∈ V ∀λ ∈ K. (34)
Такое соответствие называется изоморфизмом векторных пространств.
Теорема 7.8. 1) Векторное пространство V размерности n над полем
K изоморфно пространству столбцов K n (n < ∞).
2) Два конечномерных векторных пространства над полем K изо-
морфны тогда и только тогда, когда их размерности равны.
Доказательство. 1) Пусть e1 , . . . , en — базис V . Установим соответствие
между V и K n по правилу:
 
Xn α1
a= αi ei ↔ . . . = ae ∈ K n .
i=1 αn
Назовем ae координатным столбцом вектора a в базисе e1 , . . . , en .
Утверждается, что это соответствие — изоморфизм. Соответствие
взаимно однозначно. Пусть
 
Xn β1
b= βi ei ↔  . . .  = be ∈ K n .
i=1 βn
Тогда  
n
X α1 + β1
a+b= (αi + βi )ei ↔  . . .  = ae + be ∈ K n ,
i=1 αn + βn
 
Xn λα1
λa = (λαi )ei ↔  . . .  = λae ∈ K n .
i=1 λαn
2) ⇒ Пусть a ↔ a0 — изоморфизм пространств V и V 0 над полем K.
Тогда
n
X n
X
0 ↔ 0, λ i ai ↔ λi a0i .
i=1 i=1
Отсюда линейно зависимая система соответствует линейно зависимой си-
стеме, линейно независимая система соответствует линейно независимой,
базис соответствует базису, dim V = dim V 0 .

59
⇐ Пусть e1 , . . . , en — базис V , а e01 , . . . , e0n — базис V 0 . Установим
соответствие по равенству координат:
n
X n
X
αi ei ↔ αi e0i .
i=1 i=1
0
Это и есть изоморфизм между V и V .

7.5 Замена базиса и замена координат


Определение 7.12. Пусть e1 , . . . , en и e01 , . . . , e0n — два базиса простран-
ства V над полем K, старый и новый. Выразим вектора нового базиса
через старый базис:
e01 = c11 e1 + · · · + cn1 en
..
.
e0n = c1n e1 + · · · + cnn en
Матрица C, состоящая из координатных столбцов векторов нового бази-
са в старом базисе, называется матрицей перехода от старого базиса
к новому  
c11 . . . c1n
C =  . . . . . . . . .  = (cij ) 1 6 i, j 6 n. (35)
cn1 . . . cnn
Теорема 7.9. Матрица перехода от одного базиса пространства и к
другому всегда обратима. Обратная к ней матрица является матрицей
обратного перехода.
Доказательство. Запишем матрицы прямого и обратного переходов:
n
X
e0j = ckj ek , C = (ckj ),
k=1
n
X
ek = c0ik e0i , C 0 = (c0ik ),
i=1
n n n
! n X
n n n
!
X X X X X X
e0j = ckj ek = ckj c0ik e0i = ckj c0ik e0i = c0ik ckj e0i
k=1 k=1 i=1 k=1 i=1 i=1 k=1
Воспользуемся единственностью разложения вектора по базису:
n
(
X 1 при i = j
c0ik ckj =
k=1
0 при i 6= j

60
Это равенство показывает, что C 0 C = E, C 0 = C −1 . Отсюда det C 6= 0 и
det C 0 = det1 C .
Теорема 7.10. Пусть e1 , . . . , en и e01 , . . . , e0n — два базиса пространства
V над полем K, а C : e → e0 — матрица перехода. Тогда координат-
ные столбцы ae и ae0 вектора a в базисах e1 , . . . , en и e01 , . . . , e0n связаны
равенством ae = Cae0 .
Доказательство. Пусть
X
e0j = ckj ek , C = (ckj ),
k
! !
X X X X X X
a= αk ek = αj0 e0j = αj0 ckj ek = ckj αj0 ek ,
k j j k k j
X
αk = ckj αj0 .
j

Тогда
X 
  c1j αj0
   
α1  j


 c11 . . . c1n α10
 ..   ..   .. .. ..  ·  ..  ⇒ a = Ca 0 .
 . = . = . . .   .  e e
0
X 
αn 0 cn1 . . . cnn αn
 cnj αj 
j

7.6 Сумма и пересечение подпространств


Определение 7.13. Сумма семейства подпространств некоторого век-
торного пространства — это линейная оболочка объединения семейства
этих подпространств: X [
Ui = h Ui i.
i∈I i∈I

Объединение подпространств может и не быть подпространством, но


сумма и пересечение семейства подпространств, очевидно, являются под-
пространствами.
Теорема 7.11. (формула Грассмана) Пусть U , W — подпространства
конечномерного векторного пространства V над полем K. Тогда

dim(U + W ) = dim U + dim W − dim(U ∩ W ).

61
Доказательство. Пусть e1 , . . . , er — базис U ∩ W . Дополним его до ба-
зисов U и W . Пусть e1 , . . . , er , f1 , . . . , fs — базис U , а e1 , . . . , er , g1 , . . . , gt
— базис W . Достаточно доказать, что e1 , . . . , er , f1 , . . . fs , g1 , . . . gt — базис
U + W . Действительно, тогда

dim(U +W ) = (r+s+t) = (r+s)+(r+t)−r = dim U +dim W −dim(U ∩W ).

Прооверим линейную независимость. Пусть


X X X
αe ei + βj f j + γk gk = 0, αi , βj , γk ∈ K.
i j k

Тогда X X X
αi ei + βj f j = − γk gk ∈ U ∩ W.
i j k

Значит существует δi ∈ K:
X X
− γk gk = δi ei ,
k i
X X
γk gk + δi ei = 0.
k i

Тогда δi = 0, ∀i и γk = 0, ∀k, так как e1 , . . . , er , g1 , . . . gt — базис W . Воз-


вращаясь к исходному равенству и учитывая выбранный базис для U , по-
лучим αi = 0∀i, βj = 0∀j. Следовательно, система e1 , . . . , en , f1 , . . . , fs , g1 , . . . gt
линейно независима.
Докажем максимальность. Пусть
X X
u= αi ei + βj fj ∈ U,
i j

X X
w= αi0 ei + γk gk ∈ W.
i k

Тогда X X X
u+w = (αi + αi0 )ei + βj fj + γk gk .
i j k

Замечание 7.5. Пусть U, V, W — подпространства пространства X. Мож-


но ли выразить размерность их суммы U + V + W через размерности U ,
V , W , их попарных пересесечений и тройного пересечения?

62
Доказательство. Остаётся читателю в качестве упражнения.

Определение 7.14. Сумма семейства подпространств векторного про-


странства называется прямой суммой, если всякий вектор суммы име-
ет единственное представление в виде суммы слагаемых из подпространств.
Здесь предполагается, что все слагаемые нулевые за исключением конеч-
ного числа, т. е. сумма фактически конечна. Обозначение: ⊕i∈I Ui , U ⊕W ,
U1 ⊕ U2 ⊕ · · · ⊕ Us .
X
Теорема 7.12. Сумма Ui семейства подпространств Ui простран-
i∈I
ства V является прямой суммой тогда и только тогда, когда
!
X
Ui ∩ Uj = {0}, ∀i.
j6=i
P P
Доказательство. ⇒ Пусть ui = j6=i uj , uk ∈ Uk . Тогда ui − j6=i uj =
0. Из однозначного представления нуля получим uk = 0 ∀k. Поэтому
!
X
Ui ∩ Uj = {0}, ∀i.
j6=i

⇐ Пусть X X
uj = u0j , uj , u0j ∈ Uj .
j∈I j∈I

Выберем любой индекс i. Тогда


!
X X
ui − u0i = (u0j − uj ) ∈ Ui ∩ Uj = {0},
j6=i j6=i

ui − u0i = 0, ui = u0i ∀i.

Следствие. Пусть V = U ⊕ W . Тогда вектор v ∈ V имеет един-


ственное представление v = u + w, где u ∈ U , w ∈ W . Отображение
pr : v = u + w 7→ w называется проецированием V на W параллельно
U . Поецирование линейно:

pr(v + v 0 ) = pr v + pr v 0 ,

pr(λv) = λ(pr v).

63
7.7 Фактор-пространство и его размерность
Определение 7.15. Пусть X — множество. Бинарное отношение на
множестве X — это булевозначная функция
R : X × X → {1, 0},
aRb ⇔ R(a, b) = 1.
Определение 7.16. Отношение R называют отношением эквивалент-
ности, если выполняются свойства:
1. ∀a ∈ X : aRa — рефлексивность,
2. ∀a, b ∈ X : aRb ⇒ bRa — симметричность,
3. ∀a, b, c ∈ X : (aRb, bRc) ⇒ aRc — транзитивность.
Чаще используют значок волна ∼ вместо R для отношения эквивалент-
ности. Если ∼ — отношение эквивалентности, то класс эквивалентности
с представителем a определяется по правилу:
a = {x ∈ X | x ∼ a}
e
Теорема 7.13. Классы эквивалентности разбивают множество X,
т. е. в совокупности все классы покрывают X, но разные классы не
пересекаются: [
X= a, e
e a 6= b̃ ⇒ e
a ∩ eb = ∅.
a∈X
[
Доказательство. Очевидно, что a ∈ e
a, ∀a ∈ X. Поэтому a = X.
e
a∈X
Пусть ea 6= eb. Докажем, что e a ∩ eb = ∅. Предположим, что это не так
и существует c ∈ e a ∩ eb. Тогда a ∼ c, c ∼ b ⇒ a ∼ b. Если x ∼ a, то
x ∼ b и потому e a ⊆ eb. По аналогии выводим, что eb ⊇ e
a. Таким образом,
a = b.
e e

Определение 7.17. Множество, элементами которого являются классы


a (a ∈ X), называют фактор-множеством множе-
эквивалентности e
ства X по отношению эквивалентности ∼ и обозначают X/ ∼.
Пример 7.3. Школьный пример — рациональные числа. Фактически
это классы эквивалентности, которые могут иметь различные пред-
ставители, изображающие один класс:
3 6 36
= = = ··· .
4 8 48

64
Определение 7.18. n-арная алгебраическая операция f (a1 , . . . , an ) на
множестве X согласована с отношением эквивалентности ∼, если:
a1 ∼ a01 


a2 ∼ a02 

⇒ f (a1 , a2 , . . . , an ) ∼ f (a01 , a02 , . . . , a0n )
... 


0 
an ∼ an

В этом случае операция f индуцирует операцию fe на множестве X/ ∼


по правилу:
fe(ae1 , ae2 , . . . , aen ) := f (a1 , ^
a2 , . . . , an )
Все свойства операции f в виде тождеств справедливы и для fe. Напри-
мер,
a+b=b+a⇒e a+e eb = eb + a.
e e

Определение 7.19. Пусть V — векторное пространство над полем K,


а U — его подпространство. Введем отношение смежности на V по
модулю подпространства U по правилу

a ≡ b (mod U ) ⇔ a − b ∈ U.

Это отношение эквивалентности. Для краткости временно обозначим


его волной.
a∼a: a−a=0∈U
a ∼ b ⇒ b ∼ a : a − b ∈ U ⇒ b − a = (−1)(a − b) ∈ U,
a ∼ b, bsimc ⇒ a ∼ c : a − b, b − c ∈ U ⇒ (a − b) + (b − c) ∈ U.
Класс эквивалентности

a = {x ∈ V | x ∼ a} = {x ∈ V | x − a = u ∈ U } = {a + u|u ∈ U } = a + U
e

называется линейным многообразием, проходящим через точку a парал-


лельно подпространству U .
Например, если U — прямая на плоскости, проходящая через нуль
(начало координат), то a + U — параллельная прямая при a ∈
/ U и U при
a ∈ U.
Фактор-множество V /≡ (mod U ) обозначается через V /U . Утвержда-
ется, что операции векторного пространства согласованы с отношением
смежности по модулю подпространства:
) (
a ∼ a0 a + b ∼ a0 + b 0

b ∼ b0 λa ∼ λa0

65
) (
a − a0 ∈ U (a + b) − (a0 + b0 ) = (a − a0 ) + (b − b0 ) ∈ U

b − b0 ∈ U λa − λa0 = λ(a − a0 ) ∈ U
Это верно при любых a, a0 , b, b0 ∈ V, λ ∈ K. Следовательно, сложение
векторов и умножение на скаляр индуцирует соответствующие операции
на множестве V /U .
Теорема 7.14. 1) Пусть U — подпространство пространства V над
полем K. Тогда фактор-множество V /U образует векторное простран-
ство над K относительно индуцированных из V операций сложения
векторов и умножения на скаляр.
Оно называется фактор-пространством пространства V по мо-
дулю подпространства U .
2) Если V конечномерно, то dim(V /U ) = dim V − dim U.
Доказательство. 1) Все аксиомы векторного пространства, имеющие
характер тождеств верны и в фактор-пространстве. Например:

(e c = a]
a + eb) + e c = a^
+b+e a + b]
+b+c=e +c=e
a + (eb + e
c)

Проверим аксиомы наличия нуля и противоположного элемента:

0+e
e a = 0]
+a=e
a,

0 = 0 + U = U — нулевой класс фактор-пространства V /U ;


e

e f = a^
a + −a 0 ⇒ −a
+ (−a) = e f = −e
a.

2) Пусть f1 , . . . , fr — базис U , f1 , . . . , fr , fr+1 , . . . , fn — базис V . Утвер-


ждается, что классы fg r+1 , . . . , fn образуют базис фактор-пространства
e
V /U . Тогда
dim(V /U ) = dim V − dim U.
Докажем линейную независимость системы классов. Пусть

r+1 + · · · + λn fn = 0
λr+1 fg λi ∈ K ∀i
e e

+ · · · + λn fn = e
λr+1 fr+1^ 0
λr+1 fr+1 + · · · + λn fn ∈ U
λr+1 fr+1 + · · · + λn fn = λ1 f1 + · · · λr fr
−λ1 f1 − · · · − λr fr + λr+1 fr+1 + · · · + λn fn = 0
f1 , . . . , fn — базис V , тогда λ1 = · · · = λn = 0.

66
a ∈ V /U . Тогда
Докажем ее максимальность. Пусть e
a = λ1 f 1 + · · · + λn f n ,
a − λr+1 fr+1 − · · · − λn fn = λ1 f1 + · · · + λr fr ∈ U,
+ · · · + λn fn = λr+1 fg
a = λr+1 fr+1^
e r+1 + · · · + λn fn .
e

7.8 Ранг матрицы и теорема о ранге


Определение 7.20. Пусть A — матрица размера s × n над полем K.
Минор порядка r из A — это определитель квадратной подматрицы
порядка r из матрицы A. Здесь r 6 s и r 6 n.
Определение 7.21. Базисный минор из матрицы A — это ненулевой
минор наибольшего порядка из A.
Определение 7.22. Минорный ранг матрицы A — порядок ее базис-
ного минора.
Определение 7.23. Строчный (столбцовый) ранг матрицы A —
ранг системы строк (столбцов) матрицы A как векторов в пространстве
K n (соответственно K s ).
Теорема 7.15 (о ранге). Для матрицы над полем её строчный, столб-
цовый и минорный ранги совпадают. Это число называется рангом
матрицы A и обозначается rk A.
Доказательство. Докажем, что равны столбцовый и минорный ранги.
Выберем в матрице A размера s×n над полем K базисный минор порядка
r. Для простоты изложения считаем, что матрица B базисного минора
расположена в левом верхнем углу матрицы A. По условию det B 6= 0.
Достаточно доказать, что первые r столбцов A образуют базис си-
стемы столбцов в A. Докажем линейную независимость. Если первые r
столбцов A линейно зависимы, то линейно зависимы и столбцы B, как
укороченные столбцы. Это противоречит условию det B 6= 0.
Докажем максимальность. Достаточно доказать, что j-й столбец A
при j > r линейно выражается через первые r столбцов. Выберем i такое,
что 1 6 i 6 s, и рассмотрим "окаймляющую"для B матрицу
 
a11 . . . a1r a1j
 .. .. .. .. 
M = . . . . 


ar1 . . . arr arj 
ai1 . . . air aij

67
Поскольку det M при i > r — минор из A порядка r + 1, а при i 6 r
матрица M содержит две одинаковые строки, то в любом случае det M =
0.
Разложим det M по последней строке, используя алгебраические до-
полнения:

0 = det M = ai1 Ar+1 1 (M ) + · · · + air Ar+1 r (M ) + aij det B,

Ar+1 1 (M ) Ar+1 r (M )
aij = − ai1 − · · · − air . (36)
det B det B
−Ar+1 k (M )
Коэффициент λk = не зависит от i, так как (r + 1)-ая стро-
det B
ка матрицы M вычеркивается при взятии алгебраического дополнения.
Равенства 36 дают требуемое векторное равенство:
     
a1j a11 a1r
a2j  a21  a2r 
 ..  = λ1  ..  + · · · + λr  ..  .
     
 .   .   . 
asj as1 asr

Докажем совпадение строчного ранга и других. Легко видеть, что


равны строчный ранг A, столбцовый ранг A> , минорный ранг A> , ми-
норный ранг A (так как при транспонировании квадратной матрицы
определитель не меняется).

Следствие. Для квадратной матрицы A над полем равносильны утвер-


ждения:

1. det A = 0,

2. система строк A линейно зависима,

3. система столбцов A линейно зависима.

Доказательство. Пусть A — матрица порядка n. Имеем det A = 0 ⇔


минорный ранг A < n ⇔ система строк (столбцов) A линейно зависима
(по теореме о ранге).

Следствие. Ранг матрицы не меняется при расширении поля коэффи-


циентов.

Доказательство. Ранг матрицы совпадает с порядком базисного мино-


ра, а он не меняется при расширении поля.

68
7.9 Ранг произведения матриц
Теорема 7.16. Для матриц над полем
(
rk C 6 rk B,
C = AB ⇒
rk C 6 rk A.

Доказательство. Пусть A — размера s × n, B — n × r, C — s × r.По


правилу умножения матриц
X
cij = aik bkj .
k

Зададим индекс j. Имеем


  P   
c1j k a1k bkj a1k
 ..   .
.  X  .. 
 . = =  .  bkj
P .
csj k ask bkj
k ask

Отсюда j-й столбец матрицы C — линейная комбинация столбцов матри-


цы A с коэффициентами из j-го столбца матрицы B. Поскольку система
столбцов матрицы C линейно выражается через систему столбцов A, то
rk C 6 rk A.
Зададим индекс i. Имеем
!
X X X
(ci1 , . . . , cis ) = aik bk1 , . . . , aik bks = aik (bk1 , . . . , bks )
k k k

Отсюда i-я строка матрицы C — линейная комбинация строк матрицы


B с коэффициентами из i-го столбца матрицы A. Поскольку система
строк матрицы C линейно выражается через систему строк B, то rk C 6
rk B.

Следствие. При умножении на обратимую матрицу ранг не меняет-


ся.

Доказательство. Пусть C = AB и A — обратима. Тогда B = A−1 C. По


теореме о ранге произведения (7.16):

rk C 6 rk B, rk B 6 rk C ⇒ rk C = rk B.

Аналогично в случае обратимой матрицы B.

69
7.10 Критерий совместности системы линейных урав-
нений
Теорема 7.17 (Кронекера-Капелли). Система линейных уравнений Ax =
b над полем K совместна ⇔ rk A = rk (A | b).
Доказательство. ⇒ Пусть существует такой вектор x0 ∈ K n , что Ax0 =
b. Перепишем равенствоAx0 = b в векторном виде:
     
a11 a1n b1
 ..  0  ..  0  .. 
 .  x1 + · · · +  .  x n =  .  (37)
as1 asn bs

Это означает, что столбцы матрицы (A | b) линейно выражаются через


столбцы матрицы A. Тогда системы столбцов A и (A | b) линейно экви-
валентны, rk A = rk (A | b).
⇐) Если rk A = rk (A | b), то базис системы столбцов A остается ба-
зисом в системе столбцов (A | b). Тогда вектор b линейно выражается
через столбцы матрицы A. Получается равенство вида 37. Коэффициен-
ты линейной комбинации 37 — решение системы Ax = b.

7.11 Общее решение системы линейных уравнений


Система линейных уравнений может не иметь решений, например,
уравнение 0x = 1; может иметь конечное множество решений, например,
уравнение 2x = 1 при 2 6= 0; или бесконечно много решений, например,
уравнение 0x = 0. Если для конечного множества мы можем предъявить
список, то как представить бесконечное множество?
Пример 7.4. Ответ подсказывает следующий пример. Пусть K = R.

x1 + x2 = 1 ⇒ x1 = 1 − x2 ,

Можно считать x2 =: t — произвольным параметром. Тогда всякое


решение имеет вид

x1 = 1 − t, x2 = t, t ∈ R.

Иначе говоря, множество решений уравнения x1 + x2 = 1 — это образ


при отображении f : R → R2 по правилу
 
1−t
t→ .
t

70
Определение 7.24. Общее решение (ОР) совместной системы ли-
нейных уравнений от n переменных над полем K — это отображение
координатного пространства K d на множество L ⊂ K n всех решений
системы:
L
f : Kd −
→⊂ K n ,

(t1 , . . . , td ) 7→ (f1 (t1 , . . . , td ), . . . , fn (t1 , . . . , td )).


Пример 7.5. В предыдущем примере

d = 1, f1 (t) = 1 − t, f2 (t) = t

Определение 7.25. Функция вида f (t1 , . . . , td ) = c0 + c1 t1 + · · · + cd td ,


где ci ∈ K, называется аффинной, а при c0 = 0 — линейной.
Теорема 7.18. Всякая совместная система линейных уравнений над
полем имеет общее решение, состоящее из аффинных функций.
Доказательство. Построим общее решение.
Шаг 1. Проверка совместности системы Ax = b: rk A = rk (A | b).
Шаг 2. Выделяем главные уравнения. Найдем в матрице A базисный
минор. Уравнения, «проходящие» через него, назовем главными. Для
упрощения обозначений положим, что матрица базисного минора распо-
ложена в левом верхнем углу матрицы A и имеет порядок r. Утвеждает-
ся, что вся система равносильна системе первых r уравнений. Обозначим:

aei = (ai1 , ai2 , . . . , ain , bi ) — i-тая строка (A | b),

ae1 , . . . , aer — базис системы строк (A | b).


Значит, при i > r:
r
X
aei = λk aek ,
k=1
 r
X

 a = λk akj
 ij


k=1
n
X

 bi = λk bk



k=1

Пусть x =0
(x01 , . . . , x0n )>
— решение первых r уравнений для Ax = b.
0
Покажем, что x — решение i-того уравнения (∀i > r):
n n r
! r n
! r
X X X X X X
aij x0j = λk akj x0j = λk akj x0j = λ k bk = b i .
j=1 j=1 k=1 k=1 j=1 k=1

71
Шаг 3. Приведем к разрешенному виду: перепишем первые r уравне-
ний. 
a x + · · · + a1r xr = b1 − a1 r+1 xr+1 − · · · − a1n xn
 11 1


.. (38)
 .

a x + ··· + a x = b − a
r1 1 rr r x 1− ··· − a x
r r+1 r+1 rn n

Систему 38 можно рассматривать как крамерову систему относитель-


но x1 , . . . , xr . Решим её по правилу Крамера или методом исключения
переменных. Получим при некоторых cij , dk ∈ K:

x = d1 + c11 xr+1 + · · · + c1 n−r xn =: f1
 1


.. (39)
 .

r1 r+1 + · · · + cr n−r xn
 x =d +c x =: fr
r r

Утверждается, что набор функций

(f1 (xr+1 , . . . , xn ), . . . , fr (xr+1 , . . . , xn ), xr+1 , . . . , xn ),

где f1 , . . . , fr — правая часть системы 39, является общим решением си-


стемы линейных уравнений.
Действительно, при любых x0r+1 , . . . , x0n ∈ K можно вычислить

f1 (x0r+1 , . . . , x0n ), . . . , fr (x0r+1 , . . . , x0n )

и получить решение системы 39. По построению имеем: 39 ∼ 38 ∼ Ax =


b.
Если (x01 , . . . , x0r , x0r+1 , . . . x0n ) — решение системы Ax = b, то это реше-
ние системы 39.
Пример 7.6. (
x1 + x2 + x3 + x4 = 1
x1 + 2x2 + 3x3 + 4x4 = 0
     
1 1 1 1 | 1 1 1 1 1 | 1 1 0 −1 −2 | 2
(A|b) = ∼ ∼
1 2 3 4 | 0 0 1 2 3 | −1 0 1 2 3 | −1
(
x1 = x3 + 2x4 + 2
x2 = −2x3 − 3x4 − 1
Общее решение:

(2 + x3 + 2x4 ; −1 − 2x3 − 3x4 ; x3 ; x4 )


| {z } | {z } |{z} |{z}
f1 f2 f3 f4

72
Отсюда можно найти геометрическое описание множества решений
— это плоскость L = x0 + U , что видно из представления
x0 ∈U =hf1 ,f2 i,dim U =2
   z }| { z  }|   {
x1 2 1 2
x2  −1 −2 −3
  =   +   x3 +   x4
 x3   0   1  0
x4 0 0 1

7.12 Связь между решениями неоднородных и одно-


родных систем
Определение 7.26. Система линейных уравнений Ax = b называется
неоднородной, если b 6= 0. Система Ax = 0 называется соответствую-
щей однородной.
Теорема 7.19. 1) Множество U решений однородной системы Ax = 0
от n переменных над полем K образует подпространство из K n .
2) Множество L всех решений совместной неоднородной системы
линейных уравнений Ax = b от n переменных над полем K образует
линейное многообразие L = x0 + U , где x0 — частное решение системы,
U — пространство решений соответствующей однородной системы.
Альтернативная формулировка (менее формальная):
{все решения Ax = b} = x0 + {все решения Ax = 0}
Доказательство. 1) Докажем замкнутость U относительно взятия нуля,
сложения векторов и умножения на скаляр.
• A0 = 0 ⇒ 0 ∈ U,
• Au = 0, Av = 0 ⇒ A(u + v) = Au + Av = 0 + 0 = 0,
• Au = 0 ⇒ A(λu) = λ(Au) = λ0 = 0.
2) Пусть Ax0 = b, а U — пространство решений однородной системы
Ax = 0, L — множество решений системы Ax = b. Если u ∈ U , то Au = 0,
A(x0 + u) = Ax0 + Au = b + 0 = b, x0 + u ∈ L, значит x0 + U ⊆ L.
Пусть x — решение неоднородной системы, т. е. Ax = b. Тогда
A(x − x0 ) = Ax − Ax0 = b − b = 0,
x − x0 = u ∈ U, x = x0 + u ∈ x0 + U,
L ⊆ x0 + U.
Следовательно, L = x0 + U.

73
7.13 Фундаментальные системы решений
Определение 7.27. Фундаментальная система решений (ФСР) —
это базис пространства решений однородной системы линейных уравне-
ний.

Теорема 7.20. Пусть дана система линейных уравнений Ax = 0 от n


переменных над полем K и пусть U — пространство её решений. Тогда
1) базис U , т. е. фундаментальную систему решений, можно найти
за конечное число шагов (при условии точной арифметики),
2) dim U = n − r, где r = rk A.

Доказательство. Считаем, что система Ax = 0 уже записана в разре-


шенном виде 
x = c11 xr+1 + · · · + c1 n−r xn
 1


..
 .

x = c x
r + ··· + c
r1 r+1 x
r n−r n

где cij ∈ K.
Добавим тривиальные равенства xk = xk (k > r) и перепишем систему
в векторном виде:
   
  c11 c1 n−r
x1  .   .. 
 ..   ..   . 
 .   
 cr1  cr n−r 
 
 xr   

 =  1  xr+1 + · · · +  0  xn (40)
 
xr+1   

 . 
 .  0  .. 
 ..   
0
 
 0 
xn ..
. 1
| {z } | {z }
f1 fn−r

Утверждается, что векторы f1 , . . . , fn−r с коэффициентами xr+1 , . . . , xn


образуют базис пространства решений U (ФСР).
Линейная независимость. Если линейная комбинация f1 , . . . , fn−r с
коэффициентами xr+1 , . . . , xn равна нулю, то ввиду равенства 40 xr+1 =
· · · = xn = 0.
Максимальность следует из равенства 40.
2) dim U = n − r, где r = rk A.

74
Пример 7.7. Найдем ФСР для уравнения x1 + x2 + x3 = 0. Перепишем
его в разрешенном виде:

 x1 = −x2 − x3
     
 x1 −1 −1
x2 = x2 =⇒ x2 =
   1 x2 + 0  x3
 
x3 0 1

x = x
3 3 | {z } | {z }
f1 f2

7.14 Задание линейных многообразий


Теорема 7.21. Пусть K — поле, U — подпространство из K n , L =
x0 + U — линейное многообразие. Если dim U = d, то существует си-
стема Ax = b, состоящая из r = n−d линейных уравнений, множество
решений которой совпадает с L.
Доказательство. Пусть C — матрица размера n × d, столбцы которой
образуют базис U . Матрицу (C | x − x0 ), полученную из C добавлением
столбца x − x0 , где x — столбец переменных, приведем элементарными
преобразованиями строк к треугольному виду:
 
0 T ∗
(C | x − x ) ∼ .
0 Ax − b
Здесь T — невырожденная треугольная квадратная подматрица порядка
d, а Ax − b — столбец аффинных функций вида
n
X
aij xj − bi i = d + 1, . . . , n.
j=1

Утверждается, что система Ax = b задает L. Действительно,


x ∈ L = x0 + U ⇔ x − x0 ∈ U = hсистема столбцов матрицы Ci ⇔
⇔ rk (C | x − x0 ) = rk C = d ⇔ Ax − b = 0 ⇔ Ax = b.

Пример 7.8. Пусть


   
1 2
U =h i ⊂ R2 , 0
x = , L = x0 + U.
−1 1
Найдем систему линейных уравнений, которая задает L.
   
1 | x1 − 2 1 | x1 − 2

−1 | x2 − 1 0 | x1 + x2 − 3
Следовательно, x1 + x2 = 3 — искомая система.

75
7.15 Базисы суммы и пересечения линейных много-
образий
Определение 7.28 (Базис линейного многообразия). Пусть L = x0 + U
— линейное многообразие, не являющееся подпространством векторного
пространства (x0 ∈/ U ). Тогда система «точек» x0 , x1 , x2 , . . . , xd называ-
ется базисом L, если векторы u1 = x1 − x0 , u2 = x2 − x0 , . . . , ud = xd − x0
образуют базис подпространства U .
Определение 7.29. Сумма линейных многообразий — это наимень-
шее линейное мнообразие, содержащее каждое слагаемое (сумма — это
не объединение!).
Теорема 7.22. Пусть U , V — подпространства из K n , где K — поле,
x0 ∈
/ U , y0 ∈
/ V , L = x0 + U , M = y 0 + V . Если заданы базисы U и V , то
можно найти базисы пересечений U ∩ V , L ∩ M и сумм U + V , L + M .
Доказательство. Найдем базисы U ∩ V и L ∩ M . По теореме о задании
линейных многообразий и подпространств системами линейных уравне-
ний можно найти такие системы линейных уравнений, что
Ax = 0 ⇔ x ∈ U, Ax = b ⇔ x ∈ L, Cx = 0 ⇔ x ∈ V, Cx = d ⇔ x ∈ M.
Тогда следующие системы будут задавать необходимые линейные мно-
гообразия и подпространства:
( (
Ax = 0 Ax = b
⇔x∈U ∩V ⇔x∈L∩M
Cx = 0 Cx = d
Решая первую систему, найдем ее ФСР (базис U ∩ V ). Решая вторую
систему, найдем общее решение, а значит и базис L ∩ M .
Найдем базис U + V . Известны базис u1 , . . . , uk пространства U и
базис v1 , . . . , vl пространства V . Тогда:
( )
X X
U + V = {u + v | u ∈ U, v ∈ V } = αi ui + βj vj | αi , βj ∈ K
i j

= hu1 , . . . , uk , v1 , . . . , vl i
Иначе U + V — линейная оболочка объединения базисов U и V . По тео-
реме о ранге базис U + V образуют столбцы, проходящие через базисный
минор матрицы X, где
.. .. .. .. .. ..
 
. . . . . .
X = u1 ... uk v1 ... vl 
 
.

.. .. .. .. .. ..
. . . . . .

76
Найдем базис L + M .
1) Случай L ∩ M 6= ∅. В этом случае система линейных уравнений
(
Ax = b
Cx = d

совместна и существует решение z 0 ∈ L ∩ M . По свойствам линейных


многообразий
a ∈ L = x0 + U ⇔ L = a + U,
получаем
L = x0 + U = z 0 + U, M = x0 + V = z 0 + V
Утверждается, что L + M = z 0 + (U + V ) — наименьшее линейное мно-
гообразие, содержащее L и M . Ясно, что

z 0 + (U + V ) ⊃ z 0 + U = L,

z 0 + (U + V ) ⊃ z 0 + V = M.
Теперь предположим, что P — линейное многообразие, параллельное
некоторому подпространству W , и пусть P ⊃ L, M . Тогда P 3 z 0 и
P = z 0 + W . По утверждению P ⊃ L, M , то есть

z 0 +W ⊃ z 0 +U, z 0 +V, W ⊃ U, V, W ⊃ U +V, P = z 0 +W ⊃ z 0 +(U +V ).

2) Случай L ∩ M = ∅. Утверждается, что сумма L + M — это много-


образие x0 + hy 0 − x0 , U, V i.
Действительно,

x0 + hy 0 − x0 , U, V i ⊃ x0 + U = L,

x0 + hy 0 − x0 , U, V i ⊃ x0 + (y 0 − x0 ) + U = y 0 + V = M.
Пусть линейное мнообразие P , параллельное некоторому подпростран-
ству W , содержит L и M . Надо доказать:

P ⊃ x0 + hy 0 − x0 , U, V i.

Так как P ⊃ L, то P 3 x0 . Поэтому P = x0 + W . Тогда

P ⊃ L ⇔ x0 + W ⊃ x0 + U ⇔ W ⊃ U.

С другой стороны, P ⊃ M 3 y 0 . Тогда P = y 0 + W и

P ⊃ M ⇔ y 0 + W ⊃ y 0 + V ⇔ W ⊃ V.

77
Кроме того, P 3 x0 , y 0 , поэтому x0 − y 0 ∈ W . Отсюда
W ⊃ hx0 − y 0 , U, V i ⇒ P = x0 + W ⊃ x0 + hx0 − y 0 , U, V i.
Следовательно,
L + M = x0 + hy 0 − x0 , U, V i.
Базис подпространства
hy 0 − x0 , U, V i = hy 0 − x0 , u1 , . . . , uk , v1 , . . . , vl i
можно найти. Следовательно, можно найти базис L + M .

7.16 Геометрическое описание множества решений над


R
Из аналитической геометрии известен вид скалярного произведения
векторов x, y ∈ Rn :
x = (x1 , . . . , xn )> , y = (y1 , . . . , yn )> , ⇒ (x, y) := x1 y1 + · · · + xn yn = x> y.
Известно также, что x и y ортогональны (x ⊥ y), если (x, y) = 0.
Теорема 7.23. Пусть дана система Ax = 0 из s линейных уравнений
от n переменных над R. Пусть U ⊂ Rn — пространство её решений.
Пусть L ⊂ Rn — линейная оболочка строк матрицы A. Тогда
Rn = L ⊕ U, L ⊥ U.
Доказательство. Докажем, что L ⊥ U . Пусть u ∈ U . Тогда
n
X
aij uj = 0 ∀i. (41)
j=1

Если ai = (ai1 , ai2 , . . . , ain ) — i-я строка A, то 41 означает, что ai ⊥u.


Утверждается, что
X
λi ai ⊥ u, ∀λi ∈ R.
i

Действительно,
! n s
! s n
!
X X X X X X
λi ai , u = λi aij uj = λi aij uj = λi · 0 = 0
i j=1 i=1 i=1 j=1 i

Таким образом, L ⊥ U .
Покажем, что Rn = L ⊕ U .

78
1. L ∩ U = {0}. Действительно,
v ∈ L ∩ U ⇒ v ⊥ v, v ∈ Rn ⇒ v = 0.

2. Rn = L + U . Ясно, что Rn ⊃ L + U . Сравним размерности:

dim(L + U ) = dim L + dim U − dim(L ∩ U ) = dim L + dim U


= rk A + (n − rk A) = n = dim Rn .
Следовательно, Rn = L ⊕ U.

Замечание 7.6. Если система неоднородна, то U передвинуто на вектор


x0 , но геометрически остается ортогональным L.

7.17 Теоремы Фредгольма


Пусть A — матрица размера s × n над полем K и пусть даны три
системы линейных уравнений:
Ax = b — «система», (42)
Ax = 0 — «однородная система», (43)
A> y = 0 — «сопряженная система». (44)
Теорема 7.24 (Первая теорема Фредгольма). Система 42 совместна
тогда и только тогда, когда всякое решение сопряженной системы 44
ортогонально столбцу правых частей b:
(∃x0 ∈ K n : Ax0 = b) ⇔ (∀y 0 ∈ K s : (A> y 0 = 0 ⇒ b> y 0 = 0)).
Доказательство. ⇒ Пусть Ax0 = b, а x0 ∈ K n и пусть A> y 0 = 0. Тогда:
> >
b> y 0 = (Ax0 )> y 0 = (x0 ) A> y 0 = (x0 ) 0 = 0.
⇐ По условию совпадают пространства решений систем
(
>
A> y = 0,
A y=0и
b> y = 0
Их размерности равны, поэтому ранги соответствующих матриц также
равны:  >
A
rk A = rk > = rk(A | b)> , rk A = rk(A | b).
>
b
По теореме Кронекера-Капелли система 42 совместна.

79
Теорема 7.25 (Вторая теорема Фредгольма). Совместная система 42
имеет единственное решение тогда и только тогда, когда соответ-
ствующая однородная система 43 имеет единственное решение.
Доказательство. Очевидно из формулы:
{все решения системы 42} = x0 + {все решения системы 43}

Теорема 7.26 (Третья теорема Фредгольма). Если A — квадратная


матрица, то размерности пространств решений однородной и сопря-
женной систем 43 и 44 совпадают.
Доказательство. Размерность n − rk A пространства решений системы
43 равна размерности n − rk A> пространства решений системы 44.

8 Многочлены от одной переменной


8.1 Кольцо многочленов
Обычно под многочленом понимают функцию вида:
x 7→ a0 + a1 x1 + a2 x2 + · · · an xn
над кольцом K. Это верно, если кольцо бесконечно, и неверно, если коль-
цо конечно.
Действительно, если взять поле K = {0, 1} с правилом сложения 1 +
1 = 0, то тогда функции x 7→ x и x 7→ x2 будут совпадать, но все-таки
такие многочлены принято различать.
Определение 8.1. Многочлен (полином) от переменной x над коль-
цом K — это формальное выражение типа
a0 + a1 x 1 + a2 x 2 + · · · + an x n , ai ∈ K
Используют также краткую запись:
n
X X
ai x i = ai x i , ai ∈ K.
i=0 i>0

В последней записи все коэффициенты ai , кроме конечного их числа,


считаются нулевыми.
Формальность выражения означает однозначность записи:
X X
ai x i = bi xi ⇐⇒ ai = bi ∀i > 0
i≥0 i≥0

80
Формальное слагаемое ai xi называют одночленом степени i. Если n
— наибольший индекс, для которого an 6= 0, то an xn называется стар-
шим членом многочлена, an — старшим коэффициентом, n — сте-
пенью многочлена. Краткие обозначения: ст.ч., с.к., ст. или deg. Если
∀i ai = 0, то степень неопределена (иногда степенью такого многочлена
называют −∞). Отметим, что можно нумеровать коэффициенты много-
члена в противоположном порядке и это удобно, когда наше внимание
обращено к старшему члену многочлена.
Множество всех многочленов от переменной x над кольцом K обозна-
чается K[x]. Многочлены можно складывать и умножать по естествен-
ным правилам: X X X
ai x i + bi x i = (ai + bi )xi
i>0 i>0 i>0
! ! !
X X X X
ai x i bj x j = ai b j xk
i>0 j>0 k>0 i+j=k

Теорема 8.1. Если K — кольцо, то K[x] — кольцо. Если кольцо K


— ассоциативно (коммутативно, с единицей, без делителей нуля), то
K[x] — такое же кольцо.

Доказательство. Пусть K — кольцо. Проверим аксиомы кольца для


K[x]. Будем обозначать через fi коэффициенты при xi для многочлена
f.
Ассоциативность сложения:

(a+b)+c = a+(b+c) ⇔ ((a+b)+c)i = (a+(b+c))i ⇔ (ai +bi )+ci = ai +(bi +ci ).

Коммутативность сложения:

(a + b)i = ai + bi = bi + ai = (b + a)i .

Существование нулевого элемента:


X
∃0 : 0xi = 0.
i>0

Существование противоположного элемента:


X X
a= ai xi ⇒ −a = (−ai )xi .
i>0 i>0

81
Дистрибутивность:
X X
((a + b)c)k = (a + b)i cj = (ai cj + bi cj )
i+j=k i+j=k
X X
= ai c j + bi cj = (ac)k + (bc)k ,
i+j=k i+j=k

X X
(a(b + c))k = ai (b + c)j = (ai bj + ai cj )
i+j=k i+j=k
X X
= ai b j + ai cj = (ab)k + (ac)k .
i+j=k i+j=k

Значит K[x] является кольцом, если K — кольцо. Проверим остальные


аксиомы.
Пусть K — ассоциативное кольцо. Тогда K[x] — также ассоциативное
кольцо.
!
X X X X
((ab)c)k = (ab)i cj = ap b q c j = ap b q c j
i+j=k i+j=k p+q=i p+q+j=k
!
X X X X
(a(bc))k = ai (bc)j = ai br c s = ai b r c s
i+j=k i+j=k r+s=j i+r+s=k

Заменим индексы суммирования во второй сумме p ↔ i, q ↔ r, j ↔ s и


сравним с первой суммой.
Пусть K — коммутативное кольцо. Тогда K[x] — также коммутатив-
ное кольцо.
X X X
(ab)k = ai b j = b j ai = bi aj = (ba)k
i+j=k i+j=k i+j=k

Если K — кольцо с единицей, то K[x] также имеет единицу. Пусть 1


— единица в K.
(
X 1 при i = 0
e= ei xi , ei =
i≥0
0 при i > 0

Покажем, что ae = ea = a. Действительно,


X
(ae)k = ai ej = ak e0 = ak , ∀k
i+j=k
X
(ea)k = e i aj = e 0 ak = ak , ∀k
i+j=k

82
Замечание 8.1. Единицу кольца K[x] обозначим через 1. Кольцо K изо-
морфно вложено в K[x] по правилу

α 7→ α + 0x + 0x2 + · · · , α ∈ K.

Пусть K — кольцо без делителей нуля. Тогда и K[x] — кольцо без


делителей нуля.
Лемма 8.2 (о старшем члене многочлена). Если K — кольцо без дели-
телей нуля, то:

1. ст. ч. (ab) = (ст. ч. a)(ст. ч. b),

2. ст. к. (ab) = (ст. к. a)(ст. к. b),

3. ст. (ab) = (ст. a)+(ст. b),

для всех a, b ∈ K[x] и a 6= 0, b 6= 0.


Доказательство. Используем нумерацию коэффициентов многочлена в
противоположном порядке от старшего к младшим. Пусть

a(x) = a0 xn + a1 xn−1 + · · · + an , a0 6= 0,
| {z }
младшие члены

b(x) = b0 xm + b1 xm−1 + · · · + bm , b0 6= 0.
| {z }
младшие члены

По закону дистрибутивности:
n+m−j

 a0 b j x

a(x)b(x) = a0 b0 xn+m + ai b0 xn−i+m

ai bj xn−i+m−j

Кольцо K не содержит делителей нуля, поэтому a0 b0 6= 0. Кроме того



n + m − j

n+m> n−i+m i>0∨j >0

n−i+m−j

Следовательно, ст. ч. (a(x)b(x)) = a0 b0 xn+m = (a0 xn )(b0 xm ).


Из леммы следует, что если a(x) 6= 0, b(x) 6= 0 ⇒ a(x)b(x) 6= 0.
Замечание 8.2. K[x] — не поле, даже если K поле.

83
Доказательство. Найдем обратимые элементы из K[x]. Пусть a(x)b(x) =
1. Тогда a(x) 6= 0, b(x) 6= 0 и по лемме о старшем члене:

0 = ст. 1 = ст. (a(x)b(x)) = ст. a(x) + ст. b(x),


| {z } | {z }
>0 >0

ст. (a(x)) = ст. b(x) = 0 ⇒ a(x), b(x) ∈ K \ {0}.


Поэтому если степень многочлена больше 0, то он необратим в K[x].
Замечание 8.3. Если K — поле, то K[x] — векторное пространство над
K с базисом 1, x, x2 , x3 , . . . , размерность его счётна. Одновременно с тем,
что K[x] — кольцо, выполнена следующая аксиома:

λ(ab) = (λa)b = a(λb) ∀a, b ∈ K[x] ∀λ ∈ K. (45)

Напомним, что кольцо и одновременно векторное пространство над K с


аксиомой 45 называется алгеброй над полем K. Таким образом, K[x]
— алгебра над полем K.
Замечание 8.4. Законы сложения
X и умножения многочленов можно рас-
пространить и на ряды вида: ai xi , где ai ∈ K и все коэффициенты
i≥0
могут быть отличны от нуля. Если K — поле, то получается K[[x]] —
алгебра степенных рядов.

8.2 Деление с остатком


Определение 8.2. Пусть K — поле, f, g ∈ K[x], говорят, что g делит
f , если существует h ∈ K[x] такое, что f = gh. Обозначается gkf .

Теорема 8.3 (о делении с остатком). Пусть K — поле, f (x), g(x) ∈ K[x]


и g(x) 6= 0. Тогда существуют единственные многочлены h, r ∈ K[x],
такие, что (
f = gh + r
r = 0 или deg r < deg g
В этом случае говорят, что f — делимое, g — делитель, r — остаток
от деления, h — неполное частное.

Доказательство. Покажем существование. Проведем индукцию по n =


deg f . Если deg f < deg g, то положим h = 0, r = f . Если deg f ≥ deg g,
то используем исключение старшего члена. Пусть f (x) = a0 xn + · · · ,

84
 
a0 n−m
g(x) = b0 xm + · · · (b0 6= 0) и n ≥ m. Пусть f1 = f − g b0
x . Тогда
deg f1 < deg f . По предположению индукции:
(
f1 = gh1 + r1
r1 = 0 или deg r1 < deg g
     
a0 n−m a0 n−m a0 n−m
f = f1 + g x = gh1 + r + g x = g h1 + x +r
b0 b0 b0
| {z }
=:h

Покажем единственность. Пусть:


(
f = gh1 + r1 = gh2 + r2
ri = 0 или deg ri < deg g, где i ∈ {1, 2}

g(h1 − h2 ) = r2 − r1
Рассмотрим случай, если h1 6= h2 , то по лемме о старшем члене имеем:
deg(r2 − r1 ) = deg g + deg(h1 − h2 ) ≥ deg g. Противоречие. Значит h1 = h2
| {z }
≥0
и r2 = r1 .

8.3 Корни, значения и формулы Виета


Определение 8.3. Пусть f (x) = a0 + a1 x + · · · + an xn — некоторый
многочлен над K и c ∈ K. Тогда f (c) = a0 + a1 c + · · · + an cn называется
значением многочлена f (x) в точке c. Если f (c) = 0, то c называется
корнем многочлена f (x).
Теорема 8.4 (Безу). Пусть f (x) ∈ K[x], где K — поле, c ∈ K. Тогда
остаток от деления f (x) на (x − c) равен f (c). В частности,

f (c) = 0 ⇐⇒ (x − c)|f (x)

Доказательство. По теореме о делении с остатком (8.3):

f (x) = (x − c)h(x) + r r∈K

Очевидно:
f (c) = (c − c)h(c) + r = r
В частности:
f (c) = 0 ⇒ r = 0 ⇐⇒ (x − c)|f (x)

85
Теорема 8.5 (о числе корней). Многочлен степени n над полем имеет
в поле не более n корней.

Доказательство. Пусть f (x) ∈ K[x], K — поле, n — степень f (x). Если


c1 — корень f (x), то по теореме Безу (8.4)

f (x) = (x − c1 )f1 (x) deg f1 (x) = n − 1

Если c2 — корень f1 (x), то:

f1 (x) = (x − c2 )f2 (x) deg f2 (x) = n − 2

f (x) = (x − c1 )(x − c2 )f2 (x)


Продолжая, получим:

f (x) = (x − c1 )(x − c2 ) · · · (x − ck )fk (x)

где fk (x) не имеет корней в поле K и k ≤ n = deg f (x).

Теорема 8.6 (формулы Виета). Пусть f (x) = a0 xn + a1 xn−1 + · · · + an


(a0 6= 0) разлагается в алгебре K[x] на линейные множители (степени
1):
f (x) = a0 (x − c1 )(x − c1 ) · · · (x − cn )
Тогда  a1
 c1 + c2 + · · · + cn = −
a0



a


 c1 c2 + c1 c3 + c2 c3 + · · · cn−1 cn = 2


a0
 ..


 .
a


 c1 c2 · · · cn = (−1)n n


a0
В общем виде k-я формула Виета может быть записана так:
X ak
ci1 ci2 · · · cik = (−1)k .
1≤i <i <···<i ≤n
a0
1 2 k

Доказательство. Сравним коэффициенты при xn−k в равенстве:


a1 n−1 an
(x − c1 )(x − c2 ) · · · (x − cn ) = xn − x + · · · + (−1)n .
a0 a0

86
Пример 8.1. Пусть K = C, f (x) = x5 − 1. Тогда корни c0 , c1 , c2 , c3 , c4
расположены в вершинах правильного пятиугольника с одной из вершин
в единице:
2π 2π 4π 4π
c0 = 1 c1,4 = cos ± i sin c2,3 = cos ± i sin
5 5 5 5
По формулам Виета:

c0 + c1 + c2 + c3 + c4 = 0,

1 + (c1 + c4 ) + (c2 + c3 ) = 0,
2π 2π
1 + 2 cos + 2 cos .
5 5
Если обозначить
2π 4π
α = cos cos = 2α2 − 1,
5 5
1 + 2α + 4α2 − 2 = 0,

−1 ± 5
α= , α > 0,
4

2π 5−1
cos = .
5 4
Отсюда r p √
2π 2π 10 + 2 5
sin = 1 − cos2 = ,
5 5 4
√ √
4π 2 2π 6−2 5 −1 − 5
cos = 2 cos −1=2 −1= ,
5 5 16 4
√ p √
4π 2π 2π (−1 − 5) 10 + 2 5
sin = 2 sin cos = .
5 5 5 8

8.4 Кратные корни и производная


Определение 8.4. Пусть K — поле, f (x) ∈ K[x] и c ∈ K. Тогда c
называется k-кратным корнем f (x), если

(x − c)k |f (x) (x − c)k+1 - f (x)

Равносильно
f (x) = (x − c)k h(x), h(c) 6= 0.
При k > 1 корень называется кратным, при k = 1 — простым.

87
X
Определение 8.5. Пусть K — поле, а f (x) = ai xi ∈ K[x]. Тогда
i≥0
многочлен X
f 0 (x) := iai xi−1 (46)
i≥1

называется производным для f (x). Отображение D : f (x) 7→ f 0 (x) на-


зывается дифференцированием алгебры K[x].
Замечание 8.5. Дифференцирование обладает следующими свойствами:
1. (f + g)0 = f 0 + g 0 ,
2. (λf )0 = λ(f 0 ),
3. (f g)0 = f 0 g + f g 0 ,
4. (f (g(x))0 = f 0 (g(x)) · g 0 (x).
Доказательство. Остаётся читателю в качестве упражнения.Указание:
1) и 2) проверяются непосредственно, 3) и 4) ввиду линейности диффе-
ренцирования достаточно проверить для базиса, т.е. для f = xk и g = xl
(k, l ∈ Z+ ).
Теорема 8.7. Пусть K — поле, f (x) ∈ K[x], а c — k-кратный корень
f (x). Если 1| + 1 +{z· · · + 1} 6= 0 в поле K, то c — (k − 1)-кратный корень
k раз
для f 0 (x).
Доказательство. Пусть f (x) = (x − c)k h(x) и h(c) 6= 0. Тогда:

f 0 (x) = (k(x − c)k−1 h(x) + (x − c)k h0 (x)) = (x − c)k−1 (kh(x) + (x − c)h0 (x)).

При x = c имеем kh(c) 6= 0 в поле K.

8.5 Формула Тейлора


Определение
X 8.6 (Производные высшего порядка). Если K — поле, то
k
f (x) = ak x — многочлен. Пусть
k≥0

f (0) (x) = f (x)


f (1) (x) = f 0 (x)
..
.
f (i+1) (x) = (f (i) (x))0

88
Тогда:
X X k!
f (i) (x) = k(k − 1) · · · (k − i + 1)ak xk−i = ak xk−i
k≥i k≥i
(k − i)!

Теорема 8.8. Пусть f (x) — многочлен степени n с коэффициентами


из поля K, c — элемент из K. Тогда f (x) разлагается по степеням
(x − c)i по следующей формуле Тейлора:
n
f 0 (c) f (n) (c) X f (k) (c)
f (x) = f (c) + (x − c) + · · · + (x − c)n = (x − c)k . (47)
1! n! k=0
k!

Доказательство. Используем бином Ньютона:


n    
n
X n n−k k n n!
(a + b) = a b = Cnk =
k=0
k k k!(n − k)!

Имеем:
n k  
!
X X X X k k−i
f (x) = ak x k = ak ((x − c) + c)k = c (x − c)i
k=0 k≥0 k≥0 i≥0
i
!
XX k! X 1 X k!
= ak ck−i (x − c)i = ak ck−i (x − c)i
i≥0 k≥i
i!(k − i)! i≥0
i! k≥i
(k − i)!
X f (n) (c)
= (x − c)i
i≥0
i!

Пример 8.2.
k = Z2 = {0, 1} 1+1=0
f (x) = x2 + 1 c=1
f 0 (1) f 00 (1) 2
f (x) = f (1)+ (x−1)+ (x−1)2 = 0+0(x+1)+ (x−1)2 = (x−1)2
1! 2! 2
2 2 2
(x − 1) = x − 2x + 1 = x + 1

89
8.6 Интерполяционные формулы Лагранжа и Нью-
тона
Интерполяционная задача состоит в выборе функции из данного клас-
са K, которая в заданных точках принимать заданные значения.
x x0 x1 . . . xn
Точнее, пусть дана "интерполяционная таблица"
y y0 y1 . . . yn
где xi 6= xj при i 6= j, а yi — произвольные. Необходимо найти такую
функцию f (x) ∈ K, что f (xk ) = yk ∀k.

Теорема 8.9. Пусть K — поле, x0 , x1 , . . . , xn — (n+1) различных точек


из K, y0 , y1 , . . . , yn — (n + 1) произвольных элементов из K. Тогда суще-
ствует единственный многочлен f (x) степени ≤ n с коэффициентами
из K, такой, что: f (xk ) = yk ∀k.

Доказательство. Покажем существование. Положим:


n n
!
X Y x − xi
f (x) := yk (48)
k=0 i≥0,i6=k
xk − xi

Тогда степень f (x) ≤ n и f (xk ) = yk . Формула 48 называется интерпо-


ляционной формулой Лагранжа.
Покажем единственность. Пусть существует еще и g(x) такой, что
deg g(x) ≤ n и g(xk ) = yk ∀k. Предположим, что g(x) 6= f (x) (f (x) возь-
мем из 48).
h(x) = f (x) − g(x) 6= 0
Степень h(x) ≤ n и h(xk ) = 0 ∀k, значит xk — корень. Таким образом,
h(x) имеет n + 1 корней x0 , x1 , . . . , xn . Но многочлен степени ≤ n может
иметь не больше n корней. Противоречие.
x 0 1 2
Пример 8.3. Очевидно, что f (x) = x + 1, но по формуле
y 1 2 3
Лагранжа:
     
x−1 x−2 x−0 x−2
f (x) = 1 +2
0−1 0−2 1−0 1−2
  
x−0 x−1
+3 =x+1
2−0 2−1

Недостатки:

1. трудно подсчитывать коэффициенты при xk ,

90
2. плохо ведет при расширении таблицы.

Ньютон придумал другой способ интерполяции. Рассмотрим последова-


тельность интерполяционных таблиц:
x x0 x x0 x1 x x0 x1 . . . xn
... Пусть
y y0 y y0 y1 y y0 y1 . . . yn
fk (x) — решение k-той таблицы.
(
deg fk (x) ≤ k
fk (xi ) = yi ∀i ≤ k

Сравнивая fk (x) и fk+1 (x), ясно, что:

fk (xi ) = fk+1 (xi ) i≤k

fk+1 (x) − fk (x) = Ak+1 (x − x0 )(x − x1 ) · · · (x − xk )


Так как deg fk (x) ≤ deg fk+1 (x), то Ak+1 ∈ K. Подставим x = xk+1 . Тогда:

yk+1 − fk (xk+1 ) = Ak+1 (xk+1 − x0 ) · · · (xk+1 − xk )

yk+1 − fk (xk+1 )
Ak+1 = (49)
(xk+1 − x0 ) · · · (xk+1 − xk )
fk+1 (x) = fk (x) + Ak+1 (x − x0 ) · · · (x − xk )
В итоге:

f (x) = fn (x) = A0 +A1 (x−x0 )+A2 (x−x0 )(x−x1 )+· · ·+An (x−x0 ) · · · (x−xn−1 )

где A0 = y0 , а Ak+1 считается по формуле 49.


x 0 1 2
Пример 8.4.
y 1 2 3

f (x) = A0 + A1 (x − 0) + A2 (x − 0)(x − 1)

1 = f (0) = A0 ⇒ A0 = 1
2 = f (1) = A0 + A1 ⇒ A1 = 1
3 = f (2) = A0 + 2A1 + 2A2 ⇒ A2 = 0
f (x) = x + 1

91
8.7 Алгебраическая замкнутость поля C
Определение 8.7. Поле K называется алгебраически замкнутым,
если всякое алгебраическое уравнение от одной переменной
a0 + a1 x + a2 x2 + · · · + an xn = 0 an 6= 0 ai ∈ K n≥1
имеет решение в поле K.
Теорема 8.10 (основная теорема алгебра, Даламбера-Гаусса). Поле ком-
плексных чисел алгебраически замкнуто.
Любое доказательство используют полноту R или C относительно
предельных переходов. Приведем доказательство, основанное на свой-
стве пределов последовательностей комплексных чисел и извлечения кор-
ня некоторой степени в C.
|zw| = |z||w| z, w ∈ C
|z + w| ≤ |z| + |w| z, w ∈ C
||z| − |w|| ≤ |z − w| z, w ∈ C
Определение 8.8. Последовательность zk ∈ C сходится к числу z, если
|z − zk | → 0 при k → ∞.
Лемма 8.11. Если zk → z, если zk — ограниченная последовательность.
Доказательство. По определению:
∀ > 0 ∃N () ∀k > N : |z − zk | < 
Пусть M = max |z − zk | (k ≤ N ). Тогда R = |z| + M + . Тогда оценим zk :
|zk | = |zk − z + z| ≤ |zk − z| + |z| ≤ M +  + |z| = R

Лемма 8.12. Пусть zk = xk + iyk и z = x + iy, где xn , yn , x, y ∈ R. Тогда


zk → z ⇔ xk → x, yk → y (k → ∞).
Доказательство. ⇒)
p
|zk − z| = (xk − x)2 + (yk − y)2 ≥ |xk − x|, |yk − y| ≥ 0
Тогда:
|zk − z| → 0 ⇒ |xk − x| → 0, |yk − y| → 0
⇐)
(|z − zk |)2 = (x − xk )2 + (y − yk )2 → 0

92
Лемма 8.13. Если zk → z (k → ∞), wk → w (k → ∞), тогда zk + wk →
z + w и zk wk → zw при k → ∞.
Доказательство.

|(z + w) − (zk + wk )| = |(z − zk ) + (w − wk )| ≤ |z − zk | + |w − wk |

|zw − zk wk | = |zw − zwk + zwk − zk wk | = |z(w − wk ) + (z − zk )wk |


≤ |z||w − wk | + |z − zk ||wk | → 0

Следствие. Комплексный многочлен — непрерывная функция. Если zk →


z, f — комплексный многочлен, то f (zk ) → f (z) при k → ∞.
Лемма 8.14 (Коши-Аргана). Если f — комплексный многочлен степе-
ни n ≥ 1 и zk — последовательность комплексных чисел такая, что
|zk | → ∞, тогда |f (zk )| → ∞.
Доказательство.

f (z) = a0 z n + a1 z n−1 + · · · + an ai ∈ C a0 6= 0 n ≥ 1
n
 a1 an 
f (z) = z a0 + + ··· n z 6= 0
z z
a1 an  a
1 an 
|f (z)| = |z n | a0 + + · · · + n = |z n | a0 − − − · · · − n

z z z z
a
1 a n
|a 1 | |a n |
≥ |z n | |a0 | − + · · · + n ≥ |z|n |a0 | − − · · · − n → ∞

z z |z| |z|

Лемма 8.15 (Даламбера). Пусть f (z) — комплексный многочлен сте-


пени ≥ 1, f (z0 ) 6= 0 при некотором z0 ∈ C. Тогда существует сколь
угодно близкое к z0 точка z такая, что |f (z)| < |f (z0 )|.
Доказательство. Разложим f (z) по формуле Тейлора по степеням (z −
z0 ) и разделим на f (z0 ). Тогда:
f (z)
= 1 + αm (z − z0 )m + · · · + α0 (z − z0 )n
f (z0 )
αm 6= 0 — первый ненулевой многочлен при (z − z0 ) степени m и m > 0
Будем искать z в форме z = z0 +tz1 , где t ∈ R, 0 < t < 1 Нам необходимо,

93
q
чтобы am z1m = −1 ⇒ z1 = m − α1m . Тогда ff(z(z)0 ) = 1 − tm + tm+1 φ(t), где
φ(t) — комплексный многочлен степени n − (m + 1) или φ(t) = 0. Пусть
A — максимум из модулей коэффициентов φ(t). Если A = 0, то φ(t) = 0.

f (z) m
f (z0 ) = 1 − t < 1 0<t<1

Если A 6= 0, то φ(t) 6= 0:

|φ(t)| ≤ (n − m)A =: B


f (z) m m+1
f (z0 ) = |1 − t + t
φ(t)| ≤ |1 − tm | + |tm+1 φ(t)| ≤ 1 − tm + tm+1 B
1
= 1 − tm (1 − tB) ≤ 1 ⇒ 1 − tB > 0 ⇒ 0 < t <
B

f (z)
f (z0 ) ≤ 1 ⇒ |f (z)| ≤ |f (z0 )|

Лемма 8.16.
zk → z ⇒ |zk | → |z|

Доказательство.
||z| − |zk || ≤ |z − zk | → 0

Доказательство теоремы. Пусть M = inf |f (z)|. По определению ниж-


z∈C
ней грани существует такая последовательность zk ∈ C, что |zk | → M
(k → ∞). Если последовательность zk неограничена, то содержится под-
последовательность zk : |zk | → ∞. По лемме 8.14 имеем |f (zk )| → ∞,
значит M = +∞, что противоречит определению M . Значит zk — огра-
ниченная последовательность.
Тогда если zk = xk + iyk (xk , yk ∈ R), то xk , yk — ограниченные
последовательности: |xk | ≤ |zk |, |yk | ≤ |zk |. Ограниченная последова-
тельность вещественных чисел содержит сходящуюся подпоследователь-
ность по теореме Больцано-Вейерштрасса. Выберем сходящуюся под-
последовательность из xk , а затем из yk с теми же номерами выбе-
рем сходящуюся подпоследовательность. Тогда zk содержит сходящую-
ся подпоследовательность zk → z (по лемме 8.12). Можно считать, что

94
zk → z0 при k → ∞. Ввиду непрерывности последовательности име-
ем: |f (zk )| → |f (z0 )|. Но |f (zk )| → M ⇒ f (z0 ) = M при k → ∞. Если
M > 0, то это противоречит лемме Даламбера (8.15). Значит, M = 0:
|f (z0 )| = 0 ⇒ f (z0 ) = 0 ⇒ z0 — корень f (z).
Следствие. Всякий комплексный многочлен имеет единственное пред-
ставление в форме:
f (z) = a0 (z − z1 )(z − z2 ) · · · (z − zn )
где a0 6= 0 ∀zi ∈ C ∀i.
Доказательство. Докажем существование по индукции по n. Пусть
f (z) = a0 z n + a1 z n−1 + · · · an a0 6= 0 n ≥ 1
По теореме об алгебраической замкнутости C f (z) имеет некоторый ко-
рень z1 . По теореме Безу:
f (z) = (z − z1 )g(z) g(z) = a0 z n−1 + · · ·
По предположению индукции:
g(z) = a0 (z − z2 ) · · · (z − zn )
Тогда:
f (z) = a0 (z − z1 )(z − z2 ) · · · (z − zn )
Докажем единственность. Ясно, что z1 , . . . , zn — множество всех корней
f (z). Среди них могут быть кратные корни. Однако кратность определя-
ется многочленом f (z) однозначно. z0 — корень кратности k ⇔ f (i) (z0 ) =
0 при 0 ≤ i ≤ k.
Следствие. Пусть f (z) — комплексный многочлен степени n, a0 — его
старший коэффициент, A — максимум модулей остальных коэффици-
ентов. Тогда все корни f (z) лежат в круге радиуса: 1 + |aA0 | :
A
f (z0 ) = 0 ⇒ |z0 | ≤ 1 +
|a0 |
Доказательство. Пусть f (z) = a0 z n + · · · + an . Оценим хвост много-
члена:
|a1 z n−1 + · · · + an | ≤ |a1 ||z|n−1 + · · · + |an | ≤ A(z n−1 + · · · + 1)
|z|n − 1 A|z|n A A
=A < < |a0 z n | ⇔ < |a0 | ⇔ |z| > 1 +
|z| − 1 |z| − 1 |z| − 1 |a0 |
|z| =
6 0 |z| > 1 A>0
A
Это означает, что f (z) не имеет корней вне круга |z| ≤ 1 + |a0 |
. Если же
A = 0, то f (z) = a0 z n , корень — 0, а |0| < 1.

95
8.8 Корни вещественных многочленов
Теорема 8.17. Всякий вещественный многочлен степени n ≥ 1 разла-
гается в произведение линейных и квадратичных вещественных мно-
жителей (степени 1 или 2 над R). Разложение единственно, если счи-
тать, что линейные и квадратичные множители имеют старший ко-
эффициент равный единице и есть ненулевой вещественный множитель-
константа.

Лемма 8.18. Если f (x) — вещественный многочлен степени n ≥ 1 и


α — его комплексный корень, причем α 6= α ⇔ α ∈
/ R, то α — также
корень f (x).

Доказательство. Пусть:

f (x) = a0 xn + a1 xn−1 + · · · + a0 ai ∈ R a0 6= 0 n ≥ 1

a0 αn + a1 αn−1 + · · · + an = 0
Тогда:
a0 αn + a1 αn−1 + · · · + an = 0 = 0
a0 · αn + a1 · αn−1 + · · · + an = 0
a0 αn + a1 αn−1 + · · · + an = 0
f (α) = 0 ⇒ α — корень. Очевидно, что кратность α в f (x) совпадает с
кратностью α в f (x).
Доказательство теоремы. По теореме об алгебраической замкнутости
поля C:
f (x) = a0 (x − z1 )(x − z2 ) · · · (x − zn ) zi ∈ C
Разобьем корни zi на вещественные и мнимые. Предположим, что z1 =
c1 , . . . , zp = cp — все вещественные корни, а a1 + b1 i, a1 − b1 i, . . . , aq +
bq i, aq − bq i — все действительные корни. Причем ci , aj , bj ∈ R, bj 6= 0.
Тогда αj = aj + bj i.
p q
Y Y
ki
f (x) = a0 (x − ci ) · [(x − αj )(x − αj )]`j
i=1 j=1

(x − αj )(x − αj ) = x2 − (αj + αj )x + αj αj ∈ R
Единственность следует из однозначности множества корней и их крат-
ности.

96
Пример 8.5.

x4 + 1 = (x − α)(x − α)(x − β)(x − β)


= (x2 − (α + α)x + αα)(x2 − (β + β)x + ββ)
√ √
= (x2 − 2x + 1)(x2 + 2x + 1)

Основные задачи теории многочленов


1. Найти точные формулы для поиска корней многочленов через его
коэффициенты (решено).
2. Найти алгоритмы приближенного поиска корней.
Пример 8.6 (способ Ньютона).

y − y0 = f 0 (x0 )(x − x0 ) y0 = f (x0 ) y1 = 0

0 − y0 = f 0 (x0 )(x1 − x0 )
f (x0 ) f (x1 )
x1 = x0 − 0
x2 = x1 − 0
f (x0 ) f (x1 )
xk → корень многочлена. Этот способ может быть обобщен и на
C. Пусть z0 ∈ C.
f (z0 )
f (z0 ) 6= 0 ⇒ z1 = z0 −
f 0 (z0 )

3. Найти качественные оценки сколько корней имеет многочлен на


данном отрезке (круге).

8.9 Евклидовы кольца и НОД


Определение 8.9. Целостное кольцо — это ассоциативное, коммута-
тивное кольцо с единицей и без делителей нуля.
В целостных кольцах важную роль играет теория делимости.
Пример 8.7. Z, K[x]. В общем случае, R ⊂ K, где K — поле, а R —
подкольцо с единицей.
Определение 8.10. Пусть a, b — элементы кольца R. Говорят, что b
делит a, если a = bc, где c ∈ R. Обозначение: b|a. Очевидно, ∀b b|0.
Определение 8.11. Евклидово кольцо — это целостное кольцо с
определенной на нём нормой, то есть отображением N : R \ {0} → Z+ =
N ∪ {0} со свойствами:

97
1. ∀a, b 6= 0 b|a ⇒ N (b) ≤ N (a)

2. ∀a, b 6= 0 ∃q, r ∈ R : a = bq + r r = 0 ∨ N (r) < N (b)

Пример 8.8. 1. R = Z ⇒ N (a) = |a|

2. R = K[x] ⇒ N (f (x)) = deg f (x)

3. R = Z[i] = {a + bi|a, b ∈ Z} ⊂ C — кольцо целых гауссовых чисел.


Ясно, что R — целостное кольцо. По определению α = a + bi ⇒
a + eb = |α|2 . Проверим первое свойство нормы.
N (α) = e

α = βγ α 6= 0; β 6= 0 α, β, γ ∈ Z[i]

N (α) = |α|2 = |βγ|2 = |β|2 |γ|2 = N (β)|γ|2


γ 6= 0 ⇒ |γ|2 ≥ 1 ⇒ N (β) ≤ N (α)
α, β ∈ Z[i] β 6= 0
Проверим второе свойство нормы. Положим:

α α 1
∈ C ⇒ ∃γ ∈ Z[i] : − γ ≤ √
β β 2
Если мы нарисуем сетку из целых гауссовых чисел, то расстоя-
ние от любой точки до ближайшего целого не больше диагонали
квадрата. Положим:

δ = α − βγ ∈ Z[i]
2
|β|2

2 α
2 2

N (δ) = |δ| = |α − βγ| = |β| − γ ≤ < |β|2 = N (β)
β 2
Определение 8.12. Пусть R — целостное кольцо, a, b ∈ R и b 6= 0. Тогда
элемент d ∈ R называется НОДом a и b, если:

1. d|a и d|b в кольце R,

2. если c|a и c|b, то c|d

Обозначение: d = НОД(a, b)

Теорема 8.19. В евклидовом кольце НОД ненулевых элементов всегда


существует и может быть найден по алгоритму Евклида. Два НОДа
отличаются на обратимый множитель z из кольца.

98
Лемма 8.20. Если в целостном кольце имеется равенство a = bq + r,
где b 6= 0, то множество общих делителей пар (a; b) и (b; r) одинаково.

Доказательство леммы. Пусть d|b, d|r. Тогда b = db1 , r = dr1 , где


b1 , r1 ∈ R. Отсюда:

a = bq + r = db1 q + dr1 = d(b1 q + r1 ) b1 q + r1 ∈ R

Пусть d|a и d|b. Значит d|r = a − bq.

Лемма 8.21. Пусть a, b ∈ R \ {0}, R — евклидово кольцо. Тогда:

(a|b, b|a) ⇒ N (a) = N (b)

Доказательство леммы.

a|b ⇒ N (a) ≤ N (b) b|a ⇒ N (b) ≤ N (a) ⇒ N (a) = N (b)

Доказательство теоремы. Дана пара (a; b), b 6= 0. В евклидовом кольце


R можно записать алгоритм Евклида.

a = bq1 + r1 r1 6= 0 N (r1 ) < N (b)


b = r1 q2 + r2 r2 6= 0 N (r2 ) < N (r1 )
r1 = r2 q3 + r3 r3 6= 0 N (r3 ) < N (r2 )
..
.
rk−2 = rk−1 qk + rk rk 6= 0 N (rk ) < N (rk−1 )
rk−1 = rk qk+1

Процесс обрывается потому, что последовательность норм строго убыва-


ет, а эти нормы — неотрицательные целые числа.
Ввиду леммы имеем НОД(a, b) = НОД(b, r) = НОД(r1 , r2 ) = · · · =
НОД(rk−1 , rk ) = rk . Действительно,

1. rk |rk = rk · 1; rk |rk−1 = rk qk+1

2. c|rk−1 ; c|rk ⇒ c|rk

Следовательно, НОД(rk−1 , rk ) = rk .
Покажем единственность НОДа с точностью до обратимого множи-
теля. Предположим, что c и d — НОД(a, b) и b 6= 0. Тогда c|d и d|c. Значит

99
по лемме N (c) = N (d). Таким образом, c и d отличаются на обратимый
элемент.
c = dq + r ⇒ r = 0 ∨ N (r) < N (d) = N (c)
d = c c − dq = r c − cq = r
c(1 − q) = r
Если r 6= 0, то N (r) ≥ N (c) = N (d). Противоречие. Значит, q = 1.
Значит,  — обратимый элемент, d = c.

8.10 Критерий разрешимости уравнения ax + by = c


Теорема 8.22. Пусть R — евклидово кольцо, a, b, c ∈ R и b 6= 0. Тогда
уравнение ax + by = c разрешимо в R ⇔ НОД(a, b)|c.

Доказательство. ⇒) Обозначим d =НОД(a, b). Тогда:

a = da1 b = db1 ⇒ c = ax + by x, y ∈ R

c = da1 x + db1 y = d(a1 x + b1 y) ⇒ a1 x + b1 y ∈ R ⇒ d|c


⇐) Предположим, что d =НОД(a, b) и d|c. Тогда множество I = {ax +
by|x, y ∈ R} ⊂ R. Утверждается, что I замкнуто относительно сложения
элементов и умножения на любой элемент кольца.

ax + by ∈ I  
az + bt ∈ I ⇒ (ax + by) − (az + bt) = a(x − z) + b(y − t) ∈ I

x, y, z, t ∈ R 

ax + by ∈ I ⇒ axc + byc ∈ I
Ввиду алгоритма Евклида:

r1 = a − bq1 ∈ I
r2 = b − r1 q2 ∈ I
..
.
rk = rk−2 − rk−1 qk ∈ I

rk = НОД(a, b) ⇒ rk |c = rk u ⇒ c ∈ I ⇒ ∃x, y ∈ I : c = ax + by

100
8.11 Свойства взаимно простых элементов
Определение 8.13. Пусть R — целостное кольцо, a, b ∈ R, b 6= 0. Тогда
a и b называются взаимно простыми, если всякий их общий делитель
a и b обратим в R. Обозначение: a ⊥ b.
Теорема 8.23. В евклидовом кольце R верны утверждения:
1. a ⊥ b ⇔ ∃x, y ∈ R : ax + by = 1
2. a ⊥ , b ⊥ c ⇒ ab ⊥ c
3. a|bc, a ⊥ b ⇒ a|c
4. a|c, b|c, a ⊥ b ⇒ ab|c
Доказательство. 1. ⇒) a ⊥ b, значит d =НОД(a, b) обратим в R, d|1.
По критерию уравнение ax + by = 1 разрешимо.
⇐) Если ax + by = 1, где x, y ∈ R и d|a, d|b, то d|1.
a = da1 b = db1 a1 , b1 ∈ R 1 = ax+by = da1 x+db1 y = d(a1 x+b1 y)
Значит, d обратим в R и a ⊥ b.
2. Ввиду предыдущего пункта x, y, z, t ∈ R:
(
ax + cy = 1
bz + ct = 1
Перемножая, получаем:
(ab)(xz) + c(axt + ybz + cty) = 1
Значит, ab ⊥ c по предыдущему пункту.
3.
bc = ad ax + by = 1 x, y ∈ R
Умножим на c, получим:
axc + bcy = c ⇒ axc + ady = c ⇒ a(xc + dy) = c ⇒ a|c

4.
c = aa1 = bb1 ax + by = 1
axc + byc = c ⇒ axbb1 + byaa1 = c
ab(xb1 + ya1 ) = c ⇒ ab|c

101
8.12 Общее решение уравнения ax + by = c
Замечание 8.6. Уравнение разрешимо в евлидовом кольце R, если d =
НОД(a, b)|c. Тогда:
a = da1 b = db1 c = dc1
d(a1 x + b1 y) = dc1
Зная, что в целостном кольце нет делителей нуля, сократим на d. Тогда:
(
a1 x + b1 y = c1 — равносильно исходному
a1 ⊥ b1

Теорема 8.24. Пусть R — евклидово кольцо, a, b, c ∈ R, ab 6= 0, a ⊥ b.


Тогда ax + by = c имеет общее решение
(
x = x0 + bt
y = y0 − at t∈R

где x0 , y0 — частное решение.


Доказательство. Пусть ax0 + by0 = c. Тогда для всякого t ∈ R; x =
x0 + bt; y = y0 − at имеем:
ax + by = a(x0 + bt) + b(y0 − at) = ax0 + abt + by0 − bat = ax0 + by0 = c
Значит, это решение (пара (x; y)) — решение уравнения. Пусть тепень
(x; y) — произвольное решение уравнения. Тогда можно записать следу-
ющие равенства: (
ax + by = c
ax0 + by0 = c
Вычтем второе из первого:
a(x − x0 ) = b(y0 − y)
a|b(y0 − y) a ⊥ b ⇒ a|(y − y0 ) ⇒ y0 − y = at ⇒ y = y0 − at
a(x − x0 ) = bat ⇒ x − x0 = bt ⇒ x = x0 + bt

Пример 8.9. Пусть K — поле, R = K[x], f g 6= 0, f, g, h ∈ R, deg f g >


deg h. Тогда уравнение f u + gv = h имеет единственное решение (u0 ; v0 )
такое, что deg u0 < deg g и deg v0 < deg f .
Доказательство. Остаётся читателю в качестве упражнения.

102
8.13 Единственность разложения на множители в ев-
клидовом кольце
Определение 8.14. Пусть R — евклидово кольцо с нормой N . R∗ —
группа его обратимых элементов. Два элемента a и b из R называются
ассоциированными, если b = a,  ∈ R∗ . Ассоциированность — отно-
шение эквивалентности.

1. a ∼ a a = a · 1 1 ∈ R∗

2. a ∼ b ⇒ b ∼ a b = a a = b−1 , −1 ∈ R∗

3. a ∼ b; b ∼ c ⇒ a ∼ c b = a c = bτ ⇒ c = a(τ ) , τ ∈ R∗

Пример 8.10.

R=Z Z∗ = {1; −1} ⇒ a ∼ b ⇔ b = ±a

R = K[x] R∗ = K \ {0} ⇒ f ∼ g ⇔ g = αf α ∈ R∗

Определение 8.15. Ненулевой необратимый элемент p целостного коль-


ца R называется неразложимым в R (или простым), если всякий его
делитель в R, либо обратим в R, либо ассоциирован с p.

p = ab a, b ∈ R ⇒ (a ∈ R∗ ∨ b ∈ R∗ )

Определение 8.16. Целостное кольцо R называется кольцом с одно-


значным разложением на множители (КОР) или факториальным,
если

1. всякий ненулевой необратимый элемент из R может быть пред-


ставлен в виде произведения конечного числа неразложимых над
R элементов,

/ R ∗ ⇒ a = p1 p2 · · · ps
a 6= 0 a ∈ pi — простое

2. это разложение однозначно с точностью до перестановки множите-


лей и ассоциированности.

a = p1 · · · ps = q1 · · · qt ⇒ (s = t; pi ∼ qi ∀i)

Теорема 8.25. Евклидово кольцо - КОР.

103
Доказательство. Пусть R — евклидово кольцо с нормой N . Докажем
существование разложения на простые. Пусть элемент a 6= 0 и a ∈/ R∗ .
Если a неразложим в R, то a = a — искомое разложение. Пусть a разло-
жим в R, тогда:
a = a1 a2 / R∗
ai ∈ N (ai ) < N (a)
a = a11 a12 a2 / R∗
a1j ∈ N (a1j ) < N (a1 )
Вместе с ростом количества множителей уменьшается норма каждого
нового множителя. Поэтому процесс разложения рано или поздно пре-
рвется. Таким образом, мы получили искомое разложение элемента a.
Покажем единственность разложения на простые множители. Пред-
положим, что: 
 p1 · · · ps = q 1 · · · qt

pi , qj — простые множители

s ≤ t

p1 |(q1 q2 · · · qt )
Лемма 8.26. Если p — неразложимый элемент евклидова кольца R,
p|ab, то либо p|a, либо p|b.
Доказательство леммы. Пусть p - a. Докажем, что p|b. Утверждается,
что p ⊥ a. Если d = НОД(p, a), то d|p и d|a. Так как p — неразложимый
элемент, то d ∈ R∗ или d ∼ p.
d ∼ p ⇒ d = p,  ∈ R∗ ⇒ a = da1 = pa1 ⇒ p|a
Противоречие с предположением. Значит, d 6∼ p, d ∈ R∗ и p ⊥ a. По
свойству взаимно простых имеем: (p|ab; p ⊥ a) ⇒ p|b.
Ввиду леммы p1 |q1 (q2 · · · qt ), где p1 — простой, либо p1 |q1 , либо p1 |q2 · · · qt .
Если q1 = p1 ,  ∈ R∗ так, как q1 — простой.
p1 p2 · · · pr = p1 q2 · · · qt
p2 · · · pr = q2 · · · qt
Далее используем индукцию.
Если же p1 |q2 · · · qt = q2 (q3 · · · qt ), то по лемме p1 |q2 или p1 |q3 · · · qt . Если
p1 |q2 , то q2 = p1 1 и
p1 p2 · · · pr = q1 (p1 1 )q2 · · · qt
p2 · · · pr = q1 1 q3 · · · qt
Далее используем индукцию.

104
8.14 Разложение на множители в Z[x] и Q[x]
Определение 8.17. Многочлен из Z[x] называется примитивным, ес-
ли НОД его коэффициентов равен 1.
Лемма 8.27 (Гаусса). Произведение примитивных многочленов из Z[x]
примитивно.
Доказательство. Пусть f, g, h ∈ Z[x], причем f g = h.
X
f= ai xi ai ∈ Z
i≥0
X
g= bj x j bj ∈ Z
j≥0
X
ck = ai b j
i+j=k

Пусть h непримитивно. Тогда существует такой p ∈ N, p — простое,


p|ck ∀k. Так как f примитивен, то существует такое i:
p|a0 , p|a1 , · · · , p|ai−1 , p - ai
Так как g примитивен, то существует такое j:
p|b0 , p|b1 , · · · , p|bj−1 , p - bj
Тогда ci+j = a0 bi+j + a1 bi+j−1 + · · · ai bj + · · · + ai+j b0 . Значит, p|ci+j и
каждое слагаемое суммы. Также p|ai bj , однако p - ai , p - bj , p — простое.
Противоречие с леммой.
Теорема 8.28. Если многочлен с целочисленными коэффициентами раз-
лагается на множители в кольце Q[x], то он разлагается на множи-
тели и в Z[x]; причем множители ассоциированы с множителями из
Q[x].
Доказательство.
f (x) ∈ Z[x] f (x) = g(x)h(x) g(x), h(x) ∈ Q[x]
Тогда g(x) = αg1 (x), где g1 (x) ∈ Z[x] и g1 (x) примитивен. Аналогично
h(x) = βh1 (x), где h1 (x) ∈ Z[x] и h1 (x) примитивен. α, β ∈ Q.
m
f = gh = αβg1 h1 = g1 h1 ⇒ nf = mg1 h1 m ⊥ n m ∈ Z, n ∈ N
n
n делит все коэффициенты mg1 h1 , но m ⊥ n, значит n делит все коэф-
фициенты g1 h1 , что невозможно по лемме Гаусса (8.27). Значит, n = 1 и
f = mg1 h1 .

105
Следствие. Если многочлен с рациональными коэффициентами разга-
лается в произведение многочленов положительных степеней, то его
подходящие целочисленное кратное разлагается в произведение целочис-
ленных многочленов положительных степеней.
Теорема 8.29. Существует алгоритм разложения многочленов из Z[x]
в произведение неразложимых в Z[x] (и в Q[x]).
Доказательство. Пусть f (x) ∈ Z[x]. deg f = n > 0. Пусть m = n2 . Вы-
 

берем любые m+1 точку из Z: целые числа x0 , x1 , · · · , xm . Если f (xi ) = 0,


то f (x) = (x − xi )g(x), где g(x) ∈ Z[x] и deg g = n − 1. Далее можно ис-
пользовать индукцию по n.
Если f (x) = g(x)h(x); deg g > 0; deg h > 0, то либо deg g(x) ≤ m, либо
deg h(x) ≤ m. Считаем, что deg g(x) ≤ m. По интерполяционным форму-
лам g(x) однозначно определяется по значениям g(xi ), где i = 0, . . . , m.
Так как f (xi ) = g(xi )h(xi ), то g(xi )|f (xi ) ∀i. Так как f (xi ) 6= 0. то f (xi )
имеет некоторое число целых делителей. Для всякого набора (d0 , . . . , dm ),
где di |f (xi ), можно построить интерполяционный многочлен gd (x) по таб-
x x0 x1 . . . xm
лице: Проверим gd (x)|f (x) или нет? Если делит,
y d0 d1 . . . dm
то мы нашли делитель степени ≤ m. Если для любого набора делителей
(d0 , d1 , . . . , dn ) многочлен не делит f (x), то f (x) неразложим в Z[x] (и в
Q[x]).
Следствие. Существует алгоритм разложения на неразложимые мно-
жители для многочленов в Q[x].

8.15 Вложение целостного кольца в поле частных


Определение 8.18. Поле K называется полем частных для целост-
ного кольца R, если:
1. R ⊂ K, как подкольцо,

2. K — наименьшее, т.е. если L — подполе K, L ⊃ R, то L = K.


Теорема 8.30. Для любого целостного кольца R поле частных K суще-
ствует и только одно с точностью до изоморфизма. Обозначение:
K = Q(R).
Доказательство. Докажем единственность K. Пусть K — поле частных,
построенное для R.

L := {ab−1 |a, b ∈ R, b 6= 0} ⊆ K

106
Тогда ab−1 = cd−1 ⇔ ad = bc при b 6= 0, d 6= 0.
 −1

 ab + cd−1 = (ad + bc)(bd)−1
− ab−1 = (−a)b−1





 (ab−1 )(cd−1 ) = (ac)(bd)−1

(50)

 (ab−1 )−1 = ba−1 (a, b 6= 0)

0 = 0b−1 ∈ L





1 = aa−1 ∈ L (a 6= 0)

Таким образом, L замкнуто относительно сложения, умножения, взятия


обратного элемента, противоположного элемента, нуля и единицы. Сле-
довательно, L — подполе из K; L ⊃ R.

a = (ac)c−1 c 6= 0 a, c ∈ R

Введем поле K, получим L = K.

K = {ab−1 |a, b ∈ R, b 6= 0}

Так как при этом правила равенства элементов вида ab−1 , сложения и
умножения в виде равенств 50 определяются правилами равенства, сло-
жения и умножения в R, то K — единственно с точностью до изомор-
физма.
Докажем существование K.

K = {(a, b)|a, b ∈ R, b 6= 0}/ ∼

Рассмотрим фактор-множество по отношению ∼, где

(a, b) ∼ (c, d) ⇔ ad = bc

Покажем, что это отношение эквивалентности:

(a, b) ∼ (a, b) ⇐⇒ ab = ba

(a, b) ∼ (c, d) ⇒ (c, d) ∼ (a, b) ⇐⇒ ad = bc ⇒ cb = da


(
ad = bc
(a, b) ∼ (c, d) ∼ (e, f ) ⇒ (a, b) ∼ (e, f ) ⇐⇒ ⇒ adcf = bcde
cf = de
Если c 6= 0, то сократив на cd, можно получить af = be. Если c = 0, то
a = e = 0 и df = be.

107
Зададим правила сложения и умножения для рассматриваемого поля:

{(a, b)|a, b ∈ R, b 6= 0}
(
(a, b) + (c, d) = (ad + bc, bd)
(a, b)(c, d) = (ac, bd)
Утверждается, что операции согласованы с эквивалентностью:
) (
(a, b) ∼ (a1 , b1 ) (ad + bc, bd) ∼ (a1 d1 + b1 c1 , b1 d1 )
=⇒
(c, d) ∼ (c1 , d2 ) (ac, bd) ∼ (a1 c1 , b1 d1 )

Дано: (
ab1 = a1 b
cd1 = c1 d
Докажем, что: (
(ad + bc)b1 d1 = (a1 d1 + b1 c1 )bd
acb1 d1 = bda1 c1
При помощи замен множителей на им равные по данным равенствам
получаем верные равенства.
Тогда операции сложения и умножения можно индуцировать на фактор-
множество. Обозначим классы эквивалентности пар (a, b) при b 6= 0 как
дробь:
a
:= {(c, d)|(c, d) ∼ (a, b)}
b
Формулы сложения и умножения дробей имеют вид:

 a + c = ad + bc

b d bd
a
 · =
 c ac
b d bd
Теперь остается проверить, что K — поле, K ⊃ R как подкольцо, K —
наименьшее.
Докажем аксиому ассоциативность сложения:
a c  e  
a c e
+ + = + +
b d f b d f

ad + bc e a cf + ed
+ = +
bd f b df

108
adf + bcf + ebd adf + bcf + ebd
=
bdf bdf
Проверка остальных аксиом поля предоставляется читателю в качестве
упражения.
Покажем, что R ⊂ K как подкольцо. Пусть у нас есть отображение
φ : R → K по правилу a 7→ acc , где c — фиксированный ненулевой элемент
из R. Отображение φ взаимно однозначно:
ac bc
= ⇔ acc = bcc ⇔ a = b
c c
Отображение φ сохраняет операции:

(a + b)c ac + bc ac bc
φ(a + b) = = = + = φ(a) + φ(b)
c c c c
abc ac bc
φ(ab) = = · = φ(a) · φ(b)
c c c
n ac o
R ' R0 = |a∈R ⊂K
c
Значит, R ⊂ K как подкольцо.
Покажем, что K — минимально. Пусть L — подполе из K, L ⊃ R ' R0 .
Значит элементы вида acc ∈ L ∀a ∈ R. Если L 3 bcc 6= 0 в поле K, то L
содержит:
 ac   bc −1 ac · c a
= =
c c c · bc b
na o
L⊃K= | a, b ∈ R, b 6= 0 L=K
b

Замечание 8.7. Доказательство проходит и в случае, если R 63 1.


Замечание 8.8. Пусть P ⊂ R такое, что 0 ∈
/ P , a, b ∈ P ⇒ ab ∈ P . Тогда
можно построить кольцо, содержащее R и в котором определены только
элементы из P (локализация).

Пример 8.11.

R=Z P = {pk |k ∈ Z} p фиксировано


 
a
Qp = | a, k ∈ Z — подкольцо из Q Q(Z) = Q
pk

109
8.16 Рациональные функции и простейшие дроби
Определение 8.19. Пусть K — поле, K[x] — кольцо многочленов. Тогда
K[x] — целостное кольцо. Его поле частных существует и называется
полем рациональных функций (или дробей). Обозначение: K(x) =
Q(K[x]).  
f (x)
K(x) = |f, g ∈ K[x], g 6= 0 (51)
g(x)
Имеем такую цепочку вложений: K ⊂ K[x] ⊂ K(x). Большее поле
всегда можно рассматривать как векторное пространство над меньшим
полем. Каков базис K(x) над K?
f (x)
Определение 8.20. Дробь g(x)
называется правильной, если deg f (x) <
f (x)
deg g(x). Дробь pk (x)
называется простейшей, если:

1. p(x) — неразложимый многочлен в K[x],

2. p(x) — нормированный многочлен (старший коэффициент p(x) ра-


вен 1),

3. deg f (x) < deg p(x).


a
Пример 8.12. K = C, (x−c)k
— простейшие дроби, a, c ∈ C.
a
Пример 8.13. K = R, простейшие дроби либо (x−c)k
, a, c ∈ R, либо
ax+b
(x2 +px+q)k
, где p2 − 4q < 0 и a, b, p, q ∈ R.

Теорема 8.31. Пусть K — поле. Тогда степени 1, x, x2 , . . . переменной


m
x и простейшие дроби вида pxk (x) , где m < deg p(x), образуют базис K(x)
как векторного пространства над K.

Доказательство. Докажем максимальность. Пусть f, g ∈ K[x], g(x) 6= 0.


Используем индукцию по deg g(x), чтобы разложить fg по базису.
Разделим fg с остатком:

f = gh + r deg r < deg g

Тогда:
f gh + r r
= =h+
g g g
r
Разложим g
в сумму простейших дробей. Используем индукцию по сте-
пени g.

110
Рассмотрим случай, когда g = pk . Тогда p — неразложимый, норми-
рованный многочлен из K[x]. Разделим r на p с остатком:

r = pq + r0 deg r0 < deg p

Отсюда:
r pq + r0 q r0
k
= k
= k−1 + k
p p p p
q
При этом pk−1 можно продолжить по индукции, а pr0k уже является ли-
нейной комбинацией базисных простейших дробей.
Рассмотрим случай, когда g = g1 g2 . Пусть также g1 ⊥ g2 и deg g1 , deg g2 <
deg g. Тогда в K[x] разрешимо линейное дифантово уравнение: g1 u+g2 v =
r.
r g1 u + g2 v u v
= = +
g g1 g2 g2 g1
Далее можно продолжить по индукции.
Докажем единственность.
k1 ks
X f1k X fsk
f (x) + + ··· + =0 (*)
k=1
pk1 k=1
pks

где f, f1k , . . . , fsk ∈ K[x], p1 , . . . , ps — различные, неразложимые, норми-


рованные многочлены из K[x]. deg fik < deg pi .
Умножим равенство (*) на pk11 · · · pks s . Поэтому:

f1k1 pk22 · · · pks s + p1 (. . .) = 0

Отсюда p1 |f1k pk22 · · · pks s .

p1 ⊥ pk22 · · · pks s ⇒ p1 |f1k1 ⇒ deg f1k1 < deg p1 ⇒ f1k1 = 0

Аналогично и fiki = 0, а тогда f (x) = 0. Единственность доказана.

8.17 Гомоморфизмы колец, идеалы и фактор-кольца


Определение 8.21. Отображение φ : R → R0 колец R и R0 называется
гомоморфизмом колец, если:

1. φ(a + b) = φ(a) + φ(b) ∀a, b ∈ R

2. φ(ab) = φ(a) · φ(b) ∀a, b ∈ R

111
Простейшее следствие из аскиом:

φ(a) = φ(a − b + b) = φ(a − b) + φ(b) ⇒ φ(a − b) = φ(a) − φ(b)

a = b ⇒ φ(0) = 0
a = 0 ⇒ φ(−b) = −φ(b)
Пример 8.14. R = K[x]; K — поле; R0 = L — поле; L ⊃ K как подполе.
α ∈ L. Тогда отображение специализации

φ : f (x) 7→ f (α)

является гомоморфизмом колец.

φ : K[x] → L

.
Определение 8.22. Пусть φ : R → R0 — гомоморфизм колец. Тогда
множества:

Im φ = {φ(a)|a ∈ R} — образ гомоморфизма φ

Ker φ = {a|φ(a) = 0} — ядро гомоморфизма φ


Теорема 8.32. Im φ, Ker φ — подкольца в R0 и R соответственно.
Доказательство. Im φ замкнуто относительно сложения, умножения, взя-
тия противоположного и нуля.
φ(a) + φ(b) = φ(a + b) ∈ Im φ
− φ(a) = φ(−a) ∈ Im φ
0 = φ(0) ∈ Im φ
φ(a)φ(b) = φ(ab) ∈ Im φ
Ker φ замкнут относительно сложения, умножения, взятия противопо-
ложного и нуля.
φ(a) = φ(b) = 0
φ(a + b) = φ(a) + φ(b) = 0 + 0 = 0
φ(−a) = −φ(a) = −0 = 0
φ(0) = 0
φ(ab) = φ(a)φ(b) = 0 · 0 = 0

112
Замечание 8.9.
a ∈ Ker φ c ∈ R ⇒ ac, ca ∈ Ker φ

Определение 8.23. Идеал I — это подмножество кольца R со свойства-


ми:

1. a, b ∈ I ⇒ a − b ∈ I

2. a ∈ I; c ∈ R ⇒ ac, ca ∈ I

3. 0 ∈ I

Идеал — подкольцо, замкнуто относительно сложения, умножения, взя-


тия противоположного и нуля.

a ∈ I ⇒ −a = 0 − a ∈ I

a, b ∈ I ⇒ a + b = a − (−b) ∈ I
Обозначение: I C R.

Пример 8.15. 1. Ker φ C R

2. {0} C R и R C R — тривиальные идеалы.

3. R = Z; n ∈ N < n >:= {kn|k ∈ Z}

4. p(x) ∈ K[x] < p(x) >:= {p(x)h(x)|h(x) ∈ K[x]}

5. Пусть R — ассоциативное, коммутативное кольцо с единицей.


a1 , . . . , an ∈ R. Тогда множество

< a1 , . . . , an >:= {a1 c1 + · · · + an cn |c1 , . . . , cn ∈ R}

является идеалом в кольце R.

Теорема 8.33. Пусть I — идеал кольца R. Тогда:

1. отношение сравнимости по модулю I

a ≡ b (mod I) ⇔ a − b ∈ I

является отношением эквивалентности на R,

2. оно согласовано с операциями кольца (сложением и умножением


в R),

113
3. фактор-множество R/I := R/≡ (mod I) относительно индуциро-
ванных операций сложения и умножения образует кольцо (оно
называется фактор-кольцом).

4. Если R — ассоциативное, коммутативное кольцо с единицей, то


и R/I — такое же кольцо.

5. Отображение факторизации φ : R → R/I (φ : a 7→ e


a) является
гомоморфизмом с образом R/I и ядром I.

Доказательство. Для краткости обозначений a ∼ b ⇔ a − b ∈ I.

a∼a⇐a−a=0∈I
a ∼ b ⇒ b ∼ a ⇐ a − b ∈ I ⇒ b − a = −(a − b) ∈ I
a ∼ b; b ∼ c ⇒ a ∼ c ⇐ a − b ∈ I; b − c ∈ I ⇒ (a − b) + (b − c) ∈ I
) (
a ∼ a0 a + b ∼ a0 + b 0

b ∼ b0 ab ∼ a0 b0

a + b ∼ a0 + b ∼ a0 + b 0
ab ∼ a0 b ∼ a0 b0
a:
Найдем класс эквивалентности e

a = {b ∈ R|b ∼ a} = {b ∈ R|b − a = c ∈ I} = {a + c|c ∈ I} = a + I


e

Операции сложения и умножения классов эквивалентности:

a + eb := a]
e +b
a · eb := ab
e e

Все свойства сложения и умножения в кольце R в виде тождеств верны


и в R/I . Например:

a + eb = a]
e + b = b]
+ a = eb + e
a

Таким образом, сложение и умножение в R/I удовлетворяет аксиомам


ассоциативности и коммутативности сложения, а также аскиоме дис-
трибутивности. Проверим аксиомы наличия нуля и противоположного
элемента.
0=0+I =I ⇒e
e a+e0 = a]
+0=e a ∀ea
−e
a = −a
f ⇒e ] = a^
a + (−a) + (−a) = e
0

114
Таким образом, R/I — кольцо.
Если R — ассоциативное, коммутативное кольцо с единицей, то R/I —
такое же кольцо потому, что в R/I верны все свойства в виде тождеств
(ассоциативность и коммутативность умножения, в частности). Прове-
рим наличие единицы:

1=1+I ⇒e
e a·e ·1=e
1 = ag a ∀e
a

Пусть φ : R → R/I и φ(a) = e


a. Тогда φ — гомоморфизм.

φ(a + b) = a]
+b=e
a + eb = φ(a) + φ(b)

e = φ(a) · φ(b) ∀a, b


φ(ab) = ab
Im φ = {φ(a)|a ∈ R} = {e
a|a ∈ R} = R/I
Ker φ = {a ∈ R|φ(a) = e
0} = {a ∈ R|e
a=e
0} = I

Теорема 8.34. Пусть φ : R → R0 — гомоморфизм. Тогда

R/Ker φ ' Im φ

Доказательство. Установим соответствие по правилу:

I := Ker φ a ↔ φ(a)
e

Соответствие взаимно однозначное:

a = eb ⇔ a − b ∈ I = Ker φ ⇔ φ(a − b) = 0 ⇔ φ(a) − φ(b) = 0 ⇔ φ(a) = φ(b)


e

Операции сохраняют соответствие:


) (
a ↔ φ(a)
e + b ↔ φ(a + b) = φ(a) + φ(b)
a + eb = a]
e

eb ↔ φ(b) e ↔ φ(ab) = φ(a)φ(b)
aeb = ab
e

Такое соответствие — изоморфизм колец.

Теорема 8.35. Пусть R — ассоциативное, коммутативное кольцо с


единицей. I — максимальный идеал в R:

ICR I<J ER⇒J =R

Тогда R/I — поле.

115
Доказательство. Ясно, что R/I — ассоциативное, коммутативное коль-
цо с единицей. Осталось проверить аксиома взятия обратного элемента:

a 6= e
e 0 ⇒ ∃eb : e
a · eb = e
1

a 6= e
Так как e 0, то a ∈
/ I. Пусть:

J := aR + I = {ab + c|b ∈ R, c ∈ I}

Тогда J C R.
ab + c = ab0 + c0 ⇒ a (b − b0 ) + (c − c0 )
| {z } | {z }
∈R ∈I

(ab + c)u = a |{z} cu ∈ J


bu + |{z}
∈R ∈I

a·0+0∈J
Кроме того, J ⊃ I, значит c = a · 0 + c ∈ J. Кроме того, J 3 a = a · 1 + 0.
Так как a ∈
/ I, то J > I, но I — максимальный идеал. Значит J = R.

J = R = aR + I ⇒ ∃b : 1 = ab + c b ∈ R; c ∈ I

aeb = ab
e −c=e
e = 1] 1−e 1−e
c=e 0=e
1

Пример 8.16. R = R[x] — алгебра вещественных многочленов. R0 = C.


φ : f (x) 7→ f (i) (φ : R[x] → C) — гомоморфизм специализации. Найдем
Im φ и Ker φ. Очевидно, что Im φ ⊂ C. Верно также, что Im φ = C так,
как φ : a + bx 7→ a + bi.

x2 + 1 ∈ Ker φ ⇐ φ(x2 + 1) = i2 + 1 = 0

< x2 + 1 >= {(x2 + 1)h(x)|h ∈ R[x]} ⊂ Ker φ


Докажем, что Ker φ =< x2 + 1 >. Пусть f (x) ∈ Ker φ. Тогда f (i) = 0,
значит i — корень. По теореме Безу (x − i)|f (x) в C[x]. Но f (x) —
вещественный многочлен. Тогда f (−i) = 0. По теореме Безу (x + i)|f (x)
в C[x]. Так как x−i ⊥ x+i, то (x−i)(x+i) = x2 +1|f (x) в R[x]. Значит,
f (x) ∈< x2 + 1 >.
Отсюда можно сделать вывод:

C = Im φ ' R[x]/Ker φ = R[x]/<x2 +1>

116
8.18 Теорема Кронекера о существовании корня
Достаточно доказать теорему для неразложимого многочлена. f (x) =
p1 (x) · · · ps (x).
Теорема 8.36. Пусть K — поле, p(x) — неразложимый многочлен из
K[x]. Тогда существует поле L такое, что:
1. L ⊃ K как подполе,
2. L 3 α : p(α) = 0
3. L — минимальное среди своих подполей поле, удовлетворяющее
вышеуказанным условиям.
Стоит заметить, что L определяется этими условиями однозначно
с точностью до изоморфизма.
Доказательство. Докажем единственность. Пусть L — поле со свойства-
ми, указанными в теореме. Пусть φ : K[x] → L φ : f (x) 7→ f (α) —
гомоморфизм специализации. Найдем Ker φ. Очевидно, что p(x) ∈ Ker φ.
< p(x) >= {p(x)h(x)|h(x) ∈ K[x]} ⊆ Ker φ
Утверждается, что < p(x) >= Ker φ. Пусть: f (x) ∈ Ker φ. Значит f (α) =
0. Тогда x − α|f (x) в L[x] по теореме Безу. Аналогично p(α) = 0 и x −
α|p(x) в L[x]. Если d(x) = НОД(f (x), p(x)), то x − α|d(x) и deg d(x) ≥ 1.
d(x) ∈ K[x]. Действительно, d(x) можно найти по алгоритму Евклида в
K[x]. Так как p(x) неразложим в K[x], d(x)|p(x), deg d(x) ≥ 1, то d(x) =
λp(x), где λ ∈ K; λ 6= 0.
С другой стороны:
f (x) = d(x)h(x) = p(x)λh(x)
p(x)|f (x) ⇒ f (x) ∈< p(x) >⇒< p(x) >= Ker φ
Пусть L0 = Im φ ⊆ L. Ясно, что L0 — ассоциативное, коммутативное
кольцо с единицей. Докажем, что L0 — поле. Имеем:
L0 = Im φ ' K[x]/Ker φ = K[x]/<p(x)>
Можно доказать, что идеал < p(x) > максимальный. Но можно сделать
иначе. Пусть fe ∈ K[x]/<p(x)> ; fe 6= e
0 Найдем такой класс эквивалентности
u
e : feu
e=e 1. Имеем p - f . Иначе, p|f ⇒ f ∈< p(x) >⇒ fe = e 0. Значит,
p ⊥ f ввиду неразложимости p(x).
∃u, v ∈ K[x] : f u + pv = 1

117
1 = f^
e u + pv = feu
e + peve = feu
e+e
0 = feu
e
Значит, L0 — поле. Проверим соответствие L0 условиям теоремы. L0 ⊃ K
как подполе:

f (x) = c0 + 0x + 0x2 + · · · f (α) = c0 + 0 + 0 + · · · = c0

Ввиду произвольности c0 имеем Im φ ⊃ K. Также L0 3 α = g(α) ∈ Im φ,


где g(x) = x.
L0 — подполе из L, удовлетворяющее условиям теоремы. Но L — ми-
нимальное поле с такими свойствами. Значит L0 = L = Im φ. Таким
образом, L = Im φ ' K[x]/<p(x)> . Значит, L — единственно с точностью
до изоморфизма.
Покажем существование L. Положим по определению:

L := K[x]/<p(x)>

Надо доказать, что L — поле со свойствами, указанными в теореме. Уже


доказано, что L — поле. Пусть K 0 = {e
c|c ∈ K}. Утверждается, что c ↔ e
c
0
— это изоморфизм между K и K . Действительно:

c = ce0 ⇔ c − c0 ∈< p(x) >⇔ p(x)|c − c0 (c, c0 ∈ K) ⇔ c − c0 = 0 ⇔ c = c0


e

Соответствие взаимно однозначное. Операции сохраняют соответствие.


) (
c↔e c c + c0 ↔ c]+ c0 = e
c + ce0
=⇒
c0 ↔ ce0 cc0 ↔ cc
f0 = e
cce0

K0 ' K ⇒ K ≡ K0 ⊂ L
L содержит корень α многочлена p(x). Пусть α := x
e.

p(x) = c0 + c1 x + c2 x2 + · · · cn xn ci ∈ K ∀i

p(α) = ce0 + ce1 x fn = c0 + c1 x^


e + · · · + cen x + · · · + cn xn = p(x)
g =e 0
L — поле. Пусть L0 — полполе из L, содержащее K.

L0 ⊃ K 0 L0 3 ae0 + ae1 x fn
e + · · · + aen x

L0 3 f (x) = ae0 + · · · + aen x


fn
f (x) — произвольный многочлен.

L0 = L = {fe|f ∈ K[x]}

118
Можно доказать, что e1, x n−1 — базис L = K[x]/
e, . . . , xg <p(x)> как вектор-
ного пространства над K.

dim L = n = deg p(x)

Пример 8.17. Построим поле из 4 элементов.

Zp = {0; 1} p(x) = x2 + x + 1

Таким образом p(x) неразложим в Z2 [x]: p(x) = p(1) = 1. I =< p(x) > в
Zp [x].
L = Zp [x]/I 1=e 1 α=α e
p(α) = 0 x2 + x + 1 = 0 α2 = α + 1
L = {0, 1, α, α + 1}
+ 0 1 α α+1 · 0 1 α α+1
0 0 1 α α+1 0 0 0 0 0
1 1 0 α+1 α 1 0 1 α α+1
α α α+1 0 1 α 0 α α+1 1
α+1 α+1 α 1 0 α+1 0 α+1 1 α

(L; +) ' Z2 ⊕ Z2

(L \ {0}; ·) ' L3
< α >= {α; α2 = α + 1; α3 = 1}

9 Многочлены от многих переменных


9.1 Кольцо многочленов от нескольких переменных
Определение 9.1. Пусть K — кольцо. x1 , . . . , xn — переменные (или
неизвестные). Многочлен от x1 , . . . , xn с коэффициентами из K — это
формальная конечная сумма:
X
ak1 ···kn xk11 · · · xknn ak1 ···kn ∈ K
∀i ki ∈Z+

ak1 ···kn xk11 · · · xknn — одночлен с коэффициентом ak1 ···kn


Число k1 + · · · + kn называется степенью одночлена при ak1 ···kn 6= 0.

119
Многочлены складываются и умножаются как функции:
X X X
ak1 ···kn xk11 · · · xknn + bk1 ···kn xk11 · · · xknn = (ak1 ···kn + bk1 ···kn )xk11 · · · xknn

X  X  X
ak1 ···kn xk11 · · · xknn b`1 ···`n x`11 · · · x`nn = ak1 ···kn b`1 ···`n xk11 +`1 · · · xnkn +`n
 
X X
=  ak1 ···kn b`1 ···`n  xm 1 mn
1 · · · xn
∀i mi ≥0 ∀j kj +`j =mj

Теорема 9.1. Множество K[x1 , . . . , xn ] всех многочленов от перемен-


ных x1 , . . . , xn с коэффициентами из кольца K само образует кольцо
относительно операций сложения и умножения. Если K — кольцо ас-
социативное, коммутативное или с единицей, то и K[x1 , . . . , xn ] — та-
кое же кольцо.

Доказательство. Используем индукцию по n. При n = 1 считаем до-


казанным. Индуктивный переход от n − 1 к n следует из изоморфизма
K[x1 , . . . , xn ] ' R[xn ], где R = K[x1 , . . . , xn−1 ]. Изоморфизм задается пра-
вилом:
 
X X X kn−1  kn
f= ak1 ···kn xk11 · · · xknn ↔  ak1 ···kn xk11 · · · xn−1 xn
∀i ki ≥0 kn ≥0 ∀j kj ≥0

Проверка изоморфизма предоставляется читателю в качестве упраже-


ния.

9.1.1 Упорядочение одночленов


Пусть X = {x1 , . . . , xn } — множество переменных.
Пусть X ∗ = {xk11 · · · xknn | ki ∈ Z+ ∀i}. Тогда X ∗ относительно умноже-
ния — коммутативный моноид.

Определение 9.2. Отношение > на X ∗ называется линейным поряд-


ком, если:

1. ∀u, v ∈ X ∗ : u = v ∨ u > v ∨ v > u

2. ∀u, v, w ∈ X ∗ : u > v; v > w ⇒ u > w

Определение 9.3. Линейный порядок называется устойчивым отно-


сительно умножения, если:

120
1. ∀u, v, w ∈ X ∗ : u > v ⇒ uw > vw

2. u 6= 1 ⇒ u > 1.

Пример 9.1. Лексикографический порядок.

u = xk11 · · · xknn > v = x`11 · · · x`nn ⇔ ∃i : (k1 = `1 , . . . , ki−1 = `i−1 , ki > `i )

Это линейный порядок, устойчивый к умножению:

k1 + m1 = `1 + m1 ... ki−1 + mi−1 = `i−1 + mi−1 ki + mi > `i + mi

Пусть еще один порядок задан условием:


X X
u>v⇔ ki > `i

Если же степени равны, то используем лексикографический порядок.


Проверка устойчивости этого порядка к умножению остаётся чита-
телю в качестве упражнения

Лемма 9.2 (о старшем члене). Если K — кольцо без делителей нуля,


то верно следующее:

ст. чл. (f g) = (ст. чл. f )(ст. чл. g)

Доказательство.

f = αu + α0 u0 + . . . α 6= 0

g = βv + β 0 v 0 + . . . β 6= 0
Значит и αβ 6= 0. Тогда:

f g = αβuv + αβ 0 uv 0 + α0 βu0 v + α0 β 0 u0 v 0 + . . .

uv > uv 0 > u0 v 0 uv > u0 v > u0 v 0

9.2 Симметрические многочлены


Определение 9.4. Многочлен от нескольких переменных называются
симметрическим, если он не меняется при любых перестановках пере-
менных.

121
Пример 9.2. Пусть x1 , . . . , xn — переменные, x — новая переменная.
n
Y
f (x) = (x − xi ) = xn − σ1 xn−1 + σ2 xn−2 + · · · + (−1)n σn
i=1

σ 1 = x1 + x2 + · · · + xn
σ2 = x1 x2 + x1 x3 + · · · + xn−1 xn
..
.
X
σk = xi 1 xi 2 · · · xi k
1≤i1 <i2 <···<ik
..
.
σ n = x1 x2 · · · xn
Определение 9.5. Многочлены σ1 , σ2 , . . . , σn симметрические. Они на-
зываются элементарными симметрическими многочленами от
x1 , x2 , . . . , xn .

Теорема 9.3. Симметрические многочлены из K[x1 , . . . , xn ], где K —


кольцо, сами образуют кольцо. Любой симметрический многочлен име-
ет единственное представление в виде многочлена от элементарных
симметрических многочленов.

f (x1 , x2 , . . . , xn ) ⇒ ∃!φ(y1 , . . . , yn ) : f = φ(σ1 , . . . , σn )

Доказательство. Если f, g — симметрические, то f ±g, f g — также сим-


метрические. 0 — симметрический многочлен. Значит, симметрические
многочлены образуют подкольцо.
Покажем существование φ. Пусть f (x1 , . . . , xn ) — симметрический
многочлен (f 6≡ 0). axk11 · · · xknn — старший член этого многочлена в лекси-
кографическом порядке (a 6= 0). Тогда k1 ≥ k2 ≥ · · · ≥ kn . Предположим
противное. ki ≤ ki+1 . Переставив xi и xi+1 в многочлене f . Тогда стар-
k
ший член f перейдет в одночлен xk11 · · · xi i+1 xki+1 i
· · · xknn , который старше,
чем старший член нашего многочлена f в лексикографическом порядке.
Противоречие с выбором старшего члена f .
Теперь подберем произведение φ1 элементарных многочленов с таким
же старшим членом, что и для f .
(
φ1 = aσ1`1 σ2`2 · · · σn`n
ст. чл. φ1 ≡ ст. чл. f

122
По лемме о старшем члене многочлена:

ст. чл. φ1 = a(ст. чл. σ1 )`1 · · · (ст. чл. σn )`n


= ax`11 (x1 x2 )`2 · · · (x1 x2 · · · xn )`n = axk11 xk22 · · · xknn

`1 + `2 + · · · + `n = k1 `1 = k1 − k2 ≥ 0
 

 

` + · · · `n = k2 ` = k2 − k3 ≥ 0

 

 2  2

 

.. ⇐⇒ ... (*)
 . 
 



 ` n−1 + `n = k n−1



 `n−1 = kn−1 − kn ≥ 0
`n = kn ≥ 0
 
`n = kn
Тогда, если f1 = f − φ1 , то либо f1 = 0, либо ст. чл. f1 < ст. чл. f . В
первом случае f = φ1 . Во втором случае снова подбираем многочлен φ2
через элементарные так, чтобы ст. чл. φ2 = ст. чл. f1 . Положим, f2 =
f1 − φ2 = f − φ1 − φ2 . Процесс оборвется на нуле так, как старшие члены
разности имеет наборы показателей (k10 , . . . , kn0 ) со свойствами k10 ≥ k10 ≥
· · · ≥ kn0 > 0. Тогда множество конечно, отсюда процесс оборвется.

f = φ1 + φ2 + · · · + φn

где φi — произведение элементарных симметрических многочленов.


Докажем единственность. Предположим:

f = φ(σ1 , . . . , σn ) = φ0 (σ1 , . . . , σn ) φ 6= φ0

Тогда φ − φ0 6= 0, как многочлен от (y1 , . . . , yn ). Но:

(φ − φ0 )(σ1 , . . . , σn ) ≡ 0

Предположим, что:

φ − φ0 = φ1 + φ2 + · · · + φs

φi — разложение многочлена от y1 , . . . , yn . Многочлен φi (y1 , . . . , yn ) од-


нозначно восстанавливается по своему старшему члену, если положить
y1 = σ1 , . . . , yn = σn ввиду (*).

0= φ1 + φ2 +··· + φn (**)
|{z} |{z} |{z}
ст. чл. φ1 (σ1 , . . . , σn ) ст. чл. φ2 (σ1 , . . . , σn ) ст. чл. φn (σ1 , . . . , σn )

Так как φi различны, то старшие члены φi (σ1 , . . . , σn ) также различны.


Поэтому старший среди старших членов φi (σ1 , . . . , σn ) не может сокра-
титься в сумме (**). Противоречие доказывает, что φ = φ0 .

123
Следствие.
K[σ1 , . . . , σn ] ' K[x1 , . . . , xn ]
Следствие. Пусть p(x) = a0 xn + · · · + an ∈ K[x] (a0 6= 0). Тогда любая
симметрическая функция от корней p(x) с коэффициентами из K дает
значение в K.
Доказательство. Пусть f (x1 , . . . , xn ) — симметрический многочлен из
K[x1 , . . . , xn ]. Пусть α1 , . . . , αn — все корни p(x) в поле L ⊃ K. Найдем
многочлен φ(y1 , . . . , yn ) с коэффициентами из K.

f = φ(σ1 , . . . , σn )

f (α1 , . . . , αn ) = φ(σ1 (α1 , . . . , αn ), . . . , σn (α1 , . . . , αn ))


(−1)n an
 
a1 a2
= φ − , ,..., ∈K
a0 a0 a0
Ввиду формул Виета.
Следствие. Пусть x1 , . . . , xn и y1 , . . . , y` — два набора переменных, K
— кольцо.
f ∈ K[x1 , . . . , xn , y1 , . . . , y` ]
f — симметрический отдельно по x1 , . . . , xn и по y1 , . . . , y` . Тогда:

∃φ : f = φ(σ1 , . . . , σk , τ1 , . . . , τ` )

где σi — элементарные симметрические многочлены по x1 , . . . , xn , а τj


— элементарные симметрические многочлены по y1 , . . . , y`
Доказательство. Пусть R = K[x1 , . . . , xk ], тогда:
X
f= fk1 ···k` y1k1 · · · y`k` fk1 ···k` ∈ R
k1 ,...,k`

Так как f симметричен по x1 , . . . , xk , то fk1 ···k` симметричен по x1 , . . . , xk .

fk1 ···k` ∈ K[σ1 , . . . , σn ]

f ∈ K[σ1 , . . . , σk ][y1 , . . . , y` ]
f симметричен по y1 , . . . , y` по теореме.

∃φ ∈ K[σ1 , . . . , σk ][. . .] : f = φ(σ1 , . . . , σk , τ1 , . . . , τ` )

124
9.3 Дискриминант
Определение 9.6. Пусть f (x) = a0 xn + · · · an = a0 ni=1 (x − αi ) — мно-
Q
гочлен с коэффициентами из поля K. Тогда дискриминант f задается
равенством Y
Dis(f ) = a02n−2 (αi − αj )2
i>j

где αi — корни f . Ясно, что Dis(f ) = 0 ⇔ ∃кратный корень. Необходимо


выразить Dis(f ) через коэффициенты f .
Лемма 9.4 (об определителе Вандермонда).

1 x1 x 2
1 . . . x1n−1
1 x2 x 2
2 . . . x2n−1 Y
= (xi − xj )

.. .. ..
. . . . . .
i>j
1 xn x2n . . . xnn−1

Доказательство. Индукция по n. n = 2. Тогда:



1 x1
1 x2 = x2 − x1

n − 1 ⇒ n. Вычтем из k-того столбца k − 1 умноженный на x1 при k =


n, n − 1, . . . , 2. Получим:

1 0 0 ... 0

1 x2 − x1 x2 − x1 x2 . . . xn−1 − x1 xn−2
2 2 2
= (x2 − x1 ) · · · (xn − x1 )

.. .. .. .. ..
. . . . .
2 n−1 n−2

1 xn − x1 xn − x1 xn . . . xn − x1 xn
V (x2 , . . . , xn )
n
Y n
Y
= (x2 − x1 ) · · · (xn − x1 ) (xi − xj ) = (xi − xj )
i>j≥2 i>j≥1

Лемма 9.5.

n s1 s2 . . . sn−1

n s1 s2 . . . sn−1 sn
Y
2
(xi − xj ) = s2 . . .
... ... . . .
i>j ... ... ... ... . . .

sn−1 sn . . . . . . s2n−2
где sk = xk1 + xk2 + · · · + xkn — k-тая степенная сумма x1 , . . . , xn .

125
Доказательство.

1
1 ... 1 1 x1 . . . x1n−1
n
Y x1 x1 . . . xn 1 x2 . . . x2n−1
(xi − xj )2 = .. .. · .. ..

.. .. .. ..
. . . . . . . .
i>j n−1 n−1
x1 n−1 n−1
x2 . . . xn 1 xn . . . xn

n s1 s2 . . . sn−1

s1 s2 . . . sn−1 sn

= s2 ... ... ... . . .
... ... ... ... . . .

sn−1 sn . . . . . . s2n−2

Теорема 9.6 (Ньютона).


sk − σ1 sk−1 + σ2 σk−2 − · · · + (−1)k−1 σk−1 s1 + (−1)k kσk = 0 k ≤ n (52)
sk − σ1 sk−1 + · · · + (−1)n σn sk−n = 0 k≥n (53)
Доказательство. Докажем второе равенство, используя тождество Ви-
ета: n
Y
(x − xi ) = xn − σ1 xn−1 + · · · + (−1)n σn
i=1

Подставим x = xi , умножим xk−n i . Просуммируем при i = 1, . . . , n. Полу-


чим искомую формулу.
Докажем первое равенство индукцией по d = n − k. При d = 0 имеем
k = n, в данном случае первое и второе равенства совпадают. Пусть
d > 0. Обозначим fk,n левую часть первого равенства. Докажем, что
fk,n = 0. Подставим в fk,n (x1 , . . . , xn ) вместо xn ноль. Тогда:
fk,n (x1 , . . . , xn−1 , 0) = sk − σ1 sk−1 + · · · + (−1)k kσk
где si и σi — это si и σi , где xn = 0. Очевидно, что:
fk,n = (x1 , . . . , xn−1 , 0) = fk,n−1 (x1 , . . . , xn−1 )
Но (n − 1) − k = d − 1 < d = n − k. По предположению индукции
fk,n−1 ≡ 0. Поэтому xn входит во все слагаемые fk,n . xn | fk,n . Но fk,n —
симметрический многочлен, значит ∀i xi | fk,n . Отсюда:
fk,n = (x1 · · · xn )h(x1 , . . . , xn )
Но степени одночленов из fk,n равны k < n, значит h ≡ 0 и fk,n ≡ 0.

126
9.4 Результант
Теорема 9.7. Пусть K — поле,
k
Y
f (x) = a0 xk + · · · + ak = a0 (x − αi )
i=1

`
Y
`
g(x) = b0 x + · · · + b` = b0 (x − βj )
j=1

— многочлены соответственно k и ` степеней. Тогда:



a0 a1 . . . ak 0 0 . . . . . .

0 a0 a1 . . . ak 0 . . . . . .
...

0 0 a0 . . . ... . . . . . .

..
a`0 bk0
Y
(αi − βj ) = . . . . . . . . .
. . . . . . . . . . . . .
1≤i≤k; 1≤j≤` 0 ... ... 0 a0 . . . ak . . .
b
0 b1 . . . . . . . . . b` . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . .


0 . . . b 0 b1 . . . . . . . . . b`

Правая часть называется результантом многочленов f и g и обозна-


чается Res(f, g).

Доказательство. Пусть R — матрица результанта.


 
a0 . . . a k 0 0 0
. ... ...
 0 .. . . . 0
 
 0 0 a0 . . . ak 0 
 
R=
 b0 . . . . . . b` . . . 0 

 0 ... . . . .
. . . .. 0
 

0 0 b0 . . . . . . b`
 k+`−1 
β1 . . . β`k+`−1 α1k+`−1 . . . αkk+`−1
β k+`−2 . . . β k+`−2 α1k+`−2 . . . αkk+`−2 
 1 ` 
 .. .
. .. .. .. .. 
V = . . . . . . 
 
 β1 ... β` α1 ... αk 
1 ... 1 1 ... 1

127

f (β1 )β1`−1 . . . f (β` )β``−1

0 ... 0
.. .. ..
f (β1 )β1`−2 . . . f (β` )β``−2
 
. . . 
 .. .. .. .. .. .. 
. . . . . .
 
 
 f (β1 ) ... f (β` ) 0 ... 0
 
RV = 

0 ... 0 g(α1 )α1k−1 . . . g(αk )αkk−1 


 .. .. 

 . ... . g(α1 )α1k−2 . . . g(αk )αkk−2 

 .. .. .. .. .. .. 
 . . . . . . 
0 ... 0 g(α1 ) ... g(αk )
Используем равенство det(R · V ) = det R · det V и определитель Вандер-
монда:
z n−1 . . . z n−1
1 n
z n−2 . . . z n−2
1 n
.. .. .. = Y(z − z )
. . . i j

z1 . . . zn i<j

1 ... 1
Y Y Y
Res(f, g) (βi − βj ) (αi − αj ) (βj − αi )
i<j i<j i<j
Y Y Y Y
= f (βj ) g(αi ) (βi − βj ) (αi − αj )
j i i<j i<j

Сократим в целостном кольце K[α1 , . . . , αk , β1 , . . . , β` ], где αi и βj — пе-


ременные. Получим:
!
Y Y Y Y Y Y
Res(f, g) (βj − αi ) = f (βj ) g(αi ) = a0 (βj − αi ) g(αi )
i<j j j j i i
!
Y Y Y Y
Res(f, g) = a`0 g(αi ) = a`0 b0 (αi − βj ) = a`0 bk0 (αi − βj )
i i j i,j

Следствие.
Res(f, g) = (−1)k` Res(g, f )
Следствие. Y
Res(f, g) = a`0 g(αi )
i

Следствие.
Res(f, g) = 0 ⇔ f и g имеют общий корень

128
9.5 Результант и дискриминант
Теорема 9.8.
n
Y
n
f (x) = a0 x + · · · + an = a0 (x − αi )
i=1

n(n−1) 1
Dis(f ) = (−1) 2 Res(f, f 0 )
a0
Доказательство.
n−1
Y
0
Res(f, f ) = a0n−1 f 0 (αi )
i

По свойствам дифференцирования:
n
!0 n
!
Y X Y
f 0 (x) = a0 (x − αi ) = a0 (x − αi )
i=1 k=1 j6=k

Y
f 0 (αi ) = a0 (αi − αj )
j6=i

n
!
Y Y YY
Res(f, f 0 ) = an−1
0 a0 (αi − αj ) = a2n−1
0 (αi − αj )
i=1 j6=i i j6=i
n(n−1) Y n(n−1)
= (−1) 2 a02n−1 (αi − αj )2 = (−1) 2 a0 Dis(f )
i<j

9.6 Результант и системы полиномиальных уравне-


ний
Пусть дана система из двух полиномиальных уравнений с двумя неиз-
вестными над полем K: (
f (x, y) = 0
g(x, y) = 0
Перепишем в форме:
(
a0 (y)xk + a1 (y)xk−1 + · · · + ak (y) = 0
(54)
b0 (y)x` + b1 (y)x`−1 + · · · + b` (y) = 0

129
где ai (y), bj (y) ∈ K[y]. Если (α; β) — решение системы 54, то α — общий
корень многочлена:
(
a0 (β)xk + · · · + ak (β) = 0
b` (β)x` + · · · + b` (β) = 0

Теорема 9.9. Res(f, g) = 0 ⇔ f и g имеют общий корень или a0 = b0 =


0.
Доказательство. Пусть a0 6= 0 и b0 6= 0. Тогда по теореме о результанте
Res(f, g) = 0 ⇔ f и g имеют общий корень.
Пусть a0 = b0 = 0. Тогда Res(f, g) = 0 (первый столбец определителя
нулевой).
Предположим, что a0 6= 0, а b0 = 0. Если все b0 = b1 = · · · = b` = 0, то
Res(f, g) = 0, g ≡ 0. Теперь пусть b0 = · · · = bs−1 = 0, bs 6= 0 (0 < s ≤ `).
Обозначим ḡ(x) = bs x`−s + · · · + b` (bs 6= 0). Тогда:

a0 . . . . . . . . . ak 0 0 0
.. . .

0 . . . . . . . . . . .. .. 0

.
.. 0 a . . . . . . . . . a 0
0 k
0 . . . 0 . . . . . . . . . . . . ak

Res(f, g) = = as0 Res(f, ḡ)
..
. bs . . . b` 0 0 0

0
0 ... 0 ... . . . ... ... 0


. . . . . .

0 0 0
. . ... . 0
0 0 0 0 0 bs . . . b `

Res(f, g) = 0 ⇔ Res(f, ḡ) = 0 ⇔ f и ḡ имеют общий корень ⇔ f и g


имеют общий корень.
Следствие. Если существует алгоритм отыскания корней от одной
переменной, то существует и алгоритм отыскания решений системы
полиномиальных уравнений.
Доказательство.

a0 . . . ak 0 0 0
... . .

0 . . . .. .. 0

0 0 a0 . . . a k 0

Res(f, g) =
b0 . . . . . . b` . . . 0

... .
. . . . . . . . 0

0

0 0 b0 . . . . . . b `

130
Если (α; β) — решение системы 54, то либо β — корень многочлена
Resy (f, g), либо a0 (β) = b0 (β) = 0. По предположению все корни
Resy (f, g), a0 (y), b0 (y) можно найти. Тогда можно найти и α, отыскивая
общий корень уравнений:
(
a0 (β)xk + · · · + ak (β) = 0
b0 (β)x` + · · · + b` (β) = 0

9.7 Теорема Гильберта о базисе


Определение 9.7. Пусть I — идеал кольца R, где R — ассоциативное,
коммутативное кольцо с единицей. Множество F порождает идеал I,
если: ( s )
X
I= fi ui |fi ∈ F ; ui ∈ R
i=1
Обозначение: I =< F >. Идеал I называется конечно порожденным,
если существует конечное множество F ⊂ I такое, что: I =< F >.
Пример 9.3. K — поле, I C K. Тогда либо I = {0} =< 0 >, либо
I = K =< 1 >.
R — евклидово кольцо, I C R. Тогда I = {0} =< 0 > или I 6= 0. Тогда
выберем ненулевой элемент из I с наименьшей нормой.
a∈I a 6= 0 N (a) — минимальная
Если b ∈ I, то b = aq + r, где r = 0 или N (r) < N (a). Предположим,
что r 6= 0. Тогда r = b − aq ∈ I, что противоречит выбору a. Значит
r = 0, а I =< a >= {aq|q ∈ R}.
Теорема 9.10 (Гильберта о базисе). Всякий идеал в кольце K[x1 , . . . , xn ],
K — поле или евклидово кольцо, конечно порожден.
Доказательство. Если всякий идеал в кольце R (ассоцитивное, комму-
тативное кольцо с единицей) конечно порожден, то и R[x] — такое же
кольцо. Здесь R = K[x1 , . . . , xn−1 ]. Начало индукции: в кольце K всякий
идеал конечно порожден. Используем изоморфизм R[xn ] ' K[x1 , . . . , xn ].
Пусть J C R[x], J 6= {0}. Пусть I — множество старших коэффициентов
всех многочленов из J (полагаем, что старший коэффициент нулевого
многочлена равен нулю). Тогда I — идеал R. В самом деле, если a, b из
I, то найдутся такие многочлены f и g из J, что:
f = axn + · · · g = bxm + · · ·

131
Если a = b, то a − b = 0 ∈ I. Пусть a 6= b. Можно считать, что n ≥ m.

f − gxn−m = (a − b) xn + · · ·
| {z } | {z }
∈J a−b∈I

Если c ∈ R, то при ac = 0 ∈ I. Пусть ac 6= 0. Тогда:

cf = caxn + · · · ca ∈ I

По предположению I конечно порожден. I =< a1 , . . . , as >, где ai ∈ R.


Тогда найдутся многочлены

f 1 = a1 x n 1 + · · ·
..
.
fs = as xns + · · ·

из J. Пусть m = max{n1 , . . . , ns }. Пусть f ∈ J.

f = axk + · · · k≥m

Тогда мы можем устранить старший член f следующим образом. Имеем,


что a ∈ I, I =< a1 , . . . , as >.

a = a1 c 1 + · · · + as c s ci ∈ R

g = f − f1 c1 xk−n1 − · · · − fs cs xk−ns
Тогда g ∈ J и deg g < deg f . Продолжая этот процесс исключения стар-
ших членом получим:

r = f − f1 u1 − · · · − fs us ∈ J deg r < m

Если r = 0, то f = f1 u1 + · · · + fs us ∈< f1 , . . . , fs >. Если же r 6= 0, то


пусть Ik = {ст. к. h|h ∈ J, deg h = k ∨ h = 0} причем k = deg h < m.
Тогда Ik ⊂ R. Выберем многочлены fs+1 , . . . , ft из J, старшие коэффи-
циенты которых порождают идеалы Im−1 , Im−2 , . . . , I0 . Тогда J конечно
порожден.
J =< f1 , . . . , fs , fs+1 , . . . ft >

132