Вы находитесь на странице: 1из 138

Содержание

Лекции 1-2. Абелевы группы. 4


1 Определение . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Подгруппа . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3 Понятие изоморфизма . . . . . . . . . . . . . . . . . . . . . . 7
4 Прямые суммы . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5 Конечнопорождённые абелевы группы . . . . . . . . . . . . 9
6 Графы групп . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
7 Морфизмы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
8 Факторгруппы . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Лекция 3. Кольца. 16
1 Определение . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2 Делители нуля . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3 Кольца вычетов . . . . . . . . . . . . . . . . . . . . . . . . . 18

Лекция 4. Поля. 20
1 Определение . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2 Характеристика поля . . . . . . . . . . . . . . . . . . . . . . 20
3 Поле комплексных чисел . . . . . . . . . . . . . . . . . . . . 21

Лекции 5-6. Кольца многочленов. 25


1 Определение . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2 Понятие делимости . . . . . . . . . . . . . . . . . . . . . . . 26
3 Теория делимости . . . . . . . . . . . . . . . . . . . . . . . . 28
4 Корни многочленов . . . . . . . . . . . . . . . . . . . . . . . 31
5 Формальная производная . . . . . . . . . . . . . . . . . . . . 33

Лекции 7-8. Матрицы. 35


1 Действия с матрицами . . . . . . . . . . . . . . . . . . . . . 35
2 Делители нуля и обратимые матрицы . . . . . . . . . . . . . 40
3 Элементарные преобразования и элементарные матрицы . . 43

Лекции 9-10. Определители. 48


1 Индуктивное определение . . . . . . . . . . . . . . . . . . . 48
2 Линейность и кососимметричность определителя . . . . . . 49
3 Другие свойства определителя . . . . . . . . . . . . . . . . . 51
4 Приложения . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Лекции 11-15. Векторные пространства. 56


1 Основные определения . . . . . . . . . . . . . . . . . . . . . 56

1
2 Подпространства и линейные оболочки . . . . . . . . . . . . 57
3 Базис и размерность . . . . . . . . . . . . . . . . . . . . . . . 59
4 Суммы и пересечения пространств . . . . . . . . . . . . . . 63
5 Координатизация пространств . . . . . . . . . . . . . . . . . 66
6 Конечные поля . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7 Ранг матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8 Системы линейных однородных уравнений . . . . . . . . . . 69
9 Линейные функции и сопряженное пространство . . . . . . 70
10 Аннуляторы подпространств . . . . . . . . . . . . . . . . . . 73

Лекции 16-17. Геометрия векторных пространств. 76


1 Аффинные подпространства . . . . . . . . . . . . . . . . . . 76
2 Барицентрические комбинации . . . . . . . . . . . . . . . . . 78
3 Аффинные оболочки . . . . . . . . . . . . . . . . . . . . . . 81
4 Аффинная зависимость . . . . . . . . . . . . . . . . . . . . . 82
5 Взаиморасположение точек, прямых и плоскостей . . . . . 84
6 Теоремы Менелая и Чевы . . . . . . . . . . . . . . . . . . . . 86
7 Задача Сильвестра о коллинеарных точках . . . . . . . . . 90
8 Непересекающиеся аффинные подпространства . . . . . . . 95

Лекция 18. Геометрия порядка. 98


1 Упорядоченные поля . . . . . . . . . . . . . . . . . . . . . . 98
2 Понятие отрезка . . . . . . . . . . . . . . . . . . . . . . . . . 99
3 Задача Сильвестра в геометрии порядка . . . . . . . . . . . 101

Лекция 22. Линейные отображения. 104


1 Определение . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
2 Действия с отображениями . . . . . . . . . . . . . . . . . . . 105
3 Ядро и образ . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4 Координатизация отображений . . . . . . . . . . . . . . . . 109
5 Замена базиса . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6 Обратимые операторы . . . . . . . . . . . . . . . . . . . . . . 112
7 Проектирования и отражения . . . . . . . . . . . . . . . . . 113

Лекция 23. Аффинные отображения 116


1 Определение . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
2 Случай |F | = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3 Случай |F | > 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 118

Лекции 25-27. Собственные векторы 124


1 Определение . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

2
2 Собственное подпространство . . . . . . . . . . . . . . . . . 124
3 Диагонализируемые операторы . . . . . . . . . . . . . . . . 125
4 A-инвариантные подпространства . . . . . . . . . . . . . . . 127

Лекция 28. Теорема Гамильтона—Кэли 130


1 Аннуляторы операторов . . . . . . . . . . . . . . . . . . . . . 130
2 Теорема Гамильтона—Кэли . . . . . . . . . . . . . . . . . . . 130

Лекции 29-30. Жорданова матрица 133


1 Разложение аннулятора . . . . . . . . . . . . . . . . . . . . . 133
2 Нильпотентные операторы . . . . . . . . . . . . . . . . . . . 135
3 Жорданова матрица оператора . . . . . . . . . . . . . . . . 137

3
Лекции 1-2. Абелевы группы.

1 Определение
Абелевой группой называется множество A, на котором определена опе-
рация, обычно называемая сложением (+), обладающая следующими
свойствами:

(A1) Ассоциативность.
Для любых a, b, c ∈ A

(a + b) + c = a + (b + c).

(A2) Коммутативность.
Для любых a, b ∈ A
a + b = b + a.

(A3) Существование нейтрального элемента.


Существует такой элемент 0 ∈ A, что для любого a ∈ A

a + 0 = a.

(A4) Существование противоположного элемента.


Для любого a ∈ A существует такой b ∈ A, что

a + b = 0.

Простейшие следствия

1. Из свойств A1 и A2 следует, что результат сложения произвольного


числа элементов не зависит от расстановки скобок и последователь-
ности их сложения.

2. Элемент, удовлетворяющий условию A3, единственен. Действитель-


но, пусть a + 01 = a + 02 = a для любого a ∈ A. Тогда

01 = 01 + 02 = 02 + 01 = 02 .

4
3. Элемент b из A4 называется противоположным к a. Противополож-
ный элемент единственен. Действительно, пусть a + b1 = a + b2 = 0.
Тогда
b1 = b1 + 0 = b1 + (a + b2 ) = (b1 + a) + b2 = 0 + b2 = b2 .
Противоположный к a элемент обозначается −a. Понятно, что −(−a) =
a.
4. С помощью понятия противоположного элемента можно ввести но-
вую операцию вычитания
a − b = a + (−b).
Элемент a − b называется разностью элементов a и b.
5. Уравнение x + a = b имеет единственное решение x = b − a.

Кратные элементы

Для любых a ∈ A и α ∈ Z положим



 0 , если α = 0

 a + . . . + a , если α > 0

| {z }
αa = α .

 a

 . . + a} , если α < 0.
| + .{z
−α

Нетрудно показать, что для любых a, b ∈ A и α, β ∈ Z справедливы


равенства

1) α(βa) = (αβ)a,
2) (α ± β)a = αa ± βa,
3) α(a ± b) = αa ± αb.

Линейные комбинации

Пусть a1 , . . . , an ∈ A и α1 , . . . , αn ∈ Z. Элемент
b = α1 a1 + . . . + αn an
называется линейной комбинацией элементов a1 , . . . , an . Если элемент
c равен некоторой линейной комбинации элементов a1 , . . . , an , то будем
говорить, что элемент c линейно выражается через a1 , . . . , an .

5
2 Подгруппа
Подмножество B из абелевой группы A называется подгруппой в A, если

(S1) 0 ∈ B,
(S2) x, y ∈ B ⇒ x + y ∈ B,
(S3) x ∈ B ⇒ −x ∈ B.

Обозначение: B 6 A.
Очевидно, что подгруппа абелевой группы сама является абелевой груп-
пой относительно той же операции.
Ясно, что подмножества B = {0} и B = A являются подгруппами в
A. Эти подгруппы называются тривиальными. В первом случае B = {0}
подгруппа также называется нулевой и для неё используется упрощенное
обозначение B = 0.
Существует общий способ построения подгрупп, суть которого состоит
в следующем: пусть M — непустое подмножество из абелевой группы
A, тогда множество всех линейных комбинаций элементов из M образу-
ет подгруппу в A. Эта подгруппа обозначается через hMi и называется
подгруппой, порожденной множеством M. Само множество M называ-
ется порождающим множеством подгруппы hMi.
Абелева группа A называется конечнопорожденной, если A порождает-
ся некоторым конечным набором своих элементов. Если A порождена
одним элементом, то A называется циклической группой.
На множестве всех подгрупп из A вводятся две операции: суммы и пе-
ресечения подгрупп.
Под суммой подгрупп B и C понимается подгруппа, порожденная B и
C. Обозначение B + C. Понятно, что
B + C = {x + y | x ∈ B и y ∈ C} .
Под пересечением подгрупп B и C понимается обычное теоретико-множественное
пересечение B и C.
B ∩ C = {x | x ∈ B & x ∈ C} .
Нетрудно показать, что сумма B + C и пересечение B ∩ C подгрупп B и
C также являются подгруппами в группе A. Семейство всех подгрупп из
A, упорядоченное относительно включения, называется решеткой под-
групп. Решетка подгрупп обычно обозначается через L(A).

6
3 Понятие изоморфизма
Какие абелевы группы A и B считать одинаковыми, а какие — разными?
Для ответа на этот фундаментальный вопрос нам потребуется формали-
зовать понятие одинакового строения. Естественно считать две группы A
и B одинаковыми, если они различаются лишь обозначением элементов.
Так как понятие «переобозначение» было у нас формализовано с помо-
щью понятия «биекция», то понятие «одинаковые» может быть опреде-
лено следующим образом:
Будем говорить, что абелевы группы A и B изоморфны и писать A ≃ B,
если существует такая биекция f : A → B, что

f (x + y) = f (x) + f (y)

для любых x, y ∈ A.

4 Прямые суммы
Существует конструкция, позволяющая по семейству абелевых групп
Ai , i ∈ I построить новую абелеву группу A, которая называется (внеш-
ней) прямой суммой семейства Ai , i ∈ I. Для упрощения записи мы да-
дим определение этой конструкции лишь в случае конечного множества
индексов I = {1, 2, . . . , n}. Впрочем, в дальнейшем нами будет использо-
ваться только этот случай.
На прямом произведении множеств A1 , . . . , An

A1 × . . . × An = {(a1 , . . . , an ) | ai ∈ Ai , i = 1, . . . , n}

определим операцию сложения

(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ).

Легко проверить, что эта операция удовлетворяет условиям (A1)–(A4).


Поэтому множество A1 × . . . × An с данной операцией покоординатного
сложения образует абелеву группу A, которая и называется (внешней)
прямой
L суммой абелевых групп Ai , i ∈ I и обозначается через A1 ⊕. . .⊕An
или i∈I Ai .
Заметим, что множества

A∗i = {0, 0, . . . , ai , . . . , 0) | ai ∈ Ai }

являются подгруппами в прямой сумме A1 ⊕ . . . ⊕ An , причем

7
1) A∗i ≃ Ai ,

2) A1 ⊕ . . . ⊕ An = A∗1 + . . . + A∗n ,

3) для любых ai ∈ A∗i , i = 1, . . . , n

a1 + . . . + an = 0 ⇒ ai = 0, i = 1, . . . , n.

Сделанное нами наблюдение позволяет дать внутреннее определение пря-


мой суммы:
Пусть A — абелева группа и A1 , . . . , An — некоторое семейство подгрупп
из A. Будем говорить, что A есть (внутренняя) прямая сумма подгрупп
A1 , . . . , An , если выполнены два условия

1) A = A1 + . . . + An ,

2) для любых ai ∈ Ai , i = 1, . . . , n

a1 + . . . + an = 0 ⇒ ai = 0, i = 1, . . . , n.

В дальнейшем, второе условие мы будем для краткости называть линей-


ной независимостью подгрупп A1 , . . . , An .
Теорема (о прямой сумме абелевых групп). Если абелева группа A есть
внутренняя прямая сумма своих подгрупп A1 , . . . , An , то группа A изо-
морфна внешней прямой сумме групп A1 , . . . , An .

Доказательство. Положим A∗ = A1 ⊕ . . . ⊕ An и покажем, что A∗ ≃ A.


С этой целью определим отображение f : A∗ → A следующим образом:

f (a1 , . . . , an ) = a1 + . . . + an .

1) f — сюръекция.
Действительно, пусть a ∈ A. Так как A = A1 + . . . + An , то найдутся
такие ai ∈ Ai , i = 1, . . . , n, что

a = a1 + . . . an ,

значит f (a1 , . . . , an ) = a1 + . . . + an = a.
2) f — инъекция.
Пусть f (a1 , . . . , an ) = f (a′1 , . . . , a′n ). Тогда

a1 + . . . + an = a′1 + . . . + a′n

8
и
(a1 − a′1 ) + . . . + (an − a′n ) = 0.
В силу линейной независимости подгрупп Ai получаем ai − a′i = 0 или
ai = a′i для i = 1, . . . , n.
Итак, f — биекция. Ясно, что f сохраняет операцию:

f ((a1 , . . . , an ) + (b1 , . . . , bn )) = f (a1 + b1 , . . . , an + bn ) =


= (a1 + b1 ) + . . . + (an + bn ) =
= (a1 + . . . + an ) + . . . + (b1 + . . . + bn ) =
= f (a1 , . . . , an ) + f (b1 , . . . , bn ).

Значит f — изоморфизм и заключение теоремы справедливо.


Замечание. Обычно опускают слова «внешняя» или «внутренняя» перед
прямой суммой. Ясно, что если речь идет о подгруппах, то прямая сумма
является внутренней.

5 Конечнопорождённые абелевы группы


Простейшим примером конечнопорожденной группы является цикличе-
ская группа, т.е. абелева группа, порожденная одним элементом.
Если абелева группа A порождается одним элементом a, то множество
A совпадает с множеством всех кратных a:

A = {na | n ∈ Z} .

Возможны два случая.


Случай 1. Все кратные a различны.
В этом случае группа A изоморфна группе целых чисел Z относитель-
но сложения. В самом деле, отображение f : Z → A, определенное по
правилу f (n) = na является в случае 1 биекцией и, согласно свойству
кратных, сохраняет операцию:

f (n + m) = (n + m)a = na + ma = f (n) + f (m).

Следовательно, f — изоморфизм.
Случай 2. Некоторые кратные a совпадают, т.е. na = ma для некоторых
различных n, m ∈ Z.
В этом случае (n − m)a = 0 и значит некоторое кратное ka = 0 для k 6=
0. Тогда и −ka = 0 и значит среди натуральных кратных {na | n ∈ N}

9
найдется нулевой элемент. Пусть l — наименьшее натуральное число, для
которого la = 0. Тогда легко увидеть, что

A = {0, a, 2a, . . . , (l − 1)a} ,

т.е. A состоит из l элементов, причем сложение элементов из A происхо-


дит по правилу
n1 a + n2 a = n3 a,
где n3 = n1 + n2 , если n1 + n2 < l и
n3 = n1 + n2 − l, если n1 + n2 ≥ l.
Замечание. Понятно, что абелева группа A, представимая в виде прямой
суммы циклических подгрупп

A = ha1 i ⊕ ha2 i ⊕ . . . ⊕ han i,

является конечнопорожденной.

Действительно, в этом случае A = ha1 , . . . , an i.


Оказывается, справедливо и обратное утверждение, которое будет дока-
зано позже: любая конечнопорожденная абелева группа представима в
виде прямой суммы циклических подгрупп.

6 Графы групп
Существует способ наглядного представления абелевой группы, который
нзывается графом Кэли группы. Пусть A — абелева группа, порожден-
ная множеством элементов S. Определим с помощью A и S ориентиро-
ванный граф Γ = Γ(V, E), полагая V = A и E = {(x, y) | y − x ∈ S}.
Здесь под V понимается множество вершин графа Γ, а под E — мно-
жество ориентированных ребер графа Γ. Например, беря в качестве S
порождающий элемент циклической группы, мы получаем ориентиро-
ванные графы двух видов (Рис. 1 и 2).
... b b b b b ...

Рис. 1: Бесконечная циклическая группа.

Рассмотрим более сложный случай A = ha1 i ⊕ ha2 i и S = {a1 , a2 }. Воз-


можные в этом случае графы Кэли показаны на рис. 3, 4 и 5.

10
b

b b

b b

b b

Рис. 2: Циклическая группа порядка 8.

b b b b b

b b b b b

b b b b b

a1
b b b b b

a2

Рис. 3: A = C∞ × C∞ , |a1 | = |a2 | = ∞.

11
b
b
b
b
b

b
b
b
b
b

b
b
b
b
b

b
b
b
b
b

a1 b
b

b
a2 b
b

b
b
b
b
b

b
b
b
b
b

Рис. 4: A = C∞ × Cn , |a1 | = ∞, |a2 | = n.

b
b

b
b
b
b
b

b
b

b
b b
b b
b
b b
b b b
b
b
b b

b
b
b
b b b
b
b
b

b b
b b b
b
b
b
b
b
b

a1 b
b

b
a2 b

b
b

Рис. 5: A = Cn × Cm , |a1 | = n, |a2 | = m.

12
7 Морфизмы
Пусть A и B — абелевы группы. Отображение f : A → B называется
гомоморфизмом, если

f (x + y) = f (x) + f (y).

Понятно, что понятие гомоморфизма обобщает понятие изоморфизма.


Гомоморфизм f есть изоморфизм в том и только том случае, когда f —
биекция.
Множество f (A) = {f (x) | x ∈ A} называется образом f и часто обозна-
чается через Im f .
Множество {x ∈ A | f (x) = 0} называется ядром f и обозначается через
Ker f .
Теорема. Для любых A и B и любого гомоморфизма f : A → B спра-
ведливы следующие утверждения:

1) Im f — подгруппа в B,

2) Ker f — подгруппа в A.

Доказательство. 1) f (0) = f (0 + 0) = f (0) + f (0) ⇒ f (0) = 0 ⇒ 0 ∈


Im f .
Пусть a, b ∈ Im f ⇒ ∃x, y ∈ A : a = f (x) и b = f (y) ⇒
⇒ a + b = f (x) + f (y) = f (x + y) ∈ Im f .
Пусть a ∈ Im f ⇒ ∃x ∈ A : a = f (x) ⇒ 0 = f (0) = f (x − x) =
= f (x) + f (−x) ⇒ −f (x) = f (−x) ⇒ −a = f (−x) ∈ Im f .
2) 0 ∈ Ker f .
x, y ∈ Ker f ⇒ f (x) = 0 и f (y) = 0 ⇒ f (x + y) = f (x) + f (y) =
= 0 + 0 = 0 ⇒ x + y ∈ Ker f .
x ∈ Ker f ⇒ f (x) = 0 ⇒ f (−x) = 0 ⇒ −x ∈ Ker f .
Замечание. Im f можно рассматривать как уменьшенную копию A.

Гомоморфизм f : A → A называется эндомонфизмом группы A. Если


f — биекция, то f называется автоморфизмом группы A.
Теорема. 1) Произведение двух эндоморфизмов есть эндоморфизм;

2) Произведение двух автоморфизмов есть автоморфизм.

13
Доказательство. Пусть f : A → A и g : A → A — эндоморфизмы
группы A. Тогда

f (g(x + y)) = f (g(x) + g(y)) = f (g(x)) + f (g(y)).

Отсюда следует заключение теоремы.

8 Факторгруппы
Пусть A — произвольная абелева группа и B 6 A. Для произвольного
a ∈ A положим
B + a = {x + a | x ∈ B} .
Множество B + a называется смежным классом подгруппы B или сдви-
гом B на элемент a.
Теорема 1. Семейство всех сдвигов B образует разбиение группы A.
S
Доказательство. 1. a ∈ B + a для любого a ⇒ a∈A (B + a) = A, т.е.
все сдвиги покрывают A.
2. Пусть (B + a) ∩ (B + c) 6= ∅ и x ∈ (B + a) ∩ (B + c). Тогда x = b1 + a
и x = b2 + c для некоторых b1 , b2 ∈ B ⇒ a − c ∈ B ⇒ a = b + c для
некоторого b ∈ B ⇒ B+a = (B+b)+c. Но B+b = B ⇒ B+a = B+c.
Теорема 2. Все сдвиги B равномощны.

Доказательство. Достаточно показать, что |B + a| = |B| для произ-


вольного a ∈ A. Определим отображение f : B → B + a следующим
образом:
f (x) = x + a.
Легко проверить, что f — биекция, откуда и следует равномощность
сдвигов.
Следствие. Если A — конечная абелева группа, то порядок любой её
подгруппы делит порядок всей группы. В частности, абелева группа
простого порядка содержит лишь тривиальные подгруппы и, следова-
тельно, является циклической.

Обозначим семейство всех сдвигов через A/B и определим на этом мно-


жестве A/B операцию сложения следующим образом:

(B + x) + (B + y) = B + (x + y).

14
Данная операция определена корректно, т.к. не зависит от выбора пред-
ставителей x и y смежных классов. Проверкой можно убедиться в том,
что A/B относительно этой операции сложения образует абелеву группу,
которая называется факторгруппой группы A по подгруппе B.

Теорема. Пусть f — гомоморфизм абелевой группы A в произвольную


абелеву группу C. Тогда

A/Ker f ≃ Im f.

15
Лекция 3. Кольца.

1 Определение
Кольцом называется множество R с операциями сложения и умножения,
обладающими следующими свойствами:

(R1) (R, +) — абелева группа,

(R2) a(bc) = ab(c) для любых a, b, c ∈ R (ассоциативность),

(R3) a(b + c) = ab + ac и (a + b)c = ac + bc для любых a, b, c ∈ R (дистри-


бутивность).

Замечание. Если ab = ba для a, b ∈ R, то R называется коммутативным.


Если (R, ·) содержит единицу, то R — кольцо с единицей.

Подмножество L ⊂ R называется подкольцом в R, если

1) (L, +) 6 (R, +),

2) x, y ∈ L ⇒ xy ∈ L.

Примеры

2Z — кольцо четных чисел.


Z — кольцо целых чисел.
Q — кольцо рациональных чисел.
R — кольцо действительных чисел.
2Z ⊂ Z ⊂ Q ⊂ R — цепочка подколец. Это коммутативные кольца.
Кольцо 2Z без 1.

Простейшие следствия

1. a · 0 = 0 · a = 0.
В самом деле, a · 0 = a(0 + 0) = a · 0 + a · 0 ⇒ a · 0 = 0. Аналогично
0 · a = 0.

2. a(−b) = (−a)b = −ab.


Действительно, ab + a(−b) = a(b + (−b)) = a · 0 = 0 ⇒ a(−b) = −ab.
Аналогично (−a)b = −ab.

16
3. a(b − c) = ab − ac и (a − b)c = ac − bc.
В самом деле

a(b − c) + ac = a(b − c + c) = ab ⇒ a(b − c) = ab − ac.

Аналогично (a − b)c = ac − bc.

2 Делители нуля
Пусть R — кольцо. Элемент a ∈ R называется левым (правым) делителем
нуля, если существует такой ненулевой b ∈ R, что ab = 0 (ba = 0).
Говорят, что кольцо R без делителей нуля, если ab = 0 ⇒ a = 0 или b =
0.
Теорема. Пусть R — ненулевое конечное кольцо без делителей нуля.
Тогда:

1) R имеет единицу;
2) все ненулевые элементы обратимы

(т.е. все ненулевые элементы образуют группу относительно умноже-


ния).

Доказательство. Положим R# = R − 0.
Этап 1. Существование идемпотента (∃e ∈ R# : e2 = e).
Пусть a ∈ R# . Рассмотрим степени an = |a · .{z
. . · a}, n ∈ N. Так как R —
n
конечное кольцо, то ∃n, m ∈ N : an = an+m ⇒ an = an · am = an · a2m =
= . . . = an · akm для любого k ∈ N. Выберем такое k, что km > n. Тогда
an = an · akm ⇒ an · akm−n = an · akm · akm−n ⇒
⇒ akm = a2km ⇒ e = akm — идемпотент.

Этап 2. Биективность сдвигов: x → ax и x → xa.


Пусть a ∈ R# . Рассмотрим два отображения R# → R# :

x → ax (левый сдвиг) x → xa (правый сдвиг).

Покажем, что отображение x → ax — биекция R# . Так как R конечно,


достаточно показать, что

x 6= y ⇒ ax 6= ay.

17
В самом деле, пусть ax = ay ⇒ ax − ay = 0 ⇒ a(x − y) = 0 ⇒ x − y =
0 ⇒ x = y.
Аналогично доказывается биективность отображения x → xa.
(Т.е. доказана разрешимость уравнений xa = b и ax = b ∀a, b ∈ R# ).
Этап 3. Существование 1.
Покажем, что e = 1. Пусть a ∈ R# . Согласно (2),
∃x, y ∈ R# : a = ex и a = ye ⇒ ea = e(ex) = (ee)x = ex = a.
Аналогично ae = (ye)e = y(ee) = ye = a. Значит e = 1.
Этап 4. Обратимость элементов.
Пусть a ∈ R# . Согласно (2), найдутся такие b1 и b2 , что ab1 = 1 и b2 a = 1.
Покажем, что b1 = b2 :

b1 = 1 · b1 = (b2 a)b1 = b2 (ab1 ) = b2 · 1 = b2 .

3 Кольца вычетов
Пусть n ∈ N, n > 2. Рассмотрим следующие множества целых чисел,
которые будем называть вычетами по модулю n:

[0] = {kn | k ∈ Z}
[1] = {kn + 1 | k ∈ Z}
..
.
[n − 1] = {kn + n − 1 | k ∈ Z} .

Если числа a и b лежат в одном вычете, то будем говорить, что a и b


сравнимы по модулю n и писать a ≡ b (mod n). Ясно, что

a ≡ b (mod n) ⇔ n|a − b

Свойства сравнений

. Если a ≡ a′ (mod n) и b ≡ b′ (mod n), то

1) a + b ≡ a′ + b′ (mod n),

2) ab ≡ a′ b′ (mod n).

18

a ≡ a′ (mod n) n | a − a′
Доказательства. 1) ⇒ ⇒
b ≡ b′ (mod n) n | b − b′
⇒ n|(a − a′ ) + (b − b′ ) ⇒ n|(a + b) − (a′ + b′ ) ⇒ a + b ≡ a′ + b′ (mod n).

a ≡ a′ (mod n) n | a − a′
2) ⇒ ⇒ n|b(a − a′ ) + a′ (b − b′ ) ⇒
b ≡ b′ (mod n) n | b − b′
⇒ n|ab − a′ b′ ⇒ ab ≡ a′ b′ (mod n).

Таким образом, мы можем определить на множестве вычетов операции


сложения и умножения по формулам:

[a] + [b] = [a + b] , [a] · [b] = [ab].

Относительно этих операций множество вычетов превращается в кольцо,


которое называется кольцом вычетов по модулю n и обозначается Zn .
Zn — конечное коммутативное кольцо с 1 ([1]). Оно имеет n элементов.
Нулевой элемент — [0] — нулевой вычет.

Теорема. Кольцо Zn без делителей нуля ⇔ n — простое.

Доказательство. ⇒ (от противного). Пусть n = n1 n2 , n1 , n2 > 1. Тогда


n1 6≡ 0 (mod n), n2 6≡ 0 (mod n), но n1 n2 ≡ n ≡ 0 (mod n). Противоречие.
⇐. Пусть ab ≡ 0 (mod n) ⇒ n|ab. Так как n — простое, то n|a или n|b
⇒ a ≡ 0 (mod n) или b ≡ 0 (mod n).

19
Лекция 4. Поля.

1 Определение
Полем называется коммутативное кольцо, в котором множество всех
ненулевых элементов является (абелевой) группой относительно умно-
жения.

Примеры

Q — поле рациональных чисел.


R — поле вещественных чисел.
Поле является кольцом без делителей нуля. В самом деле, пусть ab = 0.
Если a 6= 0, то ∃a−1 : a−1 a = 1 ⇒ a−1 (ab) = a−1 0 ⇒ b = 0.
Заметим, обратное в общем случае неверно. Например, Z — коммутатив-
ное кольцо без делителей нуля, но Z не является полем.
В случае конечного кольца обратное утверждение, согласно теореме о
кольцах без делителей нуля, верно.
Теорема. Конечное коммутативное кольцо R является полем тогда и
только тогда, когда R без делителей нуля и R 6= 0.
Следствие. Кольцо вычетов Zn являетяс полем тогда и только тогда,
когда n — простое.

Пусть F — поле. Подмножество L ⊂ F называется подполем поля F ,


если

1) (L, +) 6 (F, +),

2) (L, ·) 6 (F, ·).

Например, поле Q является подполем поля R.

2 Характеристика поля
В некоторых полях, например в поле Zp , выполняется равенство

1| + .{z
. . + 1} = 0.
p

20
Этот факт необходимо учитывать, делая преобразования выражений. С
этой целью введем понятие характеристики поля.
Пусть F — произвольное поле. Наименьшее натуральное число n, для
которого
1| + .{z
. . + 1} = 0,
n
будем называть характеристикой поля. Если такого n не существует, то
характеристика поля считается равной 0. Обозначение: char F .
Например, char Q = 0, char R = 0, char Zp = p > 0.
Если char F = n > 0, то n — простое число. В самом деле, пусть n =
km, k > 1 и m > 1. Тогда
. . . 1} = (1 + . . . + 1) (1 + . . . + 1),
1| +{z
| {z }| {z }
n k m

и значит либо 1| + .{z . . + 1} = 0, что противоречит


. . + 1} = 0, либо 1| + .{z
k m
выбору n.
Рассмотрим одну формулу, где проявляется особенность полей ненулевой
характеристики. Пусть, например, char F = 2. Тогда
(a + b)2 = a2 + 2ab + b2 = a2 + b2 .
Более общо, если char F = p, то
(a + b)p = ap + bp .
В самом деле,
p  
p
X p
(a + b) = ap−k bk .
k
k=0
 
p
Но , при 0 < k < p, делится на p. Следовательно, все слагаемые,
k
кроме первого и последнего, равны 0.

3 Поле комплексных чисел


На множестве C = {(x, y) | x, y ∈ R} определим операции сложения и
умножения по правилам
(a, b) + (a′ , b′ ) = (a + a′ , b + b′ ),
(a, b) · (a′ , b′ ) = (aa′ − bb′ , ab′ + a′ b).

21
Рутинная проверка показывает, что в C выполнены все свойства опера-
ций из определения поля. Значит, (C, +, ·) — поле, которое называется
полем комплексных чисел.
Комплексные числа изображают точками на плоскости в прямоугольной
системе координат. Эту плоскость называют комплексной плоскостью.
y

c = (a, b)
b
r

ϕ
0 a x


Рис. 6: r = |c| = a2 + b2 (модуль c), ϕ = arg c (аргумент c), a = r cos ϕ ,
b = r sin ϕ.

Заметим, что
(a, 0) + (a′ , 0) = (a + a′ , 0),
(a, 0) · (a′ , 0) = (aa′ , 0).
Отсюда следует, что ось абсцисс образует подполе в C, изоморфное полю
R.
Множество {(0, b) | b ∈ R} замкнуто относительно сложения, но не за-
мкнуто относительно умножения:
(0, b) · (0, b′ ) = (−bb′ , 0).

Алгебраическая форма

Удобнее проводить вычисления, представляя комплексное число в так


называемой алгебраической форме
(a, b) → a + bi
и работая с ним, как с обычным буквенно-цифровым выражением. Прав-
да, при этом пользуются соглашением: i2 = −1.
(a + bi) + (a′ + b′ i) = (a + a′ ) + (b + b′ )i,
(a + bi) · (a′ + b′ i) = (aa′ − bb′ ) + (ab′ + a′ b)i.

22
Число a называется вещественной частью комплексного числа a + bi,
число b — мнимой частью.

Тригонометрическая форма

Так как a = r cos ϕ, b = r sin ϕ, то от алгебраической записи можно


перейти к другой
a + bi = r(cos ϕ + i sin ϕ),
которая называется тригонометрической формой записи. Эту форму удоб-
но использовать при умножении, возведении в степень и извлечении кор-
ня. Действительно,

r(cos ϕ + i sin ϕ) · r ′ (i cos ϕ′ + i sin ϕ′ ) =


= rr ′(cos(ϕ + ϕ′ ) + i sin(ϕ + ϕ′ )) , т.е. справедлива

Теорема (о модуле и аргументе произведения). 1) |c1 · c2 | = |c1 | · |c2 |,

2) arg(c1 · c2 ) = arg c1 + arg c2 .

В частности,

(r(cos ϕ + i sin ϕ))n = r n (cos nϕ + i sin nϕ).

Эта формула называется формулой Муавра.


С помощью формулы Муавра можно найти все корни n-й степени из
комплексного числа c. Если r = |c| и ϕ = arg c, то
 
√ √ ϕ + 2πk ϕ + 2πk
n
c = r cos
n
+ i sin , где k = 0, 1, . . . , n − 1.
n n
Все эти n корней лежат в вершинах правильного n-угольника с центром
в начале координат.

Комплексное сопряжение

Отображение c = a + bi → c = a − bi называется комплексным сопряже-


нием. Число c называется сопряженным с числом c. Нетрудно доказать
следующие свойства сопряжения:

1) c = c;

2) c = c ⇔ c ∈ R;

23
y
ε1
ε2

ε0 = 1
0 x
ε3
ε4


Рис. 7: 5 корней 5
1 = {ε0 , ε1, ε2 , ε3 , ε4 } , εk = cos 2πk
5
+ i sin 2πk
5
,k =
0, 1, 2, 3, 4.

3) c1 + c2 = c1 + c2 ;

4) c1 c2 = c1 · c2 ;

5) c + c ∈ R;

6) c · c ∈ R.

Вообще говоря, отображение ϕ : F → F называется автоморфизмом


поля F , если

1) ϕ — биекция,

2) ϕ(x + y) = ϕ(x) + ϕ(y),

3) ϕ(xy) = ϕ(x) · ϕ(y)

для любых x, y ∈ F .
Автоморфизм ϕ поля F называется инволютивным, если ϕ(ϕ(x)) = x
для любого x ∈ F .
Из свойств комплексного сопряжения следует, что отображение c → c
является инволютивным автоморфизмом поля C.

24
Лекции 5-6. Кольца многочленов.

1 Определение
Для произвольного поля F построим множество всех выражений вида

f = a0 xn + a1 xn−1 + . . . + an−1 x + an , ai ∈ F.
Сами выражения будем называть многочленами, символ x — перемен-
ной, элементы поля ai — коэффициентами многочлена, ненулевой коэф-
фициент с наименьшим индексом — старшим коэффициентом, а степень
переменной x, стоящей после старшего коэффициента, — степенью мно-
гочлена f . Обозначение deg f .
Два многочлена называются равными, если они имеют равные коэффи-
циенты перед равными степенями переменной. Слагаемые с нулевыми
коэффициентами могут добавляться или удаляться произвольным обра-
зом. Многочлен с нулевыми коэффициентами называется нулевым, а его
степень полагаем равной −∞.
На множестве многочленов определим операции сложения и умножения,
полагая
(f + g)k = P(f )k + (g)k ,
(f g)k = i+j=k (f )i (g)j .

Здесь через (f )k и (g)k обозначены коэффициенты перед xk в многочле-


нах f и g.
Другими словами, многочлены складывают и перемножают по обычным
школьным правилам оперирования с буквенно-цифровыми выражения-
ми.
Нетрудно показать, что операции сложения и умножения обладают все-
ми свойствами операций кольца. Поэтому множество многочленов обра-
зует кольцо, которое называется кольцом многочленов над полем F и
обозначается через F [x]. Заметим, что кольцо F [x] коммутативно, без
делителей нуля и содержит 1.
Существует и другая точка зрения на многочлены, рассматривающая
их как некоторые отображения, например, поля F в F . Действительно,
подставив вместо переменной x какой-нибудь элемент a ∈ F , мы можем
вычислить элемент f (a), который называется значением f в точке a.
Таким образом определено отображение f : F → F .
Очевидно, что равные многочлены из кольца F [x] индуцируют одно и то
же отображение, но обратное верно не всегда. Например, многочлены x

25
и x2 из кольца Z2 [x] индуцируют тождественное отображение поля Z2 .
Понятно, что с помощью многочлена f ∈ F [x] можно определить не
только отображение f : F → F , но и отображения f : R → R для
любого кольца R, содержащего поле F . Например, любой многочлен из
R[x] индуцирует некоторое отображение C в C.
Далее нам потребуется один полуочевидный результат, который мы при-
водим без доказательства, хотя и простого, но достаточно формального.
Теорема (о замене переменной). Все соотношения между многочлена-
ми из F [x], получающиеся при сложении и умножении, остаются в
силе при замене x на произвольный элемент из коммутативного коль-
ца R, содержащего поле F . Точнее, пусть F ⊂ R, f, g ∈ F [x], a ∈ R.
Тогда
f (x) + g(x) = h(x) ∈ F [x] f (a) + g(a) = h(a)

f (x) · g(x) = s(x) ∈ F [x] f (a) · g(a) = s(a).

Пример. В кольце многочленов с рациональными коэффициентами спра-


ведливо разложение x2 − 1 = (x − 1)(x + 1). Значит для любого действи-
тельного числа a выполнено равенство a2 − 1 = (a − 1)(a + 1).
Другой результат, доказательство которого мы также опускаем, очень
активно используется в теории многочленов.
Теорема (свойства степеней). Пусть f, g ∈ F [x]. Тогда

1) deg(f + g) 6 max {deg f, deg g},


2) deg f g = deg f + deg g.

Из свойства 2 степеней становится понятно, почему степени нулевого


многочлена присвоено такое странное значение −∞.

2 Понятие делимости
Пусть F — произвольное поле и f, g ∈ F [x]. Говорят, что многочлен f
делит многочлен g (обозначение f |g), если существует такой многочлен
h ∈ F [x], что
g = f · h.
Замечание. Наряду с термином делит используется термин делится.
Утверждение «многочлен g делится на многочлен f » означает, что f
делит g.

26
Отметим простейшие свойства делимости.

1) f |g ⇒ f |gh для любого h ∈ F [x],

2) f |g и g|h ⇒ f |h,

3) f |g и f |h ⇒ f |g + h,

4) f |gi , i = 1, . . . , m ⇒ f |h1 g1 + . . . + hm gm для любых hi ∈ F [x].

Аналогом понятия простого числа из арифметики целых чисел является


понятие неприводимого многочлена: говорят, что многочлен f ∈ F [x]
неприводим в кольце F [x], если deg f > 1 и f нельзя представить в
виде произведения многочленов из F [x] степеней < deg f . Очевидно, что
любой многочлен степени > 1 разложим в произведение неприводимых
многочленов.
Один из первых вопросов, возникающих в теории многочленов, — это
вопрос об однозначности такого разложения. Для ответа на него нам
потребуется развить определенную технику, основанную на делении с
остатком и изложенную в следующих разделах лекции.
Далее нам потребуются также следующие понятия. Многочлены f и g
называются ассоциированными, если f |g и g|f . Понятно, что многочлены
f и g ассоциированы в том и только том случае, когда f = h · g для
некоторого многочлена нулевой степени h ∈ F [x].
Наибольшим общим делителем многочленов f, g ∈ F [x] называется их
общий делитель, делящийся на все их общие делители. Он обозначается
через НОД(f, g). Таким образом d = НОД(f, g), если выполнены два
условия:

1) d|f и d|g,

2) c|f и c|g ⇒ c|d.

Ясно, что вместе с d условиям 1 и 2 удовлетворяет любой ассоциирован-


ный с ним многочлен. Обратно, если c и d — два наибольших делителя
многочленов f и g, то c|d и d|c, так что c и d ассоциированы. Обозна-
чение НОД(f, g) относится к любому из них, т.е. в этой записи ассоци-
ированные многочлены не различаются. С учетом этого соглашения мы
формулируем простейшие свойства НОД.

1) НОД(f, g) = f ⇔ f |g,

27
2) НОД(0, f ) = f .

Замечание. Из определения НОД не следует его существование. Это бу-


дет сделано в следующем разделе.

Многочлены f и g называются взаимно простыми, если НОД(f, g) =


1. Из определения неприводимого многочлена следует, что для любого
неприводимого многочлена f и произвольного многочлена g справедливо
одно из двух утверждений: НОД(f, g) = 1 или f |g.

3 Теория делимости
Теорема (о делении с остатком). Для любых f, g ∈ F [x], где g 6= 0,
существуют однозначно определенные q, r ∈ F [x] такие, что

1) f = qg + r,

2) deg r < deg g.

При этом q называется целой частью, r — остатком от деления f на


g. Очевидно, r = 0 ⇔ g|f .

Доказательство. Существование (индукцией по n = deg f ).


База индукции. n = −∞ ⇒ f = 0 ⇒ q = r = 0.
Шаг индукции. Пусть n > 0 и допустим, что существование q и r
справедливо для многочленов степени < n. Тогда, если deg f < deg g, то
полагаем q = 0, r = f . В случае deg f > deg g рассмотрим многочлен
f1 = f − ab00 xn−m g, где a0 и b0 — старшие коэффициенты f и g, m = deg g.
Ясно, что deg f1 < deg f и, согласно индуктивному предположению, f1 =
q1 g + r, где q1 , r ∈ F [x] и deg r < deg g. Значит
a0 n−m a0
f = f1 + x g = (q1 g + r) + xn−m g = qg + r,
b0 b0
a0 n−m
где q = q1 + b0
x .
Единственность. Пусть f = q1 g + r1 = q2 g + r2 , где deg ri < deg g, i =
1, 2. Тогда r1 − r2 = (q2 − q1 )g. Если q2 − q1 6= 0, то

deg(r1 − r2 ) = deg(q2 − q1 ) + deg g > deg g,

что неверно. Значит q1 = q2 и r1 = r2 .

28
Замечание. Из доказательства теоремы следует: если коэффициенты f
и g лежат в некотором подполе L ⊂ F , то и коэффициенты многочленов
q и r лежат в этом же L.
Теорема (алгоритм Евклида для НОД). Для любых f1 , f2 ∈ F [x], где
f2 6= 0, существует НОД(f1 , f2 ) = d, причем d = af1 +bf2 для некоторых
a, b ∈ F [x].

Доказательство. Доказательство теоремы дается конструктивное. Пред-


ложенный алгоритм нахождения НОД называется алгоритмом Евклида.
Используя теорему о делении с остатком, построим последовательность
многочленов f1 , f2 , . . ., где fi+1 — остаток от деления fi−1 на fi для i > 2.
Так как deg fi > deg fi−1 для i > 2, то для некоторого n мы получим
fn+1 = 0 и построение последовательности остановится.

f1 = q1 f2 + f3
f2 = q2 f3 + f4
...
fn−2 = qn−2 fn−1 + fn
fn−1 = qn−1 fn .

Докажем, что последний ненулевой остаток fn и есть НОД(f1 , f2 ). Дей-


ствительно, fn |fn−1 ⇒ fn |fn−2 ⇒ . . . ⇒ fn |f2 ⇒ fn |f1 . Значит
fn — общий делитель f1 и f2 . Далее, из полученных равенств мы можем
выразить fn через f1 и f2

fn = af1 + bf2 ,

где a, b ∈ F [x]. Поэтому fn делится на любой общий делитель f1 и f2 .

Следствие (критерий взаимной простоты).

НОД(f, g) = 1 ⇔ ∃a, b ∈ F [x] : af + bf = 1.

С помощью полученного критерия взаимной простоты мы докажем несколь-


ко важных свойств взаимно простых многочленов.

Теорема (свойства взаимно простых многочленов). Пусть f, g, h ∈ F [x].


Тогда

1) если НОД(f, g) = 1 и НОД(f, h) = 1, то НОД(f, gh) = 1,

2) если f |gh и НОД(f, g) = 1, то f |h,

29
3) если g|f, h|f и НОД(g, h) = 1, то gh|f .

Доказательство. 1) Согасно критерию взаимной простоты имеем равен-


ства
a1 f + b1 g = 1 и a2 f + b2 h = 1.
Перемножая их левые и правые части, получаем

(a1 f + b1 g)(a2 f + b2 h) = 1 ⇒ a3 f + b3 gh = 1,

где a3 = a1 a2 f + a1 b2 h + a2 b1 g, b3 = b1 b2 . Снова воспользовавшись крите-


рием, получаем НОД(f, gh) = 1.
2) Имеем af +bg = 1, откуда af h+bgh = h. Но f |gh ⇒ gh = cf, c ∈ F [x].
Значит h = af h + bcf = f (ah + bc) ⇒ f |h.
3) g|f ⇒ f = ag для некоторого a ∈ F [x]. h|f ⇒ h|ag. Учитывая
НОД(h, g) = 1 и применяя пункт 2 теоремы, получаем h|a ⇒ a = bh ⇒
f = bhg ⇒ gh|f .

Следствие. Неприводимый многочлен, делящий произведение много-


членов, делит и какой-либо из сомножителей.

Доказательство. Пусть неприводимый многочлен f делит произведение


gh. Если f не делит g, то НОД(f, g) = 1 и, согласно пункту 2 заключения
теоремы, f |h.

Теорема (об однозначности разложения). Любой многочлен f ∈ F x


степени > 1 можно представить в виде

f = ap1 p2 . . . pk ,

где a — многочлен нулевой степени, pi — неприводимые многочлены


(не обязательно различные). Причем из существования другого такого
разложения
f = bq1 q2 . . . qm
следует, что k = m и при надлежащей нумерации pi и qj многочлен pi
ассоциирован с qi .

Доказательство. Существование разложения на неприводимые сомно-


жители, как уже отмечалось выше, следует из определения неприводимо-
го многочлена и свойств степеней многочленов. Докажем единственность
такого разложения индукцией по числу k неприводимых множителей.

30
База индукции. k = 1. В этом случае f = ap1 и из q1 |f следует, что p1
и q1 — ассоциированы и deg q1 = deg f . Значит m = 1.
Шаг индукции. Пусть k > 1 и заключение теоремы для разложений
на меньшее число сомножителей верно. Согласно следствию из теоремы
о свойствах взаимно простых многочленов, неприводимый многочлен p1
ассоциирован с одним из неприводимых многочленов qi . Без потери общ-
ности рассуждений можно считать, что p1 = q1 , и следовательно

ap1 p2 . . . pk = bp1 q2 . . . qm ,

откуда p1 (ap2 . . . pk − bq2 . . . qm ) = 0. Воспользовавшись тем, что в кольце


F [x] нет делителей нуля, получаем

f1 = ap2 . . . pk = bq2 . . . qm .

Применяя индуктивное предположение к разложению многочлена f1 , по-


лучаем требуемое заключение.

4 Корни многочленов
Элемент c ∈ F называется корнем многочлена f ∈ F [x], если f (c) = 0.
Из теоремы о делении с остатком следует

Теорема (Безу). 1) Для любых f ∈ F [x] и c ∈ F остаток от деления


f на x − c равен значению f (c).

2) Элемент c ∈ F является корнем f ∈ F [x] ⇔ многочлен x − c


делит f .

Корень c многочлена f называется простым, если f не делится на (x−c)2


и кратным в противном случае. Кратностью корня c называется наи-
большее из чисел k, для которых f делится на (x − c)k .

Теорема (о числе корней). Число корней многочлена степени > 1 с


учетом их кратностей не превосходит степени многочлена, причем
равенство выполняется ⇔ многочлен разлагается на линейные мно-
жители.

Доказательство. Согласно теореме Безу мы имеем

f = (x − c1 )k1 (x − c2 )k2 . . . (x − cm )km g,

31
где c1 , . . . , cm — все различные корни f и g(ci ) 6= 0, i = 1, . . . , m. Так как
f = (x − ci )ki · hi , где hi (ci ) 6= 0, то ci — корень кратности ki . Следова-
тельно, число корней f с учетом их кратностей равно k1 + k2 + . . . + km =
deg f − deg g 6 deg f , откуда и следует заключение теоремы.

Следствие (о равенстве многочленов). Если многочлены f и g степеней


6 n индуцируют равные отображения поля F , содержащего более n
элементов, то f = g. В частности, разные многочлены индуцируют
разные отображения в случае бесконечного поля.

Доказательство. Допустим, что f (c) = g(c) для любого c ∈ F . Тогда


любой элемент поля является корнем мноогочлена f − g степени 6 n.
Согласно теореме о числе корней, число корней f − g 6 n, правда, в
случае deg(f −g) > 1. Так как число корней f −g больше n, то deg(f −g) <
1. Учитывая тот факт, что f (0) = g(0), получаем равенство f = g.

Мы знаем, что не любой многочлен f ∈ R[x] степени > 1 разлагается на


линейные множители. Например, f = x2 + 1. Для поля C дело обстоит
иначе:

Теорема (основная теорема кольца C[x]). Любой многочлен из C[x] сте-


пени > 1 разлагается на линейные множители.

Замечание. Согласно теореме Безу основная теорема равносильна сле-


дующему утверждению: любой многочлен из C[x] степени > 1 имеет
корень.

Существует еще одна переформулировка основной теоремы. Будем гово-


рить, что поле F алгебраически замкнуто, если любой многочлен из F [x]
степени > 1 имеет корень. Используя новый термин, мы можем сказать,
что поле C алгебраически замкнуто.
Доказательство основной теоремы будет изложено в курсе теории функ-
ций комплексного переменного (ТФКП).
Основная теорема имеет одно важное следствие для кольца R[x].

Следствие. Любой многочлен из R[x] разлагается в произведение мно-


гочленов степени 6 2.

Доказательство. Сначала докажем, что если c — корень многочлена


f ∈ R[x], рассматриваемого в поле C, то сопряженное комплексное число
c — также корень f .

32
Действительно, пусть f = a0 xn + a1 xn−1 + . . . + an , ai ∈ R, i = 1, . . . , n.
Если f (c) = 0, то f (c) = a0 cn + . . . + an−1 c + an . Напомним, что ai =
ai , xy = x · y и x + y = x + y для любых x, y ∈ C. Поэтому

f (c) = f (c) = 0 = 0

и, следовательно, c — корень f .
Заметим, если c 6= c, то многочлен f делится в кольце C[x] на произве-
дение взаимно простых многочленов (x − c)(x − c). Но многочлен

(x − c)(x − c) = x2 − (c + c)x + cc

имеет действительные коэффициенты c + c и cc из R. Поэтому, согласно


замечанию к теореме о делении с остатком, частное от деления f на (x −
c)(x − c) будет многочленом из R[x]. Отсюда и из теоремы Безу следует,
что многочлен f в кольце R[x] разлагается на линейные множители и
квадратичные множители с отрицательным дискриминантом.

5 Формальная производная
Для любого поля F определим отображение D : F [x] → F [x], сопостав-
ляя каждому многочлену f ∈ F [x] многочлен D(f ) ∈ F [x] по правилу

(D1) Если deg f 6 0, то D(f ) = 0.

(D2) Если deg f > 1 и f = a0 xn + a1 xn−1 + . . . + an−1 x + an , то

D(f ) = na0 xn−1 + (n − 1)a1 xn−2 + . . . + an−1 .

Отображение D называется формальным дифференцированием, а мно-


гочлен D(f ) — производной многочлена f , которую мы будем обозна-
чать, как обычно, через f ′ .

Теорема (свойства D). Пусть c, f, g ∈ F [x] и deg c 6 0. Тогда

1) (cf )′ = cf ′ ,

2) (f + g)′ = f ′ + g ′ ,

3) (f g)′ = f ′ g + f g ′.

33
Доказательство. Первые два свойства вытекают очевидным образом из
определения D. Докажем свойство 3.
Случай 1. f и g — одночлены.
Согласно свойству 1 достаточно рассмотреть случай f = xn и g = xm .

(f g)′ = (xn xm )′ = (xn+m ) = (n + m)xn+m−1 ,
f ′ g + f g ′ = (xm )′ xn + xm (xn )′ = mxm−1 xn + nxm xn−1 = (m + n)xn+m−1 .

В этом случае свойство 3 выполняется.


Случай 2. fP— одночлен.
Так как g = gi , где gi — одночлены, то
P ′ P ′ P
(f g)
P ′

= (f ( g i )) = (P f g i ) =
P (f gi )′ =
= (f gi + f gi′ ) = f ′ gi + f gi′ = f ′ g + f g ′.

Случай 3. Общий.
Представим теперь f в виде суммы одночленов и повторим рассуждения
из случая 2.

Теорема (необходимое условие кратности). Любой корень многочлена f


кратности > 2 является корнем и его производной f ′ .

Доказательство. Пусть f = (x−c)2 g. Тогда f ′ = ((x − c)2 ) g+(x−c)2 g ′ =
(x − c)(2g + (x − c)g ′). Следовательно, f ′ (c) = 0.

Следствие. Если многочлен взаимно прост со своей производной, то


он не имеет кратных корней.

34
Лекции 7-8. Матрицы.

1 Действия с матрицами
Пусть F — произвольное поле. Матрицей размера m × n над полем F
называется набор элементов поля, расположенных в виде таблицы из m
строк и n столбцов. Две матрицы называются равными, если они имеют
одинаковые размеры и равные элементы на одинаковых местах. Матри-
ца называется квадратной порядка n, если число её строк совпадает с
числом столбцов и равно n.
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
 
A =  .. .. . . .
 . . . 
am1 am2 . . . amn

Обозначения:

1) aij (или Aij ) — элемент матрицы A, стоящий в i-й строке и j-м


столбце;
2) M(m × n, F ) — множество всех матриц размера m × n над полем F ;
3) M(n, F ) — множество квадратных матриц порядка n над полем F ;
4) O — нулевая матрица, т.е. матрица с нулевыми элементами;
5) E — единичная матрица, т.е. квадратная матрица, все диагональ-
ные элементы aii которой равны 1, а все остальные — 0.

Умножение на элемент поля

Пусть A — произвольная матрица размера m × n над полем F и λ ∈ F .


Матрица C размера m × n называется произведением A на λ, если
Cij = λAij , Обозначение: C = λA.

Сложение

Пусть A и B — произвольные матрицы размера m × n над полем F .


Матрица C размера m × n называется суммой A и B, если
Cij = Aij + Bij , Обозначение: C = A + B.

35
Транспонирование

Пусть A — произвольная матрица размера m × n над полем F . Матрица


C размера n × m называется транспонированной к A, если

Cij = Aji , Обозначение: C = AT .

Умножение

Пусть A — произвольная матрица размера m × n над полем F , B —


произвольная матрица размера n × k над полем F . Матрица C размера
m × k называется произведением A и B, если
n
X
Cij = Aip Bpj , Обозначение: C = AB.
p=1

Теорема (свойства операций). Следующие равенства справедлиы для


любых матриц и элементов поля, для которых определены указанные
операции:

I. Свойства сложения матриц II. Свойства умножения матриц


1. A + (B + C) = (A + B) + C 1. A(BC) = (AB)C
2. A+B =B+A 2. A(B + C) = AB + AC
3. A+O =A 3. (A + B)C = AC + BC
4. A + (−1)A = O 4. AE = A
5. EA = A

III. Свойства умножения на эле- IV. Свойства умножения на эле-


мент поля и сложения мат- мент поля и умножения мат-
риц риц
1. α(A + B) = αA + αB 1. α(AB) = (αA)B = A(αB)
2. (α + β)A = αA + βA
3. (αβ)A = α(βA)
4. 1·A=A

V. Свойства транспонирования
T
1. AT = A
2. (αA)T = αAT
3. (A + B)T = AT + B T
4. (AB)T = B T AT

36
Доказательство. Большинство указанных свойств очевидным образом
следуют из определения операций. Нетривиальными свойствами являют-
ся лишь 1–3 свойства умножения матриц и свойство 4 транспонирования.
Свойство II.1
P P P
(A(BC))ij = p Aip (BC)pj = p (A ip ( Bps Csj )) =
s
P P P P
= p ( s Aip Bps Csj ) = s p Aip Bps Csj =
P P  P
= s p Aip Bps Csj = s (AB)is Csj = ((AB)C)ij .

Свойство II.2
P P
(A (B + C))ij = p Aip (B + C)pj = p Aip (Bpj + Cpj ) =
P P
= p Aip Bpj + p Aip Cpj = (AB)ij + (AC)ij = (AB + AC)ij .

(Доказательство свойства II.3 аналогично доказательству свойства II.2)


Свойство V.4
  P P  
(AB)T = (AB)ji = p Ajp Bpi = p AT pj · B T ip =
P ij  
= p B T ip · AT pj = B T AT ij .

Замечание. Строго говоря, операции сложения и умножения матриц яв-


ляются частичными операциями, так как определены не для произволь-
ных матриц, а для матриц определенных размеров. В формулировке
теоремы была допущена некоторая вольность речи при замене точно-
го термина частичная операция термином операция. Но, заметим, для
матриц фиксированного размера частичная операция сложения являет-
ся действительно операцией, и поэтому множество матриц M(m × n, F )
относительно операции сложения образует алгебраическую структуру,
которая была названа нами абелевой группой. Значит, первая группа
свойств может быть переформулирована в следующем виде:
Следствие 1. Множество матриц M(m × n, F ) с операцией сложения
является абелевой группой.

Таким образом, всю терминологию, развитую нами для абелевых групп


с операцией сложения, мы можем использовать и для матриц. Так, на-
пример, матрицу (−1)A мы будем называть противоположной к матрице
A и обозначать через −A, а операцию вычитания матриц определим сле-
дующим образом: A − B = A + (−B).

37
Частичная операция умножения матриц также определена для любых
квадратных матриц порядка n, причем их произведение является снова
квадратной матрицей порядка n. Сравнив свойства сложения и умноже-
ния квадратных матриц со свойствами операций в кольце, мы получаем
другое

Следствие 2. Множество квадратных матриц M(n, F ) с операциями


сложения и умножения является кольцом с единицей (роль единицы в
этом кольце играет единичная матрица).

Помимо операций сложения и умножения для матриц определено еще


одно действие — умножение матрицы на элемент поля. Для полученных
алгебраических структур у нас не было введено никакой терминологии.
Поэтому мы сначала дадим два новых определения:

Определение 1. Векторным пространством над полем F называется


множество V с операциями сложения и умножения на элементы поля F ,
обладающими следующими свойствами:

1) (V, +) — абелева группа;

2) α(a + b) = αa + αb для любых a, b ∈ V, α ∈ F ;

3) (α + β)a = αa + βa для любых a ∈ V, α, β ∈ F ;

4) (αβ)a = α(βa) для любых a ∈ V, α, β ∈ F ;

5) 1a = a для любого a ∈ V .

Определение 2. Алгеброй над полем F называется множество A с опе-


рациями сложения, умножения и умножения на элементы поля F , обла-
дающими следующими свойствами:

1) A есть векторное пространство относительно операций сложения и


умножения на элементы поля;

2) (A, +, ·) — кольцо;

3) (αa)b = a(αb) = α(ab) для любых a, b ∈ A, α ∈ F .

Пользуясь новыми терминами, мы можем первую и третью группы свойств


объединить в таком виде:

38
Следствие 3. Множество матриц M(m × n, F ) с операциями сложе-
ния и умножения на элементы поля F является векторным простран-
ством над полем F .

Для квадратных матриц фикспрованного порядка первые четыре груп-


пы свойств могут быть также объединены в виде:
Следствие 4. Множество квадратных матриц M(n, F ) с операциями
сложения, умножения и умножения на элементы поля F является
алгеброй над полем F .

И, наконец, обратимся к последней пятой группе свойств, касающих-


ся транспонирования матриц. Ясно, что матрица транспонированная к
квадратной матрице порядка n также является квадратной матрицей по-
рядка n и, следовательно, операцию транспонирования можно интерпре-
тировать в этом случае как отображение алгебры M(n, F ) в себя. Пятая
группа свойств говорит нам, что это — весьма специфическое отображе-
ние, для которого мы сейчас введем свой термин.
Определение 3. Пусть A — произвольная алгебра над полем F . Отоб-
ражение ϕ : A → A будем называть антиавтоморфизмом алгебры A,
если

1. ϕ — биекция;

2. ϕ(a + b) = ϕ(a) + ϕ(b) для любых a, b ∈ A;

3. ϕ(αa) = αϕ(a) для любых a ∈ A, α ∈ F ;


4. ϕ(ab) = ϕ(b)ϕ(a) для любых a, b ∈ A.

Если дополнительно выполнено условие

5. ϕ(ϕ(a)) = a для любого a ∈ A,

то антиавтоморфизм ϕ называется инволютивным. Заметим, что из 5-


го условия вытекает 1-е условие, поэтому определение инволютивного
антиавтоморфизма можно давать без условия 1.
Пользуясь определением 3, мы получаем
Следствие 5. Алгебра квадратных матриц M(n, F ) обладает инволю-
тивным антиавтоморфизмом. Точнее, транспонирование — инволю-
тивный антиавтоморфизм этой алгебры.

39
2 Делители нуля и обратимые матрицы
Свойства матричных операций похожи на свойства числовых операций,
но обладают рядом особенностей. Так, например, произведение AB нену-
левых матриц может быть нулевой матрицей, что, конечно, невозможно
для произведения двух ненулевых чисел. Поэтому при работе с матри-
цами мы должны быть осторожными, понимая, что полной аналогии
между преобразованиями матричных и числовых выражений нет.
Пытаясь осмыслить эти особенности матричных операций, мы введем
новые понятия. Сначала мы обобщим на случай частичных операций
понятие делителей нуля, которое было дано ранее для колец.
Определение 4. Матрица A называется левым делителем нуля, если
найдется такая ненулевая матрица B, что AB = O и правым делителем
нуля, если найдется такая ненулевая матрица C, что CA = O.

Необходимость выделения среди делителей нуля правых и левых объ-


ясняется тем, что операция умножения — частичная операция, и если
определено произведение AB, то это не означает, что произведение BA
также определено. Более того, даже при условии, что оба произведения
определены, их результаты могут быть различными. В частности, кольцо
M(n, F ) для n > 2 является некоммутативным.
Следующее понятие есть повторение определения обратного элемента,
которое было дано ранее для моноидов.
Определение 5. Пусть A и B — квадратные матрицы равных порядков.
Матрица B называется обратной к матрице A, если

AB = BA = E.

Как и ранее, заметим, если B1 и B2 — обратные матрицы к A, то

B1 = B1 E = B1 (AB2 ) = (B1 A)B2 = EB2 = B2 .

Следовательно, если существует обратная матрица к A, то она един-


ственна. Эта единственная обратная к A матрица обозначается через
A−1 .
Матрица называется обратимой, если существует обратная к ней мат-
рица. В противном случае матрица называется необратимой.
Рассмотрим некоторые простые свойства делителей нуля и обратимых
матриц.

40
Теорема (свойства делителей нуля). 1. Левые и првые делители ну-
ля — необратимые матрицы;

2. Матрица является левым делителем нуля тогда и только тогда,


когда транспонированная к ней матрица является правым дели-
телем нуля.

Доказательство. 1. (от противного). Пусть A — обратимый левый де-


литель нуля. Тогда найдется такая ненулевая матрица B, что AB = O.
Следовательно, A−1 (AB) = A−1 O и B = O. Полученное противоречие
завершает доказательство.
Для правых делителей нуля доказательство аналогично.
2. A — левый делитель нуля ⇔ ∃B 6= O : AB = 0 ⇔ (AB)T = O T ⇔
B T AT = O ⇔ AT — правый делитель нуля.

Теорема (свойства обратимых матриц). 1. Обратная матрица обра-


тима, причем −1
A−1 = A.

2. Транспонированная матрица к обратимой матрице обратима, при-


чем −1 T
AT = A−1 .

3. Произведение обратимых матриц — обратимая матрица, причем

(A1 · . . . · An )−1 = A−1 −1


n · . . . · A1 .

Доказательство. 1. Непосредственно следует из определения обратной


матрицы.
T T
2. (A−1 ) · AT = (A · A−1 ) = E T = E,
T T
AT · (A−1 ) = (A−1 · A) = E T = E.
−1 −1
3. (A1 . . . An )(A−1 −1
n . . . A1 ) = (An . . . A1 )(A1 . . . An ) = E.

Из свойств обратимых матриц вытекает

Теорема (определение группы GL (n, F )). Множество всех обратимых


матриц порядка n над полем F с операцией умножения является груп-
пой. Эта группа называется общей матричной группой над полем F и
обозначается через GL (n, F ).

41
Помимо свойств делителей нуля и обратимых матриц далее часто будет
использоваться один простой критерий для делителей нуля. Для форму-
лировки этого критерия нам потребуется

Определение 6. Матрицы A1 , . . . An одного размера называются линей-


но зависимыми, если

∃α1 , . . . , αn ∈ F : α1 ∨ α2 ∨ . . . ∨ αn = 6 0и
α1 A1 + . . . + αn An = 0.

В противном случае матрицы A1 , . . . , An называются линейно независи-


мыми.

Понятно, что строки и столбцы любой матрицы также представляют


собой некоторые матрицы. Поэтому можно говорить о линейной зависи-
мости строк или столбцов матрицы.

Теорема (критерий для делителей нуля). 1. Матрица является пра-


вым делителем нуля тогда и только тогда, когда её строки ли-
нейно зависимы;

2. Матрица является левым делителем нуля тогда и только тогда,


когда её столбцы линейно зависимы.

Доказательство. 1. Нетрудно понять, что определение правого делите-


ля нуля равносильно следующему: матрица A = (aij ) яляется правым
делителем нуля тогда и только тогда, когда существует такая ненулевая
строка (α1 , . . . , αm ), что
 
a11 . . . a1n
(α1 , . . . , αm )  ...  = (0, . . . , 0).
am1 . . . amn

Это матричное равенство, в свою очередь, равносильно линейной зави-


симости строк матрицы A:

α1 (a11 , . . . , a1n ) + . . . + αm (am1 , . . . , amn ) = (0, . . . , 0).

2. Следует из предыдущего утверждения и 2-го свойства делителей нуля.

42
3 Элементарные преобразования и элементарные мат-
рицы
Для дальнейшего изучения свойств делителей нуля и обратимых матриц
нам потребуется понятие элементарных преобразований матрицы.

Определение 7. Элементарными преобразованиями строк матрицы на-


зываются следующие преобразования:
I тип: прибавление к i-й строке j-й строки (i 6= j), умноженной на про-
извольный элемент λ ∈ F ;
II тип: умножение i-й строки на ненулевой элемент λ ∈ F ;
III тип: перестановка i-й и j-й строк для i 6= j.

Аналогично определяются элементарные преобразования столбцов мат-


рицы.

Определение 8. Элементарными матрицами называются матрицы, по-


лученные из единичной матрицы элементарным преобразованием строк.

Для элементарных матриц мы будем использовать следующие обозначе-


ния:
Pij (λ) — матрица, полученная из единичной матрицы преобразова-
нием типа I;
Mi (λ) — матрица, полученная из единичной матрицы преобразова-
нием типа II;
Qij — матрица, полученная из единичной матрицы преобразова-
нием типа III.
Непосредственно из определений вытекает

Теорема (свойства элементарных матриц). 1. Транспонированная к эле-


ментарной матрице также является элементарной матрицей,
причем

(Pij (λ))T = Pji (λ) , (Mi (λ))T = Mi (λ) , QTij = Qij ;

2. Элементарные матрицы обратимы, причем



(Pij (λ))−1 = Pij (−λ) , (Mi (λ))−1 = Mi λ−1 , Q−1
ij = Qij .

Таким образом, обратные к элементарным матрицам также яв-


ляются элементарными матрицами;

43
3. Элементарное преобразование строк произвольной матрицы A рав-
носильно умножению слева SA на элементарную матрицу S со-
ответствующего типа;

4. Элементарное преобразование столбцов произвольной матрицы A


равносильно умножению справа AS на элементарную матрицу S
соответствующего типа.

Также нам потрубуется

Определение 9. Матрица A = (aij ) называется ступенчатой, если вы-


полнены условия:

1) a21 = 0;

2) ai1 = ai2 = . . . = aij = 0 ⇒ ai+1,1 = ai+1,2 = . . . = ai+1,j+1 = 0

для тех индексов, которые определены в A.

Первые слева ненулевые элементы в строках ступенчатой матрицы на-


зываются главными элементами строк.
Таким образом, ступенчатые матрицы — это матрицы следующего вида
 
0 ... 0 ∗
 0 ... 0 ∗ 
 
 0 ... 0 ∗ 
  , где * — главные элементы.
 
 
 0 ... 0 ∗ 
0 ... 0

Теорема (о приведении к ступенчатому виду). Любая матрица элемен-


тарными преобразованиями строк может быть приведена к ступен-
чатому виду.

Доказательство. (Индукцией по числу столбцов).


База индукции.
 
a11
Пусть A =  ...
 
. Если все ai1 = 0, то A — ступенчатая матрица. Если
am1
некоторый ai1 6= 0, то, после преобразования 3-го типа можно считать,

44
что a11 6= 0. Умножим первую строку на λ = − aa11i1
и прибавим к i-й
строке для каждого i 6= 1. Получим ступенчатую матрицу
 
a11
 0 
 
B =  ..  .
 . 
0

Шаг индукции.
Пусть  
a11 . . . a1n
A =  ... . . ..
 
. . , n > 1
am1 . . . amn
и теорема справедлива для матриц с меньшим числом столбцов. Тогда
элементарными преобразованиями строк мы можем привести A к одному
из двух видов:
 
  ∗
0  0 
A1 =  ... . . .  или A2 =  .. . . .  , где ∗ =
   
6 0.
 . 
0
0
Вычеркивая первый столбец у матрицы A1 и первые столбец и строку
у матрицы A2 , мы получаем матрицы с числом столбцов < n, которые
согласно индуктивному предположению можно привести к ступенчатому
виду. Очевидно, что эти же преобразования приводят A1 и A2 также к
ступенчатому виду.

С помощью теоремы о приведении к ступенчатому виду мы можем по-


лучить следующий результат:
Теорема (о разложении в произведение элементарных матриц). Если
число строк у матрицы A не меньше числа её столбцов, то возможен
один из случаев:

1) A разлагается в произведение элементарных матриц;


2) A является правым делителем нуля.

Доказательство. Согласно теореме о приведении к ступенчатому виду


матрицу A элементарными преобразованиями строк можно привести к
ступенчатой матрице B, у которой число строк также не меньше числа
её столбцов. При этом возможны два случая:

45
1) B не имеет нулевых строк;
2) у B есть нулевые строки.

В первом случае, очевидно, матрица B является квадратной и имеет вид


 
b11
B= 0
 .. 
 , где bii — главные элементы строк для всех i.
.
0 0 bkk

С помощью преобразований первого типа мы можем обнулить все эле-


менты над bkk , затем над bk−1,k−1 и т.д. до b22 . Затем, применяя преоб-
разования второго типа, мы преобразуем диагональные элементы в 1 и
получаем единичную матрицу.
Напомним, что каждое элементарное преобразование строк матрицы рав-
носильно умножению слева на элементарную матрицу. Поэтому в пер-
вом случае найдется такая последовательность элементарных матриц
S1 , . . . , Sn , что Sn · . . . · S1 · A = E. Но тогда

A = S1−1 · . . . · Sn−1 ,

и значит матрица A разлагается в произведение элементарных матриц.


Во втором случае найдется такая последовательность элементарных мат-
риц T1 , . . . , Tm , что матрица B = Tm · . . . · T1 · A имеет нулевые строки. В
этом случае строки матрицы B линейно зависимы и поэтому B есть пра-
вый делитель нуля. Пусть C — такая нелулевая матрица, что CB = O.
Тогда
(CTm . . . T1 )A = CB = O.
Заметим, что Tm . . . T1 — обратимая матрица, которая не может быть
делителем нуля. Значит CTm . . . T1 6= O и A — правый делитель нуля.
Теорема доказана.

Из теоремы о разложении в произведение элементарных матриц вытека-


ет
Следствие. Пусть A — произвольная матрица размера m × n. Тогда

1) если m > n, то строки A линейно зависимы, т.е. A является


правым делителем нуля;
2) если m < n, то столбцы A линейно зависимы, т.е. A является
левым делителем нуля;

46
3) для квадратной матрицы свойство быть левым делителем нуля
равносильно свойству быть правым делителем нуля;

4) A обратима ⇔ A разлагается в произведение элементарных


матриц.

В дальнейшем необратимые квадратные матрицы мы будем называть


вырожденными. Таким образом, левый делитель нуля, правый делитель
нуля, вырожденность, необратимость, линейная зависимость строк, ли-
нейная зависимость столбцов для квадратных матриц означают одно и
то же.

47
Лекции 9-10. Определители.

1 Индуктивное определение
Ранее было показано, что квадратная матрица обратима в том и только
том случае, когда её строки (или столбцы) линейно независимы. Приме-
нять полученный критерий неудобно во многих случаях. В дальнейшем
нам потребуется другой аналитический критерий, основанный на вычис-
лении одной функции от матричных элементов, сопоставляющей каждой
квадратной матрице некоторый элемент поля:

det : M(n, F ) → F.

Эта функция det называется определителем матрицы, для A ∈ M(n, F )


значение этой функции обозначается через det A, и вычисляется det A
следующим образом:

1) если n = 1 и A = (a11 ), то det A = a11 ,

2) если n > 1 и A = (aij ), то


n
X
det A = (−1)1+j a1j det Aj ,
j=1

, где Aj — матрица порядка n − 1, полученная из A вычеркиванием


первой строки и j-го столбца.

Таким образом, вычисление значения det A для квадратной матрицы A


порядка n, согласно пункту 2 определения det A, сводится к вычислению
значений функции det от некоторых квадратных матриц порядка n − 1.
Продолжая процесс вычисления det дальше, мы в конце концов доходим
до квадратных матриц порядка 1, значения det в которых определены в
первом пункте определения.
Так, например, с помощью данного определения можно найти явные
формулы для вычисления определителей матриц порядков 2 и 3:

a11 a12
a21 a22 = a11 a22 − a12 a21 ,


a11 a12 a13

a21 a22 a23 = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 −
(1)
a31 a32 a33 −a13 a22 a31 − a12 a21 a33 − a11 a23 a32 .

48
Замечание. Наряду с обозначением det A для матрицы A, заданной в
виде таблицы A = (aij ), часто используется другое обозначение |aij |, ко-
торое мы использовали для матриц порядков 2 и 3. Также для записи
некоторых свойств определителей мы будем применять еще одно обозна-
чение: det A = det(A1 , A2 , . . . , An ), где Ai — i-й столбец матрицы A.

В общем случае явные формулы слишком громоздки и неудобны для


применения на практике. В некоторых простых случаях вычисление опре-
делителя матрицы может быть проведено с помощью данного индуктив-
ного определения. Так, например, нутрудно проверить, что определители
элементарных матриц вычисляются следующим образом:

det Pij (λ) = 1, det Mi (λ) = λ, det Qij = −1.

В частности, det S T = det S для любой элементарной матрицы.


В более сложных случаях приходится использовать некоторые свойства
определителей.

2 Линейность и кососимметричность определителя


Заметим, что на каждом индуктивном шаге вычисления определителя
мы для нахождения сомножителя det Aj у элемента a1j , стоящего в j-м
столбце, вычеркиваем j-й столбец матрицы A. Отсюда следует, что в яв-
ном выражении для det A не могут появляться произведения элементов
из одного столбца. Более того, так как любой одночлен явного выра-
жения есть произведение n элементов, где n — порядок матрицы, то в
этом произведении будет точно один сомножитель из каждого столбца.
Другими словами, det A является однородной линейной функцией от k
элементов произволного j-го столбца, то есть
n
X
det A = αi aij ,
i=1

где коэффициенты αi не зависят от элементов j-го столбца. Отсюда, в


свою очередь, следует

Свойство 1 (линейность по столбцам). Если k-й столбец матрицы A


есть линейная комбинация некоторых столбцов Bi , i = 1, 2, . . . , m, т.е.
m
X
k
A = λi Bi ,
i=1

49
то m
X
det A = λi det(A1 , . . . , Bi , . . . , An ),
i=1
где в правой части равенства столбцы Bi стоят на k-м месте.

Отметим одно важное следствие свойства 1: множитель, общий для всех


элементов столбца, может быть вынесен за знак определителя. В част-
ности, определитель матрицы, имеющей нулевой столбец, равен 0.
Формулировка второго основного свойства определителей состоит из двух
тесно связанных между собой (как это будет видно из доказательства)
утверждений.
Свойство 2 (кососимметричность по столбцам). 2.1. Определитель мат-
рицы с двумя одинаковыми столбцами равен 0;
2.2. При перестановке двух различных столбцов матрицы знак её опре-
делителя меняется на противоположный.

Доказательство. Доказательство свойства 2 делится на ряд этапов:


(1) Покажем сначала, что определитель матрицы с двумя соседними оди-
наковыми столбцами равен 0. Доказательство этого утверждения будем
проводить индукцией по порядку матрицы.
База индукции. Понятно, что наименьший порядок матрицы, для ко-
торого условие утверждения имеет смысл, равен 2.

a a
b b = ab − ab = 0.

Шаг индукции. Допустим, что порядок матрицы A = (aij ) больше 2 и


для всех матриц меньшего порядка заключение выполняется. Допустим
также, что у матрицы A k-й и (k + 1)-й столбцы одинаковы. Согласно
определению,
n
X
det A = (−1)1+j a1j det Aj ,
j=1

где все определители det Aj , для j 6∈ {k, k + 1}, равны 0 в силу индук-
тивного предположения. Следовательно,
det A = (−1)k+1 a1k det Ak + (−1)k+2 a1,k+1 det Ak+1 .
Так как k-й и (k + 1)-й столбцы одинаковы, то Ak = Ak+1 и a1k = a1,k+1 ,
откуда и вытекает требуемое равенство det A = 0.

50
(2) Покажем теперь, что при перестановке двух соседних столбцов мат-
рицы знак её определителя меняется на противоположный.
Пусть в матрице A переставлены k-й и (k + 1)-й столбцы. Тогда, исполь-
зуя свойство линейности определителя и предыдущее утверждение (1),
получаем:

0 = det(A1 , . . . , Ak−1 , Ak + Ak+1 , Ak + Ak+1 , Ak+2 , . . . , An ) =

= det(A1 , . . . , Ak−1 , Ak , Ak , Ak+2, . . . , An )+


+ det(A1 , . . . , Ak−1 , Ak , Ak+1 , Ak+2, . . . , An )+
+ det(A1 , . . . , Ak−1 , Ak+1, Ak , Ak+2, . . . , An )+
+ det(A1 , . . . , Ak−1 , Ak+1, Ak+1 , Ak+2 , . . . , An ) =

= det(A1 , . . . , Ak−1 , Ak , Ak+1 , Ak+2, . . . , An )+


+ det(A1 , . . . , Ak−1 , Ak+1, Ak , Ak+2, . . . , An ),

откуда и следует требуемое заключение.


(3) Из предыдущих двух утверждений (1) и (2) следует, что определи-
тель матрицы с двумя одинаковыми столбцами равен 0. Следовательно
утверждение (2.1) справедливо.
(4) Для доказательства утверждения (2.2) повторим рассуждения, про-
веденные в (2). Допустим, что в матрице A переставили k-й и l-й столбцы.
Тогда
0 = det(. . . , Ak + Al , . . . , Ak + Al , . . .) =
= det(. . . , Ak , . . . , Al , . . .)+
+ det(. . . , Al , . . . , Ak , . . .).
Следовательно утверждение (2.2) также справедливо.

3 Другие свойства определителя


Из свойств линейности и кососимметричности вытекает целый ряд ин-
тересны и полезных, с точки зрения приложений, свойств определителя.
Но сначала мы переформулируем полученные результаты на языке эле-
ментарных преобразований матриц.
Во-первых, перестановка i-го и j-го столбцов матрицы A равносильна,
как мы знаем, умножению матрицы A справа на элементарную матрицу
Qij . Так как det Qij = −1, то кососимметричность по столбцам означает,
что
det AQij = det A · det Qij .

51
Во-вторых, умножение j-го столбца на элемент λ 6= 0 равносильно умно-
жению матрицы A справа на элементарную матрицу Mj (λ). Заметим,
что det Mj (λ) = λ и, согласно свойству линейности, множитель λ можно
вынести за знак определителя. Значит
det AMj (λ) = det A · det Mj (λ) .

И наконец, из свойств линейности и кососимметричности следует, что


определитель матрицы A не изменится, если к некоторому столбцу мат-
рицы A прибавить другой столбец этой же матрицы, умноженный на
произвольный элемент λ. Учитывая, что det Pij (λ) = 1, получаем
det APij (λ) = det A · det Pij (λ) .

Объединим вместе полученные три равенства:


Лемма. Для любой матрицы A и произвольной элементарной матри-
цы S справедливо равенство:
det AS = det A · det S.

С помощью этой леммы легко доказать:


Теорема (критерий вырожденности матрицы). Матрица вырождена то-
гда и только тогда, когда её определитель равен 0.

Доказательство. Невырожденная матрица представима в виде произ-


ведения элементарных матриц и, согласно лемме, её определитель равен
произведению определителей сомножителей. Учитывая, что определи-
тели элементарных матриц отличны от 0, мы получаем: определитель
невырожденной матрицы отличен от нуля. Отсюда, очевидно, следует,
что если определитель матрицы равн 0, то матрица является вырожден-
ной.
Обратно, если матрица A вырождена, то её столбцы линейно зависимы,
и поэтому некоторый столбец представим P в виде линейной комбинации
других столбцов этой матрицы: Ak = i6=k λi Ai . Применяя свойство ли-
нейности по столбцам, получаем
X X
det A = det(. . . , Ak , . . .) = det(. . . , λi Ai , . . .) = λi det(. . . , Ai , . . .),
i6=k i6=k

где i-й столбец Ai стоит на месте k-го столбца Ak . Следовательно, мат-


рицы (. . . , Ai , . . .) имеют два одинаковых столбца и их определители,
согласно свойству кососимметричности, равны 0. Значит, det A = 0.

52
Теорема (определитель произведения матриц). Для произвольных мат-
риц A и B справедливо равенство

det AB = det A · det B.

Доказательство. Допустим сначала, что B — вырожденная матрица. В


этом случае B есть левый делитель нуля, и поэтому матрица AB так-
же является левым делителем нуля. Значит матрица AB вырождена и,
согласно критерию вырожденности, мы имеем det B = det AB = 0. Оче-
видно, что в этом случае заключение теоремы выполнено.
Если матрица B невырождена, то B = S1 · . . . · Sm , где Si , i = 1, . . . , m —
элементарные матрицы, и, согласно лемме,

det AB = det AS1 . . . Sm = det A · det S1 · . . . · det Sm =


= det A · det S1 . . . Sm = det A · det B.

Теорема (определитель транспонированной матрицы). Определитель


матрицы не меняется при её транспонировании.

Доказательство. Если A — вырожденная матрица, то AT также явля-


ется вырожденной и, согласно критерию вырожденности, определители
обеих матриц равны 0.
Пусть A — невырожденная матрица. Тогда A представима в виде произ-
ведения элементарных матриц A = S1 ·. . .·Sm , и поэтому AT = Sm T
·. . .·S1T .
Значит
det AT = det Sm T
. . . S1T =
= det Sm · . . . · det S1 = det S1 · . . . · det Sm =
= det S1 . . . Sm = det A.

Из теоремы об определителе транспонированной матрицы очевидным


образом следует, что свойства линейности и кососимметричности спра-
ведливы не только для столбцов, но и для строк матрицы. Этот факт, а
также свойство кососимметричности, позволяют обобщить формулу раз-
ложения определителя по элементам первой строки, которая была дана
в качестве основного определения, на случай произвольной строки или
столбца матрицы. Для формулировки этих обобщенных формул введем
новый термин.

53
Определение. Дополнительным минором элемента aij в матрице A на-
зывается определитель матрицы, полученной из A вычеркиванием i-й
строки и j-го столбца. Дополнительный минор элемента aij будем обо-
значать через ∆ij .
Теорема (формулы разложений по строкам и столбцам). Для любой
матрицы A справедливы равенства
Pn
det A = (−1)i+j aij ∆ij (разложение по i-й строке),
Pnj=1 i+j
det A = i=1 (−1) aij ∆ij (разложение по j-му столбцу).

4 Приложения
В качестве приложений определителя мы дадим формулы для вычисле-
ния обратной матрицы, а также формулы Крамера для решения систем
линейных уравнений.
Теорема (формулы для элементов обратной матрицы). Пусть A — об-
ратимая матрица. Тогда
 (−1)i+j ∆ji
A−1 ij
= ,
det A
где ∆ji — дополнительный минор элемента aji в A.

Доказательство. Пусть B — квадратная матрица, элементы которой


(−1)i+j∆
заданы следующим образом: Bji = det A ij . Тогда
P P
(AB)ij  = p Aip Bpj = det1 A 
· p Aip (−1)p+j ∆jp =
det A , i = j 1 , i=j
= det1 A = = Eij .
0 , i 6= j 0 , i 6= j

Обратимся теперь к формулам Крамера. Пусть нам дана система из n


линейных уравнений с n неизвестными x1 , . . . , xn :

 a11 x1 + . . . + a1n xn = b1
... или AX = B,

an1 x1 + . . . + ann xn = bn
   
x1 b1
где A = (aij ), X =  ... , B =  ... .
   
xn bn

54
Теорема (формулы Крамера). Система AX = B имеет единственное
решение тогда и только тогда, когда det A 6= 0, причем в этом случае
∆i
xi = det A
, где ∆i — определитель матрицы, полученной из A заменой
i-го столбца на столбец B.

Доказательство. Пусть система AX = B имеет единственное решение.


В этом случае система AX = O также имеет единственное решение X =
O. Это значит, что A не является левым делителем нуля, и следовательно
det A 6= 0.
Обратно, пусть det A 6= 0. В этом случае матрица A обратима, и значит
X = A−1 B — единственное решение системы AX = B.
Так как
B = x1 A1 + . . . + xn An ,
то
X X
∆i = det(. . . , B, . . .) = det(. . . , xk Ak , . . .) = xk det(. . . , Ak , . . .),
k k

где k-й столбец Ak стоит на i-м месте. Согласно свойству кососиммет-


ричности, det(. . . , Ak , . . .) 6= 0 лишь при k = i. Таким образом, ∆i =
∆i
xi det(. . . , Ai , . . .) = xi · det A, и значит xi = det A
.

55
Лекции 11-15. Векторные пространства.

1 Основные определения
Сначала напомним определение векторного пространства, данное ранее.
Абелева группа (V, +) называется векторным пространством над полем
F , если для любого x ∈ V и любого λ ∈ F однозначно определен элемент
из V , обозначаемый через λx и называемый произведением λ и x, причем

1) α(x + y) = αx + αy,

2) (α + β)x = αx + βx,

3) (αβ)x = α(βx),

4) 1 · x = x

для любых x, y ∈ V и α, β ∈ F .
Элементы векторного пространства называются векторами, а нулевой
элемент абелевой группы V — нулевым вектором. Также вместо термина
«векторное пространство над полем F » часто используется более корот-
кое выражение «векторное F -пространство» или даже «F -пространство»,
если из контекста понятно, о чем идет речь.
В теории векторных пространств мы будем использовать всю терминоло-
гию, которую разработали в теории абелевых групп. Так через −x будем
обозначать вектор противоположный к вектору x, а через x − y будем
обозначать выражение x+(−y), которое называется разностью векторов.
Отметим несколько простейших свойств операций сложения и умноже-
ния на элементы поля, которые будут применяться в дальнейшем:

1) x = y + z ⇒ y = x − z;

2) 0 · x = 0;

3) (−1)x = −x.

Доказательство. (1) x = y +z ⇒ x+(−z) = (y +z)+(−z) ⇒ x−z = y.


(2) 0 · x = (0 + 0)x = 0 · x + 0 · x ⇒ 0 · x = 0 · x + 0 · x ⇒ 0 · x = 0.
(3) x + (−1) · x = 1 · x + (−1) · x = (1 − 1)x = 0 · x = 0.

56
Дадим теперь определение «равенства» двух векторных пространств.
Здесь, в принципе, можно идти двумя различными путями: с одной сто-
роны, можно считать два векторных пространства «одинаковыми», ес-
ли они различаются лишь обозначениями векторов и элементов поля,
а с другой, можно зафиксировать поле F и «одинаковыми» считать F -
пространства, различающиеся лишь обозначениями векторов. В теории
векторных пространств был выбран второй путь.
Определение. Векторные F -пространства V1 и V2 называются изоморф-
ными, если существует такя биекция ϕ : V1 → V2 , что

1) ϕ(x + y) = ϕ(x) + ϕ(y),

2) ϕ(λx) = λϕ(x)

для любых x, y ∈ V1 и λ ∈ F .

Сама биекция ϕ, удовлетворяющая указанным двум условиям, называ-


ется изоморфизмом.
Ранее мы уже сталкивались с примерами векторных пространств. На-
пример, M(m × n, F ) — векторное пространство матриц размера m × n
над полем F . Очевидно, что два таких матричных F — пространства изо-
морфны, если количество матричных элементов, равное mn, у них одно и
то же. В двух частных случаях m = 1 или n = 1 для этих F -пространств
используются названия пространство строк или пространство столб-
цов. Заметим также, что для F -пространств строк и столбцов мы будем
использовать одинаковое обозначение F n , где n — длина строки или вы-
сота столбца, различая их лишь словами «простарнство строк» и «про-
странство столбцов».

2 Подпространства и линейные оболочки


Пусть V — произвольное векторное пространство над полем F .
Определение. Подмножество W ⊂ V называется подпространством в
V , если

1) 0 ∈ W ,

2) x, y ∈ W ⇒ x + y ∈ W ,

3) x ∈ W, λ ∈ F ⇒ λx ∈ W .

57
Обозначение: W 6 V .
Очевидно, что любое подпространство из V само является векторным F -
пространством относительно операций сложения векторов и умножения
на элементы поля F , индуцированных этими операциями всего V .
Простейшими примерами подпространств являются подпространство, со-
стоящее из одного нулевого вектора, и само пространство V . Эти под-
пространства называются тривиальными, причем первое, состоящее из
одного нулевого вектора, называется нулевым и обозначается через 0.
Разумеется, кроме этих тривиальных подпространств пространство V в
общем случае может содержать и другие подпространства. Для описания
общего способа построения подпространств нам потребуется ряд новых
понятий. Но сначала напомним несколько терминов, использовавшихся
ранее.
Для любых векторов v1 , . . . , vn из V и элементов λ1 , . . . , λn из F выраже-
ние вида
λ1 v1 + . . . + λn vn
будем называть линейной комбинацией векторов v1 , . . . , vn . Линейную
комбинацию с нулевыми коэффициентами λi , i = 1, . . . , n, будем назы-
вать тривиальной.
Если для вектора v ∈ V существуют такие λ1 , . . . , λn ∈ F , что v =
λ1 v1 + . . . + λn vn , то будем говорить, что вектор v представим в виде
линейной комбинации векторов v1 , . . . , vn или v линейно выражается
через векторы v1 , . . . , vn .
Пусть теперь S — произвольное непустое подмножество векторов из V
и W — множество всех векторов из V , представимых в виде линейных
комбинаций конечных наборов векторов из S. Нетрудно понять, что W —
подпространство в V . Действительно,
1) 0 ∈ W , так как S 6= ∅, а нулевой вектор может быть линейно выражен
через любые векторы с помощью тривиальной линейной комбинации,
2) сумма линейных комбинаций векторов из S есть снова линейная ком-
бинация векторов из S,
3) произведение линейной комбинации векторов из S на элемент поля
есть снова линейная комбинация векторов из S.
Построенное таким способом подпространство W называется линейной
оболочкой векторов S и обозначается через hSi. Часто используется и
другое название для линейной оболочки S. Это подпространство hSi на-
зывается подпространством, порожденным множеством векторов S, а
само множество S называется порождающим множеством простран-

58
ства hSi. Заметим также, что, используя новые термины, выражение
«вектор v представим в виде линейной комбинации векторов из S» мож-
но переформулировать в виде: «вектор v принадлежит линейной оболоч-
ке S» (или v ∈ hSi).
Очевидно, что любое подпространство W из V является линейной обо-
лочкой некоторого множества векторов из V . В качестве порождающего
множества векторов для W можно взять, например, само множество W .

Определение. Пространство V называется конечнопорожденным, если


оно порождается некоторым конечным множеством векторов или, дру-
гими словами, совпадает с линейной оболочкой некоторого конечного
множества векторов.

В дальшейшем, развивая теорию векторных пространств, мы ограничим-


ся рассмотрением случая конечнопорожденных пространств. Это огра-
ничение объясняется в первую очередь тем, что для любого конечно-
порожденного пространства может быть определена целочисленная ха-
рактеристика (или параметр, называемый размерностью пространства),
которая позволит нам проводить индуктивные доказательства многих
утверждений. Наличие этой характеристики делает более удобным для
применения термин «конечномерное пространство» вместо введенного
выше термина «конечнопорожденное пространство».

3 Базис и размерность
Определение. Упорядоченный набор векторов E = {e1 , . . . , en } назы-
вается базисом векторного F -пространства V , если любой вектор из V
представим в виде единственной линейной комбинации этих векторов,
т.е.

1) ∀x ∈ V ∃λ1 , . . . , λn ∈ F : x = λ1 e1 + . . . + λn en ,

2) α1 e1 + . . . + αn en = β1 e1 + . . . + βn en ⇒ αi = βi , i = 1, . . . , n.

Понятно, что любое пространство, обладающее конечным базисом, явля-


ется конечнопорожденным. Наша ближайшая цель — показать, что лю-
бое ненулевое конечнопорожденное пространство имеет конечный базис,
причем число базисных векторов не зависит от выбора базиса. Забегая
немного вперед, скажем, что это число и будет названо размерностью
векторного пространства.

59
Сначала проведем небольшой анализ условий 1 и 2 из определения ба-
зиса. Во-первых, условие 1 может быть переформулировано в терминах
порождения, а именно: V порождается векторами e1 , . . . , en или V есть
линейная оболочка множества E. Во-вторых, условие 2 равносильно, как
это нетрудно заметить, следующему утверждению:

λ1 e1 + . . . + λn en = 0 ⇒ λ1 = . . . = λn = 0. (*)

В дальнейшем векторы e1 , . . . , en , удовлетворяющие условию (*), будем


называть линейно независимыми. В противном случае векторы e1 , . . . , en
назовем линейно зависимыми. Понятно, что линейная зависимость век-
торов e1 , . . . , en равносильна тому, что какой-либо из векторов ek линейно
выражается через остальные векторы {ei | i 6= k}.
Пользуясь новым термином, мы можем переформулировать определение
базиса следующим образом:

Определение (первая переформулировка). Упорядоченный набор век-


торов E = {e1 , . . . , en } называется базисом векторного F -пространства
V , если

1) V = hEi, т.е. V порождается векторами e1 , . . . , en .

2) векторы из E линейно независимы.

Продолжим наш анализ определения базиса дальше. Заметим, что усло-


вие линейной независимости векторов e1 , . . . , en равносильно тому, что
ни один из векторов ek линейно не выражается через остальные векто-
ры ei , i 6= k. Отсюда следует, что если из E убрать любой вектор ek ,
то оставшиеся векторы не будут порождать все пространство V . Таким
образом мы приходим ко второй переформулировке определения базиса.

Определение (вторая переформулировка). Упорядоченный набор век-


торов E = {e1 , . . . , en } называется базисом ненулевого векторного F -
пространства V , если E — минимальное порождающее пространство V
множество векторов, т.е

V = he1 , . . . , en i и V 6= he1 , . . . , ek−1, ek+1 , . . . , en i

для любого k = 1, . . . , n.

Уже из второй переформулировки определения базиса становится яс-


но, что любое ненулевое конечнопорожденное векторное пространство

60
имеет базис. Для нахождения базиса достаточно взять любой конечный
набор векторов, порождающий пространство V , затем из этого набора
выбрать порождающее V подмножество наименьшего размера и, нако-
нец, упорядочить его. Этот способ построения базиса удобно применять
и на практике. Итак, справедлива
Теорема (о существовании базиса). Любое ненулевое конечнопорожден-
ное векторное пространство имеет конечный базис.

Прежде чем идти дальше и доказывать, что число базисных векторов не


зависит от выбора базиса, приведем еще одну переформулировку опре-
деления базиса.
Определение. Упорядоченный набор векторов E = {e1 , . . . , en } назы-
вается базисом векторного F -пространства V , если E — максимальное
множество линейно независимых векторов из V , т.е. векторы e1 , . . . , en
линейно независимы, но добавление любого вектора v ∈ V − E к этому
множеству векторов делает его линейно зависимым.

Из первой переформулировки определения очевидным образом следу-


ет, что базис — максимальное линейно независимое множество векто-
ров. Поясним обратное. Пусть E — максимальное линейно независимое
множество векторов. Тогда, понятно, второе условие первой переформу-
лировки выполнено. Покажем, что выполнено и первое условие. С этой
целью возьмем произвольный вектор v ∈ V и добавим его к векторам
e1 , . . . , en . так как векторы e1 , . . . , en , v линейно зависимы, то некоторая
их нетривиальная линейная комбинация равна 0:

λ1 e1 + . . . + λn en + αv = 0.

В силу линейной независимости векторов e1 , . . . , en элемент α обязан


быть ненулевым, и, следовательно,
λ1 λn
v=− e1 − . . . − en ,
α α
т.е. v линейно выражается через e1 , . . . , en . Отсюда следует, что v ∈ hEi,
и значит первое условие также выполнено.
Таким образом, базис, если смотреть на него как на неупорядоченное
множество векторов, представляет собой, с одной стороны, порождающее
множество линейно независимых векторов, с другой — смаое маленькое
порождающее множество векторов и, с третьей, — самое большое линей-
но независимое множество векторов.

61
Как и вторую переформулировку определения базиса, третью перефор-
мулировку можно применять для построения базиса векторного про-
странства, но сначала мы должны показать, что процесс построения мак-
симального линейно независимого множества векторов останавливается
на конечном шаге. С этой целью докажем следующее:

Лемма (основная лемма о линейной зависимости). Если векторное F -


пространство V порождено n векторами, то число векторов в любом
линейно независимом множестве векторов не превосходит n.

Доказательство. (От противного).


Пусть V = hv1 , . . . , vn i и {w1 , . . . , wm } — множество линейно независи-
мых векторов. Допустим также, что m > n. Так как любой вектор из V
линейно выражается через векторы v1 , . . . , vn , то мы имеем m равенств
для некоторых αij ∈ F :

w1 = α11 v1 + . . . + α1n vn
...
wm = αm1 v1 + . . . + αmn vn .

Заметим, что число строк в матрице A = (αij ) больше числа столбцов,


и, следовательно, строки матрицы A линейно зависимы, т.е. существуют
такие λi ∈ F, i = 1, . . . , m, что λ1 ∨ . . . ∨ λm 6= 0 и

λ1 (α11 , . . . , α1n ) + . . . + λm (αm1 , . . . , αmn ) = (0, . . . , 0).

Но тогда λ1 w1 + . . . + λm wm = 0 · v1 + . . . + 0 · vn = 0, что противоречит


линейной независимости векторов w1 , . . . , wm .

С помощью основной леммы докажем следующие утверждения:

Теорема (о конечнопорожденности подпространств). Любое подпростран-


ство конечнопорожденного векторного пространства само конечнопо-
рождено.

Доказательство. Если векторное пространство V порождается n век-


торами, то любое множество линейно независимых векторов из подпро-
странства W состоит не более, чем из n векторов. Значит, если W 6= 0,
то в W существует максимальное линейно независимое конечное мно-
жество векторов, которое, согласно третьей переформулировке базиса,
образует базис пространства W . В частности, W — конечнопорожденное
пространство.

62
Теорема (о дополнении до базиса). Любое множество линейно неза-
висимых векторов из ненулевого конечопорожденного векторного про-
странства V может быть дополнено до базиса пространства V .

Доказательство. Любое множество линейно независимы векторов из


конечнопорожденного пространства V , согласно основной лемме, содер-
жится в конечном максимальном линейно независимом множестве век-
торов из V , которое образует базис пространства V .

Теорема-определение (о равномощности базисов). Любые два базиса


ненулевого конечнопорожденного векторного пространства V состоят
из равного числа векторов. Это число называется размерностью про-
странства V и обозначается dim V . Размерность нулевого простран-
ства по определению считается равной 0.

Доказательство. Так как любой базис — порождающее линейно незави-


симое множество векторов, то число векторов в одном базисе, согласно
основной лемме, не превосходит числа векторов в другом базисе, откуда
и следует равенство этих чисел.

Теорема (о монотонности размерности). Пусть W — подпространство


конечнопорожденного векторного пространства V . Тогда dim W 6 dim V ,
причем dim W = dim V ⇔ W = V .

Доказательство. Это утверждение следует из теоремы о дополнении до


базиса, согласно которой любой базис подпространства W может быть
дополнен до базиса всего пространства V .

Итак, любое конечнопорожденное векторное пространство имеет цело-


численный параметр, называемый размерностью. В дальнейшем мы вме-
сто слова «конечнопорожденное» будем использовать термин «конечно-
мерное» или «n-мерное пространство», где n — размерность простран-
ства.

4 Суммы и пересечения пространств


Пусть W1 , . . . , Wm — произвольное семейство подпространств
Tm из вектор-
ного F -пространства V . Очевидно, что их пересечение
Sm i=1 Wi также
является подпространством в V , но их объединение i=1 Wi , в общем слу-
чае, не является подпространством в V , так как может быть не замкнуто

63
относительно сложения векторов. Вместо теоретико-множественной опе-
рации объединения в теории векторных пространств вводится понятие
суммы подпространств, в котором подSсуммой подпространств понима-
ется линейная оболочка объединения m i=1 Wi . Эта линейная оболочка,
с одной стороны, является наименьшим подпространством из V , содер-
жащим все Wi , i = 1, . . . , m, а с другой, совпадает с множеством сумм
векторов из различных Wi , i = 1, . . . , m, т.е.

hW1 , . . . , Wm i = {x1 + . . . + xm | xi ∈ Wi , i = 1, . . . , m} .
S
Поэтому линейная оболочка объединения m i=1 Wi называется суммой
подпространств Wi , i = 1, . . . , m и обозначается через W1 +. . .+Wm . Та-
ким образом hW1 , . . . , Wm i и W1 +. . .+Wm — два различных обозначения
для одного и того же подпространства, которое может называться сум-
мой подпространств Wi , линейной оболочкой подпространств Wi или под-
пространством, порожденным подпространствами Wi для i = 1, . . . , m.
Понятно, что размерность суммы или пересечения подпространств зави-
сит от их взаиморасположения. Один случай взаиморасположения под-
пространств будет для нас наиболее важен, и для этого случая вводится
специальный термин.

Определение. Будем говорить, что подпространства W1 , . . . , Wm ли-


нейно независимы, если из равенства x1 + . . . + xm = 0, где xi ∈ Wi , i =
1, . . . , m следует, что все xi = 0 для i = 1, . . . , m.

Другими словами, подпространства W1 , . . . , Wm линейно независимы, ес-


ли любой набор ненулевых представителей этих подпространств явля-
ется линейно независимым множеством векторов. Отсюда следует, что
объединение базисов линейно независимых подпространств W1 , . . . , Wm
образует базис их суммы W1 + . . . + Wm , и, следовательно, размерность
суммы линейно независимых подпространств равна сумме размерностей
слагаемых.
Для упрощения выражения «сумма линейно независимых подпространств»
введем термин «прямая сумма подпространств» и обозначение W1 ⊕
. . . ⊕ Wm для суммы линейно независимых пространств. С помощью это-
го обозначения утверждение о размерности прямой суммы записывается
следующим образом:

Теорема (о размерности прямой суммы).

dim(W1 ⊕ . . . ⊕ Wm ) = dim W1 + . . . + dim Wm .

64
Для двух подпространств существует простой критерий их линейной
независимости.

Лемма. W1 и W2 линейно независимы ⇔ W1 ∩ W2 = 0.

Доказательство. Пусть W1 и W2 — линейно независимые подпростран-


ства и x ∈ W1 ∩ W2 . Тогда x + (−x) = 0, x ∈ W1 , −x ∈ W2 ⇒ x = 0.
Обратно, пусть W1 ∩ W2 = 0 и x1 + x2 = 0, где x1 ∈ W1 , x2 ∈ W2 . Тогда
x1 = −x2 ⇒ x1 ∈ W1 ∩ W2 = 0 ⇒ x1 = 0 ⇒ x2 = 0.

Полученный критерий мы используем в доказательствах следующих утвер-


ждений:

Теорема (о прямом дополнении). Для любого подпространства W из


конечномерного векторного F -пространства V найдется такое подпро-
странство U 6 V , что
V = W ⊕ U.
Это подпространство U называется прямым дополнением к W в V .
Заметим, что прямое дополнение к W определено неоднозначно.

Доказательство. Возьмем произвольный базис {e1 , . . . , em } подпростран-


ства W и дополним его до базиса V :

{e1 , . . . , em , em+1 , . . . , em+k } .

Положим U = hem+1 , . . . , em+k i. Тогда W ∩ U = 0 и V = W + U. Следо-


вательно V = W ⊕ U.

Теорема (о размерности суммы). Для произвольных подпространств


W и U из конечномерного пространства справедливо равенство

dim(W + U) = dim W + dim U − dim W ∩ U.

Доказательство. Пусть D — прямое дополнение к подпространству W ∩


U в пространстве U. Так как W +U = W +D и W ∩D = 0, то dim(W +U) =
dim W +dim D. Заметим, что dim D = dim U −dim W ∩U, откуда и следует
требуемое равенство.

65
5 Координатизация пространств
Пусть V — произвольное конечномерное векторное F -пространство и
E = {e1 , . . . , en } — базис V . Тогда для любого v ∈ V , согласно определе-
нию базиса, существуют однозначно определенные элементы α1 , . . . , αn
из поля F , называемые координатами вектора v в базисе E, для которых

v = α1 e1 + . . . + αn en .

Положим (v)E = (α1 , . . . , αn )T . Таким образом, определено отображение


ϕ : V → F n пространства V в векторное пространство столбцов F n ,
сопоставляющее каждому вектору v ∈ V его координатный столбец в
базисе E:
ϕ(v) = (v)E .
Очевидно, что отображение ϕ есть биекция, причем

1) (x + y)E = (x)E + (y)E ,


2) (λx)E = λ (x)E

для любых x, y ∈ V и λ ∈ F .
Значит ϕ является изоморфизмом n-мерного F -пространства V на про-
странство столбцов F n . Определенный таким способом изоморфизм ϕ
называется координатизацией пространства V относительно базиса E.
В частности, отсюда следует
Теорема (об изоморфизме). Любое n-мерное векторное F -простоанство
изоморфно пространству столбцов F n .
Следствие 1. Все n-мерные векторные F -пространства изоморфны.
Следствие 2. Пусть V — n-мерное векторное F -пространство и F —
конечное поле порядка q. Тогда |V | = q n .

Ясно, что координатизация пространства зависит от выбора базиса этого


пространства. Пусть в пространстве V выбраны два базиса:

E = {e1 , . . . , en } и E ′ = {e′1 , . . . , e′n }

и заданы разложения векторов из E ′ в базисе E


e′1 = α11 e1 + . . . + α1n en
... , A = (αij ).

en = αn1 e1 + . . . + αnn en

66
Матрица S, столбцами которой являются координатные столбцы векто-
ров e′i в базисе E, называется матрицей перехода от базиса E к базису
E ′ . Другими словами, S = AT , где A = (αij ) — матрица коэффициентов
в указанных выше разложениях.
Если (v)E ′ = (λ′1 , . . . , λ′n )T , то

v = λ′1 e′1 + . . . + λ′n e′n = λ′1 (α11 e1 + . . . + α1n en ) +


+...+
+ λ′n (αn1 e1 + . . . + αnn en ) =
= (λ′1 α11 + . . . + λ′n αn1 )e1 + . . . + (λ′1 α1n + . . . + λ′n αnn )en
и, значит,
(v)E = S · (v)E ′ .
Полученная формула связывает между собой координаты вектора v в
базисах E и E ′ с помощью матрицы перехода S от базиса E к базису E ′.

6 Конечные поля
Первые шаги, сделанные нами в теории векторных пространств, позво-
ляют получить некоторые результаты и в других областях. В качестве
первого применения рассмотрим вопрос о мощности конечного поля.
Пусть F — произвольное поле ненулевой характеристики p и K — мно-
жество всех кратных 1 из F . Ранее было показано, что

K = {0, 1, . . . , p − 1} ,

где p = char F . Заметим, что множество K замкнуто относительно опера-


ций сложения и умножения. Более того, множество K образует подполе
в поле F , которое называется простым подполем поля F . Это простое
подполе K изоморфно кольцу вычетов Zp по простому модулю p.
Из аксиом поля следует, что абелеву группу (F, ·) можно рассматривать
как векторное пространство над полем K. Если поле F конечно, то, оче-
видно, F — конечномерное K-пространство и, согласно теореме об изо-
морфизме, |F | = |K|n , где n = dim F . Так как |K| = p, мы получаем

Теорема (о порядке конечного поля). Порядок конечного поля есть


некоторая степень p, где p — характеристика поля.

Следствие. Число векторов в конечномерном пространстве над конеч-


ным полем F есть некоторая степень p, где p = char F .

67
7 Ранг матрицы
Пусть V — произвольное конечномерное F -пространство и S — некоторое
множество векторов из V . Рангом множества S называется размерность
линейной оболочки S. Для ранга S мы будем использовать обозначение
rank S. Итак,
rank S = dimhSi.

Из определения размерности и её свойств следует, что ранг множества


S равен наименьшему размеру (мощности) подмножеств, через которые
линейно выражаются все векторы из S.
С помощью понятия ранга множества векторов можно ввести понятия
строчного и столбцового рангов матрицы A ∈ M(m×n, F ). Под строчным
рангом A понимается ранг множества её строк в пространстве строк F n ,
а под столбцовым рангом — ранг множества её столбцов в пространстве
столбцов F m .
Допустим, что в пространстве строк F n нашлись такие k строк (γp1, . . . , γpn ), p =
1, . . . , k, что любая строка матрицы A = (αij ) ∈ M(m×n, F ) представима
в виде некоторой линейной комбинации этих строк:
k
X
(αi1 , . . . , αin ) = βip (γp1, . . . , γpn ), i = 1, . . . , m.
p=1

Расписывая эти равенства по координатам, получаем


k
X
αij = βip γpj
p=1

или A = BC, где B = (βij ) — матрица размера m×k, C = (γij ) — матрица


размера k × n. Следовательно, для любого j = 1, . . . , n имеем
   
α1j k β 1p
 ..  X
γpj  ...  ,
 
 . =
αmj p=1 βmp
т.е. любой столбец матрицы A представим в виде линейной комбинации
k столбцов матрицы B.
Используя понятие ранга, мы можем переформулировать полученный
результат в следующем виде: солбцовый ранг A не превосходит строчного
ранга A. Меняя в этом утверждении слова «столбцовый» и «строчный»
с помощью транспонирования матрицы, заключаем:

68
Теорема-определение (о ранге матрицы). Для произвольной матри-
цы A её строчный ранг равен столбцовому рангу и называется просто
рангом матрицы A.

Обозначение: rank A.
Из доказательства теоремы мы видим, что ранг ненулевой матрицы A ∈
M(m×n, F ) равен наименьшему натуральному k, для которого найдутся
такие матрицы B ∈ M(m × k, F ) и C ∈ M(k × n, F ), что A = BC.

8 Системы линейных однородных уравнений


Мы знаем, что любое подпространство W из векторного F -пространства
V может быть задано в виде линейной оболочки некоторого множества
векторов, причем в случае конечномерного пространства V можно вы-
брать даже конечное порождающее множество векторов для W .
Другим общим способом задания подпространств является их представ-
ление в виде множества решений некоторой системы линейных однород-
ных уравнений с коэффициентами из поля F :

 a11 x1 + . . . + a1n xn = 0
...

am1 x1 + . . . + amn xn = 0

Системы такого вида, используя матричные обозначения, можно запи-


сать в более компактном виде

Ax = 0,

где A = (aij ), x = (x1 , . . . , xn )T и 0 = (0, . . . , 0)T .


Пусть теперь V — пространство столбцов F n и W — множество всех
решений системы Ax = 0, т.е.

W = {x ∈ F n | Ax = 0} .

Тогда

1) 0 ∈ W , т.к. A · 0 = 0,

2) x, y ∈ W ⇒ A(x + y) = Ax + Ay = 0 ⇒ x + y ∈ W ,

3) x ∈ W, λ ∈ F ⇒ A(λx) = λ(Ax) = 0 ⇒ λx ∈ W .

69
Таким образом, W является подпространством в V . Это подпространство
мы будем называть пространством решений системы Ax = 0.
Понятно также, что с помощью координатизации векторного простран-
ства мы можем применить новый способ построения подпространств в
любом n-мерном F -пространстве.
Возникает естественный вопрос: любое ли подпространство из простран-
ства столбцов F n есть пространство решений некоторой системы линей-
ных однородных уравнений? Этот вопрос вызывает другой, связанный
с выбором системы Ax = 0, пространство решений которой совпадает
с данным подпространством W .Конечно, выбор такой системы неодно-
значен, так как добавляя к ней любое уравнение, являющееся линейной
комбинацией уравнений системы, мы не изменим множество её реше-
ний. Однако, взяв линейную оболочку строк матрицы A в пространстве
строк F n , мы уже можем ставить проблему об однозначности соответ-
ствия между пространствами решений систем и пространствами, порож-
денными строками коэффициентов уравнений системы.
Анализ этих нетривиальных вопросов более удобно проводить в так на-
зываемой инвариантной форме, используя понятия линейной функции и
сопряженного пространства. Но, заметим, этот более короткий и удоб-
ный для теоретического изложения путь является в то же время и более
абстрактным и трудным для восприятия.

9 Линейные функции и сопряженное пространство


Пусть V — векторное F -пространство. Отображение f : V → F называ-
ется линейной функцией на V , если

1) f (x + y) = f (x) + f (y),

2) f (λx) = λf (x)

для любых x, y ∈ V и λ ∈ F .
На множестве всех линейных функций определим операции сложения и
умножения на элементы поля F :
Суммой линейных функций f и g называется функция, которая обозна-
чается через f + g и определяется следующим образом:

(f + g)(x) = f (x) + g(x) , x ∈ V.

70
Произведением линейной функции f на элемент поля λ ∈ F называет-
ся функция, которая обозначается через λf и определяется следующим
образом:
(λf )(x) = λf (x) , x ∈ V.

Нетрудно понять, что эти операции определены корректно, т.е. суммы


линейных функций и их произведения на элементы поля F снова пред-
ставляют собой линейные функции на V . Более того, эти операции опре-
деляют на множестве всех линейных функций структуру векторного про-
странства над полем F , которое называется пространством сопряжён-
ным к V и обозначается через V ∗ .
Проверку справедливости всех аксиом векторного пространства можно
не делать, т.к. существует простая интерпретация указанных операций в
координатном виде. А именно, пусть E = {e1 , . . . , en } — базис простран-
ства V , x = x1 e1 +. . .+xn en и f ∈ V ∗ . Тогда f (x) = x1 f (e1 )+. . .+xn f (en ).
Таким образом, линейная функция однозначно определена своими зна-
чениями на базисных векторах.
Строка (f )E = (f (e1 ), . . . , f (en )) называется строкой коэффициентов ли-
нейной функции f в базисе E. Используя обозначение (f )E , мы можем
записать
 
x1
f (x) = (f )E · (x)E = (f (e1 ), . . . , f (en )) ·  ...  .
 
xn

Обратно, беря произвольную строку (f1 , . . . , fn ) ∈ F n и полагая f (x) =


(f1 , . . . , fn ) · (x)E , мы получаем линейную функцию f на V . Значит сопо-
ставление f → (f )E каждой линейной функции на V её строки коэффи-
циентов в базисе E является биекцией пространства V ∗ на пространство
строк F n . Заметим также, что это отображение V ∗ → F n удовлетворяет
условиям

1) (f + g)E = (f )E + (g)E ,
2) (λf )E = λ (f )E

для любых f, g ∈ V ∗ и λ ∈ F .
Отсюда следует, во-первых, что операции сложения и умножения на
элементы поля F , определенные на V ∗ , удовлетворяют всем аксиомам
векторного F -пространства и, во-вторых, справедливость следующего
утверждения:

71
Теорема (об изоморфизме V и V ∗ ). Пусть V — n-мерное F -пространство.
Тогда сопряженное пространство V ∗ изоморфно пространству строк
F n . В частности, dim V ∗ = n и пространство V ∗ изоморфно простран-
ству V .

В качестве базиса пространства V ∗ можно взять, например, линейные


функции e∗1 , . . . , e∗n , строки коэффициентов которых в базисе E имеют
вид
(e∗1 )E = (1, 0, . . . , 0)
...

(en )E = (0, 0, . . . , 1).
Базис E ∗ = {e∗1 , . . . , e∗n } пространства V ∗ называется базисом сопряжён-
ным к базису E, а базисные функции из E ∗ называются координатными
функциями для базиса E.
С помощью координатных функций, мы можем разложение вектора x ∈
V по базисным векторам из E записать в виде:
x = e∗1 (x)e1 + . . . + e∗n (x)en ,
так как e∗i (x) есть i-я координата вектора x в базисе E.
Зафиксируем теперь вектор x ∈ V и сопоставим каждой функции f ∈ V ∗
элемент поля f (x). Из определения операций в сопряженном простран-
стве следует, что полученное отображение x : V ∗ → F есть линейная
функция на V ∗ . Тем самым каждому вектору x из V можно сопоставить
некоторую линейную функцию x на сопряженном пространстве V ∗ , т.е.
некоторый элемент из V ∗∗ .
Теорема (о каноническом изоморфизме V и V ∗∗ ). Сопоставление каж-
дому вектору x из конечномерного пространства V элемента из V ∗∗ по
правилу
x→x
является изоморфизмом пространства V на пространство V ∗∗ . (Этот
изоморфизм называется каноническим).

Доказательство. Из определения линейных функций следует, что x + y =


x + y и λx = λx. Тем самым, нам остается показать, что данное сопостав-
ление есть биекция V на V ∗∗ .
Возьмем произвольный базис E = {e1 , . . . , en } пространства V и пусть
E ∗ = {e∗1 , . . . , e∗n } — сопряженный к E базис пространства V ∗ . Тогда

∗ ∗ 1 , i=j
ei (ej ) = ej (ei ) =
0 , i 6= j

72
так что {e1 , . . . , en } — базис пространства V ∗∗ сопряжённый базису E ∗
пространства V ∗ .
Заметим, что отображение x → x переводит вектор с координатами
x1 , . . . , xn в базисе E в вектор с такими же координатами в базисе {e1 , . . . , en }
пространства V ∗∗ . Следовательно, отображение x → x есть биекция.
Замечание. В дальнейшем мы будем отождествлять пространства V и
V ∗∗ посредством канонического изоморфизма, т.е. рассматривать вектор
x ∈ V в то же время и как линейную функцию на V ∗ .

10 Аннуляторы подпространств
С помощью понятий, введенных в предыдущем разделе, легко ответить
на вопросы, связанные с заданием подпространств системами линейных
однородных уравнений. Полученные ответы будут сформулированы в
терминах аннуляторов подпространств, которые выявляют единую, по
существу, природу двух соответствий между подпространствами из V и
из V ∗ .
Во-первых, отметим, что пространство W решений системы линейных
однородных уравнений в инвариантной форме может быть задано как

W = {x ∈ V | fi (x) = 0, i = 1, . . . , m, fi ∈ V ∗ } .

Если взять линейную оболочку U = hf1 , . . . , fm i в пространстве V ∗ , то,


очевидно,
W = {x ∈ V | f (x) = 0, f ∈ U} .
Таким образом, для любого подпространства U 6 V ∗ определено про-
странство W решений уравнений f (x) = 0, f ∈ U.
Во-вторых, для любого подпространства W 6 V множество всех линей-
ных функций из V ∗ , принимающих нулевое значение на W , является
подпространством в V ∗ .
Учитывая нашу договоренность о совпадении V и V ∗∗ , мы можем опре-
делить указанные соответствия между подпространствами из V и V ∗ на
едином языке:

Определение. Аннулятором подпространства W из векторного про-


странства L называется множество

W 0 = {f ∈ L∗ | f (x) = 0 для любого x ∈ W } .

73
Заменяя в определении аннулятора L на V или V ∗ , мы получаем два
соответствия между подпространствами из V и V ∗ .
Очевидно, что W 0 — подпространство в L∗ .

Теорема (о размерности аннулятора).

dim W 0 + dim W = dim L.

Доказательство. Пусть {e1 , . . . , ek } — базис W . Дополним его до бази-


са {e1 , . . . , ek , ek+1 , . . . , en } всего пространства L и пусть {e∗1 , . . . , e∗n } —
сопряженный к нему базис пространства L∗ . Тогда, очевидно, W 0 =
he∗k+1 , . . . , e∗n i.

Теорема (об инволютивности аннулятора).


0
W0 =W для любого W 6 L.

Доказательство. В обозначениях теоремы о размерности аннулятора,


ясно, что 0
W 0 = he1 , . . . , ek i = W.

Следствие. Любое подпространство из L является аннулятором неко-


торого подпространства из L∗ .

Другими словами, свякое подпространство является пространством ре-


шений некоторой системы линейных однородных уравнений. Более того,
линейная оболочка линейных функций из этой системы определена одно-
значно. Из теоремы об инволютивности аннулятора вытекает ряд других
важных утверждений.

Теорема (свойства аннулятора). 1) W 6 U ⇒ W 0 > U 0 ,

2) W = U ⇔ W 0 = U 0 ,

3) (W1 + W2 )0 = W10 ∩ W20 ,

4) (W1 ∩ W2 )0 = W10 + W20 .

Доказательство. 1) непосредственно следует из определения аннулято-


ра.
2) следует из инволютивности аннулятора.

74
3) Wi 6 W1 + W2 , i = 1, 2 ⇒ Wi0 > (W1 + W2 )0 ⇒
⇒ W10 ∩ W20 > (W1 + W2 )0 . Обратное включение W10 ∩ W20 6 (W1 + W2 )0
следует из определения аннулятора.
4) Используя пункт 3 и инволютивность аннулятора, получаем
0 00
(W1 ∩ W2 )0 = (W100 ∩ W200 ) = (W10 + W20 ) = W10 + W20 .

75
Лекции 16-17. Геометрия векторных пространств.

1 Аффинные подпространства
Обобщением понятия подпространства в векторном пространстве явля-
ется понятие аффинного подпространства. Изучение взаиморасположе-
ния аффинных подпространств составляет основное содержание аффин-
ной геометрии векторного пространства. Таким образом, кроме алгеб-
раической структуры на векторном пространстве определена еще и гео-
метрическяа структура, позволяющая более наглядно описывать многие
тонкие свойства векторных пространств.

Определение 1. Подмножество L из векторного пространства V назы-


вается аффинным подпространством в V , если существуют такие a ∈ V
и W 6 V , что
L = W + a = {x + a | x ∈ W } .

Очевидно, что любое подпространство является также и аффинным под-


пространством, но обратное неверно.

Задача 1. Пусть ai ∈ V, Wi 6 V, i = 1, 2. Тогда

a1 + W1 = a2 + W2 ⇔ W1 = W2 и a1 − a2 ∈ W1 .

Заметим, что W = {x − y | x, y ∈ L}. Отсюда следует, что подпростран-


ство W определено однозначно для аффинного подпространства L. Это
подпространство W называется направляющим пространством или на-
правлением аффинного подпространства L. Направление L мы будем
обозначать через V (L).
Вектор a в определении L, наоборот, определен неоднозначно:

a1 + W = a2 + W ⇔ a1 − a2 ∈ W.

В качестве вектора a в определении L может быть взят произвольный


вектор из L.
Подводя первый итог обсуждения понятия аффинного подпространства,
мы можем сформулировать простой критерий равенства двух аффинных
подпространств:

Теорема (критерий равенства). Два аффинных подпространства L1 и


L2 совпадают ⇔ L1 ∩ L2 6= ∅ и V (L1 ) = V (L2 ).

76
Важным числовым инвариантом аффинного подпространства является
его размерность.

Определение 2. Размерностью аффинного подпространства L назы-


вается размерность его направляющего пространства V (L).

Обозначение: dim L.
Существуют специальные названия n-мерных аффинных подпространств
для некоторых значений n. Так, 0-мерные аффинные подпространства
называют точками, 1-мерные аффинные подпространства — прямыми,
2-мерные аффинные подпространства — плоскостями. Аффинное под-
пространство L из векторного пространства V называют гиперплоско-
стью, если dim L = dim V − 1.
Пользуясь геометрическим языком, мы можем переформулировать кри-
терий равенства следующим образом: два аффинных подпространства
совпадают в том и только том случае, если они проходят через одну
точку и имеют равные направления.

Задача 2. Доказать, что аффинное подпространство L является под-


пространством в векторном пространстве V ⇔ L проходит через точку
0.

Задача 3. Пусть L1 и L2 — аффинные подпространства в векторном


пространстве V . Доказать

1) L1 = L2 ⇔ L1 ⊂ L2 & dim L1 = dim L2 .

2) L1 ⊂ L2 ⇔ V (L1 ) 6 V (L2 ) и L1 ∩ L2 6= ∅.

3) L1 ⊂ L2 ⇒ dim L1 6 dim L2 .

Таким образом, имеется точный аналог теоремы о монотонности размер-


ности для аффинных подпространств:

Теорема (о монотонности размерности). Пусть L1 и L2 — аффинные


подпространства. Тогда

L1 ⊂ L2 ⇒ dim L1 6 dim L2 , причем


L1 = L2 ⇔ dim L1 = dim L2

Теперь несколько слов о способах задания аффинных подпространств.


Мы знаем, что любое подпространство W в конечномерном векторном

77
пространстве V есть пространство решений некоторой системы линей-
ных однородных уравнений, т.е.
∃fi ∈ V ∗ , i = 1, . . . , k : W = {x ∈ V | fi (x) = 0, i = 1, . . . , k} .
Тогда аффинное подпространство L = a + W совпадает с множеством
решений M системы линейных уравнений следующего вида:
M = {y ∈ V | fi (y) = fi (a), i = 1, . . . , k} .
Действительно, пусть y ∈ L. Тогда y = a + x для некоторого x ∈ W и,
следовательно, fi (y) = fi (a + x) = fi (a) + fi (x) = fi (a) ⇒ y ∈ M.
Обратно, пусть y ∈ M. Тогда fi (y) = fi (a) ⇒ fi (y − a) = 0 ⇒ y − a ∈
W ⇒ y ∈ a + W = L.
Таким образом, любое аффинное подпространство есть множество реше-
ний некоторой системы линейных уравнений на V . Обратное не всегда
верно. Не любая система линейных уравнений задает некоторое аффин-
ное подпространство. Дело в том, что система линейных уравнений мо-
жет быть несовместна, т.е. не иметь решений, и в этом случае множество
решений системы пусто.
Задача 4. Доказать, что множество решений совместной системы ли-
нейных уравнений на векторном пространстве есть аффинное подпро-
странство.

2 Барицентрические комбинации
Задача 5. Пусть L — аффинное подпространство в V . Доказать, что
L — подпространство в V , если выполнено одно из условий:

1) 0 ∈ L,
2) ∃a, b ∈ L : a + b ∈ L,
3) ∃a ∈ L ∃λ ∈ F : λ 6= 1 и λa ∈ L.
Задача 6. Пусть L — произвольное подмножество из V . Доказать, что
L 6 V ⇔ L 6= ∅ и L замкнуто относительно линейных комбинаций
векторов.

Нетрудно понять, что в отличие от подпространств аффинные подпро-


странства, в общем случае, не замкнуты ни относительно сложения век-
торов, ни относительно умножения на элементы поля. Тем не менее аф-
финные подпространства замкнуты относительно линейных комбинаций
специального вида.

78
P
Определение 3. Линейную P комбинацию векторов αi xi будем назы-
вать барицентрической, если αi = 1.
Теорема (критерий аффинности). Следующие условия для подмноже-
ства L из V равносильны:

1) L — аффинное подпространство;
2) L непусто и замкнуто относительно взятия барицентрических
комбинаций векторов.

Доказательство. (1) ⇒ (2).


Пусть L — аффинное подпространство,
P P xi ∈ L, i = 1,P
P i ∈ F и
. . . , k, αP
α
P i = 1. Тогда
P xi = w
Pi +a ⇒ α x
i i = α i (w i +a) = α w
i i + αi a =
αi wi + ( αi ) a = αi wi + a ∈ L.
(2) ⇒ (1).
Пусть L непусто и замкнуто относительно барицентрических комбина-
ций векторов. Зафиксируем некоторый вектор a ∈ L и положим W =
{x − a | x ∈ L}. Понятно, что L = W + a. Поэтому нам достаточно пока-
зать, что W — подпространство в V .
1) 0 = a − a ∈ W .
2) Пусть w ∈ W и λ ∈ F . Тогда

λw = λ(x − a) = λx + (1 − λ)a − a.

Заметим, что λx + (1 − λ)a ∈ L. Следовательно, λw ∈ W .


3) Пусть v, w ∈ W . Покажем, что v + w ∈ W . Действительно, так как
v, w ∈ W , то ∃x, y ∈ L : v = x − a, w = y − a ⇒ v + w = x − a + y − a.
Но x − a + y есть барицентрическая комбинация векторов x, a, y из L и,
в силу нашего предположения, x − a + y ∈ L. Значит v + w ∈ W .

Естественно возникает вопрос: нельзя ли ослабить второе условие в кри-


терии аффинности, заменив замкнутость L относительно барицентриче-
ских комбинаций произвольных наборов векторов на барицентрические
комбинации двух векторов из L. Оказывается, в общем случае, такое
ослабление невозможно. Если поле F состоит лишь из двух элементов
0 и 1, то барицентрические комбинации двух векторов будут исчерпы-
ваться векторами a и b. Таким образом, замкнутость L относительно
барицентрических комбинаций двух векторов над полем F = Z2 не яв-
ляется ограничением и любое подмножество удовлетворяет ему. В то же
время, нетрудно понять, что не любое подмножество из Z2 -пространства
является аффинным подпространством.

79
Что касается барицентрических комбинаций трех векторов, то внима-
тельно просмотрев доказательство критерия аффинности, мы видим, что
в доказательстве импликации (2) ⇒ (1) использовалась замкнутость L
относительно барицентрических комбинаций лишь трех векторов. Таким
образом, справедлива

Теорема. Если непустое множество L замкнуто относительно взя-


тия барицентрических комбинаций любых трех векторов, то L — аф-
финное подпространство.

Задача 7. Доказать, что в случае F 6= Z2 для аффинности непустого


множества L достаточно замкнутости относительно взятия барицентри-
ческих комбинаций любых двух векторов из L.

Решение. Из доказательства импликации (2) ⇒ (1) в критерии аффин-


ности видно, что только в пункте 3, где доказывается замкнутость W от-
носительно сложения, используются барицентрические комбинации трех
векторов. Точнее, нам требуется для любых x, a, y ∈ L показать, что
x − a + y ∈ L.
Согласно условию задачи

αx + (1 − α)a ∈ L для любого α ∈ F,


βy + (1 − β)a ∈ L для любого β ∈ F.

Значит z = γ(αx + (1 − α)a) + (1 − γ)(βy + (1 − β)a) ∈ L для любого γ ∈ F .


Попытаемся подобрать α, β, γ таким образом, чтобы z = x − a + y.
Нетрудно проверить, что

z = αγx + (γ(1 − α) + (1 − γ)(1 − β))a + β(1 − γ)y.

Таким образом, чтобы выполнялось равенство z = x − a + y, достаточно


найти решение в поле F следующей системы уравнений:

 αγ = 1 
αγ = 1
γ(1 − α) + (1 − γ)(1 − β) = −1 ⇔
 β(1 − γ) = 1
β(1 − γ) = 1

Так как F 6= Z2 , то найдется λ ∈ F − {0, 1}. Положим γ = λ, α = λ1 , β =


1
1−λ
. Понятно, что эти значения α, β, γ удовлетворяют нашей системе,
и значит L — аффинное подпространство.

80
3 Аффинные оболочки
Задача 8. Доказать, что барицентрическая комбинация конечного чис-
ла барицентрических комбинаций векторов x1 , . . . , xn является барицен-
трической комбинацией этих векторов.

Из критерия аффинности следует


Теорема (о пересечении аффинных подпространств). Пересечение лю-
бого семейства аффинных подпространств либо пусто, либо является
аффинным подпространством.

С помощью теоремы о пересечении мы можем определить аффинную


оболочку непустого множества векторов.
Определение. Для любого непустого множества M из векторного про-
странства V через aff (M) будем обозначать пересечение всех аффинных
подпространств из V , содержащих M. Так как M 6= ∅, то, согласно
теореме о пересечении, aff (M) — аффинное подпространство. Это аф-
финное подпространство мы будем называть аффинной оболочкой M.

Понятно, что aff (M) — наименьшее аффинное подпространство, содер-


жащее M. В частности, aff (M) содержит любую барицентрическую ком-
бинацию векторов из M. Оказывается, справедлива
Теорема (об аффинной оболочке). Аффинная оболочка M совпадает с
множеством всех барицентрических комбинаций векторов из M.

Доказательство. Нам достаточно показать, что барицентрическая ком-


бинация трех барицентрических комбинаций векторов из M есть бари-
центрическая комбинация векторов из M. Действительно, пусть x1 , . . . , xn ∈
M и P P
x = P αi xi , P αi = 1
y = P βi xi , P βi = 1
z = γi xi , γi = 1.
Тогда для любых α, β, γ таких, что α + β + γ = 1, получаем
P P P
αx + βy + γz = α(
P αi xi ) + β( βi xi ) + γ( γi xi ) =
= (ααi + ββi + γγi )xi .
В полученной барицентрической комбинации сумма коэффициентов рав-
на P P P P
(ααi + ββi + γγi ) = α αi + β βi + γ γi =
= α + β + γ = 1.

81
4 Аффинная зависимость
Определение. Точки x1 , . . . , xn будем называть аффинно независимы-
ми, если любая точка из их аффинной оболочки aff (x1 , . . . , xn ) един-
ственным образом представима в виде барицентрической комбинации
точек x1 , . . . , xn , т.е.
X X X X
αi xi = βi xi , αi = βi = 1 ⇒ αi = βi , i = 1, . . . , n. (*)

В противном случае точки x1 , . . . , xn будем называть аффинно зависи-


мыми.

Условие (*) аффинной независимости точек, как это нетрудно увидеть,


равносильно следующему условию:
X X
γi xi = 0, γi = 0 ⇒ γi = 0, i = 1, . . . , n. (**)

Условие (**), в свою очередь, может быть переформулировано следую-


щим образом: P
Из равенства γi = 0 следует, что γ1 = −γ2 − . . . − γn . Значит

(−γ2 − . . . − γn )x1 + γ2 x2 + . . . + γn xn = γ2 (x2 − x1 ) + . . . + γn (xn − x1 ) = 0.

Так как на коэффициенты γ2 , . . . , γn не наложено никаких ограничений,


то условие (**) равносильно следующему условию:

векторы x2 − x1 , . . . , xn − x1 линейно независимы. (***)

Задача 9. Доказать, что направляющее пространство аффинной обо-


лочки множества точек M порождается множеством векторов {x − a | x ∈ M},
где a — произвольный фиксированный вектор из M.
Задача 10. Доказать, что точки x1 , . . . , xn аффинно независимы ⇔ раз-
мерность их аффинной оболочки равна n − 1.

По аналогии с координатами вектора относительно некоторого базиса


векторного пространства можно ввести понятие барицентрических ко-
ординат точек в аффинной оболочке аффинно независимых точек.
Пусть x1 , . . . , xn — произвольные аффинно независимые точки. Тогда
любая точка x ∈ aff (x1 , . . . , xn ) единственным образом представима в
виде барицентрической комбинации точек x1 , . . . , xn
X
x = α1 x1 + . . . + αn xn , αi = 1.

82
Элементы α1 , . . . , αn называют барицентрическими координатами точ-
ки x относительно точек x1 , . . . , xn .
С помощью барицентрических координат точек легко проверяется их
аффинная независимость:
Теорема (критерий аффинной независимости). Точки p1 , . . . , pk аффин-
но независимы ⇔ ранг матрицы, составленной из их барицентрических
координат, равен k.

Доказательство. Пусть αi1 , . . . , αin — барицентрические координаты точ-


ки pi относительно аффинно независимых точек x1 , . . . , xn , то есть
P P
pi =
P j αij xj , j αij = 1, или
pi − x1 = α
j>1 ij (xj − x1 ).
Другими словами, αi2 , . . . , αin — координаты вектора pi − x1 в базисе
{x2 − x1 , . . . , xn − x1 }.
Ранг матрицы  
α11 α12 . . . α1n

A= .. 
. 
αk1 αk2 . . . αkn
не изменится, если прибавить к первому столбцу сумму всех остальных.
При этом мы получим матрицу
 
1 α12 . . . α1n
 1 
 
 .. . . .
 . . 
1 αk2 . . . αkn
Вычтя из каждой строки первую строку, что также не изменит ранг
матрицы, мы получим матрицу
 
1 α12 ... α1n
 0 α22 − α12 . . . α2n − α1n 
 
 .. .. ,
 . . 
0 αk2 − α12 . . . αkn − α1n
ранг которой на единицу больше ранга матрицы
 
α22 − α12 . . . α2n − α1n
B=
 .. 
,
.
αk2 − α12 . . . αkn − α1n

83
элементы которой есть координаты векторов pi −p1 в базисе x2 −x1 , . . . , xn −
x1 .
Таким образом, ранг матрицы A равен k ⇔ ранг матрицы B равен k − 1,
но последнее как раз и означает, что векторы p2 − p1 , . . . , pk − p1 линейно
независимы, или, что то же самое, точки p1 , . . . , pk аффинно независимы.

5 Взаиморасположение точек, прямых и плоскостей


Напомним, что прямой в векторном F -пространстве V называется аф-
финное подпространство с 1-мерным направляющим пространством, а
плоскостью — аффинное подпространство с 2-мерным направляющим
пространством. Таким образом, любая прямая L может быть представ-
лена в виде
L = {a + λw | λ ∈ F } ,
где w — произвольный ненулевой вектор направляющего пространства
V (L). Этот вектор называется направляющим вектором прямой L. Он,
очевидно, определен неоднозначно. Указанное представление прямой L
называется параметрическим заданием L.
Наряду с параметрическим заданием, применяется и двойственный спо-
соб задания с помощью аннулятора направляющего пространства V (L):

L = x ∈ V | f (x) = f (a), f ∈ (V (L))0 .

Понятно, что для задания L с помощью линейных уравнений достаточно


брать лишь порождающие линейные функции f ∈ (V (L))0 . Таким обра-
зом, любую прямую L в n-мерном пространстве можно задать с помощью
системы из n − 1 линейных уравнений вида f (x) = f (a), где a — фикси-
рованная точка из L. Этот способ представления L мы будем называть
заданием L системой линейных уравнений.
Наконец, третьим способом задания прямой является её представление
в виде аффинной оболочки двух различных точек:

L = {αa + (1 − α)b | α ∈ F } .

В этом способе задания любая точка, лежащая на прямой L, представи-


ма единственным образом в виде барицентрической комбинации точек
a, b ∈ L, и потому третье представление прямой мы будем называть ба-
рицентрическим.

84
Аналогичными способами можно задавать аффинные подпространства
любой размерности. При этом, используя барицентрическое задание, необ-
ходимо учитывать, что m-мерное аффинное подпространство есть аф-
финная оболочка m + 1 аффинно независимых точек. Например, плос-
кость есть аффинная оболочка трех точек, не лежащих на одной прямой.
Нетрудно показать, что взаиморасположение точек, прямых и плоско-
стей в векторном пространстве удовлетворяет всем аксиомам инцидент-
ности (или связи) из аксиоматики Гильберта (т.е. первая и четвертая
группы аксиом Гильберта из его «Оснований геометрии») Ниже приво-
дятся для самостоятельного доказательства небольшие вариации аксиом
инцидентности и некоторые их следствия:

Задача 11. Для любых двух различных точек существует единственная


прямая, которая проходит через каждую из этих точек.

Задача 12. Любая прямая равномощна полю F , над которым опреде-


лено векторное пространство.

Задача 13. Для любых трех точек, не лежащих на одной прямой, су-
ществует единственная плоскость, проходящая через каждую из этих
точек.

Задача 14. Любая плоскость равномощна множеству F 2 , где F — поле,


над которым определено векторное пространство.

Задача 15. Если две различные точки прямой лежат на некоторой плос-
кости, то и любая точка прямой лежит на этой плоскости.

Задача 16. Если две плоскости, расположенные в 3-мерном аффинном


подпространстве, имеют общую точку, то они имеют и общую прямую.

Задача 17. Через прямую и не лежащую на ней точку проходит един-


ственная плоскость.

Задача 18. Через две различные пересекающиеся прямые проходит един-


ственная плоскость.

Для формулировки следующей задачи нам потребуется дополнительный


термин.

Определение. Две прямые, лежащие в одной плоскости и не имеющие


общих точек, называются параллельными.

85
Задача 19. Пусть L — произвольная прямая и a — точка, лежащая вне
прямой L. Тогда в плоскости, определенной точкой a и прямой L, можно
провести единственную прямую, проходящую через a и параллельную L.

Выходя за пределы аксиоматики Гильберта, мы можем сформулировать


простой критерий параллельности двух прямых:
Задача 20. Две прямые, не имеющие общих точек, параллельны ⇔ на-
правляющие пространства этих прямых совпадают.

6 Теоремы Менелая и Чевы


Упрощая обозначения, прямую L, проходящую через различные точки a
и b, будем обозначать через ab.
Рассмотрим следующую ситуацию: пусть a, b, c — точки, не лежащие на
одной прямой, точки x, y, z лежат на сторонах bc, ca и ab треугольника
abc, причем
x = βb + (1 − β)c
y = γc + (1 − γ)a
z = αa + (1 − α)b.

c
b

x
b

y
b

z
b b b

a b

Теорема Менелая. Точки x, y, z лежат на одной прямой ⇔ αβγ +


(1 − α)(1 − β)(1 − γ) = 0.

Доказательство. Так как


x = 0·a + β · b + (1 − β)c
y = (1 − γ)a + 0·b + γ ·c
z = α · a + (1 − α)b + 0·c ,

86
то матрица барицентрических координат точек x, y, z относительно то-
чек a, b, c имеет вид
 
0 β 1−β
 1−γ 0 γ .
α 1−α 0

Согласно критерию аффинной независимости, точки x, y, z лежат на


одной прямой тогда и только тогда, когда ранг этой матрицы < 3, т.е. её
определитель равен 0 или αβγ + (1 − α)(1 − β)(1 − γ) = 0.

Для формулировки и доказательства теоремы Чевы нам потребуются


понятие чевианы и некоторые их свойства.
Пусть a, b, c — точки, не лежащие на одной прямой, и точка x ∈ bc. Тогда
прямая ax называется чевианой треугольника abc. Допустим теперь, что
на стороне ca треугольника abc взята еще одна точка y, и рассмотрим
взаиморасположение чевиан ax и by.

c
b

y
b
b
x
b

a b b b

Лемма 1. Пусть
x = βb + (1 − β)c
y = γc + (1 − γ)a.
Тогда

1) Чевианы ax и by совпадают ⇔ y = a, x = b.

2) Чевианы ax и by параллельны ⇔ 1 − β + βγ = 0, γ 6= 1, β 6= 1.

3) Чевианы ax и by имеют одну общую точку ⇔ 1 − β + βγ 6= 0.

87
Доказательство.
ax = {t1 a + (1 − t1 )x | t1 ∈ F } =
= {t1 a + (1 − t1 )βb + (1 − t1 )(1 − β)c | t1 ∈ F }
by = {t2 b + (1 − t2 )y | t2 ∈ F } =
= {(1 − t2 )(1 − γ)a + t2 b + (1 − t2 )γc | t2 ∈ F } .

Понятно, что общие точки чевиан ax и by определяются с помощью пара-


метров t1 и t2 , которые удовлетворяют следующей системе (Σ) линейных,
относительно t1 и t2 , уравнений

t1 = (1 − t2 )(1 − γ)
(Σ)
t2 = (1 − t1 )β

Замечание. Равенство третьих барицентрических координат следует из


равенства первых двух координат.
Следовательно,

1) Чевианы ax и by совпадают ⇔ система (Σ) имеет более одного ре-


шения.
2) Чевианы ax и by параллельны ⇔ система (Σ) несовместна.

3) Чевианы ax и by имеют одну общую точку ⇔ система (Σ) имеет


единственное решение.

Исключая t2 из первого уравнения системы (Σ), получаем уравнение

(1 − β + βγ)t1 = (1 − β)(1 − γ).

Значит, (Σ) имеет более одного решения ⇔ 1 − β + βγ = (1 − β)(1 − γ) =


0 ⇔ β = 1, γ = 0 ⇔ x = b, y = a.
Система (Σ) несовместна ⇔ 1 − β + βγ = 0, γ 6= 1, β 6= 1.
Система (Σ) имеет единственное решение ⇔ 1 − β + βγ 6= 0.

Возьмем теперь еще одну точку z на стороне ab треугольника abc и пусть


z = αa + (1 − α)b.
Теорема Чевы. Предположим, что каждая пара из трех чевиан ax, by, cz
имеет одну общую точку. Тогда
чевианы ax, by, cz имеют общу точку ⇔

αβγ = (1 − α)(1 − β)(1 − γ).

88
c
b

y
b
b
x
b

a b b b b
z

Доказательство.
x = βb + (1 − β)c
y = γc + (1 − γ)a
z = αa + (1 − α)b.
Чевианы ax, by, cz имеют общую точку ⇔ совместна следующая система
уравнений относительно t1 , t2 , t3 ∈ F :

t1 x + (1 − t1 )a = t2 y + (1 − t2 )b = t3 z + (1 − t3 )c
или
(1 − t1 )a + t1 βb + t1 (1 − β)c =
= t2 (1 − γ)a + (1 − t2 )b + t2 γc =
= t3 αa + t3 (1 − α)b + (1 − t3 )c .

Так как точки a, b, c аффинно независимы, то полученная система рав-


носильна следующей

1 − t1 = t2 (1 − γ) = t3 α
(1)
t1 β = 1 − t2 = t3 (1 − α).

Исключая из системы (1) неизвестные t1 и t2 , получим



t3 (1 − γ + αγ) = 1 − γ
(2)
t3 (1 − α + αβ) = β.

Согласно условию теоремы, 1 − α + αβ 6= 0, и поэтому система (2) сов-


местна ⇔
β(1 − γ + αγ) = (1 − γ)(1 − α + αβ)
или
αβγ = (1 − α)(1 − β)(1 − γ).

89
7 Задача Сильвестра о коллинеарных точках
В конце 19 века английский математик Сильвестр выдвинул гипотезу,
которая позднее стала называться задачей Сильвестра о коллинеарных
точках. Эта гипотеза может быть сформулирована в следующем виде:
если n точек не лежат на одной прямой, то существует, по крайней мере,
одна прямая, проходящая в точности через две из этих точек. Задачу
Сильвестра несложно переформулировать для точек и прямых из век-
торного F -пространства.
Обобщенная задача Сильвестра. Верно ли, что если n точек из F -
пространства не лежат на одной прямой, то существует, по крайней
мере, одна прямая, проходящая в точности через две из этих точек?
Ответ на поставленный вопрос зависит от количества точек и поля F .
Очевидно, что в случае F = Z2 ответ будет положительным для лю-
бого n. Этот факт является следствием того, что любая прямая в Z2 -
пространстве состоит лишь из двух точек.
С другой стороны, если F — конечное поле, отличное от Z2 , то, взяв в ка-
честве точек, не лежащих на одной прямой, все точки из F -пространства
размерности > 2, мы не сможем найти прямой, проходящей в точности
через две точки. Таким образом, в этом случае ответ отрицательный.
Анализ обобщённой задачи Сильвестра в случае произвольного значения
n и любого поля F может быть проведен следующим образом.
Пусть P — множество из n точек из F -пространства, не лежащих на
одной прямой, и

L = {ab ∩ P | a и b — различные точки из P }

Ясно, что ответ на вопрос Сильвестра будет положительным, если неко-


торый элемент из L содержит ровно две точки, т. е. |ab ∩ P | = 2 для
некоторых различных точек a, b ∈ P .
Если ответ отрицательный, то любое пересечение ab ∩ P содержит, по
крайней мере, три точки, и мы получим в конечном множестве P семей-
ство подмножеств L, удовлетворяющих условиям:

1) любой элемент L содержит более двух точек;

2) для любых двух различных точек из P существует единственный


элемент L, содержащий эти точки;

3) P ∈
/ L.

90
Полученная конфигурация (P, L) называется конечным пространством
прямых, а элементы семейства L, ради простоты, называют прямыми
этого пространства прямых.
Дальнейший анализ ситуации распадается на исспледование двух вопро-
сов:
Вопрос 1. Существуют ли конечные пространства прямых, состоящие
из n точек? Если существуют, то описать, с точностью до обозначения
точек, все такие пространства.
Вопрос 2. Реализуется ли данное пространтсво прямых в виде мно-
жества точек P векторного F -пространства и семейства пересечений
L = {ab ∩ P | a, b — различные точки из P }? Если реализуется, то для
каких полей F ?
Далее мы рассмотрим обобщенную задачу Сильвестра для n 6 8, анали-
зируя ситуацию указанным выше способом.

Теорема (о небольших пространствах прямых). Существует единствен-


ное, с точностью до обозначения точек, пространство прямых, содер-
жащее не более 8 точек.

P = {1, 2, 3, 4, 5, 6, 7}
6 4 L = {123, 345, 561, 275, 471, 673, 246}
7

1 2 3

Замечание. Это пространство прямых мы будем называть плоскостью


Фано.

Доказательство. Пусть (P, L) — пространство прямых и |P | 6 8. Тогда

1) Любая прямая L ∈ L содержит ровно 3 точки. Действительно, со-


гласно определению пространства прямых, |L| > 3. Если |L| > 4,
то |P | > 9.

91
1

6
7
8
9
2
3
4
5 L

2) Через любую точку a ∈ P проходят точно 3 прямые. Действитель-


но, так как |P | 6 8 и каждая прямая содержит ровно 3 точки, то
через любую точку проходит не более 3 прямых.
Так как все точки не лежат на одной прямой, то через каждую
точку проходят, по крайней мере, две прямы. Отсюда следует, что
для любой точки a найдется прямая L, не проходящая через эту
точку.

Проведя прямые через точку a и три точки прямой L, мы получим


три прямые, проходящие через точку a.
3) Из пунктов 1 и 2 следует, что множество P состоит из 7 точек.
4) Возьмем произвольные три точки, не лежащие на одной прямой,
и обозначим их через 1, 3, 5. Прямые 13, 35, 51 содержат ещё по
одной точке 2, 4, 6. Прямые 25, 14 и 36 должны содержать третьи
точки, которые не лежат на прямых 13, 35, 51 и, в силу равенства
|P | = 7, совпадают. Обозначим эту точку через 7.
5) Точки 2 и 4 лежат на некоторой прямой L, которая не может про-
ходить через точки 1, 3, 5, 7. и поэтому третьей точкой на L будет
точка 7.

92
6) Понятно, что других прямых в нашем пространстве прямых нет,
так как через любые две различные точки из P проходит ровно
одна из построенных 7 прямых.

Следствие. Если n точек векторного F -пространства не лежат на


одной прямой, причем n 6 8 и n 6= 7, то существует, по крайней мере,
одна прямая, проходящая через две из этих точек.
Теорема (о линейном представлении плоскости Фано). Плоскость Фано
реализуется в F -пространстве ⇔ char F = 2 и |F | > 8.

Доказательство. Плоскость Фано реализуется в F -пространстве ⇔


найдутся такие точки a, b, c, не лежащие на одной прямой, и точки x, y,
z, лежащие на прямых bc, ca, ab, для которых выполнены условия:

(1) {x, y, z} ∩ {a, b, c} = ∅,


(2) точки x, y, z лежат на одной прямой,
(3) чевианы ax, by, cz имеют общую точку, не лежащую на прямых bc,
ca и ab.
c

y x

a z b

Пусть
x = βb + (1 − β)c
y = γc + (1 − γ)a
z = αa + (1 − α)b

Тогда условия (1–3) равносильны, согласно лемме и теоремам Менелая


и Чевы, тому, что α, β, γ удовлетворяют следующей системе:

93


 {α, β, γ} ∩ {0, 1} = ∅



 αβγ + (1 − α)(1 − β)(1 − γ) = 0

αβγ = (1 − α)(1 − β)(1 − γ)
(Π)

 1 − β + βγ 6= 0



 1 − γ + γα 6= 0

1 − α + αβ 6= 0

Таким образом, вопрос о реализации плоскости Фано в F -пространстве


равносилен совместности системы (Π) в поле F .
Покажем, что система (Π) совместна ⇔ char F = 2 и |F | = 8.
Допустим, что (Π) — совместная система, и α, β, γ — некоторое решение
системы. Тогда αβγ 6= 0 и αβγ = −αβγ. Отсюда получаем 2 = 0, или
char F = 2. Покажем теперь, что |F | > 8. Действительно, если |F | < 8,
то |F | = 4 и из трех элементов α, β, γ, по крайней мере, два совпадают.
В силу симметричности условий (Π), можно считать, что α = β. Тогда
1 + α + α2 6= 0, причем, α 6= 1, что невозможно в 4-элементном поле F .
Итак, |F | > 8.
Обратно, предположим, что char F = 2, |F | > 8 и покажем, что система
(Π) совместна в поле F . Так как char F = 2, то система (Π) равносильна
системе


 {α, β, γ} ∩ {0, 1} = ∅

 αβγ = (1 + α)(1 + β)(1 + γ)

1 + β + βγ 6= 0 (Π′ )



 1 + γ + γα 6= 0

1 + α + αβ 6= 0

Система (Π′ ) совместна в данном поле F . Действительно, возьмем про-


извольные элементы α ∈ / {0, 1, 1 + α, 1 + α−1 } и положим
/ {0, 1} и β ∈

αβ
γ =1+
1+α+β

Рутинная проверка показывает, что указанная тройка элементов удовле-


творяет всем условиям (Π′ ).

Следствие. Если n точек векторного F -пространства не лежат на


одной прямой, причем n 6 8 и char F 6= 2, то существует, по крайней
мере, одна прямая, проходящая через две из этих точек.

94
8 Непересекающиеся аффинные подпространства
Мы уже знаем, что пересечение любого семейства аффинных подпро-
странств либо пусто, либо также является аффинным подпространством.
В этом разделе мы займемся изучением взаиморасположения двух аф-
финных подпространств, не имеющих общих точек. Такие подпростран-
ства мы будем называть непересекающимися. Основное понятие, которое
мы будем использовать при анализе их взаиморасположения, есть поня-
тие параллельности.

Определение. Будем говорить, что аффинные подпространства L1 и


L2 параллельны (и писать L1 k L2 ), если L1 ∩ L2 = ∅ и V (L1 ) = V (L2 ).

Теорема 1. Следующие условия для аффинных подпространств L1 =


a1 + W1 и L2 = a2 + W2 равносильны:

1) L1 ∩ L2 = ∅

2) a1 − a2 ∈
/ W1 + W2

3) (a1 + W1 + W2 ) ∩ (a2 + W1 + W2 ) = ∅

Доказательство. 1) ⇒ 2). Если a1 − a2 ∈ W1 + W2 , то a1 + w1 = a2 + w2


для некоторых w1 ∈ W1 и w2 ∈ W2 , что невозможно в силу условия 1.
2) ⇒ 3). Если a1 + w1 + w2 = a2 + u1 + u2 для некоторых w1 , u1 ∈ W1 и
w2 , u2 ∈ W2 , то a1 − a2 ∈ W1 + W2 , что невозможно в силу условия 2.
3) ⇒ 1) следует из включения

L1 ∩ L2 ⊂ (a1 + W1 + W2 ) ∩ (a2 + W1 + W2 ) = ∅

Следствие. Два аффинных подпространства не имеют общих точек


⇔ они лежат в двух параллельных подпространствах.

Теорема 2. Для любых непересекающихся подпространств L1 и L2 су-


ществует единственная пара параллельных гиперплоскостей P1 и P2
в аффинной оболочке aff (L1 , L2 ), содержащих эти аффинные подпро-
странства: Li ⊂ Pi , i = 1, 2.

Замечание. Эти две однозначно определенные гиперплоскости P1 и P2


будем называть перегородками аффинной оболочки подпространств L1
и L2 .

95
Доказательство. Пусть аффинные подпространства L1 = a1 + W1 и
L2 = a2 + W2 не имеют общих точек. Тогда, согласно теореме 1, под-
пространства P1 = a1 + W1 + W2 и P2 = a2 + W1 + W2 не имеют общих
точек. Более того, они имеют одинаковое направление W1 + W2 и, следо-
вательно, P1 k P2 .
Ясно, что Li ⊂ Pi ⊂ aff (L1 , L2 ), i = 1, 2 (см. задачу 3 из раздела 1),
причем направляющее пространство aff (L1 , L2 ) есть W1 + W2 + ha2 − a1 i.
Отсюда следует, что dim Pi + 1 = dim aff (L1 , L2 ), i = 1, 2, т. е. Pi —
гиперплоскости в аффинной оболочке L1 и L2 .
Допустим теперь, что Q1 и Q2 — параллельные гиперплоскости из aff (L1 , L2 ),
содержащие аффинные подпространства L1 и L2 , и пусть W = V (Q1 ) =
V (Q2 ). Тогда из включений Li ⊂ Qi следует, что W1 6 W и W2 6 W .
Учитывая то, что dim Qi = dim aff (L1 , L2 ) − 1 = dim(W1 + W2 ), получаем
W1 + W2 = W и Qi = Pi для i = 1, 2.
Теорема 3. Любая точка из аффинной оболочки непересекающихся под-
пространств L1 и L2 либо лежит на одной из двух её перегородок, либо
лежит на прямой, пересекающей L1 и L2 .

Доказательство. Пусть точка b ∈ aff (L1 , L2 ), Li = ai + Wi и b ∈ / ai +


W1 + W2 , i = 1, 2. Тогда найдутся такие wi ∈ Wi и λ ∈
/ {0, 1}, что
   
1 1
b = a1 + w1 + w2 + λ(a2 − a1 ) = (1 − λ) a1 + w1 + λ a2 + w2
1−λ λ

Значит, точка b лежит на прямой, пересекающей L1 и L2 .


Определение. Аффинные подпространства L1 и L2 называют скрещи-
вающимися, если L1 ∩ L2 = ∅ и V (L1 ) ∩ V (L2 ) = 0.

Следующая теорема уточняет теорему 3 в случае скрещивающихся под-


пространств.
Теорема 4. Для любой точки из аффинной оболочки скрещивающихся
подпространств L1 и L2 , и не лежащей на её перегородках, существует
единственная прямая, проходящая через эту точку и пересекающая L1
и L2 .

Доказательство. Пусть b ∈ aff (L1 , L2 ), Li = ai + Wi и b ∈


/ ai + W1 + W2 ,
i = 1, 2. Так как L1 и L2 — скрещивающиеся подпространства, то

aff (L1 , L2 ) = a1 + (W1 ⊕ W2 ⊕ ha2 − a1 i)

96
Следовательно, существуют однозначно определенные wi ∈ Wi , i = 1, 2
и λ ∈ F такие, что

b = a1 + w1 + w2 + λ(a2 − a1 ) (∗)

Так как b ∈
/ ai + W1 + W2 , i = 1, 2, то λ ∈
/ {0, 1}. Значит,
   
1 1
b = (1 − λ)a1 + λa2 + w1 + w2 = (1 − λ) a1 + w1 + λ a2 + w2
1−λ λ
1
т. е. точка b лежит на прямой, проходящей через точки a1 + 1−λ w1 ∈ L1
1
и a2 + λ w2 ∈ L2 . Таким образом, существование прямой доказано.
Допустим теперь, что точка b лежит на некоторой прямой, пересекающей
L1 и L2 в точках a1 + u1 ∈ L1 и a2 + u2 ∈ L2 . Тогда для некоторого µ ∈ F

b = (1 − µ)(a1 + u1 ) + µ(a2 + u2 ) или


b = a1 + (1 − µ)u1 + µu2 + µ(a2 − a1 )

В силу однозначности представления (*), получаем (1 − µ)u1 = w1 , µu2 =


1
w2 , µ(a2 − a1 ) = λ(a2 − a1 ). Отсюда µ = λ и u1 = 1−λ w1 , u2 = λ1 w2 .
Итак, точки пересечения прямых с L1 и L2 , а значит и сами прямые,
совпадают.

97
Лекция 18. Геометрия порядка.

1 Упорядоченные поля
Определение 1. Бинарное отношение 6 на множестве M называется
линейным порядком, если

1) x 6 x,

2) x 6 y & y 6 x ⇒ x = y,

3) x 6 y & y 6 z ⇒ x 6 z,

4) x 6 y ∨ y 6 x

для любых x, y, z ∈ M.

Замечание. x < y ⇔ x 6 y & x 6= y.

Определение 2. Поле F называется упорядоченным, если на F опреде-


лено отношение линейного порядка, удовлетворяющее условиям

1) x > y ⇒ x + z > y + z,

2) x > 0 & y > 0 ⇒ xy > 0.

Теорема (элементарные свойства). Для любых x, y, z из упорядоченного


поля F верно

1) x > 0 ⇔ −x 6 0,
x > 0 ⇔ x−1 > 0;

2) x > y ⇔ x − y > 0;

3) x > y & z > 0 ⇒ xz > yz;

4) x 6 0 & y > 0 ⇒ xy 6 0;

5) x 6 0 & y 6 0 ⇒ xy > 0;

6) 1 > 0.

Следствие. Характеристика упорядоченного поля равна 0. В частно-


сти, любое упорядоченное поле бесконечно.

98
2 Понятие отрезка
Пусть V — F -пространство, где F — упорядоченное поле.

Определение. Отрезком, соединяющим точки a, b ∈ V называется


множество
[a, b] = {λa + (1 − λ)b | 0 6 λ 6 1}

Понятно, что a, b ∈ [a, b]. Эти точки называются концами отрезка. Уда-
ляя концы отрезка из [a, b], мы получаем множество (a, b), которое назы-
вается интервалом.
Если c ∈ (a, b), то будем говорить, что точка c лежит между точками a
и b.

Теорема (свойства промежуточности). 1) [a, b] = [b, a];

2) (a, b) = (b, a);

3) c ∈ (a, b) ⇒ (a, c) ⊆ (a, b).

Доказательство. 1) [b, a] = {λb + (1 − λ)a | 0 6 λ 6 1} =


= {(1 − µ)b + µa | 0 6 µ 6 1} = [a, b]

2) следует из предыдущего пункта.

3) пусть x ∈ (a, c). Тогда x = λa + (1 − λ)c, где λ ∈ (0, 1). Так как
c ∈ (a, b), то c = µa + (1 − µ)b, где µ ∈ (0, 1). Значит,

x = λa + (1 − λ) (µa + (1 − µ)b) = (λ + µ − λµ)a + (1 − λ)(1 − µ)b,

где (1 − λ)(1 − µ) ∈ (0, 1), и поэтому x ∈ (0, 1).

Следствие. Для любой точки p и любого конечного непустого множе-


ства точек M найдется точка a ∈ M такая, что (p, a) ∩ M = ∅.

Доказательство. Из точек M выберем точку a ∈ M, для которой мощ-


ность пересечения (p, a) ∩ M минимальна. Если (p, a) ∩ M 6= ∅, то для
точки b ∈ (p, a) ∩ M пересечение (p, b) ∩ M содержится в пересечении
(p, a) ∩ M, причем b ∈/ (p, b) ∩ M, что противоречит выбору точки a.
Значит, (p, a) ∩ M = ∅.

99
Теорема (аксиома Пеано). Пусть точки a, b, c не лежат на одной
прямой, точка e ∈ (a, c), точка d лежит на прямой bc и d ∈
/ [b, c]. Тогда
прямая de пересекает интервал (a, b).

b c d

Доказательство. Пусть

e = λa + (1 − λ)c, λ ∈ (0, 1)

d = µb + (1 − µ)c, µ ∈
/ [0, 1]

Покажем, что найдутся такие α ∈ F и β ∈ (0, 1), для которых справед-


ливо равенство
αe + (1 − α)d = βa + (1 − β)b
или
α(λa + (1 − λ)c) + (1 − α)(µb + (1 − µ)c) = βa + (1 − β)b

Это равенство выполняется, если совместна относительно α и β следую-


щая система: 
 λα = β
(1 − α)µ = 1 − β

β ∈ (0, 1)
µ−1 λ(µ−1)
Из первых двух уравнений системы получаем α = µ−λ
и β = µ−λ
.
λ(µ−1)
Покажем теперь, что 0 < µ−λ
< 1.
Случай 1. µ − λ > 0

λ(µ − 1)
0< < 1 ⇔ 0 < λ(µ − 1) < µ − λ
µ−λ

Так как µ > λ и µ ∈


/ [0, 1], то µ > 1 и поэтому λ(µ − 1) > 0.

100
С другой стороны,

λ(µ − 1) < µ − λ ⇔ λµ < µ ⇔ µ(1 − λ) > 0,

что справедливо в силу λ ∈ (0, 1).


Случай 2. µ − λ < 0

λ(µ − 1) λ(1 − µ)
0< <1 ⇔ 0< < 1 ⇔ 0 < λ(1 − µ) < λ − µ.
µ−λ λ−µ
Так как µ < λ и µ ∈
/ [0, 1], то µ < 0 и поэтому 1 − µ > 0 ⇒ λ(1 − µ) > 0.
С другой стороны,

λ(1 − µ) < λ − µ ⇔ µ < λµ ⇔ µ(1 − λ) < 0 ⇔ µ < 0,

что также справедливо.

3 Задача Сильвестра в геометрии порядка


В этом разделе мы докажем, что ответ на вопрос Сильвестра будет по-
ложительным для любого n в случае упорядоченного поля F .

Теорема (Кокстера). Пусть F — упорядоченное поле. Тогда для любого


конечного множества точек из F -пространства, не лежащих на од-
ной прямой, существует по крайней мере одна прямая, проходящая в
точности через две из этих точек.

Доказательство. (От противного.)


Допустим, что конечное множество точек P = {p1 , ..., pn }, не лежащих
на одной прямой, не удовлетворяет заключению теоремы, причем точки
из P занумерованы так, что первые три точки p1 , p2 и p3 не лежат на
одной прямой.
Прямые, соединяющие точку p1 с остальными точками из P , пересекают
прямую p2 p3 в конечном множестве точек. Так как прямая p2 p3 содержит
бесконечное множество точек, то на ней найдется точка q, отличная от
этих точек пересечения. Понятно, что прямая p1 q не содержит точек из
P , отличных от p1 .

101
p1

p2 p3 q

Множество M точек пересечения прямой p1 q с прямыми, соединяющими


пары точек из P , конечно и, следовательно, для некоторой точки a ∈ M
(возможно, a = q) интервал (p1 , a) не содержит ни одной точки из M.
Точка a, по построению, лежит на прямой, соединяющей пару точек,
скажем, p4 и p5 из P .

p1

p4 p5 a p6

Прямая p4 p5 , согласно предположению, содержит кроме точек p4 и p5 по


крайней мере еще одну точку p6 ∈ P . Без потери общности рассуждений
можно считать, что p5 ∈ (p4 , a) и p6 ∈
/ (p4 , a).
Прямая p1 p4 , согласно предположению, также содержит кроме точек p1
и p4 по крайней мере еще одну точку p7 ∈ P . Возможны два случая:
p7 ∈ (p1 , p4 ) и p7 ∈
/ (p1 , p4 ).
Если p7 ∈ (p1 , p4 ), то, в силу теоремы (аксиомы Пеано), прямая p6 p7
пересекает интервал (p1 , a).

102
p1

p7

p4 p5 a p6

Если p7 ∈ / (p1 , p4 ), то, снова в силу теоремы (аксиомы Пеано), прямая


p5 p7 пересекает интервал (p1 , a).

p1

p4
p5 a

p7

Напомним, что интервал (p1 , a) не содержит ни одной точки из M, по-


этому оба случая невозможны. Полученное противоречие завершает до-
казательство теоремы.

103
Лекция 22. Линейные отображения.

1 Определение
Созданная нами «вселенная», векторное пространство, оснащено дву-
мя структурами: алгебраической и геометрической. Здесь под геомет-
рической структурой мы понимаем семейство всех аффинных подпро-
странств (точек, прямых, плоскостей и т. д.) в векторном пространстве.
Далее нами будут изучаться деформации пространств двух видов: ал-
гебраические и геометрические. Сначала мы рассмотрим отображения,
сохраняющие алгебраическую структуру, а затем покажем, что исследо-
вание геометрических деформаций в большой степени сводится к изу-
чению алгебраических деформаций. Центральным понятием, вокруг ко-
торого развивается далее теория векторных пространств, и в котором
формализуется то, что мы назвали алгебраической деформацией, явля-
ется понятие линейного отображения.
Определение. Пусть V1 и V2 — векторные пространства над полем F .
Отображение f : V1 → V2 называется линейным, если

1) f (x + y) = f (x) + f (x),
2) f (λx) = λf (x).

для любых x, y ∈ V1 и λ ∈ F .

Если V1 = V2 , то отображение f называется линейным оператором (или


линейным преобразованием) пространства V1 .
Понятно, что понятие линейного отображения есть обобщение понятия
изоморфизма векторных пространств. Согласно определению, изомор-
физм есть биективное линейное отображение. Рассмотрим несколько при-
меров линейных отображений.
Пример 1. Матричные отображения.
Пусть F — произвольное поле, V1 = F n — пространство столбцов высоты
n, V2 = F m — пространство столбцов высоты m, A ∈ M(m × n, F ) —
матрица размера m × n над полем F . Для любого x ∈ F n положим
f (x) = Ax.
Понятно, что f (x) ∈ F m и, следовательно, определено отображение f :
V1 → V2 . Из свойств матричных операций следует, что f — линейное
отображение.

104
Пример 2. Гомотетии.
Пусть V — произвольное векторное пространство над полем F и λ ∈ F .
Из свойств операций над векторами следует, что отображение f : V → V ,
определенное как
f (x) = λx
для любого x ∈ V , является линейным оператором пространства V . Для
ненулевого λ этот линейный оператор называется гомотетией простран-
ства V , а в случае λ = 0 — нулевым оператором. Гомотетия f с λ = 1
называется единичным или тождественным оператором.

2 Действия с отображениями
(2.1) Сумма
Пусть f и g — линейные отображения пространства V1 в простран-
ство V2 . Суммой отображений f и g называется отображение V1 в
V2 , которое обозначается f + g и определяется следующим образом:

(f + g)(x) = f (x) + g(x).

(2.2) Умножение на элемент поля


Пусть f — линейное отображение V1 в V2 , и λ — произвольный эле-
мент поля F . Произведением отображения f на элемент λ называ-
ется отображение V1 в V2 , которое обозначается λf и определяется
следующим образом:
(λf )(x) = λf (x).

(2.3) Произведение (композиция)


Пусть f — линейное отображение V1 в V2 , и g — линейное отображе-
ние V2 в V3 . Произведением отображений f и g называется отобра-
жение V1 в V3 , которое обозначается gf и определяется следующим
образом:
(gf )(x) = g(f (x)).

Несложно показать, что результаты указанных трёх действий f + g, λf и


gf также являются линейными отображениями. Более того, если ограни-
читься первыми двумя действиями, суммой и умножением, то указанные
операции задают на множестве всех линейных отображений простран-
ства V1 в V2 структуру векторного пространства. Из определения про-
изведения отображений становится понятно, что в случае произвольных

105
пространств V1 и V2 произведение линейных отображений V1 в V2 неопре-
делено. Но если ограничиться случаем V1 = V2 , то произведение опре-
делено для любых отображений V1 в V1 . Таким образом, на множестве
всех линейных операторов пространства V определены все три действия:
сложение, умножение на элементы поля и произведение операторов.
Рутинная проверка показывает, что данные действия удовлетворяют всем
условиям из определения алгебры. Значит, множество всех линейных опе-
раторов пространства V является алгеброй над полем F , которая назы-
вается алгеброй линейных операторов F -пространства V . Данная алгеб-
ра является вторым примером алгебр, с которыми мы уже сталкива-
лись раньше, изучая матрицы. В дальнейшем мы увидим, что алгебра
линейных операторов n-мерного пространства над полем F изоморфна
M(n, F ), алгебре квадратных матриц порядка n над полем F . Матрицы
линейных отображений возникнут естесственным образом при коорди-
натизации этих отображений.

3 Ядро и образ
Пусть f — линейное отображение F -пространства V1 в F -пространство
V2 . Для любого x ∈ V1 вектор f (x) называется образом вектора x при
отображении f . Если M — произвольное подмножество векторов из V1 ,
то под образом M понимается множество

f (M) = {f (x) | x ∈ M} ,

т. е. f (M) — множество образов всех элементов из M. Понятно, что


f (x) ∈ V2 и, следовательно, f (M) — подмножество из V2 .
Нетрудно показать, что если M — подпространство в V1 , то образ f (M)
есть подпространство в V2 . Действительно,

1) f (0) = f (0 + 0) = f (0) + f (0) ⇒ f (0) = 0. Так как 0 ∈ M, то


f (0) = 0 ∈ f (M).
2) Пусть a, b ∈ f (M). Тогда ∃x, y ∈ M : a = f (x) и b = f (y) ⇒ a + b =
f (x) + f (y) = f (x + y) ∈ f (M).
3) Пусть a ∈ f (M) и λ ∈ F . Тогда ∃x ∈ M : a = f (x) ⇒ λa = λf (x) =
f (λx) ∈ f (M).

В частности, образ всего подпространства V1 при отображении f есть


подпространство в V2 . Это подпространство называется, ради краткости,

106
образом f . Для этого подпространства используются два обозначения:
f (V1 ) и Im f . Размерность Im f часто называется рангом отображения
f и обозначается через rank f . Такой термин для размерности Im f ис-
пользуется в силу того, что dim(Im f ) совпадает, как это выяснится в
дальнейшем, с рангом матрицы отображения f .
Обратимся теперь к понятию прообраза. Вектор x ∈ V1 называется про-
образом вектора y ∈ V2 при отображении f : V1 → V2 , если f (x) = y.
Понятно, что не любой вектор y ∈ V2 может иметь прообраз при отоб-
ражении f . Если любой вектор из V2 имеет хотя бы один прообраз, то
f (V1 ) = V2 , т. е. f — сюръекция.
Множество всех прообразов некоторого вектора y ∈ V2 называется пол-
ным прообразом y при отображении f . Полный прообраз y при отобра-
жении f обозначается через f −1 (y). Таким образом, для y ∈ V2

f −1 (y) = {x ∈ V1 | f (x) = y} .

Полный прообаз нулевого вектора из V2 называется ядром отображения


f . Для ядра отображения очень редко используется обозначение f −1 (0).
Более стандартным считается обозначение Ker f . Таким образом,

Ker f = {x ∈ V1 | f (x) = 0} .

Некоторые свойста ядра отображения, в силу их важности, мы выделим


в виде теоремы.
Теорема (о свойствах ядра). Пусть f — линейное отображение про-
странства V1 в пространство V2 . Тогда

1) Ker f — подпространство в V1 ,
2) dim Ker f + dim Im f = dim V1 ,
3) полный прообраз любого y ∈ V2 либо пуст, либо есть аффинное
подпространство в V1 с направляющим пространством Ker f , т.
е. для любого y ∈ V2
(

f −1 (y) =
a + Ker f

Доказательство. 1. Нам уже известно, что f (0) = 0, поэтому 0 ∈


Ker f . Покажем, что Ker f замкнуто относительно сложения и умно-
жения на элементы поля.

107
x, y ∈ Ker f ⇒ f (x) = 0 и f (y) = 0 ⇒ f (x + y) = f (x) + f (y) =
0 + 0 = 0 ⇒ x + y ∈ Ker f
x ∈ Ker f, λ ∈ F ⇒ f (λx) = λf (x) = λ · 0 = 0 ⇒ λx ∈ Ker f

2. Пусть W — прямое дополнение к подпространству Ker f в про-


странстве V1 , т. е.
V1 = Ker f ⊕ W
и {e1 , . . . , en } — базис W . Покажем, что {f (e1 ), . . . , f (en )} — базис
Im f .

а) линейная независимость {f (e1 ), . . . , f (en )}


α1 f (e1 ) + . . . + αn f (en ) = 0 ⇒ f (α1 e1 + . . . + αn en ) = 0 ⇒
α1 e1 + . . . + αn en ∈ Ker f ⇒ α1 e1 + . . . + αn en ∈ Ker f ∩ W =
0 ⇒ α1 = . . . = αn = 0.
б) порождаемость
Пусть y ∈ Im f . Тогда найдется x ∈ V1 : f (x) = y. Так как
V1 = Ker f ⊕ W , то

x = κ + α1 e1 + . . . + αn en ,

где κ ∈ Ker f .
Следовательно, y = f (κ + α1 e1 + . . . + αn en ) = α1 f (e1 ) + . . . +
αn f (en ) ⇒ y ∈ hf (e1 ), . . . , f (en )i.
Итак, dim W = dim Im f , и значит,

dim V1 = dim Ker f + dim Im f

согласно теореме о размерности прямой суммы.

3. Пусть y ∈ V2 и f −1 (y) — непустое множество. Выберем произволь-


ный вектор a ∈ f −1 (y) и покажем, что

f −1 (y) = a + Ker f.

x ∈ a + Ker f ⇒ ∃κ ∈ Ker f : x = a + κ ⇒ f (x) = f (a + κ) =


f (a) + f (κ) = y ⇒ x ∈ f −1 (y).
Обратно, пусть x ∈ f −1 (y), т. е. f (x) = y. Тогда f (x) = f (a) ⇒
f (x − a) = 0 ⇒ x − a ∈ Ker f ⇒ x ∈ a + Ker f .

108
Из теоремы о свойствах ядра вытекают интересные следствия:

Следствие 1. Линейное отображение f является инъекцией ⇔ Ker f =


0.

Следствие 2. Линейное отображение f : V1 → V2 является биекцией


(и значит, изоморфизмом) ⇔ dim V1 = dim V2 и Ker f = 0.

Следствие 3. Для линейного оператора f : V → V следующие условия


эквивалентны:

1) f — биекция,

2) f — инъекция,

3) f — сюръекция.

Замечание. Равносильность указанных трех условий для линейного опе-


ратора в следствии 3 справедлива и для любых отображений конечного
множества в себя. Следствие 3 является примером переноса некоторых
утверждений из конечных множеств на бесконечные множества при на-
ложении некоторых ограничений (в данном случае, конечности размер-
ности пространства V ).

Задача 21. Образ любого аффинного подпространства L при линейном


отображении f есть аффинное подпространство, причём образ направ-
ляющего пространства V (L) есть направляющее пространство образа L,
т. е.
f (V (L)) = V (f (L)) .

Задача 22. Полный прообраз любого аффинного подпространства при


линейном отображении либо пуст, либо также является аффинным под-
пространством.

Задача 23. Пусть f : V1 → V2 — изоморфизм пространства V1 на про-


странство V2 . Доказать, что подмножество M ⊆ V1 является m-мерным
аффинным подпространством в V1 ⇔ f (M) — m-мерное аффинное
подпространство в V2 .

4 Координатизация отображений
Пусть f — линейное отображение F -пространства V в F -пространство
V ′ , E = {e1 , . . . , en } — базис V ′ . Матрицей отображения f в базисах E

109
и E ′ называется матрица A, столбцами которой являются координатные
столбцы векторов f (e1 ), . . . , f (en ) в базисе E ′ . Понятно, что матрица A
определена над полем F и имеет размер dim V ′ × dim V = m × n.
В случае V = V ′ и E = E ′ матрица A называется матрицей линейного
оператора f в базисе E. В этом случае используется обозначение A =
(f )E .
Заметим, что векторы f (e1 ), . . . , f (en ) порождают Im f , и поэтому ранг
матрицы A равен рангу оператора f , т. е. rank f = rank (f )E . Отсюда, в
частости, следует, что ранг матрицы линейного оператора не зависит от
выбора базиса E, хотя сама матрица оператора в различных базисах, в
общем случае, имеет разный вид.
Аналогичное замечание касается не только ранга матрицы оператора, но
и матрицы произвольного линейного отображения.

Задача 24. Доказать, что ранг матрицы линейного отображения f в


базисах E и E ′ равен рангу отображения f .

Теорема (о координатах образа). Пусть f — линейное отображение


V в V ′ , E — базис V , E ′ — базис V ′ , A — матрица отображения f в
базисах E и E ′. Тогда для любого x ∈ V справедливо равенство

(f (x))E ′ = A · (x)E .

Доказательство. Пусть

f (e1 ) = α11 e′1 + . . . + α1m e′m


...
f (en ) = αn1 e′1 + . . . + αnm e′m

и x = β1 e1 + . . . + βn en .
Тогда

f (x) = β1 f (e1 ) + . . . + βn f (en ) =


= β1 (α11 e′1 + . . . + α1m e′m ) + . . . + βn (αn1 e′1 + . . . + αnm e′m ) =
= (β1 α11 + . . . + βn αn1 )e′1 + . . . + (β1 α1m + . . . + βn αnm )e′m .

Значит, (f (x))E ′ = A · (x)E .

Теорема (о действиях в координатах). Пусть f и g — линейные опера-


торы пространства V , и E — базис V . Тогда

110
1)
(f + g)E = (f )E + (g)E ,
т. е. матрица суммы операторов есть сумма матриц этих опе-
раторов;
2)
(λf )E = λ (f )E ,
т. е. матрица произведения оператора и элемента поля есть про-
изведение матрицы оператора и этого элемента поля;
3)
(f g)E = (f )E · (g)E ,
т. е. матрица произведения операторов есть произведение мат-
риц этих операторов.

Доказательство. 1)
(f + g)(x) = f (x) + g(x) ⇒ ((f + g)(x))E = (f (x) + g(x))E ⇒
⇒ (f + g)E · (x)E = (f )E · (x)E + (g)E · (x)E = ((f )E + (g)E ) (x)E ⇒
⇒ (f + g)E = (f )E + (g)E

2)
(λf )(x) = λ(f (x)) ⇒ ((λf )(x))E = (λ(f (x)))E ⇒
⇒ (λf )E · (x)E = λ (f )E · (x)E ⇒ (λf )E = λ (f )E

3)
(f g)(x) = f (g(x)) ⇒ ((f g)(x))E = (f (g(x)))E ⇒
⇒ (f g)E · (x)E = (f )E · (g)E · (x)E ⇒ (f g)E = (f )E · (g)E

Замечание. Во всех трех пунктах доказательства было использовано сле-


дующее утверждение: A = B ⇔ A · (x)E = B · (x)E . Докажите это
утверждение самостоятельно.
Учитывая то, что координатизация f → (x)E является биекцией про-
странства операторов n-мерного пространства на пространство квадрат-
ных матриц порядка n, мы, с помощью теоремы о действиях в коорди-
натах, получаем
Следствие. Пространство линейных операторов n-мерного F -пространства
изоморфно пространству квадратных матриц порядка n над полем F .
В частности, размерность этого пространства операторов равна n2 .

111
5 Замена базиса
Понятно, что матрица линейного оператора зависит от выбора базиса
векторного пространства. В этом разделе мы рассмотрим вопрос о том,
как связаны между собой матрицы оператора в различных базисах.
Пусть E и E — базисы пространства V , S — матрица перехода от E к E ′
и f — линейный оператор пространства V . Тогда, с одной стороны,

(f (x))E = (f )E · (x)E = (f )E · S · (x)E ′ ,

а с другой, —
(f (x))E = S · (f (x))E = S · (f )E ′ · (x)E ′
для любого x ∈ V . Значит,

(f )E · S · (x)E ′ = S (f )E ′ (x)E ′ ,

и поэтому (f )E · S = S (f )E ′ . Следовательно, справедлива

Теорема (о матрице оператора в разных базисах).

(f )E ′ = S −1 (f )E S

Следствие. Определитель матрицы оператора не зависит от выбора


базиса.

Доказательство. Пусть A — матрица f в базисе E ′ , и B — матрица f в


базисе E. Согласно теореме, A = S −1 BS, и значит,

det A = det(S −1 BS) = det(S −1 ) · det B · det S = det B · det S −1 S = det B.

В дальнейшем определитель матрицы оператора f будет называться про-


сто опеределителем оператора f и обозначаться через det f .

6 Обратимые операторы
Линейный оператор f : V → V называется обратимым, если существует
такой линейный оператор g : V → V , что

f g = gf = 1,

112
где 1 — тождественный оператор.
Другими словами, f — обратимый оператор, если f — обратимый эле-
мент в алгебре операторов V .
Понятно, что f g = gf = 1 ⇔ для любого x ∈ V f (g(x)) = g(f (x)) = x
или (f )E · (g)E = (g)E · (f )E = E.
Таким образом, оператор f обратим ⇔ матрица оператора обратима.
В результате применения критерия обратимости матриц получается

Теорема (критерии обратимости оператора). Следующие условия рав-


носильны:

1) f — обратимый оператор,

2) матрица оператора f обратима,

3) det f 6= 0,

4) Ker f = 0.

Так как произведение обратимых линейных операторов есть обратимый


линейный оператор, и обратный оператор к обратимому оператору также
обратим, то множество всех обратимых линейных операторов замкнуто
относительно произведений операторов и взятия к ним обратных.
Очевидно, что множество всех обратимых операторов относительно опе-
рации умножения образует группу. Эта группа называется общей линей-
ной группой и обозначается через GL (V ).
Так как координатизация f → (f )E является изоморфизмом алгебры ли-
нейных операторов F -пространства V на матричную алгебру M(n, F,),
где n = dim V , то группа GL (V ) изоморфна группе всех обратимых мат-
риц из M(n, F ). Напомним, что группа всех обратимых матриц порядка
n над полем F была названа общей матричной группой и обозначена
через GL (n, F ). Таким образом, мы имеем изоморфизм

GL (V ) ≃ GL (n, F ) .

7 Проектирования и отражения
В этом разделе мы рассмотрим два вида линейных операторов, часто
используемых в теории и на практике.

113
Пусть векторное пространство V разложено в прямую сумму двух под-
пространств:
V = V1 ⊕ V2 .
Тогда, каждый вектор x ∈ V однозначно представим в виде x = x1 + x2 ,
где xi ∈ Vi , i = 1, 2. Слагаемые xi называются проекциями вектора x на
подпространства Vi , i = 1, 2.

Определение 1. Проектированием пространства V на подпростран-


ство V1 параллельно подпространству V2 называется отображение π :
V → V , сопоставляющее каждому вектору x ∈ V его проекцию на V1 , т.
е.
π(x1 + x2 ) = x1 .

Определение 2. Отражением пространства V относительно V1 па-


раллельно подпространству V2 называется отображение ω : V → V , опре-
деленное равенством
ω(x1 + x2 ) = x1 − x2 .

Очевидно, что любые проектирование и отражение являются линейными


операторами пространства V , причем их матрицы в базисе E, получен-
ном объединением базисов пространств V1 и V2 имеют вид
   
E 0 E 0
(π)E = и (ω)E = .
0 0 0 −E

Эти два вида линейных операторов, имеющих простую наглядную при-


роду, могут быть просто охарактеризованы алгебраическим способом.

Определение 3. Пусть S — моноид с операцией умножения, т. е. S —


полугруппа с нейтральным элементом 1.
Элемент a ∈ S называется идемпотентом, если a2 = a. В частности,
нейтральный элемент 1 является идемпотентом.
Элемент a ∈ S называется инволюцией, если a совпадает со своим обрат-
ным элементом, т. е. a2 = 1. Часто из определения инволюции исключают
случай a = 1. Мы, для упрощения формулировок, делать этого не будем.

Теорема (характеризация проектирований). Линейный оператор f про-


странства V является проектированием тогда и только тогда, когда
f — идемпотент в алгебре операторов V .

114
Доказательство. Очевидно, что любое проектирование есть идемпотент
в алгебре операторов. Обратно, пусть f — идемпотент, т. е. f 2 = f и
x ∈ Ker f ∩ Im f . Тогда f (x) = 0 & ∃y ∈ V : x = f (y) ⇒ f 2 (y) =
0 ⇒ f (y) = f 2 (y) = 0 ⇒ x = 0 ⇒ Ker f ∩ Im f = 0 ⇒ dim(Ker f ⊕
Im f ) = dim Ker f + dim Im f = dim V ⇒ V = Ker f ⊕ Im f ⇒ f —
проектирование пространства V на Im f параллельно Ker f .

Теорема (характеризация отражений). Линейный оператор f простран-


ства V над полем характеристики 6= 2 является отражением тогда и
только тогда, когда f — инволюция в алгебре операторов V .

Доказательство. Очевидно, что любое отражение есть инволюция в ал-


гебре операторов. Обратно, пусть f — инволюция, т. е. f 2 = 1. Положим
g = 21 (f + 1). Определение оператора g корректно, так как характеристи-
ка поля 6= 2.
Тогда g 2 = 41 (f + 1)2 = 41 (f 2 + 2f + 1) = 14 (2f + 2) = 21 (f + 1) = g.
Значит, g — проектирование и V = Ker g ⊕ Im g.
1
Пусть x ∈ Ker g. Тогда g(x) = 0 ⇒ 2
(f + 1)(x) = 0 ⇒ (f + 1)(x) = 0 ⇒
f (x) + x = 0 ⇒ f (x) = −x.
Пусть x ∈ Im g. Тогда g(x) = x ⇒ 21 (f + 1)(x) = x ⇒ (f + 1)(x) =
2x ⇒ f (x) + x = 2x ⇒ f (x) = x. Значит, f — отражение пространства
V относительно Im g параллельно Ker g.

115
Лекция 23. Аффинные отображения

1 Определение
При линейном отображении f векторного F -пространства V в вектор-
ное F -пространство V ′ образ f (L) любого аффинного подпространства
L из V будет также аффинным подпространством в V ′ . Более того, ес-
ли f — инъективное отображение, то размерность образа не изменит-
ся, т. е. dim L = dim f (L). В частности, образ любой прямой — пря-
мая, образ плоскости — плоскость и т. д. Указанное свойство инъектив-
ных линейных отображений мы будем называть аффинным свойством,
а отображение, обладающее аффинным свойством, будем называть аф-
финным отображением. Данная лекция посвящена исследованию аф-
финных отображений.
Необходимо сразу заметить, что аффинное свойство отображений в слу-
чае |F | > 2 равносильно более слабому условию: образ любой прямой —
прямая, а в случае |F | = 2 равносильно тому, что образ любой плоско-
сти — плоскость. Этот факт может быть легко установлен без детально-
го анализа аффинных отображений, но мы этого делать не будем, так
как он будет следовать из наших дальнейших результатов по аффинным
отображениям. Ясно также, что условие «образ любой прямой — пря-
мая» не является каким-либо ограничением для инъективных отображ-
нией в случае двухэлементного поля F , так как в этом случае любые две
точки в F -пространстве образуют прямую; поэтому для поля F , состоя-
щего из двух элементов, определение аффинного отображения дается в
иной формулировке.
Определение 1. Пусть V и V ′ — векторные пространства над полем F .
Отображение f : V → V ′ называется аффинным,

1) если образ любой прямой — прямая и |F | > 2,


2) если образ любой плоскости — плоскость и |F | = 2.

Кроме инъективных линейных отображений, существуют и другие при-


меры аффинных отображений.
Определение 2. Пусть V — векторное пространство над полем F , и
a — произвольный вектор из V . Отображение t : V → V , определённое
следующим образом:
t(x) = a + x,
называется параллельным переносом F -пространства V .

116
Пусть L = b + W — произвольное аффинное подпространство из V с на-
правляющим пространством W и t(x) = x + a — параллельный перенос.
Тогда f (L) = (a+b)+W , и следовательно, образ аффинного подпростран-
ства при параллельном переносе остается аффинным подпространством.
В частности, размерность образа при параллельном переносе не меняет-
ся: образ прямой будет прямой, образ плоскости будет плоскостью и т. д.
Значит, параллельный перенос также является аффинным отображени-
ем.
Очевидно, что композиция двух аффинных отображений есть аффинное
отображение, поэтому любое отображение f : V → V ′ вида

f (x) = g(x) + a,

где g — инъективное линейное отображение V в V ′ , и a — произвольный


вектор из V ′ , также является аффинным отображением.
Возникает естесственный вопрос: любое ли аффинное отображение пред-
ставимо в виде композиции инъективного линейного отображения и па-
раллельного переноса? Оказывается, ответ на этот вопрос зависит от
поля F , над которым определены векторные пространства.

2 Случай |F | = 2
В этом разделе мы рассмотрим аффинные отображения F -пространств
для двухэлементного поля F . В этом случае справедлива
Теорема. Любое аффинное отображение f : V → V ′ векторного F -
пространства V в векторное F -пространство V ′ в случае |F | = 2 и
dim V > 2 есть композиция линейного отображения g : V → V ′ и
параллельного переноса t : V ′ → V ′ , т. е.

f (x) = g(x) + a

для некоторого a ∈ V ′ .

Доказательство. Достаточно показать, что отображение

g(x) = f (x) − f (0)

есть линейное отображение F -пространства V в F -пространство V ′ .


Во-первых, отображение g : V → V ′ , как композиция аффинных отоб-
ражений, есть афинное отображение. Во-вторых, g(0) = f (0) − f (0) = 0.

117
Покажем, что g — аддитивное отображение, т. е. g(a + b) = g(a) + g(b)
для любых a, b ∈ V .
Если a и b линейно зависимы, то, в силу ограничения на размер поля F ,
возможны три случая:

1) a = b

2) a 6= 0, b = 0

3) a = 0, b 6= 0

Простая проверка показывает, что в каждом из этих трех случаев равен-


ство g(a + b) = g(a) + g(b) выполняется.
Предположим теперь, что a и b линейно независимы. В этом случае под-
пространство W = ha, bi состоит из четырех векторов:

W = {0, a, b, a + b} .

Так как, согласно условию теоремы, множество g(W ) = {0, g(a), g(b), g(a + b)}
есть плоскость, то все элементы из g(W ) различны, и множество g(W )
замкнуто относительно сложения векторов. В частности, g(a) + g(b) ∈
g(W ), откуда и следует равенство g(a) + g(b) = g(a + b).
Наконец, справедливость равенства g(λa) = λg(a) для любых λ ∈ F и
a ∈ V следует из того, что F = {0, 1}.

3 Случай |F | > 2
В этом случае не любое аффинное отображение является композицией
линейного отображения и параллельного переноса. Всё зависит от неко-
торых свойств поля F . Напомним, что отображение ϕ : F → F называ-
ется автоморфизмом поля F , если выполнены три условия:

1) ϕ — биекция,

2) ϕ(α + β) = ϕ(α) + ϕ(β),

3) ϕ(α · β) = ϕ(α) · ϕ(β)

для любых α, β ∈ F . Очевидно, что любое тождественное отображение —


автоморфизм поля, который мы будем называть тривиальным. Не любое

118
поле обладает нетривиальными автоморфизмами. Так, например, поля
R и Zp , где p — простое, имеют только тривиальные автоморфизмы, а
поле C имеет нетривиальный автоморфизм — комплексное сопряжение:
ϕ(z) = z̄, т. е. ϕ(a+bi) = a−bi. С помощью автоморфизмов поля понятие
линейного отображения может быть обобщено следующим образом.

Определение 3. Пусть V и V ′ — векторные пространства над полем F .


Отображение f : V → V ′ называется полулинейным, если

1) f (x + y) = f (x) + f (y);

2) существует такой автоморфизм ϕ поля F , что

f (λx) = ϕ(λ)f (x)

для любых x, y ∈ V и любого λ ∈ F .

Ясно, что если ϕ — тождественный автоморфизм, то полулинейное отоб-


ражение f есть обычное линейное отображение. Таким образом, линей-
ное отображение есть частный случай полулинейного отображения.
Полулинейное отображение обладает свойствами, во многом аналогич-
ными свойствам линейных отображений. В частности, образ аффинного
подпространства при полулинейном отображении будет также аффин-
ным подпространством. Нам это свойство в полной общности не потре-
буется. Мы докажем лишь следующее

Предложение. Любое инъективное полулинейное отображение есть


аффинное отображение.

Доказательство. Пусть V и V ′ — векторные пространства над полем


F , ϕ — автоморфизм поля F и f — полулинейное отображение V в V ′ .
Можно считать, что ϕ — нетривиальный автоморфизм поля F и, следо-
вательно, |F | > 2.
В этой ситуации, согласно определению аффинного отображения, нам
необходимо показать, что образ прямой L = {a + λb | λ ∈ F } из V есть
прямая.
Действительно, f (L) = {f (a) + ϕ(λ)f (b) | λ ∈ F } = {f (a) + λf (b) | λ ∈ F },
а так как f — инъекция, то f (b) 6= 0. Значит, f (L) — прямая с направ-
ляющим пространством hf (b)i.

119
Из доказанного предложения вытекает, что композиция любого инъек-
тивного полулинейного отображения и параллельного переноса есть аф-
финное отображение. Оказывается, справедливо и обратное утвержде-
ние для инъективных аффинных отображений пространств размерности
> 2.
Теорема. Любое инъективное аффинное отображение f : V → V ′ век-
торного F -пространства V в векторное F -пространство V ′ в случае
|F | > 2 и dim V > 2 есть композиция полулинейного отображения
g : V → V ′ и параллельного переноса t : V ′ → V ′ , т. е.

f (x) = g(x) + a,

для некоторого a ∈ V ′ .

Достаточно показать, что отображение g(x) = f (x) − f (0) есть полули-


нейное отображение F -пространства V в F -пространство V ′ .
Заметим, во-первых, g(0) = f (0) − f (0) = 0, и во-вторых, отображение g,
как композиция инъективных аффинных отображений, есть инъектив-
ное аффинное отображение. Отсюда, в частности, следует, что

g(A ∩ B) = g(A) ∩ g(B)

для любых подмножеств A и B из V .


Доказательство аддитивности отображения g разбивается на ряд этапов:
Этап 1. Для любого ненулевого x ∈ V

g(hxi) = hg(x)i.

Доказательство. Так как x 6= 0 и g — инъекция, то g(x) 6= 0. Согласно


определению аффинного отображения, g(hxi) есть прямая в V ′ , причем,
проходящая через 0. Отсюда следует, что g(hxi) — одномерное подпро-
странство в V ′ , которое порождается любым своим ненулевым вектором
и, в частности, g(hxi) = hg(x)i.
Этап 2. Для любых линейно независимых x и y из V

g(y + hxi) = g(y) + hg(x)i.

Доказательство. Покажем сначала, что g(W ), где W = hx, yi, есть плос-
кость. Так как |F | > 2, то любая точка из W лежит на прямой, пере-
секающей прямые hxi и hyi. Отсюда следует, что любая точка из g(W )

120
лежит на прямой, пересекающей прямые hg(x)i и hg(y)i. Следовательно,
g(W ) = hg(x), g(y)i. Понятно также, что g(W ) не может быть прямой,
так как прямые hg(x)i и hg(y)i имеют одну общую точку. Значит, g(W ) —
плоскость.
Прямые y + hxi и hxi лежат в плоскости W и параллельны. В силу инъ-
ективности g, их образы, прямые g(y + hxi) и g(hxi) также будут парал-
лельны в плоскости g(W ) и, следовательно, направляющее пространство
прямой g(y + hxi) совпадает с g(hxi) = hg(x)i. Учитывая то, что прямая
g(y + hxi) проходит через точку g(y), мы получаем требуемое заключе-
ние.

Этап 3. Для любых линейно независимых x и y из V

g(x + y) = g(x) + g(y).

Доказательство. Заметим, что прямые L1 = x + hyi и L2 = y + hxi


пересекаются в точке x + y и, в силу инъективности g,

g(L1 ∩ L2 ) = g(L1 ) ∩ g(L2 ).

Значит g(L1 )∩g(L2 ) = {g(x + y)} . Согласно этапу 2, g(L1 ) = g(x)+hg(y)i


и g(L2 ) = g(y) + hg(x)i, откуда следует, что g(x) + g(y) ∈ g(L1 ) ∩ g(L2 ) =
{g(x + y)} , и поэтому g(x + y) = g(x) + g(y).

Этап 4. Для любого x ∈ V

g(−x) = −g(x).

Доказательство. Достаточно рассмотреть случай x 6= 0. В этом случае


найдется z ∈ V такой, что x и z линейно независимы. Но тогда x + z и
−x также линейно независимы и, согласно этапу 3, мы имеем:

g(z) = g(z + x + (−x)) = g(z + x) + g(−x) = g(z) + g(x) + g(−x).

Следовательно, g(−x) = −g(x).

Этап 5. Для любых x и y из V

g(x + y) = g(x) + g(y).

Доказательство. Согласно этапам 3 и 4, можно считать, что x и y ли-


нейно зависимы и x 6= −y. В этом случае найдется z ∈
/ hx, yi. Покажем,
что векторы x − z и y + z линейно независимы. Действительно, если

121
α(x − z) + β(y + z) = 0, то αx + βy + (β − α)z = 0 и, следовательно,
β = α. Значит α(x − z) + α(y + z) = α(x + y) = 0. Но x + y 6= 0, и поэтому
α = β = 0.
Теперь воспользуемся этапом 3:

g(x + y) = g((x − z) + (y + z)) = g(x − z) + g(y + z) =


= g(x) − g(z) + g(y) + g(z) = g(x) + g(y).

Таким образом, отображение g аддитивно. Покажем теперь, что g — по-


лулинейное отображение.
Пусть x — произвольный ненулевой вектор из V . В силу этапа 1, g(hxi) =
hg(x)i, и поэтому для любого λ ∈ F найдется такое µ ∈ F, что

g(λx) = µg(x).

Положим µ = πx (λ). Из биективности отображения g : hxi → hg(x)i


следует, что отображение πx : F → F также является биекцией.

Этап 6. Для любых λ, µ ∈ F и любого ненулевого x ∈ V

πx (λ + µ) = πx (λ) + πx (µ).

Доказательство. С одной стороны, g((λ + µ)x) = πx (λ + µ)g(x), а с дру-


гой — g((λ + µ)x) = g(λx + µx) = g(λx) + g(µx) = πx (λ)g(x) + πx (µ)g(x) =
(πx (λ) + πx (µ))g(x). Так как g(x) 6= 0, то πx (λ + µ) = πx (λ) + πx (µ).

Этап 7. Для любых ненулевых x и y из V

πx = πy .

Доказательство. Если x и y линейно независимы, то g(λx+λy) = g(λx)+


g(λy) = πx (λ)g(x) + πy (λ)g(y). С другой стороны, g(λx + λy) = g(λ(x +
y)) = πx+y (λ)g(x + y) = πx+y (λ)(g(x) + g(y)) = πx+y (λ)g(x) + πx+y (λ)g(y).
Значит πx (λ)g(x) + πy (λ)g(y) = πx+y (λ)g(x) + πx+y (λ)g(y). Так как g(x) и
g(y) также линейно независимы, то πx (λ) = πx+y (λ) и πy (λ) = πx+y (λ) и
поэтому πx (λ) = πy (λ).
Если x и y линейно зависимы, то в V найдется такой вектор z, что x
и z линейно независимы и y и z линейно независимы. Тогда, согласно
доказанному, πx = πz = πy .

122
Итак, отображение πx не зависит от выбора вектора x 6= 0. Положим
π = πx , где x — произвольный ненулевой вектор. Для завершения дока-
зательства теоремы нам осталось показать, что π — мультипликативное
отображение.

Этап 8. π(λµ) = π(λ)π(µ).

Доказательство. Возьмем произвольный ненулевой вектор x ∈ V . То-


гда для любых λ, µ ∈ F

g(λµx) = π(λ)g(µx) = π(λ)π(µ)g(x).

С другой стороны, g(λµx) = π(λµ)g(x). Значит π(λµ) = π(λ)π(µ).

123
Лекции 25-27. Собственные векторы

1 Определение
Пусть A — линейный оператор F -проостранства V . Вектор x ∈ V назы-
вается собственным вектором оператора A, если

1) x 6= 0
2) Ax = λx для некоторого λ ∈ F .

Коэффициент λ, который, очевидно, опеределен однозначно, называется


собственным значением оператора A, соответствующим собственному
вектору x.
Заметим, что

Ax = λx ⇔ (A − λ)x = 0 ⇔ x ∈ Ker (A − λ) ⇒
⇒ Ker (A − λ) 6= 0 ⇔ det(A − λ) = 0.

Следовательно, собственное значение λ является корнем многочлена


det(A − t) с переменной t. Далее многочлен f (t) = det(A − t) будем
называть характеристическим многочленом оператора A. Итак, спра-
ведлива
Теорема. Оператор A имеет собственный вектор с собственным зна-
чением λ ⇔ λ является корнем характеристического многочлена опе-
ратора A.

Множество всех собственных значений оператора A называется его спек-


тром. Из теоремы следует, что спектр A состоит из всех корней его
характеристического многочлена. В дальнейшем под кратностью соб-
ственного значения мы будем понимать его кратность как корня харак-
теристического многочлена.

2 Собственное подпространство
Подпространство Ker (A − λ), где λ — собственное значение оператора
A, называется собственным λ-подпространством или собственным под-
пространством, соответствующим собственному значению λ.
Очевидно, что
Ker (A − λ) = {x ∈ V | Ax = λx} .

124
Теорема. Собственные λi -подпространства для различных λ1 , . . . , λk
линейно независимы.

Доказательство. (Индукцией по k.)


База индукции: k = 1, очевидно.
Шаг индукции: Пусть k > 1 и v1 + . . . + vk = 0, где vi ∈ Ker (A − λi ).
Тогда A(v1 + . . . + vk ) = A0 или λ1 v1 + . . . + λk vk = 0.
Вычитая из полученного равенства исходное, умноженное на λk , получа-
ем
(λ1 − λk )v1 + . . . + (λk−1 − λk )vk−1 = 0
и, в силу индуктивного предположения, v1 = . . . = vk−1 = 0. Отсюда
следует, что и vk = 0.
Следствие 1. Собственные векторы с различными собственными зна-
чениями линейно независимы.
Следствие 2. Сумма собственных подпространств является прямой.
Теорема. Размерность собственного λ-подпространства не превосхо-
дит кратности собственного значения λ.

Доказательство. Выберем произвольный базис {e1 , . . . , ek } собственно-


го λ-подпространства и дополним его до базиса E = {e1 , . . . , ek , ek+1 , . . . , en }
всего пространства. Тогда
   
λE ∗ (λ − t)E ∗
(A)E = и (A − t)E = ,
0 ∗ 0 ∗
где E — единичная матрица порядка k. Значит, det(A − t) = (λ − t)k · g(t),
и k не превосходит кратности корня λ характеристического многочлена.

3 Диагонализируемые операторы
Ясно, что матрица оператора A в базисе E пространства V является
диагональной ⇔ базис E состоит из собственных векторов оператора
A. Далее оператор A будем называть диагонализируемым, если V имеет
базис, состоящий из собственных векторов оператора A; который будем
называть собственным базисом.
Пусть V1 , . . . , Vk — все собственные подпространства оператора A. По-
нятно, что A — диагонализируемый оператор ⇔ V = V1 ⊕ . . . ⊕ Vk ⇔
dim V = dim V1 + . . . + dim Vk . Значит, справедлива

125
Теорема. Оператор A пространства V диагонализируем ⇔ размер-
ность V равна сумме размерностей всех собственных подпространств.

Очевидно, что размерность V совпадает со степенью характеристическо-


го многочлена оператора A. Так как размерность любого собственного
λ-подпространства не превосходит кратности собственного значения λ,
то из теоремы вытекает важное

Следствие. Оператор A пространства V диагонализируем ⇔ харак-


теристический многочлен оператора A разложим на линейные множи-
тели и размерность каждого собственного λ-подпространства совпа-
дает с кратностью собственного значения λ.

На практике удобно также применять простое достаточное условие диа-


гонализируемости:

Теорема. Если оператор n-мерного пространства имеет n различных


собственных значений, то этот оператор диагонализируем.

Далее мы дадим основной критерий диагонализируемости оператора.


Для его доказательства нам потребуется

Лемма. dim Ker AB 6 dim Ker A + dim Ker B для любых линейных опе-
раторов A и B.

Доказательство. Пусть V1 = Ker AB и V2 = B(V1 ). Рассмотрим линей-


ное отображение B∗ : V1 → V2 , определённое следующим образом:

B∗ x := Bx.

Ясно, что Ker B∗ = Ker B и Im B∗ = V2 6 Ker A. Так как dim V1 =


dim Ker B∗ + dim Im B∗ , то

dim V1 6 dim Ker B + dim Ker A.

Следствие 1.
m
X
dim Ker (A1 · . . . · Am ) 6 dim Ker Ai
i=1

126
Следствие 2. Пусть A1 , . . . , Am — линейные операторы n-мерного про-
странства. Если A1 · . . . · Am = 0, то
m
X
dim Ker Ai > n.
i=1

Теорема (основной критерий диагонализируемости). Оператор A диа-


гонализируем ⇔ (A − λ1 ) · . . . · (A − λk ) = 0 для некоторых различных
элементов λ1 , . . . , λk .

Доказательство. ⇒ Пусть A — диагонализируемый оператор про-


странства V и λ1 , . . . , λk — все собственные значения оператора. Поло-
жим B = (A − λ1 ) · . . . · (A − λk ). Так как любой собственный вектор
оператора A лежит в Ker B, а V порождается собственными векторами,
то Ker B = V ⇒ B = 0.
⇐ Пусть (A − λ1 ) · . . . · (A − λk ) = 0 для некоторых различных λi ∈ F .
Согласно следствию 2,
k
X
dim Ker (A − λi ) > dim V
i=1

и, значит, сумма размерностей собственных подпространств равна dim V .

4 A-инвариантные подпространства
Выясним, в каких случаях матрица оператора A имеет верхний треуголь-
ный вид. Допустим, матрица оператора A в базисе E = {e1 , . . . , en } —
верхняя треугольная. Это значит, что для любого i = 1, . . . , n выполнено
условие

(T ) : Aei ∈ he1 , . . . , ei i.

Верно и обратное: если справедливо условие (T), то (A)E — верхняя тре-


угольная матрица. Для анализа условия (T) нам потребуется следующее
понятие:

Определение. Пусть A — линейный оператор пространства V . Подпро-


странство W 6 V называется A-инвариантным, если A(W ) ⊆ W , т. е.
образ любого вектора из W содержится в W .

127
Понятно, что ограничение A|W оператора A на A-инвариантное подпро-
странство W является линейным оператором пространства W .
С помощью нового понятия мы можем переформулировать условие (T)
следующим образом:
(T ′ ) :
he1 , . . . , ei i есть A-инвариантное подпространство для любого i = 1, . . . , n.

Если в пространстве V найдется возрастающая последовательность A-


инвариантных подпространств

0 = V0 < V1 < . . . < Vn = V,

для которых dim Vi = i, i = 1, . . . , n, то, выбирая ei ∈ Vi − Vi−1 , i =


1, . . . , n, мы получим базис E = {e1 , . . . , en } пространства V , удовлетво-
ряющий условию (T).
Таким образом, построение базиса E, в котором матрица A есть верх-
няя треугольная, фактически сводится к построению указанной последо-
вательности A-инвариантных подпространств. Оказывается, существует
простой критерий того, когда такое построение возможно. Для его дока-
зательства нам потребуется

Лемма. Пусть W есть A-инвариантное подпространство линейного


оператора A пространства V . Тогда характеристический многочлен
ограничения оператора A на подпространство W является делителем
характеристического многочлена оператора A.

Доказательство. Выберем базис E ′ = {e1 , . . . , ek } подпространства W и


дополним его до базиса E = {e1 , . . . , ek , ek+1 , . . . , en } всего пространства
V . Так как A(W ) ⊆ W , то
 
A B
(A)E = , где A = (A|W )E ′ .
0 C

Но тогда

A − tE B
det(A − t) = = det(A − tE) · det(C − tE)
0 C − tE

и, следовательно, характеристический многочлен оператора A|W явля-


ется делителем многочлена det(A − t).

128
Теорема. Базис, в котором матрица оператора имеет верхний тре-
угольный вид, существует тогда и только тогда, когда характеристи-
ческий многочлен оператора разложим на линейные множители.

Доказательство. Допустим, что матрица оператора A в некотором ба-


зисе E имеет верхний треугольный вид
 
α11 ∗

(A)E =  .. 
.
.
0 αnn

Тогда det(A − t) = (α11 − t) · . . . · (αnn − t) и, следовательно, характери-


стический многочлен оператора A разложим на линейные множители.
Обратное утверждение будем доказывать индукцией по размерности про-
странства V .
База индукции. В одномерном пространстве любая матрица оператора
имеет верхний треугольный вид.
Шаг индукции. Пусть dim V = n > 1 и теорема справедлива для лю-
бого пространства размерности < n. Так как характеристический много-
член оператора A разложим на линейные множители, то найдется соб-
ственное значение λ ∈ F оператора A. Заметим, что Im (A − λ) 6= V ,
так как Ker (A − λ) 6= 0. Следовательно, найдется подпространство W
размерности n − 1, содержащее Im (A − λ):

Im (A − λ) 6 W < V.

Так как для любого x ∈ W

Ax = (Ax − λx) + λx ∈ W,

то W есть A-инвариантное подпространство.


Рассмотрим ограничение B = A|W оператора A на подпространство W .
Характеристический многочлен оператора B является делителем харак-
теристического многочлена оператора A и поэтому также разложим на
линейные множители. Воспользовавшись индуктивным предположени-
ем, выберем в пространстве W базис {e1 , . . . , en−1 }, в котором B верх-
няя треугольняя и дополним его произвольным образом до базиса E =
{e1 , . . . , en } всего пространства V . Тогда в базисе E матрица A будет
верхней треугольной.

129
Лекция 28. Теорема Гамильтона—Кэли

1 Аннуляторы операторов
Ненулевой многочлен f ∈ F [x] называется аннулятором линейного опе-
ратора A F -пространства V , если f (A) = 0.
Заметим, что, согласно теореме о действиях в координатах, равенство
f (A) = 0 равносильно равенству f (A) = 0, где A — матрица оператора
A в произвольном базисе.
Пользуясь новым понятием, мы можем переформулировать критерий
диагонализируемости следующим образом:

Теорема (критерий диагонализируемости). Оператор A диагонализи-


руем ⇔ найдется аннулятор f оператора A, удовлетворяющий двум
условиям:

1) f разложим на линейные множители,

2) f не имеет кратных корней.

Справедлива следующая

Теорема (о существовании аннулятора). Любой линейный оператор ко-


нечномерного пространства имеет хотя бы один аннулятор.

Доказательство. Пусть V — n-мерное векторное пространство над по-


лем F . Так как пространство операторов имеет размерность n2 , то для
любого линейного оператора A пространства V операторы A0 = 1, A1 =
2
A, . . ., An линейно зависимы. Это значит, что некоторая нетривиальная
линейная комбинация этих операторов есть нулевой оператор:
2
αn2 An + . . . + α1 A + α0 · 1 = 0, αi ∈ F.

2
Полагая f (x) = αn2 xn +. . .+α1 x+α0 , мы получаем требуемый многочлен.

2 Теорема Гамильтона—Кэли
Существует более эффективный способ нахождения аннуляторов:

130
Теорема. Характеристический многочлен линейного оператора явля-
ется аннулятором этого оператора.

Доказательство. Пусть A — линейный оператор конечномерного про-


странства V . Будем доказывать утверждение теоремы индукцией по раз-
мерности V .
База индукции. Пусть V = he1 i и Ae1 = αe1 . Тогда характеристический
многочлен оператора A имеет вид f (t) = α−t и, значит, f (A) = α−α = 0.
Шаг индукции. Пусть dim V = n > 1 и для пространств меньшей
размерности теорема справедлива. Пусть также A — линейный опера-
тор пространства V и f (t) — его характеристический многочлен. Наша
цель — показать, что f (A) = 0, т. е. f (A)x = 0 для любого x ∈ V .
Возьмем произвольный вектор x ∈ V и рассмотрим последовательность
векторов: x1 = x и xi+1 = Axi , i ∈ N. Так как пространство V конеч-
номерно, то найдется такое k, что x1 , . . . , xk линейно независимы и xk+1
есть линейная комбинация векторов x1 , . . . , xk :

xk+1 = α1 x1 + . . . + αk xk .

Пусть W = hx1 , . . . , xk i. Согласно выбору векторов, Axi ∈ W для любого


i = 1, . . . , k, и значит подпространство W A-инвариантно.
Возможны два случая: W 6= V и W = V . Рассмотрим первый случай.
Согласно индуктивному предположению, в этом случае характеристиче-
ский многочлен ограничения оператора A на W является аннулятором
оператора A|W , и значит f1 (A)x = 0, где f1 (t) — характеристический
многочлен оператора A|W .
Напомним, что многочлен f1 является делителем многочлена f , т. е.
f (t) = g(t)·f1(t). Следовательно, f (A)x = g(A)·f1(A)x = g(A)(f1(A)x) =
g(A) · 0 = 0.
Рассмотрим второй случай: W = V . В этом случае n = k, и множество
векторов E = {x1 , . . . , xn } образует базис V . Матрица оператора A в этом
базисе имеет вид  
0 0 0 . . . α1
 1 0 0 . . . α2 
 
 0 1 0 . . . α3 
 
(A)E =  0 0 1 . . . α 
 4 
 .. .. .. . . .. 
 . . . . . 
0 0 0 . . . αn

131
Следовательно,
 
−t 0 0 ... α1

 1 −t 0 ... α2 


 0 1 −t ... α3 

(A − t)E =  0 0 1 ... α4 
 
 .. .. .. .. .. 
 . . . . . 
0 0 0 . . . αn − t
и det(A − t) = (−1)n (tn − αn tn−1 − . . . − α2 t − α1 ).
Напомним, что
xk+1 = α1 x1 + . . . + αk xk ,

или

An x1 = α1 x1 + α2 Ax1 + . . . + αn An−1 x1 .

Значит (An − αn An−1 − . . . − α2 A − α1 )x1 = 0, и поэтому f (A)x = 0 для


любого x ∈ V .

132
Лекции 29-30. Жорданова матрица

1 Разложение аннулятора
Нам уже известно, что если аннулятор оператора A : V → V раскла-
дывается на линейные множители, то в пространстве V можно постро-
ить башню A-инвариантных подпространств с одномерными скачками.
В большинстве задач такой информации вполне достаточно для реше-
ния. Но в ряде случаев, например, когда рассматриваются степени Ak
оператора A, приходится искать базисы V , в которых матрица A имеет
более простой вид, чем треугольный. Нам хотелось бы найти такой ба-
зис V , в котором матрица A была бы наиболее близка к диагональной
матрице, степени которой вычисляются без труда.
Заметим: если пространство V разложимо в прямую сумму A-инвариантных
подпространств
V = V1 ⊕ . . . ⊕ Vm ,
то, взяв упорядоченное объединение базисов Ei подпространств Vi , i =
1, . . . , m, мы получим базис E пространства V , в котором матрица A
имеет клеточно-диагональный вид:
 
A1 0

(A)E =  .. 
, где Ai = (A)Ei .
.
0 Am

Очевидно, что матрица A в базисе E является диагональной в том и


только том случае, когда все Vi одномерны.
Если нам не удаётся найти разложение V в прямую сумму одномерных
A-инвариантных подпространств, т. е. оператор A недиагонализируем,
то можно попытаться найти такое разложение пространства V , на пря-
мых слагаемых Vi которого оператор A действует достаточно просто.
В этом разделе лекции мы покажем, каким способом можно находить
разложение пространства V в прямую сумму A-инвариантных подпро-
странств с помощью разложений аннулятора оператора A в произведе-
ние взаимно-простых многочленов.

Теорема (о разложении аннулятора и пространства). Пусть A — ли-


нейный оператор F -пространства V и f = f (x) — произвольный анну-
лятор оператора A. Если многочлен f представим в виде произведения

133
взаимно-простых многочленов

f = f1 · f2 , fi ∈ F [x],

то, полагая Ai = fi (A), i = 1, 2, мы получаем разложение

V = Ker A1 ⊕ Ker A2 ,

причем, Ker Ai , i = 1, 2, — A-инвариантные подпротстранства. В част-


ности, многочлен fi является аннулятором ограничения оператора A
на подпространство Ker Ai .

Доказательство. Так как операторы Ai , i = 1, 2, есть линейные комби-


нации степеней оператора A, то они перестановочны:

A1 A2 = A2 A1 , A1 A = AA1, A2 A = AA2 .

Отсюда, в частности, следует, что Ker Ai — A-инвариантные подпро-


странства для i = 1, 2. Действительно, пусть x ∈ Ker Ai . Тогда

Ai (Ax) = A(Ai x) = A · 0 = 0,

и следовательно Ax ∈ Ker Ai .
Обратимся теперь к разложению пространства V . Согласно условию тео-
ремы, f (x) = f1 (x) · f2 (x), откуда следует, что

A1 A2 = f1 (A) · f2 (A) = f (A) = 0,

и значит A1 A2 = A2 A1 = 0.
Воспользовавшись критерием взаимной простоты, выберем теперь такие
многочлены g1 , g2 ∈ F [x], что

g1 f1 + g2 f2 = 1.

Полагая Bi = gi (A), i = 1, 2, мы получаем

B1 A1 + B2 A2 = 1.

Очевидно также, что операторы B1 , B2 , A1 , A2 попарно перестановочны,


так как являются линейными комбинациями степеней оператора A.
Для произвольного x ∈ V имеем

x = 1 · x = (B1 A1 + B2 A2 )x = B1 A1 x + B2 A2 x.

134
Так как A2 (B1 A1 x) = B1 (A2 A1 x) = B1 0 = 0, и аналогично, A1 (B2 A2 x) =
0, то
B1 A1 x ∈ Ker A2 и B2 A2 x ∈ Ker A1 .
Значит V = Ker A1 + Ker A2 .
Покажем, что эта сумма является прямой. Пусть x ∈ Ker A1 ∩ Ker A2 .
Тогда
x = B1 A1 x + B2 A2 x = B1 0 + B2 0 = 0 + 0 = 0,
и, следовательно, Ker A1 ∩ Ker A2 = 0.
Следствие 1. Если аннулятор f оператора A : V → V представим в
виде произведения взаимно-простых многочленов

f = f1 · . . . · fm , fi ∈ F [x],

то
V = V1 ⊕ . . . ⊕ Vm ,
где Vi — A-инвариантные подпространства и fi — аннулятор ограни-
чения оператора A на Vi , i = 1, . . . , m.
Следствие 2. Если аннулятор f оператора A : V → V разложим на
линейные множители

f (x) = (x − λ1 )k1 · . . . · (x − λm )km ,

где λ1 , . . . , λm — различные элементы поля F , то

V = V1 ⊕ . . . ⊕ Vm ,

где Vi — A-инвариантные подпространства и (x − λi )ki — аннулятор


ограничения оператора A на Vi , i = 1, . . . , m.

2 Нильпотентные операторы
Следствие 2 предыдущего раздела фактически сводит изучение действия
оператора A на V к исследованию действия A на Vi . Это действие об-
ладает одним специальным свойством: если положить Bi = A − λi , то
Biki x = 0 для любого x ∈ Vi . Этот факт объясняет введение нового поня-
тия:
Определение. Линейный оператор B : V → V нащывается нильпо-
тентным, если его некоторая степень есть нулевой оператор, т. е. Bm = 0
для некоторого m ∈ N.

135
Также обратим внимание на следующее обстоятельство: подпростран-
ство W 6 V является A-инвариантным тогда и только тогда, когда
W — Bi -инвариантно, где Bi = A − λi . Таким образом, нашу задачу
поиска самого «мелкого» разложения пространства V в прямую сумму
A-инвариантных подпространств мы свели к исследованию разложений
подпространств Vi в прямую сумму Bi -инвариантных подпространств. В
этом разделе лекции мы займемся таким исследованием.
Итак, пусть B — нильпотентный оператор пространства V .
Для произвольного ненулевого x ∈ V высотой вектора x относительно
нильпотентного оператора B будем называть наименьшее k ∈ N, для ко-
торого Bk x = 0. Высоту нулевого вектора по определению будем считать
равной 0. Высоту произвольного вектора x мы будем обозначать через
h(x).

Лемма. Для любого ненуневого вектора x высоты k векторы x, Bx, . . . , Bk−1 x


линейно независимы.

Доказательство. (Индукцией по высоте k.)


База индукции. k = 1. Очевидно.
Шаг индукции. Пусть k > 1. Тогда Bx 6= 0 и h(Bx) = h(x) − 1. Соглас-
но индуктивному предположению, векторы Bx, . . . , Bk−1 x линейно неза-
висимы. Если векторы x, Bx, . . . , Bk−1 x линейно зависимы, то вектор x
линейно выражается через векторы Bx, . . . , Bk−1 x. Но тогда его высота
h(x) не превосходит высот векторов Bx, . . . , Bxk−1 , которые 6 h(x) − 1.
Полученное противоречие показывает, что векторы x, Bx, . . . , Bk−1 x ли-
нейно независимы.

Определение. Для любого ненулевого вектора x высоты k подпростран-


ство hx, Bx, . . . , Bk−1 xi называется циклическим подпространством ниль-
потентного оператора B, порожденным вектором x.

Понятно, что циклическое подпространство B-инвариантно и E = x, Bx, . . . , Bk−1 x —
базис этого подпространства. Ограничение оператора B на циклическое
подпространство в базисе E задается матрицей
 T  
0 1
0 ... 0 0 0 0
... 0

 0 0
1 ... 0 


 1 0 0
... 0 
 .. ..
.. . . ..
=
 0 1 0
... 0 
 . .. . .  ,
   .. .. ..
. . .. 
 0 0 0 ... 1   . . . . 
.
0 0 0 ... 0 0 0 0 ... 0

136
которая называется нильпотентной жордановой клеткой. При этом E
называют циклическим базисом.
Теорема (о разложении в прямую сумму циклических подпространств).
Пространство V представимо в виде прямой суммы циклических под-
пространств нильпотентного оператора B.

Доказательство. (Индукцией по размерности V .)


База индукции. Очевидно, любое одномерное пространство является
циклическим подпространством нильпотентного оператора.
Шаг индукции. Пусть u — вектор максимальной высоты из V , а U —
циклическое подпространство оператора B, порожденное вектором u.
Среди всех B-инвариантных подпространств, имеющих нулевое пересе-
чение с U, выберем подпространство W максимальной размерности и
положим
V ∗ = U ⊕ W.
Согласно индуктивному предположению, W есть прямая сумма цикли-
ческих подпространств оператора B, поэтому нам достаточно показать,
что V = V ∗ .
Допустим, что V 6= V ∗ . В этом случае, очевидно, найдется такой вектор
v ∈ V − V ∗ , что Bv ∈ V ∗ . Значит Bv = x + y для некоторых x ∈ U и
y ∈ W . Так как h(Bv) < h(v) 6 h(u), то h(x) 6 h(x + y) = h(Bv) < h(u),
и значит h(x) < h(u). Следовательно x = Bz для некоторого z ∈ U, и
поэтому Bv = Bz + y или B(v − z) = y.
Положим W ∗ = hv−z, W i. Понятно, что подпространство W ∗ B-инвариантно
и W < W ∗ . Так как W — максимальное B-инвариантное подпростран-
ство, имеющее нулевое пересечение с U, то W ∗ ∩ U 6= 0. Значит найдутся
такие α 6= 0 и w ∈ W , что

α(v − z) + w ∈ U.

Но тогда v ∈ U + W , что противоречит выбору v. Полученное противо-


речие показывает, что V = V ∗ , и теорема доказана.

3 Жорданова матрица оператора


Возвратимся к линейному оператору A, аннулятор которого разлагается
на линейные множители. Напомним, что в этом случае

V = V1 ⊕ . . . ⊕ Vm ,

137
где Vi — A-инвариантные подпространства и (x−λi )ki — аннулятор огра-
ничения оператора A на Vi , i = 1, . . . , m.
Полагая Bi = A − λi , i = 1, . . . , m, мы получаем нильпотентные операто-
ры подпространств Vi .
Применяя теорему о разложении пространства в прямую сумму цикли-
ческих подпространств, мы можем каждое Vi представить в виде прямой
суммы циклических подпространств операторов Bi . Так как Bi = A − λi ,
то матрица ограничения оператора A на циклическое подпространство
в циклическом базисе имеет вид
 T  
λi 1 0 . . . 0 λi 0 0 . . . 0
 0 λi 1 . . . 0   1 λi 0 . . . 0 
   
 .. .. .. . . .
. ..  =  0 1 λi . . . 0  .
  
 . . .
   .. .. .. . . . 
 0 0 0 ... 1   . . . . .. 
0 0 0 . . . λi 0 0 0 . . . λi

Такая матрица называется жордановой клеткой с собственным значени-


ем λi .
Беря упорядоченное объединение циклических базисов всех циклических
подпространств операторов Bi для всех i, мы получаем базис простран-
ства V , который мы будем называть жордановым, а матрицу A в жор-
дановом базисе будем называть жордановой матрицей. Ясно, что жор-
данова матрица имеет вид
 
J1 0
 .. 
,
 .
0 Js

где J1 , . . . , Js — жордановы клетки жордановой матрицы.

138

Оценить