Андрей Смоленский
4 июня 2021 г.
Содержание
1 Основы теории множеств 3
1.1 Множества и операции над ними . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Упорядоченные пары, кортежи и декартово произведение . . . . . . . . . . . . . 5
1.3 Бинарные отношения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Отношения эквивалентности и разбиения . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6 Фактор‐множества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Отношения порядка и математическая индукция . . . . . . . . . . . . . . . . . . . 14
3 Поля и многочлены 39
3.1 Поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Многочлены одной переменной . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3 Деление и вычисление значений многочленов . . . . . . . . . . . . . . . . . . . . . 42
3.4 Алгоритмические аспекты деления многочленов . . . . . . . . . . . . . . . . . . . 44
3.5 Комплексные числа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6 Геометрическая интерпретация комплексных чисел . . . . . . . . . . . . . . . . . 48
3.7 Дробно‐линей ные преобразования . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.8 Полиномиальные уравнения комплексной переменной . . . . . . . . . . . . . . . 54
1
3.9 Производная и кратные корни . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.10 Интерполяция . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.11 Поле частных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.12 Рациональные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5 Линейные операторы 94
5.1 Определитель оператора, собственные числа и собственные векторы . . . . . . 94
5.2 Спектр графа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3 Диагонализация и жорданова форма . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4 Приложения жордановой формы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
2
1 Основы теории множеств
1.1 Множества и операции над ними
Множества понимаются как «собрания элементов» в том смысле, что для любого объекта x
(какой бы природы он ни был) и для любого множества X либо этот объект является его
элементом (этот факт мы обозначаем записью x ∈ X), либо не является (тогда x ∈
/ X). Мно‐
жество однозначно определяется своими элементами. Это означает, что два множества A и
B совпадают, если у них одинаковые элементы, то есть всякий элемент множества A обяза‐
тельно является также элементом множества B, и наоборот.
Мы не будем строго строить теорию множеств и давать точное аксиоматическое опреде‐
ление понятия множества, но обозначим некоторые свой ства, которым это понятие должно
удовлетворять, чтобы не наткнуться на известные парадоксы (см. ниже).
• Простей ший способ задать множество — перечислить его элементы в виде явного спис‐
ка, например, X = {1, 2, 3, 99}. При этом
– множество, состоящее из одного элемента, отличается от этого элемента: {x} 6= x,
{{x}} 6= {x} и так далее;
– не учитываются повторы, то есть {x, x} = {x};
– не учитывается порядок элементов в списке: {x, y} = {y, x};
– список может не содержать ни одного элемента — такое множество называется
пустым и обозначается символом ∅;
– пустое множество — самостоятельная сущность, которая может быть элементом
какого‐то множества, и там самым, в частности ∅ 6= {∅} и {x, ∅} 6= {x}.
• Постулируется существование бесконечного множества натуральных чисел, которое
можно неформально записать в виде N = {1, 2, 3, . . .}. Подразумевается, что при виде
такой надписи читающий ее понимает, какие именно элементы имеются в виду. Мы
иногда будем пользоваться подобными неформальными записями, например, множе‐
ство всех четных целых чисел в таком стиле можно записать как {. . . , −4, −2, 0, 2, 4, . . .}.
Далее мы увидим, как можно строго построить их на основе множества натуральных
чисел.
• Если множества A и B таковы, что все элементы A являются также элементами B, то
мы говорим, что A является подмножеством B (также, что A содержится в B). Для та‐
кой ситуации мы используем запись A ⊆ B. С таким обозначением можно сказать, что
A = B тогда и только тогда, когда A ⊆ B и B ⊆ A. Обратите внимание, что запись
A ⊆ B не исключает случая A = B. Если хочется подчеркнуть, что A ⊆ B, но A 6= B,
то пишут A ( B (или A j B) и говорят, что A строго содержится в B (или является
собственным подмножеством). Часто в литературе можно также встретить для таких
случаев обозначение A ⊂ B (по аналогии с < и 6), но оно иногда используется как
эквивалент ⊆, так что мы постараемся его избегать.
Свой ство включения множеств обладает следующими простыми свой ствами:
– Для любого множества A имеем ∅ ⊆ A.
– Если A ⊆ B и B ⊆ C, то A ⊆ C.
3
x ∈ B (возможно, что в обоих сразу). Разумеется, объединение можно определить и
для большего количества множеств. Если объединяемых множеств конечное число, то
в дополнительном определении смысла немного, так как для любых трех множеств A,
B и C выполнено (A∪B)∪C = A∪(B ∪C). Поэтому если A1 , A2 , . . . , An — множества, то
A1 ∪ . . . ∪ An можно определить рекуррентно как (A1 ∪ . . . ∪ An−1 ) ∪ An — но скобки тут,
разумеется, можно расставить как угодно. Отметим некоторые тривиальные свой ства
объединения:
A ∪ B = B ∪ A, A ∪ A = A, A ∪ ∅ = A.
Последние два свой ства являютс частными случаями более общего свой ства: если B ⊆
A, то A ∪ B = A.
• В уже существующем множестве можно выделять подмножества посредством какого‐
либо предиката. А имменно, пусть P (a) — некоторое суждение, которое, в зависимости
от параметра a, может либо истинным, либо ложным. Тогда для уже имеющегося мно‐
жества A можно сформировать новое множество B = {a ∈ A | P (A)}, состоящее в точ‐
ности из тех элементов a множества A, для которых суждение P (a) истинно. Например,
если A = {1, 2, 3, 4, 5}, то {a ∈ A | a нечетно} = {1, 3, 5}. Аналогично, множество всех
четных натуральных чисел строится как {a ∈ N | a четно}.
Очень существенно, что выделение при помощи предиката производится из некоторо‐
го уже построенного множества, то есть элементы берутся не «из воздуха».
Рассмотрим «множество» X всех множеств, которые не являются собственными элементами. Является ли
само множество X элементом множества X? Если да, то по определению X оно не должно быть его элемен‐
том, если же нет, то должно — оба варианта противоречивы. Это явление известно как парадокс Рассела—
Цермело. Чтобы разрешить его, аксиоматика теории множеств не допускает подобных конструкций — в
частности, нет «множества всех множеств».
A ∩ B = {x ∈ A | x ∈ B} = {x ∈ B | x ∈ A}.
A ∩ B = B ∩ A, (A ∩ B) ∩ C = A ∩ (B ∩ C), ∀B ⊆ A A ∩ B = B.
A 4 B = (A ∪ B) \ (A ∩ B) = (A \ B) ∪ (B \ A).
4
• Операции объединения и пересечения можно распространить на бесконечные наборы
множеств. А именно, если A — такое множество,
S что все его элементы сами являются
множествами, то существует множество a∈A a, элементы которого это в точности те
объекты, которые являются элементами хотя бы одного a ∈ A. Аналогично определя‐
ется пересечение, хотя для него не требуется специального нового определения, так
как, выбрав некоторый a0 ∈ A, можно положить
\
a = {x ∈ a0 | ∀a ∈ A x ∈ a},
a∈A
5
Аналогично можно определить и упорядоченные наборы из более чем двух элементов.
Определение 1.2.3. Упорядоченной n‐кой (или кортежем длины n, или тупелем (от англ.
tuple)) называется набор (x1 , x2 , . . . , xn ), и равенство двух наборов определяется равенством
элементов на соответствующих позициях:
(a1 , . . . , an ) = (x1 , . . . , xn ) ⇔ a1 = x1 , a2 = x2 , . . . , an = xn .
A × B = {(a, b) | a ∈ A, b ∈ B}.
Формально определение выше не вполне корректно, потому что не удовлетворяет тре‐
бованиям, предъявляемым к процедуре выделения подмножества при помощи предиката.
Для практических целей существование такого множества можно постулировать в качестве
аксиомы.
Если же подходить к этому вопросу строго, то можно воспользоваться какой ‐нибудь из моделей упорядоченной
пары. Например, в модели Куратовского упорядоченная пара (a, b) состоит из двух множеств {a} и {a, b}, которые
оба являются подмножествами множества A ∪ B, или, что то же самое, элементами множества 2A∪B . Это означает,
2A∪B
что набор множеств {{a}, {a, b}} является подмножеством 2A∪B , то есть элементом множества 2 . В этом
множестве декартово произведение уже выделяется при помощи предиката:
A∪B
A×B = x∈2 2 ∃a ∈ A, b ∈ B т. ч. x = (a, b) .
A1 × . . . × An = {(a1 , . . . , an ) | ∀i = 1, . . . , n ai ∈ Ai }.
A × B × C, (A × B) × C и A × (B × C)
различны (хотя первые два совпадают, если мы принимаем рекуррентное определение упо‐
рядоченной трой ки).
Для декартова произведения множества с собой мы будем использовать обозначение A2 =
A × A. Аналогично, An = A × . . . × A (n раз).
Отметим некоторые свой ства декартова произведения.
• A × ∅ = ∅ × A = ∅;
• (A ∪ B) × C = (A × C) ∪ (B × C), (A ∩ B) × C = (A × C) ∩ (B × C) и аналогичные
формулы для A × (B ∪ C) и A × (B ∩ C);
• (A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D) — для объединения аналогичной формулы нет.
6
1.3 Бинарные отношения
Определение 1.3.1. Бинарным отношением R между элементами множеств A и B называ‐
ется подмножество их декартова произведения: R ⊆ A × B. В случае, если A = B, будем
говорить, что R ⊆ A2 это бинарное отношение на A.
Примеры 1.3.2. Во многих случаях бинарное отношение выделяется в декартовом произ‐
ведении при помощи предиката, выражающего какое‐то соотношение между элементами
упорядоченной пары.
1. R = {(x, y) ∈ R2 | x 6 y};
2. R = {(x, y) ∈ N2 | x делится на y};
3. R = {(x, y) ∈ A × 2A | x ∈ y};
4. R = {(x, y) ∈ 2A × 2A | x ⊆ y};
5. R = {(x, y) ∈ 2A × 2A | |x| = |y|};
6. Пусть Ln — множество прямых в n‐мерном пространстве, и
a) R = {(x, y) ∈ L22 | x k y},
b) R = {(x, y) ∈ L22 | x ⊥ y},
c) R = {(x, y) ∈ L33 | x и y скрещивающиеся}.
Обратите внимание, что в большинстве примеров выше предикат выражается каким‐то
уже имеющимся символом, что мотивирует следующее
Определение 1.3.3. Будем говорить, что x находися в отношении R с y (или что x и y нахо‐
дятся в отношении R), если (x, y) ∈ R, и обозначать это посредством xRy.
С учетом этого обозначения мы могли бы сразу обозначить бинарное отношение из при‐
мера 1 символом 6, а примеры 3, 4, 6a и 6b соответственно посредством ∈, ⊆, k и ⊥. С дру‐
гой стороны, полезно иметь и альтернативные обозначения, потому что иначе для указания
связей между различными бинарными отношениями пришлось бы использовать несколько
неуклюжие формулы наподобие
Хотя три указанные выше формулы верны (первая утверждает, что из строгого неравенства
следует нестрогое; вторая показывает, что равенство противоречит строгому неравенству;
третья соответствует тому, что два разнонаправленных неравенства выполняются одновре‐
менно только для равных элементов, то есть антисимметричность), мы постараемся не зло‐
употреблять возникающими лингвистическими возможностями.
Впрочем, далее мы увидим, что многие естественные примеры бинарных отношений име‐
ют другую природу.
Теперь определим некоторые свой ства, которыми могут обладать бинарные отношения
на множестве.
Определение 1.3.4. Пусть R ⊂ A2 — бинарное отношение на A. Мы будем говорить, что R
• рефлексивно, если ∀x ∈ A xRx;
• симметрично, если ∀x, y ∈ A из xRy следует yRx;
7
• антисимметрично, если ∀x, y ∈ A из xRy и yRx следует x = y;
8
7. {(α, β) ∈ R2 | α − β = 2πk для некоторого k ∈ Z} — эквивалентность величин углов.
Теперь мы дадим другое описание отношений эквивалентности.
Определение 1.4.3. Разбиением множества A называется набор B подмножеств A (т.е. B ⊆
2A ), удовлетворяющий следующим условиям:
• ∅∈
/ B;
• ∀b, c ∈ B если b 6= c, то b ∩ c = ∅;
S
• A = b∈B b.
9
1.5 Функции
Неформально говоря, функция из множества A в множество B это некое «правило сопостав‐
ления» элементов B элементам A. Это означает, что каждому элементу множества A соот‐
ветствует однозначно определенный элемент множества B. Поскольку не все интересую‐
щие нас функции удобно задаются формулами (если задаются вообще!), мы формализуем
понятие функции с помощью понятия бинарного отношения.
Определение 1.5.1. Бинарное отношение Γ ⊆ A×B называется графиком, если для любого
a ∈ A существует ровно один такой b ∈ B, что aΓb.
Это понятие отвечает привычному понятию графика функции. Например, функции, возво‐
дящей вещественное число x в квадрат, отвечает подмножество плоскости {(x, x2 ) | x ∈ R},
которое, очевидно, является графиком в смысле определения выше.
Определение 1.5.2. Функцией из множества A в множество B называется упорядоченная
трой ка f = (A, B, Γ), где Γ — график.
Обозначение 1.5.3. Если f — функция из A в B, то мы будем это записывать как f : A → B.
Замечание 1.5.4. Две функции f : A → B и g : C → D равны, если равны их области опреде‐
ления (A = C), области прибытия (B = D), а также совпадают графики (то есть для любого
x ∈ A выполнено f (x) = g(x)).
Введем некоторые обозначения и необходимую терминологию.
• Если b ∈ B таков, что aΓb (такой b существует и единственный ), то b называется обра‐
зом a под дей ствием f (или значением f в/на a) и обозначается f (a).
• Множество A называется областью определения, а B областью прибытия.
• Если C ⊆ A, то f (C) = {f (a) | a ∈ C} называется образом C. При этом f (A) иногда
называется областью значений.
• Если b ⊆ B, то f −1 (b) = {a ∈ A | f (a) = b} называется (полным) прообразом C, а
всякий его элемент — прообразом b. Естественным способом определяется прообраз
подмножества C ⊆ B, а именно f −1 (C) = {a ∈ A | f (a) ∈ C}.
Определение 1.5.5. Пусть f : A → B. Функция f называется
• инъективной (или инъекцией), если для любых a, b ∈ A если a 6= b, то f (a) 6= f (b);
• сюръективной (или сюръекцией), если для любого b ∈ B существует такой a ∈ A, что
f (a) = b;
• биективной (или биекцией), если она инъективна и сюръективна, то есть для любого
b ∈ B существует ровно один такой a ∈ A, что f (a) = b.
Иными словами, функция инъективна, если полный прообраз любого элемента содержит не
более одного элемента, сюръективна, если содержит хотя бы один, и биективна, если ровно
один.
Пример 1.5.6. Обозначим через R>0 = {x ∈ R | x > 0} множество неотрицательных веще‐
ственных чисел и рассмотрим четыре функции
10
все задаваемые одной и той же формулой fi (x) = x2 (различаются только область опре‐
деления и область прибытия). Тогда функция f1 не инъективна и не сюръективна (так как
f1−1 (1) = {1, −1} и f1−1 (−1) = ∅), функция f2 не инъективна, но сюръективна, функция f3
инъективна, но не сюръективна, а f4 биективна.
Определение 1.5.7. Сужением или ограничением функции f : A → B на подмножество C ⊆
A называется функция f |C : C → B, дей ствующая по правилу f |C (x) = f (x). Формально,
если f = (A, B, Γ), то f |C = (C, B, Γ ∩ (C × B)).
В примере выше f3 = f1 |R>0 и f4 = f2 |R>0 .
Можно вычислять значение одной функции на значении другой функции.
Определение 1.5.8. Пусть f : A → B и g : B → C, тогда композицией функций g и f называ‐
ется функция g ◦ f : A → C, дей ствующая по правилу (g ◦ f )(x) = g(f (x)).
Предложение 1.5.9. Композиция функций ассоциативна, то есть если f : A → B, g : B → C
и h : C → D, то обе композиции h ◦ (g ◦ f ) и (h ◦ g) ◦ f определены и совпадают.
Доказательство. g ◦ f есть функция из A в C, так что композиция h и g ◦ f определена и
является функцией из A в D. Аналогично, h◦g : B → D, а тогда (h◦g)◦f : A → D определена.
Проверим теперь, что совпадают значения во всех точках. Пусть a ∈ A, тогда
h ◦ (g ◦ f ) (a) = h (g ◦ f )(a) = h g(f (a)) ,
(h ◦ g) ◦ f (a) = (h ◦ g)(f (a)) = h g(f (a)) .
Замечание 1.5.10. Композиция функций не коммутативна, то есть не обязательно f ◦ g =
g ◦ f.
Дей ствительно, даже если композиция в одном порядке определена, композиция в другом
не обязательно существует. Чтобы обе композиции существовали, требуется, чтобы f : A →
B и g : B → A. Но даже в этом случае, если A 6= B, получаются функции с различающими
областями определения и прибытия, а именно g ◦ f : A → A, но f ◦ g : B → B. Наконец,
даже если A = B, легко привести пример функций , у которых две композиции не совпадают.
Например, положим f : R → R, f (x) = x + 1, и g : R → R, g(x) = x2 — тогда (g ◦ f )(x) =
x2 + 2x + 1, но (f ◦ g)(x) = x2 + 1.
Предложение 1.5.11. Композиция инъективных (сюръективных, биективных) функций инъ‐
ективна (сюръективна, биективна).
Доказательство. Пусть f : A → B и g : B → C. Предположим сначала, что f и g инъективны
и рассмотрим значения (g ◦ f ) на каких‐нибудь точках x, y ∈ A. Если g(f (x)) = g(f (y)), то по
инъективности g получаем, что f (x) = f (y), откуда в силу инъективности f имеем x = y, так
что g ◦ f также инъективна.
Пусть теперь f и g сюръективны. Если c ∈ C, то по сюръективности g най дется такой
b ∈ B, что g(b) = c. Но в силу сюръективности f существует такой a ∈ A, что f (a) = b. Тогда
(g ◦ f )(a) = g(f (a)) = g(b) = c.
Предложение 1.5.12. Пусть f : A → B и g : B → C. Если g ◦ f инъективна, то f инъективна.
Если g ◦ f сюръективна, то g сюръективна.
Доказательство. Пусть g ◦ f инъективна. Рассмотрим значения g ◦ f на двух точках x, y ∈ A.
Если x 6= y, то g(f (x)) 6= g(f (y)), а тогда f (x) 6= f (y) (иначе применение к ним g давало бы
равные значения), так что f инъективна.
Если g ◦ f сюръективна, то для любого c ∈ C най дется такой a ∈ A, что (g ◦ f )(a) = c. Тогда
положим b = f (a) — это искомый прообраз c относительно g, так что g сюръективна.
11
Определение 1.5.13. Тождественной функцией на множестве A называется функция idA : A →
A, дей ствующая по правилу idA (x) = x.
Замечание 1.5.14. Для любой функции f : A → B выполнено idB ◦f = f и f ◦ idA = f .
Сей час мы определим три важных понятия, тесно связанных с инъективностью и сюръек‐
тивностью.
12
Если f обратима, то она обратима слева и справа, а тогда по уже доказанным пунктам инъ‐
ективна и сюръективна. Обратно, если f биективна, то обратная функция строится так же,
как и выше, только на этот раз не требуется делать никаких выборов, так как прообраз един‐
ственный . Формально, если обозначить через extr функцию, которая по одноэлементному
подмножеству A возвращает его единственный элемент, то обратная функция g задается
формулой g(b) = extr f −1 (b) .
Обозначение 1.5.18. Если функция, обратная к f , существует, она обозначается символом
f −1 . Тогда запись f −1 (b) может означать как образ под дей ствием обратной функции, так
и полный прообраз относительно f (состоящий из одного элемента). Смысл всегда будет
однозначно восстанавливаться из контекста.
Замечание 1.5.19. Если f и g обратимы, то (g ◦ f )−1 = f −1 ◦ g −1 .
Обозначение 1.5.20. Множество всех функций из множества A в множество B будем обо‐
значать B A .
Чтобы строго обосновать, почему B A является множеством, заметим, что функция f : A → B является трой кой
(A, B, Γf ) и, тем самым, элементом множества {A} × {B} × 2A×B , из которого множество всех функций уже вы‐
деляется предикатом, а именно B A = {f ∈ {A} × {B} × 2A×B | ∃Γ ⊆ A × B — график, т. ч. f = (A, B, Γ)}. Более
короткий способ записать то же самое: B A = {A} × {B} × {Γ ∈ 2A×B | Γ — график}.
Замечание 1.5.21. (
∅ A 0, если A 6= ∅,
A = 1, ∅ = .
1, еслиA = ∅.
С использованием метода математической индукции (см. ниже) это доказательство можно сократить примерно
в два раза (все заканчивается на переходе к |B A\{a1 } |).
13
Замечание 1.5.24. Отображение 2A → {0, 1}A , переводящее B ⊆ A в χB , является биекцией .
Доказательство. Обратное отображение переводит функцию f : A → {0, 1} в f −1 (1).
В частности, для конечного множества A имеет место равенство |2A | = 2|A| .
Еще одна причина, почему для обозначения множества всех функций f : A → B выбрано
обозначение B A , кроме изложенных в Предложении 1.5.22 и Замечании 1.5.24, связана с де‐
картовыми степенями. А именно, имеется естественная биекция между An = A × . . . × A (n
раз) и A{1,...,n} , переводящая кортеж (a1 , . . . , an ) в функцию f (i) = ai .
Если полагать функцию исходным понятием, можно определять упорядоченные пары и более длинные кортежи
длины n как функции из фиксированного 2‐ или n‐элементного множества.
1.6 Фактор‐множества
Пусть ∼ — отношение эквивалентности на множестве A.
Определение 1.6.1. Фактор‐множеством A по отношению ∼ называется
14
• (a, b) 6 (a′ , b′ ) ⇔ a 4 a′ и b l ′
−b;
• (a, b) 6 (a′ , b′ ) ⇔ a ≺ a′ или a = a′ и b l ′
−b;
6. если A и B — два непересекающихся множества с порядками 4 и l−, то можно опреде‐
лить следующий порядок на A ∪ B:
x 6 y ⇐⇒ x, y ∈ A и x 4 y или x, y ∈ B и x l
− y или x ∈ A и y ∈ B ;
Не всякий порядок линеен, так что понятие «самого маленького» элемента подмножества
распадается на два.
Определение 1.7.4. Пусть (A, 6) — частично упорядоченное множество, и B ⊆ A — непу‐
стое. Элемент x ∈ B называется
15
Определение 1.7.7. Частично упорядоченное множество A называется вполне упорядочен‐
ным, а порядок полным, если любое непустое подмножество B ⊆ A содержит наименьший
элемент.
Замечание 1.7.8. Полный порядок является линей ным.
Доказательство. Пусть x, y два элемента. Рассмотрим множество {x, y} — в нем имеется
наименьший элемент, скажем, a. Обозначим оставший ся элемент b (если x 6= y, иначе поло‐
жим b = x = y), тогда a 6 b и тем самым x и y сравнимы.
Факт 1.7.9. Множество натуральных чисел N относительно естественного порядка является
вполне упорядоченным.
Строго говоря, в рамках аксиоматики теории множество по Цермело—Френкелю указанный факт входит в опре‐
деление множества натуральных чисел. А именно, постулируется существование вполне упорядоченного множе‐
ства, которое не является конечным (не изоморфно себе с инвертированным порядком) и которое можно инъек‐
тивно отобразить в любое бесконечное [вполне упорядоченное].
16
2. Истинность P (n − i) для всех 0 6 i < k влечет истинность P (n + 1);
17
2 Алгебраические структуры и элементарная теория чисел
2.1 Бинарные операции
Определение 2.1.1. Бинарной операцией на множестве A называется функция φ : A×A → A.
Обозначение 2.1.2. Бинарные операции часто записывают при помощи инфиксной записи,
то есть символ операции вставляется между аргументами, например, φ(x, y) = x ∗ y;
Примеры 2.1.3.
1. x + y на множестве N, Z, Q, R;
2. x · y на N, Z, R, R>0 , R \ {0};
3. x − y на R;
4. φ(x, y) = xy на R>0 ;
5. φ(x, y) = max(x, y) на R;
6. φ(x, y) = x;
7. f ◦ g на AA ;
8. Векторное произведение в трехмерном пространстве;
9. X ∪ Y , X ∩ Y , X \ Y и X 4 Y на 2A ;
Кроме функциональной и инфиксной записи распространены также префиксная и постфиксная запись. Пре‐
фиксная запись иногда именуется «польской нотацией », особенно если пишется без скобок и запятых — в ней вы‐
ражение (1 + 2) · (3 + 4) запишется как ∗ + 1 2 + 3 4 (если известна арность операций , то скобки не требуются).
Аналогичная форма постфиксной записи называется «обратной польской » и используется в стековых машинах (и,
например, в языке описания страниц Postscript). В математике постфиксная запись используется в основном для
унарных операций , таких, как дифференцирование: f ′ . Вообще говоря, бинарные операции записываются самыми
разными способами, например, xy , xy
, [x, y] для векторного произведения или, более общно, коммутатора, x + y
mod m для сложения по модулю m.
(. . . ((x2 ∗ x2 ) ∗ x3 ) ∗ . . . ∗ xn ).
18
Рассмотрим произвольную расстановку скобок — в ней последнее выполняемое дей ствие
состоит в перемножении произведений (каждое с какой ‐то расстановкой скобок)
(x1 ∗ . . . ∗ xk ) ∗ (xk+1 ∗ . . . ∗ xn ).
19
• относительно взятия максимума ней трального элемента нет (но если ограничить эту
операцию на [a, b], то a будет для нее ней тральным);
• для операции φ(x, y) = x любой элемент является правым ней тральным, а левый ней ‐
тральный существует только если операция задана на одноэлементном множестве;
• id является ней тральным относительно композиции;
Выясним теперь, когда бинарная операция задает естественным образом бинарную опе‐
рацию на фактор‐множестве. А именно, пусть ∼ это отношение эквивалентности на множе‐
стве A и ∗ — бинарная операция на A, тогда естественно определить.
является конгруэнтностью для сложения и умножения целых чисел. Дей ствительно, если
a ∼ a′ и b ∼ b′ , то для каких‐то k, l ∈ Z имеем a′ = a + km и b′ = b + lm, тогда
a′ + b′ = (a + b) + (k + l)m ⇒ a′ + b′ ∼ a + b,
a′ b′ = ab + (kb + la + klm)m ⇒ a′ b′ ∼ ab.
20
2.2 Группы и кольца
Определение 2.2.1. Пусть G — множество, а ∗ — бинарная операция на G. Пара (G, ∗) назы‐
вается (абстрактной) группой, если выполнены следующие три условия:
• операция ∗ ассоциативна;
• существует элемент e ∈ G, ней тральный относительно ∗;
• у каждого элемента a ∈ G существует обратный элемент b ∈ G.
Допуская вольность речи, мы будем говорить, что G является группой относительно ∗. Эле‐
мент, обратный к a ∈ G, будем обозначать a−1 .
Примеры 2.2.2.
1. (R, +), (Q, +), (Z, +) — но не (N, +);
2. (R>0 , ·), (R \ {0}, ·) — но не (R, ·) и не (Z \ {0}, ·);
3. множество всех биекций A → A относительно композиции (если A 6= ∅), а также все‐
возможные множества биекций , сохраняющих какую‐то структуру (так как компози‐
ция таких преобразований это снова биекция, сохраняющая структуру, тождественное
и обратное к данному преобразования тоже ее сохраняют), например:
• все повороты вокруг начала координат;
• все параллельные переносы;
• все движения;
• все симметрии фиксированной геометрической фигуры;
• все автоморфизмы графа, то есть биекции на множестве вершин, переводящие со‐
единенные ребром в соединенные ребром;
• все строго монотонно возрастающие функции [0, 1] → [0, 1];
• все строго монотонные функции [0, 1] → [0, 1] (как возрастающие, так и убываю‐
щие);
• все биекции, переводящие эквивалентные элементы в эквивалентные (относи‐
тельно некоторого фиксированного отношения эквивалентности);
4. (2A , 4) — здесь ней тральным элементом выступает ∅, а обратный X −1 = A \ X;
5. для двух групп (G, ∗) и (H, ⋆) множество G × H относительно операции (a, x) • (b, y) =
(a ∗ b, x ⋆ y) — ней тральным элементом является пара (eG , eH ), а обратный к (a, x) вы‐
числяется как (a−1 , x−1 );
6. для группы (G, ∗) и множества A множество GA относительно поточечного примене‐
ния ∗, то есть для f, g : A → G полагаем (f ⋆ g)(a) = f (a) ∗ g(a).
Определение 2.2.3. Группа (G, ∗) называется коммутативной, или абелевой, если операция
∗ коммутативна.
Определение 2.2.4. Пусть R — множество, а + и · две бинарные операции на R. Тогда трой ка
(R, +, ·) называется кольцом (или, более точно, ассоциативным кольцом с 1), если
• (G, +) — абелева группа;
21
• операция · ассоциативна;
• существует элемент 1 ∈ R, ней тральный относительно ·;
• операция · дистрибутивна относительно +, то есть для любых x, y, z ∈ R выполнено
(x + y) · z = (x · z) + (y · z) и x · (y + z) = (x · y) + (x · z).
(при попытке наивно «раскрыть скобки» в левой части получается бесконечная сумма,
но при каждом xk в качестве коэффициента в итоге получается конечная сумма ck ).
Определение 2.2.6. Кольцо называется коммутативным, если операция умножения ком‐
мутативна.
Все примеры выше являются коммутативными, но в дальней шем мы увидим важные при‐
меры некоммутативных колец.
Обозначение 2.2.7. Элемент, обратный к a ∈ R относительно +, будем обозначать −a, а
обратный относительно ∗, если он существует, a−1 .
Обозначение 2.2.8. Множество обратимых элементов кольца R будем обозначать R∗ .
22
Замечание 2.2.9. Если a, b ∈ R∗ , то ab ∈ R∗ и (ab)−1 = b−1 a−1 .
Доказательство. Прямая проверка:
(ab)(b−1 a−1 ) = a(bb−1 ) a−1 = (a · 1)a−1 = aa−1 = 1 и b−1 a−1 ab = b−1 b = 1.
23
.
Предложение 2.3.6. Пусть R — область целостности, a, b, c ∈ R и c 6= 0. Тогда ac .. bc равно‐
..
сильно a . b.
. . .
Доказательство. Если a .. b, то, поскольку c .. c, получаем, что ac .. bc. Обратно, пусть ac = (bc)r,
.
тогда (a − br)c = 0, откуда по условию теоремы a − br = 0, то есть a = br и a .. b.
.
Отношение .. является рефлексивным и транзитивным, но, вообще говоря, не антисиммет‐
рично. Установим, насколько оно далеко от антисимметричного.
. .
Определение 2.3.7. Пусть R — область целостности, a, b, ∈ R. Если a .. b и b .. a, то будем
говорить, что a и b ассоциированы.
Замечание 2.3.8. Элементы a, b ∈ R ассоциированы тогда и только тогда, когда существует
такой ε ∈ R∗ , что a = εb.
a = bq + r, 0 6 r < |b|.
24
применить индукционное предположение: существуют такие q ′ , r′ , что a′ = bq ′ + r′ и 0 6
r′ < b. Но тогда a = a′ + b = b(q ′ + 1) + r — искомое представление.
Пусть теперь a < 0, b > 0. Тогда −a > 0 и в силу уже доказанного существуют такие q ′ , r′ ,
что −a = bq ′ + r′ и 0 6 r′ < b. Тогда a = −bq ′ − r′ . Если r′ = 0, то q = −q ′ , r = 0. Если же r′ 6= 0,
то a = b(−q ′ ) − b + b − r′ = b(−q ′ − 1) + (b − r′ ). Положим q = q ′ − 1, r = b − r′ — тогда 1 6 r < b
и a = bq + r.
Остается случай b < 0. Тогда −b > 0 и существуют такие q ′ , r′ , что a = (−b)q ′ + r′ и 0 6 r′ <
−b. Отсюда a = b(−q ′ ) + r′ , причем 0 6 r′ < |b|.
Докажем теперь единственность q и r. Пусть a = bq + r = bq ′ + r′ , где 0 6 r, r′ < |b|. Тогда
b(q − q ′ ) = (r − r′ ). Если q 6= q ′ , то левая часть по модулю > |b|, в то время как правая < |b|.
Значит, q = q ′ , откуда также r = r′ .
Вопрос существования неполного частного и остатка можно решить прямым обращением к полной упорядочен‐
ности N. А именно, рассмотрим множество {a − bq | q ∈ Z} ∩ Z>0 — оно непусто и потому содержит наименьший
элемент r. Если r > |b|, то r − |b| снова является элементом того же множества, но меньше r, противоречие.
Замечание 2.4.2. Для целых чисел наибольший общий делитель определен с точностью до
знака. Поэтому можно выбрать из двух вариантов один и в дальней шем всегда считать, что
наибольший общий делитель двух целых чисел a и b неотрицательный — мы будем обозна‐
чать его gcd(a, b).
Теорема 2.4.3. Для любых ненулевых a, b ∈ Z их наибольший общий делитель существует
и является наименьшим элементом множества Xa,b = {ax + by | x, y ∈ Z} ∩ N всех положи‐
тельных целочисленных линей ных комбинаций a, b.
Доказательство. Множество Xa,b непусто, так как по край ней мере содержит |a|. Обозначим
наименьший элемент множества Xa,b через d. Тогда для каких‐то целых x0 , y0 имеем d =
ax0 + by0 . Поделим a на d с остатком: a = dq + r, где 0 6 r < d, откуда a = (ax0 + by0 )q + r,
то есть r = a(1 − x0 1) + b(−y0 q). Если r 6= 0, то r ∈ Xa,b является элементом, меньшим
. .
наименьшего, что невозможно. Значит, r = 0 и a = dq, так что a .. d. Аналогично, b .. d.
′
Пусть теперь d — какой ‐то общий делитель a и b. Тогда он является делителем любого
элемента множества X, в частности, d, так что d дей ствительно является наибольшим общим
делителем a и b.
Замечание 2.4.4. gcd(a, 0) = gcd(0, a) = a.
Следствие 2.4.5. Для любых a, b ∈ Z существуют такие x0 , y0 ∈ Z, что ax0 + by0 = gcd(a, b).
Такое выражение называется линейным представлением НОД.
Лемма 2.4.6. Пусть a, b, k ∈ R. Тогда gcd(a, b) = gcd(a, b + ak). В частности, при замене b на
остаток от деления b на a НОД не меняется.
Доказательство. Докажем, что Xa,b = Xa,b+ak . Дей ствительно,
25
1. Полагаем r0 = a, r1 = b;
2. Делим с остатком: r0 = r1 q1 + r2 , где 0 6 r2 < |r1 |;
3. Повторяем: ri−1 = ri qi + ri+1 ;
4. Если rk+1 = 0, то rk = gcd(a, b).
Этот процесс вычисляет gcd(a, b), но не дает его линей ного продставления. Конечно, мож‐
но подняться по цепочке делений с остатком и выразить каждый ri+1 в виде линей ной ком‐
бинации ri и ri−1 , в итоге получив выражение в виде линей ной комбинации a и b, но это
требует хранить в памяти все остатки и все неполные частные. Оказывается, есть модифика‐
ция алгоритма Эвклида, которая позволяет с минимальными дополнительными усилиями
получить одновременно НОД и его линей ное представление.
Алгоритм 2.4.8 (Расширенный алгоритм Эвклида).
1. Положим r0 = a, r1 = b, s0 = 1, s1 = 0, t0 = 0, t1 = 1;
2. Вычисляем
ri+1 = ri−1 − ri qi
= (asi−1 + bti−1 ) − (asi + bti )qi
= (asi−1 − asi qi ) + (bti−1 − bti qi )
= asi+1 + bti+1 .
26
2. gcd(gcd(a, b), c) = gcd(a, gcd(b, c)) = gcd(a, b, c).
3. gcd(ab, ac) = a · gcd(b, c).
. .
Доказательство. 1. Если gcd(a, b) = |a|, то b .. a. Обратно, если b .. a, то a должен делить
..
d = gcd(a, b). При этом a . d, так что a и d ассоциированы, так что d = |a|.
2. Пусть d1 = gcd(gcd(a, b), c) и d2 = gcd(a, gcd(b, c)). Тогда
. . . .
gcd(a, b) .. d1 , c .. d1 , a .. d2 , gcd(b, c) .. d2 ,
. . .
откуда a, b, c .. d1 , d2 , так что gcd(a, b) .. d2 и gcd(b, c) .. d1 . Но по определению НОД для лю‐
. .
бого такого d′ , что gcd(a, b), c .. d′ , выполнено d1 .. d′ , в частности, это верно для d′ = d2 .
. .
Аналогично, для любого такого d′′ , что a gcd(b, c) .. d′′ выполнено d2 .. d′′ , в частности,
. .
для d′′ = d1 . Итого получаем, что d1 .. d2 и d2 .. d1 , а так как они одного знака, то совпа‐
дают.
3. Если a = 0, то в обеих частях равенства стоит 0. Пусть a 6= 0. Обозначим d = gcd(b, c).
. . . .
Тогда b, c .. d, откуда ab, ac .. ad, то есть gcd(ab, ac) .. ad. С другой стороны, ab, ac .. a, так что
.. ..
gcd(ab, ac) . a, то есть gcd(ab, ac) = ak для некоторого k, и ab, ac . ak. Поскольку a 6= 0,
. . . .
получаем, что b, c .. k, откуда gcd(b, c) .. k и a · gcd(b, c) .. ak. Итого a · gcd(b, c) .. gcd(ab, ac)
..
и gcd(ab, ac) . a · gcd(b, c), так что они равны.
Предложение выше позволяет вычислить НОД любого конечного набора чисел:
gcd(a1 , a2 , . . . , an ) = gcd(gcd(a1 , a2 ), a3 , . . . , an ),
но эта процедура может оказаться неэффективной (она может сработать очень быстро, ес‐
ли, скажем, gcd(a1 , a2 ) = 1 или gcd(a1 , a2 ) = gcd(a1 , . . . , an ), но не в общем случае). Имеется
модификация алгоритма Эвклида, в которой вместо шага (a, b) (b, r) производятся следу‐
ющие дей ствия:
Алгоритм 2.4.12 (Алгоритм Эвклида для n чисел).
1. Рассмотрим кортеж (a1 , . . . , an ) и най дем его наименьший (по модулю) ненулевой эле‐
мент ak .
2. Поделим все остальные элементы на ak с остатком: ai = ak qi + ri , 0 6 ri < |ak |.
3. Заменим (a1 , . . . , an ) на (r1 , . . . , rk−1 , ak , rk+1 , . . . , rn ).
4. Будем повторять, пока в кортеже сохраняется хотя бы один ненулевой элемент. По‐
следнее ненулевое значение и будет равно gcd(a1 , . . . , an ).
При этом наименьший элемент набора на следующем шаге можно находить уже в процессе
вычисления остатков.
27
1. a ⊥ b тогда и только тогда, когда существуют такие x, y ∈ Z, что ax + bt = 1.
2. Если a ⊥ b и a ⊥ c, то a ⊥ bc.
. .
3. Если ab .. c и a ⊥ c, то b .. c.
. . .
4. Если a .. b, a .. c и b ⊥ c, то a .. bc.
Доказательство. 1. В силу Теоремы 2.4.3.
2. По предыдущему пункту ax + by = 1 и az + cw = 1 для некоторых x, y, z, w ∈ Z. Тогда
перемножая эти два равенства, получаем a · (axz + cxw + byz) + bc · yw = 1.
3. Существуют такие x, y ∈ Z, что ax + cy = 1. Домножим на b, получим abx + bcy = b.
. . .
Поскольку ab .. c и bc .. c, то же верно и для суммы, то есть b .. c.
.
4. a = bk для некоторого k ∈ Z. При этом bk = a .. c, но b ⊥ c, так что по предыдущему
..
пункту k . c, то есть k = cm для какого‐то m ∈ Z. Тогда a = bk = b(cm) = (bc)m.
Следствие 2.5.4. Если a1 , . . . , am , b1 , . . . , bn ∈ Z таковы, что ai ⊥ bj для любых i = 1, . . . , m и
j = 1, . . . , n, то a1 · . . . · am ⊥ b1 · . . . · bn . В частности, если a ⊥ b, то am ⊥ bn .
Доказательство. По предыдущей теореме ai ⊥ b1 · . . . · bn , а тогда a1 · . . . · am ⊥ b1 · . . . · bn .
Следствие 2.5.5. Если a ∈ N неявляется n‐й степенью натурального числа, то a не является
n‐й степенью рационального числа. Иными словами, нецелые корни из натуральных чисел
являются иррациональными.
Доказательство. Пусть x/y ∈ Q. Можно считать, что x ⊥ y и что y > 1. Тогда (x/y)n = xn/y n
28
Замечание 2.6.2. Если b = 0, то уравнение ax+by = c разрешимо тогда и только тогда, когда
.
c .. a. Решениями в таком случае являются x = c/a вместе с произвольным y.
Предложение 2.6.3. Линей ное диофантово уравнение a1 x1 + . . . + an xn = b от n целочис‐
.
ленных переменных x1 , . . . , xn разрешимо тогда и только тогда, когда b .. gcd(a1 , . . . , an ).
Доказательство. Если решение существует, то левая часть делится на d = gcd(a1 , . . . , an ), а
. .
тогда и b .. d. Докажем обратное. Пусть b .. d. Доказывать будем индукцией по n.
База n = 2 выполнена по предыдущему утверждению.
Пусть n > 3. Рассмотрим уравнение gcd(a1 , a2 )y1 +a3 y3 +. . .+an yn = b от n−1 переменной
y1 , y3 , . . . , yn . По индукционному предположению оно разрешимо тогда и только тогда, когда
.
b делится на gcd(gcd(a1 , a2 ), a3 , . . . , an ) = gcd(a1 , . . . , an ) = d. По условию b .. d, так что реше‐
ние (y1 , y3 , . . . , yn ) существует. Рассмотрим еще одно уравнение a1 x1 + a2 x2 = gcd(a1 , a2 )y1
.
относительно переменных x1 , x2 . Так как gcd(a1 , a2 )y1 .. gcd(a1 , a2 ), оно разрешимо, так что
a1 x1 + a2 x2 + a3 y3 + . . . + an xn = gcd(a1 , a2 )y1 + a3 y3 + . . . + an yn = b.
29
5. Достаточно доказать для натуральных n. Проведем полную индукцию по n. Если n про‐
.
стое, то n .. n и все доказано. Иначе у n имеется натуральный делитель m, меньший n.
По предположению индукции у m имеется простой делитель, который тогда является
и делителем n.
6. Если простых лишь конечное число, то можно составить список их всех: P = {p1 , . . . , pk }.
Рассмотрим число n = p1 ·. . .·pk +1. По предыдущему пункту у n есть простой делитель
— он обязан быть элементом P, скажем, pi . Но тогда 1 = n − p1 · . . . · pk тоже делится на
pi , противоречие. Значит, список всех простых не полон.
Теорема 2.7.3 (Основная теорема арифметики). Каждое натуральное число n может быть
представлено в виде произведения простых чисел, причем такое представление единствен‐
но с точностью до порядка сомножителей .
Следствие 2.7.4. Если a = pd11 ·. . .·pdkk и b = pe11 ·. . .·pekk — разложения на простые, di , ei ∈ Z>0
.
и pi 6= pj при i 6= j, то a .. b тогда и только тогда, когда di > ei для всех i.
. .
Доказательство. Если a .. b, то a .. pei i для каждого i. Но так как pj ⊥ pi для j 6= i, то pj j ⊥ pei i
d
.
и, как следствие, pdi i .. pei i , что возможно только при di > ei .
Обратно, если di > ei для всех i, то a = b · pd11 −e1 · . . . · pkdk −ek — здесь второй множитель
является целым числом.
30
Вообще говоря, каноническое разложение можно распространить и на (ненулевые) рациональные числа. Для
начала определим каноническое разложение целого числа m как произведение знака m на каноническое разложе‐
ние |m|. Затем, представляя рациональное число x в виде несократимой дроби x = m/n, где m, n ∈ Z, n > 0 и
m ⊥ n, мы видим, что каждое простое может входить в каноническое разложение лишь одного из чисел m, n (или
не входит ни в одно), так что если m = ±pd11 · . . . · pkk , а n = q1e1 · . . . · qses , то m/n = ±pd11 · . . . · pkk · q1−e1 · . . . · qs−es .
d d
Следствие 2.7.5. Если a = pd11 · . . . · pdkk и все pi различны, то количество натуральных дели‐
телей a равно (d1 + 1) · . . . · (dk + 1).
Доказательство. Выбрать делитель a это то же самое, что выбрать степени ei , с которыми pi
входит в каноническое разложение этого делителя. При этом 0 6 ei 6 d, то есть для каждого
простого pi имеется di +1 различных вариантов, а так как выборы производятся независимо,
всего способов выбрать все ei имеется (d1 + 1) · . . . · (dk + 1).
Следствие 2.7.6. Если a = pd11 · . . . · pdkk и b = pe11 · . . . · pekk , di , ei ∈ Z>0 и pi 6= pj при i 6= j, то
min(d ,e ) min(d ,e )
gcd(a, b) = p1 1 1 · . . . · pk k k
Доказательство. Указанная величина является общим делителем a и b, так как min(di , ei ) 6
di , ei . У любого другого общего делителя показатели степеней будут не больше этого, так что
это и в самом деле НОД.
31
Определение 2.8.3. Фактор‐множество Z/≡m с операциями, индуцированными на нем сло‐
жением и умножением целых чисел, называется кольцом классов вычетом по модулю m и
обозначается Z/mZ.
Элементами Z/mZ являются классы вычетов по модулю m, то есть множества вида [a] =
{b ∈ Z | b ≡ a (mod m)} (классы эквивалентности относительно ≡m ). Эти классы можно
описать и иначе: [a] = a + mZ = {a + km | k ∈ Z}. Любой элемент b ∈ [a] называется
представителем класса [a] (и тогда [b] = [a]).
Напомним, операции на классах устроены следующим образом:
Операции определены корректно (то есть зависят от классов [a] и [b], а не от конкретного
выбора представителей a и b), так как ≡m является отношением конгруэнтности.
В дей ствительности можно выписать полный список классов, образующих кольцо Z/mZ,
а именно,
Z/mZ = {[a] | a = 0, . . . , m − 1}.
Другой способ смотреть на кольцо классов вычетов — для a = 0, . . . , m − 1 определить
объекты a и задать на множестве {0, 1, . . . , m − 1} бинарные операции следующим образом:
2. {1, 2, . . . , m};
3. Если m = 2k + 1, то {−k, −k + 1, . . . , −1, 0, 1, . . . , k − 1, k} — полная система вычетов,
4. Если m = 2k, то {−k, . . . , k − 1}.
32
Следствие 2.8.7. Сравнение ax ≡ 1 (mod m) разрешимо тогда и только тогда, когда a ⊥ m.
Определение 2.8.8. Решение сравнения ax ≡ 1 (mod m) будем называть модулярным об‐
ратным для a. Модулярный обратный всегда можно выбрать в промежутке от 0 до m − 1.
Следствие 2.8.9. (Z/mZ)∗ = {[a] | a ⊥ m}.
Доказательство. Элемент [a] ∈ Z/mZ обратим, если существует такой [b] ∈ Z/mZ, что [a] ·
[b] = [1], то есть ab ≡ 1 (mod m), что выполнимо только при a ⊥ m.
33
2. Положим k = (rr′ − 1)/m (делится нацело), так что 1 + km = rr′ .
3. Переводим числа a и b в форму Монтгомери: e a = (ar mod m), eb = (br mod m). Будем
искать c ≡m ab в форме Монтгомери: e
c = (cr mod m) = (abr mod m).
34
Доказательство. Пусть x1 , . . . , xk — полный список всех обратимых элементов Z/mZ. То‐
гда, поскольку [a] также обратим, все произведения [a]x1 , . . . , [a]xk обратимы. При этом все
они различны, так как отображение x 7→ [a]x обратимо (обратное отображение реализуется
как домножение на элемент, обратный к [a]). Значит, [a]x1 , . . . , [a]xk — снова полный список
обратимых элементов, возможно, в другом порядке. Рассмотрим произведение всех обрати‐
мых элементов:
x1 · . . . · xk = [a]x1 · . . . · [a]xk = [a]k · x1 · . . . · xn .
Поскольку x1 · . . . · xk снова обратимо, можно домножить на обратный и получить [a]k = 1,
что и требовалось.
Значение функции Эй лера φ(m) не всегда является наименьшим натуральным числом k, при котором ak ≡m 1
для всех a ⊥ m. Наименьшим таким k является значение функции Кармай кла, вычисляемое следующим образом:
(
φ pd , если p > 3 или d 6 2,
λ pd = 1 λ pd11 · . . . · pds s = lcm λ pd11 , . . . , λ pds s .
2
φ pd если p = 2 и d > 3,
Существуют такие непростые числа n, что an−1 ≡ 1 (mod n) для всех a ⊥ n. Такие числа называются числами
Кармай кла, их бесконечно много, каждое имеет по край ней мере 3 простых делителя. Натуральное число n явля‐
ется числом Кармай кла тогда и только тогда, когда оно свободно от квадратов и для каждого простого делителя p
.
выполнено n − 1 .. p − 1. Наименьшим числом Кармай кла является 561 = 3 · 11 · 17.
35
Доказательство. Рассмотрим следующий частный случай : r2 = . . . = rn = 0, а r1 произволь‐
ный . Тогда решение x системы сравнений должно делиться нацело на m2 , . . . , mn и, посколь‐
ку модули попарно взаимно просты, на их произведение. С другой стороны, m2 ·. . .·mn ⊥ m1 ,
так что сравнение m2 · . . . · mn · y ≡ r1 (mod m1 ) разрешимо — пусть y1 это его решение. По‐
ложим x1 = y1 · m2 · . . . · mn , тогда x1 ≡ r1 (mod m1 ) и x1 ≡ 0 (mod mi ) при i 6= 1. Аналогично
можно най ти решения xi для систем сравнений с rj = 0 при j 6= i.
Положим x = x1 + . . . + xn , тогда x ≡ xi ≡ ri (mod mi ). Это доказывает существование
решения.
.
Пусть теперь x, y — два возможных решения. Тогда x − y .. mi , и в силу взаимной простоты
..
модулей x − y . m1 · . . . · mn , что и доказывает единственность.
Пусть m1 , . . . , mn ∈ N. Рассмотрим следующее коммутативное кольцо:
Z/m1 Z × . . . × Z/mn Z,
В дей ствительности китай скую теорему об остатках можно доказать даже более коротким образом. А именно,
аргумент о единственности решения системы сравнений показывает, что отображение θ инъективно. Но размеры
области определения и области прибытия совпадают, так что по принципу Дирихле θ биективна.
Китай ская теорема об остатках позволяет, кроме прочего, вычислять значение функции
Эй лера на произвольных натуральных числах.
36
Доказательство.
37
b) Вычисляются n = pq и φ(n) = (p − 1)(q − 1).
c) Выбирается целое число e = 2, . . . , φ(n), взаимно простое с φ(n) — оно называется
открытой экспонентой.
d) Вычисляется d — обратный к e по модулю φ(n), так что ed ≡ 1 (mod φ(n)). Это
число называется секретной экспонентой.
e) Пара (e, n) отправляется (Б) и служит открытым ключом, а пара (d, n) — закры‐
тым ключом.
2. (Б) рассматривает исходной сообщение как число m = 0, . . . , n − 1 и шифрует его, ис‐
пользуя полученный от (А) открытый ключ: c = (me mod n). Полученное зашифрован‐
ное сообщение c отправляется (А).
3. (А) использует свой закрытый ключ для дешифровки: (cd mod n) = (med mod n) = m.
Замечание 2.12.4. Дешифрование происходит корректно, то есть для любого m = 0, . . . , n−
1 выполнено med ≡ m (mod n).
Доказательство. Предположим сначала, что m ⊥ p. Так как ed ≡ 1 (mod φ(n)), то ed = 1 +
k(p − 1)(q − 1) для некоторого целого k, а тогда (по малой теореме Ферма)
k(q−1)
med = m1+k(p−1)(q−1) = m · mp−1 ≡p m · 1k(q−1) = m.
.
Если m .. p, то med ≡p 0 ≡p 0. Итого med ≡ m (mod p), и аналогично med ≡ m (mod q). Тогда
по китай ской теореме об остатках med ≡ m (mod n).
38
3 Поля и многочлены
3.1 Поля
Определение 3.1.1. Коммутативное кольцо с единицей F называется полем, если в нем лю‐
бой ненулевой элемент обратим, т.е. F ∗ = F \ {0}, и 1 6= 0.
1. Рациональные числа Q.
2. Вещественные числа R.
3. Кольцо классов вычетов Z/pZ по простому модулю p.
√ √
4. Пусть k ∈ N не является квадратом. Тогда Q[ k] = {a + b k | a, b ∈ Q} — поле. В самом
деле, это кольцо, поскольку
√ √ √
(a + b k) + (c + d k) = (a + c) + (b + d) k,
√ √ √
(a + b k) · (c + d k) = (ac + kbd) + (ad + bc k),
√ √ √ √
0 = 0 + 0 k ∈ Q[ k], 1 = 1 + 0 k ∈ Q[ k].
√ √
Чтобы показать, что Q[ k] является полем, най дем обратный к a + b k:
√ √
1 a−b k a−b k
√ = √ √ = 2
a+b k (a + b k)(a − b k) a − kb2
√
Если знаменатель a2 − kb2 ненулевой , то получается элемент Q[ k]. Предположим, что
a2 − kb2 = 0. Ясно, что либо a = b = 0, либо оба числа a, b ненулевые. Во втором случае
k = a2 /b2 , что противоречит предположению о числе k, см. Следствие 2.5.5.
5. В этом разделе мы формально и строго построим еще два важных примера: комплекс‐
ные числа C и рациональные функции F (x).
Замечание 3.1.3. Поле является областью целостности.
Доказательство. По Замечанию 2.3.5 делители нуля не могут быть обратимы, но в поле нет
отличных от 0 необратимых элементов.
Замечание 3.1.4. Кольцо вычетов Z/mZ для составного модуля m не является полем.
39
Определение 3.2.1. Бесконечная последовательность (a0 , a1 , a2 , . . . , an , . . .) элементов коль‐
ца R называется финитарной, если начиная с некоторого места все ее элементы равны 0, то
есть существует такое N , что для любого k > N выполнено ak = 0. Иными словами, в этой
последовательности лишь конечное число ненулевых значений . Если рассматривать после‐
довательность ai как функцию
a : Z>0 → R (принимающую значения a(i) = ai ), то это можно
кратко записать в виде a−1 (R \ {0}) < ∞.
Обратите внимание, что требуется именно конечность числа позиций (индексов), в которых принимается
нену‐
левое значение, а не сами ненулевые значения. Такое требование выглядело бы как a(Z>0 ) \ {0} < ∞ (что, разу‐
меется, эквивалентно конечности образа a(Z>0 )).
Определение 3.2.2. Кольцом многочленов R[x] одной переменной x над кольцом R называ‐
ется множество всех финитарных последовательностей со значениями в R с покомпонент‐
ным сложением, то есть
(a0 , a1 , a2 , . . .) + (b0 , b1 , b2 , . . .) = (a0 + b0 , a1 + b1 , a2 + b2 , . . .),
и умножением, задаваемым сверткой, то есть
(a0 , a1 , a2 , . . .) · (b0 , b1 , b2 , . . .) = (a0 b0 , a0 b1 + a1 b0 , a0 b2 + a1 b1 + a2 b0 , . . .)
— в общем случае на k‐й позиции произведения стоит
X
(a · b)k = a0 bk + a1 bk−1 + a2 bk−2 + . . . + ak b0 = i,j>0 ai bj .
i+j=k
Ясно, что несмотря на различные обозначения индексов, выражения в правых частях равны.
Коммутативность умножения тоже проста:
X X
(ab)k = ai bj = bj ai = (ba)k .
i+j=k j+i=k
40
В качестве единицы выступает 1 = (1, 0, 0, . . .). Дей ствительно, в выражении для (a · 1)k
имеется только одно ненулевое слагаемое ak · 10 = ak .
Обозначение 3.2.4. Мы будем отождествлять элемент r базового кольца R и соответству‐
ющий многочлен r = (r, 0, 0, . . .).
Обозначение 3.2.5. Обозначим x = (0, 1, 0, 0, . . .) ∈ R[x]. Тогда xn = (0, . . . , 0, 1, 0, . . .). Заме‐
| {z }
n
тим, что rxn = (0, . . . , 0, r, 0, . . .), и тогда
Доказательство. Пусть f · g = 1. Так как f, g 6= 0, имеем deg(f ), deg(g) > 0. Тогда, так как
0 = deg(f g) = deg(f )+deg(g), обе степени deg(f ) и deg(g) равны 0. Отсюда f, g ∈ R, так что ни
один многочлен f положительной степени не является обратимым и никакая необратимая
константа из R не получает в R[x] обратного элемента.
Замечание 3.2.10. Если R = Z/4Z, то 1 + 2x ∈ R[x]∗ . Дей ствительно, (1 + 2x)(1 + 2x) =
1 + (2 + 2)x + (2 · 2)x2 = 1.
41
3.3 Деление и вычисление значений многочленов
Теорема 3.3.1. (о делении многочленов с остатком) Пусть R — область целостности, а мно‐
гочлены f, g ∈ R[x] таковы, что g 6= 0 и его старший коэффициент обратим. Тогда существу‐
ют единственные многочлены q, r ∈ R[x], для которых f = qg + r и deg(r) < deg(g).
Доказательство. Докажем существование такие q, r индукцией по deg(f ). Если deg(f ) <
deg(g), то можно положить q = 0 и r = f .
Пусть deg(f ) > deg(g). Запишем f и g в их канонической форме:
f = a0 + . . . + am xm , g = b0 + . . . + bn x n , где am , bn 6= 0.
deg(g · am b−1
n x
m−n
) = deg(g) + (m − n) = m = deg(f )
и старшие коэффициенты (оба равны am ), то есть deg(f ′ ) < deg(f ). По индукционному пред‐
положению най дутся такие q ′ , r′ , что f ′ = q ′ g + r и deg(r′ ) < deg(g). Тогда
f = f ′ + g · am b−1 n x
m−n
= q ′ + am b−1
n x
m−n
· g + r′
— искомое представление.
Чтобы доказать единственность, предположим, что f = q1 g + r1 = q2 g + rs — два таких
представления. Тогда r1 − r2 = (q2 − q1 )g. Степень многочлена в левой части меньше deg(g),
а если q2 6= q1 , то степень многочлена в правой части > deg(g). Отсюда q2 = q1 и r1 = r2 .
Замечание 3.3.2. Если R — поле, то старший коэффициент всегда обратим, так что в таком
случае делить с остатком можно на любой ненулевой многочлен.
Кольцо многочленов обладает дополнительной структурой — возможностью вычислять
значение многочленов.
Определение 3.3.3. Пусть f = a0 + a1 x + . . . + an xn ∈ R[x] и c ∈ R. Тогда элемент a0 + a1 c +
. . . + an cn ∈ R называется значением многочлена f в точке c и обозначается f (c).
42
Pn Pn Pn Pn
1. (f + g)(c) = i=0 (ai + bi )ci =ai ci + bi ci = i=0 ai ci + i=0 bi ci = f (c) + g(c).
i=0
P2n P
2. deg(f g) 6 deg(f ) + deg(g) 6 2n, так что f g = k=0 i+j=k ai bj xk и
X
n X
n X
n X
2n X
f (c) · g(c) = ai c ·
j j
bj c = ai bj ci+j = ai bj ck = (f g)(c).
i=0 j=0 i,j=0 k=0 i,j>0
i+j=k
3. Если f = r + 0 · x + . . ., то f (c) = r + 0 · c + . . . = r.
Определение 3.3.5. Если f (c) = 0, то говорят, что c является корнем многочлена f .
Предложение 3.3.6 (Малая теорема Безу). Остаток при делении многочлена f на x−c равен
.
f (c). В частности, c ∈ R является корнем многочлена тогда и только тогда, когда f .. (x − c).
Доказательство. Поделим f на x − c с остатком (что возможно, поскольку старший коэф‐
фициент x − c обратим): f = q · (x − c) + r, причем deg(r) < deg(x − c) = 1, так что r ∈ R.
Вычислим значение в точке c для многочленов в левой и правой частях:
f = (x − c1 ) · . . . · (x − ck ) · g,
43
Определение 3.3.11. Многочлены f, g ∈ R[x] называются функционально равными, если
равны соответствующие полиномиальные функции fe и ge. Иными словами, если для любого
c ∈ R выполнено f (c) = g(c). Обычное равенство многочленов (как последовательностей
коэффициентов) иногда, чтобы подчеркнуть разницу с функциональным равенство, назы‐
вают формальным равенством.
Замечание 3.3.12. Выше мы уже приводили пример двух формально различных, но функ‐
ционально равных многочленов: f = xp − x и g = 0 над полем Z/pZ, для которых fe = ge = 0.
Ясно, что из формального равенства многочленов следует функциональное. Выясним, ко‐
гда имеет место обратная импликация.
Предложение 3.3.13. Пусть R — область целостности, f, g ∈ R[x]. Если количество элемен‐
тов R больше, чем deg(f ) и deg(g), то функциональное равенство fe = ge влечет формальное
равенство f = g. В частности, для бесконечного поля функциональное равенство влечет
формальное для любых многочленов.
Доказательство. Рассмотрим многочлен h = f − g. Для любого c ∈ R выполнено h(c) =
f (c) − g(c) = 0. Если h 6= 0, то число его корней не превосходит его степени, но deg(h) 6
max(deg(f ), deg(g)) < |R|, противоречие. Значит, h = 0 и f = g.
(x − c) · (q0 + q1 x + . . . + qn−1 xn−1 ) + r = qn−1 xn + (qn−2 − cqn−1 )xn−1 + . . . + (q0 − cq1 )x − cq0 + r.
qn−1 = an ,
qn−2 = an−1 + cqn−1 ,
..
.
qn−i−1 = an−i + cqn−i ,
..
.
q0 = a1 + cq1 ,
r = a0 + cq0 .
Видно, что для вычисления qk достаточно знать qk+1 и ak+1 (а для r требуются q0 и a0 ), так
что коэффициенты неполного частного qn−1 , . . . , q1 , q0 и остаток r вычисляются последова‐
тельно.
44
Замечание 3.4.2. Это вычисление остатка r = f (c) можно трактовать как нахождение зна‐
чения с помощью представления многочлена f в виде
f = a0 + x · a1 + x · a2 + x · . . . + x · (an−1 + xan ) . . .
f an an−1 ... a1 a0
c an
где rn−k при n − k > m полагается равным 0. Отсюда видно, что при k 6 n − m
X
qn−m−k · bm = an−k − bm−i qn−m−j ,
i+j=k
j<k
то есть коэффициенты qn−m−k можно вычислить, если известны коэффициенты q при сте‐
пенях выше n − m − k.
Затем, когда все коэффициенты неполного частного q най дены, легко вычислить коэффи‐
циенты остатка r.
Вычисление коэффициентов qn−m , . . . , q0 , rm−1 , . . . , r0 производится единообразно, как и
в схеме Горнера. В целом всю процедуру можно реализовать следующим образом:
1. Инициализируем переменные tn = an , . . . , t0 = a0 .
2. Для каждого индекса k = n − m, . . . , 0 проделаем следующее:
a) Нормируем tk , то есть записываем tk ← tk /bm .
b) Для каждого индекса i = 1, . . . , m добавляем к tk−i величину −tk · bm−i .
3. Возвращаем неполное частное qj = tj+m и остаток rj = tj (первые n−m+1 и последние
m элементов последовательности tn , . . . , t0 соответственно).
45
Для вычислений от руки синтетическое деление также можно реализовать в виде запол‐
нения таблицы. Для простоты будем предполагать, что старший коэффициент bm = 1.
46
Представитель (a + c) + (b + d)x уже степени 6 1. Обратимся теперь к умножению:
Тем самым, сложение и умножение элементов R[x]/≡h можно определить напрямую в тер‐
мимах коэффициентов представителей . А именно, зафиксируем следующие обозначения.
C = {a + bi | a, b ∈ R}
вместе с операциями
Можно быть бы сразу определить C как множество упорядоченных пар вещественных чисел
с так введенными операциями, но тогда пришлось бы отдельно проверять свой ства, опреде‐
ляющие кольцо, которые в нашем определении унаследованы от кольца многочленов.
Определение 3.5.7. Для комплексного числа z = a + bi вещественные числа a и b называют‐
ся соответственно вещественной и мнимой частями и обозначаются Re(z) = a и Im(z) = b.
2. z · w = z · w;
3. z = z;
4. z = z тогда и только тогда, когда z ∈ R.
47
Доказательство. Первое равенство тривиально, для доказательства второго положим z =
a + bi и w = c + di, тогда
(a + bi)(c + di) = (ac − bd) + (ad + bc)i = (ac − bd) − (ad + bc)i,
a + bi · c + di = (a − bi) · (c − di) = (ac − bd) − (ad + bc)i.
Im
z = a + bi
b
0 a Re
48
каждым комплексным числом z связывается радиус‐вектор, соединяющий начало коорди‐
нат 0 с z. Тогда сумма комплексных чисел может быть реализована как сложение соответ‐
ствующих векторов:
z
z+w
z = a + bi
|z |
z
w−z
49
Кроме декартовых координат на плоскости можно также ввести так называемые поляр‐
ные. Для этого фиксируется один луч R0 с началом в точке P0 — тогда каждая точка плоско‐
сти P лежит на каком‐то луче R с началом в P0 , причем для P 6= P0 этот луч определен од‐
нозначно. Точку P можно задать двумя параметрами: расстоянием от P0 до P и углом между
лучами R0 и R.
На комплексной плоскости есть один естественный способ выбрать такой луч, а именно
множество неотрицательных чисел R>0 с началом в точке 0. Тогда каждая точка z комплекс‐
ной плоскости кодируется расстоянием до 0 (то есть |z|) и углом между радиус‐вектором
точки z и лучом R>0 . Этот угол называется аргументом комплексного числа z и обозначает‐
ся arg(z).
Поскольку модуль комплексного числа мультипликативен, то для любого z ∈ C существу‐
ет такое z ′ ∈ C, что z = |z| · z ′ и |z ′ | = 1, а именно, z ′ = z/|z| (или z ′ = 0, если z = 0).
Комплексные числа модуля 1 лежат на окружности радиуса 1 с центром в точке 0.
|z| sin θ z
z′
sin θ
θ 1
cos θ |z| cos θ
На изображении выше аргумент числа z равен θ (и ему же равен arg(z ′ )). Вещественная и
мнимая части z ′ это в точности cos θ и sin θ.
Отсюда мы видим, что любое комплексное число представляется в виде
Изучим сперва случай , когда |z| = 1. В таком случае mz является движением, так как со‐
храняет расстояния между точками. Дей ствительно,
Кроме того, mz (0) = z · 0 = 0, так что это движение плоскости является либо поворотом
вокруг точки 0, либо отражением относительно некоторой прямой , проходящей через 0. Если
mz является отражением, то тогда m2z = idC . Но m2z = mz2 , так что это бывает только в случае
z = ±1 (в C у многочлена x2 − 1 только два корня), но в обоих случаях mz это вращение (на 0
в случае z = 1 и на π в случае z = −1). Значит, mz это поворот — остается только выяснить,
50
на какой угол. Но для этого достаточно най ти угол между радиус‐векторами одной точки и
ее образа, например, 1 и mz (1) = z. Этот угол по определению равен arg(z).
С другой стороны, если z ∈ R>0 , то mz это гомотетия с центром в 0 и коэффициентом
z. Используя тригонометрическую форму комплексного числа, видим, тем самым, что для
произвольного z ∈ C функция mz дей ствует посредством поворота на arg(z) и гомотетии с
коэффициентом |z|.
Мультипликативность, то есть свой ство mz ◦ mw = mzw , означает, что числа, записанные
в тригонометрической форме, легко умножать.
Предложение 3.6.2. Если z, w ∈ C, то arg(zw) = arg(z) + arg(w). Иными словами,
r · (cos φ + i sin φ) · s · (cos ψ + i sin ψ) = (rs) · (cos(φ + ψ) + i sin(φ + ψ)).
Доказательство. Дей ствительно, если z = r·(cos φ+i sin φ) и w = s·(cos ψ+i sin ψ), то |zw| =
|z||w| = rs. Умножение на z дей ствует как поворот на φ и растяжение в r раз, а умножение на
w как поворот на ψ и растяжение в s раз, тогда композиция mz ◦ mw дей ствует как поворот
на φ + ψ и растяжение в rs раз. Но так же дей ствует умножение на число с модулем rs и
аргументом φ + ψ.
Следствие 3.6.3. Для любых φ, ψ выполнено
cos(φ + ψ) = cos φ cos ψ − sin φ sin ψ, sin(φ + ψ) = cos φ sin ψ + sin φ cos ψ.
Доказательство. Вычислим двумя способами произведение двух комплексных чисел на еди‐
ничной окружности, имеющих аргументы φ и ψ, и сравним получающиеся вещественные и
мнимые части:
cos(φ + ψ) + i sin(φ + ψ) = (cos φ + i sin φ) · (cos ψ + i sin ψ)
= (cos φ cos ψ − sin φ sin ψ) + i(cos φ sin ψ + sin φ cos ψ).
Формула arg(zw) = arg(z) + arg(w) требует некоторых пояснений . Если мы полагаем, что
углы измеряются вещественными числами из полуинтервала [0, 2π), то надо как‐то учесть
случай , когда arg(z) + arg(w) > 2π. Один из способов — переопределить сложение углов,
например, следующим образом:
(
φ + ψ, если φ + ψ < 2π,
eψ=
φ+
φ + ψ − 2π, если φ + ψ > 2π.
Однако иногда бывает удобно считать величину некоторого углу отрицательной — но для
углов в полуинтервале (−π, π] подобная формула для сложения устроена еще сложнее, а ведь
можно выбрать и другой интервал, например, [−π, π). Поэтому продуктивнее другой подход
— переопределить, что такое мера угла. Будем отождествлять углы, отличающиеся на цело‐
численное кратное 2π. Для этого рассмотрим следующее бинарное отношение на R:
φ ≡2π ψ ⇐⇒ ∃k ∈ Z т. ч. φ − ψ = 2πk.
Отношение ≡2π является эквивалентностью и конгруэнтностью относительно сложения,
так что на фактор‐множестве T = R/≡2π определена бинарная операция, индуцированная
сложением вещественных чисел — это и есть сложение углов. Получившееся множество с
бинарной операцией является группой , называемой группой углов. Можно считать, что ар‐
гумент комплексного числа это элемент T, а формула arg(zw) = arg(z) + arg(w) понимается
как вычисление в T.
В дей ствительности группу T относительно сложения углов можно отождествить с груп‐
пой комплексных чисел модуля 1 относительно комплексного умножения.
n
Следствие 3.6.4 (Формула Муавра). r · (cos θ + i sin θ) = rn · (cos nθ + i sin nθ).
51
3.7 Дробно‐линейные преобразования
Рассмотрим следующее отображение:
az + b
f (z) = , где a, b, c, d ∈ C.
cz + d
Если c 6= 0, то такое отображение определено на C \ {−d/c}. Определим расширенную ком‐
плексную плоскость C = C∪{∞}, и доопределим функцию f следующим образом: f (−d/c) =
∞ и f (∞) = a/c. Если же c = 0, то доопределим f (∞) = ∞. Тогда f можно рассматривать как
отображение C → C — такое отображение называется дробно‐линейным преобразованием,
или преобразованием Мебиуса.
Частными случаями являются аффинные преобразования z 7→ az+b (в том числе вращения‐
растяжения ma и сдвиги z 7→ z + b) и обращение z 7→ 1/z.
d 1 bc − ad a
f1 (z) = z + , f2 (z) = , f3 (z) = z, f4 = z + ,
c z c2 c
то f = f4 ◦ f3 ◦ f2 ◦ f1 .
Доказательство. Случай c = 0 очевиден (тогда f аффинное — вида f (z) = az + b — и реа‐
лизуется как композиция ma и сдвига на b). Проверим теперь выражение для случая c 6= 0.
Дей ствительно, преобразуем выражение для f :
Полученное выражение это в точности формула для (f4 ◦ f3 ◦ f2 ◦ f1 )(z). Остается сверить
значения в доопределенных точках:
d f1 f2 f3 f4
− 7−−→ 0 7−−→ ∞ 7−−→ ∞ 7−−→ ∞,
c
f1 f2 f3 f4 a
∞ 7−−→ ∞ 7−−→ 0 7−−→ 0 7−−→ .
c
Предложение 3.7.3. Если ad − bc = 0, то соответствующее дробно‐линей ное преобразова‐
ние отображает все точки C в a/c, в противном случае оно обратимо.
52
Доказательство. В разложении выше при ad−bc = 0 функция f3 принимает только нулевые
значения на C, откуда следует, что f (z) = f4 (0) = a/c. Если же ad − bc 6= 0, то все функции
f1 , f2 , f3 , f4 обратимы; обратные задаются следующими формулами:
d 1 c2 z a
f1−1 (z) = z − , f2−1 (z) = , f3−1 (z) = , f4−1 (z) = z − .
c z bc − ad c
Функция, обратная к f , вычисляется как композиция обратных в обратном порядке, то есть
f −1 = f1−1 ◦ f2−1 ◦ f3−1 ◦ f4−1 , и дей ствует на комплексном числе z по правилу
f −1 a cz − a
z 7−−4−→ z − =
c c
f3−1 c2 cz − a c · (cz − a)
7−−−→ · =
bc − ad c bc − ad
f2−1 bc − ad
7−−−→
c · (cz − a)
f1−1 bc − ad d bc − ad − d · (cz − a) −dcz + bc −dz + b
7−−−→ − = = = .
c · (cz − a) c c · (cz − a) c · (cz + a) cz − a
r2 = |z − w|2 = (z − w) · (z − w) = zz − zw − zw + ww = r2 .
53
Доказательство. В силу Предложения 3.7.2 это утверждение достаточно доказать для функ‐
ций вида z 7→ z + a, z 7→ az и z 7→ 1/z. Для первых двух это очевидно следует из геометриче‐
ского истолкования суммы и произведения комплексных чисел, докажем для обращения.
Пусть Azz + Bz + Bz + C = 0, и положим w = 1/z. Тогда подставляя z = 1/w, получаем
1 1 1 1
A +B +B +C =0 ⇒ A + Bw + Bw + Cww = 0.
ww w w
Замечание 3.7.7. Под дей ствием обращения прямые, проходящие через 0 (случай A = C =
0), переходят в прямые, проходящие через 0. Окружности, не проходящие через 0 (случай
A, C 6= 0), переходятв такие же окружности. Прямые, не проходящие через 0 (случай A =
0, C 6= 0), и окружности, проходящие через 0 (случай A 6= 0, C = 0), переходят друг в друга.
Пример 3.7.8. Одним из важных примеров дробно‐линей ного преобразования является пре‐
образование Кэли, задаваемое формулой
z−i
f (z) = .
z+i
Это преобразование переводит верхнюю полуплоскость Im(z) > 0 в единичный круг |z| 6 1.
2πk 2πk
ξk = ξ1k = cos + i sin , k = 1, . . . , n.
n n
Все они различны, так как различаются их аргументы, и потому µn = {1, ξ, ξ 2 , . . . , ξ n−1 }.
Предложение 3.8.1. Корни из 1 степени n обладают следующими свой ствами:
1. Они располагаются в вершинах правильного n‐угольника, вписанного в единичную
окружность таким образом, что одна из вершин совпадает с точкой 1.
2. Если z ∈ µn , то z = z −1 ∈ µn .
3. µn — группа.
54
Ясно, что возможность извлекать квадратные корни из произвольных комплексных чисел
сразу дает возможность решать любые квадратичные уравнения по стандартной формуле.
В дей ствительности имеет место гораздо более общий результат, который мы приведем без
доказательства.
Теорема 3.8.2 (Основная теорема алгебры).
Если f ∈ C[x] и deg(f ) > 1, то существует c ∈ C — корень f .
55
p3
Домножение на w3 дает уравнение w6 + qw3 + 27 = 0, или, что то же самое, квадратичное
3
уравнение W + qW − = 0 относительно переменной W = w3 . Корнями этого квадратич‐
2 p
27
ного уравнения являются r
q p3 q2
W1,2 = − ± + .
2 27 4
Если w1 , w2 , w3 — три кубических корня из W , то w1 − 3wp 1 , w2 − 3wp 2 , w3 − 3wp 3 — корни
приведенного кубического уравнения t3 + pt + q = 0.
Заметим, что по формуле Виета W1 W2 = −p −p3
3
Определение 3.9.1. Пусть c ∈ R — корень многочлена f ∈ R[x]. Говорят, что c является кор‐
нем кратности m, если f делится на (x − c)m , но не делится на (x − c)m+1 . Корень кратности
1 также иногда называется простым, а кратности > 1 — кратным.
Замечание 3.9.2. Корень c ∈ R многочлена f ∈ R[x] имеет кратность m тогда и только
тогда, когда f = (x − c)m · g, где g ∈ R[x] таков, что g(c) 6= 0.
.
Доказательство. Если c — корень кратности m, то f .. (x − c)m и f = (x − c)m · g для неко‐
торого g. Если g(c) = 0, то g = (x − c) · h для некоторого h, а тогда f = (x − c)m+1 · h, что
противоречит тому, что f не делится на (x − c)m+1 .
Если же имеется разложение f = (x − c)m · g, g(c) 6= 0, то x — корень кратности m. В самом
.
деле, пусть f .. (x − c)m+1 , то есть f = (x − c)m+1 · h для какого‐то h. Но тогда (x − c)m · g =
(x − c)m+1 · h, откуда (x − c)m · (g − (x − c)h) = 0. Так как R — область целостности, то
R[x] тоже область целостности, откуда получаем, что g − (x − c)h = 0, так что g(c) = 0,
противоречие.
Следствие 3.9.3. Многочлен f ∈ R[x] представляется в виде f = (x − c1 )m1 · . . . · (x − ck )mk · g,
где g ∈ R[x] не имеет корней , а c1 , . . . , ck — различные корни f . В частности, сумма кратно‐
стей всех корней многочлена не превосходит его степени.
Обозначение 3.9.4. Пусть R — кольцо с 1. Для n ∈ N будем обозначать через n элемент
кольца R, полученный сложением 1 с собой n раз. При таких обозначениях в кольце Z/mZ
имеет место равенство m = 0. Аналогично, можно обозначить посредством −n число, про‐
тивоположное по сложению элементу n ∈ R, или же сумму −1 с собой n раз. Это позволяет
рассматривать целые числа как элементы кольца (но различным целым числам могут соот‐
ветствовать одинаковые элементы).
Определение 3.9.5. Пусть f = a0 + a1 x + . . . + an xn ∈ R[x]. Производной f называется
многочлен f ′ = a1 + 2a2 x + . . . + nan xn−1 .
Предложение 3.9.6. Пусть f, g ∈ R[x], c ∈ R, m ∈ N. Тогда
1. (f + g)′ = f ′ + g ′ (аддитивность);
2. (cf )′ = cf ′ ;
56
3. (f g)′ = f ′ g + f g ′ (правило Лей бница);
4. (f m )′ = mf m−1 f ′ .
Доказательство. Обозначим f = a0 + a1 x + . . . + an xn , g = b0 + b1 x + . . . + bn xn .
Pn Pn Pn
1. (f + g)′ = k=1 k(ak + bk )xk−1 = k=1 kak xk−1 + k=1 kbk xk−1 = f ′ + g ′ .
Pn Pn
2. (cf )′ = k=1 kcak xk−1 = c k=1 kak xk−1 = cf ′ .
3. Рассмотрим сначала случай , когда f и g — мономы, то есть f = axi и f = bxj . В этом
случае f g = abxi+j и (f g)′ = (i + j)abxi+j−1 . С другой стороны, f ′ g + f g ′ = iaxi−1 · bxj +
axi · jbxj−1 = iabxi+j−1 + jabxi+j−1 = (f g)′ .
Произвольный многочлен можно Pnзаписать в виде суммы мономов: f = f1 + . . . + fn ,
g = g1 + . . . + gn , и тогда f g = i,j=1 fi gj . Воспользуемся уже доказанным свой ством
аддитивности:
X
n X
n X
n X
n
(f g)′ = (fi gj )′ = (fi′ gj + fi gj′ ) = fi′ gj + fi gj′ = f ′ g + f g ′ .
i,j=1 i,j=1 i,j=1 i,j=1
57
Следствие 3.9.9. Пусть f ∈ K[x], c ∈ K и m > 1. Кратность c как корня f равна m тогда и
только тогда, когда f (c) = f ′ (c) = . . . = f (m−1) (c) = 0 и f (m) (c) 6= 0.
Доказательство. Если c — корень f кратности m, то он является корнем f ′ кратности m − 1,
откуда кратность как корня f (2) равна m − 2, и так далее, вплоть до f (m−1) с кратностью 1, и
f (m) 6= 0.
Пусть теперь f (c) = f ′ (c) = . . . = f (m−1) (c) = 0 и f (m) (c) 6= 0. Воспользуемся индукцией
по m. База m = 1 следует из Предложения 3.9.7. Индукционный переход: у многочлена f ′
первые m − 2 производных имеют в c значение 0, а (f ′ )(m−1) (c) 6= 0, то есть c — корень f ′
кратности m − 1, откуда c — корень f кратности m.
Замечание 3.9.10. Утверждение выше можно распространить и на случай m = 1, если эле‐
менты, не являющиеся корнями, называть «корнями крастности 0».
3.10 Интерполяция
Пусть K — поле, x1 , . . . , xn ∈ K попарно различны и y1 , . . . , yn . Задачей интерполяции на‐
зывается проблема отыскания некоторой функции, принимающей в каждой из точек xi зна‐
чение yi . Нас будет интересовать полиномиальная интерполяция, то есть мы будем искать
такую функцию среди многочленов. Более строго, такой типа интерполяции называется по‐
линомиальной интерполяцией с n простыми узлами.
Предложение 3.10.1. Задача полиномиальной интерполяции с n простыми узлами имеет
единственное решение в классе многочленов степени 6 n − 1.
Доказательство. Докажем сперва, что решение, если существует, является единственным.
Пусть f, g ∈ K[x] таковы, что f (xi ) = g(xi ) = yi для всех i = 1, . . . , n и deg(f ), deg(g) 6 n − 1.
Рассмотрим многочлен h = f − g. С одной стороны, deg(h) 6 n − 1, с другой , h(xi ) = 0 для
любого i = 1, . . . , n, так что у него имеется n различных корней . Это означает, что h = 0, а
тогда f = g.
Докажем существование искомого многочлена f при помощи явной конструкции. Дей ‐
ствовать будем аналогично доказательству китай ской теоремы об остатках (Теорема 2.11.1).
А именно, рассмотрим случай , когда y2 = y3 = . . . = yn = 0, а y1 произвольный . Если
.
f1 ∈ K[x] таков, что f1 (xi ) = yi , то f .. (x − x2 ) · . . . · (x − xn ) — это уже многочлен сте‐
пени n − 1. Остается только домножить его на подходящий скаляр, чтобы получить нужное
значение в x1 . Для этого сначала поделим на его значение в x1 , а затем домножим на y1 :
(x − x2 ) · . . . · (x − xn )
f1 = y1 · .
(x1 − x2 ) · . . . · (x1 − xn )
58
Аналогично можно построить многочлены fi , принимающие значение yi в xi и 0 в остальных
узлах интерполяции. Тогда для f = f1 + . . . + fn выполнено: f (xi ) = fi (xi ) = yi . Итого,
искомый интерполяционный многочлен имеет вид
n
X Y x − xj
f= yi · .
i=1
xi − xj
j̸=i
4. Для восстановления секрета M теперь необходимо вычислить f (0), что можно сделать,
восстановив многочлен F по любым k его значениям.
При этом знание любых k − 1 из этих значений не дает никакого знания об f (0), так как
возможные значения равномерно распределены в Z/pZ.
59
Итак, пусть R — область целостности с единицей . Будем полагать, что R 6= {0} и, в част‐
ности, 0 6= 1. Рассмотрим множество R × (R \ {0}) и введем на нем следующее отношение
эквивалентности:
(a, r) ∼ (b, s) ⇐⇒ as = br.
Моральный смысл этого определения состоит в том, что если мы представляем дроби ar и sb
в виде пар (a, r) и (b, s), то равенство дробей ar = sb равносильно, после домножения обеих
частей на rs, равенству as = br.
Лемма 3.11.1. Это отношение эквивалентности.
Доказательство. Рефлексивность очевидна: (a, r) ∼ (a, r) ⇔ ar = ar. Симметричность:
(a, r) ∼ (b, s) ⇔ as = br ⇔ (b, s) = (a, r). Транзитивность: если (a, r) ∼ (b, s) и (b, s) ∼ (c, t), то
as = br и bt = cs, откуда ast = brt и brt = crs. Вычитая, получаем, что 0 = ast−crs = s(at−cr).
Так как R — область целостности, at − cr = 0 и (a, r) ∼ (c, t).
Обозначение 3.11.2. Обозначим Q(R) = R × (R \ {0}) /∼ , а класс пары (a, r) будем обозна‐
чать ar .
Замечание 3.11.3. Для любого s 6= 0 имеется равенство a
r = as
rs .
a b as + br a b ab
+ = , · = .
r s rs r s rs
Лемма 3.11.5. Введенные операции определены корректно.
a a′ b b′
Доказательство. Требуется проверить, что если r = r′ и s = s′ , то
a b a′ b′ a b a′ b′
+ = ′ + ′, · = ′ · ′.
r s r s r s r s
Условия означают, что ar′ = a′ r и bs′ = b′ s. Выпишем
a b as + br a′ b′ a′ s′ + b′ r′
+ = и ′
+ ′ = .
r s rs r s r′ s′
Проверим, что пары, отвечающие дробям в правых частях, эквивалентны:
a b ab a′ b′ a′ b′
· = и · = .
r s rs r′ s′ r′ s′
Равенство правых частей имеет место, так как abr′ s′ = a′ b′ rs.
Лемма 3.11.6. Q(R) относительно введенных операций образует кольцо.
Доказательство. Ассоциативность сложения:
a b c as + br c ast + brt + crs a b c a bt + cs ast + brt + crs
+ + = + = , + + = + = .
r s t rs t rst r s t r st rst
60
Коммутативность сразу следует из определения:
a b as + br br + as b a
+ = = = + .
r s rs sr s r
В качестве ней трального по сложению выступает 01 :
a 0 a·1+0·r a
+ = = .
r 1 r·1 r
Заметим, кроме того, что 01 = 0r для любого r ∈ R \ {0}.
−a
Противоположный к ar по сложению вычисляется как r :
a −a ar − ar 0 0
+ = 2
= 2 = .
r r r r 1
Ассоциативность умножения:
a b c ab c abc a bc a b c
· · = · = = · = · · .
r s t rs t rst r st r s t
в кольце R.
Элементы исходного кольца R можно отождествить с элементами Q(R) посредством отоб‐
ражения a 7→ a1 . При этом различные элементы переходят в раздичные элементы (так как
a b
1 = 1 влечет a = b), а сложение и умножение таких дробей происходит так же, как и у исход‐
ных элементов:
a b a+b a b ab
+ = и · = .
1 1 1 1 1 1
Пример 3.11.8. Q(Z) = Q.
61
f
Хотя мы и используем слово «функция», значение такой дроби (понимаемое как g (c) =
f (c)
g(c) )
определено не во всех точках c (с этим мы уже встречались при рассмотрении дробно‐
линей ных функций ). Более того, так как существуют ненулевые многочлены, принимающие
нулевые значения во всех точках, существуют и рациональные функции, значение которых
не определено ни в одной точкой , например, xp1−x ∈ (Z/pZ)(x).
Еще одно препятствие состоит в том, что подобная попытка определить значение рацио‐
нальной зависит от выбора представителя — домножение числителя и знаменателя на мно‐
гочлен f удаляет из области определения корни f . Это можно было бы обой ти, выделяя в
каждом классе дробей представителя, имеющего взаимно простые числитель и знамена‐
тель (тогда область определения максимальна), либо, как делают в анализе, определеить
значение как предел в тех точках, где он конечен (так мы поступали с дробно‐линей ными
преобразованиями, но над произвольным полем такой подход недоступен).
Определение 3.12.2. Рациональная функция f
g ∈ F (x) называется правильной (дробью),
если deg(f ) < deg(g).
Замечание 3.12.3. Это определение не зависит от выбора представителей , то есть если gf11 =
f2
g2 и deg(f1 ) < deg(g1 ), то deg(f2 ) < deg(g2 ).
0.
Определение 3.12.7. Многочлен называется неприводимым, если его нельзя представить в
виде произведения двух многочленов меньших степеней .
62
Пример 3.12.8. Как мы уже видели, в C[x] неприводимыми являются только линей ные мно‐
гочлены, а в R[x] линей ные и квадратичные с отрицательным дискриминантом.
Отметим следующие свой ства многочленов, аналогичные свой ствам целых чисел.
Предложение 3.12.9. 1. Если f ⊥ g, то существуют такие u, v, что f u + gv = 1.
2. Для любого f ∈ F [x] существуют такие неприводимые многочлены f1 , . . . , fk , что f =
f1 · . . . · fk . Эти множители определены однозначно с точностью до перестановки и
ассоциированности.
Определение 3.12.10. Рациональная функция называется простейшей, если ее можно пред‐
ставить в виде pfm , где f, p ∈ F [x], p неприводимый , deg(f ) < deg(p), m ∈ N.
Лемма 3.12.11. Пусть f
gh ∈ F (x) — правильная дробь, причем g ⊥ h. Тогда существует пред‐
f a b
ставление gh = g + h в виде суммы двух правильных дробей .
Доказательство. Раз g ⊥ h, то существуют такие u, v, что gu + hv = 1. Тогда f = g · f u +
h · f v, откуда gh
f
= gf u+hf
gh
v
= fhu + fgv . Каждое из этих слагаемых представляется в виде
f
суммы многочлена и правильной дроби, итого gh = c+ ag + hb . Так как исходная рациональная
функция является правильной дробью, получаем c = 0.
f
Лемма 3.12.12. Правильную дробь вида pm можно представить в виде суммы
f a1 a2 am
m
= + 2 + ... + m,
p p p p
где ai ∈ F [x] и deg(ai ) < deg(p).
Доказательство. Индукция по m. База тривиальна. При m > 1 поделим с остатком f = pq+r,
deg(r) < deg(p). Тогда
f pq + r pq r q r
m
= m
= m + m = m−1 + m ,
p p p p p p
и к первому слагаемому можно применить индукционное предположение.
Теорема 3.12.13. Пусть f
g ∈ F (x) — правильная дробь, g = pm
1 · . . . · pk — разложение на
1 mk
неприводимые (pi ⊥ pj при i 6= j). Тогда fg представляется в виде суммы простей ших дробей ,
mk
в знаменателях которых стоят p1 , p21 , . . . , pm
1 , p 2 , . . . , pk .
1
63
4 Основы линейной алгебры
4.1 Векторные пространства и базисы
Мы уже видели, как абстрактные понятия вроде группы, кольца и поля позволяют рассмат‐
ривать на первый взгляд совершенно различные структуры единообразно, выделяя самые
существенные их свой ства. Базовой структурой в линей ной алгебре является векторное про‐
странство — понятие, реализующее основные свой ства множества всех векторов в евклидо‐
вом пространстве.
Определение 4.1.1. Пусть F — поле. Множество V вместе с бинарной операцией + : V ×
V → V и операцией · : F × V → V называется векторным пространством над полем F , если
выполнены следующие свой ства:
1. (V, +) является абелевой группой ;
2. для любых u, v ∈ V и λ, µ ∈ F верны равенства
a) λ · (u + v) = (λ · u) + (λ · v),
b) (λ + µ) · v = (λ · v) + (µ · v),
c) λ · (µ · v) = (λµ) · v,
d) 1 · v = v.
Элементы V называются векторами, а элементы базового поля F называются скалярами.
Операции на V называются векторным сложением и умножением на скаляр.
Примеры 4.1.2.
1. Множество всех векторов евклидова пространства (для простоты можно рассматри‐
вать случай плоскости), имеющих началом некоторую фиксированную точку O, отно‐
сительно сложения по правилу параллелограма и растяжений относительно точки O в
качестве домножения на вещественные скаляры.
u+v
λv
u
v
64
5. Рациональные функции над данным полем F , а также множество всех правильных дро‐
бей .
6. Для данного множества A множество всех его подмножеств 2A — векторное простран‐
ство над Z/2Z относительно симметрической разности в качестве сложения и есте‐
ственным образом определенного умножения на скаляр: 1 · X = X, 0 · X = ∅.
Замечание 4.1.3. Отметим некоторые очевидные следствия из определения векторного
пространства.
1. В V имеется ней тральный элемент относительно сложения, который мы будем обо‐
значать 0 (от нулевого элемента базового поля отличается по контексту).
2. λ · 0 = 0 для любого λ ∈ F .
3. 0 · v = 0 для любого v ∈ V .
4. −v = (−1) · v.
В примерах выше каждый элемент векторного пространства однозначно задавался неко‐
торым набором «параметров», имеющим для всех векторов одинаковый размер:
• для векторов на евклидовой плоскости это координаты концов векторов (в некоторой
фиксированной декартовой системе координат);
• для векторов F n это компоненты кортежа;
• для комплексных чисел это вещественная и мнимая часть;
• для многочленов — их коэффициенты;
• для подмножеств данного множества — значения характеристической функции.
В каждом случае эти параметры являются независимыми, причем сумме векторов отвечают
суммы параметров. Для формализации этого наблюдения используется понятие базиса.
Определение 4.1.4. Набор векторов v1 , . . . , vn ∈ V называется линейной независимым, если
для любых λ1 , . . . , λn ∈ F из равенства λ1 v1 + . . . + λn vn = 0 следует, что λ1 = . . . = λn = 0.
В противном случае набор v1 , . . . , vn называется линей но зависимым, а соотношение λ1 v1 +
. . . + λn vn = 0, где не все λi нулевые, — линей ной зависимостью.
Замечание 4.1.5. Набор векторов v1 , . . . , vn линей но независим тогда и только тогда, когда
никакой из этих векторов нельзя представить в виде линей ной комбинации остальных.
Доказательство. Пусть v1 = µ2 v2 + . . . + µn vn . Тогда (−1)v1 + µ2 v2 + . . . + µn vn = 0 — нетри‐
виальная линей ная комбинация, обращающаяся в ноль, и набор v1 , . . . , vn линей но зависим.
Если же λ1 v1 + λn vn = 0 — нетривиальная линей ная зависимость, то один из коэффици‐
ентов, скажем, λ1 , не равен 0, и тогда v1 = µ2 v2 + . . . + µn vn , где µi = −λ
λ1 .
i
65
Пример 4.1.9. Рассмотрим пространство V = F n и следующий набор вектором в нем:
v1,1 v2,1 vk,1 vn,1
0 v2,2 .
..
0
vk,k .
v1 = . , v 2 = . , . . . , v k = , . . . , vn = .
.
,
.. .. 0
.
..
0 0 0 vn,n
При таком обозначении можно сказать, что набор v1 , . . . , vn является порождающим, если
hv1 , . . . , vn i = V .
Определение 4.1.12. Линей но независимый порождающий набор называется базисом.
Примеры 4.1.13.
66
(3) ⇒ (4): Так как набор порождающий , утверждение о существовании выполнено. Пред‐
положим, что у какого‐то вектора v существует два различных представления в виде линей ‐
ной комбинации:
v = λ1 v1 + . . . + λn vn = µ1 v1 + . . . + µn vn .
Если λi 6= µi , то (λ1 − µ1 )v1 + . . . + (λn − µn )vn = 0 — нетривиальная линей ная комбинация,
так что снова по Замечанию 4.1.5 вектор vi представляется в виде линей ной комбинации
остальных векторов набора, а тогда исходный набор не является минимальным порождаю‐
щим.
(4) ⇒ (2): Поскольку у вектора 0 существует только одно представление в виде линей ной
комбинации v1 , . . . , vn , а именно 0 = 0·v1 +. . .+0·vn , то этот набор линей но независим. Пред‐
положим, что он не является максимальным по включению среди линей но независимых.
Это значит, что существует такой вектор u ∈ V , что набор v1 , . . . , vn , u линей ное независим.
Но вектор u представляется в виде линей ной комбинации v1 , . . . , vn , так что этот набор не
можкт быть линей ной независим.
(2) ⇒ (1): Если набор v1 , . . . , vn является максимальным линей ной независимым, то для
любого u ∈ V набор v1 , . . . , vn , u является линей но зависимым, то есть существуют такие
коэффициенты µ1 . . . , µn , ν ∈ F , что µ1 v1 + . . . + µn vn + νu = 0. Заметим, что ν 6= 0 — в
противном случае получалась бы нетривиальная линей ная зависимость между векторами
v1 , . . . , vn . Но тогда u = λ1 v1 + . . . + λn vn для λi = −µ
ν , и набор v1 , . . . , vn порождающий .
i
v1 = λ 2 v2 + . . . λ n vn .
v = µ 1 v1 + µ 2 v2 + . . . + µ n vn
67
Предложение 4.1.18. В конечномерном векторном пространстве любой линей но независи‐
мый набор можно дополнить до базиса.
Доказательство. Пусть v1 , . . . , vm — линей но независимый набор. Поскольку пространство
конечномерно, существует порождающий набор u1 , . . . , un . Если набор vi не является порож‐
дающим, то какой ‐то из uj не представляется в виде линей ной комбинации vi — скажем,
u1 . Тогда v1 , . . . , vm , u1 снова линей но независимый , и к нему можно применить то же рас‐
суждение. В какой ‐то момент не останется векторов uj , не представимых в виде линей ных
комбинаций vi — в таком случае набор vi является порождающим. Поскольку на предыду‐
щем шаге он еще не был порождающим, он является минимальным порождающим, то есть
базисом.
Лемма 4.1.19 (Лемма Штей ница о замене). Пусть u1 , . . . , um — линей но независимый набор,
а v1 , . . . , vn — порождающий набор. Тогда m 6 n и набор u1 , . . . , um , vm+1 , . . . , vn порождаю‐
щий , возможно, после некоторой перенумерации набора vi .
Доказательство. Докажем индукцией по k = 0, . . . , m, что утверждение верно для поднабо‐
ра u1 , . . . , uk . В качестве базы рассмотрим случай k = 0, в котором нечего доказывать.
Предположим теперь, что утверждение уже доказано для некоторого k < m. По индукци‐
онному предположению набор u1 , . . . , uk , vk+1 , . . . , vn является порождающим, так что най ‐
дутся такие коэффициенты λ1 , . . . , λn ∈ F , что
uk+1 = λ1 u1 + . . . + λk uk + λk+1 vk+1 + . . . + λn vn .
Хотя бы один из коэффициентов λk+1 , . . . , λn должен быть ненулевым, иначе выражение вы‐
ше дает нетривиальную линей ную зависимость между векторами u1 , . . . , uk+1 . В частности,
отсюда k + 1 6 n. Переупорядочивая, если необходимо, векторы vk+1 , . . . , vn , можем считать,
что λk+1 6= 0, а тогда
1
vk+1 = uk+1 − λ1 u1 − . . . − λk uk − λk+1 vk+2 − . . . − λn vn .
λk+1
Значит, набор u1 , . . . , uk+1 , vk+2 , . . . , vn — порождающий .
Утверждение леммы это в точности случай k = m.
Предложение 4.1.20. Если V — конечномерное векторное пространство, то во всех его ба‐
зисах одинаковое количество элементов.
Доказательство. Пусть имеются два базиса размеров m и n соответственно. Так как первый
из них является линей но независимым набором векторов, а второй порождающим набором,
m 6 n. Аналогично, n 6 m. Значит, m = n.
Определение 4.1.21. Размерностью векторного пространства V называется количество эле‐
ментов в каком‐нибудь (любом) его базисе. Обозначение: dim(V ) = n, если существует базис
из n элементов, и dim(V ) = ∞, если V не является конечномерным.
Последнее из четырех эквивалентных определений базиса показывает, что любое конеч‐
номерное пространство можно отождествить с пространством столбцов однозначно опреде‐
ленной высоты. А именно, если e1 , . . . , en — базис V , то для каждого вектора v ∈ V существу‐
ют такие однозначно определенные коэффициенты λ1 , . . . , λn ∈ F , что v = λ1 v1 + . . . + λn vn .
Кортеж из этих коэффициентов (λ1 , . . . , λn ), рассматриваемый как элемент пространства
столбцов F n , называется столбцов координат вектора v в базисе e и обозначается ve . Тем
самым задано отображение
v 7→ ve : V → F n .
68
Отметим, что в силу единственности набора λi это отображение инъективно, при этом легко
предъявить для любого столбца вектор, имеющий этот столбец в качестве столюца коорди‐
нат. В дей ствительно таким образом задается обратное отображение
(λ1 , . . . , λn ) 7→ λ1 v1 + . . . + λn vn : F n → V.
4. Если B ⊆ A, то 2B ⊆ 2A .
Замечание 4.2.4. Если {Ui }i∈I — семей ство подпространств V , то U = ∩i∈I Ui 6 V .
Доказательство. Если u, v ∈ U , λ, µ ∈ F , то, так как u, v ∈ Ui для каждого i ∈ I, то λu + µv ∈
Ui для всех i, а тогда λu + µv ∈ U . Так как 0 ∈ Ui для всех i, также 0 ∈ U и U 6= ∅.
69
X, так что W ⊆ hXi. Обратно, заметим, что W является подпространством V . Дей ствитель‐
но, если u = λ1 u1 + . . . + λn un ∈ W и v = µ1 v1 + . . . + µm vm ∈ W (где ui , vj ∈ X), то для
любых λ, µ ∈ F линей ная комбинация
При этом ясно, что X ⊆ W , так что W является одним из пересекаемых подпространств в
определении hXi, откуда hXi ⊆ W .
Предложение 4.2.7. Если V конечномерно и U 6 V , то U тоже конечномерно и dim(U ) 6
dim(V ).
Доказательство. Если u1 , . . . , um — линей но независимый набор векторов U , то он продол‐
жается до некоторого базиса пространства V , и поэтому m 6 dim(V ). Значит, U конечно‐
мерно, а тогда оценка на размер всех линей но независимых наборов дает оценку на размер
максимального, то есть dim(U ) 6 dim(V ).
Предложение 4.2.8. Если U 6 V и dim(U ) = dim(V ) < ∞, то U = V .
Доказательство. Если u1 , . . . , un — базис U , то он является также и базисом V (иначе его
можно было бы продолжить до базиса V , и получился бы базис V размера большего, чем
dim(V )). Но так как hu1 , . . . , un i = U , то U = V .
Пересечение подпространсв является подпространством, а вот объединение обычно под‐
пространством не является (простей ший пример — пара прямых на плоскости). Для подпро‐
странств операцией , двой ственной пересечению, является сумма.
P
Определение 4.2.9. Если {Ui }i∈I — семей ство подпространств V , то i∈I Ui = h∪i∈I Ui i.
Иными словами X
Ui = {u1 + . . . + un | n ∈ N, uk ∈ Uik }.
i∈I
U1 + . . . + Un = {u1 + . . . + un | ui ∈ Ui }.
w1 , . . . , w m , u 1 , . . . , u n , v 1 , . . . , v k
является порождающим для U +V (любой элемент U +V является суммой u+v для каких‐то
u ∈ U и v ∈ V , которые оба выражаются через этот набор).
Покажем, что этот набор является линей но независимым. Предположим, что
λw1 + . . . + λm wm + µ1 u1 + . . . + µn un + η1 v1 + . . . + ηk vk = 0.
70
Тогда X X
η1 v1 + . . . + ηk vk = − λi wi − µi ui .
Заметим, что левая часть является элементом V , а права элементом U . Тогдв обе они лежат
в U ∩ V , в частности,
η1 v1 + . . . + ηk vk = θ1 w1 + . . . + θm wm
для каких‐то коэффициентов θi . Но тогда
X X
θ1 w1 + . . . + θm wm = − λi wi − µi ui
u = u + 0 + . . . + 0, u = 0 + u2 + . . . + un .
71
Следствие 4.2.15. Если V = U1 + . . . + Un и dim(V ) = dim(U1 ) + . . . + dim(Un ), то сумма
прямая.
Доказательство. В случае n = 2 это прямо следует из Теоремы 4.2.10. В общем случае это
легко доказывается индукцией , так как U1 + . . . + Un = U1 + (U2 + . . . + Un ).
С каждой парой (V, U ) из векторного пространства V и подпространства U 6 V связано
еще одно важное векторное пространство, элементами которого являются параллельные
сдвиги U .
Определение 4.2.16. Пусть U 6 V . Рассмотрим следующее отношение эквивалентности на
V:
u ∼ v ⇔ u − v ∈ U.
Тогда фактор‐множество V /∼ относительно операций
72
Примеры 4.3.2.
1. Если V — евклидово пространство, то повороты вокруг начала координат O, отраже‐
ния относительно прямых, прходящих через O, а также растяжения — линей ные отоб‐
ражения V → V .
2. Умножение на комплексное число v 7→ zw и комплексное сопряжение z 7→ z — линей ‐
ные отображения C → C как векторным пространств над R.
3. Дифференцирование f 7→ f ′ — линей ное отображение F [x]6d → F [x]6d−1 .
4. Если c ∈ F , то эвалюация f 7→ f (c) — линей ное отображение F [x] → F .
5. Если U 6 V , то отображение вложения U → V — линей ное. Проекция v 7→ v + U —
линей ное отображение V → V /U .
6. Если e1 , . . . , en — базис V , то отображение v 7→ ve — линей ное из V в F n .
Обозначение 4.3.3. Множество всех линей ных отображений из U в V будем обозначать
Hom(U, V ). Если требуется подчеркнуть, что U и V рассматриваются как векторные про‐
странства над полем F , будем писать HomF (U, V ).
Замечание 4.3.4. Композиция линей ных отображений — линей ное отображение.
Поскольку мы уже установили, что всякое конечномерное векторное пространство мож‐
но отождествить с пространством столбцов, для выяснения структуры всех линей ных отоб‐
ражений полезно выяснить, как устроены линей ные отображения между пространствами
столбцов.
Рассмотрим семей ство линей ных отображений πi : F m → F , задаваемое правилом
πi (a1 , . . . , am ) = ai .
ei = (0, . . . , 0, 1, 0, . . . , 0),
где 1 стоит на i‐й позиции, и обозначим ai = φ(ei ). Тогда для произвольного вектора v =
(x1 , . . . , xn ) выполнено v = x1 e1 + . . . + xn en и в силу линей ности φ
73
Определение 4.3.5. Пусть a = (a1 , . . . , an ) ∈ n F , а b = (b1 , . . . , bn ) ∈ F n . Тогда произведени‐
ем строки a на столбец b будем называть скаляр a1 b1 + a2 b2 + . . . + an bn ∈ F .
В таких терминах рассуждения выше доказывают следующее
Предложение 4.3.6. Все отображения F n → F являются отображениями умножения слева
на строку из n F .
В таких обозначениях получается, что всякое линей ное отображение F n → F m это отоб‐
ражения умножения слева на матрицу из M (m, n, F ).
Замечание 4.3.10. Если линей ное отображение φ : F n → F m задается матрицей A = (ai,j ) ∈
M (m, n, F ), то ее столбцы есть в точности образы элементов естественного базиса ei про‐
странства F n , то есть a∗,j = φ(ej ).
Выясним теперь, как это описание линей ных отображений между пространствами столб‐
цов переносится на произвольное конечномерное векторное пространство при отождеств‐
лении посредством выбора базиса.
Пусть e1 , . . . , en — базис U , f1 , . . . , fm — базис V , а φ : U → V — линей ное отображение.
Обозначим через βe : U → F n и βf : V → F m линей ные отображения, сопоставляющие век‐
торам U и V их столбцы координат в базисах e и f соответственно, то есть βe (u) = ue и
74
βf (v) = vf . Тогда, как мы уже выяснили, βe обратимо и βe−1 тоже линей ное. Тогда компози‐
ция линей ных отображений
α = βf ◦ φ ◦ βe−1 : F n → F m
является линей ным отображением между пространствами столбцов, и потому является до‐
множением на некоторую матрицу A ∈ M (m, n, F ), то есть α(b) = Ab. Отсюда получаем
равенство функций α ◦ βe = βf ◦ φ, что в применении к вектору u ∈ U дает
Иными словами, чтобы най ти столбец координат вектора φ(u) относительно базиса f , надо
домножить столбец координат вектора u относительно базиса e на некоторую однозначно
определенную матрицу.
Определение 4.3.12. Пусть φ : U → V — линей ное отображение, а e1 , . . . , en и f1 , . . . , fm —
базисы U и V . Тогда матрица A ∈ M (m, n, F ) называется матрицей линейного отображения
φ относительно пары базисов e и f , если для любого u ∈ U выполнено A · ue = (φ(u))f .
Обозначение 4.3.13. A = φe,f , то есть φe,f ue = φ(u)f .
Замечание 4.3.14. Если A = φe,f , то столбцы A это столбцы координат образов базисных
векторов, то есть A∗,j = φ(ej )f .
Обозначение 4.3.15. Наиболее важным случаем являются линей ные отображения φ : V →
V . В таком случае в V можно выбрать один базис e1 , . . . , en и называть φe,e матрицей отоб‐
ражения φ относительно базиса e и обозначать ее φe .
Примеры 4.3.16.
1. Пусть V — евклидова плоскость, а e1 , e2 — стандартный базис (то есть e1 ⊥ e2 ). Пусть
φ : V → V — отображение поворота вокруг начала координат на угол θ.
e2
sin θ φ(e1 )
φ(e2 )
e1
cos θ
75
2. Пусть V = C — векторное пространство над R. Относительно базиса 1, i матрица отоб‐
ражения умножения на комплексное число z = a + bi имеет вид
a −b
,
b a
Разумеется, как частный случай Hom(F n , F m ) тоже является векторным пространством. При
этом, как мы уже знаем, линей ные отображения F n → F m это в точности домножения на
матрицы из M(m, n, F ). Выясним, как указанные операции выражаются в терминах матриц.
Столбцы матрицы A это в точности образы векторов стандартного базиса F n , так что
поточечная сумма φ + ψ переводит базисный вектор ej в сумму образов φ(ej ) + ψ(ej ), то
есть матрица, отвечающая сумме отображений составлена из сумм столбцов соответствую‐
щих матриц. Поскольку столбцы складываются покомпонентно, сумме отображений отвеча‐
ет сумма матриц: если A, B ∈ M(m, n, F ), то (A+B)i,j = Ai,j +Bi,j . Аналогично, домножение
на скаляр реализуется покомпонентным умножением: (λ · A)i,j = λ · Ai,j .
В общем случае те же соображения показывают, что относительно базисов e и f пространств
U иV
(φ + ψ)e,f = φe,f + ψe,f , (λ · φ)e,f = λ · φe,f .
Это означает, что выбор пары базисов e, f задает линей ное отображение
причем это отображение является обратимым — то есть каждая матрица задает некоторое
линей ное отображение.
Линей ные отображения обладают еще одной структурой — можно находить их компози‐
ции. А именно, если U, V, W — три векторных пространства, а φ ∈ Hom(U, V ) и ψ ∈ Hom(V, W ),
то определена композиция ψ ◦ φ ∈ Hom(U, W ).
Пусть e, f, g — базисы пространств U, V, W . Выясним, как най ти матрицу (ψ ◦ φ)e,g . В пози‐
ции (i, j) у этой матрицы стоит i‐я координата образа ej в базисе g. Но
(ψ ◦ φ)(ej ) = ψ φ(ej ) = ψf,g · φ(ej ) f = ψf,g · φe,f ∗,j .
g g
Получается, что в позиции (i, j) матрицы (ψ ◦ φ)e,g стоит произведение i‐й строки ψf,g и j‐
го столбца матрицы φe,f . Заведем для матрицы, составленной таким образом, специальное
определение.
76
Итого мы показали, что
(ψ ◦ φ)e,g = ψf,g · φe,f .
Следствие 4.3.18. Умножение матриц ассоциативно.
Доказательство. Умножение матриц соответствует композиции соответствующих линей ‐
ных отображений (достаточно рассматривать отображения между пространствами столб‐
цов), а композиция ассоциативна.
Замечание 4.3.19.
1. Отображению v 7→ 0 соответствует матрица, составленная из нулей (нулевая матрица).
Это отображение и эта матрица служат ней тральными элементами по сложению для
Hom(U, V ) и M(m, n, F ).
2. Отображению id : v 7→ v соответствует матрица, составленная из столбцов стандартно‐
го базиса пространства столбцов. Иными словами, в позиции (i, j) в ней стоит 1, если
i = j, и 0 в ином случае. Такая матрица называется единичной и обозначается I (ес‐
ли требуется явно указать размер, то In ). Это отображение и эта матрица служат ней ‐
тральным элементов относительно композиции в Hom(V, V ) и умножения в M(n, F )
соответственно.
Замечание 4.3.20. Множество матриц M(n, F ) относительно сложения и умножения матриц
образует ассоциативное кольцо с 1. Это кольцо не является коммутативным в случае n > 1.
Доказательство. Дей ствительно, все свой ства кольца уже либо были проверены выше, ли‐
бо сразу следуют из соответствия между матрицами и линей ными отображениями. Ожидать
от объектов, кодирующих функции относительно композиции, коммутативности было бы
странно. Однако некоммутативность для матриц такова, что произведение в одном порядке
может быть ненулевым, а в другом нулевым, например
1 0 0 1 0 1 0 1 1 0 0 0
= , = .
0 0 0 0 0 0 0 0 0 0 0 0
77
Доказательство. Если u, v ∈ Ker(φ) и λ, µ ∈ F , то φ(λu + µv) = λφ(u) + µφ(v) = λ0 + µ0 = 0,
так что λu + µv ∈ ker(φ).
Предложение 4.3.25. φ ∈ Hom(U, V ) инъективно тогда и только тогда, когда Ker(φ) = 0.
Доказательство. Если φ инъективно, то у 0 не больше одного прообраза, причем φ(0) = 0,
так что Ker(φ) = 0.
Обратно, пусть Ker(φ) = 0. Если φ(u) = φ(v), то φ(u − v) = φ(u) − φ(v) = 0, откуда u − v ∈
ker(φ) и −v = 0.
Предложение 4.3.26. Пусть dim(U ) = dim(V ), φ ∈ Hom(U, V ). Отображение φ инъективно
тогда и только тогда, когда оно сюръективно.
Доказательство. Заметим, что инъективное линей ное отображение никакой ненулевой век‐
тор не переводит в 0, так что любая нетривиальная линей ная комбинация элементов базиса
не переходит в 0. При этом линей ная комбинация переходит в линей ную комбинацию, так
что свой ство линей ной независимости сохраняется, и базис переходит в базис — в частно‐
сти, остается порождающим семей ством, так что отображение также сюръективно.
Если отображение φ сюръективно, то у каждого вектора есть прообраз — в частности, у
всех векторов какого‐нибудь базиса. Но тогда эти прообразы образую линей но независимый
набор (раз их образы линей но независимы), который в силу своего размера является бази‐
сом. Если какая‐то их линей ная комбинация переходит в 0, то соответствующая линей ная
комбинация образов равна 0, что противоречит их линей ной независимости.
Замечание 4.3.27. Линей ное отображение φ ∈ Hom(V, V ) обратимо слева тогда и только
тогда, когда оно обратимо справа. В частности, для квадратных матриц A, B, C если AB =
AC = I или BA = CA = I, то B = C.
Доказательство. φ обратимо слева тогда и только тогда, когда, то оно инъективно, и обра‐
тимо справа тогда и только тогда, когда сюръективно.
Определение 4.3.28. Пусть A ∈ M(m, n, F ). Транспонированной матрицей для матрицы A
называется A⊤ ∈ M(n, m, F ), задаваемая по правилу (A⊤ )i,j = Aj,i .
В частности, если рассматривать столбцы из F n и строки из n F как матрицы n × 1 и 1 × n
соответственно, то транспонирование переводит столюцы в строки и наоборот.
Предложение 4.3.29.
1. Если A, B ∈ M(m, n, F ), то (A + B)⊤ = A⊤ + B ⊤ .
2. Если A ∈ M(m, n, F ) и λ ∈ F , то (λA)⊤ = λA⊤ .
3. Если A ∈ M(m, n, F ) и B ∈ M(n, k, F ), то (AB)⊤ = B ⊤ A⊤ .
4. Если A ∈ M(n, F ) обратима, то A⊤ тоже обратима и (A−1 )⊤ = (A⊤ )−1 .
Доказательство. Первые два свой ства очевидны.
Докажем второе. В позиции (i, j) матрицы (AB)⊤ стоит
(AB)j,i = Aj,1 B1,i + . . . + Aj,n Bn,i ,
⊤ ⊤
в то время как у B A на той же позиции
⊤ ⊤ ⊤
Bi,1 A1,j + . . . + Bi,n A⊤
n,j = B1,i Aj,1 + . . . + Bn,i Aj,n ,
78
4.4 Матрица перехода между базисами
Пусть теперь в пространстве V выюраны два базиса e1 , . . . , en и f1 , . . . , fn . Выясним, как свя‐
заны для произвольного вектора v столбцы координат ve и vf .
Обозначим β : V → F n и γ : V → F n линей ные отображения β(v) = ve и γ(v) = vf . Оба
эти отображения обратимы, обратные линей ны, так что линей ная композиция δ = γ ◦ β −1 .
С другой стороны, для произвольного вектора v ∈ V выполнено δ(ve ) = vf , то есть соответ‐
ствие между столбцами координат в разных базисах реализуется линей ным оотображением
из Hom(F n , F n ). Это отображение задается матрицей C ∈ M(n, F ), то есть для любого v ∈ V
имеет место равенство Cve = vf . Ясно, как построить такую матрицу C — ее столбцы это
образы векторов стандартного базиса F n . При отображении β −1 это векторы переходят в
векторы базиса e1 , . . . , en , а их образ под дей ствием γ это (e1 )f , . . . , (en )f . Иными словами,
C∗,i = (ei )f .
Определение 4.4.1. Матрицей перехода между базисами e1 , . . . , en и f1 , . . . , fn пространства
V называется такая матрица Ce→f ∈ M(n, F ), что для любого вектора v ∈ V выполнено
Ce→f ve = vf . Столбцы этой матрицы — столбцы координат векторов базиса e в базисе f .
Предложение 4.4.2.
1. Если e, f, g — три базиса V , то Ce→g = Cf →g Ce→f .
−1
2. Матрица перехода Ce,f обратима, и Ce,f = Cf,e .
Доказательство. Cf →g Ce→f ve = Cf →g vf = vg . Второе свой ство следует из обратимости
отображений соспоставления вектору столбца координат вместе с первым утверждением и
тем, что Ce→e = I.
Выясним теперь, как меняется матрица линей ного отображения при замене базисов.
Это соотношение является характеристическим свой ством матрицы φe′ ,f ′ , откуда в силу ее
единственности получаем требуемое утверждение.
−1
Следствие 4.4.4. Если φ ∈ Hom(V, V ), а e, f — базисы V , то φf = Ce→f φe Ce→f = Cf−1
→e φe Cf →e .
Покажем теперь, что при подходящем выборе базисов e и f матрица линей ного отображе‐
ния φe,f может принимать особенно простой вид.
79
Предложение 4.4.5 (Канонический вид матрицы линей ного отображения). Для любого φ ∈
Hom(U, V ) най дутся такой базис e пространства U и такой базис f пространства V , что φe,f
имеет вид
Ik 0
∈ M(dim V, dim U, F ).
0 0
для некоторого k ∈ Z>0 , а блоки из нулей имеют соответствующие размеры.
Доказательство. Выберем v1 , . . . , vm — базис Ker(φ) (возможно, пустой , если φ инъектив‐
но), а затем дополним его векторами u1 , . . . , uk до базиса U . Базисом e будет служить набор
u1 , . . . , uk , v1 , . . . , vm . Затем положим fi = φ(ei ) при i = 1, . . . , k — это линей но независимый
набор (так как на he1 , . . . , ek i отображение φ инъективно и потому сохраняет линей ную неза‐
висимость). Дополним его какими‐то векторами fk+1 , . . . , fdim V до базиса. Тогда φe,f имеет
искомый вид.
LA : F n → F m : v 7→ Av, RA : m
F → n F : u 7→ uA.
80
Теперь воспользуемся Предложением 4.4.5 о каноническом виде линей ного отображения:
най дутся такие обратимые матрицы C ∈ M(m, F ) и D ∈ M(n, F ), что
Ik 0
CAD = .
0 0
Доказательство. Заметим для начала, что для размерность векторного пространства под
дей ствием линей ного отображения не может возрасти. Например, dim(ψ(V ′ )) 6 dim(V ′ ) для
любого V ′ 6 V . В частности, для V ′ = φ(U ) получаем, что dim(ψ(φ(U ))) 6 dim(φ(U )), что
означает в точности rk(ψ ◦ φ) 6 rk(φ).
С другой стороны, так как φ(U ) 6 V , получаем ψ(φ(U )) 6 ψ(V ), так что dim(ψ(φ(U ))) 6
dim(ψ(V )), то есть rk(ψ ◦ φ) 6 rk(ψ).
Ax = b,
81
Замечание 4.6.1. Решения однородной СЛУ образуют подпространство в F n .
Остается открытым вопрос, когда существует такой v0 . Рассмотрим внимательнее, что та‐
кое Ax при x = (x1 , . . . , xn )⊤ . По определению
Ax = x1 A∗,1 + . . . + xn A∗,n .
Тогда существование такого x, что Ax = b, эквивалентно тому, что b выражается в виде ли‐
ней ной комбинации столбцов матрицы A (иными словами, b ∈ Im(A)).
Теорема 4.6.4 (Кронекера—Капелли). СЛУ Ax = b имеет решение тогда и только тогда, ко‐
гда rk(A) = rk(A|b), то есть когда ранг матрицы системы равен рангу расширенной матрицы.
Доказательство. Рассмотрим пространства U = hA∗,1 , . . . , A∗,n i и V = hA∗,1 , . . . , A∗,n , bi.
Ясно, что U 6 V и оба утверждения эквивалентны тому, что U = V .
82
• Пусть ε ∈ F . Дилатацией называется преобразование di (ε) ∈ Hom(F n , F n ), дей ствую‐
щее по правилу
(x1 , . . . , xi , . . . , xn )⊤ 7−→ (x1 , . . . , εxi , . . . , xn )⊤ .
Отображение di (ε) обратимо тогда и только тогда, когда ε 6= 0, в таком случае обратное
отображение равно di (1/ε). Отображение di (ε) задается диагональной матрицей
A = (a1 | . . . |an ).
83
4.8 Метод Гаусса
Опишем теперь один способ решать системы линей ных уравнений . Пусть СЛУ задается в
матричном виде
Ax = b,
где A ∈ M(m, n, F ), b ∈ F m , то есть имеется m уравнений от n переменных.
Заметим, что если C ∈ M(m, F ) обратима, то множества рашений систем Ax = b и (CA)x =
Cb совпадают. Дей ствительно, для произвольной C∈ M(m, F ) из Ax = b следует (CA)x = Cb,
остается применить это же наблюдение к C −1 и СЛУ (CA)x = Cb.
Мы будем упрощать матрицу A посредством элементарных преобразований строк, что,
как мы видели, реализуется в виде домножения на некоторые обратимые матрицы слева.
1. Система имеет решение тогда и только тогда, когда в последнем столбце нет ведущего
элемента.
84
2. Если решение (x1 , . . . , xn )⊤ существует, то оно имеет вид
X
xj произвольные при j ∈
/J и x j i = bi − ai,j xj .
j ∈J
/
j>ji
85
4.9 Перестановки
Обозначение 4.9.1. Обозначим n = {1, . . . , n}.
Каким образом можно описывать перестановки? Простей ший способ записи — таблич‐
ный :
1 2 ... n
σ= .
σ(1) σ(2) . . . σ(n)
Простей шими нетривиальными перестановками являются транспозиции: биекции, меняю‐
щие местами два элемента, а все остальные оставляющие на месте. Будем обозначать τij
транспозицию, меняющую местами i и j. При записи τij мы всегда будем подразумевать, что
i 6= j.
86
4.10 Определители
Определение 4.10.1. Определителем матриц размера n называется отображение
det : M(n, F ) → F,
Нашей ближай шей целью будет показать, что такое отображение существует и единствен‐
но.
Замечание 4.10.2. При перестановке двух столбцов определитель меняет знак.
Доказательство. Фиксируем все столбцы, кроме двух с номерами i и j, рассмотрим сужение
определителя на множество таких матриц и будем рассматривать его как функцию f от пары
столбцов. Из первых двух свой ств следует, что
Построим определитель рекуррентно. А именно, ясно, что для n = 1 имеется только один
способ:
det(a) = det(a · I1 ) = a · det(I1 ) = a.
Далее, предположим, что определитель для матриц размера n − 1 уже построен и положим
X
n
det(A) = (−1)1+j a1,j det(A1,j ),
j=1
где A1,j ∈ M(n − 1, F ) — матрица, полученная из A удалением первой строки и j‐го столбца.
Предложение 4.10.3. Эта конструкция удовлетворяет свой ствам определителя.
Доказательство. Линей ность достаточно проверять для каждого слагаемого отдельно. Пред‐
положим, что i‐й столбец A∗,i раскладывается в линеную комбинацию. Если i 6= j, то a1,j не
меняется, а det(A1,j зависит от i‐го столбца линей но. Если же i = j, то наоборот a1,j зависит
от i‐го столбца линей ной , а A1,j не меняется.
Пусть теперь у матрицы A столбцы с номерами i, j совпадают. Тогда
потому что при k 6= i, j у матрицы A1,k имеется два одинаковых столбца, и соответствующее
слагаемое равно 0. Для определенности будем считать, что i < j. Тогда матрица A1,i получа‐
ется из матрицы A1,j последовательной перестановкой столбцов i и i + 1, i + 1 и i + 2, …, j − 2
и j − 1. Поэтому det(A1,i ) = (−1)j−i−1 det(A1,j ), а значит, det(A) = 0.
Третье свой ство проверяется непосредственно: det(In ) = 1 · det(In−1 ) = 1.
87
Предложение 4.10.4. Отображение определителя единственно.
Рассмотрим теперь отдельное слагаемое ak,1 · det(ek |A∗,2 | . . . |A∗,n ). Можно точно таким же
образом разложить второй столбец, тогда
X
n
ak,1 · det ek |A∗,2 | . . . |A∗,n = ak,1 · ai,2 · det ek |ei |A∗,3 | . . . |A∗,n ,
i=1
где все индексы набора i1 , . . . , in различны. Иными словами, для некоторой перестановки
σ ∈ Sn верно ij = σ(j), то есть
X
det(A) = aσ(1),1 . . . aσ(n),n det eσ(1) | . . . |eσ(n) .
σ∈Sn
Если σ = τk . . . τ1 — произведение транспозиций , то матрица eσ(1) | . . . |eσ(n) получается из
In последовательностью перестановок столбцов, отвечающих транспозициям τ1 , . . . , τk , так
что ее определитель равен (−1)k = sgn(σ). Итого получаем, что значение отображения det
на каждой матрице A определено однозначно.
Замечание 4.10.5. В дей ствительности мы доказали даже чуть более общее утверждение:
если функция матриц линей на по столбцам и обращается в ноль при равенстве двух столб‐
цов, то она определена однозначно с точностью до умножения на фиксированный скаляр,
равный значению на единичной матрице.
Полученная формула
X
det(A) = sgn(σ) · aσ(1),1 . . . aσ(n),n
σ∈Sn
называется формулой полного развертывания. Рассмотрим, что эта формула дает в случаях
n = 2 и n = 3.
В случае n = 2 существует только две перестановки двух элементов — тождественное
отображение и одна транспозиция, соответственно знаков 1 и −1. Тогда
a b
c d = ad − cb.
88
В случае n = 3 имеется 6 перестановок:
Здесь мы воспользовались тем, что sgn(σ −1 ) = sgn(σ) (сочетание Следствия 4.9.8 и Замеча‐
ния 1.5.19).
Следствие 4.11.2. Формулу полного развертывания можно переписать следующим обра‐
зом: X
det(A) = sgn(σ) · a1,σ(1) . . . an,σ(n)
σ∈Sn
Следствие 4.11.3. При перестановке двух строк матрицы определитель меняет знак.
Доказательство. Перестановка строк матрицы может быть реализована как последователь‐
ность из транспонирования, перестановки столбцов и еще одного транспонирования.
Следствие 4.11.4 (Разложение определителя по строке и по столбцу).
X
n X
n
det(A) = (−1)i+j aij det(Aij ) = (−1)i+j aij det(Aij ),
j=1 i=1
89
Доказательство. Пусть A = . . . |ai | . . . |aj | . . . , тогда в силу линей ности по столбцам
det . . . |a + λaj | . . . |aj | . . . = det(. . . |ai | . . . |aj | . . .) + λ · det . . . |aj | . . . |aj | . . . .
Первое слагаемое равно det(A), а второе равно 0, поскольку дважды встречается столбец aj .
Аналогичный результат для строк достигается транспонированием.
Замечание 4.11.6. При домножении строки или столбца на скаляр λ определитель домно‐
жается на λ.
Предложение 4.11.7. Матрица A ∈ M(n, F ) обратима тогда и только тогда, когда det(A) 6= 0.
Доказательство. Матрицу A можно привести к строчной эшелонированной форме посред‐
ством элементарных преобразований . При этом определитель только домножается на нену‐
левые скаляры. Если матрица A обратима, то по Замечанию 4.8.6 ее строчная эшелонирован‐
ная форма равна единичной матрице, которая имеет определитель 1. У необратимой матри‐
цы в строчной эшелонированной форме есть нулевая строка, так что ее определитель тоже
равен 0.
Предложение 4.11.8. Пусть A ∈ M(m, F ), B ∈ M(n, F ), X ∈ M(m, n, F ). Тогда определитель
B ) равен det(A) · det(B).
блочной матрицы ( A0 X
Доказательство. Фиксируем матрицы X и B и рассмотрим функцию
A X
f : M(m, F ) → F, f (A) = det
0 B
Ясно, что эта функция линей ная по столбцам и обращается в ноль при равенстве двух сто‐
люцов матрицы A. Значит, она единственна с точностью до домножения на скаляр, то есть
определяется значением на какой ‐то одной фиксированной матрице, например, единичной :
f (A) = det(A) · f (Im ).
Остается вычислить f (Im ). По определению
I X
f (Im ) = det m .
0 B
Разложение по первому столбцу дает равенство
Im X I X′
det = det m−1 ,
0 B 0 B
где X ′ получается из X вычеркиванием первой строки. Повторяя так m раз, получаем, что
f (Im ) = det(B).
Предложение 4.11.9. Определитель мультипликативен, то есть det(AB) = det(A) · det(B)
для A, B ∈ M(n, F ).
Доказательство. Фиксируем матрицу A и рассмотрим функцию
f : M(n, F ) → F, f (B) = det(AB).
Если у матрицы B совпадают столбцы с номерами i и j, то есть B∗,i = B∗,j , то то же самое
верно и для матрицы AB, так как (AB)∗,k = A · B∗,k . Если в матрице B столбец с номером
i имеет вид λa + µb, то в матрице AB столбец с тем же номером имеет вид λAa + µAb. По‐
этому функция f линей на по столбцами и обращается в ноль при равенстве столбцов. Сле‐
довательно, она пропорциональна определителю: f (B) = det(B) · f (In ). Но по определению
f (In ) = det(A).
Следствие 4.11.10. Если матрица A обратима, то det(A−1 ) = det(A)−1 .
90
4.12 Формулы Крамера и присоединенная матрица
Рассмотрим систему линей ных уравнений Ax = b с квадратной матрицей A ∈ M(n, F ). Пусть
матрица A составлена из столбцов A = a1 | . . . |an , и пусть x = (x1 , . . . , xn )⊤ — решение.
Теорема 4.12.1 (Формулы Крамера).
xi · det(A) = det a1 | . . . |ai−1 |b|ai+1 | . . . |an .
Доказательство.
X
det a1 | . . . |ai−1 |b|ai+1 | . . . |an = det a1 | . . . |ai−1 | xj aj |ai+1 | . . . |an
j
X
= xj · det a1 | . . . |ai−1 |aj |ai+1 | . . . |an
j
= xi · det a1 | . . . |ai−1 |ai |ai+1 | . . . |an = xi · det(A).
При det(A) 6= 0 эти соотношения позволяют явно описать решения СЛУ, в частности, до‐
ставляют формулу для обратной матрицы.
Пусть A ∈ M(n, F ) обратима. Обозначим A−1 = (cij ). Тогда j‐й столбец A−1 это решение
СЛУ Ax = (In )∗,j = ej . Формулы Крамера дают тогда соотношения
cij · det(A) = det a1 | . . . |ai−1 |ej |ai+1 | . . . |an .
Формулу для обращения матрицы 2 × 2 мы уже видели в другом контексте — в связи с нахождением преобразо‐
вания, обратного к дробно‐линей ному. В дей ствительно, дробно‐линей ные преобразования можно рассматривать
как комплексные матрицы размера 2 с точностью до умножения на скаляр (и формула для композиции дробно‐
линей ных преобразований тогда превращается в умножение матриц). Обратимые дробно‐линей ные преобразова‐
ния тогда задаются обратимыми матрицами (обратимость не зависит от домножения на ненулевой скаляр), а обра‐
тимость матрицы отвечает необращению определителя в 0, см. Предложение 3.7.3. Предложение 3.7.2 тоже можно
истолковать в матричных терминах: всякая матрица 2 × 2 записывается в виде произведения четырех матриц эле‐
ментарных преобразований (с точностью до умножения на скаляр): например, при c 6= 0
3
c a bc − ad 0 0 1 c d ac bc3 a b
= = c 3
· .
0 c 0 c2 1 0 0 c c4 dc3 c d
В случае c = 0 такое представление выглядит еще проще:
1 b a 0 a b
= .
0 d 0 1 0 d
91
Предложение 4.12.5. A · adj(A) = adj(A) · A = det(A) · In .
Доказательство. Понятно, что достаточно доказывать только одну из формул (вторая по‐
лучается транспонированием первой формулы для транспонированных матриц).
Зафиксируем пару индексов i, j и проверим, что (A · adj(A))ij = δij · det(A). Дей ствительно,
X
n X
n
(A · adj(A))ij = aik · adj(A)kj = aik · (−1)k+j det(Ajk ).
k=1 k=1
При i = j выражение в правой части совпадает с разложением по i‐й строке и дает det(A).
При i 6= j рассмотрим матрицу A′ = (a′ij ), полученную заменой j‐ю строки матрицы A на ее
i‐ю строку. Тогда для любых индексом j, k имеется равенство A′jk = Ajk (измененная строка
удалена). С другой стороны, det(A′ ) = 0, а разложение по j‐й строке дает
X
n X
0= (−1)j+k a′jk det(A′jk ) = (−1)j+k aik det(Ajk ).
k=1 k=1
Раскладывая определитель в правой части по первой строке и вынося из каждой строки об‐
щий множитель, получаем
Y
V (x1 , . . . , xn ) = (xi − x1 ) · V (x2 , . . . , xn ).
i>1
92
Пусть x0 , x1 , . . . , xn — различные элементы поля F , и пусть заданы y0 , y1 , . . . , yn ∈ F . Ин‐
терполяционная задача состоит в отыскании такого многочлена f ∈ F [x], что deg(f ) 6 n и
для всех i имеется равенство f (xi ) = yi . Запишем
f = ξ0 + ξ1 x + ξ2 x2 + . . . + ξn xn .
ξ0 + ξ1 xi + . . . + ξn xni = yi .
Определитель этой СЛУ это в точности определитель Вандермонда V (x0 , . . . , xn ). Так как все
xi различны, этот определитель не равен 0, так что матрица системы обратима и СЛУ имеет
единственное решение.
93
5 Линейные операторы
Сфокусируемся теперь на изучении структуры линейных операторов, то есть линей ных отоб‐
ражений векторного пространства в себя. Будем обозначать Hom(V ) = Hom(V, V ).
94
Пример 5.1.9. Пусть V — евклидова плоскость с базисом e1 , e2 , а φ — поворот на угол θ (про‐
тив часовой стрелки), тогда
cos θ − sin θ
φe = ,
sin θ cos θ
t − cos θ sin θ
χφ = = (t − cos θ)2 + sin2 θ = t2 − 2t cos θ + 1.
− sin θ t − cos θ
На деле это вычисление проделывать не требуется, так как известно, что ранг этой матри‐
цы не максимален (не превосходит 2) и не равен 0, так что обязательно равен единице и
тем самым можно просто оставить одну строку. Решением СЛУ с такой матрицей служат все
векторы вида
±ia
, a ∈ C соответственно для с.ч. λ = cos θ ± sin θ.
a
Ясно, что никакой такой столбец не может быть вещественными, поэтому в строгом смыс‐
ле у оператора φ нет собственных вектором и собственных чисел, но часто полезно иметь
информацию о собственных числах и векторах в таком расширенном смысле.
В случае sin θ = 0 отображение φ это либо тождественное преобразование, либо поворот
на угол π, то есть отражение относительно начала координат. В этом случае единственное
собственное число это соответственно 1 или −1, и все ненулевые векторы являются соб‐
ственными.
Обратите также внимание, что собственное число матрицы поворота оказалось равным комплексному числу,
домножение на которое дей ствует как поворот на тот же угол. Это связано с тем, что комплексные числа можно
реализовать как вещественные матрицы 2 × 2 специального вида, а именно,
a b
a + bi ! .
−b a
Легко проверить, что сумме и произведению комплексных чисел отвечает сумма и произведение таких матриц,
комплексное сопряжение реализуется как транспонирование, а квадрат модуля вычисляется как определитель.
В некоторых случаях, впрочем, можно гарантировать, что все собственные числа окажутся
вещественными.
Предложение 5.1.10. Пусть A ∈ M(n, R) симметрическая, то есть A⊤ = A. Тогда все соб‐
ственные числа A вещественные.
95
Доказательство. Для матриц X ∈ M(m, n, C) (в частности, для столбцов) будем обозна‐
чать через X результат покомпонентного применения комплексного сопряжения. Ясно, что
⊤
X = X ⊤ и для любой матрицы Y подходящего размера XY = X · Y .
Заметим, что для любого u ∈ Cn число u⊤ · u вещественное: если u = (z1 , . . . , un )⊤ , то
u⊤ · u = z1 z1 + . . . + zn zn = |z1 |2 + . . . + |zn |2 ∈ R.
При этом эта величина неотрицательная и равна 0 только для u = 0.
Пусть теперь v 6= 0 — собственный вектор, отвечающий собственному числу λ, то есть
Av = λv. Тогда
⊤
Av · Av = v ⊤ A⊤ Av = v ⊤ · A2 v = λ2 · v ⊤ v.
Тем самым λ2 выражается как частное двух неотрицательных вещественных чисел, а тогда
λ вещественное.
Характеристический многочлен доставляет также средство находить линей ные зависи‐
мости между степенями данной квадратной матрицы.
Определение 5.1.11. Пусть f ∈ F [x] и A ∈ M(n, F ). Значением f = c0 + c1 x + . . . + cm xm на
A называется
f (A) = c0 In + c1 A + . . . + cm Am .
Ясно, что как и для обычного значения многочлена, (f + g)(A) = f (A) + g(A), (f g)(A) =
f (A)g(A) и (λf )(A) = λf (A) (для доказательства необходимо дополнительно воспользо‐
ваться тем, что Ar As = As Ar ).
Теорема 5.1.12 (Гамильтона—Кэли). χA (A) = 0.
Доказательство. Пусть A ∈ M(n, F ) и χA (t) = tn + cn−1 tn−1 + . . . + c1 t + c0 . Положим B =
adj(tIn − A), тогда
(tIn − A) · B = det(tIn − A) · In = χA · In .
Элементы матрицы B — многочлены от переменной t, причем их степени не превосходят
n − 1. Дей ствительно, каждый элемент B это, с точностью до знака, определитель матрицы
порядка n−1, составленной из многочленов степени 6 1, причем в каждой строке не больше
одного не‐константного многочлена. Тогда можно представить B в виде
B = B0 + tB1 + . . . + tn−1 Bn−1 , где Bi ∈ M(n, F ).
Тогда формула выше может быть переписаа следующим образом:
96
Следствие 5.1.13. Пусть A ∈ M(n, F ), тогда dimhIn , A, A2 , . . .i 6 n.
Доказательство. Покажем, что In , A, A2 , . . . , An−1 — порождающий набор для данного под‐
пространства. Это в точности означает, что Ak выражается в виде f (A) для некоторого f ∈
F [x] степени 6 n−1. Поделим xk на χA с остатком: xk = χA ·q +r, deg(r) < deg(χA ) = n. Тогда
вычисление значений на A дает Ak = χA (A) · q(A) + r(A) — по теореме Гамильтона—Кэли
Ak = r(A), то есть можно положить f = r.
Определение 5.1.14. Алгебраической кратностью собственного числа λ оператора φ назы‐
вается его кратность как корня χφ . Геометрической кратностью называется размерность
Ker(λ id −φ), то есть максимальное количество линей но независимых собственных ветко‐
ров, отвечающих λ.
Предложение 5.1.15. Геометрическая кратность собственного числа λ оператора φ не пре‐
восходит его алгебраической кратности.
Доказательство. Пусть геометрическая кратность равна k, то есть существуют k линей но
независимых собственных вектором v1 , . . . , vk , отвечающих λ. Дополним их векторами vk+1 , . . .
до базиса всего пространства, тогда матрица оператора φ в базисе v имеет вид
λIk B
φv = .
C
Тогда χφ = χφv = χλIk · χC = (t − λ)k · χC и алгебраическая кратность λ не меньше k.
Определение 5.1.16. Следом матрицы A ∈ M(n, F ) называется сумма ее диагональных эле‐
ментов: tr(A) = a11 + a22 + . . . + ann .
Предложение 5.1.17. След матрицы равен сумме ее собственных чисел с учетом кратности.
Более точно, если A ∈ M(n, F ) и λ1 , . . . , λn — ее собственные числа (возможно, с повторами),
то tr(A) = λ1 + . . . + λn .
Доказательство. Рассмотрим характеристический многочлен χA . Так как собственные чис‐
ла это его корни, χA = (t−λ1 ) . . . (t−λn ), так что коэффициент при tn−1 равен −(λ1 +. . .+λn ).
С другой стороны, прямое вычисление показывает, что
χA = det(tIn − A) = tn − tn−1 (a11 + a22 + . . . + ann ) + слагаемые меньших степеней .
Дей ствительно, в формуле полного развертывания имеется слагаемое вида
(t − a11 )(t − a22 ) . . . (t − ann ),
а все остальные слагаемые имеют степень не больше n − 2, так как выбор одного внедиа‐
гонального элемента исключает из произведения диагональные элементы в соответству‐
ющих строке и столбце. Сравнивая два выражения для коэффициента при tn−1 , получаем
искомое утверждение.
Лемма 5.1.18. Пусть A⊤ = A ∈ M(n, R), а λ ∈ R — собственное число A. Если (A − λI)k x = 0,
то (A − λI)x = 0.
Доказательство. Если (A − λI)2 x = 0, то
⊤
0 = x⊤ · (A − λI)2 x = A − λI)x · (A − λI)x,
так что (A − λI)x = 0. Для k > 2 положим y = (A − λI)k−2 x, и по предыдущему рассуждению
получаем, что (A − λI)y = 0, то есть (A − λI)k−1 x = 0. Продолжаем, пока не дой дем до
(A − λI)x = 0.
97
Предложение 5.1.19. Пусть A ∈ M(n, R), A⊤ = A, а λ1 , . . . , λs ∈ R — все ее различные
собственные числа. Положим f = (t − λ1 ) . . . (t − λs ). Тогда f (A) = 0.
Доказательство. По теореме Гамильтона—Кэли χA (A) = 0, причем
χA = (t − λ1 )m1 . . . (t − λs )ms .
Применим предыдущую лемму для x = (A−λ2 I)m2 . . . (A−λs I)ms v, получим, что (A−λ1 I)x =
0. Теперь, поскольку все матрицы в этом произведении коммутируют, переставим множи‐
тель (A − λ1 I) в конец и повторим для λ2 . Продолжая так, получаем, что f (A) = 0.
Собственные числа матрицы смежности часто называют просто собственными числами гра‐
фа.
В дей ствительности для вещественных симметрических матриц геометрическая кратность собственных чисел
всегда совпадает с алгебраической .
Пример 5.2.3. Рассмотрим Kn — полный граф на n точках, имеющий n вершин, где любые
две различные вершины соединены ребром. Тогда
n−1 −1
Spec Kn = .
1 n−1
Дей ствительно, матрица смежности AKn имеет нули на диагонали и единицы на всех вне‐
диагональных позициях. Тогда (1, . . . , 1)⊤ — собственный вектор для собственного числа
98
n − 1, а
−1 0 0
1 −1 ..
.
0 1
, ,..., 0
.. 0
. −1
..
0 . 1
доставляют n − 1 линей но независимыый собственный вектор для собственного числа −1.
Определение 5.2.4. Характеристическим многочленом χΓ графа Γ называется характери‐
стический многочлен его матрицы смежности AΓ .
Предложение 5.2.5. Пусть χΓ = tn + cn−1 tn−1 + cn−2 tn−2 + . . . + c0 . Тогда cn−1 = 0 и cn−2 =
−|EΓ|.
Доказательство. Все собственные числа AΓ вещественные, так что χΓ = (t − λ1 )m1 . . . (t −
λs )ms . Тогда сумма m1 λ1 + . . . + ms λs равна следу матрицы смежности, но tr(AΓ ) = 0, так как
у графа нет петель.
Рассмотрим теперь коэффициент cn−2 при tn−2 . В формуле полного развертывания слага‐
емые степени > n − 2 возникают только двумя способами: либо
99
Доказательство. Пусть A = AΓ , рассмотрим матрицы I, A, A2 , . . . , Ad . Докажем, что они ли‐
ней но независимы. Пусть
µ0 I + µ1 A + . . . + µd Ad = 0.
Поскольку диаметр Γ равен d, существует некий путь длины d, который нельзя укоротить.
Пусть он проходит по вершинам с номерами i0 , i1 , . . . , id . Тогда у матрицы Ad в позиции (i0 , id )
стоит ненулевой элемент, а у меньших степеней A там стоит ноль (так как нет более корот‐
кого пути, соединяющего эти вершины). Значит, µd A = 0. Аналогично, в позиции (i0 , id−1 )
матрицы Ad−1 стоит ненулевое число, а у меньших степеней ноль, так что µd−1 = 0. Продол‐
жая таким же образом, получаем, что все µi = 0.
Отсюда мы заключаем, что если f (A) = 0 для какого‐то ненулевого f ∈ F [x], то deg(f ) >
d + 1.
С другой стороны, если λ1 , . . . , λs — полный список различных собственных чисел A, то по
предыдущей лемме для g(t) = (t − λ1 ) . . . (t − λs ) выполнено g(A) = 0, так что s > d + 1.
Определение 5.2.10. Граф Γ называется двудольным, если V Γ = V1 ∪ V2 , V1 ∩ V2 = ∅, вер‐
шины из V1 могут быть соединены только с вершинами из V2 и наоборот.
Покажем, что замена знака у второй половины собственного вектора дает собственный век‐
тор, отвечающий −λ:
0 B u −Bv −λu u
= = = −λ .
B⊤ 0 −v B⊤u λv −v
100
Определение 5.3.1. Оператор называется диагонализируемым, если его матрица в каком‐
то базисе диагональна. Матрица такого оператора в любом базисе также называется диаго‐
нализируемой . Иными словами, матрица A называется диагонализиуемой , если существует
такая обратимая матрица C, что C −1 AC диагональная.
Диагональные матрицы хороши, кроме прочего, тем, что их очень просто подставлять в
многочлены, а именно, если A = diag(a1 , . . . , an ), то f (A) = diag(f (a1 ), . . . , f (an )). Это можно
применить и к диагонализируемым матрицам: если D = C −1 AC диагональна, то f (A) =
f (CDC −1 ) = Cf (D)C −1 .
Сей час мы выясним, что можно сказать о недиагонализиуемых матрицах. Задачу можно
разбить на две части: как най ти хорошо устроенную матрицу, сопряженную с данной , и как
эффективно проводить вычисления с такими матрицами.
dim(Im α ∩ Ker β) = dim Im(α) − dim Im(β ◦ α) = dim Ker(β ◦ α) − dim Ker(α).
dim Im(β ◦ α) = dim V − dim Ker(β ◦ α) и dim Im(α) = dim V − dim Ker(α).
101
этом базисе будут отличаться на скалярную матрицу λIn ). Рассмотрим последовательность
подпространств
V = Im ψ 0 > Im ψ 1 > Im ψ 2 > . . .
Так как пространство V конечномерно, в какой ‐то момент эта последовательность стабили‐
зируется, то есть най дется такое m, что Im ψ m+1 = Im ψ m 6= Im ψ m−1 — как только простран‐
ства Im ψ m и Im ψ m+1 совпали, совпадут и все последующие, так как Im ψ m+1 = ψ(Im ψ m ).
Тогда
Im ψ m ∩ Ker ψ = 0 и Im ψ m−1 ∩ Ker ψ 6= 0
(это отвечает инъективности и неинъективности сужения ψ на Im ψ m и на Im ψ m−1 , см. Пред‐
ложения 4.3.25 и 4.3.26). В частности, ψ m (Im ψ m ) = Im ψ m .
Пусть Ui = Im ψ i−1 ∩ Ker ψ. Тогда
Выберем в пространстве Um базис x11 , . . . , x1np . Так как x1i ∈ Im ψ m−1 , то x1i = ψ m−1 (xm
i ) для
m k m−k m
некоторого вектора xi . Определим векторы xi = ψ (xi ).
Дополним теперь векторы x1i до базиса Um−1 векторами y11 , . . . , yn1 m−1 . Для каждого j най ‐
дем такой вектор yjm−1 , что yj1 = ψ m−2 (yjm−1 ), и положим yjk = ψ m−k−1 (yjm−1 ). Затем допол‐
ним x1i , yj1 до базиса Um−2 векторами z11 , . . . , zn1 m−2 и так далее. Итого получаем следующую
конфигурацию векторов:
xm
i
↓
xm−1
i yjm−1
↓ ↓
xm−2
i yjm−2 zkm−2
↓ ↓ ↓
.. .. .. ..
. . . .
↓ ↓ ↓ ···
x2i yj2 zk2 ··· a2s
↓ ↓ ↓ ··· ↓
x1i yj1 zk1 ··· a1s b1t
↓ ↓ ↓ ··· ↓ ↓
0 0 0 ··· 0 0
Здесь каждый столбец отвечает сразу набору цепочек векторов, занумерованному индексом
i, j, k, . . . , s, t соответственно, а стрелки обозначают применение оператора ψ.
Если индекс i изменяется от 1 до I, индекс j в пределах от 1 до J и так далеее, то общее
количество векторов равно
mI + (m − 1)J + (m − 2)K + . . . + 2S + T =
= I + (I + J) + (I + J + K) + . . . + (I + J + . . . + S + T ) =
= dim Um + dim Um−1 + dim Um−2 + . . . + dim U1 .
102
Так как по Лемме 5.3.3
dim Uk − dim Uk+1 = (dim Ker ψ k − dim Ker ψ k−1 ) − (dim Ker ψ k+1 − dim Ker ψ k )
= 2 dim Ker ψ k − dim Ker ψ k−1 − dim Ker ψ k+1
= rk ψ k−1 − 2 rk ψ k + rk ψ k+1 .
103
. . . + tk Zk , зависящую от параметров t1 , . . . , tk . Ее обратимость при данных значениях пара‐
метров эквивалентна необращению в ноль определителя. Положим
f (t1 , . . . , fk ) = det(t1 Z1 + . . . + tk Zk ) ∈ R[t1 , . . . , tk ].
Многочлен f принимает какие‐то ненулевые значения при подходящих комплексных значе‐
ниях переменных (так как P ∈ W ), следовательно, многочлен не является нулевым и при‐
нимает ненулевые значения и при вещественных значениях переменных.
Покажем формально, что многочлен f ∈ R[t1 , . . . , tk ], принимающий ненулевые значения при каких‐то ком‐
плексных значениях переменных, не обращается тождественно в 0 при вещественных значениях переменных. Про‐
ведем индукцию по k. База доставляется малой теоремой Безу. При k > 1 рассмотрим ;а; как многочлен одной
переменной t1 с коэффициентами в поле рациональных функций о переменных t2 , . . . , tk :
f ∈ R(t2 , . . . , tk )[t1 ].
Так как многочлен ненулевой , у него есть ненулевое значение (в R(t2 , . . . , tk )) при каком‐то вещественном зна‐
чении t1 (иначе по теореме об интерполяции f был бы нулевым — также снова можно воспользоваться малой
теоремой Безу). К полученному ненулевому значению (зависящему от k − 1 переменной ) можно применить индук‐
ционное предположение.
Более точно, для вещественных матриц имеет место «вещественная жорданова форма». А
именно, определим Jk∗ (λ) как матрицу 2k × 2k, полученную из Jk (λ) заменой каждого ком‐
x y
плексного числа x + iy блоком −y x . Тогда для любой матрицы A ∈ M(n, R) най дется такая
C ∈ M(n, R)∗ , что CAC −1 блочно‐диагональная с блоками либо вида Jk (λ), λ ∈ R, либо вида
Jk∗ (λ), λ ∈ C \ R.
104
Таким образом, Jk (λ)n верхне‐треугольная, на каждой из диагоналей все элементы совпада‐
ют, а первая строка имеет вид
n
Jk (λ)n 1,∗ = λn , nλn−1 , n(n − 1)/2 · λn−2 , . . . , λn−k+1 .
k−1
Вообще для аналитической функции f (то есть совпадающей со своим рядом Тей лора, на‐
пример, для многочлена) из формулы Тей лора следует следующее широкое обобщение: мат‐
рица f (Jk (λ)) верхне‐треугольная, на каждой из диагоналей все элементы совпадают, а пер‐
вая строка равна
f ′′ (λ) f (k−1) (λ)
f Jk (λ) = f (λ), f ′ (λ), ,..., .
1,∗ 2 (k − 1)!
Это следствие легко доказать и непосредственно, не обращаясь к жордановой форме. А именно, если det(λI −
A) = 0, то det(f (λ)I −f (A)) = det(f (λI)−f (A)) = 0. Чтобы это увидеть, покажем, что f (λI)−f (A) = (λI −A)g(A)
для некоторого многочлена g. Это условие является линей ным, а для мономов проверяется напрямую:
(λI)n − An = (λI − A)(An−1 + λAn−2 + . . . + λn−1 I).
Ранее мы уже видели, что у каждой матрицы A есть нетривиальный многочлен, ее анну‐
лирующий , а именно χA (см. Теорему 5.1.12). С другой стороны, иногда, как, например, для
вещественных симметрических матриц, есть и многочлен меньше степени, см. Предложе‐
ние 5.1.19.
Определение 5.4.2. Нетривиальный многочлен со старшим коэффициентом 1, аннулирую‐
щий данную матрицу и имеющий наименьшую возможную степень, называется минималь‐
ным многочленом данной матрицы.
Замечание 5.4.3. Минимальный многочлен существует и единственный .
µA = (t − λ1 )m1 · . . . · (t − λk )mk .
105
Предложение 5.4.6. Пусть A ∈ M(n, C). Тогда A и A⊤ сопряжены.
106
6 Билинейная алгебра
6.1 Билинейные формы и скалярные произведения
В евклидовой геометрии скялярное произведение двух векторов u, v определяется как |u| ·
|v| · cos θ, где θ — угол между u и v. Это понятие оказывается весьма полезным, но требует
для своего определения и понятие длины вектора, и понятие угла между векторами (точнее,
косинуса этого угла). Альтернативный путь — сначала определить скалярное произведение,
а уже на его основе ввести длину и угол.
Определение 6.1.1. Билинейной формой на векторном пространстве V (над полем F ) назы‐
вается отображение B : V × V → F , линей ное по каждому из аргументов, то есть
Примеры 6.1.2.
1. (u, v) 7→ |u||v| cos θ из обсуждения выше;
B(u, v) = u⊤
e · B e · ve .
107
Предложение 6.1.6. Пусть e, f — два базиса V . Тогда Bf = Cf⊤→e · Be · Cf →e .
С другой стороны, если 2 6= 0 в базовом поле F , то симметрическая такая билиней ная форма
BQ восстанавливается по Q = QB однозначно, а именно
1
BQ (u, v) = Q(u + v) − Q(u) − Q(v) .
2
Такая билиней ная форма называется поляризацией квадратичного отображения Q.
BQ билиней ная, так как ее можно выразить через исходную форму B следующим образом:
1 1
BQ (u, v) = B(u + v, u + v) − B(u, u) − B(v, v) = B(u, v) + B(v, u) .
2 2
С другой стороны BQ (v, v) = 12 Q(2v) − 2Q(v) = Q(v).
Докажем единственность. Пусть B(v, v) = C(v, v) для всех v. В частности, B(u + v, u +
v) = C(u + v, u + v), иными словами (после раскрытия по билиней ности и использования
симметричности)
108
Определение 6.2.1. Отображение Q : V → F называется квадратичной формой, если оно
квадратично и его поляризация является билиней ной формой .
Определение 6.2.2. Матрицей Грама квадратичной формы называется матрица Грама ее
поляризации.
Выше мы видели, что с квадратичным отображением связано также полиномиальное вы‐
ражение. После выбора в пространстве V (размерности n) базиса можно отождествить квад‐
ратичную форму Q с однородным многочленом степени 2 (от n переменных) следующим
образом.
Пусть B — матрица грама Q в базисе e. Положим
X
n
q(x1 , . . . , xn ) = Bi,j xi xj .
i,j=1
Ясно, что в этом определении можно использовать любую матрицу, но ее всегда можно по‐
лагать симметрической , заменив при необходимости на (B + B ⊤ )/2 — многочлен при этом
не изменится. При этом для вектора v со столбцом координат (a1 , . . . , an )⊤ значение Q(v)
можно вычислить как q(a1 , . . . , an ).
2 2 1 1/2
Пример 6.2.3. Однородному многочлену x + xy + y соответствует матрица 1 .
/2 1
Пример 6.2.4. Пусть V = R2 . Отображение (x, y)⊤ 7→ max(xy, 0) является квадратичным, но
не является квадратичной формой .
109
2. Пусть теперь Aii 6= 0, чего всегда можно добиться с помощью предыдущего шага. Для
удобства обозначений будем считать, что i = 1 (кроме того, можно перенумеровать
переменные). Рассмотрим слагаемые, содержащие x1 , и выделим полный квадрат:
1
A11 x21 + 2A12 x1 x2 + . . . + 2A1n x1 xn = (A11 x1 + . . . + A1n xn )2 − q ′ ,
A11
U ⊥ = {v ∈ V | ∀u ∈ U v ⊥ u} .
Замечание 6.3.4. U ⊥ 6 V .
110
Доказательство. Если v, w ∈ U ⊥ , то для любых λ, µ ∈ F и для любого u ∈ U выполнено
B(λv + µw, u) = λB(v, u) + µB(w, u) = 0.
Замечание 6.3.5. Если B невырожденная, то U ∩ U ⊥ = 0.
Предложение 6.3.6. Если B — невырожденная симметрическая билиней ная форма на ко‐
нечномерном пространстве B, то V = U ⊕ U ⊥ .
Доказательство. Пусть u1 , . . . , uk — базис U . Тогда v ∈ U ⊥ тогда и только тогда, когда B(v, u1 ) =
. . . = B(v, uk ) = 0. Это позволяет выразить U ⊥ как ядро линей ного отображения V 7→ F k :
⊤
U ⊥ = Ker v 7→ B(v, u1 ), . . . , B(v, uk ) .
Заметим, что это отображение сюръективно (для каждого i существует такой v, что B(v, ui ) 6=
0 и B(v, uj ) = 0 при j 6= i, то есть стандартный базис F k лежит в образе). Тогда по теореме
о размерности ядра и образа dim(U ) + dim(U ⊥ ) = dim(V ). Поскольку в силу предыдущего
замечания U ∩ U ⊥ = 0, сумма U + U ⊥ прямая и потому имеет размерность, равную сумме
размерностей слагаемых, так что совпадает со всем V .
Теорема 6.3.7. Для любой симметрической билиней ной формы B на конечномерном про‐
странстве V существует ортогональный базис.
Доказательство. Сначала сведем задачу к случаю невырожденной формы. Для этого рас‐
смотрим подпространство V ⊥ (называемое радикалом формы B). Дополним его прямым сла‐
гаемым U , тогда объединение ортогонального базиса U и любого базиса V ⊥ дает ортого‐
нальный базис V . Тем самым достаточно най ти ортогональный базис U относительно невы‐
рожденной формы B|U .
Будем теперь считать, что B невырожденная. Будем вести доказательство индукцией по
n = dim(V ). Случай n = 1 тривиален (любой базис одномерного пространства ортогонален).
Предположим, что n > 1. Поскольку B 6≡ 0, то най дется такой вектор e1 , что B(e1 , e1 ) 6= 0.
Тогда V = he1 i ⊕ he1 i⊥ . По индукционному предположению в пространстве he1 i⊥ (имеющем
размерность n − 1) най дется ортогональный базис e2 , . . . , en . Тогда e1 , e2 , . . . , en — ортого‐
нальный базис V .
Пусть e1 , . . . , en — базис V , и обозначим A = Be . Рассмотрим подпространства Vk = he1 , . . . , ek i
(в частности, V0 = 0). Тогда (B|Vk )e = (Aij )ki,j=1 = Ak (то есть подматрица A размера k × k,
раcположенная в левом верхнем углу). В частности, An = A и A1 = B(e1 , e1 ) .
Обозначим ∆k = det(Ak ) (в частности, ∆0 = 1). Эти определители называются угловыми
минорами.
Теорема 6.3.8 (диагонализация по Якоби).
Если ∆1 , ∆2 , . . . , ∆n 6= 0, то существует такой ортогональный базис f1 , . . . , fn , что fk ∈
ek + Vk−1 и B(fk , fk ) = ∆∆k−1k
.
111
Поскольку искомый базис должен быть ортогональным, должны выполняться равенства
X
n−1
0 = B(fn , fi ) = B(en , fi ) + λj B(fj , fi ) = B(en , fi ) + λi B(fi .fi ).
j=1
e2 − pre1 (e2 )
e2
Можно положить f1 = e1 , тогда для получения нужного вектора f2 можно вычесть из e2 его
проекцию на прямую, порожденную e1 . Проекция pre1 (e2 ) определяется как такое кратное
e1 , что при вычитании его из e2 получается вектор, ортогональный e1 . То есть pre1 (e2 ) = λe1 ,
B(e1 ,e2 )
где λ таково, что B(e1 , e2 − λe1 ) = 0 — отсюда λ = B(e 1 ,e1 )
.
Аналогично, если имеется три вектора e1 , e2 , e3 , из вектора e3 легко получить вектор, ор‐
тогональный e1 , e2 и находящий ся в том же трехмерном подпространстве — надо просто вы‐
честь из e3 его проекцию на плоскость he1 , e2 i. Последнее особенно просто, если e1 ⊥ e2 (чего
мы можем добиться, не меняя плоскость!) — надо вычесть из e3 проекции на e1 и e2 . Понятно,
как эта схема переносится на большее количество векторов. Такая интерпретация изложен‐
ной процедуры построения ортогонального базиса называется ортогонализацией Грама—
Шмидта. Как видно из теоремы о диагонализации по Якоби, для ее выполнимости требует‐
ся, чтобы в исходном базисе e1 , . . . , en все угловые миноры матрицы Грама были ненулевыми
— в частности, это выполнено, если билиней ная форма является скалярным произведением
(см. следующий раздел, хотя по процедуре и так видно, что делить надо только на B(v, v)).
Рассмотрим теперь, что описанная процедура означает в терминах матрицы Грама. Если в
диагонализации по Лагранжу на k‐м шаге подвергались изменениям все базисные векторы,
кроме первых k, то теперь, наоборот, на k‐м шаге меняется только k + 1‐й базисный вектор.
При этом обнуляться будут не элементы очередных строки и столбца, а только лишь часть
строки и столбца, принадлежащие угловой подматрице.
6.4 Классификация
Изучим теперь вопрос, однозначно ли определены диагональные элементы матрицы Гра‐
ма диагонализированной билиней ной формы. Вообще говоря, ответ на этот вопрос отрица‐
тельный — как минимум можно изменить порядок, в котором базисные векторы входят в
112
базис (что меняет порядок следования диагональных элементов), и домножить любой ба‐
зисный вектор на ненулевой скаляр λ (тогда соответствующий диагональный элемент до‐
множится на λ2 ).
В некоторых случаях указанных возможностей хватает, чтобы однозначно описать (с точ‐
ностью до замены базиса) все квадратичные формы. Например, если F = C, то любой скаляр
либо равен 0, либо является квадратом комплексного числа.
113
Определение 6.4.5. Числа k и l называются положительным и отрицательным индексами
инерции формы Q, а пара (k, l) — сигнатурой.
Можно также сказать, что отрицательный индекс инерции опредяется как максимальная размерность подпро‐
странства, ограничение на которое формы Q отрицательно определено, или, что то же самое, как положительный
индекс инерции формы −Q.
114
Геометрический смысл состоит в том, что домножение на ортогональную матрицу дей ‐
ствует как движение, сохраняющее начало координат, то есть поворотами и отражениями.
Это значит, что вещественную квадратичную форму можно привести к диагональному виду
одними только поворотами. Такая процедура называется приведением к главным осям.
115
7 Теория полей
7.1 Простые расширения полей
Определение 7.1.1. Пусть F и K такие поля, что F ⊆ K. Тогда поле K называется расшире‐
нием поля F .
√
Примеры 7.1.2. Q ⊂ R ⊂ C, Q ⊂ Q[ 2], F ⊂ F (x).
Определение 7.1.3. Пусть f
g ∈ F (x). Можно считать, что f, g ∈ F [x] таковы, что f ⊥ g. Если
a ∈ F таково, что g(a) 6= 0, то определено значение f
g в точке a:
f f (a)
(a) = .
g g(a)
f1 (α) f2 (α) f1 f2
Замечание 7.1.11. Пусть α трансцендентный . Если g1 (α) = g2 (α) , то g1 = g2 .
Доказательство. f1 (α)g2 (α) = f2 (α)g1 (α), откуда (f1 g2 − f2 g1 )(α) = 0, что возможно только
при f1 g2 − f2 g1 = 0, то есть gf11 = gf22 .
116
Это означает, что рациональные функции одно переменной представляют универсальную
модель для всех простых расширений , порожденных трансцендентными элементами. Такие
расширения называются простыми трансцендентными расширениями. В частности, с точ‐
ностью до изоморфизма нет разницы, какой именно трансцендентный элемент выбирать.
Для простых расширений , порожденных алгебраическими элементами, такой общей модели
нет, но все же есть способ описывать их, не вводя предварительно расширение K, в котором
выбирается алгебраический элемент.
Если рассматривать F (α) как векторное пространство над F , то минимальный многочлен элемента α совпадает
с минимальным многочленом линей ного оператора x 7→ αx, дей ствующего на F (α).
Выясним теперь, когда значения двух многочленов на α совпадают. Если f (α) = g(α), то
f − g аннулирует α и потому f ≡ g (mod µα ).
Следствие 7.1.21. Элементы F (α) находятся в биективном соответствии с классами много‐
членов в F [x] относительно ≡µα .
√
Примеры 7.1.22. 1. C ∼ = R[x]/≡x2 +1 , 2. Q( 2) ∼
= Q[x]/≡x2 −2 .
117
Обозначение 7.1.23. Пусть F — поле, f ∈ F [x]. Положим
Определение 7.1.27. Класс [g] в F [x]/(f ) называется примитивным, если gcd(g, f ) = 1 (об‐
ратите внимание, что это не зависит от выбора конкретного представителя g).
Теорема 7.1.28. В F [x]/(f ) обратимы примитивные классы и только они.
Доказательство. Пусть gcd(g, f ) = 1, тогда най дутся такие A, B ∈ F [x], что gA + f B = 1.
Это означает, что gA ≡ 1 (mod f ) и [A] = [g]−1 .
Пусть теперь [g] обратим, то есть существует такой A ∈ F [x], что [g][A] = 1. Это означает,
что [gA] = 1, или, что то же самое, gA ≡ 1 (mod f ). Значит, существует такой B ∈ F [x], что
gA + f B = 1, откуда gcd(g, f ) = 1.
Доказательство Предложения. Если f неприводим, то для любого g ∈ F [x], не делящегося
на f , непременно g ⊥ f , то есть [g] примитивен и потому обратим.
118
Доказательство. Пусть α1 , . . . , αn — базис L над K, а β1 , . . . , βm — базис K над F . В частно‐
сти, в этих обозначениях n = [L : K] и m = [K : F ].
Рассмотрим произвольный элемент α ∈ L и разложим его по базису L над K:
α = γ1 α1 + . . . + γn αn ,
X
n X
m
α= λi,j · βj αi .
i=1 j=1
Это означает, что набор {βj αi } i=1,...,n является порождающим для L как векторного про‐
j=1,...,m
странства над F . Покажем, что это базис — для этого проверим линей ную независимость.
Предположим, что для некоторых коэффициентов ci,j
n X
X m
ci,j · βj αi = 0.
i=1 j=1
Поскольку αi образуют базис L над K, в все коэффициенты такой линей ной комбинации
должны быть нулевыми:
X m
ci,j βj = 0.
j=1
Но так как βj сами линей но независимы над F , в каждой из таких линей ных комбинаций все
коэффициенты должны быть нулевыми, то есть ci,j = 0.
119
Замечание 7.3.4. Обратное неверно. Например, можно рассмотреть поле Q = {α ∈ C |
α алгебраично над Q} (то, что это поле, надо доказывать отдельно!). Поскольку существу‐
ют неприводимые многочлены над Q сколь угодно большой степени, [Q : Q] = ∞.
Другой пример — положить F2 = Q и Fn = Fn−1 (εn ), где εn — первообразный корень из
1 степени n. Тогда возникает цепочка нетривиальных расширений F2 ⊂ F3 ⊂ F4 ⊂ . . . Ясно,
что F = ∪∞ n=2 — тоже поле, причем [F : Q] = ∞, хотя расширение алгебраическое.
120
Доказательство. Разложим f на неприводимые множители над F : f = f1 · . . . · fk , fi ∈ F [x]
неприводимы. Положим F1 = F [x]/(f1 ). Рассматривая f1 как многочлен в F1 [x], получаем
f = (x − α1 ) · . . . · (x − αm ) · g1 · . . . · gl ,
где gi ∈ F1 [x] неприводимы. Теперь положим F2 = F1 [x]/(g1 ) и снова выделим линей ные
множители, отвечающие g1 . Будем продолжать таким же образом, пока не получим разло‐
жение f = a · (x − α1 ) · . . . · (x − αn ). Хотя на каждом шаге количество неприводимых множи‐
телей может увеличиваться, суммарная степень множителей степени больше 1 (то есть не
линей ных, которые требуется разложить) строго убывает, поэтому процесс будет завершен
за конечное число шагов (альтернативно: у f не может получиться корней больше, чем его
степень — это дает еще и ограничение на число шагов).
Единственность следует из Замечания 7.3.6 и рекуррентного определения для таких рас‐
ширений .
0 = 1 + . . . + 1 = 1 + . . . + 1 + . . . + 1 + . . . + 1 = (1 + . . . + 1) · (1 + . . . + 1),
| {z } | {z } | {z } | {z } | {z }
mn m m m n
| {z }
n
121
Доказательство. K является конечномерным векторным пространством над F , то есть как
векторное пространство изоморфно F m . Количество элементов последнего равно q m .
В качестве моментального следствия из уже полученных результатов получаем следую‐
щий фундаментальный результат.
Теорема 7.4.9. Пусть F — конечное поле. Тогда най дутся такое простое p и натуральное n,
то |F | = pn .
Доказательство. p = char(F ), а n — степень F над его простым подполем.
Следующая наша задача — классифицировать все конечные поля данного размера. Нач‐
нем с нескольких вспомогательных утверждений . Следующий результат является прямым
обобщением малой теоремы Ферма.
Лемма 7.4.10. Пусть |F | = q. Тогда для любого a ∈ F выполнено aq = a.
Доказательство. Если a = 0, то все ясно. Пусть a 6= 0. Рассмотрим цепочку степеней a, начи‐
ная с нулевой :
1, a, a2 , a3 , . . .
В какой ‐то момент начнутся повторы (так как все происходит внутри конечного множества).
Если ak = al с k > l, то ak−l = 1, так что первый повтор — единица. Обозначим полученное
множество степеней A:
A = {1, a, a2 , . . . , ak−1 },
где ak = 1. Введем следующее отношение эквивалентности на F ∗ = F \ {0}:
x
x∼y ⇔ ∈ A.
y
122
Доказательство. Докажем сначала существование. Пусть F — поле разложения xq − x над
Fp . Многочлен xq − x имеет q различных корней , так как его производная (xq − x)′ = qxq−1 −
1 = −1 не имеет общих корней с xq − x.
Положим S = {a ∈ F | aq − a = 0} — это подполе F . Дей ствительно, 0, 1 ∈ S, (a − b)q =
a − bq = a − b (так что a − b ∈ S), (ab−1 )q = aq · (b−1 )q = aq · (bq )−1 = ab−1 (так что ab−1 ∈ S).
q
m m
Следовательно, всякий корень xp −x является корнем xp −x = xq −x, а значит, Fq содержит
m
поле разложения xp − x над Fp , которое состоит из pm элементов.
Если есть два таких подполя, то вместе они содержат больше чем pm корней многочлена
pm
x − x, противоречие.
Пример 7.5.2. На диaграмме ниже представлены все подполя поля из 230 элементов.
GF (230 )
GF (2)
123
h/p1 h/p1 h/p1 r h/p1
1 = bh/p1 = b1 · b2 · . . . · bm . Если j = 2, . . . , m, то pj j | h/p1 , следовательно, bi = 1,
h/p
откуда b1 1 = 1, то есть ord(b1 ) | h/p1 . Но ord(b1 ) = pr11 , противоречие. Значит, в качестве
искомого элемента a можно выбрать b.
Определение 7.5.4. Такой элемент a называется примитивным элементом поля Fq .
124
8 Коды с коррекцией ошибок
8.1 Линейные коды
Код с коррекцией ошибок это способ так представить сообщение, чтобы при передаче его
по ненадежному каналу связи возникающие ошибки, если они не слишком многочисленны,
можно было обнаружить и, в идеале, исправить на стороне приемника. Мы всегда будем по‐
лагать, что сообщение представлено последовательностью бит, каждый из которых прини‐
мает одно из q значений , которые мы трактуем как элементы поля из q элементов — в про‐
стей шем и наиболее важном случае q = 2 биты принимают два значения 0 и 1 (такие коды
называют двоичными).
В дальней шем мы будем трактовать запись b1 b2 . . . bm как вектор‐столбец (b1 , b2 , . . . , bm )⊤ ∈
Fq .
m
Код мы будем понимать как отображение кодирования Fkq → Fnq , сопоставляющее каждо‐
му сообщению из k бит кодовое слово из n бит.
125
Простей ший способ построить линей ный код — прямое обобщение кода с одной провер‐
кой четности — формировать кодовое слово в виде
a1 a2 . . . ak bk+1 . . . bn .
исходное проверочные
сообщение символы
Тогда всякое кодовое слово такого вида удовлетворяет системе линей ных уравнений с мат‐
рицей H = (A|In−k ), где A ∈ M(n − k, k, Fq ). А именно,
Примеры 8.1.3.
1. Для кода с одной проверкой четности
H = −1 −1 ... −1 1 .
Замечание 8.1.4. HG = 0.
В случае, когда проверочная матрица H = (A|In−k ) записана в каноническом виде, можно
явно выбрать порождающую матрицу в виде
Ik
G= .
−A
Линей ность кода C означает, кроме прочего, что вместе с любыми x, y ∈ C также x + y ∈ C
и λx ∈ C для любого λ ∈ Fq .
126
8.2 Исправление ошибок в линейных кодах
Пусть исходное сообщение преобразовано в кодовое слово x = x1 . . . xn , а приемник получил
сообщение y = y1 . . . yn . Внесенные при передаче ошибки описваются вектором ошибок e =
y − x = e1 . . . en . Процесс исправления ошибок должен по принятому сообщению y най ти
наиболее вероятное кодовое слово x — предполагая, что вектор ошибок «мал». Для начала
надо определить, в каком смысле вектор ошибок мал и в каком смысле сообщения близки.
Определение 8.2.1. Расстоянием Хэмминга между векторами x = x1 . . . xn и y = y1 . . . yn
называется число позиций , в которых они различаются: dist(x, y) = |{i | xi 6= yi }|.
Замечание 8.2.2. Для двоичных кодов dist(x, y) = dist(y − x, 0).
Определение 8.2.3. Вес Хэмминга wt(z) = dist(z, 0) — количество ненулевых элементов
вектора z.
С каждым кодом связана важная характеристика, выражающая, насколько плотно распо‐
ложены в пространстве принимаемых сообщений кодовые слова.
Определение 8.2.4. Минимальное расстояние кода C
d = dmin = min{dist(x, y) | x, y ∈ C, x 6= y}.
Для двоичных кодов dmin = min{wt(x) | x ∈ C, x 6= 0}.
Код длины n, размерности k и с минимальным расстоянием d называется (n, k, d)‐кодом.
Теорема 8.2.5. Код с минимальным расстоянием d исправляет b d−1
2 c ошибок. Если d четное,
то код, кроме того, обнаруживает d2 ошибок.
Доказательство. Если d = 2m или d = 2m + 1, то все векторы, отстоящие от кодового слова
x на расстояние Хэмминга не больше m, находятся ото всех других кодовых слов на большем
расстоянии. Если d = 2m, то вектор, находящий ся на расстоянии m от двух кодовых слов x
и y, не может являться кодовым словом и находится от других кодовых слов на не меньшем
расстоянии.
Рассмотрим теперь вопрос о том, как най ти кодовое слово, ближай шее к данному приня‐
тому сообщению.
Определение 8.2.6. Смежным классом вектора a ∈ Fnq называется
a + C = {a + x | x ∈ C}.
С этим понятием уже встречалось под названием «аффинное подпространство» (см. Опре‐
деление 4.2.16 и далее). В частности, принадлежность к одному смежному классу — отноше‐
ние эквивалентности.
В каждом смежном классе имеются векторы наименьшего веса Хэмминга — выберем в
каждом смежном классе по одному такому и назовем его лидером смежного класса. Итого все
пространство принимаемых сообщений разбивается в дизъюнктное объединение конечно‐
го набора смежных классов a0 +C, . . . , ar +C. Без ограничения общности можно считать, что
a0 = 0 соответствующий смежный класс состоит из кодовых слов. Если принятое сообщение
y попало в смежный класс ai + C, то есть y = ai + x для некоторого x ∈ C, то возможные
векторы ошибок лежат в том же смежном классе:
e = y − x′ = ai + x − x′ ∈ ai + C.
Расположим все принимаемые сообщения в следующей таблице, именуемой стандартным
расположением:
127
Кодовое слово x(1) = 0 x(2) ... x(m)
Смежный класс a1 a1 + x(1) = a1 a1 + x(2) ... a1 + x(m)
.. .. .. ..
. . . .
Смежный класс ai ai + x(1) = ai ai + x(2) ... ai + x(m)
.. .. .. ..
. . . .
Для нахождения правильного кодового слова x достаточно отыскать в данной таблице при‐
нятое сообщение y — тогда в первой строке соответствующего столбца будет стоять x.
Для ускорения этой процедуры можно использовать следующее обстоятельноство: с каж‐
дым принимаемым сообщением y можно связать вектор Hy — и если y = x + e, то Hy =
Hx + He = He, то есть эта величина зависит не от самого y, а от соответствующего смеж‐
ного класса. Hy = He называется синдромом ошибки (обозначается S(y)) и позволяет, бу‐
дучи единожды наденным для каждого смежного класса, сразу находить строку стандарт‐
ного расположения, в которой находится принятое сообщение y.
Замечание 8.2.7.
1. S(y) = 0 тогда и тольк тогда, когда y ∈ C и сообщение передано без ошибок.
2. Векторы принадлежат одному смежному классу тогда и только тогда, когда их синдро‐
мы равны.
3. Пусть код с проверочной матрицей H двоичный . Если ошибки допущены в позициях
i1 , . . . , il , то He = H∗,i1 + . . . + H∗,il .
128
Замечание 8.3.2. Для кода Хэмминга в границе Хэмминга достигается равенство (при t = 1).
Доказательство. Длина кода Хэмминга вычисляется как n = 2r − 1, а размерность k = 2r −
1 − r. В каждом шаре радиуса 1 содержится n + 1 = 2r вектором, итого 2k · 2r = 22 −1−r · 2r =
r
22 −1 = 2n .
r
так как (c0 + c1 x + . . . + cn−1 xn−1 ) · x ≡xn −1 cn−1 + c0 x + c1 x2 + . . . + cn−2 xn−1 . Код C можно
рассматривать как подпространство векторного пространства Rn над полем Fq . Тогда алгеб‐
раическая структура кольца позволяет выразить цикличность кода:
Замечание 8.4.2. Код C 6 Rn циклический , если xC ⊆ C. Эквивалентно, f C ⊆ C для любого
f ∈ Rn .
Пример 8.4.3. Пусть g ∈ Rn . Положим C = (g) = gRn = {gf | f ∈ Rn }. Тогда для любого h ∈
Rn выполнено h · (f g) = (hf )g ∈ (g), то есть код циклический . В таком случае g называется
порождающим многочленом кода C.
Теорема 8.4.4.
1. Каждый циклический код содержит нетривиальный многочлен g наименьшей степе‐
ни, причем если потребовать, чтобы старший коэффициент был равен 1, то такой g бу‐
дет единственным.
2. C = (g).
3. g | xn − 1.
4. Для любого c ∈ C най дется единственный такой f ∈ Fq [x], что c = f g и deg(f ) <
n − deg(g) (тогда равенство можно рассматривать уже в Fq [x], а не в Rn ).
Доказательство. Первый пункт очевиден, второй следует из возможности деления много‐
членов с остатком и цикличности кода.
Для доказательства пункта (3) поделим xn − 1 на g с остатком: xn − 1 = q(x)g(x) + r(x), где
deg(r) < deg(g). Но тогда r ∈ C, что в силу минимальности степени g влечет r = 0. Значит, g
делит xn − 1. Обозначим h = (xn − 1)/g.
Пусть теперь c ∈ C. В силу второго пункта c ≡ qg (равенство в Rn ) для некоторого мно‐
гочлена q. Рассмотрим произведение qg как многочлен над Rq и поделим его с остатком на
xn − 1:
qg = u · (xn − 1) + v = uhg + v.
Поскольку qg и uhg делятся на g, то v тоже, то есть v = wg для некоторого w. При этому
deg(v) < n, так что deg(w) < n−deg(g). Итого qg = (uh+w)·g ≡ wg. Значит, можно положить
f = w.
129
Следствие 8.4.5. Циклический код C с порождающим многочленом g состоит из многочле‐
нов f g, где deg(f ) < n − deg(g), а кодирование осуществляется отображением f 7→ f g.
Если порождающий многочлен имеет вид g = g0 +g1 x+. . .+gr xr , то порождающая матрица
соотвествующего кода имеет вид
g0
g1 g0
.. .
. g1 . .
. . .. g
G = gr .. = g|xg| . . . |xn−r−1 g .
0
gr g1
.. .
. ..
gr
Многочлен h = (xn − 1)/g называется проверочным многочленом, так как для c ∈ C выпол‐
нено c = f g и, следовательно, ch = f gh ≡ 0.
Определенный ранее код Хэмминга с параметром r длины 2r − 1 имеет проверочной мат‐
рицей матрицу, составленную из всех ненулевых двоиных столбцов высоты r. Пусть α —
примитивный элемент поля GF (2r ), тогда все элементы 1, α, α2 , . . . , α2 −2 различны и мо‐
r
X
n−1
Hc = 0 ⇔ ci αi = 0 ⇔ c(α) = 0.
i=0
и потому α является корнем степени n из 1. При этом αi = αdi /d , то есть все корни степени n
из 1 выражаются как степени α. Такой элемент α называется примитивным корнем степени
n из 1 над Fq .
130
Теорема 8.5.1 (граница БЧХ).
Пусть α — примитивный корень степени n из 1 над Fq . Пусть C — циклический код с таким
порождающим многочленом g, что для некоторых b > 0 и δ > 1 выполнено
g(αb ) = g(αb+1 ) = . . . = g(αb+δ−2 ) = 0.
Тогда dmin > δ.
Доказательство. Если c = c0 . . . cn−1 ∈ C, то, поскольку как многочлены все элементы C
делятся на g,
c(αb ) = c(αb+1 ) = . . . = c(αb+δ−2 ) = 0.
Иными словами, если положить
1 αb α2b ... α(n−1)b
1 αb+1 α2(b+1) ... α(n−1)(b+1)
H′ = . .. .. .. ,
.. . . .
1 αb+δ−2 α2(b+δ−2) ... α(n−1)(b+δ−2)
то H ′ c = 0. Тем самым матрица H ′ является частью истинной проверочной матрицы ко‐
да C (которая отличается, возможно, добавлением еще каких‐то строк, выражающих допол‐
нительные уравнения, которым удовлетворяют кодовые слова). Чтобы показать, что любое
ненулевое кодовое слово кода C имеет вес по край ней мере δ, покажем, что удовлетворяю‐
щее уравнению H ′ c = 0 сообщение обязательно нулевое.
Итак, пусть c — вектор веса wt(c) = w 6 δ − 1. Это значит, что можно выделить w позиций ,
в которых c отличен от 0, иными словами, ci 6= 0 только если i ∈ {i1 , . . . , iw }. Рассмотрим
матрицу
αi1 b α i2 b ... α iw b
αi1 (b+1) αi2 (b+1) ...
αiw (b+1)
A= .. .. .. . ,
. . . ..
αi1 (b+w−1) αi2 (b+w−1) ... αiw (b+w−1)
то есть подматрицу H ′ , составленную из пересечения первых w строк и столбцов с индекса‐
ми i1 , . . . , iw (могут включать 0). Если обозначить c′ = (ci1 , . . . , ciw )⊤ , то Ac′ = 0. Если c′ 6= 0,
то A не может быть обратимой , то есть det(A) = 0. Но
1 1 ... 1
αi1 α i2
. . . α iw
det(A) = α(i1 +...+iw )b · .. .. . . ,
. . . . .
.
αi1 (w−1) αi2 (w−1) . . . αiw (w−1)
а эта величина не равна 0 как произведение ненулевого элемента поля и определителя Ван‐
дермонда для различных элементов αi1 , . . . , αiw (различны, так как α примитивный ). Зна‐
чит, c′ = 0 и c = 0.
Определение 8.5.2. Кодом БЧХ с конструктивным расстоянием δ называется циклический
код с порождающим многочленом вида
g = lcm µαb ,Fp , µαb+1 ,Fp , . . . , µαb+δ−2 ,Fp .
По определению наименьшего общего кратного и минимального многочлена такой мно‐
гочлен g аннулирует αb , . . . , αb+δ−2 , поэтому соответствующий код имеет минимальное рас‐
стояние не меньше δ.
131
Предметный указатель
алгебраическая форма, 47 дробно‐линей ное преобразование, см. функ‐
алгоритм Эвклида, 25 ция дробно‐линей ная
для n чисел, 27 дробь
расширенный , 26 правильная, 62
аргумент комплексного числа, 50, 51 простей шая, 63
ассоциированность, 24 закон инерции, 113
базис, 66 знак перестановки, 86
жорданов, 101 значение многочлена, 42
ортогональный , 109 индукция, см. математическая индукция
билиней ная форма, 107 интерполяция
положительно определенная, 108 по Лагранжу, 59
бинарная операция, 18 по Ньютону, 59
ассоциативная, 18 с простыми узлами, 58
индуцированная, 20 квадратичная форма, 109
коммутативная, 19 класс
бинарное отношение, 7 вычетов, 32
антисимметричное, 8 эквивалентности, 9
конгруэнтности, 20 код
порядка, 14 БЧХ, 131
линей ное, 15 Хэмминга, 128
полное, 16 линей ный , 125
рефлексивное, 7 циклический , 129
симметричное, 7 кольцо, 21
транзитивное, 8 классов вычетов, 32
эквивалентности, 8 коммутативное, 22
вещественная часть, 47 многочленов, 40
взаимная простота, 27 комплексная плоскость, 48
группа, 21 расширенная, 52
абелева, 21 комплексное сопряжение, 47
мультипликативная кольца, 23 композиция
углов, 51 функций , 11
декартово произведение координаты вектора, 68
множеств, 6 корень
деление с остатком комплексный из 1, 54
многочленов, 42 кратный , 56
синтетическое, 45 многочлена, 43
целых чисел, 24 первообразный по модулю p, 37
делимость, 23 простой , 56
делитель нуля, 23 кортеж, 6
диагонализация кратность
ортогональным преобразованием, 114 корня многочлена, 56
по Лагранжу, 109 криптографический протокол
по Якоби, 111 Диффи—Хеллмана—Меркла, 37
дилатация, 83 Ривеста—Шамира—Адлемана, 37
дискретный логарифм, 37 критерий Сильвестра, 114
линей ная независимость, 65
132
линей ное отображение, 72 множеств, 4
линей ное представление НОД, 25 перестановка, 86
линей ное сравнение, 32 подпространство, 69
математическая индукция, 16 порожденное подмножеством, 69
матрица, 74 поле, 39
Грама, 107 комплексных чисел, 46
диагонализируемая, 101 разложения многочлена, 120
единичная, 77 рациональных функций , 61
жорданова, 101 частных, 60
линей ного отображения, 75 порождающий набор, 66
нулевая, 77 правило Руффини, см. схема Горнера
обратная, 77 преобразование Мебиуса, см. функция дробно‐
перехода, 79 линей ная
присоединенная, 91 приведение к главным осям, 115
проверочная кода, 125, 126 принцип Дирихле, 17
транспонированная, 78 производная многочлена, 56
метод Гаусса, 84 прообраз, 10
мнимая часть, 47 простое подполе, 121
многочлен, 40 пространство
минимальный матрицы, 105 векторное, 64
минимальный элемента поля, 117 конечномерное, 67
неприводимый , 62 столбцов, 64
порождающий кода, 129
проверочный кода, 130 разбиение множества, 9
характеристический , 94 разложение
множество, 3 натурального на простые множители,
бесконечное, 5 30
всех подмножеств, 4 размерность, 68
конечное, 5 ранг
пустое, 3 линей ного отображения, 80
модуль матрицы, 81
комплексного числа, 48 расширение полей , 116
наибольший общий делитель, 24, 26 алгебраическое, 119
неполное частное, 24 простое, 116
область редукция
значений , 10 по Монтгомери, 33
определения, 10 свободный член, 41
прибытия, 10 сигнатура квадратичной формы, 114
область целостности, 23 синтетическое деление, 45
образ, 10 система вычетов, 32
образ линей ного отображения, 80 система линей ных уравнений , 81
определитель однородная, 81
матрицы, 87 скалярное произведение, 108
ортогонализация Грама—Шмидта, 112 собственные векторы и числа, 94
ортогональное дополнение, 110 сравнимость по модулю, 31, 46
остаток стандартные матричные единицы, 82
при делении многочленов, 42 старший коэффициент, 41
при делении целых чисел, 24 степень
пересечение многочлена, 41
133
расширения, 118 число
сужение функции, 11 комплексное, 46
сумма подпространств, 70 простое, 29
прямая, 71 элемент
схема левый ней тральный , 19
Горнера, 44 левый обратный , 20
разделения секрета по Шамиру, 59 максимальный , 15
теорема минимальный , 15
Гамильтона—Кэли, 96 модулярный обратный , 33
Кронекера—Капелли, 82 наибольший , 15
Эй лера, 34 наименьший , 15
Якоби, 114 ней тральный , 19
китай ская об остатках, 35 обратный , 20
малая Безу, 43 правый ней тральный , 19
малая Ферма, 35 правый обратный , 20
основная алгебры, 55 примитивный , 124
основная арифметики, 30 элементарные преобразования, 83
трансвекция, 83
транспозиция, 86
тригонометрическая форма, 50
тупель, см. кортеж
упорядоченная n‐ка, см. кортеж
упорядоченная пара, 5
уравнение
линей ное диофантово, 28
фактор‐множество, 14
фактор‐пространство, 72
финитарная последовательность, 40
форма матрицы
жорданова, 101
строчная эшелонированная, 84
трапециевидная, 84
формула
Крамера, 91
Муавра, 51
Тей лора, 58
полного развертывания, 88
функция, 10
Эй лера, 34
биективная, 10
дробно‐линей ная, 52
инъективная, 10
обратимая, 12
обратная, 12, 13
полиномиальная, 42
сюръективная, 10
тождественная, 12
характеристическая, 13
характеристика поля, 121
134