Вы находитесь на странице: 1из 272

УДК 512 (075.

8)
ББК 22.143
К 71

К о с т р и к и н А. И. В в е д е н и е в а л г е б р у . Ч а с т ь I. О с н о в ы а л г е б ­
р ы : Учебник для вузов. — 3-е изд. — М.: ФИ ЗМ А ТЛИ Т, 2004. — 272 с. —
ISBN 5-9221-0487-Х.
Рассмотрены системы линейных уравнений, элементарная теория мат­
риц, теория определителей, простейшие свойства групп, колец и полей, комп­
лексные числа и корни многочленов. Помещено большое число упражнений
различной степени трудности. Специальный раздел посвящен обсуждению
некоторых нерешенных задач о многочленах.
Второе издание — 2001 г.
Д ля студентов младш их курсов университетов и вузов с повышенными
требованиями по математике.
Ил. 28.

© Ф И ЗМ А Т Л И Т , 2000, 2001, 2004


ISBN 5-9221-0487-Х © А. И. К острики н, 2000, 2001
О ГЛ АВЛЕН И Е

П РЕДИ СЛО ВИ Е ..................................................................................................... 7


С О В ЕТЫ Ч И Т А Т Е Л Ю ........................................................................................... 10

ЕЛАВА 1
ИСТОКИ АЛГЕБРЫ

§ 1. А лгебра вкратце ...................................................................................... 12


§ 2. Н екоторые модельные задачи ............................................................ 15
1. Зад ач а о разреш им ости уравнений в радикалах (15). 2. З а ­
дача о состояниях м ногоатомной молекулы (17). 3. Зад ач а о
кодировании сообщения (18). 4. Зад ач а о н агретой пластин­
ке (18).
§ 3. Системы линейных уравнений. Первые ш а г и ............................... 19
1. Терминология (20). 2. Э квивалентность линейных сис­
тем (21). 3. Приведение к ступенчатом у виду (23). 4. Исследова­
ние системы линейных уравнений (24). 5. О тдельные замечания
и примеры (26).
§ 4. Определители небольших порядков ................................................. 29
Упражнения (33).
§ 5. М нож ества и о т о б р а ж е н и я ................................................................... 33
1. М нож ества (33). 2. О тображ ения (35). Упражнения (40).
§ 6. О тнош ения эквивалентности. Ф акторизация отображ ений . . 41
1. Бинарны е отнош ения (41). 2. Отношение эквивалентнос­
ти (41). 3. Ф акторизация отображ ений (42). 4. Упорядоченные
м нож ества (44). Упражнения (45).
§ 7. Принцип м атем атической и н д у к ц и и ................................................. 46
Упражнения (50).
§ 8. П ерестановки ............................................................................................. 50
1. С тан д артн ая запись перестановки (50). 2. Цикловая стр у к ­
ту р а перестановки (52). 3. Знак перестановки (56). 4. Действие
S n на ф ункциях (58). Упражнения (60).
§ 9. А риф м етика целых чисел ................................................................... 61
1. Основная теорем а ариф м етики (61). 2. НОД и Н О К в Z (63).
3. А лгоритм деления в Z (63). Упражнения (64).
4 Оглавление

ГЛАВА 2
М АТРИЦЫ

1. Векторны е п ространства строк и с т о л б ц о в ................................... 65


1. М отивировка (65). 2. Основные определения (66). 3. Линей­
ные комбинации. Линейная оболочка (67). 4. Линейная зависи­
м ость (68). 5. Базис. Разм ерность (69). Упражнения (72).
§ 2. Р ан г м а т р и ц ы ............................................................................................. 72
1. Возвращение к уравнениям (72). 2. Р ан г м атрицы (74).
3. К ритерий совместности (76). Упражнения (77).
§ 3. Линейные отображ ения. Д ействия с м а т р и ц а м и ........................ 78
1. М атрицы и отображ ения (78). 2. Произведение м атриц (81).
3. Транспонирование м атриц (83). 4. Р ан г произведения
м атриц (84). 5. К вад ратны е м атрицы (86). 6. Классы эквива­
лентных м атриц (91). 7. Вычисление обратной м атрицы (93).
8. П ространство решений (96). Упражнения (98).

ГЛАВА 3
ОП РЕДЕЛИ ТЕЛИ

§ 1. Определители: построение и основные с в о й с т в а ........................ 102


1. Геометрическая м отивировка (102). 2. К ом бинаторно­
аналитический подход (104). 3. Основные свойства определи­
телей (105). Упражнения (112).
§ 2. Дальнейшие свойства определителей .............................................. 113
1. Разложение определителя по элементам столбца или стро­
ки (113). 2. О пределители специальных м атриц (116). У праж ­
нения (119).
§ 3. Применения о п р е д е л и т е л е й ................................................................... 121
1. К ритерий невырожденности м атрицы (121). 2. Формулы
К рам ера (123). 3. М етод окаймляющих миноров (125). У праж ­
нения (128).
§ 4. К построению теории определителей .............................................. 130
1. Первое аксиоматическое построение (130). 2. В торое ак ­
сиоматическое построение (131). 3. П остроение методом пол­
ной индукции (131). 4. Х арактеризация мультипликативны ми
свойствами (131). Упражнения (133).

ГЛАВА 4
ГРУ П П Ы . К О Л ЬЦ А. ПОЛЯ

§ 1. М нож ества с алгебраическим и о п е р а ц и я м и ................................... 134


1. Бинарны е операции (134). 2. П олугруппы и моноиды (135).
3. Обобщённая ассоциативность; степени (136). 4. О братимые
элементы (138). Упражнения (139).
Оглавление 5

§ 2. Г р у п п ы ........................................................................................................... 139
1. Определение и примеры (139). 2. Ц иклические группы (142).
3. И зоморфизмы (143). 4. Гомоморфизмы (147). 5. Словарик.
П римеры (148). Упражнения (149).
§ 3. Кольца и п о л я ............................................................................................. 151
1. Определение и общие свойства колец (151). 2. Сравнения.
Кольцо классов вы четов (155). 3. Гомоморфизмы колец (156).
4. Типы колец. Поле (157). 5. Х арактери сти ка поля (161). 6. З а ­
мечание о линейных системах (163). Упражнения (165).

ГЛАВА 5
К О М П Л ЕКСН Ы Е Ч И С Л А И М НОГОЧЛЕНЫ

§ 1. Поле комплексных чисел ....................................................................... 167


1. Вспомогательная конструкция (167). 2. П лоскость комплекс­
ных чисел (168). 3. Геометрическое истолкование действий с
комплексными числами (169). 4. Возведение в степень и извле­
чение корня (173). 5. Теорема единственности (175). 6. Элемен­
тарная геом етрия комплексных чисел (176). Упражнения (179).
§ 2. Кольцо многочленов .............................................................................. 180
1. Многочлены от одной переменной (181). 2. Многочлены
от многих переменных (185). 3. А лгоритм деления с о ст ат­
ком (187). Упражнения (188).
§ 3. Разложение в кольце м н о г о ч л е н о в ..................................................... 190
1. Элементарные свойства делимости (190). 2. НОД и Н О К
в кольцах (192). 3. Ф акториальность евклидовых колец (194).
4. Неприводимые многочлены (197). Упражнения (200).
§ 4. Поле о т н о ш е н и й ......................................................................................... 201
1. П остроение поля отношений целостного кольца (201). 2. По­
ле рациональных дробей (203). 3. П ростейш ие дроби (204).
Упражнения (207).

ГЛАВА 6
К О Р Н И М Н О ГО Ч Л Е Н О В

1. Общие свойства к о р н е й ........................................................................... 208


1. К орни и линейные множители (208). 2. Полиномиаль­
ные функции (210). 3. Д ифференцирования кольца многочле­
нов (212). 4. К ратн ы е множители (214). 5. Ф ормулы Вие-
т а (216). Упражнения (218).
2. Сим м етрические многочлены ............................................................ 220
1. Кольцо сим м етрических многочленов (220). 2. Основная тео­
рем а о сим м етрических многочленах (221). 3. М етод неопре­
делённых коэффициентов (224). 4. Д искрим инант многочле­
на (226). 5. Р езул ьтан т (228). Упражнения (231).
6 Оглавление

§3. А лгебраическая зам кн утость поля С .............................................. 232


1. Ф орм улировка основной теорем ы (232). 2. Д оказательство
основной теорем ы (234). 3. Ещё одно доказательство основной
теорем ы (237).
$ 4. Многочлены с вещ ественными к о э ф ф и ц и е н т а м и ........................ 241
1. Разложение на неприводимые множители в R[X] (241).
2. П ростейш ие дроби над С и К (242). 3. Проблема локализации
корней многочлена (244). 4. Вещ ественные многочлены с ве­
щ ественными корнями (249). 5. Устойчивые многочлены (251).
6. Зависим ость корней многочлена от коэффициентов (252).
7. Вычисление корней многочлена (254). 8. Рациональные корни
целочисленных многочленов (255). Упражнения (257).

ПРИЛОЖЕНИЕ
Н ЕРЕШ ЁННЫ Е ЗА Д А Ч И О М Н О ГО Ч ЛЕН АХ

1. Проблема я к о б и а н а ...................................................................................... 259


2. Зад ач а о д и с к р и м и н а н т е ........................................................................... 261
3. Зад ач а о двух порождающ их кольца м н о г о ч л е н о в ........................ 261
4. Задачи о критических точ ках и критических значениях . . . 262
5. Зад ач а о глобальной сходимости м етода Н ь ю т о н а ........................ 263

П РЕДМ ЕТН Ы Й У К А ЗА Т Е Л Ь ......................................................................... 266


А лгебра щ едра — зачастую
она даёт больше, чем у неё
спраш иваю т.
Даламбер

ПРЕДИСЛОВИЕ

Необходимость в едином изложении курсов алгебры, линейной


алгебры и геометрии ощущалась давно. Во всяком случае, учебник
“Введение в алгебру” (М., Наука, 1977) 22-летней давности с само­
го начала рассматривался лишь как первый шаг к интегрированно­
му подходу. Алгебра — живая ветвь математики, обладающая зна­
чительной притягательной силой и основывающаяся на небольшом
числе ясных, интуитивных начал. Смысл алгебраического понятия
может иметь теоретико-числовую или геометрическую природу, а
зачастую его корни лежат в вычислительных аспектах математи­
ки и в решении уравнений. Возникающие из такого исторического
понимания принципы и требования, предъявляемые к современно­
му университетскому учебнику по алгебре, стали общепринятыми.
Вся трудность падает на реализацию более или менее известных
идей. Естественная эволюция стандартных программ — то в сторо­
ну объединения курсов линейной алгебры и многомерной аналитиче­
ской геометрии, то в сторону их разделения и вкрапления элементов
теории чисел в курс алгебры — нашла отражение на страницах пред­
лагаемого “Введения в алгебру”, написанного на базе упомянутого
одноимённого учебника, но сильно расширенного и разбитого для
удобства читателя на три части. Само собой разумеется, что объ­
единение этих частей заведомо содержит устойчивое ядро указан­
ных курсов — тот минимум, которому должен удовлетворять вся­
кий учебник. С другой стороны, распределение материала по частям
соответствует реально сложившемуся за последние десятилетия по­
рядку чтения курсов студентам механико-математического факуль­
тета МГУ: первый семестр — “Основы алгебры”; второй семестр —
“Линейная алгебра и геометрия”; третий семестр — “Основные
структуры алгебры” (алгебра на уровне элементарных, но доволь­
но содержательных сведений об алгебраических системах, ставших
принадлежностью каждого математика наших дней). В дальнейшем
для удобства ссылок на эти книги будут использоваться соответ­
ственно сокращения [ВА I], [ВА II], [ВА III]. На этот порядок, равно
как и на принцип подачи материала, наложили свой отпечаток не
только здравый смысл, но и мудрый совет Горация: “Надо сегодня
сказать лишь то, что уместно сегодня. Прочее всё отложить и ска­
зать в подходящее время”. Другими словами, мы придерживаемся
концентрического стиля изложения, не боясь возвращаться к одной
8 Предисловие

и той же теме, к одному и тому же примеру много раз. Так, поня­


тия группы, кольца, поля, изоморфизма возникают в [BA I] и обсуж­
даются на уровне примеров, накапливаемых затем в [ВА II]; более
основательное изучение этих понятий проводится лишь в [ВА III].
Абстрактные векторные пространства и линейные операторы на них
исследуются в [ВА II], хотя их конкретные аналоги, сопровождающие
теорию систем линейных уравнений, появляются на первых страни­
цах настоящей книги. Разумеется, только читатель вправе судить,
приближает ли такой подход то понимание предмета, о котором пи­
сал великий математик А. Пуанкаре в своем замечательном сочи­
нении “Наука и метод” (гл. 2 . Математические определения и пре­
подавание). Реально читаемым курсом (три часа лекций в неделю
в первом семестре, четыре — во втором и два — в третьем), по
опыту самого автора, заведомо невозможно охватить весь материал
учебника, да к этому и не следует стремиться. По своему замыслу
он рассчитан на свободное творчество лектора (разумеется, в из­
вестных рамках). Хотелось бы рассматривать его также как своего
рода справочник и как источник для дополнительного чтения сту­
дентами. Многообразие современной алгебры невозможно уложить в
прокрустово ложе какого-либо “Введения в алгебру”, однако импуль­
сом к творческой работе мысли учебник послужить должен. Этому
способствуют многочисленные упражнения, рассчитанные в какой-
то мере на развитие основной темы. Кроме того, в каждой части
имеется раздел, где перечислены, с необходимыми пояснениями, не­
которые нерешённые или трудно решаемые задачи, непосредственно
примыкающие (во всяком случае, по своей постановке) к программ­
ному материалу и лежащие почти что на поверхности. Вряд ли эти
задачи станут предметом повального увлечения, но будет прекрасно,
если в ком-то они зажгут огонёк поиска математической истины.

***
Несколько слов о [ВА I]. Эту книгу можно считать алгеброй в
миниатюре. Фундаментальные понятия группы, кольца, поля, новые
для большинства студентов, вводятся по возможности неформально
и в минимальных дозах, хотя общее количество производных поня­
тий получается довольно большим. Их не нужно запоминать: они
станут привычными после самостоятельной работы над задачами и
упражнениями. Для удобства выделяется несколько наиболее употре­
бительных алгебраических систем таких, как группы (Z, +), Sn, Ап,
GLn, SLn, кольцо многочленов, поля Q, 1, С и Zp, на фоне которых
демонстрируется язык алгебры. По традиции и по соображениям
преемственности между школой и вузом вначале излагается техника
матриц и определителей, используемая для отыскания и исследова­
ния решений систем линейных уравнений. На этом пути естествен­
ным образом возникают и основные алгебраические структуры. Их
Предисловие 9

более обстоятельному изучению посвящена книга [ВА III], а пока в


нашу задачу входит лишь накопление “живых” примеров.
Следует обратить особое внимание на книгу И.Р. Шафаревича [4]
из дополнительного списка литературы, в которой развивается све­
жий и в высшей мере нетрадиционный взгляд на алгебру, а также
на математику в целом.
Я благодарен всем читателям старого учебника “Введение в ал­
гебру”, его переводчикам на английский, болгарский, испанский,
польский, французский, китайский языки и рецензентам, сообщив­
шим свои замечания, а также членам кафедры высшей алгебры МГУ,
где учебник продолжает подвергаться ежегодному испытанию.
Я рад выразить глубокую благодарность А.Я. Кострикиной, а
также Н.К. Ильиной и В.В. Острику за неоценимую помощь при
оформлении рукописи.
А.И. Кострикин

ДОПОЛНИТЕЛЬНАЯ ЛИ ТЕРА ТУ РА

1. Сборник задач по ал геб ре/ Под редакцией А.И. К острикина. — М.:


Ф акториал, 1995.
2. Курош А .Г. К урс высшей алгебры. — 10-е изд. — М.: Наука, 1971.
3. Фаддеев Д .К . Лекции по алгебре. — М.: Наука, 1984.
4. Шафаревич И.Р. Основные понятия алгебры. — М.: ВИНИТИ, 1986.

ГРЕЧЕСКИЙ АЛФАВИТ

Аа вр г7 Л5 Ее
альфа бета гам м а дельта эпсилон д зета

Hr] ее Ji Кк лх М ц
эта тэта йота каппа ламбда мю

Nv Оо П 7Г Рр Sa
ню кси омикрон пи ро сигма

Тт Tv фф ф'ф Г2ио
тау ипсилон фи хи пси омега
Согласно общему плану, изложенному в предисловии, схема зави­
симости глав в книге линейна. Фактически студенту-первокурснику
полезно читать всё подряд, обращая особое внимание на многочи­
сленные примеры и на упражнения, значительная часть которых
обычно предлагается во время экзамена.
Искушённому читателю (скажем, преподавателю или студенту
второго курса) будет нетрудно начинать чтение практически с лю­
бого места, естественно — при наличии готовности обращаться
время от времени к определениям в предыдущих параграфах и гла­
вах. Не все новые понятия вводятся в абзацах, начинающихся словом
“определение”. Подробное оглавление и предметный указатель помо­
гут найти нужное место в книге.
Каждая глава разбита на несколько параграфов, а каждый па­
раграф — на несколько пунктов с собственными названиями. Внут­
ри праграфа теоремы, предложения, леммы, следствия имеют свою
собственную нумерацию: теорема 1 , теорема 2 , ...; лемма 1 , лем­
ма 2 , ... С этой примитивной, но весьма наглядной и экономной ну­
мерацией при ссылках на утверждения из другого параграфа прихо­
дится писать “теорема i § j ” или даже “теорема i § j гл. к”,
однако это не вызывает неудобств.
Конец доказательства отмечается знаком □.
Для сокращения используются простейшие логические символы.
Знак импликации = > в записи А = > В имеет простую смысло­
вую нагрузку, что “А влечёт В ” или “из А следует 5 ”, в то вре­
мя как “А В ” означает эквивалентность высказываний i и 5 ,
т.е. ( ... тогда и только тогда, когда ...). Квантор всеобщности V
служит заменой выражения “для любого”. Остальные обозначения
понятны из контекста.
Выше приведён целиком греческий алфавит с указанием произно­
шения букв. Наблюдаемая здесь путаница досадна, поскольку буквы
греческого алфавита весьма употребительны в математике.
Глава 1
ИСТОКИ АЛГЕБРЫ

С чего начинается алгебра? С некоторым приближением можно


сказать, что истоки алгебры кроются в искусстве складывать, умно­
жать и возводить в степень целые числа. Формальная, но далеко не
очевидная и не однозначная замена чисел буквами позволяет дейст­
вовать по аналогичным правилам в пределах гораздо более общих
алгебраических систем. Стало быть, попытка ответить исчерпываю­
щим образом на поставленный вопрос увела бы нас не только в глубь
веков, в тайны зарождения математической мысли. Более трудная
часть ответа была бы связана с описанием основных структур ал­
гебры наших дней: групп, колец, полей, модулей и т. п. Но этому как
раз и посвящена значительная часть книги, так что цель главы 1
кажется пока недостижимой.
К счастью, под абстрактной оболочкой большинства аксиома­
тических теорий алгебры скрываются вполне конкретные задачи
теоретического или практического характера, решение которых слу­
жило в своё время счастливым, а иногда и неизбежным поводом к
далеко идущим обобщениям. В свою очередь развитая теория давала
импульс и средства к решению новых задач. Сложное взаимодействие
теоретических и прикладных аспектов теории, присущее всей мате­
матике, в алгебре проступает весьма отчётливо и делает в какой-то
мере оправданным принятый нами концентрический стиль изложе­
ния.
После кратких общих замечаний, связанных с историей предме­
та, мы сформулируем несколько задач, предваряющих содержание
последующих глав. Одна из этих задач послужит отправной точкой
для изучения систем линейных уравнений, теории матриц и теории
определителей. Мы изложим метод Гаусса и получим первые сведе­
ния о решениях линейных систем.
Уже на этом этапе полезно ввести стандартные обозначения и
терминологию, для чего мы дадим сжатый обзор теории множеств
и отображений.
Будут введены важные понятия отношения эквивалентности и
факторизации отображений. Далее в связи с разъяснением принци­
па математической индукции устанавливаются элементарные комби­
наторные соотношения. Особое место отводится перестановкам, на
которых базируется теория определителей.
Наконец, приводимые в последнем параграфе простейшие ариф­
метические свойства системы целых чисел не только используются в
дальнейшем, но и являются прототипом для построения аналогичной
арифметики в более сложных алгебраических системах.
12 Гл. 1. Истоки алгебры

Материал этой главы не выходит далеко за пределы школьной


программы. От читателя требуется лишь готовность встать на
несколько более общую точку зрения. Чтение можно начинать с § 3.

§ 1. А л г е б р а в к р атц е
В наши дни не без основания говорят об “алгебраизации” мате-
матики, т.е. о проникновении идей и методов алгебры как в теоре­
тические, так и в прикладные разделы математики. Такое положе­
ние вещей, ставшее совершенно отчётливым к середине XX столетия,
наблюдалось отнюдь не всегда. Как всякая область человеческой
деятельности математика подвержена влиянию моды. Мода на ал­
гебраические методы вызвана существом дела, хотя увлечение ею
иногда переходит разумные границы. А так как алгебраическая обо­
лочка, затмевающая содержание, не меньшая беда, чем элементарное
забвение алгебры, то не случайно достоинством той или иной книги
уже считается (вполне резонно) умение её автора избежать перегру­
женности алгебраическим формализмом.
Если отвлечься от крайностей, то алгебра издревле составляла
существенную часть математики. То же самое следовало бы сказать
и о геометрии, но мы скроемся за крылатой фразой Софи Жермен
(XIX век): “Алгебра — не что иное, как записанная в символах гео­
метрия, а геометрия — это просто алгебра, воплощённая в фигурах”.
С тех пор положение изменилось, но, кажется, “признано, что “при­
рода” математических объектов есть, в сущности, дело второстепен­
ное и что довольно неважно, например, представили ли мы результат
в виде теоремы “чистой” геометрии или при помощи аналитической
геометрии в виде алгебраической теоремы” (Н. Бурбаки).
В соответствии с принципом “важны не математические объек­
ты, а отношения между ними” алгебра определяется (несколько тав­
тологически и совершенно непонятно для непосвящённого) как наука
об алгебраических операциях, выполняемых над элементами различ­
ных множеств. Сами алгебраические операции выросли из элемен­
тарной арифметики. В свою очередь на основе алгебраических со­
ображений получаются наиболее естественные доказательства мно­
гих фактов из “высшей арифметики” — теории чисел.
Но значение алгебраических структур, т.е. множеств с алгебра­
ическими операциями, далеко выходит за рамки теоретико-числовых
применений. Многие математические объекты (топологические
пространства, функции нескольких комплексных переменных и др.)
изучаются путём построения надлежащих алгебраических структур,
если и не адекватных изучаемым объектам, то во всяком случае
отражающих их существенные стороны. Нечто подобное относится
и к объектам реального мира.
§ 1. Алгебра вкратце 13

Определённое мнение на этот счет было высказано более 45 лет


назад одним из творцов квантовой механики П. Дираком: “Современ­
ная физика требует всё более абстрактной математики и развития
ее основ. Так, неевклидова геометрия и некоммутативная алгебра,
считавшиеся одно время просто плодом воображения или увлечения
логическими рассуждениями, теперь признаны весьма необходимы­
ми для описания общей картины физического мира”.
Алгебраические средства весьма полезны при исследовании эле­
ментарных частиц в квантовой механике, свойств твёрдого тела и
кристаллов (в этой связи особенно важна теория представлений
групп), при анализе модельных задач экономики, при конструиро­
вании современных ЭВМ и т.д. и т.п.
В свою очередь алгебра питается живительными соками других
дисциплин, в том числе математических. Так, гомологические ме­
тоды алгебры выросли из недр топологии и алгебраической теории
чисел. Не удивительно поэтому, что облик алгебры и точка зрения
на алгебру менялись в разные эпохи. Мы не имеем возможности про­
следить подробно за этими изменениями не только из-за недостатка
места, но главным образом потому, что описание истории предмета
должно быть конкретным, — требование, которому можно удовле­
творить лишь при основательном знакомстве с самим предметом.
Ограничимся схематическим перечислением имён и периодов.

Д ревние цивилизации Вавилона А ри ф м ети ч ески е действия на м н ож ест­


и Е ги п та . Г реческая ци вилиза­ вах целых и рациональн ы х полож итель­
ция. “А р и ф м ет и к а ” Д и о ф ан та ны х чисел. А лгеб раические ф орм улы
(III в. н. э.). в гео м етр и ч еск и х и астроном ич еских
расч ётах . Ф орм ул и ровк а зад ач на по­
строение (об удвоении куба и трисекции
угла), заним авш их алгебраи ческие умы
в го р азд о более позднее врем я.
В осточ ная цивилизация средних А лгеб раические уравнения первой и
веков. Сочинение урож енц а Х ивы в торой степени. Возникновение сам ого
М ухам м еда ибн М уса ал-хорезми т ер м и н а “ал ге б р а ” .
(ок. 825г.) “Х исаб ал-дж абр ва-л-
м ук аб ал а” .
Э поха В озрож дения. Реш ение общ их алгебраи ческ и х уравн е­
С. Ф ерро (1465-1526) ний т р е т ь е й и ч етв е р т о й степени.
Н. Т ар т ал ь я (1500-1557)
И. К ар д ан о (1501-1576)
Л . Ф ер р а р и (1522-1565)
Ф . В и ет (1540-1603) С оздание современной алгебраи ческой
Р . Бом белли (1530-1572) символики.
X V II-X V III вв. Возникновение анали тической г ео м е т ­
Р . Д е к а р т (1596-1650) рии — прочного м о сти к а м еж ду г ео м е т ­
П. Ф ер м а (1601-1665) рией и алгеброй. О ж ивление деятельн о­
И. Н ью тон (1643-1727) сти в теори и чисел.
14 Гл. 1. Истоки алгебры

Г. Лейбниц (1646-1716) Р а зв и т и е алгебры многочленов. И н­


Л. Эйлер (1707-1783) тенсивны е поиски общ их ф орм ул для ре­
Ж . Д алам бер (1717-1783) ш ений ал гебраи ческ и х уравнений. П ер­
Ж .-Л . Л агр ан ж (1736-1813) вые подходы к до к а за те л ьс тв у суще­
Г. К р ам ер (1704-1752) ствован ия корня уравнения с числовы ми
П. Л аплас (1749-1827) коэф ф ициентам и . Н ачала теори и опре­
В андерм онд (1735-1796) делителей.
X IX в. - начало XX в. Д о к азател ьств о основной тео р ем ы о су­
К . Ф . Гаусс (1777-1855) щ ествовании корней уравнений с чис­
П. Дирихле (1805-1859) ловыми коэф ф ициентам и . И нтенсивное
Э. К ум м ер (1810-1893) разв и ти е теори и алгебраи ческ и х чисел.
Л .К рон ек ер (1823-1891)
Р . Д едекинд (1831-1916)
Е. И. Золотарёв (1847-1878)
Г. Ф . Вороной (1868-1908)
А. А. М арков (1856-1922)
П. Л. Ч ебы ш ев (1821-1894) П оиски м етодов приближ ённого реш е­
Ш. Э рм и т (1822-1901) ния ал гебраи ческ и х уравнений. Условия
Н. И. Л обачевский (1792-1856) на коэф ф ициенты , обеспечиваю щ ие за ­
А. Гурвиц (1859-1919) данное располож ение корней.
А. Р уф ф и н и (1765-1822) Реш ение проблемы о неразреш им ости
Н. X. А бель (1802-1829) общ их уравнений степени п 5 в ради­
К . Я коби (1804-1851) калах. Р а зв и т и е теори и алгебраи чески х
Э. Г алуа (1811-1832) ф ункций. С оздание теори и Галуа. Н ача­
Б . Р и м ан (1826-1866) ла теори и конечны х групп, п реим ущ ест­
0. К ош и (1789-1857) венно на базе групп п ерестановок.
К . Ж о р д а н (1838-1922)
Л . Силов (1832-1918)
Г. Г рассм ан (1809-1877) И нтенсивное разв и ти е м етодов линей­
Д. С ильвестр (1814-1897) ной алгебры .
А. К эли (1821-1895) Возникновение, после о т к р ы т и я к в а ­
У. Г ам ильтон (1805-1865) тернионов, теори и гиперкомплексны х
Д ж . Б у л ь (1815-1864) систем (так и е систем ы теп ерь н азы в а­
С. Л и(1842-1899) ю тся алгебрами). В частн о сти , в связи
Г. Ф робен иус (1849-1918) с р азви ти ем теори и н епреры вн ы х групп
Ж . С ерре (1819-1885) (груп п Ли) были залож ены основы т е о ­
М. Н ётер (1844-1922) рии алгебр Ли. В аж н ы м и главам и м а­
Д. А. Граве (1863-1939) т е м а ти к и стали алгебраи ческ ая г ео м е т ­
А. П уан каре (1854-1912) рия и тео р и я ин вари ан тов. В X IX в. м а­
Ф . Клейн (1849-1925) т е м а т и к а ещё не д о сти гл а тонкой ди ф ­
У. Б ерн сай д (1852-1927) ф еренциации, и многие крупны е уче­
Ф . Э. М олин (1861-1941) ные творч еск и р аботал и в разл и чн ы х её
И. Ш ур (1875-1941) областях.
Г. Вейль (1885-1955)
Ф . Э нриквес (1871-1946)
Д ж . ф он Н ейман (1903-1957) П ервая половина XX в. бы ла о тм ече­
Д. Г ильберт (1862-1943) на коренной перестройкой всего здани я
Э. К а р т а н (1869-1951) м ат е м ат и к и . А лгеб ра, отказав ш аяся от
К . Гензель (1861-1941) привилегии б ы ть наукой об ал геб р аи ­
Э. Ш тейниц (1871-1928) чески х уравнениях, реш ительно в стала
Э. Н ётер (1882-1935) на аксиом ати ческий и го р азд о более
§ 2. Некоторые модельные задачи 15

Э. А р ти н (1898-1962) а б ст р а к т н ы й п у т ь разв и ти я.
Н. Б у р б а к и “Э лем енты м а т е м а т и ­
ки” .
Вошёл в обиход я зы к теори и колец, модулей, к ат е го р и й , гомологий. М ногие
разрозненны е теори и оказались уложены в общ ую схему универсальной ал­
гебры . Н а сты ке алгебры и м атем ати ч еско й логики роди лась тео р и я моделей.
С тар ы е теори и обновились, расш ирив область своих применений. П рим ером
здесь м о гу т служ и ть соврем енная ал гебраи ческ ая гео м етр и я, алгебраи ческ ая
топология, ал гебраи ческ ая A -теори я, тео р и я ал гебраи ческ и х групп. Н есколь­
ко яр к и х взлётов и сп ы тал а тео р и я конечны х групп.
Вся алгебра находится сейчас в состоянии динамического разви­
тия. Крупные заслуги в этом принадлежат математикам России. Вы­
сокий уровень алгебраических исследований в нашей стране многим
обязан таким учёным, как Н.Г. Чеботарёв (1894-1947), О.Ю. Шмидт
(1891-1956), А.И. Мальцев (1909-1967), А.Г. Курош (1908-1971),
П.С. Новиков (1901-1975), Д.К. Фаддеев (1907-1989).

§ 2. Н ек о т о р ы е м одел ьн ы е за д а ч и

Формулируемые ниже четыре задачи стоят на разных уровнях.


Первые три, сами по себе тоже неравноценные, предназначены ис­
ключительно для мотивировки исследования полей разных типов,
линейных пространств, групп и их представлений, т.е. тех алгебраи­
ческих теорий, о которых речь будет ниже. “Решениям” этих задач
посвящено много специальных монографий. Четвёртую задачу, пред­
варяющую изучение линейных систем, полезно попробовать тут же
решить, не заглядывая в следующий параграф, где приводится нуж­
ное рассуждение.
1. З а д а ч а о р а зр еш и м о сти уравн ен ии в радик алах. Из
элементарной алгебры известна формула
-Ь ± \/ 62 - 4ас
s i ,2 = ( 1)

для решений я д , к в а д р а т н о г о уравнения ах 2 + Ъх + с = 0.
Уравнение третьей степени
х 3 + ах 2 + Ьх + с = 0
подстановкой х i-Э х —а/3 приводится к виду х 3 + рх + q = 0. Корни
х\,Х 2 ,х% этого уравнения следующим образом выражаются через его
коэффициенты. Если положить
- 1 + лЛЗ
D = -Ар 3 - 2 7 q2,
( 2)
и=
16 Гл. 1. Истоки алгебры

(кубические корни выбираются так, что uv = —3р), то можно пока­


зать, что
x i = ^(u + v), x2 = ^ ( s 2u + sv ), x, = ^ ( su + s 2 v ). (3)
Формулы (2) и (3), называемые формулами Кардано (1545 г.) и
ассоциирующиеся также с именами других итальянских математи­
ков эпохи Возрождения (С. Ферро, Н. Тарталья), равно как и фор­
мула (1), справедливы при любых буквенных коэффициентах а, 5,
с, р, д, которым можно придать, например, произвольные рацио­
нальные значения. Аналогичные формулы были найдены для кор­
ней уравнения четвёртой степени, и на протяжении почти трёхсот
лет предпринимались безуспешные попытки “решить в радикалах”
общее уравнение пятой степени. Лишь в 1813 г. А. Руффини (в пер­
вом приближении) и в 1827 г. Н. Абель (независимо и совершенно
строго) доказали теорему о том, что общее уравнение
х п а\хп ^ 4- ... 4- ап — О
при п > 4 не разрешимо в радикалах.
Фундаментальное открытие в этой области было сделано двадца­
тилетним Эваристом Галуа в 1831 г. (оно стало известным лишь в
1846 г.), когда он дал универсальный критерий для разрешимости в
радикалах любого (например, с рациональными коэффициентами), а
не только общего уравнения степени п. Каждому многочлену (урав­
нению) степени п он сопоставил поле разложения и конечное семей­
ство (мощности не более п!) автоморфизмов этого поля, называемое
теперь группой Галуа поля (или исходного многочлена).
Более подробно мы остановимся на теории Галуа в [ВА III], где
будет выделен чисто внутренними свойствами специальный класс
так называемых разрешимых групп. Оказывается, уравнение сте­
пени п с рациональными коэффициентами разрешимо в радикалах
в точности тогда, когда разрешима соответствующая ему группа
Галуа. Пусть, например, дано уравнение пятой степени
ж5 —аж —1 = 0,
где а — некоторое целое число. Ему отвечает группа Галуа Ga, за­
висящая каким-то сложным образом от a; Go — циклическая группа
порядка 4 (а все циклические группы разрешимы по определению) и
уравнение
ж5 —1 = 0
разрешимо в радикалах. Напротив, G\ имеет то же строение, что и
симметрическая группа S$ порядка 120, а последняя, как показано
в [ВА III], неразрешима. Следовательно, неразрешимо в радикалах и
уравнение
ж5 —х —1 = 0.
§ 2. Некоторые модельные задачи 17

Отметим в заключение, что для практических нужд возможность


выразить корень алгебраического уравнения в явном виде через ра­
дикалы существенного значения не имеет; более актуальны разные
приближённые методы вычисления корней. Но это обстоятельство не
умаляет красоты достижения Галуа, оказавшего сильнейшее идей­
ное воздействие на последующее развитие математики. Начать с то­
го, что именно Галуа заложил основы теории групп. Установленное
Э. Галуа взаимно однозначное соответствие между подполями поля
разложения и подгруппами его группы Галуа в XX веке обогатилось
новыми абстрактными конструкциями и стало незаменимым сред­
ством исследования математических объектов.
2. З а д а ч а о состоя н и я х м н ого а т о м н о й молекулы . Каждую
молекулу можно рассматривать как систему частиц — атомных ядер
(окружённых электронами). Если в начальный момент времени кон­
фигурация системы близка к равновесной, то при определённых усло­
виях частицы, входящие в систему, всегда будут оставаться
вблизи положений равновесия и не будут приобретать больших ско­
ростей. Движения такого типа называются колебаниями относи­
тельно равновесной конфигурации, а система — устойчивой.
Известно, что любое малое колебание молекулы вблизи положе­
ния устойчивого равновесия является суперпозицией так называе­
мых нормальных колебаний. Во многих случаях удаётся определить
потенциальную энергию молекулы и её нормальные частоты, при­
нимая во внимание внутреннюю симметрию молекулы. Симметрия
молекулярной структуры описывается точечной группой молекулы.
Различные реализации этой конечной группы (её неприводимые пред­
ставления) и связанные с этими реализациями функции на группе
(характеры представлений) определяют параметры колебаний моле­
кулы.
Например, молекуле воды Н2О (рис. 1) отвечает четверная груп­
па Клейна (прямое произведение двух циклических групп второго
порядка), а молекуле фосфора Р 4 (рис. 2), имеющей вид правильного

тетраэдра, в вершинах которого расположены атомы фосфора, —


симметрическая группа S4 порядка 24. Неприводимые представления
этих групп будут изучены в [ВА III].2
2 А .И. К о стр и к и н
18 Гл. 1. Истоки алгебры

В настоящее время развитие структурной теории молекул труд­


но себе представить без помощи теории групп. Гораздо более ран­
ние применения теории групп относятся к кристаллографии. Ещё в
1891 г. великий русский кристаллограф Е.С. Фёдоров, а затем немец­
кий ученый А. Шёнфлис нашли 230 пространственных кристаллогра­
фических групп, описывающих все имеющиеся в природе симметрии
кристаллов. С тех пор теория групп постоянно используется для ис­
следования влияния симметрии на физические свойства кристалла.
3. З а д а ч а о к одир ован ии сообщ ен и я . В конструировании
автоматических систем связи, наземных или космических, обычно в
качестве элементарного сообщения берётся упорядоченная последо­
вательность — строка (или слово)
а = (ai,a2, ... ,ап)
длины п, где а,{ = 0 или a* = 1. Так как обычные операции сложения
и умножения по модулю 2 хорошо приспособлены для выполнения
на электронной машине, а сами символы 0, 1 удобны для передачи в
виде электрических сигналов (1 и 0 отличаются фазой разделённых
по времени сигналов или их наличием и отсутствием), то неудиви­
тельно, что поле GF(2) (см. § 3 гл. 4) — необходимый атрибут спе­
циалиста по переработке информации. Иногда удобно использовать
в качестве элементы других конечных полей.
С целью исключения влияния помех (атмосферных разрядов, кос­
мических шумов и т. д.), способных превратить 0 в 1 и обратно,
приходится брать а достаточно длинным и использовать специаль­
ную систему кодирования — выбор такого подмножества (кода) So
передаваемых строк (кодовых слов) из всего их множества 5, чтобы
было возможно восстановить а по полученному искажённому слову
а' при условии, что произошло не слишком много ошибок. Так воз­
никают коды, исправляющие ошибки.
Алгебраическая теория кодирования, сильно развившаяся за по­
следние годы и предложившая много остроумных методов кодиро­
вания, имеет дело в основном со специальными линейными кодами,
когда выбор So связан с построением специальных прямоугольных
матриц и решением систем линейных уравнений, коэффициенты ко­
торых принадлежат заданному конечному полю. Простой пример та­
кого кода будет приведён в гл. 4.
4. З а д а ч а о н а г р е т о й пластинке. Плоская прямоугольная
пластинка с тремя отверстиями (рис. 3) используется в качестве кла­
пана одного фантастического устройства для получения низких тем­
ператур.
На клапан нанесена квадратная сетка (решётка). Её вершины,
лежащие на четырёх контурах, называются граничными^ а все ос­
тальные вершины — внутренними. Непосредственное измерение
§ 3. Системы линейных уравнений. Первые шаги 19

показывает, что при любом нагревании или охлаждении температу­


ра в каждой внутренней вершине является средней арифметической
величиной от температур ближайших четырёх вершин — неважно,
граничных или внутренних. Ожидается, что детали устройства,

100

1C)0: —27с5 ■ 50

50
Рис. 3
соприкасаясь с различными участками контуров, сообщат соответст­
вующим граничным точкам указанную на рис. 3 температуру.
Возможно ли это, а если возможно, то однозначно ли при этом расп­
ределение температуры во внутренних точках?

§ 3. С и стем ы л и н ейн ы х урав н ен и й . П ервы е ш аги

Линейные уравнения ах = b и системы вида


ах + Ъу = е, m
сх + dy = / ' '
с вещественными (действительными) коэффициентами a, b, с, d, е, /
“решаются” в средней школе. Наша цель — научиться оперировать
с системой линейных алгебраических уравнений (или, коротко, с ли­
нейной системой) самого общего вида
ацХ\ + &12^2 + ... + ainx n = bi,
&21^1 + а22%2 + • • • + CL2nx n = ^2> /г>\

Q"mlx l “Ь &т2 + • • • + &тпх п — •


Здесь ш и п — произвольные целые положительные числа.
Будучи, казалось бы, чисто количественным, усложнение, полу­
чающееся при переходе от (1 ) к (2), имеет на самом деле принципи­
альное значение. Системы вида (2) встречаются буквально во всех
разделах математики, и так называемые линейные методы, конеч­
ным продуктом которых часто являются решения линейных систем,
составляют её наиболее развитую часть. Достаточно упомянуть, что
теория систем вида (2) послужила в конце XIX века прототипом для
создания теории интегральных уравнений, играющей исключительно
2
20 Гл. 1. Истоки алгебры

важную роль в механике и физике. Решение большого числа практи­


ческих задач на ЭВМ также сводится к системам (2).
1. Т ерм инология. Следует обратить внимание на весьма эко­
номное и удобное обозначение коэффициентов системы (2): коэффи­
циент ctij (читается а-и-жи; например, ац есть а-один-два, но ни­
как не а-двенадцать) стоит в г-м уравнении при j -й неизвестной Xj.
Число bi называется свободным членом г-го уравнения. Система (2)
называется однородной, если Ъ{ = 0 для г = 1,2,..., ш. При любых bi
линейную систему
CLuXi + CI12 X2 + . . . + СЦпх п = 0,
^ 21^1 + CL22%2 + • • • + Ci2n%n = 0, ^ 0^

&т1% 1 Н- ^га2 + • • • + 0"тп%п —0


называют однородной системой, ассоциированной с системой (2) или
ещё — приведённой системой для системы (2). Коэффициенты при
неизвестных составляют прямоугольную таблицу
ац а\2 ain
^21 а22 а2п
(3 )

am l аm2 • • ашп
называемую матрицей размера т х п (ш х п-матрицей или квадрат­
ной матрицей порядка п при т = п) и сокращённо обозначаемую
символом {a,ij) или просто буквой А. Естественно говорить об i -й
строке (a^i, а{2, . . . , am) матрицы (3) и о j -м столбце
a ij
a 2j

Amj
который в дальнейшем, ради экономии места, будет изображаться
строкой, заключённой в квадратные скобки: [aij, <22j , . .., amj-]. В слу­
чае квадратной матрицы говорят ещё о главной диагонали, состоя­
щей из элементов ац , а 22, • • •, апп. Матрица (а^), у которой все эле­
менты вне главной диагонали равны нулю, обозначается иногда
diag(au,a 225••• 5апп)
и называется диагональной матрицей, а при ац = 022 = ... = апп = а
обозначается diagn(a) (скалярная матрица). Для матрицы diagn(l),
называемой единичной матрицей, обычно используется обозначение
Еп или Е, когда размер матрицы фиксирован.
§ 3. Системы линейных уравнений. Первые шаги 21

Наряду с матрицей (3) рассматривают и расширенную матрицу


(aij\bi) системы (2), получаемую из (3) добавлением столбца
[Ьъ &2, . .., &т] свободных членов; для ясности он отделён от осталь­
ных столбцов вертикальной чертой.
Если каждое из уравнений системы (2) обращается в тождество
после замены неизвестных xi числами х®, то упорядоченный набор
из п чисел xj, ж!],..., ж?г называется решением системы (2), a i j —
его г-й компонентой. Говорят также, что набор xj, ж!],. .., УД0В~
летворяет всем уравнениям системы (2). Система, не имеющая ни
одного решения, называется несовместной. Если же у системы есть
решения, то она называется совместной и притом определённой, коль
скоро решение единственно. Решений может быть и более одного,
тогда система называется неопределённой. Совместна ли данная си­
стема линейных уравнений, а если совместна, то каковы все её реше­
ния — вот ближайшие вопросы, на которые нужно получить ответ.
П осм отри м ещё раз на зад ач у п. 4 § 2. П ронум еруем все внутрен ние т о ч к и
п ластинки произвольны м образом от 1 до 416 (именно
/ Ъ 9
столько их на рис. 3), добавим к ним 204 ном ера г р а ­
ничны х т о ч е к и в с о о тв етств и и с задан н ы м правилом вы ­ а с
числения тем п е р ат у р ы t{ во вн утрен ней точк е с номером е
г составим 416 соотнош ений ти п а
к d h
toe + tb + tc + td
te =
Рис. 4
П усть, скаж ем , а, 6, с <С 416, d > 416. Т огд а это соотнош ение можно перепи­
с ат ь в виде линейного уравнения

—ta — tb — tc + 4 t e — td
с правой частью td = - 2 7 3 ,- 1 0 0 ,- 5 0 ,0 ,5 0 ,1 0 0 ,3 0 0 (возм ож ны и другие вар и ­
ан ты ). В зяты е вм есте эти уравнения с о ст ав я т к в ад р ат н у ю линейную систему
ви да (2) с п — т — 416. К оэф ф ици енты при н еизвестны х t{ равн ы 0 (их боль­
ш инство), —1 или 4. Я в л яется ли э т а систем а совм естной и определённой?
М ы получили иную, м атем ат и ч е с к и точную ф орм улировку зад ачи к а ч е с т ­
в е н н о г о х а р а к т е р а . Вопрос о сущ ествовании и единственн ости весьм а типичен
для м ногих разделов м ат е м ат и к и , связан ны х с изучением ф изически х явлений.

2. Э к в и в ал ен тн ость линейны х си стем . Пусть нам дана ещё


одна линейная система того же размера
а'цХх + ci'i2х 2 + ... + CLinx n = 6^,
6^21^1 + а 22Х 2 + •••+ CL2nX n = /0 /ч

С1 т\ х 1 ®гп2 Н- • • • Н- &тп Жп Ьш•


Будем говорить, что система (2') получена из (2) при помощи
элементарного преобразования типа (I), если в системе (2) все урав­
нения, кроме г-ro и к-то, остались прежними, а г-е и к-е уравнения
поменялись местами. Если же в (2') все уравнения, кроме г-ro, те же,
22 Гл. 1. Истоки алгебры

что и в (2), а г-е уравнение имеет вид


ifiil Т {clin Т C(Lkn^)%n — Т (*)
где с — какое-то число (т.е. а - = а ^ + с а ^ , Ь\ — bi + cbk), то полагаем,
что к системе (2) применено элементарное преобразование типа (II).
Линейные системы (2) и (2') называются эквивалентными, если
обе они либо несовместны, либо совместны и обладают одними и те­
ми же решениями. Условившись обозначать эквивалентность систем
(а) и (b) так: (а) ~ (6), мы замечаем, что (а) ~ (а), из (а) (Ь)
следует (Ь) ~ (а), а из (а) ~ (Ь) и (Ь) ~ (с) следует (а) ~ (с).
Достаточный признак эквивалентности систем содержится в сле­
дующем утверждении.
Т е о р е м а 1. Две линейные системы эквивалентны, если одна
получается из другой путём применения конечной последователь­
ности элементарных преобразований.
Д о к а з а т е л ь с т в о . Достаточно установить эквивалентность
системы (2) и системы (2'), полученной из (2) путём применения од­
ного элементарного преобразования.
Заметим, что система (2) получается из (2') также в результа­
те применения одного элементарного преобразования, поскольку эти
преобразования обратимы. Другими словами, в случае (I), переста­
вив ещё раз местами уравнения с номерами г и к, мы вернёмся к
первоначальной системе; аналогично в случае типа (II), прибавив к
г-му уравнению в (2Д fc-e, умноженное на (—с), мы получим г-е урав­
нение системы (2).
Докажем теперь, что любое решение (xj , . .., х^) системы (2) явля­
ется также решением системы (2'). Если было произведено элемен­
тарное преобразование типа (I), то сами уравнения вообще не из­
менились (изменился только порядок их записи). Поэтому числа xj,
# 2, • • • 5жп, удовлетворявшие им ранее, будут удовлетворять им и по­
сле преобразования. В случае элементарного преобразования типа
(II) уравнения, кроме г-го, не изменились, и поэтому решение (ж^,
# 2, • • •, х п) им по-прежнему удовлетворяет. Что касается г-го уравне­
ния, то оно приобрело вид (*). Так как наше решение удовлетворяет
г-му и к-му уравнениям системы (2), то
СЬц Х® + . . . + CLinX^ = bi,
akiXi + ... + акпх°п = Ьк.
Умножив обе части последнего тождества на с и прибавив его к пер­
вому, мы получим, группируя члены, тождество вида (*) с Х{ — х®.
В силу отмеченной выше обратимости элементарных преобразо­
ваний проведённое рассуждение показывает также, что, обратно, лю­
бое решение системы (2Д будет решением системы (2).
§ 3. Системы линейных уравнений. Первые шаги 23

Осталось заметить, что несовместность одной системы влечёт


несовместность другой (рассуждение от противного). □
3. П ри в еден и е к ст у п ен ч а т о м у в и ду. Путём последователь­
ного применения элементарных преобразований можно перейти от
заданной системы уравнений к системе более простого вида.
Во-первых, заметим, что среди коэффициентов ац имеется хотя
бы один, отличный от нуля. В противном случае не имело бы смыс­
ла упоминать о неизвестной х\. Если ац = 0, то поменяем местами
(преобразование типа (I)) первое уравнение с таким j- м, что од ф 0.
Теперь коэффициент в первом уравнении при первой неизвестной от­
личен от нуля. Обозначим его через а'ц. Вычтем из г-ro уравнения
(г = 2 , 3, .. ., т) новой системы первое уравнение, обе части которого
умножены на такой коэффициент q , чтобы после вычитания коэф­
фициент при х\ обратился в 0 (ш —1 элементарных преобразований
типа (II)). Очевидно, что для этого нужно положить q = ац/а'ц.
В результате мы получим систему, в которой х\ входит только в
первое уравнение. При этом может оказаться, что вторая неизвест­
ная также не входит во все уравнения с номером г > 1. Пусть Xk —
неизвестная с наименьшим номером, которая входит в какое-нибудь
уравнение, не считая первого. Мы получим систему
а'1 1 х 1+ ...+ а ' 1 пх п =Ъ[,
а'2 кХк+ ... +а'2 пх п =Ь'2,

Не обращая теперь внимания на первое уравнение, применим ко


всем оставшимся те же рассуждения, что и ранее. После ряда эле­
ментарных преобразований исходная система примет вид
(l'] \ X1 + ... + а”пх п = &'/,
а2 кх к + ... + а 2 пх п =Щ,
а31Х1+ ••• + а3пх п = Щ,

ат1 х 1 + • • • + а — &Ш)
1> к > 1, а"! ф 0, а'ы ф 0.
Разумеется, здесь = a[j,b" = b[, ибо первое уравнение не затра­
гивалось. Будем применять этот процесс до тех пор, пока возможно.
Ясно, что мы будем вынуждены остановиться, когда станут равными
нулю не только коэффициенты при очередной неизвестной (скажем,
24 Гл. 1. Истоки алгебры

s-й), но и коэффициенты при всех следующих неизвестных вплоть до


п-й. При этом система (2) примет вид
ацХ± ••• + =
&2 kx k Т • • • Т Cl2n%n —^25
&3lxl + ... + ^ з пЖп = 6з,
................................... (4)
d rsXS Т • • • Т CLrnX n —
О= &r+i,
0 = ьт .
Здесь
^11^2к^31 • • • 7^ 0, 1 < к <1 < ... < S.
Может оказаться, что г = ш, и поэтому уравнений вида 0 = bi в
системе (4) не будет. Про систему уравнений вида (4) говорят, что
она имеет ступенчатый вид.
Этот термин не является общепринятым; здесь можно было бы
говорить о трапецевидном или о квазитреуголъном виде и т.п., что
не так уж существенно.
Т е о р е м а 2. Всякая система линейных уравнений эквивалентна
системе, имеющей ступенчатый вид.
Доказательство непосредственно вытекает из предшествующих
рассуждений.
Элементарные преобразования иногда удобно производить не над
системой, а над её расширенной матрицей (а^- | ЬД. Точно так же, как
и теорема 2 , доказывается
Т е о р е м а 2'. Всякую матрицу можно при помощи элементар­
ных преобразований привести к ступенчатому виду.
4. И сследован ие си стем ы л инейны х уравн ен ии. Ввиду
теорем 1 и 2 вопросы совместности и определённости достаточно
исследовать для систем ступенчатого вида (4).
Начнём с вопроса о совместности. Очевидно, что если система (4)
содержит уравнение вида 0 = bt с bt Ф 0, то эта система несовместна,
так как равенство 0 = bt нельзя удовлетворить никакими значениями
для неизвестных. Докажем, что если таких уравнений в системе (4)
нет, то эта система совместна.
Итак, пусть bt = 0 при t > г. Назовём неизвестные яд, ад, ж/, ...
. ..,ад, с которых начинаются первое, второе, ..., r -е уравнения,
главными, а остальные неизвестные, если таковые имеются, — сво­
бодными. Главных неизвестных по определению всего г.
Придадим свободным неизвестным произвольные значения и под­
ставим их в уравнения системы (4). Тогда для x s получится одно (г-е)
§ 3. Системы линейных уравнений. Первые шаги 25

уравнение вида axs = b с а = ars ф 0, которое имеет единственное


решение. Подставляя найденное значение x s = х® в первые г —1 урав­
нений и поднимаясь так снизу вверх по системе (4), мы убедимся в
том, что значения для главных неизвестных определяются однознач­
но при любых заданных значениях для свободных неизвестных.
Нами доказана
Т е о р е м а 3. Для совместности системы линейных уравнений
необходимо и достаточно, чтобы после приведения к ступенчато­
му виду в ней не оказалось уравнений вида 0 = bt с bt Ф 0. Если
это условие выполнено, то свободным неизвестным можно придать
произвольные значения; главные неизвестные (при заданных значе­
ниях для свободных) однозначно определяются из системы.
Выясним теперь, когда система будет определённой, в предполо­
жении, что введённое нами условие совместности выполнено. Если
в системе (4) имеются свободные неизвестные, то система заведомо
неопределённа: мы можем придать свободным неизвестным любые
значения, выражая через них (по теореме 3) главные неизвестные.
Если же свободных неизвестных нет, и все неизвестные, стало быть,
главные, то по теореме 3 они определяются из системы однозначно,
так что система является определённой.
Остается заметить, что отсутствие свободных неизвестных рав­
носильно условию г = п.
Мы доказали следующее утверждение.
Т е о р е м а 4. Совместная линейная система (2) является опре­
делённой тогда и только тогда, когда в полученной из неё ступен­
чатой системе (4) выполняется равенство г = п.
При т — п линейную систему, приведённую к ступенчатому
виду, можно записать ещё так (треугольный вид):
ацХ\ + &12 Х2 + . . . + 6 \nXn = bi,
622 X2 + ••• Т б2п — ^21
(5)

0"ппХп—Ьп,
если не заботиться о том, чтобы выполнялось условие ац ф 0 для всех
i. Действительно, запись (5) означает, что в системе k-е уравнение не
содержит неизвестных Х{ с i < к, а это условие заведомо выполнено
для систем ступенчатого вида.
Заметим на будущее, что матрица (а^) с элементами ац — О
при г > j называется верхней треугольной. Аналогично определяется
нижняя треугольная матрица.
Из теорем 3 и 4 вытекает
С л е д с т в и е 1. Линейная система (2) в случае т — п является
совместной и определённой тогда и только тогда, когда после
26 Гл. 1. Истоки алгебры

приведения к ступенчатому виду получится система (5) с


О'ЦО'22 • • •^пп О*
Обратим внимание на тот факт, что это условие не зависит от
правых частей системы. Поэтому при т — п система (2) тогда и
только тогда совместна и определённа, когда это верно для ассоци­
ированной с ней однородной системы (2°). Но однородная система
всегда совместна: она имеет, например, нулевое решение
ж? = 0, . .. , х°п = 0.
Условие ацЙ 22 • • •йпп ф 0 означает, что однородная система
обладает только нулевым решением. Мы приходим к иной форме
следствия 1 , не связанной с её ступенчатым видом.
С л е д с т в и е 1'. Линейная система (2) в случае т = п являет­
ся совместной и определённой тогда и только тогда, когда ассо­
циированная с ней однородная система (2°) имеет только нулевое
решение.
Специального внимания заслуживает случай п > т.
С л е д с т в и е 2 . Совместная система (2) при п > т является
неопределённой. В частности, однородная система при п > т всег­
да имеет ненулевое решение.
Д о к а з а т е л ь с т в о . Действительно, в любом случае г ^ ш,
поскольку в системе (4) не больше уравнений, чем в системе (2) (урав­
нения с тождественно равными нулю левыми и правыми частями от­
брошены). Поэтому неравенство п > т влечёт п > г, что по теоре­
ме 4 означает неопределённость системы (2). Остаётся заметить, что
неопределённость однородной системы равносильна существованию
у неё ненулевого решения. □
Часть полученных нами результатов отражена в следующей
таблице.
Тип линейной систем ы
общ ая однородная п > т п > т
неоднородная неоднородная
| Число реш ений 0, 1, оо 1, оо 0, оо оо

5. О тдельны е зам еч ан и я и прим еры . Изложенный нами


метод решения систем линейных уравнений называется методом
Гаусса или методом последовательного исключения неизвестных.
Весьма удобный при небольших п, он годится и для осуществления
на ЭВМ, хотя по разным причинам более практичными зачастую
оказываются другие способы решения, например итерационные. Это
относится в особенности к тому случаю, когда коэффициенты даны,
а решения ищутся с определённой степенью точности. В теоретиче­
ских исследованиях, однако, первостепенное значение приобретают
формулировка условий совместности или определённости линейной
§ 3. Системы линейных уравнений. Первые шаги 27

системы, а также нахождение общих формул для решений в терми­


нах коэффициентов и свободных членов без приведения системы к
ступенчатому виду. В какой-то мере одному из этих требований от­
вечает следствие V .
П р и м е р 1. В новь обрати м ся к задаче о н а гр е т о й пластинке из § 2. К а к мы
видели в п. 1, интересую щ ий нас вопрос в ы р аж ае т ся в свой ствах вполне к о н к р е т ­
ной линейной систем ы (для определённости назовём ее НП) с довольно большим
числом неизвестны х t{. Следуя к ри тери ю , сф орм улированн ом у в следствии Г ,
рассм отри м однородную линейную систем у (О Н П ), ассоциированную с НП. Д ру­
гим и словами, т е м п е р ат у р а всех гран и ч н ы х то ч е к пластинки п ри ним ается теп ерь
равной нулю. П усть е — номер внутрен ней то ч к и с м а к с и м а л ь н ы м зн аче­
нием \te \- Т огд а из условия
+ _ ta + tfr + tc + td
te - -
в ы т е к а е т \te \ = \ta \ = \tb\ = \tc \ = |Cz|- С двигаясь на один ш аг реш ётки в любом
из ч еты р ёх направлений, мы будем проходить через то ч к и с тем ж е значением
\t{ \ = |t e |, пока не дости гн ем грани чной то ч к и с нулевой тем п ер ату р о й . З н а ч и т,
\te \ = 0, а поэтом у и t{ = 0 для всех г. И т ак , систем а ОН П им еет лиш ь нулевое
реш ение, и, стало бы ть, НП — совм естная и определённая линейная система.
З а д а ч а о н а гр е т о й пластинке в первоначальной её постановке тем сам ы м реш ена.
П р и м е р 2. Д ан а линейная систем а
XI = 1,
Х2
‘ = 1,
- Х\- Х2 +ЖЗ = О,
Х п —2 Хп —1 Т Хп = 0.
О чевидно, ч т о это — совм естная определённая систем а, уж е приведённая к с ту ­
пен ч атом у (треугольном у) виду. Только, реш ая ее, нуж но д в и гаться не снизу
вверх, а сверху вниз. Реш ением явл яется по определению последовательность
первы х п чисел Фибоначчи J i , / 2 , • • •, fn- Э ти числа связан ы с одним б о тан и ­
ческим явлением, т а к назы ваем ы м филлотаксисом (располож ением листьев на
растен и ях). О днако при п = 1000 или даж е при произвольном п хотелось бы
у к а з а т ь общее вы раж ен ие (анали тическую ф орм улу) для n -го числа Ф ибоначчи.
Вы м ож ете в о зр ази ть, сказав, ч т о у вас х в а т и т терпени я у к а з а т ь и /ю о о , следуя
ин дукти вн ом у определению эти х чисел. Но это не будет м ат ем ати ч ески м реш е­
нием вопроса. В гл. 2 и гл. 3 мы укаж ем два вы раж ен ия для / п , хотя, конечно,
эту кон к ретн ую зад ач у можно реш и ть и более прям ы м и средствам и.
З а м е ч а н и е 1. Иногда бывает удобнее находить решения ли­
нейной системы, не приводя её к ступенчатому виду. Это особенно
относится к тому случаю когда матрица системы содержит много
нулей. Небольшая практика здесь предпочтительнее длинных объяс­
нений.
З а м е ч а н и е 2. Какое количество Гп арифметических операций
необходимо выполнить для решения системы п линейных уравнений с
п неизвестными методом Гаусса? Это не праздный вопрос, поскольку
ставшему обыденным в наши дни использованию ЭВМ при больших
п должны предшествовать априорные оценки машинного времени,
требуемого для решения задачи.
28 Гл. 1. Истоки алгебры

Так как умножение двух чисел более трудоёмко, чем сложение, то


рекомендуется подсчитывать только количество умножений и, разу­
меется, делений, называемых далее просто операциями. Без ограни­
чения общности можно предполагать, что решение линейной систе­
мы единственно, т.е. все неизвестные — главные. Правые части урав­
нений пока игнорируем. Тогда для исключения неизвестной х\ из
уравнения с номером г > 1 нужно заготовить число ^ = а ц /а ц (одно
деление) и вычислить ещё п —1 произведений j = 2,3,..., гг, т.е.
всего требуется п операций. Процедурой вычитания из г-го уравне­
ния первого, умноженного на мы условились пренебречь. Так как
i = 2 , 3, .. ., п, то для исключения х\ понадобилось п(п —1 ) операций.
На втором шаге, когда мы имеем дело с системой порядка п — 1,
понадобится (п —1 )(п —2) операций, на третьем — соответственно
(п —2)(п —3) и т.д. Общее число операций для приведения левых
частей системы к треугольному виду (5) равно сумме
Г(п) = п(п —1 ) + (п —1 )(п —2) + ... + 1(1 —1 ).
Нетрудно убедиться (докажите сами или загляните в § 7), что
п 3 —п
3 '
Процесс нахождения компонент ..., х\ решения (движе­
ние снизу вверх по системе (5)) требует всего
п(п + 1 )
1 + 2 + 3 + ... + 71
2
операций. При больших п это не внесёт существенного вклада в
общую сумму операций. Итак, вполне удовлетворительной оценкой
числа операций является (гауссова) величина Гп = п 3 / 3.
В 1969 г. Штрассеном разработан метод (подробности см. в
[ВА II]), требующий только
Шп = С ■п 10^ 7 « С • П2’81
операций, — значительный выигрыш при очень больших п, полу­
ченный, правда, за счёт увеличения числа операций сложения. Но
константа С в Шп чрезвычайно велика, а программа реализации
логически сложна, поэтому речь идёт, скорее, о выигрыше в тео­
ретическом плане.
Оба упомянутых нами метода являются типичными математи­
ческими алгоритмами, приспособленными для решения массовых за­
дач. Позднее мы встретимся с другими примерами алгоритмов. Их
роль в наш век сплошной компьютеризации весьма велика. При этом
важны не только сами алгоритмы, но и оценки их сложности.
§ 4 • Определители небольших порядков 29

§ 4. О п р едел и тел и н ебол ьш и х п орядк ов

Излагал метод Гаусса, мы не слишком заботились о значениях


коэффициентов при главных неизвестных. Важно было лишь то, что
эти коэффициенты отличны от нуля. Проведём теперь более акку­
ратно процесс исключения неизвестных хотя бы в случае квадрат­
ных линейных систем небольших размеров. Это даст нам пищу для
размышлений и исходный материал для построения общей теории
определителей в гл. 3.
Как и в § 3, рассмотрим систему двух уравнений с двумя неиз­
вестными
CLllXi + « 1 2 ^ 2 = Ь ь q \
0>
2 1% 1 + «22^2 = ^2
и постараемся найти общие формулы для компонент реше­
ния.
«11 «12
Назовём определителем матрицы выражение « п «22 —
«21 «22
—*221*212 и обозначим его
«11 *212
«21 «22

Тем самым квадратной матрице сопоставляется число


«11 *212
— « 11«22 — « 21« 12- (2)
«21 «22

Если мы попытаемся исключить Х2 из системы (1), умножив первое


уравнение на *222 и прибавив к нему второе, умноженное на —*212, то
получим
«11 «12
Х\ — Ъ±а22 — & 2«1 2-
«21 «22

Правую часть также можно рассматривать как определитель матри­


bi «12
цы . Предположим, что « 1 1 « 1 2 Ф 0. Тогда мы имеем
ь2 «22 «21 «22

bi «12 «11 bi
ь2 «22 «21 ь2
XI = 5 Х2 (3 )
«11 «12 «11 «12

«21 «22 «21 «22

Имея формулы для решения системы двух линейных уравнений с


двумя неизвестными, мы можем решать и некоторые другие систе­
мы (решать системы — значит находить их решения). Рассмотрим,
30 Гл. 1. Истоки алгебры

например, систему двух однородных уравнений с тремя неизвестны­


ми
ацХ 1 + <212^2 + «13^3 = 0,
(4 )
221^1
< + 222^ 2
< + 223^3
< = 0 .

Нас интересует ненулевое решение этой системы, так что хотя бы


одно из Xi не равно нулю. Пусть, например, жз ф 0. Разделив обе
части на —жз и положив у\ — —Ж1 /Ж3, у 2 = —ж2/жз, запишем систему
(4) в том же виде
Q'llVl + <2122/2 —<213,
С121У1 + CL22IJ2 = <2 2 3 ,
<2ц а \2
что и (1). При предположении Ф 0 формулы (3) дают
<221 <222

<213 <212 <2 ц <212


Ж1 _ <223 <222 ^2 <221 <223
, 2/2 — —
Хз <2 ц <212 ХЗ I <
2ц <212
<221 <222 1 <221 <222

Неудивительно, что мы нашли из системы (4) не сами Ж1 ,Ж2,жз,


а только их отношения: из однородности системы легко следует, что
если (ж?, Ж2, Ж3) — решение и с — любое число, то (сж?, сх\, СЖ3) тоже
будет решением. Поэтому мы можем положить
<213 <212 <2ц <213 <2ц а\2
(5)
<223 <222 <221 <223 <221 <222

и сказать, что любое решение получается из указанного умножением


всех жi на некоторое число с. Чтобы придать ответу несколько более
симметричный вид, заметим, что всегда
а Ь Ь а
1
1

с d d с
как это непосредственно видно из формулы (2). Поэтому (5) можно
записать в виде
<212 <213 <2ц <213 <2ц а\2
Ж1 (б )
<222 <223 <221 <223 <221 <222

<2ц а\2
Эти формулы выведены в предположении, что ф 0. Не-
<221 <222
трудно проверить, что доказанное утверждение верно, если хоть
один из входящих в выражения (6) определителей отличен от нуля.
Если же все три определителя равны нулю, то, конечно, формулы (6)
дают решение (а именно нулевое), но мы не можем утверждать, что
§ 4 • Определители небольших порядков 31

все решения получаются из него умножением на число (рассмотрите


систему, состоящую из двух совпадающих уравнений х±+х 2 +х 3 = 0).
Перейдём теперь к случаю системы трёх уравнений с тремя не­
известными
а ц х 1 + а12 х 2 + а13 х 3 = 0,
a2ixi + а22 х 2 + а23 х 3 = 0,
a3ixi + а32 х 2 + а33х 3 = 0.
Мы хотим исключить из этой системы х 2 и х 3, чтобы получить зна­
чение для х \ . С этой целью умножим первое уравнение на с\ , второе
на С2, третье на сз и сложим их. Подберём С1 ,С2,сз так, чтобы в по­
лучившемся уравнении члены с х 2 и х 3 обратились в нуль. Прирав­
нивая нулю соответствующие коэффициенты, мы получим для с\ , С2
и сз систему уравнений
CL12 C1 + а22 с2 + ^з2Сз = 0,
ai3ci + а23 с2 + аззСз = 0,
относящуюся к тому же типу, что и (4). Поэтому можно взять
а22 CL32 «12 «32 «12 «22
&23 «33 «13 «33 «13 «23

После очевидных изменений мы получаем для х\ выражение

«22 «23 «12 «13 «12 «13


— a 2i + «31 XI
«32 «33 «32 «33 «22 «23

«22 «23 «12 «13 а 12 «13


= h -& 2 + ^3 (7)
«32 «33 «32 «33 «22 «23

Коэффициент при яд называется определителем матрицы


«11 «12 «13
«21 «22 «23
«31 «32 «33

и обозначается
«11 «12 «13
«21 «22 «23
«31 «32 «33

Таким образом, за определитель третьего порядка мы берём выра-


32 Гл. 1. Истоки алгебры

жение
«п «12 «13
«21 «22 «23
«31 «32 «33

«22 «23 «12 «13 «12 «13


— «11 — <221 + «31
«32 «33 «32 «33 «22 «23

— « 1 1 « 2 2 « 3 3 Т « 1 2 « 2 3 « 3 1 Т « 1 3 « 2 1 « 3 2 —« 1 1 « 2 3 « 3 2 —« 1 2 « 2 1 « 3 3 —« 1 3 « 2 2 « З Ъ
( 8)

задаваемое при помощи определителей второго порядка. Легко заме­


тить, что правая часть в равенстве (7) получается из коэффициента
при х\ заменой ац на Ьц a 2i на 62 и a%i на Ъ%. Поэтому равенство (7)
можно записать в виде
«11 «12 «13 h «12 «13
«21 «22 «23 XI = ъ2 «22 «23
«31Ьз « 3 2 « 3 3
«32 «33

Предположим, что коэффициент при х\ отличен от нуля. Тогда,


проведя аналогичные вычисления для х 2 и жз, мы выразим соответ­
ственно Ж1 ,Ж2,жз в виде
h «12 «13 «11 Ъ\ «13 «11 «12 h
ъ2 «22 «23 «21 ъ2 «23 «21 «22 ъ2
Ьз «32 «33 «31 Ьз «33 «31 «32 Ьз
«11 «12 «13 «11 «12 «13 «11 «12 «13
«21 «22 «23 «21 «22 «23 «21 «22 «23
«31 «32 «33 «31 «32 «33 «31 «32 «33

Очевидно, что те же самые рассуждения применимы к системе


из четырёх, пяти и т.д. уравнений с тем же числом неизвестных.
Для этого нам надо сначала вывести формулы, аналогичные (6), для
решений однородной системы трёх уравнений с четырьмя неизвест­
ными; потом в системе четырёх уравнений с четырьмя неизвестными
исключить Х2 , х %,ж4, умножая уравнения на с\ , С2, С3, С4 и складывая
их. Мы найдём значения С{ (г = 1, 2, 3,4) из системы трёх однородных
уравнений.
Коэффициент, получающийся при х\ и строящийся из определи­
телей третьего порядка по образцу (8), мы назовём определителем
четвёртого порядка.
Проводя те же рассуждения с Ж2, жз, Ж4, мы найдём для ж* форму­
лы, аналогичные (9). Так можно продолжать неограниченно. Уверен­
ность в том, что мы когда-нибудь достигнем цели, нам даёт общий
принцип, широко используемый в математике, а именно принцип ма­
тематической индукции (см. § 7).
§ 5. Множества и отображения 33

УП РА Ж Н ЕН И Я

1. Ф орм улу (8) легче зап ом н и ть, если восп ользоваться следующим н агл яд ­
ны м правилом знаков для вы писы вания произведений, входящ их в разлож ение
определителя т р е т ь е го порядка:

Н ай ти аналогичное правило для определителя ч е т в ё р т о го порядка.


2. П о к а за ть , ч т о все ш есть членов в разлож ении определителя т р е т ь е го по­
р я д к а не м о гу т б ы ть одновременно полож ительны м и.
3. П ровери ть, ч то

ац а\ 2 012 ац 021 021 0 а Ъ


0>21 022 022 = 012 022 022 5 —а 0 с
02,1 022 022 012 022 022 -Ь —с 0

§ 5. М н о ж е ст в а и о т о б р а ж е н и я
В предыдущих двух параграфах мы встретились с множествами
элементов разной природы, равно как и с отображениями множеств.
Множество решений данной системы линейных уравнений или пра­
вило, ставящее в соответствие каждой матрице второго порядка её
определитель, — это лишь частные проявления того круга формаль­
ных понятий, знакомство с которым (хотя бы на интуитивном уров­
не) полезно для дальнейшего.
1. М н о ж ест в а . Под множеством, понимают любую совокуп­
ность объектов, называемых элементами множества.
Множества с конечным числом различных элементов могут быть
описаны путём явного перечисления всех их элементов; обычно эти
элементы заключаются в фигурные скобки. Например, {1,2,4, 8} —
множество степеней двойки, заключённых между 1 и 10. Как пра­
вило, множество обозначается прописной буквой какого-либо алфа­
вита, а его элементы — строчными буквами того же или другого
алфавита.
Для некоторых особо важных множеств приняты стандартные
обозначения, которых стоит придерживаться. Так, буквами N, Z, Q,
R обозначают соответственно множество положительных целых чи­
сел (натуральные числа), множество всех целых чисел, множество
рациональных чисел и множество вещественных чисел.
При заданном множестве S включение а Е S указывает на то,
что а — элемент множества S; в противном случае пишут а (£ S.
3 А .И. К о стр и к и н
34 Гл. 1. Истоки алгебры

Говорят, что S — подмножество множества Т и записывают это


S С Т (S содержится в Т), когда имеет место импликация
\/х х G S = > х G Т.
(По поводу обозначений см. раздел “Советы читателю”.)
Два множества S и Т совпадают (или равны), если у них одни и
те же элементы. Символически это записывается так:
S = Т «=>►5 С Т, Т С S
(<^=> — “тогда и только тогда, когда” или “влечёт в обе стороны”).
Пустое множество 0, совсем не содержащее элементов, по опре­
делению входит в число подмножеств любого множества. Если S С Т,
но S ф 0 и S ф Т, то S — собственное подмножество в Т . Для выде­
ления подмножества S С Т часто используют какое-либо свойство,
присущее только элементам из S. Например,
{п G Z | п = 2 т для некоторого m Е Z}
— множество всех чётных целых чисел, а
N = {п е Ъ | п > 0}
— множество натуральных чисел.
Под пересечением двух множеств S и Т понимают множество
S n T = {х\ X е 5, х G г},
а под их объединением — множество
5 U T = {x | x G 5 или ж G Г }.
Пересечение S' П Т может быть пустым множеством. Тогда говорят,
что S и Т — непересекающиеся множества. Операции пересечения и
объединения удовлетворяют тождествам типа
R П (S U Т) = (R П S) U (R П Г),
Л и (S П Г) = (Л и S) П (Л и Т),
проверку которых мы оставляем читателю в качестве упражнения.
Рис. 5 поможет провести несложное рассуждение.
R

Рис. 5
Разностью S \ Т множеств S и Т называется совокупность тех
элементов из S, которые не содержатся в Т. При этом, вообще говоря,
не предполагается, что Т С S. Вместо S \ Т пишут также S —Т.
§ 5. Множества и отображения 35

Если Т — подмножество в S, то запись S \ Т обозначает ещё


дополнение к Т в S. Положив R = S \ Т , будем иметь R П Т = 0,
RU Т = 5. Обратим внимание на соответствие между операциями
пересечения, объединения, дополнения и логическими связками “и”,
“или”, “нет”.
Пусть далее X и Y — произвольные множества. Пару (ж, у) эле­
ментов х G I , у G У, взятых в данном порядке, будем называть упо­
рядоченной парой, считая при этом, что (xi,yi) = (£2, 2/2) тогда и
только тогда, когда яд = £ 2, 2/1 = 2/2-
Декартовым произведением двух множеств X и У называется
множество всех упорядоченных пар (ж, г/):
Х х У = {(ж,?/)|жЕХ, у <ЕY}.
Пусть, например, R — множество всех вещественных чисел.
Тогда декартов квадрат R2 = 1 х М есть просто множество всех
декартовых координат точек на плоскости относительно заданных
координатных осей. Аналогичным образом можно было бы ввести
декартово произведение Х \ х Х2 х Х3 трёх множеств (= (Xi х Х 2 ) х
х Х3 = Х \ х (Х2 х Х3)), четырёх и т.д.
При Х \ — Х2 = ... = X/, пишут сокращённо
Хк=Х х Х х ...х Х
и говорят о Лт-й декартовой степени множества X . Элементами Х к
являются последовательности (или строки) (xi,x2, . . . , ад) длины к.
Чтобы почувствовать различие между множествами X х Y и X U
U У, возьмём за X и У множества конечной мощности (cardinality
(англ.)):
|Х| = CardX = п, |У| = СагбУ = ш.
Тогда
|Х х У| = ш , |Х U У| = п + т - \Х П У|.
Если это не ясно, то нужно перечитать заново все определения.
2. О то б р а ж ен и я . Понятие отображения или функции играет
центральную роль в математике. При заданных множествах X и У
отображение / с областью определения X и областью значений У
сопоставляет каждому элементу х Е X элемент f(x) Е У, обозначае­
мый также /ж или f x. В случае У = X говорят ещё о преобразовании
/ множества X в себя. Символически отображение записывается в
виде / : X — У или X У.
Образом при отображении / называется множество всех элемен­
тов вида /(ж):
1 т / = {/(ж) | ж Е X} = / (X) С У
(1т — от image (англ.)).
3
36 Гл. 1. Истоки алгебры

Множество
/ _1(«/) = {х е х | f(x) = у}
называется прообразом элемента у Е У. Более общо: для Уо С У
положим
Г 1То) = {х G х I f(x) С Fo} = UГ 1(у)-
уег0

Если у е Y \ lm f , то, очевидно, f ~ 1 (y) = 0.


Отображение / : X —>• У называется сюръективным (surjective
(фр).) или отображением на, когда 1 т / = У; оно называется инъ­
ективным (injective (фр).)? когда из ж ф х' следует /(ж) ф /(V ).
Наконец, / : X —>Y — биективное (bijective (фр.)) или взаимно од­
нозначное отображение, когда оно одновременно сюръективно и инъ­
ективно.
Равенство f — g двух отображений означает по определению, что
их соответствующие области совпадают:
X - A Y, X - Т Y,
причём Уж G X /(ж) = д(ж). Сопоставление “аргументу” ж, т.е.
элементу ж G I , значения /(ж) Е У принято обозначать при помощи
ограниченной стрелки: ж н-» /(ж).
П усть, наприм ер, / п — число Ф ибоначчи (см. § 3) с номером п. С о о т в е т ­
ствие п |-э f n определяет отображ ение N —» N, не являю щ ееся ни сю ръективны м ,
ч т о очевидно, ни и н ъ ек ти вн ы м , поскольку f i = / 2 = 1. Если М+ — множ ество
полож ительны х вещ ественны х чисел, то отображ ен и я

/ : К —у К, д : М. —у М._|_ U {0}, h : М._|_ —у М_|_,

определённы е одним и тем ж е правилом х —у ж2, все различны : / ни сю ръективно,


ни ин ъекти вн о, д сю ръективно, но не ин ъекти вн о, а отображ ение h биективно.
Т аким образом , задание области определения и области значения — сущ ествен­
ная ч а с ть определения о тображ ен и я (ф ункции).
Единичным (или тождественным) отображением ex : X —У X
называется отображение, переводящее каждый элемент ж £ X в се­
бя. Если X — подмножество в У ; X С У, то иногда бывает полезным
специальное отображение — вложение I : X —> У, которое каждо­
му элементу ж G I сопоставляет тот же самый элемент, но уже во
множестве У. Отображение / : X —> У называется сужением (или
ограничением) отображения g : X ' У', когда X С X ', У С У'
и Уж G X /(ж) = #(ж). В свою очередь g называется продолжением
отображения /. Например, вложение / : X —>• У есть ограничение
единичного отображения еу : У —>• У.
Нам представится также случай говорить о функциях многих
переменных. Полезно уяснить себе, что введённое выше понятие де­
картовой степени Х п множества X даёт возможность говорить о
§ 5. Множества и отображения 37

функции f( x 1 ,... , жп) многих переменных Х{ Е X , i = 1,..., п, как


об обычном отображении / : Х п —>• У.
Произведением (суперпозицией или композицией) двух отображе­
ний g : U —>• У и / : У —>- РУ называется отображение
f °9 : U ^W ,
определенное условием
( f 0 д)(и) = f(g(u)) V u e и.
То же самое наглядно изображается треугольной диаграммой

V
Про эту диаграмму говорят, что она коммутирует (или комму­
тативна.), т.е. результат перехода от U к РУ не зависит от того,
сделаем ли мы это прямо при помощи f o g или воспользуемся про­
межуточным этапом V. Заметим, что композиция определена не для
любых отображений f u g . Надо, чтобы в предшествующих обозна­
чениях у них было общим множество V. Но композиция двух пре­
образований множества X в себя всегда имеет смысл.
В дальнейшем вместо f o g мы будем писать просто fg. Ясно, что
fe x = /, ey f = f
для любого отображения / : X —у Y . Проверка этого свойства оче­
видна. Важное свойство композиции (произведения) отображений
выражает следующая
Т е о р е м а 1. Композиция отображений подчиняется закону
ассоциативности. Это значит, что если
h: U ->V, g: V W, f: W ^ T
— три отображения, то
f ( g h ) = (f g ) h .

Д о к а з а т е л ь с т в о . Наглядно все необходимые рассуждения со­


держатся в следующей диаграмме:
38 Гл. 1. Истоки алгебры

где а = gh, (5 = fg. В соответствии с формальным определением

равенства отображений нужно просто сравнить значения отображе­


ний f(gh) : U ^ Т и (f g ) h : U —>Т в произвольной “точке” и Е U.
Но согласно определению композиции отображений имеем
(f(gh))u = f{{ghu)) = f(g{hu)) = (fg){hu) = {{fg)h)u. □
Композиция отображений X —у X, вообще говоря, некоммута­
тивна, т.е. f g ф gf. В этом легко убедиться на примере, когда X =
= {а, Ь} — множество из двух элементов, /(а) = b, f(b) = а, д(а) = а,
д(Ь) = а. Другой пример: / и д — постоянные отображения из X в
X, т.е. значения /(ж) и д{х) не зависят от х. Тогда f Ф д = > f g Ф gf.
Некоторые функции имеют обратные. Предположим, что / : X —>
—>Y и д: Y —>X — какие-то отображения, так что композиции fg и
g f определены. Если fg = еу, то / называется левым обратным к д,
а д — правым обратным к /. Когда произведения в любом порядке
являются единичными отображениями:
fg = eY , g f = ех ) (1)
д называется двусторонним обратным (или просто обратным) ото­
бражением для / или к / (а / — обратным отображением к д) и
обозначается / -1 . Итак, /(га) = v <(=> / -1 (^) =
Предположив существование ещё одного отображения д1 : У —
—>• X, для которого
f9 , = eY, д'f — ех , (1')
мы, опираясь на равенства (1), (1') и на теорему 1, получим
д' = ех д' = (gf)g' = g(fg') = geY = д.
Таким образом, двустороннее обратное отображение к / , коль скоро
оно существует, определено однозначно. Это и служит оправданием
для обозначения / -1 .
Т е о р е м а 2. Отображение f : X ^ Y тогда и только тогда
имеет обратное, когда оно взаимно однозначно (биективно).
Д о к а з а т е л ь с т в о теоремы опирается на следующую лемму,
представляющую самостоятельный интерес.
Ле мма . Если
f:X^Y, g:Y^X
— любые отображения, для которых g f = ех, то / инъективно, а
g сюръективно.
Д о к а з а т е л ь с т в о . В самом деле, пусть х,х ' Е X и /(ж) =
= fix'). Тогда
х = ех (х) = ( g f ) x = g ( f x ) = (.g f ) x 1 = ех (х') = х ' .
§ 5. Множества и отображения 39

Стало быть, / инъективно. Если, далее, ж — любой элемент из X, то


X = ех(х) = (gf ) x = g(fx),
а это доказывает сюръективность д. □
Возвращаясь к теореме 2, предположим вначале, что / обладает
обратным д = / -1 . Тогда из равенств (1) и из леммы вытекает как
сюръективность, так и инъективность /. Другими словами, / биек­
тивно. Обратно: предположив / биективным, мы для любого у Е Y
найдём е д и н с т в е н н ы й элемент х Е X, для которого f(x) = у.
Положив д(у) = ж, мы определим отображение д: Y —>X, обладаю­
щее свойствами (1). Значит, / -1 = д. □
С л е д с т в и е . Из биективности отображения f : X ^ Y выте­
кает биективностъ / -1 , причём
( Г 1 ) - 1 = /• (2)
Пусть, далее, f : X Y, h: Y —>• Z — биективные отображения.
Тогда биективна и их композиция h f , причём
(h f)-1 = r 1h ~ 1 . (3)

Д о к а з а т е л ь с т в о . По теореме 2 биективность / влечёт су­


ществование / -1 , что в силу той же теоремы эквивалентно биек­
тивности / -1 . Симметричность условий (1), переписанных в виде
/ / -1 = еу, / -1/ = ех, даёт равенство (2). Далее, по условию и по
теореме 2 существуют отображения
Г 1: Y -Э X, h - 1: Z ^ Y
и их композиция

Из равенств
( /i/) ( /-1 fr-1 ) = ( ( /i/) /_1)/i_1 = ( / i ( / / _1))/i_1 = hh~x = ez,
( / _1/i_1) ( /i /) /_1(/i_1(/i/)) = f ~ 1 {{h~1 hh)f) = / _1/ = ex
вытекает, что / -1/i-1 — обратное отображение к /. □
Отображение “следования” сг : N —>• N, определённое правилом
сг(п) = п + 1, инъективно, но не сюръективно, поскольку первый эле­
мент (единица) не принадлежит Im сг. Интересно, что для конечных
множеств подобная ситуация невозможна.
Т е о р е м а 3. Если X — конечное множество и преобразование
/ : X —>• X инъективно, то оно биективно.
Д о к а з а т е л ь с т в о . Нужно лишь показать, что / сюръективно,
т.е. для любого элемента х Е X найдётся х' с /(ж7) = ж. Положим
/*0*0 = / ( / • • • (/ж) • • •) = / Щ -1®), * = 0,1,2,...
В силу конечности X в этой последовательности элементов должны
быть повторения. Пусть, скажем, / т (ж) = / п(ж), т > п. Если п > О,
40 Гл. 1. Истоки алгебры

то из / ( / m_1 х) = f ( f n - 1 x) и из инъективности / следует равенство


f 171-1 (х) = / п_1(ж). Повторив достаточное число раз сокращение /,
мы придём к равенству
Г ~ п(х) = f { x ) = е(х) = х.
А в таком случае /(V ) = ж, где х' = f m~n~ 1 {x). □
Как легко понять, сюръективное преобразование конечного мно­
жества в себя также биективно.
Несколько слов о мощности. Считается, что два множества X
и Y имеют одинаковую мощность тогда и только тогда, когда су­
ществует биективное отображение / : X —> Y. Множества той же
мощности, что и N (или Z), называются счётными.

УП РА Ж Н ЕН И Я

1. П усть П = { + , —, Н—Ь, + —, — Ь , , + + + , • • • } — м нож ество всех конеч­


ны х последовательностей плюсов и минусов, а / : П —» П — п реобразован ие,
переводящ ее элемент ш = uj\ uj2 . . . иоп G П в о / = • • -ШпСт где щ*. = —,
если = + , и (jfc = + , если ujk = —. П о к а за ть , ч т о в f(fuj ) любой о т р езо к длины
> 4 содерж и т 4—Ь и л и ---- .
2. И м еет ли отображ ение / : N —» N, заданное правилом п п 2, правое
обратн ое? У к а зат ь для / два левы х об р атн ы х отображ ения.
3. П усть / : X Y — отображ ение и S, Т — под м нож ества в X . П о к азать ,
ч то
f(s и т) = f(s) и /(Т), f(s п т) С /(5) п /(Т).
П ри вести пример, показы ваю щ ий, ч т о последнее вклю чение нельзя, вообщ е го ­
воря, зам ен и ть равенством .
4. М нож ество всех подм нож еств м нож ества S обознач ается
3>(S) = {Т\ Т С S}.
Если, наприм ер, S = { s i , S2 , • • •, s n } — конечное м нож ество из п элементов, то
43(5') состои т из п устого м нож ества 0 , п одноэлем ентны х м нож еств { si} , {« 2 }, • • •
• • • {у™}, п( п —1)/2 двухэлем ентны х м нож еств 1 ^ г < j ^ п, и т .д . вплоть
до Т = S'. К ак о ва мощ ность м нож ества IP(S)?
5. П усть / : X —» Y — отображ ение и b = f( a) для н ек оторого а Е X .
П рообраз
/_1(ь) = /_1(/(«)) = ш f(x) = /(“)}
ин огда н азы в аю т ещё слоем над элементом b G 1га / . П о к а за ть , ч т о всё множ ество
X явл яется объединением непересекаю щ ихся слоёв (т.е. разбие­ S Т
нием м н ож ества X ) .
П р е д у п р е ж д е н и е . О бозначение / _ 1 (6) не следует ассо­
ц и и р о в ать с о братн ы м отображ ением , к о то р о го м ож ет и не
бы ть.
SAT
6 . П о к а за ть , ч т о конечная д е к ар т о в а степень счётного мно­
ж ес тв а явл яется счётны м м нож еством . Рис. 6
7. Симметрическая разность двух м нож еств S и Т обозн ач ается S A T :
S A T = (S \ Т ) U (Т \ S) (рис. 6). П о к а за ть , ч т о S \ Т = (S U Т ) \ (S П Г ).
§ 6. Отношения эквивалентности. Факторизация отображений 41

§ 6. О тн ош ен и я эк в и в ал ен тн о сти .
Ф ак т о р и за ц и я о т о б р а ж е н и й
Эквивалентность систем линейных уравнений, введённая нами в
§ 3, наводит на мысль посмотреть на это понятие в общем плане,
тем более что эквивалентностями разных типов мы пользуемся нео­
сознанно как в логических рассуждениях, так и в обыденной жизни.
1. Бинарны е отнош ения. Для любых двух множеств X и Y
всякое подмножество и С X х Y называется бинарным отношением
между X и Y (или просто на X , если Y = X ). Для упорядоченной па­
ры (ж, у) Е из используют обозначение жеоу и говорят, что ж находится
в отношении со к у. Это удобно, посколь­
ку, например, упорядочение < на множестве
вещественных чисел Е является бинарным
отношением на Е, состоящим из всех точек
плоскости Е2, которые лежат выше прямой
ж —у = 0 (рис. 7); громоздкое включение
(ж, г/) Е и (и <) заменяется обычным нера­
венством ж < у.
Каждой функции / : X —>• Y сопоставляется её график — под­
множество
Г (/) = {{X, у) I х е х , у = f(x)} C X x Y ,
являющееся отношением между X и Y. Изучение на Е2 графиков
функций Е —>Е входит в курс математического анализа. Понятно,
что не каждое отношение си может служить графиком какого-либо
отображения X —>Y. Необходимое и достаточное условие заключа­
ется в том, чтобы каждому ж Е X отвечал ровно один элемент у с
жеоу. Фактически задание X, Y и графика Г(/) восстанавливает /.
2. Отнош ение эквивалентности. Бинарное отношение ~ на X
называется отношением эквивалентности, если для всех ж, х\ х" Е X
выполнены условия:
i) ж ~ ж (рефлексивность);
и) ж ~ х' = > х' ~ ж (симметричность);
ш) ж ~ ж', ж' ~ х п = > ж ~ х п {транзитивность).
Запись а оо Ъ выражает отрицание эквивалентности элементов
о, b Е -X".
Подмножество
х = {ж' Е 1 | ж' - ж} С I
всех элементов, эквивалентных данному ж, называется классом эк­
вивалентности., содержащим ж. Так как ж ~ ж (см. i)), то действи­
тельно ж Е ж. Любой элемент ж' Е ж называется представителем
класса ж.
42 Гл. 1. Истоки алгебры

Справедливо следующее утверждение.


Множество классов эквивалентности по отношению ~ являет­
ся разбиением множества X в том смысле, что X является объ­
единением непересекающихся подмножеств (это разбиение можно
обозначить тг^(Х)).
В самом деле, так как х Е ж, то X = LLex Если теперь х' П х " ф
Ф 0 и х G х' П ж", то ж ~ х' и ж ~ х п, откуда в силу транзитивнос­
ти ш) имеем х' ~ х" и ж' = ж". Значит, различные классы не пересе­
каются. □
П усть П = М2 — вещ ественная плоскость с прям оугольной системой к оорди­
н ат.
В зяв за свойство ~ п ри над леж ность т о ч е к Р, P r Е П одной гори зон тал ьн ой
прямой, мы получим, очевидно, отнош ение эквивал ентности с классам и — го р и ­
зон тал ьн ы м и прям ы м и (рис. 8).

Гиперболы Гр (рис. 9) вида х у = р > 0 определяю т отнош ение экви вал ен т­


ности в области П + G П то ч е к Р ( х , у ) с к оорд и н атам и х > 0, у > 0. Э ти гео ­
м етрич еские прим еры наглядно пок азы в аю т, ч т о верно следующее обратн ое
утверж ден ие.
Если имеется какое-то разбиение тг(Х) множества X на непере-
секающиеся подмножества Сх, то Сх будут классами эквивалент­
ности по некоторому отношению эквивалентности
В самом деле, по условию каждый элемент ж Е X содержится
точно в одном подмножестве Са- Достаточно считать ж ~ х' в том
и только том случае, когда ж и ж 7 лежат в одном и том же подмно­
жестве Са- Очевидно, это отношение ~ рефлексивно, симметрично
и транзитивно, т.е. является отношением эквивалентности. Далее,
ж G Са => х = Са по определению Стало быть, к(Х) = ir^(X). □
3. Ф акторизац ия отображ ении. Ввиду установленного вы­
ше взаимно однозначного соответствия между отношениями экви­
валентности и разбиениями множества X принято разбиение,
отвечающее отношению эквивалентности обозначать X / ~ и
называть фактормножеством X относительно ~ (или по отноше­
нию ~). Сюръективное отображение
р: ж ьэ р{ж) = ж (1)
называется естественным отображением (или канонической проек­
§ 6. Отношения эквивалентности. Факторизация отображений 43

цией) X на фактормножество X /
Пусть X, Y — два множества и / : X —у Y — отображение. Би­
нарное отношение сof.
Уж, х' е X XLOfX! f(x) = /(У),
очевидно, рефлексивно (/(ж) = /(ж)), симметрично (/(ж') = /(ж) = >
= > /У ) = / У ) ) и транзитивно (/(ж) = /(ж') & /(ж') = /(ж") = >
= > /(ж) = /(ж")). Таким образом, ujf — отношение эквивалентности
на X. Соответствующие классы эквивалентности ж являются слоями
(прообразами) в смысле упр. 5 § 5. Другими словами,
х = {х'\ fix') = fix ) } .
Отображение / : X —>Y индуцирует отображение / : Х /ujf —>Y,
определённое правилом
f(x) = fix),
или, что то же самое,
fp(x) = fix), (2)
где р — естественное отображение (1). Так как
Х = х' «=> fi x) = fix'),
то соотношение (2), задающее / , не зависит от выбора представителя
ж класса ж. В таких случаях говорят, что определение / является
правильным или корректным. Коммутативная диаграмма

X ----------- J---------- У

X/uf

наглядно описывает факторизацию (разложение)


f = S -p (з)
отображения / в произведение сюръективного отображения р и инъ­
ективного отображения /. Инъективность / вытекает из того, что
f ( x l) = Ц х 2) •*=*> f i x i ) = /(ж2) XI = Х2.
Очевидно, сюръективность / равносильна сюръективности /. Заме­
тим, что если / ': X / u f —>• У — ещё одно отображение, для которого
выполнено соотношение (3): f f •р = / , то из
/'(£ ) = /'(рж) = (/'р)х = /(ж) = fix)
(см. (2)) следует на самом деле равенство / ' = /. Стало быть, отобра­
жение /, делающее указанную выше треугольную диаграмму комму­
тативной, единственно.
44 Гл. 1. Истоки алгебры

4. Упорядоченные м нож ества. Упорядочением множества X


(или порядком на X ) называется бинарное отношение ^ на J , обла­
дающее свойствами рефлексивности (ж ^ ж), антисимметричности
(если х ^ у и у ^ х, то х = у) и транзитивности (если х ^ у и у ^ z,
то х ^ z). При х ^ у vi х ф у пишут х < у. Вместо х ^ у используется
также запись у ^ х. Пара элементов ж, х' Е X может и не находиться
в отношении Если, однако, ж ^ х' или х' ^ ж для каждой пары эле­
ментов из X , то X называется линейно упорядоченным множеством
или цепью. В общем же случае говорят о частичном порядке на X .
Множество X = Ф(5) подмножеств множества S (см. упр. 4 § 5)
с обычным отношением включения Е С Т между подмножествами, а
также множество N натуральных чисел с отношением d \ n ( n делится
на d) являются примерами частично упорядоченных множеств.
Пусть X — произвольное частично упорядоченное множество, ж
и у — его элементы. Говорят, что у накрывает ж, если ж < у и не
существует z с условием х < z < у. В случае CardX < оо ж < у
(т.е. ж и у сравнимы) тогда и только тогда, когда найдётся цепоч­
ка элементов ж = Ж1 ,Ж2, ... ,жп_ 1 ,жп = у, в которой ж^+i накрывает
Х{. Понятие накрытия удобно при изображении конечного частично
упорядоченного множества X плоской диаграммой. Элементы мно­
жества X изображаются точками. Если у накрывает ж, то у поме­
щается выше жиж соединяется с у прямолинейным отрезком. Срав­
нимость у и ж изображается понижающейся ломаной, соединяющей
у с ж, причём таких ломаных может быть несколько. Несравнимые ж
и у не соединяются. На двух из приводимых диаграмм (рис. 10) изо­
бражены “отрезок” натурального ряда чисел и множество Ф({а, Ъ, с})
(N — естественное линейно упорядоченное множество, а упорядоче­
ние на V(S) было введено выше).

о 5

0 4
{6, с}

13
{с}
О2

6 1

Наибольшим элементом частично упорядоченного множества X


называется элемент п Е X такой, что ж ^ п для всех ж Е X , а
максимальным — элемент т Е X , для которого из m ^ ж G I следу­
ет ж = т. Наибольший элемент всегда максимален, но не обратно.
§ 6. Отношения эквивалентности. Факторизация отображений 45

Максимальных элементов может быть много, но наибольший эле­


мент, если он существует, определён однозначно. Те же замечания
относятся к наименьшему и минимальному элементам. На рис. 10 две
диаграммы слева имеют наибольшие и наименьшие элементы, диа­
грамма справа — три максимальных элемента (один наименьший)
но нет наибольшего элемента.
Теория частично упорядоченных алгебраических систем (булевы
алгебры, решётки) насыщена содержательными результатами и за­
нимает важное место в алгебре, но мы не имеем возможности её
касаться. Этот параграф преследует скромную цель — познакомить
читателя с ещё одним естественным бинарным отношением и дать
представление о диаграммах, которые помогут в будущем понять
взаимное расположение подгрупп в группах или, скажем, расположе­
ние подполей в полях.

УП РА Ж Н ЕН И Я

1. П о к а за ть , ч т о ф ак то р м н о ж еств о М2/ получаю щ ееся из рис. 8, и любая


прям ая б пересекаю щ ая ось О х , находятся в биективном с оответстви и .
2. П олож ить Р ( х , у ) ~ Р ( х ' , у ' ) для т о ч е к вещ ественной к оордин атной плос­
кости М2 в т о ч н о сти т о гд а , к огд а х ’ —х Е Z и у' —у Е Z . Д о к а за ть , ч т о ~ является
отнош ением эквивал ентности и ч т о ф ак то р м н о ж еств о М2/ ~ геом етр и ч еск и изо­
б р аж ается то ч к ам и на то р е (поверхности бублика; рис. 11).

3. П о к а за ть , ч т о м нож ества из двух, т р ех и ч еты р ёх элементов им ею т со о т­


ветствен но 2, 5 и 15 разл и чн ы х ф акто р м н о ж еств .
4. П усть гч — отнош ение эквивал ентности на м нож естве X и / : X —» Y —
отображ ение, для ко то р о го

я®) fix').
П о к а за ть , ч т о это условие совместимости / с ~ (более слабое, чем р ассм о т­
ренное в п. 2) позволяет правильно определить индуцированное отображ ение
/ : х |-э f ( x ) из X / rsj в У , приводящ ее к ф а к то р и зац и и / = / • р, но / уж е не
обязательно долж но бы ть и н ъек ти вн ы м . В чём зак л ю ч ается условие и н ъ е к ти в ­
ности / ?
5. И зо б р ази ть ди аграм м ам и части ч н о упорядоченны е м нож ества:
1) 3>({a,b,c,d});
2) м нож ество всех делителей целого числа 24 (отнош ения п о р яд ка у к азан ы в
т ек сте).
46 Гл. 1. Истоки алгебры

§ 7. П ри н ц и п м а т ем а т и ч еск о й и н дук ц и и
Считается, что нам известно множество N = {1,2,3,...} всех на­
туральных (или целых положительных) чисел. На самом деле отправ­
ной точкой для изучения N служит аксиоматика Пеано (Дж. Пеано,
1858-1932). Из аксиом Пеано (мы их не приводим) вытекают свой­
ства сложения, умножения и линейного упорядочения (см. и. 4 § 6)
натуральных чисел, точнее, системы N U {0}. В частности, доказы­
вается интуитивно ясное утверждение: в каждом непустом множе­
стве S С N имеется наименьший элемент, т.е. натуральное число
s G S, меньшее всех остальных чисел в S'. С учётом этого утвержде­
ния из аксиом Пеано извлекается следующий
П р и н ц и п и н д у к ц и и . Предположим, что для каждого п Е N
мы имеем некоторое утверждение М(п). Предположим также, что
мы располагаем правилом, позволяющим установить истинность
М{ 1 ) для данного I при условии, что М(к) верно для всех к < I
(в частности, подразумевается, что мы можем проверить истин­
ность М { 1 )).
Тогда М(п) верно для всех п Е N.
В самом деле, допустим, что подмножество
S = {s | s Е N, M(s) неверно} С N
непусто. Согласно сказанному выше S содержит наименьший эле­
мент so- Тогда утверждение M(so) ложно, a M(s) истинно для каж­
дого s < s o . Это, однако, противоречит нашему предполагаемому
умению доказывать истинность M(so).
Здесь не место для всестороннего обсуждения принципа матема­
тической индукции. Мы ограничимся замечанием, что он отражает,
так сказать, суть натурального ряда, а познание последнего не сво­
дится к чему-либо существенно более простому. Стоит ещё обратить
внимание на одно обстоятельство. Именно, непременным моментом
“доказательства методом полной индукции” является установление
базиса индукции, т.е. проверка того, что свойство или утверждение
выполнено для небольших п. Без такой проверки можно приходить
к произвольным умозаключениям типа “все студенты одинакового
роста”. Вот и рассуждение. Пустое множество студентов и множе­
ство из одного студента обладают этим свойством. Делаем предпо­
ложение индукции, что им обладает любое множество из ^ п студен­
тов. Во множестве из n + 1 студентов первые п и последние п студен­
тов одинакового роста по предположению индукции. Эти множества
пересекаются по подмножеству из п —1 студентов тоже одинакового
роста. Значит, все п + 1 студентов одинакового роста. На самом деле
первое содержательное утверждение относилось бы ко множеству из
л ю б ы х двух студентов, а здесь-то оно как раз и неверно. Насколь­
ко же длинным должно быть основание индукции? Обычно это ясно
§ 1. Принцип математической индукции 47

из доказательства. В нашем элементарном примере важным являет­


ся условие непустоты пересечения двух множеств, т.е. выполнение
неравенства п —1 ^ 1 , откуда п ^ 2 .
В более сложных ситуациях, в особенности когда приходится опре­
делять или строить объект по индукции при помощи рекуррентных
соотношений, необходимо проявлять особую заботу о базисе индук­
ции. Например, делимость на 5 числа Фибоначчи f$m (см. пример 2
§ 3) при любом целом т 7> 1 вытекает из равенства /5 = 5 и из со­
отношения /б(ш+ 1) = 5/бт +1 + 3/бт , которое ещё нужно получить. С
другой стороны, нельзя впадать в иную крайность: убедившись в ис­
тинности М(к) для всех к из достаточно длинного отрезка 1 ^ к ^ I
натурального ряда, делать необоснованный вывод (это будет так на­
зываемая неполная индукция) об истинности М (п) для всех п Е N.
Вот — два обескураживающих примера.
П р и м е р 1. П. Ф ер м а полагал, ч т о все числа вида Fn = 22™+ 1, п = 0 , 1 , . . .
(числа Ферма), п росты е. П ервы е п я т ь чисел Ф ер м а просты е, но для F§ Эйлер
нашёл разлож ение F 5 = 4294967297 = 641 • 6700417. Н астойчивы е усилия полу­
ч и т ь при помощ и новейш их ЭВМ хотя бы одно новое п ростое число Ф ер м а пока
не увенчались успехом. О дним из последних “дости ж ен и й ” в этом направлении
явл яется п роверк а т о го , ч т о i ?i 9 4 5 делится на 5 • 21947 + 1 .
П р и м е р 2. И сследование при п — 1, 2 , . . . , 40 чисел ви да п 2 — п + 41 (м ного­
член, предлож енны й Эйлером) способно склон ить к мысли о п р о с то т е эти х чисел
при любом п (о п р о сты х числах см. § 9). О днако 412 — 41 + 41 = 412.
Примеров такого рода можно приводить сколь угодно много.
В рассуждениях по индукции иногда самое важное — придать
надлежащую форму доказываемому утверждению. Предположим, что
нужно найти сумму
p fe(n) = l k + 2k + 3k + ... + (n - l) k + nk, k = 1,2,3.
Задача значительно облегчится, когда вам скажут, что предполагае­
мый ответ содержится в выражениях
п(п + 1) n(n + l)(2n + l) п(п + 1)
Pi (п) P 2W ----------------^---------------- , Рз (п)
2 2
Степенные суммы р^(п) самого общего вида будут ещё обсуж­
даться в связи с корнями многочленов (см. гл. 6), а сейчас заметим,
что встретившаяся нам в п. 5 § 3 сумма Г(п) имеет вид
Г(п) = п(п —1) + ... + k(k —1) + ... + 1 • (1 —1) =
п п

= X I fc2 “ Ц k = р 2(n) - Pi(n)


к= 1 к= 1
(в дальнейшем знак суммирования ^2 будет систематически исполь­
зоваться). Опираясь на приведённые выше выражения для р 2(п) и
Pi(n), получаем, что Г(п) = (п3 —п )/3. Разумеется, к тому же ре­
48 Гл. 1. Истоки алгебры

зультату нетрудно прийти, рассуждал по индукции непосредственно


в Г(п).
Если до вида pi(n) додуматься нетрудно, то вид р 2(п) и рз(п)
уже не так тривиален, а соотношение
п(п + 1)
р5 + р7 = 2
2
вообще нужно было бы искать по какому-то определённому плану.
В данном случае такой план указать можно, но не в этом дело. Для
обоснования всех указанных выше соотношений нужно провести пря­
мыми вычислениями шаг индукции от п к п + 1. Оставим это чита­
телю в качестве полезного упражнения.
Кстати, в этом упражнении пригодится так называемая биноми­
альная формула
{а + Ь)п = а п + ( ^ ) ап~1Ь+ ... + an~kbk + ... + bn. (1)
Здесь под а и b подразумеваются произвольные числа, а биномиаль­
ный коэффициент (^)при одночлене an~kbk имеет вид
/п \ п\ п(п — 1)... (п —k + 1)
\к ) к!(п —к)\ к(к — 1)... 2 *1
где п! = п(п —1).. .2 • 1 (эн-факториал). Это — быстро растущая
величина, например, б! = 720, 10! = 3628800, а 100! > Ю150. Полезно
дополнить выражение (2) соглашениями 0! = 1 и (^) = 0 при к < 0.
Отметим ещё, что

( А ) - ©
(свойство симметричности биномиальных коэффициентов).
Формулу (1), очевидно, верную при п = 1,2, мы докажем индук­
цией по п. Считая её справедливой для всех показателей ^ п, умно­
жим обе части соотношения (1) на а + Ъ. Получим
(a + 6)n+1 = (а + Ъ)п(а + Ъ) =

= а"(о + &) + . . . + ( ” ) ап~кЬк(а + Ъ) + ... + Ъп(а + Ь) =

п п+2 —к iM—1 П п+1—кьк


= an+l + апЬ + . . . + + ъК+
к- 1 к- 1

+ ( Д an+1 ~kbk + ( nk ^ a n~kbk+1 + ... + abn + bn+1.


Приведение подобных членов показывает, что коэффициентом при
§ 1. Принцип математической индукции 49

одночлене an+1 kbk будет


П\ П\
+ +
k —1 о (k —l)!(n —k + 1)! k\(n —k)\
n\
(.k —l)!(n —k)\ n —k + 1 k
n\ n+ 1 (n + 1)! n+ 1
(fc —l)!(n —k)\ k(n — k + 1) k\(n + 1 —k)\
т.е. как раз биномиальный коэффициент вида (2) с верхним индек­
сом, увеличенным на единицу. Тем самым справедливость формулы
(1) доказана для всех п Е N.
Если записать
(а + Ь)п = (а + Ь)(а + Ь) ... (а + Ь),
присвоив каждому множителю справа номер от 1 до п, и посмотреть
на те подмножества номеров
1 ^ Н < ^2 < • • • < Ч ^ п,
которые отвечают при умножении одночлену an~kbk, то мы придём
к выводу, что есть не что иное, как число всех подмножеств
мощности к множества из п элементов. Несколько “старомодный”
термин — число
Cl

сочетаний из п по к — выражает по существу то же самое.


В частности, мощность множества CP({si, . . . , sn}) (см. упр. 4 § 5)
равна

о + о - ' + С л Ю '
Но, полагая а = b = 1 в формуле (1), получим

2”= д т ;)+ а + -Ч „ п
- 1) + 0 '
Таким образом,
C ard ?({si,s2, . . . , s n}) = 2” .
Биномиальные коэффициенты — почти непременный атрибут
элементарных комбинаторных рассуждений. Вот — наглядный гео­
метрический пример.
4 А .И. К о стр и к и н
50 Гл. 1. Истоки алгебры

Пример (A m er. M ath. M onthly. — 1977. — V. 84, № 6). И звестн а за д а ч а


об определении числа R n областей, образуем ы х в
к р у ге ( 2 ) хордам и, которы е соединяю т п ф иксиро­
ван ны х т о ч е к на окруж н ости , при предполож ении,
ч т о н и какие т р и хорды не пересекаю тся в н утри к р у ­
г а (рис. 12). Р е зу л ь т а т при п — 1,2, 3, 4, 5 н аводи т на
мы сль, ч т о R n = 2n _ 1 ; но на самом деле правильной
будет ф орм ул а Я п = 1 + ( 2 ) + ( 4 ) • П опробуйте это
д о к азать .
Д о к азател ьств о тео р ем ы или построени е об ъ ек ­
т а ин огда удобно проводи ть, опираясь на более слож­
ные ф орм ы индукции. Н априм ер, принцип двойной
Рис. 12 индукции зак л ю ч ается в следующем. П усть любым
н атурал ьн ы м числам т и п о тв е ч а е т некоторое утверж ден ие У ( т , п ) , причём:
i) У ( т , 1) и У (1 ,п ) исти нны для всех т и п ;
И) если У (к — 1,1 ) и У(к,1 — 1) исти нны , то У (к,1) т а к ж е истинно.
Э то эквивалентно:
И') если У (/с', V) истинно при всех к' ^ /с, I' ^ I, к' -\-1’ <к-\-1, то У (/с, I) т ак ж е
истинно).
Т огд а утверж ден ие У ( m , n ) истинно для всех н ату р ал ьн ы х т и п .

УП РА Ж Н ЕН И Я

1. Положим
s (п) = sin ip + sin 2р + . . . + sin np,
c (n ) = cos p + cos 2p + . . . + cos np.
И ндукцией no n д о к а за ть ф орм улы
sin(nip/2 ) s in ((n + 1 ) 99/ 2 ) sm(mp/2) c o s((n + 1 ) 99/ 2 )
s{n) = c(n) =
sin((p/2) sin((p/2)
2. И м ею т м есто ф орм улы :
ктг n (2 n — 1)
a) У ctg2
ч2п + 1 ,
k=l

« > £ ( 2Ж 2: : Г ) - " -
У бедиться в их справедливости хотя бы при п <С 5.

§ 8. П ер ест а н о в к и
1. С т а н да р тн а я зап и сь п ер естан ов к и . Разовьём немного те-
му, начатую в § 5, применительно к биективным преобразованиям
конечных множеств. На этой базе естественным образом возникают
важные алгебраические понятия.
Пусть П — конечное множество из п элементов. Поскольку при­
рода его элементов для нас несущественна, удобно считать, что П =
= {1,2,..., гг}. Элементы множества Sn = S(Ct) всех взаимно одно­
значных преобразований П —> П, обычно обозначаемые строчными
§ 8. Перестановки 51

буквами греческого алфавита, называются перестановками. Лишь


за единичным преобразованием е = cq сохранилась буква латинско­
го алфавита.
В развёрнутой и наглядной форме произвольную перестановку
7г: i I—У7г(г), i — 1 , 2 , . . . , гг, изображают в виде
2 . .. п \
а 1\ «2 ••• in )'

полностью указывая все образы:


1 2 . п
7Г : ^ 1 i ,
к к • in

где ik = я-(к), к = 1,. . ., п — переставленные символы 1, 2, .. .,п.


Перестановки cr, т G Sn перемножаются в соответствии с общим
правилом композиции отображений: (сгт) = а(т(г)). Например, для
перестановок
12 3 4 12 3 4
а= т=
2341 4321
имеем

12 3 4 12 3 4 12 3 4
(7Т =
2341 4321 14 3 2

В то же время
12 3 4 12 3 4 12 3 4
4321 2341 3 2 14
так что сгт ф та.
Согласно результатам 5 умножение перестановок подчиняется
следующим правилам.
i) Умножение ассоциативно, т.е. (а/3)у = а((3у) для всех а,/3, 7 G

ii) Sn обладает единичным элементом е : 7ге = 7г = ел для всех


7Г G 5 П.
ш ) Для каждой перестановки т
тG Sn существует обратная пере­
становка 7Г_ 1 : 7Г7Г-1 = 7Г_ 17Г = в.
Эти три свойства, дополненные общими принципами, на кото­
рых мы не хотим сейчас останавливаться (см. гл. 4), дают основание
говорить о группе Sn. Точнее, множество 5 П, рассматриваемое
вместе с естественной операцией умножения его элементов (компози­
цией перестановок), называется симметрической группой степени п
4:
52 Гл. 1. Истоки алгебры

(иначе, симметрической группой на п символах или на п точках).


Для нас пока это всего лишь удобное терминологическое соглашение,
смещающее акценты с множества Sn как такового на мультиплика­
тивные свойства перестановок, т.е. на то, что может быть выявлено
при композиции элементов из Sn. Симметрическая группа Sn лежа­
ла у истоков общей теории групп и теории Галуа более 170 лет тому
назад, и можно только поражаться связанному с ней обилию мате­
матических идей.
З а м е ч а н и е . Иногда элементы группы Sn называют подста­
новками., используя термин перестановка в качестве синонима рас­
положения чисел 1, 2,..., п в каком-то фиксированном порядке. Так
как между такими упрядочениями чисел и элементами группы Sn
имеется взаимно однозначное соответствие, а слово “перестановка”
ассоциируется в сознании скорее с действием, чем с застывшим упо­
рядочением, то подстановки у нас из употребления исключены. Впро­
чем, ниже мы будем говорить, например, о подстановке числа в мно­
гочлен, но это служит лишь дополнительным аргументом в пользу
указанного терминологического соглашения.
Если нужны ещё какие-то доводы, то их можно найти по мень­
шей мере: а) в научной литературе; б) в учебнике П.С. Александрова
“Лекции по аналитической геометрии” (Наука, 1968, с. 767).
Найдём порядок \Sn \ группы Sn. Символ 1 можно подходящей
перестановкой а перевести в любой другой символ сг(1 ), для чего
существует в точности п различных возможностей. Но, зафикси­
ровав сг(1 ), мы имеем право брать в качестве сг(2) лишь один из
оставшихся п —1 символов (всего различных пар сг(1 ),сг(2) имеет­
ся (п —1 ) + (п —1 ) + ... + (п —1 ) = п(п — 1 )), в качестве сг(3) —
соответственно п —2 символов и т.д. Всего возможностей выбора
сг(1 ), сг(2), . . . , сг(п), а стало быть, и всех различных перестановок бу­
дет п{п —1)... 2 • 1 = п!. Таким образом,
Card Sn = |Sn| =п\.

2. Ц икловая ст р у к т у р а п ер естан ов к и . Разложим теперь пе­


рестановки из Sn в произведения более простых перестановок. Идею
разложения поясним схематически (рис. 13) на примере указанных
выше перестановок сг, т Е S4.
§ 8. Перестановки 53

что то же самое, в виде


а = (2 3 4 1) = (3 4 1 2) = (4 1 2 3),
называется циклом длины 4, а перестановка
= (1 4) (2 3)
Т

— произведением двух независимых (непересекающихся) циклов (1 4)


и (2 3) длины 2. Заметим, что
сг2 = (1 3)(2 4), сг4 = (сг2)2 = е, т2 — е.
Пусть теперь 7г — произвольная перестановка из Sn. Её степень
7Vs определяется по индукции (см. доказательство теоремы 3 § 5):
7Г(ТГ* !), если s > О,
7Г“ = ^ е, если s = 0,
7Г-1((ТГ-!)*-"-1)), если s < 0.
При таком определении, очевидно,
^ s-\-t
ТГ ТГ — ТГ = ^7Г.t^7Гs , 8, t £ Z
(последовательное приписывание 7г или 7г-1 при 8 и t одинакового
знака и замена 7Г7Г-1 , 7г-17г на е при s и £ разных знаков). Так как
|П| < оо, то на самом деле для каждой перестановки тг Е 5П найдётся
однозначно определённое натуральное число q = д(7г) такое, что все
различные степени содержатся во множестве (тг) = {е, 7г,..., 7гд-1}
и тгя = е. Это число q называется ещё порядком перестановки к.
Так, рассмотренные выше перестановки а и т имеют соответственно
порядки 4 и 2.
Две точки г, j Е П назовём тг-эквивалентными, если j = тrs(i) для
некоторого 8 G Z. Так как
* = тг°(*)) i = 7Г*(«) = ^ i = TT s(j), j = ns(i), k = n \ j ) =*-
=>• k = TTs+t(i),
то, очевидно, мы имеем дело с рефлексивным, симметричным и тран­
зитивным отношением на П (см. и. 2 § 6). В соответствии с общим
свойством отношений эквивалентности получаем разбиение
П = Hi и ... и п р (1)
множества П на попарно непересекающиеся классы Hi , . .., кото­
рые принято называть ещё тт-орбитами. Название это вполне обос­
новано. Каждая точка i Е П принадлежит в точности одной орбите,
и если i G то состоит из образов точки г при действии сте­
пеней элемента 7Г: г, 7г(г), тт2(г), . . . , 7r/fc-1(i). Здесь = |П^| — длина
тг-орбиты Qk- Очевидно, что
ik ^ q = Card(7r), тг1к (г) = г,
54 Гл. 1. Истоки алгебры

причем ik наименьшее число, обладающее этим свойством. Поло-


жив
г тг(г) - 2 (г)
TTft = (in(i) ... wlh 1 (г)) =
тт(г) тт2(г) - '( г )
мы придём как раз к перестановке, называемой циклом длины
Вопрос вкуса и удобства — писать (12 3 ... I) или (1, 2, 3, .. ., I).
Цикл 7Tk оставляет на месте все точки из множества П \ П&, а
7r(j) = 7Tk(j) для любой точки j Е П/,. Это свойство даёт нам осно­
вание называть 7rs, 7iy, s 7^ t, независимыми или непересекающимися
циклами. Так как 7r/fc(i) = г для г Е П/., то тг1ф = е.
Итак, с разбиением (1) ассоциируется разложение перестановки
7Г в произведение
7Г = 7Г17Г2 . . .7Гр , (2)
где все циклы перестановочны: тг = 7Ti 7T2 ... 7гр = 7Г/17Г/2 ... 7г/р. Можно
считать, например, что h ^ h ^ - ^ lm > lm+1 = ... = lp = 1 .
Если цикл Kk — (i) имеет длину 1, то он действует как единич­
ная перестановка. Естественно такие циклы в произведении (2) опус­
кать:
7Г = 7Г17Г2 . . . 7Гш, Zfc > 1, 1 ^ к ^ Ш. (3)
Например, перестановку
12345678
7Г = G $8
23451768
мы запишем в виде
тг = (1 2 3 4 5)(6 7)(8) = (1 2 3 4 5)(6 7). (4)
Некоторую неловкость вызывает то обстоятельство, что
(1 2 3 4 5) (6 7) можно интепретировать как перестановку из Sn при
любом п ^ 7, однако при фиксированном п никакой неоднозначности
нет.
Более точно, пусть наряду с разложением (3) мы имеем ещё одно
разложение 7г = ct\ct2 ... а г в произведение независимых циклов, и
пусть i — символ, не остающийся на месте при действии 7г. Тогда
7г*(г) ф г, аЦг) ф г для одного (и только одного) из циклов 7Г1 , . .., 7гт
и одного из ад, ..., а г. Имеем 7г*(г) = 7г(г) = аЦг). Если мы уже знаем,
что
TTsk (i)=Trk(i) = a^(i), (5)
то, применяя к этим равенствам перестановку тг и используя пере­
становочность 7Г с 7Tg n c f t f , получаем
ТГ7Г* = 7Tk+1 (i) = тга* (г),
откуда 7г^7г(г) = 7rfe+1(i) = а^7г(г) и, наконец,
nk+1 ( i ) = n k+1 (i) = a k+1 (i).
§ 8. Перестановки 55

Значит, равенства (5) справедливы при любом к = 0,1, 2,... Но цикл


однозначно определяется действием его степеней на любой символ,
который не остаётся на месте. Следовательно, tts = at. Далее приме­
няется индукция по ш или г.
Итак, нами доказана
Т е о р е м а 1. Каждая перестановка тг ф е в Sn является произ­
ведением независимых циклов длины ^ 2. Это разложение в произ­
ведение определено однозначно с точностью до порядка следования
циклов.
Обратим внимание на циклы длины 2.
О п р е д е л е н и е . Цикл длины 2 называется транспозицией.
Любая транспозиция имеет вид г = (i j ) и оставляет на месте все
символы, отличные от г, j. Из теоремы 1 вытекает
С л е д с т в и е . Каждая перестановка тг Е Sn является произве­
дением транспозиций.
Д о к а з а т е л ь с т в о . В самом деле, в силу теоремы 1 достаточно
записать в виде произведения транспозиций каждый из циклов. Но
это можно сделать, например, так:
(12 ... I - 1 I) = (1 0(1 I - 1)... (1 3)(1 2). □
Формулировки теоремы 1 и её следствия нуждаются в пояснении.
Как следует из определения цикла (J — {i\ Н • • • Ч- i ч),
i\ >г2, ^2 1 ^ ч • • • 5 Ч- 1 |—^ Ч5 Ч |—^ Н
и
з ^ з, з е п \ { * ь * 2, - - . , ч - 1 , ч },
и потому ничто не изменится, если мы запишем а — (г2 • • • Ч н),
т.е. произведём циклический сдвиг номеров, входящих в а. Таким
образом, утверждение единственности в теореме 1 носит по существу
абсолютный характер. С другой стороны, в следствии ни о какой
единственности записи перестановки через транспозиции не может
быть и речи. Скажем,
O' = (*i *2 *з •••Ч - i ц ) = (*1 ц )(н i i - i ) . . . (*1 *3)(*1 г2),
<7 = (*2 *3 •••*;-1 *г *l) = (*2 *l)(*2 */)(*2 * /-l) •••(*2 *з)-
Эти две записи одной и той же перестановки ст содержат по одина­
ковому числу I — 1 совершенно разных транспозиций (лишь Ц2 Ц) =
= (н 22))• Более того, транспозиции, вообще говоря, не перестановоч­
ны, а их число не является инвариантом перестановки. Например, в
S 4 имеем
(1 2 3) = (1 3)(1 2) = (2 3)(1 3) = (1 3)(2 4)(1 2)(1 4).
56 Гл. 1. Истоки алгебры

3. Зн ак перестановки. Справедлива следующая важная


Т е о р е м а 2. Пусть тг — перестановка из Snj
TT = T 1T 2 . . . T k (6 )

— произвольное разложение тг в произведение транспозиций.


Тогда число
е* = (-1)*, (7)
называемое знаком тг (иначе: сигнатурой или чётностью), пол­
ностью определяется перестановкой к и не зависит от способа
разложения (6), т.е. чётность целого числа к для данной переста­
новки 7г всегда одна и та же. Кроме того ,
£а(3 — &а£{3 (8)
для всех a, f3 Е Sn .
Д о к а з а т е л ь с т в о . 1) Предположим, что наряду с (6) мы имеем
также разложение
ТГ = т [ т 2 . . . т ' к, , (&)

причём четности к и к 1 различны. Это значит, что целое число к + к'


нечётно. Так как (тД2 = е, то, последовательно умножая справа обе
части равенства Т1 Т2 ... т\~ — т[т.. .т'к, , вытекающего из (6) и (6’),
на 7V,... , Т2, т[ , получим Т1 Т2 ... TkTk> ... Т2т[ = е. Мы свели нашу
задачу к следующей. Пусть
е = сг1 сг2 .. .crm_icrm, ш > 0, (9)
— запись единичной перестановки в виде произведения ш > 0 транс­
позиций. Нужно показать, что обязательно ш — чётное число.
С этой целью будет установлено, что от записи (9) мы можем пе­
рейти к записи е в виде произведения тп—2 транспозиций. Продолжив
этот спуск, мы пришли бы при нечётном ш к одной транспозиции т.
Но, очевидно, е / г. Итак, нам нужно обосновать спуск в (9) от ш к
ш —2 множителям.
2) Пусть s, 1 ^ s ^ п, — любое фиксированное натуральное
число, входящее в одну из транспозиций сг2, . .., сгш. Для определён­
ности считаем, что
е —01 . . . <7р-\(7р<7р-\-\ . . . сгш,
где Op — (st), а сгр+1, ... , ат не содержат s. Для ор- \ имеются четыре
возможности:
а) сгр- 1 = (st); тогда отрезок ор- \о р — (s t ) ( s t ) из записи е уда­
ляется, и мы приходим к т —2 транспозициям;
б) сгр_! = (sr), г ф s,t] здесь
o-p-i^p = (sr)(st) = (st)(rt),
и мы сдвинули вхождение s на одну позицию влево, не изменив ш;
§ 8. Перестановки 57

в) <7p- i = (£г), г ф s,t; здесь


сгр- 1 (тр = (t r ) ( s t ) = (sr)(tr),
и снова, как в случае б), произошёл сдвиг s влево без изменения ш;
г) сгр_1 = (<?г), {<?,г} П { М } = 0 ; здесь
сгр-icrp = (qr)(st) = (st)(qr).
В случае а) наша цель достигнута. В случаях б)-г) повторяем
процесс, сдвигая вхождение s на одну позицию влево. В конечном
счёте мы придем либо к случаю а), либо к экстремальному случаю,
когда е = сДсг^ .. . G'm, причём а[ = (st') и s не имеет вхождений в
g'2, . . . , g 'm. Значит, G!k (s) = s при k > 1 и s = e(s) = g [(s ) = t1 ф s. По­
лученное противоречие доказывает утверждение об инвариантнос­
ти epi.
3) Если а = п . .. гд;, Д = rfe+i . .. rk+i, то а(3 = п . .. . .. rk+i
И£а = (- l ) k, £/_з = (-1 )', £af3 = ( - l ) k+l = ( —1)*( —1)г = £a£p. □
О п р е д е л е н и е Перестановка 7Г G Sn называется чётной , если
Еъ — 1, и нечётной, если = —1.
Из определения вытекает, что все транспозиции — нечётные пе­
рестановки, а £е = 1.
С л е д с т в и е . Пусть перестановка iг G 5 П разложена в произве­
дение независимых циклов длин • • •Рт- Тогда
£п = (-l)S r= i('fc-1).

Действительно, по теореме 2 имеем


^■77 £■77l .. .77m
£’771 • • •£’77m•
Кроме того, еПк = (—l ) /fc_1, поскольку 7гк записывается в виде про­
изведения 1к — 1 транспозиций (см. доказательство следствия теоре­
мы 1). Окончательно
е*. = (-1)*1-1... (-1)'™ -1 = (-l)Sr=i(*fc-i). □
/12345678910114 , w
П р и м е р . 7г = ( ] . Имеем 7г = (1 5 2 4 7)(3 6 9 8)(10 11),
\5467291381110/ v А А '
откуда h = 5, I 2 = 4, /3 = 2 и е п = ( —1)4+3+1 = 1.

Запишем Sn в виде объединения Sn = Ап U Дп, где


А-п — С Sn | £п = 1}
— множество всех чётных перестановок, Ап = Sn \ Ап — множе­
ство нечётных перестановок. Пусть г — (i j ) — любая транспозиция.
Отображение Sn в себя, определённое правилом Ьт : 7г i— >>Т7г, биек­
тивно. (Оно инъективно: та = тД ==> = Д; далее применить теоре­
му 3 из § 5. Можно просто заметить, что — единичное отображе­
ние и L” 1 = L T.) Для наглядности изобразим Lr в виде перестановки
58 Гл. 1. Истоки алгебры

степени N = п\ на множестве Sn = {7Г1 = е, 7Г2, 7Г3, . .., 7Гдг}:


TTl ТГ2 7Г3 . . 7Гдг
LT ( 10)
T7Ti Т7Г2 Г7Г3 . . . Т7Г/у

Аналогично,
TTl ТГ2 тгз • 7Гдг
Rr ( 10')
7Г\Т 7Г2 Г 7Г3 Т . . . 7ГдгГ

— перестановка на Sn. Отображения (10) и (10') будут использо­


ваться нами впоследствии, причём даже в более общем контексте. А
сейчас заметим, что еТ7Г = ете^ — поэтому
-^г(^-п) —Am L/T(^An) —А,
Значит, число чётных перестановок в Sn совпадает с числом нечётных
перестановок, откуда

K I = |l^«l = у - (п )
4. Д ействие Sn на ф ункциях. К важному понятию знака пере­
становки a G Sn можно подойти несколько иначе, подсчитывая число
так называемых сг-инверсий (см. упр. 5 в конце параграфа). Но вме­
сто этого мы дадим сейчас альтернативное доказательство теоре­
мы 2, которое опирается на понятие кососимметрической функции,
важное само по себе и полезное для дальнейшего.
О п р е д е л е н и е . Пусть 7Г Е Sn и / — функция от любых п аргу­
ментов. Полагаем
(тг ° /) {Х\ , . . . , хп) / ((£71-15• • • 5^ 7Гп) • (12 )
Говорят, что функция д = 7г о / получается действием iтна f .
Л е м м а 1. Пусть a,f3 — любые перестановки из Sn. Тогда
(а/?) о / = а о (/3 о / ) -

Д о к а з а т е л ь с т в о . В соответствии с определяющим соотноше­


нием (12) имеем
( a o ( f 3 o f ) ) ( x i , . . . , x n) = {(3° f ){xai , . . . , x an),
или, полагая yk = x ak и замечая, что уpi = ,
(а о (/3 о , х п) = ((Зо f ) ( y 1 }. . . , y n) =
f {УР15 ***тУРп) f(%a(P1)7 **• 1 %а(0 п)')
= f(x(aP)l,---,X(a p)n) = ( a f 3)°f)(xi,...,xn ). □

О п р е д е л е н и е . Функция f от п аргументов называется косо­


симметрической., если
/(. . . , Xk , Ж&+ 15• • • ) = /(•••5 Xk+l , Xk , . . . ) ,
§ 8. Перестановки 59

т.е. при перестановке местами любых двух соседних аргументов зна­


чение / меняет знак на противоположный.
Л е м м а 2. При перестановке местами любых двух аргументов
ко со симметрическая функция меняет знак на противоположный.
Д о к а з а т е л ь с т в о . Пусть переставлены i -й и j -й аргументы,
причём i < j . Проводим индукцию по числу I = j — i — 1 аргументов
между переставляемой парой. При I = 0 утверждение леммы совпада­
ет с определением кососимметрической функции. Пусть лемма верна
при всех j —i — 1 < I. Тогда

/(•••? Xi-\-1, . . . , Xj — 1, X j , . . . ) =

= — / (. . . , X i+ 1, Xf , . . . , X j _ i , X j , . . . ) =

= / ( . . . , X f + 1 , X j , . . . , X j —i , X f , . . . ) =

= — / (. . . , X j , X f + 1 , . . . , X j _ i , X f , . . . ) . □

Надо ещё быть уверенным в том, что не все кососимметрические


функции тождественно равны нулю. Простейшим является следую­
щий пример.
П р и м е р . П усть

Д п = Д п (ж1 , ж2, . . . , х п ) = Y\ ( X i - X j ).
1 S^j < г ^ п

Символ П при записи произведения и г р а е т т у же роль, ч т о и ^ при записи


суммы . Вы делив любые два рядом стоящ их а р гу м е н та x k , x k+i, будем и м еть

Дп = О/г + 1 - x k )[(xk + i - x k_ i) ... ( x k+1 - xi)(xk - X k _ i ) . . . { x k - Xi ) ] •A - B,

где

A = П
l ^ j <i<k
(x i ~ xj)>
n
B= П [{XS - Xs-l) . . .{xs - Xk+1 ){xs - xk) . . .{xs - Xl)].
s= k+ 2

П ри перестановке м естам и x k и x k+i множ ители

[{xk + l - x k_ i ) . . . (x k + 1 - Xl) • (x k - Xk - i ) . . . { x k - Xl)],


А и В, очевидно, не м еняю т своих значений, в то врем я к а к

( Хк — Xk + i) = —{х к ^ 1 — х к ).

Э то и зн ач и т, что

Дп(. • ^ Х к , Хк + 1 ,. . . ) = -Д та(. •. ,T fc+ i , T fc, . . . ) , 1 ^ /с ^ п - 1.

По лемме 2 имеем т ак ж е

Дп(. • • ,Жг, . . . , Tj , ...) = -Д п(. . . , X j , . . . X i , . . . ) .


К ром е т о го , Д п (ж 1 , . . . , х п ) ф 0 при попарно разл ичн ы х x i , . . . , х п .
60 Гл. 1. Истоки алгебры

В т о р о е д о к а з а т е л ь с т в о т е о р е м ы 2. Возьмём произволь­
ную кососимметрическую функцию f от п аргументов ад , . . . , х п. По
лемме 1 действие 7г = Т1Т2 . .. т/, на / сводится к последовательному
применению транспозиций т*;, т^_i , . . . , t i , т.е. к к -кратному умноже­
нию / на —1:
О/ = (п .. О(rfc О/ ) = - ( п .. . r fc_i) О/ = . . . = ( - 1)*/ =
Так как левая часть этого соотношения зависит от 7г, но не от
какого-либо его разложения, то и отображение г : 7Г i-A £п, задан­
ное равенством (7), должно полностью определяться перестановкой
7г при условии, конечно, что / не тождественно равная нулю функ­
ция. В качестве такой функции можно взять, например, только что
рассмотренную функцию / = Д п.
Применение к такой функции / перестановки а(5 по правилу, из­
ложенному в лемме 1, дает
£ap f = (а/3) o f = a o ( / 3 o f ) = a o (epf ) = £р(а о / ) =

откуда получается соотношение (8). □


З а м е ч а н и е . К действию Sn на функциях мы будем обращать­
ся неоднократно, а в [BA III] увидим, что это лишь частное про­
явление гораздо более общей закономерности. Пока наше маленькое
достижение заключается в том, что словесное выражение “поменяем
в f ( x 1, . . . , х п) местами Х{ и хj ” сведено к символьной записи т о f с
транспозицией т — (i j ).

УП РА Ж Н ЕН И Я

1. В курсе м ат е м ати ч еск о го анали за д о к азы в ается ф орм ула С ти р л и н га

п\ ~ \/27 тп п п е ~ п ,
где е = 2, 718281 . . . — основание н ату р ал ьн о го л огари ф м а, 7г = 3,141592 . . . ;
символ ~ здесь о зн ач ает, ч т о отнош ение y/2irn п п е ~ п /п\ с тр ем и тся к 1 при
п —» оо.
П ри помощ и ф орм улы С ти рл и н га, дающ ей приближ ение с н едостатком , п ро­
вери ть, ч т о 100! > (9, 33 . . . )10157. Сколько в S w о циклов длины 100?
2. Н ай ти порядок п ерестан овки (4) и перестан овки
_ / 1 2 3 4 5 6 7 85
77 ~ \ 3 6 8 2 1 4 5 7 /
3. П ерестан ов к а 7г вида (3) с m независим ы м и циклам и о став ляет
m
m! — п — h
к= 1
символов (или точек) на м есте. Число д{к) = п — (m + т' ) н азы в ается декремен­
том перестан овки 7г. П ровери ть, ч т о — ( —l ) d(7r).
§ 9. Арифметика целых чисел 61

4. Н ай ти зн ак перестан овки
_ ( I 2 3 ... п —1 п \
П~ \ п п —1 п —2 ... 2 1 /

5. П усть П = { 1 , 2 , . . . , п ), П х 2 — д е к ар то в к в а д р а т . Б удем н а зы в ат ь па-


РУ ( h j ) £ П х П инверсией относительно перестановки а Е S n (или, короче:
сг-инверсией), если г < j , но <т(г) > cr(j). Положим

П о"(Я - ДО
----:--- :--- •
7 —2
Т ак к а к (cr(j) —a ( i ) ) / ( j —г) — отличное от нуля рациональное число, являю ­
щ ееся отри ц ател ьн ы м в т о ч н о сти т о гд а , к огд а (i , j) будет сг-инверсией, и т а к к а к
а : П—х П— биективное отображ ение, то sgncr = ( —l ) k , где к — общее число
сг-инверсий.Если т = (ij) — транспозиция, то s g n r = —1. К а к легко ви деть,

(<t(j ) <г(г))а =
a(j ) ... а(г) \ г ... j
а(г) ... a(j ) ... ) ^ ... а{г) . . . a(j)
i
<r{j) ■
т а к ч т о сг-инверсия (i ,j) п ер ес т ае т б ы ть инверсией относи тельно перестан овки
тег, где т = (cr(j) сг(г)) — транспозиция.
П о к а за ть , ч т о н ай дутся к транспозиций п , . . . ,т&, для к о торы х

Т~кТ~к—1 •••Т\(Т —е
— единичная п ерестан овк а. С тало бы ть, а = т\ . . . и sgn а = {—1)к = £а —
два равн оправн ы х обозначения одного и т о го же и н ва р и а н та перестановки; sgn
(от signum (л ат.)) — зн ак. М ы получили еще один удобны й способ определения
зн ак а перестановки. С каж ем , относи тельно п ерестан овки (4) м нож ество инвер­
сий состо и т из п яти пар (1, 5), (2, 5), (3, 5), (4, 5), (6, 7), т а к ч т о sgn7r = —1.
П р ак ти ч еск и дело сводится к п одсчёту в ниж ней строке п ерестан овки 7г коли­
ч е с тв а чисел j , больш их г, но стоящ их перед г, для г = 1 , 2 , . . . , п — 1.

§ 9. А р и ф м е т и к а целы х чисел

Задачей этого параграфа является краткое описание тех простей­


ших свойств делимости целых чисел, на которые удобно по разным
поводам ссылаться в дальнейшем. Дополнительные факты будут при­
ведены в гл. 5, где теория делимости переносится на более общие
алгебраические системы.
1. О сновная т е о р е м а ар и ф м ети к и . Целое число s называется
делителем (или множителем) целого числа п, если п = st для неко­
торого t G Z. В свою очередь п называется кратным s. Делимость
л на s обозначается символом s\n, а отрицание делимости — симво­
лом s J(n. Делимость — транзитивное отношение на Z. Если, далее,
62 Гл. 1. Истоки алгебры

т\п и п|ш, то п = ± т , и целые числа п, т называются ассоцииро­


ванными. Целое число р, делители которого исчерпываются числами
=Ьр, =Ь1 (не собственные делители), называется простым. Обычно в
качестве простых берутся положительные простые числа > 1.
Фундаментальную роль простых чисел вскрывает
О с н о в н а я т е о р е м а а р и ф м е т и к и . Каждое положитель­
ное целое число n / 1 может быть записано в виде произве­
дения простых чисел: п = Pi P2 ---Ps - Эта запись единственна с
точностью до порядка множителей.
Собрав вместе одинаковые простые множители и изменив обо­
значения, получим запись
n = p £i P 2£ 2 - - - P £k k , £ г > 0 ,

Для любого рационального числа а = п /т £ Q имеет место анало-


гичное разложение, но с показателями как положительными, так
и отрицательными.
Заметим, что множество
Р = { 2,3,5,7,11,13,...}
всех простых чисел бесконечно (теорема Евклида). Действительно,
если бы существовало лишь конечное число простых чисел, скажем,
Pi,P 2, • • • ,Рг, то по основной теореме число с = Р1 Р2 .. .pt + 1 делилось
бы по крайней мере на одно из pi. Без ограничения общности считаем
с = pic'. Тогда pi (с1 —р 2 .. .pt) = 1, а это невозможно, поскольку
делителями единицы в Ъ являются лишь =Ь1. □
Доказательство основной теоремы откладывается до гл. 5. На
первый взгляд, её вообще не надо доказывать, настолько она ка­
жется очевидной. Между тем, хотя речь идёт о мультипликативных
свойствах (свойствах делимости) целых чисел, основную теорему не­
возможно доказать, не используя одновременно операций умножения
и сложения в Ъ.
В качестве иллюстрации этого утверждения рассмотрим в N под­
множество
S = {4* + 1| * = 0,1,2,...}.
Оно замкнуто относительно умножения:
(4* i + 1)(4*2 + 1) = 4*з + 1.
Индукцией по п Е S нетрудно установить существование разложения
(первая часть основной теоремы) п = q\ ... qt, где qi — далее нераз­
ложимые элементы из S. Мы назовём их квазипростыми числами.
Выпишем несколько таких чисел: 5, 9,13,17, 21,49.
Вторая часть основной теоремы для системы S неверна, посколь­
ку, например, число 441 G 5 имеет два существенно разных разложе­
ния в произведение квазипростых чисел: 441 = 9 • 49 = 212.
§ 9. Арифметика целых чисел 63

2. НОД и Н О К в Z. Любые два целых числа п и т можно


записать в виде произведения степеней одних и тех же простых чисел
п = ±ррр%2 ■■■pf, т = ±р%1р%2 ■■■РР
к\
если условиться допускать нулевые показатели (как всегда, считая
р® = 1). Введём в рассмотрение два целых числа
Н О Д (п ,т) = р '11р 12 . . . p l h,
НОК (п,т) = p5
i P 52 ■■-р5к ,
где 7i = min («,,/3,), 5t = max (а*,/?*), i = 1 , 2 , . . . , к.
Так как d\n = > d = .. .p^fc, 0 ^ а[ ^ то из (1) вытекают
следующие утверждения.
i) НОД(п,ш)|п, НОД(п,ш)|ш, и если d\n, d\m , то с?|НОД(п,т).
и) п|НОК(п,ш ), ш|НОК(п,ш), и если п\и, т \и , то HOK(n, m)|m
Свойства i) и и) оправдывают сокращённые обозначения НОД и
НОК наибольшего общего делителя и наименьшего общего кратного
целых чисел п, т. При п > 0, т > 0 выполнено соотношение
НОД(п, гп) • НОК(п, ш) = пт. (2)
Целые числа п, т называются взаимно простыми, если
НОД(п,ш) = 1. В этом случае соотношение (2) принимает вид
НОК (п,ш) = ж .
3. А лгоритм деления в Z. При заданных а,Ъ Е Z, b > 0, всегда
найдутся q,r Е Z такие, что
а = bq + г, 0 ^ г < 6
(если считать лишь Ъ ф 0, т е будет выполнено неравенство
( К г < |6|).
В самом деле, множество
5 = {а —6s | s £ Z, а —6s ^ 0},
очевидно, непусто (например, а — Ь(—а2) > 0). Стало быть, 5 со­
держит наименьший элемент; обозначим его г = а — bq. По усло­
вию г ^ 0. Предположив г ^ 6, мы получили бы элемент г — 6 =
— а — b(q + 1) Е S', меньший, чем г. Это противоречие устраняется
лишь при г < 6. □
Проведённое несложное рассуждение даёт также предписание,
т.е. алгоритм (или алгорифм), для нахождения частного 6 и остат­
ках в конечное число шагов. Алгоритм деления в Z используется для
иного определения НОД, а следовательно, и НОК, если принять во в
нимание соотношение (2).
Именно, при заданных целых числах n, т , одновременно не рав­
ных нулю, положим
J = [пи + m v | и, v Е Z }. (3)
64 Гл. 1. Истоки алгебры

Выберем в J наименьший положительный элемент d = пи о + mv о.


Используя алгоритм деления, запишем п = dq + г, 0 ^ г < d. Ввиду
выбора d включение
r — n —dq — n — (тшо + mv$)q = n ( 1 — i&otf) + ш ( —Год) Е J
влечёт равенство г = 0. Стало быть, d\n. Аналогично доказывается,
что d\m. Пусть теперь d1 — любой делитель чисел п и т. Тогда
d'\n, d'\m = > d'\nuoj d'\mvo => d'\(nuo + mvo) => d'\d.
Итак, d обладает всеми свойствами наибольшего общего делителя, и
поэтому d = НОД(п,ш). Мы приходим к следующему утверждению.
Наибольший общий делитель двух целых чисел п, т, не равных
одновременно нулю, всегда записывается в виде
НОД (п,т) = пи + mv, u,veZ. (4)
В частности, целые числа п, т взаимно просты тогда и только
тогда, когда
пи + mv = 1 (4')
при некоторых и, v Е Z.
Было проверено, что взаимная простота п, т влечёт соотношение
(4Д. Обратно: если п, т таковы, что имеет место (4Д, то
d\n, d\m = > d\nu, d\mv = > d\(nu + mv) => d\l = > d = =Ы. □
Доказательство соотношений (4) и (4;) довольно эффективно.
Нужно взять любой положительный элемент из множества J (см. (3)),
а затем уменьшать его при помощи алгоритма деления до тех пор,
пока не получится наименьший элемент, который и будет наиболь­
шим общим делителем.

УП РА Ж Н ЕН И Я

1. К аж д о е нечётное п ростое число им еет вид 4/с + 1 или 4/с — 1. И спользуя


м ул ьти п л и к ати в н о сть м нож ества S' из п. 1, д о к а за ть бесконечность м нож ества
п р о сты х чисел вида 4/с — 1.
2. Д о к а за ть , ч т о сущ ествует бесконечно много п р о сты х чисел вида 4/с + 1,
опираясь на следующее н етри виальное утверж ден ие.
Если п, т G Z , Н О Д (п, т) = 1, и если р — простое число , делящее п 2 + т 2,
то р = 4/с + 1.
3. Если н атурал ьн ое число п делится в т о ч н о сти на г разл и чн ы х п ро сты х
чисел p i , . . . , рг , то количество чисел, меньш их п и взаим но п р о сты х с п, равно

*’(” , = ” ( У ) - ( У ) -
Ф ун кц и я р : N —» N н азы в ается функцией Эйлера.
П ровери ть справедливость ф орм улы для значений (р(п) при п <С 25 и при
п = рш.
4 . И спользуя биномиальную ф орм улу, индукцией по п д о к а за ть , ч т о если
р — п ростое число, то п р — п делится на р при любом п Е Z.
Глава 2

М АТРИЦЫ

Прямоугольные матрицы, введённые в § 3 гл. 1 , встречаются


настолько часто, что с течением времени возник самостоятельный
раздел математики — теория матриц. Её становление относят к се­
редине прошлого века, но полноту и изящество она приобрела позд­
нее, вместе с развитием линейной алгебры. До сих пор теория матриц
остаётся важным инструментом исследования, хорошо приспособлен­
ным и к запросам практики, и к абстрактным конструкциям совре­
менной математики. Здесь будут изложены простейшие результаты
теории матриц.
Матрицы являются естественными спутниками линейных отоб­
ражений векторных пространств. В курсе линейной алгебры и гео­
метрии [BA II] этому утверждению будет придан точный смысл. В
настоящей главе понятия пространства, вектора, линейной зависи­
мости, ранга системы и т.п. развиваются в чисто алгебраическом
аспекте и ровно настолько, насколько они необходимы для наших
непосредственных целей.

§ 1. В ек т о р н ы е п р о с т р а н с т в а с т р о к и стол бц ов

1 . М оти в и р овк а. В связи с системами линейных уравнений


нам приходилось рассматривать строки длины п, в которые вклады­
вался разный смысл. Это были строки (ац, а^, • • •, £ЦП), 1 ^ i ^ ш,
матрицы А = (dij ) размера т х п и решения ( х ^ х ®,. .. ,ж°) линей­
ной системы с матрицей А. Приведение в § 3 гл. 1 системы или
матрицы к ступенчатому виду включало, помимо элементарного
преобразования типа (I), два важных акта: умножение строки на
число и сложение двух строк. Те же действия можно производить и с
решениями о д н о р о д н о й линейной системы. Действительно, если
(х[, х'2, . . . , х'п) и (ж'/, х 2, . . . , х'п) — два решения системы
ацхх + ai2 x 2 + . .. + ainx n = 0, i = 1, 2 , . . . , m,
a <a, f3 — два любых вещественных числа, то строка
(ах[ + /Зх", а х 2 + (Зх2, . . . , ах'п + /Зх")
тоже будет решением нашей системы:

ац (ax'i + /Зх") + ai2 (ax 2 + (Зх2) + . .. + CLin (axfn + (Зх^) —


= ol{cli\ x'i + ai2 x 2 + . .. + = (З^ацх" + сц2 х 2 + . .. + = 0.

5. А. И. Кострикин
66 Г л. 2. Матрицы

С другой стороны, любая строка, что бы она ни выражала, яв­


ляется элементом “универсального” множества Еп , т.е. п- й декар­
товой степени множества Е вещественных чисел. Поэтому жела­
тельно изучить общий объект, свойства которого автоматически
переносились бы на матрицы и на решения однородных систем.
2. О сновны е определ ени я. Пусть п — какое-то фиксирован­
ное натуральное число. Векторным пространством строк длины п
над Е называется множество Еп (его элементами являются векторы-
строки или просто векторы), рассматриваемое вместе с операция­
ми сложения векторов и умножения их на скаляры — вещественные
числа. Скаляры обозначаются строчными буквами латинского или
греческого алфавита, а векторы — заглавными латинскими буква­
ми, как матрицы. По существу на вектор X = (яд,Ж2,. . . , х п) можно
смотреть как на 1 х n-матрицу. Пусть Y = (2/1 ?2/2?• • • ?Уп) — ещё один
вектор, Л — скаляр. По определению
X + Y = (ад + у 1 , х 2 + У 2 , - - - , х п + уп),
XX = (Лад, Хх2, . . . , Ххп).
Нулевой вектор (0 , 0 , . . . , 0 ) обозначается в дальнейшем обычным сим­
волом нуля 0 . Далее, Е1 принято отождествлять с Е.
Формальные правила действий с вещественными числами, без­
условно, известные читателю, переносятся на Еп . Их перечисление,
хотя и скучное, даёт точное представление о том, что следует пони­
мать под абстрактным векторным пространством, которое изуча­
ется в более позднем курсе линейной алгебры и геометрии:
ВПр X + Y = Y + X для любых векторов X, Y Е Еп ( закон
коммутативности);
ВП2: ( X + Y) + Z = Х + (Y + Z) для любых трех векторов X, У, Z Е
Е Еп ( закон ассоциативности);
ВП3: существует специальный (нулевой) вектор 0 такой, что X +
+ = X для всех X Е Еп ;
0
ВЩ: каждому X Е Еп отвечает противоположный (или обрат­
ный) вектор —X такой, что X + (—X) = 0;
ВП5: IX = X для всех X Е Еп ;
ВП6: (а/3 ) Х = а(/ЗХ) для всех <т, Д Е Е, X Е Еп ;
ВП7: (<т + Д)Х = а Х + ДХ;
ВП8: а ( Х + Y) = а Х + аУ.
Единственность векторов 0 и —X , о которых говорится в ВП3
и ВП4, равно как и другие простые следствия из указанных правил
(или аксиом, если имеется в виду абстрактное векторное пространст­
во), мы не будем выводить, считая их достаточно прозрачными.
Происхождение термина “векторное (или ещё линейное) прост­
ранство” разъясняется в курсе аналитической геометрии (читаемом
также в первом семестре), где устанавливается взаимно однозначное
§ 1. Векторные пространства строк и столбцов 67

соответствие между точками (векторами) пространства — декарто­


вой плоскости — и их координатами (х,у). Сложению векторов по
правилу параллелограмма и умножению их на число соответствуют
как раз действия с векторами-строками в R2 .
Наряду с векторным пространством строк длины п рассматри­
вается также векторное пространство столбцов высоты п
XI
Х2
\Х\ чХ2 , • • • 5х п\,

Хп
как мы их условились обозначать в § 3 гл. 1 . Понятно, что разли­
чие между пространствами строк и столбцов чисто условное, но мы
вскоре убедимся, что полезно иметь оба варианта пространства. Из
контекста обычно ясно, о каких векторах, столбцах или строках идёт
речь, поэтому никаких специальных обозначений не вводится.
3. Л ин ейн ы е ком бинации. Л инейная обол очка. Пусть X i,
Х 2 , • • •, — векторы пространства Rn и — скаляры.
Вектор X = ot\X 1 + 012X2 + . .. + OLkXk называется линейной комби­
нацией векторов Х{ с коэффициентами с^. Например,
(2,3,5,5) - 3(1,1,1,1) + 2(1,0, -1 , -1 ) = (1,0,0,0).
Пусть, далее, Y — (5 \Х \ + /З2Х2 + . .. + ftkXk — линейная ком­
бинация тех же векторов с коэффициентами Д , а <т, / 3 Е R. Тогда
а Х + f3 Y =
= ol(ol\X \ + OL2X2 + . .. + akXk) + X i + P2X2 + . .. + PkXk) =
= (aai + PPi)Xi + (cm2 + /^ 2)^ 2 + • • • + (peak + (3 f3k)Xk
— снова линейная комбинация векторов Х{ с коэффициентами
aai + PPi- Мы видим, что множество V всех линейных комбинаций
данной системы векторов X i , Х 2 , . . . , X/, обладает свойством
X , Y е V = > а Х + f3 Y е V (1)
для всех a,f 3 Е R. В частности, нулевой вектор всегда содержит­
ся в V.
Обычно V обозначают символом (X i, Х 2 , . . . , Х&) и называют
линейной оболочкой (или просто оболочкой) системы векторов X i,
Х 2, . . . , Х Ь Говорят ещё, что оболочка ( Xi , X2 , . . . , Х&) натянута
на Х \ , Х2 , . . . Xk или порождена векторами Х \ , Х2 , . . . , X /,.
Можно определить линейную оболочку любого подмножества S С
С Мп , понимая под (S) совокупность всех линейных комбинаций
к о н е ч н ы х систем векторов из S. Ясно, что если V — линейная
оболочка в Жп , то (V ) = V : любая линейная комбинация векторов
5:
68 Ел. 2. Матрицы

из У принадлежит У. В частности, S С У => (S ) С У , т.е. линей­


ную оболочку (S) можно определить как пересечение всех оболочек,
содержащих данное множество S векторов из Еп :
(5 ) = f ] V . (2)
scv
На первый взгляд не очевидно, что стоящее в правой части (2 )
пересечение ПУ какого-то множества оболочек будет линейной обо­
лочкой. Но если 1 , 7 G ПУ, то X, Y Е У для каждой оболочки У,
входящей в множество. Значит, а Х + (ЗУ Е У для всех а, /3 Е Е, а это
и даёт нужное включение а Х + /ЗУ Е ПУ. Напротив, объединение
U U У оболочек U и У, вообще говоря, не является оболочкой, как
показывает хотя бы пример U = {(Л, 0) | Л Е М}, У = {(0, Л) | Л Е 1}
в Е2 .
Рассмотрим два общих примера.
П р и м е р 1. П усть

Um = {(A i,...,A m,0,...,0) I Ai е М} с к п,


Vm = {(0^ •••; 0; Am+ 1 ,. ••, Ап) | Aj G ПК} С IK ,
0 < т < п. Н епосредственно п роверяется, ч т о и ш , Уш — линейные оболочки,
причём {Um,Vm) — Мп и f/m П Vm = {0}.
п р и м е р 2. В п р о стр ан ств е Мп рассм отри м т а к назы ваем ы е единичные
векторы-строки

E(i) = (1> 0 , . . . , 0), £7(2) = (0 ,1 ........ 0), £7(„) = (0 ,0 ........ 1). (3)

К а ж д ы й в ек то р X = (х±,Х 2 , • • • , х п ) однозначно зап и сы вается в виде X = х \ £ Д ) +


+ Ж2^ ( 2 ) + • • • + х п Е (пу П оэтом у

Шп = ( Е у у Е ( 2 ) ,.. • ,#(п)>-
Единичные векторы-столбцы будем об о зн ач ать символами
Я (1) = [ 1 ,0 , .. ., 0 ] , £ (2) = [ 0 , 1 , . . . , 0], ..., £ (п) = [ 0 , 0 , . . . , 1]. (3')

4. Л инейная зав и си м ость . Система векторов . . . , Х\~ про­


странства Еп называется линейно зависимой, если найдутся к чисел
а д , . . . , а^, одновременно не равных нулю и таких, что
OL\X1 + OL^X^ + . . . + OLkXk = 0 (4 )
(справа стоит нулевой вектор). Будем говорить также, что линейная
зависимость (4 ) нетривиальна. Если же а \Х \ + а^Х^ + . .. + otkXk =
= 0 => ад = ot2 — . • • OLk = 0 , то векторы Х\, Х 2 , . . . , Xк называются
линейно независимыми.
Пример 2 в и. 3 показывает, что единичные векторы Е щ , Е ^) , . . .
. . . , Е(п^ линейно независимы. Один вектор X ф 0 , очевидно, всегда
линейно независим, поскольку (АХ = 0 , X ф 0 ) => А = 0 . Далее,
свойство системы Х \ , . . . , Хк быть линейно независимой никак не
§ 1. Векторные пространства строк и столбцов 69

связано с порядком векторов, так как слагаемые оь\Х{ в равенстве


(4 ) могут быть переставлены произвольным образом.
Т е о р е м а 1 . Имеют место следующие утверждения :
i) система векторов { Xi , . . . , X/ . } с линейно зависимой под­
системой сама линейно зависима ;
п) любая часть линейно независимой системы векторов { X i , ...
. . . , Х/ Д линейно независима ;
ш) среди линейно зависимых векторов X i , . .. , Х& хотя бы один
является линейной комбинацией остальных ;
iv) если один из векторов X i , . .. , Х& выражается через осталь­
ные, то векторы X i , .. . , Х& линейно зависимы ;
v) если векторы Х \ , . . . , X л и н е й н о независимы , а X i , . . . , X /,, X
линейно зависимы , то X — линейная комбинация векторов X i , . . .
• • • 5Х&;
vi) еслп векторы X l, . . . , Х& линейно независимы и вектор Xk+i
нельзя через них выразить, то система X i , . . . , X/ . , X^+i линейно
независима.
Д о к а з а т е л ь с т в о , i) Пусть, например, первые s векторов
X i , . . . , X s, s < /с, линейно зависимы, т.е.
a iX , + . .. + <rsX s = О,
где не все oti равны нулю. Положив тогда a s+i = . .. = = О,
получим нетривиальную линейную зависимость
ol\ X 1 + . .. + otsX s + a s+ iX s+i + . .. + otkXk = 0.

Утверждение ii) непосредственно следует из i) (рассуждение от


противного).
ш) Пусть, например, ^ / Ов соотношении (4 ). Тогда
v v ак- г V
Qlk
iv) Пусть, например, Хк = Д1Х1 + . .. + /Зк- i X k - i . Положив ад =
= Д1, . . . , ак~ 1 = /Зк-1, OLk = —1 , придём к соотношению (4 ) с коэф­
фициентом 0£к ф 0.
v) Нетривиальное соотношение
Д1Х1 + . .. + (ЗкХк + д х = о
с (5 ф 0 даёт в силу ш) то, что нужно. Если, однако, (5 = 0 , то
Д1 = . .. = [Зк — 0, поскольку X i , . . . , Хк по условию линейно незави­
симы.
Утверждение vi) непосредственно следует из v). □
5. Б а зи с. Р а зм ер н о с т ь . Дадим теперь важное
О п р е д е л е н и е . Пусть V — ненулевая линейная оболочка в Еп .
Система векторов X i , . . . , X r Е V называется базисом для V (или
70 Г л. 2. Матрицы

в У), если она линейно независима и её линейная оболочка совпада­


ет с У:
(X 1 , . . . , X r) = V.
Из определений базиса и линейной оболочки системы векторов
следует, что каждый вектор X ЕУ записывается единственным обра­
зом в виде X = oi\X 1 + ... + а гХ г. Коэффициенты ад, . .., a r Е Е на­
зываются координатами вектора X относительно базиса Х \ , . .., Х г.
Как мы уже видели, линейно независимые единичные векторы
(3) порождают Еп. Стало быть, {^(i), ^ ( 2)5 • • •, Е(п)} — базис прост­
ранства Еп. Но этот так называемый стандартный базис — далеко
не единственный базис в Еп. Например, векторы

Е (1 ) = Д 1)’ Е (2 ) = Е (1 ) + Е (2 ),
Щз) = Е (1) + Е (2) + Д з ) , • • ч Щ п) = Е (1) + Е (2) + • • • + Е ( п )
тоже составляют базис пространства Еп (проверьте это аккурат­
но). С другой стороны, пока не ясно, каждая ли линейная оболочка
в Еп обладает базисом, а если да, то будет ли количество базисных
векторов постоянным. Ответы на оба вопроса оказываются положи­
тельными. Наши рассуждения будут основаны на следующей лемме.
Ле мма . Пусть У — линейная оболочка в Еп с базисом Х \ , . . . , Х г
и Y\, >2, ... , Ys — линейно независимая система векторов из У.
Тогда s ^ г.
Д о к а з а т е л ь с т в о . Как и все векторы из У, Y \, . . . , Ys являются
линейными комбинациями базисных векторов. Пусть
Y\ — Q-iiХ \ + (221^2 + ... + аг\ Х г,
Y2 = cii2 X i + 022 X 2 + ... + аГ2 Х г,

Ys — a\sX \ + d2 SX 2 + ... + arsX r ,


где ciij — какие-то скаляры (являясь координатами векторов Yj, они
однозначно определены, но это пока несущественно для нас).
Рассуждаем от противного. Предположим, что s > г. Составим
линейную комбинацию векторов Yj, с коэффициентами ху.
x{Y\ + ... + x sYs =
= (ацХ\ + g-12^2 + ... + OjisXg)Х \ + ... + {ar\X\ + ar2 X2 + ... + arsx s)X r.
и рассмотрим систему из г линейных уравнений с s неизвестными
ацхх + ai 2^2 + ... + cl\ sxs = О,

аг\Х\ + аг2 X2 + ... + arsx s = 0.


Так как по предположению s > г, то применимо следствие 2 § 3
гл. 1 , согласно которому наша система обладает ненулевым решением
§ 1. Векторные пространства строк и столбцов 71

(ж?,... , ж^). Мы приходим к нетривиальной линейной зависимости


*?Г 1 + x °2 Y 2 + . . . + х % = О,
наличие которой, однако, противоречит условию леммы. Значит,
s ^ г. □
Т е о р е м а 2. Каждая ненулевая линейная оболочка У С Еп обла­
дает конечным базисом. Все базисы оболочки V состоят из одина­
кового числа г ^ п векторов (это число называется размерностью
оболочки V и обозначается dim^ У или просто dim У).
Д о к а з а т е л ь с т в о . В соответствии с условием У содержит хо­
тя бы один ненулевой вектор Х \ (строку или столбец). Пусть мы
нашли в У линейно независимую систему векторов Xi,...,Xfc. Ес­
ли линейная оболочка ( Xi , ... , Х/Д не совпадает с У, то выберем в
У вектор Xk+i (X l, . . . , Х/Д. Другими словами, X^+i не является
линейной комбинацией векторов X i , . . . , X/,. По теореме 1, vi) систе­
ма X i , ... ,Xfc,X*;+i линейно независима. Мы могли бы продолжать
неограниченно процесс расширения линейно независимой системы,
но все её векторы Xi лежат в Еп = ( Е ^ , Е(2) , ... , Е(ПД, а по толь­
ко что доказанной лемме всякая линейно независимая система в Еп
содержит не более п векторов. Стало быть, при некотором нату­
ральном г ^ п линейно независимая система X i , . . . , Х&,. . . , X r Е У
станет максимальной, т.е. мы получим линейно зависимую систему
X i , . . . , Xr , X, каков бы ни был вектор X ф 0 из У. По теореме 1, v)
будем иметь включение X Е ( Xi , . . . , Х г). Значит, У = ( Xi , . . . , Хг),
и векторы X i , . . . , Х г составляют базис для У.
Предположим теперь, что Yi,..., Ys — ещё один базис для У.
По лемме мы имеем неравенство s ^ г. Поменяв местами системы
Х Ь . . . , Х Г и УЬ . . . , У5, мы получим по той же лемме неравенство
г ^ s. Стало быть, s = г, и теорема доказана. □
Заметим, хотя в этом и нет большой необходимости, что все наши
рассуждения в равной мере относились как к пространству строк,
так и к пространству столбцов.
Итак, с каждой линейной оболочкой У в Еп ассоциируется целое
положительное число г ^ п, которое мы назвали её размерностью:
г = dim У. В частности, dimEn = п. Этот важный числовой пара­
метр пространства можно характеризовать разными другими спосо­
бами. Один из вариантов определения размерности основан на поня­
тии ранга системы векторов. Именно, если {Xi, Х 2, ... } — какая-то,
возможно, бесконечная, система векторов в пространстве Еп, то, как
мы знаем, размерность линейной оболочки ( Xi , ...) не превосходит
п. Её называют рангом системы {Xi , X 2, ... }:
rank {Xi, Х2, ... } = dim ( Xi , X2,...).
В случае У = {0} принято считать dim У = 0.
72 Г л. 2. Матрицы

УП РА Ж Н ЕН И Я

1. Л инейная оболочка (U U V) н азы в ается суммой п о д п р о стр ан ств U и V:

и + У = {U и V) = {и + v I и Е и, v Е V}.

Если U H V = 0, то го во р ят, ч т о сум м а U + V прямая , и пиш ут (7 0 У .


П усть V = V i 0 V 2 и X = X i + Х 2 = Х [ + Х£ — Два вы раж ен ия в ек т о р а
X G V в виде линейной комбинации век торов X i , X j Е V\ и Х 2 ,Х ^ G V0 Т огда
имеем Х \ — Х [ = X f2 — Х 2 G Vi П V2 , а т а к к а к Vi П V2 = 0, т о X i = Х [ , Х 2 = Х £ .
Д о к а за ть обратн ое: если запись X = X i + Х 2 , Х{ Е У , i = 1,2, единственна
для к аж д о го в ек т о р а X £ У , то сум м а V = V\ + V2 прям ая. Более общо: сумм а
V п о д п р о стр ан ств V \ , . . . , С Мп н азы в ается прямой суммой V = V\ 0 . . . 0 ,
если к аж д ы й в ек то р X Е V им еет однозначное вы раж ен ие вида X = Х \ + .. . + Хд.
с Xi G
2. П усть V, Vi и У2 — линейные оболочки в Мп , причём У С Vi + V2 . В сегда
ли верно, ч т о V = V П Vi + V П V2 ? Ч т о можно с к а за т ь про это соотнош ение в
частном случае V\ С V ?
3. П усть V — линейная оболочка в Мп . Если V = U 0 W — разлож ение в
прям ую сумму, то оболочка W н азы в ается дополнением к U, a U — дополне­
нием к W в V. О днозначно ли определено дополнение к U в V ? С р авн и ть W с
теорети ко-м н ож ествен н ы м понятием дополнения V /U (см. § 5 гл. 1).
4. П о к а за ть , ч т о в ек то р ы Х \ = (1 ,2 ,3 ), Х 2 = (3 ,2 ,1 ) линейно независимы ;
р а сс м о тр е ть линейную оболочку V ( X i , X 2 ); п о к а за ть , ч т о в ек то р X = (—5 ,2 ,9 )
содерж ится в V, и н ай ти его коор д и н аты в базисе X i , X 2 ; н ай ти в М3 хотя бы
одно дополнение к V.
5. П о к а за ть , ч т о систем а в ек торов X i , . . . , X n из Шп т о гд а и только т о гд а
п о рож дает Мп , к огд а она линейно независим а.
6 . П о к а за ть , ч т о всякую линейно независимую систем у в ек торов X i , . . . , Хд.
из линейной оболочки V С Мп можно влож ить в некоторую базисную систему
для V.
7. П усть U и V — линейные оболочки в Мп . Д о к а за ть , ч т о если U П V = О,
то dim (U + V) = dim U + dim V.
8. Н ай ти ран г систем ы век торов (0 ,1 ,1 ), (1 ,0 ,1 ), (1 ,1 ,0 ).

§ 2. Р а н г м атр и ц ы

1. В озв р ащ ен и е к уравн ен иям . В векторном пространстве


Мт столбцов высоты т рассмотрим п векторов
А(з) = [aij,a2j, • • •, amj\, j = 1, 2, .. ., п,
и их линейную оболочку V = {А^1\ , . . . , А ^ ) . Пусть дан ещё
один вектор В = [&ь • • •, Ьт\. Спрашивается, принадлежит ли В
линейной оболочке V С Мт , а если принадлежит, то каким образом
его координаты bi, ..., Ьш (относительно стандартного базиса (3') из
§ 1) выражаются через координаты векторов А^А? В случае dim У =
= п вторая часть вопроса относится к значениям координат вектора
В в базисе А^А, . . . , А^А. Мы берём линейную комбинацию векторов
§ 2. Ранг матрицы 73

с произвольными коэффициентами Xj и составляем уравнение


х\ Д.П) + ... + х пА = В. Наглядный вид этого уравнения
а ц &12 &1п h

&21 &22 &2п ь2


+ Х2 + . . . + Х п =

&т 1 dm 2 & т п дт

есть лишь иная запись системы из т линейных уравнении с п неиз­


вестными
d l l X i + CI1 2 X 2 + . . . + CLlnx n — b i,
^21*^1 + &22х 2 + • • • + &2пх п = ^2> (2)
Q"mlx l “Ь &т2х 2 + • • • + 0"тпх п = Ьп
Именно такую систему мы и встретили впервые в § 3 гл. 1. Там же
были введены простая и расширенная матрицы
ац ац а\п
&21 а22 &2 п
А=
ami аm2 •• &тп

(3)
ац d 12 .. а\п
&21 &22 &2 п
(А\В) =

ami аm2 • • &тп


линейной системы (2). Первое впечатление таково, что мы вернулись
к исходным позициям, потеряв время и ничего не выиграв. На самом
же деле мы располагаем теперь рядом важных понятий. Осталось
приобрести навыки в обращении с ними.
В этом месте удобно ещё раз остановиться на обозначениях. Для
сокращения записи мы часто будем сумму si + S2 + ... + sn обозна­
чать Yli=i Si• При этом s i , ..., sn — величины произвольной природы
(числа, векторы-строки и т.д.), для которых выполнены все законы
сложения чисел или векторов. Правила
п п п п п
^ ^t§i —t У ^Si, У ^(Sj Т ti) —''У^ Т ''У^ti
2=1 2=1 2=1 2=1 2=1
достаточно понятны, чтобы их нужно было разъяснять.
Будут рассматриваться также двойные суммы
п т п т т п

S Y, = Ё (5Z аД = 5Z ( S аД = Е а« ’
з=1 *=1 3= 1 г=1 2=1 3=1
74 Г л. 2. Матрицы

в которых порядок суммирования (по первому и второму индексу)


можно выбирать по своему желанию. Это легко понять, если рас­
положить величины ац в прямоугольную матрицу размера т х п: в
нашей воле начинать суммирование элементов матрицы по строкам
или по столбцам.
Другие возможные типы суммирования будут разъясняться в нуж­
ном месте.
2. Р а н г м атри цы . Назовём пространством столбцов прямо­
угольной матрицы А размера т х п (см. (3)) введённую выше ли­
нейную оболочку V = ( А ^ \ Д(2\ . .., Д(п)). Будем теперь V обозна­
чать VB(А) или просто VB (в — вертикальный). Размерность гв(А) =
= dim VB назовём рангом по столбцам матрицы А. Аналогично вво­
дится ранг по строкам матрицы А: гГ(А) = dimHr , где Vr = (Ар),
Д( 2), . . . , А(ш)) — пространство строк матрицы А , т.е. линейная
оболочка в Еп, натянутая на векторы-строки Ар) = (ац, а^, • • •, flm),
г = 1, 2, .. ., m (г — горизонтальный). Другими словами,
rB{A) = rank {А{1 \ А {2 \ . . . , А (пЦ,
гг {А) = rank {Д(1), А( 2 ), ■■■, -А(ш)}
— ранги систем векторов-столбцов и векторов-строк соответствен­
но. По теореме 2 § 1 величины гв(А) и гг (А) определены правильно.
Следуя терминологии, введённой в § 3 гл. 1, будем говорить, что
матрица А' получена из А элементарным преобразованием типа (I),
если А|р = Ар), Ар) = Ар) для какой-то пары индексов s ф t
и А ^ = Ар) для i ф s,t. Если же А ^ = Ар) для всех i ф s и
Ар) = Ар) + ААр), s / t, A G 1, то говорим, что к А применено
элементарное преобразование типа (II). Здесь имеются в виду эле­
ментарные преобразования над строками матрицы А.
Заметим, что элементарные преобразования обоих типов обра­
тимы, т.е. матрица А', получающаяся из А при помощи одного эле­
ментарного преобразования, переходит снова в А путём применения
одного элементарного преобразования, причём того же типа.
Ле мма . Если матрица А 1 получена из прямоугольной матрицы
А путём применения конечной последовательности элементарных
преобразований над строками, то имеют место равенства:
i) гГ(А') = гг (А);
и) гв(А') = гв(А).
Д о к а з а т е л ь с т в о . Достаточно рассмотреть тот случай, когда
А 1 получена из А путём применения одного элементарного преобра­
зования (э.п.).
i) Так как
(A(i) э• • • эАр), . . . , Ар), . . . , А(ш)) (Ар), . . . , Ар), . . . , Ар), . . . , A^m)),
§ 2. Ранг матрицы 75

то э.п. типа (I) не меняет гГ(А). Далее,


A{s) = A (s) + АЛр) => Д(5) = А(в) - АЛщ,
и, следовательно,
(Д(1),..., Д(в) + АД(ф ... , Лр), . .., Д(ш)) =
(^(1) 5' ' ' 5^-(s) 5' ' ' 5^-(t) 5' ' ' 5Al-(m)) ,
так что гг (Л) не меняется и при э.п. типа (II).
п) Пусть А ' ^ \ 1 ^ j ^ п, — столбцы матрицы А1. Докажем, что
п п

X ! Xi A{3) = 0 xj A'ti) = 0- (4)


э=1 i=i
С этой целью рассмотрим две линейные однородные системы Л ОС
и ЛОС' с матрицами А и Л/ соответственно, записанные в виде (1)
(столбцы свободных членов нулевые):
п п

ЛОС : J 2 xj AU) = 0. лос' : = 0-


3= 1 J= 1
Матрицы А и А 1 у нас таковы, что ЛОС' получается из ЛОС при
помощи э.п. типа (I) или (II). По теореме 1 § 3 гл. 1 системы ЛОС
и ЛОС' эквивалентны, т.е. всякое решение (Ai, А2, . .., Ап) одной
системы будет решением другой, а это и есть импликация (4).
Таким образом, всякой, в том числе и максимальной, независи­
мой системе столбцов одной матрицы будет отвечать независимая
система столбцов с теми же номерами другой матрицы, чем и уста­
навливается равенство гв(Д/) = г ДА). □
Основным результатом этого параграфа является следующее ут­
верждение.
Т е о р е м а 1. Для любой прямоугольной т х п-матрицы А спра­
ведливо равенство г ДА) = г ДА) (это число называется рангом
матрицы А и обозначается rank Л).
Д о к а з а т е л ь с т в о . По теореме 2 § 3 гл. 1 конечным числом эле­
ментарных преобразований, совершаемых над строками Ai, матрицу
А можно привести к ступенчатому виду
ац .. aik • .. ац . .. dis din
0 . .. а2к •.. a 2i . .. a2s • • • a 2n
0 . .. 0 . .. а3/ . . . CL^g • • ^3 n

0 . .. 0 . .. 0 . .. ars .. d rn
0 . .. 0 . .. 0 . .. 0 . .. 0

0 . .. 0 . .. 0 . .. 0 . .. 0
76 Г л. 2. Матрицы

с а ца 2 к^з1 • • •Urs Ф 0. Согласно лемме


rB(A) = RB(A), гг (А) = гг (А),
так что нам достаточно доказать равенство гв(А) = гг (А).
Столбцы матриц А и А с номерами 1, f c , отвечающими
главным неизвестным яд, яд, ж/,. .., яд линейной системы (2), будем
называть базисными столбцами. Эта терминология вполне оправда­
на. Предположив наличие соотношения
A i + АкА^к) + А/Л(/) + ... + ASA ^ = 0,
связывающего векторы-столбцы

Л(1) = [ащ 0,... ,0], й (/е) = [аи , а2^,0, ... ,0], ...
... , Э/ ^ SJ • • • J^rsi 0, . . . ,0]
матрицы (5), получим
As&rs —0? • • • ч А/аз/ —0, А/Щ2А; —0? Aian —0,
а так как а ц а ^ а з / ... ars ф 0, то Ai = Хк = А/ = ... = As = 0. Значит,
rank { А ^ \ А ^ , А^1\ ... = г и гв(А) ^ г. Но пространство Ув,
порождённое столбцами матрицы А , отождествляется с простран­
ством столбцов матрицы, которая получается из А удалением по­
следних т —г нулевых строк. Поэтому rB(A) = dimkB ^ dimRr = г.
Сопоставление двух неравенств показывает, что гв(А) = г (неравен­
ство гв(А) ^ г вытекает также из того очевидного соображения, что
все столбцы матрицы А являются линейными комбинациями базис­
ных; проделайте это самостоятельно в качестве упражнения).
С другой стороны, все ненулевые строки матрицы А линейно не­
зависимы: любое гипотетическое соотношение
^i^(i) + ^2А (2) + ... + АГП(Г) = 0 , А/ g R,
как и в случае со столбцами, даёт последовательно
Aidu = 0, A2d2^ = 0, ..., Arars = 0,
откуда А) = А2 = ... = Аг = 0. Стало быть, гг (А) — г — гв(А). □
3. К р и т ер и и со в м ест н о ст и . Ступенчатый вид матрицы А ,
дающий ответ на ряд вопросов относительно линейных систем (см.
§ 3 гл. 1), содержит элементы произвола, связанные, например, с вы­
бором базисных столбцов, или, что эквивалентно, с выбором главных
неизвестных системы (2). В то же время из теоремы 1 и из её дока­
зательства извлекается
С л е д с т в и е . Число главных неизвестных линейной системы (2)
не зависит от способа приведения её к ступенчатому виду и равно
rank Л, где А — матрица системы.
§ 2. Ранг матрицы 77

Действительно, мы видели, что число главных неизвестных равно


числу ненулевых строк матрицы А (см. (5)), совпадающему, с ран­
гом матрицы А. Ранг определялся нами совершенно инвариантным
образом. (Этими словами выражается тот факт, что ранг матрицы
служит её внутренней характеристикой, не зависящей от каких-либо
привходящих обстоятельств.) □
В следующей главе мы получим эффективное средство для вычис­
ления ранга матрицы А , устраняющее необходимость приведения А
к ступенчатому виду. Это, несомненно, повысит ценность утверж­
дений, основанных на понятии ранга. В качестве простого, но по­
лезного примера сформулируем критерий разрешимости линейной
системы, речь о котором шла ещё в гл. 1.
Т е о р е м а 2 (Кронекер—Капелли). Система линейных уравне­
ний (2) совместна тогда и только тогда, когда ранг её матрицы,
совпадает с рангом расширенной матрицы (см. (3)).
Д о к а з а т е л ь с т в о . Совместность линейной системы (2), запи­
санной в виде (1), можно трактовать (с этого начинался настоящий
параграф) как вопрос о представлении вектора-столбца В свободных
членов в виде линейной комбинации векторов-столбцов А^А матрицы
А. Если такое представление возможно (т.е. система (2) совместна),
то В G (Д(1), ..., АА)) и гапк{Д^\ ..., Д(п)} = гапк{Д^\ ..., Д(п), В},
откуда гапкД = гв(А) = гв((А\В)) = гапк(Д|£?) (см. формулировку
теоремы 1).
Обратно: если ранги матриц А и (А\В) совпадают и {Д(Д),...
...,Д(Д)} — какая-то максимальная линейно независимая система
столбцов матрицы А , то расширенная система {Д(Д),. .., Д(Д), В}
будет линейно зависимой, а это по теореме 1, v) § 1 означает, что
В — линейная комбинация базисных (и тем более всех) столбцов А^А.
Стало быть, система (2) совместна. □

УП РА Ж Н ЕН И Я

1. Д о к а за ть теорем у 1, не приводя т х n -м атр и ц у А = ( a i j ) к с туп ен ч атом у


виду.
У к а з а н и е . П усть dim V r(A ) = г, dim Vb (A) = s. В ы б р ать г базисны х строк;
без ограни чения общ ности можно с ч и т а т ь , ч т о ими являю тся первы е г с тр о к
А( 1 ), 2) , . . . , А (г ) . Р а с с м о т р е т ь укороченную г х n -м атр и ц у А = [А<д), А (2) , • • •
. . . , А (г )], составленную из первы х г с тр о к м атр и ц ы А. В ы б р ать в A t базисны х
столбцов, t = dim Vb (A). П усть ими будут А ^ \ . . . , А ^ \ Т ак к а к VB(А) С 1 г , то
t <С г. Для к аж д о го столбца А Д ), k > t, нуж но н ай ти скаляры A i, . . . , At G 1 так и е,
ч т о А*А) = Ai AA) + . . . + At A ^ \ т.е. = YAp = i ^ p aip> 1 ^ г ^ m . П ри г ^ г это,
наверное, т а к , ибо и м еется соотнош ение А*А) = Ai А А) + . . . + А*А ^) для укоро­
ченны х столбцов. П ри г > г и спользовать вы раж ен ие А ^ = щ А ^ + . . . + ц г А ^
для г-й стр о к и через первы е г стр о к . Из него следует, ч т о = Х ц = 1 Н1а1к —
= E [= 1 Ul YAp=i XPalp = YAp=i х р E [= 1 Ulalp = YAp=i ^ i p - У становленная ли­
78 Г л. 2. Матрицы

нейная зави си м ость столбцов п о к азы в ает, ч т о s <С £, а т а к к а к t <С г, то s ^ г.


Р а с с м о т р е т ь , далее, т а к назы ваем ую транспонированную м атри ц у
ац a 2i аШ1
0Д2 ^22 . • ат2
O-ln U2 п Umn

р азм ер а п х т. И м ею т м есто равен ств а гг (ьА) = гв (А), гв (ьА) = гг (А ), поэтом у


по доказанном у г <С s. С тало бы ть, г = s.
2. К а к и в случае с тр о к , п ерестан овку столбцов с ном ерам и s ж t м а т р и ­
цы А н азы в аю т элем ентарны м преобразован ием (э.п.) т и п а (I), а прибавление к
s-му столбцу t -го столбца, ум нож енного на скаляр Л, — э.п. т и п а (II).
У к а зат ь сту п ен ч аты й вид м атр и ц ы А по столбцам . Э лем ентарн ы м и п рео б р а­
зованиям и столбцов п ри вести м атр и ц у А (см. (5)) к виду

А = diag ( й ц , й 2 2 ,. .. , а г г , 0 , . . . ,0 ),
где а ц = а п , а 2 2 = а2к , а 33 = а зг, . . . , arr = a r s ; Щ = 1 аи Ф
3. П о к а за ть , ч т о при ао ф 0 к в ад р ат н а я м атр и ц а
0 0 .,. . 0 0 ао
1 0 .,. . 0 0 ai
0 1 .,. . 0 0 а2

0 0 .,. . 1 0 0“п - 2
0 0 .,. . 0 1 Ufi— 1
им еет ран г п.
4 . Условие равен ств а р ан гов двух м атри ц

а 1 СК2 <*1 OL2

, в = л fi2 • fin
/81 /82 . fin
71 72 •• 7п

в ы р ази ть геом етри ч еск и м свойством м н ож ества п прям ы х на плоскости.

§ 3. Л и н ей н ы е о т о б р а ж е н и я .
Д ей ств и я с м атр и ц ам и
1. М атрицы и отображ ения. Пусть Еп и Rm — векторные
пространства столбцов высоты п и т соответственно. Пусть, далее,
А = (ац) — матрица размера т х п. Определим отображение ipа •
Rn -э Rm, полагал для любого X = [яд,ж2>. . . , х п\ Е W1
р л (Х ) = x i + х 2 А ^ + ... + х пА^п\ (1 )
где А , . . . , А (п) — столбцы матрицы А (сравнить с (1) § 2). Так как
они имеют высоту ш, то в правой части (1 ) стоит вектор-столбец
Y = [у1 , 2/25***5 Ут\ £ Rm. Более подробно (1) переписывается в виде
п

Vi = ^ ^ Q'ij’
Ej э i — 1, 2 , . . . , т . (!')
3= 1
§ 3. Линейные отображения. Действия с матрицами 79

Если X = X ' + X " = [х[ + ж'/, #2 + #2 , • • • 5ХП + т0


п п п
ы х ' + х") = Е(Д+
2=1
= Е хХ
2=1
}+ Е ^ (i) =
2=1
= 'рА(Х')+<рА(Х").
Аналогично,
п п
<рА (XX) = Е A*iA(<)=АЕ =А< (Х ),
ра Age.
2=1 2=1

Обратно, предположим, что р: Еп —у Ет — отображение множеств


в смысле § 5 гл. 1, обладающее следующими двумя свойствами:
i) р(Х ' + X") = р(Х') + р(Х") для всех X*,Х" е Еп;
и) р ( \Х ) = Ар(Х) для всех X Е En , A Е Е.
Как мы знаем (см. и. 3 § 1), Еп = . .., Е ^ ) — линейная
оболочка стандартных базисных столбцов, так что
п
X = [хх,х2, . . . , х п]= Y xX 3)-
3= 1
Согласно свойствам i), ii) имеем
п п
ср(Х) = v ( X xi EU)) = Y XM E U)- (2)
3= 1 j= l

Соотношение (2) показывает, что отображение р полностью опреде­


ляется своими значениями на базисных векторах-столбцах. Положив
Д £ Ш ) = [ aij, a2 j , .. . , a mj] = G Mm, (3)
мы обнаруживаем, что задание р равносильно заданию прямоуголь­
ной матрицы А = (aij) размера т х п со столбцами А^1 \ . . . ^ А ^ п\
а соотношения (1) и (2) фактически совпадают. Стало быть, можно
положить if = р а .
О п р е д е л е н и е . Отображение р = ра • Еп —>• Ет , обладающее
свойствами i), ii), называется линейным отображением из Еп в Ет .
Часто, в особенности при п = ш, говорят о линейном преобразова­
нии. Матрица А называется матрицей линейного отображения р а -
Пусть р а ,РА' — два линейных отображения Еп —>Ет с матри­
цами А = (а^) и А! — (аС). Тогда равенство ра — РА1 равносильно
совпадению значений р а ( Х ) = р а >(Х) для всех X Е Еп . В частно-
сти, A'(j) = <pAi ( E = ipа (Ев) = A 1 4 . j 4.п, откуда а' - = ац и
А' = А
80 Г л. 2. Матрицы

Резюмируем наши результаты.


Т е о р е м а 1. Между линейными отображениями Еп в Ет и
матрицами размера т х п существует взаимно однозначное соот­
ветствие.
Следует подчеркнуть, что бессмысленно говорить о линейных
отображениях S —У Т произвольных множеств S и Т. Условия i),
ii) предполагают, что S и Т — линейные оболочки в Еп и Ет соот­
ветственно.
Обратим внимание на специальный случай m — 1, когда линейное
отображение ср: Еп —у Е, обычно называемое линейной функцией от
п переменных, задается п скалярами сд, а 2, ..., ап:
<р(Х) = <р(хг,Х2, . . . , х п) = а \Х \ + а2х 2 + ... + а пх п. (4)
З а м е ч а н и е . Наша терминология отличается от той, которая
принята в средней школе, где (в случае одной переменной х) линейной
называют функцию х н->> ах + Ь.
Линейные функции (4), равно как и произвольные линейные отоб­
ражения Еп —у Ет при фиксированных п и т можно складывать и
умножать на скаляры. В самом деле, пусть Рв- Еп —у Ет — два
линейных отображения. Отображение
ср — otpа Т (дрв • Еп —у Em, (Т, /3 G Е,
определяется своими значениями:
<р(Х)=а<рА(Х)+13<рв(Х).
В правой части стоит обычная линейная комбинация векторов-столб­
цов.
Так как
р{Х' + X") = а<рА(Х' + X") + /3<рв(Х' + X й) =
= а{ч>А{Х') + ч>А{Х")} + Р{<Рв(Х') + <Рв(Х")} =
= {aipA(X') + а ^ в (Х ')} + {aipA(X") + f o B {X")} = A X ' ) + А Х " ) ,

А Х Х ) = а<рА(XX) + pifB{XX) = а \ р А(Х) + /3\<рв (Х) =


= \{а<рА(Х) + f o B {X)} = \ А Х )
(здесь мы неявно пользовались правилами ВЩ-ВЩ из § 1), то <р —
линейное отображение. По теореме 1 можно говорить о его матрице
С: р = рс- Чтобы найти (7, выпишем, следуя (3), столбец с номе­
ром j:
[c ij,c 2j , . . . , c mj] = C ^ = < р с ( Е ^ =
= aipA(Eij)) + f3ipB(Eij)) = a A {i) + f3Bij) =
= \aa±j + fdb\j, aa 2j + /^ 2j, • • • ? oiamj + fdbmj\.
§ 3. Линейные отображения. Действия с матрицами 81

Матрицу С = (cij с элементами с^- = аац + fibij естественно назвать


линейной комбинацией матриц А и В с коэффициентами и /3:
ац (1\п Ьц ... ь1п
+ Р
Clml -- &тп Ьщ 1 ••• Ьт п
СШц + /36ц cmin + f3bin
(5)
-|- /36т 1 (Х&тп Н" f i b т п

Итак,
+ fltfB = фаА+0 В- (6)
Особенно часто нами будет использоваться тот факт, что ли­
нейные комбинации линейных функций снова являются линейными
функциями.
В заключение этого пункта отметим, что если правила ВЩ -
ВП8 из § 1 для векторных пространств переписать, заменив всюду
векторы-строки X , У, Z на матрицы размера т х п, то в соответствии
с определяющим соотношением (5) получатся правила BMi-BMg, ко­
торые дают основание говорить о векторном пространстве матриц
размера т х п . Если угодно, его можно считать компактной записью
векторного пространства Rmn строк длины тп (строки разбиты на
отрезки длины п, расположенные друг под другом).
2. П р о и зв ед ен и е м атри ц . Соотношения (5) и (6) выражают
согласованность действий сложения и умножения на скаляры в мно­
жествах матриц размера т х п и отображений Rn —>Rm. В случае
произвольных множеств имеется ещё важное понятие произведения
(композиции) отображений (см. п. 2 § 5 гл. 1). Разумно ожидать, что
композиция двух линейных отображений должна выражаться неким
согласованным образом в терминах матриц. Посмотрим, как это де­
лается.
Пусть <рв : Rn —>• Wa : Rs —>• Rm — линейные отображения,
(рс — <рл ° в — их композиция:

Вообще говоря, нам следовало бы предварительно проверить, что


ip = ipа ° в — линейное отображение, но это довольно ясно:
i) A X ' + X") = v a (v b (X' + X ")) = <рА( Ы Х ' ) + Ы Х " ) ) =
= Ы Ы Х 1)) + <р а (<р в ( х " ) ) = А Х ') + АХ"У,
6 А.И. Кострикин
82 Г л. 2. Матрицы

и) <р{\Х) = v a {v b {XX)) = <рА(Х<рв (Х)) = Х Ы ^ в ( Х ) ) = Х<р(Х);


поэтому по теореме 1с ср ассоциируется вполне определённая матри­
ца С.
Действие отображений на столбцы в цепочке
\х\ 5• • • 5Хп] I У\yi 5... 5Ув\ 1 У\%15• • ' 5Zm\
запишем в явном виде по формуле (1'):
S S п п / S \

— У ^ &ИгУк = У ^ &ik У ^ ЬkjXj — У ^ ( У ^ dik^kj | Xj.


к= 1 &=1 j=l j = l \&=1 /
С другой стороны,
п
Zi = ^ 2 CijXj, г=
j =1
Сравнивая полученные выражения и памятуя о том, что (j =
= 1,2,..., гг) — произвольные вещественные числа, мы приходим к
соотношениям
s
Cij = ^ 2 aikbkj, 1 ^ г ^ то, 1 ^ j ^ п. (7)
*=1

Будем говорить, что матрица С = (с^-) получается в результате


умножения матрицы Д на матрицу В. Принято писать
С = АВ.
Таким образом, произведением прямоугольной матрицы (а^) раз­
мера ш х й и прямоугольной матрицы (bki) размера s х п называется
прямоугольная матрица (с^-) размера т х п с элементами Qj, задаю­
щимися соотношением (7).
Нами доказана
Т е о р е м а 2. Произведение (рл^в двух линейных отображений с
матрицами А и В является линейным отображением с матрицей
С = АВ. Другими словами,
^ А ^ В —^АВ- (8)
Соотношение (8) — естественное дополнение к соотношению (6).
Мы можем забыть о линейных отображениях и находить произве­
дение АВ двух произвольных матриц Д, Б, имея в виду, однако, что
символ АВ имеет смысл только в том случае, когда число столб­
цов в матрице А совпадает с числом строк в матрице В. Именно
при этом условии работает правило (7) умножения г-й строки Д(р на
j -й столбец В ^ \ согласно которому
Cij = Д ц , ... , CLis) \plj 5• • • 5bsj\ = A ^ B ^ . (9)
§ 3. Линейные отображения. Действия с матрицами 83

Число строк матрицы АВ равно числу строк матрицы А , а


число столбцов — числу столбцов матрицы В. В частности, произ­
ведение квадратных матриц одинаковых порядков всегда определе­
но, но даже в этом случае, вообще говоря, АВ ф В А, как показывает
хотя бы следующий пример:
1 0 0 0 0 0 0 1 0 0 1 0
— ф —
0 0 1 0 0 0 0 0 1 0 0 0
Умножение матриц, конечно, можно было бы вводить многими
другими способами (умножать, например, строки на строки), но ни
один из этих способов не сравним по важности с рассмотренным
выше. Это и понятно, поскольку мы пришли к нему при изучении
естественной композиции (суперпозиции) отображений, а само по­
нятие отображения относится к числу наиболее фундаментальных в
математике.
С л е д с т в и е . Умножение матриц ассоциативно:
А(ВС) = (А В )С .
Действительно, произведение матриц соответствует произведе­
нию линейных отображений (теорема 2 и соотношение (8)), а по тео­
реме 1 § 5 гл. 1 произведение любых отображений ассоциативно. К
тому же результату можно прийти вычислительным путём, исполь­
зуя непосредственно соотношение (7). □
Обратим ещё внимание на так называемые законы дистрибутив­
ности:
(А + В)С = АС + ВС, D(A + В) = DA + DB, (10)
где A^B^C^D — произвольные матрицы размеров соответственно
т х s, т х s, s х п, п х т.
Действительно, полагая А = (а^-), В = (Ь^-), С = (оД, мы полу­
чим для любых г, j равенство (используя дистрибутивность в Е)
п п п
^ “Ь bik)ckj = ^ ^ QjfeCfej “Ь ^ ^ bjkCkj,
k= 1 k= 1 k= 1
левая часть которого даёт элемент gij матрицы (А + В)С, а правая —
элементы Нц и Ыц матриц АС и соответственно ВС. Второй закон
дистрибутивности (10) проверяется совершенно аналогично.
3. Т ран сп они ровани е м атри ц . Будем говорить, что матрицы
ап ап .. а\п ац a 2i a ml
^21 ^22 &2п &12 (к22 *кm 2
А= *А =
& ml • • (ктп
ат 2 <kin *к2п • • (ктп
размеров т х п и п х т соответственно получаются друг из дру­
га транспонированием — заменой строк на столбцы, а столбцов на
6:
84 Г л. 2. Матрицы

строки (внимательный читатель заметит, что понятие транспониро­


вания уже встречалось в упр. 1 § 2). Непосредственно видно,что
*(*А) = А, г(А + В) = fA + гВ, 1 {\А) = \ 1 А.
Транспонирование произведения матриц подчиняется более инте­
ресной закономерности. Если
ап «12 ••• «Is bll bl2 • bln
А= «21 «22 «2s В = ^21 b22 . • • b2n

«ml «m2 • • • «ms bsl bs2 • • bsn

гВ = (b'jk),
II

ТО
a ki ~ a iki b'jk = bkj■
Вычисление коэффициентов матриц
«n «12 • «In
«21 «22 «2n
С = AB =
«ml «m2 • • «mn
dn di 2 6?lm
d2i d2m
fB ■ *A = ^22

dni dn2 •• • dnm


по формуле (7):
п п п
cij ~ a ikbkj ? dji = bjka ki — a ik bkj ?
к=1 к=1 к=1
показывает, что dji = Cij при всех 1 ^ i ^ m, 1 ^ j ^ п. Значит,
гС = D, или, в исходных обозначениях,
\ А В ) = 1 В • 1А.
Более общо: если определено произведение матриц Ai, А2, . .., Аг, то
t (A 1 A 2 . . . A r) = 1Аг . .. 1 А21Ап
В силу теоремы 1 § 2 выполнено также свойство rankM. = rank А
4. Р ан г произведения м атриц. Пусть Аж В — произвольные
матрицы размеров т х s и s х п. Что можно сказать о величине
rank АВ2.
Т е о р е м а 3. Справедливо неравенство
rank АВ ^ min {rank A, rank В}.
§ 3. Линейные отображения. Действия с матрицами 85

Д о к а з а т е л ь с т в о . Для строк (7(р и столбцов (7^ матрицы


С = АВ мы в соответствии с (7) имеем выражения
C(i)= A {i)B, C {j)= A B {j\ (11)
Интерпретируя теперь ранг матрицы А как
гу = rank А = dim(A(1), А (2 ) А (т)),
считаем без ограничения общности базисными строки Д(1) , . .., А(Г1),
поскольку необходимая перестановка строк в А будет сопровождать­
ся точно такой же перестановкой строк матрицы (7, а это преобра­
зование (э.п. типа (I)) не меняет ни гапкД, ни rank С. Итак,
п
A(k) = 5 7 ^kiA(i), Гу < к ^ т ,
2=1
откуда (используя дистрибутивность (10)) получаем
Г1 Г1 Г1
С(к) —А (к) В — ^ kjA^p^jB —^^A^f(A^pS) — AkiC'(i)]
2=1 2=1 2=1
и, стало быть,
(C\l) 5• • • 5С'(т) ) (^(1) 5' ' ' 5CVl)) '
Таким образом,
rank С = dim((7(i), . . . , (7(ш)) ^ Т\ — rank А.
Аналогично, интерпретируя ранг матрицы В как
г2 = rank В = dim( В ^ \ В^2\ . .., В ^ )
и считая без ограничения общности базисными столбцы ...
. .., В^Г2\ будем иметь
Г2
в (к) =
3=1
2*2 2*2 2*2
С(к) = А В (к) = = ^2 ^ А В ^ =
3= 1 i= i i= i
r 2 < к ^ n,
откуда
rank (7 = dim(Cr(^1\ . .., (7 ^ ) ^ r 2 = rank IT □
Заметим, что в случае каких-то специальных матриц А, В дока­
занное неравенство может становиться строгим. Так будет, скажем,
при А ф 0, В ф 0, АВ — 0 (см. пример в и. 2). В общем случае теоре­
ма 3 просто утверждает, что при умножении матриц ранг не может
увеличиться.
86 Гл. 2. Матрицы

5. К вад ратн ы е м атрицы . Множество всех квадратных мат­


риц (a,ij) порядка п с вещественными коэффициентами а^-, обычно
обозначается МП(Е) (или Мп). Как уже отмечалось в конце п. 1, мож­
но говорить о векторном пространстве МП(Е). Согласно п. 2 произве­
дение любых двух матриц из МП(Е) снова принадлежит МП(Е). При
этом выполнены свойства ассоциативности и дистрибутивности.
О п р е д е л е н и е . Говорят, что квадратные матрицы фиксирован­
ного порядка п образуют матричное (ассоциативное) кольцо; а с
учётом легко проверяемых правил ХАВ = (ХА)В = А(ХВ) умноже­
ния на скаляры Л G Е множество Мп(Е) называют также алгеброй
матриц над Е.
К этим наименованиям предстоит ещё привыкнуть (см. гл. 4 по
поводу систематизации терминологических новшеств), а сейчас мы
обратим внимание на единичную матрицу Е = (Skj), где
~ _ Г 1, если k = j,
\ 0, если к ф j,
— символ Кронекера. Очевидно, что rank Г? = п. Правило умножения
матриц (7), в котором следует заменить bkj на Skj, показывает, что
справедливы соотношения
ЕА = А = А Е , А е М п(Е).
Более общо:
diagnO)-4 = ХА = ^diag„(A), ( 12)

где
A 0 .,.. 0
0 A .,.. 0
diag„(A) = AE =
0 0 .,.. A
— известная нам скалярная матрица (см. § 3 гл. 1). Таким образом,
умножение матрицы А на скаляр Л равносильно умножению А на
скалярную матрицу.
В равенстве (12) отражён легко проверяемый факт перестановоч­
ности diagn(A) с любой матрицей А. Весьма важным для приложений
является следующее его обращение.
Т е о р е м а 4. Матрица из Мп, перестановочная со всеми матри­
цами в Мп, должна быть скалярной.
Д о к а з а т е л ь с т в о . Введём матрицу Ец, в которой на пересе­
чении i-й строки и j-ro столбца стоит 1, а все остальные элементы
нулевые. Если Z = (Zij) — матрица, о которой идет речь в теореме,
то она перестановочна, в частности, со всеми Ец\
ZEij = Eij Z , = 1,2,. ..,?7/.
§ 3. Линейные отображения. Действия с матрицами 87

Перемножал матрицы в левой и правой частях этого равенства,


мы получим матрицы
0 .., . Z u . .. 0 0 0 . .. 0
0 .. .. 0
1 Zj1 zj2 . Zjn
0 .. ■• Zn i .. 0
3 0 0 . .. 0
с единственным ненулевым j -м столбцом и соответственно с един­
ственной ненулевой г-й строкой. Их сравнение немедленно приводит
к соотношениям Zki = 0 при к ф г и гц — Zjj. Меняя г и j, получаем
требуемое. □
Для данной матрицы А Е МП(Е) можно попробовать найти та­
кую матрицу А' Е Мп(Е), чтобы выполнялись соотношения АА' =
— Е — А'А. Сразу же заметим, что
АА! = Е = А"А А" = А'. (13)
Действительно, А" = А"Е = А"(АА') = [А"А)А' = ЕА' = А'. Таким
образом, матрица А', коль скоро она существует, единственна. Её
называют матрицей, обратной к Д, и обозначают Д-1 :
А А - 1 — Е — А - 1 А. (14)
При выполнении (14) говорят ещё, что матрица Д обратима.
О п р е д е л е н и е . Матрица Д Е МП(Е) называется невырожден­
ной, если система её строк (а тем самым и столбцов) линейно незави­
сима, т.е. гапкД = п. Если гапкД < п, то Д называется вырожден­
ной.
Т е о р е м а 5. Матрица А Е МП(Е) обратима тогда и только
тогда, когда она невырожденна.
Д о к а з а т е л ь с т в о . 1) Если АВ = Е (или В А = Е), то по тео­
реме 3 имеем
п = rankE = rank АВ ^ min {гапкД, гапкЕ?} ^ п,
откуда гапкД = п.
2) Если гапкД = п, то
{ЕА\ . . . , Е ^ п)) = Ж" = {АА\ . . . , А ^ п)),
и, стало быть,
п

E {j) = E aiiA(i)’ (15)


2=1
причём коэффициенты аС, составляющие матрицу Д' = (аС) Е МП(Е),
определены однозначно. Согласно п. 1 § 2 (см. там уравнения (1) и
(2)) соотношения (15) переписываются в виде
E ^ = A A ,U), l^ j^ n ,
88 Г л. 2. Матрицы

откуда
Е = (Е (1 ), . . . , Е (п)) = (АА,{Х>, .. ., А А '( п )) = АА!.
Здесь мы интерпретировали матрицы Е и АА 1 как объединения от­
вечающих им столбцов.
Заметим теперь (см. и. 3), что вместе с А невырожденной явля­
ется и транспонированная матрица 1 А. Поэтому в силу доказанного
найдётся матрица В такая, что 1А • В = Е. Снова обращаясь к и. 3
и полагая А" = 1 В , находим
Е — 1Е — \ lAB) = tB t ( tA) = А" А.
Итак,
АА' = Е = А" А.
Остаётся заметить (см. (13)), что А" = А', а поэтому в соответствии
с (14) А' = И-1 , т.е. матрица А обратима. □
С л е д с т в и е 1. Если В и С — невырожденные квадратные
матрицы порядков т и п соответственно, а А — произвольная
т х п-матрица, то
rank БДС = rank И.

Д о к а з а т е л ь с т в о . В силу теорем 3 и 5 имеем


rank БДС ^ rank БД = г а п к Б Д ^ С -1 ) =
= rank (В А С) С -1 ^ rank БДС,
откуда гапкБДС = rank БД. Аналогично устанавливается равенство
rank БД = rank Д. □
С л е д с т в и е 2. Если А , В е Мп(Е) и АВ = Е или В А = Б, то
В = д - 1.
Д о к а з а т е л ь с т в о . Как показано в части 1) доказательства
теоремы 5, ДБ = Е = > гапкД = п, т.е. Д невырожденна и, сле­
довательно, обратима. □
С л е д с т в и е 3. Если A , B , . . . , C , D — невырожденные п х п-
матрицы, т е произведение АВ ... CD также невырожденно и
(АВ ... CD ) - 1 = D~ 1 C ~ 1 ... В - 1 А ~ \
Д о к а з а т е л ь с т в о . Невырожденность матрицы G = ДБ .. .CD
видна из следствия 1, а равенство G-1 = D~ 1 C~1 .. . Б -1Д-1 прове­
ряется непосредственно:
G (D - 1 C~1 ... Б ” 1Д - 1) = ДБ ... C (D D - 1 )C ~ 1 ... Б -1Д-1 =
= Д Б . . . ( С С - 1) . . . Б - 1Д - 1 = .. . = Е. □
§ 3. Линейные отображения. Действия с матрицами 89

Удобный способ вычисления обратной матрицы, обычно исполь­


зуемый на практике, будет приведён в п. 7. Одновременно получится
ещё одно доказательство теоремы 5.
Явную формулу для Я-1 мы укажем в гл. 3. Сейчас лишь заме­
тим, что фактическое вычисление Я-1 для матрицы Я с числовыми
коэффициентами или вычисление произведения двух матриц обычно
требует выполнения большого числа операций. На практике встре­
чаются матрицы порядка п = 100 и более. Если Я и В — две такие
матрицы, то для вычисления С = АВ нужно найти п2 элементов
Cij по формуле (7) (или (9)), что в каждом случае требует 2п — 1
умножений и сложений чисел. Всего нужно произвести (2п —1)п2
операций, т.е. около двух миллионов операций при п = 100. Для со­
временных ЭВМ это — сравнительно лёгкая задача, но реальные
трудности возникнут, если потребуется найти степень Ат матри­
цы Я с показателем т ^ 1000. Здесь по определению Ат = ЯЯт - 1 ;
фактически Ат = А кАт ~к, 0 ^ к ^ ш, — лёгкое следствие ассоциа­
тивности (см. следствие теоремы 2), как это будет показано в гл. 4
в более общем контексте. Для вычисления Ат используют разные
дополнительные приёмы, либо основанные на специфике матрицы
Я, либо заимствованные из курса линейной алгебры. В качестве ил­
люстрации рассмотрим три примера.
П р и м е р 1. Если

ад .. 0
А = diag(< ri, . . . , а п )
0 .. . OLn

то, очевидно,

а ™ . 0
A™=diag«, . . . , cC)
0 ... а
LXn
ш

П р и м е р 2. П усть
а с
А =
0 b
Т огд а ин дукция по т п о к азы в ает, ч то

- Ь171
Аш а —b
Ьш
где
аш _ Ьш
= а ™ "1 + ат ~ 2Ь + . . . + аЬт ~ 2 + Ьт ~ х
а —Ъ
В частн о сти , при а = b имеем

а с
т а171 т а 171 хс
0 b 0 аш
90 Гл. 2. Матрицы

П р и м е р 3. И ндукцией по т нетрудно убедиться в том , ч т о т-я степень


м атри ц ы
А =
0 1
1 1
им еет вид
Аш = /га —1 /га
(16)
/га /га + 1
где целые числа / 0 = 0, / i = 1, / 2 = 1, / з = 2, . . . определяю тся реку р р ен тн ы м
соотнош ением
/га+1 = /га + /га—1*
Э то не ч т о иное, к а к числа Ф ибоначчи (см. пример 2 в конце § 3 гл. 1).
Введём м атри ц у
А2 1
5 5
В =
— у /Ъ \\ л /5

с определителем 1 (см. § 4 гл. 1), где

. 1 + V5 1 - VE
А1 = ---^---5 А2 =
Небольш ое вычисление п о к азы в ает, что

1
л /5
_ 5
Ai 0
B~L = А = В~
0
• В.
л2
А2
v^A i
5"

Но если т р и произвольны е п х n -м атр и ц ы А, В , С , из коих В невы рож денная,


связан ы соотнош ением А = В -1 С В , то

А 771 = В ~ 1С В • В ~ 1С В • В ~ 1С В • . . . • В ~ 1С В = В ~ 1С гпВ

(внутренн ие м нож ители В В зам енённы е на Е, сократи л и сь). В наш ем случае


с учётом при м ера 1 и соотнош ения (16) имеем

/га—1 /га —Ат = В-1 Ai 0


/га /га+1 0 Л2
1
П|

о уп
Af 0
В =
0 \у о

v^A ™ а 2 1
1
1

5 5 *
га + 1
Л
Л2 *
v ^ A ^ 1 — n/ 5 A i л /5
5

(звёздочкам и отм ечены не интересую щ ие нас члены ).


§ 3. Линейные отображения. Действия с матрицами 91

С равн ивая коэф ф ициенты м атр и ц в левой и правой ч а с тях это го равен ства,
получаем для числа Ф ибоначчи с номером т значение

Мы ВИДИМ, ЧТО fm при больш их т (гео м етр и ч еск ая п рогресси я), по-
%/5 1
скольку П т
1 - VE = 0.
6. Классы эквивалентны х м атриц. Как и при доказательстве
теоремы 4, обозначим через Est матрицу размера т х ш, в которой
на пересечении s-и строки и £-го столбца стоит 1, а все остальные
элементы нулевые (такие матрицы называются иногда матричны­
ми единицами). Рассмотрим в Мш(Ж) так называемые элементарные
матрицы следующих типов:
Fs,t — Е — E ss — Е й + E st + E t s —

1
0 1
' 1 sФ (I)
1 ' 0
' 1

Fs,t — Е + ЛEst — 1 ...X * Ф t; (П)

F s ( Л) = E + (Л - 1 ) E SS = d i a g { 1 , . . . , 1, Л, 1 , . . . , 1 } , Л ф 0. ( Ill)

Пусть A — произвольная m x n-матрица. Тогда непосредственно


проверяется, что матрица А' = F А получается из А посредством
элементарного преобразования (э.п.) над строками типа (I) или (II)
в зависимости от того, будет F = Fst или F = Fst(X).
В случае F = Fs(А) будем говорить об э.п. типа (III) (умножение
s-и строки А ^ на Л). Аналогично, матрица А" = AF получается из А
посредством э.п. столбцов. Мы уже знаем из п. 2 § 2 и из упр. 2 из § 2,
что э.п. типов (I) и (II), совершаемыми над строками и столбцами, А
приводится к матрице с диагональной невырожденной подматрицей
92 Г л. 2. Матрицы

в левом верхнем углу размера г х г, где г = rank А (при г = 0 матрица


А нулевая). Так как
di (Л
а2 1J

ar
0
0
'0

1 1 0

= F i(ai)F 2(a2) . ..F r (ar) ■1

о
0
' 0

то привлечение э.п. типа (III) даёт возможность получить из А мат­


рицу вида
Ег 0
(17)
0 0
(здесь Ег — единичная матрица в Mr(Е); нули обозначают матрицы
размеров г х ( п - г ) , (ш —г) х г и (ш —г) х (п —г)). Таким образом,
Ег 0
РкРк- 1 • • •Pi AQ 1 Q2 . . . Ql (18)
0 0
где Pf, (соответственно Qj) — элементарные матрицы порядка т
(соответственно п).
Не раз отмечалось, что элементарные операции обратимы. Это
согласуется с существованием обратных матриц
( F ^ y 1 = FSjt, Cs,i(A)-1 = FSit( - A),
а д - 1 = а д - 1).
В соответствии со следствием 3 теоремы 5 матрицы Р = P^Pk-i • • •Pi
и Q = Q 1 Q2 • • • Qi тоже обратимы:
Р - 1 = Р Г 1 ... Р а д - 1, Q -1 = Q i 1 ... Q p Q T 1 -
Заметим, что Р ^ 1, ^ ^ 1 — элементарные матрицы.
Две матрицы А , В размера т х п назовём эквивалентными и за­
пишем А ~ Р, если найдутся невырожденные матрицы порядков т
и п соответственно такие, что В = PAQ.
Как легко понять, ~ является отношением эквивалентности:
i) Д —Д (Р = Ет, Q = Р п);
§ 3. Линейные отображения. Действия с матрицами 93

п) А ~ В = > В ~ А, поскольку В = PAQ = > А — Р XBQ 1;


ш) В = P'AQ', С = P"BQ " => С = PAQ, где Р = Р "Р ', Q =
= Q'Q".
Согласно общим принципам (см. § б гл. 1) множество всех
т х n-матриц разбивается по отношению ~ на непересекающиеся
классы эквивалентных матриц. Так как ранги эквивалентных матриц
равны (см. следствие 1 теоремы 5), то рассуждение, приведшее нас к
равенству (18), показывает, что в качестве представителей классов
можно брать матрицы (17).
Мы получаем следующее утверждение.
Т е о р е м а 6. Множество матриц размера т х п разбивается на
р = min(ш,п) + 1 классов эквивалентности. Все матрицы ранга г
попадают в один класс с представителем (17).
С л е д с т в и е . Всякая невырожденная п х п-матрица записыва­
ется в виде произведения элементарных матриц.
Действительно, все невырожденные матрицы порядка п попада­
ют в один класс с представителем — единичной матрицей, поскольку
их ранги равны п. Соотношение (18)
PkPk-i • • •P1 AQ 1 Q2 ...Qi = E,
переписанное в виде
А = РГ1... р ,-д A A 1 • • А А 1, (19)
даёт нужное утверждение. □
Не утверждается, что запись А в виде произведения элементар­
ных матриц единственна, но сам факт существования такой записи
весьма полезен. В частности, его можно использовать для отыскания
обратной матрицы. В самом деле, из (19) мы находим
А”1 = Qi Q2 ■■■QiPkPk- 1 ...Pi=QP.
7. Вычисление обратной м атрицы . Если в рассуждениях
предыдущего пункта ограничиться преобразованиями над строками
и рассмотреть с самого начала расширенную матрицу (А\Е) размера
п х 2п, то в случае невырожденной матрицы А Е Мп(Ж) возникнет
цепочка

{А\Е) А {РгА^Е) А ...


• ■• А (Рк ... P2PiA\Pk ... Р2РгЕ) = (Е\А').
Она оборвётся на к-м шаге, когда в левой половине расширенной
матрицы место А заполнит единичная матрица Е. В правой поло­
вине при этом получится однозначный ответ: А 1 = Д-1 . В случае
вырожденной матрицы А процесс оборвётся, возможно, раньше —
приведением А к ступенчатому виду и вычислением ранга г = rank А.
94 Г л. 2. Матрицы

В матричной реализации, с которой начинался и. 6, при п = 3


имеем
1 -3 0 1 0 0
*1,2(-3) = 0 1 0 , *3,2(4) = 0 1 0
0 0 1 0 4 1

0 0 1

*1

II
0 1 0

со
1 0 0

Реально элементарные п х n-матрицы Pi слева не приписываются. На


них следует смотреть как на предписания и выполнять соответст­
вующие им э.п. над строками.
Напомним ещё раз о значении символов:
Pi = Fsj — переставить местами строки с номерами s и £;
Pi = Fs,t(Л) — прибавить к s-и строке t-ю строку, умноженную
на Л;
Pi = FS(X) — умножить s-ю строку на Л.
П р и м е р 4. П усть
0 2 0
А = 1 1 -1
2 1 -1
Имеем

0 2 0 1 0 0
* 1, 2
1 1 -1 0 1 О
(А\Е) 1 1 - 1 0 1 0 — У 0 2 0 1 О О
2 1 - 1 0 0 1 2 1 -1 О 0 1
1 1 - 1 0 1 0
* 3,1 ( - 2 ) * 2 (1 / 2 )
0 2 0 1 0 0
0 - 1 1 0 -2 1

1 1 -- 1 0 1 0
* 1,2 ( - 1)
- у 0 1 0 1/2 0 0
0 - 1 1 0 - 2 1

1 0 -- 1 -1 / 2 1 0
* 3 ,2 ( 1 )
- у 0 1 0 1/2 0 0
0 - 1 1 0 2 1

1 0 -1 - 1/2 1 0
* 1 ,3 ( 1 )
-У 0 1 0 1/2 0 0
0 0 1 1/2 -2 1

1 0 0 0 -1 1
-У 0 1 0 1/2 0 0
0 0 1 1/2 -2 1
§ 3. Линейные отображения. Действия с матрицами 95

Т аким образом ,
0 -1 1
А- 1 = 1/2 0 0
1/2 -2 1
Для экономии м еста целесообразно в ы полнять сразу серию одн отип ны х пре­
образований.
П р и м е р 5. П усть

и-1
1 1 1

и-1
1
А =
1 1 1
1 1 -1 1

и-1
1
1 1 1
Имеем

- 1 1 1 1 1 0 0 0 ^ 1 ,4 ( 1 )

(А\Е) =
1 - 1 1 1 0 1 о о * 1 ,3 ( 1 )
1 1 - 1 1 0 0 1 0
1 1 1 - 1 0 0 0 1 * 1 ,2 ( 1 )

2 2 2 2 1 1 1 1
1 - 1 1 1 0 1 0 0 * 1 (1/ 2 )
1 1 - 1 1 0 0 1 0
1 1 1 - 1 0 0 0 1

1 1 1 1 1/2 1/2 1/2 1/2 * 4 ,i ( - i )


1 - 1 1 1 0 1 *з,1(—1)
1 1 - 1 1 о о
1 1 -1 о о * 2 ,l( - l)

1 1 1 1 1/2 1/2 1/2 1/2 * 4 ( —1 / 2 )


0 - 2 0 0 - 1/2 1/2 - 1/2 - 1/2 *3 ( —1 / 2 )
0 0 - 2 0 - 1/2 - 1/2 1/2 - 1/2 ----- У
0 0 0 - 2 - 1/2 - 1/2 - 1/2 1/2 F 2( - 1/ 2)

1 1 1 1 1/2 1/2 1/2 1/2 * 1 ,4 ( - 1 )


0 1 0 0 1/4 -1 /4 1/4 1/4 *1,з(-1)
0 0 1 0 1/4 1/4 -1 /4 1/4 — У

0 0 0 1 1/4 1/4 1/4 -1 /4 *4,2( 1)

1 0 0 0 -1 /4 1/4 1/4 1/4


0 1 0 0 1/4 -1 /4 1 /4 1/4
0 0 1 0 1/4 1/4 -1 /4 1/4
0 0 0 1 1/4 1/4 1 /4 -1 /4

Т аким образом , А -1 = (1/4)А .


В прочем , в данном случае вы числений можно было бы и зб еж ать . Зам еч ая,
ч т о произведение вы рож денной м атр и ц ы и произвольной м атр и ц ы всегда вы ­
рож денно (тео р ем а 3), в то врем я к а к

4 0 0 0
А2 =
0 4 0 0 = 4Е ,
0 0 4 0
0 0 0 4
96 Г л. 2. Матрицы

мы делаем заклю чение о н евы рож денн ости А и, следовательно, о сущ ествовании
А - 1 . Но коль скоро это т а к , то

А = А 2А - 1 = 4 Е • А -1 = 4 А - 1 =>■ А -1 = - А .
4
З а м е ч а н и е . При выполнении серии преобразований над стро­
ками следует избегать типичной ошибки — прибавления в неизмен­
ном виде строки, изменившейся в ходе предыдущих преобразований.
Например, предписание
^2,1(1)
А — ► А'
^1,2(1)
двусмысленно: не ясно, в каком порядке действовать — сначала
F i ?2(1), потом F2?i (1); сначала F2?i (1), потом F i ?2(1) или одновремен­
но? Каждый раз будут получаться различные выражения для строк
H|i), А^2у В примере 5 мы объединяли лишь однотипные преобра­
зования, а если ставить своей целью вычисление на ЭВМ по указан­
ному методу, то естественно всю последовательность элементарных
преобразований линейно упорядочить.
Рассмотренный нами метод вычисления ранга, а также обратной
матрицы называется P -приведением или, более общо, (P,Q)-npuee-
дением матриц к нормальному виду (17).
8. П ространство реш ении. Из вводных замечаний в начале
§ 2 и § 3 следует, что система линейных уравнений с матрицей А
размера т х п и столбцом свободных членов В Е Rm может быть
записана коротко в виде
АХ = В (20)
(X = [ж1 , . . . , жп] — столбец высоты п). Представив, что ш = п и
квадратная матрица А невырожденна (см. п. 5), мы получим, и при­
том единственное, решение системы (20), умножая обе части матрич­
ного соотношения слева на А -1 : X = Е Х = (А~гА )Х = А~г(АХ) =
= А~гВ. Эта удобная символическая запись решений определённой
системы не избавляет нас от вычислений, поскольку матрица А~х
заранее не дана. Но не откажем себе в удовольствии заметить, что
матричный аппарат доставляет по меньшей мере эстетическое
наслаждение. Воспользуемся им теперь для обозрения всех решений
линейной однородной системы (JIOC):
А Х = 0. (21)
По существу мы уже знаем, что если — решения нашей
Л ОС, то и любая их линейная комбинация тоже будет решением:
А ( а i M 1 ) + а 2 М 2 >) — QL\ А Х W + 2 А Х ( 2) = 0 .

Поэтому можно говорить о пространстве решений ЛОС — линейной


оболочке
VA = (X е Ж1 \ А Х = 0) США.
§ 3. Линейные отображения. Действия с матрицами 97

Пусть s = dim Уд, г = rank А По определению s ^ п, г ^


^ min(m,n). Какал связь существует между s и г?
Т е о р е м а 7. Имеет место равенство г + s = п.
Д о к а з а т е л ь с т в о . Выберем базис Х^1\ ... , линейной обо­
лочки Уд и дополним его до базиса Х ^ \ ..., X^s\ X^s+1\ . .., Х ^
всего пространства Еп . Это всегда можно сделать, как показывает
доказательство теоремы 2 § 1 (и упр. 6 из § 1). Для любого вектора
X = ai £ Еп имеем
п
А Х = Y , aiA X {i) = a s+1 A X {s+1) + ... + а пА Х (п\
2=1
так что в соответствии с § 2 линейная оболочка

VB(A) = • .., А<">) = (Х 1 + ... + х пА ("> | Xi е Ж” ) =


= {АХ | I е Г ) с Мт ,
называемая пространством столбцов матрицы А , совпадает с ли­
нейной оболочкой (АХ^8+1\ . .., А Х (п)).
В частности, г = dim VB(A) ^ п —s. Но векторы A X (s+l\ ...
. .., А Х линейно независимы, поскольку из

0= Y 1 Р к А Х М = А ( Y , РкХЮ)
k^S+1 k^S+1
следует X^ g+1 е Уд, а это в силу выбора
возможно только при Ps+i = ... = /Зп = 0. Значит, г = п —s. □
З а м е ч а н и е . Если использовать язык линейных отображений
(см. п. 1 § 3), то, очевидно,
Уа = Ker ipA, VB(A) = Im ipа
— ядро и образ отображения <^д : Еп -А Ет , отвечающего Д. Для
нас, однако, этот подход служит лишь мотивировкой для введения
матричных понятий.
Чтобы найти базис пространства Уд, выберем в А г базисных
столбцов одним из способов — приведением А к ступенчатому виду
или так, как это указано в гл. 3. Перестановкой столбцов или, что
равносильно, перенумерацией неизвестных можно добиться, чтобы
базисными были г первых столбцов А^1\ . .., А^г\ При этом в новой
системе неизвестных х [ , х 2' , . . . , х'п главными неизвестными станут
х [ , . . . , х 'г . Любая система из г + 1 столбцов А ^ , . . . , А ^ , Д(г+/е), к >
> 0, будет линейно зависимой, и на основании теоремы 1 , v) из § 1
можно выписать систему соотношений
х[к)А ^ + х {2к)А ^ + ... + х {гк)А ^ + А {г+к^ = 0 , к = 1 ,2 ,... ,п - г.
7 А .И. К о стр и к и н
98 Г л. 2. Матрицы

Векторы-столбцы
T(i) т (1)
= Д А х2 ? •• 1, 0, .. о],
XW = Д А
т (2) г (2)
' • 5 Л'Г 5 0, 1, .. 0],

Х(п~г) = Д А
т (2)
’• 5 Х
гГ
(2) ,
0, 1, .. 0]

в количестве п —г штук, очевидно, линейно независимы (из-за специ­


ального вида своих последних п —г компонент) и, будучи решениями
ЛОС (21 ), составляют по теореме 7 базис пространства Va всех её
решений. Понятно, что решение получается, если новым (штри­
хованным) свободным неизвестным придать значения
^r+l ^5 • • • 1 %Г-\-к 1? • ' ' 1 %п О*
Любой базис пространства решений однородной системы А Х = О
ранга г называется фундаментальной системой решений. Систему
(22) называют ещё нормальной фундаментальной системой. Согласно
следствию теоремы 1 § 2 её ранг s = dim Уд = п —г равен числу
свободных неизвестных линейной системы.

УП РА Ж Н ЕН И Я

1. Д аны отображ ения:


а) [ж1 ,ж 2, . . . ,ж п ] ^ [жп , . . . ,ж 2,Ж1 ];
б) [ж1 ,ж2, • • • ,хп] ^ ... ,ж™];
в) [ x i , X 2 , • • • , Х п ] ^ [ x i , X l + Ж2, • • • , X l + Х2 + . . . + Хп ]-
К ак и е из них являю тся линейными?
2. Д о к а за ть , что
т т ( т — 1) , .
1 а с 1 та — —^2-------- а о + тс
0 1 b — 0 1 mb
0 0 1 0 0 1

1 а с
Н ай ти для 0 1 Ъ обратн ую м атриц у.
0 0 1
0 -1 з
3. П ровери ть, ч то = Е.
1 -1
4 . В прилож ениях большую роль и гр аю т марковские (или стохастические)
м атри ц ы
п
Р = ( P i j ), Pij ^ °, ^ 2 p i j = l , г = 1,2,...,п.
з=1
Л инейны е о тображ ен и я ipp, ассоциированны е с м арковским и м атри ц ам и , обы чно
при м еняю т к специальны м т а к назы ваем ы м вероятностным векторам -стол б ц ам
п
X = [xi , ...,Ж п ], Xi ^ 0, y ^ X j = 1.
г= 1
§ 3. Линейные отображения. Действия с матрицами 99

С огласованн ость эти х определений, д и ктуем ы х естественнон аучны м и за д а ­


чам и, видн а из следующ их утверж ден и й , которы е нуж но д о к а за ть хотя бы при
п = 2.
а) М а тр и ц а Р Е М п (М) явл яется м арковской в т о ч н о сти т о гд а , к огд а вм есте
с лю бым в ер оятн остн ы м в ек тором X в ек то р Р Х т а к ж е явл яется в ероятн остн ы м
(здесь Р Х = (рр {Х)).
б) Если Р — положительная м арковская м ат р и ц а (Vi, j Pij > 0), то лю бому
вероятн остн ом у в ек то р у X о т в е ч а е т положительный в ероятн остн ы й в ек то р Р Х
(все ком поненты с тр о го больше нуля).
в) Если Р и Q — м арковские м атри ц ы , то м арковской будет т а к ж е м а т р и ­
ца PQ. Э то о зн ач ает, в частн о сти , ч т о любая степень Р к м арковской м атри ц ы
явл яется марковской.
5. Н ай ти f Н • Н, если
1 1 1 1
1 -1 1 -1


11

11
1 1 I

I
1 -1 -1 1
6. А ссоциировав с циклом длины п в S n (см. § 8 гл. 1) м атр и ц у перестан овки
(стр о к единичной м атр и ц ы Е п )
0 0 .,.. 0 1
1 0 .,.. 0 0
0 1 .,.. 0 0
0 0 .,.. 0 0
0 0 .,.. 1 0
провери ть, ч т о Р п = Е.
7. П о к а за ть , ч то
ra n k (А + В) ^ ra n k А + ra n k В
для лю бы х двух т X n -м атр и ц А в В.
8. П о к а за ть , ч т о для любой т х s-м атр и ц ы А и любой s х n -м атр и ц ы В им еет
м есто неравенство
ra n k А + ra n k В — s ^ ra n k А В .
9. П о к а за ть , ч т о если А В С = 0 для к в а д р а т н ы х м атр и ц А, В , С п о р яд ка п,
то
ra n k А + ra n k В + ra n k С ^ 2п.
10. Н ай ти р ан г м атри ц ы
xiyi Х1У2 •• XIуп
Х2У1 Х2У2 •• Х2Уп
А =
ХпУ1 Х п У2 • ХпУп

У к а з а н и е . П о к а за ть , ч т о А = [х\ , . . . , х п \(у i , . . . , у п ).
11. П о к а за ть , ч т о если А = ( a i j ) — невы рож денная си м м етри ч еская м атр и ц а
(ciij = aji), то и А сим м етри ч еская м атри ц а.
Н ай ти А 1 и F -1 если
5 4 3 2 1
2 3 2 1
4 8 6 4 2
3 6 4 2
А = 3 6 9 6 3 F =
4 8 6 3
2 4 6 8 4
2 4 3 2
1 2 3 4 5

7"
100 Ел. 2. Матрицы

13. П ровери ть, ч то

а b d -b
А = , ad — be ф 0 = => А -1 = 1
с d ad — be —c a
В частн о сти ,
d, -b
ad — be =
—с а
С ущ ествует ли А 1 при ad — be = 0?
14. Д о к а за ть , ч т о для любой м атри ц ы

а Ъ
А =
с d
выполнено соотнош ение

А 2 = (а + d)A - (ad - bc)E (23)

(другим и словами, А явл яется “корнем ” к в ад р ат н о го уравн ен ия х 2 — (а + d)x +


+ (ad — be) = 0).
15. П ри ad —be ф 0 и спользовать соотнош ение (23) для нахож дения обратн ой
м атр и ц ы А - 1 .

16. Д о к а за ть , ч т о если = 0, то = 0.
17. О б основать следующее рассуж дение. П усть т х s-м ат р и ц а X р а зб и т а
гори зон тал ьн ы м и и в ерти к ал ьн ы м и прям ы м и на блоки (или к л етк и ), т а к что

Xu X 12 . • ■ X lk
X 21 X 22 . ■■ x 2k
X =
Хц X 12 . •• X lk

где Х ц , . . . , Xik — м атр и ц ы с одинаковы м числом с тр о к (m i + . . . + m* = m ),


а Х\ — м атр и ц ы с одинаковы м числом Sj столбцов (si + . . . s& = s).
Если теп ерь
Yu У 12 . .. Yir
Y =
У 21 Y 22 . .. Y 2r

Yki Y k2 • .. Y kr

— s х n -м ат р и ц а с блоками Y{j разм еров S{ х nj ( щ + . . . + п г = п ), то им еет


смысл г о во р и ть о произведении Z = X Y , причём м атр и ц у Z = (zij) тож е можно
с ч и т а т ь блочной с блоками Z i j , вы числяем ы м и ф орм ально по формуле (7):

Zij —XnYij + Xi2Y2j + ... + XikYfcj.


По условию р азм еры м атр и ц X i u , Y uj так ов ы , ч т о произведение X i uYuj им еет
смысл. Приём разбиения м атр и ц на блоки удобен даж е в так ом простейш ем слу­
чае, к ак
E A A 0 0 AB
0 E -E В -E В
где А , В , Е , 0 G M n (K) (Е — единичная, а 0 — нулевая м атр и ц а).
18. П о к а за ть , ч т о умнож ение м атри ц ы

х = (xij) е м п(ш)
§ 3. Линейные отображения. Действия с матрицами 101

на Т — ( t i j ) G М п (Ж) слева равносильно линейному ком бинированию с тр о к


H ffl

а справа — линейному ком бинированию столбцов


частн о сти , о б р а т и т ь внимание на то, ч т о если

1 tl2 *13 tin


0 1 ^23 t2n
Т =
0 0 0 1
— верхняя унитреузольная м атр и ц а, то

У 1) + tizX(2) + •.. + tinX(n)


У 2) + ••• + ^2n^(n)
X(n)
— м атр и ц а, полученная из X посредством цепочки элем ен тарны х п р ео б р азо в а­
ний т и п а (II) над строк ам и .
Г лава 3

О П РЕД Е Л И Т Е Л И

Формулы (3) и (9) из § 4 гл. 1 для решений квадратных линей­


ных систем порядков п = 2,3 наводят на мысль о существовании
подобных формул при любом п.
В конечном счёте речь идёт о правильной интерпретации в каж­
дой из упомянутых формул числителя и знаменателя. Мы будем смо­
треть на них как на значения некоторой “универсальной” функции
det : Мп(Ж) —у Е из множества квадратных матриц порядка п в
Е. Эффективное построение функции det (определителя) даст ответ
также на многие другие вопросы о матрицах, поднятые в гл. 2. На
самом деле роль теории определителей в математике гораздо ши­
ре затронутой нами темы, и каждое из применений этой теории
подсказывает собственный путь её построения. Один из наиболее
естественных подходов — геометрический, основанный на аналогии
“определители матриц — объёмы многомерных фигур” и на внешних
n-формах. Так как для этого нужно чуточку больше техники, то мы
остановимся на аналитическом пути, апеллируя к геометрической
интуиции лишь в самом начале.

§ 1. О п редели тели : п о с т р о ен и е и основн ы е


св ой ств а
1. Г еом етр и ч еск ая м оти в и р ов к а. Ничто сейчас не мешает
ввести общее понятие определителя, но попытаемся на время забыть
о нашей задаче, обратившись к вычислению объёмов простейших
геометрических фигур — параллелепипедов. Квадратной матрице
А = (aij) порядка п поставим в соответствие параллелепипед
П (А) = Щ ^ 1) , ^ 2) , . . . , ^ ) ,
рёбра которого задаются столбцами матрицы А , А ^ , . . . , А ^ , т.е.
векторами (или точками) А ^ = [aij, a 2j , . .., a n j \ Е Еп. Под П(П)
нужно понимать подмножество в Еп, состоящее из всех точек вида
х \ А ^ + ... + х пА^п\ 0 ^ х\ ^ 1
(мы незаметно перешли к отождествлению векторов-столбцов с их
концевыми точками в пространстве с прямоугольной системой ко­
ординат). При п — 1 параллелепипед называется отрезком, а при
п = 2 — параллелограммом.
Объём г?(П(А)) n-мерного параллелепипеда определяется по ин­
дукции как произведение объёма г(П(Н^1\ ... ,Э.(П-1))) (п — ^-мер­
ного основания в En_1 и длины h перпендикуляра А ^ Р , опущенно­
го на гиперплоскость этого основания из точки А^п\ Под объёмом
§ 1. Определители: построение и основные свойства 103

отрезка (п = 1 ) понимается, конечно, его длина, а под объёмом па­


раллелограмма (п = 2) — его площадь. В общую теорию измерений
объёмов мы сейчас не входим.
Прямые вычисления показывают, что с точностью до знака
«12
п = 2: ДП (Л(1)Л (2))) « п
5
«21 «22

« п «12 «13 (1 )
п = 3: и(П(А(1),А (2),А (3))) «21 «22 «23
«31 «32 «33

(определители матриц порядков 2 и 3 вводятся соответственно фор­


мулами (2) и (8) из § 4 гл. 1).
Соблазнительно было бы сохранить формулы типа (1 ) без огово­
рок, т.е. при любом расположении точек А^2\ . .., но это воз­
можно только в том случае, если пользоваться понятием ориенти­
рованного объёма параллелепипеда с допустимыми отрицательными
значениями. В частности, для отрезка

----о---------------- о-----
а 0
ориентированной длиной будет а < 0. Для параллелограмма
n(A W M (2)) площадь берётся со знаком плюс, если упорядоченная
пара векторов М « л (2)) задает ту же ориентацию плоскости R2,
что и базисная пара векторов (ei, ег); в противном случае — со зна­
ком минус. При таком понимании естественно обратить формулу (1)
и считать при любом п определителем det А матрицы А ориентиро­
ванный объём параллелепипеда, обозначаемый тем же символом:
det А = г(П(Д)).
Базисный вектор ej, отвечает стандартному столбцу = [0,...
. .., 1 , . . . , 0], так что
А и) = ipA(E{j))
— образ единичного вектора при линейном отображении ipа : X н->-
I—у А Х (см. § 3 гл. 2). Образом единичного куба П(.Е) при отображе­
нии ра будет как раз параллелепипед П(А), а поскольку i?(n(i£)) = 1 ,
определитель det рл = det А равен коэффициенту изменения ориен­
тированного объёма. На самом деле при применении р л ориентиро­
ванный объём любой фигуры, а не только единичного куба, меняется
в det А раз (см. [BA II]).
Обратим внимание на легко проверяемые свойства ориентирован­
ной площади параллелограмма:
1) = - у ( Щ А (2\ А ^ ) -
2) Ц п м (1) + аа (2),а (2))) = « ( п (А(1Щ (2)));
104 Гл. 3. Определители

3) Д П (£)) = I-
О свойствах 1) и 3) говорилось выше, а свойство 2) проиллюстри­
ровано (при п — 2) на рис. 14
и основано на идее равносостав­
ленности. При п > 3 свойства
1)-3) объёмов параллелепипедов
уже менее наглядны, но совер­
шенно очевидно, что при любом
подходе к теории определителей
отмеченные три свойства долж-
Рис. 14 ны выполняться. Кроме того,
должны быть получены и другие свойства определителей так, чтобы
вычисление det А для любой фиксированной квадратной матрицы А ,
а следовательно, и вычисление объёма г(П(Д)), было алгоритмически
реализуемым и легко осуществимым актом.
2. К о м б и н а тор н о-ан ал и ти ч еск и й п о д х о д . Близкие обозна­
чения
аа «12 «1п «и «12 . . «1п
А = «21 <222 «2п , det А = «21 «22 «2п

«п1 «п2 •• • «пп «п1 «п2 •• • «пп


которые для нас не новы и которыми мы будем постоянно пользо­
ваться в дальнейшем, существенно различны. Если А — квадратная
таблица, заполненная своими коэффициентами (обычно числами), то
определитель порядка п как та же таблица, но ограниченная верти­
кальными чёрточками, — это число (или выражение), приписывае­
мое матрице А и определённое формулой полного развёртывания
det А = £сг«1,сг1«2,сг2 ■ (3)
aeSn
Другими словами, определителем det А матрицы А = (а^ ) называет­
ся алгебраическая сумма всевозможных произведений коэффициен­
тов a,ij, взятых по одному из каждой строки и из каждого столбца. В
каждом произведении сомножители записываются в порядке следова­
ния строк, а номера столбцов определяются образами а 1 ,а 2 , ... ,сгп
номеров строк при перестановке а Е Sn. Всего под знаком суммы
в (3) стоит п\ слагаемых; слагаемые, отвечающие чётным переста­
новкам, входят со знаком плюс, а отвечающие нечётным перестанов­
кам, — со знаком минус. Тех и других, согласно соотношению (11)
из § 8 гл. 1, — одинаковое число п \/2.
Как показывает несложная проверка, формула (3) при п = 2 и
п = 3 приводит к известным нам выражениям. Пусть п = 4, и пусть
сг = (1 2)(3 4). Тогда е * = 1, а « 1 ,<т1 « 2 ,<т2 «з,<тЗ« 4 ,<т4 = « 1 2 « 2 1 « з 4 « 4 з-
§ 1. Определители: построение и основные свойства 105

Это значит, что в определитель четвёртого порядка слагаемое


&12&21&34&43 входит со знаком плюс. В качестве полезного упражне­
ния, рассчитанного на прочное владение материалом § 8 гл. 1, стоит
выписать все 24 члена этого определителя и внимательно проследить
за расстановкой знаков. Кстати, уже при п = 5 подобное задание с
выписыванием 120 членов выглядело бы бессмысленным. Между тем,
следуя наводящим соображениям из п. 1, мы хотели бы извлечь из ис­
ходной формулы (3) все нужные нам свойства определителей любого
порядка.
3. О сновны е св ой ств а оп р ед ел и тел ей . Этих свойств немно­
го, но для формулировки и, главное, для их понимания нужно усло­
виться о терминологии и обозначениях.
В дальнейшем, как и в гл. 2, символами
Э(р — (o-i11 ^г2 J- - - J^in) •> ^ —1,2,...,77/,
А ^ = \fL\j , 0-2j j • • • 5CLnj]j j = 1, 2, . . . , 77/,
будут обозначаться соответственно г-я строка и j -й столбец матрицы
А = (dij). Сама матрица А представляется либо как объединение
своих строк:
А = [Л(!), А(2), . . ■, Дп)]
(столбец строк), либо как объединение своих столбцов:
А = (А(1\ А (2\ ..., А (п^)
(строка столбцов). Условимся впредь строки и столбцы 7Т/Х7Т/-матрицы
А называть также строками и столбцами определителя |а^ | поряд­
ка 77/.
Согласно определению | | = det (от англ, determinant) — функ­
ция, сопоставляющая квадратной матрице А некоторое число \А\ =
= det А. Наша задача — изучить поведение этой функции при из­
менении строк или столбцов матрицы А , рассматриваемых как эле­
менты (векторы) линейного пространства Жп . Если угодно, для нас
det А — сокращённое обозначение (в духе п. 2 § 5 гл. 1) функции
det[A(]_),. .., Э(п)] или d e t ^ 1) , ..., А 77/ переменных, коими явля­
ются векторы из Еп .
Произвольную функцию V : [П(1), . .. , Д п)] Т>(А(1), . .. , Д п))
мы будем называть полилинейной, если она линейна по каждому ар­
гументу т.е.

Р(Э(1), . . . , olA!^ + /ЗА"^, • • •, Э(п)) =


= aU(A(i), . . . , А'ф, . . . , Э(п)) + f3V(A(-L), . . . , ,..., А ^ )
(ср. с п. 1 § 3 гл. 2). Та же функция V называется кососимметри­
106 Гл. 3. Определители

ческой (см. п. 4 § 8 гл. 1), если

• ^ ( ^ ■ ( 1 ) 5 • • • 5 ^ 4 -(г ) 5 ^ - ( г + 1 ) 5 • • • 5 ^ - ( п ) )

= —Х>(Л(!), .. . ,А(*+1)М(г)’ • • • M(n))> 1 ^ г ^ п - 1. (4)


З а м е ч а н и е 1. Из определения линейных функций (см. (4) § 3
гл. 2) можно заключить, что функция V полилинейна ровно тогда,
когда при фиксированных А щ , . . . , H^_i), Дф+1), . . . , Д(п) и при
— X — (х \ , . . . , жп) мы имеем
^(^-(1) 5• • • 5^-(n)) —OL\X\ + «2^2 + . . . +
где ад, . . . , а п — скаляры, не зависящие от х \ , . . . , х п.
З а м е ч а н и е 2. Кососимметричность полилинейной функции V
эквивалентна выполнению соотношений
Р(И( 1) , . . . , И(^_1) , X , X , 3.(i+2) , . . . , И(п)) = 0, 1 ^ i ^ п —1. (4')
В самом деле, положив Д(р = Дф+1) — X в (4), мы придём к (4').
Обратно, при X — + ^.(i+i) из (4;) вытекает в силу полилинейно­
сти V соотношение
^(- • • 5^-(г) 5^-(г) 5• • • ) + Т>(. . . , 3.(i+1), 3.(i+1), . . . ) +
+ Т>(. . . , Д(р , Д(Д+1) ?•••)+ ^ ( ' **5^(г+1) 5^(г) 5• • • ) =
= Т>(. . . , Д(р + Д(г+1), Д(р + Д(г+1) 5• • • ) —0-
Первые два члена равны нулю (положить в (4') соответственно
X = и X = -4(г+].)), поэтому равна нулю сумма двух последних
членов, что является лишь иной записью соотношения (4).
Те же определения и замечания относятся к функции V{A(yl\ ...
. .., А (п)) векторов-столбцов. Более того, условие (2) кососимметрич­
ности применимо к любой функции V : М п —>Е, где М п — декар­
това степень некоторого множества М . Напомним ещё, что согласно
лемме 2 гл. 1 при перестановке местами любых двух аргументов
ко со симметрическая функция меняет знак на противоположный.
Обратим внимание на то обстоятельство, что в формулу (3) стро­
ки и столбцы матрицы А входят, на первый взгляд, “неравноправ­
ным” образом. Но если в А поменять местами строки и столбцы, то
получится транспонированная матрица 1А (см. и. 3 § 3 гл. 2). Стало
быть, речь идёт о сравнении двух величин: det А и det 1А. Ответ даёт
Т е о р е м а 1. Определители любой квадратной матрицы А и
транспонированной с ней матрицы 1А совпадают:
det lA — det А.
Д о к а з а т е л ь с т в о . Положив А = (а^), 1А — (аС), где аС = фд,
и заметив, что к = 7г(7г_1&) для любой перестановки 7г Е Sn и для
§ 1. Определители: построение и основные свойства 107

любого номера к Е {1,2,..., гг} , мы видим, что упорядочение мно­


жителей произведения а[ г ... а'п^ п в соответствии с перестановкой
7Г_1 даёт

^1,7Г1 ' ' ' ® П , 7 Г П ^7Г 1 1,7г(7Г 1 1) ' ' ' ® 7 Г ~ 1 П,7г(у7 Г ~ 1 п )

_ а тг~1 1 , 1 ' ' ' a iТ ~ 1 П , П ~ 1 ' ' ' а П,7Г~1П'

Если учесть ещё, что ^ = en-i (e^e^-i = e ^ - i = г е = 1), а { л -1 \ тг Е


Е 5П} = {7г17г Е 5П} = 5П (поскольку 7г I—^ 7г_ 1 — биективное отобра­
жение из 5П в 5П), то по формуле (3) имеем

det e>r0E l •••an,Jrn = E £”- i aM - 1l ' " C - 1n =


7ге s'n 7ге sn
—^ ^<
^cr^'i,cri • • •^п,сгп —det Д. □
crESn

З а м е ч а н и е 3. Утверждение теоремы 1 интерпретируется так:


если для определителей выполнено какое-то свойство относитель­
но строк (столбцов), то оно имеет место и относительно столбцов
(строк).
Т е о р е м а 2. Функция det: А н->>det А на множестве МП(Е) обла­
дает следующими свойствами.
Dl. detA — ко со симметрическая функция строк матрицы А
(т.е. при перестановке местами любых двух строк определитель
меняет знак на противоположный).
D2. det А — полилинейная функция строк матрицы А (т.е. опре­
делитель матрицы А является линейной функцией элементов любой
её строки А ^ ) .
D3. det Е — 1.
Д о к а з а т е л ь с т в о . D1. Пусть А' — матрица, получающаяся из
А перестановкой строк Д(5), Др), т.е. Д|^ = Др), Д ^ = Д(в), Д ^ =
= Д(р при i ф s,t. Тогда, записав любую перестановку 7г Е 5 П в виде
7г — err с транспозицией г = (s,t) (см. в п. 3 § 8 гл. 1 выражение
(10'), определяющее перестановку Дг), будем иметь

det А' = У • • •а'п,пп =


7resn
= £ с г т ^ 1 ^ а т 1 ' ' ' a s,(TTS ' ' ' a t,(TTt • • • а п , а т п =
o-eSn
= • • • a s,at • • • a t,o-s • • • a n , o - n =
o-eSn
108 Гл. 3. Определители

— ^ ^ ^сгг^1,сг1 • • • • • •CLs ,(js • • • ®п,ап —


aeSn
— ^ ^ £cr&l,crl • • •^n,crn — det A.
crESn
D2. Пусть A = (a^j), и пусть A ^ = X A '^ + \"A "ky где штрихи
указывают на вспомогательные матрицы
^ = [^4(1)? • • • 5^4(fc-i) ?^4(fc) ?^4(fc+i) ?• • • ^^4(n)]?
П — [/4(1)5 • • • 5A (k) ’ ' ' ' ’ ^4(n)]'
По условию
^kj A J A j 5 «7 1 , 2, . . . , Ti.
Основываясь на замечании 1 , свойство линейности det А относитель­
но элементов к-й строки А ^ можно установить следующим образом.
По определению
det [Л(1), . . . , ^4(/с) 5• • • 5^4(n)] det А
= ^ ^ ^сг^1,сг1 • • • &к,сгк • • • CLn,(jn = ^ ^ Ра^к,ак^
(Т е <5гг О" е <5гг

где сг G 5П, — коэффициенты, не зависящие от элементов строки


А(к). Собирая подобные члены, отвечающие тем а Е 5П, для которых
сгк = j , vl полагая а^- = ^2 ak=j Ра-, получим нужное свойство линейно­
сти
п
det [..., ^4(&) 5• • •] = ^ ^ (Xjdkj 5
з=1

det [..., А'И'^ + Х 'А "к^,... ] =


п п п
= X] aj ( ^ akj + X'akj) = А' ^ A"oLja'kj =
i=i i=i i=i
= A' det [..., A(q ,...] + A" det [..., A"k^
Короче:
det A = X' det A' + A" detH".
D3. Очевидно, d e t £ = ^2aeS eaSii(Ti ... Sn^ n = seS1A ... Sn,n =
= 1. □
Из теоремы 2 вытекает несколько простых утверждений, кото­
рые мы сформулируем в виде свойств определителей, но доказывать
их будем в более общей ситуации — для любой функции V : МП(Е) —>
—>Е, обладающей свойствами D1-D2.
§ 1. Определители: построение и основные свойства 109

D4. Пусть А Е Mn(E),A Е Е. Тогда


det ХА = An det А.
Действительно, в силу свойства D2, применённого последователь­
но к строкам с номерами 1,2,..., имеем
V {\A ) = V [\Д(Д), АД(2)^ ^АД(П)] =
= АХ>[Д(!), АД(2) 5 5АД(п)] = А2Р[Д(!), Д(2), • • •, АД(П)] = ...
... = AnV[A(1), Д(2), . . . , Д(п)] = AnV(A). □
D5. Определитель с нулевой строкой равен нулю.
Пусть, например, A(k) = (0,0,..., 0). Тогда и 2А (к) = (0,0,..., 0).
Следовательно, по D2
V(A) = Т>[А(1),..., А (к), . . . , А(п)\ = Т>[А(1),..., 2 А (к), . . . , Д „)] =
= 2 ..., А (к) , . .. , А(п)] = 2Т>(А),
откуда V{A) = 0. □
D6. Если в квадратной матрице А две строки совпадают, то
её определитель равен нулю.
Берём опять произвольную функцию V со свойствами D1-D2.
Поменяв местами две совпадающие строки А ^ , Др) в А , мы полу­
чим ту же матрицу А. С другой стороны, согласно свойству D1 для
Т) значение Т)(А) примет противоположный знак. Таким образом,
V(A) = -Т>(А), откуда 2V(A) = 0 и V(A) = 0. □
D7. Определитель не меняется, если над его строками совер­
шать элементарные преобразования типа (II).
Достаточно рассмотреть случай применения одного элементарно­
го преобразования. Пусть после прибавления к s-ik строке матрицы
А её t-ik строки, умноженной на А, получилась матрица А1. Тогда в
соответствии со свойствами D1 и D6 для Т) имеем
V(A') = V[A^ , . . . , Д(з) + АДр), . . . , Др),... ] =
= £>[Д(!), . . . , Д(«), • • •, Др) ,•••] + АХ>[Д(1), . . . , Др), . . . , Др),... ] =
—^[А( 1), • • •, Д($), • • • ?Д (ф ... ] = Т){А). □
З а м е ч а н и е 4. Проведённые доказательства показывают, что
любая функция Т): МП(Е) —>Е со свойствами D1-D2 обладает также
свойствами D4-D7 (заменить символ det на V).
П ре д л о ж е н и е 1. Пусть
ац Й1 2 . . . Q-in
0 &22 •• &2 п
А = (5)
0 0 . •• Q"nn
по Гл. 3. Определители

— верхняя треугольная матрица порядка n, Е — единичная мат­


рица и V: МП(Е) —>• Е — любая функция, обладающая свойствами
D1-D2. Тогда _
Т>(А) = Т>(Е)аца22 • • *«nn.

Д о к а з а т е л ь с т в о . Согласно замечанию 4 мы можем опираться


на свойства D2, D7. На основании D2 вынесем Апп за зн,
{ ац • • ^1,п—1 ^1п \
Т>(а) = аппТ>
0 . • • ^п—1,п—1 0"п—1 ,п
V 0 . 0 1 J
Применим теперь к А элементарное преобразование типа (II): выч­
тем из г-й строки стоящей под знаком V матрицы последнюю строку,
умноженную предварительно на а^п. При этом элементы последнего
столбца обратятся в нуль (кроме апп = 1), а все другие элементы ма­
трицы останутся без изменения. Применим то же самое рассуждение
к предпоследней строке вновь полученной матрицы и т.д. Каждый
раз очередной элемент ац выносится за знак Т) и рассуждение воз­
обновляется. Проделав его п раз, мы убеждаемся в том, что
1 ..,. 0

Т>(А) = апп .. .а ц ■V
I—1 ■

0 ..

а это и есть искомая формула. □


С л е д с т в и е . Если А — матрица вида (5), то
det А = оцо 22 • • -апп. (6)
Д о к а з а т е л ь с т в о непосредственно вытекает из предложения 1,
если заметить, что det^E = 1 (свойство D3). □
Полезно привести ещё один вывод формулы (6), опирающийся
на более общее утверждение, которым мы воспользуемся позднее.
Предварительно дадим следующее
О п р е д е л е н и е . Определитель матрицы, получающейся из А —
— (aij) вычёркиванием i-й строки и j- го столбца, обозначается Мц
и называется минором матрицы Д, соответствующим элементу ац.
Величина Ац — (—1)г+^Мц называется алгебраическим дополнением
элемента ац.
Пр е д л о ж е н и е 2. Если
ац a i2 .. ain
0 «22 «2 п
А =

0 «п2 ••• «пп


§ 1. Определители: построение и основные свойства 111

то
det А = а ц М ц = ап Ап-

Д о к а з а т е л ь с т в о . Так как det А = detM. (теорема 1) и так


как ац — единственный отличный от нуля элемент первого столбца
AW , то ani :i = 0 при 7г1 ф 1 и
det А 'у ^ ^77^771,1^772,2 • • •&7ГП,П У ^ ^77<Н,1 <^772,2 • • •^77П,П’
77 G <5гг 7 7 G 5 'n ,7 7 1 = 1

Совокупность всех перестановок 7r Е Sn, оставляющих на месте сим­


вол 1, отождествляется с множеством Sn_i перестановок, действую­
щих на множестве {2, 3, .. ., п}. Таким образом,

det А —ап У ^ £а^а2,2 • • •^сгп,п —


aeSn- 1
<^22 • • &2 п
—CL11 —ац М ц • П
<3п2 • • <3пп
>еугольной матрице А
, где
&22 *
ми =
0
<3пп
— определитель того же вида, но на единицу меньшего порядка. Оче­
видное рассуждение по индукции приводит к формуле (6).
Доказанные свойства дают возможность сравнительно просто вы­
числить определитель порядка п. Один из методов заключается в
следующем. Матрицу А = (а^-) следует привести элементарными
преобразованиями к треугольному виду (см. § 3 гл. 1). Пусть мы
получим матрицу А вида (5). Предположим, что в процессе приве­
дения было совершено q элементарных преобразований типа (I) и
какое-то количество преобразований типа (II). Так как последние не
меняют определителя (свойство D7), а каждое преобразование типа
(I) умножает его на —1, то detH = (—l) qdetA. По формуле (6) мы
имеем
det А —&11&22 • • • &пп'
В таком случае
det А = (-1 )д ап а 2 2 ••-апп. (7)
Это и есть одна из формул для вычисления det А.
Теперь, опираясь на формулу (7), мы установим важный факт,
касающийся роли свойств D1-D3 определителя. Именно, имеет место
112 Гл. 3. Определители

Т е о р е м а 3. Пусть V: МП(Е) —>Е — функция, обладающая сле­


дующими свойствами:
i) при перестановке местами любых двух соседних строк мат­
рицы A G МП(Е) значение Т>(А) меняет знак на противоположный;
ii) Т>(А) является линейной функцией элементов каждой строки
матрицы А (другими словами, V{A) — ко со симметрическая поли­
линейная функция строк матрицы).
Тогда
V{A) = V (E ) -det А
Д о к а з а т е л ь с т в о . Как мы знаем, свойство i) эквивалентно то­
му, что Т)(А) меняет знак на противоположный при перестановке лю­
бых двух строк, т.е. при любом элементарном преобразовании типа
(I). Далее, согласно замечанию 4 Т)(А) обладает также свойствами
D4-D7. В частности, Т>(А) не меняется, если строки матрицы А под­
вергнуть элементарному преобразованию типа (II).
Приведём матрицу А при помощи элементарных преобразований
к треугольному виду (5), где, конечно, некоторые из Ац могут рав­
няться нулю. С учётом вышесказанного мы имеем формулы (см. (7))
det А = ( - l ) g det А = (-1 )да ц а 22 ... апп,
V(A) = (-1 y v ( A ) ,
где q — число элементарных преобразований типа (I), совершенных
при переходе от А к А. Нужное нам соотношение Т>(А) = Т>(Е) det А
вытекает теперь непосредственно из предложения 1. □
Итак, свойствами D1-D3 функция det характеризуется однознач­
но. По этой причине мы отнесли их к основным свойствам определи­
телей. Можно было с самого начала назвать определителем функцию
Т>, обладающую свойствами D1-D3, но в таком случае нужно устано­
вить её существование. У нас существование обеспечивается самой
конструкцией функции det — формулой (3).
Имея в виду дальнейшие применения теоремы 3, мы не включили
в её формулировку нормировочное условие Т)(Е) = 1.

УП РА Ж Н ЕН И Я

1. К ососим м етри ческую ф ункцию А : М3 —» К т р ёх перем енны х

А ( х , у , z) = (у - ж )0 - x ) ( z - у)
за п и с а ть в виде определителя т р е т ь е го порядка.
2. П усть А = ( a,ij ), А' = (аУ ) — две п х n -м атр и ц ы , А , А ' — их определи­
тели. С р авн и ть А и А ' в случаях:
а) аС = aij;

б) aij = + 5
в) a i j = 0“n + l - i , n + l - j •
§ 2. Дальнейшие свойства определителей 113

3. П о к а за ть , ч то

1 1 1 ... 1 1
1 2 1 ... 1 1
1 1 3 ... 1 1
1 1 1 ... п 1
1 1 1 ... 1 п + 1

§ 2. Д ал ьн ейш и е св ой ств а оп р едел и т ел ей

1. Р а зл о ж ен и е оп р ед ел и тел я по эл ем ен там стол бц а или


ст р о к и . Существует регулярный способ вычисления определите­
лей, основанный на редукции к определителям меньшего порядка.
При этом используются понятия минора Мц и алгебраического до­
полнения Aij (см. определение в § 1).
Т е о р е м а 1. Пусть А = (а^) Е Мп{Е). Справедливы следующие
формулы:
п п
det А = 1)'• •'«/, Л/,, = Aij (1)
i— i i— 1

(разложение определителя по элементам j -го столбца);


п п
det А = 1)'••'«/., Л/,, = ^j (2)
3= 1 J= 1
(разложение определителя по элементам i -й строки).
Иначе говоря, определитель матрицы А равен сумме произведе­
ний всех элементов некоторого столбца (некоторой строки) на их
алгебраические дополнения.
Д о к а з а т е л ь с т в о . 1) Опираясь на основные свойства D1 и D2
определителей (сначала относительно столбцов, а затем относитель­
но строк), выпишем цепочку равенств:

ац ai з &1 п
det А = ^21 a 2j п

CLn l ••• a nj ••• ^nn

ац a ij Uln ац .. 0 . а\п
а 21 .. 0 . а 2п a 2i •• «2 j ■ а 2п
+

0"п1 .. 0 . •• ^пп 0"п1 .. 0 . •• ^пп

8 А .И. К о стр и к и н
114 Гл. 3. Определители

«п «1 п
«21 «2п
+
«nl a nj ••

а ц a i,i-i 0 « l,j+ l «In

« i , j —1 a ij ••
=£ « il « i,j+ l « in

ani « n , j —1 0 « n ,j+ l •• «nn

0 «11 • • • al,j-l a i,j+i • «In

i) i- i a ij « il •• • « i,j —1 « i,j+ l • • « in
i=i
0 «nl • •• « n , j —1 « n ,j+ l • • «nn

aU « il •• « i , j —1 a * ,i+ i •• « in
0 «11 « l,j-l a i,i+ i «In

0 « i —1,1 •• « i —l,j— 1 O j-lJ + l • « i —l , n


0 « i+ 1 ,1 •• « i+ lj - l a * + ij+ i • « i+ l,n

0 «nl •• « n , j —1 « n ,j+ l •• «nn

2=1

Последнее равенство основано на предложении 2 § 1, применённом к


матрице
a'n « 1 2 • ^ln
0 «22 • a 2n
T =
0 a n2 '' a nn

c a'n = а^, a'12 = а ц , a'ln = « i n 5 - / И ц


§
II

•^5

что по определению = (—1)г+-?М^. Формула (1) доказана.


2) Положим М. = (а^), аО = ац. Заметим ещё, что минором, соот­
ветствующим элементу а1- в detM., будет М 1- = Мц. Как было пока-
зано в 1), det А = detM = YTj=i(~^y+%a'jiMji = 2J 5
§ 2. Дальнейшие свойства определителей 115

т.е. мы пришли к формуле (2). Можно было рассуждать проще, со­


славшись сразу на замечание 3 из § 1. □
Следующие два примера служат иллюстрацией полученных нами
свойств определителей.
П р и м е р 1. О пределитель

1 1 1
XI Х2 Хп

х\ А X2 Д(ж1,ж2, •••,хп),
,п~ 1 х пп ~ г
1 хГ1
связы ваем ы й с именем В андерм онда, вы числяется по формуле

An = Y l (X j-X i),
1^г<j
или, в более подробной записи,

А п = (ж2 - х \ ) ( х г - х \ ) .. . (хп ~ xi) (x3 - х 2) . . . (хп ~ х 2) . . . (хп ~ x n - i )


(в связи с этой ф ормулой полезно верн уться к упр. 1 из § 1). В частн о сти , при
попарно разл ичн ы х элем ентах x i , . . . , х п определитель В андерм онда отличен от
нуля. Э ти м его свойством ч асто пользую тся. По теорем е 1 § 1 имеем т ак ж е

1 XI х\ . .. х?-1
Ап —
1 х2 х\ . •• х Г 1
1 Хп Х1 - .. хГ1
Для д о к а за те л ьс тв а ф орм улы (3) применим индукцию по п. С чи тая, что
А т , т < п, вы числяется по формуле (3) и опираясь на свойство D7, вы чтем
из к аж дой г-й стр о к и определителя А п (г — 1)-ю с трок у, умнож енную на х\:

1 1 1
0 Х2 — XI - XI
Хп
0 х \ — Х2 Х 1 х 2 —- Х п Х 1

п —1 п —2
0 Х2 — Х2 Х\ .. х пп —1 - - х пп - 2
Н апраш и вается мы сль разл ож и ть теп ерь А п по первому столбцу, а в получив­
ш емся определителе п о р яд ка п — 1 вы нести из j -го столбца (j = 1, 2 , . . . , п — 1) за
зн ак определителя общ ий м нож итель Xj +\ — х \ (свойство D1 для столбцов). М ы
придём к вы раж ению

1 1 1
Х2 хз Хп
1-Г

1-Г

Н
1

1
II

н
1
>

to
3

х2~2 хГ2 . х п~ :

= (х п - x i )( x n - l - X l ) . . . (х 2- X i ) • А ( ж 2 , Ж3 , • • • Д п ) ,

совпадаю щ ем у с (3), поскольку по предполож ению индукции

А(ж2, •••,хп) = (X j-X i).


2^i<j^n
8:
116 Гл. 3. Определители

П р и м е р 2. М а тр и ц а А = (aij) вида

0 U l 2 a is CLln

— 0*12 0 U 22, . . C L2n

— а \з U23 0 U3n

U \n ~ U 2n — USn 0

н азы в ается кососимметрической (о её определителе тож е го во р ят, ч т о он ко­


сосимметрический). Д ругим и словами, t A = —А. С учётом тео р ем ы 1 из § 1
имеем
det А = det lA = d e t( —А) = ( —l ) n det А,
о т к у д а [1 + ( —l ) n _ 1 ] det А = 0. П ри нечётном п получаем det А = 0, т.е. опреде­
литель любой кососим м етри ческой м атр и ц ы нечётн ого п о р яд ка равен нулю.
2. О п р едел и тел и специальны х м атри ц . Чем больше нулей
среди элементов матрицы А и “чем лучше” они расположены, тем
легче вычислять определитель det А. Это интуитивное представле­
ние находит в некоторых случаях точное количественное выражение.
Например, мы знаем (см. (6) из § 1), что определитель треуголь­
ной матрицы (верхней или нижней) равен произведению элементов,
стоящих на главной диагонали. Другой важный частный случай со­
держит
Т е о р е м а 2. Для определителя D порядка п + га, у которого на
пересечении первых п столбцов и последних т строк, стоят нули,
имеет место формула
ац ••• 6Д n 6Ц, n+ 1 •• ^l,nAm

&nl ••• Q"nn 6^n,n+1 •• Q"n,nAm


0 ... 0 b ii ■ him

0 ... 0 bml •• hm m
(2ц ... бЦп Ьц ... Ь\т

CLn l ••• ®>пп Ъщ1 • • • Ьтт


(определитель в левой части этого равенства называется квази-
треуголъным или определителем с углом нулей).
Д о к а з а т е л ь с т в о . Зафиксируем сначала п(п + т) элементов
aij и рассмотрим определитель D как функцию элементов bku кото­
рые образуют квадратную матрицу В порядка т. На полученную
функцию можно смотреть как на функцию матрицы В: D = Т)(В).
Ясно, что полилинейность и кососимметричность определителя
D относительно последних ш строк эквивалентна тем же свойствам
Т)(В) относительно строк матрицы В. Значит, правомерно приме­
нить к Т>(В) теорему 3 § 1, согласно которой Т>(В) = Т>(Е) det В. По
§ 2. Дальнейшие свойства определителей 117

определению функции V имеем


ац Clin * H ,n + 1

Q"nl ••• ^nn ^ n ,n + 1 •• ^ n ,n + m


V(E) =
0 ... 0 1 0

0 ... 0 0 1

Разложим Т>(Е) по последней строке (см. формулу (2)), затем по


предпоследней и т.д. Повторив эту операцию m раз, мы убедимся
в том, что Т>{Е) = det А , где
ац ain
А=
Q"nl
Окончательно получаем D = V(В) = det А • det В. □
В новых обозначениях формула из теоремы 2 принимает более
компактный вид
A C
det = det А • det В. (4 )
0 В

Здесь А и В — квадратные матрицы, а нулевая матрица 0 и мат­


рица С прямоугольные. Опираясь на теорему 1 из § 1 и теорему 2 или
на рассуждения, использованные в ходе доказательства теоремы 2,
мы без труда устанавливаем, что
A 0
det = det А • det В. □
C в

Иногда пытаются написать в точности такое же выражение для


А, С А
определителя det ^ ^ , хотя сразу же напрашивается простей­

ший контрпример ^ q = —1. Всё дело в знаке. Правильный ре­


зультат получается путём перестановки строк или столбцов, приво­
дящей матрицу
c A к виду в 0 или А с
в 0 с А 0 в
Более простые рассуждения основаны на той же теореме 3 из § 1,
которую мы неоднократно использовали. Действительно,
С А С А
det = det ■det В.
В О Е О
118 Гл. 3. Определители

Далее по формуле (2), применённой т раз, находим


(2ц ... &1п
*
С А 0"п1 • • 0"пп
Em 0 1 .... 0 0 . .. 0

0 .... 1 0 . .. 0
= ( _ l ) ( » + 2 ) + (n+ 4) + ...+ (« + 2 m ) d e t A = ( _ l ) » > » d e t A .

Окончательно приходим к выводу, что если А, В — квадратные мат­


рицы порядков п и т соответственно, то

det
с А (_l)nm d etA -d e tB . (5)
в 0
Формулы (4) и (5) охватываются общей теоремой Лапласа о раз­
ложении определителей. Эта теорема, однако, употребляется срав­
нительно редко, и мы на ней не останавливаемся, отсылая любозна­
тельного читателя к упражнениям в конце следующего параграфа.
Исключительно важное в теоретическом плане утверждение об
определителях матриц содержит
Т е о р е м а 3. Пусть А и В — квадратные матрицы порядка п.
Тогда
det АВ = det А • det В.

Д о к а з а т е л ь с т в о . Согласно формулам (7) и (9) § 3 гл. 2, вы­


ражающим коэффициенты с^- матрицы (с^-) = АВ = (а^-)(Ь^-) через
коэффициенты матриц А и В , г-я строка (А В )(р записывается в виде
{AB)(i] = (А(0В(1\ Л ( 0 В (2), . . . , А( 0В (п)),
п
А(г)В^ = ^ ^ ^ ik bkj •
k=1
Фиксируем матрицу В и для любой матрицы А положим
V B(A) = det АВ.
Докажем, что функция V = V в удовлетворяет условиям i), ii)
теоремы 3 из § 1. В самом деле, поменяем А ^ и Др) местами. Так
как s-я и t-я строки матрицы АВ имеют вид

(A{t)B ^ , . . . , A {t)B ^ ) ,
§ 2. Дальнейшие свойства определителей 119

то при этом они тоже поменяются местами и, значит, то теореме 1


^ ( ' ' ' 5^-(S) 5' ' ' 5A(t) 5' ' ' ) = —
= det АВ = det[..., (AB){s), . .., (AB){t), . ..] =
= —det[..., (А В )(ф ..., (AB)(S), .. . ] = —Т>{..., Д ф . .. , Д«) , ...).
Далее, как известно, det АВ — линейная функция элементов г-й стро-
ки (AB){i):
det АВ = \ i A (i)B {1) +X 2 A {i)B i2'>+ ... + ЛnA (i)B {n).
Поэтому
n n n n n
21(Д) = ^ ^ Лj ^ ^ &ikbkj = ^ ^ &ik ^ ^ Xjbkj = ^ ^f-lkdiki
j =1 k=l k=l j =1 k=l
где jik — Y^j=i Xjbkj — скаляр, не зависящий от элементов i-й строки
Д(р матрицы А.
Мы видим, что Т) линейно зависит от элементов г-й строки
матрицы А.
Таким образом, выполнены оба условия теоремы 3 § 1, согласно
которой Т>(А) = Т>(Е) • det А. Но по определению Т>(Е) = det Е В =
= det В. Отсюда вытекает искомая формула. □
Непосредственная проверка теоремы 3, сравнительно легко вы­
полнимая при п = 2, уже при п = 3 сопряжена со значительными
трудностями. Однако и в общем случае можно указать обходной ма­
невр, основанный непосредственно на свойствах D1-D2, а также на
привлечении теорем 1 и 2 (см. упр. 3).

УП РА Ж Н ЕН И Я

1. Целые числа 1798, 2139, 3255, 4867 делятся на 31. Б ез всяких вы числений
п о к а за ть , ч т о определитель ч е т в ё р т о го поряд ка
1 7 9 8
2 1 3 9
3 2 5 5
4 8 6 7
т а к ж е делится на 31.
2. П о к а за ть , ч т о лю бой к ососим м етри ческий определитель |ад-| ч е т в е р т о го
п о р яд ка с aij G Z явл яется к в ад р ат о м целого числа.
З а м е ч а н и е . Э то верно для к ососим м етри ческого определителя прои зволь­
ного п орядка.
3. Д о к а за ть соотнош ение det А В = det А • det В (тео р ем а 3) путём приведе­
ния элем ен тарны м и преобразован и ям и т и п а (II) над с тр о к ам и всп ом огательной
Е В Е В
м атр и ц ы С = р азм ер а 2п х 2п к виду С' =
-А 0 0 АВ
У к а з а н и е. В оспользоваться равенством det С = det С и соотнош ениям и
(4), (5).
120 Гл. 3. Определители

То же до к азател ьств о п ровести, основы ваясь на упр. 17, 18 из § 3 гл. 2 и на


Е А
замечании, ч то верхняя у н и треугол ьн ая м атри ц а.
0 Е
4 (З ах ар о в В.И. — Тула, 1984). В зад а ч а х по м оделированию случайны х с т а ­
ци онарны х процессов возн и к аю т определители вида

М ^(х i)
A n { к \ 5 Х1i • • • 5кгтХт)
м%т (хт )

где х \ , . . . , Х т — любые переменны е; / c i , . . . , / c m — н атурал ьн ы е числа, к\ +


+ /с2 + . . . + кт = щ М £ ( х ) — к х n -м ат р и ц а вида

1 X т2 х п '-1
0 1 х п-2
(?)* - ("Г1)
Щ (х) = 0 0 1
(V)х п - 3
0 0 0 Xn ~k
(Г !)
Д о к а за ть , что

Дп {к\, х \ ; . . . ; к т , х ш ) = | {%i ~ %j )^г ^ •


1^1<г^т
У К а з а н и е. П ри Ад = . . . = кш = 1, т.е. при m = п, получается определитель
В андерм онда.
5. П о к а за ть , ч то

s s
t t+ 1 t + n —1
s+ 1 S+ 1 s+ 1
Вп(s, А) — t A+ 1 AT n —1

s + n —1 s + n —1 ' s + n —1
t A+ 1 чA+ n — 1
- s —1\ /n s —2 n + s —t
n ) \ n n
n + t —1 n + t —2
n n
У к а з а н и е . В ы нести последовательно s + к — 1 из /с-й стр о к и при к =
= 1, 2 , . . . , п, а за те м l / ( t + I — 1) из /-го столбца при I = 1, 2 , . . . , п. Д ейство­
в а т ь т а к до тех пор, пока в первом столбце не будут с то я т ь только 1.
6 . П усть

Ai 1 0 .. 0 0 0
-1 Л2 1 .. 0 0 0

0 0 0 .. Ап —2 1 0
0 0 0 .. —1 Ап —1 1
0 0 0 .. 0 -1 Ап
§ 3. Применения определителей 121

П о к а за ть , ч т о det Сп = \ п det Сп - \ + d e t Сп - 2 . П ри Ai = Л2 = . . . = An = 1 н ай ти
численное значение det С п .
У к а з а н и е . В спом нить пример 3 из п. 3 § 3 гл. 2 и о б р а ти ть внимание на
т о т ф а к т , ч т о det Сп ( 1 , . . . , 1 ) = ( —1 ) п det CVj ( —1 , . . ■• 5 - 1 ).
7. П о к а за ть , ч т о определитель п х n -м атр и ц ы

2 - 1 0 0 ... 0 0 0
- 1 2 - -1 0 ... 0 0 0
0 - 1 2 - 1 ... 0 0 0
Ап —
0 0 0 0 ... - -1 2 - 1
0 0 0 0 ... 0 - 1 2

равен п + 1 .
8 . П усть А, В — любые к в ад р ат н ы е м атр и ц ы п оряд ка п. П о к а за ть , ч то
А В
det = d e t(A + В) • d e t(A — В).
В А

9. П усть X — м ат р и ц а р азм ер а п х /с, a Y — р азм ер а к х п. Д о к а за ть , что

det ( Еп + X Y ) = det ( Е к + Y X ) .

У к а з а н и е . И спользовать соотнош ение


Ek + Y X 0 Ек Y Ек Y Ек О
X Еп 0 Еп 0 En X En + X Y

§ 3. П р и м ен ен и я оп р едел и т ел ей

1. К р и т ер и и н ев ы р о ж д ен н о сти м атри цы . По теореме 5 из


§ 3 гл. 2 условие невырожденности матрицы A G МП(Е) (т.е. равен­
ство rank Л = п) эквивалентно её обратимости. Применяя теорему 3
из § 2 к соотношению АА~Х = А~ХА = Е, мы получаем, что
det А • det(n_1) = 1.
Стало быть, определитель невырожденной матрицы отличен от
нуля и
det(n_1) = (det А)-1 .
Наряду с матрицей А рассмотрим её присоединённую (или взаим­
ную) матрицу
A n • A ni

Ain A
•• л пп

Чтобы получить А у, надо поставить на место каждого элемента ац


матрицы А его алгебраическое дополнение Ац (i,j = 1,... ,п), а за­
тем перейти к транспонированной матрице.
122 Гл. 3. Определители

Т е о р е м а 1. Матрица А Е МП(Е) невырожденна (обратима)


тогда и только тогда, когда det А ф 0. Если det А ф 0, то
Л-1 = (detA)-1Av,
или, в более подробной записи,
Ап Ani
-1
ац CLnl det A det A

&1 п • • ^nn Ain лAпп


det A det A
Доказательству теоремы предпошлём лемму.
Ле мма . Пусть А Е Мп{Ж). Имеют место соотношения
(liiAji + cii2 A j 2 + ... + ainA jn — Sij det A, (1)
anA ij T a,2 iA 2j T • • • T aniAnj —Sij det Л, (2)
где S^ — символ Кронекера {при i Ф j говорят о разложении опре­
делителя det Л по чужой строке или соответственно по чужому
столбцу).
Д о к а з а т е л ь с т в о . При i — j утверждение леммы совпадает с
теоремой 1 из § 2. Поэтому остаётся рассмотреть случай i ф j, когда
дц — 0. С этой целью введём матрицу
ац ai2 ain

ац ai 2 • .. am
А [Л(]Д 5• • • 5-^(г) 5• • • 5^-(г) 5' ' ' 5^-(п)]
an ai2 .. am

ani an2 ••• ann


получающуюся из А = [..., Л(р, . . . , A (j) , ... ] заменой j -й строки на
г-ю (г-я строка остается на месте). Как и у всякой другой квадрат­
ной матрицы с двумя одинаковыми строками, det А' = 0. С другой
стороны, алгебраическое дополнение А'-к (к = 1, . . . , п) образуется
путем зачёркивания j -й строки А '^ = Л(р и к-то столбца опреде­
лителя, так что A'jk = Ajk. Формальное разложение определителя
матрицы А' = {a'st) по j -й строке даст нам соотношение
п
0 = det А' =
a'jkA'jk = ^ ^ C^ikAjk 1
к=1 к=1
совпадающее с соотношением (1) в формулировке леммы. Второе со­
отношение получается из аналогичных соображений, относящихся к
столбцам. □
§ 3. Применения определителей 123

Обращаясь к доказательству теоремы, мы просто замечаем, что


левая часть соотношения (1) есть не что иное, как элемент с^- мат­
рицы С = A A V:
Си . cni ап ani А п . Л П1

Л In А
Cl п •• с пп п •• 0"пп •• л пп

Согласно соотношению (1) (с^-) = ((% det А) = (det А)Е. Таким обра­
зом,
A A V = (det А)Е,
откуда при det А ф 0 получаем
(det А)~ 1 {ААУ) = A(det A)~ 1 A V = E.
Левая часть соотношения (2) является выражением элемента сС
матрицы С = А у А. Так как правые части в (1) и (2) совпадают, то
в случае det А ф 0 мы приходим к соотношениям
A(det A)~ 1 A V = (det Л)-1 ЛУЛ = Е,
означающим, что Л-1 = (det Л)-1ЛУ. □
С л е д с т в и е . Определитель равен нулю тогда и только тогда,
когда его строки (и столбцы) линейно зависимы.
Д о к а з а т е л ь с т в о . Линейная зависимость строк (или столб­
цов) матрицы A G МП(Е) эквивалентна неравенству rank Л < п, т.е.
вырожденное™ матрицы Л, что по теореме 1 равносильно условию
det Л = 0. □
З а м е ч а н и е . Импликация rank Л < п = > det Л = 0 является,
конечно, непосредственным следствием основных свойств определи­
телей (см. D2, D6 в § 2).
Теорема 1 имеет скорее теоретическое значение. С вычисли­
тельной точки зрения, в особенности при больших размерах мат­
риц, для отыскания матрицы Л-1 удобнее пользоваться методом
(Р, Q)-приведения, описанным в п. 7 гл. 2.
2. Ф ормулы К рам ера. Выведем теперь формулы для решения
системы из п линейных уравнении с п неизвестными, ради которых,
в частности, и была первоначально развита теория определителей.
Т е о р е м а 2 (Крамер). Если линейная система
CLuXi + . . . + CL\n X n = b i ,

C L nlX i T . . . T CLn n X n — Ьп

имеет отличный от нуля определитель {т.е. det(a^) ф 0), то её


124 Гл. 3. Определители

единственное решение задаётся формулами


(2ц ... Ь\ ... СЦп

0"п1
XI = к = 1, 2, .. ., п
ац &1 к dir

&п1 &пк
(числитель D получается заменой к-го столбца в D = det(a^)
столбцом свободных членов).
Д о к а з а т е л ь с т в о . По теореме 1 матрица А = (а^) обратима.
Поэтому, записав нашу систему в виде А Х = В , мы, как и в и. 8 § 3
гл. 2, будем иметь

Ап А 21 A-ni Ьг
Аи А 22 • • Дп2 ^2
^г°к = А- 1В = 1„
det Л
Ain А 2П • А

откуда
1 Л
Х°к = f e t Ai—^1 Aikbi =

— ib\Aik + Ь^А^к + ... + bnAnk), к = 1,2,..., гг.


Именно такое выражение в числителе мы получим, разложив опре­
делитель Dk по к-му столбцу (см. (2)).
Выполнение всех преобразований в обратном порядке показыва­
ет, что набор (Di / det Д , ... , Dn/det А) действительно является ре­
шением нашей системы. □
Заметим, что формулы (3), (9) из § 4 гл. 1 совпадают как раз с
формулами Крамера при п = 2 и п = 3 соответственно. Удобные при
небольших п формулы Крамера несут в общем чисто теоретическую
функцию. Например, их применение к линейной системе из приме­
ра 2 в и. 5 § 3 гл. 1 даёт (с учётом равенства det А — 1) для чисел
Фибоначчи выражение
1—1

1 0 0 ... 0 0
0 1 0 ... 0 0 1
-1 1 ... 0 0
т—1

о
1 '

0 0 0 ... -1 1 0
0 0 0 ... -1 -1 0
§ 3. Применения определителей 125

Понятно, что оно весьма далеко от того явного выражения для / п,


которое мы нашли в п. 5 § 3 гл. 2.
Надо сказать ещё, что необходимое для применения формул Кра­
мера условие det А ф 0 неустойчиво в следующем смысле. Для реаль­
ных квадратных линейных систем с приближённо вычисленными ко­
эффициентами увеличение точности вычислений может радикально
изменить картину. Если, например,
-1 10 0 .. 0 0
0 -1 10 .. 0 0
л Е М ю (1),
0 0 0 .. . -1 10
£ 0 0 .. 0 -1
то det А£ = 1 —8 ' 109 (разложить определитель по элементам первого
столбца). При г = 10-9 имеем det А£ = 0. В то же время, вычисляя ко­
эффициенты матрицы всего лишь с точностью до одной миллионной,
мы могли “не заметить г” (т.е. посчитать г = 0, a det До —1)- Таким
образом, условия применимости формул Крамера чувствительны к
малому “шевелению” коэффициентов системы.
3. М етод окаймляю щих миноров. В § 3 гл. 2 содержится
всё необходимое для описания совокупности решений прямоуголь­
ной системы линейных уравнений. Важнейшая роль в этом описании
принадлежит понятию ранга матрицы. Нам осталось лишь переве­
сти его на язык теории определителей, чтобы получить в своё распо­
ряжение ещё один метод вычисления ранга и удобное средство для
выражения факта линейной независимости системы векторов линей­
ного пространства Rm.
Итак, пусть
ап а±г а\п

А = ari .. а гг . .. а гп

& ml .. а шг •• &тп

— произвольная прямоугольная матрица размера т х п с коэффици­


ентами CLij Е R.
О п р е д е л е н и е . Элементы, стоящие на пересечении каких-то
выделенных к строк и к столбцов т х n-матрицы А (к ^ min(ш,п)),
составляют квадратную матрицу, определитель которой называется
минором к-го порядка для А. Иногда говорят о миноре
Ъ\ ... Ifc
М
jl ••• jk
если i i , ... Ak и ji, • • • 5jk — номера выделенных строк и столбцов.
126 Гл. 3. Определители

При к — п —1 мы приходим к ранее введённому понятию минора Мц


для п х n-матрицы А.
Минор М называется окаймляющим для М, если М получается
из М вычёркиванием одной крайней строки (первой или последней)
и одного крайнего столбца.
Т е о р е м а (метод окаймляющих миноров). При вычислении ран­
га матрицы А следует переходить от миноров меньших порядков к
минорам больших порядков. Если для А уже найден минор М / 0 по­
рядка г, то требуют вычисления лишь миноры порядка г + 1, окайм­
ляющие минор М . Если все они равны нулю, то rank Л = г.
Д о к а з а т е л ь с т в о . Рассуждение основано на простом замеча­
нии, что если все миноры к-го порядка матрицы А равны нулю, то
равны нулю и все миноры более высоких порядков. Для этого соглас­
но теореме 1 § 2 достаточно рассмотреть разложение любого минора
порядка к -\-1 по элементам какого-нибудь столбца (например, перво­
го или последнего, если ограничиться рассмотрением только мино­
ров, полученных посредством окаймления), затем перейти к минорам
порядка к + 2 и т.д.
Действуя теперь по схеме, указанной в формулировке теоремы,
мы дойдём до какого-то минора М ф 0 порядка г. Без ограниче­
ния общности считаем, что М отвечает матрице, стоящей в левом
верхнем углу нашей матрицы:
ац . . . Cl\r a±j -• a \ n
м
ari ... arr ... a rj ..- • a rn

ац ... ац a%j .. ain

a ... а ш г
ml ... a m j •• a mn
Этого всегда можно достичь перестановкой строк и столбцов, не
меняющей, как нам известно, ранга матрицы А.
Выделим теперь в А строку Д(р и столбец А ^ с совершенно про­
извольными номерами г, j (возможно, г ^ г или j ^ г). Составим при
помощи элементов из Д(р и А ^ минор М порядка г + 1, окаймляю­
щий М :
a^\ ... а^j* а^j
м= ari a rr a rj
ац ац a ij

Если М ф 0, переходим к минорам, окаймляющим М . Критический


момент наступит, когда все окаймляющие М миноры будут равны
нулю.
§ 3. Применения определителей 127

Итак, пусть М — 0 при любом выборе г, j. Разлагал М по элемен­


там последней строки, придём к соотношению
а ц М \ Н- c i i 2 - ^ - 2 - - - И- a i r M r -\- c t i j M — О

с коэффициентами
an ailS- i a i,s+i CL\f CL\j
Ms = (-1 y+s+i
ari ar,s—l ^r,s+1 CLrr CLrj

не зависящими от i. Так как М / 0, то


CLij — X i a n + X.2&i2 + . . . + \ rCLir

для i = 1, 2,..., m с одними и теми же коэффициентами As = —Ms/M,


1 ^ s ^ г. Стало быть,
A ij) = AM(1) + А2 А (2) + ... + АгА (г\
т.е. любой столбец А ^ является линейной комбинацией первых г
столбцов. Это значит, что rank И ^ г. Но из М / 0 вытекает ли­
нейная независимость столбцов в М и тем более — соответствую­
щих более длинных столбцов в А. Мы приходим к заключению, что
rank И = г. □
С л е д с т в и е . Ранг всякой матрицы совпадает с наивысшим по­
рядком её отличных от нуля миноров.
Для следствия можно указать короткое независимое доказатель­
ство. Именно, пусть ранг матрицы А равен г. Согласно теореме 1
§2 гл. 2 это значит, что г — максимальное число линейно незави­
симых строк и максимальное число линейно независимых столбцов
матрицы А. Обращаясь к теореме б § 3 гл. 2, мы замечаем, что
Ег 0
А=В С,
0 0
где В и С — невырожденные матрицы порядков ш и п соответ­
ственно, записываемые в виде произведения элементарных матриц.
Ег 0
Так как у матрицы имеется отличный от нуля минор
0 0
М = \Er \ = 1 порядка г, но нет ненулевых миноров порядка > г,
и так как это свойство сохраняется при элементарных преобразова­
ниях строк и столбцов, то мы приходим к нужному утверждению. □
Метод окаймляющих миноров достаточно практичен, особенно
тогда, когда мы хотим знать не только ранг, но и те столбцы или
строки матрицы А , которые составляют максимальную линейно не­
зависимую систему. При элементарных преобразованиях эта инфор­
мация, конечно, утрачивается.
128 Гл. 3. Определители

УП РА Ж Н ЕН И Я

1. П о к а за ть , ч т о вы полнены следующие соотнош ения:

{ A B ) V = B VA V; (*A)V =* (A v ); (AA)V = An_1 A v ;


(A v )v = (det A) n_2 A.

2. В ы р ази ть r a n k A v через ra n k A.
3. Д о к а за ть , ч т о к в ад р ат н а я систем а линейны х одн ородны х уравнений т о г ­
да и только т о гд а об л ад ает н етри виальны м и реш ениями, к огд а определитель
систем ы равен нулю.
4 . О пираясь на р е зу л ь т а т ы п. 8 § 3 гл. 2 и на теорем у 2, п о к а за ть , ч то
ф у н д ам ен тал ьн ая систем а реш ений однородной систем ы

ацХ 1 + ... + ainxn = О,

Un —1,1^1 + • • • + Un —1,пх п — О
р а н га г — п — 1 будет с о сто ять из одного в ек тора-стол б ц а

Х ° = [.D1, - D 2, D z , . . . , ( - l ) n~ 1Dn],
где Di — определитель м атри ц ы , получаю щ ейся из А = (a i j ) вы чёрки вани ем её
г-го столбца. Лю бое реш ение систем ы им еет вид X = АХ °.
5. П усть А = (d i j ) G М П(К) и (п — 1)|aij \ < \ац\ для всех ъ ф j . Д о к а за ть , ч то
det А ф 0.
У к а з а н и е . П редполож ив п ротивное, восп ользоваться к ри тери ем , сф орм у­
лированны м в упр. 3. Именно, если [ж®,. . . , ж®] — н етри виальное реш ение линей­
ной систем ы А Х — 0 и х® — его ком понента, имею щ ая м аксим альны й модуль,
то из к -го уравнения
akkx k 'У у ak j x j — 0
Зфк
следует оценка

(п - 1)\ак к \\х°к \ = (п - < (п - 1)\акк \\х°к |,


Зфк
даю щ ая нуж ное противоречие.
6 . Д о к а за ть следующее утверж ден ие (теорема Вине — Коши). П усть А =
= (dij), В = ( bki ) — м атр и ц ы разм еров п х т и т х п соответствен н о, и пусть
С = А В . Т огда
aiji a2j 1 . a nji 6i i i bji2 • aj l n
det С = a ij2 a2j2 anj 2 X aj2 l aj2 2 aj 2n
<---<Зп <ГП
a i jn a2jn • .. dnjn ajn 1 a3n 2 • CLjn n

С ум м ирование в правой ч асти проходит по всем ^ J возм ож ны м комбинациям


по п элементов { j i , J 2 , . . . , j n } из 1, 2 , . . . , т. В частн о сти , det С = det A -d e t В при
т — п и det С — 0 при п > т.
У к а з а н и е . Так как
т
C = (Cij) cij = ^ ^ aik^kj j
к=1
§ 3. Применения определителей 129

то м н огок ратн ое применение свой ства D2 определителей (тео р ем а 2 § 1) даёт

т 0-1^2 а 1к1
а 2кг а 2/г2 а 2к,
Е
...,fcn=l
Ьк1Нк22 •••^ Пп)
&пк 1 апк2 &пк-
где сумм ирование п роводи тся по всем попарно различн ы м Ад,. . . , кп . П ри т < п
т а к и х индексов нет и, следовательно, det С — 0. Если же т п, то Ад, . . . , кп —
в ы борк а элементов { j i , . . . , j n }, в зя т ы х в как о м -то порядке из 1, 2 , . . . , т. С ледует
с о б р ать все члены, соответствую щ ие ф иксированной комбинации { j i , . . . , j n }, и
при помощ и ф орм улы (3) § 1 п олучить нуж ное вы раж ение:

а 1к\ &пк\ CLljl


Е апкп
Ькг 1 • • • Ькп п —
Ййп
^£тгЬк11••-Ькпп —
а 1кп
a ljl a nj 1 bill • bj i n

а 1Зп a nj п Ь3гь 1 • a jn П

где 7г = П Зп
Ад кп
7. И спользуя преды дущ ее упраж нение, п о к а за ть , ч т о если А — т х п - м а т р и ц а
над К, m п, то
det^A A = ^ М 2,

где М п р о б егае т по всем м инорам п о р яд ка п м атр и ц ы А.


8 . Д анном у минору
М и гк
ч31 • • • Зк
п о р яд ка к для п х n -м атр и ц ы А = (a i j ) (см. определение в п. 3) о тв е ч а е т дополни­
тельный минор М . ’’’ . п о р яд ка п — к, м ат р и ц а к о то р о го получается
\31 ••• Зк )
из А вы чёрки вани ем с тр о к с ном ерам и i \ , . . . , и столбцов с ном ерам и j \ , . . . , .
В ы раж ение

г1 ••• гк \ _ ( —1) s (m ) m I %1 " ’ %к


31 ••• Зк ) V ' V 31 ••• Зк

s( M) = (ii + . . . + ik) + ( jl + • • • + Jfc),

н азы в ается алгебраическим дополнением к М ( V ’’’ %k ). П ри k = п — 1 мы


VЛ ••• Зк J
возвращ аем ся к обы чном у определению. И спользуя последовательно разлож ение
определителя по элем ентам с тр о к с ном ерам и п о к а за ть , ч т о справед­
лива следующ ая
Т е о р е м а (Л аплас). Пусть в матрице А = ( a i j ) Е М П(К) выбраны к строк
с номерами i \ , . . . , . Тогда

det А = У] М *1 ) А( ^ ^к
i<ji <---<jk <та л Зк ) \31 ••• Зк

9 А .И. К о стр и к и н
130 Гл. 3. Определители

П ри произвольном п тео р е м а Л ап ласа и звестн а нам в двух ч астн ы х случаях:


1) к = 1; 2) А — м ат р и ц а с углом нулей р азм ер а {п — к) х к. В случае неудачи
полезно убедиться в п равильности теорем ы Л ап ласа хотя бы при п = 4, i\ = 1,
— 2:

а п 0*12 а зз а з4 а п 0*13 CL32 CL34


<221 <222 <243 <244 <221 <223 <242 <244

аы <232 <233 0>12 0>13 CL31 CL34


CL24 <242 <^43 <222 <223 <241 <244

0*12 0*14 а з1 азз одз a i4 аз1 CL32


<222 <224 <241 <243 <223 <224 <241 <242

9. П усть A £ М П(М ),Б £ М т (М) — невы рож денны е м атри ц ы , С — прои з­


вольная п х m -м атр и ц а. И спользуя приём блочного умнож ения м атр и ц (см. упр. 17
из § 3 гл. 2), п о к а за ть , что

А С -1 А-1 - i- ' C B - 1
0 Б 0 в -1
10. П о к а за ть , ч т о если А, В , С , D £ M n (K), det А ф 0, то

А Б
det d e t(A D - А С А - 1 В) (det А) • d e t(D - С А _ 1 В ).
с Б

К ром е т о го , провери ть, ч то

А Б Г det(A£> - С В ), если А С = СА,


det
С Б \ det ( D A — С В ), если А В = В А.

§ 4. К п о ст р о ен и ю т е о р и и оп р едел и т ел ей

Теоремы 2 и 3 из § 1 дают по существу аксиоматическое опи­


сание функции det, хотя начинали мы с чисто конструктивного её
задания. Укажем ещё несколько подходов к теории определителей,
каждый раз ограничиваясь наброском канвы рассуждений. (Полное
их проведение является хорошим упражнением.)
1. П ер в о е ак си ом ати ч еск ое п о с т р о ен и е. Будем считать
определителем любую функцию Т) : Мп(Ж) —>• Е, обладающую следую­
щими тремя свойствами:
1.1) Т>(А) — кососимметрическая функция строк матрицы А;
1.2) Т>(А) — полилинейная функция строк матрицы А;
1.3) V(E) = 1.
Мы видели, что свойствами 1.1)—1.3) функция Т) однозначно ха­
рактеризуется и совпадает с функцией det, определённой формулой
полного развёртывания (3) § 1. Единственное, о чём нужно позабо­
титься, это дать независимое доказательство факту Т){ 1А) = Т>(А).
Сама формула (3) § 1, если угодно, также нуждается в выводе.
§ 4- К построению теории определителей 131

2. В т о р о е ак си ом ати ч еск ое п о с т р о ен и е. Определителем


считаем любую функцию V : Мп(Ж) —у Е, обладающую тремя свойст­
вами:
2.1) Т>(..., А , . . . ) = АТ>(..., А ф ,...) , т.е. если одну из строк
Аф матрицы А умножить на А, то значение Т>(А) также умножается
на А;
2.2) Т>(..., Л(»)>... . ..)= !> (... ,A (i) + A (j),... ,A (j) , ...);
2.3) V(E) = 1.
Последовательно проверяется, что:
а) значение Т>(А) не меняется при элементарных преобразованиях
типа (II) над строками матрицы А;
б) Т>(А) — полилинейная функция строк матрицы А;
в) Т>(А) = 0 при равенстве двух строк матрицы А и, следователь­
но, Т>(А) — кососимметрическая функция строк.
Мы вернулись, очевидно, к первому аксиоматическому прострое­
нию. Нормировочное свойство Т>(Е) = 1 в обоих случаях необходимо.
3. П о ст р о ен и е м е т о д о м полной ин дук ции . Возьмём в ка­
честве определителя матрицы (ап) порядка 1 число ац . Определи­
тели матриц порядков 2 и 3 вводятся соответственно формулами (2)
и (8) из § 4 гл. 1. Пусть определители матриц порядков 1, 2 ,..., п —1
уже введены. Назовём определителем матрицы А = (а^) порядка п
величину
Т>(А) = а ц М ц —CI2 1 M 21 + ... + (—l) n 1 апiM ni,
где Mij — “минор” матрицы А , соответствующий элементу ац и
являющийся определителем Т>(А) матрицы А порядка п —1, которая
получается из А вычёркиванием строки с номером i и столбца с номе­
ром j. Таким образом, в качестве исходного свойства берётся разло­
жение определителя по элементам первого столбца (частный случай
теоремы 1 § 2).
Используя индукцию по п, нужно установить свойства 1.1)—1.3)
функции V применительно к матрицам порядка п, памятуя, что для
Мц эти свойства выполнены. Реализация этой программы, закреп­
ляющей навыки в грамотном применении метода индукции, не очень
сложна. С деталями можно познакомиться по учебнику “Введение в
алгебру” (1977 г.).
4. Х а р ак тер и зац и я м ультипликативны м и свойствам и .
Пусть мы имеем функцию V : Мп(Е) —у Е, обладающую следующими
свойствами:
i) Т)(АВ) = Т)(А)Т)(В) для любых матриц А, В Е Мп(Е);
п) T>(Fsj) = —1 для каждой элементарной матрицы Fsj (см. п. 6
§ 3 гл. 2);
9*
132 Гл. 3. Определители

iii) Т>(А) = Л для верхних треугольных матриц вида

А= Л G М.

В частности, V(F 1 (X)) = Л.


Утверждается, что Т) = det. В самом деле, воспользовавшись
свойствами i) и п) в применении к матрице
Fs(A )= F 1,s .F 1(A ).Flv
мы получим
n (F s(\)) = (-1 ) • Л • (—1) = Л,

причём это верно при любом A G М, а не только при А ф 0, когда по


определению матрица Fs(А) элементарна. Отсюда для
Ег 0
Fr+1( 0 )...F n(0)
0 0
имеем
если г < п,
если г = п.

Согласно iii) V(Fsj{ А)) = 1 для элементарной матрицы Fs^{А) с s < t.


Так как
Fs,tFs,t(X)Fsj — Ft,s(А),

то и V(Ft,s(А)) = 1, а поэтому
а д , * ( a)) = i
при любых индексах s ф t.
Итак,
V(F 89t) = -1 = det FS9t, V(FS9t (X)) = 1 = detFM(A),
V(Fs(X))= X = detFs(X).
Поскольку любая матрица A G Мп(Ж) записывается в виде
Ег 0
0 0
где Р и Q — произведения элементарных матриц (см. рассуждения
перед теоремой б § 3 гл. 2), свойство i) позволяет заключить, что
V(A) = det А.
§ 4- К построению теории определителей 133

УП РА Ж Н ЕН И Я

1 (J. Brow kin, P o la n d ). П усть / : К —» К — произвольная ф ункц ия с условием


До) = о.
Д о к а за ть , ч т о сущ ествует, и п ри том только одна, ф ункц ия Т >: М п (М) —» К,
обладаю щ ая следующ ими свойствам и:
i) если А содерж и т столбец нулей, то Т>(А) = 0;
И) если А! получается из А элем ентарны м преобразован ием т и п а (II) над
столбцам и, то V ( A ' ) = Т>(А);
in) если А = diag(A, 1 , 1 , . . . , 1) — ди агональная м атр и ц а, то Т>(А) = /(А ).
П ри /(А ) = А получаем Т> = d e t, но произвол в вы боре / полезен в д ругих
прилож ениях.
2. Ч и та те л ю п р ед л агается в ы дви н уть и обосновать собственны е в ар и ан ты
аксиом ати ческого описания ф ункции det.
Г лава 4
Г Р У П П Ы . К О Л Ь Ц А . П О ЛЯ

В предыдущих главах накопилось довольно много конкретного


материала, который необходимо осмыслить с более общих позиций.
С этой целью мы введём и изучим (пока на элементарном уровне),
фундаментальные для всей алгебры понятия группы, кольца и поля.

§ 1. М н о ж е ст в а с ал геб р а и ч еск и м и оп ер ац иям и


1. Бинарны е операции. Пусть X — произвольное множество.
Бинарной алгебраической операцией (или законом композиции) на X
называется произвольное (но фиксированное) отображение т : X х
х I 4 I декартова квадрата X 2 = X х X в X . Таким образом,
любой упорядоченной паре (а, Ъ) элементов а, b Е X ставится в соот­
ветствие однозначно определённый элемент т(а, Ь) того же множе­
ства X . Иногда вместо г (а, Ь) пишут атЪ, а ещё чаще бинарную опе­
рацию на X обозначают каким-нибудь специальным символом: *, о, •
или + . Последуем и мы по тому же пути, называя а • b (или просто
аЪ, без всякого значка между а и Ъ) произведением, а а + b — сум­
мой элементов а, Ъ Е X . Понятно, что эти названия в большинстве
случаев условны.
На X может быть задано, вообще говоря, много разных операций.
Желая выделить одну из них, используют скобки: (X , *), и говорят,
что операция * определяет на X алгебраическую структуру или что
(X, *) — алгебраическая структура (алгебраическая система). Так,
например, на множестве Ъ целых чисел, помимо естественных опера­
ций + , • (сложения и умножения), легко указать получающиеся при
помощи + (или —) и • “производные” операции: п о т = п + т —пт ,
n * m = —п — т и т.д. Мы приходим к различным алгебраическим
структурам (Z, +), (Z, •), (Z, о), (Z, *).
Наряду с бинарными алгебраическими операциями не лишены ин­
тереса гораздо более общие n-арные операции (унарные при п — 1,
тернарные при п — 3 и т.д.), равно как и их комбинации. Связанные
с ними алгебраические структуры составляют специальную теорию
универсальных алгебр. Впрочем, мы упоминаем об этом только для
того, чтобы лишний раз подчеркнуть принципиальную важность для
математики, казалось бы, частных разделов теории универсальных
алгебр — алгебраических структур с бинарными операциями.
В направлении конструирования разных бинарных операций на
множестве X также, очевидно, открывается неограниченный прос­
тор для фантазии. Но задача изучения произвольных алгебраических
структур слишком обща, чтобы представлять реальную ценность. По
§ 1. Множества с алгебраическими операциями 135

этой причине её рассматривают при различных естественных огра­


ничениях.
2. П олугруппы и моноиды. Бинарная операция * на множест­
ве X называется ассоциативной, если
(а * Ь) * с = а * (Ь * с)
для всех а, 5, с Е X; она называется коммутативной, если
а * b = b * а.
Те же названия присваиваются и соответствующей алгебраической
структуре (X,*).
Требования ассоциативности и коммутативности независимы. В
самом деле, операция * на Z, заданная правилом
п * т = —п —ш,
очевидно, коммутативна, но
(1 * 2) * 3 = (-1 - 2) * 3 = - ( - 1 - 2) - 3 = 0 ф 4 = 1 * (2 * 3),
так что условие ассоциативности не выполняется. Далее, на множе­
стве МП(Е) всех квадратных матриц порядка п > 1 определена опе­
рация умножения — ассоциативная, но некоммутативная (см. п. 2 § 3
гл. 2).
Элемент е G I называется единичным (или нейтральным) отно­
сительно рассматриваемой бинарной операции *, если е*ж = ж*е = х
для всех х G X . Если е' — ещё один единичный элемент, то, как сле­
дует из определения, е' = е' * е = е. Стало быть, в алгебраической
структуре (X , *) может существовать не более одного единичного
элемента.
Множество X с заданной на нём бинарной ассоциативной опера­
цией называется полугруппой. Полугруппу с единичным (нейтраль­
ным) элементом принято называть ещё моноидом (или полугруппой
с единицей).
Как и для всякого множества, мощность моноида М = (М, *)
обозначается символом CardM или \М\. В случае конечности числа
содержащихся в нём элементов говорят о конечном моноиде М по­
рядка \М\. Приведём несколько примеров полугрупп и моноидов.
п р и м е р 1. Пусть П — произвольное множество и М(П) — множество всех
его преобразований (отображений П в себя). Из свойств множеств и отобра­
жений, отмеченных в § 5 гл. 1, следует, что М(П) — моноид. Имеется в виду,
конечно, тройка (М(П),о,е^) где о — естественная композиция отображений, а
е п — тождественное отображение.
Выделим тот частный случай, когда П — конечное множество из \Q\ = п
элементов, обозначаемых просто натуральными числами 1, 2 , . . . , п. К аж дое пре­
образование / : П —» П определяется указанием упорядоченной последователь­
ности / ( 1 ), / ( 2 ) , . . . , / ( п) , где в качестве образа /(г ) может стоять любой эле­
мент из П. Не исключаются совпадения /(г ) = f ( j ) при i ф j . Выбирая все­
возможные последовательности, мы получим ровно п п преобразований. Значит,
136 Гл. 4 • Группы. Кольца. Поля

\М(П)\ = C a rd M(Q) = п п . П усть, скаж ем , п — 2. Э лем енты е , / , g, h моноида


М ({ 1,2}) и их попарны е произведения полностью за д а ю тс я следующ ими двумя
таблицам и:
1 2 е / 9 h
е 1 2 е е / 9 h
/ 2 1 / / е h 9
9 1 1 9 9 9 9 9
h 2 2 h h h h h
Н епосредственно видно, ч т о М ({ 1 ,2 } ) — н ек ом м утати вн ы й моноид.
П р и м е р 2. П усть снова П — произвольное м нож ество и 'Р(П ) — множ ество
всех его подм нож еств (см. упр. 4 из § 5 гл. 1). Т ак к а к (АП В) ПС = А П ( В Г) С) и
( A U B ) U C = A U ( B U C ) , то на Т ( 0 ) определены две естественны е ассоциативны е
бинарны е операции. О чевидно, ч т о 0 U Л = А и Л П П = А. М ы имеем два
к о м м у тати вн ы х моноида: ( V ( Q ) , U , 0 ) и (“Р(Г2), П, П). К а к известно, \V(Q)\ = 2П,
если |Г2| = п.
П р и м е р 3. (М П( К ) ,+ , 0) — ком м у тати вн ы й моноид с н ейтральны м элемен­
том — нулевой м атриц ей, а ( М П(М),-,Е) — н ек ом м утати вн ы й моноид с ней­
трал ьн ы м элементом — единичной м атри ц ей Е. Э то непосредственно в ы те к а е т
из свойств сложения и умнож ения м атри ц , с к оторы м и мы познаком ились в гл. 2.
П р и м е р 4. П усть nZ = { n m \ m Е Z} — м нож ество целых чисел, делящихся
на п. Я сно, ч т о (n Z , + ,0) — ком м у тати вн ы й моноид, a (n Z ,-) — ком м у тати вн ая
полугруппа без единицы (n > 1).
П р и м е р 5. М нож ество Р П(К) с тохасти ч еск и х м атр и ц п оряд ка п (см. упр. 4
из § 3 гл. 2) явл яется моноидом с обы чной операцией умнож ения м атриц .
Подмножество S' полугруппы S с операцией * называется подпо­
лугруппой, если х * у Е S' для всех х,у Е S'. В этом случае говорят
ещё, что подмножество S' С S замкнуто относительно операции *.
Если ( М , * ) — моноид, а подмножество М ' С М не только замкнуто
относительно операции *, но и содержит единичный элемент, то М'
называется подмоноидом в М . Например, (nZ, •) — подполугруппа в
(Z,-), a (nZ,+,0) — подмоноид в (Z,+,0). Всякий подмоноид моно­
ида М(П) называется моноидом преобразований (множества Q).
3. О бобщ ённая ассоц и ати в н ость; степ ен и . Пусть (X , •) —
произвольная алгебраическая структура с бинарной операцией •, ко­
торую мы ради простоты будем опускать, записывая ху вместо х •у.
Пусть, далее, x i , . . . , x n — упорядоченная последовательность эле­
ментов из X . Не меняя порядка, мы можем многими разными спо­
собами составлять произведения длины п. Пусть 1п — число таких
способов:
h = 1: x ix 2;
h = 2: {xix 2 )xz, x 1 (x 2 x 3);
l4 = 5: ((x 1 x 2 )x 3 )x4, (xi(x 2 x 3 ))x4, x 4 ((x 2 x 3 )x4), x 4 (x 2 (x 3 x 4)),
(x 1 x 2 )(x 3 x4);

Очевидно, что, перебирая всевозможные произведения x \...x ^ ^


Xk+i- • •х п длин к и п — к, 1 ^ к ^ п — 1, а затем соединяя их нашей
бинарной операцией в данном порядке, мы исчерпаем все 1п возмож­
§ 1. Множества с алгебраическими операциями 137

ностей. Замечательно, что в моноидах (и полугруппах) расстановка


скобок оказывается излишней.
Т е о р е м а 1. Если бинарная операция на X ассоциативна, то
результат её последовательного применения к п элементам мно­
жества X не зависит от расстановки скобок.
Д о к а з а т е л ь с т в о . При п = 1,2 доказывать нечего. При п = 3
утверждение теоремы совпадает с законом ассоциативности. Далее
рассуждаем индукцией по п. Предположим, что п > 3 и что для числа
элементов < п справедливость утверждения установлена. Нам нужно
лишь показать, что
(yx 1 . . . x k)(yx k+1 . . . x n) = (х\. . . Xi)(xi+1 - .. х п) (1)
при любых fc,/, 1 ^ k , I ^ п — 1. Мы выписали только внешние
пары скобок, поскольку по предположению индукции расстановка
внутренних скобок несущественна. В частности, х\Х 2 ...Хк =
= (... ((х\Х 2 )х%)... Xk-i)xk — произведение, называемое левонорми­
рованным. Различаем два случая:
а) к = п - 1; тогда (ад ... x n- i ) x n = (... (адж2) ... x n- i) x n — ле­
вонормированное произведение;
б) к < п — 1; ввиду ассоциативности имеем
(х 1 . . . х к)(хк+1 . . . х п) = (xi- . . X k )((X k + l- ■ .x n- i ) x n) =

= {{xi.. ,х к)(хк+1 . . ,x n- i) ) x n =
= (x 1 x 2) ■. . х к)хк+1) . . . x n- i ) x n,
т.е. снова левонормированное произведение. К тому же виду приво­
дится и правая часть доказываемого равенства (1). □
Ранее был введён знак суммирования ^ Х { . Очевидно, его мож­
но использовать и в любом аддитивном коммутативном моноиде. В
мультипликативном моноиде аналогом служит знак кратного произ­
ведения:
2 3 п / п —1 \
Дж^ = Ж1 Ж2 , Д Xi = (х 1х 2)х3, Д = ( Д х г ) х п-

В силу теоремы 1 при записи (или при вычислении) произведения


элементов Х\Х2 ... х п моноида скобки излишни. Единственная забота
должна проявляться о порядке множителей, да и то лишь в случае,
когда они не все перестановочны между собой. В частности, при
х\ — Х2 = ... = х п = х произведение х х ... х обозначают, как и
при действиях с числами, символом жп, называя его п-й степенью
элемента х. Следствием теоремы 1 являются соотношения
х тх п = х ш+п^ ^ Ш)П = ХШП, Ш, П е N. (2)
В моноиде (М, •, е) для любого х G М полагают ещё х° = е.
138 Гл. 4 • Группы. Кольца. Поля

Степеням х п Е (М, •, е) в моноиде (М, + , 0) соответствуют крат­


ные пх = х + х + .. . + х элемента х. Правила (2) становятся правилами
для кратных:
тх + пх = (ш + п)ж, п{тх) = (пт)х. (2')
Отметим ещё один полезный факт. Если ху — ух в моноиде М, то

(ху)п = х пуп, тг = 0,1,2,... (3)


В частности, это всегда так в коммутативном моноиде. Соотношение
(3) доказывается индукцией по п:

(хуГ = (хур -Ц ху) = ( х ^ у ^ х у ) = (хп- 1 уп~ 1 х)у =


= ( х ^ х у ^ у = (Xй- 1 х ^ - 1 у) = х пуп.
Более общо: при X{Xj — XjXi, i, j = 1,... ,ш, опираясь на соотноше­
ние (3) и используя индукцию по ш, получаем

(X! . . . х т)п = X™ (4)


Аналогично, если x-\-y = y-\-xvLXi+Xj = Xj + Xi при г, j = 1,..., ш,
то
п(ж + у) = пж + пу, п — 0,1,2,..., (3')
n(xi + ... + х ш) = пх 1 + ... + пжт , п = 0,1, 2,... (4')

Обычно моноид (М,-,е) называют мультипликативным, а


(М,+,0) — аддитивным. Аддитивная запись используется преиму­
щественно в коммутативных моноидах.
4. О братимы е элементы. Элемент а моноида (М, -,е) называ­
ется обратимым, если найдётся элемент b Е М, для которого ab =
= е = Ъа (понятно, что элемент b тоже будет обратимым). Если ещё и
аЪ' — е — Ъ'а, то Ъ' = е£/ = (Ьа)Ь' = Ь(аЬ') = be = Ь. Это даёт нам осно­
вание говорить просто об обратном элементе а-1 к (обратимому)
элементу а Е М: а-1 а = е = аа-1 .
Разумеется, (а-1)-1 = а. Понятие обратимого элемента монои­
да служит, очевидно, естественным обобщением понятия обратимой
матрицы в мультипликативном моноиде (МП(Е), -,Е).
Так как (ху)(у~1 х~ 1) = х(уу~ 1 )х ~ 1 = жеж-1 — е и, аналогич­
но, (у~ 1 х~ 1)(ху) = е, то (ж?/)-1 = у~гх~ г. Стало быть, множество
всех обратимых элементов моноида (М, -,е) замкнуто относитель­
но операции и составляет подмоноид в М.
§ 2. Группы 139

УП РА Ж Н ЕН И Я

1. В п. 2 в к ач естве при м ера на Z вводилась операция *: п * т = —п — т ,


ком м у тати вн ая, но неассоциати вн ая. В алгебраи ческой с тр у к т у р е (Z ,* ) вы пол­
няю тся соотнош ения = n, = п. П усть теп ерь нам дана про­
извольная алгебраи ческ ая с т р у к т у р а (X , *), в к оторой ( х * у ) * у = ж, у* (у* х) = х
для лю бы х х , у Е X . Д о к а за ть , ч т о х * у = у * х , т.е. операция * ко м м у тати вн а. Н и­
к ак и х у к азан и й к реш ению не даётся, поскольку это одно из сам ы х бесполезных
упраж н ен ий в книге. Но все-таки!
2. П о к а за ть , ч т о множ ество
п
М °(М ) = | а = (aij) Е М п (Ж) | dij = 0, i = 1 , 2 , . . . , raj
j =i
с обы чной операцией умнож ения м атр и ц явл яется полугруппой. Я в л яется ли
(М®(М),-) моноидом?
3. В м ул ьтипликати вном моноиде М вы би рается произвольны й элемент t и
вводится новая операция *: х * у = xty. П о к а за ть , ч т о (М , *) — полугруппа и
ч т о о б р ати м о сть элем ента t в М — необходимое и достато ч н о е условие, при вы ­
полнении к о то р о го (М , *) — моноид с н ейтральны м (единичны м) элементом t _ 1 .
4. П о к а за ть , ч т о м нож ество Z с операцией о: n o m = n + m + п т = (1 + п) х
X (1 + m ) — 1, явл яется ко м м у тати вн ы м моноидом. Ч т о служ ит в (Z ,o ) н ей тр ал ь­
ны м элементом? Н ай ти в (Z ,o ) все обрати м ы е элементы .

§ 2. Группы
1. О п р еделен и е и прим еры . Рассмотрим множество GLn(M)
всех п х n-матриц с вещественными коэффициентами и с отличным
от нуля определителем. Согласно теореме 3 из § 2 гл. 3 det А / О,
det В ф 0 = > det АВ ф 0. Мы видим, что А , В £ GLn(R) = > АВ G
G GLn(R). Далее, (АВ)С = А(ВС) и существует выделенная матрица
Е такая, что АЕ = ЕА = А для всех Д Е GLn(R). Кроме того, у ка­
ждой матрицы Д G GLn(R) имеется “антипод” — обратная матрица
Д-1 , для которой ДД-1 = Д-1Д = Е.
Множество GLn(R), рассматриваемое вместе с законом компози­
ции (бинарной операцией) (А, В) i-A АВ и называемое полной линей­
ной группой степени п над R, можно было бы коротко определить,
следуя терминологии § 1, как подмоноид всех обратимых элемен­
тов моноида (Mn(R), -,Е). Но этот подмоноид настолько важен, что
он заслуживает специального названия и даёт веский повод ввести
общее
О п р е д е л е н и е . Моноид G, все элементы которого обратимы,
называется группой. Другими словами, предполагаются выполнен­
ными следующие аксиомы.
G0) На множестве G определена бинарная операция (х,у) i-А ху.
G1) Операция ассоциативна: (xy)z = x(yz) для всех x, y, z G G.
G2) G обладает нейтральным (единичным) элементом е : хе =
— ех — х для всех х G G.
140 Гл. 4 • Группы. Кольца. Поля

G3) Для каждого элемента х G G существует обратный х 1 :


хх~ г = х~гх = е.
Мы видели в § 8 гл. 1, что указанным аксиомам удовлетворяет ал­
гебраическая система 5П, названная нами симметрической группой
перестановок степени п. Фактически этим важнейшим примером
мы предварили общее определение группы.
Удивительно, что одна из старейших и богатейших по результа­
там область алгебры, играющая фундаментальную роль в геометрии
и в приложениях математики к вопросам естествознания, основыва­
ется на столь простых аксиомах. Небольшой анализ показывает, что
их можно ещё упростить, но эта задача для нас не принципиальна.
Группа с коммутативной операцией называется, естественно,
коммутативной, а ещё чаще — абелевой (в честь норвежского мате­
матика Абеля). Сам термин “группа” принадлежит французскому
математику Галуа — подлинному создателю теории групп. Идеи
теории групп “носились в воздухе” (как это часто бывает с осново­
полагающими математическими идеями) задолго до Галуа, и неко­
торые из её теорем в наивной форме были доказаны еще Лагран-
жем. Гениальные работы Галуа оказались непонятыми, и возрожде­
ние интереса к ним началось только после книги К. Жордана “Курс
теории перестановок и алгебраических уравнений” (1870 г.). Лишь к
концу XIX века в теории групп “совершенно отказываются от фан­
тазии. Взамен этого тщательно препарируется логический скелет”
(Ф. Клейн, “Лекции о развитии математики в XIX столетии”).
Для обозначения числа элементов в группе G (точнее, мощности
группы) используются равноправные символы CardG, \G\ и (G : е).
Почти всё сказанное в § 1 о моноидах переносится на группы. Сле­
дует лишь производить надлежащую замену слов. В частности, под­
множество Н С G называется подгруппой в G, если е G Н\ /ii,/i2 £
G Н = > hili 2 G Н и h G Н = > /г-1 G Н. Подгруппа Н С G собст­
венная, если Н ф {е} и Н ф G.
Приведём ещё несколько примеров групп.
П р и м е р 1. В уж е известной нам полной линейной группе G L n (M) р ассм о т­
рим подм нож ество SLn (M) м атр и ц с определителем 1:

SLn (M) = { А е G L n (M) I det А = 1}.

О чевидно, ч т о Е Е SLn (K). С огласно общ им р е зу л ь т ат ам гл. 3 об определителях

det А = 1, det В = 1 det А В = 1


det А -1 = (det А )-1 = 1.

П оэтом у SLn (M) — п од груп п а в G L(K ); она носит название специальной линейной
группы степени п над К. Её н азы в аю т ещё и унимодулярной группой, хотя к
последней ч асто при числяю т м атр и ц ы с определителем =Ь1.
§ 2. Группы 141

Н адо с к а за ть , ч т о гр у п п а G L n (K), будучи вместилищ ем многих ин тересн ы х


групп, явл яется для м атем ати к о в разн ы х поко­
лений к а к бы нескончаем ы м источником новы х
идей и нереш ённы х задач.
П р и м е р 2. И спользуя рациональны е чи­
GLr
сла вм есто вещ ественны х, мы придём к полной
линейной группе G L n (Q) степени п над Q и к её
подгруппе SLn (Q). В свою очередь SLn (Q) со­
д ерж и т ин тересную п одгрупп у SLn ( Z ) целочи­
сленных м атр и ц с определителем 1. Т еорем а 1
§ 3 гл. 3, предлагаю щ ая явную ф орм улу для ко­
эф ф ици ентов обратн ой м атри ц ы , п о к азы в ает,
ч т о SLn ( Z ) действительно явл яется группой.
Группы SLn (Q) и SLn ( Z ) зан и м аю т почётное
м есто в теори и чисел. Ч асти ч н о упорядоченное
м нож ество (см. п. 4 § 6 гл. 1) рассм отрен н ы х
п одгрупп груп п ы G L n (M) и зо б р аж ается помещ ённой здесь ди аграм м ой (рис. 15).
П р и м е р 3. Положив в при м ерах 1 и 2 п — 1, мы придём , во-первы х, к
м ул ьти п л и к ати вн ы м группам

М* = М \ {0} = G L i(M ), Q* = Q \ {0} = G L i(Q )

вещ ественны х и рациональн ы х чисел. Э ти группы , очевидно, бесконечны . Т ак


к а к в ( Z, *, l ) о б рати м ы м и элем ентам и являю тся только 1 и —1, то GL i ( Z ) =
= {± 1}. Далее, S L i(K ) = SL i(Q ) = SLi ( Z) = 1. Но уж е при п — 2 гр у п п а S h 2 (Z)
бесконечна: ей п ри н ад л еж ат, наприм ер, все м атри ц ы

1 т 1 0 гп га — 1
0 1 5 т 1 5 1 1

О тм ети м ещё бесконечны е адди ти в н ы е группы :

(К, +, 0) , ( Q, +, 0), (Z, + ,0).

п р и м е р 4. П усть П — произвольное м нож ество, a S(Q) — м нож ество всех


би ективны х (взаим но однозначны х) преобразован и й / : П —» П. О бративш и сь
к р е зу л ь т ат ам § 5 гл. 1 об о тображ ен и ях м нож еств (теорем ы 1, 2 и следствие
тео р ем ы 2), мы немедленно делаем заклю чение, ч т о 5(Г2) — гр у п п а с е стеств ен ­
ной бинарной операцией, являю щ ейся композицией п реобразован ий. Р а зу м е ется,
S(Q) — подмоноид всех обр ати м ы х элементов м оноида M(Q) из при м ера 1 § 1,
но это об стоятельств о мы не склонны п од чёрки вать. С ам а по себе гр у п п а S(£l)
и в особенности различн ы е её п одгрупп ы , назы ваем ы е груп п ам и п р ео б р азо в а­
ний, — с та р то в а я площ адка, с которой начи наю тся всевозмож ны е применения
теори и групп. Д о стато ч н о уп ом ян уть о зн ам енитой “Э рлангенской п р о гр ам м е”
Ф . К лейна (1872 г.), положившей понятие груп п ы преобразован и й в основу клас­
сиф икации разл и чн ы х типов гео м етр и й (более подробно см. по этом у поводу
[ВА П]).
В зяв за Q линейное п р о стр ан ств о Мп , мы придём к “больш ой” и м алообозри­
мой группе 5'(МП). Но в S'(К71) содерж ится п од груп п а обр ати м ы х (биективны х)
линейны х преобразован и й (рл • ^ , находящ ихся во взаим но однозначном
с о о тв етств и и с невы рож денны м и м атр и ц ам и А п оряд ка п (см. § 3 гл. 2).
Т аким образом , п олучается вложение G L n (M) в S(M,n ).
Смы сл это го вложения с та н е т яснее, к огд а будет введено важ ное понятие
и зом орф изм а групп.
142 Гл. 4 • Группы. Кольца. Поля

2. Ц иклические группы . Пусть G — мультипликативная груп­


па (т.е. с операцией умножения), а — её фиксированный элемент.
Если любой элемент д G G записывается в виде д = ап для не­
которого п G Z , то говорят, что G = (а) — циклическая группа с
образующим а (или циклическая группа, порождённая элементом а).
Аналогично циклическая группа определяется в аддитивном случае:
(а) = {па | п G Z } . Это, конечно, не означает, что все элементы ап
или па попарно различны. Условимся обозначать (а~г)к = а~к и убе­
димся в справедливости следующего утверждения.
Т е о р е м а 1. Каковы бы ни были т ,п G Z ,
( т \ п _ ran
LIra (Лn —
_ га+ п
LL ^ ILL ) —LL
(соответственно та + па = (ш + п)а, п(та) = ( ш ) а ) .
Д о к а з а т е л ь с т в о . При неотрицательных ш ,п см. соотно­
шения (2), (2') из и. 3 § 1. Если т < 0, п < 0, то т' = —т > О,
п' = —п > 0 и
ат а” = (а” 1)"1'(а -1 )”' = (а - 1)™4 ”' = = am+” .
При то' = —то > 0 , п > 0 имеем
атап = (a_1)ra a” = (а " 1. . а " 1,) ( а . . о) = ап~т' = ат+п.
т' п

Если т 1 У п, то ап -т = (а_1)т _п = ат+ п.


Аналогично рассматривается случай т > 0, п < 0. Равенство
(ara)n _ атп вытекает из предыдущего и достаточно очевидно из
определения степеней. □
Простейшим примером циклической группы служит аддитивная
группа целых чисел (Z,+,0), порождённая обычной единицей 1 или
1 1
—1. Легко проверить, далее, что матрица порождает в
0 1
SL2(Z) бесконечную циклическую подгруппу. Множество {1,-1}
является по умножению циклической группой порядка 2.
Пример циклической группы порядка п получается, если рассмотреть все
вращения на плоскости вокруг некоторой точки О, совмещающие с собой пра­
вильный n -угольник Р п с центром в точке О . Очевидно, что эти вращения обра­
зую т группу: под их произведением следует понимать последовательное выполне­
ние преобразований. Наша группа С п содерж ит вращения (ро, ,..., р п- \
против часовой стрелки на углы 0, 2 п / п , . . . , (п — 1)27г/п. При этом ips = p f ,
а из геометрических соображений ясно, что t p j 1 = ( f i ~ s и (р™ = сро (единич­
ное преобразование). Итак, \ С п \ = п и С п — (фГ)- Заметим, что циклическая
группа С п является собственной подгруппой группы D n всех преобразований
симметрии n -угольника Р п (т.е. совмещений Р п с собой).
Пусть снова G — произвольная группа, а — некоторый её эле­
мент. Имеются две возможности.
1) Все степени элемента а различны, т.е. т ф п = > ат ф ап. В
этом случае говорят, что элемент a G G имеет бесконечный порядок.
§ 2. Группы 143

2) Имеются совпадения ат = ап при т ф п Если, например,


т > п, то ат~п = е, т.е. существуют положительные степени эле­
мента a G G, равные единичному элементу. Пусть q — наименьший
положительный показатель, для которого aq — е. Тогда говорят, что
а — элемент конечного порядка q.
В конечной группе G (CardG < оо) все элементы, разумеется,
будут конечного порядка.
Пр е д о с т е р е ж е н и е . Слово “порядок” в математике многознач­
но. Мы говорили раньше о квадратных матрицах порядка п (матри­
цах размера п х п), но невырожденная матрица А , рассматриваемая
как элемент группы GLn(R), имеет также порядок (возможно, бес­
конечный) в только что указанном смысле. Каждый раз будет ясно
из контекста, о чём идёт речь.
На фоне приведённого выше примера циклической группы поряд­
ка п следующее утверждение почти очевидно.
Т е о р е м а 2. Порядок любого элемента а Е G {G — абстракт­
ная группа) равен Card (а).
Если а — элемент конечного порядка q, то (а) = {е, а , ..., ад_1},
ак = е к = lq, I Е Z.

Д о к а з а т е л ь с т в о . В случае элемента бесконечного порядка


доказывать нечего. Если а — элемент порядка q, то по определе­
нию все элементы е, а, а2, ..., aq~1 различны. Любая другая степень
ак совпадает с одним из этих элементов, т.е. (а) = {е, а , ..., aq~1}.
В самом деле, воспользовавшись алгоритмом деления в Ъ (п. 3 § 9
гл. 1), запишем показатель к в виде
к = lq + г, 0 ^ г ^ г —1.
после чего, оперируя со степенями по правилам, изложенным в тео­
реме 1, получим
а к = (ач) 1аг = еаг = аг .

В частности, ак = е =>- г = 0 =>- к = lq. □


3. И зоморфизм ы . Как уже отмечалось ранее, три вращения
(ро, (fi, (f2 против часовой стрелки на углы 3
0°, 120°, 240° соответственно переводят пра­
вильный треугольник Рз в себя. Но имеют­
ся ещё три осевых преобразования симме­
трии (отражения) 'фи'ф2 ,'фз с указанными
на рис. 16 осями симметрии 1—1', 2-2', 3-3'.
Всем шести преобразованиям симметрии соот- Рис. 16
ветствуют перестановки на множестве вершин треугольника. Мы
144 Гл. 4 • Группы. Кольца. Поля

получаем
т ~ е, V?! — (12 3), <у92 ~ ( 1 3 2),
01 ~ (2 3), "02-(13), 0з ~ (1 2).
Так как других перестановок степени 3 нет, то можно утверждать,
что группа D 3 всех преобразований симметрии правильного тре­
угольника обнаруживает большое сходство с симметрической груп­
пой S 3 .
В том же смысле близки друг к другу циклические группы Сп
(см. пример в п. 2) и ((1 2 ... п)) С Sn. Эти факты, а также общие
размышления о группах не могут не приводить к весьма естествен­
ному вопросу о наиболее существенных свойствах групп. На первый
взгляд, полная информация содержится в таблице умножения группы
G, называемой таблицей Кэли:
9i 92 9п • • •

91 9 i9 i 919 2 • •• 9 i9 n •••

92 9291 9292 • •• 929п •••

9п 9n9i 9п92 • 9п9п

Действительно, многие закономерности группы можно уловить


из рассмотрения её таблицы Кэли или, что то же самое, матри­
цы М = (rriij) (размера п х п, если п = (G : е)) с элементами
гп ц — gigj Е G. Мы замечаем, например, что среди элементов каж­
дой строки и каждого столбца матрицы М любой элемент группы
G встречается ровно один раз (см. ниже доказательство теоремы
4). Группа G абелева тогда и только тогда, когда матрица М сим­
метрическая, т.е. rriij — Triji. Этот список свойств можно было бы
продолжить, но всё-таки сравнивать две таблицы для групп G, G'
одинакового порядка довольно затруднительно, потому что вид мат­
рицы М зависит от нумерации (расположения) элементов группы, а
уж в случае бесконечных групп ситуация ещё более усложняется.
Самый правильный и самый радикальный подход к различению
(или, напротив, к отождествлению) групп G и G1 предлагает понятие
изоморфизма.
О п р е д е л е н и е . Две группы С и С с операциями * и о называ­
ются изоморфными, если существует отображение / : G —>G1 такое,
что:
i) /(а * Ь) = /(а) о f(b ) для всех а, Ь Е G;
п) / биективно.
Факт изоморфизма групп часто обозначается символически
G ^ G'.
Отметим простейшие свойства изоморфизма.
§ 2. Группы 145

1) Единица переходит в единицу. Действительно, если е — едини­


ца группы G, то е * а = а * е = а, и, значит, /(е) о /(а) = /(а) о /(е) =
= /(а), откуда следует, что /(е) = е' — единица группы G1 . В этом
рассуждении использованы, хотя и частично, оба свойства /. Для i)
это очевидно, а свойство и) обеспечивает сюръективность / , так что
элементами f(g ) исчерпывается вся группа G'.
2) / ( а -1) = /( а ) -1 . В самом деле, согласно 1) /(а) о / ( а -1) =
= /(а * а-1) = /(е) = е' — единица в G', откуда
/ ( а ) - 1 = / ( а ) - 1 о е' = /( а ) ” 1 о (/(а) о / ( а ” 1)) =
= ( / ( а ) - 1 о / ( а ) ) о / ( а - 1 ) = е' о / ( а - 1 ) = / ( а - 1 ).

3) Обратное отображение / -1 : G' —¥ G (существующее в си-


лу свойства и)) тоже является изоморфизмом. В силу следствия
теоремы 2 § 5 гл. 1 надо убедиться лишь в справедливости свой­
ства i) для / -1 . Пусть а', Е Е G1 . Тогда ввиду биективности / имеем
о! — f(a),b' = f(b ) для каких-то a, b Е G. Поскольку / — изомор­
физм, а' о Ь' = /(а) о /(5) = /( а * 5). Отсюда имеем а * b = / _1(а' о 5'),
а так как в свою очередь а = / _1(а/),5 = / _1(5/), то / _1(а' о Ь') =
= f - 1 ( a ' ) * f - 1 (V).
З а м е ч а н и е . Несложная проверка показывает, что установлен­
ное нами соответствие ~ между группами D% и S 3 является на самом
деле изоморфизмом.
В качестве изоморфного отображения / мультипликативной
группы (М_|_, •) положительных вещественных чисел на аддитивную
группу (Е, +) всех вещественных чисел может служить / := In.
Известное свойство логарифма In ab = In а + In b как раз моделиру­
ет свойство i) в определении изоморфизма. Обратным к / служит
отображение х ех.
Докажем теперь две общие теоремы, иллюстрирующие роль изо­
морфизма в теории групп.
Т е о р е м а 3. Все циклические группы одного и того же порядка
(в том числе и бесконечного) изоморфны.
Д о к а з а т е л ь с т в о . В самом деле, если (д) — бесконечная ци­
клическая группа, то все степени дп образующего д различны, и мы
получим изоморфизм / : (д) —>(Z, +), полагая дп н->> f ( gn) = п. Биек-
тивность / очевидна, а свойство f ( gmgn) = f ( gn) + f ( gm) вытекает
из теоремы 1.
Пусть теперь G = {е,д,... ,дя~1} и G" = {е',д’, . . . , {д'У-1 } — две
циклические группы порядка q (операции в G и G' не различаем).
Определим биективное отображение
/ : / > - ) • (д ')к , к = 0, 1.
Полагая п + т = lq + г, 0 ^ г ^ q —1, для любых п, т = 0, 1,..., q —1
10 А .И. К о стр и к и н
146 Гл. 4 • Группы. Кольца. Поля

и рассуждал как при доказательстве теоремы 2, будем иметь


f(gn+m) = f(gr) = (д'У = (д')п+т = (д'П д'Г = f(gn)f(gm)- □
Т е о р е м а 4 (Кэли). Любая конечная группа порядка п изо­
морфна некоторой подгруппе симметрической группы Sn.
Д о к а з а т е л ь с т в о . Пусть G — наша группа, п = \G\. Можно
считать, что Sn — группа всех биективных отображений множества
G на себя, так как природа элементов, переставляемых элементами
из 5П, несущественна.
Для любого элемента а Е G рассмотрим отображение L a : G —>G,
определённое формулой
La(g) = ад
(очевидно, мы повторяем определение из п. 3 § 8 гл. 1). Если е =
= pi, 02, • • •, 9 п — все элементы группы G, то а, ад2, . .., адп будут
теми же элементами, но расположенными в каком-то другом порядке
(вспомним таблицу Кэли). Это и понятно, поскольку
agi = agj =>■ а _1(од) = a~ 1 {agj ) = > (а_1а )^ = (а~га)дj =$> д{ = gj.
Значит, L a — биективное отображение (перестановка), обратным
к которому будет Ь~г = L a-i. Единичным отображением является,
естественно, L e.
Используя вновь ассоциативность умножения в G, получаем
Lab(g) = (аЬ)д = a(bg) = L a(Lbg), т.е. L ab = L aL b.
Итак, множество Le, Ь д2, . . . , L9n образует подгруппу, скажем, Н,
в группе S(G) всех биективных отображений множества G на себя,
т.е. в Sn. Мы имеем включение Н С Sn и имеем соответствие L :
а I—у L a G Н, обладающее по сказанному выше всеми свойствами
изоморфизма. □
Теорема Кэли, несмотря на свою простоту, имеет важное зна­
чение в теории групп. Она выделяет некий универсальный объект
(семейство {Sn \ п = 1,2,...} симметрических групп) — вместили­
ще всех вообще конечных групп, рассматриваемых с точностью до
изоморфизма. Фраза “с точностью до изоморфизма” отражает сущ­
ность не только теории групп, стремящейся объединить в один класс
все изоморфные группы, но и математики в целом, которая без таких
обобщений была бы лишена смысла.
Положив G1 — G в определении изоморфизма, мы получим изо­
морфное отображение ср : G —^ G группы G на себя. Оно называ­
ется автоморфизмом группы G. Например, единичное отображение
ео : д ^ д (далее обозначаемое просто через 1) — автоморфизм,
но, как правило, G обладает и нетривиальными автоморфизмами.
Свойство 3) изоморфных отображений показывает, что отображе­
ние, обратное к автоморфизму, тоже будет автоморфизмом. Если,
далее, — автоморфизмы группы G, то (ср о ф)(аЬ) = р(ф(аЬ)) =
§ 2. Группы 147

= <р(ф(а)ф(Ъ)) = (р о ф)(а) • (р о ф)(Ъ) для любых a,b Е G. Стало


быть, множество Aut (G) всех автоморфизмов группы G образует
группу — подгруппу группы S(G) всех биективных отображений
G ^G .
4. Г ом ом орф изм ы . В группе автоморфизмов Aut(G) группы
G содержится одна особая подгруппа. Она обозначается символом
Inn(G) и называется группой внутренних автоморфизмов. Её эле­
ментами являются отображения
1а- 9 ^ ада-1 .
Небольшое упражнение показывает, что 1а действительно удов­
летворяет всем свойствам, требуемым от автоморфизмов, причём
I~ x — Ia~1 , Ie — 1 — единичный автоморфизм, 1 а о 1 Ъ= 1 аЪ (так как
(4 О Ib)(g) = Ia(Ib(g)) = I a(bgb-1) = аЪдЪ^а- 1 = abg(ab) - 1 = 1аЬ{д)).
Последнее соотношение показывает, что отображение
/ : G —>• Inn(G)
группы G на группу Inn(G) ее внутренних автоморфизмов, опре­
делённое формулой /(а) = / а, а Е G, обладает свойством i) изоморф­
ного отображения: /(а) о /(&) = f(ab). Однако свойство п) при этом
не обязано выполняться. Если, например, G — абелева группа, то
ада~г = д для всех а,д Е G, так что 1а = / е, и вся группа Inn(G) со­
стоит из одного единичного элемента / е. Это обстоятельство делает
естественным следующее общее
О п р е д е л е н и е . Отображение / : G —>G1 группы (G, *) в [G1 , о)
называется гомоморфизмом, если
Va,b G G f (a*b) = f (a) of (b)
(другими словами, выполняется только свойство i) из определения
изоморфизма).
Ядром гомоморфизма / называется множество
Ker/ = {g G G \ f(g) = е' — единица группы G'}.
Гомоморфное отображение группы в себя называется ещё её эн­
доморфизмом.
В этом определении от / не требуется не только биективности,
но и сюръективности (т.е. быть отображением “на”), что, впрочем,
не очень существенно, поскольку всегда можно ограничиться рас­
смотрением образа I m / С G', являющегося, очевидно, подгруппой
в G1. Главное отличие гомоморфизма / от изоморфизма заключает­
ся в наличии нетривиального ядра Кег/, являющегося, так сказать,
мерой неинъективности /. Если же Кег/ = {е}, то / : G —>lm f —
изоморфизм.
10
148 Гл. 4 • Группы. Кольца. Поля

Заметим, что
/(я) = е', f(b) = е' =>■ f(a * b) = f(a) о f(b) = е' ое' = е',
/ ( а ” 1) = /( а ) ” 1 = ( е 'Г 1 = е'.
Поэтому ядро Кег/ — подгруппа в G.
5. Словарик. П римеры. Стоит отметить, что термины сюръ­
ективное отображение (отображение “на”), инъективное (отобра­
жение вложения), биективное (взаимно однозначное отображение),
применимые к отображениям любых множеств (без операций), в слу­
чае групп (и в случае других алгебраических структур) заменяются
соответственно терминами эпиморфизм (гомоморфизм “на”), моно­
морфизм (гомоморфизм с единичным ядром), изоморфизм (взаимно
однозначный гомоморфизм — эпиморфизм и мономорфизм одновре­
менно). Имеется тенденция к замене гомоморфизма термином мор­
физм. Этот словарик полезно иметь в виду при чтении математи­
ческой литературы, но на первых порах желающие могут обойтись
двумя терминами: изоморфизм и гомоморфизм с добавлениями “в”
и “на”.
В дополнение к рассмотренным выше приведём ещё несколько
примеров морфизмов групп.
П р и м е р 5. А д ди ти вн ая гр у п п а целых чисел Z гом ом орф но о то б р аж а ет ся
на конечную циклическую груп п у (д) п о р яд ка q , если полож ить / : п i-Э дп (см.
тео р ем у 2 § 2). В этом случае, очевидно, К ег / = {lq \ I Е Z }. В самом деле, ясно,
ч т о {lq} С К е г / . О братное вклю чение следует из тео р ем ы 1.
П р и м е р 6. О тображ ени е / : К —» Т = SO(2) а д ди ти вн ой груп п ы вещ ествен­
ны х чисел на груп п у Т вращ ении плоскости с неподвиж ной точкой 0, задаваем ое
ф ормулой /(Л ) = Фд (Фд — вращ ение п ро ти в часовой стрел ки на угол 27гА), го ­
моморфно, т а к к а к Фд о Ф^ = Фд+ ^. В ращ ение на угол, целочисленно к р ат н ы й
27г, совп ад ает с единичны м вращ ением (на нулевой угол), поэтом у К е г / = Z.
Г оворят т ак ж е, ч т о / — гом ом орф изм К на ок р у ж н о сть S'1 единичного радиуса,
поскольку и м еется взаим но однозначное соо тв етств и е м еж ду Фд и точкой на S'1
с полярны м и к оорд и н атам и (1, 2тгА), 0 ^ А < 1.
П р и м е р 7. П олная линейная гр у п п а G L m (M) вещ ественны х м атр и ц А (т.е.
м атр и ц с коэф ф ициентам и в К с не равн ы м нулю определителем det А гом ом орф ­
но о т о б р аж а ет ся на м ульти п л и кати вн ую груп п у М* отли чны х от нуля вещ ествен­
ны х чисел, если полож ить / := det. Условие гом ом орф изм а f ( A B ) = f ( A ) f ( B ) —
лиш ь иная ф орм ул и ровк а тео р ем ы 3 § 2 гл. 3. По определению SLm (M) = К е г / .
П р и м е р 8. Р ассм о тр и м циклическую груп п у С 2 — ( —1) = { 1 ,- 1 } п оряд­
к а 2. Если угодно, её можно з а д а т ь а б ст р а к т н о таблицей Кэли:

1 -1
1 1 -1


11

11

1
I

О тображ ени е S n С 2 при помощ и известной нам ф ункции £ = sgn : я i- э


(зн ак п ерестан овки тг) явл яется гом ом орф изм ом сим м етрической груп п ы S n на
СУ Я д р о К е ге = А п п о р яд ка п \ / 2 (см. п. 3 § 8 гл. 1) н азы в ается знакопеременной
группой.
§ 2. Группы 149

п р и м е р 9. Б есконечн ая гр у п п а м ож ет б ы ть и зом орф на своей истинной


(собственной) подгруппе. В самом деле, а д д и ти в н ая гр у п п а ( Z , + ) содерж и т соб­
ственную п одгрупп у пЪ = {пк | к G Z }, где n > 1 — ф исированное натурал ьн ое
число. Л егко п роверяется, ч т о отображ ение д п : Z —» n Z , определённое соотнош е­
нием дп (к) = п к , явл яется изоморф изм ом . П опутно зам ети м , ч т о Z и n Z — бес­
конечны е циклические группы , в к о то р ы х образую щ им и служ ит соответствен н о
1 или —1 и п или —щ поэтом у дп и отображ ение к i—» —пк исчерпы ваю т все
изом орф изм ы Z —» n Z .
П р и м е р 10. Г руппа A u t(G ) и даж е отдельны й неединичны й элемент р> G
G A u t(G ) м о гу т служ и ть источником важ н ы х сведений о группе G. В от ярки й
пример т ак о го рода. П усть G — конечная груп п а, на к оторой дей ствует а в т о ­
м орф изм ср п оряд ка 2 (ср2 = 1) без неподвиж ны х точек:

а ф е ==>■ (р(а) Ф а.

П редполож им, ч т о (р(а)а-1 = (р[Ь)Ъ_1 для к ак и х -то a, b G G. Т огда после


умнож ения это го равен ств а слева на (р(6)-1 и сп рава на а получим (р(6)-1 р>(а) =
= 6_ 1 а, т.е. р>(Ь~1 а ) = 6_ 1 а, о т к у д а 6_ 1 а = е и b = а. И т ак , (р(а)а-1 п р о б егае т
вм есте с а все элем енты груп п ы G, или, ч т о равносильно, любой элемент д G G
зап и сы вается в виде д = (р(а)а- 1 . Но в так ом случае <р(д) = р{р{а)) р{а~1) =
= (р2(а)(р(а- 1 ) = а(р(а)-1 = ((р(а)а-1 ) -1 = g _ 1 . И т ак , (р совп ад ает с ото б р аж ен и ­
ем д д ~ г . Зн ая это, получаем аЪ = (р(а- 1 )(р(6- 1 ) = (р(а- 1 6- 1 ) = ( а ~ 1 Ъ~ 1) ~ 1 =
= 6а, т.е. гр у п п а G о к азы в ается абелевой. К ром е т о го , (G : е) — нечётное число,
ибо G состо и т из е и непересекаю щ ихся пар элементов gi^g ^ 1 = р{дф-
П р и м е р 11. Н асколько можно и зм ен и ть операцию на группе, не меняя в
смысле и зом орф изм а самой группы , п о к азы в ает следующий пример (см. т ак ж е
упр. 3 из § 1). П усть G — произвольная груп п а, t — её к ак ой -то ф иксированны й
элемент. Введём на м нож естве G новую операцию

(g,h) ^ д * h = gth.

Н епосредственно п роверяется, ч т о (д\ * дФ) * дз = д\ * ( # 2 * дф), т.е. операция *


ассоциати вна. К ром е т о го , д * t ~ 1 = t ~ 1 * д = д и д * ( t - 1 g - 1 t -1 = ( t - 1 g - 1 t - 1 ) *
* д = t _ 1 , а это зн ач и т, ч т о (G, *) — гр у п п а с единичны м элементом е* = t - 1 .
Э лементом, о братн ы м к д в (G, *), служ ит дД 1 = О тображ ени е / :
д устан авл и вает изом орф изм групп (G, •) и (G, *), т.е. f( gh) = f ( g ) * f ( h ) .
Все указанные примеры служат, между прочим, иллюстрацией к
одному общему правилу: изучение морфизмов группы G даёт значи­
тельную информацию о самой группе G.

УП РА Ж Н ЕН И Я

1. Д о к а за ть , ч т о пересечение C\ieI Н ц лю бого сем ейства {H{\i G 1} подгрупп


груп п ы G явл яется подгруппой.
2. Г оворят, ч т о гр у п п а G порож дается подм нож еством S своих элементов,
и пиш ут G = {S), если пересечение всех подгрупп Н , содерж ащ их S, совп ад ает
с G (другим и словами, в G н ет хотя бы одной собственной п одгрупп ы , содер­
ж ащ ей S). П о к а за ть , ч т о в случае G = (S) к аж д ы й элемент д G G им еет вид
д = t \ t 2 . . . t n , п = 1 , 2 , . . . , где либо U G S, либо t ~ x G S, 1 ^ t ^ п.
3. П о к а за ть , ч т о перестановочны е элем енты а, 6 произвольной груп п ы G,
имеющие взаим но п росты е порядки s, t , порож даю т в G циклическую подгрупп у
п о р яд ка st : (а, 6) = (ab).
150 Гл. 4 • Группы. Кольца. Поля

У к а з а н и е . В клю чение (ab) С (а, Ь) = {а 1 Г | 0 г s — 1, 0 j t — 1}


очевидно. В м есте с тем , согласно п. 3 § 9 гл. 1, из Н О Д (з,£) = 1 следует, ч то
tk + sl = 1 для некоторы х k, l Е Z . П оэтом у с учётом теорем ы 1 а = a 1-sl = atk =
at k btk = ( ab)tk E (ab). А налогично, b E (ab), и, стало бы ть, (a, b) E (ab).
4. П о к а за ть , ч т о если M = (S ) — моноид, порож дённы й м нож еством S, и
к аж д ы й элемент s Е S о брати м в М , то М — группа.
5. Г руппа — это моноид G, в котором уравн ен ия ви да ах = b, уа = b одно­
значно разреш им ы при лю бы х a, b Е G. Д о к а за ть это утверж ден ие.
6 . П о к а за ть , ч т о м нож ество АДМ) т а к назы ваем ы х аффинных преобразова­
ний (ра ,Ъ : х ах + b (a,b Е Щ а ф 0) вещ ественной прям ой К обр азу ет группу
с законом умнож ения Pa.b^Pc.d — Фас^ай+Ъ- В группе АДМ) содерж ится п од груп ­
па G L i(M ), оставляю щ ая т о ч к у х = 0 на м есте, и п од груп п а “чи сты х сдви гов”
х х + Ь.
0 1 0 1
7. Г руппа SL2(Z) содерж и т элем енты А
-1 0 , в = -1 -1
рядков 4 и 3 соответствен н о. П о к а за ть , ч т о ( А В ) — бесконечная ци кли ческая
п од груп п а в SL2(Z ). Т аким образом , произведение двух элементов конечного по­
р я д к а в группе G не обязано б ы ть элементом конечного порядка. А к а к обсто и т
дело в абелевой группе?
8. Д о к а за ть , ч т о гр у п п а G ч ётн ого п о р яд ка \G\ = 2 п обязательно содерж и т
элемент д ф е п о р яд ка 2.
У к а з а н и е . Р а с с м о т р е т ь разбиение G на пары д , д - 1 .
9. Д о к а за ть , ч т о S n = ((1 2), ( 1 3 ) , . . . , (1 п)).
10. Д о к а за ть , ч т о S n = ((1 2), (1 2 3 . . . п)).
11. Д о к а за ть , ч т о знакоперем енная гр у п п а А п , п ^ 3, порож дается циклам и
длины 3, причём на самом деле

А п = ((1 2 3), (1 2 4), . . . , (1 2 п)).

12. Д о к а за ть , ч т о к-я степень п к ци кла п = (1 2 . . . п) Е S n является


произведением d = Н О Д (п,/с) независим ы х циклов, к аж д ы й из к о то р ы х им еет
длину q = n/d.
13. П о к а за ть , ч т о порядок п ерестан овки 7г Е S n ( порядок циклической под­
груп п ы (л )) равен наим еньш ем у общ ему к р атн о м у длин независим ы х циклов,
входящ их в разлож ение 7г.
14. П усть А, В Е М П(К) и ( А В ) Ш = Е для н ек оторого целого числа тп. Верно
ли, ч т о ( В А ) Ш = Е1
15. Д о к а за ть , ч т о непустое подм нож ество Н конечной (м ультипликати вн ой)
груп п ы G явл яется подгруппой, если Н за м к н у то относи тельно умнож ения. З н а ­
ч и т, в данном случае треб о в ан и я сущ ествования в Н единичного элем ента е и
обратн о го /i-1 для к аж д о го h Е Н излишни.
16. К акую систем у образую щ их можно предлож ить для м ул ьтипликати вной
груп п ы (Q_|_,*) полож ительны х рациональн ы х чисел?
У к а з а н и е . И спользовать основную тео р ем у ар и ф м ети к и из § 9 гл. 1.
С ущ ествует ли в (Q + , •) конечная систем а образую щ их?
17. Д о к а за ть , ч т о с то ч н о стью до и зом орф изм а сущ ествует лиш ь конечное
число р(п) групп данного п оряд ка п.
У к а з а н и е . О ц ени ть сверху число разл и чн ы х табли ц К эли п оряд ка п. Ф о р ­
м альны е рассуж ден ия с использованием тео р ем ы 4 огран и ч и в аю т р{п) числом
разл и чн ы х подм нож еств в S n из п элементов. Н а самом деле р(п) зн ач и­
тельно меньш е, но хорош ей оценки, приближ аю щ ейся к точной , пока не найдено.
§ 3. Кольца и поля 151

18. И спользуя упр. 10, п о к а за ть , ч т о к аж д а я конечная гр у п п а м ож ет бы ть


влож ена (т.е. для неё сущ ествует м ономорфизм) в конечную груп п у с двум я обра­
зую щ ими.
19. П опробуйте убедиться, ч т о на ди аграм м е (рис. 17) изображ ен ы все под­
груп п ы знакоперем енной груп п ы 7Ц. Символом V4 обозначен а т а к назы ваем ая
А4

Рис. 17
четверная гр у п п а (или группа Клейна) V4 = {е, (12)(34), (13)(24), (14)(23)}, а
возле други х верш ин ди агр ам м ы поставлены образую щ ие цикли ческих подгрупп.
2 0 . П о к а за ть , ч т о все груп п ы п оряд ка 4 абелевы и с то ч н о стью до изом ор­
ф изм а исчерпы ваю тся груп п ам и перестан овок U = ((1234)), V4 , или ж е группам и
м атриц :

11

0 1 0
К
I

) С G L 2 (M),
{ -1 0 ’ 0 -1
1 0 -1 0
Ь2 0 -1 ’ 0 1 ) С G L 2 (M).

В ы п и сать в явном виде изом орф изм ы U —» L i, V4 —» Ь 2.


У к а з а н и е . Если х 2 = е для лю бого элем ента х Е G, то abab = е => ab =
= Ь~1а~ 1 = 6(6- 1 )2(а- 1 )2а = Ьееа = Ьа.

§ 3. К ол ьц а и поля
1. О пр еделени е и общ и е св ой ств а колец. Алгебраические
структуры (Z,+), (Z,-) выступали у нас в качестве самых первых
примеров моноидов, причём на (Z,+) мы смотрели позднее как на
аддитивную абелеву (фактически циклическую) группу. В повсе­
дневной жизни, однако, эти структуры чаще всего объединяются
и получается то, что в математике называется кольцом. Важная
компонента элементарной арифметики заключена в дистрибутивном
(или распределительном) законе (а + Ъ)с = ас + 5с, кажущемся три­
виальным только в силу приобретённой привычки. Попытавшись,
например, объединить алгебраические структуры (Z,+), (Z,°), где
n o m = n + m + пт , мы уже не заметим столь хорошей согласован­
ности между двумя бинарными операциями. Прежде чем переходить
к дальнейшим примерам, дадим точное определение кольца.
152 Гл. 4 • Группы. Кольца. Поля

О п р е д е л е н и е . Пусть К — непустое множество, на котором


заданы две (бинарные алгебраические) операции + (сложение) и •
(умножение), удовлетворяющие следующим условиям:
К1) (К , +) — абелева группа;
К2) (К , •) — полугруппа;
КЗ) операции сложения и умножения связаны дистрибутивны­
ми законами (другими словами, умножение дистрибутивно по сло­
жению)
(а + Ь)с = ас + 5с, с(а + Ъ) = са + cb
для всех а, 5, с G К.
Тогда (КГ, + , •) называется кольцом.
Структура (КГ, +) называется аддитивной группой кольца, а
(КГ, •) — его мультипликативной полугруппой. Если (КГ, •) — моноид,
то говорят, что (КГ, + , •) — кольцо с единицей.
Единичный элемент кольца принято обозначать обычной едини­
цей 1. Существование 1 часто вносится в определение кольца, но мы
этого делать не будем.
В приложениях и в общей теории колец (а такая теория, и при­
том чрезвычайно развитая, существует) рассматриваются алгебраи­
ческие структуры, в которых аксиома К2) либо совсем устраняется,
либо заменяется другой — в зависимости от конкретной задачи. В
таких случаях говорят о неассоциативных кольцах. Пока у нас бу­
дут только обычные (ассоциативные) кольца. Это значит, что мы
можем опираться на теорему 1 из § 1 и не заботиться о расстановке
скобок в произведении а\а 2 ... любого числа к элементов кольца.
Подмножество L кольца КГ называется подколъцом, если
х,у е L = > х —у G К, ху £ К,
т.е. если L — подгруппа аддитивной группы и подполугруппа муль­
типликативной полугруппы кольца.
Ясно, что пересечение любого семейства подколец в КГ являет­
ся подкольцом (рассуждения те же, что и в упр. 1 из § 2) и, стало
быть, имеет смысл говорить о подкольце (Т ) С КГ, порождённом под­
множеством Т С КГ. По определению (Т) — пересечение всех тех
подколец в КГ, которые содержат Т. Если с самого начала Т было
подкольцом, то (Т) = Т.
Кольцо называется коммутативным, если ху = ух для всех ж, у Е
G КГ (в отличие от групп, коммутативное кольцо не принято назы­
вать абелевым).
Понятие кольца в том виде, как оно введено нами, является весь­
ма широким. Более того, класс коммутативных колец, кажущийся
на первый взгляд довольно специальным, был предметом усиленного
изучения в течение многих десятилетий, и в настоящее время тео­
рия коммутативных колец переплетается с алгебраической геомет­
§ 3. Кольца и поля 153

рией — красивой математической дисциплиной, пограничной между


алгеброй, геометрией и топологией.
П р и м е р 1. (Z, + , •) — кольцо целых чисел с обы чны м и операциям и сложения
и умнож ения. М нож ество m Z целых чисел, делящ ихся на т , будет в Z подколь-
цом (без единицы при т > 1). А налогично, кольцам и с единицей являю тся Q
и К, причём естественны е вклю чения Z С Q С К определяю т цепочки подколец
кольца К.
П р и м е р 2. С войства операций сложения и умнож ения в М п (Ш), введённые
и подробно изученны е нам и в гл. 2, позволяю т у т в е р ж д а т ь , ч т о М п (М) — кольцо
с единицей 1 = Е. Оно н азы в ается полным матричным кольцом над К, а т ак ж е
кольцом квадратных матриц порядка п (или р азм ер а п х п) над К. Э то один
из сам ы х важ н ы х примеров колец. Т ак к а к при п > 1 м атри ц ы , к а к правило,
неперестановочны , то М п (М) — неком м утати вн ое кольцо. Оно содерж и т в к ач е­
стве подколец кольца M n (Q) и M n (Z) к в ад р ат н ы х м атр и ц т о го же п о р яд ка над
Q и над Z соответствен н о. Вообщ е, М п (Ж) насы щ ено всевозм ож ны м и подколь­
цами. В рем я от врем ени некоторы е из них будут в о зн и к ать у нас естествен н ы м
образом . З а м ети м ещё, ч т о можно р а сс м ат р и в ат ь кольцо к в ад р ат н ы х м атри ц
М п (К) над произвольны м ко м м у тати вн ы м кольцом К , поскольку при сложении
и умнож ении двух м атр и ц А, В Е М п (К) будет снова п олуч аться м ат р и ц а с ко­
эф ф ици ентам и из К , а законы ди стри бути вн ости в М п (К) являю тся следствиями
аналогичны х законов в К . Всё это прям о в ы т е к а е т из ф орм ал ьн ы х правил дей­
ствий с м атри ц ам и , п од ы тож енн ы х в пп. 2 и 5 из § 3 гл. 2.
П р и м е р 3. Н аряду с кольцом м атр и ц в разл и чн ы х раздел ах м ат е м ат и к и
ш ироко используется т а к ж е кольцо функций. Именно, п усть X — прои зволь­
ное м нож ество, К — произвольное кольцо. П усть, далее, К х = { X К} —
м нож ество всех ф ункц ий (или, ч т о то же самое, отображ ений) f : X К , рас­
см атриваем ое вм есте с двум я бинарны м и операциям и — поточечной суммой
/ + g и поточечным произведением f g , определённы ми следующим образом :

( / + 9 )Ц ) = f ( x ) ® g ( x ) ,
= f ( x ) © g(x)
(0 и 0 — операции сложения и умнож ения в К) . Э то, очевидно, не т а композиция
(суперпозиция) ф ункций, ко то р ая привела нас в случае линейны х отображ ен и й к
кольцу М п . С корее мы становим ся здесь на т о ч к у зрения, п ри нятую в м ат е м а ­
тическом анализе, к огда, наприм ер, при X = К, К = К произведением ф ункций
tg и sin будет tg • s i n : х tg х • sin ж, а не tg о s in : х tg (sin х ) .
Л егко проверяется, ч т о К х удовлетворяет всем аксиом ам кольца. Т ак, ввиду
ди стри бути вн ости операций в К имеем

[f{x) 0 g{x)\ 0 h(x) = f ( x ) 0 h(x) 0 g(x) 0 h(x)


для лю бы х т р ёх ф ункций / , g ,/i Е К х и лю бого х Е X , а это по определению
поточечн ы х операций д аёт ( / + g)h = f h + gh. С праведли вость в то р о го ди стри ­
бутивного закон а у стан авл и вается аналогично. Если 0 ,1 — нулевой и единичны й
элем енты в А , то
Ох : х 1-» 0, lx : х ^ 1
— постоянные ф ункции, играю щ ие роль нуля и единицы в К х . В случае ком м у­
т ат и в н о с ти К кольцо ф ункций К х т а к ж е ком м утати вн о.
К ольцо К х содерж и т разн ообразн ы е подкольца, определяемы е специальны ­
ми свой ствам и ф ункций. П усть, наприм ер, X = [0,1] — за м к н у ты й ин тервал в
К и К = К. Т огд а кольцо всех вещ ественны х ф ункций, определённы х на
[0,1], со держ и т в к ач естве подколец кольцо всех ограни ченны х ф ункций,
154 Гл. 4 • Группы. Кольца. Поля

кольцо Мнепр всех н епреры вн ы х ф ункций, кольцо М ^ ф всех непреры вно ди ф ф е­


ренцируем ы х ф ункций и т .д ., поскольку все отм еченны е свой ства сохраняю тся
при сложении (вы читан ии) и умнож ении ф ункций.
К аж д о м у числу а Е К о т в е ч а е т постоянная ф ункц ия а х : х ь-» а, и о то б р аж е ­
ние вложения а ь-» а х позволяет р а сс м ат р и в ат ь К к а к подкольцо в l A . Словом,
поч ти к аж дом у естественном у классу ф ункций с о о тв е тс тв у е т свое подкольцо
в Мх .
П р и м е р 4. Н а любой а д ди ти вн ой абелевой группе ( А , + ) соотнош ением
ху = 0 для всех х , у Е А у стан авл и вается с т р у к т у р а кольца с нулевым умно­
жением.
Многие свойства колец являются переформулировками соответст­
вующих свойств групп и вообще множеств с одной ассоциативной
операцией. Например, атап = am+n, (am)n = атп для всех неотри­
цательных целых ш ,п и всех а £ К (ср. с соотношением (2) § 1).
Другие свойства, более специфические для колец и вытекающие пря­
мо из аксиом кольца, моделируют по существу свойства Ъ. Отметим
некоторые из них. Во-первых, для всех а Е К
а • 0 = 0 • а = 0. (1)
Действительно, а + 0 = а = > а(а + 0) = аа = > а2 + а • 0 = а2 = >
= > а2 + а • 0 = а2 + 0 = > а • 0 = 0 (аналогично, 0 • а = 0).
Теперь, предположив на момент, что 0 = 1, мы получим а = аТ =
= а-0 = 0 для всех а Е К, т.е. К состоит только из нуля. Стало быть,
в нетривиальном кольце К всегда 0 ^ 1 . Далее,
(—а) • b = а(—Ь) = —(аЬ), (2)
поскольку, например, из (1) и аксиомы дистрибутивности следует
0 = а • 0 = а{Ь —Ъ) = ab + а(—Ъ) = > а(—Ъ) = —(аЪ). (3)
Так как —(—а) = а, то из (2) получаем равенства (—а)(—5) = аЪ
(например, (—1)(—1) = 1), —а = (—1) • а.
Аксиома дистрибутивности имеет своим следствием общий закон
дистрибутивности
п т
(ai + ... + an)(bi + ... + Ъш) = ЕЕ «А ’ (4)
i= l j= l

в чём нетрудно убедиться рассуждением по индукции сначала (при


т = 1) по п, а затем по т. Используя теперь (1), (2) и (3), получим
п{аЪ) = (па)Ъ = a(nb)
для всех п G Z и a , b Е АТ.
Наконец, отметим биномиальную формулу (бином Ньютона)
§ 3. Кольца и поля 155

справедливую для всех а, 5 Е К , но только в коммутативном кольце


К. При доказательстве (5) нужно, опираясь на (4), действовать так
же, как и в § 7 гл. 1, где рассмотрен частный случай К — Ъ.
2. Сравнения. Кольцо классов вы четов. Пусть т — фик­
сированное натуральное число, т > 1. Множество mZ, очевидно,
замкнуто не только относительно операции сложения, но и относи­
тельно операции умножения, и удовлетворяет всем трём аксиомам
кольца.
Теперь, используя подкольцо mZ С Z, построим ненулевое коль­
цо, состоящее из конечного числа элементов. С этой целью введём
О п р е д е л е н и е . Два целых числа п ,п 1 называются сравнимыми
по модулю ш, если при делении на т они дают одинаковые остатки.
При этом пишут п = п'(т) или п = пДтойш), а число т называют
модулем сравнения.
Получается разбиение Z на классы чисел, сравнимых между со­
бой по модулю т и называемых классами вычетов по модулю т.
Каждый класс вычетов имеет вид
{г}т = г 0 mZ = {г 0 тк \ к Е Z},
так что
Z = {0}m U {l}m U ... U {ш - 1}т . (6)
По определению п = п'(т) <0=> п — п 1 делится на т. Удобство
записи п = п'(т) для отношения делимости т\(п —п') состоит в том,
что с такими сравнениями можно оперировать совершенно так же,
как с обычными равенствами. А именно, если к = к'(т) и I = /'(ш),
то к ± I = к' ± Г(ш) и Ы = к'1'(т). В частности, к = fc'(m) /cs =
= k's(m) для любого s Е Z.
Таким образом, каждым двум классам {/с}т и {7}т независимо от
выбора в них представителей к, I можно сопоставить классы, являю­
щиеся их суммой или произведением, т.е. на множестве Ъш — Ъ/тЪ
классов вычетов по модулю т однозначным образом индуцируются
операции 0 и 0 :
{/t}m 0 {l^rn = \к + /}т ,
{k}m®{l}m = {kl}m.
Так как определения этих операций сводятся к соответствующим
операциям над числами из классов вычетов, т.е. над элементами из
Z, то {Zm, 0 , 0 } будет также коммутативным кольцом с единицей
{l}m = 1 0 mZ. Оно называется кольцом классов вычетов по моду­
лю т. При небольшом навыке (и фиксированном модуле) индекс т
опускают и пишут к вместо {&}т , так что
к0I= к0
к о 1 = Ы.
156 Гл. 4 • Группы. Кольца. Поля

Высший этап освоения с Zm, кажущийся на первый взгляд кощун­


ственным, но представляющий явные технические преимущества, за­
ключается в том, что отказываются от чёрточек и кружочков и опе­
рируют с каким-нибудь фиксированным множеством представителей
по модулю ш, чаще всего — с множеством {0,1, 2,..., т —1} (оно на­
зывается приведённой системой вычетов по модулю т). Скажем, в
соответствии с этим соглашением —к = т —к, 2(ш —1) = —2 = т —2.
Итак, конечные кольца существуют. Приведём три простейших
примера, указывая отдельно таблицы сложения и умножения:
+ 0 1 0 1
z 2 : 0 0 1 0 0 0
1 1 0 1 0 1

+ 0 1 2 0 1 2
0 0 1 2 0 0 0 0
Z 3 :
1 1 2 0 1 0 1 2
2 2 0 1 2 0 2 1

+ 0 1 2 3 0 1 2 з
0 0 1 2 3 0 0 0 0 0
Z4 : 1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1

Кольцо вычетов Ъш издавна привлекало внимание теоретико-чис-


ловиков, а в алгебре служило отправным пунктом для разного рода
обобщений.
3. Г ом ом орф изм ы колец. Отображение / : п н->> {п}ш обладает
в силу (7) следующими свойствами:
п к +i) = т © /( о , пы ) = т © /(/).
Это даёт нам основание говорить о гомоморфизме колец Ъ и Ъш в
соответствии с общим определением.
О п р е д е л е н и е . Пусть (КГ,+,-) и (КГ', 0 , 0 ) — кольца. Отобра­
жение f : К К ' называется гомоморфизмом, если оно сохраняет
все операции, т.е. если
f(a + V) = /(о) 0/ ( 6) ,
f(ab) = /(а) 0/ ( 6) .
При этом, конечно, /(0) = (У и /(па) = п/(а), п Е Z.
Ядром гомоморфизма / называется множество
Кег / = {а Е КГ | /(а) = 0'}.
Ясно, что Кег / — подкольцо в К.
§ 3. Кольца и поля 157

Как и в случае групп (см. словарик в п. 5 § 2), гомоморфизм


/ : К -Э К '
называется:
мономорфизмом, если Кег/ = 0;
эпиморфизмом, если образ совпадает с К 1 , т.е.
1 т / = /(К ) = {а' е К ' \ а ' = /(а)} = К';
изоморфизмом, если отображение / мономорфно и эпиморфно.
Факт изоморфизма колец кратко записывают в виде К = К ' .
Рассмотренное выше отображение / : п ь+ {п)т является, оче­
видно, эпиморфизмом Z —>Ъш с ядром Кег / = тЪ.
Если рассматривать только кольца с единицей, то в определение
гомоморфизма / : К -+ К ' целесообразно внести условие
/(1) = !'•
При эпиморфизме это условие, конечно, автоматически выполняется.
Изоморфные кольца тождественны по своим алгебраическим
свойствам, и подлинно математический интерес представляют толь­
ко те свойства колец, которые сохраняются при изоморфных отобра­
жениях. Именно это обстоятельство имелось в виду, когда кольцо Ъш
мыслилось то как множество классов вычетов по модулю ш, то как
множество произвольным образом выбранных представителей этих
классов.
4. Типы колец. Поле. В хорошо известных нам числовых коль­
цах Z, Q и Е из аЪ = 0 следует, что либо а — 0, либо b = 0.
Но кольцо квадратных матриц Мп над любым из указанных колец
этим свойством уже не обладает. Используя матрицы Eij (см. до­
казательство теоремы 4 из § 3 гл. 2), мы приходим к равенствам
EijEki = 0 при j ф &, хотя, конечно, / 0 и E^i ф 0. Заметим,
что EikEkj = ф 0. Можно было бы приписать столь необычный
для элементарной арифметики феномен некоммутативности кольца
Мп, но это не так. Как мы видели в п. 2, в коммутативном кольце
Z 4 выполнено равенство 2 0 2 = 0, вопреки общеизвестной истине
“дважды два — четыре”. Вот — ещё два примера.
П р и м е р 5. Ч исловы е пары (а, Ь) (где й, 6 G Z , Q , 1 ) со сложением и ум но­
ж ением, определённы ми ф орм улам и

(<Ч 0 1 ) + (^2 0 2 ) = (<Ч + О - 2 0 1 + 6 2 ),

0 1 0 0 • 0 2 02) = 0 1 0-2 0 0 2 ) ,

образую т, очевидно, к ом м утати вн ое кольцо с единицей (1 ,1 ), в котором мы снова


встречаем ся с тем же явлением: (1, 0) • (0 ,1 ) = (0, 0) = 0.
П р и м е р 6. В кольце вещ ественны х ф ункций (см. пример 3 в п. 1) ф у н к ­
ции / : х 1-» \х\ + х и д : х ^ \х\ — х так овы , ч т о f ( x ) = 0 для х ^ 0 и д(х) = 0 для
х 0, а поэтом у их п оточечн ы м произведением f g будет нулевая ф ункц ия, хотя
/ Ф 0 и д ф 0.
158 Гл. 4 • Группы. Кольца. Поля

О п р е д е л е н и е . Если аЪ = 0 при а / 0 и 5 / 0 в кольце К , то


а называется левым, а 5 — правым делителем нуля (в коммутатив­
ном кольце К говорят просто о делителях нуля). Сам нуль в кольце
К ф 0 — тривиальный делитель нуля. Если других делителей нуля
нет (кроме 0), то К называется кольцом без делителей нуля. Ком­
мутативное кольцо с единицей 1 ф 0 и без делителей нуля называют
целостным кольцом (кольцом целостности или областью целост­
ности).
Т е о р е м а 1. Нетривиальное коммутативное кольцо К с едини­
цей является целостным тогда и только тогда, когда в нём выпол­
нен закон сокращения
ab = ас, аф 0 = > Ъ— с
для всех а,Ъ,с Е К.
В самом деле, если в К имеет место закон сокращения, то из
аЪ = 0 = а • 0 следует, что либо а — 0, либо а ф 0, но b = 0. Обратно:
если К — область целостности, то
ab = ас, аф 0 = > а(Ь —с) = 0 = > = > Ъ—с — 0 = > Ъ— с. □
В кольце К с единицей естественно рассматривать множество
обратимых элементов. Элемент а называется обратимым (или дели­
телем единицы), если существует элемент а-1 , для которого аа-1 =
= 1 = а-1 а. Точнее, следовало бы говорить об элементах, обрати­
мых справа или слева (ab = 1 или Ъа = 1), но в коммутативных
кольцах, а также в кольцах без делителей нуля эти понятия совпада­
ют. Действительно, из ab = 1 следует aba = а, откуда a(ba — 1) = 0.
Так как а ф 0, то Ъа —1 = 0, т.е. ba = 1.
Нам известно, например, что в кольце Мп обратимые элемен­
ты — это в точности матрицы с отличным от нуля определите­
лем. Обратимый элемент а не может быть делителем нуля:
ab = 0 = > a~l (ab) = 0 = > (а~1 а)Ь = 0 = > 1-5 = 0 = > 5 = 0
(аналогично, Ъа = 0 5 = 0). Неудивительно поэтому, что имеет
место
Т е о р е м а 2. Все обратимые элементы кольца К с единицей
составляют группу U(K) по умножению.
В самом деле, так как множество U[K) содержит единицу, а Е
Е U{К) = > а-1 Е U{К) и ассоциативность по умножению в К вы­
полнена, то нам нужно только убедиться в замкнутости множества
U{К), т.е. проверить, что произведение аЪ любых двух элементов
а и 5 из U{К) будет снова принадлежать U(K). Но это очевидно,
поскольку
(а5)-1 = b~1 a ~ 1 (ab • b~1 a ~ 1 = a(bb~1 )a ~ 1 = а • 1 • а-1 = аа-1 = 1),
и, значит, ab обратим. □
§ 3. Кольца и поля 159

Нетрудно видеть, что U(Z) = {±1} — циклическая группа по­


рядка 2.
Мы получим весьма интересный класс колец — так называемые
кольца с делением, или тела, заменив в определении кольца аксиому
К2) на существенно более сильное условие
К2') относительно операции умножения множество К = К \ {0}
является группой.
Кольцо с делением, стало быть, всегда без делителей нуля, и каж­
дый ненулевой элемент в нём обратим. Операции сложения и умноже­
ния становятся почти полностью симметричными в коммутативном
кольце с делением, которое называется полем.
Итак, дадим ещё раз
О п р е д е л е н и е . Поле Р — это коммутативное кольцо с еди­
ницей 1 / 0, в котором каждый элемент а / 0 обратим. Группа
Р* = U(P) называется мультипликативной группой поля.
Поле представляет собой гибрид двух абелевых групп — адди­
тивной и мультипликативной, связанных законом дистрибутивности
(теперь уже одним ввиду коммутативности).
Произведение аЪ~х записывается обычно в виде дроби (или от­
ношения, частного) которую для экономии места на бумаге запи­
сывают ещё с помощью косой черты: а/Ъ. Следовательно, дробь а/5,
имеющая смысл только при Ъф 0, является единственным решением
уравнения Ъх = а.
Действия с дробями подчиняются нескольким правилам:
а
ad = 5с, 5, d ф 0,
Ъ
а с ad + Ъс
5, d ф 0,
b + d = bd
а —а а
Ъф о, ( 8)
Ъ = ~Ь~
а с ас
5, d ф 0,
Ъ d bdJ
а, b ф 0.
Это — обычные, “школьные” правила, но их надо не запоминать,
а выводить из аксиом поля, что, впрочем, не представляет никаких
трудностей. Вот рассуждения, достаточные для получения второго
из правил (8). Пусть х — а/Ъ и у = c/d — решения уравнений Ъх = а
и dy = с. Из этих уравнений следует

dbx = da, bdy = be = > bd(x + у) = da + be = > t = x + у =


bd
— единственное решение уравнения bdt = da + be.
160 Гл. 4 • Группы. Кольца. Поля

Подполем F поля Р называется подкольцо в Р, само являю­


щееся полем. Например, поле рациональных чисел Q — подполе поля
вещественных чисел Е.
В случае F С Р говорят также, что поле Р является расшире­
нием своего подполя F. Из определения подполя следует, что нуль
и единица поля Р будут содержаться также в F и служить для F
нулём и единицей. Если взять в Р пересечение F\ всех подполей, со­
держащих F и некоторый элемент а Е Р, не принадлежащий Р, то
Pi будет минимальным полем, содержащим множество {F, а} (рас­
суждение такое же, как для групп в упр. 1 из § 2).
Говорят, что расширение Pi поля Р получено присоединением к Р
элемента а, и отражают этот факт записью Pi = Р(а). Аналогично
можно говорить о подполе Pi = F ( a i , . . . , a n) поля Р, полученном
присоединением к Р п элементов сд,..., ап поля Р.
Н ебольш ая п роверк а п о к азы в ает, ч т о Q (\/2 ) совп ад ает с м нож еством чисел
а + Ър 2, где a, b Е Q, поскольку ( \ /2 ) 2 = 2 и
1 о» b г—
а + 6 \/2 а 2 — 262 а 2 — 262

при а + Ьф2 ф 0. То же самое о тн оси тся к 0 ( У 3), Q (x/5) И т .д .


Поля Р и Р / называются изоморфными, если они изоморфны как
кольца. По определению /(0) = (У и /(1) = 1' для любого изоморф­
ного отображения /. Не имеет смысла говорить о гомоморфизмах
полей, так как
Ker f Ф 0 = > / (а) = 0, аф 0 ^
=*- /(!) = /( а а -1 ) = /( а ) /( а -1 ) = 0 • / ( а -1) = 0 = >
= > V6 /(Ь) = /(1 • Ъ) = f(l)f(b) = 0 • № = 0 = * К ег/ = Р.
Напротив, автоморфизмы, т.е. изоморфные отображения поля Р на
себя, связаны с самыми глубокими свойствами полей и являются
мощным инструментом для изучения этих свойств в рамках так на­
зываемой теории Галуа.
Понятие расширения полей вполне созвучно известному стремле­
нию человечества увеличивать запас используемых чисел. Довольно
медленный процесс, который условно изображается диаграммой
{один} ^ {один да один есть два} {N, 0} ^
'W 2л (Q) 'W Q(x/2) "WЕ
и который продолжался вплоть до наших дней, привёл к чрезвычайно
разветвлённой сети полей, весьма далеких от привычных числовых.
Не все этапы этого процесса были чисто алгебраическими. Скажем,
переход от рациональных чисел к вещественным (или действитель­
ным), основывающийся на понятии непрерывности и полноты (су-
§ 3. Кольца и поля 161

ществование пределов у последовательностей Коши), и поныне раз­


бирается в курсах математического анализа. В то же время совер­
шенно аналогичная конструкция полей р-адических чисел, которой
мы здесь не касаемся, и выросший на её основе современный р-ади-
ческий анализ — достойные детища трёх областей — теории чисел,
алгебры и анализа.
5. Х а р а к т ер и ст и к а поля. В п. 2 было построено конечное
кольцо классов вычетов Ъ ш с элементами
О, 1, 2, ..., т —1
и операциями к + I = к + I, к • I = Ы сложения и умножения (мы
отказываемся от значков 0 и 0 ) . Если т = st, s > 1, t > 1, то
s • t = fh = 0, т.е. s и t — делители нуля в Ъ ш .
Пусть теперь т = р — простое число. Утверждается, что Ъ р —
поле (из р элементов). Для р = 2,3 это непосредственно видно из
таблиц умножения, выписанных в п. 2. В общем случае достаточно
установить существование для каждого s Е Z* обратного элемента
s' (целые числа s и s' не должны, очевидно, делиться на р).
Рассмотрим элементы
s ,2 s , (р - 1)8. (9)
Они все отличны от нуля, так как
s ^ 0 (modp) = > ks ^ 0 (modp)
при к = 1, 2,... ,р —1. (Здесь используется простота р.) По той же
причине элементы (9) все различны: из ks = Is, к < следовало бы
(к —l)s = 0, что неверно. Итак, последовательность элементов (9)
совпадает с последовательностью переставленных каким-то образом
элементов
1, 2, ..., р - 1.

В частности, найдется s', 1 ^ s' ^ р —1, для которого s's = 1. Но это


значит, что s's = 1, т.е. s' — обратный к s элемент. Нами доказана
Т е о р е м а 3. Кольцо классов вычетов Ъ ш является полем тогда
и только тогда, когда т = р — простое число.
С л е д с т в и е (малая теорема Ферма). Для любого целого числа
ш, не делящегося на простое число р, имеет место сравнение
т р~ 1 = 1 (modp).
Д о к а з а т е л ь с т в о . Как мы видели,
{ т , 2т , ( р - 1) т } = {1,2,..., р - 1}
(заменить в (9) s на m и принять во внимание равенства km =
= km , k = 1, . . . , р —1). Поэтому, перемножая по отдельности все
11 А .И. К о стр и к и н
162 Гл. 4 • Группы. Кольца. Поля

элементы в левой и правой части, получим


(р - 1 \ р -1

ш = Ш
\к = 1 / fc=l

Поскольку Zp — кольцо без делителей нуля, по теореме 1 множитель


Пк = 1 к Ф б можно сократить: тр~1 = 1. На языке сравнений имеем
то, что нужно. □
Справедлива более общая теорема Эйлера, но необходимость в
ней возникнет лишь в [ВА III].
Поля Z 2 , Z 3 , Z 5 , . .., столь не похожие на известные нам поля Q,
<Щл/2), М, заняли в алгебраической иерархии полей место, вполне
сопоставимое по своему значению с местом, давно отведённым для Q.
Дело здесь вот в чём. Пусть Р — поле. Как мы уже отмечали, пе­
ресечение Pi любого семейства подполей {Pi\i G 1} будет под­
полем в Р.
О п р е д е л е н и е . Поле, не обладающее никаким собственным под­
полем, называется простым.
Т е о р е м а 4. В каждом поле Р содержится одно и только одно
простое поле Ро. Это простое поле изоморфно либо Q, либо Z p для
некоторого простого р.
Д о к а з а т е л ь с т в о . Допустив существование двух различных
простых подполей Р ',Р " С Р, мы неизбежно придём к выводу, что
их пересечение Р' П Р" (очевидно, непустое, поскольку 0 и 1 содер­
жатся как в Р ', так и в Р") будет полем, отличным от Р 1 и Р ".
Это, однако, невозможно ввиду их простоты. Стало быть, простое
подполе Ро С Р единственно.
В P q наряду с единичным элементом 1 содержатся все его крат­
ные 77/ • 1 —1 Т ... Т 1« Из общих свойств операций сложения и умно­
жения элементов в кольцах (см. конец п. 1) следует, что
s • 1 + t • 1 = (s + t) • 1, (s • l)(t • 1) = (st) • 1; s ,t G Z.
Поэтому отображение / кольца Z в P, определённое правилом f(n ) =
= п • 1, является гомоморфизмом, ядро которого имеет вид Кег/ =
= m Z. Если т = 0, то / — мономорфизм, и дроби (s • 1) / (t • 1), имею­
щие смысл в Р (поскольку Р — поле), образуют поле Ро, изоморф­
ное Q. Оно и будет простым подполем в Р.
Если же т > 0, то, очевидно, отображение /*, определённое по
правилу
/*: fc = {fc}m ->/(*),
будет изоморфным вложением Zm —у Р. По теореме 3 это возможно
только тогда, когда т = р — простое число. Стало быть, /* (Zp) —
простое подполе в Р. □
О п р е д е л е н и е . Еоворят, что поле Р имеет характеристику
нуль, если его простое подполе Ро изоморфно Q; Р — поле простой
§ 3. Кольца и поля 163

(или конечной) характеристики р, если Ро = Ър. Соответственно


пишут charP = 0 или charP = р > 0.
Вместо Ър обозначением “абстрактного” поля из р элементов слу­
жит обычно Fр или GF(р) (Galois Field — поле Галуа). Следует иметь
в виду, что существует конечное поле GF(q) с q = рп элементами, где
р — простое, а п — любое целое положительное число. К этому инте­
ресному вопросу мы вернёмся в [ВА III], а сейчас ограничимся лишь
примером поля из четырёх элементов {0,1, а,/3}:
+ 0 1 а /3 0 1 а /3
0 0 1 а /3 0 0 0 0 0
1 1 0 Р а 1 0 1 а /3
а а /3 0 1 а 0 а /3 1
/3 /3 а 1 0 /3 0 /3 1 а
Чем являются а и /3, нас пока не интересует. Рекомендуется прове­
рить выполнение закона дистрибутивности.
Иногда нулевую характеристику называют бесконечной в соот­
ветствии с её интерпретацией как порядка элемента 1 в аддитивной
группе поля Р. Аналогично, конечная характеристика р — общий
порядок любого ненулевого элемента в аддитивной группе:
рх = X + ...+ X = 1-Ж + ... + 1- Ж=(1 + . . . + 1 )х = (р • 1 )х = 0.
6. З а м еч а н и е о л инейны х си стем ах. Настала пора окинуть
мысленным взором изложенную в предыдущих главах теорию систем
линейных уравнений и выросшую из неё теорию определителей. Ко­
эффициентами в линейных уравнениях и элементами матриц у нас
были числа (рациональные или вещественные), но специфика этих
чисел никак не использовалась. Нет никаких препятствий к тому,
чтобы взять теперь вместо чисел элементы фиксированного поля Р.
При этом и результаты должны формулироваться в терминах поля
Р: компоненты решения линейной системы и значения функции det
будут лежать в Р. Метод Гаусса решений систем линейных уравне­
ний, теория определителей, правило Крамера остаются справедливы­
ми (без существенных изменений) для произвольного поля Р.
П р и м е р 7 . Пусть нам дана однородная система линейных уравнений А Х =
= 0 с квадратной матрицей
1 2 3 4
-1 0 13 14 15
12 -9 14 15
12 13 -8 15

и столбцом неизвестных X = [яд, Ж2, жз, Ж4]. Прямые вычисления показывают,


что det А = 2 3 • I I 3 . Следовательно, при Е Р , где Р — любое поле ха­
рактеристики нуль или характеристики р ф 2,11 (в этом случае целые числа
1, 2 , 3 , 4 , —1 0 , . . . , 15 заменяются на соответствующ ие классы вычетов), система
является определённой и имеет только тривиальное решение X — 0.

11
164 Гл. 4 • Группы. Кольца. Поля

Если ch a rP = 2 (скажем, Р = Z 2), то из сравнения

1 2 3 4 1 0 1 0
-10 13 14 15 0 1 0 1 (mod 2)
12 -9 14 15 — 0 1 0 1
12 13 -8 15 0 1 0 1
мы заключаем, что ранг системы равен 2 и система допускает два независимых
решения Х \ = [1 ,0 ,1 ,0 ], Х 2 = [0 ,1 ,0 ,1 ]. Во избежание недоразумений следова­
ло бы писать Х \ = [1 ,0 ,1 ,0 ], Х 2 = [0 ,1 ,0 ,1 ], но мы считаем себя достаточно
подготовленными к восприятию упрощённой записи.
Если charP = 1 1 , то из сравнения
1 2 3 4 1 2 3 4
-10 13 14 15 1 2 3 4
(mod 11)
12 -9 14 15 — 1 2 3 4
12 13 -8 15 1 2 3 4
вытекает, что система имеет три независимых решения

Х г = [9 , 1 , 0 , 0 ], Х 2 = [8 , 0 , 1 , 0 ], Х 3 = [7 , 0 , 0 , 1 ].

Как мы видим, ответ о числе решений существенно зависит от


рассматриваемого поля Р, но анализ системы ничем не отличается
от обычного. Стало быть, одно из преимуществ перехода от Е и
Q к произвольному полю заключается в устранении дублирования
сходных рассуждений. Но имеются к тому и более веские причины.
Говоря о полной линейной группе, мы до сих пор считали её груп­
пой всех невырожденных матриц с коэффициентами из Q или Е. Со­
вокупность квадратных матриц порядка п с коэффициентами в про­
извольном поле Р составляет кольцо матриц МП(Р), а подмножест­
во всех невырожденных матриц А Е Мп(Р) (матриц с detA ф 0)
приводит к понятию полной линейной группы GLn(P) над полем Р .
Варьируя поле Р, например, полагая Р = Fp, можно естественным
путем получить ряд важных групп (см. [ВА III]).
Поля типа Е, Q, Q(^/2) и прочие называются обычно числовыми
полями. Поле ¥р — пример нечислового поля: было бы неправильным
называть его элементы числами лишь на том основании, что они
часто отождествляются с элементами множества {0,1,... ,р —1}.
В § 2 гл. 1 ставилась задача (под номером 3) по использованию ко­
нечных полей в теории кодирования. Мы приведём сейчас маленький
пример на эту тему.
П р и м е р 8. Для передачи лозунга М ИРУ МИР в принципе достаточно
повторения четырёх элементарных сообщений

М = ( 0 , 0 ), И = ( 1 , 0 ), Р = (0 ,1 ), У = ( 1 , 1 ),
интерпретируемых как векторы-строки двумерного линейного пространства Fg
над полем F2 = Z 2 = { 0 , 1 } из двух элементов. Но во время передачи в канале
связи возникают помехи (замены символа 0 на 1 или 1 на 0), в результате ко­
торых на приёмный конец канала может прийти, например, сообщение РИМ У
РИМ . Согласно фундаментальной теореме Ш еннона за счёт увеличения длины
§ 3. Кольца и поля 165

элементарных сообщений (т.е. за счёт скорости передачи) влияние помех устра­


нимо. Пусть, скажем, из условий передачи известно, что в каждом элементарном
сообщении длины 5 происходит не более одного искажения. Возьмём тогда в
линейном пространстве S = F | подмножество
So = {М = (0, 0 ,1 ,1 ,0 ), И = (1 ,0 , 0 ,1 ,1 ), Р = (0 ,1 ,1 , 0 ,1 ), У = (1 ,1 , 0, 0,0)}
так называемых ко д о в ы х в ект ор ов. Из таблицы

Кодовые векторы 00110 10011 01101 11000


Векторы, получаемые из 00010 00011 00101 01000
кодовых векторов в ре­ 00100 10001 01001 10000
зультате искажения 00111 10010 01100 11100
01110 10111 01111 11001
10110 11011 11101 11010
видно, что множества искажённых векторов из разных столбцов не пересека­
ются, и, стало быть, возможно правильное декодирование, т.е. восстановление
истинного сообщения.
Мы получили код So, исправляющий одну ошибку. Переходя к пространствам
Fg достаточно большой размерности п, можно сконструировать аналогичный
код, способный безошибочно передать весь русский алфавит, т.е. любой текст.
Чтобы декодирование не свелось к длительному и очень медленному перебору,
So приходится выбирать специальным образом. Для этого сущ ествует множество
приёмов, в том числе и чисто алгебраических, основанных на использовании ко­
нечных полей Fg.

У П РА Ж Н Е Н И Я

1. Развивая идею примера 2 из § 1, показать, что множество V ( y i ) с опера­


циями
А + В = (A U В) \ ( А П В), АВ = А П В , А, В е П,
является кольцом с единицей, все элементы аддитивной группы которого имеют
порядок 2 .
2. Установить коммутативность произвольного кольца, в котором каждый
элемент х удовлетворяет уравнению ж2 = х. Верно ли это при условии ж3 = ж?
3. Изоморфны ли поля Q (\/2), Q (\/5)?
4. П оказать, что эпиморфный образ коммутативного кольца является ком­
мутативным кольцом.
5. П оказать, что любое конечное целостное кольцо К является полем.
6 . Пусть р — простое число и К — коммутативное кольцо с единицей такое,
что рх = 0 для всех ж Е К . П оказать, что тогда
(ж + у)р — хр + ур , т — 1 ,2 ,...
У к а з а н и е . Использовать индукцию по т и то обстоятельство, что бино­
миальный коэффициент ^ j Q , 0 < к < р, делится на р.
7. Доказать, что кольцо К , состоящее из пяти элементов, либо изоморфно
Z 5 , либо является кольцом с нулевым умножением.
8. Элемент ж ^ 0 кольца К называется н и л ъ п о т е н т н ы м , если х п = 0 для
некоторого п Е N. П оказать, что:
1 ) нильпотентность элемента ж влечёт обратимость элемента 1 —ж в любом

кольце с единицей;
166 Гл. 4 • Группы. Кольца. Поля

2) кольцо Ъ гп — Ъ / т Ъ содерж и т ни лы ю тен тн ы е элем енты в т о ч н о сти то гд а ,


к огд а т делится на к в а д р а т н ату р ал ьн о го числа > 1.
9. Д о к а за ть , ч т о в кольце К с единицей и бесконечной мощ ности \К\ не
м ож ет б ы ть конечного числа п <С 1 н еобрати м ы х элементов ф 0.
У к а з а н и е . И спользовать рассуж дение о т проти вн ого. П усть N = { « г ,. ..
. . . , а п } — м нож ество всех ф 0 н еобрати м ы х элементов кольца К . О тображ ени е
рх - ai xai явл яется биекцией N N для лю бого х Е К \ (N U {0}). Я д р о К е гр
о тображ ен и я р: х \—>рх бесконечно.
10. П усть К — произвольное ассоциативное кольцо с единицей 1 и а, b — его
элементы . П о к а за ть , что

(1 — аЪ)с = 1 = с(1 — аЪ) ==> (1 — ba)d = 1 = d( 1 — 6а),

где d = 1 + бса, т.е. о б р а ти м о сть 1 — ab в К влечёт о б р а ти м о ст ь 1 — Ьа. Ч ем у


равен элемент 1 + adb?
а Ъ
1 1 . П о к а за ть , ч т о м атри ц ы , где Ь G ^3) образую т поле из девяти
-Ь а
элементов и ч т о м у л ьти п л и к ати вн ая гр у п п а это го поля ци кли ческая п оряд ка 8.
12 . С пособен ли код So (из при м ера 2 в конце п а р агр а ф а) и сп рав и ть две
ош ибки?
Глава 5
КОМ ПЛЕКСНЫ Е ЧИСЛА
И М Н О ГО Ч Л ЕН Ы

В этой главе будут рассмотрены вполне конкретные алгебраи­


ческие системы, частично известные из школьной математики, но
заслуживающие того, чтобы остановиться на них несколько подроб­
нее. Точка зрения, выработанная в предыдущей главе, позволит нам
бросить свежий взгляд на традиционное “поле деятельности” ал­
гебры прошлых веков. В то же время на примере многочленов станут
более понятными и осязаемыми такие проблемы, как расширение ко­
лец и однозначность разложения на простые множители в целостных
кольцах (областях целостности).

§ 1. П оле ком плексны х чисел


История математики отмечена длительной борьбой сторонников
и противников “мнимых” чисел, источником которых служит ал­
гебраическое уравнение
ж2 + 1 = 0. (1)
Можно занять упрощенную позицию и ограничиться формальной за­
писью решений уравнения (1) в виде =Ьд/—1. Но такое немудрено было
сделать и в более далёкие времена; оставалось лишь придать смысл
указанной записи. Мы будем решать эту задачу на разных уровнях.
Вначале приведём некоторые эвристические соображения.
1. В сп ом огател ь н ая кон струк ци я. Нам хочется расширить
поле вещественных чисел Е так, чтобы в новом поле уравнение (1)
обладало решением. Моделью такого расширения может служить
множество Р всех квадратных матриц
а Ъ
е м 2(Е). (2)
-Ъ а
Утверждается, что Р — поле (ср. с упр. 11 из § 3 гл. 4).
В самом деле, в Р содержатся нуль 0 и единица Е кольца М2(Е).
Далее, из соотношений
а Ъ с d а+ с b+ d
—Ъ а + —d с — - ( b + d) а + с

а Ъ —а —Ъ
—Ъ а ~{~Ъ) -а (3)

а b с d ас —bd ad + be
—Ъ а —d с —(ad + be) ас —bd
168 Гл. 5. Комплексные числа и многочлены

вытекает замкнутость Р относительно операций сложения и умно­


жения. Ассоциативность этих операций является следствием их ас­
социативности в М2(Е). Т о же самое относится к законам дистри­
бутивности и коммутативности сложения. Таким образом, Р —
подкольцо в М2(Е). Коммутативность умножения в Р вытекает из
третьей формулы (3), и остаётся доказать лишь существование в Р
матрицы, обратной к любой матрице (2) с определителем а2 + Ъ2 ф 0.
Прямо по формуле для коэффициентов обратной матрицы (см. тео­
рему 1 из § 3 гл. 3) или путём решения линейной системы
ах —by = 1,
bx + ау = 0,
возникающей из условия
а Ь X У 1 0
-Ъ а -у X 0 1
находим, что
-1
а Ь с d
-Ь а -d с (4)
где
а -Ъ
d=
а2 + 62 ’ а2 + Ъ2
Используя правило (5) из § 3 гл. 2 умножения матриц на числа,
мы любой элемент поля Р запишем в виде
а Ъ 0 1
аЕ -\- bJ, a, b £ Е, J (5)
—Ъ а -1 0
Поле Р содержит подполе {аЕ \ а £ Е} = Е, а соотношение
J2+ Е = 0
показывает, что элемент J £ Р “с точностью до изоморфизма” явля­
ется решением уравнения (1). Ни о какой мистике вокруг “мнимой
величины J ” здесь не может быть и речи.
Не поле Р, однако, называется полем комплексных чисел, а некий
изоморфный ему объект, элементы которого изображаются точка­
ми плоскости. Желание иметь геометрическую реализацию поля Р
не случайно, если вспомнить, что и поле Е для нас не отделимо от “ве­
щественной прямой” с фиксированной на ней точкой, изображающей
0, и фиксированным масштабом, определяемым положением числа 1.
2. П лоск ость ком плексны х чисел. Итак, мы хотим постро­
ить поле С, элементы которого были бы точками плоскости Е2, а
сложение и умножение точек, подчиняясь всем правилам операций
в поле, решали бы нашу задачу. Выберем на декартовой плоскости
§ 1. Поле комплексных чисел 169

прямоугольную систему координат с осью абсцисс х и осью ординат


у. Будем писать (а, b) для точки с абсциссой а и ординатой Ъ. Для
точек (а, Ъ) и (с, d) определим сумму и произведение по правилам
(а,Ь) + (c,d) = (ci + c,b + d),
(6 )
(а, b) (с, б?) = (ас —bd, ad + be)
(использование тех же знаков + , •, что и в поле Е, не должно при­
водить к путанице). Прямая, но довольно утомительная проверка
убедила бы нас в том, что так определённые операции наделяют мно­
жество пар (точек плоскости) строением поля с нужными свойства­
ми. В этой проверке, к счастью, нет необходимости. Сопоставление
а ъ
-Ъ а
точкам плоскости С элементов построенного ранее поля Р и беглый
взгляд на формулы (3) и (6) убеждают нас в том, что мы имеем дело
с изоморфизмом и что, следовательно, множество С является полем.
Оно и называется обычно полем комплексных чисел. Имея в виду гео­
метрическую реализацию этого поля, С называют ещё плоскостью
комплексных чисел (а чаще, хотя и несколько двусмысленно, — комп­
лексной плоскостью).
Выбранная нами ось абсцисс, т.е. множество точек (а, 0), ничем
не отличается по своим свойствам от вещественной прямой, и мы
полагаем (а, 0) = а. Нуль (0,0) и единица (1,0) поля становятся при
этом обычными вещественными числами. Для точки (0,1) на оси
ординат вводится, со времён Эйлера и Гаусса, обозначение i “мни­
мой единицы”, являющейся корнем уравнения (1): г2 = (0,1)(0,1) =
= (—1,0) = —1. Произвольное комплексное число z = (х,у) = (ж,0) +
+ (0,1)(г/, 0) запишется теперь в традиционном виде
z — x P iy , х,у е Е, (7)
весьма близком к виду (5) элементов поля Р. Заметим, что Q С Е С
С С. Поэтому С — поле нулевой характеристики (см. п. 5 § 3 гл. 4).
3. Г ео м етр и ч еск о е истолковани е дей стви и с ком плекс­
ны ми числами. Ось абсцисс плоскости С обычно называется
вещественной (или действительной) осью,
ось ординат — мнимой осью, а числа iy,
лежащие на ней, — чисто мнимыми числа­
ми, хотя слово “мнимое” и утратило свой
первоначальный смысл. Соответственно в
записи (7) х = Rez — вещественная часть,
а у = lm z — мнимая часть комплексного
числа 2 . Рассмотрим отображение, которое Рис. 18
сопоставляет каждому комплексному числу z = х + iy комплексно
170 Г л. 5. Комплексные числа и многочлены

сопряжённое с ним число z = х —iy (операция комплексного сопря­


жения). Геометрически оно сводится к отражению плоскости С от­
носительно вещественной оси (рис. 18). Весьма примечательно, что
справедлива
Т е о р е м а 1. Отображение z ^ ~2 является автоморфизмом
порядка 2 поля С, оставляющим на месте все вещественные чис­
ла. Сумма и произведение комплексно сопряжённых чисел являются
вещественными числами.
Д о к а з а т е л ь с т в о . Утверждение х = ж, х Е R, очевидно из
определения комплексно сопряжённого числа. В частности, 0 = 0
и 1 = 1. Столь же очевидно утверждение о порядке: (z) = z. Нам
остаётся проверить соотношения
21 + 22 = Zi + Z2, ZTZ5=Z1Z2, (8)
но они прямо следуют из формул (6), которые нужно только перепи-
сать в виде
(х\ + iyi) + {х2 + 1 У2 ) — (Х 1 + Х2) + i(yi + 2/2 ),
(9)
(x i + i y i ) •(х2 + гу2 ) = (Х 1 Х 2 - У 1 У 2 ) + i ( x i y 2 + x 2y i ) .

Частным случаем формул (9) является утверждение о сумме и


произведении числа z = х + iy и комплексно сопряжённого с ним
числа z: z + z = 2ж, zz = x 2 + y 2. □
З а м е ч а н и е . Автоморфизм z \-Л ~z выделяется среди многих
других автоморфизмов поля С тем, что он — единственный непре­
рывный автоморфизм (переводящий близкие точки плоскости С в
близкие). Мы не уточняем и не доказываем это утверждение.
Модулем комплексного числа z = x+ iy называется неотрицатель­
ное вещественное число \z\ = = \J х 2 + У2• Положение точки z
на плоскости, как известно, вполне определяется заданием её поляр­
ных координат: расстояния г = \z\ от начала координат до z и угла
ер между положительным направлением оси абсцисс и направлением
из начала координат на z (см. рис. 18). Угол р называется аргумен­
том числа 2 и обозначается argz = р. По определению argz может
принимать любые положительные и отрицательные значения, но при
заданном г углы, отличающиеся на целое кратное 2тт, соответству­
ют одному и тому же числу. Аргумент не определён для числа 0 с
модулем |0| = 0.
Отношения “больше” или “меньше” бессмысленны в применении
к комплексным числам, т.е. их нельзя соединять знаком неравен­
ства: в отличие от вещественных чисел, аргумент которых прини­
мает лишь два главных значения — 0 (положительные числа) и тг
(отрицательные числа), — комплексные числа не упорядочены.
§ 1. Поле комплексных чисел 171

Более точно, на С не существует отношения > со свойствами:


i) если z е С, то z > 0 , z = 0 или —2: > 0;
ii) из и > 0, v > 0 следует, что u + v > 0 h u v > 0 .
Действительно, в противном случае из z ф 0 следовало бы (как и
в М) г2 > 0. В частности, I 2 > 0, г2 > 0 и согласно п) 0 = г2 +1 > 0 —
противоречие.
Полярные координаты г и ср определяют х и у по известным фор­
мулам
х — тcos(p, y = rsiiup, 2: = г (cos (р + i shop). (10)
Это — так называемая тригонометрическая форма числа z.
Операция сложения комплексных чисел z^z 1 просто выражается
в декартовых координатах, а
именно по правилу параллело­
грамма, или, что равносильно,
по правилу сложения направлен­
ных отрезков (векторов), вы­
ходящих из начала координат
и соответствующих числам z ,z l
(рис. 19). Из рис. 19, сравнивая
стороны треугольника с верши­
нами в точках 0,z и z + z' (и
отождествляя модули комплекс­ Рис. 19
ных чисел с соответствующими геометрическими длинами), полу­
чаем важное неравенство
|* + * ' К И + И - (11)
Заметим, что неравенство (11), которое можно было бы записать
в более общей форме
И - И ^ ± * ' К И + И,
совершенно аналогично соответствующему неравенству для веще­
ственных чисел.
Операция умножения комплексных чисел удобно выражается в
полярных координатах.
Т е о р е м а 2. Модуль произведения комплексных чисел z, z 1 равен
произведению модулей, а аргумент — сумме аргументов множите­
лей:
\zz'\ = \z\ • \z'\, diigzz' = arg 2: + arg 2:/. (12)
Аналогично,
2 * = arg 2: —arg 2:/.
arg —
7 z'
172 Г л. 5. Комплексные числа и многочлены

Д о к а з а т е л ь с т в о . Действительно, пусть тригонометрической


формой (10) для z и z' будет
z = г (cos (р + i sin (р), z 1 — т1 (cos p> + i sin ip').
Непосредственным умножением или же по формуле (9) получаем
zz' = тт' [(cos ip cos ip1 —sin ip sin cp') + i(cos ip sin cp' + sin cpcos cp')],
а это соотношение при помощи известных формул приводит к три­
гонометрической форме числа zz':
zz' = \z\ • \z'\ • [cos(<p + cp') + i sin(ip + cp')].
Если, далее, z" = z / z f, то z = z 'z" . Поэтому, используя доказанные
формулы (12) для произведения z rz n,
мы получим из них формулы для дроби
z/z'. □
В частности,
г-1 = ы -1 cos(—р) + г sin(—ip)\.
Чтобы получить z-- i" на комплекс­
ной плоскости (рис. 20), надо, сле­
довательно, применить к z инверсию
относительно окружности единичного
радиуса с центром в 0 (это даст точ­
ку z f), а затем — отражение относительно вещественной оси (или
автоморфизм z' \-t~z').
Фактически утверждения о модуле произведения и модуле сум­
мы легко вытекают без обращения к геометрической интуиции из
теоремы 1. В самом деле, во-первых,
\zz , \2 = z z 1z z 1 — z z 1zz 1 — zzz 1z 1 — z\ 2 \z'\2,
откуда \zz'\ = |.г|-|.г'|- Далее, заметив, что \z\ = \ / х 2 + у 2 ^ у/х^ = \х\,
мы получаем
|1 + z \2 = (1 + z){ 1 + z) = 1 + (z + z) + 2:2: =
= 1 + 2 x + \z\2 ^ 1 + 2 \z\ + \z\2 = (1 + |z|)2,
откуда |1 + z\ ^ 1 + \z\. Если теперь z ф 0 и z' ф 0, то
\z + z'\ = \z(l + Z~l z')\ = \z\ • |1 + z~ l z'\ ^
^ 1^1•(1 + k-^'l) = k|(i + k l-1!^!) = kl + k'|.
Из полученных результатов мы можем извлечь некий общий прин­
цип: обычная форма (7) комплексных чисел приспособлена к выраже­
нию их аддитивных свойств, а тригонометрическая форма (10) — к
§ 1. Поле комплексных чисел 173

выражению мультипликативных свойств. Нарушение этого принци­


па приводит к чрезвычайно сложным формулам, затуманивающим
суть дела.
4. В о зв ед ен и е в степ ен ь и извлечени е корня. Из формулы
(12) для умножения комплексных чисел, заданных в тригонометри­
ческой форме, вытекает формула Муавра
[г(cos р + i sin р)]п = rn(cos mp + i sin mp), (13)
справедливая для всех n E Z (в иной записи \zn\ = |z|n, argzn =
= n • arg z). Частный случай формулы (13) при г — 1, биномиальная
формула ( 1 ) и з § 7 г л . 1 и соотношения
г2 = -1 , г3 = -г, г4 = 1, iik+l = il
дают возможность получить выражения для синусов и косинусов
кратного угла:
cos тир = ^ ( —1 )к (^2 ^ ) cosn~2k *sin2/e Ф,
о
(14)
cosn 1 2к psin 2k+1 р.

Справедливости ради стоит заметить, что частным случаем фор­


мул (14) при п = 2 мы воспользовались ранее — в ходе доказатель­
ства теоремы 2.
З а м е ч а н и е . Пусть еа = Нп^-юо (1 + а /п )п. В анализе, путём
разложения функции комплексной переменной в степенные ряды, до­
казывается формула Эйлера
= cosp + isinp, (15)
из которой вытекают все полученные нами результаты. Стоит толь­
ко заметить, что
ei(f ei(f' — еИ<р+<р') ^ (e^)n = ein(f.
Тригонометрическая форма комплексного числа z сводится к записи
z = \ z \ - e i<p.
Далее, мы хотели бы научиться извлекать корни произвольной
степени из комплексных чисел, и основной вопрос, который здесь
возникает: всегда ли это можно делать? Оказывается, что всегда, и
формула Муавра даёт по существу полное решение этого вопроса.
Пусть нам дано комплексное число z = r(cosp + sin у?), а мы хотим
найти число z' = г '(cos у/ + i sirup') такое, что (z')n = 2 . Выражая
(.z')n по формуле Муавра, а затем сравнивая в обеих частях равенства
(.z')n = 2 модули и аргументы, мы находим (г')п — т и тир' = <р+ 2 iтк
174 Г л. 5. Комплексные числа и многочлены

(слагаемое 27тк плата за неполную определённость аргумента).


Итак,
р + 27тк
г' = у/г, Ч> =п
(под у/ r подразумевается арифметическое значение корня п-й степе­
ни из положительного вещественного числа). Корень y/z, стало быть,
существует, но определён неоднозначно. При /с = 0, 1,..., n —1 для z 1
будет получено п различных значений, причём ими исчерпываются
все корни, поскольку из& = пд + г , 0 ^ г ^ п —1, следует
. Ю+ 27гг
р' = ---------+ 2 irq.
Нами доказана
Т е о р е м а 3. Извлечение корня п-й степени из комплексного
числа z = \z\(cosp + i sirup) всегда возможно. Все п значений корня
п-й степени из z расположены в вершинах правильного п-уголъника,
вписанного в окружность с центром в нуле и радиуса \f\z\ :
р + 27тк . . <р + Ътк
+ г s m---------- (16)
п п
к = 0, 1,..., п — 1.
С л е д с т в и е . Корни п-й степени из 1 выражаются формулой
ПГГ 27тк . . 27тк
V1 = £к = cos------ \-ism -----, (17)
п п
к = 0, 1,..., п — 1. Они расположены в вершинах правильного
п-угольника, вписанного в окружность с центром в нуле и радиу­
са 1.
Из (16) и (17) непосредственно видно, что вещественных корней
yfz будет нуль, один или два, а корней
у т — один или два (на рис. 21 пока­
заны корни из 1 степени 5).
Корень п-й степени из 1 называ­
ется примитивным (или первообраз­
ным), если он не является корнем из
1 никакой меньшей степени. Таковы­
ми будут, например,
27г , . 2 тг
£ = Si = cos-----Ь г s m— , £n-i-
Рис. 21
Любой другой корень Sk является степенью примитивного
£k — £1,
что опять-таки видно из формулы Муавра. Более того, Sk£i = £&+/,
если к + I брать по модулю п. В частности, s ^ 1 = sn-ki £о = 1- Уже
§ 1. Поле комплексных чисел 175

искушённые в теории групп, мы замечаем, таким образом, что корни


п-й степени из 1 составляют циклическую группу (г) порядка п.
Тем самым получена ещё одна реализация циклической группы
порядка п. Для каждого d\n в (г) имеется ровно одна подгруппа
(en/ d) порядка d. Корень £т будет примитивным тогда и только
тогда, когда (еш) = (е), т.е. Card(sm) = п, а это возможно только
при т , взаимно простым с п. Например, при п = 12 примитивны­
ми корнями будут г ,г 5,г 7,г 11. В случае простого п = р все корни
из единицы, отличные от 1, примитивные. С алгебраической точки
зрения, без учёта геометрического изображения, все примитивные
корни данной степени п равноправны.
Возвращаясь к вопросу об извлечении корня степени п из произ­
вольного комплексного числа z ф 0, заметим, что если z' — какой-
нибудь фиксированный корень (скажем, z' = y/fz|(cos^ + i s i n^)),
то все другие корни имеют вид z r£k, &= О, 1,..., n —1. Это утверж­
дение находится в соответствии с формулой (16).
5. Теорема единственности. Преимущество поля С перед Е
мы сможем оценить полностью лишь впоследствии, но уже один тот
факт, что С содержит все корни из 1, оправдывает повышенный ин­
терес к комплексным числам. Заметим, что по построению С — дву­
мерное векторное пространство над Е (в смысле определения из и. 2
§ 1 гл. 2) с базисными элементами 1, г: С = (1,г)к.
Возникает естественный вопрос, насколько широко семейство по­
лей, обладающих аналогичными свойствами. Оказывается, справед­
лива следующая теорема единственности поля комплексных чисел.
Т е о р е м а 4. Каждое ассоциативное коммутативное кольцо К
с единицей 1 без делителей нуля, являющееся двумерным векторным
пространством над Е, изоморфно полю С.
Д о к а з а т е л ь с т в о . Без ограничения общности отождествим
1 • Е с Е и считаем Е вложенным в К. Так как dim^X = 2, то су­
ществует е Е К \ Е такой, что 1 и е составляют базис пространства
К над Е. Очевидно, е2 = а • 1 + 2/3 • е с а, /3 Е Е. Для элемента
/ = е —f3 0 Е имеем / 2= у, где у = а + (З2 Е Е. Очевидно, у < О,
поскольку иначе ^/у Е Е, и мы имели бы / = Т^/у. Таким обра­
зом, существует S Е Е, для которого S2 = —у -1 . Теперь j 2 = —1
для j = 5/, и легко проверяется (как при построении С), что ка­
ждый ненулевой элемент из К обратим, т.е. К — поле. Отображение
ер : С —У К, определённое соответствием х + iy i—у х + jy, является
искомым изоморфизмом полей. □
Где в этом доказательстве мы использовали условие, что К —
кольцо без делителей нуля? Во-первых, могло бы случиться так, что
е2 = 0, и тогда а = (5 = 0 => у = 0. Далее, фактически утвержда­
ется, что у ^ 0 / = =Ьд/у. Это действительно так, поскольку
176 Г л. 5. Комплексные числа и многочлены

О = / 2 - 7 = ( / - х/7)(/ + л/7) = * / - л/7 = О или / + ^ = О.


В поле С, кроме Q и М, содержится много других подполей. Осо­
бенно интересны расширения поля Q, получающиеся присоединением
какого-либо элемента из С, не содержащегося в Q.
П р и м е р 1 (квадратичное поле). П усть d — отличное от нуля целое число,
возмож но, о три ц ател ьн ое, так ое, ч т о V d 0 Q. Поле Q(Vd) С С н азы в ается ве­
щественным квадратичным при d > 0 и мнимым квадратичным при d < 0. О
поле Q (\/2 ) упоминалось в § 3 гл. 4. Р ассуж дение, дословно повторяю щ ее ход
д о к а за те л ьс тв а теорем ы 4, если зам ен и ть т ам j на Vd, а соотнош ение j 2 = —1 —
на (V d)2 = d , п о к азы в ает, ч то

Q(Vd) = {о, bVd | й , 6 G Q}.


В частн о сти ,

(а>1 + b\Vd) + (a 2 + b2 ^/d) = (fli + 0 -2 ) + (6 1 + b2 )Vd, (18)


(ai + 6 i \/r f ) ( a 2 + 6 2 \/d ) = ( ai a 2 + 6 1 6 2 6 ?) + (0462 + a 2 6 i ) \/ d .
Далее,
a -6
(a + bVd) 1 Vd
a2 —db2 a 2 — db2
при a + bVd Ф 0 (т.е. при a и 6, одновременно не равн ы х нулю).
П ользуясь (18), легко провери ть, ч т о отображ ение

/ : а + bVd ^ а —bVd
явл яется автом орф изм ом поля Q(V d) (аналог комплексного сопряж ения).
Нормой числа а = а + bVd н азы в ается число
N ( a ) — о? —db2 = a f ( a ) .
О чевидно, ч т о N (a ) = 0 а = 0. Далее, т а к к а к / — автом орф изм , то
N(a(3) = a(3f(a(3) = a(3f(a)f((3) = a f ( a ) • (3f((3) = N ( a ) • N((3).
В частн о сти , N (a ) • N ( a ~ 1) = N ( a a ~ 1) = N ( 1) = 1. П оэтом у норм а о бл адает
сущ ественны ми свой ствам и (к в ад р ат а) модуля в поле С.
6. Э лем ен тар н ая ге о м ет р и я ком плексны х чисел. Вещест­
венное векторное пространство С = (1, г)к является евклидовым: оно
снабжено положительно определённым скалярным произведением
(zi\z2) = Rezi~Z2 = х гх 2 + yiy2,
где zk = x k + iy k, k = 1,2.
Справедливо неравенство Коши—Буняковского—Шварца
\(zi\z2)\ ^ \гг\ ■\z2\,
поскольку |(^1 1^2)| = \Rezi~z2\ ^ \z{z2\ = \zi\\z2\ = |2i ||z2|.
Два вектора (комплексных числа) 24, 2:2 называются ортогональ­
ными или перпендикулярными друг другу, если (^11^2) = 0.
Из соотношения (12) непосредственно вытекает, что два векто­
ра z,cz G С* ортогональны в точности тогда, когда с — чисто
мнимое число.
§ 1. Поле комплексных чисел 177

Прямая, проходящая через точки u,v Е С, задаётся параметри­


чески
w = и + (v —u)t, t Е Е.
Поэтому ортогональность двух прямых w = u + (v —u)t, w' = и' + (v' —
—u')t выражается соотношением (v —и \v' —и') = 0. Ясно также, что
три точки 2Д, Z2 , z% Е С, z\ ф Z2 , лежат на одной прямой в точности
тогда, когда
^3 - Z!
Е М., (19)
Z2 ~ Zi
т.е. 2:32:2 - 2:32:1 - 2:12:2 Е Е.
Вот маленькое рассуждение на тему ортогональности. Если рас­
положить произвольный треугольник так,
чтобы его две вершины а, (3 оказались на
вещественной оси, а третья вершина гу —
на мнимой, то легко проверяется, что три
высоты треугольника пересекаются в об­
щей точке iS, где S = —а/3/у. Например,
(—а + iS\ —/3 + гу) = 0 (рис. 22).
Важную роль во многих геометрических вопросах играет поня­
тие двойного отношения [2:1 , 2:2, 2:3,2:4] четырёх точек 2Д, 2:2, 2:3,2:4 Е С
с zi ф Z2 ф Z3 (детали см. в [ВА II]). По определению
- Z2 z 3 - z 2
Zi
[zi,z 2 ,z 3 ,z4\ =
z 1 - Z i Z 3 - 24
(zi - 22)(23 - 24) _ (Z! - Z2 )(z 3 - Z i ) ( Z ! ~ Z i ) (z 3 - Z 2 )
(20)
(z 1 - Z4)(z3 - Zi) \zi - Z4\2 ■\z3 - z 4 12
— комплексное число, зависящее от порядка в последовательности
zi,Z 2 , £3,^ 4. При циклической перестановке имеем
[22, 23, 04, 21] = [z1 ,z 2 ,z 3 ,z4]~1.
Заметим, что в соответствии с (20) двойное отношение не меня­
ется при сдвигах Та : z z + а. Представим себе, что три точки
^1 ?^2 5^3 не лежат на одной прямой. Это свойство тоже инвариантно
относительно сдвигов. Поэтому центр окружности, в которую впи­
сан треугольник с заданными вершинами z\ , Z2 , £3 , можно считать
(при вычислении [2:1, 2:2, 2:3, 2:4]) расположенным в начале координат.
Но тогда \zi \ = 12:21= |^з|, и легко убедиться в том, что
(z 1 - Z2) (23 - 24)(2 i - 24) (23 - 22) -
- г(|23|2 - 12412) • Im(2322 - 232i - Z{Z2) £ M
(рекомендуем читателю проделать это в качестве упражнения). Со­
гласно (19) должно выполняться условие Im(2:322 —2:32Д —Z1 Z2 ) ф 0,
12 А.И. К о стр и к и н
178 Г л. 5. Комплексные числа и многочлены

а в таком случае произведение (z\ —22)(23 —24)(21 — 24X23 —22) бу­


дет вещественно, или, что эквивалентно (см. (20)), [21,22,23,24] G Е
тогда и только тогда, когда Хз|2 —|2д|2 = 0 , т.е. \zs\ = 1241. Значит,
Zk, 1 ^ к ^ 4 , — числа, равные по модулю и, стало быть, лежащие на
одной окружности.
То же рассуждение действует и тогда, когда на одной прямой
не лежат какие-то другие три точки из четырёх. Достаточно заме­
тить, что вещественность [21, 22, 23,24] сохраняется при циклической
перестановке. Мы доказали следующее утверждение.
Т е о р е м а 5 . Четыре точки 21,22,23,24 Е С с z\ ф 24, 22 Ф 23,
не лежащие на одной прямощ лежат на одной окружности в точ­
ности тогда, когда их двойное отношение вещественно.
Это лишь одна из многих конфигураций, свойства которых вы­
ражаются на языке двойных отношений.
В заключение мы построим геометрическими средствами новые
числовые поля, занимающие видное место в истории математики.
П р и м е р ( конструктивные числовые поля). Н а д ек артовой плоскости М2
считаем задан н ы м и то ч к и (0,0) и (1 ,0 ). Все последующие к онструкци и осущ е­
ствл яю тся только при помощ и циркуля и линейки. П острои в то ч к и Р и Q, мы,
естественно, можем с ч и т а т ь п остроенн ы м и соединяю щ ий их о т р езо к PQ. Если
построен ы т о ч к а Р и о т р езо к г, то с тр о и тся т а к ж е окр у ж н о сть ради уса г с цен­
тр о м в точк е Р. П опарны е пересечения уж е построен н ы х прям ы х (отрезков) и
ок руж н остей к о н стр у к ти в н ы в том ж е смысле.
Комплексное число а + ib называется конструктивным, если при
помощи конечной последовательности указанных выше (допустимых)
конструкций мы можем построить, отправляясь от (0, 0) и (1,0), точ­
ку Р = (а, Ъ). Нетрудно видеть, что конструктивность а + ib эквива­
лентна конструктивности \а\ и \Ь\. Множество точек плоскости, ко­
торые строятся при помощи циркуля и линейки, а следовательно, и
множество всех конструктивных комплексных чисел обозначим CS.
Т е о р е м а 6. Множество CS является подполем поля С.
Д о к а з а т е л ь с т в о . Непосредственно из определения конструк­
тивности чисел следует замкнутость СS относительно операции сло­
жения (точка 2 + 2' строится как пересечение двух окружностей (ра­
диуса \z\ с центром в z' и радиуса \z'\ с центром в 2) и перехода от
2 = х + iy Е CS к —2 = —х —iy.
0^

к
С
II

\ а<ч
\ к\\ \/а <>
--
Ч \ Г \\ \\ / 1
^

\\ \\ \\ \\ / 1
/ 1
V----V
----о О-- _________

0 1 а 0 0 1 1+ а
'S'

II
1

а б в
Рис. 23
Откладывая на осях координат отрезки конструктивных длин
§ 1. Поле комплексных чисел 179

1, а ,/3 и рассматривал подобные треугольники, изображённые на


рис. 23, а, б (штрихами показаны новые конструктивные отрезки),
мы убеждаемся в конструктивности произведения у = а (5 и частного
S = а /(5 . Так как построение
zz' = {х + гу){х' + гу') = (хх' —уу') + i{xy' + х'у),
- = Х - i У
Z х 2 -\- у2 X2 + ?/2
сводится в конечном счёте к построению величин типа у и <5, то
конструктивность произведения zz' и частного 1/z также установле­
на. Вместе с тем доказана замкнутость множества C S относительно
всех операций в поле С. □
З а м е ч а н и е . 1) C S инвариантно относительно автоморфизма
сопряжения z
2) На рис. 23,6 показано, что извлечение квадратного корня л/а
из конструктивного вещественного числа а > 0 конструктивно. На
самом деле это высказывание относится к любому конструктивному
числу z.
Всякое подполе F С C S принято называть конструктивным чис­
ловым полем. Понятно, что Q С C S и что любое конструктивное
поле является полем нулевой характеристики. Согласно замечанию 2)
всякое квадратичное поле (см. пример в и. 5) конструктивно.

УП РА Ж Н ЕН И Я

1. Н ай ти все комплексны е числа z, по модулю равн ы е 1, при к о то р ы х z 2 +


+ (1 -\-i)z при н и м ает чи сто мнимы е значения. И зо б р ази ть соответствую щ ее гео ­
м етрическое м есто т о ч е к на плоскости С.
2. Ч т о можно с к а за т ь о поле K (J), к оторое получено из К присоединением
комплексного числа 6 , удовлетворяю щ его равен ству 54 = - 1 ? ____________
3. П усть А, В G М П(К). О пираясь на теорем у 1, д о к а за ть , ч т о d e t(A + iB) =
= d e t(A — iB) (ч е р т а озн ач ает сопряж ение).
4. П усть А, В G М П(К),
А В
С =
-В А
е м 2п(м).
П рим еняя к вещ ественной м атри ц е С элем ентарны е преобразован и я первого и
в то р о го т и п а над полем комплексны х чисел С, п о к а за ть , ч то
d et С = | d e t(A + гВ)\2.
5 (Г. П олна и Г . С егё). И спользуя упр. 3 и 4, д а т ь объяснение следующ ему
“с тран н ом у” ф а к ту . О днородн ая к в ад р ат н а я линейная систем а
d n z i + . . . + d \ n z n — О,
м
d n i z i + . . . + dn n z n — О
с комплексны ми коэф ф ициентам и dki = о-ы + и неизвестны м и Zi = Х{ + iyi
им еет н етри виальное реш ение ( z i , . . . , z n ) в т о ч н о сти т о гд а , к огд а d e t (d^i) =

12:
180 Гл. 5. Комплексные числа и многочлены

= а + гб = 0 (см. общие зам ечан ия по этом у поводу в п. 6 § 3 гл. 4). Э то условие


п ри вод ит к двум уравнениям а = 0, 6 = 0, связы ваю щ им 2 п 2 вещ ественны х вели­
чин адд, bki- С другой стороны , систем у (*) можно п р е д с та в и ть в виде систем ы
2 п линейны х однородны х уравнений с 2 п вещ ественны м и неизвестны м и у{.
Т еперь условие н етри ви ал ьн ости реш ения запиш ется в виде равен ств а нулю од­
ного вещ ественного определителя р азм ер а 2 п х 2п, ч т о даст лиш ь одно уравнение
м еж ду d k i , b k i - К а к согл асовать м еж ду собой эти два р е зу л ь т ат а?
6 . И мея в виду, ч т о автом орф и зм ы к в ад р ат и ч н о го поля Q ( \ / d) долж ны ос­
т а в л я т ь на м есте рациональны е числа, н ай ти автом орф и зм ы это го поля.
О т в е т . Е диничное отображ ение и а + b y / d i—» а — b V d .
7. Ч ем у равн а сум м а всех корней степени п > 1 из 1? Ч т о можно с к а за т ь о
сумме при м и ти вн ы х корней степени 12 и степени 15 из 1?
8. П о к а за ть , ч т о £ = (2 + г)/(2 — г) не явл яется корнем из 1, хотя |£| = 1.
У к а з а н и е . Cn = 1 = > (2 - г)п = (2 + г)п = (2 - г + 2г)п = (2 - г)п + . . .
. . . + (2 г )п = > (2 —г)(а+ 6г) = (2 i)n = > 5 (а 2 + 6 2) = 22п = > 5 |2 2п — противоречие.
9. М нож ество S'1 = {ег<р\(р Е М} (ок руж н ость единичного радиуса) о бразу­
ет относи тельно умнож ения в С п одгрупп у груп п ы (С *,-). Всякое М-линейное
отображ ение / : С —» С н азы в ается ортогональным , если ( / ( £ ) |/ ( У ) ) = ( г |г ') ,
т.е. если оно сохраняет длины в ек торов (расстоян ия м еж ду т о ч к ам и ). Д о к а за ть ,
ч т о отображ ение / : С —» С в т о ч н о сти т о гд а ортогон ал ьн о, к огд а f ( z ) = cz или
f ( z ) = cz , где cG 5 1.
10. П о к а за ть , ч то
хо XI Х2 ... Хп —1
Х п -1 хо XI ... Х п - 2
%п —2 Хп —1 Хо Хп —3 П (*о+с*х! +е кх2 +... +c(n- 1)fcxn-i),
к= 0
X 1 Х2 хз ... хо

где ^ — при м и ти вн ы й корень степени п из 1.

§ 2. К ол ьц о м н огоч л ен ов
Наряду с линейными системами, рассмотренными нами в гл. 2
и гл. 3 , многочлены составляют старый и хорошо изученный раздел
традиционной алгебры. На языке многочленов формулируются или
решаются самые различные задачи математики. Тому есть множе­
ство причин, и одна из них заключается в свойстве универсальности
кольца многочленов, на чём мы коротко остановимся в и. 1.
Пусть К — коммутативное (и, как обычно, ассоциативное) коль­
цо с единицей 1 , А — некоторое его подкольцо, содержащее 1 . Если
t Е К, то наименьшее подкольцо в К, содержащее А и £, будет, оче­
видно, состоять из элементов вида
a(t) = &о Т
+ Q-2^2 + ... + <intn, (*)
где as Е А, п Е Z, п ^ 0 . Мы обозначим его A[t\ и назовем кольцом,
полученным из А присоединением элемента £, а выражение (*) —
многочленом от t с коэффициентами в А. Что понимать под сум­
мой и произведением многочленов, видно из простейших примеров
§ 2. Кольцо многочленов 181

(скажем, при п = 2):


a(t) + b(t) = (ао Н- t + g-2t2) + (bo + bit + &2^2) =
= (ао + bo) + (сц + bi)t + (а2 + b2)t2,

a(t) • b(t) = a0b0 + (a0bi + aib0)t +


+ ((20^2 + + 0-2bo)t2 + (<21^2 + <22bl)t3 + (12^2^ •
Очевидно, что приведение подобных членов основано на попарной
перестановочности всех элементов
Теперь настало время вспомнить, что t — наугад взятый эле­
мент кольца К , и поэтому внешне различные выражения (*) могут
на самом деле совпадать. Если, скажем, А = Q, t = л/2 , то t2 = 2
и t3 = 21 — соотношения, которые никоим образом не вытекают
из формальных правил. Чтобы прийти к привычному понятию мно­
гочлена, необходимо освободиться от всех таких побочных соотно­
шений, для чего под t следует понимать произвольный символ, не
обязательно содержащийся в К . Он призван играть чисто вспомо­
гательную роль. Гораздо большее значение имеют правила, по ко­
торым составляются коэффициенты выражений a(t) + b(t), a(t)b(t).
Имея в виду эти предварительные замечания, перейдём к точному
определению алгебраического объекта, называемого многочленом, и
собрания таких объектов — кольца многочленов.
1 . М н огочлен ы о т одн ой п ер ем ен н ой . Пусть А — произ­
вольное коммутативное кольцо с единицей. Построим новое кольцо
£?, элементами которого являются бесконечные упорядоченные по­
следовательности
/ = (/о, /ъ/2, .. .)> f i e А, (1)
такие, что все /^, кроме конечного их числа, равны нулю. Определим
на множестве В операции сложения и умножения, полагая
/ + 9 — (/о, / ъ / 2 , •••) + (до, 9i, 92, •••) = (/о + 9о, Л + 9i, /2 + 92, •••),
/ *д = h =
где
hk = Е М г, к = 0,1,2,...
i+j=k
Ясно, что в результате сложения и умножения получаются снова
последовательности вида (1) с конечным числом отличных от нуля
членов, т.е. элементы из В . Проверка всех аксиом кольца (см. § 3
гл. 4), кроме, разве, аксиомы ассоциативности, очевидна. В самом
деле, поскольку сложение двух элементов из В сводится к сложению
конечного числа элементов из кольца А , (В, +) является коммута­
тивной группой с нулевым элементом (0, 0, 0, .. .) и элементом —/ =
182 Г л. 5. Комплексные числа и многочлены

= (-/о , - Л , - / 2, • • •), обратным к произвольному / = (/0, /ъ / 2, • • • )•


Далее, коммутативность умножения следует непосредственно из
симметричности выражения элементов hk через fi и gj. Это же
выражение показывает, что в В выполнен закон дистрибутивности
( / + 9 )h — f h + 9 h- Что касается ассоциативности операции умноже­
ния, то пусть
/ = ( / о , / ъ / 2, - - 0 , 9 = (90,91,92, ■■■), h = (h0 ,h i,h 2, .. .)
— три произвольных элемента множества В . Тогда f д — d — (do, di,
где dt = 'Ei+j=ifi 9j, 1 = 0,1,2,..., a (fg)h = dh = e =
= (eo, ei, e2, ■■■), где es = 'Yhi+k=sdihk = J2 i+k=s (^2 i+j=i fi9j} hk =
— T,i+j+k=s fidjbk- Вычисление f(gh) даёт тот же результат. Итак,
В — коммутативное ассоциативное кольцо с единицей (1, 0 , 0 ,...).
Последовательности (а, 0 , 0 , . . . ) складываются и умножаются так
же, как элементы кольца А. Это позволяет отождествить такие по­
следовательности с соответствующими элементами из Д, т.е. поло­
жить а — (а, 0 , 0 , . . . ) для всех а Е А. Тем самым А становится под­
кольцом кольца В .
Обозначим, далее, (0 , 1, 0 , 0 , . . . ) через X и назовем X перемен­
ной (или неизвестной) над А. Используя введённую на В операцию
умножения, находим, что
Х = (0,1,0,0,...),
X 2 = (0,0,1,0,...), (2)

* " = (0,0, . . . , 0, 1, 0, . . . )
Кроме того, ввиду (2) и ввиду включения А С В имеем
(0, 0, .. ., 0, а, 0,.. .) = а Х п = Х па.
Итак, если / п — последний отличный от нуля член последователь­
ности / = (/о, Л, • • •, /п, 0, 0,...), то в новых обозначениях
/ = (/о, • • • >/га-Ъ 0, 0, . . . ) + f nX n =
= (/о,..., / „-2, 0, 0, . . . ) + /„ _ iX ”- 1 + f nX n =
= /о + f i X + f 2 X 2 + ... + f nX n.
Такое представление элемента / однозначно, поскольку / о, . .., f n в
правой части (3) — это члены последовательности (/о,..., / п, 0,...),
которая равна нулю тогда и только тогда, когда /о = ... = f n — 0.
О п р е д е л е н и е . Введённое выше кольцо В обозначается через
А[Х] и называется кольцом многочленов над А от одной переменной
X , а его элементы — многочленами (или полиномами).
§ 2. Кольцо многочленов 183

Конечно, присвоение фиксированной букве X названия перемен­


ной или неизвестной не очень удачное терминологическое изобрете­
ние, но оно привилось, поскольку не приводит к недоразумениям.
Мы намеренно ввели заглавную букву X , чтобы отличить наш
специально выделенный многочлен / = X от теоретико-функцио­
нальной переменной ж, пробегающей какое-то множество значений
(чисто временное соглашение, придерживаться которого в будущем
не обязательно). Более привычной является запись многочлена / в
виде
f ( X ) = a 0X n + a 1 X n~ 1 + ... + an,
т.е. по убывающим степеням X. В дальнейшем мы будем писать так,
как это представится удобным.
Элементы fi (и а*) называются коэффициентами многочлена /.
Многочлен / нулевой, когда все его коэффициенты равны нулю. Ко­
эффициент /о при X в нулевой степени называется ещё постоянным
членом. Если f n ф 0 , то f n называют старшим коэффициентом, а
п — степенью многочлена и пишут п = deg/. Нулевому многочлену
приписывается степень —оо (—оо + (—оо) = —оо, —оо + п = —оо,
—оо < п для каждого п G N). Многочлены степени 1, 2 , 3 ,... называ­
ются соответственно линейными, квадратичными (или квадратны­
ми), кубичными и т.д.
Роль единицы кольца А[Х] играет единичный элемент 1 кольца А,
рассматриваемый как многочлен нулевой степени. Непосредственно
из определения операций сложения и умножения в А[Х] следует, что
для любых двух многочленов
f = fo + f i X + ... + f nX n, g = g0 + g1X + . . . + g mX m (4)
степеней п и т соответственно имеют место неравенства
deg(/ + g) ^ max(deg /, deg g), deg(/g) ^ deg / + deg g. (5)
Второе из неравенств (5) на самом деле заменяется равенством
deg (fg) = deg / + deg g
всякий раз, когда произведение f ngm старших коэффициентов мно­
гочленов (4) отлично от нуля, поскольку
f 9 — fo9o + (fo9i + f i 9 o)X + ... + (fngm) X n+m. (6)
Но это значит, что верна
Т е о р е м а 1. Если А — целостное кольцо, то и кольцо А[Х]
является целостным.
Место кольца многочленов среди коммутативных колец отчасти
поясняет следующая
Т е о р е м а 2 . Пусть коммутативное кольцо К содержит А в
качестве подкольца. Для каждого элемента t Е К существует
184 Г л. 5. Комплексные числа и многочлены

единственный гомоморфизм колец : А[Х] —>К такой, что


Чае А ПДа) = а, Щ Х ) = t. (7)
Д о к а з а т е л ь с т в о . Предположим сначала, что такой гомомор­
физм существует. Так как ПД/Д = fi для каждого коэффициен­
та многочлена / , записанного в стандартном виде (3), и Ut ( X k) =
= (ПДХ))*5= tk (свойство гомоморфизма и условие (7)), то
ПД/) = ПД/о + h X + ... + f nX n) = /о + f l X + ... + f ntn, (8)
т.е. ПД/) определён однозначно и выражается формулой (8). Обрат­
но: задав отображение формулой (8), мы, очевидно, удовлетворим
условию (7) и получим гомоморфизм колец. Это ясно для отображе­
ния аддитивных групп колец, а что касается умножения, то приме­
нение к произведению (6), а затем использование (общего) закона
дистрибутивности даёт

п t(fg) — fo9o + {fogi + fig o) x + ... + (fngm)tn+m —

= (Х > Д = П * ( Я - П*(5)- □

Результат применения отображения П^, определённого формулой


(8), к многочлену / = f ( X) называется подстановкой t в / вместо
X или (с некоторой натяжкой) просто значением / при X = £, так
что ПД/) = /(£). Знать ПД/) — значит уметь вычислить значение
/ при X = t. Гомоморфизмы Пж, х Е Д, служат связующим звеном
между функциональной и алгебраической точками зрения на мно­
гочлен. По определению линейный многочлен X — с — (—с, 1,0,...)
никогда не равен нулю, но ассоциированная с ним функция х i—у х —с
принимает нулевое значение при х — с. Другой пример: отличный от
нуля многочлен X 2 + X с коэффициентами из поля F2 (где 1 + 1 = 0)
представляет нулевую функцию / : F2 —> F2, поскольку О2 + 0 = 0 и
I2 + 1 — 0 .

Элемент t Е К называется алгебраическим над Д, если ПД/) = 0


для некоторого / Е Д[Х]. Если же П^ : А[Х] -+ К — изоморфное
вложение (мономорфизм), то t — трансцендентный над А элемент.
В случае А = Q и К = С говорят просто об алгебраических и транс­
цендентных числах. Например, числа е и 7г, определяемые в анализе,
являются трансцендентными, а числа у/2 , л/3 , л/2 + л/3 — алгебраи­
ческими.
Гомоморфизм П^, собственно говоря, служит выражением уни­
версального свойства кольца многочленов Д[Х]. Более полным обра­
зом универсальность кольца многочленов видна из следующего ут­
верждения, обобщающего теорему 2.
§ 2. Кольцо многочленов 185

Т е о р е м а 3 . Пусть А и К — произвольные коммутативные


кольца, t — элемент из К и р: А — >■К — гомоморфизм.
Тогда существует , и притом единственное, продолжение ip до
гомоморфизма p t : А[Х] — >• К кольца многочленов А[Х] в К , перево­
дящего переменную X в t.
Доказательство является незначительным видоизменением дока­
зательства теоремы 2 и оставляется читателю в качестве упражне­
ния. □
2. М н огочлен ы о т м н оги х п ер ем ен н ы х. Если в ситуации
А С К , рассматривавшейся в начале параграфа, взять произвольные
п элементов t \ , . . . , tn Е К и рассмотреть в К пересечение всех под­
колец, содержащих A, t i , . .., £п, то мы получим кольцо A [ti , . .., tn\.
Формальная запись его элементов подсказывает, как и в случае п =
= 1, необходимость введения в обиход кольца многочленов от п пе­
ременных. Делается это очень просто. Вспомним, что конструкция
кольца В = А[Х] включала произвольное коммутативное кольцо А с
единицей. Мы можем теперь заменить в нашей конструкции кольцо
А на В и построить кольцо С = 5 [У], где Y — новая независи­
мая переменная, играющая по отношению к В ту же роль, что и X
по отношению к А. Элементы из С однозначно записываются в ви-
де bj Е В , причём В отождествляется с подкольцом в (7,
а именно с множеством элементов bY° = 5 - 1. Так как в свою оче­
редь bj = ai j X l — однозначная запись элементов bj G 17, то любой
элемент из С имеет вид
к I
Y , Y a^ x i Y j ' а« е А ’
2=0 j =о
причём подразумевается (по смыслу конструкции), что ац переста­
новочны с X и У, а переменная X перестановочна с У. Кольцо С
называется кольцом многочленов над А от двух независимых пере­
менных (от двух неизвестных) X и У.
Повторив достаточное число раз эту конструкцию, мы получим
кольцо А[Х-l, . .., Х п\ многочленов (полиномов) над А от п независи­
мых переменных (или неизвестных) X i , ..., Х п.
Набор ( н , . . . , гп) Е N из п целых неотрицательных чисел У , ...
. .., i n (N = N U {0 }) условимся сокращённо обозначать символом (г).
Тогда любой элемент / G А [Х i , ..., Х п\ запишется в виде

/ = У а ( * Т г)’ «.(г) е Л, (9)


(<)
где X = Х [г ... X ^ — одночлен (или моном), так что / — линей­
ная комбинация одночленов с коэффициентами из А. В соответствии
с определением многочленов все коэффициенты в (9), за исключе­
186 Г л. 5. Комплексные числа и многочлены

нием конечного их числа, равны нулю. Единственность записи (9)


непосредственно вытекает из следующего утверждения.
Многочлен / равен нулю тогда и только тогда, когда равны
нулю все его коэффициенты При п — 1 это уже отмечалось в
ходе построения кольца Л[Х], а при п > 1 проще всего использовать
индукцию по п. Именно, мы можем записать
f = J 2 ah...inX i 1 . . . X t = J 2 b inX t ,
где
hn = Y,
iii —Лп—l
— многочлены от меньшего числа переменных. Утверждение для п =
= 1 и предположение индукции показывают, что
f — 0 ^—* Vin bin = 0 s—^ V(z1 , . . . , гп) ец1 ..лп_11п — О*
Теперь естественно считать два многочлена /, g Е А [Х i , ... , Х п\
равными, если совпадают их коэффициенты при одинаковых одно­
членах (согласно вышесказанному (Ц,. .., in) Ф (ji , . .., j n) = >
> -v;; ••••V'” / Л’/ ... A ").
Под степенью многочлена f относительно Xk понимается наи­
большее целое число, обозначаемое degk / , которое встречается в ка­
честве показателя при Х к в с ф 0. Например, многочлен
1 + X + X Y 3 + X 2 Y 2 имеет степень 2 относительно X и степень 3
относительно Y .
Целое число i\ + ... + in называется (полной) степенью одночлена
X ix ... wn
X in .
Степенью deg / (или полной степенью) многочлена / будет мак­
симальная из полных степеней его одночленов. Полагаем degO = —оо.
О старшем по степени члене многочлена / не имеет смысла говорить,
поскольку таких членов (одночленов) может быть несколько.
На кольцо А[Хi , . . . , X n] переносятся многие результаты, полу­
ченные нами в п. 1 для И[Х]. Например, опираясь на теорему 1 и
используя индукцию по п, мы сразу же убеждаемся в том, что спра­
ведлива
Т е о р е м а Т. Если А — целостное кольцо, то и кольцо А[Х\ ,...
. .., Х п] является целостным. В частности, кольцо многочленов от
п переменных над любым полем Р целостно.
Полезным уточнением теоремы Т служит
Т е о р е м а 4 . Пусть f u g — произвольные многочлены от п
переменных над целостным кольцом А. Тогда
deg(/ff) = d eg / + deg g.
§ 2. Кольцо многочленов 187

Д о к а з а т е л ь с т в о . Назовём однородным многочленом или фор­


мой степени т многочлен h ( X l, . .., Хп), все члены которого имеют
одну и ту же полную степень т. Формы степеней 1, 2 , 3 называ­
ются соответственно линейной, квадратичной и кубичной формами.
Объединяя вместе все входящие в / (или, как ещё говорят, встре­
чающиеся, имеющие ненулевые коэффициенты) одночлены одной и
той же степени, мы однозначно представим многочлен f = ^2
в виде суммы нескольких форм f m различных степеней
/ —/о + Л + • • • + Л ? k = deg /.
Если теперь
9 — 9о + 9 i + • • • + 9i ? I = deg g,
то, очевидно,
f 9 — fo 9o + (fo 9 i + f i 9o) + • • • + fk 9i
(это похоже на соотношение (6), но fi,gj имеют там другой смысл),
откуда deg f g ^ fe+ Z. По теореме 1' из f k ф 0 , gt ф О следует f kgt ф О,
т.е. deg (fg) = deg (fkgt) = к + l = deg / + deg#. □
3. А л го р и т м деления с ост а т к о м . В и. 3 § 9 гл. 1 для целых
чисел был введён алгоритм деления с остатком. Оказывается, что
совершенно аналогичный алгоритм имеет место и в кольце А[Х] над
целостным кольцом А (для А = М это известно фактически из курса
элементарной алгебры: вспомните деление уголком).
Т е о р е м а 5 . Пусть А — целостное кольцо и д — многочлен в
А[Х] со старшим коэффициентом, обратимым в А. Тогда каждо­
му многочлену / Е А[Х] сопоставляется одна и только одна пара
многочленов q,r Е А [ Х ] , для которых
f = qg + r, deg г < deg 5. (10)
Д о к а з а т е л ь с т в о . Пусть
/ = аоХп + а \Х п 1 + ... + ап,
9 = ЪоХт + b iX 171 1 + ... + bm,
где ао&о Ф 0 и Ьо|1- Применим индукцию по п. Если п = 0 и
т = deg g > deg / = 0, то положим q = 0, г = / , а если п — т — 0,
то г = 0 и q = аоЬ^1. Допустим, что теорема доказана для всех мно­
гочленов степени < п (п > 0). Без ограничения общности считаем
т ^ п, поскольку в противном случае возьмём q = 0 и г = /. Раз это
так, то
/ = a 0 b0- 1X ” - m - 5 + 7 ,

где d eg / < п. По индукции мы можем найти q и г, для которых


/ = Q9 + r i причём deg г < ш. Положив
д = а 0 60- 1Х ” - то + д,
188 Г л. 5. Комплексные числа и многочлены

мы придём к паре многочленов с нужными свойствами.


Обращаясь к свойству единственности частного q и остатка г,
предположим, что
qg + r = f = q'g + r'.
Тогда (qr —q)g = т— т1. По теореме 1 имеем deg(r —г') = deg(ql —q) +
+ degg, что в наших условиях возможно только при г 1 = г и q' = q
(напомним, что deg 0 = —оо и что —оо + m = —оо).
Наконец, приведённые рассуждения показывают, что коэффици­
енты частного q и остатка г принадлежат тому же целостному
кольцу А , т.е. /, д Е А[Х] = > q,r Е А[Х]. □
З а м е ч а н и е . Многочлены со старшим коэффициентом 1 часто
называют нормализованными (ещё нормированными, унитарными).
Указанный выше процесс деления многочлена / на д, называемый
евклидовым, несколько упрощается, если g — нормализованный мно­
гочлен. Говорят, что / делится на д, если остаток г равен нулю
(см. (10)): / = qg.

У П РА Ж Н ЕН И Я

1. М ногочлены f ( X ) = X s + З Х 4 + Х 3 + 4 Х 2 - З Х - 1 , д( Х) = Х 2+ Х + 1 мож но
с ч и т а т ь принадлеж ащ им и кольцу Z\X] или, скаж ем , кольцу Z^[X] в зависим ости
о т т о го , к а к и н те р п р е ти р о в а ть их коэф ф ициенты . П рим еняя алго р и тм деления с
о статк о м , п о к а за ть , ч т о в первом случае f ( X ) не делится на д(Х), а во втором —
делится. В озм ож на ли реализаци я противополож ного вар и ан та?
2. Д о к а за ть при помощ и тео р ем ы 3, ч т о если F — поле, то гр у п п а всех
автом орф изм ов кольца F\X], тож д ествен н ы х на F , и зом орф на группе п рео б р а­
зований X 1-» а Х + 6, где a, b Е F и а ф 0.
3. П о к а за ть , ч т о многочлен / £ F \ X \ , . . . , Х п \ явл яется ф орм ой степени т
(см. до к азател ьств о теорем ы 4) т о гд а и только т о гд а , к огд а f ( t X \ , . . . , t X n ) =
= t 171 f ( X i , . . . , X n ), где t — новая переменная.
4 . П о к а за ть , ч т о число разл ичн ы х одночленов о т п независим ы х перем енны х
полной степени т равно ^ 171 ^^ .
У к а з а н и е . И спользовать принцип двойной индукции по п и т , опираясь
на соотнош ение
m + (n — 1) — 1 \ / (m — l ) + n — 1 ^ ( т + п —V
т / V т —1
5. В озвращ аясь к определениям п. 1, рассм отри м совокуп ность А[[Х]] т а к
назы ваем ы х формальных степенных рядов f ( X ) = ^ У > 0 а { Х г от переменной
(неизвестной) X или, если угодно, последовательностей (ао, а \ , а 2 , . . . ) с лю бым,
возмож но, бесконечны м, числом коэф ф ициентов ai ф 0, принадлеж ащ их ком м у­
т ат и в н о м у кольцу А. Д ействия с ф орм альны м и степенны м и рядам и из А[[Х]]
проводятся по тем ж е правилам , ч т о и действия с многочленами:

=У(«г+6г)М,
- ( 5 > М ) = J 2 CX , Ck = J2 CHbj.
i+ j= k
§ 2. Кольцо многочленов 189

П о к а за ть , ч т о м нож ество А[[Х]], р ассм атри ваем ое вм есте с этим и опера­


циями, явл яется ассоциати вны м и ко м м у тати вн ы м кольцом с единицей 1 = (1,0,
о, . . . ) .
Т ак к а к в степенной ряд / = 2 ai X l входят сколь угодно вы сокие степени Х г
переменной X , то вм есто степени d e g / , не имеющей теп ерь смы сла, естественно
р а сс м ат р и в ат ь порядок uj(f) — целое число, равное наименьш ему индексу п, для
к о то р о го ап ф 0 (пол агаю т ещё а;(0) = + о о ).
П о к а за ть , что:
i) oj(f - g ) ^ m in {o )(/),
ii) u ( f g ) > uj(f) +oj(g).
Если A — целостное кольцо, то uj(fg) = + uj(g)- В частн о сти , вм есте с
А целостны м явл яется и кольцо А[[Х]].
П о к а за ть т ак ж е, ч т о А[Х] — подкольцо в А[[Х]].
6. М ногочлены и степенны е ряды ч асто использую тся в к ач естве производя­
щих функций разл и чн ы х числовы х величин. Смы сл оперирования с ними поясним
на двух п р о сты х примерах.
а) У стан ови ть соотнош ение

п т у .м д д
исходя из биномиальной ф орм улы ^ ( п ) Х г = (1 + Х ) п в Ъ\Х\ и очевидного
разлож ения (1 + Х ) т (1 + Х ) п = (1 + Х )ш + п .
б) Н ай ти число 1п всевозм ож ны х расстан овок скобок в произведении длины
п элементов м нож ества с одной бинарной операцией. С этой целью удобно ввести
производящ ую ф ункцию — ф орм альны й степенной ряд

l ( X) = 1пХп = X + X 2 + 2Х 3 + ...,
п^1

начальны е коэф ф ициенты к о то р о го были вы числены ещё в п. 3 § 1 гл. 4. Из


очевидного р еку р р ен тн о го соотнош ения
п —1

In —^ ^ ^кК—к
к=1
в ы те к а е т, ч т о l ( X ) 2 = l ( X) — X . Реш ая это к в ад р ат н о е уравнение, находим

т =
(зн ак перед радикалом определяется условием 1п > 0). Но если степенной ряд
f ( X ) так ов, ч т о f r — 1 + XX, г Е N, то
[к— 1
п х ) = 1+ Е п 1
----- i
г
{ХХ) к
к\

(разлож ение в ряд Тейлора, к оторое можно п р и н ять пока на веру). В наш ем слу­
чае г = 2, А = —4, и п р о стая п о д стан овк а д аёт окончательное вы раж ение
2п - 2
К —п п —1
(зам ети м , ч т о 1п = Сп - \ — классическое число К а та л ан а ).
П ред л агается провести все пром еж уточн ы е вы кл адки .
190 Г л. 5. Комплексные числа и многочлены

§ 3. Р а зл о ж ен и е в кольце м н огоч л ен ов
1. Э л ем ен тар н ы е св ой ств а д ел и м ости . В разных местах, на­
чинал с гл. 1, мы затрагивали вопросы делимости в кольце Ъ целых
чисел, но так называемая основная теорема арифметики у нас оста­
валась пока недоказанной. Теперь настала пора не только заполнить
этот пробел, но и распространить соответствующие утверждения на
более широкий класс колец. В первую очередь нас интересует кольцо
многочленов Р[Х] над полем Р.
Начнём с произвольного целостного кольца К. Обратимые эле­
менты в К были названы нами делителями единицы. Часто их имену­
ют ещё регулярными элементами. Совершенно очевидно, что много­
член / Е А[Х] обратим (регулярен) в точности тогда, когда deg / = 0
и / = /о — обратимый элемент кольца А, поскольку f g — 1 =>
= > deg / + deg д = deg 1 = 0.
Говорят, что элемент b Е К делится на а £ К (или b кратен
а), если существует такой элемент с Е К, что b = ас (это обозна­
чается а\Ъ). Если а\Ъ и Ь\а, то а и b называются ассоциированными
элементами. Тогда b = гш, где и |1. В силу сделанного выше замеча­
ния ассоциированность многочленов /, g Е А[Х] означает, что они
отличаются лишь обратимым множителем из А.
Элементу Е К называется простым (или неразложимым), если р
необратим и его нельзя представить в виде р = аЪ, где а,Ь — необра­
тимые элементы. В поле Р каждый ненулевой элемент обратим и в
Р нет простых элементов. Простой элемент кольца А[Х] называется
чаще неприводимым многочленом.
Отметим следующие основные свойства отношения делимости в
целостном кольце К.
1) Если а\Ь, Ь|с, то а\с. Действительно, мы имеем b = аЪ', с = 6с',
где b',c' Е К. Поэтому с = (аЬ')с' = а(Ь'с').
2) Если с\а и с\Ь, то с\{а ± Ъ). В самом деле, по условию а = со!,
b = cb1 для некоторых а', b' Е К , и ввиду дистрибутивности а =Ь b =
= с(а'±Ь').
3) Еслп а|Ь, т е а|Ьс. Ясно, что b = аЪ1 = > Ъс = (ab')c = а{Ъ!с).
Комбинируя 2) и 3), получаем
4) Еслп каждый из элементов &ь • • •, Ът Е К делится на а Е
Е iT, то на а будет делиться также элемент Ь\С\ +&2С2+ . . . + &тоСт,
где ci, С2, . .., ст — произвольные элементы.
О п р е д е л е н и е . Говорят, что целостное кольцо iT — кольцо с
однозначным разложением на простые множители (или К — фак­
ториальное кольцо), если любой элемент а ф 0 из К можно предста­
вить в виде
а = и р \ р 2 ■ ■- P r , (1 )

где и — обратимый элемент, а р \ , j : n , ■■ ■, р г — простые элементы (не


§ 3. Разложение в кольце многочленов 191

обязательно попарно различные), причём из существования другого


такого разложения а = vq\q2 ... qs следует, что г = s и при надлежа­
щей нумерации элементов pi и qj будет
Ql --- ^lPl 7 • • • 1 Qr —urpr ,
где u \, . . . , ur — обратимые элементы.
Допуская в равенстве (1) значение г = 0 , мы принимаем соглаше­
ние, что обратимые элементы в К тоже имеют разложение на прос­
тые множители. Ясно, что если р — простой, а и — обратимый эле­
мент, то ассоциированный с р элемент up тоже простой. В кольце Ъ
с обратимыми элементами 1 и —1 отношение порядка (а < Ъ) даёт
возможность выделить положительное простое число р из двух воз­
можных простых элементов =Ьр. В кольце Р [Х ] удобно рассматривать
нормализованные (см. замечание в конце § 2) неприводимые много­
члены.
Справедлива следующая общая
Т е о р е м а 1. Пусть К — произвольное целостное кольцо с раз­
ложением на простые множители. Однозначность разложения в К
(факториальностъ К) имеет место тогда и только тогда, когда
любой простой элемент р Е К , делящий произведение ab Е К , делит
по крайней мере один из множителей а, Ъ.
Д о к а з а т е л ь с т в о . Пусть К факториально, и пусть ab = рс.
Если
а = П а*’ Ъ= П ЪЬ С = П Ск
— разложения а, 6, с на простые множители, то из равенства Y iai х
х П ьз — Р П ск следует, что элемент р ассоциирован с одним из а{
или т.е. р делит а или Ъ.
Обратно: установим однозначность разложения в К , где р\аЪ
= > р\а или р\Ъ. Рассуждая по индукции, допустим, что разложение
всех элементов и з К с числом ^ п простых множителей единственно
(конечно, с точностью до порядка множителей и их ассоциирован­
ности). Докажем теперь это для любого элемента а / 0 , который
может быть разложен на n + 1 простых множителей. Именно, пусть
п+1 га+1
а = П Pi = П ri (2)
i=l j=1

— два разложения элемента а cm ^ п. Условие теоремы, применённое


к р = pn+1 , даёт нам, что pn+i должен делить один из элементов
r i , . . . , т771+1• Без ограничения общности (ибо это вопрос нумерации)
считаем, что pn+i Vm+i • Но r m+1 — простой элемент, поэтому r m+i =
= ирп+1, где и — обратимый элемент. Опираясь на закон сокраще­
ния в К (теорема 1 из § 3 гл. 4), получаем из (2) равенство ПГ=1 Р* =
192 Г л. 5. Комплексные числа и многочлены

— и n j l i r j • В левой его части стоит произведение п простых множи­


телей. По предположению индукции m = п, и оба разложения отли­
чаются лишь порядком простых элементов, снабжённых, возможно,
какими-то обратимыми множителями. □
В произвольном целостном кольце К элемент а / 0 вообще не
обязан допускать разложение типа (1). Что более интересно, имеются
целостные кольца, в которых разложение на простые множители хотя
и возможно, но не является однозначным, т.е. условие теоремы 1,
кажущееся тривиальным, не всегда выполняется.
П р и м е р 1. Р ассм о тр и м мнимое к в ад р ати ч н о е поле Q ( \ / —5) (см. пример
в п. 5 из § 1), а в нём целостное кольцо К = {а + by/ —5 | а, 6 Е Z }. Н орм а
N( a + by/—5) = а2 + 5 Ъ2 к аж д о го отли чного от нуля элем ента а Е К — целое
полож ительное число. Если а о брати м в К , то ( N ( a ) ) ~ 1 = N ( a _ 1 ) Е Z , о тк у д а
N (a ) = 1. Э то возмож но лиш ь при b = 0, а = =Ь1. Т аким образом , в К , к а к и
в Z , о б рати м ы м и элем ентам и являю тся только =Ь1. Если а = е а ± а 2 . . . <тг 7 ^ О,
£ = =Ы, то 7V(<a) = N ( a i ) . . . N ( a r ). Т ак к а к 1 < N(a{) Е N, то при заданном а
число множ ителей г не м ож ет неограниченно расти . С тало бы ть, разлож ение на
п росты е м нож ители в К возмож но.
В м есте с тем число 9 (да и не только оно) доп ускает два сущ ественно р а з­
личны х разлож ения на п росты е множ ители:

9 = 3 • 3 = (2 + v/ Z 5)(2 - V ^ E ) .

Н еассоциированность элементов 3 и 2 ± у/—5 очевидна. Далее, N ( 3) = N(2 =Ь


± у/—5) = 9. П оэтом у из разлож ения а = ац<Т2 для а = 3 или 2 ± \ / ~ 5 с необра­
ти м ы м и а ± , а 2 следовало бы 9 = N ( a ) = N ( a i ) N ( c t 2 ), т.е. N(cti) = 3, i — 1 , 2 ,
ч т о невозмож но, поскольку уравнение ж2 + 5 у 2 = 3 с х , у Е Z неразреш им о. Э тим
д о к азан а п р о с т о т а элементов 3 и 2 ± \ / —5.
Р ассм о тр ен н ы й пример содерж и т в зароды ш е большой к р у г вопросов,
части ч н о остаю щ ихся пока нереш ённы ми, о к в ад р ат и ч н ы х полях Q ( \ / d ). Их изу­
чение входит в к р у г вопросов алгебраической теории чисел.
Прежде чем устанавливать при помощи теоремы 1 факториаль-
ность тех или иных колец, мы введём важные вспомогательные по­
нятия, представляющие независимый интерес.
2. НОД и Н О К в кольцах. Пусть К — целостное кольцо. Под
наибольшим общим делителем двух элементов a,b Е К мы будем
понимать элемент d Е К, обозначаемый НОД(а,Ь) и обладающий
двумя свойствами:
i) d\a, d\b;
ii) c|a, c\b = > c\d.
Ясно, что вместе c d свойствами i), ii) обладает любой ассоции­
рованный с ним элемент. Обратно: если с и d — два наибольших
делителя элементов а и Ь, то будем иметь c\d, d\c, так что с и б? ассо­
циированы. Обозначение НОД(а,6) относится к любому из них, т.е.
в этой записи ассоциированные элементы не различаются. С учётом
такого соглашения к определяющим свойствам i), ii) наибольшего
общего делителя добавятся следующие:
ш) НОД(а, Ь) = а <(=> а\Ь;
§ 3. Разложение в кольце многочленов 193

iv) НОД(а, 0) = а ;
v) НОД(баДб) =Ш ОД(а, 6);
vi) НОД(НОД(а, 6), с) = НОД(а, НОД(6, с)).
Проверка их не вызывает никаких трудностей и оставляется чи­
тателю. Свойство vi) позволяет также распространить понятие НОД
на произвольное конечное число элементов.
По аналогии с НОД (а, 6) вводится дуальное понятие наименьше­
го общего кратного т = НОК(а,6) элементов а, 6 Е К, также опре­
делённого с точностью до ассоциированности двумя свойствами:
i') a|m, Ь\т;
и') а|с, Ь\с => т\с.
В частности, полагая с = ab, получаем т\аЪ.
Т е о р е м а 2. Пусть для элементов а,Ъ целостного кольца К
существуют НОД (а, 6) и НОК(а,6).
Тогда:
а) НОК(а, 6) = 0 <(=> а — 0 или 6 = 0.
б) а, b ф 0, т = НОК(а, 6), ab = dm = > d = НОД(а, 6).
Д о к а з а т е л ь с т в о . Утверждение а) вытекает непосредствен­
но из определения НОК(а,6). Для доказательства б) нам нужно убе­
диться, что элемент d, определённый равенством ab = dm, обладает
свойствами i), ii). В самом деле, i') = > т = а'а, т = 6'6. Зна­
чит, ab = dm = da'a, откуда после сокращения на а, допустимо­
го в любом целостном кольце, имеем b = da', т.е. d|6. Аналогично,
ab = dm = db'b = > а = db', т.е. d|a. Мы пришли к i).
Далее, пусть a = /a ", b = fb". Положим с = fa"b". Тогда с =
= ab" = 6а" — общее кратное а и 6. Согласно свойству и') с = с 'т
для некоторого с' Е К , откуда / с 'т = /с = / 2а//6// = аб = dm, т.е.
d = /У и /|d. Мы пришли к ii). □
О п р е д е л е н и е . Элементы а, 6 целостного кольца, в котором су­
ществует НОД, называются взаимно простыми, если НОД(а,6) = 1.
Из свойств i), ii), i'), ii') или из теоремы 2 нельзя извлечь ни
способа вычисления, ни доказательства существования НОД(а,6) и
НОК(а, 6). Теоремой 2, б) устанавливается лишь соотношение между
ними.
Предположим теперь на время, что К — факториальное кольцо.
Обозначим через V множество простых элементов в К такое, что
всякий простой элемент из К ассоциирован с одним и только одним
элементом из V . Рассматривая разложения двух элементов а, 6 Е К ,
удобно считать, что в них входят одинаковые элементы из V , но
некоторые, возможно, с нулевыми показателями, т.е.
a = up1k1 ...p krr , b = vp[1 ...р 1;,
и\ 1 , г|1; ki ^ 0, k ^ 0; Pi е Р ; 1 ^ г ^ г.
При помощи теоремы 1 получается легко запоминающийся
13 А .И. К о стр и к и н
194 Г л. 5. Комплексные числа и многочлены

П р и з н а к д е л и м о с т и . Пусть а,Ъ — элементы факториаль­


ного кольца К , записанные в виде (3).
Справедливы утверждения:
1) а\Ь тогда и только тогда, когда ki ^ li, i = 1, 2,..., г;
2) НОД(а, 6) =р*1 ...р*’', где Si = min {ki,U}, г = 1,2,
3) НОК(а, 6) = р^1 .. .р*’’, где £, = maxjfcj, Z*}, г = 1,2,..., г.
Таким образом, в качестве Si нужно брать наименьший из двух
показателей ki,li, а в качестве А — наибольший. В частности, эле­
менты а,Ъ Е К взаимно просты в точности тогда, когда простые
множители, входящие в разложение одного элемента, не входят в раз­
ложение другого.
Недостаток этого признака делимости заключается, конечно, в
том, что на практике бывает весьма трудно получить разложение
вида (3). Даже в случае К — Ъ (этим не предвосхищается факто-
риальность Z) приходится довольствоваться незначительными вариа­
циями метода прямого перебора простых чисел, меньших данного
числа п. Тем более приятно, что в факториальных кольцах, о кото­
рых пойдёт речь ниже, имеется эффективный способ вычисления
НОД(а, Ъ) и НОК(а, Ъ).
3. Ф ак то р и а л ь н ость евклидовы х колец. Алгоритм деления с
остатком в Z и Р[Х] (см. и. 3 § 9 гл. 1 и и. 3 § 2) делает естественным
рассмотрение целостного кольца АТ, в котором каждому элементу
а ф 0 поставлено в соответствие неотрицательное целое число 6 (a),
т.е. определено отображение
й : K \ { 0 } = K* ^ N U { 0 }
так, что при этом выполняются условия:
El) S(ab) ^ 6 (a) для всех а,Ъ ф 0 из К]
Е2) каковы бы ни были а,Ъ Е К, Ъ ф 0, найдутся q,r Е К (q —
“частное”, г — “остаток”), для которых
а = qb + г; 6 (г) < 6 (b) или г — 0. (4)

Целостное кольцо К с этими свойствами называется евклидо­


вым кольцом. Полагая 6 (a) = \а\ для а Е Ъ и 6 (a) = deg а для
а = а(Х) Е Р[Х], мы приходим к выводу, что Z и Р[Х\ — евклидовы
кольца.
В евклидовых кольцах существует способ нахождения НОД (а, Ъ),
называемый алгоритмом последовательного деления или алгорит­
мом Евклида и заключающийся в следующем. Пусть даны ненулевые
элементы а, Ъевклидова кольца К. Применяя достаточно большое (но
конечное) число раз предписание Е2), мы получим систему равенств
§ 3. Разложение в кольце многочленов 195

типа (4) с последним нулевым остатком:


a = qib + r1, S(ri)< S(b),
b = q2 r i + r 2, b{r2 ) < 8 {ri),
П = qzr2 + r3, S(r3 ) < S(r2),
(5)

Tk- 2 = qkTk- 1 + rk, S(rk) < 5(rk- 1 ),


rk- i = qk+irk, r k+1 = 0.
Это действительно так, поскольку строго убывающая цепочка
неотрицательных целых чисел S(b) > J(ri) > 8 (г2 ) > ... должна
оборваться, а обрыв может произойти только за счёт обращения в
нуль одного из остатков.
Утверждается, что последний отличный от нуля остаток явля­
ется как раз наибольшим общим делителем элементов а и b в смы­
сле определения, данного в и. 2. В самом деле, по условию r^|r^_i.
Двигаясь в системе (5) снизу вверх и используя свойство 4) отноше­
ния делимости, сформулированное в и. 1, получим цепочку r^|r^_i,
rk \rk- 2, rk\r2, rk\ri и, наконец, rk\b, rk\a. Стало быть, rk — общий
делитель элементов а и Ъ. Обратно: пусть с — любой другой делитель
тех же элементов; тогда c|ri, и, двигаясь теперь в системе (5) сверху
вниз, мы получим цепочку отношений делимости с|г2, с|гз, . .., с|г^.
Последнее из них окончательно убеждает нас в том, что НОД(а,5)
существует, причём имеет место равенство
п = Н 0Д (М ). (б)
Обратим, далее, внимание на то обстоятельство, что каждый
остаток Гг, в системе (5) выражается в виде линейной комбинации
с коэффициентами в К двух предыдущих остатков Г{-\ и Г{~2. При
этом г\ выражается через а и b: г\ — а —qib, а 7*2, выражаясь через b
и г\ , тем самым является опять линейной комбинацией а и Ь. После­
довательная подстановка в г г выражений r«_i и г^_ 2 через а и b даст
нам при i — к выражение
rk = аи + bv (7)
с какими-то элементами и, v Е К.
Сопоставляя (6) и (7) и принимая во внимание теорему 2, б), по­
лучаем следующее утверждение.
Т е о р е м а 3. В евклидовом кольце К любые два элемента а,Ь
имеют наибольший общий делитель и наименьшее общее кратное.
При помощи алгоритма Евклида можно найти такие u,v Е К, что
будет выполнено соотношение
НОД(а, b) = аи + bv.
13
196 Г л. 5. Комплексные числа и многочлены

В частности, элементы a,b Е К взаимно просты тогда и толь­


ко тогда, когда существуют элементы u,v е К, для которых
аи + bv = 1.
С л е д с т в и е . Пусть а,Ъ,с — элементы евклидова кольца К.
i) Если НОД (а, 6) = 1 и НОД(а,с) = 1, то НОД (a,be) = 1.
п) Если а\Ъс и НОД (а, 6) = 1, то а\с.
ш) Если Ь\а, с\а и Н0Д(6, с) = 1, то Ьс\а.
Д о к а з а т е л ь с т в о , i) Согласно теореме 3 имеем равенства ащ +
+ bv1 = 1, аи2 + cv2 = 1. Перемножал соответственно их левые и пра­
вые части, находим a(auiU2 ~\~bu2 Vi +CU1 V2 ) -\-bc(viV2 ) = 1, что и даёт
нужное утверждение.
и) Имеем au-\-bv = 1, откуда aC'U-\-(be)v = с. Но Ьс = аге, поэтому
с = а(си + гее), т.е. а|с.
ш) Согласно свойству ii') НОК
Ь\а, с\а = > НОК(6, с)\а = > 6с|а,
поскольку Ьс = НОД(6, с)НОК(6, с) и НОД(6, с) = 1 по условию. □
Читатель легко распространит утверждение теоремы 3 на случай
произвольного конечного числа элементов евклидова кольца.
Непосредственным шагом к установлению факториальности
евклидова кольца служит
Ле мма . Всякое евклидово кольцо К является кольцом с разло­
жением (т.е. любой элемент а ф 0 из К записывается в виде (1)).
Д о к а з а т е л ь с т в о . Пусть элемент а Е К обладает собствен­
ным делителем Ь: а = 6с, где би с — необратимые элементы (другими
словами, а и b не ассоциированы). Докажем, что S(b) < 6 (a).
В самом деле, согласно Е1) непосредственно имеем S(b) ^ S(bc) =
= 6 (a). Предположив выполнение равенства 6 (b) = S(a), мы восполь­
зуемся условием Е2) и найдем q,r с b = qa + г, где 6 (г) < 6 (a) или
же г = 0. Случай г = 0 отпадает ввиду неассоциированности а и Ь.
По той же причине 1 —qc ф 0. Стало быть, снова по Е2) (поменять
местами а и Ь) имеем
5(a) = 5(b) ^ 5(b( 1 —qc)) = 5(Ъ —qa) = 5(г) < 5(a)
— противоречие. Итак, 5(b) < 5(a).
Если теперь а = а\а 2 ...а п, где все ai необратимы, то
am+ia m+2 • • •ап — собственный делитель ашаш+\ ... an, и по дока­
занному
5(a) = 5(aia 2 ... ап) > 5(а2 ... ап) > ... > 5(ап) > 5(1).
Эта строго убывающая цепочка неотрицательных целых чисел име­
ет длину п ^ 5(a). Значит, для элемента а Е К имеется разложение
максимальной длины, которое и будет разложением на простые мно­
жители. □
§ 3. Разложение в кольце многочленов 197

Т е о р е м а 4. Всякое евклидово кольцо К факториально (т.е.


обладает свойством однозначности разложения на простые мно­
жители) .
Д о к а з а т е л ь с т в о . С учётом леммы и критерия факториаль-
ности, содержащегося в теореме 1, нам остаётся показать, что если
р — простой элемент кольца К , делящий произведение be каких-то
элементов b, с Е К, то р делит либо b, либо с.
Действительно, при b = 0 или с — 0 доказывать нечего. Если же
be ф 0 и d = НОД(Ь,р), то d, будучи делителем простого элемента р,
либо равен 1 (точнее, является делителем 1), либо ассоциирован с р. В
первом случае b и р оказываются взаимно простыми, и утверждение
и) следствия теоремы 3 позволяет заключить, что р\с. Во втором
случае d = up, и 11 и, значит, р|Ь. □
С л е д с т в и е . Кольца Ъ и Р[Х] факториальны (Р — произволь­
ное поле).
Д о к а з а т е л ь с т в о . Как отмечалось непосредственно после
определения евклидовости, на каждом из колец Z,P[X] задана есте­
ственная функция S с нужными свойствами El), Е2), так что оста­
ётся сослаться на теорему 4. □
Очень рекомендуется провести отдельно для Ъ и для Р[Х] до­
казательства факториальности, чтобы устранить всякую видимость
какого-либо наукообразия в этом вопросе.
Факториальность кольца многочленов Р[ Х l, ... , Хп], п > 1, уже
не являющегося евклидовым, устанавливается в [ВА III]. Там же при­
водятся дополнительные примеры евклидовых колец.
4. Н еп ри води м ы е м ногочлены . Специализируя данное ра­
нее определение простого элемента, ещё раз подчеркнем, что много­
член / ненулевой степени из кольца Р\Х] называется неприводимым
в Р[Х] (или неприводимым над полем Р), если он не делится ни на ка­
кой многочлен g Е Р[Х], у которого 0 < degg < deg/. В частности,
всякий многочлен первой степени неприводим. Совершенно очевид­
но, что неприводимость многочлена степени > 1 или разложение его
на неприводимые множители — понятия, тесно связанные с основ­
ным полем Р, как это показывает уже известный нам по построению
комплексных чисел многочлен X 2 + 1 = (X + г)(Х —г). Многочлен
X 4 + 4 приводим над Q, хотя об этом и нелегко догадаться:
X 4 + 4 = ( X 2 - 2Х + 2)(Х 2 + 2Х + 2).
Оба множителя справа неприводимы не только над Q, но и над R,
будучи приводимыми, однако, над С.
Как простых чисел в Z (см. § 9 гл. 1), так и нормализованных
неприводимых многочленов над произвольным полем Р бесконечно
много.
198 Г л. 5. Комплексные числа и многочлены

В случае бесконечного поля Р это ясно: достаточно рассмотреть


неприводимые многочлены вида X —с, с Е Р.
Если же поле Р конечно, то годится рассуждение Евклида. Имен­
но, пусть уже найдены п неприводимых многочленовр\ ,... ,рп. Мно­
гочлен / = Р1 Р2 ... Рп +1 имеет хотя бы один нормализованный прос­
той делитель, поскольку deg / ^ п. Обозначим его через рп+ь Он
отличен от p i , ... ,рп, поскольку из p n+ i = P s для какого-то s ^ п
с л е д о в а л о бы p s\(f ~ Pi ■■■ Рп), т . е . р « | 1 . □
Так как многочленов заданной степени над конечным полем ко­
нечное число, то можно сделать следующее полезное заключение.
Над любым конечным полем существуют неприводимые много­
члены сколь угодно высокой степени.
Это утверждение качественного характера будет уточнено в
[ВА III].
Неприводимые многочлены над полем Q играют особую роль в
теории полей алгебраических чисел. Так как умножением на подхо­
дящее натуральное число от многочлена из Q[X] всегда можно пе­
рейти к многочлену из Z[X], то естественно уточнить сначала связь
между свойствами приводимости над Q и над Ъ. Имея в виду дру­
гие приложения, мы докажем одно общее утверждение о многочленах
над факториальным кольцом К.
Назовём содержанием многочлена / = ао + а \Х + ... + апХ п Е
£ К [X] наибольший общий делитель d = d(f) всех его коэффициен­
тов. До сих пор мы говорили о НОД (а, Ь) двух элементов, но свойства
i)— vi) НОД позволяют без труда распространить это понятие на лю­
бое конечное число элементов целостного кольца.
Если d(f) — обратимый элемент в АТ, то многочлен / называют
примитивным.
Л е м м а Еа ус с а . Пусть К — факториальное кольцо и f,g Е
Е К[Х]. Тогда
d(fg) « d(f) ■d(g ) .

В частности, произведение двух примитивных многочленов сно­


ва будет примитивным многочленом (здесь и ниже « означает ра­
венство с точностью до ассоциированности).
Д о к а з а т е л ь с т в о . Начнём с последнего утверждения. Пусть
f = ао + а \Х + ... + апХ п, g = bo + Ъ\Х + ... + bmX m
— примитивные многочлены из К[Х], произведение f g которых не
является примитивным. Существует, стало быть, простой элемент
р Е К, делящий d(fg). Выберем наименьшие индексы s,£, для кото­
рых р J(as, р J(bt . Такие индексы найдутся ввиду примитивности / и
д. Коэффициентом при X s+t в fg будет
cs+t —osbt + (a8+ibt~i + as+2^-2 + ...) + (a8-ibt+i + as- 2^+2 + •••)•
§ 3. Разложение в кольце многочленов 199

Так как as-i и bt-i при i > 0 делятся на р по условию и p\cs+t по


предположению, то мы имеем соотношение
ри = asbt + рг,
из которого следует, что p\asbt. Ввиду факториальности К имеем
p\as или p\bt — противоречие, доказывающее наше утверждение.
Переходя к общему случаю, запишем произвольные многочлены
f,g е К [ Х } в виде
/ = d( f ) f 0, д = d(g)g0,
где /о 5до — примитивные многочлены. Так как fg = d(f)d(g) • /оро
и по доказанному d(fogo) ~ 1 , то, стало быть, d(fg) « d(f)d(g). □
С л е д с т в и е . Многочлен / Е Z[X], неприводимый над Z , продол­
жает оставаться неприводимым и над Q (deg / > 0).
Д о к а з а т е л ь с т в о . Согласно следствию теоремы 4 Z — фак­
ториальное кольцо, поэтому к Ъ\Х\ применима лемма Гаусса. Пред­
положим, что / = gh, где / Е Z[X], a р ,/i Е Q[X]. Умножая обе
части этого равенства на наименьшее общее кратное знаменателей
всех коэффициентов у g и /г, мы перепишем его в виде а / =
где а, b Е Z и — примитивные многочлены над Z. По лемме
Гаусса а • d(f) = b (в данном случае без ограничения общности ассо­
циированность заменяется на равенство), так что получается разло­
жение / = d(f)goho над Z. Остаётся вспомнить о неприводимости /
в Z[X\. □
К р и т е р и й н е п р и в о д и м о с т и (Эйзенштейн). Пусть
f ( X ) = Х п + а1 Х п- г + ... + ап- \ Х + ап
— нормализованный многочлен над Z, все коэффициенты сд,..., ап
которого делятся на некоторое простое число р, но ап не делился
нар2. Тогда f ( X ) неприводим над Q.
В самом деле, предположив противное и воспользовавшись
следствием леммы Гаусса, мы запишем / в виде произведения двух
многочленов над Z:
f ( X ) =( X s +hx * -1 +... +bs)(xl +d X 1- 1 +... +a), S t >о.

Это разложение сохранится и в кольце Z P[X\, элементы которого по­


лучаются из целочисленных многочленов взятием их коэффициентов
по модулю р. По условию Hi = 0, где — класс вычетов по модулю
р, соответствующий целому числу а^. Но кольцо ЪР[Х\ факториально
(следствие теоремы 4). Сравнивая два разложения:
X sX* = (X s + ЪхХ8- 1 + ...)(х* + d X * - 1 + ...), s + t = n,
мы неизбежно приходим к заключению, что Ь{ = 0 = су, т.е. все
коэффициенты b^,Cj делятся на р. В таком случае ап = bsct делится
на р 2 — противоречие, устанавливающее справедливость критерия
Эйзенштейна. □
200 Г л. 5. Комплексные числа и многочлены

П р и м е ч а н и е . Критерий действует и в том случае, когда стар­


ший коэффициент ао отличен от 1 , но не делится на р.
П р и м е р 2. М ногочлен / ( X ) = Х р 1 + Х р 2 + . . . + X + 1 неприводим над
Q при любом простом р.
Д о стато ч н о за м ет и т ь , ч т о вопрос о неприводим ости / ( X ) эквивалентен
вопросу о неприводим ости м ногочлена

( X + 1)Р — 1
/(* + 1) (X + 1) - 1
все коэф ф ициенты ко то р о го , кром е старш его, делятся на р в первой степени
(свойство бином иальны х коэф ф ициентов, отмеченное в упр. 6 из § 3 гл. 4) и к
котором у, следовательно, применим к р и тер и й Э йзенш тейна.

УП РА Ж Н ЕН И Я

1. П о к а за ть , ч то

nZ + mZ = Z • НОД(п, га),
nZ П mZ = Z • Н ОК(п, га).

2. Пусть / , д — нормализованные многочлены из Ъ \ Х \ . П оказать, что


в выражении Н О Д (/, д ) = f и + g v с u , v Е Z[X] можно считать deg a < degg,
deg v < deg / .
3. Являются ли кольца Z [д/—3] и Z g [ X ] факториальными?
4. Разлож ить на неприводимые множители в Z \ X ] многочлены Х п — 1 при
5 ^ п ^ 12.
5. Доказать, что неприводимые множители однородного многочлена
f ( X , Y) = а 0 Х п + a \ X n ~ l Y + . . . + + an Y n <= Q[X, Y]

однородны и /( X , Y ) неприводим тогда и только тогда, когда неприводим мно­


гочлен /( X , 1) = ao X n + a i X n_1 + . . . + а п - \ Х + а п G Q[X],
6. Пусть Р — поле и /( X ) = J T >0 а^Х г — формальный степенной ряд из
Р [ [ Х ] ] (см. упр. 5 из § 2). Условие ао ф 0, или, что эквивалентно, щ (/) = 0 необхо­
димо и достаточно для существования степенного ряда д ( Х ) £ Р[[Х]], обратного
к / : f 9 = 1- Например, (1 —X ) -1 = J X > 0 Х г . С точностью до ассоциированно­
сти X — единственный простой элемент в Р[[Х]]. Кольцо Р[[Х]] факториально.
Обосновать эти утверждения.
7. П оказать, что d e t ( x { j ) = • • • х тт( п ) , п — неприводимый од­
нородный степени п многочлен от п 2 независимых переменных ж д .
У к а з а н и е . Рассуждая от противного, предположить, что

det(T ^ ) = х д 2 ( . .. , X i j , . .

Так как det (жд) — линейный однородный многочлен от переменных, стоящих в


одном фиксированном столбце, то один из множителей g i , g 2 является линейным
однородным многочленом от жд, 1 <С г <С п, при фиксированном j , в то время как
другой совсем не зависит от ж д , 1 ^ i ^ п . Аналогичные рассуждения сохраняют­
ся при замене столбцов на строки. Пусть, скажем, х \ \ входит в д \ . Тогда д 2 не
содержит х \ j , 1 ^ j ^ п , откуда следует что д 2 не содержит жд, 1 ^ г, j ^ п,
т.е. д 2 — константа.
§ 4 • Поле отношений 201

§ 4. П оле отн ош ен и й

1. П о ст р о ен и е поля отн ош ен и и ц ел остн ого кольца. В пре­


дыдущих двух параграфах было установлено много свойств, общих
для Ъ и Р[Х]. Наша ближайшая цель — вложить Р[Х] в поле, причём
сделать это нужно самым экономным способом, образцом для ко­
торого может служить вложение Ъ в Q. Фактически нисколько не
сложнее решать точно такую же задачу для произвольного целост­
ного кольца А.
Рассмотрим множество А х А* (А* = А \ {0}) всех пар (а, b) эле­
ментов а, b G А с b ф 0. Это множество разобьём на классы, по­
лагая пары (а, Ь) и (с, d) принадлежащими одному и тому же клас­
су, как только ad = be; в записи: (а, 6) ~ (с, б?). Ясно, что всегда
(а, Ь) ~ (а, 6). Далее, (а, 6) ~ (с, б?) (с, б?) ~ (а, Ь) и, наконец,
(а, 6) ~ (с, б?), (с, б?) ~ (е,/) = > (а, 6) ~ (е,/). Действительно, име­
ют место равенства ad = be, с / = de, откуда adf = bef = bde, т.е.
d(af — be) = 0. Ho d ф 0, и в силу целостности кольца А получаем
а / = be, что и означает (а, Ь) ~ (е,/). Итак, отношение ~ рефлек­
сивно, симметрично и транзитивно, т.е. (см. § б гл. 1 ) оно является
отношением эквивалентности на множестве А х А* и, следовательно,
определяет разбиение А х А* на непересекающиеся классы.
Пусть <3(Д) — множество всех классов эквивалентности, или, что
то же самое, Q(A) есть фактормножество А х А* / ~ множества Ах А*
по отношению эквивалентности Будем обозначать символом [а, Ь\
класс, в котором лежит упорядоченная пара (а, Ь). По определению
fa, b\ = [с, d] <(=> ad = be. (i)

Если на множестве А х А* задать операции сложения и умножения


формулами
(а, Ь) + (с, d) = (ad + be, bd), (a, b)(c, d) = (ас, bd)
(а это возможно, поскольку в й и з Ь / 0Д / 0 следует bd 7^ 0), то
эти бинарные операции можно перенести на Q(A). В самом деле, нам
нужно показать, что

То же самое выражается соотношениями


(ad + bc)b'd = (a! d + b'c) bd,
ас • b'd = а1с • bd,
истинность которых прямо вытекает из условия a'b = ab' . Аналогич­
ный результат получим, заменяя (с, d) на (c^d'), где cd' = с'd. Мы
приходим к заключению, что на Q(A) операциями сложения и умно­
202 Г л. 5. Комплексные числа и многочлены

жения, не зависящими от выбора представителей в классах эквива­


лентности, будут
[a, b] 0 [с, d] = [ad 0 be, bd], [а, b] [с, d] = [ас, bd]. (2)
Здесь следовало бы писать [а, 6] 0 [с, d] и [а, 6] 0 [с, d], но без ущерба для
ясности 0 и 0 заменены обычными знаками суммы и произведения.
Убедимся теперь в том, что Q(A), рассматриваемое вместе с опе­
рациями (2), есть поле. Действительно, например, из соотношений
[а, Ь] + ([с, d\ + [е, /]) = [а, Ь] + [с/ + de, df] = [adf + bef + bde, bdf],
([a, b] 0 [c, d]) + [e, /] = [ad 0 be, fed] 0 [e, /] = [ad/ 0 bef 0 bde, bd/]
вытекает закон ассоциативности для операции сложения. Ассоциа­
тивность умножения очевидна. Далее, соотношения
([а, Ь] 0 [с, d]) • [е, /] = [ade 0 bee, bd/],
[а, Ь][е, /] + [с, d][e, /] = [adef + beef, bfdf] = [fade + bce)f, (bdf)f)
и условия (1 ) равенства классов эквивалентности показывают, что
выполняется закон дистрибутивности.
Столь же просто проверяется коммутативность операций сложе­
ния и умножения. Нулём для сложения является класс [0,1] ([0,1] 0
0 [а, Ь\ = [а, Ь]), а единицей для умножения — класс [1,1]. Далее,
—[а, Ь] = [—а,Ь], поскольку [а, Ь] 0 [—а, Ь] = [0, Ь2] = [0,1]. Всё это
вместе взятое означает, что Q(A) — коммутативное кольцо с еди­
ницей. Если [а, Ь] ф [0,1], то а / 0 в А, стало быть, [b, a] G Q(A) и
[а, Ь][Ь, а] = [1 , 1 ], так что мультипликативным обратным к [а, Ь]
7^ [0,1] служит [Ь, а]. Тем самым показано, что Q(A) — поле.
Сопоставление a н0 [a, 1 ] определяет инъективное отображение
/ : А —у Q(A), которое на самом деле является морфизмом ((моно­
морфизмом) колец (/(а 0 Ь) = /(а) 0 /(b), /(ab) = /(a)/(b); а 7^ b = >
= > /(а) /(b)). Для любого элемента ж = [a, b] G Q(A) имеем
[6,1]х = [а, 1],
так что х есть “отношение” /(a )//(b ) элементов из f(A). По этой
причине Q(A) называется полем отношений кольца А.
Удобно отождествить каждый элемент a G Д с его образом /(а) =
= [а, 1] G Q(A), т.е. заменить А на f(A). Можно поступить несколь­
ко иначе: заменить каждый из элементов [a, 1] G Q(A) на a G Д ,
оставив без изменения все другие элементы поля Q(A), и произвести
надлежащие замены в формулах (2). Именно, следует положить
a 0 [b, с] = [ас 0 b, с], a[b, с] = [ab, с].
В результате целостное кольцо Д окажется с самого начала подколь­
цом поля, изоморфного Q(A) и изображаемого обычно тем же симво­
лом Q(A). После такого отождествления разумно называть элементы
§ 4 • Поле отношений 203

[а, Ъ] дробями и писать короче и в привычной форме

Введённые выше правила действий с классами [а, Ь] повторяют, как


нетрудно догадаться, правила действий с дробями в поле (см. (8) в
п. 4 § 3 гл. 4). Нами доказана
Т е о р е м а 1. Для каждого целостного кольца А существует
поле отношений (или поле частных, поле дробей) Q(A), элементы
которого имеют вид а/Ъ, а Е А, 0 ф b Е А. Действия с дробями
подчиняются правилам (1), (2), где следует положить [а,Ъ\ = а/Ъ.
Конструкция полей отношений довольно часто используется в ма­
тематике. Её естественность оправдывается хотя бы тем, что поле Q
есть не что иное, как поле отношений Q(Z) кольца Z. Легко видеть
(проверьте это), что Q(A) = Л, если А — поле.
З а м е ч а н и е . Можно доказать, что если целостное кольцо А есть
подкольцо поля Р и каждый элемент х Е Р записывается в виде
отношения а/Ъ элементов а Е Л, 0 ф b Е Л, то Р = Q(A). Например,
Q(Vd) = Q(Z[y/d\).
2. Поле рациональных дробей. Пусть Р — поле, Р[Х\ —
кольцо многочленов над Р. Поле отношений Q(P[X]) кольца Р[Х]
обозначается символом Р(Х) (смена квадратных скобок на круглые)
и называется полем рациональных дробей от переменной X с коэф­
фициентами в Р.
Следует заметить, что поле рациональных дробей Р(Х) всегда
содержит бесконечное число элементов, а его характеристика совпа­
дает с характеристикой поля Р. Поле FP(X) доставляет пример бес­
конечного поля характеристики р > 0.
К