Академический Документы
Профессиональный Документы
Культура Документы
8)
ББК 22.143
К 71
К о с т р и к и н А. И. В в е д е н и е в а л г е б р у . Ч а с т ь I. О с н о в ы а л г е б
р ы : Учебник для вузов. — 3-е изд. — М.: ФИ ЗМ А ТЛИ Т, 2004. — 272 с. —
ISBN 5-9221-0487-Х.
Рассмотрены системы линейных уравнений, элементарная теория мат
риц, теория определителей, простейшие свойства групп, колец и полей, комп
лексные числа и корни многочленов. Помещено большое число упражнений
различной степени трудности. Специальный раздел посвящен обсуждению
некоторых нерешенных задач о многочленах.
Второе издание — 2001 г.
Д ля студентов младш их курсов университетов и вузов с повышенными
требованиями по математике.
Ил. 28.
ЕЛАВА 1
ИСТОКИ АЛГЕБРЫ
ГЛАВА 2
М АТРИЦЫ
ГЛАВА 3
ОП РЕДЕЛИ ТЕЛИ
ГЛАВА 4
ГРУ П П Ы . К О Л ЬЦ А. ПОЛЯ
§ 2. Г р у п п ы ........................................................................................................... 139
1. Определение и примеры (139). 2. Ц иклические группы (142).
3. И зоморфизмы (143). 4. Гомоморфизмы (147). 5. Словарик.
П римеры (148). Упражнения (149).
§ 3. Кольца и п о л я ............................................................................................. 151
1. Определение и общие свойства колец (151). 2. Сравнения.
Кольцо классов вы четов (155). 3. Гомоморфизмы колец (156).
4. Типы колец. Поле (157). 5. Х арактери сти ка поля (161). 6. З а
мечание о линейных системах (163). Упражнения (165).
ГЛАВА 5
К О М П Л ЕКСН Ы Е Ч И С Л А И М НОГОЧЛЕНЫ
ГЛАВА 6
К О Р Н И М Н О ГО Ч Л Е Н О В
ПРИЛОЖЕНИЕ
Н ЕРЕШ ЁННЫ Е ЗА Д А Ч И О М Н О ГО Ч ЛЕН АХ
ПРЕДИСЛОВИЕ
***
Несколько слов о [ВА I]. Эту книгу можно считать алгеброй в
миниатюре. Фундаментальные понятия группы, кольца, поля, новые
для большинства студентов, вводятся по возможности неформально
и в минимальных дозах, хотя общее количество производных поня
тий получается довольно большим. Их не нужно запоминать: они
станут привычными после самостоятельной работы над задачами и
упражнениями. Для удобства выделяется несколько наиболее употре
бительных алгебраических систем таких, как группы (Z, +), Sn, Ап,
GLn, SLn, кольцо многочленов, поля Q, 1, С и Zp, на фоне которых
демонстрируется язык алгебры. По традиции и по соображениям
преемственности между школой и вузом вначале излагается техника
матриц и определителей, используемая для отыскания и исследова
ния решений систем линейных уравнений. На этом пути естествен
ным образом возникают и основные алгебраические структуры. Их
Предисловие 9
ДОПОЛНИТЕЛЬНАЯ ЛИ ТЕРА ТУ РА
ГРЕЧЕСКИЙ АЛФАВИТ
Аа вр г7 Л5 Ее
альфа бета гам м а дельта эпсилон д зета
Hr] ее Ji Кк лх М ц
эта тэта йота каппа ламбда мю
Nv Оо П 7Г Рр Sa
ню кси омикрон пи ро сигма
Тт Tv фф ф'ф Г2ио
тау ипсилон фи хи пси омега
Согласно общему плану, изложенному в предисловии, схема зави
симости глав в книге линейна. Фактически студенту-первокурснику
полезно читать всё подряд, обращая особое внимание на многочи
сленные примеры и на упражнения, значительная часть которых
обычно предлагается во время экзамена.
Искушённому читателю (скажем, преподавателю или студенту
второго курса) будет нетрудно начинать чтение практически с лю
бого места, естественно — при наличии готовности обращаться
время от времени к определениям в предыдущих параграфах и гла
вах. Не все новые понятия вводятся в абзацах, начинающихся словом
“определение”. Подробное оглавление и предметный указатель помо
гут найти нужное место в книге.
Каждая глава разбита на несколько параграфов, а каждый па
раграф — на несколько пунктов с собственными названиями. Внут
ри праграфа теоремы, предложения, леммы, следствия имеют свою
собственную нумерацию: теорема 1 , теорема 2 , ...; лемма 1 , лем
ма 2 , ... С этой примитивной, но весьма наглядной и экономной ну
мерацией при ссылках на утверждения из другого параграфа прихо
дится писать “теорема i § j ” или даже “теорема i § j гл. к”,
однако это не вызывает неудобств.
Конец доказательства отмечается знаком □.
Для сокращения используются простейшие логические символы.
Знак импликации = > в записи А = > В имеет простую смысло
вую нагрузку, что “А влечёт В ” или “из А следует 5 ”, в то вре
мя как “А В ” означает эквивалентность высказываний i и 5 ,
т.е. ( ... тогда и только тогда, когда ...). Квантор всеобщности V
служит заменой выражения “для любого”. Остальные обозначения
понятны из контекста.
Выше приведён целиком греческий алфавит с указанием произно
шения букв. Наблюдаемая здесь путаница досадна, поскольку буквы
греческого алфавита весьма употребительны в математике.
Глава 1
ИСТОКИ АЛГЕБРЫ
§ 1. А л г е б р а в к р атц е
В наши дни не без основания говорят об “алгебраизации” мате-
матики, т.е. о проникновении идей и методов алгебры как в теоре
тические, так и в прикладные разделы математики. Такое положе
ние вещей, ставшее совершенно отчётливым к середине XX столетия,
наблюдалось отнюдь не всегда. Как всякая область человеческой
деятельности математика подвержена влиянию моды. Мода на ал
гебраические методы вызвана существом дела, хотя увлечение ею
иногда переходит разумные границы. А так как алгебраическая обо
лочка, затмевающая содержание, не меньшая беда, чем элементарное
забвение алгебры, то не случайно достоинством той или иной книги
уже считается (вполне резонно) умение её автора избежать перегру
женности алгебраическим формализмом.
Если отвлечься от крайностей, то алгебра издревле составляла
существенную часть математики. То же самое следовало бы сказать
и о геометрии, но мы скроемся за крылатой фразой Софи Жермен
(XIX век): “Алгебра — не что иное, как записанная в символах гео
метрия, а геометрия — это просто алгебра, воплощённая в фигурах”.
С тех пор положение изменилось, но, кажется, “признано, что “при
рода” математических объектов есть, в сущности, дело второстепен
ное и что довольно неважно, например, представили ли мы результат
в виде теоремы “чистой” геометрии или при помощи аналитической
геометрии в виде алгебраической теоремы” (Н. Бурбаки).
В соответствии с принципом “важны не математические объек
ты, а отношения между ними” алгебра определяется (несколько тав
тологически и совершенно непонятно для непосвящённого) как наука
об алгебраических операциях, выполняемых над элементами различ
ных множеств. Сами алгебраические операции выросли из элемен
тарной арифметики. В свою очередь на основе алгебраических со
ображений получаются наиболее естественные доказательства мно
гих фактов из “высшей арифметики” — теории чисел.
Но значение алгебраических структур, т.е. множеств с алгебра
ическими операциями, далеко выходит за рамки теоретико-числовых
применений. Многие математические объекты (топологические
пространства, функции нескольких комплексных переменных и др.)
изучаются путём построения надлежащих алгебраических структур,
если и не адекватных изучаемым объектам, то во всяком случае
отражающих их существенные стороны. Нечто подобное относится
и к объектам реального мира.
§ 1. Алгебра вкратце 13
Э. А р ти н (1898-1962) а б ст р а к т н ы й п у т ь разв и ти я.
Н. Б у р б а к и “Э лем енты м а т е м а т и
ки” .
Вошёл в обиход я зы к теори и колец, модулей, к ат е го р и й , гомологий. М ногие
разрозненны е теори и оказались уложены в общ ую схему универсальной ал
гебры . Н а сты ке алгебры и м атем ати ч еско й логики роди лась тео р и я моделей.
С тар ы е теори и обновились, расш ирив область своих применений. П рим ером
здесь м о гу т служ и ть соврем енная ал гебраи ческ ая гео м етр и я, алгебраи ческ ая
топология, ал гебраи ческ ая A -теори я, тео р и я ал гебраи ческ и х групп. Н есколь
ко яр к и х взлётов и сп ы тал а тео р и я конечны х групп.
Вся алгебра находится сейчас в состоянии динамического разви
тия. Крупные заслуги в этом принадлежат математикам России. Вы
сокий уровень алгебраических исследований в нашей стране многим
обязан таким учёным, как Н.Г. Чеботарёв (1894-1947), О.Ю. Шмидт
(1891-1956), А.И. Мальцев (1909-1967), А.Г. Курош (1908-1971),
П.С. Новиков (1901-1975), Д.К. Фаддеев (1907-1989).
§ 2. Н ек о т о р ы е м одел ьн ы е за д а ч и
100
1C)0: —27с5 ■ 50
50
Рис. 3
соприкасаясь с различными участками контуров, сообщат соответст
вующим граничным точкам указанную на рис. 3 температуру.
Возможно ли это, а если возможно, то однозначно ли при этом расп
ределение температуры во внутренних точках?
am l аm2 • • ашп
называемую матрицей размера т х п (ш х п-матрицей или квадрат
ной матрицей порядка п при т = п) и сокращённо обозначаемую
символом {a,ij) или просто буквой А. Естественно говорить об i -й
строке (a^i, а{2, . . . , am) матрицы (3) и о j -м столбце
a ij
a 2j
Amj
который в дальнейшем, ради экономии места, будет изображаться
строкой, заключённой в квадратные скобки: [aij, <22j , . .., amj-]. В слу
чае квадратной матрицы говорят ещё о главной диагонали, состоя
щей из элементов ац , а 22, • • •, апп. Матрица (а^), у которой все эле
менты вне главной диагонали равны нулю, обозначается иногда
diag(au,a 225••• 5апп)
и называется диагональной матрицей, а при ац = 022 = ... = апп = а
обозначается diagn(a) (скалярная матрица). Для матрицы diagn(l),
называемой единичной матрицей, обычно используется обозначение
Еп или Е, когда размер матрицы фиксирован.
§ 3. Системы линейных уравнений. Первые шаги 21
—ta — tb — tc + 4 t e — td
с правой частью td = - 2 7 3 ,- 1 0 0 ,- 5 0 ,0 ,5 0 ,1 0 0 ,3 0 0 (возм ож ны и другие вар и
ан ты ). В зяты е вм есте эти уравнения с о ст ав я т к в ад р ат н у ю линейную систему
ви да (2) с п — т — 416. К оэф ф ици енты при н еизвестны х t{ равн ы 0 (их боль
ш инство), —1 или 4. Я в л яется ли э т а систем а совм естной и определённой?
М ы получили иную, м атем ат и ч е с к и точную ф орм улировку зад ачи к а ч е с т
в е н н о г о х а р а к т е р а . Вопрос о сущ ествовании и единственн ости весьм а типичен
для м ногих разделов м ат е м ат и к и , связан ны х с изучением ф изически х явлений.
ат1 х 1 + • • • + а — &Ш)
1> к > 1, а"! ф 0, а'ы ф 0.
Разумеется, здесь = a[j,b" = b[, ибо первое уравнение не затра
гивалось. Будем применять этот процесс до тех пор, пока возможно.
Ясно, что мы будем вынуждены остановиться, когда станут равными
нулю не только коэффициенты при очередной неизвестной (скажем,
24 Гл. 1. Истоки алгебры
0"ппХп—Ьп,
если не заботиться о том, чтобы выполнялось условие ац ф 0 для всех
i. Действительно, запись (5) означает, что в системе k-е уравнение не
содержит неизвестных Х{ с i < к, а это условие заведомо выполнено
для систем ступенчатого вида.
Заметим на будущее, что матрица (а^) с элементами ац — О
при г > j называется верхней треугольной. Аналогично определяется
нижняя треугольная матрица.
Из теорем 3 и 4 вытекает
С л е д с т в и е 1. Линейная система (2) в случае т — п является
совместной и определённой тогда и только тогда, когда после
26 Гл. 1. Истоки алгебры
bi «12 «11 bi
ь2 «22 «21 ь2
XI = 5 Х2 (3 )
«11 «12 «11 «12
с d d с
как это непосредственно видно из формулы (2). Поэтому (5) можно
записать в виде
<212 <213 <2ц <213 <2ц а\2
Ж1 (б )
<222 <223 <221 <223 <221 <222
<2ц а\2
Эти формулы выведены в предположении, что ф 0. Не-
<221 <222
трудно проверить, что доказанное утверждение верно, если хоть
один из входящих в выражения (6) определителей отличен от нуля.
Если же все три определителя равны нулю, то, конечно, формулы (6)
дают решение (а именно нулевое), но мы не можем утверждать, что
§ 4 • Определители небольших порядков 31
и обозначается
«11 «12 «13
«21 «22 «23
«31 «32 «33
жение
«п «12 «13
«21 «22 «23
«31 «32 «33
— « 1 1 « 2 2 « 3 3 Т « 1 2 « 2 3 « 3 1 Т « 1 3 « 2 1 « 3 2 —« 1 1 « 2 3 « 3 2 —« 1 2 « 2 1 « 3 3 —« 1 3 « 2 2 « З Ъ
( 8)
УП РА Ж Н ЕН И Я
1. Ф орм улу (8) легче зап ом н и ть, если восп ользоваться следующим н агл яд
ны м правилом знаков для вы писы вания произведений, входящ их в разлож ение
определителя т р е т ь е го порядка:
§ 5. М н о ж е ст в а и о т о б р а ж е н и я
В предыдущих двух параграфах мы встретились с множествами
элементов разной природы, равно как и с отображениями множеств.
Множество решений данной системы линейных уравнений или пра
вило, ставящее в соответствие каждой матрице второго порядка её
определитель, — это лишь частные проявления того круга формаль
ных понятий, знакомство с которым (хотя бы на интуитивном уров
не) полезно для дальнейшего.
1. М н о ж ест в а . Под множеством, понимают любую совокуп
ность объектов, называемых элементами множества.
Множества с конечным числом различных элементов могут быть
описаны путём явного перечисления всех их элементов; обычно эти
элементы заключаются в фигурные скобки. Например, {1,2,4, 8} —
множество степеней двойки, заключённых между 1 и 10. Как пра
вило, множество обозначается прописной буквой какого-либо алфа
вита, а его элементы — строчными буквами того же или другого
алфавита.
Для некоторых особо важных множеств приняты стандартные
обозначения, которых стоит придерживаться. Так, буквами N, Z, Q,
R обозначают соответственно множество положительных целых чи
сел (натуральные числа), множество всех целых чисел, множество
рациональных чисел и множество вещественных чисел.
При заданном множестве S включение а Е S указывает на то,
что а — элемент множества S; в противном случае пишут а (£ S.
3 А .И. К о стр и к и н
34 Гл. 1. Истоки алгебры
Рис. 5
Разностью S \ Т множеств S и Т называется совокупность тех
элементов из S, которые не содержатся в Т. При этом, вообще говоря,
не предполагается, что Т С S. Вместо S \ Т пишут также S —Т.
§ 5. Множества и отображения 35
Множество
/ _1(«/) = {х е х | f(x) = у}
называется прообразом элемента у Е У. Более общо: для Уо С У
положим
Г 1То) = {х G х I f(x) С Fo} = UГ 1(у)-
уег0
V
Про эту диаграмму говорят, что она коммутирует (или комму
тативна.), т.е. результат перехода от U к РУ не зависит от того,
сделаем ли мы это прямо при помощи f o g или воспользуемся про
межуточным этапом V. Заметим, что композиция определена не для
любых отображений f u g . Надо, чтобы в предшествующих обозна
чениях у них было общим множество V. Но композиция двух пре
образований множества X в себя всегда имеет смысл.
В дальнейшем вместо f o g мы будем писать просто fg. Ясно, что
fe x = /, ey f = f
для любого отображения / : X —у Y . Проверка этого свойства оче
видна. Важное свойство композиции (произведения) отображений
выражает следующая
Т е о р е м а 1. Композиция отображений подчиняется закону
ассоциативности. Это значит, что если
h: U ->V, g: V W, f: W ^ T
— три отображения, то
f ( g h ) = (f g ) h .
Из равенств
( /i/) ( /-1 fr-1 ) = ( ( /i/) /_1)/i_1 = ( / i ( / / _1))/i_1 = hh~x = ez,
( / _1/i_1) ( /i /) /_1(/i_1(/i/)) = f ~ 1 {{h~1 hh)f) = / _1/ = ex
вытекает, что / -1/i-1 — обратное отображение к /. □
Отображение “следования” сг : N —>• N, определённое правилом
сг(п) = п + 1, инъективно, но не сюръективно, поскольку первый эле
мент (единица) не принадлежит Im сг. Интересно, что для конечных
множеств подобная ситуация невозможна.
Т е о р е м а 3. Если X — конечное множество и преобразование
/ : X —>• X инъективно, то оно биективно.
Д о к а з а т е л ь с т в о . Нужно лишь показать, что / сюръективно,
т.е. для любого элемента х Е X найдётся х' с /(ж7) = ж. Положим
/*0*0 = / ( / • • • (/ж) • • •) = / Щ -1®), * = 0,1,2,...
В силу конечности X в этой последовательности элементов должны
быть повторения. Пусть, скажем, / т (ж) = / п(ж), т > п. Если п > О,
40 Гл. 1. Истоки алгебры
УП РА Ж Н ЕН И Я
§ 6. О тн ош ен и я эк в и в ал ен тн о сти .
Ф ак т о р и за ц и я о т о б р а ж е н и й
Эквивалентность систем линейных уравнений, введённая нами в
§ 3, наводит на мысль посмотреть на это понятие в общем плане,
тем более что эквивалентностями разных типов мы пользуемся нео
сознанно как в логических рассуждениях, так и в обыденной жизни.
1. Бинарны е отнош ения. Для любых двух множеств X и Y
всякое подмножество и С X х Y называется бинарным отношением
между X и Y (или просто на X , если Y = X ). Для упорядоченной па
ры (ж, у) Е из используют обозначение жеоу и говорят, что ж находится
в отношении со к у. Это удобно, посколь
ку, например, упорядочение < на множестве
вещественных чисел Е является бинарным
отношением на Е, состоящим из всех точек
плоскости Е2, которые лежат выше прямой
ж —у = 0 (рис. 7); громоздкое включение
(ж, г/) Е и (и <) заменяется обычным нера
венством ж < у.
Каждой функции / : X —>• Y сопоставляется её график — под
множество
Г (/) = {{X, у) I х е х , у = f(x)} C X x Y ,
являющееся отношением между X и Y. Изучение на Е2 графиков
функций Е —>Е входит в курс математического анализа. Понятно,
что не каждое отношение си может служить графиком какого-либо
отображения X —>Y. Необходимое и достаточное условие заключа
ется в том, чтобы каждому ж Е X отвечал ровно один элемент у с
жеоу. Фактически задание X, Y и графика Г(/) восстанавливает /.
2. Отнош ение эквивалентности. Бинарное отношение ~ на X
называется отношением эквивалентности, если для всех ж, х\ х" Е X
выполнены условия:
i) ж ~ ж (рефлексивность);
и) ж ~ х' = > х' ~ ж (симметричность);
ш) ж ~ ж', ж' ~ х п = > ж ~ х п {транзитивность).
Запись а оо Ъ выражает отрицание эквивалентности элементов
о, b Е -X".
Подмножество
х = {ж' Е 1 | ж' - ж} С I
всех элементов, эквивалентных данному ж, называется классом эк
вивалентности., содержащим ж. Так как ж ~ ж (см. i)), то действи
тельно ж Е ж. Любой элемент ж' Е ж называется представителем
класса ж.
42 Гл. 1. Истоки алгебры
цией) X на фактормножество X /
Пусть X, Y — два множества и / : X —у Y — отображение. Би
нарное отношение сof.
Уж, х' е X XLOfX! f(x) = /(У),
очевидно, рефлексивно (/(ж) = /(ж)), симметрично (/(ж') = /(ж) = >
= > /У ) = / У ) ) и транзитивно (/(ж) = /(ж') & /(ж') = /(ж") = >
= > /(ж) = /(ж")). Таким образом, ujf — отношение эквивалентности
на X. Соответствующие классы эквивалентности ж являются слоями
(прообразами) в смысле упр. 5 § 5. Другими словами,
х = {х'\ fix') = fix ) } .
Отображение / : X —>Y индуцирует отображение / : Х /ujf —>Y,
определённое правилом
f(x) = fix),
или, что то же самое,
fp(x) = fix), (2)
где р — естественное отображение (1). Так как
Х = х' «=> fi x) = fix'),
то соотношение (2), задающее / , не зависит от выбора представителя
ж класса ж. В таких случаях говорят, что определение / является
правильным или корректным. Коммутативная диаграмма
X ----------- J---------- У
X/uf
о 5
0 4
{6, с}
13
{с}
О2
6 1
УП РА Ж Н ЕН И Я
я®) fix').
П о к а за ть , ч т о это условие совместимости / с ~ (более слабое, чем р ассм о т
ренное в п. 2) позволяет правильно определить индуцированное отображ ение
/ : х |-э f ( x ) из X / rsj в У , приводящ ее к ф а к то р и зац и и / = / • р, но / уж е не
обязательно долж но бы ть и н ъек ти вн ы м . В чём зак л ю ч ается условие и н ъ е к ти в
ности / ?
5. И зо б р ази ть ди аграм м ам и части ч н о упорядоченны е м нож ества:
1) 3>({a,b,c,d});
2) м нож ество всех делителей целого числа 24 (отнош ения п о р яд ка у к азан ы в
т ек сте).
46 Гл. 1. Истоки алгебры
§ 7. П ри н ц и п м а т ем а т и ч еск о й и н дук ц и и
Считается, что нам известно множество N = {1,2,3,...} всех на
туральных (или целых положительных) чисел. На самом деле отправ
ной точкой для изучения N служит аксиоматика Пеано (Дж. Пеано,
1858-1932). Из аксиом Пеано (мы их не приводим) вытекают свой
ства сложения, умножения и линейного упорядочения (см. и. 4 § 6)
натуральных чисел, точнее, системы N U {0}. В частности, доказы
вается интуитивно ясное утверждение: в каждом непустом множе
стве S С N имеется наименьший элемент, т.е. натуральное число
s G S, меньшее всех остальных чисел в S'. С учётом этого утвержде
ния из аксиом Пеано извлекается следующий
П р и н ц и п и н д у к ц и и . Предположим, что для каждого п Е N
мы имеем некоторое утверждение М(п). Предположим также, что
мы располагаем правилом, позволяющим установить истинность
М{ 1 ) для данного I при условии, что М(к) верно для всех к < I
(в частности, подразумевается, что мы можем проверить истин
ность М { 1 )).
Тогда М(п) верно для всех п Е N.
В самом деле, допустим, что подмножество
S = {s | s Е N, M(s) неверно} С N
непусто. Согласно сказанному выше S содержит наименьший эле
мент so- Тогда утверждение M(so) ложно, a M(s) истинно для каж
дого s < s o . Это, однако, противоречит нашему предполагаемому
умению доказывать истинность M(so).
Здесь не место для всестороннего обсуждения принципа матема
тической индукции. Мы ограничимся замечанием, что он отражает,
так сказать, суть натурального ряда, а познание последнего не сво
дится к чему-либо существенно более простому. Стоит ещё обратить
внимание на одно обстоятельство. Именно, непременным моментом
“доказательства методом полной индукции” является установление
базиса индукции, т.е. проверка того, что свойство или утверждение
выполнено для небольших п. Без такой проверки можно приходить
к произвольным умозаключениям типа “все студенты одинакового
роста”. Вот и рассуждение. Пустое множество студентов и множе
ство из одного студента обладают этим свойством. Делаем предпо
ложение индукции, что им обладает любое множество из ^ п студен
тов. Во множестве из n + 1 студентов первые п и последние п студен
тов одинакового роста по предположению индукции. Эти множества
пересекаются по подмножеству из п —1 студентов тоже одинакового
роста. Значит, все п + 1 студентов одинакового роста. На самом деле
первое содержательное утверждение относилось бы ко множеству из
л ю б ы х двух студентов, а здесь-то оно как раз и неверно. Насколь
ко же длинным должно быть основание индукции? Обычно это ясно
§ 1. Принцип математической индукции 47
( А ) - ©
(свойство симметричности биномиальных коэффициентов).
Формулу (1), очевидно, верную при п = 1,2, мы докажем индук
цией по п. Считая её справедливой для всех показателей ^ п, умно
жим обе части соотношения (1) на а + Ъ. Получим
(a + 6)n+1 = (а + Ъ)п(а + Ъ) =
о + о - ' + С л Ю '
Но, полагая а = b = 1 в формуле (1), получим
2”= д т ;)+ а + -Ч „ п
- 1) + 0 '
Таким образом,
C ard ?({si,s2, . . . , s n}) = 2” .
Биномиальные коэффициенты — почти непременный атрибут
элементарных комбинаторных рассуждений. Вот — наглядный гео
метрический пример.
4 А .И. К о стр и к и н
50 Гл. 1. Истоки алгебры
УП РА Ж Н ЕН И Я
1. Положим
s (п) = sin ip + sin 2р + . . . + sin np,
c (n ) = cos p + cos 2p + . . . + cos np.
И ндукцией no n д о к а за ть ф орм улы
sin(nip/2 ) s in ((n + 1 ) 99/ 2 ) sm(mp/2) c o s((n + 1 ) 99/ 2 )
s{n) = c(n) =
sin((p/2) sin((p/2)
2. И м ею т м есто ф орм улы :
ктг n (2 n — 1)
a) У ctg2
ч2п + 1 ,
k=l
« > £ ( 2Ж 2: : Г ) - " -
У бедиться в их справедливости хотя бы при п <С 5.
§ 8. П ер ест а н о в к и
1. С т а н да р тн а я зап и сь п ер естан ов к и . Разовьём немного те-
му, начатую в § 5, применительно к биективным преобразованиям
конечных множеств. На этой базе естественным образом возникают
важные алгебраические понятия.
Пусть П — конечное множество из п элементов. Поскольку при
рода его элементов для нас несущественна, удобно считать, что П =
= {1,2,..., гг}. Элементы множества Sn = S(Ct) всех взаимно одно
значных преобразований П —> П, обычно обозначаемые строчными
§ 8. Перестановки 51
12 3 4 12 3 4 12 3 4
(7Т =
2341 4321 14 3 2
В то же время
12 3 4 12 3 4 12 3 4
4321 2341 3 2 14
так что сгт ф та.
Согласно результатам 5 умножение перестановок подчиняется
следующим правилам.
i) Умножение ассоциативно, т.е. (а/3)у = а((3у) для всех а,/3, 7 G
Аналогично,
TTl ТГ2 тгз • 7Гдг
Rr ( 10')
7Г\Т 7Г2 Г 7Г3 Т . . . 7ГдгГ
K I = |l^«l = у - (п )
4. Д ействие Sn на ф ункциях. К важному понятию знака пере
становки a G Sn можно подойти несколько иначе, подсчитывая число
так называемых сг-инверсий (см. упр. 5 в конце параграфа). Но вме
сто этого мы дадим сейчас альтернативное доказательство теоре
мы 2, которое опирается на понятие кососимметрической функции,
важное само по себе и полезное для дальнейшего.
О п р е д е л е н и е . Пусть 7Г Е Sn и / — функция от любых п аргу
ментов. Полагаем
(тг ° /) {Х\ , . . . , хп) / ((£71-15• • • 5^ 7Гп) • (12 )
Говорят, что функция д = 7г о / получается действием iтна f .
Л е м м а 1. Пусть a,f3 — любые перестановки из Sn. Тогда
(а/?) о / = а о (/3 о / ) -
/(•••? Xi-\-1, . . . , Xj — 1, X j , . . . ) =
= — / (. . . , X i+ 1, Xf , . . . , X j _ i , X j , . . . ) =
= / ( . . . , X f + 1 , X j , . . . , X j —i , X f , . . . ) =
= — / (. . . , X j , X f + 1 , . . . , X j _ i , X f , . . . ) . □
Д п = Д п (ж1 , ж2, . . . , х п ) = Y\ ( X i - X j ).
1 S^j < г ^ п
где
A = П
l ^ j <i<k
(x i ~ xj)>
n
B= П [{XS - Xs-l) . . .{xs - Xk+1 ){xs - xk) . . .{xs - Xl)].
s= k+ 2
( Хк — Xk + i) = —{х к ^ 1 — х к ).
Э то и зн ач и т, что
По лемме 2 имеем т ак ж е
В т о р о е д о к а з а т е л ь с т в о т е о р е м ы 2. Возьмём произволь
ную кососимметрическую функцию f от п аргументов ад , . . . , х п. По
лемме 1 действие 7г = Т1Т2 . .. т/, на / сводится к последовательному
применению транспозиций т*;, т^_i , . . . , t i , т.е. к к -кратному умноже
нию / на —1:
О/ = (п .. О(rfc О/ ) = - ( п .. . r fc_i) О/ = . . . = ( - 1)*/ =
Так как левая часть этого соотношения зависит от 7г, но не от
какого-либо его разложения, то и отображение г : 7Г i-A £п, задан
ное равенством (7), должно полностью определяться перестановкой
7г при условии, конечно, что / не тождественно равная нулю функ
ция. В качестве такой функции можно взять, например, только что
рассмотренную функцию / = Д п.
Применение к такой функции / перестановки а(5 по правилу, из
ложенному в лемме 1, дает
£ap f = (а/3) o f = a o ( / 3 o f ) = a o (epf ) = £р(а о / ) =
УП РА Ж Н ЕН И Я
п\ ~ \/27 тп п п е ~ п ,
где е = 2, 718281 . . . — основание н ату р ал ьн о го л огари ф м а, 7г = 3,141592 . . . ;
символ ~ здесь о зн ач ает, ч т о отнош ение y/2irn п п е ~ п /п\ с тр ем и тся к 1 при
п —» оо.
П ри помощ и ф орм улы С ти рл и н га, дающ ей приближ ение с н едостатком , п ро
вери ть, ч т о 100! > (9, 33 . . . )10157. Сколько в S w о циклов длины 100?
2. Н ай ти порядок п ерестан овки (4) и перестан овки
_ / 1 2 3 4 5 6 7 85
77 ~ \ 3 6 8 2 1 4 5 7 /
3. П ерестан ов к а 7г вида (3) с m независим ы м и циклам и о став ляет
m
m! — п — h
к= 1
символов (или точек) на м есте. Число д{к) = п — (m + т' ) н азы в ается декремен
том перестан овки 7г. П ровери ть, ч т о — ( —l ) d(7r).
§ 9. Арифметика целых чисел 61
4. Н ай ти зн ак перестан овки
_ ( I 2 3 ... п —1 п \
П~ \ п п —1 п —2 ... 2 1 /
П о"(Я - ДО
----:--- :--- •
7 —2
Т ак к а к (cr(j) —a ( i ) ) / ( j —г) — отличное от нуля рациональное число, являю
щ ееся отри ц ател ьн ы м в т о ч н о сти т о гд а , к огд а (i , j) будет сг-инверсией, и т а к к а к
а : П—х П— биективное отображ ение, то sgncr = ( —l ) k , где к — общее число
сг-инверсий.Если т = (ij) — транспозиция, то s g n r = —1. К а к легко ви деть,
(<t(j ) <г(г))а =
a(j ) ... а(г) \ г ... j
а(г) ... a(j ) ... ) ^ ... а{г) . . . a(j)
i
<r{j) ■
т а к ч т о сг-инверсия (i ,j) п ер ес т ае т б ы ть инверсией относи тельно перестан овки
тег, где т = (cr(j) сг(г)) — транспозиция.
П о к а за ть , ч т о н ай дутся к транспозиций п , . . . ,т&, для к о торы х
Т~кТ~к—1 •••Т\(Т —е
— единичная п ерестан овк а. С тало бы ть, а = т\ . . . и sgn а = {—1)к = £а —
два равн оправн ы х обозначения одного и т о го же и н ва р и а н та перестановки; sgn
(от signum (л ат.)) — зн ак. М ы получили еще один удобны й способ определения
зн ак а перестановки. С каж ем , относи тельно п ерестан овки (4) м нож ество инвер
сий состо и т из п яти пар (1, 5), (2, 5), (3, 5), (4, 5), (6, 7), т а к ч т о sgn7r = —1.
П р ак ти ч еск и дело сводится к п одсчёту в ниж ней строке п ерестан овки 7г коли
ч е с тв а чисел j , больш их г, но стоящ их перед г, для г = 1 , 2 , . . . , п — 1.
§ 9. А р и ф м е т и к а целы х чисел
УП РА Ж Н ЕН И Я
*’(” , = ” ( У ) - ( У ) -
Ф ун кц и я р : N —» N н азы в ается функцией Эйлера.
П ровери ть справедливость ф орм улы для значений (р(п) при п <С 25 и при
п = рш.
4 . И спользуя биномиальную ф орм улу, индукцией по п д о к а за ть , ч т о если
р — п ростое число, то п р — п делится на р при любом п Е Z.
Глава 2
М АТРИЦЫ
§ 1. В ек т о р н ы е п р о с т р а н с т в а с т р о к и стол бц ов
5. А. И. Кострикин
66 Г л. 2. Матрицы
Хп
как мы их условились обозначать в § 3 гл. 1 . Понятно, что разли
чие между пространствами строк и столбцов чисто условное, но мы
вскоре убедимся, что полезно иметь оба варианта пространства. Из
контекста обычно ясно, о каких векторах, столбцах или строках идёт
речь, поэтому никаких специальных обозначений не вводится.
3. Л ин ейн ы е ком бинации. Л инейная обол очка. Пусть X i,
Х 2 , • • •, — векторы пространства Rn и — скаляры.
Вектор X = ot\X 1 + 012X2 + . .. + OLkXk называется линейной комби
нацией векторов Х{ с коэффициентами с^. Например,
(2,3,5,5) - 3(1,1,1,1) + 2(1,0, -1 , -1 ) = (1,0,0,0).
Пусть, далее, Y — (5 \Х \ + /З2Х2 + . .. + ftkXk — линейная ком
бинация тех же векторов с коэффициентами Д , а <т, / 3 Е R. Тогда
а Х + f3 Y =
= ol(ol\X \ + OL2X2 + . .. + akXk) + X i + P2X2 + . .. + PkXk) =
= (aai + PPi)Xi + (cm2 + /^ 2)^ 2 + • • • + (peak + (3 f3k)Xk
— снова линейная комбинация векторов Х{ с коэффициентами
aai + PPi- Мы видим, что множество V всех линейных комбинаций
данной системы векторов X i , Х 2 , . . . , X/, обладает свойством
X , Y е V = > а Х + f3 Y е V (1)
для всех a,f 3 Е R. В частности, нулевой вектор всегда содержит
ся в V.
Обычно V обозначают символом (X i, Х 2 , . . . , Х&) и называют
линейной оболочкой (или просто оболочкой) системы векторов X i,
Х 2, . . . , Х Ь Говорят ещё, что оболочка ( Xi , X2 , . . . , Х&) натянута
на Х \ , Х2 , . . . Xk или порождена векторами Х \ , Х2 , . . . , X /,.
Можно определить линейную оболочку любого подмножества S С
С Мп , понимая под (S) совокупность всех линейных комбинаций
к о н е ч н ы х систем векторов из S. Ясно, что если V — линейная
оболочка в Жп , то (V ) = V : любая линейная комбинация векторов
5:
68 Ел. 2. Матрицы
E(i) = (1> 0 , . . . , 0), £7(2) = (0 ,1 ........ 0), £7(„) = (0 ,0 ........ 1). (3)
Шп = ( Е у у Е ( 2 ) ,.. • ,#(п)>-
Единичные векторы-столбцы будем об о зн ач ать символами
Я (1) = [ 1 ,0 , .. ., 0 ] , £ (2) = [ 0 , 1 , . . . , 0], ..., £ (п) = [ 0 , 0 , . . . , 1]. (3')
Е (1 ) = Д 1)’ Е (2 ) = Е (1 ) + Е (2 ),
Щз) = Е (1) + Е (2) + Д з ) , • • ч Щ п) = Е (1) + Е (2) + • • • + Е ( п )
тоже составляют базис пространства Еп (проверьте это аккурат
но). С другой стороны, пока не ясно, каждая ли линейная оболочка
в Еп обладает базисом, а если да, то будет ли количество базисных
векторов постоянным. Ответы на оба вопроса оказываются положи
тельными. Наши рассуждения будут основаны на следующей лемме.
Ле мма . Пусть У — линейная оболочка в Еп с базисом Х \ , . . . , Х г
и Y\, >2, ... , Ys — линейно независимая система векторов из У.
Тогда s ^ г.
Д о к а з а т е л ь с т в о . Как и все векторы из У, Y \, . . . , Ys являются
линейными комбинациями базисных векторов. Пусть
Y\ — Q-iiХ \ + (221^2 + ... + аг\ Х г,
Y2 = cii2 X i + 022 X 2 + ... + аГ2 Х г,
УП РА Ж Н ЕН И Я
и + У = {U и V) = {и + v I и Е и, v Е V}.
§ 2. Р а н г м атр и ц ы
&т 1 dm 2 & т п дт
(3)
ац d 12 .. а\п
&21 &22 &2 п
(А\В) =
S Y, = Ё (5Z аД = 5Z ( S аД = Е а« ’
з=1 *=1 3= 1 г=1 2=1 3=1
74 Г л. 2. Матрицы
0 . .. 0 . .. 0 . .. ars .. d rn
0 . .. 0 . .. 0 . .. 0 . .. 0
0 . .. 0 . .. 0 . .. 0 . .. 0
76 Г л. 2. Матрицы
Л(1) = [ащ 0,... ,0], й (/е) = [аи , а2^,0, ... ,0], ...
... , Э/ ^ SJ • • • J^rsi 0, . . . ,0]
матрицы (5), получим
As&rs —0? • • • ч А/аз/ —0, А/Щ2А; —0? Aian —0,
а так как а ц а ^ а з / ... ars ф 0, то Ai = Хк = А/ = ... = As = 0. Значит,
rank { А ^ \ А ^ , А^1\ ... = г и гв(А) ^ г. Но пространство Ув,
порождённое столбцами матрицы А , отождествляется с простран
ством столбцов матрицы, которая получается из А удалением по
следних т —г нулевых строк. Поэтому rB(A) = dimkB ^ dimRr = г.
Сопоставление двух неравенств показывает, что гв(А) = г (неравен
ство гв(А) ^ г вытекает также из того очевидного соображения, что
все столбцы матрицы А являются линейными комбинациями базис
ных; проделайте это самостоятельно в качестве упражнения).
С другой стороны, все ненулевые строки матрицы А линейно не
зависимы: любое гипотетическое соотношение
^i^(i) + ^2А (2) + ... + АГП(Г) = 0 , А/ g R,
как и в случае со столбцами, даёт последовательно
Aidu = 0, A2d2^ = 0, ..., Arars = 0,
откуда А) = А2 = ... = Аг = 0. Стало быть, гг (А) — г — гв(А). □
3. К р и т ер и и со в м ест н о ст и . Ступенчатый вид матрицы А ,
дающий ответ на ряд вопросов относительно линейных систем (см.
§ 3 гл. 1), содержит элементы произвола, связанные, например, с вы
бором базисных столбцов, или, что эквивалентно, с выбором главных
неизвестных системы (2). В то же время из теоремы 1 и из её дока
зательства извлекается
С л е д с т в и е . Число главных неизвестных линейной системы (2)
не зависит от способа приведения её к ступенчатому виду и равно
rank Л, где А — матрица системы.
§ 2. Ранг матрицы 77
УП РА Ж Н ЕН И Я
А = diag ( й ц , й 2 2 ,. .. , а г г , 0 , . . . ,0 ),
где а ц = а п , а 2 2 = а2к , а 33 = а зг, . . . , arr = a r s ; Щ = 1 аи Ф
3. П о к а за ть , ч т о при ао ф 0 к в ад р ат н а я м атр и ц а
0 0 .,. . 0 0 ао
1 0 .,. . 0 0 ai
0 1 .,. . 0 0 а2
0 0 .,. . 1 0 0“п - 2
0 0 .,. . 0 1 Ufi— 1
им еет ран г п.
4 . Условие равен ств а р ан гов двух м атри ц
, в = л fi2 • fin
/81 /82 . fin
71 72 •• 7п
§ 3. Л и н ей н ы е о т о б р а ж е н и я .
Д ей ств и я с м атр и ц ам и
1. М атрицы и отображ ения. Пусть Еп и Rm — векторные
пространства столбцов высоты п и т соответственно. Пусть, далее,
А = (ац) — матрица размера т х п. Определим отображение ipа •
Rn -э Rm, полагал для любого X = [яд,ж2>. . . , х п\ Е W1
р л (Х ) = x i + х 2 А ^ + ... + х пА^п\ (1 )
где А , . . . , А (п) — столбцы матрицы А (сравнить с (1) § 2). Так как
они имеют высоту ш, то в правой части (1 ) стоит вектор-столбец
Y = [у1 , 2/25***5 Ут\ £ Rm. Более подробно (1) переписывается в виде
п
Vi = ^ ^ Q'ij’
Ej э i — 1, 2 , . . . , т . (!')
3= 1
§ 3. Линейные отображения. Действия с матрицами 79
Итак,
+ fltfB = фаА+0 В- (6)
Особенно часто нами будет использоваться тот факт, что ли
нейные комбинации линейных функций снова являются линейными
функциями.
В заключение этого пункта отметим, что если правила ВЩ -
ВП8 из § 1 для векторных пространств переписать, заменив всюду
векторы-строки X , У, Z на матрицы размера т х п, то в соответствии
с определяющим соотношением (5) получатся правила BMi-BMg, ко
торые дают основание говорить о векторном пространстве матриц
размера т х п . Если угодно, его можно считать компактной записью
векторного пространства Rmn строк длины тп (строки разбиты на
отрезки длины п, расположенные друг под другом).
2. П р о и зв ед ен и е м атри ц . Соотношения (5) и (6) выражают
согласованность действий сложения и умножения на скаляры в мно
жествах матриц размера т х п и отображений Rn —>Rm. В случае
произвольных множеств имеется ещё важное понятие произведения
(композиции) отображений (см. п. 2 § 5 гл. 1). Разумно ожидать, что
композиция двух линейных отображений должна выражаться неким
согласованным образом в терминах матриц. Посмотрим, как это де
лается.
Пусть <рв : Rn —>• Wa : Rs —>• Rm — линейные отображения,
(рс — <рл ° в — их композиция:
гВ = (b'jk),
II
ТО
a ki ~ a iki b'jk = bkj■
Вычисление коэффициентов матриц
«n «12 • «In
«21 «22 «2n
С = AB =
«ml «m2 • • «mn
dn di 2 6?lm
d2i d2m
fB ■ *A = ^22
где
A 0 .,.. 0
0 A .,.. 0
diag„(A) = AE =
0 0 .,.. A
— известная нам скалярная матрица (см. § 3 гл. 1). Таким образом,
умножение матрицы А на скаляр Л равносильно умножению А на
скалярную матрицу.
В равенстве (12) отражён легко проверяемый факт перестановоч
ности diagn(A) с любой матрицей А. Весьма важным для приложений
является следующее его обращение.
Т е о р е м а 4. Матрица из Мп, перестановочная со всеми матри
цами в Мп, должна быть скалярной.
Д о к а з а т е л ь с т в о . Введём матрицу Ец, в которой на пересе
чении i-й строки и j-ro столбца стоит 1, а все остальные элементы
нулевые. Если Z = (Zij) — матрица, о которой идет речь в теореме,
то она перестановочна, в частности, со всеми Ец\
ZEij = Eij Z , = 1,2,. ..,?7/.
§ 3. Линейные отображения. Действия с матрицами 87
откуда
Е = (Е (1 ), . . . , Е (п)) = (АА,{Х>, .. ., А А '( п )) = АА!.
Здесь мы интерпретировали матрицы Е и АА 1 как объединения от
вечающих им столбцов.
Заметим теперь (см. и. 3), что вместе с А невырожденной явля
ется и транспонированная матрица 1 А. Поэтому в силу доказанного
найдётся матрица В такая, что 1А • В = Е. Снова обращаясь к и. 3
и полагая А" = 1 В , находим
Е — 1Е — \ lAB) = tB t ( tA) = А" А.
Итак,
АА' = Е = А" А.
Остаётся заметить (см. (13)), что А" = А', а поэтому в соответствии
с (14) А' = И-1 , т.е. матрица А обратима. □
С л е д с т в и е 1. Если В и С — невырожденные квадратные
матрицы порядков т и п соответственно, а А — произвольная
т х п-матрица, то
rank БДС = rank И.
ад .. 0
А = diag(< ri, . . . , а п )
0 .. . OLn
то, очевидно,
а ™ . 0
A™=diag«, . . . , cC)
0 ... а
LXn
ш
П р и м е р 2. П усть
а с
А =
0 b
Т огд а ин дукция по т п о к азы в ает, ч то
- Ь171
Аш а —b
Ьш
где
аш _ Ьш
= а ™ "1 + ат ~ 2Ь + . . . + аЬт ~ 2 + Ьт ~ х
а —Ъ
В частн о сти , при а = b имеем
а с
т а171 т а 171 хс
0 b 0 аш
90 Гл. 2. Матрицы
. 1 + V5 1 - VE
А1 = ---^---5 А2 =
Небольш ое вычисление п о к азы в ает, что
1
л /5
_ 5
Ai 0
B~L = А = В~
0
• В.
л2
А2
v^A i
5"
А 771 = В ~ 1С В • В ~ 1С В • В ~ 1С В • . . . • В ~ 1С В = В ~ 1С гпВ
о уп
Af 0
В =
0 \у о
v^A ™ а 2 1
1
1
5 5 *
га + 1
Л
Л2 *
v ^ A ^ 1 — n/ 5 A i л /5
5
С равн ивая коэф ф ициенты м атр и ц в левой и правой ч а с тях это го равен ства,
получаем для числа Ф ибоначчи с номером т значение
Мы ВИДИМ, ЧТО fm при больш их т (гео м етр и ч еск ая п рогресси я), по-
%/5 1
скольку П т
1 - VE = 0.
6. Классы эквивалентны х м атриц. Как и при доказательстве
теоремы 4, обозначим через Est матрицу размера т х ш, в которой
на пересечении s-и строки и £-го столбца стоит 1, а все остальные
элементы нулевые (такие матрицы называются иногда матричны
ми единицами). Рассмотрим в Мш(Ж) так называемые элементарные
матрицы следующих типов:
Fs,t — Е — E ss — Е й + E st + E t s —
1
0 1
' 1 sФ (I)
1 ' 0
' 1
F s ( Л) = E + (Л - 1 ) E SS = d i a g { 1 , . . . , 1, Л, 1 , . . . , 1 } , Л ф 0. ( Ill)
ar
0
0
'0
1 1 0
о
0
' 0
0 0 1
*1
II
0 1 0
со
1 0 0
0 2 0 1 0 0
* 1, 2
1 1 -1 0 1 О
(А\Е) 1 1 - 1 0 1 0 — У 0 2 0 1 О О
2 1 - 1 0 0 1 2 1 -1 О 0 1
1 1 - 1 0 1 0
* 3,1 ( - 2 ) * 2 (1 / 2 )
0 2 0 1 0 0
0 - 1 1 0 -2 1
1 1 -- 1 0 1 0
* 1,2 ( - 1)
- у 0 1 0 1/2 0 0
0 - 1 1 0 - 2 1
1 0 -- 1 -1 / 2 1 0
* 3 ,2 ( 1 )
- у 0 1 0 1/2 0 0
0 - 1 1 0 2 1
1 0 -1 - 1/2 1 0
* 1 ,3 ( 1 )
-У 0 1 0 1/2 0 0
0 0 1 1/2 -2 1
1 0 0 0 -1 1
-У 0 1 0 1/2 0 0
0 0 1 1/2 -2 1
§ 3. Линейные отображения. Действия с матрицами 95
Т аким образом ,
0 -1 1
А- 1 = 1/2 0 0
1/2 -2 1
Для экономии м еста целесообразно в ы полнять сразу серию одн отип ны х пре
образований.
П р и м е р 5. П усть
и-1
1 1 1
и-1
1
А =
1 1 1
1 1 -1 1
и-1
1
1 1 1
Имеем
- 1 1 1 1 1 0 0 0 ^ 1 ,4 ( 1 )
(А\Е) =
1 - 1 1 1 0 1 о о * 1 ,3 ( 1 )
1 1 - 1 1 0 0 1 0
1 1 1 - 1 0 0 0 1 * 1 ,2 ( 1 )
2 2 2 2 1 1 1 1
1 - 1 1 1 0 1 0 0 * 1 (1/ 2 )
1 1 - 1 1 0 0 1 0
1 1 1 - 1 0 0 0 1
4 0 0 0
А2 =
0 4 0 0 = 4Е ,
0 0 4 0
0 0 0 4
96 Г л. 2. Матрицы
мы делаем заклю чение о н евы рож денн ости А и, следовательно, о сущ ествовании
А - 1 . Но коль скоро это т а к , то
А = А 2А - 1 = 4 Е • А -1 = 4 А - 1 =>■ А -1 = - А .
4
З а м е ч а н и е . При выполнении серии преобразований над стро
ками следует избегать типичной ошибки — прибавления в неизмен
ном виде строки, изменившейся в ходе предыдущих преобразований.
Например, предписание
^2,1(1)
А — ► А'
^1,2(1)
двусмысленно: не ясно, в каком порядке действовать — сначала
F i ?2(1), потом F2?i (1); сначала F2?i (1), потом F i ?2(1) или одновремен
но? Каждый раз будут получаться различные выражения для строк
H|i), А^2у В примере 5 мы объединяли лишь однотипные преобра
зования, а если ставить своей целью вычисление на ЭВМ по указан
ному методу, то естественно всю последовательность элементарных
преобразований линейно упорядочить.
Рассмотренный нами метод вычисления ранга, а также обратной
матрицы называется P -приведением или, более общо, (P,Q)-npuee-
дением матриц к нормальному виду (17).
8. П ространство реш ении. Из вводных замечаний в начале
§ 2 и § 3 следует, что система линейных уравнений с матрицей А
размера т х п и столбцом свободных членов В Е Rm может быть
записана коротко в виде
АХ = В (20)
(X = [ж1 , . . . , жп] — столбец высоты п). Представив, что ш = п и
квадратная матрица А невырожденна (см. п. 5), мы получим, и при
том единственное, решение системы (20), умножая обе части матрич
ного соотношения слева на А -1 : X = Е Х = (А~гА )Х = А~г(АХ) =
= А~гВ. Эта удобная символическая запись решений определённой
системы не избавляет нас от вычислений, поскольку матрица А~х
заранее не дана. Но не откажем себе в удовольствии заметить, что
матричный аппарат доставляет по меньшей мере эстетическое
наслаждение. Воспользуемся им теперь для обозрения всех решений
линейной однородной системы (JIOC):
А Х = 0. (21)
По существу мы уже знаем, что если — решения нашей
Л ОС, то и любая их линейная комбинация тоже будет решением:
А ( а i M 1 ) + а 2 М 2 >) — QL\ А Х W + 2 А Х ( 2) = 0 .
0= Y 1 Р к А Х М = А ( Y , РкХЮ)
k^S+1 k^S+1
следует X^ g+1 е Уд, а это в силу выбора
возможно только при Ps+i = ... = /Зп = 0. Значит, г = п —s. □
З а м е ч а н и е . Если использовать язык линейных отображений
(см. п. 1 § 3), то, очевидно,
Уа = Ker ipA, VB(A) = Im ipа
— ядро и образ отображения <^д : Еп -А Ет , отвечающего Д. Для
нас, однако, этот подход служит лишь мотивировкой для введения
матричных понятий.
Чтобы найти базис пространства Уд, выберем в А г базисных
столбцов одним из способов — приведением А к ступенчатому виду
или так, как это указано в гл. 3. Перестановкой столбцов или, что
равносильно, перенумерацией неизвестных можно добиться, чтобы
базисными были г первых столбцов А^1\ . .., А^г\ При этом в новой
системе неизвестных х [ , х 2' , . . . , х'п главными неизвестными станут
х [ , . . . , х 'г . Любая система из г + 1 столбцов А ^ , . . . , А ^ , Д(г+/е), к >
> 0, будет линейно зависимой, и на основании теоремы 1 , v) из § 1
можно выписать систему соотношений
х[к)А ^ + х {2к)А ^ + ... + х {гк)А ^ + А {г+к^ = 0 , к = 1 ,2 ,... ,п - г.
7 А .И. К о стр и к и н
98 Г л. 2. Матрицы
Векторы-столбцы
T(i) т (1)
= Д А х2 ? •• 1, 0, .. о],
XW = Д А
т (2) г (2)
' • 5 Л'Г 5 0, 1, .. 0],
Х(п~г) = Д А
т (2)
’• 5 Х
гГ
(2) ,
0, 1, .. 0]
УП РА Ж Н ЕН И Я
1 а с
Н ай ти для 0 1 Ъ обратн ую м атриц у.
0 0 1
0 -1 з
3. П ровери ть, ч то = Е.
1 -1
4 . В прилож ениях большую роль и гр аю т марковские (или стохастические)
м атри ц ы
п
Р = ( P i j ), Pij ^ °, ^ 2 p i j = l , г = 1,2,...,п.
з=1
Л инейны е о тображ ен и я ipp, ассоциированны е с м арковским и м атри ц ам и , обы чно
при м еняю т к специальны м т а к назы ваем ы м вероятностным векторам -стол б ц ам
п
X = [xi , ...,Ж п ], Xi ^ 0, y ^ X j = 1.
г= 1
§ 3. Линейные отображения. Действия с матрицами 99
—
11
11
1 1 I
I
1 -1 -1 1
6. А ссоциировав с циклом длины п в S n (см. § 8 гл. 1) м атр и ц у перестан овки
(стр о к единичной м атр и ц ы Е п )
0 0 .,.. 0 1
1 0 .,.. 0 0
0 1 .,.. 0 0
0 0 .,.. 0 0
0 0 .,.. 1 0
провери ть, ч т о Р п = Е.
7. П о к а за ть , ч то
ra n k (А + В) ^ ra n k А + ra n k В
для лю бы х двух т X n -м атр и ц А в В.
8. П о к а за ть , ч т о для любой т х s-м атр и ц ы А и любой s х n -м атр и ц ы В им еет
м есто неравенство
ra n k А + ra n k В — s ^ ra n k А В .
9. П о к а за ть , ч т о если А В С = 0 для к в а д р а т н ы х м атр и ц А, В , С п о р яд ка п,
то
ra n k А + ra n k В + ra n k С ^ 2п.
10. Н ай ти р ан г м атри ц ы
xiyi Х1У2 •• XIуп
Х2У1 Х2У2 •• Х2Уп
А =
ХпУ1 Х п У2 • ХпУп
У к а з а н и е . П о к а за ть , ч т о А = [х\ , . . . , х п \(у i , . . . , у п ).
11. П о к а за ть , ч т о если А = ( a i j ) — невы рож денная си м м етри ч еская м атр и ц а
(ciij = aji), то и А сим м етри ч еская м атри ц а.
Н ай ти А 1 и F -1 если
5 4 3 2 1
2 3 2 1
4 8 6 4 2
3 6 4 2
А = 3 6 9 6 3 F =
4 8 6 3
2 4 6 8 4
2 4 3 2
1 2 3 4 5
7"
100 Ел. 2. Матрицы
а b d -b
А = , ad — be ф 0 = => А -1 = 1
с d ad — be —c a
В частн о сти ,
d, -b
ad — be =
—с а
С ущ ествует ли А 1 при ad — be = 0?
14. Д о к а за ть , ч т о для любой м атри ц ы
а Ъ
А =
с d
выполнено соотнош ение
16. Д о к а за ть , ч т о если = 0, то = 0.
17. О б основать следующее рассуж дение. П усть т х s-м ат р и ц а X р а зб и т а
гори зон тал ьн ы м и и в ерти к ал ьн ы м и прям ы м и на блоки (или к л етк и ), т а к что
Xu X 12 . • ■ X lk
X 21 X 22 . ■■ x 2k
X =
Хц X 12 . •• X lk
Yki Y k2 • .. Y kr
х = (xij) е м п(ш)
§ 3. Линейные отображения. Действия с матрицами 101
О П РЕД Е Л И Т Е Л И
« п «12 «13 (1 )
п = 3: и(П(А(1),А (2),А (3))) «21 «22 «23
«31 «32 «33
----о---------------- о-----
а 0
ориентированной длиной будет а < 0. Для параллелограмма
n(A W M (2)) площадь берётся со знаком плюс, если упорядоченная
пара векторов М « л (2)) задает ту же ориентацию плоскости R2,
что и базисная пара векторов (ei, ег); в противном случае — со зна
ком минус. При таком понимании естественно обратить формулу (1)
и считать при любом п определителем det А матрицы А ориентиро
ванный объём параллелепипеда, обозначаемый тем же символом:
det А = г(П(Д)).
Базисный вектор ej, отвечает стандартному столбцу = [0,...
. .., 1 , . . . , 0], так что
А и) = ipA(E{j))
— образ единичного вектора при линейном отображении ipа : X н->-
I—у А Х (см. § 3 гл. 2). Образом единичного куба П(.Е) при отображе
нии ра будет как раз параллелепипед П(А), а поскольку i?(n(i£)) = 1 ,
определитель det рл = det А равен коэффициенту изменения ориен
тированного объёма. На самом деле при применении р л ориентиро
ванный объём любой фигуры, а не только единичного куба, меняется
в det А раз (см. [BA II]).
Обратим внимание на легко проверяемые свойства ориентирован
ной площади параллелограмма:
1) = - у ( Щ А (2\ А ^ ) -
2) Ц п м (1) + аа (2),а (2))) = « ( п (А(1Щ (2)));
104 Гл. 3. Определители
3) Д П (£)) = I-
О свойствах 1) и 3) говорилось выше, а свойство 2) проиллюстри
ровано (при п — 2) на рис. 14
и основано на идее равносостав
ленности. При п > 3 свойства
1)-3) объёмов параллелепипедов
уже менее наглядны, но совер
шенно очевидно, что при любом
подходе к теории определителей
отмеченные три свойства долж-
Рис. 14 ны выполняться. Кроме того,
должны быть получены и другие свойства определителей так, чтобы
вычисление det А для любой фиксированной квадратной матрицы А ,
а следовательно, и вычисление объёма г(П(Д)), было алгоритмически
реализуемым и легко осуществимым актом.
2. К о м б и н а тор н о-ан ал и ти ч еск и й п о д х о д . Близкие обозна
чения
аа «12 «1п «и «12 . . «1п
А = «21 <222 «2п , det А = «21 «22 «2п
• ^ ( ^ ■ ( 1 ) 5 • • • 5 ^ 4 -(г ) 5 ^ - ( г + 1 ) 5 • • • 5 ^ - ( п ) )
^1,7Г1 ' ' ' ® П , 7 Г П ^7Г 1 1,7г(7Г 1 1) ' ' ' ® 7 Г ~ 1 П,7г(у7 Г ~ 1 п )
Т>(А) = апп .. .а ц ■V
I—1 ■
0 ..
то
det А = а ц М ц = ап Ап-
УП РА Ж Н ЕН И Я
А ( х , у , z) = (у - ж )0 - x ) ( z - у)
за п и с а ть в виде определителя т р е т ь е го порядка.
2. П усть А = ( a,ij ), А' = (аУ ) — две п х n -м атр и ц ы , А , А ' — их определи
тели. С р авн и ть А и А ' в случаях:
а) аС = aij;
б) aij = + 5
в) a i j = 0“n + l - i , n + l - j •
§ 2. Дальнейшие свойства определителей 113
3. П о к а за ть , ч то
1 1 1 ... 1 1
1 2 1 ... 1 1
1 1 3 ... 1 1
1 1 1 ... п 1
1 1 1 ... 1 п + 1
ац ai з &1 п
det А = ^21 a 2j п
ац a ij Uln ац .. 0 . а\п
а 21 .. 0 . а 2п a 2i •• «2 j ■ а 2п
+
8 А .И. К о стр и к и н
114 Гл. 3. Определители
«п «1 п
«21 «2п
+
«nl a nj ••
« i , j —1 a ij ••
=£ « il « i,j+ l « in
i) i- i a ij « il •• • « i,j —1 « i,j+ l • • « in
i=i
0 «nl • •• « n , j —1 « n ,j+ l • • «nn
aU « il •• « i , j —1 a * ,i+ i •• « in
0 «11 « l,j-l a i,i+ i «In
2=1
•^5
1 1 1
XI Х2 Хп
х\ А X2 Д(ж1,ж2, •••,хп),
,п~ 1 х пп ~ г
1 хГ1
связы ваем ы й с именем В андерм онда, вы числяется по формуле
An = Y l (X j-X i),
1^г<j
или, в более подробной записи,
1 XI х\ . .. х?-1
Ап —
1 х2 х\ . •• х Г 1
1 Хп Х1 - .. хГ1
Для д о к а за те л ьс тв а ф орм улы (3) применим индукцию по п. С чи тая, что
А т , т < п, вы числяется по формуле (3) и опираясь на свойство D7, вы чтем
из к аж дой г-й стр о к и определителя А п (г — 1)-ю с трок у, умнож енную на х\:
1 1 1
0 Х2 — XI - XI
Хп
0 х \ — Х2 Х 1 х 2 —- Х п Х 1
п —1 п —2
0 Х2 — Х2 Х\ .. х пп —1 - - х пп - 2
Н апраш и вается мы сль разл ож и ть теп ерь А п по первому столбцу, а в получив
ш емся определителе п о р яд ка п — 1 вы нести из j -го столбца (j = 1, 2 , . . . , п — 1) за
зн ак определителя общ ий м нож итель Xj +\ — х \ (свойство D1 для столбцов). М ы
придём к вы раж ению
1 1 1
Х2 хз Хп
1-Г
1-Г
Н
1
1
II
н
1
>
to
3
х2~2 хГ2 . х п~ :
= (х п - x i )( x n - l - X l ) . . . (х 2- X i ) • А ( ж 2 , Ж3 , • • • Д п ) ,
П р и м е р 2. М а тр и ц а А = (aij) вида
0 U l 2 a is CLln
— а \з U23 0 U3n
U \n ~ U 2n — USn 0
0 ... 0 bml •• hm m
(2ц ... бЦп Ьц ... Ь\т
0 ... 0 0 1
0 .... 1 0 . .. 0
= ( _ l ) ( » + 2 ) + (n+ 4) + ...+ (« + 2 m ) d e t A = ( _ l ) » > » d e t A .
det
с А (_l)nm d etA -d e tB . (5)
в 0
Формулы (4) и (5) охватываются общей теоремой Лапласа о раз
ложении определителей. Эта теорема, однако, употребляется срав
нительно редко, и мы на ней не останавливаемся, отсылая любозна
тельного читателя к упражнениям в конце следующего параграфа.
Исключительно важное в теоретическом плане утверждение об
определителях матриц содержит
Т е о р е м а 3. Пусть А и В — квадратные матрицы порядка п.
Тогда
det АВ = det А • det В.
(A{t)B ^ , . . . , A {t)B ^ ) ,
§ 2. Дальнейшие свойства определителей 119
УП РА Ж Н ЕН И Я
1. Целые числа 1798, 2139, 3255, 4867 делятся на 31. Б ез всяких вы числений
п о к а за ть , ч т о определитель ч е т в ё р т о го поряд ка
1 7 9 8
2 1 3 9
3 2 5 5
4 8 6 7
т а к ж е делится на 31.
2. П о к а за ть , ч т о лю бой к ососим м етри ческий определитель |ад-| ч е т в е р т о го
п о р яд ка с aij G Z явл яется к в ад р ат о м целого числа.
З а м е ч а н и е . Э то верно для к ососим м етри ческого определителя прои зволь
ного п орядка.
3. Д о к а за ть соотнош ение det А В = det А • det В (тео р ем а 3) путём приведе
ния элем ен тарны м и преобразован и ям и т и п а (II) над с тр о к ам и всп ом огательной
Е В Е В
м атр и ц ы С = р азм ер а 2п х 2п к виду С' =
-А 0 0 АВ
У к а з а н и е. В оспользоваться равенством det С = det С и соотнош ениям и
(4), (5).
120 Гл. 3. Определители
М ^(х i)
A n { к \ 5 Х1i • • • 5кгтХт)
м%т (хт )
1 X т2 х п '-1
0 1 х п-2
(?)* - ("Г1)
Щ (х) = 0 0 1
(V)х п - 3
0 0 0 Xn ~k
(Г !)
Д о к а за ть , что
s s
t t+ 1 t + n —1
s+ 1 S+ 1 s+ 1
Вп(s, А) — t A+ 1 AT n —1
s + n —1 s + n —1 ' s + n —1
t A+ 1 чA+ n — 1
- s —1\ /n s —2 n + s —t
n ) \ n n
n + t —1 n + t —2
n n
У к а з а н и е . В ы нести последовательно s + к — 1 из /с-й стр о к и при к =
= 1, 2 , . . . , п, а за те м l / ( t + I — 1) из /-го столбца при I = 1, 2 , . . . , п. Д ейство
в а т ь т а к до тех пор, пока в первом столбце не будут с то я т ь только 1.
6 . П усть
Ai 1 0 .. 0 0 0
-1 Л2 1 .. 0 0 0
0 0 0 .. Ап —2 1 0
0 0 0 .. —1 Ап —1 1
0 0 0 .. 0 -1 Ап
§ 3. Применения определителей 121
П о к а за ть , ч т о det Сп = \ п det Сп - \ + d e t Сп - 2 . П ри Ai = Л2 = . . . = An = 1 н ай ти
численное значение det С п .
У к а з а н и е . В спом нить пример 3 из п. 3 § 3 гл. 2 и о б р а ти ть внимание на
т о т ф а к т , ч т о det Сп ( 1 , . . . , 1 ) = ( —1 ) п det CVj ( —1 , . . ■• 5 - 1 ).
7. П о к а за ть , ч т о определитель п х n -м атр и ц ы
2 - 1 0 0 ... 0 0 0
- 1 2 - -1 0 ... 0 0 0
0 - 1 2 - 1 ... 0 0 0
Ап —
0 0 0 0 ... - -1 2 - 1
0 0 0 0 ... 0 - 1 2
равен п + 1 .
8 . П усть А, В — любые к в ад р ат н ы е м атр и ц ы п оряд ка п. П о к а за ть , ч то
А В
det = d e t(A + В) • d e t(A — В).
В А
det ( Еп + X Y ) = det ( Е к + Y X ) .
§ 3. П р и м ен ен и я оп р едел и т ел ей
Ain A
•• л пп
ац ai 2 • .. am
А [Л(]Д 5• • • 5-^(г) 5• • • 5^-(г) 5' ' ' 5^-(п)]
an ai2 .. am
Л In А
Cl п •• с пп п •• 0"пп •• л пп
Согласно соотношению (1) (с^-) = ((% det А) = (det А)Е. Таким обра
зом,
A A V = (det А)Е,
откуда при det А ф 0 получаем
(det А)~ 1 {ААУ) = A(det A)~ 1 A V = E.
Левая часть соотношения (2) является выражением элемента сС
матрицы С = А у А. Так как правые части в (1) и (2) совпадают, то
в случае det А ф 0 мы приходим к соотношениям
A(det A)~ 1 A V = (det Л)-1 ЛУЛ = Е,
означающим, что Л-1 = (det Л)-1ЛУ. □
С л е д с т в и е . Определитель равен нулю тогда и только тогда,
когда его строки (и столбцы) линейно зависимы.
Д о к а з а т е л ь с т в о . Линейная зависимость строк (или столб
цов) матрицы A G МП(Е) эквивалентна неравенству rank Л < п, т.е.
вырожденное™ матрицы Л, что по теореме 1 равносильно условию
det Л = 0. □
З а м е ч а н и е . Импликация rank Л < п = > det Л = 0 является,
конечно, непосредственным следствием основных свойств определи
телей (см. D2, D6 в § 2).
Теорема 1 имеет скорее теоретическое значение. С вычисли
тельной точки зрения, в особенности при больших размерах мат
риц, для отыскания матрицы Л-1 удобнее пользоваться методом
(Р, Q)-приведения, описанным в п. 7 гл. 2.
2. Ф ормулы К рам ера. Выведем теперь формулы для решения
системы из п линейных уравнении с п неизвестными, ради которых,
в частности, и была первоначально развита теория определителей.
Т е о р е м а 2 (Крамер). Если линейная система
CLuXi + . . . + CL\n X n = b i ,
C L nlX i T . . . T CLn n X n — Ьп
0"п1
XI = к = 1, 2, .. ., п
ац &1 к dir
&п1 &пк
(числитель D получается заменой к-го столбца в D = det(a^)
столбцом свободных членов).
Д о к а з а т е л ь с т в о . По теореме 1 матрица А = (а^) обратима.
Поэтому, записав нашу систему в виде А Х = В , мы, как и в и. 8 § 3
гл. 2, будем иметь
Ап А 21 A-ni Ьг
Аи А 22 • • Дп2 ^2
^г°к = А- 1В = 1„
det Л
Ain А 2П • А
откуда
1 Л
Х°к = f e t Ai—^1 Aikbi =
1 0 0 ... 0 0
0 1 0 ... 0 0 1
-1 1 ... 0 0
т—1
о
1 '
0 0 0 ... -1 1 0
0 0 0 ... -1 -1 0
§ 3. Применения определителей 125
А = ari .. а гг . .. а гп
& ml .. а шг •• &тп
a ... а ш г
ml ... a m j •• a mn
Этого всегда можно достичь перестановкой строк и столбцов, не
меняющей, как нам известно, ранга матрицы А.
Выделим теперь в А строку Д(р и столбец А ^ с совершенно про
извольными номерами г, j (возможно, г ^ г или j ^ г). Составим при
помощи элементов из Д(р и А ^ минор М порядка г + 1, окаймляю
щий М :
a^\ ... а^j* а^j
м= ari a rr a rj
ац ац a ij
с коэффициентами
an ailS- i a i,s+i CL\f CL\j
Ms = (-1 y+s+i
ari ar,s—l ^r,s+1 CLrr CLrj
УП РА Ж Н ЕН И Я
2. В ы р ази ть r a n k A v через ra n k A.
3. Д о к а за ть , ч т о к в ад р ат н а я систем а линейны х одн ородны х уравнений т о г
да и только т о гд а об л ад ает н етри виальны м и реш ениями, к огд а определитель
систем ы равен нулю.
4 . О пираясь на р е зу л ь т а т ы п. 8 § 3 гл. 2 и на теорем у 2, п о к а за ть , ч то
ф у н д ам ен тал ьн ая систем а реш ений однородной систем ы
Un —1,1^1 + • • • + Un —1,пх п — О
р а н га г — п — 1 будет с о сто ять из одного в ек тора-стол б ц а
Х ° = [.D1, - D 2, D z , . . . , ( - l ) n~ 1Dn],
где Di — определитель м атри ц ы , получаю щ ейся из А = (a i j ) вы чёрки вани ем её
г-го столбца. Лю бое реш ение систем ы им еет вид X = АХ °.
5. П усть А = (d i j ) G М П(К) и (п — 1)|aij \ < \ац\ для всех ъ ф j . Д о к а за ть , ч то
det А ф 0.
У к а з а н и е . П редполож ив п ротивное, восп ользоваться к ри тери ем , сф орм у
лированны м в упр. 3. Именно, если [ж®,. . . , ж®] — н етри виальное реш ение линей
ной систем ы А Х — 0 и х® — его ком понента, имею щ ая м аксим альны й модуль,
то из к -го уравнения
akkx k 'У у ak j x j — 0
Зфк
следует оценка
т 0-1^2 а 1к1
а 2кг а 2/г2 а 2к,
Е
...,fcn=l
Ьк1Нк22 •••^ Пп)
&пк 1 апк2 &пк-
где сумм ирование п роводи тся по всем попарно различн ы м Ад,. . . , кп . П ри т < п
т а к и х индексов нет и, следовательно, det С — 0. Если же т п, то Ад, . . . , кп —
в ы борк а элементов { j i , . . . , j n }, в зя т ы х в как о м -то порядке из 1, 2 , . . . , т. С ледует
с о б р ать все члены, соответствую щ ие ф иксированной комбинации { j i , . . . , j n }, и
при помощ и ф орм улы (3) § 1 п олучить нуж ное вы раж ение:
а 1Зп a nj п Ь3гь 1 • a jn П
где 7г = П Зп
Ад кп
7. И спользуя преды дущ ее упраж нение, п о к а за ть , ч т о если А — т х п - м а т р и ц а
над К, m п, то
det^A A = ^ М 2,
det А = У] М *1 ) А( ^ ^к
i<ji <---<jk <та л Зк ) \31 ••• Зк
9 А .И. К о стр и к и н
130 Гл. 3. Определители
А С -1 А-1 - i- ' C B - 1
0 Б 0 в -1
10. П о к а за ть , ч т о если А, В , С , D £ M n (K), det А ф 0, то
А Б
det d e t(A D - А С А - 1 В) (det А) • d e t(D - С А _ 1 В ).
с Б
§ 4. К п о ст р о ен и ю т е о р и и оп р едел и т ел ей
А= Л G М.
то и V(Ft,s(А)) = 1, а поэтому
а д , * ( a)) = i
при любых индексах s ф t.
Итак,
V(F 89t) = -1 = det FS9t, V(FS9t (X)) = 1 = detFM(A),
V(Fs(X))= X = detFs(X).
Поскольку любая матрица A G Мп(Ж) записывается в виде
Ег 0
0 0
где Р и Q — произведения элементарных матриц (см. рассуждения
перед теоремой б § 3 гл. 2), свойство i) позволяет заключить, что
V(A) = det А.
§ 4- К построению теории определителей 133
УП РА Ж Н ЕН И Я
= {{xi.. ,х к)(хк+1 . . ,x n- i) ) x n =
= (x 1 x 2) ■. . х к)хк+1) . . . x n- i ) x n,
т.е. снова левонормированное произведение. К тому же виду приво
дится и правая часть доказываемого равенства (1). □
Ранее был введён знак суммирования ^ Х { . Очевидно, его мож
но использовать и в любом аддитивном коммутативном моноиде. В
мультипликативном моноиде аналогом служит знак кратного произ
ведения:
2 3 п / п —1 \
Дж^ = Ж1 Ж2 , Д Xi = (х 1х 2)х3, Д = ( Д х г ) х п-
УП РА Ж Н ЕН И Я
§ 2. Группы
1. О п р еделен и е и прим еры . Рассмотрим множество GLn(M)
всех п х n-матриц с вещественными коэффициентами и с отличным
от нуля определителем. Согласно теореме 3 из § 2 гл. 3 det А / О,
det В ф 0 = > det АВ ф 0. Мы видим, что А , В £ GLn(R) = > АВ G
G GLn(R). Далее, (АВ)С = А(ВС) и существует выделенная матрица
Е такая, что АЕ = ЕА = А для всех Д Е GLn(R). Кроме того, у ка
ждой матрицы Д G GLn(R) имеется “антипод” — обратная матрица
Д-1 , для которой ДД-1 = Д-1Д = Е.
Множество GLn(R), рассматриваемое вместе с законом компози
ции (бинарной операцией) (А, В) i-A АВ и называемое полной линей
ной группой степени п над R, можно было бы коротко определить,
следуя терминологии § 1, как подмоноид всех обратимых элемен
тов моноида (Mn(R), -,Е). Но этот подмоноид настолько важен, что
он заслуживает специального названия и даёт веский повод ввести
общее
О п р е д е л е н и е . Моноид G, все элементы которого обратимы,
называется группой. Другими словами, предполагаются выполнен
ными следующие аксиомы.
G0) На множестве G определена бинарная операция (х,у) i-А ху.
G1) Операция ассоциативна: (xy)z = x(yz) для всех x, y, z G G.
G2) G обладает нейтральным (единичным) элементом е : хе =
— ех — х для всех х G G.
140 Гл. 4 • Группы. Кольца. Поля
П оэтом у SLn (M) — п од груп п а в G L(K ); она носит название специальной линейной
группы степени п над К. Её н азы в аю т ещё и унимодулярной группой, хотя к
последней ч асто при числяю т м атр и ц ы с определителем =Ь1.
§ 2. Группы 141
1 т 1 0 гп га — 1
0 1 5 т 1 5 1 1
получаем
т ~ е, V?! — (12 3), <у92 ~ ( 1 3 2),
01 ~ (2 3), "02-(13), 0з ~ (1 2).
Так как других перестановок степени 3 нет, то можно утверждать,
что группа D 3 всех преобразований симметрии правильного тре
угольника обнаруживает большое сходство с симметрической груп
пой S 3 .
В том же смысле близки друг к другу циклические группы Сп
(см. пример в п. 2) и ((1 2 ... п)) С Sn. Эти факты, а также общие
размышления о группах не могут не приводить к весьма естествен
ному вопросу о наиболее существенных свойствах групп. На первый
взгляд, полная информация содержится в таблице умножения группы
G, называемой таблицей Кэли:
9i 92 9п • • •
91 9 i9 i 919 2 • •• 9 i9 n •••
Заметим, что
/(я) = е', f(b) = е' =>■ f(a * b) = f(a) о f(b) = е' ое' = е',
/ ( а ” 1) = /( а ) ” 1 = ( е 'Г 1 = е'.
Поэтому ядро Кег/ — подгруппа в G.
5. Словарик. П римеры. Стоит отметить, что термины сюръ
ективное отображение (отображение “на”), инъективное (отобра
жение вложения), биективное (взаимно однозначное отображение),
применимые к отображениям любых множеств (без операций), в слу
чае групп (и в случае других алгебраических структур) заменяются
соответственно терминами эпиморфизм (гомоморфизм “на”), моно
морфизм (гомоморфизм с единичным ядром), изоморфизм (взаимно
однозначный гомоморфизм — эпиморфизм и мономорфизм одновре
менно). Имеется тенденция к замене гомоморфизма термином мор
физм. Этот словарик полезно иметь в виду при чтении математи
ческой литературы, но на первых порах желающие могут обойтись
двумя терминами: изоморфизм и гомоморфизм с добавлениями “в”
и “на”.
В дополнение к рассмотренным выше приведём ещё несколько
примеров морфизмов групп.
П р и м е р 5. А д ди ти вн ая гр у п п а целых чисел Z гом ом орф но о то б р аж а ет ся
на конечную циклическую груп п у (д) п о р яд ка q , если полож ить / : п i-Э дп (см.
тео р ем у 2 § 2). В этом случае, очевидно, К ег / = {lq \ I Е Z }. В самом деле, ясно,
ч т о {lq} С К е г / . О братное вклю чение следует из тео р ем ы 1.
П р и м е р 6. О тображ ени е / : К —» Т = SO(2) а д ди ти вн ой груп п ы вещ ествен
ны х чисел на груп п у Т вращ ении плоскости с неподвиж ной точкой 0, задаваем ое
ф ормулой /(Л ) = Фд (Фд — вращ ение п ро ти в часовой стрел ки на угол 27гА), го
моморфно, т а к к а к Фд о Ф^ = Фд+ ^. В ращ ение на угол, целочисленно к р ат н ы й
27г, совп ад ает с единичны м вращ ением (на нулевой угол), поэтом у К е г / = Z.
Г оворят т ак ж е, ч т о / — гом ом орф изм К на ок р у ж н о сть S'1 единичного радиуса,
поскольку и м еется взаим но однозначное соо тв етств и е м еж ду Фд и точкой на S'1
с полярны м и к оорд и н атам и (1, 2тгА), 0 ^ А < 1.
П р и м е р 7. П олная линейная гр у п п а G L m (M) вещ ественны х м атр и ц А (т.е.
м атр и ц с коэф ф ициентам и в К с не равн ы м нулю определителем det А гом ом орф
но о т о б р аж а ет ся на м ульти п л и кати вн ую груп п у М* отли чны х от нуля вещ ествен
ны х чисел, если полож ить / := det. Условие гом ом орф изм а f ( A B ) = f ( A ) f ( B ) —
лиш ь иная ф орм ул и ровк а тео р ем ы 3 § 2 гл. 3. По определению SLm (M) = К е г / .
П р и м е р 8. Р ассм о тр и м циклическую груп п у С 2 — ( —1) = { 1 ,- 1 } п оряд
к а 2. Если угодно, её можно з а д а т ь а б ст р а к т н о таблицей Кэли:
1 -1
1 1 -1
—
—
11
11
1
I
а ф е ==>■ (р(а) Ф а.
(g,h) ^ д * h = gth.
УП РА Ж Н ЕН И Я
Рис. 17
четверная гр у п п а (или группа Клейна) V4 = {е, (12)(34), (13)(24), (14)(23)}, а
возле други х верш ин ди агр ам м ы поставлены образую щ ие цикли ческих подгрупп.
2 0 . П о к а за ть , ч т о все груп п ы п оряд ка 4 абелевы и с то ч н о стью до изом ор
ф изм а исчерпы ваю тся груп п ам и перестан овок U = ((1234)), V4 , или ж е группам и
м атриц :
—
11
0 1 0
К
I
) С G L 2 (M),
{ -1 0 ’ 0 -1
1 0 -1 0
Ь2 0 -1 ’ 0 1 ) С G L 2 (M).
§ 3. К ол ьц а и поля
1. О пр еделени е и общ и е св ой ств а колец. Алгебраические
структуры (Z,+), (Z,-) выступали у нас в качестве самых первых
примеров моноидов, причём на (Z,+) мы смотрели позднее как на
аддитивную абелеву (фактически циклическую) группу. В повсе
дневной жизни, однако, эти структуры чаще всего объединяются
и получается то, что в математике называется кольцом. Важная
компонента элементарной арифметики заключена в дистрибутивном
(или распределительном) законе (а + Ъ)с = ас + 5с, кажущемся три
виальным только в силу приобретённой привычки. Попытавшись,
например, объединить алгебраические структуры (Z,+), (Z,°), где
n o m = n + m + пт , мы уже не заметим столь хорошей согласован
ности между двумя бинарными операциями. Прежде чем переходить
к дальнейшим примерам, дадим точное определение кольца.
152 Гл. 4 • Группы. Кольца. Поля
( / + 9 )Ц ) = f ( x ) ® g ( x ) ,
= f ( x ) © g(x)
(0 и 0 — операции сложения и умнож ения в К) . Э то, очевидно, не т а композиция
(суперпозиция) ф ункций, ко то р ая привела нас в случае линейны х отображ ен и й к
кольцу М п . С корее мы становим ся здесь на т о ч к у зрения, п ри нятую в м ат е м а
тическом анализе, к огда, наприм ер, при X = К, К = К произведением ф ункций
tg и sin будет tg • s i n : х tg х • sin ж, а не tg о s in : х tg (sin х ) .
Л егко проверяется, ч т о К х удовлетворяет всем аксиом ам кольца. Т ак, ввиду
ди стри бути вн ости операций в К имеем
+ 0 1 2 0 1 2
0 0 1 2 0 0 0 0
Z 3 :
1 1 2 0 1 0 1 2
2 2 0 1 2 0 2 1
+ 0 1 2 3 0 1 2 з
0 0 1 2 3 0 0 0 0 0
Z4 : 1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1
0 1 0 0 • 0 2 02) = 0 1 0-2 0 0 2 ) ,
ш = Ш
\к = 1 / fc=l
11
164 Гл. 4 • Группы. Кольца. Поля
1 2 3 4 1 0 1 0
-10 13 14 15 0 1 0 1 (mod 2)
12 -9 14 15 — 0 1 0 1
12 13 -8 15 0 1 0 1
мы заключаем, что ранг системы равен 2 и система допускает два независимых
решения Х \ = [1 ,0 ,1 ,0 ], Х 2 = [0 ,1 ,0 ,1 ]. Во избежание недоразумений следова
ло бы писать Х \ = [1 ,0 ,1 ,0 ], Х 2 = [0 ,1 ,0 ,1 ], но мы считаем себя достаточно
подготовленными к восприятию упрощённой записи.
Если charP = 1 1 , то из сравнения
1 2 3 4 1 2 3 4
-10 13 14 15 1 2 3 4
(mod 11)
12 -9 14 15 — 1 2 3 4
12 13 -8 15 1 2 3 4
вытекает, что система имеет три независимых решения
Х г = [9 , 1 , 0 , 0 ], Х 2 = [8 , 0 , 1 , 0 ], Х 3 = [7 , 0 , 0 , 1 ].
М = ( 0 , 0 ), И = ( 1 , 0 ), Р = (0 ,1 ), У = ( 1 , 1 ),
интерпретируемых как векторы-строки двумерного линейного пространства Fg
над полем F2 = Z 2 = { 0 , 1 } из двух элементов. Но во время передачи в канале
связи возникают помехи (замены символа 0 на 1 или 1 на 0), в результате ко
торых на приёмный конец канала может прийти, например, сообщение РИМ У
РИМ . Согласно фундаментальной теореме Ш еннона за счёт увеличения длины
§ 3. Кольца и поля 165
У П РА Ж Н Е Н И Я
кольце с единицей;
166 Гл. 4 • Группы. Кольца. Поля
а Ъ —а —Ъ
—Ъ а ~{~Ъ) -а (3)
а b с d ас —bd ad + be
—Ъ а —d с —(ad + be) ас —bd
168 Гл. 5. Комплексные числа и многочлены
/ : а + bVd ^ а —bVd
явл яется автом орф изм ом поля Q(V d) (аналог комплексного сопряж ения).
Нормой числа а = а + bVd н азы в ается число
N ( a ) — о? —db2 = a f ( a ) .
О чевидно, ч т о N (a ) = 0 а = 0. Далее, т а к к а к / — автом орф изм , то
N(a(3) = a(3f(a(3) = a(3f(a)f((3) = a f ( a ) • (3f((3) = N ( a ) • N((3).
В частн о сти , N (a ) • N ( a ~ 1) = N ( a a ~ 1) = N ( 1) = 1. П оэтом у норм а о бл адает
сущ ественны ми свой ствам и (к в ад р ат а) модуля в поле С.
6. Э лем ен тар н ая ге о м ет р и я ком плексны х чисел. Вещест
венное векторное пространство С = (1, г)к является евклидовым: оно
снабжено положительно определённым скалярным произведением
(zi\z2) = Rezi~Z2 = х гх 2 + yiy2,
где zk = x k + iy k, k = 1,2.
Справедливо неравенство Коши—Буняковского—Шварца
\(zi\z2)\ ^ \гг\ ■\z2\,
поскольку |(^1 1^2)| = \Rezi~z2\ ^ \z{z2\ = \zi\\z2\ = |2i ||z2|.
Два вектора (комплексных числа) 24, 2:2 называются ортогональ
ными или перпендикулярными друг другу, если (^11^2) = 0.
Из соотношения (12) непосредственно вытекает, что два векто
ра z,cz G С* ортогональны в точности тогда, когда с — чисто
мнимое число.
§ 1. Поле комплексных чисел 177
к
С
II
\ а<ч
\ к\\ \/а <>
--
Ч \ Г \\ \\ / 1
^
\\ \\ \\ \\ / 1
/ 1
V----V
----о О-- _________
>Т
0 1 а 0 0 1 1+ а
'S'
—
II
1
а б в
Рис. 23
Откладывая на осях координат отрезки конструктивных длин
§ 1. Поле комплексных чисел 179
УП РА Ж Н ЕН И Я
12:
180 Гл. 5. Комплексные числа и многочлены
§ 2. К ол ьц о м н огоч л ен ов
Наряду с линейными системами, рассмотренными нами в гл. 2
и гл. 3 , многочлены составляют старый и хорошо изученный раздел
традиционной алгебры. На языке многочленов формулируются или
решаются самые различные задачи математики. Тому есть множе
ство причин, и одна из них заключается в свойстве универсальности
кольца многочленов, на чём мы коротко остановимся в и. 1.
Пусть К — коммутативное (и, как обычно, ассоциативное) коль
цо с единицей 1 , А — некоторое его подкольцо, содержащее 1 . Если
t Е К, то наименьшее подкольцо в К, содержащее А и £, будет, оче
видно, состоять из элементов вида
a(t) = &о Т
+ Q-2^2 + ... + <intn, (*)
где as Е А, п Е Z, п ^ 0 . Мы обозначим его A[t\ и назовем кольцом,
полученным из А присоединением элемента £, а выражение (*) —
многочленом от t с коэффициентами в А. Что понимать под сум
мой и произведением многочленов, видно из простейших примеров
§ 2. Кольцо многочленов 181
* " = (0,0, . . . , 0, 1, 0, . . . )
Кроме того, ввиду (2) и ввиду включения А С В имеем
(0, 0, .. ., 0, а, 0,.. .) = а Х п = Х па.
Итак, если / п — последний отличный от нуля член последователь
ности / = (/о, Л, • • •, /п, 0, 0,...), то в новых обозначениях
/ = (/о, • • • >/га-Ъ 0, 0, . . . ) + f nX n =
= (/о,..., / „-2, 0, 0, . . . ) + /„ _ iX ”- 1 + f nX n =
= /о + f i X + f 2 X 2 + ... + f nX n.
Такое представление элемента / однозначно, поскольку / о, . .., f n в
правой части (3) — это члены последовательности (/о,..., / п, 0,...),
которая равна нулю тогда и только тогда, когда /о = ... = f n — 0.
О п р е д е л е н и е . Введённое выше кольцо В обозначается через
А[Х] и называется кольцом многочленов над А от одной переменной
X , а его элементы — многочленами (или полиномами).
§ 2. Кольцо многочленов 183
= (Х > Д = П * ( Я - П*(5)- □
У П РА Ж Н ЕН И Я
1. М ногочлены f ( X ) = X s + З Х 4 + Х 3 + 4 Х 2 - З Х - 1 , д( Х) = Х 2+ Х + 1 мож но
с ч и т а т ь принадлеж ащ им и кольцу Z\X] или, скаж ем , кольцу Z^[X] в зависим ости
о т т о го , к а к и н те р п р е ти р о в а ть их коэф ф ициенты . П рим еняя алго р и тм деления с
о статк о м , п о к а за ть , ч т о в первом случае f ( X ) не делится на д(Х), а во втором —
делится. В озм ож на ли реализаци я противополож ного вар и ан та?
2. Д о к а за ть при помощ и тео р ем ы 3, ч т о если F — поле, то гр у п п а всех
автом орф изм ов кольца F\X], тож д ествен н ы х на F , и зом орф на группе п рео б р а
зований X 1-» а Х + 6, где a, b Е F и а ф 0.
3. П о к а за ть , ч т о многочлен / £ F \ X \ , . . . , Х п \ явл яется ф орм ой степени т
(см. до к азател ьств о теорем ы 4) т о гд а и только т о гд а , к огд а f ( t X \ , . . . , t X n ) =
= t 171 f ( X i , . . . , X n ), где t — новая переменная.
4 . П о к а за ть , ч т о число разл ичн ы х одночленов о т п независим ы х перем енны х
полной степени т равно ^ 171 ^^ .
У к а з а н и е . И спользовать принцип двойной индукции по п и т , опираясь
на соотнош ение
m + (n — 1) — 1 \ / (m — l ) + n — 1 ^ ( т + п —V
т / V т —1
5. В озвращ аясь к определениям п. 1, рассм отри м совокуп ность А[[Х]] т а к
назы ваем ы х формальных степенных рядов f ( X ) = ^ У > 0 а { Х г от переменной
(неизвестной) X или, если угодно, последовательностей (ао, а \ , а 2 , . . . ) с лю бым,
возмож но, бесконечны м, числом коэф ф ициентов ai ф 0, принадлеж ащ их ком м у
т ат и в н о м у кольцу А. Д ействия с ф орм альны м и степенны м и рядам и из А[[Х]]
проводятся по тем ж е правилам , ч т о и действия с многочленами:
=У(«г+6г)М,
- ( 5 > М ) = J 2 CX , Ck = J2 CHbj.
i+ j= k
§ 2. Кольцо многочленов 189
п т у .м д д
исходя из биномиальной ф орм улы ^ ( п ) Х г = (1 + Х ) п в Ъ\Х\ и очевидного
разлож ения (1 + Х ) т (1 + Х ) п = (1 + Х )ш + п .
б) Н ай ти число 1п всевозм ож ны х расстан овок скобок в произведении длины
п элементов м нож ества с одной бинарной операцией. С этой целью удобно ввести
производящ ую ф ункцию — ф орм альны й степенной ряд
l ( X) = 1пХп = X + X 2 + 2Х 3 + ...,
п^1
In —^ ^ ^кК—к
к=1
в ы те к а е т, ч т о l ( X ) 2 = l ( X) — X . Реш ая это к в ад р ат н о е уравнение, находим
т =
(зн ак перед радикалом определяется условием 1п > 0). Но если степенной ряд
f ( X ) так ов, ч т о f r — 1 + XX, г Е N, то
[к— 1
п х ) = 1+ Е п 1
----- i
г
{ХХ) к
к\
(разлож ение в ряд Тейлора, к оторое можно п р и н ять пока на веру). В наш ем слу
чае г = 2, А = —4, и п р о стая п о д стан овк а д аёт окончательное вы раж ение
2п - 2
К —п п —1
(зам ети м , ч т о 1п = Сп - \ — классическое число К а та л ан а ).
П ред л агается провести все пром еж уточн ы е вы кл адки .
190 Г л. 5. Комплексные числа и многочлены
§ 3. Р а зл о ж ен и е в кольце м н огоч л ен ов
1. Э л ем ен тар н ы е св ой ств а д ел и м ости . В разных местах, на
чинал с гл. 1, мы затрагивали вопросы делимости в кольце Ъ целых
чисел, но так называемая основная теорема арифметики у нас оста
валась пока недоказанной. Теперь настала пора не только заполнить
этот пробел, но и распространить соответствующие утверждения на
более широкий класс колец. В первую очередь нас интересует кольцо
многочленов Р[Х] над полем Р.
Начнём с произвольного целостного кольца К. Обратимые эле
менты в К были названы нами делителями единицы. Часто их имену
ют ещё регулярными элементами. Совершенно очевидно, что много
член / Е А[Х] обратим (регулярен) в точности тогда, когда deg / = 0
и / = /о — обратимый элемент кольца А, поскольку f g — 1 =>
= > deg / + deg д = deg 1 = 0.
Говорят, что элемент b Е К делится на а £ К (или b кратен
а), если существует такой элемент с Е К, что b = ас (это обозна
чается а\Ъ). Если а\Ъ и Ь\а, то а и b называются ассоциированными
элементами. Тогда b = гш, где и |1. В силу сделанного выше замеча
ния ассоциированность многочленов /, g Е А[Х] означает, что они
отличаются лишь обратимым множителем из А.
Элементу Е К называется простым (или неразложимым), если р
необратим и его нельзя представить в виде р = аЪ, где а,Ь — необра
тимые элементы. В поле Р каждый ненулевой элемент обратим и в
Р нет простых элементов. Простой элемент кольца А[Х] называется
чаще неприводимым многочленом.
Отметим следующие основные свойства отношения делимости в
целостном кольце К.
1) Если а\Ь, Ь|с, то а\с. Действительно, мы имеем b = аЪ', с = 6с',
где b',c' Е К. Поэтому с = (аЬ')с' = а(Ь'с').
2) Если с\а и с\Ь, то с\{а ± Ъ). В самом деле, по условию а = со!,
b = cb1 для некоторых а', b' Е К , и ввиду дистрибутивности а =Ь b =
= с(а'±Ь').
3) Еслп а|Ь, т е а|Ьс. Ясно, что b = аЪ1 = > Ъс = (ab')c = а{Ъ!с).
Комбинируя 2) и 3), получаем
4) Еслп каждый из элементов &ь • • •, Ът Е К делится на а Е
Е iT, то на а будет делиться также элемент Ь\С\ +&2С2+ . . . + &тоСт,
где ci, С2, . .., ст — произвольные элементы.
О п р е д е л е н и е . Говорят, что целостное кольцо iT — кольцо с
однозначным разложением на простые множители (или К — фак
ториальное кольцо), если любой элемент а ф 0 из К можно предста
вить в виде
а = и р \ р 2 ■ ■- P r , (1 )
9 = 3 • 3 = (2 + v/ Z 5)(2 - V ^ E ) .
iv) НОД(а, 0) = а ;
v) НОД(баДб) =Ш ОД(а, 6);
vi) НОД(НОД(а, 6), с) = НОД(а, НОД(6, с)).
Проверка их не вызывает никаких трудностей и оставляется чи
тателю. Свойство vi) позволяет также распространить понятие НОД
на произвольное конечное число элементов.
По аналогии с НОД (а, 6) вводится дуальное понятие наименьше
го общего кратного т = НОК(а,6) элементов а, 6 Е К, также опре
делённого с точностью до ассоциированности двумя свойствами:
i') a|m, Ь\т;
и') а|с, Ь\с => т\с.
В частности, полагая с = ab, получаем т\аЪ.
Т е о р е м а 2. Пусть для элементов а,Ъ целостного кольца К
существуют НОД (а, 6) и НОК(а,6).
Тогда:
а) НОК(а, 6) = 0 <(=> а — 0 или 6 = 0.
б) а, b ф 0, т = НОК(а, 6), ab = dm = > d = НОД(а, 6).
Д о к а з а т е л ь с т в о . Утверждение а) вытекает непосредствен
но из определения НОК(а,6). Для доказательства б) нам нужно убе
диться, что элемент d, определённый равенством ab = dm, обладает
свойствами i), ii). В самом деле, i') = > т = а'а, т = 6'6. Зна
чит, ab = dm = da'a, откуда после сокращения на а, допустимо
го в любом целостном кольце, имеем b = da', т.е. d|6. Аналогично,
ab = dm = db'b = > а = db', т.е. d|a. Мы пришли к i).
Далее, пусть a = /a ", b = fb". Положим с = fa"b". Тогда с =
= ab" = 6а" — общее кратное а и 6. Согласно свойству и') с = с 'т
для некоторого с' Е К , откуда / с 'т = /с = / 2а//6// = аб = dm, т.е.
d = /У и /|d. Мы пришли к ii). □
О п р е д е л е н и е . Элементы а, 6 целостного кольца, в котором су
ществует НОД, называются взаимно простыми, если НОД(а,6) = 1.
Из свойств i), ii), i'), ii') или из теоремы 2 нельзя извлечь ни
способа вычисления, ни доказательства существования НОД(а,6) и
НОК(а, 6). Теоремой 2, б) устанавливается лишь соотношение между
ними.
Предположим теперь на время, что К — факториальное кольцо.
Обозначим через V множество простых элементов в К такое, что
всякий простой элемент из К ассоциирован с одним и только одним
элементом из V . Рассматривая разложения двух элементов а, 6 Е К ,
удобно считать, что в них входят одинаковые элементы из V , но
некоторые, возможно, с нулевыми показателями, т.е.
a = up1k1 ...p krr , b = vp[1 ...р 1;,
и\ 1 , г|1; ki ^ 0, k ^ 0; Pi е Р ; 1 ^ г ^ г.
При помощи теоремы 1 получается легко запоминающийся
13 А .И. К о стр и к и н
194 Г л. 5. Комплексные числа и многочлены
( X + 1)Р — 1
/(* + 1) (X + 1) - 1
все коэф ф ициенты ко то р о го , кром е старш его, делятся на р в первой степени
(свойство бином иальны х коэф ф ициентов, отмеченное в упр. 6 из § 3 гл. 4) и к
котором у, следовательно, применим к р и тер и й Э йзенш тейна.
УП РА Ж Н ЕН И Я
1. П о к а за ть , ч то
nZ + mZ = Z • НОД(п, га),
nZ П mZ = Z • Н ОК(п, га).
det(T ^ ) = х д 2 ( . .. , X i j , . .
§ 4. П оле отн ош ен и й
(\gi',
—) ('-92'
—) = —
9192
е р°(х )-
Далее,
«/4 I /2 _ f i 92 f 2‘ 9 x j-y / у-\
— ± — — -------------------- G Л Д А J,
01 92 9192
поскольку степени каждого из слагаемых Дд2 и / 2gi строго меньше
степени знаменателя gig2• Как мы условились перед формулировкой
теоремы 2, 0 G Ро(Х). В то же время 1 0 Р0 (Х). □
До сих пор мы всё время подчёркивали, насколько похожи кольца
Ъ и Р[Х]. При переходе к их полям отношений появляется существен
ное различие: правильные дроби в Q не образуют кольцо. Например,
2 3 _ 19
3 + 5 “ 15'
3. П ростейш ие дроби. Правильная рациональная дробь f /д G
G Р(Х) называется простейшей, если д = pn, п ^ 1, где р = р(Х) —
неприводимый многочлен, причём deg / < degp.
§ 4 • Поле отношений 205
( / !- / { )№ = (/ 2 -/ 2 )5 1 .
Из делимости (Д —Д)#2 на дд и из взаимной простоты дд,#2 следует,
что разность Д —Д должна делиться на дд. Но deg(/i —Д) < degg, и,
стало быть, Д —Д = 0 . Единственность разложения (3) установлена.
Э т а п 2. Пусть в правильной рациональной дроби // д для (нор
мализованного) знаменателя д имеется каноническое разложение
9= рТ р¥ (4)
в произведение степеней попарно различных нормализованных не
приводимых над Р многочленов pi (X), p 2 ( X ) , ... ,рт(Х). Тогда су
ществует однозначно определёное разложение
/
9 2=1
206 Г л. 5. Комплексные числа и многочлены
Т
II
I ан
9 рТ рТ - ' - р7
^ Л 7
Так как Д и /о определены однозначно, то по предположению индук
ции это верно и относительно Д, • • •, fm-
Э т а п 3. Всякая правильная примарная дробь а/рп представля
ется, и притом единственным образом, в виде суммы простейших
дробей.
Действительно, так как по условию deg а < ndegp, то евклидов
алгоритм деления с остатком приведёт нас к системе равенств
a = q1 pn~ 1 + r 1, degri < (п —1) degp,
r\ = q2Pn~ 2 + r 2, deg r 2 < (n - 2) degp,
где deg^ < degp для всех однозначно определённых частных qi , ...
. .., qn. Мы видим, что
а = д!р” 1 + q2pn 2 + ... + qn- i P + qn,
откуда
а Ъ_ 02 дп -1 Qn
рп р р2 pn_1 рп
Так как deg^ < degp, то дроби qi/p1 являются простейшими. По
построению они однозначно определены (аналог разложения целого
числа в 2-адическую или в десятичную дробь).
Э т а п 4. Рассуждения этапов 1-3, соединённые вместе, дают всё,
что нужно.
Из доказательства теоремы 3 видно, что если f /д — правильная
рациональная дробь, то знаменателями соответствующих простей
ших дробей при заданном каноническом разложении (4) для д будут
; p £ r ,K r -1 ,...,Pm -
Тема простейших дробей, не очень актуальная для алгебры
(хотя и дающая новые примеры колец), находит важные приложения
в анализе. Это обусловлено специальным видом неприводимых мно
гочленов над полями С и Е, о чём более подробно будет говориться
в гл. 6.
§ 4 • Поле отношений 207
УП РА Ж Н ЕН И Я
К = К х D К 2 D ... D K N D ...
подколец К дг, н а тя н у ты х на дроби ( а Х + Ь ) / ( Х 2 + 1)п , п N.
Глава б
К О Р Н И М Н О ГО Ч Л ЕН О В
§ 1. О бщ ие св ой ств а корней
1. К ор н и и линейны е м н ож и тел и . Пусть коммутативное
кольцо А с единицей содержится в целостном кольце К.
О п р е д е л е н и е . Элемент с Е К называется корнем (или нулём)
многочлена / Е А[Х], если /(с) = 0. Говорят также, что с — корень
уравнения f(x) = 0.
Необходимость рассмотрения колец, содержащих А собственным
образом, станет понятной, если вспомнить, что многочлен f ( X) =
= X 2 +1 над Е не имеет нулей в Е, но /(г) = 0, i Е С = Е[г]. Сначала
мы рассмотрим, однако, случай К — А.
Т е о р е м а 1 (теорема Безу). Элемент с Е А является корнем
многочлена / Е А[Х] тогда и только тогда, когда X —с делит / в
кольце А[Х].
Д о к а з а т е л ь с т в о . Эта теорема — часть более общего утверж
дения, которое мы могли бы доказать давно. А именно, алгоритм
деления с остатком (теорема 5 из § 2 гл. 5) гласит, что f ( X) =
= ( X —c)q(X) + г(Х), где degr(X) < deg(X —с) = 1. Значит,
r(X) — константа. Подстановка с вместо X (т.е. применение отоб
ражения Пс из теоремы 2 § 2 гл. 5) даёт /(с) = г, так что всегда
f ( X) = ( Х - c)q(X) + /(с). (1)
В частности, /(с) = 0 <(=> f ( X) = ( X —c)q(X). □
Деление многочлена f ( X) с коэффициентами в целостном кольце
А на линейный многочлен X — с удобно осуществлять по так назы
ваемой схеме Горнера, более простой, чем общий алгоритм деления
с остатком. Именно, пусть
f ( X ) = a o X n + a 1 X n~ 1 + ... + ап, щ £ А.
Согласно формуле (1)
q ( X ) = b0X " - 1 + h X n ~ 2 + . . . + Ьп - и bj G А .
§ 1. Общие свойства корней 209
Рис. 24
Тонким вопросам выбора узлов интерполяции и разработки об
щих методов приближения функций посвящены целые разделы ма
тематики. Стоит отметить, что применение интерполяционных про
цессов сыграло большую роль в развитии теории трансцендентных
чисел (определение алгебраических и трансцендентных чисел см. в
§ 2 гл. 5), так что здесь смыкаются интересы теории функций, тео
рии чисел и алгебры.
Отметим в заключение, что каждой рациональной несократимой
дроби / / д G Р( Х) (см. § 4 гл. 5) и каждому расширению F D Р с
бесконечным числом элементов сопоставляется рациональная функ
ция f / g : F(f/g) -4 F с областью определения F(f/g), получающей
ся из F удалением конечного числа элементов — нулей многочлена
д в F. Можно доказать, что при указанных условиях отображение
f / g и-» f / g взаимно однозначно. Нам это утверждение не потребу
ется. Интуитивно оно ясно. Несмотря на это соответствие, нужно
делать чёткое различие между рациональными функциями и рацио
нальными дробями. Рациональная функция х i—у 1/х не определена в
точке х = 0, в то время как вопрос об определимости рациональной
дроби 1 / Х вообще не возникает.
3. Д иф ф еренцирования кольца многочленов. Функциональ
ная точка зрения на многочлены делает естественным следующее
определение. Пусть
f ( X) = а0Х п + aix n~l + ... + ап- \ Х + ап
— многочлен степени п над полем Р. Его производной называется
многочлен
f ' ( X ) = п а о Х " - 1 + ( п - 1)а1Х п~ 2 + . . . + а п- \ . (6)
§ 1. Общие свойства корней 213
В частности,
к - 1 ж/
(/*)' = k f k~4' - (9 )
Соотношения (7), (8), переписанные в терминах отображения
: / н->> f (говорят также, что — оператор дифференциро
вания), наводят на мысль ввести в рассмотрение для произвольного
кольца К отображение Т) : К —>• К, обладающее свойствами
V(u + v) = Vu + V v , (7')
V(uv) = (Vu)v + u(Vv). (S')
Такого рода отображения кольца К в себя, называемые дифференци
рованиями, весьма полезны для изучения К, а их множество Dei (К)
оказывается интереснейшим объектом, вводящим в обширную об
ласть математики (группы и алгебры Ли).
Обобщением (8') служит формула Лейбница
m
V m{uv) = Е ( 7 ) Т)киТ>т~к'и> (8")
к= 0
214 Гл. 6. Корни многочленов
f ( X) = ( X - Cl) ( X - c 2 ) . . . ( X - c n).
корни с\ , . . . , сп:
а\ — —(с\ + С2 + ... + сп),
ak = ( - l ) k ^2 ch
Qi ci2..
Q2 ***^ik i ( 12)
h < i 2 <---<ik
Х Р - 1 - 1 = ( X - 1) ( Х - 2 ) . . . ( X - (р - 1 )). ( 14 )
218 Гл. 6. Корни многочленов
УП РА Ж Н ЕН И Я
им еет ненулевое реш ение. П ровери ть, ч т о все реш ения сравнения х 2 — 2 у 2 =
= 0 (m o d 5 ) три ви альн ы и, следовательно, условие г < п сущ ественно.
6. П о к а за ть , ч т о Н О Д ( / / , / ) = 1, если c h a r P = 0, / — неприводим ы й над
полем Р многочлен и / ' — его производная.
7. Д о к а за ть , ч т о /' = 0 = > / = const для многочлена /(X ) над полем нулевой
х а р ак т ер и с т и к и и / ' = 0 = > / ( X ) = д ( Х р ) для многочлена / ( X ) над полем
х а р ак т ер и с т и к и р > 0 (д — н екоторы й другой многочлен).
8 . Из п. 3 мы знаем , ч т о к аж дое ди ф ф еренц ирован ие кольца многочленов
Р[Х] им еет вид
и е р [х ].
У стан ови ть справедливость утверж ден ий:
i) м нож ество к о н стан т (то, ч т о переходит при ди ф ф еренц ирован иях в
нуль) — подкольцо в Р [Х ];
п) произведение TUT V, вообщ е говоря, не явл яется ди ф ф еренц ирован ием , но
если c h a r Р = р > 0, то степень (Ти )р — ди ф ф еренцирование;
ш ) к о м м у та то р [TU, T V] = TUTV —TVTU всегда явл яется диф ф еренц ирован ием
ви да Tw , где w = uv' — u'v.
9. В случае кольца многочленов Р [ Х i , . . . , Х п \ от п перем енны х естественно
ввести оп ератор частного дифференцирования по к- й переменной
дХк
.. • • •ЛV кl k ... лv i п- ikX\г1 ’ ’ ’ ^х к1к~
Е X k - ^ = m - f ( X u . . . , X n ).
оХк
О братно: если c h a r P = 0, то т о ж д ес тв у Э йлера удовлетворяю т только ф орм ы
степени т = 1 , 2 , 3 , . . .
10. П о к а за ть , ч т о о тсу тств и е линейны х множ ителей у м ногочлена
Х п + a i X ” - 1 + . . . + a „ e Z 2 [X]
равносильно вы полнению условия
а п ( 1 + У ] a i ) Ф 0-
Ady Х?Х2 Х !Х 2Х 3
Qw SlS2 S3
Рз = s? + a s i s 2 + 6s3 .
2 = 23 + а - 2-1 + 6-0,
3 = З 3 -\- и " 3 • 3 Ъ• 1
А„= П
X ”- 1 х г 1 • •• Xг1
Так как определитель является кососимметрической функцией своих
столбцов, то 7г о Дп = — знак перестановки тг Е Sn. Но в та
ком случае — симметрический многочлен, и по основной теореме
§ 2. Симметрические многочлены 227
3 0 —2 а
D(f) 0 —2 а -3 6 (16)
—2 а -3 6 2а:
g(y) = f ( y - - ) = y n + a y n - 2 + . . . = 0, (17)
V П/
т.е. в новом уравнении коэф ф ициент при у n _ 1 равен нулю. Зн ая корень уо у р ав
нения (17), мы легко найдём т а к ж е и корень жо = уо — а \ / п исходного уравнения
(14). П оэтом у без ограни чения общ ности можно с ч и т а т ь a i = 0.
Если п ы т а т ь с я н ай ти общ ую ф орм улу для реш ения уравн ен ия (15) (в чём
преуспели средневековы е м ат е м ат и к и Сципион дель Ф ерро, К ар д ан о и др.), то
неизбеж но в и гру будет вводиться ди скри м и н ан т (16) (см. ф орм улы ( 2 ) из § 2
гл. 1 ).
5. Р езул ьтан т. Основное свойство D ( f ), сформулированное в
предложении из предыдущего пункта, интерпретируется также как
признак наличия общих корней (или общих множителей) у многочле
на / и его производной f . В основе этого признака лежит в конечном
счёте алгоритм Евклида. Это даёт основание полагать, что имеется
аналогичный критерий, позволяющий непосредственно по коэффи
циентам любых двух многочленов /, g Е Р[Х] решить вопрос о том,
обладают они общим множителем или не обладают.
§ 2. Симметрические многочлены 229
Итак, пусть
f ( X) = а0Х п + а1 Х п- х + ... + ап- \ Х + ап,
д(Х) = Ь0Х п + ЬгХ 11- 1 + ... + Ът- г Х + Ьт
— два многочлена с коэффициентами в поле Р. Здесь п > 0, т > О,
но не исключается возможность того, что ао = 0 или Ьо = 0.
О п р е д е л е н и е . Результантом R es(/,д) многочленов / и д
называется однородный многочлен (однородная полиномиальная
функция) от их коэффициентов (степени т относительно ао,..., ап
и степени п относительно Ьо, ..., Ъш) вида
а\ ап
ао а± ап ^ т
с тр о к
ао ах ап j
Res (/, д) =
Ьо h Ьщ 1I
Ьо Ьх Ьщ 1
[1 с тр" о к
Ьо Ьх J Ьт
В этом определении результанта содержится некое утверждение
о его степенях как многочлена. Но оно непосредственно вытекает из
свойств определителей: если заменить в первых т строках а^ на £а^,
то Res(£/,#) = £mRes(/, #), после чего остаётся сослаться на упраж
нение 3 из § 2 гл. 5.
Выведем теперь основные свойства результанта.
Rl. Res(/, д) = 0 тогда и только тогда, когда ао = 0 = Ьо или
же f u g имеют общий множитель в Р[Х] степени > 0.
Убедимся сначала в том, что условие “ао = 0 = Ьо или же / и
g имеют общий множитель в Р[Х] степени > 0” выполняется тогда
и только тогда, когда найдутся многочлены fi,g i, одновременно не
равные нулю, для которых
f 9 i + f i 9 = 0, deg А < пь deg g\ < m. (18)
Действительно, пусть h = Н О Д (/,g), degh > 0. Тогда / = hf\,
g — —hgi, и, следовательно, fg \ + g f\ — 0. Кроме того, deg/i < n,
deggi < m, так что (18) имеет место. При ао = 0 = Ьо мы можем
положить Д = / , gi = -g .
Обратно: предположив при выполнении (18), что Н О Д (/,g) = 1,
мы ввиду факториальности Р[Х] (см. § 3 гл. 5) придём к импликации
fgi = - g f i = > /1/ъ g\gi- Стало быть, deg/ < га, deg# < гга, откуда
а 0 = 0 = Ь0-
Мы докажем теперь эквивалентность условий (18) и Res(/, д) = 0.
230 Гл. 6. Корни многочленов
Положив
Л = соХп 1 + с \Х п 2 + ... + сп- 1 ,
9 i = doXm 1 + d i X m 2 + ... + dm-1
и вычислив по формальным правилам коэффициенты многочлена
f gi +f i g степени ^ п + ш —1 , мы запишем условие (18) в виде квадрат
ной однородной системы линейных уравнений с п + т неизвестными
d o ,d i,..., dm- i, со, c i , , сп_ь
+ ... + froCo • • • = 0,
ctido + ao6?i + ... + biCo + 6oCi ... = 0, , ч
fl2^0 + + 0-0^2 • • • ^2C0 + biCi + &0C2 = 0,
Действительно, согласно R2
п
/ДХ)=оо£Ц(Х -а,-),
г=1 зфг
УП РА Ж Н ЕН И Я
СЙ
CO
sk- sk - 4 ... 1
to
- l ) S f c - -1
СЙ
ksk
CO
^k — 1 sk - 2 ... si
1
Pi 1 0 0 ... 0
P2 Pi 1 0 ... 0
P3 P2 Pi 1 ... 0
к = 1 , . . . , и',
которая тоже является симметрической. В самом деле, для любой
перестановки тг Е Sn (Sn — симметрическая группа степени п) имеем
7ГОVij ^ 7г(г)^ 7r(j) ^(^ 7г(г) ^ 7r(j)) ^7т(г),7r(j)
(или если 7г(г) > тт(j )) , так что тг индуцирует переста
новку тг на множестве элементов вида (2). В силу симметричности
§ 3. Алгебраическая замкнутость поля С 239
где
^2 s i = n = ^2 tj, V + ц = \ S 0( f ) U 5 i(/)|.
§ 4 • Многочлены с вещественными коэффициентами 241
§ 4. М н огоч л ен ы с в ещ ествен н ы м и
к оэф ф и ц и ен там и
1 . Р а зл о ж ен и е на н епр иводи м ы е м н ож и тел и в Е[Х]. Из
теоремы 1 § 3 следует, что каждый многочлен / степени п в С[Х]
может быть записан, и притом единственным образом (с точностью
до перестановки множителей), в виде
f ( X) = a ( X - c 1 ) ( X - c 2 ) . . . ( X - c n),
где а ф 0, c i , . . . , c n — комплексные числа. Пусть теперь f ( X ) =
= Х п + a iX n_1 + ... + ап- \ Х + ап — нормализованный многочлен с
вещественными коэффициентами а±, . . . , ап и с — какой-то его комп
лексный корень: с = и + iv, v ф 0. Применяя к соотношению /(с) = 0
автоморфизм комплексного сопряжения, как мы это делали во вто
ром доказательстве теоремы 1 из § 3, получим, что и /(с) = 0, по
скольку df = о,{. Стало быть, f ( X) делится на многочлен второй
степени
g(X) = (X - с)(Х - с) = X 2 - (с + с)Х + сс = X 2 - 2 и Х + (и 2 + г2)
с отрицательным дискриминантом D(g) = 4и 2 —4(и2 + v2) = —4г 2 <
< 0. Условие D(g) < 0 необходимо и достаточно для неприводимости
над Е квадратного многочлена д Е ЩХ].
Если, далее, к — кратность корня с многочлена f ( X) и I ^ к —
кратность корня с, то f ( X) делится на l-ю степень многочлена д(Х):
f ( X) = g( X) lq{X).
16 А .И. К о стр и к и н
242 Гл. 6. Корни многочленов
(2к - 1)тг
Х 2п + 1 = П X2 2 cos Х + 1 (1)
2п
к= 1
а + /3+ 6 = 1,
Д + 7 + 26=0,
<т + Д + 2 у + с) = О,
/3+7 =0,
к оторая, конечно ж е, совм естна и определённа, к а к это следует из тео р ем ы 3 из
§ 4 гл. 5. Реш ая её, приходим к заклю чению , ч то
1 _ 1 , 1 х
(X + 1)2( Х 2 + 1) “ 2 (Х + I ) 2 + 2 (Х + 1) ~~ 2 (Х 2 + 1 )'
________ /РО________ _ «1 «2 «п
(X —Cl)(x — С2) • • • (X — Си) Х -Cl Х -С 2 ■' Х -С и’
о тк у д а
п
f{X) _ / ( cfc)
S p ) ~ ^ 1 9, ( с к ) ( Х - с к)
16
244 Гл. 6. Корни многочленов
1____ _____ с к
Х 2п1+ 1 2П к^1Х ~ °к
— разлож ение на простейш ие дроби над С, поскольку д' ( X) = 2 п Х 2п~ 1, д'(ск ) =
= 2 n c ^ c j j 1 = —2 п с ^ 1. О бъединение слагаем ы х с комплексно сопряж ённы м и ко
эф ф ици ентам и д аст нам разлож ение на простейш ие дроби над К:
X
1 Ск 1 п
Х 2п + 1 X -с к п Е х +1
Для начала пусть с Е]ао, аД, так что / о, . .., f s не имеют корней
в ]ао,с[. По теореме Больцано—Коши о промежуточном значении
должно выполняться условие /Дао)Л (с) ^ 0 для 0 ^ i ^ s. В случае
/г(с) ф 0 для всех г имеем /Дао)/г(с) > 0, откуда Vao = Vc. В случае
же //Дао) = 0 для некоторого к обязательно к ф 0, s из-за свойств i),
ii) системы Штурма. По свойству ш) имеем f k- i (ao)/fc+i (ao) < 0. В
то же время /*._Дж) и Д+Дж) не имеют корней в ]ао,с[, так что по
теореме Больцано—Коши fk-i(ao)fk-i(c) > 0 и fk+i(ao)fk+i(c) > 0.
Значит, что fk~i(c)fk+i(c) < 0. Мы приходим к выводу, что при
вычислении Vao и Vc подпоследовательности f k- i (ao), 0, fk+i (ao) и
f k- i (с), Л (c), fk+i (с), независимо от значения /Дс), вносят одина
ковый вклад (по одной перемене знака). Это верно для всех к с
/(ao) = 0, поэтому Vao = Кс. Аналогичное рассуждение годится для
точки из другого крайнего интервала: с E]am_ i,a m[=> Vc = Kam.
Пусть теперь с Е]а^_1 ,аД, с' E]aj,aj+Д — точки из двух сосед
них интервалов, 1 < j < т —1 (рис. 26). Действуют те же соображе
ния. Именно, соединение уже проведённых рассуждений показывает,
что Vc = VCf, если только /(аД 0:
Vc = Va, = Vc,
О r\ -о- °
aj - l с aj c aj + 1
Рис. 26
В случае fo(aj) = Да?) == 0 впервые появляется различие. По
условию iv) имеем /о (с) Л (с) < 0 и /o(c/)/i(c/) > 0, т.е. у подпосле
довательности /о(с),/Дс) будет одно изменение знака, а у /о (с'),
/Дс') — ни одного. В то же время наши предыдущие рассуждения
показывают, что при к > 1 у подпоследовательностей Д -Д с), /Дс),
/fc+Дс) и fk-i(c'), /Д с'), /й+ДсД число перемен знаков одинаково.
Все это означает, что если /(аД = 0, то Vc —Vc>= 1 .
Фиксируем точки с Е ]а/,_1 ,аД, 1 ^ к ^ ш, и записываем тож
дество
m—1
Va - V b = (Va - T J + E ^ - ^ +i) + - И)-
к=1
(4 )
fk-i{x) = qk{x)fk{x) - fk+i(x), d eg /fe+i < deg/*;
fs-i(x) = qs(x)fs(x).
По определению f s(x) = НОД(/, /') — отличная от нуля константа,
поскольку мы предполагаем, что /(ж) не имеет кратных корней (если
мы этого заранее не знали, то, получив систему (4), перешли бы к
системе gk(x) = /Дж)//Дж), 0 ^ s).
Т е о р е м а 2. Только что построенная система
f o{ x ) =f ( x ) , fi(x)=f(x), /2 (ж), f s{x) (5)
является системой Штурма.
Действительно, свойство п) выполнено по предположению, а
свойство i) входит в определение f s(x) = const ф 0. Если //Дс) = 0, то
из (4) видно, что /jfe-i(c)/fc+i(c) ^ 0, причём fk-i(c) = 0 в точности
тогда, когда f k+i(c) = 0. Но если это так, то 0 = fk-i(c) = /Дс) =
= fk+i(c) = fk+2 (c) = • • • вопреки тому, что f 8(c) Ф 0. Стало быть,
/fc-i(c)/jfe+i(c) < 0, а это есть свойство ш). Наконец, предположим,
что /о(с) = 0 для некоторой точки с Е [а, Ь\. Тогда /о(ж) = (ж —с)д(ж),
q(c) ^ 0 и fo(x)f 1 (x) = (x-c)[q 2 (x) + (x-c)q(x)q'(x)\ = (х-с)д(х), где
д(х) = q2 (x) + (x —c)q(x)q'(x). Имеем д(с) = q2 (c) > 0, и, следователь-
но, д(ж) принимает положительные значения в малой окрестности
]с — S, с + 6 [ точки с. Множитель ж —с, однако, способствует тому,
что произведение /о(ж)Д(ж) меняет знак с минуса на плюс при воз
растании ж и прохождении его через с. Таким образом, система (5)
обладает свойством iv). □
З а м е ч а н и е 1 . Система
Ао/о(ж), Ai/i(ar), \ sfs(x), (5')
получающаяся из (5) умножением её членов на положительные
константы Ао, Ai,. .., As, также будет системой Штурма. Будем на
248 Гл. 6. Корни многочленов
ж3 Зж2 —2ж -1 У
х = —М + + - 2
х —М + + - - 1
ж3 Зж 2 2ж 1 V
ж = —М - + - + 3
х —М + + + + 0
f a(X) = f ( X + a) = Y ,
М Х ) = П Х + Ъ)= Y .
О^к^п
— разложения в ряд Тейлора (см. упр. 3).
Д о к а з а т е л ь с т в о . По определению число m( f a) положитель
ных корней многочлена f a равно числу корней заданного многочлена
/ , больших, чем а. То же замечание относится к f b. Следовательно,
число корней многочлена / , заключенных между а и b (а < 5), равно
разности m( f a) —m(/&), которая по теореме 3 выражается в виде
W( f a ) ~W( f b ) . □
5. Устойчивые многочлены. Нормализованный многочлен
f ( X) = Х п + а1 Х п- г + ... + ап- \ Х + ап
с вещественными коэффициентами называется устойчивым, если все
его корни лежат в левой полуплоскости (рис. 27):
/(А) = О, А = + i/З УQi < 0. °
Терминология ведёт своё происхождение из тео- 0 0 х
рии дифференциальных уравнений. Получаемые
там критерии асимптотически устойчивого Рис- 27
поведения физической (а в более широком смысле — механической,
технической или экономической) системы в окрестности положения
равновесия требуют, чтобы было
lim ext = 0, (9)
где А — произвольный корень многочлена / , ассоциированного с
дифференциальным уравнением порядка п с постоянными коэффи
циентами. Так как по формуле Эйлера (см. (15) из § 1 гл. 5) ext =
_ eatei(3t _ e«^(COs/ 3t + isin/ 3t), то доминирующим членом является
eat, и условие (9) эквивалентно неравенству а < 0.
Возникает своеобразная проблема локализации — проблема
Рауса—Гурвица2\ когда непосредственно по коэффициентам мно
2)Ф а к ти ч е ск и поставленная горазд о раньш е (1868 г.) английским ф изи
ком Д .К . М аксвеллом и реш ённая для небольш их степеней русским инж ене
ром И.А. В ы ш н еград ским , к о торы й заним ался задачей устой ч и вости р е гу л я т о р а
(1876 г.).
252 Гл. 6. Корни многочленов
Рис. 28
§ 4 • Многочлены с вещественными коэффициентами 255
a° ( f ) +ai(f) + • • • + a« - l^ + ап = 0-
После умножения обеих частей равенства на qn получаем
а0рп + aipn_1g + ... + an_ipg "_1 + anqn = 0,
яоРп = q{-aipn~l - ... - a„_\pqn~ 2 - anqn~l ).
Таким образом, q\aopn, а так как q и р взаимно просты, то q\a$.
Аналогично, из равенства
anqn = p ( - a ip "_1 - - - - - a„_ip^f"-2 - anqn~l )
вытекает, что р\ап.
С л е д с т в и е . Рациональные корни нормализованного многочле
на должны быть целыми числами.
Итак, решение вопроса о наличии рациональных корней много
члена сводится к следующим действиям: 1 ) перебору всех делителей
свободного члена и всех делителей старшего члена; 2) составлению
из них несократимых дробей; 3) проверке посредством подстановки
дроби в многочлен. На этом этапе можно воспользоваться методом
Горнера. Если все испытания приведут к отрицательному результа
ту, то это значит, что у многочлена нет рациональных корней.
Громоздкий перебор всех делителей полезно начинать с ±1. Вы
числение /(1) и / ( —1) не представляет затруднений. Если теперь це
лое число с является корнем многочлена /(X), то f ( X) = ( X- c) q( X) ,
где q(X) = boXn_1 + b\ X n ~ 2 + . . . + bn- 1 . Из схемы Горнера непосред
ственно следует, что b^EZ, О ^ г ^ п —1. Поэтому частные
/ ( 1) / ( - 1)
с —1 С+ 1
П р и м е р 9. / ( X ) = X 5 + 2 Х 4 — 15 Х 3 —2 Х + 6. Имеем /( 1 ) = - 8 , / ( - 1 ) = 24.
Делители d = ± 6 сразу отпадаю т, поскольку d - \ - 1 не делит 24. С другой стороны,
для d = 2 имеем / ( 1 ) / ( 2 —1) £ Z и / ( —1 )/(2 + 1) £ Z, но /( 2 ) ф 0. То же относится
и к d = —3. Целым корнем на самом деле является делитель d = 3.
У П РА Ж Н ЕН И Я
17 А.И. Кострикин
258 Гл. 6. Корни многочленов
У к а з а н и е . / ( X ) = X 3 + а Х 2 + ЪХ + с = ( X 2 + а Х + /3)(Х + 0 ) , где а =
= <т + 0, Ь = /3 + а в , с = /30, причем <т,/3, 0 Е К. У стой чивость / ( X ) эквивалентна
устой ч и вости пары м ногочленов X 2 + <тХ + /3, Х + 0, т.е. вы полнению неравенств
<т > 0, (3 > 0, 0 > 0. Л егко п роверяется, ч т о э т а систем а экви вал ен тн а системе
н еравенств а > 0, b > 0, с > 0, ab — с > 0. А налогичны е соображ ения при м ени ть
к вещ ественному многочлену степени 4.
10. И м еет ли многочлен / ( X ) , стоящ ий в числителе несократи м ой рацио
нальной дроби
/(X ) 3 1 2 X —3
з(Х) “ X + 2 + ( X - I)2 ~~ X - 1 + X 2 + 1 ’
вещ ественны е корни?
1 1 . П о к а за ть , ч т о все т р и корня неприводим ого над Q многочлена f ( z ) = z 3 —
—7z —7 — вещ ественны е и л еж ат в ин тервале ] —2 ,4[. В ы чи слить полож ительны й
корень м етодом Н ью тон а с то ч н о стью до т р е т ь е го десяти ч н ого зн ака.
12 . О пираясь на теорем у Руш е (тео р ем а 4), п о к а за ть , ч т о многочлен f ( z ) =
= z 5 + 5 z 2 — 3 им еет два корня в единичном к р у ге и т р и корня в кольце м еж ду
о к руж н остям и |^| = 1 и |^| = 2.
13 . Сколько вещ ественны х корней им еет многочлен z 4 + 12z2 + 5^ — 9?
14. Многочлены Лежандра Ро( Х) = 1, Р \ ( Х ) = X , . . . , Р П( Х ) , . . . определя
ю тся р е куррен тн ой формулой
тРгп(Х) - (2 т - l ) X P m _ i ( X ) + (ш - 1)Р т _ 2 (Х ) = 0.
П о к а за ть , что:
а) Р та(1) = 1, Р п ( - 1 ) = ( - 1 ) п ;
б) {P n , P n _ i , . . . , Р о } — систем а Ш ту р м а для Р П(Х ) на отрезк е [—1,1];
в) Р П(Х ) им еет п разл и чн ы х корней на ин тервале ] — 1 , 1[.
Приложение
Н ЕРЕШ ЁН Н Ы Е З А Д А Ч И
О М Н О ГО Ч Л Е Н А Х
min т 1 ^ и —1
ee@f в 1/'(о)| ^ ~4Г
Смейл доказал существование критической точки в, для которой
\т\ 4,
mo)i
т.е. дана требуемая оценка с худшей константой. Для многочленов
степени п ^ 4 проблема решена. Константа (п — 1)/п неулучшаема,
как показывает пример многочлена f(z) = z n — п z.
в) Обозначим символом Сп множество так называемых консерва
тивных многочленов f(z) = z n + a \zn~l + ... + an- iz , определяемых
свойством: f ( 0) = 0 => f ( 6 ) = в. Таким образом, консервативный
многочлен, рассматриваемый как отображение / : С —УС, оставляет
начало координат и все свои критические точки на месте.
Известно ( Tischler D .//Complexity.— 1989), что \Сп\ =
поэтому для консервативных многочленов степени п проблема Смей-
ла, сводящаяся к доказательству неравенства | / /(0)| ^ ^ ^ , реша
ется в принципе конечным перебором. Но для этого нужно распола
гать явным описанием многочленов из Сп, что известно пока лишь
при п ^ 6. Более слабое неравенство | / /(0)| > 1 справедливо для
любого / G Сп.
Нерешенные задачи о многочленах 263
Nf(z) — z — т
№
Число / Е С С S является неподвижной точкой для N f (т.е.
Nf(() = () в точности тогда, когда / — нуль многочлена /. В этом
случае, кстати, значением производной Nf будет А^-(С) = (^ —1)/гг —
число, встретившееся нам в и. 4, б).
Метод Ньютона вычисления корня (нуля) многочлена / может
рассматриваться как итерация отображения N f : IV/(£о) = Со, Cm =
= jV/(Cm-i) = TV™(Со)- В математической литературе наших дней
пару (IV/, 5) считают динамической системой и применяют к её изу
чению хорошо развитую технику.
Как уже отмечалось, |1V/(C)| < 1, и, значит, существует окрест
ность U точки С такая, что \im m^ oq NJ l(z) = С для любой точки
2 Е U. При этом С называется стоком (или притягивающей непо
движной точкой для IV/), а открытое множество В = Um>o N j m(U)
— бассейном стока /. Точка « Е С называется стоком периода к для
264 Нерешенные задачи о многочленах
Л _ v ( B f П D 2) _ v ( B f П D 2)
f ~ v (D2) 47Г
Нерешенные задачи о многочленах 265
***
К О С Т Р И К И Н А лексей И ванович
ВВЕДЕН И Е В А Л ГЕБРУ
Ч асть I
ОСНОВЫ АЛ ГЕБРЫ