Вы находитесь на странице: 1из 368

А.И.

Кострикин

ВВЕДЕНИЕ В АЛГЕБРУ
Ч а с т ь II

ЛИНЕЙНАЯ АЛГЕБРА

Рекомендовано Министерством общего и специального образования


Российской Федерации в качестве учебника
для студентов университетов , обучающихся по специальностям
“М атематика” и “Прикладная математика”

М ОСКВА
Ф И З И К О -М А Т Е М А Т И Ч Е С К А Я
Л И ТЕРА ТУ РА
2000
УДК 512 (075.8) Издание осуществлено при поддержке
ББК 22.143 Российского фонда фундаментальных
К71 исследований по проекту 99-01-14089

К о с т р и к и н А. И. В веден и е в ал гебр у. Ч асть II. Линейная


алгебра: Учебник для вузов. — М.: Ф изико-м атем атическая ли тература,
2000. — 368 с. — ISBN 5-9221-0018-1.
Наиболее важные разделы линейной алгебры изложены в максимально
доступной форме. Н а первый план вы двигаю тся просты е геом етрические
понятия, на базе которы х идёт всестороннее развитие алгебраического
аппарата, введённого в части I. У казаны приложения к разным вопросам
анализа, теории линейных групп, алгебр Ли, м атем атической экономики,
диф ференциальны х уравнений, геом етрии Лобачевского.
К аж ды й параграф заканчивается упраж нениями. О тветы и наброски
решений собраны в отдельном разделе. С ф ормулированы некоторы е не­
решённые задачи.
Ил. 31.

ТП-2000-1-74
ISBN 5-9221-0018-1 (Т. II) © Ф И З М А Т Л И Т , 2000
5-9221-0016-5 © А .И . К о с т р и к и н , 2000
ОГЛ АВЛЕН И Е
ПРЕДИСЛОВИ Е

ЕЛАВА 1
П РО СТРАН СТВА И Ф ОРМ Ы
§ 1. А бстрактны е векторны е п р о с т р а н с т в а .......................................... 11
1. М отивировка и аксиом атизация (11). 2. Линейные обо­
лочки. П одпространства (13). 3. Зам ечания о геом етрической
интерпретации (16). Упражнения (18).
§ 2. Разм ерность и базис .............................................................................. 18
1. Линейная зависим ость (18). 2. Разм ерность векторного
п ространства и его базис (20). 3. К оординаты . И зомор­
физм пространств (22). 4. Пересечение и сумма подпрост­
ранств (26). 5. П рямые суммы (28). 6. Ф акторп ростран ст-
ва (30). Упражнения (32).
§ 3. Двойственное пространство ................................................................ 33
1. Линейные функции (33). 2. Двойственное пространство и
двойственный базис (34). 3. Рефлексивность (36). 4. К р и те­
рий линейной независимости (37). 5. Ееометрическая и н терп­
ретация решений ЛОС (38). Упражнения (39).
4. Билинейные и квадратичны е формы .............................................. 40
1. Полилинейные отображ ения (40). 2. Билинейные
форм ы (41) 3. Закон изменения м атрицы билинейной
форм ы (42). 4. С имметричные и кососимметричные
форм ы (43). 5. К вадратичны е формы (45). 6. К анони­
ческий вид квадратичной форм ы (46). 7. Вещественные
квадратичны е формы (49). 8. Положительно определённые
форм ы и м атрицы (50). 9. Канонический вид кососиммет­
ричной формы (54). 10. П фаф фиан (57). Упражнения (58).

ЕЛАВА 2
ЛИНЕЙНЫ Е О П ЕРАТОРЫ

§ 1. Линейные отображ ения векторны х п р о с т р а н с т в ........................ 60


1. Я зы к линейных отображ ений (60). 2. Задание линей­
ных отображ ений м атрицам и (61). 3. Разм ерность яд р а и
образа (63). Упражнения (64).
§ 2. А лгебра линейных о п е р а т о р о в ............................................................ 64
1. Определения и примеры (64). 2. А лгебра операторов (66).
3. М атрицы линейного оператора в различны х базисах (69).
4 Оглавление

4. Определитель и след линейного оператора (71). Упражне­


ния (73).
§ 3. И нвариантны е подпространства и собственные векторы . . 74
1. П роекторы (74). 2. И нвариантны е подпространства (75).
3. Собственные векторы . Х арактеристический многочлен (77).
4. К ритерий диагонализируем ости (79). 5. Сущ ествование ин­
вариантны х подпространств (82). 6. Сопряжённый линейный
оператор (82). 7. Ф актороператор (84). Упражнения (85).
§ 4. Ж о р д ан о в а нормальная ф орм а ........................................................ 86
1. Теорема Гамильтона— Кэли (86). 2. Ж Н Ф : форм улировка
и следствие (89). 3. Корневые подпространства (90). 4. Слу­
чай нильпотентного оператора (92). 5. Е динственность (94).
6. Д ругие подходы к Ж Н Ф (96). 7. Д ругие нормальные
форм ы (99). Упражнения (100).

ГЛАВА 3
ВЕКТОРНЫ Е П РО СТРАН СТВА
СО С К А Л Я Р Н Ы М П Р О И З В Е Д Е Н И Е М

§ 1. Евклидовы векторны е п ространства .............................................. 103


1. Э вристические соображ ения и определения (103). 2. Основ­
ные м етрические понятия (105). 3. Процесс ортогонализа-
ции (107). 4. И зоморфизмы евклидовых векторны х п р о ст­
ранств (110). 5. О ртонорм ированные базисы и ортогональ­
ные м атрицы (112). 6. Симплектические п ростран ства (113).
Упражнения (116).
§ 2. Эрм итовы векторны е п р о с т р а н с т в а ................................................. 117
1. Эрм итовы формы (117). 2. М етрические соотнош е­
ния (119). 3. О ртогональность (120). 4. Унитарные м атр и ­
цы (122). 5. Нормированные векторны е п ростран ства (123).
Упражнения (125).
§ 3. Линейные операторы на пространствах со скалярным произве­
дением ........................................................................................................... 126
1. Связь между линейными операторами и ^-линейными ф ор­
мами (126). 2. Типы линейных операторов (128). 3. К анони­
ческий вид эрм итовы х операторов (131). 4. Приведение к вад­
ратичной формы к главным осям (133). 5. Приведение пары
к вад ратичны х форм к каноническому виду (135). 6. К анони­
ческий вид изом етрий (136). 7. Нормальные операторы (139).
8. Положительно определённые операторы (143). 9. Полярное
разложение (144). Упражнения (146).
§ 4. Комплексификация и о в е щ ес тв л ен и е................................................. 147
1. Комплексная стр у к т у р а (147). 2. Овеществление (149).
3. Комплексификация (151). 4. Комплексификация — овеще­
ствление — комплексификация (153). Упражнения (155).
Оглавление 5

§ 5. О ртогональны е многочлены ................................................................ 156


1. Проблема аппроксимации (156). 2. М етод наименьш их к вад­
ратов (157). 3. Линейные системы и м етод наименьших
к вад ратов (159). 4. Т ригонометрические многочлены (161).
5. Замечание о самосопряжённых операторах (162). 6. Мно­
гочлены Л еж андра (сферические многочлены) (164). 7. Ор-
тогонализация с весом (168). 8. Многочлены Чебыш ева (пер­
вого рода) (169). 9. Многочлены Э рм ита (170). Упражне­
ния (171).

ГЛАВА 4
АФ ФИННЫ Е И ЕВКЛИДОВЫ
ТОЧЕЧНЫ Е П РО СТРАН СТВА

§ 1. Аффинные п р о с т р а н с т в а ....................................................................... 173


1. Определение аффинного п ространства (173). 2. И зомор­
физм (175). 3. К оординаты (176). 4. Аффинные подпрост­
ранства (177). 5. Барицентрические координаты (180).
6. Аффинно-линейные функции и системы линейных урав­
нений (183). 7. Взаимное расположение плоскостей (185).
Упражнения (186).
§ 2. Евклидовы (точечные) п р о с т р а н с т в а .............................................. 187
1. Евклидова м етри ка (187). 2. Расстояние от точки до
плоскости (188). 3. Расстояние между плоскостями (190).
4. Определитель Грама и объём параллелепипеда (191).
Упражнения (192).
§ 3. Группы и геом етрии .............................................................................. 193
1. А ффинная группа (193). 2. Движения евклидова п ростран ­
ства (196). 3. Группа изом етрий (198). 4. Линейная геом ет­
рия, отвечаю щ ая группе (201). 5. Аффинные преобразования
евклидова п ространства (204). 6. Выпуклые м нож ества (206).
Упражнения (208).
§ 4. П ространства с индефинитной м е т р и к о й ...................................... 208
1. И ндефинитная м етри ка (208). 2. П севдоевклидовы движе­
ния (209). 3. Группа Лоренца (210). 4. Собственная группа
Лоренца (212). Упражнения (216).

ГЛАВА 5
КВАДРИКИ

1. К вадратичны е функции ....................................................................... 217


1. К вадратичны е функции на аффинном пространстве (217).
2. Ц ентральны е точки для квадратичной функции (218).
3. Приведение квадратичной функции к каноническому
виду (220). 4. К вадратичны е функции на евклидовом п р о ст­
ранстве (222). Упражнения (224).
6 Оглавление

§ 2. К вадрики в аффинном и евклидовом п р о с т р а н с т в а х ................. 224


1. Общее понятие квадрики (224). 2. Ц ентр квадри ки (227).
3. Канонические типы квадрик в аффинном п ро стр ан ст­
ве (228). 4. Общие замечания о типах квадрик (230). 5. К в ад ­
рики в евклидовом пространстве (232). Упражнения (235).
§ 3. П роективны е п ространства ................................................................ 236
1. Модели проективной плоскости (236). 2. П роективное
пространство произвольной разм ерности (239). 3. О днород­
ные координаты (240). 4. Аффинные к ар ты (241). 5. По­
нятие алгебраического м ногообразия (243). 6. П роективная
группа (244). 7. П роективная геом етрия (247). 8. Двойное
отношение (249). 9. Вы раж ения двойного отнош ения в коор­
динатах (251). Упражнения (253).
§ 4. К вадрики в проективном п р о с т р а н с т в е .......................................... 254
1. Классификация (254). 2. П римеры и изображ ения проек­
тивны х квадрик (255). 3. Пересечение прямой с проективной
квадрикой (257). 4. Общие замечания о проективны х квадри ­
ках (258). Упражнения (259).

ГЛАВА 6
ТЕН ЗО РЫ

§ 1. Н ачала тензорного и с ч и с л е н и я ............................................................ 260


1. П онятие о тензорах (260). 2. Произведение тензоров (261).
3. К оординаты тензора (263). 4. Тензоры в разны х систе­
мах координат (266). 5. Тензорное произведение п р о ст­
ранств (268). Упражнения (271).
2 . С вёртка, сим м етризация и альтернирование тензоров . . . . 272
1. С вёртка тензора (272). 2. С труктурн ы й тензор алгеб­
ры (274). 3. С имметричные тензоры (277). 4. К ососим мет­
ричные тензоры (281). 5. Тензорные п ростран ства (283).
Упражнения (284).
§3. Внешняя алгебра ...................................................................................... 285
1. Внешнее умножение (285). 2. Внешняя алгебра векторного
п р остранства (286). 3. Связь с определителями (290). 4. Век­
торны е подпространства и р-векторы (292). 5. Условия разло­
жим ости р-векторов (293). Упражнения (296).

ГЛАВА 7
ПРИЛОЖ ЕНИЯ

1. Н орма и функции линейного о п е р а т о р а .......................................... 298


1. Н орма линейного оператора (298). 2. Ф ункции линейных
операторов (матриц) (301). 3. Экспонента (302). 4. О днопа­
рам етрические подгруппы линейной группы (305). 5. С п ект­
ральный радиус (309). Упражнения (311).
Оглавление 7

§ 2. Линейные дифференциальны е у р а в н е н и я ...................................... 312


1. П роизводная экспоненты (312). 2. Д ифференциальные
уравнения (313). 3. Линейное дифференциальное уравнение
порядка п (314).
§ 3. Выпуклые м ногогранники и линейное програм мирование . . 315
1. Ф орм улировка задачи (315). 2. М отивировка (315). 3. Основ­
ные геом етрические понятия (318). Упражнения (320).
§ 4. Н еотрицательны е м атрицы ................................................................ 321
1. П роизводственная м отивировка (321). 2. Свойства неотри­
цательны х м атриц (322). 3. С тохастические м атрицы (323).
§ 5. Геометрия Лобачевского ....................................................................... 327
1. П ространство Лобачевского (327). 2. Движения п ро стр ан ст­
ва Лобачевского (329). 3. М етрика Лобачевского (331).
4. П лоскость Лобачевского (334).
§ 6. Нерешённые з а д а ч и .................................................................................. 339
1. Проблема Ш трассена (339). 2. О ртогональны е разложе­
ния (340). 3. Конечные проективны е плоскости (341). 4. Б а ­
зисы пространств и латинские к вад р аты (342).

О Т В Е Т Ы И У К А З А Н И Я К У П Р А Ж Н Е Н И Я М ........................................ 344
М Е Т О Д И Ч Е С К И Е З А М Е Ч А Н И Я .................................................................. 359
П РЕДМ ЕТН Ы Й У К А ЗА ТЕЛ Ь ............................................................................... 362
Линейная алгебра является одновременно
одной из древнейших и одной из самых
новых ветвей м атем атики.
Н. Бур баки

ПРЕДИСЛОВИЕ

Цель этой книги, являющейся частью II единого курса “Введе­


ние в алгебру”, заключается в систематическом изложении основ
линейной алгебры — важного раздела математики, лишь отчасти
затронутого нами в первой части курса. Одинаково интересны ал­
гебраический и геометрический аспекты теории, поэтому класси­
ческие “сёстры-близнецы”, каковыми являются линейная алгебра и
геометрия, будут выступать на равных правах. Из курса аналитиче­
ской геометрии на плоскости и в трёхмерном пространстве известно
много примеров геометрической интерпретации алгебраических со­
отношений для двух и трёх переменных. Существенно, однако, то,
что терминология и идеи линейной алгебры, опирающиеся на гео­
метрическую интуицию, относятся к пространству произвольного
числа п измерений.
Словосочетания “линейная алгебра и анализ” и “линейная ал­
гебра и дифференциальные уравнения”, равно как и многие другие,
употребляемые в университетских курсах, служат отражением того
факта, что идея линейности — одна из самых распространенных в
математике и, более общо, одна из самых фундаментальных в цикле
естественных наук. Традиционное деление задач на линейные и нели­
нейные не прихоть математиков, а вполне осознанная необходимость
подчиняться сравнительной слабости нашей интуиции там, где кон­
чаются владения линейной алгебры, понимаемой в широком смысле
этого слова.
Аппарат линейной алгебры, вполне сложившийся к началу на­
шего века, продолжал совершенствоваться и развиваться в разных
направлениях. При этом его бесконечномерная часть, опирающаяся
на понятие предельного перехода, отошла по существу к функцио­
нальному анализу, а вычислительные аспекты, особенно актуальные
в связи с возможностью применения ЭВМ, стали предметом изу­
чения самостоятельной науки. Предлагаемая книга не может слу­
жить исчерпывающим руководством по линейной алгебре не только
потому, что она не охватывает указанные два направления, но пре­
жде всего ввиду недостаточного освещения приложений (хотя
последняя глава как раз названа приложением). В этом отношении
учебное пособие [2] в списке дополнительной литературы содержит
Предисловие 9

гораздо больше фантазии, поводов к раздумью и, сверх того, кван­


тово-механических интерпретаций понятий линейной алгебры. Оно
рекомендуется всем, кто хотел бы заглянуть за рамки стандартного
курса. А в данный учебник вошли лишь небольшие фрагменты из [2].
Наши намерения и надежды сводятся к тому, что читатель (прежде
всего студент первого курса), досконально проработавший основной
материал учебника (в течение одного семестра по четыре часа лек­
ций и по четыре часа упражнений в неделю) и затем использовавший
дополнительные разделы обеих книг для домашнего чтения, сумеет
выработать современное математическое мышление в области ли­
нейной алгебры.
Само собой разумеется, что для полного понимания текста учеб­
ника требуется лишь хорошее владение материалом части I (при
ссылках — [ВА I]), т.е. материалом первого семестра. Терминоло­
гия и обозначения обеих частей полностью согласованы, а все ново­
введения специально оговорены. Кстати, упражнение г из § q гл. р
иногда в тексте обозначается кратко упр. p.q.r. В этом месте сле­
дует заметить, что в отличие от [BA I, BA III] ответы и указания
к упражнениям выделены в специальный раздел, обращаться к кото­
рому нужно в крайнем случае.
Автор отдаёт себе отчёт в том, что “приземлять” учебное посо­
бие [2] и тем самым “наступать на горло собственной песне” — в
высшей степени неблагодарная задача. Единственным оправданием
может служить интерпретация данной части II как отклика на за­
просы студентов — отклика, давно подготовленного, но реализован­
ного с большой задержкой лишь по внешним причинам.

ДОПОЛНИТЕЛЬНАЯ ЛИ ТЕРА ТУ РА

1. Кострикин А.И. Введение в алгебру. Ч. I. Основы алгебры. — 2-е изд.


— М.: Наука, 1994. — 318 с.
2. Кострикин А.И., Манин Ю.И. Линейная алгебра и геом етрия. — М.:
Наука, 1986. — 304 с.
3. Сборник задач по ал геб ре/ Под ред. А .И .К острикина. — М.: Ф а к т о ­
риал, 1995. — 456 с.
4. Гельфанд И.М. Лекции по линейной алгебре. — 5-е изд. — М.: Н аука,
1998. — 272 с.
5. Мальцев А.И. Основы линейной алгебры. — М.: Наука, 1956. — 340 с.
6. Халмош П.Р. Конечномерные векторны е пространства. — М.: Мир,
1970. — 264 с.
7. Артин Э. Геометрическая алгебра. — М.: Мир, 1970. — 284 с.
8. Шилов Г.Е. Введение в теорию линейных пространств. — М.: Н аука,
1956. — 304 с.
10 Предисловие

9. Фаддеев Д .К ., Фаддеева В.Н. Вычислительные м етоды линейной ал­


гебры. — М.: Наука, 1963.
10. Стренг Г. Линейная алгебра и её применения. — М.: Мир, 1980. —
454 с.
11. Прасолов В.В. Задачи и теорем ы линейной алгебры. — М.: Наука, 1991.
12. Веллман Р. Введение в теорию матриц. — М.: Наука, 1976. — 368 с.
13. Гантмахер Ф.Р. Теория матриц. — М.: Наука, 1967.
14. Ланкастер П. Теория матриц. — М.: Наука, 1978.
15. Huppert В. A ngew andte Lineare Algebra. — B erlin-N ew York: W alter de
G ruyter, 1990. — 646 p.
ГЛАВА 1
ПРОСТРАНСТВА И ФОРМЫ

Вряд ли стоит объяснять, чем дикий лес отличается от ухожен­


ного парка или от упорядоченного леса, посаженного человеком. При
всём различии, однако, в них столько общего, что инопланетянину,
не познавшему вкуса грибов и не оценившему прелести подстрижен­
ных газонов, леса будут казаться сплошными зелёными массивами,
населёнными различной высоты и формы предметами, которые мы
именуем деревьями. Нечто подобное произойдёт, если сравнить со­
держание настоящей главы и главы 2 из [ВА I], посвящённой ко­
ординатным векторным пространствам. Абстрактное линейное про­
странство, элементы которого именуются векторами и которое по
этой причине мы будем чаще называть векторным пространством,
вводится аксиоматически. Соответствующая система аксиом, по
существу разработанная еще Дж. Пеано (1888 г.), хорошо приспо­
соблена к теории линейных отображений (в частности, линейных
операторов), занимающей центральное место в линейной алгебре.
Понятие матрицы при этом как бы отходит на второй план. Пер­
востепенное значение приобретают инвариантные, не зависящие от
выбора базиса свойства изучаемых объектов.
Однако прежде чем углубляться в абстрактный лес, рекоменду­
ется ещё раз пройтись по ухоженному парку — конкретному про­
странству векторов строк длины п. Мы сознательно пошли на
частичное повторение известного материала, чтобы сгладить
абстрактные шероховатости.

§ 1. А б с т р а к т н ы е в ек тор н ы е п р о с т р а н с т в а

1. М отивировка и аксиоматизация. В [ВА I, гл. 2] мы изу­


чали n-мерное векторное пространство Еп = {(яд,... ,жп) | ад Е Е}
строк длины п вместе с линейными отображениями Еп —>Ет , нахо­
дящимися во взаимно однозначном соответствии с т х п-матрицами.
При т — п биективное линейное отображение срл : Еп —> Еп ха­
рактеризуется свойством определителя det А ф 0, которое позволяет
применить правило Крамера для решения системы линейных урав­
нений, ассоциированной с срл и фиксированным вектором из Еп. В
случае det А = 0 решения однородной линейной системы образуют
подпространство в Еп, но, как отмечалось в свое время, это подпро­
странство (а точнее, линейная оболочка) — объект иной природы:
если Еп допускает базис (1, 0, .. ., 0),..., (0,..., 0,1), то линейная обо­
лочка U С Еп базисом такого вида, как правило, не обладает. Это
неудобство проистекает из слишком конкретной природы Еп.
12 Г л. 1. Пространства и формы

В самом деле, свойства ВЩ-ВЩ, которыми мы фактически поль­


зовались и которые будут воспроизведены ниже, присущи не только
пространству Еп. Рассмотрим, например, дифференциальное урав­
нение d2x /d t 2 0 х = 0, изучаемое в школе. Известно, что его общее
решение записывается в виде x(t) = a sin t 0 /3cos£. Если «о, А) та­
ковы, что «о sin £ 0 A) cost = 0 при всех £, то, полагая поочередно
£i = 7г/2, £2 = 0 , получим «о = 0 = А)- Это обстоятельство даёт осно­
вание говорить о линейной независимости частных решений sin £,
cos £ и о двумерном линейном пространстве общих решений урав­
нения d2x /d t 2 0 х = 0 в духе следующего определения.
О п р е д е л е н и е 1. Пусть Я — произвольное поле. Векторным
(или линейным) пространством над Я называется множество V эле­
ментов (именуемых векторами), удовлетворяющее следующим ак­
сиомам.
а) На V задана бинарная операция V х V —>V, обычно записывае­
мая аддитивно: (х, у) 1-0 х 0 у, и наделяющая V строением абелевой
группы (аддитивная группа пространства V). Стало быть:
ВП1 : х 0 у = у 0 х (коммутативность);
ВП2 : (х 0 у) 0 z = х 0 (у 0 z) (ассоциативность);
ВПз : в V существует выделенный элемент 0 , называемый нуле­
вым вектором, такой, что х 0 0 = х для любого х Е V;
ВП4 : для каждого х е V существует обратный (или противопо­
ложный) вектор —х такой, что х + (—х) = 0 .
б) На множестве Я х V задана операция (Л, х) н->> Лх, называемая
умножением векторов из V на скаляры из Я и обладающая свой­
ствами:
ВП5 : 1 • х = х (унитарность);
ВП6 : (а(3)х = а(/Зх) для всех a,f3 Е Я, х Е V (ассоциативность).
Сложение и умножение связаны двумя законами дистрибутив­
ности:
ВП7 : (а + /3)х = ах + /Зх;
ВП8 : А(х + у) = Ах + Ау.
Обратим внимание на то обстоятельство, что в левой части ра­
венства ВП7 знак + относится к элементам поля Я (скалярам), а в
правой — к векторам. Строго говоря, следовало бы обозначить раз­
личными символами операции сложения в аддитивной группе С и в
поле Я (скажем, 0 и +), равно как и операции умножения в Я х V
и в Я (скажем, 0 и • ). Этого обычно избегают, поскольку всегда
бывает ясно, о чём идет речь. Всё же, чтобы сделать это замечание
содержательным и предостеречь от возможных ошибок, рассмотрим
множество V = М+ положительных вещественных чисел. Полагая
х 0 у = ху (обычное умножение в Е) и А0 х = х х (возведение х Е Е+
в степень А Е Е), мы без труда убеждаемся в справедливости аксиом
ВП1-ВП8, так что V — векторное пространство над Е. Нулевым
§ 1. Абстрактные векторные пространства 13

вектором служит 1 Е М + . Ясно, что в данном случае обычная запись


х + у = ху, Хх = х х могла бы вызвать недоумение.
Вот ещё один пример, когда предпочтительнее другие обозна­
чения. Пусть V — векторное пространство над полем комплексных
чисел С. Определим новое векторное пространство V с той же ад­
дитивной группой_Н, но с^цругим законом умножения на скаляры:
(Л, х) и-» Л 0 х = Лх, где Л — комплексно сопряженное число к Л.
Так как Л i—^ Л — автоморфизм поля С, то легко проверяется, что
V — векторное пространство. Одновременное рассмотрение V и V
без значка 0 (или какого-то другого символа) было бы затрудни­
тельно.
С о г л а ш е н и е . Читатель, вероятно, заметил, что векторы про­
странства V у нас обозначаются то полужирными, то светлыми
строчными латинскими буквами, а иногда и буквами греческого
алфавита. Тем не менее в абстрактных векторных пространствах
предпочтение будет отдаваться полужирному шрифту; в конкретных
примерах следовать этому правилу было бы непрактично, а изобра­
жать вектор буквой со стрелкой наверху — слишком громоздко. При
небольшом навыке принятый нами компромисс не должен приводить
к недоразумениям.
Непосредственно из определения векторного пространства V вы­
текают следствия, которыми мы будем пользоваться в дальнейшем
без всяких ссылок:
а) Ох = АО = 0 для всех А Е Я, х Е V. Действительно, ввиду ВП7
Ох = (0 + 0)х = Ох + Ох, откуда Ох = 0. Аналогично, АО = А(0 + 0) =
= АО + АО, т.е. АО = 0;
б) Ах = 0 = > А = 0 или х = 0 . Если, например, А ф 0, то
х = 1 • х = (А- 1А)х = А- 1(Ах) = А-1 0 = 0;
в) (п • 1 )х = х + х + ... + х (п слагаемых) для любого целого
положительного п и любого х Е V (доказательство — индукция по
п). Естественно писать просто п х вместо (п • 1 )х , где 1 — единица
поля Я. Если Я — поле конечной характеристики р, то рх = 0;
г) (—1)х = —х. В самом деле, х + (—1)х = 1х + (—1)х = (1+
+ (-1))х = Ох = 0.
2. Линейные оболочки. П одпространства. Заметим, что,
располагая любым конечным набором скаляров Ai, . . . , An Е Я и век­
торов x i , ..., xn Е V, мы можем составить выражение
п
Aixi + ... + А„х„ = ^ 2 AiXi,
2=1

называемое линейной комбинацией векторов х* с коэффициентами


Ai. Более общо: если / — какое-то семейство индексов, возможно,
бесконечное, и М — {х^ Е V \ i Е 1} — подмножество векторов
в У, то правомерно рассматривать линейные комбинации ^2ieI А*х^
14 Г л. 1. Пространства и формы

с произвольными коэффициентами Af Е Я, среди которых, однако,


лишь конечное число отличны от нуля. Очевидно,
а( £ Л*х0 = £(АА*)х*
— линейная комбинация с коэффициентами AAf, г Е /, для всякого
скаляра А е Я. Аналогично, сумма

двух линейных комбинаций с коэффициентами Af, /if будет линейной


комбинацией тех же векторов Xj G М с коэффициентами Af + /if,
среди которых снова лишь конечное число отличны от нуля. Таким
образом, множество (М)& всевозможных линейных комбинаций век­
торов Xf Е М замкнуто относительно операций сложения векторов
и умножения их на скаляры:
А е Я, X, у Е (М) = > х + у Е ( М ) , Л х Е (М).
Принято говорить, что (М) — линейная оболочка множества М С У.
О п р е д е л е н и е 2. Пусть У — векторное пространство над по­
лем Я, U С У — его подмножество, являющееся аддитивной подгруп­
пой в У и переходящее в себя при умножении на скаляры. Тогда огра­
ничение на U операций, определённых в У, наделяет U строением
векторного пространства. Оно называется векторным (или
линейным) подпространством в У.
Пересечение любого числа векторных подпространств также
является векторным подпространством (см. начало п. 4 из §2; это
лёгкое упражнение, которое для случая групп рассмотрено в [ВА I]).
Мы видим, что линейная оболочка (М) системы векторов М С У
является векторным подпространством в У, причём, очевидно,
(М) — наименьшее подпространство в У, содержащее М . Говорят
ещё, что (М) — подпространство, натянутое на векторы х Е М
или порождённое векторами х Е М . Если с самого начала М было
подпространством, то (М) = М .
Приведём несколько примеров векторных пространств, которые
будут встречаться в дальнейшем.
П р и м е р 1 ( нульмерное пространство). Н ад лю бым полем Я сущ ествует
нульмерное (одноэлементное) в екторное п р о стр ан ств о V = {0 } с законом ум но­
ж ения на скаляры Л0 = 0.
П р и м е р 2 (основное поле Я как одномерное координатное пространство).
По определению V = Я, основны е операции в V совп ад аю т с операциям и в Я.
Если 1 — единица поля Я , то можно с ч и т а т ь , ч т о Я = (1) — линейная оболочка,
н а тя н у та я на 1.
Более общо: если поле Я — расш ирение своего подполя ф , то Я можно рассм а­
т р и в а т ь к а к в екторное п р о стр ан ств о над ф . Н априм ер, поле комплексны х чисел
С — векторное п р о стр ан ств о над полем вещ ественны х чисел К, а К — векторное
п р о стр ан ств о над полем рациональн ы х чисел Q.
§ 1. Абстрактные векторные пространства 15

п р и м е р 3 (п -мерное координатное пространство Ап \ см. [BA I, гл. 2], где


поле К можно зам ен и ть на произвольное поле А). П ри п — 1 получается п реды ­
дущ ий пример. М ы увидим вскоре (см. § 3), ч т о всякое п о д п ростран ство U С Ап
явл яется п ростр ан ств о м реш ений некоторой линейной однородной системы .
П р и м е р 4 (пространство функции). В [BA I, гл. 1, § 4, п. 1] было вве­
дено кольцо ф ункций К х , к оторое на самом деле явл яется ещё в ек торн ы м про­
с тран ств ом над К (кольцо К нуж но зам ен и ть на поле). И т ак , X — произвольное
м нож ество, А — поле, Ах — м нож ество отображ ен и й (ф ункций) / : X А,
наделённое п оточечн ы м и операциям и сложения и умнож ения на скаляры :

( / + 9){х) = /(ж ) + g(x) для всех ж G А;


(A /)(ж ) = А (/(ж )) для всех А £ F, х £ X .

К аж д о м у элем енту х £ X можно п о с та в и т ь в соо тв етств и е т а к назы ваем ую


дельта-ф ун кцию 6Х, сосредоточенную на {ж}:

дх (ж) — 1} 6х(х ) — 0, жА х .

Если А = {1, 2 , . . . , п}, то вм есто S{(j) обы чно пиш ут 5{j — с та н д а р тн о е обозна­
чение для символа К ронекера. В этом случае Ах ото ж д еств л яется с А п . Именно,
ф ункц ии / ста в и тс я в со о тв етств и е в е к т о р -ст р о к а всех её значений (/( 1 ) , / ( 2 ) , . . .
. . . , / ( п ) ) , а сам а ф ункц ия однозначно п ред став л яется в виде линейной ком бина­
ции дельта-ф ун кций

/ = /( 1) Ai + /( 2) Я2 + ... + / Н
В случае бесконечного м нож ества X аналогичное заклю чение лиш ено смы сла,
поскольку суммы бесконечного числа век торов не определены (если специально
не п озаб о ти ться о топологии).
В анализе чащ е всего р ассм атр и в аю тся вещ ественнозначны е ф ункции, опре­
делённые на всей прям ой или на ин тервале (a, b) С К. Л егко п роверяется, ч т о ли­
нейное п р о стр ан ств о содерж и т в к ач естве п од п р о стр ан ств п р о стр ан ств о
^соп? всех н епреры вн ы х ф ункций, п р о стр ан ств о всех непреры вно ди ф ф е­
ренцируем ы х ф ункций и т .д ., поскольку все отм еченны е свой ства сохраняю тся
при сложении ф ункций и умнож ении их на скаляры .
П р и м е р 5. М ногочлены / £ A[t] степени <С п — 1 с обы чны м и операциям и
сложения многочленов и умнож ения их на скаляры образую т векторное п р о с тр а н ­
ство Рп . С ледует о т м е т и т ь , ч т о м ногочлены степени, равной ф иксированном у
числу /с, линейного п р о с тр а н с тв а не составл яю т. О днако ф орм ы степени к от
т перем енны х, р ассм атри ваем ы е вм есте с нулём, о бразую т векторное п р о с тр а н ­
ство.
П р и м е р 6. П усть g(t) — ф иксированная непреры вн ая на отрезк е [0,1] ве­
щ ественная ф ункц ия, отли чная от нуля на некотором ин тервале J С [0,1], а
Vn{g) — м нож ество ф ункций ви да f ( t ) g ( t ), где f( t ) — многочлен степени <С п — 1.
Т огд а Рп — в екторное п ро стр ан ств о , содерж ащ ееся в M^ont.
П р и м е р 7 (пространство матриц). По правилам м атр и ч н о го исчисления
(см. [ВА I, гл. 2]) любую прям оугольную м атр и ц у р азм ер а т х п можно ум но­
ж и т ь на элемент поля А и любые две слож ить, в р е зу л ь т ат е получится м атр и ц а
т о го ж е вида. Все аксиом ы здесь вы полняю тся, т а к ч т о т х n -м атр и ц ы обра­
зую т в екторное п ростр ан ств о . П ри т = п кольцо к в ад р ат н ы х м атр и ц М п (А),
являю щ ееся одновременно век торн ы м п ростр ан ств о м над А , н азы в ается алгеб­
рой , в с о о тв етств и и с общ им определением, к оторое мы дадим в § 2 гл. 2 и под
действие к о то р о го п оп адаю т т а к ж е о б ъ ек т ы из примеров 2 и 4.
16 Г л. 1. Пространства и формы

П р и м е р 8 [Amer. M ath. M onthly. — 1990. — V. 94. — Р. 60-62]. М атр и ц а


A G M n (Q) н азы в ается полу магической (или полу магическим квадратом ), если
суммы коэф ф ициентов в к аж дой строке и в каж дом столбце м атр и ц ы совп адаю т:
п п

^ 2 aik = akJ = е 1^ ^ П'


k= 1 к= 1
Если к то м у же t r А = а (А) := ° 4 ,n + i - o т0 м ат р и ц а А н азы в ается маги­
ческой (или магическим квадратом).
М аги ческие к в а д р а т ы издревле привлекали к себе внимание. Нам они и н те­
ресны по той достато ч н о очевидной причине, ч т о м нож ество SM agn (Q) полума-
ги чески х к в ад р ат о в , равно к а к и м нож ество M agn (Q) всех м аги ч еск и х к в ад р ат о в
п оряд ка п, су ть векторн ы е п р о с тр а н с тв а над Q, причём

M agn (Q) С SM agn (Q) С M „(Q ).

С т о и т оговори ться, ч т о чи сто ком бин аторное м нож ество м аги ч еск и х п х п -квад-
р а то в с н а турал ьн ы м и коэф ф ициентам и 1, 2 , . . . , п 2 мы не р ассм атри ваем . См. по
этом у поводу: Постников М.М. М аги ческие к в а д р а т ы . — М.: Н аука, 1964.
3. Зам ечания о геом етрической интерпретации. Принято
называть векторное пространство V вещественным (соответственно
комплексным), если Я = Е (соответственно Я = С); скаляры тогда
будут просто числами. Именно эти случаи наиболее интересны с при­
кладной точки зрения, хотя значительная часть теории не зависит
от природы поля Я.
Самой естественной моделью векторного пространства служит,
несомненно, совокупность направленных отрезков, выходящих из
фиксированной точки трёхмерного пространства, в котором мы жи­
вем. Умножению отрезка на число А Е Е отвечает его растяжение
в А > 1 раз (или сжатие в А раз, А ^ 1) и изменение направле­
ния отрезка при А отрицательном. Сложение направленных отрез­
ков осуществляется по правилу параллелограмма. Это вещественное
векторное пространство совпадает также с множеством свободных
геометрических векторов, если условиться считать равными два на­
правленных отрезка, которые можно совместить параллельным пе­
реносом.
Объекты физического трёхмерного пространства Еф принято
изображать посредством чертежей. В случае многомерных прост­
ранств (о размерности мы поговорим в § 2) наша интуиция подверга­
ется серьёзному испытанию, тем не менее систематическое апеллиро­
вание к геометрическим образам не только полезно, но и необходимо:
вырабатываются устойчивые ассоциации, оживляющие теорию.
Непривычность геометрии векторного пространства может быть
связана также с особенностями поля Я. Если, например, Я = С, то
прямая над С — это одномерное координатное пространство С1 . Её
наглядным геометрическим изображением служит плоскость комп­
лексных чисел Е2 , которую не нужно путать с С2 . Числу z = х + iy Е
Е С1 отвечает точка (ж, у) Е Е; умножение на а ф 0 соответствует
§ 1. Абстрактные векторные пространства 17

растяжению в \а\ раз и повороту на угол arga против часовой


стрелки. В частности, при а — —1 ограничение на Е1 поворота
С1 на 180° даёт “переворачивание” прямой Е1. В гл. 3, § 4 будут
изложены операции комплексификации и овеществления, позволяю­
щие использовать преимущества алгебраической замкнутости поля
С (для работы с вещественными векторными пространствами), а
n-мерное комплексное пространство Сп представить как 2п-мерное
вещественное пространство Е2п.
Отметим ещё, что физическое пространство Еф гораздо богаче,
чем координатное пространство той же размерности, поскольку в Е |
определены длины векторов и углы между ними, площади и объёмы
фигур. Вся эта дополнительная информация невольно переносится
на чертежи, призванные отразить свойства абстрактных векторных
пространств, аксиоматика которых пока бедна. Её обогащение
метрическими понятиями в полной мере реализуется лишь в после­
дующих главах.
В какой степени векторное пространство V несёт отпечаток
свойств поля скаляров, видно также из того, что если Я — конечное
поле, то геометрические образы, привнесённые из Е3, являются “ды­
рявыми” (следствие дискретности Я). Но этот недостаток Я можно
иногда обыграть (рис. 1), ассоциируя с линейной геометрией над Я
дискретные картинки иного рода. Например, n-мерное координатное
пространство Щ над полем из двух элементов F2 = {0 , 1} = Ъ2 допус­
кает естественное отождествление с множеством вершин {(£i ,£2?• • •
. .., гп); Si = 0 или Si = 1} n-мерного куба в Еп.
(0, 1, 1) .( 1,М )
(0 , 1 ) ( 1 , 1)
•---------1> W5-*-/< 1 '
^Дод.о) (1, 1 , 0)
•-------- • » (
0 1 (0 , 0 ) (1, 0) (0, 0 , 0) ( 1, 0 , 0 )
п —1 П—2 п —3
П1 = {0} Па = {(0, 0), (1, 1)} П 3 = { (0 ,0 ,0 ), (1 ,1 ,0 ),
(1 , 0 , 1), (0 , 1 , 1)}
Рис. 1

Подпростанство Пп, состоящее из точек (ед,£2?• • • ?£п) с Si +


-hs2 + ... + £п = 0 (напомним, что 1 + 0 = 0 + 1 = 1;0 + 0 = 0 = 1 + 1),
задаёт простейший код, исправляющий одну ошибку (см. [BA I, гл. 4,
§ 4, п. 7]). Именно, условившись, что закодированным сигналам со­
ответствуют только точки (ei, £2 , . . . , £п) Е Пп, и приняв сигнал
(г^, £2, . . . , £гп) с е[ + £г2 + ... + £'п = 1, мы с полным основанием мо­
жем считать, что при передаче сообщения произошло его искажение
внешними помехами. Наш код с проверкой на чётность не обнару­
жит, конечно, двух искажений, поскольку тогда (е^,^? • • • ien) £ Пп.2
2 А .И. К о стр и к и н
18 Гл. 1. Пространства и формы

УП РА Ж Н ЕН И Я

1. О б разую т ли следующие м нож ества векторн ы е п р о с тр а н с тв а над полем К:


а) м атр и ц ы из М П(К) ф иксированного р а н га г;
б) сим м етричны е м атр и ц ы ( М = А) из М П(М);
в) кососим м етри чны е м атр и ц ы ( tА = —А) из М П(М);
г) м атр и ц ы из М п (Ж) с нулевым определителем;
д) м атр и ц ы из М п (Ж) с нулевым следом tr А = 0 (след м атр и ц ы А = ( а ^ )
определяется соотнош ением t r А = а ц + а 22 + . . . + а п п );
е) м атр и ц ы из М п (М) с полож ительны м следом;
ж) м ногочлены ви да f( t ) = {а\ + .. .-\-ап ) —a \ t —. . . —an t n при ф иксированном
п (сц G М)?
2 . Сколько элементов сущ ествует в к оордин атном п р о стр ан ств е FJJ векторов-
с тр о к ( а д , . . . , жп ) длины п над конечны м полем Fp из р элементов? Сколько ре­
ш ений в FJJ им еет уравнение ад ад + 0 ,2 X2 + . . . + о п х п = 0 (не все щ G равн ы
нулю)?

§ 2. Р а зм е р н о с т ь и бази с

1. Линейная зависим ость. Действуя по аналогии с [ВА I, гл. 2],


введём следующее
О п р е д е л е н и е 1. Векторы v i , . . . , vn пространства V называ­
ются линейно зависимыми, если некоторая их нетривиальная ли­
нейная комбинация равна нулю; другими словами, найдутся такие
скаляры ад, ..., а п, не все равные нулю, что
ад vi + a 2v 2 + ... + a nv n = 0 .
В противном случае система векторов v i , . . . , vn называется линейно
независимой.
Когда среди векторов v i , . . . , v n имеется нулевой, эти векторы
не могут быть линейно независимыми: если, например, vi = 0 , то,
положив ад = 1, а 2 = ... = а п = 0 , мы получим нетривиальную
линейную комбинацию, равную нулю.
Т е о р е м а 1. Векторы v i , . . . , v n, п ^ 2, линейно зависимы
тогда и только тогда, когда один из них является линейной комби­
нацией остальных. Система векторов v i , . .., vn линейно зависима,
коль скоро некоторая её подсистема линейно зависима. Другими
словами, если система векторов линейно независима, то и всякая
её подсистема также линейно независима.
Мы сознательно опустили доказательство, поскольку оно доста­
точно очевидно и является повторением доказательства соответст­
вующей теоремы из [ВА I, гл. 2, § 1]. Фактически там же доказана
Т е о р е м а 2. Если в пространстве V каждый из векторов ли­
нейно независимой системы e i , . . . , e s является линейной комбина­
цией векторов системы fp,... ,f^, то s ^ t .
§ 2. Размерность и базис 19

Д о к а з а т е л ь с т в о . Вспомним, как мы рассуждали ранее (чуть


в иных обозначениях). По условию имеем
e i = a u f i + « 2 1 f 2 + •••+ O'ti^t,

es — a l8fi + « 2Д 2 + ... + cutset)


где OLij — какие-то скаляры. Предположим, что s > t. Составим ли­
нейную комбинацию векторов e i , . . . , es с коэффициентами xj :

xiei + ... + x ses =


= (« 11Ж1 + « 12^2 + • • •+ a i sXs)fi + . . . + {pLtlX1 + «£2^2 + • • •+ OLtsXs)^t4
и рассмотрим систему из t линейных уравнений с s неизвестными
«11^1 Н“ «12^2 + • • • + OL\sXs = О,

ОСцХ1 + «^2^2 + • • • + OltsXs — 0 .


Так как по предположению s > £, то наша однородная система
обладает ненулевым решением (/3i,... ,/3s) (см. в этой связи [BA I,
гл. 1, § 3, следствие 2], а также [ВА I, гл. 4, § 3], где сделано важ­
ное для нас замечание о линейных системах с коэффициентами из
произвольного поля скаляров). Это значит, что /3iei + ... + /38е8 =
= 0 — нетривиальная линейная зависимость, наличие которой,
однако, противоречит условию теоремы. Стало быть, s ^ t. □
С л е д с т в и е . Любые две эквивалентные линейно независимые
системы векторов в V содержат одинаковое число (возможно, бес­
конечное) векторов.
При этом две системы векторов мы считаем эквивалентными,
когда каждый вектор одной системы является линейной комбина­
цией векторов другой системы. Разумеется эквивалентные линейно
зависимые системы могут состоять из разного числа векторов так
же, как одна из эквивалентных систем может быть линейно независи­
мой, а другая линейно зависимой. Но если в данной системе векторов
из V мы возьмём какие-то две максимальные линейно независимые
подсистемы (максимальные — значит не допускающие расширения
до линейно независимых подсистем из большего числа векторов), то
в этих подсистемах будет одинаковое число векторов. Для доказа­
тельства достаточно применить теоремы 1 и 2 .
О п р е д е л е н и е 2 . Число векторов, содержащихся в любой
максимальной линейно независимой подсистеме данной системы
векторов, называется рангом этой системы.
В применении к пространству V установленные нами факты
допускают несколько иную интерпретацию, которая будет играть
основополагающую роль во всём дальнейшем изложении.
2
20 Г л. 1. Пространства и формы

2. Р азм ерность векторного простран ства и его базис.


Могут представиться два случая: либо в пространстве V можно най­
ти произвольное число линейно независимых векторов (системы
векторов произвольного ранга), и тогда оно называется беско­
нечномерным, либо все достаточно большие системы векторов в
V линейно зависимы. Бесконечномерные линейные пространства,
содержательная теория которых предполагает наличие в них
дополнительной, обычно топологической структуры, будут рассмат­
риваться лишь эпизодически.
О п р е д е л е н и е 3. Линейное пространство V , в котором су­
ществует п линейно независимых векторов, но нет линейно незави­
симых систем с большим числом векторов (большего ранга), называ­
ется п-мерным (в записи: dim^V = п или просто dimV = п). Нулевое
пространство считается нульмерным.
Это определение хорошо согласуется с понятием размерности пря­
мой (одномерное пространство), плоскости (п = 2), пространства Мф
(п = 3). В новой терминологии ранг семейства векторов {vi, V2, ... }
есть не что иное как размерность линейной оболочки (vi, V2, ...).
П р и м е р ы . 1) К о о рди н атн ое п р о стр ан ств о Яп им еет р азм ер н о сть п (ср.
[ВА I, гл. 2]). Если бы это было не т а к , то наше определение р а зм ерн ости следо­
вало п р и зн а ть неполноценным.
2) П ро стр ан ств о м атр и ц р азм ер а т х п им еет р азм ер н о сть ra n , в чём легко
убедиться, располож ив элем енты м атр и ц ы в одну с тр о к у длины т п и о то ж ­
дествив п р о стр ан ств о т х n -м атр и ц с коорди н атн ы м п ростр ан ств о м Яш п .
3) П ро стр ан ств о ф ункций в примере 4 из § 1, очевидно, бесконечномерно.
4) П р о стр ан ств о Рп м ногочленов степени <С п — 1 от одной переменной, оче­
видно, n -мерно. Л инейно независим ы м и будут, наприм ер, в ек то р ы 1 , tn_1.
5) П ро стр ан ств о одн ородны х ф орм степени к о т т перем енны х им еет р а з­
м ерн ость п = (fc+™_1) (проверьте это).
В двух последних примерах без труда указываются системы из
п линейно независимых векторов. Для определения размерности не­
обходимо, однако, убедиться в том, что в этих пространствах нет
систем большего ранга. Перебора всевозможных систем можно избе­
жать, как нетрудно сообразить, если использовать теорему 2 или её
следствия.
О п р е д е л е н и е 4. Пусть V — n-мерное векторное пространство
над полем Я. Любая система из п линейно независимых векторов
e i ,... , en G V называется (конечным линейным) базисом прост­
ранства V.
Удобно считать, что базис нульмерного пространства образует
пустое множество векторов. Существование базиса в V вытекает из
определения n-мерного пространства. Следующая теорема показы­
вает, в частности, каким образом можно фактически строить новый
базис, исходя из заданного.
Т е о р е м а 3. Пусть V — векторное пространство над Я с ба­
зисом (ei,... , еп). Тогда имеют место следующие утверждения:
§ 2. Размерность и базис 21

i) каждый вектор v Е V можно представить, и притом един­


ственным образом, в ende линейной комбинации векторов e i , ..., еп;
и) всякую систему из s ^ п линейно независимых векторов f i , ...
. .., fs пространства V можно дополнить до базиса. В частности,
любой вектор v / 0 можно включить в базис.
Д о к а з а т е л ь с т в о , i) Присоединив к данному базису произ­
вольный вектор v G V, мы получим согласно определению п-мерного
пространства линейно зависимую систему, причём в нетривиальном
соотношении
av + аде! + ... + а пеп = О
коэффициент а должен быть отличен от нуля. Следовательно,
V = ( - a _ 1a i ) e i + . . . + ( - а _ 1а и)е„
— линейная комбинация базисных векторов.
Из существования двух разложений
/?iei + ... + (Зпеп = v = 7 iei + ... + 7 „е„
мы получили бы после вычитания соотношение
(Pi —7i)ei + • • • + (Рп —7n)en = О,
но ввиду линейной независимости e i , . . . , еп отсюда вытекало бы ра­
венство нулю всех коэффициентов:
Pi - 71 = • • • = Рп - 1п = о,
т.е. Р\ = 7 i, . .., Рп — 7 п- Тем самым установлена единственность
разложения.
и) Рассмотрим систему векторов
f i , . . . , f s, e i , . . . , e n. (1)
Выбросим теперь из системы (1) все те векторы, которые выража­
ются линейно через предыдущие. По условию f i , ..., fs линейно неза­
висимы, поэтому ни один из них выброшен не будет, и оставшаяся
система примет вид
fl 5• • • 5fS5 eil 5' ' ' 5 ' (2)
Любое нетривиальное соотношение
Oil fi + . . . + 07 fs + Pl^ii + • • • + Pteit — 0
содержало бы коэффициент Д / 0 с максимальным номером к, и
мы выразили бы вектор через предыдущие векторы системы (2),
что исключено по построению. С другой стороны, согласно i) все
векторы из V выражаются линейно через базис (ei , . .., еп), тем более
через систему (1), а стало быть, и через систему (2). Таким образом,
линейно независимая система (2) максимальна. Она будет базисом
пространства V , а , . . . , — искомым дополнением. □
22 Г л. 1. Пространства и формы

Рассуждение, использованное при доказательстве утвержде­


ния п), называют по традиции принципом Стейница о замене.
Тривиальным следствием утверждения п) является импликация
V! с v2 п < г2,
где Vi, V2 — подпространства в V размерностей соответственно гд, г2.
З а м е ч а н и е 1. Число элементов базиса конечномерного прост­
ранства V не зависит от базиса, и иногда базис считается просто
подмножеством в У, но вопрос о нумерации базисных элементов (или
о порядке элементов базиса) приобретает значение при использова­
нии матричного формализма, как это будет ясно из дальнейшего.
Структура на множестве индексов базиса чаще всего определяется
существом дела. Не всегда в качестве индексов берутся натуральные
числа. Так, базис (£ж | х Е X ) из дельта-функций (см. пример 4 из
§ 1) пространства Ях (Я — поле, \Х\ < оо) естественно нумеруется
элементами х Е X . Если вдобавок X — конечная группа, то линейное
пространство Ях функций на X со значениями в поле Я можно прев­
ратить в алгебру размерности \Х\ над Я (см. определение в конце
п. 2 из § 1), положив
Sх ^ ^х! — ^ххг \/ X, X Е .А!"
и распространив умножение на все функции / = ^ f(x)Sx, д —
— ^2 9{х,)&х' по линейности:

f*g= Е f ( x )9(x')6™ ' =


х ,х 'е х уех хех
Эта операция носит название свёртки функций. Если X = {ад, х2, ...
. .., хп} и мы возьмём в V базис ( Ai , . .., Дп), А* = SXi, пронумеро­
ванный натуральными числами, то сразу же возникнет затруднение
с определением номера к в формуле Д^ * Aj = Д&.
3. К оординаты . И зом орф изм пространств. В силу теоре­
мы 3 имеет смысл следующее
О п р е д е л е н и е 5. Пусть (ei, . . . , еп) — базис векторного прост­
ранства V над Я. Скаляры Ai, . . . , An Е Я, входящие в разложение
v —Aiei + ... + Апеп,
называются координатами вектора v Е V в данном базисе.
Если х = оде! + ... + а пеп, у = fo ei + ... + /Зпеп, то х + у =
= (ад + fo)&i + ... + (ап + (дп)еп, т.е. при сложении векторов х, у их
координаты складываются. Так как, далее, Ах = Аадв! + ... + Аапеп,
то при умножении х на скаляр А координаты вектора х умножаются
на тот же скаляр. Вектор, все координаты которого равны нулю,
совпадает с нулевым вектором.
Если Рп — пространство, векторами которого являются много­
члены из R[£] степени ^ п —1, то, как уже отмечалось, один из базисов
§ 2. Размерность и базис 23

составляют векторы ео = 1, ei = £, . .., en_i = £n_1. В этом базисе


координатами многочлена f(t) = ао + ot\t + ... + OLn- \ t n~x будут его
коэффициенты <то,ац,. .., a n_i. Но тот же многочлен /(£), записан­
ный в виде
п—1
/( * ) = / ( « ) + / '( « ) ( * - « ) + ••
+ (гг- 1)! (*“ а)
будет иметь в базисе = 1, = t — а, ~'п—1 : (i а )”- 1
координаты
/ (”
/(а), /'(а), ....
( п - 1)!
В Еп координатами вектора х = (ад, « 2, . . . , а п) относительно ба­
зиса ei = (1, 0 , . . . , 0), е 2 = (0 , 1, . . . , 0), . .., еп = (0 , 0 , . . . , 1) (раньше
мы писали , Е ^ ) , . . . , £дп)) являются числа ад, а 2, ..., а п (поэтому
это пространство и называется координатным), но в Еп имеется бес­
численное множество других базисов, в которых координатами того
же вектора х будут новые системы чисел.
Рассмотрим теперь эту ситуацию в общем случае. Пусть V —
n-мерное векторное пространство над полем Л и ( ei , ..., еп), (е^,...
... ,е'п) — какие-то два его базиса. Векторы одного базиса выража­
ются через векторы другого:
е 1 — « 11^ 1 + &21е 2 + • • • + « п 1 е п>
(3 )
еп —ainei -Ь «2п®2 Н- ... Н-
Коэффициенты ац G Я определяют матрицу
«n «12 «In
«21 a 22 «2n
II

II

«nl «n2 • • «nn


называемую матрицей перехода от базиса (ei , . .., еп) к (е^,. .., е^).
Следует подчеркнуть тот факт, что координатами вектора е'- от­
носительно базиса ( e i , . . . , e n) служат элементы j-ro столбца мат­
рицы А.
Пусть координатами вектора v Е V будут Ai, . . . , Ап в базисе
(ei , . .., еп) и A'l5. .., А^ — в каком-то новом базисе (е^,. .., е'п), т.е.
Aiei + ... + Anen = v = А^е^ + ... + А^е^.
После подстановки вместо е'- их выражений (3) через е* мы получим

v —A i e i + ... + А пеп —А ^ ( « n e i + «21е 2 + •••+ « n i e n) + ...


. . . + A ^ (a ine i + «2пе2 + . . . + аппеп ),
24 Г л. 1. Пространства и формы

откуда
Ai = ацХ[ + (212А2 + ... + CLin^'m
(4)
An = 4" ^п2^2 Н“ • • • Н“ &пп^ П 1
как мы писали в [ВА I, гл. 2],
и л и ,

X = АХ', (4')
где X = [Ai,..., An], X 1 — [A'l5..., А^] — столбцы старых и новых
координат.
Формулы (4), (4') выражают старые координаты Ai,..., Ап век­
тора v через его новые координаты А^, . . . , А^ при помощи линейного
преобразования переменных с матрицей А. Мы могли бы с самого
начала выразить e i , . . . , еп через , . . . , (оба базиса в V равно­
правны), и тогда получились бы формулы
А' = а'а Ai + afi2^2 + • • • + a'nAn, 1 ^ i ^ п. (5)
Их существование означает, что линейное преобразование с матри­
цей А обратимо, т.е. det А ф 0, и (5) принимает вид
X ' = А~ 1Х, А - 1 = (a'j).
Итак, справедлива
Т е о р е м а 4. При переходе от базиса ( e i , . . . , e n) пространства
V к базису (е^,... , е^), определяемом матрицей А , координаты век­
тора в новом базисе выражаются через старые координаты при
помощи обратимого линейного преобразования с матрицей И-1 .
Важно отметить, что при явном выражении нового (штрихован­
ного) базиса через исходный по формуле (3) естественным обра­
зом старые координаты выражаются через новые (штрихованные)
по формуле (4) (обратить внимание на порядок суммирования), в
то время как выражение новых координат через старые требует
трудоёмкой операции обращения матрицы перехода. Использование
координат позволяет свести операции над векторами к действиям
над скалярами (скажем, над числами из R), а выбор разумной
системы координат (базиса) зачастую существенно упрощает вычис­
ления. Понятие базиса или координатной системы мы используем
теперь для того, чтобы алгебраически отождествить векторные
пространства одинаковой размерности.
О п р е д е л е н и е 6 . Векторные пространства V и W над полем А
называются изоморфными, если существует биективное отображение
/: V W, для которого
f ( a u + /3v) = a f ( u) + /?/(v) (6)
при всех <т, (5 G A, u, v E V.
Другими словами, / — изоморфизм аддитивных групп прост­
ранств V и W, обладающий дополнительным свойством f ( a и) =
§ 2. Размерность и базис 25

= a f ( и ) . Говорят также, что отображение / линейно над Я, или


Я-линейно. Из определения изоморфизма групп вытекает, что отоб­
ражение / -1 будет также изоморфизмом W и V . Кроме того, ком­
позиция изоморфизмов
и Л у A w
будет изоморфизмом f og: U —УW . Непосредственно видно, что раз­
мерность является инвариантом изоморфизма: если (ei,...
. .., еп) — базис в V, то (/ (еi ) , . .., /( е п)) — базис в W, и обратно.
Других инвариантов изоморфизма нет, как показывает
Т е о р е м а 5. Все векторные пространства одинаковой размер­
ности п над Я изоморфны. Более точно: все они изоморфны коор­
динатному пространству Яп.
Д о к а з а т е л ь с т в о . Пусть ( e i , . . . , e n) — какой-нибудь базис
n-мерного пространства V. Координаты ад,...,<тп произвольного
вектора х = адв! + ... + а пеп однозначно определены, поэтому соот­
ветствие
/ : х и ( а ь . . . , а п)
между векторами из К и Яп биективно. Если у = fiiei + ... + Дпеп,
то
ах + /Зу = (aai + (3(3i)ei + ... + (аа„ + /3/3п)еп.
Стало быть,
/(ах + /Зу) = (aai + /ЗД, • • •, а а п + (3f3n) =
= a ( a i , . . . , а„) + (3((3г ,...,(Зп) = а/(х) + /3/(у),
что и является выражением свойств изоморфизма. □
Доказанная теорема в сущности утверждает, что, выбрав базис
в V , мы придём к Яп. Однако было бы крайне неудобно ограничи­
ваться изучением линейных задач только в Яп, поскольку подлинной
целью является получение результатов, совсем не зависящих от спе­
циальных свойств базиса. Кроме того, при переходе к Яп утрачива­
ется наглядный характер многих векторных пространств таких, как
обычное трехмерное пространство, пространство многочленов и др.
П р е д у п р е ж д е н и е . Изоморфизм между двумя векторными
пространствами V, W , если он существует, определён однозначно
только в двух частных случаях: а) V = W = {0 }; б) dim V = 1 =
= dim W, Я — поле из двух элементов (попробуйте доказать это).
Во всех остальных случаях изоморфизмов много.
Иногда бывает, что между двумя векторными пространствами
определён некоторый изоморфизм, не зависящий от какого-либо про­
извола, например от выбора базисов в V и W . Такие изоморфизмы
мы будем называть каноническими или естественными, в отличие
от всех остальных — “случайных”. Характерный пример естествен­
ного изоморфизма нам встретится в следующем параграфе.
26 Г л. 1. Пространства и формы

4. П ересечение и сумма подпространств. Хорошо извест­


ные теоретико-множественные операции пересечения и объединения
мы применим к подпространствам. Пересечение U\ П U2 двух под­
пространств U1 1 U2 С V , очевидно, является подпространством. То
же относится и к пересечению U = Ciiei Ui любого семейства {£/Д i Е
G /} подпространств (возможно, что U — нулевое подпространство).
Действительно, нулевой вектор, входящий во все входит в U , так
что U непусто. Если, далее, х, у Е £/, то любая их линейная комбина­
ция <тх + (Зу входит во все Щ и, следовательно, <тх + Ду Е U.
Заметим, что объединение U\ U U2 двух подпространств не обя­
зательно является подпространством. Если, например, e i , e 2 — ли­
нейно независимые векторы в У и ёД = (еД, U2 = (^2), то U\ U U2 не
содержит ei + в 2.
Наименьшим подпространством в V, содержащим Ui и явля­
ется, очевидно,
U = {ui + u 2 I ui E ЕД, u 2 E U2}.
Это подпространство называется суммой U\,U 2 и обозначается
U\ + U2 . Ясно, что U\ + U2 — U2 + Ui, причём U\ + U2 = U2 тогда и
только тогда, когда U\ С Аналогично определяется сумма любого
конечного числа векторных подпространств ЕД,. .., Um. Именно, под
U\ + ... + Um понимается наименьшее векторное подпространство,
содержащее все векторы из ЕД, 1 ^ i ^ ш, а также их всевозможные
линейные комбинации. При этом не делается никакой расстановки
скобок, поскольку Щ + (Uj + Uk) = (ЕД + Uj) + ЕД.
Если А, В — какие-то фигуры в трёхмерном физическом
пространстве, возможно, с непустым пересечением А П В и vol (А),
vol (В) — их объёмы, то справедливо соотношение
vol (A U В) = vol (А) + vol (В) —vol (АГ\ В).
Его аналог в случае пространств выражает
Т е о р е м а 6 . Пусть U u W — конечномерные подпространства
векторного пространства V. Тогда^
dim (U + W ) = dim U + dim W - dim (U П W). (7)

Д о к а з а т е л ь с т в о . Положим
dim U = k, dim W = l, dim (U П W) = rn.
Так как (ЕЕ П W) C U,W, то m ^ &,m ^ l. Выберем в U П W
какой-нибудь базис (ei , . .., em) и, опираясь на теорему 3, дополним
его, с одной стороны, до базиса (ei , . .., еш; a i , . .., а&_т ) подпрост­
ранства U, а с другой — до базиса ( ei , ..., ет; Ьц,. .., Ь/_ш) под­
пространства W . Каждый вектор суммы U + W имеет вид u + w,
Ф орм ул а (7) связы вается с именем Г. Г рассм ана (1809-1877).
§ 2. Размерность и базис 27

где u G U,w G W, а это значит, что


U + W — ( e i , . . . , e m 5 a i , . . . , a ^ _ m 5 b i , . ..
Если мы покажем, что система
5 • • • 5 ®га 5 5 • • • З-к—т5b i , . . . , Ь/_т
линейно независима и, стало быть, имеет место соотношение
dim (U + V) = т + (к —т) + (I —т) = к + I —т,
совпадающее с (7), то доказательство будет завершено. Предполо­
жим, что это не так, и пусть
т к —т 1—т

Е +Е +Е =0 (*)
s=l г=1 j=1

— нетривиальное линейное соотношение. Тогда мы имеем


т к —т 1—т

Е + Е ai&i = - Е
8= 1 i=l i= l
где в левой части равенства стоит элемент из £/, а в правой — элемент
из W . Значит, перед нами вектор из U П W, и мы можем записать
Е 31—=1т Рзъз
п л \-^ т с
= E e= i ^ eej или
т 1—т
= 0.
s=i i=i
Но линейная зависимость базисной системы { e i , . . . , e m ; b i , . . . , b / _ m}
подпространства VE должна быть тривиальной. В частности,
/3i = ... = Pi-m — 0 , и соотношение (*), превратившееся теперь в
линейную зависимость базисной системы { e i , . . . , e m; a i , . . . , a k- m}
подпространства £/, также должно быть тривиальным: 71 = ...
... = 7 ш = ад = ... = ак-т = 0. Мы пришли к желаемому противо­
речию. □
Так как размерность суммы U + W не превосходит размерности
объемлющего пространства V , то на основании теоремы б часто
можно делать заключение о нетривиальное™ пересечения подпрост­
ранств. Например, две плоскости трёхмерного пространства или два
трёхмерных подпространства пятимерного векторного пространст­
ва обязательно содержат общую прямую, поскольку в обоих случаях
dim U + dim W > dim V.
По поводу используемой терминологии сделаем следующее
З а м е ч а н и е 2 . В n-мерном пространстве V существуют под­
пространства всех меньших размерностей, в чём легко убедиться,
включив V в цепочку подпространств
0 С V l С V 2 С . . . С У „ _ 1 С Vn = V = ( е ь . . . , е „ ) ,
28 Г л. 1. Пространства и формы

где Vi = ( e i,...,e f ) . Одномерные векторные пространства назы­


вают прямыми, двумерные — плоскостями, ^-мерные при к ^ 3 —
к-мерными плоскостями. Пусть U — подпространство векторного
пространства V. Разность
codim U = dim V —dim U
называется коразмерностью подпространства U. Любое подпрост­
ранство коразмерности 1 называется гиперплоскостью. Понятие
гиперплоскости относительно: прямая является гиперплоскостью
двумерного векторного пространства W, но перестаёт быть таковой,
если W рассматривается как плоскость векторного пространства V
большей размерности.
5. П рямы е суммы. В сумме ненулевых линейных подпрост­
ранств
и = и 1 + и 2 + ... + и т (8)
любой вектор и G U записывается в виде
U = U1 + U2 + . . . + Um, Ui е Ui, (9)
вообще говоря, неоднозначно.
О п р е д е л е н и е 7. Если каждый вектор u G U может быть пред­
ставлен одним и только одним способом в виде (9), то сумма (8)
называется прямой и обозначается
U = U\ 0 U2 0 ... 0 Um.
Сумма (8) будет прямой и в том случае, когда однозначность
записи (9) имеет место лишь для нулевого вектора, т.е.
О = ui 0 u 2 0 ... 0 u m = > ui = 0 , u 2 = 0 , . .., u m —0 .
В самом деле, если это более слабое условие выполнено, то из двух
разложений
111 0 и2 + ... + u m =11 = Ui 0 U2 0 • • • 0 u m
следовало бы 0 = (ui — и[) 0 (u 2 - td,) 0 ... 0 (um - u ^ ), где
щ G Ui. По предположению щ — = 0 ,1 ^ i ^ m, или
ui = Ui, u 2 = U2, . .., u m = u ^ , т.е. выполнено свойство разложения
в прямую сумму.
Условимся в обозначении:
U\ 0 ... 0 Ui 0 ... 0 Um = U\ 0 ... 0 Ui—1 0 Ui+1 0 ... 0 Um.
Т е о р е м а 7. Сумма U = U\ 0 U2 0 • • • 0 Um является прямой
тогда и только тогда, когда
Ui П (U\ 0 ... 0 Ui 0 ... 0 Um) = 0 (10)
для i = 1, 2 , . . . , т.
Д о к а з а т е л ь с т в о . Предположим, что наша сумма прямая. Рас­
смотрим произвольный вектор х G UiC\{Ui + .. . + Ui + ... + Um), где
§ 2. Размерность и базис 29

индекс i фиксирован. Тогда х = ui + . . . + и^ + . . . + иш, и для нулевого


вектора мы получим два разложения
0 + . . . + 0 + 0 + 0 + ... + 0 = 0 =
= U1 + . . . + U;_1 + (-х ) + Ui+1 + . . . + Um.
Так как сумма прямая, то эти разложения должны совпадать. В част­
ности, —х = 0 , и, следовательно, равенство (10) выполнено.
Обратно, предполагая справедливым (10), докажем единствен­
ность разложения нулевого вектора (этого, как мы знаем, доста­
точно, чтобы сумма была прямой). В самом деле, будем исходить
из какого-нибудь разложения
0 = a.i + ... + + ... + аш.
Тогда при любом i = 1, 2,..., т имеем
—Щ = ai + ... + а ^_1 + a^+i + ... + am Е
£ Ui П (Ui + ... + £/* + . . . + Um) = 0.
Стало быть, а* = 0. □
В случае т — 2 теорема 7 принимает особенно простую форму:
сумма U = U\ + U2 прямая U\ П £/2 = 0. В частности, привлекая
соотношение (7), получаем, что dim U = dim£/i +dim£/ 2- Обобщение
этого свойства выражает
Т е о р е м а 8 . Сумма U = U\ + U2 + ... + Um является прямой
тогда и только тогда, когда
т
dim U = dim Ui. (11)
2=1
Д о к а з а т е л ь с т в о . Проводим его индукцией по т. При т = 2
справедливость утверждения отмечена выше, а в случае произволь­
ного т воспользуемся теоремами б и 7. Именно, если сумма прямая,
то прямой будет и сумма СД + ... + £/* + ... + С/ш, а тогда
dim U = dim Щ + dim(£/i + ... + £/* + ... + Um) —
— dim С П ((7i + ... + С + ... + (7m) =
т
= dim Ui + (dim U\ + ... + dim Ui + ... + dim C/m) —0 = ^ dim Ui.
2=1
Обратно, если формула (11) верна, то объединение базисов подпрост­
ранств £/* будет базисом в £/, и, значит, сумма прямая. □
Вариацией на ту же тему служит
Т е о р е м а 9. Для любого т-мерного подпространства U век­
торного пространства V размерности п найдётся такое (п —т)-
мерное подпространство И . что V = U 0 W (U и W называются
дополнительными подпространствами).
30 Г л. 1. Пространства и формы

Д о к а з а т е л ь с т в о . Результат получается немедленно, если про­


извольный базис ( ai , . .., am) в U дополнить до базиса ( ai , . .., am;
b i , ... , b n_m) в У (воспользовавшись теоремой 3) и положить W =
= (bi, . . . , b n_m). п
Рассматривая прямые суммы, мы действовали пока в фиксиро­
ванном векторном пространстве У; такие прямые суммы часто назы­
вают внутренними. Но иногда возникает необходимость в рассмот­
рении внешней прямой суммы U 0 W двух векторных пространств
над одним и тем же полем Я, заранее никуда не вложенных в качестве
подпространств. Под U 0 W в этом случае понимается совокупность
У = U x W всевозможных упорядоченных пар (u, w ) c u G t / , w G V P .
Операции сложения векторов из У и умножения их на скаляры опре­
делены формулой
<a(u, w) + Д(и', w') = (аи + /Зи', aw + flw').
Это похоже на построение плоскости по двум её координатным осям.
Векторы (и,0) порождают в У подпространство У, изоморфное
У, а векторы (0 , w) порождают подпространство W , изоморфное W.
Изоморфизмы (и,0) н->> и, (0,w) н->> w здесь очевидны; вместе с тем
можно записать _ _
U о ТУ = У = U ® W ,
внеш няя внутрен н яя
поскольку на У 0 РУ мы уже смотрим как на прямую сумму подпрост­
ранств данного нам векторного пространства У. В дальнейшем речь
будет идти преимущественно о внутренних прямых суммах, поэтому
всякие спецификации опускаются.
6 . Ф акторп ростр ан ства. К заданному подпространству L С
С У существует, вообще говоря, много дополнительных подпрост­
ранств М С У, для которых У = L 0 М . Но все такие дополнения
изоморфны одному векторному пространству, которое строится по
У и L абсолютно инвариантным способом, не связанным с каким-
либо произволом.
Будем смотреть на У и L как на аддитивные абелевы группы.
Множество
х + L = {х + у| у е L)
называется смежным классом У по L, вектор х — представите­
лем этого смежного класса. Если 0 ф z Е (х + L) П (х' + L), то
x + y = x/ + y / = Z H X + L = x/ + L = z + L. Поэтому два смежных
класса либо не пересекаются, либо совпадают. При фиксированном
L положим х := х + L. Каждый вектор v Е У попадает в какой-то
смежный класс, и если У = V /L — множество всех смежных клас­
сов У по L, то_на У устанавливается структура абелевой группы по
правилу х + х' = х + х'. Операции коммутативности и ассоциатив­
§ 2. Размерность и базис 31

ности проверяются непосредственно. Понятно, что 0 — L — нулевой


элемент этой абелевой группы: х + 0 = х + 0 = х. Далее, —х = —х.
Положив Ах = Ах, т.е. А(х + L) = Ах + L VA Е Я, мы легко убеж­
даемся в том, что выполнены все аксиомы ВЩ-ВЩ из § 1. Например,
l-(x + Z/) = l- x + Z/ = x + Z/,
а(/3(х + L)) = а(/3х + L) = аДх + L = (аД)(х + L).
Таким образом, V = V / L наделено естественным образом струк­
турой векторного пространства, которое и называется фактор-
пространством пространства V по подпространству L (или по
модулю L). Вместо смежных классов мы могли бы рассматривать
классы по отношению эквивалентности, определенному сравнением
х = хДтосIL) <(=> х - х' G L,
но это была бы перефразировка сказанного.
П р и м е р 7. П усть V = М2 — к оорди н атн ая плоскость, a L — ось х. Допол­
ни тельны м п о д п ростран ством М слу­
ж и т любая прям ая, проходящ ая через
О и отли чная от гори зон тал ьн ой оси
(рис. 2).
Дополнение М пересекает каж дую
прям ую , параллельную оси ж, точно в
одной точке, т а к ч т о М п а р ам е тр и зу е т
м нож ество всех т а к и х прям ы х. Э то мно­
ж ество к а к раз и есть V /L . Рис. 2

Т е о р е м а 10. Пусть V = L 0 М — прямая сумма подпрост­


ранств, L , M С V . Тогда отображение / : и о и + L (и Е М)
является изоморфизмом между М u V / L .
Д о к а з а т е л ь с т в о . В самом деле, / — линейное отображение,
поскольку
f ( a u + (3v) = а и + (3v + L = а (и + L) + (3(v + L) = a f ( u) + /?/(v).
Пусть v + L — произвольный элемент из V/ L. По условию v =
= х + у, x e L , у Е М, так что v + Z/ = x + y + Z/ = (х + L) + (у + L) =
= L + (у + L) = у + I/ = /(у ). Это доказывает сюръективность /.
Если, далее, u Е Кег/, то и + L = L, откуда и Е L. Но и Е М, а
L П М = 0. Поэтому и = 0, так что Кег/ = 0. Стало быть, / —
биективное отображение. □
С л е д с т в и е . Пусть L — произвольное подпространство в V.
Тогда
dim V / L = dim V —dim L.
Другими словами, dim V / L = codimy L.
Д о к а з а т е л ь с т в о . По теореме 9 найдётся такое подпрост­
ранство М С V, что V = L 0 М, причём dim М = dim У —dim L.
По только что доказанной теореме 10 это подпространство М изо­
морфно факторпространству V/ L. □
32 Г л. 1. Пространства и формы

УП РА Ж Н ЕН И Я

1. С колько к- мерны х п од п ро стр ан ств , 1 <С к <С п, у n -м ерного в ек торн ого


п р о с тр а н с тв а V над полем из q элементов?
2. В ы ясн ить, как о в а разм ер н о сть п р о с тр а н с тв а вещ ественны х к в ад р ат н ы х
м атр и ц п оряд ка п : а) сим м етричны х; б) кососим м етри чны х; в) с нулевым следом.
3. К ак о ва разм ер н о сть п р о с тр а н с тв а всех м ногочленов f( t ) степени <С п от
одной переменной с условием /( 1 ) = 0? Н ай ти базис это го п р о с тр ан ств а.
4 . Д о к а за ть , ч т о сум м а U = £Д + U2 + • • • + и ш явл яется прям ой в то ч н о сти
т о гд а , к огд а
( £ Д 0 . . . 0 £ Д —1) С£ Д = 0э 1 < г <С т.
5. Н ай ти м атр и ц у перехода о т базиса (1, t , . . . , t n ~ 1) п р о с тр а н с тв а Рп к ба­
зису (1, (t — а), . . . , ( £ — <т)п - 1 ) т о го же п р о стр ан ств а.
6. П усть в — комплексны й корень неприводим ого над Q многочлена / Е Q[t].
Н ай ти разм ер н о сть над Q п р о с тр а н с тв а Q[<a] = (1, в ,..., 9 к,... )q .
7. Д о к а за ть , ч т о для прям ы х сумм не вы полняется закон сокращ ения, т.е. из
равен ств а сумм U 0 ИД = U 0 ИД с одинаковы м слагаем ы м U, вообщ е говоря, не
следует, ч т о ИД = ИД.
8. В ы ясн ить, конечномерно ли ф а к то р п р о с т р ан с т в о &[t]/L, где:
а) L — п о д п ростран ство Рп многочленов от t степени <С п — 1;
б) L — п о д п ростран ство м ногочленов, делящ ихся на t n ;
в) L — п о д п ростран ство многочленов от t 2?
9. Д о к а за ть следующий аналог ф орм улы Г рассм ана:

codim (U + W ) + codim {U П W ) = codim U + codim W

(U и W — п о д п р о стр а н ств а конечной коразм ерн ости не обязательно конечно­


мерного в ек торн ого п р о с тр а н с тв а V).
10. Следуя терм ин ологии при м ера 8 из § 1, вы делим три ви альн ы е полумаги-
ческие м атри ц ы

1 1 1 1 .. . 1
1 1 11.. . 1
со

0, Е —
II
II

1 1 1 .. . 1
1

В озн и к ает вопрос: каковы р а зм ерн ости dim SM agn (Q) и dim M agn (Q)? О че­
видно, SM ag2(Q) = { E , D ) q . В этом случае S = Е + D — единственная с т о ч ­
ностью до рациональн ого м нож ителя м аги ч еск ая м атри ц а. П ри п — 3 можно
у к а з а т ь менее очевидную м агическую м атри ц у

1 2 0
А = 0 1 2
2 0 1

В ы чи слить указан н ы е выше р азм ерн ости при п = 3 и п = 4.


11. Д о к а за ть разлож ение в прям ую сумму

SM agn (Q) = M agn (Q) 0 QE 0 QD.

12. П усть V i , . . . , Vk — п о д п р о стр а н ств а n -м ерного в ек торн ого п р о с тр а н с тв а


V. Д о к а за ть , ч т о если dim V\ + . . . + dim У/, > п[к — 1), то П ?=1 Н Ф О (прямое
обобщ ение утверж ден и й , вы текаю щ и х из ф орм улы (7)).
§ 3. Двойственное пространство 33

§ 3. Д в о й ст в ен н о е п р о с т р а н с т в о

1. Линейные функции. Любому векторному пространству V


конечной размерности над полем Я можно сопоставить другое век­
торное пространство, находящееся с V в специальном отношении
двойственности. С этой целью введём
О п р е д е л е н и е 1. Отображение f : V —>Я, обладающее свойст­
вом
/ ( а х + /Зу) = а/ (х) + (if {у) Va, / 3eF; х ,у £ V,
называется линейной функцией на V (линейной формой или линей­
ным функционалом; последний термин чаще используется в теории
бесконечномерных пространств).
Выберем в V какой-нибудь базис ( e i , . . . , e n). Тогда результат
применения линейной функции / к вектору х = Aiei + ... + Апе п
запишется в виде
/(х ) = \\f3i + ... + Ап/^п, (1)
где fa = f(ei) — скаляры, зависящие только от выбора базиса.
Обратно: непосредственно видно, что при заданном базисе (ei,...
. . . , е п) произвольным скалярам fa Е Я, i = 1, . . . , п, отвечает, и
притом только одна, линейная функция. Важно, однако, помнить,
что как в определении линейной функции, так и в эквивалентных
ему соотношениях
/( х + у) = /(х ) + /(у), /(Ах) = А/(х)
нет упоминания о каком-либо выборе базиса, т.е. определение линей­
ной функции инвариантно (не связано с выбором базиса). Предста­
вляя значения линейной функции / в виде (1), мы должны знать пра­
вила, по которым меняются коэффициенты Д = /(е^) при переходе
от одного базиса к другому. Пусть
(еь . . . , е„) = V = ( ei , . .. , е'п),
22^2 + •••+ anj-en,
e'j = aij-ei + < j = 1,2,..., n,
— формулы перехода от базиса (ei, . . . , еп) к базису (е^, . . . , е'п). Если
теперь
XiPi + ... + Ап(Зп = /(v ) = \[f3[ + ... + Х!п(3'п,
где Ai, . . . , Ап и \ [ , ... ,\'п — координаты вектора v Е V в базисе
(ei , . .., еп) и (е^,. .., е^) соответственно, то, как легко видеть,

(3j — f ( e j ) = / ( a lje l + a 2je 2 + • • • + CLnjVn) =

= a i j / ( e 1 ) + a 2 j f ( e 2) + ... + a n j f ( e n ) =
= + a 2 j /^2 + ... + anj(3n . (2)

3 А .И. К о стр и к и н
34 Г л. 1. Пространства и формы

Стало быть, базисные векторы и коэффициенты линейной формы


при замене базиса меняются по одним и тем же формулам, т.е.
согласованно или, как еще говорят, когредиентно.
2. Двойственное пространство и двойственный базис.
Имея линейные функции /, g на У, мы можем рассмотреть их линей­
ную комбинацию a f + (3g с а, [5 Е Я, полагая
(а / + fig){x) =f af(x) + (Зд(х).
Непосредственно проверяется, что a f + /Зд является линейной функ­
цией и, следовательно, имеет смысл
О п р е д е л е н и е 2 . Относительно введённых операций сложения
и умножения на скаляры линейные функции составляют векторное
пространство У* = £(У, F), двойственное (сопряжённое или дуаль­
ное) к У.
З а м е ч а н и е . При одновременном рассмотрении пространств У
и У* элементы из У* называются ко вариантными векторами (или
ковекторами), а элементы из У — контравариантными векторами.
В рамках общей теории тензоров, которой мы уделим особое внима­
ние в гл. 6 , ковекторы относятся к тензорам типа (1, 0) (ковариант-
ныв тензоры ранга 1), а векторы — к тензорам типа (0 , 1) (контра-
вариантные тензоры ранга 1). Переходя к новой терминологии, мы
назовём тензором типа (1, 0) соответствие, относящее каждому
базису пространства У систему из п скаляров /3\, . . . , /Зп таким обра­
зом, что нештрихованные и штрихованные системы, отвечающие ба-
зисам (еь ... ,е„) и (е'1;... ,е'п), где
П
e'j = '^ 2 a ije i, j = l,...,n,
2=1
связаны между собой соотношениями (2). Для тензоров типа (0,1),
определяемых системами скаляров (Ai,. .., An), (A'l5. .., Х'п) в соот­
ветствующих базисах, то же самое выражается соотношениями (4)
из § 2. Приставки ко и контра часто встречаются в математике (ко-
вариантные и контравариантные функторы в самом общем понима­
нии), но их смысл всегда примерно одинаков и в какой-то степени
иллюстрируется рассмотренными простейшими примерами. Обще­
принятые обозначения тензоров будут введены позднее.
Мы видели, что при заданном базисе (ei,...,en) пространства
У имеется взаимно однозначное соответствие Ф : / н->> (/3i,. . . , /Зп)
между линейными функциями и системами из п скаляров. Эти сис­
темы мы отождествляем с векторами координатного пространства
Яп и замечаем, что если / н->> ( Д , ..., Дп), g (71,... , 7 П), то
/ + g ^ (Pi + 7 1,•••,fin + 7 п)ч А/ (A/3i,...,АДп).
Таким образом, Ф — изоморфизм векторных пространств У* n F ;
в частности dim У* = dim ^n = п.
§ 3. Двойственное пространство 35

Задав скаляры fdj = 0 для j ф г, = 1, и положив

мы определим линейную функцию ег Е У*:


е (ej) — — ^г-
Функции е1, ... ,еп, очевидно, линейно независимы, поскольку неза­
висимы соответствующие им векторы-строки (0, ..., 1, . .., 0) в Яп.
Тем самым доказана
Т е о р е м а 1. Пусть У — векторное пространство размерно­
сти п над полем Я. Тогда двойственное пространство У* также
имеет размерность п. Если ( e i , ..., еп ) — базис в V, а е1, ..., еп —
линейные функции, для которых
при г = j,
при i ф j,
то (е1, . . . , еп) — базис в У*.
О п р е д е л е н и е 3. Базис (е1 , . . . , е п) пространства У*, указан­
ный в формулировке теоремы 1, называется двойственным (дуаль­
ным или взаимным) для данного базиса (ei , . .., еп) пространства У.
Само название пространства У*, двойственного к У, и двойствен­
ных базисов (е1, ..., en), (ei,..., еп) связано “двусторонней симме­
трией” между У и У*, свойства которой будут раскрываться нами
постепенно, по мере введения новых понятий. Условимся временно
вместо / ( х ) писать (/, х) — намёк на скалярное произведение век­
торов, взятых, однако, из разных пространств. Тем самым опреде­
ляется отображение У* х У —>Я, линейное по каждому аргументу:
(af+(3g,x) = a(f,x)+/3(g,x), (/,ах+(3у) = а(/,х)+/?(/,у). (3)
Отображения У х W —>Я с таким свойством принято называть
билинейными, а также спариваниями между пространствами У и РУ.
Рассматриваемое нами спаривание между У* и У называется кано­
ническим.
Пользуясь двойственными базисами и представляя через них эле­
менты
х = аде! + « 2 ^ 2 + . . . + <anen5 / = Д е 1 + / ^ е 2 + . . . + /Зпеп ,
легко вычислить значение
/ ( х) — (/? х) — + ^ 2/^2 + • • • + OLn/3n
С другой стороны, получаются удобные формулы для вычисления
координат ak вектора х в базисе (ei , ... , еп) и координат Д ковек-
тора (линейной функции) / в базисе (е1, . .., еп):
а* = (е*,х), /5* = ( /, е*). (4)
з*
36 Г л. 1. Пространства и формы

В самом деле,
(ек, х) = (ек, а 1е1 + а 2е2 + ... + а пеп) = ^ a*(efc, еД = а к,
i
( / , e ft) = 2 ^ е \ ек) = ^ / Ц е \ е * ) = Рк-
Ъ Ъ
П р и м е р . П усть V = Рп = (1 , £ , . . . , t n _ 1 ) — n -мерное вещ ественное век­
торное п р о стр ан ств о многочленов степени <С п — 1. О тображ ени е f x - р ^ (ДА),
ставящ ее в со о тв етств и е к аж дом у многочлену p(t) = ро + p i t + . . . + (pn _ i t n_1
его значение в точк е Л Е I , очевидно, линейно. М еняя Л, мы можем получить
н екоторы й базис двойственного п р о с тр а н с тв а У*. Удобно ввести ещё ф ункции
/ : V I—)►К вида f ( p ) = Д(Д*ДА), где р^к) — к-я прои зводная многочлена р, а
д, А — некоторы е ф иксированны е числа. Т ак к а к f(ap-\-f3rtp) = р ( а р - \ - (Л) =
= р ( а р ^ ( Х ) + /З'ф^(Х)) = c t f (p ) + /5 /(^ ), то / Е У*. В частн о сти , линейные
ф ункции
ь ¥>(*>(0)
е : i-> — - — =<f>ki к = 0,1, • ■• ,п - 1,
к\
со ставл яю т базис в У *, двойственны й к 1 , £ , . . . , t n _ 1 . Б ази сом , двойственны м к
1, (t — Л ),. . . , (t — A)n_1 , будет набор ф ункц ий р ьд р ( к\ \ ) / к \ , к = 0 , 1 , . . . , п — 1.
В этой связи сто и т вспом нить о к оэф ф ициентах разлож ения ф ункции в ряд
Тейлора.
3. Рефлексивность. Простое сопоставление теоремы 1 и тео­
ремы 5 из § 2 приводит нас к заключению, что по крайней мере в
случае dim У < оо существует изоморфизм У* = У. По тем же при­
чинам будут изоморфны пространства У* и У** = (У*)*. По опреде­
лению У** — пространство, двойственное к У*, т.е. пространство ли­
нейных функций на У*. На первый взгляд, кажется затруднительно
разумным образом интерпретировать его элементы в терминах ис­
ходного пространства У. Между тем, У** находится в естественном
соответствии с У, как показывает
Т е о р е м а 2 . Существует канонический изоморфизм е: У —>•
—>У**, определённый формулами
е ( х ) = е х, ех(/) = /(х ).
Здесь х е v, / е V*, ех е г**.
Д о к а з а т е л ь с т в о . Линейность г проверяется непосредственно.
Действительно, sax+/gy (f) = f ( a x + Ду) = а /(х ) + Д/(у) = asx (f) +
+ Дгу(/) = (аех + /3sy)(f) для всякой линейной функции / : У —>• F.
Отсюда гах+ду = olex + Деу, т. е. е{ах + Ду) = ае(х) + Де(у).
Чтобы убедиться в биективности г, выберем в У и У* двойствен­
ные базисы У = (ei , ... , еп), У* = (е1, ... ,еп). Тогда
£еДег) = еДеД = <%.
Апеллируя к доказательству теоремы 1, мы видим, что справедливо
равенство У** = (sei,£e2, ... , £ета)> т.е. (sej) — базис в У**, двой­
ственный к (ег). Сюръективность и инъективность г теперь оче­
видны.
§ 3. Двойственное пространство 37

Каноничность изоморфизма г заключена в его определении. □


О п р е д е л е н и е 4. Свойство векторных пространств, выражен­
ное в наличии естественного изоморфизма между У и У**, называ­
ется рефлексивностью.
Рефлексивность делает пространства У и У** совершенно равно­
правными. Отождествив У** с У посредством естественного изомор­
физма г из теоремы 2, мы можем считать У пространством линей­
ных функций на У* и придать новый смысл формулам спаривания
(3): х(/) = ( / , х) = /(х). В частности, для всякого базиса в У* су­
ществует однозначно определённый двойственный ему базис в У.
4. Критерии линейной независимости. Используя понятие
двойственного пространства У*, удобно формулировать различные
критерии линейной независимости векторов пространства У. Вна­
чале доказывается
Л е м м а 1. Если a i , ..., аш — линейно зависимые векторы из У,
a / i , . .., fm — произвольные линейные функции на У, то
d e t ( /i (ai )) = 0, 1
{%— номер строки, j — номер столбца).
Д о к а з а т е л ь с т в о . В силу линейной зависимости векторов
a i , ..., am один из них, скажем, а ш , является линейной комбинацией
остальных (теорема 1 из § 2). Пусть а т = ада! + . . . + a m_ i a m_ i.
В определителе det(/f(aj)) вычтем из последнего столбца первый,
умноженный на ад, второй, умноженный на « 2, и, наконец, (ш —1)-й,
умноженный на а ш- \. Мы знаем, что при этих преобразованиях ве­
личина определителя не изменится. Вместе с тем на г-м месте послед­
него столбца будет стоять / Д а ш ) - а д / Д а ^ - . . . - a m- i / i ( a m- i ) =
= fi (am « ia i ... «га —1ага—1) = fi (0) = 0, i — 1,2 , . . . , Ш.
Поэтому определитель равен нулю. □
Л е м м а 2. £У/ш ( / i , . . . , / n) — базис пространства У*, двой­
ственного к У, то векторы a i , . .., an Е У будут независимы тогда
и только тогда, когда
d e t ( /i (ai )) ф 0,

Д о к а з а т е л ь с т в о . По лемме 1 линейная зависимость векто­


ров a i , . . . , a n влечёт равенство определителя нулю. Пусть теперь
они линейно независимы, так что У = ( ai , . .., ап). Обозначим через
(ei, . . . , еп)базис в У, двойственный к ( Д , . . . , / п), а через a±j, . . . , a nj-
— координаты вектора aj в этом базисе. Тогда
OL11 «12 «1п

«21 «22 «2п

«п1 «п2 «пп

будет матрицей перехода от базиса ( e i , . . . , еп) к ( a i , . . . , а п ). По


38 Г л. 1. Пространства и формы

теореме 4 из § 2 она обратима и, следовательно, det(a^) ф 0. Но


= Д(аД (см. (4)), откуда и следует, что беДД(аД) ф 0. □
Т е о р е м а 3. Пусть (Д , . . . , / п) — базис пространства V *, двой­
ственного к V. Тогда ранг системы векторов a i , ..., G V равен
наибольшему порядку отличного от нуля определителя вида
d et(/i(ai )), (5)
1 ^ i = i i , . .., im ^ щ 1 ^ j — jl j • • • 5 jm ^
Д о к а з а т е л ь с т в о . Обозначим через г ранг системы векторов
a i , ..., а&. Любые т > г векторов а ^ , . . . , aJm линейно зависимы и,
значит, по лемме 1 любой определитель вида (5) порядка т > г равен
нулю.
Остаётся доказать, что существует определитель (5) порядка г,
отличный от нуля. С этой целью обозначим через Д , . . . , / п ограни­
чения линейных функций Д , . . . , f n на подпространство U = (ai,...
...,а/Д. Докажем сначала, что
<7ъ---, in) = и*, (6)
где U* — подпространство, двойственное к U.
В самом деле, включение ( Д , . . . , f n ) Я U* очевидно. Пусть, да­
лее, / — любой вектор из [/*, (ei , . .., ег) — базис в [/, a (ei , . .., ег;
er_|_i,. . . ,еп)— его дополнение до базиса в V. Рассмотрим линейную
функцию / <Е У*, для которой / (еД = /(ei), г = 1 /(ei) =
= 0 , г = г + 1, . . . , п (существует функция / G У* с любыми, а сле­
довательно, и с этими значениями). Так как У* = ( Д , . . . , / п), то
/ = Д Д + . . . + Дп/п- Ограничим в этом равенстве все функции на U.
Очевидно, f = f \ v = /, поскольку / и / принимают одинаковые зна­
чения на базисных векторах e i , ..., е г пространства U. Таким обра-
зом, / = / =_Pifi +_■ ■■+ Pnfn, откуда следует, что / € (/ь
т. е. £/* С ( Д , . . . , / п ). Тем самым равенство (6) доказано.
Выберем, наконец, г линейно независимых векторов как среди
ai, . . . , а* (пусть ими будут , . . . , air), так и среди /i, . . . , (пусть
ими будут f h , . . . , fir ). Они составляют базисы в соответствующих
подпространствах £/, £/* и по лемме 2
det (/j(aj)) ф 0 , г= гг; j = j 1 , . . . , j r.
Остаётся заметить, что Д(аД = Д(аД. □
Мы снова подошли вплотную к понятию ранга матрицы (см. [ВА I,
гл. 2 , § 2]), но останавливаться ещё раз на его свойствах не имеет
смысла.
5. Геометрическая интерпретация решении Л ОС. Напом­
ним, что линейная однородная система (ЛОС) с п неизвестными
совместна, а если интерпретировать её решения как векторы про­
странства Яп строк (или столбцов) над основным полем Я (что мы
§ 3. Двойственное пространство 39

и делали), то в &п выделяется подпространство U решений нашей


системы. Встанем на несколько более абстрактную точку зрения. По
своему определению Л ОС размера т х п записывается коротко в виде
/l(x ) = 0 , / т (х) = 0 , (7)
где х — вектор n-мерного пространства У, а Д , . . . , f m Е У*. Чтобы
вернуться к обычной записи, достаточно выбрать в У какой-нибудь
базис.
Т е о р е м а 4. i) Если ранг системы Д , . . . , / ш Е У* равен г, то
размерность пространства U С V решений ЛОС (7) равна п — г
(■п = dim^y).
ii) Любое подпространство U С У является пространством ре­
шений некоторой системы (6).
Д о к а з а т е л ь с т в о . Утверждение i) было доказано в [ВА I, гл. 2,
§ 3], но теперь соответствующие рассуждения будут восприниматься
более естественно. Итак, без ограничения общности считаем линейно
независимыми векторы Д , . . . , Д. Тогда остальные Д будут их ли­
нейными комбинациями, а система (7) на самом деле равносильна
системе
Л(х) = 0 , ..., Д(х) = 0 . (У)
Дополним Д , . . . , f r до базиса (е1, ..., еп) пространства У*(ег = Д
при г ^ г). Пусть (ei, . . . , еп)— базис в У, двойственный к (е1, . . . , еп).
Тогда при любом х = a^ei + ... + х пеп система (7') принимает
вид х\ — ... = х г = 0. Следовательно, пространство решений U
системы (7') состоит из векторов х = x r+ier+i + ... + х пеп, т.е.
U = (er_|_i,. .., еп).Заметим, что жг+ 1, ..., х п играют роль свободных
неизвестных. Так как er+ i , . .., еп линейно независимы, то dim У =
— п —г.
и) Пусть ( e i , . . . , e s) — базис подпространства U С У, являю­
щийся частью базиса (ei , . .., еп) всего пространства У. Вектор х =
= аде!+ .. .+ хпеп в точности тогда принадлежит У, когда х 8+\ = ...
... = х п = 0. Выберем в У* базис ( Д , ..., / п), двойственный к ( ei , ...
. . . , е п). Тогда Х{ — Д(ж), и условие х Е U записывается в виде
f s + l(x ) = 0 , jfn (x ) = 0 . □

УПРАЖНЕНИЯ

1. К а к легко в ы т е к а е т из определения (см. упр. 1 из § 1), ф ункц ия следа


t r : X I—» tr X линейна на п р о стр ан ств е V = М п (Я) всех к в ад р ат н ы х м атри ц
п о р яд ка п над полем Я. Д о к а за ть , ч т о к аж д а я линейная ф ункц ия / на V им еет
вид f ( X ) = t r А Х , причём м ат р и ц а А = A f однозначно определена.
2. П усть a( t ) — ф иксированны й многочлен из КМ, Р п — п о д п ростран ство
вещ ественны х многочленов степени <С п — 1. Р ассм о тр и м следующие ф ункции
на Р п :

а) /(и) = / : a( t ) u ( t ) dt, u ( t ) e p„;


40 Г л. 1. Пространства и формы

a(t) u( t 2) dt ;

a(t) [u(t)]2 dt ;

r| № I = » L . - , - .
К ак и е из эти х ф ункций линейны на Рп 1
3. П усть У — в екторное п ро стр ан ств о , и п усть ф ункции / , д Е У* так овы ,
ч т о К е г / = Кегд. Д о к а за ть , ч т о т о гд а д = Л / для н ек оторого скал яра Л.
4. П усть х — ненулевой в ек то р п р о с тр а н с тв а У. О днозначно ли определяется
ф ункц ия / Е У* условием / ( х ) = 1?
5. Д о к а за ть , ч т о для всякой ненулевой линейной ф ункции / на п-м ерном
векторном п р о стр ан ств е У над Я най дётся базис ( e i , . . . , e n ) п р о с тр а н с тв а У
такой , что
f ( a 1e 1 + . . . + a n e n ) = ai Vai Е Я.

§ 4. Б и л ин ей ны е и к в адр ати ч н ы е ф о р м ы
1. Полилинейные отображения. При первом чтении этот
пункт можно опустить. Понятие ковектора (линейной функции на
V ), уже проявившее свою работоспособность, допускает далеко иду­
щее обобщение.
Рассмотрим векторные пространства V\ , . . . , Vp; U над Я. Отобра­
жение
/ : V! х V2 х ... х Vp -> U
называется полилинейным (в данном случае р-линейным, если для
каждого индекса i = 1,... и для любых фиксированных векторов
aj G Vj, 1 ^ j ^ р, j Ф г, отображение
/г : V / ( а 1 , . . . , а г - 1 , V, а г+ 1, . . . , а р )

является линейной формой (линейной функцией), т.е.


/г(ах + /Зу) = аД(х) + /3fi(y) Vx , y € Vi, а, / ЗеЯ. (1)
Изучение линейных отображений вида (1) мы продолжим в гл. 2,
сейчас же сделаем только одно общее замечание. Как и в случае
линейных функций, нетрудно убедиться в том, что линейная ком­
бинация a f + f3g двух р-линейных отображений снова является р-
линейным отображением. Это обстоятельство позволяет рассматри­
вать множество £(Vi, . .., Vp; U) всех р-линейных отображений
V\ х ... х Vp —>• U как векторное пространство над Я.
Мы получим простейший пример, взяв V± = V2 = ... = Vp = U =
= Я (одномерные векторные пространства) и положив
f(Vl,---,Vp) =V\...Vp.
Более общо: любое полилинейное отображение V\ х ... х Vp в Я
называется полилинейной формой на V\ х ... х Vp. Если, скажем,
§ 4 • Билинейные и квадратичные формы 41

1 г : Vi i->- P(vi), i = 1, . . . , р, — какие-то линейные функции на Vi,


то функция / , определённая соотношением
/ ( v i , . . . , v p) =Z1(vi). .. F(vp),
будет полилинейной формой на Vi х ... х Vp. Она называется тен­
зорным произведением линейных функций (форм) У , . .., 1Р и обозна­
чается / = I1 0 I2 (8) ... 0 1Р или просто I1 ! 2 .. Лр (порядок существен).
Можно доказать, что произвольная полилинейная форма на
Vi х ... х Vp является суммой тензорных произведений линейных
форм, но пока этот факт нам не понадобится. При V\ —. . . = Vp = V
полагаем Vp = V х ... х V (декартово произведение р экземпляров
множества У). В этом случае удобным является обозначение
cp(y,a) = £(y,...,v-,&).
Полилинейная форма / на У х V*q будет впоследствии названа нами
тензором типа (р, q) и валентности р + q. То, что тензоры типа (0,1)
можно считать векторами из V , есть следствие отмеченного в § 3,
и. 3 свойства рефлексивности.
Полилинейная форма / на V p (тензор типа (р, 0)) называется сим­
метричной, если
/ ( v w(l),Vff(2), . . . , Vw(p)) = / ( v b v2, . . . , v p)
для любых Vi,..., vp G V и для любой перестановки тг Е Sp. Если же
/ ( v w(l), УЦ2), • • • , vw(p)) = £w/( v b V2, • • • , Vp),
где втт — чётность перестановки, то / называется ко со симметрич­
ной (или знакопеременной) формой. В случае dim У = р мы знаем
хороший пример кососимметричной формы — это определитель ма­
трицы А , рассматриваемый как функция её строк или столбцов.
Цель данных здесь общих определений заключается лишь в том,
чтобы уложить в общую схему все частные понятия, с которыми мы
уже встречались и которые нам еще предстоит изучить. Тензорными
обозначениями в общем виде мы воспользуемся лишь в гл. 6 .
2. Билинейные формы. Мы ограничимся пока случаем V\ —
— У2 = У и будем говорить о билинейной (р = 2) форме / на У (а
не на V 2, что было бы более правильным). В соответствии с общим
определением, билинейная форма / на векторном пространстве У над
Я характеризуется свойствами
f( a u + 0v,w) = af(u,w) +/3/(v,w),
f(w, mi + /3v) = af(w, u) + f3f(w, v)
для всех u, v, w E У, a, f3 E Я. Заметим, что, вообще говоря, /(u , v) ф
T^/(V,U).
Выбрав в У некоторый базис (ei , . .., еп) и выразив х, у G У через
их координаты
х = Xiei + ... + хпеп, У — У1е 1 + • • • + Уп^т
42 Г л. 1. Пространства и формы

мы используем определяющие свойства (2) для записи значения /(u , v)


формы / через п 2 скаляров /(е ^ е Д . Именно,

/ (х, у) = / ( Е У ^ Е ^ ' Д = =
i 3 i 3
= Е У Е % /( е ь e i) = E ( 3)
i 3 hj
где f i j = f ( e iy ej).
Матрица F = (fij) называется матрицей билинейной формы f
на У в базисе ( e i , . . . , e n). Введя в рассмотрение координатную
п х 1-матрицу (столбец) X = [х\,Х2 , ... ,х п\ и транспонированную с
ней координатную 1 х n-матрицу (строку) lX — (х\,Х 2 , ... , х п), мы
перепишем выражение (3) в виде
/ (х, у) = lX - F - Y . (4)
Для этого нужно лишь воспользоваться известными правилами умно­
жения матриц размеров l x n , n x n , n x l .
Обратно, имея квадратную матрицу F = (fij), мы при помощи
соотношения (4) (или (3)) определим на У билинейную форму / , по­
лагая /(е^, ej) = fij. Таким образом, при заданном базисе (ei,...,еп)
векторного пространства над Я имеется взаимно однозначное соот­
ветствие между квадратными п х n-матрицами над Я и билинейными
формами на У (п = сЙт^У). Это соответствие является на самом
деле изоморфизмом векторного пространства £2 (У, Я) всех билиней­
ных форм У х У —>• Я (если / , д е £ 2 (У,Я), то и a f + /Зд е £ 2 (У,Я);
проверка очевидна) на векторное пространство Мп(Я) всех квадрат­
ных матриц порядка п над Я. Действительно, если
/(х, у) = lXFY, д ( х , у ) = гХО¥,
ТО

а /(х , у) + Рд(х., у) = *Х • (aF + /3G) ■Y.


3. Закон изменения матрицы билинейной формы. Акси­
оматическое определение билинейной формы / свойствами (2) сво­
бодно от выбора какого бы то ни было базиса в У. Чтобы матрич­
ная запись / имела реальную ценность, нужно соответствие / i—у
I-» F дополнить правилом изменения матрицы F при переходе к но­
вому базису. Пусть наряду с (ei,... ,еп) в У задан еще один базис
(еД,..., е'п) вместе с матрицей перехода А = (а*Д:
п
e'j = ' ^ 2 a ije i , j = l,...,n.
2=1

Если х\е\ + ... + х пеп = х = аДеД + ... + х'пе'п, то координатные


столбцы X и X ' связаны соотношением X = А • X '. Пусть теперь
§ 4 • Билинейные и квадратичные формы 43

F = ( f i j ) — матрица билинейной формы / в базисе (еД, a F' = (/Д)


— матрица той же формы / в базисе (е'Д, т.е. fij = /(е^еД и /Д =
= /(еДе'-). Так как 1 (АХ') = • М и так как значение /(х,у)
вообще не зависит от выбора базиса, то
• F' -Y' = /(х , у) = гХ • F - Y =
= \ А Х ' ) • F • (ДУ') = 1 Х' • 1 A - F - A - Y ' .
Сравнивал левую и правую части этого равенства, мы приходим
к заключению, что имеет место
Т е о р е м а 1. Матрицы F и F' билинейной формы / на V в ба­
зисах (еД и (е'г) связаны соотношением
F' = 1 A - F - А, (5)
где А — матрица перехода от (еД к (е'г).
О п р е д е л е н и е 1. Матрицы F и F ' = 1A F А с detA ф 0 называ­
ются конгруэнтными. Рангом билинейной формы / называется ранг
соответствующей ей в каком-нибудь базисе (еД матрицы F.
С л е д с т в и е . Ранг r ank/ билинейной формы / является её ин­
вариантом, не зависящим от выбора базиса.
Д о к а з а т е л ь с т в о . Применить следствие 1 теоремы 5 из [ВА I,
гл. 3, § 3] к конгруэнтным матрицам (5). □
Утверждение о ранге билинейной формы можно доказать ещё
и так. Обозначим через L f множество тех х Е V, для которых
/(х , у) = 0 при всех у G V . Короче: /(х , V ) = 0. Очевидная проверка
показывает, что L f — подпространство в V. Его называют левым
радикалом или ядром формы /. Ясно, что dim L f — величина, зави­
сящая только от /. Пусть (ei , . .., еп ) — базис в V. Условие х Е L f
равносильно тому, что
/(x,ei) = 0, /(х,е„)= 0.
Эта система уравнений определяется линейными функциями х н->>
^ fj (х) = Дх, ej) = 0, j = 1 ,..., п.
Координатами функций f j являются скаляры /ДеД, т.е. коэф­
фициенты f(ei,ej) = fij i-й строки матрицы F. Стало быть, ранг
системы линейных форм Д , ..., / п Е У* совпадает с рангом матрицы
F = (fij), и если он равен г, то по теореме 7 из [ВА I, гл. 2, § 3] имеет
место равенство dim Lf = п —г. Другими словами,
г = dim V —dim L f
— величина, не зависящая от какого бы то ни было базиса.
4. Симметричные и кососимметричные формы. В соот­
ветствии с и. 1 билинейная форма / : V х V —> А называется сим­
метричной, когда /(х , у) = / ( у,х) для всех х, у Е V, и кососимме­
тричной, когда /(х , у) = —/ ( у,х). Эта терминология хорошо согла­
суется с понятиями симметричных и кососимметричных многочле­
нов (см. [ВА I]), а также симметричной матрицы А = (а^), когда
44 Г л. 1. Пространства и формы

1А = А, и ко со симметричной, когда 1А — —А. Так как / ( у,х) =


= ^/( у >х) (транспонирование 1 х 1-матрицы, т.е. скаляра), то из
/(х, у) = е/(у,х), г = =Ь1, в соответствии с соотношением (4)
следует
fX ■F ■Y = /(х , у) = е/(у ,х ) = г • 4/(у, х) =
= е • * ( Т ■F ■X ) = е ■1Х ■fF -Y,
откуда = sF. Обратно: если = sF, е = ±1, то билинейная
форма / , отвечающая матрице Т, будет удовлетворять соотношению
/ (х, у) = е/(у ,х ).
Остаётся еще добавить, что согласно (5)
F' = 1 A* F • А = > tF 1 — 1 A ' lF ' А — е ' fA - F - A = sF 1,
поэтому свойство симметричности или кососимметричности мат­
рицы F для / не зависит от выбора базиса. Таким образом, билиней­
ная форма / симметрична или кососимметрична в точности тогда,
когда её матрица F относительно любого базиса в V симметрична
или соответственно кососимметрична.
Т е о р е м а 2. Если char Я ф 2, то пространство £2 (И, Л) всех
билинейных форм является прямой суммой
С2 (V, Я) = C t (V, Я) 0 (V, Я)
подпространств £ЦУ,Й), £ДУ,Й) симметричных и кососиммст-
ричных билинейных форм.
Д о к а з а т е л ь с т в о . Если / Е С2 (V, Я) П С^ (V, Я), то
/(X, у) = /(у, х) = -/(X , у) = > 2/(х , у) = 0 = > /(х , у) = О
(поскольку по условию char Л 7^ 2), откуда / = 0. Следовательно,
сумма ^ 2~ + £ 2 прямая.
С другой стороны, соотношение

/ < Х у ) = ^ { / ( х >у) + / ( у , х)} + ^{/ ( х, у) - / ( у , х ) }


или соответствующее матричное соотношение
F = i ( F + lF) + i ( F - 4F)
показывает, что всякая билинейная форма / представляется в виде
суммы симметричной и кососимметричной форм. □
Над Я — Z^ каждая кососимметричная матрица симметрична, и
поэтому утверждение теоремы перестаёт быть верным, поскольку,
например, матрица ( q| ) не является симметричной. Имеется ещё
понятие знакопеременной билинейной формы /: /(и , и) = 0 Vu Е V,
которое, однако, при char Я ф 2 совпадает с понятием кососимме­
тричной формы (проверьте это). В дальнейшем предполагается, что
char Я ф 2.
§ 4 • Билинейные и квадратичные формы 45

5. Квадратичные формы. Рассмотрение симметричных би­


линейных форм приводит к следующему важному понятию, которое
естественным образом возникает в разных разделах математики.
О п р е д е л е н и е 2 . Квадратичной формой на конечномерном век­
торном пространстве V над Я называется функция q : V Я, обла­
дающая двумя свойствами:
i) q(~v) = q(v) V v e V ;
ii) отображение / : V x V —>• Я, определённое формулой

f(x, y) = ±{q(x + y ) - q ( x ) - q ( y ) } , (6)


является билинейной формой на V (очевидно, симметричной). Её
ранг называется также рангом q: rankg = rank/.
Говорят ещё, что симметричная билинейная форма / , определён­
ная формулой (1), получается из q поляризацией или что / — би­
линейная форма, полярная к квадратичной форме q.
Пусть теперь / — произвольная симметричная билинейная форма
на V . Положив
9/(х ) = /(х,х), (7)
мы получим функцию qf : V —>Я, удовлетворяющую условиям i), ii)
в определении квадратичной формы, поскольку / ( —х, —х) = /(х, х)
и
/ ( X , У) = \ { / ( X + у, х + у) - / ( х , х) - Д у , у ) }. (8)

Можно подумать, что qf — какая-то особая квадратичная форма.


На самом деле это не так, поскольку справедлива следующая теорема
(её несложное доказательство можно опустить без ущерба для пони­
мания дальнейшего).
Т е о р е м а 3. Каждая квадратичная форма q однозначно восста­
навливается по своей полярной форме /; другими словами, q — q f.
Д о к а з а т е л ь с т в о . Положим в (6) у = —х:

- / ( х , х ) = ^{</(0) - g(x) - q{ х)},


отсюда z
<?(х) = Д х ,х ) + ^д(О).

Так как / — билинейная форма, то /(0,0) = 0. Поэтому при х = 0


имеем д(0) = ^ДО), т.е. ДО) = 0. Значит, q(x) = /(х,х). □
О п р е д е л е н и е 3. Матрицей квадратичной формы q — qf отно­
сительно базиса (ei , ... , еп) пространства V называется матрица F
билинейной формы / , полярной к q.
Стало быть, F = (/ij), где

fij = + e i ) ~ <l(e i ) ~ q ( e j ) } y i , j = 1,2


46 Г л. 1. Пространства и формы

Любой симметричной матрице F = (ДД в свою очередь отвечает


квадратичная форма q, заданная соотношением
д ( х ) = * Х - Р - Х = ^1 ц Х гХ 1 . (9)
ьз
Таким образом, в соответствии с названием квадратичная форма
суть однородная квадратичная функция координат х \ , . . . , х п век­
тора х = х±е± + ... + х пеп. Заслуживает быть особо отмеченным
случай диагональной матрицы F.
О п р е д е л е н и е 4. Говорят, что квадратичная форма q имеет в
базисе (ei,...,en) пространства У канонический или диагональный
вид, если для каждого вектора х = ^ Е У значение q(x) вы­
числяется по формуле

= ^ 2 к х1 -
i

Базис (ei) при этом называется каноническим базисом для q.


Та же терминология относится и к соответствующей полярной
билинейной форме /:
/ ( х , у) = ^2 fiiXiVi.
г
Не требуется, чтобы канонический вид квадратичной формы или её
канонический базис определялись однозначно. Скажем, при произ­
вольной перестановке векторов канонического базиса вновь получа­
ется канонический базис.
Заметим, что в каноническом виде rank qf = rank / есть просто
число отличных от нуля коэффициентов фц. Вместе с тем согласно
замечанию в конце и. 3 rankg = dim У —dimLg, где L q = L f —
ядро (радикал) формы / (левое или правое — безразлично ввиду
симметричности /). Подпространство L q С У, называемое также
изотропным (или нулевым) подпространством квадратичной формы
д, в терминах q определяется так:
L q = {и е V \ q(и + v) = g(u) + q(v) Vv Е У}.
Ранг формы q — величина инвариантная.
6. Канонический вид квадратичной формы. Вопрос о воз­
можности выбора базиса, в котором данная форма принимала бы
наиболее простой вид (а таковым является канонический вид), имеет
важное теоретическое и прикладное значение.
Т е о р е м а 4. Для всякой симметричной билинейной формы / на
V существует канонический базис.
Д о к а з а т е л ь с т в о . При п = 1 утверждение очевидно, поэтому
можно использовать индукцию по п. Если /(х, у) = 0 для всех х,у Е
Е У (т.е. / = 0), то теорема очевидна: любой базис годится. Если же
§ 4 • Билинейные и квадратичные формы 47

f Ф 0 , то отлична от нуля и соответствующая квадратичная форма


(равенства (6), (8) или теорема 3). Пусть ei — такой вектор, что
/(еi,ei) = q(ei) ф 0. Тогда линейная функция Д: х и /(х,еi) от­
лична от нуля (/i(ei) ф 0). По теореме 4 из § 3 линейное подпро­
странство
L = Ker/i = {х е V\ Л(х) = 0}
имеет размерность п — 1, т.е. является гиперплоскостью. По пред­
положению индукции L обладает базисом (в2, . .., еп),в котором ма­
трица формы / , ограниченной на L, диагональна, т.е.
/ ( е *> e j ) = 0 при i,j = 2,...,n.

Так как по построению /(е^, еi) = 0, г = 2, 3,..., гг, то мы получаем


свойства /(ef,ej) = 0 , г ф j, характеризующие канонический базис
(е/.), если только система векторов ei, в2, . .., еп линейно независима.
Предположив противное, мы в любом соотношении
оде1 + (^2^2 + ... + апеп = 0
имели бы коэффициент ад 7^ 0, поскольку (в2, ... , еп) — базис в L.
Но в таком случае ei = и
о ф/ l ( e i ) = /1 А е г) = =0
г>1 г>1
— противоречие, доказывающее теорему. □
С л е д с т в и е 1. Пусть на векторном пространстве V размерно­
сти п над полем Я задана квадратичная форма q ранга г ^ п. Тогда
в V существует базис (е^), в котором q принимает канонический
вид
q(x) = \ i x \ + \ i x \ + ... + \ rx\. (10)

С л е д с т в и е 2. Для любой симметричной матрицы F сущест­


вует невырожденная матрица А такая, что 1 A F А — диагональная
матрица того же ранга, что и F. Другими словами, всякая симмет­
ричная матрица конгруэнтна диагональной.
Рассмотренный выше индуктивный способ приведения билиней­
ной (а следовательно, и квадратичной) формы к каноническому виду
принадлежит Лагранжу (1736-1813). Естественно, что на практике
его применяют в координатной записи, действуя несколько в ином
порядке. Исходя из выражения (9) квадратичной формы д(х), интер­
претируемой как однородный многочлен степени 2 от п независимых
переменных
п
q(xi, ■. . , х п) := q(x) = ^ 2 fa x ixi >
bj = l
будем избавляться от смешанных членов X{Xj, i ф j, древневавилон­
ским методом дополнения до полного квадрата. Выделим все члены,
48 Г л. 1. Пространства и формы

содержащие координату х \ :
q ( x х п) =
= /и Д + 2/12 Х1 Х2 + 2/13 Х1 Х3 + ... + 2/i„ х \ х п +
Д/ 2^27
ьзФ1
(визуально мы имеем суммы типа fijX\Xj + fjiXjXi, но fji = /ij,
поэтому возникают удвоенные произведения). Предположим сначала,
что /ц ф 0 , и за счёт коэффициентов при членах, не содержащих яд,
выделим полный квадрат:

q{x 1, . . . , Жп) = —— (/цЖ 1 + / 12^2 + . . . + flnXn )2 + /ij %iXj.


hl г,т
Полагая теперь
Д = /цЖ 1 + / 12Ж2 + . . . + flnXn, x 'i = X i, i > 1,
мы приведём форму q к виду

g(arb . . . , x„) = - / ( Д ) 2 + </ ( Д, . . . , Д ) ,


/11
где qf(xf2, ... ,х'п) = YU j =2 /^ж'ж'- — квадратичная форма от мень­
шего числа переменных. Считая /22 7^ 0, перепишем её в виде

д' ( Д, . . . , х'п) = Д 2 ж'2 + /23 Д Д + ■■■ + й п x Wn + fij Д Д =


i,j>2

- 77- (/Д д + Дз д + • • • + /Д Д )2 + Е /ij д д


-' 22 *,i>2
(переход от /к к обусловлен выделением нового полного ква­
драта). Очередная замена переменных
Ж-, = X 15 х 2 — /22^ 2 4" /23^3 + •••+ /2 ж, = ад г > 2,
даст нам выражение

д(х) = 2 - ( Д ) 2 + 2 - ( Д ') 2 + д"(Д, ■■•, Д ),


/И /22
где д"(жз, . . . , ж") = X ^ j =3 flj х"х" — форма от ещё меньшего числа
переменных.
Этот процесс, очевидно, продолжаем до канонической записи д(х)
в виде линейной комбинации г = rankg квадратов. Производимые по
ходу дела замены переменных невырожденны и отвечают переходам
к новым базисам. Следует сделать только одно замечание. Ограни­
чительные, на первый взгляд, предположения /ц ф 0, j 22 ф 0,...
таковыми не являются. Если /ц = 0 , но fkk Ф 0 для некоторого
к, то достаточно поменять нумерацию переменных Ж1,жи (или, что
§ 4 • Билинейные и квадратичные формы 49

то же самое, иначе занумеровать базисные векторы). Если, однако,


q(x) ф 0 не содержит ни одного квадрата, т.е. fkk — 0 для всех к,
то без ограничения общности можно считать, что 2 f 12 X1 X2 ф 0, а в
таком случае следует воспользоваться заменой
Х\ — х[ + # 2, Х2 — х[ —# 2, ^ к —х'к, к > 2.
Возникнет несократимое слагаемое 2/12 (V^ —ж'^), дающее возмож­
ность начать наш процесс.
7. Вещественные квадратичные формы. Действуя над про­
извольным полем Я (с ограничением char Я ф 2), мы не можем, во­
обще говоря, приводить диагональные квадратичные формы к ещё
более простому виду. Если, однако, Я = Е, то все коэффициенты в
(10) мы можем сделать равными =Ы. Действительно, при соответ­
ствующей перестановке базисных векторов мы имеем право считать
первые s коэффициентов Ai,...,As формы (10) положительными, а
остальные отрицательными. При замене координат
х\ — л/А“ • Xi, 1 ^ i ^ s; х\ — \ / —\ i • Xi, s + 1 ^ i ^ г;
х\ — ж*, г + 1 ^ i ^ п,
получим q(x) = E i= i(x d 2 - E [= i0 4 )2-
О п р е д е л е н и е 5. Еоворят, что квадратичная форма д, значения
которой вычисляются по формуле
q(x) = х \ + ... + Д - x 2s +1 - ... - x 2r, (11)
имеет нормальный вид.
Только что проведенное рассуждение показывает, что в случае
Я = Е справедлив более сильный вариант следствия 1 теоремы 4.
С л е д с т в и е 1'. Всякая квадратичная форма q на вещественном
векторном пространстве V приводится к нормальному виду.
Кроме ранга г у квадратичной формы q на векторном простран­
стве V над Е появилась еще одна числовая характеристика — коли­
чество s коэффициентов 1 в её нормальном виде. Оказывается, что
число s также не зависит от способа приведения q к нормальному
виду.
Т е о р е м а 5 (закон инерции). Пусть q — квадратичная форма
на п-мерном векторном пространстве V над Е. Тогда целые числа
г и s, s ^ г ^ п, входящие в нормальный вид (11), зависят только
от q.
Д о к а з а т е л ь с т в о . Инвариантность г нам известна, так что
нужно лишь убедиться в инвариантности (независимости от выбора
канонического базиса) числа s. Предположим, что в каком-то другом
базисе (еД,...,е'п) форма q имеет нормальный вид
д(х) = (Д )2 + ... + (Д )2 - (Д+1)2 - ... - (Д )2 (11')
4 А .И. К о стр и к и н
50 Г л. 1. Пространства и формы

с t положительными членами (х = Y^i=i x iei ~ Y^i=i x ie'i)• При t ф s


без ограничения общности считаем t < s.
Рассмотрим в V подпространства
L = (еъ •••5 5 L = (е t+i-> • • • 1 е п)к •
Так как dim (L + L') ^ dim V ^ п, то по теореме б из § 2 имеем
dim (L П L') = dim L + dim L' —dim (L + L') ф
^ s + (n —t ) —n = s —t > 0.
Стало быть, существует ненулевой вектор а Е (L П L'):
О / а = a i e i + . . . + ase s = a^+ 1 e ^ + i + . . . + a'ne rn.
Согласно (11)
g(a) = a j + . . . + a2
s >0.
В то же время согласно (11')
4(а) = - К +1)2 - . . . - ( < ) 2 0
(возможно, что г < n, aj+1 — ... — а'г — 0). Полученное противоречие
устраняется только в случае s = t. □
Ввиду теоремы 5 для числовых инвариантов формы использу­
ются специальные термины.
О п р е д е л е н и е 6. Ранг вещественной квадратичной формы на­
зывается также её индексом инерции, число s — положительным
индексом инерции, число г —s — отрицательным индексом инерции.
Под сигнатурой формы понимают либо пару (s, г —s), либо разность
2 s — г между числом положительных и числом отрицательных ква­
дратов.
Закон инерции квадратичной формы, приписываемый Дж. Силь­
вестру (1814-1897), ведет свое происхождение из механики. Оче­
видно, что для комплексной квадратичной формы д: У — С понятие
положительного или отрицательного индекса инерции теряет смысл,
поскольку ненулевые коэффициенты в её диагональном виде (10)
можно тогда сделать все равными 1 или все равными —1.
8. Положительно определённые формы и матрицы. Пусть
снова V — вещественное векторное пространство. Квадратичная
форма q на V называется невырожденной, если rankg = dim^K;
другими словами, её индекс инерции совпадает с размерностью про­
странства.
О п р е д е л е н и е 7. Невырожденная квадратичная форма q : V —>
—> Е называется положительно (соответственно отрицательно)
определённой или просто положительной (отрицательной), когда
д(х) > 0 (q(x) < 0) для любого вектора х / 0. Форма q называет­
ся положительно полуопределённой (или неотрицательной), если
q(x) ^ 0 для всех х Е V. Наконец, форма q неопределённая, если
она принимает как положительные, так и отрицательные значения.
§ 4 • Билинейные и квадратичные формы 51

Важно заметить, что эти понятия не связаны с выбором базиса.


Соответствующими нормальными формами от п = dim^V являются:
х \ + х \ + ••• + в случае положительной определённости;
—х \ —х \ —... —х 2п в случае отрицательной определённости;
х \ + х \ + ... + г ^ п, в случае положительной полуопределён-
ности;
г > s > 0 (см. (11)) в случае неопределённости.
Записанная в каноническом базисе (е*) вещественная квадратич­
ная форма q(x) = Х\х\ + А2Ж2 + ... + Апж^, очевидно, положительно
определена тогда и только тогда, когда все коэффициенты Ai больше
нуля: достаточно заметить, что Ai = д(е^).
Билинейная форма, полярная к положительно определённой ква­
дратичной форме, также называется положительно определённой.
Аналогичная терминология переносится на матрицы. Например, ве­
щественная симметричная матрица F называется положительно
определённой, если F соответствует положительно определённой ква­
дратичной форме. Но положительно определённой форме в ее нор­
мальном виде отвечает единичная матрица, поэтому, согласно след­
ствию 2 теоремы 4 имеет место
Т е о р е м а 6. Любая положительно определённая матрица F
имеет вид
F = 1А • А, (12)
где А — вещественная невырожденная матрица. Верно и обрат­
ное: всякая вещественная матрица вида (12) положительно опре­
делена.
Часто возникает необходимость непосредственно по матрице ква­
дратичной формы судить о том, является ли она положительно опре­
деленной.
П р и м е р . П усть р ( х , у ) — ди ф ф еренц ируем ая ф ункц ия двух вещ ественны х
перем енны х, допускаю щ ая разлож ение в сходящ ийся ряд Тейлора в ок р естн о сти
н ачала коорди н ат. С имволами р'х , р' обознач аю тся ч астн ы е производны е по х
и у соответствен н о. Т о ч к а (0, 0) п редп ол агается критической (или, к а к еще го ­
в орят, стационарной ), т.е. (/4 (0 ,0 ) = 0 = р'% Д 0 ,0 ), т а к ч т о разлож ение в ряд
Тейлора начи н ается с членов нулевой и в торой степени:

р(х, у) = р ( 0, 0) + ^ { а х 2 + 2 Ьху + су2} + . . .

Здесь а = р х х (0,0), Ь = р " у ( 0 ,0 ), с = </?" (0 ,0 ), а то ч к ам и обозначены члены


более вы сокой степени. В достато ч н о малой о к р естн о сти нуля этим и членами
можно пренебречь, т а к ч т о значение ф ункции р приближ ённо равно к он стан те
р(0, 0) плюс 7^ ( v ) , v = х е \ + y e 2 , где

q(v) = а х 2 + 2 bxy + су2


— к в ад р ат и ч н ая ф о р м а на V = ( e i , е г). В общем случае ra n k q = 2, и если это т а к ,
то к р и ти ч е с к а я т о ч к а (0,0) н азы в ается невырожденной. Если q полож ительно
определена, то, очевидно, р им еет в (0, 0) относительный минимум. Максимум

Т
52 Г л. 1. Пространства и формы

о тв е ч а е т о три ц ател ьн о определённой ф орм е q. Если ж е с и гн ат у р а ф орм ы q р авн а


(1 ,1 ), то в (0,0) н ет ни м иним ум а, ни м аксим ум а, и к р и ти ч еск ая т о ч к а (0,0)
н азы в ается седловой.
Зап и сав q(v) в виде

q(v) = а с 1
Ьа а Ф 0,

или используя аналогичное вы раж ен ие при а = 0, с ф 0, мы видим, ч т о вы полне­


ние неравенств
а Ъ
а > 0,
b с
>0
явл яется достато ч н о п росты м необходимы м и д о стато ч н ы м условием положи­
тельной определённости ф орм ы q и, следовательно, условием сущ ествования ми­
ним ум а ф ункции р в о к р естн о сти н ачала коорди н ат.
В рассмотренные выше неравенства входят определители, анало­
гом которых в n-мерном случае являются так называемые главные
миноры
/п /1 2 ••• flk
/п /1 2 /2 1 /2 2 ••• / 2 /г
Ai —/ц , Д 2 —
/2 1 /2 2

fkl fk2 ••• fkk


(13)
матрицы F = ( f i j ) . Таким образом, Дп = detF. Для удобства по­
ложим еще До = 1. Роль главных миноров хорошо иллюстрируется
одним специальным способом приведения квадратичной формы q к
каноническому виду.
Т е о р е м а 7 (метод Якоби). Пусть q — квадратичная форма
n a V c матрицей F, все главные миноры (13) которой отличны от
нуля.
Тогда существует базис ( е Д , . . . , е'п ) пространства V, в кото­
ром q(x) принимает канонический вид

<КХ) = ^ ( Д )2 + ^ ( Д )2 + .. ----тф-(х'п)2- (14)

Д о к а з а т е л ь с т в о . Пусть ( e i , . . . , e n) — первоначальный ба­


зис пространства V. Рассмотрим (п — 1)-мерное подпространство
L = (ei , ..., en_i). Пусть q = q\L — ограничение q на L. Матрица
F формы q получается из F вычёркиванием последной строки и по­
следнего столбца, поэтому её главными минорами будут A i = Д 1,
Д 2 = Д 2, . .., Дп- i — Д п -ь Все они по условию отличны от нуля.
Рассуждая по индукции относительно п, выберем в L базис, в кото­
ром 5(х), х G I/, принимает вид

g(x) = q(x) = ^ ( Д ) 2 + ... +


ZAi l\ n- 1
§ 4 • Билинейные и квадратичные формы 53

Отразим этот факт в терминах полярной билинейной формы /:


Д«-1
Д е ',е ') = / ( ei’ej) = 0’ 1
Система
/ ( х , е i ) = О,
• > f ( x , e'n-l) = 0; XGV,
из п —1 линейных уравнений с п неизвестными х [ , . . . , х'п обязательно
имеет ненулевое решение в V ; этому решению соответствует х = е^.
Легко видеть, что система (е^, е'2, ..., е^) составляет базис простран­
ства V. Так как вектор определён с точностью до скалярного мно­
жителя, то мы нормируем его условием, чтобы матрица А перехода
от базиса (е^) к (е^) имела определитель
det А = (Дп)-1 = (d etF )-1 .
Пусть F' — матрица формы / в базисе (е'). Тогда /(е',е'-) = 0
при i Ф j и

/(<><) До Д1 Дуг—2
Де'„,е'„) = П / ( Д , е ' ) =
Дп—1 Д1 Д2 Дуг-1

= det F ’ = det ( ЬА ■F ■А) = (det A )2 det F = Т - ,


откуда
Дп—1
Д е»>е») =
Форма д, записанная в базисе (е '), принимает искомый вид (14). □
Легко убедиться в том, что матрица А будет треугольной:
ei = а ц е ь

^2 = ^12в1 + а 22е2,

е п — ^nlei Т &n2e 2 Т • • • Т &пп^П1


но нам этот факт не понадобится.
С л е д с т в и е . Отрицательный индекс инерции квадратичной
формы д(х) = /(х, х) с матрицей F, все главные миноры которой
Д*, 1 ^ i ^ п, отличны от нуля, совпадает с числом перемен зна­
ков в последовательности
1 = До, Д ь . . . , Д п
в частности,
Д 1 > 0, . .., Дп > 0,
т е квадратичная форма q положительно определена.
Сейчас мы увидим, что утверждение следствия обратимо.
54 Г л. 1. Пространства и формы

Т е о р е м а 8 (критерий Сильвестра). Квадратичная форма q


на п-мерном вещественном векторном пространстве V в том и
только том случае является положительно определённой, когда
все главные миноры Ai, Дп её матрицы F = (фц) положи­
тельны.
Д о к а з а т е л ь с т в о . Согласно следствию теоремы 7 неравенства
Ai > 0, i = 1,2,..., гг, обеспечивают положительную определённость
формы q. Для доказательства обратного утверждения, как и в тео­
реме 7, используем индукцию по п, рассматривая ограничение q = q\v
формы q на (п —1)-мерное подпространство U = (ei , ... , en_i) С У =
= (ei , . .., en) ((ei) — базис, в котором q имеет матрицу F ).
_ Понятно, что главными минорами матрицы F формы q будут
Ai = Ai, ..., An_i = Дп_ь Так как мы считаем q положительно
определённой, то таковой будет и форма q. Стало быть, по предпо­
ложению индукции Ai > 0 , . .., An_i > 0. Остаётся показать, что
Дп > 0. Но из теоремы б мы знаем, что F = 1А • А, где А — не­
вырожденная матрица. Поэтому
Дп = det F = d et 1 А • det А = (det А )2 > 0. □
9. Канонический вид кососимметричнои формы. Уделив
основное внимание квадратичным (и заодно билинейным симметрич­
ным) формам, мы обратимся теперь, руководствуясь теоремой 2, к
пространству £^~(У, Я), т.е. к билинейным кососимметричным фор­
мам. Итак, пусть
/(х, у) = -/ (у, х) Vx, у G V.
Как и в случае симметричных форм, радикалом (или ядром) формы
/ назовём подпространство
Vo = Кег/ = {v Е V | /(v, x) = 0 Vx G V } .
Если Vi — любое дополнительное к Vo подпространство в У, то
V = У0 0 Vi,
причём ограничение / | уг будет невырожденной кососимметричной
формой. Действительно, если a G V , а / 0 и / ( a, xi ) = 0 для всех
xi Е У]_, то для любого вектора х = xq + xi Е У (xq Е Уо) имеем
/(а,х) = /(а, х0 + xi) = /(а,х0)+ /(а,хг) = -/(х0,а) = 0
(здесь мы воспользовались кососимметричностью формы), что про­
тиворечит определению Уо.
Тем самым изучение / сведено к случаю невырожденной формы.
Будем с самого начала считать, что / : У х У —у Я — невырожденная
кососимметричная билинейная форма. Пусть
V = (е ь е 2, . . . , е „ ) , х= у =
г 3
§ 4 • Билинейные и квадратичные формы 55

Тогда
п
Д х , у ) = 'Б, f i i xiV3 = t x F Y ,
fij =
Ь3=1
где F = (fij) — кососимметричнал матрица: fF + F = 0. Стало быть,

/ ( х , у) = Е Л/ (•'';•'// - (15)

Из [BA I, гл. 3, § 2] известно, что для определителя кососимме­


тричной матрицы F порядка п справедливо соотношение {1 +
+ (—l)n_1} det F = 0, так что неравенство det F ф 0 (условие невы­
рожденности формы /) возможно лишь при чётных п. Мы получим
этот результат другим способом, причём заодно приведём форму /
к каноническому виду.
С этой целью введём понятие гиперболической (или симплекти-
ческой) плоскости W в V, понимая под W любое двумерное подпро­
странство с условием f\w ф 0. Такое подпространство найдётся хотя
бы потому, что для всякого вектора ф 0 существует вектор е 2 с
/ ( e i, e J>) Ф 0- Умножая е 2' на подходящий скаляр, мы можем считать,
что /(e'i,e^) = 1; разумеется, / (ei , ei ) = 0 = f{e'2 ,e ’2).
Т е о р е м а 9. Пусть V — векторное пространство с заданной
на нём невырожденной ко со симметричной формой / . Тогда dim У =
= 2т u V — прямая сумма т гиперболических плоскостей, попарно
ко со ортогональных друг другу относительно /.
Д о к а з а т е л ь с т в о . Применяем индукцию поп = dimV . В силу
сделанного выше замечания найдётся гиперболическая плоскость
W = (e 'i,e ' 2) С V. Если п > 2, то рассматриваем косоортогоналъное
дополнение
Ж 1 = (х€У|/(е';,х)=0, *= 1,2).
Дополним е^, е 2 до (штрихованного) базиса пространства V . Пусть
V = {е[,е'2, е'„), х = х[е[ + ... + х'пе'п.
Тогда
/(ei, х) = f'12x'2 + f[ 3х'3 + ... + f[ nx'n = 0,
Д е 2>х ) = & 1 Х1 + /2 3Ж3 + • • • + р 2 п х 'п = 0
— линейная система ранга 2, поскольку строки матрицы F линейно
независимы. Значит, пространство решений (e^e^)-1 этой системы
имеет размерность п —2. Так как
<е1)е 2> П ( e i ^ ) - 1 С Ке г / = 0,
то мы получаем разложение
V = (ei,ef>) 0 (ej.e^)1 ,
56 Г л. 1. Пространства и формы

причём ограничение / на (e ^ e ^)-1 является невырожденной косо­


симметричной формой. В таком случае по предположению индукции
(е 1, е 2)^ — чётномерное пространство, являющееся прямой суммой
попарно косоортогональных гиперболических плоскостей. Значит,
п = dim V = 2 т для некоторого целого числа т и V обладает бази­
сом (е") с е" = = е^, таким, что
У = <е", е"> © <е", е"> © . . . © ( е " ^ , е " т >,

/ + Де^, 7e2j-i + ^е 2j) —0 ? * 7^ i?


/ ( e2 i- b e2i) = 1 . □
С л е д с т в и е . Любая невырожденная ко со симметричная матри­
ца F размера 2т х 2т конгруэнтна матрице
I—1
1

0 0 0
1 0 0 0
J =
о •

1 •
•о

I—1
0
0 0 1 0
т.е. найдётся невырожденная матрица А такая, что 1A F А = J.
Доказательство немедленно вытекает из теоремы 9, если вспо­
мнить закон изменения матрицы билинейной формы при переходе к
новому базису.
З а м е ч а н и е . Теорема и её следствие справедливы над любым
полем характеристики ф 2. Часто за стандартную кососимметрич­
ную матрицу выбирают
0 —Ет
Jo = 0
Fm
Переход от J к Jo достигается переупорядочением базисных векто­
ров.
Если говорить о практическом приведении кососимметричной
формы (15) к каноническому виду, то опять следует воспользоваться
методом Лагранжа. Именно, считая j ф 0 (в противном случае
делать нечего) и в случае необходимости переупорядочивая базис­
ные векторы, мы придём к ситуации /12 Ф 0. Выделим в (15) все
слагаемые с переменными х\ или у\\
X l { f l 2 V 2 + ■■ ■ + f l n V n ) ~ ( f l 2 X 2 + ■■ ■ + f l n X n h l -

С новыми переменными
х '2 — f l 2 % 2 + ••• + /ln ^ n , У2 = fl2l/2 + • • • + flnVn

(xi, уi, Ж3, уз, . .., жп, уп остаются прежними) начинается процесс вы­
§ 4 • Билинейные и квадратичные формы 57

деления слагаемых, содержащих ж2, у2 -


Д х ,у ) =
= {Х 1 + /з2ж 3 + ■■■ + Р п 2 х п ) У 2 — ^ 2 (2/1 + /з2?/3 + ••• + / п 2 Уп ) + ■■■ =
= х'1 у '2 - х ' 2 у[ + ...,
где
х[ = Х ! + /з 2Ж3 + . . . + f n2 x n, у'1 = у 1 + f'32 y 3 + . . . + f n2 yn,
а точками обозначены слагаемые, содержащие лишь жз,г/з,...
... , х п, у п. С ними, если они отличны от нуля, поступаем аналогич­
ным образом. В конечном счёте форма / окажется приведённой к
каноническому виду:
/(х , у) = {х \ у '2 - Х 2у [ ) + . . . + ( х 2т_ 1у 2т - 4 m 2 / 2 m - l ) - (16)

10. Пфаффиан. Согласно следствию теоремы 9 для любой


невырожденной кососимметричной матрицы F найдётся матрица А
такая, что
0 —Ет
1AFA = = Jo-
Em 0
Отсюда (det A)2det F = 1, т.е. det F — квадрат в основном поле А.
Это обстоятельство наводит на мысль рассмотреть поле отношений
(поле частных)
£ = Q(t) = Q(t 12 , *1 3 , • • • , tn-l,n)
кольца многочленов
Z[t\ = Z[ti 2, £13, . .., £n-l,n]
от n(n —1)/2 независимых переменных и кососимметричную матрицу
Т = (tij) с tji = —£ij при i < j. Мы знаем, что det Т — квадрат в поле
Q(£). С другой стороны, det Т — многочлен из Z[£]. Значит (здесь мы
неявно пользуемся однозначностью разложения на множители в Z [£];
см. [ВА I] и [ВA III]), det Т — квадрат некоторого многочлена из Z[tj:
det Т = Pn(t)2.
Нормируем Pn(t) = Рп(ti 2 , £13, • • •) так, чтобы Рп(£?2, £?3, . . . ) = 1 для
тех значений £^- = О, =Ы переменных £^-, для которых То = (£ij) = Jo-
При такой нормировке получается однозначно определённый много­
член Pfn(£), называемый общим пфаффианом размера п. Например,
Pf2(£) = £, Pf4(£) = £12 £34 - £13 £24 + £14 £23,
что легко получить, вычисляя определители матриц
0 —£12 —£13 —£14
0 —£ £12 0 —£23 —£24
£ 0 5 £13 £23 0 —£34
£14 £24 £34 0
58 Г л. 1. Пространства и формы

Под Pf(F) будем понимать результат подстановки в Pfn(fij) ко­


эффициентов fij кососимметричной матрицы F вместо tij (заменив
всюду Q на простое поле Zv, мы распространим наши рассуждения
на поля произвольной характеристики). Имеет место
Т е о р е м а 10. Если F — ко со симметричная матрица размера
п х п, то
det F = Pf (F)2.
Далее,
Pf CAFA) = det A • Pf (F)
для любой n x п-матрицы A.
Д о к а з а т е л ь с т в о . Соотношение det F = Pf (F )2 выражает из­
вестные нам свойства кососимметричной матрицы и пфаффиана.
Пусть, далее, U = (uij) — произвольная п х n-матрица с алгебраиче­
ски независимыми коэффициентами г^-, Т — рассмотренная выше
кососимметричная матрица. Тогда
Pf CU TU )2 = det ( 1 ит и) = (det U )2 det Г = (det U )2 Pf (T)2,
откуда
Pf ( гиТ11) = ±(det U) Pf (Г).
Если подставить теперь вместо иц mtij такие значения, что U станет
единичной матрицей, а Т — стандартной кососимметричной матри­
цей, то слева будет стоять Pf (Jo) = 1, а справа ±1 • Pf (Jo), т.е.
следует взять знак + . Это значит, что и для специальных матриц
U = А, Т = F справедливо доказываемое равенство. □
Остаётся заметить, что пфаффиан Pf (Т) для Т = (tij)2m, 1Т —
— —Т — универсальный многочлен, являющийся однородной фор­
мой степени ш, коэффициенты которой целочисленны или лежат в
простом поле.

У П РА Ж Н Е Н И Я

1. Пусть A i, . . . , А п = F — главные миноры вещественной квадратичной


формы q с матрицей F. Доказать, что q и F отрицательно определены в точности
тогда, когда ( —1 )к Ад, > 0 для к = 1, 2 , . . . , п.
2. Привести пример:
а) положительно определённой матрицы А = (a{j) с aij < 0 для некоторых
пар (г, j) ;
б) матрицы А = (aij) с aij > 0 для всех индексов г, j , которая не была бы
положительно определённой.
3. Указать Л, ц Е К, для которых матрицы

1 Л Л 1 1 и
Л 1 Л , 1 и 1
Л Л 1 и 1 1

являются положительно определёнными.


§ 4 • Билинейные и квадратичные формы 59

4. Пусть X = [х\ , Ж2, Жз] G с, Q (x) = x f + —ЗЖ1Ж2Ж3, £ — примитив­


ный корень степени 3 из 1. Используя выражение
Q (x) = (Ж1 + Ж2 + Х з ) ( х 1 + £Ж2 + £2Хз ) ( х 1 + £2Ж2 + £Ж3),
убедиться в том, что Q (x)Q (y) = Q(z), где z = [^1, ^2, ^з], Z{ = ^ ( х , у) =
= k a ^ X j i / k — билинейные симметричные формы. Найти их явный вид.
5. Пусть А — произвольная вещественная симметричная матрица, £ = е(А) —
достаточно малое вещественное число. Доказать, что матрица В = Е + еА поло­
жительно определена.
ГЛАВА 2
Л И Н ЕЙ Н Ы Е О П Е Р А Т О РЫ

Как правило, изучают не векторные пространства сами по себе,


а линейные отображения векторных пространств. Примерами могут
служить вращения, отражения, гомотетии в Мф, операции дифферен­
цирования и интегрирования в анализе. Для начала сосредоточимся
на наиболее общих свойствах линейных отображений.

§ 1. Л и н ей н ы е о т о б р а ж е н и я
в ек тор н ы х п р о с т р а н с т в
1. Язык линейных отображении. Как мы знаем (см. [ВА I,
гл. 2, § 3]), каждой т х n-матрице А отвечает линейное отображение
ipА : Rп —>Rm. Аксиоматизируя его свойства, мы вводим следующее
общее
О п р е д е л е н и е 1. Пусть V, W — векторные пространства раз­
мерностей п, т над одним и тем же полем А. Отображение / : V —>• W
называется линейным, если
/(х + у) = /(х)+/(у), /(Ах) = А/(х).
Другими словами, /( а х + /Зу) = а /(х ) + Д/(у). Частным типом ли­
нейного отображения служит понятие линейной функции / : V —>А,
подробно рассмотренное нами в гл. 1.
Совокупность всех линейных отображений V —> W, обозначае­
мая символом C(V,W) (или Нот(К, ИД), — векторное пространство
с естественными операциями сложения отображений и их умножения
на скаляры: если /, д Е £(К, W) и z/, fi Е F, то по определению
( v f + да)(х) = г//(х) + /Х0(х).
Непосредственно проверяется, что все аксиомы векторного простран­
ства (см. гл. 1, § 1) применительно к C(V,W) выполняются.
С любым линейным отображением / : V —>• W ассоциируются два
подпространства — его ядро
K e r f = {v е V\ /(v) = 0}
и образ
Im / = {w G VT| w = /(v ) для некоторого v Е V}.
Ядро и образ как понятия для нас не новы, но теперь важно под­
черкнуть, что они являются векторными подпространствами в К и
W соответственно (лёгкая проверка, очевидная для Кег/, а для 1 т /
приводимая ниже). Для любого подпространства U С V условимся
писать коротко f(U) = {/(u)| u Е U}. Если u i , u 2 G U\ V\,V2 G F, to
z/ i / ( u i ) + v 2f { U2) = / ( ^ l U i + I/2 U 2 ) G / ( [ / ) ,
§ 1. Линейные отображения векторных пространств 61

поскольку U1 U1 +Z/2U2 £ U. Поэтому f(U) — векторное подпростран­


ство в W. В частности, это относится к f (V) = 1гн/.
Заметим, что инъективность / равносильна равенству Кег/ =
= {0}. Действительно, в случае /(х ) = /(у), х / у , имеем 0 / х - у G
G Кег/. Обратно: если 0 / х G Кег/, то /(х ) = 0 = /(0).
Т е о р е м а 1. Пусть f : V —>W — линейное отображение. Если
U = (еь ...,еД С V, то f(U) = ( / ( е Д, . . . , /(еД) С W. В част­
ности,
dim /([/) ^ dim U.
Д о к а з а т е л ь с т в о . По условию любой вектор u Е U записы­
вается в виде и = аде! + ... + a ses, поэтому /(и) = ад /(е 1) + ...
... + a sf ( e s), а это и означает, что f(U) = ( / ( еД, . . . , /(еД ). В том
случае, когда система ( e i , . . . , e s) была базисной для £/, система
( / ( еД, . . . , /(еД), вообще говоря, не обязана быть базисной для /(£/),
поэтому dim f(U) ^ s = dimt/. Вполне может случиться, что
U С Кег/ и /([/) = {0}. □
2. Задание линейных отображении матрицами. Пусть нам
заданы базисы ( vi , ..., vn), (w1?...,w m ) векторных пространств V
и W соответственно. Любой вектор из образа I m / С W является
линейной комбинацией векторов
/(v1) = aiiWi + a2iw 2 + ... + amlw m,
(i)
/(v „) = a inwi + a2nw2 + . . . + Q"mnWm
Обратно, задание набора векторов = /(vi), . .., = / ( v n) про­
странства W полностью определяет линейное отображение /; произ­
вольному вектору v = ад vi + .. .+ a nv n достаточно поставить в соот­
ветствие вектор w = ад + ... + a nw'n. Если v' = a [v! + . . . + аДуп,
то
/(г/v + г/V) = f( ( v a i + i/a'Jvi + ... + (uan + v'a'n)wn) =
= {va\ + a'1)w,i + •••+ (ran + v'a'n)w'n =
= и {a iwi + ... + a nw'n) + i/'(aiwi + ... + a'nw'n) = v f ( v ) + u'f{v').
Матрица
ац ai2 Uln
^21 022 n
II

a mi a m2 ®>тп
называется матрицей линейного отображения / : V W относи­
тельно базисов ( vi , ... , vn), ( wi , ... , wm) ( или в базисах (уД, (\уД)
пространств V и W. Различным матрицам отвечают различные ли­
нейные отображения.
62 Г л. 2. Линейные операторы

Заметим, что координаты вектора /(vj) составляют j -й столбец


матрицы M f. Поэтому r ank{/ (vi ), ... , / ( v n)} = rankM /, а так как
всегда rank{/ (vi ), . . . , /(v„)} = dim ( / ( vi ) , . .. , /( v n))fi = dimlm/ ,
t o dim Im / = rank M f.

О п р е д е л е н и е 2. Размерность подпространства I m / называ­


ется также рангом (rank/) линейного отображения /.
Понятно, что от выбора базиса величина rank / не зависит. Нами
доказана
Т е о р е м а 2. i) Пусть V = (vb . . . , v n), W = (wb . . . , w m) —
два пространства с фиксированными базисами. Тогда существует
взаимно однозначное соответствие между линейными отображе­
ниями из V в W и т х п-матрицами с коэффициентами в основном
поле Я.
и) Произвольной системе векторов w^, . . . , w^ Е W отвечает
единственное линейное отображение / : V W, для которого
f(vi) = w-, 1 ^ г ^ п.
ш) Ранги линейного отображения f : V ^ W и отвечающей ему
матрицы M f (при любом выборе базисов в V и W) совпадают.
Как мы знаем, все т х п-матрицы с коэффициентами в поле Я
образуют векторное пространство над Я размерности тп с базис­
ными векторами Eij — матрицами, в которых на пересечении г-й
строки и j -го столбца стоит 1, а на остальных местах — нули. Стало
быть, имеет место равенство
dim C(V,W) = (dim У) (dim W).
Соответствие между матрицами и линейными отображениями
можно использовать для нового доказательства известного утверж­
дения (см. [ВА I, гл. 2 § 3]) о ранге произведения матриц. На языке
отображений ему соответствует
Т е о р е м а 3. Пусть f o g — композиция линейных отображений
и Л у -Uw.
Тогда:
i) dim Im (/ о g) ^ dim Im /;
ii) dim Im (/ о g) ^ dim Im g.
Доказательство. Неравенство i) очевидно, поскольку
Im ( / о g) C I m/ . Для доказательства ii) заметим, что Im ( / о g) =
= f(lmg). Так как di ml m/г ^ dim U для любого линейного отобра­
жения h: U —>W, то становится очевидным и неравенство ii). □
Пусть х = Y%= 1 xj vj — вектор из V, у = Д х) = Y a =i Viw i ~ ег0
образ относительно линейного отображения / : V —>W с матрицей
M f вида (2) в указанных базисах (vj), (w^). Тогда в соответствии с
правилом (1) имеем
п п т т п т
/(х) =
j=1
X
j=1
(X
2=1
=Х ( Х " ^ ' Ь = 5 > w<-
2=1 J = 1 2=1
§ 1. Линейные отображения векторных пространств 63

Отсюда yi — 1 aijxj ч 1 ^ i ^ т , или, коротко,


Y = Mf ■X, (3)
где X = [^1, . . . , жп], У = [г/i, . . . , ут\ — столбцы координат векто­
ров х G У и у = /(х ) G ТУ. На (3) мы смотрим как на линейное
преобразование координат (в привычном нам смысле), отвечающее
отображению /.
Пусть / , д — линейные отображения из У в ТУ. Фиксируя в этих
пространствах базисы (vj), (w*), мы фактически переходим к рас­
смотрению линейных отображений / : X у M f X , д : X у МдХ
из Яп в Ят . В соответствии с нашими прежними представлениями
[BA I, гл. 2, § 3] видим, что линейному отображению u f + дд (см.
и. 1) отвечает матрица
M vf +цд = vM f + IlMg.

Аналогично, композиции f o g линейных отображений U A У -4 ТУ


при фиксированных базисах в У, У и ТУ отвечает матрица
М/ор = MfMg.
Мы лишь напомнили известные факты, ещё раз подчеркивая полную
согласованность в соответствии между линейными отображениями
и матрицами.
3. Размерность ядра и образа. Справедлива следующая
Т е о р е м а 4. Пусть У — конечномерное векторное прост­
ранство над полем Я, / : У —>ТУ — линейное отображение. Тогда
Ker f и 1 т. f конечномерны и
dim Ker / + dim Im / = dim У.
Д о к а з а т е л ь с т в о (cp. с доказательством аналогичной теоре­
мы в [ВА I, гл. 2, § 3]). Так как Кег/ С У, то dimKer / ^ dim У < оо.
Выберем базис (ei , . .., е/Д в Кег / и дополним его в соответствии с
теоремой 3 из § 2 гл. 1 до базиса ( ei , ..., е^, e^+i,. .., еп) простран­
ства У. Любой вектор из 1 т / имеет вид
п \ п
У^ ) = У ^ О д / (ег) 5 Ф С Л,
г=1 ' г=/г+1
т.е. векторы /(e^+i), . .., /(еп) порождают 1 т / . Остаётся лишь по­
казать, что эти векторы линейно независимы.
Предположим, что Yn=k+1 Л*/(е0 = Тогда f{Yli=k+i Л*е0 = °*
Это значит, Ч Т О Y^i=k+1 ^гег £ К ег/, т.е. YTi=k+iXiei = E j = i Aj ei-
Но всякая линейная зависимость между базисными элементами
e i , ...,еп должна быть тривиальной. Приходим к заключению, что
\ k + i = ... = Ап = 0. Следовательно, векторы / (e^+i ), . .., /(еп) ли­
нейно независимы и dim 1 т / — п —к. □
64 Г л. 2. Линейные операторы

С л е д с т в и е . В случае dim/ < оо следующие свойства линей­


ного отображения f : V ^ W равносильны:
i) / инъективно;
ii) dim V = dim Im /.
Д о к а з а т е л ь с т в о . Согласно теореме dim V = d i ml m/ тогда
и только тогда, когда dimKer / = 0, т.е. Кег/ = {0}, а мы видели,
что ядро нулевое только в случае инъективности /. □
З а м е ч а н и е . Если dim V = dim W и / : V —>W — линейное отоб­
ражение, то, как утверждает следствие, из инъективности (когда
Кег / = {0}) или из сюръективности (Im / = W) вытекает биектив-
ность / , т.е. в этом случае / является изоморфизмом.

УП РА Ж Н ЕН И Я

1. Зап и сав столбец к оорд и н ат X = [xi, х 2, жз, х А в виде м атр и ц ы ( Х1 Х2 ) Е


Vх3 х4J
Е М 2 (Я), а затем взяв ф иксированную м атр и ц у А = ( ai а2 ) Е М 2 (Я), мы опре-
\ а3 а4J
делим два линейны х п реобразован ия:

f L : X ^ A ( X1 Х2) = = Х',
V Х4 J
/ д : X »->■ ( Х1 Х2 ) А = = Х",
\ хз х4 J
к оторы м о т веч аю т м атр и ц ы M f L и M f R .
П ред л агается провери ть, ч то

( а\ 0 а2 0 \ / ai аз 0 0 \
о

а\ 0 а2 а2 « 4 0
II
II

$
Й
4

0 0 0 0 ai
в

в
СО

СО

« 4

1 0 as 0 « 4
J 1 0 0 а2 « 4
/
2. П ровери ть линейность следующ их отображ ений:
а) У — векторное п р о стр ан ств о , W = V / L — ф а к то р п р о с т р ан с т в о , / о то б ­
р а ж а е т к аж д ы й в ек то р х Е V на смеж ны й класс х = х + L;
б) / : Рп —» Рп — отображ ение, определённое по правилу f( u(t) ) = tu'(t) —
-u(t). "
Н ай ти К ег / и вы числить r a n k / .
3. П о к а за ть , ч т о отображ ение С _1Х С , определённое невы рож ден­
ной м атри ц ей С Е М П(Д), линейно на М п (А) и об л ад ает свойством f c ( X Y ) =
= fc(X) fс (Y).

§ 2. А л г е б р а л и н ейн ы х о п ер а т о р о в
1. Определения и примеры. Основное поле Я пока предполага­
ется произвольным. В случае W = V элементы векторного простран­
ства jC(V,W), которое теперь естественно обозначать символом С(У)
(используется также обозначение End К), обычно называют линей­
ными операторами или линейными преобразованиями. Ввиду много­
значности термина “линейное преобразование” (связанного скорее с
§ 2. Алгебра линейных операторов 65

координатами векторов, чем с самим векторным пространством) мы


предпочтём первый из них. В дальнейшем линейные операторы будем
обозначать заглавными рукописными латинскими буквами Д , 23, С,
Т>, . .., а соответствующие им в каком-нибудь базисе (е*) пространст­
ва V матрицы — заглавными печатными буквами А , В , (7, D , ...
В другом (штрихованном) базисе (е[) тем же операторам А, В, ...
будут отвечать матрицы А', В 1 , ... Линейный оператор £ = Id с
матрицей Е = (Sij) всегда обозначает тождественное (единичное)
отображение х i—у х. Как правило, результат применения оператора
Л к вектору х обозначается простым приписыванием букв: Дх (реже
Д(Х)).
Линейный оператор В называется обратным к А , если А В =
= ВА = £. В соответствии с известными общими результатами (см.
[ВА I, гл. 1, § 5]) обратный к А оператор, если он существует, од­
нозначно определён; его обозначают символом Л -1 . Согласно след­
ствию теоремы 4 из § 1 существование Л -1 эквивалентно условию
Кег Л = 0 или dim V = dim Im Д. В общем случае размерность ядра
dim КегД называется дефектом оператора Л. Стало быть, операторы
дефекта нуль и только они обратимы. Например, если уравнение
Дх = b имеет решение при всех Ь, то существует обратный опе­
ратор Л. Напомним ещё, что rank Д = dim Im Д = dim V —dim Кег Д
это ранг оператора Л. Все эти понятия и условия, переведённые на
язык матриц, нам хорошо известны, но важно признать, что поня­
тие линейного оператора является более фундаментальным: оно не
связано с выбором какого-либо базиса.
Приведём несколько примеров линейных операторов.
П р и м е р 1. Нулевой оп ератор О п ереводит любой в ек то р v £ V в нулевой:
ra n k 0 = 0.
П р и м е р 2. О п ератор подобия А : А х = Ах (А — ф иксированны й скаляр).
П р и м е р 3. О п ератор А п ов орота плоскости М2 на угол а прощ е всего
реал и зо вать , и н те р п р е ти р у я М2 к а к плоскость комплексны х чисел с базисом {1, г ) .
Т огда, очевидно, А : z = х + iy ега z — оп ератор умнож ения на число ега =
= cos<a + zsin<a и А • г = —sin<a + zcosck. П оэтом у в базисе (1,г) м атри ц ей опе­
р а т о р а А будет
д _ / cos а — sin а \
— у sin a cos<a J
П р и м е р 4. П усть V = U 0 W — прям ая сум м а п од п ростран ств . Если
х = Х£/ + хцл — разлож ение в ек т о р а с ком понентам и xjj £ U, хцл £ W и
"Рх = Х£/, то V н азы в ается оператором проектирования или проектором на
п од п ростран ств о U параллельно W (или вдоль W ) З а м ети м , ч т о V 2 = V .
П р и м е р 5. Рп = (1, t , . . . , t n _ 1 ) — п р о стр ан ств о м ногочленов степени
п — 1 над А , T>t = d/dt — оп ератор ди ф ф еренц ирован ия по t: T>t • f( t ) =
Следует предостеречь от возможной ошибки в истолковании фор­
мулы
dim Кег Д + dim Im Д = dim V (1)
(см. формулировку теоремы 4 из § 1). Отсюда вовсе не следует, что
5 А .И. К о стр и к и н
66 Гл. 2. Линейные операторы

V = Кег Д + Im Д, как показывает хотя бы оператор V из примера 5:


КегГ>= (1) = Я - 1 с = Im V .
2. Алгебра операторов. Мы уже знаем, что множество C(V)
всех линейных операторов на векторном пространстве V само явля­
ется векторным пространством размерности
dim £(У) = (dim V )2 . (2)
Линейный оператор Л на V полностью определяется своим действием
на элементы х Е V . Вспоминая принципы композиции отображений,
изложенные в [BA I, гл. 1, 2], мы полагаем, что
(Д + £>)х = Дх + £>х, (АД)х = А(Дх), (Д£>)х = Д(£>х)
(таким образом, композиция А о В обозначается просто “приписы­
ванием” Л к В). Из этого определения непосредственно вытекают
соотношения
су(Д Н- В) = суД аВ,
(су+ /3) Д = суД + /ЗД,
(3')
(а(3)А = а(/ЗА),
1 • Д = А;
А(ВС) = (АВ)С (ассоциативность),
А{В + С) = АВ + АС, ( 3 ")
(Д + В)С = АС + ВС (дистрибутивность);
А(ДВ) = (ХА)В = А(ХВ). (3"')
Мы видим, что множество линейных операторов £(V) является
одновременно векторным пространством над полем Я (первые че­
тыре соотношения (3;)) и ассоциативным кольцом (следующие три
соотношения (3")); последнее соотношение (3'") смешанного типа
устанавливает дополнительную закономерность между умножением
на скаляры и композицией операторов.
О п р е д е л е н и е 1. Кольцо К , являющееся одновременно вектор­
ным пространством над полем Я таким, что A(ab) = (Аа)Ъ = а(ХЬ)
для всех А € Я, а,Ь € К, называется алгеброй над Я. Размерность К
как векторного пространства называется размерностью алгебры К
над Я. Всякое векторное подпространство L С А, замкнутое относи­
тельно операции умножения в К (L •L С L), называется подалгеброй
алгебры К.
Говоря об алгебрах, имеют в виду преимущественно ассоциатив­
ные алгебры (ab)c = а(Ьс) с единицей 1:1 • х = х, х Е К. Именно
такой является алгебра C(V) линейных операторов на V. Матрич­
ный вариант Мп(Я) алгебры C(V) встречался в [ВА I, гл. 2, § 3],
§ 2. Алгебра линейных операторов 67

где приводились аналоги соотношений (3/)-(3///) для матриц. Хотя о


соответствии между линейными отображениями и матрицами гово­
рилось неоднократно, в том числе в § 1, ещё раз запечатлеем в памяти
простой, но важный факт: если
п п
А • е к I у Ае^ ^ ^ В • Cj i у Betj ^ ^ dkjGk
i=l &=1

— линейные операторы с матрицами А = (а^), В = (Ь^-) в базисе


(еД пространства V, т е матрицей оператора АВ в т е ж же базисе
будет С = АВ.
Действительно,

5 ^ Qj-ei = (АВ)е^ = А(ВеД = Al ^ bkjА ек =


г ' к ' к

= ^ ^ bkj ^ ^ = ^ ^ ^ ^&ikbkj )
к i г ' к '

т.е. Qj = &ikbkj и (cij') — А В .


Наиболее интересные для приложений кольца являются алгебра­
ми. Алгебра многочленов Л [£] — простейший пример бесконечномер­
ной ассоциативной алгебры. В ассоциативной алгебре £(У)
размерности п2 (см. (2); п = dim У) особого упоминания заслужи­
вают подалгебры, порождённые одним оператором. Именно, если
А — линейный оператор, то порождённая им подалгебра А [А] есть
наименьшая подалгебра, содержащая А. В этом частном случае удоб­
но считать единичный оператор £ принадлежащим А [А]. Элемен­
тами подалгебры А[А\ являются всевозможные степени оператора А:
Л° = £, Л, А 2 =ЛЛ, Ак = А А ...А ,
к

и их линейные комбинации. Другими словами, если


/(£) = aotm + ait 171 1 + ... + аш- А + ат G A[t\,
то
/(A ) = aoAm 1 + ... + am- \ A + am£ (4)
— наиболее общий вид линейного оператора из А [А]. Встав на функ­
циональную точку зрения, мы сказали бы, что /(А ) — значение мно­
гочлена / G A[t\ при t = А. Линейный оператор /(А ) вида (4) дей­
ствует на векторы х G V естественным образом:
/(А )х = а0А тх + а1 А гп~1х + ... + am_i Ах + ашх.
Алгебра А [А] коммутативна, поскольку
/(А ) • д{А) = д{А) • /(А )
5*
68 Г л. 2. Линейные операторы

(следствие перестановочности степеней: А к • А 1 = A k+l = А 1 • А к).


Какова ее размерность? Мы увидим в дальнейшем, что всегда
dim Я [А] ^ dim V. (5)
Но это сравнительно тонкий результат, а пока мы сделаем предва­
рительные полезные замечания.
О п р е д е л е н и е 2. Говорят, что многочлен /(£) аннулирует ли-
нейный оператор Л, если /(Л ) = О. Нормализованный (т.е. со стар­
шим коэффициентом 1) многочлен минимальной степени, аннули­
рующий Л, называется минимальным многочленом оператора Л.
Пусть
H A ( t ) = t m + / l i t 171 1 + ...+ l ± m - A + l^m (6)
— минимальный многочлен линейного оператора Л. Тогда опера­
торы £, Л, Л2, . .., Лш_1 линейно независимы, так как соотношение
А^Лг = О означало бы, что многочлен q1 ^ г аннулирует
Л, хотя его степень меньше т. Обратно, если £, Л, Л2, ..., Лш_1 —
линейно независимые операторы (как векторы пространства £(К)),
а оператор А т уже выражается линейно через них, то это значит,
что т — степень минимального многочлена для Л. Существова­
ние т — тривиальное следствие включения Я [А] С £(V). Так как
dim£(K) = п2, то т ^ п2. Тем самым доказана часть следующего
утверждения.
Т е о р е м а 1. Для всякого линейного оператора А существует
минимальный многочлен /хд(£). Его степень совпадает с размерно­
стью алгебры Я [А]. Оператор А обратим тогда и только тогда,
когда свободный член цш многочлена (6) отличен от нуля.
Д о к а з а т е л ь с т в о заключительной части теоремы столь же
просто, как и проведённое выше доказательство первой части. Имен­
но, если fim = 0, то
О = я а (Л) = Л(ЛШ_1 + i n А т ~ 2 + ... + ptm-iS).
Значит, у Л есть делитель нуля Лт_1 + iiiA m~ 2 + ... + /im_i£ ф
Ф О (минимальность /i^(t)), а делитель нуля в кольце не может быть
обратимым. Если, напротив, /im ф 0, то соотношение
Л (-/хДЛ™-1 - /vV iAm~2 - ... - M“VTO- 1£) = £,
вытекающее из (Л) = О, в явном виде задаёт оператор, обратный
к Л. □
Т е о р е м а 2. Любой аннулирующий многочлен f(t) оператора А
делится без остатка на минимальный многочлен /хд(£).
Д о к а з а т е л ь с т в о . По предположению линейный оператор / (Л)
(см. (4)) равен нулевому оператору О. Если f(t) = q(t)/jL^(t) +r(t) —
результат деления f(t) на /хд(£) с остатком г(£), то
0 = f(A) = q (A )-0 + r(A),
§ 2. Алгебра линейных операторов 69

откуда г (А) = О. Но degr(t) < deg /хд(£), так что в соответствии с


определением минимального многочлена имеем r(t) = 0 . □
О п р е д е л е н и е 3. Линейный оператор А называется нилъпо-
тентным, если А т = О для некоторого т > 0; наименьшее такое
натуральное число т называется индексом нильпотентности.
Понятно, что = tm для оператора с индексом нильпотент­
ности т и /хд(£) = t 2 —t для нетривиального оператора А с А 2 = А.
Далее, iio(t) = t и fig(t) — t — 1. Типичным примером нильпотент-
ного линейного оператора индекса п служит оператор дифференци­
рования T>t, действующий на пространстве Рп многочленов степени
^ п —1. Оператор проектирования Р (пример 4 из и. 1) обладает
свойством V 2 = V. Эти примеры будут активно использоваться в
дальнейшем.
3. Матрицы линейного оператора в различных базисах.
Пусть V — n-мерное векторное пространство над полем Я, А: V —>
—>V — линейный оператор. Выбрав в V базис (ei , . .., еп), мы можем
задать А его матрицей А = (а^), так что
A ei = ^ a kiek. (7)
к
Но тот же самый оператор А в ином базисе (е^, . . . , е^) пространства
V будет иметь какую-то другую матрицу А' = (аДД:

A e ’j = (7')
к
Если В = (bij) — матрица перехода от базиса (еД к базису (е'Д, то
формулы е'- = J2ibijei, 1 ^ i ^ п, наводят на мысль ввести линей­
ный оператор В:
B e j = е'-, (8)

с матрицей В в базисе (ei , . .., еп). Так как det В ф 0 (теорема 4 из


§ 2 гл. 1), то оператор В обратим.
Наконец, определим вспомогательный оператор А ', имеющий в
базисе ( e i , . . . , e n) ту же матрицу Д/, что и оператор А в базисе
(еД. .., е^Д. Другими словами, положим

A'ej = J 2 aijei- (9)


i
Мы имеем право это сделать, поскольку при фиксированном базисе
между линейными операторами и матрицами имеется биективное со­
ответствие. Используя (7) и (8), перепишем соотношение (7') в виде

A B e j = A e 'j = Y а ' ^ е 'г = Y a 'ijB e i = Б ( E a 'ij ei) ’


i i i
70 Гл. 2. Линейные операторы

откуда ввиду обратимости В и ввиду выражения (9) для А 1 получаем


B~1ABej = A'ej, 1 ^ j ^ п. (10)
Рассматривая все операторы А, В и А! в одном и том же базисе
(ei , . .., еп), мы переходим от (10) к матричному соотношению
А' = В - 1 АВ. (11)
К соотношению (11) можно прийти более прямым, координатным
путем. Пусть, как обычно, JT x ^ i — х = х[е[ — запись произ­
вольного вектора х Е V в исходном и новом (штрихованном) базисе;
X = [яд,. . . , жп], X ' = — соответствующие столбцы ко­
ординат. Далее, пусть Y = АХ , Y' = А'Х', где Д, А' — матрицы,
определённые соотношениями (7) и (7'). Так как X = В Х ' , У = B Y 1
(см. (У) из § 2 гл. 1), то
А В Х ' = A X = Y = B Y 1 = В А ’Х 1.
Ввиду произвола в выборе столбца X ' (вектора х Е V) имеем АВ =
= ВА!, откуда А' = В - 1 АВ.
Итак, мы дважды убедились в том, что справедлива
Т е о р е м а 3. Матрица А 1 линейного оператора А в базисе
(е^,... , е^) получается из матрицы А того же оператора А в ба­
зисе (ei , . . . ,еп) по формуле (11), где В — матрица перехода от (еД
к Ю-
О п р е д е л е н и е 4. Говорят, что матрица А 1 подобна матрице Д и
пишут А’ ~ Д, если существует невырожденная матрица В, связыва­
ющая Д и А' соотношением (11). Предполагается, что все матрицы
квадратные одинакового порядка, с коэффициентами из одного и
того же поля А.
Ясно, что всегда Д ~ Д (взять В = Е). Далее, соотношение (11),
переписанное в виде Д = В ^ 1 А 1В\ с В\ — В -1 , показывает, что отно­
шение подобия симметрично: А' ~ А = > А ~ А '. Оно также транзи-
тивно: если А' = В - 1 АВ, А" = С~ 1 А'С, то А" = (ВС ) - 1 А(ВС), т.е.
А" ~ А', А' ~ Д = > А" ~ Д. Таким образом, отношение подобия
является отношением эквивалентности, и все квадратные матрицы
порядка п разбиваются на непересекающиеся классы подобных ма­
триц (сравнить с классами эквивалентности матриц из [ВА I, гл. 2,
§ 3, и. 6]). Согласно теореме 3 каждому линейному оператору соот­
ветствует ровно один класс подобных матриц, а подобные матрицы
служат матрицами одного и того же линейного оператора в различ­
ных базисах.
Язык линейных операторов удобен в теоретических исследова­
ниях, однако конкретные вычисления чаще всего реализуются в ма­
тричной форме. Поэтому классификация матриц с точностью до по­
добия является весьма важной с практической точки зрения. Если,
скажем, нам требуется вычислить степень А к матрицы Д порядка
§ 2. Алгебра линейных операторов 71

п > 1 (или даже п > 100) для большого показателя к ^ 1000 (а та­
кие задачи встречаются на практике), то естественно попытаться
найти матрицу А' ~ А с легко вычислимой степенью (А')к. Проще
всего это сделать с А' = diag(Ai,. .., Ап), коль скоро такая матрица в
классе подобия с представителем А существует. Тогда А = В А 1В -1
и А к = В diag (Af, . . . , А*) В ~ х. В этом отношении достаточно ти-
пична матрица А = I J , имеющая прямое отношение к числам
Фибоначчи и являющаяся главным “героем” в [BA I, гл. 2, § 3, и. 5,
пример 3]. Добавим ещё, что умение вычислять степени А к даёт воз­
можность находить значения
f(A) = аоАт + aiAm 1 + ... + am- i A + атЕ
для произвольного многочлена f(t) = a^tm + ... + ат.
4. Определитель и след линейного оператора. Пусть А —
линейный оператор на V . Его определителем называется определи­
тель det А матрицы А , соответствующей А в каком-нибудь базисе
пространства V. Так как det (В~1АВ) = det А, то det А — инвари­
ант оператора А. Обратимым матрицам отвечают обратимые опе­
раторы, поэтому det Л / 0 — необходимое и достаточное условие
обратимости оператора А. В случае det А — 0 мы имеем дело с вы­
рожденным линейным оператором А.
Назовём теперь следом линейного оператора А выражение
п
tr А = tr А = ац ,
2=1
где А = (aij) — матрица, отвечающая A (tr — сокращение от ан­
глийского trace). Как известно и как легко проверяется,
trA B = tr B A (12)
для любых матриц А ,В одинакового порядка. Применяя это соотно­
шение к матрицам В ~ гА и В , где В невырождена, получим
tr { В - 1АВ) = t r ( 5 - 5 “ 1A) = tr А.
Значит, определение следа оператора корректно, т.е. не зависит от
выбора базиса в V. Аналогом (12) является соотношение
tv АВ = tv В А. (12')
Обе введённые функции det и tr: £(V) —>А играют важную роль.
Функция det мультипликативна (det АВ = (det A )(det В)), и с её по­
мощью выделяется группа Aut V автоморфизмов пространства V ,
или, что эквивалентно, группа всех невырожденных линейных опе­
раторов на V. Нетрудно сообразить, что при любом выборе базиса в
V группа Aut V превращается в известную из [BA I] полную линей­
ную группу GLn(A) матриц порядка п = dim^ V. Более точно: имеет
место изоморфизм групп Aut У = GLn(A).
72 Г л. 2. Линейные операторы

Функция tr линейна:
tr (а А + (ЗВ) = a tr А + /3 tr В
(лёгко проверить), и этот факт широко используется в математике;
так, содержательная теория характеров групп (см. [ВА III]) цели­
ком основывается на понятии следа. Рассмотрим более “скромные”
применения.
П р и м е р 6 (алгеб ры Л и). А лгебры , к а к и кольца, не обязательно долж ны
б ы ть ассоциати вны м и . О чень важ ны м примером неассоциативной алгебры явля­
ется т а к н азы ваем ая алгебра Ли L (или лиева алгебра — в ч е с ть С оф уса Ли
(1842-1899)), в к оторой операция умнож ения (х, у) i—)■ х * у удовлетворяет двум
аксиомам:
i) (х * х) = О; т о гд а (х + у) * (х + у) = 0 = > х * у = —у * х (свойство
а н ти к о м м у т а ти в н о с т и );
п) (х * у) * z + (у * z) * х + (z * х) * у = О (тож дество Я коби).
О перацию х * у чащ е обозн ач аю т символом [х,у] и н азы в аю т операцией ком­
мутирования. В екторное п р о стр ан ств о L = М3 = (еД есть трёхм ерн ая алгеб ра
Л и с операцией умнож ения — векторным (или внешним) произведением в ек т о ­
ров: если
х = x i e i + ж2е 2 + ж3е 3 , у = yi&i + ?/2е 2 + ?/3е 3 ,
то
[х, у ] = ( Х2УЗ - хзУ 2 )е 1 + ( хзУ 1 - X I у з ) е 2 + ( х \ у 2 - ж2?д)е3 .
Л егко провери ть, далее (а так у ю проверку к аж д ы й м а т е м а т и к долж ен про­
вести хотя бы раз в ж изни ), что , зад ав на м нож естве L = C{V) новую операцию
умнож ения по правилу
[А ,В \= А В -В А , (13)
мы удовлетворим обеим аксиом ам i), п) и можем с м о т р е ть на C{V) к а к на ал­
геб ру Ли. Её при н ято о б о зн ач ать символом И м еется глубокая теорем а,
согласно которой всякая конечном ерная ал геб р а Л и над Я явл яется подалгеброй
алгебры Л и (£ (У ); [, ]), где V — н екоторое в екторное п р о стр ан ств о конечной
р азм ерн ости над Я (напомним, ч т о подалгебра — п о д п ростран ство в C(V), за ­
м кн утое относи тельно операции [, ]).
А лгебры Ли, конечномерны е и бесконечномерны е, и гр аю т весьм а сущ ествен­
ную роль в кван товой механике (см. учебное пособие [2] в списке дополнитель­
ной л и т ер а ту р ы ). Дело в том , ч т о т а к назы ваем ы е динам ические переменны е в
кван товой теори и подчин яю тся законам неком м утати вн ой алгебры , и степень
их неперестановочности и зм еряется к а к раз “к о м м у та то р а м и ” (13). М ы полу­
чим н етри виальны й и в некотором смысле близкий к кван товой теори и пример
ком м утацион ного соотнош ения, если возьмём в к ач естве V бесконечномерное
п р о стр ан ств о всех м ногочленов над Я. П усть T>t = d/d t — оп ератор ди ф ф ерен ­
ци рования по Д а T t — оп ератор умнож ения на t : T>t(f) = = t • / . Л егко
п ровери ть, ч то
[D t,rt] = V t F t - r t V t = S (14)
— единичны й оп ератор на У = ЯЩ.
В озн и к ает вопрос: м ож ет ли вы полняться соотнош ение [А, В] = 6 т и п а (14)
в конечномерной алгебре £ (У )? О т в ет на него о к азы в ается зависящ им о т х а р а к ­
тер и с ти к и основного поля. Если Я = С или Я = К (наиболее ин тересны е случаи),
то сразу ж е приходим к противоречию :
О = t r А В — t r В А = t r [Л, В] = t r 8 = п = dim V.
§ 2. Алгебра линейных операторов 73

О днако при р\п, где р = char А, это проти воречи е у стр ан яется, к а к пок азы в аю т
о п ераторы с м атри ц ам и п о р яд ка р над А:

0 1 0 ... 0
0 0 ... 0 0
0 0 1 ... 0
1 0 ... 0 0
0 2 ... 0 0 (15)
II

0 0 0 ... 1
0 0 0 ... 0
0 0 ... р - 1 0
0 0 0 ... 0

П реж ний к р и тер и й с ф ункцией t r здесь не ср аб а т ы в а ет , и на самом деле [Jp , N p] =


= Ер.

УП РА Ж Н ЕН И Я

1. П ровери ть, ч т о обе м атр и ц ы вида (15) н и льпотентны : Jp = N p = 0.


2 . П о к а за ть , ч т о если А, В, С — м атр и ц ы разм еров п х р , p x q , q x n со о т­
ветствен но, то t r {А ВС ) = t r {В СА ) = t r {CAB).
3. И н те р п р е ти р у я G L n {¥p ) к а к груп п у автом орф изм ов A ut V век торн ого
п р о с тр а н с тв а V р а зм ерн ости п над полем Fp из р элементов, н ай ти порядок
\СЬп {¥р )\.
4. П о к а за ть , ч т о м нож ество sln {A) линейны х операторов со следом нуль явля­
ется п одалгеброй коразм ерн ости 1 в алгебре Л и $1п {А) = C(V).
5. Д о к а за ть , ч т о для лю бы х линейны х операторов А , В на V им еет м есто
равенство
ra n k А = ra n k В + dim (Im А П К ег В ) .
6. И спользуя упр. 5, д о к а за ть , ч т о для лю бы х линейны х операторов А , В, С
на V справедливо неравенство Фробениуса

ra n k В А + ra n k АС ^ ra n k А + ra n k ВАС.

7. Д о к а за ть , ч т о для лю бого линейного о п ер ато р а А : V —> V и для лю бого


г 1 им еет м есто ф орм ула

dim (Im A i _ 1 ПКегД) = dim Кег Д* —dim Кег Л'-1


(для г = 1 ф орм ула очевидна; следует и м еть в виду, ч т о по определению всегда
Л ° = 8 ).
8. Д о к а за ть , ч т о две м атр и ц ы А, В £ М П(М), подобны е над полем комплекс­
ны х чисел, будут подобны и над полем вещ ественны х чисел.
9. По аналогии с определением 2 назовём f{t) аннулирующим многочленом
о п ер ато р а А относи тельно в ек т о р а v £ V, если f { A ) v = О. А ннулирую щ ий нор­
м али зован ны й многочлен м инимальной степени н азы в ается минимальным мно­
гочленом оператора А относительно v . О бозначим его fij\^ { t). Б удем с ч и т а т ь
поле А бесконечны м. Д о к а за ть , что:
а) /EA,vM делит /хд(£);
б) сущ ествует а Е V с АЫ,а М = AM.W-
10. П усть V — в екторное п ро стр ан ств о , U, W — два его п од п р о стр ан ств а,
причём
У = У 1 0 У 2, VE = VEi 0VE2
— прям ы е разлож ения, где С i — 1,2. П усть, далее, Vi — проекция V на
V параллельно Vj, j
Д о к азать:
74 Г л. 2. Линейные операторы

а) если
v1 = w 1 + u n v 1, V2 = W 2 + V 2 (U), (*)
то У = W + U;
б) если V = W + U и V 2 ( U) n W 2 = О, то справедливы разлож ения (*) для Vi,
V2, причём W П U = W± П U.
11. Д о к а за ть , ч т о любая м ат р и ц а А £ М П(А) с коэф ф ициентам и в поле А
х а р ак т ер и с т и к и нуль и с нулевым следом подобна м атри ц е А ' с нулями по главной
ди агонали ( А ' = ( а £ ) , а'п = а 22 = . . . = о!пп — 0).
12. С ущ ественно ли в упр. 11 ограни чение char А = 0?

§ 3. И н в ар и ан тн ы е п о д п р о с т р а н с т в а
и с о б ст в ен н ы е в ек тор ы
1. П роекторы . Пример 4 из § 2, п. 1 устанавливает связь между
разложением V в прямую сумму двух подпространств и оператором
проектирования V , обладающим, как мы знаем, свойством V 2 = V.
Обратно: всякий оператор с этим свойством является оператором
проектирования. Мы докажем это утверждение в следующем более
общем контексте.
Пусть V = W\ 0 W 2 0 ... 0 W m — разложение в прямую сумму
т подпространств (см. и. 5 § 2 гл. 1). Тогда каждый вектор х £ V
однозначно записывается в виде
X = XI + Х2 0 ... 0 x m, X; £ Wi,
а отображение Vi : х i—у х* является линейным оператором на V .
Кроме того,
V i + V 2 + • • • + Vm = £,
причём V i V j = О при i ф j и V 2 — Vi . Наконец,
W i= V i V = { x e V \ V i X = x},
Ki = Ker Vi = W 1 + . . . + W i + . . . + W m
и Vi суть оператор проектирования V на Wi вдоль K i .
Т е о р е м а 1. Пусть V\ , . . . , Vm • V -А V — конечное множество
линейных операторов, удовлетворяющих условиям
т
^ 2V i = £; V? = Vi, ViVj = 0 , j. (1)
2=1

Тогда
V = W\ 0 ... 0 W 7m
где Wi = ImVi.
Д о к а з а т е л ь с т в о . По условию для любого х £ V имеем
х = £х = = xi + ... + xm, х* £ Wi.
§ 3. Инвариантные подпространства и собственные векторы 75

Поэтому V = W\ + ... + Wm. Эта сумма является прямой, в чём мы


убедимся, применив критерий из гл. 1, § 2, п. 5 (теорема 7). Именно,
предположим, что х Е Wj П W ) . Так как W\ — ImVi, то най­
дутся такие векторы x i , . . . , хш, что
х= =

Применяя к этому равенству оператор Vj и используя определяющие


свойства V 2 = Vj, VjVi = О при г ф j, получим

х = ^ i( xi) = Д2(ХЙ = E VW i ) = о.

Таким образом, сумма V = J^Wi прямая и Vi — оператор проекти­


рования V на Wi вдоль Ki = KerVi = Wj. □
Добавим, что если V 2 = V w V = U (&W — связанное с этим про­
ектором прямое разложение с U = Im V = ( ei , ..., er), W = KerV =
= (er_|_i,..., en), то в выбранном базисе оператору V отвечает
матрица
Ег 0
г = rankTT (2)
0 0
В частности, мы видим, что любая п х n-матрица А ранга г, обла­
дающая свойством А 2 = А , подобна матрице Р: В ~ 1АВ — Р и
rank А = tr А.
З а м е ч а н и е . Часто говорят, что операторы V i , ..., Vm, удовле­
творяющие соотношениям
ViVj = SijVi, 1 ^ г, j ^ т,
составляют ортогональную систему {Vi | 1 ^ г ^ т} идемпотент-
ных операторов, а отвечающие им матрицы — ортогональную си­
стему {Pi | 1 ^ г ^ т} идемпотентных матриц. Если выполнены все
условия (1), то говорят о полной ортогональной системе.
2. Инвариантные подпространства. Всякий линейный опе­
ратор А: V —УV действует не только на отдельные векторы х Е V ,
но и на подпространства U С V : AU = { Д х | х Е U}. В связи с этим
исключительно важное значение приобретает понятие инвариантно­
сти.
О п р е д е л е н и е 1. Подпространство U С V инвариантно отно­
сительно линейного оператора А: V —)>V, если AU С U.
Например, Кег Л и 1 т Л — инвариантные подпространства, хотя, возможно,
и тривиальные, т.е. совпадающие с {0} или с V . Для оператора дифференциро­
вания T>t на пространстве Рп многочленов степени <С п — 1 сразу же выделяется
цепочка
{0} С Hi С У2 С . . . С Уп = V (3)
инвариантных подпространств Vi многочленов степени <С г — 1; г = 1 ,2 , . . . , п .
Рассмотренное выше (п. 1) семейство операторов проектирования V \ 1 • • • 5Р т
76 Г л. 2. Линейные операторы

зам еч ател ьн о в том отнош ении, ч т о с ним ассоциировано большое число подпро­
стр а н с тв
w h 0 W i2 0 . . . 0 W ih , {u , . . . , h } с { 1 , 2 , . . . , m },
и н вари ан тн ы х сразу относи тельно к аж д о го оп ер ато р а Т \ , . . . , Т ш (мы здесь ис­
пользовали то очевидное о б стоятельство, ч т о сум м а и пересечение в V подпро­
с тр а н с тв , и н вари ан тн ы х относи тельно линейного оп ер ато р а Л, всегда и н вари­
ан тн ы ).
П рим ер противополож ного свой ства доставл яю т м атр и ц ы J p , N p , указан н ы е
в конце § 2. О твечаю щ ие им о п ераторы действую т на р-м ерном п р о стр ан ств е
V = Яр (над полем Я х а р ак т ер и с т и к и р > 0) т ак и м образом , ч т о у них нет
общ его нетри ви ал ьн ого и н вари ан тн ого п од п р о стр ан ств а. М ожно у к а з а т ь одну
сущ ественную причину т ак о го различия: [Pi,Vj] = О, в то врем я к а к [J p , N p] ф 0.
Н ад полем К т а к ж е м ож ет проявл яться подобны й феномен. О п ератор Л по­
в о р о та плоскости М2 на угол а (0 < а < тг; см. пример 3 из п. 1) не им еет
нетри ви ал ьн ы х и н вари ан тн ы х п о д п р о стр ан ств — прям ы х, которы е переходили
бы в себя при действии Л.
Наличие собственного инвариантного подпространства {0} С
С U С V даёт возможность упростить матрицу И оператора А
путём выбора надлежащего базиса в У. Именно, если дополнить ба­
зис (еь . . . , е т ) в U до базиса (еь . .., ет , ет + ь . .., еп) в V, то из
условия Aei G U, 1 ^ i ^ ш, следует, что в этом базисе матрицей
оператора А будет
А 1 Ао
0 н2
где А\ — m х ш-матрица, А 2 — (п —тп) х (п —тп)-матрица и Но —
m х (п —ш)-матрица. На А\ можно смотреть как на матрицу ли­
нейного оператора Аи — оператора Л, ограниченного на U (удобно
положить А\ = Ац).
Представим на минуту, что Но — нулевая матрица. Тогда, оче­
видно, W = (em_|_i,... , еп) тоже будет инвариантным подпростран­
ством в У, а Н2 — матрицей оператора Aw- В этом случае говорят
о прямой сумме операторов
А = Аи + Нщ, (5)
соответствующей разложению V = U 0 W в прямую сумму инвари­
антных подпространств. Матрица прямой суммы операторов имеет
клеточно-диагональный вид:
Аи 0 (5')
Аи + Aw-
0 Aw
Нами фактически доказана
Т е о р е м а 2. Пространство V является прямой суммой двух
подпространств U, W, инвариантных относительно линейного опе­
ратора А : V —> У, тогда и только тогда, когда матрица этого
оператора в каком-либо базисе принимает клеточно-диагональный
вид (5').
§ 3. Инвариантные подпространства и собственные векторы 77

Это утверждение очевидным образом переносится на любое


число т инвариантных подпространств, прямая сумма которых сов­
падает с У. При т = п = dim У мы приходим к условиям, когда
матрица линейного оператора в подходящем базисе становится диа­
гональной.
Вернёмся к тому случаю, когда в равенстве (4) матрицу A q нельзя
сделать нулевой, как бы мы ни выбирали векторы em+ i , ..., еп, до­
полняющие базис ( e i , . . . , e m) инвариантного подпространства U С
С У. Это значит, что хотя по теореме 9 из § 2 гл. 1 пространство У
разлагается в прямую сумму У = U(&W многими способами, ни одно
из дополнительных подпространств W не инвариантно относительно
А. Такую ситуацию лучше всего иллюстрирует оператор дифферен­
цирования V t : если У — одно из инвариантных подпространств Vi
в цепочке (3) и У = У 0 РУ, то заведомо (Vt (Wi)) П У ф 0.
Заметим в заключение, что если A(U) С [ /и B(U) С У, т.е. U —
общее для Л и В инвариантное подпространство, то U инвариантно
относительно линейных комбинаций а А + /ЗВ и произведений АВ,
ВА. В частности,
AU С U = > f(A )U С U
для любого многочлена / Е & [t\.
3. С о б ственны е векто р ы . Х а р ак те р и сти че ск и й м н о го ­
член. Одномерные инвариантные подпространства заслуживают
специального рассмотрения.
О п р е д е л е н и е 2. Любой ненулевой вектор из одномерного под­
пространства, инвариантного относительно Л, называется собствен­
ным вектором оператора Л. Если х — собственный вектор:
Лх = Ах,
то скаляр А Е А называется собственным значением оператора Л,
отвечающим собственному вектору х. Иногда говорят также: харак­
теристический вектор, характеристическое значение.
Заметим, что
Лх = Ах = > Л^х = А^х,
откуда
/( 3 ) х = /( А)х, (6)
каков бы ни был многочлен / Е A[t\. В частности,
/(Л ) = О = > /(А) = 0 (7)
для всякого собственного значения А оператора Л.
Пусть
е = {v е v\ A v = Av}
— подпространство, состоящее из 0 и всех собственных векторов,
ассоциированных с собственным значением А.
78 Г л. 2. Линейные операторы

О п р е д е л е н и е 3. Очевидная импликация
Д х = Лх, Д у = Лу = > Д(<тх + /Зу) = А(<тх + /Зу)
даёт основание называть V х собственным подпространством опе­
ратора Д, ассоциированным с Л. Его размерность dim V х называется
геометрической кратностью собственного значения Л.
Условие существования собственного вектора записывается, оче­
видно, в виде
( Д - А £ ) х = 0, х/0, (8)
т.е.
Кег (Д - А£) ф 0.
Это значит, что оператор Д —А£ вырожден:
det (Д - Х £ ) = 0. (9)
Если в каком-нибудь базисе (е*) пространства V матрицей оператора
Д является А = (а^), то матрицей оператора А — Х£ будет А —АЕ,
так что условие (9) переписывается в виде
ац —А <212 ••• Clin

det (A - AE) = &21 &22 — А ... <22п _ q

<2ni &п2 - - - Q"nn А


Пусть х = xiei + ... + хпеп — собственный вектор оператора
Д с собственным значением А. В матричной записи равенство (8)
принимает вид
(ац — X ) x i + a i 2 ^ 2 + . . . + СЦп Х п — 0,
O'2 1 X 1 + (a22 — X)x2 + . . . + CL2nx n = 0,

CLni Xi + an2 ^ 2 + . . . + (ann — X ) x n = 0.


Полученная система линейных однородных уравнений с определите­
лем (9'), равным нулю, имеет нетривиальные решения. Как мы знаем
из [ВА I], линейное пространство всех решений этой системы совпа­
дает с собственным подпространством Vх оператора Д. Размерность
dimKA (или геометрическая кратность А) равна п —г, где г — ранг
матрицы А —XЕ.
Развернув определитель det (tE —А) = (—l) ndet (Д —tE) по фор­
муле (3) из [ВА I, гл. 3, § 1]:
det (tE А) = ^ ^ Stt($1,7гД CL\,7г1) ($2,7г2^ ^ 2,772) • • • ($П,7Г?Д ^п,7гп) 5
тгesn
мы получим нормализованный многочлен
XA(t) = det (tE - A) = t n + Х1Г -1 + ... + Xn-it + Xn (Ю)
§ 3. Инвариантные подпространства и собственные векторы 79

степени п относительно независимой переменной t с коэффициен­


тами Xi £ А.
О п р е д е л е н и е 4. Многочлен (10) называется характеристи­
ческим многочленом матрицы А. Уравнение XA(t) = 0 называется
также характеристическим (иногда говорят о вековом уравнении
матрицы А).
На самом деле можно говорить о характеристическом многочлене
(или уравнении) линейного оператора Л, а не какой-то ассоциирован­
ной с ним матрицы А , поскольку наряду с теоремой 3 из § 2 имеет
место несложная
Т е о р е м а 3. Характеристические многочлены подобных
матриц совпадают.
Д о к а з а т е л ь с т в о . Пусть А' = С~гАС. Тогда det (tE —А') =
= det ( t C ^ E C - С - 1 АС) = ( C - ^ t E - А)С) = det C ^ d e t i t E -
- A ) d e t C = d e t ( t E - A). □
Итак, полагаем
ХлХ) ■■= XA(t).
Определяющее равенство (10) показывает, что скаляр Л Е А явля­
ется собственным значением оператора А тогда и только тогда, ко­
гда Хл(А) = 0, т.е. Л — корень характеристического многочлена.
Если многочлен х а (^) не имеет корней в А, то у оператора А нет
собственных векторов. Всякий линейный оператор, действующий
на комплексном векторном пространстве, обладает собственными
векторами.
О п р е д е л е н и е 5. Кратность Л как корня характеристического
многочлена Ха {^) называется алгебраической кратностью собствен­
ного значения Л оператора А.
Т е о р е м а 4. Геометрическая кратность собственного значе­
ния А не превосходит его алгебраической кратности.
Д о к а з а т е л ь с т в о . По определению геометрическая кратность
есть размерность т пространства V х решений уравнения Дх = Лх.
Очевидно, что V х инвариантно относительно А, и если А! — ограни­
чение А на V х, то det (tE' —A') = (t —A)m, причём XA(t) — (t —X)mq(t),
где q(t) — некоторый многочлен из A [t]. Пусть Л — корень кратности
к ^ 0 многочлена q(t). В таком случае алгебраической кратностью Л
будет т + к. □
4. К ритери и диагонализируем ости. Корни характеристиче­
ского многочлена Ха {^) (говорят также: характеристические корни)
составляют множество, несущее важную информацию о линейном
операторе А. По понятным причинам, однако, не все характеристи­
ческие корни равноправны.
О п р е д е л е н и е 6. Множество всех собственных значений линей­
ного оператора А называют спектром этого оператора и обозначают
символом SpecM (собственные значения считаются с их геометри­
80 Г л. 2. Линейные операторы

ческими кратностями). Аналогично говорят о спектре Spec А мат­


рицы А. Точка спектра называется простой, если ей отвечает геомет­
рическая кратность 1. Если все точки спектра простые, то и спектр
называется простым.
В случае алгебраически замкнутого поля, например, Я = С, ха­
рактеристические корни совпадают с точками спектра, но в общем
случае спектр может быть пуст, как, например, для оператора пово­
рота на вещественной плоскости.
Л е м м а 1. Собственные векторы, принадлежащие к различным
собственным значениям, линейно независимы. Сумма J^AeSpecа ^ Х
прямая (вообще говоря, V х не совпадает с V).
Д о к а з а т е л ь с т в о . Пусть Ai, . . . , \ т — какие-то различные соб­
ственные значения, V Xl, . . . , V Xm — соответствующие собственные
подпространства. Выберем в каждом V Xi по одному собственному
вектору е*. Нужно доказать их линейную независимость. Для т = 1
утверждение верно. Рассуждая по индукции относительно т и пред­
полагая существование нетривиальной линейной зависимости
аде! + «2^2 + ... + 0'тет = О,
где, скажем, ад ф 0, мы применим к обеим частям этого равенства
оператор А. Так как = А ^ , то
aaAiei + ад>А2е2 + ... + осш\ шеш = 0.
Умножая первое соотношение на \ ш и вычитая из него второе, при­
ходим к линейной зависимости первых т —1 векторов:
О Д (^га Т • • • Т O^ m — 1 ( А т ^ т —l)e m — 1 = 0.
Х \ )е 1

По предположению индукции ад(Ат —АД = 0, г = 1 , . . . , ш —1. Но


од ф 0, Хш ф Ai, i <т У oli(Am Ai) ф 0.
Полученное противоречие доказывает наше утверждение.
По определению любой отличный от нуля вектор Е V Xi явля­
ется собственным. Поэтому по доказанному V Xi П V Xj = 0. Это
и значит, что сумма JT V Xi прямая. □
О п р е д е л е н и е 7. Линейный оператор А на n-мерном простран­
стве V называется диагонализируемым, если существует базис (еД,
относительно которого матрица оператора принимает диагональ­
ный вид
Ai 0 .. . 0
0 А2 . 0
А=
0 0 .. Ап
Т е о р е м а 5. Линейный оператор А с простым спектром диаго-
нализируем.
§ 3. Инвариантные подпространства и собственные векторы 81

Д о к а з а т е л ь с т в о . Формулировка теоремы предполагает, что


многочлен х а (Ъ) имеет в основном поле Я п = dim У различных
корней Ai,...,An, которым отвечают собственные векторы е^, i =
= 1, . .. ,п. По лемме 1 эти векторы линейно независимы. Значит,
У = (ei , . .., еп), и так как = А^е^, то А = diag (Ai,. .., An). □
Простота спектра оператора является всего лишь достаточным
условием его диагонализируемости. Например, идемпотентный опе­
ратор диагонализируем (см. (2)), хотя его спектр при п > 2 не будет
простым. Внутреннюю причину этого факта отчасти объясняет
Т е о р е м а 6. Пусть А — линейный оператор на конечномерном
векторном пространстве V над полем Я. Для диагонализируемости
А необходимо и достаточно выполнения следующих двух условий:
i) все корни характеристического многочлена х а {1 ) лежат в Я;
и) геометрическая кратность каждого собственного значения
А совпадает с его алгебраической кратностью.
Д о к а з а т е л ь с т в о . Пусть выполнены условия i), ii). Если
Ai,..., Am — различные корни многочлена Ха {1), a fci,..., km — их
кратности, то
dim V Xi — hi, ki + k 2 + ... + km = n. (11)
По лемме 1 любая совокупность не равных одновременно нулю век­
торов Vi G V Xi, i = 1,..., m, линейно независима, так что
V Xi П {VXl + ... + У ^ + ... + V х™) = 0. (12)
Значит (см. теорему 7 из § 2 гл. 1), сумма V Xl + ... + V Xm прямая, а
с учётом равенств (11) получаем
У = V Xl + ... + УА™. (13)
Взяв за базис в У объединение базисов в V Xi, мы придём к собствен­
ному базису, т.е. к базису, состоящему из п линейно независимых соб­
ственных векторов оператора А. Его существование эквивалентно
диагонализируемости А.
Обратно: пусть оператор А диагонализируем. Снова обозначим
через Ai, . . . , \ ш его различные собственные значения и положим ^ =
= dim V Xi, 1 ^ г ^ m. Условие (12) по-прежнему выполнено, а так как
У имеет собственный базис, состоящий из элементов подпространств
УАД т0 V Xl,... , V Xrn порождают У. Из этого мы заключаем, что
имеет место равенство (13). Относительно базиса, получающегося
объединением базисов в V Xi, матрицей оператора А будет
А = diag (Ai, . . . , Ai; 5^
у > - - m i -

h l
Из равенства
XA(t) = XA(t) = det (tE - A) ( )l

6 А .И. К о стр и к и н
82 Гл. 2. Линейные операторы

вытекает, что все корни многочлена Хл{^) принадлежат Я, т.е. вы­


полнено условие i), и что целое число £ совпадает с алгебраической
кратностью ki корня (см. (11)) для i = 1,... , m. □
5. Существование инвариантных подпространств. Все
рассуждения, связанные с инвариантными подпространствами, соб­
ственными значениями и собственными векторами оператора, про­
ходят, в принципе, над произвольным полем. Однако существова­
ние рассматриваемых объектов находится в прямой зависимости от
основного поля, в чём мы убеждаемся на примере наиболее важных
полей Е и С.
Т е о р е м а 7. Всякий комплексный (соответственно веществен­
ный) линейный оператор А имеет одномерное (соответственно од­
номерное или двумерное) инвариантное подпространство.
Д о к а з а т е л ь с т в о . Так как характеристический многочлен
Ха (1) имеет в С хотя бы один корень, то известный метод нахожде­
ния собственных векторов заведомо даст одномерное инвариантное
подпространство исходного пространства V.
В случае вещественного поля Е рассмотрим минимальный много­
член fij{(t) оператора А (см. определение 2 из § 2). Его коэффициенты
лежат в Е. Если дл(^) имеет вещественный корень <т, то
Яд(*) = ( t - a)g(t), g(t) £ M[i],
Так как g(A) ф О в силу минимальности /i^(t), то д(А) и ф 0 для
некоторого вектора u Е V. Но
(А - а£) = (А - а£)д(А)и = /^д(Д)и = О,
откуда A v = (tv, т.е. v — собственный вектор.
Предположим теперь, что А не имеет собственных векторов.
Тогда по доказанному у дл(^) нет вещественных корней. Но по тео­
реме о многочленах с вещественными коэффициентами [BA I, гл. 6,
§ 4, теорема 1] мы имеем право записать
дл(1) — (t2 —оЛ —/3)h(t), а, /3 Е Е, h(t) Е Е [£].
Снова v = h(A)и ф 0 для некоторого u Е V и
A 2v —a A v —/3v = /хд(Д)и = 0.
Получается, что A 2v = a A v + /3v, а так как A v ф Av (одномерного
инвариантного подпространства нет), то L — (v, *4v) — двумерное
инвариантное подпространство. □
6. Сопряжённый линейный оператор. Посмотрим, в какой
связи находятся понятия оператора и сопряжённого пространства.
Пусть V — векторное пространство над полем Я, Е* — сопряжённое
к нему пространство и А — линейный оператор на V. При любом
фиксированном элементе / Е V* отображение х н->> (/, Ах.) := f(A x)
(в обозначениях п. 2 § 3 гл. 1) снова является элементом из V*, т.е.
§ 3. Инвариантные подпространства и собственные векторы 83

линейной функцией:
(/, А(ах + /5у)) = (/, а А х + (ЗАу) = a(f, Лх) + /5(/, Ау).
Раз это так, то мы можем положить
( A * f ,x ) : = ( f,A x ) , (14)
считал символ Л */ некоторой линейной функцией на У. Соответ­
ствие Л* : / I—>A* f при переменном / определяет линейное отобра­
жение У* —>• У*:
(A*(af + /Зд),х) = (a f + /3д, Ах) = a ( f,A x ) + /3(д,Ах) =
= а(А* f, х) + (3{А*д,х) = (аА* f + (ЗА* д,х),
так что А * Е £(У*).
О п р е д е л е н и е 8. Линейный оператор А * на У*, заданный со­
отношением (14), называют оператором, сопряжённым к А £ £(У).
Итак, мы имеем отображение C(V) —> £(У*), а именно * : А н->•
|—>• Л*. Непосредственно из определения мы выводим следующие его
свойства:
0 v* = О у*, = £ у , (а А)* = а А*,
(Л + в у = Л* + В \ (АВУ = Б* Л*. (15)
Например, последнее соотношение в (15) доказывается так:
((A B )* f,x ) = (/, (АВ)х) = (f,A { B x )) = {A* f, Вх) = (В*А* f,x ) .
Чтобы задать оператор Л* в матричном виде, естественно вы­
брать в У и У* дуальные базисы (е^), (ег). Если Aej = УУУ= 1 ctkjek,
то
п п
(е , Aej) = ^ ^ Qfej (^ , в/g) = ^ ^ Qfej5^^ = dfj.
&=1 &=1
Положив, далее,
п
А*е 1 = ^ * ые \
к= 1

будем иметь (Л*ег,е^) = (Аы {ек, &j) = а^. Так как, с другой
стороны, в соответствии с (14) (Л*ег,е:/) = (ег, Ле^) = а^-, то a*f =
= ац. Следовательно, верна
Т е о р е м а 8. Если в базисе (е^) пространства V линейный опе­
ратор А имеет матрицу А = (а^), то в дуальном базисе ег про­
странства У* сопряжённый к А оператор Л* имеет транспониро­
ванную матрицу lA: А* = (а*^) = 1А. □
Заметим, что рефлексивность конечномерных векторных прост­
ранств, дающая возможность отождествить У** и У посредством
6*
84 Гл. 2. Линейные операторы

естественного изоморфизма (теорема 2 из § 3 гл. 1), на уровне опе­


раторов выражается в виде
Л** = Л. (16)
Действительно, в силу рефлексивности любую линейную функцию на
У* можно мыслить себе как / н->> (/, х) при некотором фиксирован­
ном х е У. В частности, (Л*/, х) = (/, у). По определению у = Л**х.
Стало быть,
(/, А х ) = ( A * f, х) = (/, 3**х),
откуда и вытекает соотношение (16). Оно показывает, что отобра­
жение Л и-» Л**, обладающее свойствами (15), взаимно однозначно.
Его называют антиизоморфизмом алгебр C(V) и £(У*).
Одновременное рассмотрение пар (У, Л), (У*, Л*) часто приво­
дит к практическим результатам. Одним из содержательных приме­
ров этого является доказательство следующего утверждения.
Т е о р е м а 9. Всякий комплексный линейный оператор Л на V
обладает инвариантной гиперплоскостью.
Д о к а з а т е л ь с т в о . Пусть dim V — п. Как мы знаем, dim Кег/ =
— п — 1 для любой линейной функции / / 0 на У. Возьмём теперь
в качестве / собственный вектор линейного оператора Л* на У*.
Он существует по теореме 7, и если Л — отвечающее ему собствен­
ное значение, то, как следует из определяющего равенства (14), х Е
е Кег/ = > 0 = Л(/,х) = (А/, х) = (A * f ,x ) = (/, Ах.) =>■ А х £ Кег/.
Это и означает, что Кег/ — искомая гиперплоскость. □
7. Фактороператор. Пусть L — подпространство, инвари­
антное относительно линейного оператора Л, действующего на век­
торном пространстве У. Считая У и L фиксированными, будем
обозначать факторпространство У/L, определённое в п. 6 § 2 гл. 1,
символом У, а любой его элемент х + L через х.
О п р е д е л е н и е 9. Соотношением Л • х = Лх на У вводится
фактороператор. Другими словами, Л(х + L) = Лх + L.
Это определение не зависит от выбора представителя х: если х +
+ L = х' + L, т о х —х' = у G L и Лх —Лх' = Л(х —х') = Лу G L (в
силу инвариантности L относительно Л). Отсюда Лх + L = Лх' + L.
Если бы L не было инвариантным относительно Л, то определение
фактороператора Л теряло бы всякий смысл.
Предположим, что У = Ь ф М — прямая сумма инвариантных от­
носительно Л подпространств. Тогда, как мы знаем, Л = Ль + Л м —
прямая сумма операторов ограничений Л на L и М . Если / : u i—>
!->• и + L — изоморфизм между М и У = V/L (теорема 10 из § 2
гл. 1), то
(/ • А м )У = /И м у) = АмУ + ь = А (у + L) = Л(/у),
откуда
f - Ам = A - f . (17)
§ 3. Инвариантные подпространства и собственные векторы 85

Итак, действие Л на У совпадает с действием Л м на М . Говорят,


что равенство (17) устанавливает эквивалентность (подобие) между
А и Дм-
ii р и м е р . К а к известно, всяком у линейному о п ератору В, действую щ ем у в
двумерном векторном п р о стр ан ств е V = ( e i , e 2 ) с собственны м век тором e i ,
о т в е ч а е т т реугол ьн ая м атр и ц а . П ри V = V / ( e i ) = ( ё г ) имеем Л ё 7 =

= Р&2 -
Если теп ерь V = (е 1 , е 2 , е з ) — трёхм ерное в екторное п р о стр ан ств о над С
и А: V V — линейны й оп ератор с собственны м в ек тором e i (А е \ = а е i ,
a G С), т о на двумерном п р о стр ан ств е V = V / (е\) = ( ё г , ё з ) дей ствует ф ак то р о -
Р 6
п ер ато р А , к о тором у по преды дущ ем у о т в е ч а е т треу го л ьн ая м атр и ц а
0 7
в подходящ ем базисе. П усть для п р о с то т ы им будет базис ( ё г , ё з ) . Т огда
А ё 2 = (Зё2 <!=> А е 2 = (Зе2 + v e \ ,
А Щ = у ё ^ + 6 ё 2 *<=> Л е 3 = у е 3 + 6 е 2 + .
Т аким образом ,
а V и
А = 0 р 5
0 7 0
А налогичны е соображ ения использую тся и в общем случае.

УП РА Ж Н ЕН И Я

1. П усть {А{ | 1 <С г <С m — 1} — о р тогон ал ьн ая систем а и д ем п отен тн ы х


м атр и ц (см. зам ечан ие в конце п. 1). П о к а за ть , ч т о А 2 = А, АА{ — А{А — A j,
1 <С i <С т — 1 для А = A i А А 2 + . . . + А ш - 1 , и если полож ить А ш = Е — А, то
{ А{ | 1 <С г <С т ) будет полной ортогон ал ьн ой системой.
2. П усть Т>: М п (Я) —» М п ( Я) — не тож д ествен н о равн ы й О линейны й опе­
р а то р на п р о стр ан ств е к в ад р ат н ы х м атри ц , обладаю щ ий свойством м ультипли­
к ати вн ости :
V (A B ) = V (A )V (B )
для всех А, В £ М п ( Я) . Д о к а за ть , ч т о т о гд а Т> = f с для некоторой невы рож ден­
ной п х n -м атр и ц ы С (см. упр. 3 из § 1).
3. П усть А : V —> V — линейны й оп ератор так ой , ч т о I m А р = I m A p + 1 для
н ек оторого н ату р ал ьн о го числа р. Д о к а за ть , ч т о в этом случае V = К ег А р (&
ф ! т А р — прям ая сум м а двух Л -и н в ар и ан тн ы х п о д п ростран ств.
4. Д о к а за ть , ч т о если линейные о п ераторы £, Л , Л 2, . . . , Л п _ 1 , действую щ ие
на векторном п р о стр ан ств е V р азм ерн ости п, линейно независим ы , то суще­
ств у е т так ой в ек то р v £ V, ч то
V = ( v , A v , A 2v , . . . , A n ~ 1v )

(в этом случае го во р ят, ч т о V циклично).


5. П усть А — вещ ественная п х n -м ат р и ц а без вещ ественны х собствен ны х
значений, т а к что , в частн о сти , п чётно и А о брати м а. П о к а за ть , ч т о сущ ествует
вещ ественная м ат р и ц а В т ак а я , ч т о А В = В А и В 2 = —Е — единичная м атр и ц а
(Д. Д ж окович).
6. Д о к а за ть , ч т о для лю бы х А, В £ М п (Ш) х а р ак тер и с ти ч е ск и е многочлены
м атр и ц А В и В А совп адаю т.
86 Г л. 2. Линейные операторы

7. Н ай ти х а р ак тер и с ти ч е ск и е корни “ц и клической” м атри ц ы

ао а\ а2
а2 ао а\
ai а2 ао

используя легко проверяем ое соотнош ение

0 1 0
А — а о Е -\- а \ В а 2Б ^ , В = 0 0 1
1 0 0

8 . Д о к а за ть , ч т о п р о стр ан ств о SM agn (Q) полум агических к в ад р ат о в (см.


пример 8 из § 1 гл. 1) явл яется Q-подалгеброй в M n (Q).
9 [Amer. M ath. M onthly. — Febr. 1991. — P. 131-133]. П усть A, В £ M n (A ),
char А Ф 2. Б удем п и сать В ~ А, если В = D A , где D = d i a g ( # i , . . . , 0n ), 9{ = ± 1 .
О чевидно, ч т о ~ — отнош ение эк вивалентности . Если S (A ) — класс экви вал ен т­
ности с п редставителем А, то C ard S '(A ) <С 2П.
Д о к а за ть , ч т о по край ней мере одна из м атр и ц в S (A ) не им еет собствен ного
значения 1.
10. П усть А — линейны й оп ератор на n -мерном векторном п р о стр ан ств е V.
П о к а за ть , ч то
А? — А ra n k А + ra n k (8 — А ) = п.

§ 4. Ж о р д а н о в а норм альная ф о р м а

Пытаясь разобраться с действием заданного линейного опера­


тора А : V —> V, естественно поставить перед собой цель найти
базис в V , наилучшим образом согласованный с А. Другими словами,
в классе подобных матриц С~хАС, отвечающих оператору А, требу­
ется найти матрицу, имеющую как можно более простой вид. По по­
нятным причинам эта задача существенно связана с основным полем
Я, над которым определено векторное пространство V. В дальней­
шем считаем, что Я = С — поле комплексных чисел, хотя в принципе
С можно заменить на любое алгебраически замкнутое поле.
1. Теорема Гамильтона— Кэли. Весьма полезно следующее
несложное утверждение.
Т е о р е м а 1. Матрицу линейного оператора А всегда можно
привести (в смысле подобия) к треугольному виду.
Д о к а з а т е л ь с т в о . Проще всего в этом убедиться рассужде­
нием по индукции. По теореме 9 из § 3 пространство V содержит
инвариантную относительно А гиперплоскость U : AU С U. По пред­
положению индукции в U можно выбрать такой базис (ei , . .., en_i),
что Де; = X^i + Vf, Vi G (еь ... ,ei_i). Имеем V = (U,en), где
en — произвольный, не содержащийся в U вектор. Пусть Деп =
= Anen + u, u G U. Таким образом, в базисе (ei , . .., en_i, еп) дейст­
§ 4 • Жорданова нормальная форма 87

вие оператора Д выражается матрицей требуемого вида


Ai
м *

0 Ап
Теперь довольно просто доказывается содержательная
Т е о р е м а 2 (теорема Гамильтона—Кэли). Линейный оператор
А и соответствующая ему матрица А (в любом базисе) аннулиру­
ются своим характеристическим многочленом хл(^)> т-е
х а (А) = О.

Д о к а з а т е л ь с т в о . Так как это утверждение не зависит от вы­


бора базиса (см. п. 3 § 2), то естественно воспользоваться теоремой 1,
с самого начала считая матрицу А в базисе ( e i , . . . , e n) имеющей
треугольный вид (1). Рассмотрим цепочку Д-инвариантных подпро­
странств
V = Vo D V i D . . . D Vn- i D К = О,
Vk = (ei, е2, . .., en—k—i j en—k)• Так как (Д Xn—k£)en—k Е ,
то
{A Xn-k£)Vk С V&-I-1
и, стало быть,
п
Xa (A)V = H ( A - X X ) V =
1=1

= (Д - Xi£ ) ... (Д - Хп£)Ц3 С (Д - Хг£) . . . ( A - X n - i S ^ С


С ( А - Хг£) . . . ( А - АП_2£)К2 С ... С (Д - Ai£)Kn_i = 0.
Но Xa (A)V = 0 ^ Ха (А) = О .П
С л е д с т в и е . Минимальный многочлен линейного оператора
является делителем характеристического многочлена хл(^)5 деля­
щимся на все линейные множители t —А, А Е 8рес(Д).
Д о к а з а т е л ь с т в о . По определению fij,{А) = О, а по теореме 2
Х а (А) = О. Делимость хл(^) на Яд(£) вытекает теперь из теоремы 2
из § 2.
Если, далее, А — собственное значение оператора Д, то
A v = Av =>■ 0 = /i a (A) v = (i a W v = > Дд(А) = 0 =>■ (t - А) |
(мы повторили вывод импликации (7) из § 3). □
З а м е ч а н и е . Казалось бы, det (tE — A)\t=A = det (AE —A) =
= det 0 = 0, и теорема Гамильтона—Кэли доказана. Но это совер­
шенно неверное рассуждение. Подумайте, почему.
88 Г л. 2. Линейные операторы

Теорема Гамильтона—Кэли имеет многочисленные приложения,


но нами пока она будет использоваться в самой непосредственной
форме.
П р и м е р 1. П усть А : V —> V — н и лы ю тен тн ы й линейны й оп ератор индекса
н и льп отен тн ости т (см. определение 3 из § 2), т а к ч т о дм(£) = t 171.
П усть A rn~ 1v ф О. Т огд а в ек то р ы v , Л v , . . . , A rn~ 1v линейно независим ы .
Д ействительно, всякая нетри ви ал ьн ая линейная зави си м ость им еет вид

A k v + a i A k+1v + . . . + Л т _ 1 v = 0, 0 ф к ф т — 1.

П рименение о п ер ато р а А гп~ 1~ к к обеим ч астям это го равен ств а привело бы нас
к соотнош ению *4m _ 1 v = 0, проти воречащ ем у вы бору v.
И т ак , индекс н и льп отен тн ости т о п ер ато р а А не превосходит п — dim V,
что , разум еется, в ы т е к а е т и из тео р ем ы Г ам и л ьтон а— Кэли. П редполож им т е ­
перь, ч т о т — п и Л п _ 1 е ф 0. Введём следующие обозначения для базисны х
векторов:

e i = А п хе, е <2 = А п 2е, ..., e n _ i = Л е, е п = е.


Т огда A e i = 0, Лед, = ед,_ 1 , /с > 1, и м атри ц ей о п ер ато р а Л в базисе ( e i , . . . , е п )
будет ж ордан ова к л ет к а J n (А) с А = 0, определение которой дано ч у т ь ниже.
Если, скаж ем , V = (1 , £ , . . . , t n _ 1 ) — п р о стр ан ств о многочленов степени
^ _ d
< п над С и и — — — оп ератор ди ф ф еренц ирован ия по t, то м атри ц ей это го
dt
оп ер ато р а в базисе (е^), = —Г , будет к а к раз к л ет к а J n (0).
i\
О п р е д е л е н и е 1. а) Назовём1) (верхней) клеткой Жордана
размера т х т (или порядка ш), соответствующей собственному зна­
чению Л, матрицу
Л 1 0 ... 0 0
0 Л 1 ... 0 0

0 0 0 ... Л 1
0 0 0 ... 0 Л
б) Жордановой матрицей называется матрица, состоящая из
диагональных блоков J m. (Л«) и нулей вне этих блоков:
J m i (^1) 0
(2)
0 J m s (^s)

в) Жордановым базисом для линейного оператора А : V —> V


называется такой базис пространства V , в котором матрица опера­
тора А является жордановой, или, как говорят, имеет жорданову
нормальную форму (ЖНФ) J(A).

-бВ ч е с ть ф ран ц узск ого м а т е м а т и к а К . Ж о р д а н а (1838-1922).


§ 4 • Жорданова нормальная форма 89

г) Приведением квадратной матрицы А к жордановой нормаль­


ной форме называется решение уравнения в матрицах вида Х ~ хА Х =
= J(A ), где X — (неизвестная) невырожденная матрица, a J(A) —
(неизвестная) жорданова матрица.
Заметим, что J m(Л) —ХЕ = J m(0) — нильпотентная матрица. В
частности, (t —Х)т — минимальный многочлен клетки Жордана (2)
и Л — её единственное собственное значение: Spec J m(A) = {Л}.
П р и м е р 2. П усть D n (А) — в екторное п р о стр ан ств о комплексны х ф ункций
ви да где Л Е С, f ( t ) п р о б егае т м ногочлены степени <С п — 1. Т ак к ак

4(extm ) = ext(xm+f'(t)),
at

то ди ф ф еренц ирован ие V = — явл яется линейны м оператором на D n (X). Поло-


dt
pi
ж им е ^+1 = —ex t , i = 0 , . . . , n — 1. О чевидно,

^ ег+1 ———eAt + \ —еМ = е* + Xei+1


(г — 1)! г!

(0! = 1; первое слагаем ое о т су т с т в у е т при i = 0). С ледовательно, ф ункции


}
о бразую т ж орданов базис для о п ер ато р а Т> в наш ем п р о стр ан ств е и J(T>) =- м х ) .
Этот пример показывает особую роль жордановых матриц в
теории линейных дифференциальных уравнений. Мы к нему ещё вер­
нёмся.
П р и м е р 3. Если f ( t ) — произвольны й многочлен, то

/(А ) /'(А )/1 ! Г (А )/2 ! .. . /<™-1)(А)/(т-1)!


0 /(А ) /'(А )/1 ! . / ( т _ 2 ) ( А ) / ( т — 2)!
/ ( J m (A)) =
0 0 0 /(А )
т а к ч т о с J mjx го р азд о легче оп ери ровать, чем с произвольны м и м атри ц ам и .
2. Ж Н Ф : ф орм улировка и следствие. Сформулируем основ­
ное утверждение и его следствие.
О с н о в н а я т е о р е м а . Каждая квадратная матрица
А порядка п над алгебраически замкнутым полем А (в частности,
над С) приводится к жордановой нормальной форме. Именно, суще­
ствует невырожденная матрица С, для которой С~ХАС = J(A) =
— J — матрица вида (2). С точностью до перестановки клеток
жорданова нормальная форма матрицы единственна.
Так как минимальные многочлены подобных матриц совпадают,
то из основной теоремы и из замечаний, сделанных по поводу жор­
дановой клетки J m(A), следует, что
цА(г) = а - \ ^ . . . ( t - x ip)mi% (з)
где {Aix, . . . , Xip} — все попарно различные собственные значения
90 Г л. 2. Линейные операторы

матрицы А и rrijk — максимальный порядок жордановой клетки, от­


вечающей собственному значению Лjk.
Ясно, что необходимым и достаточным условием диагонализиру-
емости матрицы А (т.е. подобия её матрице diag (Ai,. .., Ап)) явля­
ется отсутствие в J(A) клеток порядка > 1. Поэтому с учётом (3)
получается следующий полезный критерий.
С л е д с т в и е . Квадратная матрица А над С диагонализируема
тогда и только тогда, когда её минимальный многочлен /м(^) не
имеет кратных корней.
Этот критерий эффективен, поскольку для вычисления Ца (£)
нет необходимости приводить матрицу А к жордановой нормальной
форме.
Доказательство основной теоремы разбивается на три части, со­
ответствующие пи. 3-5. Попутно будут сформулированы некоторые
практические рекомендации для получения ЖНФ (жордановой нор­
мальной формы), а затем мы укажем на другие доказательства.
3. К орневы е подпространства. Приведём следующее
О п р е д е л е н и е 2. Множество векторов
У (Л) = {v Е У| (А —X£)kv = 0 для некоторого к}
называется корневым подпространством, соответствующим собст­
венному значению Л Е Spec А.
В том, что У(Л) — подпространство, нас убеждает лёгкая про­
верка. Если, например, u Е У (A), v Е У (А), причём (А — A£)su = О,
(А —X£)fv = 0, и т — m ax{s,£}, то
(А —Х£)т(аи + (3v) = а(А —Х£)ти + /3(А —X£)mv = О,
откуда сш + /3v Е У (А) при любых <т, (5 Е С. Так как в У (А) со­
держится собственный вектор, отвечающий А, то У (А) ф 0. Далее,
V х С У (А), но равенства может и не быть, как показывает пример
нильпотентного оператора А индекса нильпотентности п > 1. В этом
случае А = 0 — единственное собственное значение, dim У0 = 1, но
У(0) = У.
Так как dim У (А) ^ п и ограничение А — Х£ на У (А) является
нильпотентным оператором, то
У(А) = {v Е У | ( А - Х£)п = 0 }.
Т е о р е м а 3. Пусть А: V —> V — линейный оператор с харак­
теристическим многочленом
р
XA(t) = ~ [[{t - \ i ) n i; Aj ф Xj при i ф j.
2=1

Тогда У = y ( A i ) 0 . .. 0У(Ар) — прямая сумма корневых подпро­


странств У (АД, каждое из которых инвариантно относительно А
§ 4 • Жорданова нормальная форма 91

и имеет размерность dim У (АД = П{. Оператор А —XiS, нильпо-


тентный на У(АД, действует невырожденным образом на подпро­
странстве
У = V (Ai) 0 ... 0 V (Ai_i) 0 V (Ai+i) 0 ... 0 У(АР).
Наконец, A^ — единственное собственное значение оператора
Mv(Xi)-
Д о к а з а т е л ь с т в о . Ни один из простых множителей t — А/, не
может быть делителем одновременно всех многочленов
Xi(t) = Ц (2 - Xj)nj, i = 1,2,... ,р,
зфг
и поэтому НОД (%i(t),. .., Xp(t)) = 1- Найдутся, стало быть, много­
члены /i (t), . . . , fp(t) E C[t\, для которых

^ 2 x i(t)fi(t) = 1. (4)
2=1
Подпространства
= * (Л ) /<(Л) г = {Xi(A)fi(A)v I V е Г},
инвариантны относительно A:
AW, = Xi(A) fi(A) A V c Xi ( A ) fi(A) У = ИД
Кроме того,
( A - X i £ ) n i Wi = x a ( A ) fi(A) V = 0

(поскольку по теореме 2 x a (A) так что


= О),

Wi c у (а д . (5)
Соотношение (4), переписанное в виде

£ = ^хМ )М А ),
2=1
дает нам разложение

V = Y ,W i
2=1

тем более (ввиду включения (5))

г = 5 > ( а4).

Предположим, что v Е У(АДПУ, где, как и в формулировке теоремы,


Vi = Тогда ( А - Xi £ ) nv = 0, а так как v = и
(А — Xj£)nvj = 0 , то и {Yij^i(A —Xj£ )n}v = 0 . Но из взаимной
92 Г л. 2. Линейные операторы

простоты многочленов (t —АДП, c(t) = —Xj)n следует сущест­


вование a(t), b(t), для которых
a(t) (t —Xi)n + b(t) c(t) = 1.
Получаем
v = а(Л)(Л - Xi£)nv + 6(Д) jJJ(A l A?£)n }v =
зфг
т.е. пространства У (АД и У не пересекаются. Значит, мы имеем
разложение
у = У(Л1) 0 . . . 0 У ( Л р ) (6)
в прямую сумму Д-инвариантных подпространств.
Из включения (5) и из разложения (6) непосредственно вытекает,
что Wi = У(АД. Таким образом, для У(АД получено эффективное
выражение
V ( X i ) = Xi(A)fi(A)V,
где хДД? fi(t) — многочлены из тождества (4). В частности,
(А —Xi£)nV (АД = 0.
Минимальным многочленом для А на У (АД будет некоторый дели­
тель многочлена (t —Xi)ni. Отсюда следует, во-первых, что Ai —
единственное собственное значение оператора А \у(\{)- Далее, в ба­
зисе, являющемся объединением базисов пространств У (АД, опера­
тор А имеет матрицу
А, .... 0
• О

Ар
где А{ — матрица порядка п\ — dim У (АД с единственным собствен­
ным значением Х{ и характеристическим многочленом
XAi(t) = (t - A*)nS п '^ щ .
Так как XA(t) = П *=1 XAt (t), то n = n [ + ■■ ■ + n'p и n \ = щ.
Осталось доказать невырожденность ограничения (А — А^£)|у..
Но это понятно: в противном случае {Кег(Д —А^£)} П У* / 0 и
A v —Xiw = 0 для некоторого 0 / v Е У. Однако на У характе­
ристическим многочленом для А является хДД = ~ УДПУ и
Ai собственным значением быть не может. □
4. Случаи нильпотентного оператора. Теоремой 3 задача
о выборе простейшей матрицы для линейного оператора А : V —>V
свелась к тому случаю, когда А имеет единственное собственное зна­
чение А и (Л - АЕ)т = О, т ^ dim V. Положив В = А — X£, мы по­
лучим нильпотентный оператор индекса нильпотентности т с ниль-
потентной матрицей В. В рассматриваемой ситуации естественным
является
§ 4 • Жорданова нормальная форма 93

О п р е д е л е н и е 3. Линейная оболочка
R[B]v = (v, Bv, Bm'~lv)
называется циклическим подпространством, ассоциированным с
оператором В индекса нильпотентности т и вектором v. Предпола­
гается, что т! ^ т — наименьшее натуральное число, для которого
B m' v = 0.
Т е о р е м а 4. Жорданова нормальная форма J{B) нильпотент-
ной матрицы В существует (основное поле Я произвольное).
Д о к а з а т е л ь с т в о . Из примера 1 и из определения 1 видно, что
всякому циклическому подпространству отвечает клетка Жордана.
Нам нужно показать, что векторное пространство V , на котором
действует нильпотентный оператор В с матрицей Б, разлагается в
прямую сумму надлежащим образом выбранных циклических под­
пространств.
По теореме 1 матрица В приводится к верхнему треугольному
виду с нулями по диагонали. Это значит, что линейная оболочка U
первых п —1 базисных векторов инвариантна относительно В. По
определению BV С С/, а по предположению индукции в U можно
выбрать жорданов базис для В , или, что то же самое,
U = Я[В]е1 ф ...ф Я [ В ] е 8, (7)
R[B]ei = (ei, Веи . .. , Bmi~yе{) , Bmiei = 0.
Без ограничения общности считаем
mi ^ ш2 ^ ^ m s. (8)
Далее, V = (v,£/), B v Е U для любого вектора v, не содержащегося
в [/, так что Bv = аде^ + Би, и Е U. Заменяя v на v' = v — и,
будем иметь
S

V = (v’ ,U), Bv' = Y , a i e i .


2=1
Если ад = 0, 1 ^ i ^ s , то к клеткам Жордана Jmi (0),..., Jms (0)
добавится Л(0), отвечающая циклическому подпространству (v'),

в ~ J(B) = diag (Jmi (0 ),..., Jma (0), Ji (0))


— знак подобия).
Остаётся рассмотреть случай, когда
s
ад = ... = ад_ 1 = 0, Bv' = ^ адед аг ф 0
i —r
для некоторого индекса г ^ 1. Удобно положить
/ • / / 1 / /О *^2
е2 = еь гф г, ег = — v , Д; = — •
ад а,
94 Г л. 2. Линейные операторы

Тогда

Be'r = er + ^ f a e i := fr.
i=r+l

В соответствии с упорядочением (8) Bmrfr = 0, а так как сумма (7)


прямая, то B 17lr~ 1 fr ф О, какие бы ни были коэффициенты Д. Кроме
того, лёгкое рассуждение показывает, что сумма
5^ Я [В] е[+Я[В] fr
гфг
также является прямой и совпадает с U.
Но теперь циклическое подпространство Я [В] fr расширяется за
счёт вектора e'r ^ U: Я [В] fr С Я [В] е'г, и мы имеем прямую сумму
S

Г = 0 Я [ В ] е ;,
2=1

отвечающую набору индексов ттД,... , m's, где ш- = i / г, ттД =


= mr + 1. В свою очередь
В ~ diag (J m- (0),..., Jmrs (0))
(число клеток Жордана сохранилось прежним, но размер одной
клетки увеличился на 1). Последовательность (т[ , ..., т'8), вообще
говоря, не упорядочена, но этого всегда можно добиться путём пере­
обозначения векторов е^. Таким образом, существование жорданова
базиса для нильпотентного оператора В доказано. □
5. Е динственность. Приступая к доказательству единствен­
ности, укажем заодно практическое правило для приведения произ­
вольной матрицы А порядка п к жордановой нормальной форме.
Для этого нужно уметь находить число iV(m, Л) жордановых кле­
ток Jm(Л) порядка ш, отвечающих собственному значению Л ма­
трицы А. Сопоставим обычным образом матрице А оператор А, дей­
ствующий на n-мерном векторном пространстве V , и разложим V в
прямую сумму
V = У(Л) 0 V', (9)
где
S

Г(А) = 0 (ej, (3 - X£)ej, \£)rn‘i ~1ej ) ,


3=1
v = Y
\'ф\
,v(л')-
Будем подсчитывать ранг rt = rank (А —\ Е ) г матрицы (А —\ Е )г,
или, что то же самое, размерность пространства (А —\ £ ) г V. Эта
§ 4 • Жорданова нормальная форма 95

размерность, конечно, не зависит от выбора базиса в У. Каждое из


пространств в разложении (9) инвариантно относительно (Л —Х£)г,
поэтому
dim (Л —Х£)гУ = ^ dim (Л —Х£)г С [Л] ej + dim (Л —X£)f У'.
з
Считаем для определённости т\ ^ ^ ... ^ m s. Если rrij ^ £, то
(Л —Х£)г С [Л] ej = 0. При rrij > t имеем
(Л —Х£)г С [Л] ej =
= ((Л - XSYej, (Л - X£)t+1 ej, . .., (Л - ХЕ)771^ 1^ ) ,
так что
dim (Л —А£)* С[Л] ej = —t.
На У' оператор Л Х£ невырожден (теорема 1), поэтому
dim ( Л - А £ ) * У ' = бпнУ'.
Получаем
ту = ^ {rrij —t) + dim У',
rrij >t
откуда

r4 - ri+ i = (mi - f) ~ E (m J - 1 - !) =
rrij>t rrij>t -\-1

= E - *) - E (™i - *) + E 1=
rrij>t rrij>t -\-1 mj>t+l

— ^ ^ 1+ ^ ^ 1 —-/V(£ + 1, A) + _/V(£ + 2, A) + ...


rrij=t-\-l rrij>t -\-1

Стало быть,
^*ra—1 ^m (^*m
^ra+l) —{-/V(m, A) + N {гп + 1, A) + . . . }
- {N(m + 1, A) + N(m + 2, A) + ... } = N(m, A),
и мы получаем окончательную формулу
7V(m, А) = гш—1 2гш + гт _)_1, (Ю)
m ^ 1, ту = rank (Л —Х£)ь, го = п.
Заметим, что rt — инвариант матрицы А (т.е. число, определяе­
мое классом подобия матрицы А). Значит, формулой (10) устанавли­
вается также единственность жордановой формы J{A). □
До сих пор о матрице (7, осуществляющей подобие
J{A) = С - 1 АС,
96 Г л. 2. Линейные операторы

почти ничего не говорилось. Но так как теперь А и J(A) — известные


нам матрицы, то С = (с^-) можно найти из матричного уравнения
X J(A ) - А Х = О,
о котором упоминается в определении 1 из п. в) и которое эквива­
лентно линейной однородной системе порядка п2. Пусть С\ , . . . , Сг —
её фундаментальная система решений. Вообще говоря, не все С{ —
невырожденные матрицы, но так как жорданова нормальная форма
J(A) существует, то
det {t\C\ trCr ) ф О
(с неопределёнными коэффициентами £i,... ,tr), и можно подобрать
комплексные числа ад, ..., а г, для которых
det (адCi -I-... -I- схгСф) ф 0.
Тогда С = адCi + ... + a rCr — искомая матрица. Разумеется, С
определяется далеко не единственным образом, даже при нормировке
det (7 = 1. Нахождение таким способом матрицы (7, осуществляющей
переход к жорданову базису, не очень практично, хотя и не пред­
ставляет принципиальных трудностей.
П р и м е р 4. М и ним альны м многочленом п х п -м атр и ц ы

1 .. . 1
W
Ь?
II

ij 1 .. . 1
удовлетворяю щ ей соотнош ению S 2 = n S , будет, очевидно, p s ( t) = t 2 — n t , т.е.
Ai = n, А2 = 0 — собственны е значения м атр и ц ы S к р а т н о с ти 1 и п — 1 с о о тв е т ­
ственно. Т ак к ак , далее, ra n k S = 1 и S не м ож ет бы ть н и льпотентной м атриц ей
(не т о т миним альны й м ногочлен), то для её ж ордановой ф орм ы о стаётся един­
ственная возм ож ность: J( S) = d iag (n , 0 , . . . , 0). Э то и понятно, поскольку Р = —S
п
— м ат р и ц а п р о ек то р а. Реш ением м атр и ч н о го уравнения

Хц Х\ п п . 0 1 .. . 1 Хц Xl п

Хп 1 • ■• %пп 0 .. . 0 1 .. . 1 Хп 1 %пп
явл яется, в частн о сти ,

1/ п —1 -1
1/ п п —1 -1
С =
1/ п —1 п —1

6. Д ругие подходы к Ж Н Ф . Для нахождения жордановой


нормальной формы матрицы и соответствующего жорданова базиса
достаточно эффективной оказывается общая теория модулей над
кольцами главных идеалов, одной из разновидностей которой явля­
ется хорошо разработанный метод A-матриц. Хотя эта теория уни­
версальна и приводит к другим важным следствиям, её изложение
§ 4 • Жорданова нормальная форма 97

довольно утомительно и вряд ли уместно в данном контексте. На­


против, прямой геометрический метод, которому мы следовали, до­
статочно нагляден и заслуживает того, чтобы привести ещё один
его вариант, объединяющий теоремы 3 и 4 (см., например, пособия
Р, 9]).
Итак, пусть А : V — У V — комплексный линейный оператор,
Л — одно из его собственных значений. Так как жорданов базис
для А —Х£ будет также жордановым базисом для А, то без огра­
ничения общности считаем Л = 0. Тогда оператор А вырожден,
включение lm А С V строгое, и мы можем использовать индукцию
по п = dim V . С этой целью рассмотрим последовательность
Im Л° D Im Л 1 D Im A 2 D ... D Im Лр~г D Im Лр = 1 т Л р+1 = . . . ,
стабилизирующуюся на каком-то р-м члене, так что
Im А р П Кег А = 0, Im А р~ 1 П КегА / 0.
Согласно упр. 3 из § 3 имеет место разложение V в прямую сумму
V = Кег ЛР 0 Im ЛР
Д-инвариантных подпространств. Если dim Im ЛР > 0, то по предпо­
ложению индукции каждое из слагаемых допускает жорданов базис.
Их объединение будет жордановым базисом в V .
Мы пришли к ситуации, когда
V = Кег А р,
т.е. Лр = О, Л11- 1 ф 0.
Таким образом, в обход теоремы 3, имеющей самостоятельное
значение, получена редукция к случаю нильпотентного оператора.
Не апеллируя к теореме 4, поступим следующим образом. Положим
для удобства
Vi = Im Л*-1 П Кег Л.
Тогда
Кег А = Ei Э V2 D . .. D Vp ф 0, Tp+i = 0.

Выберем в подпространстве Vp базис (а|; 1 ^ i ^ пр). Так как


а^ G lm A p~1J то а^ = А р~ 1 а.р для некоторого вектора а.р. Рассмо­
трим векторы а^ = А р~кэ.р, 1 ^ к ^ р. Векторы а* дополним до
базиса подпространства Vp- \ векторами Ъ1- в количестве пр- 1 штук;
найдём вектор Ы р 1, для которого Ь] = А Р~2ЪР~1, и рассмотрим век­
торы h lj = 1 ^ ^ ^ р — 1. Затем дополним векторы а*,
bj до базиса подпространства Vp- 2 векторами в количестве п р- 2
7 А .И. К о стр и к и н
98 Г л. 2. Линейные операторы

штук и т.д. Иллюстрируем этот процесс диаграммой


af

1
a f1 bГ 1
1 1
аГ2 b f2 cc pk ~ 2

1 1 1

1 1 1
ai b? cc 2k d?
1 1 i 1
c1 dl et
ai b] ck
1 1 l 1 1
0 0 0 0 0 0
Предположим, что векторы из диаграммы линейно зависимы:

Ег dp)aг?+Е « t ' A 1 +•••+Е3 А ' А 1 + •••+Е1 ^ =°-


(И )
Применение к (11) оператора АР 1 даст в результате

Е a P a i = °>
откуда имеем
oif^ = 0 , 1 ^ i ^ пр.
Применив теперь к (11) оператор АР~2, получим

2 > Г 1|а; + 2 > Г 1|ь ; = о .


г 3
что в соответствии с выбором векторов даст a f ^ = 0 = (5^ 1\
Продолжение этого процесса приведёт к тривиальности соотноше­
ния (11). С другой стороны, общее число векторов в диаграмме равно
|{а*}| + | { Ц } | + . . . + |{е Л | =
= рпр + (р - 1 ) п р _ 1 + . . . + 2 п 2 + п \ —

— (^ 1 + • • • + T ip ) + (jl2 + • • • + T ip ) + . . . + ( r ip —i + T ip ) + Tip =

= dim Vi + dim V2 + ... + dim Vp- \ + dim Vp =


p
= ^ ( I m Лг_1 П Ker Д) = y^(dim Ker A —dim Ker Дг_1) =
г= 1 г

= dim Ker AP — dim V


§ 4 • Жорданова нормальная форма 99

(по поводу этого равенства см. упр. 7 из § 2)


Таким образом, векторы в диаграмме составляют базис прост­
ранства V , и этот базис жорданов по построению.
Что касается утверждения о единственности ЖНФ, то в обозна­
чениях п. 5 имеем
N(m, 0) = dim Vm —dim Vm+i =
= (dim Ker A m - dim Ker Л ™ -1) - (dim Ker A m+1 - dim Ker A m ) =

= 2 dim Ker A m - dim Ker Лт_1 - dim Ker A m+1 =

= rank Лто_1 - 2гапкДга + гапкДга+1 = r TO_i —2rm + rm+1,


а это, как мы знаем, есть инвариантная величина.
7. Д р у г и е н о р м а л ь н ы е ф о р м ы . В этом пункте мы вкратце
опишем другие нормальные формы матриц, пригодные, в частности,
для алгебраически незамкнутых полей.
а) Циклические пространства и циклические клетки. Разовьём
определение 3. Векторное пространство V размерности п над Я назы­
вается циклическим относительно линейного оператора Л : V —> V ,
если в V существует такой вектор v , также называемый цикличе­
ским;, что

с однозначно определёнными коэффициентами cti Е Я, поэтому опе­


ратору Л в этом базисе отвечает так называемая циклическая клетка
— матрица вида
ап - 1 1 0 ... 0 0
OLn- 2 0 1 . . . 0 0
А = (12)
од 0 0 ... 0 1
«о 0 0 ... 0 0
Обратно: если матрица оператора Л в базисе (ei , . .., еп) является ци­
клической клеткой, то вектор v = еп цикличен, причём е* = Д п - г еп
(индукция вниз по г).
Покажем, что вид циклической клетки, отвечающей Л, не зависит
от выбора исходного циклического вектора. Для этого достаточно
7"
100 Г л. 2. Линейные операторы

проверить, что первый столбец клетки (12) состоит из коэффициен­


тов минимального многочлена оператора А , т.е.
п —1

/Ы(*) = f(t) = tn - ^ 2 a ift-


2 =0

В самом деле, f(A ) = О, поскольку


/(Д)[ДЧ] = ДД/(Д)у] = 0,
а векторы порождают V. С другой стороны, д(Д) Ф О для лю­
бого многочлена g(t) степени < п, потому что иначе, применив опера­
тор д(А) = О к циклическому вектору v, мы получим нетривиальное
линейное соотношение между базисными векторами A lv.
б) Критерий цикличности пространства. Согласно предыдущим
рассмотрениям, если пространство V циклично относительно А, то
его размерность п равна степени минимального многочлена опера­
тора А и, стало быть, минимальный многочлен совпадает с характе­
ристическим. Обратное тоже верно (см. упр. 4 из § 3).
в) Матрица любого оператора в подходящем базисе может быть
приведена к прямой сумме циклических клеток. Доказательство мож­
но провести аналогично доказательству теоремы о ЖНФ. Вместо
множителей (t —Ai)ni характеристического многочлена следует рас­
сматривать множители Pi(t)r i , где Pi(t) — неприводимые над полем Я
делители характеристического многочлена. Теорема единственности
также имеет место, если ограничиться случаем, когда минимальные
многочлены всех циклических клеток неприводимы. Без этого огра­
ничения она неверна: циклическое пространство может быть пря­
мой суммой двух циклических подпространств, минимальные мно­
гочлены которых взаимно просты.

У П РА Ж Н Е Н И Я

1. Используя матрицу S из примера 4 и выражение для J ( S ), вычислить


определитель матрицы

т -1 .. . -1
-1 т . -1
А =
-1 -г .. т

представив его в виде det А = X s { m + !)•


2 . С точностью до подобия ненулевые нильпотентные 4 х 4-матрицы исчер­
пываются следующими:

A i = J2(0) + J i(0 ) + J i(0), А 2 = J 2(0) + J 2(0),


А 3 = J3(0) + J i(0), А 4 = J4(0).
§ 4 • Жорданова нормальная форма 101

М атрицы
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1
1 0 0 1 0 0 1 1 1 0 0 0 0 0 0 0
0 0 0 0 ’ 0 0 0 0 ’ 1 -1 0 0 5 1 -1 0 0
0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0
очевидно, нильпотентны. Каким матрицам А{ они подобны?
3. а) Найти J ( A ), зная, что хл( t) = (t —3)4(t + 2) и rank ( А —38) = 2.
б) Однозначно ли восстанавливается J ( A ) в случае rank ( А —38) = 1, 3, 4?
4. а) П оказать, что матрицы

6 2 - 2 6 2 2
А = -2 2 2 , В = -2 2 0
2 2 2 0 0 2
имеют одинаковые характеристические многочлены.
б) Найти [lA (t) и ^ e ( t ) -
в) Найти J( A) и J(B).
5. Пусть А — поле характеристики 0, А — п х n -матрица с коэффициентами
из А. Доказать, что А нильпотентна в точности тогда, когда tr ( А к) = 0, 1 <С
к п.
6. Доказать, что матрицы А £ М п (С) и t А всегда сопряжены.
7. Соотношение A N = Е для матрицы А £ М п (С) справедливо тогда и только
тогда, когда А диагонализируема и её собственные значения являются корнями
степени N из 1.
8. Непосредственно проверяется, что А 2 ^ M ag3(Q) для матрицы

1 2 0
А = 0 1 2 £ M ag3(Q),
2 0 1

т.е. магические квадраты , в отличие от полумагических (см. упр. 9 из § 2), кольца


не образуют. Тем более неожиданным является утверждение:
если А £ M ag3(Q), то А ш £ M ag3(Q) для любого нечётного т ?> 1.
Д оказать это, опираясь на теорему Гамильтона— Кэли.
9. Проверить, что при любом т ?> 2 матрица Ат , где
2 0 0 0
0 0 1 1
£ Mag4(Q),
0 1 0 1
0 1 1 0

не является магической. Используя матрицу А, показать, что для всякого п ?> 4


существует магическая п х n -матрица, т-е степени которой не будут магиче­
скими (т Д 2).
10. Запишем матрицу А = J\ (А) + А ф ц, в виде А = S + N, где
S = diag(A,ц ,ц ). Более подробно:

А 0 0 А 0 0 0 0 0
А = 0 11 1 , S = 0 11 0 , N = 0 0 1
0 0 11 0 0 11 0 0 0
В ыразить S и N в виде многочленов s ( A ), п(А) от А (по теореме Гамиль­
тона— Кэли можно считать, что deg s(t) <С 2, deg n(t) <С 2; как обычно, А0 = Е).
102 Г л. 2. Линейные операторы

11. П усть V — n -мерное комплексное п ро стр ан ств о , А — линейны й оператор


на V. Д о к а за ть , ч т о А доп ускает однозначную запись в виде

A = S+Af, SM = MS,
где S — ди агонали зируем ы й , а Я — ни льп отен тн ы й линейны й оператор, причём
S и Я в ы р аж аю тся в виде многочленов от Л (S н азы в ается полупростой , а
Я — нилъпотентной компонентой оп ер ато р а А).
12. В ы чи слить (Jn ( А)) для лю бого н ату р ал ьн о го к.
13. Д о к а за ть , ч т о [[X, Y ] 2 ,Z] = 0 для лю бы х т р ёх м атр и ц X , У, Z £ М 2 (Я).
Здесь [X , Y] = X Y — Y X — к о м м у та то р м атр и ц X , Y .
ГЛАВА 3
ВЕКТО РН Ы Е П РО С ТРА Н С ТВА
СО С К А Л Я Р Н Ы М П Р О И ЗВ Е Д Е Н И Е М

Теория билинейных форм была развита нами в гл. 1 отчасти для


того, чтобы иметь возможность перейти от общих векторных про­
странств к более содержательным и, пожалуй, даже более привыч­
ным структурам — метрическим пространствам. Вспомним, что бо­
гатство фактов нашей трёхмерной геометрии в значительной мере
обусловлено двумя дополнительными понятиями векторной алгеб­
ры — длиной вектора и углом между двумя векторами. Переход от
чисто качественного свойства линейности, безразличного к природе
основного поля, к количественным соотношениям между объектами
векторных пространств заставляет нас сосредоточиться по существу
на двух полях скаляров — Е и С. Геометрия комплексных векторных
пространств заслуживает особого обсуждения как ввиду её важно­
сти, так и ввиду необходимости рассмотрения нового типа форм.

§ 1. Е вклидовы в ек тор н ы е п р о с т р а н с т в а

1. Эвристические соображения и определения. В аналити­


ческой геометрии пространств Е2 и Е3 важную роль играет скаляр­
ное произведение двух векторов, которое вводится как произведение
длин этих векторов и косинуса угла между ними. Длина ||х|| вектора
х = x\ei + Х2&2 + ^зез, заданного в прямоугольной системе коорди­
нат, определяется по формуле

||х|| = y j x \ + x \ + x l ,
так что ||х|| > 0 для любого х / 0. Квадрат длины ||х||2 = х\ + х\ + х\
можно интерпретировать как значение положительно определённой
квадратичной формы. Полярная к ней симмет­
ричная билинейная форма (* | *) сопоставляет
любым двум векторам х,у Е Е 3 число (или
с к а л я р а х | у) = xiyi + Х2 У2 + хзуз. Пусть
(р = (х,у) — угол между векторами х и у,
z = у — х — их разность (рис. 3). Обычная
формула косинусов из элементарной геометрии, применённая к треу­
гольнику со сторонами х, у, z, утверждает, что
INI2 = IIх !!2 + 11у 1|2 - 2 | 1 х 11 11у 11 cos<£.
104 Гл. 3. Векторные пространства со скалярным произведением

С другой стороны, используя билинейность и симметричность фор-


мы (* I *), получаем ||z||2 = ||у- х||2 = (у - х |у - х) = ||х||2 + ||у||2 -
— 2(х |у). Сравнение двух выражений для ||z||2 даёт
(х|у) = ||х||||у|| COS<£,
т.е. скаляр (х | у) совпадает с обычным скалярным произведением
векторов х и у. Это обстоятельство подсказывает разумный путь
введения скалярного произведения векторов в Еп:
п
(х |у) = ^ 2 ^ г У г - (1)
2=1

В этом определении, однако, ощущается некий произвол, связан­


ный с выбором специальной системы координат. Чтобы его устра­
нить, введём следующее общее
О п р е д е л е н и е 1. Евклидовым векторным пространством на­
зывается вещественное векторное пространство V с выделенной на
нём симметричной билинейной формой (х,у) i—у (х | у) такой, что со­
ответствующая квадратичная форма х д (х | х) (или просто (х | х))
положительно определена.
В общем случае значение (х | у) симметричной билинейной формы
(* | *) на векторах х,у G У будет называться их скалярным произ­
ведением. Использованное нами обозначение (х | у) вместо обычного
/(х, у) призвано подчёркивать тот факт, что из бесчисленного мно­
жества форм мы выделили одну, которую и положили в основу опре­
деления евклидова пространства. Так как мы собираемся при помощи
(х | у) ввести понятия длины и угла, то получающуюся при этом не­
однозначность можно сравнить с произволом в выборе масштаба при
измерении длин отрезков на прямой. Часто скалярное произведение
обозначают (х,у) или (х,у), но у нас (х,у) есть просто пара векто­
ров (элемент декартова произведения V хУ), а (х,у) — подпростран­
ство, натянутое на х и у. В дальнейшем мы отождествляем билиней­
ную форму (* | *) как элемент пространства £2 (У, Е) с её значениями
(х | у) на произвольных векторах х и у.
Итак, в соответствии с определением 1 евклидово векторное про­
странство — это пара (У, (* | *)), где У — векторное пространство
над Е, а (* | *) — фиксированная симметричная билинейная форма
на У. Отметим ещё раз основные свойства скалярного произведения:
i) (х Iу) = (у Iх) Vx, у е V;
й) (ах + /3у |z) = а(х |z) + /5(у |z) Va, t;
iii) (х |х) > 0 Vx ф 0 ((0 |х) = 0).
Скалярное произведение, заданное соотношением (1) (оно назы­
вается стандартным скалярным произведением), удовлетворяет, ко­
нечно, этим свойствам и подходит под общее определение, иначе по­
следнее было бы лишено смысла.
§ 1. Евклидовы векторные пространства 105

П р и м е р 1. П усть V — Рп — вещ ественное в екторное п р о стр ан ств о мно­


гочленов степени <С п — 1. Сопоставление лю бым двум в ек то р ам (многочленам)
f , g E V числа

(/Is) = f f(t)g(t)dt (2)



( [a,b] — ф иксированны й о т р езо к на К) т а к ж е за д а ё т скалярное произведение
на V, к а к это легко у с м о т р е ть из свойств определённого и н тегр ал а. Бы ло бы не­
удобно в ы р а ж а т ь то же самое скалярное произведение (2) в терм и н ах “е стеств ен ­
н ого” базиса 1, t , . . . , t n _ 1 . С ледует за м ет и т ь , ч т о соотнош ением (2) за д а ёт ся ска­
лярное произведение и на бесконечномерном п р о стр ан ств е С(а,Ь) непреры вн ы х
ф ункц ий (на отр езк е [а, Ь]). С оответствую щ ее бесконечномерное евклидово век­
торное п р о стр ан ств о обозн ач ается символом С г(а, Ь).
2. Основные метрические понятия. Пусть V — евклидово
векторное пространство со скалярным произведением (х | у).
О п р е д е л е н и е 2. Длиной или нормой ||v|| любого вектора v £ V
называется неотрицательное вещественное число
IMI = \ / ( v lv )- (з)
Так как (v | v) ^ 0, то длина любого вектора вполне определена,
причём v / 0 = > 11v 11 > 0. Если Л Е Е, то ||Av|| = у / (Av | Av) =
= 1Л 1 • 1 М |.
В этом месте заметим, что любое подпространство U евклидова
векторного пространства V само является евклидовым векторным
пространством, поскольку скалярное произведение (х|у), будучи
ограниченным на U, определяет билинейную форму U х U —У Е,
которая, очевидно, остаётся симметричной и положительно опре­
делённой. В частности, само поле Е можно рассматривать как одно­
мерное векторное пространство, длина вектора в котором совпадает
с обычным абсолютным значением вещественного числа. В общем
случае мы будем различать символы | * | и || * ||.
Вектор длины 1 называется нормированным. Любой вектор х / 0
можно нормировать, умножив его на подходящий скаляр, а именно
для вектора х , = -—
1 - х имеем

1
= 1.
ы
Прежде чем вводить угол между двумя векторами, мы ещё раз
обратимся к свойству ш) скалярного произведения.
Т е о р е м а 4 (неравенство Коши—Буняковского). Каковы бы ни
были векторы х, у евклидова векторного пространства V, справед­
ливо неравенство
1 ( х |у ) |^ ||х ||||у ||. (4)
106 Гл. 3. Векторные пространства со скалярным произведением

Д о к а з а т е л ь с т в о . Из положительной определённости скаляр­


ного произведения (свойство ш)) следует, что
А2 (х | х) — 2А(х | у) + (у | у ) = (Ах — у | Лх — у ) ^ 0, (5)
где Л — произвольное вещественное число. При фиксированных век­
торах х , у G У мы смотрим на левую часть (5) как на квадратный
трёхчлен /. Так как /(А) ^ 0 для всех Л Е R, то для его дискрими­
нанта D(f ) = (2(х | у )) — 4(х | х) •(у | у) должно выполняться нера­
венство D(f ) ^ 0, откуда
(х|у)2 ^ (х |х ) -( у |у ) . (6)
Взяв положительный квадратный корень из обеих частей неравен­
ства (6) и воспользовавшись определением (3) длины вектора, мы
придём к неравенству (4), в левой части которого стоит абсолютная
величина скаляра (х | у ) . □
З а м е ч а н и е . Если | (х | у ) | = ||х|| ||у||, то D(f ) = 0, т.е. трёхчлен
/ имеет один вещественный корень Ао- Согласно (5) имеем (Лох —
у | Аох — у) = 0, откуда у = Аох. Следовательно, лишь для колли-
неарных (пропорциональных) векторов скалярное произведение по
абсолютной величине равно произведению их длин.
П р и м е р 2. В применении к ста н д а р тн о м у скалярном у произведению (1) и
скалярном у произведению (2) на С Д а ,^ ) неравенство (4) при н и м ает вид

Е Ж^Ч ^ л E rf (7)
г= 1 \ г=1
и соответствен н о

(8)
/ ‘ f ( t )g ( t ) dt
неравенство (8) и г р а е т важ ную роль в анализе.
Неравенство Коши—Буняковского означает, что
(х| у)
-1 ^ ^ 1.

Стало быть, отношение (х | у ) / (||х|| • ||у||) является косинусом вполне


определённого угла ср:

c°s ip = 0 ^ ^ . (9)

Именно этот угол (р и считается, по определению, углом между век­


торами х и у.
О п р е д е л е н и е 3. Векторы х и у называются ортогональными
(обозначение х 1 у ), когда угол между ними равен 7г/2, т.е.
(х | у) = о.
§ 1. Евклидовы векторные пространства 107

Нулевой вектор ортогонален любому вектору х Е V. Заметим


ещё, что
x l y = > ||х + у ||2 = ||х||2 + ||у||2
(теорема Пифагора), причём у нас это элементарно-геометрическое
утверждение является следствием формальных свойств скалярного
произведения. Чуть более общим является утверждение о попарно
ортогональных векторах х, у, z, и,...:
||х + у + Z + и + ... ||2 = ||х||2 + ||у||2 + ||Z||2 + ||и||2 + . . .
В к ач естве упраж н ен ия п роверьте, ч т о всегда
IMI = ||у|| =► (х+ у)±(х-у)
(ди агонали ром ба пересекаю тся под прям ы м углом).
Из теоремы 1 вытекает
С л е д с т в и е (неравенство треугольника). Длины векторов х,
у wx + y связаны неравенством
| | х ± у | К | | х | | + ||у||. (10)
Д о к а з а т е л ь с т в о . Действительно, используя неравенство (4),
получаем
Цх ± у||2 = ||х||2 + ||у||2 ± 2(х Iу) ^ ||х||2 + ||у||2 + 2 I (х Iу) I <
^ Цх||2 + ||у||2 + 2||х|| • ||у|| = (||х|| + ||у||)2.□
пример 3. В п р о стр ан ств е ф ункций С Д а Д ) неравенство (10) п ри ним ает
вид

(неравенство М инковского).
3. П роцесс ортогонализации. В стандартном пространстве
Еп со скалярным произведением (1) векторы = (0 , . .., 1. . . , 0),
i = 1, . . . , п, попарно ортогональны и образуют базис. Естественно
ожидать, что в любом евклидовом векторном пространстве V можно
выбрать базис с аналогичными свойствами. Сформулируем точно то,
что нам хотелось бы иметь.
О п р е д е л е н и е 4. Базис (ei, . . . , еп) евклидова векторного про­
странства V называется ортогональным, если (е^ | еД = 0 при i Ф j\
г, j = 1,2,..., гг. Если, кроме того, (е^ | еД = 1 при г — 1,2,..., гг, то
базис называется ортонормир ованным (или ортонормалъным).
Другими словами, в ортонормированном базисе все векторы
имеют единичную длину. Из любого ортогонального базиса можно
получить ортонормированный, нормировав каждый из векторов е^.
Отметим следующий почти очевидный факт.
Т е о р е м а 4. Любые ненулевые взаимно ортогональные векторы
ei , . . . , e m Е V линейно независимы. Если при этом dim С — п и
т — п , то векторы е* образуют ортогональный базис в V.
108 Г л. 3. Векторные пространства со скалярным произведением

Д о к а з а т е л ь с т в о . Второе утверждение вытекает (по опреде­


лению размерности) из первого, которое мы сейчас и докажем. Пред­
положим, что
аде! + «2^2 + ... + 0'тет = О
— нетривиальное соотношение между векторами ei,...,еш .Пусть,
скажем, ак ф 0. Умножив скалярно на е/, обе части нашего линейного
соотношения, получим
0 = (0 |е/Д = (аде! И- ... + а шеш |еД =
= ад (ei | еД + ... + oiki^k | еД + ... + а ш(еш | еД = а^Де^ | еД,
поскольку по условию (еД еД = 0 при i ф k. С другой стороны,
(е& | еД ф 0, и мы приходим к заключению, что otk = 0. Полученное
противоречие доказывает теорему. □
Утверждение теоремы 4 будет использовано при фактическом по­
строении ортогонального базиса, но его существование устанавлива­
ется немедленно.
Т е о р е м а 5. Во всяком п-мерном евклидовом пространстве V
существуют ортонормир ованные базисы.
Д о к а з а т е л ь с т в о . Квадратичная форма q:
g(x) = (x|x) = ||x||2,
на V положительно определена. Поэтому для неё, как для всякой дру­
гой положительно определённой формы (см. гл. 1, § 4, п. 8) суще­
ствует базис ( ei , ... , еп) пространства V , в котором она записыва­
ется в нормальном виде
<?(х) = х\ + х\ + ... + х \
(х = аде! + ... + х пеп). Скалярным произведением векторов х и у
будет (1). Но это и значит, что (е* | еД = т.е. ( ei , ..., еп) — орто-
нормированный (а в данном случае даже лучше — ортонормальный)
базис. □
Заметим, что в ортонормированном базисе координаты вектора
х равны скалярным произведениям х на соответствующие базис­
ные векторы:
(х |еД = Х{. (10)
О п р е д е л е н и е 5. Скалярное произведение (х|е), где е — век­
тор длины 1, называется проекцией вектора х на прямую (еД.
Таким образом, мы можем сказать, что координаты вектора х
в ортонормированном базисе (ei,...,еп) совпадают с проекциями х
на “оси координат” (еД^- Фактическое построение ортонормирован-
ного базиса осуществляется при помощи так называемого процесса
ортогонализации Грама—Шмидта, встречающегося в самых разных
§ 1. Евклидовы векторные пространства 109

вопросах анализа и геометрии. Предварительно заметим, что множе­


ство всех векторов, ортогональных данному вектору v, есть подпро­
странство, называемое ортогональным дополнением к v. Действи­
тельно, если х 1 v, у 1 v, т.е. (х | v) = (у | v) = 0, то и
(ах + Ду Iv) = а(х Iv) + Д(у Iv) = 0 Va, Д G Е.
Говорят также, что вектор v ортогонален подпространству U С V,
если v 1 u Vu G U. Очевидно, что v _L U v _L , г = 1 , . . . , m,
где ei,. .., em — базисные векторы в U.
Наконец введём
О п р е д е л е н и е 6. Множество всех векторов х Е V, ортогональ­
ных подпространству U С V, есть подпространство [/± (ввиду ли­
нейности условия х 1 [/), которое называется ортогональным до­
полнением к U.
Т е о р е м а б (процесс ортогонализации). Пусть ei,...,еш — си­
стема из т линейно независимых векторов евклидова векторного
пространства V .
Тогда существует ортонормир ованная система векторов
еД . .., такая, что линейные оболочки Li = (ei,..., еД и L\ —
— (еД . .., е') совпадают при i = 1, 2,..., ш; т ^ п.
Д о к а з а т е л ь с т в о . Возьмём в качестве вектор Aei, где А =
= ||ei||-1 . Так как L\ — (еД = (е'Д = 1Д, то это даёт утверждение
теоремы при i — 1. Пусть уже построена нужная система еД . . . , еД
1 ^ k < т (Li = L'; i = 1,..., к). Покажем, как найти вектор е^+1.
Вектор e/,+i не может содержаться в L'k = L\~ (иначе e^+i вы­
ражался бы линейно через e i , ... ,еД, поэтому L^+i = (ei , . .., е^, v),
где
к
V = е к+1 - Xi e'i
2=1

с произвольными скалярами Ai, . . . , А/,. Постараемся подобрать Ai


так, чтобы вектор v был ортогонален к L'k. Для этого, как мы знаем,
необходимо и достаточно выполнения условий
/ к
о = (v Iе ') = (е*+1 Iе ') - ( ^ А*е' |е'-
' 2=1
к
(е&+1 Iej)У^ Iej) (efc+1 Iej) Л? ч j 1, . . . , /t.
2=1
Таким образом, при Aj = (e^+i | е') получаем вектор v / 0, ортого­
нальный к L'k. Полагая е^+1 = fiv с ц — ||v||-1 , мы придём к орто-
нормированной системе еД . .., е^+1, причём L^+i = 1Д+1. В конце
концов получим искомую систему еД . .., еД. □
110 Гл. 3. Векторные пространства со скалярным произведением

С л е д с т в и е . Всякая ортонормир ованная система векторов ев­


клидова векторного пространства V дополняема до ортонормиро-
ванного базиса в V.
Д о к а з а т е л ь с т в о . Согласно теореме 3 из §2 гл. 1, имеющуюся
по условию ортонормированную систему e i , . . . , em можно дополнить
до базиса e i , . .., em, em+ i , ..., еп. К этому базису применим процесс
ортогонализации, описанный в теореме б, не затрагивая при этом
первые т векторов. □
Воспользуемся приёмом, близким к процессу ортогонализации в
предыдущей теореме, для доказательства следующего утверждения.
Т е о р е м а 7. Пусть L — подпространство конечномерного ев­
клидова векторного пространства V, ZA — его ортогональное до­
полнение. Тогда
V = L®L- l , L-l± = L . (11)

Д о к а з а т е л ь с т в о . Возьмём в L какой-нибудь ортонормиро-


ванный базис ( e i ,. . . , еш). Пусть w Е V. Рассмотрим вектор
т
v = w - y ^ (w | ej)e*.

Так как (v | e j ) = (w | e j ) - Y T = i О Ie*)(ei Iei) = О I ej) ~ (w Iej ) ~


—(w | ej ) -1 = 0; j = 1 ,2 ,..., ш, то вектор v ортогонален подпрост­
ранству L. Это значит, что w = u + v, где и = | еДе^ Е L и
v <Е ZA. Итак, V = L + ZA.
Пусть х G L n L ^. Так как х Е L, то (х | Lx ) = 0. Но, в частности,
ZA э х, так что (х | х) = 0, откуда получаем х = 0. Следовательно,
V = L 0 ZA — прямая сумма.
Из разложения w = u + v ( u G L, v G ZA) имеем (w | u) = (u +
+ v | u) = (u | u) + (v | u) = 11u112 и, аналогично, (w | v) = 11v112 . Если
теперь w E ZAX, to (w | v) = 0 и ||v ||2 = 05откуда w = u E L. Стало
быть, Ь±А- C L. Так как, далее, = (L ^)1- — подпространство,
ортогональное к ZA, a (L | L^) = 0, то L С Следовательно,
= L. □
4. И зоморфизм ы евклидовых векторны х пространств.
Мы видели, что выбор ортонормированного базиса в евклидовом
векторном пространстве V даёт возможность записать скалярное
произведение (х | у) в стандартном виде (1). Этот факт означает по
существу, что по своим метрическим свойствам пространства V и
Еп неразличимы. Более точное утверждение выражает
Т е о р е м а 8. Любые евклидовы векторные пространства V, V
одинаковой конечной размерности изоморфны. Это значит, что
существует изоморфное отображение / : V —t V ' векторных про­
странств (см. определение в п. 3 из § 2 гл. 1), сохраняющее ска­
§ 1. Евклидовы векторные пространства 111

лярное произведение, т.е.


(х| у) = ( / ( х) | / ( у) ) ' (12)
((* | *)' — скалярное произведение на V').
Д о к а з а т е л ь с т в о . Рассмотрим ортонормированный базис
(ei , . .., еп ) в У и какой-то ортонормированный базис (е^),. .., в
V '. Соответствие
/ : х = Х\&\ + ... + х пеп и- х' = Xie\ + ... + хпе'п,
очевидно, биективно. Как и в случае теоремы 5 из и. 3 § 2 гл. 1,
непосредственно проверяется, что / — изоморфизм векторных про­
странств. Так как в У и в У' скалярные произведения (х | у), (х' | у')'
вычисляются по одной и той же формуле (1) (в силу выбора базисов),
то условие (12) изоморфизма евклидовых векторных пространств
также выполнено. □
Доказанная теорема позволяет перевести на язык элементарной
геометрии любое утверждение, сформулированное в терминах дей­
ствий с векторами из У и скалярного произведения на У. Обратно:
метрическая теорема, относящаяся к объектам пространства R3 или
R2, должна оставаться справедливой в любом евклидовом векторном
пространстве У размерности ^ 3.
Раз уж речь зашла об изоморфизмах, рассмотрим пространство
У*, сопряжённое (двойственное) к евклидову векторному простран­
ству У в смысле § 3 из гл. 1.
Очевидно, что отображение х д (v | х) при любом фиксирован­
ном векторе v Е У определяет линейную форму
<£v = (v | *): У —>• R,
т.е. (v | *) Е У*.
Т е о р е м а 9. Отображение Ф: v (v | *) = <I>V есть естествен­
ный изоморфизм векторных пространств У и У*. При этом изо­
морфизме ортонормированный базис e i , . . . , e n евклидова вектор­
ного пространства V отождествляется с дуальным к нему базисом
/ ь . . . , / п пространства У*.
Д о к а з а т е л ь с т в о . Так как скалярное произведение (v | х) ли­
нейно по v, то отображение Ф линейно:
$(au+/?v) = (au + 0 v \ * ) = a(u |*) + /3(v |*) = аФи + /?ФУ.
Далее, КегФ = 0, поскольку v Е Кег Ф = > (v | х) = 0 Vx Е У и,
в частности, (v | v) = 0 н-у v = 0.
Как всякий элемент пространства У*, линейная форма (v | *) ли­
нейно выражается через двойственные к (еД базисные векторы
е1, . .., en Е У*. В частности,
п
$ei = (е* I*) = i = 1,..., п.
3= 1
112 Гл. 3. Векторные пространства со скалярным произведением

Так как (ei , . .., еп) — ортонормированный базис, то


п п
ttij = ^ ^ ^ (ej) = (ei I ej) =
k=l k=l
откуда
(e* | *) = e \ (13)
Это даёт нам сюръективность, а следовательно, и биективность Ф.
Вместе с тем соотношением (13) устанавливается справедливость за­
ключительного утверждения теоремы. □
Итак, в евклидовом векторном пространстве V каждый вектор
v G У можно рассматривать также как линейную форму v: У —>• Е.
При таком отождествлении ортонормированный базис в У является
своим собственным дуальным (взаимным) базисом. Естественным
изоморфизмом (сравнить его с изоморфизмом У ~ У** для обыч­
ного векторного пространства) мы воспользуемся при изучении ли­
нейных операторов. Изоморфизм Ф можно считать метрическим в
смысле теоремы (8), если определить на У* скалярное произведение
по правилу
((и 1*) 1М*) Г := (u|v).
Все аксиомы скалярного произведения выполняются (проверьте).
5. Ортонормированные базисы и ортогональные матри­
цы. В евклидовом векторном пространстве У ортонормированные
базисы играют особую роль, поэтому естественно посмотреть на
формулы перехода от одного ортонормированного базиса (ei,...,еп)
к другому ортонормированному базису (е^,... , е^). Как всегда, за­
писав
e'j = а ^в! + a2j e 2 + ... + anjen, 1 ^ j ^ п, (14)
мы получаем матрицу перехода А = (а^-), в к-м столбце которой
стоят координаты вектора относительно базиса (ei , . .., еп ). Пока
мы лишь переписали формулы (3) из § 2 гл. 1 и на И имеем един­
ственное ограничение det А ф 0. Воспользуемся теперь ортонорми-
рованностью базисов:

= (e'i Iej) = ( Е аыек I Е аЧе‘) Е а^ аУ(еП ег) = Е ^ki^kj •


к,1 к
Итак,
Г 0 при i ф j,
QjliQjlj Н" ^2i^2j + •••+ CLniOnj (15)
\ 1 при г = j.
Взяв транспонированную матрицу tA, соотношения (14) (или (15))
перепишем в кратком виде:
*А ■А = Е, (16)
§ 1. Евклидовы векторные пространства 113

откуда А 1 — 1А. Так как А 1 А — Е = > А • А 1 = Е, то и


А-*А = Е, (16')
что приводит к соотношениям
Г 0 при i ф j. г/ч
anCLji + ai2 aj2 + ... + ainajn — <j ^ и -_ j (15)

О п р е д е л е н и е 7. Квадратная матрица А = (а^), удовлетво­


ряющая одному из эквивалентных условий (15), (15'), (16), (16'), на­
зывается ортогональной. Множество всех ортогональных матриц
порядка п обозначается символом 0 (п).
Непосредственно проверяется (и мы к этому ещё вернёмся), что
0{п) — группа. Она называется ортогональной группой. Если те­
перь А — произвольная ортогональная матрица, то система векторов
(е^,. .., е^), полученная из ортонормированного базиса (ei , . .., еп) по
формулам (14), будет также ортонормированным базисом.
Мы приходим к следующему выводу.
Т е о р е м а 10. Матрица перехода от одного ортонормирован­
ного базиса к другому ортогональная, и всякая ортогональная
матрица может быть матрицей такого перехода.
Заметим, что из формул (14) и условия ортонормированности
векторов получается геометрическая интерпретация элементов ац
ортогональной матрицы А. Именно,
aij = (e; |е'-) = cos (fij, (17)
где (fij — угол между старым базисным вектором е* и новым базис­
ным вектором е'-. Переходя в равенстве (16) к определителям, полу­
чаем ещё, что (det А )2 = 1, т.е. определитель всякой ортогональной
матрицы равен 1 или —1.
Мы знаем из § 2 гл. 1 правило преобразования координат вектора
х G V при замене базиса. Если х = то
X i ^ a i jx 'j, г = 1, 2,..., п.
з
Но теперь известно дополнительно, что И-1 = 1 А, поэтому
x '= Y ,a j i X j , г = 1,2,..., гг.
з
6. Симплектические пространства. Понятие скалярного про­
изведения “многолико”. Так, любая невырожденная билинейная косо­
симметричная форма на V = R2m задаёт симплектическую линейную
структуру. Сама форма, часто обозначаемая [х | у], называется ещё
кососкалярным произведением на V. Пара (V, [* | *]) называется симп-
лектическим пространством. Согласно теореме 9 из § 4 гл. 1 симп­
лектическую структуру без ограничения общности можно считать
8 А .И. К о стр и к и н
114 Г л. 3. Векторные пространства со скалярным произведением

стандартной (отвечающей матрице J или Jo). Соответствующий ба­


зис называют симплектическим. Переформулировка следствия упо­
мянутой теоремы 9: все симплектические пространства одинаковой
размерности изоморфны.
Так же, как и в случае евклидовых пространств, естественно рас­
смотреть группу линейных операторов на V , сохраняющих симплек-
тическую структуру.
О п р е д е л е н и е 8. Линейный оператор А : V —> V называется
симплектическим, если
[Дх|Лу] = [х |у] Vx, у е У = М2то.
Множество всех симплектических линейных операторов на про­
странстве V называется симплектической группой и обозначается
символом Sp(2m) := Sp(C).
В матричной форме условие принадлежности А к Sp(2m) запи­
сывается в виде
0 —Ет
*А • Jo -А = Jo =
Ет 0
При этом А называется симплектической матрицей. Отсюда сле­
дует, что det А = =Ь1. На самом деле det А = 1, как это прямо выте­
кает из теоремы 10 (п. 10 § 4 гл. 1):
1 = P f(J0) = Pf(*A • Jo • А) = (det A) Pf (J0) = det A.
В том, что множество Sp(2m) действительно является группой,
т.е. замкнуто относительно обычных операций (А, В) > А В , А >
!->• А - \ легко убедиться непосредственной проверкой.
При т = 1 имеем изоморфизм Sp(2) = SL(2,R). Действительно,
для a ,/3 ,j,S Е R из условий
I—1
1

а (5 0 а (5
I—
1

7 S 0 7 S
I—
1

1

1
0

аб —/3j 0 1 0
следует, что аб —Ду = 1. □
Мы видели в п. 5, что элементы ортогональной группы находятся
во взаимно однозначном соответствии с ортонормированными бази­
сами евклидова пространства. Аналогично, линейный оператор А :
R2m —у R2m симплектичен тогда и только тогда, когда он переводит
симплектический базис в симплектический (причём для любой пары
симплектических базисов найдётся оператор, переводящий один ба­
зис в другой).
Спектр симплектического оператора (симплектической матрицы)
обладает рядом интересных особенностей, как показывает
§ 1. Евклидовы векторные пространства 115

Т е о р е м а 11. Справедлива импликация


Л G Sp(2m) = > XA(t) = е тх л ( ^ У

Корни характеристического многочлена х л ( t) разбиваются на


четвёрки (и на пары), расположенные симметрично относительно
вещественной оси и относительно единичной окружности.
Другими словами, хл(^) = Y^=i аАг — возвратный многочлен:
0>
%—Cl2m—i’) Ъ—1,2,...
Д о к а з а т е л ь с т в о . Пусть А — матрица оператора А. Из опре­
деляющего соотношения 1 AJ qA = J q имеем lA~l = J qAJ q 1 =
= —Jo A Jo. Стало быть,
XA(t) — det (tE —A) = det(Jo(tE —A)J q 1) = det(tE —J qAJ q 1) =
= det (tE - 'Д - 1) = det( \ t E - Д-1)) = det (tE - A~x) =
= det(tE —Д - 1) det A = det(T4 —E) = det(J? —tA) =

= t2m det ( ± E ~ a ) = t 2 mXA( ] ) -


Мы видим, что вместе с Л характеристическим числом симплек-
тического линейного оператора А
будет также и Л-1 . Кроме того,
X A ( t ) С М[£], так что вместе с ком­
плексным корнем Л корнем мно­
гочлена XA{ t ) будет и Л. Каждый
корень Л с | Л | / 1 и 1шЛ / О
определяет четвёрку корней Л,
Л, 1/А, 1/А (рис. 4). При наруше­
нии одного из условий получается
пара корней. □
Иногда на симплектическом пространстве V со стандартной
структурой J q:
т
[х Iу] = 5 ~2(xi+myi - Xiyi+m),
2=1
вводится согласованная (хотя и связанная с Jo не канонически, т.е.
способом, зависящим от выбора системы координат) евклидова струк­
тура

(х I У) = ^2%кУк-
к=1
Для [х | у], как и для любой билинейной формы (см. § 3), найдётся
такой линейный оператор J , что
[х Iу] = (хЦ-у).
8*
116 Г л. 3. Векторные пространства со скалярным произведением

Кососимметричность [х | у] влечёт кососимметричность операто­


ра J . На самом деле его матрицей в выбранном базисе служит J q.
Ясно, что J Е Sp(V) и J 2 = —£. Наглядно оператор J можно пред­
ставлять в виде вращений на угол 7г/2 в каждой из симплектических
(гиперболических) плоскостей.
Назовём плоскость П Е V нулевой, если [П | П] = 0, т.е. [х | у] = О
Vx,y Е П (косая ортогональность). Из определения оператора J сле­
дует, что плоскость П нулевая в точности тогда, когда плоскости
П и ^(П ) ортогональны в евклидовом смысле. Так как J — невы­
рожденный оператор, то dim П = dim ^7(П), а поэтому размерность
нулевой плоскости П в V = R2m не превосходит т.
Оператор J , удовлетворяющий условию J 2 = —£, даёт возмож­
ность ввести в симплектическое пространство V ещё и комплексную
структуру. Что под этим следует понимать, разъясняется в § 4.

УП РА Ж Н ЕН И Я

1. В п р о стр ан ств е Рз вещ ественны х многочленов f ( t ) степени < 3 век то р ы


1, t о р тогон ал ьн ы относи тельно скалярного произведения, задан н ого формулой
( / | д) = f(t)g(t) dt (частн ы й случай ф орм улы (2)). Н айти:
а) п од п ростран ств о (1, t) ^ ;
б) ортонорм и рован н ы й базис в Р 3 .
2. П усть (У, (* | *)) — евклидово трёхм ерное в екторное п р о стр ан ств о такое,
ч т о ||х ||2 = (х | х) = Зх\ + 2^2 + х \ — 4:Х\Х2 — 2 х \ х з + 2 x 2 x 3 (п роверить, ч т о э т а
ф о р м а полож ительно определена). Н айти:
а) угол а м еж ду век то р ам и х = [1,1,1], у = [2, 2,1];
б) все век то р ы , ортогон ал ьн ы е х.
3. И спользуя процесс о ртогон ал и зац и и Г рам а— Ш м и дта, д о к а за ть , ч т о лю ­
бая невы рож денная м ат р и ц а А = ( а ^ ) Е М п (К) м ож ет бы ть зап и сан а в виде про­
изведения А = В С ортогон ал ьн ой м атр и ц ы В и верхней треугол ьн ой м атри ц ы
С с det В = =Ь det А.
4 . М нож ество М П(М), рассм атри ваем ое к а к п 2-мерное евклидово п р о с тр а н ­
ство со с та н д а р тн ы м скалярны м произведением, содерж и т груп п у 0 (п) о р т о го ­
нальны х м атри ц , определяем ы х п(п + 1 )/2 соотнош ениям и (15) или (15') (О(п)
суть о р тогон ал ьн ая груп п а). Т аким образом , 0 ( п ) можно р а сс м ат р и в ат ь к а к “ал­
гебраическое м ногообрази е” р а зм ерн ости п 2 —n (n + l ) / 2 = п(п —1 )/2 = dim о(п),
где о(п) — в ек торое п р о стр ан ств о кососим м етри чны х м атр и ц п о р яд ка п. Е ст е ­
ственно о ж и д ать к ак о го -то хорош его с о о тв е тс тв и я м еж ду м нож ествам и 0 (п) и
о(п). П рим ером т ак о го с о о тв е тс тв и я служ ит п реобразован ие Кэли
К — (Е — А ) ~ 1(Е + А), А = ( Е - К ) ~ 1(Е + К) . (18)
Т реб уется д о к а за ть , ч т о если А Е 0 ( п ), d e t(E — А) ф 0, то К Е о(п). Верно
и обратн ое: к аж дой м атри ц е К Е о(п) о т в е ч а е т А Е О(п) с 1 ( Spec(A ). При
указан ном с о о тв етств и и из “алгебраи ческого м н огообрази я” 0 (п ) т р еб у ется вы ­
броси ть “гиперп оверхн ость” , определяемую уравнением d e t(E — А) = 0.
М ожно предлож ить другое преобразование Кэли
К = (Е + А ) ~ 1(Е - А), А = (Е + К ) ~ 1(Е - К ), (19)
где из 0 ( п ) нуж но у дал и ть “гиперповерхн ость” с уравнением d e t(A + Е) = 0,
или, ч т о эквивалентно, ортогон ал ьн ы е м атр и ц ы с —1 ^ Spec(A ).
§ 2. Эрмитовы векторные пространства 117

Т реб уется убедиться в справедливости с о о тв е тс тв и я (19).


5. П ровери ть, ч т о ортогон ал ьн ы е м атри ц ы , полученные преобразован ием
К эли из к ососим м етри чны х (в соотнош ениях (18) и (19)), им ею т определитель 1
(м нож ество всех т а к и х м атр и ц обозн ач ается символом SO(n)).
6 . Д о к а за ть , ч т о х ар ак тер и с т и ч е ск и й многочлен х а М ортогональной
п х n -м атр и ц ы А об л ад ает свойством
*ПХА{1Ц) = ±XA(t).
7. П усть А = [A (i), . . . , — произвольная м ат р и ц а с попарно о р то го н а л ь­
ны ми строк ам и . Д о к а за ть , ч то

| det А | = ||А (1)|| • ||А ( 2)|| . . . ||А (П)||


(с та н д а р тн ая норм а век торов в Мп ).
8. П усть X = [Х<д), • • •, Х (п)] — произвольная м ат р и ц а из М П(К). Д о к а за ть ,
ч то
| d e t X K | | X (1)| | . | | y 2) | | . . . | I X n ) l l
(неравенство А д ам ара).

§ 2. Э р м и то в ы в ек тор н ы е п р о с т р а н с т в а
1. Э рм итовы ф орм ы . Многие задачи сводятся к тем или иным
вопросам о линейных операторах, действующих на комплексных век­
торных пространствах, и по этой причине последние заслуживают
особого внимания. Многообразие метрических соотношений в ев­
клидовых пространствах над R служит естественным стимулом для
введения скалярного произведения и в комплексном случае. Однако,
как было отмечено в конце п. 7 из § 4 гл. 1, стандартная билинейная
форма s(x, у) = Х\у 1 + . .. + х пуп с Xj , yj Е С не может быть отправ­
ным пунктом для этой цели, поскольку длина (норма) ||х|| = s(x, х)
вектора х Е Сп обладает “неприятным” свойством:
||гх||2 = s(ix,ix) = i2s ( x , x ) = —||х||2.
Если х / О и ||х| | > 0, то гх е Сп , но ||гх|| < 0. Это определение явно
неприемлемо, если мы хотим пользоваться интуитивно воспринима­
емым понятием длины вектора.
Замечательным аналогом евклидова векторного пространства
служит эрмитово (или унитарное) пространство. Введём следующее
О п р е д е л е н и е 1. Говорят, что / : V х V -А С есть полуторали­
нейная форма на комплексном векторном пространстве V , если:
i) J ( a x + /3y,z) = af ( x, z) + (3f{y,z) Va,/3 6 C, x, y, z 6 V, т.е. /
линейна по первому аргументу при фиксированном втором;
п) /(х , ay + f3z) = а /(х , у) + /3/(х, z), где черта над a, f3 означает
обычную комплексную сопряжённость (полулинейность по второму
аргументу при фиксированном первом).
Полуторалинейная форма / называется эрмитовой, если
/(у ,х )= /(х ,у ). (1)
118 Г л. 3. Векторные пространства со скалярным произведением

Пусть (ei , ... , еп) — базис пространства V. Если х = у =


= Е, т0
Д х , у) = Е
fiix iVh fij = Д е ь ej)>
hJ
— выражение значений формы / в базисе (ei , . .., еп). Эрмитовость
формы / означает, что коэффициенты её матрицы F = (fij) удов­
летворяют условию fij = fji. Другими словами,
F* = F, (V)
где F* := lF. Матрица F, удовлетворяющая условию (1'), также
называется эрмитовой.
Если F' — матрица эрмитовой формы / в базисе (е^,. .., е^),
получающемся из (ei , . .., еп) при помощи матрицы перехода Д, то
F' = lA -F - А (2)
(А = (aij); ср. с выражением (5) из § 4 гл. 1). Непосредственно про­
веряется, с использованием (1'), что
( F' y = t ( t' A- F- A) = 1 А - 1Т - А = lA - F * A = 1 A -F H — F ',
т.е., как и следовало ожидать, при замене матрицы F на * A - F - A
свойство эрмитовости сохраняется.
Эрмитовой форме /(х , у) отвечает, естественно, эрмитова ква­
дратичная форма /(х,х). Так как
Д х ,х ) = /(х,х),
то квадратичная эрмитова форма принимает только вещественные
значения. Если при этом /(х, х) ^ 0 и /(х, х) = 0 => х = 0, то
форма / называется положительно определённой. Записав / в виде
Дх, у) = <?(х,у) + i /г(х,у)
с вещественнозначными функциями д, /г, мы, используя (1), легко
убеждаемся в том, что g и h — билинейные формы на V, причём g —
симметричная, a h — кососимметричная форма. Наконец, положи­
тельная определённость / эквивалентна положительной определён­
ности д.
О п р е д е л е н и е 2. Конечномерное векторное пространство V
над полем С, снабжённое положительно определённой эрмитовой фор­
мой (х | у) := /(х , у), называется эрмитовым (унитарным) прост­
ранством. Комплексное число (х | у) называется скалярным произве­
дением (говорят ещё: внутренним произведением) векторов х, у G V.
Итак, в новых обозначениях имеем
(х Iу) = (У I х ),
(ах + /Зу | z) = а(х | z) + /3(у | z),
(х | х) ^ 0; (х | х) = 0 лишь при х = 0.
§ 2. Эрмитовы векторные пространства 119

п р и м е р 1. Положив

(х | у) = Х 1 У 1 + Х2У2 + • • • + Жп2М, (3)


мы получим, несомненно, полож ительно определённую эрм и тову ф орм у с единич­
ной м атри ц ей F = Е, т.е. координ атное комплексное п р о стр ан ств о Сп , снабж ён­
ное этой ф орм ой, с тан ови тся эрм и товы м . Если п ерей ти о т с т а н д а р тн о го базиса
в Сп к лю бому д ругом у при помощ и м атр и ц ы перехода А, то согласно (2) мы
сопоставим наш ей ста н д а р тн о й эрм и товой ф орм е эрм и тову м атр и ц у F' = 1А- А.
В вещественном случае комплексную сопряжённость можно игно­
рировать, так что эрмитово пространство — истинный аналог евкли­
дова. Как и в евклидовом пространстве, длина ||v|| вектора v Е V
определяется равенством
IMI = \ / ( v lv)-
2. Метрические соотношения. Легко проверяемое соотноше­
ние
2(и | v) = ||u + v||2 + i ||u + Н | 2 - (1 + г) {||u||2 + ||v||2}
показывает, что скалярное произведение выражается непосредствен­
но в терминах длин (процесс поляризации). Из очевидных равенств
11Ах11 = \ J (Ах |Ах) = л/|А|2 (х|х) = |А|л/(х|х)
следует известное в евклидовом случае свойство нормы
11Ах11 = |А| ||х||. (3)
Эта параллель распространяется на большинство других ут­
верждений. В частности, неравенство Коши—Буняковского (его на­
зывают ещё неравенством Шварца) приобретает следующий вид:
1(х|у)К1|х|М|у|| (4)
(равенство достигается в точности тогда, когда векторы х,у про­
порциональны) .
Д о к а з а т е л ь с т в о . Действительно, записывая комплексное чи­
сло (х | у) в тригонометрической форме (х | у) = |(х |у )|е г(/?, (р Е Е,
мы видим, что при любом t G М выполнено неравенство
||х||2*2 + ((х Iy)t~ iv>+ Щ у ) е ^ ) 1 + ||у||2 = (xi + yeitp \ xt + у е^) ^ 0.
Так как (х | у)е_г(/? = |(х|у)| = (х|у)ег(/?,то оно переписывается в
виде
Цх||2*2 + 2|(х|у)|г+ ||у||2 ^ 0.
Получающееся условие на дискриминант приводит к нужному нера­
венству. Оно превращается в строгое равенство тогда, когда х£о +
-\-уег(р = 0 при подходящем to Е М, т.е. при пропорциональных х, у. □
Из неравенства (4) непосредственно вытекает неравенство тре­
угольника
х ± у К | | х || + ||у || (5)
120 Гл. 3. Векторные пространства со скалярным произведением

и его очевидное обобщение


| | x - z | | <; ||х - у|| + ||у - z
П р и м е р 2. П р о с тр а н с тв а 6 2 ( 0,, 6) и Рп над С, снабж ённы е скалярны м про­
изведением ь
(f\a)= [ f(t)g(t) dt,

являю тся, очевидно, эрм и товы м и. Н еравенство (5) в эти х случаях при н и м ает вид

2 dt

(сравн и ть с неравенством М инковского в примере 3 из § 1). В эрм и товом


п р о стр ан ств е Сп со с та н д а р тн ы м скалярны м произведением (3) выполнено не­
равенство

У IXi ± Vi \2 Екг|2 1 > |2


\
Неравенство (4) позволяет утверждать, что существует единствен­
ный угол ер, 0 ^ ( р ^ 7 г / 2 , д л я которого
(х|у)
cos (р =

Квантовомеханическое истолкование величины cos2 ip можно найти в


учебном пособии [2].
3. О ртогональность. Как и в вещественном случае, набор век­
торов e i , . . . , e m эрмитова пространства (К, (* | *)) называется ор-
тонор мир ованным (или ортонормалъным), если (е* | ej) = Sij. Этот
набор векторов линейно независим и дополняем до ортонормиро-
ванного базиса пространства V. Чтобы убедиться в этом, следует
снова воспользоваться процессом ортогонализации Грама—Шмидта
(см. и. 3 из § 1), сопоставляя каждому вектору и вектор v = и —
—Е Г М е*)е* И замечая, что v Е (ei , . .., em)x . Вектор v можно
нормировать и продолжить процесс дальше. Кстати,
V = W 0 W ±, РГ-1-1 = W, (6)
для любого подпространства W С V.
В качестве небольшого упражнения предлагается доказать сле­
дующее утверждение.
Т е о р е м а 1. Пусть ( e i , . . . , e n) — ортонормир ованный базис эр­
митова (или евклидова) векторного пространства (К, (*|*)).
Тогда:
i) х = E i( x Iег)ег длл 6сякого х Е V;
и) (х | у) = Ег ( х Iег)(ег IУ) для любых х, у Е V (равенство Пар-
сев аля);
Ш ) х е Г ^ | | х | | 2 = Е З ( х | е , ) | 2.
§ 2. Эрмитовы векторные пространства 121

Пусть ( e i , . . . , e n) — ортонормированный базис эрмитова про­


странства V . В теореме 1 использовано следующее соображение. Для
любого вектора х = ввиду линейности скалярного произве­
дения по первому аргументу имеем

(х Iei) = (5 1 x iei Iei) = 5 Z Xi(ei I = xi-


i i
Таким образом, мы пришли к линейной форме fj = (* | еД : V —>
—> С, сопоставляющей каждому вектору х = JT x ^ i его j -ю коор­
динату xj относительно (еД. Если теперь у = — ещё один
вектор пространства V , то
(x|y) = £ Xi y] { ei I e j ) = ж ш + . . . + ж * ,
i,j
т.е. вычисление скалярного произведения векторов эрмитова про­
странства V при выборе в нём ортонормированного базиса происхо­
дит по формуле (3) для стандартного скалярного произведения в Сп .
Тем самым определён изоморфизм Cn = V эрмитовых пространств:
(ж1, . . . , жп) н->> '^2 i XiGi — биективное отображение, сохраняющее
скалярное произведение. В отличие от евклидова векторного прост­
ранства эрмитово пространство не отождествляется со своим двой­
ственным пространством. Вместе с линейными функциями нужно
рассматривать и полулинейные функции в смысле следующего опре­
деления.
О п р е д е л е н и е 3. Пусть / — обычная линейная форма (функ­
ция) на комплексном векторном пространстве V. Сопряжённой к
/ линейной формой (или полулинейной функцией) на V называется
функция / : V —>С, удовлетворяющая условиям
7( х + у) =7(х) + /(у), 7(Ах) = л7(х).

Если (V, (* | *)) — эрмитово пространство, то / представляется


в виде /(х) = (х | а) для некоторого однозначно определённого век­
тора а (ср. с теоремой 9 из § 1), но соответствие между / и а не
является линейным. Если теперь / — полулинейная функция, то,
выбрав какой-то ортонормированный базис (еД в V и положив
а = £ \/(еД е* , будем иметь для любого вектора х = ^2jXj£j со­
отношение
(а|х) = ^(е* |Y l x i ei ) = ^ = 7(х).
г j г
Единственность вектора а вытекает, очевидно, из положительной
определённости формы (* | *). Свойство эрмитовости (* | *) позволяет
записать ____ ___
7(х) = (а|х) = (х|а) = /(х).
122 Гл. 3. Векторные пространства со скалярным произведением

4. У нитарные м атрицы . В евклидовом векторном простран­


стве переход от одного ортонормированного базиса к другому реали­
зуется при помощи ортогональной матрицы (теорема 10 из § 1). Ана­
логичное утверждение имеет место в случае эрмитовых пространств.
Пусть (еД, (е' ) — ортонормированные базисы эрмитова векторного
пространства (V,(*|*)), связанные матрицей перехода А = (а^) :
е' = Y ,iaHei- Тогда
3jk — (Oj | вд.) — CLijClsk (©г I Os) — ^ Cljjag. .
i,s i

Другими словами,
A • A* = E = A* • A, (7)
где A * := 1A — матрица, эрмитово сопряжённая с А (напомним, что
А = (ctij)).
О п р е д е л е н и е 4. Матрица А, удовлетворяющая условию (7),
называется унитарной.
Понятно, что в вещественном случае унитарная матрица явля-
ется ортогональной. Далее, det А = det А, поэтому det А* = det А и,
принимая во внимание (7), получаем, что | det А| = 1, т.е. det А = ег(р
для любой унитарной матрицы А. В частности, унитарные матрицы
невырожденны.
Из определения А* непосредственно вытекает, что
(А • В)* = В* • А*. (8)
Поэтому в случае унитарных матриц А, В мы приходим к заключе­
нию об унитарности их произведения: (А В )(А В )* = А(ВВ*)А* =
= АЕА* = АА* = Е. Далее, А "1А = Е = А - А-1 = > А*(А-1)* =
— Е — (А-1 )*А* А-1 (А-1)* — Е — (А - 1 )*А -1, т.е. вместе с А
унитарной является и матрица А-1 . Разумеется, те же соображения
относятся и к ортогональным матрицам.
Принимая во внимание общее определение группы, мы видим, что
имеет место
Т е о р е м а 2. Справедливы следующие утверждения:
i) все унитарные матрицы порядка п являются элементами (уни­
тарной) группы U{n);
п) унитарная группа U{n) содержит в качестве подгруппы (ор­
тогональную) группу О(п), состоящую из вещественных ортого­
нальных матриц порядка щ
ш) ортогональные (соответственно унитарные) матрицы с
определителем 1 составляют специальную ортогональную группу
SO{n) (соответственно специальную унитарную группу SU{n)).
Таким образом,
SO(n) = 0(п) П SL(n) С SU(n) = U{n) П SL(C).
§ 2. Эрмитовы векторные пространства 123

Вообще говоря, можно было бы без особого труда определить


ортогональную группу 0 (п,Я) над произвольным полем Я, равно
как и унитарную группу 17(п,Я) над полем Я, допускающем аналог
комплексного сопряжения а у а.
5. Нормированные векторные пространства. Неравенство
(10) из § 1 (длина стороны треугольника не превышает суммы длин
двух других его сторон) и его унитарный аналог (5) позволяют счи­
тать векторные пространства со скалярным произведением метри­
ческими пространствами в смысле следующего общего определения.
О п р е д е л е н и е 5. Пусть Е — множество точек и d : Е х Е —>
—у Ж — отображение, сопоставляющее любым двум точкам u,v G Е
неотрицательное вещественное число d(u, v) (расстояние между и и
v) и обладающее следующими свойствами:
i) d{u,v) = d{v,u) (симметрия);
ii) d(u,v) = 0 и = v]
iii) d(u,w) ^ d(u,v) +d(v, w) (неравенство треугольника).
Функция d с такими свойствами называется метрикой, а пара
(E,d) — метрическим пространством.
П р и м е р 3. В векторном п р о стр ан ств е V со скалярны м произведением и
тем сам ы м с определённой нормой ||х || за расстоян ие м еж ду век то р ам и х , у при­
ни м ается d(x, у ) := ||х — у11. Т ак, наприм ер, для V = 6 2 ( 0,, 6) м етрикой служ ит

Но условиям i)—iii) определения 5 удовлетворяю т т а к ж е ф ункции

в чём нетрудно убедиться непосредственной проверкой.


Наличие метрики сразу же приводит к простейшим понятиям из
топологии и анализа, включая понятие предельного перехода. Под­
множества
В (ао, г) = {х G Е | d(a0,x ) < г},
В(а0, г) = {х G Е \ d(a0 ,x) ^ г},
S(a 0 ,r) = {х £ Е | d(a0, х) = г}
метрического пространства (Е, d) называются соответственно
открытым шаром, замкнутым шаром, сферой с центром в точке
ао и радиусом г.
Подмножество F С Е ограниченное, если оно содержится в неко­
тором шаре радиуса г < оо.
Последовательность точек ei, в2, . .., еп ... в (Е, d) сходится к
точке е Е Е, если limn_>.00d(en, е) = 0. Последовательность назы­
вается фундаментальной или последовательностью Коши, если для
124 Гл. 3. Векторные пространства со скалярным произведением

всякого г > 0 существует N = N(e) такое, что d(en,em) < £ при


ш, п > N. Метрическое пространство Е называется полным, если
любая последовательность Коши в нём сходится. Из полноты Е и С,
доказываемой в анализе, следует, что пространства Е п и С п с любой
из метрик

d(x, y) = ( ^ | ж г - г / * | 2) >
П

dl(x,y) = тах(|Жг - У*|)> d2(x, y) = ^ |аг* - Уг I


1=1

полны (проверить, что d\ и d% — метрики; для d это следует из при­


мера 2).
Итак, пусть V — вещественное или комплексное векторное
пространство с метрикой d. Особо важным является случай, когда d
удовлетворяет двум дополнительным условиям:
а) d(x, у) = d(x + z, у + z) для любых x,y,z G У (инвариантность
относительно сдвига);
б) d{Лх, Лу) = |А| d(x, у) (умножение на скаляр Л увеличивает рас­
стояние в |А| раз).
О п р е д е л е н и е 6. Назовём нормой вектора х Е V относительно
метрики d с условиями а), б) и будем обозначать через ||х|| число
d(x, 0).
В пространстве со скалярным произведением (* | *) метрика d
вводилась нами специальным образом (пример 3), так что старое
и новое определения нормы вектора х согласованы. Поэтому исполь­
зуется прежнее обозначение ||х||. Возвращаясь к общему случаю, мы
должны убедиться, что выполнены следующие свойства нормы:
||0|| = 0; ||х|| > 0, если х ф 0;
11Л х | | = |А| ||х|| для всех A G С, х Е V;
IIх + У|| ^ ||х||+ ||у|| для всех X,у G V.
Первые два свойства непосредственно вытекают из аксиом ме­
трики и условий а), б); третье проверяется так: ||х+у|| = <i(x+y, 0) =
= d(x, - у ) ^ d(x, 0) + d(0, - у ) = ||х|| + ||у||.
О п р е д е л е н и е 7. Векторное пространство V , снабжённое функ­
цией нормы || * || : V —> Е, удовлетворяющей перечисленным трём
условиям, называется нормированным. Полное нормированное век­
торное пространство называется банаховым.
Пространства Е п и С п с любыми нормами, отвечающими рас­
смотренным выше метрикам, банаховы. Заметим ещё, что по норме
восстанавливается метрика: положив d(x, у) := ||х —у||, легко прове­
рить аксиомы метрики. Для неё d(x, 0) = ||х||.
§ 2. Эрмитовы векторные пространства 125

Понятие сходимости последовательности в метрическом прост­


ранстве, данное нами выше, специализируется на случай нормиро­
ванных векторных пространств и называется сходимостью по норме.
Справедлива несложная
Т е о р е м а 3. Пусть V — векторное пространство размерности
п над Е или С со скалярным произведением.
Тогда эквивалентны следующие два понятия сходимости после­
довательности векторов х/, Е V, k = 1, 2, ..., к вектору х Е V:
i) Цх/g —х|| —>0 при к —>оо;
п) (х/, —х | у) -а 0 при к ^ оо для каждого фиксированного
yev.
Д о к а з а т е л ь с т в о . i)^=>ii), поскольку в силу неравенства (4)
имеем
|(xfc —X I у) | ^ ||х* - х11 • ||у|| -»• 0.
п )= И ). Чтобы увидеть это, возьмём в V ортонормированный
базис ( e i , . . . e n). Если верно п), то (х/, —х | еД -а 0 для каждого
i = 1, 2, .. ., п. Поэтому, используя равенство
п
||х* —х||2 = £ | ( х * - х М 2
2=1

(теорема 1, iii)), приходим к выводу, что и ||х^ —х|| — >0. □


Линейная структура позволяет определить понятие сходимости
ряда, более сильное, чем сходимость по норме его частичных сумм.
Именно, ряд Xf называется абсолютно сходящимся, если схо-
дится ряд IIх *II-

УПРАЖНЕНИЯ

1. С 0 ( п ) = {A G М п (С) | 1А • А = Е } — определение комплексной о р т о го ­


нальной группы . П онятно, ч т о О(п) С С О(п) и SO{n) С S'CO(n) (подгрупп ы в
О (п ) и СО (п) элементов с определителем 1). М ожно ли по аналогии с теорем ой 2
го во р и ть о вклю чениях С 0 ( п ) С U(n) и SCO(n) С U ( n )?
2. П о к а за ть , ч т о м етри к и d\ и с?2 из п. 5 не индуцирую тся каким -либо ска­
лярны м произведением на Шп (аналогично на Сп ).
3. И спользуя ф ункциональны е средства, провери ть, ч т о формулой
1/р
||х||р =

для лю бого р ^ 1 на п р о стр ан ств е Шп за д а ёт ся норм а (т а к н азы ваем ая 1р-норма).


П ровери ть, ч то
1/ р
Пт m ax \хЛ.
р—Ьоо 1<г<п
Т огд а ф орм ально можно с ч и т а т ь d i ( x , y ) = ||х — у||оо (очевидно, ч т о с?2 ( х , у ) =
= ||х - у 111, d(x, у) = ||х — у | | 2).
126 Гл. 3. Векторные пространства со скалярным произведением

Н а векторном п р о стр ан ств е С ( 0,1 ) н епреры вн ы х ф ункций / : [0,1] —» К су­


щ ествую т аналоги ук азан н ы х норм:

Н/1|оо = m ax |/(t)|, ll/lli = [ \f(t) \ dt.

Более общо: \\f\\p = ( / q \f(t)\p dt) (это упраж нение носит необязател ьн ы й х а­
р а к т е р ).

§ 3. Л и н ей н ы е о п ер а то р ы на п р о с т р а н с т в а х
со скалярны м п р о и зв ед ен и ем
1. Связь между линейными операторами и ^-линейными
формами. Под ^-линейной формой на векторном пространстве У
понимается билинейная форма (0 = 2), когда У — вещественное век­
торное пространство, и полуторалинейная форма (в = 3/2), когда
У — комплексное векторное пространство. Будем считать теперь
У евклидовым (соответственно эрмитовым) пространством над Е
(соответственно над С) со скалярным произведением (* | *). Пусть,
далее, Л — произвольный линейный оператор на У. В п. 6 из § 3
гл. 2 было введено понятие линейного оператора Л*, сопряжённого
к Л и действующего на У*. В случае пространства со скалярным
произведением имеется далёкая аналогия между линейными опера­
торами и ^-линейными формами, что отражает наличие (по крайней
мере в вещественном случае) естественного изоморфизма между У
и У* и что найдёт отражение в действии Л* непосредственно на У.
Остановимся на этом более подробно. Рассмотрим отображение
/д : У х У ч Я (Л = Е или Я = С),
определённое по правилу
/ а (х , у ) := ( А х \ у ) . (1)
Из свойств скалярного произведения непосредственно вытекает, что
— ^-линейная форма на У, т.е. билинейная форма в вещественном
случае и полуторалинейная — в комплексном. Аналогичную проверку
мы не раз проводили.
Соответствие Л ь-х /ур задающее отображение C(V) —х Св(У,Я),
инъективно. Действительно, если (Лх | у) = /л(х,у) = (Вх|у), то
((Л - Б)х |у) = (Лх - Бх |у) = (Лх |у) - (Бх |у) = 0 Vy е У,
откуда (Л — В)х = 0 Vx G У, или Л = В. Отсюда, а также из
равенства dim£(y) = dim Се (У,Я) вытекает биективность нашего
отображения.
Это, впрочем, можно усмотреть и из явной конструкции по задан­
ной ^-линейной форме /(х, у) линейного оператора Л/, для которого
/(х, у) = (уЦ х|у). (2)
§ 3. Операторы на пространствах со скалярным произведением 127

Вот как это нужно делать. Пусть ( e i , . . . , e n) — ортонормирован-


ный базис в V, a F — матрица ^-линейной формы /(х, у) в этом
базисе. Как всегда, обозначим через X = [яд,... ,х п\ столбец коор­
динат вектора х = ^7 Ввиду ортонормированности базиса ска­
лярное произведение вектора х и вектора у = yjej записывается
в виде произведения строки 1Х и столбца У : (х |у) = 1Х •Y .
Возьмём в качестве Af линейный оператор с матрицей fF. Ему
соответствует линейное преобразование X \-У lF X столбцов коор­
динат в базисе (еД. Определяющее соотношение (2) теперь является
просто интерпретацией введённых обозначений:
Дх,у) = tX F Y = t ( t F X ) Y = ( A f x |у).
Но мы могли бы взять некий линейный оператор А у* с матрицей F.
Тогда
Дх,у) = tX ( F Y ) = (х| Л^у).
Если положить А = fF, Л* = 1A = F , t o A будет матрицей нашего
оператора Д /, а Л* = ^Л — матрицей оператора Ду>.
Всё сказанное позволяет утверждать, что справедлива
Т е о р е м а 1. Пусть V — векторное пространство со скаляр­
ным произведением (* | *). Тогда любая из формул
/д(х,у) = (Лх|у), /д (х ,у ) = (х| Л*у) (3)
устанавливает биективное соответствие между в-линейными
формами и линейными операторами на V. Взятые вместе форму­
лы (3) однозначно определяют линейный оператор А* : V —> V,
сопряжённый к А.
В ортонормир ованном базисе матрица оператора А * получа­
ется из матрицы оператора А путём транспонирования и комп­
лексного сопряжения (в случае Я = С).
Определение
(Лх|у) = (х|Д*у) (4)
при Я = М полностью согласуется с определением сопряжённого опе­
ратора в п. 6 из § 3 гл. 2, поскольку каждая линейная функция на
V имеет вид у i—> (х |у) при некотором фиксированном х. Вспомним
в этой связи выражение ег = (е^ | *) для векторов дуального базиса
(см. (13) из § 1).
Стоит отметить, что в векторном пространстве, не снабжённом
евклидовой или эрмитовой структурой, сопоставление ^-линейной
форме / с матрицей F в некотором базисе линейного оператора с
матрицей А = lF носило бы случайный характер. Действительно,
при переходе к новому базису при помощи матрицы перехода В ма­
трицей ^-линейной формы становится F' = tB F B 1 так что А' =
= lF' — В* lFB. Но в то же время по теореме 3 из § 2 гл. 2 мы
128 Гл. 3. Векторные пространства со скалярным произведением

должны иметь А 1 = В ~ 1АВ = B ~ llFB. Между двумя выражениями


для А' нет ничего общего. Однако в случае эрмитова (евклидова)
пространства матрица В должна сохранять ортонормированность
базисов, что влечёт её унитарность (соответственно ортогональ­
ность). Для унитарной матрицы В * = Р?-1 , так что имеется полная
согласованность.
Перепишем ещё раз известные свойства отображения А н-УА *:
Д + Б*=Д*+Б*, (аА )*=аА *, (АВ)*=В *А*, А * * = А. (5)
Небольшое отличие от формул (15) из § 3 гл. 2 — наличие знака
комплексного сопряжения над а, обусловленное полуторалиней-
ностью формы (* | *) и типом соответствия Фv : / н-У (v | *) (см.
п. 4 из § 1).
2. Типы линейных операторов. Все линейные операторы,
действующие на векторном пространстве V со скалярным произве­
дением (* | *), разбиваются на классы в зависимости от их поведения
по отношению к операции *, введённой в п. 1. Выделим наиболее
важные классы.
О п р е д е л е н и е 1. Линейный оператор А называется эрмитовым
(или самосопряжённым), если АС — А. В случае евклидова простран­
ства (Л = Ж) оператор А — АС называют ещё симметричным.
Самосопряжённость оператора А эквивалентна условию эрмито-
вости ^-линейной формы (Дх|у), как это вытекает из теоремы 1.
Действительно, условие самосопряжённости записывается в виде
(Дх| у) = (х| Лу),
а условие эрмитовости формы /д — в виде
(Лх Iу) = /л (х , у) = /д (у ,х ) = (Лу Iх).
Так как (* | *) — эрмитова форма, то (Ау | х) = (х | Ау). Это и уста­
навливает эквивалентность упомянутых условий.
В матричной форме, если использовать ортонормированный ба­
зис пространства V , условие самосопряжённости (эрмитовости) опе­
ратора А выражается равенством 1 А А 0 . Раньше именно такие
— —

матрицы мы называли эрмитовыми, а в вещественном случае — сим­


метричными.
Каждая вещественная матрица А является суммой симметричной
и кососимметричной (см. гл. 1, § 4, п. 4). Чтобы иметь аналог этого
свойства в комплексном случае, введём
О п р е д е л е н и е 2. Линейный оператор А называется косоэрми­
товым (или ко со симметричным при А = Е), если АС — —А.
Так как А** = А для любого A G £(К), то оператор А + А* эрми­
тов, а А —АС косоэрмитов. Аналогично, эрмитовость А эквивалентна
косоэрмитовости оператора г А. Поэтому справедлива
§ 3. Операторы на пространствах со скалярным произведением 129

Т е о р е м а 2. Каждый линейный оператор Z на эрмитовом


пространстве записывается в виде
Z = A + B,
где А — эрмитов, а В — косоэрмитов оператор. Кроме того,
Z = X + iy , (6)
где X и У — эрмитовы линейные операторы.
Д о к а з а т е л ь с т в о . Положить A — (Z + Z*) / 2, В = (Z —Z *)/ 2,
Т = А, У = —г В. Далее — непосредственная проверка при помощи
формул (5). □
Запись (6), очевидно, является прямым обобщением записи ком­
плексного числа z в виде z = х + iy, т.е. эрмитовы операторы —
далёкие аналоги вещественных чисел. В свою очередь косоэрмитов
оператор — прямой “потомок” чисто мнимого числа z = iy, для
которого z = —z. Но если произведение двух вещественных чисел
всегда есть вещественное число, то произведение двух эрмитовых
операторов не обязательно эрмитово.
Имеет место
Т е о р е м а 3. Произведение АВ эрмитовых операторов является
эрмитовым тогда и только тогда, когда АВ = В А.
Д о к а з а т е л ь с т в о . Используя снова формулы (5), получаем
АВ = В А (АВУ = (ВАУ = Д*Б* = АВ. □
Многочисленные приложения в физике и математике вызывают
потребность в рассмотрении множества всех эрмитовых или косоэр­
митовых операторов как алгебр в смысле определения 1 из § 2 гл. 2.
П р и м е р 1. К а к видно из теорем ы 6, эрм и товы м атр и ц ы или операторы ,
вообщ е говоря, не за м к н у ты относи тельно ассоциати вного произведения. В по­
п ы тке н ай ти алгебраи ческие рам к и для кван товой м еханики ф изик П. И ордан
ввёл в 1930-х го д ах алгебры над К, носящие теп ерь его имя. В основу положено
йорданово произведение
А о В = ^(АВ + ВА),
удовлетворяю щ ее закону к о м м у тати вн о сти (очевидно) и то ж д ес тв у Й ордана
( Л2 о Б) о А = А 2 о (Б о А) (проверить!). К настоящ ем у времени р а зв и т а
содерж ател ьн ая тео р и я йордановы х алгебр, не обязательно конечномерны х.
П р и м е р 2. К осоэрм и товы о п ераторы о бразую т над К алгебру Л и (см. при­
мер 6 из § 2 гл. 2) относи тельно обы чной операции к ом м ути рования. Именно,
если Л и Б — к осоэрм итовы оп ераторы , то косоэрм итовы м будет т а к ж е их ком ­
м у та т о р [А , Б] = А Б — Б А.
Предположим, что (Ах. | у) = 0 V x ,y Е V. Тогда, в частности,
(Ах | Ах) = 0, а это может быть только при А х = 0 V x Е V , т.е. А =
= О. Этот критерий тривиальности А можно существенно усилить.
Т е о р е м а 4. Пусть (Ах \ х) = 0 V x Е V, и пусть выполнено
одно из двух условий:
1) V — эрмитово пространство;
9 А.И. Кострикин
130 Г л. 3. Векторные пространства со скалярным произведением

2) V — евклидово пространство и Л — симметричный опера­


тор.
Тогда Л — О.
Д о к а з а т е л ь с т в о . 1) Из двух легко проверяемых поляризаци­
онных тождеств
( Л х |у ) + ( Л у | х ) = (Л (х + у ) | х + у ) - ( Л х | х ) - ( Л у | у ) , (7)
(Ах | у) - (Ау | х) = -г (А(гх + у) | гх + у ) + i(A(ix) | гх) + i(Ay | у ),
( 8)
правые части которых по предположению равны нулю, мы приходим
к системе двух линейных однородных уравнений
( Э х | у ) + (Ау | х) = 0, (Д х | у ) - (Ау | х) = 0.

Отсюда следует, что (Д х | у) = 0 Vx, у Е V , а это, как мы уже знаем,


эквивалентно равенству А — О.
2) Поляризационное тождество (7), выполняющееся в любом слу­
чае, и условие симметричности
(Ау | х) = (у | А*х) = (у | Д х ) = (Д х | у)
дают в итоге то же самое тождество (Д х | у) = 0 V x ,y Е V , из
которого следует, что Д = О. □
З а м е ч а н и е 1. Симметричность оператора Д в условии 2) тео­
ремы 4 существенна. Например, для кососимметричного оператора
на евклидовом пространстве V выполняется тождество (Д х | х) = 0
V x Е V, но Д не обязательно нулевой оператор.
О п р е д е л е н и е 3. Линейный оператор Д на векторном прост­
ранстве со скалярным произведением называется унитарным (в евк­
лидовом случае — ортогональным), если Д* • Д = £ = Д • Д*.
При п = 1 имеем z • z = 1, т.е. унитарные операторы анало­
гичны комплексным числам, по модулю равным единице. В матрич­
ной форме (по отношению к ортонормированному базису) условие
унитарности выражается равенством (7) из § 2. Именно такие ма­
трицы мы и называли унитарными (в вещественном случае — ор­
тогональными). Они возникли естественным образом как матрицы
перехода от одного ортонормированного базиса к другому. Этому
факту отвечает более содержательная геометрическая интерпрета­
ция унитарных операторов.
О п р е д е л е н и е 4. Линейный оператор Д: V —>V, сохраняющий
расстояние (метрику), т.е. такой, что
\\Ах - Ау\\ = ||х - у|| V x ,y e V ,
называется изометрией.
Так как Д х —Д у = Д (х —у ), то, очевидно, Д — изометрия на V
§ 3. Операторы на пространствах со скалярным произведением 131

в точности тогда, когда ||Дх|| = ||х|| для всех х Е V. Далее,


||Дх|| = ||х|| (Д х |Д х ) = ( х |х ) «<=>
(Д* Ах | х) = (х | х) «<=> ((Л*Л — £)х | х) = 0 (9)
для любого вектора х Е V . Оператор Д * А —£ самосопряжён, поэтому
согласно теореме 4 как в эрмитовом, так и в евклидовом случае из
(9) вытекает тождество А* А —£ = О, т.е. изометричный оператор
Д должен быть унитарным.
С другой стороны, всякий унитарный оператор изометричен:
(Ах | Д х ) = (х | А* Ах) = (х | £х) = (х | х).
Следовательно, верна
Т е о р е м а 5. Унитарные линейные операторы на векторном
пространстве V с метрикой, и только они, являются изометриями
на V .
Унитарные, а стало быть, и изометричные операторы на V обра­
зуют группу — унитарную U(n) при Я = С и ортогональную 0(п)
при Я = Е. На языке матриц мы с этим фактом уже знакомы (тео­
рема 2 из § 2). Положение здесь такое же, как с группой GL(n,A):
можно говорить о группе матриц, а можно говорить о группе Aut(K)
автоморфизмов пространства V. Изометрии — это автоморфизмы,
сохраняющие метрику.
3. К а н о н и ч е с к и й в и д э р м и т о в ы х о п е р а т о р о в . Существова­
ние собственного базиса для любого эрмитова оператора, на первый
взгляд, не очевидное свойство. В самом деле, матрицы Д, А 1 данного
симметричного оператора Д : V —>• V (при Я = Ж) в разных ортонор-
мированных базисах (еД, (еД связаны соотношением А 1 = В ~ 1 А В ,
где В — ортогональная матрица. Мы знаем, что симметричную ве­
щественную матрицу можно привести к диагональному виду, но за
счёт произвольного выбора невырожденной матрицы В. Как оказы­
вается, свойством самосопряжённости Д можно распорядиться более
“экономно”.
Л е м м а 1. Собственные значения эрмитова оператора веще­
ственны.
Д о к а з а т е л ь с т в о . В самом деле, пусть А: V —>V — эрмитов
оператор, Л — его собственное значение, отвечающее собственному
вектору е Е V . По определению
А(е | е) = (Ае | е) = (Де | е) = (е | Д*е) = (е | Д е) = (е | Ае) = А(е | е).

Так как (е | е) ф 0, то А = А. □
В случае симметричного (т.е. вещественного самосопряжённого)
оператора утверждение леммы 1 пусто, ибо всякое его собствен­
ное значение по определению принадлежит Е. Напротив, следующая
лемма очевидна в комплексном случае.
9:
132 Г л. 3. Векторные пространства со скалярным произведением

Л е м м а 2. У каждого симметричного линейного оператора А


существует собственный вектор.
Д о к а з а т е л ь с т в о . Как и всякий вещественный оператор, А
обладает одномерным или двумерным собственным подпространст­
вом (теорема 7 из § 3 гл. 2). Существование одномерного инвари­
антного подпространства совпадает с утверждением леммы. Рассмо­
трим случай, когда L — двумерное инвариантное подпространство.
Оператор А индуцирует на L симметричный линейный оператор
А р , поскольку условие симметричности (Дх |у) = (х|Ду), будучи
ограниченным на х,у Е L, продолжает оставаться справедливым:
Дх Е I/, A y Е L.
Выберем в L ортонормированный базис (ei,e 2). Матрицей опе­
ратора Ар в этом базисе будет симметричная 2 х 2-матрица
а Ъ
Ь d
с характеристическим многочленом
t —а —Ъ
x(t) = = t 2 — (а + d)t + (ad —Ъ2).
—Ъ t —d
Дискриминант этого многочлена
Dx = (а + сI)2 —4(ad —Ь2) = (а —сI)2 + 4Ь2 ^ О,
так что x(t) имеет вещественный корень Л, а оператор А — соб­
ственный вектор с собственным значением Л. □
Дальнейшие рассуждения ведутся одновременно для Я = С и
Я = Е.
Л е м м а 3. Пусть А — самосопряжённый линейный оператор
на векторном пространстве V со скалярным произведением (* | *),
L — подпространство, инвариантное относительно А. Тогда ор­
тогональное дополнение L 1- к L также инвариантно относи­
тельно А.
Д о к а з а т е л ь с т в о . В самом деле, если х Е L, у Е ZA, то А х Е L
и (Ах | у) = 0 . Условие самосопряжённости А даёт также соотноше­
ние (х | А у ) = 0. Стало быть, вектор А у ортогонален любому вектору
х Е I/, т.е. A L х С lA . □
Теперь мы готовы доказать основную теорему.
Т е о р е м а 6. Существует ортонормированный базис прост­
ранства V со скалярным произведением, в котором матрица
самосопряжённого оператора А диагоналъна, причём Spec (А) ве­
щественный.
Д о к а з а т е л ь с т в о . По леммам 1 и 2 у линейного оператора А
имеется собственный вектор ei с собственным значением Ai Е Е.
Без ограничения общности считаем ||ei|| = 1. Ортогональное допол­
нение V к одномерному подпространству (ei) имеет размерность
§ 3. Операторы на пространствах со скалярным произведением 133

dim V —1 и по лемме 3 инвариантно относительно А. Рассматривал


ограничение А на V и повторяя все рассуждения, находим собствен­
ный вектор в 2: А е 2 = А2^ 2,11е 211 = 1, А2 G Е. Линейная оболочка
(ei,e 2) инвариантна относительно А , поэтому инвариантно ортого­
нальное к нему дополнение размерности dim У —2 и т.д. Рассуждая
по индукции относительно dim V или просто повторяя нужное число
раз описанную процедуру, мы найдём требуемые п = dim V взаимно
ортогональных нормированных векторов e i , ..., еп. □
З а м е ч а н и е 2. Характеристическое уравнение произвольной
симметричной матрицы А Е Мп(Ж) имеет по доказанному только
вещественные корни. К изучению их взаимного расположения приме­
нимы, следовательно, теоремы Декарта, Бюдана—Фурье, Штурма из
[ВА I]. Геометрическая и алгебраическая кратности каждого корня А
уравнения Ха (Ъ) = 0 совпадают, как это прямо вытекает из теоремы
б и теоремы б из § 3 гл. 2.
З а м е ч а н и е 3. Согласно теореме б для каждого самосопряжён­
ного оператора А : V —> V имеется п = dim V попарно ортогональ­
ных собственных направлений. Действие оператора А сводится к
растяжению пространства по к-му направлению в |АД раз, где А/, —
соответствующее собственное значение, и, возможно, при А/, < 0 к
отражению относительно плоскости, ортогональной к к-му напра­
влению.
4. Приведение квадратичной формы к главным осям. Мы
знаем (см. и. 1), что всякой эрмитовой форме /(х,у) на векторном
пространстве V со скалярным произведением (* | *) соответствует
линейный самосопряжённый оператор А = Д /, определяемый усло­
вием
/(х,у) = (Дх|у).

По теореме б существует ортонормированный базис (ei,...,en)


пространства V , состоящий из собственных векторов оператора А:
Aei = Ai&i. Если записать векторы х,у в этой координатной системе:
х = Xiei + ... + х пеп, у = yiei + ... + упе п,
то получим
п

поскольку /(е^, еД = (Де* | еД = (А« | еД = (А ^ | еД = A{Sij. Полагая


х = у, мы приходим к следующему утверждению.
Т е о р е м а 7 (приведение к главным осям). Для всякой квадра­
тичной эрмитовой формы q(x) на п-мерном векторном прост­
ранстве со скалярным произведением существует такой ортонор­
134 Г л. 3. Векторные пространства со скалярным произведением

мированный базис, в котором q(x) принимает вид


п
«(х) = Y s Xi n 2- (9)
2=1

П р и м е р 3. П ри Я = 1 и п —2 к в ад р ат и ч н ая ф о р м а q определяет ц ен тр ал ь­
ное коническое сечение, состоящ ее из тех век торов х, для к о то р ы х q{x) = 1.
И спользуя ортонорм и рован н ы й базис ( e i , e 2), в котором q{x) при н и м ает вид (9),
имеем Х \ х \ + А2Ж2 = 1. В ек то р ы e i , е 2 определяю т направления главны х осей
эллипса (А1 А2 > 0) или гиперболы (А1 А2 < 0), а через Ai, А2 в ы р аж аю тся длины
полуосей.
Теоремы б и 7 на матричном языке звучат одинаково.
Для любой эрмитовой (или вещественной симметричной) мат­
рицы А существует унитарная (соответственно ортогональная)
матрица В такая, что матрица В ~ гАВ диагоналъна. По диагонали
стоят собственные значения матрицы А , каждое со своей крат­
ностью.
П р а к т и ч е с к и е р е к о м е н д а ц и и . Матричная интерпрета­
ция геометрических фактов подсказывает возможный порядок дейст­
вий для приведения квадратичной формы
п
ФМ = XiX3

(ограничимся вещественным случаем) к каноническому виду. Имен­


но, примем x i , ..., х п за координаты вектора х в евклидовом прост­
ранстве V со скалярным произведением
п
(х | у )

так что ei = (1,0,..., 0), ..., еп = (0,...,0,1) — ортонормирован­


ный базис в V. Вычислим характеристический многочлен XA(t) =
= det (tE —А) с А = (а^) и найдём его корни (наиболее трудная
часть процесса). Для каждого корня А* решим линейную однород­
ную систему уравнений
(ац — \i)x 1 + а ± 2 Х 2 + . . . + CLlnx n — 0,

0>21х 1 + (&22 — \ ) x 2 + . . . + &2пх п = 0,

U n lx l + &п2х 2 + •••+ (dun — Ai ) x n — 0.


Пространство решений этой системы имеет размерность, рав­
ную алгебраической кратности корня Ai (следствие симметричности
матрицы А). Применяя к фундаментальной системе решений про­
цесс ортогонализации Грама—Шмидта, а затем объединяя системы,
§ 3. Операторы на пространствах со скалярным произведением 135

соответствующие различным А^, получим ортонормированный базис


пространства V
e'j = b i j e i + b2 j e 2 + . . . + bn j e n , 1 ^ j ^ n.

В этом месте мы опираемся по существу на известное свойство сим­


метричного (более общо: самосопряженного) оператора А с матри­
цей А = (ctij) в ортонормированном базисе ( e i , . . . , e n): собствен­
ные векторы u, v, отвечающие различным собственным значениям
Л, /i, ортогональны друг другу. В самом деле, (Ли | v) = (и | Av) = >
= > (Ли | v) = (и | /iv) = > (A —/i)(u|v) = > (и | v) = 0 (веществен­
ность Л, ц существенна).
Матрица (Ь^-), связывающая две ортонормированные системы,
будет ортогональной (у нас Я = М), поэтому новые координаты
х [ , . . . , х'п вектора х, для которых
п

<КХ) = ^ 2 M x'i)2,
2=1
выражаются через старые координаты по формулам, выписанным в
конце § 1.
5. Приведение пары квадратичных форм к каноническо­
му виду. Пример форм q(x) = |x i|2 — |ж2|2, г(х) = \xi \ • \х2 \ по­
казывает, что не всегда можно в векторном пространстве выбрать
такой базис, чтобы две квадратичные формы одновременно приняли
канонический вид. Тем не менее в одном практически важном случае
существование указанного базиса гарантировано.
Т е о р е м а 8. Пусть на векторном пространстве V размернос­
ти п над Я = Е или Я = С заданы две эрмитовы квадратичные
формы (т.е. квадратичные формы с вещественными значениями)
q(x) и г(х), причём форма г(х) положительно определена.
Тогда в V существует базис, в котором обе формы записыва­
ются в каноническом виде.
Д о к а з а т е л ь с т в о . Пусть д (х , у) — эрмитова ^-линейная фор­
ма, отвечающая квадратичной форме г(х). Определим на V скаляр­
ное произведение, полагая
(х IУ) : = р ( х , у ) .
Положительная определённость формы г(х) позволяет это сделать.
Согласно теореме 7 в У с указанной эрмитовой метрикой найдётся
ортонормированный базис ( e i , . . . , e n), в котором q(x) принимает
канонический вид (9). В свою очередь в том же базисе скалярный
квадрат вычисляется по формуле
п

( х| х) = 0(х,х) = г(х) = ^ 2 \ X i \2.


2=1
136 Г л. 3. Векторные пространства со скалярным произведением

Итак, в базисе (еД обе квадратичные формы приняли канонический


вид. □
6. Канонический вид изометрии. Согласно теореме 5 изо­
метрии на У — это в точности унитарные операторы (ортогональ­
ные операторы в случае Я = Ж). Мы рассмотрим по отдельности
комплексный и вещественный случаи, но вначале докажем некото­
рые общие факты.
Л е м м а 4. Собственные значения унитарного (ортогонального)
оператора по модулю равны 1 (соответственно равны ±1).
Д о к а з а т е л ь с т в о . Пусть Л : V —У У — унитарный (в част­
ности, ортогональный) оператор и е Е У — собственный вектор с
собственным значением Л. Тогда
(Ле |Ле) = (Ле |Ле) = ЛЛ.
С другой стороны,
(Ле |Ле) = (Д* •Де |е) = (Ее |е) = (е |е).

Поэтому ЛЛ = 1,т.е. |Л| = 1.Понятно, что в вещественном случае (ор­


тогональных операторов) имеются лишь две возможности Л = ±1. □
Л е м м а 5. Пусть U С У — инвариантное подпространство
унитарного (ортогонального) оператора Л: V —> У. Тогда орто­
гональное дополнение U1- к U в V также инвариантно относи­
тельно Д.
Д о к а з а т е л ь с т в о . По определению
u L = {v е v \ ( u | v ) = о Vue;/}.
Ограничение Л и оператора Д на U является, очевидно, унитарным
оператором (изометрией на U). Так как detA u ф 0, то вектор и
можно записать в виде и = Ди' с и' Е U. Имеем
(и IAv) = ( Л и 1IAv) = (и' IV) = 0.
Другими словами, A v Е U1- вместе с v Е U1-. □
А) У н и т а р н ы е о п е р а т о р ы . В терминах матриц мы хотим
доказать следующее: для каждой унитарной матрицы А сущест­
вует такая унитарная матрица В, что
С = В ~ ХАВ = diag{Ai,...,An}
— диагональная матрица с |Л*| = 1.
На самом деле удобнее действовать, опираясь на геометрический
смысл унитарных операторов.
Т е о р е м а 9. Каждый унитарный оператор (Я = С) диагонали-
зируем. Другими словами, для каждого унитарного оператора Д :
V —>• V, dim У = п, найдётся ортонормир ованный базис, в котором
матрицей оператора будет
А = diag {Аь ... ,Л„}, |А*| = 1. (10 )
§ 3. Операторы на пространствах со скалярным произведением 137

Д о к а з а т е л ь с т в о . Возьмём любой нормированный собствен­


ный вектор ei оператора А. Он существует, поскольку основное
поле Я = С алгебраически замкнуто. По лемме 5 подпространство
(еД^ = U размерности п — 1 инвариантно относительно А. Индук­
ция по размерности V даёт требуемый результат. Утверждение о
доказано в лемме 4. □
Заметим, что оператор с матрицей А вида (10), конечно, является
унитарным, поскольку
■А = diag{Ai,. .. , А„} • diag{Ab ..., Ап} = Е.
Обычно диагональную унитарную матрицу А записывают в виде
ei(fl
ei(f2
А=

используя формулу Эйлера егср = coscp + г sincp.


Б) О р т о г о н а л ь н ы е о п е р а т о р ы . Как отмечалось, леммы 4
и 5 справедливы для ортогонального оператора А : V —> V с тем
уточнением, что собственные значения в данном случае равны =Ь1.
Однако дальнейшие рассуждения нуждаются в небольшом измене­
нии. Дело в том, что ортогональный оператор может и не обладать
собственными векторами. Разумеется, как и всякий вещественный
линейный оператор, А имеет одномерное или двумерное инвариант­
ное подпространство. Поэтому при помощи леммы 5 мы можем раз­
ложить V в прямую сумму одномерных и двумерных инвариантных
попарно ортогональных подпространств:
V = V\ 0 V2 0 • • • 0 Vrm (11)
на каждом из которых А индуцирует ортогональный линейный опе­
ратор. Объединение ортонормированных базисов в Vi, i = 1,... ,m,
даст нам ортонормированный базис в V. Мы получим так называе­
мый канонический базис для ортогонального линейного оператора А,
предположив, что в разложении (11) ни одно из двумерных подпро­
странств не разложимо в прямую сумму одномерных инвариантных
подпространств. Этого всегда можно добиться, и мы будем предпо­
лагать, что разложение (11) является таковым.
Посмотрим теперь, какова матрица оператора А в каноническом
базисе. Если Ai := Ayi — матрица ограничения оператора А на Vi,
то
Аг
А2
А — А \-\-... + Аш

Ат
138 Г л. 3. Векторные пространства со скалярным произведением

Достаточно поэтому ограничиться случаем, когда V не имеет инва­


риантных подпространств и dim V = 1 или dim V — 2 . Если dim V = 1
и V = (е), ||е|| = 1, то Л е = Ле, Л = ±1 (лемма 4). Если dimE = 2 и
Е = (ei,e 2), (е* | еД = Sij, то в этом ортонормированном базисе
а b
Д= а, 6, с, d G
с d
Предположим, что det А = ad —be = —1. Тогда характеристи­
ческий многочлен XA(t) = £2 — (а + d)t — 1 имеет два веществен­
ных корня и, стало быть, у оператора А существует собственный
вектор. Это, однако, противоречит условию, наложенному на V . Мы
приходим к выводу, что det А — 1. Вычисляя по известным правилам
обратную матрицу Д-1 , находим
d -Ь
д -1=
—с а
С другой стороны, в силу ортогональности
а с
Д - 1 = 1А =
Ъ d
Сравнивая два выражения для Д-1 получаем
а 2 +, с2 = 1.
а —с
Д=
с а
Таким образом, при а = cos (р, с = sirup будет
cos р —sin(^
Д=
sin р COS(£
т.е. линейный оператор А осуществляет вращение в плоскости V .
Проведённый анализ показывает, что если в разложении (11) пер­
вые г слагаемых V\ , . . . , Vr отвечают двумерным неразложимым ин­
вариантным подпространствам, а остальные — одномерным (чего
всегда можно добиться подходящей перенумерацией базисных век­
торов), и если р и ... ^Рг — соответствующие углы поворотов, то
матрица Д примет вид, указанный в следующей теореме.
Т е о р е м а 10. Для всякого ортогонального линейного оператора
А на V существует ортонормир ованный базис пространства V, в
котором матрицей оператора будет
COS(£i ■- sin pi
sin<£i COS(^i

COS p r —sin p r k + I + 2г = п.
sin p r COS p r
-E k
Ei
§ 3. Операторы на пространствах со скалярным произведением 139

7. Нормальные операторы. В доказательствах спектральных


теорем б и 9 много общего, и это не случайно, поскольку эрмитовы и
унитарные операторы входят в естественный, более широкий класс
диагонализируемых операторов.
О п р е д е л е н и е 5. Пусть V — эрмитово пространство. Линей­
ный оператор А: V —>V, обладающий свойством
Д • Л* = Л* • Л, (12)
называется нормальным. Его матрица в любом базисе также назы­
вается нормальной.
Напомним, что в силу (5) имеют место соотношения
(Л£)* = Х£, (А - X£)* = Л* - Х£,
поэтому оператор Д нормален вместе с А — XS. Из нормальности Д
вытекает, что
||Дх||2 = (Дх|Дх) = (х|Д*Дх) = (х| ДД*х) = (Д*х| Д*х) = ||Д*х||2.
Заменяя Д на А —А£, получаем
||Дх - Ах|| = ||Д*х - Ах||,
а отсюда следует, что
Дх = Ах Д*х = Ах. (13)
Понятно, что любое из условий JC — Л или Л * = А г 1 влечёт
(12). Совсем нетрудно, однако, привести примеры нормальных опе­
раторов, не являющихся ни эрмитовыми (или косоэрмитовыми), ни
унитарными (скажем, с матрицей А = diag(2i, 2,1,..., 1)). Вместе с
тем определение нормального оператора переносится на бесконечно­
мерные гильбертовы пространства и находит там многочисленные
применения. Нашей непосредственной целью является точное описа­
ние класса диагонализируемых линейных операторов на эрмитовом
пространстве.
Т е о р е м а 11. Эквивалентны следующие условия:
а) А : V —>• V — оператор, диагонализируемый в ортонормиро-
ванном базисе пространства V;
б) А — нормальный оператор.
Д о к а з а т е л ь с т в о , а) = > б). Если (ei, . . . , еп)— ортонормиро-
ванный базис с Де^ = А^е^, то в силу (13) Д*е^ = А^е^, так что
[Л, Л*] — О, и из а) следует б).
Для доказательства обратной импликации б) а) выберем соб­
ственное значение А оператора Л и, как обычно, положим
Ул = { х е У | Д х = Ах}.
Снова из (13) следует, что
Л*(ГЛ) С
140 Г л. 3. Векторные пространства со скалярным произведением

а в таком случае
л ( У А)х с ( v A)x .
Действительно,
y G ( y Y «=> (у |х) Vxe УА.
Стало быть, (Ду | х) = (у | Д*х) = (у | х') = 0, поскольку х' Е V х.
Так как (Д*)* = Д, то по симметрии подпространство (CA)X
также Д*-инвариантно. Ограничения операторов Д и Д* на ( y A)x ,
очевидно, коммутируют, т.е. являются нормальными. Применяя ин­
дукцию по размерности п = dim V , мы можем считать, что на (СА)±
оператор Д диагонализируется. Для V х это верно по определению, а
поскольку V = V х 0 (УА)± , доказательство завершено. □
Так как эрмитовы и унитарные операторы нормальны, то, диа-
гонализировав их по теореме 11, мы легко получим спектральные
свойства, о которых говорится в теоремах б и 9. Вспомним теперь
о полной ортогональной системе идемпотентных операторов (проек­
торов) из теоремы 1 из § 3 гл. 2. Общая спектральная теорема для
нормальных операторов может быть сформулирована в следующем
виде.
Т е о р е м а 12. Каждому нормальному оператору А на конечно­
мерном пространстве V отвечают попарно различные числа Ai,...
. .. , Am, 1 ^ т ^ п = dim V, и взаимно ортогональные проекторы
V i,... jVm, отличные от О и такие, что:
а) E j P # = £;
б) Y j AjPj = Д — спектральное разложение оператора А, так
что Aj G 8рес(Д);
в) разложение из п. б) единственно;
г) существуют комплексные многочлены fi ( t ) , . .., / т (£), обла­
дающие свойствами
= Sij, fi(A) = Vi
(в случае самосопряжённого оператора все числа Ai и многочлены
fi(t) вещественные).
Д о к а з а т е л ь с т в о . Пусть Ai, . . . , \ ш — все попарно различные
собственные значения оператора Д и Vi — проектор на V Xi (i =
= 1,..., т) параллельно Y j^ i V Xj • По теореме 11 (см. также её дока­
зательство) все Vj взаимно ортогональны (т.е. ViVj = VjVi = SijVi)
и отличны от О. Далее, V = ®iVx, так что Y i Vi = £ — свидетельст­
во полноты системы 7Д,... ,V m (утверждение а)).
Для любого вектора v Е V имеем A vj = AjVj, где Vj = VjV.
Таким образом, A v = A(£v) = A ( Y jV jv ) = Y j ^ Yj — =
= = (S j a эт0 и есть основное утверждение б).
Что касается утверждения в) о единственности спектрального
разложения оператора Д, то рассуждаем так. Из Vi ф О следует
§ 3. Операторы на пространствах со скалярным произведением 141

существование вектора х / 0, х G ImVi. По определению Трк = х,


PjX = 0 при j ф г. Поэтому
Лх = ^ AjPjX = ЛiVi* = ЛiX,
з
т.е. Ai G Spec(^).
Обратно, если Л G Spec(^) и Л у = Av для некоторого v ф 0, то
A v = \ v = A £ v i? Vj = Pj v,
J
а с другой стороны,
^ = Л £ ^ = £ A vj = £ AjWj.
3 3 3
Поэтому A — Aj)vj = 0. Но векторы v i , . . . , v m взаимно орто­
гональны (следствие взаимной ортогональности проекторов V\ ,...
• • • ч'Рщ) и, значит, те из них, которые отличны от 0, линейно неза­
висимы. Стало быть, (А —Aj)vj = 0 для каждого j, и если v* ф 0
(а такое г найдётся, поскольку v ф 0) , то А = А^ G {Ai,...,Am}.
Единственность установлена.
Многочлены Д (£),...,/ m(t) G C[t\ из утверждения г) строятся
конструктивно:
t ^3
/,(*) = п Ai Aj

Понятно, что fi(t) G М[£], если Л — самосопряжённый оператор.


Используя определение семейства взаимно ортогональных проек­
торов Vj и разложение б), будем иметь
л 2 = ( £ h r ) ( £ ajV j) = £ x ^ V j = £ a 2р,-,
г 3 hJ 3
л 3 = А 4 2 = ( £ XiPi) ( £ A2р ,) = £ А3Р,,
i 3 3

•4‘ = £ a*?>.
3
(при k = 0 использовать а): Л0 = ^jV j = = £). Таким
образом,
/И) = £ / ( xppj
3
для любого многочлена /(£). В частности,
ли) = £ л(а,оъ = м а<)р<=р*. □
3
142 Г л. 3. Векторные пространства со скалярным произведением

Как всякий линейный оператор, нормальный оператор Д записы­


вается в виде Д = В + гС и, аналогично, Д* = В —iC, где В, С —
эрмитовы операторы (см. (6)), в свою очередь выражающиеся через
Л и Л*:
В = \ { Л + Л*), С = А а ~Л*).
2 2г
Из АА* = А* А следует, что ВС = СВ. Обратно, из перестановочно­
сти В и С вытекает перестановочность А и АС'.
АЛ* = В 2 +С 2 = А* Л,
т.е. нормальность А.
Отвлекаясь от нормальных операторов, остановимся на роли пе­
рестановочных или, как ещё говорят, коммутирующих операторов.
Л е м м а 6. Пусть А, В — перестановочные операторы на ком­
плексном пространстве V. Тогда А и В имеют общий собственный
вектор.
Д о к а з а т е л ь с т в о . Пусть A Е Spec(Al). Рассмотрим подпро­
странство V х = {х Е V | Дх = Ах}. Тогда B V X С V х. Действительно,
используя условие АВ = В А, приходим к импликации
х Е V х = > А(Вх) = В (Ах) = В( Ах) = А(Вх),
т.е. Бх Е КА.
Линейный оператор Б, ограниченный на К А, имеет собственный
вектор у Е КА: By = /ху, /г Е Spec(S). Таким образом, Ду = Ау,
By = /ху, т.е. у — общий собственный вектор. □
Т е о р е м а 13. Два эрмитовых оператора Д, Б или две изоме­
трии Д, Б на п-мерном эрмитовом пространстве V одновременно
приводятся к диагональному виду в некотором ортонормир ованном
базисе тогда и только тогда, когда они перестановочны.
Д о к а з а т е л ь с т в о . Предположив, что Д и В диагонализируемы
в общем ортонормированном базисе, мы приходим к выводу о пере­
становочности их матриц А, В в этом базисе. Но так как в любом
другом базисе матрицами операторов будут С~ 1 АС, С~ 1 В С , а
С - 1 АС • С - 1 ВС = С - 1 АВС = С - 1 ВАС = С~ХВС • С - 1 АС,
то перестановочны сами операторы.
Обратно, пусть АВ = ВА. Тогда по лемме б операторы Д, В
имеют общий собственный вектор ei. Без ограничения общности
можно считать, что ||ei|| = 1. Подпространство W = размер­
ности п — 1 инвариантно относительно Д и относительно В в силу
их эрмитовости (лемма 3) или в силу унитарности (лемма 5). Огра­
ничения Д и В на W будут перестановочными эрмитовыми (соот-
ветствтенно унитарными) операторами. Индукция по размерности
приводит к явной конструкции ортонормированного базиса, в кото­
ром Д и В запишутся в диагональной форме. □
§ 3. Операторы на пространствах со скалярным произведением 143

З а м е ч а н и е 4. Напомним, что по теореме 3 перестановочность


эрмитовых операторов Д , В эквивалентна эрмитовости операто­
ра ЛВ.
8. Положительно определённые операторы. Так как лю­
бому эрмитову оператору А на эрмитовом пространстве V (симмет­
ричному оператору на евклидовом векторном пространстве)
отвечает квадратичная форма q(x) = (Ах. | х), а к последней приме­
нимы такие понятия, как положительная определённость, полуопре-
делённость и т.п. (см. гл. 1, § 4, п. 8), то их можно переносить и
на А.
О п р е д е л е н и е 6. Эрмитов (или линейный симметричный ) опе­
ратор А называется положительно определённым, если (Дх | х) > О
для любого вектора х / 0 из У.
Теорема б и последующие замечания показывают, что для вся­
кого положительно определённого оператора А существует ортонор-
мированный базис пространства V , в котором матрица А принимает
диагональный вид:
Ai
А= (14)

с положительными собственными значениями Ai, . . . , An G Е. Обрат­


но, интерпретируя любую матрицу А вида (14) как матрицу эрми­
това (симметричного) оператора А относительно какого-то орто-
нормированного базиса пространства V , мы приходим к выводу,
что условие Ai > 0, . .., Ап > 0 обеспечивает положительную опре­
делённость А. Это обстоятельство закрепляется символом А > 0.
Имеет смысл также говорить о положительно полуопределённом
операторе А (обозначение: А ^ 0), когда Ai ^ 0, . .., Ап ^ 0 и А^ =
= 0 для некоторых индексов i. Для двух эрмитовых (симметричных)
операторов А, В будем писать А ^ В, если А —В ^ 0.
По смыслу положительно определённый оператор невырожден
(обратим). Это видно и из неравенства Коши—Буняковского
|{ 3 х |х )| «С ||3х|| • ||х||.
Обратно, условия невырожденности и А ^ 0 гарантируют положи­
тельную определённость А.
П ре д л о ж е н и е 1. Всякий положительно определённый опера­
тор А записывается в виде квадрата некоторого другого положи­
тельно определённого оператора: А = Б 2, причём выражение корня
квадратного В := л/Д единственно.
Д о к а з а т е л ь с т в о . Достаточно привести матрицу оператора
Д к диагональному виду (14) и положить В = diag(v/A]~, • • •, л/Ап)5
считая л/X i > 0. Оператор В с матрицей В в данном ортонормирован­
ием базисе будет положительно определённым. Соотношение А = В 2
144 Г л. 3. Векторные пространства со скалярным произведением

при переходе к другому базису сохраняется: С~ХАС = (С~гВС )2.


Таким образом, А = В2.
Утверждение о единственности В удобно доказывать при помощи
теоремы 12 о спектральном разложении. Именно, если В 1 > 0 и (В1)2 =
= А, то, рассматривая спектральное разложение В 1 — iijVj, по­
лучаем соотношение
= (В')2 = Л = 5 > T V
з i
Все числа fij > 0 попарно различны, как и их квадраты /л2. Един­
ственность спектрального разложения оператора А приводит нас к
заключению, что множества {/а2} и {АД совпадают, т.е. при надлежа­
щей перенумерации должны выполняться равенства /л2 = A V[ = V i,
откуда fii — у/Х~i т Bf = В = у/ А . □
П р е д л о ж е н и е 2. Пусть С — произвольный невырожденный
линейный оператор на пространстве со скалярным произведением.
Тогда произведение А = СС* (или С*С) является невырожденным
положительно определённым оператором.
Д о к а з а т е л ь с т в о . Эрмитовость (или симметричность) опера­
тора СС* уже проверялась: (СС*)* = С**С* = СС*. Невырожденность
А = СС* очевидна: detCC* = detC^C = detC detC = detC det C =
= | detC |2 Ф 0. Далее, x / 0 = > C*x ф 0, поэтому по определению
сопряжённого оператора имеем
(СС*х|х) = (С*х | С*х) > 0 V x ф 0.
Это и значит, что А — СС* — положительно определённый оператор.
То же относится и к произведению АСА. □
Из предложений 1, 2, обобщённых на случай вырожденных опе­
раторов, немедленно вытекает
Т е о р е м а 14. Пусть V — пространство со скалярным произве­
дением (* | *). Следующие свойства линейных операторов на V экви­
валентны:
1) А = В2, В* =В;
2) А = СС*;
3) (Д х | х) ^ 0.
В одномерном комплексном пространстве каждое из свойств 1),
2) характеризует неотрицательные вещественные числа: z ^ 0 озна­
чает возможность как записи z = А2, А Е Е (аналог 1)), так и z — z 1 z'
(аналог 2)).
9. Полярное разложение. Упомянутый параллелизм между
комплексными числами и линейными операторами на пространстве
со скалярным произведением простирается дальше, вплоть до за­
писи комплексного числа в тригонометрической форме: z — \z\el(f =
= y / z l e ^ . Об этом свидетельствует
§ 3. Операторы на пространствах со скалярным произведением 145

Т е о р е м а 15. Всякий невырожденный линейный оператор А на


эрмитовом (или евклидовом) векторном пространстве V может
быть представлен в виде
A = PQ, (15)
где V — положительно определённый оператор, a Q — изометрия
(унитарный или ортогональный оператор). Разложение (15) един­
ственно. (Оно называется полярным разложением оператора А.)
Д о к а з а т е л ь с т в о . Согласно предложениям 1 и 2 АА* = V 2,
где V — положительно определённый оператор, являющийся един­
ственным квадратным корнем: V = л/АА *. Разумеется, V — обрати­
мый оператор. Положив Q = Р ~ 1 А, получим выражение (15). Нужно
только убедиться, что Q — изометрия.
Действительно, так как V* = V и = £ = £* = (p -'ty p * ==>
= > ( р - 1)* = (Р * )-1 = Р ~ \ ТО

Q = р - 1 АА*(Р~1)* = р - ^ р - 1 = £.
Если теперь PQ = А = PiQ i — два представления в виде (15),
то имеем Q*P = Q\P\. Поэтому PQ • Q*P = PiQ i • Q \Pu откуда
P 2 = P 2 = > P = Pi (единственность квадратного корня) и, стало
быть, Q = Q1? т.е. единственность полярного разложения также
установлена. □
З а м е ч а н и е 5. Очевидно,
a = v q = q q ~1v q ,
и мы видим, что
A=QVu
где Q — изометрия, а Р\ = Q*PQ — положительно определённый
линейный оператор.
Полярное разложение (15) (но не единственность Q) справедливо
и в случае вырожденного оператора. Однако мы обратимся к дру­
гому свойству разложения. Для комплексного числа z безразличен по­
рядок множителей в его тригонометрической записи: \z\el(f = el(f\z\.
Если теперь А = PQ = QP, то
АА* = VQ ■Q*V* = V 2 = VQ*QP = (QV)*QV = А*А,
что означает нормальность оператора А.
Обратно,
АА* = А*А = > Р 2 = VQQ*V = Q*V*VQ = Q~1 V 2 Q.
Но из перестановочности Q с V 1 следует перестановочность Q с V ,
поскольку v = V v 2 — многочлен от Р 2 (как это вытекает из тео­
ремы о спектральном разложении). Таким образом,
А = PQ — нормальный оператор <(=> PQ = QP.
10 А .И. К о стр и к и н
146 Г л. 3. Векторные пространства со скалярным произведением

УП РА Ж Н ЕН И Я

1. К о гд а ун и тар н ая п х n -м ат р и ц а А зап и сы вается в виде (м ул ьти п л и к ати в ­


ного) к о м м у та то р а А = X Y X ~ 1Y ~ 1 с у н и тарн ы м и м атр и ц ам и X , У ? Условие
det А = 1, очевидно, необходимо. Д о к а за ть , ч т о оно и достаточн о. Д руги м и сло­
вами, в группе S U ( n ) к аж д ы й элемент явл яется ком м у тато р о м .
2. Под матрицей Якоби пон им ается вещ ественная м ат р и ц а вида

ai -bi 0 0 0
-c i a2 -b2 .. 0 0
0 -C2 аз 0 0
, b{C{ У 0, 1 ^ i ^ n —1
. an —i —bn —i
0 0 0 —cn —1 an
Д о к а за ть , ч т о S p e c (J) всегда вещ ественны й и простой .
3. С праведлив ли аналог тео р ем ы 13, к огд а один из операторов А , В эрм и тов,
а в торой явл яется изом етрией ?
4. П усть А , В — произвольны е ком м утирую щ ие линейные о п ераторы на век­
торном п р о стр ан ств е V над полем А. Д о к а за ть , ч т о если к аж д ы й из операторов
А , В ди агонали зируем , то они одновременно ди агонали зируем ы , т.е. сущ ествует
базис в V, состоящ ий из собствен ны х век торов к а к для А , т а к и для В.
5. Д о к а за ть , ч т о если А , В — полож ительно определённы е линейные опера­
т о р ы и А В = В А , то А В — тож е полож ительно определённы й оператор.
6. Д о к а за ть , ч т о если 1А — —А, то А2 — сим м етрич ная неполож ительно
определённая м атри ц а. В частн о сти , отличны е о т нуля собственны е значения
кососим м етри чной м атр и ц ы являю тся чи сто мнимы ми.
7. П усть А и В — эрм и товы (сим м етричн ы е) оп ераторы , из к о то р ы х один,
скаж ем , А , полож ительно определённы й. Д о к а за ть , ч т о т о гд а Spec (АВ) вещ е­
ственны й.
8. П усть q(x) — к в ад р ат и ч н ая ф о р м а в евклидовом п р о стр ан ств е Е со ска­
лярны м произведением (* | *). В к ак и х т о ч к а х единичной сф еры (х | х) = 1 ф орм а
q д о с ти га ет м аксим ум а или миним ум а? Более общо: в к ак и х т о ч к а х единичной
сф еры ф о р м а q при н и м ает стацион арное значение, т.е. все её производны е в
эти х т о ч к а х по лю бому направлению равн ы нулю? Д о к а за ть , ч т о справедливо
следующ ее утверж ден ие.
Квадратичная форма д(х) принимает стационарные значения ровно в тех
точках единичной сферы, которые отвечают собственным векторам симме­
тричного оператора У , определяемого формой д(х) = ( У х |х ) .
В частности, максимум формы д(х) на единичной сфере равен наибольшему
из её канонических коэффициентов , а минимум — наименьшему ( экстремаль­
ные значения квадратичной формы).
9. Д о к а за ть следующее обобщ ение леммы 6.
Т е о р е м а 16. Любое семейство коммутирующих линейных операторов на
конечномерном комплексном векторном пространстве обладает общим соб­
ственным вектором.
10. Д о к а за ть , ч т о если

6 = {Аг е М п ( с) I A i A j = A j A i ; i , j £ J}
— любое множество коммутирующих (попарно перестановочных) матриц по-
р я д к а п, то найдётся т а к а я невы рож денная м ат р и ц а С , ч т о сопряж ённое мно­
ж ество
с ~ 1е с = { c ^ A j C | j e J }
§ 4 • Комплексификация и овеществление 147

будет состоять из коммутирующих верхнетреугольных матриц.


11. Пусть, как обычно, Е — единичная матрица порядка n; E ij, 1 ^ г, j ^ п,
— матричные единицы. Проверить, что семейство
е = {Eij I 1 ^ г ^ [гг2/2], [n2/2] + 1 ^ j ^ n} U {Е }
имеет мощность [n2/4] + 1 и состоит из линейно независимых коммутирующих
верхнетреугольных матриц. Под [p/q] понимается целая часть дроби p/q.
12. Т е о р е м а [И. Шур, 1905]. Максимальная размерность коммутативной
подалгебры в М п (С) равна [n2/4] + 1.
Другими словами, нужно доказать, что максимальное число попарно комму­
тирующих линейно независимых матриц порядка п над С есть [n2/4] + 1.
На самом деле С можно заменить на любое поле Я.
13. Д оказать следующее утверждение. Пусть (V, (* | *)) — евклидово век­
торное пространство чётной размерности п = 2 т , и пусть /( х , у) — невы­
рожденная ко со симметричная форма на V. Тогда найдутся разложение V в
прямую сумму V = Vi 0 У2 двух т-мерных подпространств и невырожденный
симметричный (относительно (* | *)) линейный оператор А : V —» V такие,
что
/(х,у) = (xi|«Ду2) - (х2\Ayi).
i = 1,2.
Здесь х = x i + х 2, у = у ! + у 2, x i?yi Е Vi,

§ 4. К ом п л ек сиф ик ац и я и ов ещ ествл ен и е
Как мы не раз имели возможность убедиться, вопрос о приведе­
нии к каноническому виду матрицы линейного оператора А : V —>V
решается по-разному в зависимости от того, является основное поле
Я алгебраически замкнутым (Я = С) или нет (Я = Ж). Это относится,
в частности, к изометриям — унитарным и ортогональным операто­
рам. Так как в комплексном случае алгебраическая картина (при не­
которой потере геометрической интуиции) становится проще, то ча­
сто применяют операцию (или, как ещё говорят, функтор) комплек-
сификации к вещественным пространствам и операторам, а при по­
мощи обратной операции (функтора овеществления) возвращаются
к первоначальным объектам. Остановимся на этом подробнее.
1. Комплексная стр у кту р а. Пусть V — векторное простран­
ство над Е конечной размерности п.
О п р е д е л е н и е 1. Говорят, что на V определена комплексная
структура, если задан линейный оператор J : V —>• V с квадратом
J 2 = -£ .
п р и м е р 1. Пусть п = 2m, J — оператор с матрицей
1
0

1 0
1
0

1 0
I—1
1
0

1 0

10
148 Г л. 3. Векторные пространства со скалярным произведением

(см. следствие тео р ем ы 9 из § 4 гл. 1). О чевидно, ч т о J будет определять на V


комплексную с т р у к т у р у , поскольку J 2 = —Е.
Словосочетание “комплексная структура” оправдано тем обстоя­
тельством, что пару (У, Д) можно превратить в векторное простран­
ство У над С, полагая
(а + i/3)v = av Н- f3Jv, a, f3 G Е, v GУ
Аксиомы дистрибутивности
а(и + v) = аи + av, (a + b)v = av + ftv, a, b G C, u, v e c ,
будут выполнены, поскольку J" — линейный оператор. Далее, из
Д 2 = —£ следует, что
(a-N/3)[(y+W)v] = (a-N /JXyv+JJv) = a^v+ ^JA ^+ X JX yv+ ^yv) =
= ayv + a S J v + /3 y jv —/3Sv = (ay —/3J)v + (ай + Ду) J v =
= [ay —Дй + г(ай + Ду)]у = [(a + гД)(у + гй)]у.
Все остальные аксиомы векторного пространства выполнены, по­
скольку У и У совпадают как множества.
О п р е д е л е н и е 2. Говорят, что У — комплексное векторное про­
странство, связанное с вещественным пространством У.
Докажем, что пример 1 не случаен.
П р е д л о ж е н и е 1. Пространство V с комплексной структурой
Д всегда чётномерно над Е, а матрица оператора Д в некотором
базисе имеет вид (1). Далее,

dime V = ^ dimR У (2)

Д о к а з а т е л ь с т в о . Пусть мы уже нашли векторы e i , ... ,e k G


G У такие, что 2к векторов ei, Д е\, ..., ек, Д ек оказались линейно
независимы. Либо линейная оболочка
Ус (®1 ч Д ^ 1 ч • • • ч ®кч Д ^к)
совпадает с У, и тогда всё доказано, либо найдётся вектор ek+i ^ У*..
Допустив на минуту, что
J e k+1 = a e /,+1 + v*, a G E, v k G Vk,
мы применим к обеим частям этого равенства оператор Д :
—е/г+1 = a j e^+i + J v k.
Заметим, что подпространство Vk инвариантно относительно У, по­
этому Длгк G Vk. Умножив первое из имеющихся у нас соотношений
на а и сложив со вторым, получим
(a2 + l)e fc+i = - а \ к - J v к e V k.
§ 4 • Комплексификация и овеществление 149

Это, однако, противоречит выбору ek+i, поскольку всегда а 2 + 1 ф 0.


Продолжал процесс присоединения к Vk линейно независимых век­
торов, мы, наконец, получим при некотором т всё пространство
]/ = ]/т = (ei, 3 е15 ' ' ' 5 ега) •
Таким образом, dim^ V = 2m, причём в базисе (ei, J e \ , . .., em, J e m)
матрица оператора J имеет как раз вид (1). Равенство (2) отражает
просто тот факт, что векторы ек и J e k пропорциональны над С :
J^k — □
П роведённое рассуж дение по сущ еству п о в то р яет процедуру приведения ко­
сосим м етри чной ф орм ы к каноническом у виду (см. гл. 1, § 4).
2. Овещ ествление. Пусть теперь U — произвольное векторное
пространство над С размерности п.
О п р е д е л е н и е 3. Овеществлением U называется вещественное
векторное пространство Uu, которое совпадает с U как множество
и как аддитивная группа, но в котором об умножении на комплекс­
ные числа “забыто”, а умножение векторов на вещественные числа
производится так же, как и в U.
Овеществляя U, мы обедняем U и из n-мерного пространства
U = (ei, . .., еп)с
получаем 2п-мерное пространство
Uu = (еЪ ^е15 • • • 5 еП5 '
Определённое с самого начала умножение на г = л/—1 в U превра­
щается в комплексную структуру J на Uu — линейный оператор,
задаваемый соотношениями
J e k = ie k, J ( ie k) = - e k, l^ k ^ n . (3)
Применяя к паре (Uu, J ) соображения п. 1, получаем в качестве ком­
плексного пространства, связанного с Uu, исходное пространство,
т.е. _
lh = U.
Введём теперь следующее
О п р е д е л е н и е 4. Овеществлением оператора Л: U U назы­
вается линейный оператор Ли : Uu —> Uu, действие которого пото­
чечно совпадает с действием Л. Различие между Л и Ли заключается
в интерпретации результата действия:
UU = (е15' ' ' 5еп)]^ Т (^е15' ' ' 5Ъ^п)и '
В соответствии с этим разложением С-линейный оператор Л :
U —у U мы запишем в виде Л = Л\ + 1 Л 2 , где Л\ и Лъ — Е-линейные
операторы на (ei , ... , en)R с вещественными п х n-матрицами А\ и
А 2 соответственно. Так как
Л(гек) = гЛек = i(A ie k + гЛ2 ек) = - Л 2 ек + iA ie k,
150 Гл. 3. Векторные пространства со скалярным произведением

то в базисе (ei, . . . , en; ie i, . . . , ien) для Ur матрицей овеществлённого


оператора A r будет
Ai —А2
А2 Ai (4)
Мы видим, что далеко не каждый линейный оператор на Ur может
рассматриваться как овеществление некоторого оператора на U.
Пусть C(U) r — совокупность всех овеществлённых операторов, а
C(Ur ) — пространство всех Е-линейных операторов на Ur . Из опре­
деления или из матричной интерпретации (4) овеществлённых опе­
раторов видно, что
(А + B) r = A r + Br , (AB) r = A r • Br , (аЛ)м = аЛк, a E E.
Другими словами, C(U) r — подалгебра в C(Ur ). Очевидно,
dimR jC(U) r = 2n2 = ^(2n)2 = ^ dim jC(Ur ).
Матрицей линейного оператора J (комплексной структуры) в нашем
базисе служит
0 -Е
Е — Еп. (5)
Е 0
По смыслу A r • J — J • A r , ч т о соответствует легко проверяемому
матричному соотношению A r • J q = J q • A r . Более того, из условия
Ai Аз 0 -Е 0 -Е Ai Аз
а2 а4 Е 0 Е 0 а2 а4
переписанного (после перемножения блочных матриц) в виде
-А 1 —Аг - а 4
со

а 4 —Аг А1
со

мы видим, что Дз = —А2, Д.4 = А 1, т.е. всякая 2п х 2п-матрица над


Е, перестановочная с Jo, имеет вид (4).
Итак, справедливо
П р е д л о ж е н и е 2. Подалгебра C{U)r С C{Ur ) овеществлённых
операторов (относительно структуры J ) состоит в точности из
операторов, перестановочных с J .
Более интересен следующий вопрос. Пусть V — чётномерное ве­
щественное пространство (скажем, dim^ V = 2п) и А : V —> V —
линейный оператор. Когда на V существует комплексная структура
J , согласованная с А, т.е. такая, что А = Br , где В : U —> U —
оператор на комплексном n-мерном пространстве U1 Мы разберём
содержательный частный случай.
Т е о р е м а 1. Пусть У = Е2 и А: V —>• V — R-линейный опера­
тор, не имеющий собственных векторов. Тогда на V можно опре­
делить согласованную с А комплексную структуру (подробности
сообщаются в ходе доказательства).
§ 4 • Комплексификация и овеществление 151

Д о к а з а т е л ь с т в о . Согласно условию А имеет два комплексно


сопряжённых характеристических корня Л, Л. Положим Л = Ai +гЛ 2,
Ai ,A2 Е Е, где А2 ф 0. По теореме Гамильтона—Кэли А 2 — trА +
+ (det А)£ = О, т.е.
Л2 - 2AiД + (А2 + А2)£ = О. (6)
Определим оператор J , полагая
J = АД(Д - AM),
или, что эквивалентно,
А — Х\Е + A2J .
Подставляя выражение для Д в равенство (6), находим
(Х2£ + 2Ai A2J + X \J 2) - 2Х1 (Х1£ + X2 J ) + (А? + Х2)£ = О,
откуда следует
J 2 = -£ .
Согласно общим рассуждениям из п. 2 на V определена структура
комплексной прямой С1 . Так как оператор А перестановочен с J ,
то А — Вк, где В : С1 —> С1 — оператор умножения на некоторое
комплексное число. Этим числом, очевидно, является А. □
Докажем теперь
П ре д л о ж е н и е 3. det Дм = |det Д |2.
Д о к а з а т е л ь с т в о . Проведём прямые выкладки, основанные на
элементарных преобразованиях над полем С и не слишком входящие
в детали овеществления. Так как det А = det Д, где черта означает
комплексное сопряжение, и так как имеет место соотношение (4),
использующее запись А = А\ + iA 2, то
Аг —А 2
det Дм = det Дм = det
А2 Аг
= det A i + iA * ' -Д2 + iA 1 = det Д i + iA 2 0
а2 Д1 A2 A i —iA 2
А 0
= det = det Д • det Д = | det Д|2. □
А2 А
3. Комплексификация. Пусть V — произвольное векторное
пространство над Е размерности п. Непосредственно проверяется,
что на внешней прямой сумме У 0 У — векторном пространстве пар
(u, v) с операциями
a(u, v) + а '(u', v') = (аи + а 'и', aw + cdv'), а, а' Е Е,
— соответствием
J : (u,v) Н> ( - v, u)
определяется линейный оператор, задающий комплексную структуру
на У 0 У. Эта комплексная структура называется канонической.
152 Гл. 3. Векторные пространства со скалярным произведением

О п р е д е л е н и е 4. Комплексное векторное пространство У 0 У,


связанное с УфУ, называется комплексификацией (или комплексной
оболочкой) пространства У. Для него вводится специальное обозна­
чение
V е := С ® 0
Если смотреть на С как на векторное пространство размерности
2 над Е, то
Vе = V С
— частный случай тензорного произведения пространств — кон­
струкции, широко используемой в математике (мы упоминали о ней
в § 4 из гл. 1, а более подробно она будет рассматриваться в главе б,
§ 4). Так как сбт^ДУ 0 У) = 2п, то в соответствии с равенством (2)
dime V е = dim^ У
По определению г(u, v) = J ( и, v) = (—v,u), так что (и, v) =
= (и, 0) 0 i(v, 0). Поэтому пару (и, v) естественно обозначать u 0 i v .
При этом
(u + iv) 0 (и' 0 iv') = (и 0 и') 0 i(v 0 v').
Далее,
(а 0 i/3)(и 0 iv) = (аи —/3v) 0 (av 0 Ди),
поскольку
(а£ 0 ДДг)(и, v) = a(u, v) 0 Д(—v, и) = (аи —/3v, av 0 Ди).
Запомнить эти правила нетрудно, поскольку они в точности со­
ответствуют правилам действий с комплексными числами. Векторы
u 0 i 0 обозначаются просто через и, так что вещественное простран­
ство У считается подпространством в Ус .
О п р е д е л е н и е 5. Комплексификацией Е-линейного оператора
A : У -0 У назовём С-линейный оператор А с : V е -0 Ус , для кото­
рого
А С(и 0 iv) = А и 0 iAv.
Имеем импликацию
У = (е1? ' ' ' 5еп)]^ ---^ У = (е1? • • • 5еп)с '
Стало быть, матрица А оператора А в базисе ( ei , ..., еп) будет слу­
жить одновременно и матрицей АС оператора А с в том же базисе,
т.е.
Дс = А.
В частности, det А с = det А и tr А с = tr А. Так как
(А 0 В)с (и 0 iv) = (А 0 В)и 0 i(A 0 B)v =
= (Аи 0 Bu) 0 i(*4v 0 Bv) = (Ли 0 гДлД 0 (Ви 0 iBv) =
= Дс (и 0 iv) 0 Вс (и 0 iv) = (Ас 0 Вс)(и 0 iv),
§ 4 • Комплексификация и овеществление 153

то (А + В)с = А с + ВС. Аналогично проверяется, что (АВ)С = А СВС.


По аналогии с А с определяются продолженные с V линейные и,
более общо, полилинейные формы на V е . Если, например, / — били­
нейная форма на вещественном пространстве V , то полагаем
/с (х + гу, u + iv) = /(х, и) - /(у, v) + г (/(х, v) + /(у, и)).
В к ач естве упраж н ен ия п роверьте, ч т о из кососи м м етри чн ости / следует
к ососи м м етри чн ость / с .
Пусть теперь V — вещественное векторное пространство со ска­
лярным произведением (* | *). Тогда и на V е определяется скалярное
произведение
(х + гу Iu + i v f := (х |и) + (у |v) -г((х| v) - (и|у)).
Е сли при этом пара (У , (* | * )) — евклидово пространство, то
(Ус , (* | *)с) будет эрмитовым векторным пространством. В част­
ности, норма || * ||с на V е задаётся равенством
(||х + гу||с)2 = ||х||2 + ||У||2.
Возвращаясь к общему случаю, предположим, что А — линейный
оператор на У, а а + гЪ — собственный вектор с собственным зна­
чением а + i/З линейного оператора А с на V е (a, b Е У, а,/3 Е Е).
Тогда, в соответствии с определением, Да + iA h = Дс (а + гЬ) =
= (а + г/3)(в. + гЬ) = (аа —/ЗЪ) + г(/3а + ab), т.е.
Да = а а —/ЗЪ, ДЬ = /За. + <тЬ.
Таким образом, (a, b)R — двумерное инвариантное относительно Д
подпространство. Так как Дс всегда имеет хотя бы один собствен­
ный вектор, то мы ещё раз доказали теорему 7 из § 3 гл. 2.
Заметим, далее, что каждое векторное пространство U над С раз­
мерности п изоморфно комплексной оболочке V е подходящим обра­
зом выбранного векторного пространства V над Е. Достаточно за­
фиксировать некоторый базис (ei,...,еп) в U и взять в качестве V
совокупность всех векторов вида cxjej с aj Е Е:

U = (ei,...,en)c = ((ei,...,еп)^) .
4. Комплексификация — овеществление — комплексифи­
кация. Введём обозначение
W = (Vch
для вещественного пространства размерности 2п, полученного из
n-мерного вещественного пространства V комплексификацией, а за­
тем овеществлением. Легко понять, что
W = V 0 i V, (7)
154 Гл. 3. Векторные пространства со скалярным произведением

причём говорят о вещественной плоскости У и о мнимой плоскости


i У. Согласно (3) на W определён оператор J — (i£)u — овеществле­
ние оператора %£ умножения на г в Ус . Его матрицей служит ё7о (см.
(5)). Оператор J меняет местами вещественную и мнимую плоско­
сти.
Простейший случай представится, когда У = E i , Ус = С1 и
W = (С1)м = Е2 . На комплексной прямой определена операция ком­
плексного сопряжения
а + i/3 н-» а + i/3 = а —i/3.
В общем случае на пространстве (7) действует аналогичный линей­
ный оператор
S : u + ivi ->-u-hiv = u —iv
с матрицей

s= (t Л )-
Расширяя эту ситуацию, рассмотрим произвольный С-линейный опе­
ратор А : V е —>• V е (а при желании даже линейное отображение
V-ф —УУ2С>гДе Vl Ф V2). Комплексно сопряжённым к А назовём опе­
ратор А: V е —>• Ус , для которого
А • u + iv = Д(и + iv).
При этом
(A) r = S • Аи • S.
Линейность над С оператора А является простым следствием линей­
ности А и оператора комплексного сопряжения. Записанный в базисе
(e i, . . . , еп) пространства V оператор А имеет матрицу А = Ai +гЛ2,
а оператор А — матрицу А = А\ —1 А 2 с вещественными матрицами
А\ и Л2 (ср. с рассуждениями из п. 2). Отсюда следует, что условие
А — А необходимо и достаточно для возможности записи А — Вс
(комплексификация некоторого вещественного оператора V —> V).
Используя понятие комплексно сопряжённого оператора, мы можем
записать для любого овеществлённого оператора A r с матрицей (4)
tr Аи = 2 tr Ai = tr(*4 + А) = tr А + tr А.
Пусть U — произвольное комплексное пространство. В п. 1 гл. 1
мы рассматривали пример пространства У, которое назовём ком­
плексно сопряжённым с U идюторое отличается от U только умно­
жением на скаляры: Л 0 х = Лх.
Аналогично, если (У, J ) — вещественное пространство с ком­
плексной структурой, то линейный оператор —J также определяет
комплексную структуру, называемую сопряжённой с исходной. Если,
далее, У — комплексное пространство, отвечающее (У, то У —
комплексное пространство, отвечающее (У, —J ).
§ 4 • Комплексификация и овеществление 155

Применяя теперь к комплексному векторному пространству У


сначала функтор овеществления, а затем функтор комплексифика-
ции, мы построим канонический С-линейный изоморфизм
/ : Цк)с ^ Г е Г .
С этой целью заметим, что на (УДС имеются два Е-линейных опе­
ратора: оператор канонической комплексной структуры J {x , у) =
= (—у,х) и оператор умножения на г — у/—1 , отвечающий исходной
комплексной структуре на У : г(х,у) = (гх,гу). Так как J комму­
тирует с г, то он С-линеен в этой структуре. Поскольку J 2 = —£,
его собственные значения равны =Ьг. Введём стандартные обозначе­
ния для двух подпространств, отвечающих этим собственным значе­
ниям:
Г 1,0 = {(х,у) <Е (VR)C |J (х,у) = г(х,у)},
V 0,1 = {(х,у) G (Vk)c | J ( x , y ) = —г(х,у)}.
Оба множества У1,0, У 0,1 являются комплексными подпространства­
ми в (Vr )c : ясно, что они замкнуты относительно сложения и умно­
жения на вещественные числа, а замкнутость относительно умноже­
ния на J следует из того, что J и г коммутируют. Покажем, что
У = у 1’0 0 У0’1, а также, что У 1^естественно изоморфно У, тогда
как У 0,1 естественно изоморфно У.
Из определений сразу же следует, что У 1,0 состоит из векторов
(х, —гх), а У 0,1 — из векторов вида (у,гу). Для данных u, v Е У
уравнение (u, v) = (х, —гх) + (у,гу) имеет единственное решение
х = (u + iv ) /2, у = (и —iv ) /2. Следовательно, У = У 1,0 0 У0,1.
Отображения х i—> (х, —гх), х i—> (х,гх) являются Е-линейными изо­
морфизмами У на У 1,0 и соответственно У на У0,1. Кроме того, они
перестановочны с действием г на У, У и действием J на У1,0, У 0,1
в силу определений. Это завершает нашу конструкцию.

УП РА Ж Н ЕН И Я

1. П ред л агается убедиться в том , ч т о о р тогон ал ьн ы й оп ератор А на евкли­


довом векторном п р о стр ан ств е V, не имеющ ий собствен ны х в ек торов (это воз­
можно лиш ь в случае dim V = 2т), явл яется овещ ествлением ун и тар н о го опе­
р а т о р а В : U —» U на комплексном векторном п р о стр ан ств е U р азм ерн ости т,
связанном с V. З а м ети м в этой связи, ч т о овещ ествление ун и тар н о го п р о с тр а н ­
с тв а п ри вод ит к евклидову п р о с тр а н с тв у в два р а за большей разм ерн ости.
2. Д о к а за ть ф орм улу из предлож ения 3, вы брав базис ( e i , . . . , е п ) комплекс­
ного п р о с тр а н с тв а U, в котором м ат р и ц а А о п ер ато р а A : U —» U им еет верхне­
треугол ьн ую ф орм у с A i , . . . , A n по диагонали.
3. П усть U — в екторное п р о стр ан ств о над С. Ч ем у и зом орф на комплекси­
ф икация Н с ?
4. П усть (V, (*|*)) — евклидово п ро стр ан ств о , У с — его ком плексиф икация,
А — линейны й оп ератор на V е , определяемы й правилом: *4(u + iv ) = u — iv для
156 Гл. 3. Векторные пространства со скалярным произведением

всех u , v G V. Б у д е т ли Л линейны м оператором на овещ ествлении RV C, и если


да, то будет ли Л си м м м етричн ы м , о ртогон ал ьн ы м , ид ем потен тн ы м ?

§ 5. О р тогон ал ь н ы е м н огоч лен ы


1. П роблема аппроксимации. В самых различных вопросах
математики и физики встречается задача о разложении произвольно
взятой из некоторого класса функции по заданной системе функ­
ций. Не вдаваясь в аналитические тонкости, которые обычно рас­
сматриваются в курсе анализа, мы ограничимся обсуждением чисто
алгебраического аспекта этой задачи. Попутно будут затронуты не­
которые новые вопросы линейной алгебры и геометрии.
Запас функций вещественной переменной t у нас будет исчерпы­
ваться пространством С2(а, Ь) непрерывных на отрезке а ^ t ^ b
(или на интервале с бесконечными концами) функций со скалярным
произведением

Черта означает комплексное сопряжение, если встретится необходи­


мость рассматривать комплекснозначные функции. В С2(сц Ь) будут
выделяться подмножества гладких функций, например дважды не­
прерывно дифференцируемых.
Обычным образом вводится норма функции /: ||/|| = у/ ( / | /).
Пространство С2(а, Ь) превращается в метрическое с расстоянием
d(f,g) = I I / - g\\-
Сформулированная выше общая задача основана на рассмотрении
ортонормированной системы функций Lp\ (£), ^ 2(^)5
iVi \(Pj) —dij
и линейных комбинаций с коэффициентами с^, завися­
щими от “приближаемой” функции / Е С2 (а,Ь). Задача приближе­
ния имеет смысл лишь в том случае, если функции достаточно
хорошие — бесконечно дифференцируемые или даже аналитические.
Если функция /(£) описывает какой-то периодический процесс в
физике или механике, то естественно строить систему {(pn{i)} при
помощи элементарных периодических функций sinnt, cos nt, п = О,
1,... В общем случае хорошим источником ортонормированных сис­
тем служит обычное пространство многочленов Е[£]. Построение сис­
темы заключается просто в последовательном применении
уже известного нам процесса ортогонализации Грама—Шмидта. Мы
рассмотрим вскоре эти два важных примера (sin, cos и Е[£]), а сей­
час остановимся на уточнении проблемы приближения (или, как ещё
говорят, аппроксимации) функции /(£).
§ 5. Ортогональные многочлены 157

2. М етод наименьш их квадратов. Пусть дана ортонорми-


рованная система функций {(pn(t)}. Если / — любая функция из
С2(а, 5), то числа
с п — { f |^п)? 77/ = 1,2,...,

называются коэффициентами Фурье функции / относительно


{<?„(*)}. Так как
it ^ /ь it
0^ /- £ w | = (/ - £ w I/ - £ =
7= 1 7= 1 5=1

- £ I /) - £ IЫ + £ I ¥>*) =
7 5 j,s

ll/ll2 - £ I - £ cjcs + £ =
7,5

У ^ C7C7 C5C5 + У ^ ~E i^'i ’


CjCj = ll/ll2 - > |c / 2
7= 1
то всегда

E m 2^
7= 1

В правой части стоит не зависящее от гг число, поэтому на самом


деле выполнено неравенство
(X)
£ Ы 2 ^11/112, (1)
к=1
или, что то же самое,
со

£ ( / Ы 2 ^ ll/ l l 2- (П
к= 1

Неравенство (1), справедливое для произвольной ортонормиро-


ванной системы {pj(t)}, называется неравенством Бесселя. Оно до­
казывает сходимость ряда ^ 2 k > i \c k \ 2 с неотрицательными членами.
Аппроксимировать в смысле метода наименьших квадратов
данную функцию /(£) линейной комбинацией Ylh=i dk Pk(t) с постоян­
ными коэффициентами dk и фиксированным числом слагаемых
777/ — значит подобрать коэффициенты dk так, чтобы мини­
мизировать среднее квадратичное уклонение (по другой термино­
логии — сделать наименьшей “среднюю квадратичную ошибку”
\\f ~^Ук= 1 7^(^)1|2- Геометрический смысл этой задачи достаточно
ясен. Для вектора / из (бесконечномерного) векторного прост­
ранства V = С2(а,5) мы ищем вектор ср из линейной оболочки U =
158 Гл. 3. Векторные пространства со скалярным произведением

— (<£ъ <^25***5 фт) ч расстояние которого ||/ —(р|| до / было бы мини­


мальным. Это так называемая задача о кратчайшем расстоянии от
точки до подпространства, или ещё — задача о перпендикуляре, к
которой мы вернёмся позднее, находясь уже по настоящему в точеч­
ных, а не в векторных пространствах. Мы всегда имеем разложение
в прямую сумму
V = и® и ±,
так что / = /о + Л , где /о — проекция / на £/, а Д — перпендикуляр
“из конца вектора / ” (довольно бессмысленное выражение) на £/, или,
что то же самое, проекция / на U Если теперь U Э (р Ф /о, то
11/-И1>11/-/о||- (2)
В самом деле, /о —(р G U и, следовательно, fo —<Pортогонален вектору
/i = / —/о- Согласно теореме Пифагора
II/ - И12 = II/ - /о + /о - И12 = II/ - /oil2 + ||/о - И12,
откуда и следует неравенство (2).
Фактически задача о перпендикуляре сводится к задаче о нахо­
ждении проекции /о вектора / на U. Записав /о в виде
/о — + ...+ Х т (рт ,
мы из условий
( / - /о|<Лг) = 0, j = 1 ,2 , ... ,т,
выраженных в виде системы из т линейных уравнений
I<Pj) + (<fi2 | <fij) + ■ ■ ■ + Х т ( < Р т \ 4 > i) = ( / I4 > j ) , 1^ j ^ Ш, (3)
находим неизвестные коэффициенты Х{.
Условия (3) годны и в том общем случае, когда система {(^i,...
. .., ipm} не ортонормирована. Если же система ортонормирована, то
сз — ( / \фз) — коэффициент Фурье, и система (3) сразу даёт
xj = (f\<Pj) = Cj,
Возвращаясь к нашей задаче аппроксимации, мы заключаем, что
среднее квадратичное уклонение || / —^ d jip j ||2 будет минимальным
при dj = cj. Это, между прочим, можно видеть и непосредственно:

У diVi
/ - Е ы 2- Е 'О
з=1 з=1 3=1
Если при увеличении т для любой функции / Е С2(а, Ь) норму
разности ||/ — || можно сделать сколь угодно малой, то
систему {<Pj(t)} называют полной ортогональной системой функций.
Необходимое условие полноты как видно из предыдущих рас-
суждений, заключается в том, чтобы для любой функции / выпол-
§ 5. Ортогональные многочлены 159

нялось соотношение (равенство Парсеваля)


оо оо
Е м 2 = Е 1 ( / м 2 = ||/||2- (4)
3= 1 3= 1
Вопрос о полноте ортонормированных систем { < P j ( t ) } относитель­
но данного класса функций f ( t ) впервые был исследован крупным
русским математиком В.А. Стекловым (1864-1926).
Условие полноты (4) выражается в интегральной форме

При выполнении условия (5) говорят ещё, что последовательность


функций сз Vjit) сходится в среднем к функции /(£). Из сходи­
мости в среднем, вообще говоря, не следует, что f(t) разлагается в
ряд по функциям ipj(t), т.е. f(t) = YlpLi cj Лишь в случае рав­
номерной сходимости ряда cj iPj(^) можно в условии полноты
(5) сделать переход к предельной функции под знаком интеграла, и
разложимость f(t) в ряд становится фактом.
Понятие сходимости в среднем, а вместе с ним и понятие полноты
системы функций сохраняет смысл для системы, не обязательно явля­
ющейся ортогональной и нормированной.
3. Линейные системы и метод наименьших квадратов.
В связи с последним замечанием, а также ради получения дополни­
тельной информации, относящейся к методу наименьших квадратов,
вернёмся к задаче о вычислении расстояния от точки до подпро­
странства.
Пусть по-прежнему V — векторное пространство произвольной
размерности со скалярным произведением (* | *), / — фиксирован­
ный вектор и U — (ei , . .., еш ) — подпространство в V . Мы видели,
что расстояние от “точки” / до U измеряется нормой вектора / —/о,
где /о — вектор из U с координатами ад ,...,х ш, определяемыми из
линейной системы
х 1(е1 |ej) + ж2(е2 |е^) + ... + х ш{еш |е,) = (/|еД l^ j^ m (6)
(см. (3), где следует заменить ipj на е^). Если e i , . . . , e m — орто-
нормированная система, то xj — (/|е^), 1 ^ j ^ ш, — искомое
решение. Но существование решения, т.е. возможность опустить од­
нозначным образом перпендикуляр из / на £/, неестественно связы­
вать с каким-то базисом. Нам известно, что любой базис допускает
ортогонализацию. Поэтому решение системы (6) существует всегда,
и оно единственно. Это значит, что определитель
160 Гл. 3. Векторные пространства со скалярным произведением

называемый определителем Грама системы векторов e i , ..., em, от­


личен от нуля. Определитель Грама, очевидно, равен нулю, если один
из векторов является линейной комбинацией остальных. Факти­
чески нами доказана
Т е о р е м а 1. Система векторов { e i , . . . , e m} линейно незави­
сима тогда и только тогда, когда её определитель Грама отличен
от нуля.
Это утверждение не ново (ср. с теоремой 4 из § 1). Возникший у
нас в связи с проблемой аппроксимации метод наименьших квадра­
тов позволяет выработать свежую точку зрения на, казалось бы, до
конца исчерпанную задачу о решениях системы линейных уравнений.
Пусть дана линейная система
^11^1 + ^12^2 + •••+ &1пх п = &1,
^21^1 + ^22^2 + . . .+ Cin 2 X n = &2, /7\

0"mlx l + & га2^2 + • • • + Q"mn%n — Ьт

с большим числом т > п уравнений. Без ограничения общности


можно считать, что гапк(а^) = п. Такие переопределённые системы
возникают на практике, например при обработке большого массива
вычислений. В общем случае система (7) несовместна и не имеет ре­
шений. Однако можно попробовать найти такие значения неизвест­
ных xj, ж!], • • • 5 чтобы средняя квадратичная ошибка
т
^ 2 (akiXi + ak2 x% + ... + aknx°n - bk)
k=1
принимала наименьшее значение. Будем интерпретировать столбцы
е 1 = 1+ 11 5 ' ' ' 5 & m l] 5 ' ' ' 5 е П = 1 + 1 П 5 ' ' ' 5 ® Ш и ] 5 f = [^ 1 5 • • • 5 ^ т ]

как векторы ш-мерного евклидова пространства со стандартным


скалярным произведением
т

{ [ х 1 , • • • , х т \ | [У1 5 • • • 5 У т ]) = ^ ^ х г Vi•

В таком случае
т п 2
' Г ( С1к+ + • •• + акпХ°п - Ьк) 2 = ||у^а;°е; - f
к= 1 i— 1

есть квадрат расстояния от Y ^ i = i е г до f. Если U = (ei , . .., еп) —


линейная оболочка линейно независимых по условию векторов e i ,...
. . . , е п, то задача о минимуме квадратичного уклонения свелась к
известной задаче о перпендикуляре, т.е. к отысканию проекции век­
тора f на U . Интересующие нас компоненты ж?,..., х®п “приближён­
ного решения” исходной линейной системы находятся из совместной
§ 5. Ортогональные многочлены 161

определённой “нормальной” системы


(ei |е г)х° + (е2 |ei)^ + ■■■+ (е„ |е\)х°п = (f|ei),
(ei|е2)хЧ + (е2 |е2)а;2 + ... + (е„ |е2)а;° = (f|е2),

(ei |еп)х° + (е2 |еп)х% + ... + (en |еп)х°п = (f|еп)


с определителем Грама det||(ej|ej)|| ф 0.
4. Тригонометрические многочлены. Из легко проверяемых
соотношений
Г Г 2
/ cos kt • cos It dt = 0, k ^ i , / cos ktdt = 7Г;
J —IT J —7Т
Г Г
/ cos kt • sin It dt = 0, кф1, / 1 • dt = 27г,
J —7T J —7Т
P7T Р7Т
/ sin kt • sin It dt = 0, кф1, / sin2 ktdt —'К
J —7T J —7Т
следует, что функции
1 1 1 1 1
—= , —= cos t. —= sin t. . . . . —= cos nt, —= sin nt
уДФ y/n у/ тт х/ тг ч/ тг
составляют ортонормированный базис (2п+1)-мерного пространства
V2 n+i так называемых тригонометрических многочленов

sn(t) = ^ + а\ cos t + Ъ\ sin t + . .. + an cos nt + bn sin nt (8)


порядка n.
Общие рассуждения об аппроксимации функций показывают, что
тригонометрический многочлен sn(t) с (чуть изменёнными) коэффи­
циентами Фурье
1 Г
ао = - f(t) dt,
^ J —7Т
1 Г 1 Г
ак = — /(£) cos kt dt, bk = — f{t) sin kt dt, 1 ^ к ^ n,
^ J—7Г ^ J—It
даёт наилучшее приближение в среднем (порядка п) к произвольной
функции / G ( —7Г, 7г) .
Глубоко развитая теория рядов Фурье решает для различных
классов функций, являются ли многочлены Фурье, дающие наилуч­
шее приближение в среднем, также равномерно аппроксимирующими,
т.е. сходится ли бесконечный ряд limn^ 00sn(t) равномерно и пред­
ставляет ли он функцию f(t). Ответ оказывается утвердительным, в
частности, для любой непрерывной на отрезке [—7г,7г] функции f(t)
11 А .И. К о стр и к и н
162 Гл. 3. Векторные пространства со скалярным произведением

с естественным условием / ( —7г) = / ( 7г). Этот результат можно вы­


вести из теоремы Вейерштрасса, формулируемой в п. 6. Доказатель­
ство не входит в наши планы.
Сделаем важное замечание технического порядка. При помощи
уже встречавшейся нам формулы Эйлера cos kt + i sin kt = elkt три­
гонометрический многочлен (8), отвечающий комплексной функции
/(£), можно представить в более удобной форме
п

sn(t) = ^ а кегЫ, (9)


к= — п

(обратите внимание на необычное суммирование от —п до п), где

ak = h f f № ~ iktdt = ^ ( f \ eikt)’
2а0 = а0; 2а к = ак - ibk, к > 0; 2a k = a - k + ib -k, к < 0.
Показательные функции

дают на отрезке [—7г, тг] пример комплексной ортонормированной си­


стемы, как это непосредственно вытекает из соотношений ортого­
нальности
1
ei(k~l)tdt 5ы-
2тг
5. Замечание о самосопряжённых операторах. Полнота
ортонормированной системы тригонометрических (показательных)
функций даёт повод взглянуть на неё с несколько необычной сто­
роны. Дело в том, что очень многие полные ортонормированные сис­
темы функций являются наборами собственных функций (собствен­
ных векторов) соответствующих самосопряжённых операторов, дей­
ствующих на С2(а, b) или на некоторых подмножествах П С ^ ( а , Ь).
Вообще говоря, теорема о диагонализируемости самосопряжён­
ного оператора A: V V, dim У < оо, не переносится на бесконеч­
номерные пространства, как показывает хотя бы пример линейного
оператора Tt умножения на t. Оператор Tt симметричен:

{Ftf(t)\g(t)) = ( tf(t) g(t) dt =


J a
f
J a
f(t)tg(t)dt = (f(t)\Ttg(t)).

Ho Tte(t) — Ae(t) — >e(t) = 0, поэтому оператор Tt совсем не имеет


собственных векторов. Можно было бы упомянуть и другие трудно­
сти работы с линейными операторами на бесконечномерных (хотя
бы и гильбертовых) пространствах, но это только увело бы нас в
сторону.
§ 5. Ортогональные многочлены 163

Гораздо важнее отметить, что многие операторы на бесконечно­


мерных метрических пространствах, имеющие первостепенное зна­
чение в математике и физике, при выполнении ряда условий явля­
ются самосопряжёнными, причём для них справедлив естественный
аналог спектральной теоремы в конечномерном случае. Именно, если
А : V —У V — самосопряжённый оператор, то ортонормированная
система S д его собственных векторов (функций) зачастую оказыва­
ется полной в V в смысле п. 2. Этот замечательный факт мы проил­
люстрируем простейшим доступным примером.
В дальнейшем пусть (а, Ь) — пространство дважды непрерыв­
но дифференцируемых функций с обычным скалярным произведе­
нием
(f\g) = [ f(t)g(t)dt.
J —7Г

Рассматривается совокупность вещественнозначных функций


0, = {f е С р - 7Г,7Г)| / ( —7Г) = /(тг), / ' ( —тг) = / ' (?г) }
и линейный оператор

<Г2 ( —тг, 7г) С2(-7Г,7г)

с областью определения П. Правило интегрирования по частям даёт

{■Af(t)\g(t)) = f f"(t)g(t)dt =
J —7Г

= f'(t)g(t) [ f'(t)g'(t)dt=-[ f'(t)g'(t)dt =


J —7Г J —7Г

= f(t) g'(t)\\- f f(t) g'(t) dt= f f(t) g"(t) dt = (f(t) | Ag{t)).


J —7Г J —7Г

Это означает, что при сделанных предположениях оператор А явля­


ется самосопряжённым (симметричным). Что можно сказать о его
собственных функциях и собственных значениях? Пусть

d^ = Л /(*)>
Решениями этого уравнения с учётом ограничений, сформулирован­
ных в определении П, будут функции
Mk cos Ы + Nk sin Ы, (9)
отвечающие собственному значению Л = —к2 (к = 0 ,1 ,...). Если
бы существовали какие-то ещё собственные значения, то нашлась
бы функция, ортогональная ко всем тригонометрическим функциям
(свойство ортогональности собственных векторов самосопряжённого
оператора, отвечающих различным собственным значениям), а это
11
164 Гл. 3. Векторные пространства со скалярным произведением

невозможно в силу полноты тригонометрической системы. По тем


же соображениям при Л = —к2 все решения исчерпываются функ­
циями (2).
Таким образом, справедлива
Т е о р е м а 2. Дифференциальное уравнение

- а
в классе дважды непрерывно дифференцируемых функций, определён­
ных на отрезке [—7г,7г] и удовлетворяющих условиям
/ ( —Ю = / М , / ' ( —Ю = /'М >
имеет решения только при А = —п2 (п = 0 ,1 ,...). Каждому п отве-
чает двумерное пространство решений (cos nt, sin nt). Все решения
1, cost, sint, cos21, sin2t, ... образуют в С Д —7г,7г) полную ортого­
нальную систему функций.
Термин “дифференциальное уравнение” нужно воспринимать
пока лишь как синоним “уравнение на собственные значения и собст­
венные функции”

где

— линейный дифференциальный оператор, действующий на прост­


ранстве достаточно гладких вещественных функций на отрезке [а, Ь];
предполагается, что если f(t) — функция из этого класса, то (а) =
= (Ь) для fc = 0 , l ,. .. ,m —1. Используя формулу интегрирования
по частям несколько раз, получаем

£>* £ (-1 Г ^ -о а ^ ), (**)


2=1

где запись — о аг(£) для оператора означает, что, применяя его к


at1
функции /(t), мы сначала умножаем её на аД£) и затем дифференци­
руем г раз по t. Формула (**) определяет операцию (формального)
сопряжения дифференциальных операторов: Т> Т>*. Оператор V
называется (формально) самосопряжённым, если V * = 2). Слово
“формальный” здесь напоминает о том, что в определении не ука­
зано явно пространство, на котором V реализуется как линейный
оператор.
6. М н о г о ч л е н ы Л е ж а н д р а ( с ф е р и ч е с к и е м н о г о ч л е н ы ) .
Упомянутая в п. 4 теорема Вейерштрасса гласит: любую функцию
/(t), непрерывную на отрезке а ^ t ^ Ь, можно равномерно аппрок­
симировать на этом отрезке многочленами от t. Другими словами,
§ 5. Ортогональные многочлены 165

для любого положительного г найдётся многочлен ао + a\t + .. . + antn


достаточно высокой степени п такой, что
ао + apt + ... + antn —f ( t ) \ < £, а^ ^ Ъ
(функция f(t) задана). Из этой теоремы, доказываемой в курсе ана­
лиза, вытекает как полнота в смысле п. 2 бесконечной системы од­
ночленов {£г}§°, так и сходимость в среднем (или по норме) к f(t)
ряда Фурье, построенного по f(t) и по соответствующей ортонор-
мированной системе. Чтобы получить такую систему, нужно при­
менить к одночленам tk процесс ортогонализации Грама—Шмидта.
Этот процесс даст последовательность ортогональных нормирован­
ных многочленов — однозначно определённых, если зафиксировать
отрезок, скажем, —1 ^ t ^ 1, и условиться выбирать старший коэф­
фициент в каждом многочлене положительным.
Чаще, однако, систему ортогональных многочленов {(pn{i)} нор­
мируют не интегральным условием ||(^n(£)|| = 1, а каким-нибудь ло­
кальным соглашением одного из следующих типов:
1) ipn(t) — нормализованный многочлен степени п, т.е. ср^ = гг!;
2) <рп(\) = 1.
В любом случае получаются системы пропорциональных векто­
ров (функций), поскольку условие ортогональности записывается
одинаково:

Последовательно полагая п — 1 ,2 ,3 ,... и выбирая нормировку типа


1), получаем систему ортогональных многочленов

рассмотренных более двухсот лет назад (1785 г.) французским мате­


матиком Лежандром в связи с задачами теории потенциала. Общая
формула для них была получена позднее, и теперь многочленами Ле­
жандра называют систему ортогональных многочленов

с нормировкой типа 2): Рп(1) = 1. Вот несколько первых многочле­


нов:
Po(t) = 1, Pi(t) = t, P2(t) = ^(3£2 - 1), P3(t) = ^(513 - 31),
Проверим, что действительно многочлены (11) обладают нужными свой­
ствами. По формуле бинома Ньютона имеем

t2(n - k ) = t2 n _ nt2n-2 +
( P - i r = E ( - i ) fcQ
k= 0
166 Гл. 3. Векторные пространства со скалярным произведением

Поэтому

1
Pn(t) [2п(2п — 1 ) ... (га + 1)tn + члены степени ^ п — 2] =
2п
= (2 п)!
члены более низкой степени (12 )
2п(п!)2
Это показывает, что deg Pn (t) = га, причём мы получили одновременно выраже­
ние для старшего коэффициента многочлена Pn(t).
Далее, применяя к многочлену (t 2 —l ) n = (t — 1)n (t + 1)п формулу Лейбница
n -кратного дифференцирования произведения, получим

dn dn ~
dtn

Так как при к < п многочлен 1)п делится на t — 1 и, следовательно,


обращается в нуль при t — 1, то

(1) = _2_ ( п) \ ^ - {t _ !)»] (t + i)» ,^ = J _ . ! . n! . 2" = 1.


V 2n n\ \ n J \-dtn V ' ' lt_1 2n ra!
Заметим, кстати, что при т < п формула Лейбница m -кратного дифференциро­
вания произведения (t — 1)n (t + 1)п даст нам многочлен, делящийся на t — 1 и на
t + 1, т.е.
Ат
— ( t 2 - l ) n = ( t 2 - l ) - v m (t), т < п.
Стало быть,
drn
(■t2 - 1)я m < n,
dtш
— многочлен, обращающийся в нуль при t = =Ы. Используя теперь правило ин­
тегрирования по частям, проведём проверку условий ортогональности Pn (t) к
функциям 1, t, . . . , t n _ 1 . Имеем

/ 1 Ап
- l ) n dt =
, ‘‘ 5 ? (<’ "" 11
- 1)П dt =

-2

= dt - 1 )"Г
l-i + к(-к - tk~2^ 2 ^ ~ !)” М■
Постепенно понижая показатель при t, придём к окончательному равенству
dn- I+1
2nn! (t* | Pn№) = (—l)fe/3^ п_к_1(t2 ~ 1) = 0.
Косвенным образом мы не только доказали попарную ортогональность много­
членов Лежандра
( p k ( t ) \ p , ( t ) ) = о, кф1,
но и получили выражение для членов последовательности (10):
2П('п')2
n = 1, 2,...
§ 5. Ортогональные многочлены 167

Д ействительно, из общ их соображ ений мы знаем , ч т о u n (t) и Pn (t) м о гу т отли ­


ч а т ьс я лиш ь постоян ны м множ ителем, и сравнение старш и х коэф ф ициентов (см.
ф орм улу (12)) д аёт нуж ное соотнош ение.
П ред л агается провери ть, ч то

||P n (t)||2 = j 1p*(t )dt = — (13)

Положим временно wn = (£2 —1)п. При помощи формулы Лейб­


ница (п + 1)-кратного дифференцирования произведений, стоящих в
обеих частях тождества
it Oj ~^jWn —2 n tw n,
получим
^n+2 ^ n+1 dn
Ct2 6 ^ +2Wn + 2(n + !)* d i ^ Wn + {n + 1)n d p Wn =
dn+l
= 2n t - —-ю „ + 2n(n + l ) — w„
d t^ 1
Умножив все члены этого равенства на 1/(2Пп\) и воспользовавшись
тем, что
1 dn
Pn(t),
2Пп\
мы придём к дифференциальному соотношению

Сt 2 - + 2* J t p n(t) - п (п + 6 В Д = 0- (14)
Рассмотрим на пространстве С^2(—1,1) линейный дифференциаль­
ный оператор
_ /о d2 (I
S = (t - l)-£o
dt2 + 2t~ndt =
с областью определения (—1,1), где, как и ранее (см. п. 4), берётся
пространство дважды непрерывно дифференцируемых функций с
обычным скалярным произведением. Оператор S самосопряжён, как
это вытекает непосредственно из общих формул (*), (**) в конце п. 4.
Равенство (14), переписанное в виде
SPn{t) = п(п + 1)Pn(t), (15)
показывает, что многочлен Pn(t) является собственной функцией са­
мосопряжённого линейного оператора 5, отвечающей собственному
значению Л = п(п + 1). Итак, уравнение Sx(t) = п(п + 1) x(t) допус­
кает ненулевое решение х = Pn(t). Если бы размерность собствен­
ного подпространства V х была больше единицы, то в V х существовал
бы вектор y(t) ф 0, ортогональный к Pn(t). Так как собственные под­
пространства самосопряжённого оператора взаимно ортогональны:
(Vх | Г д) = О, Л ф ц,
168 Гл. 3. Векторные пространства со скалярным произведением

то вектор y(t) ортогонален ко всем Pj(t), j = 0 ,1 ,... Это, однако,


противоречит полноте системы (11), вытекающей из теоремы Вей-
ерштрасса. По той же причине оператор S не имеет собственных
значений, отличных от п(п + 1), п = 0 ,1 ,...
Нами доказано (по модулю теоремы Вейерштрасса) следующее
утверждение.
Т е о р е м а 3. Дифференциальное уравнение

в классе дважды непрерывно дифференцируемых функций на отрезке


—1 ^ t ^ 1 имеет решения только при А = п(п Ч- 1), гг = 0 ,1 ,2 ,...
Каждому п отвечает единственное с точностью до умножения на
константу решение x(t) = Pn(t). Все указанные решения образуют
в С2 (—1,1) полную ортогональную систему функций.
Рассмотренные нами (весьма бегло) дифференциальные опера­
d2 d
торы (t2- 1) принадлежат к более широкому классу так
dt2 dt
называемых операторов Штурма—Лиувилля, играющих заметную
роль в математической физике.
З а м е ч а н и е . Многочлены
_ 2” (n!)2
un{t) = a nPn{t),
(2п)\
из системы (10) обладают следующим интересным свойством мини-
мальности. Среди всех нормализованных вещественных многочленов
степени п многочлен un(t) наименее удалён в среднем от нуля на от­
резке —1 ^ t ^ 1.
В самом деле, речь идёт о минимуме интеграла

1(f) = f f ( t ) 2 dt для f ( t ) = t n + ... eR[t\.

Используя разложение
/(£) = a nPn(t) + 7 n_ iP n_i(t) + ... + JiPi(t) + 7o, 7i £ ^
попарную ортогональность многочленов Pk(t) и формулу (13) для
||РП(£)||, получим выражение
п —1
2а1
ил = +2
2?! Т 1 * ^ 2i Т 1
2=0

которое, очевидно, достигает минимума при 7 ^ = 0, —1.


7. О ртогонализация с весом. Непосредственным обобщением
многочленов Лежандра служат многочисленные семейства функций,
получающиеся следующим образом. Пусть на отрезке а ^ t ^ b за­
§ 5. Ортогональные многочлены 169

дана неотрицательная функция р(£), которую мы будем называть ве­


совой функцией. Рассматривается векторное пространство
V ( '/p i t) ) = (\/p (t)tk I fc = 0, 1,2, . . . ) r
или его конечномерное подпространство
Vn ( y W ) ) = 11 ^ к ^ п - l ) R.
Встаёт вопрос о выборе в V (y/p (t)) (или в Vn (\/p (t))) орто-
нормированного базиса. Обычный процесс ортогонализации Грама—
Шмидта приводит к системе функций
{\/p(t)Q n(t)}, Qn(t) е ВД, degQn = n, п = 0 ,1 ,...,
удовлетворяющих условию

f p(t) Qm(t) Qn(t) dt = Sn


Говорят, что {Qn(t)} — ортогональные многочлены, соответ­
ствующие весу p(t). В этом смысле многочлены Лежандра соответ­
ствуют весу 1.
Мы могли бы с самого начала ввести новое скалярное произведе­
ние
( f \ g ) P(t) = [ p(t) f ( t ) g(t) dt,
Ja
и тогда речь шла бы об ортогонализации многочленов в прежнем
смысле, но, как правило, предпочитают иметь дело с фиксированным
скалярным произведением.
8. Многочлены Небышева (первого рода). Русский матема­
тик и механик П.Л. Чебышев (1821-1894), обладавший разносторон­
ними интересами, заложил основы теории аппроксимации функций.
Ему принадлежат основные идеи общей теории ортогональных мно­
гочленов. Замечательная серия ортогональных многочленов Tn{t),
п ^ 0, (а, Ь) = (—1,1), соответствующих весу p(t) = 1/лД —t2, носит
его имя. Вот их явное выражение:
( _ о )пп ! _______ лп
Тп(t) = (2п)! ’ “ t2)n~1/2 = cos(n arccos t). (16)
В частности,
T0(i) = l, Ti(t)=t, T2{t) = 2t2 - l ,
T3(t) = 4i3 - S t , T4(t) = 8t4 - 8t2 + 1.
Нормировка:
0 при m ф n,
f 1 Tm(t) T„(t) dt
7г/ 2 при m — n ф 0,
-i \/l - t2 7г при m — n — 0.
170 Гл. 3. Векторные пространства со скалярным произведением

В связи с замечанием в конце и. 6 отметим, что многочлены Чебы­


шева, наименее уклоняющиеся от нуля в том смысле, что максимум
абсолютного значения | 2n-i Tn(t) | на отрезке —1 ^ t ^ 1 принимает
наименьшее значение в классе всех нормализованных вещественных
многочленов степени п.
У п р а ж н е н и е . П роверьте, ч т о вы раж ен ие (16) правильно, и д ок аж и те, что
многочлен Ч ебы ш ева Tn (t) явл яется собственны м век тором с собственны м зн а­
чением п 2 ди ф ф еренц иального оп ер ато р а
d2 d
(ь2 1) dt2 dt
9. М ногочлены Э рм ита. Рассмотрим вкратце многочлены Эр-
мита Hn(t) (правильнее — многочлены Лапласа—Чебышева—Эрми­
та), отвечающие выбору а = —оо, Ъ = оо, p(t) = е~1 и получаю­
щиеся в результате ортогонализации базисной последовательности
одночленов 1, £, £2, ... Явные формулы:
Hn(t)
п \ J = (\ - l )J V 2-d ^
f n- e - y

H0(t) = l, # i(i) = 2i, H2( t) = 4 t2 - 2 , H3{t) = 8t3 - 12t,


нормировка:
f 0 при m ф n,
e Hm(t) Hn(t) dt
| 2пп\у/тг при m = n.
Это — небольшое упражнение для читателя, овладевшего материа­
лом и. 5. Надо только воспользоваться значением несобственного
интеграла
е 1 dt = V5F

и тем обстоятельством, что на концах интервала (—оо,оо) все про-


.2
изводные функции е обращаются в нуль.
Далее, прямая индукция по п устанавливает справедливость сле­
дующего утверждения.
Многочлен Эрмита Hn(t) есть собственный вектор с собствен­
ным значением —2п дифференциального оператора

dt2 dt
В математической физике полезны также функции Эрмита
фп® = e~t2/ 2Hn(t) = ( - 1 ) V 2/ 2| V * 2.
Докажем, что функция является собственным вектором
оператора
d2
§ 5. Ортогональные многочлены 171

с собственным значением —(2n + 1).


С этой целью рассмотрим вспомогательный оператор
d
м = л - 1-
Легко проверить, что

[П,М\ = Н М - М П = - 2 = -2 м .

Отсюда следует, что если / — собственная функция оператора % с


собственным значением Л, то М / есть собственная функция опера­
тора % с собственным значением Л —2:
И М / = [П, M \f + М П / = - 2 M f + Х М / = (Л - 2) М / .
Индукция по п приводит к соотношению
П М п/ = (А - 2n )M nf.
Так как l~Le~t2/2 = —е_^2//2, то, заменяя / на е_^2//2 и Л на —1, мы
приходим к выводу, что Л4пе~г /2 есть собственная функция для %
с собственным значением —(2п + 1) при всех п ^ 0.
С другой стороны, индукция по п и непосредственные вычисле­
ния показывают, что

dt
M t ) = (—1)nM ne~t2/ \
Тем самым всё доказано.

У П РА Ж Н Е Н И Я
u sin kt
1. Тригонометрический ряд 2 ^ = i — 1 =~ сходится на Используя нера­
Vk
венство Бесселя, показать, что он не является рядом Фурье никакой функции
/ G С2( 7Г,7Г).
2. Получить рекуррентные формулы:
2л -)- \ л
а) для многочленов Лежандра Рп+i(t) = ---------tPn ( t ) -----------Pn —i{/)\
п + 1 п + 1
б) для многочленов Чебышева Tn+ i(t) = 2tTn (t) —Tn _ i(t);
в) для многочленов Э рмита iT i+ iM = 2t H n (t) — 2 n H n - \ ( t ) .
3. Д оказать самосопряжённость дифференциального оператора S из п. 6 не­
посредственно, не опираясь на общую формулу (**) из п. 5.
4. Доказать, что f ( x , t ) = — производящая функция для мно-
V I —2tx + х 2
гочленов Лежандра (в разложении по степеням ж коэффициентом при х п
служит Pn (t)).
5. Доказать, что m a x _ i ^ i | ^ — [ T n (t) | =
172 Гл. 3. Векторные пространства со скалярным произведением

6 . Д о к а за ть , ч т о м ногочлены Ч ебы ш ева в то р о го род а

[гг/2] П+ 1
1 dTn + i( t)
Unit) :: ^ j.n —2m (t2 l)m
п + 1 dt £
m=0
2m + 1

о р тогон ал ьн ы на отр езк е [—1,1] с весом у /\ — t 2 :

7. Д о к а за ть , ч т о все нули многочленов Tn (t ), Un (t) — вещ ественны е, попарно


различн ы и л еж ат в н утри о т р е зк а [—1,1]. У к а зат ь эти нули в явном виде.
ГЛАВА 4
АФФИННЫ Е И ЕВКЛИДОВЫ
ТОЧЕЧНЫ Е П РО СТРАН СТВА

Нам, живущим в трёхмерном физическом мире (обозначаемом


Мф), приходится иметь дело с точками, прямыми, плоскостями, рас­
положенными причудливым образом относительно друг друга и не
привязанными к какой-то выделенной точке — началу координат.
Понятно, что и в общем случае было бы желательно рассматривать
геометрические объекты, которые получаются из прямых и плоско­
стей, проходящих через начало координат, сдвигами. Другими сло­
вами, отвлекаясь пока от метрики, мы хотели бы сделать вектор­
ное пространство однородным, расширив его группу автоморфизмов
при помощи сдвигов так, чтобы все векторы (теперь уже “точки”
нового “аффинного пространства”) становились эквивалентными. В
этой главе будут введены все необходимые определения и доказаны
простейшие свойства аффинных пространств.

§ 1. А ф ф и н н ы е п р о с т р а н с т в а

1. Определение аффинного пространства. Как было от­


мечено выше, в любом векторном пространстве начало координат,
ассоциирующееся с нулевым вектором, играет особую роль: при всех
автоморфизмах пространства нулевой вектор остаётся на месте. Все
векторы станут равноправными (или эквивалентными) только после
расширения общей линейной группы за счёт сдвигов (параллельных
переносов) пространства. Чтобы эти соображения приобрели точ­
ный смысл, введём несколько определений.
О п р е д е л е н и е 1. Пусть А — некоторое непустое множество,
элементы которого мы будем называть точками и обозначать1) р,
ф г , ...
Пусть, далее, V — векторное пространство над полем Я. Мно­
жество А (а точнее, пара (А, У)) называется аффинным простран­
ством, ассоциированным (или связанным) с V , если задано отобра­
жение (р, v) I-Ар + v декартова произведения А х V в А, обладающее
следующими свойствами:
i) р + 0 = р, (р + u) + v = р + (и + v) для любой точки р е А и
любых векторов u, v е V (0 — нулевой вектор пространства V);

^ Ч а с то , особенно в механике и в теори и ди ф ф еренц иальны х уравнений, сим­


волом р обозн ач аю т производную dp/dt ди ф ф еренцируем ой ф ункции р = p (t). У
нас э т а ситуаци я не в ст р е ти т ся .
174 Гл. 4 • Аффинные и евклидовы точечные пространства

ii) каковы бы ни были точки р, g Е А, найдётся, и притом един­


ственный вектор v G У, для которого р + v = g (этот “вектор из р в
д” обозначается обычно р$ или q —р).
Размерность п = dim^ V векторного пространства V считается
одновременно размерностью ассоциированного с V аффинного про­
странства А. Иногда пишут Ап, чтобы подчеркнуть роль размерно­
сти. В тех наиболее интересных случаях, когда Я = Е или Я = С,
говорят о вещественном или соответственно комплексном аффин­
ном пространстве.
По своему смыслу аксиома ii) утверждает, что каждой точке р Е
Е А отвечает биекция v —у p + v множеств: V = А. С другой стороны,
мы имеем биективное отображение
U : Р -> р + v = tw(p), р е А,
на множестве А, называемое сдвигом (или параллельным переносом)
в А на вектор v. Из аксиом i), ii) следует, что
Al ' tv tu_|_v? tv ' t —Л/ С
(e := to — тождественное отображение), т.е. t_ v — сдвиг, обратный
к tv. Стало быть, сдвиги образуют группу, изоморфную аддитивной
группе пространства V . Если положить
cxtu -Ь /3 tv :=
то множество всех сдвигов становится векторным пространством,
однозначно определённым пространством А и изоморфным прост­
ранству V . Обозначим его символом A #.
З а м е ч а н и е . Обратим внимание на то обстоятельство, что один
и тот же знак + используется в выражениях u + v, р + v, имеющих
совершенно разный смысл, но это не приводит к недоразумениям.
Если, далее, р, g, г, s — такие точки из А, что p + v = g, r + v = s,
то Й , — ничто иное как разные представители класса, обозна­
чаемого вектором v. Запись р + р$ = g удобно использовать в силу
её мнемоничности, не более того. Непосредственно из определения
получаются простые правила действий с векторами р$:
р $ + qft = рТу р $ = —g^, pf) = 0

(р, д, г — произвольные точки из А). С таким же правом можно


писать
( Q- p) + ( r - q ) = r - p , (q-p) = - ( p- q) , Р ~ Р = 0.
П р и м е р 1. Если V — произвольное в екторное п р о стр ан ств о над полем Я
и А = vo + U — смеж ны й класс по векторн ом у п о д п р о стр ан ств у U С V (vo —
ф иксированны й в ек то р из У ), то А явл яется аф ф инны м п ростр ан ств о м над Я с
п ростр ан ств о м параллельны х переносов A# = U. К аж д о м у в ек то р у u ' Е U о т ­
в еч ает биекция vo + и —» vo + u + и ', удовлетворяю щ ая аксиом ам i), ii) просто
потом у, ч т о в ек то р ы п р о с тр а н с тв а V образую т груп п у по сложению. Г оворят,
§ 1. Аффинные пространства 175

ч т о А — аффинное линейное многообразие (или, коротко, линейное многообра­


зие) п р о с тр а н с тв а V, а п од п ростран ств о U — направление линейного м н огообра­
зия А
В частн о сти , к огд а U = V и А к а к м нож ество совп ад ает с V, будем п и сать
Va := А, понимая под точкой р Е Va п росто н екоторы й в ек то р u Е V. Т аким
образом , для лю бого в ек т о р а v Е V имеем p + v = u + v G V y и отображ ение
Va х V —УVa об л ад ает свой ствам и i), п). В этом случае ( Va — V. Ф ак т и ч е ск и
на одном м нож естве V определены две различн ы е алгебраи ческие с тр у к т у р ы .
2. И зоморфизм. Аффинные пространства А, А ', ассоциирован­
ные с одним и тем же векторным пространством У, естественно
называть изоморфными, если существует биективное отображение
/ : А —>А', для которого f(p + v) = f(p) + v при всех v Е У, р Е А
(ради простоты мы обозначаем результат применения сдвига tv в А
и А' одним и тем же символом).
Дадим более общее
О п р е д е л е н и е 2. Пусть А, А' — аффинные пространства, ассо­
циированные с векторными пространствами V , V над одним и тем
же полем Я. Отображение / : А —> А' называется аффинным (или
аффинно-линейным), если для всех р Е A, v G 7 выполнено соотно­
шение
/(р + v) = f(p) + D f ■V, (1)
где D / : V —>V' — линейное отображение векторных пространств.
Отображение D f называют иногда линейной частью (или дифферен­
циалом) отображения /. Для биективного аффинно-линейного ото­
бражения / линейная часть D f также биективна. В этом случае го­
ворят об изоморфизме между А и А', а при А' = А — об (аффинном)
автоморфизме пространства А, реализованном посредством невыро­
жденного аффинного преобразования /.
Заметим, что в принятых ранее обозначениях p + v = q уравнение
(1) переписывается в виде
D f - Й = f(p )f(q ). (1')
Т е о р е м а 1. Аффинные пространства (А, У), (А', У') одинако­
вой размерности изоморфны.
Д о к а з а т е л ь с т в о . Так как dim У = dim А = dim А' = dim У',
то существует биективное линейное отображение Т : У —> V (тео­
рема 5 из § 2 гл. 1). Зафиксируем точки о Е А и о1 Е А'. Построим
отображение / : А —> А', полагая /(б) = o', D f = Т. Любую точку
р Е А можно записать в виде р — о + v. Согласно нашему определе­
нию
/(p)=6'+4v). (2)
Когда р пробегает все точки в A, v пробегает все векторы в У (по
определению аффинного пространства), а тогда b1+Т{у) в силу биек-
тивности Т пробегает все точки в АС По тем же причинам разным
точкам из А соответствуют разные точки в АС Стало быть, / —
176 Гл. 4 • Аффинные и евклидовы точечные пространства

биективное отображение. Осталось проверить, что оно аффинно-ли­


нейно. В самом деле, используя (2), получаем
f(p + u) = / ( ( o + v ) + и) = / ( o + ( v + u)) =
= 6' + + и) = 6' + (JP(v ) + Т(и)) =
= {o'+ Т ( \ ) ) + Т(и) = f(p) + D f ■и. □
3. К оординаты . Введём естественное
О п р е д е л е н и е 3. Системой координат (или репером) в п-мер-
ном аффинном пространстве (А, У) называется совокупность {б;
e i , . . . , e n} точки о Е А и базиса ( e i , . . . , e n) в У. Координатами
x i , ..., х п точки р в системе {б; e i , ..., еп} считаются координаты
вектора сф в базисе (ei , ..., еп) : сф = х±е± + ... + х пеп.
Из равенства —сф следует, что если х \ , . . . , х п — коорди­
наты точки р, а ^/1, . . . , уп — координаты точки ф то координатами
вектора рф в базисе (ei , . .., еп) будут у\ —яд,. .., уп —х п. Обратно,
если q = р + а, то координаты у\ , . . . , уп точки q получаются сло­
жением координат а \ , . . . , ап вектора а и координат х \ , . . . , х п точки
р: yi = cti + Xi, i = 1,... ,n.
З а м е ч а н и е . Систему координат можно задавать также п + 1
точками {ро; Ръ • • • ,рп} такими, что векторы pop!, . .., роРп обра­
зуют базис пространства У.
Сказанное выше об основных операциях, выраженных в коорди­
натах, резюмирует
Т е о р е м а 2. Пусть {ро; Ръ • • • ,рп} — система координат в про­
странстве (А,У), := роРг, i = 1, .. ., п. £с,/ш координатами то­
чек р, q в этой системе являются соответственно x i , . . . , x n и
2/ ъ ... , ?/П; то вектор рф имеет координаты у\ — яд, ..., уп —х п в
базисе (ei , . .., еп). Для любого вектора а = + ... + апеп точка
р + а имеет координаты х \ + од, . .., х п + ап .
Пусть мы хотим перейти от системы координат {б; e i , ..., еп} к
системе {б'; е^, ..., е^}. Тогда нужно задать координаты bi, ..., bn

Рис. 5
§ 1. Аффинные пространства 177

точки 6' в старой системе (т.е. координаты вектора о&') и матрицу


перехода А = (а^) от базиса ( e i , . .., еп ) к базису (е'1?..., е'п) в прост­
ранстве V (рис. 5). Пусть x i , ... ,х п и х [ ,... ,х'п — старые и новые
координаты точки р Е А. Из равенства

о0 = од' - рЬ' = м » + ^ 2 x'je'j = biei +T A X а« е* =


i j i j i

= (m “A ') e*+ Ц biei


следует, что
n
Xi = '^ 2 aij x'j +bi, i = l,...,n . (3)
j= i
Короче,
X = A X ' + B,
где
*1 \
( Ж'1 \ ( h \
X = : ■ д- = : , Б =
\ хп / < V J \ ьп J
Так как det А ф 0, то
( bi
X ' = А~1Х + В', в' = = А~ХВ.
\ К
4. А ффинные подпространства. Для дальнейшего введём
О п р е д е л е н и е 4. Пусть р — фиксированная точка п-мерного
аффинного пространства (А, V ) и U — векторное подпространство
в V. Тогда множество
п =р + и = {р + и | и е и}
называется плоскостью (или аффинным подпространством) в А раз­
мерности т = dim U. Считается, что П проходит через точку р в
направлении векторного подпространства U. При т = 0 плоскость
П называется, естественно, точкой, при т — 1 — прямощ при т =
= п —1 — гиперплоскостью (в полном соответствии с терминоло­
гией, принятой для векторных пространств). Говорят ещё, что U —
направляющее подпространство плоскости П.
Заметим, что если q = р + u, г = р + v, и, v Е [/, то
q Т (v —и) = р Т и Т (v - и) = р + v = г.
Отсюда ф^ = v —и, а так как v —и Е £/, то ф^ G U. Стало быть,
Ф г G П = > qft е U. (4)

12 А .И. К о стр и к и н
178 Гл. 4 • Аффинные и евклидовы точечные пространства

Далее,
s, q, г G П = > s + qj* е П, (5)
поскольку = р + w, w G U и qft е U, так что s + = р + (w + qfi),
где w + qft G U .
Обратно, подмножество П С А, обладающее свойствами (4), (5),
очевидно, является плоскостью в смысле данного нами определения.
Итак, направляющее подпространство U С У однозначно опре­
деляется плоскостью П как совокупность всех векторов qft с q, г G П.
Точку р, входящую в определение П, можно заменить любой другой
точкой q G П. Действительно, g = Р + и, и G £/, поэтому
g + У = (р + и) + У = р + (и + У) = р + У.
Из отмеченных свойств И непосредственно вытекает
Т е о р е м а 3. Всякая плоскость И = p + U в аффинном прост­
ранстве сама является аффинным пространством, ассоциирован­
ным с векторным пространством U.
Д о к а з а т е л ь с т в о . В самом деле, аксиомы i), ii) аффинного
пространства с заменой У на £/, выполняющиеся в А, выполняются
и в И. Далее, как мы знаем, для любых двух точек q, г G И вектор
w = qft принадлежит U и г = q + w, причём вектор w определён
однозначно в У, а значит, и в U. □
Получим ещё несколько полезных фактов о подпространствах аф­
финного пространства (А, У). В дальнейшем предполагается, что
основное поле Я, которое пока находилось в тени, имеет характе­
ристику ф 2. В соответствии с общим определением на плоскости И
размерности г > 0 лежат по крайней мере две различные точки р, q.
При г = 1 (И — прямая) имеем
И = {р + Х Й I X G Я}. (6)
Т е о р е м а 4. Подмножество И С А тогда и только тогда явля­
ется подпространством (плоскостью), когда оно целиком содер­
жит прямую, проходящую через любые две его различные точки
(char Я ф 2).
Д о к а з а т е л ь с т в о . Пусть сначала П — плоскость. Тогда П =
= р + U, р G A, U С У. Если qi,q 2 £ П, то согласно (6) точки прямой,
проходящей через q\ , g2, имеют вид
qi + МйЙ = р + Pot + MTgt
Если qi = р + u i , q2 = р + u2, то Ui, u2 G U, qiq^ = u2 - щ , pqt = Ui
и,значит,
qi + Xqiq$ = p + ui + A(u2 - u i ) G p + У = П.
Обратно, пусть p G П, U = {p^ | q G П}. Надо доказать, что
U — векторное подпространство в У. По условию, если ф, д2 £ П,
pgi = ui, pq2 = u 2, то точка р + ui + A(u2 —ui), лежащая на прямой
§ 1. Аффинные пространства 179

{qi + P4iq\ | р Е Я} в А, содержится в П при любом А Е Я. Другими


словами,
u b u 2 Е и => Ui + Л(и2 - Ui) € и.
Кроме того, О Е £/, поскольку р Е П. При u i = 0 получаем импли­
кацию u 2 Е U = > Ли2 Е U. При Л = 1 /2 из u i , u 2 Е U следует
+ | u 2 Е [/, а тогда и ui + u 2 = 2 ( |u i + | u 2) E U.Стало быть,
U — векторное подпространство в V . □
С л е д с т в и е . Если П7 и П" — плоскости аффинного простран­
ства А, то их пересечение П = П' П П" либо пусто, либо является
плоскостью. Если U' , U" и U — векторные подпространства в V,
соответствующие плоскостям П7, П" и П, то U = U1П U".
Д о к а з а т е л ь с т в о . Если П содержит лишь одну точку, то ут­
верждение верно (U — нулевое подпространство). Пусть в П имеются
хотя бы две различные точки ф, д2. Тогда по теореме 4 прямая, про­
ходящая через бД, бД, целиком содержится как в П7, так и в П". Сле­
довательно, эта прямая целиком содержится и в П = П' П ПА Опять
согласно теореме 4 приходим к заключению, что П — плоскость.
Впрочем, это видно и непосредственно: если р Е П7 П П7', то П7 =
= р + и ', П" = p+U". В таком случае q Е П'ПП" —>• q = р+ и' = р+ и",
где и ' = и ' ' Е U1 П U". Мы в и д и м , ч т о П с о с т о и т и з точек вида
р + u, u Е U1 П U11 и, стало быть, является плоскостью, ассоцииро­
ванной с U = U1П U". □
О п р е д е л е н и е 5. Любые две плоскости в направлении одного и
того же подпространства U называются параллельными.
Совпадение двух параллельных плоскостей p + U, q + U, очевидно,
имеет место в точности тогда, когда р$ Е U. В любом случае
q + U = tp$ (ft + U),
т.е. параллельные плоскости получаются друг из друга сдвигом.
Уточним теперь замечание перед теоремой 2.
О п р е д е л е н и е 6. Говорят, что точки Рсь-Ръ... ,рт аффин­
ного пространства А находятся в общем положении (или являются
аффинно независимыми), если они не лежат в какой-нибудь
(ш —1)-мерной плоскости.
Свойство точек p o ,p i,... ,рш находиться в общем положении, вы­
полнимое лишь при т ^ п = dim А, равносильно условию линейной
независимости векторов popl, Рвр\ , • • •, РоРт или системы векторов
ш$>, ■■■,PiPi-l,PiPi+L ■■■,р ф Х
для любого другого индекса г, поскольку pip) = р$р) —рор\. Взяв за U
линейную оболочку (popl, ..., РоРт), мы придём к выводу, что через
точки Po,pi,... ,рш, находящиеся в общем положении, проходит, и
притом единственная, m-мерная плоскость ро + U.
12
180 Гл. 4 • Аффинные и евклидовы точечные пространства

В случае произвольного множества АЛ точек из А линейная обо­


лочка U векторов ро$ с фиксированным началом ро Е и концами
р, также лежащими в АЛ, имеет размерность, равную рангу мно­
жества (pof) | р G АЛ), и не зависит от выбора точки ро. Плоскость
П := А{АЛ) := ро + U можно рассматривать как пересечение всех
плоскостей, содержащих АЛ.
О п р е д е л е н и е 7. Плоскость П = А{АЛ) называется аффинной
оболочкой множества АЛ.
В частности, при АЛ = {П^П"} можно говорить об аффинной
оболочке П(П/,П//) любых двух плоскостей П', П" С А. Легко ви­
деть, что аффинная оболочка А{АЛ) определена множеством АЛ од­
нозначно: А(АЛ) — минимальная плоскость, содержащая П' и ПА
П р и м е р 2. П ' = {р} — нульмерная плоскость, содерж ащ ая одну т о ч к у р
двумерной плоскости (А, М2), П " = {q + \q fi | A G М} — прям ая в (А, М2). Если
р G П ", то, разум еется, А (П / ,П //) = И". Если же р (£ П ", то А (П / ,П //) = (А, М2).
5. Барицентрические координаты. Замечание в п. 3 наво­
дит на мысль заменить в определении 3 векторы e i , . . . , еп точками
Po,Pi,... ,рп, находящимися в общем положении. Координаты произ­
вольной точки р G А определяются из записи р = ро + —
—ро). Формально это выражение можно переписать в виде
п п

р = (i - X Xi)p° + X XiP
2=1 2=1
где, очевидно, отдельные слагаемые не имеют смысла. Более точно,
для любых точек q, г Е А и скаляра Л Е А, вообще говоря, бессмыс­
ленно как-то геометрически интерпретировать сумму q + г или вы­
ражение Aq, за исключением того случая, когда А = V. Тем не менее
имеет смысл
О п р е д е л е н и е 8. Пусть Ро,Ри - • • ,Рт — произвольные точки
аффинного пространства А. Любым скалярам а о ,а \,... ,а ш Е А с
Е тi=о сц — 1 сопоставим формальную сумму
-1
ФРа п0~
лагая т т

X a iPi = Р + X _ Р)>
2=0 2=0

где р — любая точка из А. Говорят, что ^ aipi является барицентри­


ческой комбинацией точек ро,Ри • • • ,Рт с коэффициентами <то,ац,...
. .., (Тт .
Данное определение корректно, поскольку справедливо
П р е д л о ж е н и е 1. Выражение
т т т

Х«гРг : = Р + Х Х ^ “ А Х а<= 1’
2=0 2=0 2=0
не зависит от выбора точки р.
§ 1. Аффинные пространства 181

Д о к а з а т е л ь с т в о . Действительно, заменив р на точку q = р +


+ v, v Е V , мы получим
т

p + v + ^ 2 а г(Рг - Р - v ) =
г= 0
m m m
= p + v + ^2ai{pi - p ) ~ (^ 2 a i)v = p + ^2ai{pi -p ),
2=0 2=0 2 =0

поскольку (1 — a i)v = O' П


Например, можно говорить о “полусумме точек” \q + \т — q+
+ \(r —q), но никак не об “одной трети” ^q + |г .
О п р е д е л е н и е 8. Если любая точка р Е А однозначно предста­
вима в виде барицентрической комбинации
22 22

Р= 2> Л , ж* е Я, У Xj = 1,
2=0 2 =0

то система точек {ро5.Ръ • • • ,£>22} называется барицентрической


системой координат в А, а числа хо ,... ,х п — барицентрическими
координатами точки р.
Переписав выражение для р в виде р = ро + —Ро)5
мы видим, что однозначность барицентрической комбинации равно­
сильна тому, что система {po',Pi —Ро, • • • ,рп ~ Ро} является аффин­
ной системой координат в А, т.е. точки p o ,p i,... ,рп находятся в
общем положении, а набор векторов (pi —ро, • • • ,Рп ~ Ро) является
базисом в V. По координатам x i , . . . , x n вектора х барицентриче­
ские координаты точки ро + х восстанавливаются однозначно в виде
1 —1 Хо, Х\ , • • • , Хп.
Рассуждая несколько иначе, предположим, что {6; ei,..., еп } —
какой-то репер n-мерного аффинного пространства А, Пт — един­
ственная ш-мерная плоскость, проходящая через точки р о ,р \,... ,рпг,
находящиеся в общем положении, и х \ , . .. ,аф, 0 ^ г ^ ш, — их ко­
ординаты. Тогда координаты х \ , . . . , х п любой точки р Е Пт одно­
значным образом выражаются в виде:
X j = X j + M i x j - X j ) + . . . + Ат (ж™ - X j ) , j = 1, 2, . . . , n . (7)
Эт и уравнения — способ так называемого параметрического зада­
ния плоскости Пт . Мы достигнем большей симметричности в за­
писи, если введём параметр Ао, связанный с Ai,. .., Хш соотношением
Ао + Ai + ... + Хт = 1, и перепишем (7) в виде
Xj = А0ж° + \ i x ) + . . . + \ тх ™ , j = 1, 2, (Т)

Барицентрические комбинации хорошо согласованы с аффинными


отображениями, как это видно из следующего утверждения.
182 Гл. 4 • Аффинные и евклидовы точечные пространства

П р е д л о ж е н и е 2. i) Пусть / : А —>А' — аффинное отображе­


ние и ро, - - - ,рш Е А. Тогда
т т т

/ ( Х ж^ ) = 5 >я&)> Х ж*= L
2 = 0 2 = 0 2 = 0

п) Пусть точки Ро,Ри • • • ,Рп задают барицентрическую систе­


му координат в А. Тогда для любых точек qo, ф , gn Е А' с?/-
ществует единственное аффинное отображение /, Ддл которого
f{Pi)=m, г = 0 , 1 , . . . , га.
Д о к а з а т е л ь с т в о . Выбрав точку р G А, в соответствии с пред­
ложением 1 получим
т

/(X = / ( / + Х ж^ -/))=
2= 0 т 2=0
т т
= /(/О + Df ( ^ Ж;(Д - р)) = f(p) +^2Xi ~P) =
2=0 2=0
m m
= fip) + T , X i ( f ( p i ) - f(p)) = ^Xif{pi),
2=0 2=0
что доказывает утверждение i).
Так как всякая точка из А представляется единственной барицен­
трической комбинацией, то теоретико-множественное отображение
/ : А —>А' можно определить формулой

/ (Х ^ д ) = ХА®-
Это — единственно возможное определение в силу i), и нужно лишь
проверить, что / — аффинное отображение. Действительно,
22 22 22 22

/ ( X XiPi) ~ / ( X УiPi) = X х "X =


2 = 0 2 = 0 2 = 0 2 = 0

22 22

= <?о + X “ ®>) - (<?о + X “ 9о)) =


22 22 22

= Х ( ж* “ - /о) = £ > / ( Х ж*Р* - Х ® ^ ) ’


2=1 2=0 2=0
где D / : У V' — линейное отображение, переводящее —ро в
qi —qo для всех г = 1,..., п. Оно существует, ибо по предположению
(pi —Ро, • • • ,Рп —Ро) — базис векторного пространства V. □
П р и м е р 3. В вещ ественной аф ф инной плоскости А в к ач естве реп ера можно
в зя т ь верш ины лю бого невы рож денного треу го л ьн и к а. Если, скаж ем , (1 ,0 ,0 ),
(0 ,1 ,0 ), (0 ,0 ,1 ) — барицентрические к оорд и н аты верш ин тр еу го л ьн и к а, то
( 1 / 3 ,1 / 3 ,1 / 3 ) — барицентрические коор д и н аты его ц ен тр а тяж е ст и .
§ 1. Аффинные пространства 183

6. Аффинно-линейные функции и системы линейных урав­


нений. Пусть (А, У) — аффинное пространство над полем Я. В
соответствии с определением 2 отображение / : А —у Я называется
аффинно-линейной функцией, если
Д р + v) = Др) + D f •v Vp G A, v е V,
где D f G У* — линейная функция на У, называемая, как и ранее,
линейной частью (или дифференциалом) функции /. Константы, т.е.
скаляры, относятся к аффинно-линейным функциям с равными нулю
линейными частями.
Выбрав систему координат {6; e i , . . . , еп} и обозначив через х \ ,...
. .., х п координаты точки р Е А в этой системе, мы выразим значение
функции / в виде
п
f(i>) = f(6 + o $ ) = ^2 a iX i + a0, (8)

где а 0 = До), «* = £)/• еь о$ = x xe x + ... + х пе п.


Обратно: если значения функции / : А —у Я вычисляются по фор­
муле (8) и v = где! + ... + r nen, то согласно теореме 2
п

f(p + v) = ^ 2 a i(Xi + Vi) + “ о =


2=1

= (5 2 a *x i + а о) + ^ 2 a m = Др) + D f • V,
i i
т.е. / — аффинно-линейная функция.
З а м е ч а н и е . Положив (А/ + дд)(р) = Лf(p) + дд(р), D (\f+
+дд) = XD f + gDg, мы обнаруживаем, что множество S всех аф­
финно-линейных функций А —у Я наделено структурой векторного
пространства: если /, д Е 5, то
(Л/ + цд)(р + v) = АДр + v) + цд(р + v) =
= А{Др) + -D/ • v} + р{с/(р) + Dg • v} =
= (А/ + цд)(р) + { XDf + fiDg) • v =
= (А/ + pg)ip) + { D (\f + цд)) • v,
т.е. А/ + дд Е 5. Теперь D можно интерпретировать как линейное
отображение S —>У*. Ядром KerD является прямая 5° в 5, состоя­
щая из постоянных функций.
Обратимся ещё раз к системе линейных уравнений
CLuXi + CI1 2 X 2 + . . . + CLlnx n — bi,
(9)
&т1х 1 Т 0"т2х 2 Т • • • Т 0"тпх п —
которую можно записать в виде
flip) = 0 , /ш (р ) = о, ( 9' )
184 Гл. 4 • Аффинные и евклидовы точечные пространства

где fi — аффинно-линейная функция:


п

ш ) = Y 1 аи хз - bi■

Предположим, что система (9) совместна и х\ , ... ,х®п — одно из


её решений. Принимая х®,... ,х^ за координаты точки ро в некото­
ром репере {о; e i , . . . , e n} (так что /До) = —bi) и условившись для
краткости называть саму точку ро решением, мы на основе извест­
ных фактов приходим к выводу, что любое другое решение системы
(9) или (9') имеет вид р = ро + х, где х Е V удовлетворяет системе
линейных уравнений
D fi • х = 0, . .., D fm • х = 0. (10)
Здесь D f i — линейная часть функции f i : D f i • х = Y l j a i j x j -
Решения системы (10) образуют, как мы знаем (см. гл. 1, § 3, и. 5),
подпространство U С V размерности п —г, где г — ранг системы
D fi, ... ,D fm. Таким образом, совокупностью решений системы (3)
будет плоскость П = ро + U размерности п —г.
Обратно: любую плоскость П = ро + U С А можно задать сис­
темой линейных уравнений. Действительно, согласно теореме 4 из
§ 3 гл. 1, векторное подпространство U С V размерности п —г явля­
ется пространством решений системы уравнений вида (10), имею­
щей ранг г. Далее, по определению точка р принадлежит П тог­
да и только тогда, когда pof) Е U. Если x i , . . . , x n — координаты
точки р в выбранном репере, а х\ , ... ,х®п — координаты точки ро,
то (xj —Xj)ej, и система (10) принимает вид
п
^ 2 aij(xj - Xj) = 0, i = 1 ,... ,т,
3= 1
или
п
dijXj — bi, i = 1,..., т,
з=1
где bi = х®. Ранг этой системы по-прежнему равен г.
Итак, доказана
Т е о р е м а 6. Пусть А — аффинное пространство размернос­
ти п. Множество точек из А, координаты которых удовлетво­
ряют совместной системе линейных уравнений ранга г, образуют
(п —г)-мерную плоскость П С А. Любая плоскость в А может быть
так получена.
В частности, гиперплоскость задаётся одним линейным уравне­
нием
а \ Х \ + 0- 2^2 + • • • + &пх п — Ь.
§ 1. Аффинные пространства 185

Оставив в системе (9) лишь г ^ т линейно независимых уравнений


(линейно-аффинных функций /^), мы на любую плоскость П размер­
ности п —г можем смотреть как на пересечение г гиперплоскостей. В
случае несовместной системы линейных уравнений пересечение ги­
перплоскостей пусто.
7. Взаимное расположение плоскостей. Пусть (А , У) — аф­
финное пространство размерности п. Обобщал понятие параллельно­
сти плоскостей одинаковой размерности (см. определение 5), введём
следующее
О п р е д е л е н и е 9. Пусть П' = р + £/', П" = q + U" (U' , U" —
векторные подпространства в V размерностей к, I) и к ^ I. Говорят,
что плоскость П' параллельна П", если U" С U1.
В случае к = I мы возвращаемся к прежнему понятию параллель­
ности. Если П" С П', то условие параллельности автоматически вы­
полняется. Учитывая установленное нами соответствие между плос­
костями и системами линейных уравнений, мы можем утверждать,
что справедлива
Т е о р е м а 7. Для любой плоскости И С А и любой точки q Е
Е А найдётся, и притом единственная, плоскость П' размерности
dinin' = dimn, проходящая через точку q параллельно П. Если
q Е П, то П' = П. Если q ^ П, то П и П' не пересекаются.
В частности, параллельность двух гиперплоскостей П и П', за­
данных в одной и той же системе координат уравнениями
а\Х\ + ... + апхп = 5, а[х[ + ... + а!пх'п — У,
означает попросту пропорциональность коэффициентов при пере­
менных: а' = Ла^, г — l , . . . , n ; а совпадение П = П' налагает, ес­
тественно, ещё одно ограничение У = ХЬ с тем же Л Е Я.
О п р е д е л е н и е 10. Непараллельные и непересекающиеся плос­
кости П, П' С А называются скрещивающимися.
Качественную картину взаимного расположения плоскостей под­
крепим некоторыми количественными оценками. Во-первых, если
плоскости П' = р + U1, П" = q + U" пересекающиеся и б — их общая
точка, то, как мы знаем, аффинная оболочка имеет вид
П := А(П', П") = б + W, W = U' + U".
Но в таком случае по теореме б из § 2 гл. 1 имеем
т := dim П = dim W = k + I —г,
где
к = dim U', I = dim £/", к ^ I, i = dim (U' П U"). (11)
Если пересечение П' П П" пусто, то рассмотрим векторную пря­
мую V\ = { А р ^ | А Е Л } и подпространство
W° = Uf + и " + El С V.
186 Гл. 4 • Аффинные и евклидовы точечные пространства

Так как U' + U" (см. упр. 4.4.1), то


т = dim П = dim (Ur + U") + dim V\ = k + l —i + 1.
Плоскость П° = p + VT0, очевидно, содержит П' = p + U1 и П" =
= q + U" = p + + U" C p + U" + V\. С другой стороны, всякая
плоскость, содержащая П', П", содержит вектор р$ и прямую Vi, а
потому содержит П°. Другими словами, в случае П' П Пп = 0 имеем
равенство П° = Д(П/,П//). Таким образом,
к + I —г, если П ' П П " / 0 ,
т = dim Д(П',П") = ( 12)
к 1 —г Т 1, если П' П П" = 0.
Четвёрка
(г, к, ш), 0 (13)
целых чисел, определённых соотношениями (12), вполне характери­
зует взаимное расположение плоскостей П', ПТ
П р и м е р 3. П усть (А, М3) — трёхм ерное вещ ественное аф ф инное п р о с тр а н ­
ство, П ', Л" — две прям ы е в нём, т а к ч т о п = 3, к = I = 1. Р азн ы е случаи
взаим ного располож ения прям ы х в А3 достато ч н о очевидны и изображ ен ы на
рис. 6.

Рис. 6
П опробуйте п р е д с та в и ть скрещ иваю щ иеся плоскости разм ерн остей 1 и 2 в
четы рёхм ерн ом вещ ественном аф ф инном п ростран ств е.

УП РА Ж Н ЕН И Я

1. П ровери ть, ч т о П ' = р-\- U1, Л" = q-\- U" являю тся пересекающимися , т.е.
имею щ ими хотя бы одну общ ую то ч к у , ровно т о гд а , к огд а р$ Е U' + Urr (ср. со
следствием теорем ы 4).
2. П усть А (П 1 , . . . , П ш ) — аф ф инная оболочка прям ы х П 1 , . . . , Л ш в вещ е­
ственном n -мерном аф ф инном п р о стр ан ств е А П ри каком минимальном т им еет
м есто совпадение ^ ( П 1, . . . , П т ) = А?
3. П усть (ро?Р1, • • • ,Рп) — репер аф ф ин ного п р о с тр а н с тв а А р азм ерн ости п
и (p q ,P i , . . . ,р'п ) — набор из п + 1 то ч к и аф ф ин ного п р о с тр а н с тв а А ' . Д о к а за ть ,
§ 2. Евклидовы ( точечные) пространства 187

ч т о сущ ествует в т о ч н о сти одно аф ф инное отображ ение / : А —)■А ', для ко то р о го
f(Pi) = P i , г = 0 ,1 , . . . , га.
4. У бедиться в том , ч т о бари ц ен три ч еская ком бинация конечного числа ба­
ри ц ен три ч ески х комбинаций т о ч е к p o , p i , . . . , р п явл яется барицентрической ком ­
бинацией эти х точек.
5. П усть А — n -мерное аф ф инное п ростр ан ств о . Д о к а за ть , ч т о отображ ение
/ : А —» А, сохраняю щ ее любые барицентрические комбинации т о ч е к из А, явля­
ется аф ф инны м преобразован ием (обращ ение у тверж ден и я i) из предлож ения 2).
6 . И спользуя свой ства аф ф ин ны х п реобразован ий, д о к а за ть известную т е о ­
рем у о том , ч т о медианы лю бого т р еу го л ьн и к а пересекаю тся в одной точке.

§ 2. Е вклидовы (т о ч еч н ы е) п р о с т р а н с т в а

1. Евклидова м етрика. Чтобы полностью приблизиться к реа­


лиям трёхмерного физического пространства, мы введём следующее
О п р е д е л е н и е 1. Аффинное пространство (Е, V ) называется
евклидовым (точечным) пространством, если V — евклидово век­
торное пространство.
Слово “точечное” мы будем обычно опускать, поскольку ранее
рассматривались только евклидовы векторные пространства, и по­
этому никакой путаницы не произойдёт. Итак, евклидово простран­
ство есть тройка (Е, V, р), где р(*,*) — функция расстояния между
точками из Е. Именно,
р (р ,д ):= \Ш = у Ш Ш - (1)
Здесь (и | v) — положительно определённая форма, задающая скаляр­
ное произведение на V.
Известные нам свойства функции расстояния в метрических про­
странствах (см. гл. 3, § 3, п. 5) гласят:
i) pip, о) = p (q, p );
ii) pip, q) = 0 p = q;
iii, p(p,q) + p(q,r) ^ p(p, г) (неравенство треугольника).
В дальнейшем символом И б у д е м обозначать прямую, проходя­
щую через две различные точки р, q Е Е.
О п р е д е л е н и е 2. Углом между прямыми И и назовём
угол ср между векторами и rt:
(р$ | rt)
cos (f =
Ы\\ • 1И1Г
О п р е д е л е н и е 3. Система координат {6; e i , ..., еп} в евклидо­
вом пространстве (Е, V) называется прямоугольной (или декарто­
вой), если ( e i , . . . , e n) — ортонормированный базис евклидова век­
торного пространства V: (е* | ej) = Sij; i,j — 1,2,... ,n.
Пусть p, q — точки в E с координатами ад, # 2, • • •, хп и г/i, 2/2?• • •
. .., уп в прямоугольной системе координат. Тогда координатами век­
188 Гл. 4 • Аффинные и евклидовы точечные пространства

тора р$ будут yi —яд, ..., уп —хп. Поэтому в соответствии с опре­


деляющим равенством (1)
р(р,q) = V (yi ~ x i)2 + ■■■+ (уп - х п)2 (2)
— обычная формула, по которой измеряется расстояние между точ­
ками.
Т е о р е м а 1. Любые евклидовы (точечные) пространства К, Е'
одинаковой конечной размерности изоморфны. Это значит, что су­
ществует изоморфное отображение / : Е —> Е' аффинных прост­
ранств, сохраняющее расстояние между точками:
p(p,q) = p'(f(p),f(q)) (з)
(рг — функция расстояния на Е').
Д о к а з а т е л ь с т в о . Выберем прямоугольную систему коорди­
нат {б; e i , . . . , еп} в Е и прямоугольную систему координат {<У; ,...
. .., е^} в Е '. Построим отображение / : Е —>Е ', полагая
Д о ) = 6', Т ( х \ е \ + . . . + х„ еп) = rcie'j + . . . + х пе'п . (4)
Так как линейное отображение Т : V —>К', очевидно, биективно, то
проверка, проведённая при доказательстве теоремы 1 из § 1, пока­
зывает, что / — изоморфизм между аффинными пространствами Е
и Е' с D f = Т .
Кроме того, точка р1 — f(p) имеет те же координаты ад,. .., хп
в {<У; е^,..., е^}, что и точка р в {б; e i , ... , еп}. А так как в Е и в Е'
расстояния р(р, q), рДр', q') вычисляются по одной и той же формуле
(2) (в силу выбора базиса), то условие (3) изоморфизма евклидовых
пространств также выполнено. □
Введём некоторые новые понятия.
О п р е д е л е н и е 4. Отрезком, соединяющим точки р и д аффин­
ного пространства, называется множество
pq = {р + Х Й I 0 ^ Л ^ 1}.
По смыслу pq = qp. Точка г, удовлетворяющая условию рУ =
= г£, обычно называется серединой отрезка pq. В случае евклидова
пространства под длиной отрезка pq будем понимать величину
\М\ ■- ||р$|| = p(p,q).
2. Расстояние от точки до плоскости. Пусть П — ш-мерная
плоскость в евклидовом пространстве Е размерности п, р — точка в
Е, лежащая вне плоскости П. Пусть q — точка в П.
О п р е д е л е н и е 5. Если (р$ \ г£) = 0 для любых точек г, s G П, то
говорят, что прямая П ^ перпендикулярна к плоскости П и пишут
Пp g _L П; величина р(р, q) в этом случае называется расстоянием от
точки р до плоскости П (оно равно нулю, если р G П), а отрезок pq
между точками р и q — перпендикуляром из точки р на П. Пишут
также pq -L П.
§ 2. Евклидовы ( точечные) пространства 189

Длина перпендикуляра — кратчайшее расстояние от точки р до


П, т.е. р(р, г) > р(р, q) для любой точки г Е П, отличной от д. В самом

Рис. 7
деле, как видно из рис. 7, pft = рф + сф — сумма двух ортогональных
векторов. Поэтому
p { p ,r f = (pi* |р#) = (р$ \р§) + (5# I eft) = p(p,q)2 + p(q,r)2 > p{p,q)2,
если г ф q (свойство ii) функции p).
Пусть П = о + U. Точку g = о + х на П ищем из условия pq _L П.
Так как V = U + U1- (теорема 7 из § 1 гл. 3), а сф = х + д^, где
х Е U, то компонента g^ Е £7^ вектора сф существует и определяется
однозначно.
Чтобы фактически найти перпендикуляр из р на П, выберем в Е
прямоугольную систему координат
{65 ец, . .., em, . .., en}, (5)
в которой векторы e i , . . . , em составляют базис векторного подпро­
странства U. Вектор v = сф мы считаем заданным. Мы найдём
h = w m , вычислив координаты вектора
х = 0$ + р^ = Xiei + ... + х тет.
Заметим, что
pql.П «<=> (рф | U) = 0 (рф | еД = О, г = 1, . . . , т.
Следовательно,
(х —v | е,) = 0, г = 1,..., то, (6)
откуда Xi = (v | е ^ , г = 1,... ,то.
Если бы система координат (5) не была прямоугольной, то усло­
вия (6) выразились бы в виде системы из т линейных уравнений
(ei |ei)zi + (е2 |е ^ х 2 + ... + (em |ei)xm = (v |е»), i = 1,... ,то, (7)
которая по доказанному имеет единственное решение. Система из т
линейных уравнений с т неизвестными имеет единственное решение
только тогда, когда её определитель отличен от нуля. Определителем
190 Гл. 4 • Аффинные и евклидовы точечные пространства

системы (7) является


(ei| ei) ... ( e i | e m)
G(ei, . . . , em) (8)
(era | el) ••• era | era)
Таким образом, G(e i , . . . , em), называемый определителем Грама
векторов e i , ..., em, не равен нулю. Мы ещё раз получили теорему 1
из § 5 гл. 3, фактически повторив все рассуждения.
Резюмируем наши сведения о перпендикуляре.
Т е о р е м а 2. Из каждой точки р, лежащей вне плоскости П =
= о + U евклидова пространства Е, можно опустить перпенди­
куляр pq. Его длина \pq\ есть кратчайшее расстояние от р до П.
Если о — любая выбранная нами точка на П, то р$ = х — of,
где х = x±ei + ... + хшеш — вектор в U, координаты которого
в любой системе координат {б; e i , ..., em, . .., еп} пространства Е
вычисляются как решение системы (7) по формулам Крамера
(ei | ех) ... (ei | v) ... (e1 \ em)
1 (e2 | ei) ... (e2 Iv) ... (e2 j em)
v = of).
G(e i , . . . , e m)
(em | el) • • • (em | v ) ••• (em | em)

Если (ei , . .., е) — ортонормир ованный базис, то Xi = (е^ | of).


3. Расстояние меж ду плоскостями. Пусть П и П' — плос­
кости в евклидовом пространстве (Е, V, р): П = р + U, П' = р1+ U1.
Так как р1 можно заменять на любую точку в плоскости П', то без
ограничения общности можно считать, что рр' А. П', т.е. П А_ П'.
Если одновременно П 1 П, то отрезок рр' — общий перпендику­
ляр к П и П'.
Л е м м а 1. Если отрезок рр' — общий перпендикуляр к П и П',
то
p(p,p') ^ p (q, q'), (9)

каковы бы ни были точки q Е П, q' G П'.


Д о к а з а т е л ь с т в о . Пусть q = р + u, q' = р' + и '. Так как р' =
=р+ то q' = р + pf>' + и' и
qq' = p f' + u ; —u.
По условию (p f ' | u) = 0 и (p f ' | u') = 0, т.е. (p f ' | u' —u) = 0, а в
таком случае по теореме Пифагора имеем
§ 2. Евклидовы ( точечные) пространства 191

Л е м м а 2. Любые две плоскости П, П' в (Е, Т, р) имеют общий


перпендикуляр.
Д о к а з а т е л ь с т в о . Пусть П = q + 77, П' = q' + U'. Подберём
точки р = q —u, р' = q' —и' так, чтобы вектор pf>' был ортогонален к
77 и 77'. Очевидно, р$' = u - и Ч ^ ' Так как V = (77 + U') 0 (77 + 77')^,
то q$f = b + с, где b G (7 + (7', с G (77 + 77')^, причём компоненты b
и с определены однозначно. Кроме того, b = v + v', v G 77, v' G U1.
Получаем
= —u' + v' + v + u + c.
Вектор будет искомым, если мы возьмём u' = v', u = —v. Дейст­
вительно, тогда pf>' = c G (U + 7 7 ' ) □
Из лемм 1 и 2 почти непосредственно вытекает
Т е о р е м а 3. Для любых двух плоскостей П, П' G (Е, V, р) най­
дутся такие точки р G П, р1 G П', что будет выполнено нера­
венство (1). Отрезок рр' является общим перпендикуляром к П и
П'. Он определён однозначно в точности тогда, когда 77 П U' = О
(77, U1 — направляющие подпространства для П и П').
Д о к а з а т е л ь с т в о . Действительно, если ftp' и qqf — два об­
щих перпендикуляра, то p(p,pr) = p(q,qr) и согласно доказательству
леммы 2 и = и', т.е. q1 — р1+ и, q — р + и, и G 77 П 77'. Таким обра­
зом, множество общих перпендикуляров взаимно однозначно соот­
ветствует векторам из 770 77'. Единственность имеет место только в
случае 77 П 77' = 0. Так обстоит дело, в частности, когда П' — точка,
и, значит, 77' = 0. □
4. Определитель Грама и объём параллелепипеда. Решение
задачи о перпендикуляре в и. 2 привело нас попутно к заключению,
что определитель Грама G (e i , . .., em ),вычисляемый по формуле (8),
отличен от нуля, коль скоро векторы e i , ...,em линейно независимы.
На G(e 1,... ,em ) можно смотреть и как на последний главный ми­
нор А ш матрицы положительно определённой квадратичной формы
g(v) = (v | v) на направляющем векторном подпространстве 77 плос­
кости П. Согласно критерию Сильвестра (теорема 8 из § 4 гл. 1)
G( q\ ,...,em ) = А т > 0.
Если же ei, . .., em линейно зависимы и, например, е т =
= аде! + ... + a m- i e m- i (мы уже отвлекаемся от базиса подпрост­
ранства 77), то
га—1
(ет Iе*) = оц (ет |е,), г = 1,... ,ш,

так что последняя строка в G(ei, . . . , em) оказывается линейной ком­


бинацией остальных строк. Таким образом, G(ei , . .., em) = 0 и спра­
ведлива
Т е о р е м а 4. Определитель Грама системы векторов e i , . . . , em
отличен от нуля в точности тогда, когда векторы системы ли­
192 Гл. 4 • Аффинные и евклидовы точечные пространства

нейно независимы. Всегда выполнено неравенство G ( e ^


^ 0, частным случаем которого при т — 2 является неравенство
Коши—Буняковского.
Определитель Грама G( e i , . . . , e m) можно истолковать как
квадрат объёма параллелепипеда P(dpi, . .., дрш) со сторонами
др1,...,д р т {pi = о + е*; г = l , . . . , m) :
Р{др\ , . . . , ОРш) = {^1 Ьр1 + • • • + tm Орт | 0 ^ ti ^ 1} • (Ю)
Пусть (fi, . . . , fm) — ортонормированный базис векторного прост­
ранства £/, в котором лежат векторы e i , ..., em (возможно, линейно
зависимые), и пусть
т
ез — ^'
2=1
По определению считаем
vm = v m (P{6p1,...,6 p m)) = |det(aij)™|,
что полностью соответствует замечаниям из [ВА I, гл. 3, § 1, п. 1].
Поэтому
2
ац .. а1т ац .. a mi an .. aim
к о 2=
a mi .. • • ^тт aim • • CLmm a mi .. a mm

—det(ttfj),
CLij — ^ ^ Clki ttkj — (е г | ej)}
k=1
ввиду ортонормированности базиса (fi,. .., fm). Следовательно,
(ei| ei) ... ( e i | e m)
(^)2= —G(ei, . . . , om).
(em Iei) 0
Итак, определитель Грама G( ei , ..., em) равен квадрату объёма
ш-мерного параллелепипеда со сторонами др±, ..., дрт.
По поводу объёмов фигур в евклидовом пространстве более под­
робные разъяснения даны в учебном пособии [2].

УП РА Ж Н ЕН И Я

1. Н ай ти расстоян ие от то ч к и р = (2 ,1 , —3,4 ) до плоскости


П : 2х\ — 4 ж2 — 8жз + 13ж4 + 19 = 0, х \ + Х2 — хз + 2ж4 — 1 = 0.
2. Н ай ти расстоян ие м еж ду плоскостям и
П 1 : х \ + жз + Х4 —2 х 5 —2 = 0, Х2 + жз —Х4 —х§ —3 = 0,
Ж1 — Х2 + 2жз — .т,5 —3 = 0;
П 2 : (1, —2 ,5 ,8 , 2) + <(0,1 ,2 ,1 ,2 ), ( 2 ,1 , 2 ,- 1 , 1 ) ) .
§ 3. Группы и геометрии 193

3. П о к а за ть , ч т о объём уш параллелепипеда (11) вы числяется по формуле


Vm = IId p i • h . . . i m_i||,
где Ik — длина перпендикуляра, опущ енного из то ч к и Pk+i на аф ф инную обо­
лочку A ( o , p i , . . . ,рт).

§ 3. Группы и г е о м е т р и и
1. Аффинная группа. Вначале рассмотрим простейший при­
мер.
п р и м е р 1. В ещ ественная аф ф инная прям ая А по определению совп ад ает с
м нож еством К вещ ественны х чисел. Д ругим и словами, т о ч к а ж Е К о то ж д еств л я­
ется (и мы этим отож дествлен ием будем п ользоваться) с вещ ественны м числом
х G М. Г еом етри я прям ой опи сы вается аф ф ин ны м и автом орф и зм ам и в смысле
п. 2 из § 1. В данном случае это будут о тображ ен и я Фа ^ : А —» А, определённы е
правилом
Ф а,/3: х а х + Д, a G М*, Д G М. (1)
Если угодно, ж — к о о р д и н ата то ч к и ж в некотором репере {б ,е}, т.е. ж = б +
+ ж, Фа ,/з(ж) = (д + Д) + а х = б + (скж + Д). О бозначим символом Ад = Aff (М)
м нож ество всех аф ф ин ны х преобразован и й ви да (1). Т ак к а к композиция

Фа,/3 ’ Ф<т,т — Фасг,сст+/3 (2)


лю бы х двух преобразован и й Ф ^ д , Фо-,г £ Ад снова при н ад л еж и т A i, и т а к к а к
£ = Ф1,о G А ц а Фа _ 1 ^_а _ 1 ^ — п реобразован ие, обратн о е к Ф ^ д , то множ ество
А \ вм есте с естественной операцией умнож ения (2) явл яется группой (см. [BA I,
гл. 4, § 2]), назы ваем ой одномерной вещест венной аффинной группой. Из (2)
следует, ч т о А \ — неабелева груп п а, а отображ ение
7г : Ф 1 - » а
явл яется эпим орф измом А —» М* на м ульти п л и кати вн ую груп п у М* вещ ественны х
чисел, о тли чны х о т 0. Я сно, ч т о К е г л = {Фцд | Д Е К} — п од груп п а сдвигов в
А 1 , изом орф ная а д ди ти вн ой группе = {М,+ } вещ ественны х чисел. М ы имеем
то, ч т о при н ято н а зы в ат ь короткой точной последовательностью м орф измов
групп:
0 М+ Ai М* 1.
Пусть теперь (А, V ) — n-мерное аффинное пространство над по­
лем Я, / : А —>А — биективное аффинное преобразование (аффин­
ный автоморфизм). Согласно общему определению (см. § 1)
f(p + V) = f(p) + Tv,
где T — невырожденный линейный оператор на V , обозначаемый
в общем случае D f. По условию detJA / 0 и линейный оператор Т
имеет обратный Д7-1, являющийся линейной частью аффинного пре­
образования / -1 :
Г Ч р + v )= г 1 ( р ) + у - \ .
Обозначив через е единичное (или тождественное) аффинное пре­
образование с линейной частью £ : v на v, мы видим, что / • / -1 =
= Г 1 - / = в.
13 А .И. К о стр и к и н
194 Гл. 4 • Аффинные и евклидовы точечные пространства

Пусть / и g — два аффинных преобразования пространства А.


Их композиция
h = f -g: f(g(jp))
снова является аффинным преобразованием с линейной частью % =
= TQ [Т и Q — линейные части преобразований f u g ) . Дейст­
вительно,
h(p + v) = f(g(j> + v)) = f(g(p) + Gv) =
= + F(Gv) = ( / • g)(p) + TQv = h{j>) + H.
Ассоциативность операции умножения на множестве Aff(A) =
= Ап(Я) всех аффинных автоморфизмов следует из ассоциативности
закона композиции на множестве произвольных отображений А —у А
(см. [ВА I]). Таким образом, Aff(A) есть группа, называемая п-мерной
аффинной группой (аффинного) пространства А. Мы получили часть
следующего утверждения.
Т е о р е м а 1. Совокупность Ап(Я) всех аффинных автоморфиз­
мов п-мерного пространства (А, У) над полем Я образует группу.
Все аффинные автоморфизмы, оставляющие на месте фиксирован­
ную точку о G А, образуют подгруппу Ап(Я)д С Ап(Я), изоморфную
полной линейной группе GL(V) = GLn{^). Подгруппа Т = {tv | v G
G V} сдвигов пространства А нормальна в Ап(Я) и служит ядром
эпиморфизма D в точной последовательности
е -> Т 4 Ап(Я) 4 GLn(A) -> ё.

(Точность означает, что Ъхкр = KerD.)


Д о к а з а т е л ь с т в о . Рассмотрим аффинные автоморфизмы
/ , g G Ап(Я)д- Так как /(б + х) = о + JAx и д(д + х) = о + £/х, то
( / ° 5 )(о + х) = f(g(d + bfx)) = f(6 + g-x) = 6 + TG, т.е. fo g е Ап(Я)д.
Аналогично показывается, что / _1 С А„ (Я ) . Единичное отобра-
жение также содержится в Ап(Я)д- Таким образом, Ап(Я)д — под­
группа в Ап(Я). Соответствие D : f н-» D f = Т для / G Дп(Л)о,
очевидно, является изоморфизмом Ап(Я)б на группу всех невырож­
денных линейных операторов, т.е. на GL(V).
Мы ещё раньше отмечали, что сдвиги образуют подгруппу
Т С Ап(Я), изоморфную аддитивной группе пространства V. Пусть
tv — сдвиг и / — произвольный аффинный автоморфизм с линейной
частью Т . Тогда
( / _1iv/)(p) = ( / _1М /(р ) = / _1(/(Й + v) =
= / _ 1 ( / ( р )) + T ~ xv = p + F ~ 1v = t jr-iv {p).
Так как р — произвольная точка, то отсюда следует, что
f ~ Xtw f = tp - lv. (3)
§ 3. Группы и геометрии 195

Равенство (3) показывает, что Т — нормальная подгруппа в Ап(Я),


т.е. ядро некоторого гомоморфизма. Найдём этот гомоморфизм.
Хорошо известное отображение D : f i—>- D f = Т имеет в качестве
ядра подгруппу KerD = { / Е Ап(Я) \ Т — £}. Значит,
/ G Ker£> => f(p + v) = f(p) + v.
В этом случае вектор u = (р + v)/(p + v) = (р + v)(f(p) + vj = pf('p)
не зависит от точки р и f(p + v) = (р + u) + v = (р + v) + и, так что
/ = tu — сдвиг на вектор и. Итак, KerD — Т. С другой стороны,
выбрав какую-то начальную точку о и построив для любого Т Е
Е GL(V) отображение o + v н p + ^ v , мы видим, что ImZ} = G L(V),
так что D — эпиморфизм. □
Докажем ещё следующее утверждение.
Т е о р е м а 2. Каждое аффинное преобразование / : Е —>Е с ли­
нейной частью Т можно представить в виде / = ta g, где ta —
сдвиг на вектор а = o f (о), g — аффинное преобразование, остав­
ляющее на месте заданную точку о. Это разложение зависит от
точки о. Если заменить о на д' , то вместо вектора а нужно взять
а' = а + ( Т —£ ) об'.
Д о к а з а т е л ь с т в о . Положим а = o f (о) и g — t~ xf. Мы уже зна­
ем, что g — аффинное преобразование. При этом g(o) = t~ x • f{6) =
= t - а • /(б) = /(б) —o f (о) = б. Стало быть, д оставляет б на месте.
Взяв вместо б другую точку б;, мы получили бы вектор а; =
= о1f(o'). Если о' — б + b, то /(б') = /(б) -Ь^Ь, или, что то же самое,
о' + о1f(o f) = б + o f (о) + JTb, откуда
а' = Т Ъ - b + а = а + { Т - Е) об*. □

При фиксированной начальной точке б Е А группу Aff(A) можно


представлять себе как множество (G L(V),V) пар (Е, v) с действием

(Т , v) (б + х) = б + Т х + v (4)
и с законом композиции
(Ti,vi) •(T2,V2)= (Ti^vi + ^ 1 У2). (5)
Действительно, если fi = ( ^ , у Д, г = 1,2, то

(/l • / 2) (о + х) = /1 ( /2(6 + х)) =


= Л ( б + ^ 2Х + v 2) = б + Д № х + v 2) + Vi.
Отсюда следует (4) и (5).
Выберем теперь в А какую-нибудь систему координат {б; e i ,...
. .., еп}. Тогда координатами точки р = б + х будут по определению
13
196 Гл. 4 • Аффинные и евклидовы точечные пространства

координаты х \ , . . . , х п вектора сф = х = ^ Если / — аффинное


преобразование с линейной частью D f = Т , то
f(p) = /(о) + .Fx = о + o f (о) + Т х.
Обозначим координаты точки f(p) через г/i, . . . , уп] пусть также
о f(o) — a F = (/ij) — матрица линейного оператора JF, так
что
(•^x)i = Е г
з=1
Собирал все данные, мы получим
п
Уг = ^2fijX j +bi, i = 1,... ,п. (6)
Короче, J
Y = F X + В,
где У, X, В — столбцы соответствующих координат (ср. с (3) из § 1,
а ещё лучше — с (3) из § 1 гл. 2).
2. Д в и ж е н и я е в к л и д о в а п р о с т р а н с т в а . Пусть (Е, V, р) —
евклидово (точечное) пространство размерности п. По умолчанию
предполагается, что Я = R.
О п р е д е л е н и е 1. Движением (или изометрией) пространства Е
называется любое отображение / : Е —у Е, сохраняющее расстояние,

p(f (p) , /(<?)) = р(р,4) (7)


для всех р, q Е Е.
В определении движения / не предполагается, что / — аффинное
преобразование, но на самом деле / им является, как показывает
Т е о р е м а 3. Отображение / : Е —>Е является движением тог­
да и только тогда, когда / — аффинное преобразование с линейной
частью Т — ортогональным линейным оператором на V.
Д о к а з а т е л ь с т в о . В одну сторону утверждение почти оче­
видно. Действительно, любое аффинное преобразование с ортого­
нальной линейной частью Т обладает свойством (7):

p{f(p),f(q)) = p{ f(p )3 (p + v)) = \\f(p)f(p + v)\\ =


= I I 4 V)II = IMI = \\p(i> + v)|| = ЦЙ11 = p(p,<i)-
Заметим, в частности, что любой сдвиг есть движение.
Центр тяжести лежит в доказательстве обратного утверждения.
Мы разобьём это доказательство на несколько этапов.
1. Очевидная проверка показывает, что произведение двух дви­
жений будет движением. Пусть / — движение, о — фиксированная
§ 3. Группы и геометрии 197

точка, р' = /(о), а = oh' и ta — сдвиг на вектор а. Тогда д = t ^ 1 • /


также есть движение. Так как
9(6) = ^ 4 / ( 6 ) ) = гг1(o') = о,
то / = tag, где д(о) = о, т.е. любое движение является произведе­
нием сдвига (параллельного переноса) и движения д, оставляющего
неподвижной точку б. Нам достаточно показать, что д — аффинное
преобразование с ортогональной линейной частью.
2. Итак, д — движение и д{6) = о. Определим отображение Q :
V V, полагая Qx = б д (б + х ) , т.е.
д(о + х) = о+ £/х. (8)

Отображение обладает свойствами


00 = 0, ||0х - 0 у|| = ||х - у||. (9)
Действительно, д(о) = о = > ^0 = 0. Положим теперь р = о + х,
q = о + у. Тогда </) = 11у х ||, поскольку ^ = р + у - х и р ^ = У - х .
Так как д — движение, то p(g(p),g(q)) = p(p,q) = ||у - х ||. Но из (8)
следует, что д(р) = 6 + бх, g(q) = 6 + 6у, и поэтому p(g(p),g(q)) =
= \\Qy —£/х||. Вместе это и даёт (9).
Полагая у = 0, получаем, в частности, с учётом (3)
110х|| = ||х||. (10)

3. Отображение Q сохраняет скалярное произведение, т.е.


( 0 х |0 у ) = ( х | у ) . (11)
Действительно, согласно (9)

11х 1|2 - 2 (х | У) + ||у||2 = (х - у | х - у) = ||х - у ||2 = ||0х - 0 у ||2 =


= ( 0 х - 0 У I 0 Х - 0 у ) = ||х ||2 - 2 ( 0 х |0 у ) + ||0 у ||2.
Это соотношение с учётом (10) даёт (11).
4. Отображение Q линейно. В самом деле, положим z = х + у ,
так что ||z —х —у 112 = 0. Расписав это равенство более подробно,
получим
INI2 + N il2 + ||у||2 - 2 (z | х ) - 2 (z | у ) + 2 (х | у ) = 0.
Отсюда с учётом (10) и (11) находим
||0z||2 + ||0 х||2 + ||0 у||2 - 2(0Z I Qx) - 2(0Z I у) + 2(0 X | Qy) = 0,
что эквивалентно равенству ||£/z —Qx —Qy|| = 0, т.е. Q%—Qx —Qy =
= 0. Стало быть,
Q(x + у ) = Qx + Qy.
Равенство £/(Ax) = A £ /x доказывается аналогично.
198 Гл. 4 • Аффинные и евклидовы точечные пространства

5. Конец доказательства. Из (8) и из пп. 3,4 следует, что g —


аффинное преобразование с линейной частью — ортогональным ли­
нейным оператором Q. □
Уточнением рассуждений, проведенных в п. 1 доказательства
теоремы 2, служит
Т е о р е м а 4. Пусть / — движение евклидова пространства
(Е, V, р) с линейной частью — ортогональным линейным операто­
ром Т . Существует разложение V в прямую сумму ортогональных
подпространств, инвариантных относительно Т\
V = L® LД (12)
и такая точка о £ Е, что Т ъ — х для всех х £ L, причём / = £а • д,
а е L и д{о) = б.
Д о к а з а т е л ь с т в о . Обозначим через L совокупность всех век­
торов из V , остающихся неподвижными при действии Т . Очевидно,
это будет векторное подпространство, инвариантное относительно
Т . Как мы знаем (теорема 7 из § 1 гл. 3), ZA также .^-инвариантно
и имеет место разложение (12).
Возьмём любую точку о1 £ Е и представим / в виде / = £а' • д1,
д1{о1) = <У. При замене точки <Уна точку б = б' + х вектор а' перейдёт
в а = а' + (Т —£)х (теорема 2), а А в д с д(б) = б.
Пусть а' = b + с, х = у + z, где Ь, у Е L, с, z G 1/Х. Подберём над­
лежащим образом вектор х. Линейный оператор Т —Е, ограниченный
на lA , не имеет ядра, поскольку L П ZA = 0 . Поэтому (Т — £)\l -l
невырожден. Это значит, в частности, что существует такой вектор
z G ZA, для которого (Т —£)z = —с. Но тогда
а = b + с —с = b £ Z. □
3. Группа изом етрии. Так как аффинные преобразования
образуют группу (теорема 1) и ортогональные линейные операторы
образуют группу (теорема 2 из § 2 гл. 3), то согласно теореме 1
совокупность всех движений евклидова пространства Е будет также
группой. Назовём её группой изометрий пространства Е и обозначим
символом Iso (Е) . Поскольку два евклидовых пространства одина­
ковой размерности изоморфны (теорема 1 из § 2), имеется с точ­
ностью до изоморфизма лишь одна группа изометрий для каждой
размерности. Ясно, что Iso (Е) — подгруппа аффинной группы Aff(E).
В Iso (Е) содержится подгруппа Т сдвигов, изоморфная аддитивной
группе векторного пространства V. Подгруппа движений, оставляю­
щих на месте фиксированную точку б £ Е, изоморфна ортогональ­
ной группе 0(n), п = dimE. Если {б; e i , ..., еп} — прямоугольная
система координат в Е, то движение / запишется в виде
Y = F X + Л, (13)
где X = [х\ , . .., хп\, Y = [г/i, . . . , уп\ — столбцы координат точек р
§ 3. Группы и геометрии 199

и f(ft) соответственно, А = [а\ . .., ап\ — столбец координат вектора


a G V, отвечающего сдвигу £а, F — ортогональная матрица.
Если F G SO(n), т.е. det F = 1, то / называется собственным
движением. Группу всех собственных движений пространства Iso(E)
обозначим Iso+(E) (это, впрочем, нами использоваться не будет).
Элементы группы изометрий, т.е. движения постоянно встре­
чаются в геометрии и механике, поэтому имеет смысл остановиться
на их интерпретации в случае небольших п.
С л у ч а й п = 1. Согласно общей формуле (13)
у = ех + а, (14)
где е = zЬ1 (ортогональность одномерного линейного оператора) и
а — некоторая постоянная, соответствующая сдвигу. Если г = 1, то
получаем сдвиг прямой. Если г = —1, то формула (14), переписанная
в виде
У - а / 2 = - ( х - а / 2),

наводит на мысль выбрать новое начало координат: ж = х' + а / 2 ,


у = у' + а /2. Теперь формула у' = —х' показывает, что мы имеем
дело с отражением (симметрией) прямой относительно некоторой
точки о1.
С л у ч а й п = 2. Выбрав прямоугольную систему координат
{о; e i, 02}, в которой линейная часть Т движения / приводится к
каноническому виду (теорема 10 из § 3 гл. 3), мы видим, что коор­
динатная запись / сводится к одной из следующих:
1) х' = х + а, 2) х' = х + а, 3) х' = х cos (р —у sin ip + а,
у' = у + Ъ] у' — —у + у' — х sin (р + у cos р + Ь.
В случае 1) мы имеем сдвиг на вектор а е±+Ь в 2. В случае 2) нужно
перенести начало координат в точку д' = (б, —Ъ/2), т.е. ввести новые
координаты ^ , 77:
ж = £ О' = С'), «/ = »?(«/' = »?' + V 2)-
После этого формулы 2) примут вид
£' = f + а, V = -V-
В случае 3) при 7^ 0 перенесём начало координат в точку о1 —
— (жо, 2/о) ? гДе жсь 2/о определяются из системы
жо cos (^ —7/0 sin (^ + а = жо,
жо sin у? + 7/0 cos р + b = т/о•
Геометрически это означает, что /(б') = б'. Существование точки о1
вытекает и из теоремы 3, в обозначениях которой L — 0 (отсутствие
неподвижных векторов при действии F) и ta = е, так что f — g —
200 Гл. 4 • Аффинные и евклидовы точечные пространства

чистое вращение. Если рассуждать формально, то нужно ввести но­


вые координаты ^ , 77:
х = £ + х0 ( х' =£' + х0),
У = Ц + 2/о {у' = г)' + Уо),
после чего формулы 3) примут вид
£ = £ cos р —rj sin (р,
7/ = £ sin р + г] cos
Таким образом, доказана
Т е о р е м а 5. Любое собственное движение плоскости есть либо
сдвиг, вращение вокруг некоторой точки. Стало быть, собст­
венное движение, оставляющее неподвижной какую-то точку, есть
вращение вокруг этой точки. Несобственное движение плоскости
сводится к отражению относительно некоторой прямой (у нас —
оси абсцисс £) и сдвига плоскости вдоль этой прямой. Из суще­
ствования хотя бы одной неподвижной точки относительно несоб­
ственного движения вытекает существование целой прямощ со­
стоящей из неподвижных точек.
С л у ч а й п = 3. Снова опираясь на теорему 10 из § 3 гл. 3,
мы постараемся выбрать в трёхмерном евклидовом пространстве Е
такую прямоугольную систему координат {б; ei, в 2, ез}, чтобы ли­
нейная часть Т движения / приняла канонический вид. Тогда в ко­
ординатной записи для / получается всего несколько возможностей:
1) х1 — х + а, 2) х1 — х cos р —у sin р + а,
у' = у+ Ь, у1 — х sin р + у cos р + Ъ,
z' = z + с; z' = z + с;

3) х' = х + а, 4)
х1 — х cos р —у sin р + а,
у1 = У + ь, у1 — х sin р А-у cos у? + Ь,
z 1 — —z + с; 2:' = —2 + с.
В случае 1) имеем сдвиг на вектор ае 1 + be2 + сез.
В случае 2) при ^ 0, проводя аналогию с плоскостью, мы
придём (после перенесения начала координат в точку д1 = (жо, 2/о? 0))
к формулам
С' = £ cos if - Т]sin ip,
7/ = £ sin р + г] cos <£,
// = /i + с.
Стало быть, / есть сдвиг на вектор (0,0, с) вдоль прямой <У/л,
соединённый с вращением вокруг этой же прямой на угол р. Полу­
чается то, что в механике называют винтовым движением (навёр­
тывание гайки на болт).
§ 3. Группы и геометрии 201

В случае 3), перейдя к новым координатам 77, /х:

У = V,
z = /1 + с / 2 ; // + с / 2 ,
мы придём к формулам
т/ V + b, й' = ~Й ,

показывающим, что / сводится к отражению относительно плос­


кости П = д£г) и к сдвигу на вектор (а, 6, 0), компланарный этой
плоскости.
В случае 4), являющемся комбинацией 2) и 3), формулы приво­
дятся к виду
£ = £ cos ср —r\ sin ср,
7/ = £ sin (р + г] cos (р,
й'= - й,
откуда следует, что / есть отражение относительно плоскости б £ 77,
соединённое с вращением вокруг оси bfi на угол ср.
Т е о р е м а 6 . Собственное движение / трёхмерного евклидо­
ва пространства Е является всегда винтовым, т.е. / сводится к
сдвигу вдоль некоторой прямой и вращению вокруг этой же пря­
мой (винтовое движение включает как чистый сдвиг, так и чистое
вращение).
Несобственное движение есть отражение относительно неко­
торой плоскости П, соединённое либо со сдвигом на вектор, ком­
планарный той же плоскости П, либо с вращением на угол (р вокруг
прямой, перпендикулярной плоскости П (при ср = тг получается сим­
метрия относительно точки).
Из теоремы б в качестве частных случаев вытекают теорема
Эйлера (1776 г.), согласно которой всякое перемещение твёрдого тела
с одной закреплённой точкой о представляет собой вращение вокруг
некоторой оси (проходящей через точку б), и теоремы Шаля (1830 г.)
о том, что любое перемещение тела может быть осуществлено путём
поступательного перемещения тела вдоль некоторого направления и
вращения вокруг оси с этим направлением.
4. Линейная геом етри я, отвечаю щ ая группе. В соответс­
твии с точкой зрения, ставшей общепринятой более 125 лет назад и
впервые чётко изложенной в “Эрлангенской программе” Ф. Клейна
(1872 г.), под геометрией следует понимать совокупность инвариан­
тов данной группы G. Пусть Г — некоторое множество, или, как мы
ещё будем говорить, пространство точек, G — какая-то подгруппа в
группе всех биективных отображений Г —у Г. Предметом геометрии,
202 Гл. 4 • Аффинные и евклидовы точечные пространства

отвечающей G, является изучение тех свойств пространственных фи­


гур (или пространственных конфигураций точек) в Г, которые оста­
ются неизменными при действии преобразований из G.
Все фигуры разбиваются на классы G-конгруэнтных фигур.
Именно, фигура Ф1 объявляется конгруэнтной (или равной) фигуре
ф2 (Ф-l ~ Ф2), если Ф2 = д(Ф1) хотя бы для одного элемента д G G.
Из аксиом группы непосредственно вытекает, что конгруэнтность
является отношением эквивалентности, т.е. справедливы свойства:
G
1) рефлексивность (поскольку Ф1 ~ Ф1 Ф1 = е(Ф1), е —
единичный элемент группы G;
2) симметричность (поскольку Ф2 = д(Ф]_) = > Ф1 = д_1(Ф2),
д~х G G и, стало быть, Ф1 ~ Ф2 Ф2 ~ Ф1);
3) транзитивность (так как Ф1 = д{Ф2), Ф2 = /ДФз) = > Ф1 =
= (дЩФ3)).
Таким образом, классы конгруэнтных фигур не пересекаются.
Рассматриваемые в линейных геометриях пространства Г являются
либо линейными (векторными) пространствами, либо пространст­
вами, производными от линейных. Ближайшими к нам примерами
служат: евклидова геометрия (Г = Е, G = Iso(E)) и аффинная гео­
метрия (Г = A, G = Aff(A)). Уже эти две геометрии различаются
множествами изучаемых фигур. Элементарная евклидова геометрия
на плоскости имеет дело с прямыми, углами, треугольниками, окруж­
ностями и т.д. и с соотношениями между линейными и угловыми
элементами различных фигур. В аффинной геометрии приходится
отказаться от всего, что обусловлено расстоянием между точками.
Остановимся на некоторых простейших свойствах фигур в аффин­
ной и евклидовой геометриях.
Т е о р е м а 7. Пусть (Е, V, р) — евклидово пространство. Лю­
бые две плоскости П, П' Е Е тогда и только тогда G-конгруэнтны
(G = Iso(E)), когда dim П = dim П'. В частности, все точки кон­
груэнтны. То же самое верно в случае аффинного пространства
(А, V ) и группы G = Aff (А).
Д о к а з а т е л ь с т в о . Действительно, если П = р + £/, П' = р/ + U1
и /(П) = П', / G G, то Df(U) = £/', а так как det / := det D f ф 0, то
dimG = dimG', откуда по определению dim lt = dinin' .
Обратно: пусть dim lt = dim lt' = т. Выберем в U (соответ­
ственно в U') ортонормированный базис (ei,...,еш )(соответственно
(е'ь ...,e^J) и дополним его до ортонормированного базиса е* (со­
ответственно еД всего векторного пространства V. Существует ор­
тогональный линейный оператор Т : V —>V, для которого — е'.
Движение / с f ( p ) = p r и D f = Т будет переводить П в П'.
В случае аффинного пространства (А, V ) рассуждения совершен­
но аналогичны. Не нужно лишь заботиться об ортонормированности
и ортогональности. □
§ 3. Группы и геометрии 203

Отмеченную в формулировке теоремы 7 конгруэнтность точек


выражают ещё словами: группа G действует транзитивно на точках
пространства Е (соответственно А). Транзитивность — важнейшее
свойство группы G и отвечающей ей геометрии, без которого мы ли­
шились бы возможности “сравнивать” различные фигуры. В случае
аффинной геометрии группа Aff (А) обладает гораздо более сильным
свойством.
Т е о р е м а 8. В аффинной геометрии любые две системы {ро, • • •
... ,Рт} и jpg, ...,р 'т} в (А, У) из т + 1 точек, 0 ^ т ^ п, находя­
щихся в общем положении, конгруэнтны.
Д о к а з а т е л ь с т в о . Дополним данные системы до систем точек
{ро,...,рп} и {р'о, • • • ,р'п}, п = dim А, также находящихся в
общем положении. По определению это значит, что векторы
(ei = popl, ..., en = роРп) составляют один базис пространства V ,
а (е^ = р'0р { ,... ,е'п = р'ър'п) — другой базис. Найдётся невырожден­
ный линейный оператор Т : V —УV с . Положив f(po + х) =
= р'0 + JAx, мы получим искомое аффинное преобразование / : А —>А,
переводящее pi в р1^ г — 0,1,. .. , п. □
Ясно, что теорема 8 перестаёт быть верной в евклидовой гео­
метрии уже при т — 1, ибо для 18о(Е)-конгруэнтности пар точек
р, q и р1 необходимо, чтобы выполнялось условие р(р, q) = р(р1, ф).
Впрочем, это условие и достаточно, что можно усмотреть из дока­
зательства теоремы 7.
Геометрический смысл аффинных автоморфизмов виден также
из следующих рассуждений. Рассмотрим произвольное биективное
отображение / : А —у А, для которого
Й = Х й => f ( r ) f ( s ) = Xf(p)f(q) VA е «. (15)
(поле R здесь можно заменить любым другим полем). Геометрически
это значит, что / переводит коллинеарные точки в коллинеарные
или, что то же самое, аффинную прямую отображает на некоторую
другую аффинную прямую.
Положив F(p$) = f{p)f{q), мы видим (при А = 1), что отобра­
жение Т : V —>V не зависит от выбора точек г, s G А, для которых
r t = р$, а целиком определяется самим вектором р$. Докажем, что
определённое так отображение Т линейно. Условие T{\w) — AJF(v)
вытекает из определения Т и из условия (15). Любые два вектора
u, v G V можно представить в виде v = v = qft для некоторых
точек р, ф г G А, поэтому u + v = J^ + g^ = J^H
• 4 й + v) = f(p) f ( r ) = f(p) f(q) + f(q) f ( r ) = Fxi + Tv.
Стало быть, T — линейный оператор на V. Для любой точки q = р + х
имеем
Яя) = Яр) + f(p) f(q), Яр) f{q) = НЙ) =
204 Гл. 4 • Аффинные и евклидовы точечные пространства

откуда f(p + х) = f(p) + JFx, т.е. биективное отображение / , обла­


дающее свойством (15), обязательно является аффинным преобразо­
ванием.
Обратное также верно: если / — аффинный автоморфизм с ли­
нейной частью Т и если г£ = А- ^ 'т~/— Л/W— тт г/ ’4
_ — д у) д_ ? так
Т(р<$) = f(p) f(q)- Нами доказана
Т е о р е м а 9. Свойство (15) биективного отображения / : А —>•
—>А является характеристическим для аффинных преобразований.
Рассмотрим теперь специальный случай, когда р, ф г — три точки
на одной прямой (как говорят, коллинеарные точки) и р Ф q. Тогда
найдётся такое число Л, что
pfi = Ар$. (15')
О п р е д е л е н и е 2. Число Л в формуле (15') называется простым
отношением коллинеарных точек р, ф г и обозначается [р, ф г].
Понятно, что из теоремы 9 вытекает
С л е д с т в и е . Аффинное преобразование / пространства А
сохраняет коллинеарность точек и простое отношение тройки
коллинеарных точек.
Формула (15'), переписанная в “аддитивной” форме г — р —
— А(д —р), означает попросту, что любая точка г на прямой П
записывается в виде г = (1 —А)р + Aq. В частности, в аффинной гео­
метрии имеет смысл отношение между: образ внутренней точки г,
0 < А < 1, остаётся внутренней точкой отрезка pq. Мы уже отме­
чали раньше, что длина отрезка — понятие евклидовой геометрии,
но середина отрезка — аффинное понятие.
5. Аффинные преобразования евклидова пространства.
Эффект воздействия аффинных преобразований в окружающем нас
мире наблюдается повсеместно. Простейший пример — растяжение
резиновой ленты. Отметим более аккуратно ещё несколько фактов.
В § 2, и. 4 мы условились понимать под объёмом vn паралеллограмма
P(dpi, ..., дрп) со сторонами dpi,. .., орп величину vn = | det (ftij)li 5
где (aij) — матрица перехода от ортонормированного базиса ( f i , . . .
. .., f n ) евклидова векторного пространства V к базису ( e i , . .., еп),
е^ = бр^, i = 1,... ,n. С другой стороны, если g — аффинный авто­
морфизм с линейной частью Q, то объёмом параллелепипеда, постро­
енного на векторах Qei , . .., Qen (точнее, на отрезках, отождествля­
емых с этими векторами), будет v'n = |det(5j^)|, где матрица (bjk)
вычисляется по следующему правилу. Пусть
п
§ 3. Группы и геометрии 205

Тогда
У уbjkfj := б^к — У ^ = У ^Qjfe ^ ^9jifj = ^ ' (^ ^ , 9jiaik)fji
3 г г 3 3 i
т.е. bjk = Е ; < № , откуда
В = GA
Следовательно,
*4 = |det(b^)| = | det G| • гп = |detp| -гп.
Мы пришли к следующему выводу.
Т е о р е м а 10. При аффинном преобразовании п-мерного евк­
лидова пространства объём параллелепипеда, построенного на п
векторах, умножается на абсолютную величину определителя пре­
образования. Другими словами, при аффинном преобразовании от­
ношение объёмов параллелепипедов сохраняется.
То же самое относится и к объёмам любых других фигур в ев­
клидовом пространстве.
Следующее утверждение имеет наглядный геометрический смысл.
Т е о р е м а 11. Всякое невырожденное аффинное преобразование /
п-мерного евклидова пространства (Е, V) есть произведение:
1) сдвига на некоторый вектор;
2) движения, оставляющего неподвижной некоторую точку б;
3) аффинного преобразования /г, являющегося композицией п
сжатий (растяжений) вдоль взаимно перпендикулярных осей, пере-
секающихся в точке о.
Д о к а з а т е л ь с т в о . Действительно, согласно теореме 2 / =
= ta • д, где д{о) = о для некоторой точки о. Если Q — линейная
часть преобразования д, то согласно теореме 15 из § 3 гл. 3 Q — VH,
где V — ортогональный линейный оператор на V, а В — положи­
тельно определённый симметричный оператор. В соответствии с тео­
ремой б из § 3 гл. 3 выберем в Е прямоугольную систему координат
{б; e i , ..., еп}, в которой оператор В принимает канонический вид:
Не; = А;е;, А; > 0, г = 1,...,п.
Тогда
f = ta - d - h , d(d + х) = б + Т>х, h(d + х) = б + ?{х, (16)
так что d — движение пространства Е, a h — аффинное преобразо­
вание, которое можно ещё записать в виде произведения
h = hih2 . . . h n. (17)
Здесь hk — аффинное преобразование с линейной частью Ни:
Hk^i = при i ф к] Вк^к — Ак^к-
Формулы (16) и (17) дают искомое разложение аффинного преобра­
зования /. □
206 Гл. 4 • Аффинные и евклидовы точечные пространства

6. Выпуклые множества. Вспоминал определение барицентри­


ческой комбинации точек (из § 1, п. 5)
Р — ^ОРО + M p i + . . . + А т Р г т Ао + A i + . . . + А ш — С (18)
и барицентрических координат, мы замечаем теперь, что при т — 1
точки р = АоРо + Aipi, Ао + Ai = 1, пробегают
всю прямую Пр0 . Если же дополнительно 0 ^
^ A i ^ l , i = 0,l, то получится отрезок pofii.
При т — 2 точки р = А0ро + Aipi + А2р2, А0+
+Ai + А2 = 1, Ai > 1, i = 0,1,2, пробегают от-
Рис. 8 крытый треугольник с вершинами ро, pi, р2.
Действительно, внутренняя точка р треугольника будет внутрен­
ней точкой отрезка poq, где q — внутренняя точка отрезка р\р2.
Имеем
Р —АоРо + Аср Ао + А = 1, Ао > 0, А > 0,
q = a±pi + а 2р 2 , а± + а2 = 1, а± >0, а2 > 0.
Стало быть,
р = А0ро + Ma iPi + а 2Р2 ) = А0ро + Aipi + А2Р2 ,
где Ai = Аад > 0, А2 = Аа 2 > 0 и Ao + Ai +А2 = 1 (прямые вычисления
или упр. 4 из § 1).
Обратно: если р = А0ро + Aipi + А2р2 и А0 + Ai + А2 = 1, А* > 0,
i = 0,1,2, то р = А0ро + А(/, где А = Ai + А2 > 0, А0 + А = 1 и
q = а±р± + а 2р2, а± = Ai/(Ai + А2), а 2 = A2/(A i + А2), так что а± > 0,
а 2 > 0, ад + а 2 = 1. Итак, q — внутренняя точка отрезка p ip 2, а
р — внутренняя точка треугольника с вершинами ро,РиР 2 (рис. 8).
Рассуждая аналогичным образом, мы при т — 3 придём к тетра­
эдру, а при любом т ^ п — к симплексу. Именно, дадим следующее
О п р е д е л е н и е 3. Открытым т-мерным симплексом с верши­
нами в точках общего положения ро?Ръ---,Рт называется мно­
жество всех точек вида (18) с положительными барицентрическими
координатами Ао, Ai,. .., Am. Неотрицательные барицентрические
координаты относительно системы ро,_Ръ • • •,Рт соответствуют
точкам замкнутого симплекса с вершинами ро,_Ръ • • • ,Рт-
Т е о р е м а 12. Образом любого т-мерного симплекса при аффин­
ном автоморфизме является симплекс. Все т-мерные симплексы в
аффинной геометрии конгруэнтны.
Д о к а з а т е л ь с т в о . Это почти очевидно. Пусть / : А —> А —
аффинное преобразование с линейной частью — линейным операто­
ром Т : V V. Применяя / к обеим частям равенства (18) с А^ ^ 0
и используя предложение 2, i) из § 1, мы придём к равенству
f(P) —Ао/(ро) + Ai/(pi) + . . . + Amf(Pm),
§ 3. Группы и геометрии 207

означающему, что f(p) — точка симплекса с вершинами f(po),Pi, ...


• • • 5/ (jPm) • Последнее утверждение теоремы есть перефразировка
утверждения теоремы 8 . □
О п р е д е л е н и е 4. Пусть (А, V ) — аффинное пространство. Под­
множество М С А называется выпуклым, если вместе с любыми точ­
ками р, q оно целиком содержит отрезок pq.
Симплекс — важный пример выпуклого множества. Понятно, что
пересечение любого числа выпуклых множеств выпукло.
О п р е д е л е н и е 5. Пересечение всех выпуклых множеств, содер­
жащих данное множество М , называется выпуклой оболочкой мно­
жества М и обозначается С(М).
Очевидно, что С(М) — М в точности тогда, когда М выпукло.
Собственно говоря, ш-мерный симплекс с вершинами ро,... ,рт явля­
ется выпуклой оболочкой указанной системы точек.
П ре д л о ж е н и е 1. Пусть М — выпуклое множество, р Е А.
Тогда
С(М Up) = Upq, q е М.

Д о к а з а т е л ь с т в о . По определению отрезок pq, q Е М, при­


надлежит любому выпуклому множеству, содержащему М и р . Стало
быть, Uq^ m M Г С(М Up).
Обратное включение будет следовать из выпуклости множества
Upq, q Е М , проверкой которого мы и займёмся.
Пусть qi,q 2 С М. Тогда произвольным точкам г\ Е pqi, г 2 Е Щ2
отвечает точка г Е тДгг- Покажем, что
г Е pq, где q — какая-то точка из
М. Предположим сначала, что точки
p, qi, q2 не лежат на одной прямой.
Тогда они принадлежат своей аффин­
ной оболочке — двумерной плоскости
П = А(р, qi, q2 ), к которой мы вправе
применять обычную элементарную геометрию. В частности, мы за­
мечаем, что прямая П^у пересекает отрезок q\q2 в некоторой точке
q. Ввиду выпуклости М имеем включение q Е М (рис. 9). В таком
случае г Е pq, т.е. в этом случае всё доказано. Если же точки р, qi,
q2 лежат на одной прямой, то в качестве q можно взять просто одну
из точек qi,q 2 >□
Т е о р е м а 13. Аффинно-линейная функция / на выпуклой обо­
лочке S = C(po,pi, ... ,Рт) конечной системы точек pi, i = 0 , 1,...
... ,т (т.е. на симплексе), достигает своего максимума в одной из
вершин:
т а х / ( р ) = max/(pj).
peS г
208 Гл. 4 • Аффинные и евклидовы точечные пространства

Д о к а з а т е л ь с т в о . При т — 0 утверждение теоремы триви­


ально. Используем, далее, индукцию по т > 0. Считаем по предполо­
жению индукции, что максимум функции / на выпуклом множестве
М = С(ро,. . . , Pm—i) равен тах^<ш Ввиду предложения 1 вся­
кая точка s Е S содержится в некотором отрезке рт ф q Е М, и,
значит,
s=Pm + 0 ^ А ^ 1.
Если Т — линейная часть функции / , то
/(«) = / (Pm) + АТ{р^$), Т { р ^ ) = f(q) ~ f(Pm),
а поэтому
f(s) = (1 - X)f(Pm) + Af (q) ^ max {/(рга) ,/(<?)} ^ тах/(р*). □
г^га
Несложная теорема 13 относится к аппарату линейного програм­
мирования, имеющего прикладное значение.

УП РА Ж Н ЕН И Я

1. У бедиться, ч т о гр у п п а A i ( ¥ p ) автом орф изм ов аф ф инной прям ой над полем


из р элементов (р п ростое) им еет порядок р(р — 1). К акой группе и зом орф на
A i(F 3 )?
2. Д а ть геом етри ч еское описание собствен ного движ ения / евклидовой плос­
кости, если

^ =^1! 'll’ №) = (AD-


3. П ровести классиф икацию собствен ны х движ ений четы рёхм ерн ого евкли­
дова точечн ого п р о с тр ан ств а.

§ 4. П р о с т р а н с т в а с и н д еф и н и т н о й м ет р и к о й

1. И ндеф инитная м етрика. Под пространством со скалярным


произведением мы условились понимать векторное пространство V,
рассматриваемое вместе с фиксированной невырожденной квадра­
тичной формой
Я(х ) = / ( х , х) = Е dijXiXj.
ЬЗ
Евклидовы и эрмитовы (унитарные) пространства, соответствую­
щие положительно-определённой форме q (обычной или эрмитовой),
нами рассмотрены достаточно подробно. Важную роль играют также
пространства с так называемой индефинитной метрикой, отвечаю­
щей неопределённой форме q. Как известно из § 4 гл. 1, при надле­
жащем выборе базиса (е^) пространства V невырожденная форма q
§ 4 • Пространства с индефинитной метрикой 209

принимает нормальный вид


q(x) = х\ + ... + х\ - x 2s+1 - ... - х 2п (1)
(основным полем теперь считается Ж). Скалярным произведением на
V будет
(х Iу) := х гуг + ... + x sys - x s+1ys+1 - ... - х пуп.
Чтобы оставаться в вещественной области, будем говорить только
0 квадрате нормы (длины) ||х||2 = (х | х) вектора х, которая может
принимать как положительные, так и отрицательные значения при
1 ^ s ^ п —1. Вектор х будем называть изотропным, если ||х||2 = 0.
На аффинном пространстве Е, связанном с векторным простран­
ством V , определён квадрат “расстояния”
S п

Р2 {р, я) = ^ 2 ( У г - Хг)2 ~ ^ 2 ( У г - Х{ ) 2
2=1 i= s+ l

между точками р(хi , . . . , хп), q(yi, . . . , уп) Е Е.


Квадратичная форма (х | х) называется ещё метрической фор­
мой векторного пространства V , a p2{p,q) — метрической формой
аффинного пространства Е. При 1 ^ s ^ п —1 пространство Е назы­
вается псевдо евклидовым, а при s = 1 говорят ещё о пространстве
Минковского (иногда к нему относят случай s = п — 1, но это не­
существенно: замена формы q на —q). В случае п = 4 пространство
Минковского отвечает физическому пространственно-временному
континууму и играет важную роль во всех вопросах, связанных со
специальной теорией относительности.
2. Псевдоевклидовы движения. Согласно общей концепции,
изложенной в § 3, п. 4, геометрия псевдоевклидова пространства
определяется группой G псевдоевклидовых движений, которая по­
рождается подгруппой Т параллельных переносов (сдвигов) и ста­
ционарной подгруппой 0 (s ,n —s) некоторой фиксированной точки
о G Е (подгруппой, оставляющей о на месте). При s — п мы имеем
ортогональную группу 0(п) = 0(п, 0). В общем же случае “псев-
доортогональная” группа 0 (s ,n — s) состоит из линейных опера­
торов T \ V —>V, сохраняющих форму (1). Говорят также, что
0( s , n —s) — группа автоморфизмов формы q.
В выбранном каноническом базисе (ei,...,en) пространства V
форма (1) имеет матрицу
Es 0
0 —-L F,^n—S
а оператор Т G 0( s , n —s) — матрицу F такую, что

Чтобы это понять, надо вспомнить закон изменения матрицы квад­


ратичной формы при переходе к другому базису, в данном случае —
14 А .И. К о стр и к и н
210 Гл. 4 • Аффинные и евклидовы точечные пространства

к базису (jTei,. .., JTen). Очевидно, как и в случае ортогональной


группы, det Т — det F = =Ы. Если det F = 1, то говорят, что Т —
собственный автоморфизм формы q, а аффинное преобразование
/ : Е —>Е с D f — Т — собственное “псевдоевклидово” движение.
Заметим ещё, что автоморфизм Т формы q переводит изотропные
векторы в изотропные, поскольку q(Fx, Fx) = q(x, х) = 0.
3. Группа Лоренца. Как уже отмечалось, четырёхмерное ве­
щественное пространство с невырожденной симметричной метрикой
сигнатуры (1,3) занимает особое место.
О п р е д е л е н и е 1. Группа 0(1,3) называется группой Лоренца и
обозначается L.
В этом случае стандартными являются обозначения
V = (е0,еь е2,е3),
х = te0 + xiei + ж2е2 + ж3е3,
||х||2 = q{x) = t2 - х\ - х\ - х\.
Достаточно интересным является частный случай “одномерной
группы Лоренца” Li автоморфизмов двумерного пространства, со­
храняющих метрику
( u | u ) = t 2 - х 2.
Группа Li описывает физическое движение по прямой (у нас теперь
х — не вектор, а координата вектора u = teg + xei). Ясно, что все
изотропные векторы пропорциональны векторам ео + ei и ео - ец
Поэтому для оператора Т в силу его невырожденности имеются две
возможности:
Чео + ei) = а(е0 + ei), f ( e 0 - ei) = /?(е0 - ei),
^(е0 + ei) = а (е 0 - ei), ^(е0 - ei) = /3(е0 + ei).
Рассмотрим одну из этих возможностей, например, первую. Имеем
OL 3 а —в
Ле0 =
2 ео + 2 Gl
а - (3 OL-\~/3
=
2 в0 + 2 01
Матрица
a /3 а —/3
2 2
F =
а —(3 Qi И- /3
2 2
оператора Т имеет определитель det F = а/3. Ограничимся собствен­
ным преобразованием Лоренца, т.е. будем считать а/3 = 1. Для пре-
§ 4 • Пространства с индефинитной метрикой 211

образования координат получим


а 1+ а а 1 —а
*' ) -
х' ) -
2
<т-1 —а
2
2
а -1 + а
2
ел
откуда
OL (
^ Н- OL а ± —а \
t' = (t Н----—р - —х ),
2 V а 1+ а /
а~г + а (/<т-
оГ1 —аа
1 — \
X =
Va-1 + а /
Введём обозначение
а —а -1 а 2 —1
-1
OL OL = V= а 2 + 1'
(2)
Ещё один повод к недоразумению: у нас г? — скаляр, а не вектор,
как было раньше. Рассматриваемая величина соответствует физи­
ческой скорости, а скорость принято обозначать буквой v. Заметим,
что всегда |i?| < 1, и поэтому имеют смысл выражения, вытекающие
из соотношения (2):
1 —v 1 —v
а2 = а =
1 + V’ 1+ v ’
OL OL-1
2 л/ l —V2
Наконец, получаем
t —vx х —vt
*' = ж = (3)
л/Г3 гг л/1 —V2
Эта элегантная формула записана в масштабе, когда скорость
света принята за единицу. В обычном масштабе преобразования при­
няли бы вид
t —v x / с2 х —vt
*' = (з')
у/1 —V2/с2 ’ уЛ —V2/с2
Они соответствуют квадратичной форме с2£2 — ж2. Будем для
простоты пользоваться формулой (3). Замечательно, что уравнения
электродинамики Максвелла не меняются в результате применения
преобразования Лоренца и Эйнштейн, следуя мысли, впервые выска­
занной математиком А. Пуанкаре, предположил, что все физические
законы не должны меняться от преобразований Лоренца (при п = 4).
Этим было положено начало специальной теории относительности.
Мы не останавливаемся на физической интерпретации и на следст­
виях формулы (3). Заметим лишь, что при скорости г, близкой к
и
212 Гл. 4 • Аффинные и евклидовы точечные пространства

нулю (малой по сравнению со скоростью света), преобразования (3 )


принимают вид преобразований Галилея:
t' = £, х 1 —х —vt.
Однако в общем случае положение точки характеризуется двумя ко­
ординатами (£, х ) — временной и пространственной. Положениям
(xi,ti), (x2,ti) с одним и тем же t = Ч, в первой (неподвижной) сис­
теме координат соответствуют различные t[, t 2 во второй системе.
Отсюда получается, например, закон изменения длин
. . Х\ —vti Х2 —vti Х\ —Х2
Хл —Х2 = . ----- . = .
л/ 1 —V2 л/ 1 —V2 л/ 1 —V2
Наоборот, при х\ —Ж2, Ч ф 1 2 получаем закон изменения времени.
Если f v — преобразование Лоренца (3 ), определённое параме­
тром Г, то
9v 1 * 9 v2 = 9v •
Найдём параметр (скорость) г. Положив
, _ t - ViX , X —V\ t
T, = ----------- .
I—1
1
<2

л/1 -
„ t' - v2 x' „ x' - V2 tf
1 — v2 X л/l- « Г
получим
• - V2(x - V\t) t - (v1 + V2 )x/ (1 + V1V2)
t" :
лД 'л *лД ^2 y / i - ((^ + у2)/( 1 + ^1^2))2
Значит,
Щ + Г2
^ = ГЗ-------’
1 + VIV2
что является просто законом сложения скоростей.
4. Собственная группа Лоренца. Что такое собственная
группа Лоренца, отвечающая квадратичной форме
<?(х ) = t 2 - х\ - х\ - x l (4 )
мы уточним чуть позже. В одномерном случае для преобразования
Лоренца мы получили явную формулу (3 ). Формула общего преобра­
зования, сохраняющего д(х), выглядела бы довольно громоздко. По­
этому мы изберём несколько иной путь описания группы L. Именно,
рассмотрим пространство всех эрмитовых матриц порядка 2
t - x 3 x2 —ix 1
x2 + ix 1 t + x 2 (5)

Здесь х = (£, ж1,Х2,хз) — вектор из четырёхмерного вещественного


пространства R4 . Соответствие между векторами и эрмитовыми
§ 4 • Пространства с индефинитной метрикой 213

матрицами взаимно однозначно и линейно:


Г*ПХ+Зу = (ЗРу-
Каждой комплексной матрице
(5
А= а5 —(37 = 1,
7 й

т.е. каждому элементу группы SX2(C), поставим в соответствие


преобразование Гл в пространстве эрмитовых матриц, полагал
Га (Рх) = А - Р х -А*.
Легко видеть, что
(Гд(Рх)}* = А**Р*А* = Гд(Рх),
где А* = *Л — обычное эрмитово сопряжение. Так как
Гл(Г в (Рх)) = АВРХВ*А* = АВРХ(АВ)* = ТАВ(РХ),
ТО

Гл Гб = Гл б ,
причём оператор Гл линеен:
Гa {olP^ + /ЗРу) = аГл(-Рх) + Р Гл(Т> у ).
Обратим внимание на то, что
det А • det Рх *det Л* = det Рх,
поскольку det А = det Л* = 1 по условию. Но
det Рх = £2 —х\ —х\ —х\.
Значит, линейный оператор Гл не меняет квадратичной формы (4).
В частности, d e tl^ = ±1. На самом деле из простых топологичес­
ких соображений (непрерывность функции det и связность группы
SZ/2(C)) следует, что det Гл = +1. Мы примем это на веру, хотя при
небольшом усилии этот факт можно установить.
Уравнение
t2 —х\ —х\ —х\ — 0 (6)
определяет в R4 конус — специальную поверхность второго порядка
(или, как мы будем говорить в следующей главе, квадрику), на ко­
торой лежит целиком прямая, проходящая через начало координат
и через любую точку на поверхности. Условие t > 0 выделяет так
называемую верхнюю полость конуса (6).
Далее, неравенства
t > 0, t2 —х\ —х\ —х\ > О
дают необходимые и достаточные условия положительной определён­
ности матрицы Рх или, что то же самое, положительной определён­
ности соответствующей квадратичной формы (см. гл. 1, § 4, и. 8).
214 Гл. 4 • Аффинные и евклидовы точечные пространства

Ясно, что эти условия положительной определённости сохраняются


и для матрицы
Гл(Рх)=^'Рх'^*.
Значит, линейный оператор Гл сохраняет не только конус (6), но и
его верхнюю полость.
Резюмируем свойства Гл:
1) Гл является автоморфизмом квадратичной формы (4);
2) det Гл = 1;
3) Гл сохраняет верхнюю полость конуса (6).
О п р е д е л е н и е 2. Всякий линейный оператор R4 —у R4, удовлет­
воряющий условиям 1)—3), называется собственным преобразованием
Лоренца, а группа L+ всех таких преобразований — собственной
группой Лоренца.
На самом деле гомоморфизм Г является эпиморфизмом (см.
упр. 3). Найдём ядро КегГ. Пусть
Рх = Я • Рх • Я*
для любой эрмитовой матрицы Рх (условие Гл = £). В частности,
при е = (1,0,0,0) имеем Ре = Е и АА* = Е, откуда А * = Я-1 .
Таким образом,
АРХ = РХЯ.
Выбирая различные независимые матрицы Рх, получим А = а Е , а
так как det Я = 1, то а = ±1. Стало быть, КегГ = {ЕЕ}.
Мы получили следующее утверждение.
Т е о р е м а 1. Соответствие Г : Я Гл между комплексными
матрицами второго порядка с определителем 1 и собственными
преобразованиями Лоренца является гомоморфным отображением
группы SX2(C) на группу L+ всех собственных преобразований
Лоренца. Каждому собственному преобразованию Лоренца отве­
чают ровно две комплексные матрицы А и —Я, различающиеся лишь
знаком.
Имея в виду теорему 1, часто группой Лоренца называют SX2(C),
хотя правильнее было бы говорить о факторгруппе SX2(C)/{=bE}.
Так как по определению форма q(x) инвариантна относительно
преобразований Лоренца, то эти преобразования переводят в себя
поверхности Sc, заданные уравнениями
t±2 —х 21 —х2
2 —х3
2 = с, с г-
G тМ
п).
Если с > 0, то Sc — двуполостный гиперболоид; если с < 0, то Sc —
однополостный гиперболоид; наконец, So — конус (терминология,
заимствованная из аналитической геометрии трёхмерного прост­
ранства, будет активно использоваться нами в следующей главе). На
каждой из этих поверхностей (в отдельности на каждой полости ги­
перболоида или конуса) Гл является движением в том же смысле, в
§ 4 • Пространства с индефинитной метрикой 215

каком ортогональный оператор на Еп определяет движение на сфере


5 n_1 (движение — преобразование, сохраняющее расстояние между
точками).
Верхняя полость двуполостного гиперболоида
t2 —х\ —х\ —х\ — 1, t > О,
с определённой на ней группой движений L+ (или 51/2 (С)) представ­
ляет собой одну из моделей пространства Лобачевского А3. Мы не бу­
дем пока останавливаться подробно на самом понятии пространства
Лобачевского, но обратим внимание на одно обстоятельство. Группа
движений G какого-либо пространства S лишь тогда представляет
интерес, когда любую точку р Е S можно перевести в любую другую
точку q Е S некоторым движением g Е G: g(p) = q, или, что экви­
валентно, любая точка q Е S является образом относительно д Е G
некоторой фиксированной точки ро Е S. Мы уже отмечали в § 3, что
группа Aff (А) действует транзитивно на аффинном пространстве А,
a Iso(E) — на евклидовом пространстве Е. Группа 0(п) действует,
очевидно, транзитивно на сфере 5 n_1 С Мп (как это проще всего
обосновать?).
Покажем теперь, что собственная группа Лоренца L+ транзи-
тивна на А3. Для этого точке х = (t,x 1,Ж2,^з) £ А3 сопоставим, как
и ранее, эрмитову матрицу Рх (см. (5)). Она будет положительно
определённой и иметь определителем 1. Как нам известно, любую
такую матрицу можно представить в виде

р х = а - а * = а ( 1 J )т,

где А = ^ ^ J — комплексная матрица с определителем 1. Это

и означает, что Рх получается из фиксированной матрицы ^ ^ ^ ^


при помощи движения Г^.
Стационарной подгруппой L+o точки xq = (1,0, 0,0) служит со­
вокупность всех Г с
а

i h ' - a !)•
Другими словами, А • А* — Е. Так как ещё det А = 1, то мы за­
ключаем, что
L+ ^ SU(2)/{±E} = 50(3)
(последний изоморфизм будет установлен в [ВА III]; нам он пока не
понадобится). Движения пространства А3 называют ещё гиперболи­
ческими вращениями.
216 Гл. 4 • Аффинные и евклидовы точечные пространства

УП РА Ж Н ЕН И Я

1. Р а с с м о т р е т ь подробно вторую возм ож ность для действия оп ер ато р а


J GLi .
2. Д о к а за ть , ч т о d e tT ^ = 1 для линейного оп ер ато р а Г ^ , определённого
в п. 4.
3. Д о к а за ть , ч т о гом ом орф изм

Г : S L 2(С) L+

яв л яется на самом деле эпим орф измом , т.е. отображ ен и ем на всю гру п п у L + .
4 . П р о ч и т а т ь § 12 в ч асти 2 учебного пособия [2], ч то б ы усилить для себя
ф изически й аспект, присущ ий п р о с тр а н с тв у М инковского и группе Л оренца.
ГЛАВА 5
КВАДРИКИ

Геометрические фигуры аффинной и евклидовой геометрий, ко­


торые будут изучаться в этой главе, знакомы читателю из курса
аналитической геометрии. Используемая терминология — кривые,
поверхности и т.д. — та же самая. Но мы уже видели в конце преды­
дущей главы, что возникает настоятельная необходимость выйти за
пределы трёхмерного пространства. Чисто алгебраическая класси­
фикация поверхностей 2-го порядка в многомерных пространствах
не очень сложна: надлежащий аппарат имеется в нашем распоряже­
нии, хотя наглядное геометрическое воображение, вероятно, отойдёт
на второй план. Важное место займёт изучение геометрических объ­
ектов с проективной точки зрения.

§ 1. К в а д р а т и ч н ы е ф ун к ц и и
1. К вадрати чн ы е функции на аффинном пространстве.
Пусть А — аффинное пространство, ассоциированное с векторным
пространством V размерности п над полем Я. Будем смотреть на
Я как на одномерное аффинное пространство Яа. Например, множе­
ство Е вещественных чисел есть в то же время вещественная аф­
финная прямая Мд = Е, на которой действует одномерная аффинная
группа (см. § 1, 3 гл. 3).
По аналогии с билинейными формами / : V х V —>Я определяются
биаффинные функции.
О п р е д е л е н и е 1. Функция Ф: А х А —>Я называется биаффин-
нощ если Ф(р, q) при фиксированной точке р Е А или при фиксиро­
ванной точке q является аффинным отображением q \-у а Е Яа (или
р и-» a Е Яа). Биаффинная функция называется симметричной, когда
Ф(р,д) = Ф(д,р) Vp,<?e А.
Мы не будем доказывать тот факт, что если выбрать какую-то
точку о Е А в качестве “начала” и положить р = б + х, g = б + у, то
любая биаффинная функция Ф выражается в виде
Ф(о + х,о + у) = /(х ,у ) I(х) +/' (у) +ifio, (1)
где / — билинейная форма на У, а ро = Ф(б, 6) — скаляр. Зафикси­
ровав вектор у = а и положив
h{o) = /'(а) + р о, Dh(x) = /(х , а) + Z(x),
мы без труда убеждаемся в том, что действительно отображение
р = о + х и-» h(o + х) = h(o) + Dh(x)
218 Гл. 5. Квадрики

аффинно-линейно, с линейной частью — линейной функцией Dh :


V -э Я.
Для простоты мы возьмём (1) за определение биаффинной функ­
ции, мотивируя его обоснованность предыдущими замечаниями. Те­
перь легко проверяется, что симметричная биаффинная функция Ф
имеет запись
Ф(о + х,6 + у) = Дх,у) +Z(x) +/(у) (2)
с симметричной билинейной формой / : V х V —>Я, линейной функ­
цией I: V —>• Я{1' = I) и скаляром = Ф(б, б) G Я.
О п р е д е л е н и е 2. Положим Q(p) = Ф(р,р), где Ф имеет вид (2),
и назовём Q : А —>Я квадратичной функцией на А.
Пусть q — квадратичная форма на V: q(x) = /(х,х). В соответ­
ствии с (2) имеем
Q(o + х) = <Дх) + 2/(х) + (ро (3)
Взяв систему координат {б; e i , ..., еп} в А с началом в точке б, мы
получим координатную запись значения квадратичной функции Q:
п п
Q(o + х) = ^ ipij XiXj + 2 cpiXi + щ (4)
i,j=1 2=1
в точке р = б + х, х = x\ei + ... + х пеп. Здесь коэффициенты со­
ставляют симметричную матрицу F = Сравнивая (3) и (4), мы
замечаем, что в любой другой координатной системе Q(p) запишется
аналогичным образом, т.е. в виде многочлена степени ^ 2, хотя и с
какими-то другими коэффициентами.
Пусть х [ , . . . , х'п — координаты точки р = д' + х' в системе ко­
ординат {б'; e'l5. .., е^}. Как мы знаем (см. (3) из § 1 гл. 4), старые
координаты х \ , . . . , х п выражаются через новые по формулам
п
Xi = ^ ClijXj + bi, i = 1, . . . , П,
2=1
с невырожденной матрицей А = (а™). В новых координатах матри­
цей квадратичной формы q будет *А • F • А (см. (5) из § 4 гл. 1). В
частности, её ранг г является инвариантом относительно аффинных
преобразований и имеет смысл положить
rankQ := rankg = г.
2. Центральные точки для квадратичной функции. Введём
ещё одно полезное понятие, для чего рассмотрим значение Q в точке
q = р + у = б + х + у £ А . Непосредственно из (3) получаем
Q(q) = Q(p + у) = Q(o + X + у) = q(x + у) + 2Z(x + у) + <Р0,
т.е.
Q(q) = Q(p) + q(y) + 2{/(х, у) + 1(у)} (5)
§ 1. Квадратичные функции 219

(напомним, что / — симметричная билинейная форма, полярная к q).


О п р е д е л е н и е 3. Точку р Е А назовём центром (или централь­
ной точкой) для квадратичной функции Q, если
Qip + у) = Qip) + я(у) Vy g V. (б)
Множество всех центров квадратичной функции Q обозначается сим­
волом C(Q). Про квадратичную функцию Q с C(Q) ф 0 говорят, что
она центральная.
Сравнение (5) и (6) показывает, что условие р = о + х Е C{Q)
записывается в виде
/(х , у) + /(у) = О Vy G Г. (7)
В частности, точка о центральная, когда в формуле (3) линейная
функция I нулевая. Другими словами, если начало координат о —
центральная точка, то выражение Q(o + х) не содержит членов пер­
вой степени относительно яд,... ,жп. Для b Е C(Q) условие (7) цен­
тральности точки о1 — о + b принимает вид / ( Ь,у) = 0. Значит,
g(b) = / ( b, b) = 0. Вспоминая, что ро = Q(d), мы получаем из (3)
равенство Q{o') = Q{6). Таким образом,
б,б' e C ( Q ) ^ Q ( 6 ) = Q ( 6 ' ) . (8)
Как узнать, является ли квадратичная функция Q, заданная фор­
мулой (3) или (4), центральной? А если она центральна, то как найти
множество C(Q)?
Для решения этих вопросов нужно исходить из условия (7), экви­
валентного, как легко понять, системе уравнений
/ ( е Ь х ) + 1 (ег) = 0, i = 1 , 2 ,... ,п.
Для координат вектора х = аде! + ... + жпеп,определяющего цен­
тральную точку р = б + х, получается, таким образом, система ли­
нейных уравнений
п
^P ijX j = -<fii, г= 1 , . . . , п, (9)
3= 1
совместность которой проверяется при помощи теоремы Кронеке-
ра—Капелли. В случае совместности системы (9) множество C(Q)
будет либо точкой (случай det F ф 0), либо, как это следует из упо­
мянутой теоремы, аффинным подпространством размерности п —г.
Направляющая плоскость U этого подпространства совпадает с
пространством решений линейной системы
п

3= 1
так что
U = Ker q = Кег /
220 Г л. 5. Квадрики

(напомним, что Keiq = {х Е V\ /(х, у) = 0 Vy Е У}).


Нами доказана
Т е о р е м а 1. Множество центров C{Q) квадратичной функ­
ции Q, заданной в системе координат {о; ei,. .., еп} соотно­
шением (4), состоит из точек р = о + х, определяемых линейной
системой (9). Если о' — о + х' — центральная точка, то
C(Q) = 6'+ U
— аффинное пространство с направляющей плоскостью U = Kerg.
Далее, C(Q) = 0 = > г < щ C(Q) — аффинно инвариантное образо-
вание, зависящее только от функции Q.
3. Приведение квадратичной функции к каноническому
виду. Две квадратичные функции Q и Q' на А аффинно эквива­
лентны, когда существует аффинный автоморфизм g Е Aff(A) такой,
что Q’ = Q • д.
Естественное желание иметь для Q(p) наиболее простое выраже­
ние реализует
Т е о р е м а 2. Пусть Q — квадратичная функция ранга г на
п-мерном аффинном пространстве А над Я. Если множество C(Q)
пусто и, значит, г < п, то путём надлежащего выбора системы
координат {б; еi,...,еп} функция Q приводится к виду
<2(6 + х) = а \х \ + ... + а гх\ + 2xr+i (10)
с ненулевыми скалярами ад, . . . , ад; в этом случае Kerq есть подпро­
странство решений системы х\ — ... — х г — 0 (q — квадратичная
форма, связанная с Q).
Если Q центральна, то выбором надлежащей системы коорди­
нат с началом в центральной точке о её можно привести к виду
Q(d + х) = oi\x\ + ... + oirx ^ + (/?о; (11)
в этом случае Q{o') = сро для любой точки o' Е С(<2). Функции вида
(10) и (11) аффинно неэквивалентны.
Д о к а з а т е л ь с т в о теоремы проще, чем её формулировка. Вы­
берем сначала в V канонический базис для квадратичной формы q
(см. § 4 гл. 1). В соответствующей системе координат {<У; е[ , . .., е^}
функция Q примет вид
Q(or + х) = адж^ + ... + (хгх'г + 2fd'ix'i + ... + 2(5,пх ,п + Д
с ад ф 0, ..., ад ф 0. Перенос начальной точки в б", сводящийся к
замене координат
х ” = x'i + РУаи i = I , ... ,г,
х" = х\, г — г + 1,..., п,
сделает равными нулю коэффициенты при х " , . . . , х" в линейной
части, так что
Qip") = ад ж'/ + ... + ад ж" + 2f3"+kx"+k + ... + Pnx n + l ”•
§ 1. Квадратичные функции 221

Если не все /3" равны нулю (Д"+/е Ф 0), то ещё одна аффинная
замена координат
X i = X /, i = l,...,T,

Хг+1 = /З'г+ к х г + к + ••• + Рпхп + 7 ”/ 2>


X r+ 2 — % r_\-h •••ч %г+к — ^ т~\~к —15
%Г-\-к-\-1 ^r + fc+i} ^ ^ 1?
приведёт Q к виду (10). В противном случае Q с точностью до обоз­
начений будет иметь вид (11).
Итак, мы можем считать Q приведённой к виду (10) или (11). Так
как g(x) = \ \ + ... + а гх 2, то Kerg есть (п —г)-мерное подпрост­
ol x

ранство в V , заданное уравнениями х\ — ... = х г = 0. Предположим,


что р = о + х — центральная точка, р + у — любая точка. Тогда

Q(fi + У) = Q[p + X + у) = ^ a i(Xi + Vi)2 + 2(xr+1 + yr+1) =

= Q(P) + q(y) + 2 E a iXiVi


2=1
для вида (10) и
г

Q(p + у) = Q(p) + q(y) + 2 E a ix iVi


2=1
для Q вида (11). Условие (6) центральности точки р, которое должно
выполняться для произвольного у G У, в последнем случае сводится
к Ж1, . . . , жг = 0, т.е. к х G Kerg, а в первом случае из-за наличия
свободного члена 2yr+i оно вообще не может удовлетвориться, т.е.
C(Q) = 0. □
С л е д с т в и е . Над полем Е вещественных чисел всякая квадра­
тичная функция Q путём надлежащего выбора системы координат
{б; e i , ..., еп} в А может быть приведена, причём единственным
образом, к одному из канонических видов
Q(d + х) = х\ + ... + х\ - x 2s+1 - ... - х 2г + 2жг+1, (12)
Q{o + х) = х\ + ... + х\ - x 2s+1 - ... - х 2г + <ро- (13)

Д о к а з а т е л ь с т в о . Так как положительный индекс инерции s


квадратичной формы д, связанной с Q, и её ранг г инвариантны
относительно невырожденных линейных преобразований (теорема 5
из § 4 гл. 1), то теорема 2 даёт всё, что нужно. □
Следствию можно придать несколько иную формулировку:
Две квадратичные функции Q, Q' на А аффинно эквивалентны
тогда и только тогда, когда они имеют одинаковые ранги и одина­
ковые сигнатуры и когда они обе либо нецентральны, либо
222 Г л. 5. Квадрики

центральны с одинаковыми значениями на соответствующих


центральных точках.
4. Квадратичные функции на евклидовом пространстве.
В случае евклидова (точечного) пространства (Е, V ) естественно изу­
чать эквивалентность квадратичных функций относительно действия
группы изометрий Iso(E).
О п р е д е л е н и е 4. Две квадратичные функции Qi, Q2 на Е
называются Iso(E)-эквивалентными, если существует движение g Е
Е Iso(E), для которого Q2 — Q 1 ' 9, т.е. фгСЙ = Qi{g(p))-
Т е о р е м а 3. Любая квадратичная функция Q на п-мерном ев­
клидовом пространстве Е может быть приведена путём надлежа­
щего выбора прямоугольной системы координат {о; ei,...,еп} в Е
к одному из следующих видов:
Q(o + х) = Xixl + ... + \ гх 2 + (ро, о Е C(Q), (14)
Q(d + х) = AixJ + ... + \ rx 2r + 2/ixr+i, ji > 0. (15)
Bee вещественные числа Ai отличны от нуля. Указанные виды
определены однозначно с точностью до нумерации переменных Х{.
Д о к а з а т е л ь с т в о . Пусть Q(d' + х) = q(x) + 2Z'(x) + Q(o').
Начнём с выбора в евклидовом векторном пространстве V ортонор-
мированного базиса (е^,..., е^), в котором q имеет канонический
вид:
г п
ч(у) = Е + °> у = Е yiei■
2=1 2=1

Этот выбор обеспечивается теоремой 7 из § 3 гл. 3. Если Q — цен­


тральная функция, то, заменив в случае необходимости о1на центр о
(который отыскивается так же, как в аффинном случае), мы придём
к выражению (14). В случае же нецентральной функции имеем
г п
Q(°') + У —^ + ^ ViVi + ^0-
2=1 2=1

Совершив преобразование координат (перенос начала)


Zi = yi + (fi/Xi, г = 1 , 2 , . . . , г,
Zi = у и i = г + 1,... ,п,
получим
г п
Q(d + z) = AiZ2 + 2 /^г^г + 2/ice
2=1 2= Г +1

где из-за нецентральное™ Q не все /^, i > г, равны нулю. Введём


“норму”
9 — у / i i 2r+ 1 + ••• + 9 п > 0
§ 1. Квадратичные функции 223

линейной формы Y^i=r+i l1izi и сделаем преобразование координат


Xi= Zi, i = 1,2,... ,r,
E H'k . PO
---Zk H----- 5
Li Li
k=r+ 1 ^ ^

Xi= 1 i = r + 2,... ,n,


j = r+ 1
используя матрицу А размера (n —r) x (n —r):
V r + l/ /tr+2//U .. l^ n / ft
Clr+2,r+l «r+2,r+2 C^r-\-2,n
А=
^n,r+1 ^П,Г +2 (%n,n
Так как мы хотим использовать только прямоугольные реперы,
то матрицу А нужно брать ортогональной. Сумма квадратов эле­
ментов её первой строки равна 1, как и положено, а элементы ац
находятся в нашем распоряжении, поэтому ортогональная матрица
А может быть построена (см. по этому поводу и. 5 из § 1 гл. 3). После
подстановки будем иметь
г п
<5(о + х) = + 2(iXr+1, X=
2=1 2=1

как и требуется в формуле (15).


Однозначность типов (14) и (15) докажем, исходя из следующих
соображений. Согласно теореме о приведении к главным осям ква­
дратичной формы q ранг г и числа Ai определены единственным
образом. Число ipо = Q(6) не зависит от выбора центра о (см. (8)).
Нам осталось установить отсутствие произвола в выборе кон­
станты ji > 0 в формуле (15). Предположим, что в какой-то прямо­
угольной системе координат {<У; е [ ,..., е^} будет
г
Q(df + х) = ^ А^(ж-)2 + 2fi x'r+1, ii > 0.

Пусть Т — симметричный линейный оператор на V , соответст­


вующий билинейной форме / , полярной к q (см. и. 1 из § 3 гл. 3):
/(х,у) = (^х|у).
Его матрица
F = diag (Ai,. .., Ar , 0, .. ., 0)
имеет один и тот же вид в базисе (е^) и в базисе (е^). Значит,
1ш J~ ( ei , . . . , er) (е1, . . . , er),
224 Г л. 5. Квадрики

а поэтому матрица перехода от (е*) к (е') имеет вид


0 Ву
В =
В2 0
с ортогональными матрицами В\ размера г х г и В^ размера
(п —г) х (п —г). С учётом переноса начала координат и отсутствия
в выражениях для Q координат с номерами > г + 1 получаем

У А*ж- = У 2 А *(ж ')2 + 2г/,


i—1 i—1
2fixr+i = 2ii'x'r+1 —2z/, z/ G Е.
Отсюда
Xr_)_i _

м' •жг+1
, ^

В силу ортогональности В в выражении xr+i = Y l aj xj + должно


выполняться равенство ^2&? = 1, которое в нашем случае сводится
к соотношению
№ ) 2 = 1.
Отсюда вытекает нужное нам равенство /л1 — /л, поскольку /л1 ж/л
положительны. □

УП РА Ж Н ЕН И Я

1. С ч и тая 2s г > 0, н ай ти число классов эк вивалентны х нецентральн ы х


к в ад р ат и ч н ы х ф ункций на n -мерном вещ ественном аф ф инном п ростран ств е.
2 . Н ай ти C(Q) для к в ад р ати ч н о й ф ункции Q над К вида
п
ж?+ 2 ^ 2 X jX j + 2 ^ X i + 1.
i=1

§ 2. К в а д р и к и в аф ф и н н ом и евк л идовом
п ростран ствах

1. Общее понятие квадрики. Каждой квадратичной функ­


ции Q на А ставится в соответствие пространственная конфигура­
ция точек S q , называемая квадрикой (или поверхностью (гиперпо­
верхностью) второго порядка) и определяемая как “геометрическое
место” (множество) всех точек р £ А, удовлетворяющих уравнению
Q(p) — 0- При п = 2 квадрики называются ещё коническими сечения­
ми (кривыми 2-го порядка). Квадрики можно рассматривать (и они
действительно встречаются в различных задачах) над произвольным
§ 2. Квадрики в аффинном и евклидовом пространствах 225

полем Л, причём наиболее естественно брать в качестве Я алгебра­


ически замкнутое поле, например Я = С. Однако из соображений
наглядности (тоже, впрочем, несколько условной) мы ограничимся
случаем поля Я = Е. Здесь с самого начала удобно временно
исключить из рассмотрения так называемые “нулевые” квадрики,
на которых нет ни одной точки. Скажем, квадратичная функция
х\ + х\ + 1 определяет нулевую кривую. Более точно: в дальнейшем
предполагается, что квадрика Sq , заданная уравнением Q(p) = 0, —
непустое множество и что
rankSg := г = rankQ = rankg > 0.
Считаем также п ^ 2.
О п р е д е л е н и е 1. Квадрика называется двойным подпрост­
ранством, если она совпадает с аффинной плоскостью в А.
Например, уравнение х\ + . . . + х 2г = 0 в n-мерном пространстве А
равносильно системе х\ — 0, ..., х г = 0 и, стало быть, определяет
(п —г)-мерное подпространство. Определение двойного подпрост­
ранства не зависит от системы координат, поэтому квадратичную
функцию Q, определяющую S q , можно брать в каноническом виде.
Как показывает следствие теоремы 2, любое двойное подпространст­
во задаётся уравнением рассмотренного выше типа х\ + ... + х\ = 0.
Заметим, что двойные (линейные) подпространства х\ + х\ — 0 и
2х\ + Ъх\ — 0 изображают в трёхмерном пространстве одну и ту же
прямую х\ — 0, Х2 = 0. Ситуация совершенно меняется и становится
гораздо более удовлетворительной в случае квадрик, отличных от
двойных подпространств.
Т е о р е м а 1 (теоремаединственности). Если квадрика S не явля­
ется двойным подпространством, то любые два её уравнения (в
одной и той же системе координат) пропорциональны, т.е.
sQl=s = S q2 = > q 2 = XQu A g e *.
Д о к а з а т е л ь с т в о . По условию наша квадрика S задаётся дву­
мя уравнениями: Qi(p) = 0 и Q2 (p) — 0. Беглого взгляда на формулы
(12) и (13) из § 1 достаточно, чтобы убедиться в существовании на
квадрике S не менее двух различных точек. Более того, существуют
хотя бы две различные точки p,q G S такие, что проходящая через
них прямая Пр д не содержится целиком в S. В самом деле, иначе
в соответствии с теоремой 4 из § 1 гл. 4 квадрика S сводилась бы
к аффинному подпространству (плоскости), т.е. была бы двойным
подпространством. Легко видеть, что П П 5 = {p,q} — множество
из двух точек.
Зафиксируем две точки р, q G S с указанным свойством и выбе­
рем р за начало координат в А, а вектор р$ ф 0 — за последний
вектор базиса ( e i , . . . , e n) пространства V. Тогда П б у д е т состо­
ять из точек с координатами (0,..., 0, /3). Точка р имеет координаты
(0,..., 0, 0), a q — координаты (0,..., 0,1).
15 А .И. К о стр и к и н
226 Г л. 5. Квадрики

Распишем Qi по степеням координаты х п:


Qi(p + х) = 6х2п + 9{х 1, • • • ,x n- i) x n + ,.. . , х п- 1).
Здесь g — многочлен первой степени, a h — многочлен второй сте­
пени относительно яд,. . . , х п- \ (д и h не обязательно линейные мно­
гочлены). Тот факт, что Пр?д пересекается с S в двух разных точках,
означает, что трёхчлен
6х2п + #(0)жп + /г(0)
имеет два различных вещественных корня, т.е. g(0)2 —4Sh(0) > О
(на самом деле <5^0, д(0) ф 0, /г(0) = 0). Поделив на S, мы можем
считать с самого начала S = 1. То же верно и для Q2. Итак,
Qi(p + х) = х 2п + gi(x1, .. . , х п- i)x n + h i(x i,.. . , x n-i), i = 1,2,
причём Ai(0) > 0, Д2(0) > 0, где
A i (x1, . . . , x n- 1) = ft(a ;i,...,a ;n_ i)2 - 4hi(x1}..., i = 1,2,
— дискриминант многочлена Qi от переменной х п с коэффициентами
в М(ж1 , . . . , х п-\).
При осуществлённой нами нормировке нужно показать, что
Q2 — Q 1- Выберем произвольные, но фиксированные скаляры Ai,...
. .., An_i G Ми рассмотрим в А плоскость
x i= t\i, ..., x n- i = t \ n- i, teK. (1 )
Тогда для
х = tAiei + ... + £An_i en_i + х пеп
будем иметь
Qi(p + x) = x 2n + gi(t)xn + hi(t), (2)
где
9i(t) = ■■■,t\n-i), hi(t) = ... ,tK - i) - (3)
Положим также
Ai(t) = gi(t)2 - 4hi(t), г = 1,2.
По условию Ai(0) > 0, A2(0) > 0. Найдётся, следовательно, такое
г > 0, что при \t\ < г будут выполнены неравенства
Ai (t) > 0, А2(£) > 0.
Иначе говоря, многочлены (2) имеют при любом |£| < г два различ­
ных вещественных корня. Но по условию множества корней этих мно­
гочленов при фиксированном t совпадают — это есть просто пересе­
чение S с подпространством (1). Раз нормализованные многочлены
степени 2 имеют одинаковые корни, то их коэффициенты совпадают:
9i(t) = hit), hi t) = hit), |£| < e. (4)
§ 2. Квадрики в аффинном и евклидовом пространствах 227

Но значений t G 1, \t\ < £, бесконечно много, следовательно, равен­


ства (4) справедливы при всех t. В частности, они выполнены при
t — 1. Положив t = 1 в (3), перепишем (4) в виде равенства полино­
миальных функций:
01 (Ai, • • •, An_i) = #2(Ai,..., An_i),
(5)
hi (Ai . .., An_i) = /1 2 (Ai, . . . , An_i).
Из [BA I] мы знаем, что две полиномиальные функции /^ : А н->>
!->• /г(А) степени ш, совпадающие при к ^ т + 1 различных значениях
А, совпадают как многочлены: fi(X ) = f 2 (X). Обобщением на слу­
чай многочленов многих переменных служит следующее утвержде­
ние (см. [BA I, упр. 2 в § 1 гл. 6]). Если многочлены /ДАЙ, . . . , Xn_i)
и / 2 (Ай,. . . , X n- i) определяют одинаковые полиномиальные функ­
ции En_1 —>Е, то они совпадают, т.е. их коэффициенты равны. Для
доказательства нужно расписать многочлены по степеням одной пе­
ременной и воспользоваться индукцией по п.
Опираясь на это утверждение, мы переходим от (5) к равенствам
01 (^1 ч • • • ч%п —1 ) 02 (*^1 Ч" " " ч%п —1 ) 5

/ll(xb ... ,xn_i) = h2(x1, . .. ,xn_i),


которые показывают, что Q\ — Q2. □
2. Ц ентр квадрики. Непосредственно видно, что изображён­
ная на рис. 10 квадрика симметрична относительно начала коорди­
нат. Более общую геометрическую
картину отражает
О п р е д е л е н и е 2 . Точка д аф­
финного пространства А называется
центром (или центром симметрии)
квадрики Sq , если вместе с любой
точкой о + х к S q принадлежит и
точка д —х. Квадрика 5 называется
центральной, если у неё есть хотя бы
один центр, и нецентральной, если
центр отсутствует.
Предположим, что центральная квадрика 5 с центром в точке о
не является двойным подпространством. Пусть
Q(o + х) = <Дх) + 2/(х) + £о = 0
— её уравнение. В силу центральности S квадратичная функция
Q 1(6 + х) := Q(d —х) определяет ту же квадрику S :
Qi(d + х) = <Дх) - 2/(х) + £0 = 0.
По теореме 1 имеет место пропорциональность
Qi — AQ, A G Е,
15
228 Г л. 5. Квадрики

а так как q ф 0, то это возможно лишь при Л = 1 и I = 0. Но


мы уже знаем из п. 2, что 1 = 0 — условие центральности точки о
для Q. Мы приходим к выводу, что центр квадрики (не являющейся
двойным подпространством) и центр для квадратичной функции
Q, задающей эту квадрику, совпадают. Множество C(S q ) центров
симметрии квадрики S q совпадает с множеством C(Q) централь­
ных точек для квадратичной функции Q и является (в случае не-
пустоты) аффинным подпространством (теорема 1 из § 1). Способ
его описания в какой-либо координатной системе был нами разобран,
поэтому вопрос о центральности любой квадрики S может быть
решён эффективно.
3. Канонические типы квадрик в аффинном пространст­
ве. Основной является
Т е о р е м а 2. Уравнение квадрики в п-мерном вещественном аф­
финном пространстве приводится аффинным автоморфизмом к од­
ному и только одному из следующих канонических типов.
Случай центральной квадрики с центром симметрии в начале
координат исчерпывается типами
I s ,r : х\ + . . . + х 28 — x 2s + 1 - ... - х2
г = 1, 0 < s ^ г;
/ ' ?г : х\ + ... + х\ - х 28+1 - ... - х 2г = 0, г / 2 ^ s ^ г.
Случай нецентральной квадрики исчерпывается типами
I I s,r : х\ + ... + x 2s - x 2s+1 - ... - х 2г = —2жг+1, г/ 2 ^ s ^ г.
Д о к а з а т е л ь с т в о почти очевидно: достаточно применить след­
ствие теоремы 2 из § 1 и заметить, что S \ q = S q для Л / 0. Это
даёт возможность заменить в выражении (13) из § 1 постоянную сро
на —1 (если она отлична от нуля). Условие s > 0 в / s?r исключает
нулевую квадрику. Равенство s = г в / ' г соответствует двойному
подпространству. □
О п р е д е л е н и е 3. Квадрика типа 1щп называется эллипсоидом,
типа / s?n, s < п, — гиперболоидом, типа IIn- i,n- i — эллиптическим
параболоидом, типа — гиперболическим параболоидом. Все
эти квадрики невырожденные.
Квадрики типа / s?r, Г8 г при г < п и типа IIs,r ПРИ г < п — 1
называются цилиндрами, а квадрики типа Г8 п — конусами. Конусы
и цилиндры вместе называются вырожденными квадриками.
Конус (рис. 11) можно характеризовать инвариантным образом
как квадрику 5, на которой имеется точка б, обладающая тем свойст­
вом, что
о X£ S г о Лх £ S VA £ М.. (6)
Точка о в этом случае называется вершиной конуса (она авто­
матически является центром симметрии), а прямые о + Ах — обра­
зующими конуса. Лишь квадрики типа / ' г обладают свойством (6)
§ 2. Квадрики в аффинном и евклидовом пространствах 229

конусов (вершиной конуса в данном случае является начало коорди­


нат).

Цилиндр S как квадрика (рис. 12) характеризуется тем, что су­


ществует такой вектор и / 0, для которого
р GS р + Ли <Е S VA <Е Е. (7)
Другими словами, сдвиг t \ u вдоль и переводит цилиндр S в себя:
t\u(S) = S. Так как tUl • tU2 = tUl+U2, т0 все векторы, обладающие
свойством (7), составляют векторное подпространство U С V. Плос­
кости вида p + U с р G S называются образующими цилиндра S. Если
V — U 0TE, q G 5, то каждая образующая p+U пересекает плоскость
q + W в единственной точке г (р$ = u + w, u G (7, w G Т , откуда
р + и = q —w = r). Поэтому заданием подпространства U С V и
квадрики
5° = 5 П (q + W)
цилиндр S определяется однозначно. Квадрика 5° называется осно­
ванием цилиндра S.
Если р = д + х е S q и р + аи G Sq , т.е. Q(p) = 0 и Q(p + au) = О,
то из соотношения (5) из § 1 имеем
q(au) + 2{/(х, au) + /(au)} = 0.
Значит,
a 2q(u) + 2a{/(x, u) + Z(u)} = 0 Va G E,
откуда
Q(v)= 0, / (x, u) +/ (u) = 0. (8)
Пусть u G U и
К = U 0 IE, ТЕ = (ei, . . . , em), U — (em_|_i, . . . , en).
Тогда из соотношения (8) следует, что в выражении
<2(6 + X) = Хгхз + 2 X / + 00
id 3
230 Г л. 5. Квадрики

коэффициенты ipij и ipj с j > т равны нулю. Стало быть, и в кано­


ническом уравнении квадрики S q не будет координат, соответствую­
щих базисным векторам подпространства U. Получается следующий
вывод.
Если г = rankQ, то S q — цилиндр <(=> г < п в случае цент­
ральной квадрики и г < п — 1 в случае нецентральной квадрики.
Далее , dim U = п —г или соответственно п —г — 1, а основанием
S q цилиндра S q служит невырожденная квадрика или конус в аф­
финном пространстве размерности г (центральная квадрика) или
г + 1 (нецентральная квадрика).
О п р е д е л е н и е 4. В зависимости от типа основания 5° цилиндр
называется эллиптическим, гиперболическим или коническим. Гово­
рят также о цилиндре над квадрикой S 0.
Следует заметить, что конусы и цилиндры различаются по тому,
является их вершина конечной или бесконечно удалённой точкой.
4. Общие зам ечания о типах квадрик. Мы назвали рангом
квадратичной функции Q и соответствующей ей квадрики S q ч и с л о
г = rankg, где q — квадратичная форма, связанная с Q. Часто это
число называют малым рангом квадрики S q и в в о д я т наряду с г ещё
большой ранг г. Для его определения по общему уравнению квадрики
S q в какой-либо системе координат {б; e i , . .., еп}:
п п
Q(6 + х) = ifiijXiXj + 2 LpiXi + (^0 = 0 (9)
i,j=1 i=l
составляют две матрицы — матрицу F = (pij) квадратичной формы
q и расширенную матрицу
Рп .. Pin Pi

^Рп1 Рпп Рп
Pi •• Рп Ро

Тогда по определению г = rankF и г = rankF. Для удобства поло­


жим
Pi,n+ 1 — Рп-\- 1,г :— Р%ч ^ — 1, 2, . . . , Щ Рп+1,п+1 :—
так что F = (p ij)i+1 и г есть ранг квадратичной формы q:
п+1

<Т(х) = Q(o + x) = (fijXiXj.


i,j=1
Можно считать, что ж п + 1 = С придерживаясь этого соглашения и
в формулах перехода от {б; e i , . . . , еп } к новому реперу { д ' ; е [ , . . . ,е'п },
§ 2. Квадрики в аффинном и евклидовом пространствах 231

т.е. мы полагаем
Х 1 = 0*11 х[ + . . . + CLln%'n + ^ l , n + l ^ n + l 5

Х п — 0>п1х \ + . . . + &ппх п “Ь 0"п,п+1Х п+1'>

х п+ 1 = х п+ 1

(жп+1 = ж^+1 = 1). Матрица перехода А = (а^)^+1, разумеется,


невырожденная. В новых координатах матрицей формы q станет,
очевидно, матрица
F ’ = 1A 'F • А.
Так как det А ф 0, то г — инвариант относительно аффинных пре­
образований, и, в частности, г легко вычисляется по уравнению квад­
рики S q в её каноническом виде. Мы видим, что квадрика S q
вырождена, т.е. является конусом или цилиндром, если г < п + 1
или, что то же самое, если det F = 0.
На аффинную инвариантность малого ранга г мы обращали вни­
мание ранее. Число квадратов с коэффициентом ±1 в каноническом
уравнении определяется числом положительных и отрицательных
корней характеристического многочлена XF(t), а единственность
центра квадрики выражается условием det F / 0. Если det F = 0,
то либо центров нет (rankF < rankF), либо их бесконечно много
(rankF = rankF), что соответствует случаю цилиндрической квад­
рики. Итак, канонический тип квадрики S q целиком описывается без
фактического приведения её уравнения Q(p) = 0 к каноническому
виду.
Введём ещё некоторые понятия, возникающие естественным обра­
зом при исследовании квадрики. Предположим, что мы хотим найти
пересечение квадрики (9) с прямой, проходящей через точку ро =

Xi = х® + a t f , г = 1 , 2 , . . . , гг. (10)

Подставляя (10) в (9), получаем квадратное уравнение для t


Q(0)t2 + 2Q{1h + Q{2) = 0 (11)
с коэффициентами
Q (0) = q(a),

<2 (1) = ^2QitPo)<Xi, Q i(p) = 2 faT. = +¥>*>


i= l 1 j=1

Q (2) = Q(po)-
Здесь a = (ад,..., a n) — направляющий вектор прямой (10), ад, ...
. .., х п — координаты текущей точки р.
232 Г л. 5. Квадрики

О п р е д е л е н и е 5. Вектор а = (ад, . . . , а п) называется асимпто­


тическим для квадрики S q , если q(a) = 0. Уравнение
q(a) = 0
задаёт так называемый конус асимптотических направлений квад­
рики S q .
Если прямая (10) неасимптотического направления, т.е. q(ot) ф 0,
то уравнение (11) имеет два (возможно, комплексно сопряжённых)
корня, отвечающих паре точек (возможно, мнимых) пересечения пря­
мой с квадрикой. Прямая асимптотического направления либо не пе­
ресекается с квадрикой, либо пересекается в одной точке, либо, на­
конец, целиком содержится в S q (в последнем случае прямая (3) есть
прямолинейная образующая квадрики S q ).
Предположим, что ро = (ж^,. .., ж^) — точка квадрики, т.е. Q^ =
= Q(Po) — 0. Точка ро называется особой точкой квадрики S q , если
Qi(Po) — 0 для i = 1, . . . , п. Координаты ж^,...,ж^ особой точки
находятся из системы линейных уравнений
п п

У > О ^ + ^ = 0, i = 1,2, +tp0 = Q.


3= 1 J= 1
Ясно, что особые точки могут быть лишь у вырожденных ква­
дрик, причём при г = п существует не более одной особой точки.
В общем случае особые точки лежат на (п —г)-мерной плоскости.
Уравнение
п

~x°i) = 0

задаёт касательную плоскость к квадрике S q в её неособой точке ро.


5. К вадри ки в евклидовом пространстве. Пусть Е —
n-мерное евклидово пространство, V — связанное с ним векторное
пространство над R. Как и в общем аффинном пространстве, квад­
рика S q С Е задаётся уравнением Q(p) = 0.
Очевидной перефразировкой теоремы 3 из § 1 о Iso(Е)-эквива­
лентности квадратичных функций на Е является
Т е о р е м а 3. Уравнение квадрики в п-мерном евклидовом про­
странстве Е приводится подходящим выбором прямоугольной
системы координат {б; ei,..., е п } к одному и только одному ка­
ноническому типу. Именно, центральные квадрики с центром сим­
метрии в начале координат о исчерпываются типами
•L S + 1 _ К = 1 0 < s ^ r, (12)
1 о
as+l a?

d +
Xg Cs+1
-I—
1 о- - - % = 0, -Г ^ s < r; (13)
ll+l
§ 2. Квадрики в аффинном и евклидовом пространствах 233

нецентральные квадрики исчерпываются типами


Ls + 1
^2 >‘ ‘ ‘ > о —. . . ---- у + 2xr+i —О < S< г (14)
П ^s+1 *
(нулевые квадрики и двойные подпространства исключены).
Формулировку теоремы 3 следует дополнить описанием величин
ai. В случае (12)

dj = Ро
> 0, г = 1,...,г, ( 12')
Xi
где 0 ф (fo = Q(d), a Ai,...,Ar — характеристические корни (соб­
ственные значения) симметричной матрицы F = (ifij). Всегда можно
выбрать такую нумерацию переменных ад, чтобы в выражении
Qip + х) = Х\х\ + ... + Агж^ + <р>о
для величин A ipо выполнялись неравенства
Х\(ро < 0, XsPo < 0; Xipo > 0, i > s .
В случае (13) нужно положить
1
&г — > 0, г = 1 , 2, . . . , г, (13')
у/Щ
причём, очевидно, всегда можно удовлетворить условию s ^ г/2,
умножая в случае необходимости обе части уравнения на —1.
В случае (14) считаем
Ai/i > 0, Xsp > 0; Xip < 0, г > s,
так что
> 0, г = 1. (14')

Аффинные названия невырожденных квадрик: эллипсоид ((12),


s = п, рис. 13), гиперболоид ((12), 0 < s < г = п, рис. 14, 15),
эллиптический параболоид ((14), s = п —1, рис. 16), гиперболиче­
ский параболоид ((14), 0 ^ s < r = n —1, рис. 17), переносятся на
евклидовы квадрики, у которых, однако, появляются непрерывные
инварианты (параметры) — так называемые полуоси сд. Их Iso(E)-
инвариантность есть следствие 18о(Е)-инвариантности величин Af,
сро, Аб установленной в теореме 3 из § 1. С аффинной точки зрения,
например, все эллипсоиды эквивалентны при данном п “единичной
сфере”. С евклидовой же точки зрения даже у сферы имеется свой
инвариант — её радиус R = а± = ... = ап (эллипсоид с равными по­
луосями). Эллипсоид с полуосями а\ ^ ^ ^ ап > 0, очевидно,
можно считать вписанным в сферу радиуса а±, поскольку расстояние
от центра до точки (яд,. . . , х п) эллипсоида равно \J х\ + ... + х 2п и
2 rJ2 1
+ х п)>
234 Г л. 5. Квадрики

т.е. х\ + . . . -\-х2п ^ а\ , причём равенство достигается в точке {а\ , 0,...


. .., 0). Аналогично, ап — радиус сферы, вписанной в эллипсоид.
В случае гиперболоида полуоси as+i , . . . , ап называются мнимыми
полуосями. Эта терминология отражает тот факт, что в сечении ги­
перболоида плоскостью х\ — ... — х 8 — 0 нет вещественных точек.
Вообще, исследование квадрик при помощи сечений — обычный гео­
метрический приём, вносящий элемент наглядности в многомерную
картину.

Рис. 16
§ 2. Квадрики в аффинном и евклидовом пространствах 235

Сечения эллипсоида гиперплоскостями xi = const < а{ дадут


снова эллипсоиды в пространстве размерности п — 1. Сечения
гиперболоидов отличаются большим разнообразием. Гиперболу
x \ j а\ — x \ j — 1 при п — 2, двуполостный и однополостный ги­
перболоиды
4 _ 4. _ А , ^ _4 1
+ — “
а\ a2 «1 «! а2 а\
при п — 3 мы можем изобразить на чертеже (рис. 14, 15).
Гиперболоиды трёх различных типов при п — 4 сводятся к ним
и к эллипсоидам при помощи сечений. Так, например, двуполостный
гиперболоид

(М^
4 4 4
а{ а\ аз а\
встречающийся в теории относительности, состоит из двух связных
компонент, расположенных в полупространствах х\ 7> а± и х\ ^ а±.
Его сечения гиперплоскостями xi = const, i > 1, являются обычными
двуполостными гиперболоидами, а сечение гиперплоскостью х\ —
— const, \xi \ > ai, даёт эллипсоид. Столь же многообразно семейство
параболоидов. Мы не останавливаемся подробно ни на их анализе, ни
на анализе конусов и цилиндров (эллиптических, гиперболических,
параболических).

У П РА Ж Н Е Н И Я

1. Убедиться, что в аффинном пространстве А размерности 3 над К любая


квадрика может быть задана в надлежащей системе координат одним из сле­
дующих уравнений:

1) х \ + х \ + ж| = 1; 2) ж12 + х \ — ж| = 1; 3) х \ -x'i — х \ — —1
4) х \ — х \ — 2жз; 5) х \ + ж^ = 2жз; 6) х\ - -х\ = -1;
7) ж2 + ж^ —х \ — 0; 8) х \ + х \ + х \ — 0; 9) х \ + ж^ = —1;
10) х \ + ^2 = 1; 11) х\ —2x2; 12) —^2 = 1;
13) ж2 — х \ — 0; 14) ж2 - 1 = 0; 15) ж2 + ж| = 0 = 0;
16) х \ + 1 = 0 17) ж2 = 0.
2. Пусть S — квадрика в евклидовом точечном пространстве Е . Если её
уравнением в ортонормированном репере {6;ei,... , еп} будет
п п
+ 2 ^2 L4xi + До = 0,
г=1 г=1
то говорят о репере главных направлений квадрики S (вспомним о “главных
осях” квадратичной формы). Найти главные направления квадрик:
а) 2ж2 + у 2 — 3z 2 + 12х у + 4x z + 8yz + 18 = 0;
б) 6ж2 + 5у 2 + 7 z 2 + 4х у — 4 x z —8ж — 10у + 142: —6 = 0.
236 Г л. 5. Квадрики

3. У праж нению 3.3.8 на эк стрем альны е значения вещ ественной к в ад р ати ч н о й


ф орм ы д(х) можно п р и д ат ь больш ий геом етри ч еск и й смысл. Н апомним, ч т о речь
ид ёт о значениях q(v) при ||v || = 1 , или, ч т о то ж е самое, о значениях g ( v ) / ||v ||2 .
У бедиться в том , ч то
m ax q ( v ) = m in 11v 112
II V | | = l q M

(аналогично — при перемене м естам и m ax и m in). П усть, скаж ем , п = 2 и


q(v) = а х 2 + 2(3ху + гуу2 = 1 — уравнение эллипса. Если А*, г — 1,2, — корни
х ар ак тер и с т и ч е ск о го многочлена Л2 — (а + 7 )А + (cry — j32) = 0 и (х{, yi) — со о т­
ветствую щ и е то ч к и эк стрем ум а, то х 2 + у 2 = 1 /A j, т.е. один из корней о тве ч а е т
к в а д р а т у м иним ального (а в торой — м аксим ального) расстоян и я о т начала ко­
орд и н ат до эллипса. Заодно получаю тся условие перпен дикулярности главны х
осей (направлений) эллипса и ф орм ул а 7т/ у/а'у — (З2 для площ ади эллипса (обос­
новать!).
4 . П ри к ак и х значениях п а р а м е тр а t к в ад р и к а
х \ + х \ + х \ + 2tx\X2 + 2 tx \ x s + 2tx2Xs — 4t = О
явл яется эллипсоидом?
5. Н ай ти аф ф инны й ти п кривой, являю щ ейся пересечением к в ад р и к и
x f + 5^2 + + 2Ж1 Ж2 + 2 X 2 X3 + 6Ж1 Ж3 — 2xi + 6Ж2 + 2жз = О
И П ЛО СК О СТ И 2Ж 1 — Х 2 + Жз = 0.
6 . К о гд а два гиперболоида им ею т общ ий а си м п тоти чески й конус?
7. К акую к в ад р и к у н апом ин ает баш ня Ш ухова в М оскве?

§ 3. П р о ек ти в н ы е п р о с т р а н с т в а
Развитие проективной геометрии, особенно в первой половине
XIX века, оказало существенное влияние на всю математику. Мы
коснёмся лишь немногих фактов, относящихся к ней, отсылая за по­
дробностями к учебному пособию [2] и к специальной литературе.
1. М одели проективной плоскости. В аффинной плоскости
над полем Я любые две точки лежат на единственной прямой, а любые
две непараллельные прямые пересекаются в единственной точке.
Напомним из курса аналитической геометрии построение проек­
тивной плоскости Р 2 = ЛР2, в которой:
i) любые две различные точки лежат на единственной прямой;
п) любые две различные прямые пересекаются в единственной
точке.
Для построения Р 2 начнём с произвольного трёхмерного вектор­
ного пространства V над Я и определим Р 2 = Р(У), считая точ­
кой р G Р(У) одномерное векторное подпространство (прямую) в
V , а прямой L С Р(У) — двумерное векторное подпространство в
V. Точка р лежит на проективной прямой L (или инцидентна с L),
когда аффинное подпространство р содержится в L. Свойство инци­
дентности i), очевидно, выполнено: если р ф q — точки, то они же
являются различными прямыми в V , так что их суммой будет дву­
мерное подпространство L, т.е. прямая в Р(У), причём единственная
§ 3. Проективные пространства 237

прямая, содержащая р и q. Далее, две различные проективные пря­


мые L и М суть различные двумерные подпространства в V , так что
их суммой L + М в V должно быть всё пространство V . Поэтому по
формуле (7) из § 2 гл. 1 имеем
dim(L П М) = dim L + dim М —dim(L + М) = 2 + 2 —3 = 1.
Это означает, что ЬГ\М — одномерное аффинное подпространство,
т.е. единственная точка р Е Р ( С ) , в которой пересекаются проек­
тивные прямые L и М . Свойство инцидентности п), таким образом,
тоже выполнено.
Выше была приведена одна из реализаций проективной плоскости,
близкая к тому, что принято называть связкой в аффинном прост­
ранстве. Мы добьёмся известной наглядности в изображении проек­
тивной плоскости, используя также следующую модель.

Пусть Я = Е — поле вещественных чисел. В евклидовом про­


странстве Е = Е 3 берётся двумерная сфера
S 2: х 2 + у2 + z 2 = 1.
Каждая прямая, проходящая через начало о в ! 3, пересекает единич-
ную сферу в двух диаметрально противоположных точках, а каждая
плоскость, содержащая б, пересекает сферу по большой окружности.
В проективном пространстве Е Е 2 за точку можно брать пару
(£, t') диаметрально противоположных точек (рис. 18), а за прямую —
большую окружность на S2, считая, что точка р = (£,£') лежит на
прямой L, когда большая окружность L проходит через t и t' . Совер­
шенно очевидно, что две различные большие окружности пересекают
S 2 точно в одной паре (£,£') диаметрально противоположных точек.
Свойства инцидентности i), ii) выполнены.
Можно ограничиться рассмотрением нижней полусферы S'2 , со­
стоящей из всех точек (x,y,z) в Е 3 с х 2 + у2 + z2 = 1, 2 ^ 0 (рис. 19).
Её границей является экватор S 1 С S 2 с уравнением х 2 + у2 = 1
и z = 0. Одна из диаметрально противоположных точек сферы S 2
238 Г л. 5. Квадрики

должна лежать на S2 , а обе — только в том случае, когда они будут


диаметрально противоположными точками экватора S 1. Итак, точка
р g МР2 есть точка полусферы S'2 при условии, что диаметрально
противоположные точки её экватора отождествляются. Прямой L в
МР2 считается пересечение с 5 2 любой большой окружности на S 2. В
частности, сам экватор S 1 с отождествлёнными противоположными
точками является прямой в МР2.
Рассмотрим аффинную плоскость П, касательную к полусфере
S2 в её южном полюсе (0,0,—1), и спроектируем полусферу из на­
чальной точки о на П. Это значит, что точке t G S'2 \ S 1 ставится в
соответствие точка t* G П, лежащая на прямой, соединяющей о и t.
Очевидно, что проекция
a: S 2_ X S 1 ->• П
является взаимно однозначным отображением. Каждой прямой на
М Р 2 , т.е. дуге большой окружности на S2, отображение т г ставит
в соответствие прямую на П. Отображение сг-1 переводит точки в
точки, сохраняя инцидентность. Образом сг-1 будет множество всех
точек в М Р 2 , за исключением точек прямой L q, представленной эква­
тором S 1 полусферы S'2 . Таким образом, проективная плоскость мо­
жет быть получена из аффинной плоскости добавлением всех точек
некоторой новой проективной прямой L q, называемой бесконечно
удалённой прямой. Любое множество параллельных прямых на аф­
финной плоскости отображается при сг-1 на множество дуг больших
окружностей на 5 2 , проходящих через концы некоторого диаметра
экватора S 1. При этом определяется пара (£, t') диаметрально проти­
воположных точек экватора, т.е., по соглашению, одна точка на L q.
Стало быть, добавление бесконечно удалённой прямой к аффинной
плоскости есть добавление точек пересечения всех тех пар парал­
лельных прямых, которые не пересекаются в П. Следует заметить,
что бесконечно удалённая прямая L q не
является аффинной прямой.
В отличие от проективной плос­
кости, проективная прямая МР1
изображается точками окружности
(одномерной сферы) без отождествления
диаметрально противоположных точек.
В самом деле, М Р 1 есть пучок прямых,
проходящих через фиксированную точку
д обычной плоскости (рис. 20). На
фиксированной окружности S1, проходя­
щей через точку б, каждой прямой пучка соответствует ровно одна
точка (её пересечение с S 1). Точке о соответствует касательная к S 1
в о. Итак, окружность — модель проективной прямой.
§ 3. Проективные пространства 239

2. Проективное пространство произвольной размер­


ности. Создав себе наглядное представление о проективной прямой
и проективной плоскости, нетрудно ввести понятие проективного
пространства более высокой размерности и над любым полем. Его
можно мыслить как множество точек вместе с некоторыми выделен­
ными подмножествами, называемыми проективными подпростран­
ствами и подчиняющимися естественным аксиомам или отношениям
инцидентности. Аксиоматический путь (его называют ещё синтети­
ческим) имеет свои преимущества, но является чересчур окольным и
более приспособленным для изложения в отдельном курсе. Поэтому
мы изберём непосредственный подход, по-существу эквивалентный
рассмотрению связки в аффинном пространстве.
О п р е д е л е н и е 1. Проективным пространством Рп = ЛРП =
= Р(К) размерности п над полем Я называется совокупность (одно­
родных или векторных) прямых (п + 1)-мерного векторного прост­
ранства V над Я. Прямые пространства V называются точками
пространства ЛРП. Если U С V — ( т + 1)-мерное векторное под­
пространство в V, то подмножество Р (U) С Р(К), состоящее из всех
прямых пространства V, содержащихся в £/, называется проектив­
ным подпространством (а также проективным линейным много­
образием или плоскостью) размерности т пространства Рп. В случае
т — п — 1 говорят о проективной гиперплоскости. Считается, что
Р({о}) = 0 — пустое множество.
Можно несколько иначе выразить то же самое определение, ска­
зав, что проективным пространством , порождённым векторным
пространством V над Я, называется фактормножество Р(К) допол­
нения К* к {х} в У по отношению эквивалентности между х и у
в V*:
X- у ЭХ е Я*, х = Лу.
Класс эквивалентности х, определённый элементом х Е V* (не­
нулевым вектором х G К), и есть точка проективного пространства
Р(К). Итак, по определению
Лх = х VA е Я*. (1)
Отображение П : х х называется каноническим отображением
V * на фактормножество Р(К ). Следует подчеркнуть, что на Р(К)
не определены линейные операции, и мы не можем, например, поло­
жить х 0 у = х + у. Двумерное векторное подпространство U С V
определяет проективную прямую Р(£/), а трёхмерное векторное под­
пространство — проективную плоскость. Если U С W, т.е. если U
— векторное подпространство другого подпространства W С У, то
Р(U) С Р(VE), поскольку каждая прямая из V, содержащаяся в £/,
содержится и в W . Если Р (17) С Р(VE), то говорят, что проективное
подпространство Р (U) лежит на или инцидентно с Р(РК). Имеет
240 Гл. 5. Квадрики

смысл положить
P ( t / ) n P ( t / ;) = F(U П U').
Для каждого множества S С Р(К) существует наименьшее содер­
жащее его проективное подпространство Р(U): если S = {xi, 5Д,... },
то U — (xi, Х2, ... )я- Говорят, что S есть система образующих для
F(U). Наименьшим проективным подпространством, содержащим
Р(U) и Р(U'), очевидно, следует считать Р(U + U'). Каждое подпрост­
ранство Р(ИД можно рассматривать как самостоятельное проектив­
ное пространство с выделенными подмножествами Р(U) для U С W .
3. Однородные координаты. Пусть (ео, e i , . ..,еп) — базис
векторного пространства V. Если
х = £ое0 + £iei + ... + £nen £ V*,
то £о? £ъ • • •, £,п принято называть однородными координатами точки
х относительно базиса (еД пространства V. Каждая система (£Д из
п + 1 элементов поля Я, одновременно не равных нулю, есть одно­
родная (или проективная) система координат некоторой точки из
Р(К) относительно (еД. Две такие системы (£Д, (/хД будут систе­
мами однородных координат одной и той же точки из Р(К) отно­
сительно одного и того же базиса (еД тогда и только тогда, когда
щ — i = 0,1,... , п, для некоторого Л / 0 из Я. Этот факт мы
будем выражать записью
Х = (Со : £ i : ••• : £ » ) ,
означающей, что имеется взаимно однозначное соответствие между
точкой х Е Р(К) и классом пропорциональных друг другу систем её
однородных координат в данном базисе.
Если (eg, еД . .., е^Д — какой-то другой базис пространства V ,
причём
п
e’j = '^ 2 aij ei, O ^ j^ n ,
i= О
то ДД будет системой однородных координат точки х от­
носительно базиса (еД тогда и только тогда, когда найдётся Л Е Я*,
для которого
п
К, 0^г^п. (2)
2= 0
Действительно,
(Со : 6 : •••: Сп) = х = (£(, : £( : . . . :
и достаточно вспомнить из гл. 1 правило перехода от новых коорди­
нат к старым.
Отметим ещё, что, как следует из теоремы 4 (§ 3 гл. 1), всякое
подпространство Р(U) С Р(К) задаётся в данном базисе (еД систе­
§ 3. Проективные пространства 241

мой линейных однородных уравнений


<Но£о + Cin^l + . . . + Ciln^n —О,
(3)
a r0^0 + CLrl^l + ... + a rn^n —0-
4. А ффинные кар ты . Выделим в векторном пространстве V
с базисом (еД векторное подпространство
Vo = (е15е25• • • 5еп)5
а в аффинном пространстве (Е = V, V) — гиперплоскость
Ео = е0 + Vo = {е0 + х | х Е У0}.
Как мы уже знаем, пара (Ео, Vo) есть аффинное пространство, если
для a := а = ео + а', Ъ= ео + Ь' положить
~а?) = Ъ ' —& .
Прямая (х) С К, не содержащаяся в Vo, пересекается с Ео в един­
ственной точке. Действительно,
х £ К0 х = £0е0 + ... + ^пеп, £о Ф 0.
Значит, Лх = А^о^о + ... + А£пеп = ео + у с у Е Vo тогда и только
тогда, когда А£о = 1.
Поставим в соответствие прямой (х) эту точку пересечения
(х) П Eq. Мы получим биективное соответствие
Ф: (х) I—У (х) П Eq
между прямыми (х) ^ Vo и точками аффинного пространства Eq.
Другими словами, Ф индуцирует биективное отображение
Ф0:Р(К)\Р(К0) ^ Е о . (4)
Под P(K)\P(Vo) понимается проективное пространство Р(У) с уда­
лённой (выброшенной) гиперплоскостью P(Vo).
О п р е д е л е н и е 2. Аффинное пространство Eq вместе с отобра­
жением Фо (а иногда и просто P(K)\P(Vo)), отождествляемое с Eq,
называется аффинной маршей проективного пространства Р(У). При
этом P(Vo) называется бесконечно удалённой гиперплоскостью отно­
сительно карты Eq. Бесконечно удалёнными считаются также точки
и плоскости, содержащиеся в P(Vo).
Выразим то же самое в координатах. По своему смыслу
P(K)\P(Vo) состоит из точек х = (£о : £1 : ... : £п) с ф 0.
Выберем в Eq аффинную систему координат {ёо; e i , ..., еп}, пони­
мая под ёо = ео точку в Eq, а под e i , . . . , еп — базисные векторы
пространства Vo, с которым ассоциировано Eq. Чтобы найти аф­
финные координаты точки х, надо найти точку пересечения прямой
(х) = (£оео + £iei + • • • + £пеп) с Eq. Мы видели, что эта точка имеет
16 А .И. К о стр и к и н
242 Г л. 5. Квадрики

вид
, £i , ,
ео + т~ е 1 + • • • + т“ еп.

Значит, в системе координат {ёд; e i , ..., еп} карты Eg аффинными


координатами точки х будут fi/fo, • • •, fn/fo-
Итак, приписывал точке х Е Р(У)\Р(Уо) координаты точки
Фо (х) G Ео 5мы получаем аффинную (или неоднородную) систему ко­
ординат в Р(Е), определённую, правда, лишь на множестве
P(y)\P(Vo)« Между точками этого множества и их неоднородными
координатами (в фиксированном базисе) имеется биективное соот­
ветствие.
Если U — векторное подпространство в V размерности т + 1,
то ш-мерная проективная плоскость Р(17) либо будет бесконечно уда­
лённой относительно Eg (в случае U С Vo), либо её образом
Ф0{пи)) = и п Е о = е 0 + и0
будет ш-мерная аффинная плоскость на карте Eg. С другой стороны,
любой ш-мерной аффинной плоскости eg + Uo С Eg соответствует
ш-мерная проективная плоскость Р(£/), где U = (eg,£/g). Проведен­
ное рассуждение показывает, что Фд есть не только биективное
точечное соответствие между P(E)\P(Vg) и Eg, но и соответствие
между плоскостями одинаковых размерностей. В этом смысле Р(Е)
получается из Eg добавлением бесконечно удалённой гиперплоскости.
Взяв вместо eg вектор е^, а вместо Vg гиперплоскость
Vf (eg, . . . , ei_i, ei_)_i, . . . , en),
мы получим другую аффинную карту (Ei, ФД. Она состоит из точек
(£о : fi : • • • : fn) с & ф 0. В Ei с системой координат {ё^ е0, . .., ei_b
ei+i, ..., еп} аффинными координатами точки (£g : £l : ... : £п) будут
(& £i-l £г+1 ^п\

Беря за исходные векторы последовательно eg, ei , ..., мы полу­


чаем п + 1 карт
(Ег,Ф^, г = 0, 1, ...,п.
Их объединение “совпадает” с Р(Е). Действительно, для любой точки
х = (£g, £ъ • • •, £п) £ Р(Е) хотя бы одна координата ^ отлична от
нуля, а это значит, что ФДх) Е Е$. С принятым нами соглашением
об отождествлении Р(Е)\Р(ЕД и Ei имеем
п
Р” = Р(У) = ( J Ei-
i= 0

Легко видеть, что меньшим числом карт пространство Рп не покры­


вается.
§ 3. Проективные пространства 243

5. Понятие алгебраического многообразия. Будем гово­


рить, что многочлен
f ( t o , ^ 1 , • • • , t n ) G Я [* 0 5 ^1 5 • • • 5 * n]
обращается в нуль в точке х = (£о? £ъ •••?€п) £ Р(Е), если /(£о? £ъ •••
. .., £п) = 0. Это значит, что /(А£о?A£l, . .., А£п) = 0 для всех А ф
Ф 0, A G Я. Положив
/ —/о + /l + • • • + /т )
где fi — сумма всех одночленов степени i в / , мы видим, что из
условия
0 = / ( А £ 0, . . . , А£п ) =

в случае бесконечного поля Я следуют равенства Л(£о?..., £п) = 0 для


г = 0,1,... ,ш. Стало быть, если / обращается в нуль в некоторой
точке х G Р(Е), то в той же точке обращаются в нуль и все его
однородные составляющие. Естественно поэтому ввести следующее
О п р е д е л е н и е 3. Подмножество S С Рп точек (ао : ад : ...
... : а п), удовлетворяющих системе алгебраических уравнений
01 (a0, ... , a n) = 0 ,

• • • 5&п) 0 }
где #1, . . . , gk — однородные многочлены, называется (проективным)
алгебраическим многообразием.
Точнее, следовало бы говорить о замкнутом алгебраическом мно­
жестве в Рп, поскольку многообразия уместно вводить на языке од­
нородных простых идеалов и топологии Зарисского. Мы, однако, в
детали входить не будем. Алгебраические многообразия (в особен­
ности комплексные алгебраические многообразия, когда Я = С) —
предмет изучения большой самостоятельной математической дисци­
плины — алгебраической геометрии.
Ограничимся для простоты случаем одного уравнения
g(a0ja l j . .. , а п) = 0 .
Найдём уравнение пересечения So = S П Ео • Если х G Ео, х = (ао :
: ai : : а п), то ао ф 0. Поэтому условие д(ао, . .., а п) = 0 равно­
сильно условию

Так как a i / a o , ..., a n/ao — аффинные координаты точки ж, то это


и есть уравнение “аффинного” многообразия So, т.е. уравнение мно­
гообразия S в Ео. Аналогично, делением на а* находятся уравнения
S в Ej.
16
244 Г л. 5. Квадрики

Обратно: если координаты точек в Ео обозначены x i , . . . , x n и


множество So задано уравнением
f( x 1,... ,х п) = О,
где / — произвольный, не обязательно однородный многочлен сте­
пени ш, то
g(a0,o ti,...,a n) = (a0)mf ( — , . . . , — )
чао olо/
— однородный многочлен. Действительно, из одночлена
(хг)к1 ... (хп)кп, кг + ... + k n ^ m ,
в / получается одночлен (ao)m~kl~'"~kri (oi\)kl ... (а п)кп степени т в
д. При этом
^ (1, Х\, . . . , жп) = /(жь . . . , жп).
Следовательно, если S задано уравнением д = 0 в Рп, то S П Eq = So­
rt р и м е р 1 (конические сечения). С чи таем ниж е Я = М.
1) О к р у ж н о сть S , имею щ ая в к а р т е Ео уравнение х \ + х \ — 1, в п роек ти вн ы х
однородны х к о о р д и н атах за д а ёт ся уравнением a f + = а ^ . Её пересечение
S'nP(V o) с бесконечно удалённой прям ой P(Vb) относи тельно к а р т ы Ео находится
из условия (То = 0 (это уравнение Vo и P(Vo))- Из a f + = 0 следует, ч т о и
ol\ — сч2 — 0. Т ак и х то ч е к (ао = а \ = <Г2 = 0) вообщ е нет, и, зн ач и т, S'nP(Vo) = 0 -
2 ) Г ипербола S с уравнением х \ —х^ = 1 в к а р т е Ео в одн ородны х к оордин а­
т а х им еет уравнение a f —a^ = ckq. Её пересечение с бесконечно удалённой прямой
P(Vo) п олучается из условия ао = 0, т.е. <Г2 = d=ai. П ри этом а± ф 0, иначе все
т р и коор д и н аты были бы равн ы нулю. П оделив на а д , две то ч к и пересечения
S'nP (V o) можно зап и сать в виде (0 : 1 : 1 ), (0 : 1 : —1 ). С другой стороны , в к а р т е
Ei будет ад ф 0, и уравнение гиперболы в к а р т е S п р и о б р ет а ет вид х \ + х \ — 1
(хо = a o / a i , Х2 = <^2 / ^ 1 ), т.е. S П Ei явл яется ок руж н остью и S H P (V i) = 0 .
3) П арабола х \ — х \ (уравнение в Ео) при х \ = а \ / а о , Х2 = а г / а о за д а ётся
уравнением a o a i = а \ . П ересечение с P(Vo) («о = 0) содерж и т одну (двойную )
т о ч к у ( 0 : 1 : 0 ) . Соверш ив переход к другой системе к оорд и н ат ао = do — d i,
a i = до + /й , а 2 = д2, мы получим уравнение d i + d ^ = до> к оторое в новой
к а р т е Eq д аст ок руж н ость. Т аким образом , окр у ж н о сть (или эллипс), гипербола
и парабола — это одна к ривая на проекти вн ой плоскости, р а ссм атри ваем ая лиш ь
в разн ы х аф ф ин ны х к а р т а х . С обственно, э т о т р е зу л ь т а т , и звестны й из ан ал и ти ­
ческой геом етри и , приведён лиш ь для иллю страции рассм атри в аем ы х понятий.
6. П роективная группа. Пусть Р(У) — проективное прост­
ранство, порождённое векторным пространством V над полем Я,
так что точка х £ Р(У) есть векторная прямая (х) С V . Пусть
Л : V —> V — невырожденный линейный оператор на V. Он пере­
водит прямую в прямую и не может перевести её в 0. Стало быть,
имеет смысл
О п р е д е л е н и е 4. Каждый невырожденный линейный оператор
Л на У индуцирует некоторое преобразование Л : Р(У) —>• Р(У),
называемое проективным преобразованием:
Л - х = Л х. (5)
§ 3. Проективные пространства 245

Равенство (5) полностью согласуется с принятым нами определе­


нием точки х, поскольку
Д • Лх = Л • Дх = Дх = Д • х. (6)
Из (6) следует также, что ЛД = Д. На самом деле верна
Т е о р е м а 1. Равенство В = Д имеет место тогда и только
тогда, когда В = ЛД.
Д о к а з а т е л ь с т в о . Нам нужно только показать, что В = Д = >
= > Б = ЛД. Так как /Зх = /Зх = Дх = Дх, то /Зх = Лх • Дх для
любого вектора х / 0 из У и какого-то скаляра Лх 0, зависящего
от х. Если у = ах, то
Лу • Ду = By = аВх. = аЛхДх = ЛхДу,
откуда Лу = Лх. Если же х и у — линейно независимые векторы, то
линейно независимыми будут векторы Дх, Ду, а из соотношения
Лх • Дх + Лу • Ду = £>х + By =
= В(х + у) = Лх+У • Д(х + у) = Лх+уДх + Лх+уДу
вытекает, что Лх = Лх+У = Лу. Это значит, что Лх = Л — скаляр, не
зависящий от х, и, следовательно, В = Л • Д. □
Чтобы получить запись проективного преобразования Д в коор­
динатах, выберем базис (ео, e i , . .., еп) пространства V и обозначим
через А = (а^) матрицу линейного оператора Д в этом базисе:
п
Лез =
2 =0

Если х = (ао : а\ : ... : а п) и Дх = (До -Pi : • • • : Дп)5 то


п
Pi = \ У 2 ач а1’ г = 0 , 1 , .. . , гг, (7)
3=0

где Л / 0 — некоторый скаляр. Это видно непосредственно из ра­


венства
п п п п
л-1 Piei = Лх = аз ^ ез = Е Е aii ei
2=0 j =0 j =0 2=0
и согласуется с законом преобразования координат вектора при
действии линейного оператора (см. гл. 2).
Пусть теперь Eg — аффинная карта в Р(Е). Она состоит из точек
х = (ао : ад : ... : а п) с ао ф 0. Если окажется, что До Ф 0 в (7), то
Дх G Ео- Аффинными координатами точки х являются Xj — а^/ао,
1 ^ j ^ n, а для точки Дх — координаты yj = Ду/ До? 1 ^ j ^ п.
246 Г л. 5. Квадрики

Если разделить равенства (7) с номерами i = 1, 2,... ,п на Дд, а за­


тем разделить числители и знаменатели в правых частях на <тд, то
получится запись проективного преобразования А в аффинных ко­
ординатах карты Ео:
ацХ\ + . . . + CLin%n + &г0
tji = --------------------------------------------- ,
1 / •/
1 <С г <С и . (8)
a o iX ! + . . . + CiOnx n + а 00
Характерно то, что что во всех этих формулах — общий знамена­
тель. Неопределённый множитель Л исчез.
З а м е ч а н и е . Следует, конечно, иметь в виду, что проективное
преобразование А вполне может переводить точку из Eg (точнее, из
множества Ф^~ (Ео)) в точку, не принадлежащую карте, т.е. в беско­
нечно удалённую (иначе: принадлежащую P(V g ) ) . Формулы (8) в этом
случае теряют смысл. Этого заведомо не произойдёт, если a$j = О,
1 ^ j ^ щ сюо — 1- Тогда мы получаем известные формулы аффин­
ного преобразования карты Eg. Стало быть, аффинное преобразова­
ние — частный случай проективного.
Для любого вектора у ф 0 из V найдётся в силу невырожденно­
сти А такой вектор х, что Дх = у. Значит, любая точка у Е Р(С)
является образом некоторой точки х при проективном преобразова­
нии А: у = А х = Ах. Аналогично, любые две различные точки х, z
переходят в различные: А х = Az = > А х = Az = > Az = ЛДх = >
=> А(ъ —Лх) = 0 = > z = Лх = > z = х.
Итак, всякое проективное преобразование биективно.
О п р е д е л е н и е 5. В группе всех биективных отображений
Р(С) —> Р(Е) проективные преобразования образуют подгруппу,
обозначаемую символом PGL(V) и называемую проективной
группой.
Обозначение PGL(V) связано с тем, что эта группа является го­
моморфным образом полной линейной группы GL(V) = GLn+i(&).
В самом деле, отображение тг : А н-У А удовлетворяет условию гомо­
морфизма 7т(АВ) = 7г(Д) 7г(В), поскольку
АВх = АВх = А В х = А(Вх) = (АВ)х.
Из теоремы 1 следует, что ядро Кег7г состоит из операторов подобия
Х£: А = £ => А — \£ . Так как отображение Ф : A i—^ является,
очевидно, изоморфизмом групп Я* и Кег7г = {А£| A G F } , то на
основании всего вышесказанного получается
Т е о р е м а 2. Все проективные преобразования пространства
Р(С) образуют проективную группу PG L(V), являющуюся гомо­
морфным образом полной линейной группы GL(V). Ядро гомомор­
физма 7г изоморфно мультипликативной группе Я* поля Я и имеет
место “короткая точная последовательность”
1 ->• Я* 4 GL(V) 4 PGL(V) ->• 1. (9)
§ 3. Проективные пространства 247

В данном случае мы могли бы обойтись без точной последова­


тельности (9), означающей просто, что Ф — изоморфное вложение,
Im Ф = Кегл, а 7г — эпиморфизм. Но мы воспользовались случаем,
чтобы ещё раз ввести в обиход само понятие точной последователь­
ности, широко применяемой в современной математике.
7. П роективная геом етри я. Мы знаем, что проективная груп­
па PGL(V) действует транзитивно на Р(У), т.е. переводит любую
точку в любую другую точку. В соответствии с общей концепцией
(см. гл. 4, § 2, п. 4), группе PGL(V) отвечает некоторая геомет­
рия. Эта геометрия называется проективной. Предметом проектив­
ной геометрии является изучение тех свойств пространственных фи­
гур в Р(У), которые не меняются при действии преобразований из
PGL{V). Такие свойства называют также проективными. Свойство
параллельности прямых или плоскостей, очевидно, не относится к
числу проективных. Теорема Пифагора тоже не является проектив­
ной, поскольку она содержит понятия длины и угла. Требованием
проективности исключается много теорем не только евклидовой, но
и аффинной геометрии. Тем не менее проективная геометрия отно­
сится к числу весьма содержательных и крайне необходимых гео­
метрий. Чуть позднее мы остановимся на одном важном проектив­
ном свойстве четырёх коллинеарных точек, а пока отметим р яд
с в о й с т в проективной группы PGL(V).
1) Согласно замечанию, сделанному после формул (8), группа
PGL{V) содержит в качестве подгруппы аффинную группу Aff(Eo),
действующую на аффинной карте Eq (а также группы Aff(Ej),
г = 1,2,...,п).
2) Будем говорить, что точки хо, x i , . . . , xn+i n-мерного проек­
тивного пространства Р(У) находятся в общем положении, если
никакие n + 1 из них не лежат в одной гиперплоскости. Другими
словами, любые п + 1 векторов
Х05x i , . . . , Xf_ 1, Xf_|_i, . .., Xn_|_i
линейно независимы.
Т е о р е м а 3. Пусть х0, х ь . .., xn+i и у0, Уь • • •, Уп+i — две
системы точек в Р(У), находящихся в общем положении. Тогда
существует, и притом единственное, проективное преобразование
A G PGL{V), для которого Axi = Уг, г = 0,1,. .. , п + 1.
Д о к а з а т е л ь с т в о . Согласно определению
(xi, x2, . . . , x n+i) = V = (у 1, У2, - - - , Уп+1) 1
поэтому существует невырожденный линейный оператор А ' , для ко­
торого
A!xi = Уг, 1 ^ i ^ п + 1. (10)
На первый взгляд, не остаётся никакого произвола для отыскания
248 Г л. 5. Квадрики

А. Но условие Ax.i = yi в терминах векторов Е V приобретает


вид
AXi = Aiyi, Xi ф 0, 0 ^ i ^ П + 1.
Так как А ^ Д = А, то нормируем А условием Aq = 1.
Определим теперь линейный оператор В:
£уг = А;У;, 1 ^ г ^ П + 1, (11)
и, пользуясь тем, что скаляры Ai находятся в нашем распоряжении,
подберём их так, чтобы выполнялось условие
ВЛ'к0 = уо- (12)
Из определения системы точек в общем положении следует, что
п+1 п+1

Х0 =Е
i—1
а*х*’ уо=г=1Е ^*у*’ щ)
причём все коэффициенты a*, fa отличны от нуля. В соответствии с
(10) имеем
п+1 п+1 п+1 п+1

В Л ' ко = в(Е
=1
г
«*+хг) =в(Е= 1а*У*)=Е= 1 а+у*=Е= 1 а+У*-
г г г
Ввиду (13) нам остаётся положитьа^А^ = Д, 1 ^ г^ n +1, чтобы
удовлетворить условию (12). Скаляры Ai = а вместе с ними и
преобразования (11) полностью определены. Положив теперь
А = ВА',
мы получим однозначно определённый линейный оператор, которому
соответствует проективное преобразование А с требуемыми свой­
ствами. □
Ясно, что теорема 3 — аналог теоремы 8 из § 3 гл. 4, относящейся
к аффинным преобразованиям.
С л е д с т в и е . Любые две тройки х0, xi, х2 и уо, уд, У2 попарно
различных точек на проективной прямой Р1 однозначно определяют
проективное преобразование Р1 —>Р1, переводящее соответственно
Хг 6 уi , i = 0,1,2.
Это утверждение означает между прочим, что свойство точки
лежать между двумя другими точками не является проективным.
Из теоремы следует также (утверждение о единственности А), что
не всякую четвёрку точек на прямой можно перевести в заданную.
3) Пусть Р(£/), Р(W) — две т-мерные плоскости в Р(У). Тогда
они PG L{V)-конгруэнтны, т.е. их можно перевести друг в друга
проективным преобразованием.
В самом деле, пусть
и = (u0, u b . . . , u m), W = (w0, wb . . . , w m).
§ 3. Проективные пространства 249

Дополним {и0, . .., u m} до базиса (и0, . .., u m, ..., u n), {w0,...


...,w m } — до базиса (w0,...,w m ,...,w n) пространства V и рас­
смотрим линейный оператор А : V —У V, для которого Ащ = w
г = 0,1,.^. ,п. Тогда Ащ = w *, А ^ щ щ = Л(^2{щ щ ) =
так что А(Г(У)) = P (W).
4) Всякое проективное преобразование D плоскости ¥(U) С Р(У)
может быть продолжено до проективного преобразования всего
пространства Р(У).
В самом деле, вместе с uq, ui, . .., u m векторы Т)uq, Т>u i , ...
. .., V u m также образуют базис подпространства U С V. Пусть
(llo, . . . , u m, Um_|_i, . . . , u n), (B\1 q, . . . , V u m, Wm+1, . . . , wn)
— базисы в V , получающиеся дополнением указанных базисов в U.
Полагая
Ащ = Vui, 0 ^ i ^ ш,
Ащ = w i, ш + l^ i^ n ,
мы получим линейный оператор А: V —>V, которому соответствует
проективное преобразование А: Р(У) —>• Р(У), совпадающее с V на
Р (U).
8. Двойное отношение. Пусть Рп = Р(У) — проективное про­
странство и ар, а2, S3, а 4 — четыре точки из Р(У), лежащие на
прямой Р 1 = Р(£/), причём
S i ^ a 3, a i ^ a 4, а2 ф а3, а2 ф а4.
Это значит, что
(аь а3) = (аь а4) = 11 = (а2,а3) = (а2,а4).
Обозначим через
а Д
(14)
7 S
определитель матрицы перехода от базиса (с,d) двумерного вектор­
ного пространства к другому его базису (а,Ь):
а = ас + /3d, b = ус + Sd.
В силу условий, наложенных на точки ар, можно образовать выраже­
ние
/ \ / \ -1
а Ъ а3 \ / а25а3
[а 15а2>а3>аД (15)
а 1 5а 4 / V а 2 5а 4

О п р е д е л е н и е 6 . Выражение (15) называется двойным отно­


шением четырёх точек ар, а2, а3, а4.
Следует, конечно, убедиться, что [ар, а2, а3, а4] зависит только от
точек ар, а не от выбора векторов а^ (вспомним, что Ла^ = ар), т.е.
оно не меняется при замене а^ на А^ар
250 Г л. 5. Квадрики

Действительно, заменим ai на bi = Ааь Если ai а ъ аз —


= jsli + 5а4, то bi = bi, а3 = 7 A_1bi + 5а4, и поэтому
/ а ъ аз \ 1 0 1 0 / b i , аз
Va i , а4 / 7 8 7 Л- 1 <5 Vb i , а4 )
Множитель
/ а25аз -1
Vа2, а4 )
при этом, очевидно, тоже не меняется. Так же обстоит дело при за­
мене а 2 на Аа2.
Заменим теперь а 4 на Ь 4 = Аа4. Если
а 1 —а Ъ а2 —а21
а3 = 7ai + 6а4, а3 = 7'а2 + 6'а4,
то
а 1 —а Ъ а 2 — а 2,
аз = 7a i + ЙА_1Ь4, а 3 = у 'а 2 + 5'А_ 1Ь4,
и поэтому
1 о a i , b 3\
= Л(
7 8\~1 а 1, а4 /
1 0 / а2JЬ3 \
У 5'А-1 Vа2, а4 /
Отношение в правой части (15) при этом не меняется. Так же обстоит
дело при замене а 3 на Аа3. Одновременная замена а^ на Аа^ сводится к
последовательной замене одного из них, поэтому двойное отношение
четырёх точек корректно определено формулой (15).
Т е о р е м а 4. Двойное отношение не меняется при проективном
преобразовании, т.е.
[Даь Да2, Да3, Да4] = [аь а2, а3, а4] (16)
для любого Л G PGL(V).
Д о к а з а т е л ь с т в о . Пусть Л G GL(V), U — двумерное вектор­
ное подпространство в V, U' = A(U). В силу невырожденности А
любые два линейно независимых вектора перейдут под действием А
в линейно независимые. Если теперь
(а,Ъ) = U = (с,d),
ТО

(Аъ,АЪ) = и ' = (Mc,Md),


а соотношениям, связывающим базисы (а,Ь) и (с,d):
а = ас + /3d, b = 7с + 5d,
соответствуют ровно такие же соотношения в плоскости U1\
Да = аАс + в Ad. АЪ = уДс + 8Ad.
§ 3. Проективные пространства 251

Это значит, что


/а, b \ _ a f3 _ /Да, ДЬч
\c,d/ У \Дс,Дс1/
,Дс, ДсЕ
Стало быть, в применении к нашей ситуации имеем

[Дах,Да2,Да3,Да4] = [Дах,Да2,Да3,Да4] =
_ /Даь Да3\ /Да2,Да3\-1 = /аь а3\ /а2,а3у-1
V<Да1
Дат,,Да47
/ VДа2,Да47 Vai,а47 Vа2,а47
—[а 15а2, а3, а4]« П
9. Выражения двойного отношения в координатах. Вве­
дём на прямой Р(U) с точками a i , a 2 а3,а 4, для которых можно за­
дать двойное отношение, некоторую однородную систему координат.
Именно, пусть U = (е,f) и а^ = аде + /ЗД, i — 1,2, 3,4. Тогда
af = (од : А), * = 1,2, 3,4. (17)
Смысл (17) ясен из общего определения однородных координат в про­
ективном пространстве. Если ai = ai, а3 = yai + 5а4,то
/аьаз\
= 5. (18)
V4 ai,
а 1 , а4
а47
'

Кроме того, из соотношения


аде + Af = у(оце Т Af) + 5(<т4е + А О
получаем ад = уад + 5ад, А = у А + ^А- Поэтому
0.1 Д а\ А ад А —оЛ OL1А

«3 Д уад + 5ад уА + 5 А 5ад JA ОД А
что в сочетании с (18) даёт
/аьаз\ А А
Vai,а47 од А
р со

со

Аналогично
-1
/ а2, а3 \ «2 А «2 А
Vаа2,
2 , а4
а47 ад А
Р со

со

Таким образом, по определению (6) двойного отношения имеем


«1 д «2 А
ад А
Рсо

со

[а 1, а2, а3, а4] = (19)


А «2 А
ад А
р со

со
252 Г л. 5. Квадрики

Если ад ф О, 1 ^ г ^ 4, и Х{ — fti/ai, то из (19) следует

I— 1
1 Х2

н 5
1—
1

I— 1
со
[ai,а2,а3,а4]

I— 1
1 х2

5
1—

1—
1

1
Н со
{хз - х 1)(х4 - х 2)
[а 15а2>а3>а4] (20)
(ж4 - х 1)(х3 - х 2у
Выражение (20) или эквивалентное ему выражение
Хз —Х\ Ж4 —Х\
[а 1, а2, аз, а4]
Х2 - Хз ' Х2 ~ х4
можно брать в качестве определения двойного отношения, но это не
очень удобно, потому что формально оно зависит от выбора аффин­
ной карты (условие ад ф 0, 1 ^ г ^ 4), в то время как выраже­
ние, стоящее в правой части равенства (19), имеет смысл и в том
случае, когда одна из точек ад является несобственной (бесконечно
удалённой).
Если за бесконечно удалённую точку по отношению к карте Eq
выбрана точка а4 = (0 : 1), то из (19) получаем
г~ ~ ~ ~ 1 Х з - Х !
La l ? а 2 5 а 3 5 a 4j — -------------- •
Хз ~ х 2
Если, сверх того, выбрать а3 за начало координат (1 : 0), а а2 — за
единичную точку (1 : 1), то ж3 = 0, х 2 = 1 и
[ai,a2,a 3,a 4] = (21)
Это не что иное как координата точки ад в системе координат, в
которой а4 — бесконечно удалённая, а3 — нулевая и а2 — единичная
точки.
Полезно и такое рассуждение. Будем выбирать не точки, а од­
нородную систему координат на Р1 = Р(U). Пусть a i , a 2, a3 — три
фиксированные точки прямой Р1, ад ф а2. Положим е = z/ai, f = /ia2,
где скаляры z/, ц таковы, что а3 = e+f. Тогда ад = (1 : 0), а2 = (0 : 1),
а3 = (1 : 1). Если теперь а4 = (а : /3) — произвольная точка на Р1,
то по формуле (19), где следует положить
ад = 1, f3i = 0; а 2 = 0 , /32 = 1;
OL3 1, /З3 1, ад ад /34 f3,
находим
[аь а2,а 3,а 4] = а / (5.
Мы видим, что отношение однородных координат ад /3, задаю­
щее точку а4, само однозначно определяется двойным отношением
[ад, а2, а3, а4]. Таким образом, справедлива
§ 3. Проективные пространства 253

Т е о р е м а 5. При трёх попарно различных фиксированных точ­


ках а ь а2; а 3 проективной прямой Р 1 всякая четвёртая точка
S4 G Р 1 однозначно задаётся двойным отношением [Si, а2, а3, S4].
Мы готовы теперь доказать утверждение, существенно уточ­
няющее следствие теоремы 3.
Т е о р е м а 6 . Две четвёрки ai, а2, а3, ад и Ьд, b 2, b 3, Ь 4 кол-
линеарных точек в п-мерном проективном пространстве PGL(V)-
конгруэнтны (эквивалентны в смысле проективной геометрии) то­
гда и только тогда, когда
[ai, а2, а3, а4] = [Ьд, b 2, Ь3, Ь4] . (22)
Д о к а з а т е л ь с т в о . Необходимость условия (22) следует из (16),
коль скоро bf = Ащ.
Пусть теперь выполнено условие (22). Согласно свойству 3) про­
ективной группы, найдётся проективное преобразование В: Р(У) —>•
—> Р(У), переводящее прямую Р(£/), на которой лежат точки £р, в
прямую Р(ИД, на которой лежат точки Ь^. Согласно следствию тео­
ремы 3 существует проективное преобразование Т> прямой Р(ИД,
переводящее Вщ в bf, i = 1,2,3. Используя свойство 4) проектив­
ной группы, продолжим V до проективного преобразования А\ всего
пространства Р(У). Преобразование А = А \В переводит точки ар в
точки b i,i = 1, 2 , 3, соответственно, а точку S4 — в некоторую точку
С4 на прямой Р(ИД. По теореме 4 имеем
[ai, а2, а3, а4] = [bi, b 2, Ь3, с4] ,
что с учётом (22) даёт
[bi, b 2, b 3, b4] = [bi, b 2, b 3, c4] .
Из теоремы 5 следует, что £4 = b 4. □

УП РА Ж Н ЕН И Я

1. В основе зн ам ен и того кода Хэмминга Н длины 7 л еж ит к онф и гурация из


семи т о ч е к и семи прям ы х проекти вн ой плоскости F 2 P 2 (7 = 22 + 2 + 1 ). Э т а
к онф и гурация схем атично и зоб раж ен а на рис. 2 1 .
В каж дой строке м атр и ц ы и н цидентности J с то я т по т р и единицы: они о т ­
в еч аю т трём то ч к ам на одной прямой. К а ж д ая с т р о к а служ ит т а к ж е кодовы м
словом в Н веса 3. К одовы е слова веса 4 с оставл яю т м атр и ц у J ;
0 1 1 0 1 0 0 1 0 0 1 0 1 1
0 0 1 1 0 1 0 1 1 0 0 1 0 1
0 0 0 1 1 0 1 1 1 1 0 0 1 0
1 0 0 0 1 1 0 , J= 0 1 1 1 0 0 1
0 1 0 0 0 1 1 1 0 1 1 1 0 0
1 0 1 0 0 0 1 0 1 0 1 1 1 0
1 1 0 1 0 0 0 0 0 1 0 1 1 1
254 Г л. 5. Квадрики

М а тр и ц а J получается из J заменой 0 на 1 и 1 на 0. В сего в Н и м еется 16


кодовы х слов. М ы вы писали 14. В от оставш иеся два: ( 0 0 0 0 0 0 0 )