Вы находитесь на странице: 1из 201

В.Р.

Кайгородов

Курс аналитической
геометрии и линейной
алгебры

Казань
Предисловие к первому изданию
Материал, излагаемый ниже, представляет собой годовой курс лек-
ций, прочитанный автором на первом курсе физического факультета
Казанского университета в 1961-1983 учебных годах, рассчитан как
для аудиторного обучения, так и для самообразования.
Выпуск данного пособия обусловлен тем, что согласно последним
учебным планам 2 отдельных ранее курса "Аналитическая геомет-
рия" и "Высшая алгебра" объединены в один годовой курс с сокра-
щением числа учебных часов. Кроме того, методы линейной алне-
бры находят все большее приложение при рассмотрении прикладных
вопросов и студенты 1-го курса физического факультета сразу же
привлекаются к работе на ЭВМ при рассмотрении систем линейных
алгебраических уравнений. Все это потребовало пересмотра после-
довательности традиционного изложения материала и начать курс с
теории систем линейных уравнений, ввести сразу же такие понятия
из алгебры, как матрица, детерминант (определитель) матрицы, ранг
матрицы и т.д., что позволило использовать эти понятия при изло-
жении ряда вопросов из курса аналитической геометрии.
Автор сознательно сдвинул в середину курса введение аксиомати-
ческого определения линейного векторного пространства, исподволь
приближая студентов к этому абстрактному понятию через вопросы,
разбираемые в теории систем линейных уравнений и при исследова-
нии линейной зависимости векторов в аналитической геометрии.
Необходимость подготовить материал для прохождения темы "Гео-
метрические и физические приложения определенных интегралов" в
курсе математического анализа обуславливает проведение исследова-
ние общего уравнения кривых второго порядка и канонических урав-
нений поверхностей второго порядка в первом семестре, не прибегая
к методам линейной алгебры. К более строгому и последовательно-
му изложению этих вопросов автор возвращается в курсе линейной
алгебры.
Данный курс читается параллельно с курсом математического ана-
лиза, где на первых лекциях затрагивается теория множеств, дается
определение числового поля, подробно исследуются свойства полей
вещественных и комплексных чисел. Поэтому автор не останавлива-
ется на этих понятиях и под числовым полем K подразумевается ли-
бо поле вещественных чисел R, либо поле комплексных чисел C. На
протяжении курса об этом будет каждый раз указываться отдельно.
Студенты первого курса обычно испытывают затруднения при
применении теории к решению задач. На каждую тему в книге при-
водится решение 1-2 примеров с подробным объяснением хода рас-
суждений.
Лекционный материал в порядке изложения разбивается на сле-

2
дующие разделы:
I. Системы линейных алгебраических уравнений.
II. Векторная алгебра в трехмерном пространстве.
III. Задачи аналитической геометрии на плоскости и в простран-
стве.
IV. Линейные пространства и линейные отображения.
V. Билинейные и квадратичные формы.
VI. Аффинные, евклидовы и унитарные пространства.
Читатели, заинтересованные в более детальном и глубоком изуче-
нии курса, могут обратиться к литературе, указанной в конце книги.

3
Лекция1
Терминология, определения и задачи теории
систем линейных уравнений. Детерминант
(определитель) квадратной матрицы
В первых лекциях излагаются вопросы, связанные с теорией систем
линейных алгебраических уравнений. Все результаты справедливы
как для поля вещественных чисел R, так и для поля комплексных
чисел C. Ниже для числового поля употребляется общий символ K.
Под системой m линейных уравнений с n неизвестными понима-
ется m рассматриваемых в совокупности соотношений вида
9
a11 x1 + a12 x2 + : : : + a1n xn = b1 >
>
a21 x1 + a22 x2 + : : : + a2n xn = b2 =
(1.1)
:::::::::::::::::::::::: ::: ::: >
>
a1 x1 + am
m
2 x2 + : : : + am nx
n = bm ;

или в краткой форме


n
X
aij xj = bi ; (i = 1; m); (1.2)
j =1

где aij 2 K – коэффициенты системы, bi 2 K – свободные члены,


xj 2 K – неизвестные, подлежащие определению.
Таблица чисел
2 3
a11 a12 ::: a1n
6 a2 a22 ::: a2n 7
A=6 1 7 (1.3)
4: : : ::: ::: : : :5
am1 am
2 ::: amn
называется матрицей системы уравнений. Она имеет m строк и n
столбцов. Если m =n; то прямая называется квадратной, если же
=
m 6 n - прямоугольной. Числа aij называются элементами матрицы.
Матрица, содержащая только одну строку, называется матрицей-
строкой (с n элементами)
A = [a1 ; a2 ; : : : ; an ]: (1.4)
Матрица, содержащая один столбец, называется матрицей-столб-
цом (с m элементами) 2 3
a1
6 a2 7
A=6 6 7
. 7 (1.5)
4 .. 5
am

4
Если в (1.5) все ai = 0, то имеем нуль-столбец, обозначаемый
0
символом . Два столбца
2 3 2 3
a1 b1
6 a2 7 6 b2 7
A=6 6 7
. 7; B=6 6 7
. 7 (1.6)
4 .. 5 4 .. 5
am bm
считаем равными (пишем A B ), если ai= bi i ; m . Если хотя = ( =1 )
бы одно из чисел ak (k фиксировано) не совпадает с соответствующим
числом bk ; то столбцы считаются различными (A 6 B ). Под суммой =
+
столбцов A и B (пишем A B ) понимаем столбец
2 3
a1 + b1
6 a2 + b2 7
6 7
6 .. 7: (1.7)
4 . 5
am + bm
Под умножением столбца A на число  2 K (пишем A) понимаем
столбец вида 2 13
a
6 a2 7
6 7
6 . 7: (1.8)
.
4 . 5
am
Введенные операции позволяют рассматривать линейные комбина-
ции матриц-столбцов. Пусть имеем k столбцов
2 3 2 3 2 3
a11 a12 a1k
A1 = 6
4
.. 7 ;
. 5 A2 = 6
4
.. 7 ;
. 5 : : : ; Ak = 6
4
.. 7 :
. 5
am
1 am
2 am
k
Линейной комбинацией столбцов A1 ; : : : ; Ak с коэффициентами
+ + + )
1 ; : : : ; k (пишем 1 A1 2 A2 : : : k Ak называется столбец вида
2 3
k
P
6 j aj 71
6 j =1 7
6 7
6 .. 7: (1.9)
6 . 7
6 k 7
4P
j aj 5
m
j =1

Столбцы A1 ; : : : ; Ak называются линейно-зависимыми, если су-


ществуют такие числа 1 ; : : : ; 2 , среди которых хотя бы одно отлично

5
от нуля, что выполнено

1 A1 + 2 A2 + : : : + k Ak = 0 (0 нуль-столбец ):
+ + +
Если равенство 1 A1 2 A2 : : : k Ak =0
выполнено тогда и
только тогда, когда 1 =0 ; 2 =0
; : : : ; k =0
; то система матриц-
столбцов fA1 ; : : : ; Ak g называется линейно-независимой.
Например, система столбцов
2 3 2 3 2 3
1 0 1
627 6 17
6 0 7
A1 = 6
405 ;
7 A2 = 6
A3 = 6
4 15 ;
7
4 25
7

0 1 2
является линейно-зависимой, так как A1 + 2A2 A3 = 0; а система
столбцов 2 3 2 3 2 3
1 1 0
A1 = 0 ; A2 = 2 ; A3 = 15
4 5 4 5 4
0 0 1
является линейно-независимой, поскольку из соотношения 1 A1
+ +
2 A2 3 A3 =0
на основании равенства матриц-столбцов следует
9
1 + 2 = 0 =
22 + 3 = 0 =) 1 = 2 = 3 = 0:
3 = 0 ;

Очевидно, если между столбцами A1 ; : : : ; Ak k > ( 1)


существует ли-
нейная зависимость, то один из этих столбцов является линейной
комбинацией других. В самом деле, пусть выполнено 1 A1 2 A2 + +
+ =0
: : : k Ak ; где, например, 1 6 : Тогда=0
   
2 k
A1 = A + ::: + A:
1 2 1 k
Обратно, если какой-либо столбец есть линейная комбинация
других, то данная система столбцов линейно-зависима.
= + +
Действительно, пусть A1 2 A2 : : : k Ak . Тогда имеем

( 1)A1 + 2A2 + : : : + k Ak = 0;
где первый коэффициент отличен от нуля.
Все приведенное выше для матриц-столбцов тривиальным обра-
зом переносится и для матриц-строк, если ввести в рассмотрение
нуль-строку 0 = [0 0 0]
; ; : : : ; , сумму A B + =[ +
a1 b1 ; : : : ; an bn , + ]
умножение на число A =[
a1 ; : : : ; an : ]
6
Вернемся к рассмотрению систем вида (1.1). Решением системы
(1.1) называется матрица-столбец
2 3
c1
6 c2 7
X = 6 .. 7 ; 6 7
4.5
cn
если после подстановки чисел c1 ; : : : ; cn вместо неизвестных x1 ; : : : ; xn ,
соотношения в (1.1) обращаются в тождества. При этом решения
2 3 2 3
c11 c12
X1 = 64 .. 5 ; X2 = 4 .. 5
.7 6.7

cn1 cn2
считаются различными, если X1 6= X2 .
Система называется определенной, если она имеет единственное
решение, и неопределенной, если имеются, по крайней мере, два раз-
личных решения. В случае отсутствия решений система называется
несовместной, при наличии решений – совместной.
Например, система

x1 x2 x3 = 0
x1 + x2 + x3 = 0
является неопределенной, так как
2
03 2
03
X1 = 4 1 5 ; X2 = 4 1 5
1 1
– два различных решения указанной системы.
Система уравнений

x1 + x2 2x3 = 1
x1 x2 + 2x3 = 1
является несовместной системой, так как правые части обоих уравне-
ний одинаковы, а левые отличаются знаком.
В теории систем линейных уравнений рассматривают три основ-
ных задачи: (1) Выяснить, является ли система совместной или несов-
местной, (2) Если система совместна, то является ли она определен-
ной или неопределенной. В случае определенной системы необходимо
указать способ нахождения ее единственного решения. (3) В случае
неопределенной системы описать все множество ее решений.

7
При решении этих задач важную роль играют два понятия: (1)
детерминант (определитель) квадратной матрицы и (2) ранг матри-
цы.
Остановимся на первом понятии. Мы сформулируем правило, со-
гласно которому каждой квадратной матрице A aij i; j ;n =[ ]( =1 )
сопоставим число, называемое детерминантом (определителем n-
го порядка) матрицы. Это число обозначают символом A; а сам det
определитель обозначают так:
1
a1
2
a12 ::: a1n
a1 a22 ::: a2n
det A =
: : :

::: ::: : : : :
: : :
::: ::: : : :
n
a1 an2 ::: ann
Термин вычислить (раскрыть) определитель означает указать дан-
ное число, следуя сформулированному ниже определению детерми-
нанта с использованием свойств определителей, изложенных во вто-
рой лекции.
Для введения детерминанта используем альтернатор
(
i1 i2 :::ik
=1 )
j1 j2 :::jk i1 ; : : : ; ik ; j1 ; : : : ; jk ; n . Он определяется следующими усло-
= 1
виями: ji11 ji22:::i k
:::jk  , если j1 ; j2 ; : : : ; jk есть некоторая перестановка
значений индексов i1 ; i2 ; : : : ; ik , считая, что все эти значения различ-
ны; при этом берется +1 ; если перестановка четная, и ; если она 1
нечетная. Во всех остальных случаях ji11 ji22:::i k
:::jk =0
(т. е., если среди
значений i1 ; i2 ; : : : ; ik или среди значений j1 ; j2 ; : : : ; jk есть одинако-
вые, а также, если среди значений i1 ; i2 ; : : : ; ik есть такие, каких нет
среди j1 ; j2 ; : : : ; jk , и наоборот). 
Так, при k = 1 имеем альтернатор ji = 10;; ii ==6 jj , называемый
символом Кронекера (очень часто используемым в последующих
лекциях).
Определение 1. Детерминантом (определителем) матрицы A
называется число:
n
X
det A = i121 ;i:::n i1 i2 in
2 ;:::;in a1 a2 : : : an :
i1 ;:::;in =1
!
Поскольку существует n перестановок, то, согласно определению
альтернатора, определитель есть сумма n произведений элемен- !
тов матрицы, выбранных по одному из каждого столбца на раз-
личных строках и взятых со знаком плюс в случае четной пе-
рестановки номеров строк и со знаком минус в случае нечетной
перестановки.

8
Пример вычисления определителя второго порядка

a1
2
a12 = X
12
a a 2 i121 i2 ai11 ai22 = 11
12 a1 a1 +  12 a1 a2 +  12 a2 a1 +  12 a2 a2 :
1 2 12 1 2 21 1 2 22 1 2
1 2 i1 ;i2 =1
12
По определению альтернатора 11 12
; 22 12
; 12 12
; 21 =0 =0 =1 = 1:
Поэтому для любого определителя второго порядка имеем


a >> b
>>


>>
>>

= ad cb: (1.10)

c d

Пример вычисления определителя третьего порядка (члены с ну-


левым альтернатором не пишем):

a1 a12 a13 3
1 X
det A = a2
13
2 2
a2 a3 = i123
1 i2 i3 a1 a2 a3 =
i1 i2 i3
a1 a32 a33 i1 ;i2 ;i3 =1
123 a1 a2 a3 +  123 a1 a3 a2 +  123 a2 a1 a3 +
= 123 1 2 3 132 1 2 3 213 1 2 3
123 a2 a3 a1 +  123 a3 a1 a2 +  123 a3 a2 a1 :
+231 1 2 3 312 1 2 3 321 1 2 3
Используя определение альтернатора, приходим к правилу Саррюса
вычисления определителя -го порядка: 3
a == b == @ c == @ a b
== ==  ==  @
== == == 
=
==  =  == 
     
d e f
@ === @ === @ ===
d e = aek + bfg + cdh gec hfa kdb:
 == ==
 ==
=
=== ==
   =
  =  =
g h k g h

9
Лекция2
Свойства определителей. Алгебраическое
дополнение и минор элемента определителя
Рассмотрим матрицу из m строк и n столбцов
2 3
a11 a12 : : : a1n
6: : : : : : : : : : : :7
A=6 7
4: : : : : : : : : : : :5
am1 am 2 : : : am n

Ей можно сопоставить матрицу из n строк и m столбцов, у которой


каждая строка является столбцом матрицы A с тем же номером. Эту
матрицу 2 3
a11 a21 ::: am1
6 a1 a22 ::: am
B=6 2 27 7
4: : : ::: ::: : : :5
a1n a2n ::: amn
называют транспонированной матрицей и обозначают символом Atr ,
а переход от A к B – транспонированием. В случае квадратных мат-
риц транспонирование можно определить как поворот вокруг главной
диагонали.
Элементы bij транспонированной матрицы связаны с элементами
матрицы A соотношением bij = aji (i = 1; n; j = 1; m).
Свойство 1. При транспонировании квадратной матрицы значение
определителя не меняется, т. е. Atr A. det = det
В самом деле,
X X
det Atr = i1 i2 :::in b1 b2 bn = i121 i:::n
12 :::n i1 i2 in 1 2 n
2 :::in ai1 ai2 : : : ain :

Согласно определению альтернатора i12 1 i


:::n
2 :::i n 12 =
i1 i2 ::: in
:::n . Вследствие
P
этого det
Atr 11:::n n a1i1 : : : anin : Мы получили сумму n тех же про-
=i :::i
!
изведений элементов (с измененным порядком перемножения) мат-
рицы A и взятых с тем же знаком, что при вычислении суммы
X
i121 i:::n
2 :::in a1 a2 : : : an = det A:
i1 i2 in

это означает что Atr detA. = det


Доказанное предложение позволяет формулировать и доказывать
свойства определителей с использованием лишь столбцов определи-
теля. Автоматически все переносится и на его строки.

10
Свойство 2. При перестановке двух столбцов (строк) в матрице ее
детерминант меняет знак.
Сначала рассмотрим тот случай, когда переставлены соседние столб-
цы (например, s-й и s ( + 1)
-й). До перестановки имеем:
X
i11:::s s+1:::n i1 is is+1 in
:::is is+1 :::in a1 : : : as as+1 : : : an :

После перестановки
X
i11:::s +1 s:::n i1 is is+1 in
:::is is+1 :::in a1 : : : as+1 as : : : an :

Но
i11:::s +1 s:::n 1:::s s+1:::in
:::is is+1 :::in = i1 :::is is+1 :::in :
Свойство 2 для рассматриваемого случая доказано.
Обратимся к более общему случаю, когда меняются местами s-й
и l-й столбец, между которыми находится k столбцов. Такую пере-
становку можно осуществить последовательными перестановками s-
го столбца с соседними столбцами, двигаясь к l-му столбцу на его
место. Понадобится k +1
перестановок. Передвигая после этого ана-
логичным образом l-й столбец на место s-го, произведем еще k пере-
становок. Определитель получит множитель 2k+1 , т. е. изменит
( 1)
свой знак на противоположный.
Следствие свойства 2. Определитель, имеющий одинаковых 2
столбца (строки), равен нулю.
В самом деле, переставляя одинаковые столбцы мы, с одной сто-
роны, не изменим определителя, а, с другой, в силу свойства 2, он
изменяет знак на противоположный, т. е. A det = det
A. Следова-
тельно, det = 0
A .
Свойство 3. Если элементы s-го столбца матрицы A представляют
= +
собой линейную комбинацию вида ais 1 ai1s 2 ai2s : : : k aiks , то + +
det = det + det + + det
A 1 A1 2 A2 : : : k Ak , где матрицы A1 ,. . . ,Ak
получаются из матрицы A путем замены s-го столбца на элементы
ai1s ; ai2s ; : : : ; aiks .
В самом деле,
X
det A = i11:::s:::n
:::is :::in a1 : : : as : : : an =
i1 is in
X
= i11:::s:::n
:::is :::in a1 : : : (1 a1s + 2 a2s + : : : + k aks ) : : : an =
i1 is is is in
X X
= 1 i11:::s:::n a
:::is :::in 1
i1
: : : ais in
a
1s n + : : : +  k i11:::s:::n i1 is in
:::is :::in a1 : : : aks an :

Свойство 3 доказано.

11
Следствие свойства 3. Общий множитель у всех элементов столб-

ца (строки) можно вынести за знак определителя, т.е. если ais asi,

=
то det A =  det A.
Свойство 4. Если какой-либо столбец (строка) есть линейная ком-
бинация других столбцов (строк), то определитель равен нулю.
Действительно, применяя свойство 3, мы обнаружим в опреде-
лителях матриц A1 ; : : : ; Ak одинаковые столбцы, и в силу следствия
свойства 2 их детерминанты равны нулю, что и доказывает свой-
ство 4.
Свойство 5. Определитель не изменится, если к элементам столб-
ца (строки) прибавить соответствующие элементы другого столбца
(строки), умноженного на какое-либо число.
В самом деле, пусть к s-му столбцу матрицы A прибавляем l-

й, умноженный на . Во вновь полученной матрице A s-й столбец
i 
будет состоять из элементов: as =
ais ail . По свойству 3 A + det =
det + det
A  A1 , где у матрицы A1 s-й и l-й столбцы совпадают. Сле-

довательно, det = 0 det = det
A1 , и A A.
Пример. Требуется вычислить определитель

1
a1 a2 ::: an
1
x1 a2 ::: an
4= 1


a1 x2 ::: an :
: : : ::: ::: ::: : : :
1
a1 a2 ::: xn
Умножая последовательно первый столбец на an ; an 1 ; : : : ; a1 и вы-
читая результат после каждого умножения из n -го, n-го и т. д. ( + 1)
столбцов, получим по свойству 5

1
0 0 ::: 0

1
x1 a1 ::: 0 0

4= 1


0 x2 a2 : : : 0
:

: : : ::: ::: ::: :::
1
0 0 : : : xn an

Вычитая первую строку из всех остальных, мы придем к определи-


телю, у которого все элементы, за исключением главной диагонали
(она останется неизменной), нули. Из всех n произведений не ( + 1)!
нулевым останется лишь одно произведение элементов по главной
диагонали. В итоге =(
x1 a1 x2 a2 : : : xn an . )( ) ( )
12
Важную роль в теории определителей играют понятия алгебра-
ического дополнения и минора соответствующих фиксированному
элементу aks . Чтобы их ввести в рассмотрение, зафиксируем s-й стол-
бец и представим определитель как сумму n слагаемых, вынося в
качестве множителя элементы s-го столбца
X
det A = i11:::s:::n
:::is :::in a1 : : : as : : : an =
i1 is in
X
= a1s i11:::s:::n
:::1:::in a1 : : : as 1 as+1 : : : an +
i1 is 1 is+1 in
X
+ a2s i11:::s:::n
:::2:::in a1 : : : as 1 as+1 : : : an + : : : +
i1 is 1 is+1 in
X
+ ans i11:::s:::n i1 is 1 is+1 in
:::n:::in a1 : : : as 1 as+1 : : : an :

Обозначим соответственно суммы, стоящие после множителей a1s ; : : : ; an


s
1 2
через As ; As ; : : : ; As , и назовем их алгебраическими дополнениями
n
элементов a1s ; a2s ; : : : ; an
s.
Итак,
X n
det A = a1s A1s + a2s A2s + : : : + ans Ans = aks Aks (2.1)
k=1

Формула (2.1) носит название разложения определителя по эле-


ментам s-го столбца.
Приведенное выше определение алгебраического дополнения Aks
не имеет конструктивного характера, удобного для вычисления. Что-
бы преодолеть эту трудность, дадим определение минора Msk эле-
мента aks и установим связь между алгебраическим дополнением Aks
и минором Msk .
Определение 1. Если в определителе мысленно вычеркнуть s-й
столбец и k-ую строку, то оставшийся определитель n -го порядка ( 1)
называется минором элемента as и обозначается символом Msk .
k

Теорема 1. Имеет место следующая связь между алгебраиче-


скими дополнениями и соответствующими минорами:

Aks = ( 1)k+s Msk (2.2)

Докажем сначала теорему для частного случая, когда k = s = 1.


С этой целью из выражения

det A = i11i22:::n
:::n ai1 ai2 ain
1 2 n
выберем все слагаемые, содержащие множителем a11 . Вынося a11 за
скобки, получим, что в скобках останется следующее выражение:

13
P
i11 i22:::n i2
:::in a2 : : : an .
in
Но данная сумма есть (согласно определению
детерминанта) определитель n ( 1)
-го порядка, полученный из ис-
ходного вычеркиванием 1-го столбца и 1-й строки, т.е. A11 M11 (или =
A11 1+1 M11 ).
= ( 1)
Докажем сейчас (2.2) для любых k и s. Рассмотрим элемент b =
as и, переставляя последовательно s-й столбец и k-ую строку, пере-
k
ведем его в левый верхний угол определителя. Вновь полученный

определитель обозначим через 4. Согласно свойству 2 получаем, что

4 = ( 1)s 1+k 1 4 = ( 1)k+s 4. В силу определения минора имеем,
  
что M11 = Msk . По выше доказанному A11 M11 Msk . В силу равен- = =
 k+s и согласно правилу выделения алгебраического
ства 4 = ( 1) 4
дополнения Aks как суммы слагаемых с общим множителем ask полу-

чим, что A11 k+s Ak , и следовательно, имеем цепочку равенств
= ( 1)
  s
( 1) k+s Ak
s A11 M11 Msk , откуда тотчас следует выполнение (2.2).
= = =
Пример. Вычислить алгебраическое дополнение A ( ) элемента
в определителе
1 1 0 0


4 = 20 1 02 0 :

(2.3)


1 0 1 1

Согласно формуле (2.2) имеем


3+2
1 0 0
A( ) = ( 1) 0 2 0 = ( 1)5  1  2  1 = 2
1 1 1
Пример. Разложить определитель (2.3) по элементам третьего
столбца и вычислить его

1 1 0
2+3
4 = 2( 1) 2 +
1 0 1
1 1 0

+ ( 1)( 1)4+3 0 1 0 = 4 2 +
2

Наконец, приведем два следующих замечания.


Замечание 1. В силу свойства 1 имеет место аналогичная формуле
(2.1) формула разложения определителя по элементам строки
n
X
det A = alk Alk (2.4)
k=1

14
(l фиксировано!).
Замечание 2. Пусть определитель имеет два одинаковых столбца
(например, j -й и s-й, т.е. akj=aks k ( = 1 ))
; n . Он, как указано выше,
равен нулю. Разложим его по элементам j -го столбца. Имеем

a1s A1j + a2s A2j + : : : + ans Anj = 0 (j 6= s): (2.5)

Этот результат можно сформулировать так. Сумма произведе-


ний элементов какого-либо столбца (строки) на алгебраические
дополнения соответствующих элементов другого столбца
(строки) всегда равна нулю.

15
Лекция3
Правило Крамера. Ранг матрицы.
Теорема о базисном миноре
Перейдем к исследованию систем линейных уравнений. Прежде всего
рассмотрим систему n уравнений с n неизвестными, когда определи-
тель матрицы системы отличен от нуля. Наша цель состоит в дока-
зательстве, что такая система уравнений всегда совместна и имеет
единственное решение. Pn
Пусть задана система уравнений j =1 aj x
i j bi i ; n , где = ( =1 )
=[ ]
A aj , матрица системы и A 6 .
i det = 0
Покажем, что система совместна. С этой целью рассмотрим набор
4s
= ( =1 )
чисел cs det A s ; n , где 4s есть определитель вида

a1 ::: b1 ::: 1
an
1
a2 ::: b2 ::: a2n ;
4s = 1 (3.1)
: : : ::: ::: ::: : : :
n
a1 ::: bn ::: ann
т.е. в матрице A s-й столбец заменен столбцом из свободных членов
системы. Подставим числа cs вместо неизвестных xs в систему уравне-
ний, заметив предварительно, что разложение детерминантаPn (3.1) по
элементам s-го столбца дает следующее выражение: 4s k=1 bk As ,
k =
где Aks – алгебраические дополнения элементов s-го столбца матрицы
A. Имеем
n
X
aij cj =
n
X4 j
=
aij
1 Xn n
X
aj bk Akj =
i
j =1 j =1
det A det A j=1 k=1
1 Xn
k
Xn
= det A b aij Akj : (3.2)
k=1 j =1

Вспомнив формулу (2.1) и замечание 2 в конце лекции 2, мы получим,


что (
= det =
n
X A; если i k,
aij Akj
j =1
; если 0
i 6 k .
(3.3)
=
Поэтому при суммировании по k в правой части (3.2) останется лишь
одно слагаемое, равное bi A, т.е. det
n
X
aij cj =
1  bi  det A = bi
j =1
det A
имеем тождественное выполнение уравнений системы.

16
Итак,
2 41 3
det A
X= 6 . 7
4 .. 5 (3.4)
4n
det A
есть решение системы (3.1).
Докажем, что оно единственное. Предположим,P что имеется реше-
ние x =s c , отличное от (3.4). Имеем n тождеств nj=1 aij cj  bi i
s (=
1 )
; n . Умножим каждое тождество на алгебраическое дополнения Ais
(s фиксировано!) и просуммируем их по индексу i от 1 до n. Имеем
следующее тождества:
n
X n
X n
X
Ais aij cj = bi Ais (s = 1; n)
j =1 j =1 i=1
или
n
X n
X
cj aij Ais = 4s (s = 1; n): (3.5)
j =1 i=1

В силу (2.1) и (2.5) вытекает, что cs A 4s s ; n det = ( =1 )


Единственность решения, системы (3.1) доказана. Оно всегда име-
ет вид (3.4) и носит название формул Крамера.
Исследование более общих систем линейных уравнений, чем систе-
мы вида (3.1), приводит нас к введению важнейшего понятия ранга
матрицы.
С этой целью в матрице A =[ ]( =1 ; =1 )
aij i ; m j ; n зафиксируем p
произвольно выбранных строк и p произвольно выбранных столбцов
матрицы. Из элементов, стоящих на пересечении выбранных строк и
столбцов, построим квадратную матрицу p-го порядка Ap .

Определение 1. Детерминант матрицы A называется минором p-го


порядка матрицы A.

Например, для матрицы



1 1 1
2 0 1
имеем следующие миноры второго порядка:


1 1 ; 1 1 ; 1 1 ;
2 0 2 1 0 1
а миноры первого порядка совпадают с элементами матрицы.

17
Определение 2. Число r называется рангом матрицы A (пишем
ранг A = r), если у нее имеется хотя бы один минор r-го порядка,
отличный от нуля, а все миноры r ( + 1)
-го порядка (следовательно,
в силу формулы разложения (2.1) r ( + 2)
-го и т.д.) равны нулю. При
этом всякий отличный от нуля минор r-го порядка называется базис-
ным, а соответствующие столбцы и строки матрицы A называются
базисными столбцами и строками.

Пример. Найти ранги матриц


2 3 2 3
  0 1 1 1 0 1 0
A = 00 30 01 ; B = 40 1 15 ; C = 40 1 1 15 :
0 1 1 0 0 0 0
Очевидно, что ранг A = 1. Ранг B = 1, так как все миноры второго

1 0
порядка равны нулю. Ранг C = 2, ибо существует минор ( так-

1 1
1 0 0 1 ), который отличен от нуля, а все миноры третьего
же ;
0 1 1 1
порядка содержат нулевую строку и поэтому обращаются в нуль. В
матрице C каждый из указанных миноров 2-го порядка может быть
выбран за базисный минор.

Теорема 1 (о базисном миноре). Любой столбец (строка) матри-


цы A есть линейная комбинация ее базисных столбцов (строк).

Прежде всего отметим, что за счет перенумерации строк и столб-


цов можно добиться того, что базисный минор находится в левом
верхнем углу матрицы.
Рассмотрим минор r ( + 1)
-го порядка, полученный окаймлением
( =1 ; =1 )
k-ой строкой и j -м столбцом k ; m j ; n
1
a1
::: a1r a1j
: : :
::: ::: : : :

4r+1 = : : :
r ::: ::: : : : :
a1 ::: arr arj
k
a
1 ::: akr akj
Этот определитель всегда равен нулю, так как если j  r, то 4r+1
содержит 2 одинаковых столбца; если j > r, то 4r+1 есть минор
+1
r -го порядка и он равен нулю, поскольку ранг A r. К такому =
же выводу приходим, когда дело имеем с окаймляющей строкой.
Разложим 4r+1 по элементам последней строки. Получим

ak1 C1 + : : : + akr Cr + akj Cj = 0; (3.6)

18
где C1 ; : : : ; Cr ; Cj означают алгебраические дополнения элементов ak1 ;
: : : ; akr ; akj в определителе 4r+1 .
Поскольку Cj совпадает со значением базисного минора и не равно
нулю, то из (3.6) выводим
     
C1 k C2 k Cr k
akj = a +
Cj 1
a + ::: +
Cj 2
a:
Cj r
Придавая k значения от 1 до m, получим
2 13 2 13 2 13
aj   a1   ar
C1 6 .. 7 Cr 6 .. 7
4 .. 5 = 4 . 5 + ::: +
6 . 7
4 . 5:
C j C j
am
j am
1 am
r
Тем самым для столбцов теорема доказана. Если бы мы разло-
жили 4r+1 по элементам последнего столбца и затем рассмотрели
получившиеся соотношения для j =1
; n, то получили бы, что каж-
дая строка матрицы A есть линейная комбинация ее базисных строк.
Перейдем к выводу следствия из только что доказанной теоремы.
Следствие 1. Пусть дана квадратная матрица A и известно, что
det = 0
A . Это означает, что ранг A < n, и, следовательно, по крайней
мере один из столбцов (строк) является (на основании теоремы о ба-
зисном миноре) линейной комбинацией остальных столбцов (строк),
что говорит о линейной зависимости столбцов определителя.
Учитывая свойство 4 для определителей и только что полученный
факт, можно сделать вывод: детерминант матрицы A равен ну-
лю тогда и только тогда, когда его столбцы (строки) линейно-
зависимы.
Следствие 2. Ранг матрицы равен максимальному числу линейно-
независимых столбцов (строк) матрицы.
В самом деле, пусть ранг A =
r. Базисные столбцы (строки) яв-
ляются линейно-независимыми столбцами (строками), так как в про-
тивном случае по следствию 1 был бы равен нулю базисный минор.
Число линейно-независимых столбцов (строк) не может и превысить
числа r, потону что в противном случае нашелся бы столбец (стро-
ка), не являющийся линейной комбинацией базисных (см. лекцию 1 о
линейной зависимости матриц-столбцов), что противоречит теореме
о базисном миноре. Таким образом, максимальное число линейно-
независимых столбцов матрицы всегда совпадает с максималь-
ным числом линейно-независимых строк матрицы и равно ее
рангу.
На основании этого следствия можно дать второе определение
ранга матрицы.

19
Определение 3. Рангом матрицы называется максимальное число
линейно-независимых столбцов (строк) этой матрицы.

Следствие 3. Ранг матрицы не изменится, если (1) переставить ме-


стами столбцы (строки); (2) умножить столбец (строку) на число,
отличное от нуля; (3) прибавить к столбцу (строке) другой столбец
(строку), умноженный на некоторый общий множитель.

Данное утверждение очевидным образом выполняется для преоб-


разований (1) и (2), так как после них максимальное число линейно-
независимых столбцов (строк) не изменится. Докажем справедли-
вость утверждения для преобразования (3). Если основной s-й стол-
бец, к которому прибавляются другие со множителем, не входит в
число базисных, то во вновь преобразованной матрице согласно тео-
реме о базисном миноре он будет линейной комбинацией базисных и
ранг матрицы не изменится. Если же основной s-й столбец, к кото-
рому прибавляются со множителями другие столбцы, входит в число
базисных, то опять-таки максимальное число линейно-независимых
столбцов остается неизменным. Действительно, если бы s-й столбец
в преобразованной матрице стал бы являться линейной комбинацией
других базисных столбцов, то мы сумели бы s-й столбец, взятый до
преобразования, выразить как линейную комбинацию других базис-
ных столбцов матрицы A и прибавленного столбца.
Если прибавленный столбец базисный, то тогда между базисными
столбцами матрицы A существует линейная зависимость. Противоре-
чие. Если же прибавленный столбец не входит в число базисных, то он
представляет собой линейную комбинацию базисных, и, следователь-
но, опять-таки между базисными столбцами матрицы A существует
линейная зависимость. Снова приходим к противоречию.
Преобразования (1)-(3), не меняющие ранга матрицы, позволяют
дать следующий конструктивный метод нахождения ранга матрицы.
Пусть в матрице A =[ ]( =1 ; =1 )
aij i ; m j ; n имеется элемент i 6 . =0
Переставляя строки и столбцы, поместим его в левом верхнем углу.
Затем, вычитая из каждой строки матрицы первую строку, умножен-
ную на соответствующий множитель, обратим в нуль все оставшиеся
элементы первого столбца. Аналогичную операцию проводим и со
столбцами, обращая в нуль все элементы первой строки. Имеем
2 3 2 3
a11 a12 ::: a1n 1 0 : : : 0
6 a2 a22 a2n 7 b22 : : : b2n 7
::: 760
6
A=6 1
: : : 5 4: : : : : : : : : : : : 5 :
7
4: : : ::: :::
am
1 am
2 ::: amn 0 bm2 : : : bmn
Знак  означает эквивалентность матриц в смысле неизменности
ранга у обеих матриц. Аналогично поступаем с матрицей B bij =[ ]
20
(i = 2; m; j = 2; n). В итоге мы придем к матрице вида
2 .. 3
6 1
.
7
6 .. 7
6
6
2 0 . 7
7
6 7
6 .. .. 07
6 . . 7
6 7
6 7:
6 .. 7
6
6 0 r . 7
7
6 7
6 .. 7
6: : : : : : ::: ::: . 7
4 5
..
0 . 0

Число не равных нулю и расположенных по главной диагонали блока


элементов совпадает с рангом матрицы A.
Пример. Найти ранг матрицы
2
2 3 4 13 2 1 2 1 63
A=4 1 2 1 65  4 2 3 4 15 
1 5 3 5 1 5 3 5
2 3 2
1 0 0 0 1 0 0 03
 0
4 7 2 11  0
5 4 7 0 05 :
0 7 2 11 0 0 0 0
Ранг матрицы A равен двум.

21
Лекция4
Теорема Кронекера-Капелли. Условия
нетривиальной совместности однородной системы.
Общее решение системы. Фундаментальная
система решений
Пусть задана система уравнений
n
X
aij xj = bi (i = 1; m):
j =1

Если хотя бы одно из чисел bi отлично от нуля, то система называется


неоднородной. Если все свободные члены bi равны нулю, то система
называется однородной.
Перейдем к установлению условий совместности неоднородной си-
стемы уравнений. Ее можно записать в виде
2 3 2 3 2 3 2 3
a11 a12 a1n b1
6 27 6 27 6 a2 7 6 b2 7
x 1 6 a1 7
6 . 7 +x 2 6 a2 7
6 . 7 + ::: + x n 6 n7
6 . 7 = 64 .. 75 :
6 7
(4.1)
4 .. 5 4 .. 5 4 .. 5 .
am 1 am 2 amn bm
Кроме матрицы системы A =[ ]
aij будем рассматривать расширенную
матрицу системы 2
1 1 13 a1 : : : an b
B=
6
6    77 :
4    5
am
1 : : : am
n b
m

Теорема 1 (Кронекера-Капелли). Для того, чтобы неоднородная


система линейных уравнений была совместна, необходимо и до-
статочно, чтобы ранг матрицы системы и ранг расширенной
матрицы совпадали.
Необходимость. Дано, что система уравнений совместна. Следо-
вательно, существует набор чисел c1 ; : : : ; cn таких, что выполнено
2 3 2 3 2 3 2 3
a11 a12 a1n b1
c1 6
4
.. 7
. 5 + c2 64 .. 7
. 5 + : : : + cn 64 .. 7
. 5 = 64 ... 75 :
am
1 am
2 am
n bm
Это означает, что последний столбец расширенной матрицы B есть
линейная комбинация столбцов матрицы A. Ранги матриц совпадают.

22
= =
Достаточность. Дано: r ранг A ранг B . В силу строения мат-
рицы B это означает, что существует один и тот же базисный минор
как для A, так и для B . В таком случае последний столбец матрицы B
(по теореме о базисном миноре) есть линейная комбинация базисных
столбцов, и мы можем его представить в виде (для простоты считаем
первые r столбцов базисными)
2 3 2 3 2 3 2 3
b1 a11 a12 a1r
6 . 7
4 .. 5 = 1 6
4
.. 7
. 5 + 2 64 .. 7
. 5 + : : : + r 64 .. 7
. 5 +
bm am
1 am
2 am
r
2 1 3 2 3
ar+1 a1n
+ 0  64 .. 7
. 5 + : : : + 0  64 .. 7 ;
. 5
am
r+1 am
n

0
откуда следует, что набор чисел 1 ; : : : ; r , ; : : : ; , подставленный в 0
систему вместо x1 ; : : : ; xn обратит уравнения системы в тождества.
Система совместна.
Пример. Совместна ли система уравнений?
8
< x1 + 2x2 3x3 = 1
x1 x2 + 2 x3 = 0
:
2x1 + x2 x3 = 1
Решение:
2 3 2 3
1 2 3 17 61 2 3
6
..
.
..
. 17
B= 1 1 2 6
6 075  640 3 5
7 6 ..
.
..
. 175 
7
4
2 1 1 1 0 3 5
..
.
..
. 1
2 3
61 2 3 . 17 ..

 640 3 5 ... 1775 :


6

0 0 0 ... 0
Ранг A = ранг B = 2. Система совместна. Pn
Обратимся к рассмотрению однородных систем уравнений j =1 aij xj
=0( =1 )
i ; m . Такая система всегда совместна, так как набор ; ; : : : ; 00 0
всегда удовлетворяет системе. Нулевое решение называется триви-
альным и нас не интересует.
Поставим вопрос об условиях нетривиальной совместности од-
нородной системы уравнений. Ответ дает, следующее утверждение.

23
Теорема 2. Для того, чтобы, однородная система линейных
уравнений была нетривиально совместна, необходимо и доста-
точно, чтобы ранг матрицы системы был меньше числа неиз-
вестных.

Необходимость. Дано: однородная система нетривиально сов-


местна. Следовательно, существует набор чисел c1 ; : : : ; cn , среди ко-
торых хотя бы одно отлично от нуля, что выполнено
2 3 2 3 2 3 2 3
a11 a12 a1n 0
c1 6 . 7
4 .. 5 + c2 6 . 7
4 .. 5 + ::: + cn 6 . 7
4 .. 5 = 6.7
4 .. 5 :
am 1 am2 am
n 0
Последнее соотношение определяет линейную зависимость столбцов
матрицы системы. Поэтому ранг A < n.
Достаточность. Дано, что ранг A < n. В таком случае (см. лек-
цию 3, следствие 1) столбцы матрицы линейно-зависимы. Это означа-
ет, что существуют такие числа 1 ; : : : ; n , среди которых по крайней
мере одно отлично от нуля, что
2 3 2 3 2 3 2 3
a11 a12 a1n 0
1 6
4
.. 7
. 5 + 2 64 .. 7
. 5 + : : : + n 64 .. 7
. 5 = 64 ... 75 :
am
1 am
2 am
n 0
Следовательно, набор чисел 1 ; : : : ; n , подставленный вместо x1 ; : : : ; xn
в систему, обратит уравнения в тождества. Система нетривиально
совместна.
Как описать все множество решений системы линейных уравне-
ний? Чтобы ответить на этот вопрос, дадим определение общего ре-
шения для системы линейных уравнений.

Определение 1. Общим решением называется набор функций


1 a b c1 ; : : : ; cq ; : : : ; n a b c1 ; : : : ; cq , зависящих от коэффициентов
(; ; ) (;; )
системы, свободных членов и q числовых параметров, удовлетворя-

ющий двум условиям: (1) подстановка 1 ; : : : ; n в систему вместо 
x1 ; : : : ; xn обращает уравнения в тождества; (2) любое решение си-
стемы может быть получено из этого набора путем фиксирования
определенных значений параметров c1 ; : : : ; cq .

Как конструктивно найти общее решение системы? Предлагается


следующий метод.
Пусть r – ранг матрицы системы. За счет перенумерации перемен-
ных и уравнений можно добиться того, что базисный минор матрицы
эквивалентной системы уравнений будет находиться в левом верхнем

24
углу матрицы. Все дальнейшие рассуждения проводятся для этого
случая.
Рассмотрим первые r уравнений системы (4.1) и перепишем их в
следующем виде:
8
< a11 x1 + : : : + a1r xr = b1 a1r+1 cr+1 : : : a1n cn
::: ::: ::: : (4.2)
: r 1 +1
a1 x + : : : + ar x = b ar+1 c
r r r r r : : : an c
r n

Здесь переменные xr+1 ; : : : ; xn являются параметрами и обозначе-


ны через cr+1 ; : : : ; cn (cq 2 K, q = r + 1; n).

Определитель данной системы уравнений совпадает с базисным
минором и, применяя формулы Крамера, получим
xp = p (p = 1; r); (4.3)
где
p
z }| {
Xn
a11 ::: b1 a1q cq : : : a1r
p = Pq=r+1 : (4.4)
a21 : : : b2 n
q=r+1 aq c
2q : : : a2r
::: ::: Pn: : : :::
ar1 : : : br q=r+1 aq c
r q : : : arr
Из приведенных рассуждений следует, что набор чисел 1 ; : : : ;
r ; cr+1 ; : : : ; cn , подставленных вместо неизвестных, обращает в тож-

дество первые r уравнений системы линейных уравнений (4.1). Пока-
жем, что этот набор обращает в тождества и оставшиеся m r урав- ( )
нений рассматриваемой неоднородной системы. С этой целью вспом-
ним, что r ( +1) –я,. . . , m–я строка расширенной матрицы есть линей-
ная комбинация первых r базисных строк. Для системы линейных
уравнений это означает, что каждое уравнение, начиная с r ( + 1)
-
го и кончая m-ым, есть линейная комбинация первых r уравнений.
Вследствие тождественного удовлетворения рассматриваемым набо-
ром первых r уравнений тождественно удовлетворяются и оставшиеся
( )
m r уравнений системы.
Итак, матрица-столбец
2 1 3

6 . 7
6 .. 7
6 7
6 r 7
X= 6  7
6cr+1 7 (4.5)
6 7
6 . 7
4 .. 5
cn

25
есть решение исследуемой системы уравнений.
Докажем, что X задает общее решение системы. Для этого нам
необходимо показать, что любое решение системы содержится в X
при определенных значениях параметров cr+1 ; : : : ; cn .
Пусть набор c1 ; c2 ; : : : ; cn – некоторое решение системы. Оно яв-
ляется также решением системы (4.2). Зафиксируем в правой части
(4.2) значения параметров cq , положив cr+1 = cr+1 ; : : : ; cn cn . Как
=
известно, по формулам Крамера решение определяется однозначным
образом. Поэтому с необходимостью числа cp p ( =1 ); r будут сов-
p , 
падать с числами 
где за p обозначены определители (4.4), у
которых вместо параметров cq выступают фиксированные значения
( = +1 )
cq q r ; n .
Пример. Решить систему уравнений
8
< x1 + 2x2 3x3 = 1
x1 x2 + 2x3 = 0 :
:
2x1 + x2 x3 = 1
Разбирая предыдущий пример, мы показали, что система совместна.
Ранг основной и расширенной матриц равен двум. Минор 2-го поряд-
ка в левом верхнем углу

 = 11 21 = 3


является базисным.
Поступаем согласно разработанному алгоритму. Имеем

x1 + 2 x2 = 1 + 3 c3
x1 x2 = 2 c3

1 + 3c3 2


x1 =
2
c3 1
= 1 (1 c3);
3 3

1 1 + 3c3

1 2c3 1
x2 =
3 = 3 (5c3 + 1)
Получили общее решение системы.
При нахождении общего решения однородной системы линейных
уравнений важную роль играют понятия нормальной фундамен-
тальной системы решений и фундаментальной системы реше-
ний.

26
Pn
Пусть задана однородная система j =1 aij xj i ; m . Пусть =0( =1 )
ранг матрицы A =[ ]
aij равен r. Согласно предложенному выше мето-
ду решение системы находится по формулам (4.5), где в определите-

лях p необходимо положить bp p ;r . =0( =1 )
Зададимся n r наборами значений параметров cr+1 ; : : : ; cn , фик-
( )
сируя их следующим образом:

2 r+1 3 2 3 2 r+1 3 2 3 2 r+1 3 2 3


c1 1 c2 0 cn r 0
6cr+2 7 6 7 6cr+2 7
0 617 6cr+2 7 0
6 7
6 1 7 6 7 6 2 7
6 . 7
4 .. 5
= 6.7 ; 6 . 7
4 .. 5 4 .. 5
= 6 7
4 .. 5
6 n r7
6.7 ; : : : ; 6 . 7
4 .. 5
= 6 7
6.7 :
4 .. 5
(4.6)

cn 1 0 cn 2 0 cnn r 1
Этим наборам, согласно (4.5), будет соответствовать (n r) решений
2 3 2 3 2 3
x11 x12 x1n r
6 . 7 6 . 7 6 . 7
6 .. 7 6 .. 7 6 .. 7
6 7 6 7 6 7
6x r 7 6x r 7 6xr 7
6 17 6 27 6 n r7
X1 = 6 7 1
6 7 ; X2 = 0 6 7 ; : : : ; Xn r
6 7 = 6
6 0
7;
7 (4.7)
6 7
6 7 0 1 6 7
6 7
6
6
7
70
6 . 7 6 . 7 6 . 7
4 .. 5 4 .. 5 .
4 . 5
0 0 1
p p
где x1 ; : : : ; xn r подсчитываются по формулам (4.3) с учетом фикси-
рованных значений cq q r ( = +1 )
; n . Они имеют вид

a11 ( a1r+1 ) a1r



::: :::
a21 ( a2r+1 ) a2r

::: :::
= 1

xp1 ::: ::: ::: ::: : : : ; : : : ;



ar1 ::: (| arr+1 )
{z }
::: arr

p

a11 ::: ( a1n2 ) ::: a1r
a21 a2r

::: ( an) :::
= 1

xpn r
::: ::: ::: ::: : : : : (4.8)



ar1 ::: (| {zarn}) ::: arr
p

Система полученных решений образует линейно-независимую систе-


му матриц-столбцов, так как в матрице, содержащей n строк и n r

27
столбцов 2 3
x11 x12 : : : x1n r
6 . .. .. 7
6 .. . . 7
6 7
6xr xr2 : : : xrn r 7
6 1 7
6
6 1 0 : : : 0 77
6
6 0 1 : : : 0 77
6 . .. .. 7
4 .. . . 5
0 0 ::: 1
имеется минор (n r)-го порядка


1 0 ::: 0

0 1 ::: 0
. .. .. ;
.. . .

0 0 ::: 1
отличный от нуля.
Определение 2. Система решений (4.7) однородной системы линей-
ных уравнений, соответствующая n r наборам (4.6) параметров ( )
( = +1 )
cq q r ; n , называется нормальной фундаментальной систе-
мой решений.
Теорема 3. Общее решение однородной системы уравнений есть
линейная комбинация с произвольными постоянными нормаль-
ной фундаментальной системы решений.
В самом деле, рассматривая общее решение (4.5), где в определи-

телях p постоянные bi i ( =1 )
; m равны нулю, используя свойство 3
определителей, получим
a11 : : : ( a1r+1 cr+1 ) : : : a1r
8
>
>
1 : :r: : : : ::: ::: :::
>
>
>
>
>
>
>
xp =
 a1 : : :
(| ar+1 )c
r r +1 : : : arr

+ :::
>
> {z }
>
>
> p
<
a11 : : : a1n cn ) : : : a1r

>
>
>


(

(4.9)
>
>
> + 1 ::: :::
::: ::: :::
>
>
>
>
>

 ar1 : : :


(| an c ) : : : arr
{z
r n
}



>
>
>
: p
xq = cq (q = r + 1; n; p = 1; r)
или
(  1  2  n r
= cr+1  + cr+2  
xp  + ::: + cn
p p p
  ; (4.10)
xq = cq (q = r + 1; n; p = 1; r)

28
где
1
( a1r+1 ) : : : a1r

a1 :::

p1 = 1
: : : ::: ::: : : : : : :
r
a1

::: (| ar+1 ) : : : arr ; : : : ;
r
{z }
p
1
a1

::: ( a1n) : : : a1r

pn r = 1
: : : ::: ::: : : : : : :
(| {zarn}) : : : arr :
r
a1 :::

p

С учетом (4.7), (4.8) общее решение (4.10) может быть записано в виде
X = cr+1 X1 + cr+2 X2 + : : : + cn Xn r ; (4.11)
что и доказывает теорему.
Зададимся сейчас n r наборами параметров cr+1 ; : : : ; cn , фик-
( )
сируя их произвольным образом
2 3 2 3 2 3
cr+1 c r +1 c r +1
6 1. 7 6 2. 7 6 n. r 7
6 . 7;6 . 7;:::;6 . 7 (4.12)
4 . 5 4 . 5 4 . 5
 n 
cn 1 c2 cnn r
с одним лишь условием, чтобы детерминант матрицы
2 r+1 r+1 3
cr+1 c2 : : : cn
6 1. r
.. 7
N= 6 .
4 .
..
. . 5
7
  
cn 1 cn2 : : : cnn r
был отличен от нуля.
Наборам (4.12) отвечает (n r) линейно-независимых (из-за det N 6=
0) решений
2 1 3 2 1 3 21 3
x1 x2 xn r
6 . 7 6 . 7 6 . 7
6 .. 7 6 . 7 6 .. 7
6 7 6 . 7 6 7
6 r 7  6 r 7 6r 7
 6 x1 7 6 x2 7  6x n r 7
X1 = 6r+1 7 ; X 2
6 c1 7
= 6 7 ; : : : ; Xn r
6cr+1 7 = 6 r+1 7 ;
6 cn r 7
(4.13)
6 7 6 2 7 6 7
6 .. 7 6 . 7 6 .. 7
4 . 5 6 . 7 4 . 5
4 . 5
 n 
cn
1 c2 cnn r
Система решений (4.13), отвечающая наборам (4.12) параметров cr+1 ;
det = 0
: : : ; cn , при условии N 6 , называется фундаментальной системой
решений.

29
Как и выше, можно доказать, что общее решение однородной си-
стемы линейных уравнений есть линейная комбинация с произ-
вольными постоянными фундаментальной системы решений.
Доказательство проводить не будем, заметив только, что каждое

из X s s ( =1 )
; n r по доказанной выше теореме есть конкретная ли-
нейная комбинация нормальной фундаментальной системы решений.

Из-за линейной независимости систем fXs g и fX s g каждое из
Xs также представляет собой фиксированную линейную комбинацию

матриц-столбцов X s (ее конкретный вид может быть получен по фор-
мулам Крамера). Подстановка этих комбинаций в (4.11) приведет нас
к желаемому результату.
В заключение
Pn вернемся к неоднороднымPсистемам линейных урав-
нений j =1 aj x
i j bi i = ( =1 )
; m . Система nj=1 aij xj i ;m с =0( =1 )
той же матрицей A =[ ]
aj называется однородной системой, соот-
i
ветствующей рассматриваемой неоднородной системе.

Теорема 4. Общее решение неоднородной системы есть сумма


частного решения неоднородной системы и общего решения со-
ответствующей однородной системы.

В самом деле, пусть 2 3


x10
6 x20 7
X0 = 6 .. 7 6 7
4 . 5
xn0
– частное решение неоднородной системы
0 1
n
X
@ aij xj0  bi (i = 1; m)A :
j =1

Вместо неизвестных xj в неоднородной системе введем новые неиз-


j
вестные y j , положив xj x0 y j . Имеем= +
n
X n
X n
X
aij (x0 + ) =
j
yj aij xj0 + aij yj = bi (i = 1; m):
j =1 j =1 j =1
Pn
Поскольку i j
j =1 aj x0  bi , то получаем, что
n
X
aij yj = 0 (i = 1; m):
j =1

30
Неизвестные y j являются неизвестными для соответствующей од-
нородной системы. Пусть Y – общее решение этой системы уравнений,
найденное пo формуле (4.11). Тогда для неоднородной системы общее
решение имеет вид
n
Xr
X = X0 + cr+s Xs ; (4.14)
s=1
где fXs g образуют нормальную фундаментальную систему решений
(фундаментальную систему решений).
На этом мы заканчиваем рассмотрение теории систем линейных
алгебраических уравнений и переходим к вопросам векторной алгеб-
ры в трехмерном евклидовом пространстве.
Отметим, что в этом курсе мы не останавливаемся на численных
методах (с использованием ЭВМ) решения систем уравнений, так как
эти вопросы для студентов физических факультетов вынесены в от-
дельный учебный курс.

31
Лекция5
Векторы. Сложение векторов. Умножение вектора
на число. Линейная зависимость векторов в
трехмерном пространстве
С этой лекции мы переходим к изложению вопросов аналитической
геометрии на плоскости и в пространстве, заметив, что ареной дей-
ствия является трехмерное евклидово пространство. Строгое аксио-
матическое определение n-мерного евклидова пространства будет да-
но позднее (в курсе линейной алгебры), а сейчас мы будем опираться
лишь на те геометрические понятия евклидова пространства, что рас-
смотрены в школьном курсе элементарной геометрии.
Хотя содержание аналитической геометрии концентрируется во-
круг понятия координат, целесообразно начать ее изложение с поня-
тия вектора и аксиоматически ввести операции с векторами, а затем
уже переходить к координатной записи. Отметим, что физика и меха-
ника дают нам многочисленные примеры использования векторных
величин, как, например, скорость, ускорение тела, сила и т.д. В гео-
метрии абстрагируются от конкретного физического содержания век-
торных величин и говорят просто о векторе. Отметим, что в лекциях
5 - 14 в качестве числового поля выступает поле вещественных чисел.

Определение 1. Если для двух точек A; B указано, какая из них


является начальной и какая конечной, то говорят об упорядоченной
( )
паре точек A; B (A – начальная точка, B – конечная точка).

Определение 2. Всякую упорядоченную пару точек называют на-


!
правленным отрезком или геометрическим вектором и обознача-
ют символом AB .

Рис. 1: a) вектор ~ ; б) коллинеарные векторы; в) равные векторы.


AB

32
На вектор можно смотреть как на оператор сдвига точки A в точ-
ку B . Его обозначают обычно малой латинской буквой со стрелкой
(чертой) сверху: ~a; ~b; . . . ,m
!
~ ; . . . Поэтому вектор AB можно записать в
виде ~a A( )=B: Но такую громоздкую запись обычно не используют,
оставляя лишь первую букву со стрелкой (чертой) наверху.

Определение 3. Расстояние между точками A и B называют длиной


!
вектора AB и для обозначения длины пользуются символом модуля
!
(абсолютной величины): jAB j; j~aj; : : :

Определение 4. Векторы называются коллинеарными, если они ле-


жат на одной прямой либо на параллельных прямых.

Определение 5. Вектор называется нулевым (пишется ~ либо про- 0


0
сто ), если его начало и конец совпадают. Очевидно, что длина нуле-
вого вектора равна нулю, а направление не определено (можно счи-
тать, что его направление какое угодно). Вследствие этого нулевой
вектор коллинеарен с любым вектором пространства.

Рис. 2:

Определение 6. Два вектора считаются равными, если их длины


равны и они имеют одинаковые направления (сонаправлены). Пишем:
=
~a ~b (Рис. 1).

! ~a. Это
Из последнего определения следует, что каковы бы ни были точ-
ка P и вектор ~a, всегда найдется такая точка Q, что P Q =
означает, что точка приложения вектора ~a может быть выбрана про-
извольно (оператор сдвига ~a одновременно действует на все точки

33
пространства). Такие векторы называются свободными. В дальней-
шем мы будем рассматривать только свободные векторы, хотя в ста-
тике твердого тела используют скользящие векторы. Для них опре-
деление равных векторов состоит в том, что два вектора считаются
равными, если их длины равны, они сонаправлены и лежат на одной
прямой.
Для свободных векторов введем две линейные операции (пришед-
шие из физики) и укажем их свойства.
Определение 7. Суммой векторов ~a1 ;~a2 ; : : : ;~ak называется вектор
= + + +
~a (пишем ~a ~a1 ~a2 : : : ~ak ), который замыкает ломаную линию,
построенную из данных векторов так, что начало каждого последую-
щего вектора совмещается с концом предыдущего. Замыкающий век-
тор ~a направлен из начала первого вектора к концу последнего (см.
Рис. 2).

Рис. 3:

Операция сложения векторов обладает следующими свойствами.


Свойство 1 (коммутативность). Для любых векторов ~a + ~b = ~b + ~a.
! ! !
В самом деле, для коллинеарных векторов свойство 1 очевидно. В
= =
случае не коллинеарных векторов (Рис. 3а) AD ~a BC; DC ~b = =
! + = ! = +
AB . Поэтому ~a ~b AC ~b ~a.
Свойство 2 (ассоциативность). Для любых векторов (~a + ~b) + ~c =
+( + )
~a ~b ~c .
Действительно (см. Рис. 3б), AD
! = AC
! + CD
! и AD
! = AB
! + BD
!.
( + )+ = +( + )
Поэтому ~a ~b ~c ~a ~b ~c .
Свойство 3. Нуль-вектор является нулем сложения: ~a + ~0 = ~a.
34
Прежде чем переходить к формулировка четвертого свойства, да-
дим определение противоположного вектора.

Определение 8. Вектор ~a0 (обозначается также символом ~a назы- )


вается противоположным по отношению к вектору ~a, если длины
векторов ~a и ~a0 равны, а направления противоположны.

Поскольку для любых точек выполнено AB


! + BA
! = AA
!, то можно
сформулировать

Свойство 1. Для любого вектора ~a существует противоположный


+ =0
вектор ~a0 , такой, что ~a ~a0 ~ .

Перейдем к следующей операции - умножению вектора на веще-


ственное число.

Определение 9. Произведением вектора ~a на число  называется


=
вектор (символ ~a) такой, что (1) j~aj jj  j~aj; (2) векторы ~a и ~a
0
сонаправлены, если  > , и противоположно направлены, если  < , 0
=0
~a , если  . =0
Операция произведения вектора на число обладает следующими
четырьмя свойствами, доказательства которых просты и предостав-
ляются читателю.

Свойство 1. 1  ~a = ~a для любого вектора ~a 6= 0.


Свойство 2. ( + )~a = ~a + ~a для любых ;  2 R и любого вектора
~a.
Свойство 3. ()~a = (~a) для любых ;  2 R и любого ~a.
Свойство 4. (~a + ~b) = ~a + ~b для любого  2 R и любых векторов
~a и ~b.
Из определения операции умножения вектора на число следует,
что противоположный вектор ~a0 может быть получен путем умноже-
ния вектора ~a на 1 = ( 1)
: ~a0 ~a. Отсюда и обозначение ~a, принятое
для противоположного вектора.

Определение 10. Разностью векторов ~a и ~b называем сумму век-


тора ~a и противоположного вектора ~b0 .

Обозначаем разность символом ~a ~b. Итак, ~a ~b ~a def


= + ( 1)
 ~b (см.
Рис. 4)
Пользуясь операцией умножения вектора на число, выведем фор-
мулу для нахождения орта вектора.

35
Определение 11. Ортом вектора ~a называется вектор единичной
длины, имеющей то же направление, что и вектор ~a.

Орт вектора обозначают символом ~a0 (либо ~e).


По определению ~a0 ~a, где  > . Но j~a0 j
= 0 =1
: Поэтому j~aj =
=1 1 =
  j~aj . Следовательно, множитель  j~aj . Окончательно можно
записать, что
~a0 =
1 ~a = ~a
j~aj j~aj : (5.1)

Обе линейные операции позволяют нам рассматривать линейные


комбинации векторов a~1 ; : : : ; a~s с коэффициентами 1 ; : : : ; s
~l = 1~a1 + 2~a2 + : : : + s~as : (5.2)

Определение 12. Система векторов ~a1 ; : : : ;~as называется линейно-


зависимой, если существуют такие числа 1 ; : : : ; s среди которых
хотя бы одно не равно нулю, что выполнено

1~a1 + 2~a2 + : : : + s~as = ~0: (5.3)

Если же (5.3) для системы ~a1 ; : : : ;~as выполнено тогда и только


тогда, когда все i =0
, то система векторов называется линейно-
независимой.
Приводимые ниже теоремы полностью разъясняют геометриче-
ский смысл линейной зависимости векторов.

Теорема 1. Для того, чтобы система, состоящая из одного век-


тора, была линейно-зависимой, необходимо и достаточно, что-
бы он был нулевым вектором.

В самом деле, пусть система f~ag,


состоящая из одного вектора, линейно-
зависима. Следовательно, ~a =0~,
где  6 =0
. Вектор ~a нулевой. Пусть,
обратно, вектор ~a есть нуль-вектор.
Очевидно, что при любом  6=0 име-
ем ~a ~ . =0
Вывод из этой теоремы можно
сформулировать и так: каждый не
нулевой вектор есть линейно-не-
Рис. 4:
зависимый вектор.

Теорема 2. Для того, чтобы система, состоящая из двух век-


торов, была линейно-зависимой, необходимо и достаточно, что-
бы векторы были коллинеарны.

36
Действительно, если система f~a; ~bg из двух векторов линейно-зави-
+ =0
сима, то ~a ~b =0
, где  6 =0
или  6 =0
. Если  6 , то ~a =( )
 ~b и

векторы коллинеарны. Если  6 =0 =( )~
, то b 
 ~a. Имеем коллинеар-
ные векторы.
Пусть, обратно, векторы ~a и ~b коллинеарны между собой. Если
=0
хотя бы один из них нулевой (например, ~a ~ ), то очевидным образом
выполняется ~a +0 =0 =0
 ~b ~ , где  6 . Система линейно-зависима.
Если же не один из векторов не нулевой, то согласно определениям
операции умножения вектора на число и орта вектора ~a получим ~b =
= +1
"j~bj j~~aaj , где " , когда направления векторов ~a и ~b совпадают, " =
1,~ когда направления векторов ~a и ~b противоположны. Обозначив
"  jjabjj = , получим ~a ~b = 0, где  6= 0. Линейная зависимость имеет
место.
Вывод из доказанной теоремы может быть сформулирован сле-
дующим образом. Любая пара неколлинеарных векторов образует
систему линейно-независимых векторов.
Определение 13. Векторы, расположенные в одной плоскости или
параллельные одной и той же плоскости, называются компланарны-
ми.
Теорема 3. Для того, чтобы система, состоящая из трех век-
торов, была линейно-зависимой, необходимо и достаточно, что-
бы тройка векторов была компланарной.
Необходимость. Дано, что ~a; ~b;~c – линейно-зависимая тройка.
+ + =0
Это означает, что выполнено ~a ~b ~c ~ , где хотя бы один из
коэффициентов отличен от нуля. Например,  6 =0 . В таком случае
~a= ( ) +( )

 b
~ 
 ~c – вектор ~a есть диагональ параллелограмма, по-
строенного на векторах ( ) ( )
 ~b и


 ~c. Это означает (в силу коллине-
арности векторов ~b и ( ) ( )
 ~b, ~c и  ~
 ~c), что тройка векторов f~a; b;~cg
лежит в плоскости указанного параллелограмма и, следовательно,
компланарна. В случае, когда хотя бы один из тройки векторов ну-
левой, доказательство становится очевидным.
Достаточность. Пусть тройка f~a; ~b;~cg компланарна. Если хотя
=0
бы один из векторов нулевой (например, ~a ~ ), то имеет место ра-
+0 +0 = 0
венство ~a ~b ~c ~ , где  6 =0 , и в данном случае тройка является
линейно-зависимой. Пусть ни один из векторов не является нулевым.
Приведем их к общему началу O (см. рис. 5) и спроектируем конец
вектора ~a (проектирующие прямые строим параллельно векторам ~b и
: =
~c) на прямые, на которых лежат векторы ~b и ~c ~a OB OA AB .
! ! !
= +
! = !
Но OA ~c (OA коллинеарен ~c), AB
! ~b (AB
= ! коллинеарен ~b). Та-
=0
ким образом, имеет место равенство ~a ~c ~b ~ . Тройка векторов

37
Рис. 5:

линейно-зависима. Данные рассуждения справедливы, когда ~b и ~c –


неколлинеарные векторы (что и отражено на рис. 5). Если же ~b и ~c
2
коллинеарны, то в силу теоремы ~b ~c +0 = 0
~a ~ – имеем линейно-
зависимую систему векторов.
Вывод из теоремы 3 таков: всякая некомпланарная тройка век-
торов есть линейно-независимая система векторов.
Теорема 4. Всякая четверка векторов (в трехмерном простран-
стве) линейно-зависима.

Рис. 6:
Если все четыре вектора компланарны, то в силу теоремы 3 они
линейно-независимы. Пусть векторы ~a; ~b;~c не компланарны, а ~x –

чалу (рис. 6). Из конца вектора OB


! ~x проведем прямую, парал-
произвольный четвертый вектор. Приведем четверку к общему на-
=
лельную вектору ~c, до встречи в точке A с плоскостью векторов ~a и
~b. Из точки A проведем прямые, параллельные ~a и ~b, до пересечения
! ! !
= =
с прямыми, на которых лежат ~a и ~b. Имеем, что ~x OB OA AB .+
!= + ! =
Но OA ~a ~b, AB ~c и, следовательно,
~x = ~a + ~b + ~c; (5.4)
что и доказывает линейную зависимость четверки векторов.

38
Лекция6
Базис и аффинные координаты. Проекция вектора
на ось. Прямоугольная система координат.
Полярная система координат на плоскости
Используем результаты теорем 3 и 4, доказанных в конце предыдущей
лекции, для введения базиса и аффинных координат в пространстве
и на плоскости.
( )
Определение 1. Тройка (пара) f~e1 ; ~e2 ; ~e3 g f~e1 ; ~e2 g линейно-незави-
симых векторов называется базисом в пространстве (на плоскости),
если любой вектор ~x может быть представлен в виде линейной ком-
= + + ( = + ) (
бинации: ~x x1~e1 x2~e2 x3~e3 ~x x1~e1 x2~e2 . Числа x1 ; x2 ; x3 (на )
( )
плоскости x1 ; x2 ) называются координатами ~x в указанном базисе.
Из этого определения на основании теоремы 3 вытекает, что вся-
кая пара не коллинеарных векторов образует базис на плоско-
сти, а на основании теоремы 4 – всякая тройка не компланарных
векторов образует базис в пространстве.

Рис. 7: a) правая тройка; б) левая тройка.

Определение 2. Упорядоченная тройка не компланарных векторов


f~e1 ; ~e2 ; ~e3 g называется правой (левой) тройкой, если, будучи приве-
денной к общему началу, кратчайший поворот вокруг ~e3 от ~e1 к ~e2 со-
вершается против часовой стрелки (по часовой стрелке) (см. Рис. 7).
Соответственно базис в пространстве называется правым (левым).
Определение 3. Упорядоченная пара не коллинеарных векторов
f~e1 ; ~e2 g называется правой (левой), если, будучи приведенной к об-
щему началу, кратчайший поворот на плоскости от ~e1 к ~e2 происходит
против часовой стрелки (по часовой стрелке). Соответственно базис
на плоскости называется правым (левым).

39
Теорема 1. Координаты вектора в данном базисе определены
однозначным образом.

Действительно, если предположить, что это не так ~x x1~e1 = +


+ = + +
x2~e2 x3~e3 и ~x y1~e1 y2~e2 y3~e3 , то при вычитании векторов
получим
( ) +( ) +(
x1 y1 ~e1 x2 y2 ~e2 x3 y3 ~e3 ~ : ) =0
(6.1)
Но для тройки линейно-независимых векторов равенство (6.1) име-
ет место лишь тогда, когда все коэффициенты равны нулю. Таким
= = =
образом, x1 y1 ; x2 y2 ; x3 y3 : Теорема доказана.

Теорема 2. При сложении векторов их координаты складыва-


ются, а при умножении вектора на число его координаты умно-
жаются на это число.
P3
В самом деле, пусть ~a = i=1 ai ~
e i ; ~b = P3i=1 bi~ei . Тогда ~a + ~b =
P3 P3 P3
a ~
e
i=1 i i + b
i=1 i i~
e = i=1 (ai + bi )~
ei . Согласно определению (a1 +
b1 ; a2 + b2 ; a3 + b3 ) есть координаты вектора ~a + ~b. Умножим вектор ~a
на число : Имеем
X3 X 3
~a =  ai~ei = (ai )~ei :
i=1 i=1

( )
Числа a1 ; a2 ; a3 есть координаты вектора ~a.
Обе теоремы имеют место и для векторов плоскости.

Определение 4. Аффинной системой координат в пространстве


0 0
f ; ~e1 ; ~e2 ; ~e3 g (на плоскости f ; ~e1 ; ~e2 g) называется совокупность неко-
( )
торой точки O и базиса f~e1 ; ~e2 ; ~e3 g f~e1 ; ~e2 g , приведенного к общему
началу в этой точке.

Определение 5. Аффинными координатами точки M в простран-


стве (на плоскости) в данной аффинной системе координат f ; ~e1 ; ~e2 ; ~e3 g
! относительно базиса 0
(0 )
f ; ~e1 ; ~e2 g называются координаты вектора OM
( )
f~e1 ; ~e2 ; ~e3 g f~e1 ; ~e2 g (Рис. 8)
!
Координаты OM , как показано нами, определены однозначным
образом в данном базисе. Тем самым показано, что каждой точке M
однозначным способом сопоставлено три числа – ее аффинные коор-
динаты.
Отметим, что в аналитической геометрии употребляются только
(
правые системы координат, т.е. тройка (пара) f~e1 ; ~e2 ; ~e3 g f~e1 ; ~e2 g в )
0 (0 )
системе координат f ; ~e1 ; ~e2 ; ~e3 g f ; ~e1 ; ~e2 g есть правая тройка векто-
ров.

40
Прежде чем переходить к наиболее используемым в приложениях
прямоугольным системам координат, являющимся частным случаем
аффинных, остановимся на свойствах проекции вектора на ось.
Пусть задана прямая и с помощью орта ~{ на ней указано направ-
ление. Такая прямая называется осью.

Рис. 8: a) аффинная система координат в пространстве; б) аффинная


система координат на плоскости.

!
Определение 6. Проекцией вектора AB на ось Ox называется длина
отрезка A0 B 0 этой оси, заключенного между основаниями перпенди-
куляров, опущенных из A и B на ось, взятая со знаком плюс, если
!
направление A0 B 0 совпадает с направлением ~{; и взятая со знаком
!
минус, если направления векторов A0 B 0 и ~{ противоположны.
Символически записываем следующим образом:

!
( !0 j; если сонаправлены векторы ~{ и A0 B!0 ;
+jA0B!
ПpOx AB = !
jA0 B 0 j; если направления ~{ и A0 B 0 противоположны:
! !
Углом вектора AB (= A0 B ) с осью Ox называется угол (Рис.
1
Ox около
!   .
9), на который нужно кратчайшим способом повернуть ось
точки A0 ; чтобы совместить с вектором A0 B1 (0 )
Теорема 3. Проекция вектора на ось равна длине вектора, умно-
женного на косинус угла .
Пусть – острый угол. Из треугольника A0 B1 B 0 (Рис. 9a) имеем:
ПpOx AB
! = jA0 B!0 j = jA0 B!j cos = jAB
!j cos :
1

41
Рис. 9:

Пусть – тупой угол (Рис. 9б). Из треугольника B 0 B1 A0 находим:


ПpOx AB
! = jA0 B!0 j = jA0 B!j cos( ) =
1
! !j cos :
= jA0B1 j cos = jAB
!
вектора AB равна единице (имеем орт-вектор),
ПpOx
!
Если длина
AB = cos . Косинус угла называется направляющим
то
коси-
нусом единичного вектора с осью Ox.
Теорема 4. При умножении вектора на число  его проекция
умножается на то же число.
Пусть вектор ~a составляет с осью Ox угол , и  > . В таком 0
случае вектор ~a с осью Ox составляет тот же угол, а вектор ~a ( )
( )
– угол  . Согласно теореме 3 имеем

ПpOx (~a) = j~aj cos = j~aj cos =  ПpOx~a


и
ПpOx ( ~a) = j ~aj cos( ) = j~aj cos =  ПpOx~a:

Теорема 5. Проекция суммы двух векторов на ось равна сумме


проекций этих векторов на ту же ось.

Рассмотрим сумму двух векторов AC


! = !+ !AB BC . Для доказа-
тельства теоремы спроектируем точки A; B; C на ось Ox и получим
три точки A0 ; B 0 ; C 0 на оси. В общем случае возможны следующие 6
случаев расположения в направлении штрихованных точек на оси:
(1) A0 ; B 0 ; C 0 ; (2) A0 ; C 0 ; B 0 ; (3) B 0 ; A0 ; C 0 ; (4) B 0 ; C 0 ; A0 ; (5) C 0 ; A0 ; B 0 ;
(6) C 0 ; B 0 ; A0 .

42
Рис. 10:

Доказательство проведем для случая (2) (Рис. 10). Имеем


(
( ! + !) =
ПpOx AB BC
! = jA0 C!0 j
ПpOx AC
! + ! = ! jB 0 C!0 j = jA0 C!0 j:
ПpOx AB ПpOx BC jA0 C 0 j
Из сравнения отношений вытекает, что

ПpOx
! + BC
(AB !) = Пp AB! + Пp BC:
!
Ox Ox
Аналогично доказываются остальные случаи. Теорема 5 по индук-
ции распространяется на любое число слагаемых векторов.
0
Определение 7. Система координат f ;~{;~|; ~kg в пространстве (на
0
плоскости f ;~{;~|g) называется декартовой прямоугольной систе-
мой координат, если базисные векторы f~{;~|; ~kg (пара f~{;~|g) попарно
ортогональны и имеют длину, равную единице.
Базисные векторы ~{;~|; ~k соответственно называются ортами ко-
ординатных осей Ox; Oy; Oz (на плоскости Ox; Oy ).
Определение 8. Декартовыми прямоугольными координатами точ-
ки M в пространстве (на плоскости) относительно выбранной прямо-
угольной системы координат называются координаты вектора OM в
!
ортонормированном базисе f~{;~|; ~kg (на плоскости f~{;~|g), т.е.
!
OM = x~{ + y~| + z~k ) M (x; y; z ):
Из определения проекции вектора на ось следует геометрический
смысл прямоугольных координат точки M :
! !
x = ПpOx OM; y = ПpOy OM; z = ПpOz OM:
!

43
Рис. 11:

Для плоскости имеем буквальное повторение сказанного.


Некоторые задачи аналитической геометрии на плоскости целе-
сообразно решать используя не прямоугольную систему координат
на плоскости, а полярную систему координат, которая строится
следующим образом. Выбираем точку O на плоскости (полюс) и ось
с ортом ~{ (полярная ось) (рис. 11). Любой точке плоскости можно

лярные координаты) r = !j и ' - угол между OM


jOM ! и полярной
однозначно сопоставить (за исключением полюса) пару чисел (по-

0 !
осью. При этом считаем ' > ; если поворот от ~{ к OM совершается
против часовой стрелки. Полюс задается одним числом r =0 : Когда
0 0 2 )
 r  1 и  ' <  (или  < ' <  ; мы пробегаем все мно-
жество точек плоскости. Из определения проекции вектора на ось и
с учетом геометрического смысла прямоугольных координат точки
следует связь полярных и прямоугольных координат:
  p
x = r cos ' r = x2 + y 2
y = r sin '; tg ' = xy : (6.2)

Замечание 1. В задачах, связанных с перемещением с перемещени-


ем материальной точки на плоскости, часто требуют, чтобы перемен-
ная ' менялась в пределах 1 < ' < 1. +

44
Лекция7
Скалярное произведение векторов и его
приложения. Векторное произведение векторов и
его приложения

Определение 1. Углом между векторами ~a 6 ~ и ~b 6 ~ называется =0 =0


наименьший угол между этими векторами, приведенными к общему
началу.

Его обозначение [
= (~a; ~b). Очевидно, что 0   .
Определение 2. Скалярным произведением двух векторов ~a и ~b (пи-
( )
шем ~a  ~b ) называется число, равное произведению длин этих векто-

[
ров на косинус угла между ними

(~a ~b) = j~ajj~bj cos (~a; ~b): (7.1)


Обращаясь к формуле, по которой вычисляется проекция вектора
на ось, можно (7.1) записать в виде

(а) (~a ~b) = j~ajПр~a~b; (б) (~a ~b) = j~bjПр~b~b: (7.2)


Таким образом, скалярное произведение двух векторов равно длине
одного из них, умноженной на проекцию второго вектора на
ось, направление которой определяется первым вектором.
Свойство 1. Для любых ~a и ~b имеем
[ [
(~a ~b) = (~b ~a).
В самом деле, из равенства cos (~a; ~b) = cos (~b;~a) следует коммута-
тивность скалярного произведения.
Свойство 2. Для любого ~a 6 = 0 : (~a ~a) = ~a2 = j~aj2 > 0:
Скалярный квадрат вектора равен нулю тогда и только тогда,
когда ~a есть нуль-вектор.
Свойство 3. Для любого 2R и любых векторов ~a и ~b ((~a)~b) =
( )
 ~a ~b .
Действительно,((~a)~b) = j~bjПр~b(~a) = j~bjПр~b~a = (~a ~b).
Свойство 4. Для любых векторов ~a; ~b;~c выполнено (~a(~b +~c)) = (~a ~b)+
(~a ~c).
На основании (7.2) имеем

(~a(~b + ~c)) = j~ajПр~a(~b + ~c) = j~aj(Пр~a~b + Пр~a~c) = (~a ~b) + (~a ~c):
45
Теорема 1. Два вектора ортогональны друг другу тогда и толь-
ко тогда, когда их скалярное произведение равно нулю.

[ Пусть векторы ~a и
[
~b не нулевые и ортогональны между собой:
(~a; ~b) = 2 . Так как cos (~a; ~b) = cos 2 = 0, то (~a ~b) = 0: Если же один из
[
векторов нулевой, то его длина равна нулю и (~a ~b) = 0:
Обратно, если (~a~b) = j~ajj~bj cos (~a; ~b) = 0, то хотя бы один из мно-

[
жителей равен нулю. В случае равенства нулю одного из первых

[
двух множителей один из векторов нулевой, который всегда мож-
но считать ортогональным к любому вектору. Если cos (~a; ~b) = 0, то
(~a; ~b) = 2 – векторы ортогональны между собой.
Все перечисленные выше определения и свойства установлены без-
относительно к какой-либо системе координат – они инвариантны
относительно выбора системы координат.
Введем сейчас прямоугольную систему координат и установим,
как вычисляется скалярное произведение векторов, заданных свои-
ми координатами в базисе f~{;~|; ~kg. Все приводимые ниже формулы
введены для пространства (для плоскости во всех формулах третью
координату следует положить равной нулю).
Учитывая, что базис f~{;~|; ~kg есть ортонормированный базис, по-
лучим
( )=1 ( )=0 ( )=1 ( )=0 ( )=1
~{ ~| ; ~{ ~k ; ~| ~| ; ~| ~k ; ~k ~k : (7.3)
Если ~a = x1~{ + y1~| + z1~k; ~b = x2~{ + y2~| + z2~k, то, воспользовавшись
свойствами 3 и 4, имеем

(~a ~b) = x1 x2 (~{~{) + x1 y2 (~{ ~|) + x1 z2 (~{ ~k) + y1 x2 (~|~{) + y1 y2 (~| ~|) +
+ y1 z2 (~| ~k) + z1 x2 (~k ~{) + z1 y2 (~k ~|) + z1 z2 (~k ~k):
С учетом (7.3) и свойства (7.1) окончательно получим

(~a ~b) = x1x2 + y1 y2 + z1z2: (7.4)

Итак, скалярное произведение векторов в ортонормированном


базисе равно сумме произведений одноименных координат этих
векторов.
На основании (7.4) могут быть тотчас получены вычислительные
формулы для длины вектора, орта вектора, проекции вектора, коси-
нуса угла между векторами и другие геометрические приложения.
(
Длина вектора ~a x1 ; y1 ; z1 )
p q
j~aj = (~a~a) = x21 + y12 + z12 : (7.5)

46
Орт вектора ~a (x1 ; y1; z1) (~a 6= ~0)
~a xp1~{ + y1~| + z1~k
~a0 = = :
j~aj x21 + y12 + z12
(7.6)

Поэтому для направляющих косинусов вектора ~a имеем


x1 y1
cos = p ; cos = p ;
x21 + y12 + z12 x21 + y12 + z12
cos = p 2 z1 2 2 :
x1 + y1 + z1
(7.7)

Проекция вектора ~b(x2 ; y2 ; z2 ) на ось с направлением ~a(x1 ; y1 ; z1 )


(~a 6= ~0)
x1 x2 + y1 y2 + z1 z2
Пр~a~b = p 2 :
x1 + y12 + z12
(7.8)

Косинус угла между векторами (~a 6= ~0; ~b 6= ~0)

[
cos (~a; ~b) = (~a b~) = p
~
j~ajjbj
x1 x2 + y1py 2 + z 1 z2
x21 + y12 + z12 x22 + y22 + z22
: (7.9)

На основании доказанной выше теоремы получаем, что необходимым


и достаточным условием ортогональности двух векторов является
следующее условие:

x1 x2 + y1 y2 + z1 z2 = 0: (7.10)

Пример 1. Найти орт вектора ~a (1; 1; 5):


Согласно (7.6) имеем

~{ ~| + 5~k
~a0 = p = p127~{ p127 ~| + p527 ~k:
12 + ( 1)2 + 52
Пример 2. Дан вектор ~a(6; 18; z ). Найти z , если j~aj = 21.
В силу (7.5) имеем
p p
21 = 62 + ( 18)2 + z2; z =  441 360 = 9:
Понятие скалярного произведения векторов пришло из физики,
и мы остановимся на одном из физических приложений скалярного
произведения для подсчета работы силы.
Пусть требуется вычислить работу W силы F~ по перемещению
материальной точки из точки A в точку B по прямолинейному пути
(рис. 12).

47
Рис. 12:

Если бы материальная точка двигалась по направлению действия


силы F~ (угол =0 !
), то, по определению, работа силы равна про-
изведению величины силы на длину перемещения: W
! jF~ jjAB j = =
( )
F~  AB . Если же точка движется под углом к направлению си-
!
лы, то работает только составляющая AC 0 , направленная по линии
!
перемещения AB . Перпендикулярная составляющая силы уравнове-
шивается сопротивлением. Поэтому

W
!j = (F~  AB
= (ПрAB! F~ )jAB !): (7.11)

Другие физические приложения скалярного произведения векто-


ров мы находим в курсе "Общей физики", читаемом параллельно с
данным курсом.
Переходим к определению векторного произведения двух векто-
ров.

Определение 3. Векторным произведением векторов ~a и ~b называ-

[
ется вектор ~x, который: (1) перпендикулярен к плоскости векторов
~a и ~b; (2) j~xj = j~ajj~bj sin (~a; ~b); (3) направлен так, что тройка f~a; ~b; ~xg –
правая (Рис. 13).

Векторное произведение обозначается символом ~x ~a ~b (либо =[ ]


=
~x ~a  ~b).
Приведенные условия (1)-(3) однозначно определяют векторное
произведение, если сомножители – ненулевые векторы. Если хотя бы
один из множителей нуль-вектор, векторное произведение, по опре-
делению, нулевой вектор.
Отметим также, что из условия (2) вытекает: модуль векторного
произведения численно равен площади параллелограмма, постро-
енного на векторах ~a и ~b.
Рассмотрим свойства векторного произведения.

Свойство 1. Для любых ~a и ~b : [~a ~b] = [~b ~a].


48
Рис. 13:

Действительно, для ~x1 =[ ]


~b ~a выполнены условия (1), (2). Но, что-
бы тройка f~b;~a; ~x1 g была правой, вектор ~x1 должен быть направлен
в сторону, противоположную вектору ~x ~a ~b . =[ ]
Свойство 2. Для любого  2 R и любых ~a и ~b имеем
[(~a)~b] = [~a~b] = [~a(~b)]: (7.12)

=0 0
[
При  справедливость равенства очевидна. Пусть  > .
Тогда ~a имеет то же направление, что и вектор ~a. Длины векто-
ров
[
j[(~a)~b]j и [~a ~b] совпадают, так как j[(~a)~b]j = j~ajj~bj sin (~a; ~b) =
j~ajj~bj sin (~a; ~b) = j[~a ~b]j. Направления их также совпадают (ориента-
ция тройки не меняется). Аналогичные рассуждения имеют место и
при  < . 0
Свойство 3. Для любых векторов ~a; ~b;~c имеем

[(~a + ~b)~c] = [~a ~c] + [~b ~c]: (7.13)

Предварительно докажем, что имеет место равенство

[(~a + ~b)~c 0] = [~a ~c 0 ] + [~b ~c 0 ]; (7.14)

где ~c 0 – орт вектора ~c. Умножив затем (7.14) на  = j~cj. Получим


выполнение (7.13).

49
Рис. 14:

Для доказательства (7.14) заметим, что вектор ~a~c 0 можно по-[ ]


строить следующим образом. На плоскость, перпендикулярную к ~c0 ,
! =
спроектируем направленный отрезок OA ~a. Затем повернем по ча-
! !
совой стрелке вектор OA0 на угол 2 и получим вектор OA00 (Рис. 14а).
! !
OA00 = [~a ~c 0 ], так как (1) OA00 перпендикулярен ~a и ~c 0 , (2)
jOA!00 j = jOA!0 j = j~aj cos 2 ' = j~ajj~c 0 j sin ', (3) тройка f~a;~c 0 ; OA!00 g
Имеем:


– правая. Спроектируем далее на плоскость, перпендикулярную к ~c 0 ,


! ! !
векторы OA0 , A0 B 0 ; OB 0 . После поворота на = 2 этих векторов по
! ! !
часовой стрелке можно записать, что OA00 + A00 B 00 = OB 00 . Обращаясь
к высказанному замечанию, заключаем, что справедливо равенство
(7.14), а после умножения его на  =
j~cj убеждаемся в выполнении
равенства (7.13)

Теорема 2. Необходимым и достаточным условием коллинеар-


ности двух векторов является равенство нулю их векторного

[
произведения.

[
Пусть векторы ~a и ~b
[
коллинеарны. Следовательно, либо
0, либо (~a; ~b) = : В обоих случаях sin (~a; ~b) = 0. Это означает, что
(~a; ~b) =
j[~a ~b]j = 0. Векторное произведение есть нуль-вектор.
[
Пусть, обратно, [~a ~b] = 0. Тогда j[~a ~b]j = j~ajj~bj sin (~a; ~b) = 0. Если

[ [
хотя бы один из первых сомножителей равен нулю, то данный вектор
является нулевым и коллинеарность установлена. Если [
sin (~a; ~b) = 0,
то (1) (~a; ~b) = 0; (2) (~a; ~b) = . Векторы коллинеарны.
Изложенные свойства векторного произведения инвариантны от-
носительно выбора системы координат. Пусть задана прямоугольная
0
система координат f ;~{;~|; ~kg. Легко проверить, что выполнены сле-

50
дующие условия:

[~{~{] = 0; [~| ~|] = 0; [~k ~k] = 0  :


[~{ ~|] = ~k; [~| ~k] = ~{; [~k ~{] = ~| (7.15)

Пользуясь свойствами 1, 2, 7 и таблицей (7.15), для векторов ~a =


+ + = + +
x1~{ y1~| z1~k и ~b x2~{ y2~| z2~k получим
[~a ~b] = x1x2[~{~{] + x1y2[~{ ~|] + x1z2[~{ ~k] + y1x2 [~|~{]+
+y1y2[~| ~|] + y1 z2[~| ~k ] + z 1 x2 [~k ~{ ] + z1 y2 [~k ~| ]+
z1 z2 [~k ~k] = ~{ yy1 zz1 ~| xx1 zz1 + ~k xx1 yy1 :

(7.16)
2 2 2 2 2 2
Обращаясь к свойству разложения определителя по элементам стро-
ки, окончательно получим формулу вычисления векторного произве-
дения векторов, заданных своими координатами в ортонормирован-
ном базисе
~{
~| ~k
[~a ~b] = x1
y1 z1 : (7.17)
x2 y2 z2
Заметим, что хотя в первой строке определителя стоят векторы (а не
числа!), запись (7.17) законная, так как операции умножения вектора
на число и суммы векторов подчиняются тем же правилам, что и
числовые элементы.
Поскольку условием коллинеарности двух векторов является ра-
венство нулю их векторного произведения, то, приравнивая опреде-
литель в правой части (7.16) нулю и учитывая линейную
 независи-

мость векторов ~{;~|; ~k; получим, что ранг матрицы
x1 y1 z1 равен 1
x2 y2 z2
и, следовательно, условие
 
ранг
x 1 y 1 z1 =1 (7.18)
x 2 y 2 z2
является необходимым и достаточным условием коллинеарно-
сти векторов ~a и ~b.
Одним из геометрических приложений векторного произведения
является вычисление с его помощью площади треугольника с верши-
нами в точках

A1 (x1 ; y1 ; z1 ); A2 (x2 ; y2 ; z2 ); A3 (x3 ; y3 ; z3 ):


Имеем: ~a = A1 A!2 = ~{(x2 x1 ) + ~|(y2 y1) + ~k(z2 z1); ~b = A1 A!3 =
~{(x3 x1 )+~|(y3 y1 )+~k(z3 z1 ). В силу того, что площадь треугольника

51
равна половине площади параллелограмма, построенного на векторах
A1~A2 ; A1~A3 , получим

~{ ~| ~k
1
S = j[~a ~b]j = j
1
x2 x1 y2 y1 z2

z1 j:
2 2
x3 x1 y3 y1 z3 z1
(7.19)

Если речь идет о площади треугольника на плоскости, заданно-


( ) ( ) (
го своими вершинами A1 x1 ; y1 ; A2 x2 ; y2 ; A3 x3 ; y3 , то в формуле )
(7.19) необходимо положить z1 z2 z3 = = =0и разложить определи-
тель по элементам последнего столбца

~{ ~| ~k
1
S = j

x2 x1 y2 y1
1
0 j = 2 j xx23
x1 y2 y1 j:
2
x3 x1 y3 y1 0 x1 y3 y1 (7.20)

Одним из физических приложений является подсчет момента


силы с помощью векторного произведения.
Пусть твердое тело закреплено в точке A и в точке B приложена
сила F~ . Вращающий момент, возникающий в этом случае, вычисля-
ется по следующей формуле (так показывает опыт):

M
!  F~ :
~ = AB (7.21)

52
Лекция8
Cмешанное произведение векторов. Двойное
векторное произведение. Преобразование
прямоугольной системы координат на плоскости и
в пространстве
Зная операции скалярного и векторного умножения двух векторов,
что можно сказать о комбинированных произведениях трех векторов?
Имеются следующие возможности для комбинированного произведе-
( ) ([ ] ) [ [ ]]
ния: (1) ~a ~b ~c; (2) ~a ~b ~c ; (3) ~a ~b ~c . В первом случае ответ простой –
получаем вектор, коллинеарный вектору ~c. Случаи (2) и (3) требуют
более подробного рассмотрения.
Определение 1. Смешанным произведением трех векторов ~a; ~b;~c
называется число, получаемое от умножения вектора ~a ~b скалярно [ ]
def
на ~c. Оно обозначается символом (~a ~b ~c ), т.е. (~a ~b ~c ) = ([~a ~b]~c ).

Рис. 15:
Выясним геометрический смысл смешанного произведения, счи-
тая, что f~a; ~b;~cg – не компланарная тройка векторов. Учитывая, что
вектор ~x =[ ] ~a ~b имеет длину, равную численно площади паралле-
лограмма, построенного на ~a и ~b , и перпендикулярен к плоскости
параллелограмма, из равенства
([~a~b]~c ) = (~x~c ) = j~xjПр~x~c = h  S (8.1)
выводим, что в случае правой тройки смешанное произведение
равно объему V параллелепипеда, построенного на векторах ~a; ~b;~c,
а в случае левой тройки – объему параллелепипеда, взятому со
знаком минус (рис. 15).

53
Теорема 1. Тройка векторов f~a; ~b;~cg компланарна тогда и толь-
ко тогда, когда их смешанное произведение равно нулю.

Необходимость. Пусть тройка f~a; ~b;~cg компланарна. Это может


осуществиться в трех случаях: (1) один из векторов есть нуль-вектор,
(2) пара векторов коллинеарна, (3) векторы лежат или параллельны
одной плоскости. Во всех трех случаях в соотношениях (8.1) либо
=0
j~xj , либо Пр~x~c и, следовательно, смешанное произведение равно
нулю.
( )
Достаточность. Пусть ~a; ~b;~c = 0. Это означает, что j ~a ~b j  [ ]
Пр~x~c =0. Если первый сомножитель равен нулю, то векторное
[ ]
произведение ~a ~b равно нулю, векторы ~a; ~b – коллинеарные, а, сле-
довательно, тройка f~a; ~b;~cg – компланарная. Если Пр~x~c , то век- =0
тор ~c ортогонален к вектору ~x ~ =[ ]
~a b и, следовательно, параллелен
плоскости параллелограмма, построенного на векторах ~a и ~b. Имеем
компланарную тройку векторов. Теорема доказана.

Свойство 1. Операции скалярного и векторного умножений в сме-


шанном произведении можно поменять местами, т.е.

([~a ~b]~c ) = (~a[~b ~c ]) = ([~b ~c ]~a ): (8.2)

Справедливость этого равенства следует из того что ориентация


троек f~a; ~b;~cg и f~b;~c;~ag не меняется, а параллелепипед для обеих тро-
ек один и тот же.

Свойство 2. Круговая перестановка сомножителей не меняет вели-


чины смешанного произведения. Перестановка местами двух соседних
сомножителей изменяет знак произведения на противоположный, т.е.

(~a ~b ~c ) = (~b ~c ~a ) = (~c ~a ~b ) = (~b ~a ~c ) = (~a ~c~b ) = (~c~b ~a ): (8.3)

В самом деле, в силу коммутативности скалярного произведения


и свойства 1 имеем

(~a ~b ~c ) = ([~a ~b] ~c ) = (~c [~a ~b ]) = (~c ~a ~b) :
(~a ~b ~c ) = (~a [~b ~c ]) = ([~b ~c ]~a ) = (~b ~c ~a ) (8.4)

В силу антикоммутативности векторного произведения и равенств


(8.4) получим

(~a ~b ~c ) = ([~a ~b] ~c ) = ([~b ~a] ~c ) = (~b ~a ~c ): (8.5)

Пусть выбрана прямоугольная система координат. В ортонорми-


( )
рованном базисе ~{;~|; ~k векторы ~a; ~b;~c имеют координаты x1 ; y1 ; z1 , ( )
54
(x2; y2 ; z2), (x3 ; y3; z3 ). Согласно определению смешанного произведе-
ния как скалярного произведения векторов [~a ~b] и ~c и выражению
(7.16) для [~a ~b] получим

x3 yy1 z1 y x1 z1 + z x1 y1 :

(~a ~b ~c ) = 2 z2 3 x2 z2 3 x2 y2 (8.6)

Правая часть (8.6) с учетом свойств определителей представляет со-


бой разложение определителя третьего порядка по элементам послед-
ней строки. Поэтому

x1 y1 z1

(~a ~b ~c ) = x2
y2 z2 : (8.7)
x3 y3 z3
Получили компактное выражение смешанного произведения через
координаты векторов-сомножителей.
Переходим к рассмотрению третьей возможности комбинирован-
ного произведения трех векторов.

Определение 2. Двойным векторным произведением векторов


~a; ~b;~c называется выражение вида ~a ~b ~c . [ [ ]]
Рассмотрим это произведение в прямоугольной системе коорди-
нат, когда векторы ~a; ~b;~c заданы своими координатами: ~a x1~{ = +
y1~| + z1~k; ~b = x2~{ + y2~| + z2~k; ~c = x3~{ + y3~| + z3~k:


~{ ~| ~k

x1
y1 z1
[~a[~b~c]] =
y2 z2

x2 z2

x2
:
y2

y3 z3 x3 z3 x3 y3
Раскрывая определитель по элементам первой строки, вычисляя опре-
делители второго порядка и добавляя в сомножителях при ~{;~|; ~k соот-
( )(
ветственно нули в виде x1 x2 x3 x1 x2 x3 ; y1 y2 y3 y1 y2 y3 ; z1 z2 z3 )(
)
z1 z2 z3 , получим
[~a [~b ~c ]] = ~{ (y1x2y3 y1x3y2 z1x3z2 + z1 x2 z3 + x1x2x3 x1x2x3)+
+~|(z1 y2 z3 z1y3z2 x1x2y3 + x1 x3y2 + y1y2 y3 y1 y2y3)+
+~k(x1x3 z2 x1 x2z3 y1 y2 z3 + y1y3z2 + z1 z2z3 z1z2 z3) =
= (x2~{ + y2~| + z2~k)(x1x3 + y1 y3 + z1z3)
(x3~{ + y3~| + z3~k)(x1x2 + y1 y2 + z1z3):

55
Поскольку x1 x3 y1 y3( + + z1z3) = (~a ~c); (x1x2 + y1 y2 + z1z3) = (~a ~b),
то окончательно имеем

[~a [~b ~c ]] = ~b(~a ~c ) ~c(~a ~b ): (8.8)

Формула (8.8) носит название формулы раскрытия двойного век-


торного произведения по векторам-сомножителям внутренне-
го векторного произведения.
Очевидно, что используя определение смешанного произведения
векторов и (8.8), можно рассматривать различные комбинированные
произведения четырех и т.д. векторов.
Пример 1. Компланарны ли векторы ~a ; ; ; ~b ; ; ; = (2 3 1) = (1 1 3)
~c= (1 9 11)
; ; ?
Вычислим определитель


2 3 1

1 1 3 = 2(11 27) 3( 11 3) 1(9 + 1) = 0:
1 9 11
Векторы компланарны.
Пример 2. Проверить справедливость равенства

[[~a ~b ]~c ] + [[~b ~c ]~a ] + [[~c ~a ]~b ] = 0:


Представим сомножители во внешних векторных произведениях
и воспользуемся формулой (8.8). Имеем

[~c [~a ~b ]] = ~a(~c~b ) ~b(~c ~a ); [~a [~b ~c ]] = ~b(~a ~c ) ~c(~a ~b ); [~b [~c ~a ]] = ~c(~b ~a ) ~a(~b ~c ):
Сложим все три равенства и учтем коммутативность скалярного
произведения пары векторов. При сложении правые части взаимно
уничтожаются и справедливость написанного равенства доказана.
В заключение лекции остановимся на вопросе о переходе от од-
ной декартовой прямоугольной системы координат к другой. Снача-
ла рассмотрение проведем для плоскости. Пусть fO;~{;~|g – некоторая
прямоугольная система координат на плоскости и пусть fO0 ;~{ 0 ;~| 0 g
!
– другая прямоугольная система координат (рис. 16а). Координаты
точки M в первой системе координат есть координаты OM в базисе
(
f~{;~|g OM! ~{x ~|y : Координаты точки M во второй системе коорди-
= + ) ! !
нат есть координаты вектора O0 M в базисе f~{ 0 ;~| 0 g O0 M x0~{ 0 y 0~| 0 . ( = +
(; )
Установим связь координат x y с координатами x0 y 0 точки M . С ( ; )
этой целью заметим (рис. 16б), что
)
~{ 0 = (Пр~{~{ 0 )~{ + (Пр~|~{ 0 )~| = ~{ cos(~{d;~{ 0 ) + ~| cos(~|d
;~{ 0 ) :
~| 0 = (Пр~{~| 0 )~{ + (Пр~|~| 0 )~| = ~{ cos(~{d;~| 0 + ~| cos(~|d;~| 0 )
(8.9)

56
Рис. 16:

Если обозначить через угол между осью Ox и осью O0 x0 , то (8.9)


примет вид 
~{ 0 = ~{ cos + ~| sin :
~| 0 = ~{ sin + ~| cos (8.10)

Радиусы-векторы точки M в первой и второй системе координат свя-


заны соотношением
! ! !
OM = OO0 + O0 M: (8.11)
Если (a; b) координаты нового начала O0 , то (8.11) примет вид

x~{ + y~| = a~{ + b~| + x0~{ 0 + y0~| 0 : (8.12)

Подставив в (8.12) вместо ~{ 0 ;~| 0 их выражения (8.10) окончательно


получим

x~{ + y~| = a~{ + b~| + x0 (~{ cos + ~| sin ) + y~ ( ~{ sin + ~| cos ): (8.13)

В силу линейной независимости векторов ~{ и ~| коэффициенты при


них в левой и правой частях (8.13) равны между собой. Мы получаем
связь координат нештрихованной системы координат с координатами
штрихованной системы координат

x = x0 cos y0 sin + a :
y = x0 sin + y0 cos + b (8.14)

Если (8.14) разрешить относительно x0 ; y 0 , то получим выражение для


новых (штрихованных) координат

x0 = x cos + y sin + a0 ;
y0 = x sin + y cos + b0 (8.15)

57
где a0= cos sin = sin cos
a b ; b0 a b есть координаты точки
O относительно штрихованной системы координат.
Очевидно, что если =0
, то совершен лишь параллельный пере-
нос начала координат без вращения осей координат. Полагая
0 0
в =0
(8.14), (8.15) и выражениях для a и b ; получим
 
x = x0 + a x0 = x a :
y = y0 + b y0 = y b (8.16)

Если a b= =0 =0; 6 , то перенос начала координат не соверша-


ется, происходит лишь поворот осей. Для него имеем
 
x = x0 cos y0 sin x0 = x cos + y sin :
y = x0 sin + y0 cos y0 = x sin + y cos (8.17)

Осуществим сейчас переход в пространстве от одной прямоуголь-


ной системы координат fO;~{;~|; ~kg к другой прямоугольной системе
( !
координат fO0 ;~{ 0 ;~| 0 ; ~k 0 g без переноса начала координат. OO0 ~ и= 0)
с сохранением ориентации (обе тройки векторов – правые).
Очень часто в приложениях формулы перехода, связывающих штри-
хованные и нештрихованные координаты, требуется записать через
три независимых параметра – углы Эйлера.
С этой целью переход от первого ортонормированного базиса ко
второму разобьем на три этапа (рис. 17).

Рис. 17:

58
Первый этап (рис. 17а). Повернем вокруг оси Oz на угол ' оси
Ox и Oy. Новые оси обозначим через Ox1 ; Oy1 ; Oz1 . Согласно форму-
лам (8.17) поворота осей на плоскости P имеем
9
x = x1 cos ' y1 sin ' =
y = x1 sin ' + y1 cos ' : (8.18)
z = z1 ;

Второй этап (рис. 17б). Повернем вокруг оси Ox1 оси Oy1 ; Oz1
на угол . Новые оси обозначим через Ox2 ; Oy2 ; Oz2 . Имеем
9
x1 = x2 =
y1 = y2 cos  z2 sin  : (8.19)
z1 = y2 sin  + z2 cos  ;

Третий этап (рис. 17в). Повернем вокруг оси Oz2 в плоскости Q


оси Ox2 ; Oy2 на угол . Получим оси Ox0 ; Oy 0 ; Oz 0 . Формулы пере-
хода следующие: 9
x2 = x0 cos y0 sin =
y2 = x0 sin + y0 cos : (8.20)
z2 = z 0 ;

Подставляя сейчас (8.20) в (8.19), а затем полученный результат


в (8.18), получим следующий переход от одной прямоугольной систе-
мы координат в пространстве к другой прямоугольной системе без
переноса начала координат:
8
> x = (cos ' cos sin ' cos  sin )x0 0 0
>
>
< (cos ' sin + sin ' cos  cos )0y + z sin ' sin ;
y = (sin ' cos + cos ' cos  sin )x 0 0 (8.21)
>
>
>
: (sin ' sin cos ' cos  cos )y z cos ' sin ;
z = x sin  sin + y sin  cos + z0 cos ):
0 0

Чтобы получить выражение x0 ; y 0 ; z 0 через "старые " координаты x; y; z;


необходимо в (8.21) заменить ' на ';  на ; на , штрихо-
ванные координаты на нештрихованные.
!0
В случае, если осуществлен и перенос начала координат OO ( =
+ + )
a~{ b~| c~k , то к правым частям соотношений (8.21) нужно добавить
соответственно слагаемые a; b; c.
На этом подготовительный материал (играющий также значитель-
ную самостоятельную роль в приложениях совершенно независимо от
излагаемого ниже) окончен, и мы можем перейти к непосредственным
вопросам аналитической геометрии на плоскости и в пространстве.

59
Лекция9
Простейшие задачи аналитической геометрии на
плоскости. Линии на плоскости и их уравнения.
Каноническое и общее уравнение прямой на
плоскости
Как нами установлено ранее, при помощи системы, координат уста-
навливается взаимно-однозначное соответствие между геометрически-
ми образами – точками и алгебраическими объектами – числами.
Показано, что каждой точке плоскости в прямоугольных и поляр-
ных координатах соответствует пара чисел, взятых в определенном
порядке, и обратно, каждой паре чисел соответствует единственная
точка плоскости. Взаимно-однозначное соответствие между точками
и их координатами сводит изучение геометрических свойств различ-
ных объектов к изучению аналитических соотношений между коорди-
натами точек множеств, задающих рассматриваемые геометрические
объекты.
Прежде чем переходить к установлению соответствия между ли-
ниями на плоскости и уравнениями с двумя переменными x и y или
r и ' остановимся на трех простейших фактах, знание которых необ-
ходимо при решении задач аналитической геометрии на плоскости.

( ; ) !
Согласно определению 3 из 5-й лекции расстояние между точками
( ; )
M1 x1 y1 и M2 x2 y2 равно модулю вектора M1 M2 т. е. d M1 ; M2( )=
( )= !
d M2 ; M1 jM1 ; M2 j.
Поскольку
! ! !
M1 ; M2 = OM2 OM1 = (x2 x1 )~{ + (y2 y1 )~|;
то согласно (7.5) имеем
p
d= (x2 x1 )2 + (y2 y1 )2 : (9.1)

( ; );
Пусть задан, далее, отрезок как упорядоченная, пара точек A x1 y1
( ; ) (; )
B x2 y2 . Пусть задана также третья точка C x y , лежащая на пря-
мой, соединяющей точки A и B , и не совпадающая с концом B отрезка
(точка C может находиться как внутри отрезка, так и вне его). Рас-
! !
смотрим векторы AC и CB . Они коллинеарны, так как находятся на
одной прямой. Поэтому
!
AC = CB:
! (9.2)

Определение 1. Число  в (9.2) называется отношением, в кото-


ром точка C делит отрезок AB .

60
Отметим, что поскольку точки A и B не совпадают между собой,
= 1
то  6 . В координатах (9.2) имеет вид x x1 ~{ ( ) +(
y y1 ~| ) =
(( ) +( ))
 x2 x ~{ y2 y ~| . В силу линейной независимости векторов ~{ и
~| получим
x x1 y y1
= ; = ; (9.3)
x2 x y2 y
x + x2 y + y2
а также
x= 1 ; y= 1
1+ 1+ : (9.4)

При  = 1 точка C делит отрезок пополам. Согласно (9.4) координаты


середины отрезка имеют вид
x +x y +y
x = 1 2; y = 1 2:
2 2 (9.5)

Наконец, часто приходится иметь дело c формулой вычисления


площади треугольника, заданного своими вершинами
( ; ) ( ; ) ( ; )
A1 x1 y1 ; A2 x2 y2 ; A3 x3 y3 Она была выведена нами в конце 7-й
лекции. Приведем ее

1
S = j xx2
x1 y2 y1 j
2 3 x1 y3 y1 (9.6)

Используя свойства определителей, выражение (9.6) часто записыва-


ют в следующей эквивалентной форме:

1 x1
y1 1
S = j
2
x2
y2 1 j (9.7)
x3 y3 1
В самом деле, вычитая первую строку из второй и третьей строк и
понижая порядок определителя, приходим к соотношению (9.6).
Следующим этапом является установление между линиями на плос-
кости и уравнениями с двумя переменными x и y (r и ') опреде-
ленного соответствия, что позволяет свести изучение геометрических
свойств линий к изучению аналитических свойств соответствующих
уравнений. В аналитической геометрии всякую линию рассматрива-
ют как геометрическое место точек, обладающих общим свойством.
Так, например, пусть задана прямоугольная декартова система коор-
динат и требуется вывести уравнение окружности радиуса R, центр
(;)
которой находится в точке C a b .

Определение 2. Окружностью с центром в точке C называется гео-


метрическое место точек (ГМТ), находящихся на одном и том же
расстоянии R от центра.

61
Пусть x; y – координаты произвольной точки M окружности (те-
кущая точка M окружности). Тогда jCM j
! R и, следовательно,
=
!j2 R2 . Последнее равенство в координатах запишется в виде
jCM =
(x a)2 + (y b)2 = R2 : (9.8)

Ясно, что данное соотношение выполняется для всех точек окружно-


сти и только для них. Равенство (9.8) называется уравнением окруж-
ности в прямоугольной системе координат. Если центр окружности
совпадает с началом координат a ( = = 0)
b , то ее уравнение прини-
мает вид
x2 y 2 R 2 :
+ = (9.9)
В полярной системе координат уравнение окружности с центром
в полюсе имеет наиболее простой вид: r R. =
В общем случае посредством уравнения, связывающего коорди-
наты x; y (или r; ') переменной точки M , выражаем общее свойство
точек линии.
Определение 3. Уравнение F x; y ( ) = 0 (( ) = 0)
r; ' в прямоуголь-
ной системе координат (в полярной системе координат) называется
уравнением линии L, если этому уравнению удовлетворяют коорди-
наты любой точки линии и не удовлетворяют координаты ни одной
точки, не лежащей на ней.
Если уравнение имеет вид y = f (x), то оно называется явным в
отличие от неявного уравнения F (x; y) = 0.

Рис. 18: а) – окружность r = a; б) – спираль Архимеда r = a'


Отметим, что множество точек плоскости, координаты которых
удовлетворяют некоторому уравнению, может обладать особенностя-
ми и не составлять линии на плоскости в том смысле, который при-
дается этому слову. Перечислим наиболее часто встречающиеся осо-
( ) = 0 (( ) = 0)
бенности: (1) уравнение F x; y , r; ' не определяет ни

62
одной точки плоскости (например, x2 y 2
+ +1 = 0 ); (2) уравнение
+ =0
задает одну или несколько точек (например, x 2 y2 ), (3) ле-
( )=0
вая часть уравнения F x; y распадается на k штук сомножите-
( )= ( ) ( ) ( )
лей: F x; y f1 x; y f2 x; y : : : fk x; y и тем самым выделяется k
2 2
( )=0 ( )=0
ветвей линии с уравнениями f1 x; y : : : ; fk x; y . Например,
x y =0 ( )=0 ( + )=0
представляется в виде двух ветвей x y и x y .
Рассмотрим конкретные примеры часто встречающихся в прило-
жениях уравнений линий в полярной системе координат.
Окружность: r a a > = ( 0 )
const (рис. 18а).
Спираль Архимеда: r =a' (a - положительная константа)  0
' < 1(рис. 18б).
=
Логарифмическая спираль: r ae' (a,  – положительные кон-
+
станты), 1 < ' < 1 (рис. 19а).
Кардиоида: r a = (1 + cos ) 0 0
' (a > const),  ' <  (рис. 19б). 2
Пересечением двух (трех и т. д.) линий называется ГМТ, коорди-
наты которых одновременно удовлетворяют уравнениям обеих линий

F1 (x; y) = 0
F2 (x; y) = 0 (9.10)

Рис. 19: а) – логарифмическая спираль r = aek' ; б) – кардиоида


r = a(1 + cos ')
Часто линию на плоскости удобно (особенно при рассмотрении
движения материальных точек в механике) задавать системой урав-
нений, в которой каждая текущая координата есть некоторая функ-
ция одной переменной t (например, в механике времени t), называе-
мой параметром. В данном случае уравнения вида

x = x(t) (t 2 T )
y = y(t) (9.11)

называются параметрическими уравнениями линии на плоско-


сти. При фиксированном значении t =
t0 (9.11) определяют коор-
= ( ) = ( )
динаты x0 x t0 ; y0 y t0 точки M0 линии.

63
( )=0
Исключив из (9.11) параметр t, мы получим уравнение F x; y
= ()
(либо y f x ), задающее ту же линию на плоскости, что и уравнения
(9.11).
Например, уравнения

x = R cos t (0  t < 2)
y = R sin t
определяют окружность с центром в O (0; 0)
и радиуса R, так как,
возводя в квадрат уравнения и складывая, получим уравнение x2 +
y2 R2 , описывающее окружность с центром в начале координат.
=
Параметр t в рассматриваемом случае есть угол между осью Ox и
радиус-вектором текущей точки окружности.
В качестве еще одного примера выведем параметрические урав-
нения циклоиды , определяемой как траектория, точки M окруж-
ности радиуса a при ее качении по прямой линии без скольжения
(рис. 20). За параметр t выберем увеличивающийся при качении угол
t = \AC1 M

Рис. 20:

Имеем
! ! ! !
OM = OA + AC1 + C1 M . Поэтому (t 2 [0; 2])
! ! ! )
x = ПрOx OA + ПрOx AC1 + ПрOx C1 M = a(t sin t) :
! ! !
y = ПрOy OA + ПрOy AC1 + ПрOy C1 M = a(1 cos t)
Если линия задана в полярной системе координат явным способом
= ()
r r ' , то, используя связь декартовых и полярных координат (6.2),
легко получить ее параметрическое представление

x = r(') cos ' (' 2 ):
y = r(') sin ' (9.12)

64
( ) 0 ( ) 0
Если задано неравенство F x; y > или F x; y < , то его геомет-
рический смысл легко устанавливается. Такие неравенства определя-
ют в прямоугольной системе координат множество точек плоскости
— область плоскости, границей которой является линия с уравнени-
( )=0
ем F x; y . Аналогично и в полярной системе координат. Так,
например, неравенство x2 y 2 < R2 определяет множество точек, на-
+
ходящихся внутри окружности x2 y 2 R2 , называемое открытым
+ =
кругом радиуса R.
В заключение лекции остановимся на выводе канонического и об-
щего уравнения прямой линии на плоскости в прямоугольной системе
координат.
Прямую на плоскости можно задать, если фиксировать некоторую
( ; )
точку M0 x0 y0 (опорная точка прямой) и направляющий век-
тор p ( ) ( )
~ l; m (рис. 21а). Пусть ~r x; y —радиус-вектор текущей точки
искомой прямой линии. Тогда векторы ~r r~0 и p ~ суть коллинеарные
=
векторы (~r r~0 t~ p), и мы имеем
~r = ~r0 + t~p ( 1 < t + 1): (9.13)

Рис. 21:

Получили параметрическое уравнение прямой в векторном


виде. В координатной записи (9.13) имеет вид

x = x0 + lt ( 1 < t < +1)
y = y0 + mt (9.14)

Коллинеарность векторов ~r r~0 и p


~ может быть выражена и так:
x x0 y y0
l
= m : (9.15)

Имеем каноническое уравнение прямой на плоскости. Если l = 0 (m =


0), то соответствующее уравнение прямой имеет вид x = x0 (y = y0).
65
Прямую на плоскости можно задать другим способом. Зафикси-
( ; )
руем некоторую точку прямой M0 x0 y0 и вектор N ( )
~ A; B , ортого-
нальный к искомой прямой (он носит название нормального вектора
( )
прямой). Пусть ~r x; y – радиус-вектор текущей точки прямой. Тогда
(рис. 21б)
( (
N~ ~r ~r0)) = 0 (9.16)
суть векторное уравнение прямой с нормальным вектором.
В координатах имеем

A(x x0 ) + B (y y0 ) = 0: (9.17)

Чтобы описать все множество прямых на плоскости, мы должны


произвольным образом задавать N~ и M0 , т.е. считать A; B и C =
Ax0 By0 произвольными параметрами, пробегающими множество
вещественных чисел.
Таким образом, уравнение

Ax + By + C = 0: (9.18)

называется общим уравнением прямой на плоскости. Геометриче-


ский смысл коэффициентов при x и y следующий: коэффициенты
A и B суть координаты в ортонормированием базисе {~{;~|} нор-
мального вектора прямой. Геометрический смысл параметра C бу-
дет выяснен ниже. Этот параметр связан с расстоянием от начала
координат до прямой. В частности, при C =0 +
имеем Ax By =0 -
уравнение прямой, проходящей через начало координат.
Обратно, если в прямоугольной системе координат на плоскости
1
имеем уравнение -й степени вида (9.18), то это будет уравнение пря-
мой линии. Действительно, (9.18) как уравнение с двумя неизвест-
( )
ными всегда имеет решение. Пусть x0 ; y0 – некоторое решение, т. е.
+ + 0
Ax0 By0 C  . Вычитая это тождество из (9.18), получим экви-
(
валентное ему уравнение A x x0 )+ ( )=0
B y y0 , которое может
быть записано в виде N ( ( )) = 0
~ ~r r~0 = + где N = +
~ A~{ B~|, ~r x~{ y~|
– переменный радиус-вектор, r~0= + x0~{ y0~| – фиксированный век-
( )
тор, задающий точку M0 x0 ; y0 . Очевидно, что данному уравнению
удовлетворяют координаты любой точки прямой линии, проходящей
через M0 и имеющей нормальный вектор N ~ , и не удовлетворяют ко-
ординаты ни одной точки с радиусом-вектором ~r 0 , не лежащей на
прямой, так как ~r 0 ~r0 и N~ не ортогональны между собой.

66
Л е к ц и я 10
Различные виды уравнений прямой на плоскости и
их геометрические приложения. Расстояние от
точки до прямой. Взаимное расположение двух
прямых на плоскости. Уравнение пучка прямых
Остановимся на трех видах уравнения прямой, имеющих наибольшие
приложения.
Уравнение в отрезках. Пусть в общем уравнении прямой Ax +
+ =0
By C коэффициенты A 6 =0 =0 =0
,B6 ,C6 . Тогда это уравнение
( A) + ( B) = 1 = =
можно переписать в виде x y . Обозначив a C, b
C C A
C
B , получим уравнение прямой в отрезках
x y
+
a b
= 1: (10.1)

Видим, что точки с координатами a и ( ; 0) (0; )


b удовлетворяют
уравнению (10.1), и, следовательно, уравнение (10.1) описывает пря-
мые, отсекающие от осей координат отрезки длиной jaj и jbj.
Уравнение с угловым коэффициентом. Каноническое уравнение
(9.15) может быть записано в виде y y0 m x
l = (
x0 , где l 6 . ) =0
Вспомним, что
l = Пр~{ p~ = jp~j cos '; m = Пр~| p~ = jp~j sin ';
и поэтому коэффициент
m
k= = tg '; (10.2)
l
[0 ) (
где ' (рассматриваемый в пределах ' 2 ; 2 [ 2 ;  , угол между])
векторами ~{ и p
~ (угол наклона прямой к оси Ox), называем угловым
=
коэффициентом. Если обозначить b y0 ml x0 , то уравнение прямой
с угловым коэффициентом примет вид
y = kx + b: (10.3)
Легко убедиться в том, что точка с координатами (0; )
b удовлетво-
ряет уравнению (10.3), и, следовательно, прямая (10.3) отсекает от
оси Oy отрезок длиной jbj (рис. 22a).
Если в общем уравнении прямой B 6 =0
(прямая не параллельна
оси ординат), то его можно привести к виду y A =
C
B x B . Обозначив
k= A
B, b= C
B , приходим к уравнению прямой с угловым коэффи-
циентом.
Используя геометрический смысл углового коэффициента k, легко
получить выражение для тангенса угла между двумя прямыми.

67
Рис. 22:

Определение 1. Углом  между прямыми, заданными уравнениями


с угловыми коэффициентами, будем называть угол, на который надо
повернуть против часовой стрелки первую прямую вокруг точки S
до совмещения со второй прямой (0 )
    (рис. 22б).
Пусть заданы прямые y = + =
k1 x b1 и y k2 x b2 . Поскольку +
= +
'2 '1  (рис. 22б), то  tg = tg( )
'2 '1 . Учитывая, что '1 tg =
tg =
k1 , '2 k2 , и применяя формулу для тангенса разности углов,
получим

tg  = 1k+2 k kk1 ; (1 + k1 k2 6= 0) (10.4)


1 2
Если прямые заданы общими уравнениями A1 x B1 y C1 + + =0
, A2 x +
+ =0
B2 y C2 то, так как k1 A=1
B1 , k2
A 2 =
B2 , из (10.4) имеем

tg  = AA1 BA2 + BB1BA2 ; (A1 A2 + B1B2 6= 0) (10.5)


1 2 1 2
Последняя формула годится и в том случае, когда одна из прямых
параллельна оси координат. Формула (10.4) этот случай не затраги-
вает.
Теорема 1. Для того, чтобы прямые были параллельными, необ-
= (
ходимо и достаточно, чтобы k1 k2 A1 B2 B1 A2 . = )
Пусть прямые параллельны. Угол  = 0 (либо  =  ), и, следо-
вательно, tg  = 0. Из (10.4) вытекает, что k1 = k2 , а из (10.5)
A1 B2 = B1 A2 . Необходимость доказана.
Пусть обратно k1 = k2 (A1 B2 = B1 A2 ). Тогда tg  = 0. Следова-
тельно, прямые параллельны. Достаточность доказана.

68
Рис. 23:

Теорема 2. Для того, чтобы прямые были перпендикулярны


между собой, необходимо и достаточно, чтобы k2 1 = ( +
k1 A1 A2
B1 B2 = 0)
.
В самом деле, если прямые ортогональны друг другу, то орто-
гональны и их нормальные векторы, имеющие для прямых с угло-
вым коэффициентом вид: N = =
~ 1 k1~{ ~|, N~ 2 k2~{ ~|, а для пря-
мых с общим уравнением N = + = +
~ 1 A1~{ B1~|, N~ 2 A2~{ B2~|. В силу
равенства N (
)=0~ 1 N~ 2 получим, что k1 k2 +1 = 0 и соответственно
+ =0
A1 A2 B1 B2 .
1
=
Пусть обратно k2 k1 . Это значит k1 k2 +1 = 0 . Поскольку
= +
для прямой y k1 x b1 нормальный вектор N~ 1 имеет координа-
( 1)
ты k1 ; , а для прямой y = +
k2 x b2 N~ 2 = k2~{ ~|, то равен-
+1 = 0
ство k1 k2 эквивалентно N( )=0
~ 1 N~ 2 . Следовательно, нор-
мальные векторы у прямых ортогональны. Ортогональны и прямые.
Аналогичное рассуждение проводится в случае выполнения условия
+ =0 = +
A1 A2 B1 B2 , если вспомнить, что ~n1 A1~{ B1~|, ~n2 A2~{ B2~|. = +
Нормированное уравнение прямой. Рассмотрим прямую, не про-
ходящую через начало координат, опустим из начала координат пер-
пендикуляр на прямую (рис. 23а) и обозначим через Q точку пересе-
чения перпендикуляра и прямой. Пусть ~n – орт вектора OQ
! ~q.
=
Для любой точки M прямой вектор ~r ( )
~q ортогонален к ~n, т.е
(( ) )=0
~r ~q ~n . Поскольку ~n – орт-вектор, то ~n ~{ = cos + sin
~| , где
=( ) ( )=
~{c cos( ) =
; ~n , и ~q~n j~qjj~nj ~qd ; ~n p (длина перпендикуляра, рав-
ная расстоянию от начала координат до прямой). Поэтому равенство
(( ) ) = (
~r ~q ~n )=0 ~r~n ~q~n в координатах имеет вид.
x cos + y sin p = 0: (10.6)
Уравнение носит название нормированного (нормального) уравне-
ния прямой.

69
Пусть прямая задана общим уравнением Ax By C + + =0
или
( )+ = 0
~r~n C . Найдем выражение для единичного вектора ~n, коллине-
арного с N =
~ . Получим, что ~n N~~
"jN j
p A = pB +
" A2 +B 2 ~{ " A2 +B 2 ~|. Поэтому
нормированное уравнение имеет следующий вид:

p 2A x + p B
y + p C
= 0;
" A + B2 " A2 + B 2 " A2 + B 2
(10.7)

где "= +1 , если свободный член C < и " 0 = 1


, если C > . Такой 0
выбор знака перед корнем определяется тем, что в (10.6) свободный
член p всегда отрицателен.
Пример Пронормировать уравнение прямой x y . Так +1 = 0
как свободный член положителен, то нормирующий множитель будет
равен
p
1 = p1:
12 + ( 1)2 2
Поэтому нормированное уравнение имеет вид:

p1 x + p1 y p1 = 0:
2 2 2
Используя нормированное уравнение прямой, легко вывести фор-
мулу вычисления расстояния d от точки до прямой.
( ; )
Пусть M0 x0 y0 – точка вне прямой x cos + sin
y p . =0
Определение 2. Отклонением  точки M0 от прямой называется
+
число, равное d, если M0 и начало координат находятся по разные
стороны прямой, и равное d, если M0 и начало координат находятся
по одну сторону от прямой.

Теорема 3. Для вычисления отклонения  точки M0 x0 y0 от ( ; )


прямой x cos + sin
y p =0
нужно в левую часть уравнения
вместо x и y подставить координаты x0 и y0 точки M0 , т.е.

 = x0 cos + y0 sin p: (10.8)

Для вычисления расстояния от точки до прямой получаем фор-


мулу
= cos + sin
d jx0 y0 pj: (10.9)

Докажем теорему. Доказательство проведем для случая, когда на-


чало координат и M0 находятся по разные стороны прямой (рис. 23б).

ситуации  = !
p~n M 0 M0 = !
p~n QR. Но QR
! !
В другом случае все повторяется буквально. Для рассматриваемой
= (
p~n OM0 ~n p~n ) =
70
(r~0~n)~n p~n.
Поэтому  =(! )=( )
QR  ~n ~r0~n p, так как ~n~n ( ) = 1.
Формулы (10.8), а, следовательно, и (10.9) доказаны.
Пример Найти расстояние от точки P ; (1 2) до прямой x 2 +y
3=0 .
Нормируем согласно (10.7) данное уравнение:

p2 x + p1 y p3 = 0:
5 5 5
Подставляем координаты точки P (1; 2). Получим, что

2 1 3 3 3
 = p + p ( 2) p = p ; d = p = p :
3
5 5 5 5 5 5
В качестве приложения формулы для отклонения (10.8) выступает
вывод уравнений биссектрис углов, образованных при пересечении
прямых A1 x B1 y C1+ + =0
и A2 x B2 y C2 + + =0
. Так как биссек-
триса есть ГМТ равноудаленных от сторон угла, то, учитывая знак
( ; )
отклонения текущей точки биссектрисы M X Y от первой и второй
прямой, получим уравнения биссектрис. А именно
!
A1 A2
p p X+
"1 A21 + B12 "2 A22 + B22
!
B1 B2
+ p p Y+
"1 A21 + B12 "2 A22 + B22
!
C1 C2
+ p
2 2 p
2 2 = 0:
"1 A1 + B1 "2 A2 + B2
для угла, где отклонения совпадают по знаку, а также
!
A1 A2
p + p X+
"1 A21 + B12 "2 A22 + B22
!
B 1 B 2
+ p + p Y+
"1 A21 + B12 "2 A22 + B22
!
C 1 C2
+ p + p = 0:
"1 A21 + B12 "2 A22 + B22
для угла, где отклонения разнятся знаком.
Пример Найти уравнения биссектрис углов, образованных пере-
сечением прямых x y 2 +1=0 2 +
и x y . 2=0
71
Решение Нормируем прямые. Имеем p15 x p25 y p15 + =0
и p25 x p15 y p25
+ =0
. Для одинаковых знаков  получим, что
3 1 +
p5 X p5 Y p5 1 + или Y =0 X . =3 1
Для разных знаков  получим, что p15 X p35 Y p35 +
, т.е. =0
X Y +3 3=0
или Y = 1 +1
3X .
Взаимное расположение двух прямых A1 x B1 y C1 и + + =0
+
A2 x B2 y C2 + =0
на плоскости описывается тремя ситуациями: (1)
прямые пересекаются; (2) прямые параллельны, но не совпадают; (3)
прямые совпадают. Рассмотренные системы уравнений

A1 x + B1 y + C1 = 0
A2 x + B2 y + C2 = 0 (10.10)

с привлечением теории систем линейных уравнений


приводит
нас к
следующим выводам: (1) если определитель
A1 B1
6= 0, то
A2 B2
система имеет
единственное
решение прямые
 пересекают-

ся; (2)

если
A1 B1
= 0 , а ранг матрицы A1 B1 C1 ра-
A2 B2 A2 B2 C2
вен двум, то система не совместна
 – прямые
 параллельны и
не совпадают; (3) если ранг A1 B1 C1 1
равен , то прямые
A2 B2 C2
совпадают.
Перейдем к описанию пучка прямых.
Определение 3. Множество всех прямых плоскости, проходящих
( ; )
через точку M0 x0 y0 плоскости (называемую центром), называет-
ся пучком прямых.
Как задать пучок прямых? Первый способ состоит в задании цен-
( ; )
тра пучка M0 x0 y0 . В таком случае множество всех прямых, прохо-
дящих через эту точку, опишется соотношениями
 
y y0 = k(x x0 ) ( 1 < k < +1):
x = x0 (10.11)

Второй способ состоит в задании двух фиксированных пересекающих-


+
ся прямых: A1 x B1 y C1 + =0
и A2 x B2 y C2 + + =0(
A1 B2 A2 B1 6 . = 0)
Теорема 4. Уравнение пучка прямых с центром в точке пере-
сечения прямых A1 x B1 y C1 + +
и A2 x B2 y C2 =0(без + + =0
определения координат точки пересечения) описывается соот-
ношением вида
(A1 x + B1 y + C1 ) + (A2 x + B2 y + C2 ) = 0; (10.12)
где ,  – произвольные вещественные числа.

72
Действительно, (10.12) относится к уравнению вида Ax By C + + =
0 и, следовательно, есть уравнение прямой (при  =0
имеет первую
базовую прямую пучка, при  =0 имеет вторую базовую прямую).
Прямая, описываемая уравнением (10.12), проходит через точку пе-
ресечения базовых прямых, ибо координаты точки пересечения об-
ращают в нуль как первую скобку, так и вторую и, следовательно,
удовлетворяют (10.12). Наконец, (10.12) описывает все прямые пучка,
т.е. какова бы ни была наперед заданная прямая, проходящая через
центр пучка, она будет описываться уравнением (10.12) при некото-
рых значениях параметров  и . В самом деле, наперед заданная
прямая пучка однозначно определяется заданием еще одной точки
( ; ) 2
P x1 y1 (через точки проходит единственная прямая!). Если мы
покажем, что найдутся такие  и , что координаты точки P удовле-
творяют (10.12), то доказательство теоремы будет закончено. Все эти
условия соблюдаются, так как, взяв
A2 x + B2 y + C2
=  ;
A1 x + B1 y + C1
мы получим

(A1 x + B1 y + C1 ) + (A2 x + B2 y + C2 )  0
+1 = 0 и 2x+y +1 = 0
Пример. Через точку пересечения прямых x y
3 + + 1 = 0. Написать ее
проходит прямая, параллельная прямой x y
уравнение.
( + 1) + (2 + + 1) = 0 или ( + 2)x +
Решение. Имеем  x y  x y
( + ) + + =0 +2 = 3  +  = 1,
  y   . Условие параллельности: 
т.е.  31 ,  43 . Ответ: x y 53
= = 3 + + =0 .

73
Л е к ц и я 11
Приведение общего уравнения кривой второго
порядка к каноническому Виду. Эллипс, его форма
и геометрические свойства
В предыдущей лекции мы изучали на плоскости геометрический об-
раз, описываемый в декартовой прямоугольной системе координат
уравнением первой степени: Ax By C + + =0
– прямую линию.
Сейчас мы перейдем к исследованию линий плоскости, координаты
точек которых в прямоугольной системе координат удовлетворяют
уравнению второй степени.
Мы отступаем от традиционного изложения теории кривых второ-
го порядка, как ГМТ, обладающих определенным свойством, и начи-
наем с классификации кривых второго порядка, приведя общее урав-
нение к каноническим видам. полное и последовательное изложение
этого вопроса для n-мерного евклидова пространства будет представ-
лено в линейной алгебре (лекция 25). Здесь же проводится хотя и
строгое, но с учетом двумерного случая специфическое исследование
без привлечения аппарата линейной алгебры. Затем с использованием
канонических уравнений устанавливаются геометрические свойства
кривых, положенные в основу их определения как геометрического
места точек.
Определение 1. Линия, определяемая в прямоугольной системе ко-
ординат уравнением
Ax2 + 2Bxy + Cy2 + 2Dx + 2Ey + F = 0; (11.1)
где A, B , C одновременно не обращается в нуль, называется кривой
второго порядка, а уравнение (11.1) – ее общим уравнением.
Совершенно очевидно, что всякая окружность x a 2 y b 2
) +( ( ) =
R2 есть кривая второго порядка (11.1) при A C , B= =0 , так как
после возведения в квадрат имеем x y 2 2
+ 2 2 + + ax by a b R2 .
2 2 =0
Обратно, если в (11.1) A C , B = =0 0 , FA < , то (11.1) есть урав-
нение окружности. В самом деле, умножив (11.1) на A1 , получим
x2 y2 ax by c
+ 2 2 =0( = =
a = D;b
A 0) E;c
A
F > ; которое
A
может быть записано в виде x a 2 ( ) +( ) = + + y b 2 c a2 b2 .
Нашей целью является выбор такой прямоугольной системы ко-
ординат fO0 ;~{ 0 ;~| 0 ; ~k 0 g; относительно которой уравнение кривой (11.1)
имеет наименьшее число числовых параметров (каноническое
уравнение). Переход осуществляется по формулам (8.14)

x = x0 cos y0 sin + a :
y = x0 sin + y0 cos + b (11.2)

74
Подставив вместо x и y в (11.1) их выражения (11.2), получим
A(x02 cos2 + y02 sin2 + a2 2x0 y0 cos sin + 2ax0 cos 2ay0 sin )+
+2B (x02 cos sin + x0y0 cos2 + bx0 cos x0 y0 sin2 y02 sin cos
by0 sin + ax0 sin + ay0 cos + ab) + C (x02 sin2 + y02 cos2 + b2 +
+2x0y0 cos sin + 2bx0 sin + 2by0 cos ) + 2D(x0 cos y0 sin + a)+
+2E (x0 sin + y0 cos + b) + F = 0:
Приведя подобные члены, имеем
A0 x02 + 2B 0 x0 y0 + C 0 y02 + 2D0 x0 + 2E 0 y0 + F 0 = 0; (11.3)
где новые коэффициенты выражаются, следующим образом:
9
A0 = A cos2 + 2B cos sin + C sin2 >
>
B0 = B cos 2 + 12 (C A) sin2 >
>
>
>
= A sin2 2B sin cos + C cos2
>
C0 >
>
>
D0 = a(A cos + B sin ) + b(B cos + C sin )+ =
:
+ D cos + E sin >
>
(11.4)
E0 = a(B cos A sin ) + b(C cos B sin ) >
>
>
>
D sin + E cos >
>
>
>
F0 = Aa2 + 2Bab + Cb2 + 2Da + 2Eb + F ;

Отметим следующий факт: определитель



A B ;
4=
B C
составленный из коэффициентов при второй степени, есть инвари-
ант относительно преобразований координат (11.2). В самом де-
ле, подставив в выражение 40 A0 C 0 B 02 значения A0 , B 0 , C 0 из
=
(11.4), получим
40 = A0 C 0 B 02 = (AC B 2 ) sin4 + (AC B 2 ) cos4 +
+2(AC B 2) sin2 cos2 = (AC B 2)(sin2 + cos2 )2 = 4: (11.5)
Если в уравнении B = 6 0; то в преобразованиях (11.2) угол под-
берем таким, чтобы коэффициент B 0 в (11.3) обратился в нуль. Для
этого достаточно, чтобы B cos 2 + 21 (C A) sin2 = 0; т.е.
ctg 2 = 21B (A C ): (11.6)

Распорядимся сейчас выбором параметров a и b для упрощения


вида уравнения (11.3), где B 0 =0
. С этой целью дальнейшее рассмот-
рение разобьем на два случая в зависимости от того, отличен от нуля
определитель 4 AC B 2 в уравнениях (11.1) или он равен нулю.
=
75
(A) Пусть 4 AC B 2 6
= =0
. Заметив, что определитель, состав-
ленный из коэффициентов при a и b для D0 и E 0 в (11.4)

A
cos + B sin B cos + C sin = AC B 2 6= 0;
B cos A sin C cos B sin (11.7)

выберем a и b таким образом, чтобы D0 и E0 =0 =0


. Для этого,
согласно (11.4), необходимо решить систему уравнений относительно
неизвестных a и b (значение фиксировано равенством (11.6)

a(A cos + B sin ) + b(B cos + C sin ) = D cos E sin :
a(B cos A sin ) + b(C cos B sin ) = D sin E cos
В силу (11.7) для по формулам Крамера имеем единственное решение.
Подставив найденные значения ; a; b в A0 ; C 0 ; F 0 из (11.4) мы по-
лучим в штрихованной системе координат с началом в точке O0 a b (;)
следующее уравнение:
px02 qy02 r:
+ = (11.8)
(;)
Покажем, что начало координат O0 a b является центром сим-
метрии кривой (11.8), а штрихованные оси координат – осями сим-
метрии. В самом деле, если в уравнение (11.8) вместо координаты x0
подставить x0 , то уравнение не изменится. Не изменится оно и по-
сле замены y 0 на y 0 . Это значит, точка O0 (пересечение осей O0 x0 и
O0 y0 ) есть центр симметрии кривой (11.8). Линию второго порядка,
имеющую единственный центр симметрии, называют центральной,
остальные носят название нецентральных.
Если r 6 =0 ; то центральная кривая называется невырожденной,
при r =0 - вырожденной.
(A.1) Невырожденные центральные кривые. Представив урав-
нение (11.8) в виде xr
2 y2+ =1
(ради упрощения записи штрихи у
r
p p
переменных опустим) и обозначив pr = "1 a2; rq = "2b2 (a; b > 0; "1 =
1 = 1)
 ; "2  , получим
x2 y2
+
"1 a2 "2 b2
= 1: (11.9)

При "1 = 1; "2 = 1 имеем каноническое уравнение эллипса


x2 y 2
+ = 1:
a2 b2
(11.10)

Когда a = b, эллипс представляет собой окружность. При "1 = 1;


"2 = 1 имеем каноническое уравнение гиперболы
x2 y 2
a2 b2
= 1: (11.11)

76
При "1 = 1
; "2 =1опять имеем уравнение гиперболы, в котором
по сравнению с (11.11) роль переменной x играет y и наоборот. Этот
случай принципиально не отличается от предыдущего.
При "1 = 1 ; "2 = 1вещественных точек не существует (мни-
мый эллипс). Очевидно, что первый и четвертый случай соответ-
0
ствуют ситуации, когда 4 > , второй и третий, когда 4 < . 0
(A.2) Вырожденные центральные кривые. При r уравнение =0
(11.8) записывается в виде

x2 y2
"1 2 + "2 2
a b
= 0 ("1 a2 = p1 ; " 2 b2 =
1 ):
q
(11.12)

При "1 = 1; "2 = 1(4 > 0) имеем одну точку O0 (0; 0). При "1 =
1; "2 = 1(4 < 0) левая часть (11.12) распадается на два сомножите-
ля
x + y x y  = 0. Поэтому имеем пару пересекающихся прямых
a b a b
x y x y
+
a b
= 0; a b
= 0: (11.13)

При "1 = 1 = 1(
; "2 0)
4 < ситуация та же самая. Этот случай ничем
принципиальным от предыдущего не отличается.
Наконец, при "1 = 1 = 1(
; "2 0) 4 > возвращаемся к первой
ситуации.
(B) Пусть 4 = AC B 2
=0 =0 =0
. Взяв a ;b в (11.2), после
выбора угла поворота осей в виде (11.6) мы получим, что B 0 . =0
Из-за инвариантности 4 имеем 4 = =0
0 0
AC 0 . Пусть A 0 (если =0
C 0=0 , то все рассуждения повторяются буквально, только роль x
1
=0
будет играть y ), и, следовательно, C 0 6 . Уравнение (11.3) принимает
после умножения на C 0 следующий вид:

y02 + 2px0 + 2qy0 + r = 0: (11.14)

После переноса начала координат в точку

q2 2 r 00 0
 
r q
2p ; x00 = x0 +
2p ; y = y + q
O 00 q

(случай p = 0 будет рассмотрен ниже) имеем


y002 = 2px00 (11.15)

Получили каноническое уравнение нецентральной невырожден-


ной кривой второго порядка – параболы.

77
Если в (11.14) p = 0, то после переноса начала координат в точ-
ку O00 (0; q ) : x00 = x0; y00 = y0 + q имеем каноническое уравнение
вырожденной нецентральной кривой второго порядка

(y002 )2 = "a2 ("a2 = q2 r; " = 1): (11.16)

При " =1 уравнение (11.16) описывает пару параллельных прямых


(при a =0 слившихся), при " = 1
– пару мнимых параллельных
прямых.
На этом классификация всех возможных алгебраических линий
второго порядка закончена.
Перейдем к рассмотрению свойств и установлению формы эллип-
са (11.10). При этом мы будем предполагать, что b < a (при b > a
роли переменных x и y меняются местами), и называть a – большой
полуосью эллипса, b – малой полуосью эллипса.
Введем параметр c > , определив его из равенства c2 a2 b2 , и
0 =
рассмотрим на оси Ox две точки F1 c ( ; 0)
и F2 c ( ; 0)
так, что начало
координат делит отрезок F1 F2 пополам. Вычислим сейчас расстояния
rp1 и r2 от точек F1 и Fp2 до произвольной точки эллипса M x y r1 ( ; ): =
( +) +
x c 2 y 2 ; r2 = ( ) +
x c 2 y2 . Из уравнения (11.10), подставив
2
вместо b2 его выражение b2 a2 c2 ; получим y 2 a2 c2 x2 ac 2 x2
= = +
и внесем его под корни для r1 и r2
q 2 q 9
r1 =q
2 + +
cx a2 c2 2
a2 x
q
a axc= a +
c
ax
=
:
= +
a ac x 2 a ac x ;

r2 = 2 + +
cx a2 c2 x2
a2 = =

Из уравнения (11.10) следует, что x j j
a; и так как c < a, то ac x <
+ 0
a. Таким образом, a ac x > и a ac x > . Поэтому для r1 и r2 0
окончательно имеем

r1 = a + ex; r2 = a ex; (11.17)

где параметр e =c
a < 1
называют эксцентриситетом эллипса.
Складывая равенства (11.17), получим, что r1 r2 a для лю- + =2
бой точки эллипса. Это свойство позволяет определить эллипс как
геометрическое место точек плоскости, сумма расстояний от
которых до двух данных точек F1 и F2 (называемых фокусами эл-
липса) есть величина постоянная (большая чем расстояние между
фокусами).
Числа r1 и r2 из (11.17) часто называют фокальными радиусами
эллипса.
Исследуем форму эллипса по его каноническому уравнению. Нами
уже установлено, что оси координат являются осями симметрии, а

78
Рис. 24:

2 2
начало координат – центром симметрии. Поскольку xa2  и yb2  , 1 1
1
то эллипс расположен в прямоугольнике jxj  ; jy j  . 1
Для исследования формы эллипса в силу симметрии достаточно
p 2 ту2 его часть, что лежит в первой координатной четверти:
рассмотреть
= b
y a a x . Получив график этой линии и достроив ее симмет-
рично в остальных четвертях, получим линию эллипса (рис. 24а).
При изучении эллипса особую роль играют две прямые, перпенди-
=
кулярные к оси Ox, с уравнениями x  ae (рис. 24б) – директрисы
1
эллипса. Для эллипса e < ; ae > a, и, следовательно, директрисы рас-
положены вне эллипса. Для директрис имеет место теорема, которую
можно взять за новое определение эллипса.
Теорема 1. Отношение расстояния от любой точки эллипса до
фокуса к расстоянию ее до соответствующей директрисы есть
величина постоянная, равная эксцентриситету эллипса.
(; )
Действительно, пусть M x y – точка эллипса, d1 и d2 – рассто-
яния до соответствующих директрис. В силу симметрии достаточно
доказать теорему для одного из фокусов (например,для F2 ).
!
( ; 0)
Точка M 0 имеет координаты x , а D20 a
e ;0
. Поэтому d2 =
jM 0 D20 j ae x. Поскольку r2 a ex, то dr22 (aa exex)e e. Теорема
= = = =
доказана.
В заключение остановимся на параметрическом уравнении эллип-
са. С этой целью рассмотрим окружность x2 y 2 a2 и произведем
+ =
точечное сжатие плоскости вдоль ординат точек
a
x = X; y = Y: (11.18)
b
2
Подставив в уравнение окружности, получим уравнение эллипса X
a 2 +
Y2 =1
. Пусть окружность задана в параметрической форме: x =
b2

79
a cos t; y = b sin t(t 2 [0; 2)). Из (11.18) находим X = a cos t; Y = ab y =
b cos t; (t 2 [0; 2)). Поэтому параметрическое уравнение эллипса с по-
луосями a и b имеют вид

x = a cos t (0  t < 2):
y = b sin t (11.19)

В следующей лекции мы изучим гиперболу и параболу.

80
Л е к ц и я 12
Гипербола, ее свойства и форма. Парабола, ее
свойства и форма. Полярное уравнение эллипса,
гиперболы и параболы. Условия касания прямой и
кривой второго порядка
Перейдем к установлению геометрических свойств и формы гипербо-
лы
x2 y2
a2 b2
= 1; (a; b > 0) (12.1)

Введем параметр c > 0 с помощью равенства c2 = a2 + b2 , так, что


c > a, и рассмотрим на оси Ox две точки F1 ( c; 0) и F2 (c; 0); кото-
! !
рые назовем левым и правым фокусами гиперболы. Вычислим фо-
кальные расстояния jF1 M j; jF2 M j до произвольной точки гиперболы
(; ) ! =
M x y : jF1 M j r1
p
= ( +) + !
x c 2 y2 ; jF2 M j r2 =
p
= (
x c 2 y2 . ) +
Из (12.1) находим y 2 c2 2 x2 c2 a2 и подставляем в выражения
= +
a2 x
для r1 и r2 . Имеем
p 
r1 = p(a + ac x)2 = ja + exj
r2 = (a ac x)2 = ja exj; (12.2)

где e = c
a – параметр, называемый эксцентриситетом гиперболы.
1
Заметим, что для гиперболы e > , так как c > a.
Исследуем различные возможности, представляемые равенствами
2
1
(12.2). Из (12.1) следует xa2  , т.е. jxj  a. Поэтому в зависимости от
(; )
того, лежит ли M x y в правой полуплоскости x > ( 0)
или в левой
( 0)
x < ; выражения для (12.2) различные.
0 + 0 0 1
Если x > , то a ex > и a ex < , так как e > ; x > a; ex > a.
Поэтому в правой полуплоскости выполнено

r1 = a + ex; r2 = a + ex: (12.3)

0 +
Если x < , то a ex < так как0 jexj > a, и a ex > 0. Поэтому
в левой полуплоскости выполнено

r1 = a ex; r2 = a ex: (12.4)

Из этих рассуждений вытекает, что гипербола состоит из двух сим-


метричных ветвей, расположенных, соответственно, в правой и левой
полуплоскостях. Из (12.3),(12.4) для обеих ветвей выводим инвари-
антное равенство
jr1 r2 j a: =2 (12.5)

81
На основании (12.5) можно дать новое определение гиперболы как
ГМТ плоскости, модуль разности расстояний от которых до
двух фиксированных точек F1 ; F2 , называемых фокусами гипер-
болы, есть величина постоянная (не равная нулю и меньшая рас-
стояния между фокусами).
При установлении формы гиперболы отметим, что оси Ox и Oy
являются осями симметрии, а их пересечение – центром симмет-
2
1( )
рии(центр гиперболы). Поскольку xa2  jxj  a , то ветви гипербо-
лы лежат на плоскости вне полосы a < x < a. Точки пересечения
ветвей с осью Ox y ( = 0 ( ; 0) ( ; 0))
; A1 a ; A2 a называются вершина-
ми гиперболы. Для гиперболы, заданной уравнением (12.1), ось Ox
называется действительной осью гиперболы, а ось Oy – мнимой
2
осью гиперболы (пересечения нет из-за равенства yb2 =1
). В силу
симметрий p достаточно исследовать форму гиперболы первой четвер-
=
ти, y a x2 a2 , а затем распространить на всю плоскость. Наряду
b
с указанной ветвью гиперболы целесообразно рассмотреть луч, исхо-
дящий из начала координат, с уравнением Y b
a x. =
Пусть M – точка гиперболы с абсциссой x, N – точка указанной
прямой с той же абсциссой. Для разности ординат имеем

b p
Y y= (x x2 a2 ):
a
При неограниченном возрастании x данная разность монотонно стре-
мится к нулю, так как

b p b x2 px2 + a2
x!1
lim (Y y) = lim (x
a x!1
x a ) = xlim
2 2
a !1 (x + x2 a2 )
= 0:
2
=
Поэтому прямые y  ab x являются асимптотами гиперболы xa2
y2 =1
b2 . Для построения асимптот строим прямоугольник со сторо-
=
нами x a; y =
b. Асимптоты - прямые, содержащие диагонали
прямоугольника. При построении гиперболы удобно построить сна-
чала асимптоты, а затем ветви гиперболы (рис. 25а).
Для гиперболы вводятся две прямые, перпендикулярные к оси
=
Ox, с уравнениями x  ae , и называемые директрисами гипербо-
1
лы. В силу неравенства e > директрисы лежат между вершинами
гиперболы. Так же как и для эллипса, имеет место утверждение:
r1
d1 = =
r2
d2 e, где d1 и d2 – расстояния от точки гиперболы до соответ-
ствующих директрис (рис. 25б). Доказательство совершенно анало-
гично тому, что проедено для эллипса, и поэтому мы приводить его
не будем. Приведем лишь формулировку теоремы, которая является
фактически еще одним определением гиперболы.

82
Рис. 25:

83
Теорема 1. Отношение расстояния от любой точки гиперболы
до фокуса к расстоянию ее до соответствующей директрисы
есть величина постоянная, равная эксцентриситету гиперболы
e> . 1
2 2
Отметим, что гипербола yb2 xa2 =1
называется сопряженной по
отношению к гиперболе (12.1). Действительной осью сопряженной
гиперболы является ось Oy , асимптоты остаются прежними.
Перейдем к установлению геометрических свойств и вида формы
параболы
y2 px =2 p> : 0 (12.6)
Прежде всего отметим, что кривая лежит в правой полуплоско-
( 0)
сти x  и проходит через начало координат. Рассмотрим точку
( ; 0)
p
F 2 , называемую фокусом параболы, и прямую, перпендикуляр-
ную к оси Ox, с уравнением x =p , называемую директрисой па-
2
(; )
раболы. Пусть M x y – произвольная точка параболы. Вычислим
расстояние r
!j = r =  p 2
2 +y ;
jF1 M x 2
подставив y2 из соотношения (12.6), получим
r
 p 2 p
r = x+ = x + p2 = x + :
2 2 (12.7)

Расстояние d от M до директрисы x =
2 2 +
p также равно x p . По-
этому для параболы dr =1. Таким образом, парабола есть ГМТ, для
которых расстояние до фиксированной точки F (фокуса пара-
болы) равно расстоянию до фиксированной прямой (директрисы
параболы).
Так как для эллипса и гиперболы отношение dr есть постоянное
число, равное e – эксцентриситету, то и для параболы отношение dr =
e называют эксцентриситетом, т.е. для параболы e . =1
Из приведенного рассуждения следует, что эллипс, гипербола и
парабола обладают общим геометрическим свойством: отношение
расстояния r от любой точки M каждой из этих кривых до
фокуса к расстоянию d от этой точки M до соответствующей
директрисы есть величина постоянная, равная эксцентрисите-
ту e кривой.
Форма параболы легко устанавливается с использованием сим-
p
метрии относительно оси Ox и монотонного возрастания функции
y= 2 px (рис. 26а).
Для вывода единого уравнения эллипса, гиперболы и параболы в
полярной системе координат воспользуемся установленным еди-
ным для этих кривых свойством dr e. =
84
Пусть задана какая-либо из перечисленных кривых. Поместим по-
люс полярной системы координат в фокус F , а полярную ось – по
перпендикуляру от директрисы к фокусу (рис. 26б).
Пусть B – точка пересечения кривой с перпендикуляром к поляр-
!
ной оси, исходящим из фокуса F , а p - длина вектора F B , называемая
фокальным параметром. Согласно свойству dr e имеем, что =
p
!j = p! = e:
jCB jEF j
Поэтому
!j = p , а также
jEF e
! ! ! p
d = jDM j = jEM j = jEF j + r cos ' = + r cos ':
e
Подставляя данное выражение в отношение dr = e, получим
r
p + r cos ' = e;
e
откуда следует полярное уравнение для рассматриваемых кривых
1 1
второго порядка (e < – эллипс, e > – гипербола, e – па- =1
рабола):
p
r=
1 e cos ' : (12.8)

Отметим, что при e > 1 из-за условия r > 0 уравнение (12.8) опи-
сывает только одну ветвь гиперболы, внутри которой лежит фокус.
Эллипс, гиперболу и параболу называют коническими сечения-
ми, потому что их можно получить путем сечения плоскостями кру-
гового конуса. Если плоскость пересекает только одну полость конуса
и параллельна одной из образующих конуса, то получим параболу.
Если секущая плоскость пересекает только одну полость конуса и не
параллельна ни одной образующей конуса, то коническое сечение бу-
дет эллипсом. Когда секущая плоскость перпендикулярна оси конуса,
получаем окружность.
Наконец, если секущая плоскость не проходит через вершину и
параллельна оси конуса, то получим гиперболу.
В заключение лекции остановимся на условиях касания прямой
и кривой второго порядка, заданной своим каноническим уравнени-
ем. Рассмотрение подробно проведем для эллипса. Для гиперболы и
параболы все повторяется буквально, и для них мы приведем лишь
результат.
Пусть заданы прямая Ax By C + + =0 2
и эллипс xa2 y2 + =1
b2 .
Считаем B 6 =0 , так как прямые, перпендикулярные к оси Ox B ( = 0)
85
Рис. 26:

86
и касающиеся эллипса, известны (x = a). Совместное рассмотрение
системы уравнений
y=
 Ax C
B B;
x2 y2
+ =1
a2 b2
приводит к квадратному уравнению

x2 1 A C 2
 
+
a2 b2 B
x+
B
= 1;
корни которого должны совпадать (прямая Ax + By + C = 0 касается
кривой). Поэтому дискриминант

A2 C 2 1 + A2   C 2 1 = 0;

D=
B 4 b4 a2 B 2 b2 B 2 b2
откуда следует условие касания прямой Ax + By + C = 0 и эллипса
x2 y2
+ =1
a 2 b2
A2 a2 + B 2 b2 = C 2 : (12.9)
Аналогично рассуждая, получим условие касания прямой и ги-
перболы(12.1)
A2 a2 B 2 b2 C 2 ; = (12.10)
а также прямой y = kx + b и параболы y2 = 2px
(k p)2 = k2 b2:
2 2
Пример. Написать уравнение касательной к эллипсу x25 y16 + =1 ,
которая была бы перпендикулярна к прямой x y 2 3 +1=0
.
Решение. Условие перпендикулярности прямой Ax By C + + =0
и прямой x2 3 +1 = 0
y записывается в виде A B A 23 B , а
2 3 =0( = )
условие касания: A2
25 +16 = B 2 C 2 . Решая совместно данные условия,
получим  94
(25 +16) =B 2 C 2 , т.е. C  172 B . Подставляя в уравнение
=
прямой значения параметров A 3 B; C  17 B и сокращая на
= =
2 2
общий множитель 12 B; получим два решения задачи: x y 3 +2 17 = 0
.

87
Л е к ц и я 13
Простейшие задачи аналитической геометрии в
пространстве. Уравнение поверхности и уравнение
линии в пространстве. Различные виды уравнения
плоскости в пространстве
Переходим к аналитическому рассмотрению геометрических образов
в пространстве относительно прямоугольной системы координат
0
f ;~{;~|; ~kg. Предварительно остановимся на трех простейших понятиях
аналитической геометрии в пространстве, лежащих в основе решений
прикладных задач.
( )
Определение 1. Под расстоянием d M1 ; M2 между двумя точками
!
( ; ; ) ( ; ; )
M1 x1 y1 z1 , M2 x2 y2 z2 понимается модуль вектора M1 ; M2 , т. е.
!
d(M1 ; M2 ) = d(M2 ; M1 ) = jM1 ; M2 j =
p
= (x1 x2)2 + (y1 y2)2 + (z1 z2 )2: (13.1)
Пусть задана упорядоченная пара точек
A(x1 ; y1 ; z1 ); B (x2 ; y2 ; z2 ):
Проведем прямую линию, проходящую через точки A и B , и вы-
(; ; )
берем на прямой точку C x y z , не совпадающую с точкой B . Рас-
! !
смотрим векторы AC и CB . Они коллинеарны, и мы можем записать
!
AC = CB
! (13.2)
Число  в (13.2) называется отношением, в котором точка C де-
лит отрезок AB .
В координатах (13.2) имеет вид
x x1 = (x2 x); y y1 = (y2 y); z z1 = (z2 z );
откуда находим
x x1
=
x2 x
= yy y1
= zz z1
;
2 y 2 z
а также
x + x2 y + y2 z + z2
x= 1 ; y= 1 ; z= 1
1+ 1+ 1+ : (13.3)

В частности, при  = 1 , точка C делит отрезок пополам. Координаты


середины отрезка будут иметь вид
x +x y +y z +z
x = 1 2; y = 1 2; z = 1 2:
2 2 2 (13.4)

88
Часто в приложениях участвует формула для площади треуголь-
ника, заданного своими вершинами A1 x1 y1 z1 ; A2 x2 y2 z2 ; ( ; ; ) ( ; ; )
( ; ; )
A3 x3 y3 z3 . Напомним ее (см. лекцию 7)

~{ ~| ~k
S = j
1
x2 x1 y2 y1 z2

z1 j:
2
x3 x1 y3 y1 z3 z1
(13.5)

Перейдем к выяснению геометрического смысла уравнения с тре-


мя переменными. Целесообразно начинать с примера. Пусть нам за-
( )
дана сфера с центром в точке C a; b; c и радиуса R. Сферу можно
определить как ГМТ пространства, отстоящих от центра сфе-
ры на одном и том же расстоянии R. Если M x y z – произ-
! ! (; ; )
вольная точка сферы, то jCM j R или jCM j2 R2 . В координатах
= =
это равенство называется уравнением сферы и выглядит следующим
образом:
(x a 2 y b 2 z c 2 R2 :
) +( ) +( ) =
(13.6)
В частности, если центр сферы находится в начале координат, урав-
нение будет иметь вид
x2 + y 2 + z 2 = R 2 : (13.7)
В аналитической геометрии поверхность рассматривают как мно-
жество точек пространства обладающее определенным свойством. По-
(; ; )
этому, если M x y z – произвольная точка поверхности, то посред-
3
ством соотношения, связывающего переменные x; y; z выражают их
общее свойство.
Определение 2. Соотношение F x; y; z ( )=0
называют неявным
уравнением поверхности в пространстве z f x; y – явным урав- = ( )
нением), если ему удовлетворяют координаты любой точки поверх-
ности и не удовлетворяют координаты ни одной точки, не принадле-
жащей поверхности.
Заметим, что уравнение F x; y; z ( )=0
может иметь особенности
и множество точек, координаты которых удовлетворяют ему, может
быть пустым, составлять конечное и счетное множество, распадаться
на ветви, и т. д.
Например, множество действительных точек, удовлетворяющих
уравнению x2 y 2 z 2
+ + +1 = 0 , есть пустое множество, уравнение
2 2
+ + =0
x y z 2 определяет одну точку O , уравнение x2 z 2
(0; 0;0) =0
может быть представлено в виде x z x z ( )( + ) = 0и поверхность
распадается на две ветви: x z ;x z .=0 + =0
Пусть в уравнение поверхности не входит одна из переменных.
Какую поверхность определяет такое уравнение? Чтобы ответить на
этот вопрос, дадим определение цилиндрической поверхности.

89
Определение 3. Цилиндрической поверхностью (цилиндром) на-
зывается поверхность, полученная движением прямой, перемещаю-
щейся параллельно некоторому вектору и пересекающей во время
движения фиксированную линию. Движущаяся прямая называется
образующей цилиндрической поверхности (рис. 27а).

Пусть например уравнение не содержит z и имеет вид F x; y . ( )=0


На плоскости xOy уравнение определяет линию. (рис. 27б). Но это-
му уравнению удовлетворяют также координаты точек пространства,
у которых первые две координаты совпадают с координатами точек
L, а координата z произвольна, т. е. координаты точек всех пря-
мых, перпендикулярных к плоскости xOy в точках кривой L. Дан-
ная поверхность получена движением прямой вдоль L параллельно
вектору ~k. Итак, уравнение F x; y ( )=0 определяет цилиндриче-
скую поверхность с образующей параллельной оси Oz . Аналогич-
( )=0
но, F x; z задает цилиндрическую поверхность с образующей,
( )=0
параллельной оси Oy , а F y; z – цилиндр, образующие которого
параллельны оси Ox.
Методы аналитической геометрии и линейной алгебры позволя-
ют выяснить свойства поверхностей, левая часть уравнения которых
представляет полиномы первой и второй степени (поверхности, опи-
сываемые более сложными уравнениями, изучаются методами мате-
матического анализа и дифференциальной геометрии). В связи с этим
дадим определение алгебраической поверхности.

Определение 4. Алгебраической поверхностью m-го порядка на-


зывается поверхность, левая часть уравнения которой представляет
полином m-й степени относительно переменных x; y; z; т. е. сумму
+ + (
слагаемых вида Axp y q z r , где p q r  m p; q; r  .0)
Например, Ax + By + Cz + D = 0 – общее уравнение алгебраической
поверхности первого порядка, а Ax2 + 2Bxy + 2Cxz + Dy 2 + 2Eyz +
F z 2 +2Gx +2Hy +2Kz + L = 0 – общее уравнение поверхности второго
порядка.
Линию в пространстве можно рассматривать как пересечение двух
поверхностей
   
F1 (x; y; z ) = 0 z = f1 (x; y) ;
F2 (x; y; z ) = 0 или
z = f2 (x; y) (13.8)

т. е. линия есть ГМТ, координаты которых удовлетворяют си-


стеме двух уравнений с тремя неизвестными.
Линию в пространстве в классической механике рассматривают
как след движущейся материальной точки, координаты которой есть

90
Рис. 27:

функции времени t (параметра t)


9
x = x(t) =
y = y(t) (t 2 T ): (13.9)
z = z (t) ;

В аналитической геометрии от вре-


менного смысла параметра отказыва-
ются, и t может иметь смысл перемен-
ного угла и др. Уравнения (13.9) но-
сят название параметрических уравне-
ний линии в пространстве.
Пример. Пусть отрезок OA длины
a равномерно вращается и равномерно
движется вдоль оси Oz (рис. 28). Точка
A описывает линию, находящуюся на
поверхности цилиндра. Она носит на-
Рис. 28: звание винтовой линии Если за пара-
метр t выбрать угол поворота отрезка,
то параметрические уравнения винтовой линии имеют вид
9
x = a cos t =
y = a sin t ( 1 < t < +1): (13.10)
z = bt ;

Обратимся сейчас к исследованию алгебраической поверхности


первой степени. С этой целью рассмотрим некоторую плоскость в про-
( )
странстве. Ее можно зафиксировать, если задать точку M0 x0 ; y0 ; z0
(опорная точка плоскости) и нормальный вектор N =0
~ (A,B,C)6 ~
(вектор, ортогональный к плоскости).

91
Рис. 29:

( )
Пусть точка M x; y; z – текущая точка плоскости (рис. 29). Век-
~ . Поэтому уравнение
тор ~r ~r0 ортогонален к N
(N~ (~r ~r0 )) = 0 (13.11)
есть векторное уравнение плоскости с опорной точкой и нор-
мальным вектором ~n. В координатной записи имеем
A(x x0 ) + B (y y0 ) + C (z z0 ) = 0: (13.12)
Если раскрыть скобки и обозначить D = Ax0 By0 Cz0 , то при-
ходим к алгебраическому уравнению первого порядка
Ax + By + Cz + D = 0: (13.13)
Обратно, в прямоугольной системе координат имеем уравнение
(13.13), то это будет уравнение некоторой плоскости. В самом де-
ле, уравнение (13.13) есть линейное уравнение с тремя неизвестны-
( )
ми. Оно всегда имеет решение. Пусть x0 ; y0 ; z0 – некоторое решение
+ + + 0
(13.13), т. е. Ax0 By0 Cz0 D  . Вычитая это тождество из (13.13),
(
получим A x x0 )+ (
B y y0 C z z0 )+ ( )=0
. На левую часть этого
соотношения можно смотреть как на скалярное произведение вектора
= + +
N~ (A,B,C) и вектора ~r ~r0 , где ~r0 ~{x0 ~|y0 ~kz0 – фиксированный
( ) ((
вектор, задающий точку M0 x0 ; y0 ; z0 , т. е. ~n ~r ~r0 )) = 0
. Очевидно,
что данному уравнению удовлетворяют координаты любой точки
плоскости, проходящей через M0 и имеющей нормальный вектор N ~,
и не удовлетворяют координаты ни одной точки P с радиус-вектором
r~0 не лежащей на плоскости, так как r~0 ~r0 не ортогонален ~n и, сле-
довательно, N ( ( )) = 0
~ ~r ~r0 6 .

92
Определение 5. Уравнение (13.13) называется общим уравнением
плоскости в пространстве.
В зависимости от того, какой из параметров A; B; C; D равен нулю
или отличен от нуля, расположение плоскости относительно систе-
мы координат будет обладать определенным свойством (параллель-
ность координатной оси, координатной плоскости, и т.д.). Например,
Ax By Cz+ + =0
есть уравнение плоскости, проходящей через начало
координат. Исследование других частных случаев предоставим чита-
телю и остановимся лишь на видах уравнений плоскости, имеющих
наибольшие приложения.
Уравнение в отрезках. Пусть A 6 =0 =0
; B 6 ; C 6 ; D 6 . То- =0 =0
гда общее уравнение (13.13) можно переписать в виде ( xD ) ( yD )
A
+ B +
(
z
D
C ) = 1. Обозначив a = Ab=
D, D,
B c = D , имеем уравнение
C
плоскости в отрезках
x y z
+ +
a b c
= 1: (13.14)

Плоскость отсекает от осей координат отрезки длиной jaj; jbj; jcj, по-
скольку уравнению (13.13) удовлетворяют координаты точек P1 a; ; , ( 0 0)
(0 0) (0 0 )
P2 ; b; , P3 ; ; c .
Уравнение плоскости, проходящей через точки. Заданы три 3
( )
точки Mi xi ; yi ; zi , не лежащие на одной прямой. Пусть M x; y; z –
! ! ! ( )
текущая точка плоскости. Векторы M1 M , M2 M1 , M1 M3 компланар-
ны, и, следовательно, смешанное произведение этих векторов равно
нулю (рис. 29б)

((~r ~r1 )(~r2 ~r1 )(~r3 ~r1 )) = 0: (13.15)

Имеем векторное уравнение плоскости, проходящей через 3 точ-


ки. В координатной записи (13.15) имеет вид

x x1 y y1 z z1

x2
x1 y2 y1 z2 z1 = 0: (13.16)
x3 x1 y3 y1 z3 z1
Нормированное (нормальное) уравнение плоскости. Пусть плос-

из начала координат на плоскость и рассмотрим вектор OP


! p~.
кость не проходит через начало координат. Опустим перпендикуляр
=
Пусть ~n ~{ = cos( ) + cos( ) + cos( )
~| ~k – орт вектора p~, M x y z – (; ; )
текущая точка плоскости (рис. 30а). Видим, что ~r p~n ортогонален
(( ) )=0
вектору ~n и, следовательно, ~r p~n ~n . Раскрывая скобки имеем

(~r~n) p = 0 (p > 0): (13.17)

Получили нормированное (нормальное) уравнение плоскости в

93
Рис. 30:

векторном виде. В координатной записи (13.17) имеет вид


x cos + y cos( ) + z cos( ) p = 0 (p > 0): (13.18)
Если уравнение плоскости задано общим уравнением Ax + By +
+ =0
Cz D , то его можно пронормировать, учитывая, что
N~
~n =
"jN~ j
= "pA2 +AB 2 + C 2~{ + "pA2 +BB 2 + C 2 ~|+
+ "pA2 +CB 2 + C 2 ~k
где " = +1, когда D < 0, и " = 1, когда D > 0. Итак,

p 2 Ax 2 2 + p 2 By 2 2 + p 2 Cz 2 2 +
" A +B +C " A +B +C " A +B +C
+ "pA2 +DB 2 + C 2 = 0 (13.19)

– нормированное уравнение плоскости, полученное из общего урав-


нения.
( ; ; )
Определение 6. Отклонением  точки M0 x0 y0 z0 от плоскости
+
называется число, равное d, где d – расстояние от точки M0 до
плоскости, если M0 и начало координат находятся по разные сто-
роны плоскости, и равное d, если M0 и начало координат находятся
по одну сторону плоскости.
Поскольку
!
 = Пр~n OM0 p (рис. 30б), то
!
 = (OM0  ~n) p = (~r0~n) p:

94
В координатной записи имеем

 = x0 cos + y0 cos + z0 cos p: (13.20)

Из (13.20) следует, что для расстояния от точки до плоскости имеет


место формула

d = jx0 cos + y0 cos + z0 cos pj: (13.21)

Пример. Найти расстояние от точки M ; ; (1 1 2) до плоскости 3x


y+ z +1=0 .
Решение. Нормируем уравнение плоскости:

p3x + py pz p1 = 0:
11 11 11 11
По (13.20) получаем

d=j p3 p1 p2 p1 j = p7 :
11 11 11 11 11
Наконец, остановимся на условиях параллельности и перпендику-
+
лярности двух плоскостей A1 x B1 y C1 z D1 + + =0
и A2 x B2 y + +
+ =0
C2 z D2 . Поскольку параллельность плоскостей означает колли-
неарность нормальных векторов плоскостей, то в силу необходимых
и достаточных условий коллинеарности двух векторов мы имеем сле-
дующее утверждение.

Теорема 1. Необходимым и достаточным условием параллель-


ности двух плоскостей является условие
 
[N~ 1N~ 2] = 0 () ранг A1 B1 C1 = 1: (13.22)
A2 B2 C2

Перпендикулярность двух плоскостей эквивалентна ортогональ-


ности их нормальных векторов. Поэтому имеем еще одно утвержде-
ние.

Теорема 2. Необходимым и достаточным условием перпенди-


кулярности двух плоскостей является условие

(N~ 1N~ 2) = 0 () A1 A2 + B1B2 + C1 C2 = 0: (13.23)

Пример 1. Найти уравнение плоскости, проходящей через точку


(1 2 2)
M0 ; ; и параллельно плоскости x y z 3 +2 . +1=0
95
Решение. Нормальный вектор N (3 2 1)
~ 1 имеет координаты ; ; . За
нормальный вектор искомой плоскости можно взять (ради простоты
решения) вектор, совпадающий с N 3( 1) + 2(
~ 1 . Поэтому имеем x y
2) ( + 2) = 0
z или x 3 +2
y z 9=0 .
Пример 2. Найти уравнение множества плоскостей, проходящих
через точку M0 (1; 2; 2)
и перпендикулярных к плоскости x3 +2 y
z +1=0 .
3 +2
Решение. Из (13.23) следует A2 =0
B2 C2 = . Находим C2
3 +2 ( 1)+ ( 2)+ ( +2) =
A2 B2 и подставим в уравнение A2 x B2 y C2 z
0 + + (3 + 2 ) = 5
. Окончательно имеем: A2 x B2 y A2 2B2 z A2 B2 –
параметрическое семейство плоскостей.

96
Л е к ц и я 14
Прямая в пространстве. Взаимное расположение
прямой и плоскости в пространстве. Исследование
формы поверхностей второго порядка по
каноническим уравнениям
Прямая в пространстве полностью определена, если на ней задана
( ; ; )
точка M0 x0 y0 z0 (опорная точка прямой) и направляющий век-
тор p ( ) (; ; )
~ l,m,n . Пусть M x y z – текущая точка прямой. Тогда
векторы M~0 M и p
~ коллинеарны, и мы можем записать ~r ~r0 t~p =
( + )
1 < t < 1 (рис. 31а), т.е. для радиус-вектор ~r текущей точки
имеем
= (
~r ~r0 t~p 1 < t < 1 : + ) (14.1)
Уравнение (14.1) есть векторное параметрическое уравнение
прямой в пространстве. В координатной записи (14.1) выглядит
следующим образом:
8
< x = x0 + lt
y = y0 + mt ( 1 < t < +1): (14.2)
:
z = z0 + nt
Исключим t из уравнений (14.2), разрешив их сначала относитель-
но t, а затем приравняв правые части равенств, имеем:
x x0
l
= y my0 = z n
z0
: (14.3)

Уравнения (14.3) носят название канонических уравнений пря-


мой в пространстве. Заметим, что если какая-либо координата на-
правляющего вектора равна нулю, то равен нулю и числитель дроби.
Например, выражение z 0z0 понимают условно, оно означает равен-
ство z z0 =0 .
На основании (14.3) легко написать уравнение прямой, проходя-
( ; ; ) ( ; ; )
щей через 2 точкиM1 x1 y1 z1 и M2 x2 y2 z2 . Первую точку, на-
пример, мы принимаем за опорную, а за направляющий вектор p
! ~6 =0
возьмем вектор M1 M2 =( )
x2 x1 ; y2 y1 ; z2 z1 . Поэтому уравнение
2
прямой через точки примет вид
x x1
x2 x1
= yx x1
= zz z1
: (14.4)
2 y1 2 z1
Прямая в пространстве может быть задана также как пересечение
двух плоскостей

A1 x + B1 y + C1 z + D1 = 0
A2 x + B2 y + C2 z + D2 = 0 (14.5)

97
Рис. 31:

Плоскости пересекаются, если их нормальные векторы не колли-


неарные векторы (иначе плоскости параллельны). Поэтому за направ-
ляющий вектор p~ прямой может быть взят вектор, полученный от пе-
~
ремножения N1 и N~ 2 векторным способом (рис.31б). Итак, p~ N~ 1 N~ 2 . =[ ]
За опорную точку искомой прямой можно взять любую
тройку чисел,
удовлетворяющую системе (14.5). Если 1
A
1 6 ; то положив B
=0
A2 B2
в (14.5) z =0 и решая оставшуюся систему двух уравнений с дву-
мя неизвестными, находим x0 и y0 . Точка с координатами x0 y0 и ( ; ; 0)
будет опорной точкой прямой.
Тем самым от уравнения прямой в виде (14.5) мы переходим к
каноническим (или параметрическим) уравнениям той же прямой.

x y + 2z + 1 = 0
Пример. Прямая задана в виде
x + y + 3z + 2 = 0 . Написать
ее каноническое уравнение.
Решение. Положив z =0
, решаем систему

x y= 1
x+y = 2:
Находим, что x 3; y
= 1 . Итак, опорная точка имеет координаты
=
2 2
3 1 . Найдем направляющий
( ; ; 0)
2 2 вектор p
~

~{
~| ~k
p~ = [N~1 N~2 ] =
1 1 2 = 5~{ ~| + 2~k:
1 1 3
98
Канонические уравнения прямой имеют вид

x + 32 y + 12 z
5 = =
1 2:
В механике часто уравнение прямой записывают в виде момента
вектора p
~. Поскольку вектор ~r ~r0 коллинеарен с p~, то их векторное
[(
произведение ~r ~r0 p~ ) ]=0 [ ]=
: Обозначив ~r0 p~ ~a, получим векторное
уравнение прямой в виде "момента"

[~rp~] = ~a: (14.6)

Используя сведения из векторной алгебры, легко вывести значе-

\)
ние косинуса угла между прямыми, подразумевая под ним угол (в
пределах от нуля до  ) между направляющими векторами прямых
=(
' p~1 ; p~2 . Поэтому

cos ' = (jp~p~1jj; p~p~2 )j = p 2l1 l2 + m1 mp2 + n1 n2


:
l1 + m21 + n21 l12 + m21 + n21
(14.7)
1 2
Теорема 1. Необходимым и достаточным условием параллель-
ности прямых в пространстве является условие
 
l1 m1 n1
[p~1p~2] = 0 l2
= m2
= n2
:

Доказательство теоремы совпадает дословно с доказательством


теоремы о необходимых и достаточных условиях коллинеарности двух
векторов. Аналогично имеет место также следующая теорема.
Теорема 2. Необходимым и достаточным условием перпендику-
лярности двух прямых является условие p~1 p~2 ( ) = 0
( + +
l1 l2 m1 m2 n1 n2 . = 0)
Как узнать, являются ли две данные прямые скрещивающими-
ся? Если прямые не являются скрещивающимися (т.е. пересекают-
!
ся или параллельны), то они лежат в одной плоскости и векторы
M1 M2 ; p~1 ; p~2 ; где M1 и M2 – опорные точки прямых, компланарны,
т.е.
x2 x1 y2 y1 z2 z1

4=
l1 m1 n1 = 0: (14.8)
l2 m2 n2
Если 4 6 =0
то прямые являются скрещивающимися.
y 1
Пример. Лежат ли прямые x+12 0
z +2 ; x 2
1 1 = = = y+1 z 5
2 = 0 в
одной плоскости?

99
Решение. Проверим равенство (14.8) Вычисляем определитель

3 2 7


4 = 2 0 1 = 3  2 + 2  1 + 7  4 = 36 6= 0:


1 2 0

Прямые являются скрещивающимися и в одной плоскости не ле-


жат.
Перейдем к рассмотрению ряда задач на взаимное расположение
прямой и плоскости. Используя доказанные в векторной алгебре тео-
3
реме, приведем утверждения.
Теорема 3. Необходимым и достаточным условием перпендику-
~ p ~ или
лярности прямой и плоскости является условие N~ [ ]=0 (
A
l = = )
B
m
C .
n
Теорема 4. Необходимым и достаточным условием параллель-
~p
ности прямой и плоскости является условие N~ или Al( )=0 ( +
Bm cn + = 0)
.
Теорема 5. Необходимым и достаточным условием принадлеж-
ности прямой плоскости является одновременное выполнение
+
условий: Al Bm Cn + =0
; Ax0 By0 Cz0 D .+ + + =0
В самом деле, первое условие выполнено в силу теоремы 4, а
второе условие означает, что опорная точка прямой принадлежит и
плоскости и следовательно, ее координаты удовлетворяют уравнению
плоскости.
Пример. Лежит ли прямая x 11 y+1 =z 5 на плоскости x
= 2 +
0 2
3 +
y z 4=0 ?
Решение. Проверяем первое условие:  2 ( 1) + 3 0 + 1 2 0
   .
проверяем второе условие:  2 1+3( 1)+5 4 0
 . Прямая принадлежит
плоскости.
Задача 1. Написать уравнение плоскости,проходящей через пря-
мую x lx0 =y+y0 = ( ; ; )
z z0 и точку M x y z , не лежащую на пря-
m n 1 1 1 1
мой.
! (; ; )
Пусть M x y z – текущая точка плоскости. В таком случае век-
! ~ компланарны.
торы M0 M (M0 – опорная точка прямой), M0 M1 и p
Это значит
x x0 y y0 z z0

x1
x0 y1 y0 z1 z0 = 0: (14.9)
l m n
Это и есть уравнение искомой плоскости.
Задача 2. Написать уравнение плоскости, проходящей через пря-
мую x lx0 =y+y0 =
z z0 и параллельной прямой x x1 y+y1 = =
z z1
m n l1 m1 n1
([ ] = 0)
p~p~1 6 ~ .

100
За нормальный вектор плоскости можно взять вектор равный век-
=[ ]
~ и p~1 : N~ p~p~1 . За опорную точку плоскости
торному произведению p
можно взять опорную точку прямой, через которую проходит плос-
кость. Поэтому искомое уравнение имеет вид p ([ ](
~p~1 ~r ~r0 . В)) = 0
координатах имеем

x x0 y y0 z z0


l m n = 0: (14.10)
l1 m1 n1
Задача 3. Написать уравнение плоскости, которая перпендику-
+ +
лярна к плоскости A1 x B1 y C1 z D1
y+y0
+ =0
и проходит через прямую
x x0
l = m = z z0 .
n
За нормальный вектор искомой плоскости возьмем N ~ p~N~1 , =[ ]
а за опорную искомой плоскости – опорную точку прямой, так как
~N~1 ~r ~r0
плоскость проходит через нее. Имеем, что p ([ ](
или в )) = 0
координатах

x x0 y y0 z z0

l
m n = 0: (14.11)
A1 B1 C1
Задача 4. Найти координаты точки пересечения прямой x lx0 =
y+y0= +
z z0 и плоскости Ax By Cz D + + =0
.
m n
= +
Решение. Запишем параметрические уравнения прямой: x x0
= + = +
lt; y y0 mt; z z0 nt. Подставив в уравнение плоскости эти
( + )+ ( + )+ ( + )+ = 0
значения, получим A x0 lt B y0 mt C z0 nt D ,
+ + + =0
откуда при Al Bm Cn D 6 =
найдем значение параметра t t , 0
= + =
которое удовлетворяет данному уравнению. Тогда x0 x0 lt0 ; y0
+ = + +
y0 mt0 ; z 0 z0 nt0 есть координаты точки пересечения. Если Al
+ =0
Bm Cn , то прямая параллельна плоскости.
Задача 5. Найти расстояние от точки до прямой в пространстве.
Решение. Пусть прямая задана векторным параметрическим урав-
= +
нением ~r ~r0 t~ ( ; ; )
p с опорной точкой M0 x0 y0 z0 и точкой M1 x1 y1 z1 ( ; ; )
вне прямой. Опустим из точки M1 перпендикуляр M1 M10 (рис. 32а).
Совместим начало направляющего вектора с опорной точкой M0 и
построим параллелограмм на векторах p
!
~ и M0 M1 . Тогда расстояние
d от точки M1 до прямой мы можем найти, разделив площадь парал-
лелограмма на длину основании jp ~ j.
! ~. Поэтому
Площадь параллелограмма, как известно, совпадает с модулем
векторного произведения M0 M1  p

d=
j[(r~1 r~0 )p~]j
jp~j (14.12)

101
Рис. 32:

Пример. Требуется найти расстояние от точки M1 (1; 1; 2) до


прямой x+1 y 1 z 3.
= =
0 1 2
Имеем:
~{
~| ~k
1) [(~r1 ~r0 )p~] =
2 2 1 = 3~{ 4~| + 2~k;


0p 1 2 p

~]j = 9 + 16p+ 4 = 29;
2) j[(~r1 p~r0 )p
~j =q 0 + 12 + 22 = 5;
3) jp 2
4) d = 29 5.
Задача 6. Найти расстояние между прямыми в пространстве.Если
прямые пересекаются или параллельны (условие (14.8)), то в первом
случае расстояние равно нулю, а во втором – расстояние между пря-
мыми равно расстоянию от опорной точки первой прямой до второй
прямой и вычисляется по формуле (14.12).
Пусть прямые

x x0
l1
= y m+ y1 = z n z1 и
x x1
l2
= y m+ y2 = z n z2
1 1 2 2
– скрещивающиеся. Для них определитель (14.8) отличен от нуля.
Кратчайшее расстояние между ними равно расстоянию между парал-
лельными плоскостями, проходящими соответственно через первую
и вторую прямые. Очевидно, за нормальный вектор N ~ к плоско-
сти может быть выбран вектор p [
~1 p~2 . Опорные точки M1 x1 y1 z1 ; ] ( ; ; )
( ; ; )
M2 x2 y2 z2 прямых могут быть взяты за опорные точки плоскостей.
Уравнения плоскостей будут иметь вид

([p~1p~2](~r r~1 )) = 0; ([p~1p~2 ](~r r~2 )) = 0:

102
Искомое расстояние будет равно модулю проекции вектора
!
M1 M2 на
=
~n jNN~~ j (рис. 32б). Окончательно имеем

!
d = jПр~n M1 M2 j = j((~r2 ~r1 )~n)j =
j((~r2 ~r1 )p~1 p~2 )j :
j[p~1 p~2 ]j (14.13)

да, построенного на векторах p


!
Заметим, что в числителе дроби (14.13) стоит объем параллелепипе-
~1 p~2 ; M1 M2 , а знаменателе – площадь
параллелограмма, лежащего в основании параллелепипеда. Поэто-

щенного из вершины параллелепипеда fp


!
му кратчайшее расстояние совпадает с длиной перпендикуляра, опу-
~1 ; p~2 ; M1 M2 g на основание
fp~1 ; p~2 g.
Материал по аналитической геометрии в пространстве мы закон-
чим исследованием формы поверхностей второго порядка методом
параллельных сечений по их каноническим уравнениям. Изложение
этого материала вызвано потребностями математического анализа.
Строгая классификация поверхностей второго порядка будет дана ни-
же с использованием методов линейной алгебры.
1. Эллипсоид:

x2 y 2 z 2
+ +
a2 b2 c2
= 1 (a > 0; b > 0; c > 0): (14.14)

Поскольку из (14.14) следует, что jxj  a; jy j  b; jz j  c; то эл-


липсоид заключен в прямоугольном параллелепипеде со сторонами
2 2 2
a; b; c. Координатные плоскости являются плоскостями симмет-
рии. Рассечем поверхность плоскостями z
2 2 2
= (
h jhj  c . Получим )
кривые с уравнениями xa2
q q
y
b2+ =1 h
c2 ( = )
z h . Это эллипсы с
полуосями a 1 h2 и b
c 2 1
h2 . При h
c2 =0
эллипс имеет наиболь-
шие полуоси. Когда jhj растет, то полуоси эллипсов уменьшаются и
при jhj = c эллипсы вырождаются в точки A1 c и A2(0; 0; ) c (0; 0; )
(рис. 33а). Аналогично картина возникает, если рассекать эллипсоид
плоскостями, перпендикулярными к оси Ox и Oy .
2 y2 z2
2. Однополостный гиперболоид: xa2 b2 + c2 =1
Координатные плоскости являются плоскостями симметрии ( при
замене x на x, y на y , z на z уравнение не меняется). Рассекаем
плоскостями, параллельными плоскости xOy : z
2 2 2
=
h. Получим ли-
x
нии, сечения с уравнениями a2 y+ = 1+
b2
h (
c2 ; 1 < h < 1 : Это + )
эллипсы, полуоси которых
r r
h2 h2
a 1+ 2; b 1 + c2
c
103
Рис. 33:

104
растут вместе с ростом jhj. Наименьший эллипс имеем при h =0
(плоскость xOy ). Он носит название горлового эллипса (рис. 33б).
2 z2
Сечения плоскостями x
2 z2
, y =0 =0
дают нам гиперболы yb2 c2 =
1 x + =1
; a2 c 2 . Точки этих гипербол являются вершинами эллипсов,
получаемых при сечении поверхности плоскостями z h. =
3. Двуполостной гиперболоид:

x2 y 2 z2
+
a2 b2 c2
= 1
Координатные плоскости являются плоскостями симметрии. Се-
2 y2 h2
=
чения z h дают линии с уравнениями xa2 b 2 + = c2 1 =
; z h. При
jhj < c имеем мнимые эллипсы. Следовательно, поверхность располо-
=
жена выше плоскости z c и ниже плоскости z qc. При jhq = j  c по-
лучаем вещественные эллипсы, полуоси которых a hc2
2
1
; b hc22 1
растут вместе с ростом jhj. При сечении плоскостями x
2 2 2 2
=0 =0
иy
имеем сопряженные гиперболы yb2 z
c2 + = 1
; xa2 zc2 + = 1 в точ-
ках которых лежат вершины эллипсов, получаемых сечениями z h =
( )
jhj  c (рис. 34а)
4. Эллиптический параболоид: z x2 y2 .
= +
a 2 b2
Плоскости yOz и xOz являются плоскостями симметрии. Поверх-
ность проходит через начало координат и расположена над плоско-
0 =
стью xOy , так как z  . Сечения z h дают эллипсы xa2
2 y2
+ = h,
p p b2
полуоси которых a h; b h растут с ростом h (рис. 34б). При сечении
плоскостями x =0 и y =0
имеем параболы z y2 ; z
= x2 , точки
=
b2 a2
которых являются вершинами указанных выше эллипсов.
5. Гиперболический параболоид: z x2 = y2 . Плоскости yOz и
a 2 b2
xOz являются плоскостями симметрии. Рассечем поверхность 2
плос-
костью y =0 . В плоскости xOz получим параболу z x =
a2 . Сечение
плоскостью x =0 дает нам в плоскости yOz параболу z = y2 , ветви
b2
которой направлены вниз. Сечение координатной плоскостью z =0
есть пара пересекающихся прямых xa2
2 y2 =0( =
y  ab x. Сечение
b2
=
плоскостями z h дает гиперболы с уравнениями ha x2 y2 =1
2 hb2 , при-
0
чем при h > ветви расположены вдоль оси Ox, а при h < ветви 0
расположены вдоль оси Oy . Построив соответствующие сечения, мы
получим вид гиперболического параболоида (рис. 35а).
2 y2 z2
6. Эллиптический конус: xa2 b2 +c2 =0
Поверхность симметрична относительно всех координатных плос-
2 2 h2 с
=
костей. Сечение плоскостями z h дают нам эллипсы xa2 yb2 + = c2
j hja jhjb
полуосями c ; c . Полуоси эллипсов растут с ростом jhj. При h =0
имеем точку (начало координат). Сечение плоскостями x =0иy =0
105
Рис. 34:

дают соответственно пары прямых z = =


 cb y и z  ac x. Вид эллип-
тического конуса дан на рис. 35б.
7. Цилиндры второго порядка. Для примера приведем лишь ци-
линдры с образующими, параллельными оси Oz :
2 y2
(a) эллиптический цилиндр: xa2 + =1
b2
(б) гиперболический цилиндр: xa2
2 y2
=1
b2
(в) параболический цилиндр: y 2 =2px
Поскольку кривые второго порядка изучены нами ранее и в лек-
ции 13 подробно рассмотрен вопрос о цилиндрических поверхностях
с образующими, параллельными оси Oz , то вид цилиндров устанав-
ливается легко (рис. 36). Аналогично обстоит дело, когда отсутствует
какая-либо другая переменная.
Если нужно получить уравнение общей цилиндрической поверх-
ности с образующими, параллельными
 вектору p ( )
~ l; m; n и проходя-
L; F1 (x; y; z ) = 0
щими через точки линии
F2 (x; y; z ) = 0 , то поступаем следую-
щим образом. Напишем уравнение образующей X l x m=
Y y =
Z z,
n
где x; y; z – координаты переменной точки линии L. Затем из четырех

106
Рис. 35:

уравнений 8
< F1 (x; y; z ) = 0
F2 (x; y; z ) = 0
: X x
l = Ym y = Zn z
исключим переменные x; y; z . В результате получим уравнение иско-
(
мой цилиндрической поверхности X; Y; Z )=0
.
На этом материал по аналитической геометрии исчерпан, и мы
переходим к курсу линейной алгебры.

Рис. 36:

107
Л е к ц и я 15
Определение линейного пространства. Линейная
зависимость векторов. Базис и размерность
Пусть задано некоторое множество L, элементы которого будем на-
зывать векторами (независимо от природы элементов множества).
В каждом конкретном случае они приобретают определенный смысл.
Например, направленные отрезки, если речь идет о векторах евклидо-
ва пространства, матрицы-столбцы (матрицы-строки), если речь идет
о множестве решений однородной системы линейных уравнений, или
-функции в квантовой механике и т. д.
Наряду с множеством векторов будем рассматривать числовое по-
ле K, под которым подразумевается поле комплексных чисел C либо
поле вещественных чисел R, о чем в случае необходимости будем
оговаривать особо. Элементы L будем обозначать в дальнейшем ла-
тинскими малыми буквами, а элементы множества K – греческими
малыми буквами.
Определение 1. Пара L =( )
L; K называется линейным простран-
( )
ством, если A задан закон, по которому любой паре векторов x; y 2
L сопоставлен вектор, называемый их суммой и обозначаемый симво-
+ ( ) + = +
лом x y , причем для любых x; y; z 2 L выполнено: A1 x y y x;
( ) ( + )+ = +( + ) ( )
A2 x y z x y z ; A3 для любого x 2 L существует
0 +0 = ( )
нуль-вектор , что x x; A4 для любого x 2 L существует
+ =0 ( )
противоположный вектор x , что x x0
0 ; B задан закон, по ко-
торому для любого x 2 L и любого числа  2 K сопоставлен вектор
x, называемый произведением числа  на вектор x, причем выпол-
( )1 = ( ) ( )=( ) ( ) + ) = +
нено: B1  x x; B2  x  x; B3 (  x x x; B4 ( )
( + )= +
 x y x y.
Когда речь идет о конкретных линейных пространствах, то опера-
ции сложения векторов и умножения вектора на число приобретают
свой конкретный смысл. Например, если в качестве L рассмотреть
множество всех матриц-строк вида a =[ ] =[ ]
1 ; : : : ; n , b 1 ; : : : ; n ,
+ =[ +
то a b + ] =[ ]
1 1 : : : ; n n , a  1 ; : : : ;  n . Легко убедиться в
( )( )
том, что все аксиомы Ai , Bi выполнены, если за нуль-вектор взять
0 = [0 0 0]
; ; : : : ; , а за противоположный a0 =[ ]
1 ; 2 ; : : : ; n .
На основании определения линейного пространства следует утвер- 3
ждения.
Теорема 1. Нуль-вектор единственен.
В самом деле, если существуют два нуль-вектора 01 и 02 , то по
( ) 0 +0 = 0 0 +0 = 0
A3 1 2 1, 2 1 2 . Но 1 2 0 + 0 = 0 + 01 (по (A1 )) и,
2
0 =0
следовательно, 1 2 .

108
Теорема 2. Если любой вектор x умножить на нуль-число, то
получим нуль-вектор.

Действительно, рассмотрим x + 0 = (1 + 0)
x x (по B3 ). Поэтому ( )
x+0 x =1 = ( )
 x x (по B1 ). Сравнивая равенства x xи +0 =
x+0 = 0 =0
 x x, выводим равенство  x .
Теорема 3. От умножения вектора x на -1 получим противо-
положный вектор x0 .

Доказательство: x + ( 1) = (1 + ( 1)) = 0 = 0
x x  x . Сравнивая
+ =0
равенства x x 0 иx + ( 1) = 0
x , выводим равенство x0 = 1
 x.
Операции сложения векторов и умножения на число позволяют
ввести в рассмотрение линейные комбинации векторов

a = 1 x1 + 2 x2 + : : : + k xk (15.1)

Определение 2. Система векторов fa1 ; : : : ; as g называется линейно-


зависимой, если существуют числа 1 ; : : : ; s , среди которых хотя бы
одно отлично от нуля, что выполнено
s
X
k ak = 1 a1 + 2 a2 + : : : + s as = 0 (15.2)
k=1

Если соотношение вида (15.2) выполнено тогда и только тогда, когда


все k =0, то система векторов называется линейно-независимой.
k
z}|{
Пример. В пространстве матриц-строк векторы ak ;::: = [0
::: 1 0]
(k=1 ; n) образуют линейно-независимую систему векторов, так как,
составив линейную комбинацию векторов ak с произвольными (апри-
ори) числами k и приравнивая нулю, в подробной записи случаем
9
1  1 + 2  0 + : : : + n  0 = 0 >
>
1  0 + 2  1 + : : : + n  0 = 0 =
;
:::::::::::::::::::::::: ::: ::: >
>
1  0 + 2  0 + : : : + n  1 = 0 ;

откуда следует равенство нулю всех коэффициентов k (k ; n). =1


Докажем ряд утверждений, касающихся линейной зависимости
системы векторов.

Теорема 4. Если какая-либо подсистема системы векторов ли-


нейно-зависима, то и вся система линейно-зависима.

109
Действительно, если подсистема faj1 ; aj2 ; : : : ; ap g, где j1 ; j2 ; : : : ; jp
j
12
- фиксированные индексы из набора ; ; : : : ; s, линейно-зависимая,
то существуют числа j1 ; : : : ; jp , среди которых, например, j1 6 ,=0
+ +
что выполнено j1 aj1 : : : jp ajp =0
. Очевидно, выполнено также
0 + +0 + + + +0
 a1 : : :  aj1 1 j1 aj1 : : : jp ajp  ajp +1 : : :  as , + +0 =0
где j1 6=0 . Система векторов

fa1 ; : : : ; aj1 ; : : : ; ajp ; : : : ; as g


линейно-зависима.

Теорема 5. Для того, чтобы система fa1 ; : : : ; as g была линейно-


зависимой, необходимо и достаточно, чтобы хотя бы один из
векторов был линейной комбинацией других.

В самом деле, если система векторов линейно-зависима, то выпол-


нено условие (15.2), где, например, 1 6 =0
. Поэтому из (15.2) следует,
что    
2 s
a1 = a + ::: + a:
1 2 1 s
Необходимость доказана.
Пусть, обратно, какой-либо вектор из системы fa1 ; : : : ; as g есть
линейная комбинация остальных. Например, первый вектор a1 =
+ +
2 a2 : : : s as . Это равенство эквивалентно следующему равенству
( 1) + + +
a1 2 a2 : : : s as =0
, где первый коэффициент отличен от
нуля.

Определение 3. Система векторов fe1 ; e2 ; : : : ; en g называется бази-


сом в пространстве L, если она линейно-независима и любой вектор
x пространства представим в виде
n
X
x=  k ek =  1 e1 +  2 e2 + : : : +  n en (15.3)
k=1

Числа  1 ; : : : ;  n называются координатами (компонентами) вектора


x в данном базисе.
В матричном обозначении это выглядит в задании матрицы-столбца
[x]: 2 3
1
62 7
[x] = 64 .. 75 :
6 7
(15.4)
.
n

110
Теорема 6. Координаты вектора в заданном базисе определя-
ются однозначно.
Действительно,
Pn если предположить,
Pn что это не так, P
т.е. одновре-
менно x
Pn
= k =1
Pn
 k e =
k и x k =1 
e ek , то из равенства
k n
k =1  ke
k =
k=1  ek (или
ek (k=1 
k ) = 0)
 ek
ek и линейной независимости век-
= =1
торов e1 ; : : : ; en следует  k ek (k ; n).
Очевидным является утверждение, что линейной комбинации век-
торов x1 и x2 соответствует линейная комбинация с теми же коэф-
фициентами матриц-столбцов из координат этих векторов, так как
n
X n
X n
X
x1 + x2 = 1k ek + 2k ek = ( 1k + 2k )ek :
k=1 k=1 k=1

Определение 4. Если в L существует n линейно-независимых векто-


ров, а любая система из n ( +1)
-го вектора линейно-зависимая, то на-
туральное число n называется размерностью пространства ( L dim =
n). Само пространство L называется конечномерным и обозначается
символом Ln . Если же в L можно указать систему из произвольно-
го конечного числа линейно-независимых векторов, то говорят, что
пространство L бесконечномерно.
Понятия базиса пространства и размерности пространства тесно
связаны между собой.
Теорема 7. В пространстве Ln любая совокупность из n линейно-
независимых векторов есть базис пространства.
Доказательство. Пусть fa1 ; : : : ; an g – некоторая линейно-неза-
висимая система векторов в пространстве Ln . Согласно определению
размерности пространства система векторов fx; a1 ; : : : ; an g при лю-
бом векторе x есть линейно-зависимая система и, следовательно, вы-
полнено условие
+
x 1 a1 : : : n an+ + =0(15.5)
Число необходимо отлично от нуля, так как при =0
в силу линей-
ной независимости векторов a1 ; : : : ; an последовало бы 1 ,. . . , n =0 =
0, что привело бы к противоречию о линейной зависимости векторов
fx; a1 ; : : : ; an g. Поэтому из (15.5) для любого вектора x следует
n  
X k
x= ak :
k=1

Это означает, что система линейно-независимых векторов fa1 ; : : : ; an g
есть базис пространства Ln .

111
Теорема 8. Если в пространтве L существует базис из n век-
торов, то dim =
L n.
Доказательство. Пусть fe1 ; : : : ; en g – базис в L. Рассмотрим про-
извольную
Pn ( + 1)
систему из n -го вектора fx1 ; : : : ; xn ; xn+1 g, где xi =
k=1 i ek (i
k = 1 +1
; n ). Построим матрицу из n ( + 1) столбцов-
координат векторов xi
2 3
11 : : : n1 n1 +1
6 12 : : : n2 n2 +1 7
6 7
6 . .. .. .. 7
4 .. . . . 5
n 1 : : : nn nn+1
Ранг этой матрицы r  n, так как число строк матрицы равно n.
Поскольку столбцов n +1 , то в силу теоремы о базисном миноре по
крайней мере один из столбцов является линейной комбинацией ба-
зисных (следовательно, и остальных) столбцов рассматриваемой мат-
рицы. Это означает, что по крайней мере один из векторов есть линей-
ная комбинация других. На основании теоремы 5, доказанной выше,
система из векторов fx1 ; : : : ; xn ; xn+1 g линейно-зависима. В силу про-
извольности рассматриваемой системы векторов теорема доказана.
Пример 1. Задано множество положительных вещественных чи-
сел, которые будем называть векторами. Под "суммой" двух векто-
ров понимаем обычное произведение чисел ab. Под "произведением"
вектора a на число  2 R понимаем возведение в степень  числа
a. Будет ли данное множество с введенными операциями линейным
пространством?
( )
Решение. Проверяем аксиомы группы A . Поскольку ab = ba,
( ) = ( ) ( ) ( )
ab c a bc , то A1 и A2 выполнены. В качестве "нуль-вектора"
1 1=
нужно взять , так как a  a. В качестве противоположного вектора
1
необходимо взять a , так как a  a1 =1 ( )
. После этого аксиомы A3 и
A4 также будут выполнены. Перейдем к группе B . Так как a1
( ) ( ) =
a, a  a , a+ a  a , ab =a b , то все аксиомы группы
( ) = = ( )  

( )
B выполнены. Искомое множество с введенными операциями есть
линейное пространство. За базис в введенном линейном пространстве
может быть взято любое фиксированное число p 6 =1, так как любое
положительное число может быть представлено в виде: a = p , где
 ln
= a
ln p . Пространство является одномерным (теорема 8).
ПримерP2. Множество решений однородной системы линейных
n
уравнений k=1 ik  k =0 =1 (i ; m) с введенными в лекции 1 опе-
рациями сложения столбцов и умножения на число есть линейное
пространство размерности n r, где r – ранг матрицы системы урав-
нений.

112
В самом деле, на основании того, что линейная комбинация реше-
ний есть снова решение системы уравнений, все восемь аксиом для
матриц-столбцов, являющихся решениями однородной системы, вы-
полнены. В силу теоремы, что общее решение (любой вектор множе-
ства решений) есть линейная комбинация нормальной фундаменталь-
ной системы решений, которые являются линейно-независимыми, за-
ключаем: пространство решений однородной системы есть ли-
нейное (n r)- мерное пространство.

113
Л е к ц и я 16
Подпространства и линейные оболочки. Теорема о
Пополнении базиса. Пересечение и сумма
подпространств. Пространство решений
однородной системы уравнений как
подпространство пространства матриц-столбцов
Определение 1. Множество векторов U  L, для которых при лю-
+
бых ; 2 K выполнено x y 2 U , называется подпространством
линейного пространства L. Само пространство L и множество, состоя-
щее только из нуль-вектора, являются тривиальными подпростран-
ствами пространства L.
Примером нетривиального подпространства является множество
всех векторов, коллинеарных данному вектору ~e в трехмерном ев-
клидовом пространстве, так как ~x = =
~e; y~ ~e и, следовательно,
+ =
~x ~y ~e ~e + =( + )
  ~e – снова коллинеарный вектор
при любых ; 2 R. Вектор ~e в данном примере играет роль базиса
в рассматриваемом подпространстве, размерность которого, согласно
теореме 8 из предыдущей лекции, равна единице.
Другим примером подпространства L является линейная оболоч-
ка, натянутая на систему векторов.
Определение 2. Линейной оболочкой, натянутой на систему векто-
ров a1 : : : ; as (s – любое фиксированное натуральное число), назы-
вается множество векторов вида l = + +
1 a1 2 a2 : : : s as , где+
1 ; : : : ; s – числовые параметры, пробегающие независимо друг от
друга все числовое поле K.
Ps Ps
Пусть l1 = =
k=1 k ak ; l2 k ak – произвольные
k=1 P Ps векто-
Ps оболочки. Видим, что l1
ры + =
l2 s
+
k=1 k ak k=1 k ak=
( + )
k=1 k k k – снова вектор линейной оболочки при любых
и из K . Таким образом, каждая линейная оболочка есть, линей-
ное подпространство. Обратно, если U – линейное подпространство
размерности m < n и h1 ; : : : ; hm – базис в подпространстве U , то лю-
бой вектор x 2 U представим в виде x =  1 h1 : : :  m hm . Таким
+ +
образом, каждое подпространство есть линейная оболочка, на-
тянутая на систему своих базисных векторов.
В определении линейной оболочки векторы a1 ; : : : ; as не обяза-
тельно линейно-независимы (s может быть и больше n – размерно-
сти пространства L). Поэтому необходимо решить вопрос о базисе и
размерности линейной оболочки. С этой целью из системы a1 ; : : : ; as
выделим максимальное число линейно-независимых векторов и обо-
значим их e1 ; : : : ; er . За e1 ; : : : ; er можно взять r базисных столбцов

114
матрицы, которую можно построить из матриц-столбцов координат
векторов a1 ; : : : ; as . Векторы e1 ; : : : ; er и являются базисными векто-
рами оболочки, так как любой вектор оболочки есть линейная ком-
бинация векторов a1 ; : : : ; as , которые, в свою очередь, линейным об-
разом выражаются через линейно-независимые векторы e1 ; : : : ; er .
Итак, размерность линейной оболочки равна максимальному
числу линейно-независимых векторов, содержащихся среди век-
торов a1 ; : : : ; as (равна рангу матрицы из s координатных столбцов
векторов a1 ; : : : ; as ).
Пусть задано подпространство U и базис на нем ff1 ; : : : ; fm g.
Теорема 1 (О пополнении базиса подпространства до базиса всего
пространства). Векторы базиса подпространства всегда можно
пополнить в Ln векторами e1 ; e2 ; : : : ; en m так , что система
ff1 ; : : : ; fm ; e1 ; : : : ; en m g образует базис пространства Ln .
Действительно, в Ln существуют векторы, которые не являют-
ся линейной комбинацией векторов ff1 ; :::; fm g, так как в противном
=
случае ff1 ; : : : ; fm g образовали бы базис Ln и тогда m n. Обозна-
чим через e1 любой вектор, не принадлежащий U . Ясно, что система
векторов ff1 ; : : : ; fm ; e1 gесть линейно-независимая система векторов,
потому что, составив линейную комбинацию их с произвольными ко-
+ +
эффициентами и приравняв ее нулю: 1 f1 : : : m fm 1 e1 + =0 ,
получим, что 1=0 , иначе вектор e1 можно было бы выразить как
линейную комбинацию векторов ff1 ; :::; fm g. Но если 1 =0 , то и
все i = 0( = 1 )
i ; m в силу линейной независимости векторов бази-
са подпространства. Итак ff1 ; : : : ; fm ; ei g – линейно-независимая си-
стема векторов. Если любой вектор x 2 Ln есть линейная комбина-
ция данных векторов, то они составляют базис Ln , и, следовательно,
= +1
n m . Наше построение на этом будет закончено.
Если же m +1 < n, то, рассуждая подобным же образом, найдем
вектор e2 такой, что ff1 ; : : : ; fm ; e1 ; e2 g будет линейно-независимой си-
стемой векторов. При m +2 < n продолжаем наш процесс. Через n (
)
m шагов мы получим систему векторов ff1 ; : : : ; fm ; e1 ; e2 ; : : : ; en m g,
составляющую базис Ln .
Практически пополнение осуществляется следующим образом.
Матрицу, состоящую из m координатных столбцов векторов f1 ; : : : ; fm ,
расширяем новыми столбцами так, чтобы ее ранг каждый раз увели-
чивался на единицу.
Определение 3. Совокупность векторов, принадлежащих одновре-
менно подпространствам U1 и U2 называется пересечением подпро-
странств и обозначается символом U1 \ U2 .
Покажем, что U1 \ U2 – линейное подпространство. Действитель-
( + )
но, если x; y 2 U1 \ U2 , то x y 2 U1 (поскольку x; y 2 U1 ) и

115
( x + y) 2 U2 (поскольку x; y 2 U2 ). Следовательно, ( x + y) 2
U1 \ U2при любых ; 2 K . Отметим, что пересечение – линейное
подпространство подпространства U1 и подпространства U2 .

Определение 4. Совокупность векторов вида x x1 x2 , где x1 про- = +


бегает все множество векторов подпространства U1 ; x2 – все множе-
ство векторов подпространства U1 , называется суммой подпространств
+
и обозначается символом U1 U2 . Если при этом пересечение подпро-
странств U1 \ U2 состоит только из нуль-вектора, то сумма называется
прямой и обозначается символом U1  U2 .

+
Покажем, что U1 U2 – линейное подпространство (может быть
совпадающее со всем пространством Ln ). В самом деле, пусть x =
+ = +
x1 x2 ; y y1 y2 – векторы из суммы подпространств. Но если
( + ( + )
x1 ; y1 2 U1 , то x1 y1 2 U1 , и если x2 ; y2 2 U2 , то x2 y2 2 U2 . В
+ = ( + )+ ( + ) = (
таком случае x y x1 x2 y1 y2 x1 y1 x2 y2 + )+( + )
принадлежит сумме подпространств при любых ; 2 K .

Теорема 2. Размерности подпространств, пересечения и сум-


мы связаны соотношением

dim(U1 + U2) = dim U1 + dim U2 dim(U1 \ U2): (16.1)

Доказательство. Пусть dim U1 = m1 ; dim U2 = m2 ; dim(U1\ U2 ) =


m3 . Пусть fh1 ; :::; hm3 g – базис пересечения U1 \ U2 . Поскольку пересе-
чение является подпространством подпространства U1 , то по теореме
о пополнении базиса, базис пересечения можно дополнить до базиса
U1 и векторы ff1 ; : : : ; fm1 m3 ; h1 ; : : : ; hm3 g составят базис U1 . Анало-
гично найдутся векторы g1 ; : : : ; gm2 m3 , что ff1 ; : : : ; fm3 ; g1 ; : : : ; gm2 m3 g
составят базис U2 .
Если мы сейчас покажем, что система векторов

ff1 ; : : : ; fm1 m3 ; h1 ; : : : ; hm3 g1 ; : : : ; gm1 m3 g (16.2)

+
образует базис суммы U1 U2 , то теорема будет доказана, так как
число векторов в системе (16.2) равно m3 m1 m3 m2 m3 +( )+( )=
+
m1 m2 m3 . Для того, чтобы выяснить, является ли система векто-
ров (16.2) базисом суммы, надо прежде всего показать, что любой
вектор суммы есть линейная комбинация векторов (16.2), и затем
установить линейную независимость векторов (16.2).
= +
Пусть z x1 x2 - произвольный вектор суммы U1 U2 . Заметив, +
= + + + + +
что x1 1 f1 : : : m1 m3 fm1 m3 1 h1 : : : m3 hm3 (поскольку
x1 вектор из U1 ) и
x2 = 1 h1 + : : : + m2 hm3 + 1 g1 + : : : + m2 m3 gm2 m3

116
(поскольку x2 2 U2 ), получим
z = 1 f1 + : : : + m1 m3 fm1 m3 + ( 1 + 1 )h1 + : : : +
+( m3 + m3 )hm3 + m2 m3 gm2 m3
+
Итак любой вектор из суммы U1 U2 представлен линейной комбина-
цией векторов (16.2). Осталось доказать, что (16.2) линейно-незави-
симая система векторов. Допустим противное, что существует линей-
ная комбинация

1 f1 + : : : + m1 m3 fm1 m3 + 1 h1 + : : : + m3 hm3 +


+1 g1 + : : : + m2 m3 gm2 m3 = 0 (16.3)

где по крайней мере один из коэффициентов отличен от нуля. Вектор


= + +
t 1 g1 : : : m1 m3 gm1 m3 принадлежит U2 . Но из (16.3) вытекает,
что t = 1 f1 : : : m1 m3 fm1 m3 1 h1 : : : m3 hm3 и следова-
тельно t 2 U1 . Это означает, что t 2 U1 \ U2 и может быть представлен
в виде линейной комбинации лишь векторов h1 ; : : : ; hm3

t = 1 h1 + : : : + m3 hm3 :
Поэтому имеем

1 g1 + : : : + m2 m3 gm2 m3 = 1h1 + : : : + m3 hm3


или

1 g1 + : : : + m2 m3 gm2 m3 1 h1 : : : m3 hm3 = 0 (16.4)

В силу линейной независимости векторов базиса U2 из (16.4) сле-


дует, что 1 =0
; : : : ; m2 m3 ; =0 =0
; : : : ; m3 =0
. Условия (16.3)
принимают вид

1 f1 + : : : + m1 m3 fm1 m3 + 1h1 + : : : + m3 hm3 = 0 (16.5)

В силу линейной независимости векторов базиса U1 получим, что


наряду с коэффициентами s все коэффициенты p p ( =1
; m1 m3 ; )
( =1
q q )
; m3 также нулевые. Пришли к противоречию. Таким об-
разом, система векторов (16.2) линейно-независима и образует базис
подпространств. Теорема доказана.
Обратимся кP пространству решений однородной системы линей-
n
ных уравнений k=1 ik  k i = 0( = 1 )
; m и выясним геометрический
смысл этого пространства. С этой целью рассмотрим множество мат-
риц-столбцов, составленных из n чисел. Если ввести операции сложе-
ния матриц-столбцов, нуль-столбец и противороложный столбец, как

117
это сделано сделано в лекции 15, то мы получим выполнение всех ак-
( )( )
сиом A ; B . Тем самым мы устанавливаем, что множество матриц-
столбцов с введенными операциями образует линейное пространство.
Базисом его будет совокупность линейно-независимых матриц-столб-
цов вида 2 3 2 3 2 3
1 0 0
6 7 0 1
6 7 0
6 7
e1 = 6 7
6 . 7 ; e2 = 6 7
6 . 7 ; : : : ; en = 6 7
6.7 ;
4 .. 5 4 .. 5 4 .. 5
0 0 1
так как любая матрица-столбец есть их линейная комбинация
2 3 2 3 2 3 2 3
1 1 0 0
6 2 7
1 607 2 617
6 7 6 7 607
a=6 6 7
. 7 = 6.7 + 6.7 + ::: + n6 7
6.7
4 .. 5 4 .. 5 4 .. 5 4 .. 5
n 0 0 1
Полученное n-мерное линейное пространство обозначают обычно
символом Tn , а линейное пространство матриц-строк – символом Tn .
В предыдущей лекции (пример 2) нами показано, что пространство
решений однородной системы уравнений образует n r -мерное ли- ( )
нейное пространство, векторами которого являются матрицы-столбцы,
а базисом служит нормальная фундаментальная (либо просто фунда-
ментальная) система решений. Таким образом, можно заключить, что
пространство решений однородной системы линейных уравне-
ний есть подпространство пространства Tn . Его размерность
равна n r, где r – ранг матрицы системы уравнений. Вспоми-
ная определение линейной оболочки, мы можем также сказать, что
пространство решений однородной системы линейных уравне-
ний есть линейная оболочка в пространстве Tn , натянутая на
векторы фундаментальной системы решений.
Если решения системы уравнений записывать в виде матриц-строк,
то в предыдущем абзаце необходимо символ Tn заменить на символ
Tn .
Обратимся к иллюстрирующим материал лекции примерам.
Пример 1. Найти размерность и указать базис линейной оболоч-
ки, натянутой на векторы
a1 = [1; 0; 1; 2]; a2 = [2; 1; 1; 1]; a3 = [4; 1; 1; 5]:
Составляем матрицу из матриц-строк, находим ее ранг
2
1 0 1 23 21 0 1 2 3 21 0 1 2 3
A = 42 1 1 15  40 1 3 35  40 1 3 35
4 1 1 5 0 1 3 3 0 0 0 0
118
Ранг A =2 . Первая и вторая строка являются базисными. Следова-
тельно, размерность оболочки равна двум, базис составляют векторы
a1 ; a2 .
Пример 2. Найти размерность и указать базис пересечения под-
пространств U1 ; U2 , являющихся линейными оболочками, натянуты-
ми на следующие системы векторов:

(1) a1 = [1; 0; 1; 2]; a2 = [2; 1; 1; 1]; a3 = [4; 1; 1; 5];


(2) b1 = [ 2; 0; 2; 4]; b2 = [0; 0; 1; 1]; b3 = [ 2; 0; 3; 3];
b4 = [ 4; 0; 5; 7]:
Решение. Согласно примеру 1 dim U1 = 2 и базис a1 ; a2 . Посту-
паем так же, как и в примере 1, с системой векторов b1 ; : : : ; b 4 .
2 3 2 3 2 3
2 2 40 2 0 2 4 2 0 2 4
6 0 0
1 1 77  66 0 0 1 1 77  66 0 0 1 1 77
B=6
4 2 0
3 35 4 0 0 1 1 5 4 0 0 0 05
4 5 70 0 0 1 1 0 0 0 0
Заключаем, что dim U2 = 2. Его базис – fb1 ; b2 g.
Ищем векторы, принадлежащие одновременно как U1 , так и U2
1 [1; 0; 1; 2] + 2[2; 1; 1; 1] = 3[ 2; 0; 2; 4] + 4[0; 0; 1; 1]:
Получим систему линейных уравнений с неизвестными 1 ; 2 ; 3 ; 4
9 8
1 + 2 2 + 2 3 = 0 >
> >
> 1 = 2c
2 = 0 = <
=) > 2 = 0
1 + 2 2 3 4 = 0 >
> > 3 = c
2 1 + 2 + 4 3 4 = 0 ; :
4 = 0
(c – произвольная постоянная)
Векторы пересечения x имеют вид: x = 2c[1 0 1 2]. Пересечение
одномерно, его базис e = [1 0 1 2]
.

119
Л е к ц и я 17
Линейные отображения и их матричное
представление. Действия над операторами и
матрицами
Пусть заданы линейные пространства Ln и Mm . Пусть A – отобра-
жение пространства Ln в пространство Mm . Образ вектора x 2 Ln
будем обозначать символом Ax Ax 2 Mm . ( )
:
Определение 1. Отображение A Ln ! Mm называется линейным
отображением (иначе морфизмом), если выполнено A x1 x2 ( + )=
+
Ax1 Ax2 и A x ( )=
Ax для любых векторов x1 ; x2 ; x из Ln и
любого  2 K.
В дальнейшем все линейные отображения обозначаем большими
прописными латинскими буквами.
Если A отображает векторы Ln на все множество векторов
Mm , то отображение называется эпиморфизмом. Если же A задает
отображение на часть множества векторов Mm , но отображение
( )
взаимно-однозначное x $ Ax , то A называется мономорфизмом.
Отображение A, являющееся одновременно эпоморфизмом и моно-
морфизмом, называется изоморфизмом.
В случае, когда пространство Mm является n-мерным, как и Ln
( = ) :
m n , линейное отображение A Ln ! Mn называется эндомор-
физмом или линейным оператором.
Сейчас мы докажем теорему, на основании которой Mn можно
отождествить с Ln и считать, что эндоморфизм (линейный оператор)
задает отображение Ln в самого себя. Поэтому для эндоморфизма A
часто употребляют символ A Ln . = End
Теорема 1. Любые два n-мерных пространства Ln и Mn (над
полем K) изоморфны между собой.
Действительно, пусть в Ln выбран базис fe1 ; :::; en g, а в Mn - ба-
зис fg1 ; :::; gn g. Построим
Pnотображение A Ln ! MP :
n по следующему
правилу. Каждому x = k=1  ek сопоставим y
k n
=
k=1  gk , т.е. ко-
k
ординаты образа Ax = y в базисе fg1 ; :::; gn g те же самые, что и у
вектора x в базисе fe1 ; :::; en g. Это отображение линейное, так как
вектору
n
X n
X n
X
x1 + x2 = 1k ek + 2k ek = ( 1k + 2k )ek
k=1 k=1 k=1
соответствует, согласно правилу, вектор
n
X n
X n
X
( 1 + 2 )gk =
 k  k 1k gk + 2k gk = Ax1 + Ax2 :
k=1 k=1 k=1

120
Построенное отображение – мономорфизм, потому что при x1 6 x2 =
имеем различные координатные матрицы-столбцы, построенные из 1k
и 2k , а, следовательно, векторы Ax1 и Ax2 также различны между
собой.
Построенное отображение
Pn в то же время и эпиморфизм, Pn так как
для любого y = k=1  gk существует прообраз x
k
k=1  ek для
k =
=
которого Ax y . Теорема доказана.
Тем самым все n-мерные линейные пространства (если учитывать
только линейную структуру) не различимы между собой. Поэтому
символ M для другого линейного пространства можно не употреб-
лять и писать Ln , Lm , Lp и т.д.
Пусть A – линейное отображение из Ln в Lm . Из P линейности A
следует
Ps ( +
A x1 x2 )= +
Ax1 Ax2 и вообще A sk=1 k xk ( )=
k=1 k Axk . Пусть fe1 ; :::; en g – базис Ln , fg1 : : : ; gm g – базис Lm .
Векторам базиса ek k =1
; n соответствуют образы Aek 2 Lm , которые
мы можем разложить по векторам базиса fg1 ; : : : ; gm g
9
Ae1 = 111g1 + 221g2 + ::: + mm1 gm >>
Ae2 = 2g1 + 2g2 + ::: + 2 gm = (Aek = Xm
i g ):
::::::::::::::::::::::::::::::::: > k i (17.1)
> i=1
Aen = 1n g1 + 2n g2 + ::: + m n gm
;

Записывая координаты векторов Ae1 ; : : : ; Aen в виде столбцов, полу-


чим матрицу 2 3
11 12 : : : 1n
6 21 22 : : : 2n 7
A=6 6
. ..
7
.. .. 7 ; (17.2)
4 .. . . . 5
m m
2 : : : m
1n
которую кратко будем записывать в виде A = [ ik ] (верхний индекс –
номер строки, нижний индекс – номер столбца) и называть мат-
рицей линейного отображения A Ln ! Lm в данных базисах :
fe1 ; : : : ; en g, fg1 ; : : : ; gm g.
Если A - эндоморфизм (линейный оператор), то его матрица необ-
ходимо квадратная. Pn
Если координаты вектора x заданы: x k=1  ek , то как най-
k =
ти координаты образа Ax? Используя линейность отображения A,
получим
!
n
X n
X
y = Ax = A  k ek =  k Aek =
k=1 k=1
! !
n
X m
X m
X Xn
= k ik gi = ik  k gi :
k=1 i=1 i=1 k=1

121
Если обозначить координаты вектора y через i , то имеем
n
X
i = ik  k : (17.3)
k=1

Формула (17.3) служит для нахождения координат образа Ax, если


известны матрица отображения и координаты вектора x.
Итак, каждому линейному отображению A соответствует
(в фиксированных базисах) прямоугольная матрица A ik (i =[ ] =
1 =1
; m; k ; n).
Обратно, пусть задана некоторая матрица A ik (i =[ ]
; m; =1
k =1 ; n) и заданы базис fe1 ; : : : ; en g в Ln и fg1 ; : : : ; gm g в Lm . За-
дадим отображение PnA L :
n ! Lm по следующему закону. Pm Каждо-
му вектору x =
k=1  ek сопоставим вектор y
k =
i=1  gi , где
i
числа  i определяются с помощью матрицы A ik по формуле =[ ]
(17.3).
Pn Заданное отображение линейное, так как вектору x1 x2 + =
( + )
k=1 1 2 ek по (17.3) соответствует вектор с координатами
k k

n
X n
X n
X
ik ( 1 + 2) =
 k  k ik 1k + ik 2k = 1i + 2i
k=1 k=1 k=1

откуда следует, что A x1 x2 ( + )= +


Ax1 Ax2 . Воспользовавшись
формулой (17.3), подсчитаем координаты векторов Ae1 ; : : : ; Aen .
У вектора e1 первая координата равна , остальные равны ну- 1
лю. Поэтому из (17.3) следует, что вектор Ae1 имеет координаты
11 ; 21 ; : : : ; m
1 – первый столбец матрицы A. У вектора e2 вторая ко-
1
ордината равна , а остальные нулю. Поэтому из (17.3) следует, что
вектор Ae2 имеет координаты 12 ; 22 ; : : : ; m
2 – второй столбец мат-
рицы A. Аналогично получим, что остальные столбцы матрицы A
есть координаты векторов Ae3 ; : : : ; Aen . Таким образом, матрица по-
строенного отображения A совпадает с заданной матрицей A. Тем
самым, каждой матрице (при фиксированных базисах fe1 ; : : : ; en g,
fg1 ; : : : ; gm g) однозначно сопоставляется линейное отображение
A. Можно заключить, что между множеством всех линейных
отображений (операторов) и множеством всех прямоугольных
(квадратных) матриц существует взаимно-однозначное соот-
ветствие.
Пример. Найти матрицу оператора, переводящего векторы x1 =
[1 0 1] = [0 1 2]
; ; , x2 ; ; , x3 = [1 1 1]
; ; в векторы y1 ; ; , y2 = [0 1 1] =
[1 0 2] = [0 0 1]
; ; , y3 ; ; .
Решение. Используем (17.3) для определения неизвестных ik 9
122
(i; k = 1; 2; 3)
8 8 8
< 0 = 11 13 < 0 = 112 + 122 + 132
1 = 212 2 213 <
1 = 213 23 0 = 13 + 23 + 33
0 = 23 2 33
:
1 = 1 :
33 :
1 = 1 + 2 + 3
2 = 2 2 3
Данная система уравнений распадается на 3 подсистемы каждая с
тремя неизвестными
8 8 8
< 11 + 12 + 13 = 0 < 21 + 22 + 23 = 0 < 31 + 32 + 33 = 1
12 2 13 = 1 22 2 23 = 0 32 2 33 = 2
:
11 13 = 0 :
21 23 = 1 :
31 33 = 1
Решая их, находим вид матрицы оператора
2 1 1 13
4 2 4
A=6 3 1 17
4 4 2 45 :
3 1 1
2 2
Среди множества отображений выделим отображения, играющие 3
важную роль в теории линейных операторов.
Определение 2. Нулевым морфизмом называется отображение O :
Ln ! Lm , которое любой вектор переводит в нуль-вектор простран-
ства Lm , т.е. Ox =0
для любого x 2 Ln .
Легко найти вид матрицы нулевого морфизма. Поскольку Oek =
0, то все ik =0 =1
(i =1
; m; k ; n) и матрица имеет вид
2
0 0 ::: 03
60 0 ::: 077
0 = 64 .. ..
6
.. 7 : (17.4)
. . .5
0 0 ::: 0
Определение 3. Отображение A0 называется противоположным
по отношению к отображению A, если для любого x 2 Ln выполнено
A0 x =
Ax .
Пусть матрица отображенияP A есть A P ik (i =[ ] =1
; m; k ; n). =1
0
Поскольку A ek =Aek
m
=
i=1 k gi
i m
= ( )
i=1 k gi , то матрица
i
противоположного оператора составлена из чисел ik , умноженных на
1
, т.е. A0 =[ ]
ik .
Определение 4. Эндоморфизм (оператор) E называется тожде-
ственным, если он оставляет на месте все векторы пространства,
=
т.е. "x x для любого x 2 Ln .

123

E ek = ek , то ik = ki = 1; i = k
Поскольку
0; i 6= k – символ Кроне-
кера (i; k = 1; n). Матрица тождественного оператора имеет вид
2
1 0 : : : 03
60 1 : : : 07
E=6 6. .
7
.. 7
. : (17.5)
4 .. .. 5
0 0 ::: 1
и носит название единичной матрицы.
Перейдем к рассмотрению действий над отображениями и постро-
им соответствующие действия для матриц.
Определение 5. Если для любого x 2 Ln Ax = Bx, то отображения
считаются одинаковыми (равными).
Поскольку Aek =
Bek , то ik ki (i =
; m; k =1
; n). Поэтому =1
две матрицы A и B считаются совпадающими (пишем A B ), если =
их элементы на соответствующих местах равны друг другу.
Определение 6. Суммой линейных отображений A и B называется
= +
такое отображение C A B, что для любого x 2 Ln Cx Ax Bx. + =
Покажем, что C – линейное отображение. Действительно, C( x1 +
x2 ) = A( x1 + x2 )+ B( x1 + x2 ) = Ax1 + Ax2 + Bx1 + Bx2 =
(Ax1 + Bx1 )+ (Ax2 + Bx2 ) = Cx1 + Cx2 , т.е. при любых x1 ; x2 2
Ln , и любых ; 2 K C( x1 + x2 ) = Cx1 + Cx2 . Отображение C
– линейное отображение.
Поскольку
m
X m
X m
X
Cek = Aek + Bek = ik gi + ki gi = ( ik + ki )gi ;
i=1 i=1 i=1

то, обозначая элементы матрицы отображения C через ki , мы полу-


чим
= +( =1 ; =1 )
ki ik ki i ; m k ; n (17.6)
Поэтому под суммой матриц A = [ ik ] и B = [ ki ] понимаем мат-
рицу C = [ ki ], элементы которой связаны соотношением (17.6).
Легко проверить, что как для отображений, так и для матриц вы-
полняются следующие четыре условия (записываем только для мат-
риц):

(1) A+B =B+A (2) (A + B0 ) + C = A + (B + C )


(3) A+0=A (4) A + A = 0 (17.7)

124
Определение 7. Если для любого x 2 Ln выполнено A x  Ax , ( ) = ( )
то отображение A называется произведением числа  на отобра-
жение A (введена операция умножения на число отображения
A).
Pm
( ) =
Поскольку A ek =
Aek  i=1 ik gi = Pm (
i=1  k gi , то эле-
i )
менты матрицы оператора A получаются путем умножения на 
всех элементов матрицы A =[ ]
ik . Поэтому под произведением числа
 и матрицы A понимается матрица с элементами  ik i ; m k [ ]( =1 ; =
1; n).
Легко убедиться, что выполнены условия

(1) 1  A = A (2) ()A = (A)


(3) ( + )A = A + A (4) (A + B ) = A + B (17.8)

Введенные операции и выполнение свойств (17.7) для суммы матриц


и свойств (17.8) для операции умножения матрицы на число приводит
( )
нас к выводу (см. аксиомы группы A и группы B для линейных ( )
пространств): совокупность всех матриц вида m  n представля-
ет собой линейное векторное пространство, где роль векторов
играют прямоугольные матрицы, имеющие m строк и n столб-
цов.
Какова размерность введенного линейного пространства? Чтобы
ответить на этот вопрос, рассмотрим mn матриц вида
2
0 ::: 0 ::: 0 3
6: : : ::: ::: : : : : : :7
60
eik = 6 ::: 1 ::: 0 7 7: (17.9)
4
::: ::: ::: : : : : : :5
0 ::: 0 ::: 0
1
где на пересечении i-й строки и k-го столбца стоит , а остальные эле-
менты матрицы – нули. Эти матрицы Pm линейно-независимы,
Pn так как,
составив линейную комбинацию i=1 k=1 ik eik с произвольными
коэффициентами ik и приравняв ее нулевой матрице (нуль-вектору),
из равенства матриц получим, что ik =0 =1
(i ; m; k ; n). =1
Кроме того, любая матрица A =[ ]
k может
i
Pm P быть представлена
как линейная комбинация матриц eik : A = n
i=1 k=1 k eik . Поэто-
i
му матрицы (17.9) играют роль базисных векторов в линейном про-
странстве матриц m  n. Таких матриц mn. Поэтому размерность
рассматриваемого линейного пространства равна mn.
Ясно, что все изложенные выше для отображений A Ln ! Lm :
и прямоугольных матриц имеет место для операторов (эндоморфиз-
мов) и квадратных матриц n  n. Размерность линейного про-
странства операторов равна n2 .

125
Л е к ц и я 18
Композиция отображений и умножение матриц.
Обратный оператор и обратная матрица. Образ и
ядро линейного отображения
Пусть A – линейное отображение из Ln в Lm , B – линейное отображе-
ние из Lm в Lp , т.е. Ln ! Lm ! Lp . Тогда возникает отображение
A B

:
C Ln ! Lp , которое называется композицией отображений A и
B и обозначается символом C =
B  A (при композиции последова-
тельность действий пишется справа налево). Другими словами, для
= ( )
любого x 2 Ln имеем Cx B Ax .
Покажем, что C – линейный оператор. Этот факт легко проверя-
( + )= ( (
ется, так как C x1 x2 B A x1 x2 + )) = (
B Ax1 Ax2 + )=
( )+ ( )= +
B Ax1 B Ax2 Cx1 Cx2 .
Как записать композицию отображений в матричном представле-
нии?
Пусть fe1 ; :::; en g, fg1 ; :::; gm g, fh1 ; :::; hp g – базисы в пространствах
Ln ; Lm ; Lp , а соответствующие матрицы отображений A ik i =[ ]( =
1 ; =1 ) =[ ]( =1 )
; m k ; n , B is s ; p , C ks s ; p k ; n . Можно =[ ]( =1 ; =1 )
написать следующую цепочку преобразований:
p ! p !
m
X m
X X X m
X
ek A! ik gi B! ik is hs = is ik hs (18.1)
i=1 i=1 s=1 s=1 i=1
С другой стороны имеем
p
X
Cek = ks hs (18.2)
s=1

Сравнивая (18.1), (18.2) и учитывая линейную независимость векто-


ров h1 ; : : : ; hp получим
m
X
ks = is ik (18.3)
i=1
т.е. элемент матрицы C , стоящий на пересечении s-й строки и k-
го столбца представляет собой сумму произведений элементов s-
й строки матрицы B с соответствующими элементами (т.е.
стоящими под теми же номерами, что и элементы s-й строки) k-го
столбца матрицы A.
Построенную таким способом матрицу C называют произведени-
ем матриц B; A (пишут C =
BA), а правило умножения матриц
(18.3) называют правилом "строка на столбец". Из этого правила вы-
текает, что не любые матрицы B и A могут быть перемножены, а

126
только такие, когда число столбцов матрицы B совпадает с числом
строк матрицы A. В результате получится матрица, имеющая число
строк, равное числу строк матрицы B , а число ее столбцов совпадает
с числом столбцов матрицы A.
Пример. Найти произведение AB , если
2
1 1 03 2
1 2 3 13
A = 4 0 2 3 5 ; B = 40 1 1 1 5 :
1 0 1 1 1 0 0
Пользуясь правилом "строка на столбец", имеем
2
1  1 + ( 1)  0 + 0  1 2 + 1 + 0 3 + 1 + 0 1 1 + 03
AB = 4 0  1 + 2  0 + 3  1 0 2 3 0 2+0 0+2+0 5=
11+00 11 2+0+1 3+0+0 1+0+0
2
1 3 4 23
=4 3 5 2 2 5
2 1 3 1
На этом примере видно, что произведение AB существует, а произве-
дение BA не существует.
Нетрудно видеть, что если произведение нескольких матриц имеет
смысл, то оно ассоциативно
(AB )C = A(BC ):
Если речь идет об операторах A; B, то соответствующие матрицы
=
квадратные и, следовательно, C BA – снова квадратная матрица.
=
В общем случае для квадратных матриц AB 6 BA, в чем легко
убедиться на следующем примере:
       
1 2 1 0 1 2 1
A = 1 3 ; B = 1 1 ; AB = 4 3 ; BA = 0 5 ; AB 6= BA: 2
Когда AB 6= BA, то этот факт отмечают словами: матрицы A и B не
коммутируют между собой. Если же матрицы A и B таковы, что
AB = BA, то они называются коммутирующими.
Для всякой квадратной матрицы A вводится понятие не отрица-
тельной степени матрицы, если по определению считать, что
A0 = E; A1 = A; A2 = A  A; : : : ; An+1 = A  An ; : : : ; (18.4)
где E – единичная матрица (17.5). Используя (18.4), тотчас получим,
что Ap Aq ap+q Aq Ap , так как EA A AE для любой матрицы
= = = =
A.
В дальнейшем нам понадобится факт из теории матриц, который
мы приведем без доказательства.

127
Теорема 1. Детерминант произведения квадратных матриц ра-
вен произведению детерминантов сомножителей, т.е.

det(AB ) = det A  det B (18.5)

Доказательство приведено, например, в книге Г.Е. Шилова (см.


литературу в конце лекций).
Перейдем к более подробному рассмотрению эндоморфизмов про-
странства Ln , называемых далее операторами.

Определение 1. Оператор B называется обратным по отношению


к оператору A, если выполнено B  A =
E , где E – тождественный
оператор.

В матричном представлении данное условие имеет вид BA E, =


где E – единичная матрица (17.5).
Поэтому можно дать аналогичное определение обратной матрицы
по отношению к матрице A.

Определение 2. Матрица A 1 называется обратной к матрице A,


если выполнено условие
A 1 A = E: (18.6)

Какие из матриц A имеют обратные? Чтобы ответить на этот во-


прос, воспользуемся соотношением (18.5). Из (18.6), учитывая, что
det = 1
E , следует A 1 
(det ) (det ) = 1
A . Следовательно, детерми-
нант матрицы A непременно должен быть отличен от нуля.
Если матрица A вырожденная ( A det = 0)
, то понятие об обратной
матрице для нее отсутствует. Этот факт выражают словами, что вся-
кая вырожденная матрица A обратной матрицы не имеет.
Пусть матрица A =[ ]
ik – невырожденная ( A 6
1
det = 0)
. Как най-
ти элементы матрицы A , зная элементы матрицы A? Обозначим
элементы A 1 через ik , где ik – неизвестные пока числа. Запишем
условие (18.6) через элементы матриц

= = 10;; ii =6= kk
n
X
is sk ki (18.7)
s=1

1
Придадим индексу i значение , а индекс k заставим меняться от 1
до n. В результате получим систему n уравнений с n неизвестными
1s : 9
i = 1; k = 1 : 11 11 + 12 21 + : : : + 1n n1 = 1 >
>
i = 1; k = 2 : 11 12 + 12 22 + : : : + 1n n2 = 0 =
: (18.8)
:::::::::::::::::::::::::::::::::::::::::: >
>
i = 1; k = n : 11 1n + 12 2n + : : : + 1n nn = 0 ;

128
Поскольку det A 6= 0, то применяем формулу Крамера

1 : : : 1 : : : n
1 1
1 : : : 0 : : : n
2 2
: : : : : : : : : : : : : : :
1
n : : : 0 : : : n n Aj1
1
j = = det A ;
det A (18.9)

j j
где A1 – алгебраическое дополнение элемента 1 в матрице A. За-
метим, что элемент 1j стоит на пересечении первой строки и j -го
столбца, а алгебраическое дополнение подсчитывается для элемента,
стоящего на пересечении первого столбца j -й строки. Если сейчас ин-
2
дексу i придать значение, равное , индекс k заставить меняться от
1 до n и разрешить по формулам Крамера соответствующую систему
уравнений, то получим, что 2
Aj2
= det A
. Аналогично имеем
j

3 Aj3 Ajn
j =
det A ; : : : ; j = det A :
n

Таким образом, элементы A 1 определены однозначным образом


ik = det
Aki 1 имеет вид
A и, следовательно, A
2 3
A11 A21 : : : An1
A 1=
1 66 A12 A22 : : : An2 77 ;
det A 4 1  2     n 5 (18.10)
An An : : : An
j
где (еще раз напоминаем) Ak – алгебраические дополнения элементов
jk матрицы A.
Пользуясь формулой разложения определителя по алгебраиче-
ским дополнениям своей и чужой строки (столбца) (лекция 2)

n
X
ik Ajk =
n
X
ki Akj = det A; i = j ;
k=1 k=1
0; i 6= j
легко проверить выполнение следующих равенств:
(a) AA 1 = E; (б) (AB ) 1 = B 1A 1; (в) (A 1) 1 = A: (18.11)
На основании (18.6) и (18.11) заключаем, что
A 1 A = AA 1 = E:
Определив отрицательную степень матрицы A в виде A n A 1 A = 1
: : : A 1 , формулу Ap Aq Ap+q мы распространим тем самым на все
=
множество целых чисел p и q .

129
Пример. Найти обратную матрицу для
2
1 1 23
A = 4 1 1 15 :
0 1 0
Решение. Вычисляя определитель и алгебраические дополнения,
находим: A ; A11
det = 3 ; A21
= 1; A31 ; A12
=2 ; A22 ; A32= 3 =0 =0 =
3; A13 ; A23 ; A33 . Поэтому
= 1 = 1 =0
21
3
2 13
A 1 = 40
1
013 15 :
3 3 0
Вернемся к рассмотрению линейных отображений A Ln ! Lm и :
установим, что представляет собой множество векторов Ax из Lm .

Определение 3. Совокупность всех векторов пространства Lm , y =


Ax, где x пробегает все множество векторов Ln , называется образом
отображения A и обозначается символом Im A.
Pn
Пусть x= k=1  ek . Тогда
k

!
n
X n
X
Ax =A  k ek =  k Aek :
k=1 k=1

Вспоминая определение линейной оболочки, заключаем: образ ли-


нейного отображения A есть линейная оболочка, натянутая
на образы базисных векторов fAe1 ; : : : ; Aen g. Нам известно, что
координаты векторов Aek составляют столбцы матрицы A ik . =[ ]
Поэтому размерность Im A совпадает с максимальным числом
линейно-независимых столбцов матрицы A, т.е. с рангом A.
Итак, dim
Im A ранг A.=
Еще одной важной характеристикой отображения A является по-
нятие ядра отображения.

Определение 4. Ядром линейного отображения A (символ Ker A)


называется множество всех векторов из Ln , которые A отображает в
нуль-вектор пространства Lm , т.е. совокупность x 2 Ln таких, что
Ax =0
.

Покажем, что Ker A есть линейное подпространство пространства


=0
Ln . В самом деле, пусть x1 ; x2 2 Ker A, т.е. Ax1 , Ax2 . Видим, =0
(
что A x1 x2 + )= +
Ax1 Ax2   = 0+ 0 = 0
, и, следовательно,
( + )
вектор x1 x2 2 Ker A при любых ; 2 K.

130
Какова размерность ядра отображения? Чтобы ответить на этот
вопрос, запишем в координатах условие Ax =0
! !
n
X n
X n
X m
X
Ax =A  k ek =  k Aek = k ik gi = 0:
k=1 k=1 k=1 i=1
Из-за линейной независимости векторов g1 ; : : : ; gm имеем
n
X
ik  k = 0 (i = 1; m) (18.12)
k=1
– однородную систему линейных уравнений, матрица которой совпа-
дает с матрицей A. Следовательно, вектор x принадлежит простран-
ству решений системы (18.12), и ядро отображений A совпадает с
пространством решений однородной системы уравнений с мат-
рицей A. Нам известно, что размерность пространства решений равна
n r, где r – ранг матрицы A. Подводя итоги, можно заключить, что
( )
ядро Ker A есть подпространство пространства Ln размерно-
сти n r.
=
Теорема 2. Если B AT (или если B = T A), где T – невырож-
денная матрица, то ранг B ранг A. =
Доказательство: Имеем, что Bx = ( )
A T x для любого x 2 Ln .
Но Im T = =
Ln , поскольку ранг T n (T - невырожденная матрица).
Поэтому dimIm B = dim
Im A. Ранги матриц B и A совпадают.
Отметим, что систему уравнений (18.12) в матричном представ-
лении можно записать в виде A x [ ]=0 []
, где x – матрица-столбец с
неизвестными коэффициентами. Если через b обозначить матрицу- []
столбец из свободных членов b1 ; b2 ; : : : ; bm неоднородной системы, то
неоднородная система линейных уравнений в матричной форме при-
мет вид A x [ ]=[ ]
b.
Поэтому нахождение общего решения однородной системы урав-
нений можно всегда интерпретировать как отыскание ядра отображе-
ния, задаваемого матрицей системы, а нахождение общего решения
неоднородной системы уравнений - как отыскание множества всех
векторов пространства Ln , которые отображаются с помощью A в
фиксированный вектор b пространства Ln .
В частности, когда имеем систему A x [ ]=[]
b из n уравнений с n
неизвестными и с det = 0
A 6 , то формулы Крамера приобретают вид
[x] = A 1 [b] (18.13)

Для доказательства достаточно умножить равенство A[x] = [b] слева


на A 1 и учесть, что A 1 A x Ex x. [ ]= [ ]=[ ]
131
Л е к ц и я 19
Собственные значения и собственные векторы
оператора. Переход к новому базису. Инварианты
оператора
Очень важную роль в теории линейных операторов и в физических
приложениях играют понятия собственных векторов и собственных
=
значений оператора A EndLn .

Определение 1. Подпространство U называется инвариантным


относительно оператора A, если для любого x 2 U образ Ax 2 U, т.е.
( )
A U  U.

Нас будут интересовать одномерные инвариантные подпростран-


ства, называемые собственными направлениями оператора A.

Определение 2. Вектор x (x 6= 0) называется собственным векто-


ром оператора A, если Ax = x. Число  называется собственным
значением оператора.

Теорема 1. Если x-собственный вектор оператора A, то для


любого 2 K вектор x так же является собственным векто-
ром A с тем же собственным значением, что и вектор x.

В самом деле, пусть Ax = x. Тогда A( x) = Ax = (x) =


( )
x .
Теорема 2. Множество всех собственных векторов, отвечаю-
щих одному и тому же собственному значению, образует ли-
нейное инвариантное подпространство.

Действительно, если Ax1 = =


x1 , Ax2 x2 , то A ( x1 + x2) =
+ = ( + )
Ax1 Ax2  x1 x2 . Теорема доказана.
Теорема 3. Собственные векторы x1 ; : : : ; xs с попарно различны-
= ; = )
ми собственными значениями 1 ; : : : ; s (i 6 j i 6 j образуют
линейно-независимую систему векторов.

Для доказательства теоремы применим метод индукции. При s =


1 теорема выполнена, так как собственный вектор не нуль-вектор.
Пусть теорема верна для любой системы из k собственных векторов.
Докажем, что она верна и для системы из k ( +1)
собственного вектора.
Составим линейную комбинацию с произвольными коэффициентами

1 x1 + : : : + k xk + k+1 xk+1 = 0: (19.1)

132
Действуем оператором A, учитывая, что Axs = s xs . Получаем
1 1 x1 + : : : + k k xk + k+1 k+1 xk+1 = 0: (19.2)
Из собственных чисел 1 ; : : : ; k+1 хотя бы одно отлично от нуля, так
как собственные значения попарно различны. За счет перенумерации
всегда можно считать, что k+1 6 =0
. Умножив (19.1) на k+1 и вычи-
тая полученное соотношение из (19.2), получим
1 (1 k+1 )x1 + 2 (2 k+1 )x2 + : : : + k (k k+1 )xk = 0: (19.3)
Поскольку для любых k собственных векторов теорема верна, то век-
торы x1 ; : : : ; xk линейно-независимы и, следовательно, 1 1 k+1 ( )=
0 (
, 2 2 k+1 )=0 (
, . . . k k k+1 )=0
. Это означает, что 1 , =0
2 =0, . . . k =0 = =
, так как 1 6 k+1 , 2 6 k+1 , . . . , k 6 k+1 . В =
таком случае из (19.1) следует равенство k+1 xk+1 =0
. Но xk+1 как
собственный вектор не является нуль-вектором. Поэтому коэффици-
ент k+1 также равен нулю. Теорема доказана.
Как практически находить собственные значения и собственные
векторы оператора?
Пусть fe1 ; : : : ; en g – базис в Ln , A =[ ]
ik – матрица оператора.
Равенство Ax =x можно записать в виде A E x ( ) =0
, где E –
( = )
тождественный оператор E x x . В матричной форме приведенное
операторное равенство выглядит следующим образом:
n
X
(A E )[x] = 0 или ( ik ki ) k = 0:
k=1
Подробно расписывая последнее равенство, получим систему n ли-
нейных уравнений
8
>
> ( 211 1 )12 + 1222 + : : : + 1n2 nn = 0
<
1  + ( 2 ) + : : : + n  = 0
>
>  (19.4)
:
n1  1 + n2  2 + : : : + ( nn ) n = 0
Из теории систем линейных уравнений следует, что данная система
имеет не нулевое решение тогда и только тогда, когда определитель
матрицы системы равен нулю (ранг A E < n). ( )
Приравнивая det( )
A E к нулю, мы получим характеристиче-
ское уравнение

1  12    1n
1
2
1 22     2n = ( 1)nn + I1n 1 + : : : + In = 0:
n1 n2    nn 
(19.5)

133
Полином n-й степени, стоящий в левой части равенства (19.5), назы-
вается характеристическим полиномом матрицы A. Корни этого
полинома суть собственные значения оператора.
Итак, для того, чтобы оператор A имел собственные векто-
ры, необходимо и достаточно, чтобы характеристический по-
лином его матрицы A был равен нулю, причем соответствую-
щие собственные значения оператора совпадают с корнями ха-
рактеристического полинома.
Если мы рассматриваем комплексные линейные пространства K  (
)
C , то согласно основной теореме алгебры (о наличии корней поли-
нома) имеем n корней (включая кратные)

: : ; }1 ; | 2 ; :{z
| 1 ; :{z : : ; }2 ; : : : ; | s ; :{z
: : ; }s : (19.6)
r1 r2 rs

Тем самым мы найдем s попарно различных собственных значе-


ний оператора. Подставляя k в систему (19.4) вместо параметра  и
составляя нормальную фундаментальную систему решений, мы нахо-
дим базис подпространства собственных векторов, отвечающих дан-
ному собственному значению k оператора A.
Если мы рассматриваем вещественные линейные пространства K  (
)
R , то ситуация складывается несколько сложнее, чем в предыду-
щем случае. Когда вещественные корни у характеристического по-
линома отсутствует (корни только комплексные), то мы говорим,
что вещественных собственных векторов оператор не имеет. Пусть
{z }
; ;|
1 ; : : : ; 1 : : : m ; : : : ; m – вещественные корни полинома, а
| {z }
p1 pm
|
: : ; 1  i }1 ; : : : ; | t  i t ; :{z
1  i 1 ; :{z : : ; t  i }t – комплексные и комп-
q1 qt
лексно-сопряженные корни полинома (вспомним, что у полинома с
вещественными коэффициентами наряду с комплексным корнем +
i непременно присутствует корень i ), причем p1 : : : pm q1 + + +2 +
+2 =
: : : qt n. В вещественном линейном пространстве m веществен-
ным собственным значениям 1 ; : : : ; m будут отвечать вещественные
собственные векторы (процедура нахождения базиса оболочки соб-
ственных векторов, отвечающих фиксированному вещественному соб-
ственному значению, полностью совпадает с указанной выше для ком-
плексных пространств, только координаты  k – вещественные числа),
а комплексным собственным значениям будут отвечать комплексные
собственные векторы (их координаты  k – комплексные числа).
Пример. Найти собственные значения и собственные векторы опе-

134
ратора, заданного матрицей
2 3
1 0 1 1
6 0 1 0 177 :
6
4 0 0 1 15
0 0 2 1
Составляем характеристическое уравнение


1  0 1 1

0 1  0 1 = ( 1 )2 (2 + 1) = 0:

0 0 1  1
0 0 2 1 
2
Имеем -кратный вещественный корень 1 = 1 и комплексные кор-
ни 1= i, 2 =
i. Подставляем вместо  в систему вида (19.4)
1 = 1. Имеем
8
0  11 + 0  22 + 3 3+ 4 4 = 0
>
>
0   1+ 0   2+ 0  3 4 = 0 ;
<
>
> 0  1 + 0  2 + 23 +  4 = 0
:
0   + 0   2 + 0   = 0
откуда следует, что  3 =  4 = 0, а  1 = c1 ,  2 = c2 (c1 ; c2 – произволь-
ные вещественные параметры). Строим нормальную фундаменталь-
ную систему решений, полагая сначала c1 = 1, c2 = 0, затем c1 = 0,
c2 = 1. Получим два базисных собственных вектора
2 3 2 3
1 0
607 617
x1 = 6 405 ; x2 = 405
7 6 7

0 0
для оболочки собственных векторов, отвечающих собственному зна-
чению 1 = 1
. Любой другой собственный вектор x, отвечающий
1 = 1 , есть линейная комбинация векторов x1 и x2
2 3 2 3
1 0
607 617
x = 1 6
405 + 2 405 :
7 6 7

0 0
Подставляя вместо  в систему вида (19.4) комплексный корень 1 =
i, получим следующую систему уравнений:
8
>
> ( 11 i)1 + 0  22 + 3 3+ 4 4 = 0
<
0  1 + ( 12 i) + 0  3 4 = 0 ;
>
> 0   1 + 0   2 + ( 31 i) + 4 = 0
:
0   + 0   2 + (1 i) = 0
135
откуда находим, что

1 =
1 (1 + i)c; 2 =
1 (1 i)2 c;  3 = c;  4 = (i 1)c;
2 2
где c – произвольный комплексный параметр. Фиксируя значение c,
полагая, например, c =2
, получим базисный комплексный собствен-
ный вектор для одномерного инвариантного подпространства, отве-
чающего собственному значению 1 i =
2 3
1+i
6
y1 = 6 2i 77 :
4 2 5
2 + 2i
Если провести аналогичные рассмотрения с сопряженным корнем
2 i, то при соответствующем выборе  3 c базисный собствен-
= =
ный вектор, отвечающий собственному значению 2 i, будет ком- =
плексно сопряженным к вектору y1
2 3
1 i
y2 = 6
6 2i 77 :
4 2 5
2 2i
Что можно сказать о размерности инвариантного пространства
собственных векторов, отвечающих кратному собственному значению?
Теорема 4. Размерность подпространства собственных векто-
ров, отвечающих кратному собственному значению, не превос-
ходит кратности этого значения.
Пусть U - подпространство собственных векторов, отвечающих
собственному значению 1 кратности r1 , имеет размерность m U (dim =
)
m . Пусть ff1 ; : : : ; fm g – базис в U. Поскольку ff1 ; : : : ; fm g – собствен-
ные векторы, отвечающие собственному значению 1 , то
Af1 = 1f1; Af2 = 1f2; : : : ; Afm = 1 fm : (19.7)
Дополним базис U до базиса Ln векторами em+1 ; : : : ; en . Образы этих
векторов при действии оператора A есть линейные комбинации век-
торов базиса ff1 ; : : : ; fm ; em+1 ; : : : ; en g
8 Pm Pn
>
>
>
A em +1 =
j =1 j
m +1 f j s=m+1 +
sm+1 es
>
< :::::::::::::::::::::::::::::::::::::
: : : : : : : : :P
: : : : : : : : : : : : :P
::::::::::::::: (19.8)
Aen = j =1 n fj + s=m+1 sn es
>
> m j n
>
>
:

136
Матрица A в базисе ff1 ; : : : ; fm ; em+1 ; : : : ; en g, согласно (19.7), (19.8),
имеет вид
2 3
0:::0 1m+1 : : : 1n
..
6
1 .
7
2m+1 : : : 2n
6 7
6
6
0 1 : : : 0 ..
. 7
7
6 .. .. .. .. 7
6 . . . . 7
6 7
6 7
A=
6
6 0 0 : : : 1 ..
. m
m+1 : : : m 7
n 7: (19.9)
6 .. 7
6
6   .  7
7
6
6 0 0:::0 ..
m +1 : : : m+1 7 7
6 . m+1 n 7
6 .. .. .. .. 7
6 . . . . 7
4 5
0 0:::0 ..
. nm+1 : : : nn
Составляя характеристический полином det(A E ), получим
det(A E ) = (1 )m Q(); (19.10)

где Q() – полином степени n m.


Из (19.10) следует, очевидно, что кратность r1 корня  1 не =
=
меньше m ( 1 может быть и корнем полинома Q  ). Итак, m  ()
r1 . Теорема доказана.
В том, что размерность подпространства собственных векторов
бывает меньше кратности соответствующего корня, легко убедиться
на следующем примере. Пусть
2 3
0 0 1 1
6 1 0 1 177
A=6
4 0 0 0 05
0 0 0 1
– матрица оператора. Ее характеристический полином имеет вид


0 1
 1
1  1

1 = 3 ( 1):
0 0  0


0 0 0 1 

Первый корень 1 = 0 имеет кратность 3, второй корень 2 = 1 одно-


кратен. В случае первого собственного значения получаем

 3  4 = 0;  1 +  3  4 = 0;  4 = 0;
откуда следует, что  1 =  3 =  4 = 0,  2 = c (c – произвольный веще-
ственный параметр). Таким образом, подпространство собственных

137
3
векторов, отвечающих собственному -кратному значению 1 , =0
имеет размерность, равную единице. Его произвольный вектор-x име-
ет вид 2 3
0
x=
6 7
6 1
4 5:
7
0
0
Переход к новому базису
В n-мерном линейном пространстве L любая система из линейно-
независимых векторов служит базисом пространства, т.е. базисы в Ln
могут быть выбраны различным образом. Возникают следующие во-
просы: (1) как задать переход от одного базиса к другому? (2) как
при этом меняются координаты вектора x? (3) как меняется матрица
оператора при переходе к новому базису? (4) какие величины, связан-
ные с матрицей оператора, остаются неизменными или, как говорят,
являются инвариантными преобразования базисов? Ответим на эти
вопросы.
Пусть fe1 ; : : : ; en g – базис в Ln и fe10 ; : : : ; en0 g – новый базис в Ln .
Разложим векторы ei0 i ( =1 ) ; n нового базиса по векторам базиса
fe1 ; : : : ; en g n
X
ei0 = ik0 ek (i = 1; n): (19.11)
k=1
Координаты ei0 запишем, как обычно, в виде столбцов и получим
матрицу 2 3
110 210 : : : n10
6 20  20 : : :  20 7
T 6 4
1 2 = n 7;
::: :::::::5 (19.12)
1n0 2n0 : : : nn0
которая называется матрицей перехода от нештрихованного бази-
са к штрихованному. Ясно, что det = 0
T 6 , так как векторы ei0 как
векторы базиса являются линейно-независимыми и ранг матрицы T
полный. Итак, матрица перехода есть невырожденная матрица.
Соотношения (19.11) могут быть записаны в матричной форме, ес-
ли ввести в рассмотрение матрицы-строки e 0 [ ] =[ ] [ ]=
e10 ; e20 ; : : : ; en0 , e
[ ]
e1 ; e2 ; : : : ; en , составленные из векторов штрихованного и нештрихо-
ванного базисов. Тогда (19.11) эквивалентно следующему соотноше-
нию:
[ ] =[ ]
e 0 e T: (19.13)
Поскольку T – невырожденная матрица, то всегда существует T 1 .
Умножая (19.13) на T 1 справа и пользуясь равенствами T T 1 E =
и eE[ ] =[ ]
e , получим
e e 0T 1: [ ]=[ ] (19.14)

138
Итак, переход от штрихованного базиса к нештрихованному осу-
ществляется с помощью обратнойP матрицы.
Pn 0
$
Для любого x 2 n мы имеем x
n
k =1 =
 k e в базисе fe ; : : : ; e g
k 1 n
иx = i=1  ei0 в базисе fe10 ; : : : ; en0 g. Подставив
i
P ei0 из (19.11), полу-
Pn 0i Pn P k0  i0 e . Поэтому
чим, что x = i=1  
k=1 i
k0 e
k
n
k=1= n
i=1 i k
!
n
X n
X n
X 0
 k ek = ik0  i ek :
k=1 k=1 i=1
В силу линейной независимости векторов базиса fe1 ; : : : ; en g, возни-
кает равенство
Xn
0
 k ik0  i ; = (19.15)
i=1
которое в матричной форме имеет вид

[x] = T [x]0 ; (19.16)

[] []
где под x и x 0 подразумеваются матрицы-столбцы, составленные
0
из координат  k и  k вектора x. Умножая (19.16) слева на T 1 , мы
получим, как "новые" координаты вектора x выражаются через "ста-
рые":
x0 T 1x: []= []
(19.17)
Таким образом, формулы (19.16), (19.17) задают законы, связы-
вающие между собой координаты вектора x в штрихованном и
нештрихованном базисах.
Пусть A
0
=[ ]
ik – матрица оператора в базисе fe1 ; : : : ; en g. Через
=[ ]
A0 ik0 обозначим матрицу
Pn
того же оператора в базисе fe10 ; : : : ; en0 g.
Pn 0
=
Заметив, что Aek P i=1 ik ei и AekP 0 m =1 m
k =
0 em0 , подставив
согласно (19.11) ek0 =
n
s=1 k0 es , em0
s n
=
i=1 m0 ei в левую и правую
i
части второго равенства, получим
n
X n
X n
X
0
ks0 Aes = m
k0 mi 0 ei
s=1 m=1 i=1
или
n
X n
X n
X
0
ks0 is ei = m
k0 mi 0 ei
s=1 m=1 i=1
В силу линейной независимости векторов базиса fe10 ; : : : ; en0 g имеем
равенство
Xn Xn
0
i s
s k0 mi 0 m
k ;
0 = (19.18)
s=1 m=1

139
которое в матричной форме принимает вид

AT = T A0; (19.19)

откуда следует, что

A0 = T 1 AT ; A = T A0 T 1 : (19.20)

Формулы (19.20) задают законы, согласно которым связаны мат-


рицы оператора в штрихованном и нештрихованном базисах.
Перейдем сейчас к очень важному для физических приложений
вопросу об инвариантах линейных операторов. Прежде всего отме-
тим, что ранг A есть инвариант преобразования базисов, так как
ранг A0 = ранг A из-за умножения A на невырожденные матрицы.
Теорема 5. Собственные значения оператора инвариантны от-
носительно преобразования базисов.
В самом деле, пусть 0 – собственное значение оператора и x -
собственный вектор, отвечающий данному собственному значению.
Тогда имеет место следующее матричное соотношение:

A[x] = 0 [x]; (19.21)

где A – матрица оператора в базисе fe1 ; : : : ; en g. Пусть T – матрица


перехода к штрихованному базису. Умножив (19.21) на T 1 слева и
вставив между A и [x] множитель E T T 1 , получим
=
T 1 A(T T 1 )[x] = 0 T 1 [x]: (19.22)

В силу ассоциативности умножения матриц, имеем

(T 1 AT )(T 1 [x]) = 0 T 1 [x];


или с учетом (19.17) и (19.20) получаем

A0 [x]0 = 0 [x]0 :
Собственное значение собственного вектора x в штрихованной систе-
ме координат осталось неизменным. Теорема доказана.
Отметим также, что матрица тождественного преобразования при
переходе к новому базису не меняет своего вида и остается единичной,
так как E 0 T 1 ET T 1 T E .
= = =
(
Рассмотрим характеристическую матрицу A E для операто- )
( )
ра A E . Согласно (19.20) имеем: A E 0 ( T 1 A E T
) = ( ) =
T 1 AT T 1 ET A0 E . Но
=
det(A E )0 = det T 1  det(A E )  det T =
140
= det1 T  det(A E )  det T = det(A E )
В силу равенства (A E )0 = A0 E получим следующее равенство:
det(A E ) = det(A0 E ); (19.23)

выполняющееся при любом значении параметра , т.е. характери-


стический полином оператора есть инвариант преобразования
базисов.
В (19.23) слева и справа стоят полиномы n-й степени

( 1)nn + I1 n 1 + : : : + In 1 + In = ( 1)n n +
+I10 n 1 + : : : + In0 1  + In0 :
Известно, что полиномы тождественно равны друг другу, если равны
их коэффициенты при соответствующих степенях . Итак, коэффи-
циенты характеристического полинома суть инварианты от-
носительно преобразования базисов.
Каким образом они связаны с элементами матрицы оператора?
Раскрывая определитель n-го порядка det(
A E и собирая члены )
при соответствующих степенях , мы получим, что

I1 = ( 1)n 1( 11 + 22 + : : : + nn ) = ( 1)n 1 SpA; (19.24)


Pn
где символом SpA (либо trA) обозначают i=1 ii и называют следом
матрицы A (шпуром A).
Аналогично, I2 есть сумма всех диагональных миноров второ-
n 2 , I – сумма всех диаго-
( 1)
го порядка, взятая со множителем 3
нальных миноров третьего порядка, взятая со множителем n 3 ( 1)
и т.д. Наконец, In = det
A, поскольку минор n-го порядка совпадает
с определителем матрицы. Тот факт, что определитель матрицы опе-
ратора есть инвариант преобразования базисов, может быть получен
и из (19.20), поскольку A0 T 1 A T
det = det det det = det
A.

141
Л е к ц и я 20
Линейные формы и сопряженное линейное
пространство. Билинейные формы.
Преобразование матрицы билинейной формы при
изменении базиса и ее инварианты. Симметричные
и антисимметричные билинейные формы
На числовое поле K, под которым мы подразумеваем C или R, если
иметь в виду лишь операции сложения чисел и умножения их на чис-
ла из того же поля K, можно смотреть как на одномерное линейное
пространство K1 (комплексное в случае C и вещественное в случае
R), векторами которого являются числа из множества K.
Определение 1. Линейное отображение ' Ln ! K1 называется :
линейной формой, заданной на векторах Ln , т.е. для любого x 2 Ln
()
сопоставлено число ' x 2 K1 , причем ' x1 x2 (
' x1 ' x2+ ) = ( )+ ( )
для любых ; 2 K.
Например, если в трехмерном евклидовом пространстве зафикси-
ровать вектор ~c и рассмотреть скалярное произведение ~c~x , где ~x ( )
пробегает все множество векторов пространства, то мы получим ли-
нейную форму ' ~x( )=( ) ((
~c~x , так как ~c ~x1 ~x2 + )) = ( )+ ( ) =
~c~x1 ~c~x2
( )+ ( )
' ~x1 ' ~x2 .
Пусть fe1 ; : : : ; en g – базис в Ln . Найдем матрицу отображения ',
вычислив ' на векторах базиса. Имеем ' ek ( )= ( =1 )
'k k ; n . Матрица
[]
' имеет одну строку, поскольку K1 одномерно. Поэтому
['] = ['1 '2 : : : 'n]: (20.1)

Элементы этой матрицы носят название коэффициентов линейной


[]
формы. Зная матрицу ' , легко найтиP значение формы на любом
векторе x 2 Ln . В самом деле, если x
n
=
k=1  ek , то
k

n
X n
X n
X
'(x) = '(  k ek )= k' (ek ) = 'k  k :
k=1 k=1 k=1

В матричной форме это выражение имеет вид

'(x) = ['][x]; (20.2)

[]
где под x подразумевается матрица-столбец из координат вектора x.
Мы знаем, что относительно операции сложения и умножения на
число совокупность всех линейных форм (как линейных отображе-
ний) образует свое линейное пространство размерности  n n. 1 =
142
Определение 2. Линейное n-мерное пространство, векторами ко-
торого являются линейные формы, называется сопряженным линей-
ным пространством (по отношению к пространству Ln ) и обознача-
ется символом Ln .

Базис в Ln будем обозначать той же буквой e, но ставя индексы


наверху fe1 ; e2 ; : : : ; en g, в отличие от базиса fe1 ; : : : ; en g в Ln .
Всякая линейная форма ' как вектор P из Ln раскладывается по
векторам базиса fe1 ; : : : ; en g ' : = )
n
k=1 k e , где k – координаты
k
линейной формы ' в базисе fe1 ; : : : ; en g.
Удобно выбрать базис в Ln таким образом, чтобы линейные фор-
мы ek на векторах базиса Ln fe1 ; : : : ; en g принимали наиболее простые
значения. А именно

ek (ei ) = = 10;; ii =6= kk
ik (20.3)

Такой базис в Ln называется каноническим или взаимным к базису


fe1 ; : : : ; en g в Ln .
Почему целесообразно выбирать в Ln канонический (взаимный)
базис? Чтобы ответить на поставленный вопрос, находим
n
X n
X n
X n
X
'(x) = k ek (x) = k ek ( ie i )= k  i ek (ei ) =
k=1 k=1 i=1 i;k=1
n
X Xn
= k  i ik = k  k ;
i;k=1 k=1

где k – координаты формы. Pn С другой стороны, ранее нами получе-


но выражение ' x ( )= k=1 'k  , где 'k – коэффициенты
1
k
Pnлинейной
формы. Итак, если базис fe ; : : : ; e g канонический, то k=1 k  k
P
n =
n
k=1 'k  для любого вектора x. Это означает, что k
k
1
'k k ; n = ( =1 )
– во взаимных базисах fe1 ; : : : ; en g; fe ; : : : ; e g e ei
n k ik коор- ( ( )= )
динаты линейной формы и коэффициенты линейной формы сов-
падают. В дальнейшем мы будем полагать, что базис fe1 ; : : : ; en g в
Ln и базис fe1 ; : : : ; en g в Ln взаимные.
Как меняются коэффициенты линейной формы, если от базиса
fe1 ; : : : ; en g в Ln перейтиPкn базису fe10 ; : : : ; en0 g с помощьюPматрицы
перехода
Pn T ? Пусть
P e k 0 = i=1  i0 e . Тогда ' 0
k i k ' ek 0 ' n
= ( )= (
i=1 k0 ei
i )=
( )=
i=1 k0 ' ei
i n
i=1 'i k0 . В матричной форме, если через ' обо-
i 0 []
значать матрицу-строку линейной формы в штрихованном базисе, по-
следнее соотношение может быть записано в виде

[']0 = [']T: (20.4)

143
Умножая справа на T 1 , получим выражение для матрицы-строки
[]
' в нештрихованном базисе
['] = [']0T 1: (20.5)

Мы видим, что закон пробразования коэффициентов линейной фор-


мы совпадает по форме с законами преобразования базисов в
пространстве Ln .
Перейдем к рассмотрению линейных скалярных функций, зави-
сящих не от одного векторного аргумента, как это было в случае ли-
нейных форм, а от двух векторных аргументов. с этой целью будем
рассматривать отображение (функцию) B L  L ! K, где L  L – :
прямое произведение множеств векторов пространства Ln .
( )
Определение 3. Числовая функция B x; y называется билинейной
формой, если для любых x; y; z 2 Ln и любого  2 K выполнено: (1)
B (x + z; y) = B (x; y) + B (z; y); (2) B (x; y) = B (x; y); (3) B (x; y +
z ) = B (x; y) + B (x; z ); (4) B (x; y) = B (x; y), т.е. числовая функция
линейна как по первому, так и по второму аргументу.
Из условий (1) - (4) следует
p q ! p X
q
X X X
B i xi ; k yk = i k B (xi ; yk )
i=1 k=1 i=1 k=1

и поэтому, если fe1 ; : : : ; en g – базис в Ln , то


!
n
X n
X n
X
B (x; y) = B  i ei ; k ek =  i k B (ei ; ek ):
i=1 k=1 i;k=1

Обозначим B (ei ; ek ) = ik , и тогда


n
X
B (x; y) = ik  i k ; (20.6)
i;k=1

где числа ik называются коэффициентами билинейной формы. Из


них мы можем построить матрицу (первый индекс номер строки, вто-
рой - номер столбца)
2
11 12 ::: 1n 3
6 21 22 ::: 2n 7
B=6
6::: ::: ::: ::: 7
7; (20.7)
4
::: ::: ::: ::: 5
n1 n2 ::: nn

144
которая носит название матрицы билинейной формы относитель-
но данного базиса.
Как преобразуется матрица билинейной формы, если мы перей-
дем к штрихованному базису? Какие можно указать инварианты для
билинейных форм?Pn
=
Пусть ek0 P i=1 ki0 ePi – векторы нового
Pn базиса. Тогда i0 k0 =
( )= ( n p n q
B ei0 ; ek0 B p=1 i0 ep ; q=1 k0 eq )= p q
p;q=1 i0 k0 pq . Чтобы запи-
сать полученное равенство в матричной форме, запишем последнюю
двойную сумму в раздельном виде
!
Xn n
X
i0 k0 = ip0 pq kq0 : (20.8)
p=1 q=1

Внутренняя P сумма дает нам элементы pk0 матрицы BT . Из равен-


=
ства i0 k0
n p
p=1 i0 pk0 следует, что перемножаются соответствую-
щие элементы столбцов матрицы T и BT и складываются. Правило
умножения матриц (строка на столбец) нарушено. Чтобы правило
умножения матриц не нарушалось, рассмотрим транспонированную
T tr , полученную
Pn из T заменой строк на столбцы и столбцов на стро-
p
ки. Тогда p=1 i0 pk0 будет давать элементы матрицы, полученной
от перемножения T tr и BT . Таким образом, равенство (20.8) в мат-
ричном виде имеет вид
=
B 0 T tr BT: (20.9)
Поскольку матрица B слева и справа умножается на невырожденные
матрицы, то заключаем: ранг матрицы билинейной формы есть
инвариант преобразования базисов. В силу того, что T tr T det = det
(первое свойство определителей), имеем

det B 0 = (det T )2 det B; (20.10)

откуда заключаем, что знак детерминанта матрицы билинейной


формы есть инвариант преобразования базисов.
В приложениях чаще всего находят себя симметричные и анти-
симметричные (кососимметричные) билинейные формы.
Прежде чем переходить к их рассмотрению, дадим определение
симметрической и антисимметрической матрицы.

Определение 4. Матрица B называется симметрической, если при


транспортировании она не меняется, т.е. B tr B . =
Определение 5. Матрица B называется антисимметрической (ко-
сосимметрической), если при транспортировании меняет знак на
противоположный, т.е. B tr B.=
145
Если элементы матрицы B обозначить через ik , то условие сим-
метричности означает следующее равенство между элементами мат-
рицы:
= ( =1 )
ik ki i; k ; n ; (20.11)
а условие антисимметричности означает, что

ik = ki (i; k = 1; n): (20.12)

=
Условия (20.12) при i k дают, что ii =
ii и все элементы по глав-
ной диагонали матрицы нулевые, а при i 6 k элементы совпадают по=
модулю, но различаются знаком.
Переходим к рассмотрению симметричных и антисимметричных
билинейных форм.
Определение 6. Билинейная форма B x; y называется симмет- ( )
ричной, если для любых x; y 2 Ln выполнено B x; y B y; x . ( )== ( )
Пусть в Ln задан базис fe1 ; : : : ; en g. По определению 6 имеем, что
(
B ei ; ek )= ( )
B ek ; ei . Это означает, что коэффициенты билинейной
=
формы ik удовлетворяют условию ik ki , т.е. матрица симмет-
ричной билинейной формы необходимо симметрическая. Обрат-
( )
но, пусть у билинейной формы B x; y матрица симметрическая, т.е.
=
ik ki . Тогда
n
X n
X
B (x; y) = ik i k = ki k  i = B (y; x)
i;k=1 k;i=1

для любых x и y из Ln . Билинейная форма с симметрической


матрицей непременно симметирчная билинейная форма.
Определение 7. Билинейная форма B (x; y) называется антиси-
метричной, если для любых x; y 2 Ln : B (x; y) = B (y; x).
Если в Ln
задан базис fe1 ; : : : ; en g, то согласно определению 7
(
B ei ; ek )= ( )
B ek ; ei и, следовательно, ik =
ki . Итак, матри-
ца антисимметричной билинейной формы с необходимостью
является антисимметрической матрицей. Обратно, если у би-
( )
линейной формы B x; y матрица B антисимметрическая, то форма
( )
B x; y является антисимметричной, так как
n
X n
X
B (x; y) = ik i k = ( ki )k  i = B (y; x):
i;k=1 k;i=1

Поскольку определения симметричности и антисимметричности не


связаны с каким-либо базисом и носят инвариантный характер, то

146
условия симметричности и антисимметричности матриц симметрич-
ной и антисимметричной билинейных форм носят также инвариант-
ный характер и не зависят от выбора базиса в Ln .
Вернемся к рассмотрению общих билинейных форм B x; y . По- ( )
( ) ( )
строим билинейные формы B1 x; y , B2 x; y по правилам
)
def 1
(а) B1 (x; y ) = 2 (B (x; y ) + B (y; x))
: (20.13)
(б) B2 (x; y ) = 12 (B (x; y ) B (y; x))
def

Совершенно очевидно, что B1 (x; y ) – симметричная билинейная фор-


ма, так как B1 (y; x) = 12 (B (x; y )+ B (y; x)) = B1 (x; y ), а B2 (x; y ) – анти-
симметричная билинейная форма, поскольку B2 (y; x) = 21 (B (x; y )
B (y; x) = B2 (x; y).
Если сейчас сложить оба равенства из (20.13), то получим
B (x; y) = B1 (x; y) + B2 (x; y): (20.14)
Итак, любая билинейная форма может быть всегда представле-
на как сумма некоторой симметричной и некоторой антисим-
метричной билинейных форм.
Пример. Задана билинейная форма B x; y 1 1 1 2
( )=2
2 1 3  2 1  2 2  2 3  3 1  3 2  3 3 . Представить ее
+3 2 5 + + +
в виде суммы симметричной и антисимметричной билинейных форм.
Решение. Составляем матрицу билинейной формы, а затем по
( )
правилу (20.13) построим матрицы форм B1 x; y и B2 x; y . Итак, ( )
2
2 1 23
B = 43 2 55 :
1 1 1
(1)
11 =
(1)
2; 12= 1 ( 1 + 3) = 1; (1)13 = 1 ( 2 + 1) = 1 ; (1)22 = 2;
2 2 2
= 12 ( 5 + 1) = 2; 33= 1; 11 = 22= 33 = 0; 12= 12 ( 1 3) = 2;
(1) (1) (2) (2) (2) (2)
23

= 21 ( 3
(2) (1) 1
13 2 1) = 2 ; 23= 2 ( 5 1) = 3:
Поэтому матрицы симметричной и антисимметричной форм имеют
вид: 2 13
2 1 2 2 33
0 2 2
B1 = 4 1 2 2 5 ; B2 = 4 23 0 3 5
1 2 1
2 2 3 0
(сами билинейные формы вписывать не будем).
Проверка решения проста. Сложив B1 и B2 , мы получаем B.

147
Л е к ц и я 21
Квадратичные формы. Приведение квадратичной
формы к каноническому виду методом Лагранжа.
Теорема инерции квадратичных форм.
Положительно определенные квадратичные
формы
( )
Определение 1. Квадратичной формой B x; x называется число-
вая функция, полученная из билинейной формы B x; y путем заме- ( )
ны аргумента y на аргумент x.

Для установления вида квадратичной формы воспользуемся соот-


ношениями (20.14) и заменим в них аргумент y на x. В этом случае
( ) 0 ( )= ( )
B2 x; x  (см. (20.13б)) и B x; x B1 x; x .
Итак, всякая квадратичная форма, построенная на основе би-
( )
линейной формы B x; y , совпадает с квадратичной формой, по-
строенной на основе симметричной части B1 x; y общей били- ( )
нейной формы B x; y . ( )
В силу установленного факта матрица всякой квадратичной фор-
мы (понимаемая как матрица соответствующей симметричной били-
нейной формы) есть симметричная матрица
2 3
11 12 ::: 1n
6 12 22 ::: 2n 7
B=6
4::: ::: ::: ::: 5;
7

1n 2n ::: nn
а сама квадратичная форма в некотором базисе имеет вид

B (x; x) = 11 ( 1 )2 + 2 12  1  2 + : : : + 2 1n  1  n + 22 ( 2 )2 + 2 23  2  3 +
+ : : : + 2 n 1nn 1n + nn(n)2: (21.1)

Поскольку матрица квадратичной формы совпадает с матрицей


симметричной билинейной формы, то, как и для любых билинейных
форм, имеем, что (1) ранг матрицы квадратичной формы (назы-
ваемый просто рангом квадратичной формы) есть инвариант
преобразования базисов, (2) знак детерминанта матрицы квад-
ратичной формы сохраняется при преобразованиях базисов, (3)
при переходе от одного базиса к другому закон преобразования
матрицы квадратичной формы имеет вид B 0 T tr BT . =
Отметим, что если ранг квадратичной формы полный (ранг B =
n), то квадратичная форма называется невырожденной. Их рассмот-
рением мы займемся ниже, а сейчас зададимся вопросом, нельзя ли

148
перейти в Ln к такому базису, в котором квадратичная форма пред-
ставляет сумму квадратов новых координат, умноженных на некото-
рые коэффициенты?
Если такое возможно, то базис называется каноническим и мат-
рица квадратичной формы в нем будет иметь диагональный вид.

Теорема 1. В пространстве Ln всегда существует канониче-


ский базис fe1 ; : : : ; en g, в котором квадратичная форма примет
вид
B x; x 1  10 2 2  20 2 : : : n  n0 2 ;
( )= ( ) + ( ) + + ( ) (21.2)
где 1 ; : : : ; n – фиксированные числа (некоторые из них, может
быть, и равные нулю).

Для доказательства применим метод Лагранжа. Предваритель-


но отметим, что если 11 =0
, и какое либо из чисел 1s 6 , то, =0
проведя замену координат по правилу

1 = 1 + s ; 2 = 2 ; : : : ; s 1 = s 1 ; s = 1 s ;
 s+1 = s+1 ; : : : ;  n = n :
для слагаемого 2 1s  1  s в новом базисе получим

2 1s (1 + s )(1 s ) = 2 1s (1)2 2 1s (s )2 ;


т.е. в новом базисе 10 10 = 2 1s 6= 0. Поэтому, не ограничивая общности
рассуждений, применяем метод Лагранжа к квадратичной форме, где
11 6= 0:
n
X
B (x; x) = 1s ( 1 )2 + 2 12  1  2 + : : : + 2 1n  1  n + ik  i  k : (21.3)
i;k=2

Запишем (21.3) в следующем виде:

B (x; x) =
1 ( 11 1 + 12 2 + : : : + 1n n )2

11
1 ( 2 (2)2 + : : : + 2 (n)2 + 2 12 13 2 3 + : : : + 2 1n 1 1nn 1 n)+
11 12 1n

+ ik i k = 1 ( 111 + 122 + : : : + 1nn)2 + B~ (x; x):


Xn

i;k=2 11
~( )
где B x; x – квадратичная форма, в которую входят лишь перемен-
ные  2 ; : : : ;  n .

149
Делаем замену координат

1 = 11  1 + 12  2 + : : : + 1n  n ; 2 =  2 ; : : : ; n =  n ; (21.4)

после которой B (x; x) = 111 ( 1 )2 +B ~ (x; x), где B~ (x; x) = Pni;k=2 ~ik i k .
Предложенный алгоритм применяем к B ~ (x; x) и после конечного чис-
ла шагов приходим к (21.2). Чтобы найти матрицу перехода от на-
чальных координат  1 ; : : : ;  n к каноническим  10 ; : : : ;  n0 , достаточно
перемножать матрицы промежуточных переходов (вспомним, что ес-
ли  [ ]=T1 1 x и  T1 1  , то  T2 1 T1 1 x и т.д.).
[ ] [ ]= [ ] [ ]= []
Пример. Методом Лагранжа привести к каноническому виду квад-
( )= +4 + +3
ратичную форму B x; x x21 x1 x2 x22 x3 x4 .
x1 x2 2 x22 x3 x4 . После
( ) = ( +2 ) 3 +3
Решение. Первый шаг: B x; x
замены координат y1 = +2 = = = +
x1 x2 ; y2 x2 ; y3 x3 x4 ; y4 x3 x4
(эквивалентно относительно старых координат x1 = 2 = y1 y2 ; x2
1
y2 ; x3 2 y3 y4 ; x4 2 y4 y3 имеем B x; x y1 y22 34 y32
= ( + ) = ( 1 )) ( )= 3 + 2
3 2
4 y4 . Матрица перехода T от первоначального базиса к каноническому
(помним, что x [ ]= [ ]
T y ) имеет вид
2
1 2 0 03
60 1 01 01 77 :
T =6
40 0 21 21 5
0 0 2 2
Все, что излагалось до сих пор относительно квадратичных форм,
имеет место как для вещественных, так и для комплексных квадра-
тичных форм. Дальнейшее изучение квадратичных форм мы про-
должаем только для вещественных линейных пространств и для
( )
квадратичных форм B x; x , для которых коэффициенты ik и коор-
динаты  k – с необходимостью вещественных числа.
Пусть квадратичная форма приведена к каноническому
виду (21.2), где 1 ; : : : ; n – вещественные числа. Поскольку ранг
квадратичной формы – инвариант преобразования базисов, то сре-
ди чисел 1 ; : : : ; n имеется ровно r чисел, отличных от нуля, где r =
рангB , а остальные равны нулю. Если среди этих r чисел s чисел
( )
положительны, а остальные r s отрицательны, то, проведя соот-
ветствующую перенумерацию переменных, приведем B x; x к виду ( )
B (x; x) = 1 (1 )2 + : : : + s (s )2 s+1 (s+1 )2 : : : r (r )2 ; (21.5)

где 1 ; : : : ; r
– положительные числа.
Ясно, что после преобразования координат
0 p 0
k = k  k ; t = t (k = 1; r; t = r + 1; n)
150
квадратичная форма примет наиболее простой вид
0 0
B (x; x) = (1 )2 + : : : + (s )2 (s0+10 )2 ::: (r0 )2 :
который и называется каноническим для вещественных квадра-
тичных форм, рассматриваемых в пространстве Ln , при этом число
s – положительным индексом инерции, r s – отрицатель- ( )
ным индексом инерции, разность s r s при полном ранге r n ( ) =
- сигнатурой квадратичной формы.
Легко заметить, что ни канонический базис, ни канонический вид
квадратичной формы не определены однозначно, так как числа 1 ;
: : : ; n в (21.2) после различных линейных преобразований, сохраня-
ющих диагональную форму, принимают различные значения. Ясно,
что число r (как ранг матрицы) квадратичной формы) при измене-
нии канонического базиса остается неизменным. А что можно сказать
о числах s; r s?
Теорема 2 (инерции квадратичных форм). Положительный ин-
декс инерции s и отрицательный индекс инерции r s является
инвариантами квадратичных форм.
Доказательство. Пусть
Pn квадратичная форма в базисе fe1 ; : : : ; en g
имеет вид B x; x( )= i;k=1 ik   . Пусть в каноническом базисе
i k
fe10 ; : : : ; en0 g
B (x; x) = (1 )2 + : : : + (s )2 (s+1 )2 ::: (r )2 ; (21.6)

а в каноническом базисе fe100 ; : : : ; en00 g


B (x; x) = ( 1 )2 + : : : + ( p )2 ( p+1)2 ::: ( r )2 ; (21.7)

Пусть соответствующие преобразования координат следующие:


n
X n
X
(а)  k = ik  i ; (б)  k = ik  i : (21.8)
i=1 i=1

Вычитая из (21.6) соотношения (21.7), для любого x 2 Ln получим


(1 )2 + : : : + (s )2 + ( p+1)2 + : : : + ( r )2 =
= ( 1)2 + : : : + ( p )2 + (s+1)2 + : : : + (r )2: (21.9)

Предположим, что s < p и рассмотрим вектор x, координаты которого


в базисе fe10 ; : : : ; en0 g удовлетворяют условию  1 ; 2 ; : : : ; s =0 =0 =
0, а в базисе fe100 ; : : : ; en00 g условию  p+1 ; : : : ; n =0. Такой век- =0
тор x существует и он не нулевой, так как наложенные условия для

151
координат вектора x в базисе fe1 ; : : : ; en g эквивалентны однородной
системе уравнений
 Pn
= 0 (k = 1; s);
Pni=1 m
i
k i
= 0 (m = p + 1; n):
i=1 i 
i (21.10)

Число уравнений в (21.10), равное s + (n p) = n (p мень- s),


ше n из-за нашего предположения s < p, и поэтому система всегда
имеет нетривиальное решение. Выбран такой вектор x (для этого до-
статочно взять любое частное решение системы (21.10)), мы получим
из (21.9) для его канонических координат соотношение
( 1)2 + : : : + ( p )2 + (s+1)2 + : : : + (r )2 = 0;
откуда следует, что  1 = 0; : : : ;  p = 0;  s+1 = 0; : : : ;  r = 0, т.е. вектор
x таков, что в базисе fe100 ; : : : ; en00 g его координаты  1 = 0; : : : ;  p =
0;  p+1 = 0; : : : ;  n = 0. Получается, что вектор x нулевой. Пришли
к противоречию. Остается предположить, что s  p. Однако в си-
лу симметрии чисел s и p предположение p < s также приводит к
=
противоречию. Следовательно, s p. Теорема доказана.
Сейчас более подробно рассмотрим положительно определенные
квадратичные формы.
( )
Определение 2. Квадратичная форма B x; x называется положи-
тельно определенной, если для любого x 6 B x; x > . =0 ( ) 0
Теорема 3. Для того, чтобы квадратичная форма была поло-
жительно определенной, необходимо и достаточно, чтобы по-
ложительный индекс инерции был равен n.
( ) 0
Необходимость. Дано, что B x; x > для любого x 6 . Пред- =0
( )
положим, что s < n. Приведем B x; x к каноническому виду
0 0 0 0
B x; x  1 2 : : :  s 2  s+1 2 : : :  r 2 :
( )=( ) + +( ) ( ) ( )
(21.11)
Если r < n, то, взяв вектор x0 , у которого координаты в каноническом
0 0 0
базисе имеют вид  1 ; : : : ; n 1
=0 =0
; n =1
, из (21.11) получим
(
B x0 ; x0)=0 =
. Имеем противоречие. Итак, r n, т.е. всякая положи-
тельно определенная квадратичная форма является невырож-
денной. Пусть s < r =
n. Рассмотрим тот же вектор
1 0 x0 , у которого
n 10
координаты в каноническом базисе имеют вид 
0 ; :=0
: : ;  =
0; n =1. Из (21.11), где r = (
n, получим, что B x0 ; x0 )= 1 0< .
Противоречие. Необходимость доказана.
=
Достаточность. Дано, что s n. Это означает, что в канониче-
( )
ском базисе B x; x имеет вид
0 0 0
B x; x 1 2 2 2 : : : n 2:
( )=( ) +( ) + +( ) (21.12)

152
откуда следует, что для любого x 6 =0 ( ) 0
B x; x > . Имеем положи-
тельно определенную квадратичную форму.
Отметим, что соответствующая положительно определенной квад-
ратичной форме симметричная билинейная форма в каноническом
базисе имеет вид
0 0 0 0 0 0
B x; y  1 1  2 2 : : :  n n :
( )= + + + (21.13)

Ее матрица является единичной.


Если квадратичная форма записана в произвольном (не канони-
ческом) базисе, то как узнать, является ли она положительно опре-
деленной или не является?
Теорема 4 (Сильвестр). Квадратичная форма B x; x i;k=1 ik  
i k ( ) = Pn
положительно определенная тогда и только тогда, когда глав-
ные миноры матрицы B строго положительны:

11 12 ::: 1n

11 12 ; : : : ; 12 22 ::: 2n > 0:

11 > 0;
12 22 > 0 ::: ::: ::: : : : (21.14)

1n 2n ::: nn
Для доказательства представим квадратичную форму в виде
!
X1
n
B (x; x) = B~ (x; x) + 2 in  i  n + nn ( n )2 : (21.15)
i=1
~( )
где B x; x – квадратичная форма, содержащая переменные  1 ; : : : ;  n 1 .
~
Главные миноры матрицы B совпадают с минорами матрицы B , если
исключить из рассмотрения последний, совпадающий с B . Далее det
будем применять метод индукции. При n =1
теорема верна (этот
факт очевиден). Предположим, что теорема верна для квадратичной
формы от n ( 1) переменных. Необходимо доказать теорему для слу-
чая n переменных.
( )
Необходимость. Дано, что B x; x – положительно определен-
ная квадратичная форма. Требуется доказать неравенства (21.14).
~( )
Из соотношения (21.15) тотчас следует, что B x; x также положи-
тельно определенная квадратичная форма, так как иначе существу-
ет такой вектор x0 , у которого первые n 1
координат отличны от
нуля, а  n =0 (
, что B x0 ; x0 ) = ~( ) 0
B x0 ; x0  . Следовательно, в си-
лу индуктивного рассмотрения все главные миноры в (21.14), кро-
ме последнего, строго положительны. Докажем, что и последний ми-
нор, равный det
B , строго положителен. Поскольку B x; x положи- ( )
тельно определенная квадратичная форма, то в каноническом бази-
се ее матрица B 0 =
E (см. (21.12)) и B0 det =1
. Но мы знаем, что

153
det B 0 = (det T )2 det B . Поэтому det B = (det T ) 2 > 0. Необходимость
доказана.
Достаточность. Дано, что выполнены условия (21.14). Доказать,
( )
что B x; x; положительно определенная квадратичная форма. По-
скольку выполнены условия (21.14), то согласно индуктивному подхо-
~( )
ду квадратичная форма B x; x положительно определенная. Не ме-
( = )
няя последней переменной  n  n за счет невырожденных линей-
ных преобразований, связывающих канонические координаты  1 ; : : : ;  n 1
~( )
и координаты  1 ; : : : ;  n 1 , приведем B x; x к каноническому виду. В
результате получим
!
X1
n X1
n
B (x; x) = (i)2 + 2 in i n + nn (n )2 =
i=1 i=1
!
X1
n X1
n
= (i + inn)2 2
in (n)2 + nn(n)2 :
i=1 i=1
Положив
0 0 X1
n
i = + in (i = 1; n 1);
i n n = n ; nn 2 = ;
in
i=1
имеем
X1
n
B (x; x) = (i0 )2 + (n0 )2: (21.16)
i=1
Из (21.16) следует, что det =
B 0 . На основании известной нам фор-
мулы det
B0 T 2 B и того факта, что
= (det ) det B > (условия det 0
0
(21.14) выполнены), выводим > . Следовательно, B x; x по (21.16) ( )
строго положительны для любого x 6 =0
. Достаточность также дока-
зана.
В заключение лекции отметим, что если бы мы рассматривали
квадратичные формы в комплексных линейных пространствах, то
не получили бы таких дополнительных свойств квадратичных форм,
как в вещественном случае, потому что за счет комплексных невы-
рожденных линейных преобразований из (21.2) следует единственный
канонический вид квадратичной формы
B (x; x) = (1 )2 + (2 )2 + : : : + (r )2 ; (21.17)
где r < n для вырожденных квадратичных форм и r n для невы- =
рожденных квадратичных форм.
Свойства, установленные выше для вещественных квадратичных
форм, позволяют нам перейти в следующих лекциях к рассмотрению
вещественных евклидовых пространств.

154
Л е к ц и я 22
Линейные векторно-точечные (аффинные)
пространства. Преобразование аффинной системы
координат. Собственно евклидовы и
псевдоевклидовы пространства. Преобразование
прямоугольной системы координат
Нашей дальнейшей целью является изучение линейных операторов в
евклидовом пространстве, и мы могли бы ограничиться рассмотрени-
ем только векторных евклидовых пространств, но физические прило-
жения требуют рассмотрения векторно-точечных собственно евкли-
довых и псевдоевклидовых пространств. Поэтому мы начинаем с опре-
деления аффинных n-мерных пространств, на основе которых стро-
ится понятие евклидовых пространств.
Пусть Ln =( )
L; K – n-мерное линейное векторное пространство,
а M – некоторое множество, элементы которого назовем точками.
( )
Определение 1. Пара L; M называется n-мерным аффинным про-
странством, если выполнено: (I) для L имеют место аксиом линей-8
( )
ного векторного пространства (т.е. L; K – n-мерное линейное про-
странство); (II) для множества M имеют место аксиомы: II1 любой ( )
( )
упорядоченной паре точек A; B соответствует один и только один
! ( )
вектор из Ln , обозначаемый символом AB ; II2 для любой точки
A 2 M и любого вектора x 2 Ln существует такая единственная
точка B , что AB
! x; II если AB
= ( ) ! CD !, то AC
! BD
= ! (аксиома=
3
параллелограмма).
Аффинное n-мерное пространство является векторно-точечным и
обозначается символом An . Для An с применением аксиом линейного
! !
пространства и аксиом группы (II) легко получить (доказательства
просты и мы их опускаем), что (1) векторы AA и BB для любых
! !
точек равны между собой и представляют нуль-вектор, (2) вектор
BA есть противоположный вектор по отношению к AB .
Если поле K  C, то имеем дело с комплексным аффинным про-
странством, если K  R, то речь идет о вещественных аффинных
пространствах.
На протяжении последующих лекций (до рассмотрения унитар-
ных пространств) мы будем иметь дело только с вещественными аф-
финными и евклидовыми пространствами.
Определение 2. Совокупность точки O и системы линейно-незави-
симых векторов (базиса fe1 ; : : : ; en g) fO; e1 ; : : : ; en g в An называется
аффинной системой координат, а координаты радиус-вектора OM
!

155
(для любой точки M ) называются аффинными координатами точ-
ки M в заданной системе координат.

Поэтому, если OM
! = Pn
k=1 i ek , то говорим, что точка M имеет
k
аффинные координаты  1 ;  2 ; : : : ;  n .
( )
Pn
Если начало координат O осталось прежним, а ek0 i=1 k0 ei
i =
– векторы нового базиса, то мы получим новую аффинную систему
координат с прежним началом fO; e1 ; : : : ; en g. В новой системе коор-
! =
динат радиус-вектор x OM имеет новые координаты (т.е. и точка
M имеет новые координаты), которые подсчитываются (см. лекцию
18) по правилу

(а) [x]0 = T 1[x]; (б) [x] = T [x]0: (22.1)

В координатной записи преобразование (22.1) аффинной системы ко-


ординат с сохранением начала координат имеет вид
n
X n
X
0 0 0
(а)  k = ik  i ; (б)  i = ki0  k ; (22.2)
k=1 k=1
0
где ik – элементы обратной матрицы T 1 .
Более общее преобразование аффинной системы координат затра-
гивает и перенос начала координат. Пусть fO; e1 ; : : : ; en g и fO0 ; e10 ; : : : ; en0 g
– аффинные системы координат. Поскольку OM OO0 O0 M , то
! = !+ !
OM
! P
= n P
+ n i0 1
k=1 ek i=1  ei , где ; : : : ; – координаты нового на-
k n
чала координат O0 относительно нештрихованной системы
Pn Pn 0координат.
Pn
Поэтому
Pn имеем следующее равенство: k =1 i
k e k i=1  i
k=1 i0 ek
k = +
k=1 ek , откуда следует
k

n
X 0
k = ik0  i + k : (22.3)
i=1
Соотношения (22.3) в матричной форме приобретают вид

[x] = T [x]0 + [ ]; (22.4)

где [ ] – матрица-столбец,1 построенная из координат начала O0.


Умножив слева на T (22.4), получим

[x]0 = T 1 [x] T 1 [ ] (22.5)

или в координатной записи


n
X
0 0 0
k = ik  i + k ; (22.6)
i=1

156
0
где за k обозначены числа
Pn k0 i
( )
i=1 i .
Формулы (22.3) и (22.6) полностью исчерпывают вопрос об общем
преобразовании аффинной системы координат.
Определение 3. Аффинное пространство An называется евклидо-
вым, если в An зафиксирована симметричная невырожденная би-
( )
линейная форма g x; y , называемая метрической билинейной фор-
мой (или просто метрикой).
Из этого
Pnопределения следует, что если в некотором базисе fe1 ; : : : ; en g
( )=
g x; y i;k=1 gik   , то (1) gik
i k =
gki (симметричность),(2) gik 6 det[ ] =
0 (невырожденность).
Метрическую билинейную форму принято называть скалярным
произведением векторов x и y и обозначать просто x; y , опуская ( )
ради простоты букву g – символ метрической билинейной формы.
Зная свойства симметричных билинейных форм, установленные
нами ранее, запишем их для скалярного произведения векторов
(а) (x; y) = (y; x); (б) (x + z; y) = (x; y) + (z; y);
(x; y) = (x; y): (в)
(22.7)
В аффинной системе координат скалярное произведение (x; y ) под-
считывается, согласно определению билинейной формы, следующим
образом:
n
X
(x; y) = gik  i  k ; (22.8)
i;k=1
где gik =( )
ei ; ek – скалярные произведения векторов базиса.
Как известно, всякая симметричная билинейная форма однознач-
но определяет квадратичную форму. Метрической билинейной форме
однозначно соответствует невырожденная квадратичная форма
n
X
(x; x) = x2 = gik  i  k ; (22.9)
i;k=1
называемая квадратом длины вектора x.
Длина вектора обозначается символом jxj и, следовательно, в аф-
финной системе координат вычисляется по формуле
v
u n
uX
jxj = t gik  i  k : (22.10)
i;k=1
Определение 4. Евклидово пространство называется собственно
евклидовым и обозначается
Pn символом En , если невырожденная квад-
ратичная форма x 2 =
i;k=1 gik   является положительно опре-
i k
деленной, и называется псевдоевклидовым, если невырожденная квад-
ратичная форма не является положительно определенной.

157
В силу данного определения, и для случая положительно опреде-
ленных квадратичных форм следует, что для собственно евклидовых
пространств к свойствам (22.7) скалярного произведения прибавля-
ется еще одно
x2 = (x; x) => 0 (22.11)

для любого x 6 =0 ( )=0


и x; x тогда и только тогда, когда x является
нуль-вектором.
Для псевдоевклидовых пространств условие (22.11) выполняется
( )
только для части векторов и x; x может обращаться в нуль и для не
нулевых векторов (в физике они называются светоподобными или
изотропными).
Классическая физика базируется на рассмотрении -мерных соб- 3
ственно евклидовых пространств (они называются в физике как и в
школьной геометрии просто "евклидовыми пространствами"), а реля-
тивистская физика базируется на рассмотрении определенного класса
4-мерных псевдоевклидовых пространств. Этот класс псевдоевклидо-
вых пространств носит название пространств Минковского и будет
нами определен ниже.
В предыдущей лекции нами показано, что всегда существует та-
кой базис fi1 ; i2 ; : : : ; in g (называемый каноническим), в котором по-
ложительно определенная для собственно евклидовых пространств
невырожденная квадратичная форма x2 имеет вид

x2 = ( 1 )2 + ( 2 )2 + : : : + ( n )2 : (22.12)

Для псевдоевклидовых пространств x2 может быть приведена к сле-


дующей канонической форме:

x2 = ( 1 )2 + : : : + ( s )2 (s+1)2 ::: (n)2 : (22.13)

Это означает, что в базисе fi1 ; : : : ; in g для собственно евклидовых


 про-
странств коэффициенты метрической формы gik = ik = 10;; ii =6= kk
[ ]
и матрица gik имеет вид
2 3
1
6 7
6
6
1 0 7
7
g = 6
6
6
..
.
7
7;
7
(22.14)
6 7
4 0 ..
. 5
1
158
а для псевдоевклидовых
2 9 3
1 >
=
6
6
6
..
. >
s 0 7
7
7
=
6
6 1 ;
9
7
7:
g 6
6 1 >
=
7
7
(22.15)
6
4 0 ..
. >
n s 7
5
1 ;

Разность между числом положительных слагаемых и числом от-


рицательных слагаемых в (22.13) называется сигнатурой псевдоев-
клидова пространства. Все псевдоевклидовы пространства разбива-
ются на классы в зависимости от сигнатуры пространства. Иногда
сигнатуру обозначают символически следующим образом:
(+| {z +} |
::: ::: . {z }
)
s n s
Определение 5. Пространством Минковского называется -мер- 4
ное псевдоевклидово пространство сигнатуры , которая носит (+ )
название сигнатуры Лоренца.
Часто в псевдоевклидовых пространствах вместо квадратичной
формы x2 рассматривается квадратичная форма x2 , и в этом случае
пространство Минковского имеет сигнатуру вида . Вслед- ( + ++)
ствие этого в учебниках по физике можно встретиться как с одной,
так и с другой формой сигнатуры.
К псевдоевклидовым пространствам в этом курсе мы обращать-
ся далее не будем, вернемся к рассмотрению собственно евклидовых
пространств, которые будем называть евклидовыми (как это сделано
во всех учебниках по линейной алгебре), и дадим определение орто-
гональных векторов (используемое также в случае псевдоевклидовых
пространств).
Определение 6. Векторы x; y называются ортогональными между
собой, если их скалярное произведение равно нулю: x; y . ( )=0
Обратившись к каноническому базису fi1 ; : : : ; in g и зная, что ко-
эффициенты метрической билинейной формы суть скалярные произ-
ведения векторов базиса, из (22.14) заключаем

(ik ; im) = km = 10;; k=m ;
k 6= m (22.16)

т.е. векторы канонического базиса взаимно ортогональны друг к дру-


гу и имеют длины, равные единице. Каждый такой базис называется

159
ортонормированным (или орторепером). Итак, согласно (22.14), в
евклидовом пространстве En всегда существует ортонормиро-
ванный базис, в котором матрица метрической формы совпа-
дает с единичной матрицей.
Определение 7. Система координат fO; i1 ; : : : ; in g в En называется
прямоугольной системой координат.
В прямоугольной системе координат все формулы, связанные с
вычислением скалярного произведения (метрических величин), силь-
но упрощаются, и в этом смысле прямоугольная система координат
является предпочтительной. Например, скалярное произведение век-
торов и длина вектора имеют вид
v
n u n
X uX
(x; y) =  k k ; jxj = t k ( )2: (22.17)
k=1 k=1

Для того, чтобы ввести понятие угла между векторами в En , до-


кажем предварительно следующее утверждение.
Теорема 1. В пространстве En для любых векторов имеет ме-
сто неравенство Коши-Буняковского

j(x; y)j = jxjjyj: (22.18)

В самом деле, для любого  2 R и любых x; y согласно (22.11) вы-


полнено: (x y; x y ) 2 (x; x) 2(x; y )+(y; y )  0, т.е. квадратный
трехчлен относительно  не может иметь различных вещественных
корней. Поэтому его дискриминант D x; y 2 x; x y; y  , от-
=( ) ( )( ) 0
куда следует неравенство (22.18).
Неравенство Коши-Буняковского позволяет ввести понятие угла
между векторами.
Определение 8. Углом  между не нулевыми векторами x; y мы
будем называть угол (в пределах от 0 до  ), косинус которого равен
(x;y)
jxjjyj . В аффинной системе координат он подсчитывается по формуле
Pn
i;k=1 gik  
k k
cos  = qP
n
qP
n
: (22.19)
i;k=1 gik   i;k=1 gik  
i k i k

В прямоугольной системе координат (22.19) принимает более про-


стой вид P n
k=1qk k
cos  = qPn Pn : (22.20)
k=1 ( )
k 2 k=1 (
k )2
160
Поставим вопрос о переходе в En от одной прямоугольной систе-
мы координат к другой прямоугольной системе координат. Предва-
рительно дадим определение ортогональной матрицы.

Определение 9. Матрица A = [aik ] называется ортогональной, если


она удовлетворяет условию

Atr A = E; (22.21)

которое в подробной записи имеет вид



= km = 10;; k=m ;
Xn
pk pm k 6= m (22.22)
p=1

Из (22.22) заключаем, что у всякой ортогональной матрицы


сумма произведений элементов столбца на самого себя равна , а 1
сумма произведений элементов разных столбцов равна . Это правило 0
легко позволяет отличить ортогональную матрицу от неортогональ-
ной. Его можно было бы взять за новое определение ортогональной
матрицы, поскольку оно означает выполнение (22.22).
Из (22.21) следует, что Atr A E или A 2 , и,
(det )(det ) = det (det ) = 1
следовательно, если A – ортогональная матрица, то

det A = 1: (22.23)

Это означает, что ортогональная матрица обязательно невырожден-


ная, и если (22.21) умножить справа на A 1 , то получим эквивалент-
ное (22.21) условие
Atr A 1 : = (22.24)
Условие (22.24) можно было бы взять еще за одно определение орто-
гональной матрицы.
Пусть fO; i1 ; : : : ; in g и fO; i10 ; : : : ; in0 g – две прямоугольные систе-
мы координат в En с общим началом, т.е. совершается переход от од-
ного ортонормированного базиса к другому. Обозначим матрицу пе-
рехода от нештрихованного
Pn базиса к штрихованному через Q qkm0 , =[ ]
так что ik0 = m=1 qk0 im . Ввиду того, что i10 ; : : : ; in0 – единичные
m
взаимно ортогональные векторы, имеем
!
n
X n
X
ks = (ik0 ; is0 ) = qkm0 im ; qsi 0 ii =
m=1 i=1
n
X Xn n
X
= (
qkm0 qsi 0 im ; ii )= qkm0 qsi 0 mi = qkm0 qsm0 :
m;i=1 m;i=1 m=1

161
Итак, элементы матрицы перехода связаны соотношением
Xn
qkp0 qsp0 = ks ;
p=1
которое совпадает с (22.22) и показывает, что матрица перехода от
одного ортонормированного базиса к другому необходимо явля-
ется ортогональной матрицей.
Обратно, если задано некоторая ортогональная матрица A aik , =[ ]
то, как известно, она невырожденная и с ее помощью можно осу-
ществить переход от одного базиса к другому. Пусть fi1 ; : : : ; in g –
ортонормированный базис в En . Построим векторы
n
X
ek0 = m
k im :
m=1
Они линейно независимые ( det = 0
A 6 ), и мы можем построить ба-
зис fe10 ; : : : ; en0 g. Вычислим скалярное произведение векторов нового
базиса. Имеем
!
Xn n n n
p X q X X
(ek0 ; em0 ) = k ip ; m iq = pk qm pq = pk pm :
p=1 q=1 p;q=1 p=1
Поскольку A – ортогональная матрица, то в силу (22.22) ek0 ; em0 ( )=
km , и , следовательно, базис fe10 ; : : : ; en0 g является также ортонор-
мированным базисом.
Таким образом, установлено взаимно-однозначное соответствие
между ортогональными матрицами и вращениями базиса (ре-
пера) в пространстве En . Если детерминант ортогональной мат-
рицы перехода равен +1
, то вращения называются собственными
(ориентация репера сохраняется: например, в E3 правая тройка пе-
реходит в правую), если же детерминант ортогональной матрицы пе-
рехода равен 1
, то вращения называются несобстенными (ориен-
тация репера меняется: например, в E3 правая тройка переходит в
левую).
Примером собственных вращений в трехмерном евклидовом про-
странстве E3 являются вращения задаваемые углами Эйлера, изучен-
ные нами в лекции 11.
Применяя сейчас формулы преобразования координат (22.3), (22.6)
в произвольном случае, мы можем написать формулы перехода от
одной прямоугольной системы координат к другой прямоугольной
системе координат, когда перенесено и начало координат
(а)  k
Pn
=q k 0  m0 k  +
0 Pn m=1 m
k 0  m k 0 ;
(б)  k =
m=1 mq + (22.25)

162
или в матричной форме

(а) [x]0 = Q[x]10 + [ ] 0 ;


(б) [x] = Q [x] + [ ] (22.26)

где Q = [qmk 0 ] – ортогональная trматрица и, следовательно, в (22.26)


Q 1 может быть заменено на Q согласно (22.24).

163
Л е к ц и я 23
Изометрический оператор. Самосопряженный
(симметрический) оператор и его матрица. Связь
симметрической билинейной формы с
соответствующим ей самосопряженным
оператором
Переходим к изучению свойств некоторых операторов в En , играю-
щих важную роль в приложениях (в теоретической механике и кван-
товой механике).
Определение 1. Оператор A в En называется изометрическим (изо-
метричным), если он сохраняет скалярное произведение векторов,
(
т.е. Ax; Ay )=( )
x; y для любых x; y 2 En .
Другими словами, изометричный оператор сохраняет метрику про-
странства и соответственно все метрические свойства пространства
En .
Пусть A =[ ]
ik - матрица изометричного оператора в произволь-
ном базисе {e1 ; : : : ; en }. Согласно определению, имеем Aek , Aem ( )=
( )
ek ; em . Рассмотрим подробнее левую часть этого равенства и учтем,
(
что ek ; em )=gkm .

!
n
X n
X n
X n
X
(Aek ; Aem) = ik ei ; pm ep = ik pm (ei ; ep ) = ik gip pm ;
i=1 p=1 i;p=1 i;p=1

т.е. элементы матрицы изометричного оператора и коэффициенты


метрической формы связаны соотношением
n
X
ik gip pm = gkm (23.1)
i;p=1
или в матричном представлении

Atr gA = g; (23.2)
где через g =[ ]
gkm обозначена матрица метрической билинейной фор-
мы.
Если в En выбрана прямоугольная система координат и {i1 ; : : : ; in }
=
- ортонормированный базис, то в нем g E и (23.2) переходит в со-
отношение Atr A =
E . Это значит, что у всякого изометрического
оператора его матрица невырожденная и в ортонормированном
базисе есть ортогональная матрица.

164
Обратно, пусть в ортонормированном базисе матрица A некоторо-
го оператора A является ортогональной. Тогда A – изометрический
оператор.
В самом деле,
! !!
n
X n
X
(Ax; Ay) = A  k ik ; A  m im =
k=1 m=1
!
n
X n
X Xn Xn
= (
 k m Aik ; Aim )= k m pk ip ; qm iq =
k;m=1 k;m=1 p=1 q=1
!
Xn Xn Xn
= k
  m p q
k m pq = k m km x; y : =( )
k;m=1 p;q=1 k;m=1

Определение 2. Оператор B называется сопряженным к операто-


ру A относительно операции скалярного произведения, если Bx; y ( )=
( )
x; Ay для любых x; y 2 En
Пусть A =[ ] ik – заданная матрица оператора A в произвольном
базисе {e1 ; : : : ; en }. Какова матрица оператора B в этом базисе? Пусть
=[ ]
B ki , где ki – пока неизвестные числа. Из определения следует:
( )=(
Bek ; em )
ek ; Aem или в подробной записи
! !
Xn n
X
kp ep ; em = ek ; qm eq
p=1 q=1

т.е.
Xn n
X
kp gpm = gkq qm : (23.3)
p=1 q=1
Последнее равенство в матричном виде записывается следующим об-
разом (учтем, что слева стоят элементы с индексами k; m; a справа с
индексами m; k):
gB gA tr : =( ) (23.4)
Но при транспонировании произведения матриц необходимо перемно-
жать транспонированные матрицы в обратном порядке, т.е. gA tr ( ) =
Atr gtr . Поскольку для метрической билинейной формы gtr g (фор- =
ма – симметричная), то (23.4) эквивалентно соотношению

B = g 1 Atr g: (23.5)

Условие (23.5) и есть то условие, которому удовлетворяет матрица


сопряженного оператора в произвольном базисе.

165
Если базис ортонормированный, то g E; g 1 E и из (23.5)
= =
=
следует, что B Atr . Итак, если в ортонормированном базисе А –
матрица некоторого оператора A, то матрица Atr определяет
сопряженный ему оператор. Сопряженный к A оператор обычно
обозначают символом Ac (или A+ ), и, следовательно, в ортонорми-
рованном базисе его матрица Ac Atr . =
Определение 3. Оператор A называется самосопряженным (сим-
метрическим), если A =
Ac , т.е. Ax; y (
x; Ay для любых )=( )
x; y 2 En .
Согласно (23.5) матрица A самосопряженного оператора в произ-
вольном базисе удовлетворяет условию

A = g 1 Atr g: (23.6)

а в ортонормированном базисе, когда g = E , имеем


A = Atr ) ik = ki : (23.7)

Итак, у всякого самосопряженного в ортонормированном ба-


зисе матрица необходимо симметрическая (отсюда и ещё одно
название у самосопряженного оператора - симметрический оператор).
Наоборот, пусть в ортонормированном базисе матрица некоторо-
го оператора A симметрическая, т.е. m
k =
km . Покажем, что A –
самосопряженный оператор.
В самом деле,
! !
n
X n
X
Ax = 1k  k i1 + : : : + nk  k in ;
k=1 k=1
! ! !
n
X n
X n
X
Ay = 1m m i1 + 2m m i2 + : : : + nm m in :
m=1 m=1 m=1

Тогда
! !
n
X n
X n
X n
X
(Ax; y) = m
k
k m = km m  k = (x; Ay):
m=1 k=1 k=1 m=1

Тем самым, между множеством всех симметричных матриц


и множеством самосопряженных операторов существует вза-
имно-однозначное соответствие.
Но каждая симметрическая матрица однозначно определяет сим-
метричную билинейную форму и соответствующую квадратичную

166
форму. Поэтому установим связь между самосопряженными опе-
раторами и симметричными билинейными формами (эквива-
лентно – квадратичными формами).
Пусть A – самосопряженный оператор, A =[ ]
ik – его матрица
в ортонормированном базисе. Введем обозначение e
Pkm
akm и по- =
строим симметричную билинейную форму A e x; y n
k;m=1 ( )=
ekm  k  m
(
ekm = =[ ]
emk из-за симметричности матрицы A km ). Что она собой
представляет? Для ответа на вопрос подсчитаем скалярное произве-
( )
дение x; Ay . Имеем
!
n
X n
X n
X
(x; Ay) = k km m = ekm  k m = Ae(x; y):
k=1 m=1 k;m=1

Таким образом, мы доказали, что каждому самосопряженному опе-


ратору однозначно сопоставляется симметричная билинейная
форма, которая представляет собой скалярное произведение век-
тора x и образа вектора y при самосопряженном эндоморфизме
A.
Отметим, что из-за самосопряженности x; Ay ( )=(
Ax; y , и поэто- )
му симметричную билинейную форму A ( )
e x; y можно задать и таким
скалярным произведением Ax; y ( )= ( )
Ae x; y .
Докажем сейчас обратное, что любой симметрической билиней-
ной форме можно однозначно сопоставить самосопряженный
оператор. Pn
Действительно, пусть B x; y( )= k;m=1 km   – симметричная
k m
( = )
билинейная форма km mk , заданная в ортонормированном ба-
зисе. Введем в рассмотрение элементы матрицы A km , определив =[ ]
=
их равенством km km . Из-за симметричности билинейной формы
=
получим, что A Atr . Но в таком случае матрица A определяет по
свойству, доказанному нами выше, самосопряженный оператор.
Итак, между множеством самосопряженных операторов и
симметрическими билинейными формами (квадратичными фор-
мами) существует взаимно-однозначное соответствие.
Полученный результат имеет очень важное значение при решении
вопроса о приведении ортогональными преобразованиями к канони-
ческому виду квадратичных форм (или что то же самое – симмет-
ричных билинейных форм).
В самом деле, пусть Q – матрица перехода от одного ортонор-
мированного базиса к другому ортонормированному базису, т.е. Q –
ортогональная матрица, и пусть A =[ ]
km – матрица квадратичной
( = )
формы km mk . Тогда согласно общей теории билинейных форм
=
матрица A преобразуется по закону M 0 Qtr AQ. Но в ортонормиро-
ванном базисе матрица A определяет и самосопряженный оператор

167
A. Согласно общей теории линейных операторов закон преобразова-
ния для матриц операторов таков: A0 Q 1 AQ. Но для ортогональ-
=
ных матриц Q 1 =Qtr , и, следовательно, закон преобразования
матрицы самосопряженного оператора при переходе к новому
ортонормированному базису совпадает с законом преобразова-
ния матрицы квадратичной формы. Из этого факта тотчас следует
вывод: если удастся ортогональными преобразованиями привес-
ти к диагональному виду матрицу самосопряженного операто-
ра, то тем самым будет указан канонический вид квадратич-
ной формы, ибо матрица квадратичной формы будет в новом базисе
иметь тот же диагональный вид, что и матрица оператора.
Нам известно, что наиболее простой вид матрица оператора име-
ет в базисе, где векторы базиса являются собственными векторами
оператора. Поэтому необходимо выяснить все свойства собственных
значений и собственных векторов самосопряженного оператора.

Теорема 1. Все собственные значения самосопряженного опе-


ратора – вещественные числа.

В самом деле, пусть 0 – корень характеристического уравнения


det( ik ki )=0 [ ]
, где ik – матрица самосопряженного оператора в
ортонормированном базисе (для доказательства теоремы достаточно
ограничится рассмотрением ортонормированного базиса, так как соб-
ственные значения оператора – инварианты преобразования базиса).
Из систем алгебраических уравнений
n
X
pq  q = 0  p (p = 1; n) (23.8)
q=1

определяются координаты  q собственных векторов, отвечающих соб-


ственному значению 0 . При этом мы не знаем пока, вещественные
или комплексные числа 0 ;  1 ; : : : ;  n . Будем предполагать, что имеет
место общий случай - эти числа комплексные, потому что веществен-
ные числа есть частный случай комплексных. Умножим равенство
p
(23.8) на комплексно-сопряженные числа  и просуммируем по p от
1 до n. Имеем
n
X n
X
pq  p  q = 0 pp (23.9)
p;q=1 p=1
Pn p p
Выражение p=1   – вещественное число, так как каждое слагае-
p
мое  p  – вещественное число. Если мы покажем, что и левая часть
равенства (23.9) вещественна, то 0 – вещественное число и теорема
будет доказана.

168
В левой части равенства (23.9) слагаемые, для которых p q яв- =
=
ляются вещественными числами. Те члены, где p 6 q , будем рас-
сматривать попарно, объединяя, например, члены при p =s, q t =
и при p = =
t, q s (s; t – фиксированные индексы). Тогда такая па-
ра слагаемых представляет собой сумму st  t (s
+ )
ts  s  t . Но в силу
самосопряженности оператора ts = st , и, следовательно, рассмат-
риваемая пара слагаемых равна st ( t  +  s  ) = ts ( t  +   t ). В
s t s s
скобках стоит сумма комплексного числа и сопряженного ему ком-
плексного числа, т.е. скобка есть вещественное число. Итак, левая
часть равенства (23.9) - вещественное число. Теорема доказана.
Теорема 2. Собственные векторы самосопряженного операто-
ра, отвечающие различным собственным значениям, ортогональны
между собой.
= = =
Действительно, пусть Ax x, Ay y ( 6 ). Тогда Ax; y ( )=
( ) ( )= ( )
 x; y и x; Ay   x; y . Но оператор А самосопряженный, и,
( )=( )
следовательно, Ax; y ( )= ( )
x; Ay . Это означает, что   x; y   x; y
( ) ( )=0
или    x; y , откуда следует, что x; y ( )=0. Собственные
векторы ортогональны между собой.
Доказанные теоремы позволяют нам перейти к вопросу о канони-
ческом виде матрицы самосопряженного оператора и соответственно
каноническом виде квадратичной формы, полученном с помощью ор-
тогональных преобразований. К решению поставленного вопроса мы
перейдем в следующей лекции.

169
Л е к ц и я 24
Ортогонализация системы линейно-независимых
векторов. Основная теорема о диагональном виде
матрицы самосопряженного оператора и
каноническом виде квадратичной формы
Взаимно-однозначное соответствие между симметричными билиней-
ными формами и самосопряженными операторами в En , установлен-
ное в предыдущей лекции, позволяет решить один из наиболее важ-
ных для физических приложений вопросов о приведении ортогональ-
ными преобразованиями к главным осям симметрических матриц,
описывающих физические характеристики той или иной физической
системы (в механике и электродинамике сплошных сред).
Предварительно решим задачу о построении ортонормированного
базиса для линейной оболочки в En , натянутой на систему векторов
( )
ff1 ; f2 ; : : : ; fk g k  n , причем, не ограничивая общности рассужде-
ний, будем считать эти векторы линейно-независимыми (в противном
случае из системы векторов выделяем максимальное число линейно-
независимых и процесс ортогонализации будем осуществлять только
для них).
Рассмотрим вектор f1 , пронормируем его и обозначим g1 = f1
jf1 j .
Рассмотрим далее вектор f20 = +
1 g1 f2 c неизвестным коэффици-
ентом 1 и выберем его так, чтобы f20 был ортогонален к g1 , т.е.
( )=0
g1 ; f20 . Последнее равенство означает, что 1  1+(g1 ; f2 )=0 ,
откуда следует
1 = ( g1 ; f2 : )
f20
Пронормируем вектор f20 и обозначим g2 =
jf20 j . Затем строим вектор
= + +
f30 1 g1 2 g2 f3 c неизвестными коэффициентами 1 ; 2 , которые
определим из условий ортогональности f30 к g1 и к g2 :(
g1 ; f30 )=
1  1+( )=0 (
g1 ; f3 и g2 ; f30)= 1+( )=0
2  g2 ; f3 , т.е.

1 = (g1 ; f3 ); 2 = (g2 ; f3 ):
f0
Пронормируем вектор f30 и обозначим g3 = jf30 j .
Продолжая про-
3
цесс, мы построим систему единичных взаимно ортогональных век-
торов fg1 ; g2 ; : : : ; gk g, которую можно взять за базис рассматривае-
мой оболочки, так как система построенных векторов будет линейно-
независима. Последний факт нуждается в доказательстве. Действи-
тельно, составим линейную комбинацию векторов g1 ; : : : ; gk с произ-
вольными коэффициентами 1 ; : : : ; k и приравняем ее нулю

1 g1 + 2 g2 + : : : + k gk = 0 (24.1)

170
Умножая (24.1) скалярно на вектор g1 и учитывая ортогональность к
g1 векторов g2 ; : : : ; gk , получим   1=0 . Аналогично умножая (24.1)
скалярно на g2 ; : : : ; gk , получим 2 =0 ; 3 =0 =0
; : : : ; k , что и
доказывает линейную независимость построенных векторов.
Если нам необходимо перейти от ортонормированного базиса fi1 ;
: : : ; in g, относительно которого были заданы векторы f1 ; f2 ; : : : ; fk , к
другому ортонормированному базису в En , первыми векторами кото-
рого служили бы векторы g1 ; : : : gk , то поступаем следующим обра-
зом. Pn Pn
Пусть g1= 
m=1 1 Pn m =
mi ; : : : ; g
k m=1 k im . Ищем множество
m
всех таких векторов x = m=1  im , которые были бы ортогональ-
m
ны одновременно к g1 ; : : : ; gk . Для этого строим нормальную систему
линейных уравнений
Pn 9
(g1; x) = P m =1 1m  m = 0 >
>
(g2; x) = nm=1 2mm = 0 = (24.2)
: : : : : : : : : :P
::::::::::::::::: >
(gk ; x) = nm=1 kmm = 0 > ;

Тогда совокупность векторов x будет образовывать линейную обо-


лочку, натянутую на векторы нормальной фундаментальной системы
решений. Поскольку ранг матрицы системы уравнений (24.2) равен k
(
(векторы g1 ; : : : ; gk линейно-независимы), то имеем n k векторов )
нормальной фундаментальной системы решений. Для них применим
процесс ортогонализации и обозначим полученные единичные вза-
имноортогональные векторы через h1 ; h2 ; : : : ; hn k . Система векторов
fg1 ; : : : ; gk ; h1 ; : : : ; hn k g и будет служить новым ортонормированным
базисом в En . Ортогональная матрица перехода от базисаfi1 ; : : : ; in g
к базису fg1 ; : : : ; gk ; h1 ; : : : ; hn k g строится очень просто. Ее столбца-
ми служат матрицы-столбцы из координат векторов fg1 ; : : : ; gk ; h1 ;
: : : ; hn k g.
Пример. В E5 задана оболочка, натянутая на линейно-независимые
векторы
13
2
0
2 3
0
2 3
6 17 617 6 0 7
f1 = 6 0 7 ; f2 = 627 ; f3 = 6
6 7 6 7
6 1 7:
7
0
4 5
0
4 5 4 5
1
0 0 0
Построить ортонормированный базис fg1 ; g2 ; g3 g оболочки и перейти
к новому ортонормированному базису в E5 , первыми тремя вектора-
ми которого служили бы g1 ; g2 ; g3 .
Решение. Пронормируем f1 . Имеем jf1 j
p
2 p.
= 1 + ( 1) = 2
2
Тогда g1 p12 i1 i2 . Находим, что a1
= ( ) = ( )=
g1 ; f2 p12 ; f20 p12 g1
= +
171
f20
f2 = 12 i1 12 i2 + i2 + 2i3 = 21 i1 + 21 i2 + 2i3 . Поэтому g2 = jf20 j =
1
3p2 (i1 + i2 + 4i3 ). Далее находим, что
(g1 ; f3 ) = 0; 2 = (g2; f3) = 3p4 2 ;
1 =
4 1
f30 = p g2 + f3 = (2i1 + 2i2 + i3 ) i4 :
3 2 9
Поэтому g3 = 3p210 (i1 + i2 12 i3 + 92 i4 ).
Решаем систему линейных уравнений (24.2)
8
p12  1 p12  2 = 0
9
> >
>  1 = 2 c1
p1 2  1 + 3p1 2  2 + 3p4 2  3 = 0
=
=) >
<
 2 = 2 c1
2 1 3
2 2 1 3 9 4  3 =  4 = c1
3p10  + 3p10  3p10  = 0
>
3p10 
; >
:
 5 = c2
Векторы нормальной фундаментальной системы решений имеют вид
x1= 2 i1 i2 i3 i4 ; x2 i5 . Поэтому h1 p110 i1 i2 i3
2 + + = = ( 2 2 + +
) =
i4 ; h2 i5 .
Ортогональная матрица перехода от базиса fi1 ; : : : ; i5 g к базису
fg1 ; g2 ; g3 ; h1 ; h2 g имеет вид
p12 1 2 p210
2
3p1 2 3p210 03
6
6 p12 3p4 2 31p10 p210 0777
Q= 6
6 0 3p2 3p10 p110 077 (24.3)
p310 p110
6
4 0 0 05
0 0 0 0 1
Перейдем к формулировке и доказательству основной теоремы.
Теорема 1. У каждого самосопряженного оператора в En сущес-
твует n единичных взаимноортогональных собственных век-
торов. Матрица оператора относительно ортонормированного
базиса, построенного на указанных собственных векторах опе-
ратора, имеет диагональный вид
2 3
1
6 .. 7
6 . 7
6 7
6
6 1 7
7
6 7
6 ..
. 7; (24.4)
6 7
6
6 s 7
7
6 .. 7
4 . 5
s

172
где по диагонали стоят собственные значения оператора, повторенные
столько раз, какова их кратность в характеристическом уравнении.
Доказательство. Пусть 1 – собственное значение самосопряжен-
ного оператора А, заданного в некотором ортонормированном бази-
се fi1 ; : : : ; in g своей симметрической матрицей A =[ ]
pq . Рассмотрим
собственный вектор f1 (для этого достаточно взять первый вектор
из нормальной фундаментальной системы решений системы однород-
ных уравнений
n
X
( pq 1 qp ) q = 0
q=1
и пронормируем его. Получим единичный собственный вектор g1 =
f1 =
jf1 j , для которого Ag1 1 g1 . Pn
Рассмотрим далее Pмножество всех векторов x m=1 =
 m im ; ор-
тогональных к g1 = n
m=1 1 im . Для этого необходимо построить
m
векторы нормальной фундаментальной системы решений для систе-
мы уравнений состоящей лишь из одного уравнения
(g1 ; x) = 11 1 + 122 + : : : + 1n n = 0:
Таких векторов будет n 1. Применим к ним процесс ортогонали-
зации и получим (n 1) единичных взаимноортогональных векто-
ров fh2 ; h3 ; : : : ; hn g, каждый из которых также ортогонален и к век-
тору g1 . Очевидно, что искомые векторы x принадлежат к линей-
ной оболочке, натянутой на векторы fhg, а сама она представляет
(n 1) -мерное векторное пространство En 1 , ортогональное к g1 (т.
е. любой вектор из En 1 ортогонален к g1 ). Покажем, что векто-
ры En 1 под действием самосопряженного оператора A переходят в
векторы того же En 1 (другими словами, En 1 является инвариант-
ным подпространством для A). В самом деле, используя самосопря-
женность A, имеем Ax; g1( )=( x; Ag1 )=(x; 1 g1)= ( )=0
1 x; g1 ,
т.е. Ax 2 En 1 . От ортонормированного базиса fi1 ; : : : ; in g перей-
дем к ортонормированному
Pn =
базису fg1 ; h2 ; : : : ; hn g. Поскольку Ag1
1 g1 ; Ahs= ( =2 )
r=2 s hr s
r ; n , то матрица самосопряженного опе-
ратора в новом базисе имеет вид
2
1 02
::: 0 3
60
6
2 : : : n2 7 7
6: : : : : : : : : : : : 7 : (24.5)
4 5
::: ::: ::: :::
0 2n : : : nn
В силу вышесказанного матрица B = [ sr ] (r; s = 2; n) есть матри-
ца самосопряженного оператора A, действующего на векторах про-
странства En 1 . Затем весь рассмотренный нами процесс повторяем

173
уже для En 1 и матрицы B . А именно, находим корни характери-
стического уравнения det( B E )=0 , и если, например, 1 корень
уравнения det( A E )=0 1
кратности r1 > , то 1 непременно бу-
дет корнем уравнения det( B E )=0 , поскольку характеристиче-
ский полином оператора (вместе с ним и собственные значения) есть
инвариант преобразования базисов, а характеристический полином
матрицы (24.5)
Pn имеет ( )=(вид   1  ) det( )
B E . Из системы
(
уравнений s=2 s 1 s ) =0
r r s (если 1 – однократный корень урав-
нения det(A E )=0 , то в системе вместо 1 стоит другой корень
уравнения det( )=0
B E ) определяем собственный вектор f2 , нор-
мируем его и получим единичный собственный вектор Ag2 1 g2 , ( = )
ортогональный к единичному собственному вектору . Как и выше, в
En 1 строим подпространство En 2 , ортогональное к g2 (автоматиче-
ски и к g1 ), с ортонормированным базисом fh03 ; : : : ; h0n g. Перейдя от
базиса fg1 ; h2 ; : : : ; hn g к базисуfg1 ; g2 ; h03 ; : : : ; h0n g, мы получим следу-
ющий вид матрицы самосопряженного оператора в новом базисе:
2
10 0 ::: 0 3
6 0 1 0 ::: 0 7
60
6
0 33 : : : n3 7
7: (24.6)
4
: : : : :5
0 0 3n : : : nn
Заметим, что если 1 – однократное собственное значение, то в мат-
2 2
рице (24.6) на пересечении -й строки и -го столбца будет стоять не
1 , а другой корень характеристического уравнения A E det( )=0
Продолжая предложенный алгоритм построения ортогональных
друг другу единичных собственных векторов оператора, через n 2
шага мы придем к ортонормированному базису fg1 ; g2 ; : : : ; gn g, со-
стоящему из собственных векторов оператора A, в котором матрица
оператора примет вид (24.4).
Важнейшим следствием доказанной теоремы является тот факт,
что r-кратному собственному значению самосопряженного опе-
ратора соответствует r-мерное инвариантное подпространст-
во собственных векторов оператора, отвечающих данному соб-
ственному значению, в чем мы убедились, применяя конструктив-
ный метод доказательства основной теоремы.
Это следствие дает практический способ построения того ортонор-
мированного базиса, в котором матрица оператора имеет диагональ-
ный вид. Пусть f1 ; : : : ; fr1 -линейно-независимые собственные векто-
ры, отвечающие собственному значению 1 кратности r1 (для их на-
хождения достаточно построить векторы нормальной фундаменталь-
Pn
ной системы решений для однородной системы уравнений q=1 q
p
(
) =0
1 qp  q . Согласно следствию, будет r1 таких векторов). Далее,

174
проверим их ортогонализацию и получим r1 единичных взаимноорто-
гональных собственных векторов {g1 ; : : : ; gr1 g. Поскольку различным
собственным значениям отвечают ортогональные собственные векто-
ры, то достаточно проделать такую же процедуру с собственным зна-
чением 2 кратности r2 и т.д. В итоге мы имеем n единичных взаим-
;
но ортогональных собственных векторов fg1 ; : : : ; gr1 h1 ; : : : ; hr2 : : : ; ;
( + + + = )
k1 ; : : : ; krs g r1 r2 : : : rs n , служащих базисом, в котором
матрица оператора имеет диагональный вид (24.4).
Координаты собственных векторов fg1 ; : : : ; krs g, записанные в ви-
де столбцов, будут составлять ортогональную матрицу перехода от
первоначального ортонормированного базиса к каноническому орто-
нормированному базису.
Но заданной в ортонормированном базисе матрице самосопряжен-
ного оператора однозначно сопоставляется симметрическая билиней-
ная форма (квадратичная форма), причем матрицы оператора и фор-
мы при переходе в другой ортонормированный базис преобразуются
по одному и тому же закону. Поэтому теорему 1 можно записать в
следующей эквивалентной форме (она-то и играет в приложениях
главную роль).
Теорема 2. Любую квадратичную форму B x; x k=1 ik  
i k ( ) = Pn
( ik = )
ki ортогональными преобразованиями всегда можно
привести к следующему каноническому виду:
B (x; x) = 1 (1 )2 + : : : + 1 (r1 )2 + : : : + s (n )2 ; (24.7)
где 1 ; : : : ; s – корни характеристического уравнения   ( ) = det( ik
ik)=0 , встречающиеся столько раз, какова их кратность.
Пример. Привести ортогональными преобразованиями к канони-
ческому виду квадратичную форму: x1 x2 2 +2
x1 x3 x1 x4 x2 x3 2 2 +
2 +2
x2 x4 x3 x4 и найти матрицу перехода от данного базиса к канони-
ческому.
Решение. Найдем характеристический полином матрицы квад-
ратичной формы


1 1 1

det(A E ) = 11 1 1 11 = ( 1)3 ( + 3):

(24.8)


1 1 1 

Из (24.8) следует, что A имеет собственное значение 1 = 1 кратно-


сти 3 и однократное собственное значение 2 = 3: Согласно теореме
2 по формуле (24.7) имеем следующий канонический вид квадратич-
ной формы:
A x; x y12 y22 y32 y42 :
( )= + + 3(24.9)

175
Найдем ортогональное преобразование, осуществляющее приведе-
ние квадратичной формы к каноническому виду. С этой целью нам
необходимо указать четыре единичных взаимно ортогональных соб-
ственных вектора матрицы A. P4
При 1 =1
система уравнений q=1 pq 1 pq  q (
соответ- ) =0
ствующая данному примеру, выглядит так:
9
1 + 2 + 3 4 = 0 >
>
1 2 3 + 4 = 0 =
1 2 3 + 4 = 0 >
>
(24.10)
1 + 2 + 3 4 = 0 ;

Ранг матрицы системы равен 1 (уравнения 2; 3; 4 совпадают с пер-


вым). Поэтому

 1 = c2 + c3 c4 ;  2 = c2 ;  3 = c3 ;  4 = c4 :
Строим нормальную фундаментальную систему решений. Имеем
2 3 2 3 2 3
1 1 1
617 607 6 0 7
f1 = 6
405 ; f2 = 415 ; f3 = 4 0 5 :
7 6 7 6 7

0 0 1
Применяя процесс ортогонализации и нормировки, придем к следу-
ющим единичным взаимно ортогональным векторам:
2
p12 3
2
p16 3 2 1 3
p
21 3 7
6 p1 7 p16 7
2p1 3 7
6 6
g1 = 4 0 5 ; g2 =
6 27 6q 7
6 2 7 ; g3 = 6
6 p 7:
4 5
3 4 2p 3 5
0 0 2
3

При 2 = 3 система уравнений


4
X
( pq 2 pq ) q = 0
q=1

имеет ранг, равный трем, и нормальная фундаментальная система


решений состоит из одного вектора
2 3
1
6 17
f4 = 6
4 15 :
7

1
176
Нормируя собственный вектор f4 , получим единичный собственный
вектор, ортогональный к g1 ; g2 ; g3 ; так как 1 6 2 =
2 13
6
21 7
g4 = 64 21 7
5:
1 2
2
Таким образом, ортогональная матрица перехода от старого базиса к
каноническому имеет следующий вид:
2 13
p12 p16 1
21p3 21 7
6 p1 p16
Q=6
6 2 q 2p3 27
0 2 1 17
2pp3
6 7
4 3 25
0 0 3 1
2 2

177
Л е к ц и я 25
Приведение в En общего уравнения поверхности
второго порядка к каноническому виду.
Невырожденные центральные и нецентральные
поверхности. Цилиндры
В этой лекции мы вернемся к рассмотрению векторно-точечных про-
странств En . В предыдущих двух лекциях мы ограничились в основ-
ном рассмотрением векторных евклидовых пространств, поскольку
теория операторов затрагивает лишь векторную структуру простран-
ства.
Определение 1. Поверхностью второго порядка в En называется
геометрическое место точек М, прямоугольные координаты  1 :::  n ; ;
которых удовлетворяют уравнению вида
n
X n
X
i; i +2 'i  i + = 0; (25.1)
i;=1 i=1

где A = Pni;=1 i; i  – квадратичная форма от радиус-вектора


(x; x) P
x; '(x) = ni=1 'i  i – линейная форма от x, – постоянная, ранг
[ i ] 6= 0.
Нашей задачей является выбор в En новой прямоугольной декар-
товой системы координат, в которой поверхность второго порядка
описывалась бы наиболее простым уравнением, называемым кано-
ническим.
По каноническому уравнению легко изучать свойства этих поверх-
ностей.
Первый этап. Совершим ортогональное преобразование базиса,
оставляя начало координат на месте, и перейдем к базису, в кото-
( )
ром квадратичная форма A x; x принимает канонический вид. Пусть
ранг формы равен r и 1 ; : : : ; r - собствен- ные значения матрицы
=[ ]
A i , отличные от нуля (среди них совпадающие также зануме-
рованы). В результате получим новое уравнение поверхности

X n
1 (1 )2 + : : : + r (r )2 + 2 i i + = 0; (25.2)
i=1

которое может быть записано в следующем виде:


2
s2
r  n r
X X X
s  +
s s
+ p p + = 0: (25.3)
s 1 s p=r+1

s=1 s

178
Второй этап. Совершим  перенос начала координат в точку
; ;
O0  11 : : :  rr : : : ; 0; 0
s
0
= s + s (s = 1; r); p
0
= p (p = r + 1; n): (25.4)
s
После этого, уравнение поверхности примет следующий вид:
10 2
1 ( r0 2 r+10
) + : : : + r ( ) + 2 r+1 n0 + : : : + 2 n  + ~ = 0: (25.5)

Определение 2. Поверхность называется центральной, если в ее


уравнении (25.5) коэффициенты линейной формы r+1 ; : : : ; n равны
нулю, причем – невырожденной центральной, когда r n и вы- =
рожденной центральной, когда r < n. Если же хотя бы одно из
чисел p p ( = +1 )
r ; n oтлично от нуля, то поверхность называется
нецентральной.
Такое определение связано с тем, что точка O0 является единствен-
ным центром симметрии для поверхностей с уравнением
0 0
1 1 2 : : : r r 2 ;
( ) + + ( ) +~=0 (25.6)
0 0
поскольку отражения   !   не меняют вида данного уравнения.
Для нецентральных поверхностей продолжим процесс выбора но-
вой прямоугольной системы координат с целью дальнейшего упроще-
ния вида уравнения нецентральной поверхности (вместе с этим объ-
яснится и тот факт, почему поверхность названа нецентральной).
Третий этап.(Для нецентральных поверхностей). Начало коор-
динат O0 оставляем на месте и совершим следующее преобразование
(новые координаты обозначим буквой  ):
0 9
s = s (s = 1; r)0 0
>
>
>
 r+1 = P( r+1 r+1 + :0 : : + n n ) >
>
=
 r+2 = n r+2 p
p=r+1 qp  >
(25.7)
::: ::: P::: >
>
>
 n = np=r+1 qpn p0 >
;

!
= p
1 ;
r2=1 + : : : + n2
подобрав числа qpr+2 ; : : : ; qpn (p = r + 1; n) так, чтобы матрица преоб-
разования была ортогональной. Покажем, что это всегда может быть
осуществлено.
[]
Действительно, матрицы-столбцы  из новых координат и  0 []
из старых координат связаны с матрицей перехода T соотношением

179
[ ] = T 1[]0. Но для ортогональных преобразований T 1 = T tr , и
поэтому для (25.7) матрица tr T имеет вид
2 3
6
1 0 ::: 0 ..
. 0 0 ::: 0 7
6 7
6
6 0 1 ::: 0 ..
. 0 0 ::: 0 7
7
6 .. .. .. .. .. .. .. 7
6 . . . . . . . 7
6 7
6 7
6
6 0 0 ::: 1 ..
. 0 0 ::: 0 7
7
T tr = 6: : :
6 ::: ::: ::: ::: ::: ::: ::: ::: 7 7;
6 7
6
6 0 0 ::: 0 ..
. r+1 r+2 ::: n 7 7
6 7
6 0 0 ::: 0 .. +2 qr+2
qrr+1 ::: qn 7
r +2
6 . r+2 7
6 . .. .. .. .. .. .. 7
6 .. . . . . . . 7
4 5
0 0 0
:::
..
qrn+1 qrn+2 : : :
. qnn
(25.8)
r +2
где qp ; : : : ; qp (p = r + 1; n) – неизвестные пока элементы матрицы.
n
Очевидно, для того, чтобы матрица T была ортогональной, необ-
ходимо в En r найти (n r 1) единичных взаимно-ортогональных
векторов, ортогональных к вектору x0 с координатами r+1 ; : : : ; n ,
и их координаты подставить вместо qrr+1 +2 ; : : : ; qr+2 ; : : : ; qn ; : : : ; qn :.
n r+1 n
Для этого строим векторы нормальной фундаментальной системы
решений для системы уравнений, состоящей из одного уравнения
n
X
(x0; x) = ( p )p = 0:
p=r+1

Таких векторов будет n r ( 1)


штук. Затем для них проводим про-
цесс ортогонализации и нормировки. Тем самым, неизвестные числа
qpr+2 ; : : : ; qpn p r ; n будут определены, и ортогональное преоб-
( = +1 )
разование (25.7) принимает конкретный вид. После преобразования
(25.7) уравнение (25.5) поверхности перейдет в следующее:
2
1 ( 1 )2 + : : : + r ( r )2 +  r+1 + ~ = 0: (25.9)

Четвертый этап состоит в переносе начала координат

1
0
=  1; : : : ; r0 =  r ; r+10 =  r+1 + 2 ~ ; r+20 =  r+2; : : : ; n0 =  n ;
после которого каноническое уравнение нецентральной поверхности
примет окончательный вид
0 0 0
1  1 2 : : : r  r 2  r+1 ;
( ) + + ( ) =2 (25.10)

180
q
где = r2+1 + : : : + n2 :
Если в (25.10) r +1 = n, то нецентральная поверхность называется
невырожденной, если же r + 1 < n – то вырожденной.
Переходим к конкретной классификации невырожденных цент-
ральных и нецентральных поверхностей второго порядка, учитываю-
щей знаки собственных значений.
Невырожденные центральные поверхности.
Каноническое уравнение имеет вид (25.6), где r n. В зависи- =
~
мости от того, равен нулю свободный член или отличен от нуля,
все невырожденные центральные поверхности разбиваются на ти- 2
па. Рассмотрим каждый в отдельности.
~=0
(I) 6 . Поделим левую часть уравнения (25.6) на и переобо- ~
значим переменные так, чтобы сначала шли те, у которых коэффи-
циенты положительные, а затем, те у которых коэффициенты отри-
цательные. В результате получим для первого типа следующий вид
уравнения центральной поверхности:

x21 x2k x2k+1 x2n


a21
+ : : : + a2 a2k+1
:::
a2n
= 1: (25.11)
k
Имеем n различных классов невырожденных центральных по-
верхностей первого типа k =12
; ; : : : ; (при k =0
имеем мнимую по-
2
верхность -го порядка).
Ограничимся рассмотрением частных случаев n иn . При =2 =3
n=2 2
(на плоскости) имеем центральные кривые второго порядка

x21 x22
k=1: = 1 (гипербола);
a21 a22
x21 x22
k=2: + = 1 (эллипс):
a21 a22
При n = 3 (в пространстве) имеем 3 центральные поверхности 2-
го порядка

x21 x22 x23


k=1: = 1 (двуполостный гиперболоид);
a21 a22 a23
x21 x22 x23
k=2: + = 1 (однополостный гиперболоид);
a21 a22 a23
x21 x22 x23
k=3: + + = 1 (эллипсоид):
a21 a22 a23
Вид приведенных кривых и поверхностей подробно изучен нами в
аналитической геометрии, и на этих вопросах мы не останавливаемся.

181
(II) )~=0
. Нумеруя переменные так, чтобы сначала шли перемен-
ные с положительными коэффициентами, а затем с отрицательными,
мы получим уравнения для центральных невырожденных поверхно-
стей второго типа

x21 x2k x2k+1 x2n


a21
+ : : : + a2 a2k+1
:::
a2n
= 0: (25.12)
k

Такие поверхности относятся к коническим, так как наряду с точ-


( ; ; )
кой M x1 : : : xn этому уравнению удовлетворяют точки с коорди-
натами tx1 ; tx2 ; : : : ; txn при любом t 2 R, т.е. точки, лежащие на пря-
мой, проходящей через M и начало координат. Сколько различных
классов конических поверхностей описывает уравнение (25.12)? Что-
бы ответить на этот вопрос, заметим, что  достаточно менять лишь
0
в пределах от до n2 , так как при k > n2 , умножая уравнение (25.12)
на 1
, придем к уравнению, в котором положительных слагаемых
меньше n2 . Кроме того, при  =0имеем мнимую поверхность с од-
(0 0 0) 0
ной вещественной точкой ; ; : : : ; . Итак, <   n2 , при этом мы
должны учитывать, что  – целое число.
Опять таки ограничимся рассмотрением частных случаев n и =2
=3
n . Согласно нашим оценкам для  имеем лишь по одному классу
в каждом случае.   
x21 x22
При n =2: a21 =0
a22
x
или a11 x2
a2
x1
a1
x2
a2 + =0
(пара пересе-
кающих прямых).
x21 x22 x23
При n =3: a12 a22 a23 =0 (эллиптический конус с центральной
осью x1 ).
Невырожденные центральные поверхности.
Как и выше, поделив на  и перенумеровав переменные в (25.10),
получим уравнение вида

x21 x2k x2k+1 x2n 1


a21
+ : : : + a2k a2k+1
:::
a2n 1
= 2xn: (25.13)

Число различных классов поверхностей зависит от числа значений


принимаемых индексом k. Очевидно, что  k  n 2 1 , так как если
0
k > n 2 1 , то, умножая (25.13) на 1
и обозначая xn через x0n , мы
придем опять же к уравнению вида (25.13), в котором положительных
слагаемых (квадратичных) меньше n 2 1 .
Обратимся к конкретным случаям n иn =2
. При n имеем =3 =2
1 класс нецентральных кривых -го порядка: 2
x21
k=0: = 2x2 (парабола):
a21

182
При n = 3 ( = 0 = 1) имеем 2 класса нецентральных поверхно-
k ;k
стей второго порядка
x21 x22
k=0: = 2x3 (эллиптический параболоид);
a21 a22
x21 x22
k=1: = 2x3 (гиперболический параболоид):
a21 a22
Форма параболы и формы указанных поверхностей подробно изу-
чались нами в аналитической геометрии, и на их построении мы не
останавливаемся.
Сейчас остановимся на рассмотрении вырожденных централь-
ных и нецентральных поверхностей -го порядка. 2
Поскольку поверхность вырожденная, то в канонических уравне-
ниях (25.11), (25.12), (25.13) отсутствует хотя бы одна переменная,
например, переменная x1 . В этом случае все сечения рассматривае-
мой поверхности гиперплоскостями x1 =
const представляют собой
одну и ту же поверхность в пространстве En 1 . Это означает, что
каждая вырожденная поверхность образуется за счет поступательно-
го движения поверхности 2-го порядка, заданной в En 1 , вдоль оси x1 ,
перпендикулярной к En 1 . Следовательно, исследуемая поверхность
необходимо содержит прямолинейные образующие параллельные оси
x1 . Поэтому вырожденные поверхности второго порядка часто назы-
вают цилиндрическими.
Перейдем к конкретным частным случаям n =2
иn . =3
При n =2согласно (25.11) и (25.12) все центральные вырожден-
ные кривые описываются уравнением
x22
a22
= "; (25.14)

где "= 1; 1; 0.
При " = 1 вещественных геометрических образов не существует.
Когда " = 1, имеем пару параллельных прямых. При " = 0 – пару
слившихся прямых.
Согласно (25.13), когда n = 2, нецентральных вырожденных кри-
вых второго порядка не имеется.
Чтобы построить все цилиндрические поверхности в E3 , необходи-
мо подвергнуть поступательному движению вдоль оси x3 все кривые
2-го порядка, лежащие в плоскости x1 Ox2 .
Учитывая приведенную выше классификацию всех невырожден-
ных и вырожденных кривых второго порядка, получим следующие
вещественные цилиндрические поверхности второго порядка:
x21 x22
(1) +
a21 a22
= 1 (эллиптический цилиндр);

183
x21 x22
(2) a21 a22
= 1 (гиперболический цилиндр);
x21
(3) a21
= 2x2 (параболический цилиндр);
x21 x22
(4) a21 a22
= 0 (пара пересикающихся плоскостей);
x21
(5) a21
= 1 (пара параллельных плоскостей);
x21
(6) a21
= 0 (пара слившихся плоскостей):
В заключение проведем подробный разбор примера связанного с
приведением к каноническому виду общего уравнения кривой второго
порядка на плоскости.
Пример.Требуется привести к каноническому виду уравнение
кривой -го порядка x2
2 xy y2 x
3 + 10 + 3 y 2
и указать 14 13 = 0
соответствующее преобразование координат.
Решение.Найдем собственные значения матрицы квадратичной
формы

det(A E ) = 3 5  3 5  = 2 6 16 = 0;


1 = 8; 2 = 2:
Соответствующие им собственные векторы из-за 1 6= 2 ортого-
нальны между собой, и их остается только пронормировать. Имеем
" #
p12 p12
g1 = 1
p2 ; g 2 =

p12 :

Следовательно, после преобразования координат, индуцированно-


го переходом к базису с векторами g1 ; g2
(
x= p12 x0 p12 y 0
y= p12 x0 + p12 y 0 ;

мы придем к уравнению x0 2 y0 28( ) 2( ) 8p2x0 6p2y0 13 = 0. Его


можно преобразовать к следующему виду:
 2  2
8 x0 p1 0 3
2 y + p2 13 4 + 9 = 0:
2
184
После переноса начала координат: x0 = X + p12 ; y0 = Y p32 , получим
следующее уравнение:
8X 2 2Y 2 = 8;
которое в канонической записи примет вид

Y2
X2
4 = 1: (25.15)

Преобразование, связывающее координаты x; y и X; Y , легко уста-


навливается 
x = X cos 4 Y sin 4 + 2
y = X sin 4 + Y cos 4 1
Таким образом, в новой системе координат, которая получена из
старой поворотом на угол 4 (против часовой стрелки ) и переносом
начала координат в точку O0 (2; 1), мы имеем гиперболу (25.15) с
0
вещественной осью O X и асимптотами Y = 2
 X.
На этом мы закончим рассмотрение вещественных евклидовых
пространств и перейдем к изучению специальных комплексных ли-
нейных пространств, свойства которых очень близки к свойствам ве-
щественных собственно евклидовых пространств. Такие пространства
называются унитарными. Теория операторов в указанных простран-
ствах находит широкое приложение в квантовой механике.

185
Л е к ц и я 26
Эрмитовы и эрмитово-квадратичные формы в
комплексном линейном пространстве. Унитарное
n-мерное пространство. Унитарные операторы.
Эрмитовы операторы и их свойства
На протяжении данной лекции мы будем рассматривать комплексные
линейные пространства (K  C). Нашей целью является введение та-
ких комплексных линейных пространств, которые были бы близки по
своим свойствам к собственно евклидовым вещественным простран-
ствам. Евклидовы комплексные линейные пространства для этой це-
ли не годятся, так как для них скалярные произведение x; x может ( )
обращаться в нуль не только для нулевых векторов, в то время как
для собственно евклидовых вещественных пространств x; x > для ( ) 0
любого x 6 =0 ( )=0
и x; x тогда и только тогда, когда x . Чтобы =0
подойти к решению поставленной задачи, в линейном комплексном
пространстве мы будем помимо билинейных форм рассматривать эр-
митовы формы.
Ниже материал будет излагаться в соответствии со схемой

ЭФ СЭФ СЭКФ

ЭКФ

На этой схеме ЭФ – эрмитовые формы, СЭФ – симметрические эр-


митовые формы, СЭКФ – симметрические эрмитовые квадратичные
формы и ЭКФ – эрмитовые квадратичные формы.

( )
Определение 1. Числовая функция H x; y называется эрмитовой
формой, если для любых x; y; z 2 L и любого 2 выполнено C
9
(1) H (x + z; y) = H (x; y) + H (z; y) > >
(2) H ( x; y) = H (x; y) =
;
(3) H (x; y + z ) = H (x; y) + H (x; z ) >
>
(26.1)
(4) H (x; y) = H (x; y) ;

где – комплексно-сопряженное число по отношению к .


3
Очевидно, что первые условия из (26.1) совпадают с условиями
для билинейных форм, а четвертое условие для эрмитовых форм от-
личается от четвертого условия для билинейных форм (там B x; y ( )=
( )
B x; y ).

186
Из (26.1) тотчас следует (по индукции)
p q ! q
p X
X X X
H k xk ; m ym = k m (xk ; ym ) (26.2)
k=1 m=1 k=1 m=1
для любых xk ; ym 2 L и любых k ; m 2 C.
Пусть fe1 ; : : : ; en g – базис Ln и
n
X n
X
x=  k ek ; y=  m em :
k=1 m=1
Тогда, согласно (26.2), имеем
n
X n
X
H (x; y) = k m H (ek ; em) = hkm  k m ; (26.3)
k;m=1 k;m=1

где hkm – значения эрмитовой формы на векторах базиса, называемые


коэффициентами эрмитовой формы относительно данного базиса.
Из них можно построить по обычному правилу квадратную матрицу
=[ ]
H hkm , называемую матрицей эрмитовой Pn формы.
Если перейти к другому базису ek0 =
i=1 k0 ei с матрицей пере-
i
хода T =[ ]k0 , то
i

n
X n
X
hk0 m0 = H (ek0 ; em0 ) = ki0  jm0 H (ei; ej ) = hij ki0  jm0 (26.4)
i;j =1 i;j =1

В матричном представлении равенство (26.4) имеет вид


H 0 = T tr HT : (26.5)
В силу невырожденности матрицы перехода и очевидного равенства
det = det
T T из (26.5) следует, что ранг r матрицы эрмитовой
формы есть инвариант преобразования базисов. Если r n, то =
эрмитова форма называется невырожденной.
Для приложений нам необходимы не общие эрмитовы формы, а
симметричные эрмитовы формы.
Определение 2. Эрмитова форма называется симметричной, если
( )= ( )
H x; y H y; x .
Исходя из этого определения, мы получим, что
hkm = H (ek ; em ) = H (em ; ek ) = hmk ; (26.6)
и, следовательно, матрица всякой симметричной эрмитовой фор-
мы обладает свойством H H .
tr
=
187
Определение 3. Матрица, которая после операции транспонирова-
ния и замены элементов на комплексно-сопряженные переходит в се-
бя, называется эрмитовой матрицей.
Для сокращения записи обе проводимые операции обозначают сим-
" "
волом  , и поэтому эрмитова матрица может быть определена как
всякая матрица, обладающая 
 свойством A A . =
A= 1 1+i
Например, матрица
1 i 1 является эрмитовой, в чем
легко убедиться, если i заменить на i и заменить строки столбцами.
В силу (26.6) матрица симметричной эрмитовой формы необ-
ходимо эрмитова.
Обратно, если матрица эрмитовой формы эрмитова, то дан-
ная эрмитова форма является симметричной. В самом деле,
n
X n
X n
X
H (x; y) = hik i k = hki i i = hki k  i = H (y; x):
i;k=1 i;k=1 i;k=1

Таким образом, между эрмитовыми матрицами и симметрич-


ными эрмитовыми формами установлено взаимно-однозначное
соответствие.
Отметим, что в вещественном случае эрмитова форма переходит
в билинейную вещественную форму, симметричная эрмитова форма
– в симметричную билинейную форму, а эрмитова матрица – в сим-
метрическую матрицу. Эти факты автоматически следуют из (26.1),
(26.3), (26.6). Но в отличие от вещественного линейного простран-
ства в комплексном линейном пространстве можно определить вида 2
квадратичных форм – эрмитово-квадратичную форму и симмет-
ричную эрмитово-квадратичную форму.
Определение 4. Эрмитово-квадратичной формой в комплексном
пространстве L называется функция аргумента x 2 L, получаемая из
( )
эрмитовой формы H x; y заменой y на x.
Ее общий вид следует из (26.3)
n
X
H (x; x) = hkm  k  m : (26.7)
k;m=1

Определение 5. Симметричной эрмитово-квадратичной фор-


мой называется эрмитово-квадратичная форма, полученная на осно-
ве симметричной эрмитовой формы.
Ее общий вид дается формулой (26.7), но с условием – матрица
H =[ ]
hkm должна быть эрмитовой. Учитывая взаимно-однозначное

188
соответствие между эрмитовыми матрицами и симметричными эрми-
товыми формами, мы можем заключить, что между симметричны-
ми эрмитово-квадратичными формами и эрмитовыми матри-
цами также существует взаимно-однозначное соответствие.
Для приложений основную роль играют симметричные эрмитово-
квадратичные формы, поскольку по своим свойствам они близки к
квадратичным формам в вещественном пространстве L. Поэтому в
( )
дальнейшем под символом H x; x понимается только симметричная
эрмитово-квадратичная форма.
Первое свойство, которое мы сразу же отметим, заключается в
том, что симметричная эрмитово-квадратичная форма прини-
мает только вещественные значения, поскольку из равенства
( )= ( )
H x; y H y; x тотчас следует
H (x; x) = H (x; x): (26.8)

Для симметричных эрмитово-квадратичных форм имеют место


теоремы, аналогичные теоремам, доказанным для квадратичных форм
в вещественном линейном пространстве.
Теорема 1. В комплексном пространстве Ln существует ба-
зис, в котором симметричная эрмитово-квадратичная форма
имеет канонический вид
n
X 0
H (x; x) = k j k j2 (26.9)
k=1

где k – вещественные числа, среди которых r чисел отлично


=
от нуля (r ранг H ).
Доказательство этой теоремы совпадает почти дословно с доказа-
тельством теоремы о приведении вещественной квадратичной формы
к каноническому виду методом Лагранжа (необходимо только учи-
тывать эрмитовость матрицы H =[ ]
hkm , у которой из-за условия
= =
hkm hmk диагональные элементы (k m) необходимо веществен-
ные числа).
В самом деле, симметричную эрмитово-квадратичную форму мож-
но всегда представить в виде (считаем, не ограничивая общности рас-
суждений, что h11 6 ) =0
H (x; x) =
1 [a11 1 + (a12 ib12 ) 2 + : : : + (a1n ib1n ) n ]
a11
n
[a11  1 + (a12 + ib12 ) 2 + : : : + (a1n ib1n ) n ] +
X
h0km  k  m ;
k;m=2

189
где a11 = h11 – вещественное число, a12 + ib12 = h12 ; a13 + ib13 =
h13 ; : : : ; a1n + ib1n = h1n .
В качестве первого шага совершаем преобразование координат
 0
 10 = a11  1 + (a12 ib12 ) 2 + : : : + (a1n ib1n ) n
 p =  p (p = 2; n);
после которого форма H (x; x) записывается следующим образом:

H (x; x) =
1 0 0
1 1 +
n
X 0
h0km  k  m :
0
(26.10)
a 11 k;m=2

Pn 0 m0
Применяя данный алгоритм к форме k;m=2 h0km  k  , через конеч-
ное число шагов придем к каноническому виду (26.9).

Теорема 2. Число s положительных коэффициентов и число


r s отрицательных коэффициентов в наборе 1 ; : : : ; n из (26.9)
не зависит от выбора канонического базиса.

Доказательство теоремы полностью повторяет доказательство тео-


ремы инерции квадратичных форм в вещественном случае.

Определение 6. Симметричная эрмитово-квадратичная форма на-


зывается положительно определенной, если H x; x > для любого ( ) 0
=0
x6 .
Из канонического вида (26.9) и теоремы 2 вытекает, что симмет-
ричная эрмитово-квадратичная форма положительно определе-
= =
на тогда и только тогда, когда s r n. Таким образом, поло-
жительно определенная симметричная эрмитово-квадратичная
форма всегда является невырожденной формой.
Заметим, что детерминант любой эрмитовой матрицы есть веще-
tr
ственное число, поскольку из равенства A A следует, что = A det =
detA tr
= det
A. Из закона преобразования (26.5) для эрмитовой мат-
рицы имеем
det H 0 = j det T j2 det H:
Поскольку det det
H и H 0 – вещественные числа, то знак детерми-
нанта матрицы симметричной эрмитово-квадратичной формы
есть инвариант преобразования базисов. Вследствие этого факта,
мы можем доказать критерий Сильвестра для положительно опре-
деленных симметричных эрмитово-квадратичных форм, повторяя из
слова в слово доказательство критерия Сильвестра в случае веще-
( )
ственных квадратичных форм: форма H x; x положительно опре-

190
делена тогда и только тогда, когда все главные миноры её мат-
рицы
h11 h12 ::: h1n

h11 ; hh11 h12 ; : : : ; h12 h22 ::: h2n :

12 h22 ::: ::: ::: : : :

h1n h2n ::: hnn
строго положительны.
Для положительно определенной формы H x; x канонический вид( )
(26.9) упрощается, поскольку все k >
p 0
0( =1 )
k ; n . За счет преобра-
зования  k = ( )
k  H x; x примет окончательный канонический
k
вид
n
X n
X
H (x; x) = j j2 =
k ik  i  k ; (26.11)
k=1 i;k=1
т.е. в каноническом базисе матрица положительно определен-
ной симметричной эрмитово-квадратичной формы совпадает с
единичной матрицей.
Сейчас мы можем перейти к определению унитарного простран-
ства, которое является обобщением собственно евклидова простран-
ства на случай линейных комплексных пространств.
На первый взгляд кажется естественным в качестве скалярно-
го произведения векторов с комплексными P координатами  1 ; : : : ;  n
и  1 ; : : : ;  n взять обычное выражение
n
k=1   . В определенных
k k
случаях так и поступают. Пространство, которое при этом получает-
ся, называется комплексным евклидовым пространством. Оно в
этом случае, как уже выше указывалось, теряет ряд свойств, и среди
( ) 0
них важнейшее свойство x; x > для любого x 6 . По этой при- =0
чине комплексное евклидово пространство по своим свойствам отсто-
ит очень далеко от вещественных евклидовых пространств, изучен-
ных нами в предыдущих лекциях. Поэтому в комплексном линейном
пространстве необходимо так ввести операцию скалярного произве-
( ) 0
дения, чтобы свойство x; x > (для любого x 6 ) сохранилось в =0
данном случае.
Но таким свойством, как нами установлено, обладает симметрич-
ная положительно определенная эрмитово-квадратичная форма. В
связи с этим мы примем следующее определение.

Определение 7. Комплексное линейное пространство L называется


унитарным, если в L зафиксирована некоторая симметричная эрми-
това форма такая, что соответствующая ей симметричная эрмитово-
квадратичная форма является положительно определенной. При этом
данная симметричная эрмитова форма называется скалярным про-
изведением векторов x; y и обозначается символом x; y . ( )
191
Учитывая свойства симметричных эрмитовых форм, мы получим,
что скалярное произведение обладает следующими свойствами:

(а) (x; y) = (y; x); (б) (x; y + z) = (x; y) + (x; z);


(в) (x; y) = (x; y); (г) (x; x) > 0 (8x 6= 0): (26.12)

Если в унитарном пространстве выбран общий базис fe1 ; : : : ; en g,


то 0 1
n
X n
X
(x; y) = hkm  k m @ hkm  k  m > 0A : (26.13)
k;m=1 k;m=1
Длиной вектора
p x, как и в вещественном случае, назовем величи-
ну jxj = ( )
x; x . Вектор, длина которого равна единице, называ-
ется нормированным (или единичным). Очевидно, каждый вектор
=0
x 6 в унитарном пространстве можно нормировать, умножая его на
 jx1j x0 jxxj .
= : =
Определение 8. Говорят, что вектор x ортогонален к y , если (x; y) =
0.
По свойству (26.12) в этом случае и (y; x) = 0, т.е. y также орто-
гонален к x.
Теорема 3. В любом n-мерном унитарном пространстве суще-
ствует ортонормированный базис.
Действительно, согласно (26.11) для положительно определенной
симметричной эрмитово-квадратичной формы x; x существует та-
Pn
( )
кой канонический базис fi1 ; : : : ; in g, в котором x; x ( )=
k m
k;m=1 km   ,
где km =( )
ik ; im . Поэтому симметричная эрмитова форма x; y в ( )
этом базисе fi1 ; : : : ; in g будет иметь вид
n
X n
X
(x; y) = km k m = k k ; (26.14)
k;m=1 k=1

где (ik ; im ) = km = 10;; k=m
k 6= m . Теорема доказана.
Отметим, что процесс ортогонализации системы векторов в уни-
тарном пространстве полностью повторяется, как и в вещественном
случае.
Определение 9. Линейное преобразование в n-мерном унитарном
пространстве, соответствующее переходу от одного ортонормирован-
ного базиса к другому ортонормированному базису, называется уни-
тарным преобразованием.

192
Если fi1 ; : : : ; in g и fi10 ; : : : ; in0 g – ортонормированные базисы в
унитарном пространстве с матрицей перехода U um
k0 =[ ]
n
X
ik 0 = um
k0 im ;
m=1
то в силу единичности и ортогональности векторов fi10 ; : : : ; in0 g имеем
Xn Xn
=(
km ik0 ; im0 )=(uk0 ip ; uqm0 iq
p
)=
p=1 q=1
Xn Xn Xn
= p q
(
uk0 um0 ip ; iq )= p q
uk0 um0 pq =
upk0 upm0 (26.15)
p;q=1 p;q=1 p=1

Равенство (26.15), если ввести в рассмотрение транспонированную


0
матрицу U
tr
=[ ]
um
k , может быть записано в виде
U  U = E: (26.16)
Всякая матрица U , удовлетворяющая условию (26.16), называется
унитарной.
Таким образом, в унитарном пространстве переход от одно-
го ортонормированного базиса к другому ортонормированному
базису совершается всегда с помощью унитарной матрицы пе-
рехода.
Обратно, если задана унитарная матрица U
2
um
k0 , то в силу =[ ]
(26.16) она невырожденная (P j n Uj det =1
), и может служить мат-
рицей перехода. Пусть ek0 =
m=1 uk0 im – векторы нового базиса.
m
Очевидно, что с учетом 26.16 имеем
!
Xn Xn Xn
(ek0 ; em0 ) = uk0 ip ; uqm0 iq
p
= upk0 upm0 = km:
p=1 q=1 p=1

Новый базис fe10 ; : : : ; en0 g – ортонормированный базис.


Другими словами, между вращениями базиса в унитарном про-
странстве и унитарными матрицами установлено взаимно-од-
нозначное соответствие.
Легко заметить, что унитарные матрицы обобщают понятие ор-
тогональных матриц в вещественном пространстве En . Из условия
(26.16) тотчас следует эквивалентное равенство
U  = U 1; (26.17)
которое часто принимают за новое определение унитарной матри-
цы.

193
Унитарный оператор, как и изометрический в En , сохраняет ска-
лярное произведение векторов в унитарном пространстве. В самом
деле, согласно определению унитарного преобразования, имеем:
n
X n
X
(Ux; Uy) = k m (Uik ; Uim ) =  k m (fk ; fm );
k;m=1 k;m=1

(
где fk ; fm )=
km , поскольку унитарное преобразование переводит
ортонормированный базис в ортнормированный. Таким образом,
n
X n
X
(Ux; Uy) = k m  km =  k k = (x; y):
k;m=1 k=1

Поэтому унитарный оператор называют также изометрическим.


Определение 10. Самосопряженный оператор A, действующий в
унитарном пространстве, называется эрмитовым оператором.
Какова матрица самосопряженного оператора в ортонормирован-
ном базисе? Согласно определению самосопряженности ( Ax; y ( )=
(
P )
x; Ay для любых векторов x и y),Pучитывая, что Aik ; im ( ) =
n
(
s=1 k is ; im
s m)=
k и i k ; Ai m
n
( s )=
s=1 m ik ; is km , имеем ( )=
m
k = km . Итак, в ортонормированном базисе матрица самосо-
пряженного оператора является эрмитовой матрицей.
Обратно, если оператор A в ортонормированном базисе име-
ет эрмитову матрицу, то он необходимо самосопряженный
оператор. В самом деле,
! !
n
X n
X n
X n
X
(Ax; y) = ki  i k = ik k  i =
k=1 i=1 i=1 k=1
!
n
X n
X
= ik k  i = (Ay; x) = (x; Ay):
i=1 k=1
Таким образом, между эрмитовыми операторами и эрмитовыми
матрицами существует взаимно-однозначное соответствие.
Этим свойством и объясняется термин "эрмитов оператор" для
самосопряженного оператора в унитарном пространстве.
В то же время существует взаимно-однозначное соответствие меж-
ду эрмитовыми матрицами и симметричными эрмитовыми формами
(эквивалентно, симметричными эрмитово-квадратичными формами).
Поэтому между эрмитовыми операторами и соответствующими сим-
метричными эрмитовыми формами также может быть установлено
взаимно-однозначное соответствие.

194
Действительно, пусть fi1 ; : : : ; in g – ортонормированный
Pn базис в
унитарном пространстве. Пусть H x; y ( )= m
k;m=1 hkm   – симмет-
k
ричная эрмитова форма (hkm =
hmk ). Построим матрицу A km , =[ ]
= =
положив km hmk (т.е. A H tr ). Из-за условия hkm hmk матрица =
A эрмитова, и она соответствует эрмитову оператору A. Подсчиты-
( )
ваем далее x; Ay и устанавливаем следующую связь оператора и
( )
формы H x; y :
! !
n
X n
X n
X n
X
(x; Ay) = k km m = m
k
k m =
k=1 m=1 m=1 k=1
n
X
= hkm  k m = H (x; y): (26.18)
k;m=1

Эрмитовы операторы, как и симметричные операторы в веществен-


ном En , обладают рядом замечательных свойств.

Теорема 4. Собственные значения эрмитова оператора – веще-


ственные числа.

В самом деле, если 0 – собственное значение эрмитова опера-


тора A и x – соответствующий собственный вектор оператора, то
(Ax; x)=( 0 x; x )= ( ) ( )=(
0 x; x и x; Ax x; 0 x 0 x; x . В силу )= ( )
самосопряженности 0 x; x( )= ( )
0 x; x , откуда следует, что 0 0 . =
Теорема доказана.

Теорема 5. Собственные векторы эрмитова оператора, при-


надлежащие различным собственным значениям, ортогональ-
ны между собой.

Действительно, из равенств Ax; y ( )= ( ) (


 x; y , x; Ay  x; y )= ( )=
( ) (
 x; y вытекает, что   x; y )( ) = 0 =
. При  6  следует утверждение
теоремы.
Поскольку метод ортогонализации системы векторов и их норми-
ровки в унитарном пространстве полностью совпадает с аналогичным
методом в En , то имеет место

Теорема 6. В унитарном пространстве для каждого эрмито-


ва оператора существует канонический ортонормированный ба-
зис, построенный из единичных взаимно-ортогональных собствен-
ных векторов оператора, относительно которого матрица опе-
ратора имеет диагональный вид

195
2 3
1
6 .. 7
6 . 7
6 7
6
6 1 7
7
6 7
6 ..
. 7; (26.19)
6 7
6
6 s 7
7
6 .. 7
4 . 5
s
где 1 ; : : : ; s – собственные значения эрмитова оператора, взя-
тые столько раз, какова их кратность в характеристическом
уравнении.
Учитывая, что матрица A эрмитова оператора связана с матрицей
симметричной эрмитовой формы (симметричной эрмитово-квадратич-
=
ной формы) сооношением A H tr , то из закона (26.5) преобразования
=
матрицы эрмитовой формы следует H 0tr T  H tr T , а переход от од-
ного ортонормированного базиса к другому совершается с помощью
унитарной матрицы T = U , для которой U  U 1 , мы можем на
=
основании (26.19) сформулировать следующий результат.
Теорема 7. Для всякой эрмитовой матрицы A существует та-
кая унитарная матрица U , что матрица U 1 AU имеет веще-
ственный диагональный вид.
На этом мы закончим изучение унитарных пространств и свойств
эрмитовых и унитарных операторов, многие из которых переносятся
на бесконечномерные линейные пространства и находят свое прило-
жение в квантовой механике.

196
Список литературы
[1] Александров П.С. Курс аналитической геометрии и линей-
ной алгебры. - М.: Наука, 1979
[2] Беклемишев Д.В. Курс аналитической геометрии и линейной
алгебры. - М.: Наука, 1976
[3] Ефимов Н.В. Краткий курс аналитической геометрии. - М.:
Наука, 1975
[4] Ильин В.А., Позняк Э.Г. Линейная алгебра. - М.: Наука, 1978
[5] Клетеник Д.В. Сборник задач по аналитической геометрии.
- М.: Наука, 1975
[6] Мальцев А.И. Основы линейной алгебры. - М.: Наука, 1975
[7] Проскуряков И.В. Сборник задач по линейной алгебре. - М.:
Наука, 1978
[8] Цубербиллер О.Н. Задачи и упражнения по аналитической
геометрии. - М.: Наука, 1970
[9] Шилов Г.Е. Конечномерные линейные пространства. - М.: На-
ука, 1969

197
Содержание
Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1 Лекция1
Терминология, определения и задачи теории систем
линейных уравнений. Детерминант (определитель) квад-
ратной матрицы . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Лекция2
Свойства определителей. Алгебраическое дополнение
и минор элемента определителя . . . . . . . . . . . . . . 11

3 Лекция3
Правило Крамера. Ранг матрицы.
Теорема о базисном миноре . . . . . . . . . . . . . . . . . 17

4 Лекция4
Теорема Кронекера-Капелли. Условия нетривиальной
совместности однородной системы. Общее решение
системы. Фундаментальная система решений . . . . . 23

5 Лекция5
Векторы. Сложение векторов. Умножение вектора на
число. Линейная зависимость векторов в трехмерном
пространстве . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

6 Лекция6
Базис и аффинные координаты. Проекция вектора
на ось. Прямоугольная система координат. Полярная
система координат на плоскости . . . . . . . . . . . . . . 40

7 Лекция7
Скалярное произведение векторов и его приложения.
Векторное произведение векторов и его приложения 46

8 Лекция8
Cмешанное произведение векторов. Двойное вектор-
ное произведение. Преобразование прямоугольной си-
стемы координат на плоскости и в пространстве . . . 54

9 Лекция9
Простейшие задачи аналитической геометрии на плос-
кости. Линии на плоскости и их уравнения. Канони-
ческое и общее уравнение прямой на плоскости . . . 61

198
10 Л е к ц и я 10
Различные виды уравнений прямой на плоскости и
их геометрические приложения. Расстояние от точки
до прямой. Взаимное расположение двух прямых на
плоскости. Уравнение пучка прямых . . . . . . . . . . . 68

11 Л е к ц и я 11
Приведение общего уравнения кривой второго поряд-
ка к каноническому Виду. Эллипс, его форма и гео-
метрические свойства . . . . . . . . . . . . . . . . . . . . . 75

12 Л е к ц и я 12
Гипербола, ее свойства и форма. Парабола, ее свой-
ства и форма. Полярное уравнение эллипса, гипер-
болы и параболы. Условия касания прямой и кривой
второго порядка . . . . . . . . . . . . . . . . . . . . . . . . . 82

13 Л е к ц и я 13
Простейшие задачи аналитической геометрии в про-
странстве. Уравнение поверхности и уравнение ли-
нии в пространстве. Различные виды уравнения плос-
кости в пространстве . . . . . . . . . . . . . . . . . . . . . 89

14 Л е к ц и я 14
Прямая в пространстве. Взаимное расположение пря-
мой и плоскости в пространстве. Исследование фор-
мы поверхностей второго порядка по каноническим
уравнениям . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

15 Л е к ц и я 15
Определение линейного пространства. Линейная за-
висимость векторов. Базис и размерность . . . . . . . 109

16 Л е к ц и я 16
Подпространства и линейные оболочки. Теорема о
Пополнении базиса. Пересечение и сумма подпространств.
Пространство решений однородной системы уравне-
ний как подпространство пространства матриц-столбцов115

17 Л е к ц и я 17
Линейные отображения и их матричное представле-
ние. Действия над операторами и матрицами . . . . . 121

199
18 Л е к ц и я 18
Композиция отображений и умножение матриц. Об-
ратный оператор и обратная матрица. Образ и ядро
линейного отображения . . . . . . . . . . . . . . . . . . . 127

19 Л е к ц и я 19
Собственные значения и собственные векторы опера-
тора. Переход к новому базису. Инварианты оператора133

20 Л е к ц и я 20
Линейные формы и сопряженное линейное простран-
ство. Билинейные формы. Преобразование матрицы
билинейной формы при изменении базиса и ее инва-
рианты. Симметричные и антисимметричные били-
нейные формы . . . . . . . . . . . . . . . . . . . . . . . . . 143

21 Л е к ц и я 21
Квадратичные формы. Приведение квадратичной фор-
мы к каноническому виду методом Лагранжа. Теоре-
ма инерции квадратичных форм. Положительно опре-
деленные квадратичные формы . . . . . . . . . . . . . . 149

22 Л е к ц и я 22
Линейные векторно-точечные (аффинные) простран-
ства. Преобразование аффинной системы координат.
Собственно евклидовы и псевдоевклидовы простран-
ства. Преобразование прямоугольной системы коор-
динат . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

23 Л е к ц и я 23
Изометрический оператор. Самосопряженный (сим-
метрический) оператор и его матрица. Связь симметри-
ческой билинейной формы с соответствующим ей са-
мосопряженным оператором . . . . . . . . . . . . . . . . 165

24 Л е к ц и я 24
Ортогонализация системы линейно-независимых век-
торов. Основная теорема о диагональном виде матри-
цы самосопряженного оператора и каноническом ви-
де квадратичной формы . . . . . . . . . . . . . . . . . . . 171

200
25 Л е к ц и я 25
Приведение в En общего уравнения поверхности вто-
рого порядка к каноническому виду. Невырожденные
центральные и нецентральные поверхности. Цилиндры179

26 Л е к ц и я 26
Эрмитовы и эрмитово-квадратичные формы в ком-
плексном линейном пространстве. Унитарное n-мерное
пространство. Унитарные операторы. Эрмитовы опе-
раторы и их свойства . . . . . . . . . . . . . . . . . . . . . 187

201