Вы находитесь на странице: 1из 21

Второй семестр

1. Линейное пространство над произвольным полем (аксиомы линейного пространства, базис и


размерность).
Аксиомы линейного пространства:
1) 𝑎 + 𝑏 = 𝑏 + 𝑎
2) (𝑎 + 𝑏) + 𝑐 = 𝑎 + (𝑏 + 𝑐)
3) Существует нейтральный элемент 𝜃 ∈ 𝑉: 𝑎 + 𝜃 = 𝜃 + 𝑎 = 𝑎
4) ∀𝑎 ∈ 𝑉 ∃ элемент −𝑎 ∈ 𝑉 ∶ 𝑎 + (−𝑎) = (−𝑎) + 𝑎 = 𝜃
5) 1 ∙ 𝑎 = 𝑎
6) 𝛼(𝛽 ∙ 𝑎) = (𝛼 ∙ 𝛽)𝑎
7) (𝛼 + 𝛽)𝑎 = 𝛼𝑎 + 𝛽𝑎
8) 𝛼(𝑎 + 𝑏) = 𝛼𝑎 + 𝛼𝑏
Базис и размерность:
Система векторов 𝑒1 , …, 𝑒𝑛 порождает пространство 𝑉, если любой вектор 𝑥 из пространства 𝑉 является
линейной комбинацией векторов 𝑒1 , …, 𝑒𝑛 .
Упорядоченная система векторов 𝑒1 , …, 𝑒𝑛 линейного пространства 𝑉 называется базисом в 𝑉, если она
линейно независима и порождает пространство 𝑉.
Базисом линейного пространства называется упорядоченная линейно независимая система векторов
пространства, через которую линейно выражается любой вектор пространства.
Теорема. Любые два базиса линейного пространства состоят из одинакового числа векторов.
Число векторов базиса пространства называется размерностью пространства. Обозначение dim 𝑉.
Размерность пространства совпадает с максимальным числом линейно независимых векторов данного
пространства.
Теорема о неполном базисе. Пусть dim 𝑉 = 𝑛, в 𝑛-мерном пространстве любую независимую систему из 𝑘
векторов (𝑘 < 𝑛) можно дополнить до базиса.
Разложение вектора по базису единственно, – теорема коэффициенты в этом разложении называются
координатами этого вектора.
𝑥 = 𝑥1 𝑒1 +. . . +𝑥𝑛 𝑒𝑛
𝑥1
𝑥 = [𝑥1 … 𝑥𝑛 ] = [ … ]
𝑥𝑛
𝑒 = (𝑒1 … 𝑒𝑛 )
𝑥 = 𝑒𝑥𝑒
Теорема. Координаты вектора обладают свойством линейности: при сложении векторов их координаты в
одном базисе складываются, а при умножении этого вектора на числа, они умножаются на число.

2. Изменение координат вектора при переходе к новому базису.


𝑒 = (𝑒1 … 𝑒𝑛 ) и 𝑓 = (𝑓1 … 𝑓𝑛 ) – базисы 𝑛-мерного пространства 𝑉.
Выражаются по следующим формулам:
𝑓1 = 𝑐11 𝑒1 + 𝑐21 𝑒2 + ⋯ + 𝑐𝑛1 𝑒𝑛
{ 𝑓2⋯=⋯𝑐12 𝑒1 + 𝑐22 𝑒2 + ⋯ + 𝑐𝑛2 𝑒𝑛 (1)
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
𝑓𝑛 = 𝑐1𝑛 𝑒1 + 𝑐2𝑛 𝑒2 + ⋯ + 𝑐𝑛𝑛 𝑒𝑛
Коэффициенты C =(𝑒𝑖𝑗 ) образуют матрицу перехода от базиса 𝑒 в базис 𝑓. ⟹ 𝑓 = 𝑒𝐶 (2)
𝑒→𝑓
Теорема 1. Матрица перехода к другому базису невырожденная (det 𝐴 ≠ 𝒱).
Теорема 2. Если 𝐶 – это матрица перехода от 𝑒 к 𝑓, то 𝐶 −1 – это матрица перехода от 𝑓 к 𝑒.
Теорема 3. Координаты вектора 𝑥 в базисах 𝑒 и 𝑓 связаны между собой соотношением 𝑥𝑒 = 𝐶𝑥𝑓 (3)
Базис стандартный.
𝑒1 = (1, 0, … , 0) 𝑓1 = (𝑖, 0, … , 0)
𝑒2 = (0, 1, … , 0) } ∈ 𝑅 𝑛 𝑓2 = (0, 𝑖, … , 0)} 2𝑛 – в комплексном пространстве необходимо для
⋯⋯⋯⋯⋯⋯ ⋯⋯⋯⋯⋯⋯
𝑒𝑛 = (0, 0, … , 1) 𝑓𝑛 = (0, 0, … , 𝑖)
образования базиса.
𝑛
𝑎 = (𝛼1 + 𝑖𝛽1 , 𝛼2 + 𝑖𝛽2 , … , 𝛼𝑛 + 𝑖𝛽𝑛 ) ∈ 𝐶
3. Сумма и пересечение подпространств. Прямая сумма подпространств.
Сумма и пересечение подпространств:
Пусть 𝐿1 , 𝐿2 , …, 𝐿𝑘 линейные подпространства линейного пространства 𝑉.
Суммой подпространств 𝐿1 , 𝐿2 , …, 𝐿𝑘 называется множество всевозможных векторов 𝑥 представимых в
виде 𝑥 = 𝑥1 + 𝑥2 +. . . +𝑥𝑘 ∶ 𝑥𝑖 ∈ 𝐿𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑘 :
𝑘

∑ 𝐿𝑖 = {𝑥 = 𝑥1 + 𝑥2 +. . . +𝑥𝑘 ∶ 𝑥𝑖 ∈ 𝐿𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑘 }
𝑖=1
Представление вектора 𝑥 в виде данной суммы пересечением
𝑘

⋂ 𝐿𝑖 = 𝐿1 ∩ 𝐿2 ∩ … ∩ 𝐿𝑘 = {𝑥 ∈ 𝑉 ∶ 𝑥𝑖 ∈ 𝐿𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑘 }
𝑖=1
Замечание. Пересечение подпространств всегда содержит нулевой вектор пространства.
Теорема 1.1. Сумма и пересечение подпространств линейного пространства 𝑉 является линейными
подпространствами пространства 𝑉.
Теорема 1.2. Сумма линейных подпространств есть линейная оболочка совокупности базисов слагаемых
подпространств.
Следствие. Размерность суммы линейных подпространств равна рангу совокупности слагаемых
подпространств.
𝑘

dim ∑ 𝐿𝑖 = rg(𝑒1 , … , 𝑒𝑚 , … , 𝑓1 , … , 𝑓𝑠 , … , 𝑔1 , … , 𝑔𝑡 )
𝑖=1
Теорема 1.3. Для любых двух линейных подпространств 𝐿1 и 𝐿2 линейного пространства 𝑉 имеет место
соотношение
dim(𝐿1 + 𝐿2 ) = dim 𝐿1 + dim 𝐿2 − dim(𝐿1 ∩ 𝐿2 ).
Прямая сумма подпространств:
Сумма подпространств линейного пространства называется прямой сумой, если разложение каждого
вектора в ней по слагаемым подпространствам единственно.
𝐿1 ⨁𝐿2 ⨁ … ⨁𝐿𝑘
Теорема 2.1. (критерий прямой суммы)
Для подпространств 𝐿1 , …, 𝐿𝑘 конечного линейного пространства 𝑉 следующие утверждения равносильны:
1) Сумма подпространств 𝐿1 , …, 𝐿𝑘 – прямая
2) Совокупность базисов подпространств 𝐿1 , …, 𝐿𝑘 линейно независима
3) Совокупность базисов подпространств 𝐿1 , …, 𝐿𝑘 образует базис суммы ∑𝑘𝑖=1 𝐿𝑖
4) dim ∑𝑘𝑖=1 𝐿𝑖 = ∑𝑘𝑖=1 dim 𝐿𝑖
5) Существует вектор 𝑎̅ ∈ ∑𝑘𝑖=1 𝐿𝑖 , для которого разложение по подпространствам 𝐿1 , …, 𝐿𝑘 единственно
6) Произвольная система ненулевых векторов 𝑎1 , …, 𝑎𝑘 , взятых по одному из каждого подпространства
𝐿𝑖 , 𝑖 = 1, 𝑘, линейно независима
7) 𝐿1 ∩ 𝐿2 = {0} (для 𝑘 = 2)
Теорема 2.2. Линейное пространство 𝑉 является прямой суммой своих подпространств 𝐿1 и 𝐿2 ⟺
1) dim 𝑉 = dim 𝐿1 + dim 𝐿2
.
2)𝐿1 ∩ 𝐿2 = {0}
Дополнительное подпространство 𝐿𝛿 называется дополнением к пространству 𝐿 ⊂ 𝑉, если прямая сумма
этих подпространств равна 𝑉, 𝐿⨁𝐿𝛿 = 𝑉.
Теорема 2.3. Для любого подпространства 𝐿 линейного пространства 𝑉 существует дополнительное
подпространство.
4. Скалярное произведение и его свойства.
Пусть 𝑉 – линейное пространство, 𝑃 – вещественное (𝑅) или (𝐶) пространство.
Отображение (, ) ∶ 𝑉 × 𝑉 → 𝑃 называется скалярным произведением, если оно удовлетворяет следующим
аксиомам для ∀𝑥, 𝑦, 𝑧 ∈ 𝑉 и ∀𝛼 ∈ 𝑃:
1) (𝑥, 𝑦) = (𝑥,
̅̅̅̅̅)
𝑦
2) (𝛼𝑥, 𝑦) = 𝛼(𝑥, 𝑦)
3) (𝑥 + 𝑦, 𝑧) = (𝑥, 𝑧) + (𝑦, 𝑧)
4) (𝑥, 𝑥) ≥ 0 для ∀𝑥 ∈ 𝑉; (𝑥, 𝑥) = 0 ⟺ 𝑥 = 𝜃
Вещественное линейное пространство со скалярным произведением называется евклидовым (𝐸)
пространством, а комплексное – унитарным (𝑈).
Свойства скалярного произведения:
1) (𝑥, 𝑦 + 𝑧) = (𝑥, 𝑦) + (𝑥, 𝑧) для ∀𝑥, 𝑦, 𝑧 ∈ 𝐸(𝑈)
2) (𝑥, 𝛼𝑦) = 𝛼̅(𝑥, 𝑦) для ∀𝑥, 𝑦, 𝑧 ∈ 𝐸(𝑈), ∀𝛼 ∈ 𝑅(𝐶)
3) (𝜃, 𝑥) = (𝑥, 𝜃) = 0, ∀𝑥 ∈ 𝐸(𝑈)
4) (𝑥, 𝑦) = 0 ∀𝑦 ∈ 𝐸(𝑈) ⟺ 𝑥 = 𝜃
5) Любое подпространство 𝐿 евклидова (унитарного) пространства является евклидовым (унитарным)
пространством.
В евклидовом пространстве скалярное произведение (𝑥, 𝑦) векторов 𝑥⃗, 𝑦⃗ линейно по обоим аргументам, а в
унитарном – по первому.

5. Ортогональные векторы. Процесс ортогонализации Грама-Шмидта.


Ортогональные векторы:
Два вектора называются ортогональными, если (𝑥, 𝑦) = 0.
Нулевой вектор ортогонален к любому вектору.
Система векторов называется ортогональной системой, если все векторы этой системы попарно
ортогональны между собой.
(𝑥𝑖 , 𝑥𝑗 ) = 0 при 𝑖 ≠ 𝑗
Система векторов называется ортонормированной системой, если (𝑥𝑖 , 𝑥𝑗 ) = 𝛿𝐼𝑗 , где 𝛿𝐼𝑗 – символ
Кронекера.
1 𝑖=𝑗
𝛿𝐼𝑗 = {
0 𝑖≠𝑗
Теорема 1.1. Ортогональная система ненулевых векторов линейно-независима.
𝑥1 , . . . , 𝑥𝑘 ∈ Е(𝑈)
𝛼1 𝑥1 + 𝛼2 𝑥2 +. . . +𝛼𝑘 𝑥𝑘 = 𝜃 | ∙ 𝑥𝑖 𝑖 = 1, 𝑘
𝛼𝑖 (𝑥𝑖 , 𝑥𝑖 ) = 𝜃
| → 𝛼𝑖 = 0 → 𝑥1 , . . . , 𝑥𝑘 – линейно-независима.
𝑥𝑖 ≠ 𝜃
Следствия:
1) Ортонормированная система векторов линейно независима.
2) В 𝑛-мерном 𝐸(𝑈) пространстве любая ортонормированная система из 𝑛 векторов образует базис.
Базис, векторы которого образуют ортонормированную систему, называется ортонормированным базисом.
1 𝑖=𝑗
(𝑒𝑖 , 𝑒𝑗 ) = {
0 𝑖≠𝑗
Теорема 1.2. В евклидовом (унитарном) пространстве координаты 𝑥1 , . . . , 𝑥𝑛 вектора 𝑥 в базисе е =
(𝑒1 , . . . , 𝑒𝑛 ) вычисляются по правилу 𝑥𝑖 = (𝑥, 𝑒𝑖 ) ⟺ 𝑒 ‒ ортонормированный базис.
Теорема 1.3. В евклидовом (унитарном) пространстве скалярное произведение векторов 𝑥 = ∑𝑛𝑖=1 𝑥𝑖 𝑒𝑖 , 𝑦 =
∑𝑛𝑖=1 𝑦𝑖 𝑒𝑖 , заданных своими координатами в базисе 𝑒, вычисляется по правилу (𝑥, 𝑦) = ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 ⟺ 𝑒 ‒
ортонормированный базис.
Теорема 1.4. В конечномерном евклидовом (унитарном) пространстве Ǝ ортонормированный базис.
Процесс ортогонализации Грама-Шмидта:
Опишем способ перехода от любой линейно независимой системы из 𝑛 векторов 𝑓1, 𝑓2, …, 𝑓𝑛 к
ортогональной системе, также состоящей из 𝑛 ненулевых векторов, эти векторы будут обозначены через 𝑔1 ,
𝑔2 , …, 𝑔𝑛 . Нормируя векторы последней системы, получим ортонормированную систему из 𝑛 векторов 𝑒1 , 𝑒2 ,
…, 𝑒𝑛 .
𝑔
Первый шаг: Пологая 𝑔1 = 𝑓1 находим 𝑒𝑘 = |𝑔1 |
1
𝑘-ый шаг (𝑘 ≥ 2). Пологая 𝑔𝑘 = 𝑓𝑘 − 𝛼1 𝑒1 − 𝛼2 𝑒2 −. . . −𝛼𝑘−1 𝑒𝑘−1 , где 𝛼𝑖 = (𝑓𝑘 , 𝑒𝑖 ), 𝑖 = ̅̅̅̅̅̅̅̅̅̅
1, 𝑘 − 1, и находим
𝑔
𝑒𝑘 = |𝑔𝑘 |.
𝑘
Через 𝑛 шагов получим ортонормированный базис 𝑒1 , 𝑒2 , …, 𝑒𝑛 .

6. Линейные операторы (определение и простейшие свойства).


Отображение 𝑓: 𝑥 → 𝑦 – это закон, посредствам которого произвольному элементу 𝑥 из множества 𝑥
ставится в соответствие однозначно определённый элемент 𝑦 из 𝒴.
Пусть 𝑉 и 𝑊 – линейные пространства над произвольным полем 𝑃.
Отображение 𝒜: 𝑉 → 𝑊 называется линейным отображением пространства 𝑉 в пространство 𝑊, если для
∀𝑥, 𝑦 ∈ 𝑉, ∀𝛼 ∈ 𝑃.
1) 𝒜(𝑥 + 𝑦) = 𝒜𝑥 + 𝒜𝑦
2) 𝒜(𝛼𝑥) = 𝛼𝒜𝑥
Линейное отображение 𝒜: 𝑉 → 𝑊 называется также линейным преобразованием пространства 𝑉 в
пространство 𝑊 или линейным оператором, действующим из пространства 𝑉 в пространство 𝑊.
Если 𝑉 = 𝑊, то линейное отображение 𝒜: 𝑉 → 𝑉 называют линейным отображением (преобразованием)
пространства 𝑉 в себя, а чаще – линейным оператором, действующим в 𝑉.
Если 𝑊 = 𝑃, то линейные отображения 𝒜: 𝑉 → 𝑊 называют линейной формой или линейным
функционалом в пространстве 𝑉.
Множество всех линейных операторов, действующих и пространства 𝑉 в 𝑊 будем обозначать ℒ(𝑉, 𝑊)
операторы 𝒜, ℬ равны, если 𝒜𝑥 = ℬ𝑥 ∀𝑥 ∈ 𝑉.
𝑀𝑛 – множество многочленов степени не выше 𝑛. Отображение 𝒟𝑀𝑛 → 𝑀𝑛 определённое правилом (1).
𝒟𝑝(𝑡) = 𝑝′ (𝑡) (1) является оператором дифференцирования.
Пусть 𝑉 = 𝐿1 ⨁𝐿2 отображение 𝒯: 𝑉 → 𝑉 определённые правилом (2).
𝒯𝑥 = 𝑥1 (2), где 𝑥 = 𝑥1 + 𝑥2 , 𝑥1 называется оператором проектирования пространства 𝑉 на 𝐿1
параллельно 𝐿2 .
Отражения 𝒯: 𝑉 → 𝑉 называется оператором отражения пространства 𝑉 𝐿1 ∥ 𝐿2 .
Отображение 𝒥: 𝑉 → 𝑉 переводит каждый вектор 𝑥 в 𝑥, 𝑥 ∈ 𝑉 𝒥𝑥 = 𝑥, называется тождественным или
единичным.
Отображение 0: 𝑉 → 𝑉 переводит каждый вектор 𝑥 в 0, 𝜃 ∈ 𝑤 𝜃𝑥 = 𝜃.

7. Матрица линейного оператора. Координаты вектора и его образа. Матрицы линейного


оператора в различных парах базисов.
8. Собственные значения и собственные векторы.
Пусть 𝑉 – линейное пространство над полем 𝑃. Ненулевой вектор 𝑥 ∈ 𝑉 называется собственным вектором
оператора 𝒜, если существует 𝜆 ∈ 𝑃, что 𝒜𝑥 = 𝜆𝑥 (1).
𝜆 ‒ собственное значение оператора 𝒜, соответствующее собственному вектору 𝑥.
Множество всех собственных значений оператора 𝒜 называется спектром оператора.
Из определения следует, что если 𝑥 – собственный вектор, отвечающий собственное значение 𝜆, то ∀𝛼𝑥
тоже будет собственным вектором, отвечающим тому же собственному значению 𝜆.
Любой собственный̆ вектор порождает подпространство собственных векторов, из которых исключён
нулевой вектор.
Теорема 1. Собственные векторы 𝑥1 , ..., 𝑥𝑘 оператора, отвечающие различным собственным значениям, 𝜆1 ,
..., 𝜆𝑘 линейно независимы.
Доказательство.
𝛼1 𝑥1 +. . . +𝛼𝑘 𝑥𝑘 = 𝜃 (2)
Подействуем оператором 𝒜:
𝛼1 𝜆1 𝑥1 +. . . +𝛼𝑘 𝜆𝑘 𝑥𝑘 = 𝜃 (3)
Умножим на 𝜆𝑘 и вычтем из (3):
𝛼1 (𝜆1 − 𝜆𝑘 )𝑥1 +. . . +𝛼𝑘−1 (𝜆𝑘−1 − 𝜆𝑘 )𝑥𝑘−1 = 𝜃
𝛼1 = 𝛼𝑘−1 = 0
𝛼𝑘 𝑥𝑘 = 0 → 𝛼𝑘 = 0 ⟹ все 𝑘 векторов линейно независимы.
Следствие. Любой оператор, действующий в 𝑛-мерном пространстве, не может иметь более чем 𝑛
собственных значений.

9. Жорданова форма.
Канонический базис корневого подпространства:
Пусть 𝑘𝜆𝑗 – корневое подпространство оператора 𝒜, отвечающее собственному значение 𝜆𝑗 .
Пусть есть ℬ = 𝒜 − 𝜆𝑗 𝐼, при этом 𝑁𝑘 = ker ℬ𝑘 , 𝑛𝑘 = dim 𝑁𝑘 , 𝑟𝑘 = rang ℬ𝑘 .
Нужно найти момент 𝑞, начинай с которого подпространства будут совпадать:
𝑁𝑞 = 𝑘𝜆𝑗 ⟹ dim 𝑁1 = 𝑆𝑗 , dim 𝑘𝜆𝑗 = 𝑚𝑗
𝑛1 = 𝑆𝑗 < 𝑛2 <. . . < 𝑛𝑞 = 𝑚𝑗 𝑆𝑗 – геометрическая кратность.
𝑚𝑗 – алгебраическая кратность 𝜆𝑗 .
Теорема 1. Пусть 𝒜 ∈ ℒ(𝑉, 𝑉) – линейный оператор, действующий в комплексном пространстве 𝑉, и его
характеристический многочлен имеет вид 𝑓(𝜆) = (𝜆1 − 𝜆)𝑚1 ∙ … ∙ (𝜆𝑝 − 𝜆)𝑚𝑝 , где 𝜆𝑖 ≠ 𝜆𝑗 , при 𝑖 ≠ 𝑗.
Тогда в пространстве 𝑉 существует базис 𝑒, в котором матрица оператора 𝒜 имеет квазидиагональную
форму.
𝐴1 0
𝐴𝑒 = 𝐴2

[ 0 𝐴𝑒 ]
𝐽𝑞1 (𝜆𝑗 ) 0
𝐽𝑞2 (𝜆𝑗 )
В которой матрицы 𝒜𝑗 , 𝑗 = 1, 𝑝 имеют вид 𝐴𝑗 = , где 𝐽𝑞𝑖 (𝜆𝑗 ) =

[ 0 𝐽𝑞𝑖 (𝜆𝑗 ) ]
𝜆𝑗 1 0 ⋯ 0 0
0 𝜆𝑗 1 ⋯ 0 0
⋯ ⋯ ⋯ ⋯ ⋯ ⋯
0 0 0 ⋯ 𝜆𝑗 1
[ 0 0 0 ⋯ 0 𝜆𝑗 ]
Клетка Жордана 𝑞𝑖 -го порядка с 𝜆𝑗 на главной диагонали, количество всех клеток Жордана в матрице 𝐴𝑗
геометрической кратности 𝑆𝑗 собственного значения 𝜆𝑗 , 𝑞1 + 𝑞2 +. . . +𝑞3𝑗 = 𝑚𝑗 , а количество клеток 𝑘-ого
порядка равно числу 𝑡𝑘 = −𝑛𝑘−1 + 2𝑛𝑘 − 𝑛𝑘+1 = 𝑟𝑘−1 − 2 𝑟𝑘 + 𝑟𝑘+1 , где 𝑛𝑘 = dim 𝑁𝑘 = def(𝒜 − 𝜆𝑗 𝐼)𝑘 , 𝑟𝑘 =
rg(𝒜 − 𝜆𝑗 𝐼)𝑘 .
Следствие. Для собственного значения оператора 𝐴 имеют место соотношения 𝜆1 +. . . +𝜆𝑛 = tr 𝒜, 𝜆1 ∙ … ∙
𝜆𝑛 = det 𝒜.
Полученная форма матрицы линейного оператора называется жордановой формой, а базис 𝑒, в котором
матрица оператора имеет жорданову форму 𝐴𝑒 , – канонический (или жордановым) базисом.
Жорданова форма матрицы линейного оператора определена однозначно с точностью до порядка клеток
Жордана. Для операторов простой структуры, и только для них, жорданова форма совпадает с диагональной.
В матричной формулировке теорема 1. означает, что любая квадратная комплексная матрица подобна
матрице, имеющую жорданову форму.
Матрица 𝐴𝑒 , имеющая жорданову форму и подобная матрица 𝐴, называется жордановой формой матрицы
𝐴.
Если 𝐴 = 𝑇𝐴𝑒 𝑇 −1, то столбцами матрицы 𝑇 преобразования подобия являются векторы канонического
базиса.
Теорема 2. Обе матрицы 𝐴, 𝐵 ∈ 𝐶 𝑛×𝑛 подобны ⟺ их жордановы формы совпадают.
Теорема 3. (теорема Гомильтона-Кэли).
Линейный оператор, действующий в комплексном (или в вещественном) пространстве, является корнем
своего характеристического многочлена.

10. Некоторые виды линейных операторов: унитарные операторы, эрмитовы операторы,


кососимметрические, неотрицательные, нормальные, самосопряженные операторы.

11. Квадратичные формы в линейном пространстве.

Третий семестр
1. Норма вектора.
Пусть 𝑉 – линейное пространство, вещественное или комплексное. Нормой в линейном пространстве 𝑉
называется отображение ‖∙‖: 𝑉 → ℝ, ставящее в соответствие каждому вектору 𝑥 ∈ 𝑉 число ‖𝑥‖ ∈ ℝ и
удовлетворяющее аксиомам: ∀𝑥, 𝑦 ∈ 𝑉, 𝛼 ∈ ℝ(ℂ)
1) ‖𝑥‖ ≥ 0, ‖𝑥‖ = 0 ⟺ 𝑥 = 𝜃
2) ‖𝛼𝑥‖ = |𝛼| ∙ ‖𝑥‖
3) ‖𝑥 + 𝑦‖ ≤ ‖𝑥‖ + ‖𝑦‖ (неравенство треугольника)
Линейное пространство 𝑉 с заданной на нём нормой ‖∙‖ называется линейным нормированным
пространством. Число ‖𝑥‖ называется нормой вектора 𝑥.
Сходимость по норме:
Утверждение 1. В нормированном пространстве 𝑉 отображение 𝜌: 𝑉 ⨯ 𝑉 → ℝ , определенное равенством
𝜌(𝑥, 𝑦) = ‖𝑥 − 𝑦‖, ∀𝑥, 𝑦 ∈ 𝑉, является метрикой.
Аксиомы метрики вытекают из аксиом нормы. □
Таким образом, в нормированном пространстве можно ввести расстояние между векторами и, значит,
пользоваться предельным переходом. Последовательность векторов {𝑥 (𝑘) } в нормированном пространстве 𝑉
называется сходящейся по норме к вектору 𝑎 ∈ 𝑉, если lim ‖𝑥 (𝑘) − 𝑎‖ = 0, при этом вектор 𝑎 называется
𝑘→∞
пределом последовательности {𝑥 (𝑘) } по норме ‖∙‖.
Обозначение: lim 𝑥 (𝑘) = 𝑎 или 𝑥 (𝑘) → 𝑎.
𝑘→∞
Утверждение 2. Сходящаяся по норме последовательность имеет единственный предел.
Доказательство. Пусть 𝑥0 ∈ 𝑉, 𝑟 > 0. Множество 𝑆(𝑥0 , 𝑟) = {𝑥 ∈ 𝑉: ‖𝑥 − 𝑥0 ‖ = 𝑟} называется сферой
радиуса 𝑟 с центром 𝑥0 по норме ‖∙‖, а множество 𝐵(𝑥0 , 𝑟) = {𝑥 ∈ 𝑉: ‖𝑥 − 𝑥0 ‖ ≤ 𝑟} замкнутым шаром радиуса
𝑟 с центром 𝑥0 по норме ‖∙‖.
Сферы и шары по евклидовой норме будем обозначать символами 𝐵𝐸 (𝑥0 , 𝑟), 𝑆𝐸 (𝑥0 , 𝑟).
Эквивалентность норм в конечномерном пространстве:
Две нормы ‖∙‖1 и ‖∙‖2 в линейном пространстве 𝑉 называются эквивалентными, если существуют такие
числа 𝑐1 > 0, 𝑐2 > 0, что для любого вектора 𝑥 ∈ 𝑉 выполняются неравенства ‖𝑥‖1 ≤ 𝑐1 ‖𝑥‖2, ‖𝑥‖2 ≤ 𝑐2 ‖𝑥‖1 .

2. Матричные нормы оператора.


Спектральная норма линейного оператора является, по существу, единственной подчинённой нормой, не
связанной явно с базисами пространств 𝑉 и 𝑊. Если же в пространствах 𝑉 и 𝑊 зафиксированы базисы, то
возможность введения операторных норм существенно расширяется.
Пусть 𝑒 = (𝑒1 , … , 𝑒𝑛 ) и 𝑓 = (𝑓1 , … , 𝑓𝑚 ) – базисы пространств 𝑉 и 𝑊. Введём 𝑉 и 𝑊 векторную норму ‖∙‖𝑝
1
согласно ‖𝑥‖𝑝 = (∑𝑛𝑘=1|𝑥𝑘 |𝑝 )𝑝 , где 𝑝 = 1, 2, ∞. Будем считать, что в пространствах 𝑉 и 𝑊 введены нормы
одинакового типа. Обозначим через ‖𝒜‖𝑝 норму оператора, подчинённую векторным нормам ‖∙‖𝑝 , через 𝐴 =
(𝑎𝑖𝑗 ) – матрицу оператора 𝒜 в базисах 𝑒 и 𝑓.
Теорема 1. Для любого оператора 𝒜 ∈ ℒ(𝑉, 𝑊)
‖𝒜‖1 = max ∑𝑚 𝑖=1|𝑎𝑖𝑗 |
1≤𝑗≤𝑛
Доказательство. Пусть 𝑥 = ∑𝑚 𝑛 𝑛 𝑚 𝑚 𝑛
𝑗=1 𝑥𝑗 𝑒𝑗 , тогда 𝒜𝑥 = ∑𝑗=1 𝑥𝑗 𝒜𝑒𝑗 = ∑𝑗=1 𝑥𝑗 ∑𝑖=1 𝑎𝑖𝑗 𝑓𝑖 = ∑𝑖=1(∑𝑗=1 𝑎𝑖𝑗 𝑥𝑗 )𝑓𝑖 .
1
Согласно ‖𝑥‖𝑝 = (∑𝑛𝑘=1|𝑥𝑘 |𝑝 )𝑝 , где 𝑝 = 1, 2, ∞
‖𝒜𝑥‖1 = ∑𝑚 𝑛 𝑚 𝑛 𝑛 𝑚
𝑖=1|∑𝑗=1 𝑎𝑖𝑗 𝑥𝑗 | ≤ ∑𝑖=1 ∑𝑗=1|𝑎𝑖𝑗 ||𝑥𝑗 | = ∑𝑗=1|𝑥𝑗 | ∑𝑖=1|𝑎𝑖𝑗 | (∗)
Пусть 𝑘-ый столбец матрицы 𝐴 имеет максимальную столбцовую сумму, то есть ∑𝑚 𝑖=1|𝑎𝑖𝑘 | =
𝑚 𝑛 𝑚 𝑚
max ∑𝑖=1|𝑎𝑖𝑗 |. Тогда из (∗) следует, что ‖𝒜𝑥‖1 ≤ ∑𝑗=1|𝑥𝑗 | ∑𝑖=1|𝑎𝑖𝑘 | = ‖𝑥‖1 ∑𝑖=1|𝑎𝑖𝑘 |. Это означает, что
1≤𝑗≤𝑛
‖𝒜𝑥‖1 ≤ ∑𝑚 𝑚
𝑖=1|𝑎𝑖𝑘 | для любого вектора 𝑥, у которого ‖𝑥‖1 = 1 и ‖𝒜𝑥‖1 = ∑𝑖=1|𝑎𝑖𝑘 | для вектора 𝑥 = 𝑒𝑘
(очевидно, ‖𝑒𝑘 ‖1 = 1). Следовательно, ∑𝑚𝑖=1|𝑎𝑖𝑘 | = sup ‖𝒜𝑥‖1 . □
‖𝑥‖1 =1
Теорема 2. Для любого оператора 𝒜 ∈ ℒ(𝑉, 𝑊)
‖𝒜‖∞ = max ∑𝑛𝑗=1|𝑎𝑖𝑗 |
1≤𝑖≤𝑚
Доказательство. Аналогично предыдущей теореме.
Замечание. Векторные нормы ‖∙‖2 пространств 𝑉 и 𝑊 порождают спектральную норму оператора ‖𝒜‖2 ,
так как норма ‖∙‖2 совпадает с евклидовой нормой ‖∙‖𝐸 , если в пространства 𝑉 и 𝑊 ввести скалярное
произведение так, чтобы базисы 𝑒 и 𝑓 стали ортонормированными.
Евклидовая норма оператора:
Можно строить норму линейного оператора и как норму вектора в линейном пространстве ℒ(𝑉, 𝑊).
1
2 2
Евклидовой нормой оператора 𝒜 называется число ‖𝒜‖𝐸 = (∑𝑚 𝑛
𝑖=1 ∑𝑗=1|𝑎𝑖𝑗 | ) (∗)
Корректность этого определения следует из легко проверяемых для ‖𝒜‖𝐸 аксиом нормы.
Как видно из (∗), евклидова норма оператора легко вычисляема (по сравнению, например, с ‖𝒜‖2 ). При
этом она обладает многими свойствами подчиненных норм.
1) Свойство согласованности: ‖𝒜‖𝐸 ≤ ‖𝒜‖𝐸 ‖𝑥‖𝐸 , так как в силу неравенства Коши-Буняковского
2 2 𝑛 2 2
‖𝒜𝑥‖2𝐸 = ∑𝑚 𝑛 𝑚 𝑛 𝑛 2 2 2
𝑖=1|∑𝑗=1 𝑎𝑖𝑗 𝑥𝑗 | ≤ ∑𝑖=1 (∑𝑗=1|𝑎𝑖𝑗 | ∑𝑗=1|𝑥𝑗 | ) = ∑𝑗=1|𝑥𝑗 | ∙ ‖𝒜‖𝐸 = ‖𝒜‖𝐸 ‖𝑥‖𝐸 .
2
2) Свойство мультипликативности: ‖𝒜𝐵‖𝐸 ≤ ‖𝒜‖𝐸 ‖𝐵‖𝐸 , ибо ‖𝒜𝐵‖2𝐸 = ∑𝑖,𝑗|∑𝑘 𝑎𝑖𝑘 𝑏𝑘𝑗 | ≤
2 2 2
∑𝑖,𝑗(∑𝑘|𝑎𝑖𝑘 ||𝑏𝑘𝑗 |) ≤ ∑𝑖,𝑗 (∑𝑘|𝑎𝑖𝑘 |2 ∙ ∑𝑘|𝑏𝑘𝑗 | ) = ∑𝑖,𝑘|𝑎𝑖𝑘 |2 ∑𝑗,𝑘|𝑏𝑘𝑗 | = ‖𝒜‖2𝐸 ‖𝐵‖2𝐸
3) ‖𝒜‖2𝐸 = 𝑡𝑟𝒜 ∗ 𝒜 = 𝑡𝑟𝒜𝒜 ∗ эти равенства легко проверяются непосредственно.
4) ‖𝒜‖2𝐸 = 𝑝12 + ⋯ + 𝑝𝑛2 , где 𝑝1 , … , 𝑝𝑛 – сингулярные числа оператора 𝒜.
5) ‖𝒜‖𝐸 ≤ ‖𝒜‖2
6) ‖𝒜‖𝐸 не изменяется при умножении оператора 𝒜 на ортогональные (унитарные) операторы.

3. Множества с алгебраическими операциями: бинарные операции; полугруппы и моноиды.


Бинарные операции:
Пусть 𝑋 – произвольное множество. Бинарной алгебраической операцией на 𝑋 называется произвольное
отображение 𝜏: 𝑀 ⨯ 𝑀 → 𝑀 декартова квадрата 𝑀2 = 𝑀 ⨯ 𝑀 в 𝑋. Таким образом, любой упорядоченной паре
(𝑎, 𝑏) элементов 𝑎, 𝑏 ∈ 𝑋 ставится в соответствие однозначно определенный элемент 𝜏(𝑎, 𝑏) того же
множества 𝑋. Иногда вместо 𝜏(𝑎, 𝑏) пишут 𝑎𝜏𝑏, а ещё чаще бинарную операцию на 𝑋 обозначают каким-
нибудь специальным символом: ∗, °, ∙ или +. Поэтому назовём 𝑎 ∙ 𝑏 – произведением, а 𝑎 + 𝑏 – суммой
элементов 𝑎, 𝑏 ∈ 𝑋.
Операция ∗ определяет на 𝑋 алгебраическую структуру или (𝑋,∗) – алгебраическая структура. Так,
например, на множестве 𝑍 целых чисел, помимо естественных операций +, ∙, легко указать получающиеся при
помощи + (или −) и ∙ «производные» операции: 𝑛°𝑚 = 𝑛 + 𝑚 − 𝑛𝑚, 𝑛 ∗ 𝑚 = −𝑛 − 𝑚 и так далее. Мы
приходим к различным алгебраическим структурам (𝑍, +), (𝑍,∙), (𝑍, °), (𝑍,∗).
Полгруппы и моноиды:
Бинарная операция ∗ на множестве 𝑋 называется ассоциативной, если (𝑎 ∗ 𝑏) ∗ 𝑐 = 𝑎 ∗ (𝑏 ∗ 𝑐) ∀𝑎, 𝑏, 𝑐 ∈ 𝑋.
Она же называется коммутативной, если 𝑎 ∗ 𝑏 ∗ 𝑎.
Те же названия присваиваются и соответствующей алгебраической структуре (𝑋,∗). Требования
ассоциативности и коммутативности независимы. В самом деле, операция * на 𝑍, заданная правилом 𝑛 ∗ 𝑚 =
−𝑛 − 𝑚, очевидно, коммутативна, но условие ассоциативности не выполняется. Далее, на множестве 𝑀𝑛 (𝑅)
всех квадратных матриц порядка 𝑛 > 1 определена операция умножения – ассоциативна, но некоммутативная.
Элемент 𝑒 ∈ 𝑋 называется единичным относительно рассматриваемой бинарной операции ∗, если 𝑒 ∗ 𝑥 =
𝑥 ∗ 𝑒 = 𝑥 ∀𝑥 ∈ 𝑋. Если 𝑒 ′ – ещё один единичный элемент, то, как следует из определения, 𝑒 ′ = 𝑒 ′ ∗ 𝑒 = 𝑒.
Стало быть, в алгебраической структуре (𝑋, ∗) может существовать не более одного единичного элемента.
Множество 𝑋 с заданной на нём бинарной ассоциативной операцией называется полугруппой. Полугруппу
с единичным элементом принято называть ещё и моноидом.
Как и для всякого множества, мощность моноида 𝑀 = (𝑀,∗) обозначается символом Card 𝑀 или |𝑀|. В
случае конечности числа содержащихся в нём элементов говорят о конечном моноиде 𝑀 порядка |𝑀|.
Подмножество 𝑆 ′ полугруппы 𝑆 с операцией ∗ называется подполугруппой, если 𝑥 ∗ 𝑦 ∈ 𝑆 ′ ∀𝑥, 𝑦 ∈ 𝑆 ′ . В
этом случае подмножество 𝑆 ′ ⊂ 𝑆 замкнуто относительно операции ∗. Если (𝑀,∗) – моноид, а подмножество
𝑀′ ⊂ 𝑀 не только замкнуто относительно операции ∗, но и содержит единичный элемент, то 𝑀′ называется
подмоноидом в 𝑀. Например, (𝑛𝑍, ∙) – подполугруппа в (𝑍, ∙), а (𝑛𝑍, +,0) – подмоноид в (𝑍, +,0). Всякий
подмоноид моноида 𝑀(𝛺) называется моноидом преобразований.

4. Обобщенная ассоциативность. Степени.


Рассмотрим произвольное множество (𝑀, ∙ ), для удобства можем опустить ∙ , то есть 𝑥 ∙ 𝑦 = 𝑥𝑦.
Пусть 𝑥1 , … , 𝑥𝑛 ∈ 𝑀.
Не меняя порядка элементов, можно многими различными способами составить произведения длины 𝑛.
𝑙𝑛 – число способов.
𝑙2 = 1: 𝑥1 𝑥2
𝑙3 = 2: 𝑥1 (𝑥2 𝑥3 ); (𝑥1 𝑥2 )𝑥3
𝑙4 = 5: 𝑥1 (𝑥2 (𝑥3 𝑥4 )); (𝑥1 𝑥2 )(𝑥3 𝑥4 ); ((𝑥1 𝑥2 )𝑥3 )𝑥4 ; (𝑥1 (𝑥2 𝑥3 )𝑥4 ); 𝑥1 ((𝑥2 𝑥3 )𝑥4 ).
Теорема 1. Если бинарная операция на множестве 𝑋 ассоциативна, то результат её последовательности
применим к 𝑛 элементам множества 𝑋 не зависит от расстановки скобок.
Доказательство. (методом математической индукции).
Если 𝑥1 = 𝑥2 =. . . = 𝑥𝑛 = 𝑥, то 𝑥 ∙ 𝑥 ∙ 𝑥 ∙ … ∙ 𝑥 = 𝑥 𝑛 – 𝑛 – степень 𝑥.
Следствия:
1) 𝑥 𝑚 𝑥 𝑛 = 𝑥 𝑚+𝑛
(𝑥 𝑚 )𝑛 = 𝑥 𝑚𝑛 , 𝑚, 𝑛 ∈ 𝑁.
Если 𝑥1 = 𝑥2 =. . . = 𝑥𝑛 = 𝑥, то 𝑥 + 𝑥+. . . +𝑥 = 𝑛𝑥.
2) 𝑛𝑥 + 𝑚𝑥 = (𝑛 + 𝑚)𝑥
𝑛(𝑚𝑥) = (𝑛𝑚)𝑥
3) Если моноид коммутативен, то 𝑥𝑦 = 𝑦𝑥 ⟹ (𝑥𝑦)𝑛 = 𝑥 𝑛 𝑦 𝑛 .

5. Обратимые элементы. Определение группы.


Обратимые элементы:
Элемент 𝑎 моноида (𝑀, ∙, 𝑒) называется обратимым, если найдётся элемент 𝑏 ∈ 𝑀, для которого 𝑎𝑏 = 𝑒 =
𝑏𝑎. Если ещё и 𝑎𝑏 ′ = 𝑒 = 𝑏 ′ 𝑎, то 𝑏 ′ = 𝑒𝑏 ′ = (𝑏𝑎)𝑏 ′ = 𝑏(𝑎𝑏 ′ ) = 𝑏𝑒 = 𝑏. Это даёт нам основание говорить
просто об обратном элементе 𝑎−1 к (обратимому) элементу 𝑎 ∈ 𝑀: 𝑎−1 𝑎 = 𝑒 = 𝑎𝑎−1.
Разумеется, (𝑎−1 )−1 = 𝑎. Понятие обратимого элемента моноида служит, очевидно, естественным
обобщением понятия обратимой матрицы в мультипликативном моноиде (𝑀𝑛 (𝑅), ∙, 𝐸).
Так как (𝑥𝑦)(𝑦 −1 𝑥 −1 ) = 𝑥(𝑦𝑦 −1 )𝑥 −1 = 𝑥𝑒𝑥 −1 = 𝑥𝑥 −1 = 𝑒 и аналогично (𝑦 −1 𝑥 −1 )(𝑥𝑦) = 𝑒, то (𝑥𝑦)−1 =
−1 −1
𝑦 𝑥 . Стало быть, множество всех обратимых элементов моноида (𝑀, ∙, 𝑒) замкнуто относительно
операции и составляет подмоноид в 𝑀.
Обратные элементы:
Если 𝑎−1 – обратный к 𝑎, то 𝑎−1 𝑎 = 𝑎𝑎−1 = 𝑒.
Свойство: (𝑎−1 )−1 = 𝑎.
Множество всех обратимых элементов моноида замкнуто относительно операции и составляет подмоноид
в (𝑀, ∙ , 𝑒).
Определение группы:
Рассмотрим все первичные матрицы 𝑛-го порядка заданных на поле действительных чисел.
𝐺𝐿𝑛 (𝑅); ∀𝐴, 𝐵 ∈ 𝐺𝐿𝑛 (𝑅); 𝐴, 𝐵 ∈ 𝐺𝐿𝑛 (𝑅)
𝐴(𝐵𝐶) = (𝐴𝐵)𝐶
det 𝐴 ≠ 0
det 𝐴 ∗ det 𝐵 = det(𝐴𝐵)
∃𝐴−1 ∈ 𝐺𝐿𝑛 (𝑅)
𝐴𝐴−1 = 𝐴−1 𝐴 = 𝐸
Множество 𝐺𝐿𝑛 (𝑅), рассматриваемое вместе с законом композиции (бинарной операцией) (𝐴, 𝐵) → 𝐴𝐵 и
называется полной линейной группой степени 𝑛 над 𝑅.
Моноид 𝐺, все элементы которого обратимы, называется группой. Другими словами, предполагаются
выполненными следующие аксиомы:
0) на множестве 𝐺 определена бинарная операция: (𝑥, 𝑦) ↦ 𝑥𝑦
1) операция ассоциативна: (𝑥𝑦)𝑧 = 𝑥(𝑦𝑧) ∀𝑥, 𝑦, 𝑧 ∈ 𝐺
2) 𝐺 обладает нейтральным (единичным) элементом 𝑒: 𝑥𝑒 = 𝑒𝑥 = 𝑥 ∀𝑥 ∈ 𝐺
3) ∀𝑥 ∈ 𝐺 существует обратный элемент 𝑥 −1 : 𝑥𝑥 −1 = 𝑥 −1 𝑥 = 𝑒
Группа с коммутативной операцией называется абелевой.
Для обозначения числа элементов в группе 𝐺 (точнее, мощности группы) используются равноправные
символы Card 𝐺, |𝐺|, (𝐺: 𝑒). В частности, подмножество 𝐻 ⊂ 𝐺 называется подгруппой в 𝐺, если
𝑒 ∈ 𝐻 ∶ ℎ1 , ℎ2 ∈ 𝐻 ⇒ ℎ1 ℎ2 ∈ 𝐻
∀ ℎ ∈ 𝐻 ≢ ℎ−1 ∈ 𝐻
ℎℎ−1 = ℎ−1 ℎ = 𝑒
𝐻 ≠ 𝐺, 𝐻 = {𝑒}

6. Циклические группы.
Пусть (𝐺, ∙ , 𝑒) – мультипликативная группа, 𝑎 – фиксированный элемент.
∀𝑔 ∈ 𝐺
𝑔 = 𝑎𝑛 – то группа циклическая 𝐺 = 〈𝑎〉, 𝑎 – образующий элемент.
(𝐺, +, 0)
𝑔 = 𝑛 ∙ 𝑎 ⟹ 𝐺 = 〈𝑎〉
𝑛∈𝑍
(𝑎−1 )𝑘 = 𝑎−𝑘
𝑎𝑚 𝑎𝑛 = 𝑎𝑚+𝑛 𝑚𝑎 + 𝑛𝑎 = (𝑚 + 𝑛)𝑎
Теорема 1. 𝑚, 𝑛 ∈ 𝑍, то 𝑚 𝑛 𝑚𝑛 или .
(𝑎 ) = 𝑎 𝑚(𝑛𝑎) = (𝑚𝑛)𝑎
Если 𝑛, 𝑚 > 0, то множество 𝑍 является множеством натуральных чисел.
𝑚 < 0, 𝑛 < 0
𝑚′ = −𝑚 > 0
𝑛′ = −𝑛 > 0
′ ′ ′ ′ ′ ′
𝑎𝑚 𝑎𝑛 = (𝑎−1 )𝑚 ∙ (𝑎−1 )𝑛 = (𝑎−1 )𝑚 +𝑛 = 𝑎−(𝑚 +𝑛 ) = 𝑎𝑚+𝑛
𝑚′ = −𝑚 > 0, −𝑛 > 0
′ ′
𝑎𝑚 𝑎𝑛 = (𝑎−1 )𝑚 ∙ 𝑎𝑛 = 𝑎−1 ∙ … ∙ 𝑎−1 ∙ 𝑎 ∙ … ∙ 𝑎 = 𝑎𝑛−𝑚 = 𝑎𝑛+𝑚
′ ′
Если 𝑚′ ≥ 𝑛, то 𝑎𝑛−𝑚 = (𝑎−1 )𝑚 −𝑛 = 𝑎𝑚+𝑛 .
𝐺 – произвольная группа, 𝑎 – фиксированный элемент.
1) Все степени элемента 𝑎 различны 𝑚 ≠ 𝑛 ⟹ 𝑎𝑚 ≠ 𝑎𝑛 , тогда говорят, что 𝑎 имеет бесконечный порядок.
2) Степени могут совпадать 𝑚 ≠ 𝑛, 𝑎𝑚 = 𝑎𝑛 . Если 𝑚 > 𝑛, то 𝑎𝑚−𝑛 = 𝑒 – нейтральный элемент, тогда ∃
степень, при возведении в которую элемент 𝑎 становится нейтральным.
𝑎𝑞 = 𝑒 , наименьшая степень элемента, обладающая этим свойством, называется порядком.
Card〈𝑎〉
Теорема 2. Если 𝑎 элемент конечного порядка 𝑞, то цикличная группа порядка 𝑞 состоит из
следующего(их) элемента(ов) 〈𝑎〉 = {𝑒, 𝑎, … , 𝑎𝑞−1 } 𝑎𝑘 = 𝑒 ⟹ 𝑘 = 𝑙𝑞, 𝑙 ∈ 𝑍.
Доказательство.
Все элементы должны быть различны
𝑘 = 𝑞 ∙ 𝑙 + 𝑅, 0 ≤ 𝑅 ≤ 𝑙 − 1
𝑎𝑘 = 𝑎𝑞𝑙+𝑅 = (𝑎𝑞 )𝑙 ∙ 𝑎𝑅 = 𝑎𝑙 ∙ 𝑎𝑅 = 𝑒 ∙ 𝑎𝑅 = 𝑎𝑅
Если 𝑎𝑘 = 𝑒, то 𝑅 = 0, 𝑘 = 𝑙𝑞.
Таблица умножения (Келли):
Первый элемент – столбец. Симметричная матрица.

𝑚𝑖𝑗 = 𝑚𝑗𝑖 , то группа является абелевой.


Примером циклической группы порядка 𝑛 являются все вращения на плоскости правильного 𝑛-угольника
вокруг его центра.

7. Изоморфизмы. Теоремы об изоморфизмах групп.


Две группы 𝐺 и 𝐺 ′ с операциями ∗ и ° называются изоморфными, если существует отображение 𝑓: 𝐺 → 𝐺 ′
такое что:
i) 𝑓(𝑎 ∗ 𝑏) = 𝑓(𝑎)°𝑓(𝑏) ∀𝑎, 𝑏 ∈ 𝐺
ii) 𝑓 биективно.
Факт изоморфизма групп часто обозначается 𝐺 ≅ 𝐺 ′ .
Свойства изоморфизма:
1) Единица переходит в единицу. Действительно, если 𝑒 – единица группы 𝐺, то 𝑒 ∗ 𝑎 = 𝑎 ∗ 𝑒 = 𝑎, и,
значит, 𝑓(𝑒)°𝑓(𝑎) = 𝑓(𝑎)°𝑓(𝑒) = 𝑓(𝑎), откуда следует, что 𝑒 – единица группы 𝐺 ′ . В этом рассуждении
использованы оба свойства 𝑓. Для (i) это очевидно, а свойство (ii) обеспечивает сюръективность 𝑓, так
что элементами 𝑓(𝑔) исчерпывается вся группа 𝐺 ′ . □
2) 𝑓(𝑎−1 ) = 𝑓(𝑎)−1 . В самом деле, согласно 1), 𝑓(𝑎)°𝑓(𝑎−1 ) = 𝑓(𝑎 ∗ 𝑎−1 ) = 𝑓(𝑒) = 𝑒 ′ − единица
группы 𝐺 ′ , откуда 𝑓(𝑎)−1 = 𝑓(𝑎)−1 °𝑒 ′ = 𝑓(𝑎)−1 °(𝑓(𝑎)°𝑓(𝑎−1 )) = (𝑓(𝑎)−1 °𝑓(𝑎))°𝑓(𝑎−1 ) = 𝑒 ′ °𝑓(𝑎−1 ) =
𝑓(𝑎−1 ). □
3) Обратное отображение 𝑓 −1 : 𝐺 ′ → 𝐺 (существующее в силу свойства (ii)) тоже является
изоморфизмом.
Докажем справедливость свойства (i) для 𝑓 −1.
Пусть 𝑎′ , 𝑏 ′ ∈ 𝐺 ′ . Тогда ввиду биективности 𝑓 имеем 𝑎′ = 𝑓(𝑎), 𝑏 ′ = 𝑓(𝑏) для каких-то 𝑎, 𝑏 ∈ 𝐺. Поскольку
𝑓 – изоморфизм, 𝑎′ ∙ 𝑏 ′ = 𝑓(𝑎)°𝑓(𝑏) = 𝑓(𝑎 ∗ 𝑏). Отсюда имеем 𝑎 ∗ 𝑏 = 𝑓 −1 (𝑎′ °𝑏′ ), а так как, в свою очередь
𝑎 = 𝑓 −1 (𝑎′ ), 𝑏 = 𝑓 −1 (𝑏′ ), то 𝑓 −1 (𝑎′ °𝑏′ ) = 𝑓 −1 (𝑎′ ) ∗ 𝑓 −1 (𝑏′ ). □
Теорема 1. Все циклические группы одного и того же порядка изоморфны.
Доказательство. В самом деле, если 〈𝑔〉 – бесконечная циклическая группа, то все степени 𝑔𝑛 образующего
𝑔 различны, и мы получим изоморфизм 𝑓: 〈𝑔〉 → (𝑍, +), полагая 𝑔𝑛 → 𝑓(𝑔𝑛 ) = 𝑛. Биективность 𝑓 очевидна.
Пусть теперь 𝐺 = {𝑒, 𝑔, … , 𝑔𝑞−1 } и 𝐺 ′ = {𝑒 ′ , 𝑔′ , … , (𝑔′ )𝑞−1 } – две циклические группы порядка 𝑞.
Определим биективное отображение 𝑓: 𝑔𝑘 ↦ (𝑔′ )𝑘 , 𝑘 = 0, 1, … , 𝑝 − 1.
Полагая 𝑛 + 𝑚 = 𝑙𝑞 + 𝑟, 0 ≤ 𝑟 ≤ 𝑞 − 1, ∀𝑛, 𝑚 = 0, 1, … , 𝑞 − 1, будем иметь 𝑓(𝑔𝑛+𝑚 ) = 𝑓(𝑔𝑟 ) = (𝑔′ )𝑟 =
(𝑔 )𝑛+𝑚 = (𝑔′ )𝑛 (𝑔′ )𝑚 = 𝑓(𝑔𝑛 )𝑓(𝑔𝑚 ). □

Теорема 2 (Кэли). Любая конечная группа порядка 𝑛 изоморфна некоторой подгруппе симметрической
группы 𝑆𝑛 .
Доказательство. Пусть 𝐺 – наша группа, 𝑛 = |𝐺|. Можно считать, что 𝑆𝑛 – группа всех биективных
отображений множества 𝐺 на себя, так как природа элементов, переставляемых элементами из 𝑆𝑛 ,
несущественна.
Для любого элемента 𝑎 ∈ 𝐺 рассмотрим отображение 𝐿𝑎 : 𝐺 → 𝐺, определенное формулой 𝐿𝑎 (𝑔) = 𝑎𝑔
Если 𝑒 = 𝑔1 , 𝑔2 , … , 𝑔𝑛 – все элементы группы 𝐺, то 𝑎, 𝑎𝑔2 , … , 𝑎𝑔𝑛 будут те же элементы, но
расположенные в каком-то другом порядке, поскольку 𝑎𝑔𝑖 = 𝑎𝑔𝑗 ⟹ 𝑎−1 (𝑎𝑔𝑖 ) = 𝑎−1 (𝑎𝑔𝑗 ) ⟹ (𝑎−1 𝑎)𝑔𝑖 =
(𝑎 −1 𝑎)𝑔𝑗 ⟹ 𝑔𝑖 = 𝑔𝑗 .
Значит, 𝐿𝑎 – биективное отображение (перестановка), обратным к которому будет 𝐿−1 𝑎 = 𝐿𝑎 −1 .
Единичным отображением является, естественно, 𝐿𝑒 .
Используя ассоциативность умножения в 𝐺, получаем 𝐿𝑎𝑏 (𝑔) = (𝑎𝑏)𝑔 = 𝑎(𝑑𝑔) = 𝐿𝑎 (𝐿𝑏 𝑔), то есть
𝐿𝑎𝑏 = 𝐿𝑎 °𝐿𝑏 .
Итак, множество 𝐿𝑒 , 𝐿𝑔2 , … , 𝐿𝑔𝑛 образует подгруппу 𝐻 в группе 𝑆(𝐺) всех биективных отображений
множества 𝐺 на себя, то есть в 𝑆𝑛 . Мы имеем включение 𝐻 ⊂ 𝑆𝑛 и имеем соответствие 𝐿: 𝑎 ↦ 𝐿𝑎 ∈ 𝐻,
обладающее всеми свойствами изоморфизма. □
8. Гомоморфизмы.
В группе автоморфизмов Aut(𝐺) группы 𝐺 содержится одна особая подгруппа. Она обозначается символом
Inn(𝐺) и называется группой внутренних автоморфизмов. Её элементами являются отображения 𝐼𝑎 : 𝑔 ↦
𝑎𝑔𝑎−1 .
Покажем, что 𝐼𝑎 действительно удовлетворяет всем свойствам, требуемым от автоморфизмов, причём
𝐼𝑎 = 𝐼𝑎−1 , 𝐼𝑏 = 1 – единичный автоморфизм, 𝐼𝑎 °𝐼𝑏 = 𝐼𝑎𝑏 (так как (𝐼𝑎 °𝐼𝑏 )(𝑔) = 𝐼𝑎 (𝐼𝑏 (𝑔)) = 𝐼𝑎 (𝑏𝑔𝑏 −1 ) =
−1

𝑎𝑏𝑔𝑏 −1 𝑎−1 = 𝑎𝑏𝑔(𝑎𝑏)−1 = 𝐼𝑎𝑏 (𝑔)).


Последнее соотношение показывает, что отображение 𝑓: 𝐺 → Inn(𝐺), определённое формулой 𝑓(𝑎) = 𝐼𝑎 ,
𝑎 ∈ 𝐺, обладает свойством 𝑓(𝑎 ∗ 𝑏) = 𝑓(𝑎)°𝑓(𝑏) ∀𝑎, 𝑏 ∈ 𝐺 (∗): 𝑓(𝑎)°𝑓(𝑏) = 𝑓(𝑎𝑏). Однако свойство, что 𝑓
биективно, при этом не обязано выполняться. Если, например, 𝐺 – абелева группа, то 𝑎𝑔𝑎−1 = 𝑔 ∀𝑎, 𝑔 ∈ 𝐺,
так что 𝐼𝑎 = 𝐼𝑒 , и вcя группа Inn(𝐺) состоит из одного единичного элемента 𝐼𝑒 .
Отображение 𝑓: 𝐺 → 𝐺 ′ группы (𝐺, ∗) в (𝐺 ′ , °) называется гомоморфизмом, если ∀𝑎, 𝑏 ∈ 𝐺 𝑓(𝑎 ∗ 𝑏) =
𝑓(𝑎)°𝑓(𝑏).
Ядром гомоморфизма 𝑓 называется множество Ker 𝑓 = {𝑔 ∈ 𝐺 | 𝑓(𝑔) = 𝑒 ′ − единица группы 𝐺 ′ }.
Гомоморфное отображение группы в себя называется её эндоморфизмом.
В этом определении от 𝑓 не требуется не только биективности, но и сюръективности, что не очень
существенно, поскольку всегда можно ограничиться рассмотрением образа Im 𝑓 ⊂ 𝐺 ′ , являющегося
подгруппой в 𝐺 ′ . Главное отличие гомоморфизма 𝑓 от изоморфизма заключается в наличии нейтрального
ядра Ker 𝑓, являющегося мерой неинъективности 𝑓. Если же Ker 𝑓 = {𝑒}, то 𝑓: 𝐺 → Im 𝑓 – изоморфизм.
Заметим, что 𝑓(𝑎) = 𝑒 ′ , 𝑓(𝑏) = 𝑒 ′ ⟹ 𝑓(𝑎 ∗ 𝑏) = 𝑓(𝑎)°𝑓(𝑏) = 𝑒 ′ °𝑒 ′ = 𝑒 ′ и 𝑓(𝑎−1 ) = 𝑓(𝑎)−1 = (𝑒 ′ )−1 = 𝑒 ′
Поэтому ядро Ker 𝑓 – подгруппа в 𝐺.

9. Подгруппа. Классы смежности.

10. Определение и общие свойства колец.


Пусть 𝐾 – непустое множество, на котором заданы две (бинарные алгебраические) операции + и ∙ ,
удовлетворяющие следующим условиям:
1) (𝐾, +) – абелева группа;
2) (𝐾, ∙) – полугруппа;
3) операция сложения и умножения связаны дистрибутивными законами (𝑎 + 𝑏)𝑐 = 𝑎𝑐 + 𝑏𝑐, 𝑐(𝑎 + 𝑏) =
𝑐𝑎 + 𝑐𝑏 ∀𝑎, 𝑏, 𝑐 ∈ 𝐾
Тогда (𝐾, +, ∙) называется кольцом.
Структура (𝐾, +) называется аддитивной группой кольца, а (𝐾, ∙) – его мультипликативной полугруппой.
Если (𝐾, ∙) – моноид, то говорят, что (𝐾, +, ∙) – кольцо с единицей.
Подмножество 𝐿 кольца 𝐾 называется подкольцом, если 𝑥, 𝑦 ∈ 𝐿 ⟹ 𝑥 − 𝑦 ∈ 𝐿, 𝑥𝑦 ∈ 𝐿, то есть если 𝐿 –
подгруппа аддитивной группы и подполугруппа мультипликативной полугруппы кольца.
Пересечение любого семейства подколец в 𝐾 является подкольцом и имеет смысл говорить о подкольце
〈𝑇〉 ⊂ 𝐾, порождённом подмножеством 𝑇 ⊂ 𝐾. По определению 〈𝑇〉 пересечение всех тех подколец в 𝐾,
которые содержат 𝑇. Если с самого начала 𝑇 было подкольцом, то 〈𝑇〉 = 𝑇.
Кольцо называется коммутативным, если 𝑥𝑦 = 𝑦𝑥 ∀𝑥, 𝑦 ∈ 𝐾.
Свойства кольца:
1) ∀𝑎, 𝑏, 𝑐 ∈ 𝐾 𝑎 + 𝑏 = 𝑏 + 𝑎; (𝑎 + 𝑏) + 𝑐 = 𝑎 + (𝑏 + 𝑐)
2) ∀𝑎 ∈ 𝐾 существует относительно сложения нейтральный элемент −0, то есть 𝑎 + 0 = 0
3) ∀𝑎 ∈ 𝐾 существует противоположный элемент −𝑎′ , то есть 𝑎 + 𝑎′ = 0
4) ∀𝑎, 𝑏, 𝑐 ∈ 𝐾 (𝑎 ∙ 𝑏) ∙ 𝑐 = 𝑎 ∙ (𝑏 ∙ 𝑐)
5) ∀𝑎, 𝑏, 𝑐 ∈ 𝐾 𝑎 ∙ (𝑏 + 𝑐) = 𝑎𝑐 + 𝑏𝑎, (𝑎 + 𝑏)𝑐 = 𝑎𝑐 + 𝑏𝑐.
11. Кольцо классов вычетов. В каком случае данное кольцо является полем?
Кольцо классов вычетов:
Пусть 𝑚 > 1 – фиксированное число из 𝑁, 𝑚𝑍 замкнуто относительно + и ∗ (кратность 𝑚), 𝑚𝑍 ⊂ 𝑍.
Два числа 𝑛 и 𝑛′ называются сравнивыми по модулю 𝑚, если при делении на 𝑚 они дают одинаковые
остатки:
𝑛 = 𝑛′ (𝑚)
𝑛 = 𝑛′ mod(𝑚)
Множество целых чисел можно разбить на классы чисел, сравнимых между собой по модулю 𝑚 и назвать
их классами вычетов по модулю 𝑚.
{𝑅}𝑚 = 𝑚𝑍 + 𝑅 = {𝑅 + 𝑚𝑘 ∶ 𝑘 ∈ 𝑍} – ∀ классов вычетов.
𝑧 = {0}𝑚 ∪ {1}𝑚 ∪ … ∪ {𝑚 − 1}𝑚
𝑛 = 𝑛′ (𝑚) , если 𝑛 − 𝑛′ делится на 𝑚 (нацело) 𝑘 = 𝑘 ′ (𝑚), 𝑙 = 𝑙 ′ (𝑚) тогда:
𝑘 ± 𝑙 = 𝑘 ′ ± 𝑙 ′ и 𝑘𝑙 = 𝑘 ′ 𝑙 ′ (𝑚)
𝑘𝑠 = 𝑘 ′ 𝑠 (𝑚), 𝑠 < 𝑧
Каждым вторым классом 𝑘 и 𝑙, сравнимым по модулю 𝑚, независим от выбора в них представителей 𝑘 и 𝑙,
можно сопоставить классы, является их суммой или произведением.
{𝑘}𝑚 и {𝑙}𝑛
{𝑘}𝑚 ⨁{𝑙}𝑛 = {𝑘 + 𝑙}𝑚
{𝑘}𝑚 ⨀{𝑙}𝑛 = {𝑘𝑙}𝑚
{𝑧𝑚 , ⨁, ⨀} – множество всех классов вычетов является кольцом.
1. Сложение классов ассоциативно и коммутативно:
𝑎 + (𝑏 + 𝑐) = 𝑎 + (𝑏 + 𝑐) = 𝑎 + (𝑏 + 𝑐) = (𝑎 + 𝑏) + 𝑐 = (𝑎 + 𝑏) + 𝑐 = (𝑎 + 𝑏) + 𝑐
𝑎+𝑏 =𝑎+𝑏 =𝑏+𝑎 =𝑏+𝑎
2. Роль нейтрального элемента выполняет класс 0.
3. Для каждого класса 𝑎 противоположным классом является −𝑎, то есть класс, содержащий −𝑎 ∶ 𝑎 +
(−𝑎) = 0.
4. Умножение коммутативно и ассоциативно:
𝑎 ∙ 𝑏 = 𝑎𝑏 = 𝑏𝑎 = 𝑏 ∙ 𝑎
𝑎 ∙ (𝑏𝑐) = 𝑎(𝑏𝑐) = 𝑎(𝑏𝑐) = (𝑎𝑏)𝑐 = (𝑎𝑏)𝑐 = (𝑎𝑏)𝑐
5. Умножение и сложение связаны дистрибутивно:
(𝑎 + 𝑏)𝑐 = (𝑎 + 𝑏)𝑐 = (𝑎 + 𝑏)𝑐 = 𝑎𝑐 + 𝑏𝑐 = 𝑎𝑐 + 𝑏𝑐 = 𝑎𝑐 + 𝑏𝑐
𝑓: 𝑛 → {𝑛}𝑚
𝑧 𝑧𝑚
𝑓(𝑘 + 𝑙) = 𝑓(𝑘)⨁𝑓(𝑙)
𝑓(𝑘𝑙) = 𝑓(𝑘)⨀𝑓(𝑙)
(𝑘, +,∙ ), (𝑘 ′ , ⨁, ⨀)
𝑓: 𝑘 → 𝑘 ′ называется гомоморфным, если оно сохраняет операции.
𝑓(0) = 0′
𝑓(𝑛𝑎) = 𝑛 ∙ 𝑓(𝑎) 𝑛 ∈ 𝑍
ker 𝑓 = {𝑎 ∈ 𝑘 ∶ 𝑓(𝑎) = 0′ } (ядром называется все числа, образом которых является нуль)
ker 𝑓 (ядро является подкольцом множества 𝑘)
Если ядро состоит только из одного элемента, то называется мономорфным (то есть само на себя).
В каком случае данное кольцо является полем?
Кольцо вычетов является полем ⟺ когда 𝑚 – простое число.

12. Типы колец. Поле. Тело.


Если 𝑎𝑏 = 0 при 𝑎 ≠ 0, 𝑏 ≠ 0 в кольце 𝐾, то 𝑎 называется левым, а 𝑏 – правым делителем нуля. Сам нуль в
кольце 𝐾 ≠ 0 – тривиальный делитель нуля. Если других делителей нуля нет (кроме 0), то 𝐾 называется
кольцом без делителей нуля. Коммутативное кольцо с единицей 1 ≠ 0 и без делителей нуля называют
целостным кольцом.
Теорема 1. Нетривиальное коммутативное кольцо 𝐾 с единицей является целостным ⟺ в нём выполнен
закон сокращения 𝑎𝑏 = 𝑎𝑐, 𝑎 ≠ 0 ⟹ 𝑏 = 𝑐 ∀𝑎, 𝑏, 𝑐 ∈ 𝐾.
В кольце 𝐾 с единицей естественно рассматривать множество обратимых элементов. Элемент 𝑎 называется
обратимым (или делителем единицы), если существует элемент 𝑎−1 , для которого 𝑎𝑎−1 = 1 = 𝑎−1 𝑎.
Теорема 2. Все обратимые элементы кольца 𝐾 с единицей составляют группу 𝑈(𝐾) по умножению.
𝑈(ℤ) = {±1} – циклическая группа порядка 2.
Поле 𝑃 – это коммутативное кольцо с единицей 1 ≠ 0, в котором каждый элемент 𝑎 ≠ 0 обратим. Группа

𝑃 = 𝑈(𝑃) называется мультипликативной группой поля.
Подполем 𝐹 поля 𝑃 называется подкольцо в 𝑃, само являющееся полем. Например, поле рациональных
чисел ℚ – подполе поля вещественных чисел ℝ.
В случае 𝐹 ⊂ 𝑃 поле 𝑃 является расширением своего подполя 𝐹.
Поля 𝑃 и 𝑃′ называются изоморфными, если они изоморфны как кольца.
Напротив, автоморфизмы – изоморфные отображения поля 𝑃 на себя.

13. Теорема о теле кватернионов.


Теорема. Алгебра кватернионов относительно операций сложения и умножения кватернионов является
телом.

14. Индексные обозначения. Условие о суммировании.


Элементы тензорной алгебры. 𝑖 = 1, 2, 3.
Индексные обозначения:
Нумерация:
(1) 𝑥1 , 𝑥2 , 𝑥3 𝑥𝑖
1 2 3
(2) 𝑥 , 𝑥 , 𝑥 𝑥𝑖
3
(3) ∑𝑖=1 𝑎𝑖 𝑥 = 𝑎1 𝑥 1 + 𝑎2 𝑥 2 + 𝑎3 𝑥 3
𝑖

Объекты, зависящие только от одного индекса, называются объектами первого порядка. Отдельные буквы
с индексами называют элементами составляющими объекта.
Объекты первого порядка, имеющие три составляющих, назовём трёхмерными.
(4) 𝑎11 (𝑥1 )2 + 𝑎12 𝑥 1 𝑥 2 + 𝑎13 𝑥 1 𝑥 3 + 𝑎21 𝑥 2 𝑥1 + 𝑎22 (𝑥 2 )2 + 𝑎23 𝑥 2 𝑥 3 + 𝑎31 𝑥 3 𝑥 1 + 𝑎32 𝑥 3 𝑥 2 + 𝑎33 (𝑥 3 )2 =
3
∑𝑚,𝑛=1 𝑎𝑚𝑛 𝑥 𝑚 𝑥 𝑛
𝑝
𝑎𝑚𝑛𝑝 𝑎𝑚𝑛 𝑎𝑝𝑚𝑛 𝑎𝑚𝑛𝑝
Каждый объект третьего порядка содержит 33 индексов.
Условие о суммировании:
Знак суммы подразумевается в любом случае, когда в одночленном выражении индексы повторяются.
Соглашение о суммировании применяется ⟺ индекс записан малой буквой. Отдельные члены (3) и (4)
будем обозначать большими буквами, например, 𝑎𝑀 𝑥 𝑀 .
Повторяющийся индекс называется немым. Индекс, который в каком-нибудь одночленном выражении не
повторяется, называется немым.

15. Сложение, умножение и свёртывание объектов.


Сложение:
Операция сложения применяется только к объектам одного и того же порядка и типа.
𝑅 𝑅 𝑅
𝑎𝑠𝑡 + 𝑏𝑠𝑡 = 𝐶𝑠𝑡
Умножение:
Каждую составляющую первого объекта будем умножать на каждую составляющую второго порядка.
𝑅 𝑅𝑚𝑛
𝑎𝑠𝑡 ∙ 𝑏 𝑚𝑛 = 𝐶𝑠𝑡
В результате получаем объект, порядок которого равен сумме порядков объектов.
Свёртывание:
𝑅𝑃
Возьмём объект пятого порядка 𝑎𝑠𝑡𝑢 .
𝑅𝑃 𝑅1 𝑅2 𝑅3
Пусть 𝑢 = 𝑃, тогда 𝑎𝑠𝑡𝑃 = 𝑎𝑠𝑡1 + 𝑎𝑠𝑡2 + 𝑎𝑠𝑡3
𝑅 = 𝑡 𝑎𝑠𝑅𝑃 = (𝑎𝑠11 + 𝑎𝑠21 + 𝑎𝑠31 ) + (𝑎12
𝑅𝑃 11 21 31 13 22 23 33
𝑠12 + 𝑎𝑠13 ) + (𝑎𝑠22 + 𝑎𝑠23 + 𝑎𝑠33 )
При проведении операции свёртывание получается объект на две единицы меньше исходного объекта.
Внутреннее умножение:
Операция комбинация умножения и свёртывания. Сначала перемножить два объекта и свернуть по
нижнему первого и по верхнему второго.
𝐶𝑠𝑅𝑚 = 𝑎𝑠𝑝𝑅 𝑚𝑛
𝑏 = ∑3𝑝=1 𝑎𝑠𝑝
𝑅 𝑚𝑝
𝑏

16. Симметричные и антисимметричные объекты.


Если мы имеем объект 𝑎𝑚𝑛 с двумя нижними индексами, то может случиться, что каждая из составляющих
не изменится по величине и знаку при перемене мест индексов, то есть 𝑎𝑚𝑛 = 𝑎𝑛𝑚 .
Такой объект называется симметричным. В более общем случае объект, имеющий любое число нижних
индексов, называется симметричным относительно двух из них, если составляющие не изменяются при
перемене мест этих двух индексов. Объект называется абсолютно симметричным относительно нижних
индексов, если при перемене мест любых двух из них составляющие не изменяются. Абсолютно
симметричный объект третьего порядка будет удовлетворять соотношениям 𝑎𝑚𝑛𝑝 = 𝑎𝑚𝑝𝑛 = 𝑎𝑛𝑚𝑝 = 𝑎𝑛𝑝𝑚 =
𝑎𝑝𝑚𝑛 = 𝑎𝑝𝑛𝑚 .
С другой стороны, объект 𝑎𝑚𝑛 называется антисимметричным, если перемена мест индексов изменяет знак
составляющей, но не изменяет её численного значения: в таком случае мы имеем 𝑎𝑚𝑛 = −𝑎𝑛𝑚 .
Эти равенства, выписанные полностью, выглядят так:
𝑎11 = −𝑎11 , 𝑎22 = −𝑎22 , 𝑎33 = −𝑎33 ,
𝑎12 = −𝑎21 , 𝑎23 = −𝑎32 , 𝑎31 = −𝑎13 ,
Откуда мы немедленно заключаем, что 𝑎11 = 𝑎22 = 𝑎33 = 0, как и выше, объект может быть
антисимметричным либо относительно двух каких-нибудь нижних индексов, либо относительно всех пар
индексов; в последнем случае объект называется абсолютно антисимметричным. Абсолютно
антисимметричный объект третьего порядка должен удовлетворять соотношениям 𝑎𝑚𝑛𝑝 = −𝑎𝑚𝑝𝑛 = −𝑎𝑛𝑚𝑝 =
𝑎𝑛𝑝𝑚 = 𝑎𝑝𝑚𝑛 = −𝑎𝑝𝑛𝑚 .
Всё сказанное выше о симметрии и антисимметрии в равной степени применимо и к верхним индексам.

17. Антисимметричный объект третьего порядка. Символы Кронекера.


Пусть 𝑎𝑟𝑠𝑡 – абсолютно антисимметричный объект третьего порядка, то есть его составляющие изменяются
по знаку, но не по абсолютному значению, при перемене мест любых двух из индексов. Составляющие могут
иметь только три следующих различных значения:
1) 0, когда любые два индекса равны;
2) +𝑎123 , когда 𝑟𝑠𝑡 является чётной перестановкой чисел 1, 2, 3;
3) −𝑎123 , когда 𝑟𝑠𝑡 является нечётной перестановкой чисел 1, 2, 3.
Обозначим через 𝑒𝑟𝑠𝑡 антисимметричный объект, составляющие которого имеют значения 0, +1, −1, и
будем называть его 𝑒-объектом. Пусть мы имеем 𝑒123 = +1, если 𝑎𝑟𝑠𝑡 – любой антисимметричный объект
третьего порядка, то 𝑎𝑟𝑠𝑡 = 𝑎123 𝑒𝑟𝑠𝑡 .
Точно так же можно считать все индексы верхними: тогда получим соответствующий антисимметричный
объект 𝑒 𝑟𝑠𝑡 , составляющие которого имеют те же самые значения, что и у 𝑒𝑟𝑠𝑡 . Мы увидим, что оба эти
объекта имеют большое значение в теории определителей.
Из двух объектов 𝑒𝑟𝑠𝑡 и 𝑒 𝑟𝑠𝑡 мы сможем получить другие объекты, воспользовавшись операциями
𝑟𝑠𝑡
умножения и свертывания. После умножения мы получаем объекты шестого порядка 𝛿𝑚𝑛𝑝 = 𝑒 𝑟𝑠𝑡 𝑒𝑚𝑛𝑝 .
Вспомнив значения, которые могут принимать составляющие 𝑒-объектов, мы видим, что составляющие
нового объекта имеют следующие значения:
1) 0, когда два или больше нижних (или верхних) индексов одинаковы;
2) +1, когда 𝑟𝑠𝑡 и 𝑚𝑛𝑝 отличаются на чётное число перестановок;
3) −1, когда 𝑟𝑠𝑡 и 𝑚𝑛𝑝 отличаются на нечётное число перестановок.
𝑟𝑠𝑡
Теперь свернём объект 𝛿𝑚𝑛𝑝 таким образом, чтобы получить объект четвёртого порядка:
𝑟𝑠 𝑟𝑠𝑝 𝑟𝑠1 𝑟𝑠2 𝑟𝑠3 (1)
𝛿𝑚𝑛 = 𝛿𝑚𝑛𝑝 = 𝛿𝑚𝑛1 + 𝛿𝑚𝑛2 + 𝛿𝑚𝑛3
Во-первых, мы видим, что это выражение равно нулю, если 𝑟 равно 𝑠 или если 𝑚 равно 𝑛. Во-вторых, если
мы придадим 𝑟 и 𝑠 определённые значения, например равные 1 и 2 соответственно, то из (1) увидим, что
12 123 12
𝛿𝑚𝑛 = 𝛿𝑚𝑛3 и следовательно, 𝛿𝑚𝑛 исчезает, если 𝑚, 𝑛 не является перестановкой 1 и 2; оно равно +1 для
чётной перестановки и −1 для нечетной. Мы получим те же самые результаты, если придадим 𝑟 и 𝑠 какие-
𝑟𝑠
либо другие определённые значения. Следовательно, составляющие 𝛿𝑚𝑛 имеют значения:
1) 0, когда два верхних или нижних индекса одинаковы, или когда один из верхних индексов имеет
значение, не равное одному из нижних;
2) +1, когда 𝑟, 𝑠, 𝑚, 𝑛 представляют собой одни и те же перестановки одних и тех же двух чисел;
3) −1, когда 𝑟, 𝑠, 𝑚, 𝑛 представляют собой противоположные перестановки одних и тех же двух чисел.
𝑟𝑠
Если мы свернём 𝛿𝑚𝑛 и разделим результат пополам, то получим объект второго порядка
𝑟 1 𝑟𝑛 1 𝑟1 𝑟2 𝑟3 )
𝛿𝑚 = 𝛿𝑚𝑛 = (𝛿𝑚1 + 𝛿𝑚2
2 2
+ 𝛿𝑚3
𝑟 1 1 12 13 ).
Положив в 𝛿𝑚 𝑟 = 1 получим 𝛿𝑚 = 2 (𝛿𝑚2 + 𝛿𝑚3
1 1
Мы видим, что 𝛿𝑚 исчезает, если 𝑚 ≠ 1, если 𝑚 = 1, то 𝛿𝑚 = +1. Аналогичный результат получится, если
𝑟
положить 𝑟 равным 2 или 3. Следовательно, 𝛿𝑚 имеет значения:
1) 0, если 𝑟 не равно 𝑚;
2) +1, если 𝑟 равно 𝑚.
Все эти 𝛿-объекты обычно называются символами Кронекера.
18. Определитель, образованный из составляющих объекта второго порядка.
Определитель, элементами которого являются составляющие трёхмерного объекта 𝑎𝑠𝑟 , записывается так:
𝑎11 𝑎12 𝑎13
|𝑎𝑠𝑟 | ≡ |𝑎12 𝑎22 𝑎32 |
𝑎13 𝑎23 𝑎33
Здесь верхний индекс – строка, нижний индекс – столбец. Если определитель раскрыт по столбцам, то по
𝑗
определению он будет равен ∑3𝑖,𝑗,𝑘 ±𝑎1𝑖 𝑎2 𝑎3𝑘 , где 𝑖, 𝑗, 𝑘 образуют перестановки чисел 1, 2, 3, а знак плюс или
минус ставится в соответствии с четностью или нечетности перестановки. Вспоминая свойства 𝑒-объектов,
𝑗 𝑗
мы видим, что определитель равен ∑ 𝑒𝑖𝑗𝑘 𝑎1𝑖 𝑎2 𝑎3𝑘 , или используя условие о суммировании, |𝑎𝑠𝑟 | = 𝑒𝑖𝑗𝑘 𝑎1𝑖 𝑎2 𝑎3𝑘 .
𝑗
Если раскрыть определитель по строкам, видно, что мы получим подобную формулу |𝑎𝑠𝑟 | = 𝑒 𝑖𝑗𝑘 𝑎1𝑖 𝑎2 𝑎3𝑘 .
𝑗
Рассмотрим объект 𝑒𝑖𝑗𝑘 𝑎1𝑖 𝑎2 𝑎3𝑘 (2)
Докажем сначала, что он является абсолютно антисимметричным относительно 𝑟, 𝑠, 𝑡. Индексы 𝑖, 𝑗, 𝑘 –
немые, а буква, обозначающая немой индекс, совершенно несущественна. Следовательно, мы не изменим
𝑗 𝑗
величины суммы, если заменим 𝑘 на индекс 𝑖, а 𝑖 – на 𝑘. Таким образом, 𝑒𝑖𝑗𝑘 𝑎𝑟𝑖 𝑎𝑠 𝑎𝑡𝑘 = 𝑒𝑘𝑗𝑖 𝑎𝑟𝑘 𝑎𝑠 𝑎𝑡𝑖 =
𝑗 𝑗
𝑒𝑘𝑗𝑡 𝑎𝑡𝑖 𝑎𝑠 𝑎𝑟𝑘 = −𝑒𝑡𝑗𝑘 𝑎𝑡𝑖 𝑎𝑠 𝑎𝑟𝑘 , так как перемена мест двух индексов в 𝑒𝑖𝑗𝑘 изменяет знак. Следовательно, (2)
изменяет знак, если 𝑟 и 𝑡 поменять местами. Мы получим тот же самый результат, если поменять местами
любые два индекса 𝑟, 𝑠, 𝑡, что и доказывает наше утверждение. Более того, (2) даёт нам значение |𝑎𝑟𝑠 |, когда
𝑟, 𝑠, 𝑡 принимают частные значения 1, 2, 3 соответственно, а из равенства 𝑎𝑟𝑠𝑡 = 𝑎123 𝑒𝑟𝑠𝑡 мы заключаем, что
𝑗
𝑒𝑖𝑗𝑘 𝑎𝑟𝑖 𝑎𝑠 𝑎𝑡𝑘 = |𝑎𝑛𝑚 |𝑒𝑟𝑠𝑡 (21). Аналогично, 𝑒 𝑖𝑗𝑘 𝑎𝑖𝑟 𝑎𝑗𝑠 𝑎𝑘𝑡 = |𝑎𝑛𝑚 |𝑒 𝑠𝑟𝑡 (22).
Перемена мест любых двух строк или столбцов изменяет знак определителя, но не изменяет его
абсолютной величины. В частности, если две строки или два столбца одинаковы, определитель обращается в
ноль.

19. Алгебраическое дополнение элемента определителя.


𝑎11 𝑎12 𝑎13
Если определитель ≡ |𝑎12 𝑎22 𝑎32 | полностью раскрыт, то очевидно, что любой элемент 𝑎𝑖𝑟
|𝑎𝑠𝑟 |
𝑎13 𝑎23 𝑎33
появляется по одному разу в некотором числе членов разложения. Коэффициент при 𝑎𝑖𝑟 в этом разложении
называется алгебраическим дополнением элемента 𝑎𝑖𝑟 и обозначается через 𝐴𝑖𝑟 .
𝑗
Рассмотрим элемент 𝑎1𝑟 . Из |𝑎𝑠𝑟 | = 𝑒𝑖𝑗𝑘 𝑎1𝑖 𝑎2 𝑎3𝑘 видно, что его алгебраическое дополнение есть 𝑒𝑟𝑠𝑡 𝑎2𝑠 𝑎3𝑡. Это
1 1𝑗𝑘 1 𝑖𝑗𝑘 1 𝑖𝑗𝑘
может быть записано так: 𝑒 123 𝑒𝑟𝑠𝑡 𝑎2𝑠 𝑎3𝑡 = 𝑒 𝑒𝑟𝑠𝑡 𝑎𝑗𝑠 𝑎𝑘𝑡 = 𝛿𝑟𝑠𝑡 𝑎𝑗𝑠 𝑎𝑘𝑡 или 𝐴1𝑟 = 𝛿𝑟𝑠𝑡 𝑎𝑗𝑠 𝑎𝑘𝑡 .
2! 2! 2!
1 𝑖𝑗𝑘
Алгебраическое дополнение элемента 𝑎𝑖𝑟 определяется формулой 𝐴𝑖𝑟 = 𝛿𝑟𝑠𝑡 𝑎𝑗𝑠 𝑎𝑘𝑖 .
2!
Получив выражения для алгебраических дополнений 𝐴𝑖𝑟 , найдём разложение определителя по элементам
любой строки или столбца. Рассмотрим объект 𝑎𝑟𝑚 𝐴𝑖𝑚 .
1 𝑖𝑗𝑘 1 1 𝑝 1 𝑝 𝑖𝑗𝑘
𝑎𝑟𝑚 𝐴𝑖𝑚 = 2! 𝛿𝑚𝑠𝑡 𝑎𝑟𝑚 𝑎𝑗𝑠 𝑎𝑘𝑖 = 2! 𝑒 𝑖𝑗𝑘 𝑒𝑚𝑠𝑡 𝑎𝑟𝑚 𝑎𝑗𝑠 𝑎𝑘𝑡 = 2! 𝑒 𝑖𝑗𝑘 𝑒𝑟𝑗𝑘 |𝑎𝑞 | = 2! |𝑎𝑞 |𝛿𝑟𝑗𝑘
Следовательно, если обозначить определитель буквой 𝐴, то 𝑎𝑟𝑚 𝐴𝑖𝑚 = 𝐴𝛿𝑟𝑖 (25). Эта формула даёт
𝑖 𝑚
разложение определителя по элементам 𝑟-го столбца. Соотношение 𝑎𝑚 𝐴𝑟 = 𝐴𝛿𝑟𝑖 (26) является разложением
определителя по элементам 𝑖-й строки.
𝐴𝑖
Эти выражения могут быть записаны в несколько измененной форме: если 𝐴 не равно нулю, то 𝑎𝑟𝑖 = 𝐴𝑟.
То есть 𝑎𝑟𝑖 есть алгебраическое дополнение элемента 𝑎𝑖𝑟 в 𝐴, делённое на 𝐴. Формулы (25) и (26) примут
вид 𝑎𝑟𝑚 𝑎𝑚
𝑖
= 𝑎𝑚 𝑖 𝑚
𝑎𝑟 = 𝛿𝑟𝑖 .

20. Положительно определённая квадратичная форма.


𝑎𝑚𝑛 𝑥 𝑚 𝑥 𝑛 – квадратичная форма
𝑥 𝑅 = 0 → 𝑎𝑚𝑛 𝑥 𝑚 𝑥 𝑛 = 0
𝑥 𝑅 ≠ 0 → 𝑎𝑚𝑛 𝑥 𝑚 𝑥 𝑛 > 0
𝑏𝑚𝑛 𝑥 𝑚 𝑥 𝑛
𝜆𝑎11 − 𝑏11 𝜆𝑎12 − 𝑏12 𝜆𝑎13 − 𝑏13
|𝜆𝑎21 − 𝑏21 𝜆𝑎22 − 𝑏22 𝜆𝑎23 − 𝑏23 | = |𝜆𝑎𝑚𝑛 − 𝑏𝑚𝑛 | – характеристический определитель.
𝜆𝑎31 − 𝑏31 𝜆𝑎32 − 𝑏32 𝜆𝑎33 − 𝑏33
Теорема 1. Если 𝑎𝑚𝑛 𝑥 𝑚 𝑥 𝑛 и 𝑏𝑚𝑛 𝑥 𝑚 𝑥 𝑛 две положительно определённых квадратичных формы, то все
корни характеристического многочлена вещественны и положительны.
Теорема 2. Если 𝑎𝑚𝑛 𝑥 𝑚 𝑥 𝑛 положительно определённая квадратичная форма, то все корни
характеристического многочлена вещественны.
21. Линейные преобразования. Инварианты, контравариантные и ковариантные векторы
(тензоры).
Линейные преобразования:
Пусть переменные 𝑥 1 , 𝑥 2 , 𝑥 3 преобразуются в новые ̅̅̅ 𝑥 1 , ̅̅̅
𝑥 2 , ̅̅̅
𝑥 3 с помощью линейного преобразования:
̅̅̅
1 1 1 1 2
𝑥 = 𝑐1 𝑥 + 𝑐2 𝑥 + 𝑐3 𝑥 1 3

̅̅̅
𝑥 2 = 𝑐12 𝑥1 + 𝑐22 𝑥 2 + 𝑐32 𝑥 3
̅̅̅
𝑥 3 = 𝑐13 𝑥1 + 𝑐23 𝑥 2 + 𝑐33 𝑥 3
Где 𝑐𝑠𝑟 – константы. Применяя условие о суммировании, запишем эту систему уравнений в виде ̅̅̅ 𝑥𝑟 =
𝑟 𝑠 (1).
𝑐𝑠 𝑥
Предположим, что определитель преобразования 𝑐 = |𝑐𝑠𝑟 | не равен нулю. Пусть 𝛾𝑟𝑠 является
алгебраическим дополнением элемента 𝑐𝑠𝑟 в определителе 𝑐, делённым на величину 𝑐. Тогда 𝑐𝑚 𝑟 𝑚
𝛾𝑠 = 𝛾𝑚 𝑟 𝑚
𝑐𝑠 =
𝛿𝑠 , разрешим систему уравнений (1) относительно 𝑥: 𝑥 = 𝛾𝑚 ̅̅̅̅
𝑟 𝑟 𝑟
𝑥 𝑚.
Это показывает, что данное преобразование обратимо. Кроме того, если 𝑐𝑠𝑟 = 𝛿𝑠𝑟 , мы имеем ̅̅̅ 𝑥 𝑟 = 𝑥 𝑟 , то
есть тождественное преобразование.
Если перейти сначала от переменных 𝑥 𝑟 к ̅̅̅ 𝑥 𝑟 по (1), а затем от переменных ̅̅̅ 𝑥 𝑟 к ̿̿̿
𝑥 𝑟 при помощи
преобразования ̿̿̿ 𝑥 = 𝑐𝑠 ̅̅̅
𝑟 ′𝑟
𝑥 , то мы видим, что переход от первоначальных переменных 𝑥 𝑟 к ̿̿̿
𝑠 𝑥 𝑟 определяется
формулой ̿̿̿ 𝑥 𝑟 = 𝑐𝑠′′𝑟 𝑥 𝑠 , где 𝑐𝑠′′𝑟 = 𝑐𝑚
′𝑟 𝑚
𝑐𝑠 .
Это преобразование, следовательно, также линейное.
Инварианты, контравариантные и ковариантные векторы (тензоры):
Тензор есть частный случай объекта, рассмотренного ранее, составляющими которого являются числа или
функции, при линейном преобразовании переменных ̅̅̅ 𝑥 𝑟 = 𝑐𝑠𝑟 𝑥 𝑠 . Следовательно, существуют тензоры
нулевого, первого, второго, третьего, и так далее порядков, так же как существуют всякие другие объекты
этих же порядков.
Сначала рассмотрим объект нулевого порядка, то есть просто число или функцию. Если этот объект имеет
одно и то же значение и в новых переменных ̅̅̅ 𝑥 𝑟 и в старых переменных 𝑥 𝑟 , то он называется скаляром, или
инвариантом, или тензором нулевого порядка. Следовательно, если 𝑎 есть инвариант, то 𝑎̅ = 𝑎, где 𝑎̅ есть
значение данного объекта в новых переменных.
Теперь рассмотрим объект первого порядка. Простейший тип такого объекта есть совокупность самих
переменных, а именно 𝑥 𝑟 . Составляющие этого объекта преобразуются следующим образом ̅̅̅ 𝑥 𝑟 = 𝑐𝑠𝑟 𝑥 𝑠 .
Следовательно, эта формула даёт один из способов, с помощью которого может быть преобразован объект
первого порядка. Любой объект, составляющие которого преобразуются по этому закону, называется
контравариантным тензором первого порядка, или, иначе, контравариантным вектором. Таким образом, 𝑎𝑟
есть контравариантный вектор, если при линейном преобразовании переменных (1) его преобразованные
составляющие определяются формулой a̅r = csr as (5).
Имеется и другой способ преобразования элементов объекта первого порядка. Мы уже видели, что
коэффициенты линейной формы переменных 𝑥 также образуют объект первого порядка. Таким образом,
коэффициенты линейной формы 𝑎𝑚 𝑥 𝑚 являются составляющими объекта 𝑎𝑟 . Предположим, что
составляющие 𝑎𝑟 преобразуются таким образом, что линейная форма 𝑎𝑚 𝑥 𝑚 остаётся инвариантной
относительно преобразования переменных (1). Если обозначить через ̅̅̅ 𝑎𝑟 новые составляющие объекта 𝑎𝑟 , то
𝑎𝑚 ̅̅̅̅
получится ̅̅̅̅𝑥 𝑚 = 𝑎 𝑥 𝑚 , так как эта линейная форма есть инвариант, тогда из 𝑥 𝑟 = 𝛾 𝑟 ̅̅̅̅
𝑚 𝑎𝑚 ̅̅̅̅
𝑚 𝑥 следует ̅̅̅̅𝑥
𝑚 𝑚 =

𝑎𝑚 𝛾𝑝𝑚 ̅̅̅
𝑥 𝑝.
Поскольку немой индекс может быть обозначен любой буквой, то эту систему уравнений можно записать в
𝑚 ̅̅̅
виде (𝑎̅̅̅ 𝑝
𝑝 − 𝑎𝑚 𝛾𝑝 )𝑥 = 0.
Если это соотношение справедливо для всех значений переменных ̅̅̅ 𝑥 𝑟 , то должно выполняться равенство
𝑚
𝑎𝑟 = 𝛾𝑟 𝑎𝑚 . Это преобразование отлично от преобразования, задаваемого формулой (5). Объект первого
̅̅̅
порядка, составляющие которого преобразуются по этому закону, называется ковариантным тензором первого
порядка или ковариантным вектором.
Таким образом, есть два типа тензоров первого порядка, их можно различать с помощью положения
индекса. Если тензор контравариантен, мы используем верхний индекс, если же он ковариантен, то нижний.
Другими словами, верхний индекс обозначает контравариантность, а нижний индекс – ковариантность.
22. Тензоры любого порядка.
Рассмотрим объект второго порядка. Простейшим видом такого объекта является произведение двух
векторов или объектов первого порядка. Такое произведение может быть трех различных типов:
1) произведение двух контравариантных векторов;
2) произведение двух ковариантных векторов;
3) произведение контравариантного и ковариантного векторов.
1) Например, (𝑎𝑟 𝑏 𝑠 ) есть объект второго порядка, который является произведением двух
контравариантных векторов 𝑎𝑟 , 𝑏 𝑟 . Составляющие этого объекта в новых переменных определяются
формулами (𝑎 ̅̅̅𝑟 ̅̅̅ 𝑟 𝑚 )(𝑐 𝑠 𝑛 )
𝑏 𝑠 ) = (𝑐𝑚 𝑎 𝑛𝑏 = 𝑐𝑚𝑟 𝑠 (𝑎𝑚 𝑛 ).
𝑐𝑛 𝑎 Следовательно, объект второго порядка 𝑎𝑟𝑠 может
иметь закон преобразования ̅̅̅̅ 𝑎𝑟𝑠 = 𝑐𝑚 𝑟 𝑠 𝑚𝑛
𝑐𝑛 𝑎
Объект, составляющие которого преобразуются по этому закону, называется контравариантным
тензором второго порядка. Он обозначается при помощи двух верхних индексов.
2) (𝑎𝑟 𝑏𝑠 ) есть объект второго порядка, который является произведением двух ковариантных векторов
𝑎𝑟 , 𝑏𝑟 . Его составляющие в новых переменных будут (𝑎 ̅ 𝑚 𝑛 𝑚 𝑛
𝑟 𝑠 ) = (𝛾𝑟 𝑎𝑚 )(𝛾𝑠 𝑏𝑛 ) = 𝛾𝑟 𝛾𝑠 (𝑎𝑚 𝑏𝑛 ).
̅̅̅𝑏
Следовательно, объект второго порядка 𝑎𝑟𝑠 может преобразовываться по закону ̅̅̅̅ 𝑎𝑟𝑠 = 𝛾𝑟𝑚 𝛾𝑠𝑛 𝑎𝑚𝑛 . Объект,
преобразующийся по этому закону, называется ковариантным тензором второго порядка. Он обозначается
при помощи двух нижних индексов.
3) (𝑎𝑟 𝑏𝑠 ) есть объект второго порядка, образованный умножением контравариантного вектора 𝑎𝑟 и
ковариантного вектора 𝑏𝑟 . Преобразование этого объекта производится по формулам (𝑎 ̅̅̅𝑟 𝑏̅𝑠 ) =
𝑟 𝑚 )(𝛾 𝑛 ) 𝑟 𝑚 𝑚 𝑟
(𝑐𝑚 𝑎 𝑠 𝑏𝑛 = 𝑐𝑚 𝛾𝑠 (𝑎 𝑏𝑛 ). Следовательно, объект второго порядка 𝑎𝑠 может преобразовываться по
̅̅̅
𝑟 𝑟 𝑛 𝑚
закону 𝑎𝑠 = 𝑐𝑚 𝛾𝑠 𝑎𝑛 . Такой объект называется смешенным тензором второго порядка. Он обозначается
при помощи одного верхнего и одного нижнего индексов.

23. Сложение, умножение и свертывание тензоров.


Сложение соответствующих составляющих двух объектов одного и того же порядка и типа даёт другой
𝑟 𝑟 𝑟
объект того же порядка и типа. Таким образом, если есть два объекта третьего порядка 𝑎𝑠𝑡 и 𝑏𝑠𝑡 , то 𝑐𝑠𝑡 =
𝑟 𝑟
𝑎𝑠𝑡 + 𝑏𝑠𝑡 определяет третий объект, называемый суммой двух исходных.
𝑟 𝑟 𝑟
Покажем, что если 𝑎𝑠𝑡 , 𝑏𝑠𝑡 являются тензорами третьего порядка, то и 𝑐𝑠𝑡 также является тензором третьего
𝑟 𝑛 𝑝 𝑚 𝑟 𝑛 𝑝 𝑚
порядка. Для составляющих в новой системе переменных имеем 𝑐𝑠𝑡 = 𝑎𝑠𝑡 + ̅̅̅̅
̅̅̅̅
𝑟 ̅̅̅̅
𝑟 𝑟
𝑏𝑠𝑡 = 𝑐𝑚 𝛾𝑠 𝛾𝑡 𝑎𝑛𝑝 + 𝑐𝑚 𝛾𝑠 𝛾𝑡 𝑏𝑛𝑝 =
𝑟 𝑛 𝑝 𝑚 𝑚 𝑟 𝑛 𝑝 𝑚
𝑐𝑚 𝛾𝑠 𝛾𝑡 (𝑎𝑛𝑝 + 𝑏𝑛𝑝 ) = 𝑐𝑚 𝛾𝑠 𝛾𝑡 𝑐𝑛𝑝 , что и доказывает это утверждение.
Таким образом, операция сложения, применённая к двум тензорам, даёт тензор того же самого порядка и
типа. Это справедливо и для вычитания, как частного случая сложения. Из этих результатов следует, что
система равенств 𝑎𝑠𝑟 = 𝑏𝑠𝑟 образует так называемое тензорное уравнение. Под этим следует понимать, что если
эти равенства справедливы в одних каких-нибудь переменных, то они справедливы и во всех других
переменных. Чтобы доказать это, заметим, что у тензора (𝑎𝑠𝑟 − 𝑏𝑠𝑟 ) в одной из систем переменных все
составляющие равны нулю и, следовательно, то же самое имеет место во всех других переменных.
При умножении каждой составляющей одного объекта на каждую составляющую другого в результате
получается объект, порядок которого равен сумме порядков обоих исходных объектов. Таким образом, если
𝑟 𝑝 𝑝𝑡
𝑎𝑠𝑡 является объектом третьего порядка, а 𝑏𝑞 – объектом второго порядка, то объект 𝑐𝑞𝑠𝑡 , называемый
𝑝𝑡𝑟 𝑝
произведением исходных объектов, определяется равенствами 𝑐𝑞𝑠𝑡 = 𝑏𝑞 𝑎𝑠𝑡 и является объектом пятого
порядка. Процесс умножения, применённый к тензорам, снова приводит к тензорам. Отметим, что в
операциях сложения и умножения нижние индексы остаются нижними, а верхние – верхними.
Далее рассмотрим операцию свёртывания, будучи применена к тензорам, она также снова приводит к
𝑟
тензорам. Возьмём смешенный тензор, например, третьего порядка, и обозначим его 𝑎𝑠𝑡 . Если мы сделаем
𝑟
индексы 𝑟 и 𝑡 одинаковыми, то придём к объекту 𝑎𝑠𝑟 . Если мы вспомним, что немой индекс означает
суммирование от 1 до 3, то порядок объекта уменьшился на две единицы – за счет одного ковариантного и
другого контравариантного индекса.
Покажем, что свёрнутый тензор также является тензором. Обозначив, как обычно, преобразованные
𝑟 𝑛 𝑝 𝑚
составляющие буквами с чертой сверху, имеем ̅̅̅̅
𝑟
𝑎𝑠𝑡 = 𝑐𝑚 𝛾𝑠 𝛾𝑡 𝑎𝑛𝑝 .
̅̅̅̅ 𝑟 𝑛 𝑝 𝑚 𝑝 𝑝
𝑟
Приводя свёртку по 𝑟 и 𝑡, получаем выражение 𝑎𝑠𝑟 = 𝑐𝑚 𝛾𝑠 𝛾𝑟 𝑎𝑛𝑝 = 𝛿𝑚 𝛾𝑠𝑛 𝑎𝑛𝑝
𝑚
= 𝛾𝑠𝑛 𝑎𝑛𝑝 , которое
𝑟
показывает, что 𝑏𝑠 = 𝑎𝑠𝑟 есть ковариантный вектор.
24. Обратный тензорный признак.
Дана система уравнений вида 𝐴𝑟𝑠𝑡 𝐵 𝑠𝑡 = 𝐶 𝑟 , связывающая объекты 𝐴𝑟𝑠𝑡 , 𝐵 𝑠𝑡 , 𝐶 𝑟 .
Известно, что 𝐴𝑟𝑠𝑡 и 𝐵 𝑠𝑡 – тензоры типов, определённых расположением их индексов, следовательно, мы
можем заключить, что 𝐶 𝑟 есть тензор, так как он получен умножением и последующим свёртыванием двух
других тензоров. Очень важно уметь распознавать тензоры, так сказать, обратным способом.
Существует следующий признак. Если нам дано соотношение 𝐴(𝑟, 𝑠, 𝑡)𝐵 𝑠𝑡 = 𝐶 𝑟 , где известно, что 𝐶 𝑟
является некоторым определённым тензором, а 𝐵 𝑠𝑡 – произвольным тензором, то 𝐴(𝑟, 𝑠, 𝑡) также есть тензор,
который может быть представлен как 𝐴𝑟𝑠𝑡 .
Для доказательства выше сказанного сделаем линейное преобразование ̅̅̅ 𝑥 𝑟 = 𝑐𝑠𝑟 𝑥 𝑠 переменных 𝑥 𝑟 в ̅̅̅ 𝑥𝑟,
причём буквы с чертой сверху будут относиться к новым переменным. Имеем 𝐴(𝑟, 𝑠, 𝑡)𝐵 ̅̅̅̅̅
𝑠𝑡 = ̅
𝐶̅̅𝑟̅ = с𝑟𝑚 𝐶 𝑚 =
𝑛 𝑝 ̅̅̅̅̅ 𝑝 ̅̅̅̅̅
𝑐𝑚 𝐴(𝑚, 𝑛, 𝑝)𝐵 и 𝐵 = 𝛾𝑠 𝛾𝑡 𝐵 , поэтому [𝐴̅(𝑟, 𝑠, 𝑡) − с𝑚 𝛾𝑠 𝛾𝑡 𝐴(𝑚, 𝑛, 𝑝)]𝐵 = 0 (∗).
𝑟 𝑛𝑝 𝑛𝑝 𝑠𝑡 𝑟 𝑛 𝑠𝑡

Но 𝐵 𝑠𝑡 есть совершенно произвольный тензор и, следовательно, ̅̅̅̅̅𝐵 𝑠𝑡 – тоже произвольный тензор. Поэтому
𝑝
все коэффициенты при ̅̅̅̅̅
𝐵 𝑠𝑡 в (∗) должны равняться нулю, или 𝐴̅(𝑟, 𝑠, 𝑡) = с𝑟𝑚 𝛾𝑠𝑛 𝛾𝑡 𝐴(𝑚, 𝑛, 𝑝). Но это и
показывает, что 𝐴(𝑟, 𝑠, 𝑡) является тензором третьего порядка и что его правильная запись есть 𝐴𝑟𝑠𝑡 .
Важно отметить, что тензор 𝐵 𝑠𝑡 должен быть совершенно произвольным, причём степень произвола не
должна быть ограничена существованием симметрии или антисимметрии.
Особенно существенным является то, что у произвольных тензоров мы можем давать произвольное
значение какой-нибудь одной из составляющих и считать все остальные равными нулю.

25. Псевдотензоры.
𝑟 𝑛 𝑝 𝑚
𝑟
До сих пор объект 𝑎𝑠𝑡 назывался тензором, если он преобразовывался по закону ̅̅̅̅ 𝑟
𝑎𝑠𝑡 = 𝑐𝑚 𝛾𝑠 𝛾𝑡 𝑎𝑛𝑝 (1)
Преобразование самих переменных 𝑥 𝑟 в переменные ̅̅̅ 𝑥 𝑟 имеет вид 𝑥 𝑟 = 𝛾𝑠𝑟 ̅̅̅
𝑥 𝑠 . Причём детерминант этого
преобразования 𝛾 = |𝛾𝑗𝑖 | не равен нулю.
Мы распространяем название тензора на объект 𝑎𝑠𝑡 𝑟
который преобразуется по закону ̅̅̅̅ 𝑟
𝑎𝑠𝑡 =
𝑀 𝑟 𝑛 𝑝 𝑚 𝑀
(𝛾) 𝑐𝑚 𝛾𝑠 𝛾𝑡 𝑎𝑛𝑝 (2), где под выражением (𝛾) подразумевается определитель 𝛾, возведённый в степень 𝑀.
Закон преобразования (2) отличается от (1) только множителем (𝛾)𝑀 в правой части. Закон преобразования
(1) есть только частный случай закона (2), соответствующий 𝑀 = 0, так что наше новое определение тензора
включает в себя старое.
Объект, который преобразуется по закону (2), назовём псевдотензором, а число 𝑀 – его весом. Тензоры, о
которых шла речь до сих пор, все имели вес, равный нулю.
Обычно мы будем под словом тензор понимать истинный тензор, если только противоположное не
оговорено специально. Псевдотензоры первого и нулевого порядков называются соответственно
псевдовекторами и псевдоскалярами. Мы будем заниматься главным образом истинными векторами и
скалярами.
Важно отметить, что, если нам известен какой-нибудь псевдоскаляр веса, равного единице, мы можем
немедленно превратить любой псевдотензор в истинный тензор. Для этого предположим, что величина 𝐾 есть
𝑟
псевдоскаляр веса 1 и что 𝑎𝑠𝑡 есть псевдотензор веса 𝑀.
Закон преобразования величины 𝐾 ̅ определяется формулой 𝐾 ̅ = 𝛾𝐾 и, следовательно, 𝐾 ̅ 𝑀 = (𝛾)𝑀 𝐾 𝑀 , где
обе части возведены в степень 𝑀. Другими словами, 𝐾 𝑀 есть псевдоскаляр веса 𝑀. Кроме того, ̅̅̅̅ 𝑟
𝑎𝑠𝑡 =
𝑀 𝑟 𝑛 𝑝 𝑚
(𝛾) 𝑐𝑚 𝛾𝑠 𝛾𝑡 𝑎𝑛𝑝 .
̅ −𝑀 ̅̅̅̅
𝑟 𝑟 𝑛 𝑝
Следовательно, (𝐾 𝑎𝑠𝑡 ) = 𝑐𝑚 𝛾𝑠 𝛾𝑡 (𝐾 −𝑀 𝑎𝑛𝑝
𝑚
), то есть (𝐾 −𝑀 𝑎𝑠𝑡
𝑟 )
есть истинный тензор. Впоследствии мы
будем всюду, где это возможно, пользоваться таким способом для превращения псевдотензоров в истинные
тензоры и, следовательно, мы будем почти всегда иметь дело с истинными тензорами.

26. Общие преобразования. Тензоры относительно общего преобразования.


Общие преобразования:
Предположим, что формулы преобразования имеют вид ̅̅̅ 𝑥 𝑟 = 𝑓 𝑟 (𝑥 1 , 𝑥 2 , 𝑥 3 ) (1), где 𝑓 1 , 𝑓 2 , 𝑓 3 –
произвольные функции. Мы предполагаем, что функции, с которыми нам придётся иметь дело, обладают
производными любого порядка и что преобразование (1) обратимо. Следовательно, мы можем написать
̅̅̅1 , ̅̅̅
обратное преобразование 𝑥 𝑟 = 𝑔𝑟 (𝑥 𝑥 2 , ̅̅̅
𝑥 3 ) (2)
̅̅̅𝑟̅
𝜕𝑥
Для того чтобы преобразование было обратимо, необходимо и достаточно, чтобы определитель 𝑐 = |𝜕𝑥 𝑠 | не
равнялся нулю. Этот определитель часто называют якобианом. Отметим, что линейное преобразование ̅̅̅
𝑥𝑟 =
𝑟 𝑠
𝑐𝑠 𝑥 , есть только частичный случай общего преобразования (1) являются линейными однородными
функциями.
̅̅̅𝑟̅
̅̅̅𝑟 = 𝜕𝑥 𝑠 𝑑𝑥 𝑠 (3)
𝑑𝑥 𝜕𝑥
Если мы возьмём дифференциалы от (1) и (2), то получим 𝜕𝑥 𝑟
.
𝑟
𝑑𝑥 = ̅̅̅𝑠 𝑑𝑥 ̅̅̅𝑠 (4)
𝜕𝑥
̅̅̅𝑟̅
𝜕𝑥 𝜕𝑥 𝑟
Если положить = 𝑐𝑠𝑟 , 𝛾𝑟 ̅̅̅𝑟 = 𝑐𝑠𝑟 𝑑𝑥 𝑠 ,
= 𝜕𝑥 𝑠 𝑠 ̅̅̅𝑠 ,
то мы видим, что уравнения (3) и (4) принимают вид 𝑑𝑥
𝜕𝑥
̅̅̅𝑠 .
𝑑𝑥 𝑟 = 𝛾𝑠𝑟 𝑑𝑥
Другими словами, преобразование дифференциалов является линейным, аналогичным ̅̅̅ 𝑥 𝑟 = 𝑐𝑠𝑟 𝑥 𝑠 и 𝑥 𝑟 =
𝑟 ̅̅̅̅
𝛾𝑚 𝑥 𝑚 . Существенная разница состоит в том, что здесь коэффициенты 𝑐 и 𝛾 не постоянны, а являются
функциями 𝑥 𝑟 или ̅̅̅
𝑥𝑟.
Тензоры относительно общего преобразования:
Определим теперь тензоры относительно общих преобразований (1).
Если дан набор функций, образующий объект некоторого порядка, мы говорим, что этот объект есть тензор
относительно преобразования (1), если он является тензором по отношению к линейному преобразованию
дифференциалов (3), (4).
𝑟
Подобным же образом объект 𝑎𝑠𝑡 является псевдотензором веса 𝑀 относительно общего преобразования,
если его составляющие ̅̅̅̅
𝑎𝑠𝑡 в новых переменных удовлетворяют соотношениям ̅̅̅̅
𝑟 𝑟
𝑎𝑠𝑡 =
𝑀 ̅̅̅𝑟̅ 𝜕𝑥 𝑛 𝜕𝑥 𝑝
𝜕𝑥 𝑖 𝜕𝑥 𝑚 (5)
|𝜕𝑥 𝑗 | 𝜕𝑥 𝑚 𝜕𝑥̅̅̅𝑠 ̅̅̅𝑡 𝑎𝑛𝑝 для всех значений переменных. Как и прежде, тензоры порядка один и нуль
𝜕𝑥
называется соответственно векторами и скалярами, а псевдотензоры веса нуль называется истинными
тензорами.
Так как линейное преобразование есть только частный случай общего преобразования, то все объекты,
которые являются тензорами относительно общих преобразований, являются также тензоры относительно
линейных преобразований. Однако обратное не верно: существуют объекты, которые являются тензорами
относительно линейных преобразований и не являются тензорами относительно общих преобразований.
Например, сами переменные являются векторами относительно линейных преобразований, но не являются
векторами относительно преобразования (1).
Из строения формул (5), которые дают определение тензора, мы видим, что все число алгебраические по
своему характеру операции применимы в равной мере как к тензорам относительно общего преобразования,
так и к тензорам относительно линейного преобразования. Следовательно, все важные результаты
относительно, сложения, умножения и свертывания, а также относительно тензорных признаков могут быть
применимы без изменения к тензорам относительно преобразования (1).
Большую часть внимания мы будем уделять истинным тензорам, и под словом тензор мы будем понимать
именно истинный тензор, если специально не оговорено противоположное. Правило преобразования
̅̅̅𝑟̅ 𝜕𝑥 𝑛 𝜕𝑥 𝑝
𝜕𝑥
истинного тензора 𝑎𝑠𝑡 𝑟
имеет вид ̅̅̅̅
𝑟
𝑎𝑠𝑡 = 𝑚
𝑎𝑛𝑝 . ̅̅̅𝑡
̅̅̅𝑠 𝜕𝑥
𝜕𝑥 𝑚 𝜕𝑥

27. Численные схемы реализации метода Гаусса.


𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 = 𝑏1 𝑎11 ⋯ 𝑎1𝑛
{ 21 𝑥1 + 𝑎22 𝑥2 +…⋯ + 𝑎2𝑛 𝑥𝑛 = 𝑏2 или 𝐴𝑥 = 𝑏, где 𝐴 = ( ⋮
𝑎 ⋱ ⋮ ) – квадратная матрица 𝑛-го
𝑎𝑛1 𝑥1 + 𝑎𝑛2 𝑥2 + ⋯ + 𝑎𝑛𝑛 𝑥𝑛 = 𝑏𝑛 𝑎𝑛1 ⋯ 𝑎 𝑛𝑛
𝑥1 𝑏1
порядка; 𝑥 = ( ⋮ ), 𝑏 = ( ⋮ ) – столбцы размеров (𝑛 ⨯ 1). Это означает, что число уравнений совпадает с
𝑥𝑛 𝑏𝑛
числом неизвестных, то есть 𝑚 = 𝑛. Выполняется условие det 𝐴 ≡ |𝐴| ≠ 0.
Метод Гаусса содержит две совокупности операций, которые условно названы прямым ходом и обратным
ходом.
Прямой ход состоит в исключении элементов, расположенных ниже главной диагонали матрицы 𝐴. При
этом матрица 𝐴 с помощью элементарных преобразований преобразуется к верхней треугольной, а
расширенная матрица (𝐴|𝑏) – к трапециевидной:
𝑎11 𝑎12 ⋯ 𝑎1𝑛 𝑏1 1 𝑎̃12 ⋯ 𝑎̃1𝑛 𝑏̃1
𝑎 𝑎22 ⋯ 𝑎 2𝑛 𝑏2 ⋯ 𝑎̃2𝑛 𝑏̃2
(𝐴|𝑏) = ( 21
⋮ ⋮ | )~ 0 1 | = (𝐴̃|𝑏̃)
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑎𝑛1 𝑎𝑛2 ⋯ 𝑎𝑛𝑛 𝑏𝑛 (0 0 ⋯ 1 𝑏̃𝑛 )
Обратный ход состоит в решении системы 𝐴̃𝑥 = 𝑏. ̃
28. Метод прогонки.
Метод прогонки применяется, когда матрица системы трёхдиагональная.
𝛼𝑖 𝑥𝑖−1 − 𝛽𝑖 𝑥𝑖 + 𝛾𝑖 𝑥𝑖+1 = 𝛿𝑖 (1), где 𝛼1 = 𝛾𝑛 = 0, 𝑖 = 1, … , 𝑛
−𝛽1 𝛾1 0 0 ⋯ 0 0 𝛿1
𝛼2 −𝛽2 𝛾2 0 ⋯ 0 0 𝛿2
𝛼 𝛾 ⋯ 0 0 |
0 3 −𝛽3 3
⋯ | 𝛿3
⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯
( 0 0 ⋯ ⋯ ⋯ 𝛼𝑛 −𝛽𝑛 𝛿𝑛 )
Если к (1) приметить алгоритм прямого хода метода Гаусса, то вместо исходной расширенной матрицы
получится трапециевидная:
1 −𝑃1 0 0 ⋯ 0 𝑄1
0 1 −𝑃2 0 ⋯ 0 𝑄2
|
0 0 1 −𝑃3 ⋯ 0 | 𝑄3
⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯
(0 0 0 0 ⋯ 1 𝑄𝑛 )
Учитывая, что последний столбец в этой матрице соответствует правой части, и переходя к системе,
включающей неизвестные, получаем рекуррентную формулу:
𝑥𝑖 = 𝑃𝑖 𝑥𝑖+1 + 𝑄𝑖 , 𝑖 = 1, … , 𝑛 − 1 (2)
𝑃𝑖 , 𝑄𝑖 – прогоночные элементы. Запишем (2) для индекса 𝑖 − 1: 𝑥𝑖−1 = 𝑃𝑖−1 𝑥𝑖 + 𝑄𝑖−1 и подставим в (1).
Получим, 𝛼𝑖 (𝑃𝑖−1 𝑥𝑖 + 𝑄𝑖−1 ) − 𝛽𝑖 𝑥𝑖 + 𝛾𝑖 𝑥𝑖+1 = 𝛿𝑖
Получим рекуррентные соотношения для 𝑃𝑖 , 𝑄𝑖 :
𝛾𝑖 𝛼 𝑄 −𝛿
𝑃𝑖 =
𝛽𝑖 −𝛼𝑖 𝑃𝑖−1
, 𝑄𝑖 = 𝑖 𝑖−1 𝑖, 𝑖 = 1, … , 𝑛 − 1 (3)
𝛽𝑖 −𝛼𝑖 𝑃𝑖−1
Определение прогоночных коэффициентов по формулам (3) соответствует прямому ходу метода прогонки.
Обратный ход метода прогонки начинается с вычисления 𝑥𝑛 . Для этого используется последнее уравнение,
коэффициенты которого определены в прямом ходе, и последнее уравнение исходной системы:
𝑥𝑛−1 = 𝑃𝑛−1 𝑥𝑛 + 𝑄𝑛−1 , 𝛼𝑛 𝑥𝑛−1 − 𝛽𝑛 𝑥𝑛 + 0 ∗ 𝑥𝑛+1 = 𝛿𝑛 .
Тогда определяется 𝑥𝑛 :
𝛼 𝑄 −𝛿
𝑥𝑛 = 𝑛 𝑛−1 𝑛 = 𝑄𝑛 , то есть 𝑥𝑛 = 𝑄𝑛 .
𝛽𝑛 −𝛼𝑛 𝑃𝑛−1
Прямой ход:
𝛾1 𝛿1
1) Вычислить 𝑃1 = ; 𝑄1 = −
𝛽1 𝛽1
2) Вычислить прогоночные коэффициенты 𝑃2 , 𝑄2 ; 𝑃3 , 𝑄3 ; … ; 𝑃𝑛−1 , 𝑄𝑛−1
Обратный ход:
𝛼 𝑄 −𝛿
1) Найти 𝑥𝑛 = 𝑛 𝑛−1 𝑛
𝛽𝑛 −𝛼𝑛 𝑃𝑛−1
2) Значения 𝑥𝑛−1 , 𝑥𝑛−2 , … , 𝑥1 определить по формуле (2): 𝑥𝑛−1 = 𝑃𝑛−1 𝑥𝑛 + 𝑄𝑛−1 , 𝑥𝑛−2 = 𝑃𝑛−2 𝑥𝑛−1 +
𝑄𝑛−2 , … , 𝑥1 = 𝑃1 𝑥2 + 𝑄1
Замечания:
1. Аналогичный подход используется для решения систем линейных алгебраических уравнений с
пятидиагональными матрицами.
2. Алгоритм метода прогонки называется корректным, если ∀𝑖 = 1, … , 𝑛, 𝛽𝑖 − 𝛼𝑖 𝑃𝑖−1 ≠ 0, и устойчивым,
если |𝑃𝑖 | < 1, 𝑖 = 1, … , 𝑛 − 1
3. Достаточным условием корректности и устойчивости прогонки является условие преобладания
диагональных элементов в матрице 𝐴, а которой 𝛼𝑖 ≠ 0 и 𝛾𝑖 ≠ 0 (𝑖 = 2,3, … , 𝑛 − 1): |𝛽𝑖 | ≥ |𝛼𝑖 | + |𝛾𝑖 |
29. LU-разложение.
𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 = 𝑏1
𝐿𝑈-разложение еще один метод решения задач { 𝑎21 𝑥1 + 𝑎22 𝑥2 +…⋯ + 𝑎2𝑛 𝑥𝑛 = 𝑏2 или 𝐴𝑥 = 𝑏.
𝑎𝑛1 𝑥1 + 𝑎𝑛2 𝑥2 + ⋯ + 𝑎𝑛𝑛 𝑥𝑛 = 𝑏𝑛
Метод опирается на возможность представления квадратной матрицы 𝐴 системы в виде произведения двух
треугольных матриц:
𝑙11 0 ⋯ 0
𝑙21 𝑙22 ⋯ 0
𝐴 = 𝐿𝑈 (1), где 𝐿 – нижняя, а 𝑈 – верхняя треугольные матрицы, 𝐿 = ( ), 𝑈 =
⋮ ⋮ ⋱ ⋮
𝑙𝑛1 𝑙𝑛2 ⋯ 𝑙𝑛𝑛
1 𝑢12 ⋯ 𝑢1𝑛
⋯ 𝑢2𝑛
(0 1 )
⋮ ⋮ ⋱ ⋮
0 0 ⋯ 1
С учётом (1) система 𝐴𝑥 = 𝑏 представляется в форме 𝐿𝑈𝑥 = 𝑏 (2)
Решение системы (2) сводится к последовательному решению двух простых систем с треугольными
матрицами. В итоге процедура решения состоит из двух этапов
Прямой ход.
Произведение 𝑈𝑥 обозначается через 𝑦. В результате решения системы 𝐿𝑦 = 𝑏 находится вектор 𝑦.
Обратный ход.
В результате решения системы 𝑈𝑥 = 𝑦 находится решение задачи – столбец 𝑥.
Замечание. Всякую квадратную матрицу 𝐴, имеющую отличные от нуля угловые миноры △1 = 𝑎11 ≠ 0,
𝑎11 𝑎12
△2 = |𝑎 | ≠ 0, …, △𝑛 = |𝐴| ≠ 0, можно представить в виде 𝐿𝑈-разложения, причём это разложение будет
21 𝑎22
единственным. Это условие выполняется для матриц с преобладанием диагональных элементов, у которых
|𝑎𝑖𝑖 | > ∑𝑛𝑗=1|𝑎𝑖𝑗 |, 𝑖 = 1, 2, … , 𝑛.
𝑗≠𝑖
Алгоритм:
1. Выполнить операцию факторизации исходной матрицы 𝐴, применяя схемы или формулы (3), и
получить матрицы 𝐿 и 𝑈.
2. Решить систему 𝐿 𝑦 = 𝑏.
3. Решить систему 𝑈 𝑥 = 𝑦.

30. Методы решения задач о собственных значениях и собственных векторах матрицы.


Пусть задана квадратная матрица 𝐴 порядка 𝑛. Напомним, что числа 𝜆1 , 𝜆2 , … , 𝜆𝑛 , являющиеся решениями
характеристического уравнения: |𝐴 − 𝜆𝐸| = 0, называются характеристическими (собственными) значениями
матрицы 𝐴, а соответствующие каждому 𝜆𝑖 , 𝑖 = 1, … , 𝑛, ненулевые векторы 𝑋 𝑖 , удовлетворяющие системе
𝐴𝑋 𝑖 = 𝜆𝑖 𝑋 𝑖 или (𝐴 − 𝜆𝑖 𝐸)𝑋 𝑖 = 0, 𝑖 = 1,2, … , 𝑛, называются собственными векторами.
Различают полную и частичную проблему собственных значений, когда необходимо найти весь спектр (все
собственные значения) и все линейно независимые собственные векторы либо часть спектра, например:
𝜌(𝐴) = max|𝜆𝑖 (𝐴)| и min|𝜆𝑖 (𝐴)|. Величина 𝜌(𝐴) называется спектральным радиусом.
𝑖 𝑖
Для решения частичной проблемы собственных значений и собственных векторов в практических расчетах
используется метод итераций (степенной метод). На его основе можно определить приближенно собственные
значения матрицы 𝐴 и спектральный радиус 𝜌(𝐴) = max|𝜆𝑖 (𝐴)|.
Пусть матрица 𝐴 имеет 𝑛 линейно независимых собственных векторов 𝑋 𝑖 , 𝑖 = 1, … , 𝑛, и собственные
значения матрицы 𝐴 таковы, что 𝜌(𝐴) = |𝜆1 (𝐴)| > |𝜆2 (𝐴)| ≥ ⋯ ≥ |𝜆𝑛 (𝐴)|.
Алгоритм:
1. Выбрать произвольное начальное (нулевое) приближение собственного вектора 𝑋1(0) (индекс в
скобках – номер приближения, а первый индекс – номер собственного значения). Положить 𝑘 = 0.
1(1)
(1) 𝑥𝑖
2. Найти 𝑋1(1) = 𝐴𝑋1(0) , 𝜆1 = 1(0) , где 𝑖 – любой номер 1 ≤ 𝑖 ≤ 𝑛 и положить 𝑘 = 1.
𝑥𝑖
3. Вычислить 𝑋1(𝑘+1) = 𝐴𝑋1(𝑘)
1(𝑘+1)
(𝑘+1) 𝑥𝑖 1(𝑘) 1(𝑘+1)
4. Найти 𝜆1 = 1(𝑘) , где 𝑥𝑖 , 𝑥𝑖 – соответствующие координаты векторов 𝑋1(𝑘+1) и 𝑋1(𝑘) . При
𝑥𝑖
этом может быть использована любая координата с номером 𝑖, 1 ≤ 𝑖 ≤ 𝑛.
(𝑘+1) (𝑘) (𝑘+1)
5. Если △= |𝜆1 − 𝜆1 | ≤ 𝜀, процесс завершить и положить 𝜆1 ≅ 𝜆1 , 𝜌(𝐴) = |𝜆1 |. Если △> 𝜀,
положить 𝑘 = 𝑘 + 1 и перейти к пункту 3.