Вы находитесь на странице: 1из 7

Пусть 𝑋, 𝑌 – нормированные пространства, 𝑈 ⊂ 𝑋 открыто, 𝑎 ∈ 𝑈, и задана функция

𝑓: 𝑈 →𝑌.
Определение. Функция 𝑓 называется дифференцируемой в точке 𝑎, если существует такое
непрерывное линейное отображение 𝐿𝑎 : 𝑋 → 𝑌 , что

𝑓 (𝑎 + ℎ) = 𝑓 (𝑎) + 𝐿𝑎 (ℎ) + 𝛼(ℎ)‖ℎ‖, (1)

для некоторой функции 𝛼, такой что 𝛼(ℎ) → 0.


Линейное отображение 𝐿𝑎 называется дифференциалом 𝑓 в точке 𝑎 и обозначается 𝑑𝑓𝑎 .
Замечание. Формула (1) не определяет значение 𝛼 в нуле. В дальнейшем будем считать,
что 𝛼(0) = 0 и, значит, функция 𝛼 непрерывна в нуле.
Формулу (1) также можно записать в виде

𝑓 (𝑎 + ℎ) = 𝑓 (𝑎) + 𝑑𝑓𝑎 (ℎ) + 𝑜(‖ℎ‖), ℎ → 0.

Замечание. Если функция 𝑓 дифференцируема в точке 𝑎, то она непрерывна в 𝑎. Действи-


тельно, точка 𝑎 – внутренняя точка 𝑈 , и из (1) следует, что lim 𝑓 (𝑎+ℎ) = 𝑓 (𝑎), что равносильно
ℎ→0
lim 𝑓 (𝑥) = 𝑓 (𝑎).
𝑥→𝑎

Определение. Пусть 𝑣 ∈ 𝑋, и функция 𝑓 определена на множестве {𝑎 + 𝑡𝑣 : |𝑡| < ∆} для


некоторого ∆ > 0. Предел
𝑓 (𝑎 + 𝑡𝑣) − 𝑓 (𝑎)
lim ,
𝑡→0 𝑡
если этот предел существует, называется производной 𝑓 по вектору 𝑣 в точке 𝑎 и обозначается
𝜕𝑓
𝜕𝑣
(𝑎) (а также 𝑓𝑣′ (𝑎) и 𝜕𝑣 𝑓 (𝑎)).
Если ‖𝑣‖ = 1, то производную по вектору 𝑣 иногда называют производной по направлению 𝑣 .
Теорема 1. Если функция 𝑓 : 𝑈 → 𝑌 дифференцируема в точке 𝑎, и 𝑣 ∈ 𝑋 , то существует
𝜕𝑓
𝜕𝑣
(𝑎)= 𝑑𝑓𝑎 (𝑣).
N Если 𝑣 = 0, то равенство верно. Пусть 𝑣 ̸= 0. Выберем 𝛿>0 так, что 𝐵𝛿 (𝑎) ⊂ 𝑈 . Полагая в
𝛿
(1) ℎ = 𝑡𝑣 для всех 𝑡 с |𝑡| < , получим
‖𝑣‖

𝑓 (𝑎 + 𝑡𝑣) = 𝑓 (𝑎) + 𝑑𝑓𝑎 (𝑡𝑣) + 𝛼(𝑡𝑣)‖𝑡𝑣‖.

В силу линейности 𝑑𝑓𝑎 (𝑡𝑣) = 𝑡𝑑𝑓𝑎 (𝑣). Далее, по непрерывности 𝛼 в 0 имеем 𝛼(𝑡𝑣) → 0 при 𝑡 → 0,
поэтому
𝜕𝑓 𝑓 (𝑎 + 𝑡𝑣) − 𝑓 (𝑎)
(𝑎) = lim = lim (𝑑𝑓𝑎 (𝑣) ± 𝛼(𝑡𝑣)‖𝑣‖) = 𝑑𝑓𝑎 (𝑣). 
𝜕𝑣 𝑡→0 𝑡 𝑡→0

Следствие. Если функция 𝑓 дифференцируема в точке 𝑎, то ее дифференциал в точке 𝑎


определен однозначно.

Пример. Непрерывное линейное отображение 𝐿 : 𝑋 → 𝑌 дифференцируемо в любой точке


𝑎∈𝑋 с 𝑑𝐿𝑎 = 𝐿. Это следует из равенства 𝐿(𝑎 + ℎ) = 𝐿(𝑎) + 𝐿(ℎ).
Запишем определение дифференцируемости функции для 𝑋 = R𝑛 и 𝑌 = R𝑚 .
Случай функций из R в R𝑚 .
𝑚
Дифференцируемость функции 𝛾 : (𝛼, 𝛽) → R в точке 𝑎 ∈ (𝛼, 𝛽) определялась ранее как
′ 𝛾(𝑎+𝑡)−𝛾(𝑎)
существование производной 𝛾 (𝑎) = lim . Это согласуется с определением дифферен-
𝑡→0 𝑡

цируемости, поскольку наличие предела равносильно 𝛾(𝑎+𝑡)−𝛾(𝑎) = 𝑡𝛾 (𝑎)+𝑡𝜎(𝑡), где 𝜎(𝑡) → 0

при 𝑡 → 0. Таким образом, 𝑑𝛾𝑎 (𝑡) = 𝑡𝛾 (𝑎).

Случай функций из R𝑛 в R.
Пусть 𝑈 ⊂ R𝑛 открыто, и функция 𝑓 : 𝑈 → R. Пусть 𝑒1 , . . . , 𝑒𝑛 – стандартный базис в R𝑛 .

1
Определение. Производная по вектору 𝑒𝑘 в точке 𝑎, т.е. 𝜕𝑓
𝜕𝑒𝑘
(𝑎) = lim 𝑓 (𝑎+𝑡𝑒𝑘𝑡 )−𝑓 (𝑎) , называется
𝑡→0
частной производной функции 𝑓 по переменной 𝑥𝑘 в точке 𝑎 и обозначается
𝜕𝑓
𝜕𝑥𝑘
(𝑎) (а также
𝑓𝑥′ 𝑘 (𝑎) и 𝜕𝑘 𝑓 (𝑎)).
𝜕𝑓
Замечание. По определению
𝜕𝑥𝑘
(𝑎) = 𝜙′ (𝑎𝑘 ), где 𝜙(𝑡) = 𝑓 (𝑎1 , . . . , 𝑎𝑘−1 , 𝑡, 𝑎𝑘+1 , . . . , 𝑎𝑛 ). В
этом состоит правило вычисления частной производной.

Из теоремы 1 получаем утверждения.


Следствие 1. Если 𝑓 : 𝑈 ⊂ R𝑛 → R дифференцируема в точке 𝑎, то она имеет в этой точке
𝑛
𝜕𝑓 𝜕𝑓
(𝑎) ℎ𝑘 для всех ℎ ∈ R𝑛 .
∑︀
частные производные
𝜕𝑥𝑘
(𝑎), 𝑘 = 1,. . . , 𝑛, и 𝑑𝑓𝑎 (ℎ) =
𝜕𝑥𝑘
𝑘=1
𝜕𝑓
N По теореме 1 существуют 𝜕𝑥 (𝑎) = 𝑑𝑓𝑎 (𝑒𝑘 ), следовательно, в силу линейности
(︃𝑘 𝑛 )︃ 𝑛 𝑛
∑︁ ∑︁ ∑︁ 𝜕𝑓
𝑑𝑓𝑎 (ℎ) = 𝑑𝑓𝑎 ℎ𝑘 𝑒𝑘 = ℎ𝑘 𝑑𝑓𝑎 (𝑒𝑘 ) = (𝑎) ℎ𝑘 . 
𝑘=1 𝑘=1 𝑘=1
𝜕𝑥𝑘
Замечание. Дифференциал координатной функции 𝑝𝑘 (𝑥1 , . . . , 𝑥𝑛 ) = 𝑥𝑘 не зависит от точки;
обозначим его через 𝑑𝑥𝑘 , тогда 𝑑𝑥𝑘 (ℎ) = ℎ𝑘 для любого ℎ ∈ R𝑛 . Линейные функции 𝑑𝑥1 , . . . , 𝑑𝑥𝑛
𝑛 *
образуют базис в пространстве (R ) , двойственный к 𝑒1 , . . . , 𝑒𝑛 . Теперь имеем функциональную
запись дифференциала:
𝑛
∑︁ 𝜕𝑓
𝑑𝑓𝑎 = (𝑎) 𝑑𝑥𝑘 .
𝑘=1
𝜕𝑥𝑘
На значение 𝑑𝑓𝑎 (ℎ) можно смотреть как на скалярное произведение вектора ℎ и вектора,
составленного из частных производных.
(︁ )︁𝑇
Определение. Вектор
𝜕𝑓
𝜕𝑥1
𝜕𝑓
(𝑎), . . . , 𝜕𝑥 𝑛
(𝑎) называется градиентом функции 𝑓 в точке 𝑎
и обозначается grad 𝑓 (𝑎) или ∇𝑓 (𝑎).
Следствие 2. Если 𝑓 дифференцируема в точке 𝑎, и grad 𝑓 (𝑎) ̸= 0, то для любого 𝑣 ∈ R𝑛 с
|𝑣| = 1 выполнено ⃒ ⃒
⃒ 𝜕𝑓 ⃒
⃒ (𝑎)⃒ 6 | grad 𝑓 (𝑎)|,
⃒ 𝜕𝑣 ⃒

причем равенство достигается лишь при 𝑣 = ± | grad 𝑓 (𝑎)


grad 𝑓 (𝑎)|
.

N Так как 𝜕𝑓
𝜕𝑣
(𝑎) = 𝑑𝑓𝑎 (𝑣) = (grad 𝑓 (𝑎), 𝑣), то по неравенству Коши-Буняковского-Шварца
⃒ 𝜕𝑓 ⃒
⃒ (𝑎)⃒ 6 | grad 𝑓 (𝑎)| · |𝑣| = | grad 𝑓 (𝑎)|, причем равенство достигается лишь в случае колли-
𝜕𝑣
grad 𝑓 (𝑎)
неарности grad 𝑓 (𝑎) и 𝑣 , т. е. 𝑣 = ± . 
| grad 𝑓 (𝑎)|
Существование производной по вектору при 𝑛 > 1 не гарантирует непрерывности функции.
Пример. Пусть 𝑓 : R2 → R, {︃
1, 𝑦 = 𝑥2 , 𝑥 > 0
𝑓 (𝑥, 𝑦) =
0, иначе.
𝜕𝑓
Тогда
𝜕𝑣
(0, 0) = 0 для любого 𝑣 ∈ R2 , но функция 𝑓 разрывна в точке (0, 0).
Тем не менее, в терминах частных производных можно получить довольно простой признак
дифференцируемости.

Теорема 2. Пусть 𝑓 : 𝑈 ⊂ R𝑛 → R, точка 𝑎 ∈ 𝑈 . Если все частные производные


𝜕𝑓
𝜕𝑥𝑘
определены в окрестности 𝑎 и непрерывны в точке 𝑎, то 𝑓 дифференцируема в точке 𝑎.
𝜕𝑓 𝑇
N Пусть все 𝜕𝑥 определены в 𝐵𝑟 (𝑎) ⊂ 𝑈 . Рассмотрим ℎ = (ℎ1 , . . . , ℎ𝑛 ) с |ℎ| < 𝑟 , и определим
𝑘
∑︀𝑘
точки 𝑥0 = 𝑎, 𝑥𝑘 = 𝑎 + ℎ𝑗 𝑒𝑗 . Тогда приращение
𝑗=1 𝑛 𝑛
∑︁ (︀ )︀ ∑︁ (︀ )︀
𝑓 (𝑎 + ℎ) − 𝑓 (𝑎) = 𝑓 (𝑥𝑘 ) − 𝑓 (𝑥𝑘−1 ) = 𝑓 (𝑥𝑘−1 + ℎ𝑘 𝑒𝑘 ) − 𝑓 (𝑥𝑘−1 ) .
𝑘=1 𝑘=1

Функция 𝑔(𝑡) = 𝑓 (𝑥𝑘−1 + 𝑡𝑒𝑘 ) − 𝑓 (𝑥𝑘−1 ) на отрезке с концами 0 и ℎ𝑘 (при ℎ𝑘 ̸= 0) имеет


𝜕𝑓
производную 𝑔 ′ (𝑡) = 𝜕𝑥𝑘
(𝑥𝑘−1 + 𝑡𝑒𝑘 ). По теореме Лагранжа о среднем 𝑔(ℎ𝑘 ) − 𝑔(0) = 𝑔 ′ (𝜉𝑘 )ℎ𝑘

2
для некоторого 𝜉𝑘 между 0 и ℎ𝑘 . Положим 𝑐𝑘 (ℎ) = 𝑥𝑘−1 + 𝜉𝑘 𝑒𝑘 , тогда последнее равенство
𝜕𝑓
перепишется в виде 𝑓 (𝑥𝑘 ) − 𝑓 (𝑥𝑘−1 ) = 𝜕𝑥 𝑘
(𝑐𝑘 )ℎ𝑘 , причем 𝑐𝑘 → 0 при ℎ → 0. Поэтому
𝑛 𝑛 (︂ )︂
∑︁ 𝜕𝑓 ∑︁ 𝜕𝑓 𝜕𝑓
𝑓 (𝑎 + ℎ) − 𝑓 (𝑎) − (𝑎)ℎ𝑘 = (𝑐𝑘 ) − (𝑎) ℎ𝑘 =
𝑘=1
𝜕𝑥 𝑘
𝑘=1
𝜕𝑥 𝑘 𝜕𝑥𝑘
𝑛 (︂ )︂
∑︁ 𝜕𝑓 𝜕𝑓 ℎ𝑘
= (𝑐𝑘 ) − (𝑎) |ℎ| =: 𝛼(ℎ)|ℎ|.
𝑘=1
𝜕𝑥 𝑘 𝜕𝑥𝑘 |ℎ|

𝜕𝑓
В силу непрерывности
𝜕𝑥𝑘
в точке 𝑎 и неравенства |ℎ𝑘 | 6 |ℎ| функция 𝛼(ℎ) → 0 при ℎ → 0.
Следовательно, 𝑓 дифференцируема в точке 𝑎. 

Случай функций из R𝑛 в R𝑚 .
𝑈 ⊂ R𝑛 открыто, и функция 𝑓 : 𝑈 → R𝑚 , 𝑓 = (𝑓1 , . . . , 𝑓𝑚 )𝑇 .
Пусть
Лемма 1. Функция 𝑓 дифференцируема в точке 𝑎 ⇔ все ее координатные функции 𝑓𝑖
дифференцируемы в точке 𝑎.
N Пусть 𝑓 дифференцируема в точке 𝑎. Запишем равенство (1) покоординатно:
𝑓𝑖 (𝑎 + ℎ) = 𝑓𝑖 (𝑎) + 𝐿𝑖 (ℎ) + 𝛼𝑖 (ℎ)|ℎ|. (2)
Координатные функции 𝐿𝑖 дифференциала 𝐿𝑎 линейны, а условие “ 𝛼(ℎ) → 0 при ℎ → 0” рав-
носильно условиям “ 𝛼𝑖 (ℎ) → 0 при ℎ → 0”, 𝑖 = 1, . . . , 𝑚, поэтому функция 𝑓𝑖 дифференцируема
в точке 𝑎.
Обратно, если выполнены условия (2) с линейными функциями 𝐿𝑖 и 𝛼𝑖 (ℎ) → 0, то выполнено
равенство (1) с отображением 𝐿𝑎 = (𝐿1 , . . . , 𝐿𝑚 )𝑇 и 𝛼 = (𝛼1 , . . . , 𝛼𝑚 )𝑇 . 
Действие линейного отображения из R𝑛
R𝑚 на вектор есть умножение этого вектора слева
в
на матрицу, поэтому найдется такая матрица 𝐷𝑓𝑎 размера 𝑚 × 𝑛, что 𝑑𝑓𝑎 (ℎ) = 𝐷𝑓𝑎 · ℎ для всех
ℎ ∈ R𝑛 .
Определение. Матрица 𝐷𝑓𝑎 называется матрицей Яко́би функции 𝑓 в точке 𝑎.
Из леммы 1 следует, что 𝑑𝑓 (ℎ) = (𝑑𝑓1 (ℎ), . . . , 𝑑𝑓𝑚 (ℎ))𝑇 , поэтому 𝑖𝑗 -й элемент матрицы Якоби
𝜕𝑓𝑖
в точке 𝑎 равен значению 𝑑(𝑓𝑖 )𝑎 (𝑒𝑗 ), т.е. 𝜕𝑥 𝑗
(𝑎). Таким образом, строками матрицы Якоби 𝑓 в
точке 𝑎 являются градиенты ее координатных функций в этой точке.

Определение. 𝑈 ⊂ R𝑛 открыто, и 𝑓 : 𝑈 → R𝑚 , 𝑓 = (𝑓1 , . . . , 𝑓𝑚 )𝑇 . Функция 𝑓 называ-


Пусть
ется непрерывно дифференцируемой на 𝑈 , если все функции
𝜕𝑓𝑖
определены и непрерывны на
𝜕𝑥𝑗
1 𝑚
𝑈 . Множество всех таких функций обозначим 𝐶 (𝑈 ; R ).
Лемма 2. Функция 𝑓 непрерывно дифференцируема на 𝑈 ⇔ 𝑓 дифференцируема в каждой
точке 𝑈 и отображение 𝑑𝑓 : 𝑈 → ℒ(R𝑛 , R𝑚 ) непрерывно.
N Пусть 𝑓 дифференцируема на 𝑈 . Положим ‖𝐴‖ = sup |𝐴ℎ|
|ℎ|
– операторная норма на простран-
ℎ̸=0
стве матриц размера 𝑚×𝑛. Поскольку 𝑑𝑓𝑥 (ℎ) = 𝐷𝑓𝑥 ℎ для всех 𝑥 ∈ 𝑈 и ℎ ∈ R𝑛 , то ‖𝑑𝑓𝑥 ‖ = ‖𝐷𝑓𝑥 ‖.
Рассмотрим еще норму ‖𝐴‖𝑀 = max |𝑎𝑖𝑗 |, 𝐴 = (𝑎𝑖𝑗 ). Нормы ‖ · ‖ и ‖ · ‖𝑀 эквивалентны.
Теперь утверждение следует из следующей цепочки равносильностей

𝜕𝑓𝑖 𝜕𝑓𝑖
lim ‖𝑑𝑓𝑥 − 𝑑𝑓𝑎 ‖ = 0 ⇔ lim ‖𝐷𝑓𝑥 − 𝐷𝑓𝑎 ‖𝑀 = 0 ⇔ (𝑥) → (𝑎) при 𝑥 → 𝑎 ∀𝑖, 𝑗 
𝑥→𝑎 𝑥→𝑎 𝜕𝑥𝑗 𝜕𝑥𝑗

Правила дифференцирования

Пусть 𝑋, 𝑌 – нормированные пространства, 𝑈 ⊂𝑋 открыто.


Если функции 𝑓, 𝑔 : 𝑈 → 𝑌 и 𝜆: 𝑈 → R дифференцируемы в точке 𝑎, то

1) 𝑓 +𝑔 дифференцируема в точке 𝑎, и 𝑑(𝑓 + 𝑔)𝑎 = 𝑑𝑓𝑎 + 𝑑𝑔𝑎 ;

2) 𝜆·𝑓 дифференцируема в точке 𝑎, и 𝑑(𝜆 · 𝑓 )𝑎 = 𝜆(𝑎) 𝑑𝑓𝑎 + 𝑑𝜆𝑎 𝑓 (𝑎).

3
N Докажем только пункт 2. По определению дифференцируемости

𝜆(𝑎 + ℎ) − 𝜆(𝑎) = 𝑑𝜆𝑎 (ℎ) + 𝜇(ℎ)‖ℎ‖, 𝑓 (𝑎 + ℎ) − 𝑓 (𝑎) = 𝑑𝑓𝑎 (ℎ) + 𝛼(ℎ)‖ℎ‖,


где функции 𝜇(ℎ) → 0 и 𝛼(ℎ) → 0 при ℎ → 0. Тогда

𝜆(𝑎 + ℎ) 𝑓 (𝑎 + ℎ) − 𝜆(𝑎) 𝑓 (𝑎) = 𝜆(𝑎 + ℎ) (𝑓 (𝑎 + ℎ) − 𝑓 (𝑎)) + (𝜆(𝑎 + ℎ) − 𝜆(𝑎)) 𝑓 (𝑎) =


(︀ )︀ (︀ )︀
= 𝜆(𝑎 + ℎ) 𝑑𝑓𝑎 (ℎ) + 𝛼(ℎ)‖ℎ‖ + 𝑑𝜆𝑎 (ℎ) + 𝜇(ℎ)‖ℎ‖ =
= 𝜆(𝑎)𝑑𝑓𝑎 (ℎ) + 𝑑𝜆𝑎 (ℎ)𝑓 (𝑎) + 𝛾(ℎ)‖ℎ‖,
𝑑𝑓𝑎 (ℎ)
где 𝛾(ℎ) = 𝜆(𝑎 + ℎ)𝛼(ℎ) + (𝜆(𝑎 + ℎ) − 𝜆(𝑎)) + 𝜇(ℎ)𝑓 (𝑎).
‖ℎ‖
Поскольку из дифференцируемости следует непрерывность, функция 𝜆 ограничена в окрест-
ности 𝑎 и разность 𝜆(𝑎 + ℎ) − 𝜆(𝑎) → 0. Далее, существует такое 𝐶 > 0, что ‖𝑑𝑓𝑎 (ℎ)‖ 6 𝐶‖ℎ‖.
Учитывая еще, что 𝜇(ℎ) → 0, имеем 𝛾(ℎ) → 0 при ℎ → 0. 

Теорема 3 (дифференцирование композиции). Пусть 𝑋 , 𝑌 , 𝑍 – нормированные простран-


ства, 𝑈 открыто в 𝑋 , 𝑉 открыто в 𝑌 . Если функция 𝑓 : 𝑈 → 𝑌 дифференцируема в точке 𝑎,
функция 𝑔 : 𝑉 → 𝑍 дифференцируема в точке 𝑓 (𝑎), и 𝑓 (𝑈 ) ⊂ 𝑉 , то композиция 𝑔 ∘ 𝑓 : 𝑈 → 𝑍
дифференцируема в точке 𝑎, и 𝑑(𝑔 ∘ 𝑓 )𝑎 = 𝑑𝑔𝑓 (𝑎) ∘ 𝑑𝑓𝑎 .
N Положим 𝑏 = 𝑓 (𝑎). По определению дифференцируемости
𝑓 (𝑎 + ℎ) = 𝑓 (𝑎) + 𝑑𝑓𝑎 (ℎ) + 𝛼(ℎ)‖ℎ‖, 𝛼(ℎ) → 0 при ℎ → 0,
𝑔(𝑏 + 𝑘) = 𝑔(𝑏) + 𝑑𝑔𝑏 (𝑘) + 𝛽(𝑘)‖𝑘‖, 𝛽(𝑘) → 0 при 𝑘 → 0.
Подставляя во второе равенство вместо 𝑘 выражение κ(ℎ) = 𝑑𝑓𝑎 (ℎ) + 𝛼(ℎ)‖ℎ‖, получим
(︀ )︀ (︀ )︀ (︁ )︁
𝑔 𝑓 (𝑎 + ℎ) = 𝑔 𝑏 + κ(ℎ) = 𝑔(𝑏) + 𝑑𝑔𝑏 𝑑𝑓𝑎 (ℎ) + 𝛼(ℎ)‖ℎ‖ + 𝛽(κ(ℎ))‖κ(ℎ)‖ =
(︀ )︀ (︀ )︀
= 𝑔(𝑏) + 𝑑𝑔𝑏 𝑑𝑓𝑎 (ℎ) + ‖ℎ‖𝑑𝑔𝑏 𝛼(ℎ) + 𝛽(κ(ℎ))‖κ(ℎ)‖ =
= 𝑔(𝑓 (𝑎)) + 𝑑𝑓𝑏 𝑑𝑔𝑎 (ℎ) + 𝛾(ℎ)‖ℎ‖,
‖κ(ℎ)‖
где 𝛾(ℎ) = 𝑑𝑔𝑏 (𝛼(ℎ)) + 𝛽(κ(ℎ)) . Для завершения доказательства нужно показать, что
‖ℎ‖
функция 𝛾 является бесконечно малой при ℎ → 0.
По теореме о непрерывности композиции функции 𝑑𝑔𝑏 (𝛼(ℎ)) и 𝛽(κ(ℎ)) непрерывны в нуле и
их значения там равны 0. Существует такое 𝐶 > 0, что ‖𝑑𝑓𝑎 (ℎ)‖ 6 𝐶‖ℎ‖, откуда заключаем, что
‖κ(ℎ)‖
дробь ограничена в некоторой проколотой окрестности 0. Поэтому 𝛾(ℎ) → 0 при ℎ → 0
‖ℎ‖
как сумма двух бесконечно малых. 

Рассмотрим подробнее случай функций 𝑓 : 𝑈 ⊂ R𝑛 → 𝑉 и 𝑔 : 𝑉 ⊂ R𝑚 → R. Для матриц


Якоби дифференцируемость композиции означает:
⎛ 𝜕𝑓1 𝜕𝑓1 ⎞
(︂ )︂ (︂ )︂ 𝜕𝑥 (𝑎) . . . (𝑎)
𝜕(𝑔 ∘ 𝑓 ) 𝜕(𝑔 ∘ 𝑓 ) 𝜕𝑔 𝜕𝑔 1 𝜕𝑥𝑛
(𝑎) . . . (𝑎) = (𝑏) . . . (𝑏) ⎝ ... ... ... ⎠.
𝜕𝑥1 𝜕𝑥𝑛 𝜕𝑦1 𝜕𝑦𝑚 𝜕𝑓𝑚 𝜕𝑓𝑚
𝜕𝑥1
(𝑎) . . . 𝜕𝑥𝑛
(𝑎)
𝑚
𝜕(𝑔∘𝑓 ) ∑︀ 𝜕𝑔 𝜕𝑓𝑖
Откуда следует, что
𝜕𝑥𝑗
(𝑎) = 𝜕𝑦𝑖
(𝑏) · 𝜕𝑥𝑗
(𝑎).
𝑖=1
Запишем дифференциал композиции:

𝜕(𝑔 ∘ 𝑓 ) 𝜕(𝑔 ∘ 𝑓 )
𝑑(𝑔 ∘ 𝑓 )𝑎 = (𝑎) 𝑑𝑥1 + · · · + (𝑎) 𝑑𝑥𝑛 =
𝜕𝑥1 𝜕𝑥𝑛
(︃ 𝑚 )︃ (︃ 𝑚 )︃
∑︁ 𝜕𝑔 𝜕𝑓𝑖 ∑︁ 𝜕𝑔 𝜕𝑓𝑖
= (𝑏) · (𝑎) 𝑑𝑥1 + · · · + (𝑏) · (𝑎) 𝑑𝑥𝑛 =
𝑖=1
𝜕𝑦𝑖 𝜕𝑥1 𝑖=1
𝜕𝑦𝑖 𝜕𝑥𝑛
𝑚
(︃ 𝑛 )︃ 𝑚
∑︁ 𝜕𝑔 ∑︁ 𝜕𝑓𝑖 ∑︁ 𝜕𝑔
= (𝑏) · (𝑎) 𝑑𝑥𝑗 = (𝑏) · 𝑑𝑦𝑖 , 𝑑𝑦𝑖 = 𝑑𝑓𝑖,𝑎
𝑖=1
𝜕𝑦𝑖 𝑗=1
𝜕𝑥𝑗 𝑖=1
𝜕𝑦𝑖
(инвариантность формы первого дифференциала ).

4
Частные производные и дифференциалы высших порядков

Пусть 𝑈 ⊂ R𝑛 𝑓 : 𝑈 → R, 𝑘 ∈ N.
открыто, функция
𝜕 𝑘−1 𝑓
Определение. Пусть частная производная порядка (𝑘 − 1) функции 𝑓 опре-
𝜕𝑥𝑖𝑘−1 . . . 𝜕𝑥𝑖1
делена в некоторой окрестности точки 𝑎 ∈ 𝑈 и имеет в точке 𝑎 производную по переменной 𝑥𝑖𝑘 ,
тогда
)︂ ⃒⃒
𝜕𝑘𝑓 𝜕 𝑘−1 𝑓
(︂
𝜕
(𝑎) =

𝜕𝑥𝑖𝑘 . . . 𝜕𝑥𝑖1 𝜕𝑥𝑖𝑘 𝜕𝑥𝑖𝑘−1 . . . 𝜕𝑥𝑖1


𝑥=𝑎
называется частной производной порядка 𝑘 функции 𝑓 в точке 𝑎. Частной производной 0-го
порядка будем называть 𝑓 (𝑎).
Если 𝑖𝑘 = · · · = 𝑖1 , т.е. 𝑥𝑖𝑘 , . . . , 𝑥𝑖1 одна и та же переменная, то такую частную производ-
𝜕𝑘 𝑓
ную называют чистой и обозначают (𝑎). Если среди переменных 𝑥𝑖𝑘 , . . . , 𝑥𝑖1 встречаются
𝜕𝑥𝑘 𝑖1
𝜕𝑘 𝑓
различные, то частную производную
𝜕𝑥𝑖𝑘 ...𝜕𝑥𝑖1
(𝑎) называют смешанной частной производной.

Вопрос о симметрии смешанных производных изучим для случая двух переменных, 𝑥 и 𝑦.


Теорема 4 (Юнг). Пусть 𝑈 ⊂ R2 открыто, и функция 𝑓 : 𝑈 → R. Если частные произ-
водные 𝜕𝑓
𝜕𝑥
и 𝜕𝑓
𝜕𝑦
определены в окрестности точки (𝑎, 𝑏) и дифференцируемы в (𝑎, 𝑏), то
𝜕 2𝑓 𝜕 2𝑓
(𝑎, 𝑏) = (𝑎, 𝑏).
𝜕𝑦 𝜕𝑥 𝜕𝑥 𝜕𝑦
𝜕𝑓 𝜕𝑓
N Выберем окрестность 𝐵𝛿 (𝑎, 𝑏), в которой определены
𝜕𝑥
и
𝜕𝑦
. Рассмотрим выражение

∆(𝑡) = 𝑓 (𝑎 + 𝑡, 𝑏 + 𝑡) − 𝑓 (𝑎 + 𝑡, 𝑏) − 𝑓 (𝑎, 𝑏 + 𝑡) + 𝑓 (𝑎, 𝑏), 0 < |𝑡| < 𝛿.

Функция 𝑔(𝑠) = 𝑓 (𝑎 + 𝑠, 𝑏 + 𝑡) − 𝑓 (𝑎 + 𝑠, 𝑏) на отрезке с концами 0 и 𝑡 имеет производную


𝜕𝑓
𝑔 ′ (𝑠) = 𝜕𝑥
(𝑎 + 𝑠, 𝑏 + 𝑡) − 𝜕𝑓
𝜕𝑥
(𝑎 + 𝑠, 𝑏). По теореме Лагранжа 𝑔(𝑡) − 𝑔(0) = 𝑔 ′ (𝜉)𝑡 для некоторого 𝜉
между 0 и 𝑡. Тогда в силу равенства ∆(𝑡) = 𝑔(𝑡) − 𝑔(0) и дифференцируемости 𝜕𝑓 𝜕𝑥
имеем

∆(𝑡) = 𝑔 ′ (𝜉)𝑡 = 𝜕𝑓𝜕𝑥


(𝑎 + 𝜉, 𝑏 + 𝑡)𝑡 − 𝜕𝑓𝜕𝑥
(𝑎 + 𝜉, 𝑏)𝑡 =
[︁ 2 2
]︁ [︁ ]︁
𝜕2𝑓
√︀
= 𝜕𝑓 𝜕𝑥
(𝑎, 𝑏) + 𝜕 𝑓
𝜕2𝑥
(𝑎, 𝑏)𝜉 + 𝜕 𝑓
𝜕𝑦𝜕𝑥
(𝑎, 𝑏)𝑡 + 𝛼(𝑡) 𝜉 2 + 𝑡2 𝑡 − 𝜕𝑓 (𝑎, 𝑏) +
𝜕𝑥 𝜕2𝑥
(𝑎, 𝑏)𝜉 + 𝛽(𝑡)|𝑡| 𝑡 =
[︂ √︁ ]︂
𝜕2𝑓 2
= 𝜕𝑦𝜕𝑥 (𝑎, 𝑏) ± 𝛼(𝑡) 1 + 𝜉𝑡2 ± 𝛽(𝑡) 𝑡2 ,

𝜕2𝑓
где 𝛼(𝑡) → 0, 𝛽(𝑡) → 0 при 𝑡 → 0. Следовательно, существует lim Δ(𝑡)
𝑡2
= 𝜕𝑦𝜕𝑥
(𝑎, 𝑏).
𝑡→0
𝜕2𝑓
Аналогично lim Δ(𝑡)
𝑡2
= 𝜕𝑥𝜕𝑦
(𝑎, 𝑏), что и доказывает теорему. 
𝑡→0
Распространим теорему на случай 𝑛 переменных.
Следствие. Пусть 𝑘 ∈ N, 𝑘 > 2. Если все частные производные до порядка 𝑘−2 диф-
ференцируемы в некоторой окрестности точки 𝑎, а все частные производные порядка 𝑘−1
дифференцируемы в точке 𝑎, то
𝜕𝑘𝑓 𝜕𝑘𝑓
(𝑎) = (𝑎)
𝜕𝑥𝑖𝑘 . . . 𝜕𝑥𝑖1 𝜕𝑥𝑗𝑘 . . . 𝜕𝑥𝑗1
при условии, что списки (𝑖1 , . . . , 𝑖𝑘 ) и (𝑗1 , . . . , 𝑗𝑘 ) отличаются лишь порядком.
N Индукция по 𝑘 . При 𝑘 = 2 положим 𝑥𝑟 = 𝑎𝑟 , 𝑟 ̸= 𝑖1 , 𝑖2 , тогда имеем функцию
двух перемен-
ных 𝑥𝑖 1
𝑥𝑖2 , и равенство вытекает по теореме 4.
и
Пусть 𝑘 > 2. Можно считать, что список (𝑗1 , . . . , 𝑗𝑘 ) получен из (𝑖1 , . . . , 𝑖𝑘 ) с помощью одной
транспозиции, т. е. обменом 𝑖𝑟 и 𝑖𝑟−1 .
𝜕 𝑟−2 𝑓
Рассмотрим 𝑔 = . По теореме 4 в окрестности точки 𝑎 имеет место равенство
𝜕𝑥𝑖𝑟−2 . . . 𝜕𝑥𝑖1
𝜕2𝑔 2 2 2

𝜕𝑥𝑖 𝜕𝑥𝑖
= 𝜕𝑥𝑖 𝜕 𝑔𝜕𝑥𝑖 . При 𝑟 = 𝑘 имеем 𝜕𝑥𝑖 𝜕𝜕𝑥𝑔𝑖 (𝑎) = 𝜕𝑥𝑖 𝜕 𝑔𝜕𝑥𝑖 (𝑎), что лишь формой записи
𝑟 𝑟−1 𝑟−1 𝑟 𝑟 𝑟−1 𝑟−1 𝑟

5
отличается от требуемого равенства; при 𝑟<𝑘 еще надо продифференцировать по переменным
𝑥𝑖𝑟+1 , . . . , 𝑥𝑖𝑘 и подставить 𝑥 = 𝑎. 
𝑈 ⊂ R𝑛 открыто, функция 𝑓 : 𝑈 → R𝑚 . Если 𝑓 дифференцируема в 𝑈 , то определен
Пусть
𝑛 𝑚
дифференциал 𝑑𝑓 : 𝑈 → ℒ(R , R ). Можно поставить вопрос о его дифференцируемости.
Если функция 𝑑𝑓 дифференцируема в 𝑈 , то ее дифференциал

𝑑(𝑑𝑓 ) : 𝑈 → ℒ R𝑛 , ℒ(R𝑛 , R𝑚 )
(︀ )︀

называют дифференциалом 2-го порядка. Используем то, что пространство ℒ R , ℒ(R , R )


(︀ 𝑛 𝑛 𝑚
)︀
𝑛 𝑛 𝑚
изоморфно пространству билинейных отображений 𝐿(R × R , R ), т.е. будем считать 𝑑(𝑑𝑓 )
билинейным отображением. По индукции определятся дифференциалы всех высших порядков.

Положим ℒ1 (R𝑛 , R𝑚 ) := ℒ(R𝑛 , R𝑚 ), ℒ𝑘 (R𝑛 , R𝑚 ) := ℒ(R𝑛 , ℒ𝑘−1 (R𝑛 , R𝑚 )).


𝑛 𝑛 𝑚
Пространство ℒ𝑘 отождествляется с пространством 𝐿(R × . . . × R , R ) всех 𝑘 линейных
отображений по правилу:
отображению 𝜙 ∈ ℒ𝑘 (R𝑛 , R𝑚 ) сопоставим 𝑘 -линейное отображение (𝑣1 , . . . , 𝑣𝑘 ) ↦→ 𝜙(𝑣1 ) . . . (𝑣𝑘 ),
где 𝑣1 , . . . , 𝑣𝑘 ∈ R𝑛 .
Определение. Пусть 𝑘 ∈ N, 𝑘 > 2.
Если дифференциал 𝑑
𝑘−1
(︀ 𝑘−1𝑓 определен
)︀ в некоторой
𝑘
окрестности точки 𝑎 и дифференцируем в точке 𝑎, то 𝑑 𝑓𝑎 := 𝑑 𝑑 𝑓 𝑎 , понимаемый как 𝑘 -
линейное отображение, называется дифференциалом 𝑘 -го порядка функции 𝑓 в точке 𝑎. При
этом функция 𝑓 называется 𝑘 раз дифференцируемой в точке 𝑎.
Лемма 3. Пусть 𝑣1 , . . . , 𝑣𝑘−1 ∈ R𝑛 . Если функция 𝑓 𝑘 раз дифференцируема в точке 𝑎, то
функция 𝑔(𝑥) = 𝑑𝑘−1 𝑓𝑥 (𝑣1 , . . . , 𝑣𝑘−1 ) дифференцируема в точке 𝑎 и 𝑑𝑔𝑎 (𝑣) = 𝑑𝑘 𝑓𝑎 (𝑣1 , . . . , 𝑣𝑘−1 , 𝑣).
N Рассмотрим отображение 𝜆, которое каждому (𝑘 − 1)-линейному отображению сопоставляет
𝑘−1
его значение на векторах 𝑣1 , . . . , 𝑣𝑘−1 . Тогда по определению 𝑔 = 𝜆 ∘ 𝑑 𝑓 . Очевидно, отобра-
жение 𝜆 линейно, поэтому 𝑑𝜆 = 𝜆 и, значит, по теореме о дифференцировании композиции

𝑑(𝜆 ∘ 𝑑𝑘−1 𝑓 )𝑎 = 𝜆 ∘ 𝑑(𝑑𝑘−1 𝑓 )𝑎 = 𝜆 ∘ 𝑑𝑘 𝑓𝑎 .


Следовательно, 𝑑𝑔𝑎 (𝑣) = 𝑑𝑘 𝑓𝑎 (𝑣1 , . . . , 𝑣𝑘−1 )(𝑣). 
Теорема 5. Дифференциал 𝑑𝑘 𝑓 симметричен, т.е. на наборах 𝑘 векторов, отличающихся
лишь порядком, принимает одинаковые значения.
N Достаточно установить совпадение на наборах векторов стандартного базиса и воспользо-
ваться линейностью.
𝜕𝑘 𝑓
Покажем по индукции, что 𝑑𝑘 𝑓𝑎 (𝑒𝑖1 , . . . , 𝑒𝑖𝑘 ) = 𝜕𝑥𝑖𝑘 ...𝜕𝑥𝑖1
(𝑎). При 𝑘 = 1 это следует из тео-
ремы 1 и определения частной производной. Если равенство верно для 𝑘 − 1, то по лемме 3
𝜕 𝑘−1 𝑓
производная дифференцируема в точке 𝑎 и
𝜕𝑥𝑖𝑘−1 ...𝜕𝑥𝑖1

𝑘−1 𝑘−1
)︂ ⃒⃒
𝜕𝑘𝑓
(︂ )︂ (︂
𝜕 𝑓 𝜕 𝜕 𝑓
𝑑𝑘 𝑓𝑎 (𝑒𝑖1 , . . . , 𝑒𝑖𝑘 ) = 𝑑 (𝑒𝑖𝑘 ) = = (𝑎).

𝜕𝑥𝑖𝑘−1 . . . 𝜕𝑥𝑖1 𝜕𝑥𝑖𝑘 𝜕𝑥𝑖𝑘−1 . . . 𝜕𝑥𝑖1 ⃒ 𝜕𝑥𝑖𝑘 . . . 𝜕𝑥𝑖1

𝑎 𝑥=𝑎

Симметричность 𝑑𝑘 𝑓 на наборах базисных векторов теперь вытекает по следствию теор 4. 


𝑘
Теорема 5 позволяет наряду с 𝑘 -линейным отображением 𝑑 𝑓𝑎 рассматривать соответствую-
𝑘 𝑘 𝑘 𝑘 𝑘
щую 𝑘 -форму ℎ ↦→ 𝑑 𝑓𝑎 (ℎ, . . . , ℎ) =: 𝑑 𝑓𝑎 (ℎ ). При 𝑚 = 1 форма 𝑑 𝑓𝑎 (ℎ ) является однородным
многочленом степени 𝑘 от компонент вектора ℎ:
𝑛 𝑛 𝑘
∑︁ ∑︁ 𝜕 𝑓
𝑑𝑘 𝑓𝑎 (ℎ𝑘 ) = ... (𝑎) ℎ𝑖1 . . . ℎ𝑖𝑘 , ℎ = (ℎ1 , . . . , ℎ𝑛 )𝑇 ∈ R𝑛 .
𝑖𝑘 =1 𝑖1 =1
𝜕𝑥 𝑖𝑘 . . . 𝜕𝑥 𝑖1

Из представления получаем, что 𝑑𝑝 𝑓 дифференцируем только в случае дифференцируемости


всех частных производных 𝑝-го порядка, т.е. справедливо
Следствие. Функция 𝑓 𝑘 раз дифференцируема в точке 𝑎, т. и т. т., к. все частные произ-
водные до порядка 𝑘 − 2 дифференцируемы в некоторой окрестности точки 𝑎, а все частные
производные порядка 𝑘 − 1 дифференцируемы в точке 𝑎.
Теперь мы можем доказать многомерный вариант формулы Тейлора.

6
Теорема 6. Пусть функция 𝑓 (𝑝 + 1) раз дифференцируема на открытом 𝑈 в R𝑛 . Если
точки 𝑎, 𝑎 + 𝑥 ∈ 𝑈 и отрезок [𝑎, 𝑎 + 𝑥] ⊂ 𝑈 , то найдется такое 𝜃 ∈ (0, 1), что
𝑝
∑︁ 1 𝑘 (︀ 𝑘 )︀ 1
𝑑𝑝+1 𝑓𝑎+𝜃𝑥 𝑥𝑝+1 .
(︀ )︀
𝑓 (𝑎 + 𝑥) = 𝑓 (𝑎) + 𝑑 𝑓𝑎 𝑥 +
𝑘=1
𝑘! (𝑝 + 1)!

N Рассмотрим функцию 𝑔(𝑡) = 𝑓 (𝑎 + 𝑡𝑥), определенную на интервале, содержащем [0, 1]. Так
как𝑡 ↦→ 𝑎 + 𝑡𝑥 есть сумма постоянного и линейного отображений, то 𝑑(𝑎 + 𝑡𝑥)𝑡 (𝜏 ) = 𝜏 · 𝑥 для

любого 𝜏 ∈ R. Поэтому по правилу дифференцирования композиции 𝑔 (𝑡)𝜏 = 𝑑𝑓𝑎+𝑡𝑥 (𝜏 · 𝑥). В
′ ′′ 2
частности, при 𝜏 = 1 имеем 𝑔 (𝑡) = 𝑑𝑓𝑎+𝑡𝑥 (𝑥). Дифференцируем еще раз, 𝑔 (𝑡)𝜏 = 𝑑 𝑓𝑎+𝑡𝑥 (𝑥, 𝜏 𝑥),
′′ 2 2 (𝑘)
откуда при 𝜏 = 1 получим 𝑔 (𝑡) = 𝑑 𝑓𝑎+𝑡𝑥 (𝑥 ). По индукции 𝑔 (𝑡) = 𝑑𝑘 𝑓𝑎+𝑡𝑥 (𝑥𝑘 ) при всех
𝑘 = 1, . . . , 𝑝 + 1.
Запишем для 𝑔 формулу Тейлора с остаточным членом в форме Лагранжа: для некоторого
𝜃𝑡 ∈ (0, 1) выполнено
𝑝
∑︁ 𝑔 (𝑘) (0) 𝑘 𝑔 (𝑝+1) (𝜃𝑡 ) 𝑝+1
𝑔(𝑡) = 𝑔(0) + 𝑡 + 𝑡 .
𝑘=1
𝑘! (𝑝 + 1)!
Искомая формула получается при 𝑡=1 с 𝜃 = 𝜃1 . 
Следствие (теорема Лагранжа о среднем). Пусть функция 𝑓 𝐵𝑟 (𝑎), и
дифференцируема в
‖𝑑𝑓𝑥 ‖ 6 𝑀 для всех 𝑥 ∈ 𝐵𝑟 (𝑎), тогда для любых 𝑥, 𝑦 ∈ 𝐵𝑟 (𝑎) выполнено |𝑓 (𝑦) − 𝑓 (𝑥)| 6 𝑀 |𝑦 − 𝑥|.
N По теореме 6 (при 𝑝 = 1) имеем 𝑓 (𝑦) = 𝑓 (𝑥) + 𝑑𝑓𝑥+𝜃(𝑦−𝑥) (𝑦 − 𝑥) для некоторого 𝜃𝑡 ∈ (0, 1). Так
как |𝑑𝑓𝑥+𝜃(𝑦−𝑥) (𝑦 − 𝑥)| 6 ‖𝑑𝑓𝑥+𝜃(𝑦−𝑥) ‖|𝑦 − 𝑥|, получаем требуемое неравенство. 

Лемма 4. Пусть 𝜙 : (R𝑛 )𝑘 → R𝑚 – 𝑘 -линейное симметрическое отображение, и Φ : R𝑛 → R𝑚 ,


Φ(𝑥) = 𝜙(𝑥𝑘 ). Тогда функция Φ дифференцируема и 𝑑Φ𝑥 (ℎ) = 𝑘𝜙(𝑥𝑘−1 , ℎ).
N Имеем Φ(𝑥 + ℎ) − Φ(𝑥) = 𝜙(𝑥 + ℎ, . . . , 𝑥 + ℎ) − 𝜙(𝑥, . . . , 𝑥) = 𝑘𝜙(𝑥𝑘−1 , ℎ)+ слагаемые 𝜙(𝑥𝑝 , ℎ𝑞 ),
где 𝑝 + 𝑞 = 𝑘 , 𝑞 > 2.
𝑝 𝑞 𝑝 𝑞
Покажем, что найдется такое 𝐶 > 0, что |𝜙(𝑥 , ℎ )| 6 𝐶|𝑥| |ℎ| . Если оба 𝑥, ℎ ненулевые, то
⃒ (︁(︀ )︀ (︀ )︀ )︁⃒
𝑥 𝑝 ℎ 𝑞 ⃒
|𝜙(𝑥𝑝 , ℎ𝑞 )| = ⃒𝜙 |𝑥| , |ℎ| ⃒|𝑥|𝑝 |ℎ|𝑞 6 𝐶|𝑥|𝑝 |ℎ|𝑞 для 𝐶 = max |𝜙(𝑥𝑘 )|. Оценка очевидно выпол-

|𝑥|=1
няется, когда хотя бы один из векторов нулевой.
Так как 𝑞 > 2, то из полученной оценки следует, что 𝜙(𝑥𝑝 , ℎ𝑞 ) = 𝑜(|ℎ|) при ℎ → 0, что
доказывает утверждение. 

Теорема 7. Если функция 𝑓 𝑝 раз дифференцируема в точке 𝑎, то


𝑝
∑︁ 1 𝑘 (︀ 𝑘 )︀
𝑑 𝑓𝑎 𝑥 + 𝑜 |𝑥|𝑝 , 𝑥 → 0.
(︀ )︀
𝑓 (𝑎 + 𝑥) = 𝑓 (𝑎) +
𝑘=1
𝑘!

N Индукция по 𝑝. При 𝑝=1 равенство верно по определению дифференцируемости. Предпо-


ложим, утверждение верно при 𝑝 − 1.
Рассмотрим функцию 𝜙(𝑥) = 𝑓 (𝑎+𝑥)−𝑓 (𝑎)−𝑑𝑓𝑎 (𝑥)− 21 𝑑2 𝑓𝑎 (𝑥2 )−. . .− 𝑝!1 𝑑𝑝 𝑓𝑎 (𝑥𝑝 ). Зафиксируем
ℎ ∈ R𝑛 . Тогда по лемме 4 имеем
1
𝑑𝜙𝑥 (ℎ) = 𝑑𝑓𝑎+𝑥 (ℎ) − 𝑑𝑓𝑎 (ℎ) − 𝑑2 𝑓𝑎 (𝑥, ℎ) − . . . − 𝑑𝑝 𝑓𝑎 (𝑥𝑝−1 , ℎ).
(𝑝 − 1)!
Применим предположение индукции к функции 𝑔(𝑦) = 𝑑𝑓𝑦 (ℎ):
1
𝑑𝑓𝑎+𝑥 (ℎ) = 𝑑𝑓𝑎 (ℎ) − 𝑑2 𝑓𝑎 (𝑥, ℎ) − . . . − 𝑑𝑝 𝑓𝑎 𝑥𝑝−1 , ℎ + 𝑜 |𝑥|𝑝−1 (ℎ).
(︀ )︀ (︀ )︀
(𝑝 − 1)!
(︀ 𝑝−1 )︀
Сравнивая последние равенства, получим 𝑑𝜙𝑥 = 𝑜 |𝑥| при 𝑥 → 0.
𝑝−1 𝑛
Зафиксируем 𝜀 > 0. Найдется такое 𝛿 > 0, что ‖𝑑𝜙𝑥 ‖ 6 𝜀|𝑥| при всех 𝑥 ∈ R , |𝑥| < 𝛿 . В
шаре 𝐵𝛿 (0) применим теорему о среднем (следствие выше), получим

|𝜙(𝑥)| = |𝜙(𝑥) − 𝜙(0)| 6 𝜀|𝑥|𝑝−1 |𝑥|,


т.е. 𝜙(𝑥) = 𝑜(|𝑥|𝑝 ) при 𝑥 → 0.