Вы находитесь на странице: 1из 226

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение


высшего профессионального образования
«ТАГАНРОГСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ
имени А.П. Чехова»

На правах рукописи

Голиков Александр Николаевич

МОДЕЛИРОВАНИЕ ЭЛЕКТРОН-ФОНОННОГО РАССЕЯНИЯ


В НАНОПРОВОЛОКАХ НА ОСНОВЕ СХЕМ ОБРАБОТКИ
С МИНИМИЗАЦИЕЙ ВРЕМЕННОЙ СЛОЖНОСТИ

Специальность:
05.13.18 – Математическое моделирование, численные методы
и комплексы программ

Диссертация на соискание ученой степени


кандидата технических наук

Научный руководитель: доктор технических наук,


профессор Ромм Я.Е.

ТАГАНРОГ 2012
2
СОДЕРЖАНИЕ

ВВЕДЕНИЕ............................................................................................................. 6

ГЛАВА 1. МОДИФИКАЦИЯ КОМПЬЮТЕРНОГО МЕТОДА


КУСОЧНО-ПОЛИНОМИАЛЬНОГО ВЫЧИСЛЕНИЯ ФУНКЦИЙ
ОДНОЙ ПЕРЕМЕННОЙ, ПРОИЗВОДНЫХ И ИНТЕГРАЛОВ ............... 36

1.1. Модификация кусочно-полиномиальной схемы аппроксимации


функций одной переменной. ............................................................................ 37
1.2. Равномерная сходимость кусочно-полиномиальной схемы
аппроксимации функций одной переменной. ................................................ 47
1.3. Применение кусочно-полиномиальной схемы для аппроксимации
производных и равномерная сходимость процесса численного
дифференцирования. ......................................................................................... 50
1.4. Применение кусочно-полиномиальной схемы для приближённого
вычисления определённых интегралов и равномерная сходимость
приближения. ..................................................................................................... 50
1.5. Временная сложность максимально параллельной формы кусочно-
полиномиальных схем ...................................................................................... 53
1.6. Сравнение предложенных схем аппроксимации с известными. ........... 57
1.7. Выводы ........................................................................................................ 63

ГЛАВА 2. КОМПЬЮТЕРНЫЙ МЕТОД КУСОЧНО-


ПОЛИНОМИАЛЬНОГО ВЫЧИСЛЕНИЯ ФУНКЦИЙ ДВУХ
ПЕРЕМЕННЫХ, ЧАСТНЫХ ПРОИЗВОДНЫХ И ДВОЙНЫХ
ИНТЕГРАЛОВ ..................................................................................................... 64

2.1. Компьютерная кусочно-полиномиальная схема аппроксимации


функций двух переменных. .............................................................................. 65
2.2. Равномерная сходимость компьютерной кусочно-полиномиальной
аппроксимации функций двух переменных и численный эксперимент по
компьютерной аппроксимации функций. ....................................................... 75
3
2.3. Применение компьютерной кусочно-полиномиальной схемы для
аппроксимации частных производных. .......................................................... 78
2.4. Численный эксперимент по аппроксимации частных производных. ... 81
2.5. Применение компьютерной кусочно-полиномиальной схемы для
приближённого вычисления двойных интегралов и скорость сходимости
процесса приближения. .................................................................................... 83
2.7. Временная сложность максимально параллельной формы алгоритмов
компьютерной кусочно-полиномиальной аппроксимации. ......................... 86
2.8. Сравнение компьютерных кусочно-полиномиальных схем
аппроксимации с известными. ......................................................................... 89
2.9. Выводы ........................................................................................................ 97

ГЛАВА 3. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ЭЛЕКТРОН-


ФОНОННОГО РАССЕЯНИЯ В GaAs НАНОПРОВОЛОКАХ ................ 99

3.1. Самосогласованный расчёт электронной структуры


нелегированной GaAs нанопроволоки. ......................................................... 100
3.2. Расчёт скорости электрон-фононного рассеяния в
нелегированной GaAs нанопроволоке. ......................................................... 108
3.3. Численный эксперимент по моделированию электронной структуры
GaAs нанопроволоки....................................................................................... 116
3.4. Численный эксперимент по моделированию электрон-фононного
рассеяния и физический смысл уточнений. ................................................. 127
3.5. Выводы ...................................................................................................... 134

ЗАКЛЮЧЕНИЕ ................................................................................................. 136

ЛИТЕРАТУРА ................................................................................................... 144

ПРИЛОЖЕНИЕ К ГЛАВЕ 1 ........................................................................... 159

4.1. Схема вычисления коэффициентов полинома по его корням ............. 159


4.2. Доказательство равномерной сходимости изложенного метода
приближённого вычисления определённых интегралов ............................. 161
4
4.3. Об аппроксимации функций, их производных и определённых
интегралов кусочно-полиномиальными схемами на основе ортогональных
полиномов. ....................................................................................................... 164
4.4. О приближении функций, производных и определённых интегралов на
основе интерполяционных полиномов с центральными разностями ........ 168
4.5. Численный эксперимент аппроксимации функций и производных при
помощи исходной и модифицированной кусочно-полиномиальной схемы.
........................................................................................................................... 169
4.6. Применение кусочно-полиномиальной схемы для аппроксимации
разрывных функций, их производных и определённых интегралов. ........ 180

ПРИЛОЖЕНИЕ К ГЛАВЕ 2 ........................................................................... 182

5.1. Представление двойных конечных разностей через значения функции.


........................................................................................................................... 182
5.2. Оценка скорости сходимости и доказательство равномерной
сходимости кусочно-полиномиальной аппроксимации функций двух
переменных. ..................................................................................................... 183
5.3. Оценка скорости сходимости и доказательство равномерной
сходимости кусочно-полиномиальной схемы приближённого вычисления
двойных интегралов. ....................................................................................... 185
5.4. Численный эксперимент по аппроксимации действительных функций
двух действительных переменных при помощи кусочно-полиномиальных
схем на базе интерполяции по Ньютону....................................................... 187
5.5. Численный эксперимент по аппроксимации частных производных при
помощи кусочно-полиномиальных схем на базе интерполяции по
Ньютону. .......................................................................................................... 208

ПРИЛОЖЕНИЕ К ГЛАВЕ 3 ........................................................................... 216

6.1. Аналитическое вычисление левой части аппроксимации уравнения


Пуассона. .......................................................................................................... 216
5
6.2. Описание численного эксперимента по моделированию электрон-
фононного рассеяния в GaAs нанопроволоке. ............................................. 219
6.3. Численный эксперимент по моделированию электрон-фононного
рассеяния в p-GaAs/AlAs транизисторной струтуре. .................................. 221

ЛИТЕРАТУРА К ПРИЛОЖЕНИЯМ ............................................................ 223

АКТЫ ОБ ИСПОЛЬЗОВАНИИ РЕЗУЛЬТАТОВ


ДИССЕРТАЦИОННОЙ РАБОТЫ ................................................................ 226
6

ВВЕДЕНИЕ

Актуальность проблемы. В настоящее время технологии электроники


позволяют производить полупроводниковые устройства наномасштаба с
различной геометрией, в частности – транзисторы на основе GaAs квантовых
проволок [1 – 3]. Проектирование таких устройств невозможно без
предварительного численного и компьютерного моделирования и требует
учёта квантовых эффектов высшего порядка в физических уравнениях, а
также уточнения численных методов их решения [4].
В квантовых проволоках движение электронов ограничено в двух
направлениях, что позволяет использовать для описания кинетических
процессов математическую модель одномерного электронного газа [5]. В
таком случае [6] электрон-фононное взаимодействие и соответствующие
скорости рассеяния [7, 8], а также электронная проводимость [9],
электронная структура [10], функции распределения [11] и подзоны энергии
[12] претерпевают изменения по сравнению с объёмным полупроводником.
Известно [5, 6], что электрон-фононное рассеяние оказывает
существенное влияние на явления электронного транспорта в системах
низкой размерности. В частности, от взаимодействия с продольными
оптическими фононами зависит подвижность носителей в GaAs и скорость
насыщения, которые определяют время отклика устройства, рабочие частоты
конструируемых микросхем, вольт-амперные характеристики приборов [6].
Для того чтобы используемая математическая модель электрон-фононного
взаимодействия находилась с одной стороны в максимальном согласии с
экспериментом, а с другой – не содержала избыточных вычислений, не
влияющих на конечный результат, необходимо определить доминирующие
механизмы рассеяния [13 – 17].
Расчёт электрон-фононного рассеяния в нанопроволоках. Для
расчёта скорости рассеяния электронов на фононах широко применяется
золотое правило Ферми [6] и кинетическое уравнение Больцмана [18] с
7
использованием аппроксимации Фока для само-энергии, основанной на
формализме функций Грина [19]. Такой подход позволяет принять во
внимание непараболичность дисперсионного соотношения для электронов
[20], однако учёт столкновительного уширения подзон энергии, в терминах
[15], а также квантовых корреляций между актами рассеяния приводит к
теоретическим противоречиям [17], заключающимся в том, что при таком
подходе функцией распределения электронов не может быть функция
Ферми-Дирака [21 – 23].
В обзоре Кнезевица, Рамайи и др. [24] для транзисторов со структурой
металл-оксид-полупроводник (МОП) на основе нанопроволок показан расчет
кулоновского рассеяния, рассеяния на шероховатостях поверхности и
рассеяния на акустических и оптических фононах в приближении
параболического закона дисперсии при помощи золотого правила Ферми. В
[25] учитывается непараболичность подзон энергии размерного квантования,
так для скорости рассеяния электронов на акустических фононах приводится
выражение вида [25]
1  2E f
E f , (1)
2
k BT 2m*
Wnacm E   Bac
  n x, y   m x, y  dx dy
2 2

2  v2 G E f 1  2E f 

где Bac – акустический деформационный потенциал, k B – постоянная

Больцмана, T – абсолютная температура, m* – эффективная масса электрона


в кристалле,  – редуцированная постоянная Планка,  – плотность
кристалла, v – скорость звука в кристалле,  n  x, y  ,  m  x, y  – волновые
функции n -го и m -го квантового состояния соответственно,  – фактор
непараболичности, E f – энергия электрона после рассеяния вида

1  4E z  1
E f  En  Em    ,
2
при этом   0 для упругого рассеяния,   0 для случая эмиссии
фонона,   0 – для случая абсорбции, E z – кинетическая энергия
8
движения вдоль оси нанопроволоки, E f  – единичная функция Хевисайда,

для которой справедливо соотношение


0, E f  0,
E f   
1, E f  0.

При таком подходе непараболичность дисперсионного соотношения


учитывается в (1) введением множителя  , что соответствует представлению
кинетической энергии отрезком ряда вида [26]

Ez 
2 2
2m *

k  k4 .  (2)

Представление энергии вида (2) является частным случаем разложения в


виде ряда с постоянными коэффициентами

E z   a2 i k 2 i . (3)
i 0

Приближение (2) является наиболее часто используемым, так как позволяет


проводить более точные вычисления по сравнению со случаем
параболических подзон, при этом уравнения усложняются не так
существенно, как при учёте большего числа членов ряда (3).
Методика самосогласованного вычисления скорости рассеяния
электронов на АПОФ и шероховатостях поверхности [4, 15, 23] в GaAs
нанопроволоке с учётом столкновительного уширения подзон энергии и
взаимного влияния механизмов рассеяния в предположении
термодинамического равновесия, предложенная Поздняковым, Галенчиком и
др. в [17], позволяет обойти указанные выше теоретические противоречия со
статистикой Ферми-Дирака. В [14] вычисляются скорости электрон-
фононного рассеяния в рамках подхода [17] с учётом непараболичности
дисперсионного соотношения. В рамках такого подхода скорость рассеяния
электронов с начальным квантовым состоянием i, j в состояние , k  на
акустических фононах имеет вид [4]:
9
N sb 1 N sb 1
E, ij   2 2   
2
k BT 2m*
Bac
  x, y   k x, y  2 dxdy ,(4)
2
WijA Dijk E, Eijk , ij
v 
ij
 1 k 1 G

Dijk 
E , Eijk , ij   E  Eijk  
2ij  2 4 E  Eijk 2
 ij2
, (5)

4E Eijk
2
  ij2

где приняты обозначения из (1), а также ij – величина столкновительного

уширения уровня i, j, обусловленного всеми рассматриваемыми


механизмами рассеяния, N sb – число рассматриваемых подзон энергии,

Eijk  Ek  Eij , i , j ,  , k – квантовые числа, описывающие квантование

вдоль оси абсцисс и ординат соответственно, при этом полагается, что ось
аппликат направлена вдоль оси квантовой проволоки, E – кинетическая
энергия движения электронов вдоль оси нанопровлоки.
Интегралы перекрытия вида

  ij x, y   k x, y  dxdy ,


2 2
(6)
G

входящие в выражения (1), (4) вычисляются приближённо. Погрешность


приближённого вычисления интеграла (6) в значительной степени влияет на
погрешность численного моделирования электрон-фононного рассеяния.
В отличие от работ [24, 25], в рамках подхода [4, 17] для вычисления
скорости рассеяния (4) требуется предварительно решить уравнения вида
ij E   Wijk E , ij E   0 , (7)
k

где E – кинетическая энергия движения электронов вдоль оси нанопровлоки,


Wijk E , ij E  – скорость рассеяния, соответствующая механизму рассеяния,

на который указывает индекс k . Равенство (7) отражает влияние механизмов


рассеяния друг на друга и вклад каждого механизма в столкновительное
уширение. Уравнение (7) является нелинейным алгебраическим уравнением
относительно столкновительного уширения спектра ij и должно решаться

численно для каждого значения E .


10
Для решения уравнений вида (7) наиболее часто используют
итерационные методы – метод Ньютона или метод Ньютона-Рафсона, –
сходимость которых в значительной степени зависит от погрешности
начального приближения [26].
В представленном диссертационном исследовании использовался
метод решения уравнений вида (7) на основе сортировки [27, 28], который
обладает устойчивостью, инвариантностью шагов алгоритма относительно
правой части (7), а также параллелизмом. Особенности применения метода
на основе сортировки для обработки данных физических экспериментов
излагаются в [29 – 31].
В [4] отмечается, что для наиболее точного компьютерного
моделирования процессов рассеяния необходим самосогласованный расчет
уровней энергии и волновых функции электронов.
Самосогласованный расчёт электронной структуры
нанопроволоки. Полупроводниковый кристалл принято представлять в виде
решётки, заполненной электронным газом, в узлах которой помещены атомы.
Кристалл в рамках такой модели является многочастичной системой, а
уравнение Шрёдингера в таком случае будет иметь вид [32]:
Hˆ r1, s1, ...rN , sN   Eˆ r1, s1, ...rN , sN  , (8)
где  r1 , s1 , ...rN , s N  – многочастичная волновая функция, r – радиус-вектор

электрона, s – спин, Ĥ – гамильтониан, N – число электронов в


моделируемом кристалле.
Волновая функция в равенстве (8) зависит от 3N пространственных
переменных и N спинов, что при увеличении числа электронов N влечёт
вычислительные трудности при решении уравнения (8), заключающиеся в
экспоненциальном росте объёма требуемой памяти и погрешностей
приближения – так называемая катастрофа Ван Флека-Инглиса [33, 34]. Так
при рассмотрении N  1000 электронов и при использовании q  3 бит на

одну переменную для записи волновой функции потребуется B  q3 N  101500


11
бит памяти [35], что делает невозможным использование математического
аппарата многочастичных волновых функций для практических
приближённых расчётов сложных квантовых систем.
С целью упрощения математических моделей, а именно для
использования формализма одночастичных волновых функций, вводят
следующие допущения.
Первое допущение – приближение Борна-Оппенгеймера [36],
заключающееся в раздельном описании движения атомов кристалла и
электронов. Движение электронов определяется мгновенным положением
ионов, а медленное движение ионов определяется средним распределением
электронов в кристалле. Сделанное предположение корректно в силу
значительной разницы – на 4-5 десятичных порядков – масс электронов и
ионов.
Второе допущение – это приближение самосогласованного поля,
предложенное Хартри [37 – 40] и Фоком [41], состоящее в замене задачи о
расчёте взаимодействия электронов друг с другом и ионами решётки задачей
о расчёте взаимодействия одного электрона с усреднённым
самосогласованным полем. Действие самосогласованного поля на электрон
считается эквивалентным действию остальных электронов и ионов.
В работах Томаса [42] и Ферми [43] в 1927 г. предполагалось, что
кинетическая энергия Ek взаимодействующих электронов может быть
представлена как кинетическая энергия свободных электронов во внешнем
поле, тогда средняя энергия электронов ETF зависит только от электронной
плотности вида
nr     dr2 ...  r1 , s1 , ...rN , s N  * r1 , s1 , ...rN , s N  drN , (9)
s1 , s 2 , ..., s N

где  r1 , s1 , ...rN , s N  – решение уравнения (8), * r1, s1,...rN , sN  – функция


комплексно сопряжённая с  r1 , s1 , ...rN , s N  , N – число моделируемых
электронов.
12
Теоремы Хоэнберга-Кона [44] устанавливают существование
функционала ETF nr  для многоэлектронных систем [35] при абсолютном
нуле температур, а в работе Мермина [45] действие теорем Хоэнберга-Кона
распространяется на случай температур отличных от абсолютного нуля.
В работе [46] Коном и Шэмом предложен способ приближённого
построения функционала ETF nr .
Теоремы Хоэнберга-Кона и подход Кона-Шэма составляют базис
теории функционала плотности (DFT – density functional theory), в рамках
которой поведение электронов в кристалле описывается одночастичным
уравнением Кона-Шэма вида [46]:
2 2
 *   r    KS r  r   E r  , (10)
2m
где первое слагаемое в левой части отвечает за кинетическую энергию
электрона, второе – соответствует взаимодействию электрона с полем,
обладающим потенциалом  KS r  , полученным из функционала Кона-Шэма
для энергии [46]:
 KS r   ext r    H r    xc r  , (11)
при этом  H r  – потенциал Хартри самосогласованного поля,  ext r  –
потенциал поля ионов решётки,  xc r  – обменно-корреляционный
потенциал.
При наличии точного аналитического выражения для  xc r  из (11)
уравнение (10) точно опишет состояние электронов в кристалле при
сделанных допущениях, однако точного выражения для обменно-
корреляционного потенциала не существует [47]. Наиболее простая и часто
используемая аппроксимация обменно-корреляционного взаимодействия –
это аппроксимация локальной плотности (LDA – local density approximation)
– физичекая модель, в рамках которой полагается, что обменно-
корреляционный потенциал зависит только от электронной плотности в
текущей точке.
13
В зависимости от области квантово-механической задачи могут
использоваться различные аппроксимации обменно-корреляционного
потенциала. Так потенциалы, используемые при расчёте атомных орбиталей
[50, 51] являются источником значительной погрешности при расчёте
электронной структуры, в силу необходимости учёта неоднородности поля
вблизи иона. По той же причине потенциалы пригодные для вычислений
поведения электрона во всём моделируемом устройстве повлекут
существенные неточности при использовании их в области квантовой химии.
С вычислительной точки зрения на выбор конкретной аппроксимации
обменно-корреляционного потенциала влияют также налагаемые
ограничения временной сложности [50]. Под временной сложностью
понимается время работы программного комплекса без учёта накладных
расходов связанных с обращениями к памяти и простоем операционной
системы.
Аппроксимация обменно-корреляционного потенциала по Беку и
Джонсону [52], а также его модификация Трана и Блахи [53], позволяет
получить большее согласие с экспериментом в задачах о расчете электронной
структуры полупроводника, но при этом необходимо при каждом
вычислении обменно-корреляционного потенциала решать нелинейное
алгебраическое уравнение, что повышает временную сложность алгоритмов.
С целью учёта в уравнении (10) периодичности потенциала атомов
решётки кристалла, и чтобы оперировать представлениями классической
физики, в частности вторым законом Ньютона, вводят формализм
эффективной массы [54], в рамках которого уравнение Кона-Шэма (10)
принимает вид уравнения Шрёдингера в форме БенДаниэла-Дюка [55, 56]:
2  1 
  *  r   V r  r   E r  . (12)
2  m r  
Потенциал Хартри удовлетворяет уравнению Пуассона вида [4]:
8
 2 H r    e  r , (13)
0
14
где  e  r  – электронная плотность с учётом заселённости подзон
размерного квантования –
N sb 1
 e r    nk  k r  ,
2
(14)
k 0

при этом N sb – априори заданное число моделируемых подзон размерного


квантования. Населённость k -й подзоны n k квантовой проволоки имеет вид
[57]:

2m* 1
ni    dE , (15)
 E  E  E  EF 
Ei i
1  exp  i 
 k BT 
где Ei – энергии i -го состояния, k B – постоянная Больцмана, T –
абсолютная температура, E F – уровень Ферми, E – кинетическая энергия
электрона.
Электронную структуру полупроводниковых кристаллов принято
описывать системой уравнений (12), (13) которая является нелинейной, так
как в уравнение Пуассона (13) входит электронная плотность (14) явно
зависящая от волновой функции, а потенциал Хартри, определяемый
уравнением (13), входит в уравнение (12), определяющее волновую
функцию.
Для системы уравнений (12), (13) часто выбирают граничные условия
Дирихле [31, 58, 59], при этом математические выражения условий зависят от
постановки физической задачи и моделируемого устройства. Так при
моделировании гетеропереходов граничные условия имеют вид [32, 58]
 1 r  H  1 ,

 2 r  H  2 ,

1 r  H  1 ,
 (17)
 2 r  H   2 ,
 r   0,
 1 D
 r   0,
 2 D
15
где H – граница гетероперехода, D – граница устройства,  1 r  ,  2 r  –
волновые функции электронов в первом и во втором полупроводнике
гетероперехода соответственно, 1 r  ,  2 r  – потенциалы Хартри в первом и
во втором веществе, 1 , 2 , 1 ,  2 – константы, определяемые веществами,
образующими гетеропереход. Последние два равенства в системе (25)
физически означают, что электрон не может покинуть границы устройства.
Таким образом, система уравнений (12), (13) с граничными условиями
(17) составляют задачу самосогласованного расчёта электронной структуры
полупроводникового кристалла, входящего в моделируемое устройство. В
ходе решения системы вычисляются волновые функции основного и
возбуждённых квантовых состояний, потенциал Хартри, а также уровни
энергии размерного квантования.
Система уравнений Шрёдингера и Пуассона не имеет [57] точного
аналитического решения, поэтому в настоящее время остаётся актуальной
[57, 58] задача численного решения задачи (12), (13), (17).
Вне зависимости от используемых численных методов блок-схема
самосогласованных итераций, как правило, имеет вид, представленный на
рис. 1 [60]:
Решение уравнения
Шрёдингера Расчёт электронной Решение уравнения
при   0 плотности Пуассона

Расчёт обменно-
корреляционного
Решение уравнения потенциала
Шрёдингера и
потенциала
Кона-Шема

Нет Да
Решение Конец итераций
сходится?

Рис. 1. Блок-схема самосогласованных итераций


16
Метод конечных разностей (МКР). Суть метода конечных разностей
применительно к задаче (12), (13), (17) кратко заключается в следующем.
Пусть для определённости рассматривается нанопроволока
прямоугольного поперечного сечения, и пусть для простоты полагается
изотропия эффективной массы, что справедливо, например, для GaAs [32]. В
таком случае уравнения (12), (13) составят систему вида
 2  2 2 
 *  2  2  x, y   V x, y  x, y   E x, y ,
 2m  x y 
 2 (18)
     x, y    8   x, y ,
2

 x 2 y 2  H 0 e
 
с областью рассмотрения вида
G  x, y  x a, b, y c, d    R 2 . (19)
Нанопроволока, моделируемая системой (18) на области (19),
представлен на рис. 2а, расчёт его электронной структуры важен для
разработки двухзатворных гетероструктурных транзисторов на основе GaAs
нанопроволок [4, 15], возможная структура которых в поперечном разрезе
представлена на рис. 2б.

а) б)
y n-AlAs Затвор 1
y

Ly p-GaAs

z
Ly
n-AlAs Затвор 2

O x O x
Lx Lx

Рис. 2. Нанопроволока (а) и поперечное сечение двухзатворного транзистора


на её основе (б)
17
С целью решения системы (18) методом конечных разностей на
области (19) задаётся равномерная сетка с узлами  xi , yi  ,
xi  a  ihx , (20)
yi  b  jhy , (21)

где i  0, N x , j  0, N y , hx  (b  a ) N x , hy  (d  c) N y , N x – число узлов

сетки вдоль оси абсцисс, N y – число узлов сетки вдоль оси ординат.

Значения N x , N y задаются априори.

В уравнениях (12), (13), (17) частные производные заменяются


конечными разностями, что влечёт
  2  i 1, j  2 i , j   i 1, j  i , j 1  2 i , j   i , j 1 
 *     Vij ij  E ij ,
 2m   hx 2
hy 2 

 (22)
 
 i 1, j  2i , j  i 1, j i , j 1  2i , j  i , j 1  8
    e  ij ,
h 2
h 2  
 x y  0

где i  0, N x , j  0, N y , N x из (20), N y из (21).

Изменение нумерации узлов (28), (29) при помощи соотношения


k  i Ny  j , (23)

где i  0, N x , j  0, N y , N x из (20), N y из (21), приведёт систему (22) к виду

  2  k  N j  2 k   k  N j   2   
 *   k 1 k k 1 
 Vk k  E k ,
 2 m  h 2
h 2 
 x y 
 (24)
  k  N j  2 k   k  N j  k 1  2 k   k 1  8
    e  k ,
h 2
h 2  
 x y  0

где k  0, N x N y .

В [61] показано, что первое равенство системы (24) является полной


проблемой собственных значений с блочно симметричной матрицей, второе
равенство совместно с условиями (17) – конечно-разностная аппроксимация
задачи Дирихле для дифференциального уравнения второго порядка в
частных производных эллиптического типа [62].
18
Решение задачи для аппроксимации уравнения Пуассона из (24) с
условиями (17) детально описано в [62] и здесь не приводятся в силу
громоздкости. Кратко суть метода [62] заключается в перенумеровании узлов
сетки и решении полученной таким образом системы линейных
алгебраических уравнений.
Для решения полной проблемы собственных значений обычно
используют итерационные методы: QR -алгоритм [63], итерации Чебышева
[64], метод Якоби [65] или Якоби-Дэвидсона [66, 67].
При использовании QR -алгоритма на каждой итерации исходная
матрица представляется в виде произведения двух матриц – ортогональной и
правой треугольной, при этом наиболее часто используется устойчивый
вариант ортогонализации Грама-Шмидта [63], при этом отмечается, что
сходимость ортогонализации [63] и QR -алгоритма [68] чувствительна к
погрешностям вычисления матричных элементов.
Сходимость методов Якоби и Якоби-Дэвидсона помимо зависимости
от погрешности матричных элементов имеет существенную зависимость от
начального приближения собственных значений [66 – 68].
В [26, 68] показывается чувствительность схем приближённого
решения проблемы собственных значений к погрешностям входных данных,
поэтому задача снижения погрешности конечно-разностных аппроксимаций
остаётся актуальной.
Контроль точности полученных приближённых решений
осуществляется при помощи условий вида

 xi , y j    k  xi , y j    k 1 xi , y j     (25)

для самосогласованного потенциала из (22),

 xi , y j    k  xi , y j   k 1 xi , y j    (26)

для волновой функции, и

En  Enk   Enk 1   E , (27)


19
для уровней энергии размерного квантования, при этом k – номер
самосогласованной итерации, i из (20), j из (21), n – номер квантового
состояния.
При использовании конечно-разностного подхода удаётся достичь
невязки уровней энергии (27) порядка 10 7 за 15 самосогласованных
итераций [69] и снизить невязку потенциала (25) до 10 10 за 70-80 итераций
[60].
Метод Галёркина. Приближённое решение уравнений системы (18)
ищется в виде отрезков ряда
N terms
 n x, y    pn, i i x, y , (28)
i 1

N terms
 x, y    vii x, y  , (29)
i 1

где N terms задаётся априори, n – номер квантового состояния, i  x, y  –


базисные функции, которые должны удовлетворять следующим условиям
[62]:
1) функции i  x, y  дважды непрерывно дифференцируемы в области G
из (19) и на её границе;
2) любое конечное их число линейно независимо;
3) для любой дважды непрерывно дифференцируемой функции i  x, y  ,
удовлетворяющей граничным условиям, и для любого   0 , найдутся
такие линейные комбинации (28), (29), которые обратят уравнения
системы (18) в верные равенства с точностью до  .
Подстановка аппроксимаций (28), (29) в уравнения (18) с приведением
подобных влечёт [70]:
20
 N terms   2 
     * i  x, y  j  x, y   i  x, y  j  x, y  dx dy p j
 j  1 G  2m 


N terms
  E n   i  x, y  j  x, y dx dy p j , (30)
 j 1 G
 N terms
   i  x, y  j  x, y  dx dy v j   8    e  x, y i  x, y  dx dy,
N terms

 j  1 G 0 j  1 G

где i  0, Nterms .
Систему (30) можно представить в матричном виде
Cp  Ip,
 (31)
Av  f,
где I – единичная матрица,
 2 
Cij     * i x, y  j x, y   i x, y  j x, y  dx dy , (32)
G  2m 
Aij   i  x, y  j  x, y  dx dy, (33)
G

f i    e  x, y i  x, y  dx dy, (34)


G

при i  0, Nterms  1, j  0, Nterms  1.


Первое равенство системы (31) представляет собой полную проблему
собственных значений [70], второе – систему линейных алгебраических
уравнений [70].
Так как алгоритмы приближённого вычисления собственных чисел и
собственных векторов чувствительны к погрешностям входных матричных
элементов [68] и интегралы (32) – (34) в общем случае не могут быть
вычислены аналитически, остаётся актуальной задача наиболее точного
приближения двойных интегралов вида (32) – (34).
Метод конечных элементов (МКЭ). Кратко идея метода конечных
элементов заключается в следующем [71].
Область рассмотрения (19) разбивается на конечное число
подобластей, в каждой из которых решение ищется в виде (28), (29).
21
Коэффициенты разложения (28), (29) находятся из условия равенства
аппроксимантов на границах подобластей и выражаются через значения
аппроксимирующих функций в узлах на границах подобластей.
Число алгебраических уравнений равно числу значений
аппроксимирующих функций в узловых точках, поэтому получаемые
системы принципиально разрешимы по теореме Крамера.
Так, применительно к рассмотренной выше квантовой проволоке,
область (19) разбивается на равные прямоугольные подобласти вида

Gk  x, y  x  x , x
i i 1 , y  y j , y j 1  , (35)

где k вычисляется аналогично (23), при этом i  0, N x , j  0, N y , N x – число

подобластей вдоль оси абсцисс, N y – число подобластей вдоль оси ординат.

В каждой подобласти (35) задаются узлы вида xi,  , y j , k ,  


xi,   xi  hx , (36)

y j , k  y j  khy , (37)

где   0, nx , k  0, n y , hx   xi  xi 1  nx , hy  y j  y j 1  ny , i  0, N x ,

j  0, N y , N x , N y из (35), n x , n y – число узлов вдоль осей абсцисс и ординат

соответственно, определяемое видом приближённых решений (28), (29).


В граничных узлах (36), (37) налагается условие равенства
аппроксимирующих функций для внутренних подобластей (35), либо
равенства аппроксимирующей функции и граничных условий для граничной
подобласти, при этом граничной подобластью считается подобласть, хотя бы
одна из границ которой частично или полностью совпадает с границей
области (19), остальные подобласти называются внутренними. Аналогично
определяются граничные и внутренние узлы в подобласти (35).
Узлы (36), (37) используются для приближённого вычисления
интегралов (32) – (34) конечно-разностными схемами.
Метод конечных элементов сам по себе не предусматривает [71]
подбора размера подобластей и шага узлов для более точного вычисления
22
интегралов (32) – (34). На этом основании, а также по причине
чувствительности устойчивости алгоритмов приближённого решения
проблемы собственных значений к погрешностям входных данных, задача
наилучшего в смысле снижения погрешности аппроксимации отрезками ряда
(28), (29) разбиения области (19) на подобласти, а также наилучшего в
названном смысле задания узлов (36), (37) остаётся актуальной.
На рис. 3 показано поведение невязки (25) потенциала Хартри [69].

Рис. 3. Сходимость метода конечных элементов

Из рис. 3 видно, что в рамках метода конечных элементов удаётся


получить невязку потенциала (25) порядка 10 5 [70].
Вейвлет-подход в методе конечных элементов (МКЭ + вейвлет). В
рамках вейвлет-подхода [72] решение задачи (18), (17) ищется в виде

 n  x, y    p, k q, k x, y  ,


~
(38)
, k , q

 x, y    v, k q, k x, y  ,


~
(39)
, k , q

где индексы  , k определяют узлы (36), (37), а для функций базиса


выполняются равенства
23
0,k  x, y     x h     y g  k ,
~
~
1, k  x, y     x h     y g  k ,
 ~2 (40)
 , k  x, y     x h     y g  k ,
 ~3
 , k  x, y     x h     y g  k ,

 m

  x   2  w j  2 x  j ,
 j 1 m
 m
  y   2  w j  2 y  j ,
 j 1 m
 m
(41)
  x  

2  w~ j  2 x  j ,
j 1 m

 m

  y   2  w~ j  2 y  j ,
 j 1 m

m
где  w j  1, w~ j   1 j w j 1 , j  1 m, j .
j 1 m

Аппроксимации (38), (39) с учётом (40), (41) подставляются в систему


(18) по аналогии с методом Галёркина, после чего вычисляются матричные
элементы аналогичные (32) – (34) и задача (0,18), (17) сводится к полной
проблеме собственных значений и системе линейных алгебраических
уравнений.
На рис. 4 показано поведение невязки уровней энергии (27) в
зависимости от шага сетки с узлами вида (36), (37).
24

Рис. 4. Сходимость метода конечных элементов при вейвлет-подходе

Из рис. 4 видно, что при использовании вейвлет-разложения невязка


уровней энергии (27) составляет величины порядка 10 5  10 6 в
исследованиях [72].
Сравнительная характеристика численных методов. В табл. 1
сравниваются невязки потенциала Хартри (25), уровней энергии размерного
квантования (27), а также навязки электронной плотности вида

e xi , y j    e k  xi , y j    e k 1 xi , y j  (42)

где k – номер самосогласованной итерации. Прочерк в табл. 1 означает, что в


рамках работы поведение соответствующей невязки не исследовалось,
аббревиатура МСЭ соответствует методу спектральных элементов [73].

Таблица 1
Сравнение невязок
Численный   e E Источник
метод
МКЭ + вейвлет – – 10 6 [74]
МКЭ 10 6 – – [75]
МКЭ + вейвлет – – 10 10 [73]
МСЭ 10 10 – 10 14 [76]
25
МКР – 10 2 – [77]
МКР – – 10 5 [69]
МКР 10 10 10 2 – [60]
МКЭ 10 4 10 2 – [70]

Из табл. 1 видно, что наибольшего снижения невязок удаётся достичь


при помощи методов, построенных на основе метода Галёркина, – метода
конечных элементов и метода спектральных элементов. Из названных
методов большей точностью в терминах (25), (27), (42) и более быстрой
сходимостью обладают методы, в рамках которых удаётся наилучшим
образом приблизить интегралы вида (32) – (34).
В связи с ростом массовой доступности аппаратных средств для
параллельных вычислений повышается актуальность распараллеливаемых
численных схем [79, 80], при этом известно [81], что алгоритмы, обладающие
естественным параллелизмом на практике показывают большую
эффективность распараллеливания.
В настоящее время широкое распространение получили программные
комплексы, ориентированные как на решение отдельных задач
вычислительной математики, так и на решение совокупности задач по
моделированию объектов физики и химии. К таковым относятся пакеты
ARPACK [82], HI-SPEED (Highly specific but edgily effective data-processing)
software packets [83], CCP6 (Collaborative Computational Project on Molecular
Quantum Dynamics) [84, 85], SiLENSe [86, 87], SIESTA (Spanish Initiative for
Electronic Simulations with Thousands of Atoms) [88, 89] и др.
Несмотря на то, что стандартные библиотеки и комплексы программ
дают возможность решать с различной точностью подавляющее
большинство возникающих вычислительных задач и задач компьютерного
моделирования, их общим недостатком является то, что попытки учесть
конкретную аппаратную архитектуру, приводят к трудностям переносимости
программ [90 – 92], а стремление к платформонезависимости приводит к
26
снижению производительности в силу усложнения вычислительной среды,
например обработки байт-кода в JVM (Java Virtual Machine) [81, 92].
При реализации параллельных программ на практике
производительность существенно зависит от метода потоковой обработки
[92] и соответствия метода и алгоритма используемой аппаратной части [93,
94].
Таким образом, актуальной является задача математического
построения схем приближённого вычисления действительных функций
одной действительной переменной, их производных и определённых
интегралов, а также схем приближённого вычисления действительных
функций двух действительных переменных, частных производных и двойных
интегралов. Реализация на основе построенных схем компьютерных
программных комплексов позволит более точно вычислять населённость
подзон вида (15), а, следовательно, – более точно вычислять электронную
плотность (14) и правую часть уравнения Пуассона (13), что снизит влияние
погрешности вычисления элементов матрицы f на устойчивость вычисления
аппроксимации (29) потенциала Хартри. Аналогично более точное
вычисление на указанной основе элементов матриц A, C, f,
представляющих собой двойные интегралы вида (32) – (34), снизит влияние
соответствующих погрешностей на сходимость итерационных методов
приближённого решения полной проблемы собственных значений.
Конструируемые алгоритмы при этом должны по построению обладать
минимальной временной сложностью и естественным параллелизмом. Более
точно, формулируется следующая цель.
Целью диссертационной работы является разработка и исследование
варьируемых компьютерных кусочно-полиномиальных схем приближённого
вычисления с высокой точностью и малой временной сложностью
действительных функций одной и двух действительных переменных,
производных от них, а также определённых интегралов для моделирования
электрон-фононного рассеяния в нелегированной GaAs нанопроволоке.
27
Для достижения поставленной цели в диссертационном исследовании
поставлены следующие задачи:
1. Построить программно варьируемую кусочно-полиномиальную
схему вычисления действительных функций одной действительной
переменной на основе усредненной суммы интерполяционных полиномов
Ньютона для интерполирования вперёд и назад на каждом подынтервале. На
этой основе разработать видоизменения кусочно-полиномиальных схем
вычисления производных и определённых интегралов. Обосновать
сходимость и оценить скорость сходимости данного приближения функций и
определённых интегралов.
2. Разработать программно варьируемую кусочно-полиномиальную
схему аппроксимации действительных функций двух действительных
переменных на основе интерполяционного полинома Ньютона от двух
действительных переменных с варьируемыми степенью и числом
подобластей. На этой основе разработать методы аппроксимации частных
производных и приближения двойных интегралов по прямоугольной
области. Доказать сходимость и оценить скорость сходимости данных
приближений функций и двойных интегралов.
3. Оценить временную сложность предложенных варьируемых
кусочно-полиномиальных вычислительных алгоритмов на модели
неветвящихся параллельных программ.
4. На основе предложенных кусочно-полиномиальных схем
вычисления двойных интегралов, а также схем вычисления корней
полиномов при помощи сортировки выполнить моделирование электронного
транспорта в нелегированной GaAs нанопроволоке с учётом квантовых
эффектов высокого порядка. Уточнить известные численные значения
экстремумов скоростей электрон-фононного рассеяния и уточнить значения
уровней энергии размерного квантования GaAs нанопроволоки для
основного и первых двух возбуждённых состояний.
28
5. Создать программный комплекс для реализации предложенных
разновидностей кусочно-полиномиальных схем, обеспечивающий
минимизацию их временной сложности. На основе комплекса провести
численный эксперимент по приближению рассматриваемых функций,
производных и интегралов. На этой же основе разработать программный
комплекс по моделированию GaAs нанопроволок и сравнить полученные
результаты моделирования с результатами моделирования на базе других
вычислительных подходов.
Методы исследования включают интерполяционные методы
аппроксимации действительных функций одной и двух действительных
переменных, численные методы алгебры и математического анализа, методы
приближённого решения нелинейных систем дифференциальных уравнений
в частных производных, элементы теории сложности, методы
математического, численного и компьютерного моделирования объектов и
устройств наноэлектроники с двумерным квантованием, методы объектного
и многопоточного программирования.
Достоверность результатов диссертации следует из их корректного
математического обоснования, аналитических оценок скорости сходимости и
погрешности приближений, подтверждается результатами численного и
программного эксперимента, а также результатами компьютерного
моделирования.
Научная новизна результатов диссертационной работы заключается в
следующем:
1. Предложена модификация компьютерной варьируемой кусочно-
полиномиальной схемы вычисления действительных функций одной
действительной переменной, отличающаяся от аналогов построением на
основе усреднения полиномов Ньютона для интерполирования вперёд и
назад на каждом подынтервале, что позволяет существенно повысить
точность при минимизированной временной сложности вычисления. На этой
основе даны видоизменения кусочно-полиномиальных схем вычисления
29
производных и определённых интегралов от функций рассматриваемого
вида. Показана сходимость данных приближений функций и определённых
интегралов со скоростью геометрической прогрессии (С. 36 – 45, 46 – 52, 152
– 155).
2. Разработана компьютерная кусочно-полиномиальная схема
аппроксимации действительных функций двух действительных переменных,
отличающаяся от известных по построению на основе интерполяционного
полинома Ньютона от двух действительных переменных с программно
варьируемыми степенью и числом подобластей, что позволяет
минимизировать временную сложность для произвольно заданной в рамках
числового диапазона языка программирования границы погрешности
вычисления функции. На этой основе предложены компьютерные схемы
приближенного вычисления частных производных и двойных интегралов по
прямоугольной области. Показана сходимость данных приближений
функций и интегралов со скоростью произведения геометрических
прогрессий по каждой из двух переменных (С. 64 – 74, 77 – 80, 82 – 85, 177 –
181).
3. Показан параллелизм предложенных разновидностей кусочно-
полиномиальных алгоритмов вычисления функций двух действительных
переменных, частных производных и двойных интегралов, даны оценки
временной сложности на модели неветвящихся параллельных программ,
согласно которым динамический синтез данных алгоритмов можно
осуществить с логарифмической временной сложностью (С. 52 – 56, 85 – 88).
4. На основе предложенных компьютерных схем вычисления двойных
интегралов и нахождения корней полиномов при помощи сортировки
модернизирована математическая модель электронного транспорта в
уединённой нелегированной GaAs нанопроволоке с учётом квантовых
эффектов высокого порядка, что позволило уточнить значения пиков
скоростей электрон-фононного рассеяния, а также уровней энергии
30
размерного квантования GaAs нанопроволоки для основного и первых двух
возбуждённых состояний (С. 99 – 134).
5. Разработан программный комплекс для реализации предложенных
разновидностей кусочно-полиномиальных схем, обеспечивающий
минимизацию их временной сложности и границ погрешности. С помощью
данного комплекса выполнен численный эксперимент для широкого класса
функций одной и двух действительных переменных, включая тестовые
наборы, который подтвердил существенное повышение точности
предложенного метода по сравнению с известными аналогами. На данной
основе разработано расширение программного комплекса для
моделирования GaAs нанопроволок, с помощью которого проведены
программные и численные эксперименты, уточняющие численные
параметры математических моделей электрон-фононного рассеяния (С.
56 – 62, 88 – 96, 115 – 134).
Основные положения, выносимые на защиту:
1. Предложена модификация варьируемой компьютерной кусочно-
полиномиальной схемы вычисления действительных функций одной
действительной переменной на основе усреднения интерполяционных
полиномов Ньютона для интерполирования вперёд и назад на каждом
подынтервале, что позволяет на порядок снизить границы абсолютной
погрешности аппроксимации. На этой основе разработаны видоизменения
варьируемых кусочно-полиномиальных схем вычисления производных и
определённых интегралов. Даны оценки сходимости и скорости сходимости
предложенных схем.
2. Разработана программно варьируемая кусочно-полиномиальная
схема аппроксимации действительных функций двух действительных
переменных на основе интерполяционного полинома Ньютона от двух
действительных переменных с варьируемыми степенью и числом
подобластей, что позволяет минимизировать временную сложность для
произвольно заданной границы погрешности вычисления функции. На этой
31
основе построены методы аппроксимации частных производных и
приближения двойных интегралов по прямоугольной области. Доказана
сходимость процесса приближения функций и двойных интегралов
сконструированных схем со скоростью произведения геометрических
прогрессий по каждой переменной.
3. Даны оценки временной сложности предложенной модификации
кусочно-полиномиального метода на модели неветвящихся параллельных
программ, согласно которым динамическое построение базового алгоритма
кусочно-полиномиальной аппроксимации можно выполнить с
логарифмической временной сложностью.
4. Модернизация математической модели электронного транспорта в
уединённой нелегированной GaAs нанопроволоке с учётом квантовых
эффектов высокого порядка на основе предложенных кусочно-
полиномиальных методов вычисления двойных интегралов с применением
схем вычисления корней полиномов при помощи сортировки. В результате
получены уточнения известных значений пиков скоростей электрон-
фононного рассеяния, а также уточнения уровней энергии размерного
квантования GaAs нанопроволоки для основного и первых двух
возбуждённых состояний. Показано влияние аппроксимаций обменно-
корреляционного взаимодействия на соотношение вкладов механизмов
рассеяния.
5. Разработан программный комплекс для реализации предложенных
разновидностей кусочно-полиномиальных схем, обеспечивающий
минимизацию их временной сложности, а также существенное повышение
точности предложенных варьируемых кусочно-полиномиальных схем по
сравнению с известными методами. Построен программный комплекс по
моделированию GaAs нанопроволок, позволяющий рассчитать уточнённые
численные значения пиков скоростей электрон-фононного рассеяния, а также
уровней энергии размерного квантования GaAs нанопроволоки для
основного и первых двух возбуждённых состояний. Согласно численным и
32
программным экспериментам на основе данных комплексов точность
расчетов таких параметров математической модели диффузионного
электронного транспорта как скорость электрон-фононного рассеяния и
столкновительное уширение спектра более чем на порядок превышает
точность расчетов известными методами.
Практическая ценность диссертационного исследования заключается
в прикладном характере предложенных численных методов варьируемой
кусочно-полиномиальной аппроксимации действительных функций одной и
двух действительных переменных, соответствующих прямых и частных
производных, а также определённых и двойных интегралов, которые
используются в качестве численной и алгоритмической базы для
компьютерной реализации математического моделирования GaAs
нанопроволок прямоугольного поперечного сечения. Результаты
моделирования необходимы для конструирования полевых транзисторов с
высокой подвижностью электронов (HEMT – high electron mobility transistor)
на основе нанопроволок, уточнённого расчёта их электронной структуры,
электрон-фононного рассеяния и, в конечном счёте, для моделирования
высокоскоростных устройств наноэлектроники. В частности, повышение
точности моделирования критически важно при расчёте электронного
транспорта с учётом квантовых эффектов высокого порядка. Предложенные
варьируемые кусочно-полиномиальные методы доведены до практической
реализации в виде программного комплекса аппроксимации функций,
производных и интегралов, который минимизирует одновременно
временную сложность и абсолютную погрешность. На этой основе
разработан расширенный программный комплекс для компьютерного
моделирования электронной структуры и электрон-фононного рассеяния
нанопроволок и транзисторных структур, ориентированный на создание
высокоскоростных устройств наноэлектроники.
Внедрение и использование результатов работы. Полученные в
работе результаты использованы:
33
1. В НИИ механики и прикладной математики им. Воровича И.И. ЮФУ
приняты к использованию следующие материалы диссертации:
1.1. Представленные в гл. 1 модификации варьируемой кусочно-
полиномиальной схемы вычисления действительных функций одной
действительной переменной на основе усреднения полиномов Ньютона для
интерполирования вперёд и назад на каждом подынтервале, позволяющие
достигать высокой точности при минимизированной временной сложности
вычисления, а также видоизменения кусочно-полиномиальных схем
вычисления производных и определённых интегралов от функций
рассматриваемого вида (С. 36 – 45, 46 – 52, 152 – 155).
1.2. Представленная в гл. 2 кусочно-полиномиальная схема
аппроксимации действительных функций двух действительных переменных
на основе интерполяционного полинома Ньютона от двух действительных
переменных с программно варьируемыми степенью и числом подобластей,
позволяющая минимизировать временную сложность вычисления функции
для заданной границы погрешности, а также компьютерные схемы
приближенного вычисления частных производных и двойных интегралов (С.
64 – 74, 77 – 80, 82 – 85, 177 – 181).
1.3. Представленный в гл. 3 метод численного моделирования
электронного транспорта в уединённой нелегированной GaAs нанопроволоке
с учётом квантовых эффектов высокого порядка, позволяющий уточнить
значения пиков скоростей электрон-фононного рассеяния, а также уровней
энергии размерного квантования GaAs нанопроволоки для основного и
первых двух возбуждённых состояний (С. 99 – 134).
1.4. Разработанный в диссертации программный комплекс для
реализации предложенных разновидностей кусочно-полиномиальных схем,
обеспечивающий минимизацию их временной сложности и границ
погрешности, с помощью которого осуществляется численный эксперимент
для широкого класса функций одной и двух действительных переменных,
включая тестовые наборы, подтверждающий существенное повышение
точности предложенного метода по сравнению с известными аналогами, а
также разработанное расширение программного комплекса для
моделирования GaAs нанопроволок, с помощью которого проведены
34
программные и численные эксперименты, уточняющие численные
параметры математических моделей электрон-фононного рассеяния (С. 56 –
62, 88 – 96, 115 – 134). В частности, предложенные программные пакеты
используются для снижения границы абсолютной погрешности
приближённого решения самосогласованной системы уравнений Шрёдингера
и Пуассона при моделировании электронного транспорта.
2. В работе по выполнению государственного задания Министерства
образования и науки РФ ФГБОУ ВПО «ТГПИ имени А.П. Чехова» по
проекту № 7.1398.2011 «Распараллеливаемые компьютерные методы
вычисления функций, решения и анализа устойчивости дифференциальных
уравнений, цифровой обработки сигналов и распознавания изображений с
применением алгоритмов сортировки».
3. В учебном процессе кафедры информатики ФГБОУ ВПО «ТГПИ
имени А.П. Чехова» в курсах «Численные методы», «Программирование»,
«Методы численного анализа и вычислительной алгебры», «Математическое
моделирование» и «Компьютерное моделирование».
Апробация работы. Основные результаты работы были представлены
на:
– Пятьдесят второй научной студенческой конференции (Таганрог,
ТГПИ, 2009);
– III Всероссийской студенческой научно-технической конференции
«Прикладная информатика и математическое моделирование» (Москва,
МГУП, 2009);
– IV Всероссийской студенческой научно-технической конференции
«Прикладная информатика и математическое моделирование» (Москва,
МГУП, 2010);
– Пятьдесят третьей научной студенческой конференции (Таганрог,
ТГПИ, 2010);
– Всероссийской научно-технической конференции с международным
участием: «Компьютерные и информационные технологии в науке,
инженерии и управлении» «КомТех-2011» (Таганрог, ТТИ ЮФУ, 2011);
– XII Всероссийском Симпозиуме по прикладной и промышленной
математике (осенняя сессия) (Сочи-Адлер, 2011);
35
– VIII Международной научно-практической конференции «Aplikované
vědecké novinky - 2012» (Czech, Praha, 2012);
– VI Международной научно-технической конференции молодых
специалистов, аспирантов и студентов «Математическое и компьютерное
моделирование естественнонаучных и социальных проблем (МК-70-912)»
(Пенза, ПГУ, 2012);
– XIII Всероссийской (с международным участием) научно-
практической конференции студентов, аспирантов и молодых ученых
«Молодежь и наука ХХI века» (Красноярск, КГПУ им. В.П. Астафьева,
2012);
– XIII Всероссийском Симпозиуме по прикладной и промышленной
математике (летняя сессия) (Петрозаводск, 2012);
– XV Международной конференции «Опто-, наноэлектроника,
нанотхнологии и микросистемы» (Ульяновск, УлГУ, 2012);
– Международной молодежной конференции в рамках фестиваля науки
«Микроэлектронные информационно-управляющие системы и комплексы»
(Воронеж, ВИВТ, 2012);
– Международной молодежной научной школе в рамках фестиваля
науки «Летняя Суперкомпьютерная Академия» (Воронеж, ВИВТ, 2012);
– XIII Всероссийском Симпозиуме по прикладной и промышленной
математике (осенняя сессия) (Сочи-Вардане, 2012).
Публикации. По материалам работы опубликовано 20 печатных работ
общим объёмом более 25 печатных листов, из них 3 в журналах из перечня,
рекомендуемых ВАК РФ для опубликования результатов исследований
кандидатских диссертаций.
Структура и объём работы. Диссертационная работа состоит из
введения, трёх глав, заключения, списка литературы и приложений к трём
главам. Основное содержание изложено на 158 страницах, включая список
литературы из 139 наименований, приложение изложено на 67 страницах,
включает коды программ, реализующих исследуемые математические
модели и предложенные численные методы.
36

ГЛАВА 1. МОДИФИКАЦИЯ КОМПЬЮТЕРНОГО МЕТОДА


КУСОЧНО-ПОЛИНОМИАЛЬНОГО ВЫЧИСЛЕНИЯ ФУНКЦИЙ
ОДНОЙ ПЕРЕМЕННОЙ, ПРОИЗВОДНЫХ И ИНТЕГРАЛОВ

В данной главе описывается компьютерная схема кусочно-


полиномиальной аппроксимации действительных функций одной
действительной переменной на базе подхода, разработанного в [96, 100, 101].
Отличительной чертой представленной в главе схемы является
использование в качестве аппроксиманта полусуммы интерполяционных
полиномов. При этом, как и в [96], применяется интерполяционный полином
Ньютона, однако, в отличие от [96], используется не только полином для
интерполирования вперёд, но и полином Ньютона для интерполирования
назад, от которых берется среднее арифметическое значение на каждом
подынтервале [97, 98]. На основе такого простого приема достигается
существенное повышение точности компьютерной кусочно-полиномиальной
аппроксимации функции, производных и интегралов, причем, согласно
таблично-алгоритмической структуре, сохраняемой в предлагаемой
модификации исходного метода, повышение точности происходит без
увеличения временной сложности.
В рамках излагаемого подхода отрезок из области определения
исходной функции покрывается системой подынтервалов, на каждом из
которых строятся полиномы Ньютона для интерполяции вперёд и назад с
приведением к виду с числовыми коэффициентами. Такой вид полинома в
дальнейшем будет называться каноническим видом полинома.
Излагаемая схема традиционно учитывает ограничения памяти и
временной сложности для априори заданной границы погрешности
аппроксимации рассматриваемых функций, алгоритмически минимизируя
временную сложность за счет выбора минимальной степени полинома на
подынтервале.
37
По ходу изложения приводится доказательство сходимости и оценки
скорости сходимости представленного кусочно-полиномиального процесса,
заимствованное из [106], при этом учитывается предложенная модификация
исходного метода.
В главе приводятся оценки временной сложности максимально
параллельной формы основного алгоритма аппроксимации функций и
рассматриваемых величин.
Выполняется сравнение результатов численного эксперимента по
приближённому вычислению функций, производных и определённых
интегралов по описанным схемам с результатами, полученными при помощи
математических программных пакетов и схем на базе других
интерполяционных полиномов.
Материал главы является исходным для построения в последующих
разделах аппроксимации функций двух переменных, частных производных и
двойных интегралов. В свою очередь материал в целом предназначается для
моделирования процесса электрон-фононного рассеяния в нанопроволоках
(глава 3).
Всюду ниже временная сложность (иногда для краткости – время
выполнения) алгоритма оценивается числом последовательных шагов с
учётом вида операции на шаге в зависимости от числа процессоров на
модели неветвящихся параллельных программ [93, 95] и обозначается t R  ,
где R – число процессоров.
1.1. Модификация кусочно-полиномиальной схемы
аппроксимации функций одной переменной [96]. Ниже на основе [96]
излагается схема аппроксимации функции
y  f x  , (1.1)

где x  a, b  R , x, y  R 2 , a, b   . Описываемая непосредственно ниже


алгоритмическая основа будет, как отмечено выше, перенесена на случай
действительных функций двух действительных переменных.
38
В рамках излагаемого подхода [96 – 98] отрезок a, b  покрывается
системой равных непересекающихся подынтервалов вида
~
P 2
a, b   xi , xi 1   xP 1 , xP  , (1.2)
i 0

~
где P  2 k , k  0,1, 2, ... , x0  a , xP~  b .
Интерполирующие полиномы Ньютона строятся в узлах
расположенных в закрытых интервалах xi , xi1  . При последующем
вычислении аппроксимирующего полинома для однозначной адресации в
границах x i , xi 1 подынтервалов (1.2) по номеру i к массиву коэффициентов
аппроксимирующего полинома, все подынтервалы считаются открытыми
справа интервалами вида xi , xi 1  из (1.2).
Ниже вводятся ограничения числа подынтервлов и степени
интерполирующего полинома вида:
k  k0 , (1.3)
n  n0 , (1.4)
где n0  const – априори задаваемое значение верхней границы степени
приближающего полинома, k0  const – априори задаваемая верхняя граница
для k из (1.2).
В отличие от прототипа [96] на каждом подынтервале (1.2) с учётом
условий (1.3), (1.4) строится аппроксимирующий полином степени n вида

i  x   Pn i  x 
Pnfwd bkw
Pn i x   , (1.5)
2

i  x  , Pn i  x  – полином Ньютона для интерполирования вперёд и


где Pnfwd bkw

назад соответственно, i – номер подынтервала (1.2). Степень n полинома


(1.5) выбирается одинаковой для всех подынтервалов (1.2) и минимальной
при выполнении условия
f  x   Pn i  x    , (1.6)
39
где  – априори заданная граница погрешности аппроксимации функции
~
(1.1), i  0, P  1 – номер подынтервала (1.2).
Условие (1.6) проверяется на всех подынтервалах в точках, не
совпадающих с узлами интерполяции, и следующих с априори заданным
равномерным проверочным шагом, длина которого является параметром
алгоритма и выбирается заведомо меньшей шага интерполяции.
Для определения степени n полинома (1.5) и параметра k из (1.2)
(псевдокод на основе семантики C++) служит
Алгоритм 1.1.
/*
Псевдокод основан на синтаксисе С++

Величины, входящие в блок комментария


задаются как входные параметры подпрограммы функции,
реализующей приводимый непосредственно ниже алгоритм,
а именно задаются:

const int a = …; // Левая граница отрезка изменения аргумента


const int b = …; // Правая граница отрезка изменения аргумента
const int eps = …; // Граница абсолютной погрешности аппроксимации
const int Npt = …; // Число проверочных точек на подынтервале
const int k0 = …; // k0 из (1.3)
const int n0 = …; // n0 из (1.4)
*/
for (int k = 0; k <= k0; ++k) {
for (int n = 1; n <= n0; ++n) {
for (int kp = 0; kp < pow(2, k); ++kp) {// kp – номер подынтервала
long double hp = (b – a) / pow(2, k);
long double x0 = a + kp * hp;
/*
Построение аппроксимирующего полинома
*/
long double hx = hp/Npt; // hx – проверочный шаг
for (int i = 0; i < Npt; ++i)
if (abs(f(x0 + i * hx) – P(x0 + i * hx))) > eps) goto next;
if (kp == pow(2, k) - 1) goto final;
}
next:;
}
}
final:;

По алгоритму 1.1 вычисление коэффициентов полинома (1.5)


начинается с показателя степени n 1 при k  0 . Если достижение заданной
границы абсолютной погрешности  из (1.6) невозможно, значение n
40
увеличивается на 1; так продолжается, пока n не выйдет за допустимые
границы (1.4); при их нарушении снова делается переход к минимальному
значению n  1 , но уже при k  1, и т.д.
Аппроксимант (1.5) в виде полусуммы интерполирующих полиномов
Ньютона отличает излагаемую модификацию от прототипа [96], где
использовался только полином Ньютона для интерполяции вперёд. Благодаря
такому видоизменению удаётся снизить, как будет показано в дальнейшем,
накопление погрешности аппроксимации по сравнению с исходной схемой.
Полином (1.5) преобразуется по дистрибутивности с приведением
подобных к виду
n
Pn i  x    B f ij x j , (1.7)
j 0

где f – индекс, соответствующий аппроксимируемой функции, i – номер

подынтервала из (1.2), x  xi , xi 1 , i  0, P  1, n  const .


~

Если комбинация чисел n , k , при которых построенный полином (1.7)


удовлетворяет неравенству (1.6) на всех подынтервалах (1.2), найдена, то для
функции (1.1) и для каждого подынтервала (1.2) коэффициенты полинома
(1.7), всего 2k n  1 значений, могут быть записаны в память компьютера. В
дальнейшем, для вычисления значения функции (1.1) достаточно выполнить
дешифрацию номера подынтервала, –
x  a
i , (1.8)
 P 
h
с временной сложностью
t  O1 , (1.9)

где α  – целая часть числа α , а hP – длина подынтервала (1.2), hP  xi  xi 1 ,

i  0, P  1. Полученное значение i – индекс строки в двумерном массиве

коэффициентов B f ij ( j  0, n , i  0, P  1 ), в которой хранится выборка


41
значений B f ij для функции (1.1) (размерность соответствующая номеру

функции f не учитывается).
Так как коэффициенты полинома (1.7) сохранены в памяти
компьютера, то время его вычисления по схеме Горнера оценится из
выражения
t 1  n  t y  tc , n  const , (1.10)

где t y , t c – время бинарного умножения и сложения соответственно,

За счет уменьшения длины подынтервала степень n в (1.7) можно


~
сделать «сколь угодно» малой при соответственном возрастании P  2 k из
(1.2). Фраза «сколь угодно малой» понимается в том смысле, что степень
полинома – натуральное число – не превосходит некоторой априори
заданной константы и снижается с ростом числа подынтервалов
соответственно предустановленному значению  из (1.6) [96].
Выбранная по алгоритму 1.1 степень полинома (1.7) является
минимальной на 2 k подынтервалах, тем самым достигается минимизация
временной сложности вычисления функции для априори заданной границы
погрешности (1.6). С учётом сделанных оговорок на основе (1.10)
t 1  O1 .
В виде (1.7) аппроксимирующий полином ниже применяется для
численного дифференцирования и приближённого вычисления производных,
при этом производная от функции (1.1) аппроксимируется производной от
полинома, а первообразная от функции – первообразной от полинома.
Схема по построению инвариантна относительно номера i
подынтервала (1.2), числа P подынтервалов, а также относительно степени
полинома (1.5). Поэтому дальнейшие математические построения проводятся
~
для текущего номера подынтервала (1.2), i  0, P  1 , и для текущих значений
n, k .
Подынтервал (1.2) покрывается сеткой равноотстоящих узлов вида
42
xi,  xi  h , (1.11)

где   0, n , h – шаг интерполяции –


xi 1  xi
h . (1.12)
n
В узлах (1.11) строится полином Ньютона для интерполяции вперёд
[99]:
n  j y i ,0 j 1
Pnfwd
i x   f ( x i ,0 )    ( x  x i, ) , (1.13)
j 1 j !h j  0

где x  xi , xi 1  .
Аналогично на отрезке xi , xi 1  в узлах (1.11) строится полином
Ньютона для интерполяции назад [99]:
n j y i,n  j j 1
Pnbkw
i x   f ( x i,n )    ( x  x i,n m ) . (1.14)
j 1 j !h j m0

С целью дальнейших преобразований вычисляются конечные разности


первого порядка  yi,0  f ( xi,1)  f ( xi,0 ) и конечные разности k -го порядка

k yi ,0  k 1 y i ,1  k 1 yi ,0 , i  0, P  1 , после чего в обозначениях

 j y i ,0
bijfwd  , (1.15)
j!

j y i, n  j
bijbkw  , (1.16)
j!
полиномы (1.13), (1.14) примут вид соответственно
j 1
n bijfwd
Pnfwd
i x   f ( x i ,0 )    ( x  x i , ) , (1.17)
j 1 hj  0

j 1
n bijbkw
Pnbkw
i x   f ( x i,n )    ( x  x i,nm ) . (1.18)
j 1 hj m0

где x  xi , xi 1  .
В равенстве (1.17) вводится переменная
43
x  x i ,0
t , (1.19)
h
где h из (1.12), что влечёт
n j 1
Pnfwd
i t x   f ( x i ,0 )   bijfwd  (t  ) , (1.20)
j 1  0

где t  0, n.


Аналогично, введение переменной
x  x i, m
q , (1.21)
h
где h из (1.12), приводит полином (1.18) к виду
n j 1
Pnbkw
i qx   f ( x i,n )   bijbkw  ( q  m) , (1.22)
j 1 m0

где q   n, 0 .
С целью приведения полинома (1.5) к виду (1.7) используется
матричная схема вычисления коэффициентов полиномов по его корням [28]:
 
*
 d j, j   1 0  0 0 
   
 d j*,  j 1    z j  1  0 0 
 *   
d j
 0  z  0 0 ,
 j , j  2   

j  
(1.23)
    1       
 *   
 j ,1 
d  0 0   z j  1 
 d j, 0 *   0 0  0  z j  
    
 j   1 

j t  , Rn, j q  соответственно, z    –
где d j*,j – коэффициенты полиномов Rn,fwd bkw

j t  , Rn, j q  ,   0, j  1 , j  0, n ,
корни полиномов Rn,fwd bkw

j 1 j
Rnfwd
,j t    (t  )   dfwd t  , (1.24)
 0  0

j 1 j
Rnbkw
,j q    (q  m)   d mbkw q m . (1.25)
m0 m0
44
Детальное описание схемы (1.23) и её алгоритмическая реализация
приводятся в приложении 1.
С учётом равенств (1.24), (1.25) полиномы (1.20), (1.22) примут вид
соответственно
n j

i t  x   f ( x i , 0 )   bij
Pnfwd  dfwd t  ,
fwd
(1.26)
j 1  0

n j
Pnbkw
i qx   f ( x i,n )   bijbkw  d mbkw q m . (1.27)
j 1 m0

Раскрытие скобок и приведение подобных в полиномах (1.26), (1.27)


повлечёт равенства
n
i t  x  
Pnfwd  aijfwd t j , (1.28)
j 0

n
i q  x  
Pnbkw  aijbkw q j , (1.29)
j 0

где

, 0  f xi , 0 ,
 aifwd

 fwd n
 i, j
a   bi,fwd fwd
m d j,m , (1.30)
 m j
 j  1, n,

, 0  f xi , n ,
 aibkw

 bkw n
 ai , j   bi , m d j , m ,
bkw bkw
(1.31)
 m j
 j  1, n.

Перейдём в полиноме (1.29) к переменной t из (1.19), учитывая, что
t  q  n. (1.32)
Выразив q из (1.32) и подставив в (1.29), получим
n
Pnbkw
i t x    aijbkw t  n  j . (1.33)
j 0

Применение к скобкам t  n j в (1.33) бинома Ньютона влечёт:


45
n l n n
i t  x    ai , l   1 , l  1
  aibkw
l j l j l l j j
Pnbkw bkw
C lj nl  j t j  C jn t ,
l 0 j 0 j 0 l  j

откуда следует
n
i t  x  
Pnbkw  Aibkw j
,j t , (1.34)
j 0

где
n
, l  1
  aibkw
l j
Aibkw
,j C lj nl  j . (1.35)
l j

С учётом (1.30), (1.35) искомый аппроксимирующий полином (1.5) на


подынтервале xi , xi 1  из (1.2), i  0, P  1 , примет вид
n
Pn i t  x    Bi , j t j , (1.36)
j 0

где t из (1.19),

, j  ai , j
Aibkw fwd
Bi , j  . (1.37)
2
Как отмечалось выше, после того как коэффициенты (1.37) вычислены,
по алгоритму 1.1 проверяется условие (1.6), если полином (1.36)
удовлетворяет неравенству (1.6) во всех проверочных точках, то
построенный полином (1.36) с коэффициентами (1.37) принимается за
искомый полином вида (1.5).
Аппроксимирующий полином в виде (1.36) вычисляется по схеме
Горнера
   
Pn i (t )   Bi , n t  Bi ,n 1 t  Bi ,n  2  t  ...  Bi ,0 , (1.38)

где t из (1.19).
В силу построения на основе интерполяции алгоритм с применением
(1.36) – (1.38) применим для аппроксимации широкого класса функций, при
этом, как будет проиллюстрировано численным экспериментом, достигает
высокой точности аппроксимации с малой временной сложностью.
46
Представленный подход, помимо излагаемого в дальнейшем
назначения, целесообразен для создания библиотеки алгоритмов вычисления
часто используемых функций, что позволяет существенно снизить время
численных экспериментов при проведении компьютерного моделирования
[31, 102], а также повысить точность получаемых в результате физических
характеристик [105].
Как отмечалось, представленная схема инвариантна относительно вида
функции и интервала из области определения.
Тем не менее, в дальнейшем предполагается, что аппроксимируемая
функция непрерывна на отрезке a, b, способ применения изложенного
подхода в случае разрывных функций будет дан в приложении.
Помимо того, относительно размера отрезка a, b необходимы
следующие ограничения. Формально интерполяция возможна всюду в
области определения, однако, поскольку метод опирается на компьютерный
алгоритм, то его реализация ограничена форматом плавающей точки,
поэтому возникает задача избежать потери значащих цифр мантиссы чисел с
ростом их диапазона. Для этой цели в случае стандартных функций
используются формулы редукции аргумента к значению из основного
интервала. Такие формулы используются в библиотеках стандартных
подпрограмм [106], их вид представлен в [101, 107].
Замечание 1.1. Возможно построение схем, использующих другие
интерполяционные полиномы, например полиномы с центральными
разностями или отрезки ряда по ортогональным полиномам [97, 101]. Их
описание приводится в приложении к главе 1, результаты численного
эксперимента в сравнении с представленной выше схемой представлены
ниже.
Таким образом, изложена модификация аппроксимации на кусочно-
полиномиальной основе функций вида (1.1) с помощью полусуммы
интерполяционных полиномов Ньютона.
47
1.2. Равномерная сходимость кусочно-полиномиальной схемы
аппроксимации функций одной переменной [108]. Доказательство
равномерной сходимости кусочно-полиномиальной аппроксимации в
зависимости от числа подынтервалов (1.2) в сокращённом виде приводится
на основе [108].
Пусть зафиксирована степень аппроксимирующего полинома
n  const   , и пусть функция (1.1) непрерывна и непрерывно
дифференцируема n  1 раз на отрезке a, b из (1.2). Все рассматриваемые

производные на концах отрезка a, b предполагаются односторонними.


~
Рассмотрим нулевой шаг алгоритма 1.1, когда k  0, P  1,
x0 , x1   a, b , тогда с учётом сделанных предположений в обозначениях

, n 0  x   Pn 0  x  , погрешность интерполяции функции (1.1) полиномами


Pkfwd fwd

(1.17), (1.18) на подынтервалах из (1.2) будет иметь оценку вида [109]


max f n 1  x  n
xa , b 
f x   P0fwd
, n 0 x    x  x0 ,  (1.41)
n  1!  0

для полинома (1.17), и соответственно –


max f n 1  x  n
xa , b 
f  x   Pbkw
0 , n 0  x    x  x0 , n  m (1.42)
n  1! m 0

, n 0  x   Pn 0  x  , P0 , n 0  x   Pn 0  x  .
для полинома (1.18), где P0fwd fwd bkw bkw

Так как x  a, b , то x  x0,   x1  x0  b  a ,   0, n , и аналогично

x  x0, n  m  x1  x0  b  a , m  0, n , тогда справедливы соотношения


n
 x  x0,  b  a 
n 1
, (1.43)
 0

где   0, n ,
n
 x  x0,n m  b  a 
n 1
, (1.44)
 0

где m  0, n .
48
С учётом неравенств (1.43), (1.44) выражения (1.41), (1.42) примут вид
соответственно
max f n 1  x 
xa , b 
f  x   P0fwd
, n 0  x   b  a n 1 , (1.45)
n  1!
max f n 1  x 
xa , b 
f  x   Pbkw
0 , n 0  x   b  a n 1 . (1.46)
n  1!
Аппроксимирующий полином P0 , n 0  x  из (1.5) конструируется как

полусумма полиномов (1.17), (1.18), поэтому с учётом неравенства


треугольника, получим

f  x   P0 , n 0  x  
1
2
 f  x   Pnfwd
0  x   f  x   P k , n 0  x 
bkw
 (1.47)

С учётом неравенств (1.45), (1.46) оценка (1.47) примет вид


max f n 1  x 
xa , b 
f  x   P0 , n 0  x   b  a n 1 ,
n  1!
откуда получим

f  x   Pk , n 0  x   M n (1.48)

где

max f n 1  x 
xa , b 
Mn  b  a n 1 . (1.49)
n  1!
Величина M n является константой при фиксированных a , b , n .

Рассмотрим случай k  1 , P  2 , a, b  x0 , x1   x1 , x2  , тогда длина


~

подынтервалов (1.2) уменьшится в два раза по сравнению с предыдущим


шагом алгоритма 1.1, и на каждом подынтервале будут выполняться
равенства x1  x0  x2  x1  b  a  2 , которые в обозначениях (1.49) повлекут
из оценки (1.48) неравенство вида
M
f  x   P1,n i  x   n n1 , (1.50)
2
49
где i  0,1 – номер подынтервала (1.2), константа M n та же, что и в
неравенстве (1.49).
Правая часть (1.50) мажорирует абсолютную погрешность
аппроксимации функции (1.1) полиномами (1.5), уменьшаясь в 2 n 1 при
ограниченной степени аппроксимирующего полинома на каждом
последующем шаге процесса сужения подынтервалов (1.2) – с возрастанием
k на единицу.
Продолжая рассуждения по индукции, при P  2k ,

 
xi 1  xi  b  a  2 k , i  0,1, ..., 2k  1 , получим оценку

f x   Pk , n i x   , x  a, b ,
Mn
k n 1
(1.51)
2
Mn
где k   0,1, 2, ... – из (1.2). Из неравенства (1.61) следует lim  0,
k  2k n1
откуда окончательно получаем

Pk , n i  x  


 f  x  , x  a, b .
xa , b 

На основании представленных рассуждений формулируется


Теорема 1.1 [108]. Пусть для произвольного натурального n  n0 , где
n0 из (1.4), функция f x  из (1.1) непрерывна и непрерывно
дифференцируема n 1 раз на отрезке a, b , на концах которого
соответствующие производные понимаются как односторонние, тогда
последовательность полиномов Pk , n i  x  из (1.49) равномерно сходится на

a, b  при k   , где k  log 2 P~ , P~ – число подынтервалов из (1.2). Скорость


сходимости при этом оценивается из неравенства (1.51).
Теорема 1.1 утверждает, что последовательность полиномов (1.36) с
коэффициентами (1.37) равномерно сходится на отрезке a, b  со скоростью
геометрической прогрессии к функции (1.1), как и прототип (1.26), (1.28)
[106].
50
1.3. Применение кусочно-полиномиальной схемы для
аппроксимации производных и равномерная сходимость процесса
численного дифференцирования. Ниже излагается схема аппроксимации
производных от функции (1.1) [96] основанная на схеме аппроксимации
функций (1.36), (1.37).
Пусть полином (1.36) с коэффициентами (1.37) построен, тогда на i -м
подынтервале (1.2) выполняется приближённое равенство:
f x  Pn i t x . (1.52)

Предполагая существование производной  f  x x  ,


продифференцируем левую и правую часть выражения (1.52) по переменной
x , получим

 f x x   Pn i t x t t x  , (1.53)



откуда с учётом следующего из (1.19) равенства: t x  1 h , h из (1.12),
следует
n 1
Pn i t x x   1h  Bi, j 1t j . (1.54)
j 0

После дешифрации (1.8) номера i подынтервала (1.2) значение


полинома в правой части равенства (1.54) может быть вычислено по схеме
Горнера вида

Pni (t )  n Bn, i t  (n  1) Bn  1, i  t    2Bn  2, i  t  B1, i  .


1
(1.55)
h
В приложении к гл. 2 рассматриваются вопросы сходимости
последовательности полиномов (1.55) к производной (1.53).
1.4. Применение кусочно-полиномиальной схемы для
приближённого вычисления определённых интегралов и равномерная
сходимость приближения. Ниже на базе изложенной схемы аппроксимации
функций вида (1.1) полиномами (1.36) с коэффициентами (1.37) излагается
построение схемы приближённого вычисления определённых интегралов от
функции (1.1) [96, 101, 108].
51
Пусть по алгоритму 1.1 найдено значение степени n
аппроксимирующего полинома и параметра k из (1.2), при которых
вычислены коэффициенты (1.37). В таком случае выполняется соотношение
(1.52), проинтегрировав обе части которого по подынтервалу (1.2), получим
x i1 x i 1

 f x  dx   Pn i t x  dx , (1.56)
xi xi

где t  x  из (1.19).
В силу аддитивности интеграла по промежутку интегрирования
справедливо приближённое равенство
b P 1 xi 1

 f x  dx  
i 0
 Pn i t  x  dx , (1.57)
a xi

Перейдем в правой части (1.56) к интегрированию по переменной t из (1.19),


получим
xi n

 Pn i t x  dx  h  Pn i t  dt , (1.58)
x i 1 0

где h – шаг интерполяции из (1.12).


Подстановка полинома (1.36) в правую часть равенства (1.58) и
непосредственное вычисление интеграла повлечёт
xi
n

 Pn i t x  dx  h 
1 j 1
Bi , j n , (1.59)
x i 1 j 0 j  1

при этом аппроксимация первообразной функции (1.1) на i -м подынтервале


(1.2) имеет вид
n
Pn i t  x   h 
~ 1
Bi , j t j 1 , (1.60)
j 0 j  1

где t  x  из (1.19).
Полином в правой части может быть вычислен по схеме Горнера
  B B  B  B 
Pn i n    ...  i , n n  i , n 1  n  i , n  2  n    i ,0  n .
~
(1.61)
  n 1 n  n 1  1 
52
Приближённое равенство (1.60) с учётом соотношения (1.57)
запишется в виде
~
b P 1 n

 f xdx  h 
1 j 1
Bi , j n . (1.62)
a i 0 j 0 j  1

Схема (1.61), (1.62) помимо прочего ориентирована на приближение


интегралов от функций из библиотеки стандартных часто используемых
функций, например, при решении задач моделирования квантовых объектов
Bi , n Bi , n 1 Bi , n  2 B
[31, 102]. В таком случае коэффициенты , , , ... , i ,0
n 1 n n 1 1
помещаются в память компьютера с целью дальнейшего считывания при
необходимости, тогда временная сложность приближённого вычисления
интегралов примет вид
t 1  Pn  1t y  tc  .

Отметим, что схема (1.61), (1.62), (1.37) построена для наименьшей,


соответствующей выбранному по алгоритму 1.1 значению k из (1.2), степени
n аппроксимирующего полинома, при которой подынтегральная функция
аппроксимируется с априори заданной точностью. Такой степени полинома
на практике бывает достаточно, чтобы абсолютная погрешность
приближённого вычисления интеграла составляла величины порядка 10 20
[97, 98].
Схема (1.61), (1.62), (1.37) по построению обладает инвариантностью
относительно размера отрезка интегрирования, а также относительно вида
подынтегральной функции, в предположении её непрерывности и
ограниченности на отрезке a, b  .
Равномерную сходимость на отрезке a, b  последовательности
2 k 1 xi 1 b

  Pk , n i x dx к интегралу  f x dx при k   , k из (1.2), где


i 0 xi a

Pk , n i  x   Pn i  x  , устанавливает
53
Теорема 1.2. В условиях теоремы 1.1 каково бы ни было натуральное
2 k 1 xi 1
n  n0 , где n 0 из (1.4), последовательность   Pk , n i x dx равномерно
i 0 xi

b
сходится на отрезке a, b  из (1.2) к f  x dx при k   , где k  log 2 P , P –
~ ~

a

число подынтервалов из (1.2). Скорость сходимости имеет оценку


b 2 k 1xi 1

 f x dx    Pk ,n i x dx  n
k  n 1
, где n  b  a  M n , M n из (1.46).
a i 0 xi 2

Согласно теореме 1.2 последовательность полиномов в правой части


b
(1.62) равномерно сходится на отрезке a, b  к  f x dx в зависимости от
a

числа подынтервалов со скоростью геометрической прогрессии.


В [108] теорема 1.2 сформулирована и доказана для кусочно-
полиномиальной схемы на основе полинома (1.26), (1.28), при этом в [108]
получена оценка в виде
b 2 k 1xi 1

 f x dx  
i 0
 Pk ,n i x dx  1 ,
a xi

где  1  0 . Теорема 1.2 уточняет результат [108], позволяя оценить скорость


сходимости.
В приложении к главе 1 приводится доказательство теоремы 1.4 для
полиномов (1.36) с коэффициентами (1.37).
1.5. Временная сложность максимально параллельной формы
кусочно-полиномиальных схем [96]. Временная сложность максимально
параллельных модификаций изложенных кусочно-полиномиальных схем
оценивается в рамках модели неветвящихся параллельных программ без
учёта обмена данными [112], при этом полагается, что вычислительная
система работает как идеальный параллельный процессор [95]. Временная
сложность обозначается t R  , где R – число процессоров.
54
В основу излагаемых рассуждений положены результаты из [28, 96].
Представленные ниже оценки отличаются от оценок [96] в силу отличий
используемых аппроксимирующих полиномов и, как следствие, – различного
числа процессоров, необходимых для максимально параллельной реализации
алгоритмов.
Пусть по изложенному алгоритму 1.1 выбрана некоторая пара значений
степени n полинома (1.5) и k из (1.2) удовлетворяющих неравенствам (1.3),
(1.4) соответственно, тогда параллелизм изложенных схем будет обладать
следующими особенностями.
Полиномы (1.24), (1.25) не зависят от вида аппроксимируемой
функции, а только от степени n , поэтому для всех значений n ,
удовлетворяющих условию (1.3), коэффициенты d fwd , dmbkw полиномов
(1.24), (1.25) могут быть вычислены однократно по матричной схеме (1.23) в
максимально параллельной форме с временной сложностью [28]
3  1
t  n3  ~ log 22 n tc  O (log 22 n) ,
2  2
после чего d fwd , dmbkw помещаются в память компьютера и считаются
априори известными.
Дальнейшее преобразование полиномов (1.13), (1.14) к каноническому
виду (1.36) требует параллельного вычисления конечных разностей. С этой
целью используется выражение конечных разностей через значения функции,
так для конечных разностей полинома (1.13) выполняется [99]
j
 yi , 0    1 Ckj yi ,
j k
j k , (1.63)
k 0

для конечных разностей полинома (1.14) [109] –


j
 yi , n  j    1 Ckj yi , n  k ,
j k
(1.64)
k 0

где C kj – биномиальные коэффициенты –


55
j  j  1... j  k  1
C kj  . (1.65)
k!
Коэффициенты (1.65) могут быть однократно вычислены, занесены в
память компьютера с целью обращения при необходимости и далее
считаются априори известными. В таком случае одновременной
параллельное вычисление конечных разностей (1.64), (1.65) сводится к
умножению коэффициентов (1.65) на значения функции (1.1) в узлах
интерполяции с последующим сложением по схеме сдваивания с временной
сложностью [81]

t (2 j )  t y  log 2 j  tc , (1.66)

где j – порядок конечной разности,   – ближайшее сверху к  целое


число. По сравнению с [96] число процессоров в левой части оценки (1.66) в
рамках представленного подхода увеличилось в два раза, что обусловлено
необходимостью построения одновременной двух интерполяционных
полиномов, а не одного, как в [96]. Такое отличие является главным в
оценках временной сложности максимально параллельных алгоритмов.
Факториалы j! в (1.15), (1.16) могут быть присоединены к
биномиальным коэффициентам, тогда в памяти сохраняются значения
полученных дробей. Последующее умножение конечных разностей на
коэффициенты d fwd , dmbkw полиномов (1.24), (1.25) соответственно и
приведение подобных преобразует полиномы (1.13), (1.14) к каноническому
виду, при этом сложение коэффициентов при j -й степени по схеме

сдваивания имеет временную сложность log 2 j  tc . С учетом

предварительного умножения на коэффициенты с тем же количеством


процессоров время оценивается из (1.66). Максимум в правой части (1.66)
достигается при степени слагаемого полиномов (1.13), (1.14) j  n , число
процессоров складывается по арифметической прогрессии, поэтому для
одного подынтервала получим
56

t n (n  1)   t y  log 2 n  1 t c . (1.67)


~
При параллельном суммировании одновременно по P подынтервалам
~
число процессоров возрастает в P раз, тогда
~
 
t P (n 2  n)  t y  log 2 (n  1)  t c .

После того как параллельно построены полиномы (1.28), (1.29)


вычисляются коэффициенты (1.35). С этой целью для всех n,
удовлетворяющих условию (1.3), априори сохраняются в памяти компьютера
значения членов последовательности C j n  j ,   j, n , j  0, n , тогда

вычисление по схеме сдваивания всех n коэффициентов (1.46) произойдёт за


время (1.67). Вычисление коэффициентов (1.37) с временной сложностью
t n  t y  tc окончательно завершит параллельное преобразование

аппроксимирующего полинома (1.5) в канонический вид (1.36).


Сравнение приближённого и точного значения функции можно
~
выполнять также параллельно одновременно для всех P подынтервалов. При
этом необходимое число процессоров вырастет пропорционально степени
~
P 1
полинома, умноженной на число проверочных точек и на – сумму
2
арифметической прогрессии, по которой возрастает число подынтервалов.
Описанные действия сохранят максимальный параллелизм схемы
аппроксимации, при этом сохранится правая часть оценки (1.11).
Дальнейшая аппроксимация функции (1.1) сведётся к параллельному
вычислению значения полинома (1.36). С этой целью значения членов
последовательности t  ,   0, n , могут быть вычислены по схеме сдваивания
с временной сложностью

t nn  1 2   log 2 n  t y , (1.68)

при этом число процессоров считается аналогично (1.67). Последующее


умножение t  на соответствующий коэффициент и сложение по схеме
57
сдваивания с временной сложностью (1.67) даст на выходе приближённое
значение функции (1.1).
С учётом того, что производная функции (1.1) аппроксимируется
полиномом степени n  1, проводя рассуждения аналогичные (1.68) получим
оценку временной сложности вычисления t  ,   0, n  1, в виде

t nn  1 2   log 2 n  t y , –

а также оценку приближённого дифференцирования –

t n (n  1) / 2  t y  log 2 n  t c .

Так как числа n 0 , n1 , …, n n 1 можно сделать априори хранимыми в


памяти компьютера, то максимально параллельное вычисление правой части
(1.66) выполнится параллельно по всем подынтервалам с соответствующим
ростом числа процессоров –

  
t P n 2  n 2  t y  log 2 n  tc .

Правые части оценок временной сложности максимально


параллельных алгоритмов модифицированной схемы (1.36), (1.37) совпадают
с оценками схемы-прототипа (1.28), (1.30), отличаясь лишь числом
процессоров, что обусловлено необходимостью одновременного
преобразования полиномов (1.17), (1.18) к виду (1.28), (1.30), в то время как
схема-прототип строится на базе одного полинома (1.17).
1.6. Сравнение предложенных схем аппроксимации с известными.
Ниже изложенные схемы сравниваются с аналогичными схемами,
построенными на базе полиномов Ньютона (1.26) [96], полиномов Гаусса [97]
и на базе отрезков ряда по полиномам Чебышева [101], схемы также
сравниваются с пакетом компьютерной математики MathCad. Подробное
описание схем на основе полиномов Ньютона (1.26) с коэффициентами
(1.28), полиномов Гаусса, а также полиномов Чебышева приводится в
приложении к главе 1. Ниже проводится сравнение абсолютной погрешности
58
аппроксимации функций, их производных, и абсолютной погрешности
приближённого вычисления определённых интегралов.
Под абсолютной погрешностью аппроксимации функции понимается
 f  f x   Pn i x  , (1.69)

под абсолютной погрешностью аппроксимации производной –


 f   f x   Pni x  , (1.70)

под абсолютной погрешностью приближённого вычисления определённого


интеграла –
b 2 k 1 xi 1
I   f x dx  
i 0
 Pn i  x dx , (1.71)
a xi

где k из (1.2), значения (1.69), (1.70) вычисляются в проверочных точках


расположенных равномерно по всему отрезку a, b  из (1.2) с априори
заданным шагом.
Для отличия погрешностей относящихся к различным схемам
используется верхний индекс:  P  – для изложенных выше схем,  N  – для
схем на базе полиномов (1.26), (1.28), G  – для схем на базе полиномов
Гаусса, T  – для схем на базе отрезков ряда по полиномам Чебышева, M  –

для погрешности полученная при использовании пакета MathCad, так  f P  –

погрешность (1.69) схемы (1.36), (1.37),  fG  – погрешность (1.87) схемы на

основе полинома Гаусса и т.д.


Численный эксперимент проводился в среде Borland Delphi 7, для
чисел с плавающей точкой использовался тип extended с 18-19 значащими
цифрами, все эксперименты проводились для a, b  0,1 .
1
В табл. 1.1 представлены погрешности вида (1.86) функции y 
1  e2 x
при помощи различных аппроксимационных схем.
59
Таблица 1.1
1
Абсолютная погрешности аппроксимации функции y 
1  e2 x
 f P   f N   fG   fT   f M 
x Предложенный Полином Полином Полином
MathCad
метод Ньютона Гаусса Чебышёва
0.00E+0000 1.877E-20 0.000E+00 0.000E+00 5.164E-15 5.551E-17
1.00E-0001 2.710E-20 1.355E-19 4.307E-14 4.904E-15 5.551E-17
2.00E-0001 2.710E-20 4.662E-19 2.070E-14 1.520E-15 5.551E-17
3.00E-0001 2.710E-20 6.234E-19 1.939E-14 1.531E-15 2.775E-17
4.00E-0001 2.710E-20 1.084E-19 3.548E-14 5.015E-15 2.775E-17
5.00E-0001 5.421E-20 0.000E+00 0.000E+00 5.384E-15 5.551E-17
6.00E-0001 0.000E+00 6.098E-19 1.668E-13 4.853E-15 2.775E-17
7.00E-0001 1.084E-19 2.019E-19 4.186E-14 1.436E-15 2.775E-17
8.00E-0001 1.084E-19 2.710E-19 2.701E-14 1.387E-15 5.551E-17
9.00E-0001 0.000E+00 8.131E-20 3.806E-14 4.378E-15 5.551E-17

Из табл. 1.1 видно, что граница абсолютной погрешности


1
аппроксимации функции y  по предложенной схеме (1.36), (1.37) на
1  e2 x
1-2 десятичных порядка меньше, чем погрешность, полученная при
использовании схемы-прототипа (1.26), (1.28) из [96], на 6-7 порядков
меньше, чем погрешность схемы на основе полиномов Гаусса, на 5
десятичных порядков меньше, чем погрешность аппроксимации рядами по
полиномам Чебышева, а также на два порядка меньше, чем при
использовании пакета MathCad.
Замечание 1.2. Отметим, что в пакете MathCad под машинным нулём
понимается величина порядка 1016 , которая не снижается при помощи
программных настроек, поэтому фактической границей абсолютной
погрешности выполненных вычислений в MathCad является 1016 с
некоторым, возможно дробным, коэффициентом.
Представленные в табл. 1.1 результаты являются типичными для
широкого класса функций, более подробно численный эксперимент по
аппроксимации функций вида (1.1) по схемам (1.36), (1.37) и (1.26), (1.28)
представлен в приложении к главе 1.
60
В табл. 1.2 представлена погрешность (1.70) аппроксимации
производной функции y  x arctg  x  .

Таблица 1.2
Абсолютная погрешности аппроксимации производной функции y  x arctg  x 

 f P   f N   fG   fT   f M 
x Предложенный Полином Полином Полином
MathCad
метод Ньютона Гаусса Чебышёва
0.00E+0000 3.401E-17 1.920E-14 4.768E-07 9.536E-07 1.387E-15
1.00E-0001 7.616E-18 4.767E-16 6.544E-07 1.869E-07 7.494E-16
2.00E-0001 2.141E-18 1.186E-16 8.817E-08 5.290E-07 1.387E-15
3.00E-0001 8.131E-19 1.387E-17 8.829E-07 4.816E-07 1.110E-15
4.00E-0001 1.409E-18 2.840E-16 2.126E-07 1.417E-07 2.109E-15
5.00E-0001 7.464E-17 5.019E-15 3.051E-07 6.103E-07 1.443E-15
6.00E-0001 7.426E-18 1.037E-16 3.609E-07 1.031E-07 1.554E-15
7.00E-0001 4.119E-18 5.312E-18 4.295E-08 2.577E-07 6.217E-15
8.00E-0001 1.301E-18 5.963E-18 3.900E-07 2.127E-07 1.776E-15
9.00E-0001 1.398E-17 1.669E-17 8.733E-08 5.821E-08 2.153E-14

Из табл. 1.2 видно, что абсолютная погрешность численного


дифференцирования по модифицированной схеме (1.36), (1.37) на 2-3
десятичных порядка меньше, чем абсолютная погрешность прототипа [96],
на 10-11 порядков меньше, чем погрешность схемы на основе полиномов
Гаусса, на 9-11 порядков меньше, чем аналогичная погрешность
аппроксимации рядами по полиномам Чебышева, на 3-4 порядка меньше, чем
при использовании пакета MathCad.
Для полноты сравнения предложенный метод сопоставляется по
оценке погрешности со сплайн-интерполяцией функций:
Таблица 1.3
Сравнение погрешности предложенного метода и сплайн-аппроксимации
Предложенный
Класс функции Сплайн-интерполяция
метод
C 1 a, b 3 8h f ' 
C 2 a, b h n 1 n 1
f 1 32 h 2 f 2

2k
C 3 a, b 1 192 h 3 f 3

61
В табл. 1.3 приняты обозначения: C  a, b – класс непрерывных и  раз
непрерывно дифференцируемых функций, k, n – определяются по
алгоритму 1.1.
Таким образом, за счет переменного k предложенный метод достигает
в 2k раз меньшего значения абсолютной погрешности, чем сплайн-
интерполяция.
Схема (1.53), (1.37) ориентирована на создание программного
комплекса аппроксимирующего производные часто встречающихся функций,
например, при компьютерном моделировании объектов и устройств
наноэлектроники [82, 88, 102 – 105], при этом за счёт и математической
модификации позволяет существенно снизить границу абсолютной
погрешности аппроксимации и фактическую временную сложность
программ [31, 97, 102, 105].
В табл. 1.4 приводятся погрешности (1.71) приближённого вычисления
определённого интеграла по отрезку a, b  0,1 от различных функций, при

этом помимо описанных обозначений под  IS  понимается погрешность


приближённого вычисления интеграла по формуле Симпсона [99].

Таблица 1.4
Абсолютная погрешность приближённого вычисления определённых интегралов

Интегрируемая  IP   I N   IG   IT   IM   IS 


функция Предложенный Полином Полином Полином Формула
MathCad
метод Ньютона Гаусса Чебышёва Симпсона
1
y 2.710E-20 3.062E-18 3.631E-07 3.200Е-07 5.551E-17 1.738E-14
1  e2 x
y  sh  x  5.421E-20 5.421E-20 5.603E-07 9.157Е-07 3.330E-16 8.913E-14
x
y 5.421E-20 8.131E-20 2.589E-07 1.421Е-07 3.885E-16 2.557E-14
1 sin x 
y  x cos x  1.084E-19 5.421E-19 2.576E-07 8.609Е-07 1.665E-16 2.892E-15
1
y
 
3
0.000E+00 2.710E-19 3.850E-07 3.207Е-07 2.220E-16 2.892E-15
x2  x  1 2

y  x arctg  x  2.710E-20 2.710E-20 3.745E-07 3.062E-06 4.771E-16 4.323E-14


62
Из табл. 1.4 видно, что абсолютная погрешность приближённого
вычисления определённого интеграла по модифицированной схеме (1.36),
(1.37) на 1-2 десятичных порядка меньше, чем по исходной схеме (1.78),
(1.28) [96], на 12-13 порядков меньше чем по схемам на основе полиномов
Гаусса и Чебышева, на 3-4 порядка меньше, чем при использовании пакета
MathCad, на 4-6 порядков меньше, чем аналогичная погрешность, полученная
по формуле Симпсона.
Отметим, что в столбце табл. 1.4, представляющем абсолютную
погрешность  I N  приближения определённого интеграла по схеме-
прототипу [96] показаны наилучшие результаты для схемы из [96], которые
не всегда могут быть получены по стандартной подпрограмме.
Таким образом, численный эксперимент, проведённый для широкого
класса функций, показывает отличительное преимущество предложенной
модификации (1.36), (1.37) прототипа (1.26), (1.28) по сравнению с
известными при универсальности изложенных методов относительно вида
функции, области изменения аргумента с отмеченными выше оговорками, а
также при алгоритмической минимизации временной сложности и
естественном параллелизме.
Математической базой улучшений, показываемых модифицированной
схемой, является построение аппроксимирующего полинома в виде среднего
арифметического полиномов Ньютона для интерполяции вперёд и назад, что
позволяет равномерно распределить ошибку аппроксимации по
подынтервалу (1.2).
Следует отметить, что представленные схемы в отличие от
стандартных программных пакетов компьютерной математики могут быть
использованы в качестве программной основы приборов, основной задачей
которых является обработка входных данных с априори заданной точностью
при минимизации времени обработки. Схемы также обладают
инвариантностью относительно архитектуры вычислительной системы и
программного окружения.
63
1.7. Выводы
1. Предложена модификация компьютерной кусочно-полиномиальной
схемы вычисления действительных функций одной действительной
переменной, отличающаяся от аналогов способом построения на основе
усреднения интерполяционных полиномов Ньютона для интерполирования
вперёд и назад на каждом подынтервале, что позволяет на порядок снизить
границы абсолютной погрешности аппроксимации.
2. На основе модификации компьютерных кусочно-полиномиальных
схем предложены видоизменения кусочно-полиномиальных схем
вычисления производных и определённых интегралов от действительных
функций одной действительной переменной, которые позволяют
существенно уменьшить погрешность приближения по сравнению с
известными алгоритмами.
3. Разработан программный комплекс для реализации предложенных
разновидностей кусочно-полиномиальных схем, обеспечивающий
минимизацию их временной сложности, на его основе проведен численный
эксперимент и получены результаты, подтверждающие существенное
снижение абсолютной погрешности вычисления функций, производных, а
также определенных интегралов по сравнению с известными методами, в
числе которых сплайн-интерполяция и методы пакета MathCad.
4. Даны оценки временной сложности предложенной модификации
кусочно-полиномиального метода на модели неветвящихся параллельных
программ, согласно которым динамическое построение базового алгоритма
кусочно-полиномиальной аппроксимации можно выполнить с
логарифмической временной сложностью.
64

ГЛАВА 2. КОМПЬЮТЕРНЫЙ МЕТОД КУСОЧНО-


ПОЛИНОМИАЛЬНОГО ВЫЧИСЛЕНИЯ ФУНКЦИЙ ДВУХ
ПЕРЕМЕННЫХ, ЧАСТНЫХ ПРОИЗВОДНЫХ И ДВОЙНЫХ
ИНТЕГРАЛОВ

В данной главе излагается компьютерная схема кусочно-


полиномиальной аппроксимации действительных функций двух
действительных переменных на основе подхода, изложенного в предыдущей
главе для случая функций одной переменной. Прямоугольная область
изменения аргумента на плоскости OXY покрывается системой
непересекающихся прямоугольных подобластей, при этом каждая
подобласть своей диагональю дробится ещё на две треугольные подобласти.
В каждой из полученных треугольных подобластей строится
соответствующий интерполяционный полином Ньютона от двух
переменных, который приводится к виду полинома с числовыми
коэффициентами и после этого применяется для аппроксимации функции.
Число подобластей и степень аппроксимирующего полинома
варьируется по алгоритму, аналогичному алгоритму 1.1, который подбирает
наименьшую степень для данного числа подобластей и заданной границы 
абсолютной погрешности аппроксимации, при этом число подобластей
выбирается также минимальным. Минимизация числа подобластей и степени
влечёт минимизацию временной сложности аппроксимации.
Аппроксимант в виде полинома с постоянными числовыми
коэффициентами применяется для аппроксимации частных производных и
двойных интегралов по прямоугольной области, при этом частные
производные от функции аппроксимируются соответствующими частными
производными от полинома, а двойной интеграл от функции – двойным
интегралом от полинома.
65
Доказывается равномерная сходимость предложенных схем в
зависимости от числа подобластей в области изменения независимых
переменных.
Схемы обладают естественным параллелизмом, приводятся оценки
временной сложности максимально параллельных алгоритмов в рамках
модели параллельных неветвящихся программ без учёта обмена данными.
Приводятся результаты численного эксперимента по сравнению
абсолютной погрешности аппроксимации функций двух переменных,
частных производных, и приближённого вычисления двойных интегралов
при помощи описанной схемы и аналогичной схемы не предусматривающей
диагонального дробления подобласти.
Построенная схема используется ниже (глава 3) как вычислительная
база приближения коэффициентов в методе Галёркина при
самосогласованном расчёте электронной структуры GaAs нанопроволоки и
основанном на нём приближённом вычислении скоростей электрон-
фононного рассеяния.
2.1. Компьютерная кусочно-полиномиальная схема
аппроксимации функций двух переменных. Предлагаемый подход [111,
112] распространяет методологию из [96, 100, 101] на случай действительных
функций двух действительных переменных.
Пусть рассматривается функция
z  f  x, y  , (2.1)

где x, y   G  R 2 , x, y, z   R3 , в замкнутой прямоугольной области

G  x, y  x a, b, y c, d . (2.2)


Схемы, реализующие аналогичный подход в круге и кольцевом секторе
описаны в [113, 114].
Область (2.2) покрывается системой прямоугольных
непересекающихся подобластей, удовлетворяющих соотношению
66
Px Py 1
G  Gk~ , (2.3)
~
k 0

где Px  2k1 , Py  2k 2 , k1 , k2  0,1, 2, ...,

  
  x, y  x  xi , xi 1 , y  y j , y j 1  , i  0, Px  2, j  0, Py  2,

  
Gk~    x, y  x  xi , xi 1 , y  y j , y j 1  , i  Px  1, j  0, Py  2, (2.4)

  
  x, y  x  xi , xi 1 , y  y j , y j 1 , i  0, Px  2, j  Py  1.

Каждая подобласть Gk~ из (2.3), (2.4) дробится диагональю

hy hy
w x    x yi  xi 1 (2.5)
hx hx
на треугольные подобласти вида


  x, y  xi  x  xi 1 , y j  y  w x  ,

 i  0, Px  2, j  0, Py  2,
d

Gk~    x, y  xi  x  xi 1 , y j  y  w x  ,  i  Px  1, j  0, Py  2, (2.6)


  x, y  xi  x  xi 1 , y j  y  w x  ,  i  0, Px  2, j  Py  1,

 x, y  x  x  x
i i 1 , w x   y  y j 1 ,  i  0, Px  2, j  0, Py  2,

Gk~u   x, y  x  x  x
i i 1 , w x   y  y j 1 , i  Px  1, j  0, Py  2, (2.7)

 x, y  x  x  x
i i 1 , w x   y  y j 1 , i  0, Px  2, j  Py  1,

ba d c
где Px , Py , k1 , k 2 из (2.3), hx  , hy  – линейные размеры
Px Py

подобласти.
В подобластях Gk~d из (2.6), (2.7) строятся полиномы Ньютона для

интерполирования вперёд и вверх, в подобластях Gk~u – полиномы для

интерполирования назад и вниз. С использованием матричной схемы (1.23)


[28] и приведения подобных интерполирующие полиномы приводятся к виду
N N i
Pk~s, N  x, y     ak~s , i , j x i y j , (2.9)
i 0 j 0
67
~
где N – степень полинома, k  0, Px Py  1 – номер подобласти (2.6), (2.7), Px ,

Py из (2.3), s   d , u, d – индекс, соответствующий подобласти Gk~d , u –

индекс, соответствующий подобласти Gk~u .

Затем в каждой подобласти (2.6), (2.7) в проверочных точках, не


совпадающих с узлами интерполяции и следующих по направлению вдоль
координатных осей с постоянным априори заданным шагом, проверяется
условие вида

f x, y   Pk~s, i , j x, y    , (2.10)

где  – априори заданная граница абсолютной погрешности аппроксимации,


Pk~s, i , j  x, y  из (2.9).

Излагаемый подход по аналогии с работами [96, 100, 101] учитывает


ограничения числа подобластей вида
k1  K x ,
 (2.11)
k2  K y ,
а также ограничение степени N интерполирующего полинома
~
N N, (2.12)
~
где K x , K y , N задаются априори, k1 , k 2 из (2.3).

Для определения минимальных значений чисел k1 , k 2 , N служит


Алгоритм 2.1
/*
Величины, входящие в блок комментария
задаются как входные параметры подпрограммы функции,
реализующей приводимый непосредственно ниже алгоритм,
а именно задаются:

const int Kx = … // Кх из (2.11)


const int Ky = … // Кy из (2.11)
const int Nn = …
const long double X0 = … // Координаты вершин
const long double Xn = … // области
const long double Y0 = … // изменения
const long double Yn = … // аргумента

*/
for (int ky = 0; ky <= Ky; ky++) { // k2 из (2.6), (2.7)
long double hy = (Yn-Y0)/pow(2,ky);// размер подобласти вдоль оси OY
68
for (int kx = 0; kx <= Kx; kx++) { // k1 из (2.6), (2.7)
long double PxPy = (int)(pow(0,kx) * pow(0,ky));
long double hx = (Xn - X0) / pow(0,kx);
for (int N = 1; N <= Nn; N++) { // степень полинома
long double ya=Y0-hy;
for (int kpy=0; kpy < pow(0,ky); kpy++) {
ya += hy;
long double yb=ya+hy;
long double xa=X0-hx;
for (int kpx=0; kpx<pow(0,kx); kpx++) {
xa += hx;
int kk = (int)pow(0, kx) * kpy + kpx;
long double xb=xa+hx;
/*
Построение аппроксимирующего полинома
*/
for (int i = 0; i <= Npt; i++) {
long double xp = xa+i*h1x; // абсцисса проверочной точки в Gd
long double xxp = xb–i*h1x; // абсцисса проверочной точки в Gu
long double tp=(xp-xa)/hhx;
long double ttp=(xb-xxp)/hhx;
for (int j = 0; j <= Npt - i; j++) {
long double yp=ya+j*h1y; // ордината проверочной точки в Gd
long double yyp=yb–j*h1y; // ордината проверочной точки в Gu
long double up = (yp - ya) / hhy;
long double uup = (yb - yyp) / hhy;
long double p = a_u_r[kk][0][N];
for (int m = N - 1; m >= 0; m--) {
p *= up;
long double p_t = a_u_r[kk][N-m][m];
for (int k=N – m - 1; k >= 0; k--)
p_t = p_t * tp + a_u_r[kk][k][m];
p += p_t;
}
long double p_ = a_d_l[kk][0][N];
for (int m = N - 1; m >= 0; m--) {
p_ *= uup;
long double p_t_ = a_d_l[kk][N-m][m];
for (int k = N – m - 1; k >= 0; k--)
p_t_ = p_t_*ttp + a_d_l[kk][k][m];
p_ += p_t_;
}
if (abs(Fxy(xp,yp) - p) >= eps) goto next_iteration;
if (abs(Fxy(xxp,yyp) - p_) >= eps) goto next_iteration;
}
}
if (kk == PxPy - 1) goto final;
}
}
next_iteration:;
}
}
}
final:;

Алгоритм 2.1 имеет структурную схему, представленную на рис. 2.1.


69

k1  0, k 2  0, N  1

k2  k2  1
k1  K x , Нет
k2  K y
k1  k1  1
Да
N 1
Нет ~
NN

Да
N  N 1
Построение
полинома

Нет
f x, y   Px, y   

Да

Конец

Рис. 2.1. Структурная схема алгоритма кусочно-полиномиальной аппроксимации функций


двух переменных

По алгоритму 2 построение полинома (2.9) начинается с минимальных


значений k1  0 , k 2  0 , N  1 . Если при таких k1 , k 2 , N условие (2.10)
выполняется во всех проверочных точках, то полином (2.9) считается
построенным, в противном случае значение N увеличивается на единицу и
построение повторяется, и так до исчерпания пределов (2.12). При
~
достижении значения N из (2.12) и невыполнения хотя бы в одной из
проверочных точек неравенства (2.10) степень принимает минимальное
значение N  1 , и построение аппроксимирующего полинома повторяется
при увеличенном на единицу k1 . При достижении параметром k1 значения Kx

и невыполнении условия (2.10) хотя бы в одной проверочной точке,


70
построение выполняется для увеличенного на единицу k 2 и k1  0 , N  1 и
т.д.
Полученная по алгоритму 2.1 степень N полинома (2.9) является
минимальной соответствующей данному числу подобластей, при которой
выполняется условие (2.10), так достигается минимизация временной
сложности аппроксимации в том случае, когда аппроксимируемая функция
принадлежит библиотеке стандартных подпрограмм или достаточно часто
повторяющихся (например, при моделировании некоторого процесса)
функций. В этих случаях коэффициенты аппроксимирующего полинома
заносятся в память компьютера. Адресация к этим коэффициентам
выполняется путем дешифрации подобласти (2.6), (2.7) при помощи
соотношений
~
k  jPx  i,

 x  a  y  c
i    , j   ,
  x  h  y 
h (2.8)

 x, y   Gk~ , y  w x ,
d

 x, y   G~u , y  w x ,
 k

ba d c
где   – целая часть числа  , hx  , hy  , Px , Py те же, что и в
Px Py

(2.6).
~
Отметим, что во избежание неоднозначной дешифрации номера k в
граничных точках подобластей Gk~d из (2.6) и Gk~u из (2.7), общая часть границ

подобластей включается только в одну из смежных, при этом


интерполирующий полином строится в замыкании соответствующей
подобласти.
После данной выборки коэффициентов из памяти аппроксимация
функции (2.1) с отмеченной оговоркой и при вычислении полинома с
использованием схемы Горнера будет иметь временную сложность
71

t 1 
N  1N  2  t  tc  , (2.13)
y
2
где t y , t c – время одного умножения и сложения соответственно.

Полином (2.9) с постоянными коэффициентами, имеет табличные


частные производные и применяется ниже для аппроксимации частных
производных функции (2.1), а также для приближённого вычисления
двойных интегралов от функции (2.1) по области (2.2).
Ниже приведение полиномов Ньютона от двух переменных к виду (2.9)
описывается с некоторыми деталями, используемыми в дальнейшем [111].
В предположении, что аппроксимируемая функция является
непрерывной по обеим переменным в области (2.2), в подобластях Gk~d , Gk~u

задаются соответствующие узлы интерполяции:


~
 
Gk~d  xi*, , y*j , m xi*,  xi  h, y*j , m  y j  mg,   0, N , m  0, N   ,  (2.14)
~

Gk~u  ~ y j 1, m  ~
xi 1,  , ~ xi 1,   xi 1  h, ~
y j 1, m  y j 1  mg,   0, N , m  0, N   , 
(2.15)
~
где h  hx N , g  hy N , i , j , k из (2.7), hx , hy из (2.6), (2.7).

Далее, строятся интерполяционные полиномы Ньютона вида:



m f x k y mk xi*, 0 , y*j , 0  mk
f xi , 0 , y j , 0      x  xq   y  yr 
N m k
Pk~d, N  x, y   (2.16)
m 1 k  0 k!h k m  k ! g m  k q 0 r 0

в узлах (2.14) для точек x, y   Gk~d ,

m f x k y mk ~
xi 1, 0 , ~y j 1, 0  mk
f xi 1, 0 , y j 1, 0     x  xq   y  yr (2.17)
N m k
Pk~d, N  x, y   
m 1 k  0 k!h k m  k ! g m  k q 0 r 0

в узлах (2.15) для точек  x, y   Gk~u .

Двойные конечные разности в полиноме (2.16) имеют вид


72
 1 0 f x , y   f x , y
*
i
*
j
*
i 1
*
j   f x , y ,
*
i
*
j
 xy
 0 1 f
 xy x , y   f x , y
*
i
*
j
*
i
*
j 1   f x , y ,
*
i
*
j
 m
f x , y    f x , y     , m  k  0,
(2.18)
m 1 m 1
 x k y m  k
* * * *
i j x k y m  k 1 i j 1 x k y m  k 1
f xi* , y *j
 m
 x k y m  k f x , y   
*
i
*
j
m 1
x k 1 y m  k
f x , y   
*
i 1
*
j
m 1
x k 1 y m  k
f x , y , m  k  0,
*
i
*
j

аналогично, конечные разности в полиноме (2.17) –


 1 0 f ~ y j   f ~
xi , ~ xi 1 , ~ y j   f ~ y j ,
xi , ~
 x y

 0 1 f ~ ~  ~ ~  ~ ~ 
 x y xi , y j  f xi , y j 1  f xi , y j ,
 m (2.19)
 x k y mk f xi , y j    x k y mk 1 f xi , y j 1    x k y mk 1 f xi , y j , m  k  0 ,
~ ~ m 1 ~ ~ m 1 ~ ~
 m
 x k y mk f ~ y j   mx k11 y mk f ~
xi , ~ y j   mx k11 y mk f ~
xi 1 , ~ y j , m  k  0 ,
xi , ~

где m  2, N , k  0, m , i  0, N  m , j  0, N  i . Так, согласно (2.19) конечные


разности второго и третьего порядка имеют вид
2x 2 y 0 f ~ y j   f ~
xi , ~ y j   2 f ~
xi  2 , ~ y j   f ~
xi 1 , ~ y j ,
xi , ~

2x1 y1 f ~ y j   f ~
xi , ~ y j 1   f ~
xi 1 , ~ y j   f ~
xi 1 , ~ y j 1   f ~
xi , ~ y j ,
xi , ~

2x 0 y 2 f ~ y j   f ~
xi , ~ y j  2   2 f ~
xi , ~ y j 1   f ~
xi , ~ y j ,
xi , ~

3x 3 y 0 f ~ y j   f ~
xi , ~ y j   3 f ~
xi  3 , ~ y j   3 f ~
xi  2 , ~ y j   f ~
xi 1 , ~ y j ,
xi , ~

3x 2 y1 f ~ y j   f ~
xi , ~ y j 1   2 f ~
xi  2 , ~ xi 1 , ~y j 1  
 f ~ xi , ~y j 1   f ~ y j   2 f ~
xi  2 , ~ y j   f ~
xi 1 , ~ y j ,
xi , ~
3 f ~
x1 y 2
x ,~ y   f ~
i j x ,~ y   f ~
i 1 j2 x ,~ y  i j2

 2 f ~ y j 1   2 f ~
xi 1 , ~ y j 1   f ~
xi , ~ xi 1 , ~y j   f ~ y j ,
xi , ~
3x 0 y 3 f ~ y j   f ~
xi , ~ y j  3   3 f ~
xi , ~ y j  2   3 f ~
xi , ~ y j 1   f ~
xi , ~ y j .
xi , ~

Приведённые непосредственно выше явные выражения конечных разностей


через значения функции совпадают с конечными разностями из [113].
В обозначениях

m f x k y m  k xi*, 0 , y *j , 0 
bmd ,k  , (2.20)
k!m  k !
73
где m f x k y m k xi , 0 , y j , 0  из (2.18), m  1, N , k  0, m , полином (2.16) запишется в

виде

    h g bmd , k mk
x  xq   y  yr  .
N m k
Pk~d, N t , u   f xi*, 0 , y*j , 0 k mk 
(2.21)
m 1 k  0 q 0 r 0

Введение в равенстве (2.17) обозначений


mx k y m  k f ~ y j 1, 0 
xi 1, 0 , ~
bmu ,k  , (2.22)
k!m  k !
повлечёт
bmu , k
t , u   f ~xi 1, 0 , ~y j 1, 0   
mk
x  xq   y  yr .
N m k
Pk~u, N  k mk 
(2.23)
m 1 k  0 h g q 0 r 0

В полиноме (2.21) производятся замены переменных


x  xi ,0
t , x, y   Gk~d , t  0, N , (2.24)
h
y  yi ,0
u , x, y   Gk~d , u  0, N  , (2.25)
g
которые приведут полином (2.20) к виду

 
N m k mk
Pk~d, N t , u   f xi*, 0 , y *j , 0    bmd , k  t  q   u  r  . (2.26)
m 1 k  0 q 0 r 0

Аналогично, замены
xi 1,0  x
t , x, y   Gk~u , t  0, N , (2.27)
h
yi 1,0  y
u ,  x, y   Gk~u , u  0, N  , (2.28)
g
преобразуют равенство (2.23) к виду

Pk~u, N t , u   f ~ y j 1, 0  
N m k mk
xi 1, 0 , ~   bmu , k  t  q   u  r  . (2.29)
m 1 k  0 q 0 r 0

Полиномы (2.26), (2.29) имеют схожий вид с точностью до значений


функции в начальных узлах интерполяции, а также индексов, указывающих
подобласть (2.6), (2.7). Формально полагая  
b0d,0  f xi*, 0 , y *j , 0 ,
74
b0u,0  f ~ y j 1, 0  ,
xi 1, 0 , ~ для краткости дальнейшего изложения введем

обозначение
N m k mk
Pk~s, N t , u     bms ,k  t  q  u  r  , (2.30)
m 0 k 0 q 0 r 0

где при подстановке индекса d вместо индекса s запись (2.30) будет


определять полином (2.26) в подобласти Gk~d из (2.6), аналогично при замене

s на u полином (2.30) станет полиномом (2.29) в подобласти Gk~u из (2.7).


Всюду ниже в данной статье такое соответствие индексов s , d , u
сохранится во всех записях.
k mk
По аналогии с (1.24), применяя к произведениям  t  q  ,  u  r 
q 0 r 0

схему (1.23), получим


k mk k mk
 t  q  u  r    d k , q t  dm  k ,r u r . q ~
(2.31)
q 0 r 0 q 0 r 0

Раскрывая скобки и приводя подобные в правой части (2.31), запишем


k mk k mk
 t  q  u  r     d m  k , r d k , qt qu r .
~
q 0 r 0 q 0 r 0

~
Последнее равенство в обозначениях Dm, k , q, r  d m  k , r dk , q примет вид
k mk k mk
 t  q  u  r     Dm, k , q, r t qu r ,
q 0 r 0 q 0 r 0

тогда для соотношения (2.30) справедливо


N m k mk
Pk~s, N t , u     bms , k   Dm,k ,q,rt qu r . (2.32)
m 0 k 0 q 0 r 0

Раскрытие скобок и приведение подобных при произведениях t q u r в


(2.32) повлечёт
N q
Pk~s, N t , u     ak~s ,q,r t q u r . (2.33)
q 0 r 0
75
ak~s , q , r  ak~d , q , r ,  x, y   Gk~d ,

ak~s , q , r  aku~ , q , r ,  x, y   Gk~u ,

 s N mr (2.34)
ak~ , q , r    bm, k Dm, k , q , r ,
s

 mr k q

q  1, N , r  0, N  q.
Аппроксимирующий полином (2.33) вычисляется по схеме Горнера:

 
Pk~s, N t , u   ... ak~s ,0, N u  ak~s ,1, N 1t  ak~s ,0, N 1 u   (2.35)
 
ak~s , 2, N  2t  ak~s ,1, N  2 t  ak~s , 0, N  2  u  ... u  ...  ak~s , 0,0

с временной сложностью (2.13). В (2.35) следует отличать квадратные скобки


от значка операции вычисления целой части числа.
Преобразования (2.20) – (2.33) интерполяционных полиномов (2.16),
~
(2.17) инвариантны относительно числа подобластей, степени N и номера k
подобласти (2.6), (2.7), кроме того шаги схемы вычисления коэффициентов
(2.35) инвариантны относительно вида аппроксимируемой функции и
размера области изменения аргументов.
2.2. Равномерная сходимость компьютерной кусочно-
полиномиальной аппроксимации функций двух переменных и
численный эксперимент по компьютерной аппроксимации функций.
Рассуждения, повторяющие методику доказательства равномерной
сходимости, предложенную в [108] для схемы (1.28), (1.30) в случае одной
действительной переменной, применимы и для схемы (2.33), (2.34).
Справедлива
Теорема 2.1 [114]. Пусть для произвольного натурального N  const
функция f  x, y  из (2.1) определена и непрерывна вместе со своими
частными производными до N  1 -го порядка, включительно, при этом
частные производные в граничных точках замкнутой области G из (2.2)
понимаются как пределы соответствующих частных производных при
стремлении точек изнутри к границе. Тогда последовательность полиномов
76
Pk~s, N t , u  из (2.33) равномерно сходится на G при k1   , k2   , где

k1  log 2 Px , k2  log 2 Py , Px , Py – число подобластей (2.4) вдоль оси абсцисс и

ординат соответственно. Скорость сходимости имеет оценку

t , u   k1 k 2 , где M Nmax  N  2M max b  a  d  c N 1


N 1
M Nmax
Rk~s , N при b  a  1 ,
2 2 N  1!

d  c 1, M Nmax 
N  2M max при b  a  1, d  c  1,
N  1!
 N 1 f x, y 
M max  max max .
i 0,1,..., N 1  G x i y N 1i

Доказательство теоремы 2.1 приводится в приложении к главе 2.


Замечание 2.1. В качестве математической основы излагаемого
подхода используются интерполирующие полиномы Ньютона, узлы
интерполяции которых расположены, в том числе, на границе подобласти
(2.6). Узлы на границе являются общими для полиномов, построенных на
соседних подобластях, этим обусловлена непрерывность аппроксиманта.
Ниже в табл. 2.1 приводится абсолютная погрешность

  f x, y   Pk~s, N t x, u y  аппроксимации функции z  sin x  y  по схеме

(2.33), (2.34).

Таблица 2.1
Абсолютная погрешность аппроксимации функции z  sin x  y 

y x Pk~s, N t x , u y  
0.0E+0000 0.0000E+0000 0.0000E+0000
2.0E-0001 1.9867E-0001 1.3553E-0020
0.0E+0000 4.0E-0001 3.8942E-0001 8.1315E-0020
6.0E-0001 5.6464E-0001 5.4210E-0020
8.0E-0001 7.1736E-0001 5.4210E-0020
0.0E+0000 1.9867E-0001 1.3553E-0020
2.0E-0001 3.8942E-0001 8.1315E-0020
2.0E-0001 4.0E-0001 5.6464E-0001 5.4210E-0020
6.0E-0001 7.1736E-0001 5.4210E-0020
8.0E-0001 8.4147E-0001 0.0000E+0000
0.0E+0000 3.8942E-0001 8.1315E-0020
2.0E-0001 5.6464E-0001 5.4210E-0020
4.0E-0001
4.0E-0001 7.1736E-0001 5.4210E-0020
6.0E-0001 8.4147E-0001 0.0000E+0000
77
8.0E-0001 9.3204E-0001 0.0000E+0000
0.0E+0000 5.6464E-0001 5.4210E-0020
2.0E-0001 7.1736E-0001 5.4210E-0020
6.0E-0001 4.0E-0001 8.4147E-0001 0.0000E+0000
6.0E-0001 9.3204E-0001 0.0000E+0000
8.0E-0001 9.8545E-0001 0.0000E+0000
0.0E+0000 7.1736E-0001 5.4210E-0020
2.0E-0001 8.4147E-0001 0.0000E+0000
8.0E-0001 4.0E-0001 9.3204E-0001 5.4210E-0020
6.0E-0001 9.8545E-0001 0.0000E+0000
8.0E-0001 9.9957E-0001 5.4210E-0020

Из табл. 2.1 видно, что абсолютная погрешность аппроксимации


функции z  sin x  y  не превосходит по порядку погрешности
представления данных в формате long double C++.
Представленное в табл. 2.1 поведение погрешности компьютерной
кусочно-полиномиальной аппроксимации является типичным. Более
подробно результаты численного эксперимента по сравнению предложенных
кусочно-полиномиальных методов аппроксимации с известными приводятся
в параграфе, посвящённом сравнительному анализу схем аппроксимации, а
также в приложении к главе 2.
В табл. 2.2 показано фактическое время аппроксимации функций при
помощи кусочно-полиномиальной схемы на персональном компьютере Intel
Core 2 Quad Q6600 8Gb RAM.

Таблица 2.2
Фактическое время кусочно-полиномиального вычисления функций
Функция Время аппроксимации

z  sin x  y  10 мс
z  cosx  y  12 мс
x y
ze 12 мс
z  x 2e x sin  5 y  125 мс

z  xy sh x 2  y 2  31 мс

z  xy x 2

1 y2 1  41 мс

Из табл. 2.2 видно, что время аппроксимации, увеличиваясь при


усложнении поведения функции, не превосходит 125 мс.
78
Замечание 2.2. В случае, когда функция принадлежит библиотеке
стандартных функций, или непосредственно часто используется в процессе
моделирования, коэффициенты (2.34) могут быть занесены в память
компьютера, тогда с использованием дешифрации вида (2.8) временная
сложность аппроксимации функции (2.1) будет оцениваться из соотношения
(2.13). Поскольку N  const , то в данном случае временная сложность имеет
порядок O1 .
2.3. Применение компьютерной кусочно-полиномиальной схемы
для аппроксимации частных производных. Полином (2.33) с постоянными
коэффициентами (2.34) и «табличными» частными производными
применяется ниже для аппроксимации частных производных от функции
(2.1). Ниже предполагается, что аппроксимируемые частные производные от
функции (2.1) произвольно фиксированного порядка, где порядок не
превышает степень аппроксимирующего полинома, существуют, также
предполагается, что коэффициенты (2.34) вычислены, и при помощи
дешифрации (2.8) определена подобласть (2.6), (2.7). В граничных точках
области G из (2.2) под частными производными понимаются пределы
соответствующих частных производных при стремлении точек к границе
изнутри области [115].
Из того что полином (2.33) построен, следует приближённое равенство
f x, y   Pk~s, N t , u  , (2.36)

где t , u определяются выражениями (2.24), (2.25) в подобласти (2.6), и


соотношениями (2.27), (2.28) – в подобласти (2.7).
Продифференцировав обе части соотношения (2.45), получим
k k
f  x, y    k Pk~s, N t , u  , (2.37)
x y
 k
x y
где , k – порядок дифференцирования по переменной x и y
соответственно,   k  N , при этом считается, что если   0 , то
79
дифференцирование по переменной x не производится, аналогично, в случае
k  0.
k
При вычислении частной производной P~s t , u  в соотношении
x y
 k k ,N

(2.36) полином Pk~s, N t , u  считается суперпозицией функций от переменных

x , y , поэтому выполняется
k
   k f  x, y   dt 

 du 
    
x  y k  dx   dy  (2.38)
N  k N i 
   ii  1...i    1 j  j  1... j  k  1 ak~s ,i, j t i  u j  k ,
i  j k

где производные dt dx , du dy вычисляются дифференцированием равенств


(2.24), (2.25) в подобласти (2.6) и дифференцированием равенств (2.27), (2.28)
в подобласти (2.7). Вводятся обозначения
dt
hs  , (2.39)
dx
du
gs  , (2.40)
dy
где

h, x, y   Gk~ ,


dt 
d


dx  h, x, y   G~u ,
 k

 g , x, y   Gk~ ,
du 
d


dy  g , x, y   G~u ,
 k

h , g – шаги интерполяции из (2.14), (2.15).


В обозначениях (2.39), (2.40) аппроксимация (2.38) примет вид
   k f  x, y 
 hs  g s k 
x y k

N  k N i 
(2.41)
   ii  1...i    1 j j  1... j  k  1 ak~s ,i, j t i  u j  k .
i  j k

Заметим, что справедливы равенства:


80

ii  1...i    1 
i!
, (2.42)
i   !

j  j  1... j  k  1 
j!
, (2.43)
 j  k !
тогда произведения ii  1...i    1 , j  j  1... j  k  1 в правой части (2.41)
i! j!
могут быть вычислены в силу (2.42), (2.43) как отношения , за
i   !  j  k !
время одного деления при априори известных членах последовательности
0!, 1!, ..., N !. Если памяти компьютера достаточно, чтобы при заданном N
хранить значения
i! j!
i , j ,, k  , (2.44)
i   !  j  k !
где i, j, k ,   0, N , то с целью сокращения времени вычислений правой части
(2.41) можно занести в память i , j ,,k для дальнейшего считывания при

необходимости.
С учётом обозначений (2.44) и выражений (2.42), (2.43) приближённое
равенство (2.41) примет вид
   k f  x, y  N  k N i 
 hs g s    i , j , , k ak~s , i , j t i  u j  k .
 k
(2.45)
x y k
i  j k

Правая часть (2.45) может быть вычислена по схеме Горнера:


   k f  x, y 
x y k
 
 hs  g s k ...   , N   ,  , k ak~s ,  , N   u    1, N   1,  , k ak~s ,  1, N   1t 

 
   , N   1,  , k ak~s ,  , N   1 u   2, N    2,  , k ak~s , 2, N    2t  (2.46)
  
 1, N    2,  , k ak~s ,1, N    2 t   0, N    2,  , k ak~s , 0, N    2 u  ... u  ...    , k ,  , k aku~ ,  k .

Схема (2.54), (2.55) с предварительной дешифрацией (2.8) позволяет


аппроксимировать частные производные   k -го порядка,   k  N , с
временной сложностью t 1  N  1  k N  2   2 t y  tc  в обозначениях

(2.13).
81
В граничных точках области (2.2) схема (2.45), (2.46) аппроксимирует
пределы соответствующих частных производных от функции (2.1) при
стремлении точек к границе области.
2.4. Численный эксперимент по аппроксимации частных
производных. Ниже в табл. 2.3 приводится абсолютная погрешность
 
 f x, y   Pk~s, N t x , u y  аппроксимации частной производной
y y


sin x  y  при помощи схемы (2.45), (2.46).
y

Таблица 2.3

Абсолютная погрешность аппроксимации частной производной sin x  y 
y
 s
y x P~ t x , u  y   f
y k , N
0.0E+0000 1.0000E+0000 1.4311E-0017
2.0E-0001 9.8007E-0001 7.2099E-0018
0.0E+0000 4.0E-0001 9.2106E-0001 2.2443E-0017
6.0E-0001 8.2534E-0001 2.5967E-0017
8.0E-0001 6.9671E-0001 3.2689E-0017
0.0E+0000 9.8007E-0001 2.7105E-0019
2.0E-0001 9.2106E-0001 6.7221E-0018
2.0E-0001 4.0E-0001 8.2534E-0001 7.1015E-0018
6.0E-0001 6.9671E-0001 2.3852E-0018
8.0E-0001 5.4030E-0001 5.0589E-0016
0.0E+0000 9.2106E-0001 6.1257E-0018
2.0E-0001 8.2534E-0001 5.5836E-0018
4.0E-0001 4.0E-0001 6.9671E-0001 1.7347E-0018
6.0E-0001 5.4030E-0001 5.0475E-0016
8.0E-0001 3.6236E-0001 4.8789E-0018
0.0E+0000 8.2534E-0001 1.0625E-0017
2.0E-0001 6.9671E-0001 5.8547E-0018
6.0E-0001 4.0E-0001 5.4030E-0001 5.0480E-0016
6.0E-0001 3.6236E-0001 4.8518E-0018
8.0E-0001 1.6997E-0001 1.6588E-0017
0.0E+0000 6.9671E-0001 1.5720E-0018
2.0E-0001 5.4030E-0001 5.0589E-0016
8.0E-0001 4.0E-0001 3.6236E-0001 4.8789E-0018
6.0E-0001 1.6997E-0001 1.6602E-0017
8.0E-0001 -2.9200E-0002 1.7327E-0017

Из табл. 2.3 видно, что абсолютная погрешность при однократном


приближённом дифференцировании функций вида (2.1) не превосходит 1016 .
82
В табл. 2.4 показана абсолютная погрешность аппроксимации частной
2
производной второго порядка cosx  y  .
x 2

Таблица 2.4
 2
Абсолютная погрешность аппроксимации частной производной cosx  y 
x 2
2 s
y x P~ t  x , u  y   f
x 2 k , N
0.0E+0000 0.0E+0000 -1.0000E-0000 -1.6054E-0014
2.0E-0001 -9.8007E-0001 -3.2775E-0016
4.0E-0001 -9.2106E-0001 3.4727E-0016
6.0E-0001 -8.2534E-0001 -1.9117E-0015
8.0E-0001 -6.9671E-0001 7.8583E-0016
2.0E-0001 0.0E+0000 -9.8007E-0001 -3.2775E-0016
2.0E-0001 -9.2106E-0001 3.4727E-0016
4.0E-0001 -8.2534E-0001 -1.9117E-0015
6.0E-0001 -6.9671E-0001 7.8583E-0016
8.0E-0001 -5.4030E-0001 -1.1229E-0013
4.0E-0001 0.0E+0000 -9.2106E-0001 3.4727E-0016
2.0E-0001 -8.2534E-0001 -1.9118E-0015
4.0E-0001 -6.9671E-0001 7.8583E-0016
6.0E-0001 -5.4030E-0001 -1.1229E-0013
8.0E-0001 -3.6236E-0001 -7.3010E-0016
6.0E-0001 0.0E+0000 -8.2534E-0001 -1.9117E-0015
2.0E-0001 -6.9671E-0001 7.8583E-0016
4.0E-0001 -5.4030E-0001 -1.1229E-0013
6.0E-0001 -3.6236E-0001 -7.3007E-0016
8.0E-0001 -1.6997E-0001 2.3899E-0015
9.0E-0001 0.0E+0000 -6.2161E-0001 2.5548E-0015
2.0E-0001 -4.5360E-0001 -2.0738E-0015
4.0E-0001 -2.6750E-0001 1.0121E-0015
6.0E-0001 -7.0737E-0002 1.3560E-0013
8.0E-0001 1.2884E-0001 -9.6583E-0016

Табл. 2.4 иллюстрирует, что прямая частная производная


2
cosx  y  аппроксимирует с абсолютной погрешностью не
x 2
превышающей 10 12 .
В табл. 2.3, 2.4 представлены типичные для широкого класса функций
результаты. Детально численный эксперимент по аппроксимации частных
производных описан ниже в параграфе, посвящённом сравнительному
анализу схем аппроксимации, и в приложении к главе 2.
83
Относительно временной сложности компьютерной аппроксимации
частных производных функций двух переменных можно повторить
замечание 2.2. В частности, для часто встречающихся функций время
компьютерного вычисления частных производных имеет порядок O1 .
2.5. Применение компьютерной кусочно-полиномиальной схемы
для приближённого вычисления двойных интегралов и скорость
сходимости процесса приближения. В следующих ниже рассуждениях
полином (2.33) с коэффициентами (2.34) предполагается построенным в
ограничениях теоремы 2.1, что влечёт выполнение приближённого равенства
(2.37). В частности это означает возможность используемого в дальнейшем
перехода от двойного интеграла к повторному.
Интегрируя обе части (2.37) по области (2.2) с учётом аддитивности
интеграла по области интегрирования, получим
Px Py 1  
 
 f x, y  dx dy  k~ 0   Pk~ , N x, y  dx dy   Pk~ , N x, y  dx dy  ,
d u
(2.47)
G 
Gk~
d
G ~u
k


где Pk~s, N  x, y   Pk~s, N t  x , u  y  из (2.33), t , u определяются соотношениями

(2.24), (2.25) в области (2.6), а также соотношениями (2.27), (2.28).


В области Gk~ из (2.4) выполняется соотношение

 f x, y  dx dy  I  Iu,
d
(2.48)
Gk~

в обозначениях
Id   Pk~, N x, y  dx dy ,
d
(2.49)
G ~d
k

I u   Pk~u, N  x, y  dx dy . (2.50)
G ~u
k

Из соотношений (2.23), (2.24) следуют равенства: dx  h dt , dy  g du , с


учётом которых переход от двойного интеграла к повторному в (2.49) влечёт
84
N N t N N i

 Pk~d, N x, y  dx dy  hg  dt    ak~d , ij t iu j du . (2.51)


G ~d 0 0 i 0 j 0
k

Проинтегрировав правую часть равенства (2.51), получим


N N N i

 Pk~d, N x, y dx dy  hg    ak~ , ij t  N  t  dt ,


1 d i j 1

G ~d 0 i 0 j 0
j 1
k

откуда, с применением бинома Ньютона к скобкам N  t  j1 , следует


соотношение:
1 d i j 1
N N N i

 Pk~d, N x, y  dx dy  hg    ak~ , ij t    , j t  dt , (2.52)


G ~d 0 i 0 j 0
j 1  0
k

где

 , j   1 N
  j 1  
C j 1 , при   0, j  1,
 (2.53)
 , j  0 , при   j  2, j  0, N  i, i  0, N .

Раскрытие скобок и приведение подобных в (2.52) влечёт


N N

 Pk~d, N x, y  dx dy  hg    k~d, i t i dt , (2.54)


G ~d 0 i 0
k

где
N i
1
 k~d, i    j  1 ak~d , i   j  , j . (2.55)
j 0  0

Непосредственное интегрирование правой части равенства приведёт


(2.54) к равенству вида:
N N

 Pk~d, N x, y  dx dy  hg  1  k~d, i t i 1 . (2.56)


G ~d i 0 i  1 0
k

Проводя аналогичные рассуждения для интеграла I u из (2.50),


получим
N N

 Pk~u, N x, y  dx dy  hg  1  k~u, i t i 1 , (2.57)


G ~u i 0 i  1 0
k
85
N i
1
 k~u, i    j  1 aku~, i   j  , j , (2.58)
j 0  0

где  , j из (2.53).

С учётом (2.54), (2.57) приближённое равенство (2.47) примет вид


Px Py 1  N N N

 N

f x, y  dx dy  hg
1 d i 1 1 u i 1
  

 k~ , i t 

 k~ , i t  . (2.59)
G
~
k 0 
i  0
i 1 0 i 0 i 1 0 

Из (2.59) следует окончательная формула приближённого
интегрирования:
Px Py 1 N
1
 f x, y  dx dy  hg k~0 
i 0 i  1
 k~, i N i (2.60)
G

в обозначении

 j  1 aku~, i   j  ak~d , i   j  , j ,
N i
1
 k~ , i   d
~
k ,i
 u
~
k ,i
 (2.61)
j 0  0

где  k~d, i из (2.55),  k~u, i из (2.58).

Коэффициенты (2.61) заносятся в память компьютера, что сводит


приближённое вычисление интеграла лишь к вычислению полинома (2.60) по
схеме Горнера:
N   ~  k~ , N 1   k~ , N  2   k~ , 0 
N
1   k , N 
hg   k~ ,it i 1
 hx g  ... N N N  . (2.62)
i 0 i  1    N  1 N  N  1  1 
0
    
Схема (2.60), (2.62) по построению инвариантна относительно
размеров области (2.2) и обладает естественным параллелизмом [111].
Построенный процесс приближённого вычисления двойного интеграла
(2.47) сходится со скоростью геометрической прогрессии при сужении
подобласти. Справедлива
Теорема 2.3 [114]. В условиях теоремы 2.1, каково бы ни было
Px Py 1
натуральное N  const , последовательность hg    Pk~s, N t , u dt du
~
k 0 s G ~s
k
86
сходится на области G из (2.2) к интегралу  f x, y dx dy при k1   ,
G

k2   , где k1  log 2 Px , k2  log 2 Py , Px , Py – число подобластей (2.6) вдоль

оси абсцисс и ординат соответственно, h , g – шаги интерполяции из (2.13).


Скорость сходимости оценивается из неравенства

2 k1 2 k 2 1
M Nmax b  a d  c 
 f x, y  dx dy  k~0 s  Pks, k~ , N t , u  dt du 
2 k1 2 k 2
,
G G ~s
k

где M Nmax из теоремы 2.1.


Методология доказательства теоремы 2.3 использует методологию
доказательства теоремы 1.3 в случае подынтегральных функций двух
переменных и с соответственным видоизменением приводится в приложении
к главе 2.
2.7. Временная сложность максимально параллельной формы
алгоритмов компьютерной кусочно-полиномиальной аппроксимации.
Ниже временная сложность максимально параллельных алгоритмов
вычисления коэффициентов (2.34) оценивается в тех же предположениях
[111], что временная сложность максимально параллельной формы схемы
(1.36), (1.37) [96, 97].
~
Коэффициенты d k , j , d m  k , j из (2.31) вычисляются по схеме (1.23).
~
Значения d k , j , d m  k , j не зависят от аппроксимируемой функции и после

однократного вычисления для всех практически используемых значений N


помещаются в память компьютера и считаются далее априори известными. В
таком случае коэффициенты Dm, k , i , j из (2.32) также являются априори

известными. Предварительному вычислению подлежат произведения


k !m  k ! из (2.20), (2.22), которые сохраняются как элементы массива.

Остаётся параллельно вычислить конечные разности mx k y mk f xi , y j , для


87
чего необходимо выразить их непосредственно через значения
аппроксимируемой функции. Имеет место следующее равенство
k mk
mx k y mk f xi , y j      1 Ck Crm  k f xi   , y j  r  ,
m   r
(2.63)
 0 r 0

где Ck 
k!
, Crm  k 
m  k ! , m  2, N , k  0, m ,
 !k   ! r !m  k  r !

i  0, N  m , j  0, N  i , N – степень полинома (2.31). Вывод соотношения


(2.64) приводится в приложении к главе 2.
С целью параллельного вычисления конечных разностей по формуле
(2.63) заранее вычисляются и сохраняются в памяти компьютера
произведения Ck Crm  k с возможностью дальнейшего использования
посредством считывания. Сохранённые произведения биномиальных
коэффициентов умножаются на значения функции, и далее по схеме
сдваивания выполняется вычисление внутренней суммы в правой части
(2.63). После чего аналогично по схеме сдваивания выполняется сложение
полученных значений сумм. С учётом того, что число слагаемых в (2.63)
m
равно k  1m  k  1 и достигает максимума при k    , описанный
2
алгоритм параллельного вычисления конечных разностей в подобластях G k~d

из (2.6), Gk~u из (2.7) имеет верхнюю границу временной сложности

 m m     m   m  
t  2      t y  log 2      tc .
  2   2     2   2  
Отсюда
 m2 
t   ~ t y  2 log 2 m tc  O log 2 m ,
 2 
где   – ближайшее к  сверху целое число,   – ближайшее к  снизу

целое число, k  0, m , m  1, N , N – степень аппроксимирующего полинома,


t y , t c – время бинарного умножения и сложения соответственно.
88
Число коэффициентов bmd , k , bmu , k из (2.20), (2.22) соответственно,

составляет арифметическую прогрессию с суммой sN 


N  1N  2 ,
2
поэтому временная сложность параллельного вычисления bmd , k , bmu , k составит

t  N  1N  2   t y . Наконец, для получения конечных коэффициентов

(2.34) необходимо вычислить произведения bmk Dm, k , i , j . После этого по схеме

сдваивания вычисляются внутренние суммы из (2.34), а затем аналогично по


схеме сдваивания складываются полученные значения сумм. Временная
сложность описанного процесса оценится выражением
t  m  j  i  1   t y  N  j  1log 2 m  j  i  1  tc , (2.64)

где i  0, N , j  0, N  i , m  j, N , N – степень полинома (2.31). При m  N ,


i  j  0 произведение N  j  1m  j  i  1 из (2.64) имеет максимум, с
учётом этого верхняя оценка временной сложности максимально
параллельного вычисления коэффициентов ak~s , i , j из (2.34) в подобластях G k~d ,

Gk~u примет вид

 
t 2N  1  t y  2 log 2 N  1  tc .
2
(2.65)

Отсюда
 
t N 2 ~ 2 log 2 N tc  Olog 2 N .
В случае параллельного вычисления по всем подобластям (2.6), (2.7) с
увеличением числа процессоров в Px Py раз, получим

 
t 2 Px Py N 2 ~ 2 log 2 N tc  O log 2 N  , (2.66)

где Px , Py из (2.2).

Отметим, что оценка (2.65) сохраняется и в случае вычислений


полинома (2.33) одновременно во всех проверочных точках, при этом число
процессоров увеличивается пропорционально количеству точек. Сказанное
справедливо и для выражения (2.66), в случае, если проверка производится
89
одновременно по всем подобластям G k~d из (2.6), Gk~u из (2.7). Отметим также,

что может иметь место параллельное построение полинома (2.33) для всего
набора значений степени N и для разных Px Py , тогда для сохранения оценок

(2.65), (2.66) необходимо увеличить число процессоров в N  Px Py раз.

Во всех случаях аппроксимирующий полином (2.33), а значит и


полиномы (2.45), (2.60), в любой конкретной точке могут быть вычислены по
параллельной схеме.
2.8. Сравнение компьютерных кусочно-полиномиальных схем
аппроксимации с известными. Ниже приводится абсолютная погрешность
построенных выше кусочно-полиномиальных методов аппроксимации
функций двух переменных, частных производных и двойных интегралов в
сравнении с абсолютной погрешностью известных методов.
Под абсолютной погрешностью аппроксимации функции в точке  x, y  ,
как и ранее, понимается величина
 f  f x, y   Pk~s,i , j x, y  , (2.67)

под абсолютной погрешностью аппроксимации частных производных в


точке  x, y  –

  k   k
    k f x, y    k Pk~s,i , j x, y  , (2.68)
x y x y
где   k  N , под абсолютной погрешностью приближённого вычисления
двойного интеграла –
Px Py 1
I   f x, y  dx dy  k~0 s  Pk~, N t, u  dt du
s
, (2.69)
G G ~s
k

где приняты обозначения из (2.62).


В рамках проведённого численного эксперимента полагалось
G  x, y  x  0,1, y  0,1. (2.70)
90
Значения (2.67) – (2.69) вычислялись в равноотстоящих проверочных точках,
расположенных с шагом h  0, 2 по направлению вдоль координатных осей.
В таблицах ниже для обозначения принадлежности приводимой
погрешности к определённому методу используются верхние индексы: P s –  
для схем на основе полинома (2.33) с коэффициентами (2.34),  P  – для схем

на основе полинома (2.16). В рамках такой символики  fP  – погрешность


s

(2.91), полученная при использовании схемы (2.33), (2.34),  P  –


погрешность (2.68), полученная при использовании схемы на базе полинома
(2.16), и т.д.
Для проведения численного эксперимента использовалась среда
Borland Delphi. Листинги программ приводятся в приложении к главе 2.
В табл. 2.5 представлена погрешность (2.67) аппроксимации тестовой
функции Франке вида [115]:
 9 x 12 9 y 12 
9 x  2 2  9 y  2 2    9 x  7 2  9 y  32
 e  9 x  4   9 y  7  
3  3  49 10 1   1 2 2
fF  e 4  e 
 e  4
4 4 2 5
при помощи сплайнов S51, 2 пятой степени с гладкими частными
производными первого порядка [115], а также при помощи кусочно-
полиномиальной схемы (2.33), (2.34).

Таблица 2.5
Абсолютная погрешность аппроксимации тестовой функции Франке
Максимум
Число Степень Число
Метод абсолютной Время
подобластей полинома коэффициентов
погрешности
2044 5 10 4 25 с 25 871
Сплайн S51, 2
8192 5 10 4 326 с 103 041
Кусочно- 16 11 10 6 0,01 с 1 248
полиномиальная
аппроксимация на 2048 12 10 15 0,015 с 186 368
основе полиномов
Ньютона
4096 12 10 17 0,032 с 372 736
91
Из табл. 2.5 видно, что схема (2.33), (2.34) аппроксимирует тестовую
функцию Франке существенно более точно и за меньшее время при меньшем
числе подобластей.
Для полноты исследований предложенный метод сравнивался со
сплайн-аппроксимацией функций [116] и по оценке остаточного члена в табл.
2.7.

Таблица 2.6
Сравнение погрешности предложенного метода и сплайн-аппроксимации
Предложенный Линейная сплайн-
Класс функции
метод интерполяция

M Nm ax 1 2 2 f 1 2 f
C 1 a, b h  l2
2 k1 2 k2 8 x 2 
8 y 2 

В табл. 2.6 приняты обозначения: C1a, b класс функций (2.1), имеющих

непрерывные частные производные первого порядка, M Nmax из теоремы 2.1,


k1 , k 2 определяются по алгоритму 2.1, h , l расстояния между узлами
сплайна вдоль оси абсцисс и ординат соответственно.
Таким образом, за счет варьируемых k1 , k 2 предложенный метод

теоретически достигает в 2k1 2k2 раз меньшего значения абсолютной


погрешности, чем сплайн-интерполяция.
В табл. 2.7 сравниваются фактические максимальные значения
погрешности (2.67) полученные по схеме (2.33), (2.34) и по методу конечных
элементов на основе полиномов Лагранжа от двух переменных [117], при
этом  max – максимальная абсолютная погрешность аппроксимации с
точностью до множителя меньшего единицы, N – степень
интерполяционного полинома.
92
Таблица 2.7
Абсолютная погрешность аппроксимации функций
Максимальный Кусочно-
Метод конечных
Линейный полиномиальная схема
Функция элементов на основе
размер на основе полинома
полинома Лагранжа
подобласти Ньютона

f  ex  e y  x  y  1 1 N  3 ;  max  104 N  12 ;  max  1013


18 N  3 ;  max  108 N  9 ;  max  1018
1 N  3 ;  max  104 N  2 ;  max  1019
f  x  y 1
2 2
18 N  3 ;  max  108 N  2 ;  max  1019

Из табл. 2.7 видно, что при соизмеримых линейных размерах


подобласти кусочно-полиномиальная схема (2.33) позволяет
аппроксимировать функции вида (2.1) с абсолютной погрешностью на 9-10
десятичных порядков меньшей чем аналогичная погрешность схемы на
основе полиномов Лагранжа [117].
В табл. 2.8 сравнивается фактическая абсолютная погрешность
аппроксимации гауссовой кривизны поверхностей по методу углового
дефицита (Angle Deficit) [118] с аналогичной погрешностью, когда для
аппроксимации частных производных использовалась схема (2.45), при этом
под гауссовой кривизной традиционно понимается величина
b11b22  b122
K ,
g11 g 22  g12
2

где b11  f xx cos n, z , b22  f yy cosn, z  , b12  f xy cosn, z ,

cosn, z   1 1  f x2  f y2 , g11  1  f x2 , g 22  1  f y2 , g12  f x f y , индексы « x »,

« y » означают дифференцирование по соответствующей переменной.


В качестве поверхностей в ходе численного эксперимента
использовались графики функций вида
1  81
f1  exp  
3  16

x  0,52   y  0,52  ,


93
1,25  cos5  4 y 
f2  ,
6  63x  1
2

f 3  exp  x  y  .

В табл. 2.8 число подобластей (2.6), (2.7) записано в виде 2k1 2k2 , где k1 , k 2 из
(2.3), в столбцах «КПА» приводятся результаты кусочно-полиномиальной
схемы (2.45), аналогично в столбцах «АУД» – результаты аппроксимации по
методу углового дефицита, h – расстояние между узлами интерполяции,  max
имеет смысл аналогичный используемому в табл. 2.7, N – степень
аппроксимирующего полинома (2.33).

Таблица 2.8
Абсолютная погрешность аппроксимации гауссовой кривизны
f1 f2 f3
h
КПА АУД КПА АУД КПА АУД
 max  100 1  max  100  max  107
1 10 10 10 0
10 4
N  10 ; 2 2
0 0
N  8; 2 2 0 0
N  10 ; 2 2
0 0

 max  10 1  max  101  max  1010


1 20 10 2 10 0 10 4
N  10 ; 2 2
1 1
N  9; 2 2 1 1
N  10 ; 2 2
1 1

 max  105  max  104  max  1012


1 40 10 2 10 1 10 5
N  10 ; 2 2
2 2
N  9; 2 2 2 2
N  10 ; 2 2
2 2

 max  106  max  107  max  1013


1 80 10 2 10 1 10 5
N  10 ; 2 2
3 3
N  10 ; 2 2 3 3
N  10 ; 2 2
3 3

 max  109  max  1011  max  1013


1 160 10 3 10 2 10 6
N  10 ; 2 2
4 4
N  10 ; 2 2 4 4
N  9; 2 24 4

 max  1010  max  1012  max  1013


1 320 10 4 10 3 10 7
N  10 ; 2 2
5 5
N  10 ; 2 2 5 5
N  8; 2 25 5

 max  1011  max  1012  max  1014


1 640 10 5 10 3 10 7
N  8; 2 26 6
N  9; 2 2 6 6
N  7; 2 26 6

 max  1012  max  1012  max  1013


1 1280 10 5 10 4 10 8
N  8; 2 27 7
N  8; 2 2 7 7
N  7; 2 27 7

Табл. 2.8 показывает, что схема (2.45) сходится фактически с большей


скоростью по сравнению с методом углового дефицита, а также позволяет
94
достигать на несколько десятичных порядков меньшей абсолютной
погрешности при соизмеримых значениях h .
В табл. 2.9 приводится погрешность (2.68) аппроксимации смешанной

частной производной
2 x y
xy
e  
, при этом  P  – погрешность (2.68) схемы
s

(2.45),   P  – погрешность (2.68) схемы аналогичной схеме (2.45) без


диагонального дробления подобласти (2.3).

Таблица 2.9
2
Абсолютная погрешность аппроксимации частной производной
xy
 
e x y

 P   P 
s
y x
0.0E+0000 -3.1438E-0015 5.8789E-0013
2.0E-0001 1.8360E-0014 6.2029E-0013
0.0E+0000 4.0E-0001 -3.6645E-0015 7.1222E-0013
6.0E-0001 -3.0013E-0015 5.1853E-0013
8.0E-0001 2.9385E-0014 7.2678E-0013
0.0E+0000 5.4572E-0013 -9.9454E-0010
2.0E-0001 6.3275E-0013 -1.2143E-0009
2.0E-0001 4.0E-0001 7.6292E-0013 -1.4820E-0009
6.0E-0001 9.6716E-0013 -1.8082E-0009
8.0E-0001 -1.2198E-0013 -2.2024E-0009
0.0E+0000 2.0357E-0011 -1.9201E-0008
2.0E-0001 2.4565E-0011 -2.3431E-0008
4.0E-0001 4.0E-0001 2.9660E-0011 -2.8597E-0008
6.0E-0001 -2.9029E-0010 -3.4900E-0008
8.0E-0001 -3.4863E-0010 -4.2599E-0008
0.0E+0000 1.8651E-0010 -9.3330E-0011
2.0E-0001 2.2499E-0010 -1.1411E-0010
6.0E-0001 4.0E-0001 -3.9215E-0011 -1.3907E-0010
6.0E-0001 -4.5837E-0011 -1.6977E-0010
8.0E-0001 -5.5305E-0011 -2.0788E-0010
0.0E+0000 9.4794E-0010 -9.1174E-0009
2.0E-0001 -2.3546E-0012 -1.1129E-0008
8.0E-0001 4.0E-0001 -1.3483E-0012 -1.3587E-0008
6.0E-0001 -1.7168E-0012 -1.6584E-0008
8.0E-0001 -2.0931E-0012 -2.0287E-0008
95
Из табл. 2.9 видно, что абсолютная погрешность (2.68) аппроксимации

смешанной частной производной


xy
e 
2 x y
 по схеме (2.45) на 2-4

десятичных порядка меньше, чем по схеме без диагонального разбиения


подобласти (2.4).
В табл. 2.10 представлена абсолютная погрешность (2.69)
приближённого вычисления двойных интегралов по области G , при этом
используются следующие обозначения: N – степень аппроксимирующего
полинома, Px Py – число подобластей (2.4), тильдой сверху отмечены

величины, относящиеся к схеме на базе полинома (2.16).

Таблица 2.10
Абсолютная погрешность приближения двойных интегралов

 IP 
~~
~
 IP 
s
Функция N N Px Py Px Py
z  sin  x  y  7 6 2048 1024 4.2501E-0017 0.0000E+0000
z  cos x  y  7 8 2048 64 6.5161E-0017 5.4210E-0020
x y
ze 6 7 8192 256 2.7105E-0017 1.3010E-0018
z  x 2e x sin  5 y  8 8 2048 4096 1.7089E-0017 3.3204E-0019

z  xy sh x 2  y 2  7 7 16384 4096 5.5678E-0005 8.1315E-0020

z  xy x 2

1 y2 1  7 7 16384 1024 2.1009E-0016 5.4210E-0020

Из табл. 2.10 видно, что схема (2.60), использующая диагональное


разбиение подобласти позволяет снизить границу абсолютной погрешности
приближения двойных интегралов по прямоугольной области на величину до
двух десятичных порядков и более с усложнением вида подынтегральной
функции, как правило, оперируя при этом существенно меньшим
количеством подобластей.
В табл. 2.10 представлены типичные результаты, иллюстрирующие,
что граница абсолютной погрешности аппроксимации функций вида (2.1) по
схеме (2.33), (2.34) составляет величины порядка 10 18 , граница погрешности
аппроксимации частных производных первого порядка – 10 13 , смешанной
96
частной производной второго порядка – 10 7 , прямой частной производной
второго порядка – 10 10 . Двойные интегралы по области (2.2) удаётся
приблизить с погрешностью (2.93), не превосходящей на практике 10 17 .
В табл. 2.11 сравнивается погрешность (2.69) схемы (2.60) со схемами
на основе различных сплайн аппроксимаций: S1 , S 2 [119], W2 [120], при этом
 max имеет смысл аналогичный использованному в табл. 2.7., в скобках
указано число треугольных подобластей, N – степень полинома (2.33).
При проведении численного эксперимента область интегрирования
имела вид (2.70), в качестве подынтегральных функций были выбраны
функции:

f4 
1
9

64  81 x  0,5   y  0,5  0,5 ,
2 2


5 10 x 2 
5 10 y 2 
5 10 x 2  5 10 y 2
f5  e 2  0,75 e 2  0,75 e 2
.

Таблица 2.11
Абсолютная погрешность приближения двойных интегралов
Интегрируемая функция
Метод
f4 f5
 max  2  102 (36)  max  5  102 (36)
S1
 max  9  105 (4356)  max  3  108 (4356)
 max  5  104 (36)  max  4  102 (36)
S2
 max  1  108 (4356)  max  6  1010 (4356)
 max  1  103 (57)  max  1  101 (57)
W2
 max  3  109 (8577)  max  2  109 (8577)
Предложенная  max  6  106 (2) N  9  max  2  104 (8) N  9
кусочно-
полиномиальная  max  2  1011 (32) N  9  max  1  1010 (128) N  9
схема  max  3  1017 (2048) N  8  max  3  1017 (2048) N  9

Табл. 2.11 демонстрирует, что схема (2.60) позволяет на практике


приближённо вычислять двойные интегралы по прямоугольной области с
97
абсолютной погрешностью на 4-13 десятичных порядков меньшей, чем
аналогичная погрешность схем на основе сплайн-аппроксимации.
Детальное описание численного эксперимента проведённого для
широкого класса функций приводится в приложении к главе 2.
2.9. Выводы
1. Предложена кусочно-полиномиальная схема аппроксимации
действительных функций двух действительных переменных, отличающаяся
от известных по построению на основе интерполяционного полинома
Ньютона от двух действительных переменных с программно варьируемыми
степенью и числом подобластей, что позволяет минимизировать временную
сложность для произвольно заданной границы погрешности вычисления
функции. Схема инвариантна относительно вида функции, числа
подобластей, обладает естественным параллелизмом. Доказана равномерная
сходимость и дана оценка скорости сходимости схемы, имеющая вид
произведения геометрических прогрессий по каждой переменной.
2. На основе предложенной схемы аппроксимации функции двух
действительных переменных построены методы аппроксимации частных
производных этих функций и приближения двойных интегралов по
прямоугольной области, позволяющие снизить границу абсолютной
погрешности приближения по сравнению с известными методами. Для
рассматриваемых интегралов доказана сходимость сконструированных схем
со скоростью произведения геометрических прогрессий по каждой
переменной.
3. Разработан программный комплекс, реализующий предложенные
методы приближения функций, частных производных и двойных интегралов.
Представлены результаты численного эксперимента, проведённого для
широкого класса функций, включающего тестовые наборы. Согласно
эксперименту имеет место повышение точности предложенного
варьируемого кусочно-полиномиального метода по сравнению с известными
методами аппроксимации функций двух действительных переменных на
98
несколько десятичных порядков. Аналогичное повышение точности имеет
место при вычислении частных производных и двойных интегралов.
4. На модели неветвящихся параллельных программ представлен
параллелизм синтезированных алгоритмов вычисления функций двух
действительных переменных, частных производных и двойных интегралов,
получены логарифмические оценки их временной сложности.
99

ГЛАВА 3. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ЭЛЕКТРОН-


ФОНОННОГО РАССЕЯНИЯ В GaAs НАНОПРОВОЛОКАХ

В главе проводится компьютерное моделирование электронной


структуры нанопроволоки из арсенида галлия ( GaAs ), а также
моделирование рассеяния электронов на акустических и полярных
оптических фононах (АПОФ). Под нанопроволокой традиционно понимается
объект, в котором электроны испытывают квантование в двух направлениях.
Моделирование электронной структуры состоит в приближённом
вычислении волновых функций электронов, уровней энергии размерного
квантования, а также потенциалала Хартри путём приближённого решения
системы самосогласованных уравнений Шрёдингера и Пуассона [60] с
однородными граничными условиями в рамках теории функционала
плотности [5] (DFT – density functional theory – теория функционала
плотности) и аппроксимации локальной плотности [49] (LDA – local density
approximation – аппроксимация локальной плотности).
Система уравнений Шрёдингера и Пуассона суть нелинейная система
двух уравнений в частных производных второго порядка. В рамках
описываемого подхода для приближённого решения такой системы
используется метод Галёркина [62, 70]. В процессе приближённого решения
задача аппроксимации собственных значений и собственных векторов
оператора полной энергии в уравнении Шрёдингера сводится к полной
проблеме собственных значений симметрической матрицы. Приближённое
решение уравнения Пуассона сводится к численному решению системы
линейных алгебраических уравнений [70]. При этом коэффициенты матриц
системы представляют собой двойные интегралы по области, совпадающей с
поперечным сечением нанопроволоки.
Приближённое решение полной проблемы собственных значений
находится при помощи QR -итераций [63] с устойчивой модификацией
ортогонализации по Граму-Шмидту [63]. Для решения системы линейных
100
алгебраических уравнений используется метод Гаусса с выбором ведущего
элемента по столбцу [68].
Сходимость самосогласованных итераций определяется малостью
невязок волновой функции, потенциала Хартри, уровней энергии и
электронной плотности [60, 69].
Главным отличием предлагаемого численного подхода от излагаемого
в [74 – 76] является применение описанных в гл. 2 кусочно-полиномиальных
методов для вычисления двойных интегралов, использование которых
позволяет рассчитывать коэффициенты матриц с меньшей абсолютной
погрешностью. Это в свою очередь повлечёт ускорение сходимости QR -
итераций и уточнение полученных аппроксимаций собственных значений и
векторов [63].
Полученные в ходе итеративного приближения волновые функции и
уровни энергии используются в рамках модели [4, 17] для вычисления
скорости рассеяния электронов каждой из рассматриваемых подзон на
АПОФ, при этом учитывается столкновительное уширение подзон
(неопределённость спектра энергии [4]) и взаимное влияние механизмов
рассеяния [4]. Для вычисления столкновительного уширения служит
нелинейное алгебраическое уравнение [4], которое приближённо решается
при помощи схемы на основе сортировки, изложенной в [27, 28].
Представленный в настоящей главе вычислительный подход в рамках
принятых физических моделей позволяет уточнено рассчитать электронную
структуру нанопроволоки, а также интенсивности электрон-фононного
рассеяния, что влечёт, в конечном счёте, уточнение на этапе моделирования
оценок времени отклика устройства, его температурных и
электротехнических характеристик.
3.1. Самосогласованный расчёт электронной структуры
нелегированной GaAs нанопроволоки. Изложенные в гл. 2 кусочно-
полиномиальные методы приближённого вычисления двойных интегралов
используются в рамках излагаемого подхода для расчёта характеристик
101
квантовых объектов. Моделирование микрообъекта в одномерной
бесконечно глубокой потенциальной яме приводится в [31]. В данной главе
представлено ab inito моделирование электронной структуры
нелегированной GaAs нанопроволоки прямоугольного поперечного сечения
(рис. 2а) [105] на модели двумерной квантовой ямы.
Поведение электронов описывает система (18) [60], в которой
уравнение Шрёдингера записано в форме БенДаниэла-Дюка [55] в
предположении изотропии эффективной массы [32] по направлениям абсцисс
и ординат, что корректно для GaAs [121].
Тип чисел с наибольшей длиной мантиссы в C++ – long double – имеет
17-18 значащих цифр [91], поэтому при операциях с числами, порядки
1
которых разнятся более чем на величину 1017  1018 , например и ,

происходит существенная потеря точности. С целью предотвращения
вычислительных трудностей расчёты принято проводить в эффективных
единицах [122], в которых длина измеряется в эффективных боровских
4 0 2
радиусах – a 
*
, энергия – в эффективных ридбергах –
m*e2
e2 Ry *
Ry 
*
, множитель перехода для температуры – T0  , для
80 a* kB

концентрации – n0*  a*  3


, для времени – t0 

Ry *
, для скорости –

a*Ry * m*
v0  , для плотности вещества – 0  , при этом  –
 a 
* 3

диэлектрическая проницаемость GaAs ,  0 – диэлектрическая постоянная, e

– заряд электрона, m* – эффективная масса электрона в GaAs . В


эффективных единицах выполняются равенства
  e  m*  1 .
102
При вычислении множителей перехода от единиц СИ к эффективным
единицам значения констант бралось из данных, рекомендованных CODATA
в 2010 году для международного использования (2010 CODATA
recommended values) [123], параметры GaAs заимствовались из [121].
В эффективных единицах уравнения системы (18) перепишутся в виде
 1 
      Vxc  n  x, y   En n  x, y ,
 2  (3.1)
 2  x, y   8    x, y ,
 e

с граничными условиями:
 n  x, y  G  0,
 (3.2)
  x, y  G  0,

и областью рассмотрения:

 
G   x, y  x 0, Lx , y  0, Ly , (3.3)

где Lx , Ly – линейные размеры нанопроволоки.

Электронная плотность e   x, y  из (3.1) определяется соотношением


(14), где населённость подзон ni имеет вид (15). Интеграл (15) может быть
вычислен только приближённо [57], поэтому зачастую c целью упрощения
вычислений переходят к выражению электронной плотности в терминах
эффективной плотности состояний [103]. Такой переход допустим, так как
рассматривается собственный полупроводник [104].
В эффективных единицах эффективная плотность состояний будет
иметь вид
~
T  E E 
ni  exp   i ~ F  , (3.4)
2  T 
~
где E F – уровень Ферми, T – температура в эффективных единицах.
Уровень Ферми в эВ, отсчитываемый от середины запрещённой зоны,
определяется соотношением [104]:
103

1 3 m*
EF  Eg  k BT ln * ,
2 4 mp

где m* , m *p – эффективная масса электрона и дырки соответственно, Eg –

ширина запрещённой зоны.


Температурная зависимость ширины запрещённой зоны в эВ
аппроксимируется соотношением [124]:
 1

    2T   2T   6 
4 n 6
Eg T   Eg 0  1   an       1 , (3.5)
2  n  2       
 
 

где a2   
 2
1 
 
, a3    1  42  34 , a4    2 1  2 ,   4,76 104 эВ K ,

  252 K ,   0,44 , Eg 0  1,52 эВ , T – температура в СИ, Eg в эВ.

Выбор аппроксимации (3.5) обусловлен большей точностью [124, 125]


в широком температурном интервале по сравнению с часто используемыми
формулами Вина (Vin~a ) [126] и Варшни (Varshni ) [127].
Для обменно-корреляционного потенциала Vxc в правой части
уравнения Шрёдингера из (3.1) используется выражение Хедина-Лундквиста
[61]:
2 Ry *   1 
VxcHL  x, y    1  0.7734 r ln 1    , (3.6)
21r   r 

  
где   4 9   , r  1 21 4 3 a* e x, y 
13 3
1 3
,  e из (14).
Равенство (3.6) в эффективных единицах имеет вид:
1 2 
VxcHL x, y     2  u x, y   0,7734 ln 1  u x, y  ,
~
(3.7)
7  3 

где ux, y   73 36 e x, y  .


Кроме того, в правой части уравнения Шрёдингера использовалась
аппроксимация обменно-корреляционного взаимодействия по Такагаки-
Плугу [128]:
104

x, y   
0.0784e 2 3 e x, y  


ln 1  18,38a* 3 e x, y   ,
VxcTP
0 1  0.0338 a* 3 e x, y  
 
которая в эффективных единицах примет вид
VxcTP ~
~
 
y   0.0784  8 3 e x, y   0.0338 ln 1  18,383 e x, y  .
x, ~  (3.8)
С использованием равенств (3.4) – (3.8) приближённые решения задачи
(3.1) – (3.3) численно находились по методу Галёркина [62, 70] в виде (28),
(29). В качестве базисных и весовых функций использовались функции [129]

     
sin   N terms  i  x  sin   N terms  i 
2
i  y, (3.9)
 
Lx Ly  Lx   Ly 
где N terms – число членов в отрезках рядов (28), (29).
В ходе приближённого решения системы (3.1) методом Галёркина
аппроксимации (28), (29) подставляются в уравнения системы (3.1), что
влечёт
 1 N terms N terms

     Vxc   pii  x, y   En  pii  x, y ,


 2 i 1 i 1
 N terms (3.10)
 2
  vii x, y   8 e x, y .
 i 1

Умножив уравнения системы (3.10) на функции (3.9) и проинтегрировав по


области (3.3), получим системы
  1 N
 terms 
 i  x, y        Vxc   p j j  x, y  dx dy 

G  2  j 1 


N terms
   i  x, y En  p j j  x, y  dx dy, (3.11)
 G j 1
 N terms
 i  x, y  2  v j j  x, y  dx dy  8  i  x, y  e  x, y  dx dy,
 G j 1 G
~

где i  0, Nterms  1. С учётом того, что суммирование и интегрирование –


независимые операции, в системе (3.11) раскрываются скобки и приводятся
подобные при искомых коэффициентах p j , v j , что влечёт [70]
105
 N terms  1 
     i  x, y  j  x, y     Vxc i  x, y  j  x, y  dx dy p j 
 j 1 G  2 


N terms
  E n   i  x, y  j  x, y dx dy p j , (3.12)
 j 1 G ~

 N terms N terms
  i  x, y  j  x, y  dx dy v j  8   e  x, y i  x, y  dx dy,
 j 1 G j 1 G

где i  0, Nterms  1. Системы вида (3.12) записываются в матричной форме

Cp  Ip,
 (3.13)
Av  f,
в обозначениях:
 1 
Cij     i  x, y  j  x, y     Vxc i  x, y  j  x, y  dx dy , (3.14)
G  
2

Aij   i  x, y  j  x, y  dx dy, (3.15)


G

f i  8   e  x, y i  x, y  dx dy, (3.16)


G

где i  0, Nterms  1, j  0, Nterms  1. Из (3.14), (3.15) видно, что


1
2 ~
~

Cij   Aij   ~  Vxc i ~
x, ~ 
y  j ~ y  d~
x, ~ x d~
y. (3.17)
G

Коэффициенты (3.15) вычисляются аналитически непосредственным


интегрированием с использованием таблицы интегралов из [109],
производимые при этом математические преобразования описываются в
приложении к главе 3.
С целью снижения погрешности приближённого вычисления
интегралов непосредственно ниже интеграл в правой части (3.16)
представляется в виде суммы интегралов, в каждый из которых входит
плотность электронов населяющих только одну подзону. Подставив в (3.16)
плотность электронов из (14), получим
N sb 1
fi  8   nk  k x, y  i x, y  dx dy ,
2
(3.18)
~
G k 0
106
где ni из (3.4), N sb – априори заданное число моделируемых подзон,

i  0, Nterms  1. Так как суммирование и интегрирование независимые

операции, и так как функции  i  x, y  и i  x, y  непрерывны во всей


2

области (3.3) по обеим переменным, то выражение (3.17) приводится к виду


N sb 1
fi  8  ~ nk  k x, y  i x, y dx dy ,
2
(3.19)
k 0 G

где k  0, N sb  1, i  0, Nterms  1.
При вычислении коэффициентов f i в виде (3.19) подынтегральная
функция представляет собой только одну k -ю моду, соответствующую k -й
подзоне, а не суперпозицию мод в виде правой части (14), что составляет
суть используемого упрощения.
Интегралы в правых частях равенств (3.17), (3.19) вычисляются при
помощи кусочно-полиномиальной схемы (2.74), (2.32).
Из выражений (3.14), (3.16) видно, что Aij  Aji , Cij  C ji ,

i  0, Nterms  1, j  0, Nterms  1, следовательно, матрицы A , C из (3.13)


являются симметрическими, поэтому собственные числа En проблемы
Cp  Ip из (3.13) будут действительными, а собственные вектора p будут
иметь действительные компоненты pi из (28) [68]. Для вычисления En и p
применялись QR -итерации [63] с устойчивой ортогонализацией Грама-
Шмидта [63]. Кратко QR -алгоритм представлен следующими шагами:

C  C0   Q0 R 0  ,
 1 0  0  1 1 1
C  R Q , C  Q R ,
 2  1 1 2  2  2 
C  R Q , C  Q R , (3.20)
...

Cm   R m 1Qm 1 , Cm   Qm R m  ,

где m – номер текущего шага, R m  – правая треугольная матрица, Qm  –
ортогональная матрица. Итерации (3.20) прекращаются, как только
107
наибольший по модулю поддиагональный элемент матрицы C m 
удовлетворяет условию:

max Cijm    QR , (3.21)


0  i  N terms
0  j i

где  QR задаётся априори.

Если на m -м шаге алгоритма (3.20) неравенство (3.21) выполняется, то


на главной диагонали матрицы Cm  в порядке убывания по номеру строки
располагаются приближения собственных значений En уравнения

Шрёдингера из (3.1), при этом столбцы матрицы Q m  являются


приближениями p из (28). С учётом порядка следования приближений
собственных значений выполняется:
EN terms i 1  Ciim  ,

где Ciim  – элемент матрицы Cm  , i  0, Nterms  1.

Второе равенство из (3.13) с коэффициентами (3.14), (3.15)


представляет собой систему линейных алгебраических уравнений
относительно v i из (29), которая приближённо решается методом Гаусса с
выбором ведущего элемента по столбцу [68].
Сходимость самосогласованных итераций (рис. 1.) определялась
условиями (25) – (27), а также условием
max
*
e ~x , ~y    , (3.22)
G

где
N sb 1 N sb 1
e ~ y   m 
~x , ~y    nk  km 1 ~ y ,
2 2
x, ~ nk  k x, ~ (3.23)
k 0 k 0

i  0, Nterms  1, m – номер текущей QR -итерации, G * – система проверочных


точек, расположенных с равным априори заданным шагом вдоль
координатных осей.
108
Полученные приближённые собственные значения энергии En и
аппроксимации (28) волновой функции используются ниже для расчета
скорости рассеяния электронов на фононах в рассматриваемой
нанопроволоке.
3.2. Расчёт скорости электрон-фононного рассеяния в
нелегированной GaAs нанопроволоке. Кратко теоретические основы
используемого метода изложены в [17, 23]. Расчёт скорости электрон-
фононного рассеяния для транзисторной структуры выполнялся в [4, 15], для
проволоки, помещённой в поперченное электрическое поле – в статье [130], в
работе [4] приводились выражения для скорости рассеяния электронов на
АПОФ, учитывающие произвольное число энергетических подзон
размерного квантования. В работе [14] принималась в рассмотрение
непараболичность закона дисперсии, однако в [14] энергетические уровни
рассчитывались не самосогласованным методом, что согласно [4]
значительно изменяет поведение кривой скорости рассеяния.
Отметим, что в работах [14, 15, 17, 68] приводились результаты
вычислений скорости электрон-фононного рассеяния в предположении
электрического квантового предела, когда считается, что все электроны
находятся в основном квантовом состоянии.
С использованием математических выражений скоростей рассеяния из
[4] проводится расчёт скорости рассеяния электронов основного и первых
двух возбужденных состояний на АПОФ в предположении установившегося
температурного равновесия. В ходе моделирования двойные интегралы по
области, совпадающей с поперечным сечением нанопроволоки,
приближаются при помощи компьютерного кусочно-полиномиального
метода вычисления двойных интегралов, изложенного в гл. 2.
Аппроксимации уровней энергии размерного квантования и волновых
функций получены в процессе самосогласованных итераций (рис. 1) [60, 70].
109
Скорость рассеяния электронов с начальным квантовым состоянием
i, j в состояние , k  на акустических фононах [4] в единицах системы СИ
представлена соотношениями

E, ij   2 2 
2
Bac k BT 2 m *
WijA
 v 
N sb 1 N sb 1
(3.24)
   
Dijk E , Eijk , ij   ij x, y   k x, y  2 dx dy,
2

 1 k 1 G

Dijk 
E , Eijk , ij   E  Eijk  2ij  2 4 E  Eijk  2
 ij2
, (3.25)
4E   Eijk
2
  ij2

где k B – постоянная Больцмана, m* – эффективная масса электрона,  –

плотность вещества GaAs , v – скорость звука в GaAs , Bac – акустический


деформационный потенциал, T – температура кристалла GaAs , E –
кинетическая энергия электрона,  ij x, y  ,  k  x, y  – волновые функции,

соответствующие уровням энергии Eij и E k , ij – величина

столкновительного уширения уровня i, j, обусловленного всеми


рассматриваемыми механизмами рассеяния, N sb – число рассматриваемых

подзон энергии, Eijk  Ek  Eij ,  x  – единичная ступенчатая функция,

0, x  0,
 x    (3.26)
1, x  0.
Порядковый номер n собственного значения En из (3.1) и
соответствующего вектора p из (28) связан с квантовыми числами i, j,
, k  соотношением
n  i  j  2    k  2,

где i, j, , k  1, Nsb  1, i, j, , k  – квантовые числа соответствующие зонам


размерного квантования.
110
Скорость рассеяния электронов с начальным квантовым состоянием
i, j в состояние , k  на полярных оптических фононах в СИ определяется
равенствами вида [4]





 
W fe ij E , ij  
e  PO 2m  1 1 
2 2 *
   nBE  1 
OP

4Lx Ly    
N sb 1 N sb 1 

   Dij E , Eij  EPO , ij 
k k
 
 (3.27)
 1 k 1 
2 
 p   r 
    x  sin  y dxdy 
2
   
2
x , y x , y sin
N sb 1 N sb 1 ij k   
 Lx   Ly 
   ,
G

p 1 r 1  p   r 
2 2

q ef       
L  
 x   y
L






 
W fa ij E , ij  
e  PO 2m  1 1 
2 2 *
OP
    
4Lx Ly    
N sb 1 N sb 1 

 nBE    Dij E , Eij  EPO , ij 
k k
 
 (3.28)
 1 k 1 
2 
 p   r 
    x  sin  y dxdy 
2
N sb 1 N sb 1 
  
2
x , y x , y sin
ij  k  
 Lx   Ly 
   ,
G

p 1 r 1  p   r 
2 2

q f  
a
    
L  
 x   y
L
111





 
Wbe ij E , ij 
e  PO 2m  1 1 
2 2 *
   nBE  1 
OP

4Lx Ly    
N sb 1 N sb 1 

   Dij E , Eij  EPO , ij 
k k
 
 (3.29)
 1 k 1 
2 
 p   r 
    x  sin  y dxdy 
2
N sb 1 N sb 1 
  
2
x , y x , y sin
ij k  
 Lx   Ly 
   ,
G

p 1 r 1  p   r 
2 2

qb       
  L 
e

 x   y
L 






 
Wba ij E , ij  
e  PO 2m  1 1 
2 2 *
   nBE 
OP

4Lx Ly    
N sb 1 N sb 1 

   Dij E , Eij  EPO , ij 
k k
 
 (3.30)
 1 k 1 
2 
 p   r 
    x  sin  y dxdy 
2
   
2
x , y x , y sin
N sb 1 N sb 1 ij  k  
 Lx   Ly 
   ,
G

p 1 r 1  p   r 
2 2

qb  
a
    
L  
 x   y
L

qef 
2m*E


2m* E  Eijk  EPO
,
 (3.31)
 

q af 
2m*E


2m* E  Eijk  EPO
,
 (3.32)
 

qbe 
2m*E


2m* E  Eijk  EPO
,
 (3.33)
 
112

qba 
2m*E


2m* E  Eijk  EPO
,
 (3.34)
 
где верхний индекс « e » соответствует испусканию фонона, верхний индекс
« a » – поглощению, нижний индекс « f » соответствует рассеянию вперёд,

нижний индекс « b » – рассеянию назад, E , ij , m* , Eijk из (3.24), e – заряд

электрона,  ,   – статическая и оптическая диэлектрическая проницаемость


GaAs соответственно,  PO – частота полярного оптического фонона,
EPO   PO , Lx , Ly – линейные размеры нанопроволоки вдоль оси абсцисс и

ординат (рис. 2а).


Скорости рассеяния (3.24), (3.27) – (3.30) входят в нелинейное
относительно ij уравнение [4]:

  
ij   WijA  W fe
PO
ij
 
 Wbe
PO
ij
 
 W fa
PO
ij
 
 Wba
PO
ij
 0 , (3.35)

которое в обозначениях

  
F  ij , E   ij   WijA  W fe
PO
ij
 
 Wbe
PO
ij
 
 W fa
PO
ij
 
 Wba ij
PO
 (3.36)

примет вид
F  ij , E   0 . (3.37)

Уравнение (3.35) необходимо решать для каждого моделируемого


уровня энергии i, j, а также для каждого значения кинетической энергии E .
Найденные при этом значения ij , далее подставляются в равенства (3.24),

(3.27) – (3.30) для вычисления соответствующих скоростей рассеяния.


Отметим, что двойные интегралы в выражениях (3.24), (3.27) – (3.30)
не зависят от столкновительного уширения ij и кинетической энергии E ,

поэтому для сокращения времени вычисления левой части (3.37) после


получения аппроксимаций (28), (29) интегралы могут быть однократно
вычислены и помещены в память компьютера для дальнейшего считывания
при необходимости.
113
Для решения уравнения (3.37) применяется схема решения
трансцендентных уравнений на основе сортировки [27, 28]. Суть схемы в
терминах рассматриваемой предметной области кратко состоит в
следующем. Пусть фиксируется квантовое состояние i, j, пусть также
задана область поиска нулей левой части (3.35) вида


   


   ij , E  ij  ij0  , ij N   , E  Emin , Emax  , (3.38)

где границы ij0  , ij N  , Emin , Emax задаются априори, исходя из данных

конкретной физической задачи, N  – априори заданное число подынтервалов


вдоль оси ij . Область (3.38) разбивается на подобласти вида
N  1
   , (3.39)
 0

где
 ij N    ij0  

   

   ij , E  ij  ij , ij  H  , E  Emin , Emax , H  

 , (3.40)

 N  

Шаги схемы инвариантны относительно номера  подобласти (3.40),
поэтому дальнейшие рассуждения приводятся для произвольной подобласти
 из (3.40).

В подобласти (3.40) задаётся система прямых вида


E k   Emin  khE , (3.41)

где k  0, NE  1 , hE  Emax  Emin  N E , N E  N – задаётся априори, исходя


из ограничений временной сложности и производительности
вычислительной системы, при этом повышение N E приводит к более
точному моделированию зависимости скорости рассеяния (3.24), (3.27) –
(3.30) от кинетической энергии электрона.
На каждой прямой E k  из (3.41) задаётся система узлов вида
ij m
 ij   m h  , (3.42)
114
где h  H  n , H  из (3.40), n  N – априори заданное число узлов (3.42)

 
на подынтервале ij  , ij   H  из (3.40). Значения модуля правой части

 
(3.37) в узлах ij m , E k  заносятся в массив b так, что выполняется


bm  F ij m , E k  ,  (3.43)

где m  0, n  1, n из (3.42).
Массив b из (3.43) подаётся на вход сортировки. Используемая
сортировка должна сохранять порядок равных элементов, и взаимно
однозначно сопоставлять индексы входных и выходных элементов. В
описываемых исследованиях использовалась сортировка подсчётом в
реализации [27, 28]. На выходе сортировки сформирован массив b SORT . Связь
индексов отсортированного массива b SORT и несортированного массива b
выражается равенством вида
ek   m ,

где k – позиция элемента bm  в массиве b SORT , m – позиция элемента в


исходном массиве b , e – массив индексов.
В последовательности элементов b SORT идентифицируются локальные
минимумы при помощи условия [27, 28]
ek   ek     0 h  , (3.44)

где k  0, nГ  1,   0, k  1 , nГ из (3.42) ,  0 – радиус окрестности текущего


узла. Значение  0 задаётся априори так, чтобы не превышать половины числа
узлов, заключённых между двумя ближайшими друг к другу соседними
минимумами.
В массиве дискретных элементов (3.43) рассмотренные экстремумы
можно выделить путём последовательного или другого просмотра.
Предпочтительный выбор описанной схемы обусловлен тем, что в ней по
стандартной подпрограмме локализуются одновременно все экстремумы,
причём при произвольном задании значения радиуса окрестности
115
локализации  0 . Все локальные экстремумы идентифицируются по значению
и по индексу их местоположения. Все локализации экстремумов взаимно
независимы и могут быть выполнены по максимально параллельным
алгоритмам [27, 28, 131].
Отметим, что в математике под локальным минимумом числовой
последовательности понимается элемент меньший всех соседних в некоторой
своей  – окрестности. В рамках излагаемого подхода, в отличие от
математического определения, под локальным минимумом числовой
последовательности понимается элемент не больший других в своей  –
окрестности. Сортировка сохраняет порядок равных элементов входного
массива, поэтому в массиве равных элементов по условию локализации
максимума будет идентифицирован первый элемент, а по условию
локализации минимума – последний. При работе описанного алгоритма
локализации не происходит накопления погрешности [27, 28, 131].
После идентификации минимума последовательности (3.43)
осуществляется спуск [132] вдоль оси ij до выполнения условия вида

 
F ij , E k    0D ,
~
(3.45)
~
где ij – текущее приближённое значение искомого столкновительного

уширения ij ,  0D задаётся априори.

После того, как для прямой E k  из (3.41) вычислено значение ij ,


~

удовлетворяющее неравенству (3.45), шаги алгоритма повторяются для


следующей прямой E k 1 , и так для всех прямых E k  .
~
Если в области  из (3.40) не удалось идентифицировать ij ,

доставляющее модулю правой части (3.37) значение, удовлетворяющее


соотношению (3.45), то описанный алгоритм выполняется в области  1 из

(3.41).
116
После обработки прямой E  N  , N E из (3.41), работа схемы завершается.
E

~
Идентифицированные при этом значения ij считаются искомыми

приближениями в принятых условиях моделирования и заносятся в память


компьютера для последующего считывания при необходимости. Для
~
вычисления скорости рассеяния электронов на АПОФ ij используется в

выражениях (3.24), (3.27) – (3.30) в качестве ij .

При помощи предложенного в гл.2 компьютерного кусочно-


полиномиального метода приближённого вычисления двойных интегралов
уточнено рассчитывается электронная структура, на базе которой с
использованием представленной непосредственно выше схемы на основе
сортировки с априори заданной точностью вычисляется столкновительное
уширение. Снижение абсолютной погрешности аппроксимации
столкновительного уширения, а также использование кусочно-
полиномиальных методов приближения двойных интегралов для
уточнённого приближённого вычисления интегралов в правой части равенств
(3.24), (3.27) – (3.30) позволяет получить уточнённое значение пиков кривых
зависимости интенсивности рассеяния от кинетической энергии электрона.
3.3. Численный эксперимент по моделированию электронной
структуры GaAs нанопроволоки. Для проведения численного
эксперимента используется ПК на базе процессора Intel Core 2 Quad Q6600 с
8 Gb DDR2 ОЗУ под управлением операционной среды Windows 7 Ultimate
64 bit, а также компилятор C++ Builder 2009.
Верхние границы невязок в правых частях неравенств (25) – (27), (3.22)
выбираются равными:
 QR          E  1018 .
Выбор числовых значений обусловлен необходимостью уточнения
результатов моделирования на основе предложенных схем, данные значения
устанавливаются меньшими, чем аналогичные границы в исследованиях [60,
70, 133], выбранных ниже для сравнения.
117
Условия (2.10), (2.11) принимаются в виде
10  N  12,

6  k x  10,
7  k  10.
 y

Данные границы вариации N , kx , ky выбираются в соответствии [114], как


позволяющие добиться гарантированного снижения абсолютной
погрешности приближённого вычисления используемых для моделирования
функций двух переменных и двойных интегралов.
Линейные размеры моделируемой нанопроволоки для удобства
сравнения результатов заимствуются из [129]: Lx  10 нм , Ly  10 нм (рис.

2а), характеристики GaAs – из [55]. Расчёты проводятся в эффективных


единицах.
При моделировании учитываются зоны размерного квантования с
квантовыми числами 1,1 , 1, 2, 2,1, 2, 2, что соответствует [129] N sb  3
из (3.18). Для аппроксимаций (28), (29) используется набор из N terms  10
[129] базисных функций (3.9).
Исходный код основного модуля программы, содержащего полное
описание использованных процедур и функций, приводится в приложении к
главе 3.
Ниже в табл. 3.1 приводятся приближённые значения коэффициентов
~
Aij матрицы A из (31), которые вычислены при помощи кусочно-

полиномиальной схемы (2.74), (2.32) согласно равенству (3.15) в сравнении с


их аналитическими значениями Aij (см. приложение к главе 3). Также в табл.

3.1 приводится невязка вида


 ~
Aij  Aij
 , Aij  0,
A   Aij (3.46)
 ~
 Aij  Aij , Aij  0,

где i  0, Nterms  1, j  0, i , при этом учтено, что матрица A симметрическая.


118
Таблица 3.1
Сравнение приближённых и точных значений коэффициентов матрицы A
i, j Точное значение Aij ~ Абсолютная
Приближённое значение Aij
погрешность
A
0, 0 2.15829676335503224200e+03 2.15829676335503224800e+03 2.5720e-18
1, 0; -7.85071503595755600400e+02 -7.85071503595755601600e+02 1.4849e-18
0, 1
1, 1 1.74822037831757611600e+03 1.74822037831757614400e+03 1.5940e-17
2, 0; 0.00000000000000000000e+00 2.64951905901145146000e-18 2.6495e-18
0, 2
2, 1; -6.27622561213714096600e+02 -6.27622561213714091400e+02 8.4909e-18
1, 2
2, 2 1.38130992854722063500e+03 1.38130992854722063700e+03 1.3664e-18
3, 0; -6.59154353126543011400e+01 -6.59154353126543011300e+01 1.0527e-19
0, 3
3, 1; 0.00000000000000000000e+00 7.78592685116152871600e-18 7.7859e-18
1, 3
3, 2; -4.87668756617141581500e+02 -4.87668756617141583400e+02 3.7564e-18
2, 3
3, 3 1.05756541404396579800e+03 1.05756541404396580400e+03 5.4589e-18
4, 0; 0.00000000000000000000e+00 5.25160427297666210200e-19 5.2516e-18
0, 4
4, 1; -5.03841444974342705400e+01 -5.03841444974342706000e+01 1.3083e-18
1, 4
4, 2; 0.00000000000000000000e+00 -2.63427246596087405400e-18 2.6342e-18
2, 4
4, 3; -3.65210514848266162200e+02 -3.65210514848266162300e+02 3.7999e-19
3, 4
4, 4 7.76986834807811607100e+02 7.76986834807811604000e+02 4.0009e-18
5, 0; -1.55506618819241575800e+01 -1.55506618819241576200e+01 2.8446e-18
0, 5
5, 1; 0.00000000000000000000e+00 1.45520260338288798200e-18 1.4552e-18
1, 5
5, 2; -3.68063003122465268000e+01 -3.68063003122465269800e+01 4.8074e-18
2, 5
5, 3; 0.00000000000000000000e+00 -9.04631187667592762100e-19 9.0463e-19
3, 5
5, 4; -2.60248680255342306500e+02 -2.60248680255342305500e+02 3.7328e-18
4, 5
5,5 5.39574190838758060500e+02 5.39574190838758056100e+02 8.1275e-18
6, 0; 0.00000000000000000000e+00 -4.93820208249257097600e-19 4.9382e-19
0, 6
6, 1; -1.07327171710510872200e+01 -1.07327171710510872500e+01 2.9901e-18
1, 6
6, 2; 0.00000000000000000000e+00 2.32934060494932593200e-18 2.3293e-18
2, 6
6, 3; -2.51895018913812800400e+01 -2.51895018913812802200e+01 7.0933e-18
3, 6
119
6, 4; 0.00000000000000000000e+00 -2.28402434227122086400e-18 2.2840e-18
4, 6
6, 5; -1.72785132021379528600e+02 -1.72785132021379528100e+02 2.6505e-18
5, 6
6, 6 3.45327482136805158700e+02 3.45327482136805158100e+02 1.6879e-18
7, 0; -3.80269174144383759000e+00 -3.80269174144383759700e+00 1.6537e-18
0, 7
7, 1; 0.00000000000000000000e+00 1.58352809489191448400e-18 1.5835e-18
1, 7
7, 2; -6.66236621453676304600e+00 -6.66236621453676303800e+00 1.3670e-18
2, 7
7, 3; 0.00000000000000000000e+00 4.73279659278340314400e-19 4.7327e-19
3, 7
7, 4; -1.55506618819241575800e+01 -1.55506618819241575100e+01 3.9044e-18
4, 7
7, 5; 0.00000000000000000000e+00 -2.19010956424440031400e-18 2.1901e-18
5, 7
7, 6; -1.02824784688641368450e+02 -1.02824784688641368200e+02 2.3619e-18
6, 7
7, 7 1.94246708701952901800e+02 1.94246708701952901100e+02 3.2864e-18
8, 0; 0.00000000000000000000e+00 -1.49141326187800932200e-18 1.4914e-18
0, 8
8, 1; -1.91203112024333123100e+00 -1.91203112024333121500e+00 8.5623e-18
1, 8
8, 2; 0.00000000000000000000e+00 4.82597021698137618200e-19 4.8259e-19
2, 8
8, 3; -3.38658858761903876100e+00 -3.38658858761903876600e+00 1.5367e-18
3, 8
8, 4; 0.00000000000000000000e+00 -1.91196512018976944000e-18 1.9119e-18
4, 8
8, 5; -7.93401116424701917100e+00 -7.93401116424701916800e+00 3.2797e-19
5, 8
8, 6; 0.00000000000000000000e+00 -5.61159327555973974600e-20 5.6115e-20
6, 8
8, 7; -5.03841444974342705400e+01 -5.03841444974342703200e+01 4.4070e-18
7, 8
8, 8 8.63318705342012896600e+01 8.63318705342012895400e+01 1.5271e-18
9, 0; -3.56994074424337868900e-01 -3.56994074424337870300e-01 3.7963e-18
0, 9
9, 1; 0.00000000000000000000e+00 -2.21022659674168994700e-19 2.2102e-19
1, 9
9, 2; -5.64196349457565807600e-01 -5.64196349457565808200e-01 8.6475e-19
2, 9
9, 3; 0.00000000000000000000e+00 5.00490592708884712800e-19 5.0049e-19
3, 9
9, 4; -1.02824784688641368500e+00 -1.02824784688641368400e+00 1.0544e-18
4, 9
9, 5; 0.00000000000000000000e+00 3.02880453092416613400e-19 3.0288e-19
5, 9
9, 6; -2.48810590110786521200e+00 -2.48810590110786521600e+00 1.3770e-18
6, 9
120
9, 7; 0.00000000000000000000e+00 3.26438556937926841600e-20 3.2643e-20
7, 9
9, 8; -1.55506618819241575700e+01 -1.55506618819241575800e+01 1.1155e-19
8, 9
9, 9 2.15829676335503224200e+01 2.15829676335503224400e+01 1.2056e-18

Из табл. 3.1 видно, что погрешность (3.46) аппроксимации интегралов


(3.15) при помощи предложенной кусочно-полиномиальной схемы не
превосходит по величине порядка 10 17 , что соответствует погрешности
формата представления данных типа long double в С++ [91]. Результат,
представленный в табл. 3.1 является типичным для схемы (2.74), (2.32), что
подтверждается численным экспериментом [114].
На рис. 3.1 представлена зависимость невязок вида (26) от номера
самосогласованной итерации для квантовых состояний n  1, 3 .

Рис. 3.1. Поведение невязки  в зависимости от номера итерации

Из рис. 3.1 видно, что порядок невязки (26) имеет тенденцию убывать в
зависимости от номера итерации, при этом на одиннадцатой итерации
невязка не превосходит величины 10 20 , что сопоставимо с погрешностью
представления действительных чисел типом long double С++. Под нулевым
121
значением невязки на двенадцатой итерации имеется в виду её равенство
нулю в формате представления данных long double С++.
На рис. 3.2 приводится график для невязки (25) потенциала Хартри в
рамках описываемого подхода (сплошная линия) в сравнении с
аналогичными невязками, приводимыми в [60] – штриховая линия, и в [70] –
пунктирная линия. Число «500» на графике означает, что в исследованиях
[60] снизить невязку  до величин порядка 10 10 удалось за 500 итераций.

Рис. 3.2. Поведение невязки  в зависимости от номера итерации

Рис. 3.2 демонстрирует тенденцию линейного убывания порядка


невязки (15) с каждой следующей итерацией при использовании кусочно-
полиномиального метод. Из рис. 3.2 видно, что после одиннадцатой итерации
невязка не превышает величину порядка 10 20 , при этом для двенадцатой
итерации справедливы сделанные для рис. 3.1 оговорки.
Изложенный компьютерный метод решения самосогласованной
системы (81) полностью аналогичен [70], отличаясь только способом
вычисления интегралов (3.15) – (3.17). При этом в [70] используется метод
конечных элементов с линейными функциями базиса. Из рис. 3.2 видно, что
122
при вычислении коэффициентов (3.15) – (3.17) при помощи кусочно-
полиномиальных схем (2.74), (2.32) удаётся снизить невязку (25) на 16
десятичных порядков по сравнению с методом из [70]. Помимо того,
согласно рис. 3.2 использование предложенного метода позволяет при
меньшем числе самосогласованных итераций получить невязку
электростатического потенциала на 8 десятичных порядков меньше
аналогичной невязки [105], полученной при использовании метода [60].
На рис. 3.3 приводятся зависимости невязки (3.23) электронной
плотности (14) от номера текущей самосогласованной итерации, полученные
предложенным методом – сплошная линия, а также представленные в [60] –
штриховая линия, и в [132] – пунктирная линия.

Рис. 3.3. Поведение невязки  e в зависимости от номера итерации

Из рис. 3.3 видно, что на первых итерациях плотность электронов


сходится в терминах (3.23) быстрее, чем волновые функции и
электростатический потенциал, однако величина уменьшения порядка
невязки за одну итерацию падает при приближении  e к величинам порядка
123
точности типа long double С++, при этом после восьмой итерации невязка
(3.23) становится менее 10 20 .
Сравнение графиков на рис. 3.3 показывает, что в рамках
представленного подхода невязка (3.23) обладает устойчивой тенденцией к
снижению с ростом числа самосогласованных итераций по сравнению с
аналогичной невязкой, полученной в [133], достигая значений на 15
десятичных порядков меньше чем в [133], а также на 18 десятичных
порядков меньше, чем в [60].
На рис. 3.4 показана зависимость невязки (27) энергии основного
квантового состояния от номера самосогласованной итерации.

Рис. 3.4. Поведение невязки E0 в зависимости от номера итерации

Из рис. 3.4 видно, что невязка энергии основного квантового


состояния, аналогично рассмотренным ранее, имеет тенденцию к убыванию
порядка после каждой итерации, при этом после одиннадцатой итерации
величина невязки не превосходит 10 20 .
Поведение невязок энергий возбуждённых состояний с n  2 , n  3
полностью аналогично представленному на рис. 3.4.
124
На основе рис. 3.1 – 3.4 заключаем, что невязки (25) – (27), (3.23) ведут
себя похожим образом, уменьшая свой порядок после каждой
самосогласованной итерации и не превосходя 10 20 после одиннадцатой
итерации.
Отметим, что для наиболее точного расчёта электронной структуры
нанообъекта необходимо, чтобы условие прекращения самосогласованных
итераций включало в себя одновременно условия вида (25) – (27), (3.23). В
противном случае, например, если использовать в качестве основного
параметра только невязку электронной плотности, то в рамках
рассмотренной модели самосогласованное решение будет считаться
приближённо найденным после восьмой итерации, когда e  1020 , при
~
этом невязка E0 будет иметь значение порядка 10 14 , а невязка потенциала

Хартри – 10 16 . Такая разница в порядках, если её не учесть, может привести


к получению недостаточно точных аппроксимаций (28), (29) и производных
от них величин при формальном выполнении условия сходимости.
На рис. 3.5 представлены графики зависимости    x, Ly 4 в

эффективных единицах для состояний с n  1, 2, 3 .

Рис. 3.5. Вид волновой функции для n  1 (пунктирная линия), n  2 (штриховая линия),
n  3 (сплошная линия)
125
Вид сечений волновых функций на рис. 3.5 соответствует основному
состоянию, с n  1 , и первым двум возбуждённым состояниям квантовой
частицы помещённой в двумерную потенциальную яму, как принято
полагать при моделировании [32].
На рис. 3.6 изображён график функции (29), приближающей потенциал
Хартри при y  Ly 2 .

Рис. 3.6. Потенциал Хартри, рассчитанный самосогласованно при аппроксимации


обменно-корреляционного взаимодействия по Хедину-Лундквисту (сплошная линия) и по
Такагаки-Плугу (штриховая линия)

Вид потенциала ~ на рис. 3.6 согласуется с моделью двумерной


потенциальной ямы. Значительная крутизна снижения потенциала к центру
проволоки говорит, что основной вклад в электростатическое
взаимодействие вносят электроны основного квантового состояния с n  1 ,
наиболее вероятное место расположения которых находится вблизи оси
нанопроволоки, что согласуется с [4, 129].
Разница между электростатическим взаимодействием,
моделированным с учётом обменно-корреляционных процессов в
приближении Хедина-Лундквиста (3.7) [49], и электростатическим
126
взаимодействием с обменно-корреляционной аппроксимацией Такагаки-
Плуга (3.8) [128] составляет менее 7,5% в рамках сделанных допущений, что
меньше принятого порога 10%, поэтому разница считается технически
незначительной [].
На рис. 3.7 приводится график электронной плотности (14) в
эффективных единицах при y  Ly 2 .

Рис. 3.7. Электронная плотность при y  Ly 2

График на рис. 3.7 находится в согласии с приведёнными выше


графиками потенциалов и свидетельствует, что основная часть электронов с
наибольшей вероятностью находится на оси нанопроволоки [4, 130].
Сравнение рис. 3.1 – 3.4 с табл. 1 показывает, что в отличие от [74 – 76,
133] представленный в настоящей работе подход, главной особенностью
которого является использование кусочно-полиномиальных схем (2.74),
(2.32) для вычисления элементов матриц f , C из (31), позволяет снизить
невязки вида (25) – (27), (3.23) до величин порядка 10 18  10 19 .
Важно отметить, что в [70], где также моделировался объект с
квантованием в направлении абсцисс и ординат, использовался подход
127
аналогичный изложенному и отличный от него только в части вычисления
двойных интегралов, – в [70] применялся метод конечных элементов с
линейными функциями базиса. Однако, как показывает численный
эксперимент [114], погрешность интегрирования по схеме (2.74), (2.32) с
использованием полиномов степени ниже пятой составляет величины
10 0  10 3 , что существенно больше погрешности описанных в данной работе
вычислительных схем. Таким образом, использование кусочно-
полиномиальной аппроксимации в качестве вычислительной основы для
компьютерного моделирования снижает погрешность аппроксимации
отрезками ряда вида (28), (29) потенциала Хартри и волновой функции.
3.4. Численный эксперимент по моделированию электрон-
фононного рассеяния и физический смысл уточнений. Ниже приводятся
результаты расчета скоростей рассеяния электронов на АПОФ с
использованием волновых функций и уровней энергии, полученных при
помощи компьютерного метода вычисления двойных интегралов,
представленного в гл. 2.
Интегралы в правых частях равенств (3.24), (3.27) – (3.30) вычислялись
по схеме (2.74), (2.32). Для решения уравнения (3.35) использовалась схема
на основе сортировки [27, 28], при этом устанавливалось  0D  1018 . Выбор

значения  0D обусловлен необходимостью уточнения результатов


моделирования и вычислительными возможностями схемы на основе
сортировки, изложенными в [27, 28].
На рис. 3.8 представлена зависимость скорости рассеяния электронов
на акустических фононах от кинетической энергии для подзоны 1,1 при
использовании аппроксимации Хедина-Лундквиста (рис. 3.8а) и Такагаки-
Плуга (3.8б).
128

Рис. 3.8. Скорость рассеяния на акустических фононах с использованием аппроксимации


Хедина-Лундквиста (а) и Такагаки-Плуга (б) для начального состояния 1,1

Из рис. 3.8 видно, что выбор аппроксимации (3.7) или (3.8) в


рассматриваемых условиях моделирования существенно не влияет на
поведение Wac E  из (3.27), однако, при использовании аппроксимации
Хедина-Лундквиста (3.7) пики кривых получаются немного выше. Эта
особенность будет наблюдаться на всех графиках [105], отображающих
зависимость скорости рассеяния от кинетической энергии электрона, и в
дальнейшем отдельно оговариваться не будет.
На рис. 3.9 приводятся графики скорости рассеяния электронов из
подзоны с квантовыми числами 1, 2 на акустических фонах в зависимости
от кинетической энергии электронов при различных аппроксимациях
обменно-корреляционного потенциала.
129

Рис. 3.9. Скорость рассеяния на акустических фононах с использованием аппроксимации


Хедина-Лундквиста (а) и Такагаки-Плуга (б) для начального состояния 1, 2

Сравнение рис. 3.8, 3.9 показывает, что в основном и возбуждённом


состоянии характер кривой между пиками не меняется, но изменяется число
максимумов на выбранном отрезке кинетических энергий, уменьшаясь с
ростом энергии состояния. Это естественно, т. к. каждый пик соответствует
переходу электрона из начального состояния в последующие, учтённые при
моделировании [134], а именно, из состояния 1,1 в состояние 1, 2 – на
рис. 3.8, – из состояния 1, 2 в состояние  2, 2 – на рис. 3.9.
На рис. 3.10 изображены скорости рассеяния на полярных оптических
фононах (ПОФ) электронов в основном квантовом состоянии в зависимости
от кинетической энергии движения вдоль оси нанопроволоки. При этом на
рис. 3.10а изображён случай испускания фонона с рассеянием назад и
аппроксимацией (3.7), на рис. 3.10б – случай испускания фонона с рассеянием
вперёд в аппроксимации обменно-корреляционного потенциала вида (3.8).
130

Рис. 3.10. Скорость рассеяния на ПОФ с испусканием фонона и рассеянием назад (а) и
вперёд (б) в основном квантовом состоянии

На рис. 3.11 приводятся аналогичные зависимости для подзоны 1, 2 .

Рис. 3.11. Скорость рассеяния на ПОФ с испусканием фонона и рассеянием назад (а) и
вперёд (б) в состоянии 1, 2

Из рис. 3.10, 3.11 видно, что скорость рассеяния назад электронов на


ПОФ, изображённая на рис. 3.10а, 3.11а, имеет тенденцию к более быстрому
убыванию по сравнению со случаем рассеяния назад, представленным на
131
рис. 3.10б, 3.11б. Кроме того для кривых, соответствующих возбуждённому
состоянию, характерна меньшая выраженность пиков.
На рис. 3.12а представлена скорость рассеяния на ПОФ с поглощением
фонона и рассеянием назад в приближении обменно-корреляционных
процессов по Хедину-Лундквисту (3.7), а также аналогичная скорость
рассеяния вперёд с аппроксимацией Такагаки-Плуга (3.8) – на рис. 3.12б.

Рис. 3.12. Скорость рассеяния на ПОФ с поглощением фонона и рассеянием назад (а) и
вперёд (б) в основном квантовом состоянии

Сопоставление графиков на рис. 3.10 – 3.12 показывает, что скорость


рассеяния на ПОФ с рассеянием назад в обоих случаях – с испусканием и
поглощением фонона – обладает тенденцией к более быстрому снижению с
повышением кинетической энергии E . Также отметим, что в случае
рассеяния с поглощением расстояние между пиками увеличивается по
сравнению с кривыми, отражающими процессы рассеяния с испусканием
фонона.
Характер зависимостей на рис. 3.8 – 3.12, а именно, чередование ярко
выраженных пиков и участков быстро падающей кривой, совпадает с
характером графиков, опубликованных в [4], с точностью до положения и
значения экстремумов. Расхождения обусловлены тем, что в [4]
132
моделировалась транзисторная структура, а в настоящей работе – уединённая
нанопроволока, при этом за счёт применения более точных вычислительных
схем уточнены значения пиков кривых.
Физический смысл полученных уточнений обсуждается ниже.
На рис. 3.13 приводится график зависимости величины 1,1

столкновительного уширения уровня энергии 1,1 от кинетической энергии


электрона.

Рис. 3.13. Столкновительное уширение 1, 1 уровня энергии основного квантового


состояния с использованием аппроксимации Хедина-Лундквиста (а) и Такагаки-Плуга (б)

На рис. 3.13 видно, что использование аппроксимации обменно-


корреляционного потенциала по Такагаки-Плугу (3.8) делает пики,
обведённые в кружочки, более явными (рис. 3.13б) по сравнению с видом
кривой столкновительного уширения, рассчитанного при использовании
аппроксимации Хедина-Лундквиста (3.7) (рис. 3.13а).
Сопоставление графиков на рис. 3.8 – 3.13 показывает, что пики
столкновительного уширения на рис. 3.13 соответствуют пикам скоростей
рассеяния в следующем порядке: рассеяние с испусканием фонона, рассеяние
с поглощением фонона, рассеяние на акустических фононах, это
соответственно отражено метками e , a , Ac на рис. 3.13.
133
Таким образом, из рис. 3.13 следует, что при аппроксимации обменно-
корреляционного взаимодействия по Такагаки-Плугу столкновительное
уширение спектра энергии для рассеяния на ПОФ из первого возбуждённого
состояния получает большие значения (выше пики в «кружочках»). Такой
эффект означает повышение вклада механизма ПОФ (высокочастотных
колебаний кристаллической решётки) в изменение энергетической структуры
полупроводника.
Первые три пика, соответствующие рассеянию из основного
квантового состояния в первое возбуждённое, имеют наибольшую величину,
вторая тройка, соответствующая рассеянию в очередное состояние, имеет
значительно меньшую амплитуду. Такое поведение кривой объясняется тем,
что большинство электронов находится в основном квантовом состоянии и
участвует в большинстве актов рассеяния, а значит, подзона основного
состояния получает наибольшее уширение.
Показанное соответствие экстремумов позволяет выявить
доминирующий механизм рассеяния, путем исследования только
зависимости столкновительного уширения от кинетической энергии
движения электрона вдоль оси нанопроволоки, что в итоге сокращает время
моделирования.
Наибольшие пики кривой на рис. 3.13 соответствуют рассеянию на
акустических фононах, поэтому взаимодействие электронов зоны
проводимости с низкочастотными колебаниями кристаллической решётки,
формализуемое моделью акустических фононов [5, 6], вносит наибольший
вклад в изменение структуры энергетических подзон по сравнению с
рассеянием на высокочастотных фононах в ограничениях рассматриваемой
модели.
Представленные рассуждения согласуются с результатами
моделирования транзисторной структуры в [4, 17] и уточняют значения
экстремумов скоростей рассеяния.
134
Для столкновительного уширения энергии возбуждённых состояний
описанное соответствие экстремумов также имеет место и не приводится в
силу полной аналогии с изложенным для основного квантового состояния.
Физическая интерпретация полученных уточнений дополнительно
заключается в следующем. Величина скорости рассеяния электронов на
фононах имеет существенное влияние на время отклика устройства,
температурный режим его работы, кондактанс и т.д. [2 – 6, 9, 12, 16].
Пиковые значения скорости рассеяния, в конечном счёте, позволяют
определить наибольшую величину изменений названных характеристик
проектируемого устройства, обусловленных различными механизмами
рассеяния [2 – 6, 15].
На базе предложенных кусочно-полиномиальных методов аналогичное
представленному моделирование электрон-фононного рассеяния в p-GaAs
нанопроволоке в поперечном электрическом поле описывается в [135].
Решение самосогласованной системы Шрёдингера и Пуассона (3.1) без
использования понятия эффективной плотности состояний и расчет
электрон-фононного рассеяния в нелегированной нанопроволоке приводится
в [136, 137] соответственно. Моделирование электронного транспорта в
p-GaAs/AlAs транзисторной структуре описано в [138], аспекты
распараллеливания такого моделирования приведены в [139].
3.5. Выводы
1. Выполнено моделирование уединённой нелегированной GaAs
нанопроволоки, отличающееся от известных тем, что основано на
предложенных вычислительных методах сравнительно высокой точности. В
результате достигнуто уточнение численных параметров существующих
моделей обменно-корреляционного потенциала при аппроксимации
локальной плотности.
2. На основе предложенных кусочно-полиномиальных методов
вычисления двойных интегралов и схем вычисления корней полиномов при
помощи сортировки получены уточнения известных численных значений
135
пиков скоростей электрон-фононного рассеяния, а также уточнения
электронной структуры GaAs нанопроволоки (при аппроксимации
коэффициентов рядов, определяющих потенциал Хартри и волновые
функции электронов основного и первых двух возбуждённых состояний).
3. Разработан программный комплекс для моделирования GaAs
нанопроволок, который отличается от известных по построению на основе
кусочно-полиномиальных методов и повышенной точностью численного
моделирования, что позволяет уточнить математические модели рассеяния
электронов нескольких подзон на полярных и оптических фононах с учётом
столкновительного уширения энергетического спектра и взаимной
корреляции механизмов рассеяния.
4. На основе полученных уточнений дана физическая интерпретация
соответствия между пиками столкновительного уширения и пиками кривых
электрон-фононного рассеяния, что позволяет определить доминирующий
механизм рассеяния. В технологическом аспекте уточнения рассматриваемой
модели позволяют повысить точность расчета времени отклика электронного
устройства, температурного режима его работы, а также кондактанс в смысле
электрической проводимости в зависимости от химического состава и
геометрической формы.
136

ЗАКЛЮЧЕНИЕ

Основной результат диссертационной работы заключается в разработке


и исследовании компьютерного варьируемого кусочно-полиномиального
метода приближённого вычисления функций двух переменных, их частных
производных и двойных интегралов с применением к моделированию
электронной структуры и электрон-фононного рассеяния в GaAs
нанопроволоках прямоугольного поперечного сечения. В частности
результаты отличаются следующей новизной:
1. Предложена модификация компьютерной варьируемой кусочно-
полиномиальной схемы вычисления действительных функций одной
действительной переменной, отличающаяся от аналогов построением на
основе усреднения полиномов Ньютона для интерполирования вперёд и
назад на каждом подынтервале, что позволяет существенно повысить
точность при минимизированной временной сложности вычисления. На этой
основе даны видоизменения кусочно-полиномиальных схем вычисления
производных и определённых интегралов от функций рассматриваемого
вида. Показана сходимость данных приближений функций и определённых
интегралов со скоростью геометрической прогрессии (С. 36 – 45, 46 – 52, 152
– 155).
2. Разработана компьютерная кусочно-полиномиальная схема
аппроксимации действительных функций двух действительных переменных,
отличающаяся от известных по построению на основе интерполяционного
полинома Ньютона от двух действительных переменных с программно
варьируемыми степенью и числом подобластей, что позволяет
минимизировать временную сложность для произвольно заданной в рамках
числового диапазона языка программирования границы погрешности
вычисления функции. На этой основе предложены компьютерные схемы
приближенного вычисления частных производных и двойных интегралов по
прямоугольной области. Показана сходимость данных приближений
137
функций и интегралов со скоростью произведения геометрических
прогрессий по каждой из двух переменных. (С. 64 – 74, 77 – 80, 82 – 85, 177 –
181)
3. Показан параллелизм предложенных разновидностей кусочно-
полиномиальных алгоритмов вычисления функций двух действительных
переменных, частных производных и двойных интегралов, даны оценки
временной сложности на модели неветвящихся параллельных программ,
согласно которым динамический синтез данных алгоритмов можно
осуществить с логарифмической временной сложностью. (С. 52 – 56, 85 – 88)
4. На основе предложенных компьютерных схем вычисления двойных
интегралов и нахождения корней полиномов при помощи алгоритмов
сортировки модернизирована математическая модель электронного
транспорта в уединённой нелегированной GaAs нанопроволоке с учётом
квантовых эффектов высокого порядка, что позволило уточнить
численные значения пиков скоростей электрон-фононного рассеяния, а
также уровней энергии размерного квантования GaAs нанопроволоки для
основного и первых двух возбуждённых состояний. (С. 99 – 134)
5. Разработан программный комплекс для реализации предложенных
разновидностей кусочно-полиномиальных схем, обеспечивающий
минимизацию их временной сложности и границ погрешности. С помощью
данного комплекса выполнен численный эксперимент для широкого класса
функций одной и двух действительных переменных, включая тестовые
наборы, который подтвердил существенное повышение точности
предложенного метода по сравнению с известными аналогами. На данной
основе разработано расширение программного комплекса для
моделирования GaAs нанопроволок, с помощью которого проведены
программные и численные эксперименты, уточняющие численные
параметры математических моделей электрон-фононного рассеяния. (С.
56 – 62, 88 – 96, 115 – 134)
В частности работа содержит следующие научные результаты:
138
1. Модификация компьютерной варьируемой кусочно-полиномиальной
схемы вычисления действительных функций одной действительной
переменной с программно варьируемыми степенью и числом подобластей,
минимизацией временной сложности для произвольно заданной в рамках
числового диапазона языка программирования границы погрешности
вычисления функции. Видоизменение кусочно-полиномиальных схем
вычисления производных и определённых интегралов от функций
рассматриваемого вида. Доказательство сходимости данных приближений
функций и определённых интегралов со скоростью геометрической
прогрессии.
2. Компьютерная кусочно-полиномиальная схема аппроксимации
действительных функций двух действительных переменных, отличающаяся
от известных по построению на основе интерполяционного полинома
Ньютона от двух действительных переменных с программно варьируемыми
степенью и числом подобластей, с минимизацией временной сложности для
произвольно заданной в рамках числового диапазона языка
программирования границы погрешности вычисления функции.
Компьютерные схемы приближенного вычисления частных производных и
двойных интегралов по прямоугольной области. Доказательство сходимости
данных приближений функций и интегралов со скоростью произведения
геометрических прогрессий по каждой из двух переменных.
3. Даны оценки временной сложности предложенных разновидностей
кусочно-полиномиальных алгоритмов на модели неветвящихся
параллельных программ, согласно которым динамический синтез данных
алгоритмов можно осуществить с логарифмической временной сложностью.
4. Модернизация вычислительных алгоритмов математической модели
электронного транспорта в уединённой нелегированной GaAs нанопроволоке
с учётом квантовых эффектов высокого порядка, уточнение численные
значения пиков скоростей электрон-фононного рассеяния, а также уровней
энергии размерного квантования GaAs нанопроволоки для основного и
139
первых двух возбуждённых состояний на основе предложенных
компьютерных схем вычисления двойных интегралов и нахождения корней
полиномов при помощи алгоритмов сортировки.
5. Программный комплекс для реализации предложенных
разновидностей кусочно-полиномиальных схем, обеспечивающий
минимизацию их временной сложности и границ погрешности. Расширение
на данной основе программного комплекса для моделирования GaAs
нанопроволок, с помощью которого уточнены численные параметры
математических моделей электрон-фононного рассеяния.
Научная новизна результатов диссертационной работы заключается в
следующем:
1. Предложена модификация компьютерной варьируемой кусочно-
полиномиальной схемы вычисления действительных функций одной
действительной переменной, отличающаяся от аналогов построением на
основе усреднения полиномов Ньютона для интерполирования вперёд и
назад на каждом подынтервале, что позволяет существенно повысить
точность при минимизированной временной сложности вычисления. На этой
основе даны видоизменения кусочно-полиномиальных схем вычисления
производных и определённых интегралов от функций рассматриваемого
вида. Показана сходимость данных приближений функций и определённых
интегралов со скоростью геометрической прогрессии (С. 36 – 45, 46 – 52, 152
– 155).
2. Разработана компьютерная кусочно-полиномиальная схема
аппроксимации действительных функций двух действительных переменных,
отличающаяся от известных по построению на основе интерполяционного
полинома Ньютона от двух действительных переменных с программно
варьируемыми степенью и числом подобластей, что позволяет
минимизировать временную сложность для произвольно заданной в рамках
числового диапазона языка программирования границы погрешности
вычисления функции. На этой основе предложены компьютерные схемы
140
приближенного вычисления частных производных и двойных интегралов по
прямоугольной области. Показана сходимость данных приближений
функций и интегралов со скоростью произведения геометрических
прогрессий по каждой из двух переменных. (С. 64 – 74, 77 – 80, 82 – 85, 177 –
181)
3. Показан параллелизм предложенных разновидностей кусочно-
полиномиальных алгоритмов вычисления функций двух действительных
переменных, частных производных и двойных интегралов, даны оценки
временной сложности на модели неветвящихся параллельных программ,
согласно которым динамический синтез данных алгоритмов можно
осуществить с логарифмической временной сложностью. (С. 52 – 56, 85 – 88)
4. На основе предложенных компьютерных схем вычисления двойных
интегралов и нахождения корней полиномов при помощи алгоритмов
сортировки модернизирована математическая модель электронного
транспорта в уединённой нелегированной GaAs нанопроволоке с учётом
квантовых эффектов высокого порядка, что позволило уточнить
численные значения пиков скоростей электрон-фононного рассеяния, а
также уровней энергии размерного квантования GaAs нанопроволоки для
основного и первых двух возбуждённых состояний. (С. 99 – 134)
5. Разработан программный комплекс для реализации предложенных
разновидностей кусочно-полиномиальных схем, обеспечивающий
минимизацию их временной сложности и границ погрешности. С помощью
данного комплекса выполнен численный эксперимент для широкого класса
функций одной и двух действительных переменных, включая тестовые
наборы, который подтвердил существенное повышение точности
предложенного метода по сравнению с известными аналогами. На данной
основе разработано расширение программного комплекса для
моделирования GaAs нанопроволок, с помощью которого проведены
программные и численные эксперименты, уточняющие численные
141
параметры математических моделей электрон-фононного рассеяния. (С.
56 – 62, 88 – 96, 115 – 134)
Практическая ценность диссертационного исследования заключается
в прикладном характере предложенных численных методов варьируемой
кусочно-полиномиальной аппроксимации действительных функций одной и
двух действительных переменных, соответствующих прямых и частных
производных, а также определённых и двойных интегралов, которые
используются в качестве численной и алгоритмической базы для
компьютерной реализации математического моделирования GaAs
нанопроволок прямоугольного поперечного сечения. Результаты
моделирования необходимы для конструирования полевых транзисторов с
высокой подвижностью электронов (HEMT – high electron mobility transistor)
на основе нанопроволок, уточнённого расчёта их электронной структуры,
электрон-фононного рассеяния и, в конечном счёте, для моделирования
высокоскоростных устройств наноэлектроники. В частности, повышение
точности моделирования оказывается критически важным при расчёте
электронного транспорта с учётом квантовых эффектов высокого порядка.
Предложенные варьируемые кусочно-полиномиальные методы доведены до
практической реализации в виде программного комплекса для
аппроксимации практически значимых функций, производных и интегралов,
который минимизируюет временную сложность и абсолютную погрешность.
Разработано дополнение к комплексу, нацеленное на уточнённое
компьютерное моделирование электронной структуры и электрон-фононного
рассеяния нанопроволок и транзисторных структур на их основе.
Практическое использование результатов работы:
1. В НИИ механики и прикладной математики им. Воровича И.И. ЮФУ
приняты к использованию следующие материалы диссертации:
1.1. Представленные в гл. 1 модификации варьируемой кусочно-
полиномиальной схемы вычисления действительных функций одной
действительной переменной на основе усреднения полиномов Ньютона для
142
интерполирования вперёд и назад на каждом подынтервале, позволяющие
достигать высокой точности при минимизированной временной сложности
вычисления, а также видоизменения кусочно-полиномиальных схем
вычисления производных и определённых интегралов от функций
рассматриваемого вида (С. 36 – 45, 46 – 52, 152 – 155).
1.2. Представленная в гл. 2 кусочно-полиномиальная схема
аппроксимации действительных функций двух действительных переменных
на основе интерполяционного полинома Ньютона от двух действительных
переменных с программно варьируемыми степенью и числом подобластей,
позволяющая минимизировать временную сложность вычисления функции
для заданной границы погрешности, а также компьютерные схемы
приближенного вычисления частных производных и двойных интегралов (С.
64 – 74, 77 – 80, 82 – 85, 177 – 181).
1.3. Представленный в гл. 3 метод численного моделирования
электронного транспорта в уединённой нелегированной GaAs нанопроволоке
с учётом квантовых эффектов высокого порядка, позволяющий уточнить
значения пиков скоростей электрон-фононного рассеяния, а также уровней
энергии размерного квантования GaAs нанопроволоки для основного и
первых двух возбуждённых состояний (С. 99 – 134).
1.4. Разработанный в диссертации программный комплекс для
реализации предложенных разновидностей кусочно-полиномиальных схем,
обеспечивающий минимизацию их временной сложности и границ
погрешности, с помощью которого осуществляется численный эксперимент
для широкого класса функций одной и двух действительных переменных,
включая тестовые наборы, подтверждающий существенное повышение
точности предложенного метода по сравнению с известными аналогами, а
также разработанное расширение программного комплекса для
моделирования GaAs нанопроволок, с помощью которого проведены
программные и численные эксперименты, уточняющие численные
параметры математических моделей электрон-фононного рассеяния (С. 56 –
62, 88 – 96, 115 – 134). В частности, предложенные программные пакеты
используются для снижения границы абсолютной погрешности
143
приближённого решения самосогласованной системы уравнений Шрёдингера
и Пуассона при моделировании электронного транспорта.
2. В работе по выполнению государственного задания Министерства
образования и науки РФ ФГБОУ ВПО «ТГПИ имени А.П. Чехова» по
проекту № 7.1398.2011 «Распараллеливаемые компьютерные методы
вычисления функций, решения и анализа устойчивости дифференциальных
уравнений, цифровой обработки сигналов и распознавания изображений с
применением алгоритмов сортировки».
3. В учебном процессе кафедры информатики ФГБОУ ВПО «ТГПИ
имени А.П. Чехова» в курсах «Численные методы», «Программирование»,
«Методы численного анализа и вычислительной алгебры», «Математическое
моделирование» и «Компьютерное моделирование».
144

ЛИТЕРАТУРА

1. Jia R., Hasegawa H., Shiozaki N., Kasai S. Device interference in


GaAs quantum wire transistors and its suppression by surface passivation using Si
interface control layer // J. Vac. Sci. Technol. – 2006. – B 24. – pp. 2060 – 2068.
2. Chou S. Y., Wang Y. Planar double gate quantum wire transistor //
Appl. Phys. Lett. – 1993. – Vol. 83. – № 6. – pp. 788 – 790.
3. Jovanovic D. and Leburton J.P. Quantum confinement and charge
control in deep mesa etched quantum wire device // IEEE Electron Device Lett. –
1993. – Vol. 14. – pp. 7 – 9.
4. Borzdov A.V., Pozdnyakov D.V., Galenchik V.O., Borzdov V.M.,
Komarov F.F. Self-consistent calculations of phonon scattering rates in GaAs
transistor structure with one-dimensional electron gas // Phys. Stat. Sol. (b). –
2005. – Vol. 242. – № 15. – pp. 134 – 136.
5. Philip L. Taylor, Olle Heinonen A quantum approach to condensed
mater physics. – Cambridge University Press, 2002. – 414 pp.
6. Stroscio M. A. and Dutta M. Phonons in nanostructures. – Cambridge
University Press, 2001. – 274 pp.
7. Antonyuk V. B., Malshukov A. G., Larsson M. and Chao K.A. Effect
of electron-phonon interaction on electron conductance in one-dimensional
systems // Phys. Rev. B. – 2004. – Vol. 69. – pp. 155308 – 1553015.
8. Kim K.W., Stroscio M.A., Bhatt A., Mickevicius R., Mitin V.V.
Electron-optical-phonon scattering rates in a rectangular semiconductor quantum
wire // J. Appl. Phys. – 1991. – V. 70. – pp. 319 – 327.
9. Suzuki A. Theory of hot-electron magnetophonon resonance in quasi-
two-dimensional quantum-well structures // Phys. Rev. B. – 1992. – Vol. 45. – pp.
6731–6741.
10. Gaggero-Sager M. L., Moreno-Martinez N., Rodriguez-Vargas I.,
Perez-Alvarez R., Grimalskyand V. V. and Mora-Ramos M. E. Electronic structure
145
as a function of temperature for Si  -doped Quantum Wells in GaAs // PIERS
Online. – 2007. – № 3. – pp. 851 – 854.
11. Samuel E. P. and Patil D. S. Analysis of wavefunction distribution in
quantum well biased laser diode using transfer matrix method // PIERL. – 2008. –
Vol. 1. – pp. 119–128.
12. Ariza-Flores A. D. and Rodriguez-Vargas I. Enhancement of the
electronic confinement improves the mobility in p-n-p delta-doped quantum wells
in Si // PIER letters. – 2008. – Vol. 1. – pp. 167 – 172.
13. Mickevicius R., Mitin V. Acoustic-phonon scattering in rectangular
quantum wire // Phys. Rev. B. – 1993. – V. 48. – pp. 17194–17201.
14. Pozdnyakov D.V., Galenchik V.O., Borzdov A.V. Electron Scattering
in Thin GaAs Quantum Wires // Phys. Low-Dim. Struct. – 2006. – № 2. – pp. 87–
90.
15. Борздов А.В., Поздняков Д.В. Рассеяние электронов в
транзисторной структуре GaAs/AlAs // ФТТ. – 2007. – Т. 49. – С. 913–916.
16. Борздов В.М, Комаров Ф.Ф. Моделирование электрофизических
свойств твердотельных слоистых структур интегральной электроники.
Минск: БГУ, 1999.
17. Pozdnyakov D., Galenchik V., Borzdov A., Borzdov V., Komarov F.
Influence os scattering processe on electron quantum states in nanowires //
Nanoscale Res. Lett. – 2007. – Vol. 2. – pp. 213 –218.
18. Ziman J.M. Electrons and Phonons. The theory of transport in solids.
Oxford: Oxford University Press, 2001.
19. Srivastava J. K. and Rao S. M. (eds.) Models and Methods of High-Tc
Superconductivity: Some Frontal Aspects. New York: Nova Science, 2003.
20. Hess K. Monte Carlo device simulation: Full band and beyond.
Boston: Kluwer Academic Press, 1991.
21. Briggs S., Mason B. A., Leburton J. P. Self‐consistent polaron
scattering rates in quasi-one-dimensional structures // Phys. Rev. B. – Vol. 40. –
1989. – pp. 12001 – 12004.
146
22. Pozdnyakov D. V., Galenchik V.O. Electron-phonon scattering in
semiconductor structures with one-dimensional electron gas // Phys. Low-Dim.
Struct. – 2006. – № 1. – pp.17 – 19.
23. Pozdnyakov D.V., Galenchik V.O., Borzdov V.M., Komarov F.F.,
Zhevnyak O.G. Ionized impurity and surface roughness scattering rates of
electrons in semiconductor structures with one-dimensional electron gas and
broadened energy levels // Phys. Low-Dim. Struct. – 2006. – № 1. – pp. 19 – 24.
24. Knezevic I., Ramayya E. B., Vasileska D., Goodnick S. M. Diffusive
transport in quasi-2D and quasi-1D electron systems // J. of Comput. and Theor.
Nanoscience. – 2009. – Vol. 6. – pp. 1725-1753.
25. Ramayya E. B., Vasileska D., Goodnick S. M. and I. Knezevic
Electron transport in silicon nanowires: The role of acoustic phonon confinement
and surface roughness scattering // J. Appl. Phys. – 2008. – Vol. 104. – pp.
063711.
26. Бахвалов Н. С., Жидков Н. П., Кобельков Г. М. Численные
методы. – М.: «Бином. Лаборатория знаний», 2008. – 640 с.
27. Ромм Я. Е. Локализация и устойчивое вычисление нулей
многочлена на основе сортировки. I. — Кибернетика и системный анализ. –
2007. – № 1. – с. 165 – 182
28. Ромм Я. Е. Локализация и устойчивое вычисление нулей
многочлена на основе сортировки. II // Кибернетика и системный анализ,
Киев, 2007, № 2. – С. 161 – 174.
29. Ромм Я.Е., Голиков А.Н. Применение сортировки для
идентификации спектральных линий на модели оптического спектра / ТГПИ.
– Таганрог, 2006. – 14 с. Деп. в ВИНИТИ № 1620 – В2006.
30. Ромм Я.Е., Голиков А.Н. Программный поиск экстремальных
закономерностей на графических отображениях физических процессов /
ТГПИ. – Таганрог, 2008. – 39 с. Деп. в ВИНИТИ № 53 – В2008.
31. Ромм Я.Е., Голиков А.Н. Идентификация экстремальных
закономерностей решений нестационарного уравнения Шрёдингера для
147
исходно гауссова волнового пакета в бесконечно глубокой потенциальной
яме при отсутствии внешних полей / ТГПИ. – Таганрог, 2009. – 137 с. Деп. в
ВИНИТИ 05.06.09, № 346-В2009.
32. Harrison P. Quantum well, wires and dots. Theoretical and
computational physics of semiconductor nanostructures. – John Wiley & Sons,
2005. – 482 pp.
33. Van Vleck J. H. Nonorthogonality and Ferromagnetism // Phys. Rev.
– 1936. – Vol. 49. – pp. 232-240.
34. D.R. Inglis Non-Orthogonal Wave Functions and Ferromagnetism //
Phys. Rev. – 1934. – Vol. 46. – pp. 135-138.
35. Сатанин А.М. Введение в теорию функционала плотности. –
Нижний Новгород, 2009, 64 с.
36. Born M., Oppenheimer R. Zur Quantentheorie der Molekeln //
Annalen der Physik. – 1927. – № 20. – 4. Folge. – Band 84. – s. 457-484.
37. Hartree D. R. The wave mechanics of an atom with a non-Coulomb
central field. Part I. Theory and methods // Proc. Cambridge Phyl. Soc. – 1928. –
Vol. 24. – p. 89-110.
38. Hartree D. R. The Wave Mechanics of an Atom with a Non-Coulomb
Central Field. Part II. Some Results and Discussion // Proc. Cambridge Phyl. Soc.
– 1928. – Vol. 24. – p. 111-132.
39. Hartree D. R. The wave mechanics of an atom with a non-Coulomb
central field Part III Term values and intensities in series an optical spectra // Proc.
Cambridge Phyl. Soc. – 1928. – Vol. 24. – p. 426-437.
40. Hartree D. R. The Wave Mechanics of an Atom with a Non-Coulomb
Central Field. Part IV. Further Results relating to Terms of the Optical Spectrum //
Proc. Cambridge Phyl. Soc. – 1929. – Vol. 25. – p. 310-314.
41. Fock V. Näherungsmethode zur Lösung des
quantenmechanichanischen Mehrkörperproblems // Z. Phys. – 1930. – Vol. 61. – p.
126-148.
148
42. Thomas L. H. The calculation of atomic fields // Proc. Cambridge
Philos. Soc. 1927. – Vol. 23. – pp. 542-548.
43. Fermi E. Un metodo statistico par la determinazione di alcune
propriety dell'atome // Atti Accad. Naz. Lincei, Cl. Sci. Fis. Mat. Nat. Rend. –
1927. – Vol. 6. – Issue 6. – pp. 602-607.
44. Hohnberg P., Kohn W. Inhomogeneous Electron Gas // Phys. Rev. –
1964. – Vol. 136. – Issue 3B. – B864-B871.
45. Mermin D. Thermal Properties of the Inhomogeneous Electron Gas //
Phys. Rev. – 1965. – Vol. 137. Issue 5A. – pp. A1441-A1443.
46. Kohn W. and Sham L. J. Self-Consistent Equations Including
Exchange and Correlation Effects // Phys. Rev. – 1965. – Vol. 140. – pp. A1133–
A1138.
47. Н. Марч, У. Янг, С. Сампантхар Проблема многих тел в
квантовой механике, М.: «Мир», 1969.
48. Wigner E. On the Interaction of Electrons in Metals // Phys. Rev. –
1934. – Vol. 46. – Issue 11. – pp. 1002-1011.
49. Hedin L. and Lundqvist B. Explicit local exchange-correlation
potentials // J. Phys. C.: Solid State Phys. – 1971. –Vol. 4. – № 14. – pp. 2064 –
2083.
50. Oliveira M. J. T., Räsänen E., Pittalis S. and A. L. M. Marques
Toward an all-around semilocal potential for electronic exchange // J. Chem.
Theory Comput. – 2010. – Vol. 6. – pp. 3664–3670.
51. Persson C. and Mirbt S. Improved electronic structure and optical
properties of sp-hibridized semiconductors using LDA+USIC // Brasilian J. of Phys.
– 2006. – Vol. 36. – № 2A. – pp. 286-290.
52. Becke A. D. and Johnson E. R. A simple effective potential for
exchange // J. Chem. Phys. – 2006. – Vol. 124. – pp. 221101-1 – 221101-4.
53. Tran F. Blaha P. Accurate band gaps of semiconductors and insulators
with a semilocal exchange-correlation potential // Phys. Rev. Lett. – 2009. – Vol.
102. – pp. 226401-1 – 226401-4.
149
54. Гуртов В. А. Твердотельная электроника. – Москва, 2005. – 492 с.
55. BenDaniel D.J., Duke C.B. Space-Charge Effects on Electron
Tunneling // Phys. Rev. – 1966. – Vol. 152. – pp. 683 – 692.
56. Willatzen M., Melnik R.V.N., Galeriu C., Voon L.C. L. Y. Quantum
confinement phenomena in nanowire superlattice structures // Mathematics and
Computers in Simulation. – 2004. – Vol. 65. – pp. 385–397.
57. May F. Realistic simulation of semiconductor nanostructures // A
dissertation for the degree of Doctor of Sciences. – Zurich: ETH, 2009. – 102 pp.;
Diss. ETH №. 18743.
58. Chen M. Porod W. and Kirkner D. J. Coupled finite element/boundary
element method for semiconductor quantum devices with exposed surfaces // J.
Appl. Phys. – 1994. – Vol. 75. – Issue 5. – pp. 2545-2554.
59. Зубков В. И. Моделирование вольт-фарадных характеристик
гетероструктур с квантовыми ямами помощью самосогласованного решения
уравнений Шрёдингера и Пуассона // ФТП. – 2006. – Т. 40. – Вып. 10. – с.
1236-1240.
60. Trellakis A., Ravaioli U. Computational issues in the simulation of
semiconductor quantum wires // Comput. Methods Appl. Mech. Engrg. – 2000. –
Vol. 181. – pp. 437 – 449.
61. Smoliner J. and Ploner G. Electron Transport and Confining Potentials
in Semiconductor Nanostructures // Handbook of Nanostructured Materials and
Nanotechnology, Vol.3; edited by H. Nalwa. – Academic Press. – 2000. – p1-91.
62. Березин И. С., Жидков Н. Г. Методы вычислений. – Т. 2. – М.:
Физматгиз, 1962. – 640 с.
63. Olver P. J. Shakiban C. Applied Mathematics. – John Wiley & Sons,
2004. – pp. 1059.
64. Zhou Y., Saad Y., Tiago M. L., Chelikowsky J. R. Self-consistent-
field calculations using Chebyshev-filtered subspace iteration // Journal of
Computational Physics. – 2006. – Vol. 219. – pp. 172–184.
150
65. Jacobi C. G. J. Über ein leichtes Verfahren die in der Theorie der
Säcularstörungen vorkommenden Gleichungen numerisch aufzulösen // Journal für
die reine und angewandte Mathematik. – 1846. – Bd. 30. – pp. 51 – 94.
66. Nozaria K., Akbaria S., Fayeghib F. and Mirzaiec M. Many-Body
Effects and Bandgap Renormalization in H-Shaped Quantum Wires // Acta
Physica Polonica A. – 2009. – Vol. 115. – № 3. – pp. 721-731.
67. Lew Yan Voon L. C., Zhang Y., Lassen B., Willatzen M., Xiong Q.,
and Eklund P. C. Electronic Properties of Semiconductor Nanowires // Journal of
Nanoscience and Nanotechnology. – 2008. – Vol. 8. – pp. 1-26.
68. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной
алгебры. – М.: Наука, 1963. – 656 c.
69. Heiskanen M., Torsti T., Puska M. J. and Nieminen R. M. A novel
multigrid method for electronic structure calculations // Phys. Rev. B. – 2001. –
Vol. 63. – pp. 245106.
70. Wu Z. and Ruden P.P. Self-consistent calculation of the electronic
structure of semiconductor quantum wires: Semiclassical and quantum mechanical
approaches // J. Appl. Phys. – 1993. – Vol. 74. – № 10. – pp. 6234 – 6241.
71. Марчук Г. И. Методы вычислительной математики. – М.: Глав.
ред. физ.-мат. лит. изд-ва «Наука», 1977. – 456 с.
72. Deutsch T., Genovese L. Wavelets for electronic structure calculations
// Collections SFN. – 2011. – Vol. 12. – pp. 33-76.
73. Попонин В.С., Кошеутов А.В., Григорьев В.П., Мельникова В.Н.
Метод спектральных элементов для решения плоских задач динамики вязкой
жидкости на неразнесённых неструктурированных сектах // Известия
Томкого политехнического университета. Математика и механика. Физика. –
2010. – Т. 317. – № 2. – с. 31-36.
74. Schneider R., Weber R. Wavelets for density matrix computation in
electronic structure calculation // Applied Numerical Mathematics. – 2006. – Vol.
56. – pp. 1383-1396.
151
75. Genovese L., Neelov A., Goedecker S., Deutsch T., Ghasemi S. A.,
Willand A., Caliste D., Zilberberg O., Rayson M., Bergman A. and Schneider R.
Daubechies wavelets as a basis set for density functional pseudopotential
calculations // J. Chem. Phys. – 2008. – Vol. 129. – № 1. – pp. 014109 – 014123.
76. Li G. and Aluru N. R. Hybrid techniques for electrostatic analysis of
nanoelectromechanical systems // J. Appl. Phys. – 2004. – Vol. 96. – № 4. – pp.
2221 – 2231.
77. Cheng C., Liu Q. H., Lee J. H. and Massoud H. Z. Spectral element
method for the Schroedinger-Poisson system // Journal of Computational
Electronics. – 2004. – Vol. 3. – p. 417.
78. Trellakis A., Galick A. T., Pacelli A., Ravaioli U. Iteration scheme for
the solution of the two-dimensional Schrödinger-Poisson equations in quantum
structures // J. Appl. Phys. – 1997. – Vol. 81. – № 12. – pp. 7880 – 7884.
79. Cooke S. J., Vlasov A. N., Levush B. , Chernyavskiy I. A., Antonsen
T. M. GPU-accelerated 3D time-domain simulation of vacuum electron devices //
IVEC '11 Proceedings of the 2011 IEEE International Vacuum Electronics
Conference. – 2011. – pp. 305-306.
80. Tomono H., Aoki M., Iitaka T. and Tsumuraya K. Implementation of
GPU-FFT into Planewave Based First Principles Calculation Method // Journal of
Computational Science and Technology. – 2011. – Vol. 5. – № 3. – pp. 89-105.
81. Воеводин В. В., Воеводин Вл. В. Параллельные вычисления. –
СПб.: БХВ-Петербург, 2004. – 608 с.: ил.
82. R. B. Lehoucq, D. C. Sorensen, and C. Yang, ARPACK USERS
GUIDE: Solution of Large Scale Eigenvalue Problems by Implicitly Restarted
Arnoldi Methods, SIAM, Philadelphia. – 1998. Интернет-сайт проекта ARPACK
http://www.caam.rice.edu/software/ARPACK/.
83. Donoho D.L., Maleki A., Rahman I.U., Shahram M.,
Stodden V. Reproducible Research in Computational Harmonic Analysis //
Computing in Science & Engineering. – 2009. – Vol. 11. – Issue 1. – pp. 8-18.
152
84. Multidimensional Quantum Mechanics with Trajectories; ed. D. V.
Shalashilin and M. P. de Miranda. – CCP6, Daresbury Laboratory. – 2009.
85. Quantum Trajectories; ed. Keith H. Hughes and Gérard Parlant. –
CCP6, Daresbury Laboratory. – 2011.
86. Sabathil M., Laubsch A., Linder N. Self-consistent modeling of
resonant PL in InGaN SQW LEDstructure // Proc. of SPIE. – Vol. 6486. – pp.
64860V-1 – 64860V-9.
87. Интернет-сайт разработчиков проекта вычислительного
программного комплекса SiLENSe http://www.semitech.us/products/SiLENSe/.
88. Интернет-сайт разработчиков проекта вычислительного
программного комплекса SIESTA http://www.icmab.es/siesta/.
89. Soler J. M., Artacho E., Gale J. D., García A., Junquera J., Ordejón P.,
Sánchez-Portal D. The SIESTA method for ab initio order-N materials simulation
// Journal of Physics: Condensed Matter. – 2002. – Vol. 14. – Issue 11. – pp. 2745–
2779.
90. Шилдт Г. C# 4.0: полное руководство.: Пер. с англ. – М.: ООО
«И.Д. Вильямс», 2011. – 1056 с.
91. Джосьютис Н. C++ Стандартная библиотека. Для
профессионалов. – СПб.: Питер, 2004. – 2004. –730 с.
92. Эхтер Ш., Робертс Дж. Многоядерное программирование. –
СПб.: Питер, 2010. – 316 с.
93. Топорков В. В. Модели распределённых вычислений. – М.:
ФИЗМАТЛИТ, 2004. – 320 с.
94. Чадов С.Н. О решении СЛАУ методом итераций Чебышёва на
графических процессорах // Вестник ИГЭУ. – 2010 г. – Вып. 3. – с. 1-3.
95. Котов В.Е. О связи алгебраических и архитектурных аспектов
параллельных вычислений. – В кн.: Вычислительные процессы и системы.
Под ред. Г.И. Марчука. – М.: Наука, 1983. – С. 54-80.
96. Аксайская Л.Н. Разработка и исследование параллельных схем
цифровой обработки сигналов на основе минимизации временной сложности
153
вычисления функций // Автореферат диссертации на соискание ученой
степени кандидата технических наук. – Таганрог: ТТИ ЮФУ, – 2008.
97. Ромм Я.Е., Голиков А.Н. Распараллеливаемые кусочно-
полиномиальные схемы аппроксимации функций, производных и
вычисления определённых интегралов с повышенной точностью / ТГПИ. –
Таганрог, 2010. – 139 с. Деп. в ВИНИТИ 27.04.2010, № 230-В2010.
98. Ромм Я.Е., Голиков А.Н. Кусочно-полиномиальная схема
вычисления функций и определенных интегралов с повышенной точностью /
Известия ЮФУ. Технические науки. Тематический выпуск «Методы и
средства адаптивного управления в электроэнергетике» – 2011. – № 2. – С. 38
– 44
99. Березин И.С., Жидков Н.Г. Методы вычислений. – Т. 1. – М.:
Наука, 1970. – 464 с.
100. Ромм Я.Е., Фирсова С.А. Минимизация временной сложности
вычисления функций с приложением к цифровой обработке сигналов. –
Таганрог: Изд-во Таганрог. гос. пед. ин-та, 2008. – 125 c.
101. Ромм Я.Е. Бесконфликтные и устойчивые методы
детерминированной параллельной обработки / Диссертация на соискание
ученой степени доктора технических наук. – Таганрог: ТРТУ, 1998. – 546 с.;
ВНТИ Центр. – № 05.990.001006.
102. Ромм Я.Е., Голиков А.Н. Идентификация динамических
характеристик микрообъекта в бесконечно глубокой потенциальной яме //
Известия вузов. Северо-Кавказский регион. Технические науки, раздел
«Управление, вычислительная техника и информатика». – 2009. – №6. – С. 29
– 35.
103. Seino K. and Bechstedt F. Effective density of states and carrier
masses for Si/SiO2 superlattices from first principles // Semicond. Sci. Technol. –
2011. – Vol. 26. – pp. 014024.
104. Росадо Л. Физическая электроника и микроэлектроника. – М.:
Высшая школа, 1991. – 351 с.
154
105. Голиков А.Н. Самосогласованный расчёт электрон-фононного
рассеяния в GaAs нанопроволоках на основе кусочно-полиномиальных схем
/ ТГПП. – Таганрог, 2011. – 123 с. Деп. в ВИНИТИ 14. 11. 2011, № 488-
В2011.
106. Салтыков А.И. Новые программы вычисления элементарных
функций на БЭСМ - 6. - Дубна, 1976. - 48 с. (Препринт Объед. ин-т ядерн.
исслед.: 011-8612).
107. Люстерник Л.А., Червоненкис О.А., Ямпольский А.Р.
Математический анализ. Вычисление элементарных функций. - М.:
Физматгиз, 1963. - 248 с.
108. Ромм Я.Е., Джанунц Г.А., Разностно-полиномиальный метод
численного решения систем обыкновенных дифференциальных уравнений и
уравнений в частных производных / ТГПИ. – Таганрог, 2011. – 59 с. Деп. в
ВИНИТИ 20.07.2011, № 353-В2011.
109. Корн Г., Корн Т. Справочник по математике (для научных
работников и инженеров). – М.: Наука. Главная редакция физико-
математической литературы, 1974. – 832 с. – с илл.
110. Солодовников В.И. Верхние оценки сложности решения систем
линейных уравнений // Теория сложности вычислений. 1: Записки научных
семинаров ЛОМИ АН СССР. Л., 1982. Т. 118. С. 159–187.
111. Golikov A. N. A piecewise polynomial computer scheme for
approximation of functions and double integrals on a circle / Materiály VIII
mezinárodní vědecko - praktická conference «Aplikované vědecké novinky -
2012». - Díl 12. Matematika. Fyzika. Moderní informační technologie. Výstavba a
architektura: Praha. Publishing House «Education and Science» s.r.o, 2012 – 88 s.
112. Голиков А.Н. Компьютерный кусочно-полиномиальный метод
приближения функций двух переменных, частных производных и двойных
интегралов по кольцевому сектору // Обозрение прикладной и
промышленной математики. 2012. – Т.19. – Вып. 4.
155
113. Голиков А.Н. Кусочно-полиномиальные схемы вычисления
функций двух переменных, частных производных и двойных интегралов на
основе интерполяционного полинома Ньютона // ТГПИ. – Таганрог, 2010. –
150 с. Деп в ВИНИТИ 20.09.2010, № 528-В2010.
114. Голиков А.Н. Кусочно-полиномиальная схема аппроксимации
функций двух переменных, частных производных и двойных интегралов с
повышенной точностью // Известия ЮФУ. Технические науки. Тематический
выпуск «Компьютерные и информационные технологии в науке, инженерии
и управлении» – 2011. – № 5. – С. 179 – 186.
115. M.-J. Lai and L. L. Schumaker, A domain decomposition method for
computing bivariate spline _ts of scattered data // SIAM J. Numer. Anal. – 2009. –
Vol. 47. – pp. 911-928.
116. Завьялов Ю.С., Квасов Б.И., Мирошниченко В.Л. Методы
сплайн-функций. – М.: Наука. Главная редакция физико-математической
литературы, 1980.
117. G. Jaklič, J. Kozak, M. Krajnc, V. Vitrih, E. Žagar, On geometric
Lagrange interpolation by quadratic parametric patches. – Comput. Aided Geom.
Design. – 2008. – Vol. 25. – pp. 373 – 384.
118. D. Liu and G. Xu, Angle Deficit Approximation of Gaussian
Curvature and Its Convergence over Quadrilateral meshes. – Comput.-Aided
Design. – 2007. – Vol. 39. – pp. 506 – 517.
119. P. Sablonni_ere, On some multivariate quadratic spline
quasiinterpolants on bounded domains, in: W. Hausmann & al. (Eds.), Modern
developments in multivariate approximations, ISNM Vol. 145, Birkh• auser
Verlag, Basel, 2003, pp.263-278.
120. P. Sablonnière, Quadratic spline quasi-interpolants on bounded
domains of Rd, d = 1, 2, 3, Rend. Sem. Mat. Univ. Pol. Torino 61, no. 3 (2003), pp.
229-246.
121. Adachi S. Properties of Semiconductor Alloys: Group-IV, III–V and
II–VI Semiconductors. – John Wiley & Sons, 2009. – 400 pp.
156
122. Cuesta J. A., Sánchez A. and Domínguez-Adame F. Self-consistent
analysis of electric field effect on Si  -doped GaAs // Semicond. Sci. Technol. –
1995. – Vol. 10. – 1303 – 1309.
123. Fundamental Physical Constants – Frequently used constants //
http://physics.nist.gov/constants. – 2010.
124. Pässler R. Semi-empirical descriptions of temperature dependences of
band gaps // Phys. stat. sol. b. – 2006. – Vol. 236. – № 3. – pp. 710 – 728.
125. Pässler R. and Oelgart G. Appropriate analytical description of the
temperature dependence of exciton peak position in GaAs / Al xGa1 x As multiple
quantum wells and the 8v  6c gap of GaAs // J. Appl. Phys. – 1997. – Vol. 82. –
№ 5. – pp. 2611 – 2616.
126. Vina L., Logothetidis S. and Cardona M. Temperature dependence of
the dielectric function of germanium // Phys. Rev. B. – 1984. – Vol. 30. – p. 1979
– 1991.
127. Varshni Y. P. Temperature dependence of the energy gap in
semiconductors // Physica. – 1967. – Vol. 34. – pp. 149 – 154.
128. Takagaki Y. and Ploog K. Self-consistent energy levels in low-
dimensionally delta-doped structures // J. Phys.: Condens. Matter. – 1995. – Vol. 7.
– № 4. – pp. 731.
129. Shim S. Y., Lee Y. K., Kim D. C. and Yoo K. H. Comparison of
effective potential method and Rayleigh-Ritz method for the calculation of energy
of Quantum wires // Journal of the Korean Physical Society. – 1999. – Vol. 34. –
pp. 36 – 41.
130. Борздов А. В., Поздняков Д. В., Борздов В. М., Орликовский А.
А., Вьюрков В. В. Моделирование влияния поперечного электрического поля
на дрейфовую скорость электронов в GaAs квантовой проволоке //
Микроэлектроника. – 2010. – Т. 39. – № 6. – с. 436 – 442.
131. Рюмин О. Г. Разработка и исследование алгоритмов
распознавания изображений на основе определения экстремальных
признаков замкнутых контуров с помощью сортировки // Автореферат
157
диссертации на соискание ученой степени кандидата технических наук. –
Таганрог: ТТИ ЮФУ, – 2008. – 16 с.
132. Ромм Я. Е., Тюшнякова И. А. Применение сортировки для поиска
нулей и особенностей функций с приложением к идентификации плоских
изображений. – Таганрог: Изд. центр Таганрог. гос. пед. ин-та. – 2009. – 172
с.
133. Khan H. R., Mamaluy D., Vasileska D. Quantum Transport
Simulation of Experimentally Fabricated Nano-FinFET // IEEE Transactions on
electron devices. – 2007. – Vol. 54. – № 4. – pp. 784 – 796.
134. Pennington G. and Goldsman N. Monte Carlo study of electron
transport in a Carbon nanotube // IEICE Trans. Electron. – 2003. – Vol. E86-C. –
№ 3. – pp. 372 – 377.
135. Голиков А.Н. Компьютерное моделирование рассеяния
электронов в p-GaAs нанопроволоке в поперечном электрическом поле на
основе кусочно-полиномиальных схем // «Опто-, наноэлектроника,
нанотехнологии и микросистемы»: Труды XV международной конференции.
– Ульяновск: УлГУ, 2012.
136. Голиков А.Н. Приближенное решение самосогласованной
системы уравнений Шредингера и Пуассона для нанопроволоки на основе
кусочно-полиномиальных схем // Обозрение прикладной и промышленной
математики. 2012. – Т.19. – Вып. 2. – с. 245 – 246.
137. Голиков А.Н. Компьютерное моделирование электронного
транспорта в нанопроволоках на основе кусочно-полиномиальных методов /
Математическое и компьютерное моделирование естественнонаучных и
социальных проблем: сборник статей VI Международной научно-
технической конференции молодых специалистов, аспирантов и студентов. –
Пенза: Приволжский Дом Знаний, 2012. – С. 177 – 179.
138. Голиков А.Н. Решение самосогласованной системы уравнений
Шрёдингера и Пуассона для транзисторной структуры p-GaAs/AlAs на
основе кусочно-полиномиальных методов // Микроэлектронные
158
информационно-управляющие системы и комплексы: материалы
Международной молодежной конференции в рамках фестиваля науки. –
Воронеж: ИПЦ «Научная книга», 2012. – 148 с.
139. Голиков А.Н. Моделирование электрон-фононного рассеяния в
p-GaAs/AlAs транзисторной структуре на основе распараллеливаемых
кусочно-полиномиальных схем и сортировки // Летняя Суперкомпьютерная
Академия: материалы Международной молодежной научной школы. –
Воронеж: ИПЦ «Научная книга», 2012. – 88 с.
159

ПРИЛОЖЕНИЕ К ГЛАВЕ 1

4.1. Схема вычисления коэффициентов полинома по его корням [1]. Ниже


излагаются детали построения схемы (1.23) [1]. Схема является модифицированным
преобразованием Виета, инвариантным относительно степени входного полинома.
Каждое произведение вида
j 1
Rn , j t    (t  ) (4.1)
 0
есть разложение полинома с некоторыми постоянными коэффициентами
Rn, j t   d0, j  d1, j t  d 2, j t 2  ... d n, j t n . (4.2)
Значения d  , j ,   0, j , из (1.24) для всех полиномов (4.1) определяются
следующим образом [1].
Из (4.1) и (4.2) следует равенство
d 0 j  d1 j t  ... d n j t n  t  0t 1t  n 1 . (4.3)
Вводятся обозначения zl  l , l  0, 1,..., n  1 , в которых (4.3) примет вид
d 0 j d1 j t  ... d n j t n  t  z0 t  z1 t  z n1 . (4.4)
В левой части (4.4) коэффициенты восстанавливаются по значениям корней
z0 , z1 ,  , zn 1 с помощью формул Виета или по формулам Ньютона [2, 3].
Коэффициенты полиномов (4.3) и (4.4) не зависят от вида аппроксимируемой функции,
следовательно, после вычисления их можно сделать хранимыми в памяти компьютера для
всех использований интерполяции по Ньютону с равным шагом h в (1.12).
Классические схемы вычисления коэффициентов не вполне удобны ввиду различия
входных операций для шагов алгоритма в зависимости от степени полинома n .
Непосредственно ниже излагается алгоритм, не содержащий различия между шагами по
составу входных операций [1].
Пусть сначала рассматривается случай n  1 , тогда полином (4.1) примет вид
R 1, j t   t  z 0 , полином (4.2), соответственно, – R 1, j t   e11t  e10 , где
e10   z 0 , e11  1. (4.5)
Тогда при n  2 получаем равенство (4.1) в виде
R2, j t   t  z 0  t  z1   R 1, j t  t  z1  ,
откуда в обозначениях (1.27) после раскрытия скобок получим
R2, j t   R 1, j t  t  z1   e11t  e10t  e11t  e10  z1  . (4.6)
С другой стороны равенство (4.2) при n  2 имеет вид
R2 j t   e22t 2  e21t  e20 ,
где
e22  e11 , 

e21  e10  e11 z1 , (4.7)
e20   e10 z1 . 
Пусть в ходе описанного процесса вычислены коэффициенты полинома k  1 -й
степени
Rk 1, j t   ek 1,k 1t k 1  ek 1,k 2t k 2  ... ek 1,1t  ek 1,0 ,
тогда для полинома k -й степени справедливо соотношение
k 1
Rk j t    t  z r   Pk 1 j t   t  z k 1  . (4.8)
r 0
160
Раскрывая скобки в равенстве (4.8) по аналогии с (4.6) запишем
Rkj t   ek 1k 1t k 1  ek 1k  2 t k  2    ek 10   t  ek 1k 1t k 1 
 ek 1k  2 t k  2    ek 1 0   ( z k 1 )  ekk t k  ek k 1t k 1    ek 0 .
(4.9)

Приравняв коэффициенты при одинаковых степенях в (4.9), получим k -й шаг


описываемого алгоритма
ek , k  ek 1,k 1 , 

ek ,k 1  ek 1,k  2   ek 1,k 1 z k 1 , 
ek ,k  2   ek 1,k 3   ek 1,k  2  z k 1 , 

...  (4.10)
ek ,k    ek 1,k  1  ek 1,k   z k 1 ,

... 

ek , 0  ek 1, 0 z k 1 , 
где ek , k  e( k 1),( k 1)  e( k  2 ),( k  2 )  ...  e1,1  1 .
В (4.10)   1, k  1 при изменении значений k  2, n . При k  2,   1 (4.10)
включает (4.7). В случае, когда k  n левые части (4.10) совпадут с искомыми значениями
коэффициентов полинома (4.2).
Схему (4.10) можно представить в матричной форме [1]:
 
 
 1 0 0  0 0 
 ek , k  
   xk 1 1 0  0 0   e k 1,k 1 
 ek ,k 1     
e   0  xk 1 1      e k 1,k  2  
 k ,k  2     0 
 0  xk 1  k  1 0 0   . (4.11)
     

 e     0

1 0   e k 1,1 
     
 xk 1
k ,1
 ek , 0       1   e k 1, 0 
   0   xk 1 
 0
 
0 0

 k 
Замена в (4.11) k на k  1 позволит в аналогичной форме представить вектор из
правой части. Рекуррентный процесс таких замен и соответственных подстановок влечет
явное выражение при k  n коэффициентов многочлена (4.1) через все его n нулей
xn 1 , xn  2 ,  , x 1 , x 0 :
  
  
 1 0  0 0   
  
1 
 x 1 0 0 0
0 0    
 n 1
   xn  2 1  0 0 
 en   0  xn 1    
 0  xn  2 
      
 en 1   0 0       
 0
     
 n 1
0 0  
0 n 0 0 
 
 e   0      1 0 
 0   0  1 0  
   0 0   xn  2 1 
 0 0   xn 1 1   
    0 0  0  xn  2 
 00  0
  x n 1 
         
   
   n 1 
 n 
161
 1 0 0 
   1 0 
  x2 1 0     1 
    x 1    . (4.12)
 x2 1    
1
0 x
   0  x1   0 
 0  
 0 x 2

Каждый нуль многочлена повторяется на поддиагонали одной и только одной


матрицы из (4.12), диагональ всегда состоит из единиц. Число элементов диагонали и
поддиагонали совпадают, поскольку число строк матрицы на единицу больше числа
столбцов. Размерность на единицу возрастает справа налево.
Свернув левую часть равенства (4.12), получим схему (1.23).
Применение описанной схемы для расчета коэффициентов полинома (1.24)
позволяет хранить их значения для дальнейшего использования при вычислении функций.
Подпрограмма-функция, реализующая схему (1.23) на языке C++ приводится
непосредственно ниже, –
//---------------------------------------------------------------------------
//----------- Вычисление коэффициентов полинома по его корням --------(OK)---
//-----------при помощи модифицированного преобразования Виета --------------
//---------------------------------------------------------------------------
void Viete(mass2_INT d,
mass3_INT y,
long const jp,
long const n)
{
mass2_INT e;
e[1][1]=1; e[1][0]=-y[0];
for (int i=2; i<=n; i++) {
e[i][0]=-e[i-1][0]*y[i-1];
for (int j=1; j<i; j++) e[i][i-j]=e[i-1][i-j-1]-e[i-1][i-j]*y[i-1];
e[i][i]=e[i-1][i-1];
}
for (int i=0; i<=jp; i++) d[i][jp]=e[jp][i];
}

В представленном виде схема (1.23) реализованная приведённым алгоритмом


используется при аппроксимации функций одной и двух действительных переменных.
4.2. Доказательство равномерной сходимости изложенного метода
приближённого вычисления определённых интегралов. Ниже приводится
доказательство теоремы 1.4.
Пусть на время рассуждений считается, что коэффициенты (1.37) полинома (1.36)
вычислены в рамках изложенного подхода, а также справедлива теорема 1.1.
Интегрирование равенств (4.13), (4.14) по аналогии с (1.81) влечёт
~ ~ ~
P 1 xi 1 P 1 xi 1 P 1 xi 1

  f x dx    P x dx    R x dx ,


i  0 xi i  0 xi
fwd
ni
i  0 xi
fwd
ni (4.27)
~ ~ ~
P 1 x i 1 P 1 xi 1 P 1 x i 1

  f x dx    P x dx    R x dx .


i  0 xi i  0 xi
bkw
ni
i  0 xi
bkw
ni (4.28)

Сложим равенства (4.27), (4.28), получим


~
P 1 x i 1  P~ 1 xi1 fwd P 1 x i 1  P~ 1 xi1 fwd P 1 xi 1
2  f x dx     Pn i x dx    Pn i x dx     Rn i  x dx    Rnbkw
bkw
i  x dx ,
 i 0 x  i 0 x
i  0 xi  i
i  0 x i  i
i  0 x i

откуда следует выражение


~
P 1 xi 1  P~ 1  xi1 xi 1
  P~ 1  xi1 fwd xi 1

 
2  f x dx    Pn i x dx   Pn i x dx    Rn i x dx   Rnbkw i  x dx .
 fwd bkw    (4.29)
 i 0  x    
i  0 xi
  i x i   i  0  x i x i 
Так как полиномы Pn i x, Pn i x  , Rn i x, Rnbkw
fwd bkw fwd
i x  есть непрерывные функции

переменной x , то существует [4] интеграл вида


162
xi 1

 P x   P x dxdx ,
fwd bkw
ni ni
xi

поэтому из (4.29) получаем


~ ~ ~
P 1 xi 1 P 1 x i 1 P 1 x i 1
2  f x dx    P x   P x dx    R x   R x dx .
fwd bkw fwd bkw
ni ni ni ni (4.30)
i  0 xi i  0 xi i  0 xi

Деление соотношения (4.30) на 2 и внесение множителя 1 2 под знак суммы и


интеграла влечёт
P 1 x i 1 P fwd  x   P bkw  x  P 1 xi 1 R fwd  x   R bkw  x 
~ ~
P 1 xi 1

  f x dx    ni ni
dx    n i ni
dx ,
i  0 xi i  0 xi 2 i  0 xi 2
откуда с учётом (1.5) следует
i  x   Rn i  x 
~ ~ ~
P 1 xi 1 P 1 xi 1 P 1 xi 1 Rnfwd bkw

 f x dx    Pn i x dx    dx . (4.31)


i  0 xi i  0 xi i  0 xi 2
Заметим, что
i  x   Rn i  x 
Rnfwd bkw

Rn i  x    f  x   Pn i  x  , (4.32)
2
~
где i  0, P  1 .
В обозначениях (4.32) запишем выражение (4.31) в виде
~ ~ ~
P 1 x i 1 P 1 x i 1 P 1 x i 1

  f x dx    P x dx    R x dx .


i  0 xi i  0 xi
ni
i  0 xi
ni (4.33)

Так как сумма непрерывных функций f x  , Pn i x  – есть функция непрерывная [4], и так
как всякая непрерывная функция интегрируема [4], то существует интеграл
xi 1

  f x   P x dx , поэтому из равенства (4.33) следует


xi
ni

~ ~
P 1 xi 1 P 1 xi 1

   f x   P x dxdx    R x dx .
i  0 xi
ni
i  0 xi
ni (4.34)

Для подынтервала xi , xi 1  из (1.2) справедливо соотношение


xi 1 xi 1

  f x   P x dxdx   R x dx ,
xi
ni
xi
ni

откуда получается равенство


xi 1 xi 1

  f x   P x dxdx
xi
ni   R x dx
xi
ni . (4.35)

b b
По свойству интеграла [4]:  f  x dx   f  x  dx , оценка правой части (4.35) будет
a a

иметь вид
xi 1 xi 1

 R x dx
xi
ni  
xi
Rn i  x  dx ,

тогда для левой части выражения (4.35) справедливо неравенство


xi 1 xi 1

  f x   P x dxdx
xi
ni  
xi
Rn i  x  dx . (4.36)
163
Из равенств (4.32) и оценки (1.49) вытекает соотношение
M k ,i 
Rn i  x   k nn 1 , (4.37)
2
 k ,i 
где M n из (1.57).
Так как неравенство выполняется для x  a, b, а значит и для x  xi , xi 1  , то по
свойству определённого интеграла [4] из (4.37) следует
M nk ,i 
xi 1 xi 1

x n i
R  x  dx  x 2k n1 dx , (4.38)
i i

где M n k ,i  из (1.57).
С учётом неравенства (4.38) оценка (4.36) примет вид
M nk ,i 
xi 1 xi 1

  f x   P x dxdx
xi
ni  
xi
2 k n 1
dx . (4.39)

Правая часть соотношения (4.39) преобразуется по цепочке


M nk ,i  M nk ,i  i1 M nk ,i  M nk ,i  b  a 
xi 1 x

 2k n1  
2 k n 1 xi
dx  dx  x  x  ,
2 k n 1 2 k n 1 2 k
i 1 i
xi

после чего оценка (4.39) запишется в виде


M nk ,i  b  a 
xi 1

  f x   P x dxdx
xi
ni 
2 k n 1 2 k
, (4.40)

где M n k ,i  из (1.57).
Просуммируем неравенства (4.40) по всем P  2k подынтервалам (1.2), получим
2 k 1 xi 1
M   b  a 
 
2 k 1 k ,i

  f  x   P  x dx dx  2   2 .
ni
n
k n 1 k
(4.41)
i 0 xi i 0

Применяя к соотношению (4.41) свойство модуля [4] по аналогии с (4.25), запишем


2 k 1 xi 1 2 k 1 xi 1
M   b  a 
   f x   P x dxdx  
2 k 1 k ,i

ni    f  x   P  x dx dx 
ni2   2 , n
k n 1 k
i  0 xi i 0 xi i 0

откуда следует оценка левой части равенства (4.41)


b 2 k 1 xi 1
M nk ,i  b  a 
2 k 1

 f  x dx    Pn i  x dx   k  n 1


. (4.42)
a i  0 xi i 0 2 2k
Преобразование суммы в правой части выражения (4.42) влечёт
2 k 1

b  M   b  a 
2 k 1 xi 1 n
k ,i

 f x dx    P x dx  2   2 ,
i 0
ni k n 1 k
(4.43)
a i  0 xi

 k ,i 
где M n из (1.57).
В обозначении
 n  b  a  max M nk ,i  (4.44)
i0, P 1

справедлива цепочка рассуждений вида


2 k 1 2 k 1
b  a  M n  k ,i 
 b  a   n  b  a 2 k  n ,
i 0 i 0
из которой следует неравенство для правой части (1.104) вида
164
2 k 1

 M   b  a 
n
k ,i
n 2k
i 0
 ,
2 k n 1 2k 2 k n 1 2k
тогда окончательно оценка (4.42) примет вид
b 2 k 1 xi 1

 f x dx    P x dx  n
ni k  n 1
. (4.45)
a i  0 xi 2
Правая часть неравенства (4.44) мажорирует ошибку приближённого вычисления
определённого интеграла от функции (1.1) и так как справедливы рассуждения вида
n b 2 k 1 xi 1
lim
k  2 k n 1
 0  lim
k   f x dx    P x dx
a i  0 xi
ni 0,

то схема (1.62), (1.63) с коэффициентами (1.37) обладает равномерной сходимостью на


отрезке интегрирования в зависимости от числа подынтервалов, скорость сходимости
имеет оценку (4.45), что и требовалось доказать.
4.3. Об аппроксимации функций, их производных и определённых интегралов
кусочно-полиномиальными схемами на основе ортогональных полиномов.
Классические ортогональные полиномы могут стать базой кусочно-полиномиальных схем
аналогично интерполяционным полиномам [5]. Основой подхода является формула
разложения функции в ряд по ортогональным полиномам Qk  x  на отрезке a, b [6]:

f  x    Ak Qk , (4.46)
k 0
где
n

 Q x  f x  x 
k i i i
Ak  i 0
n
, (4.47)
 Q x  x 
i 0
2
k i i

здесь x i – корни полиномов Qk  x  ,  x  – весовая функция. В (4.46) функция должна


быть непрерывна на a, b , иметь кусочно-непрерывную производную, а также должны
сходиться интегралы
b b

 f 2 x  x dx и   f x  x  xdx ,


2

a a

где  x  x  – весовая функция для производных от полиномов Qk  x  [7].


Представляя полиномы в виде
k
Qk  x    pik  x i , (4.48)
i 0

и приводя подобные при равных степенях x в (4.46), можно получить каноническую


форму полинома аппроксимирующего функцию f x  . Коэффициенты pk i могут быть
априори вычислены и сохранены в памяти компьютера.
Так в случае полиномов Чебышева первого рода будем иметь схему [8]:
165
n

f x  
1
A0   Ar Tr y, 
2 r 1

2 n 2  1 r  
Ar   f xi  cos 2n  2 , ,
n  1  0 (4.49)
r  0, 1, , n, 

2 x  xi 1  xi 
y , 
xi 1  xi 
где x i , xi 1 – границы i -го подынтервала (1.2).
Для полинмов Чебышева справедливо рекуррентное соотношение
T1 x   x, T2 x   2 x 2  1, Tr x   2 xTr 1 x   Tr  2 x , r  3, 4,  (4.50)
Приведя подобные в (4.49) с учётом (4.50) и вида y , получим
T1  y   y, T2  y   2 y 2  1, 


S 0  y   A 0 , S1  y   A 0  A1 y, ...,
1 1
(4.51)
2 2 
S r  y   S r 1  y   Pr  y  , 
где
Pr  y   A r Tr  y ,
 (4.52)
Tr  y   2 yTr 1  y   Tr  2  y  .
Числовые коэффициенты (4.52) определяются по следующим соотношениям
S 0  y   A 0 , S1  y   A 0  A1 y.
1 1
2 2
Если уже найдены числовые коэффициенты многочленов
r 1
S r 1  y    ar 1 y  ,
0
r 1 r 2
Tr 1  y    br 1 y  , Tr  2  y    ar  2  y  ,
 0  0
то для многочлена
r
Tr  y    br  y 
 0

коэффициенты b (r )
 выразятся через них по рекуррентным уравнениям
r r 1 r 2

 br  y   Tr  y   2 y Tr 1  y   Tr 2  y    2br 1 y  1   br 2  y  


 0  0  0
r r 2
  2br11 y    br  2  y  .
 0  0
Следовательно
b0r   b0r  2  , 

br   2 br11  br  2  , 1    r  2,
 (4.53)
brr1  2 brr21 , 
brr   2 brr11 . 

Из (4.51), (4.52)
r 1 r
S r  y   S r 1  y   A r Tr  y    ar 1 y    A r b( r ) y  .
 0  0
166
Поэтому
ar   ar 1  A r br  , 0    r  1,

 (4.54)
arr   A r br( r ) , r  3, 4, , n . 

Окончательно, при x  xi , xi 1 
n
f  x   PТ n  y    cif y  ,
 0
где
cif  an  ,   0, 1, , n, (4.55)
n 
и a получается из (4.54) при r  n .
Начальные значения в дополнение к (4.54) непосредственно вытекают из (4.49) -
(4.54):
1 1
a0(1)  A 0 , a1(1)  A1 , A(02)  A 0  A 2 , a1( 2)  A1 , A(22)  2 . (4.56)
2 2
Рассуждая аналогично, можем прийти к аппроксимационной схеме [8] на основе
полиномов Лежандра P  x  , для которых
2n  1 
A   f x P x 
2 i 1
(4.57)

Представляя полиномы P  x  в виде (4.48), получим приближение:


n 
f  x    A  p j  x j .
 0 i 1

где, приведя подобные при x , окончательно запишем аппроксимационную схему


 n

 f  x    an  x  ,
  0
 n
(4.58)
 a n  
  
k 0
Ak p . k

Коэффициенты pk находятся из рекуррентного соотношения


n  1Pn 1 x   2n  1xPn x   nPn 1 x  ,
отсюда
Pn 1 x  
2n  1 xP x   n P x  ,
n  1 n n  1 n 1
представляя полиномы Pn  x  в виде (72) и выписывая коэффициенты при равных
степенях, окончательно запишем
 n 1 n n 1
 p0   n  1 p0 ,

 n 1 2n  1 n n
 pi  pi 1  pin 1 , i  1,2,...,n  1, (4.59)
 n  1 n  1
 n 1 2n  1 n
 p j  n  1 p j 1 , j  n, n  1.

При этом начальные значения имеют вид:
p00  1, p01  0, p11  2.
Таким образом, выражения (4.57)-(4.59) представляют собой схему
аппроксимации на основе полиномов Лежандра.
167
Численный эксперимент показал сопоставимую точность аппроксимации функций,
их производных и вычисления определённых интегралов для обеих схем – (4.49), (4.58).
Непосредственно ниже представлены результаты аппроксимации функции y  sin  x  , её
производной и обсуждение численного интегрирования по схеме на базе полиномов
Чебышева.

Таблица 1
Абсолютная погрешность аппроксимации функции y  sin  x 
по схеме на основе полиномов Чебышева
Значение приближающего Абсолютная
Значение аргумента x f
полинома S n погрешность
0.00000000000000E+0000 4.79425538604210E-0001 6.81312645189891E-0015
1.00000000000000E-0001 5.22687228930652E-0001 6.83361787295889E-0015
2.00000000000000E-0001 5.64642473395033E-0001 2.24668374182446E-0015
3.00000000000000E-0001 6.05186405736037E-0001 2.40817565541618E-0015
4.00000000000000E-0001 6.44217687237683E-0001 8.42246194662777E-0015
5.00000000000000E-0001 6.81638760023344E-0001 9.68680431007174E-0015
6.00000000000000E-0001 7.17356090899513E-0001 9.37872826275998E-0015
7.00000000000000E-0001 7.51280405140290E-0001 2.98930801986841E-0015
8.00000000000000E-0001 7.83326909627480E-0001 3.11697282567858E-0015
9.00000000000000E-0001 8.13415504789363E-0001 1.06345054290413E-0014

Из табл. 1 видно, что схемы на основе ортогональных полиномов сравнимы по


точности со схемами на основе интерполяционных полиномов с центральными
разностями и уступают схемам на основе интерполяции по Ньютону на 4-5 десятичных
порядков.

Таблица 2
Абсолютная погрешность аппроксимации
производной функции y  sin  x 
по схеме на основе полиномов Чебышева
Приближённое значение Абсолютная
Значение аргумента x производной S n погрешность  f 
0.00000000000000E+0000 8.77582447586065E-0001 1.14304308198166E-0007
1.00000000000000E-0001 8.52524546982750E-0001 2.49232438552798E-0008
2.00000000000000E-0001 8.25335534136457E-0001 8.07732215251235E-0008
3.00000000000000E-0001 7.96083885121107E-0001 8.65720506759249E-0008
4.00000000000000E-0001 7.64842156565351E-0001 3.07191377202777E-0008
5.00000000000000E-0001 7.31688706358000E-0001 1.62515821123285E-0007
6.00000000000000E-0001 6.96706743553023E-0001 3.42058571130332E-0008
7.00000000000000E-0001 6.59983038412975E-0001 1.07472007605043E-0007
8.00000000000000E-0001 6.21610080326036E-0001 1.12055371584353E-0007
9.00000000000000E-0001 5.81683050676702E-0001 3.87871815980649E-0008

Из табл. 2 заключаем, что абсолютная погрешность численного


дифференцирования по схеме на основе ортогональных полиномов сравнима по порядку с
абсолютной погрешностью схем на основе интерполяции с центральными разностями и
превосходит абсолютную погрешность схем на основе интерполяции по Ньютону на 7-8
порядков без учёта алгоритмов минимизации. С учётом же алгоритма минимизации
памяти преимущество модифицированной схемы возрастает до 9-10 порядков.
Как показал численный эксперимент, абсолютная погрешность численного
интегрирования по схемам на основе ортогональных полиномов сравнима с
6
погрешностью формулы трапеций и составляет величины порядка 10  10 8 , что
168
превосходит значение абсолютной погрешности формулы Симпсона и схем на основе
интерполяции с центральными разностями на 6-8 порядков, а схем на основе
интерполяции по Ньютону – на 12-14.
Объяснить большую по сравнению со схемами на основе полиномов Ньютона и
полиномов с центральными разностями абсолютную погрешность аппроксимации
функций, их производных и вычисления определённых интегралов можно тем, что они
являются по сути вариантами квадратурных формул Гаусса-Кристоффеля, а вид
коэффициентов A сводит их фактически к интерполяционной формуле Лагранжа с
выбором узлов интерполяции в нулях используемых ортогональных полиномов [9]. При
этом, как показывает численный эксперимент [10] интерполяционная формула Лагранжа
сопоставима по точности со схемами (4.49)-(4.51) и (4.57)-(4.59) и варьирование
конфигурации узлов интерполирования не позволяет улучшить её результат.
4.4. О приближении функций, производных и определённых интегралов на
основе интерполяционных полиномов с центральными разностями [8]. Аналогично
схеме (1.36), (1.37) можно построить кусочно-полиномиальные схемы аппроксимации
функций на базе полиномов с центральными разностями, которые будут отличаться от
*
названной лишь коэффициентами bi j из (1.15), (1.16).
Так в случае полиномов Гаусса для интерполяции вперёд [11]:
 i i
2
 i 1 
 2  

  i 2 ,
t  k  t  j  ,
n    
G n  f 0      (4.60)
i 1  i! k  0 j 1 
 
получим
i y i 2 ,
bi j 
*
, (4.61)
i!
Проводя рассуждения полностью аналогичные (1.15) – (1.31), получим схем
(1.28), (1.30), где вместо коэффициентов (1.15) необходимо использовать коэффициенты
(4.61).
Далее приводятся результаты приближения функции y  sin  x  и её производной,
а также интегралов по кусочно-полиномиальной схеме на базе полинома Гаусса.

Таблица 3
Абсолютная погрешность аппроксимации функции y  sin  x 
по схеме на основе полинома Гаусса
Абсолютная
Значение аргумента x Значение Gn
погрешность  f
0.00000000000000E+0000 0.00000000000000E+0000 0.00000000000000E+0000
1.00000000000000E-0001 9.98334166468717E-0002 4.35827114957273E-0014
2.00000000000000E-0001 1.98669330795083E-0001 2.16825933293044E-0014
3.00000000000000E-0001 2.95520206661318E-0001 2.15018974847325E-0014
4.00000000000000E-0001 3.89418342308608E-0001 4.25008877917576E-0014
5.00000000000000E-0001 4.79425538604203E-0001 0.00000000000000E+0000
6.00000000000000E-0001 5.64642473395282E-0001 2.46498676505225E-0013
7.00000000000000E-0001 6.44217687237761E-0001 7.03094808936211E-0014
8.00000000000000E-0001 7.17356090899471E-0001 5.21945225755160E-0014
9.00000000000000E-0001 7.83326909627398E-0001 8.54918349654787E-0014
169

Из табл. 3 видно, что схема на основе полиномов с центральными разностями


уступает схемам на основе интерполяции по Ньютону в среднем на 6-7 порядков.

Таблица 4
Абсолютная погрешность аппроксимации
производной функции y  sin  x 
по схеме на основе полинома Гаусса
Абсолютная
Значение аргумента x Значение Gn
погрешность  f
0.00000000000000E+0000 9.99999999999848E-0001 1.51582468365524E-0013
1.00000000000000E-0001 9.95004270006859E-0001 1.04728833548808E-0007
2.00000000000000E-0001 9.80066710467071E-0001 1.32625829202932E-0007
3.00000000000000E-0001 9.55336573674515E-0001 8.45489089464752E-0008
4.00000000000000E-0001 9.21060956865034E-0001 3.71378509966629E-0008
5.00000000000000E-0001 8.77582333282334E-0001 2.28608039122970E-0007
6.00000000000000E-0001 8.25336207242742E-0001 5.92333063850856E-0007
7.00000000000000E-0001 7.64842617346005E-0001 4.30061516800654E-0007
8.00000000000000E-0001 6.96706914584354E-0001 2.05237188432715E-0007
9.00000000000000E-0001 6.21609893566756E-0001 7.47039084565064E-0008

Из табл. 4 заключаем, что абсолютная погрешность численного


дифференцирования по схемам на основе полиномов с центральными разностями
превышает абсолютную погрешность схем на основе интерполяции по Ньютону в среднем
на 7-8 порядков.
Для представленных в предыдущих численных экспериментах функций
абсолютная погрешность численного интегрирования у схем на основе полиномов с
центральными разностями больше на 13-14 порядков по сравнению со схемами на основе
7
полиномов Ньютона, при этом граница абсолютной погрешности не меньше 10 .
Таким образом, численный эксперимент показывает преимущество кусочно-
полиномиальных схем на основе интерполяции по Ньютону перед схемами на базе
полиномов с центральными разностями.
4.5. Численный эксперимент аппроксимации функций и производных при
помощи исходной и модифицированной кусочно-полиномиальной схемы. Далее
приводятся результаты приближения функций, их производных и определенных
интегралов модифицированной и немодифицированной кусочно-полиномиальной схемой
с минимизацией числа подынтервалов.
Полный текст программы Modif_Polinom_Newton_Optimise_Memory ,
реализующей исходную кусочно-полиномиальную схему на основе интерполяции по
Ньютону с минимизацией объёма памяти приводится непосредственно ниже, –
program Modif_Polinom_Newton_Optimise_Memory;
{$APPTYPE CONSOLE}
uses
SysUtils, math;
CONST x0=0; xn=1; nn=11; nnk=18; nKU=8;
TYPE
mass1_=^mass1;
mass1=array [1..262144,0..nn] of extended;
mass11=array [1..262144] of extended;
mass2=array [0..nn,0..nn] of extended;
mass3=array [0..nn] of extended;
TFunc= array [1..nKU] of function(xx: extended; m: integer): extended;
bc_=array [0..nn, 0..nn] of integer;
VAR
a,aw, Ab, Bb, a2,a3: mass1_;
a00_, a00_2, a00_3 :mass11;
x,t,g,Simp,Trap: extended;
k, mm: integer;
170
fnf, FF, PFF: TFunc;
F, ofi: text;
hp_Global, hh_Global: extended;
n_Global, k_Global: integer;
ht_Global: extended;
nT_Global, kT_Global: integer;
File_: text;
b_c: bc_;
//--- y=sin(m*x) ------------------------------------------------------------
FUNCTION sinus_m (xx: extended; m: LongInt): extended;
Begin
sinus_m:= sin(xx)
End;
//--- y= 1_1_exp_2x ---------------------------------------------------------
FUNCTION F_1_exp_2x (xx: extended; m: LongInt): extended;
Begin
Result:= 1/(1+exp(2*xx))
End;
//--- y= SinusH -------------------------------------------------------------
FUNCTION SinusH (xx: extended; m: LongInt): extended;
Begin
Result:= SinH(xx)
End;
//--- y= xx_1_sin_x ---------------------------------------------------------
FUNCTION xx_1_sin_x (xx: extended; m: LongInt): extended;
Begin
Result:= xx/(1+sin(xx))
End;
//--- y= xx_cos_xx ----------------------------------------------------------
FUNCTION xx_xos_xx (xx: extended; m: LongInt): extended;
Begin
Result:= xx*cos(xx)
End;
//--- y= 1_xx_xx_xx_1 -------------------------------------------------------
FUNCTION F_xx_xx_xx_1 (xx: extended; m: LongInt): extended;
Begin
Result:= 1/((xx*xx+xx+1)*Sqrt(xx*xx+xx+1))
End;
//--- y= sin_xx_3 -----------------------------------------------------------
FUNCTION sin_xx_3 (xx: extended; m: LongInt): extended;
Begin
Result:= sin(xx)*sin(xx)*sin(xx)
End;
//--- y= xx_atg_xx ----------------------------------------------------------
FUNCTION xx_atg_xx (xx: extended; m: LongInt): extended;
Begin
Result:= xx*arctan(xx)
End;
//--- y= 1_tg_x_3 -----------------------------------------------------------
FUNCTION F_tg_x_3 (xx: extended; m: LongInt): extended;
Begin
Result:= 1/tan(xx)/tan(xx)/tan(xx)
End;
//--- Производная y=sin(m*x) ------------------------------------------------
FUNCTION D_sinus_m (xx: extended; m: LongInt): extended;
Begin
D_sinus_m:=cos(xx)
End;
//--- Производная y=1_1_exp_2x ----------------------------------------------
FUNCTION D_1_1_exp_2x (xx: extended; m: LongInt): extended;
Begin
Result:= -2*exp(2*xx)/sqr(1+exp(2*xx))
End;
//--- Производная y= SinusH -------------------------------------------------
FUNCTION D_SinusH (xx: extended; m: LongInt): extended;
Begin
Result:= CosH(xx)
End;
//--- Производная y= xx_1_sin_x ---------------------------------------------
FUNCTION D_xx_1_sin_x (xx: extended; m: LongInt): extended;
Begin
Result:= (1+sin(xx)-xx*cos(xx))/((1+sin(xx))*(1+sin(xx)))
End;
//--- Производная y= xx_cos_xx ----------------------------------------------
FUNCTION D_xx_cos_xx (xx: extended; m: LongInt): extended;
Begin
Result:= cos(xx)-xx*sin(xx)
End;
//--- Производная y= 1_xx_xx_xx_1 -------------------------------------------
FUNCTION D_1_xx_xx_xx_1 (xx: extended; m: LongInt): extended;
171
Begin
Result:= -3*(2*xx+1)/(2*SQRT(SQR(xx*xx+xx+1)*SQR(xx*xx+xx+1)*(xx*xx+xx+1)))
End;
//--- Производная y= 1_sin_xx_3 ---------------------------------------------
FUNCTION D_sin_xx_3 (xx: extended; m: LongInt): extended;
Begin
Result:= 3*sin(xx)*sin(xx)*cos(xx)
End;
//--- Производная y= xx_atg_xx ----------------------------------------------
FUNCTION D_xx_atg_xx (xx: extended; m: LongInt): extended;
Begin
Result:= arctan(xx)+xx/(1+xx*xx)
End;
//--- Производная y= 1_tg_x_3 -----------------------------------------------
FUNCTION D_1_tg_x_3 (xx: extended; m: LongInt): extended;
Begin
Result:= 3/tan(xx)/tan(xx)/(1-xx*xx)
End;
//--- Первообразная y=sin(m*x) ----------------------------------------------
FUNCTION P_sinus_m (xx: extended; m: LongInt): extended;
Begin
Result:=-cos(xx)
End;
//--- Первообразная y=1_1_exp_2x --------------------------------------------
FUNCTION P_1_1_exp_2x (xx: extended; m: LongInt): extended;
Begin
Result:= 1/2*LnXP1(exp(2*xx)/(1+exp(2*xx))-1)
End;
//--- Первообразная y=SinusH --------------------------------------------
FUNCTION P_SinusH (xx: extended; m: LongInt): extended;
Begin
Result:= cosh(xx)
End;
//--- Первообразная y=xx_1_sin_xx -------------------------------------------
FUNCTION P_xx_1_sin_xx (xx: extended; m: LongInt): extended;
Begin
Result:= -xx*tan(pi/4-xx/2)+2*LnXP1(cos(pi/4-xx/2)-1)
End;
//--- Первообразная y=xx_cos_xx ---------------------------------------------
FUNCTION P_xx_cos_xx (xx: extended; m: LongInt): extended;
Begin
Result:= cos(xx) + xx*sin(xx)
End;
//--- Первообразная y=1_xx_xx_xx_1 ------------------------------------------
FUNCTION P_1_xx_xx_xx_1 (xx: extended; m: LongInt): extended;
Begin
Result:= 2*(2*xx+1)/(3*Sqrt(xx*xx+xx+1))
End;
//--- Первообразная y= 1_sin_xx_3 -------------------------------------------
FUNCTION P_1_sin_xx_3 (xx: extended; m: LongInt): extended;
Begin
Result:= -cos(xx)+1/3*cos(xx)*cos(xx)*cos(xx)
End;
//--- Первообразная y= xx_atg_xx -------------------------------------------
FUNCTION P_xx_atg_xx (xx: extended; m: LongInt): extended;
Begin
Result:= 0.5*(xx*xx+1)*arctan(xx)-xx/2
End;
//--- Первообразная y= xx_atg_xx -------------------------------------------
FUNCTION P_1_tg_x_3 (xx: extended; m: LongInt): extended;
Begin
Result:= -0.5/tan(xx)/tan(xx)-ln(sin(xx))
End;
//--- Вычисление конечных разностей -----------------------------------------
procedure Konech_Raznoct(var dy:mass2; var xj: mass3; lf,m,n:integer; a00,hh: extended);
var j,k1: integer;
begin
for j:=0 to n do xj[j]:=a00+j*hh;
for j:=0 to n-1 do dy[1,j]:=fnf[lf](xj[j+1],m)-fnf[lf](xj[j],m);
for k1:=2 to n do
for j:=0 to n-k1 do dy[k1,j]:=dy[k1-1,j+1]-dy[k1-1,j];
end;
//--- Вычисление коэффициентов по модифицированному преобразованию Виета ----
procedure Vieta(var d,e:mass2; var y: mass3; jp,n: longint);
var kk,l: integer;
begin
e[1,1]:=1; e[1,0]:=-y[0];
for kk:=2 to n do
begin
e[kk,0]:=-e[kk-1,0]*y[kk-1];
172
for l:=1 to kk-1 do e[kk,kk-l]:=e[kk-1,kk-l-1]-e[kk-1,kk-l]*y[kk-1];
e[kk,kk]:=e[kk-1,kk-1]
end;
for l:=0 to jp do d[l,jp]:=e[jp,l];
end;
//--- Вычисление биномиальных коэффициентов по треугольнику Паскаля ---------
procedure binomial_coefficients(var b_c: bc_);
var i,j: integer;
Begin
b_c[0,0]:=1;
b_c[0,1]:=1; b_c[1,1]:=1;
for i:=2 to nn do
begin
for j:=0 to i do
if (j=0)or(j=i) then b_c[j,i]:=1
else b_c[j,i]:= b_c[j-
1,i-1]+b_c[j,i-1];
for j:=i+1 to nn do b_c[j,i]:=0;
end;
End;
//-------Кусочно-полиномиальная аппроксимация функции на основе -------------
//--------------- интерполяционного полинома Ньютона ------------------------
function odin (ll: integer): extended;
begin if ll mod 2 = 0 then Result:=1 else Result:=-1; end;
//---------------------------------------------------------------------------
procedure Polinom_Newton(lf,m: longint );
const epsN=1e-18;
label final, err;
var a00,b00,a0,b0,x1,tp,hp,h1,s,pp,hh,epsK, h0,hp1: extended;
i,j,k,n,l,r,k1,p1,c,ki, n0,k0,ki1,n1, lll: integer;
xj, b,bw: mass3;
e,d,Dw,dy: mass2;
y: mass3;
delta0, delta1: extended;
Begin
for i:=0 to nn do
for j:=0 to nn do d[i,j]:=0;
{аппроксимация значений подынтегральной функции}
a0:=x0; b0:=xn; {на основе интерполяции по Ньютону}
binomial_coefficients(b_c);
epsK:=epsN;
delta0:=1e4100;
delta1:=0;
NEW(a2);
k:=0;
while k<=nnk do
begin
n:=1;
delta1:=0;
repeat
hp:=(b0-a0)/exp(k*ln(2));
a00:=a0-hp;
while a00-b0+hp<=0 do
begin
a00:=a00+hp; b00:=a00+hp;
ki:= Trunc((a00-a0)/hp)+1;
hh:=(b00-a00)/n;
h1:=hh/7;
Konech_Raznoct(dy,xj,lf,m,n,a00,hh);
x1:=a00;
while x1-b00<=0 do
begin
tp:=(x1-xj[0])/hh;
p1:=1;
for j:=1 to n do
begin
p1:=p1*j;
b[j]:=dy[j,0]/p1;
bw[j]:=dy[j,n-j]/p1;
for c:=0 to n-1 do y[c]:=c;
Vieta(d,e,y,j,n)
end;
a^[ki][0]:=(fnf[lf](xj[0],m));
for l:=1 to n do
begin
s:=0;
for j:=l to n do s:=s + b[j]*d[l,j];
a^[ki][l]:=s;
end;
aw^[ki][0]:=(fnf[lf](xj[n],m));
173
for l:=1 to n do
begin
s:=0;
for j:=l to n do s:=s + bw[j]*abs(d[l,j]);
aw^[ki][l]:=s;
end;
for i:=0 to n do
begin
s:=0;
for j:=i to n do s:= s + aw^[ki][j]*odin(i-
j)*b_c[i,j]*exp((j-i)*ln(n));
Ab^[ki][i]:=s;
end;
for i:=0 to n do Bb^[ki][i]:=(a^[ki][i]+Ab^[ki][i])/2;
pp:=Bb^[ki][n];
for r:=n-1 downto 0 do pp:=pp*tp+Bb^[ki][r];
if (abs(pp-fnf[lf](x1,m))>epsK) then goto err;
delta1:=delta1 + abs(pp-fnf[lf](x1,m))/(7*exp(k*ln(2)));
x1:=x1+h1
end;
a00_[ki]:=a00;
if (a00-b0+hp>=0)and(delta1<delta0) then
begin
delta0:=delta1;
for i:=1 to ki do
for j:=0 to n do a2^[i][j]:=Bb^[i][j];
a00_2:=a00_;
k0:=ki;
n0:=n;
h0:=hp;
goto err
end;
if (a00-b0+hp>=0)and(delta1>=delta0) then goto final
end;
err: n:=n+1;
until n>=nn;
k:=k+1;
end;
final:;
for i:=1 to k0 do
for j:=0 to n0 do Bb^[i][j]:=a2^[i][j];
a00_:=a00_2;
DISPOSE(a2);
hp_Global:=h0;
k_Global:= k0;
n_Global:= n0;
{hp_Global:=hp;
k_Global:= ki;
n_Global:= n; }
End;
//--- Вычисление функции на основе интерполяции по Ньютону ------------------
function Func_Polinom(ab: mass1_; lf,m,n_: longint; xx,hp_: extended): extended;
var r,k: integer;
a00,b00,tp,hh,pp: extended;
Begin
k:=Trunc((xx-x0)/hp_)+1;
a00:=a00_[k];
hh:= hp_/n_;
tp:=(xx-a00)/hh;
pp:=ab^[k][n_];
for r:=n_-1 downto 0 do pp:=pp*tp+ab^[k][r];
Func_Polinom:=pp;
End;
//--- Вычисление производной на основе интерполяции по Ньютону --------------
function DIF_Polinom(ab: mass1_; lf,m,n_: longint; xx,hp_: extended): extended;
var r,k: integer;
a00,hh,tp,pp,ff, pp1: extended;
Begin
k:=Trunc((xx-x0)/hp_)+1;
a00:=a00_[k];
hh:= hp_/n_;
tp:=(xx-a00)/hh;
pp:=ab^[k][n_]*n_;
for r:=n_-1 downto 1 do pp:=pp*tp+ab^[k][r]*r;
ff:=pp/hh;
DIF_Polinom:=ff;
End;
//--- Вычисление определённого интеграла на основе интерполяции по Ньютону --
function INTEGRAL_Polinom(ab: mass1_;lf,m,n_,k_:longint;hp_: extended): extended;
var r,k: integer;
174
pp,ff,Sum, pp1: extended;
Begin
Sum:=0;
for k:=1 to k_ do
begin
pp:=ab^[k][n_]/(n_+1);
for r:=n_-1 downto 0 do pp:=pp*n_+ab^[k][r]/(r+1);
ff:=pp*hp_;
Sum:=Sum+ff;
end;
INTEGRAL_Polinom:=Sum;
End;
//---------------------------------------------------------------------------
//---------------------------------------------------------------------------
BEGIN
fnf[1]:=sinus_m;
fnf[2]:=F_1_exp_2x;
fnf[3]:=SinusH;
fnf[4]:=xx_1_sin_x;
fnf[5]:=xx_xos_xx;
fnf[6]:=F_xx_xx_xx_1;
fnf[7]:=sin_xx_3;
fnf[8]:=xx_atg_xx;
ff[1]:=D_sinus_m;
ff[2]:=D_1_1_exp_2x;
ff[3]:=D_SinusH;
ff[4]:=D_xx_1_sin_x;
ff[5]:=D_xx_cos_xx;
ff[6]:=D_1_xx_xx_xx_1;
ff[7]:=D_sin_xx_3;
ff[8]:=D_xx_atg_xx;
Pff[1]:=P_sinus_m;
Pff[2]:=P_1_1_exp_2x;
Pff[3]:=P_SinusH;
Pff[4]:=P_xx_1_sin_xx;
Pff[5]:=P_xx_cos_xx;
Pff[6]:=P_1_xx_xx_xx_1;
Pff[7]:=P_1_sin_xx_3;
Pff[8]:=P_xx_atg_xx;
mm:=1;
g:=0.1;
for k:=1 to 8 do
begin
NEW(a);
NEW(aw);
NEW(Ab);
NEW(Bb);
x:=x0;
Polinom_Newton(k,mm);
WriteLn('n = ',n_Global,' k = ',k_Global,' hp= ',hp_Global);
Assign(File_, 'Modif_Func_Opt_Mem_ '+IntToStr(k)+'.txt'); Rewrite(File_);
while x<=xn do
begin
t:= Func_Polinom(Bb,k,mm,n_Global,x,hp_Global);
WriteLn('x= ',x,' Pogr_F = ',fnf[k](x,mm)-t);
WriteLn(File_,'x= ',x,' f= ',t,' Pogr_F = ',fnf[k](x,mm)-t);
x:=x+g;
end;
Close(File_);
Assign(File_, 'Modif_Dif_Opt_Mem_ '+IntToStr(k)+'.txt'); Rewrite(File_);
x:=x0;
while x<=xn do
begin
t:= DIF_Polinom(Bb,k,mm,n_Global,x,hp_Global);
WriteLn('x= ',x,' P_DIF = ',FF[k](x,mm)-t);
WriteLn(File_,x,' df= ',t,' P_DIF = ',FF[k](x,mm)-t);
x:=x+g;
end;
Close(File_);
Assign(File_, 'Modif_Int_Opt_Mem_ '+IntToStr(k)+'.txt'); Rewrite(File_);
WriteLn('--- INTEGRAL ---');
t:= Integral_Polinom(Bb,k,mm,n_Global,k_Global,hp_Global);
if k>0 then
begin
WriteLn(' PFF(xn)-PFF(x0)-Poli = ',PFF[k](xn,mm)-PFF[k](x0,mm)-t);
WriteLn(File_,' PFF(xn)-PFF(x0)-Poli = ',PFF[k](xn,mm)-PFF[k](x0,mm)-t);
WriteLn(File_,' Poli = ',t);
end;
Close(File_);
DISPOSE(a);
175
DISPOSE(aw);
DISPOSE(Ab);
DISPOSE(Bb);
end;
WriteLn('End.');
ReadLn;
END.

В таблицах в этом параграфе представлены результаты работы программ


Modif_Polinom_Newton_Optimise_Memory и аналогичной программы, использующей
только полиномы Ньютона для интерполяции вперёд; при этом для оценки погрешности
применялись выражения (1.73) – (1.75).
Таблица 5
Сравнение точности аппроксимации функции y  sin  x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f погрешность  f M
0.00000000000000E+0000 0.00000000000000E+0000 6.69469087492984E-0021
1.00000000000000E-0001 0.00000000000000E+0000 6.77626357803440E-0021
2.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
3.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
4.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
5.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
6.00000000000000E-0001 0.00000000000000E+0000 5.42101086242752E-0020
7.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
8.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
9.00000000000000E-0001 1.08420217248550E-0019 5.42101086242752E-0020

Из табл. 5 видно, что модифицированная и немодифицированная схемы дают в


целом сопоставимые результаты притом, что у модифицироанной граница абсолютной
погрешности ниже на один порядок.
Таблица 6
Сравнение точности аппроксимации
производной функции y  sin  x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f  погрешность  f  M
0.00000000000000E+0000 8.63328505906757E-0015 2.00035300823576E-0017
1.00000000000000E-0001 1.91686944095437E-0016 3.25260651745651E-0019
2.00000000000000E-0001 4.07117915768307E-0017 1.84314369322536E-0018
3.00000000000000E-0001 4.09286320113278E-0017 1.62630325872826E-0018
4.00000000000000E-0001 1.90982212683322E-0016 4.87890977618477E-0019
5.00000000000000E-0001 6.67803486120722E-0015 3.02492406123456E-0017
6.00000000000000E-0001 1.47830966218399E-0016 9.21571846612679E-0019
7.00000000000000E-0001 3.19297539796981E-0017 1.84314369322536E-0018
8.00000000000000E-0001 3.00324001778485E-0017 4.87890977618477E-0019
9.00000000000000E-0001 1.39319979164387E-0016 1.08420217248550E-0018

Из табл. 6 видно, что точность численного дифференцирования при


использовании модифицированной схемы выше на 1-3 порядка в сравнении с исходной.
Также при использовании алгоритма минимизации числа подынтервалов удаётся
повысить точность приближения производной в среднем на 1-2 порядка в сравнении с
алгоритмом минимизации степени.
176

Таблица 7
1
Сравнение точности аппроксимации функции y 
1 e2x
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f погрешность  f M
0.00000000000000E+0000 0.00000000000000E+0000 0.00000000000000E+0000
1.00000000000000E-0001 1.35525271560688E-0018 2.71050543121376E-0020
2.00000000000000E-0001 4.66206934168767E-0018 0.00000000000000E+0000
3.00000000000000E-0001 6.23416249179165E-0019 0.00000000000000E+0000
4.00000000000000E-0001 1.08420217248550E-0019 0.00000000000000E+0000
5.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
6.00000000000000E-0001 6.09863722023096E-0019 1.35525271560688E-0020
7.00000000000000E-0001 2.01932654625425E-0018 0.00000000000000E+0000
8.00000000000000E-0001 2.71050543121376E-0019 1.35525271560688E-0020
9.00000000000000E-0001 8.13151629364128E-0020 0.00000000000000E+0000

Из табл. 7 заключаем, что модифицированная кусочно-полиномиальная схема


превосходит немодифицированную в среднем на 1-2 порядка.

Таблица 8
Сравнение точности аппроксимации
1
производной функции y
1 e2x
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f  погрешность  f  M
0.00000000000000E+0000 7.26295109124142E-0014 4.40321607300675E-0016
1.00000000000000E-0001 3.79199709826805E-0017 1.05709711817336E-0018
2.00000000000000E-0001 6.30165407702887E-0016 5.71916645986104E-0018
3.00000000000000E-0001 7.43762690325056E-0017 1.62630325872826E-0019
4.00000000000000E-0001 3.36102673470506E-0018 4.22838847269347E-0018
5.00000000000000E-0001 3.66035598099029E-0014 8.79016911342623E-0017
6.00000000000000E-0001 1.88109076926235E-0017 5.14996031930615E-0019
7.00000000000000E-0001 2.76796814635549E-0016 2.16840434497101E-0018
8.00000000000000E-0001 3.62936677239523E-0017 5.42101086242752E-0019
9.00000000000000E-0001 2.14129929065887E-0018 3.65918233213858E-0019

Из табл. 8 видно, что модифицированная схема превосходит


немодифицированную по точности в среднем на 2-3 порядка.

Таблица 9
Сравнение точности аппроксимации функции y  sh  x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x 
погрешность f погрешность  f M
0.00000000000000E+0000 0.00000000000000E+0000 1.87745624844948E-0020
1.00000000000000E-0001 0.00000000000000E+0000 2.71050543121376E-0020
2.00000000000000E-0001 0.00000000000000E+0000 2.71050543121376E-0020
3.00000000000000E-0001 0.00000000000000E+0000 2.71050543121376E-0020
4.00000000000000E-0001 0.00000000000000E+0000 2.71050543121376E-0020
177
5.00000000000000E-0001 0.00000000000000E+0000 5.42101086242752E-0020
6.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
7.00000000000000E-0001 5.42101086242752E-0020 1.08420217248550E-0019
8.00000000000000E-0001 5.42101086242752E-0020 1.08420217248550E-0019
9.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000

Из табл. 9 делаем вывод, что немодифицированная схема с алгоритмом


минимизации числа подынтервалов точнее модифицированной в среднем на один
порядок.

Таблица 10
Сравнение точности аппроксимации
производной функции y  sh  x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f  погрешность  f  M
0.00000000000000E+0000 9.17587403628795E-0015 9.75781955236954E-0019
1.00000000000000E-0001 2.05239471251506E-0016 1.95156391047391E-0018
2.00000000000000E-0001 4.38017677684144E-0017 1.62630325872826E-0018
3.00000000000000E-0001 4.32596666821716E-0017 2.05998412772246E-0018
4.00000000000000E-0001 2.02962646689286E-0016 2.05998412772246E-0018
5.00000000000000E-0001 1.14425613081947E-0014 1.96349013437125E-0016
6.00000000000000E-0001 2.57389595748059E-0016 3.90312782094782E-0018
7.00000000000000E-0001 5.42101086242752E-0017 1.06251812903579E-0017
8.00000000000000E-0001 5.60532523175006E-0017 2.27682456221956E-0018
9.00000000000000E-0001 2.49041239019920E-0016 5.42101086242752E-0019

Из табл. 10 заключаем, что модифицированная схема позволяет выполнять


численное дифференцирование функции y  shx  с точностью превосходящей точность
немодифицированной схемы в среднем на 1-2 порядка.

Таблица 11
x
Сравнение точности аппроксимации функции y 
1 sin  x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f погрешность  f M
0.00000000000000E+0000 0.00000000000000E+0000 4.63381238979262E-0022
1.00000000000000E-0001 0.00000000000000E+0000 1.35525271560688E-0020
2.00000000000000E-0001 0.00000000000000E+0000 2.71050543121376E-0020
3.00000000000000E-0001 0.00000000000000E+0000 1.35525271560688E-0020
4.00000000000000E-0001 0.00000000000000E+0000 2.71050543121376E-0020
5.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
6.00000000000000E-0001 0.00000000000000E+0000 5.42101086242752E-0020
7.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
8.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
9.00000000000000E-0001 5.42101086242752E-0020 0.00000000000000E+0000

x
Из табл. 11 видно, что погрешности приближения функции y  по
1 sin  x 
19
модифицированной и немодифицированной схемам сопоставимы и не превосходят 10 .
178

Таблица 12
Сравнение точности аппроксимации
x
производной функции y 
1 sin  x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f  погрешность  f  M
0.00000000000000E+0000 2.07336860354179E-0014 3.90421202312030E-0016
1.00000000000000E-0001 4.27609336828283E-0016 7.26415455565288E-0018
2.00000000000000E-0001 3.50197301712818E-0017 3.79470760369927E-0019
3.00000000000000E-0001 1.38235776991901E-0017 1.08420217248550E-0018
4.00000000000000E-0001 3.78386558197441E-0017 3.36102673470506E-0018
5.00000000000000E-0001 5.45462112977457E-0016 1.18611717669914E-0016
6.00000000000000E-0001 1.41759434052480E-0017 7.10152422978005E-0018
7.00000000000000E-0001 2.43945488809238E-0018 3.25260651745651E-0018
8.00000000000000E-0001 1.32814766129474E-0018 3.79470760369927E-0018
9.00000000000000E-0001 1.05438661274215E-0017 4.79759461324836E-0018

Из табл. 12 делаем вывод, что модифицированная схема превосходит


немодифицированную по точности в среднем на 1-2 порядка. При сравнении табл. 9, 26 и
43 видно, что применение алгоритма минимизации степени и алгоритма минимизации
числа подынтервалов позволяет на 1-2 порядка снизить погрешность численного
дифференцирования.
Таблица 13
Сравнение точности аппроксимации функции y  x cos x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f погрешность  f M
0.00000000000000E+0000 0.00000000000000E+0000 1.17415405758605E-0021
1.00000000000000E-0001 6.77626357803440E-0021 0.00000000000000E+0000
2.00000000000000E-0001 1.35525271560688E-0020 2.71050543121376E-0020
3.00000000000000E-0001 2.71050543121376E-0020 0.00000000000000E+0000
4.00000000000000E-0001 2.71050543121376E-0020 0.00000000000000E+0000
5.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
6.00000000000000E-0001 2.71050543121376E-0020 5.42101086242752E-0020
7.00000000000000E-0001 0.00000000000000E+0000 0.00000000000000E+0000
8.00000000000000E-0001 0.00000000000000E+0000 5.42101086242752E-0020
9.00000000000000E-0001 0.00000000000000E+0000 5.42101086242752E-0020

Табл. 13 показывает, что модифицированная и немодифицированная схемы дают


сопоставимую точность аппроксимации функции y  x cosx  .

Таблица 14
Сравнение точности аппроксимации
производной функции y  x cos x 
по модифицированной и немодифицированной схемам
с одновременной минимизацией погрешности и памяти
Абсолютная Абсолютная
Значение аргумента x погрешность  f погрешность  f M
0.00000000000000E+0000 9.45105538968649E-0014 0.00000000000000E+0000
1.00000000000000E-0001 2.09570858930586E-0015 3.25260651745651E-0019
179
2.00000000000000E-0001 4.47721287127889E-0016 2.71050543121376E-0019
3.00000000000000E-0001 4.47070765824398E-0016 2.38524477946811E-0018
4.00000000000000E-0001 2.08123449030317E-0015 2.27682456221956E-0018
5.00000000000000E-0001 6.84330521937004E-0014 3.93565388612238E-0017
6.00000000000000E-0001 1.50639049845136E-0015 4.03865309250850E-0018
7.00000000000000E-0001 3.20273321752218E-0016 3.25260651745651E-0019
8.00000000000000E-0001 3.16471837884941E-0016 3.85569397590158E-0018
9.00000000000000E-0001 1.46352385505671E-0015 1.55854062294791E-0018

Из табл. 14 видно, что модифицированная схема повышает точность численного


дифференцирования на 2-3 порядка по сравнению с немодифицированной.
Численный эксперимент по приближению функций при помощи
модифицированной и немодифицированной схемы показывает в целом сравнимую по
значению порядка точность. Использование алгоритма минимизации памяти позволяет в
некоторых случаях снизить абсолютную погрешность схемы на 1-2 порядка по сравнению
с этой же схемой без названной минимизации, а также с этой же схемой при минимизации
временной сложности. Улучшение становится более существенным при усложнении вида
аппроксимируемой функции.
Модифицированная схема показывает преимущество перед немодифицированной
при численном дифференцировании. Преимущество заключается в усреднении по отрезку
аппроксимации a, b абсолютной погрешности аппроксимации производной, при этом
снижается граница абсолютной погрешности на 1-2 порядка. Полученный эффект
объясняется построением модифицированной схемы, в которой приближающий полином
представляет собой среднее арифметическое полиномов Ньютона для интерполяции
вперёд и назад. Такое усреднение позволяет распределить погрешность аппроксимации по
всему подынтервалу, соответственно, и отрезку a, b , а не «концентрировать» её по
границам подынтервалов, как при использовании полиномов Ньютона для
интерполирования вперед.
Использование алгоритма минимизации временной сложности сохраняет
преимущество модифицированной схемы, при этом в среднем на 1-2 порядка удаётся
улучшить её результат в отношении точности, за счёт одновременной вариации степени
аппроксимирующего полинома.
Модифицированная схема позволяет выполнять численное интегрирование с
точностью, превосходящей точность немодифицированной схемы на половину порядка и
более. Минимизация временной сложности по алгоритму 1 повышает точность
численного интегрирования по модифицированной схеме на 1-2 порядка.
На основе приведённых результатов численных экспериментов заключаем, что
схема (1.36), (1.37) ориентирована на использование при решении задач:
а) где интерполируемая функция заранее известна и существенно ограничено время
её вычисления, а также ограничено время численного дифференцирования и
интегрирования;
б) где необходимо аппроксимировать функции, их производные и приближать
интегралы из стандартной библиотеки функций, например при математическом
моделировании нанопроцессов;
в) где необходимо выполнять отмеченные непосредственно выше приближения
данных поступающих «в реальном времени».
Одновременная вариация числа подынтервалов и степени интерполирующего
полинома составляет алгоритмическое отличие от схемы прототипа [96], построение
полинома (1.5) – математическое отличие, которые в совокупности позволяют добиваться
снижения границы абсолютной погрешности аппроксимации, представленного в табл. 5-
14.
180
4.6. Применение кусочно-полиномиальной схемы для аппроксимации
разрывных функций, их производных и определённых интегралов.
Предполагается, что функция (1.1) не имеет точек разрыва второго рода на отрезке
изменения аргумента.
В случае аппроксимации функции (1.1), имеющей на отрезке a, b  конечное число
n точек разрыва первого рода или точек устранимого разрыва – 1 ,  2 , ...,  n , в которых
функция принимает конечные значения – f 1   f1 , f  2   f 2 , …,  
f  n  f n –
описанный подход будет обладать следующими непосредственно ниже деталями.
Отрезок a, b  разбивается точками 1 ,  2 , ...,  n на интервалы непрерывности
вида

 j   x : x   j ,  j 1 , 

 j   x : x   j ,  j 1  ,


 j   x : x   j ,  j 1  ,
(4.60)

 j   x : x   j ,  j 1 ,


где  0  a ,  n 1  b , j  0, n , при этом граница –  j или  j 1 – включается в интервал
 j , если аппроксимируемая функция имеет на  j в  j или  j 1 соответственно
одностороннюю непрерывность.
На каждом из полученных интервалов непрерывности  j по алгоритму 1.1
задаются подынтервалы (1.2) и строится полином (1.36) с коэффициентами (1.37), при
этом значения функции в узлах интерполяции совпадающих с точками разрыва
получаются доопределением функции по непрерывности, а значения f1 , f 2 , …, f n
заносятся в память компьютера.
В дальнейшем номер j интервала j определяется путём проверки
справедливости неравенств:  j  x   j 1 ,  j  x   j 1 ,  j  x   j 1 ,  j  x   j 1 , j  0, n ,
при этом строгость неравенства определяется включённостью соответствующей границы
в  j . Последующая аппроксимация функции (1.1) с предварительной дешифрацией (1.8)
подынтервала (1.2) выполнится по схеме вида
 f j , x   j ,
f x     j  (4.61)
 Pn i t  x , x   j .
При аппроксимации производной, если при этом в точках разрыва  j , j  1, n ,
функция (1.1) имеет одностороннюю непрерывность на интервале  j из (4.60), то схема
(1.65) аппроксимирует соответствующую одностороннюю производную, в противном
случае функция не дифференцируема в точке  j .
Для приближения определённого интеграла от разрывной функции, обладающей
описанными выше особенностями, с учётом аддитивности интеграла по промежутку
интегрирования, суммированием по всем  j из (1.39), j  1, n , получается
выражение
b n P 1 xi 1

 f x  dx    Pnij  t x dx . (1.76)


a j 1 i  0 xi
181
xi

 P t x dx ,
 
Существование интеграла ni
j
когда одна из границ j интервала
xi 1

непрерывности  j из (1.39), j  1, n , является пределом интегрирования и при этом


 j   j , устанавливает
Лемма 1.1 [12]. Пусть функции f x  и   x  определены на отрезке a, b и
f x    x  на интервале a, b  . Тогда если функция интегрируема на a, b , то и функция
b b
  x  интегрируема на a, b и  f x  dx    x  dx .
a a

Полином Pn i t x из (1.36), (1.40) с точностью до априори заданного  совпадает


 j

с аппроксимируемой функцией (1.1) во всех точках интервала непрерывности  j из


(1.39), j  1, n , кроме, может быть, границ  j , поэтому согласно лемме 1.1 интегралы в
правой части (1.76) существуют и справедливо приближённое равенство (1.76).
Отметим, что представленные рассуждения носят общий характер и требуют
апробации в рамках численного эксперимента, что составляет предмет дальнейших
исследований.
182

ПРИЛОЖЕНИЕ К ГЛАВЕ 2

5.1. Представление двойных конечных разностей через значения функции.


Ниже следует вывод соотношения из п. 2.7 гл. 2 связывающего двойные конечные
разности произвольного порядка непосредственно со значениями функции.
Покажем справедливость (2.82) по индукции [13]. С этой целью запишем конечные
разности второго порядка:
2x 2 y 0 f xi , y j   f xi  2 , y j   2 f xi 1 , y j   f xi , y j ,
2x1 y1 f xi , y j   f xi 1 , y j 1   f xi 1 , y j   f xi , y j 1   f xi , y j , (5.1)
2x 0 y 2 f xi , y j   f xi , y j  2   2 f xi , y j 1   f xi , y j ,
и аналогично запишем конечные разности третьего порядка:
3x3 y0 f xi , y j   f xi 3 , y j   3 f xi2 , y j   3 f xi 1 , y j   f xi , y j ,
3x2 y1 f xi , y j   f xi2 , y j 1   2 f xi1 , y j 1  
 f xi , y j 1   f xi2 , y j   2 f xi1 , y j   f xi , y j ,
(5.2)
3x1 y 2 f xi , y j   f xi1 , y j 2   f xi , y j 2  
 2 f xi1 , y j 1   2 f xi , y j 1   f xi1 , y j   f xi , y j ,
3x0 y3 f xi , y j   f xi , y j 3   3 f xi , y j 2   3 f xi , y j 1   f xi , y j .
Из (2.17), (5.1), (5.2) видно, что для m  1, 2, 3 равенство (2.82) выполняется.
Предположим, что оно выполняется и для всех m  M . Покажем справедливость (2.82)
для m  M  1.
В силу способа вычисления разностей (2.17), задача разбивается на два случая, –
первый: k  M , и второй: k  M . При k  M будем иметь
Mx k11y M k f xi , y j   Mx k y M k f xi 1 , y j   Mx k y M k f xi , y j  . (5.3)
Подстановка (2.82) в (5.3) повлечёт
k M k
Mx k11y M k f xi , y j      1 Ck C rM  k f xi   1 , y j  r  
M   r

 0 r 0
k M k
(5.4)
    1 f xi   , y j  r .
M   r k M k
C C
 r
 0 r 0

Перепишем первую двойную сумму в правой части (5.4) так, чтобы индекс  начинал
изменяться со значения   1 , а под знак второй внесём «минус», получим
k 1 M  k
Mx k11y M k f xi , y j      1 Ck1C rM  k f xi   , y j  r  
M    r 1

 1 r  0
k M k
(5.5)
    1 f xi   , y j  r .
M    r 1 k M k
C C  r
 0 r 0
После приведения подобных, выражение (5.5) примет вид
C 
k M k
Mx k11y M k f xi , y j      1  Ck CrM  k f xi   , y j  r  
M    r 1 k
 1
 1 r  0
M k M k
(5.6)
   1 f xi , y j  r     1 f xi  k 1 , y j  r .
M  r 1 k M k M k r k M k
C C
0 r C C k r
r 0 r 0

С учётом равенств [11] Ck1  Ck  Ck 1 , C 0k  C 0k 1  1 , C kk  C kk11  1 , соотношение (5.6)


преобразуется к виду
183
k 1 M  k
Mx k11y M k f xi , y j      1 Ck 1CrM  k f xi   , y j  r ,
M    r 1

 0 r 0
что и требовалось доказать.
В случае k  M рассуждения аналогичны. Запишем конечную разность, –
Mx ky1M k 1 f xi , y j   Mx k y M k f xi 1 , y j   Mx k y M k f xi , y j  . (5.7)
Подставив (2.82) в (5.7), получим равенство
k M k
Mx ky1M k 1 f xi , y j      1 Ck C rM  k f xi   , y j  r 1  
M   r

 0 r 0
k M k
(5.8)
    1 f xi   , y j  r .
M   r k M k
C C
 r
 0 r 0
Перепишем первую сумму в правой части (5.8) так, чтобы индекс r имел начальное
значение r  1, тогда после приведения подобных можем записать
k M k
Mx ky1M k 1 f xi , y j      1 Ck CrM  k 1 f xi   , y j  r  
M    r 1

  0 r 1

  1 Ck C0M k f xi  , y j  r     1 Ck CMM kk f xi  , y j  r ,


k k
M   1 k   1

 0  0
M k
откуда, аналогично (5.6), с учётом равенств C 0  C0M  k 1  1 , C MM kk  C MM kk11  1 следует
соотношение
k M  k 1
Mx ky1M k 1 f xi , y j      1 Ck CrM  k 1 f xi   , y j  r ,
M    r 1

 0 r 0
что и требовалось доказать. Лемма 1 доказана.
5.2. Оценка скорости сходимости и доказательство равномерной сходимости
кусочно-полиномиальной аппроксимации функций двух переменных. Излагаемые
рассуждения повторяют методику доказательства равномерной сходимости,
предложенную в [14] для схемы (1.28), (1.30) в случае одной действительной переменной.
Ниже предполагается, что функция (1) определена и непрерывна по обеим
переменным в области (2) вместе со всеми частными производными до  N  1 -го порядка
включительно. Частные производные в граничных точках области (2) понимаются как
пределы соответствующих производных при стремлении точек к границе [15]. Также
полагается, что b  a  1 , d  c  1 , такое предположение не сужает общности, случай
b  a  1 , d  c  1 будет отдельно рассмотрен ниже.
Пусть рассматривается текущий этап разбиения исходной области (2.2), когда по
алгоритму 1 определены значения k1 , k 2 , N . Предполагается, что полином (2.33) с
коэффициентами (2.34) построен, тогда выполняется равенство [11]
f x, y   Pk~s, N t , u   Rk~s , N t , u  , (5.9)
где t , u определяются соотношениями (2.24), (2.25) в подобласти Gk~d и соотношениями
(2.27), (2.28) в подобласти Gk~u , Pk~s, N – полином для интерполяции вперёд и вверх при
x, y  Gk~d , аналогично, Pk~s, N – интерполяционный полином для интерполяции назад и
вниз при x, y  Gk~u , Rk~s , N – остаточный член интерполяции, при s  d полагается
Rk~s , N  Rk~d, N – остаточный член интерполяции вперёд и вверх, при s  u полагается
Rk~s , N  Rk~u , N – остаточный член интерполяции назад и вниз.
Замечание 1. Строго говоря, непосредственно ниже идёт речь о равномерной
сходимости последовательности полиномов (33), состоящей из двух
184
подпоследовательностей полиномов (16), (17), которые определены в подобластях (6), (7)
соответственно. При этом элементы последовательности нумеруются при помощи
мультииндекса k   k1 , k 2 , s , где k 1 , k 2 из (3), s из (30).
В сделанных предположениях Rk~s , N t , u  имеет вид [16, 17]:
i 1 N i
t     u  k 
 f  i ,  i  
N 1 N 1
Rk , k~ , N t , u   
s
  0
 k 0  h i  g N 1i , (5.10)
i 0 x i
y N 1 i
i !  N  1  i !
где точки i ,  i  предполагаются внутренними точками подобласти соответствующей
полиному (2.33) [18], где h  hx N , g  hy N – шаги интерполяции, hx  (b  a ) 2 k1 ,
hy  (d  c) 2k2 – линейные размеры соответствующей подобласти.
Из равенства (5.10) следует
i 1 N i
t     u  k  i h N 1i
 f  i ,  i  
N 1 N 1
h
Rk , k~ , N t , u      0
 k 0  xi  N 1i
s y
, (5.11)
i  0 x y
i N 1 i
i! N  1  i ! N N
где
 N 1 f x, y 
M i  max . (5.12)
G x i y N 1i
Согласно равенствам (24), (27), (26), (28) t  0, N  , u  0, N . Элементарно
i 1 N i
оправдываются неравенства:  t 
 0
 Ni ,  uk
k 0
 N N i 1 , с учётом которых

соотношение (39) запишется в виде


N 1i
N 1
Ni N N 1i h i hy
Rks , k~ , N t , u    M i    xi  N 1i , (5.13)
i 0 i ! N  1  i ! N N

Так как hxi h yN 1i 


b  a i d  c N 1i , то с учётом того, что
b  a  1 , d  c  1 , выполняется
2 k1i 2 k 2  N 1i 
неравенство

hxi h yN 1i 
b  a N 1 d  c N 1 .
2 k1 2 k 2
Отсюда, в обозначениях
M max  max Mi , (5.14)
i0, 1, ..., N 1

где M i из (5.12).
Оценим величину i ! ( N  1  i)! . Очевидно,
i ! ( N  1  i) 
N  1! ( N  1  i)! ,
( N  1) N ( N  1) ... (i  1)
или,
i ! ( N  1  i) 
N  1! 1 2  ...  ( N  1  i) .
( N  1  0)( N  1  1)( N  1  2) ... ( N  1  ( N  i ))
Иными словами,
1 2  ...  ( N  1  i )
i ! ( N  1  i )  ( N  1) ! ,
( N  1  ( N  i )) ... ( N  1  2)( N  1  1)( N  1  0)
Или, что то же самое,
185
1  2  ...  ( N  1  i )
i ! ( N  1  i )  ( N  1) ! .
(i  1)(i  2) ... ( N  1  2)( N  1  1)( N  1)
Отсюда
i ! ( N  1  i)  ( N  1)! .
Из последнего неравенства с учетом соотношений (5.13), (5.14) вытекает оценка:

Rks , k~ , N t , u  
N  2M max b  a N 1 d  c N 1 . (5.15)
N  1! 2k1 2k 2
Поскольку рассматривается случай b  a  1  d  c , то (43) переходит в неравенство:
M Nm ax
Rk~s , N t , u   , (5.16)
2 k1 2 k 2
где

M Nmax 
N  2M maxb  a N 1 d  c N 1 . (5.17)
N  1! 22 N 1
M Nmax
Для правой части (5.16) следует lim  0 , откуда окончательно получаем
k1   2 k1 2 k 2
k 
2

P s
~
k,k , N
t x , u y  
 f  x, y  .
G

Замечание 2. В случае b  a  1 , d  c  1 , для hxi hyN 1i из (41) будет справедливо


неравенство
1
hxi hyN 1i  k1 k 2 ,
2 2
тогда константа M N из (5.17) существенно уменьшится и примет вид:
m ax

M Nm ax 
N  2M m ax
,
N  1!
формальная запись оценки (5.16) и последующие рассуждения не изменятся, усилив
оценку скорости сходимости.
Таким образом, доказана
Теорема 2.1. Пусть для произвольного натурального N  const функция f  x, y  из
(2.1) определена и непрерывна вместе со своими частными производными до N  1 -го
порядка, включительно, при этом частные производные в граничных точках замкнутой
области G из (2.2) понимаются как пределы соответствующих частных производных при
стремлении точек к границе. Тогда последовательность полиномов Pks, k~ , N t , u  из (2.33)
равномерно сходится на G при k1   , k 2   , где k1  log 2 Px , k 2  log 2 Py , Px , Py –
число подобластей (2.4) вдоль оси абсцисс и ординат соответственно. Скорость
сходимости имеет оценку (2.43).
5.3. Оценка скорости сходимости и доказательство равномерной сходимости
кусочно-полиномиальной схемы приближённого вычисления двойных интегралов.
Ниже предполагается, что при выбранных по алгоритму 1 значениях k1 , k 2 , N полином
(2.33) с коэффициентами (2.34) построен в подобластях (2.6), (2.7) в ограничениях
теоремы 2.1, следовательно выполняется соотношение (2.36).
Интегрирование равенства (2.36) по области G из (2.2) с учётом аддитивности
интеграла по области интегрирования влечёт
2 k1 2 k2 1 2 k1 2 k2 1 2 k1 2 k2 1

   f x, y dx dy  hg    P
~ ~
s
~
k, k ,N
t , u dt du  hg    R
~
s
~
k, k ,N
t , u dt du , (5.27)
k 0 s G ~s k 0 s G ~s k 0 s G ~s
k k k
186
где h , g – шаги интерполяции из (2.13), ), а обозначения Pks, k~ , N , Rks , k~ , N имеют тот же
смысл, что и в выражении (36).
Именно, полагается
  f x, y  dx dy   f x, y  dx dy   f x, y  dx dy ,
s G ~s
k
Gk~d Gk~u

hg   Pks, k~ , N t , u  dt du  hg  Pkd, k~ , N t , u  dt du  hg  Pku, k~ , N t , u  dt du ,


s G ~s Gk~d Gk~u
k

hg   Pks, k~ , N t , u  dt du  hg  Pkd, k~ , N t , u  dt du  hg  Pku, k~ , N t , u  dt du .


s G ~s Gk~d Gk~u
k

hg   Pk~s, N t , u  dt du  hg  Pk~d, N t , u  dt du  hg  Pk~u, N t , u  dt du .


s G ~s G k~d G k~u
k

С использованием свойств двойного интеграла, из правой части (5.27) вытекают


неравенства [12]:
2 k1 2 k2 1 2 k1 2 k2 1

   R
~
s
~
k,k ,N
t , u  dt du     R
~
s
~
k,k ,N
t , u  dt du ,
k 0 s G ~s k 0 s Gk~s
k

2 k1 2 k2 1 2 k1 2 k2 1

   R
~
s
~
k,k ,N
t , u  dt du    
~
Rks , k~ , N t , u  dt du. (5.28)
k 0 s Gk~s k 0 s G ~s
k

В силу справедливости оценки (5.16) во всех подобластях (2.6), (2.7) из


соотношения (5.28) следует
2 k1 2 k2 1 2 k1 2 k2 1
M Nmax
hg 
~
  R s
~
k,k ,N
t , u  dt du  hg 
~
s s 2k1 2k2 dt du, (5.29)
k 0 s G ~s k 0 G~
k k

где k 1 , k 2 из (2.6), M из (5.17). m ax


N

Непосредственное интегрирование в правой части (5.29) повлечёт


2 k1 2 k2 1
t , u  dt du b  a  d  c  2 k1 k2
2 1
M Nmax N 2
hg    R
~
s
~
k,k ,N

2 k1 N 2 k 2 N

~
s 2k1 2k2 2 ,
k 0 s G ~s k 0
k

откуда с учётом (5.27) получим


2 k1 2 k2 1 2 k1 2 k2 1
M Nmax b  a  d  c 
  f x, y dx dy     P
~ ~
s
~
k,k ,N
t , u  dt du  2 2 k1 k2 k1
2 2 2
k1

2k2
k2
. (5.30)
k 0 Gk~s k 0 s G ~s
k

2 k1 2 k2 1
Из (5.30), с учётом равенства  f x, y  dx dy    f x, y  dx dy ,
~
k 0
следует окончательная
G Gk~s

оценка
M Nmaxb  a d  c 
Px Py 1

 f x, y dx dy     Pk~s, N t, u dt du  , (5.31)


G
~
k 0 s G ~s 2k1 2k 2 N 2
k

где M Nm ax из (5.17).
Таким образом, доказана
Теорема 2.3. В условиях теоремы 2.1, каково бы ни было натуральное N  const ,
2 k1 2 k2 1
последовательность hg    P
~
s
~
k,k ,N
t , u  dt du равномерно сходится на области G из
k 0 s G ~s
k
187
(2.2) к интегралу  f x, y dx dy
G
при k1   , k 2   , где k1  log 2 Px , k 2  log 2 Py , Px , Py

– число подобластей (2.6) вдоль оси абсцисс и ординат соответственно, h , g – шаги


интерполяции из (2.13). Скорость сходимости оценивается из (5.31).
Теорема 2.3 утверждает равномерную сходимость построенного
аппроксимационного процесса в зависимости от числа подобластей со скоростью
геометрической прогрессии.
5.4. Численный эксперимент по аппроксимации действительных функций
двух действительных переменных при помощи кусочно-полиномиальных схем на
базе интерполяции по Ньютону. Непосредственно ниже следует описание численного
эксперимента по верификации и сравнению абсолютной погрешности аппроксимации
функций двух переменных по кусочно-полиномиальной схеме на базе полинома Ньютона
(2.15) для интерполяции вперёд и вверх – немодифицированной схеме, с аналогичной
погрешностью схемы (2.31), (2.32), называемой в дальнейшем модифицированной [13].
Абсолютная погрешность аппроксимации определялась модулем отклонения
значения аппроксимирующего полинома от значения функции, вычисленного
внутренними инструментами Delphi 7. Так для полинома (16) формула имеет вид
  f x, y   Pk~ , N x, y  , (5.32)
и аналогично для полинома (62), –
 M  f x, y   Pk~ , N x, y  .
~
(5.33)
В ходе эксперимента область G из (2) имела вид
G  x, y  x 0,1, y 0,1.
Непосредственно ниже приводится приводится полный исходный код порграммы
приближающей функции, частные производные и двойные интегралы по
модифицированной схеме на базе интерполяции по Ньютону.
program two_dim_Newton_MODIF;
{$APPTYPE CONSOLE}
USES
SysUtils, Math; {2^12x2^12}
CONST x0=0; xn=1; nnk=12; kkn=16777216;
y0=0; yn=1; nn= 25; nKU=6;
Block_Size= 10;
TYPE
mass1_=^mass1;
mass1=array [0..nn,0..nn] of extended;
mass11=array [1..kkn] of extended;
mass2=array [0..nn,0..nn] of extended;
mass2_INT=array [0..nn,0..nn] of integer;
mass3=array [0..nn] of extended;
mass3_INT=array [0..nn] of integer;
mass4=^mass4_;
mass4_=array [0..nn,0..nn,0..nn,0..nn] of integer;
mass5=^mass5_;
mass5_=array [0..nn,0..nn,0..nn,0..nn,0..nn] of extended;
TFunc= array [1..nKU] of function(xx: extended; yy:extended): extended;
TdifFunc= array [1..nKU,1..2,1..3] of function(xx: extended; yy:extended): extended;
VAR
x00_, y00_:mass11;
factorial: mass3;
func, intF: TFunc;
dF,d2F: TdifFunc;
hx_Global, hy_Global: extended;
N_Global, kx_Global, ky_Global: integer;
b_c: mass2_INT;
//--- z=cos(x+y) ------------------------------------------------------------
FUNCTION cosinus(xx: extended; yy: extended): extended;
Begin
cosinus:= cos(xx+yy)
End;
//--- Производная по х от z=cos(x+y) ----------------------------------------
FUNCTION d_cosinus_dx(xx: extended; yy: extended): extended;
Begin
188
Result:= -sin(xx+yy)
End;
//--- Производная по y от z=cos(x+y) ----------------------------------------
FUNCTION d_cosinus_dy(xx: extended; yy: extended): extended;
Begin
Result:= -sin(xx+yy)
End;
//--- Первообразная от z=cos(x+y) --------------------------------------------
FUNCTION P_cosinus(xx: extended; yy: extended): extended;
Begin
Result:= -cos(xx+yy)
End;
//--- Вторая производная по х от z=cos(x+y) ---------------------------------
FUNCTION d2_cosinus_dx2(xx: extended; yy: extended): extended;
Begin
Result:= -cos(xx+yy)
End;
//--- Вторая производная по y от z=cos(x+y) ---------------------------------
FUNCTION d2_cosinus_dy2(xx: extended; yy: extended): extended;
Begin
Result:= -cos(xx+yy)
End;
//--- Смешанная производная по y от z=cos(x+y) ------------------------------
FUNCTION d2_cosinus_dxdy(xx: extended; yy: extended): extended;
Begin
Result:= -cos(xx+yy)
End;
//--- z=sin(x+y) ------------------------------------------------------------
FUNCTION sinus(xx: extended; yy: extended): extended;
Begin
sinus:= sin(xx+yy)
End;
//--- Производная по х от z=sin(x+y) ----------------------------------------
FUNCTION d_sinus_dx(xx: extended; yy: extended): extended;
Begin
Result:= cos(xx+yy)
End;
//--- Производная по y от z=sin(x+y) ----------------------------------------
FUNCTION d_sinus_dy(xx: extended; yy: extended): extended;
Begin
Result:= cos(xx+yy)
End;
//--- Первообразная от z=sin(x+y) -------------------------------------------
FUNCTION P_sinus(xx: extended; yy: extended): extended;
Begin
Result:= -sin(xx+yy)
End;
//--- Вторая производная по х от z=sin(x+y) ---------------------------------
FUNCTION d2_sinus_dx2(xx: extended; yy: extended): extended;
Begin
Result:= -sin(xx+yy)
End;
//--- Вторая производная по y от z=sin(x+y) ---------------------------------
FUNCTION d2_sinus_dy2(xx: extended; yy: extended): extended;
Begin
Result:= -sin(xx+yy)
End;
//--- Смешанная производная по х от z=sin(x+y) ------------------------------
FUNCTION d2_sinus_dxdy(xx: extended; yy: extended): extended;
Begin
Result:= -sin(xx+yy)
End;
//--- z=exp(x+y) ------------------------------------------------------------
FUNCTION exponenta(xx: extended; yy: extended): extended;
Begin
exponenta:= exp(xx+yy)
End;
//--- Производная по х от z=exp(x+y) ----------------------------------------
FUNCTION d_exp_dx(xx: extended; yy: extended): extended;
Begin
Result:= exp(xx+yy)
End;
//--- Производная по y от z=exp(x+y) ----------------------------------------
FUNCTION d_exp_dy(xx: extended; yy: extended): extended;
Begin
Result:= exp(xx+yy)
End;
//--- Первообразная от z=exp(x+y) ------------------------------------------
FUNCTION P_exp(xx: extended; yy: extended): extended;
Begin
189
Result:= exp(xx+yy)
End;
//--- z=x*x*exp(x)*sin(5*y) -------------------------------------------------
FUNCTION x_exp_sin(xx: extended; yy: extended): extended;
Begin
Result:= xx*xx*exp(xx)*sin(5*yy)
End;
//--- Производная по х от z=exp(x^2)*sin(y) ---------------------------------
FUNCTION d_x_exp_sin_dx(xx: extended; yy: extended): extended;
Begin
Result:= 2*xx*exp(xx)*sin(5*yy)+ xx*xx*exp(xx)*sin(5*yy)
End;
//--- Производная по y от z=x*x*exp(x)*sin(5*y) -----------------------------
FUNCTION d_x_exp_sin_dy(xx: extended; yy: extended): extended;
Begin
Result:= 5*xx*xx*exp(xx)*cos(5*yy)
End;
//--- Первообразная от z=x*x*exp(x)*sin(5*y) --------------------------------
FUNCTION P_exp_sin(xx: extended; yy: extended): extended;
Begin
Result:= -(xx*xx-2*xx+2)*exp(xx)*cos(5*yy)/5
End;
//--- Вторая производная по y от z=x*x*exp(x)*sin(5*y) ----------------------
FUNCTION d2_x_exp_sin_dy2(xx: extended; yy: extended): extended;
Begin
Result:= -25*xx*xx*exp(xx)*sin(5*yy)
End;
//--- Вторая производная по x от z=x*x*exp(x)*sin(5*y) ----------------------
FUNCTION d2_x_exp_sin_dx2(xx: extended; yy: extended): extended;
Begin
Result:= //2*(1+2*xx+xx*xx)*exp(xx)*sin(5*yy)
(xx*xx+4*xx+2)*exp(xx)*sin(5*yy)
End;
//--- Смешанная производная по y от z=x*x*exp(x)*sin(5*y) -------------------
FUNCTION d2_x_exp_sin_dxdy(xx: extended; yy: extended): extended;
Begin
Result:= (10*xx+5*xx*xx)*exp(xx)*cos(5*yy)
End;
//--- z= x*y*sh(x*x+y*y) ----------------------------------------------------
FUNCTION xysh(xx: extended; yy: extended): extended;
Begin
Result:= xx*yy*SinH(xx*xx+yy*yy)
End;
//--- Производная по х от z= x*y*sh(x*x+y*y) -------------------------------
FUNCTION d_xysh_dx(xx: extended; yy: extended): extended;
Begin
Result:= yy*SinH(xx*xx+yy*yy) + 2*xx*xx*yy*CosH(xx*xx+yy*yy)
End;
//--- Производная по y от z= x*y*sh(x*x+y*y) -------------------------------
FUNCTION d_xysh_dy(xx: extended; yy: extended): extended;
Begin
Result:= xx*SinH(xx*xx+yy*yy) + 2*xx*yy*yy*CosH(xx*xx+yy*yy)
End;
//--- Первообразная для z= x*y*sh(x*x+y*y) ----------------------------------
FUNCTION P_xysh(xx: extended; yy: extended): extended;
Begin
Result:= 1/4*SinH(xx*xx+yy*yy)
End;
//--- Вторая производная по х от z= x*y*sh(x*x+y*y) -------------------------
FUNCTION d2_xysh_dx2(xx: extended; yy: extended): extended;
Begin
Result:= 6*xx*yy*CosH(xx*xx+yy*yy)+4*xx*xx*xx*yy*SinH(xx*xx+yy*yy)
End;
//--- Вторая производная по y от z= x*y*sh(x*x+y*y) -------------------------
FUNCTION d2_xysh_dy2(xx: extended; yy: extended): extended;
Begin
Result:= 6*yy*xx*CosH(xx*xx+yy*yy)+4*yy*yy*yy*xx*SinH(xx*xx+yy*yy)
End;
//--- Смешанная производная от z= x*y*sh(x*x+y*y) ---------------------------
FUNCTION d2_xysh_dxdy(xx: extended; yy: extended): extended;
Begin
Result:= (2*yy*yy+2*xx*xx)*CosH(xx*xx+yy*yy) +
(1 + 4*yy*yy*xx*xx)*SinH(xx*xx+yy*yy)
End;
//--- z= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) ----------------------------------
FUNCTION xy_(xx: extended; yy: extended): extended;
Begin
Result:= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1)
End;
//--- Производная по х от z= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) --------------
190
FUNCTION d_xy_dx(xx: extended; yy: extended): extended;
Begin
Result:= yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) +
2*xx*xx*yy*SQRT(yy*yy+1)/(2*SQRT(xx*xx+1))
End;
//--- Производная по y от z= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) --------------
FUNCTION d_xy_dy(xx: extended; yy: extended): extended;
Begin
Result:= xx*SQRT(xx*xx+1)*SQRT(yy*yy+1) +
2*yy*yy*xx*SQRT(xx*xx+1)/(2*SQRT(yy*yy+1))
End;
//--- Первообразная z= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) --------------------
FUNCTION P_xy_(xx: extended; yy: extended): extended;
Begin
Result:= 1/9*SQRT((xx*xx+1)*(xx*xx+1)*(xx*xx+1))
*SQRT((yy*yy+1)*(yy*yy+1)*(yy*yy+1))
End;
//--- Вторая производная по y от z= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) -------
FUNCTION d2_xy_dy2(xx: extended; yy: extended): extended;
Begin
Result:= xx*SQRT(xx*xx+1)*
(3*yy/SQRT(yy*yy+1)-yy*yy*yy/(SQRT((yy*yy+1)*(yy*yy+1)*(yy*yy+1))))
End;
//--- Вторая производная по x от z= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) -------
FUNCTION d2_xy_dx2(xx: extended; yy: extended): extended;
Begin
Result:= yy*SQRT(yy*yy+1)*
(3*xx/SQRT(xx*xx+1)-xx*xx*xx/(SQRT((xx*xx+1)*(xx*xx+1)*(xx*xx+1))))
End;
//--- Смешанная производная от z= xx*yy*SQRT(xx*xx+1)*SQRT(yy*yy+1) ---------
FUNCTION d2_xy_dxdy(xx: extended; yy: extended): extended;
Begin
Result:= (SQRT(xx*xx+1) + xx*xx/SQRT(xx*xx+1))
*(SQRT(yy*yy+1) + yy*yy/SQRT(yy*yy+1))
End;
//--- Функция вычисляющая (-1)^n --------------------------------------------
FUNCTION one(n_: integer): integer;
Begin
if n_ mod 2 = 0 then Result:=1 else Result:=-1;
End;
//--- Вычисление биномиальных коэффициентов по треугольнику Паскаля ---------
procedure binomial_coefficients(var b_c: mass2_INT);
var i,j: integer;
Begin
b_c[0,0]:=1;
b_c[0,1]:=1; b_c[1,1]:=1;
for i:=2 to nn do
begin
for j:=0 to i do
if (j=0)or(j=i) then b_c[j,i]:= 1
else b_c[j,i]:= b_c[j-1,i-1]+b_c[j,i-1];
for j:=i+1 to nn do b_c[j,i]:=0;
end;
End;
//--- Вычисление коэффициентов по модифицированному преобразованию Виета ----
procedure Vieta(var d,e:mass2_INT; var y: mass3_INT; jp,n: longint);
var kk,l: integer;
begin
e[1,1]:=1; e[1,0]:=-y[0];
for kk:=2 to n do
begin
e[kk,0]:=-e[kk-1,0]*y[kk-1];
for l:=1 to kk-1 do e[kk,kk-l]:=e[kk-1,kk-l-1]-e[kk-1,kk-l]*y[kk-1];
e[kk,kk]:=e[kk-1,kk-1]
end;
for l:=0 to jp do d[l,jp]:=e[jp,l];
end;
//--- Вычисление двойных конечных разностей "вверх-вправо" ------------------
PROCEDURE dual_finite_differences_up_right(var dz: mass5; num, N: integer;
xa,ya,hhx,hhy: extended);
var i,j,k,l,m: integer;
xx, yy: mass3;
Begin
for i:=0 to N do xx[i]:=xa+i*hhx;
for j:=0 to N do yy[j]:=ya+j*hhy;
for i:=0 to N-1 do
for j:=0 to N-1 do
begin
dz[1,1,0,i,j]:=func[num](xx[i+1],yy[j])-func[num](xx[i],yy[j]);
dz[1,0,1,i,j]:=func[num](xx[i],yy[j+1])-func[num](xx[i],yy[j]);
191
end;
for m:=2 to N do
for k:=0 to m do
for i:=0 to N-m do
for j:=0 to N-i-m do
if m-k <> 0 then
dz[m,k,m-k,i,j]:=dz[m-1,k,m-k-1,i,j+1]-dz[m-1,k,m-k-1,i,j]
else
dz[m,k,m-k,i,j]:=dz[m-1,k-1,m-k,i+1,j]-dz[m-1,k-1,m-k,i,j];
End;
//--- Вычисление двойных конечных разностей "вниз-влево" --------------------
PROCEDURE dual_finite_differences_down_left(var dz: mass5; num, N: integer;
xb,yb,hhx,hhy: extended);
var i,j,k,l,m: integer;
xx, yy: mass3;
Begin
for i:=0 to N do xx[i]:=xb-i*hhx;
for j:=0 to N do yy[j]:=yb-j*hhy;
for i:=0 to N-1 do
for j:=0 to N-1 do
begin
dz[1,1,0,i,j]:=func[num](xx[i+1],yy[j])-func[num](xx[i],yy[j]);
dz[1,0,1,i,j]:=func[num](xx[i],yy[j+1])-func[num](xx[i],yy[j]);
end;
for m:=2 to N do
for k:=0 to m do
for i:=0 to N-m do
for j:=0 to N-i-m do
if m-k <> 0 then
dz[m,k,m-k,i,j]:=dz[m-1,k,m-k-1,i,j+1]-dz[m-1,k,m-k-1,i,j]
else
dz[m,k,m-k,i,j]:=dz[m-1,k-1,m-k,i+1,j]-dz[m-1,k-1,m-k,i,j];
End;
//--- Кусочно-полиномиальная аппроксимация по Ньютону -----------------------
PROCEDURE two_dim_Newton (num_func: integer);
const eps=1e-17; npt_=1;
label Inc_N, final;
var a_u_r, a_d_l: mass1_;
kx,ky, kk, N, i,j, m_,k_,PxPy, Numb_Run, npt: integer;
b_u_r, b_d_l: mass2;
d,e: mass2_INT;
roots: mass3_INT;
Dd: mass4;
dz_u_r, dz_d_l: mass5;
hx,hy, xa,xb, ya,yb, hhx,hhy, h1x,h1y, x1,y1, Summa, xp,yp, tp,up: extended;
polinom, polinom_t, ttp,uup, polinom_, polinom_t_, xxp, yyp: extended;
File_a, File_a_: file;
File_Name, File_Name_: string;
Time1, Time0: TDateTime;
Hour, Min, Sec, Msec: Word;
Begin
//---------------------------------------------------------------------------
factorial[0]:=1;
for i:=1 to nn do factorial[i]:=i*factorial[i-1];
//---------------------------------------------------------------------------
NEW(Dd);
NEW(dz_u_r);
NEW(dz_d_l);
for i:=0 to nn do
for j:=0 to nn do d[i,j]:=0;
for m_:=1 to nn do
for k_:=0 to m_ do
for i:=0 to k_ do
for j:=0 to m_-k_ do Dd[m_,k_,i,j]:=0;
for j:=1 to nn do
begin
for i:=0 to j-1 do roots[i]:=i;
for i:=1 to j do Vieta(d,e,roots,i,j);
end;
for m_:=1 to nn do
for k_:=0 to m_ do
for i:=0 to k_ do
for j:=0 to m_-k_ do
begin
if (k_=0) then Dd[m_,k_,i,j]:=d[j,m_-k_]
else
if (m_-k_=0) then Dd[m_,k_,i,j]:= d[i,k_]
else Dd[m_,k_,i,j]:= d[i,k_]*d[j,m_-k_];
end;
//---------------------------------------------------------------------------
192
Time0:=GetTime;
Numb_Run:=0;
if FileSearch ('a!!!', ExtractFilePath('two_dim_Newton_MODIF.dpr.dpr'))=
'' then MkDir(ExtractFilePath('two_dim_Newton_MODIF.dpr')+'Coefficients\');
File_Name:= 'a!!!';
AssignFile(File_a, File_Name);
Rewrite(File_a);
CloseFile(File_a);
ChDir(ExtractFilePath('two_dim_Newton_MODIF.dpr')+'Coefficients\');
ky:=6;
while ky<=nnk do
{}begin
hy:=(yn-y0)/exp(ky*ln(2));
kx:=6;
while kx<=nnk do
{2} begin
PxPy:=Trunc(exp(kx*ln(2))*exp(ky*ln(2)));
hx:=(xn-x0)/exp(kx*ln(2));
N:=1;
{3} repeat
npt:= N + npt_;
ya:=y0-hy;
while ya-yn <0 do
{4} begin
ya:=ya+hy;
yb:=ya+hy;
xa:=x0-hx;
hhy:=hy/N;
h1y:=hy/(npt);
while xa-xn <0 do
{5} begin
Numb_Run:=Numb_Run+1;
xa:=xa+hx;
xb:=xa+hx;
kk:= Trunc(exp(kx*ln(2)))*(Trunc((ya-y0)/hy))+Trunc((xa-x0)/hx)+1;
hhx:=hx/N;
h1x:=hx/(npt);
dual_finite_differences_up_right(dz_u_r,num_func,N,xa,ya,hhx,hhy);
dual_finite_differences_down_left(dz_d_l,num_func,N,xb,yb,hhx,hhy);
for i:=0 to N do
for j:=0 to i do b_u_r[i,j]:=dz_u_r[i,j,i-j,0,0]/
factorial[j]/factorial[i-j];
for i:=0 to N do
for j:=0 to i do b_d_l[i,j]:=dz_d_l[i,j,i-j,0,0]/
factorial[j]/factorial[i-j];
{+a} NEW(a_u_r);
{+a'} NEW(a_d_l);
for i:=0 to N do
for j:=0 to N-i do
{6} begin
Summa:=0;
for m_:=j to N do
for k_:=i to m_-j do Summa:= Summa + b_u_r[m_,k_]*Dd[m_,k_,i,j];
if (i=0)and(j=0) then a_u_r^[i,j]:= Summa + func[num_func](xa,ya)
else a_u_r^[i,j]:= Summa;
{6} end;
for i:=0 to N do
for j:=0 to N-i do
{6'} begin
Summa:=0;
for m_:=j to N do
for k_:=i to m_-j do Summa:= Summa + b_d_l[m_,k_]*Dd[m_,k_,i,j];
if (i=0)and(j=0) then a_d_l^[i,j]:= Summa + func[num_func](xb,yb)
else a_d_l^[i,j]:= Summa;
{6'} end;
for i:=0 to npt do
{7} begin
xp:= xa+i*h1x;
xxp:=xb-i*h1x;
tp:=(xp-xa)/hhx;
ttp:=(xb-xxp)/hhx;
for j:=0 to npt-i do
{8} begin
yp:= ya+j*h1y;
yyp:=yb-j*h1y;
up:=(yp-ya)/hhy;
uup:=(yb-yyp)/hhy;
polinom:= a_u_r^[0,N];
for m_:=N-1 downto 0 do
{9} begin
193
polinom:= polinom*up;
polinom_t:= a_u_r^[N-m_,m_];
for k_:=N-m_-1 downto 0 do
begin
polinom_t:= polinom_t*tp + a_u_r^[k_,m_];
end;
polinom:= polinom + polinom_t;
{9} end;
polinom_:= a_d_l^[0,N];
for m_:=N-1 downto 0 do
{9'} begin
polinom_:= polinom_*uup;
polinom_t_:= a_d_l^[N-m_,m_];
for k_:=N-m_-1 downto 0 do
begin
polinom_t_:= polinom_t_*ttp + a_d_l^[k_,m_];
end;
polinom_:= polinom_ + polinom_t_;
{9'} end;
if abs(func[num_func](xp,yp)-polinom)>=eps then goto Inc_N;
if abs(func[num_func](xxp,yyp)-polinom_)>=eps then goto Inc_N;
{8} end;
{7} end;
File_Name:='a_u_r_'+IntToStr(kk);
AssignFile(File_a,File_Name);
Rewrite(File_a,Block_Size);
Seek(File_a,0);
for i:=0 to N do BlockWrite(File_a,a_u_r^[i],Block_Size);
CloseFile(File_a);
File_Name:='a_d_l_'+IntToStr(kk);
AssignFile(File_a,File_Name);
Rewrite(File_a,Block_Size);
Seek(File_a,0);
for i:=0 to N do BlockWrite(File_a,a_d_l^[i],Block_Size);
CloseFile(File_a);
x00_[kk]:=xa;
y00_[kk]:=ya;
{-a} DISPOSE(a_u_r);
{-a'} DISPOSE(a_d_l);
if kk=PxPy then goto final;
{5} end;
{4} end;
Inc_N:Inc(N);
{3} until N>nn;
Inc(kx);
{2} end;
Inc(ky);
{}end;
final:;
DISPOSE(Dd);
DISPOSE(dz_u_r);
DISPOSE(dz_d_l);
hx_Global:=hx;
hy_Global:=hy;
N_Global:=N;
kx_Global:=kx;
ky_Global:=ky;
Time1:= GetTime;
DecodeTime(Time1-Time0, Hour, Min, Sec, Msec);
WriteLn('Time: ', Hour,' h ', Min,' m ', Sec, ' s ', Msec,' ms');
WriteLn('hx = ',hx_Global);
WriteLn('hy = ',hy_Global);
WriteLn('ky_Global= ',ky_Global,' kx_Global= ',kx_Global,' N_Global= ',N_Global,' Numb_Run=
',Numb_Run);
WriteLn('PxPy = ',PxPy);
readln;
End;
//-------------- Функция вычисляющая значение аппроксимирующего -------------
//------------------------ полинома в точке (xx, yy) ------------------------
function Polinom_2_dim(num_func: integer; xx,yy,hx_,hy_: extended;
N_,kx_: integer; const x00_,y00_:mass11; File_Name:string):extended;
var i,j, kk,kx,ky: integer;
File_a: File;
FileName, File_Name_Add: string;
aa: mass2;
aa1: array [0..nn] of extended;
tp,up, polinom, polinom_t: extended;
Begin
ky:=Trunc((yy-y0)/hy_)+1;
kx:=Trunc((xx-x0)/hx_)+1;
194
kk:= Trunc(exp(kx_*ln(2)))*(ky-1) + kx;
tp:= (xx-x00_[kk])/(hx_/N_);
up:= (yy-y00_[kk])/(hy_/N_);
if up <= N_-tp then File_Name_Add:='u_r_'
else
begin
File_Name_Add:='d_l_';
tp:=(x00_[kk]+hx_-xx)/(hx_/N_);
up:=(y00_[kk]+hy_-yy)/(hy_/N_);
end;
FileName:=File_Name + File_Name_Add + IntToStr(kk);
AssignFile(File_a, FileName);
Reset(File_a, Block_Size);
Seek(File_a,0);
for i:=0 to N_ do
begin
BlockRead(File_a,aa1,Block_Size);
for j:=0 to N_-i do aa[i,j]:=aa1[j];
end;
CloseFile(File_a);
polinom:= aa[0,N_];
for i:=N_-1 downto 0 do
begin
polinom:= polinom*up;
polinom_t:= aa[N_-i,i];
for j:=N_-i-1 downto 0 do
begin
polinom_t:= polinom_t*tp + aa[j,i];
end;
polinom:= polinom + polinom_t;
end;
Result:= polinom;
End;
//------ Функция вычисляющая приближённое значение частной производной ------
//------------- от аппроксимирующего полинома в точке (xx, yy) --------------
function d_Polinom_2_dim(num_func,dx_l,dy_k: integer; xx,yy,hx_,hy_: extended;
N_,kx_: integer; const x00_,y00_:mass11; File_Name:string):extended;
var i,j, kk,kx,ky, odin: integer;
File_a: File;
FileName, File_Name_Add: string;
aa: mass2;
aa1: array [0..nn] of extended;
tp,up, polinom, polinom_t, hhx,hhy, hhx1: extended;
Begin
ky:=Trunc((yy-y0)/hy_)+1;
kx:=Trunc((xx-x0)/hx_)+1;
kk:= Trunc(exp(kx_*ln(2)))*(ky-1) + kx;
hhx:=hx_/N_;
hhy:=hy_/N_;
tp:= (xx-x00_[kk])/hhx;
up:= (yy-y00_[kk])/hhy;
odin:=1;
if up <= N_-tp then File_Name_Add:='u_r_'
else
begin
File_Name_Add:='d_l_';
odin:=-1;
tp:=(x00_[kk]+hx_-xx)/hhx;
up:=(y00_[kk]+hy_-yy)/hhy;
end;
FileName:=File_Name + File_Name_Add + IntToStr(kk);
AssignFile(File_a, FileName);
Reset(File_a, Block_Size);
Seek(File_a,0);
for i:=0 to N_ do
begin
BlockRead(File_a,aa1,Block_Size);
for j:=0 to N_-i do aa[i,j]:=aa1[j];
end;
CloseFile(File_a);
if (dx_l<>0)and(dy_k=0) then
begin
polinom:= factorial[dx_l]*aa[dx_l,N_-dx_l];
for i:=N_-dx_l-1 downto 0 do
begin
polinom:= polinom*up;
polinom_t:= factorial[N_-i]/factorial[N_-i-dx_l]*aa[N_-i,i];
for j:=N_-i-1 downto dx_l do polinom_t:= polinom_t*tp +
factorial[j]/factorial[j-dx_l]*aa[j,i];
polinom:= polinom + polinom_t;
195
end;
for i:=1 to dx_l do polinom:= odin*polinom/hhx;
end
else if (dx_l=0)and(dy_k<>0) then
begin
polinom:= factorial[N_]/factorial[N_-dy_k]*aa[0,N_];
for i:=N_-1 downto dy_k{1} do
begin
polinom:= polinom*up;
polinom_t:= factorial[i]/factorial[i-dy_k]*aa[N_-i,i];
for j:=N_-i-1 downto 0 do polinom_t:= polinom_t*tp +
factorial[i]/factorial[i-dy_k]*aa[j,i];
polinom:= polinom + polinom_t;
end;
for i:=1 to dy_k do polinom:= odin*polinom/hhy;
end
else
begin
polinom:= factorial[dx_l]*factorial[N_]/factorial[N_-dy_k]*aa[dx_l,N_-dx_l];
for i:=N_-1-dx_l downto dy_k do
begin
polinom:= polinom*up;
polinom_t:= factorial[N_-i]/factorial[N_-i-dx_l] *
factorial[i]/factorial[i-dy_k]*aa[N_-i,i];
for j:=N_-i-1 downto dx_l do polinom_t:= polinom_t*tp +
factorial[j]/factorial[j-dx_l]*factorial[i]/factorial[i-dy_k]*aa[j,i];
polinom:= polinom + polinom_t;
end;
for i:=1 to dx_l do polinom:= odin*polinom/hhx;
for i:=1 to dy_k do polinom:= odin*polinom/hhy;
end;
Result:= polinom;
End;
//-------------- Функция вычисляющая приближённое значение ------------------
//----------------- интегралa аппроксимирующего полинома --------------------
function Integral_Polinom_2_dim(num_func: integer; hx_,hy_: extended;
N_,kx_,ky_: integer; const x00_,y00_:mass11; File_Name:string):extended;
var i,j,l, kk,PxPy: integer;
File_a: File;
FileName: string;
aa_u, aa_d: array [0..nn+1,0..nn+1] of extended;//mass2;
aa1: array [0..nn] of extended;
theta: array [0..nn+2] of extended;
alpha: array [0..nn+2,0..nn+2] of integer;
up,tp, polinom,polinom_t, Integral,I_, Summa_j,Summa_l: extended;
Begin
PxPy:= Trunc(exp(kx_*ln(2))*exp(ky_*ln(2)));
up:=N_;
tp:=N_;
binomial_coefficients(b_c);
Integral:=0;
for i:=0 to N_+1 do
for j:=0 to N_+1 do
begin
aa_u[i,j]:=0;
aa_d[i,j]:=0;
end;
for i:=0 to N_+2 do
begin
theta[i]:=0;
for j:=0 to N_+2 do alpha[i,j]:=0;
end;
for j:=0 to N_ do
for l:=0 to j+1 do alpha[l,j]:=one(l)*b_c[l,j+1]*round(exp((j+1-l)*ln(N_)));
for kk:=1 to PxPy do
begin
FileName:=File_Name + 'u_r_' + IntToStr(kk);
AssignFile(File_a, FileName);
Reset(File_a, Block_Size);
Seek(File_a,0);
for i:=0 to N_ do
begin
BlockRead(File_a,aa1,Block_Size);
for j:=0 to N_-i do aa_d[i,j]:=aa1[j];
end;
CloseFile(File_a);
FileName:=File_Name + 'd_l_' + IntToStr(kk);
AssignFile(File_a, FileName);
Reset(File_a, Block_Size);
Seek(File_a,0);
196
for i:=0 to N_ do
begin
BlockRead(File_a,aa1,Block_Size);
for j:=0 to N_-i do aa_u[i,j]:=aa1[j];
end;
CloseFile(File_a);
for i:=0 to N_+1 do
begin
Summa_j:=0;
for j:=0 to N_ do
begin
Summa_l:=0;
for l:=0 to i do Summa_l:= Summa_l + (aa_u[i-l,j]+aa_d[i-l,j])*alpha[l,j];
Summa_j:= Summa_j + 1/(j+1)*Summa_l;
end;
theta[i]:= Summa_j;
end;
I_:= theta[N_+1]/(N_+2);
for i:= N_ downto 0 do I_:= I_*N_ + theta[i]/(i+1);
Integral:= Integral + hx_*hy_/N_*I_;
end;
Result:= Integral;
End;
//---------------------------------------------------------------------------
VAR nf,i,j, nnt, n_f, d_f, l,k: integer;
x,y, poli, intPoli: extended;
F, ofi: text;
BEGIN
nnt:=10;
func[1]:=sinus;
func[2]:=cosinus;
func[3]:=exponenta;
func[4]:=x_exp_sin;
func[5]:=xysh;
func[6]:=xy_;
df[1,1,1]:=d_sinus_dx;
df[1,1,2]:=d_sinus_dy;
df[2,1,1]:=d_cosinus_dx;
df[2,1,2]:=d_cosinus_dy;
df[3,1,1]:=d_exp_dx;
df[3,1,2]:=d_exp_dy;
df[4,1,1]:=d_x_exp_sin_dx;
df[4,1,2]:=d_x_exp_sin_dy;
df[5,1,1]:=d_xysh_dx;
df[5,1,2]:=d_xysh_dy;
df[6,1,1]:=d_xy_dx;
df[6,1,2]:=d_xy_dy;
df[1,2,1]:=d2_sinus_dx2;
df[1,2,2]:=d2_sinus_dxdy;
df[1,2,3]:=d2_sinus_dy2;
df[2,2,1]:=d2_cosinus_dx2;
df[2,2,2]:=d2_cosinus_dxdy;
df[2,2,3]:=d2_cosinus_dy2;
df[3,2,1]:=exponenta;
df[3,2,2]:=exponenta;
df[3,2,3]:=exponenta;
df[4,2,1]:=d2_x_exp_sin_dx2;
df[4,2,2]:=d2_x_exp_sin_dxdy;
df[4,2,3]:=d2_x_exp_sin_dy2;
df[5,2,1]:=d2_xysh_dx2;
df[5,2,2]:=d2_xysh_dxdy;
df[5,2,3]:=d2_xysh_dy2;
df[6,2,1]:=d2_xy_dx2;
df[6,2,2]:=d2_xy_dxdy;
df[6,2,3]:=d2_xy_dy2;
intF[1]:=P_sinus;
intF[2]:=P_cosinus;
intF[3]:=P_exp;
intF[4]:=P_exp_sin;
intF[5]:=P_xysh;
intF[6]:=P_xy_;
n_f:=5;
two_dim_Newton (n_f);
x:=x0;
y:=y0;
for i:=0 to nnt-1 do
begin
y:=y0 + i*(yn-y0)/(nnt);
WriteLn('y=',y);
for j:=0 to nnt-1 do
197
begin
x:=x0 + j*(xn-x0)/(nnt);
poli:=Polinom_2_dim(n_f,x,y,hx_Global,hy_Global,N_Global,kx_Global,x00_,
y00_,'a_');
WriteLn('x=',x,' P=', poli,' P-f=',poli-func[n_f](x,y));
end;
end;
readln;
for d_f:=1 to 2 do
for l:=0 to d_f do
begin
WriteLn(' --- d',d_f,'_F/dx_',d_f-l,'_dy_',l,' --- ');
x:=x0;
y:=y0;
readln;
for i:=0 to nnt-1 do
begin
y:=y0 + i*(yn-y0)/(nnt);
WriteLn('y=',y);
for j:=0 to nnt-1 do
begin
x:=x0 + j*(xn-x0)/(nnt);
poli:= d_Polinom_2_dim(n_f,d_f-l,l,x,y,hx_Global,hy_Global,N_Global,
kx_Global,x00_,y00_,'a_');
WriteLn('x=',x,' dP', poli,' pogr',poli-df[n_f,d_f,l+1](x,y));
end;
end;
//readln;
end;
WriteLn('--- INTEGRAL --- PRESS ENTER'); readln;
intPoli:= Integral_Polinom_2_dim(n_f,hx_Global,hy_Global,N_Global,
kx_Global,ky_Global,x00_,y00_,'a_');
WriteLn('INTEGRAL = ',intF[n_f](xn,yn)-intF[n_f](x0,yn)-intF[n_f](xn,y0) +
intF[n_f](x0,y0):30);
WriteLn('INT_Poli = ',intPoli:30);
WriteLn('delta = ',intF[n_f](xn,yn)-intF[n_f](x0,yn)-intF[n_f](xn,y0) +
intF[n_f](x0,y0) - intPoli);
readln;
END.

Ниже в таблицах приводятся значения погрешностей в обозначениях: Pk~, N x, y  –


немодифицированный полином (2.15),  – погрешность схемы (2.15), Pk~ , N x, y  –
~

полином (2.31),  M – погрешность схемы (2.32).


В табл. 5.1. представлена абсолютная погрешность аппроксимации функции
z  sin x  y  по обеим схемам. Граница абсолютной погрешности аппроксимации из (5)
для немодифицированной схемы имела значение   1014 , для модифицированной –
  1018 . При этом схема (17), (18) аппроксимировала функцию z  sin x  y  на
Px Py  2048 подобластях Gk~ из (2) полиномом степени N  7 , а модифицированная – на
Px Py  64 подобластях, полиномом с N  8 .

Таблица 5.1
Абсолютная погрешность аппроксимации функции z  sin  x  y 

y x Pk~, N x, y   Pk~ , N  x, y 


~
M
0.0E+0000 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 9.9833E-0002 -6.7763E-0021 9.9833E-0002 -1.0842E-0019
2.0E-0001 1.9867E-0001 0.0000E+0000 1.9867E-0001 -1.3553E-0020
3.0E-0001 2.9552E-0001 0.0000E+0000 2.9552E-0001 2.7105E-0020
4.0E-0001 3.8942E-0001 0.0000E+0000 3.8942E-0001 8.1315E-0020
5.0E-0001 4.7943E-0001 0.0000E+0000 4.7943E-0001 0.0000E+0000
6.0E-0001 5.6464E-0001 -5.4210E-0020 5.6464E-0001 -5.4210E-0020
7.0E-0001 6.4422E-0001 0.0000E+0000 6.4422E-0001 0.0000E+0000
8.0E-0001 7.1736E-0001 0.0000E+0000 7.1736E-0001 5.4210E-0020
9.0E-0001 7.8333E-0001 5.4210E-0020 7.8333E-0001 1.0842E-0019
198
y x Pk~, N x, y   Pk~ , N  x, y 
~
M
1.0E-0001 0.0E+0000 9.9833E-0002 -2.2091E-0018 9.9833E-0002 -1.0842E-0019
1.0E-0001 1.9867E-0001 -1.1939E-0017 1.9867E-0001 -2.7105E-0020
2.0E-0001 2.9552E-0001 -6.8305E-0018 2.9552E-0001 0.0000E+0000
3.0E-0001 3.8942E-0001 -7.2723E-0017 3.8942E-0001 1.0842E-0019
4.0E-0001 4.7943E-0001 -1.1546E-0017 4.7943E-0001 2.7105E-0020
5.0E-0001 5.6464E-0001 -1.7889E-0017 5.6464E-0001 -1.0842E-0019
6.0E-0001 6.4422E-0001 3.6863E-0018 6.4422E-0001 0.0000E+0000
7.0E-0001 7.1736E-0001 -1.7889E-0017 7.1736E-0001 5.4210E-0020
8.0E-0001 7.8333E-0001 -1.5125E-0017 7.8333E-0001 5.4210E-0020
9.0E-0001 8.4147E-0001 -2.3636E-0017 8.4147E-0001 0.0000E+0000
2.0E-0001 0.0E+0000 1.9867E-0001 1.3688E-0018 1.9867E-0001 -1.3553E-0020
1.0E-0001 2.9552E-0001 -2.7105E-0019 2.9552E-0001 2.7105E-0020
2.0E-0001 3.8942E-0001 2.4123E-0018 3.8942E-0001 8.1315E-0020
3.0E-0001 4.7943E-0001 -3.3881E-0017 4.7943E-0001 2.7105E-0020
4.0E-0001 5.6464E-0001 3.0900E-0018 5.6464E-0001 -5.4210E-0020
5.0E-0001 6.4422E-0001 4.7163E-0018 6.4422E-0001 0.0000E+0000
6.0E-0001 7.1736E-0001 -1.5720E-0018 7.1736E-0001 5.4210E-0020
7.0E-0001 7.8333E-0001 5.0415E-0018 7.8333E-0001 1.0842E-0019
8.0E-0001 8.4147E-0001 -1.0787E-0017 8.4147E-0001 0.0000E+0000
9.0E-0001 8.9121E-0001 4.9873E-0018 8.9121E-0001 -1.0842E-0019
3.0E-0001 0.0E+0000 2.9552E-0001 2.2497E-0018 2.9552E-0001 2.7105E-0020
1.0E-0001 3.8942E-0001 2.2497E-0018 3.8942E-0001 1.0842E-0019
2.0E-0001 4.7943E-0001 3.3068E-0018 4.7943E-0001 2.7105E-0020
3.0E-0001 5.6464E-0001 9.7578E-0018 5.6464E-0001 -5.4210E-0020
4.0E-0001 6.4422E-0001 4.0115E-0018 6.4422E-0001 -5.4210E-0020
5.0E-0001 7.1736E-0001 5.3668E-0018 7.1736E-0001 5.4210E-0020
6.0E-0001 7.8333E-0001 4.4994E-0018 7.8333E-0001 1.0842E-0019
7.0E-0001 8.4147E-0001 5.6921E-0018 8.4147E-0001 0.0000E+0000
8.0E-0001 8.9121E-0001 1.5178E-0018 8.9121E-0001 -1.0842E-0019
9.0E-0001 9.3204E-0001 5.7463E-0018 9.3204E-0001 -5.4210E-0020
4.0E-0001 0.0E+0000 3.8942E-0001 -1.3959E-0017 3.8942E-0001 8.1315E-0020
1.0E-0001 4.7943E-0001 -1.3932E-0017 4.7943E-0001 0.0000E+0000
2.0E-0001 5.6464E-0001 -1.8431E-0017 5.6464E-0001 -5.4210E-0020
3.0E-0001 6.4422E-0001 -1.7185E-0017 6.4422E-0001 -5.4210E-0020
4.0E-0001 7.1736E-0001 -2.1630E-0017 7.1736E-0001 5.4210E-0020
5.0E-0001 7.8333E-0001 -2.6671E-0017 7.8333E-0001 1.0842E-0019
6.0E-0001 8.4147E-0001 -2.3581E-0017 8.4147E-0001 0.0000E+0000
7.0E-0001 8.9121E-0001 -2.8298E-0017 8.9121E-0001 -1.0842E-0019
8.0E-0001 9.3204E-0001 -2.4286E-0017 9.3204E-0001 0.0000E+0000
9.0E-0001 9.6356E-0001 -2.8406E-0017 9.6356E-0001 0.0000E+0000
5.0E-0001 0.0E+0000 4.7943E-0001 0.0000E+0000 4.7943E-0001 0.0000E+0000
1.0E-0001 5.6464E-0001 -5.4210E-0020 5.6464E-0001 -1.0842E-0019
2.0E-0001 6.4422E-0001 0.0000E+0000 6.4422E-0001 0.0000E+0000
3.0E-0001 7.1736E-0001 5.4210E-0020 7.1736E-0001 5.4210E-0020
4.0E-0001 7.8333E-0001 5.4210E-0020 7.8333E-0001 1.0842E-0019
5.0E-0001 8.4147E-0001 0.0000E+0000 8.4147E-0001 0.0000E+0000
6.0E-0001 8.9121E-0001 0.0000E+0000 8.9121E-0001 -1.0842E-0019
7.0E-0001 9.3204E-0001 -5.4210E-0020 9.3204E-0001 -5.4210E-0020
8.0E-0001 9.6356E-0001 5.4210E-0020 9.6356E-0001 0.0000E+0000
9.0E-0001 9.8545E-0001 0.0000E+0000 9.8545E-0001 5.4210E-0020
6.0E-0001 0.0E+0000 5.6464E-0001 -1.7835E-0017 5.6464E-0001 -5.4210E-0020
1.0E-0001 6.4422E-0001 3.6863E-0018 6.4422E-0001 -5.4210E-0020
2.0E-0001 7.1736E-0001 -1.7889E-0017 7.1736E-0001 5.4210E-0020
3.0E-0001 7.8333E-0001 3.7513E-0017 7.8333E-0001 5.4210E-0020
4.0E-0001 8.4147E-0001 -2.2497E-0017 8.4147E-0001 0.0000E+0000
5.0E-0001 8.9121E-0001 -2.9057E-0017 8.9121E-0001 -1.0842E-0019
6.0E-0001 9.3204E-0001 -3.6863E-0018 9.3204E-0001 0.0000E+0000
7.0E-0001 9.6356E-0001 -2.4611E-0017 9.6356E-0001 5.4210E-0020
199
y x Pk~, N x, y   Pk~ , N  x, y 
~
M
8.0E-0001 9.8545E-0001 -6.3426E-0017 9.8545E-0001 0.0000E+0000
9.0E-0001 9.9749E-0001 -2.5967E-0017 9.9749E-0001 0.0000E+0000
7.0E-0001 0.0E+0000 6.4422E-0001 4.7163E-0018 6.4422E-0001 0.0000E+0000
1.0E-0001 7.1736E-0001 5.9631E-0019 7.1736E-0001 5.4210E-0020
2.0E-0001 7.8333E-0001 5.0415E-0018 7.8333E-0001 1.0842E-0019
3.0E-0001 8.4147E-0001 -1.3552E-0017 8.4147E-0001 0.0000E+0000
4.0E-0001 8.9121E-0001 4.9873E-0018 8.9121E-0001 -1.0842E-0019
5.0E-0001 9.3204E-0001 6.7763E-0018 9.3204E-0001 -5.4210E-0020
6.0E-0001 9.6356E-0001 6.3426E-0018 9.6356E-0001 0.0000E+0000
7.0E-0001 9.8545E-0001 6.2884E-0018 9.8545E-0001 5.4210E-0020
8.0E-0001 9.9749E-0001 3.5237E-0017 9.9749E-0001 0.0000E+0000
9.0E-0001 9.9957E-0001 5.6921E-0018 9.9957E-0001 -5.4210E-0020
8.0E-0001 0.0E+0000 7.1736E-0001 5.3668E-0018 7.1736E-0001 5.4210E-0020
1.0E-0001 7.8333E-0001 4.4452E-0018 7.8333E-0001 1.0842E-0019
2.0E-0001 8.4147E-0001 5.6921E-0018 8.4147E-0001 0.0000E+0000
3.0E-0001 8.9121E-0001 6.5052E-0019 8.9121E-0001 -1.0842E-0019
4.0E-0001 9.3204E-0001 5.7463E-0018 9.3204E-0001 -5.4210E-0020
5.0E-0001 9.6356E-0001 7.1557E-0018 9.6356E-0001 0.0000E+0000
6.0E-0001 9.8545E-0001 5.5836E-0018 9.8545E-0001 0.0000E+0000
7.0E-0001 9.9749E-0001 6.7221E-0018 9.9749E-0001 0.0000E+0000
8.0E-0001 9.9957E-0001 9.8120E-0018 9.9957E-0001 -5.4210E-0020
9.0E-0001 9.9166E-0001 6.1257E-0018 9.9166E-0001 0.0000E+0000
9.0E-0001 0.0E+0000 7.8333E-0001 -2.6671E-0017 7.8333E-0001 1.0842E-0019
1.0E-0001 8.4147E-0001 -2.3636E-0017 8.4147E-0001 0.0000E+0000
2.0E-0001 8.9121E-0001 -2.8298E-0017 8.9121E-0001 -1.0842E-0019
3.0E-0001 9.3204E-0001 -2.4340E-0017 9.3204E-0001 0.0000E+0000
4.0E-0001 9.6356E-0001 -2.8406E-0017 9.6356E-0001 0.0000E+0000
5.0E-0001 9.8545E-0001 -3.2906E-0017 9.8545E-0001 5.4210E-0020
6.0E-0001 9.9749E-0001 -2.7376E-0017 9.9749E-0001 0.0000E+0000
7.0E-0001 9.9957E-0001 -3.1062E-0017 9.9957E-0001 0.0000E+0000
8.0E-0001 9.9166E-0001 -2.5425E-0017 9.9166E-0001 0.0000E+0000
9.0E-0001 9.7385E-0001 -2.8243E-0017 9.7385E-0001 0.0000E+0000

Из табл. 5.1. видно, что модифицированная схема превосходит


немодифицированную по точности на величину в среднем до двух десятичных порядков,
обладая при этом более стабильной точностью.
Дополним результаты, представленные в табл. 1 абсолютной погрешностью
аппроксимации функции на подобласти Gk~ из (2.2). Для определённости бралась область
G50 в обозначениях (2.4). В табл. 5.2 приводятся значения абсолютной погрешности
 
(2.86) в точках xi k , y j m не совпадающих с узлами интерполяции, при этом
hx hy
xi k  xi  kh1 x , yi m  yi  mh1 y , h 1 x  , h1 y  , h x , h y – шаг интерполяции,
10 10
N – степень аппроксимирующего полинома.
Таблица 5.2
Абсолютная погрешность аппроксимации функции z  sin  x  y 
на подобласти G50
j i  M
0 0 0.0000E+0000 0.0000E+0000
1 1.0090E-0016 0.0000E+0000
2 5.1052E-0017 8.1315E-0020
3 2.3785E-0017 1.0842E-0019
200
j i  M
4 9.5139E-0018 2.7105E-0020
5 0.0000E+0000 2.7105E-0020
6 9.5003E-0018 2.7105E-0020
7 2.3771E-0017 2.7105E-0020
8 5.0876E-0017 0.0000E+0000
9 1.0045E-0016 0.0000E+0000
10 1.0056E-0015 2.7105E-0020
1 0 6.7763E-0021 0.0000E+0000
1 1.0011E-0016 0.0000E+0000
2 5.0605E-0017 2.7105E-0020
3 2.3554E-0017 2.7105E-0020
4 9.3648E-0018 2.7105E-0020
5 0.0000E+0000 0.0000E+0000
6 9.3106E-0018 8.1315E-0020
7 2.3202E-0017 2.7105E-0020
8 4.9060E-0017 1.0842E-0019
9 9.3594E-0017 0.0000E+0000
10 1.7231E-0016 0.0000E+0000
2 0 6.7763E-0021 8.1315E-0020
1 9.9326E-0017 8.1315E-0020
2 5.0158E-0017 0.0000E+0000
3 2.3310E-0017 1.0842E-0019
4 9.2835E-0018 0.0000E+0000
5 1.3553E-0020 2.7105E-0020
6 9.1615E-0018 2.7105E-0020
7 2.2660E-0017 2.7105E-0020
8 4.7380E-0017 2.7105E-0020
9 8.4622E-0017 2.7105E-0020
10 3.5510E-0016 2.7105E-0020
3 0 0.0000E+0000 2.7105E-0020
1 9.8547E-0017 0.0000E+0000
2 4.9697E-0017 0.0000E+0000
3 2.3080E-0017 2.7105E-0020
4 9.1615E-0018 5.4210E-0020
5 1.3553E-0020 5.4210E-0020
6 8.9853E-0018 8.1315E-0020
7 2.2118E-0017 0.0000E+0000
8 4.6268E-0017 0.0000E+0000
9 7.2018E-0017 2.7105E-0020
10 5.5229E-0016 2.7105E-0020
4 0 0.0000E+0000 0.0000E+0000
1 9.7768E-0017 2.7105E-0020
2 4.9277E-0017 0.0000E+0000
3 2.2850E-0017 2.7105E-0020
4 9.0666E-0018 2.7105E-0020
5 1.3553E-0020 2.7105E-0020
6 8.8498E-0018 0.0000E+0000
7 2.1305E-0017 5.4210E-0020
8 4.6675E-0017 2.7105E-0020
9 5.3397E-0017 0.0000E+0000
10 7.6913E-0016 2.7105E-0020
5 0 0.0000E+0000 2.7105E-0020
1 9.7002E-0017 5.4210E-0020
2 4.8843E-0017 1.0842E-0019
3 2.2606E-0017 0.0000E+0000
4 8.9582E-0018 0.0000E+0000
5 0.0000E+0000 2.7105E-0020
6 8.7820E-0018 2.7105E-0020
201
j i  M
7 2.0085E-0017 5.4210E-0020
8 4.9087E-0017 2.7105E-0020
9 2.7349E-0017 2.7105E-0020
10 1.0090E-0015 0.0000E+0000
6 0 0.0000E+0000 0.0000E+0000
1 9.6243E-0017 0.0000E+0000
2 4.8410E-0017 2.7105E-0020
3 2.2402E-0017 2.7105E-0020
4 8.8498E-0018 2.7105E-0020
5 1.8974E-0019 5.4210E-0020
6 8.1044E-0018 5.4210E-0020
7 1.9841E-0017 8.1315E-0020
8 5.1012E-0017 0.0000E+0000
9 2.8460E-0018 0.0000E+0000
10 1.2682E-0015 0.0000E+0000
7 0 0.0000E+0000 0.0000E+0000
1 9.5484E-0017 0.0000E+0000
2 4.7962E-0017 2.7105E-0020
3 2.2172E-0017 0.0000E+0000
4 9.1751E-0018 0.0000E+0000
5 1.9380E-0018 2.7105E-0020
6 3.8218E-0018 2.7105E-0020
7 2.6102E-0017 2.7105E-0020
8 4.3639E-0017 8.1315E-0020
9 2.3825E-0017 2.7105E-0020
10 1.5283E-0015 1.0842E-0019
8 0 6.7763E-0021 0.0000E+0000
1 9.4732E-0017 0.0000E+0000
2 4.7556E-0017 2.7105E-0020
3 2.1440E-0017 0.0000E+0000
4 1.1546E-0017 2.7105E-0020
5 9.0395E-0018 2.7105E-0020
6 1.1587E-0017 2.7105E-0020
7 5.2096E-0017 2.7105E-0020
8 5.9360E-0018 2.7105E-0020
9 4.5536E-0018 5.4210E-0020
10 1.7460E-0015 5.4210E-0020
9 0 0.0000E+0000 1.0842E-0019
1 1.4677E-0017 0.0000E+0000
2 6.1528E-0018 0.0000E+0000
3 1.3688E-0018 0.0000E+0000
4 2.3175E-0018 0.0000E+0000
5 5.4210E-0019 2.7105E-0020
6 5.2584E-0018 5.4210E-0020
7 6.2884E-0018 2.7105E-0020
8 7.3726E-0018 8.1315E-0020
9 1.0226E-0016 5.4210E-0020
10 8.0418E-0016 8.1315E-0020

Табл. 5.2 иллюстрирует значительный рост до 4-5 десятичных порядков


абсолютной погрешности аппроксимации по схеме на основе полинома (2.15) при
удалении от левой нижней вершины xi , y j  
подобласти из (2.4). Напротив,
модифицированная схема (2.31), (2.32) показывает стабильную точность во всей
подобласти (2.4), что обеспечивается её построением, а именно делением подобласти Gk~
из (2.4) на две дополнительные подобласти вида (2.6) с аппроксимацией на каждой
подобласти (2.6) соответствующим полиномом Ньютона.
202
Представленный в табл. 5.2 результат является типичным для рассматриваемых
схем и повторяется для всех идущих ниже функций. Значение  из (2.9) для схемы на
базе (2.15) принималось минимально возможным, при котором ещё выполнялась
14 18
аппроксимация, и равным 10 , для модификации (2.31), (2.32) –   10 .
В табл. 5.3 представлена погрешность аппроксимации функции z  cos x  y  .
Для обеих схем значения  задавались такими же, как и в предыдущем случае.
Немодифицированная схема на базе (2.15) аппроксимировала функцию на Px Py  2048
подобластях (2.4) полиномом степени N  7, модифицированная – на
Px Py  64 подобластях полиномом степени N  8 .

Таблица 5.3
Абсолютная погрешность аппроксимации функции z  cos x  y 
y x Pk~, N x, y   Pk~ , N x, y 
~
M
0.0E+0000 0.0E+0000 1.0000E+0000 0.0000E+0000 1.0000E+0000 0.0000E+0000
1.0E-0001 9.9500E-0001 0.0000E+0000 9.9500E-0001 0.0000E+0000
2.0E-0001 9.8007E-0001 0.0000E+0000 9.8007E-0001 0.0000E+0000
3.0E-0001 9.5534E-0001 0.0000E+0000 9.5534E-0001 0.0000E+0000
4.0E-0001 9.2106E-0001 0.0000E+0000 9.2106E-0001 0.0000E+0000
5.0E-0001 8.7758E-0001 0.0000E+0000 8.7758E-0001 0.0000E+0000
6.0E-0001 8.2534E-0001 5.4210E-0020 8.2534E-0001 5.4210E-0020
7.0E-0001 7.6484E-0001 0.0000E+0000 7.6484E-0001 0.0000E+0000
8.0E-0001 6.9671E-0001 0.0000E+0000 6.9671E-0001 0.0000E+0000
9.0E-0001 6.2161E-0001 0.0000E+0000 6.2161E-0001 -1.0842E-0019
1.0E-0001 0.0E+0000 9.9500E-0001 -3.3177E-0017 9.9500E-0001 0.0000E+0000
1.0E-0001 9.8007E-0001 -5.3180E-0017 9.8007E-0001 5.4210E-0020
2.0E-0001 9.5534E-0001 -2.4828E-0017 9.5534E-0001 0.0000E+0000
3.0E-0001 9.2106E-0001 -3.0737E-0017 9.2106E-0001 0.0000E+0000
4.0E-0001 8.7758E-0001 -2.2877E-0017 8.7758E-0001 0.0000E+0000
5.0E-0001 8.2534E-0001 -2.7972E-0017 8.2534E-0001 1.0842E-0019
6.0E-0001 7.6484E-0001 -3.1442E-0017 7.6484E-0001 5.4210E-0020
7.0E-0001 6.9671E-0001 -1.8540E-0017 6.9671E-0001 5.4210E-0020
8.0E-0001 6.2161E-0001 3.4966E-0017 6.2161E-0001 -5.4210E-0020
9.0E-0001 5.4030E-0001 -1.1817E-0017 5.4030E-0001 0.0000E+0000
2.0E-0001 0.0E+0000 9.8007E-0001 7.1557E-0018 9.8007E-0001 0.0000E+0000
1.0E-0001 9.5534E-0001 2.8731E-0018 9.5534E-0001 0.0000E+0000
2.0E-0001 9.2106E-0001 5.9631E-0018 9.2106E-0001 0.0000E+0000
3.0E-0001 8.7758E-0001 4.7813E-0017 8.7758E-0001 -5.4210E-0020
4.0E-0001 8.2534E-0001 4.8247E-0018 8.2534E-0001 5.4210E-0020
5.0E-0001 7.6484E-0001 5.6921E-0018 7.6484E-0001 0.0000E+0000
6.0E-0001 6.9671E-0001 6.3426E-0018 6.9671E-0001 0.0000E+0000
7.0E-0001 6.2161E-0001 4.0658E-0018 6.2161E-0001 -1.0842E-0019
8.0E-0001 5.4030E-0001 1.8486E-0017 5.4030E-0001 0.0000E+0000
9.0E-0001 4.5360E-0001 2.6292E-0018 4.5360E-0001 1.0842E-0019
3.0E-0001 0.0E+0000 9.5534E-0001 6.9931E-0018 9.5534E-0001 0.0000E+0000
1.0E-0001 9.2106E-0001 5.2584E-0018 9.2106E-0001 -5.4210E-0020
2.0E-0001 8.7758E-0001 5.8547E-0018 8.7758E-0001 0.0000E+0000
3.0E-0001 8.2534E-0001 2.1684E-0018 8.2534E-0001 1.0842E-0019
4.0E-0001 7.6484E-0001 4.7163E-0018 7.6484E-0001 5.4210E-0020
5.0E-0001 6.9671E-0001 5.0958E-0018 6.9671E-0001 0.0000E+0000
6.0E-0001 6.2161E-0001 3.5237E-0018 6.2161E-0001 -5.4210E-0020
7.0E-0001 5.4030E-0001 3.5779E-0018 5.4030E-0001 0.0000E+0000
8.0E-0001 4.5360E-0001 2.1684E-0019 4.5360E-0001 8.1315E-0020
9.0E-0001 3.6236E-0001 2.2226E-0018 3.6236E-0001 5.4210E-0020
4.0E-0001 0.0E+0000 9.2106E-0001 -3.0195E-0017 9.2106E-0001 0.0000E+0000
1.0E-0001 8.7758E-0001 -2.3690E-0017 8.7758E-0001 0.0000E+0000
203
y x Pk~, N x, y   Pk~ , N x, y 
~
M
2.0E-0001 8.2534E-0001 -2.5099E-0017 8.2534E-0001 1.0842E-0019
3.0E-0001 7.6484E-0001 -1.9136E-0017 7.6484E-0001 1.0842E-0019
4.0E-0001 6.9671E-0001 -1.9732E-0017 6.9671E-0001 0.0000E+0000
5.0E-0001 6.2161E-0001 -1.9732E-0017 6.2161E-0001 -1.0842E-0019
6.0E-0001 5.4030E-0001 -1.4040E-0017 5.4030E-0001 0.0000E+0000
7.0E-0001 4.5360E-0001 -1.3200E-0017 4.5360E-0001 1.0842E-0019
8.0E-0001 3.6236E-0001 -8.6465E-0018 3.6236E-0001 2.7105E-0020
9.0E-0001 2.6750E-0001 -6.9389E-0018 2.6750E-0001 -5.4210E-0020
5.0E-0001 0.0E+0000 8.7758E-0001 0.0000E+0000 8.7758E-0001 0.0000E+0000
1.0E-0001 8.2534E-0001 5.4210E-0020 8.2534E-0001 1.0842E-0019
2.0E-0001 7.6484E-0001 0.0000E+0000 7.6484E-0001 0.0000E+0000
3.0E-0001 6.9671E-0001 0.0000E+0000 6.9671E-0001 0.0000E+0000
4.0E-0001 6.2161E-0001 -5.4210E-0020 6.2161E-0001 -1.0842E-0019
5.0E-0001 5.4030E-0001 0.0000E+0000 5.4030E-0001 0.0000E+0000
6.0E-0001 4.5360E-0001 0.0000E+0000 4.5360E-0001 8.1315E-0020
7.0E-0001 3.6236E-0001 1.3553E-0019 3.6236E-0001 5.4210E-0020
8.0E-0001 2.6750E-0001 -1.6263E-0019 2.6750E-0001 -8.1315E-0020
9.0E-0001 1.6997E-0001 -1.3553E-0020 1.6997E-0001 -1.0842E-0019
6.0E-0001 0.0E+0000 8.2534E-0001 -2.8027E-0017 8.2534E-0001 5.4210E-0020
1.0E-0001 7.6484E-0001 -3.1496E-0017 7.6484E-0001 5.4210E-0020
2.0E-0001 6.9671E-0001 -1.8540E-0017 6.9671E-0001 -5.4210E-0020
3.0E-0001 6.2161E-0001 2.3256E-0017 6.2161E-0001 -5.4210E-0020
4.0E-0001 5.4030E-0001 -1.3064E-0017 5.4030E-0001 0.0000E+0000
5.0E-0001 4.5360E-0001 -1.6128E-0017 4.5360E-0001 8.1315E-0020
6.0E-0001 3.6236E-0001 -5.8167E-0017 3.6236E-0001 2.7105E-0020
7.0E-0001 2.6750E-0001 -7.6978E-0018 2.6750E-0001 -8.1315E-0020
8.0E-0001 1.6997E-0001 -3.5312E-0016 1.6997E-0001 -6.7763E-0020
9.0E-0001 7.0737E-0002 -8.2670E-0018 7.0737E-0002 0.0000E+0000
7.0E-0001 0.0E+0000 7.6484E-0001 5.6921E-0018 7.6484E-0001 0.0000E+0000
1.0E-0001 6.9671E-0001 7.2099E-0018 6.9671E-0001 0.0000E+0000
2.0E-0001 6.2161E-0001 4.0658E-0018 6.2161E-0001 -1.0842E-0019
3.0E-0001 5.4030E-0001 2.0004E-0017 5.4030E-0001 0.0000E+0000
4.0E-0001 4.5360E-0001 2.7105E-0018 4.5360E-0001 1.0842E-0019
5.0E-0001 3.6236E-0001 2.8460E-0018 3.6236E-0001 5.4210E-0020
6.0E-0001 2.6750E-0001 -5.9089E-0018 2.6750E-0001 -8.1315E-0020
7.0E-0001 1.6997E-0001 1.1519E-0018 1.6997E-0001 -1.0842E-0019
8.0E-0001 7.0737E-0002 -6.6719E-0017 7.0737E-0002 -1.3553E-0020
9.0E-0001 -2.9200E-0002 -2.3717E-0019 -2.9200E-0002 4.7434E-0020
8.0E-0001 0.0E+0000 6.9671E-0001 5.0415E-0018 6.9671E-0001 0.0000E+0000
1.0E-0001 6.2161E-0001 3.5237E-0018 6.2161E-0001 -5.4210E-0020
2.0E-0001 5.4030E-0001 3.5779E-0018 5.4030E-0001 0.0000E+0000
3.0E-0001 4.5360E-0001 -6.2342E-0019 4.5360E-0001 8.1315E-0020
4.0E-0001 3.6236E-0001 2.2226E-0018 3.6236E-0001 2.7105E-0020
5.0E-0001 2.6750E-0001 1.7618E-0018 2.6750E-0001 -8.1315E-0020
6.0E-0001 1.6997E-0001 1.0164E-0018 1.6997E-0001 -5.4210E-0020
7.0E-0001 7.0737E-0002 4.0658E-0019 7.0737E-0002 -6.7763E-0021
8.0E-0001 -2.9200E-0002 -6.5628E-0018 -2.9200E-0002 9.1480E-0020
9.0E-0001 -1.2884E-0001 -8.4026E-0019 -1.2884E-0001 5.4210E-0020
9.0E-0001 0.0E+0000 6.2161E-0001 -1.9787E-0017 6.2161E-0001 -1.0842E-0019
1.0E-0001 5.4030E-0001 -1.4095E-0017 5.4030E-0001 0.0000E+0000
2.0E-0001 4.5360E-0001 -1.3200E-0017 4.5360E-0001 1.3553E-0019
3.0E-0001 3.6236E-0001 -8.5381E-0018 3.6236E-0001 5.4210E-0020
4.0E-0001 2.6750E-0001 -6.9118E-0018 2.6750E-0001 -5.4210E-0020
5.0E-0001 1.6997E-0001 -4.4588E-0018 1.6997E-0001 -1.0842E-0019
6.0E-0001 7.0737E-0002 -1.1316E-0018 7.0737E-0002 -6.7763E-0021
7.0E-0001 -2.9200E-0002 1.8736E-0018 -2.9200E-0002 4.7434E-0020
8.0E-0001 -1.2884E-0001 4.1335E-0018 -1.2884E-0001 5.4210E-0020
9.0E-0001 -2.2720E-0001 7.5352E-0018 -2.2720E-0001 -1.3553E-0020
204

Результаты табл. 5.3 и следующих из неё выводов справедливы и для функции


z  cos  x  y  . Отсюда и из табл. 3 заключаем, что функцию z  cos  x  y 
модифицированная схема аппроксимирует в среднем на 2-4 десятичных порядка точнее,
отличаясь при этом стабильной точностью.
x y
В табл. 5.4 приводится погрешность аппроксимации функции z  e . Граница
абсолютной погрешности аппроксимации для схемы на основе (2.15) принималась равной
  10 14 , для модифицированной схемы (2.31), (2.32) –   10 17 . При этом
немодифицированная схема аппроксимировала рассматриваемую функцию на
Px Py  8192 подобластях (2.4) полиномом шестой степени, а модифицированная – на
Px Py  64 подобластях полиномом степени N  8 .
Таблица 5.4
x y
Абсолютная погрешность аппроксимации функции z  e
y x Pk~, N x, y   Pk~ , N  x, y 
~
M
0.0E+0000 0.0E+0000 1.0000E+0000 0.0000E+0000 1.0000E+0000 0.0000E+0000
1.0E-0001 1.1052E+0000 0.0000E+0000 1.1052E+0000 -1.0842E-0019
2.0E-0001 1.2214E+0000 0.0000E+0000 1.2214E+0000 0.0000E+0000
3.0E-0001 1.3499E+0000 0.0000E+0000 1.3499E+0000 0.0000E+0000
4.0E-0001 1.4918E+0000 1.0842E-0019 1.4918E+0000 2.1684E-0019
5.0E-0001 1.6487E+0000 0.0000E+0000 1.6487E+0000 0.0000E+0000
6.0E-0001 1.8221E+0000 0.0000E+0000 1.8221E+0000 -1.0842E-0019
7.0E-0001 2.0138E+0000 2.1684E-0019 2.0138E+0000 0.0000E+0000
8.0E-0001 2.2255E+0000 -2.1684E-0019 2.2255E+0000 0.0000E+0000
9.0E-0001 2.4596E+0000 -2.1684E-0019 2.4596E+0000 0.0000E+0000
1.0E-0001 0.0E+0000 1.1052E+0000 4.3368E-0019 1.1052E+0000 -1.0842E-0019
1.0E-0001 1.2214E+0000 1.0842E-0019 1.2214E+0000 -1.0842E-0019
2.0E-0001 1.3499E+0000 4.3368E-0019 1.3499E+0000 0.0000E+0000
3.0E-0001 1.4918E+0000 4.3368E-0019 1.4918E+0000 3.2526E-0019
4.0E-0001 1.6487E+0000 4.3368E-0019 1.6487E+0000 0.0000E+0000
5.0E-0001 1.8221E+0000 6.5052E-0019 1.8221E+0000 -1.0842E-0019
6.0E-0001 2.0138E+0000 4.3368E-0019 2.0138E+0000 0.0000E+0000
7.0E-0001 2.2255E+0000 4.3368E-0019 2.2255E+0000 -2.1684E-0019
8.0E-0001 2.4596E+0000 4.3368E-0019 2.4596E+0000 2.1684E-0019
9.0E-0001 2.7183E+0000 6.5052E-0019 2.7183E+0000 -2.1684E-0019
2.0E-0001 0.0E+0000 1.2214E+0000 -3.2526E-0019 1.2214E+0000 0.0000E+0000
1.0E-0001 1.3499E+0000 -1.0842E-0019 1.3499E+0000 -1.0842E-0019
2.0E-0001 1.4918E+0000 -1.0842E-0019 1.4918E+0000 3.2526E-0019
3.0E-0001 1.6487E+0000 -6.5052E-0019 1.6487E+0000 0.0000E+0000
4.0E-0001 1.8221E+0000 -1.0842E-0019 1.8221E+0000 -1.0842E-0019
5.0E-0001 2.0138E+0000 -4.3368E-0019 2.0138E+0000 0.0000E+0000
6.0E-0001 2.2255E+0000 -2.1684E-0019 2.2255E+0000 0.0000E+0000
7.0E-0001 2.4596E+0000 -4.3368E-0019 2.4596E+0000 0.0000E+0000
8.0E-0001 2.7183E+0000 6.0715E-0018 2.7183E+0000 2.1684E-0019
9.0E-0001 3.0042E+0000 -6.5052E-0019 3.0042E+0000 -4.3368E-0019
3.0E-0001 0.0E+0000 1.3499E+0000 3.2526E-0019 1.3499E+0000 0.0000E+0000
1.0E-0001 1.4918E+0000 3.9031E-0018 1.4918E+0000 2.1684E-0019
2.0E-0001 1.6487E+0000 2.1684E-0019 1.6487E+0000 1.0842E-0019
3.0E-0001 1.8221E+0000 -1.5178E-0018 1.8221E+0000 -1.0842E-0019
4.0E-0001 2.0138E+0000 0.0000E+0000 2.0138E+0000 -2.1684E-0019
5.0E-0001 2.2255E+0000 6.5052E-0019 2.2255E+0000 0.0000E+0000
6.0E-0001 2.4596E+0000 8.6736E-0019 2.4596E+0000 2.1684E-0019
7.0E-0001 2.7183E+0000 2.1684E-0019 2.7183E+0000 0.0000E+0000
8.0E-0001 3.0042E+0000 3.3827E-0017 3.0042E+0000 0.0000E+0000
9.0E-0001 3.3201E+0000 0.0000E+0000 3.3201E+0000 -4.3368E-0019
205
y x Pk~, N x, y   Pk~ , N  x, y 
~
M
4.0E-0001 0.0E+0000 1.4918E+0000 -5.4210E-0019 1.4918E+0000 2.1684E-0019
1.0E-0001 1.6487E+0000 -9.6494E-0018 1.6487E+0000 0.0000E+0000
2.0E-0001 1.8221E+0000 -2.1684E-0019 1.8221E+0000 -2.1684E-0019
3.0E-0001 2.0138E+0000 -1.1167E-0016 2.0138E+0000 0.0000E+0000
4.0E-0001 2.2255E+0000 -1.7347E-0018 2.2255E+0000 0.0000E+0000
5.0E-0001 2.4596E+0000 -1.0842E-0018 2.4596E+0000 2.1684E-0019
6.0E-0001 2.7183E+0000 -2.5370E-0017 2.7183E+0000 0.0000E+0000
7.0E-0001 3.0042E+0000 -4.3368E-0019 3.0042E+0000 -2.1684E-0019
8.0E-0001 3.3201E+0000 3.0141E-0017 3.3201E+0000 -2.1684E-0019
9.0E-0001 3.6693E+0000 4.7705E-0018 3.6693E+0000 0.0000E+0000
5.0E-0001 0.0E+0000 1.6487E+0000 0.0000E+0000 1.6487E+0000 0.0000E+0000
1.0E-0001 1.8221E+0000 0.0000E+0000 1.8221E+0000 -1.0842E-0019
2.0E-0001 2.0138E+0000 2.1684E-0019 2.0138E+0000 0.0000E+0000
3.0E-0001 2.2255E+0000 0.0000E+0000 2.2255E+0000 0.0000E+0000
4.0E-0001 2.4596E+0000 0.0000E+0000 2.4596E+0000 2.1684E-0019
5.0E-0001 2.7183E+0000 0.0000E+0000 2.7183E+0000 0.0000E+0000
6.0E-0001 3.0042E+0000 4.3368E-0019 3.0042E+0000 -2.1684E-0019
7.0E-0001 3.3201E+0000 -2.1684E-0019 3.3201E+0000 -4.3368E-0019
8.0E-0001 3.6693E+0000 0.0000E+0000 3.6693E+0000 2.1684E-0019
9.0E-0001 4.0552E+0000 -4.3368E-0019 4.0552E+0000 0.0000E+0000
6.0E-0001 0.0E+0000 1.8221E+0000 6.5052E-0019 1.8221E+0000 -1.0842E-0019
1.0E-0001 2.0138E+0000 2.1684E-0019 2.0138E+0000 0.0000E+0000
2.0E-0001 2.2255E+0000 6.5052E-0019 2.2255E+0000 -2.1684E-0019
3.0E-0001 2.4596E+0000 4.3368E-0019 2.4596E+0000 2.1684E-0019
4.0E-0001 2.7183E+0000 6.5052E-0019 2.7183E+0000 2.1684E-0019
5.0E-0001 3.0042E+0000 1.0842E-0018 3.0042E+0000 -2.1684E-0019
6.0E-0001 3.3201E+0000 6.5052E-0019 3.3201E+0000 -2.1684E-0019
7.0E-0001 3.6693E+0000 1.0842E-0018 3.6693E+0000 4.3368E-0019
8.0E-0001 4.0552E+0000 4.3368E-0019 4.0552E+0000 -4.3368E-0019
9.0E-0001 4.4817E+0000 8.6736E-0019 4.4817E+0000 0.0000E+0000
7.0E-0001 0.0E+0000 2.0138E+0000 -4.3368E-0019 2.0138E+0000 0.0000E+0000
1.0E-0001 2.2255E+0000 -4.3368E-0019 2.2255E+0000 -2.1684E-0019
2.0E-0001 2.4596E+0000 -6.5052E-0019 2.4596E+0000 0.0000E+0000
3.0E-0001 2.7183E+0000 2.8189E-0018 2.7183E+0000 0.0000E+0000
4.0E-0001 3.0042E+0000 -4.3368E-0019 3.0042E+0000 -2.1684E-0019
5.0E-0001 3.3201E+0000 -8.6736E-0019 3.3201E+0000 -4.3368E-0019
6.0E-0001 3.6693E+0000 0.0000E+0000 3.6693E+0000 2.1684E-0019
7.0E-0001 4.0552E+0000 -8.6736E-0019 4.0552E+0000 0.0000E+0000
8.0E-0001 4.4817E+0000 -8.6736E-0019 4.4817E+0000 0.0000E+0000
9.0E-0001 4.9530E+0000 -4.3368E-0019 4.9530E+0000 0.0000E+0000
8.0E-0001 0.0E+0000 2.2255E+0000 4.3368E-0019 2.2255E+0000 0.0000E+0000
1.0E-0001 2.4596E+0000 -3.4694E-0018 2.4596E+0000 2.1684E-0019
2.0E-0001 2.7183E+0000 2.1684E-0019 2.7183E+0000 0.0000E+0000
3.0E-0001 3.0042E+0000 2.2985E-0017 3.0042E+0000 0.0000E+0000
4.0E-0001 3.3201E+0000 0.0000E+0000 3.3201E+0000 -2.1684E-0019
5.0E-0001 3.6693E+0000 6.5052E-0019 3.6693E+0000 2.1684E-0019
6.0E-0001 4.0552E+0000 -8.6736E-0018 4.0552E+0000 -4.3368E-0019
7.0E-0001 4.4817E+0000 4.3368E-0019 4.4817E+0000 -4.3368E-0019
8.0E-0001 4.9530E+0000 -1.4355E-0016 4.9530E+0000 -4.3368E-0019
9.0E-0001 5.4739E+0000 4.3368E-0019 5.4739E+0000 0.0000E+0000
9.0E-0001 0.0E+0000 2.4596E+0000 -8.6736E-0019 2.4596E+0000 0.0000E+0000
1.0E-0001 2.7183E+0000 -1.4962E-0017 2.7183E+0000 0.0000E+0000
2.0E-0001 3.0042E+0000 -4.3368E-0019 3.0042E+0000 -4.3368E-0019
3.0E-0001 3.3201E+0000 -2.5457E-0016 3.3201E+0000 -2.1684E-0019
4.0E-0001 3.6693E+0000 -8.8905E-0018 3.6693E+0000 2.1684E-0019
5.0E-0001 4.0552E+0000 -1.3010E-0018 4.0552E+0000 0.0000E+0000
6.0E-0001 4.4817E+0000 4.1633E-0017 4.4817E+0000 0.0000E+0000
7.0E-0001 4.9530E+0000 -4.3368E-0019 4.9530E+0000 0.0000E+0000
206
y x Pk~, N x, y   Pk~ , N  x, y 
~
M
8.0E-0001 5.4739E+0000 1.9646E-0016 5.4739E+0000 0.0000E+0000
9.0E-0001 6.0496E+0000 -7.8063E-0018 6.0496E+0000 0.0000E+0000

x y
Для функции z  e характерен рост абсолютной погрешности аппроксимации
при удалении от начального узла интерполирования, аналогичный представленному в
x y
табл. 2. С учётом этого и табл. 4 заключаем, что функцию z  e модифицированная
схема аппроксимирует точнее схемы базирующейся лишь на полиноме (2.15) на 2-4
десятичных порядка, отличаясь при этом стабильной точностью.
В табл. 5.5 представлены результаты аппроксимации функции z  xy sh x  y  2 2

по обеим схемам. Граница абсолютной погрешности аппроксимации была равна для
14 17
немодифицированной схемы –   10 , для модифицированной –   10 . При этом
немодифицированная схема аппроксимировала функцию на Px Py  16384 подобластях,
полиномом степени N  7 модифицированная – на Px Py  4096 полиномом степени
N  7.
Таблица 5.5
Абсолютная погрешность аппроксимации функции z  xy sh x  y  2 2

y x Pk~, N x, y   Pk~ , N  x, y 
~
M
0.0E+0000 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
2.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
3.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
4.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
5.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
6.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
7.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
8.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
9.0E-0001 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 2.0001E-0004 4.9657E-0020 2.0001E-0004 -6.3792E-0021
2.0E-0001 1.0004E-0003 9.5079E-0020 1.0004E-0003 2.2658E-0020
3.0E-0001 3.0050E-0003 1.3362E-0019 3.0050E-0003 7.6233E-0021
4.0E-0001 6.8328E-0003 1.6771E-0019 6.8328E-0003 -2.8799E-0020
5.0E-0001 1.3147E-0002 -1.2282E-0019 1.3147E-0002 -8.4703E-0022
6.0E-0001 2.2710E-0002 -1.2705E-0019 2.2710E-0002 -8.4703E-0021
7.0E-0001 3.6477E-0002 -1.2875E-0019 3.6477E-0002 8.1315E-0020
8.0E-0001 5.5740E-0002 -1.3553E-0019 5.5740E-0002 6.0986E-0020
9.0E-0001 8.2353E-0002 -8.8091E-0020 8.2353E-0002 -1.4908E-0019
2.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 1.0004E-0003 -9.9526E-0021 1.0004E-0003 2.2658E-0020
2.0E-0001 3.2034E-0003 -2.1599E-0020 3.2034E-0003 7.4115E-0021
3.0E-0001 7.8220E-0003 -2.7105E-0020 7.8220E-0003 1.0842E-0019
4.0E-0001 1.6107E-0002 -1.0672E-0019 1.6107E-0002 5.0822E-0021
5.0E-0001 2.9408E-0002 7.1151E-0020 2.9408E-0002 0.0000E+0000
6.0E-0001 4.9290E-0002 8.8091E-0020 4.9290E-0002 3.0493E-0020
7.0E-0001 7.7723E-0002 9.4868E-0020 7.7723E-0002 1.3553E-0020
8.0E-0001 1.1738E-0001 9.4868E-0020 1.1738E-0001 2.9816E-0019
9.0E-0001 1.7210E-0001 5.9631E-0019 1.7210E-0001 1.3553E-0020
3.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 3.0050E-0003 -1.0587E-0020 3.0050E-0003 7.6233E-0021
207
y x Pk~, N x, y   Pk~ , N  x, y 
~
M
2.0E-0001 7.8220E-0003 -1.8635E-0020 7.8220E-0003 1.0842E-0019
3.0E-0001 1.6288E-0002 1.2197E-0019 1.6288E-0002 1.6941E-0021
4.0E-0001 3.0313E-0002 -3.3881E-0020 3.0313E-0002 2.3717E-0020
5.0E-0001 5.1988E-0002 1.4569E-0019 5.1988E-0002 -1.3553E-0020
6.0E-0001 8.3762E-0002 1.6941E-0019 8.3762E-0002 1.3553E-0020
7.0E-0001 1.2874E-0001 1.7618E-0019 1.2874E-0001 1.4908E-0019
8.0E-0001 1.9118E-0001 -3.2391E-0018 1.9118E-0001 2.7105E-0020
9.0E-0001 2.7716E-0001 -2.2416E-0017 2.7716E-0001 0.0000E+0000
4.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 6.8328E-0003 1.2367E-0019 6.8328E-0003 -2.9223E-0020
2.0E-0001 1.6107E-0002 3.0832E-0019 1.6107E-0002 5.0822E-0021
3.0E-0001 3.0313E-0002 4.6350E-0018 3.0313E-0002 2.2023E-0020
4.0E-0001 5.2078E-0002 -4.8620E-0018 5.2078E-0002 -6.7763E-0021
5.0E-0001 8.4317E-0002 -1.3281E-0018 8.4317E-0002 -6.7763E-0021
6.0E-0001 1.3050E-0001 -1.1655E-0018 1.3050E-0001 -4.0658E-0020
7.0E-0001 1.9509E-0001 -3.1035E-0018 1.9509E-0001 1.3553E-0020
8.0E-0001 2.8419E-0001 -1.3389E-0017 2.8419E-0001 2.7105E-0020
9.0E-0001 4.0660E-0001 -3.0222E-0017 4.0660E-0001 -2.7105E-0020
5.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 1.3147E-0002 0.0000E+0000 1.3147E-0002 -8.4703E-0022
2.0E-0001 2.9408E-0002 -3.3881E-0021 2.9408E-0002 0.0000E+0000
3.0E-0001 5.1988E-0002 -6.7763E-0021 5.1988E-0002 -1.3553E-0020
4.0E-0001 8.4317E-0002 0.0000E+0000 8.4317E-0002 -6.7763E-0021
5.0E-0001 1.3027E-0001 -1.3553E-0020 1.3027E-0001 0.0000E+0000
6.0E-0001 1.9456E-0001 4.0658E-0020 1.9456E-0001 1.3553E-0020
7.0E-0001 2.8329E-0001 5.4210E-0020 2.8329E-0001 0.0000E+0000
8.0E-0001 4.0489E-0001 0.0000E+0000 4.0489E-0001 2.7105E-0020
9.0E-0001 5.7148E-0001 0.0000E+0000 5.7148E-0001 0.0000E+0000
6.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 2.2710E-0002 -5.3871E-0019 2.2710E-0002 -8.4703E-0021
2.0E-0001 4.9290E-0002 -1.0808E-0018 4.9290E-0002 3.0493E-0020
3.0E-0001 8.3762E-0002 -1.6737E-0018 8.3762E-0002 1.3553E-0020
4.0E-0001 1.3050E-0001 -2.3310E-0018 1.3050E-0001 -4.0658E-0020
5.0E-0001 1.9456E-0001 -4.7163E-0018 1.9456E-0001 1.3553E-0020
6.0E-0001 2.8218E-0001 -5.8276E-0018 2.8218E-0001 0.0000E+0000
7.0E-0001 4.0157E-0001 -7.1828E-0018 4.0157E-0001 1.0842E-0019
8.0E-0001 5.6410E-0001 -8.7820E-0018 5.6410E-0001 1.6263E-0019
9.0E-0001 7.8614E-0001 -1.0950E-0017 7.8614E-0001 5.4210E-0020
7.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 3.6477E-0002 1.8296E-0019 3.6477E-0002 8.1315E-0020
2.0E-0001 7.7723E-0002 3.6592E-0019 7.7723E-0002 6.7763E-0021
3.0E-0001 1.2874E-0001 5.5565E-0019 1.2874E-0001 1.4908E-0019
4.0E-0001 1.9509E-0001 2.1413E-0018 1.9509E-0001 1.3553E-0020
5.0E-0001 2.8329E-0001 1.7347E-0018 2.8329E-0001 0.0000E+0000
6.0E-0001 4.0157E-0001 2.1955E-0018 4.0157E-0001 1.0842E-0019
7.0E-0001 5.6084E-0001 2.4395E-0018 5.6084E-0001 -1.0842E-0019
8.0E-0001 7.7633E-0001 3.0900E-0018 7.7633E-0001 1.6263E-0019
9.0E-0001 1.0700E+0000 -6.0715E-0018 1.0700E+0000 -1.0842E-0019
8.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 5.5740E-0002 2.2700E-0019 5.5740E-0002 6.0986E-0020
2.0E-0001 1.1738E-0001 4.5401E-0019 1.1738E-0001 3.0493E-0019
3.0E-0001 1.9118E-0001 -1.1519E-0018 1.9118E-0001 1.3553E-0020
4.0E-0001 2.8419E-0001 3.5399E-0017 2.8419E-0001 2.7105E-0020
5.0E-0001 4.0489E-0001 2.8731E-0018 4.0489E-0001 2.7105E-0020
6.0E-0001 5.6410E-0001 3.2526E-0018 5.6410E-0001 1.6263E-0019
7.0E-0001 7.7633E-0001 3.7947E-0018 7.7633E-0001 1.6263E-0019
8.0E-0001 1.0620E+0000 1.2576E-0017 1.0620E+0000 1.0842E-0019
9.0E-0001 1.4503E+0000 -4.0766E-0016 1.4503E+0000 0.0000E+0000
208
y x Pk~, N x, y   Pk~ , N  x, y 
~
M
9.0E-0001 0.0E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000 0.0000E+0000
1.0E-0001 8.2353E-0002 -1.5585E-0019 8.2353E-0002 -1.4230E-0019
2.0E-0001 1.7210E-0001 -2.1684E-0018 1.7210E-0001 2.7105E-0020
3.0E-0001 2.7716E-0001 -1.7076E-0018 2.7716E-0001 0.0000E+0000
4.0E-0001 4.0660E-0001 -1.6724E-0016 4.0660E-0001 0.0000E+0000
5.0E-0001 5.7148E-0001 -2.0925E-0017 5.7148E-0001 0.0000E+0000