Вы находитесь на странице: 1из 421

Министерство образования и науки РФ

Нижегородский государственный университет им. Н.И. Лобачевского


Национальный исследовательский университет

Ю.И. Неймарк

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
КАК НАУКА И ИСКУССТВО

Учебник
Издание второе, исправленное и дополненное

Нижний Новгород
Издательство Нижегородского университета
2010
УДК 519.8
ББК В143
Н 45

Неймарк Ю.И.
Н 45 Математическое моделирование как наука и искусство: Учебник. −
2-е изд., испр. и доп. − Н. Новгород: Изд-во Нижегородского госуниверсите-
та, 2010. − 420 с.

ISBN 978−5−91326−145−8

В учебнике рассказывается о разнообразных конкретных математиче-


ских эволюционных моделях и их исследовании в механике, физике, биоло-
гии, технике и управлении, моделях игр и поиска решения, волновых явлени-
ях, фундаментальных законах макромира и микромира, пространстве и вре-
мени и др.
Для студентов, аспирантов, преподавателей, инженеров и всех интере-
сующихся математическим моделированием.

Печатается по решению Ученого совета ННГУ

ISBN 978−5−91326−145−8 ББК В143

 Ю.И. Неймарк, 2010


 Нижегородский госуниверситет
им. Н.И. Лобачевского, 2010
Оглавление III

ОГЛАВЛЕНИЕ
ПРЕДИСЛОВИЕ ......................................................................................................................X
ВВЕДЕНИЕ ........................................................................................................................... XIV
Математика как язык. Математическая модель. Математическое моде-
лирование как метод изучения окружающего мира
1. ДИНАМИЧЕСКАЯ СИСТЕМА .............................................................................................1
Детерминизм Лапласа. Динамическая система как основная математи-
ческая модель естествознания. Фазовый портрет. Примеры динамиче-
ских систем и их фазовых портретов: простейшие примеры, игра
«жизнь», маятник на вращающемся основании. Фазовый портрет как
средство отображения наших знаний о динамике модели и как средство
ее изучения
2. ВЫТЕКАНИЕ ЖИДКОСТИ ИЗ СОСУДА ........................................................................19
Закон Торричелли и простейшая модель вытекания. Эффект сжатия
струи. Недостаточность простейшей модели. Уточненные модели, учи-
тывающие разгон жидкости. Фазовый портрет и отображение на нем
быстрой фазы разгона и медленного вытекания. Уточнение фазы раз-
гона
3. РАВНОВЕСИЕ И АВТОКОЛЕБАНИЯ УРОВНЯ ЖИДКОСТИ
В СОСУДЕ ПРИ ОДНОВРЕМЕННОМ ПРИТОКЕ И ОТТОКЕ ...................................30
Равномерный приток и отток через дырочку и через сифон
4. ПЕРЕХОДНЫЙ ПРОЦЕСС, СОСТОЯНИЕ РАВНОВЕСИЯ
И АВТОКОЛЕБАНИЯ ...........................................................................................................34
Подводится итог полученным знаниям о возможных типах движений:
переходные процессы, устойчивые равновесия и автоколебания
5. ДИНАМИКА УРОВНЯ ЗЕРКАЛА ВОДОХРАНИЛИЩА
С ГИДРОСТАНЦИЕЙ ............................................................................................................37
Критические значения. Бифуркационная диаграмма
6. ЭНЕРГЕТИЧЕСКАЯ МОДЕЛЬ СЕРДЦА .........................................................................42
Виды кризисных состояний. Критические значения. Сужение жизнен-
ных возможностей
7. ЗАСОЛЕНИЕ ВОДОЕМА С ЗАЛИВОМ
И ЗАГАДКИ КАСПИЙСКОГО МОРЯ ...............................................................................46
Загрязнение водоема сточными водами с растворимыми загрязнения-
ми. Загадка Каспийского моря. Засоление водоема с заливом. Равно-
весный водный режим и равновесная соленость. Возможность непред-
сказуемых смен равновесного уровня
8. ЭКСПОНЕНЦИАЛЬНЫЕ ПРОЦЕССЫ ............................................................................55
Математическая модель. Периоды полураспада и удвоения. Примеры
экспоненциальных процессов: размножение и гибель, радиоактивность,
цепные реакции, разряд конденсатора, разгон ракеты, торможение, по-
глощение излучения, охлаждение, распространение эпидемии и слухов,
рост численности населения, производства, знаний, приближение и удале-
ние от равновесия и др. Уточнение модели: учет насыщения, взрывной ха-
рактер роста. Явление внезапного кризиса, «схлопывания» и исключи-
тельности
IV Ю.И. Неймарк. Математическое моделирование как наука и искусство

9. ДИНАМИКА СОСУЩЕСТВОВАНИЯ ПОПУЛЯЦИЙ ..................................................65


Математические модели сосуществования: «хищник – жертва», конку-
ренция (противостояние), симбиоз. Фазовые и бифуркационные порт-
реты
10. ПРОТОЧНЫЙ БИОЛОГИЧЕСКИЙ РЕАКТОР ..............................................................74
Простейшая модель биологического реактора (хемостат): фазовый
портрет, оптимизация
11. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИММУННОГО ОТВЕТА
ОРГАНИЗМА НА ВТОРЖЕНИЕ ИНФЕКЦИИ ...............................................................77
Рассматривается упрощенная феноменологическая модель иммунного от-
вета организма на инфекцию в виде системы дифференциальных уравнений
четвертого порядка, которая обнаруживает основные варианты течения за-
болевания: выздоровление и выздоровление через обострение, гибель и ги-
бель от истощения ресурсов, хроническое заболевание с равновесным и пе-
риодическим течением, бациллоносительство, их зависимости
12. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СООБЩЕСТВА
«ПРОИЗВОДИТЕЛИ–ПРОДУКТ–УПРАВЛЕНЦЫ» .......................................................83
Возможные виды фазовых портретов. Эволюция сообщества с ростом
технологии производства в зависимости от остальных параметров
13. ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР ..............................................................................................92
Математическая модель линейного осциллятора. Возможные типы
движений. Фазовый и бифуркационный портреты. Что описывает ли-
нейный осциллятор: типы равновесий, гармонические, затухающие и
нарастающие колебания
14. ЭЛЕКТРОМЕХАНИЧЕСКИЕ АНАЛОГИИ. УРАВНЕНИЯ
ЛАГРАНЖА – МАКСВЕЛЛА .............................................................................................103
Электромеханические аналогии. Уравнения Лагранжа–Максвелла ме-
ханических, электрических и электромеханических систем. Инвари-
антность уравнений Лагранжа. Принцип наименьшего действия как ва-
риационная форма математических моделей. Примеры и уравнения Ла-
гранжа – Максвелла с обобщенными силами
15. ЧАСЫ ГАЛИЛЕЯ – ГЮЙГЕНСА .....................................................................................113
Как и почему появились часы Галилея–Гюйгенса, что в них принципиально
нового, что определяет точность часов? Анализ причин погрешностей и пу-
ти их уменьшения. Простейшая математическая модель часов Галилея –
Гюйгенса. Фазовый портрет. Отображение А. Пуанкаре и диаграмма точеч-
ного отображения Кенигса – Ламерея. Часы как автоколебательная система,
как система с обратной связью
16. ГЕНЕРАТОР ЭЛЕКТРИЧЕСКИХ КОЛЕБАНИЙ .........................................................124
Генератор электрических колебаний как электрический аналог часов
Галилея – Гюйгенса. Математическая модель. Уравнение Ван-дер-Поля
и его фазовый портрет. Приближенное исследование уравнения Ван-
дер-Поля и сведение к точечному отображению. Мягкий режим возбу-
ждений автоколебаний
17. МЯГКИЙ И ЖЕСТКИЙ РЕЖИМЫ ВОЗБУЖДЕНИЯ
АВТОКОЛЕБАНИЙ .............................................................................................................130
Фазовые портреты и бифуркационные портреты мягкого и жесткого возбуж-
дения автоколебаний на основе исследования точечного отображения
Оглавление V
18. СТОХАСТИЧЕСКИЙ ОСЦИЛЛЯТОР («ЧАСЫ НАОБОРОТ») ................................135
Осциллятор с непредсказуемым поведением. Математическая модель,
фазовый портрет, точечное отображение. Непредсказуемость и случай-
ность. Два типа поведения динамических систем: устойчивость и неус-
тойчивость, предсказуемость и непредсказуемость. Осциллятор (дина-
мическая система) как генератор стохастических колебаний
19. НЕУСТОЙЧИВОСТЬ И АВТОКОЛЕБАНИЯ,
ВЫЗЫВАЕМЫЕ ТРЕНИЕМ ..............................................................................................143
Математическая модель и ее фазовый портрет. Классическая кулонов-
ская модель сухого трения и необходимость ее уточнения. Возбужде-
ние колебаний трением и возникновение автоколебаний, исчезновение
трения
20. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ ЛИНЕЙНОГО ОСЦИЛЛЯТОРА ........................152
Математическая модель. Амплитудно-фазовая частотная характери-
стика. Явления резонанса и фазового сдвига. Примеры килевой качки
корабля и динамического гасителя колебаний. Спектральный подход и
принцип суперпозиции. Обобщенная δ-функция
21. ПАРАМЕТРИЧЕСКОЕ ВОЗБУЖДЕНИЕ И СТАБИЛИЗАЦИЯ ................................162
Математическая модель. Явления параметрического возбуждения и ре-
зонанса. Особенности параметрического резонанса, отличающие его от
обычного резонанса
22. НОРМАЛЬНЫЕ КОЛЕБАНИЯ И БИЕНИЯ ...................................................................169
Математическая модель двух взаимодействующих осцилляторов. Нор-
мальные колебания и перекачка энергии, вызывающая явление биений
23. СТАБИЛИЗАЦИЯ ПЕРЕВЕРНУТОГО МАЯТНИКА ...................................................174
Управление как могучее средство изменения поведения и свойств ди-
намических объектов и систем. Жонглирование вертикально стоящей
на опоре и двумя стоящими друг на друге палочками. Математические
модели. Стратегия управления, условия стабилизации, роль запаздыва-
ния
24. УПРАВЛЯЕМЫЙ МАЯТНИК И ДВУНОГАЯ ХОДЬБА ..............................................184
Перевернутый управляемый маятник как математическая модель авто-
колебательной двуногой ходьбы
25. ДИНАМИЧЕСКИЕ МОДЕЛИ ИГР, ОБУЧЕНИЯ
И ЦЕЛЕСООБРАЗНОГО ПОВЕДЕНИЯ ..........................................................................192
Автоматные модели игроков и динамические детерминированные и
стохастические модели игр
26. ПЕРСЕПТРОН И РАСПОЗНАВАНИЕ ОБРАЗОВ .........................................................207
Рассказывается о принципе работы персептрона Розенблата, трактуе-
мого как динамическая система. Описываются математические модели
объекта, образа, распознавания и обучения распознаванию. Формули-
руется и доказывается теорема о конечности числа ошибок. Обнаружи-
вается связь между алгоритмом обучения персептрона и стохастиче-
ской аппроксимацией
27. ЗАКОНЫ КЕПЛЕРА И ПРОБЛЕМА ДВУХ ТЕЛ,
РЕШЕННАЯ НЬЮТОНОМ ................................................................................................215
Рассказывается о проблеме двух тел и ее связи с некоторыми вопроса-
ми астрономии: черные дыры, расширение Вселенной, эволюция Сол-
нечной системы
VI Ю.И. Неймарк. Математическое моделирование как наука и искусство

28. РАСПРЕДЕЛЕННЫЕ ДИНАМИЧЕСКИЕ МОДЕЛИ


МЕХАНИКИ И ФИЗИКИ ....................................................................................................228
Определяется понятие распределенной динамической системы. Опи-
сываются распределенные модели классической математической физи-
ки, механики, электродинамики и квантовой механики: уравнения Эй-
лера и Навье – Стокса, Максвелла и Шредингера
29. ФУНДАМЕНТАЛЬНОЕ РЕШЕНИЕ УРАВНЕНИЯ
ТЕПЛОПРОВОДНОСТИ ....................................................................................................237
Рассказывается о расплывании поля температур, диффундирующе-
го вещества или плотности вероятности блуждающей случайной
частицы, поначалу сосредоточенных в некоторой точке. Решается
задача о прогреве полупространства
30. БЕГУЩИЕ ВОЛНЫ И ДИСПЕРСИОННОЕ УРАВНЕНИЕ ........................................245
Рассказывается о бегущих гармонических волнах. Решается задача о тем-
пературе поверхностного слоя земли под влиянием суточных и годовых
колебаний над ним. Решается задача о скорости намерзания льда на по-
верхности воды
31. ТЕОРИЯ ЭЛЕКТРОМАГНЕТИЗМА ФАРАДЕЯ – МАКСВЕЛЛА
И ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ МАКСВЕЛЛА – ГЕРЦА ..................................253
Показывается наличие у уравнений Максвелла решения в виде бегущей
со скоростью света гармонической волны
32. ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ВОЛН ......................................................................257
Находятся отраженная и преломленная волны при набегании на грани-
цу раздела сред бегущей гармонической волны
33. СТОЯЧИЕ ВОЛНЫ И КОЛЕБАНИЯ ОГРАНИЧЕННОЙ СТРУНЫ ........................260
Излагается метод Фурье изучения колебаний струны. Решается задача
о колебаниях струны, вызванных сосредоточенным ударом. Выясняет-
ся спектр и его связь с «окраской» звука
34. МИКРОЧАСТИЦА ...............................................................................................................265
Рассказывается об особенностях микромира. О необходимости пе-
ресмотра привычных представлений классической физики. Излага-
ется формализм квантовой механики и приводятся примеры его
применения. Описываются понятия квантового состояния, опера-
тора его изменения и его связь с измеряемыми и наблюдаемыми
физическими величинами. Рассматривается поведение квантовой
частицы в потенциальной яме, в радиально-симметричном элек-
трическом поле заряда
35. ПРОСТРАНСТВО И ВРЕМЯ ..............................................................................................284
Рассказывается о преобразованиях Галилея и Лоренца. Об инвариант-
ности уравнений Ньютона и неинвариантности уравнений Максвелла
по отношению к преобразованиям Галилея. Выводятся преобразова-
ния Лоренца из свойства сохранения волнового уравнения, вытекаю-
щего из уравнений Максвелла, и представлений однородности и изо-
тропности пространства и однородности времени. Рассматривается
связь между событиями, наблюдаемыми в разных системах коорди-
нат: сокращение расстояний и замедление часов, сложение скоростей.
Вводится четырехмерное пространство – время. Обсуждаются поня-
тие одновременности и принцип причинности. Указываются необхо-
димые уточнения уравнений Ньютона в случае очень больших скоро-
стей движения, приближающихся к скорости света
Оглавление VII
36. РАЗГОН РЕЛЯТИВИСТСКИХ ЧАСТИЦ В ЦИКЛОТРОНЕ ......................................296
Рассматривается модель движения релятивистской частицы в цикло-
троне. Обнаруживается наличие квазистационарного устойчивого ре-
зонансного разгона
37. МАТЕМАТИКА КАК ЯЗЫК, КАК ОПЕРАЦИОННАЯ СИСТЕМА
И МОДЕЛИ ............................................................................................................................300
Математика как особый язык, включающий операционную систему и
математические модели. Изоморфизм операционных систем и моделей.
Роль изоморфизма в математическом моделировании
38. ГЕОМЕТРИЧЕСКОЕ, ФИЗИЧЕСКОЕ, АНАЛОГОВОЕ,
МАТЕМАТИЧЕСКОЕ И СТАТИСТИЧЕСКОЕ ИМИТАЦИОННОЕ
МОДЕЛИРОВАНИЕ .............................................................................................................306
О геометрическом, физическом, математическом моделировании и ле-
жащих в их основе изоморфизмах, о критериях моделируемости и пра-
вилах моделирования
39. ОБЩАЯ СХЕМА МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ..............................314
О двух разных взаимосвязанных частях математического моделирова-
ния (составление модели и ее исследование) и основных этапах моде-
лирования и некоторых полезных соображениях
40. МОДЕЛИ ВИБРОПОГРУЖЕНИЯ ....................................................................................317
О вибропогружении и его математическом моделировании
41. ОСНОВНАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ
СОВРЕМЕННОЙ НАУКИ И ТЕОРИЯ КОЛЕБАНИЙ .................................................322
Динамическая система как основная модель точной науки, о ее роли и
ее изучении. Об автоколебаниях, регулярных и хаотических движениях
и гомоклинических структурах. О теории колебаний как всеобъемлю-
щей науке об эволюционных процессах. О роли А.А. Андронова в ста-
новлении нелинейной теории колебаний
42. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ КАК ПЛОДОТВОРНАЯ ИДЕЯ
НАУЧНОГО ИССЛЕДОВАНИЯ. D-РАЗБИЕНИЕ .........................................................337
На примере устойчивости линейных систем (проблемы Рауса − Гур-
вица, робастной устойчивости и др.) показывается возможная роль ма-
тематической модели как плодотворной идеи научного использования
43. ИДЕАЛИЗАЦИЯ, МАТЕМАТИЧЕСКАЯ КОРРЕКТНОСТЬ
И РЕАЛЬНОСТЬ ...................................................................................................................344
На примерах моделирования центробежного регулятора скорости вра-
щения и известной проблемы парадокса Пенлеве в механике иллюст-
рируется роль идеализации в математической корректности, в дости-
жении требуемой адекватности результатов моделирования реальному
объекту
44. ДИНАМИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ МЕТОДА НАИМЕНЬШИХ
КВАДРАТОВ И ГЛОБАЛЬНОЙ ПОИСКОВОЙ ОПТИМИЗАЦИИ
С АДАПТИВНОЙ МОДЕЛЬЮ ..........................................................................................355
На примерах широко известного метода наименьших квадратов и гло-
бальной поисковой оптимизации функций многих переменных иллю-
стрируется полезность широкого использования модели динамической
системы
45. ИГРОВАЯ МОДЕЛЬ ЧЕЛОВЕЧЕСКОГО ОБЩЕСТВА ..............................................360
Аргументируется игровая модель человеческого общества. Обнару-
живаются основные принципы его функционирования, организации
VIII Ю.И. Неймарк. Математическое моделирование как наука и искусство

и управления. Изучается идеальная игра людей в обществе и выясняет-


ся существо и пути преодоления проблемы власти
46. СИНТЕЗ И ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ
КВАЗИИНВАРИАНТНОГО ЛИНЕЙНОГО
И НЕЛИНЕЙНОГО УПРАВЛЕНИЯ .................................................................................382
На примере простейшей математической модели линейной минимально фазо-
вой системы квазиинвариантного управления рассматриваются вопросы фи-
зической реализуемости, устойчивости, ошибки управления, на основе кото-
рых решается задача синтеза квазиинвариантного управления и возникает
возможность расширения управления путем синтеза нелинейной системы,
объединяющей квазиинвариантную стратегию управления с классической
47. АБСТРАКТНАЯ И РЕАЛЬНАЯ МАТЕМАТИЧЕСКИЕ ТЕОРИИ
ДИНАМИЧЕСКИХ СИСТЕМ ............................................................................................396
Глава содержит краткое описание современного состояния основ теории ди-
намических систем
СПИСОК ЛИТЕРАТУРЫ ...................................................................................................402
Посвящаю

моей матери Елене Николаевне


и отцу Исааку Густавовичу,
моей жене Валентине Васильевне,
без которых я не жил бы на этом свете;
а также Александру Александровичу Андронову,
открывшему мне путь в науку.
Выражаю благодарность всем своим ученикам,
которым я помог войти в науку и которые сейчас
мне служат опорой и поддержкой.
X Ю.И. Неймарк. Математическое моделирование как наука и искусство

В науке и ее приложениях, как и в жизни,


самое главное – понимание.
Оно всегда просто, но добывается трудно.

ПРЕДИСЛОВИЕ
Математическое моделирование (ММ) возникло скорее не как наука, а как
ремесло, в основе которого лежало искусство реализации сложных вычислений и
анализа их результатов с использованием, в основном, известных вычислитель-
ных методов. Однако вскоре в значительной мере благодаря появлению компью-
теров и сближению с идеями математической физики, теории колебаний, теории
управления и др., ММ стало фактически всеобъемлющей наукой, изучающей ма-
тематические модели вне зависимости от их конкретного смысла. Не будет пре-
увеличением сказать, что вся современная техника (авиация и наземный транс-
порт, ракеты и компьютеры, атомная энергетика и машиностроение, приборо-
строение и связь), определившая наш образ жизни, основана на успехах фунда-
ментальной науки и является детищем математического моделирования. Сегодня
цели и задачи ММ очень широки и многообразны, но могут быть кратко сформу-
лированы как качественное и количественное изучение всего, что нас окружает,
всевозможных объектов природы, техники и общества. При этом под качествен-
ным изучением подразумевается достижение понимания существа изучаемого
объекта, его свойств, поведения, возможных явлений и определяющих их причин.
Общая схема ММ в значительной мере устоялась, а ее реализация опирается
на фундаментальную науку, методы исследования математических моделей (ана-
литические, качественные и численные) и на современную вычислительную тех-
нику. Вместе с тем продумывание этой схемы обнаруживает в ней действия, не
поддающиеся формализации. Это прежде всего относится к построению модели и
отчасти к ее исследованию. То, что не формализуемо, можно отнести к искусству
моделирования.
Требования от ММ точных количественных результатов и полного качест-
венного исследования антагонистичны: первое требует достаточно полного учета
многих факторов, усложняющих модель; второе, напротив, тем более реализуемо,
чем проще модель. Конечно, всегда следует стремиться к возможно более про-
стым моделям, простым с точки зрения возможностей их исследования, обеспе-
чивающим требуемое понимание, пусть не очень точным и лишь частично и од-
носторонне оценивающим рассматриваемый объект. Насколько мне известно,
проблема построения простых моделей особо не ставилась, но простые модели
все время спонтанно возникали в физике, химии, биологии, технических науках,
экономике и играют в них существенную, если не ведущую роль. Ведь это мате-
риальная точка, точечный заряд, диполь, формулы химических соединений и хи-
мических реакций, условные и безусловные рефлексы, твердое и упругое тело,
линейные и нелинейные осцилляторы, различные волны и простые поля и многое,
многое другое.
Настоящая книга возникла в результате чтения автором лекций о математи-
ческом моделировании студентам, бакалаврам и магистрам, специализирующимся
Предисловие XI

по прикладной математике и информатике, и аспирантам в области точных наук


Нижегородского государственного университета. Появление этого нового лекци-
онного курса было вызвано тем, что существующая в России университетская
система подготовки специалистов по прикладной математике основывалась на
сочетании фундаментального математического и прикладного компьютерного об-
разования, что ориентировало студентов на решение точно поставленных матема-
тических задач, формируя определенную отчужденность от важнейших этапов и
сторон фактического решения прикладных задач, таких как осмысление и глубо-
кое проникновение в существо конкретной задачи, и математическую подготовку,
включающую упрощения, принимаемые идеализации и составление математиче-
ской модели, ее коррекцию и сопоставление результатов исследования с реаль-
ным объектом. Помимо этой главной цели была еще и другая, состоящая в том,
чтобы выпускники в дальнейшем занимались не только математическими вопро-
сами и на них ориентировались, но и воспринимали и широко использовали ма-
тематику как универсальный язык современной точной науки, а математическое
моделирование – как могучее средство изучения природы, техники и человече-
ского общества.
В 1994, 1996 и 1997 годах частично эти лекции по математическим моделям
естествознания и техники были изданы Нижегородским университетом в виде
трех небольших книжек. Затем была написана четвертая часть, сделаны добавле-
ния к ранее опубликованным частям, содержащим материал, читаемый магист-
рантам и аспирантам. Получившийся труд был рекомендован Научно-
методическим советом по прикладной математике и информатике университетов
России в качестве учебника для студентов, бакалавров и магистров. Пожалуй,
следует отметить, что, кроме перечисленных выше стимулов к написанию этой
книги, важным оказалось то, что я в процессе чтения лекций осмыслил решаю-
щую роль простых математических моделей в общем понимании и познании ок-
ружающего мира и получал огромное удовольствие, строя и изучая такие простые
модели, как модель автоколебательной ходьбы человека, загадок Каспийского
моря, кризисов и исключительности иммунного ответа организма на вторжение
инфекции, игры в отгадывание, парадокса Пенлеве и многие другие.
Автор книги – ученик А.А. Андронова, выходец из его всемирно известной
школы теории нелинейных колебаний. Это определило выбор рассматриваемых
моделей. В книге идет речь об эволюционных моделях, т.е. моделях процессов
изменения во времени: о моделях динамики, управления, обучения, вычислитель-
ных процессов, распознавания, оптимизации, относящихся к объектам самой раз-
нообразной природы: механической, физической, химической, биологической,
технической, экологической, социальной и др. Объединяющей основой всего это-
го разнообразия является универсальная, всеобъемлющая математическая модель
– динамическая система.
Книга может быть интересной и полезной очень широкому кругу читателей:
студентам всевозможных естественных, технических и других высших учебных
заведений; специалистам, сталкивающимся с задачами и проблемами, где моде-
лирование может быть полезным, и просто людям любопытным, желающим уз-
нать, как математика изучает окружающий мир и позволяет понять и объяснить
загадочные явления, предвидеть будущие изменения, постигнуть свойства и пред-
XII Ю.И. Неймарк. Математическое моделирование как наука и искусство

сказать поведение не только реально существующих объектов и процессов, но и


воображаемых или изобретаемых.
Моделирование в значительной мере искусство, и в силу этого в нем не по-
следнюю роль играет красота: красота модели, красота ее исследования и, нако-
нец, красота объяснения загадочных и непростых явлений и свойств изучаемого
объекта.
Возможно, что построение и исследование некоторых моделей, содержащих-
ся в книге, доставит вам эстетическое удовольствие.
Математические модели можно подразделить на простые, лишь в общих чер-
тах, в самом нам интересном, описывающие реальный объект; математические
модели фундаментальных законов природы – уравнения Ньютона механического
движения, электродинамические уравнения Фарадея – Максвелла, уравнение Шре-
дингера микропроцессов и т.п.; модели, от которых требуется значительная коли-
чественная адекватность, когда например моделируется полет ракеты и ее посадка
на Луну. Каждый из перечисленных типов моделей имеет свою специфику. Моде-
лирование последнего типа, как правило, требует высокой вычислительной ква-
лификации, знания различных вычислительных методов и умения ими пользо-
ваться, значительной вычислительной культуры и навыков, включающих навыки
использования современной вычислительной техники. Для построения и исследо-
вания моделей первых двух типов многое из перечисленного не обязательно. Но
далеко не всегда моделирование третьего типа может обойтись без умений и на-
выков, требуемых для построения и исследования моделей первых двух типов.
Более того, фундаментальные модели только и обеспечивают возможность мате-
матического моделирования, а простые модели − и только они − позволяют по-
нять функционирование изучаемого объекта и сопровождающие его явления: по-
нять глобально и качественно основные свойства, возможные явления, причинные
связи и зависимости поведения от параметров.
Настоящая книга − о моделях первого и отчасти второго типов, что интересно
и важно само по себе и что является необходимым для моделирования нестан-
дартных задач и объектов третьего типа. Вместе с тем это не охватывает полно-
стью проблему математического моделирования, к которому, безусловно, отно-
сится еще построение математических моделей на основе наблюдаемых опытных
и экспериментальных данных путем их математической обработки. Одним из ос-
новных методов построения таких моделей является метод наименьших квадра-
тов, представленный в трудах Гаусса и Лежандра около двух столетий назад. Его
рассмотрение было осуществлено отдельно в [32].
Первые издания предлагаемой читателю книги вышли в 2003 году на англий-
ском языке в издательстве Springer и в 2004 году на русском в издательстве Ниже-
городского университета. Эта книга на общероссийском конкурсе учебных изда-
ний для высших учебных заведений «Университетская книга – 2006» награждена
дипломом в номинации «Лучшее учебное издание по точным наукам». В настоя-
щем втором издании исправлены опечатки, внесены некоторые коррективы в
текст и сделаны небольшие дополнения.
Вначале предполагалось пополнить книгу рассказом о приспособленном ба-
зисе [26], позволяющем кратко описывать значительную информацию о непро-
стых объектах; рассказать о роли динамических негрубых систем, о преобразова-
Предисловие XIII

телях, усилителях и генераторах стохастичности и явлении синхронизации в эво-


люции мира и др. В конечном счете я ограничился некоторым расширением гла-
вы, привлекающей внимание к важнейшей проблеме настоящего времени: эволю-
ции человеческого общества на земном шаре, и реабилитацией плодотворной
идеи о возможности инвариантного управления, высказанной Г.В. Щипановым в
1939 году [49]. В связи с этим книга получила новое название, более точно отра-
жающее ее содержание.
В подготовке рукописи мне существенную помощь оказали сотрудники и
друзья: В.П. Савельев, З.С. Баталова, П.С. Ланда, И.С. Емельянова, И.В. Котельни-
ков, Л.Г. Теклина и И.С. Гельфер, которым приношу искреннюю благодарность.
XIV Ю.И. Неймарк. Математическое моделирование как наука и искусство

ВВЕДЕНИЕ
В этой книге вы познакомитесь с разнообразными математическими моделя-
ми механических, электрических, физических, астрономических, химических,
биологических, экологических, кибернетических и других систем и процессов.
Кроме того, этот курс поможет вам сформировать естественно-научное миропо-
нимание, понимание науки и ваше отношение к специальности «прикладная мате-
матика», к изучаемым общим и специальным математическим предметам.
Вы поступили в университет, чтобы получить высшее математическое образо-
вание и специальность прикладного математика, что позволит вам иметь интерес-
ную работу, приносящую удовлетворение и средства к существованию. Возможно,
вы об этом и не думали, а пришли сюда в силу природной любознательности и люб-
ви к математике и достижения успехов в ней.
Вам хочется постичь и изучить окружающий мир, к чему зовет вас ваша ге-
нетическая наследственность. Почему же вместо этого вас учат абстрактной, труд-
но понимаемой математике, оторванной от живого мира, – числам, векторам, мат-
рицам, функциям, действиям над ними, дифференцированию, интегрированию и
другому?
Я думаю, что вы знаете общий ответ на этот вопрос: потому что математика
является основой естественно-научного познания. Но почему так велика роль в
познании мира именно абстрактной математики, такой далекой от нашего кон-
кретного, осязаемого, красочного мира, а, например, не астрологии, которая по
расположению светил предсказывает будущее?
Каков метод использования математики в познании мира и предсказаний бу-
дущего?
Возможно, и на этот последний вопрос вы знаете ответ: мы познаем мир, соз-
давая и изучая его математические модели.
Вот и мы с вами будем строить математические модели и будем их изучать,
тем самым постигая тайны мира, в котором живем.
Что такое модель? Слово «модель» пришло из итальянского языка и означает
«копия, образец, прототип», изучив который мы познаем оригинал. Значит, мате-
матическая модель – это прототип какой-то части мира – объекта, системы, уст-
ройства, машины, процесса, прибора, изучая который мы постигаем эту часть
мира.
Чем же является математика и какова ее роль в создании этой вспомогательной
модели, и почему мы эту математическую модель можем изучить, и почему изучив
ее мы изучаем мир, и что, собственно, собой представляет математика? Я думаю,
что на эти вопросы вы ответов не знаете.
К ответу на них подойдем издалека. Как-то давно, в позапрошлом веке, на одном
из ученых заседаний бурно обсуждался вопрос о роли языков и математики в обуче-
нии студентов. Дебаты длились долго. Одни отстаивали роль языков, другие – зна-
чение математики. Среди обсуждающих был великий ученый Виллард Гиббс.
Тот самый, который утверждал, что целое проще своей части, что изучить ско-
пище миллиардов молекул проще, чем одну молекулу, и не только утверждал, но
Введение XV

и доказал своими замечательными научными открытиями. Он был всеми уважаем


и необычайно молчалив. Но тут, к общему удивлению, он попросил слова и ска-
зал: «Математика − тоже язык».
Что же имел в виду Гиббс? Что общего между русским, английским, грече-
ским, французским и другими языками и математикой? А вот что: язык людей
описывает их действия, чувства, желания, воспоминания, пожелания, мнения, при-
казания, а математика − это язык описания природы, язык научного естествозна-
ния. Если вы хотите поговорить с французом, вам надо изучить французский
язык, с англичанином − английский язык, с природой − математический язык.
Только на математическом языке природа открывает нам свои тайны, и если вы
хотите их постичь, вы должны изучить математический язык, изучить математику.
С природой и техникой − тоже частью природы, только созданной человеком, −
нужно разговаривать на математическом языке. То, что книга природы написана
на математическом языке, сказал еще Галилей.
Языки человека − это конкретные языки, в них каждое слово имеет конкрет-
ный смысл, напротив, математический язык − язык абстрактный. Но оба они −
языки, и это различие не так уж существенно. Допустим, вы на заборе увидели
надпись: «Глокая югора икает справдо».
Сначала вам показалось, что это бессмыслица, но, вдумавшись, вы поняли,
что говорится о некой «югоре», которая «глокая» и которая «икает» и делает это
«справдо». А теперь сравните эту фразу со следующими математическими фраза-
ми:
( a + b) 2 = a 2 + 2ab + b 2 ,
d d
0< x (t ) < y (t ),
dt dt

∫ u dv = uv − ∫ v du.
Во второй математической фразе говорится, что некоторая величина х(t) воз-
растает с ростом t медленнее, чем величина у(t). Что такое х и у, при этом остается
неизвестным, как и то, чему равны а и b в первой фразе (формуле).
Языковые описания нашей жизни − рассказы, повести, романы − это ее языко-
вые модели. Описание естественных явлений на математическом языке − это их
математические модели, т.е. математика − это язык точных наук, а математиче-
ские модели − это описание объектов и процессов природы или техники на матема-
тическом языке.
Как для того чтобы написать хорошее сочинение, нужно хорошо знать то, о
чем пишешь, так и для того чтобы составить математическую модель, нужно хо-
рошо понимать то, что хочешь описать, отличать главное от второстепенного,
понимать существо и закономерности происходящих процессов, явлений и взаи-
моотношений, наконец, нужно уметь все это описать на математическом языке.
Написать сочинение не просто, но прочитать его и понять обычно не очень
трудно. Хотя простота может быть обманчивой. Составить модель тоже достаточ-
но трудно, но и понять ее, оказывается, не всегда просто, а подчас и очень трудно.
Для того чтобы понять математическую модель, понять то, что она описывает,
необходимо ее изучить, и это изучение может быть очень трудным.
XVI Ю.И. Неймарк. Математическое моделирование как наука и искусство

Теперь, я думаю, вам понятно в общих чертах содержание этой книги.


Но на один вопрос мы не получили ответа: почему изучая математическую
модель реального объекта или процесса мы получаем возможность изучения и их
самих? Ведь они такие разные и, казалось бы, не имеют ничего общего. Это
очень непростой вопрос. Один из известных математиков назвал эту чудесную
возможность «непостижимой». Но, пожалуй, это не совсем так: кое-что понять
можно.
Все основано на изоморфизме. Об этом − много позднее, а пока заметим
только: то, что реальный объект и модель такие разные, не так уж страшно − как
работает телевизор, можно понять по его радиосхеме, совершенно не похожей на
телевизор, можно разобраться в улицах города по его карте.
Теперь я перейду к рассказу об одной из основных моделей естествознания и
техники − динамической системе.
1. Динамическая система 1

1. ДИНАМИЧЕСКАЯ СИСТЕМА
Архимед, когда постиг закон рычага, опьяненный открывшейся ему тайной
природы, сказал: «Дайте мне точку опоры, и я переверну мир».
Много веков спустя, в XVIII веке, великий математик и астроном Лаплас,
восхищенный открывшейся ему научной картиной мироздания и причинных свя-
зей всех явлений, выразил свое прозрение словами: «Я предскажу во всех деталях
все будущее, все, что будет на все века вперед, от мелочей до самого крупного,
если вы мне скажете или полностью опишите, в каком состоянии мир находится
сейчас».
Это был апофеоз детерминизма, полной причинной связи будущего с на-
стоящим.
Ясно, что никто не мог уличить Лапласа во лжи или ошибке: кто же может
описать мироздание полностью? Хорошо бы это сделать хотя бы в какой-нибудь
его части – и не всего, а только кое-чего. Ну и что тогда? Уже предсказывать
нельзя? Нет, оказывается, иногда можно. Постараемся разобраться, когда можно и
когда нельзя, и от чего это зависит, и заодно поймем, почему Лаплас так сказал.
Сказано это было в связи с успехами астрономии, в которой наука добилась
полного понимания причин движения планет и научилась их рассчитывать на
много лет вперед, и одновременно с воцарением механистической картины мира,
в которой все происходящее объяснялось механическим движением мельчайших
материальных частиц – молекул. При этом само собой разумелось, что молекулы
(атомы), хотя и очень маленькие, но обладают такими же свойствами, как и окру-
жающие нас тела: могут взаимодействовать между собой, ударяться друг о друга,
соединяться и т.д. Таковы уж капризы истории, что величайшие прозрения при-
шли в науку «с небес» − благодаря успехам астрономии. Движение планет – блу-
ждающих звезд – давно привлекало внимание человечества. Сейчас нам до них
нет дела, а тогда было совсем не так. Широко известна птолемеевская система
мира. Она достаточно хорошо описывала и с точки зрения этого описания объяс-
няла видимые причудливые движения планет (Меркурия, Венеры, Марса, Луны,
Юпитера, Сатурна) и Солнца, еще проще это делала система Коперника, но толь-
ко Ньютон их объяснил исходя из открытых им законов механического движения
и всемирного тяготения. В отношении механического движения материальной
точки он установил, что оно подчиняется дифференциальному уравнению второго
порядка и однозначно определяется начальным положением и скоростью. Отсюда
следовало, что движение всех планет и Солнца может быть точно вычислено, если
известны их массы, начальные положения и скорости. Само вычисление Ньютон
сумел выполнить лишь для двух притягивающихся свободных тел, но это уже не-
принципиально. Вскоре научились вычислять приближенно, но с громадной точ-
ностью, движения всех планет, а сейчас это легко делают ЭВМ. Итак, для планет
существует описание, по которому может быть предсказано будущее, т.е. то, как
это описание меняется. Такое описание было названо состоянием механической
системы. В какой-то мере понятие состояния может быть обобщено и распростра-
нено не только на механические системы. Именно по этому пути пошло дальней-
2 Ю.И. Неймарк. Математическое моделирование как наука и искусство

шее развитие точного естествознания в изучении эволюционных процессов и


предсказании будущего.
Идея детерминизма, вдохновившая Лапласа, идея временной причинности и
однозначной обусловленности событий нашего мира может рассматриваться как
наличие связей между описаниями прошлого и настоящего.
При этом бессмысленно говорить о связи всего прошлого со всем настоящим:
возможность фактического изучения появляется тогда, когда выбирается что-то
как из описания, так и из окружающего мира. Этот выбор предмета изучения
Ньютон описал как сосредоточение внимания на отдельных привлекательных
красивых камушках на необозримом берегу моря. Тот «камушек», который мы
выберем, назовем системой, а то, что привлечет к нему наше внимание, – ее опи-
санием. Это описание можно обозначить буквой х, оно зависит от времени и со-
вершенно не обязательно, что для него будет справедлив принцип детерминизма,
т.е. что прошлое описание x(t1) определяет будущее описание х(t2) (t2 > t1). Это
только тогда, когда нам крупно повезло как в выборе камушка, так и в выборе то-
го, что нас в нем привлекает.
Теперь я приведу вам некоторые примеры выбора «камушков» и их описа-
ний. Но прежде я хочу сказать еще несколько слов о детерминизме Лапласа. Если
можно так выразиться, оградить его от естественных нападок, что он не видел и
игнорировал повсеместно наблюдаемую случайность. Нет, он ее видел. Более то-
го, он ввел в науку распределение вероятностей, получившее впоследствии назва-
ние нормального (или гауссовского) распределения. Но так же как А. Эйнштейн,
он не верил, что Бог играет в кости. Он не знал, как объяснить наблюдаемую слу-
чайность, но это не помешало ему принять детерминистическую картину мира. И
сделал правильно. И случайные процессы допускают детерминистическое описа-
ние, но об этом много позднее.
Вернемся к прерванному разговору. Вот у меня в руках кусочек мела. Я могу
заинтересоваться, как он пишет на доске и почему он это делает. Тогда меня бу-
дут интересовать его свойства и его описание с точки зрения его качества для
письма на доске. Но я могу воспользоваться им для того, чтобы бросить или про-
сто отпустить и посмотреть, как он будет падать. В этом последнем случае я могу
быть удачлив и установить законы падения тяжелых тел на землю, обнаружив
торжество детерминизма.
Я могу обратить внимание на стакан горячего чая и задуматься о том, почему
он имеет такой вкус и запах, и что это такое, а могу поинтересоваться, когда же
он, наконец, остынет и его можно будет пить. В последнем случае меня интересу-
ет только температура чая, описываемая в градусах Цельсия, и если я буду доста-
точно упорен, то найду закон ее уменьшения, подтверждающий общую идею де-
терминизма.
Эти примеры можно продолжать до бесконечности: горящая свеча, привлек-
шая внимание Фарадея; движение Земли вокруг Солнца, изученное Иоганном Ке-
плером и Исааком Ньютоном; электрический контур из емкости и индуктивности,
тайна колебаний заряда которого была разгадана Томсоном; модель атома Нильса
Бора; земная атмосфера, от которой зависит погода, которую мы никак не нау-
чимся предсказывать; живой организм, и посейчас полный тайн, и совсем таинст-
венный мозг.
1. Динамическая система 3

После этих беглых примеров рассмотрим несколько примеров попроще и бо-


лее подробно.
Понаблюдаем спринтерский заезд двух велосипедистов на велодроме. Они
приняли старт в одно и то же время, и выиграет тот, кто приедет первым к фини-
шу. Сколько времени они будут ехать, не имеет значения, и это приводит к тому,
что ни один из них не рвется вперед, а маневрирует, желая обмануть противника и
прийти первым. Просто рвануться без оглядки вперед нельзя, потому что «севший
на хвост» соперник поедет за ним, затрачивая значительно меньше сил, и вблизи
финиша легко придет первым.
В качестве описания примем углы ϕ1 и ϕ2, проходимые первым и вторым ве-
лосипедистами (рис. 1.1).

1
ϕ1
Рис. 1.1. Вид сверху велодрома ϕ2
2
и спринтерского заезда
велосипедистов 1 и 2

Графики функций ϕ1(t) и ϕ2(t) дают представление о том, как протекало со-
ревнование (рис. 1.2). При этом мы рисуем две кривые. Можно изобразить ход
соревнования одной кривой на плоскости ϕ1, ϕ2. (Старт отвечает углу ϕ = 0, фи-
ниш – ϕ =2π.)
ϕ

Рис. 1.2. Временные графики ϕ1(t) и ϕ2(t) ϕ1(t)


одного из заездов велосипедистов ϕ2(t)

0 t
С течением времени точка М с координатами ϕ1 и ϕ2 опишет некоторую кри-
вую (рис. 1.3).
ϕ2 ϕ2
2π 2π

0 2π ϕ1 0 2π ϕ1
а) б)
Рис. 1.3. Изображение на плоскости ϕ1, ϕ2 разных заездов велосипедистов
4 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Ее вид также показывает, как протекало соревнование. Так, согласно рис.


1.3,а, первым уехал со старта первый велосипедист, затем второй и был почти до
самого конца позади первого, а перед самым финишем его обогнал и пришел пер-
вым. На рис. 1.3,б изображен другой вариант соревнований, где много раз велоси-
педисты менялись местами и победил первый.
Нетрудно видеть, что принятое описание с помощью углов ϕ1 и ϕ2 до того,
как один из них становится равен 2π, не допускает однозначного прогноза исхода
соревнований, хотя, возможно, опытный глаз специалиста мог бы высказать более
или менее вероятные предположения.
Рассмотрим еще пример с описанием течения болезни графиком температуры
больного (рис. 1.4). Этот график опытному врачу может сказать о многом в отно-
шении течения болезни, но все же его начальной части недостаточно для досто-
верного прогноза всей кривой или только финала болезни.

o
37 Рис. 1.4. График утренних и вечерних
температур больного

Следующий пример – это свободное вертикальное падение тела, находящего-


ся на высоте h0 от земли и имеющего скорость v0 (вертикальную).
Согласно закону свободного падения, имеем
h = h0 + v0 t + gt 2/2,
где t – время падения, a h – положение, отсчитываемое по вертикали вниз. На
рис. 1.5 изображены допустимые виды графиков зависимости h(t).
Эти графики показывают, как происходит падение тела с заданным h0, если
оно брошено вверх, просто отпущено или брошено вниз. Так что величина h не-
плохо описывает падение тела. Но возможно ли с помощью одного h дать полное
описание дальнейшего падения тела? Очевидно, нет, нужно знать еще h&(t ) . Учи-
тывая это, примем в качестве описания два графика − h(t) и h&(t ) (рис. 1.6). По
значениям h(t) и h&(t ) = v в любой момент времени t можно предсказать их значе-
ния в любой следующий момент времени t > t по формулам:
h(t ) = h (t ) + h&(t )(t − t ) + g (t − t ) 2 / 2,
(1.1)
h&(t ) = h&(t ) + g (t − t ),
хорошо известным вам из школьной физики.
Вместо двух графиков − h(t) и h&(t ) − можно ограничиться одной кривой, про-
бегаемой при изменении времени t на плоскости (h, v) точкой М с координатами h
иv
h = h (t), v = h&(t ) .
1. Динамическая система 5

h
h, v h

v
h0 h0

t t
v0

Рис. 1.5. Графики падения тела с одной Рис. 1.6. Временные графики изменения
и той же высоты, но с разными высоты h и скорости v брошенного
начальными скоростями вертикально вверх тела
Уравнения этой кривой можно найти следующим образом.
Из очевидных соотношений
v = h&(t ) , v& = g, (1.2)
выражающих, что скорость – это производная от пройденного пути, а ускорение
свободного падения равно g, следует, что
dh v
=
dv g
или
h = v2 2g + C ,
где С – произвольная постоянная.
В силу этого, траектории, описываемые точкой M(h, v) на плоскости h, v при
различных С, имеют вид, показанный на рис. 1.7. При возрастании времени точка
М пробегает эти кривые в направлениях, показанных стрелками (это следует из
того, что при v > 0 величина h возрастает, а при v < 0 – убывает). Принятое нами
описание падения тела двумя величинами h и v обладает замечательным свойст-
вом самодостаточности и позволяет осуществлять однозначный прогноз. Дейст-
вительно, задание любых h и v однозначно определяет единственную параболу, на
которой лежит точка M(h, v). Тем самым однозначно определено дальнейшее из-
менение величин h и v.
v

Рис. 1.7. Фазовый портрет


падения тела h

Плоскость переменных h, v имеет особое название – фазовая плоскость, соот-


ветственно переменные h и v – фазовые переменные, а нарисованные на этой фа-
зовой плоскости траектории движения фазовых точек М(h, v) – фазовые траекто-
рии.
6 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Движение фазовой точки по траекториям замечательно тем, что знание ее по-


ложения в любой момент времени t позволяет найти, куда она переместится в лю-
бой последующий момент времени t > t , а именно, согласно (1.1) или (1.2):
v (t ) = v(t ) + g (t − t ),
1
g (t − t ) 2 .
h(t ) = h(t ) + v (t )(t − t ) +
2
Это свойство самодостаточности переменных h, v, состоящее в том, что для
их нахождения через любой промежуток времени ∆t достаточно знать их же в на-
чальный момент, придает им особое значение, благодаря которому такое описа-
ние получило название состояния, а описывающие его переменные – фазовых пе-
ременных. Это же свойство состояния легло в основу определения математиче-
ской модели, получившей наименование динамической системы, модели, описы-
вающей детерминированные эволюционные процессы, одной из основных − если
не основной − моделей современного научного естествознания и техники.
Еще раз взглянем на описание соревнования велосипедистов на плоскости ϕ1,
ϕ2 и свободного падения тела на плоскости h, v. В первом случае описания раз-
личных заездов представляют собой всевозможные кривые в квадрате 0 ≤ ϕ1 ≤ 2π,
0 ≤ ϕ2 ≤ 2π. Естественно только предположить, что во всех этих случаях ϕ1 и ϕ2 –
неубывающие функции времени. Через каждую точку этого квадрата может про-
ходить сколько угодно кривых. Именно поэтому задание значений ϕ1 и ϕ2 в неко-
торый момент времени не определяет дальнейшего хода проходящей через нее
кривой. Напротив, на плоскости h, v кривые, изображающие различные случаи
падения, не пересекаются между собой. Именно в силу того, что они не могут пе-
ресекаться и через каждую точку проходит единственная кривая, возможен одно-
значный прогноз дальнейшего изменения величин h и v.
Таким образом, при описании переменными ϕ1, ϕ2 невозможен однозначный
прогноз, и это находит свое отражение в том, что через каждую точку (ϕ1, ϕ2) мо-
гут проходить несколько кривых, и, напротив, при описании свободного падения
переменными h и v имеет место детерминизм, потому что через каждую точку
(h, v) проходит единственная кривая. Рассмотренное математическое описание
свободного падения тела в поле силы тяжести является примером математической
модели, называемой динамической системой, в то время как математическое опи-
сание соревнования велосипедистов с помощью углов ϕ1 и ϕ2 не является матема-
тической моделью, называемой динамической системой.
Дадим теперь общее абстрактное определение математической модели, назы-
ваемой динамической системой, в геометрической трактовке великого математика
А. Пуанкаре.
Динамическая система определяется пространством Х и заданным на нем од-
нозначным оператором Т(∆t), зависящим от параметра ∆t ≥ 0 так, что каждой точ-
ке х ∈ Х оператор Т ставит в соответствие единственную точку x , т.е
x = T ( ∆t ) x.
При этом предполагается, что оператор Т(∆t) при любых допустимых ∆t1 ≥ 0
и ∆t2 ≥ 0 удовлетворяет соотношению
1. Динамическая система 7

T(∆t2)T(∆t1) = T(∆t1 + ∆t2).


Смысловое содержание пространства Х и оператора Т(∆t) следующее: Х – это
пространство всевозможных состояний рассматриваемой системы. (Обычно x –
это многомерный вектор с компонентами x1, x2,…, xn.) Описание x называется со-
стоянием или фазовой точкой, а пространство состояний Х – фазовым простран-
ством. Оператор Т(∆t) по состоянию х в начальный момент позволяет найти со-
стояние x спустя время ∆t. При этом ясно, что переход из состояния x в x , со-
вершаемый сначала за время ∆t1 ≥ 0, а затем еще за время ∆t2 ≥ 0, должен быть та-
ким же, как переход за время ∆t1 + ∆t2. В этом смысл написанного выше требова-
ния к оператору Т(∆t).
Описание х замечательно тем, что по нему можно найти такое же описание
спустя любое время ∆t ≥ 0. Именно поэтому оно названо состоянием, а точка х –
фазовой.
Рассмотренный выше пример свободного падения тела под действием силы
тяжести полностью соответствует приведенному определению. В нем состояние х
– это двумерный вектор с компонентами h и v. Пространство состояний или фазо-
вое пространство представляет собой двумерную плоскость переменных h и v.
Значения высоты h и скорости v за время ∆t изменяются, и, согласно предыдуще-
му, их новые значения равны h и v , где
1
h = h + v∆t + g ( ∆t ) 2 , v = v + g∆t. (1.3)
2
Эти последние формулы определяют оператор T(∆t). Можно непосредственно
проверить, что для этого оператора Т(∆t) выполняется требование, налагаемое на
него определением динамической системы.
Из соотношений, определяющих изменение переменных h и v за время ∆t,
следует, что
v −v h −h 1
= g, = v + g∆t.
∆t ∆t 2
Переходя в них к пределу при ∆t → 0, находим, что функции h(t) и v (t) удов-
летворяют дифференциальным уравнениям
dh dv
= v, = g.
dt dt
Этот вывод имеет место и в общем случае, если предположить, что существу-
ет предел
T ( ∆t )
lim = L,
∆t → 0 ∆ t

и тогда вектор состояния х, как функция времени t, удовлетворяет дифференци-


альному уравнению
dx
= Lx,
dt
которое в компонентах записывается в виде
8 Ю.И. Неймарк. Математическое моделирование как наука и искусство

dxi
= Li ( x1 ,K, xn ), i = 1, n .
dt
Действительно, запишем соотношение
x = T (∆ t ) x
в виде
x (t + ∆ t ) = T ( ∆ t ) x (t ) ,
далее в виде
x ( t + ∆ t ) − x ( t ) T ( ∆ t ) x ( t ) − x (t )
=
∆t ∆t
или, учитывая, что
x(t) = T(0) x(t),
и переходя к пределу при ∆t → 0, в виде
dx (t ) T ( ∆ t ) − T (0)
= lim x (t ) = L x (t ),
dt ∆t → 0 ∆t
что и требовалось.
Таким образом, изменение состояния динамической системы удовлетворяет
некоторой системе дифференциальных уравнений первого порядка, которые для
компонент вектора х могут быть записаны в виде:
dx1
= l1 ( x1 , x2 ,..., xn ),
dt
LLLLLLLL
dxn
= ln ( x1 , x2 ,..., xn ).
dt
При этом, конечно, предполагается, что рассматриваемые дифференциальные
уравнения однозначно разрешимы, и тогда их решение xi (t ) (i= 1, n ) в любой
момент времени t ≥ t0 определяется начальными условиями, т.е. значениями
xi (t0 ) (i = 1, n ) .
Напротив, интегрирование этих уравнений позволяет найти оператор преоб-
разования состояния динамической системы Т(∆t). Тем самым задание дифферен-
циальных уравнений, которым удовлетворяет состояние как функция времени t,
определяет оператор динамической системы. Обратное имеет место лишь в слу-
чае дифференцируемости оператора динамической системы, что часто может не
выполняться. Поэтому данное выше определение динамической системы не-
сколько более общее, чем то, которое можно получить считая, что изменение со-
стояния динамической системы подчиняется некоторым дифференциальным
уравнениям. Заметим еще, что оператор Т(∆t) может быть определен не при всех
∆t ≥ 0, а только для некоторого множества значений ∆t ≥ 0.
Центральным наглядным геометрическим образом динамической системы
является ее фазовый портрет, изображающий все возможные ее движения, т.е.
всевозможные случаи эволюции во времени ее состояния (описания).
1. Динамическая система 9

Знание фазового портрета дает полное представление о динамике (возмож-


ных изменениях) динамической системы, это портрет ее динамики.
С фазовым портретом мы уже сталкивались при изображении падений тела
на двумерной плоскости h, v. Каждое отдельное падение на этой плоскости изо-
бражалось параболой
v2
h= + C.
2g
Вся совокупность возможных падений описывается параболами при всевоз-
можных значениях С. Это привело к рис. 1.7. Отдельные кривые этого фазового
портрета называются фазовыми траекториями, вся совокупность возможных фа-
зовых траекторий образует фазовый портрет.
Опираясь на этот наглядный пример, нетрудно дать общие определения фа-
зовой траектории и фазового портрета, обнаружить важнейшее свойство фазовых
траекторий, состоящее в том, что они не могут раздваиваться, т.е. из каждой фа-
зовой точки не может выходить более одной фазовой траектории и одна обяза-
тельно выходит.
Действительно, пусть х – произвольная точка фазового пространства X. За
время ∆t эта точка перейдет в точку x . При изменении ∆t от 0 до ∞ точка x опи-
шет некоторую «кривую», выходящую из точки х. Это и есть фазовая траектория,
выходящая из фазовой точки х. Эта фазовая траектория единственная в силу од-
нозначности оператора T(∆t). Совокупность всех фазовых траекторий образует
фазовый портрет.
Проиллюстрируем понятие фазового портрета на примерах описания катания
на санках или лыжах, рассмотрев два вида профиля: ямку с всевозвышающимися
краями и ямку на горизонтальной поверхности, изображенных на рис. 1.8. Будем
считать, что сани симметричные и могут скользить без трения как вперед, так и
назад.

a) б)
Рис. 1.8. Схема езды по снегу при разных профилях местности

Описание нужно выбрать так, чтобы оно было состоянием. Исходя из опыта
примера со свободным падением тела, естественно выбрать в качестве описания
положение s и скорость v саней. Переменную s выберем вдоль горизонтали, нача-
ло отсчета – от наиболее глубокого места ямки. За скорость v примем скорость
движения саней вдоль профиля местности. Не будем писать никаких формул и
уравнений. Попробуем сообразить без них, какой вид имеет фазовый портрет, т.е.
фазовые траектории на плоскости s, v. В случае ямки с всевозвышающимися
склонами всякое движение саней будет представлять собою либо неподвижное
10 Ю.И. Неймарк. Математическое моделирование как наука и искусство

положение внизу ямки, либо периодическое катание со склона на склон. Соответ-


ствующий фазовый портрет изображен на рис. 1.9,а. Он состоит из овальных,
замкнутых, вложенных друг в друга фазовых траекторий, внутри которых нахо-
дится фазовая траектория, изображаемая одной точкой s=0, v = 0, отвечающая
равновесному положению саней на дне ямки. В точках А, В, С и D фазовой траек-
тории z сани последовательно находятся, соответственно, в крайнем левом верх-
нем положении, на дне ямки, в крайнем правом верхнем положении, опять на дне
ямки и, наконец, снова в крайнем левом верхнем положении. Такое движение не-
ограниченно периодически повторяется.
v
v
B
z

A C s s

D
а) б)
Рис. 1.9. Фазовый портрет движения саней: а) по идеально гладкому снегу;
б) с трением при профиле местности рис. 1.8,а
Второй случай фазового портрета более разнообразен, поскольку вдоль гори-
зонтальных участков сани движутся с постоянной скоростью и каждая из точек
горизонтальных участков при v = 0 является состоянием равновесия. Это приво-
дит к фазовому портрету рис. 1.10,а.
Давайте сообразим, как изменятся фазовые портреты рис. 1.9,а и рис. 1.10,а,
если учесть реально всегда существующее трение. Теперь колебания внутри ямки
всегда затухают и переходят в равновесие на дне ямки. Движение по горизон-
тальной части также затухает. Если это учесть, то фазовые портреты рис. 1.9,а и
рис. 1.10,а преобразуются к портретам, изображенным на рис. 1.9,б и рис. 1.10,б.
v
v

s s

а) б)
Рис.1.10. Фазовый портрет движения саней: а) по идеально гладкому снегу;
б) с трением при профиле местности рис. 1.8,б

Теперь, я думаю, вы готовы к тому, чтобы найти уже достаточно сложный


фазовый портрет плоского маятника. Мы опять не будем прибегать к уравнениям
и формулам, а попробуем непосредственно сообразить, какой он имеет вид.
1. Динамическая система 11

В свое время, позднее, мы напишем формулы и уточним его количественно, а сей-


час ограничимся качественным видом. Пожалуй, самое трудное – это понять, что
представляет собой фазовое пространство маятника. Если угол отклонения маят-
ника от вертикали ϕ , то состоянием будет этот угол ϕ и угловая скорость враще-
ния маятника ω = ϕ& . Фазовое пространство – это пространство, точками которого
являются всевозможные точки M(ϕ, ω). Угол ϕ меняется в пределах от −π до π,
причем значениям ϕ = −π и ϕ = π отвечает одно и то же положение маятника.
Следовательно, фазовым пространством будет бесконечная полоса −π ≤ ϕ ≤ π,
−∞ < ω < ∞, где точки ϕ = −π, ω и ϕ = π, ω изображают одно и то же состояние
маятника, поэтому им должна отвечать в фазовом пространстве только одна фазо-
вая точка, а не две.
Можно просто условиться, что точки (−π,ω) и (π,ω) – это одна и та же точка.
А можно реально осуществить их слияние, склеив в цилиндр полосу по линиям
ϕ = − π и ϕ = π, но, конечно, так, чтобы склеились друг с другом точки с одинако-
выми ω. В результате приходим к тому, что фазовое пространство маятника – это
двумерный цилиндр. Он изображен на рис. 1.11. Разрезав его вдоль линии ϕ = ± π,
придем к полосе рис. 1.12 с отождествленными сторонами. Рисовать фазовые тра-
ектории на цилиндре затруднительно, и поэтому будем это делать на полосе, имея
все время в виду, что это разрезанный и развернутый на плоскость цилиндр.

ω
ω

ϕ −π π ϕ

Рис. 1.11. Фазовый цилиндр Рис. 1.12. Развертка фазового


цилиндра на плоскости
У маятника есть два равновесия: одно нижнее устойчивое, отвечающее точке
ϕ = 0, ω = 0, и другое верхнее неустойчивое, отвечающее ϕ = ± π, ω = 0. Каждая из
этих точек – целая фазовая траектория, ее начало и конец и вся она в одной точке.
Если неподвижно висящий маятник, изображаемый равновесием ϕ = 0, ω = 0,
немного толкнуть, то он начнет качаться с маленькой амплитудой возле этого со-
стояния равновесия. Такое движение изобразится небольшим овалом, охваты-
вающим точку нижнего равновесия. С усилением толчка маятник будет качаться
все с большим и большим размахом (амплитудой), и наконец, его качания перей-
дут во вращательное движение либо по часовой стрелке, либо против часовой
стрелки. Сказанное изображено на рис. 1.13,а. На этом фазовом портрете k0 –
нижнее устойчивое равновесие, k∞ – верхнее неустойчивое, k1, k2 – периодические
колебательные движения около нижнего равновесия; B1, B2 – все более и более
быстрые вращательные движения против часовой стрелки; B1 , B2 – убыстряю-
12 Ю.И. Неймарк. Математическое моделирование как наука и искусство

щиеся вращения по часовой стрелке. Угол ϕ отклонения маятника отсчитывается


от нижнего его положения против часовой стрелки; Р1 и Р1 – движения, прибли-
жающиеся к точке k∞ при t → ∞ и t → –∞. Эти последние фазовые траектории Р1
и Р1 разделяют колебательные и вращательные движения.

ω ω
B2
B1
P1
k2
k1
_
k0 k∞ ϕ k0 k∞ ϕ
P1
_
B
_1
B2

а) б)
Рис. 1.13. Фазовый портрет маятника: а) в отсутствие трения;
б) при наличии трения
Вы можете считать себя на этом первоначальном этапе усвоившими пред-
ставления о фазовом портрете, если сумеете сами, не заглядывая в рис. 1.13,б, на-
рисовать, как изменится портрет рис. 1.13,а с появлением затухания, например из-
за сопротивления воздуха, и объяснить, какие движения изображаются его от-
дельными фазовыми траекториями.
Все математические модели, которые далее будут возникать и изучаться, яв-
ляются конкретизациями и частными случаями описанной выше общей матема-
тической модели динамической системы. Но сколь же они будут не похожи друг
на друга, сколь разнообразны как по характеру протекающих в них процессов, так
и по их физической природе! Всякий процесс, явление или система любой приро-
ды, описываемая дифференциальными уравнениями, – это динамическая система.
В силу этого великие законы природы: законы механического движения твердых
тел, жидкостей и упругих сред, изменения электромагнитного поля и законы
электродинамики и квантовой физики – описываются математическими моделя-
ми, представляющими собою динамические системы. Но дальнейшее изложение
начнется не с них. Мы будем рассматривать и изучать очень простые модели, и
лишь затем они будут несколько усложняться, оставаясь все же конкретными и
очень простыми. Несмотря на их простоту, а скорее именно благодаря их просто-
те, они наиболее подходят для обучения и в наибольшей мере способствуют при-
обретению столь важных общих и интуитивных представлений, подкрепленных
конкретными, допускающими исчерпывающее осмысление примерами. Иногда
это будут очень простые математические модели простых физических систем и
иногда – простые модели очень сложных систем. Но даже в очень сложных слу-
чаях модели будут оставаться простыми, обнаруживая свое значение и познава-
тельную мощь.
1. Динамическая система 13

Как отмечалось, всякая система или процесс, описываемые дифференциаль-


ными уравнениями, всегда представляют собой динамическую систему. Это сле-
дует из теоремы существования и единственности решения дифференциальных
уравнений при заданных начальных условиях. Ее состояние является совокупно-
стью начальных условий, однозначно определяющих решение, а оператор опре-
деляется ее решением на промежутке времени ∆t.
Вместе с тем мне не хотелось бы, чтобы вы подумали, что данное вам общее
определение динамической системы – просто другая трактовка дифференциаль-
ных уравнений. Чтобы этого не произошло, я приведу пример, где очевидно, что
от дифференциальных уравнений далеко и они ни при чем. Этот пример – игра
«жизнь» по Конуэлю.
В этой игре, разыгрываемой на шахматной доске, состояние определяется
расположением на ней фишек. Пространство состояний – это множество всевоз-
можных расположений фишек. Состояние можно задать матрицей 8×8, элементы
которой – единицы и нули, в зависимости от того, есть фишка или нет на соответ-
ствующей клетке. Фазовое пространство состоит из всевозможных таких матриц.
С каждым тактом ∆t = 1 расположение фишек меняется в соответствии с операто-
ром, определяемым тремя правилами выживания, гибели и рождения:
1) фишка остается, если рядом с ней находятся две или три другие фишки;
2) фишка убирается, если рядом с ней находится более трех или менее двух
фишек;
3) на пустой клетке появляется новая фишка, если рядом с ней имелось три
фишки.
В зависимости от начального расположения фишек возможны весьма много-
образные их изменения. Так, например, три фишки, расположенные следующим
образом

нет,

превращаются, как показано, сначала в две и затем исчезают.


Расположение четырех фишек в виде квадрата

не влечет никаких изменений.


Три фишки в ряд

осциллируют (как показано) с периодом два такта.


14 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Пять фишек, образующие фигуру «планер»

повторяются каждые четыре такта, смещаясь вправо и вниз на одну клетку.


Существуют расположения фишек, которые, осциллируя каждый период, ро-
ждают «планер».
Есть расположения фишек, пожирающие «планеры», и т.д. Это разнообразие
возможностей, отдаленно и упрощенно имитирующее реальную жизнь, порож-
даемую комбинированием химических молекул, как уже говорилось, представля-
ется динамической системой, состояние которой х – это матрица из нулей и еди-
ниц. В ней столько же строк и столбцов, сколько на доске, на которой разыгрыва-
ется эта игра. Элемент aij этой матрицы равен 1 или 0, в зависимости от того, есть
фишка или нет на пересечении строки i и столбца j доски. Множество всевозмож-
ных таких матриц с единичными и нулевыми элементами составляет ее простран-
ство состояний. Оператор T(∆t) этой динамической системы определен только для
дискретных значений ∆t , равных 0, 1, 2 .…
При этом, если n целое, то
T ( n ) = T n (1) ,
а T(0) – оператор, никак не меняющий расположение фишек.
В заключение знакомства с математической моделью динамической системы
и ее фазовым портретом найдем фазовый портрет физического маятника на вра-
щающемся основании (рис. 1.14).
O′

l
ϕ
O

Рис. 1.14. Физический маятник


O′′ на вращающемся основании

Фазовый портрет маятника при неподвижном основании нашли, не выписы-


вая его уравнений движения: мы достаточно хорошо знаем маятник и нам не по-
надобились дифференциальные уравнения его движения. С маятником на вра-
щающемся основании так поступить нельзя: его динамика для нас загадка и раз-
гадать ее можно исследуя его математическую модель, что мы и сделаем. Для это-
го нам потребуются некоторые сведения из механики. Примите их на веру.
В качестве состояния маятника на вращающемся вокруг вертикальной оси с
угловой скоростью Ω основании, как и маятника на неподвижном основании,
1. Динамическая система 15

примем его угол отклонения от вертикали ϕ и его угловую скорость ω = ϕ& . Нам
нужно составить его дифференциальные уравнения движения. В этом может по-
мочь теоретическая механика. Ее рецепт состоит в следующем: надо найти кине-
тическую Т и потенциальную V энергии маятника и составить функцию Лагранжа
L = T – V, выразив ее через переменные состояния ϕ и ω, после чего уравнения
движения записываются в таком красивом виде:
d  ∂L  ∂L
 − = 0.
dt  ∂ω  ∂ϕ
После сейчас непонятных вам вычислений находится функция L в виде
A C
L = ( ω2 + Ω 2 sin 2 ϕ) + Ω 2 cos 2 ϕ + Mgl cos ϕ,
2 2
где A и С – моменты инерции маятника, l и М – его длина и масса.
После дифференцирования приходим к искомому дифференциальному урав-
нению второго порядка:
C−A 2
Aϕ&& + Ω sin 2ϕ + M g l sin ϕ = 0. (1.4)
2
Примите на веру то, как составлено это уравнение. Нужно лишь его пони-
мать, в частности видеть, что при Ω = 0 оно переходит в уравнения движения
обычного физического маятника на неподвижном основании. Еще следует пред-
ставлять физический смысл моментов инерции А и С. Маятник имеет вид тела
вращения относительно своей линии подвеса (линии, соединяющей точку подвеса
с центром масс). Его центр масс находится на расстоянии l от оси подвеса, сам
маятник имеет массу М, С – момент инерции относительно линии подвеса, A –
момент инерции относительно осей, перпендикулярных линии подвеса и прохо-
дящих через точку подвеса. Для тела, вытянутого вдоль оси подвеса, С < A. На-
оборот, для маятника в виде диска достаточно большого радиуса по сравнению
с его длиной C > A.
Решить уравнение (1.4) в элементарных функциях нельзя. Но можно его один
раз проинтегрировать. Для этого умножим его на ϕ& и проделаем следующие вы-
числения:
C−A 2
Aϕ&&ϕ& + Ω ϕ& sin 2ϕ + Mg l ϕ& sin ϕ =
2
d A C−A 2 
=  ϕ& 2 − Ω cos 2ϕ − Mg l cos ϕ  = 0,
dt  2 4 
откуда
A 2 C−A 2
ϕ& − Ω cos 2ϕ − Mg l cos ϕ = h,
2 4
где h – постоянная интегрирования.
Из полученного интеграла находим, что
16 Ю.И. Неймарк. Математическое моделирование как наука и искусство

A C−A 2
ϕ& = ± h + Ω cos 2ϕ + Mg l cos ϕ . (1.5)
2 4
Это и есть уравнение фазовых траекторий на цилиндрическом фазовом про-
странстве переменных состояния ϕ и ϕ& . Эти фазовые траектории надо построить,
каждому h – своя фазовая траектория. Но вам сделать это не очень просто. Поэто-
му, сначала, исходя из этого уравнения (1.5), построим уже известный нам фазо-
вый портрет маятника на неподвижном основании (Ω = 0). В этом более простом
случае
A
ϕ& = ± h + Mg l cos ϕ . (1.6)
2
Рассматривая подкоренное выражение как функцию ϕ, построим график по-
стоянной h и график функции –Mgl cos ϕ (рис. 1.15,а). Первый график – прямая,
параллельная оси ϕ на расстоянии h от нее, второй график – один период косину-
соиды с амплитудой Mgl. Стрелками на этом рис. 1.15,а показаны значения под-
коренной функции при разных ϕ. Если длину этой стрелки с учетом ее направле-
ния обозначить через ρ, то уравнение фазовой траектории (1.6) запишется в очень
простом виде:
ϕ& = ± 2ρ A . (1.7)
Для приведенного на рис. 1.15,а значения h возможные значения ϕ заключе-
ны между ϕ1 и –ϕ1 (вне их ρ < 0 и ϕ& мнимое). Меняя ϕ от ϕ1 до –ϕ1 , легко нахо-
дим из рис. 1.15,а вид соответствующей фазовой траектории. Это будет овал, на-
рисованный ниже используемых нами графиков на плоскости ϕ, ϕ& (точнее, поло-
се −π ≤ ϕ ≤ π, −∞ < ϕ& < ∞). Меняя h от –Mgl до ∞, найдем все фазовые траектории.
Этот фазовый портрет нам уже известен и еще раз изображен на рис. 1.15,а.

–ϕ1 ϕ1 ρ h −π π
ϕ
−π ρ π ϕ ρ
h
ρ
ω
ω

ϕ ϕ

а) б)
Рис. 1.15. Построение фазового портрета маятника на вращающемся основании:
а) при Ω = 0; б) при достаточно большом значении Ω
1. Динамическая система 17

Колебаниям маятника отвечают –Mgl < h < Mgl, нижнему, устойчивому рав-
новесию – h = –Mgl, верхнему, неустойчивому, – h = Mgl, вращениям – h > Mgl.
Теперь аналогичным образом построим значительно более сложный фазовый
портрет по уравнению (1.5) при Ω ≠ 0.
При (С – A) Ω2 > 4Mgl рисунок 1.15,а изменится и примет вид рис. 1.15,б. На
нем построен график зависимости
C−A 2
F (ϕ) = − Mg l cos ϕ − Ω cos 2ϕ
4
и проведена прямая, отвечающая значению h.
Как и ранее, стрелками показаны значения ρ(ϕ), и по-прежнему фазовая тра-
ектория описывается уравнением (1.7). Меняя h, при некотором усердии находим
фазовый портрет, который изображен на рис. 1.15,б. Этот фазовый портрет наде-
ляет маятник совершенно удивительными свойствами: он может устойчиво висеть
как вниз, так и вверх. Это поразительная способность появилась в силу сделанно-
го предположения, что
(C – A)Ω2 > 4Mgl,
т.е. при С > А и при достаточно большой скорости вращения Ω основания маят-
ника. Интересно, что, как можно обнаружить аналогичным образом, при С < А
увеличение скорости вращения Ω сохраняет неустойчивость верхнего положения
и делает неустойчивым и нижнее положение равновесия. При С < А и
Ω2 > Mgl (A – C)–1 соответствующий фазовый портрет изображен на рис. 1.16.
ϕ

Рис. 1.16. Фазовый портрет маятника


на вращающемся основании
при достаточно большом значении Ω −π π ϕ

Почему нижнее положение равновесия становится неустойчивым с ростом


угловой скорости Ω, понять можно: устойчивость нарушается центробежной си-
лой. Почему же это не имеет место при C > A и почему при этом и верхнее рав-
новесие становится устойчивым? А дело в том, что маятник не математический,
его масса не сосредоточена в одной точке и суммарная центробежная сила при
отклонении маятника от нижнего и верхнего равновесий не обязательно направ-
лена от оси вращения, она при C > A может быть направлена к оси вращения.
Чтобы это обнаружить, следует всмотреться в уравнение (1.4), которое можно
трактовать как уравнение движения маятника во вращающейся вместе с маятни-
ком системе координат под действием силы тяжести и центробежных сил. При
этом на маятник действует суммарный момент сил, равный:
C−A 2
− Ω sin 2ϕ − M gl sin ϕ,
2
18 Ю.И. Неймарк. Математическое моделирование как наука и искусство

который при ϕ, близком к нулю, возвращает к равновесию при любом Ω и воз-


вращает к равновесию ϕ = π при достаточно большом Ω. Точная математическая
модель поправляет нашу примитивную интуицию, порождая новую, более совер-
шенную.
Рассмотрим еще один пример, где интуиция нас подводит. Пусть вам задают
вопрос о том, как лучшей вооруженностью войск компенсировать их меньшую
численность. Естественный ответ: если армия в два раза малочисленнее, то она
должна быть в два раза лучше вооружена, подразумевая при этом, что она должна
быть в два раза более эффективной, т.е. что каждый солдат должен в два раза бы-
стрее выводить из строя солдат противника, чем это делают более многочислен-
ные армии.
А теперь посмотрим, что дает соответствующая математическая модель.
Пусть x(t) и y(t) – численности армий в момент времени t. При t = 0, когда нача-
лось сражение, они были x(0) и y(0). Пусть a и b – скорости, с которыми солдаты
противостоящих армий выведут из строя солдат противника. Тогда
x& = −b y ,
y& = − a x
или axdx – bydy = 0, ax2 – by2 = ax2 (0) – by 2 (0) = const.
Согласно полученному интегралу, дающему уравнения фазовых траекторий,
фазовый портрет имеет вид, представленный на рис.1.17.
y
y = a/ b x

Рис. 1.17. Фазовый портрет динамики


O x численностей сражающихся армий

Все фазовые траектории кончаются либо на оси OX, либо на OY, либо в точке
O. Если фазовая траектория кончается на оси OX, то побеждает армия численно-
сти x, если на оси OY, то армия численности y.
В первом случае для начальной точки x0, y0 должно выполняться неравенство:
a
y0 < x0 ,
b
во втором случае – обратное неравенство. Таким образом, для победы армии чис-
ленности x0 над армией численности y0 должно иметь место неравенство:
a y02
> ,
b x02
т.е. при численности y0, в два раза большей x0, необходимо, чтобы эффективность
армии x была в четыре раза большей. Это следует из математической модели, а в
чем ошибка интуиции, попробуйте сообразить сами.
2. Вытекание жидкости из сосуда 19

2. ВЫТЕКАНИЕ ЖИДКОСТИ ИЗ СОСУДА


Рассмотрим очень простое явление вытекания воды из цилиндрического со-
суда с маленькой дырочкой в его дне (рис. 2.1).

S
Рис. 2.1. Цилиндр с отверстием в дне,
через которое выливается вода H

Пусть площадь сечения сосуда S , площадь дырочки σ, а высота уровня воды


в сосуде H. Как будет меняться высота уровня жидкости H, если она вытекает и в
начальный момент вытекания воды ее уровень H = H 0 ? Ясно, что для того чтобы
ответить на этот вопрос, достаточно знать скорость v, с которой вода вытекает че-
рез дырочку. Действительно, за время dt через дырочку вытекает объем воды,
равный σv dt, и поэтому скорость опускания уровня воды в сосуде равна
σ
H& = − v .
S
Если известно v, то полученное соотношение является дифференциальным
уравнением, из которого можно найти H как функцию времени t, т.е. H (t). Пер-
вым догадался, чему равно v, очень давно, три века назад, Торричелли. Он сказал:
«Вода будет вытекать с той же скоростью, с какой она упала бы с высоты H».
Ведь сверху вода исчезает, а снизу вытекает, и при этом она как бы падает с высо-
ты H. Тело, падающее с высоты H, приобретает скорость
v = 2 gH .
Это и есть знаменитая в свое время формула Торричелли. Нельзя не признать
остроумия рассуждений Торричелли. Но ведь сверху опускается одна вода, а че-
рез дырочку вытекает другая. Не все здесь понятно, но формула верная – это по-
казал эксперимент. Если поверить этой формуле, то приходим к дифференциаль-
ному уравнению
σ
H& = − 2 gH , (2.1)
S
из которого следует, что
dH σ
=− 2 g dt ,
H S
и поэтому
20 Ю.И. Неймарк. Математическое моделирование как наука и искусство

σ
2 H =− 2gt + C ,
S
где С – пока неизвестная постоянная.
Из начальных условий
Ht = 0 = H0
находим, что
C = 2 H0 ,
и окончательно
2
 σ g 
H =  H 0 − t  . (2.2)
 S 2 
Теперь можно нарисовать график убывания H (рис. 2.2) и найти время полного
вытекания воды
S 2H 0
tвыт = . (2.3)
σ g
Из графика видно, что сначала вода вытекает быстрее, затем скорость ее выте-
кания уменьшается до нуля и это происходит за конечное время tвыт , пропорцио-
нальное корню квадратному из начальной высоты воды H0.

H0

Рис. 2.2. Временной график изменения


уровня воды при ее вытекании из цилиндра
tвыт t

Насколько эти выводы совпадают с экспериментом? Формула Торричелли


практикой подтверждается: действительно, вода во всех случаях выливается с той
же скоростью, как если бы она свободно падала с верхнего уровня воды. А вот
время вытекания tвыт, получаемое по формуле (2.3), оказывается примерно в два
раза меньшим. Соответственно, в два раза меньше расчетной и скорость опуска-
ния уровня воды H в сосуде. Откуда взялось такое громадное расхождение, если
скорость вытекания воды v из дырочки определена правильно? Это возможно
только за счет неправильности формулы
σ
H& = − v ,
S
означающей, что сколько воды вытекло, на столько ее и убыло.
Отчего же она может быть неправильной? Сформулируем ее точный смысл:
отношение скоростей v / H& равно отношению сечения цилиндра к сечению выте-
кающей струи. Мы приняли, не задумываясь, что сечение струи совпадает с раз-
мером дырки, и вот это совсем не так. Сечение струи на самом деле меньше сече-
ния дыры, и вызвано это тем, что притекающая к дыре с разных сторон жидкость
вызывает ее сжатие, благодаря чему сечение струи оказывается меньше сечения
2. Вытекание жидкости из сосуда 21

отверстия. Сжатия струи можно избежать, снабдив отверстие постепенно сужаю-


щейся воронкой. Сложный гидродинамический расчет, подтвержденный экспе-
риментом, дает, что сужение струи, вытекающей через отверстие в горизонталь-
ном дне, равно примерно 2.
Построенная нами математическая модель вытекания жидкости является ди-
намической системой. Ее фазовым пространством является полупрямая H ≥ 0 . Ее
единственная фазовая траектория представляет эту полупрямую, пробегаемую от
H = ∞ до H = 0 (рис. 2.3).

H=0 H
Рис. 2.3. Построение одномерного
фазового портрета вытекания воды
.
H
Сосуд, из которого вытекает вода, в древние времена использовался для от-
счета времени. Это так называемые водяные часы, клепсидры. Если выбрать S, σ
и H0 так, чтобы tвыт равнялось суткам, то, налив сосуд водой, можно определять
время в течение последующих суток по уровню воды Н. Для того чтобы указать
уровни, которым отвечают разные часы суток, нужно разделить отрезок оси t гра-
фика рис. 2.2 на 24 равные части и, согласно графику этого рисунка, найти соот-
ветствующие Н. Нетрудно видеть, что получающаяся при этом шкала времени,
выражаемая уровнями воды, будет неравномерной: сначала часу будет отвечать
сильное опускание воды, а дальше все меньшее и меньшее. Попробуем сообра-
зить, как нужно изменить водяные часы, чтобы их шкала была более удобной,
равномерной. Еще раз взглянем на формулу (2.1): шкала будет равномерной, если
равным dH вне зависимости от Н будут отвечать равные dt, т.е. нужно сделать
так, чтобы
σ
2 gH = const .
S
На первый взгляд, это невозможно, но если подумать, то можно догадаться,
что для этого достаточно цилиндрический сосуд, для которого S постоянно и не
зависит от Н, заменить на сосуд, у которого
S=a H .
Что за форма у такого сосуда? Пусть он имеет вид тела вращения, тогда его гори-
зонтальное сечение на высоте Н – круг радиуса r и площади S = π r 2. Далее следу-
ет, что
πr 2 = a H
или
2
π
H =   r4 ,
a
что соответствует форме сосуда, изображенной на рис. 2.4, форме, похожей на
котелок.
22 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Рис. 2.4. Форма сосуда, из которого вода вытекает


с постоянной скоростью убывания ее уровня

Итак, задача решена, закон вытекания найден и может быть использован для
построения водяных часов с удобной равномерной шкалой, правда, сейчас это
уже никому не нужно.
В основе решения задачи о вытекании лежит закон Торричелли, вывод кото-
рого несколько туманен. Попробуем его прояснить. Для этого прибегнем к тому,
чего Торричелли не знал, к закону сохранения энергии. При вытекании воды по-
тенциальная энергия тонкого слоя воды массы dm в связи с ее опусканием пере-
ходит в кинетическую энергию вытекающей воды, так что
v2
dm gH = dm
2
или
v = 2 gH ,
что и есть формула Торричелли. Так что все обосновано.
Но давайте испытаем на прочность полученный выше результат (2.2)
2
σ g 
H (t ) =  t − H 0 
S 2 
тем, что посмотрим, что он дает при σ = S, когда вода не вытекает, а просто пада-
ет из бездонного цилиндра. Раз она свободно падает, то, очевидно,
gt 2
H = H0 − ,
2
что никак не согласуется с тем, что дает принятый нами закон Торричелли. На
рис. 2.5 для сравнения приведены вместе оба графика изменения H(t). Первый из
них отвечает закону Торричелли при σ = S, второй – свободному падению воды.
Они не совпадают, хотя вода выливается из сосуда в обоих случаях за одно и то
же время tвыт.
H
H0 2
Рис. 2.5. Временные графики 1 и 2 «вытекания» воды
из цилиндра без дна, следующие из уравнения (2.1)
1 и, соответственно, закона свободного падения

tвыт t
2. Вытекание жидкости из сосуда 23

В чем же дело? Где ошибка? Неверен закон Торричелли? В законе падения


твердого тела усомниться трудно. Посмотрим, в чем разница между графиками 1
и 2 рис. 2.5. Согласно графику 1, вода сначала вытекает быстро, а затем скорость
ее вытекания замедляется, а согласно кривой 2, наоборот, сначала медленно, а за-
тем все быстрее и быстрее. При дырке во весь сосуд, пожалуй, вернее второе. Где
же ошибка? Что, неверен закон сохранения энергии? Едва ли. Он неверно приме-
нен? Это скорее похоже на правду. Но где?
Ведь все так просто и ясно. Вернемся к основной посылке: энергия сохраня-
ется (трением жидкости можно пренебречь) и поэтому потенциальная энергия
верхнего слоя переходит в кинетическую энергию вытекающей жидкости. Но
ведь это так, причем приближенно, только при σ << S. Действительно, ведь и
верхний слой жидкости опускается и имеет некоторую кинетическую энергию,
поэтому правильнее написать
H& 2 v2
dm gH + dm = dm
2 2
&
и соответственно, учитывая, что σv = − SH ,
2 gH σ 2 gH
H& = − =− . (2.4)
( S σ) 2 − 1 S 1 − (σ S ) 2

Эта новая формула при σ << S переходит в формулу Торричелли. Так что
требуемое уточнение найдено. Но не будем спешить: примем опять σ = S. Еще
хуже: теперь H& = ∞ . Опять ошибка. Вернемся снова к исходному рассуждению,
сразу имея в виду σ = S. При падении жидкости ее потенциальная энергия, равная
действительно dm gH, переходит в кинетическую, но не только жидкости, «выле-
зающей» из сосуда, но и находящейся в нем, точнее, в прибавку ее кинетической
энергии, поскольку движение носит ускоренный характер. Так что ошибка в том,
что нужно еще учитывать прибавку в кинетической энергии жидкости, находя-
щейся в сосуде, которая действительно мала при σ << S . Но при σ , сравнимом с
S, это совсем не так. Еще раз вернемся к исходному рассмотрению и сделаем не-
обходимые уточнения.
Итак, пусть V – потенциальная энергия жидкости в сосуде, Т – ее кинетиче-
ская энергия, а Т1 – кинетическая энергия вытекшей из сосуда за время dt жидко-
сти, тогда, согласно закону сохранения энергии,
d
(T + V )dt + T1 = 0 .
dt
Выражение для Т1 нам уже известно. Это
v2 v2
T1 = dm = −ρ SH& dt ,
2 2
где ρ – объемная плотность жидкости.
Потенциальная энергия может быть сосчитана
H
ρgSH 2
V = ∫ gH dm = ∫ ρSHg dH = ,
0
2
24 Ю.И. Неймарк. Математическое моделирование как наука и искусство

кинетическая энергия равна


u2
T = ∫ dm ,
2
где интеграл берется по всему объему жидкости в сосуде, а и – скорость течения
элемента массы dm этого объема жидкости. В разных точках сосуда скорость u
своя, найти ее – это значит найти, как жидкость вытекает из сосуда, а это очень
сложно. Как же быть? Как быть, ясно в двух крайних случаях: σ << S, и тогда
можно пренебречь величиной порядка u2, и σ = S, когда u = H& . Последнее при-
ближение применимо и в случае, когда H >> r, где r – радиус цилиндрического
сосуда с водой. Примем его, и тогда
H& 2
T = ρSH .
2
После этого закон сохранения энергии, согласно предыдущему, примет вид:
2
d H& 2 ρgSH 2   S  H& 2
 ρSH +  − ρSH  
& =0
dt  2 2  σ 2
или
2
H& 3 & &&  S  H&
3
ρS + ρSHHH − ρS   + ρgSHH& = 0 ,
2 σ 2
откуда

&& 1   S  2  H& 2 
H = −  gH −   − 1 . (2.5)
H 
  σ  
 2 
 
Как и можно было ожидать, теперь полученное дифференциальное уравнение
уже второго порядка и успешно проходит проверку при σ = S, поскольку из нее
следует, что, как требуется,
&& = − g.
H
Остается понять, как из него при σ << S следует ранее полученное уравне-
ние, основанное на законе Торричелли или его уточнении. Обнаружить это не
очень просто. Для облегчения рассуждения введем обозначение u = − H& , запишем
исследуемое уравнение в виде
1   S  2  u 2 
u& =  gH −   − 1  ≡ f (u ) (2.6)
H   σ   2 
и посмотрим, как меняется u& . При f (u) < 0 скорость и убывает, а при f (u) > 0, на-
против, возрастает, т.е. существует такое значение
−1

 S  2 
u = 2 gH   − 1 ,
 σ  
2. Вытекание жидкости из сосуда 25

что при и < и* и возрастает, а при и > и* и убывает. В результате этого и оказыва-
ется близким к u*. Для наглядности изобразим полуось значений u ≥ 0 и нарисуем
график f (u) как функции и. В соответствии с этим графиком и меняется, как пока-
зано на рис. 2.6. При этом, в силу того, что S/σ >> 1, приближение u к и* происхо-
дит быстро. Заметим, что при приближении и к и* точка и* несколько смещается,
но это смещение точки и* происходит значительно медленнее, чем приближение и
к и*, поскольку
d 2 gH 1 σu 2g
u& ∗ = 2
=− . (2.7)
dt ( S σ) − 1 2 S H [1 − ( σ S )]2
В силу этого, приближенно и тем точнее, чем меньше σ/S, имеет место
σ
u= 2 gH , (2.8)
S
что полностью совпадает с тем, что написано ранее (формулы (2.1) и (2.4)).
Какие же выводы следуют из того, что уравнение
σ
H& = − 2 gH
S
заменилось уравнением

&& 1   S  2  H& 2 
H = − gH +   − 1 ?
H 
  σ  
 2 

Прежде всего то, что теперь в начальный момент t = 0, H& = 0 . Затем проис-
ходит быстрое приближение H& к величине H& , определяемой первым уравнени-
ем, и далее процесс изменения H& происходит в соответствии с первым. Сказан-
ное изображено на рис. 2.7, где сплошной линией изображен график изменения
H& согласно первому уравнению, а пунктиром – второму. Часть графика, отве-
чающая промежутку времени от t = 0 до tраз, соответствует разгону вытекающей
струи жидкости, а остальная часть от tраз до tвыт – ее длительному вытеканию с по-
степенным замедлением.
u = − H&

u*
u
. tраз tвыт t
u
Рис. 2.6. Фазовый портрет Рис. 2.7. Временные графики падения
дифференциального уравнения (2.6) уровня воды после открытия дырочки:
при H = const сплошная линия – без учета фазы разгона,
пунктирная – с учетом ее
26 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Для того чтобы правильно представить этот график изменения скорости, сле-
дует определить время разгона tраз , а время вытекания уже определено
S 2H0
tвыт = .
σ g
После разгона величина скорости вытекания жидкости достигает величины
2gH , причем скорость разгона u& , во всяком случае в начале, как следует из
(2.6), равна
u& = g .
Поэтому приближенно по порядку величины время разгона равно
σ 2H 0
tраз = .
S g
Отсюда следует, что примерно
2
tраз σ
=  .
tвыт S
В частности, если отношение радиуса цилиндра сосуда к радиусу отверстия в
дне равно 100, то время разгона меньше времени вытекания примерно в 108 раз,
т.е. если время вытекания – около часа, то время разгона – десятитысячные доли
секунды. Даже при относительно большей дыре, когда отношение радиусов ≈10,
отношение времен – порядка 104. Таким образом, при σ/S << 1 разгон происходит
практически мгновенно, а далее вытекание согласуется с законом Торричелли.
На этом краткий рассказ о том, как вытекает вода из сосуда через дырочку в
его дне, можно было бы и закончить. Но я хочу еще вам показать, как можно ис-
пользовать понятие фазового портрета для исследования движений уточненной
модели (2.5).
Запишем ее дифференциальные уравнения в переменных Н и v уровня жид-
кости и скорости вытекающей струи. Совокупность этих переменных образует
состояние, и их изменения, согласно предыдущему, удовлетворяют дифференци-
альным уравнениям:
S  1   σ   v 2 
2
σ
H& = − v , v& =
 g − −
    .
1 (2.9)
S σ H   S   2 
 
В пределе при σ/S → 0 дифференциальные уравнения принимают вид:
 ∞ при v 2 < 2 gH ,

H& = 0, v& =  0 при v 2 = 2 gH ,
− ∞ при v 2 > 2 gH ,

согласно которому фазовый портрет состоит из вертикальных фазовых траекто-
рий, по которым фазовые точки бесконечно быстро перемещаются на кривую со-
стояний равновесия v2 = 2gH (рис. 2.8).
2. Вытекание жидкости из сосуда 27

При σ/S << 1, т.е. очень маленьком, мгновенные движения перейдут в быст-
рые, замедляющиеся по мере приближения к линии v2 = 2gH, и одновременно ка-
ждая из фазовых точек, включая и бывшие состояния равновесия, будет смещать-
ся влево с очень малой скоростью. В результате этого фазовый портрет изменится
и примет вид, показанный на рис. 2.9. На нем всякое движение фазовой точки по-
сле быстрого изменения переходит в медленное движение вблизи и вдоль фазовой
кривой v2=2gH, где выполняется закон Торричелли.
v
v
2
v =2gH

H H
Рис. 2.8. Фазовый портрет предельного Рис. 2.9. Фазовый портрет
дифференциального уравнения (2.9). дифференциального уравнения (2.9)
Линия с черными точками – при σ/S << 1
состояния равновесия
В частности, если начальной является фазовая точка H = H0 , v = 0, то сначала
она очень быстро приблизится к кривой v2= 2gH и затем будет двигаться вдоль
нее налево, оставаясь вблизи нее. Соответствующий этому движению фазовой
точки график изменения скорости v (точнее − H& = (σ S )v ) уже был представлен
на рис. 2.7. Там же мы очень грубо оценили время приближения фазовой точки из
начального положения H = H0, v = 0 к малой окрестности кривой v2=2gH. Сейчас
мы можем уточнить эту оценку. Действительно, пусть нас интересует время при-
ближения рассматриваемой начальной фазовой точки к ε-окрестности кривой
v2=2gH, определяемой неравенствами
− 2 gHε < v 2 − 2 gH < 2 gHε ,
где ε > 0 мало. Из второго дифференциального уравнения (2.9) следует, что
 v 2 (1 − µ 2 ) 
µ dv =  g −  dt ,
 2H 
где введено обозначение µ = σ/S. Пренебрегая малым изменением величины H,
которая в начальный момент равна H0, и величиной µ2, запишем его в виде
µd v
= dt .
g (1 − v 2 /(2 gH 0 ))
Интегрируя левую часть от значения v = 0 до значения v = 2 gH (1 − ε) , отве-
чающего достижению границы ε-окрестности кривой v 2 = 2 gH , а правую часть от
0 до τ, находим, что искомое время движения τ фазовой точки приближенно рав-
но
28 Ю.И. Неймарк. Математическое моделирование как наука и искусство

2 gH (1− ε )
µ dv 1 σ 2H 0 1 + 1 − ε
τ=
g ∫ 2
=
1 − v ( 2 gH 0 ) 2 S g
ln
1− 1− ε
.
0
Это по порядку величины близко к ранее грубо оцененному значению τ , рав-
ному σ S 2 H 0 g .
Таким образом, при небольшой дырочке (σ⁄S << 1) вытекание жидкости из
сосуда четко разбивается на две фазы: быстрая фаза разгона до скорости, близкой
к 2gH 0 , и фаза длительного вытекания за конечное время с убывающей до нуля
скоростью v. Вместе с тем из полученных оценок следует, что время разгона с
уменьшением сечения дырочки σ неограниченно уменьшается. Это вызывает со-
мнения, так как соответствует неограниченному росту ускорения. Этот парадокс,
по-видимому, – следствие допущенных приближений в подсчете кинетической
энергии жидкости в сосуде, когда принято, что скорость жидкости во всех ее точ-
ках равна H& . Ясно, что вблизи дырочки это значительно не так, и тем более не
так, чем больше S/σ. Вместе с тем, при достаточно малой дырочке в силу капил-
лярного поверхностного натяжения жидкость может не начать течь, если радиус
отверстия меньше 2µ/ρgH0, где µ – коэффициент поверхностного натяжения. Для
воды и H0 ≈ 50 см это отверстие много менее 1 мм. В силу этого же эффекта мо-
жет прекратиться вытекание с уменьшением уровня H. Вообще, при маленькой
дырочке возможно не только прекращение вытекания, но и возникновение преры-
вистого вытекания. Однако оставим эти явления в стороне и попытаемся уточнить
вычисление кинетической энергии жидкости в сосуде на основе гидродинамиче-
ской модели вытекания идеальной жидкости. Это уточнение вычисления наибо-
лее существенно вблизи дырочки, где скорость много больше H& .
Пусть H& достаточно мало, так что поле скоростей жидкости внутри сосуда
вблизи дырочки меняется медленно и его можно считать квазистационарным.
Для возможности сравнения полученного выражения для кинетической энер-
гии T запишем его в виде (рис. 2.10):
H 2
ρu 2 d σ 1 1 S  H& 2  KS
T = ∫ dσ ∫ dx = ρv 2σK = ρKσ  H& 2 =  ρ S H 
 σH .
S 0
2 d σ 2 2  σ   2 
Выделенный скобками множитель – это прежнее выражение кинетической
энергии. Отличие нового и прежнего − в множителе KS(σH)−1, где K – среднее
значение интеграла по трубкам тока,
H
1 dσ
K = ∫ dσ ∫ dx .
σ S 0 dσ
Величина dσ d σ убывает с ростом x от 1 до dσ dS , где dS – значение d σ на
поверхности жидкости. Поэтому K – величина, меньшая H , причем тем более
меньшая, чем быстрее убывает вдоль трубки тока с ростом x dσ d σ . Итак, мно-
житель отличия первоначальной и уточненной величин кинетической энергии
меньше S σ и его величина растет с уменьшением σ. Отсюда видно, что совер-
шенная нами ошибка в первоначальном подсчете кинетической энергии может
2. Вытекание жидкости из сосуда 29

быть значительна, но уменьшается с ростом H и убыстрением убывания dσ d σ с


ростом x.

S ds

Рис. 2.10. Трубка тока, по которой осуществляется x



подсчет кинетической энергии T

σ

Найдем теперь, как изменится дифференциальное уравнение (2.5). Имеем


2
d  2 −1 H& 2 ρgSH 2   S  H&
2
 ρS Kσ +  &
− ρSH   = 0,
dt  2 2  σ 2
откуда
σ   S  H& 
2 2
H&& = −  gН −   , (2.10)
SK   σ  2 
как и раньше, приходим к оценке времени разгона вида
2H 0
tраз ≈ K , (2.11)
g
согласно которой нет стремления tраз к нулю вместе с уменьшением σ. Заметим,
что 2 H 0 g – это время свободного падения с высоты H0, а K < 1 . Время паде-
ния с высоты 50 см – это примерно 0,3 с, т.е. разгон остается быстрым.
30 Ю.И. Неймарк. Математическое моделирование как наука и искусство

3. РАВНОВЕСИЕ И АВТОКОЛЕБАНИЯ УРОВНЯ ЖИДКОСТИ


В СОСУДЕ ПРИ ОДНОВРЕМЕННОМ ПРИТОКЕ И ОТТОКЕ
Пусть теперь одновременно с оттоком воды из цилиндрического сосуда с
площадью сечения S через его дырочку в дне с эффективным сечением σ вода
притекает снаружи с интенсивностью Q. В этом случае уравнение баланса жидко-
сти в сосуде запишется в виде:
S H& = − σv + Q , (3.1)
где v – скорость вытекания воды через отверстие с сечением струи σ, а Н, как и
ранее, – высота уровня жидкости в сосуде, при этом жидкость считается несжи-
маемой. Если еще пренебречь ее вязкостью, то при σ/S << 1 и v = 2g H диффе-
ренциальное уравнение (3.1) можно записать в виде:
σ Q
H& = − 2 gH + . (3.2)
S S
Оно легко интегрируется, но прибегнем к рассмотрению его фазового порт-
рета, нарисовав график скорости H& как функции Н (рис. 3.1). Слева от точки Н*
H ∗ = Q 2 2 σ2 g, (3.3)
в которой H& = 0, фазовые точки по фазовой полупрямой H ≥ 0 движутся вправо,
H возрастает; справа от точки Н*, наоборот, Н убывает. Это означает, что точка
Н = Н* – устойчивое состояние равновесия. К нему приходят с течением времени
все точки фазовой полупрямой Н ≥ 0. Из формулы (3.3) следует, что высота рав-
новесного уровня прямо пропорциональна квадрату интенсивности Q притока во-
ды и обратно пропорциональна квадрату сечения вытекающей струи.
Вот, собственно, и вся нехитрая динамика этой системы: она всегда приходит
к устойчивому динамическому равновесию Н = Н* притока и оттока жидкости.
Допустим теперь, что отток жидкости происходит не через отверстие в дне
сосуда, а через так называемый сифон, трубку сечения σ, изогнутую, как показано
на рис. 3.2.

.
H S H2
Q/S H
H1
*
H
H H3 σ

Рис. 3.1. Фазовый портрет изменения уровня Рис. 3.2. Цилиндр с притоком воды Q
воды H в цилиндре при притоке воды Q извне и оттоком через сифон
и оттоке ее через дырочку в дне
3. Равновесие и автоколебания уровня жидкости в сосуде 31

Трубка не доходит до дна на расстояние, равное Н1, вверху она поворачивает


на высоте Н2 от дна и кончается ниже дна на расстоянии Н3 (рис. 3.2). Сифон – это
замечательное устройство, позволяющее выливать воду из неполной бочки через
ее край, т.е. при Н < Н2. Но это возможно лишь тогда, когда сифон наполнен во-
дой, если же он пуст, то при уровне воды Н < Н2 через него вода не течет. Можно
поэтому думать, что наша система – бочка с сифоном и притоком – будет иметь
своим состоянием описание, достаточное для прогноза: высоту уровня воды Н и
значение переменной ξ, равное 1, если сифон заполнен водой, и равное 0, если он
пуст. Итак, в качестве описания, претендующего на состояние, примем Н и ξ. По-
видимому, следует различать случаи:
H < Н1, Н1 < H < Н2 и Н > Н2.
При H < Н1 ξ = 0 и S H& = Q . При H > Н2 сифон наполняется (если не был на-
полнен), поэтому ξ = 1 и
S H& = Q − σ 2 g ( H + H ) .
3

В промежуточном случае Н1 < Н < Н2 возможны значения ξ = 0 и ξ = 1. При ξ = 0


S H& = Q .
При ξ = 1
S H& = Q − σ 2 g ( H + H 3 ) .
В случае Н1 < H < Н2 ξ = 1, если непосредственно перед этим ξ = 1 или
Н > Н2, и ξ = 0, если перед этим ξ = 0 или H < Н1.
Описанную зависимость ξ от значения и изменения Н можно представить
диаграммой рис. 3.3, на которой указаны условия смены значения ξ с 0 на 1 и об-
ратно: ξ меняется с 0 на 1, если Н, возрастая, обращается в Н2, и ξ испытывает пе-
реход от 1 к 0, если Н, убывая, проходит значение Н1. Сделанное описание явля-
ется математической моделью сифона. При этом ξ не является функцией Н, хотя
бы и двузначной. Это функционал от предшествующего изменения H(τ) с τ ≤ t,
описываемый диаграммой рис. 3.3.
Уравнения изменения Н, согласно предыдущему, записываются в виде
Q / S при H < H1,
Q / S при H1 ≤ H ≤ H 2 и ξ = 0,

H& =  (3.4)
 Q / S − σ / S 2 g ( H + H 3 ) при H1 ≤ H ≤ H 2 и ξ = 1,
Q / S − σ / S 2 g ( H + H 3 ) при H > H 2 .
Фазовое пространство рассматриваемой системы состоит из двух частей: от-
резка 0 ≤ H ≤ H2 и полупрямой H1 ≤ H < ∞, с переходами с одного участка на дру-
гой, показанными на диаграмме рис. 3.3.
Для того чтобы на этом фазовом пространстве построить фазовый портрет,
нужно показать стрелкой направление движения каждой из его точек в соответст-
вии с дифференциальными уравнениями (3.4). Знак H& непосредственно указыва-
ется уравнениями (3.4). При H < H2 и ξ = 0 H& > 0. На части фазового пространст-
ва, отвечающей ξ = 1, знак H& зависит от местоположения точки H=H*, в которой
32 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Q − σ 2 g ( H + H 3 ) = 0.
Возможны три разных случая: а) H* < H1, б) H1 < H* < H2 и в) H* > H2. Они
представлены на рис. 3.4.
H*

а)
H1 H2
H*
ξ
ε=1 б)
H1 H2
ε=0
H*
H1 H2 H
в)
H1 H2

Рис. 3.3. Диаграмма смен состояния ξ Рис. 3.4. Фазовое пространство


сифона при изменении уровня воды H уравнения (3.4)

Для того чтобы на этом фазовом пространстве построить фазовый портрет,


нужно показать стрелкой направление движения каждой из его точек в соответст-
вии с дифференциальными уравнениями (3.4). Знак H& непосредственно указыва-
ется уравнениями (3.4). При H < H2 и ξ = 0 H& > 0. На части фазового пространст-
ва, отвечающей ξ = 1, знак H& зависит от местоположения точки H=H*, в которой
Q − σ 2 g ( H + H 3 ) =0.
Возможны три разных случая: а) H* < H1, б) H1 < H* < H2 и в) H* > H2. Они
представлены на рис. 3.4.
Первый случай (а) отвечает возникновению периодических колебаний уровня
воды от Н1 к Н2 и обратно. Второй и третий – устойчивым равновесным уровням
Н* между Н1 и Н2 и выше Н2.
Пусть все параметры изучаемой системы фиксированы, а Н3 может меняться.
То, какой из случаев будет иметь место, зависит от значения корня Н* уравнения
Q − σ 2 g ( H + H 3) =0,
равного
Q2
H∗ = − H 3.
2 gσ 2
Согласно рис. 3.4, при Н* > Н1 имеет место устойчивое равновесие уровня
жидкости в сосуде, при Н* < Н1 – устойчивые периодические его колебания, на-
зываемые автоколебаниями.
Скачкообразное изменение динамики уровня жидкости происходит при зна-
чении Н3, определенном из условия
3. Равновесие и автоколебания уровня жидкости в сосуде 33

Q2
− H 3 = H1
2 gσ 2
или при
Q2
H 3 = H 3* = − H1 ,
2 gσ 2
т.е. при H 3 < H 3* имеет место устойчивое равновесие, а при H 3 > H 3* будут на-
блюдаться автоколебания.
34 Ю.И. Неймарк. Математическое моделирование как наука и искусство

4. ПЕРЕХОДНЫЙ ПРОЦЕСС, СОСТОЯНИЕ РАВНОВЕСИЯ


И АВТОКОЛЕБАНИЯ
В только что рассмотренных математических моделях мы познакомились с
тремя типами движений динамических систем: переходный процесс, состояние
равновесия и автоколебания.
Переходный процесс имел место при выливании воды из сосуда: система из
одного состояния, отвечающего начальному уровню воды, переходит к другому,
при котором сосуд пуст. Переходные процессы имели место и при установлении в
сосуде равновесного уровня или периодических колебаний уровня. Последнее
имело место в случае слива воды с помощью сифона.
Равновесие носило динамический характер в результате устойчивого вырав-
нивания притока и оттока воды. Устойчивость возникла в силу того, что увеличе-
ние уровня вызывало превышение оттока над притоком, а его уменьшение, на-
оборот, превышение притока над оттоком.
Наиболее неожидан и интересен случай, когда возникают устойчивые коле-
бания. Ведь они возникают без какой-либо видимой побуждающей их причины,
сами по себе, почему и названы автоколебаниями (самоколебаниями). Еще совсем
недавно возникновение таких колебаний связывали с каким-нибудь периодиче-
ским воздействием и с трудом приняли, что периодические колебания могут воз-
никнуть сами по себе, без него.
В науке и инженерном деле признание возможности автоколебаний носило
характер революционной ломки сознания, которая последовательно совершалась
в электричестве, механике, химии, биологии и экономике. Казалось, что возмож-
ность автоколебаний противоречит природе вещей: всякие механические колеба-
ния, например колебания маятника, затухают, затухают и колебания электриче-
ского контура. А в химической реакции откуда возьмутся колебания: всякая реак-
ция стремится к своему окончанию; некоторому динамическому равновесию. Но
все оказалось значительно сложнее. Автоколебания возможны в самых разнооб-
разных физических, химических и биологических системах. Автоколебания могли
быть вредными, а могли быть полезными, и вскоре, после упорных и бурных об-
суждений, их стали видеть всюду. Сегодня это уже банальность. Но еще в тридца-
тых–пятидесятых годах прошлого века это было совсем не так. В технике многие
автоколебательные явления, такие как шимми передних колес автомобиля, со-
стоящие в возникновении их колебаний; флаттер крыла самолета, при котором
возбуждаются колебания крыла самолета, ведущие к его поломке или потере
управляемости самолета; колебания режущего инструмента металлообрабаты-
вающих станков и многие другие, длительное время пытались объяснить исходя
из предположения о наличии вынуждающей силы и резонанса. Явление шимми
предполагалось возникающим от неровностей дороги или дисбаланса колес, при-
чем особенно опасным, если имел место резонанс – близость периода этих воз-
действий и собственной частоты колебаний колес. Считалось, что флаттер крыла
4. Переходный процесс, состояние равновесия и автоколебания 35

вызывается вихрями в атмосфере и опять же опасен, если имеет место резонанс.


Режущий инструмент вибрировал под влиянием срывов снимаемой стружки.
Эти неправильные представления приводили к бессилию теории в борьбе с
подчас очень вредными и опасными явлениями.
Несколько ранее, чем в механике, признание автоколебаний произошло в ра-
диотехнике, поскольку именно они лежали в основе зарождающейся передачи ра-
диосигналов и затем телевидения.
Особенно упорным сопротивление идее автоколебаний было в химии и био-
логии, где консервативность проявлялась сильнее и длительнее. Даже когда Бело-
усов нашел реакцию, которая носила явный автоколебательный характер, види-
мый по периодическому изменению цвета раствора, химики не сдавались и ут-
верждали, что это невозможно, потому что невозможно никогда.
Обычно принято думать, что великие открытия и перевороты в науке требу-
ют сложных новых методов, на самом деле они требуют скорее простых, но
принципиально новых.
Таким принципиально новым подходом, позволяющим понять естествен-
ность возникновения автоколебаний и заставляющим нас их принять в противовес
ошибочной интуиции, является фазовый портрет динамической системы. Именно
он легко убедил в том, что сифон может вызвать автоколебания. Но, пожалуй,
общие соображения о том, каков образ автоколебаний на фазовом портрете и как
он может у него возникнуть, еще действеннее, чем отдельные примеры. Этот про-
стой геометрический образ – замкнутая фазовая траектория – открыл А. Пуанкаре,
а его научное математическое открытие с практикой и теорией колебаний связал
А.А. Андронов. Его знаменитая работа так и называлась: «Предельные циклы
A. Пyaнкape и автоколебания».
Как же сегодня можно объяснить возникновение автоколебаний в динамиче-
ских системах, естественность и обычность этого явления?
Пусть динамическая система описывается дифференциальными уравнениями
x& = X ( x ) (x – вектор).
Его фазовые траектории являются огибающими векторов поля этой системы,
т.е. скоростей X, которые в каждой точке x фазового пространства определяют
вектор x& , т.е. векторное поле. Если поле скоростей (т.е. вектор-функция Х(х)) та-
ково, что фазовая траектория замыкается, то возникают автоколебания. Для этого
нужно лишь подобрать подходящим образом вектор-функцию Х(х), а это сделать
совсем нетрудно. Нужно лишь, чтобы пучок фазовых траекторий «зашел себе в
хвост» и «сжался», как это показано на рис. 4.1. Сжатие фазовых траекторий обес-
печивает не только существование замкнутой фазовой траектории, но и ее устой-
чивость. Так бывает очень часто: именно в силу такой ситуации поет скрипичная
струна, гудит орган, переливается флейта, поет соловей, мы говорим и поем, ра-
ботает наше сердце, мы ходим и бегаем, идут часы на нашей руке, передаются ра-
диосигналы, стрекочут кузнечики, противно скрипят тормоза и еще неприятнее
скрипит ноготь, которым проводят по стеклу.
В двумерном случае, т.е. при двумерном фазовом пространстве, нарисовать
общее поведение фазовых траекторий, ведущих к наличию автоколебания – ус-
тойчивой замкнутой фазовой траектории, к которой приближаются соседние тра-
36 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ектории, еще нагляднее. Пусть фазовая траектория γ1 скручивается и расположен-


ная внутри другая фазовая траектория γ2 раскручивается, как показано на рис. 4.2.
γ1

γ2

Рис. 4.1. Иллюстрация Рис. 4.2. Иллюстрация


к возникновению автоколебаний к возникновению автоколебаний
на фазовой плоскости

Наглядно ясно, что между ними есть замкнутая фазовая траектория γ, на ко-
торую они наматываются (она изображена пунктиром). В дальнейшем будет при-
веден конкретный, т.е. описывающий реальный объект, пример подобного пове-
дения фазовых траекторий. А сейчас ограничимся примером дифференциального
уравнения [11]. Пусть ϕ, r – полярные координаты, удовлетворяющие дифферен-
циальным уравнениям
ϕ& = 1, r& = r − r 2 .
Из этих уравнений видно, что фазовая траектория, начинающаяся при ϕ = 0 и
r = 1/2, раскручивается, а начинающаяся в точке ϕ = 0 и r = 2 – скручивается, и их
разделяет окружность r = 1, соответствующая устойчивому периодическому вра-
щению – автоколебанию, что означает, что касательная в каждой ее точке совпа-
дает с вектором x& , вектором скорости и перемещения этой точки в фазовом про-
странстве.
5. Динамика уровня зеркала водохранилища с гидростанцией 37

5. ДИНАМИКА УРОВНЯ ЗЕРКАЛА ВОДОХРАНИЛИЩА


С ГИДРОСТАНЦИЕЙ
В предыдущих главах мы строили и изучали математические модели бочки с
водой при ее оттоке через отверстие в дне или сифон и, возможно, еще притоке.
Бочка − объект, заслуживающий внимания: самая известная для современников
работа И. Кеплера, помимо его астрологических работ, − о том, как определить
объем наполненной бочки, не опорожняя ее. Но это было давно, и с тех пор бочка
потеряла свою «актуальность». В соответствии с этим и мы перейдем от бочки к
математическим моделям более значимых объектов: водохранилища с гидростан-
цией и бесценного жидкостного насоса, помещающегося у нас в груди, именуемо-
го сердцем. Эти объекты очень сложные, но их модели останутся простыми до
примитивности, и все же кое о чем важном, неочевидном и интересном они нам
поведают.
На рис. 5.1 схематически изображено водохранилище с уровнем воды H, под-
пирающей его плотиной и гидравлической турбиной с электрогенератором.
I

H
Q
Рис. 5.1. Схематическое изображение P
водоема с плотиной и гидростанцией H1
h W, k

F
Вода из водоема по трубопроводу поступает в турбину и вращает ее. Соеди-
ненный с ней генератор вырабатывает электрический ток требуемой мощности W.
В водоем притекает вода, интенсивность общего притока которой равна Q. Вели-
чина Q меняется со временем, но мы примем ее постоянной. Вода в водоеме рас-
ходуется на вращение турбины, но, кроме того, следует учесть испарение и
фильтрацию воды, которые растут с повышением уровня воды в водоеме. Нас бу-
дет интересовать изменение уровня воды Н в водоеме. Расход воды, необходимый
для выработки электроэнергии, зависит от интенсивности использования воды
гидротурбиной и ее напора, определяемого уровнем Н воды в водоеме. Учитывая
все сказанное, можно записать
dH W
S =Q−I −F − , (5.1)
dt k ρ g ( H + h)
где S(H) – площадь поверхности зеркала воды в водоеме, I и F – интенсивности
испарения и фильтрации, а последний член выражает интенсивность расхода во-
ды, необходимого для выработки электроэнергии мощности W при коэффициенте
полезного действия гидростанции k и объемной плотности воды ρ. Выражение
последнего члена расхода воды в формуле (5.1) находится следующим образом.
38 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Пусть искомый объемный расход равен Р. Тогда, если перепад уровня воды перед
гидротурбиной Н+h, то при перетекании воды из водохранилища в гидротурбину
освобождается за время dt энергия, равная
ρ g P( H + h )dt .
Часть kρgP(H + h) этой энергии превратится в электроэнергию (k – коэффи-
циент полезного действия гидротурбины вместе с электрогенератором) требуемой
мощности W. Поэтому
k ρ gP( H + h ) = W ,
откуда находим искомую интенсивность объемного расхода воды гидротурбиной
W
P= .
k ρg ( H + h )
Перейдем к исследованию полученного дифференциального уравнения (5.1).
Для этого нам необходимо нарисовать график правой части этого уравнения как
функции Н. Правая часть состоит из постоянного слагаемого Q, величин I и F,
возрастающих с ростом уровня Н, и последнего члена, который, напротив, увели-
чивается с убыванием Н. При Н < 0 последний член исчезает, так как при этом
прекращается подача воды в гидротурбину. В соответствии с этим более полно
уравнение (5.1) запишется в виде:
 W
& Q − I − F − при H > 0,
SH =  kρ g ( H + h ) (5.2)
Q − I − F при H < 0,
а график правой части уравнения (5.1) качественно имеет вид, представленный на
рис. 5.2.

Q
Рис. 5.2. Фазовый портрет системы
Q «водоем − гидростанция с плотиной»
при описании изменения уровня воды
Q в водоеме дифференциальным
H
*
уравнением (5.2)
*
−H1 H=0 H1 H2

На нем величина правой части есть разность между Q и остальными членами,


которая изображается стрелками. Согласно этому графику, на фазовой полупря-
*
мой Н ≥ –Н1 имеются три состояния равновесия: O2 (H = H2 ) – устойчивое равно-
весие, при котором обеспечена полноценная работа гидростанции с выдачей тре-
буемой мощности W; равновесие O с Н = 0 также устойчивое, но оно обеспечивает
получение не полной мощности W, а только ее части, равной
kρg (Q − I − F ) H =0 < W ,
поскольку при H = 0, как видно из графика рис. 5.2,
5. Динамика уровня зеркала водохранилища с гидростанцией 39

W
Q−I −F − < 0;
kgρh
*
и, наконец, неустойчивое состояние равновесия О1 (H = Н1 ). Оно интересно тем,
* *
что при H > H1 уровень водоема возрастает до величины H = Н2 и при этом обес-
*
печивается требуемая отдача электроэнергии. Напротив, при 0 < Н < Н1 уровень Н
уменьшается до нуля и полноценная работа гидростанции не обеспечивается. За-
метим, что она не обеспечивается не за счет того, что принципиально не хватает
требуемой воды, а за счет того, что режим работы системы выбран неправильно.
Ведь при том же притоке Q в равновесии O2 мощность W гидростанцией обеспе-
чивается.
Из сказанного следует, что нельзя допускать падения уровня воды в водоеме
* *
ниже H = Н1 , Н1 – это критический уровень, ниже которого необходимо прини-
мать неординарные меры: уменьшать временно потребление электроэнергии и
*
мощность гидростанции и лишь после того, как уровень Н превзойдет H1 , снова
вернуться к нормальной эксплуатации.
Теперь посмотрим, какие сюрпризы нас могут ожидать при временных
уменьшениях интенсивности притока Q или временной необходимости увеличе-
ния мощности W. При уменьшении Q состояния равновесия O2 и O1 сближаются,
при Q = Qкр – сливаются и при Q < Qкр – исчезают, после чего уровень H прибли-
жается к H = 0. При Q < Qкр равновесный уровень меньше нуля. Аналогичный
результат возможен и при временном увеличении W. В обоих случаях для того
чтобы вернуться к прежнему нормальному режиму работы гидростанции, необхо-
димо временно уменьшить мощность гидростанции и дождаться превышения
*
уровнем H критического значения H1.
Для придания наглядности сказанному нарисуем диаграмму зависимости рав-
новесных режимов от величин Q. При одном значении Q, изображенном на
* *
рис. 5.2, эти равновесные состояния – O1 (H1), O2 (H2 ) и O (H = 0). Нанесем их при
разных Q на диаграмму, как показано на рис. 5.3. Кружочками отмечены устойчи-
вые равновесия и крестиком – неустойчивые.
Будем теперь менять Q и посмотрим по диаграмме рис. 5.3, как меняется рав-
*
новесие. При уменьшении Q состояния равновесия O1 и O2 будут сближаться (H2
*
убывает, а H1 возрастает). Для состояния равновесия O величина Н по-прежнему
равна нулю. При некотором критическом значении Q = Qкр равновесия O1 и O2
сольются и при дальнейшем уменьшении Q исчезнут. После того как они исчез-
нут, в связи с уменьшением Q, останется одно устойчивое равновесие O. В этом
равновесии H = 0, гидростанция не может вырабатывать полную мощность W, так
как при этом расход воды P, находимый из соотношения
Q − I − F − P = 0,
меньше, чем расход W/kgρh, требуемый для получения мощности W. При обрат-
ном возрастании Q гидростанция будет находиться в неполноценном режиме
H = 0 работы вплоть до Q = Q , где
W
Q = I ( 0) + F ( 0) + .
kgρh
40 Ю.И. Неймарк. Математическое моделирование как наука и искусство

После возрастания Q сверх Q режим O перестанет быть равновесным и гид-


ростанция перейдет к режиму O2, в котором будет отдавать требуемую мощность
W в выгодном режиме работы.
H H
O2

O O1

Qкр Q Q Q

Рис. 5.3. Бифуркационная диаграмма Рис. 5.4. Графическая иллюстрация явления


равновесных уровней в водоеме гистерезиса зависимости уровня воды H
с гидростанцией в водоеме от ее притока Q

На рис. 5.4, повторяющем рис. 5.3, показано, как будет меняться режим рабо-
ты гидростанции при медленном, описанном выше, сначала убывании, а потом
возрастании притока воды Q. Характерной особенностью этого изменения являет-
ся то, что при одном и том же притоке Q при Qкp < Q < Q возможны два сущест-
венно разных режима работы гидростанции в соответствии с двумя устойчивыми
равновесиями О2 и О. С точки зрения работы гидростанции хорошим является
первый и плохим – второй. То, какой из режимов на самом деле будет иметь ме-
сто, зависит от предыстории изменения Q. Нетрудно заметить, что характер этой
зависимости похож на тот, что имел место для сифона.
С помощью диаграммы рис. 5.3 и рис. 5.4 легко прослеживается зависимость
возможных равновесных режимов от притока Q и смена их при медленном изме-
нении Q. Ее называют бифуркационной диаграммой состояний равновесия по па-
раметру Q – диаграммой изменения равновесий с изменением параметра Q.
Как следует из сказанного, стратегия управления гидростанцией, при которой
она все время вне зависимости от уровня Н и притока Q должна выдавать мощ-
ность W, не только не всегда реализуема, но и плоха, так как может приводить к
ситуации, когда гидростанция не выдает требуемую мощность W, хотя это было
бы вполне возможным при другой стратегии управления ею.
Выше предполагалось, что уровень устойчивого равновесия не выше допус-
тимого Hmax. Это может быть не так, и тогда необходимо использовать неустой-
чивое равновесие, трансформировав его в устойчивое средствами управления, о
чем будет идти речь далее. Если пренебречь потерями воды на испарение и
фильтрацию по сравнению с расходом ее на выработку электроэнергии, то станет
ясно, что наилучшим режимом работы гидростанции является ее работа на мак-
симально возможном Hmax (определяемом высотой плотины), потому что в этом
случае расход воды на единицу получаемой мощности минимален. Этот режим
работы не только самый экономный с точки зрения расхода воды, но и дающий
максимально возможную мощность при заданном притоке Q. Это, если можно так
выразиться, идеальный режим работы гидростанции. Но он реализуется при за-
данной Hmax при вполне определенном притоке Q, равном
5. Динамика уровня зеркала водохранилища с гидростанцией 41

W
I ( H max ) + F ( H max ) + .
kgρ( h + H max )
При уменьшении Q этот оптимальный режим нарушается и при сохранении
мощности W переходит в менее выгодный режим с меньшей, чем Hmax, высотой Н.
Нетрудно видеть, что при этом происходят потери возможной суммарной энер-
гии. Чтобы этого не происходило, можно снизить мощность W так, чтобы уровень
воды оставался Hmax. Как видите, перед нами возникает задача об оптимальном
управлении гидростанцией. Теоретическим изучением таких задач занимается
специальная сравнительно недавно возникшая и еще развивающаяся наука – тео-
рия оптимального управления, являющаяся самостоятельной частью более общей
науки, называемой теорией операций.
42 Ю.И. Неймарк. Математическое моделирование как наука и искусство

6. ЭНЕРГЕТИЧЕСКАЯ МОДЕЛЬ СЕРДЦА


Мы построим и исследуем очень простую энергетическую модель сердца.
Будем изучать орган очень сложный с помощью модели очень простой. Оказыва-
ется, это возможно. Оказывается, и очень простая модель может быть полезной и
сказать что-то очень важное и интересное.
Функционально сердце – четырехкамерный насос, снабжающий кровью весь
организм. Одна его половина прокачивает кровь по так называемому малому кру-
гу, через легкие, обогащающие ее кислородом. Синяя венозная кровь превращает-
ся в красную, ее эритроциты, поглотив кислород, меняют цвет. Вторая половина
сердца снабжает артериальной кровью, наполненной кислородом и многими дру-
гими веществами, все органы и ткани человека. Это так называемый большой
круг кровообращения. Сердце не может остановиться, оно должно непрерывно
работать днем и ночью, всю нашу жизнь.
Но сердце – не просто насос. Это управляемый насос, подчиняющийся ко-
мандам вегетативной и центральной нервных систем. При своей работе оно долж-
но согласовываться с физическими и психическими нагрузками своего обладате-
ля, поддерживать баланс между большим и малым кругами, менять свой ритм и
интенсивность работы в соответствии с командами нервной системы. Его нервная
регуляция многоступенчата и достаточно сложна. Сердце совершает механиче-
скую работу за счет запасенной им химической энергии, которая все время неус-
танно пополняется поступающей в него кровью за счет его же работы. Оно как бы
питает само себя, работает, потому что себя питает.
Сердце – это сложный управляемый насос, он должен прогонять кровь по ма-
лому и большому кругам, принимая ее предсердиями и прокачивая желудочками.
Для этого нужна система клапанов: митральный, аортальный и другие, нужны
сложнейшие сети артериальных и венозных сосудов вплоть до тончайших капил-
лярных сосудов, доставляющих кровь клеткам тканей. Процесс превращения хи-
мической энергии АТФ в механическую работу очень сложен, очень сложна и
система управления работой сердца, она должна в достаточной мере снабжать ор-
ганизм кровью, не излишествуя и увеличивая это снабжение по мере необходимо-
сти при физических, умственных и стрессовых нагрузках. Она должна обеспечить
согласованность прокачки крови по большому и малому кругам, не вызывая пе-
реполнения кровью легких, органов и тканей организма. В этом ей помогают эла-
стичные сокращения и расслабления сосудов. Система управления должна обес-
печить и синхронное сокращение отдельных мышечных волокон сердца, и воз-
можность его автономной работы. Все это достаточно сложно. Современной ме-
дицине очень нужны математические модели сердца, они нужны, чтобы понять,
как можно ему помочь, особенно в так называемых критических состояниях: при
реанимации, операциях на сердце и тех или иных его заболеваниях.
В настоящее время существуют модели сердца, отражающие лишь отдельные
стороны его очень сложного функционирования. Я вам расскажу об очень про-
стой модели, где отражено только то, что им управляет нервная система и неко-
торые поступающие в него химические вещества, и то, что оно живет только
6. Энергетическая модель сердца 43

потому, что, работая, себя питает. В соответствии с этим будем описывать его
только двумя переменными: командой управления и, которую сердце беспреко-
словно выполняет, и его текущим энергетическим запасом Q, который расходует-
ся для выполнения работы и пополняется протекающей через него кровью. Энер-
гетический запас сердца Q расходуется и тогда, когда сердце не работает. Он рас-
ходуется для поддержания жизнедеятельности его тканей. В соответствии с этим
можно записать дифференциальное уравнение
dQ
= − a − f (u, Q ) + g (u, Q ), (6.1)
dt
где a – интенсивность расходования Q на поддержание жизненного состояния не-
работающего сердца, f (u, Q) – интенсивность расхода энергетического запаса на
совершение работы по перекачке крови и g(u, Q) – интенсивность пополнения за-
паса Q за счет поступающей в cердце крови. Величины и и Q могут меняться в
каких-то пределах 0 ≤ u ≤ umax , 0 ≤ Q ≤ Qmax (рис. 6.1).
u
umax

Рис. 6.1. Геометрическая интерпретация Г


энергетической модели сердца, описывае-
мой дифференциальным уравнением (6.1),
на плоскости переменных запаса энергии
G
сердца Q и управления u

Qкр Qmax Q

Для того чтобы написанная модель приобрела конкретность, нужно знание


функций f (u, Q) и g(u, Q), хотя бы качественное. Ясно, что как при u = 0, так и при
Q = 0 эти функции обращаются в нуль, т.е.
f (0, Q ) = f (u, 0) = g(0, Q) = g (u, 0) = 0.
Далее f (u,Q) – неубывающая функция обоих аргументов.
Так как Q не может быть больше Qmax , то при Q = Qmax
dQ
≤0
dt
и поэтому
– a – f (u, Qmax) + g(u, Qmax) ≤ 0.
Естественно предположить, что при u = umax , т.е. максимальном требовании к
работе сердца, оно быстро истощается и при этом dQ/dt < 0. Таким образом, на
сторонах Q = 0, u = 0 и u = umax прямоугольника рис. 6.1 правая часть дифферен-
циального уравнения (6.1) отрицательна. На четвертой стороне Q = Qmax она не
положительна. Вместе с тем мы длительно живем, и поэтому внутри квадрата
рис. 6.1 должна быть область, где правая часть уравнения (6.1) положительна. Это
приводит к картинке рис. 6.1, где стрелками указаны направления перемещения
44 Ю.И. Неймарк. Математическое моделирование как наука и искусство

точки М(и, Q) при фиксированном и. Конечно, сколько-нибудь точный вид грани-


цы области, где внутренний запас Q энергии сердца растет, остался неизвестным,
но для наших целей он и не нужен. Мы будем основывать дальнейшие выводы
только на общих представлениях о виде области G, в которой Q возрастает вплоть
до ее границы. Вне области G точка М(и, Q ) при своем движении при фиксиро-
ванной команде управления и либо приходит на отрезок, где Q = 0, либо приходит
на часть Г границы области G.
Наблюдая возможные движения точки М(и, Q) при изменениях и, можно за-
метить, что до тех пор пока точка М(и, Q) не оказалась левее прямой Q = Qкр , она
может побывать в любом месте и быть приведена к любому месту с Q > Qкр . На-
против, при Q < Qкр ее судьба предопределена и независимо от изменения и точка
М(и, Q) приходит на границу Q = 0, это приводит к гибели сердца. К неотврати-
мой, если не будут приняты соответствующие реанимационные меры. Отсюда яс-
но, что пребывание вне области G в той ее части, где точка М(и, Q) приходит к от-
резку, на котором Q = 0, допустимо только до тех пор, пока точка М(и, Q) лежит
правее прямой Q = Qкр . Причем меры, с помощью которых можно предотвратить
это, могущее стать роковым, движение точки M(u, Q), различны для случаев, ко-
гда точка М(и, Q) лежит выше области G и когда – ниже нее. В первом случае не-
обходимо вовремя прекратить дальнейшее требование высокой нагрузки на рабо-
ту сердца, т.е. нужно уменьшить и. Во втором случае, напротив, необходимо сти-
мулировать работу сердца и увеличить команду и. Нетрудно видеть, что первый
случай отвечает длительным нагрузкам, которые следует прекратить, а второй –
недостаточной работе сердца, недостаточной ее стимуляции и требует увеличения
команды, в том числе с помощью возбуждающих медикаментозных средств.
Таким образом, с точки зрения этой модели, возможны два кардинально раз-
ных кризисных состояния сердечной деятельности: одно – называемое длитель-
ной нагрузкой, другое – длительным чрезмерным ослаблением его деятельности.
Заметим, что длительная интенсивная работа сердца может быть вызвана не толь-
ко реальной физической нагрузкой, но и стрессовым состоянием и перевозбужде-
нием нервной системы.
Теперь посмотрим, как меняется область G при сужении сосудов, питающих
сердце, при уменьшении его коэффициента полезного действия, вызываемого, в
частности, детренировкой, интоксикацией или общим истощением организма.
В первом случае уменьшается величина функции питания g(u, Q), во втором –
увеличивается значение функции f (u, Q).
Оба случая имеют один и тот же эффект – уменьшение размеров области G,
что влечет сужение жизненных возможностей организма. В частности, при этом
увеличивается Qкр , уменьшаются нагрузочные возможности и одновременно воз-
можности сердцу «отдохнуть». Как это ни парадоксально, но сердце вынуждено
работать интенсивнее и в суженных пределах изменения нагрузки. Оно лишено
отдыха и имеет очень малый запас мощности и суженный резерв. Некоторого
улучшения этой ситуации можно добиться путем искусственного лекарственного
расширения коронарных сосудов и, возможно, еще умеренной тренировкой, при-
званной увеличивать коэффициент полезного действия сердечной мышцы и серд-
ца в целом.
6. Энергетическая модель сердца 45

Таковы выводы, которые можно сделать из принятой примитивной энергети-


ческой модели сердца. В модели учтено лишь то, что интенсивность работы серд-
ца подчиняется управлению и и что оно поддерживает свою жизнь, все время ра-
ботая. Можно заметить, что эти же особенности есть и у каждого живого сущест-
ва, предоставленного самому себе в окружении безжалостной природы: оно
должно все время убегать от врагов, искать и добывать себе пищу, и интенсив-
ность этого поиска и убегания диктуется им самим и обстоятельствами. Разница
между бедным животным и нашим сердцем только в жесткости внешних требова-
ний, которые человек сумел в большей или меньшей мере смягчить. Пожалуй, в
некоторой мере эта модель относится и к сообществу животных и человека.
46 Ю.И. Неймарк. Математическое моделирование как наука и искусство

7. ЗАСОЛЕНИЕ ВОДОЕМА С ЗАЛИВОМ


И ЗАГАДКИ КАСПИЙСКОГО МОРЯ
Следующая математическая модель, которую мы рассмотрим, это засоление
или растворимое загрязнение водоема стекающими в него водами. Помимо эколо-
гического аспекта, эта модель имеет отношение к загадке существенно разных
соленостей Черного и Каспийского морей, имеющих общее происхождение. Если
говорить о засолении замкнутого ограниченного водоема, то ясно, что по мере
стекания в него вод, несущих растворимые вещества, он будет все более и более
засоляться до тех пор, пока не наступит насыщение и выпадение осадка.
Пусть Q – интенсивность втекающего потока, а ν – концентрация загрязняю-
щих веществ. Далее, пусть υ – объем водоема, I – интенсивность испарения с его
поверхности. Интенсивность испарения зависит от многих факторов: влажности
воздуха, его температуры, ветра. Но ее среднее значение определяется в основном
размером испаряющей поверхности, которая определяется объемом υ. Аналогич-
но интенсивность втекающего потока Q меняется и зависит от очень многих при-
чин, но среднее значение Q достаточно постоянно.
Запишем уравнение баланса притекающей и испаряющейся воды

= Q − I (υ)
dt
и уравнение накопления в водоеме общего количества загрязнений
dM
=νQ ,
dt
где M − масса растворимого загрязнения в водоеме.
Так как I(υ) – возрастающая функция υ, то из первого уравнения следует ус-
тановление устойчивого равновесного уровня υ*, определяемого из уравнения
Q − I ( υ) = 0,
что поясняется графиком рис. 7.1.
I(υ)
Q Рис. 7.1. Фазовый портрет динамики уровня
воды в водоеме с испарением, зависящим
от количества воды в нем

υ*
Из второго уравнения следует, что масса загрязнения неуклонно растет. Сна-
чала это влечет за собой увеличение концентрации загрязнения, равной M/υ, а за-
тем, с наступлением насыщения, ее рост прекращается и начинается образование
донных отложений.
Как видно, в рамках этой модели причина различия в солености Черного и
Каспийского морей установлена быть не может. Необходимо учесть еще какие-то
7. Засоление водоема с заливом и загадки Каспийского моря 47

обстоятельства. Но что именно? Черное море не совсем замкнутое, оно соединено


узким проливом со Средиземным морем. Но через Босфор вода в основном выте-
кает, так обстоит дело сейчас, а ранее оно было замкнутым. Каспийское море все
время изолировано от океана и, несмотря на это, его соленость много меньше, чем
Черного моря.
В чем же может быть существенное различие? Это различие не бросается в
глаза. Оно – в наличии у Каспийского моря залива Кара-Богаз-Гол. На первый
взгляд кажется, что это не может играть роли, ведь все равно Каспий остается
замкнутым водоемом, но это не так. Не так, потому что между водами Кара-Богаз-
Гола и Каспия нет перемешивания, вода из Каспия все время течет в залив. Про-
лив, их соединяющий, узкий и длинный, а снижение уровня воды в нем около 4,5
метров. Учтем все это и составим более полную математическую модель.
Пусть υ и υ1 – объемы воды в водоеме и заливе; Q и ν – имеют прежний
смысл; I и I1 – интенсивности испарения в водоеме и заливе; q – интенсивность
перетекания воды из водоема в залив (рис. 7.2). В этих обозначениях непосредст-
венно имеем:

= Q − I − q,
dt
(7.1)
dυ1
= q − I1.
dt
Кроме того,
dM
= νQ − µq,
dt
(7.2)
dM 1
=µ q,
dt
где М и M1 – общие массы растворимого загрязнения в водоеме и заливе, а µ –
концентрация загрязнения в водоеме. Считая, что загрязнение в водоеме не дости-
гает насыщенности, имеем µ = M/υ. Напротив, насыщение в заливе имеет место
уже давно и в нем образовались гигантские донные отложения солей натрия, маг-
ния и других.
I
Q, ν
I1
Рис. 7.2. Схематическое изображение q
Каспийского моря с заливом υ, µ υ1, µ1
Кара-Богаз-Гол

Полученная система дифференциальных уравнений (7.1) и (7.2) описывает


водный баланс и баланс растворимого загрязнения. Первые два уравнения водно-
го баланса не зависимы от оставшихся двух, так что их можно рассматривать са-
ми по себе. Однако это рассмотрение осложнено тем, что I и I1 зависят от υ и υ1
соответственно, а q – функция υ и υ1 , причем выписать конкретный вид этих за-
висимостей весьма затруднительно. Вместе с тем представляется очевидным на-
48 Ю.И. Неймарк. Математическое моделирование как наука и искусство

личие у них устойчивого равновесного режима υ*, υ1*. Для того чтобы в этом убе-
диться, надлежит установить наличие решения у системы нелинейных уравнений
I(υ)+q(υ, υ1) = Q,
(7.3)
I1(υ1) – q(υ, υ1) = 0
и обнаружить устойчивость отвечающего ему равновесия (υ*,υ1*). Этим займемся
позднее, а сейчас, предполагая наличие такого устойчивого равновесия, перейдем
к анализу дифференциальных уравнений (7.2) математической модели водоема с
заливом. Последнее уравнение уже хорошо известно и не несет ничего нового.
Масса примесей в заливе растет со временем, это влечет за собой рост концентра-
ции примесей, который прекращается с достижением насыщения и образованием
осадка.
Первое дифференциальное уравнение, напротив, говорит о коренном измене-
нии ситуации и подмене неограниченного роста количества загрязняющего веще-
ства равновесной концентрацией µ*, находимой из условия обращения правой
части рассматриваемого дифференциального уравнения в нуль:
µq(υ, υ1) – νQ = 0.
Учитывая, что υ → υ*, υ1 → υ1*, находим равновесную концентрацию
νQ
µ∗ = .
q(υ∗ , υ1∗ )
Следует отметить, что процесс установления водного равновесия значительно
более быстрый, чем установление равновесной концентрации, и поэтому общий
процесс установления можно разбить на два этапа: относительно быстрое уста-
новление равновесных объемов υ*, υ1* и сравнительно медленное установление
равновесной концентрации µ*. После установления равновесных объемов υ*, υ1*
процесс установления равновесной концентрации подчиняется, согласно (7.2),
дифференциальному уравнению

υ∗ = νQ − q (υ∗ ,υ1∗ ) µ ,
dt
решение которого легко находится и при нулевом начальном условии запишется в
виде:
νQ   q(υ∗ ,υ1∗ )   ∗   q(υ∗ ,υ1∗ ) 
µ= 1 − exp −  t  =µ  1 − exp− t  . (7.4)
q(υ∗ ,υ1∗ )   υ∗    υ∗
   
Заметим, что концентрация µ, как следует из формулы (7.4), составляет 1 – е–1
часть равновесной µ* спустя время υ*/q*, равное времени, в течение которого в
равновесном режиме объем υ* перетекает из Каспийского моря в залив Кара-
Богаз-Гол. При удвоении этого времени µ уже равно (1 – е–2)µ*, так что в качестве
оценки времени установления равновесной концентрации µ* можно принять вре-
мя τ = υ*/q*.
Вернемся к равновесной концентрации µ*. Она равна
7. Засоление водоема с заливом и загадки Каспийского моря 49

νQ
µ∗ =
q(υ∗ ,υ1∗ )
и, казалось бы, требует знания v, Q и q. Однако, пользуясь уравнениями (7.3), оп-
ределяющими υ* и υ1* , легко находим, что
νQ q∗ + I ∗  I∗   I∗ 
µ∗ = = ν = ν  1 +
 q∗ 
 = ν 1 + ∗  ,
 I  (7.5)
q (υ∗ ,υ1∗ ) q∗    1 

где звездочки обозначают, что соответствующие величины взяты при равновес-


ных значениях υ = υ* и υ1 = υ1*.
Отношение I*/I1* , входящее в (7.5), грубо приближенно равно отношению
площадей водных поверхностей водоема и залива, т.е. S/S1. Эта величина для Кас-
пийского моря и Кара-Богаз-Гола равна примерно 37, и поэтому равновесная кон-
центрация в заливе примерно только в 40 раз больше средней концентрации солей
в потоках пресной воды, поступающей в Каспийское море, благодаря втекающим
рекам и дождям.
Таким образом, залив Кара-Богаз-Гол играет для Каспийского моря роль от-
стойника, отсасывающего растворимые загрязнения. Эту же роль в заселяемых
стоками воды водоемах могут сыграть искусственные заливы. При этом необхо-
димо обеспечить наличие неисчезающего перепада уровня воды от водоема к за-
ливу, так как обратный поток из залива в водоем все испортит.
Поэтому меньшую, чем у Черного моря, соленость Каспийского моря можно
объяснить наличием залива Кара-Богаз-Гол. Но на самом деле наше предположе-
ние о равновесности объемов υ* и υ1* не совсем соблюдается. Уровень Каспийско-
го моря меняется причудливым образом: то колеблется возле одной величины, то
возле другой, и различие этих уровней значительно больше колебаний воды возле
каждого из них.
Эти изменения не удается объяснить ни изменениями погоды, ни тектониче-
скими изменениями ложа Каспийского моря. Так что это еще одна загадка Кас-
пийского моря.
Относительно небольшие колебания уровня Каспийского моря не нарушают
данного выше объяснения малой его солености и формулу (7.5), но они значи-
тельны для эксплуатации Каспийского моря и интересны сами по себе. Для того
чтобы перейти к разгадке этого удивительного явления, рассмотрим, казалось бы,
очевидное предположение о наличии устойчивых равновесных объемов υ* и υ1*
вод моря и залива и зададим вопрос: единственно ли равновесие и нет ли автоко-
лебаний?
Вернемся к уравнениям (7.1) водного баланса в Каспийском море и заливе.
Фазовым пространством этой системы дифференциальных уравнений является
первый октант плоскости υ, υ1, для которого υ ≥ 0 и υ1 ≥ 0. Прежде всего устано-
вим, что все фазовые траектории приходят в конечную его часть вида:
υ + υ1 = C > 0.
Это следует из того, что при достаточно больших υ и υ1 (большом C)
d
( υ+ υ1 ) = Q − I ( υ) − I1 ( υ1 ) < 0.
dt
50 Ю.И. Неймарк. Математическое моделирование как наука и искусство

На рис. 7.3, изображающем поперечное сечение Каспия, залива и соединяю-


щего их протока, виден наиболее высокий уровень соединяющего их протока.

Рис. 7.3. Профиль дна водоема, залива


Каспий и соединяющего их узкого пролива
Кара-Богаз-Гол

Из рисунка видно, что фазовое пространство, первый октант υ > 0, υ1 > 0


плоскости υ, υ1, разбивается на части, когда q = 0, q > 0 и q < 0. Ясно, что q = 0,
когда в Каспии и заливе уровень ниже указанного на рис. 7.3. И пусть это имеет
место при υ < υ и υ1 < υ1, q = 0. Это имеет место еще и тогда, когда уровни Кас-
пия и залива равны, но υ > υ и υ1 > υ1. Множество точек фазовой плоскости, отве-
чающее q = 0, состоит из прямоугольника υ ≤ υ и υ1 ≤ υ1 и некоторой кривой γ,
изображенных на рис. 7.4.
υ1
γ
Рис. 7.4. Графическая иллюстрация к поиску
υ1 области, в которую приходят все траектории
q=0 фазового пространства υ ≥ 0, υ1 ≥ 0

υ υ
На этом же рис. 7.4 изображена прямая υ + υ1 = C, пересекаемая фазовыми
траекториями снаружи внутрь, что показано стрелками. Эта прямая вместе с ося-
ми υ = 0 и υ1 = 0 ограничивает область, в которую входят все фазовые траектории,
т.е. спустя достаточное время любая фазовая точка (υ, υ1) находится в ней.
После этих предварительных соображений перейдем к выяснению устано-
вившихся движений системы (7.1). Ясно, что они зависят от величины притока Q,
функций I(υ ), I(υ1) и функции q(υ, υ1).
При Q < I(υ) все фазовые траектории входят в четырехугольник, в котором
q = 0, и далее приближаются к состоянию равновесия υ = υ* < υ и υ1 = 0, где υ* –
корень уравнения
Q – I(υ) = 0,
единственный, если I'(υ) > 0. Так как при составлении второго уравнения (7.1) мы
учли приток q воды только из Каспия, то получается, что залив высыхает. Отме-
тим, что именно это произошло после временного перекрытия плотиной протока
из Каспия в залив.
При Q > I(υ ) все фазовые траектории входят в треугольник, ограничиваемый
прямыми υ = υ1, υ1 = 0 и υ + υ1 = С, и поэтому в нем есть состояния равновесия. В
одной части этого треугольника q > 0 , в другой − q < 0. Их разделяет кривая γ, на
которой q = 0. Выше кривой и на ней q ≤ 0 и υ& 1 < 0, так что все фазовые траекто-
рии, начинающиеся в криволинейном треугольнике, ограничиваемом прямыми
υ = υ, υ + υ1 = С и кривой γ, выходят из него и, следовательно, в нем не может
быть равновесия.
7. Засоление водоема с заливом и загадки Каспийского моря 51

Теперь покажем, что это равновесие единственно и устойчиво. Далее мы по-


кажем, что замкнутых фазовых траекторий нет, и поэтому это единственное рав-
новесие глобально устойчиво. Конечно, это основывается на определенных свой-
ствах функций I(υ), I(υ1) и q(υ, υ1).
Мы примем, помимо Q > I(υ), что
dI ( υ) dI1 ( υ1 ) ∂q ∂q
> 0, > 0, > 0, ≤ 0. (7.6)
dυ dυ1 ∂υ ∂υ1
Преобразуем (7.3) к виду:
I(υ) + I1(υ1) = Q,
(7.7)
I(υ) + q(υ, υ1) = Q.
Дифференцируя первое уравнение (7.7) по υ, получим
dI dI1 dυ1
+ = 0,
dυ dυ1 dυ
и поэтому, в силу (7.6), dυ1 dυ < 0 .
Аналогично из второго уравнения (7.7) следует
dI ∂ q ∂ q dυ1
+ + = 0,
dυ ∂υ ∂υ1 dυ
и тогда dυ1 dυ > 0 , причем может обращаться в бесконечность.
Первое соотношение (7.7) определяет υ1 как убывающую функцию υ; второе
соотношение (7.7) – как возрастающую функцию, могущую иметь вертикальные
отрезки или вообще быть вертикальной прямой. Пересечение этих кривых един-
ственно и определяет единственное равновесие υ*, υ1*.
Таким образом, при естественных предположениях равновесие существует и
пусть имеет место при υ = υ* и υ1 = υ1* .
Покажем, что оно устойчиво. Для этого пусть ξ и η – малые отклонения от
равновесия, так что υ = υ* + ξ , υ1 = υ1* + η.
Отклонения ξ и η удовлетворяют дифференциальным уравнениям
d (υ∗ + ξ)
= Q − I (υ∗ + ξ) − q (υ∗ + ξ, υ1∗ + η ),
dt
d (υ1∗ + η )
= q (υ∗ + ξ, υ1∗ + η ) − I1 (υ1∗ + η )
dt
или после линеаризации
 ∂q dI  ∂q
ξ& =  − −  ξ− η,
 ∂υ dυ  ∂υ1
∂q  ∂q dI1 
η& = ξ +  −  η ,
∂υ ∂
 1υ d υ1
3

где производные вычисляются при υ = υ*, υ1 = υ1*.


52 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Устойчивость или неустойчивость определяется корнями характеристическо-


го уравнения, которое в рассматриваемом случае второй степени, вида
λ2 + Aλ + B = 0.
Устойчивость имеет место, если корни этого уравнения лежат слева от мни-
мой оси. Для этого необходимо и достаточно, чтобы
A > 0, B > 0.
Вычисляя коэффициенты A и B непосредственно, в силу отмеченных выше
неравенств, находим, что
∂ q dI ∂q dI1
A= + − + > 0,
∂υ dυ ∂υ1 dυ1
∂I ∂ q ∂q ∂I1 ∂I ∂I1
B=− + + > 0.
∂υ ∂υ1 ∂υ ∂υ1 ∂υ ∂υ1
Таким образом, состояние равновесия имеется, оно устойчивое и единствен-
ное.
Интуитивно ясно, что это исследование было излишним, а с другой стороны,
из него еще нельзя заключить, что кроме устойчивого равновесия нет других ус-
тановившихся движений, которыми могут быть только устойчивые периодиче-
ские движения. Но их все же нет, как это следует из широко известного критерия
Бендиксона, согласно которому справедливость неравенства
∂P ∂Q
+ >0
∂υ ∂υ1
или обратного, где Р и Q – правые части дифференциальных уравнений (7.1), дос-
таточно для отсутствия предельных циклов в области, где это неравенство выпол-
няется. В рассматриваемом случае, в силу сделанных предположений,
∂P ∂Q dI ∂q ∂q dI1
+ =− − + − < 0,
∂υ ∂υ1 dυ ∂υ ∂υ1 dυ1
поэтому состояние равновесия (υ*,υ1*) является глобально устойчивым и к нему
сходятся все движения, т.е. при любых начальных условиях υ(t) → υ*, υ1(t) → υ1*
при t → ∞.
Итак, при естественных предположениях не только интуитивно кажется, но и
доказано, что равновесие одно и оно глобально устойчиво. Откуда же наблюда-
ются переходы равновесного уровня Каспия от одного уровня к другому? Это
действительно загадка. Ведь сделанные предположения так естественны. Но по-
даться некуда, и надлежит думать, какое же предположение все же неверно.
Напомним, что сделанные предположения – это Q > I(υ) и неравенства (7.6).
Конечно, загадка была бы полностью устранена, если бы усредненный по не-
скольким годам водный приток значительно менялся или менялось ложе Каспий-
ского моря и почему-то все время одинаково. Но этого не наблюдалось. Что же
может быть еще не так? Посмотрим на принятые неравенства (7.6), пожалуй, са-
мое слабое место – это dI/dυ > 0. Действительно, можно придумать, когда это мо-
жет быть не так. Пусть дно Каспия имеет вид, показанный на рис. 7.5.
7. Засоление водоема с заливом и загадки Каспийского моря 53

4
2 3
Рис. 7.5. Гипотетический профиль дна 1
Каспийского моря и различные
возможные в нем уровни: 1, 2, 3 и 4

Горб в центре рисунка – это возможные мели. Теперь посмотрим, как ме-
няется интенсивность испарения при жаркой погоде при переходе от нижнего
уровня, обозначенного на рис. 7.5 цифрой 1, к верхнему уровню 4.
При переходе от 1 к 2 происходит сильное возрастание испарения. При пере-
ходе от 2 к 3, несмотря на общее увеличение площади моря, испарение может
уменьшаться, так как вода над мелью стала более глубокой и значительно холод-
нее, а следовательно, и менее испаряющей. При дальнейшем переходе от 3 к 4
снова происходит увеличение испарения. Таким образом, наличие мелей может
привести к тому, что график I(υ) примет вид, показанный на рис. 7.6.

I Imax
Рис. 7.6. Фазовый портрет изменения
объема вод Каспийского моря при
значении притока Q, когда пересечение
происходит в трех точках, которым Q−q
отвечают два устойчивых равновесия Imin
O1 и O3 и одно неустойчивое O2 O1 O2 O3 υ
И теперь равновесий может быть три, как это видно из того же рисунка. Пре-
небрегая ради простоты величиной q << Q, рассмотрим, что происходит с этими
равновесиями при временных изменениях Q, иногда выходящих за рамки Imax и
Imin , указанных на рис. 7.6.
Теперь фазовое пространство – это полупрямая υ ≥ 0, а фазовый портрет оп-
ределяется уравнением

= Q − I (υ) .
dt
Точки пересечения графика I(υ) и прямой Q на рис.(7.6) определяют равнове-
сия, а стрелки – величину и знак разности Q – I(υ), т.е. dυ/dt. В случае, показан-
ном на рис. 7.6, состояний равновесия три: O1, O2 и O3, причем O1 и O3 – устойчи-
вые, а O2 – неустойчивое.
Теперь мы можем нарисовать графики зависимости O1, O2 и O3 от Q. Коорди-
наты состояний равновесия O1, O2 и O3 обозначим соответственно u1*, u2* и u3* и
придем к зависимостям u1*, u2* и u3* от Q, изображенным на рис. 7.7.
υ u3
*

Рис. 7.7. Бифуркационная диаграмма *


равновесных уровней объемов воды
u2
в Каспийском море (кружочки –
устойчивые равновесия, крестики –
неустойчивые) *
u1
Imin Imax Q
54 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Кружочкам на этом графике, называемом бифуркационной диаграммой, со-


ответствуют устойчивые равновесия, а крестикам – неустойчивые. При Imin < I <
< Imax имеется два устойчивых равновесия u1* и u3*. При убывании Q сверх Imin оба
они переходят в u1* , причем равновесие u3* – скачком. При последующем возрас-
тании Q u1* меняется также скачком на u3* при возрастании Q сверх Imax.
При последующем убывании Q равновесие u3* сохраняется, перескакивая на
*
u1 при уменьшении Q сверх Imin.
Сказанное может объяснить имеющие место на Каспийском море изменения
его уровня. Эти изменения происходят скачками с низкого уровня на высокий,
когда Q при своем текущем изменении превосходит Imax. И наоборот, высокий
уровень моря снижается скачком на низкий при снижении Q ниже Imin . Здесь идет
речь о скачкообразном изменении устойчивых равновесий с изменением притока
Q. Уровень же Каспийского моря меняется вовсе не скачком, а достаточно мед-
ленно в соответствии со скоростью перехода к новому состоянию равновесия,
причем разные уровни u3* и u1* имеют место при одинаковом притоке Q, а их смена
происходит сравнительно редко, через несколько десятилетий, когда Q > Imax и,
соответственно, Q < Imin .
8. Экспоненциальные процессы 55

8. ЭКСПОНЕНЦИАЛЬНЫЕ ПРОЦЕССЫ
От рассказа об отдельных математических моделях перейдем к описанию
достаточно широкого класса динамических процессов, так называемых экспонен-
циальных процессов, и некоторых других (логистических, взрывных).
Экспоненциальные процессы могут быть двух видов: экспоненциального воз-
растания и экспоненциального убывания. Они оба описываются очень простым
дифференциальным уравнением
dx
= λx. (8.1)
dt
При λ > 0 – это экспоненциально возрастающий процесс, при λ < 0 – экспоненци-
ально убывающий. Экспоненциальное возрастание или убывание может быть как
по времени t, так и по какой-либо другой, отличной от времени физической пере-
менной.
Решение дифференциального уравнения (8.1), обращающееся в x0 при t = 0,
имеет вид:
x = x0 eλt (8.2)
и обладает следующим замечательным характеристическим свойством: спустя
промежуток времени τ =| λ |−1 ln 2 от любого начального момента t,
x(t + τ)
=2 , (8.3)
x(t )
если λ > 0 и процесс возрастающий, и
x(t + τ) 1
= , (8.4)
x(t ) 2
если λ < 0 и процесс убывающий. Это говорит о том, что арифметической про-
грессии возрастающих значений t + nτ (n = 0, 1, 2, …) соответствует геометриче-
ская прогрессия со знаменателем 2 или 1/2. Ha рис. 8.1 представлены эти свойства
возрастающего и убывающего экспоненциальных процессов.
x x
x0

16x0
x0 8x0 1/2x0
1/4x0
ln2/|λ| t ln2/|λ| t

а) б)
Рис. 8.1. Графическая иллюстрация экспоненциального возрастания (а)
и убывания (б) и времени удвоения и уменьшения вдвое
Основное, что поражает в экспоненциальных процессах, это их фантастиче-
ски быстрое, не вполне осмысливаемое нами, все убыстряющееся возрастание
56 Ю.И. Неймарк. Математическое моделирование как наука и искусство

или, наоборот, замедляющееся убывание. Хорошим примером может служить


притча о царе и изобретателе шахмат, которого царь пожелал вознаградить и ска-
зал: «Проси у меня, что хочешь, хоть полцарства, хоть царскую дочь». Но изобре-
татель шахмат оказался очень скромным человеком. Он сказал: «Не надо мне ни-
чего, дай мне самую малость. На первую клетку шахматной доски положи пше-
ничное зернышко, на второю – два, на третью – четыре и т.д.». Царь сказал: «Что
за пустяк ты просишь, но пусть будет по-твоему». Когда дошли, до середины дос-
ки, то закрома царя уже были пусты. А чтобы заполнить все 64 клетки шахматной
доски, требуется зерна много больше, чем на всем земном шаре.
Столь же фантастически ускоряясь, происходит беспрепятственное размно-
жение клеток, микробов и вирусов. Клетки и микробы делятся каждые час-два, и
поэтому через 3–6 суток их число того же порядка, что и число пшеничных зерен
на всех клетках шахматной доски. У вирусов время удвоения много меньше часа,
так что за время, меньшее суток, возможна катастрофа, если им не мешать раз-
множаться. Так же, все ускоряясь, истощая ресурс, протекают цепные ядерные и
химические реакции, лавинообразующие и лавинообразные процессы. В них вре-
мя удвоения может измеряться тысячными долями секунды, так что процесс мо-
жет носить взрывной характер, достигая фантастических размеров за ничтожные
доли секунды.
Аналогичны примеры распространения эпидемий и слухов. Они тоже носят в
своей начальной стадии экспоненциальный характер. Ярким примером плохой
нашей ориентировки в скорости роста экспоненциального процесса является не-
обдуманный ответ на вопрос: «Сколько рукопожатий жителя маленького городка
нашей страны связывает с президентом США?». Обычно отвечают, что достаточ-
но много, в то время как на самом деле – заведомо меньше десяти. Быстро оце-
нить это можно, если учесть, что каждый человек, как правило, здоровается за
свою жизнь не менее, чем со 100 людьми. Поэтому в цепочке из 5 человек, если
не учитывать повторных рукопожатий, насчитывается 1010 человек, больше чем
их на земном шаре. Это, в частности, указывает на стремительность распростра-
нения эпидемий с коротким продромальным периодом и еще большую стреми-
тельность распространения слухов.
Во всех приведенных примерах скорость нарастания некоторой величины тем
больше, чем больше сама эта величина. До тех пор, пока не истощается материал,
из которого создается эта величина, и не нарушаются условия ее роста, такой
процесс носит нарастающий экспоненциальный характер и подчиняется диффе-
ренциальному уравнению
dN
= λN ,
dt
где N:– число размножившихся клеток или вирусов, число заболевших людей во
время эпидемии, число размножающихся нейтронов или молекул при цепной
ядерной или химической реакциях, число людей, до которых дошел слух о сенса-
ционном событии или новости, число жителей страны или всей нашей планеты и
т.д. В какой-то мере такая же закономерность относится к приобретению знаний,
изучению языков, поскольку уже приобретенные знания облегчают и ускоряют их
дальнейшее постижение. Это относится как к накоплению знаний отдельным че-
8. Экспоненциальные процессы 57

ловеком, так и всем человечеством. Это относится к развитию науки, производст-


ва, нарастанию экологического загрязнения и разрушения.
Быстрота нарастания экспоненциального процесса приводит к явлениям вне-
запного возникновения кризиса и исчезновения, «схлопывания» ресурсов. Пред-
ставьте себе, что вы летом устроились в палатках на берегу чудесного озера, в ко-
тором предполагали купаться и плавать. Пусть это озеро имеет площадь 16384 м2.
Большое, хорошее озеро метров 200 длиной и метров 100 шириной. В день вашего
приезда в укромном уголке озера были зеленые водоросли, занимающие площадь
в 1 м2. Вы их и не приметили. Пусть время их удвоения при размножении равно
одним суткам. В течение 13 дней они вам особенно не мешали, хотя в последние
3–4 дня вы уже их заметили. Но вот наступил 14 день, и все озеро заросло зеле-
ными водорослями и купаться и поплавать уже негде. Катастрофа произошла за
одну ночь, еще вчера ничто не предвещало беды и половина озера была без водо-
рослей. Это 8192 м2, более чем достаточно. Чистая вода озера «схлопнулась» за
сутки, а 13 дней до этого все было очень хорошо и не предвещало никаких непри-
ятностей.
Экспоненциальный рост знаний, науки, промышленности, богатства приво-
дит еще к одной связанной с ними особенности. В качестве примера возьмем ин-
дивидуальное накопление знаний, знания языков в частности. Для каждого чело-
века в период его активной жизни и при наличии благоприятствующих обстоя-
тельств накопление знаний носит экспоненциально нарастающий характер, по-
скольку приобретение новых знаний облегчается имеющимися, т.е. грубо при-
ближенно

= λЗ.
dt
В силу этого, приобретение знаний носит пороговый характер, т.е. как только
они достигают некоторого порога З*, их дальнейшее накопление приобретает не-
обычайно быстрый характер и человек за свою короткую жизнь может достичь
гигантских высот. Но для этого он должен в своих знаниях превзойти некоторый
трудно достижимый порог. Это удается немногим. Но кто этого достиг, далее
устремляется к вершинам. Это приводит к тому, что среди всех людей резко вы-
деляется по объему и качеству познаний лишь весьма ограниченное число, ни-
чтожные доли процента, и между ними и остальными имеет место колоссальный
разрыв. В этом можно видеть объяснение явления исключительности.
Следующий пример – пример внезапного кризиса – возможно, уже из вашего
опыта. Вы заразились неделю тому назад. Шесть дней длился ничем не обнару-
живающий себя, так называемый, продромальный период заболевания. На седь-
мой день – озноб, высокая температура, плохое или даже тяжелое состояние. Ко-
нечно, микробы или вирусы размножаются в вашем организме не беспрепятст-
венно. Им противостоит мощная иммунная система, но, возможно, еще не моби-
лизованная и недостаточная, чтобы подавить инфекцию. Для этого организму
нужно время. В силу этого, экспоненциальная катастрофа в значительной мере
смазана, но все же она проявляется, и чем расслабленней и неподготовленней им-
мунная система, чем позже ее реакция, тем четче и быстрее растет численность
58 Ю.И. Неймарк. Математическое моделирование как наука и искусство

возбудителей болезни и интоксикация достигает критических значений, и после


первых слабых признаков заболевания наступает состояние, угрожающее жизни.
Об экспоненциальном росте населения земли впервые сказал Мальтус в кон-
це XVIII века. У него был предшественник в XVII веке – известный математик
Фибоначчи. Он поставил и разрешил вопрос: «Сколько пар кроликов в год от од-
ной пары рождается».
Экспоненциальное размножение предполагает отсутствие всяких ограниче-
ний. На самом деле они всегда есть (например, ограничение ресурса), и простей-
ший их учет состоит во введении отрицательного квадратичного члена, так что
соответствующее дифференциальное уравнение
dx
= λ x − εx 2 (8.5)
dt
имеет решение вида, так называемой, логистической кривой, изображенной на
рис. 8.2. При этом первоначальное возрастание, близкое к экспоненциальному,
замедляется и ограничено предельно достижимой величиной x∞ = λ/ε (см рис. 8.2).
x
λ/ε

Рис. 8.2. График логистической


зависимости (кривой)

t
Многие процессы, экспоненциальные на начальном участке, затем испыты-
вают замедление и близки к логистической кривой. Таковы рост народонаселения,
рост численности животных, развитие промышленности, науки, образования и
многое другое.
Возможны процессы нарастающие быстрее, чем экспоненциальные. Таково,
например, размножение насекомых, где численность потомства определяется час-
тотой встреч, которая на ограниченном участке пропорциональна квадрату числа
его населенности, т.е.
dN
= aN 2 . (8.6)
dt
Решение этого уравнения
1
N = −1 (8.7)
N 0 − at
при начальном условии
N t =0 = N 0
неограниченно возрастает при приближении t к конечному значению 1/a N0 , что
соответствует взрывному росту численности, хорошо известному, например, у
саранчи.
Экспоненциальный характер нарастания, во всяком случае на начальном уча-
стке, характерен для неравновесных уходов от неустойчивых состояний равнове-
сия. Так, пусть система описывается дифференциальным уравнением
8. Экспоненциальные процессы 59

x& = f (x ) , (8.8)
*
х = х – ее неустойчивое состояние равновесия. На рис. 8.3 показана горка, вер-
шинная точка которой отвечает неустойчивому равновесию. Скатываясь с нее,
точка все быстрее и быстрее набирает скорость.
Введем новую переменную ξ, положив
x = x* + ξ ,
и подставим ее в уравнение (8.8), найдем, что
ξ& = f ( x ∗ + ξ) = f ( x ∗ ) + f ′( x ∗ )ξ + ... ( f ( x ∗ ) = 0),
где многоточия означают члены второго и выше порядков малости относительно
ξ. На начальном участке ухода от неустойчивого равновесия, когда ξ еще мало,
можно приближенно принять, что
ξ& = λξ ,
где λ = f ′ (x*) > 0, т.е. возрастание ξ, во всяком случае на начальном участке, дей-
ствительно происходит по экспоненте.
До сих пор описывались экспоненциально возрастающие процессы. Перей-
дем к экспоненциально убывающим. Их тоже очень много, и они весьма разнооб-
разны. Это остывание чашки горячего чая, разряд электрически заряженного кон-
денсатора, и в частности электронной трубки телевизора после его выключения,
убывание интенсивности излучения при прохождении его через частично про-
зрачную среду, убывание массы разгоняющейся ракеты, торможение падения по-
сле раскрытия парашюта, гибель популяции, попавшей в неблагоприятные усло-
вия, например, резкого недостатка пищи, приход к равновесному состоянию и
многое, многое другое.
Экспоненциальное убывание – это все время замедляющееся убывание, на-
столько быстрое, что весь процесс замедления всегда ограничен. Именно ввиду
этой конечности времени быстроногий Ахилл не мог догнать черепаху, потому
что он пробегал сначала метр, потом полметра, затем четверть метра, ... и всего не
более двух метров. Ахилл не догоняет черепаху, но вместе с тем приближается к
ней он очень быстро, в том смысле, что расстояние до нее сокращается сначала в
два раза, потом еще в два раза и всего в четыре, потом еще в два раза, и всего в
восемь и т.д. Из сказанного следует, что экспоненциальное убывание можно трак-
товать как все убыстряющееся приближение к финальному значению.
Перейдем к конкретным примерам. На рис. 8.4 представлена схема конденса-
тора емкости С, разряжающегося на сопротивление R.

q
R
C

Рис. 8.3. Иллюстрация неустойчивого Рис. 8.4. Электрический замкнутый


равновесия в виде материальной точки контур, состоящий из сопротивления
на вершине выпуклой кривой и емкости
60 Ю.И. Неймарк. Математическое моделирование как наука и искусство

В соответствии с законами Кирхгофа, дифференциальное уравнение разряда


конденсатора пишется в виде:
q
Rq& = −
C
или
dq 1
=− q
dt RC
и, следовательно, описывается экспоненциальным убывающим процессом с вре-
менем уменьшения вдвое, равным
τ = RC ln 2.
Это время τ пропорционально емкости С и сопротивлению R. При начальном за-
ряде q = q0
q(t) = q0 e−t/RC.
Следующий пример – торможение парашюта. Пусть по достижении скорости
падения v0 парашют раскрылся и тормозит падение пропорционально его скоро-
сти. Согласно закону Ньютона,
mv& = −mg − hv .
Решение этого уравнения следующее:
mg  mg  −( h m )⋅t
v= +  v0 − e .
h  h 
Из него следует, что начальная скорость v0 (v0 > 0) экспоненциально замедляется
до постоянной скорости спуска, равной mg/h. График этого процесса изображен
на рис. 8.5.
v
v0

Рис. 8.5. Временной график


mg/h падения тела при вязком
сопротивлении

t
До сих пор рассматриваемые нами экспоненциальные процессы носили вре-
менной характер, т.е. они менялись экспоненциально с изменением времени. Рас-
смотрим теперь также экспоненциальные процессы, но не от временной перемен-
ной.
Сейчас уже мало кто читает Жюля Верна, а когда-то им зачитывались. Он в
своих фантастических романах предвидел очень многое, но иногда ошибался. Од-
ной из таких явных ошибок был описанный им полет на Луну из пушки. Полет он
предсказал, но из пушки – это ошибка. Жюлю Верну казалось, что чем больше
пушка, тем быстрее она выбрасывает ядро. Но это не совсем так; есть предельная
скорость выброса и ее превзойти нельзя. Пусть используется порох (как у Жюля
Верна) или другое взрывчатое вещество, и пусть при взрыве его массы т выделя-
8. Экспоненциальные процессы 61

ется энергия Ехим на единицу массы. Эта энергия может сообщить массе m (без
учета массы ядра) скорость v. В лучшем случае
mv 2
= mEхим ,
2
т.е. скорость выбрасываемого ядра не может быть больше
vmax = 2Eхим .
Вот тот абсолютный теоретический предел скорости, который можно достиг-
нуть стрельбой из пушки. Он много меньше требуемой первой космической ско-
рости, равной 8 км/с.
Циолковский был первым, кто понял, что необходим другой путь использо-
вания того же химического вещества, при котором теоретически может быть дос-
тигнута любая, сколь угодно большая скорость. Это путь использования ракетно-
го двигателя. Ракетный двигатель развивает тягу за счет выбрасываемой им струи
газа. Пусть ракета массы m имеет скорость v и из нее выбрасывается в обратном к
скорости направлении масса со скоростью c (рис. 8.6). Эта выбрасываемая масса –
dm − приобретает скорость c за счет химической энергии сгорающего в ракете то-
плива, так что
dmc 2
= dEхим , (8.9)
2
где dЕхим – затрата химической энергии, запасенной в ракете, переходящая в ки-
нетическую энергию движения газа. То, что ракета при выбрасывании из себя на-
зад массы – dm получает ускорение движения вперед, можно обнаружить и вы-
числить величину этого прироста скорости, исходя из закона сохранения энергии,
т.е. приравнивания энергии до и после выброса массы.

−dm
v + dv
m + dm
−c + v

Рис. 8.6. Схема, поясняющая вывод уравнения разгона ракеты


при выбрасывании из нее через сопло газа

До выброса массы ракета обладала энергией, равной


mv 2
E хим + .
2
Она складывалась из химической энергии Ехим содержащегося в ней топлива
и ее кинетической энергии движения. После выброса массы общая энергия скла-
дывается из уменьшенной химической энергии, измененной кинетической энер-
гии ракеты и кинетической энергии выброшенной массы газа – dm и в соответст-
вии с этим равна
( m + dm)( v + dv ) 2 dm( v − c) 2
E хим + dEхим + − .
2 2
62 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Приравнивая общие энергии до и после выбрасывания массы, найдем, что


( m + dm)( v + dv ) 2 dm( v − c ) 2 mv 2
E хим + dEхим + − = Eхим + .
2 2 2
Отсюда, учитывая (8.9) и, естественно, отбрасывая члены, содержащие dm dv,
(dv)2 более высокого порядка малости, придем к простому соотношению
mvdv + cvdm = 0
или
dm 1
= − m.
dv c
Таким образом, масса т ракеты убывает как экспоненциальная функция ско-
рости v:
m = m0 e−v/c. (8.10)
Так как нас интересует возрастание скорости с убыванием массы в связи с ее
отбрасыванием назад, то естественно последнее соотношение записать в виде
формулы Циолковского
m
v = c ln 0 .
m
Из выражения скорости v через отношение начальной массы m0 к массе т
следует, что, выбрасывая все большую и большую часть массы, ракета может
достичь все больших и больших скоростей, причем каждому уменьшению массы
в два раза отвечает увеличение скорости ракеты на величину c ln 2. Эта законо-
мерность в принципе позволяет достичь любых сколь угодно больших скоростей,
но для этого, так как конечная масса ракеты не может быть очень маленькой, не-
обходимо, соответственно, значительное увеличение начальной массы т0 . Так что
для полета на Луну нужна не большая пушка, как думал Жюль Верн, а большая
ракета. Не большая, а громадная. Из соотношения (8.10) следует, что начальная
масса т0 – экспоненциально возрастающая функция скорости v:
m0 = mev/c,
и удвоение начальной массы при заданной конечной происходит с каждым воз-
растанием скорости на величину c ln 2. Поэтому, чтобы снизить начальный вес
ракеты, необходимо предельно уменьшить ее конечный вес. Существенного сни-
жения конечного веса ракеты достигают путем ее многоступенчатой конструкции,
когда уже в полете ненужные части ракеты отбрасываются и остается минималь-
но необходимая ступень ракеты.
Другой пример. Динамика численности популяции N, т.е. величина произ-
водной N& определяется соотношением скоростей рождаемости Р и гибели Г, так
что
N& = P – Г,
Р и Г являются функциями численности N и внешних условий. При неизменности
внешних условий и естественной простейшей зависимости от N (P = aN, Г = bN)
с учетом знака величины λ = a − b приходим к процессам экспоненциального раз-
множения или гибели.
8. Экспоненциальные процессы 63

Процессу гибели популяции аналогичен радиоактивный распад, влекущий


экспоненциальное убывание нераспавшегося вещества. Скорость радиоактивного
распада характеризуют временем полураспада. Чем меньше это время, тем быст-
рее исчезает опасное для человека радиоактивнее излучение.
Как процесс только гибели, можно представить поглощение излучения не
вполне прозрачной средой. При этом очень удобно представить себе излучение
как поток большого числа N фотонов, а среду – обладающей некоторыми незави-
симыми вероятностями поглощения каждого из фотонов потока на единицу про-
бегаемого им пути. В этой интерпретации при очень большом N
dN
= −λN ,
dl
что приводит к экспоненциально убывающему процессу с пробегом, уменьшаю-
щим интенсивность излучения вдвое, равным λ−1 ln 2.
Экспоненциальным характером убывания интенсивности излучения объясня-
ется факт кромешной тьмы в глубинах океана при достаточной освещенности в
его верхних слоях. Действительно, пусть освещенность падает вдвое на каждые
20 метров. Это падение освещенности в ясный светлый день совершенно незамет-
но. Но уже на глубине километра будет тьма, поскольку интенсивность излучения
будет в 250 ≈ 1012 раза меньшей.
Эта же модель потока частиц может привести к экспоненциально растущему
лавинообразному процессу, если при столкновении быстро движущейся частицы
с молекулой газа может образоваться более одной так же быстро движущихся
частиц. Такие лавинные процессы наблюдаются при вхождении в атмосферу из
космоса частиц со скоростями, близкими к скорости света, и огромными энергия-
ми.
Охлаждение не очень сильно нагретого тела – стакана чая или кофе – это
также экспоненциально убывающий процесс. Действительно, если температуру
окружающей среды принять за отсчетную, то изменение температуры Т нагретого
тела подчиняется дифференциальному уравнению
dT
= − λT
dt
в силу того, что отдача тепла нагретым телом окружающей среде приближенно
пропорциональна разности температур тела и среды.
Наконец, отметим, что все процессы прихода к равновесному состоянию, а
именно так можно трактовать разряд заряженного конденсатора, торможение
движущегося тела, гибель популяции, охлаждение нагретого тела, как правило,
имеют экспоненциально убывающий характер. Это обосновывается тем, что ли-
неаризованное в окрестности равновесия уравнение движения в общем случае
совпадает с дифференциальным уравнением экспоненциально убывающего про-
цесса.
Так, для одномерного процесса
dx
= f ( x) ,
dt
имеющего состояние равновесия x*, для величины отклонения ξ от х* имеем:
64 Ю.И. Неймарк. Математическое моделирование как наука и искусство


≈ f ′( x ∗ )ξ ,
dt
где в силу устойчивости f' (x*) < 0.
Для многомерного случая все несколько сложнее и процесс убывания описы-
вается выражением вида:

∑ Cs e −λ t +∑ Dk e −µ t cos(ωk t+ϕk ),
s k

где λs и µk – положительные, т.е. суперпозицией экспоненциально убывающих и


экспоненциально убывающих осциллирующих составляющих. Ясно, что финаль-
ный приход к равновесию будет описываться членом с наименьшим показателем
λs или µk, и в этом смысле тоже может характеризоваться как экспоненциально
убывающий или осциллирующий экспоненциально убывающий процесс.
9. Динамика сосуществования популяций 65

9. ДИНАМИКА СОСУЩЕСТВОВАНИЯ ПОПУЛЯЦИЙ


Выше рассказывалось о беспрепятственном размножении популяции. Оно
происходило по экспоненте. Однако в реальных условиях популяция находится в
весьма разнообразных взаимоотношениях с другими популяциями и внутри себя.
Эти взаимоотношения могут быть типа хищник и жертва (антагонизм), взаимопо-
мощи (симбиоз), взаимной конкуренции. В простейшем случае взаимодействую-
щих популяции две, так что именно это взаимодействие является решающим и
наиболее важным, а остальные носят второстепенный характер.
Первая экологическая модель взаимодействующих популяций – это модель
хищник – жертва, написанная Лоткой и Вольтерра [14–16]. Она учитывает, что по-
пуляция жертвы может существовать сама по себе, а популяция хищника – только
питаясь жертвой. Поэтому в отсутствие хищника жертва размножается экспонен-
циально согласно уравнению
x& = ax ,
а хищник в отсутствие жертвы вымирает, так что
y& = −cy .
Хищник съедает тем больше жертвы, чем ее больше и чем более многочисле-
нен он сам, поэтому при наличии хищника
x& = ax − bxy . (9.1)
Съеденное количество жертвы способствует размножению хищника и поэто-
му
y& = −cy + dxy . (9.2)
Дифференциальные уравнения (9.1) и (9.2) и есть знаменитые и широко извест-
ные дифференциальные уравнения Вольтерра–Лотки, уравнения, с которых началось
развитие теории взаимодействующих популяций.
Состоянием этой динамической системы, описываемой уравнениями (9.1) и
(9.2), являются численности х и у жертвы и хищника, фазовым пространством –
октант х ≥ 0, у ≥ 0. При y = 0 x возрастает по экспоненте, при x = 0 у убывает по
экспоненте. Точка x = y = 0 является состоянием неустойчивого равновесия типа
седла. Это следует из того, что вблизи точки равновесия х = у = 0 членами, содер-
жащими произведение малых величин х и у, можно пренебречь и приближенно
записать:
x& = ax , y& = −cy .
Кроме равновесия x = y = 0, возможно еще равновесие x = x*, y = y*, где х* и у* –
отличные от нуля решения уравнений
ax – bxy = 0, –cy + dxy = 0,
то есть
x* = c/d, y* = a/b.
66 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Тип равновесия (х*, у*) можно найти, как обычно, составляя его характеристи-
ческое уравнение
a − by ∗ − λ − bx ∗
=0
dy ∗ − c + dx ∗ − λ
или
λ2 + a c = 0 .
Корни характеристического уравнения чисто мнимые λ1,2 = ±i a c и отвеча-
ют в линейном приближении состоянию равновесия типа центр, которое при уче-
те отбрасываемых при линеаризации членов может оказаться как устойчивым, так
и неустойчивым фокусом. В данном случае более полный анализ обнаруживает,
что нелинейные члены сохраняют вид состояния равновесия, т.е. оно остается ти-
па центра. Более детальный анализ основывается на возможности интегрирования
дифференциальных уравнений Вольтерра–Лотки. Уравнение Вольтерра–Лотки
можно записать в виде:
dx dy
=− .
ax − bxy − cy + dxy
Откуда, разделяя переменные х и у, получим
( −c + dx )dx ( a − by )dy
=
x y
и после интегрирования
− a ln y − c ln x + dx + by = h ,
где h – произвольная константа. Последнее уравнение – это уравнение фазовых
траекторий. Каждой траектории соответствует свое значение константы интегри-
рования h. Качественно построить фазовые траектории на плоскости х, у можно,
заметив, что каждая из фазовых траекторий получается проектированием на плос-
кость х, у линии пересечения поверхности
z = dx + by − c ln x − a ln y ≡ f ( x, y ) (9.3)
плоскостью z = h. Вид этой поверхности, показанный на рис. 9.1, можно найти из
соображений, что на осях х и у f (x, у) = ∞ и f (x, у) → ∞ при возрастании хотя бы
одной из переменных х или у. Точке минимума этой поверхности z = f (x, у) отве-
чает состояние равновесия (х*, у*). Все остальные фазовые траектории представ-
ляют собою овалы, заключенные друг в друге и охватывающие равновесие (х*, y*),
так что фазовый портрет оказывается вида, изображенного на рис. 9.2.
Несмотря на свою простоту, модель Вольтерра–Лотки качественно правильно
отражает колебательный характер численностей х и у в сосуществовании хищника
и жертвы. Он был обнаружен, например, при многолетних наблюдениях числен-
ности зайцев и рысей в Канаде и многих других случаях.
Согласно фазовому портрету, колебания численности популяции имеют пе-
риодический характер, но могут происходить с разными размахами: от нулевых
до бесконечных, но, как заметил Вольтерра, временные средние значения числен-
9. Динамика сосуществования популяций 67

ности х и у остаются неизменными, равными координатам х* и у* состояния рав-


новесия. Это непосредственно следует из усреднения по периоду соотношений
x& y&
= a − by , = − c + dx ,
x y
поскольку средние значения их левых частей равны нулю.
z
y

z = f (x,y)

z=h
x
y
x
Рис. 9.1. Геометрическое построение Рис. 9.2. Фазовый портрет
фазового портрета модели Вольтерра – Лотки модели Вольтерра – Лотки

Согласно этой модели, ни изменения параметров a, b, c и d, ни возмущения,


приводящие к изменению начальных условий, до тех пор, пока у не обращается в
нуль, не могут нарушить печальную судьбу жертвы быть пищей для хищника.
Пожалуй, самое благоприятное для нее – находиться вблизи равновесного состоя-
ния, поскольку при больших размахах популяция жертвы, впрочем, как и хищни-
ка, проходит периоды очень малой численности.
Если распространить, что допустимо лишь с большими оговорками, эту мо-
дель на сосуществование человека (жертва) с микробом или вирусом (хищник), то
можно сделать любопытные выводы о том, как следует и как не следует прини-
мать лекарства, уничтожающие хищника. Прежде всего, если это возможно, то
хищника нужно добивать полностью: оставляя даже очень малое его количество,
мы никакой цели не достигнем; спустя некоторое время он достигнет, возможно,
еще большей численности. Если же полное истребление хищника невозможно, то
уменьшать его число целесообразно в некоторой мере и только в верхнем над
равновесием положении фазовой точки, т.е. вблизи максимальности его числен-
ности. Частичное уничтожение при малой численности приведет только к боль-
шему последующему обострению заболевания.
Таковы выводы, которые можно сделать из очень простой модели сосущест-
вования хищника и жертвы Вольтерра – Лотки. В дальнейшем эта модель уточня-
лась и усложнялась. С чисто математической стороны модель Вольтерра–Лотки
неудовлетворительна в силу возможности значительных качественных изменений
фазового портрета под влиянием сколь угодно малых изменений правых частей ее
дифференциальных уравнений. Это означает, что неучет даже незначительных
факторов может существенно его изменить, и поэтому нет никаких оснований
считать модель правильной, так как игнорирование второстепенных факторов не-
избежно.
Такое нежелательное поведение модели Вольтерра – Лотки объясняется тем,
что его равновесие типа центр, которому отвечают чисто мнимые корни характе-
68 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ристического уравнения, может при самых незначительных добавках δ(x, y) и


ε(x, y) к правым частям уравнений (9.1), (9.2) смениться на устойчивый или неус-
тойчивый фокус, а вокруг него могут появиться замкнутые устойчивые периоди-
ческие движения, что существенно изменяет фазовый портрет и вытекающее из
него поведение сосуществующих жертвы и хищника.
Модель, лишенная этого недостатка, учитывающая насыщение хищника и
конкуренцию жертвы за источники питания и жизни, имеет вид [5]:
bxy
x& = ax − − Bx 2 ,
1 + Ax (9.4)
dxy
y& = − cy + .
1 + Ax
Она переходит в модель Вольтерра–Лотки при А = 0 и B = 0. Параметр A учиты-
вает насыщение хищника, что даже при очень большом числе x жертв он не может
съесть жертвы больше, чем некоторое количество bА–1, в то время как при A = 0 он
мог съесть неограниченно много при x → ∞. Параметр В > 0 учитывает ограни-
ченность ресурсов для размножения жертвы.
Исследование дифференциальных уравнений (9.4) уже не так просто, как мо-
дели Вольтерра–Лотки. Его целесообразно начать с уменьшения числа парамет-
ров. Сейчас их шесть. Оказывается, что можно привести к двум. Замена перемен-
ных t =τ/α, x = c/d u, y = a/b v приводит дифференциальные уравнения (9.4) к ви-
ду:
uv
u& = u − − εu 2 ,
1 + αu (9.5)
 u 
v& = − γv 1 −  .
 1+ αu 
Как показывает исследование, качественный вид их фазового портрета зави-
сит только от положительных параметров α и ε, параметр γ на него не влияет
(α = Ac/d, ε = cB/a d).
Отыскание двумерного (переменные u ≥ 0, v ≥ 0) фазового портрета этих
уравнений и бифуркационного портрета распадается на ряд этапов. Сначала нахо-
дятся и исследуются состояния равновесия. Это исследование подсказывает воз-
можность автоколебаний. Далее находятся области параметров, отвечающие раз-
личным качественным структурам фазового портрета. В результате приходим к
бифуркационному портрету (рис. 9.3).
ε
1

2
Рис. 9.3. Параметрический портрет уточненной
модели «хищник–жертва» Вольтерра – Лотки
3
1 α
9. Динамика сосуществования популяций 69

Он содержит три области 1, 2 и 3. Каждой из них отвечает свой вид фазового


портрета, показанный на рис. 9.4 с указанием номера области бифуркационного
портрета.
v v v

2
1

1/ε u 1/ε u 1/ε u

Рис. 9.4. Фазовые портреты уточненной модели «хищник–жертва»


для значений параметров из областей 1–3 параметрического портрета

При параметрах из области 1 хищник гибнет, остается одна жертва в количе-


стве u* = 1/ε, отвечающем устойчивому равновесию фазового портрета 1 рис. 9.4.
В области 2 изолированное существование жертвы становится неустойчивым
и появляется равновесное взаимодействие хищника и жертвы.
С переходом в область 3 нарушается равновесное сосуществование жертвы и
хищника и оно приобретает автоколебательные характер.
После этого краткого описания перейдем к изложению исследования.
Состояния равновесия находятся из уравнений:
uv  u 
u− − εu 2 = 0, γv 1 −  = 0. (9.6)
1 + αu  1 + αu 
Решений три: 1) u = v = 0 , 2) u = 1/ε, v = 0 , 3) u = 1/(1 – α), v = 1 – α – ε /(1 – α)2.
Первые два равновесия имеют место при любых положительных α и ε, по-
следнее – только в области 2 и 3, где 1 – α – ε > 0. На границе областей 1 и 2
третье и второе равновесия сливаются.
Для исследования устойчивости найденных равновесий составим характери-
стическое уравнение:
v αuv u
1 − 2εu − + −λ −
1 + αu (1 + αu ) 2
1 + αu
X (λ ) = = 0,
 αu 1  u
− γv  −  − γ (1 − )−λ
 (1 + αu ) 1 + αu  1 + αu
2

в которое последовательно подставляются вместо и и v значения координат рав-


новесий, исследуемых на тип и устойчивость. Для состояний равновесия 1, 2 и 3
последовательно находим корни этого характеристического уравнения:
1) λ1 = 1, λ2 = –γ;
2) λ1 = –1, λ2 = –γ(α + ε – 1);
3) λ1,2 = –σ ± iω,
где σ обращается в нуль на граничной кривой ε = α (1 – α)/(1 + α) областей 2 и 3
(в области 2 – значение σ отрицательно, а в области 3 – положительно). В соот-
70 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ветствии с теорией бифуркаций при переходе из области 2 в 3 должно либо рож-


даться устойчивое периодическое движение от третьего состояния равновесия,
либо неустойчивое периодическое движение должно исчезать, влипая в него. Вы-
яснить, какой из случаев имеет место, можно, подсчитывая знак так называемой
ляпуновской величины. Эта процедура приводит к тому, что имеет место рожде-
ние устойчивого периодического движения – автоколебания – и в соответствии с
этим имеет место фазовый портрет 3 рис. 9.4.
Справедливости ради укажем, что при строгом подходе нужно еще выяснить,
не могут ли возникнуть сложные предельные циклы. Легче всего в этом убедиться
с помощью компьютера, с дисплея которого и были срисованы все приведенные
картинки фазовых портретов.
Мы рассмотрели математические модели взаимодействующих популяций ти-
па хищник–жертва. Аналогичные модели могут быть построены для двух конку-
рирующих популяций и помогающих друг другу. Дифференциальные уравнения
двух конкурирующих популяций при учете еще и внутренней конкуренции в каж-
дой из них можно записать в виде:
2 2
x&1 = a1 x1 − a11 x1 − a12 x1 x2 , x& 2 = a2 x2 − a22 x2 − a 21 x2 x1
или, после замены переменных
τ a1 a2
t= , x1 = u1 , x2 = u2 ,
a1 a11 a 22
в эквивалентном виде:
u&1 = u1 (1 − u1 − ε1u2 ) ,
(9.7)
u& 2 = γu2 (1 − u2 − ε 2 u1 ) .
Как и в предыдущей модели, приведенной к такому виду, зависимость от γ
несущественная, не отражающаяся на качественном виде фазового портрета. По
существенным параметрам ε 1 и ε 2 бифуркационная диаграмма содержит четыре
области 1, 2, 3 и 4 (рис. 9.5), каждой из которых отвечает свой вид фазового порт-
рета, показанный на рис. 9.6 под тем же номером, что и соответствующая область
бифуркационного портрета.
ε2

2 4

1
Рис. 9.5. Параметрический портрет
3 1 модели конкурирующих видов

1 ε1
Общий смысл их состоит в том, что в конкурентной борьбе выживает та по-
пуляция, которая в параметрах ε 1 и ε 2 оказывает на другую большее конкурент-
ное давление. Эта ситуация имеет место в областях 1 и 2, где один из параметров
ε 1 и ε 2 больше единицы, а другой меньше. В области 3 имеет место равновесное
сосуществование. В области 4 выживает одна из популяций в зависимости от на-
чальных условий.
9. Динамика сосуществования популяций 71
u2 u2

1 1 1
2

1 u1 1 u1
u2 u2

1 3 1
4

1 u1 1 u1
Рис. 9.6. Фазовые портреты, соответствующие параметрическому портрету
(рис.9.5) модели конкурирующих видов
Для осмысливания этих выводов нелишне знание связи исходных параметров
модели a1, a2, a11, a12, a21, a22 с редуцированными ε 1 и ε 2 :
a a aa
ε1 = 2 12 , ε 2 = 1 21 .
a1a 22 a2 a11
Следующие две модели соответствуют взаимопомощи популяций, известной
в биологии как явление симбиоза. Первая модель относится к случаю, когда взаи-
мопомощь – необходимое условие существования: каждая из популяций сама по
себе гибнет. В ней учитываются еще внутренние конкуренции в каждой из попу-
ляций. В исходных параметрах эта модель имеет вид:
bx1 x2
x&1 = − a1 x1 + − c1 x12 ,
1 + A1 x2 (9.8)
bx1 x2
x& 2 = −a2 x2 + − c2 x22 .
1 + A2 x1
Как и ранее, все параметры неотрицательные. Здесь возможно только два ви-
да фазового портрета: один, когда при любых начальных условиях численности
обеих популяций x1 и х2 стремятся к нулю и популяции вымирают, и второй, отве-
чающий рис. 9.7.
x2

O Рис. 9.7. Фазовый портрет модели (9.8)


симбиоза двух видов

x1
72 Ю.И. Неймарк. Математическое моделирование как наука и искусство

В заштрихованной части фазового пространства все фазовые траектории


стремятся к началу координат, что означает гибель обеих популяций. При боль-
ших значениях численности x1 и x2 популяций, отвечающих незаштрихованной
области, устанавливается равновесное взаимовыгодное сосуществование. Это рав-
новесное состояние отмечено на фазовом портрете буквой О.
Значительное разнообразие динамики симбиоза двух популяций наблюдается
в модели, где отдельное существование каждой из популяций возможно, но тре-
бует, чтобы ее численность превзошла некоторый порог: малочисленная популя-
ция вымирает. Такая особенность биологического поведения изолированной по-
пуляции может быть отображена моделью вида:
x& = − ax ( x − L1 )( x − L2 ) ( 0 < L1 < L2 ), (9.9)
как это видно из рис. 9.8, на котором изображен график правой части этого урав-
нения и соответствующий ему фазовый портрет.

x=0 L1 L2 x

Рис. 9.8. Фазовый одномерный портрет существования одного вида модели (9.9)

В соответствии с этим математическая модель симбиоза двух популяций за-


писывается в виде:
x&1 = a1 x1 ( x1 − L1 )( L2 − x1 ) + b1 x1 x2 ,
(9.10)
x& 2 = a 2 x2 ( x2 − K1 )( K 2 − x2 ) + b2 x1 x2 .
Один из возможных здесь фазовых портретов, который, как и другие, можно
наблюдать на дисплее персональной ЭВМ, изображен на рис. 9.9. В соответствии
с поведением фазовых траекторий на рис. 9.9 в описываемом симбиозе может
произойти вымирание обеих популяций, любая из популяций может выжить, а
другая погибнуть, и, наконец, они могут сосуществовать при больших численно-
стях, чем каждая отдельно.
x2
x2

O4
O3
O2

O1 O1
O2 x1 x1
Рис. 9.9. Фазовый портрет Рис. 9.10. Другой фазовый
симбиоза двух видов портрет симбиоза двух видов
для модели (9.10) для модели (9.10)
9. Динамика сосуществования популяций 73

Другой возможный случай изображен на рис. 9.10. В нем, как и в предыду-


щей модели симбиоза (9.8), возможно только совместное существование обеих
популяций или их обоюдная гибель.
Мы рассмотрели несколько разных математических моделей сосуществова-
ния двух популяций. Соображения, положенные в их основу, естественны и про-
сты, но выводы неожиданны и поучительны.
Можно ли было ожидать, что сосуществование хищника и жертвы ведет к ав-
токолебаниям? Можно ли было думать, что конкуренция жертв способствует ее
избавлению от хищника, что при сосуществовании конкурирующих популяций та
же внутренняя конкуренция, которая еще более затрудняет жизнь, способствует
выживанию? Менее неожидан, но также интересен вывод о том, что при симбиозе
популяции выживают только при достаточно больших численностях.
74 Ю.И. Неймарк. Математическое моделирование как наука и искусство

10. ПРОТОЧНЫЙ БИОЛОГИЧЕСКИЙ РЕАКТОР


Проточный биологический реактор – хемостат – представляет собою емкость
с питательной средой, в которой размножаются микробы [18]. Его особенность
состоит в том, что среда, в которой происходит непрерывное размножение, все
время пополняется свежим интенсивным питающим раствором и одновременно с
той же скоростью отбирается жидкость с микроорганизмами и субстратом. Среда
хемостата интенсивно размешивается, так что во всем его объеме концентрации
интенсивного субстрата и микробов одинаковы. Пополнение и отбор происходят
с одинаковыми объемными скоростями. В хемостате поддерживается постоянная
температура.
Наша задача состоит в том, чтобы, построив математическую модель дина-
мики хемостата, изучить ее и оптимизировать его работу по управляемым пара-
метрам. Размножение микробов в питательной среде хемостата подобно размно-
жению хищника с учетом его насыщения. В соответствии с этим скорость раз-
множения примем пропорциональной массе микробов x с коэффициентом про-
порциональности вида
µ S
µ= m , (10.1)
K+S
где S – концентрация субстрата в хемостате, а µm и K – параметры. Пусть посту-
пающий в хемостат питательный субстрат концентрации S0 и скорость объемного
поступления его в хемостат равна D. Ясно, что убыль интенсивного вещества
пропорциональна скорости размножения микробов. Поступление интенсивного
раствора и отбор содержимого хемостата происходят с постоянной объемной ско-
ростью D.
Согласно сказанному, используя (10.1), найдем, что
µ S D
x& = m x − x ,
K+S V
lµ S
VS& = D ( S0 − S ) − m x ,
K+S
где V – объем жидкости в хемостате. Введем новые параметры: D вместо D/V и l
вместо l/V, запишем эти уравнения в виде:
µ S
x& = m x − Dx ,
K+S (10.2)
lµ S
S& = D( S0 − S ) − m x
K+S
и приступим к их изучению.
Фазовым пространством хемостата, точнее, его математической модели
(10.2), является первый октант x ≥ 0, S ≥ 0 плоскости x, S. Помимо тривиального
равновесия x = 0, S = S0 , имеется еще одно равновесие, определяемое из уравне-
ний:
µm S lµ S
− D = 0, D( S0 − S ) − m x = 0.
K+S K+S
10. Проточный биологический реактор 75
Непосредственно находим, что его координаты x* и S* равны
KD
S∗ = , x ∗ = [(µ m − D ) S0 − K D ]l −1 (µ m − D ) −1 . (10.3)
µm − D
Этим значениям S* и x* будет отвечать равновесие, если они не отрицатель-
ные, т.е. при выполнении неравенства
KD
µm > D + , (10.4)
S0
т.е. если точка (S0, D) лежит в области, изображенной на рис. 10.1.
D

µm

x*, S* > 0
Рис. 10.1. Область существования
равновесия (x*, S*) хемостата
по параметрам S0 и D
S0
Устойчивость равновесий определяется корнями характеристического урав-
нения:
µm K
µ− D−λ x
( K + S )2
X (λ ) = = 0, (10.5)
µm K l
− lµ −D− x−λ
( K + S )2
где использовано обозначение (10.1), а S и x – значения координат рассматривае-
мого равновесия. Для равновесия x = 0, S = S0 корни действительные разных зна-
ков, и для равновесия x = x*, S = S*, определяемого (10.3), коэффициенты квадрат-
ного уравнения относительно λ (10.5) положительны и, следовательно, оно устой-
чиво. Соответствующий фазовый портрет представлен на рис. 10.2. Он очень
прост: любая фазовая точка (x, S) (x > 0) асимптотически приближается к равнове-
сию с координатами S*, x*.
x

Рис. 10.2. Фазовый портрет хемостата при значениях


параметров S0 и µm из области существования
равновесия, показанной на рис. 10.1

S0 S
Параметрами хемостата, согласно (10.2), являются µm, K, D, S0, l, причем вели-
чины параметров D и S0 можно менять, они управляемые. Менять их следует так,
чтобы не нарушить устойчивую работу хемостата, т.е. соблюдая условия (10.4), и
желательно так, чтобы максимизировать Dx*. Из (10.3) следует, что
D S0 K D2
Dx = D[(µ m − D )S0 − KD ]l/ (µ m − D )
∗ −1 −1
= − . (10.6)
l l (µ m − D )
76 Ю.И. Неймарк. Математическое моделирование как наука и искусство

При выбранном S0 максимум по D достигается при некотором D(S0) < µm ,


причем D(S0) – возрастающая функция S0 . Таким образом, S0 желательно выби-
рать побольше и при выбранном S0 существует оптимальная скорость отбора D.
На рис. 10.3 изображен поясняющий этот факт график зависимости скорости про-
изводства микроорганизмов Dx* от скорости отбора D.
Dx*

µm
Рис. 10.3. График производительности хемостата
Dmax D от скорости отбора D. Четко видно наличие
максимума

Точка пересечения этого графика с осью абсцисс имеет координату


µm S0(K + S0)−1 и поэтому после этой точки график теряет физический смысл, по-
скольку нарушается неравенство (10.4), обеспечивающее функционирование хе-
мостата.
11. Математическая модель иммунного ответа организма на вторжение инфекции 77

11. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИММУННОГО ОТВЕТА


ОРГАНИЗМА НА ВТОРЖЕНИЕ ИНФЕКЦИИ
Иммунные системы животного и человека очень сложны. Сложно и многооб-
разно их устройство, сложны и многовариантны их реакции на инфекцию, слож-
ны и многолики средства противодействия. Сегодня описание иммунной системы
занимает пару томов, и при этом еще многое остается незатронутым и неизвест-
ным. Вместе с тем, иммунная система, сколь бы сложна она ни была, предназна-
чена оказывать противодействие и уничтожать вторгшуюся в организм чужерод-
ную и вредную для него инфекцию, и в общих понятиях это противодействие ин-
фекции и ее вредное влияние на организм можно описать, опуская детали того,
как это фактически происходит.
Есть инфекция, которая стремится размножиться и воздействует на организм,
подавляя его жизнеспособность. Есть организм, который пытается ее истребить,
организуя, кроме изначального противодействия, еще и дополнительное, как
только ее обнаружит. Быстрота и эффективность ответа организма зависят от на-
следственных факторов и от приобретенного «жизненного опыта», а также от со-
стояния организма в данный момент и резервов, которыми он располагает.
Таким образом, несмотря на всю сложность иммунного ответа организма на
инфекцию, на первый план выступают три фактора: инфекция; ее размножение и
влияние на организм; противодействие организма и возможности его реализации,
зависящие от его состояния. Эти факторы можно количественно охарактеризовать
тремя величинами: x, y и z – численностью инфекции, величиной противодействия
организма и потенциалом организма. Инфекция, помимо своей численности x, ха-
рактеризуется быстротой размножения в среде организма и подавляющим дейст-
вием на организм. Противодействие характеризуется своим количеством y и его
эффективностью, быстротой и мощностью пополнения w, зависящими от орга-
низма и его потенциала z.
Все сказанное позволяет описать динамику иммунного ответа − изменение
величин x, y, w и z – следующими четырьмя дифференциальными уравнениями:
axy
x& = λ x − − εx 2 ;
1 + αx
 b xy
− +w=K при y > 0 или y = 0 и K ≥ 0,
y& =  1 + α x
 0 при K < 0;

 0 при x ≤ x0 , (11.1)
τ w& + w =  2
 B z ( 2 z0 − z )( x + β x ) при x > x0 ;
 c ( z0 − z )
 − dy − e = F при z > 0 или z = 0 и F ≥ 0,
z& =  1 + γ x
 0 при z = 0 и F < 0.
78 Ю.И. Неймарк. Математическое моделирование как наука и искусство

В этих уравнениях x0 – порог чувствительности организма к инфекции, τ –


временная задержка дополнительного иммунного ответа, величина которого зави-
сит от объема инфекции x и потенциала организма z. При β = 0 зависимость от
x линейная, при β > 0 она форсирована, а при β < 0 , напротив, уменьшена. По-
следнее уравнение системы (11.1) описывает изменение потенциала z, при этом
0 ≤ z ≤ z0 . Первый член последнего уравнения (11.1) – это скорость пополнения по-
тенциала z до его предельного значения z0, второй и третий – его расход на иммун-
ный ответ организма y и на потребности самого организма. Обращение z в нуль
трактуется как полное истощение организма, ведущее к его гибели.
У четырех уравнений (11.1) 13 параметров. Параметр λ может иметь любой
знак: λ < 0 означает, что инфекция, попав в среду организма, гибнет; при λ > 0 она
все же размножается, но ей мешает в этом противодействие организма y, которого
может и не быть. В дальнейшем будем считать λ > 0. Все остальные параметры,
кроме β , положительны. Процесс нарастания и динамики противодействия y ин-
фекции x описывается последними тремя уравнениями.
Хотя сказанного достаточно для понимания предлагаемой модели (11.1), все
же дадим более подробное описание каждого из ее уравнений.
В первом уравнении член λx соответствует размножению инфекции, второй −
ее уничтожению фактором y противодействия организма. Этот член, естественно,
равен нулю при x = 0, максимален при x = ∞ и линейно зависит от y. Последний
член отражает возможность конкуренции за условия размножения.
Второе уравнение описывает изменение противодействия инфекции y. Пер-
вый член во втором уравнении при y > 0 соответствует тому, что на каждую еди-
ницу уничтоженной инфекции x происходит определенное уменьшение y. Второй
член w в этом же уравнении – это скорость пополнения организмом противодей-
ствия y.
Третье уравнение указывает, что иммунный ответ на инфекцию имеет место
только при x > x0, происходит с временной задержкой и определяется величиной,
зависящей от потенциала организма z, причем пропорционально x или с некото-
рой форсировкой при β > 0, или, наоборот, уменьшением с ростом x при β < 0.
Последнее уравнение описывает изменение потенциала z организма. В этом урав-
нении 0 ≤ z < z0. Первый член правой части увеличивает z при z < z0. Скорость этого
роста потенциала убывает с увеличением вредного влияния инфекции x. Второй и тре-
тий члены – затраты на поддержание противодействия y и всего организма.
Модель (11.1) для исследования достаточно сложна, но ее можно значительно
упростить, ограничившись переменными x и y. Это тем более возможно, что роль
остальных уравнений довольно очевидна и может быть мысленно учтена и поня-
та. Упрощенная модель имеет вид:
axy
x& = λx − − εx 2 ,
1 + αx
11. Математическая модель иммунного ответа организма на вторжение инфекции 79

 bxy
− 1 + αx при x ≤ x0 и y ≥ 0,
 bxy

&y = − + B ( x + βx 2 ) = K при x > x0 и K ≥ 0, (11.2)
 1 + αx
0 при x > x0 и K < 0.

Отличие уравнений (11.2) от (11.1) в том, что величина B теперь постоянна,
в то время как в уравнениях (11.1) она меняется согласно двум последним урав-
нениям. Формально перейти от системы (11.1) к (11.2) можно, положив τ = 0 и
приняв z постоянным. Величина τ > 0 определяет быстроту возрастания w от нуля
до предельного значения B z ( 2 z0 − z )( x + β x 2 ) , а B в уравнениях (11.2) равно
B z ( 2 z0 − z ) при принимаемом постоянном z. Так что роль последних двух урав-
нений в (11.1) может быть учтена, как изменяемость B в уравнениях (11.2).
Число параметров в упрощенных уравнениях (11.2) может быть уменьшено
путем изменения масштабов по времени t и переменным x и y, после чего они
принимают вид:
xy
x& = x − − ε x2 ,
1+ x
 bxy
− 1 + x при x ≤ x0 и y > 0,
 (11.3)
 bxy
y& = − + B( x + βx 2 ) = K при x > x0 и y > 0 или y = 0 и K ≥ 0,
 1+ x
0 при x > x0 и K < 0.

Поймем, что следует из упрощенной модели (11.3), сначала приняв ε = β = 0.
При этом остается три параметра: x0, b и B. Как оказывается, возможны два суще-
ственно разных случая: b > B и b < B. Второй случай, b < B, распадается еще на
два: b < 1 и b > 1. Так что имеют место четыре разных вида фазовых портретов,
представленных на рис. 11.1.
На рис. 11.1 показана A – область начальных условий, для которых имеет ме-
сто выздоровление. Вне области A инфекция сохраняется на уровне чувствитель-
ности x0 и имеет место бациллоносительство.
Как видно из рис. 11.1 в случае b > B организм избегает гибели только при
начальных условиях в области A, т.е. при достаточно высоком начальном уровне
y . При недостаточном начальном противодействии y организм гибнет (происхо-
дит неограниченное возрастание x, ведущее, согласно последнему уравнению
(11.1), к занулению потенциала z). Это происходит даже при самой незначитель-
ной начальной инфицируемости. Напротив, при b < B организм никогда не гиб-
нет. Однако исход встречи с инфекцией может кончиться либо полным ее унич-
тожением (область A и приход к одному из равновесий x = 0, y > y*), либо сохра-
нением инфекции на пороге чувствительности (весь положительный октант, кро-
80 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ме области A), благодаря приходу к устойчивому равновесию O. Полное выздо-


ровление при начальных условиях в области A сопровождается одним либо, воз-
можно, несколькими обострениями (рис. 11.1,б). То, насколько ярко выражены
эти обострения, зависит от массированности инфекции x и начального значения
величины иммунного противодействия y . Носительство инфекции и равновесное
сожительство с ней происходит путем колебательного прихода к устойчивому
равновесию O (рис. 11.1,в, г).
y y
A
A
*
y y* O

x0 x x0 x
а) б)
y
y

A A

y* O y* O

x0 x x0 x
в) г)
Рис. 11.1. Фазовые портреты упрощенной модели (11.3) при β = ε = 0:
а) при b > B, б) b < B, в) b < B и b < 1, г) b < B и b> 1

По рис. 11.1 можно проследить, каковы последствия уменьшения количества


инфекции x , например, с помощью антибиотиков или других лекарств, в предпо-
ложении, что это не оказывает существенного влияния на иммунный ответ, т.е. на
величины b и B в уравнениях (11.3) и значение y . В случае b > B и y > y* доста-
точное уменьшение инфекции x ведет к более быстрому выздоровлению или даже
спасению организма от гибели. При y < y* выздоровление требует полного унич-
тожения инфекции (x = 0). Это выздоровление носит неустойчивый характер: ма-
лейшее повторное внесение инфекции или остаточная инфекция влекут после
временного улучшения повторное заболевание, оканчивающееся гибелью орга-
низма.
В случае b < B роль такого лекарственного воздействия скромнее и не всегда
положительна, так как может привести к сожительству с инфекцией, хотя и об-
легчает течение заболевания. Вместе с тем необходимо учитывать, что значитель-
ное и длительное обострение, через которое может произойти, согласно
рис. 11.1,б−г выздоровление, может реально не состояться в силу не учитываемо-
11. Математическая модель иммунного ответа организма на вторжение инфекции 81

го нами уменьшения потенциала z, влекущего уменьшение величины B в уравне-


ниях (11.3). И еще необходимо отметить, что на самом деле, согласно полной мо-
дели (11.1), вначале, в момент заражения, B = 0, и лишь затем достигает своего,
рассматриваемого нами значения, причем рост B в течение времени порядка τ
происходит только после того, как x превзойдет x0.
Приведенные рисунки фазовых портретов указывают на желательность прив-
несенного извне увеличения y, стимуляции иммунной системы. Это вообще убы-
стряет выздоровление и позволяет избежать перехода в хроническую инфициро-
ванность. Это будет видно и из дальнейшего, когда выявится роль β. Но, пожалуй,
самый существенный вывод, кроме крайней желательности обеспечения b < B,
тот, что целесообразно поддерживать изначальное значение y больше, чем y* (см.
рис. 11.1).
Действительно, если в начальный момент, до заражения, иммунная система
находится в равновесии, x = 0, y ≥ 0, то при y < y*, в силу неустойчивости равнове-
сия, даже незначительное увеличение x приводит к заболеванию, в то время как
при y > y* происходит уничтожение инфекции и наступление нового близкого
равновесного состояния. Уменьшение y может произойти в силу отсутствия
асимптотической устойчивости состояний равновесий x = 0, y > y*. Напротив, при
сожительстве с инфекцией состояние равновесия организма O асимптотически
устойчиво, и в этом смысле оно оберегает организм от вторичного заражения. Ко-
нечно, это только при стабильности параметров b и B, при их изменении эта ин-
фекция, наоборот, может быть причиной повторного заболевания.
Теперь посмотрим, что нового вносят параметры β и ε, не учитываемые ранее
(ε = β = 0). Ограничимся иллюстрацией ряда фазовых портретов, срисованных с
дисплея ЭВМ. Фазовые портреты, представленные на рис. 11.2, 11.3 и 11.4, де-
монстрируют роль форсированного иммунного ответа β > 0 на весьма неблаго-
приятном случае b > B.
y
y

O1 A A
O1
*
y *
y

x0 x x0 x
Рис. 11.2. Вид фазового портрета Рис. 11.3. Вид фазового портрета
упрощенной модели (11.3) при x0=1, упрощенной модели (11.3) при x0=1,
b=1,1, B=1,0, ε=0 и β=0,2. b=0,8, B=0,5, ε=0 и β=0,2.
Состояние равновесия O1 устойчиво Состояние равновесия O1 неустойчиво
и соответствует хроническому и при любых начальных условиях –
заболеванию. В области A – выздоровление
выздоровление
82 Ю.И. Неймарк. Математическое моделирование как наука и искусство

При этом все кончается хроническим заболеванием, бациллоносительством,


или выздоровлением. Конечно, длительное хроническое заболевание может на-
влечь существенное уменьшение потенциала z и следующее за ним уменьшение
величины B, что может привести к фатальным последствиям.
На рис. 11.5 представлен другой вариант форсирования иммунного ответа
(β > 0), при котором возможно течение болезни с периодически повторяющимися
рецидивами (автоколебание Γ).

y y

A
A
Γ
O y* O
y*

x0 x x0 x
Рис. 11.4. Вид фазового портрета Рис. 11.5. Вид фазового портрета
упрощенной модели (11.3) при x0=1, упрощенной модели (11.3) при x0=1, b=0,9,
b=1, B=0,9, ε=0,01 и β=0,05. B=0,9, ε=0,01 и β=0,05. В области A –
В области A – выздоровление, выздоровление, вне A – периодическое
вне A – бациллоносительство течение болезни (автоколебание Γ)
Что может произойти при ослаблении иммунного ответа (β < 0), демонстри-
руют рис. 11.6 и 11.7: несмотря на то, что B > b, возможен летальный исход. К ос-
лаблению иммунного ответа может привести не только β < 0, но и уменьшение
потенциала z согласно последнему, не учитываемому упрощенной системой
(11.3), уравнению системы (11.1).
y
A y
A

O1
O
y* y*

x0 x x0 x
Рис. 11.6. Вид фазового портрета Рис. 11.7. Вид фазового портрета
упрощенной модели (11.3) при x0=1, упрощенной модели (11.3) при x0=1,
b=0,5, B=2, ε=0 и β=−0,1. В области A – b=0,8, B=1, ε=0 и β=−0,2. В области A –
выздоровление, вне A – гибель выздоровление, вне A – гибель
12. Математическая модель сообщества «производители – продукт – управленцы» 83

12. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СООБЩЕСТВА


«ПРОИЗВОДИТЕЛИ – ПРОДУКТ – УПРАВЛЕНЦЫ»
Человеческое общество необычайно сложно, каждый человек – целый мир с
многообразным непредсказуемым поведением, а людей – тысячи и миллионы, и
они находятся в сложнейших взаимоотношениях друг с другом. Кроме того, есть
государство, системы управления и распределения, финансы, промышленность,
бытовые учреждения, транспорт, связь, учебные заведения, медицинские учреж-
дения и т.д. Кажется, что это все невозможно описать математически, да это так и
есть. Но можно попытаться описать только некоторые стороны этого неописуемо-
го сложного человеческого сообщества, опираясь на какие-то присущие ему осо-
бенности. Например, для того чтобы жить, необходимо добывать пищу, чтобы ее
эффективнее добывать, нужна организованность; да и не хлебом единым жив че-
ловек: ему нужно жилище, семья, орудия производства, зрелища и удовольствия.
При реализации своих естественных потребностей он вступает в конфликт с дру-
гими членами сообщества, имеющими свои потребности, и вместе с тем члены
сообщества объединяются, чтобы эффективнее добывать то, что они хотят по-
треблять. Выделим во всем этом три основных компонента: производители, про-
дукт, управленцы. Производители – это те, которые непосредственно производят
продукт, управленцы не производят продукт, но способствуют его производству;
продукт – это все то, что нужно для жизни человека, что он потребляет и чем он
пользуется.
Придадим производителям, управленцам и продукту количественную опре-
деленность в виде величин х, у и z, означающих численности производителей,
управленцев и наличное количество используемого сообществом продукта. Про-
изводители и управленцы находятся в конкурентных взаимоотношениях как меж-
ду собой, так и друг с другом, и вместе с тем, производители совместно произво-
дят продукт, а управленцы могут способствовать этому производству. Управлен-
цы оказывают влияние на жизнь и производство продуктов, управление сообще-
ством, но непосредственными их кормильцами, как и себя самих, являются про-
изводители. Итак, есть конкурентные взаимоотношения, есть естественное раз-
множение и есть совместное производство продукта, эффективность которого оп-
ределяется уровнем технологии сообщества.
На рис. 12.1 указаны связи и взаимодействия между производителями x,
yправленцами у и продуктом z.
l
a, b d, e
x g, ε1, ε2 y

h k
Рис. 12.1 Схема влияний в модели f
«производители – продукт – управленцы» с
z
b
84 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Каждая стрелка этой схемы отвечает воздействию переменной, от которой


она идет, на изменение той, к которой она ведет. Так, стрелка от переменной х к
переменной z означает, что скорость изменения количества продукта z зависит от
переменной х – числа производителей. Таких стрелок две: одна отвечает тому, что
х производит продукт z, а такая же другая – что он его потребляет. Стрелка от z к
x означает, что скорость изменения х зависит от наличного продукта z. Все стрел-
ки, идущие от х, у и z к z, указывают, что скорость изменения накопленного про-
дукта z зависит от х, y& и z.
Эта схема не раскрывает конкретного характера зависимостей и взаимных
связей, она лишь указывает на их наличие и то, что мы хотим в нашей модели их
учесть. Ясно, что сколько-нибудь точный учет их очень труден, да и при агреги-
рованности переменных х, у и z невозможен. Ограничимся грубо приближенным,
качественным их учетом, описываемым следующей системой трех дифференци-
альных уравнений:
x& = ( a − b x − l y + c z ) x ,
y& = ( − d − e y + f z ) y ,
 1 + ε1 y x (12.1)
F = g − h x − k y при z > 0 или z = 0 и F > 0,
z& =  1 + ε2 y 1 + δz
0 при z = 0 и F ≤ 0,
которая является предлагаемой математической моделью сообщества «произво-
дители – продукт – управленцы». В этой модели очень многое не учтено. Посмот-
рим, к какой динамике модели это приводит. Опишем еще раз, более детально,
общие соображения, лежащие в ее основе. Принимается, что скорость изменения
x в целом пропорциональна х с коэффициентом пропорциональности a – bx –
– ly + cz, убывающим с ростом х и y и возрастающим с ростом z. Это призвано от-
разить внутреннюю конкуренцию среди производителей х, давление на них
управленцев у и способствование производителям накопленного продукта z. Без
учета этих влияний х, у и z на изменение х первое уравнение системы (12.1) при-
няло бы вид
x& = ax ,
отвечающий беспрепятственному размножению производителей.
Соображения, положенные в основу второго уравнения системы (12.1), такие
же, но принято, что давление производителей на управленцев отсутствует или им
можно пренебречь. Возможно, это не всегда так и не представляет труда это
учесть. Если производители еще как-то, возможно, могут существовать сами по
себе при z = 0, то в отношении управленцев это исключено и поэтому знак перед
коэффициентом d отрицательный, в соответствии с чем «изолированные» управ-
ленцы подчиняются дифференциальному управлению
y& = −dy ,
отвечающему их гибели.
Третье уравнение отражает процесс накопления продукта в результате его
производства и потребления. Потребляют продукт производители и управленцы.
Он амортизируется и разрушается сам по себе и производится совместными уси-
12. Математическая модель сообщества «производители – продукт – управленцы» 85

лиями производителей и управленцев. Характер участия производителей и управ-


ленцев в производстве продукта разный: производители непосредственно его
производят, а управленцы способствуют (или тормозят) его производству. В соот-
ветствии с этим, правая часть дифференциального уравнения для z содержит три
слагаемых: первое отражает скорость производства продукта с учетом увеличи-
вающейся трудности его производства, с ростом его объема и учетом его «старе-
ния» (амортизации), второе и третье – его потребление производителями и, соот-
ветственно, управленцами. Потребления продукта производителями и управлен-
цами принимаются пропорциональными с разными коэффициентами их числен-
ности х и у. С производством продукта сложнее. Принято, что скорость его произ-
водства пропорциональна численности производителей х с коэффициентом про-
порциональности, в который входят сомножителями уровень технологии сообще-
ства g, величина (1 + ε1y)(1 + ε2y)–1, описывающая влияние на производство
управленцев у, и множитель (1 + δz)–1, убывающий с ростом z, призванный учесть
амортизацию накопленного продукта и увеличение трудности его накопления с
возрастанием его объема. При ε1/ε2 > 1 управленцы способствуют в пределах от 1
до ε1/ε2 производству, напротив, при ε1/ε2 < 1 они его тормозят в тех же пределах.
В принятой модели понятия продукта, производителей и управленцев агреги-
рованные, не учитывающие их, возможно, очень сложной и многообразной диф-
ференциации. Для первобытного общества продукт – это прежде всего продукты
питания и, возможно, жилище; для более развитого общества – еще и орудия охо-
ты, скотоводства и земледелия, включая сам скот и землю; для современного об-
щества – это вся совокупность материальных и интеллектуальных богатств обще-
ства. Трактовка переменных х и у усредненная, обобщенная, ассоциированная с
производственной и общественной активностью, отражаемой в производственных
и конкурентных взаимоотношениях.
Такие обобщенные, усредненные и расплывчатые трактовки переменных х, у
и z, естественно, вызывают чувство неудовлетворенности. Многое еще хочется
учесть, уточнить, дифференцировать, но вместе с уточнениями модель неизбежно
потеряет не только свою простоту, но и общность. Поэтому не будем излишне
требовательны. Ведь все же что-то, и, возможно, самое главное, она учитывает.
Посмотрим, что из нее следует, и тогда составим свое мнение.
Модель определяется большим числом параметров, эти параметры вовсе не
постоянные и не всегда меняются достаточно медленно, иногда даже очень быст-
ро. Они сложно зависят от текущего и прошлого состояния сообщества. Это в ре-
альности, а в модели они принимаются постоянными. Анализируя модель, можно
выяснить, что происходит при тех или иных фиксированных значениях парамет-
ров и как поведение модели меняется с их изменением.
То, как текущие значения х, у и z влияют на изменение параметров модели,
зависит от того, понимают ли ее современники закономерности динамики сооб-
щества, в котором живут, и каковы их фактические представления о ней, какова
управленческая структура общества, каковы нравы и воспитание его членов, ка-
ковы верования, мораль и этика? Ясно, что на характер зависимости параметров
могут существенно повлиять и сведения о сообществе, полученные в результате
изучения ее математической модели. Все это учесть очень трудно, поэтому огра-
86 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ничимся изучением модели при различных постоянных значениях ее параметров,


а остальное предоставим нашему интеллекту.
Изучение модели, несмотря на ее простоту, − непростая задача: она трехмер-
ная и в ней много параметров. Качественное изучение ее динамики сводится к по-
строению фазовых и бифуркационных портретов. Фазовый портрет трехмерен и
может быть нарисован. С бифуркационным портретом дело сложней и можно
лишь получить некоторые общие о нем представления. Даже после обычного со-
кращения числа параметров их остается не меньше девяти, так что удобнее со-
хранить тринадцать исходных.
Выяснение возможных видов фазовых портретов и их зависимости от пара-
метров в основном осуществлено старомодным трудоемким аналитическим ис-
следованием. Некоторая поддержка получена наблюдением фазовых траекторий
на дисплее персональной ЭВМ.
Обнаружить удалось следующее. Одним из основных параметров, опреде-
ляющих структуру сообщества, является его уровень технологии g. В зависимости
от его величины сообщества можно подразделить на три типа: с низким уровнем
технологии, средним и высоким. Низкий уровень – это когда g < h, средний – при
h < g < h(1 + δd/f ), и высокий – когда g > h(1 + δd/f ).
Фазовые портреты сообществ с низким и средним уровнями технологии зави-
сят еще от величин ε1 и ε2, определяющих влияние управленцев на эффективность
производства. При ε1 < K(ε2), где K(ε2) зависит, конечно, и от остальных парамет-
ров, имеют место фазовые портреты рис. 12.2 и 12.3. Первый из них отвечает со-
обществу с низким уровнем производства, когда в нем остаются одни производи-
тели без накопленного продукта и управленцев: что добыл, то и съел. Второй –
сообществу со средним уровнем производства, в котором устанавливается обще-
ство производителей, имеющих накопленный продукт. Состояния, при которых
имеются управленцы, меняются так, что они со временем исчезают, а для сообще-
ства с низким уровнем исчезает и накопленный продукт.
z
z
Φ
O2 Φ

O1 y
y
x x

Рис. 12.2. Фазовый портрет модели Рис. 12.3. Фазовый портрет модели
«производители – продукт – управленцы» «производители – продукт – управленцы»
при g < h, когда в глобально устойчивом при h < g < h(1 + δd/f ), когда в глобально
равновесии O1 нет продукта устойчивом равновесии O2 есть производители
и управленцев и продукт, но нет управленцев

Если управленцы могут значительно повысить эффективность производства,


так что ε1 > K (ε2), то это приводит к измененным фазовым портретам, показан-
ным на рис. 12.4,а, 12.5,а. В этом случае, наряду с сохранением прежних устойчи-
вых сообществ «производители» или «производители – продукт», возможно воз-
12. Математическая модель сообщества «производители – продукт – управленцы» 87

никновение сообществ с накопленным продуктом и управленцами, т.е. сообщест-


ва «производители – продукт – управленцы».
z z
Φ2 Φ2
Γ
S O3 O4 S O4
Φ1 O3
Φ1
O1 O1
x y x y
а) б)

Рис.12.4. Фазовые портреты модели


«производители – продукт –управленцы»:
а) два устойчивых равновесия O1 и O4, области притяжения Ф1 и Ф2
которых разделены сепаратрисной поверхностью S седлового равновесия O3;
б) одно равновесие O1 устойчиво, второе – O4, став неустойчивым, породило
устойчивое периодическое движение Γ, области их (O1 и Γ) притяжения Ф1 и
Ф2 разделены сепаратрисной поверхностью S седлового равновесия O3

Сообщества «производители – продукт – управленцы» могут быть стабильны-


ми и нестабильными. Все это приводит к четырем видам фазовых портретов, изо-
браженных на рис. 12.4 и рис. 12.5. Стабильность имеет место при ∆ > 0, а неста-
бильность – при ∆ < 0 (см. (12.9)).
z z
Φ2
O4
Φ2 O4 O2 Γ
O3 O3
O2 Φ1 S
S x
Φ1 y
x y
а) б)
Рис. 12.5. Фазовые портреты такие же, как на рис. 12.4,
но устойчивое равновесие O1, в котором есть только производители,
заменилось устойчивым равновесием O2, где нет только управленцев

Нестабильное сообщество можно представить себе возникшим из соответст-


вующего стабильного, благодаря потере устойчивости состоянием равновесия О,
отвечающего сообществу «производители – продукт – управленцы», в результате
рождения от него устойчивого периодического движения Г. Периодическое дви-
жение Г может располагаться целиком выше плоскости z = 0 полного истощения
накопленного продукта, а может включать в себя участок, расположенный на
плоскости z = 0.
Модель сообщества с высоким уровнем технологии g > h(1 + δd/f ) всегда
имеет два состояния равновесия О2 и O4. Ранее устойчивое равновесие О2, отве-
88 Ю.И. Неймарк. Математическое моделирование как наука и искусство

чающее сообществу «производители – продукт», становится неустойчивым. Появ-


ляется новое состояние равновесия O4. В зависимости от знака величины ∆ оно
устойчиво или неустойчиво: первое имеет место при ∆ > 0 и второе – при ∆ < 0.
При его локальной устойчивости оно глобально устойчиво и соответствует сооб-
ществу «производители – продукт – управленцы». При смене знака величиной ∆ и
потере устойчивости состоянием равновесия из него рождается устойчивое пе-
риодическое движение Г. Его устойчивость также глобальная, и оно соответству-
ет сообществу «производители – продукт – управленцы». Как и ранее, это периоди-
ческое решение, отвечающее нестабильному автоколебательному сообществу
«производители – продукт – управленцы», располагается выше плоскости z = 0, но
может содержать части, лежащие на плоскости z = 0. Соответствующие сделан-
ному описанию фазовые портреты изображены на рис. 12.6.
z z
Φ Φ Γ
O4
O2 O2 O4

S
x y x
y
а) б)
Рис. 12.6. Фазовые портреты при высоком уровне технологии и стабильности (а)
и существенной нестабильности (б) общества,
где есть производители и управленцы
Кроме этих качественных различий, можно отметить, что устойчивое или не-
устойчивое равновесное сообщество, точнее, отвечающее ему равновесие x* ≠ 0,
y* ≠ 0, z* ≠ 0, может по-разному вести себя при неограниченном росте параметра
g: х*, у*, z* неограниченно растут, либо остаются ограниченными. Первое имеет
место при сe – lf > 0, второе – при обратном неравенстве.
Описанные выше состояния равновесия и периодические движения лежат це-
ликом в параллелепипеде, определяемом неравенствами:
0 ≤ x ≤ A, 0 ≤ y ≤ B, 0 ≤ z ≤ C,
где конечные A, B и C определяются неравенствами:
max (1, ε1/ε2) – (1 + δC)h < 0, – d – eB + f C < 0, a – bA + cC < 0,
поскольку через его стороны х = А, у = В и z = C фазовые траектории входят
внутрь него.
Определенный интерес представляют количественные значения координат х*,
у* и z* для устойчивых сообществ, отвечающие устойчивым равновесиям. Они
легко находятся для обществ производителей и производителей и продукта:
a
x∗ = , y∗ = z∗ = 0 (12.2)
b
и, соответственно,
12. Математическая модель сообщества «производители – продукт – управленцы» 89

a c( g − h ) g −h
x* = + , y∗ = 0 , z∗ = . (12.3)
b δbh δh
В случае сообщества «производители – продукт – управленцы» отыскание х*,
* *
у , z сложнее и определяется следующим образом: находим максимальный поло-
жительный корень у* уравнения
1 + ε1 y a1 + a2 y
g − h a1 − ( h a2 + k ) y = 0 , (12.4)
1 + ε 2 y 1 + δb1 + δb2 y
где
a cd ce l d e
a1 = + , a2 = − , b1 = , b2 = ,
b bf bf b f f
и затем х*, z* определяются формулами:
x * = a1 + a2 y ∗ , z ∗ = b1 + b2 y ∗ . (12.5)
При условии
 δd 
g < h 1 +  (12.6)
 f 
уравнение (12.4) имеет либо два положительных корня, либо ни одного. Слияние
корней происходит при
ε1 = K(ε2), (12.7)
и они отсутствуют при ε1 < K(ε2).
При условии
 δd 
g > h 1 +  (12.8)
 f 
уравнение (12.4) имеет один и только один положительный корень.
Устойчивость равновесия (х*, у*, z*) со всеми координатами, отличными от
нуля и где у* – максимальный корень уравнения (12.4), имеет место при выполне-
нии неравенства:
∆ = ( ey ∗ + bx ∗ ) (bBx ∗ − Afy ∗ + eBy ∗ + bex ∗ y ∗ ) −
2 2 2
(12.9)
− (bkfx ∗ y ∗ + lkfx ∗ y ∗ − cekx ∗ y ∗ ) > 0,
где
ε1 − ε 2 x∗ δ(h x ∗ + k y ∗ )
A= g , B= .
(1 + ε 2 y ∗ ) 2 1 + δ z ∗ 1 + δz∗
При убывании ∆ в момент ∆ = 0 из состояния равновесия (x*, y*, z*) рождается
устойчивый предельный цикл Г.
Подведем итоги сказанному. Они представлены на диаграмме рис. 12.7. На
ней уже указаны номера рисунков соответствующих фазовых портретов. Про-
комментируем диаграмму. При g < h в зависимости от остальных параметров воз-
можны три вида фазового портрета, представленные на рис. 12.2 и рис. 12.4,а и б.
В первом случае имеет место глобально устойчивое равновесие O1(x* > 0, y* = z* =
= 0), отвечающее сообществу производителей. Во втором случае все фазовое про-
90 Ю.И. Неймарк. Математическое моделирование как наука и искусство

странство разбивается на две части: часть Ф1 – это область притяжения устойчи-


вого равновесия O1 (x* > 0, y* = z* = 0) и часть Ф2, являющуюся областью притя-
жения либо устойчивого равновесия O4 (x* >0, у* > 0, z* > 0) (рис 12.4,а), либо ус-
тойчивого периодического движения – автоколебания – Г (рис. 12.4,б). Возникно-
вение второй области Ф2 и ее притягивающего установившегося движения при
малом g объясняется его фактическим увеличением за счет воздействия управ-
ленцев, возникновение которых стало возможным, благодаря их значительному
положительному воздействию на производительность общества. С исчезновением
этой положительной роли управленцы, а с ними и накопленный продукт, исчеза-
ют.
При среднем уровне технологии производства, когда h < g < h(1 + δd/f ), так-
же в зависимости от ε1, возможны три разных вида фазовых портретов, изобра-
женных на рис. 12.3−12.5. В случае, изображенном на рис. 12.3, имеет место со-
общество «производители и продукт». Управленцы в нем изживаются. Это если
ε1 < K. Напротив, при ε1 > K возникает сообщество, в котором, помимо производи-
телей и накопленного продукта, есть еще и управленцы. В зависимости от знака
величины ∆ сообщество стабильное или нестабильное, а его установившийся ре-
жим – состояние равновесия или автоколебание. В третьем случае – высокого
уровня технологии – появление управленцев не зависит от того, положительно
или отрицательно их воздействие на общество: они возникают, потому что произ-
водительность общества позволяет им это сделать. Возникающие варианты фазо-
вого портрета зависят от знака величины ∆ и соответствуют стабильному равно-
весному сообществу и нестабильному автоколебательному. Все фазовое про-
странство в обоих случаях является областью притяжения равновесия или автоко-
лебания, т.е. они глобально устойчивы.
Отметим, что наряду с сообществами, в которых устанавливающееся состояние
определяется только значениями параметров, возможны случаи, когда устанавли-
вающееся движение зависит еще и от начальных условий.
Разделение стабильных обществ на общества неограниченного и ограниченно-
го развития не имеет качественного характера и относится к характеру изменения
координат глобально устойчивого равновесия х*, у*, z* при g → ∞. Отметим, что
такова же роль знака величины се – l f на характер изменения средних значений
периодических функций x*(t), y*(t), z*(t), описывающих автоколебания, как это
следует из соотношений для средних значений этих функций, которые можно по-
лучить из дифференциальных уравнений модели:
a − b x ∗ (t ) − l y ∗ (t ) + cz ∗ (t ) = 0 ,
− d − e y ∗ (t ) + f z ∗ ( t ) = 0 ,
поскольку из них следует, что
~ a cd 1
x∗ = + + (ce − l f ) ~ y∗ .
b bf bf
В заключение обратим внимание на рис. 12.7. На нем указаны условия, отве-
чающие различным видам фазовых портретов, и показано, как они переходят друг
в друга с изменением параметров. Параметр g, и отчасти ε1, определяют общую
структуру сообщества. При этом можно отметить, что если при высоком уровне
12. Математическая модель сообщества «производители – продукт – управленцы» 91

технологии управленцы возникают вне зависимости от их полезности или вредно-


сти для сообщества, то при более низком уровне технологии их возникновение
имеет место только при их достаточно высокой полезности. От знака параметра ∆
зависит стабильность сообщества, т.е. является ли его предельное установившееся
движение устойчивым равновесием или автоколебанием. Наконец, важен еще па-
раметр се – l f: он определяет количественный характер развития сообщества с
ростом уровня технологии.

ε1 < k ε1 > k

g<h
g<h Рис. 12.4,а ∆ > 0;
Рис. 12.2 Рис. 12.4,б, ∆ < 0

h < g < h(1 + δd/f )


h < g < h(1 + δd/f ) Рис. 12.5,а ∆ > 0;
Рис. 12.3 Рис. 12.5б, ∆ < 0

g > h(1 + δd/f )

∆>0 ∆<0
Рис. 12.6,а Рис. 12.6,б

сe – l f > 0 сe – l f > 0
Общество Общество
ограниченного неограниченного
развития развития
Рис. 12.7. Условия, отвечающие различным видам фазовых портретов

Можно смотреть на диаграмму и фазовые картинки как на игру математиче-


ского ума и воображения, а можно и задуматься о том, какое отношение они име-
ют к многовековой истории человечества и нашей судьбе.
92 Ю.И. Неймарк. Математическое моделирование как наука и искусство

13. ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР


Линейный осциллятор – очень простая математическая модель, замечатель-
ная как по разнообразию и широте конкретных интерпретаций, так и многообра-
зию описываемых ею явлений. В механике осциллятор всюду, где есть взаимо-
действующие масса и упругость, в электродинамике − там, где есть емкости и ин-
дуктивности. В схематическом виде они представлены на рис. 13.1 и 13.2.

k
q
x
L
m C

Рис. 13.1. Грузик, удерживаемый Рис. 13.2. Электрический контур с емкостью


пружиной и индуктивностью
Линейный осциллятор описывает периодические гармонические колебания,
затухающие и нарастающие колебания разных частот, различные равновесия: ус-
тойчивые и неустойчивые, типа узла, фокуса и седла. Математической моделью
линейного осциллятора является линейное дифференциальное уравнение второго
порядка вида
&x& + 2δx& + ω2 x = 0. (13.1)
В нем всего лишь два параметра δ и ω2, его фазовое пространство двумерно.
Простейшими физическими объектами, приводящими к уравнению (13.1), яв-
ляются масса на пружинке и электрический контур из индуктивности и емкости,
изображенные на рис. 13.1 и 13.2.
Масса m может перемещаться только вдоль оси x, а сила упругости пружины
при ее растяжении на x от нерастянутого состояния x = 0 равна –kx. Минус пото-
му, что сила противоположна смещению массы m. Согласно уравнению Ньютона,
m&x& = − kx
или
k
&x& +
x =0,
m
что при δ = 0 и k/m = ω2 совпадает с (13.1).
В замкнутом контуре, включающем в себя емкость C и индуктивность L (см.
рис. 13.2 ), q – заряд конденсатора и, следовательно, I = q& – сила тока в контуре.
На обкладках конденсатора возникает напряжение q/C , а в индуктивности L –
электродвижущая сила (ЭДС), равная –LdI/dt. Опять же минус, потому что ЭДС
13. Линейный осциллятор 93

самоиндукции противоположна нарастанию тока. В силу того, что конденсатор


замкнут на индуктивность, напряжения q/C и –LdI/dt равны друг другу, т.е.
dI q
−L = ,
dt C
или, учитывая, что I = q& ,
q
q&& + = 0.
LC
Это совпадает с (13.1) при δ = 0 и ω2 = 1/LC.
В любом реальном электрическом контуре имеется омическое сопротивление
(если только мы не имеем дело с исключительным случаем сверхпроводимости).
Схема соответствующего контура, включающего сопротивление, представлена на
рис. 13.3.
R

q
Рис. 13.3. Электрический контур с конденсатором, L
индуктивностью и сопротивлением C

В этом случае ЭДС конденсатора q/C противостоит ЭДС последовательно со-


единенных индуктивности с ЭДС – LdI/dt и сопротивления с ЭДС – RI. В силу
этого имеем:
dI q
−L − RI =
dt C
или
R 1
q&& + q& + q = 0,
L LC
что совпадает с (13.1) при 2δ = R/L и ω2 = 1/LC. Аналогично и в случае массы на
пружинке может присутствовать препятствующее движению сопротивление, про-
порциональное скорости x& с коэффициентом h, и тогда
m&x& = −kx& − hx
или
h k
&x& + x& + x = 0 ,
m m
что опять приводит к уравнению линейного осциллятора (13.1) с 2δ = h/m и
ω2 = k/m.
Дифференциальное уравнение (13.1) имеет частные решения вида x = eλt, где
λ – любой из корней так называемого характеристического уравнения
λ2 +2δλ + ω2 = 0,
получаемого прямой подстановкой этого предполагаемого решения в уравнение
(13.1). Вообще, таких корней два, и общее решение, получаемое согласно прин-
ципу суперпозиции линейных динамических систем, имеет вид:
94 Ю.И. Неймарк. Математическое моделирование как наука и искусство

x = C1e λ1t + C2 e λ 2t . (13.2)


Напомним, что принцип суперпозиции применительно к осциллятору (13.1)
означает, что если x1(t) и x 2 (t ) – произвольные решения дифференциального
уравнения (13.1), то и их любая линейная комбинация C1 x1 (t ) + C2 x2 (t ) – также
решение.
Общее решение уравнения (13.1) при λ1 = λ2 , т.е. при δ2 = ω2, также можно
найти, опираясь на принцип суперпозиции. Действительно, пусть λ1 близко к λ2 и
имеется два независимых решения e λ1t и e λ 2t . Однако при λ2 → λ1 они сливаются
и остается только одно. Но можно рассмотреть решение
x = (λ1 − λ 2 ) −1 ( e λ1t − e λ 2t ) ,
которое при λ2 → λ1 не исчезает и не совпадает с e λ1t : оно равно t e λ1t . Таким об-
разом, при λ1 = λ2 = λ общее решение может быть записано в виде:
x = C1e λt + C2 te λt . (13.3)
Это простое рассуждение говорит о том, что мы можем считать λ1 ≠ λ 2 и, ес-
ли имеет место обратное, то в конечном результате следует перейти к пределу при
λ2 → λ1 .
Корни λ1 и λ2 характеристического уравнения могут быть действительными
или комплексными. В любом случае при подходящих C1 и C2 общее решение
(13.3) может удовлетворить любым начальным условиям вида:
x t =0 = x0 , x& t =0 = x1. (13.4)
Действительно, расписывая эти условия, придем к двум линейным уравнени-
ям относительно C1 и C2:
C1 + C2 = x0 , λ1C1 + λ2 C2 = x1,
откуда легко находим, что
λ x −x λ x −x
C1 = 2 0 1 , C2 = 1 0 1 ,
λ 2 − λ1 λ1 − λ 2
и поэтому соответствующее решение принимает вид:
x = (λ 2 − λ1 ) −1{(λ 2 x0 − x1 ) e λ1t − (λ1 x0 − x1 ) e λ 2t }. (13.5)
При комплексных корнях, когда
λ1,2 = − δ ± iΩ , Ω = ω2 − δ 2 , (13.6)
из (13.5) находим, что
1
x = − i Ω {[( − δ − iΩ) x0 − x1 ] e −δt (cos Ωt + i sin Ωt ) −
2
− [( − δ + iΩ) x0 − x1 ] e − δt (cos Ωt − i sin Ωt )} = (13.7)
= e − δt {x0 cos Ωt + Ω −1 ( δx0 + x1 ) sin Ωt}.
13. Линейный осциллятор 95

К этому же результату (13.7) и общему виду действительного решения при


комплексных корнях характеристического уравнения можно прийти и другим пу-
тем. Опять же в силу принципа суперпозиции, наряду с e λ1t и e λ 2t , решениями
будут и
1 λ1t
( e + e λ 2t ) = e −δt cos Ωt ,
2
и
1 λ1t
( e − e λ 2t ) = e −δt sin Ωt ,
2i
которые уже действительные. Суперпозиция этих действительных решений и дает
его общий вид.
Что же собою представляют найденные нами общие решения
x = C1e λ1t + C2 e λ 2t (13.8)
в случае действительных λ1 и λ2 и общие решения
x = e − δt (C1 cos Ωt + C2 sin Ωt ) (13.9)
при комплексных λ1 и λ2?
Нас интересуют графики x(t) и фазовые портреты, отвечающие случаям (13.8)
и (13.9). И то и другое зависит от параметров δ и ω2. Прежде всего, от этих пара-
метров зависит, какой из случаев (13.8) или (13.9) имеет место.
Для наглядности введем в рассмотрение плоскость параметров ω2 и δ
(рис. 13.4). Подчеркнем, что оба параметра δ и ω2 могут быть любого знака.
Граничному случаю, разделяющему (13.8) и (13.9), отвечает равенство
δ = ω2, которому на плоскости рис. 13.4. соответствует нанесенная на нем пара-
2

бола. Внутри этой параболы δ2 < ω2 и имеет место (13.9), вне ее δ2 > ω2 и имеет
место (13.8).
Рис. 13.4. Разбиение плоскости параметров ω2, δ линейно- δ 4
го осциллятора на области с различными корнями λ1 и λ2
характеристического уравнения: 1 − оба корня чисто 2
мнимые, 2 − комплексные с отрицательными действи- 6 1
тельными частями, 3 − комплексные с положительными 3 ω2
действительными частями, 4 − действительные отрица-
тельные, 5 − действительные положительные, 6 − дейст-
вительные разных знаков 5

Рассмотрим сначала осцилляторы, отвечающие точкам внутри параболы.


Точкам на оси δ = 0, помеченным на рис. 13.4 цифрой 1, внутри параболы отве-
чают гармонические осцилляторы
&x& + ω2 x = 0 , (13.10)
движения которых – хорошо известные гармонические колебания
x = C1 cos ωt + C2 sin ωt = A cos(ωt + ϕ), (13.11)
96 Ю.И. Неймарк. Математическое моделирование как наука и искусство

где A – амплитуда колебаний, ω – частота колебаний, а ϕ – фаза. С постоянными


C1 и C2 амплитуда A и фаза ϕ связаны соотношениями:
A sin ϕ = C1, A cos ϕ = C2,
из которых следует, что
C1
A = C12 + C22 , tgϕ =
.
C2
График гармонических колебаний представлен на рис. 13.5. На нем же пока-
заны амплитуда A, фаза ϕ и период T = 2π/ω.
x
A
Acos ϕ

t Рис. 13.5. Временной график


гармонического колебания
T=2π/ω
ϕ/ω

Из (13.11) находим параметрические уравнения фазовых траекторий в виде:


x = Acos (ωt + ϕ),
x& = −ωA sin(ωt + ϕ).
При изменении t точка (x, x& ) пробегает по часовой стрелке эллипс
x2 x& 2
+ =1.
A2 ω2 A2
Различным A отвечают разные эллипсы, что в итоге приводит к фазовому
портрету рис. 13.6.
.
x

Рис. 13.6. Фазовый портрет гармонического


x осциллятора (область 1 рис. 13.4)

Заметим, что найти фазовые траектории можно было и непосредственно, ин-


тегрируя дифференциальное уравнение (13.10) гармонического осциллятора.
Именно, умножая (13.10) на x& и интегрируя, находим, что
x& 2 ω2 x 2
+ = h,
2 2
где постоянная интегрирования h, имеющая смысл приведенной энергии осцилля-
тора, связана с амплитудой колебаний осциллятора соотношением
1
h = ω2 A2 .
2
13. Линейный осциллятор 97

Сместимся теперь в область плоскости параметров ω2, δ выше оси абсцисс, ос-
таваясь внутри параболы. В этом случае придем к тому, что согласно (13.9),
x = Ae−δt cos(ωt + ϕ). (13.12)
Это соответствует затухающим гармоническим колебаниям, изображенным
на рис. 13.7. Их период колебаний 2π/Ω несколько больше, чем период колебаний
соответствующего гармонического осциллятора, равного 2π/ω (Ω = ω2 − δ 2 ) .
При δ < 0, т.е. при смещении вниз от оси абсцисс по плоскости параметров ω2, δ
рис. 13.4, также имеет место (13.12). Однако теперь соответствующие колебания
нарастающие, как показано на рис. 13.8. Фазовые портреты в рассмотренных слу-
чаях состоят из скручивающихся (δ > 0) или раскручивающихся (δ < 0) спиралей,
представленных на рис. 13.9,а и б.
x
2π/Ω

Рис. 13.7. Экспоненциально затухающее


гармоническое колебание (область 3 рис.13.4) t

Рис. 13.8. Экспоненциально нарастающие t


гармонические колебания

2π/Ω
. .
x x

x x

а) б)
Рис. 13.9. Фазовые портреты (область 2 рис.13.4): а) для δ > 0; б) для δ < 0

Итак, мы нашли графики движения и фазовые портреты в областях 1 (δ = 0,


ω > 0), 2 (δ > 0, δ2 < ω2) и 3 (δ < 0, δ2 < ω 2), показанных на рис. 13.4.
2

Найдем еще графики изменения x и фазовые портреты для осцилляторов из


областей 4 (δ > 0, δ2 > ω2 > 0), 5 (δ < 0, δ2 > ω2 > 0) и 6 (ω2 < 0) того же рис. 13.4.
Если предшествующие случаи отвечали комплексным корням характеристическо-
го уравнения, то теперь эти корни действительные, и общее решение определяет-
98 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ся формулой (13.8). Это решение является суперпозицией двух решений x = e λ1t и


x = e λ 2t . Графики этих решений – возрастающие или убывающие экспоненты в
зависимости от знаков λ1 и λ2, что позволяет представить себе, каковы графики их
суперпозиций с любыми коэффициентами C1 и C2.
Для построения фазовых портретов построим сначала фазовые траектории
для частных решений x = e λ1t и x = e λ 2t . Пусть λ – это λ1 либо λ2, тогда парамет-
рическое уравнение фазовой траектории записывается в обоих случаях в виде
x = e λt , x& = λe λt ( −∞ < t < ∞) , (13.13)
и фазовые траектории представляют собой лучи
x& = λx ( x > 0 или x < 0) ,
пробегаемые фазовой точкой, согласно (13.13), от начала координат до бесконеч-
ности при λ > 0 или, наоборот, из бесконечности до нуля при λ < 0. Нетрудно по-
нять векторное равенство
( x, x& ) = C1 (1, λ1 )e λ1t + C2 (1, λ 2 )e λ 2t , (13.14)
непосредственно следующее из (13.13). Соответствующая ему геометрическая ин-
терпретация представлена на рис. 13.10. Она позволяет, меняя знаки и величины
C1 и C2, построить фазовый портрет.
.
x
C2(1, λ2) eλ2t

.
(x, x) Рис. 13.10. Вспомогательное построение
для получения фазового портрета узло-
C1(1, λ1) eλ1t вого состояния равновесия

x
В области 4 рис. 13.4 λ1 и λ2 отрицательны и соответствующий фазовый
портрет представлен на рис. 13.11. В области 5 λ1 и λ2 положительны, и фазовый
портрет имеет вид, показанный на рис. 13.12. В области 6 λ1 и λ2 – разных знаков,
а фазовый портрет вида, показанного на рис. 13.13.
. .
x x

x x

Рис. 13.11. Фазовый портрет Рис. 13.12. Фазовый портрет


устойчивого узла (для области 4 рис. 3.4) неустойчивого узла (для области 5 рис. 3.4)
13. Линейный осциллятор 99
.
x

Рис. 13.13. Фазовый портрет седла


(для области 6 рис. 13.4)

Таким образом, мы нашли все возможные виды фазовых портретов линейно-


го осциллятора. На всех них есть выделенная фазовая траектория, сводящаяся к
одной точке − состоянию равновесия x = 0, x& = 0. Остальные фазовые траектории
как бы расположены вокруг нее и поэтому можно говорить о различных типах со-
стояний равновесия. Они соответствуют областям 1, 2, 3, 4, 5 и 6 рис. 13.4 и назы-
ваются центром, устойчивым и неустойчивым фокусом, устойчивым и неустой-
чивым узлом и седлом. В этом перечислении выделена граница 1 между областя-
ми 2 и 3. Остальные границы оставлены без внимания. Это вызвано ее особой ро-
лью. Эта граница между экспоненциальной устойчивостью и неустойчивостью,
затухающими и нарастающими колебаниями, и этот особый граничный случай
является общим для консервативных и, в частности, гамильтоновых систем.
Фазовые портреты гармонических осцилляторов, принадлежащих этому гра-
ничному случаю, обладают очень важной для статистической механики особен-
ностью. Она проявляется, когда вместо одного осциллятора рассматривается ан-
самбль идентичных осцилляторов, каждый из которых представляется своей дви-
жущейся фазовой точкой. При этом фазовый портрет можно интерпретировать
как поток частиц, отображающих осцилляторы, или как течение фазовой жидко-
сти. Фазовые частицы с течением времени перемещаются и как-то деформируют-
ся. Если задана область фазового пространства G0 , то, спустя время t, она перей-
дет в область Gt согласно преобразованию:
 δ  x& 
x = e − δt  cos Ωt + sin Ωt  x0 + 0 sin Ωt ,
 Ω  Ω 
  δ2   δ  
x& = e −δt − x0  Ω +  sin Ωt +  − sin Ωt + cos Ωt ) x& 0  ,
  Ω  Ω  
следующему из формулы (13.7), определяющей решение x(t) через начальные ус-
ловия x0 и x1. Якобиан этого преобразования
∂x ∂x
∂x x& 0
J= 0
∂x& ∂x&
∂x0 ∂x& 0
находится после несложных вычислений и оказывается равным e −2 δt . Этот ре-
зультат означает, что при своем течении фазовая жидкость сжимается при δ > 0,
расширяется при δ < 0, и при δ = 0 ведет себя как несжимаемая. Точнее, любой
элемент фазового объема dσ0 преобразуется за время t в элемент dσt и
100 Ю.И. Неймарк. Математическое моделирование как наука и искусство

dσ t = e −2 δ t dσ 0 ,
так что e −2 δ t является коэффициентом сжатия (δ > 0) или коэффициентом растя-
жения (δ < 0) текущей фазовой жидкости. При δ = 0 этот коэффициент растяже-
ния равен единице, что соответствует течению несжимаемой жидкости.
Перечисленные выше виды фазового портрета линейного осциллятора −
центр, фокус, узел и седло – имеют место не только у равновесий линейного ос-
циллятора, но и у равновесий O(x*, y*) любых двумерных динамических систем,
описываемых дифференциальными уравнениями второго порядка
x& = X ( x, y ) , y& = Y ( x, y ) . (13.15)
Мы с этим уже сталкивались, рассматривая фазовые портреты взаимодейст-
вующих популяций, причем эти фазовые портреты имели место не на всей фазо-
вой плоскости, а только в некоторой окрестности состояния равновесия. Как и для
осциллятора, вид фазового портрета в окрестности состояния равновесия x*, y* оп-
ределяется корнями λ1 и λ2 характеристического уравнения, которое для уравне-
ния (13.15), как известно, принимает вид:
∗ ∗
 ∂X   ∂X 
  −λ  
 ∂x   ∂y  =
X (λ ) = ∗ ∗
 ∂Y   ∂Y 
    − λ
 ∂x   ∂y 
  ∂χ  ∗  ∂Y  ∗  ∗
 ∂X   ∂Y 
∗ ∗
 ∂X   ∂Y 


2
=λ −   +  
 λ +     −     =0,
  ∂x   ∂ y 
   ∂ x   ∂ y   ∂ y   ∂ x 

где звездочки означают, что производные вычисляются в точке равновесия x*, y*.
В окрестности состояния равновесия линеаризованные уравнения (13.15)
имеют вид:
∗ ∗
 ∂X   ∂X 
ξ& =   ξ +   η ,
 ∂x   ∂y 
∗ ∗
 ∂Y   ∂Y 
η& =   ξ   η ,
 ∂x   ∂y 
где ξ и η – отклонения от равновесия x*, y*, т.е. ξ = x – x* и η = y – y*.
Исключение из этих дифференциальных уравнений ξ или η приводит к
уравнению линейного осциллятора для ξ:
 * *
  * * * *
&ξ& −  ∂X  +  ∂Y   ξ& +  ∂X   ∂Y  −  ∂X   ∂Y   ξ = 0
     
 ∂x   ∂y    ∂x   ∂y   ∂y   ∂x  
или точно такому же уравнению для η.
Ниже будут приведены конкретные примеры линейных осцилляторов из всех
областей 1–6 бифуркационного портрета рис. 13.4. При этом модель линейного
осциллятора (13.1), как правило, является тем или иным приближением реальной
13. Линейный осциллятор 101

системы, очень часто приемлемой только при малых или не очень больших укло-
нениях от равновесия. Так, в линейном приближении нижнее состояние равнове-
сия маятника описывается линейным гармоническим осциллятором с состоянием
равновесия типа центр; движение вблизи верхнего равновесия – осциллятором с
неустойчивым седловым равновесием. Действительно, круговой маятник
g
ϕ
&& + sin ϕ = 0 (13.16)
l
имеет два равновесия: нижнее ϕ* = 0 и верхнее ϕ* = π. Полагая ϕ = ϕ* + x, имеем
g
&x& + sin(ϕ∗ + x ) = 0 ,
l
или
g g
&x& + sin ϕ∗ + x cos ϕ∗ + ... = 0, (13.17)
l l
где многоточие означает величины третьего и большего порядка малости относи-
тельно предполагаемого малым x. Из (13.17) при ϕ* = 0 следует
g
&x& + ω2 x = 0 , ω2 = ,
l
*
а при ϕ = π следует
&x& − ω2 x = 0 ,
как и утверждалось.
Маятник, отвечающий математической модели (13.16), мы представляем в виде
тела, подвешенного в поле силы тяжести. Но его можно представить и в виде ди-
поля в электрическом поле. Если I – момент инерции диполя длины 2l относи-
тельно центра масс, e и –e – заряды на его концах и E – напряженность однород-
ного постоянного электрического поля, то для угла ϕ отклонения диполя от на-
правления электрического поля имеет место уравнение

&& = −2le sin ϕ ,
т.е. опять же классическое уравнение маятника, а в линейном приближении при
малых отклонениях от равновесных значений ϕ = 0 и ϕ = π – линейный осцилля-
тор.
В хорошем приближении линейным осциллятором описываются малые коле-
бания лодки или другого плавающего на воде тела. Для лодки или корабля разли-
чают бортовые и килевые колебания. Каждое из них имеет свою частоту. Можно
приближенно линейным осциллятором описывать колебания струны, здания,
имея в виду его вертикальные колебания на фундаменте и боковые колебания.
Стоэтажный небоскреб колеблется так, что боковые смещения его верхней части
порядка метра.
Осциллятором можно описать упругие колебания газа в сосуде в виде резона-
тора Гельмгольца, колебания молекул в кристалле, электромагнитных волн в про-
водящей полости и многое, многое другое: колебания автомобиля, поезда, пу-
зырька воздуха в воде, разнообразных электрических контуров в радиосхемах;
колебание воды в сообщающихся сосудах; колебания жидкости в нашем вестибу-
лярном аппарате; крутильные колебания маховика на упругом валу.
102 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Во всех приведенных примерах осцилляторов имеет место рассеяние энергии


и колебания затухают, при этом δ > 0, или δ = 0, если этим затуханием можно пре-
небречь. Ниже будут приведены примеры с δ < 0, с так называемым отрицатель-
ным трением, когда, напротив, происходит подкачка энергии от некоторого ис-
точника. Кроме того, будут рассмотрены некоторые нелинейные осцилляторы,
для которых линейное описание недостаточно, а поведение существенно другое.
В заключение, как на итог всего сказанного, посмотрите на сводный
рис. 13.14. На нем изображено, как ведут себя осциллограммы изменения коорди-
наты x(t) и какой вид имеют фазовые портреты в зависимости от параметров ω2 и
δ, из разных областей бифуркационной диаграммы.

ω2

Рис. 13.14. Итоговый параметрический портрет линейного осциллятора.


В каждой из его областей изображены временные графики и фазовые портреты
14. Электромеханические аналогии. Уравнения Лагранжа − Максвелла 103

14. ЭЛЕКТРОМЕХАНИЧЕСКИЕ АНАЛОГИИ.


УРАВНЕНИЯ ЛАГРАНЖА – МАКСВЕЛЛА
Вернемся к простейшим примерам механического и электрического линей-
ных осцилляторов. Первая физическая модель описывается дифференциальным
уравнением
m&x& + hx& + kx = 0 , (14.1)
а вторая – дифференциальным уравнением
Lq&& + Rq& + (1 / C ) q = 0 . (14.2)
Модели (14.1) и (14.2) переходят друг в друга при заменах переменной x на q
( x& на q& , &x& на q&& ) и параметров m на L, h на R, k на 1/C. Поэтому если m = L,
h = R, k = 1/C и если в некоторый начальный момент времени x = q и x& = q& , то ра-
венства x = q и x& = q& будут иметь место после этого все время; x – это координата
положения массы, а q – электрический заряд конденсатора, и они при перечис-
ленных условиях будут меняться одинаково. Аналогично все время будут совпа-
дать величина скорости x& перемещения массы и электрический ток q& в контуре.
Поэтому можно говорить об аналогии массы на пружине с вязким трением и
электрического контура, состоящего из индуктивности, емкости и сопротивления.
Аналогии в том смысле, что процессы изменения совершенно разных физических
величин x и q одинаковы, если только m = L, h = R и k = 1/C. А аналогичными яв-
ляются: механические смещения и электрический заряд, скорость и ток, масса и
индуктивность, коэффициент вязкого трения и омическое сопротивление, коэф-
фициент жесткости пружины и величина, обратная емкости конденсатора.
Продолжим эту аналогию. Кинетическая энергия массы равна mx& 2 / 2 . Анало-
гом ее будет величина Lq& 2 / 2 . Это, как известно, энергия магнитного поля катуш-
ки индуктивности. Потенциальная энергия пружины − это kx& 2 / 2 , ее аналог –
q2/2C и это, как мы видели ранее, энергия электрического поля конденсатора.
Произведение k x − это сила натяжения пружины, ей отвечает величина электри-
ческого напряжения q/C конденсатора.
Мы установили аналогичность величин смещения, скорости, силы, кинетиче-
ской и потенциальной энергий соответственно заряду, току, напряжению, энергии
магнитного поля индуктивности и электрического поля конденсатора. Одновре-
менно масса m, вязкое сопротивление h и жесткость k аналогичны индуктивности
L, омическому сопротивлению R и величине, обратной емкости 1/C.
Эта аналогия относится не только к массе на пружине и электрическому кон-
туру. Она значительно шире. Чтобы в этом убедиться, представим механическую
систему и электрическую, состоящими из элементов: масс, упругостей, вязкого
сопротивления и, соответственно, индуктивности, емкостей и омического сопро-
тивления. Каждый из этих простейших элементов имеет свою математическую
модель. Укажем их. Масса m связывает ускорение &x& с силой F соотношением
104 Ю.И. Неймарк. Математическое моделирование как наука и искусство

m &x& = F. Аналогично индуктивность L связывает скорость изменения тока q&& с на-


пряжением E, так что L q&& = E. Таковы же аналогии между упругостью и емкостью,
механическим вязким и электрическим сопротивлениями. Выпишем их все:
m&x& = F ↔ Lq&& = E ,
hx& = F ↔ Rq& = E , (14.3)
kx = F ↔ q C = E.
При этом в каждой из аналогий (14.3) сила F и напряжение E имеют свой
смысл и величину. Слева – математические модели массы, вязкого сопротивления
(демпфера), упругой пружины. Справа – индуктивности, омического сопротивле-
ния, емкости.
После этого ясно, что если имеются две системы: механическая и электриче-
ская, составленные из перечисленных элементов и так, что между аналогичными
элементами возникают одинаковые связи, то и системы в целом будут аналогич-
ными. На этом основано электромеханическое аналоговое моделирование, позво-
ляющее механическую систему изучить с помощью электрической и наоборот.
Не будем пока развивать дальше эту тему и ограничимся сказанным. Проду-
майте только, что чему соответствует в этой замечательной аналогии. Еще раз
выпишем ее
x ↔ q, mv 2 2 ↔ LI 2 2, m ↔ L,
v = x& ↔ I = q& , kx 2 2 ↔ q 2 2C , k ↔ 1 C , (14.4)
F ↔ E, h ↔ R.
Перейдем теперь к трудному вопросу составления математических моделей
механических, электрических и электромеханических систем.
Для механических систем Лагранж придумал общий простой и удобный уни-
версальный способ составления их динамических математических моделей в виде
знаменитых дифференциальных уравнений Лагранжа. Вообще, это большая и
красивая теория. Вы о ней узнаете из соответствующих курсов. А сейчас, не вда-
ваясь в детали, я постараюсь вам описать алгоритм составления этих дифферен-
циальных уравнений для произвольной механической системы, положение всех
материальных точек которой определяется конечным числом скалярных величин
q1 , q2 ,…, qn , получивших наименование обобщенных координат.
Пусть сначала все силы, действующие в системе, потенциальные, т.е. для них
есть потенциальная энергия V(q1 , q2 , …, qn , t), зависящая от обобщенных коорди-
нат, и возможно, времени t. Это означает, что работа этих сил на любом вирту-
альном перемещении δq1 , δq2 , …, δqn равна уменьшению потенциальной энергии:
∂V
δA = − δV = − ∑ δqα .
α ∂qα

Далее ясно, что кинетическую энергию T системы в любой момент времени


можно выразить через обобщенные координаты q1 , q2 , …, qn и обобщенные ско-
рости q&1 , q& 2 ,..., q& n . Ведь кинетическая энергия – это сумма кинетических энергий
всех материальных точек системы, положение которых однозначно зависит от q1 ,
q2 , …, qn и t.
14. Электромеханические аналогии. Уравнения Лагранжа − Максвелла 105

Согласно Лагранжу, нужно составить функцию


L = T – V, (14.5)
с ее помощью искомые уравнения движения записываются в виде:
d ∂L ∂L
− =0 ( α = 1, 2, ..., n ). (14.6)
dt ∂q& α ∂qα
Этот очень красивый общий способ составления уравнений движения, в силу
изложенной аналогии, можно перенести на электрические системы. В свое время
это сделал Максвелл. Это можно сделать не только для электрических систем, но
и для электромеханических. Нужно лишь, в силу изложенной выше аналогии, под
кинетической энергией T понимать сумму механической кинетической энергии и
энергии магнитных полей индуктивностей, а под потенциальной энергией V –
сумму механической потенциальной энергии и энергий электрических полей ем-
костей. Под обобщенными координатами q1 , q2 , …, qn при этом понимаются лю-
бые скалярные величины, которые определяют не только механическое положе-
ние, но и все заряды, производные которых определяют все электрические токи.
Подчеркнем, что при этом в системе нет ни механических, ни электрических со-
противлений.
Поясним на очень простом примере, как возникает запись дифференциаль-
ных уравнений математической модели движения в виде уравнения Лагранжа
(14.6).
Рассмотрим уравнение Ньютона движения линейного механического осцил-
лятора
m&x& + kx = 0 (14.7)
и выполним с ним следующие преобразования:
d ∂ mx& 2 ∂ kx 2
m&x& = , kx = ,
dt ∂x& 2 ∂x 2
следовательно,
d ∂  mx& 2 kx 2  ∂  mx& 2 kx 2 
m&x& + kx =  − −  −  = 0, (14.8)
dt ∂x&  2 2  ∂x  2 2 
что по форме совпадает с уравнением Лагранжа (14.6) и при этом x – обобщенная
координата, mx& 2 / 2 – кинетическая энергия и kx2/2 – потенциальная энергия.
Аналогично к лагранжеву виду приводится и уравнение электрического ос-
циллятора:
q d ∂  Lq& 2 q 2  ∂  Lq& 2 q 2 
Lq&& + =  − −  − =0, (14.9)
C dt ∂q&  2 2C  ∂q  2 2C 
где обобщенной координатой является заряд q конденсатора, Lq& 2 / 2 – магнитная
энергия катушки индуктивности, а q2/2C – электрическая энергия конденсатора.
Эти выкладки представляются искусственными и ничего не доказывающими.
Это так и есть. Для того чтобы придать им смысл, нужно проникнуть в тайну ла-
гранжевой записи уравнений движения. А тайна их в том, что они соответствуют
некоторой вариационной задаче минимума функционала. Необходимое условие
106 Ю.И. Неймарк. Математическое моделирование как наука и искусство

минимума функционала, как известно, состоит в обращении в нуль первой его ва-
риации. Условия обращения в нуль первой вариации оказываются уравнениями
Лагранжа. Такова тайна удивительной формы и универсальности уравнений Ла-
гранжа. Но давайте не будем спешить, а сначала познакомимся еще с удивитель-
ным свойством инвариантности лагранжевой записи уравнений движения, неза-
висимости их вида от выбранных обобщенных координат, в частности, уравнений
(14.8) или (14.9). Оказывается, при любой замене переменных вида x = f (y)
(q = f (p)) вид их сохраняется, чего нет для исходных уравнений Ньютона или
Кирхгофа.
Действительно, замена переменных в дифференциальном уравнении Ньютона
(14.7) приводит его к виду:
 ∂2 f ∂f 
m  2 y& 2 + &y&  + k f ( y ) = 0, (14.10)
 ∂ y ∂ y 
отличному по форме от исходной записи (14.7). А теперь сделаем такую же заме-
ну переменных в лагранжевой записи (14.8). Нам надо убедиться, что из уравне-
ния
d ∂  mx& 2 kx 2  ∂  mx& 2 kx 2 
 − −  − =0 (14.11)
dt ∂x&  2 2  ∂x  2 2 
следует
d ∂  m (∂f ∂y ⋅ y& )2 k f 2 ( y )  ∂  m(∂f ∂y ⋅ y& )2 k f 2 ( y ) 
− − − = 0 (14.12)
dt ∂y&  2 2  ∂y  2 2 
и обратно, т.е. замена переменных в уравнении Лагранжа сводится к замене пере-
менных в функции Лагранжа (функция Лагранжа должна быть функцией прини-
маемых нами обобщенных координат и скоростей). Для этого достаточно пока-
зать, что (14.12) совпадает с (14.10), поскольку (14.10) совпадает с (14.7), а (14.7)
− с (14.11). Действительно,
d ∂  mf ′2 y& 2 kf 2  ∂  mf ′2 y& 2 kf 2  ∂f
 − −  −  = [m( f ′ &y& + f ′′ y& 2 ) + k f ] = 0

dt ∂y&  2  
2  ∂y  2 2   ∂y
и поскольку ∂f / ∂y ≠ 0 , то приходим к уравнению (14.10).
Итак, лагранжева форма записи обладает удивительным свойством инвари-
антности формы записи по отношению к замене переменных. Эта форма записи
не зависит от выбранных переменных, она инвариантна по отношению к ним. Ин-
тересно, откуда эта инвариантность? Разгадать это не просто. Но в науке очень
часто важно найти зацепку, дальше уже следует «ковырять», пока не поймешь. А
что нужно «ковырять», пожалуй, ясно: существует, по-видимому, какой-то над-
координатный подход отделения истинных движений системы среди всех мысли-
мо возможных. Ведь именно это, в конечном счете, делают дифференциальные
уравнения движения.
Не зависимая от координат вариационная формулировка законов механиче-
ского движения исторически назревала давно и имела своим истоком теологиче-
ские представления о целесообразности божественного промысла. Об этом много
14. Электромеханические аналогии. Уравнения Лагранжа − Максвелла 107

написано. Наверное, и сейчас к этому трудно прийти чисто логически. Так что не
будем лукавить и прямо скажем, в чем дело.
Возьмем интеграл по времени от функции Лагранжа от момента времени t0 до
момента t1:
t1

∫ Ldt
t0
и назовем эту величину действием. Обозначим ее через W. Распишем детальнее,
от чего зависит действие W:
t1
W = ∫ L( q1 (t ),..., qn (t ); q&1 (t ),..., q&n ; t ) dt .
t0

Оно определяется функциями qα(t) (α = 1, 2, …, n), зависящими от времени t на


промежутке от t0 до t1, т.е. является функционалом. Рассмотрим, как меняется
этот функционал при малых изменениях функции qα (t ) . Изменим функции qα (t ) ,
заменив qα (t ) на qα (t ) + δ qα (t ) , и найдем изменение действия W с точностью до
величин первого порядка малости относительно малых изменений δqα (t ) и δq& α .
Получим:
t1 t1
 ∂L ∂L  t1
 ∂L ∂L d 
δW = δ ∫ Ldt = ∫  ∑ δqα + δq& α  dt = ∫  ∑ δqα + δqα  dt =
 ∂qα ∂q& α   α ∂qα ∂q& α dt 
t0 t0   t0
t
∂L t1
1
d ∂L   ∂L
=∑ δqα | + ∫ ∑  ∂q δqα dt .

α ∂q
&α t0
αt α dt ∂q& α 
0
Последнее действие в этих вычислениях состоит в интегрировании по частям.
В результате мы с удивлением обнаруживаем, что под интегралом стоят выраже-
ния
∂L d ∂L
− , (14.13)
∂qα dt ∂q& α
обращение которых в нуль как раз и есть уравнения Лагранжа. Что же нужно по-
требовать, чтобы они обратились в нуль? Какое предположение в отношении дей-
ствия W приведет к такому выводу? Догадаться не очень трудно. Потребуем, что-
бы
δW = 0
при условии, что изменений функций qα (t ) на концах не происходит и поэтому
δqα = 0 при t = t0 и t = t1 . Действительно, из этих предположений следует, что
t1
  ∂L d∂L  
∫ ∑ 
α  ∂qα
− δqα  dt = 0
dt∂q& α 
(14.14)
 t0 
для произвольных δqα (α = 1, ... , n), обращающихся в нуль при t = t0 и t = t1 . Это
влечет, как нетрудно понять, обращение в нуль всех выражений (14.13) и имеет
место только благодаря произвольности δqα , которые в силу этого можно, в част-
ности, выбрать равными
108 Ю.И. Неймарк. Математическое моделирование как наука и искусство

 ∂L d ∂L  2
δqα =  −  ε (t ) ,

 αq dt ∂q& α
2
где ε (t ) обращается в нуль только на концах замкнутого интервала [t0 , t1 ] . Для
таких вариаций функций qα (t ) из (14.14) следует, что
t1  ∂L d ∂L  2 
∫ ∑ 
 ∂qα

dt ∂q& α
  ε 2 (t )dt = 0 ,
 
(14.15)
t0  α 
и если бы при каком-либо значении t внутри промежутка [t0 , t 1] одно из выраже-
ний (14.13) было отлично от нуля, то и интеграл (14.13) был бы положительным,
отличным от нуля.
Итак, уравнения Лагранжа эквивалентны требованию
δW = 0 (14.16)
при любых вариациях функций qα (t ) , при которых не меняются их значения при
t = t0 и t = t1 .
Это и есть желанная вариационная формулировка принципа отбора истинно-
го движения от всех мыслимо возможных. Истинное движение за время от t0 до t1
от начальной точки qα = qα0 до конечной qα = q1α выделяется из всех мыслимых
тем, что для него вариация действия равна нулю.
Можно показать, что при этом на истинном движении не только достигается
равенство нулю первой вариации, но действие на нем достигает минимума. Но
нам достаточно и того, что мы узнали: мы пришли к формулировке закона движе-
ния, не зависящей от выбираемых переменных, от того, как конкретно мы его
описываем. Из этой независимости и следует инвариантность лагранжевой записи
уравнений движения.
Вместе с тем мы обнаружили, что в качестве математической модели могут
выступать не только дифференциальные уравнения движения, но и, пожалуй, бо-
лее общие вариационные принципы. Более общие, потому что они не зависят от
координатного описания. Они как бы над ним. Повторим еще раз, в чем же состо-
ит эта вариационная математическая модель.
В основе ее уже не лежит пространство состояний, ее основа − пространство
положений, конфигураций, пространство переменных q1, …, qn. Для механической
системы – это положение всех ее материальных точек. Для электрических, тех, о
которых речь шла выше, − это электрические заряды, производные по времени от
которых − электрические токи.
Движение в вариационном принципе определяется не начальным состоянием,
а исходным и конечным положениями. Во всяком случае, они предполагаются как
бы заданными или фиксированными. А сам рассматриваемый нами вариационный
принцип состоит в том, что действительное движение от заданной начальной точ-
ки к конечной выделяется тем, что для него вариация действия равна нулю.
Можно смотреть на это, как на математический прием новой формы записи
дифференциальных уравнений движения, можно видеть в этом новый принцип.
Он так и называется принципом наименьшего действия, открытие которого при-
14. Электромеханические аналогии. Уравнения Лагранжа − Максвелла 109

надлежит Гамильтону. Это принцип некоей целесообразности, по идее иной, чем


принцип детерминизма. Вообще говоря, из принципа целесообразности не следу-
ет принцип детерминизма, но конкретно, применительно к законам природы, пока
это всегда так. Это и делает обе точки зрения совместимыми, дополняющими
друг друга.
Теперь я хочу привести вам несколько примеров применения уравнений
Лагранжа – Максвелла. Они убедят вас в их эффективности, в том числе и в слу-
чаях, когда вы не знаете даже, как подступиться к составлению математической
модели.
В качестве первого примера возьмем обычный круговой маятник. Для него
кинетическая энергия равна Jϕ& 2 / 2 , а потенциальная равна mgl cos ϕ , где ϕ – угол
отклонения маятника от вертикали, J и m – момент инерции и масса маятника, l –
расстояние от точки подвеса до центра масс. Поэтому функция Лагранжа равна
Jϕ& 2
L= + mgl cos ϕ .
2
После чего легко находим, что
d ∂L ∂L
− = Jϕ&& + mgl sin ϕ = 0 .
dt ∂ϕ& ∂ϕ
Теперь пусть маятник не круговой, а параболический, т.е. масса m может дви-
гаться по расположенной в вертикальной плоскости параболе z = ax2 (рис. 14.1). В
этом случае
mv 2 m( x& 2 + y& 2 ) m
T= = = (1 + 4a 2 x 2 ) x& 2 ,
2 2 2
V = mgz = mgax 2
и
d ∂L ∂L
− = m(1 + 4a 2 x 2 ) &x& + 2mgax = 0 .
dt ∂x& ∂x
Наконец, пусть материальная точка массы m движется в вертикальной плос-
кости Oxz (рис. 14.2) по произвольной кривой, уравнение которой запишем в па-
раметрическом виде:
x = x(s), z = z(s),
где параметр s – длина дуги кривой, отсчитываемая от некоторой точки O.
z
z O
S
m
(x, z)

x
mg x
mg
Рис. 14.1. Параболический Рис. 14.2. Иллюстрация к движению
математический маятник материальной точки по произвольной гладкой
плоской кривой в поле силы тяжести
110 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Непосредственно находим, что


ms& 2
L= + mgz ( s ) ,
2
и поэтому
d ∂L ∂L
− = m&s& + mgz ′( s ) = 0 .
dt ∂s& ∂s
Возьмем электрический контур, состоящий из индуктивности L и емкости C.
При этом
Lq& 2 q 2
L= − ,
2 2C
и поэтому
d ∂L ∂L q
− = Lq&& + = 0,
dt ∂q& ∂q C
что нам хорошо известно.
Усложним задачу, предположив, что внутри катушки индуктивность может
качаться подвешенный на пружине железный стержень массы m, так что ее ин-
дуктивность L зависит от отклонения x стержня от его равновесного положения
x = 0 (рис. 14.3).

K
m
x
q
L(x) Рис. 14.3. Взаимодействующие между собой
механический и электрический осцилляторы
C

Эта система довольно сложна. Она состоит из двух осцилляторов (замкнутого


контура, состоящего из индуктивности и емкости, и массы m, подвешенной на
пружине), которые взаимодействуют друг с другом. Движение стержня меняет
магнитное поле катушки индуктивности, вызывая в ней ЭДС индукции, а меняю-
щееся магнитное поле катушки индуктивности воздействует на железный сердеч-
ник. Для того чтобы написать уравнения движений этих осцилляторов, нужно
найти индуцируемую в катушке индуктивности движением стержня ЭДС и ме-
няющуюся силу воздействия магнитного поля катушки индуктивности на нахо-
дящийся в ней железный стержень. Это для математика не так уж просто. А напи-
сать функцию Лагранжа – Максвелла очень легко.
Помимо координаты x, введем еще заряд конденсатора q, тогда
L( x ) q& 2 mx& 2 q 2 kx 2
L= + − −
2 2 2C 2
и приходим к двум уравнениям для координат x и q как функций времени:
14. Электромеханические аналогии. Уравнения Лагранжа − Максвелла 111

d ∂L ∂L 1
− = m&x& − L′( x ) q& 2 + kx = 0 ,
dt ∂x& ∂x 2
d ∂L ∂L q
− = L( x ) q&& + L′( x ) x&q& + = 0.
dt ∂q& ∂q C
Из этих уравнений, как и следовало ожидать, вытекает закон сохранения
энергии в виде:
L( x ) q& 2 mx& 2 q 2 kx 2
+ + + = h = const .
2 2 2C 2
Получается это соотношение умножением первого уравнения на x& , второго на q& ,
затем их сложения и интегрирования.
Перепишем найденные выше уравнения Лагранжа – Максвелла в виде:
1
m&x& + kx = L′q& 2 ,
2
q
Lq&& + = − L′x&q& .
C
При L' = 0 они распадаются на два независимых осциллятора − механический
и электрический. Их взаимодействие тем сильнее, чем больше L'. При L' ≠ 0 элек-
трический осциллятор действует на массу механического с силой L′q& 2 / 2 , а меха-
нический осциллятор наводит в электрическом контуре ЭДС индукции, равную
− L′x&q&.
Вы, вероятно, уже заметили, что во всех приведенных примерах отсутствуют
механические и электрические сопротивления. Это потому, что уравнения Ла-
гранжа предполагают потенциальность действующих сил. При независимости по-
тенциальной функции от времени из этого следует, как и в рассмотренном приме-
ре, закон сохранения энергии.
При непотенциальных силах и, в частности, при наличии вязких трений и
омических сопротивлений, энергия не сохраняется и уравнения Лагранжа не при-
менимы. Но их можно обобщить. Это несложно. Нужно только исходить не из по-
тенциальной энергии действующих сил и энергии электрического поля, а из вы-
ражения элементарной работы δA. При наличии потенциальной энергии V эле-
ментарная работа δA запишется:
∂V
δ A = −δV = − ∑ δqα . (14.17)
∂qα
В общем же случае (точнее, более общем)
δ A = ∑ Qα δqα , (14.18)
т.е. производные –∂V/∂qα заменяются на величины Qα , называемые обобщенными
силами. К этой формальной замене, как оказывается, сводится обобщение уравне-
ний Лагранжа. Запишем уравнения Лагранжа в виде:
d ∂T ∂T ∂V
− =− .
dt ∂q& α ∂qα ∂qα
112 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Их обобщение будет
d ∂T ∂T
− = Qα . (14.19)
dt ∂q& α ∂qα
Заметим еще, что, разделяя потенциальные и непотенциальные силы, можно
уравнение Лагранжа записать в виде:
d ∂T ∂T ∂V
− =− + Qα
dt ∂q& α ∂qα ∂qα
или
d ∂L ∂L
− = Qα , (14.20)
dt ∂q& α ∂qα
где по-прежнему L = T – V, но V относится только к потенциальным силам, а не-
потенциальные силы представлены обобщенными силами Qα .
Проиллюстрируем сначала уравнения (14.19) и (14.20) очень простым приме-
ром массы на пружине при наличии вязкого трения. В этом случае кинетическая
энергия T равна mx& 2 / 2 . Сил, совершающих работу при виртуальном изменении x,
две – сила упругости –kx и сила трения − hx& . Их работа на перемещении δx равна
δA = −kx δx − hx& δx,
поэтому соответствующая координате x обобщенная сила (в данном случае про-
сто сила) равна
Q = kx − hx& .
Уравнение Лагранжа (14.19) принимает вид:
m &x& = –kx – h x& .
Составляя уравнения движения в форме (14.20), потенциальную силу жестко-
сти относим к функции Лагранжа L, равной
mx& 2 kx 2
L= − ,
2 2
а обобщенная сила вязкого трения Q будет − hx& . В силу этого уравнение (14.20)
принимает вид:
d ∂  mx& 2 kx 2  ∂  mx& 2 kx 2 
 − −  −  = −h x&
dt ∂x&  2 2  ∂x  2 2 
или
m&x& + kx = − hx& .
Для электрического контура из индуктивности, емкости и омического сопро-
тивления все аналогично, так как работа диссипативных сил омического сопро-
тивления при переносе заряда δq равна − Rq& δq .
15. Часы Галилея − Гюйгенса 113

15. ЧАСЫ ГАЛИЛЕЯ – ГЮЙГЕНСА


Исчисление времени – древнейшая проблема человечества. Миллионы лет,
столетия, годы, месяцы, сутки, часы, минуты, секунды и кратчайшие ее доли –
наносекунды – это те разнообразные масштабы, в которых для разных целей нау-
чился измерять время человек. Первоначальное измерение времени основывалось
на обращении Земли вокруг Солнца и ее собственном вращении. Знаки Зодиака
указывали времена года, а Солнце днем и звезды ночью – время суток.
Вызванная мореплаванием потребность определения местоположения кораб-
ля потребовала точного измерения времени суток. Широта определялась только
по астрономическим наблюдениям. Для определения долготы требовалось еще и
точное знание времени. Определение местоположения по долготе с точностью в
один километр соответствует ошибке в отсчете времени примерно в три секунды.
А плавать приходилось, не имея возможности откорректировать показания кора-
бельных часов, месяц и более.
В XVII веке английское адмиралтейство объявило конкурс на создание точ-
ных часов. Такие часы были сконструированы и изготовлены Х. Гюйгенсом. Это
были первые маятниковые часы – часы, в которых для отсчета времени использо-
вались колебания маятника. Галилей изучил колебания маятника, установил не-
изменность периода их колебаний (при малых отклонениях маятника изменения
частоты его колебаний Галилей заметить не мог). Гюйгенс создал часы на этой
основе. Поэтому эти новые часы можно назвать часами Галилея – Гюйгенса. До
Галилея и Гюйгенса были часы, использующие колебания балансира, однако этот
балансир не имел собственной частоты колебаний, его частота колебаний зависе-
ла и определялась прилагаемыми к нему усилиями часового механизма.
Использование в часах устройства с собственной частотой колебаний оказа-
лось необычайно плодотворным и привело к серии разнообразных конструкций
все более и более точных часов, использующих этот принцип: часы с балансиром
на пружинке с цилиндрическим, анкерным и хронометровым ходами; кварцевые
часы, использующие собственные упругие колебания кварцевой пластинки; часы,
использующие электрический колебательный контур с собственной частотой и,
наконец, феноменально точные молекулярные и атомные часы, позволяющие об-
наружить и измерить неравномерность вращения Земли [11].
Для того чтобы колеблющийся маятник сделать часами, нужно считать его
колебания и показывать их число, например, стрелкой на циферблате в соответст-
вующем масштабе. Кроме того, нужно поддерживать его колебания, которые са-
ми по себе затухают. Необходимо затухающие колебания маятника превратить в
незатухающие автоколебания.
Обе эти задачи успешно решает так называемый часовой ход, простейший
вариант которого схематически изображен на рис. 15.1. После каждого колебания
маятника туда и обратно храповик под влиянием заведенной пружины или опус-
кающегося груза поворачивается на один зубец и одновременно сообщает маят-
нику подталкивающий импульс. Тем самым скорость вращения храпового колеса
114 Ю.И. Неймарк. Математическое моделирование как наука и искусство

определяется частотой колебаний маятника, а его зубцы в момент его поворота


подталкивают маятник, поддерживая его колебания.

Рис. 15.1. Схематическое изображение


ходового механизма часов

Точность хода часов с таким устройством определяется стабильностью коле-


баний маятника. Период колебаний маятника зависит от многих причин, и каждая
из них может повлечь его изменение. Основными факторами, определяющими
период колебаний маятника, являются его длина, масса, момент инерции, сопро-
тивление среды и трение в точке подвеса, величина ускорения силы тяжести, уда-
ры храпового колеса, а также амплитуда его колебаний.
Рассмотрим сначала зависимость периода колебаний маятника от его ампли-
туды. Запишем уравнение колебаний маятника в виде

&& + mgl sin ϕ = 0 , (15.1)
где J – момент инерции маятника, m и l – масса и длина (расстояние от оси подве-
са до центра масс). Введя обозначение ω2 = mgl/J, умножая уравнение (15.1) на ϕ&
и интегрируя, найдем, что
ϕ& 2
− ω2 cos ϕ = h , (15.2)
2
где h – константа интегрирования. Полагая угловую амплитуду маятника равной
α, имеем, что при ϕ = α ϕ& = 0. Выражаем, согласно (15.2), константу интегриро-
вания через α и (15.2) записываем в виде:
ϕ& 2
− ω2 cos ϕ = − ω2 cos α
2
или
ϕ& = ω 2(cos ϕ − cos α) . (15.3)
Из уравнения (15.3) следует, что

= dt . (15.4)
ω 2(cos ϕ − cos α)
Пусть период колебания маятника при амплитуде α равен T. Тогда при изме-
нении угла отклонения маятника от нуля до α пройдет четверть периода и, со-
гласно (15.4), найдем, что
α
T dϕ
=∫ .
4 0 ω 2(cos ϕ − cos α)
15. Часы Галилея − Гюйгенса 115

Этот интеграл не вычисляется в элементарных функциях. Он может быть


найден численно. При малых α, что нас устраивает, можно найти его разложение
в ряд по параметру α. Если ограничиться точностью до α2, то это представление
находится следующим образом:
−1 / 2
  ϕ 2 ϕ 4   α2 α4  
[2(cos ϕ − cos α)] −1 / 2

=  2  1 − + − ...  − 1 − + − ...   =
  2 24   2 24  
−1 / 2
2 −1 / 2  ϕ2 + α2   ϕ2 + α2 
2
= (α − ϕ ) 1 −
 + ...  = ( α 2 − ϕ 2 ) −1 / 2 1 + + ...  ,
 12   24 
и поэтому
α
4  ϕ2 + α2  dϕ
T= ∫ 1 +
ω 0  24
+ ... 
 2
 α −ϕ
2

или после подстановки ϕ = α sin θ


π/2
4  α 2 (1 + sin 2 θ)  2π  α2 
T=
ω ∫ 
 1 +
24
+ ... 


d θ = 1 +

ω  16
+ ...  .

(15.5)
0

О точности этой формулы можно судить по графику на рис. 15.2 , где сплош-
ной кривой изображена численно определенная величина, стоящая в скобках пра-
вой части формулы (15.5), т.е. ωT/2π, и пунктиром − график первых двух членов
этой скобки, т.е. 1 + α2/16. Из них видно, что при α < π /2 эти графики на рисунке
неразличимы.
T/T0

Рис. 15.2. График зависимости периода T 1


колебаний маятника от его амплитуды

0 π/2 α
Из самой формулы (15.5) видно, что при малых амплитудах α изменение пе-
риода колебаний маятника невелико. Так, при α ≤ 0,1 изменение периода не более
чем 0,7%. А изменение периода T при изменении амплитуды α на ∆α таково, что
dT α∆α
≈ .
T 8
При α = 0,1 и требуемой точности dT/T = 10–5 ∆α не должно превосходить
4 ·10–4, т.е. требуется очень маленькая амплитуда колебаний маятника. В связи с
этим в свое время задумывались, нельзя ли сделать маятник, у которого период
колебаний не зависел бы от амплитуды. Такой маятник был придуман. Его идея
состояла в том, чтобы маятник качался не по окружности, а по какой-нибудь дру-
116 Ю.И. Неймарк. Математическое моделирование как наука и искусство

гой кривой, чего можно достичь, как это показано на рис. 15.3 , где П – гибкая
пластинка, а H – ограничивающие ее движение направляющие. При этом линия L,
направленная вдоль подвеса маятника, все время касается направляющей H.
Пусть искомая кривая, по которой должен качаться маятник (материальная
точка массы m), имеет уравнение
x = x (s ) , y = y (s ) , (15.6)
где s – длина дуги, отсчитываемая от нижней точки кривой (рис. 15.4).

H H y
П

m
S
L S=0 x
mg
Рис. 15.3. Ограничивающее препятствие H, Рис. 15.4. Иллюстрация к поиску кривой,
позволяющее изменить траекторию по которой должен качаться маятник,
колебаний маятника чтобы его период колебаний не зависел
от амплитуды
Составим уравнения движения массы m. Находим функцию Лагранжа
m
L = s& 2 − mgy ( s ).
2
Откуда
m &s& + m g y ′( s ) = 0 . (15.7)
Решение этого уравнения будет периодическим с периодом, не зависящим от
начальных условий, а следовательно, и амплитуды, если оно совпадает с уравне-
нием линейного гармонического осциллятора, т.е. когда
g y ′( s ) = ω2 s (15.8)
при произвольном ω. Решая это уравнение, находим, что
ω2 2
y=s , (15.9)
2g
где произвольная постоянная отсутствует, так как, согласно рис. 15.3, при s = 0
y = 0.
Осталось найти функцию x(s). Это легко сделать, исходя из соотношения
dx 2 + dy 2 = ds 2
или
2 2
 dx   dy 
  +   = 1. (15.10)
 ds   ds 
Из (15.9) и (15.10) находим, что
15. Часы Галилея − Гюйгенса 117

2
dx  ω2 
= 1 −   s 2 (15.11)
ds  2g 
или
2
 ω2  2
x=∫ 1 −   s ds = ∫ 1 − a 2 s 2 ds . (15.12)
 2g 
Используя замену s = a–1sin ϕ, вычисляем интеграл (15.12) и, учитывая (15.9),
приходим к параметрическим уравнениям искомой кривой:
g g 2g
x= 2
ϕ + 2 sin 2ϕ , y = 2 sin 2 ϕ . (15.13)
2ω 4ω ω
Это хорошо известная циклоида, ее вид показан на рис. 15.5. Она отличается
от окружности тем, что поднимается вверх от точки x = y = 0 все быстрее и быст-
рее, чем окружность, тем самым ускоряется скатывание по ней маятника при уве-
личении его отклонения. Это отличие, естественно, при малых ϕ невелико, как
невелико и отличие уравнения колебаний кругового маятника от уравнения ли-
нейного гармонического осциллятора, т.е. как отличие sin ϕ от ϕ.
y

Рис. 15.5. Сопоставление траекторий


движения кругового и циклоидального
маятника (пунктирная кривая)
x

Мы рассмотрели зависимость периода колебаний маятника от его амплитуды


колебаний, оценили влияние изменения амплитуды на точность хода часов и об-
наружили, что от этой зависимости и возможной причины уменьшения точности
хода часов можно избавиться, если круговой маятник заменить циклоидным. Од-
нако изменение амплитуды далеко не единственная причина, от которой зависит
точность хода часов. У маятника может меняться длина, при значительных пере-
мещениях часов может меняться ускорение силы тяжести. Мы никак не учли на-
личие трения, вязкого и сухого. Нестабильность периода может внести и меха-
низм подталкивания маятника, поддерживающий его колебания.
Таким образом, нестабильность и потеря точности хода часов могут возник-
нуть от многих причин, и если мы хотим создать точные часы, то нам надлежит
изучить все эти факторы нестабильности, оценить их величину и найти пути уст-
ранения.
Все эти факторы нестабильности в силу их малости можно изучить раздель-
но, независимо друг от друга, учитывая не все вместе, а каждое отдельно. Это
значительное упрощение можно обосновать следующим образом. Период колеба-
ний T является функцией многих параметров часового механизма u1 , u2 ,…, um , так
что
T = T (u1 , u2 , ..., um ) .
118 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Пусть u1* , u2* , ..., um* – номинальные значения параметров, а их возможные из-
менения – δu1 , δu2 , …, δum . Тогда с точностью до этих малых изменений
* * *
 ∂T   ∂T   ∂T 
δT =   δu1 +   δu2 + ... +   δum ,
 ∂u1   ∂u2   ∂um 
где производные от функции T вычисляются при номинальных значениях пара-
метров, т.е. производная ∂T ∂u s вычисляется в предположении отсутствия зави-
симости от остальных параметров u1* , u2* , ..., um* , кроме us* .
В силу этого с принимаемой точностью зависимость от длины, вязкого тре-
ния и ускорения силы тяжести можно вычислить, исходя из упрощенной модели
колебаний маятника, не учитывающей зависимость его периода от амплитуды,
т.е. из уравнения линейного осциллятора
&& + 2δϕ& + ω2 ϕ = 0  ω2 =
mgl 
ϕ , (15.14)
 J 
период колебаний которого равен

T= . (15.15)
ω2 − δ
Ради простоты примем, что основная масса маятника сосредоточена в одном
месте. Тогда J = ml 2 и (15.15) принимает вид:
2π l  1 lδ 2 
T= = 2π 1 + + ... ,
g l − δ2 g  2 g 

из которого находим оценку
dT 1 dl 1 dg lδ dδ
= − + . (15.16)
T 2 l 2 g g
Эта оценка указывает на сильную зависимость точности хода от изменений
длины и силы тяжести, а также от вязкого трения, если оно не очень мало.
Длина маятника меняется в основном под влиянием изменения температуры.
Поэтому этот факт потери точности хода часов можно устранить, поддерживая
окружающую температуру постоянной. Но есть и другой способ поддержания по-
стоянства l, несмотря на изменение температуры. Он состоит в особой конструк-
ции маятника, показанной на рис. 15.6. При увеличении температуры длины l1 и l2
увеличиваются на δl1 и δl2, а длина маятника увеличивается при этом на δl1 – δl2.
Стержни длин l1 и l2 изготовлены из разных материалов с коэффициентами тепло-
вого расширения α1 и α2 , подобранными так, чтобы величина удлинения, равная
δ l = δ l1 − δ l2 = ( α1l1 − α 2 l2 )δT ,
где δT – изменение температуры, равнялась нулю, т.е. так, чтобы α1l1 – α2 l2 = 0.
С зависимостью от ускорения силы тяжести, если часы значительно меняют
свое местонахождение, например, находясь на корабле, вроде бы ничего сделать
нельзя. Можно лишь скомпенсировать ее соответствующими вычислительными
15. Часы Галилея − Гюйгенса 119

поправками или заменить маятник часов балансиром на пружинке, что спустя не-
которое время и было сделано: часы Гюйгенса сменил корабельный хронометр.
Оценим еще влияние сухого трения. Для этого, согласно сказанному, можно
ограничиться рассмотрением модели
&& + ω 2 ϕ = − f sign ϕ& ,
ϕ (15.17)
где f – параметр, отражающий наличие сухого кулоновского трения. Как мы сей-
час увидим, сухое трение приводит к затуханиям колебаний, но их период не ме-
няется. Действительно, на каждом полупериоде колебаний ϕ& не меняет знака и
поэтому, например, при ϕ& > 0 (15.17) записывается в виде
&& + ω 2 ϕ = − f
ϕ
или, после замены ϕ на ϕ − f /ω2, в виде
&& + ω 2 ϕ = 0 ,
ϕ
где явная зависимость от трения f исчезла, т.е. ее нет.
Перейдем к рассмотрению механизма поддержания колебаний маятника и его
влияния на стабильность хода часов.
Часовые ходы весьма различны по конструкции (цилиндрический ход, анкер-
ный, хронометровый и др.), и их точное описание довольно сложно. Примем
идеализированную схему часового хода, считая, что он осуществляет подталкива-
ние при угле ϕ = α ( ϕ& > 0), сообщая маятнику импульс p, а вне этого подталки-
вающего импульса движение маятника подчиняется уравнению
&& + 2δϕ&& + ω2 ϕ = 0 .
ϕ (15.18)
Толчок происходит при ϕ = α и ϕ& > 0, и в результате его скорость ϕ& мгно-
венно возрастает на величину p. Так, что
ϕ& + = ϕ& − + p , (15.19)
где ϕ& − – доударная угловая скорость, а ϕ& + – послеударная. Угол ϕ при этом из-
мениться не успевает. Нарисуем фазовую траекторию, отвечающую одному коле-
банию от точки ϕ = α снова к ϕ = α. Пусть начальная точка M0 , а M1 – точка по-
вторного значения ϕ = α при условии, что движение происходит в соответствии с
дифференциальным уравнением (15.18). В момент прихода в точку M1 происхо-
дит передача импульса p и точка M1 перемещается вверх вдоль оси ϕ& на расстоя-
ние p (рис. 15.7 ) в точку M2 .
. M0
ϕ
M2
P
l1 M1
m α ϕ
l2

Рис. 15.6. Схема устройства подвеса Рис. 15.7. Фазовая траектория часов и способ
маятника, делающего его длину ее изучения путем сведения к точечному
не зависящей от температуры отображению точки M0 в точку M2
120 Ю.И. Неймарк. Математическое моделирование как наука и искусство

После этого весь описанный цикл повторяется (за исключением случая, когда
выходящая из точки M2 фазовая траектория больше не пересекает линии ϕ = α).
Найдем аналитические зависимости описанного движения от фазовой точки
M0 к M1 и затем к M2 . Пусть точки M0 , M1 и M2 имеют координаты ϕ0 = α и ϕ& 0 ,
ϕ1 = α и ϕ& 1 , ϕ2 = α и ϕ& 2 . Точки M0 и M1 связаны, согласно (13.7), зависимостями:
 ϕ& + δϕ0 
ϕ1 = e − δτ  ϕ 0 cos Ωτ + 0 sin Ωτ  ,
 Ω 
(15.20)
  ϕ& + δϕ 0  
ϕ& 1 = e − δτ  − δ ϕ 0 cos Ωτ + 0 sin Ωτ  − Ωϕ 0 sin Ωτ + (ϕ& 0 + δϕ 0 )cos Ωτ ,
  Ω  
где τ – время движения от точки M0 до M1, а Ω = ω2 − δ 2 . Для точек M1 и M2 , со-
гласно (15.19),
ϕ 2 = ϕ1 , ϕ& 2 = ϕ& 1 + p . (15.21)
При этом следует еще иметь в виду, что
ϕ 0 = ϕ1 = ϕ 2 = α . (15.22)
Из (15.20)−(15.22), вводя обозначения ϕ& 0 = u и ϕ& 2 = u , находим, что
 u + δα 
α = e − δτ  α cos Ωτ + sin Ωτ  ,
 Ω 
(15.23)
 − δτ u + δα − Ω 2 α 
u = p + e  u cos Ωτ + sin Ωτ  .
 Ω 
Первое соотношение (15.23) определяет время τ в зависимости от u , а второе по-
зволяет найти u .
Анализ этих уравнений достаточно сложен, но при α = 0 он существенно уп-
рощается, так как в этом случае формулы (15.23) принимают вид:
sin Ωτ = 0 (u ≠ 0) , u = e − δτu cos Ωτ + p ,
из которого следует, что τ = 2 π / Ω (взят второй по величине положительный ко-
рень первого уравнения, так как для первого корня соответствующее ϕ& 1 < 0 , это
же следует из рис. 15.7) и что
u = e −2 πδ / Ω u + p . (15.24)
Прежде чем проанализировать этот необычайно простой результат, покажем,
что именно он в первую очередь достоин внимания. Дело в том, что именно при
α = 0 исчезает зависимость периода колебаний τ от скорости u. Он постоянен и
равен 2π/ω. Напротив, при α ≠ 0 такая зависимость есть и следует из уравнений
(15.23). Действительно, дифференцируя по u первое уравнение (15.23), находим,
что
dτ  u + δα 
0 = −e −δτ  α cos Ωτ + sin Ωτ  +
du  Ω 
15. Часы Галилея − Гюйгенса 121

 dτ 1 dτ 
+ e − δτ  − αΩ sin Ωτ + sin Ωτ + (u + δα) cos Ωτ  ,
 du Ω du 
откуда
dτ sin Ωτ
=
du Ω [( α − u − δα) cos Ωτ + ((u + δα) Ω + αΩ) sin Ωτ]
и, следовательно, dτ/du не обращается в нуль, поскольку τ отлично от 2π/ω.
Этот же факт можно обнаружить и непосредственно из вида фазовой траек-
тории (рис. 15.7), причем из него видно, что τ > 2π/ω, так как на нем α > 0. Напро-
тив, при α < 0 видно, что τ < 2π/ω. Сказанное становится очевидным, если заме-
тить, что любой луч ϕ& = aϕ любая фазовая траектория повторно пересекает через
одно и то же время 2π/ω.
Вернемся к найденному ранее соотношению (15.24), определяющему связь
между последовательными угловыми скоростями, с которыми после подталкива-
ния маятник проходит через вертикальное равновесное положение. Этому соот-
ношению, связи между u и u , можно придать очень простую, полезную во мно-
гих случаях геометрическую интерпретацию. Возьмем прямоугольную систему
координат, откладывая на ее осях u и u , и построим в ней график зависимости
(15.24) (рис. 15.8). Дополним его биссектрисой и найдем по u u и затем перене-
сем его снова на ось u, как показано на том же рисунке.
−u

Рис.15.8. Диаграмма Ламерея для часов Галилея – Гюйгенса:


u*– устойчивая неподвижная точка, соответствующая
автоколебаниям часов; u, u , u , … – последовательные
приближения к точке u*
u −u −u u* u
Повторяя это построение, найдем последовательно u , u и т.д. Из него видно, что
последовательные точки u, u , u , … стремятся к точке u*, отвечающей пересече-
нию кривой (15.24) с биссектрисой. Само же значение u* переходит в себя, по-
скольку u ∗ = u*, и, следовательно, согласно (15.24),
u* = e−2πδ/Ω u* + p
и
p
u∗ = .−2πδ / Ω
(15.25)
1− e
Таким образом, при подталкивающих ударах, сообщающих маятнику посто-
янный импульс при прохождении им состояния равновесия, его колебания асим-
птотически приближаются к периодическим с периодом 2π/ω и амплитудой по
скорости, равной u*. Тем самым затухающие колебания маятника превращаются в
автоколебания. Достигается это с помощью механизма – часового хода, осущест-
вляющего обратную связь, полнее – управления движением маятника с помощью
обратной связи. Общая идея управления и обратной связи имеют в науке и техни-
122 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ке огромное значение. Мы еще не раз с ней столкнемся, а сейчас ограничимся


объяснением, в чем же состоит управление и почему оно реализуется с помощью
обратной связи.
Управление состоит в том, что мы действуем на маятник импульсами, имею-
щими сторонний источник энергии. Эти импульсы сообщаются маятнику тогда,
когда он проходит через свое состояние равновесия, т.е. влияние на маятник осу-
ществляется в зависимости от движения самого маятника. Маятник как бы дейст-
вует сам на себя, осуществляя обратную связь и используя при этом стороннюю
энергию пружинного завода часов или опускающегося груза. В результате этого
не толчки определяют движение маятника, а сам маятник поддерживает свои ко-
лебания, управляя толчками, и часы Гюйгенса оказываются автоколебательной
автономной (не зависящей явно от времени) динамической системой.
Вообще управление используется человеком и существует в природе для реа-
лизации каких-то целей. Во многих случаях оно реализуется как корректировка
того, что происходит с объектом управления, т.е. с помощью обратной связи и не-
которого необходимого ей источника энергии. Но возможны и случаи, когда
управление осуществляет намеченный заранее план или подчиняется каким-то
командам извне.
В чем же секрет точности часов Гюйгенса? Ведь и до него были часы, ис-
пользующие часовой ход, колеблющий балансир. Но Гюйгенс придал балансиру
собственную частоту колебаний и этим колоссально увеличил точность хода ча-
сов. При этом частоту колебаний маятника уже определяли не толчки «туда–
обратно» часового хода, а собственная частота его колебаний.
Маятник – конкретный частный вид осциллятора с собственной частотой –
стал определяющим фактором отсчета времени, и стабильность его собственных
колебаний определяла точность часов. А стабильность колебаний осциллятора
может быть очень высокой, и тем большей, чем незначительней подталкивающие
его импульсы, т.е. чем меньше его затухание, и поэтому еще более точные часы –
это часы, в которых вместо маятника используется упруго колеблющаяся кварце-
вая пластинка или, наконец, молекулы и атомы. Молекулярные и атомные часы
уже настолько точны, что позволяют регистрировать неравномерность вращения
Земли.
В заключение несколько слов о соотношении (15.24) с диаграммой рис. 15.8.
Способ, с помощью которого мы пришли к соотношению (15.24), носит об-
щий характер. Его придумал А. Пуанкаре, и он широко используется в теории ко-
лебаний и теории динамических систем. В общей формулировке он состоит в све-
дении описания и исследования движений динамической системы к составлению
и исследованию точечного отображения. С этой общей точки зрения соотношение
(15.24) – это точечное отображение прямой в себя, преобразующее любую ее точ-
ку с координатой u в другую точку с координатой u . Именно это точечное ото-
бражение строится изложенным выше способом на рис. 15.8. Диаграмма рис. 15.8
впервые использовалась Ламереем, а точечное отображение прямой в прямую ис-
следовалось Кенигсом. В связи с этим диаграмма рис. 15.8 получила наименова-
ние диаграммы Кенигса – Ламерея. Это название ей дал А.А. Андронов, который
усовершенствовал и широко использовал ее для решения ряда актуальных задач
теории колебаний и автоматического регулирования [2, 3, 25].
15. Часы Галилея − Гюйгенса 123

Вот, пожалуй, для первого знакомства с методом Пуанкаре и точечными ото-


бражениями и все. Дальнейшее вы сможете узнать из соответствующих курсов
теории управления и теории динамических систем [36].
124 Ю.И. Неймарк. Математическое моделирование как наука и искусство

16. ГЕНЕРАТОР ЭЛЕКТРИЧЕСКИХ КОЛЕБАНИЙ


Электрическим аналогом маятника является колебательный контур, состав-
ленный из емкости и самоиндукции. Так же как в часах Галилея – Гюйгенса, коле-
бания маятника поддерживаются подталкиваниями часового механизма, можно
поддерживать колебания электрического контура с помощью специальных уст-
ройств − электронной лампы или полупроводникового триода. Эти устройства
должны осуществлять подкачку энергии для того, чтобы компенсировать ее рас-
сеяние на неизбежном омическом сопротивлении. Подталкивающее воздействие
на маятник часов должно согласовываться с его фазой и в этом смысле имеет
управляемый характер. Аналогично этому управляемый характер имеет и под-
держка колебаний электрического контура – генератора электрических колебаний,
осуществляемая электронной лампой или полупроводниковым триодом через
взаимоиндукцию M. Электрическая схема одного из вариантов такой управляемой
подкачки энергии изображена на рис. 16.1. Входящая в нее электронная лампа
имеет катод, анод и управляющую сетку. Напряжением на сетке можно, практи-
чески не затрачивая энергии, менять сопротивление лампы от катода к аноду. По-
этому, если между катодом и сеткой приложить некоторое напряжение, то теку-
щий от катода к аноду ток (поток электронов) Ia будет определяться напряжением
на сетке Eg. Эта зависимость имеет вид, представленный на графике рис. 16.2. Со
школы вы, наверное, помните, почему график зависимости I a ( E g ) имеет именно
такой вид: раскаленный катод излучает электроны, и напряжение Eg на сетке, по-
мещенной между катодом и анодом, помогает или препятствует их попаданию на
анод, т.е. увеличивает или уменьшает анодный ток.

M Eg
Ea

L Рис. 16.1. Схема лампового генератора


R C

Напишем математическую модель для электрической схемы рис. 16.1. Пусть


Ia – анодный ток, Eg – напряжение на сетке (относительно катода), а q – заряд кон-
денсатора. Пусть еще C, R и L – соответственно емкость конденсатора, величина
сопротивления (резистора) и самоиндукция катушки, а M – ее коэффициент взаи-
моиндукции с катушкой в анодном контуре. Для колебательного контура, со-
стоящего из самоиндукции L, емкости C и сопротивления R, имеем:
q
I = q& , E g = ,
C
dI q dI (16.1)
L + RI + = M a .
dt C dt
16. Генератор электрических колебаний 125

Для того чтобы продвинуться дальше, необходимо конкретизировать вид за-


висимости I a ( E g ) . Примем, что
I a = α + β E g − γ E g3 . (16.2)
При этом мы пренебрегаем самоиндукцией в анодном контуре и принимаем,
что анодный ток определяется формулой (16.2), аппроксимирующей зависимость
рис. 16.2:
q  β 3γ 
Lq&& + Rq& + = M  − 3 q 2  q&
C C C 
или
 R Mβ  & 3γM & 2 q
q&& +  − q + qq + = 0. (16.3)
 L CL  LC 3 CL
Ia

Рис. 16.2. Вид зависимости анодного тока


от напряжения на сетке трехэлектродной лампы
Eg
Уравнение (16.3) приводится к виду широко известного уравнения Ван-дер-
Поля [2]
u&& − 2δ(1 − au 2 )u& + ω2 u = 0 , (16.4)
где
−1
Mβ R  Mβ R  3γ 1
2δ = − , a= −  , ω2 = .
CL L  CL L  LC 3 LC
При этом предполагается, что δ > 0, a > 0 и ω2 > 0. При a = 0 или очень малых u
уравнение Ван-дер-Поля превращается в линейный осциллятор с отрицательным
трением δ > 0. При u2 > 1/a коэффициент при u& становится положительным и мы
вправе предположить, что при этом колебания затухают. Таким образом, состоя-
ние равновесия осциллятора Ван-дер-Поля неустойчиво и малые колебания на-
растают, а очень большие колебания затухают и, следовательно, между ними
должно быть устойчивое периодическое движение Г (рис. 16.3).
.
u

u
Рис. 16.3. Фазовый портрет уравнения Ван-дер-Поля:
Γ – автоколебание – устойчивое периодическое движение Γ

В этом правдоподобном утверждении можно непосредственно убедиться, наблю-


дая на дисплее ЭВМ фазовый портрет уравнения (16.3). Аналитическое обоснова-
126 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ние этого факта сравнительно просто при достаточно малом δ, при этом мы не
только аналитически обоснуем автоколебательность рассматриваемой нами сис-
темы при δ > 0 (т.е. при достаточно большом M), но и найдем приближенное зна-
чение амплитуды автоколебаний.
Запишем уравнение Ван-дер-Поля (16.4) в виде:
u&& + ω2u = −εu 2u& + 2δu& , (16.5)
где величина
3γM
ε= > 0,
LC 3
как и δ, принимается малой. Это позволяет записать решение уравнения (16.5) в
виде:
u = A cos(ωt + ϕ) , (16.6)
где в силу малости ε и δ A и ϕ – медленно меняющиеся функции времени. Воз-
можность такого представления не вызывает особых сомнений, но вместе с тем
требование его конкретного вида может вызвать затруднения. Оно, прежде всего,
связано с тем, что такое представление неоднозначно. Но именно пользуясь этой
неоднозначностью, можно к условию (16.6) добавить еще одно, например,
u& = −ω A sin(ωt + ϕ) , (16.7)
после чего A и ϕ выражаются через u и u& . Далее, можно непосредственно убе-
диться, что производные A& и ϕ& в силу уравнения (16.5) малы ввиду малости δ и ε.
Рассмотрим, как меняется со временем энергия осциллятора, отвечающего
уравнению (16.5) при ε = δ = 0. Энергия такого осциллятора равна
1
E = (u& 2 + ω2u 2 ) , (16.8)
2
а ее производная по времени при изменении величины u, согласно (16.5), имеет
вид:
dE
= u&u&& + ω2uu& = ( 2δ − εu 2 )u& 2`
dt
или, учитывая (16.6) и (16.7),
dE
dt
[ ]
= 2δ − ε A2 cos2 ( ωt + ϕ) A2 ω2 sin 2 ( ωt + ϕ) . (16.9)

Интегрируя по периоду 2π/ω полученное соотношение (16.9) при тех же


предположениях A& = ϕ& = 0 , найдем, что изменение энергии за это время
πε ω 4
∆E = 2πδωA2 − A .
2
С другой стороны, согласно (16.7) и (16.6), E = ω2 A2 / 2 . Поэтому
ω2 2 2 A4
∆E = ∆A = 2πδωA − πεω
2 2
или
16. Генератор электрических колебаний 127

4πδ 2 πε 4
∆( A2 ) = A − A . (16.10)
ω ω
Обозначая последовательные значения амплитуды A, отстоящие друг от дру-
га на промежутке времени 2π/ω, через An и An + 1, приходим, согласно (16.10), к
связывающему их соотношению
 4πδ  2 πε 2
An2+1 = 1 +  An − An , (16.11)
 ω  ω
которое уже известным нам образом может быть рассмотрено с помощью диа-
граммы Кенигса – Ламерея.
Из вида этих диаграмм при δ < 0 и δ > 0 и постоянном ε > 0 следует, что при
δ < 0 (рис. 16.4,а) амплитуда A движения уменьшается до нуля, т.е. состояние рав-
новесия глобально устойчиво. Напротив, в интересующем нас случае, когда δ > 0
(рис. 16.4,б), из вида соответствующей диаграммы следует неустойчивость равно-
весия и наличие глобально устойчивого автоколебания (периодического движе-
ния). Амплитуда этого периодического движения A* находится из условия
An+1 = An и равна
δ
A∗ = 2 . (16.12)
ε
Период соответствующего автоколебания при сделанных предположениях
малости δ и ε приближенно равен 2π/ω.
2 2
An+1 An+1

2 2
A*2 An A*2 An
a) б)
Рис. 16.4. Диаграмма Ламерея в случае мягкого возбуждения автоколебаний
с ростом параметра δ: а) при δ < 0, б) при δ > 0.
При δ = 0 происходит рождение из теряющего устойчивость равновесия
устойчивой неподвижной точки А*, соответствующий автоколебанию
Построим еще для наглядности бифуркационную диаграмму равновесия и
возникающего из него при смене знака δ автоколебания. Она представлена на
рис. 16.5. По оси абсцисс отложена величина δ/ε.
A*2
Рис. 16.5. Бифуркационная диаграмма мягкого
возбуждения колебаний. С ростом параметра δ/ε
при переходе его через нуль равновесие теряет
устойчивость и становится неустойчивым.
Одновременно с этим рождается автоколебание,
амплитуда которого растет с последующим воз-
растанием величины δ/ε δ /ε
128 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Точки оси абсцисс отвечают состояниям равновесия, устойчивым при δ < 0 и


неустойчивым при δ > 0. Потеря устойчивости происходит при δ = 0 и вместе с
этим при возрастании δ возникает автоколебание, амплитуда которого растет от
нуля, т.е. оно как бы рождается из сменяющего устойчивость равновесия.
Все сделанные выводы мы получили из приближенного вида точечного ото-
бражения (16.11), считая его точным. Не может ли это привести к ошибке? Вооб-
ще это возможно, но только при достаточно больших ϕ& или A& . При малых ϕ& и
A& точечные отображения рис. 16.4 меняются мало, и общие выводы остаются
прежними. Они остаются прежними при достаточной малости ϕ& и A& , т.е. пара-
метров δ и ε. А вот изменение вида анодно-сеточной характеристики Ia = I a ( E g )
может повлечь значительные изменения. Мы их рассмотрим, так как это позволя-
ет обнаружить разные пути возникновения автоколебаний при потере устойчиво-
сти состоянием равновесия и обнаружить и дать математические описания явле-
ниям мягкого и жесткого возбуждения автоколебаний и так называемого явления
гистерезиса.
Мягкое возбуждение колебаний – плавное от нуля возникновение автоколе-
баний из теряющего устойчивость состояния равновесия в силу изменения пара-
метров системы – это то, которое описано выше. Подчеркнем, что оно возникает
в результате изменения параметров системы.
При обратном изменении параметров вся картина возникновения автоколеба-
ний повторяется в обратном порядке. Адекватной математической моделью мяг-
кого возбуждения являются последовательности фазовых портретов или точечных
отображений, отвечающих бифуркационной диаграмме рис. 16.5.
Эта последовательность точечных отображений и фазовых портретов вос-
произведена в серии из трех рис. 16.6. Первый рисунок отвечает устойчивости
равновесия, второй – состоянию непосредственно после возникновения неустой-
чивости, третий – при дальнейшем изменении параметра, приводящего к росту
амплитуды (размаха) автоколебаний.
2 2
2
An+1 An+1 An+1

2 2 2
A*2 An A*2 An A*2 An
. . .
u u u

Γ Γ
u u u

Рис. 16.6. Последовательные виды диаграмм Ламерея и соответствующих


фазовых портретов при мягком возбуждении автоколебаний с ростом δ /ε
16. Генератор электрических колебаний 129

Такое мягкое возбуждение колебаний в результате изменения параметров на-


блюдается в реальных системах, но наряду с этим можно наблюдать и совсем
другой вариант возникновения автоколебаний, он назван жестким. При жестком
режиме возбуждения колебаний все не так: автоколебания возникают скачком,
приобретая сразу конечное и, возможно, большое значение. При обратном изме-
нении картина не повторяется в обратном порядке: она другая.
130 Ю.И. Неймарк. Математическое моделирование как наука и искусство

17. МЯГКИЙ И ЖЕСТКИЙ РЕЖИМЫ


ВОЗБУЖДЕНИЯ АВТОКОЛЕБАНИЙ
На сыгравшем историческую роль в начале прошлого века примере лампово-
го генератора электрических колебаний и описывающего его динамику диффе-
ренциального уравнения Ван-дер-Поля мы познакомились с явлением мягкого
возбуждения автоколебаний. Это явление носит общий характер и сопряжено с
бифуркацией рождения в фазовом пространстве из теряющего устойчивость со-
стояния равновесия устойчивого периодического движения – автоколебания.
Впервые эта бифуркация динамической системы была рассмотрена А.А. Андроно-
вым и носит его имя. На соответствующем рисунке были приведены последова-
тельные стадии – кадры киноленты – мягкого возбуждения автоколебаний в дву-
мерном фазовом пространстве. Эти кадры являются геометризованной математи-
ческой моделью этого явления, а уравнение Ван-дер-Поля можно считать про-
стейшей конкретной его аналитической моделью.
Но возбуждение автоколебаний при изменении параметров может носить не
только мягкий, но и так называемый, жесткий характер. Его можно наблюдать на
том же ламповом генераторе с другого вида анодной характеристикой Ia = Ia(Eg),
например при
I a = βE g + γE g3 + µE g5 , (17.1)
в котором отсутствие четных степеней несущественно, так как они никак себя не
проявляют при нашем приближенном методе исследования.
Повторим предшествующие выкладки для этого более общего случая, когда в
характеристику (17.1) добавлен еще один член, и мы придем к точечному отобра-
жению вида:
 4πδ  2
An2+1 = 1 + 4 6
 An + ε1 An + ε2 An , (17.2)
 ω 
первые два члена которого совпадают с тем, что было раньше, а третий член но-
вый. Коэффициенты ε1 и ε2 пропорциональны γ и µ и, как и δ, по предположению,
малы. Кроме того, описание анодной характеристики полиномом (17.1) приемле-
мо только в некоторой конечной области изменения Eg, что влечет ограничен-
ность амплитуды An в (17.2).
Рассмотрим точечное отображение (17.2) с учетом описанных ограничений.
Если различать все возможные случаи по знакам параметров δ, ε1 и ε2, то это при-
водит к восьми различным вариантам, для каждого из которых на рис. 17.1
изображены соответствующие графики точечного отображения – диаграммы
Кенигса – Ламерея. Они разбиты на четыре пары а), б), в) и г), каждая из которых
отвечает δ < 0 и δ > 0 при одинаковых ε1 и ε2.
Случай г) соответствует уже известному нам мягкому возбуждению колеба-
ний при непрерывном переходе от δ < 0 к δ > 0, а случай в) – интересующему нас
новому жесткому возбуждению. Случаи а) и б) скорее умозрительного характера,
так как не отвечают реальному виду характеристики электронной лампы.
17. Мягкий и жесткий режимы возбуждения автоколебаний 131

2 2
An+1 An+1

2 2
An An
δ < 0, ε1 > 0, ε2 > 0 а) δ > 0, ε1 > 0, ε2 > 0

2 2
An+1 An+1

2 2
An An
δ < 0, ε1 < 0, ε2 > 0 б) δ > 0, ε1 < 0, ε2 > 0

2 2
An+1 An+1

2 2
An An
δ < 0, ε1 > 0, ε2 < 0 в) δ > 0, ε1 > 0, ε2 < 0
2 2
An+1 An+1

2 2
An An
δ < 0, ε1 < 0, ε2 < 0 г) δ > 0, ε1 < 0, ε2 < 0

Рис. 17.1. Возможные виды диаграммы Ламерея при полиномиальной характеристике


лампы (17.1) в соответствии с видом точечного отображения (17.2)

Сосредоточим внимание на случае в), изобразив его подробнее в виде пяти


последовательных графиков точечного отображения (рис. 17.2) для возрастающих
значений величины δ.
Из этих графиков видно, что сначала имеет место устойчивое состояние рав-
новесия O, затем появляется полуустойчивое периодическое движение M12 (точ-
нее, полуустойчивое периодическое движение, отвечающее неподвижной точке
M12), затем распадающееся на устойчивое M2 и неустойчивое M1 периодические
движения. При дальнейшем возрастании δ амплитуда неустойчивого периодиче-
ского движения M1 уменьшается, а устойчивого M2 – увеличивается, в результате
чего M1 сливается с состоянием равновесия O, которое из устойчивого становится
неустойчивым.
132 Ю.И. Неймарк. Математическое моделирование как наука и искусство

2 2 2
An+1 An+1 An+1 M2
M12 M1

2 2 2
O An O An O An

2 2
An+1 An+1
M2 M2

M1

2 2
O An O An
Рис. 17.2. Последовательность диаграмм Ламерея жесткого возбуждения колебаний:
сначала равновесие О глобально устойчиво, затем рождается полуустойчивая
неподвижная точка М12, которая распадается на две: М1 и М2; затем точка М1
сливается с равновесием О и делает его неустойчивым, в результате чего
глобально устойчивой оказывается неподвижная точка М2
Фазовые портреты, отвечающие этим превращениям, представлены на
рис. 17.3. Найдем, основываясь на этих рисунках, бифуркационную диаграмму.
Она изображена на рис. 17.4. Как видно, она отличается от бифуркационной диа-
граммы, имеющей место в случае мягкого возбуждения (см. рис. 16.5). Что же
следует из этого различия? Прежде всего, если раньше при переходе δ через нуль,
возрастая, состояние равновесия теряло устойчивость, отрождая от себя устойчи-
вое периодическое движение, то теперь при потере устойчивости с ним сливается
неустойчивое периодическое движение и система, находясь ранее в устойчивом
равновесии, покидает его и переходит сразу к периодическому движению конеч-
ной амплитуды M2. Это и есть жесткий режим возбуждения колебаний, когда сра-
зу скачком возникают автоколебания конечной амплитуды. Конечно, они уста-
навливаются не мгновенно, для этого нужно некоторое время и размах колебаний
растет непрерывно, а скачок с изменением параметра имеет место для установив-
шегося движения.
Таким образом, первое отличие жесткого режима возникновения автоколеба-
ний как физического явления, состоит не в плавном, а скачкообразном изменении
характера движения с изменением параметра. В математическом описании это
различие отражается в том, что из состояния равновесия не рождается устойчивое
периодическое движение, а с ним сливается неустойчивое периодическое движе-
ние и точки, близкие к ставшему неустойчивым состоянию равновесия, устрем-
ляются к ранее существующему устойчивому периодическому движению.
Второе существенное отличие относится к необратимому характеру жесткого
перехода от равновесия к установившемуся движению: при возрастании δ и пере-
ходе через значение δ = 0 жестко возникают автоколебания, но при обратном
уменьшении δ через нуль автоколебания не исчезают, они сохраняются, непре-
рывно меняя амплитуду. Для того чтобы от жестко возникающих автоколебаний
перейти к устойчивому состоянию равновесия, нужно уменьшить параметр до не-
17. Мягкий и жесткий режимы возбуждения автоколебаний 133

которого отрицательного значения δ = δ* (рис. 17.4), после чего автоколебания


скачком исчезают и происходит переход к устойчивому равновесию. Исчезнове-
ние устойчивого автоколебания сопровождается его слиянием с неустойчивым
периодическим движением и их совместным исчезновением (при δ = δ* устойчи-
вое периодическое движение M2 сливается с неустойчивым M1 и при δ < δ* они
исчезают). Таким образом, возникновение и исчезновение автоколебаний при же-
стком их возбуждении имеет место при разных значениях параметра δ, как это
показано на рис. 17.4. Это явление подобно гистерезису ферромагнитных тел.
.
u
. .
u u
M2

u u u
M1
M12

a) б) в)
. .
u u

u u
M1
M2 M2

г) д)
Рис. 17.3. Изменения фазового портрета, отвечающие изменениям
диаграммы Ламерея на рис. 17.2

A*2

Рис. 17.4. Бифуркационная диаграмма жесткого


возбуждения колебаний. Кружочки и крестики –
соответственно устойчивые и неустойчивые рав-
новесия и периодические колебания

δ* δ
Закончим повествование о мягком и жестком возбуждениях автоколебаний
мыслимым экспериментом. Пусть перед вами ручка, вращая которую вы можете
увеличивать и уменьшать параметр динамической системы, наблюдая одновре-
менно на дисплее ЭВМ изменение состояния системы (одну из его компонент).
134 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Тогда при мягком режиме при медленном вращении ручки сначала не будет коле-
баний, затем они возникнут, и их амплитуда будет медленно нарастать, тем мед-
леннее, чем медленнее вы вращаете ручку (рис. 17.5,а). При обратном движении
все виденное вами повторится в обратном порядке.

t t

а) б)

Рис. 17.5. Осциллограммы мягкого (а) и жесткого (б)


возбуждения колебаний при плавном изменении параметра

При жестком возбуждении вначале также не будет колебаний, но затем они


возникнут сразу, причем быстрота этого перехода не уменьшается с замедлением
вращения ручки (рис. 17.5,б). При обратном изменении картина не будет меняться
в обратном порядке. Исчезновение автоколебаний, и притом тоже скачком, про-
изойдет при более длительном вращении ручки в обратную сторону.
18. Стохастический осциллятор («часы наоборот») 135

18. СТОХАСТИЧЕСКИЙ ОСЦИЛЛЯТОР («ЧАСЫ НАОБОРОТ»)


В предыдущих лекциях мы рассмотрели часы Галилея – Гюйгенса. Основой
этих часов является маятник или любой другой осциллятор, колебания которого
поддерживаются за счет какого-нибудь источника энергии и период которых дос-
таточно стабилен. Стабильность периода колебаний – это точность часов. Мы
изучили возможные причины нестабильности и пути ее уменьшения. Очень важ-
ным моментом стабильности была малость затухания, одновременно и малая за-
висимость от затухания периода, достаточность очень малых толчков и малая, вы-
зываемая толчками, нестабильность.
Однако осциллятор может быть не только высокоточным измерителем вре-
мени с весьма стабильным периодом, но может обладать и беспорядочными, зна-
чительно меняющимися временами колебаний, настолько разными, что говорить
о периоде колебаний становится бессмысленным. Более того, эти колебания при-
обретают свойства случайности, становятся непредсказуемыми и допускают ве-
роятностное описание. Эта удивительная возможность стала научной сенсацией
недавних лет. Она изменила общепринятые представления о случайности. Оказа-
лось, что случайность может порождаться динамической системой, описываемой
дифференциальными уравнениями. И это несмотря на то, что остается верной
теорема о единственности решения, о единственности его определения начальны-
ми условиями (начальным состоянием). Как это может быть? Представляется оче-
видным, что это совершенно невозможно, и все-таки это может быть и реализует-
ся вокруг нас не менее часто, чем детерминированные процессы, описываемые
дифференциальными уравнениями. Оказывается, что реальные решения диффе-
ренциальных уравнений могут быть детерминированными и предсказуемыми, а
могут быть и случайными непредсказуемыми.
Целью дальнейшего рассказа является объяснение того, как это может быть,
на очень простом примере стохастического осциллятора или «часов наоборот».
Часы – это затухающий осциллятор, время от времени подталкиваемый. «Ча-
сы наоборот» – это самораскачивающийся осциллятор, колебания которого время
от времени одерживаются.
Математическая модель часов имела вид:
&x& + 2δx& + ω2 x = 0 для x ≠ 0 или x = 0 и x& < 0 ,
(18.1)
x& + = x& − + p для x = 0 и x& > 0 .
Математическая модель «часов наоборот» ( p ≤ a ) :
&x& − 2δx& + ω2 x = 0 для x ≠ 0 или x = 0 и x& < a ,
(18.2)
x& + = x& − − p для x = 0 и x& ≥ a .
Уравнения (18.2) получаются из (18.1) заменой –δ на δ и p на –p. Кроме того,
еще нуль заменяется числом a > 0.
Нам надлежит исследовать модель (18.2). Прежде всего представим себе вид
ее фазовой траектории (рис. 18.1). Затем сведем исследование динамики модели
136 Ю.И. Неймарк. Математическое моделирование как наука и искусство

(18.2) к точечному отображению, к диаграмме Кенигса – Ламерея. Для этого рас-


смотрим последовательные уходы фазовой точки с полуоси x = 0, x& > 0 .
x
p
a

Рис. 18.1. Фазовый портрет «часов наоборот»


x (стохастического осциллятора)

Пусть после первого пересечения x& = u, а после второго x& = u . Найдем связь
между u и u . Пусть траектория выходит из точки M(0, u). Она приходит вновь на
луч x = 0, u > 0 в некоторой точке M1(0, u1), где
u1 = ue 2 πδ / Ω ,
и не одерживается, если u1 < a (рис. 18.2,а), и тогда u = u1, либо одерживается,
если u1 ≥ a, и тогда u = u1 – p (рис. 18.2,б). Итак, имеем:
qu для u < a / q,
u = (18.3)
qu − p для u ≥ a / q,
где для сокращения записи введено обозначение q = exp (2πδ/Ω) > 1.
x x
a
M1
M1, u = u1 u = u1 − p
a
M M

x x

a) б)
Рис. 18.2. Различные возможные виды фазовых траекторий «часов наоборот»:
а) при u1 точки M1 меньшем a; б) при u1 > a.
За цикл колебания точка M с координатой u переходит в точку с координатой u ,
причем при u1 > a этот переход совершается со скачком от u1 до u

Нарисуем для точечного отображения (18.3) диаграмму Кенигса – Ламерея.


Для этого построим график зависимости u от u (рис. 18.3) и проведем биссектри-
су. Изучение диаграмм, несмотря на их простоту, достаточно сложно. Но оно сто-
ит того, чтобы потрудиться. Даже потрудившись, мы далеко не все сможем обос-
новать, кое-что придется принять на веру.
Получаемые таким образом диаграммы точечного отображения могут иметь
три различных вида. Они показаны на рис.18.3,а, б и в.
18. Стохастический осциллятор («часы наоборот») 137

u u u
A A C A
a p a a
C
p p
B
B
B

a/q u a/q p/(q – 1) u a/q p/(q – 1) u


а) б) в)
Рис. 18.3. Возможные виды диаграммы Ламерея для «часов наоборот»

Первый случай (рис. 18.3,а): точки A и B обе лежат выше биссектрисы. При
этом a – p > a/q или p/a < 1 – 1/q. Второй случай (рис. 18.3,б): точка B лежит ниже
биссектрисы, а точка C выше точки A. При этом a – p < a/q и a < p/(q – 1) или
p/a > 1–1/q и p/a > q – 1. Третий случай (рис. 18.3,в): точка B лежит ниже биссек-
трисы и точка C ниже точки A. При этом a – p < a/q и a > p/(q – 1) или p/a > 1 –
– 1/q и p/a < q – 1. Как видно, от величин q и p/a зависит то, какой из случаев име-
ет место. При этом q > 1, 0 < p/a ≤ 1.
Каждому из перечисленных случаев на плоскости величин q и p / a отвечает
своя область. Эти области, обозначенные соответственно номерами 1, 2 и 3, пока-
заны на рис.18.4.
p/a

1
Рис. 18.4. Параметрический портрет, соот- 3
2
ветствующий изображенным на рис. 18.3
различным видам диаграммы Ламерея 1

1 q

В случаях 1 и 3 почти все последовательные преобразования уходят в беско-


нечность. Это соответствует неограниченному раскачиванию осциллятора. В слу-
чае 2 в зависимости от начального значения величины u возможны два разных ти-
па поведения. При u < p/(q – 1) последовательные преобразования u все время ог-
раничены. Напротив, при u > p/(q – 1) они неограниченно возрастают.
Наибольший интерес для нас представляет случай 2, когда значения преобра-
зований все время ограничены. Для любого начального u0 ∈ (0, p/(q –1)) последо-
вательные преобразования u1 , u2 , ... с некоторого номера попадают на отрезок
[a – p, a] и на нем остаются. Любая такая фазовая траектория u0 , u1 , u2 , ... неус-
тойчива, и близкие к ней траектории разбегаются. Они, в силу наличия у отобра-
жения (18.3) разрыва, могут сблизиться, но потом снова разбегаются и т.д.
Проследим, как это происходит, сопоставляя две траектории u0 , u1, ... и
v0, v1 ... с близкими начальными точками u0 и v0 . Если между точками u0 и v0 не
лежит точка разрыва a/q отображения (18.3), то, согласно (18.3),
u1 − v1 = q(u0 − v0 ) (18.4)
138 Ю.И. Неймарк. Математическое моделирование как наука и искусство

и, следовательно, расстояние между ними увеличивается в q > 1 раз. Если же ме-


жду точками u0 и v0 лежит точка разрыва a/q отображения (18.3), то
u1 − v1 = q(u0 − v0 ) ± p . (18.5)
Такая же альтернатива имеет место и на всех последующих преобразованиях.
Поэтому в любом случае после некоторого числа преобразований, сколь бы близ-
ки ни были начальные точки, они расходятся на конечное расстояние, не мень-
шее, чем p/2q. Причем это заведомо происходит за число шагов, не более чем n,
для которого
p
q n | u0 − v 0 | > . (18.6)
2q
Поэтому, сколь бы точно, но все же с некоторой погрешностью, мы ни вы-
числяли последовательные преобразования отображения (18.3), их ошибки после
некоторого их числа превзойдут величину p/2q. Исключение составляет лишь
случай абсолютно точного вычисления, который вообще нереализуем. А так как
эти малые ошибки, как и малые возмущения, при физической реализации непред-
сказуемы и не поддаются учету, то фактически мы сталкиваемся с непредсказуе-
мостью фазовой траектории движения «часов наоборот». Движения «часов на-
оборот» непредсказуемы, и эта непредсказуемость явно проявляется очень быст-
ро. Действительно, неравенства (18.6) при q = 1,76, p = 4 и очень маленькой
ошибке в начальных значениях порядка 10–8 выполняются для n ≥ 32. Для ошибки
порядка размеров атома оно выполняется при n ≥ 48.
Движение «часов наоборот» непредсказуемо еще и потому, что мы не можем
задать или знать их начальные условия абсолютно точно. Любая же погрешность
в начальном значении через некоторое время ведет к большим различиям, ведет к
непредсказуемости.
Идея о том, что случайность может порождаться исчезающе малыми, не из-
вестными нам неопределенностями с последующим их экспоненциальным усиле-
нием из-за неустойчивости, высказывалась еще А. Пуанкаре и позднее в более
развернутом виде Н.С. Крыловым и М. Борном. Применительно к долгосрочному
прогнозу погоды эффект необычайно чувствительной зависимости от малых воз-
мущений отмечался Э. Лоренцем как «эффект бабочки», которая своим полетом
может изменить состояние атмосферы и будущую погоду так же, как она повлия-
ла на события, развертывающиеся в одном из рассказов Брэдбери.
Осмысливание сказанного, естественно, приводит к пониманию того, что не-
устойчивость порождает непредсказуемость, но это не значит, что случайность.
Для случайности необходимо наличие еще вероятностного описания. Откуда ему
взяться? Мне представляется, что сегодня еще трудно дать исчерпывающий одно-
значный ответ. Этот вопрос требует дальнейшей глубокой проработки. Но кое-что
сказать можно.
Оказывается, что динамическая система, описываемая отображением (18.3),
обладает удивительными свойствами, которые позволяют ее непредсказуемости
приписать вероятность, определяемую только ее динамикой, а не тем, какие слу-
чайные возмущения вызывают непредсказуемость. Нужно лишь наличие этих ни-
чтожно малых случайностей. Достаточно тех, которые порождаются тепловым
движением молекул или даже квантовой вероятностной природой микромира.
18. Стохастический осциллятор («часы наоборот») 139

Поясним сказанное на примере «часов наоборот» с параметрами из области 2


рис. 18.4, взяв в ней точку, где p = a и q = 2. Диаграмма точечного отображения
(18.3), которое обозначим через T, принимает вид, показанный на рис. 18.5, а само
оно записывается так:
 2u при u < a / 2,
u = (18.7)
2u − a при u ≥ a / 2.
Отображение, обратное (18.7), двузначное. Пусть T1−1 и T2−1 – его однознач-
ные ветви. Согласно (18.7),
u u +a
T1−1 : u = ; T2 −1 : u = . (18.8)
2 2
Зададим начальную точку u0, предполагая ее случайной с некоторой плотно-
стью вероятности p0 (u). Малая неопределенность в задании u0 означает, что функ-
ция p0(u) плотности вероятности похожа на δ-функцию и имеет вид, изображен-
ный на рис. 18.6. Чем уже и выше пик этой функции, тем точнее задается началь-
ное значение u0.
P0 (u)

u
a

a/q 2a/q u u
Рис. 18.5. Частный случай диаграммы Ламерея Рис. 18.6. Вид плотности вероятности
для «часов наоборот», когда p = a и q = 2 задания начального значения u

Произведем преобразование T, при этом каждое u0 перейдет в новое значение


u1. Если u0 случайные, то и u1 тоже случайные. По плотности вероятности p0(u)
случайной точки u0 можно найти плотность вероятности преобразованной точки
u1 . Пусть это p1 (u). Продолжая преобразования T, можно найти p2(u), p3(u) и так
далее. Для того чтобы действительно их вычислить, найдем связь между ps(u) и
ps+1(u).
Точки us+1 ∈ (u, u + du), если us ∈ ( T1−1 (u), T1−1 (u + du)) или us ∈ ( T2−1 (u),
T2−1 (u+du)). Поэтому
P(u s +1 ∈ (u, u + du )) =
(18.9)
= P(u s ∈ (T1−1 (u ), T1−1 (u + du ))) + P(u s ∈ (T2 −1 (u ), T2 −1 (u + du ))),
где P означает вероятность события, стоящего за P в скобках. Так что соотноше-
ние (18.9) означает, что вероятность того, что точка us+1, являющаяся отображени-
ем точки us , принадлежит интервалу (u, u+du), равна сумме вероятностей того, что
140 Ю.И. Неймарк. Математическое моделирование как наука и искусство

us принадлежит соответственно интервалу ( T1−1 (u), T1−1 (u + du)) или интервалу


( T2−1 , T2−1 (u + du)).
Учитывая (18.8), перепишем (18.9) в виде:
  u u + du     u + a u + a + du  
P (u s +1 ∈ (u, u + du )) = P  u s ∈  ,   + P  us ∈  , 
 2 2    2 2 
или
 u  du  u + a  du
ps +1 (u )du = ps   + ps   ,
2 2  2  2
или, сокращая на du,
1  u  u + a 
 ps   + ps 
ps +1 (u ) =  . (18.10)
2  2  2 
Это искомое соотношение (18.10) позволяет, начиная с известной плотности
вероятностей p0(u), найти последовательно p1(u), p2(u) и так далее. Естественен
вопрос: есть ли предельная вероятность и какова она? Установить сходимость и
найти предел можно следующим образом.
Пусть начальная плотность вероятностей p0(u) имеет производную. Тогда, со-
гласно (18.10), ее имеют и все последующие вероятности ps(u). Продифференци-
руем (18.10) и найдем, что
1 u  u + a 
ps′ +1 (u ) =  ps′   + ps′   . (18.11)
4  2  2 
Из (18.11) с очевидностью следует, что
lim ps′ (u ) = 0 ,
s →∞
и поэтому предельная функция p∞(u) постоянна. Учитывая условие нормировки,
непосредственно находим, что
1
p∞ (u ) = .
a
Таким образом, спустя некоторое время, величины послеударных скоростей
us в моменты прохождения маятником «часов наоборот» равновесия, являются
равномерно распределенными случайными величинами с интервалом значений от
нуля до a. Эти величины не независимы. Напротив, близкие по номеру величины
тесно связаны друг с другом, но по мере удаления друг от друга эта связь слабеет
и очень отдаленные значения практически независимы.
Мы обосновали наличие вероятности лишь на конкретном примере, да еще
только в частном случае p = a и q = 2. Обоснование может быть и более широким.
В том, что изложено, рассуждение о связи плотностей вероятностей ps (u) и ps+1(u),
имеет общий характер. Трудности возникают в обосновании существования пре-
дела ps (u) при s → ∞. Именно поэтому мы ограничимся частным случаем p = a и
q = 2, хотя существующие исследования позволяют сделать значительно более
общие утверждения. Они позволяют утверждать, что наличие предела не есть что-
то исключительное, что это одна из общих возможностей.
18. Стохастический осциллятор («часы наоборот») 141

Таким образом, ситуация, обнаруженная в рассмотренном очень простом


примере «часов наоборот», имеет общий характер. Она имеет место в широком
круге явлений турбулентности жидкостей и газов. Именно ею вызваны трудности
долгосрочного прогноза погоды. Стохастичность наблюдается во многих элек-
трических и механических системах, в движениях молекул газа. Можно сказать,
что устойчивости и неустойчивости отвечают два принципиально разных основ-
ных типа поведения динамических систем. В первом случае имеет место предска-
зуемость и детерминизм, а во втором – непредсказуемость и стохастичность.
Простейшим примером первого типа динамических систем являются часы
Галилея – Гюйгенса, типичным примером второго типа – «часы наоборот» или
простейший стохастический осциллятор [40, 41].
Часы служат для измерения времени, в регулярности и стабильности их хода
их достоинство, стохастический осциллятор порождает из микрослучайности
макрослучайность. Часы Галилея – Гюйгенса генерируют равномерный ряд мо-
ментов времени, «часы наоборот» генерируют случайную последовательность.
В динамических системах первого типа фазовые траектории сближаются,
стремясь к состояниям равновесия или периодическим движениям, в системах
второго типа они все время разбегаются, образуя сложный запутанный клубок.
Ранее, при обсуждении автоколебаний, была выявлена естественность их воз-
никновения в динамических системах и указан геометрический образ автоколеба-
ний − замкнутая фазовая кривая, к которой приближаются все соседние траекто-
рии [2]. С непредсказуемыми хаотическими движениями это сделать много слож-
нее. Они значительно более многолики [22–24]. Общее их свойство – в нерегу-
лярности и непредсказуемости, которые могут вызываться самыми ничтожными
возмущениями. Можно выделить притягивающие множества неустойчивых фазо-
вых траекторий. Это когда каждая отдельно взятая фазовая траектория неустой-
чива и соседние от нее убегают, а все в целом они притягивающие, что схемати-
чески представлено на рис. 18.7.

Рис. 18.7. Схематичное представление


притягивающего множества неустойчивого
непредсказуемого движения

Этого достаточно для непредсказуемости. Для стохастичности, по крайней


мере, следует еще потребовать наличия предельных плотностей вероятностей, о
которых шла речь выше, а, в общем, еще все впереди и ждет своих исследовате-
лей и исследований, которые могут видоизменить и обогатить нашу феноменоло-
гическую аксиоматически построенную теорию вероятностей.
На этом можно было бы закончить, но мне хочется познакомить вас еще с за-
мечательной системой дифференциальных уравнений Лоренца:
142 Ю.И. Неймарк. Математическое моделирование как наука и искусство

x& = − σx + σy ,
y& = − rx − y − xz ,
z& = −bz + xy ,
дающих приближенное описание тепловой конвекции между нагретой нижней и
более холодной верхней горизонтальными пластинками. При b = 0 это уравнение
описывает конвективную циркуляцию жидкости в замкнутой круговой трубке,
которую снизу нагревают. В отсутствие нагрева снизу эта система имеет устойчи-
вое равновесие. По мере нагрева оно становится неустойчивым и рождаются две
устойчивые циркуляции жидкости по часовой стрелке и против часовой стрелки.
Затем по мере роста нагрева и эти циркуляции становятся неустойчивыми и на-
ступает хаос: равновесие нарушается – возникает циркуляция, она нарушается и
возникает другая циркуляция, она, в свою очередь, прекращается и возникает
снова прежняя, и т.д. без какой-либо регулярности, без намека на периодичность,
с единственно закономерной сменой циркуляции в одну сторону циркуляцией в
другую, сменой непредсказуемой, совершаемой через разные случайные проме-
жутки времени. Но что замечательно: оказывается, исследование этих смен цир-
куляций может быть описано точечным отображением, похожим на то, которое
имело место в рассмотренном нами примере «часов наоборот». Вот на этом уже
поставим точку.
19. Неустойчивость и автоколебания, вызываемые трением 143

19. НЕУСТОЙЧИВОСТЬ И АВТОКОЛЕБАНИЯ,


ВЫЗЫВАЕМЫЕ ТРЕНИЕМ
Последующий рассказ − о механизме и простейших математических моделях
возникновения неустойчивости и автоколебаний благодаря трению.
В том, что трение вызывает неустойчивость и автоколебания, есть что-то па-
радоксальное: мы привыкли к тому, что трение тормозит и прекращает движение.
Но, оказывается, это не всегда так, и парадокс разрешается тем, что трение вы-
ступает в роли распределителя энергии некоторого другого, не связанного с тре-
нием, источника энергии. Само же по себе оно действительно может только тор-
мозить движение.
Схематическая упрощенная модель, с которой мы начнем исследование сис-
тем с парадоксальной ролью сухого трения, состоит из массы, которую через
пружину тянут с постоянной скоростью по горизонтальной плоскости. Массивное
тело при этом движется под влиянием силы растягиваемой пружины (рис. 19.1). В
этой модели можно считать, что движется с постоянной скоростью плоскость, а
конец пружины, прикрепленной к телу, неподвижен (рис. 19.2).

Рис. 19.1. Движение тела под влиянием ϕ


силы растягиваемой пружины

Рис. 19.3. Маятник Фроуда


m x

Рис. 19.2. Другой вид конкретной реализации


математической модели с трением
Остановимся на этом последнем варианте модели (рис. 19.2). В несколько
другом конкретном физическом виде она предстает в так называемом маятнике
Фроуда, изображенном на рис. 19.3, и представляющем собою обычный маятник,
насаженный с помощью муфты на вращающуюся с постоянной скоростью ось
[74]. Ось вращается в муфте с некоторым не очень большим трением, чтобы ма-
ятник мог качаться на ней, но не вращался вместе с нею. Реальными прототипами
описанной схематической модели могут служить тормозные колодки автомобиля,
трамвая, железнодорожного вагона, а также других разнообразных механических
144 Ю.И. Неймарк. Математическое моделирование как наука и искусство

тормозных устройств. С некоторой натяжкой сюда же можно отнести скрипичную


струну, по которой с трением скользит смычок.
Вернемся к принятой схематической модели. Обозначим через x величину
смещения массы m от ее положения, при котором пружина не растянута, а через F
– силу трения массы о движущуюся плоскость опоры, тогда уравнение Ньютона
запишется в виде:
m &x& = −k x + F . (19.1)
Природа силы сухого трения очень сложна. Первая математическая модель
силы сухого трения была предложена еще в XVIII веке Кулоном. Она так и назы-
вается – кулоновское трение. Об этой модели вам рассказывали в школе в разделе
о законах сухого трения, согласно которым сила трения не зависит от взаимной
скорости трущихся поверхностей, действие ее направлено против скорости и по
величине пропорционально нормальному давлению, так что
F = F0sign (v − x& ) , (19.2)
где sign ξ – знак величины ξ. Это при x& ≠ v . При x& = v , т.е. когда масса движется
вместе с плоскостью, как бы скреплена с ней, сила трения – сила трения покоя –
может быть любой в пределах от –F0 до F0 . Последнее означает, что любая сила,
по величине меньшая F0 , не может сдвинуть покоящуюся относительно движу-
щейся плоскости массу. Движение начинается, когда действующая сила по вели-
чине превзойдет F0 .
Эти последние утверждения о силе трения покоя можно включить в формулу
(19.2), приняв, что sign 0 означает любую величину между –1 и +1. После чего со-
отношение (19.2) становится математической моделью кулоновского трения и
уравнение движения запишется в виде:
m&x& + kx = F0sign (v − x& ) . (19.3)
Дифференциальное уравнение (19.3) – это математическая модель рассматри-
ваемой нами системы. Выяснение ее динамики сводится к рассмотрению фазово-
го портрета динамической системы (19.3).
Фазовым пространством динамической системы, определяемой дифференци-
альным уравнением (19.3), является плоскость фазовых переменных x и x& = y . В
полуплоскостях y < v и y > v движения фазовых точек подчиняются, согласно
(19.3), уравнениям
m&x& + kx = m F0 , (19.4)
каждое из которых является гармоническим осциллятором с состоянием равнове-
сия соответственно в точке x = –F0 /k, x& = y = 0 или в точке x = F0 /k, x& = y = 0. Это
позволяет непосредственно нарисовать, как показано на рис. 19.4, фазовые траек-
тории отдельно в каждой из полуплоскостей y > v и y < v.
Движение фазовой точки на этом рисунке определено всюду, кроме точек
линии x& = y = v. Эта линия разбивается на три части: луч (−∞, O1), по отношению
к которому фазовые траектории приходят снизу и уходят сверху; отрезок [O1 , O2],
на который фазовые траектории приходят снизу и сверху, и луч (O2 , ∞), где они
приходят сверху и удаляются снизу.
19. Неустойчивость и автоколебания, вызываемые трением 145

На лучах (−∞, O1) и (O2, ∞) естественно предположить, в силу непрерывности


изменения скорости y = x& и координаты x (фазовая точка не может совершать
скачков), что при своем движении фазовая точка пересекает их соответственно
снизу вверх и сверху вниз; а на отрезке [O1, O2], придя к нему снизу или сверху,
остается на нем, двигаясь вдоль отрезка согласно тому, что на нем y = x& = v, и,
достигнув в результате этого движения точки O2, ее покинет, переходя в нижнюю
полуплоскость.

O1 O2

–F0/k F0/k x

Г
Рис. 19.4. Фазовый портрет систем типа маятника Фроуда
при кулоновской идеализации трения
Сделанное описание полностью определяет движение фазовых точек на всей
фазовой плоскости. Однако, возможно, оно кажется не совсем обоснованным или,
во всяком случае, его желательно детальнее осмыслить.
Движение массы m может быть с проскальзыванием по опорной плоскости и
без него, т.е. вместе с плоскостью. В полуплоскостях y < v и y > v движения всю-
ду с проскальзыванием. На лучах (−∞, O1) и (O2, ∞) имеют место мгновенные ос-
тановки относительно плоскости, вызванные сменой направления проскальзыва-
ния, совершаемого со скоростью v – x& . На отрезке [O1, O2] проскальзывания нет,
масса движется вместе с плоскостью со скоростью v. На этом отрезке x& = y = v.
На отрезке [O1, O2] сила трения – это сила трения покоя. На нем в течение конеч-
ного времени y = v и y& = 0 и поэтому, в силу уравнения (19.3),
k x = F0 sign (0). (19.5)
Так как на отрезке [O1, O2] –F0 /k < x < F0 /k, то сила натяжения пружины kx не
превосходит величины трения покоя F0 и проскальзывания не возникает. Напро-
тив, на лучах (−∞, O1) и (O2, ∞) остановка имеет мгновенный характер, так как на
них сила натяжения пружины kx превосходит предельную величину силы трения
покоя F0 .
Перейдем к общему описанию полученного фазового портрета (см. рис. 19.4)
и возможных движений массы m.
Имеется равновесие O(x = F0 /k, y = 0 ). Оно устойчивое типа центра. Возле
него возможно бесконечное множество гармонических колебаний до некоторой
предельной амплитуды, отвечающей кривой Г. Эти гармонические колебания не
затухают, несмотря на наличие трения. Трение как бы исчезает. Все остальные
движения после нескольких колебаний с уменьшающимся размахом приводят к
временному движению массы m вместе с движущейся плоскостью (к движению
146 Ю.И. Неймарк. Математическое моделирование как наука и искусство

фазовой точки по отрезку [O1, O2]), после чего возникают гармонические колеба-
ния, отвечающие замкнутой фазовой кривой Г.
Мы провели теоретическое исследование движений массы на пружине, ле-
жащей на движущейся плоскости, исходя из кулоновской модели сухого трения, и
обнаружили не только устойчивое равновесие, что довольно естественно, но и, к
удивлению, множество различных периодических колебаний. Однако экспери-
мент не подтверждает эти теоретические результаты: на небольших конечных
временах теоретические и экспериментальные данные близки друг другу, однако
со временем расхождения нарастают. Это значительное нарастание различий име-
ет место только в области фазового пространства, ограниченного кривой Г, и со-
стоит в том, что равновесие может быть неустойчивым и вместо бесконечного
числа периодических движений либо нет ни одного, либо чаще всего одно. Это
имеет место одновременно с соблюдением законов Кулона с большой точностью.
Податься некуда, по-видимому, и ничтожные отличия от закона Кулона могут
привести к таким существенным различиям. Это действительно так, и вы уже с
этим сталкивались при рассмотрении модели «хищник – жертва» Вольтерра – Лот-
ки. Там причина была в некорректности математической модели, и вызвана она
была наличием состояния равновесия типа центр. В рассматриваемом сейчас слу-
чае центр тоже есть. Так что, возможно, именно в нем все дело и нужно уточнить
математическую модель сухого трения таким образом, чтобы математическая мо-
дель рассматриваемой нами системы стала корректной. Желательно это сделать
так, чтобы учесть реальные отличия характеристики трения от идеальной куло-
новской и одновременно не слишком усложнить задачу исследования получаю-
щейся уточненной математической модели.
Закону Кулона отвечает график зависимости силы трения F от взаимной ско-
рости u трущихся поверхностей, представленный на рис. 19.5.
F
F0
Рис. 19.5. Кулоновская идеализация
u сухого трения

–F0
Эксперимент дает несколько другие графики. Они в основном трех следую-
щих типов: сила трения возрастает с увеличением скорости, убывает со скоро-
стью, сначала убывает, а затем возрастает. Возможны и другие варианты, но оста-
вим их без внимания. На рис. 19.6. изображены перечисленные три типа. Для пер-
вых двух изображенных случаев естественна кусочно-линейная аппроксимация,
при которой сила трения равна
F = F0 sign u + hu, (19.6)
где u – взаимная скорость трущихся поверхностей, в нашем случае u = v – x& .
В третьем случае аппроксимируем силу трения полиномом третьего порядка
F = F0 sign u +βu + γu 3. (19.7)
Эти аппроксимации, естественно, могут быть хорошими только при ограни-
ченных значениях u.
19. Неустойчивость и автоколебания, вызываемые трением 147

F F F
F0 F0 F0

u u u
–F0 –F0 –F0

а) б) в)

Рис. 19.6. Возможные отклонения от кулоновской характеристики трения:


а) сила трения возрастает с возрастанием скорости; б) сила трения убывает;
в) сила трения сначала убывает, а зачем возрастает

В случае (19.6) математическая модель рассматриваемой нами системы при-


мет вид:
m&x& + hx& + kx = F0sign (v − x& ) + hu , (19.8)
а в случае (19.7) − вид:
m&x& + hx& + kx = F0sign (v − x& ) + β u + γu 3 , (19.9)
где h, β и γ малы.
В общем же случае уравнение уточненной математической модели можно за-
писать в виде:
m&x& + kx = F (u ) , u = v − x& , (19.10)
где F(u) – кусочно-гладкая функция, имеющая разрыв непрерывности при u = 0.
Ясно, что математическая модель (19.10) содержит модели (19.8) и (19.9) как ча-
стные случаи.
Исследование мы начнем с самой общей модели, но оно коснется только ее
состояния равновесия x = F(v)/k, x& = 0, когда сила трения уравновешивается си-
лой натяжения пружины. Интересовать нас будет устойчивость этого равновесия.
Для исследования устойчивости нам следует рассмотреть движения, близкие
к равновесию x = F(v)/k. Введем новую переменную
F (v )
ξ= x− (19.11)
k
и запишем уравнение (19.10) в виде:
∂F
m&ξ& + kξ = F (u ) − F (v) = − ξ& + ...
∂u u =v
Пренебрегая в дальнейшем членами не ниже второго порядка малости отно-
сительно малой величины ξ& , обозначенными в этом уравнении многоточием, рас-
смотрим линеаризованное уравнение
∂F
m&ξ& + ξ& + kξ = 0 . (19.12)
∂u u =v

Это хорошо известный нам осциллятор. Его равновесие устойчиво при


148 Ю.И. Неймарк. Математическое моделирование как наука и искусство

∂F
>0 (19.13)
∂u u =v
и неустойчиво при противоположном неравенстве.
Таким образом, если скорости v отвечает восходящий участок характеристи-
ки трения, то равновесие устойчиво, если нисходящий, то оно неустойчиво. Это
общее утверждение, полученное из общей модели, верно, конечно, и для моделей
(19.6) и (19.7). Характеристика трения модели (19.6) качественно изображена на
рис. 19.6. Для нее
∂F
=h. (19.14)
∂u u = v
Для модели (19.7)
∂F
= β + 3γ v 2 . (19.15)
∂u u =v

Поэтому состояние равновесия x = F(v)/k, x& = 0 этих моделей устойчиво соответ-


ственно при положительных h и β + 3γv2 и неустойчиво при отрицательных.
Сказать еще что-нибудь о модели (19.10), не уточняя вида характеристики
трения, едва ли возможно, так что обратимся к более конкретизированным моде-
лям (19.8) и (19.9).
Уравнение (19.8) перепишем в виде:
m&x& + hx& + kx = F0sign (v − x& ) + h u .
В полуплоскостях x& > v и x& < v своей фазовой плоскости x, x& = y оно прини-
мает вид:
m&x& + hx& + kx = m F0 + h u , (19.16)
т.е. в каждой из них является линейным осциллятором со смещенным в точку
h F
x = v m 0 &, x& = 0
k k
состоянием равновесия (в отличие от привычной записи, когда равновесие нахо-
дится в точке x = x& = 0 ). Величина h, по предположению, мала, поэтому фазовые
портреты – устойчивый фокус при h > 0 и неустойчивый при h < 0. При этом
«скручивание» и «раскручивание» фазовых траекторий происходит в силу мало-
сти h медленно, так что существенное изменение фазовых траекторий уравнений
(19.16) по отношению к фазовым траекториям ранее рассмотренных уравнений
(19.4) произойдет только с замкнутыми фазовыми траекториями, охватывающими
точку (F0/k, 0) (см. рис. 19.4) (точнее, близкую к ней в силу малости h точку
( F0 /k + hv /k , 0) ). Эти изменения при сколь угодно малых h > 0 и h < 0 разные и
представлены на рис. 19.7,а и б. Ранее рассмотренный случай относится к h = 0. В
первом случае при h > 0 всякое движение оканчивается устойчивым состоянием
равновесия O с координатами F0 /k и 0. Во втором, когда h < 0, это равновесие не-
устойчиво и всякое движение оканчивается устойчивым периодическим движени-
ем − автоколебанием, изображаемым на рис. 19.7,б замкнутой кривой Г (на рисун-
ке она выделена жирной линией).
19. Неустойчивость и автоколебания, вызываемые трением 149
.
x
.
v–x<0

O1 O2

O
–F0 /k F0 /k x

.
v–x>0

а)
.
x
.
v<x

O1 O2
O
–F0 /k F0 /k x
Γ

.
v>x
б)

Рис. 19.7. Фазовые портреты систем типа маятника Фроуда:


а) при характеристике трения вида, показанного на рис.19.6,а;
б) при характеристике трения вида, показанного на рис. 19.6,б
Эти качественные изменения имеют место при сколь угодно малом h. Это
подтверждает и обосновывает сделанное ранее утверждение о некорректности ма-
тематической модели (19.3), совпадающей с рассматриваемой моделью при h = 0.
При h ≠ 0 математическая модель (19.8) корректна. Это следует из общей теории
грубости – структурной устойчивости – динамических систем второго порядка.
Поэтому можно надеяться, что полученный результат имеет общий характер, т.е.
справедлив для любых монотонных не очень крутых характеристик трения, воз-
растающих и убывающих. Конечно, не лишнее, прежде чем делать такое предпо-
ложение, посмотреть на дисплей компьютера. Кроме того, следует иметь в виду,
что сделанные аппроксимации силы трения предполагают не очень большие ве-
личины x& и v.
Перейдем к модели (19.9). Ее характеристика трения состоит из падающего и
последующего восходящего участков (см. рис. 19.6,в). Возьмем за образец прове-
денное ранее исследование динамики лампового генератора, описываемого урав-
нением Ван-дер-Поля.
Пусть v > 0 и x& мало. Запишем уравнение (19.9) в виде:
m&x& + kx = F0 + β v + γv3 + (−β − 3γv 2 ) x& + 3γvx& 2 − γx& 3 = a0 + a1 x& + a2 x& 2 + a3 x& 3 .
150 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Это дифференциальное уравнение после замены переменных ξ = x – a0/k приво-


дится к виду:
&ξ& − 2δ(1 − aξ& − bξ& 2 )ξ& + ω2ξ = 0 , (19.17)
где 2δ = a1/m, a = a2/ma1 , b = a3/ma1 и ω2 = k/m. При a = 0 оно очень похоже на
уравнение Ван-дер-Поля. Член aξ& , как будет видно из дальнейшего, несуществе-
нен. Уравнение (19.17) с a = 0 и уравнение Ван-дер-Поля являются простейшими
математическими моделями автоколебательных систем.
Приступим к исследованию уравнения (19.17). Как и ранее, примем, что
ξ = A cos (ωt + ϕ), (19.18)
& 2 2 2
и найдем производную по времени от энергии E = (ξ + ω ξ ) / 2 соответствующе-
го линейного осциллятора:
dE d ω2 A2 & &&
= = ξξ + ω2ξξ& = [2δ(1 − aξ − bξ& 2 )ξ& ]ξ& =
dt dt 2 (19.19)
= 2δ[1 + aωA sin(ωt + ϕ) − b ω2 A2 sin 2 (ωt + ϕ)]ω2 A2 sin 2 (ωt + ϕ) .
Напомним, что эти последние вычисления выполняются в пренебрежении члена-
ми с A& и ϕ& , т.е. при A& = ϕ& = 0.
Интегрируя (19.19) по периоду 2π/ω, находим что
ω2 A2  2 2 1  2π
∆ =  δω A − δbω4 A4 
2  2  ω
или
4πδA2
∆ ( A2 ) = − 2πδbωA4 . (19.20)
ω
Из (19.20) следует рекуррентное соотношение для последовательных ампли-
туд An и An+1:
 4πδ  2
An2 +1 = 1 + 4
 A n − 2πδbωAn , (19.21)
 ω 
которое можно рассматривать как точечное отображение полупрямой в себя. Его
неподвижной точке A = 0 соответствует состояние равновесия, устойчивое при
δ < 0 и неустойчивое при δ > 0. При b > 0 имеется еще одна неподвижная точка
1 2
A* = , (19.22)
ω b
которая устойчива при δ > 0, т.е. при неустойчивости равновесия.
Для характеристики трения вида, изображенного на рис. 19.6,в, и приближен-
но аппроксимируемой полиномом (19.7), если скорость v лежит на ее падающем
участке, δ > 0 и b > 0 и, следовательно, состояние равновесия неустойчиво и воз-
никают автоколебания с амплитудой, приближенно определяемой формулой
(19.22) (рис. 19.8).
19. Неустойчивость и автоколебания, вызываемые трением 151
.
x
.
v <x

O1 O2
Γ

–F0 /k F0 /k x

.
v >x

Рис. 19.8. Фазовый портрет системы типа маятника Фроуда


при наличии падающего участка характеристики трения,
показанного на рис. 19.6,в
С некоторой долей оптимизма можно надеяться, что так же будет для любой
характеристики вида, изображенного на рис. 19.6,в (но при δ малом).
152 Ю.И. Неймарк. Математическое моделирование как наука и искусство

20. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ


ЛИНЕЙНОГО ОСЦИЛЛЯТОРА
Мы познакомились с простейшими физическими реализациями линейного
осциллятора: масса на пружине при наличии вязкого трения и электрический кон-
тур, состоящий из индуктивности, емкости и сопротивления. Теперь нам предсто-
ит рассмотреть, каков результат воздействия на эти объекты гармонической силы
и, соответственно, напряжения (рис. 20.1). Математическая модель в обоих случа-
ях одна и та же и имеет вид:
&x& + 2δx& + ω2 x = a cos νt . (20.1)
Мы значительно облегчим себе выкладки в этом и подобных случаях, если
прибегнем к так называемой комплексной форме записи, заменив уравнение
(20.1) уравнением
&x& + 2δ x& + ω2 x = aeiνt . (20.2)
Понимать его можно как то, что его действительная часть – это и есть рассматри-
ваемое уравнение (20.1) и, в соответствии с этим, a exp (iνt) – это комплексная
запись действительного воздействия a cos νt, а в (20.1) x есть действительная часть
x, входящего в (20.2).

E cos νt
h k C

m R

Fcosνt
а) б)
Рис. 20.1. Условное изображение конкретных реализаций механического (а)
и электрического (б) осцилляторов с действующими на них внешними
гармоническими воздействиями: силой F cos νt и напряжением E cos νt

Решение неоднородного уравнения (20.2) состоит из общего решения одно-


родного, которое хорошо нам известно, и какого-нибудь решения неоднородного
уравнения, которое мы постараемся найти. Будем его искать в виде x =
= A exp(iνt), т.е. как колебания той же частоты, что и внешнее воздействие
a exp (iνt) . Прямая подстановка дает
( − ν 2 + 2δνi + ω2 ) A = a ,
откуда
a
A= 2 2
. (20.3)
ω − ν + 2δ νi
20. Вынужденные колебания линейного осциллятора 153

Если предположить, что общее решение однородного уравнения при t → ∞


исчезает – это имеет место при δ > 0 и ω2 > 0 , то остающееся при неограниченном
возрастании времени колебание осциллятора (20.2) совпадает с найденным нами
частным решением неоднородного уравнения
a
x= 2 2
e iνt . (20.4)
ω − ν + 2δνi
Выясним, что оно собою представляет. Начнем с общего рассмотрения. Пусть
x = K (iν)e iνt , (20.5)
где K(iν) – комплексная функция частоты ν. Реальный смысл имеет действитель-
ная часть (20.5). Найдем ее, сохранив за ней обозначение x:
x = Re ( K (iν)eiνt ) = Re [| K (iν) | ei ( νt + arg K (iν )) ] = | K (iν) | cos(νt + ϕ) ,
где ϕ = arg K(iν) .
Таким образом, найденное нами частное решение (20.4), которое устанавли-
вается с возрастанием t при асимптотической устойчивости осциллятора, назы-
ваемое поэтому вынужденным колебанием, является гармоническим колебанием
с частотой внешнего воздействия ν, амплитудой | K (iν) | и фазой ϕ = arg K(iν).
Обратите внимание, что характеристики вынужденного гармонического ко-
лебания – амплитуда и фаза – находятся по одному и тому же комплексному чис-
лу K(iν), которое определяет эти величины как функции частоты внешнего воз-
действия ν. Благодаря этому зависимость K(iν) получила наименование ампли-
тудно-фазовой частотной характеристики, т.е. характеристики, объединяющей
частотные зависимости амплитуды и фазы одновременно.
Частотной амплитудно-фазовой характеристике можно придать геометриче-
ски наглядную форму. Для этого на комплексной плоскости W нарисуем годограф
(кривую), пробегаемую комплексной точкой W = K(iν) при изменении ν от 0 до ∞
(рис. 20.2). Длина радиуса-вектора точки W этой кривой, отвечающего частоте ν,
дает амплитуду, а угол с действительной осью – фазу соответствующего вынуж-
денного колебания.
Кривая-годограф, отвечающая формуле (20.3), легко строится по трем своим
характерным точкам, для которых ν = 0, ν = ω и ν = ∞ (рис. 20.3). При малом δ > 0
годограф сильно вытягивается вдоль отрицательного направления мнимой оси,
принимая при ν = ω значение –ia/2δω. Начинается он в точке ν = 0 и кончается в
точке ν = ∞.
По амплитудно-фазовой частотной характеристике рис. 20.3 легко построить
амплитудную зависимость – резонансную кривую – и фазовую зависимость от
частоты внешнего воздействия ν. Эти зависимости при разных δ > 0 качественно
представлены на рис. 20.4. Из них следует широко известное явление амплитудно-
го резонанса – большое возрастание амплитуды вблизи ν = ω при δ << 1 – и менее
известное, но не менее замечательное явление противофазы вынужденных коле-
баний по отношению к внешнему воздействию при ν > ω. При δ = 0 фаза колеба-
ний зависит от частоты ν разрывно: при ν < ω она равна нулю, а при ν > ω она
равна –π . При небольшом δ > 0 эта зависимость уже непрерывная, но с быстрым
154 Ю.И. Неймарк. Математическое моделирование как наука и искусство

изменением фазы ϕ вблизи ν = ω (рис. 20.5). Резонанс тем ярче выражен, чем
меньше затухание δ. При малом δ максимальная амплитуда достигается примерно
при ν = ω, а точнее, при ν = ω2 − 2δ 2 , ибо именно при этом значении частоты
внешнего воздействия достигается максимум модуля величины A, определяемой
формулой (20.3) (см. рис. 20.4).

W = K(iν) ν=∞ ν =0

ν=∞
ν=0

Рис. 20.2. Амплитудно-фазовая частотная Рис. 20.3. Амплитудно-фазовая частотная


характеристика W = K(iν) характеристика линейного осциллятора

A
ϕ
δ3
δ0 = 0 < δ1 < δ2

δ1 > δ2 > δ3 ω
δ2 ν

δ1 δ2
δ1

ν δ0
Рис. 20.4. Резонансные кривые Рис. 20.5. Фазовая частотная характеристика
для трех различных значений δ > 0 для трех убывающих значений коэффициента δ
Оба эти явления ярко иллюстрируются бортовой и килевой качками корабля
на бегущих волнах. В обоих случаях приближенной моделью качки корабля явля-
ется осциллятор, на который действует внешняя гармоническая сила, на что в
свое время обратил внимание А.Н. Крылов. Особый интерес представляет килевая
качка корабля, когда при достаточно большой амплитуде воздействия волн на ко-
рабль их частота зависит от скорости и курса корабля. При неудачных курсе и
скорости набегающие волны могут иметь частоту, несколько большую собствен-
ной частоты килевой качки, и тогда явление резонанса будет еще сопровождаться
тем, что корабль не взбегает носом на приближающуюся волну, а опускается вниз
и зарывается в нее носом.
Найдем условия возникновения такой нежелательной и опасной качки. Пусть
θ – угол между направлениями движения волны со скоростью u и корабля, дви-
жущегося со скоростью υ навстречу волне. При этом скорость набегания волн на
20. Вынужденные колебания линейного осциллятора 155

корабль равна u + υ cos θ (рис. 20.6), а частота их набегания ν = 2πλ–1(u +


+ υ cos θ), где λ – длина бегущих волн. Пусть ω − частота собственных свободных
колебаний корабля. Тогда особенно опасна ситуация, когда при близости частот ν
и ω ν > ω, так как именно в этом случае имеет место близость к резонансу, а коле-
бания носа корабля находятся в противофазе с набегающей волной.
Следующий пример вынужденных колебаний системы несколько более слож-
ный, чем осциллятор. Основной его частью является машина на упругом основа-
нии под действием возникающей при ее работе гармонической силы. Ее матема-
тическая модель совпадает с (20.1). Периодическое воздействие может иметь сво-
ей причиной, например, наличие эксцентрических вращающихся деталей или де-
талей, поступательно движущихся туда и обратно с некоторой частотой ν. Под
влиянием этой силы машина начинает вибрировать, что может быть весьма неже-
лательным.
Как подавить или хотя бы уменьшить эти вибрации? Одним из эффективных
средств их подавления является динамический демпфер, который представляет
собой массу с пружиной, подсоединяемой к основной большой массе вибрирую-
щей машины (рис. 20.7).
υ m
u
θ
k Fe iνt

M
λ
K

Рис. 20.6. Курс корабля, движущегося Рис. 20.7. Схема механического резонансного
со скоростью υ под углом θ к набегающим демпфера вынужденных колебаний массы M
со скоростью u волнам гармонической силой Feiνt

Пусть величины перемещений машины и демпфера от их равновесных поло-


жений соответственно x и y; M и m – массы машины и демпфера, а K и k –
жесткости основания (крепления) машины и пружины демпфера. Математиче-
скую модель машины на упругом основании с динамическим демпфером (см.
рис. 20.7) можно записать в виде:
M&x& = − Kx − k ( x − y ) + Feiνt ,
(20.6)
m&y& = k ( x − y ).
В этой модели ради простоты трение не учитывается. Для реального расчета
динамического демпфера этот учет, конечно, необходим, но для наших целей де-
монстрационного характера он несущественен и только усложняет рассмотрение.
Уравнение (20.6) можно написать, исходя непосредственно из законов Нью-
тона или на основе функции Лагранжа, которая в данном случае равна
156 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Mx& 2 my& 2 Kx 2 k ( x − y ) 2
L= + − − ,
2 2 2 2
и, кроме того, есть силы
Q x = Fe iνt , Qy = 0 .
Найдем вынужденные колебания модели (20.6). В соответствии с предыду-
щим примем, что
x = Ae iνt , y = Beiνt , (20.7)
и подставим их в (20.6). Имеем
− Mν 2 A = − KA − k ( A − B ) + F ,
(20.8)
− mν 2 B = k ( A − B ),
откуда
F ( k − mν 2 )
A= ,
( K + k − Mν 2 )( k − mν 2 ) − k 2
, (20.9)
kF
B= .
( K + k − Mν 2 )( k − mν 2 ) − k 2
Из этих формул следует, что вынужденные колебания машины на основании
имеют амплитуду A, обращающуюся в нуль при
k − mν 2 = 0 . (20.10)
Масса демпфера при этом колеблется с амплитудой B = – F/k, так что пружины
демпфера действуют на массу машины с силой kBe iνt = − Fe iνt , в точности ком-
пенсирующей воздействие Feiνt. Так как, согласно (20.10), k = mν2, а масса m мала,
то амплитуда колебаний демпфера может быть большой и именно такой, чтобы
нейтрализовать воздействие на машину гармонической силы.
Это замечательный и удивительный результат: демпфер колеблется, а вибра-
ций машины нет. Однако как же заколебался демпфер? По-видимому, ответ мо-
жет быть только один: машина вначале колебалась и возбудила колебания демп-
фера, колебания демпфера подавили колебания машины и они исчезли, остались
одни колебания демпфера. Это довольно правдоподобно, но не совсем так, по-
скольку о вынужденных колебаниях, как об установившихся, можно говорить
только при затухании собственных, т.е. при наличии трения. Так что это может
быть так только при наличии исчезающе малых трений. Они, конечно, всегда есть
и все в конечном счете верно. Только при наличии очень малых трений вибрации
машины не отсутствуют, а очень малы.
Мы рассмотрели действие гармонической силы на линейный осциллятор,
нашли вызываемые им колебания и обнаружили явления синхронизма, резонанса
и сдвига фаз.
Синхронизм выражается в том, что гармоническое воздействие частоты ν вы-
зывает гармонические вынужденные колебания осциллятора той же частоты. Яв-
ления резонанса проявляются тем сильнее, чем меньше параметр трения δ > 0, так
что в резонансе амплитуда вынужденных колебаний неограниченно растет при
δ → 0.
20. Вынужденные колебания линейного осциллятора 157

Явление сдвига фазы – это ее зависимость от частоты воздействия ν. Она та-


кова, что при маленьких частотах сдвиг фаз близок к нулю, при больших – к –π ,
т.е. к противофазе. При δ → 0 эта зависимость приобретает скачкообразный ха-
рактер: при ν < ω сдвиг фаз равен 0, при ν > ω он равен –π.
Мы ввели еще понятие частотной амплитудно-фазовой характеристики K(iν),
так что в комплексной записи связь между гармоническим воздействием aeiνt и
вынужденными колебаниями Aeiνt записывается в очень простом виде:
A = K(iν)a, (20.11)
напоминающем закон рычага. Конечно, из этой записи следуют явления синхро-
низма, резонанса и сдвига фаз. Таковы успехи хорошей теории: сложное стано-
вится простым.
К этому краткому итогу наших исследований мне хочется сделать одно важ-
ное добавление. Формула (20.11) относится к гармоническому воздействию.
Нельзя ли ее обобщить на произвольное периодическое воздействие? Оказывает-
ся, это возможно. Возможно в силу применимости принципа суперпозиции и
представимости любого периодического воздействия в виде суммы гармониче-
ских. С представимостью вас познакомили в курсе математического анализа, где
она называется рядом Фурье.
Согласно теории рядов Фурье, периодическую функцию f (t ) с периодом
T = 2π/ν при выполнении для нас неограничительных условий можно записать в
виде:
f (t ) = ∑ a s cos sνt + bs sin sνt , (20.12)
где
T T
ν ν
2π ∫0 π ∫0
a0 = f (t )dt , as = f (t ) cos sνt dt ,

T
ν
bs = ∫ f (t ) sin sνt dt ( s = 1, 2, ...) ,
π0
или в виде

f (t ) = Re ∑ ( a s − ibs )e isνt . (20.13)
s =0
Последняя формула (20.13) означает, что периодическое воздействие являет-
ся суммой гармонических воздействий (в комплексном представлении)

f (t ) = Re ∑ сs e isνt , cs = a s − i bs . (20.14)
s =0
Такое представление функции f (t ) называется спектральным, частоты вхо-
дящих в него гармонических составляющих – его спектром. С нулевой частотой
входит постоянное воздействие величины c0 = a0. Гармоническая составляющая с
частотой ν называется основной, остальные воздействия, называемые гармоника-
ми, имеют частоты 2ν, 3ν, …. Амплитуды этих гармонических составляющих, ос-
новной и гармоник, равны соответственно | c1 |, | c2 |, ...
158 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Теперь, чтобы найти вынужденные колебания осциллятора, отвечающие про-


извольному периодическому воздействию f (t ) , достаточно воспользоваться
принципом суперпозиции. Отдельному гармоническому воздействию, входящему
в (20.14), отвечает вынужденное колебание
c s K (isν)e isνt , (20.15)
поэтому сумме воздействий (20.14), т.е. воздействию f (t ) , отвечает сумма выну-
жденных гармонических колебаний (20.15)

∑ cs K (isν)eisνt . (20.16)
s =0

Соответствующие (20.16) гармонические колебания имеют частоты sν, ам-


плитуды |cs K(isν)| и фазы arg [cs K(isν)]. Явление синхронизма сохраняется в том
смысле, что ответ осциллятора имеет тот же период, что и воздействие, явление
сдвига фаз при периодическом воздействии (20.14) теряет смысл, а явление резо-
нанса сохраняется, однако теперь резонанс возможен не только при ν =
= ω2 − 2δ2 , но и при sν = ω2 − 2δ2 с любым целым s, т.е. не только на основ-
ной частоте, но и на ее гармониках. Но в связи с тем, что cs → 0 при s → ∞, явле-
ние резонанса может проявляться только на не очень далеких гармониках. Это
при δ > 0; при δ = 0 резонанс возможен на любой гармонике.
Сказанное о периодическом внешнем воздействии на осциллятор может быть
обобщено на произвольное воздействие f (t ) . Это дальнейшее обобщение также
основывается на принципе суперпозиции, но исходит из более общих способов
представления воздействия f (t ) в виде суперпозиции более простых. При этом
под более простыми понимаются такие воздействия, для которых отклик осцилля-
тора может быть легко найден. Как было показано ранее, таким простым воздей-
ствием было гармоническое воздействие eiνt. Отклик на него также гармонический
и равен K(iν)eiνt, где K(iν) – амплитудно-фазовая частотная характеристика осцил-
лятора. Далее, мы воспользовались тем, что периодическое воздействие f (t ) пе-
риода T может быть представлено в виде ряда Фурье, т.е. в виде суперпозиции
гармонических колебаний частот 2πn/T с n = 1, 2, 3,… и некоторого постоянного
воздействия. Но, кроме ряда Фурье, существует еще интеграл Фурье, который
любую функцию f (t ) , достаточно быстро убывающую при t → ±∞ , представляет
в виде интеграла

∫ g ( ν)e
iνt
f (t ) = dν , (20.17)
−∞

т.е. тоже в виде суперпозиции гармонических воздействий g ( ν)e iνt dν частоты ν,


амплитуды |g(ν) dν | и фазы arg [g(ν) dν]. При этом, как известно, функция g(ν),
называемая преобразованием Фурье функции f (t ) , находится по формуле

1
g ( ν) = ∫
2π − ∞
f (t )e − iνt dt . (20.18)
20. Вынужденные колебания линейного осциллятора 159

На каждую гармоническую составляющую g ( ν)eiνt dν интегральной суммы


(20.17) откликом осциллятора является K (iν) g (iν)eiνt dν , а отклик на все воздей-
ствие f (t ) будет

∫ K (iν) g ( ν)e
iνt
x (t ) = dν . (20.19)
−∞
Наряду со спектральным представлением внешнего воздействия f (t ) воз-
можно и импульсное представление, т.е. представление f (t ) как последователь-
ности мгновенных воздействий – импульсов. В момент t за время dt величина это-
го импульса равна f (t ) dt, где длительность dt исчезающе мала. Задать такой им-
пульс с помощью обычных функций невозможно и это достигается с помощью
обобщенной функции, получившей название дельта-функции. Мгновенный еди-
ничный импульс в момент времени τ записывается в виде δ(t – τ) . Составить
представление об этом описании, об этой математической модели мгновенного
единичного импульса можно, представив его как предел пикообразной функции
ϕ(t – τ, ε), изображенной на рис. 20.8 при ε → 0.

ϕ(t − τ, ε)

Рис. 20.8. График импульсного воздействия

t
τ − ε/2 τ τ + ε/2
При этом предполагается, что несмотря на неограниченное сужение области
ширины ε возле точки τ, в которой функция ϕ(t – τ, ε) отлична от нуля, интеграл
∞ τ+ε / 2

∫ ϕ(t − τ, ε)dt = ∫ ϕ(t − τ, ε)dt (20.20)


−∞ τ−ε / 2

все время равен единице. Ясно, что такое требование ведет к неограниченному
росту функции ϕ(t – τ, ε) при ε → 0 и отсутствию предельной функции в обычном
понимании. Обойдем эту трудность, назвав предельную функцию обобщенной и
записав в виде δ(t – τ) . С помощью этой обобщенной функции любое воздействие
f (t ) можно записать в виде

f (t ) = ∫ f ( τ) δ(t − τ) dτ . (20.21)
−∞
Действительно, согласно теореме о среднем,
∞ τ+ ε / 2

∫ f ( τ) δ(t − τ) dτ = lim
ε→0 ∫ f ( τ) ϕ(t − τ, ε) dτ =
−∞ τ−ε / 2
160 Ю.И. Неймарк. Математическое моделирование как наука и искусство

τ+ε / 2
= lim f ( ~τ ) ∫ ϕ(t − τ, ε) dτ = f (t ).
ε→ ∞
τ−ε / 2
Напомним, что ~τ – это некоторое значение, лежащее в суживающемся ин-
тервале (t – ε/2, t + ε/2).
Формула (20.21) – это представление внешнего воздействия в виде суперпо-
зиции импульсных воздействий, описываемых обобщенной функцией δ(t – τ).
Обозначим отклик осциллятора на единичный импульс через ψ(t – τ). С его по-
мощью, согласно принципу суперпозиции, отклик осциллятора x(t) на произволь-
ное воздействие f (t ) можно записать в виде

x (t ) = ∫ f ( τ)ψ(t − τ)dτ . (20.22)
−∞
Осталось найти отклик ψ(t – τ) осциллятора на единичный импульс δ(t – τ) ,
т.е. на воздействие f (t ) = δ(t – τ). Но прежде чем приступить к поиску этого от-
клика ψ(t – τ), уточним условия его действия, как и то, что мы понимаем под от-
кликом осциллятора на воздействие f (t ) .
Дело в том, что движение осциллятора определяется его начальным состоя-
нием и последующим внешним на него воздействием. Поэтому естественно под
откликом на внешнее воздействие понимать только ту его часть, которая отвечает
этому воздействию, а не начальному возмущению осциллятора, его начальным,
отличным от нуля условиям. Итак, под ψ(t – τ) мы понимаем результат воздейст-
вия импульса δ(t – τ) при нулевых начальных условиях, т.е. мы хотим решить за-
дачу: найти решение дифференциального уравнения
&x& + 2δx& + ω2 x = δ(t − τ) (20.23)
при условиях
x ( τ − ξ) = 0 , x& ( τ − ξ) = 0 ( ξ > 0) . (20.24)
Позволим себе найти его не формально. Затем можно проверить прямой под-
становкой верность полученного результата.
Мгновенный импульс вызывает скачок скорости x& , а координата x, ввиду
бесконечной малости времени импульса и конечности скорости x& , не меняется.
Поэтому интегрируя (20.23) в пределах от τ – ε/2 до τ + ε/2 и устремляя ε к нулю,
имеем
∆x& = x& ( τ + 0) − x& ( τ − 0) = 1 ,
откуда x& ( τ + 0) = 1 , так как x& ( τ − 0) = 0 . К этому добавим, что x(τ + 0) =
= x(τ – 0) = x(τ) = 0.
Таким образом, откликом на воздействие δ(t – τ) является решение уравне-
ния:
&x& + 2δx& + ω2 x = 0 ,
x ( τ) = 0 , x& ( τ) = 1 ,
при t < τ равное нулю, а при t ≥ τ определяемое начальными условиями
20. Вынужденные колебания линейного осциллятора 161

x ( τ) = 0 , x& ( τ) = 1 .
Это решение, согласно (1.7), при ω2 – δ2 > 0 записывается в виде:
0 при t ≤ τ,
x ( t ) = ψ ( t − τ) =  − δ ( t − τ ) 1 (20.25)
 e sin Ω ( t − τ ) при t ≥ τ.

В заключение я хотел бы отметить, что полученная нами формула отклика
(20.22) (с учетом (20.25)) является прямым следствием использования новой, не-
привычной для вас обобщенной функции δ(t), обладающей свойством

 0 при t ≠ 0,
δ(t ) = 
∞ при t = 0,
∫ δ(t )dt = 1 . (20.26)
−∞

Несмотря на необычность функции δ(t), она всего лишь естественная матема-


тическая модель мгновенного импульсного воздействия. Одновременно она же –
математическая модель плотности единичной точечной массы на прямой или то-
чечного единичного заряда. Впервые эту функцию в науке ввел Хэвисайд в связи
с созданным им операционным исчислением, позднее – физик Дирак в связи с
разрабатываемой им квантовой физикой. Физики ее называют функцией Дирака,
математики – обобщенной δ-функцией или просто δ-функцией.
162 Ю.И. Неймарк. Математическое моделирование как наука и искусство

21. ПАРАМЕТРИЧЕСКОЕ ВОЗБУЖДЕНИЕ И СТАБИЛИЗАЦИЯ


В предыдущих лекциях мы рассмотрели действие внешней гармонической
силы на линейный осциллятор, в результате которого его дифференциальное
уравнение принимает вид:
&x& + 2δx& + ω2 x = a cos νt . (21.1)
Но воздействие, зависящее от времени, может вызывать и другие изменения
уравнения линейного осциллятора. Например, оно может состоять в том, что па-
раметр частоты ω2 меняется гармонически со временем и тогда уравнение осцил-
лятора принимает вид:
&x& + 2δx& + ( ω2 + ε cos νt ) x = 0 . (21.2)
Непосредственной физической моделью для уравнения (21.2) является масса
на пружине с переменной гармонически меняющейся жесткостью при наличии
вязкого сопротивления. С приемлемым приближением уравнением (21.2) описы-
ваются малые колебания маятника с вертикально гармонически колеблющейся
точкой подвеса. Если точка подвеса колеблется горизонтально, то с аналогичным
приближением приходим к уравнению (21.1).
Рассмотрим вместе оба этих случая, предполагая, что точка подвеса маятника
смещается по горизонтали и вертикали согласно законам u(t) и υ(t ) (рис. 21.1).

υ x
u

l
ϕ Рис. 21.1. Маятник с перемещаемой точкой
подвеса (u и υ − величины перемещений
в горизонтальном и вертикальном направлениях)
m

y
Для составления уравнений движения мы прибегнем к уравнению Лагранжа.
Выразим координаты x и y массы m маятника через смещения u(t) и υ(t ) и угол ϕ
отклонения его от вертикали (см. рис. 21.1):
x = u + l sin ϕ, y = υ + l cos ϕ
и запишем функцию Лагранжа
m
L = {(u& + lϕ& cos ϕ) 2 + ( υ& − lϕ& sin ϕ) 2 } + mg (l cos ϕ + υ) .
2
После несложных вычислений находим искомое уравнение Лагранжа в виде:
g 1 1
ϕ
&& + sin ϕ = − u&& cos ϕ + υ && sin ϕ
l l l
21. Параметрическое возбуждение и стабилизация 163

или, учитывая еще вязкое трение и заменяя sin ϕ на ϕ, а cos ϕ на 1, в виде:


1 1
&& + 2δϕ& + ω2ϕ = − u&& + υ
ϕ &&ϕ. (21.3)
l l
Уравнение (21.3) переходит в (21.1) и (21.2) соответственно при гармонических
горизонтальных (u = alν –2cos νt, υ = 0) и вертикальных (u = 0, υ = εlν–2 cos νt) ко-
лебаниях точки подвеса маятника.
Таким образом, если гармонически горизонтально перемещать точку подвеса
маятника, то это равнозначно действию на маятник гармонической силы. Если же
точку подвеса гармонически перемещать вертикально, то это равнозначно гармо-
ническому изменению частоты маятника. Это позволяет нам наглядно наблюдать,
что происходит с маятником в первом и втором случаях, описываемых дифферен-
циальными уравнениями (21.1) и (21.2). Воспользуемся этим, чтобы еще раз про-
демонстрировать явления синхронизма, сдвига фаз и резонанса, о которых была
речь в предыдущей лекции, а в заключение этой лекции продемонстрируем вывод
и исследование дифференциального уравнения (21.2). Для демонстрации я вос-
пользуюсь одной из сумочек присутствующих здесь студенток. Я держу ее за ре-
мешок на весу. Затем начинаю перемещать руку периодически вправо и влево.
Сумка начинает качаться в такт с рукой, демонстрируя явление синхронизма. Ре-
зонанс наступает тогда, когда сумка сильно качается, а перемещения руки прак-
тически незаметны; сумка колеблется влево, а рука перемещается вправо, когда
частота движения руки больше собственной частоты колебаний сумки, при мень-
шей частоте движения руки рука и сумка движутся одновременно вправо и влево.
Вернемся к уравнению (21.2). Путем замены переменных x = ye−δt в нем мож-
но убрать член вязкого трения и привести уравнение к виду:
&y& + (Ω 2 + ε cos νt ) y = 0 ,
где Ω 2 = ω2 – δ 2. В свою очередь, замена масштаба времени τ = νt позволяет оста-
вить в нем только два параметра, приведя его к виду широко известного уравне-
ния Матье:
&y& + ( ν −2Ω 2 + ε ν −2 cos τ) y = 0 ,
которое запишем, возвращаясь к исходным обозначениям, в виде:
&x& + ( ω2 + ε cos t ) x = 0. (21.4)
Исследование уравнения Матье (21.4) не очень просто и может служить при-
мером, когда хорошая идея порождает метод исследования, само исследование
ведет к вычислениям, а вычисления приводят к четким и неожиданным результа-
там.
Идея идет от великого математика А. Пуанкаре и состоит в сведении изуче-
ния решений уравнения Матье к точечному отображению. Метод и вычисления
состоят в построении, изучении и численном исследовании этого точечного ото-
бражения.
Пусть x и x& = y – начальные значения при t = 0, а x и y – значения этих же
переменных спустя время 2π. Значения x и y однозначно находятся по x и y, так
что
164 Ю.И. Неймарк. Математическое моделирование как наука и искусство

( x , y ) = T (x, y), (21.5)


где T – некоторый не известный нам однозначный оператор, переводящий x и y в
x и y.
Соотношения (21.5) можно трактовать и как точечное отображение точки
(x, y ) в точку ( x , y ). С такой трактовкой мы уже сталкивались при рассмотрении
динамики часов Галилея – Гюйгенса и «часов наоборот» (стохастического осцил-
лятора). Это были диаграммы Кенигса – Ламерея, которые геометрически пред-
ставляли одномерные точечные отображения. Теперь перед нами – двумерное то-
чечное отображение. К сожалению, столь же удобное геометрическое представле-
ние для него неизвестно. Но и без него использование точечного отображения
оказывается очень полезным. Полезность эта состоит в том, что продолжение ре-
шения уравнения Матье (21.2) с начальными условиями x, y на времени 2π, 4π,
6π, ... сводится к однократному, двукратному, трехкратному, и т.д. преобразова-
ниям (21.5), т.е. при любом целом положительном n и любом решении x(t),
y(t) = x& (t) уравнения Матье (21.2) имеет место
(x(2nπ), y (2nπ) ) = T n (x(0), y (0) ) . (21.6)
Этот очевидный факт сводит исследование поведения решений уравнения
Матье (21.2) при неограниченном возрастании времени t к рассмотрению итера-
ций (последовательных преобразований) точки (x, y).
Итак, идея состоит в том, чтобы вместо решений уравнения Матье (21.2) и
его трехмерного фазового портрета изучать отображение T плоскости переменных
x, y в себя. Найдем отображение T. Для этого надлежит проинтегрировать диффе-
ренциальное уравнение Матье (21.4) . Пусть мы это сделали для начальных усло-
вий x = 1, y = 0 и x = 0, y = 1. Обозначим эти решения ϕ1(t) и ϕ2(t). Тогда при про-
извольных начальных условиях x, y решение x(t) в силу линейности уравнения
Матье запишется в виде:
x(t) = x ϕ1(t) + y ϕ2(t)
и
y (t ) = x& (t ) = xϕ& 1 (t ) + yϕ& 2 (t ).
Поэтому
x = x ( 2 π) = ϕ1 ( 2 π) x + ϕ2 ( 2 π) y ,
y = x& ( 2π) = ϕ& 1 ( 2 π) x + ϕ& 2 ( 2 π) y , (21.7)
т.е. мы нашли отображение T, и оно оказалось линейным. Для его отыскания нам
потребовалось знание только двух частных решений ϕ1(t) и ϕ2(t). Даже не самих
решений, а только их значений и значений их производных при t = 2π.
Линейное отображение мы исследовать умеем, и как оно устроено нам хоро-
шо известно. Применим эти знания. Самым важным являются собственные значе-
ния матрицы линейного отображения T, т.е. корни квадратного уравнения
ϕ1 ( 2π) − λ ϕ2 ( 2 π)
=
ϕ& 1 ( 2 π) ϕ& 2 ( 2 π) − λ (21.8)

= λ2 − (ϕ1 ( 2π) + ϕ& 2 ( 2π))λ + ϕ1 ( 2π)ϕ& 2 ( 2π) − ϕ& 1 ( 2π)ϕ2 ( 2π) = 0 .


21. Параметрическое возбуждение и стабилизация 165
Это уравнение не общего вида: его свободный член равен единице. Действитель-
но, пусть
ϕ1(t) ϕ& 2 (t) – ϕ& 1 (t)ϕ2(t) = W(t).
При t = 0 W(t) = 1. Далее обнаруживаем, что W& (t) = 0 и поэтому W(2π) = 1,
т.е. свободный член тоже равен единице. Итак, характеристическое уравнение
(21.8) имеет вид:
λ2 – 2A λ + 1 = 0, (21.9)
где
2A = ϕ 1(2π) + ϕ& 2 (2π).
Корни λ1 и λ2 уравнения (21.9)
λ1,2 = A ± A2 −1
при A> 1 – действительные различные, один по модулю больше единицы, дру-
гой – меньше (следует иметь в виду, что произведение корней равно единице);
при A< 1 – корни комплексные сопряженные, по модулю равные единице. Пе-
реход от первого случая ко второму происходит при A = 1: при A = 1 – через
двойной корень, равный единице, и при A = –1 – через двойной корень, равный
минус единице.
Как известно, при различности корней λ1 и λ2, т.е. A ≠ 1, линейное отобра-
жение T после однородной линейной замены переменных (возможно, комплекс-
ной) представимо в диагональном виде:
u = λ1u , v = λ 2v . (21.10)
При A > 1 корни λ1 и λ2 – действительные, замена переменных также дей-
ствительная и, согласно (21.10), отображение T в одном направлении сжимающее,
а в другом – растягивающее. При A < –1 растягивание и сжатие сопровождаются
еще симметричным отображением относительно преобразуемой в себя точки
x = y = 0, совпадающей с точкой u = v = 0. Ясно, что при этом почти все точки x,
y при последовательных преобразованиях удаляются в бесконечность. Исключе-
ние составляют точки линии u = 0 или v = 0, вдоль которой имеет место сжатие
(соответствующее λ по модулю меньше единицы).
Из этого следует, что при A > 1 состояние равновесия x = y = 0 уравнения
Матье неустойчиво и почти все его решения со временем неограниченно возрас-
тают. Имеет место так называемое параметрическое возбуждение колебаний ос-
циллятора, при котором амплитуда колебаний неограниченно растет.
При A < 1 ситуация совсем другая. В этом случае λ1 и λ2, как и перемен-
ные u и v, – комплексные сопряженные. Перейти к действительным переменным
можно с помощью замены
u+v u−v
ξ= , η= .
2 2i
В новых переменных ξ и η преобразование (21.10) и исходное для него (21.7)
(если учесть, что λ1 = λ2 = 1, и поэтому при некотором ϕ λ1 = cos ϕ – isin ϕ, а
λ2 = cos ϕ + isin ϕ) принимают вид:
166 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ξ = ξcos ϕ – ηsin ϕ, η = ξsin ϕ + ηcos ϕ,


т.е. в этих переменных являются вращением вокруг точки x = y = 0 на угол ϕ. Это
означает, что при неограниченном возрастании времени любое решение x(t)
v(t)= x& (t) уравнения Матье остается ограниченным, а его равновесие x = y = 0 яв-
ляется устойчивым.
Итак, при A > 1 имеет место неустойчивость с экспоненциальным возрас-
танием, а при A < 1 – устойчивость, не сопровождающаяся приближением к
равновесию. Граничный случай A = 1 позволим себе оставить без внимания.
Значение величины A определяется параметрами ω2 и ε уравнения Матье.
Эту зависимость не удается найти аналитически, но для любых ω2 и ε можно
вычислить соответствующее значение A. Это вычисление легко выполняется с
помощью ЭВМ. Представим себе, что мы ею воспользовались и нашли области на
плоскости параметров ω2 и ε , где A > 1 и где A < 1. При этом мы придем к
картинке, показанной на рис. 21.2.
На этой картинке есть детали, которые не могут быть выяснены вычисли-
тельно – это поведение граничных кривых вблизи оси ε. Доходят ли они до нее
или оканчиваются очень близко к ней и как именно ведут себя около нее? Но
именно этот вопрос может быть исследован аналитически, поскольку при этом
можно ограничиться малыми ε. Это аналитическое исследование было проде-
лано. Приведенный рис. 21.2 соответствует его результату: «носы» областей
неустойчивости упираются своими заострениями в ось ω в точках, для кото-
рых ω2 = n2/4 (n = 1, 2, ...).
ε

4
Рис. 21.2.Области по параметрам ω2 и ε
параметрического резонанса (заштрихованы)
2 и устойчивости параметрически возбуждаемого
осциллятора, описываемого уравнением
Матье (21.4)

0 2 4 ω2
Что же из этого следует в отношении движений осциллятора, описываемого
уравнением Матье? Отсюда следует не только удивительное явление параметри-
ческого возбуждения под влиянием гармонически меняющегося параметра, но и
возможность этого возбуждения при сколь угодно малых амплитудах изменения
параметра, если только частота исходного приведенного невозмущаемого осцил-
лятора ω достаточно близка к одному из значений n/2 (это, конечно, при ω2 > 0).
Параметрическое возбуждение удивительно потому, что оно может происхо-
дить и тогда, когда при каждом фиксированном значении меняющегося параметра
осциллятор устойчив. Это еще более удивительно потому, что может происходить
21. Параметрическое возбуждение и стабилизация 167

при сколь угодно малых изменениях параметра, однако только при вполне опре-
деленных условиях на частоту осциллятора, точнее, на соотношение частоты ω
исходного осциллятора (2.9) и частоты ν изменения параметра ε. Это последнее
явление такого же типа, как явление резонанса при вынужденных колебаниях ос-
циллятора, и потому получило наименование параметрического резонанса; но ес-
ли обычный резонанс (при δ = 0) происходит при равенстве частот осциллятора и
внешнего воздействия, то параметрический резонанс имеет место при счетной се-
рии соотношений частот, когда
n
ω= (n = 1, 2, ...). (21.11)
2
Наиболее ярко проявляется параметрический резонанс, отвечающий n = 1,
когда отношение частот осциллятора и параметрического воздействия ω и ν равно
1/2. Именно благодаря этому резонансу мы раскачиваемся на качелях, приседая и
вставая в два раза чаще, чем качания качелей. Приседания и вставания приводят к
изменению параметра длины маятника, что также с некоторым приближением
описывается уравнением Матье. «Понять» этот основной параметрический резо-
нанс можно с энергетической точки зрения, так как периодическое изменение же-
сткости или изменение длины маятника требует затраты работы, которая перехо-
дит в колебательную энергию качания маятника. Для подкачки энергии нужно
вставать, когда вас сильнее давит вниз, и приседать, когда это давление меньше:
внизу вставать, в верхних положениях приседать. Ясно, что при этом мы совер-
шаем работу и, значит, раскачиваем качели.
Параметрическое возбуждение в основном резонансе можно трактовать, как
преобразование колебаний частоты ν в колебания с частотой ν/2. При обычном
резонансе деления частоты не происходит: вынужденные колебания происходят с
той же частотой, что и внешнее воздействие. Это преобразование частоты широко
используется в технике, в так называемых параметрических преобразованиях час-
тоты. В ряде случаев параметрический резонанс, как и обычный, приводит к
крайне нежелательным и даже опасным колебаниям, например, при возбуждении
колебаний спаренных колес электровоза, в силу того, что жесткость их соедине-
ния зависит от угла поворота колес.
В трактовке результатов исследования уравнения Матье, предполагалось, что
отсутствует диссипация и δ = 0. При обычном резонансе с появлением диссипа-
ции амплитуда колебаний становится конечной вне зависимости от величины
воздействия. Для параметрического резонанса это не так. Амплитуда колебаний и
при наличии диссипации может расти неограниченно. Нужно только, чтобы ам-
плитуда изменения ε превосходила некоторый предел. То есть граница неустой-
чивости располагается несколько выше указанной на рис. 21.2 линии. Параметри-
ческое возбуждение имеет место выше этой линии. Естественно, что эта линия с
ростом δ смещается все выше и выше.
Внимательно посмотрим на рис. 21.2. На нем области устойчивости и неус-
тойчивости изображены как при ω2 > 0, так и при ω2 < 0. Штриховка относится к
областям неустойчивости. Штриховка при ω2 > 0 означает параметрическое воз-
буждение. При ω2 < 0 осциллятор неустойчив и при ε = 0, и поэтому при ω2 < 0
область неустойчивости примыкает к оси абсцисс. При ω2 > 0 «носы» областей
168 Ю.И. Неймарк. Математическое моделирование как наука и искусство

неустойчивости указывают на явление параметрического резонанса, а наличие


областей устойчивости при ω2 < 0, напротив, − на явление параметрической ста-
билизации статически неустойчивого осциллятора – перевернутого маятника.
На этом рассказ об осцилляторе с параметрическим гармоническим воздейст-
вием можно было бы закончить. Однако отчего же при обычном резонансе даже
малая диссипация делает амплитуду вынужденных колебаний конечной, а при па-
раметрическом резонансе она продолжает неограниченно расти?
Рассмотрим процесс нарастания амплитуды при обычном резонансе в отсут-
ствие диссипации. Ему соответствует решение дифференциального уравнения
&x& + ω2 x = a cos ωt (21.12)
при нулевых начальных условиях x = x& = 0 при t = 0. Это решение легко находит-
ся и имеет вид:
x = At sin ωt, (21.13)
где после прямой подстановки выясняется, что A = a/2ω.
Таким образом, рост амплитуды при обычном резонансе пропорционален
времени. Убывание же амплитуды, вызываемое δ > 0, экспоненциальное, так что
рост амплитуды обязательно приостановится. При параметрическом резонансе
все иначе. Нарастание амплитуды при неустойчивости (A > 1) имеет экспоненци-
альный характер, и показатель этой экспоненты может быть больше по величине
показателя – δ экспоненциального затухания. Следовательно, обычный резонанс с
помощью диссипации можно подавить лишь частично, уменьшив амплитуду. Для
параметрического резонанса это подавление полное, поскольку превращает неус-
тойчивое равновесие в устойчивое. Однако если это подавление недостаточное, то
амплитуда продолжает экспоненциально расти.
В заключение я, как обещал, продемонстрирую вам параметрическое возбуж-
дение, но только для главного резонанса, когда ν = 2ω, с помощью той же знако-
мой вам сумочки на ремешке. Как видите, я ее поднимаю и опускаю в два раза
чаще, чем она может качаться, и она начинает раскачиваться. Затем это раскачи-
вание нарастает, но, конечно, не до бесконечности, так как с ростом ее колебаний
становится неприемлемой наша модель.
Более сложные нелинейные модели вынужденных и параметрических коле-
баний рассмотрены сотрудниками кафедры теории управления и динамики машин
в работах [7–10] и др.
22. Нормальные колебания и биения 169

22. НОРМАЛЬНЫЕ КОЛЕБАНИЯ И БИЕНИЯ


Ранее мы познакомились с замечательной математической моделью – линей-
ным осциллятором. Его обобщением являются системы взаимодействующих, свя-
занных осцилляторов и линейные динамические системы. Последующий рассказ
ознакомит вас с некоторыми новыми явлениями и фактами, относящимися к этим
обобщениям линейного осциллятора. Изложение не будет носить общего характе-
ра, оно ограничится простым примером, осмыслив который, вы все же получите
некоторое представление о том, что нового может быть в многомерных линейных
динамических системах.
Пример: две массы, перемещения которых вдоль прямой сдерживаются тремя
пружинами (рис. 22.1).
k µ k
m m

x
Рис. 22.1. Два гармонических осциллятора, взаимодействующих
друг с другом посредством упругой связи жесткости µ

Массы одинаковые и равные m, крайние пружины равных жесткостей k. Ме-


жду массами – пружина жесткости µ. Если x1 и x2 – смещения масс от их равно-
весных положений, то дифференциальные уравнения Ньютона непосредственно
записываются в виде:
m&x&1 = − kx1 − µ( x1 − x2 ) ,
m&x&2 = − kx2 + µ( x1 − x2 )
или
m&x&1 + ( k + µ) x1 = µ x2,
(22.1)
m&x&2 + ( k + µ) x2 = µ x1.
Если в правых частях этих уравнений положить µ = 0, то мы придем к двум,
никак не связанным между собой линейным осцилляторам. Несущественным, но
упрощающим последующие выкладки обстоятельством является то, что осцилля-
торы, получаемые фиксированием одного из них (x1 или x2 равно нулю), имеют
одинаковые частоты ω = ( k + µ) / m . Это естественно, и в соответствии с (22.1)
наталкивает на мысль рассматривать систему (см. рис. 22.1) как два взаимодейст-
вующих осциллятора: первый действует на второй с силой µx1, а второй на пер-
вый – с силой µx2. Каков же будет результат этого взаимодействия? Для того что-
бы ответить на этот вопрос, необходимо найти решение системы (22.1). Это дела-
ется так же, как и для одного линейного осциллятора, путем поиска решений вида
x1 = a1 eλt, x2 = a2 eλt, (22.2)
170 Ю.И. Неймарк. Математическое моделирование как наука и искусство

когда обе переменные x1 и x2 меняются пропорционально eλt. Такое решение, точнее,


отвечающие ему действительные решения, называются нормальными колебаниями,
т.е. колебаниями, когда все части системы колеблются с одной и той же частотой, но,
возможно, с разными амплитудами. После подстановки (22.2) в (22.1) приходим к
двум уравнениям:
(mλ2 + k +µ)a1 – µa2 = 0, µa1 + (mλ2 + k +µ)a2 = 0. (22.3)
Это два уравнения относительно трех неизвестных a1, a2 и λ. Ясно, что найти
их однозначно не удается. Это и сразу было понятно, потому что наряду с (22.2)
решением является и любое другое, получаемое умножением (22.2) на один и тот
же множитель. Исключая переменные a1 и a2 или пользуясь общей теоремой ли-
нейной алгебры о наличии у линейной однородной системы ненулевого решения,
приходим к характеристическому уравнению для возможных значений λ:
mλ2 + k + µ −µ
χ( λ ) = 2
= 0. (22.4)
−µ mλ + k + µ
Это уравнение легко решается (так и был подобран пример) и оказывается, что
k k + 2µ
λ1,2 = ±i
= ±iω1 , λ 3,4 = ±i = ±iω2 . (22.5)
m m
Теперь, подставляя последовательно в (22.3) полученные значения λ (22.5),
находим постоянные a1 и a2 с точностью до множителя. При этом следует под-
ставлять найденные значения λ только в одно из уравнений (22.3), так как они ли-
нейно зависимы.
При λ = λ1,2 имеем
µa1 – µa2 = 0
или
a2 = a1.
При λ = λ3,4
–µa1 – µa2 = 0
или
a2 = – a1.
Таким образом, мы нашли частные решения вида
x1 = a e iω1t , x2 = a e iω1t
и вида
x1 = a e iω2t , x2 = –a e iω2t .
Им отвечают следующие действительные решения:
cos cos
x1 = a ω1t , x2 = a ω1t (22.6)
sin sin
и
cos cos
x1 = a ω2 t , x2 = −a ω2 t . (22.7)
sin sin
22. Нормальные колебания и биения 171

Эти решения, при которых обе массы колеблются с одинаковой частотой, на-
зываются нормальными колебаниями. Их частоты разные, ω1 и соответственно
ω2 , причем ω2 > ω1 . Для первого нормального колебания амплитуды колебаний
обеих масс одинаковы и они колеблются в фазе. Во втором – амплитуды тоже
одинаковы, но колебания происходили в противофазе. Это означает, что при пер-
вом нормальном колебании обе массы колеблются вместе вправо и влево. При
втором, напротив, навстречу друг другу с большей частотой. Любое другое дви-
жение рассматриваемой системы двух масс или связанных осцилляторов – это су-
перпозиция нормальных колебаний (22.6) и (22.7). Складывая колебания (22.6) и
(22.7), можно получить много различных графиков, но, пожалуй, самый интерес-
ный возникает при ω1, близком к ω2, так как при этом наблюдается неожиданное
явление последовательной перекачки энергии от одного осциллятора к другому,
когда графики изменений x1 и x2 имеют вид, показанный на рис. 22.2.
x1

Рис. 22.2. Явление биений в колебаниях x2


двух связанных осцилляторов

Частоты ω1 и ω2 близки друг к другу, согласно (22.5), когда µ мало, что и бу-
дем предполагать. При этом, пользуясь комплексной записью колебаний, имеем
x1 = C1 e iω1t + C2 e iω2t ,
x2 = C1 e iω1t – C2 e iω2t
или, несколько преобразовывая эту запись в предположении, что C1 ≥ C2,
 C 
x1 = C1e iω1t 1 + 2 ei ( ω2 −ω1 )t  ,
 C1 
(22.8)
 C 
x2 = C1e iω1t 1 − 2 e i ( ω2 − ω1 )t  .
 C1 
Каждое из этих колебаний в силу записи (22.8) и условия ω1 ≈ ω2 можно трак-
товать, как колебание с частотой ω1 и медленно меняющимися амплитудами, рав-
ными величинам
C2 i ( ω2 − ω1 )t
1± e ,
C1
находящимся в пределах от 1 –C2/C1 до 1 +C2/C1.
Частота изменения амплитуды мала и равна ω2 – ω1. Мы предположили, что
C1 ≥ C2; при C1 ≤ C2 аналогично пришли бы к колебаниям частоты ω2
172 Ю.И. Неймарк. Математическое моделирование как наука и искусство

с медленно меняющейся амплитудой в пределах от 1 –C2 /C1 до 1 +C2 /C1.


Это подтверждает график на рис. 22.2. При этом полнота перекачки энергии от
одного осциллятора к другому зависит от отношения C2 /C1. При C1 = C2
перекачка полная, при C2 = 0 или C1 = 0 она отсутствует, но это имеет место толь-
ко при нормальном колебании с частотой ω1 или ω2 , т.е. в тех случаях, когда мас-
сы колеблются вместе либо навстречу друг другу.
Этот простой пример следует рассматривать как введение в разнообразный,
подчиненный принципу суперпозиции мир колебаний связанных осцилляторов и
линейных систем, в частности, образующих цепочки, кристаллические решетки
или отдельные молекулы, с их затейливыми спектрами нормальных колебаний и
многообразием их форм и суперпозиций. Качественно новыми, пожалуй, будут
нормальные колебания в виде стоячих и бегущих волн, ярко проявляющихся при
большом числе осцилляторов. Эти волновые явления перебрасывают мостик от
скромного линейного осциллятора к колебаниям распределенных сред, соответст-
вующих неограниченно большому их числу.
Перейдем к описанию наглядной демонстрации обнаруженного нами явления
биений или перекачки энергии от одного осциллятора к другому и обратно. И это
несмотря на малость связей осцилляторов между собой, когда жесткость µ мала,
но при близости частот каждого из осцилляторов при µ = 0. То есть перекачка
энергии от одного осциллятора к другому и обратно происходит при близости их
частот в условиях резонанса. Становится понятным, почему малая связь влечет за
собой значительные последствия – полную перекачку энергии с одного осцилля-
тора на другой.
Эту перекачку можно наглядно показать с помощью двух одинаковых маят-
ников с общей осью, соединенных между собой слабой пружинкой или резинкой
(рис. 22.3). Если качнуть один из маятников, то он начнет раскачивать другой до
тех пор, пока сам не остановится, после чего уже его начнет раскачивать раска-
чавшийся маятник и т.д. Эта взаимная раскачка обусловлена малым силовым, но
резонансным их взаимодействием.
Аналогичное явление резонансной перекачки энергии можно наблюдать, ко-
гда одна из связей между осцилляторами силовая, а другая – параметрическая.
Представьте себе грузик, висящий на длинной пружинке. Он может качаться
вверх и вниз, а может еще колебаться, как маятник (рис. 22.4).

x2

x1 Качания
x2
Колебания
x1
Рис. 22.3. Упруго связанные Рис. 22.4. Маятник с упругим подвесом
осцилляторы в виде маятников как два связанных осциллятора:
от x1 к x2 связь параметрическая,
от x2 к x1 – силовая
22. Нормальные колебания и биения 173

Частоты этих колебаний разные, и пусть все подобрано так, что частота коле-
баний в два раза больше частоты качаний. Тогда при колебаниях грузика перио-
дически меняется длина маятника и происходит параметрическое возбуждение
его качаний за счет, естественно, его колебаний. Далее, качания маятника вызы-
вают колебания грузика, так как сила инерции имеет частоту, удвоенную по от-
ношению к качаниям маятника. Все это приводит к очень интересной и красивой
последовательности переходов от колебаний к качаниям и обратно – от качаний к
колебаниям.
В заключение мне хотелось бы подчеркнуть, что формальная математическая
сторона нашей сегодняшней лекционной беседы в основном вам хорошо известна
из курса дифференциальных уравнений: вас там научили, как решаются системы
линейных дифференциальных уравнений с постоянными коэффициентами. В
этом плане ничего нового вы не услышали. Но мы придали некоторую образность
тому, что делали, введя понятие нормального колебания, его частот и форм и
представляя любое движение как суперпозицию нормальных колебаний. Чтобы
ощутить полезность этих общих наглядных представлений, попробуйте выяснить,
каковы возможные колебания трех равных масс, насаженных без трения на круго-
вое кольцо при условии, что сила притяжения каждой пары масс друг к другу за
счет сближающих их пружин пропорциональна углу между ними. По общим пра-
вилам эту задачу можно решать долго и нудно, а с использованием образного
представления нормального колебания решение потребует не более строчки.
174 Ю.И. Неймарк. Математическое моделирование как наука и искусство

23. СТАБИЛИЗАЦИЯ ПЕРЕВЕРНУТОГО МАЯТНИКА


Я хочу рассказать вам об универсальном методе, который позволяет карди-
нально менять свойства разнообразных объектов, на простом примере превраще-
ния неустойчивой, всегда падающей, вертикально стоящей палочки в устойчивую,
саму по себе стоящую. Этот универсальный метод, широко используемый живой
природой и человеком, называется управлением. Вертикально поставленная па-
лочка стоять не может. Она обязательно упадет. Заставить ее не падать могут в
цирке. Это делают жонглеры едва заметными перемещениями ее точки опоры.
Они меняют положение ее точки опоры так, что палочка или другой предмет сто-
ит вертикально и не падает. Как они это делают? Попробуем это понять, построив
математическую модель стабилизации вертикального маятника.
Итак, перед нами плоский маятник с перемещаемой точкой опоры (рис. 23.1).
Угол отклонения маятника от вертикали пусть ϕ, горизонтальное смещение точки
опоры в плоскости качания маятника u, длина маятника l, масса m. Найдем функ-
цию Лагранжа и составим с ее помощью уравнения движения.

m y

ϕ Рис. 23.1. Перевернутый маятник с углом ϕ


отклонения от верхнего неустойчивого положения

u x
Непосредственно находим координаты x, y масссы m маятника
x = u – l sin ϕ, y = l cos ϕ.
Далее находим кинетическую и потенциальную энергии
m m
T = [(u& − lϕ& cos ϕ) 2 + l 2 ϕ& 2 sin 2 ϕ] = (u& 2 − 2lu& ϕ& cos ϕ + l 2 ϕ& 2 ),
2 2
V = mgy = mgl cos ϕ
и функцию Лагранжа
m 2
(u& − 2lu& ϕ& cos ϕ + l 2 ϕ& 2 ) − mgl cos ϕ.
L = T −V = (23.1)
2
Составляем уравнение Лагранжа
d ∂L ∂L
− = 0. (23.2)
dt ∂ϕ& ∂ϕ
В рассматриваемом случае
23. Стабилизация перевернутого маятника 175

∂L ∂L
= − mlu& cos ϕ + ml 2 ϕ& , = mlu&ϕ& sin ϕ + mgl sin ϕ ,
∂ϕ& ∂ϕ
и поэтому уравнение (23.2) принимает вид:
− mlu&& cos ϕ + mlu&ϕ& sin ϕ + ml 2 ϕ
&& − mluϕ& sin ϕ − mgl sin ϕ = 0
или
g u&&
ϕ
&& −
sin ϕ = cos ϕ .
l l
Ограничимся малыми углами ϕ и упростим это уравнение, записав его в виде:
g 1
ϕ
&& − ϕ = u&& . (23.3)
l l
При u = 0, т.е. при неподвижной точке опоры маятника, уравнение (23.3) пе-
реходит в хорошо нам известное уравнение маятника, линеаризованное вблизи
верхнего неустойчивого положения равновесия. Это неустойчивое равновесие ти-
па седла. А мы хотим, чтобы оно стало устойчивым равновесием типа узла или
фокуса. Как этого достигнуть? Воспользуемся возможностью выбора смещения u
точки опоры, возможностью управлять ее положением. Как это нужно делать, мы
не знаем, но хотим, чтобы уравнение (23.3) превратилось в уравнение
&& + 2δϕ& + ω2 ϕ = 0
ϕ (23.4)
осциллятора с устойчивым положением равновесия ϕ = 0, т.е. чтобы маятник,
стоя кверху, вел себя так же, как если бы он висел вниз и колебания его затухали
(δ > 0).
Сравнивая (23.3) и (23.4), находим, что для этого нужно, чтобы
u&& = −( g + lω2 )ϕ − 2lδϕ& . (23.5)
Реализовать такое u можно, наблюдая за маятником и измеряя его отклонение
ϕ и скорость отклонения ϕ& и сообщая точке опоры ускорение u&& согласно форму-
ле (23.5).
Способ управления, задаваемый формулой (23.5), называют стратегией
управления. Как уже говорилось, для ее реализации нужно измерять ϕ и ϕ& , и, ес-
тественно, прикладывать к точке опоры силу, которая бы сообщала точке опоры
требуемое ускорение u&& . Таким образом, для реализации управления нужна изме-
рительная и исполнительная системы. В цирке обе эти функции с успехом выпол-
няет жонглер.
Описанный процесс управления можно изобразить схемой, показанной на
рис. 23.2. Схема включает в себя объект управления – перевернутый маятник, на
который можно воздействовать, перемещая его опору; систему измерения угла ϕ
и угловой скорости ϕ& ; систему управления, реализующую стратегию управления
и силовое воздействие, передвигающее опору перевернутого маятника и сооб-
щающее ей требуемое стратегией управления ускорение.
Что же собою представляет стратегия управления (23.5)? Она линейна по ϕ и
ϕ& , так что u&& = –aϕ – b ϕ& , причем требуется для устойчивости, чтобы a > g, а
176 Ю.И. Неймарк. Математическое моделирование как наука и искусство

b > 0. При b = 0 перевернутый маятник также устойчив, но его колебания возле


равновесия не затухают, так как они описываются осциллятором (23.4) с δ = 0.

Объект ϕ Система
измерения
.. Рис. 23.2. Принципиальная схема стабили-
u зации стоящего вертикально вверх маят-
ника, отображающая основной принцип
Система управления – обратную связь
управления .
ϕ, ϕ

Первый член стратегии управления aϕ – это управление по отклонению ма-


ятника ϕ. Согласно этому члену, основание маятника нужно перемещать ускорен-
но в ту же сторону, что и наклон маятника, т.е. при ϕ > 0 u&& < 0, а при ϕ < 0 u&& > 0.
Следующий член корректирует величину ускорения u&& , учитывая угловую
скорость вращения маятника. Если маятник движется в ту же сторону, что и его
отклонение, то это приводит к увеличению необходимого ускорения u&& по сравне-
нию с членом aϕ, напротив, если он движется в сторону, обратную по отношению
к отклонению, то это ускорение уменьшается по величине, становясь меньше aϕ.
Перейдем теперь от жонглирования палочкой к управлению лодкой (судном
или кораблем). Целью управления является поддержание определенного курса ее
движения, а средством воздействия – руль. Если рулем не управлять, то лодка
может двигаться в любую сторону или вообще все время будет менять курс.
Построим математическую модель движущейся со скоростью v лодки и мо-
дель ее управления, т.е. модель движения управляемой лодки.
Пусть лодка движется с постоянной скоростью v, так что сила сопротивления
ее движению компенсируется силой тяги весел или гребного винта. Если набе-
гающий на лодку поток направлен точно вдоль ее корпуса, то никакой момент сил
не возникает. Момент сил (пусть относительно ее центра масс) возникает только
тогда, когда набегающий поток отклоняется от продольной оси лодки, от направ-
ления ее киля. В грубом приближении угол расхождения скорости движения цен-
тра масс лодки и направления ее продольной оси определяется скоростью ее вра-
щения ϕ& и вызывает момент, равный –h ϕ& , где в зависимости от конструкции
лодки коэффициент h может быть положительным или отрицательным. При этом
изменение угла ϕ поворота лодки относительно ее центра масс, без учета воздей-
ствия руля, описывается уравнением вида:

&& = −hϕ& , (23.6)
где J – момент инерции лодки. Как видим, лодка, как объект управления, пред-
ставляет собою осциллятор с нулевой жесткостью.
Интегрируя уравнение (23.6), находим, что
J ϕ& + hϕ = const. (23.7)
Наличие первого интеграла (23.7) позволяет непосредственно указать фазо-
вые портреты лодки, движущейся без руля, изображенные на рис. 23.3,а, б. Рису-
нок 23.3,а относится к h > 0, а рис. 23.3,б – к h < 0. В обоих случаях лодка имеет
23. Стабилизация перевернутого маятника 177

множество равновесий, отвечающих фазовым точкам оси ϕ& = 0, при которых


лодка движется с постоянной скоростью под некоторым постоянным углом ϕ.
. .
ϕ h>0 ϕ h>0

ϕ ϕ

a) б)
Рис. 23.3. Фазовые портреты неуправляемого объекта управления
(корабля или лодки): а) устойчивого и б) неустойчивого
При h > 0 эти равновесия устойчивые и любое движение лодки переходит в
движение в каком-то постоянном направлении. Напротив, при h < 0 состояния
равновесия неустойчивы и лодка стремится быстрее и быстрее вращаться
(рис. 23.3,б). Так как наше линеаризованное упрощенное уравнение (23.6) спра-
ведливо только для не очень больших ϕ& , то сказанное нужно понимать, как то,
что лодка не может придерживаться определенного курса и обязательно будет
вращаться.
При h > 0 состояния равновесия устойчивые, но эта устойчивость не асимпто-
тическая и малейшее возмущение движения лодки вообще приводит к неустрани-
мому изменению направления движения лодки.
Примем, что ϕ = 0 отвечает требуемому курсу движения лодки. Из предыду-
щего следует, что ни при h > 0, ни тем более при h < 0, лодка не может устойчиво
придерживаться заданного курса ϕ = 0.
Для того чтобы лодка его придерживалась, надо ею управлять, например, с
помощью руля. Пусть ψ – угол отклонения руля (рис. 23.4).

Рис. 23.4. Лодка (корабль), уклонившаяся


на угол ϕ, с рулем, повернутым на угол ψ
ψ
ϕ=0

При ψ ≠ 0 давление текущей воды на руль создает вращающий момент и


уравнение (23.6) заменится уравнением

&& + hϕ& = −kψ . (23.8)
Такое уравнение приемлемо, конечно, только при не очень больших ψ. Урав-
нение (23.8) предполагает ϕ& и ψ малыми, а ϕ может быть любым. Кроме того,
следует иметь в виду, что теперь коэффициент h относится не к лодке без руля, а
к лодке с закрепленным рулем (ψ = 0). Отличие может быть значительным при
178 Ю.И. Неймарк. Математическое моделирование как наука и искусство

большой площади руля и приводит к увеличению параметра h. При отрицатель-


ном, но небольшом |h| это может сделать его положительным, что кардинально
изменит управляемость лодки. Для придания лодке нового свойства асимптотиче-
ской устойчивости движения по требуемому курсу ϕ = 0 используем ту же страте-
гию, что и для жонглирования палочкой, а именно, примем, что
ψ = aϕ + b ϕ& . (23.9)
Подставляя (23.9) в (23.8), находим, что

&& + ( h + b)ϕ& + kaϕ = 0 . (23.10)
Состояние равновесия ϕ = 0 этого дифференциального уравнения – линейно-
го осциллятора – будет устойчивым, если все коэффициенты его характеристиче-
ского уравнения
Jλ2 + (h + b)λ + ka = 0 (23.11)
положительные, т.е. при выполнении условий h + b > 0, ka > 0, которые нетрудно
выполнить, выбирая соответствующие a и b,
a > 0, b > –h. (23.12)
Итак, лодка, управляемая стратегией (23.9) при условии (23.12), асимптоти-
чески устойчива на курсе. Смысл стратегии при условии (23.12) прост. Он такой
же, как и в случае жонглирования палочкой, но если ранее требовалось достаточ-
но большое значение параметра a, то теперь при h < 0 это требование налагается
на параметр b. Из этого следует, что лодкой с h > 0 управлять сравнительно про-
сто. Напротив, при h < 0 это становится достаточно сложным, ибо требуется дос-
таточно большое и правильное реагирование на скорость вращения лодки.
Для этой правильной реакции есть даже свое название, нужно вовремя энер-
гично «одерживать» уходящую с курса лодку. Если лодка сама по себе устойчи-
вая (h > 0), то управление ею выглядит так: лодка влево – руль вправо, лодка
вправо – руль влево. При h < 0 стратегия управления значительно сложнее, глав-
ным в ней является идея «одерживания», «одерживания» даже при ϕ = 0, если
ϕ& ≠ 0.
Вернемся к жонглированию палочкой. Но прежде чем продолжить исследо-
вание, отметим, что цирковое жонглирование имеет много общего со стабилиза-
цией вертикального взлета и разгона ракеты. Как и палочка, ракета неустойчиво
торчит вверх и подпирается снизу реактивными двигателями. Конечно, для нее
нужны более точные и полные модели, но в принципе, все так же, как и для па-
лочки. А более точные модели требуются хотя бы потому, что нужно учесть уп-
ругость корпуса ракеты, влияние ее колебаний на показания измерительных при-
боров и процесс стабилизации, запаздывания реализации наблюдения и управле-
ния и, возможно, многое другое.
Все же снова о стабилизации перевернутого маятника. Стратегия (23.5) под-
держивает вертикальность перевернутого маятника, но при этом его точка опоры
может значительно смещаться, не имея тенденции к возврату. Спрашивается, а
можно ли стабилизировать верхнее положение маятника, сделав одновременно
асимптотически устойчивым и исходное положение точки опоры?
23. Стабилизация перевернутого маятника 179

Попробуем применить к этой более требовательной задаче стратегию такого


же вида, как и ранее, т.е. линейную по фазовым переменным объекта. Итак, мы
хотим стабилизировать маятник не только по ϕ, но и по координате точки опоры
u. Теперь фазовыми переменными маятника с перемещающейся точкой опоры бу-
дут переменные ϕ, ϕ& и u, u& , для которых примем уравнения
g u&&
ϕ
&& − ϕ = ,
l l (23.13)
u&& = aϕ + bϕ& + cu + du&,
где стратегия управления, как и ранее, − линейная функция всех фазовых пере-
менных.
Задача существенно усложнилась. Характеристическое уравнение, от корней
которого зависит устойчивость, не второго, а четвертого порядка. Найдем его. Из
(23.13) непосредственно находим характеристическое уравнение в виде определи-
теля
λ2 − g / l − λ2 / l
=0
a + bλ c + dλ − λ2
или, раскрывая определитель:
 b  g a g g
λ4 +  − d +  λ3 +  − c − +  λ2 + d λ + c = 0. (23.14)
 l  l l l l
Корни этого уравнения за счет выбора параметров a, b, c и d можно сделать
любыми. Это следует из того, что свободный член − любой за счет выбора c, ко-
эффициент при λ – за счет выбора d, коэффициент при λ2 – за счет выбора a и, на-
конец, коэффициент при λ3 – за счет выбора b.
Таким образом, подходящая стратегия вида
u&& = aϕ + bϕ& + cu + du& ,
при которой все корни уравнения (23.14) лежат слева от мнимой оси, обеспечива-
ет требуемую стабилизацию перевернутого маятника. Подчеркнем, что при c =
= d = 0, т.е. при стратегии управления u&& = − a ϕ − bϕ& , характеристическое уравне-
ние имеет два нулевых корня и равновесие ϕ = 0, u = 0 неустойчиво, что приводит
к уклонению u от нуля.
Рассмотрим еще вопрос о так называемой левитации, т.е. бесконтактном ус-
тойчивом «подвешивании» тела в некотором месте. Согласно легенде, так висит в
какой-то пещере гроб Магомета. Сразу же приходит мысль сделать это с помо-
щью магнитов, т.е. вывесить железный или содержащий железо предмет магни-
тами. Однако есть общая теорема, которая это запрещает, но ферромагнитный
шарик можно устойчиво подвесить с помощью управления, используя такую же
стратегию управления, как и ранее. Это очень соблазнительно, так как бескон-
тактная подвеска позволяет создавать многие новые высокоточные измеритель-
ные приборы и другие устройства, избавленные от неточностей и диссипаций, вы-
зываемых трением, не говоря уж об отсутствии подчас нежелательных контактов
с другими телами.
180 Ю.И. Неймарк. Математическое моделирование как наука и искусство

В детстве, возможно, вы безрезультатно пытались «вывесить» металлическое


перышко (или какой-либо небольшой железный предмет) магнитом: при этом пе-
рышко неизменно либо падало, либо прилипало к магниту. Управлять можно по-
ложением магнита, но значительно проще заменить магнит электромагнитом и
управлять его током I. При этом, как и ранее, нужна измерительная система по-
ложения и скорости вывешиваемого тела, а стратегия управления может состоять
в изменении тока как линейной функции этих измерений. При подходящем под-
боре параметров тело «свободно» и асимптотически устойчиво висит. Висящее
тело можно потрогать пальцем и почувствовать, что оно упирается, не желая ме-
нять своего места. Можно его завертеть и оно будет долго вращаться, так как тре-
ние о воздух незначительно. Можно трение уменьшить, откачав воздух, и тогда
оно будет вращаться еще дольше.
Мы рассмотрели жонглирование (стабилизацию) одного перевернутого маят-
ника, но нельзя ли таким же путем жонглировать с несколькими поставленными
друг на друга маятниками, управляя положением точки опоры только самого
нижнего? Кажется, что это нельзя сделать: верхние маятники упадут. Но посмот-
рим, что дает математическая модель. Ограничимся двумя маятниками с равными
длинами и массами, которые без потери общности примем единичными (рис.
23.5).
y
ϕ2
m ϕ1
l
m
Рис. 23.5. Двойной маятник с уклонениями
от вертикали на углы ϕ1 и ϕ1 + ϕ2 соответственно
l

В обозначениях рис. 23.5, полагая без ограничения общности m = l = 1, непо-


средственно находим, что функция Лагранжа L с учетом последующей линеари-
зации, т.е. сохранения в дифференциальных уравнениях Лагранжа только членов,
линейных относительно ϕ1, ϕ2, ϕ& 1 , ϕ& 2 , равна
1 g
L = ( 2u& 2 − 4u&ϕ& 1 − 2u&ϕ& 2 + 2ϕ& 12 + ϕ& 22 + 2ϕ& 1ϕ& 2 ) + gϕ12 + ϕ 22 .
2 2
Отсюда непосредственно находим, что имеют место уравнения:
2ϕ&&1 + ϕ
&& 2 − 2u&& − 2 gϕ1 = 0 ,
ϕ
&&1 + ϕ
&& 2 − u&& − gϕ 2 = 0
или
−ϕ&& 2 − 2 gϕ1 + 2 gϕ 2 = 0,
(23.15)
ϕ
&&1 + ϕ&& 2 − u&& − gϕ 2 = 0.
Как и ранее, примем стратегию управления в виде линейной функции всех
фазовых переменных, т.е.
23. Стабилизация перевернутого маятника 181

u&& = a1ϕ1 + b1ϕ& 1 + a2 ϕ 2 + b2 ϕ& 2 . (23.16)


Составим характеристическое уравнение системы (23.15) с учетом (23.16)
− 2g − λ2 + 2 g
=0
λ2 − a1 − b1λ λ2 − g − a 2 − b2 λ
или
λ4 − b1λ3 − ( a1 + 4 g )λ2 + 2 g (b1 + b2 )λ + 2 g ( g − a1 + a2 ) = 0 . (23.17)
Из вида характеристического уравнения (23.17) следует, что коэффициенты
при λ3, λ2, λ и λ0 могут быть любыми при соответствующем выборе параметров
стратегии управления b1, a1, b2 и a2.
Таким образом, стабилизация двух поставленных друг на друга палочек воз-
можна, и для этого достаточно надлежащим образом перемещать нижнюю точку
опоры в соответствии со стратегией управления (23.16). Естественно предполо-
жить, что аналогично возможно жонглировать и тремя стоящими друг на друге
палочками, и, может быть, даже любым их числом, и в соответствии с этим даже
заставить кусок веревки из руки стоять вертикально вверх. В юности я видел
фильм, где великолепный актер Игорь Ильинский перебрался через высокий за-
бор по вертикально поставленной веревке, которую он принес с собой в мешочке.
Это было заведомо не управление, она стояла сама по себе.
Вместе с тем, следует иметь в виду, что эта и предшествующие модели со-
ставлены в предположении идеальности как измерительной, так и исполнитель-
ной систем управления, т.е. что измерительная система достаточно точно и свое-
временно находит значения фазовых переменных, а исполнительная система бы-
стро и точно реализует требуемое управление (ускорение точки опоры, угла пово-
рота руля). При этом из рассмотренных нами математических моделей не ясно, в
какой мере можно уклониться от этих идеальных требований, как и то, каким об-
разом их можно осуществить.
Едва ли в общем курсе целесообразно сколько-нибудь подробно рассматри-
вать эти сами по себе важные вопросы – это удел специальных курсов. Поэтому
ограничимся сказанным и примером учета неизбежных задержек (запаздываний в
измерении ϕ и ϕ& и реализации управляющего ускорения u&& ) при стабилизации
вертикального положения маятника. В отсутствие этих задержек уравнение дви-
жения системы управления имело вид (уравнения (23.3) и (23.5)):
g
ϕ
&& − ϕ = −aϕ − bϕ& .
l
Учитывая временную задержку τ измерений ϕ и ϕ& и реализации управления,
заменим их уравнением
g
ϕ
&& (t ) − ϕ(t ) = −aϕ(t − τ) − bϕ& (t − τ) . (23.18)
l
Его характеристическое уравнение, составляемое обычным образом, полагая
ϕ = eλt, имеет вид:
g
λ2 − + ae − τλ + bλe − τλ = 0 . (23.19)
l
182 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Для того чтобы система управления, описываемая линейными дифференци-


альными уравнениями с запаздываниями (23.18), имела устойчивое состояние
равновесия ϕ = 0, как и в случае обыкновенного дифференциального уравнения,
нужно, чтобы корни его характеристического уравнения (23.19) лежали слева от
мнимой оси, т.е. удовлетворяли условию Re λ < 0. Расположение корней характе-
ристического уравнения (23.19) зависит от параметров стратегии управления a
и b. При отсутствии запаздывания, когда τ = 0, устойчивость имеет место при
a > g/l, b > 0. (23.20)
Как обнаруживает соответствующее исследование, с методикой которого вас
познакомят в курсе теории управления, при τ малых, меньших 2l / g , область
устойчивости по параметрам управления a и b существует и имеет вид, показан-
ный на рис. 23.6. При τ → 0 эта область устойчивости стремится к области D0, оп-
ределяемой неравенствами (23.20). При увеличении τ область устойчивости по
параметрам a и b на рис. 23.6 уменьшается (D1) и при τ = τ* = 2l / g исчезает.
При τ > τ* ее нет.
b 1
2
Рис. 23.6. Область стабилизируемости
3 перевернутого маятника и ее зависимость
от запаздывания τ реализации линейной
D1 стратегии управления. Граничные кривые
D0 0, 1, 2 и 3 соответствуют возрастанию
запаздывания. При τ = 0 область устой-
чивости a > g/l, b > 0; при τ, отвечающем
0 граничной кривой 3, область устойчиво-
сти исчезает
g/l a

Из сказанного следует: чтобы жонглирование было успешным, нужно не


только правильно выбрать параметры a и b стратегии управления, но и реализо-
вать измерения и управление достаточно быстро. Эта быстрота должна быть тем
большей, чем меньше длина палочки. Пытаясь жонглировать очень короткими
палочками, вы неизбежно потерпите поражение и по этой наименьшей, доступной
вам длине успешного жонглирования, можете судить о быстроте выполнения ва-
ми требуемого управления и, конечно, одновременно и об умении подобрать тре-
буемую стратегию управления.
Для палочки (шариковой ручки) длиной 16 см мне это никак не удавалось.
Осуществление жонглирования представлялось безнадежным. Она падала рань-
ше, чем я успевал что-либо сделать для предотвращения ее падения. Критическое
значение запаздывания для такой палочки равно примерно τ ≈ 0,17 с. Для τ* =
= 0,3 с соответствующая длина равна l = 45 см. Такой палочкой жонглировать уже
удается. Я имею в виду себя. А как у вас? При желании вы можете сопоставить τ*,
получающиеся для вас из экспериментов жонглирования, с прямым измерением
времени вашей реакции, которое вы можете провести с кем-нибудь из своих зна-
комых, располагая обыкновенной линейкой, причем интересно, что по такой же
23. Стабилизация перевернутого маятника 183

формуле τ = 2l/g , где l – минимальная длина падающей между вашими боль-


шим и указательным пальцами линейки, которую после отпускания на ваших гла-
зах, вам еще удастся зажать и не дать упасть. У меня вышло примерно 20 см, что
отвечает τ ≈ 0,2 с.
Мы познакомились на простых примерах с величайшей придумкой природы
и человека – управлением, без которого жизнь была бы невозможна. Человек
управляет своим поведением, с помощью управления через энзимы он осуществ-
ляет биохимические процессы в своем организме; зажигая электрический свет в
темной комнате, он нажатием выключателя управляет электрическим током; по-
ворачивая руль, управляет велосипедом, а нажимая на педали, заставляет его
ехать; руками и ногами управляет автомобилем; произнося команды, через других
людей управляет производственными процессами; посредством нервной системы
управляет сокращением и расслаблением мышц и, тем самым, движением своего
тела, биением сердца, дыханием, сокращениями и перистальтикой кишечника,
поступлением в желудок и двенадцатиперстную кишку необходимых для пище-
варения веществ. Посмотрите, как красиво бежит или скачет лошадь, грациозно
перемещается и движется кошка – это тоже благодаря управлению. А мимика на-
шего лица, отражающая внутренние психологические процессы, обогащающая
наше общение, да и сама наша речь возможна только благодаря управлению голо-
совыми связками, горлом и артикуляцией рта.
Человек создал и разработал новую науку – теорию управления, и она под-
сказала ему, как построить автопилот, авторулевой, как управлять ядерным реак-
тором, полетом самолета, работой станков и механизмов, как создать системы
связи и передачи информации и как управлять ракетой и своей собственной жиз-
нью на Земле, что наиболее трудно и еще далеко от совершенства. Да и сама наша
жизнь возможна лишь благодаря ферментам, управляющим биохимическими ре-
акциями в нашем организме, и нервной системе, управляющей сердцем и нашими
органами, движениями и действиями.
184 Ю.И. Неймарк. Математическое моделирование как наука и искусство

24. УПРАВЛЯЕМЫЙ МАЯТНИК И ДВУНОГАЯ ХОДЬБА


В предыдущих разделах я вам рассказывал об управлении на примерах жонг-
лирования – стабилизации одной и двух вертикально стоящих палочек – и управ-
ления курсом лодки. С этим вы встречаетесь, но сравнительно редко. Сейчас я
вам расскажу тоже о конкретном феномене управления, но с которым вы в со-
дружестве все время, пользуетесь им каждый день. Хотя жонглированием вы за-
нимаетесь тоже каждый день, поддерживая свое вертикальное положение, но мо-
дели этого жонглирования не те, что мы рассмотрели.
Простейший вид жонглирования своим телом – вы стоите, опираясь на обе
ноги. Стоите вы вполне уверенно, но все же немного, еле заметно, покачиваясь.
Прислушавшись к себе, можно заметить, как меняются усилия в опорных ногах.
Это подсказывает следующую модель управления в виде вертикального маятника,
в неподвижной точке опоры которого имеется управляющий момент M. В каждой
из двух перпендикулярных плоскостей имеют место линеаризованные уравнения
вида:
g 1
ϕ
&& − ϕ = 2 M .
l ml
Согласно предыдущему ясно, что стратегия, обеспечивающая ваше верти-
кальное положение, может быть очень простого вида:
M = aϕ + b ϕ& .
Но стоять вертикально вы можете не только опираясь на подошвы обеих ног,
но и встав на носки, т.е. опираясь на маленькую площадку, не позволяющую вам
создать момент M. Вы это делаете, двигая руками и корпусом, а если стоите на
одной ноге, то и другой свободной ногой. В этом случае оказывается, что для ста-
билизации вертикального положения достаточно одного управления корпусом. В
качестве упрощенной модели такого жонглирования примем двойной маятник с
закрепленной точкой опоры и управляемым моментом M в их сочленении. Для
написания математической модели в этом случае можно воспользоваться полу-
ченными ранее формулами для управляемого двойного маятника, положив в них
u = 0 и добавив к правым частям моменты M и –M соответственно. В упрощенном
линеаризованном виде, согласно формулам (23.14), (23.15), имеем:

&&1 + ϕ& 2 − 2 gϕ1 = M ,
ϕ
&&1 + ϕ
&& 2 − gϕ 2 = − M .
Стратегию управления в соответствии с предыдущим возьмем зависящей от
всех фазовых переменных, т.е. от ϕ1 , ϕ& 1 , ϕ 2 , ϕ& 2 , так что
M = a1ϕ1 + b1ϕ& 1 + a2 ϕ 2 + b2 ϕ& 2 .
Это приводит к характеристическому уравнению
2λ2 − 2 g − a1 − b1λ λ2 − a2 − b2 λ
=0
λ2 + a1 + b1λ λ2 − g + a2 + b2 λ
24. Управляемый маятник и двуногая ходьба 185

или
λ4 + (3b2 − 2b1 )λ 3+ (3a2 − 2a1 − 4 g )λ 2 + (b1 − 2b2 ) gλ + g ( 2 g + a1 − 2a2 ) = 0.
Коэффициенты полученного характеристического уравнения за счет выбора a1, b1,
a2, b2 могут быть любыми, и поэтому при надлежащем их выборе асимптотиче-
ская устойчивость равновесия ϕ1 = ϕ2 = 0 обеспечивается.
Итак, жонглирование двумя стоящими друг на друге перевернутыми маятни-
ками при закрепленной опоре возможно с помощью линейной стратегии управле-
ния моментом M в шарнирном соединении маятников. Природа тоже нашла такие
стратегии, они вырабатываются у нас после рождения в процессе обучения и,
возможно, что-то заложено генетически.
Таким образом, стоять мы умеем. Но мы умеем еще и ходить. Природа ходь-
бы кажется очень сложной: в ней участвуют многие десятки мышц нашего тела.
Вместе с тем феномен ходьбы в своем простейшем виде – это не более чем авто-
колебания, при которых все периодически повторяется. Добиться генерации ко-
лебаний, как это было видно на примере часов Галилея – Гюйгенса и генератора
электрических колебаний, рассмотренных ранее, можно с помощью обратной свя-
зи, управления, осуществляемого обратной связью. Выше указывались и много-
численные другие примеры применения управления и обратной связи для дости-
жения требуемых свойств различных объектов. Пожалуй, управление и обратная
связь по достоинству должны быть произведены в некий принцип обратной связи.
Именно так сделал Н. Винер и провозгласил новую, основанную на этом принци-
пе, науку кибернетику.
Но вернемся к двуногой ходьбе. Рассказ об этом феномене начнем издалека.
Мы рассмотрели и поняли, как жонглер заставляет не падать вертикально стоя-
щую палочку: он ею управляет. Управляет, перемещая ее точку опоры в зависи-
мости от ее движения. Ясно, что это не единственный способ управления пере-
вернутым маятником. Маятником можно управлять и иначе. Например, подсое-
динить к концу маятника еще одно звено и поддерживать его направление посто-
янным. Не задумывайтесь над тем, зачем это нужно, лучше сначала разберемся,
что из этого последует.
Итак, перед нами двойной маятник (рис. 24.1). Его звенья имеют длины l1 и
l2; массы, которые ради простоты сосредоточим на концах палочек, m1 и m2 ; углы
звеньев с вертикалью ϕ1 и ϕ2 . В сочленении звеньев маятника находится управ-
ляющее устройство, которое с помощью момента M между подсоединенным зве-
ном и маятником поддерживает угол ϕ2 постоянным, равным α. Момент M нам
неизвестен, но известно, что система уравнений справляется со своей задачей, так
что угол ϕ2 постоянно равен α.
y
m2
ϕ2
l2
m1

ϕ1
Рис. 24.1. Двойной маятник l1

x
186 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Составим математическую модель этого причудливо управляемого перевер-


нутого маятника.
Маятник с подсоединенным звеном – это двойной маятник. С ним вы уже
встречались, когда рассматривали жонглирование двумя стоящими одна на дру-
гой вертикальными палочками. Сейчас нас интересует другое: как будет двигать-
ся маятник под воздействием описанного управления.
Пусть x1, y1 и x2, y2 – координаты точечных масс m1 и m2. Непосредственно из
рис. 24.1 находим, что
x1 = – l1 sin ϕ1, y1 = l1 cos ϕ1,
x2 = –l1 sin ϕ1 – l2 sin ϕ2, y2 = l1 cos ϕ1 + l2 cos ϕ2.
Далее находим кинетическую энергию T и потенциальную функцию V сил тяже-
сти:
1 1
T = ( m1 + m2 )l12 ϕ12 + m2 l1l2 ϕ& 1ϕ& 2 cos(ϕ1 − ϕ 2 ) + m2 l2 2 ϕ 2 2 ,
2 2
V = ( m1 + m2 ) gl1 cos ϕ1 + m2 gl2 cos ϕ 2 .
Обобщенные силы Q1 и Q2, отвечающие моменту M управляющего устройст-
ва, равны: Q1 = M, Q2 = –M.
Теперь мы знаем функцию Лагранжа и дополнительные обобщенные силы и
можем написать уравнения Лагранжа:
( m1 + m2 )l12 ϕ
&&1 + m2 l1l2 ϕ&& 2 cos(ϕ1 − ϕ 2 ) − m2 l1l2 ϕ& 2 (ϕ& 1 − ϕ& 2 ) sin(ϕ1 − ϕ 2 ) +
+ m2 l1l2 ϕ& 1ϕ& 2 sin(ϕ1 − ϕ 2 ) − ( m1 + m2 )l1 g sin ϕ1 = M ,
(24.1)
m2 l 2 2 ϕ
&& 2 + m2l1l2 ϕ
&&1 cos(ϕ1 − ϕ 2 ) − m2 l1l2 (ϕ& 1 − ϕ& 2 )ϕ& 1 sin(ϕ1 − ϕ 2 ) −
− m2 l1l2 ϕ& 1ϕ& 2 sin(ϕ1 − ϕ 2 ) − m2 l2 g sin ϕ 2 = − M
или, учитывая, что ϕ2 = α ( ϕ& 2 = ϕ
&& 2 = 0)

( m1 + m2 )l12 ϕ
&&1 − ( m1 + m2 )l1 g sin ϕ1 = M ,
(24.2)
&&1 cos(ϕ1 − α) − m2 l1l2ϕ& 12 sin(ϕ1 − α) − m2 l2 g sin α = − M .
m2 l1l2 ϕ
Эта система уравнений определяет изменение угла ϕ1 маятника с вертикалью
и управляющий момент M. Исключая из этих уравнений неизвестный момент M,
приходим к уравнению для угла ϕ1. Опустив у угла ϕ1 индекс, запишем получив-
шееся дифференциальное уравнение второго порядка в виде:
[( m1 + m2 )l12 + m2 l1l2 cos(ϕ − α)]ϕ
&& −
(24.3)
− m2 l1l2 ϕ& 2 sin(ϕ − α) − ( m1 + m2 ) gl1 sin ϕ − m2 gl2 sin α = 0.
Для любого решения уравнения (24.3) каждое из уравнений (24.2) можно исполь-
зовать для нахождения момента M.
Приступим к изучению решений – фазового портрета – уравнения (24.3).
Прежде всего, приведем его к виду
&& − κϕ& 2 sin(ϕ − α) − ω2 sin ϕ − κω2 sin α = 0 ,
[1 + κ cos(ϕ − α)]ϕ (24.4)
содержащему только два параметра κ и ω:
24. Управляемый маятник и двуногая ходьба 187

m2 l 2 g
κ= , ω2 = .
m1 + m2 l1 l1
При κ = 0 уравнение (24.4) превращается в уравнение маятника, который при
ϕ = 0 стоит вертикально вверх. Оказывается, что уравнение (24.4) можно проин-
тегрировать. Для этого умножим его на [1+ κ cos (ϕ – α)] ϕ& :
[1 + κ cos(ϕ − α)]2 ϕ& ϕ
&& − κ[1 + κ cos(ϕ − α)]ϕ& 3 sin(ϕ − α) −
− ω2 [1 + κ cos(ϕ − α)]ϕ& sin ϕ − κω2 [1 + κ cos(ϕ − α)]ϕ& sin α = 0
и преобразуем к виду
1 d
{[1 + κ cos(ϕ − α)]2 ϕ& 2 } − [1 + κ cos(ϕ − α)]ω2 (sin ϕ + κ sin α)ϕ& = 0 .
2 dt
Интегрируя, находим, что
[1 + κ cos(ϕ − α)]2 ϕ& 2 + F (ϕ) = h , (24.5)
где h – постоянная интегрирования и
F (ϕ) = −2ω2 ∫ [1 + κ cos(ϕ − α)](sin ϕ + κ sin α)dϕ =
 3κ κ 
= 2ω2 cos ϕ − ϕ sin α + cos ( 2ϕ − α) − κ 2 sin α sin(ϕ − α) .
 2 4 
Разрешая (24.5) относительно ϕ& , имеем
1
ϕ& = ± h − F ( ϕ) . (24.6)
1 + κ cos(ϕ − α)
Как вы уже знаете, построение фазового портрета, согласно (24.6), сводится к
нахождению графика функции F(ϕ). Однако при κ ≥ 1 возможно неограниченное
возрастание угловой скорости при приближении угла ϕ к значению, при котором
1+ κ cos (ϕ – α) = 0. (24.7)
Этот неожиданный феномен проистекает оттого, что при реализации требуемого
управления управляющий момент M неограниченно растет, так как из уравнений
(24.2), исключая ϕ&& , находим, что

M=
m2 l1l2
1 + κ cos(ϕ − α)
[
ϕ& 2 sin(ϕ − α) + ω2 sin α − ω2 sin ϕ cos(ϕ − α) , ]
(24.8)

где ϕ1 заменено на ϕ.
Реализация неограниченного момента невозможна, и поэтому невозможно
соблюдение условия ϕ2 = α и мы вынуждены, если хотим изучить этот случай,
внести коррективы в рассматриваемую математическую модель. Эта корректи-
ровка может, например, состоять в том, что при достижении M некоей пре-
дельной величины принимается M = M *sign M до тех пор, пока M, определяемое
из (24.8), не окажется по модулю меньше M*. При этом углы ϕ1 и ϕ2 определяются
из уравнений (24.1). Однако ограничимся случаем, когда описанное явление не
имеет места. Отметим только, что это явление подобно удару и приводит к очень
быстрым изменениям скоростей ϕ& 1 и ϕ& 2 .
188 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Как уже отмечалось, для построения фазового портрета достаточно распола-


гать графиком функции F(ϕ), определяемой формулой (24.5). Вид графика функ-
ции F(ϕ) зависит от двух параметров κ и α. Достаточно очевиден его вид при ма-
лых κ и α. На рис. 24.2 приведен его вид при α > 0. Согласно этому графику, по-
строены фазовые траектории, определяемые уравнением (24.6) при разных h, со-
вокупность которых дает фазовый портрет на цилиндрическом фазовом простран-
стве, изображенном на рис. 24.3.
.
F

–π ϕ* π ϕ

Рис. 24.2. График функции F(ϕ) в формуле (24.6)


.
ϕ

O1 O1 ϕ
O

Рис. 24.3. Фазовый портрет на развертке цилиндра


управляемого двухзвенного маятника,
получаемый с помощью графика функции F(ϕ)

Физически то, что состояние рассматриваемого маятника имеет своим со-


стоянием ϕ и ϕ& , причем − π ≤ ϕ ≤ π и точки ϕ = π, ϕ& и ϕ = − π, ϕ& соответствуют
одному и тому же состоянию, очевидно. Но вместе с тем уравнение фазовых тра-
екторий (24.6) содержит ϕ , значение которого находится в пределах от − ∞ до
+ ∞ , причем никакой периодичности по этому ϕ нет и изображать кривые линии,
определяемые уравнением (24.6), надо на бесконечной плоскости − ∞ < ϕ < +∞,
− ∞ < ϕ& < +∞ . Как же согласовать это несоответствие и как уместить эти кривые
на линии на цилиндре так, чтобы они были фазовыми траекториями исследуемого
объекта.
Плоскость ( ϕ, ϕ& ), на которой можно поместить все кривые, определяемые
уравнением (24.6), можно разбить на бесконечное число полос ( mπ, ( m + 2)π ), где
m – любое нечетное целое число. На любой полосе располагаются кривые, опре-
деляемые уравнением вида
24. Управляемый маятник и двуногая ходьба 189

2ω2  3k 
ϕ& = ±  h − ϕ sin α + G (ϕ) ,
1 + k cos(ϕ − α)  2 
где G(ϕ) – периодическая функция с периодом 2π. Эти кривые в m-й полосе мож-
но перенести в полосу (−π, π), отвечающую m = −1, заменив ϕ на ϕ – (m + 1)π, что
эквивалентно замене h на h − 3k 2 ( m + 1) π sin α . Таким образом, все кривые, опи-
сываемые уравнением (24.6), оказываются на цилиндре и составляют фазовый ци-
линдрический портрет рассматриваемого управляемого двухзвенного маятника.
На этом фазовом портрете два состояния равновесия O и O1. Равновесие
O(ϕ = ϕ*), где ϕ* находится из условия sin ϕ* = –κ sin α, неустойчиво и отвечает
положению маятника, показанному на рис. 24.4, т.е. перевернутому маятнику.
Равновесие O1, отвечающее тому же условию, соответствует маятнику, висящему
вниз. Это равновесие устойчиво. Возле этого устойчивого равновесия возможны
колебания. Они соответствуют замкнутым фазовым траекториям, изображенным
на рис. 24.3 области, содержащей равновесие O1.
y
m2
α
l2
m1
Рис. 24.4. Положение двухзвенного маятника,
отвечающее неустойчивому равновесию
(точка О на фазовом портрете рис. 24.3) ϕ* l
1

x
Все остальные фазовые траектории, кроме граничных траекторий, сепаратрис
седла O, отвечают движениям с неограниченно возрастающей скоростью враще-
ния маятника ( ϕ& → ∞). Это неожиданный эффект управления вторым звеном ма-
ятника: стремление поддерживать второе звено под одним и тем же углом α к
вертикали приводит к ускоренному вращению основного звена маятника.
Мы привыкли, что маятник можно завращать, подталкивая его в одну и ту же
сторону, сильно крутанув рукой непосредственно или с помощью ременной или
зубчатой передачи. В этих случаях воздействие на маятник носит внешний харак-
тер. Но, оказывается, это можно сделать и иначе, с помощью подсоединения к не-
му управляемого маятника. Это приводит к тому, что основной маятник все быст-
рее и быстрее крутится.
Конечно, такое неограниченное раскручивание предполагает отсутствие дис-
сипации (вязкого и сухого трения). При учете диссипации, например, небольшим
вязким трением, возникает устойчивое вращение Г с некоторой скоростью, как
это видно из рис. 24.5. В области, охватываемой кривой, составленной из сепарат-
рис седла O, все фазовые траектории неограниченно приближаются к устойчиво-
му равновесию O1. Равновесие O − по-прежнему неустойчивое седло. С дальней-
шим увеличением коэффициента трения все движения сходятся к устойчивому
равновесию O1.
Нас будет интересовать случай, когда имеется устойчивое вращение Г, что
соответствует фазовому портрету рис. 24.5.
190 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Таким образом, в реальных условиях наличия потерь энергии описанное


управление приводит к вращению маятника. Мы уже отмечали необычность этого
способа порождения и поддержки вращения. В дополнение к этому отметим, что
этот эффект неожиданным образом используется человеком в организации его
двуногой ходьбы. Едва ли вы задумывались, как вы ходите. Но уже самое поверх-
ностное наблюдение обнаруживает, что при ходьбе вовсе не обязательно подтал-
кивать себя вперед ногами. Скорее при ходьбе ощущается, что какая-то «сила»
тянет вас, и вы только выставляете поочередно ноги вперед, чтобы не упасть. Эта
влекущая вас вперед сила ощущается не только при спуске, но и при ходьбе на
ровной дороге и даже чуть-чуть в гору. Эту влекущую вперед «силу» можно уве-
личить, наклонив еще немного корпус вперед.
Γ

O1 O O1 O

Рис. 24.5. Фазовый портрет перевернутого управляемого двойного маятника


с учетом диссипации

Понять, откуда берется эта тяга вперед, можно, обратившись к фазовому


портрету рис. 24.5, трактуя нашу ногу, на которую мы опираемся, как звено пере-
вернутого маятника, а подсоединенный к ней наш корпус – как подсоединенное
звено, которое мы поддерживаем под некоторым постоянным углом к вертикали:
при стоянии корпус вертикален, при ходьбе несколько наклонен вперед. Наша
опорная нога не может совершать полных вращений около своей точки опоры, она
лишь поворачивается на некоторый угол от –β до β, после чего нога H1 сменяется и
другая нога H2 поворачивается от –β до β. И так все время, пока вы не меняете длину
шага (рис. 24.6). При этом мы несколько упрощаем характер движения опорной ноги;
она не опирается одной точкой, опора осуществляется всей ступней. В целом это
движение со сменой ног уподобляется качению колеса со спицами без обода.
m2 m2 m2

m1 m1 m1
Рис. 24.6. Схема двуногой ходьбы как циклически
β –β β –β повторяемые движения управляемого двойного
маятника (автоколебательная ходьба)
H2 H1

В соответствии со сказанным проведем на фазовом портрете рис. 24.5 две


вертикальные линии ϕ = –β и ϕ = β (рис. 24.7).
24. Управляемый маятник и двуногая ходьба 191
.
ϕ

u u
u0 u1
ϕ=−β ϕ=β
Рис. 24.7. Фрагмент фазового портрета двойного маятника
с учетом диссипации

Фазовые траектории, покидая точки отрезка ϕ = –β, могут пересекать при


своем продолжении отрезок ϕ = β. Пусть на начальном отрезке ϕ& = u, а на ко-
нечном ϕ& = u . Отображение u в u рис. 24.7 имеет диаграмму, показанную на
рис. 24.8. Устойчивая неподвижная точка этой диаграммы точечного отображения
отвечает равномерной ходьбе, у которой каждый новый шаг начинается со скоро-
стью u, равной координате u* этой неподвижной точки. При этом если вы исполь-
зовали рис. 24.3, то диссипация полностью отсутствует, а если рис. 24.5, то она
есть в течение всего движения от ϕ = –β до ϕ = β.
u

u0
Рис. 24.8. Диаграмма Ламерея, обосновывающая
автоколебательную ходьбу

u0 u* u
При реальной ходьбе диссипация есть при перекатывании на опорной ноге и
особенно при смене ног, так как при смене опорной ноги происходит «толчок» ее
об опору, сопровождаемый потерей энергии. Тонкости механизма потери энергии
не влияют на качественно правильный вид диаграммы рис. 24.8, неподвижная
точка которой соответствует равномерной периодической ходьбе.
Резюмируя сказанное, отметим, что, как следует из предыдущего, не только
человек, но и природа придумали свое колесо и не только колесо, а и своеобраз-
ные способы его вращения; у человека способ вращения основан на управлении
положением корпуса и своевременной сменой ног, предотвращающей падение.
Можно еще отметить, что для динозавров, у которых κ > 1, этот способ требует
дополнительных опор, что, по-видимому, и делал динозавр, опираясь на громад-
ный хвост. Но это взгляд «сквозь магический кристалл»: детального анализа слу-
чая κ > 1 мы не провели.
192 Ю.И. Неймарк. Математическое моделирование как наука и искусство

25. ДИНАМИЧЕСКИЕ МОДЕЛИ ИГР, ОБУЧЕНИЯ


И ЦЕЛЕСООБРАЗНОГО ПОВЕДЕНИЯ
В последующих лекциях я расскажу вам о простейших динамических моде-
лях целесообразного поведения, игр и обучения. Разработка этих вопросов только
началась и в своем начале пересекалась с популярной дискуссией о том, «может
ли машина мыслить?» Дискуссия была бурной и, пожалуй, формально безрезуль-
татной: каждая из сторон осталась при своем мнении. Одни утверждали, что ма-
шина может мыслить, так как умеет решать сложные математические задачи,
подчас не доступные человеку, умеет доказывать геометрические теоремы, нахо-
дить выход из лабиринта, играть в шахматы, управлять ядерным реактором или
ракетой, «читать» чертеж и по нему управлять изготовлением соответствующей
детали и т.д. Другие возражали и говорили, что машина не мыслит, а лишь вы-
полняет действия, начертанные ей человеком.
Ясно, что каждая из сторон по-своему была права, что дискуссия не имеет
смысла, пока не договорились о том, что значит «мыслить», пока каждая из сто-
рон понимает это по-своему.
Где же этот водораздел между бездумным выполнением команд и предписа-
ний и разумным поиском решения и его осуществлением? Чем «мыслить» отли-
чается от выполнения некоторой программы действий? Ведь всякий разумный
подход тоже происходит по некоторому неведомому нам алгоритму. Возможно,
этот алгоритм не детерминированный, а включает в себя элементы случайности.
Может, в этой случайности и последующей фильтрации и есть суть мышления?
А, может быть, в ассоциациях и умении увидеть аналогии и использовать имею-
щиеся знания или, наконец, в умении извлечь выводы из неудачных и удачных
попыток? Но даже если все это так, то и это происходит в соответствии с некото-
рыми правилами.
Едва ли сегодня можно дать исчерпывающий ответ на эти вопросы: точно
определить, что означает «мыслить». Да и как это можно сделать, когда мы фак-
тически ничего не знаем о том, как работает наш мозг, которому мы приписываем
возможность мышления?
Но мы знаем, как работают создаваемые нами ЭВМ, и применительно к ним
можем попытаться установить, где наступает различие между «бездумным» вы-
полнением команд, предписанных человеком, а где начинается «мышление» ма-
шины. В признании способности ЭВМ мыслить нас не должно смущать, что этой
способностью машину наделил человек, ведь и человека ею тоже наделила при-
рода, миллиарднолетний эволюционный процесс, как мы сейчас думаем, сводя-
щийся к жесткому отбору случайных изменений.
Даже в этой специализированной суженной постановке вопроса едва ли сей-
час целесообразно стремиться к однозначным четким ответам, лучше лишь обсу-
дить их с вами, дав некоторую затравку для размышлений. Эта затравка состоит в
рассказе о простейших моделях, в которых обнаруживаются элементы того, что,
пожалуй, уже воспринимается как мышление.
25. Динамические модели игр, обучения и целесообразного поведения 193

Начнем с описания автоматных моделей целесообразного поведения и обуче-


ния. При этом субъект, принимающий решение, будет «мыслить» как некий авто-
мат с внутренним состоянием, от которого зависит принимаемое решение, а само
состояние определяется успешностью предшествующих решений. Идея и иссле-
дование таких моделей ведет начало от М.Л. Цетлина [47, 48]. Об использовании
автоматов для оптимизации и управления см. [43].
Пусть у автомата возможных действий только два, тогда все состояния делят-
ся на два класса: в одном принимается одно решение, в другом – другое. Обозна-
чим эти решения «+1» и «–1». Примером такой ситуации может быть решение во-
проса о том, в правой или левой руке находится монета, которая служит призом
при угадывании. Можно представить и ситуацию с выбором одной из двух кор-
мушек A или B, как изображено на рис. 25.1. С помощью кормушек изучалась
способность крыс к обучению. Крысу время от времени выпускали через дверцу в
помещение, из которого она могла пойти к одной из кормушек: направо A или на-
лево B. Пища помещалась время от времени то в одну, то в другую кормушку и
крыса в зависимости от того, куда она пошла, могла утолить свой голод или ос-
таться голодной до следующего раза.

A B
Рис. 25.1. Схема расположения двух кормушек
для проведения эксперимента по обучаемости
крыс или других животных или птиц

Первая ситуация соответствует игре в отгадывание, вторая напоминает жиз-


ненную ситуацию о том, куда отправиться за пищей.
Начнем с простейших автоматных описаний различных типов игроков: про-
стака, упрямца, хитреца и мистика. Будем считать, что игрок может находиться в
двух состояниях, и в одном он принимает решение –1, а в другом +1 (рис. 25.2).

Рис. 25.2. Два разных состояния x–1 x+1


автомата-игрока
–1 +1

Решения –1 и +1 означают соответственно, что игрок выбирает левую или


правую руку. Отгадывающий – отгадывая, загадывающий – кладя монету. То, ка-
кое состояние он имеет и как их меняет в зависимости от результатов предшест-
вующих игр, зависит от того, кто он: простак, хитрец, упрямец или мистик. Про-
стак считает, что если он выиграл, то не должен менять своего мнения – состоя-
ния о том, в какой руке монета. Напротив, если он проиграл, то состояние нужно
сменить. Пусть величины ξ = +1 и ξ = –1 означают, выиграл или, соответственно,
проиграл игрок предшествующее отгадывание. Тогда при ξ = +1 он не меняет
своего состояния и при ξ = – 1, напротив, его меняет, как это показано на
рис. 25.3.
194 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Хитрец же считает, что если он выиграл, то его партнер сменит положение


монеты и поэтому он должен, выиграв, сменить свое состояние. При проигрыше
он, напротив, не меняет состояние, так как думает, что его партнер сам его сме-
нит. Стратегия игры хитреца изображена на рис. 25.4.
ξ=1 ξ=1

x–1 x+1 x–1 x+1

ξ = –1 ξ = –1

x–1 x+1 x–1 x+1

Рис. 25.3. Граф смены состояний Рис. 25.4. Граф смены состояний
автомата-игрока «простак» в зависимости автомата-игрока «хитрец» в зависимости
от выигрыша (ξ = 1) или проигрыша (ξ = –1) от выигрыша (ξ = 1) или проигрыша (ξ = –1)
в предыдущей партии в предыдущей партии

Упрямец не меняет своего решения и находится все время в состоянии x–1 или
x+1 вне зависимости от результатов игры. Граф смен его состояний не зависит от
результата ξ предшествующей игры (рис. 25.5).
ξ = ±1
Рис. 25.5. Граф смены состояний автомата-игрока
«упрямец» в зависимости от выигрыша (ξ = 1)
x–1 x+1
или проигрыша (ξ = –1) в предыдущей партии

Мистик доверяет свое решение случаю, бросая некий, не обязательно


симметpичный, кубик и пpинимая в соответствии с этим независимо состояния x–1
или x+1 с веpоятностями p и q = 1 – p. При этом он не обращает внимания на свои
выигрыши и проигрыши, полностью полагаясь на свой талисман – кубик. Такое
поведение также можно описать (моделировать) автоматом с двумя состояниями,
но теперь его состояния меняются не в строгой зависимости от проигрыша или
выигрыша, а случайно в соответствии со стрелками и указанными на них вероят-
ностями графа смен состояний (рис. 25.6).
p 1–q q

x–1 x+1 Рис. 25.6. Граф вероятностей


1–p перехода «мистика» (p + q = 1)
ξ = ±1
Мы описали стратегию отгадывающего простака, хитреца, упрямца и мисти-
ка. Аналогичные стратегии могут быть у загадывающего простака, хитреца, уп-
рямца и мистика. Такие же стратегии могут быть и у крысы, ищущей пищу. Одна-
ко в случае крысы едва ли целесообразны стратегии хитреца, мистика или упрям-
ца. Хотя все зависит от того, каковы правила размещения пищи в кормушках.
В описании возможных стратегий игры в отгадывание мы ограничились дву-
мя состояниями и предполагали, кроме мистика, детерминированную их смену
25. Динамические модели игр, обучения и целесообразного поведения 195

после каждой партии в зависимости от ее результата. Число состояний можно


увеличить и их смене придать стохастический характер. Так можно ввести про-
стака с памятью, который не сразу меняет свое мнение, а после первой неудачи
только начинает сомневаться в нем и лишь при повторном проигрыше его меняет.
То, как происходит смена состояний у такого памятливого простака, изображено
на рис. 25.7.
ξ = +1

Рис. 25.7. Граф смен состояний


для «простака» с памятью ξ = –1
(так называемая линейная тактика игры)

На нем четыре состояния: крайние правое и левое соответствуют уверенно-


сти, какое надо принять решение; средние, напротив, тому, когда решение прини-
мается, но с некоторым сомнением. Ясно, что состояний может быть не четыре,
а любое число. Каждому из решений могут соответствовать не обязательно
равные числа состояний, как в предшествующем примере, где их по два. Можно
придумать и другие автоматные модели, например, с графом смены состояний
(рис. 25.8).

ξ = +1

Рис. 25.8. Автомат-игрок с памятью,


но другим графом смен состояний, ξ = –1
чем на рис. 25.7

На рис. 25.9 изображен граф смены состояний для принимающего решения


автомата с двумя состояниями, но в случае, когда их смена происходит случайно
с вероятностями 1 – p при выигрыше, когда ξ = +1, и, соответственно, с вероятно-
стями 1 – q при проигрыше, когда ξ = – 1. Игрок со стохастической стратегией,
изображенной на графе рис. 25.9: при p = 1, q = 0 – простак; при p = 0, q = 1 –
хитрец; при p = 1, q = 1 – упрямец.
p 1–p p

x–1 x+1
1–p
Рис. 25.9. Граф вероятностей перехода ξ = +1
для автомата-игрока «стохастик»
q 1–q q

x–1 x+1
1–q

ξ = −1
196 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Мы описали простейшие стратегии для игры в отгадывание у другого игрока


или у «природы». Природу также можно рассматривать как игрока, безразличного
к проигрышу или выигрышу.
В качестве простейших моделей стратегии стохастической природы можно
принять последовательность независимых решений с вероятностями p и q (p +
+ q = 1), как у мистика, или марковскую последовательность, определяемую не-
которой матрицей смен состояний. Например, имеется два состояния x–1 и x+1, в
них принимаются решения –1 и соответственно +1. Смена состояний x–1 и x+1
происходит случайно, с некоторыми неизменными вероятностями, например, δ
(рис. 25.10). Случайные независимые смены состояний x–1 на x+1 и наоборот могут
происходить и с разными вероятностями δ1 и δ2.
1–δ δ 1–δ
Рис. 25.10. Граф вероятностей перехода
x–1 x+1 «стохастика» при безразличии к выигрышу
δ или проигрышу

После того как мы познакомились с простейшими автоматными моделями


игроков, рассмотрим игру в отгадывание между двумя игроками: простаком и
хитрецом. Посмотрим, кто кого обыграет. Состояние одного игрока – простака −
обозначим x–1 и x+1, состояние второго – хитреца – y–1 и y+1. У них вместе будет
четыре состояния (x–1, y–1), (x+1, y–1), (x–1, y+1), и (x+1, y+1). В состояниях x–1 и y–1 от-
гадывающий выбирает левую руку, а загадывающий в нее берет монету, а в со-
стояниях x+1 и y+1 отгадывающий называет правую руку, а загадывающий в ней
держит монету. В состояниях (x–1, y–1) и (x+1, y+1) выигрывает отгадывающий, а в
состояниях (x–1, y+1) и (x+1, y–1) выигрывает загадывающий. Теперь можно нарисо-
вать граф смены состояний динамической системы загадывающий – отгадываю-
щий (рис. 25.11). Результат несколько неожиданный. Если выиграл первую пар-
тию отгадывающий простак, то он будет выигрывать и все остальные партии. Ес-
ли же выиграл первую партию загадывающий хитрец, то он будет выигрывать и
дальше.
ξ = –1 ξ = +1

x–1, y+1 x+1, y+1

Рис. 25.11. Фазовый портрет игры


«простака» с «хитрецом»

x–1, y−1 x+1, y−1

ξ = +1 ξ = –1

Аналогичный граф для двух простаков изображен на рис. 25.12. Их игра про-
текает периодически с периодом в четыре игры: в двух партиях выигрывает зага-
дывающий простак, а в двух других – отгадывающий. Так что общий результат
ничейный.
25. Динамические модели игр, обучения и целесообразного поведения 197

ξ = –1 ξ = +1
x–1, y+1 x+1, y+1

Рис. 25.12. Фазовый портрет игры


двух «простаков»

x–1, y–1 x+1, y–1


ξ = +1 ξ = –1

Рассмотрим игру двух игроков со стохастическими стратегиями. Это рас-


смотрение включает в себя как частные случаи все варианты игр хитреца и про-
стака, а также мистика или природы (см. рис. 25.9). У одного пусть соответст-
вующие вероятности p, q, а у другого r, s. Игроки могут находиться в четырех
комбинациях своих состояний (x–1, y–1), (x+1, y–1), (x–1, y+1) и (x+1, y+1). В первом и
последнем состояниях выигрывает отгадывающий, в двух средних – загадываю-
щий. Смены состояний обоих игроков могут происходить в любом случае: при
выигрыше с вероятностями 1 – p и 1 – r, а при проигрыше − с вероятностями 1 – q
и 1 – s соответственно. Пусть играются последовательно несколько партий и
pn(x–1, y–1), pn (x+1, y–1), pn ( x–1, y+1) и pn(x+1, y+1) – вероятности соответствующих
комбинаций xi и yj в n-й партии. В начальный момент может иметь место опреде-
ленное сочетание состояний xi , yj , так что только одна из вероятностей p(xi , yj)
равна единице, а остальные – нулю.
Ясно, что теперь комбинации (x i, yj) не являются состояниями, так как знание
xi и yj не позволяет предсказать, какие будут xi и yj на следующем такте. Но можно
предсказать, каковы их вероятности. Это наводит на мысль, что за состояние сле-
дует принять вектор p , компонентами которого являются вероятности p(xi, yj).
Допустим, что на n-й игре вектор состояний известен и равен p n. Найдем
вектор p n+1, т.е. найдем его компоненты
pn+1(x–1, y–1), pn+1(x+1, y–1), pn+1(x–1, y+1) и pn+1(x+1, y+1)
через
pn(x–1, y–1), pn(x+1, y–1), pn(x–1, y+1) и pn(x+1, y+1).
Оказывается, что
p n +1 = p n P , (25.1)
где P – матрица вероятностей перехода,
ps (1 − p ) s p(1 − s ) (1 − s )(1 − p )
(1 − q) r qr (1 − q)(1 − r ) q(1 − r )
P= , (25.2)
q(1 − r ) (1 − q)(1 − r ) qr (1 − q) r
(1 − p )(1 − s ) (1 − s ) p s (1 − p ) ps

а p n и p n+1 – векторы строки.


198 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Если перенумеровать комбинации «состояний» (x–1, y–1), (x–1, y+1), (x+1, y–1),
(x+1, y+1) номерами 1, 2, 3, 4, а элементы матрицы P обозначить pij, где i – номер
строки, а j – номер столбца, то pij – это вероятность перехода из комбинации «со-
стояний» с номером i в комбинацию «состояний» с номером j. Так, элемент p12 –
это вероятность перехода (x–1, y–1) в (x–1, y+1), равная произведению вероятностей
смены состояния выигравшего отгадывающего, т.е. 1 – p, на вероятность сохране-
ния состояния проигравшего загадывающего, т.е. s. Аналогично находятся все ос-
тальные элементы матрицы P.
Справедливость формулы (25.1) следует из соотношения
pin+1 = p1np1i+p2np2i+p3np3i+p4np4i ,
означающего, что i-я комбинация состояний может возникнуть из первой с веро-
ятностью p1i, из второй – p2i , из третьей – p3i и из четвертой – с вероятностью
p4i, а вероятности первой, второй, третьей и четвертой комбинаций, соответствен-
но, p1n, p2n, p3n и p4n.
Итак, знание вектора вероятностей p n позволяет найти его следующее значе-
ние p n+1 после еще одной сыгранной партии. Это позволяет нам игру двух сто-
хастических автоматов рассматривать как динамическую систему с состоянием,
описываемым вектором p .
Фазовым пространством этой динамической системы являются всевозмож-
ные векторы p ( p1 , p2 , p3 , p4 ) , у которых все pi не отрицательны и их сумма равна
единице, так как в одном из несовместных «состояний» 1, 2, 3 или 4 рассматри-
ваемая система обязательно находится. Это фазовое пространство имеет размер-
ность три и представляет собою трехмерный симплекс. Вершины этого симплекса
Σ3, изображенного на рис. 25.13, отвечают единичным векторам (1, 0, 0, 0),
(0, 1, 0, 0), (0, 0, 1, 0) и (0, 0, 0, 1). На четырех гранях соответственно p1 = 0, p2 = 0,
p3 = 0 и p4 = 0.

(0, 0, 0, 1)
Рис. 25.13. Фазовое пространство в виде
трехмерного симплекса в случае, когда
хотя бы один автомат-игрок меняет свои
(0, 0, 1, 0) состояния случайно с какими-то вероят-
ностями, могущими зависеть от резуль-
тата предшествующей игры
(1, 0, 0, 0)
(0, 1, 0, 0)

Динамическая система с фазовым пространством в виде симплекса Σ3 (а в


общем случае с симплексом любой размерности) и оператором, определяемым
матрицей P, согласно формуле (25.1), называется дискретной марковской систе-
мой.
Фазовый портрет такой системы в общем случае очень прост: все его фазовые
траектории стремятся к единственному равновесию p *, определяемому из усло-
вия
p n +1 = p n = p ∗
или, согласно (25.1),
25. Динамические модели игр, обучения и целесообразного поведения 199

p∗ = p∗P . (25.3)
Уравнение (25.3) в общем случае имеет единственное ненулевое нормиро-
ванное решение p *. Марковская система определяется матрицей P, т.е. ее эле-
ментами pij ≥ 0. В силу этого под общим случаем понимается тот, когда ни одно из
pij не обращается в нуль. В нашем конкретном случае, когда матрица P вида
(25.2), общий случай имеет место при p, q, r и s, отличных от нуля и единицы.
При выполнении этого общего условия уравнение (25.3) имеет единственное ре-
шение p ∗ ( p1∗ , p2∗ , p3∗ , p4∗ ) , для которого p1∗ + p2* + p3* + p4* = 1 .
Это условие существования единственного глобально устойчивого равнове-
сия, к которому асимптотически приближаются все точки фазового пространства,
является достаточным. Необходимое и достаточное условие состоит в том, что
некоторая степень матрицы P, т.е. P k, удовлетворяет этому достаточному условию
положительности всех своих элементов.
В ситуациях (x–1, y–1) и (x+1, y+1), т.е. 1 и 4, выигрывает угадывающий, в ос-
тальных (2 и 3) он столько же (пятак) проигрывает, так что математическое ожи-
дание его выигрыша f при длительной игре близко к его значению в равновесном
состоянии
Mf = 5(p1* + p4*) – 5(p2* + p3*). (25.4)
Полученное выражение (25.2) матрицы переходных вероятностей использу-
ем, чтобы рассмотреть игры простака, хитреца и мистика со стохастиком с веро-
ятностями 0 < r < 1 и 0 < s < 1.
Для простака p = 1 и q = 0, поэтому, согласно (25.1), матрица P записывается
в виде:
s 0 1− s 0
r 0 1− r 0
P= , (25.5)
0 1− r 0 r
0 1− s 0 s
что приводит к уравнениям, определяющим равновесие:
p1∗ = sp1∗ + rp2∗ ,
p2∗ = (1 − r ) p3∗ + (1 − s ) p4∗ ,
(25.6)
p3∗ = (1 − s ) p1∗ + (1 − r ) p2∗ ,
p4∗ = rp3∗ + sp4∗ ,
к которым следует присоединить условие нормировки
p1∗ + p2∗ + p3∗ + p4∗ = 1 . (25.7)
Решение этих уравнений (25.6) и (25.7) легко находится, если сначала найти
искомые p *1 , p*2 , p*3 , и p *4 и с точностью до общего множителя из (25.6):
1− s ∗
p2∗ = p3∗ = p1 , p4∗ = p1∗ , (25.8)
r
200 Ю.И. Неймарк. Математическое моделирование как наука и искусство

а затем − этот множитель из (25.7). В результате найдем, что


r 1− s
p1∗ = p4∗ = , p2∗ = p3∗ = , (25.9)
2(1 + r − s ) 2(1 + r − s )
и, следовательно, математическое ожидание (25.4) выигрыша отгадывающего
простака равно
−1+ r + s
Mf = 5 . (25.10)
1+ r − s
Теперь легко исследовать, как зависит выигрыш в глобально устойчивом рав-
новесии от вероятностей r и s. Полагая Mf = 5µ, согласно (25.10) легко придем к
тому, что на линии
r (1 − µ)
s+ = 1 ( −1 ≤ µ ≤ 1) (25.11)
1+ µ
внутри квадрата 0 < r < 1, 0 < s < 1 математическое ожидание (25.10) равно 5µ
(рис. 5.14).
s
µ=1
1
µ = 0,5
Рис. 5.14. Геометрическое представление
µ = –1 зависимости выигрыша µ от вероятностей r
µ=0
и s смен состояний в игре «простака»
со «стохастиком»
µ = −0,5
0 1 r
Таким образом, простак в зависимости от вероятностей r и s может как выиг-
рывать, так и проигрывать, а также иметь любой промежуточный результат. Бли-
зок простак к максимально возможному выигрышу при µ ≈ + 1 и, напротив, к
максимальному проигрышу при µ ≈ –1. При µ ≈ –1 стохастик близок к хитрецу с
r = 0 и s = 1, но хитрец у простака не всегда выигрывает, а сколь угодно близкий
стохастик выигрывает. Этот скачок вызван тем, что при r = 0 и s = 1 нарушаются
условия существования глобально устойчивого равновесия.
Аналогично почти максимально проигрывающий стохастик близок к упрямцу
с r = 1 и s = 1, который у простака не выигрывает. Это несоответствие (скачок)
опять же объясняется нарушением условия глобальной устойчивости равновесия
p * при r = s = 1.
Для игры хитреца со стохастиком (p = 0, q = 1 в формуле (25.2)) матрица P за-
пишется в виде
0 s 0 1− s
0 r 0 1− r
P= , (25.12)
1− r 0 r 0
1− s 0 s 0
25. Динамические модели игр, обучения и целесообразного поведения 201

и поэтому равновесие находится из уравнений:


p1∗ = (1 − r ) p3∗ + (1 − s ) p4∗ ,
p2∗ = sp1∗ + rp2∗ ,
(25.13)
p3∗ = rp3∗ + sp4∗ ,
p4∗ = (1 − s ) p1∗ + (1 − r ) p2∗
и условия нормировки (25.7). Из (25.13) и (25.7) находим, что
1− r s
p1∗ = p4∗ = , p2∗ = p3∗ = . (25.14)
2(1 + s − r ) 2(1 + s − r )
Далее оказывается, что математическое ожидание выигрыша хитреца в гло-
бально устойчивом равновесном режиме равно
1− r − s
Mf = 5 . (25.15)
1+ s − r
Найденное Mf равно –Mf формулы (25.10), если в ней поменять местами s и r,
поэтому имеет место тот же, что и раньше, график (см. рис. 25.13) с заменой µ на
–µ и оси r на s и s на r.
Теперь рассмотрим игру мистика, для которого p = q = α, со стохастиком. В
этом случае матрица переходных вероятностей имеет, согласно (25.2), вид:
αs (1 − α) s α(1 − s ) (1 − α)(1 − s )
(1 − α) r αr (1 − α)(1 − r ) α(1 − r )
P= . (25.16)
α(1 − r ) (1 − α)(1 − r ) αr (1 − α) r
(1 − α)(1 − s ) α(1 − s )0 (1 − α) s αs
В соответствии с (25.16) уравнения устойчивого равновесия запишутся в виде:
( αs − 1) p1∗ + (1 − α) rp2∗ + α(1 − r ) p3∗ + (1 − α)(1 − s ) p4∗ = 0,
(1 − α) sp1∗ + ( αr − 1) p2∗ + (1 − α)(1 − r ) p3∗ + α(1 − s ) p4∗ = 0,
(25.17)
α(1 − s ) p1∗ + (1 − α)(1 − r ) p2∗ + ( αr − 1) p3∗ + (1 − α) sp4∗ = 0,
(1 − α)(1 − s ) p1∗ + α(1 − r ) p2∗ + (1 − α) rp3∗ + ( αs − 1) p4∗ = 0.
Эти уравнения линейно зависимые и поэтому допускают ненулевое решение
p1 , p2*, p3*, p4*, которое затем следует нормировать на единицу. Манипулируя с
*

этой системой уравнений (25.17) (складывая первое и третье уравнения, и третье и


четвертое), приведем ее к виду (отбрасывая четвертое):
p1* – p2* + p3* – p4* = 0,
(1 – s)p1* + (1 – r)p2* + (r – 1)p3* + (s – 1)p4* = 0,
α( 1 – s )p1* + (1 – α)(1 – r)p2* + (αs – 1)p3* + (1 – α)sp4* = 0
и непосредственно найдем, что требуемое нормированное на единицу решение
будет следующим:
202 Ю.И. Неймарк. Математическое моделирование как наука и искусство

p1∗ = p4∗ = ∆−1 ( 2 − s − r ) ( r + α − 2αr ) ,


p2∗ = p3∗ = ∆−1 ( 2 − α − s ) ( α + s − 2αs ) ,
∆ = 2( α − s − r )[2α + s + r − 2α( r + s )] ,
а математическое ожидание выигрыша в равновесном состоянии будет
5( r − s ) (1 − 2α)
Mf = 5( p1∗ + p4∗ − p2∗ − p3∗ ) = . (25.18)
2α + r + s − 2α( r + s )
Из выражения (25.18) следует, что при α = 0,5 мистик не проигрывает и не
выигрывает у любого автомата (при любых r и s). Напротив, при α ≠ 0,5 он может
как проигрывать, так и выигрывать.
При α< 0,5 он выигрывает при r > s и проигрывает при r < s. При этом его
максимальный выигрыш у простака, когда r = 1, s = 0; максимальный проигрыш
хитрецу, когда r = 0, s = 1.
При α > 0,5 все наоборот: он выигрывает при r < s максимально у хитреца, а
проигрывает при r > s максимально у простака. (Эти выводы о максимальном вы-
игрыше и проигрыше предполагают α отличным от нуля и единицы, что опять
связано с нарушением условий глобальной устойчивости равновесия.)
Итак, мы рассмотрели игры простака и хитреца между собой, а также игры
простака, хитреца и мистика со стохастиком. Мы нашли вероятности различных
ситуаций в игре в установившемся равновесном состоянии и выигрыши и проиг-
рыши игроков в нем. Для полноты представления об этих играх напомним соот-
ветствующие им графы смены ситуаций для игр детерминированных игроков
простака с хитрецом и простака с простаком, изображенные на рис. 25.11 и 25.12.
В этом случае графы смен ситуаций одновременно являются и фазовыми портре-
тами, потому что ситуация является одновременно и состоянием. При наличии в
игре стохастичности ситуация не является состоянием и граф смены ситуаций не
является фазовым портретом. Фазовый портрет – это всевозможные фазовые тра-
ектории точки p (p1, p2, p3, p4) трехмерного симплекса
ps ≥ 0, p1 + p2+ p3 + p4 = 1.
Этот фазовый портрет в общем случае положительности всех вероятностей
перехода pij прост и состоит из фазовых траекторий, стягивающихся к единствен-
ному устойчивому равновесию p *(p1*, p2*, p3*, p4*) (рис. 25.15).
(1, 0, 0,

(0, 1, 0, 0) Рис. 25.15. Иллюстрация к наличию


P* глобально-устойчивого равновесия
в игре со случайными сменами состояний

(0, 0, 0, 1)
(0, 0, 1, 0)
25. Динамические модели игр, обучения и целесообразного поведения 203

Граф смены ситуаций может быть непосредственно нарисован по матрице пере-


ходных вероятностей P (25.2). Матрицы смен состояний игроков при играх простака и
хитреца со стохастиком и стохастического мистика со стохастиком являются частны-
ми случаями этой матрицы P. Поэтому можно ограничиться одним рис. 25.16 графа
переходов матрицы P вида (25.2).

qr q(1 – r)
ps
2. 4.
p (1 – s)
x+1, y–1 x+1, y+1

(1 – q)s

(1 – q)r
(1 – q)r

(1 – q)s
Рис. 25.16. Граф вероятностей 1. 3.
перехода в игре двух «стохастиков» x−1, y–1 q(1 – r) x−1, y+1
ps qr
p (1 – s)

Мы рассмотрели очень простые примеры игр в отгадывание. А где же в них


обучение? Оно состоит в том, что игроки «простак», «хитрец», «стохастик» дей-
ствовали не по заранее фиксированному плану, а на основе результатов предше-
ствующих игр, поскольку они выбирали принимаемое в следующей партии реше-
ние в зависимости от результатов игры. Упрямец не обучался, он действовал по
заранее определенному плану, он мог бы быть и другим, реализующим некоторую
произвольную, заранее заданную последовательность действий (ходов). Мистик
также не обучался, хотя и не имел заранее заданного плана, но его действия не
зависели от хода игры, они определялись независимым от него случаем. Страте-
гии упрямца и мистика не предполагают обучение. Напротив, стратегии простака,
хитреца и стохастика таковы, что имеет место обучение.
Простейшие стратегии игры в отгадывание, которые мы рассмотрели, приме-
нимы и к принятию крысой решения о том, к какой из кормушек пойти, чтобы по-
есть, куда отправиться за пищей. Этот случай соответствует игре отгадывающего
с природой, поскольку принимается, что то, где окажется еда, определяется при-
чинами, не зависящими от действий крысы. Есть еще одно отличие в стратегии
природы от стратегии загадывающего игрока: не обязательно одна кормушка с
едой, другая без нее, возможны и случаи, когда обе кормушки с едой или обе без
нее.
В интерпретации игры в отгадывание, как и крысы, ищущей еду и улучшаю-
щей свой поиск в результате учета результатов своих предшествующих действий,
элемент обучения очевиден. Этот элемент обучения заложен в играющего, он
очень прост до примитивности и поэтому, возможно, еще не ощущаются его
принципиальное отличие и совершенно новые возможности по сравнению с жест-
ко заданными, не использующими предшествующего опыта, алгоритмами пове-
дения. Хотелось бы подчеркнуть, что новое в обучении не только в иных алго-
204 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ритмах действий, а и в новой информации, используемой алгоритмом: информа-


ции о результатах предшествующих действий.
В рассмотренных выше примерах эта информация использовалась для приня-
тия решения перехода автомата в то или иное состояние. Предполагается и более
общее и глубокое использование этой информации для изменения самого автома-
та, в частности, вероятностей p и q стохастического автомата.
Описанная стратегия поведения крысы с обучением представляется нам целе-
сообразной. Вместе с тем, не так уж очевидно, почему это так: неясно, с чем ее
сравнивать и по отношению к чему она лучше. Это очень непростой вопрос. Его
обсуждение увело бы нас очень далеко от нашей темы. Поэтому ограничимся
сравнением со случайным поведением, и то, что лучше его, будем считать целе-
сообразным. Случайное поведение с независимыми выборами имеет равные веро-
ятности выигрыша и проигрыша. Целесообразная стратегия – это та, для которой
выигрыш более 0,5. Такое понимание, по-видимому, согласуется с нашей интуи-
цией. Более полный анализ этого вопроса вас, возможно, ждет в специальных кур-
сах.
В заключение хотелось бы остановиться на двух общих вопросах, не имею-
щих прямого отношения к теме нашего разговора – это объяснение того, почему
стохастик с p = q = 0,5 ни у кого не выигрывает и никому не проигрывает и поче-
му марковская система с матрицей P, у которой все элементы pij положительны,
имеет единственное устойчивое равновесие p *. То, что он не проигрывает и не
выигрывает ни у простака, ни у хитреца, ни у стохастика, мы получили из кон-
кретного рассмотрения математических моделей их игр. Но естественен вопрос:
не может ли все же существовать такая стратегия игры против стохастика, равно-
вероятно и независимо выбирающего –1 и +1, при которой его можно обыграть,
как об этом мечтают фанатики игорных домов? Простое рассуждение показывает,
что это невозможно. Невозможно в силу независимости реализаций у стохастика
–1 и +1 ни от его предшествующих ходов, ни от действий партнера. В силу этой
независимости условные вероятности его выигрыша и проигрыша всегда одни и
те же, равные 0,5.
В свое время мне и Д.М. Черток захотелось придумать более сложные, чем
описано выше, обучающиеся стратегии, и с их помощью обыграть человека. Че-
ловек − не равновероятный стохастик: человек невольно учитывает результаты
предыдущих игр, и если этот его учет разгадать – проигрыш человека неизбежен.
Для того чтобы реализовать стратегию игры с человеком, основанную на разга-
дывании его стратегии, нужна математическая модель человека-игрока. Доста-
точно эффективным оказалось предположение, что стратегия человека-игрока
имеет случайный характер, но вероятности выбора –1 и +1 зависят от конечного,
не очень большого числа предшествующих партий, и то, что человек в результате
этого выбирает –1 и +1, не равновероятно и не независимо.
Вместе с тем машина, таким способом обыгрывающая человека, ставит себя в
рискованное положение и, следовательно, может проиграть человеку, если он
придумает еще более совершенную, чем у машины, стратегию, основанную на
разгадке ее стратегии. Этот процесс взаимного совершенствования стратегий мо-
жет длиться долго, как войны человечества. Это не совсем прямая аналогия, по-
тому что в войнах совершенствуются не только стратегии ее ведения, но и средст-
25. Динамические модели игр, обучения и целесообразного поведения 205

ва, которыми она ведется, что, впрочем, тоже можно считать стратегией. Насущ-
ная жизненно необходимая проблема человечества – обрыв этой цепочки эволю-
ционного совершенствования, заложенного в инстинктах человека как представи-
теля мира живых существ. Это, по-видимому, возможно только через осознание
им гибельности этого «естественного» пути, гибельности в новых невиданных
еще условиях его существования, в осознании необходимости коренного измене-
ния стратегий коллективного поведения перед лицом экологической катастрофы.
В связи со сказанным особый интерес представляет построение не только моделей
сосуществования на основе дарвинской теории борьбы за существование, но и
моделей сосуществования современного человечества в новых условиях его су-
ществования. Скорее всего, это переход к новым эволюционным стратегиям, ос-
нованным не на открытой борьбе за существование, а на стратегиях компромис-
сов и соглашений, которые должны быть взаимовыгодными, как в кратковремен-
ных, так и долгосрочных планах, в понимании, что кроме примитивных инстинк-
тивных стратегий, возможны другие, много более целесообразные и выгодные
стратегии.
Наличие таких стратегий ниже иллюстрируется примером Ю.Б. Гермейера,
хорошо объясняющим возможность более выгодных стратегий, чем прямая мак-
симизация собственного выигрыша. Речь идет об игре n лиц, в которой выигрыш
s-го игрока равен
f s = 1 − x s + µ ∑ xi ( s = 1, 2, ..., n ) . (25.19)
i≠s
Каждый игрок волен распоряжаться своей, выбираемой им переменной 0 ≤ xs ≤ 1.
Ясно, что непосредственная максимизация s-м игроком своего выигрыша fs
приводит к выбору xs = 0. Если так поступят все игроки, то выигрыш каждого из
них равен 1. Вместе с тем, если они договорятся о том, что не будут стремиться к
непосредственной выгоде, а все выберут xs = 1, то выигрыши каждого из них бу-
дут не единица, а, возможно, много большие µ(n – 1). Такая договоренность не
имеет устойчивого характера: каждому из игроков выгодно ее нарушить и полу-
чить еще больший выигрыш µ(n – 1) + 1. Однако если так поступят m игроков, то
их выигрыш будет µ(n – m – 1) + 1, а остальных − µ(n – m – 1). Ясно, что если
µ(n – m – 1) окажется меньше единицы, то для них общая договоренность станет
невыгодной и «союз» распадется к общей невыгоде всех. Договоренности можно
придать устойчивый характер, если прибегнуть к общей кассе, т.е. договориться,
что выигрыши всех поступают в общую кассу и затем, например, поровну разда-
ются всем. В этом случае общий выигрыш равен
F = ∑ f s = n − x1 − ... − xn + µ( n − 1)( x1 + ... + xn ) =
= n + (µ( n − 1) − 1)( x1 + x2 + ... + xn ) .
Пусть µ(n – 1) – 1 > 1, тогда не только всем вместе, но и каждому из игроков
выгодно выбирать xs = 1.
Второй общий вопрос, по-видимому, был вам обоснован в лекциях по теории
вероятностей. Удивительность и важность этого общего факта делает желатель-
ным эвристически наглядное его понимание, которое и приводится ниже. Я толь-
ко хочу напомнить вам, что условия pij > 0 достаточные, а не необходимые. Необ-
206 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ходимые и достаточные условия тоже известны. Я не буду вам о них рассказы-


вать, хотя они очень красивые и непосредственно проверяются по виду графа
возможных смен ситуаций. Итак, пусть все pij > 0.
При этом линейном преобразовании с матрицей P симплекс Σn переходит
опять-таки в симплекс Σ n, который лежит строго внутри симплекса Σn. Строго
внутри потому, что все вершины симплекса Σn(1, 0, …, 0), (0, 1, …), … ,
(0, 0, …, 1) переводятся в силу pij > 0 строго внутрь Σn. Это означает, что симплекс
~
Σn преобразуется внутрь геометрически подобного симплекса Σ n, который в q < 1
раз меньше симплекса Σn. При следующем преобразовании аналогично симплекс
~ ~
~
Σ n преобразуется в q раз меньший, подобный ему симплекс Σ n и так далее. По-
следовательность подобных неограниченно уменьшающихся с числом преобразо-
ваний симплексов стягивается к некоторой внутренней точке p*.
26. Персептрон и распознавание образов 207

26. ПЕРСЕПТРОН И РАСПОЗНАВАНИЕ ОБРАЗОВ


Перейдем теперь к модели, которая появилась сравнительно недавно, в сере-
дине ХХ века, и получила широкую известность уже в шестидесятые годы. Моде-
ли безусловно интеллектуальной деятельности человека, которая реализуема на
ЭВМ и тем самым доказывает, что машина может мыслить. Модели, которая по-
трясла современников и послужила началом нового раздела кибернетики – распо-
знавания образов [26]. Сначала появилась не математическая модель, а удиви-
тельное устройство, которое придумал Ф. Розенблат в 1957 году и которому дал
звучное название «персептрон». Придумано оно было, исходя из тогдашних пред-
ставлений о конструкции мозга, сетчатки глаза и обработки ее сигналов в слоях
нервных клеток. По профессии Розенблат был физиолог. Его устройство могло
воспринимать, различать и узнавать зрительные образы, отличать треугольники
от овалов, опознавать буквы и другие изображения. Самое удивительное было в
том, что эти способности не были заложены в устройстве, а возникали в результа-
те обучения. Обучение позволяло различать новые геометрические фигуры и зри-
тельные образы. Это умение ранее считалось прерогативой человеческого интел-
лекта, недоступной машине. Удивление подкреплялось еще и тем, что было со-
вершенно непонятно, как персептрон это делает: доска с фотоэлементами, имити-
рующая сетчатку глаза, случайные их связи с A-слоем, B-слой, сумматор, фор-
мальный нейрон, многочисленные обратные связи − все это как-то связано между
собой и как-то функционирует согласно непостижимым принципам нейродина-
мики. Возможно, если бы не реальное устройство, а просто его описание и те же
рассуждения о его работе, никто бы на них не обратил внимание. Но было уст-
ройство и оно работало, распознавало образы, обучалось этому распознаванию.
Розенблат написал толстую книгу «Принципы нейродинамики» [44], она бы-
ла переведена на русский язык. Скорее всего, мало кто ее читал, едва ли она была
понятна кому-нибудь, кроме автора. Но человеческая мысль работала. Принципы
были поняты. Они оказались в потрясающе простой, далекой от нейрофизиоло-
гии, математической модели пространства признаков и образа, как области в нем,
модели, основанной на абстрактном фантастическом понятии многомерного про-
странства, придуманном необузданным воображением математиков. Таинствен-
ность, запутанность, непостижимость исчезли. Все стало очень просто, даже три-
виально, и эта мощь простоты привела к бурному развитию нового раздела ки-
бернетики − «распознаванию образов» − и его разнообразным, многочисленным
применениям и использованиям. Сейчас робот может играть на фортепиано с нот,
поставленных перед ним, станок – изготовлять детали по их чертежам, компьютер
– печатать статью или книгу с рукописи или голоса, ставить диагноз заболевания,
обнаруживать неисправности машин, находить месторождения полезных иско-
паемых и многое, многое другое.
Вернемся к персептрону. Я не буду вас затруднять детальным описанием его
устройства, хотя, может быть, это было бы полезно. Я попытаюсь вам рассказать
о его функционировании с точки зрения сегодняшнего его понимания.
208 Ю.И. Неймарк. Математическое моделирование как наука и искусство

С помощью табло 100×100 фотоэлементов персептрон воспринимал зритель-


ный образ, как 104 сигналов x1, x2, …, x10000, образующих вектор признаков или
описание x. На каждый входной сигнал x персептрон отвечал: да или нет, +1 или
–1. То, как он отвечает на данный входной сигнал x в каждом конкретном случае,
зависит от его внутреннего состояния, характеризуемого величинами параметров
γ1, γ2, …, γm, составляющих вектор γ. Эти параметры γ могут меняться под воздей-
ствием учителя, который в каждом случае поначалу указывает персептрону, когда
он отвечает верно и когда неверно. Предполагается, что учитель все показывае-
мые персептрону объекты делит на два класса A и B и хочет этому разделению
научить персептрон, так чтобы на объект образа (класса) A он отвечал +1, а на
объект образа B отвечал –1. Этого учитель хочет достигнуть, обучая персептрон
на примерах показа разных образов и вызывая соответствующие изменения его
внутреннего состояния γ. Учитель надеялся, что после обучения персептрон будет
верно (так же, как учитель) отвечать на новые показы, которых, возможно, не бы-
ло при обучении.
Согласно этому описанию, внутреннее устройство персептрона, каким бы оно
ни было, может быть представлено моделью
y = f (x, γ), (26.1)
в которой f (x, γ) – функция двух векторов x и γ, могущая принимать только два
значения +1 и –1. В простейшем варианте персептрона Розенблата эта функция
имеет вид:
m
f ( x, γ ) = sign∑ γ s ϕ s ( x1 ,..., xn ) = sign γϕ( x ). (26.2)
s =1
Это только модель ответа персептрона на сигнал x, нужно еще описать, как про-
исходит процесс обучения персептрона.
В общем виде обучение можно понимать, как использование информации
учителя для определения вектора γ состояния персептрона, т.е.
γ = g(x1, z1; x2, z2; …, x p, z p), (26.3)
i i
где x , z – описание i-го показываемого объекта и указание учителя, к какому об-
разу он принадлежит: к образу A, если z= +1, и B, если z = −1. Последователь-
ность x1, z1; ... ; x p, z p – это обучающая информация учителя. Персептрон ее ис-
пользует, определяя по ней свое состояние γ. При новом показе ответ персептрона
(26.1) на показ объекта с описанием x определяется x и состоянием γ. Ответ z учи-
теля определяется какой-то нам неизвестной функцией fучит (x) = z. Так что про-
цесс обучения можно видеть в том, чтобы приблизить функцию персептрона
(26.1) к неизвестной функции учителя fучит (x) по обучающей информации I(x1, z1;
...; x p, z p). После этого пояснения перейдем к описанию алгоритма обучения (26.3)
для простейшего варианта персептрона.
Пусть X – множество всевозможных объектов x. Их конечное или бесконеч-
ное число. Каждый объект x ∈ X учитель относит к одному из классов A или B.
Эту способность учителя можно представить некоторой функцией fучит (x), прини-
мающей для любого x только одно из двух значений: +1 и –1. Задача обучения
персептрона в идеале состоит в том, чтобы ученик-персептрон делал то же, что и
учитель, т.е. чтобы при любом x∈ X
26. Персептрон и распознавание образов 209

y = f (x, γ) = sign γϕ(x) = fучит (x). (26.4)


Ясно, что для принципиальной возможности обучения необходимо сущест-
вование такого числа γ = γ*, для которого имеет место (26.4) при всех x ∈ X. Далее
возникает вопрос, каким должно быть значение γ из (26.3), чтобы найти такое γ*
при условии, что оно существует? Напомним, что в рассматриваемом нами случае
функция f (x, γ) определяется формулой (26.2).
Розенблат придумал следующий алгоритм подбора требуемого γ* в процессе
последовательных показов объектов x1, x2, ... персептрону и указаний учителя
f учит (x1), …, f учит (x2), ..., обнаруживающих, верно или неверно ответил персептрон.
Возьмем произвольное γ. Если персептрон ответил верно, то это подтвержда-
ет учитель, и персептрон, удовлетворенный, ничего не меняет, т.е. оставляет γ без
изменения. Если же ответ персептрона не совпал с ответом учителя, т.е. если он
неверен, то происходит изменение γ, приближающее персептрон к верному отве-
ту. А именно, пусть учитель ответил +1, а персептрон –1, тогда
f (x, γ) = sign γϕ(x) = –1,
и для того чтобы приблизить персептрон к верному ответу +1, можно к вектору γ
добавить вектор εϕ(x) (ε > 0), т.е. заменить γ на γ согласно формуле
γ = γ + εϕ(x).
При этом
γ ϕ(x) = γϕ(x) + εϕ2(x) (ε > 0),
следовательно, f (x, γ ) > f (x, γ) и тем самым персептрон приблизился к верному
ответу.
Пусть теперь, наоборот, учитель ответил –1, а персептрон +1. Тогда величину
γϕ(x) следует уменьшить, т.е. γ заменить на γ согласно формуле
γ = γ − εϕ(x),
поскольку при этом f (x, γ) = γϕ(x) уменьшается на –εϕ2(x).
Пусть ответ учителя fучит(x) и ответ персептрона не совпадают, тогда, согласно
сказанному, γ меняется в соответствии с формулой
γ = γ + ε f учит (x)ϕ(x). (26.5)
Это изменение происходит только при ошибке персептрона. В случае же, когда
персептрон отвечает правильно, вместо (26.5) имеет место
γ = γ. (26.6)
Не представляет труда выражения (26.5) и (26.6) записать в виде одной фор-
мулы
γ при f учит ( x ) = f ,
γ= (26.7)
 γ + ε f учит ( x )ϕ( x ) при f учит ( x ) ≠ f
или
γ = γ – 0,5ε( f – f учит)ϕ(x),
где f – ответ персептрона, определяемый формулой (26.2) , а fучит – ответ учителя
на показ одного и того же объекта x ∈ X.
210 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Прежде чем перейти к изучению алгоритма обучения (26.7), кратко и схема-


тично опишем, как сказанное было реализовано в персептроне Розенблата.
Как уже говорилось, Розенблат, конструируя персептрон, исходил из пред-
ставлений о структуре зрительного рецептора и последующей обработки воспри-
ятия зрительного образа сетчаткой глаза и мозгом. Эту обработку он предполагал
послойной: слой рецепторов, слой формирования функций ϕs(x1 , ..., xn), слой ум-
ножения функций ϕs на коэффициенты γs и, наконец, нейрон, реализующий поро-
говую функцию sign. В соответствии с этим его схема имела вид, показанный на
рис. 26.1.
x1 γ1
ϕ1
x2
γ2 γ1ϕ1
ϕ2 Рис. 26.1. Схема трехслойного
. персептрона с формальным нейроном
. f (пороговым элементом) на выходе.
. Обратные связи изменения
γm фазовых переменных γ1,…, γm
ϕm γmϕm в третьем слое не показаны
xn–1
xn

Механизм обучения был реализован путем сопоставления ответа нейрона с


ответом учителя, по результатам которого происходила корректировка с помо-
щью обратных связей каждого из множителей γs согласно формуле (26.7). Таково
схематическое описание работы персептрона.
Помимо функционального и схематического описаний возможно геометриче-
ское описание. Поступление образа x в персептрон можно интерпретировать как
возникновение точки x в многомерном пространстве признаков Rn . В этом про-
странстве функцию (26.2), реализуемую персептроном, можно представить гео-
метрически как то, с какой стороны от поверхности
γϕ(x) = 0 (26.8)
находится точка x. С одной стороны этой поверхности γϕ(x) > 0, и это соответст-
вует ответу +1, с другой ее стороны γϕ(x) < 0 , что отвечает ответу –1. Множество
точек X делится на точки класса A и точки класса B, которые должны лежать по
разные стороны поверхности (26.8).
В соответствии со сказанным множество точек x, отвечающих образу A, мож-
но трактовать как модель образа A; аналогично множество точек образа B – как
модель образа B. Обучение при этом трактуется как построение поверхности
(26.8), разделяющей множества точек образов A и B, согласно формуле
 A, если γϕ( x ) > 0,
x∈
 B, если γϕ( x ) < 0.
Итак, интеллектуальная задача распознавания образов получила геометриче-
скую интерпретацию в построении поверхности, разделяющей множества точек –
моделей – образов A и B.
Такая геометрическая интерпретация распознавания зрительных образов во-
зымела огромные последствия. Образы начали воспринимать не только зритель-
26. Персептрон и распознавание образов 211

ные, а любые, описываемые какими-то числовыми признаками x1 , x2 ,..., xn . А это


сделало возможным распознавание почерков, различных звуковых сигналов, неф-
тяных месторождений, чтение текстов, узнавание голоса человека и произноси-
мых им слов, медицинской и технической диагностики, и многого, многого дру-
гого.
Наконец, немаловажно и интересно, что персептрон – это динамическая сис-
тема, что процесс его обучения, как и само узнавание, – динамический пpоцесс.
Состояние персептрона – это вектор γ размерности m. Оператор этой динами-
ческой системы дается формулой (26.7), которая определяет изменение его со-
стояния γ. Ответ персептрона на внешнее воздействие x определяется формулой
(26.2). Обученность персептрона – это достижение им равновесного состояния, в
котором состояние γ уже не меняется при любом показе x.
Перейдем к обоснованию возможности его обучения согласно алгоритму
(26.7). При этом мы будем трактовать персептрон как динамическую систему.
Вектор состояния γ будем интерпретировать как точку в многомерном фазовом
пространстве Гm. Формула (26.7) определяет закон изменения состояния и может
трактоваться как оператор динамической системы. Состояния γ*, при которых
персептрон обучен и всегда отвечает одинаково с учителем, согласно (26.7), не
меняются и поэтому являются его равновесными состояниями.
Нетрудно видеть, что множество состояний равновесия, если они существу-
ют, образуют выпуклый конус. Действительно, равновесие γ* определяется требо-
ванием
sign γ*ϕ(x) = fучит (x) (26.9)
для всех x ∈ X. Но если (26.9) выполнено для некоторого γ*, то оно выполнено и
для λγ* при любом λ > 0. Аналогично, если γ1* и γ2* – равновесия, то и λ1γ1* + λ2γ2*
– тоже равновесие при λ1 и λ2 положительных (в частности, при λ2 = 1 – λ1 и 0 ≤
≤ λ1 ≤ 1).
Теперь докажем, что если персептрон имеет конус равновесий, содержащий
внутреннюю точку γ*, то он может совершить не более некоторого конечного
числа ошибок, после чего уже их не совершает. Эта ошеломляющая теорема Но-
викова доказывается сравнительно просто. Смысл ее состоит в том, что любая
дискретная фазовая траектория персептрона при любой заданной последователь-
ности показов не может содержать более некоторого конечного числа точек. Из
этого еще не следует, что она обязательно окончится равновесием, просто после
некоторого конечного числа ошибок персептрон на любой заданной последова-
тельности обязательно перестает ошибаться. Но если мы будем несколько раз по-
казывать последовательно все точки множества X, то фазовая траектория обяза-
тельно закончится состоянием равновесия и персептрон научится правильно раз-
личать все точки множества X.
Доказательство этой замечательной теоремы Новикова, как уже говорилось,
несложно.
Пусть для x ∈ X 0 < r ≤ ϕ( x ) ≤ R < ∞ и пусть γ* – внутренняя точка множества
равновесий, которая соответствует обученности персептрона, тогда
| γ ∗ϕ( x ) | ≥ ρ|| γ ∗|||| ϕ( x ) || , ρ > 0, (26.10)
212 Ю.И. Неймарк. Математическое моделирование как наука и искусство

вне зависимости от длины вектора γ*, которую можно выбрать произвольно.


Действительно, если γ* – внутренняя точка конуса равновесий, то при
некотоpом ρ > 0 для любого вектоpа a, для которого a ≤ ρ, для всех x ∈ X имеет
место неравенство
| ( γ ∗+ α || γ ∗||) ϕ ( x ) | > 0
или, пpинимая α = νϕ( x ) / ϕ( x ) , неpавенство
|γ ∗ϕ( x ) + ν || γ ∗||||ϕ( x ) ||| > 0
при любом v ≤ ρ , из чего следует (26.10). Пусть еще γ0 – произвольное начальное
состояние персептрона; γ1, γ2, γ3, ... – последовательность состояний, возникающая
в результате его обучения показами некоторых произвольных точек x1, x2, x3, ...
множества X. Рассмотрим, как меняется расстояние V(γs) = (γs – γ*)2 точки γs от
точки γ* с ростом s. Непосредственно находим, что
V ( γ s +1 ) − V ( γ s ) = ( γ s + ε f учитϕ( x) − γ ∗ ) 2 − ( γ s − γ ∗ ) 2 =
= 2ε f учит γ s ϕ( x) − 2ε f учит γ ∗ϕ( x) + ε 2 f 2 учитϕ2 ( x).
Так как
fучит γsϕ(xs) < 0, fучит γ*ϕ(x) > 0,
то, учитывая (26.10),
V ( γ s +1 ) − V ( γ s ) < −2ε | γ ∗ϕ( x ) | + ε 2 ϕ 2 ( x ) ≤ −2ερ || γ ∗ ||||ϕ( x )|| + ε 2 ϕ 2 ( x ).
Пользуясь произвольностью выбора длины вектора γ*, выберем ее так, чтобы
− 2ερ || γ ∗ ||||ϕ( x ) || + ε 2 ϕ 2 ( x ) ≤ − q < 0 .
Тогда с каждым переходом от γs к γs+1 расстояние до γ* будет уменьшаться не ме-
нее чем на q > 0, и поэтому таких переходов не может быть больше, чем
N = V(γ)/q. Утверждение доказано.
Найдем явное выражение оценки N верхней границы числа ошибок персеп-
трона. При ||γ ∗ ||= εR ρ и γ0 = 0,
−1
ε2 R 2  εR  R2 1
N= max 2ερ ϕ( x) − ε 2ϕ2 ( x) = 2 max
[2 Rξ − ξ 2 ]−1 = 2 ,
ρ 2
 ρ  ρ r ≤ ξ≤ R ρ
что весьма естественно, так как вынужденное уменьшение ρ означает все боль-
шую и большую трудность разделения подмножеств A и B множества X.
Таким образом, персептрон совершает не более конечного числа ошибок, если
он в принципе способен к различению образов A и B. Это так даже при бесконеч-
ности множества X. Если множество X конечно, то при повторном показе персеп-
трон в конце концов обязательно научится правильному распознаванию заведомо
за число повторных показов, меньшее N. Напротив, при бесконечности множества
X никакое сколь угодно длительное обучение не может гарантировать его обучен-
ности. С точки зрения ускорения обучаемости желательно, чтобы персептрон при
обучении совершал возможно большее число ошибок и исчерпал допустимое их
число. Если это число исчерпано, то персептрон правильно классифицирует все
26. Персептрон и распознавание образов 213

остальные точки, несмотря на то, что учитель ему их не показывал. В этой экст-
раполяционной прогностической возможности состоит величайшая его ценность
и практическое значение. Она, в частности, позволяет по показу нескольких боль-
ных с той или иной болезнью затем ставить диагноз этого заболевания для новых
больных. По нескольким показам буквы A затем узнавать ее при других написа-
ниях и т.д.
Выше фактически одновременно с описанием модели персептрона была опи-
сана и общая модель обучения распознаванию двух классов объектов (то, что
только двух классов, не является существенным ограничением, так как путем ди-
хотомии можно осуществить разделение на любое число классов). Эта модель со-
стоит из решающего правила f (x, γ) и алгоритма обучения, алгоритма изменения
состояния γ, который записывается в виде (26.3). Сегодняшние знания не позво-
ляют указать на все возможные, приводящие к цели, алгоритмы для любого за-
данного решающего правила f (x, γ). Нельзя указать и лучшее из решающих пра-
вил. Но уже существует довольно много разных видов алгоритмов обучения. Мы
укажем на один общий способ их построения. Он основан на методе минимиза-
ции стохастического функционала и получил название метода стохастической ап-
проксимации.
Пусть имеется некоторый функционал G(x, γ), зависящий от случайного век-
тора x ∈ X и вектора параметров λ. Случайный вектор имеет некоторую функцию
распределения p(x). Метод стохастической аппроксимации указывает процедуру
последовательных приближений к значению λ*, которое минимизирует математи-
ческое ожидание функционала
M G ( x, λ ) = ∫ G ( x, λ ) p( x)dx (26.11)
x
по параметру λ. Последовательные приближения строятся согласно формуле
λp +1 = λp − ε p ∇λG ( x ρ +1 , λρ ) , (26.12)
1 2
где точки x , x , ... возникают случайно в соответствии с плотностью вероятностей
p(x).
Не будем формулировать условий сходимости последовательных приближе-
ний λ1, λ2, ... к минимуму функционала (26.11). Это при желании вы узнаете из
соответствующих спецкурсов или книг. Ограничимся тем, что покажем, как этим
общим способом можно прийти к описанному выше алгоритму обучения и мно-
гим другим, как показал Я.З. Цыпкин.
Ясно, что цель обучения можно сформулировать как стремление к возможно
меньшему числу ошибок, т.е. как отыскание такого λ*, при котором решающее
правило f (x, λ) допускает минимум ошибок. Введем вместо числа ошибок функ-
цию штрафа совершенной ошибки G(x, λ) и потребуем, чтобы математическое
ожидание этой функции штрафа было минимальным. Отыскание требуемого λ
можно осуществить согласно (26.12).
Примем
f (x, λ) = sign λϕ(x),
G(x, λ) = (f (x, λ) – fучит(x))λϕ(x)
214 Ю.И. Неймарк. Математическое моделирование как наука и искусство

и согласно (26.12) найдем


λp+1 = λp – ε p∇λ (f (x, λ) – fучит (x))λϕ(x) =
= λp– ε p(f (x, λ) – fучит(x))ϕ(x),
что, как нетрудно видеть, совпадает с (26.7) при εp = 0,5ε.
Функция штрафа G(x, λ) была выбрана так, что при верном ответе (f = fучит)
она обращается в нуль, а при неверном (f ≠ fучит) оказывается равной |λϕ(x)|. Вы-
бирая другие функции штрафа, можно найти другие алгоритмы обучения.
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 215

27. ЗАКОНЫ КЕПЛЕРА И ПРОБЛЕМА ДВУХ ТЕЛ,


РЕШЕННАЯ НЬЮТОНОМ
Сегодня я начну рассказ о динамической системе, описание и математическое
моделирование которой прошло через всю историю человечества. От египтян, ва-
вилонян, арабов и древних греков к европейцам и всему современному человече-
ству протянулась извилистая нить этих исследований через двадцать пять веков,
отражая изменения взглядов людей на окружающий мир и свое место в нем, на
возможности использования их в своей жизни. Началась с примитивных описаний
непосредственно созерцаемого, прошла через постижения величественного за-
мысла богов и созданной ими гармонии мира, через описание этой гармонии со-
вершенными идеальными математическими образами (кругами, сферами, пра-
вильными многогранниками, золотым сечением и др.) к современному лакониче-
скому, сугубо математизированному, абстрактному моделированию и исследова-
нию, к пониманию единства мира земного и небесного и их законов, выражаемых
языком математики. Эта система – звездное небо с Солнцем, Луной и планетами,
и Землей под ними.
День сменяет ночь и снова наступает день, так из поколения в поколение, ис-
покон веков. Зиму сменяет весна, весну – лето, лето – осень, снова зима и так все
время. Жизнь человека непосредственно связана с этой вечной сменой времен го-
да, дня и ночи. Луна то появляется, то исчезает, меняются ее фазы, причудливо
движутся по небесному своду бродяги-планеты. Иногда вдруг затмевается Луна
или Солнце. Загадки этих метаморфоз не могли не волновать человека, ему каза-
лось, что его жизнь целиком в их власти, во власти величественного божественно-
го неба и его светил. Мы все со школьной скамьи знаем о геоцентрической систе-
ме мира древних греков и средневековья, об описательной кинематической моде-
ли Птолемея, о сменившей ее гелиоцентрической системе Коперника, о законах
Кеплера и всемирном законе тяготения. Но как из этих законов Ньютона следуют
три закона Кеплера, осталось тайной. Вот эту тайну мы развеем. Именно о ее рас-
крытии будет дальнейший рассказ.
Законы Кеплера несравнимо проще описывают движение небесных светил и
позволяют предсказывать их положения на небе, чем это делала предшествующая
очень сложная кинематическая модель Птолемея и более простая Коперника, но
такая же в основном принципе представления движения планет в виде суперпози-
ции равномерных круговых вращений. Если системы Птолемея содержали 77 кру-
гов, то система Коперника уменьшила их число до 34. Вместе с тем системы Пто-
лемея и Коперника достигли очень большой точности предсказания порядка угло-
вых минут, но вычисления были очень сложными. Кеплер все необычайно упро-
стил, но описание по-прежнему оставалось кинематическим. Три закона Кеплера
не были связаны между собой, не имели единого объяснения. Единое объяснение
им дал Ньютон. Единое не только для них, но и для всех механических явлений на
небе и на земле. Все стало следствием одних и тех же законов, законов механиче-
ского движения.
Напомним законы Кеплера.
216 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Первый закон говорит о том, что орбита каждой планеты – это эллипс, в од-
ном из фокусов которого расположено Солнце.
Второй закон описывает, как, с какой скоростью движется каждая планета по
своему эллипсу. Скорость ее движения переменная, но постоянна так называемая
секторная скорость – скорость, с которой описывает площадь радиус-вектор, со-
единяющий Солнце и планету.
Третий закон, как думал Кеплер, – это общая гармония небесных сфер, выра-
жаемая постоянством отношения квадрата периода обращения планеты к кубу
большой полуоси ее эллипса.
В целом три закона Кеплера дают полное кинематическое описание законо-
мерностей движения планет Солнечной системы. Но нет ли более общих обосно-
ваний этим закономерностям, не есть ли они следствие каких-то более общих за-
конов природы? Чтобы это выяснить, Ньютон преодолел громадные трудности и
титаническими усилиями человеческого гения заложил основы ряда новых на-
правлений науки: механики, теории тяготения, дифференциального и интеграль-
ного исчисления. Более того, само вычисление, как говорил Ньютон, законов Ке-
плера было для того времени невообразимо сложной задачей, но Ньютон их «вы-
числил».
Мы сейчас в осовремененном виде повторим эти вычисления и предпошлем
им выдержку из сочинений Ньютона, которая говорит о близости нам его методо-
логии и о месте нашего рассказа в его общей программе постижения мира. «Вся
трудность физики... состоит в том, чтобы по явлениям движения распознать силы
природы, а затем по этим силам объяснить остальные явления».
В аннотации загадочного тяготения, действующего через пустоту, он писал:
«... гипотез же я не изобретаю. Довольно того, что тяготение на самом деле суще-
ствует и действует согласно изложенным нами законам и вполне достаточно для
объяснения всех движений небесных тел и моря».
Может быть, следует напомнить, что в изложенном подходе великий Ньютон
следовал великому Галилею.
Как и до сих пор, нам надлежит построить математическую модель и ее ис-
следовать. Объектом моделирования являются две точечные массы, которые при-
тягиваются друг к другу с силой, по величине равной γ mM ρ 2 , где m и M – массы
притягивающихся тел, ρ – расстояние между ними и γ – экспериментально най-
денный коэффициент, константа тяготения. Сила притяжения направлена по ли-
нии, соединяющей два тела.
Пусть r и R – радиусы-векторы этих масс в некоторой инерциальной систе-
ме координат (рис. 27.1), тогда, согласно второму закону Ньютона и закону все-
мирного тяготения, имеем:
Mm r − R
MR&& = γ ,
(R − r )2 r − R
(27.1)
Mm r − R
m&r& = − γ .
(R − r )2 r − R
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 217

В этих дифференциальных уравнениях ( r − R ) | r − R |−1 – единичный вектор,


направленный от тела M к телу m. Если их написать в скалярной форме, как это,
естественно, делал Ньютон, то они составят систему шести уравнений второго
порядка, т.е. систему двенадцатого порядка.
m
ρ−

M z r−
Рис. 27.1. Графическая иллюстрация

к задаче двух тел – притягивающихся R
друг к другу масс m и M 0 y
x
Перейдем к вычислениям с этой системой. Они необычайно облегчаются век-
торной записью (27.1). Первое – сложим друг с другом эти уравнения и найдем,
что
MR&& + m&r& = 0
или
d MR + mr
= Vc = const . (27.2)
dt M + m
Это означает, что центр масс двух тел движется равномерно и прямолинейно
с постоянной скоростью Vc .
Запишем уравнения (27.1) в виде:
m( r − R ) && M (r − R )
R&& = γ 3
, r = −γ
|r − R | | r − R |3
и вычтем одно из другого, найдем, что
&& = − γ ( M + m ) ρ ,
ρ (27.3)
| ρ |3
где ρ = r − R – радиус-вектор массы m (планеты) по отношению к массе M
(Солнцу), т.е. это дифференциальные уравнения их относительного движения.
Как движется их центр масс, мы уже знаем.
Умножим векторно обе части уравнения (27.3) на ρ и придем к тому, что
&& × ρ = 0
ρ
или
d &
(ρ × ρ ) = 0 ,
dt
ρ& × ρ = g = const. (27.4)
Выясним смысл полученного соотношения (27.4). Из него следует, что обе
массы M и m все время находятся в плоскости, проходящей через центр масс,
перпендикулярно вектору g . Действительно, радиусы-векторы ρm и ρM масс m и
M (планеты и Солнца) по отношению к их центру масс равны соответственно:
218 Ю.И. Неймарк. Математическое моделирование как наука и искусство

MR + m r m
ρm = r − =− ρ,
M +m M +m
M R + mr M
ρM = R − = ρ,
M +m M +m
где вектор ρ , согласно (27.4), все время перпендикулярен вектору g .
Далее распишем (27.4) в скалярной форме, выбрав начало координат в начале
вектора ρ , т.е. в центре Солнца, и направим ось Oz вдоль вектора g длины g.
Имеем
i j k
ρ& × ρ = x& y& z& = g k , (27.5)
x y z
где i , j , k – орты осей Ox, Oy и Oz; x, y, z – проекции вектора ρ на эти орты,
причем векторы ρ и ρ& ортогональны орту k согласно его выбору, и поэтому
z = z& = 0 . В силу этого из (27.5) следует только одно соотношение
x&y − y& x = g . (27.6)
Перейдем к полярным координатам x = ρ cos ϕ, y = ρ sin ϕ и приведем (27.6) к
виду
ρ 2 ϕ& = − g . (27.7)
Нетрудно заметить, что полученное соотношение (27.7) выражает второй за-
кон Кеплера. Действительно, приращение площади dσ, описываемой вектором ρ ,
равно
1
dσ = ρ 2 dϕ ,
2
и поэтому
1 g
dσ = ρ 2 ϕ& dt = − dt
2 2
или
dσ g
= − = const ,
dt 2
что и требовалось показать (рис. 27.2).

Рис. 27.2. Иллюстрация ко второму закону


σ M Кеплера: σ – площадь, описанная вектором
ρ , массой m, движущейся вокруг Солнца
ρ
m

Перейдем теперь к поиску орбиты планеты относительно Солнца.


27. Законы Кеплера и проблема двух тел, решенная Ньютоном 219

В нашем распоряжении уже имеется одно уравнение (27.7), которое запишем


в виде:
dϕ g
=− 2 . (27.8)
dt ρ
Второе уравнение для dρ/dt можно получить из векторного уравнения (27.3),
умножив его скалярно на вектор скорости ρ& :
&
&& ρ& = − γ (M + m ) ρ ρ
ρ
ρ3
или
d  ρ& 2  1 d ρ2 1 d  ρ2 
  = − γ (M + m ) 3 = − γ (M + m ) 3   =
dt  2  ρ dt 2 ρ dt  2 
ρ& d 1
= − γ (M + m ) 2 = γ (M + m )   ,
ρ dt  ρ 
откуда, интегрируя, находим, что
ρ& 2 γ ( M + m )
− = h = const . (27.9)
2 ρ
Выразим в (27.9) ρ& 2 через полярные координаты ρ и ϕ:
ρ& 2 = ( x& 2 + y& 2 ) = (ρ& cos ϕ − ρϕ& sin ϕ ) + (ρ& sin ϕ + ρϕ& cos ϕ ) = ρ& 2 + ρ 2 ϕ& 2 .
2 2

После подстановки в (27.9) имеем


2γ ( M + m)
ρ& 2 + ρ 2ϕ& 2 − = 2h
ρ
или, выражая ϕ& через ρ, согласно (27.8), получим
g 2 2 γ ( M + m)
− ρ& 2 + = 2h.
ρ2 ρ
Разрешая последнее уравнение относительно ρ& , находим, что

dρ 2γ( M + m) g 2
= 2h + − 2. (27.10)
dt ρ ρ
Найденное уравнение (27.10) вместе с полученным ранее уравнением (27.8) пред-
ставляют собою дифференциальные уравнения относительного движения планеты
в плоскости OXY. Если из этих уравнений исключить время t, разделив почленно
уравнения (27.10) на уравнение (27.8), то придем к одному уравнению орбиты
планеты

dρ ρ2 2γ ( M + m) g 2
=− 2h + − 2 .
dϕ g ρ ρ
220 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Проинтегрировать это дифференциальное уравнение первого порядка и найти


уравнение орбиты можно следующим образом. Сделаем замену переменных, вве-
дя новую переменную u = 1/ρ, в результате чего придем к уравнению
du 1 1
= 2h + 2 γ ( M + m )u − g 2 u 2 = f
dϕ g g
и повысим его порядок, продифференцировав по ϕ:
d 2u 1 1 1 df du 1 1 df 1
=− =− f =
dϕ 2
g 2 f du dϕ 2 g f du g
1 df 1
= 2
= − 2 ( −2 γ ( M + m ) + 2 g 2 u )
2 g du 2g
или
d 2u µ
2
+u = 2 (µ = γ ( M + m)) . (27.11)
dϕ g
Мы пришли к хорошо нам известному неоднородному дифференциальному
уравнению гармонического осциллятора, общее решение которого нам хорошо
известно и пишется в виде:
µ µ
u = 2 + c1 cos ϕ + c2 sin ϕ = 2 {1 + e cos (ϕ − ϕ0 )},
g g
где e и ϕ0 – константы интегрирования. Постоянная ϕ0 имеет смысл начала отсче-
та переменной ϕ на орбите и может быть выбрана равной 0 или π, так чтобы по-
стоянная e была неотрицательной. После этого уравнение планетной орбиты при-
мет вид:
g2
ρ= , e ≥ 0. (27.12)
µ(1 + e cos ϕ)
Эта орбита при e = 0 – окружность, при 0 < e < 1 – эллипс, при e = 1 – пара-
бола и при e > 1 – гипербола (рис. 27.3). В точке ρ = 0 расположен фокус. Бли-
жайшей к фокусу точкой орбиты является точка ϕ = 0, ρ = g 2 /M(1 + e). Параметр
e имеет смысл эксцентриситета1.
Между величинами a и b большой и малой полуосей эллипса и расстоянием
c = a 2 − b2 от центра эллипса до его фокусов F1 и F2 и параметрами формулы
(27.12) имеют место соотношения:
c g2 g2
e= , a−c= , a+с= . (27.13)
a µ (1 + e) µ (1 − e)

1
Это следует непосредственно из определений перечисленных конических сечений.
Так, для эллипса, согласно рис. 27.4 и его определению, (2a – ρ)2 = ρ2 + 4c2 + 2ρc cos ϕ ,
откуда ρ = (a2 – c2)/[a(1 + c/a cos ϕ)], что при обозначениях e = c/a, g2/µ = a2 – c2/a совпа-
дает с (27.12).
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 221

m
m
ρ ϕ
ϕ 2a – ρ ρ
M M
ϕ
0≤e<1 m e=1
F2 0 с F1
ϕ
M
e>1
Рис. 27.3. Эллиптическая, параболическая Рис. 27.4. Эллипс с фокусами F1 и F2
и гиперболическая орбиты движения массы m
относительно инерциальной системы
с началом координат в центре масс

Перейдем к извлечению из найденных соотношений третьего закона Кеплера.


Прежде всего, интегрируя формулу секторной скорости планеты
dσ g
=− ,
dt 2
находим, что
T
dσ g
∫ dt dt = − 2 T .
0

Используя то, что площадь эллипса равна πab, находим


πab = –gT/2.
или
2πab
T =− . (27.14)
g
Соотношение (27.14) вместе с соотношениями (27.13) и c = a 2 − b2 состав-
ляет 5 уравнений с шестью величинами a, b, c, e, g, T, что позволяет, в частности,
получить соотношение между a и T. Оно может быть получено следующим обра-
зом:
2πab 2 πa 2 2 2 πa 2
T =− =− a −c =− 1 − e2 . (27.15)
g g g
Далее из соотношений (27.13) следует, что
g2
a=
µ(1 − e 2 )
или
−g
1 − e2 = .
µa
Подставляя найденное выражение в (27.15), находим, что
222 Ю.И. Неймарк. Математическое моделирование как наука и искусство

2 πa 2  − g  2 πa 3 / 2
T =−  =
g  µa  µ
или
T 2 4π2
= , (27.16)
a3 µ
что и является соотношением, выражающим третий закон Кеплера. Величина
 m
µ = γ ( M + m) = γ M 1 + 
 M
несколько различна для разных планет, но эти различия не могли быть замечены
во времена Кеплера, так как для солнечной системы m/M очень малая величина.
Применим теперь полученные результаты в отношении движения двух тел,
притягивающихся друг к другу по закону всемирного тяготения, к движению те-
ла, запущенного с горы на Земле в горизонтальном направлении со скоростью υ ,
в отсутствие сопротивления воздуха. Прежде всего заметим, что шарообразная
Земля при сферической однородности притягивает брошенное тело так же, как
материальная точка, имеющая массу Земли и находящаяся в ее центре. Этот не-
тривиальный факт был установлен Ньютоном. Он же поставил и решил сформу-
лированный выше вопрос о траектории движения запущенного с земной поверх-
ности тела и обнаружил, что при достаточной скорости это тело станет спутником
Земли подобно Луне.
Согласно предыдущему, движение будет происходить по кривой, определяе-
мой уравнением (27.12):
g2
ρ= , (27.17)
µ(1 + e cos ϕ)
и в одном из ее фокусов будет находиться центр Земли. При ϕ = 0 ρ = RЗ, где RЗ –
радиус Земли или, точнее, расстояние от центра Земли до места, с которого запус-
кается тело, так что
g2 1
RЗ = . (27.18)
µ 1+ e
Осталось еще учесть, что тело запускается со скоростью υ . Из соотношения
(27.8) следует, что
g
ϕ& = − 2 ,

где
υ
ϕ& = .

Так что (27.18) можно записать в виде:
(υRЗ )2 1
RЗ = ,
µ 1+ e
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 223

откуда получим
υ2 RЗ
1+ e =
µ
или, пренебрегая массой запущенного тела, запишем
υ 2 RЗ
e= −1. (27.19)
γ MЗ
Соотношение (27.19) позволяет по скорости υ найти эксцентриситет e орби-
ты брошенного тела, что вместе с (27.18), определяющим g2/µ, определяет пара-
метры уравнения орбиты (27.17).
Формула (27.19) позволяет найти первую и вторую космические скорости υ1
и υ2. Первая – это минимальная скорость, при которой брошенное тело не падает
на Землю и становится ее спутником. Вторая – это минимальная скорость, при
которой брошенное тело перестает быть спутником и покидает Землю. Первое
имеет место при e = 0 и круговой орбите, второе – при e = 1, когда орбита стано-
вится параболической. Из (27.19) находим, что
γ MЗ γ MЗ
υ1 = = 2
RЗ = 9,8 ⋅ 6 ⋅ 106 ≈ 8 км/с,
RЗ RЗ
(27.20)
2γ M З
υ2 = ≈ 11 км/с.

Эти скорости очень велики; с такой скоростью можно облететь земной шар
менее чем за два часа. Но человек их достиг и сделал это только в XX веке с по-
мощью ракеты, о которой у нас была речь ранее. Этих скоростей могут достигать
и молекулы газа. На Земле это удается очень редким молекулам, а на Луне, где
вторая космическая скорость много меньше, их настолько много, что на ней нет
атмосферы. Вторая космическая скорость на Солнце много больше, чем на Земле,
но температура на нем настолько велика, что Солнце все время испускает поток
заряженных частиц.
Помимо этих очевидных замечаний по поводу полученных нами формул
(27.20), укажем еще на два их следствия. Первое относится к тому, когда «звезда»
становится черной дырой, которую ничто и даже свет не может покинуть. Черная
дыра уже не светится и ее удается обнаружить лишь по влиянию ее тяготения на
ближайшие к ней настоящие видимые звезды. Ответ на поставленный вопрос
очень прост: «звезда» будет черной дырой, если ее вторая космическая скорость
больше скорости света: быстрее света c ничто перемещаться не может. Таким об-
разом, условие черной дыры имеет вид:
2 γM
> с, (27.21)
R
где M – ее масса, а R – радиус. Чтобы почувствовать, что представляет собою это
условие, укажем, что Солнце было бы черной дырой, если бы его размер был ме-
нее трех километров, т.е. при гигантской плотности нескольких миллионов тонн в
кубическом сантиметре. Эта фантастическая плотность все же возможна, и чер-
224 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ные дыры существуют. Вблизи черной дыры геометрия пространства неевклидова


и часы идут медленнее в соответствии с теорией тяготения Эйнштейна, эффекты
которой, еле уловимые в поле тяготения Солнца и планет, становятся значитель-
ными в гигантских гравитационных полях черных дыр.
Второй вопрос о том, сбегаются под влиянием тяготения небесные тела все-
ленной или, наоборот, разбегаются? Он уже не так прост, я бы даже сказал, на-
столько сложен, что ответ не столь уж очевиден и ясен.
Начнем издалека. Еще Ньютону было известно, что сила f притяжения еди-
ничной массы на расстоянии r от центра массивного однородного шара радиуса R
и массы M определяется формулой
 γM
 2
для r ≥ R,
f = r 3 (27.22)
 γ M r
для r ≤ R,
 r 2 R 3
т.е. при r ≥ R шар можно заменить точечной массой M в его центре, а при r < R
наружная часть шара по отношению к притягиваемой единичной массе никакого
притяжения не оказывает (все ее притяжения, направленные в разные стороны,
уравновешиваются).
Сделанные выше выводы из формулы (27.22) обобщаются на неоднородный
шар, у которого плотность ρ зависит только от радиуса удаления от центра. Те-
перь перенесем эти соображения на вселенную. Плотность ее в пределах досягае-
мости и точности измерений постоянна. Конечно, под плотностью понимается
усредненная плотность по достаточно большому шару, но и не очень большому:
много, много меньшему размеров обозримой нами вселенной. Можно думать, что
где-то еще дальше она уменьшается и даже исчезает и что наша Солнечная систе-
ма находится где-то вблизи центра вселенной, центра по отношению к этому
очень далекому убыванию. Об этом говорит отсутствие притяжения вселенной
нашей Солнечной системы, с точностью до локальных флуктуаций плотности.
Далее, чтобы ответить на вопрос, сжимается или разбегается вселенная, нуж-
но иметь некоторое представление о скоростях составляющих ее масс. Эти сведе-
ния дает закон Хаббла, согласно которому на хаотические скорости звезд накла-
дывается систематическая радиальная составляющая. Звезды радиально разбега-
ются со скоростью
V = HR км/с, (27.23)
где H – постоянная Хаббла, примерно равная 75 км/с⋅Мик, а R – расстояние до
звезды, измеряемое в Мик (Мик – это единица расстояния, равная примерно пути,
пробегаемому светом за три года).
Теперь выделим большой шар радиуса R с центром, где мы находимся, и
спросим, могут ли звезды или другие тела его покинуть? Они смогут это сделать,
если скорости на поверхности шара превосходят вторую космическую скорость
выделенного нами шара, т.е. если
2γ M
V = HR > , (27.24)
R
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 225

и не смогут это сделать при противоположном неравенстве. Выражая массу M


выделенного шара радиуса R через среднюю плотность ρ, найдем, что
4
M = πρR 3 .
3
Подставляя значение M в (27.24), находим, что критическая, разделяющая
случаи разбегания и сжатия, плотность ρкр, не зависит от R и равна
3H 2
ρкр = ≈ 10− 29 г/см 3. (27.25)
8πγ
Таким образом, если плотность массы во вселенной больше ρкр, вселенная
будет сжиматься, если меньше – расширяться. Сегодняшние подсчеты ρ для все-
ленной требуют учета межзвездного темного вещества и дают с его учетом циф-
ру, близкую к ρкр, так что вопрос остается открытым.
Мы с достаточной скрупулезностью проделали все вычисления, с которыми
впервые справился Ньютон. Вы понимаете, что в те времена это был громадный,
титанический труд, полный неожиданных препятствий. Ведь до Ньютона не было
ни дифференциального, ни интегрального исчисления, не было и дифференциаль-
ных уравнений.
В дальнейшем пытались обобщить результаты Ньютона на большое число
притягивающихся тел, на так называемую проблему n тел. Но никому это не уда-
лось. Спустя значительное время стало ясно, что это нельзя сделать: проблема n
тел при n > 2 неинтегрируемая. Возникли сложные теории приближенного реше-
ния, методы так называемой теории возмущений. Эта теория достигла высокой
степени совершенства и сыграла в науке громадную роль, не только в небесной
механике. Путем вычислений, основанных на теории возмущений, удалось не
только предсказать на много лет вперед положение планет, но и открыть новую
планету Нептун. Но проинтегрировать уравнения не удалось даже в упрощенной
проблеме трех тел, когда одно из тел имеет исчезающе малую массу и притяже-
нием двух других тел можно пренебречь.
Теория возмущений основана на построении последовательных приближе-
ний, например, в виде степенного ряда по некоторому малому параметру. В пер-
вом приближении учитывается основное взаимодействие каждой планеты с
Солнцем. В нем все планеты движутся по неизменным кеплеровым орбитам.
Плоскости этих орбит близки к плоскости эклиптики. Положение каждой из ор-
бит относительно плоскости эклиптики определяется какими-то параметрами. В
первом приближении они постоянны. Затем строится второе приближение, учи-
тывающее влияние всех или части остальных планет, при этом считается, что они
движутся по неизменным эллиптическим орбитам. Затем эта процедура повторя-
ется с учетом уточненных орбит планет и т.д. В результате возникает решение для
изменений параметров орбит и движений по ним планет в виде ряда по малому
параметру – отношения масс планет к массе Солнца. Построение этих рядов дос-
таточно сложно и, с одной стороны, достигло высокой степени разработанности, а
с другой, обнаружило ряд трудностей, среди которых самой стойкой и непреодо-
ленной оказалась проблема малых знаменателей.
226 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Качественная теория дифференциальных уравнений А. Пуанкаре – ответ на


эти трудности. Начало ей положили знаменитые труды А. Пуанкаре «Новые мето-
ды небесной механики» [40, 41] и «О кривых, определяемых дифференциальными
уравнениями». Но и эта новая замечательная теория оказалась бессильной не
только перед проблемой n тел, но даже перед ограниченной (упрощенной) про-
блемой трех тел. Сегодня расчет движения планет и искусственных спутников,
благодаря успехам в развитии методов вычислений и вычислительной техники,
выполняют ЭВМ. Они это делают быстро и очень точно. Но не все им подвластно.
И сегодня нет ответа, какой будет Солнечная система через миллиарды лет. Ус-
тойчива ли она или может существенно измениться? Прямые вычисления здесь
помочь не могут: как бы ни были малы ошибки счета за миллиарды лет, они нака-
пливаются и становятся очень большими и непредсказуемыми.
Это вызвано тем, что дифференциальные уравнения движения в задаче n тел
− консервативные гамильтоновы, не допускающие экспоненциально устойчивых
движений. Любое их решение либо экспоненциально неустойчиво, и тогда неиз-
бежно экспоненциальное же нарастание ошибки при его приближенном вычисле-
нии, либо нейтральное, для которого ошибки счета так же, хотя и значительно
медленнее, но все же нарастают. Более того, при сколь угодно малых независи-
мых случайных ошибках спустя достаточное время Солнечная система, скорее
всего, может прийти к любому состоянию, достижимому при ненарушении ос-
новных законов сохранения энергии, количества и момента количества движения.
Вместе с тем, у Солнечной системы наблюдаются удивительные структурные
особенности и закономерности. Особое удивление вызвали удивительные син-
хронизмы между периодами обращения планет, орбитальными и собственными,
тонкая структура колец Сатурна и другие. Все это ни теория, ни счет долго не
объясняли. Они и не могли объяснить, пока господствовала только консерватив-
ная гамильтонова модель Солнечной системы.
Эти закономерности своим появлением обязаны неконсервативным силам, не
только силам ньютоновского притяжения, но и, пусть и очень малым, диссипа-
тивным силам. Солнечная система существует миллиарды лет и именно эти, каза-
лось бы, ничтожные силы, породили удивительную структуру и закономерности
ее движения.
Изучение этих структурных особенностей долго эволюционирующей Сол-
нечной системы невозможно и без более полного учета гравитационных взаимо-
действий между ее телами. Если однородные шарообразные тела взаимодейству-
ют друг с другом как материальные точки, помещенные в их центрах, что знал
еще Ньютон, то для тел нешарообразных и неоднородных это не так. Нужно учи-
тывать не только нешарообразность тел Солнечной системы, но и их деформи-
руемость, приводящую к приливному трению и силам, вызываемым внутренними
деформациями. Этот учет кардинально качественно меняет фазовый портрет и
движение Солнечной системы, т.к. консервативная гамильтонова система диффе-
ренциальных уравнений движения превращается в диссипативную, допускающую
экспоненциально устойчивые движения. Их уже можно находить с помощью вы-
числений, а экспоненциально устойчивые установившиеся движения можно най-
ти теоретически с помощью современной теории систем с быстровращающимися
фазами.
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 227

Наличие малой диссипации упростило фазовый портрет Солнечной системы,


в нем уже нет прежнего, возможно, бесконечного числа периодических движений,
он упростился и стал доступен теоретическому и вычислительному изучению, и
это сделал учет, казалось бы, совершенно ничтожных добавок, не обнаруживае-
мых в первых приближениях.
228 Ю.И. Неймарк. Математическое моделирование как наука и искусство

28. РАСПРЕДЕЛЕННЫЕ ДИНАМИЧЕСКИЕ МОДЕЛИ


МЕХАНИКИ И ФИЗИКИ
До сих пор рассматриваемые нами математические модели – динамические
системы – были в основном такими, что их состояние задавалось конечным чис-
лом скаляров, а его изменение подчинялось обыкновенным дифференциальным
уравнениям
dx
= X (x ) , (28.1)
dt
где x – конечномерный вектор состояния, а X(x) – вектор-функция x.
Сейчас мы перейдем к другому типу динамических систем, у которых со-
стояние определяется функциями от каких-то переменных, а изменение состояния
во времени, т.е. изменение описывающих его функций, подчиняется уравнению в
частных производных вида
∂u  ∂u ∂u 
= F  u, ,..., ,...  , (28.2)
∂t  ∂x1 ∂xn 
где u(x1,... , xn; t) – функция или вектор-функция, описывающая состояние в мо-
мент времени t, а правая часть уравнения (28.2) зависит не только от функции u,
но и ее частных производных по переменным x1,..., xn до какого-то порядка.
При этом данное ранее общее определение динамической системы полностью
сохраняется. Изменился лишь способ описания ее состояния и в связи с этим и
вид ее оператора. Как и ранее, изменение состояния во времени, т.е. производная
∂u ∂t определяется через состояние, т.е. функцию u(x1,..., xn; t) и определяемые ею
частные производные по x1,..., xn. Как и ранее, это позволяет приближенно найти
состояние в следующий момент времени t + ∆t через состояние в предшествую-
щий момент времени t:
~
u( x1 ,..., xn ; t + ∆t ) ≈ u( x1 ,..., xn ; t ) + F ( x1 ,..., xn ; t ) ∆t
и надеяться делать это сколь угодно точно с уменьшением ∆t. В предположении
существования гладкого решения ошибка на одном шаге порядка (∆t)2, а на ко-
нечном промежутке времени T порядка ( ∆t ) 2 T ∆t = T∆t и стремится к нулю вме-
сте с ∆t.
Описание состояния функциями во многих случаях вызвано пространствен-
ной распределенностью описываемой реальной системы. Так, тепловое состояние
среды описывается температурой T(x, y, z, t), зависящей от пространственных пе-
ременных x, y, z и меняющейся со временем t. Давление в жидкости (газе) опреде-
ляется его величиной p(x, y, z, t) в каждой ее точке (x, y, z). Аналогичны описания
ρ(x, y, z, t) плотности вещества или распределения в пространстве электрического
заряда.
Это все примеры скалярных полей и описаний их одной функцией от про-
странственных переменных и времени.
28. Распределенные динамические модели механики и физики 229

Поля могут быть векторными. Таково поле скоростей υ( x, y , z, t ) течения


жидкости или газа; поле смещений r (x, y, z, t) точек упругого деформируемого те-
ла; электрические и магнитные поля, описываемые векторами электрического и
магнитного полей.
Рассматриваемые нами ранее системы, состояние которых описывалось ко-
нечным числом скалярных переменных, называются дискретными. Системы, о
которых сейчас речь и у которых состояние описывается функциями, называются
распределенными.
Распределенную систему можно трактовать как дискретную с бесконечным
числом переменных. Действительно, функцию, например, трех переменных
f (x, y, z) можно разложить в ряд по некоторым функциям ϕ1(x, y, z), ϕ2(x, y, z), ..., так
что

f ( x , y , z ) = ∑ c j ϕ j ( x, y , z ) ,
j =1
и тем самым функция f (x, y, z) определяется бесконечным числом скалярных пе-
ременных c1, c2,...
При такой замене при независимости функций ϕ1, ϕ2, ... уравнение (28.2) по-
влечет за собой эквивалентную ему бесконечную систему обыкновенных диффе-
ренциальных уравнений
dc j
= F (c1, c2 ,...) ( j = 1, 2, 3).
dt
Сказанное достаточно очевидно, но требует обоснований, и они не так уж и
просты, скорее даже очень сложны, если пытаться уменьшать ограничения на
функции f и F. Но это уже не предмет этих лекций.
Мир распределенных систем, пожалуй, еще более многообразен и широк, чем
дискретных. Более того, на дискретные системы можно смотреть как на частный
конечномерный случай распределенных систем. Это не делается только потому,
что существующие методы исследования уравнений в частных производных су-
щественно отличаются от методов теории обыкновенных дифференциальных
уравнений. Фактически это разные научные дисциплины, разные разделы матема-
тики, которыми занимаются разные люди.
Вместе с тем, те и другие дифференциальные уравнения при использовании
общих понятий функционального анализа записываются одинаково в виде (28.1),
где теперь x – элемент некоторого функционального пространства, а X(x) не век-
тор-функция от x, а оператор X от x.
Дальнейший рассказ − не более чем знакомство, предисловие или введение в
науку о распределенных динамических системах. Более основательные встречи с
ними могут состояться в курсах математической физики, гидродинамики, теории
упругости, электродинамики, статистической физики, теории вероятностей и слу-
чайных процессов и других. Поскольку это предисловие, то многое будет носить
описательный, а не доказательный характер. Это в первую очередь относится к
основным моделям классической математической физики и великим уравнениям
в частных производных механики и физики: уравнениям Эйлера, Навье – Стокса и
уравнениям Максвелла. Вам придется поверить на слово, не требуя их обоснова-
230 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ния и вывода, и это не должно вам мешать их «понять» и пользоваться ими при
рассмотрении конкретных примеров. Исключением из этого будет уравнение теп-
лопроводности или диффузии, для того чтобы дать вам возможность увидеть, как
возникают и откуда берутся уравнения в частных производных. Речь идет об
уравнении
∂u  ∂ 2u ∂ 2u ∂ 2u 
= a 2  2 + 2 + 2  , (28.3)
∂t  ∂x ∂y ∂z 
которое одновременно описывает явления теплопроводности, диффузии и слу-
чайного блуждания. В первом случае u(x, y, z, t) – температура в точке (x, y, z) в мо-
мент времени t, во втором – плотность диффундирующего вещества, в третьем –
плотность вероятности того, что случайная блуждающая точка в момент времени
t находится в точке (x, y, z).
Начнем с распространения тепла в однородной одномерной среде. Поле тем-
пературы и этом случае описывается функцией T(x, t). Ее изменение происходит
благодаря естественному перетеканию тепла с более горячих мест в более холод-
ные. Это перетекание во многих случаях можно принять пропорциональным гра-
диенту температуры, так что
∂T
dt , dQ = −k (28.4)
∂x
где dQ – количество тепла, перетекшего в направлении оси Ox за время dt через
сечение x (рис. 28.1). Знак минус указывает на то, что перетекание тепла происхо-
дит в направлении, обратном возрастанию температуры. Однородность среды вы-
ражается в постоянстве коэффициента теплопроводности k.
T(x, t)

dQ
Рис. 28.1. Распространение тепла
O в однородной одномерной среде
x
x

Выделим произвольный участок [x1, x2]. Принимая, что теплоемкость среды


постоянна и равна с, находим, что в момент времени t в нем содержится количе-
x2
ство тепла, равное ∫x
1
cT ( x, t ) dx.
Прирост этого количества тепла, если нет излучения, за время dt определяется
его притоком через сечения x = x1 и x = x2 (x2 > x1), т.е.

∂  2 
x
( )  dt = −k ∂T ∂T

∂t  x
cT x , t dx
 ∂x
x = x1 dt +k
∂x
x = x2 dt ,
 1 
сокращая на dt и дифференцируя по t, получим
28. Распределенные динамические модели механики и физики 231
x2
∂T  ∂T ∂T 
c∫ dx = k  x = x2 − x = x1 . (28.5)
x1
∂t  ∂x ∂x 
Нам осталось перейти к пределу при неограниченном сближении сечений x1 и
x2 к произвольному x. Воспользуемся теоремой о среднем для интеграла в соот-
ношении (28.5) и запишем это соотношение в виде:
∂T  ∂T ∂T 
c( x2 − x1 ) x =ξ = k x = x2 − x = x1 ,
∂t  ∂x ∂x 
где ξ – некоторая промежуточная точка между x1 и x2 . Разделим полученное ра-
венство на x2 – x1 и перейдем к пределу при стремлении этой разности к нулю в
связи со сближением точек x1 и x2 к точке x. В результате придем к искомому
уравнению теплопроводности
∂T ∂ 2T
c =k 2 ,
∂t ∂x
которое обычно записывают в виде
∂T ∂ 2T 2 k
= a2 2 a =  . (28.6)
∂t ∂x  c
Таким же уравнением описывается и процесс диффузии одного вещества с
концентрацией ρ(x, t) в другом. Это следует из того, что при диффузии происхо-
дит перемещение вещества из мест с большей концентрацией в места с меньшей,
причем для количества переместившегося вещества dm за время dt имеет место
тот же закон, что и для перемещения тепла, т.е.
∂ρ
d m = −D dt, (28.7)
∂x
где D – коэффициент диффузии. Поэтому такие же рассуждения и выкладки при-
водят к уравнению (28.6), в котором a2 = D.
К такому же уравнению приводит и задача о случайных блужданиях частицы
по прямой Ox. Назовем эту задачу задачей об абсолютно пьяном, который не зна-
ет, куда ему идти, и делает шаг вперед или назад равновероятно. Пусть шагает он
через время τ, а длина его шага a. Пусть еще p(sa, nτ) – вероятность того, что в
момент t = nτ после n шагов он оказался в точке x=sa (s – целое).
Нетрудно установить связь между вероятностями p(sa, nτ) и p (sa, (n + 1)τ).
Действительно, в точке sa он может оказаться, только шагнув перед этим вперед
из точки (s – 1)a, или шагнув назад из точки (s + 1)a. То и другое он делает равно-
вероятно с вероятностью 1/2, поэтому
1 1
p ( sa, ( n + 1) τ) = p(( s − 1) a, nτ) + p(( s + 1)a, nτ). (28.8)
2 2
Соотношение (28.8) позволяет, зная функцию p(sa, nτ) при n = 0, найти после-
довательно ее при любом n. Так, если при n = 0 абсолютно пьяный – блуждающая
частица – находится в точке x = 0, то функция p(sa, 0) известна и равна
232 Ю.И. Неймарк. Математическое моделирование как наука и искусство

0 при s ≠ 0,
p( sa,0) = 
1 при s = 0,
и по ней может быть найдена любая из вероятностей p(sa, nτ) при любых s и n.
Допустим теперь, что шаги пьяного все убыстряются, а их длина уменьшает-
ся. Пусть τ и a стремятся к нулю, так, что
a2
lim = D. (28.9)

Запишем соотношение (28.8) в виде:
p ( sa, ( n + 1) τ) − p ( sa, nτ) a 2 p (( s + 1)a, nτ) − 2 p ( sa, nτ) + p ( sa, nτ)
= ,
τ 2τ a2
переходя в нем к пределу при τ → 0, a → τ и учитывая условие (28.9), придем к
уравнению в частных производных относительно функции p(x, t):
∂p ∂2 p
=D 2 , (28.10)
∂t ∂x
совпадающему по виду с уравнением теплопроводности (28.6) (a2 = D).
Не следует думать, что в уравнении (28.10), как это было бы естественно,
стоит предел дискретной функции p(sa, nτ). Этот предел, как нетрудно видеть, ра-
вен нулю, так как все вероятности p(sa, nτ) при a → 0 стремятся к нулю. Конечно,
нуль уравнению (28.10) удовлетворяет, но это нас не устраивает. Нам нужно не-
нулевое решение уравнения (28.10), удовлетворяющее условию нормировки
+∞

∫ p( x, t ) dx = 1 ,
−∞
которое интерпретируется для дискретных функций p(sa, nτ) в виде
+∞
∑ p( sa, nτ) = 1 .
s = −∞
Его можно записать в виде
p( sa, nτ)
∑a
a = 1,

приводящем к мысли, что p(x, t) следует считать пределом дискретной функции


p(sa, nτ)/a.
Приведенные выводы нетрудно повторить в более общих предположениях
двумерности или трехмерности пространства. При этом мы во всех трех случаях
придем к уравнению вида
∂T  ∂ 2T ∂ 2T 
= a 2  2 + 2  (28.11)
∂t  ∂x ∂y 
или, соответственно, вида
∂T  ∂ 2T ∂ 2T ∂ 2T 
= a 2  2 + 2 + 2  . (28.12)
∂t  ∂x ∂y ∂z 
28. Распределенные динамические модели механики и физики 233

Дифференциальное уравнение в частных производных (28.12) (и его частные


случаи (28.6) и (28.11)) является одним из основных уравнений классической ма-
тематической физики. Вторым основным ее уравнением является волновое урав-
нение
∂ 2u 2 ∂ u ∂ 2u ∂ 2u 
2
= a  2 + 2 + 2  .
 (28.13)
∂t 2  ∂x ∂y ∂z 
Это уравнение описывает колебания упругих сред. Для звуковых колебаний
газа функция u(x, y, z, t) имеет смысл давления в точке (x, y, z) в момент времени t.
В одномерном случае, когда
∂ 2u 2
2 ∂ u
=a ,
∂ t2 ∂x 2
функция u(x, t) может быть отклонением натянутой струны от ее равновесного по-
ложения. Это же уравнение описывает продольные упругие колебания однород-
ного стержня. В этом случае u(x, t) – упругое продольное смещение материала
стержня в сечении x в момент t. В двумерном варианте уравнение (28.11) может
описывать поперечные колебания мембраны.
Уравнения теплопроводности и волновое уравнение классической математи-
ческой физики – линейные. Это значит, что к ним применим принцип суперпози-
ции, тот же самый, что и для линейного осциллятора или любой другой линейной
системы, т.е. найдя какие-нибудь их решения, можно с их помощью строить но-
вые решения или, может быть, даже любое нужное нам решение. Такими частны-
ми решениями являются так называемое фундаментальное решение уравнения
теплопроводности и гармонические бегущие волны. С тем и другим ниже мы по-
знакомимся.
Существенным отличием динамических систем, описываемых дифференци-
альными уравнениями в частных производных, от тех, которые описываются
обыкновенными дифференциальными уравнениями, состоит в том, что равновес-
ные состояния дискретных динамических систем находятся сравнительно просто
из обращения в нуль их правых частей, т.е. из некоторых нелинейных уравнений,
в то время как для распределенных динамических систем уравнения, определяю-
щие равновесие, оказываются также дифференциальными. Так, полагая в (28.12)
или (28.13) T(x, y, z, t) =T*(x, y, z) и u(x, y, z, t) =u*(x, y, z) равновесными состояниями,
не меняющимися со временем, приходим к тому, что они удовлетворяют уравне-
ниям в частных производных
∂ 2T ∗ ∂ 2T ∗ ∂ 2T ∗
+ + =0 (28.14)
∂x 2 ∂y 2 ∂z 2
и, соответственно,
∂ 2u∗ ∂ 2u∗ ∂ 2u∗
+ + 2 =0. (28.15)
∂x 2 ∂y 2 ∂z
Решение этих уравнений настолько сложно, что они также входят в список
уравнений классической математической физики.
Продолжим знакомство с другими математическими моделями распределен-
ных динамических систем.
234 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Движение вязкой жидкости подчиняется нелинейным дифференциальным


уравнениям в частных производных Навье – Стокса
∂υ 1
+ ( υ∇)υ = − ∇p + ν ∇υ ( υ = ( υ x , υ y , υ z )) . (28.16)
∂t ρ
Частным его случаем при ν = 0 является уравнение Эйлера движения идеаль-
ной (невязкой) жидкости. В этом уравнении υ(x, y, z, t) – вектор скорости жидкости
в точке x, y, z в момент t; p(x, y, z, t) –давление; ρ – плотность; ν – параметр, так на-
зываемая кинематическая вязкость; ∇ и ∆ – известные символы операторов гради-
ента и Лапласа. Именно градиент
∂ ∂ ∂
∇=i + j +k ,
∂x ∂y ∂z
где i, j, k – орты прямоугольной системы координат, а оператор Лапласа имеет
вид:
∂2 ∂2 ∂2
∆= 2 + 2 + 2.
∂x ∂y ∂z
В случае несжимаемой жидкости к уравнению Навье – Стокса или Эйлера
требуется добавить условие несжимаемости, состоящее в том, что скорости жид-
ких частиц должны быть такими, чтобы их объем не менялся. Это условие также
записывается с помощью уравнения в частных производных, а именно:
∂υ ∂υ y ∂υ z
div υ = x + + = 0, (28.17)
∂x ∂y ∂z
а для сжимаемой жидкости в виде условия
div ρν = 0, (28.18)
выражающего сохранение не объема, а массы.
Вас бегло познакомлю еще с великими уравнениями Максвелла. Это доста-
точно сложная система уравнений в частных производных. В нее входит много
разных функций: вектор-функции E(x, y, z, t), D(x, y, z, t), H(x, y, z, t), B(x, y, z, t), опи-
сывающие электрическое и магнитное поля (поля вектора электрической напря-
женности и индукции, магнитной напряженности и индукции); скалярная функ-
ция распределенного электрического заряда ρ(x, y, z, t) и векторная функция поля
электрических токов j(x, y, z, t). Уравнения Максвелла связывают эти функции ме-
жду собой. В векторной форме и в сокращающих их запись общепринятых обо-
значениях они могут быть записаны в виде следующих основных уравнений 1:

1
rot A – дифференциальная операция над вектором A (Ax, Ay, Az), записанная в виде оп-
ределителя:
i j k
∂ ∂ ∂  ∂Az ∂A y  ∂A ∂A  ∂A ∂A 
rot A = = i  −  + j  x − z  + k  y − x  .
∂x ∂y ∂z  ∂y ∂z   ∂z ∂x   ∂x ∂y 
Ax A y Az
Определение div A содержится в уравнении (28.17).
28. Распределенные динамические модели механики и физики 235

∂D ∂B
= −4πj + c rot H , = −c rot E , (28.19)
∂t ∂t
к которым следует добавить еще два уравнения
div B = 0, div D = −4πρ , (28.20)
и в простейшем, частном случае, еще три алгебраических соотношения
D = εE , B = µH , j = σE . (28.21)
Это очень сложная система уравнений. Это и понятно, ведь из нее следуют
все явления электростатики, магнитостатики, электродинамики и электромагнит-
ного излучения и волн. Они при независимости ε и µ от полей E и H линейные и
поэтому допускают применение принципа суперпозиции. В этом смысле более
простые на вид уравнения гидродинамики куда хуже, они нелинейные и принцип
суперпозиции для них не имеет места.
Вы увидели несколько замечательных, даже великих, распределенных мате-
матических моделей механики и физики. Возможно, они вам чужды и непонятны.
Не смущайтесь этим, ведь это не более как математические описания, математи-
ческие модели. Только это от вас сейчас требуется. Вы должны принять их в этом
качестве, не смущаясь ни их сложностью, ни вашим сегодняшним незнанием, как
их решать и применять.
Во всех приведенных моделях описание состояния функциями возникло по-
тому, что речь шла о тех или иных физических пространственных полях: поле
температур, плотности, скорости, смещений, давления, электрической и магнит-
ной напряженностей и индукции, плотности вероятностей. Но возможны и совсем
другие причины возникновения в описании состояния функций. Этот другой слу-
чай вам встретится позднее при рассмотрении математических моделей микроми-
ра. Состояние динамических систем микромира описывается функцией от коор-
динат всех входящих в систему частиц и их спинов, а уравнение, которому эта
функция удовлетворяет, – это знаменитое уравнение Шредингера для функции
состояния ψ:
∂ψ
ih = Hψ , (28.22)
∂t
которое пишется очень кратко, но в котором отражается весь окружающий мир.
Уравнение это на самом деле очень сложное и решается очень трудно: функция
ψ – комплексная и может зависеть от очень большого числа переменных, а под
знаком оператора Гамильтона H спрятан сложный дифференциальный оператор,
содержащий частные производные второго порядка. Этому не следует удивлять-
ся, ведь именно он, в конечном счете, определяет все происходящее в окружаю-
щем нас неживом и живом мире.
Ко всему сказанному о распределенных моделях динамических систем (клас-
сических уравнениях математической физики, уравнениях Эйлера и Навье –
Стокса, Максвелла и Шредингера) необходимо добавить, что сами по себе они
еще не дают полного описания изменения входящих в них функций. К этим урав-
нениям необходимо присоединить еще некоторые дополнительные условия. Они
весьма разнообразны и определяются конкретным рассматриваемым объектом.
Для уравнений математической физики при неограниченности пространства пе-
236 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ременных x, y, z – это некоторые условия ограниченности на бесконечности, при


ограниченности области переменных x, y, z – это некоторые условия на ее грани-
це, называемые краевыми. То же имеет место и для уравнений гидродинамики,
электродинамики и уравнений Шредингера. Только совместно с этими дополни-
тельными условиями входящие в эти уравнения функции от пространственных
переменных определяют состояние, т.е. будучи заданы при t = t0, они могут быть
найдены при любом t > t0. С некоторыми конкретными краевыми условиями вы
встретитесь в дальнейшем. А сейчас ограничимся простым примером натянутой
струны, концы которой неподвижно закреплены.
В этом случае уравнение малых колебаний струны – это волновое уравнение
∂ 2u 2
2 ∂ u
=a , (28.23)
∂t 2 ∂x 2
где u(x, t) – отклонение струны от равновесного натянутого положения в момент
времени t. Это уравнение имеет место на всей струне, т.е. при 0 ≤ x ≤ l, где x = 0 и
x = l – координаты закрепленных концов струны. На этих концах отклонение u
отсутствует, и поэтому имеют место краевые условия
u x =0 = 0, u x =l = 0. (28.24)
Уравнения в частных производных (28.23) совместно с краевыми условиями
(28.24) допускают при заданном начальном положении и скоростях
∂u
u ( x, t ) t =0 = ϕ ( x ), = ψ( x ) (28.25)
∂t t =0
единственное решение u(x, t). Состояние в этом случае определяется в начальный
момент функциями ϕ(x) и ψ(x), удовлетворяющими краевым условиям ϕ(0) =
= ϕ(l) = 0, ψ(0) = ψ(l) = 0. При любом t состояние описывается удовлетворяющими
краевым условиям функциями от x: u(x, t) и ∂u ( x, t ) ∂t . Вас не должно удивлять,
что наряду с функцией u (x, t) в описание состояния входит еще и функция
∂u ( x, t ) ∂t . Это объясняется тем, что волновое уравнение (28.13) в виде (28.2) за-
писывается как

(u, υ) = ( υ, a 2 ∆u ) , (28.26)
∂t
и состоянием для него является вектор, составленный из двух функций u(x, t) и
υ(x, t), как функций x при фиксированном времени t.
29. Фундаментальное решение уравнения теплопроводности 237

29. ФУНДАМЕНТАЛЬНОЕ РЕШЕНИЕ


УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ
Распространение тепла в неограниченной однородной одномерной теплопро-
водящей среде описывается дифференциальным уравнением в частных производ-
ных вида
∂T ∂ 2T
= a2 2 , T = T(x, t). (29.1)
∂t ∂x
Такое же по виду уравнение описывает диффузию или случайное блуждание час-
тицы.
Пусть в начальный момент времени t = 0 имеется некоторое произвольное
поле температур T0(x), так что
T ( x, t ) t =0 = T0 ( x ) . (29.2)
Уравнение теплопроводности (29.1) по начальному распределению темпера-
тур T0(x) определяет дальнейшее поле температур T(x, t) при любом t > 0.
Уравнение (29.1) и начальное условие (29.2) описывают не только изменение
начального поля температур, но и диффузию вещества, и изменение со временем
плотности вероятности случайно блуждающей частицы. При этом T0(x) – началь-
ная плотность вещества или, соответственно, начальная плотность вероятности.
Не будем решать эту общую для всех перечисленных явлений задачу (29.1),
(29.2) сразу для произвольного начального поля T0(x). Попытаемся найти ее реше-
ние для точечного начального поля, когда только в одной точке x0 среда разогре-
та, или только в ней находится диффундирующее вещество, или в ней находится
случайная частица.
Сразу же возникает вопрос: как, какой моделью описать точечное сосредото-
чение тепла, вещества или плотности вероятности? С физической точки зрения
идеализации точечным сгущением массы или тепла обычны. Но как их описать
математически? Ведь в этих случаях температура, плотность диффундирующего
вещества или, соответственно, плотность вероятности становятся бесконечными,
а всюду вне этой точки равными нулю. Не будем смущаться и запишем, что для
описывающей функции T0(x) имеет место
∞ при x = x0 ,
T0 ( x ) =  (29.3)
0 при x ≠ x0 ,
и еще запишем, что в точке x = x0 сосредоточено c (c – теплоемкость вещества)
единиц тепла, единичная масса или вероятность, равная единице,

∫ T0 ( x )dx = 1 . (29.4)
−∞

Безусловно, функция T0(x), определяемая (29.3), − не функция в обычном


смысле, а интеграл (29.4) – не интеграл. Будем ее рассматривать как некий новый
символ – δ-функцию или обобщенную функцию. Эту необычную δ-функцию ввел
238 Ю.И. Неймарк. Математическое моделирование как наука и искусство

в математику О. Хевисайд в связи с созданным им операционным исчислением, и


позднее физик П. Дирак – в квантовой механике.
Обобщенная функция δ(x) определяется условиями:
∞ при x = 0,
δ( x ) =  (29.5)
0 при x ≠ 0,

∫ δ( x ) dx = 1 .
−∞

Из (29.5) формально следует, что для любой непрерывной функции


∫ f ( x )δ( x − x0 ) dx = f ( x0 ) . (29.6)
−∞
Действительно,
∞ x0 + ε

∫ f ( x )δ( x − x0 )dx = ∫ f ( x )δ( x − x0 )dx


−∞ x0 − ε

при любом сколь угодно малом ε > 0. По известной теореме о среднем этот по-
следний интеграл равен
x0 + ε
f ( ξ) ∫ δ( x − x0 ) dx = f (ξ) ,
x0 − ε

где ξ лежит в промежутке от x0 – ε до x0 + ε. Так как ε может быть сколь угодно


малым и функция f (x) – непрерывна, то ξ = x0 .
Пусть x0 = 0 и начальному распределению температур T0(x) = δ(x) отвечает
меняющееся поле температур ϕ(x, t). Функция ϕ(x, t) показывает, как растекается c
единиц тепла, сосредоточенных в точке x = 0, по всей прямой. Для задач диффу-
зии и случайного блуждания функция ϕ(x, t) описывает диффузию вещества, по-
началу сосредоточенного в точке x = 0, а для случайного блуждания частицы –
плотность вероятности нахождения и в точке x спустя время t, если в начальный
момент она находилась в точке x = 0.
Найти путем логического рассуждения функцию ϕ(x, t) не очень просто, дога-
даться можно, но трудно. Мы не будем делать ни того, ни другого, а просто ее на-
пишем
1  x2 
ϕ( x , t ) = exp − 2  (29.7)
2 a πt  4 a t 
и проверим, что эта функция ϕ(x, t) удовлетворяет при любых x и t > 0 уравнению
теплопроводности (29.1) и начальным условиям (29.2), когда T0(x) = δ(x). Не нуж-
но только последнее понимать буквально: если в (29.7) подставить t = 0, то нам
дважды придется делить на 0. Поэтому будем не подставлять t = 0, а переходить к
пределу при t → 0, т.е. покажем, что
0 при x ≠ 0,
lim ϕ( x, t ) = 
t →0 ∞ при x = 0
29. Фундаментальное решение уравнения теплопроводности 239

и что

lim ∫ ϕ( x, t )dx = 1 .
t →0
−∞
Первое очевидно, второе мы установим, показав, что при всех t > 0

∫ ϕ( x, t )dx = 1 .
−∞
Действительно,
∞ ∞
1  x2  1  x2  x
∫ 2a πt exp  − 4a 2t  dx = π ∫ exp  − 4a 2t  d 2a t =
−∞ −∞

1

π −∞
exp ( −ξ2 )dξ = 1 .
= (29.8)

Полученный несобственный определенный интеграл хорошо известен и ра-


вен π . Убедиться в этом можно следующим образом. Обозначим этот интеграл
через I. Тогда
∞ ∞ ∞ ∞
I2 = ∫ exp ( −ξ ) dξ ∫ exp ( −η ) d η = ∫ ∫ exp ( −ξ
2 2 2
− η2 ) dξdη,
−∞ −∞ −∞ −∞
переходя к полярным координатам r и ϕ, получим
∞ π ∞
I 2 = ∫ dr ∫ exp ( − r 2 ) rdϕ = π ∫ exp ( − r 2 )dr 2 = π .
0 −π 0
То, что функция ϕ(x, t) удовлетворяет уравнению теплопроводности (29.1)
при всех t > 0, можно убедиться непосредственно подстановкой. Итак, функция
ϕ(x, t) − та, которую мы искали. Напомним еще раз, что ϕ(x, t), определяемая фор-
мулой (29.7), соответствует тому, что в начальный момент t = 0 в точке x = 0 по-
мещено c единиц тепла. В случае если речь идет о диффузии, то в начальный мо-
мент t = 0 в точке x = 0 помещена единичная масса диффундирующего вещества.
Наконец, при случайном блуждании в момент t = 0 блуждающая частица находит-
ся в точке x = 0. При t ≈ 0 функция ϕ(x, t) имеет вид высокого (высоты 1/2a πt )
и тонкого пика. С ростом времени t этот пик расплывается, как показано на
рис. 29.1. Площадь, ограниченная этой расплывающейся колоколообразной кри-
вой, все время при всех t, согласно (29.8), равна единице, что отвечает сохране-
нию тепла, вещества или, соответственно, нормировке плотности вероятности.
ϕ(x ,t)
1
2a πt

Рис. 29.1. Изменение со временем


функции отклика ϕ(x, t)

x
240 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Зная функцию ϕ(x, t), описывающую расплывание тепла, сосредоточенного в


одной точке, можно найти по ней аналогичные функции в двумерном и трехмер-
ном случае. В трехмерном случае такой функцией будет
 x2 + y2 + z2  1
−
ϕ( x , y , z , t ) = ϕ( x , t , ) ϕ( y , t ) ϕ( z , t ) =
exp . (29.9)
8a 3 ( πt ) 3  4a 2 t 
 
Проверить это очень просто. Непосредственно находим, что
∞ при x = y = z = 0,
lim ϕ( x, y , z, t ) =  (29.10)
t →0
0 при x 2 + y 2 + z 2 ≠ 0.
Запишем
∞ ∞ ∞ ∞

∫ ϕ( x, y, z, t )dxdydz = ∫ ϕ( x, t ) dx ∫ ϕ( y, t ) dx ∫ ϕ( z, t ) dx = 1 .
−∞ −∞ −∞ −∞

Далее уравнение
∂ϕ( x, y , z, t ) ∂ 2 ϕ( x, y , z, t ) ∂ 2 ϕ( x, y , z, t ) ∂ 2ϕ( x, y , z, t )
= + +
∂t ∂x 2 ∂y 2 ∂ z2
записывается в виде:
∂ϕ( x, t ) ∂ϕ( y , t ) ∂ϕ( z, t )
ϕ( y , t ) ϕ( z , t ) + ϕ( x , t ) ϕ( z , t ) + ϕ( x , t ) ϕ( y , t ) =
∂t ∂t ∂t
∂ 2 ϕ( x , t ) ∂ 2 ϕ( y , t ) ∂ 2 ϕ( z , t )
= ϕ( y , t ) ϕ( z , t ) + ϕ ( x , t ) ϕ ( z , t ) + ϕ ( x , t ) ϕ ( y , t ) ,
∂x 2 ∂y 2 ∂z 2
из которого следует его выполнимость.
Функция ϕ(x, t) описывает температурное поле, которое возникает растекани-
ем c единиц тепла, помещенных в точке x = 0 в момент времени t = 0. Если то же
количество тепла помещается в точку x0 в момент времени τ, то последующее те-
пловое поле будет описываться функцией ϕ(x, t) с заменой x на x – x0 и t на t – τ,
т.е. функцией ϕ(x – x0 , t – τ).
Оказывается, что с помощью функции ϕ(x, t) можно найти тепловое поле
T(x, t) для любого начального распределения температуры T0(x). В силу этого ча-
стное решение ϕ(x, t) названо фундаментальным. Для того чтобы это установить,
прибегнем к принципу суперпозиции. Однако прежде рассмотрим описываемое
этой функцией случайное блуждание.
Плотность вероятности случайно блуждающей частицы – абсолютно пьяного
– со временем меняется, как показано на рис. 29.1. Спрашивается, как далеко уй-
дет абсолютно пьяный от начальной точки x = 0 за время t?
Средняя удаленность (математическое ожидание x) равна нулю, потому что
возможные уходы влево и вправо уравновешивают друг друга, поэтому следует
прибегнуть к математическому ожиданию | x | или Mx 2 . Та и другая величины
легко вычисляются и равны
29. Фундаментальное решение уравнения теплопроводности 241

t
M| x | = a, Mx 2 = a 2t , (29.11)
π
т.е. в обоих случаях «удаление» пропорционально t , в то время как при равно-
мерном движении удаление пропорционально t. Поэтому даже очень медленно
движущаяся частица уходит дальше, чем блуждающая бесконечно быстро слу-
чайная. Вместе с тем, с очень маленькой вероятностью спустя любое время, в том
числе и очень малое, она может оказаться сколь угодно далеко от начального по-
ложения.
Растекание тепла и диффузия вещества происходят так же, как и растекание
плотности вероятностей случайно блуждающей частицы. Интересно отметить,
что это растекание несколько необычно. За конечное и даже малое время темпе-
ратура повышается сколь угодно далеко. Это повышение ничтожно, но оно есть,
т.е. тепло распространяется бесконечно быстро. То же самое относится и к диф-
фузии. Эта несуразица, несущественная ввиду ничтожной малости удаленных
значений фундаментального решения ϕ(x, t), является все же некоторым принци-
пиальным дефектом наших моделей. Сущность дефекта понятна из соотношения
(28.9), согласно которому τ и a стремятся к нулю, а величина a2/2τ = a/τ⋅a/2 − к
конечному числу D, и поэтому скорость перемещения случайной частицы a/τ не-
ограниченно растет.
Вернемся к роли фундаментального решения ϕ(x, t) и принципа суперпозиции
в решении общей задачи о тепловом поле T(x, t) при начальном его значении T0(x).
Из принципа суперпозиции следует, что если раздельно для начальных полей
T01(x) и T02(x) температурные поля есть T1(x, t) и T2(x, t), то при начальном поле
температур c1T01(x) + c2T02(x) последующее температурное поле будет c1T1(x, t) +
+ c2T2(x, t).
Начальное поле температур T0(x) можно записать в виде:

T0 ( x ) = ∫ T0 (ξ)δ( x − ξ)dξ (29.12)
−∞
и воспринимать его как сумму полей δ(x – ξ)T0(ξ)dξ при всевозможных ξ, каждо-
му из слагаемых которой спустя время t отвечает температурное поле ϕ(x –
− ξ)T0(ξ) dξ.
В соответствии с этим, согласно принципу суперпозиции,

T ( x, t ) = ∫ T0 (ξ) ϕ(x − ξ, t ) dξ . (29.13)
−∞
Это и есть решение задачи (29.1), (29.2). При желании, с пользой для себя, вы мо-
жете проверить это путем подстановки (29.13) в (29.1) и (29.2).
Напишем еще раз полученное решение (29.13), выписав конкретный вид фун-
даментального решения
1  ( x − ξ)2 

2a πt −∫∞
T ( x, t ) = T ( ξ) exp − dξ . (29.14)
0  4a 2 t 

В двумерном и трехмерном случае искомые решения запишутся аналогично. Так,
в трехмерном случае
242 Ю.И. Неймарк. Математическое моделирование как наука и искусство


T ( x, y, z, t ) = ∫ T0 ( ξ, η, ζ ) ϕ ( x − ξ, t ) ϕ ( y − η, t ) ϕ ( z − ζ , t ) d ξd η d ζ =
−∞

1  ( x − ξ ) 2 + ( y − η) 2 + ( z − ζ ) 2 
=
8a 3
( πt) 3 ∫ 0
T ( ξ , η, ζ ) exp −

 4a 2t
 d ξd η d ζ ,


−∞

где, как и ранее, T0(x, y, z) – трехмерное начальное при t = 0 поле температур.


Этим возможности фундаментального решения не ограничиваются. С его по-
мощью можно решить и более общую задачу, когда наряду с начальным полем
температур имеется распределенное тепловыделение или поглощение тепла. Пер-
вое можно представить как горение или экзотермическую химическую реакцию в
теплопроводящей среде, а второе – как таяние мелких льдинок или эндотермиче-
скую химическую реакцию в ней. Мы получим решение этой новой задачи, даже
не выписывая уравнения в частных производных, которое ей соответствует.
Пусть выделяющееся тепло за время dτ в каждый момент времени τ создает
некоторое дополнительное распределение тепла c f (x, τ)dτ. Ему, как нам уже из-
вестно, отвечает решение (29.13) или (29.14), в котором T0(ξ) следует заменить на
cf (ξ, τ)dτ, а t на t – τ, т.е.

∫ f (ξ, τ)dτ ϕ( x − ξ, t − τ)dξ .


−∞
Ко времени t все эти тепловые поля просуммируются, т.е.
t ∞
T ( x, t ) = ∫ ∫ f (ξ, τ)ϕ( x − ξ, t − τ)dξdτ . (29.15)
0 −∞
Это, конечно, при начальном поле температур T0(x) = 0. Если T0(x) ≠ 0, то следует
к решению (29.15) добавить еще (29.13), так что в итоге
∞ t ∞
T ( x, t ) = ∫ T0 (ξ)ϕ( x − ξ, t )dξ + ∫ ∫ f (ξ, τ)ϕ( x − ξ, t − τ)dξdτ . (29.16)
−∞ 0 −∞

Это есть решение уравнения (29.1), правая часть которого дополнена слагае-
мым f(x, t), соответствующим непрерывному тепловыделению, при условии (29.2).
Вот так изящно с помощью фундаментального решения находятся решения задач
о теплопроводности в неограниченной теплопроводящей среде. Изящество преж-
де всего в том, что решения сложные, а находятся легко, без выкладок, только на
основе принципа суперпозиции. Но надо было догадаться, что нужно найти реше-
ние ϕ(x, t), отвечающее точечному распределению тепла.
Теперь рассмотрим задачу о прогреве полупространства, в решении которой
нам опять поможет фундаментальное решение ϕ(x, t). Эта задача формулируется
так. С одной стороны пространства температура все время равна T1, а с другой –
находится теплопроводящая среда, имеющая в начальный момент температуру T0.
Спрашивается, как будет меняться температура этого последнего полупростран-
ства?
Выберем начало координат O на границе сред и направим ось Ox вглубь теп-
лопроводящей среды (рис. 29.2). Тогда ее температурное поле будет зависеть
29. Фундаментальное решение уравнения теплопроводности 243

только от x и, следовательно, описывается функцией T(x, t). Эта функция T(x, t)


удовлетворяет уравнению теплопроводности
∂T ∂ 2T
= a2 2 , (29.17)
∂t ∂x
начальным условиям
T ( x, t ) t = 0 = T0 (29.18)
и, кроме того, граничному условию
T ( x, t ) x = 0 = T1 , (29.19)
так как по условиям задачи в полупространстве x ≤ 0 поддерживается температура
T1. Новым по сравнению с предыдущим является наличие границы области, в ко-
торой рассматривается тепловое поле, и в связи с этим появление нового допол-
нительного условия – граничного условия (29.19).
T1
0

Рис. 29.2. Иллюстрация к задаче T(x,t)


о прогреве бесконечно толстой стенки
x
Заметим, что температуру T0 можно считать равной нулю. При этом T1 заме-
нится на T1 – T0 . А можно этого и не делать, а просто искать тепловое поле в виде
T(x, t) = T0 + T (x, t),
где T (x, t) удовлетворяет условиям (29.17), (29.18) и (29.19), в которых T0 и T1 за-
меняются соответственно нулем и T1 – T0 .
Решая эту задачу, можно, наверное, исходить только из чисто математиче-
ских соображений. Но мне хочется показать вам на этом примере, как могут по-
мочь и подсказать решение физические соображения.
Пусть ради определенности T1 > T0 и, следовательно, происходит прогрев по-
лупространства x > 0. Этот прогрев происходит за счет того, что через граничную
точку x = 0 (через единицу площади границы раздела x = 0) перетекает тепло с ин-
тенсивностью q(t). Эта функция q(t) нам неизвестна, но через нее с помощью фун-
даментального решения можно записать T(x, t) в виде
t
T ( x, t ) = T0 + ∫ q( τ)ϕ( x, t − τ)dτ . (29.20)
0
Функция T(x, t), определяемая формулой (29.20), удовлетворяет (29.17) и
(29.18) при любой функции q(τ). Остается удовлетворить еще только требованию
(29.19), т.е.
t
T1 = T0 + ∫ q( τ)ϕ(0, t − τ)dτ
0
или
244 Ю.И. Неймарк. Математическое моделирование как наука и искусство

t
q( τ)
T1 = T0 + ∫ dτ . (29.21)
0 2 a π( t − τ )

Вводя новую переменную u = τ/t, запишем (29.21) в виде


t
1 q(tu ) t
T1 − T0 = ∫
2a π 0 1 − u
du . (29.22)

Для выполнения этого последнего условия, во всяком случае, следует изба-


виться от зависимости подынтегральной функции от t. Для этого следует выбрать
c
q(tu ) = , (29.23)
tu
после чего (29.22) принимает вид:
t
1 du π
T1 − T0 =
2a π ∫ =
u(1 − u ) 2a
c.
0

Отсюда находим, что


2a (T1 − T0 )
c= , (29.24)
π
и искомое решение, согласно (29.22), (29.23) и (29.24), принимает вид:
t
T1 − T0 dτ  x2 
T ( x, t ) = T0 +
π ∫ τ(1 − τ)
exp − 2 .

 4a ( t − τ) 
(29.25)
0

Исследование этого решения обнаруживает, что оно является функцией t/x2.


Это означает, в частности, что для того чтобы на глубине 2x установилась та же
температура, какая уже есть на глубине x, необходимо не в два, а в четыре раза
больше времени.
Устанавливается сделанное выше общее утверждение преобразованием после
замены переменной τ на η = τ/x2 выражения (29.25) к виду:
t x2
T −T dη  1 
T ( x, t ) = T0 + 1 0
π ∫ 2
η(t x − η)
exp  2 2
 = T0 + F (t x 2 ) .
 4a (t x − η) 
(29.26)
0

Вид графика этого решения показан на рис. 29.3.


F
T1 − T0

Рис. 29.3. График изменения температуры


в прогреваемой толстой стене
в идеализации полупространством
0 t/x2

Такой его вид следует из монотонности возрастания F как функции аргумен-


та t/x2 и из того, что при t/x2 = 0 T(x, t ) = T0 , а при t/x2 = ∞ T(x, t) = T1.
30. Бегущие волны и дисперсионное уравнение 245

30. БЕГУЩИЕ ВОЛНЫ И ДИСПЕРСИОННОЕ УРАВНЕНИЕ


Уравнение линейного осциллятора
&x& + 2δx& + ω2 x = 0
имеет частные решения вида eλτ, где значения λ находятся из характеристическо-
го уравнения
χ(λ) = λ2 + 2δλ + ω2 = 0.
Аналогично для уравнения теплопроводности [19]
∂u ∂ 2u
= a2 2 (30.1)
∂t ∂x
и волнового уравнения
∂ 2u 2
2 ∂ u
= a (30.2)
∂t 2 ∂x 2
имеются решения вида ei(ωt − kx), где возможные значения ω и k находятся из дис-
персионного уравнения
χ(ω, k) = 0. (30.3)
Подставляя в (30.1) предполагаемое решение
u(x, t) = ei(ωt − kx), (30.4)
приходим к дисперсионному уравнению
iω + a2k2 = 0. (30.5)
Для уравнения (30.2) аналогичная подстановка дает
iω – a2k2 = 0. (30.6)
Выражая k через ω, согласно (30.5) и соответственно (30.6), находим, что
уравнение (30.1) имеет всевозможные решения вида
 ω 1− i 
u ( x, t ) = exp i  ωt ± x  , (30.7)
 a 2 
а уравнение (30.2) − решения вида
 ω 
u ( x, t ) = exp i  ωt ± x  . (30.8)
 a 
Выясним, что представляют собою решения (30.7) и (30.8), т.е. решения вида
u(x, t) = exp i(ωt + kx), (30.9)
где ω действительно, а k может быть комплексным.
Пусть поначалу ω и k – действительные. Тогда
exp i(ωt + kx) = cos (ωt + kx) + isin (ωt + kx)
и, следовательно, действительными решениями являются функции
cos (ωt + kx), sin (ωt + kx). (30.10)
246 Ю.И. Неймарк. Математическое моделирование как наука и искусство

При t = 0 этим решениям отвечают переменные, гармонически меняющиеся


поля с длиной волны λ = 2π/|k| (рис. 30.1). С ростом времени t это поле как целое
перемещается вдоль оси x со скоростью v = –ω/k. Так что (30.10) является, а (30.9)
можно трактовать как бегущую со скоростью v = –ω/k гармоническую волну дли-
ны λ = 2π/|k|. При этом в каждой точке x, как это видно из (30.10), поле при изме-
нении времени t меняется тоже по гармоническому закону с частотой ω и единич-
ной амплитудой. В силу этого величины ω и k названы частотой и волновым чис-
лом бегущей гармонической волны (30.10) ((30.9)).

x Рис. 30.1. Гармонически меняющееся


одномерное скалярное поле

λ=
|k |
Пусть теперь волновое число k − комплексное, т.е. k = k1 + ik2. Тогда
expi(ωt + kx) = exp i ( ωt + kx ) = e − k2 x cos(ωt + k1 x ) + ie − k2 x cos(ωt + k1 x ) ,
и, следовательно, действительными решениями являются
e − k2 x cos(ωt + k1 x ), e − k2 x sin(ωt + k1 x ).
Если бы k2 = 0, то это была бы гармоническая бегущая волна. Наличие мно-
жителя e − k2 x при k2 > 0 приводит к ее экспоненциальному убыванию в направле-
нии положительных x или, напротив, экспоненциальному возрастанию при k2 < 0.
Сама волна перемещается направо, если k1 < 0, и налево, если k1 > 0. Скорость
этого перемещения υ, как и в предыдущем случае, равна –ω/k1, так что при k1 < 0
и k2 > 0 – это убывающая бегущая направо волна (рис. 30.2); при k1 < 0 и k2 < 0 –
это возрастающая бегущая направо волна (рис. 30.3). Аналогично при k1 > 0 меем
бегущую налево волну, убывающую при k2 < 0 и возрастающую при k2 > 0. Во
всех случаях в каждой точке x поле меняется по гармоническому закону с часто-
той ω и амплитудой e − k2 x .

υ = –ω/k1, k2 > 0 υ = –ω/k1, k2 < 0

x x

Рис. 30.2. Бегущая затухающая Рис. 30.3. Бегущая нарастающая


гармоническая волна гармоническая волна
30. Бегущие волны и дисперсионное уравнение 247

Волновое уравнение (30.2), согласно (30.8), допускает всевозможные бегущие


гармонические волны с всевозможными частотами и волновыми числами ω и
±ω/a соответственно. Скорость распространения у всех этих волн одна и та же: –a
и, соответственно, +a. Длины волн 2πa/ω разные, как и разные соответствующие
им частоты.
В силу принципа суперпозиции, наряду с всевозможными бегущими гармо-
ническими волнами (30.8), имеют место и всевозможные бегущие волны вида
  x 
∑ cs cos ωs  t ± a  + ϕ s 
s  
и вида

  x 
∫ c (ω) cos ω  t ± a  + ϕ(ω) dω.
0
Это наталкивает на мысль, что волновое уравнение допускает произвольные бе-
гущие со скоростью ±a волны
 1 
u ( x, t ) = f  t ± x  (30.11)
 a 
любой формы. Так это на самом деле и есть. Это легко проверить, непосредствен-
но убеждаясь, что при любой функции f уравнение (30.11) удовлетворяет волно-
вому уравнению (30.2).
Если все бегущие волны волнового уравнения распространяются в обе сторо-
ны с одной и той же скоростью a, не затухают и не возрастают, то волновые ре-
шения (30.7) уравнения теплопроводности имеют разные скорости распростране-
ния и экспоненциально уменьшаются. Согласно (30.7), действительными волно-
выми решениями являются переменные поля вида
ω  ω 
u( x, t ) = exp x cos  ωt + x ( 30.12)
a 2  a 2 
и вида
 ω   ω 
u( x, t ) = exp  − x  cos  ωt − x  (30.13)
 a 2   a 2 
при разных неотрицательных ω.
Поле, описываемое формулой (30.12), – затухающая волна, бегущая налево, а
поле (30.13) – бегущая направо затухающая волна. При этом как быстрота затуха-
ния, так и скорость движения волны зависят от ее частоты ω. Скорость ее пере-
мещения равна a 2ω и тем больше, чем больше ее частота ω или меньше длина
волны λ = 2 2 π a / ω . Вид этих бегущих волн показан на рис. 30.4. На этом же
рисунке указаны скорость распространения, длина волны и быстрота ее затуха-
ния.
248 Ю.И. Неймарк. Математическое моделирование как наука и искусство

2 2 2 2
λ= πa λ= πa
ω ω

x x

υ = a 2ω υ = a 2ω

Рис. 30.4. Бегущие гармонические тепловые волны; ω – временная частота волны,


λ – ее пространственная длина, υ – скорость распространения
Применим теперь полученные нами сведения к следующим двум похожим
задачам для волнового уравнения и уравнения теплопроводности. В качестве фи-
зической модели первой задачи возьмем полубесконечную веревку, конец кото-
рой двигают вверх и вниз по закону Acos Ωt. В качестве физической модели вто-
рой задачи – полупространство, на границе которого температура меняется по то-
му же закону.
Я думаю, вы, наверное, не раз в детстве забавлялись пусканием волн по ве-
ревке, быстро колебля ее конец в руке. Так же природа со сменой дня и ночи или
зимы и лета меняет температуру над земной поверхностью. Мы придем к сфор-
мулированным выше задачам, если примем, что движение руки и температура
меняются по гармоническому закону. Конечно, это грубое приближение. Но оно
достаточно для понимания происходящих при этом явлений.
Построим математические модели в первом и втором случаях. Примем, что
веревку начали колебать уже очень давно, как и очень давно меняют температуру
над земной поверхностью.
В первом случае движение натянутой полубесконечной веревки описывается
волновым уравнением
∂ 2u 2
2 ∂ u
=a (30.14)
∂t 2 ∂x 2
при –∞ < t < +∞ и x ≥ 0. При x = 0 и всех t имеет место
u(x, t)x = 0 = A cos Ωt. (30.15)
Во втором примере тепловое поле подчиняется уравнению теплопроводности
∂T ∂ 2T
= a2 2 (30.16)
∂t ∂x
тоже при –∞ < t < +∞ и x ≥ 0, а при x = 0 и всех t
T(x, t)x = 0 = A cos Ωt . (30.17)
Как видите, постановки обеих задач очень похожи. В первом случае вы хо-
рошо знаете и много раз видели, что будет. Это позволяет нам, сочетая виденное
с тем, что мы узнали о гармонических волнах, сразу сообразить, какое будет ре-
шение. Это будет гармоническая волна частоты ω, бегущая от руки вдоль веревки,
то есть
30. Бегущие волны и дисперсионное уравнение 249

 x
u( x, t ) = A cos Ω  t −  . (30.18)
 a
Она удовлетворяет уравнению (30.14) и краевому условию (30.15).
По аналогии решение второй задачи запишем в виде тепловой волны, бегу-
щей от поверхности Земли вглубь и имеющей частоту Ω, т.е. согласно (30.13),
 Ω   Ω 
T ( x, t ) = A exp − x  cos  Ωt − x  . (30.19)
 a 2   a 2 
Ясно, что функция T(x, t), определяемая (30.19), удовлетворяет уравнению тепло-
проводности (30.16) и краевому условию (30.17).
Решение (30.18), я думаю, вам хорошо известно из наблюдения. Хотя, если
бы веревка была достаточно длинная, то вы бы заметили, что бегущая волна зату-
хает. Это уже дефект нашей идеализации: наличие трения в веревке при ее де-
формациях и трение ее о воздух мы не учли. При желании это можно сделать,
считая, например, что сила трения пропорциональна скорости движения веревки
и противоположно направлена. Это привело бы к уравнению вида
∂ 2u 2
2 ∂ u ∂u
= a −h . (30.20)
∂t 2
∂x 2
∂t
Далее можно найти волновое решение вида (30.4) и, используя его, уточнить
полученное нами решение (30.18). Действительно, подставляя (30.4) в (30.20),
найдем, что
ω2 – a2k2 – ih ω = 0
или
ω h
k= 1− i .
a ω
При h/ω << 1 приближенно
ω h 
k=± 1 − i .
a 2ω 
Нас интересует волна, бегущая от руки, поэтому в полученном значении вол-
нового числа k берем знак минус. Соответствующее уточненное решение будет
 hx   Ω 
u( x, t ) = A exp −  cos  Ωt − x  . (30.21)
 2a   a 
Оно действительно затухает с ростом x и при h = 0 переходит, как и положено, в
(30.18).
Бегущая вдоль веревки волна может привести к неожиданному эффекту, если
веревка утончается. Это утончение вызывает рост скорости распространения вол-
ны a, так как a2 = T/ρ, где T – натяжение веревки, а ρ – ее линейная плотность.
При этом растет не только скорость, но и амплитуда колебаний, волна нарастает.
В результате может возникнуть сильный хлопок, вызванный тем, что скорость
движения к концу веревки превзойдет звуковую. Чтобы осмыслить это явление,
учтем, что волна сохраняет энергию, а колеблющаяся масса уменьшается. Наблю-
250 Ю.И. Неймарк. Математическое моделирование как наука и искусство

дать это явление можно на пастбище, когда пастухи хлопают утончающимися к


концу длинными кнутами.
Полученное нами решение (30.19) качественно описывает прогрев земной
поверхности при суточных и годовых колебаниях температуры. При этом предпо-
лагалось, что наружная температура меняется согласно (30.17), колеблясь возле
среднего значения, равного нулю. Если считать среднее значение температуры
отличным от нуля и равным T0, то и к решению (30.19) добавится T0 и оно примет
вид:
 Ω   Ω 
T ( x, t ) = T0 + A exp  − x  cos  Ωt − x . (30.22)
 a 2   a 2 
Проанализируем это решение. Оно состоит из постоянной составляющей T0 и
экспоненциально убывающей бегущей волны. Экспоненциальное убывание для
суточных колебаний много больше, чем для годовых. Амплитуда колебаний тем-
пературы убывает в e раз на глубине a 2 / Ω и поэтому, если для годовых коле-
баний она порядка метра, для суточных она в Ω год / Ω сут ≈ 20 раз меньше, т.е.
порядка сантиметров. Отсюда следует, что на глубине нескольких метров темпе-
ратура практически постоянна и равна средней температуре. Это объясняет нали-
чие вечной мерзлоты на глубине, если наружная средняя температура ниже нуле-
вой.
Длина тепловой волны λ равна aπ 2 / Ω и значительно больше для годовых
колебаний, чем для суточных, примерно в двадцать раз. Минимальное и макси-
мальное значения температуры на поверхности смещаются вглубь одно за другим
со скоростью распространения волны υ, равной a 2Ω . Поэтому на глубине x
максимум и минимум температур наступают позднее на время x /a 2Ω , чем на
поверхности. Это объясняет тот факт, что если в холодную зиму глубоко зарытые
в землю водопроводные трубы замерзают, то происходит это не в самые сильные
морозы, а значительно позднее, возможно, весной при значительном потеплении.
Суточные волны температуры распространяются вглубь быстрее, чем годовые
(примерно в 20 раз), а затухают они значительно быстрее, по экспоненте с показа-
телем тоже примерно в 20 раз большим и, конечно, отрицательным.
Мы рассмотрели задачи о теплопроводности, которые можно трактовать, как
прогрев земной поверхности или толстой стенки здания, а также как изменение
температуры в глубине земной поверхности при суточных и годовых изменениях
ее на поверхности.
Рассмотрим еще, как происходит намерзание льда над водой в озере или реке.
Вода начинает замерзать, когда она охлаждается до нуля и продолжает охлаж-
даться со своей поверхности. На рис. 30.5 схематически представлена толща льда
и под ним еще не замерзшая вода при нулевой температуре. На поверхности льда
температура отрицательная T1, толщина льда ξ. Нас интересует, как растет со
временем ξ. Пусть температура льда T(x, t). Для нее имеет место уравнение теп-
лопроводности
30. Бегущие волны и дисперсионное уравнение 251
2
∂T 2 ∂ T
=a (30.23)
∂t ∂x 2
и краевые условия
T(x, t)x = 0 = T1, T(x, t)x = ξ = 0, (30.24)
означающие, что на верхней и нижней поверхностях льда его температура соот-
ветственно T1 и 0.
T1 < 0
0

Лед
Рис. 30.5. Иллюстрация к намерзанию льда
на поверхности воды
ξ Вода
x
Поток тепла через нижнюю поверхность льда от более нагретой воды к более
холодному льду равен
∂T
Q=k . (30.25)
∂x x = ξ
В соответствии с этим оттоком тепла происходит образование нового льда,
причем
∂T ( x, t ) dξ
k =ρc , (30.26)
∂x x = ξ dt
где c – тепло, выделяющееся при замерзании единицы массы льда, а ρ – его плот-
ность. Такова наша исходная математическая модель. Она достаточно сложна.
Сложность эта обусловлена тем, что в краевое условие (30.25) входит неизвестная
переменная ξ, меняющаяся в соответствии с уравнением (30.26), которое само за-
висит от неизвестного ξ.
Учтем особенности задачи и упростим ее математическую модель. Образова-
ние льда происходит очень медленно, так что можно считать, что в толще льда
температура квазистационарна, т.е. такая, которая устанавливается при постоян-
ном ξ.
При постоянном ξ установившееся, не зависяшее от времени температурное
поле T(x, t) = u*(x) удовлетворяет уравнению
d 2u∗
= 0, (30.27)
dx 2
следующему из (30.23), и краевым условиям
u*x = 0 = T1, u*x = ξ = 0, (30.28)
следующим из (30.24). Из (30.27), (30.28) непосредственно находим, что
T
u ∗ = − 1 x + T1 ,
ξ
252 Ю.И. Неймарк. Математическое моделирование как наука и искусство

и поэтому уравнение (30.25) принимает вид


dξ T
ρc = − k 1 . (30.29)
dt ξ
Откуда, зная, что при t = 0 ξ = 0, получим
2kT1
ξ= − t, (30.30)
ρc
что означает увеличение толщи льда по закону t , т.е. замедляясь со временем.
Так, если один сантиметр льда возникает за сутки, то 6 сантиметров, когда по
льду можно ходить, не за шесть, а за 36 суток. Зависимость от наружной темпера-
туры тоже замедленная, пропорциональная − T1 . Поэтому при температуре в два
раза более низкой скорость образования льда увеличивается только в 2 раз.
Конечно, реально все немного не так, поскольку температура T1 не постоян-
на, а меняется со временем. Если эти изменения температуры не очень быстрые и
в толще льда успевает все время устанавливаться тепловое поле, отвечающее
температуре T1(t), то можно по-прежнему воспользоваться уравнением (30.29), но
считая в нем T1 функцией времени. Из этого уравнения (30.29) находим, что
ρcξ dξ = –kT1(t) dt
или
t
ρc 2
ξ = −k ∫ T1 ( τ) dτ ,
2 0

откуда
12
2k  
t
ξ= − ∫ T1 ( τ) dτ  . (30.31)
pc  0 

Из приближенной формулы (30.31) следует, что в пределах ее погрешностей
толщина намерзшего льда за некоторое время t определяется той же формулой
(30.30), где уже T1 − средняя температура над поверхностью льда за время t. Так
что толщина льда, намерзшего за зиму, пропорциональна корню квадратному от
средней зимней температуры и коpню квадратному из ее длительности.
31. Теория электромагнетизма Фарадея − Максвелла и электромагнитные волны 253

31. ТЕОРИЯ ЭЛЕКТРОМАГНЕТИЗМА


ФАРАДЕЯ – МАКСВЕЛЛА И ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ
МАКСВЕЛЛА – ГЕРЦА
Ранее вы познакомились с великими уравнениями Максвелла. Они достаточ-
но сложны и в них не просто разобраться. Современникам они были непонятны и
лишь немногие их приняли всерьез. Их освоение, даже в современной более ясной
и простой векторной форме написания и продвинутом общем уровне мышления,
требует больших усилий мысли, освоения новых понятий и представлений. В
первоначальном же виде у Максвелла они были записаны в кватернионной форме
и содержали затемняющие суть дела лишние уравнения. Электрические и магнит-
ные поля существовали до Максвелла раздельно. Они мгновенно порождались
соответственно зарядами и токами, которые считались первопричинами электро-
магнитных явлений. Уравнения Максвелла описывали нечто совершенно другое и
новое. Они описывали электромагнитные поля, которые, меняясь и взаимодейст-
вуя друг с другом, могут существовать и распространяются сами по себе в про-
странстве с конечной скоростью. Из уравнений Максвелла можно было извлечь
волновое уравнение, говорящее о существовании гармонической бегущей элек-
тромагнитной волны. Ее скорость оказалась близкой к скорости света, что позво-
ляло Максвеллу высказать гипотезу об электромагнитной природе световых волн.
Теория Максвелла, английского физика, противоречила существующей евро-
пейской, с нашей точки зрения, квазистационарной электродинамике, хорошо ма-
тематически разработанной и, казалось, полностью согласующейся с эксперимен-
том. Приверженец европейской теории Герц решил опровергнуть заумную тео-
рию Максвелла, поставив основательные и хорошо продуманные эксперименты.
По существу, речь шла об отстаивании европейской теории электромагнетизма,
успешно развиваемой такими гигантами науки, как Ампер, Лаплас, Гаусс, Ней-
ман, Вебер, Гельмгольц, против «вздорной» теории Фарадея – Максвелла. Первые
шли от зарядов и токов, от описания электромагнитных явлений на их основе. И,
как мы сейчас знаем, их ждал тупик. Заряды и токи не позволяют во всех случаях
построить состояние электродинамической системы и поэтому понять, изучить и
предсказать ее поведение. Для конструирования состояния нужны принципиально
новые полевые представления, нужно электромагнитное поле, для которого заря-
ды и токи − лишь его особенности. В теории Фарадея – Максвелла электромагнит-
ные явления могут протекать без зарядов и токов. Состоянием динамической сис-
темы электродинамики Фарадея – Максвелла являются электромагнитные поля. И
если в механике сплошных сред поля смещений и скоростей возникали естест-
венно и не были сопряжены с новым взлетом мысли, то в электродинамике это не
так. В ней конструируются поля совершенно непонятной природы, чуждой чело-
веческому восприятию.
Этот скачок человеческой мысли осуществил М. Фарадей. Именно он приду-
мал электрические и магнитные поля и с их помощью описывал непонятные элек-
тромагнитные явления. Максвелл уверовал в гений самоучки Фарадея и, как он
254 Ю.И. Неймарк. Математическое моделирование как наука и искусство

сам пишет, лишь придал его представлениям математическое описание. И именно


этот безумный скачок мысли был необходим для создания адекватной математи-
ческой модели.
Результат экспериментов Герца был неожиданным, он противоречил теории,
разделяемой Герцем и любезной ему, и полностью соответствовал теории Мак-
свелла. Несмотря на это, Герц опубликовал результаты своих экспериментов и в
связи с ними развил теорию Максвелла, открыв излучатель электромагнитных
волн, получивший название вибратора Герца. Тем самым вместе с Максвеллом он
стал у истоков возникновения радио, величайшего технического достижения на-
чала ХХ века. Эксперимент Герца подтвердил теоретические открытия Максвел-
ла, и уже ничто не препятствовало триумфальному шествию уравнений Максвел-
ла.
Сейчас очень непросто воспроизвести поиски Максвелла. Даже если это сде-
лать, они будут едва ли понятны. Поэтому в плане общего рассказа о распреде-
ленных динамических системах и бегущих гармонических волнах покажем, как из
уравнений Максвелла следует их наличие, следует возможность электромагнит-
ных волн. Итак, наша задача выяснить, допускают ли уравнения Максвелла реше-
ние в виде бегущих волн, когда вектора E и H являются только функциями двух
переменных, времени t и, допустим, переменной x, электромагнитной волны, су-
ществующей самостоятельно, при отсутствии зарядов и токов, в пустом простран-
стве, т.е. при ε = µ = 1 и σ = 0. В этих условиях уравнения Максвелла (28.19),
(28.20) и (28.21) упрощаются и принимают вид:
∂E ∂H
= c rot H , = − c rot E , (31.1)
∂t ∂t
div E = 0, div H = 0,
где E = E(x, t) и H = H(x, t). Заметим, что, не упрощая задачу поиском сразу пло-
ской волны, можно обнаружить, что из уравнений (31.1) следуют волновые урав-
нения для полей E и H. Действительно, продифференцируем первое уравнение
(31.1) по t, а к второму применим операцию rot:
∂2E ∂H ∂H
= c rot , rot = − c rot rot E ,
∂t 2
∂t ∂t
откуда, пользуясь известной формулой векторного анализа rot rot = ∇ div – ∆ , за-
пишем
∂2E
2
= − c rot rot E = − c 2 (∇divE − ∆ E ) ,
∂t
и в силу третьего уравнения (31.1) придем к волновому уравнению для векторного
поля
∂2E
= c 2 ∆ E.
∂t 2
Аналогично находится волновое уравнение для вектора магнитного поля. Да-
лее уже можно находить согласованные уравнениями (31.1) решения этих волно-
вых уравнений. Не ставя себе такой общей задачи, забудем об этом эффектном
31. Теория электромагнетизма Фарадея − Максвелла и электромагнитные волны 255

использовании векторного анализа и скромно продолжим поиск решения уравне-


ний (31.1) в виде плоской волны, распространяющейся вдоль оси x.
Итак, в уравнениях (31.1) векторы E и H – функции только x и t. Из послед-
них двух уравнений (31.1) непосредственно следует, что
∂E x ∂H x
= 0, =0
∂x ∂x
и, следовательно, компоненты Ex и Hx векторов E и H не зависят от x. Поэтому
они нас не интересуют, и мы примем Ex = Hx = 0. После этого распишем первые
два уравнения (31.1) в компонентах:
∂E y ∂H z ∂E z ∂H y
= −c , =c ,
∂t ∂x ∂t ∂x
∂H y ∂E ∂H z ∂E y
=c z, = −c .
∂t ∂x ∂t ∂x
Эти уравнения разделяются на две независимые пары. Выпишем отдельно
одну из них:
∂E y ∂H z ∂H z ∂E y
= −c , = −c . (31.2)
∂t ∂x ∂t ∂x
Дифференцируя первое уравнение по t, а второе по x и сравнивая их, приходим к
волновому уравнению
∂2E y 2 ∂2E y
=c , (31.3)
∂t ∂x 2
которое, как нам известно, имеет решение в виде бегущей гармонической волны
 ωx 
E y = A sin ω t − . (31.4)
 c 
Далее из любого из уравнений (31.2) находим, что
 ωx 
H z = A sin ω t − . (31.5)
 c 
Полученное частное решение (31.3), (31.4) удовлетворяет исходным уравне-
ниям (31.1) и представляет собою электромагнитную волну, состоящую из двух
перпендикулярных друг другу гармонических волн электрического и магнитного
полей, распространяющихся вдоль оси x со скоростью c (рис. 31.1).
z Hz

x
y
Ey

Рис. 31.1. Гармоническая электромагнитная волна


256 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Таким образом, уравнения Максвелла при ε = µ = 1 и σ = 0 имеют решение


(31.4), (31.5). Остальные компоненты Ex, Ez и Hx, Hz равны нулю. Это решение –
плоская электромагнитная гармоническая волна с произвольной частотой ω, вол-
новым числом 2πc/ω и скоростью распространения c. Так что таких разных волн
много. Среди них − световые волны, радиоволны, ультрафиолетовые и инфра-
красные волны, рентгеновские волны. Все эти разные волны имеют одну и ту же
электромагнитную природу и различаются только частотой и длиной волны при
одинаковой скорости распространения.
32. Отражение и преломление волн 257

32. ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ВОЛН


Мы познакомились с распределенными динамическими системами; с основ-
ными уравнениями классической математической физики; уравнением теплопро-
водности и одновременно диффузии, и случайных блужданий; волновым уравне-
нием, описывающим колебания натянутой струны или мембраны, продольные и
поперечные колебания упругой среды, изменения давления в газе, звуковые коле-
бания, электромагнитные волны.
Новым по сравнению с дискретными системами являются волны: тепловые
затухающие волны, скорость распространения которых зависит от частоты и дли-
ны волны; незатухающие волны упругой среды и электромагнитные волны, рас-
пространяющиеся с неизменной скоростью. С волнами связаны такие впечатляю-
щие явления, как интерференция, дифракция, причудливая эволюция волнового
пакета, с которой, в частности, связаны искажения речи и музыки при передаче их
на большие расстояния, отражение и преломление волн и другие. Эти явления вам
хорошо знакомы со школьной скамьи и курса общей физики. Но там их изложе-
ние носило описательный характер и не опиралось на математические модели.
Сейчас мы их можем не только описывать, но и изучать, извлекая новые неиз-
вестные нам количественные и качественные сведения.
В качестве еще одного простого примера рассмотрим явления отражения и
преломления волн от раздела упругих сред с разными характеристиками. Пусть
конкретно речь идет о бегущей вдоль натянутой струны волне вида
Aei ( ωt −kx ) , (32.1)
наталкивающейся на скачкообразное изменение плотности струны. Направим ось
Ox вдоль струны и пусть разные плотности струна имеет при x < 0 и x > 0, т.е.
точка x = 0 – точка раздела сред. Нам нужно найти переменное поле u(x, t) сме-
щений струны, вызываемое бегущей слева на границу раздела волной (32.1). Ма-
тематическая модель должна включать волновые уравнения для частей x < 0 и
x > 0 струны и условия согласования их решений при x = 0 и то, что слева напра-
во по части струны x < 0 бежит волна вида (32.1).
В соответствии с этим пусть u(x, t) = u1(x, t) при x < 0 и u(x, t) = u2(x, t) при
x > 0. Для u1(x, t) и u2(x, t) имеют место уравнения:
∂ 2 u1 ( x, t ) 2
2 ∂ u1
= a 1 ( x < 0) (32.2)
∂t 2 ∂x 2
и
∂ 2 u2 ( x, t ) 2 ∂ u2
2
= a 2 ( x > 0) , (32.3)
∂t 2 ∂x 2
где между u1(x, t) и u2(x, t) при x = 0 имеют место сопряжения
u1 ( x, t ) x =0
= u2 ( x , t ) x =0
,
∂u1 ( x, t ) ∂u2 ( x, t ) (32.4)
= .
∂x x =0 ∂x x =0
258 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Первое соотношение (32.4) очевидно, так как в точке x = 0 струна не разры-


вается. Второе условие не столь очевидно. Оно следует из одинаковости натяже-
ния N струны слева и справа от точки x = 0. Слева перпендикулярно оси Ox на
точку стыковки струн действует сила –N sinα1, где α1 – угол струны слева от точ-
ки x = 0 с осью Ox. Аналогично справа действует сила +N sinα2 (рис. 32.1). Точка
струны, отвечающая x = 0, имеет нулевую массу, поэтому силы –N sinα1 и
−N sinα2 уравновешивают друг друга, т.е. α1 = α2 и, следовательно, касательные к
струнам слева и справа в точке x = 0 совпадают. А это и означает выполнение
второго из соотношений (32.4).
N
α1
Рис. 32.1. Иллюстрация к преломлению
α2 и отражению бегущей гармонической
N
волны на границе раздела x = 0 разных
однородных сред
x=0 x
Еще нужно отразить тот факт, что слева на границу раздела приходит бегу-
щая волна вида (32.1), в которой волновое число k = ω /a1.
Несмотря на простоту задачи, без физической подсказки поиск ее решения не
представляется простым. Физическая подсказка состоит в том, что нам известно,
что при этом возникают отраженная и преломленная волны. Какие они – вопрос,
но естественно предположить, что такие же, как и падающая волна, бегущие гар-
монические волны. В соответствии с этим примем, что
u1 ( x, t ) = Aei ( ωt − ωx / a1 ) + A1ei ( ω1t + ω1 x / a1 ) ,
(32.5)
u2 ( x, t ) = A2 ei ( ω2 t − ω2 x / a 2 ) ,
где A, A1 и A2 – амплитуды падающей, отраженной и преломленной волн, a1 и a2 оп-
ределены уравнениями (32.2) и (32.3); A1, A2 и ω1, ω2 – неизвестные, подлежащие оп-
ределению. Из условий сопряжения имеем:
Aeiωt + A1eiω1t = A2 eiω2t ,
ω iωt ω ω
−i Ae + i 1 A1eiω1t = −i 2 A2 eiω2t ,
a1 a1 a2
где оба соотношения выполняются при любом t.
Из этих соотношений следует, что ω1 = ω2 = ω. Это можно было сообразить и
сразу, ведь условия (32.4) должны соблюдаться при всех t. Принимая ω1 = ω2 = ω,
приходим к условиям
A + A1 = A2 ,
ω ω ω
− A + A1 = − A2 ,
a1 a1 a2
откуда
1 − a1 / a 2 2
A1 = A, A2 = A. (32.6)
1 + a1 / a 2 1 + a1 / a 2
32. Отражение и преломление волн 259

Требуемые решения u1(x, t) и u2(x, t) найдены. Рассмотрим зависимости ам-


плитуд A1 и A2 отраженной и преломленной волн от a1 и a2. Для этого на рис. 32.2
представлен график зависимости A1/A и A2/A от a1/a2. Напомним, что a12 и a22 в
волновых уравнениях (32.2) и (32.3) – это отношения общей для них силы натя-
жения к плотностям струны при x < 0 и x > 0. Из графика рис. 32.2 следует, что
для однородной струны, когда a1/a2 = 1, как и должно быть, отраженной волны
нет, а преломленная – продолжение падающей. При исчезающе малой или очень
большой плотности струны в части x > 0 отношение a1/a2 равно 0 и, соответст-
венно, ∞. В первом случае имеет место отражение волны с той же амплитудой и
фазой, во втором – с той же амплитудой, но противоположной фазой. Амплитуда
преломленной волны, соответственно, удваивается, либо равна нулю. Эти крайние
случаи можно рассматривать как отражение от свободного и закрепленного конца
x = 0 струны с x < 0. В первом случае падающая волна отражается, изменив толь-
ко направление движения, а во втором еще и перевертывается (рис. 32.3).
A1, A2
(A = 1)
2
x=0
1
A2
1 a1/a2
A1
–1

Рис. 32.2. График амплитуд А1 и А2 Рис. 32.3. Явление перевертывания


соответственно отраженной при отражении бегущей гармонической волны
и преломленной гармонических волн от «закрепления». Преломленной волны нет
260 Ю.И. Неймарк. Математическое моделирование как наука и искусство

33. СТОЯЧИЕ ВОЛНЫ


И КОЛЕБАНИЯ ОГРАНИЧЕННОЙ СТРУНЫ
В этой лекции вы познакомитесь с новым типом колебаний распределенных
динамических систем – сплошной среды или электромагнитного поля – стоячими
волнами. Они возникают в ограниченных упругих телах или объемах. Стоячая
волна может возникнуть и как суперпозиция (интерференция) гармонических
волн Aei(ωt – kx) и Aei(ωt + kx), бегущих навстречу друг другу, так как
Aei(ωt – kx) + Aei(ωt + kx) = 2Aeiωtcos kx. (33.1)
У волны (33.1) колебания в каждой точке x совершаются с одной и той же
частотой ω и фазой, но с разной амплитудой, зависящей от x и изменяющейся по
закону 2Acos kx. В соответствии с (33.1) общий вид стоячей одномерной волны
можно записать в виде
u(x, t) = X(x) T(t), (33.2)
где X(x) – функция только x, а T(t) – только времени t.
Во многих случаях колебания распределенной системы представимы в виде
суперпозиции стоячих волн. В качестве примера мы рассмотрим произвольные
колебания ограниченной струны с закрепленными концами и их частный случай,
когда эти колебания вызваны сосредоточенным ударом по ней в каком-то месте.
Общая математическая модель следующая. Задано волновое уравнение
∂ 2u 2
−2 ∂ u
= a (0 ≤ x ≤ l ) (33.3)
∂t 2 ∂x 2
и начальные и граничные условия на функцию u(x, t). Начальные условия
∂u
u(x, t)t = 0 = ϕ(x), = ψ( x ) , (33.4)
∂t t = 0
граничные –
u(x, t)x = 0 = 0, u(x, t)x = 0 = 0. (33.5)
Метод получения требуемого решения был впервые предложен Фурье и на-
зван его именем. Он состоит в том, что сначала ищутся решения вида стоячих
волн (33.2) уравнения (33.3) при граничном условии (33.5). Таких решений оказы-
вается счетное число. После этого решение задачи (33.3)−(33.5) ищется в виде су-
перпозиции полученных решений вида (33.2). При этом оказывается, что суперпо-
зиция всегда может быть подобрана требуемым образом, т.е. так, чтобы удовле-
творялись начальные условия (33.4); краевые условия, как и само уравнение
(33.2), удовлетворяются автоматически в силу того, что каждое слагаемое супер-
позиции им удовлетворяет.
Подставляем (33.2) в (33.3) и находим, что
T ′′ X ′′
= a2 .
T X
33. Стоячие волны и колебания ограниченной струны 261

Так как левая часть этого равенства не зависит от x, а правая от t, то они рав-
ны постоянной, пусть –λ. Это приводит к уравнениям
T'' + λT = 0, X'' + a2λX = 0. (33.6)
Нас интересуют только те решения уравнений (33.6), для которых функция
u(x, t), определяемая согласно (33.2), удовлетворяет краевым условиям (33.5). Это
возможно только при положительном λ. При λ > 0 общие решения (33.6) имеют
вид:
T = sin λ t + B cos λ t , X = C sin a λ x + D cos a λ x ,
и, следовательно,
u( x, t ) = TX = ( A sin λ t + B cos λ t )(C sin a λ x + D cos a λ x ) . (33.7)
Это решение должно удовлетворять краевым условиям (33.6). Из них следует,
что
D = 0, C sin a λl = 0 . (33.8)
Принять C = 0 нельзя, так как в результате придем к тривиальному нулевому
решению, поэтому из (33.8) следует, что
π
λ= n ( n = 1, 2, 3, ... ).
al
Итак, приходим к решениям вида
 πn πn  πn
u(x, t) =  A sin t + B cos t  sin x. (33.9)
 al al  l
Это стоячие волны с дискретными длинами волн 2l/n и соответствующими
частотами πn/al. У этой стоячей волны все точки колеблются синхронно с вре-
менной частотой ωn = πn/al и амплитудой, гармонически меняющейся с измене-
нием x пропорционально sin (πnx/l). Вид нескольких стоячих волн для n = 1, 2, 3
показан на рис. 33.1.
n=1

Рис. 33.1. Гармонические стоячие волны:


n = 1 – основной тон, n = 2 − первая гармо-
ника, n = 3 – вторая гармоника
x=0 x=l
n=3 n=2
Далее будем искать решение исходной задачи (33.3)−(33.5) в виде бесконеч-
ной суммы всех стоячих волн (33.7):
 πn πn  πn
u( x, t ) = ∑  An sin t + Bn cos t  sin x, (33.10)
 al al  l
где An и Bn пока произвольны. Начальные условия (33.4) приводят к условиям
πn
∑ Bn sin l x = ϕ ( x ),
(33.11)
πn πn
∑ a l An sin l x = ψ ( x ),
262 Ю.И. Неймарк. Математическое моделирование как наука и искусство

которые можно рассматривать как разложения в ряды Фурье функций ϕ(x) и ψ(x)
соответственно. Так как при n ≠ m
l
πn πm
∫ sin l
x sin
l
x dx = 0 ,
0

а при n = m тот же интеграл равен l/(2π), то, умножая каждое из равенств (33.11)
на sin πm l x и интегрируя по x от 0 до l, находим, что
l
2π πm
Bm = ∫
l 0
ϕ( x ) sin
l
xdx,
(33.12)
l
2a πm
Am =
m 0∫ ψ( x ) sin
l
xdx.

Так красиво и просто решается общая задача (33.3)−(33.5). Решение получено


в виде суперпозиции дискретной последовательности стоячих волн. Каждая стоя-
чая волна характеризуется частотой ωn = nπ/al и длиной волны 2l/n. Ее вид опре-
деляется формулой (33.10). Частоты ωn образуют спектр частот возможных коле-
баний ограниченной струны. Наименьшая частота ω1 отвечает основному тону,
частота ω2 – первой гармонике, ω3 – второй и т.д. (см. рис. 33.1). Спектр колеба-
ний струны определяется его спектром частот и соответствующими им амплиту-
дами.
Если речь идет о рояльной струне, то состав гармоник ее колебаний опреде-
ляет основной тон звука и его окраску, зависящую от гармоник. При одинаковом
основном тоне окраска звука может быть совершенно разной. Так, один и тот же
нотный звук у рояля, скрипки и гитары звучит совершенно по-разному. Это при
одинаковых основных тонах. Так что окраска и красота звука определяется всем
его спектром. Основной тон определяется длиной, натяжением и плотностью
струны. Спектр же зависит от того, как возбудили ее колебания: где ее ударил мо-
лоточек рояля, как и где проводится смычок скрипки и какой он сам, наканифолен
ли и как натянут и из чего сделан? Конечно, дело не только в том, каков спектр
колебаний самой струны, но и в том, как эти колебания превращаются в звук. Но
этот сложный вопрос мы оставим в стороне и рассмотрим только, как зависит
спектр колебаний струны от места ее удара x = ξ. Разница звучаний рояля Бек-
штейна и Стенвея проистекает, прежде всего, от различия мест удара молоточка
по струне.
При составлении математической модели колебаний первоначально непод-
вижной струны, получившей сосредоточенный на очень малой длине удар, пере-
давший ей импульс p, будем исходить из общей модели (33.3)−(33.5). В этой об-
щей модели надлежит только конкретизировать вид функций ϕ(x) и ψ(x).
Удар будем считать мгновенным и точечным. В соответствии с этим за время
удара струна не успеет переместиться и поэтому ϕ(x) = 0. Так как струне при уда-
ре передается импульс p, то
l

∫ ρψ( x )dx = p , (33.13)


0
33. Стоячие волны и колебания ограниченной струны 263

где ρ – постоянная плотность струны, а ψ(x) – скорость струны после удара в точ-
ке x. Удар мы предполагаем сосредоточенным в исчезающе малой окрестности
точки x = ξ. Вне этой исчезающе малой окрестности скорость ψ(x) непосредст-
венно после удара равна нулю и поэтому условие (33.13) можно записать в виде
ξ+ ε
p
∫ ψ( x)dx =
ρ
(ε > 0) (33.14)
ξ−ε

и ψ(x) = 0 при x ∉ [x – ε, x + ε], где ε исчезающе мало. При неограниченном


уменьшении длины отрезка, по которому ударяет молоточек, на этом маленьком
отрезке функция ψ(x) неограниченно растет, но все время соблюдается условие
(33.13). Таким образом, функция ϕ(x) = 0, а функция ψ(x) всюду равна нулю, кро-
ме исчезающе маленькой окрестности точки x = ξ, и для нее имеет место условие
(33.13). Используем эти сведения для вычисления постоянных Am и Bm по форму-
лам (33.12). Согласно первой из них, Bm = 0, а согласно второй,
ξ+ ε
2a πm 2ap πm
Am = ∫
m ξ− ε
ψ( x ) sin
l
xdx ≈

sin
l
ξ, (33.15)

где формулы тем точнее, чем меньше ε > 0.


Это рассуждение, позволяющее у общего решения (33.10) найти конкретные
значения коэффициентов An и Bn (n = 1, 2,... ), можно формализовать и упростить
с помощью уже знакомой вам обобщенной δ-функции. Мгновенный удар моло-
точка сообщает струне, точнее ее точке x = ξ, импульс p. Математическая модель
сосредоточенного в точке импульса p – это pδ(x – ξ), т.е.
p
ψ( x ) = δ( x − ξ) . (33.16)
ρ
Подставляя (33.16) в формулы (33.12) для Am, формально приходим к (33.15),
где знак приближения заменяется равенством.
В обоих случаях приходим к тому, что колебания струны, получившей мгно-
венный сосредоточенный в точке x = ξ удар импульса p, имеют вид:
2ap πn πn πn
u ( x, t ) = ∑ sin ξ sin x sin t . (33.17)
nρ l l al
Согласно (33.17), максимальные амплитуды основной частоты π (al ) и гармо-
ник 2π ( al ) , 3 π ( al ) , … соответственно равны
2ap π ap 2π 2ap 3π
sin ξ , sin ξ, sin ξ ,
ρ l ρ l 3ρ l
что наглядно представлено на рис. 33.2 для основного тона n = 1 и первых трех
гармоник n = 2, n = 3 и n = 4.

Рис. 33.2. Графическая иллюстрация


к зависимости амплитуды от порядка
гармоники при импульсном ударе струны x=0 x=ξ x=l
в точке x = ξ
264 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Из рис. 33.2, в частности, видно, что основной тон наилучше представлен при
ударе по центру струны, но при этом отсутствует вторая и четвертая гармоники.
Для того чтобы хорошо представить несколько первых гармоник, можно ударить
недалеко от концов струны. Так и делается в рояле, причем чем это расстояние
меньше, тем больше гармоник представлено. У рояля Стенвея это расстояние
меньше, чем у Бекштейна, и поэтому его звук «звонче», но зато звук у рояля Бек-
штейна «бархатнее» и «мягче».
Звук скрипичной струны и фортепианной одного и того же основного тона
сильно различаются, и это отличие объясняется также различностью представи-
тельности гармоник.
Наше ухо устроено так, что звук воспринимается фактически через его
спектр. Музыкальные звуки до, ре, ми и т.д. имеют спектр, состоящий из основно-
го тона и гармоник. Музыкальные аккорды имеют спектр, составленный из спек-
тров, входящих в него звуков. Шум имеет очень много спектральных частот, та-
кой спектр называют сплошным в противоположность дискретному спектру, ко-
гда частот не очень много.
Почему определенные последовательности звуков вызывают у нас такие
сильные эмоции – пожалуй, одна из величайших загадок природы. Хотя некото-
рые необходимые для этого требования известны и составляют предмет теории
музыки.
34. Микрочастица 265

34. МИКРОЧАСТИЦА
До сих пор мы рассматривали различные математические модели окружаю-
щего нас мира, подчас непонятного и загадочного, но все же того, в котором мы
живем. Но помимо этого мира существуют миры, скрытые от нас, которые недос-
тупны нам, и в этом смысле существуют лишь в нашем воображении. Таков мик-
ромир – мир молекул, атомов и элементарных частиц. Мир, о котором человек до-
гадался давно, но который стал доступен изучению только в последнее столетие,
вместе с созданием новой неклассической физики – квантовой механики.
Математические модели объектов микромира – квантовой механики – еще в
большей мере, чем модели классической физики, носят математический характер,
не только оторванный от нашего непосредственного опыта, повседневных пред-
ставлений и интуиции, но и непринимаемый ими. Несогласования имели место и
раньше при рождении законов механики и электродинамики. В механике повсе-
дневные наблюдения, казалось бы, бесспорно свидетельствуют о том, что силы
вызывают движение, в то время как они только его изменяют. Более сложные
электрические явления казались порождаемыми зарядами и токами и совершенно
неприемлемой была идея о существовании электромагнитных волн, ибо при этом
нет ни зарядов, ни токов. Для квантовой механики такие неприятия проявлялись
значительно сильнее. Микромир никогда и ни в чем непосредственно не воспри-
нимался нашими органами чувств и оказался невообразимо отличным от привыч-
ного макромира. Вместе с тем, в конечном счете, именно микромир лежит в осно-
ве всех проявлений макромира. Поэтому микромир все же можно обнаружить с
помощью создаваемых человеком приборов и специальных условий опыта: на-
блюдая спектры излучения и поглощения атомов, радиоактивность, дифракцию
электронов, фотоэффект и другое.
Приобретаемые таким образом новые данные и их теоретическое осмысление
противоречили не только многовековому опыту, но и сложившимся к тому време-
ни теоретическим представлениям об окружающем физическом мире, получив-
шим впоследствии наименование классической физики. Конечно, это относится
не только к микромиру, но и другим разделам новой физики нашего века – физике
больших скоростей, близких к скорости света, огромных расстояний в миллионы
световых лет, гигантских масс и огромных плотностей, сверхвысоких температур,
невиданных магнитных полей и др.
Укажем на некоторые явные отличия проявлений микромира, говорящих о
необходимости кардинального пересмотра представлений классической физики и
создания кардинально новых математических моделей.
Человечество давно, со времен древних греков, догадывалось, что материаль-
ный мир состоит из мельчайших частиц – атомов – и все происходящее с ним по-
рождается их движениями и взаимодействиями. При этом само собой разумелось,
что хотя они и чрезвычайно маленькие, но наделены такими же свойствами, как и
обычные тела: они могут перемещаться, ударяться друг о друга, зацепляться и т.д.
Создаваемая поначалу кинетическая теория газов, представления о жидких и
твердых телах и многообразные химические превращения не противоречили этим
266 Ю.И. Неймарк. Математическое моделирование как наука и искусство

наивным представлениям. Но на пороге ХХ века начали обнаруживаться несоот-


ветствия. Постепенно эти несоответствия проявили свою полную несовмести-
мость с классической физикой.
Например, выяснилось, что в некоторых случаях бессмысленно говорить о
траекториях движения микрочастиц, что представление о наличии таких траекто-
рий входит в явное противоречие с опытом, что в микромире может в классиче-
ском понимании нарушаться закон сохранения энергии, а колеблющийся в атоме
электрический заряд – электрон – почему-то не излучает, как это положено со-
гласно классической электродинамике, а если и излучает, то только волновые па-
кеты определенных частот и энергий. Вы, конечно, слышали об этих и других
особенностях микромира: о дифракции электронов, о радиоактивном распаде,
спектрах излучения и поглощения атомов, квантовых генераторах – лазерах, фото-
эффекте, ядерных реакциях и реакторах, атомной бомбе, непомерно большой
энергии излучения Солнца, необъяснимых закономерностях таблицы Менделеева
и, возможно, многом другом.
Для доказательства несостоятельности научных представлений и теорий не
требуется много противоречий, нужно много соответствий, но противоречия дос-
таточно одного. На одном мы и остановимся, на дифракции электронов.
Электрон по первоначальным представлениям – это мельчайшая заряженная
частица с очень маленьким зарядом и массой. Его полет можно отклонить маг-
нитным полем в полном соответствии с силой Лоренца, действующей на движу-
щийся в магнитном поле электрический заряд. Его можно обнаружить после уда-
ра о фотопластинку, на ней он оставит после проявления черную точку. В элек-
трическом поле он движется в полном соответствии с законами Ньютона. Но вот
поставим на пути потока электронов постоянной интенсивности преграду с двумя
отверстиями, а после преграды экран, который фиксирует попадание в него элек-
тронов. Естественно считать, что на экране оставят следы только те электроны,
которые пролетают через отверстия. Остальные будут задержаны препятствием и
на него не попадут. При этом одни электроны летят через одну дырочку, а другие
– через другую. Пролетев через дырочки в преграде, они долетят до экрана и оста-
вят на нем свои следы. Из сказанного с очевидностью следует, что если мы будем
в течение некоторого времени T пропускать электроны через одну дырочку, за-
крыв другую, а затем опять в течение того же времени так же пропускать через
другую, то это должно дать на экране ту же картину попаданий в него электронов,
как если их пропускать через обе дырочки в течение того же времени T. Различие
можно видеть только в том, что пролетевшие через две дырочки электроны взаи-
модействуют друг с другом. Но это кулоновское взаимодействие очень мало.
Кроме того, оно, как и всякое другое, исключается, если время между полетами
электронов более времени их движения от препятствия до экрана, т.е. если поток
электронов достаточно малой интенсивности. При описанном раздельном про-
пускании электронов то через одну дырочку, то через другую или сразу через две,
но в течение в два раза меньшего времени, на экране должны быть одинаковые
картины попаданий в него электронов. Если электроны летят по определенным
траекториям, как обычные маленькие частицы, то это, безусловно, так. Что же да-
ет эксперимент? Он дает нечто совершенно неожиданное, изображенное на
рис. 34.1.
34. Микрочастица 267

Рис. 34.1. Дифракция электронов


при последовательном прохождении
через две дырочки и одновременном:
черные точки соответствуют «ударам»
о фотоэмульсионный слой отдельных
электронов

Эти картинки разные, совершенно не похожие друг на друга. Вторая картинка


похожа на то, что через два отверстия пролетали не частицы – электроны, а про-
ходил свет – электромагнитные волны – с характерной для него картинкой ди-
фракции. Так что же такое летящий электрон – это летящая частица или волна,
для которой имеет место явление дифракции? Скорее всего, ни то, ни другое, они
– микрочастицы, объекты новой незнакомой нам природы. Верно лишь то, что в
одних случаях они проявляют себя подобно частицам, в других ведут себя как
волны, а в третьих − ни как волны и ни как частицы, а как микрочастицы.
История синтеза математических моделей микромира – сложный, противоре-
чивый и запутанный процесс, очень далекий от логического вывода. В нем много
фантастических гипотез, непостижимых догадок и озарений с последующей
фильтрацией, уточнением и взаимными увязками. Изложение квантовой механики
даже для физиков обходит сколько-нибудь полное описание этого процесса. Тем
более, естественно это сделать для математиков, начав сразу с описания итоговой
математической модели, ее формализма, который затем иллюстрируется на при-
мерах.
Освоение необычных математических моделей микромира требует выработки
новых представлений, понятий и новой интуиции на основе постижения матема-
тической модели путем проникновения в ее логику и гармонию, исходя из чисто
математических соображений. Такой путь постижения истины тоже доступен че-
ловеческому интеллекту и именно в этой возможности его мощь и сила, вызвав-
шая гигантский скачок естественных наук в последние столетия.
Основанием необходимости этих необычных математических моделей слу-
жит невозможность трактовки наблюдаемых явлений микромира с позиций клас-
сической физики, а основанием их справедливости являются качественные и ко-
личественные совпадения получаемых с их помощью выводов и результатов с
данными разнообразных наблюдений и экспериментов (дифракция электронов на
кристаллических решетках, спектры атомов и молекул, фотоэффект, спектры рав-
новесного излучения, химические свойства веществ и таблица Менделеева, явле-
ния физики твердого тела и полупроводников, квантовые генераторы и многое,
многое другое). К этому следует добавить, что все же необычные квантовые мо-
дели переходят в классические при изменении параметров от их значений в мик-
ромире к значениям нашего макромира. И в этом можно видеть стыковку законов
нашего макромира и микромира.
268 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Лучше всего воспринять модель микромира, о которой будет речь ниже, как
игру, так же, как в свое время вы слушали игру Коена «жизнь». Только теперь ме-
няются не фишки на шахматной доске, а некая функция ψ и находимые с ее по-
мощью физические величины. Такой подход позволит вам легко принять ее пра-
вила и, потрудившись, научиться играть. Когда вы научитесь «играть», математи-
ческая модель микромира вам станет привычной, а со временем и понятной.
Если основной математический аппарат классической физики – это диффе-
ренциальные уравнения, то для квантовой механики – это еще и совсем другой,
существенно отличный от дифференциальных уравнений, математический аппа-
рат теории линейных операторов. Он был создан математиками до того, как был
востребован физиками, исходя из внутренних потребностей и мотивов развития
самой математики. Теория линейных операторов вам знакома из курса функцио-
нального анализа, но, несомненно, действия с линейными операторами вам менее
привычны, чем с дифференциальными уравнениями.
Математические модели классической физики и квантовой механики сущест-
венно разные, но принцип детерминизма в его достаточно широком понимании
уцелел. Как и в классической физике, в основе описания объектов микромира ле-
жит состояние, но теперь в виде некоторой комплексной функции ψ от координат
микрочастиц и, возможно, их спинов. При этом состояние микросистемы – это
сама комплексная функция ψ перечисленных переменных, а не значения входя-
щих в нее переменных.
Изменение во времени функции ψ подчиняется дифференциальному уравне-
нию Шредингера
∂ψ
ih = Hψ , (34.1)
∂t
где H – оператор рассматриваемой системы, h – так называемая постоянная План-
ка, равная очень маленькой величине 1,05⋅10–27 эрг⋅с.
Функция ψ, как уже отмечалось – это функция вектора x – координат мик-
рочастиц, спинов и времени t. Оператор H – это так называемый оператор Га-
мильтона. Он действует по переменным вектора x . Назван он так потому, что по-
лучается по определенным правилам из функции Гамильтона микросистемы, рас-
сматриваемой как классическая механическая система.
То, что именно функция является описанием состояния, имело место и в клас-
сической механике при описании сплошных сред, и в электродинамике при опи-
сании электрического и магнитного полей. Не ново и то, что эта функция удовле-
творяет некоторому уравнению в частных производных. Не так уж ново и то, что
функция ψ комплексная: такое имеет место в приложении теории функций ком-
плексного переменного к задачам гидродинамики и электродинамики. Сущест-
венное отличие состоит не в этом. Оно состоит в том, как по функции состояния ψ
находятся возможные значения наблюдений физических величин, характеризую-
щих рассматриваемую микросистему; как функция ψ связана с наблюдаемыми
физическими величинами: координатами, импульсами, моментами, энергиями,
спинами, частотами, длинами волн и др.
Математический формализм квантовой механики. В квантовой механике
постулируется, что каждой физической величине отвечает эрмитов – комплекс-
34. Микрочастица 269

ный самосопряженный – линейный оператор, собственные значения которого –


единственные возможные значения этой физической величины.
Напомним, что эрмитовость оператора L означает, что для любых функций ψ1
и ψ2 имеет место (звездочка означает комплексное сопряжение)

∫ ψ1 ∗ Lψ 2d x = ∫ ψ 2 ( Lψ1 ) ∗ d x . (34.2)
Собственные значения λ любого эрмитова оператора L действительные. Чис-
ла λ и соответствующие собственные функции ϕ находятся из условия
Lϕ = λ ϕ (ϕ ≠ 0). (34.3)
Множество всех собственных функций эрмитова оператора полное, а собст-
венные функции ϕ1 и ϕ2, отвечающие разным собственным значениям λ1 ≠ λ2, ор-
тогональны
∫ ϕ1 ∗ ϕ 2 d x = 0 . (34.4)
Итак, как уже указывалось, каждой физической величине l сопоставляется по
правилам, которые будут указаны ниже, эрмитов оператор L. Возможные значе-
ния физической величины l – это только его собственные значения. В результате
измерений эти значения могут наблюдаться. При этом в идентичных условиях ре-
зультаты измерений могут быть разными, и фактический физический смысл име-
ет лишь их среднее значение (математическое ожидание). Это среднее значение
l , согласно квантово-механическому формализму, находится по состоянию ψ
квантовой системы по формуле
l = ∫ ψ ∗Lψd x , (34.5)
где функция состояния ψ предполагается нормированной, т.е.

∫ ψ ∗ψ d x = 1 .
Сказанным исчерпывается формальное описание математической модели
квантовой системы. Эта математическая модель включает понятие состояния –
функцию ψ, уравнение Шредингера изменения состояния во времени и форма-
лизм отыскания возможных значений любой физической величины и ее средне-
статистического значения по функции состояния и операторам этих физических
величин, согласно (34.5).
Фактическое построение математической модели квантовой системы требует
написания функций ψ и H и уравнения Шредингера, а также знания операторов,
отвечающих интересующим нас физическим величинам.
Ее исследование в рамках изложенного состоит в решении уравнения Шре-
дингера, возможно, при некоторых дополнительных сведениях о функции ψ; оты-
скании собственных значений и собственных функций операторов интересующих
нас физических величин и вычислении с помощью найденной функции ψ их сред-
них значений по формуле (34.5).
Укажем операторы, отвечающие координатам x, y и z, импульсам px, py и pz,
кинетической T и потенциальной V энергиям, а также оператору Гамильтона H,
для частицы массы m в потенциальном поле V(x, y, z) без учета ее спина.
270 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Операторы, отвечающие координатам x, y и z, – это умножение на x, y и, соот-


ветственно, z. Так что оператор, отвечающий координате x, от функции ψ – это
x ψ; для y и z – это y ψ и z ψ. Оператор от ψ, отвечающий функции V(x, y, z), – это
V(x, y, z)ψ.
Импульсам px, py и pz отвечают дифференциальные операторы
∂ ∂ ∂
− ih , − ih , − ih . (34.6)
∂x ∂y ∂z
Вектору импульса p(px, py, pz) отвечает вектор – оператор
∂ ∂ ∂
− ih  , ,  = −ih∇ , (34.7)
 ∂x ∂y ∂z 
где ∇ – значок оператора градиента.
Кинетической энергии T частицы массы m соответствует оператор
h2  ∂2 ∂2 ∂2  h2 2 h2
−  2 + 2 + 2=− ∇ = − ∆, (34.8)
2m  ∂x ∂y ∂z  2m 2m
где ∆ – значок оператора Лапласа.
Потенциальная энергия V(x, y, z) является функцией координат, и поэтому со-
ответствующий ей оператор – это умножение на V(x, y, z).
Осталось указать оператор Гамильтона частицы массы m. Согласно так назы-
ваемому принципу соответствия классической функции Гамильтона
1 2
( p x2 + p 2y + p z2 ) + V ( x, y , z )
2m
и квантового оператора Гамильтона, он записывается в виде
h2
H =− ∆ + V ( x, y , z ) . (34.9)
2m
Теперь мы можем записать уравнение Шредингера для микрочастицы массы
m (без спина). Функция состояния будет
ψ = ψ( x , t) = ψ(x, y, z, t), (34.10)
а уравнение Шредингера, согласно (34.1) и (34.9), имеет вид
∂ψ h 2  ∂ 2ψ ∂ 2ψ ∂ 2ψ 
ih =−  + +  + V ( x, y , z ) ψ . (34.11)
∂t 2m  ∂x 2 ∂y 2 ∂z 2 
Прежде чем перейти к конкретным примерам, укажем на два важных следст-
вия, вытекающих из описанной математической модели квантовой системы. Одно
следствие касается того, что можно указать, не только какие значения может при-
нимать та или иная физическая величина и не только ее среднее значение, но и
вероятности, с которыми эти значения могут приниматься.
Для того чтобы это обнаружить, разложим в формуле среднего значения
(34.5) функцию ψ по собственным нормированным функциям оператора L. Ради
простоты пусть спектр собственных значений оператора L дискретен, и тогда раз-
ложение нормированной функции ψ по собственным функциям ϕ1, ϕ2, ... с собст-
венными значениями l1, l2, ... , которые есть возможные значения величины l, име-
ет вид:
34. Микрочастица 271

ψ = c1ϕ 1 + c2ϕ2 + ... , (34.12)


где
cs = ∫ ψ( x ) ϕ∗s ( x ) d x .
Подставляя (34.12) в (34.5), непосредственно находим, что
l = ∑ cs l s ,
2
(34.13)
где в силу нормированности функции ψ
∑ cs
2
= 1.
Как известно, математическое ожидание величины l, которая может прини-
мать значения l1, l2, ... с вероятностями p1, p2, ..., равно
M l = ∑ ls ps . (34.14)
Сравнивая (34.14) с (34.13), находим, что вероятность ps принятия значения ls
равна
2
p s = cs . (34.15)
В частности, отсюда следует, что если функция ψ совпадает с одной из собст-
венных функций оператора L, пусть с ϕs, то ps = 1 и поэтому в этом случае физи-
ческая величина может принимать только одно значение ls, а вероятности других
значений lj (j ≠ s) равны нулю.
Таким образом, в общем случае функции ψ величина l может принимать лю-
бое из значений l1, l2, ... с вероятностями p1, p2, ... соответственно. Это не исклю-
чает возможности в частных случаях (частных видах функции ψ) принятия вели-
чиной l лишь некоторых значений или даже только одного. Только в последнем
случае результат измерения физической величины l предсказуем.
Таков первый важный вывод из сформулированной математической модели
квантовой системы.
Проиллюстрируем его простым примером, когда речь идет о значениях коор-
динат x, y и z микрочастицы. Этим величинам отвечают операторы умножения на
x, y и z. Поэтому, согласно формуле (34.5),
2
x = ∫ ψ ∗ xψ dx dy dz = ∫ x ψ dx dy dz = ∫ x (∫ ψ 2
)
dy dz dx
и аналогично для y и z . Отсюда непосредственно следует, что
2
∫∫ ψ dy dz
является плотностью вероятностей значений координаты x, а |ψ|2 – плотность ве-
роятностей значений x, y и z.
Тем самым найден статистический смысл функции квантового состояния ψ:
квадрат ее модуля |ψ|2 – это плотность вероятностей принятия координатами зна-
чений x, y и z.
Однако, согласно предыдущему, функция ψ дает статистическое описание не
только значений координат x, y и z, но и любых других физических величин, опе-
раторы которых нам известны.
272 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Второй вывод, который можно сделать из определения математической моде-


ли, относится к так называемому принципу неопределенности Гейзенберга о воз-
можных результатах одновременного измерения физических величин (l и k с опе-
раторами L и K) и состоит в утверждении, что однозначный результат измерения
двух физических величин возможен только при коммутативности операторов L и
K, т.е. когда
LK – KL = 0.
В противном случае либо обе величины l и k не имеют однозначных значе-
ний, либо если одна однозначна, то другая неопределенна. Полнее, для дисперсий
величин l и k имеет место неравенство
2
1 ∗  LK − KL 
4∫ 
Dl Dk ≥ψ   ψd x . (34.16)
i 
Поясним это важное неравенство. В нем l и k – произвольные физические из-
меряемые величины, а L и K − соответствующие им операторы. Оно является
следствием очевидного неравенства
2
λ
∫Lψ +
i
Kψ d x ≥ 0 ,

справедливого при любом действительном λ.


Выше формулой (34.5) были определены средние значения физических вели-
чин l и k. Аналогично можно определить их дисперсии, как средние значения ве-
личин (l − l ) 2 и ( k − k ) 2 . Так,
Dl = ∫ ψ ∗ ( L − l ) 2 ψ d x ,
где функция ψ( x , t ) , являющаяся состоянием микрочастицы, как и в формуле
(34.5), предполагается нормированной на единицу.
Например, операторы координаты x и импульса px не коммутируют, так как
 ∂  ∂ ∂ ∂
 − i h x + x i h = − i h − i h x + x i h = −i h ,
 ∂x  ∂x ∂x ∂x
и поэтому, согласно формуле (34.16),
h2
Dx Dp x ≥ , (34.17)
4
т.е. произведение дисперсий результатов измерений координаты x и соответст-
вующего импульса px не может быть меньше h2/4.
Это существенно отлично от того, что имеет место в классической механике,
где, наоборот, для определения состояния требуется задание вместе с координатой
x и импульса px. В квантовой же механике они одновременно не могут быть зада-
ны принципиально. Это возможно лишь в случае коммутативности соответст-
вующих операторов. Так, например, коммутируют между собой операторы коор-
динат x, y и z, а также импульсов px, py и pz, и поэтому одновременное однозначное
измерение только всех координат или только всех импульсов возможно, но если
одновременно определены три координаты или три импульса, то не определены
все импульсы и соответственно все координаты.
34. Микрочастица 273

Таким образом, одновременная определенность всех физических величин, к


которой мы привыкли в классической механике, в квантовой механике не имеет
места. Напомним, что кроме этого кардинального различия с классикой, имеет
место и еще другое существенное различие, о котором уже говорилось. Это дис-
кретность физических величин, их квантованность, поскольку возможные значе-
ния физической величины определяются спектром собственных значений ее опе-
ратора, а этот спектр может быть дискретным.
Перейдем к рассмотрению движений свободной квантовой частицы в некото-
рых простых одномерных полях. Рассмотрим мы и гармонический осциллятор, и
квантовый вариант задачи Ньютона – атом водорода и водородоподобный иони-
зированный атом гелия или лития.
Во всех этих случаях уравнение Шредингера, согласно (34.10), имеет вид
∂ψ h 2  ∂ 2ψ ∂ 2ψ ∂ 2ψ 
ih =−  + +  + V ( x, y , z )ψ . (34.18)
∂t 2m  ∂x 2 ∂y 2 ∂z 2 
Будем искать его решения вида
ψ( x, y , z, t ) = A(t ) ψ ( x, y , z ) . (34.19)
После подстановки (34.19) в (34.18) и разделения переменных t и x, y, z полу-
чаем
i h ∂A 1  h 2 
= − ∆ ψ + Vψ  = E , (34.20)
A ∂t ψ  2m 
где E – постоянная. Перед нами два уравнения: одно относительно A(t), второе
относительно ψ (x, y, z). Решение первого уравнения легко находится и имеет вид
A(t ) = e − (iE h ) t , (34.21)
решение второго уравнения
h2
− ∆ψ + V ψ = E ψ (34.22)
2m
требует конкретизации функции V. Если нам удалось найти решение уравнения
(34.22), удовлетворяющее естественным условиям, налагаемым на функцию ψ
(непрерывность, ограниченность и еще какие-нибудь условия, следующие из по-
становки задачи), то решением (точнее одним из решений) исходного уравнения
(34.20) будет
ψ( x, y , z, t ) = e − (iE h )t
ψ ( x, y, z ) . (34.23)
Это решение ψ при любом t удовлетворяет уравнению (34.22) (если в него
вместо ψ подставить ψ) и поэтому является собственной функцией оператора
энергии
h2

∆ +V . (34.24)
2m
Следовательно, в найденном состоянии ψ энергия системы имеет определен-
ное значение E, так как E, согласно (34.20), является собственным значением опе-
ратора энергии, отвечающим собственной функции ψ.
274 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Состояния квантовой системы, отвечающие определенным значениям энер-


гии E, называются стационарными. Так что ψ – стационарное состояние с энерги-
ей E. Заметим, что
2 2
ψ = ψ , e − ( iE / h ) t = 1 , (34.25)
поэтому плотности вероятности значений координат в стационарном состоянии
не зависят от времени (потому оно и названо стационарным).
Для квантовой системы имеет место принцип суперпозиции. Это следует из
линейности относительно функции состояния уравнения Шредингера. Поэтому
суперпозиция стационарных состояний является тоже некоторым состоянием,
удовлетворяющим уравнению Шредингера. Верно и обратное: всякое допустимое
решение уравнения Шредингера может быть представлено суперпозицией ста-
ционарных состояний. Тем самым изучение возможных состояний квантовой сис-
темы сводится в этом смысле к отысканию всех ее стационарных состояний.
Спектр собственных значений оператора энергии может быть дискретным,
непрерывным или смешанным. Каждому невырожденному значению спектра от-
вечает единственная нормированная собственная функция. При вырожденности
собственного значения их может быть несколько и даже бесконечно много. Одна-
ко в любом случае все собственные функции можно ортогонализировать и нор-
мировать.
Условие ортогональности двух различных собственных функций ψ1 и ψ2 , от-
вечающих дискретному или непрерывному спектру, состоит в том, что

∫ ψ1ψ 2 d x = 0 .

(34.26)
Условие нормировки по форме записывается по-разному для собственного
значения, отвечающего дискретному или непрерывному спектру.
Для случая дискретного спектра условие нормированности функции ψs , отве-
чающей собственному значению Es, уже было написано, оно имеет вид

∫ ψ sψ s d x = 1 .
*
(34.27)
Для непрерывного спектра, собственные функции которого зависят от пара-
метра E, т.е. ψ = ψE , условие нормировки можно записать в виде

∫ ψ E ψ E ′ d x = δ ( E − E ′) .

(34.28)
Эта запись означает, что при E ≠ E'

∫ ψ E ψ E′ d x = 0 ,

(34.29)
что соответствует ортогональности. При E = E' интеграл (34.29) обращается в бес-
конечность, но так, что все же существует интеграл от него по E, равный единице,
т.е.
∫ ψ E ψ E ′d x = 1,
*
(34.30)
где интегрирование по E происходит по непрерывной части спектра.
Для того чтобы сблизить записи (34.26)−(34.31), запишем их в виде

∫ ψiψ j d x = δij , ∫ ψ E ψ E ′d x = δ( E − E ′) ,
*
(34.31)
34. Микрочастица 275

где символы δij и δ(E – E') обращаются в нуль соответственно при i ≠ j и E ≠ E', а
при i = j и E = E' первый равен 1, а для второго равен единице интеграл

∫ δ(E − E ′)dE = 1 .
Напомним, что символ δij (функция от целочисленных значений i и j) был
введен Кронекером и называется символом Кронекера, а символ δ(E – E') был вве-
ден в теоретическую физику Дираком и называется функцией Дирака. Впервые
эта функция использовалась Хевисайдом в созданном им новом, непонятом со-
временниками, операционном исчислении.
После этого затянувшегося, но необходимого предисловия перейдем, нако-
нец, к рассмотрению указанных выше квантовых систем.
Микрочастица (например, электрон) описывается операторами координат,
импульса, моментов импульса, энергии и спина, кроме того, она имеет массу и
заряд. Если микрочастица имеет заряд, то на нее действует электрическое, а при
движении – и магнитное поля. Такое богатство описания и возможных влияний
приводит к гигантскому разнообразию явлений в поведении микрочастиц. После-
дующее имеет целью познакомиться лишь с некоторыми из них, наиболее про-
стыми, не приводящими к математическим трудностям и все же достаточно пред-
ставительными для того, чтобы почувствовать отличия микромира от привычного
макромира. В последующем изложении примеры относятся только к микрочасти-
це, для которой отсутствует или несущественен спин и отсутствует магнитное по-
ле.
Свободная микрочастица. Для свободной микрочастицы V = 0, и поэтому
уравнение (34.22) принимает вид
h2
− ∆ψ = Eψ . (34.32)
2m
Непосредственно проверяя, можно убедиться, что оно имеет решение вида
i
ψ = exp ( p x x + p y y + p z z ) , (34.33)
h
где px, py, pz – произвольные постоянные, удовлетворяющие условию:
1
( p x2 + p 2y + p z2 ) = E . (34.34)
2m
Поэтому, согласно (34.23), соответствующее решение уравнения Шредингера
для свободной частицы запишется в виде:
i
ψ = exp ( p x x + p y y + p z z − Et ) . (34.35)
h
Это знаменитая функция. Она получила наименование волны де Бройля и с
нее началась волновая трактовка микрочастицы. Чтобы это понять, заметим, что, с
одной стороны, функция ψ описывает комплексную плоскую волну с частотой
ω = E/h и волновым числом k = p / h = 2m E /h, распространяющуюся вдоль
вектора p , а с другой, – она представляет собой микрочастицу с энергией E и им-
пульсом p . Последнее следует из того, что функция ψ является собственной
функцией операторов импульсов
276 Ю.И. Неймарк. Математическое моделирование как наука и искусство

∂ ∂ ∂
− ih , − ih , − ih
∂x ∂y ∂z
и одновременно оператора кинетической энергии – h2∆ /2m с собственными чис-
лами px, py, pz и E соответственно. Согласно смыслу функции состояния ψ, плот-
ность вероятности ее местонахождения пропорциональна |ψ|2, который, как видно
из (34.35), при всех x, y, z и t равен единице. Таким образом, волна де Бройля как
функция состояния описывает частицу с определенным импульсом и энергией, но
располагающуюся равномерно во всем пространстве, в полном соответствии с
принципом неопределенности.
Микрочастица в потенциальной яме. Пусть в прямоугольной потенциаль-
ной яме с неограниченными стенками находится микрочастица. В этом случае в
уравнении Шредингера
∂ψ h2
ih =− ∆ψ + Vψ (34.36)
∂t 2m
функция V зависит только от одной координаты x:
0 при x ∈ (0, a ),
V = (34.37)
∞ при x ∉ (0, a ),
и ее график имеет вид, изображенный на рис. 34.2.

V=∞ V=0 V=∞

Рис. 34.2. Иллюстрация к поведению электрона


в бесконечно глубокой потенциальной яме
0 a x

Решение уравнения Шредингера (34.36) можно искать в виде


ψ = ψ1(x)ψ2(y, z). (34.38)
После подстановки(34.38) в (34.36) получаемое уравнение можно записать в
виде:
1  ∂ψ1 h 2 ∂ 2ψ1  − 1  ∂ψ 2 h 2  ∂ 2ψ 2 ∂ 2ψ 2  
 ih + − Vψ1  =  ih +  2 +   (34.39)
ψ1  ∂t 2m ∂x 2  ψ  ∂t
2  2 m  ∂y
 ∂ z 2 

с разделяющимися переменными, что позволяет последующее рассмотрение све-
сти к поиску решения одномерного уравнения Шредингера:
∂ψ1 h 2 ∂ 2ψ1
ih =− + Vψ1 . (34.40)
∂t 2m ∂x 2
Этот прием будет использоваться и в последующих задачах.
При x ∉ (0, a) из уравнения (34.40) следует, что ψ1 = 0, поскольку при этом
V(x) = ∞. При x ∈ (0, a) оно принимает вид одномерного уравнения свободной
частицы (ψ1 заменено на ψ)
34. Микрочастица 277

∂ψ h 2 ∂ 2ψ
ih =− ,
∂t 2m ∂x 2
решение которого легко находится и записывается в виде суперпозиции функций
вида
p E  p2
exp i  x x − t  , E = x ,
 h h  2m
которая должна удовлетворять краевым условиям равенства нулю при x = 0 и x =
= a. Этим краевым условиям удовлетворяют только функции вида:
p E   p E   iEt  px
c exp i  x x − t  –c exp i  − x x − t  = 2ic exp  −  sin x, (34.41)
 h h   h h   h  h
для которых
px a
= πk (k = ±1, ±2, …),
h
то есть
πh π2h 2 2
px = k , Ek = k . (34.42)
a 2ma 2
Мы уже знаем, что функции (34.41) являются собственными функциями опе-
ратора кинетической энергии − h ( 2m ) ⋅ ∂ 2 ∂x 2 с собственными значениями Ek,
определяемыми формулой (34.42). Функция (34.41) состоит из суперпозиции двух
функций, которые являются собственными для оператора импульса − ih ∂ ∂x с
собственными значениями, равными pk = ±πhk/a.
Таким образом, функции состояния ψ формулы (34.41) отвечает квантовая
частица с энергией Ek и импульсами pk и – pk, принимаемыми равновероятно.
Выясним еще, какова плотность вероятности координаты x квантовой части-
цы, находящейся в потенциальной яме с неограниченными краями для функций ψ
вида (34.41).
Для этого необходимо функцию формулы (34.41) нормировать и найти квад-
рат ее модуля. Обозначим эту функцию ψk. Непосредственные вычисления дают,
что
1  p 
∫ ψ k ψ k dx = 2a  ψk = e
∗ − i ( E h )t
sin k x  ,
h 
и поэтому для нормированной функции ψk
2 1 kπ
ψk = sin 2 x. (34.43)
2a a
Соответствующие графики плотности вероятности изображены на рис. 34.3.
(для k = 1, 2 и 3).
Возможные функции состояния ψ являются всевозможными суперпозициями
с комплексными коэффициентами найденных функций ψk, т.е.
1  π 2 hk 2  kπ
ψ( x, t ) =
2a
∑ k  − i 2ma 2 t  sin a x ,
c exp
 
278 Ю.И. Неймарк. Математическое моделирование как наука и искусство

для которой условие нормировки состоит в равенстве единице суммы квадратов


модулей коэффициентов ck . При этом квантовая частица имеет энергию E k и им-
пульс pk или –pk с вероятностями 1/2|ck|2.

k=1 k=2

0 a x 0 a x

k=3
Рис. 34.3. Иллюстрация к поведению электрона
в бесконечно глубокой потенциальной яме,
где изображены первые три гармоники функции
ψ(x, t)
0 a x

Что же отличает движение квантовой частицы в потенциальной яме от дви-


жения классической? Классическая частица будет двигаться в ямке от стенки к
стенке, идеально отскакивая от них. Может иметь любую энергию E. Половину
времени попеременно и периодически она будет иметь импульс 2mE , и другую
половину – 2mE . Никакая суперпозиция движений иметь места, конечно, не
может. По существу, мало общего, только соотношение p x2 = 2mE между энергией
и импульсом.
Мы решили задачу об одномерном движении квантовой частицы в бесконеч-
ной прямоугольной потенциальной яме, определяемой функцией (34.37), которую
обозначим Va(x). Располагая этим решением
1  E  πk
ψk ( x) = exp  − i k t  sin x,
2a  n  a
можно указать решение и для частицы, находящейся в трехмерной прямоугольной
яме (прямоугольном ящике), для которого потенциальная функция имеет вид:
V = Va(x) + Vb(y) + Vc(z).
А именно, искомые функции ψ(x, y, z) будут
c −iEt / h πk πk πk
ψ k1k 2 k 3 ( x, y , z ) = sin 1 x sin 2 y sin 3 z ,
8abc a b c
где k1, k2, k3 – целые числа, большие нуля, и
π2h 2  k12 k2 2 k32 
Ek1k 2 k3 = + + .
2m  a 2 b2 c 2 
34. Микрочастица 279

Диффузия микрочастицы через потенциальный барьер. Допустим, что


микрочастицы движутся в направлении оси Ox. Пусть энергия каждой из них E и,
следовательно, они описываются найденной выше волной де Бройля. Поставим на
пути этих микрочастиц потенциальный барьер (рис. 34.4) с уровнем энергии V0.

Рис. 34.4. Иллюстрация к явлению прохождения


микрочастицы сквозь потенциальный барьер V0
ширины а, в частности, и тогда, когда энергия
микрочастицы меньше энергетической высоты
барьера V0
0 a x

В классическом случае, если E > V0, частицы пройдут через потенциальный


барьер и продолжат свое движение с прежней скоростью вдоль оси Ox. Если же
E < V 0, то частицы полностью отразятся и ни одна из них через барьер не пройдет.
Оказывается, что для макрочастиц все будет не так. Только часть из них при
E > V0 «просочится» через барьер, а часть отразится обратно. Частичное отраже-
ние будет иметь место и при E < V0. Остальные преодолеют барьер, хотя их энер-
гия E меньше энергетической высоты барьера V0. Если рассуждать в терминах
волнового дуализма, то такое поведение довольно естественно: падающая на по-
тенциальный барьер волна де Бройля частично отразится, а частично, преломив-
шись, пройдет через него.
Посмотрим, что дает в этом случае математический формализм модели мик-
рочастицы. Будем искать стационарное решение уравнения Шредингера с энерги-
ей E. Учитывая, что потенциальная энергия V(x) на рис. 34.4 описывается форму-
лой
 0 при x < 0,

V ( x ) = V0 при 0 ≤ x ≤ a,
 0 при x > a,

найдем, что уравнение (34.22), вытекающее из уравнения Шредингера, для разных
x имеет различный вид, так что
h2 ∂2ψ
− = E ψ при x < 0,
2m ∂x 2
h2 ∂2ψ
− = ( E − V0 ) ψ при 0 ≤ x ≤ a, (34.44)
2m ∂x 2
h2 ∂2ψ
− = E ψ при x > a.
2m ∂x 2
Решение ψ этих уравнений должно быть ограничено и непрерывно вместе с пер-
вой производной.
Вводя для краткости обозначения
2mE 2m( E − V0 )
2
= k2 , 2
= k12 ,
h h
из уравнений (34.44) непосредственно находим, что ψ будет таково:
280 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ψ = Ae ikx + Be − ikx при x < 0,


ψ = Ceik1x + De −ik1x при 0 ≤ x ≤ a, (34.45)
ikx −ikx
ψ = Ee + Fe при x > a.
Условия гладкости функции ψ (x) при x = 0 и x = a приводят к четырем усло-
виям:
A + B = C + D,
ikA − ikB = ik1C − ik1D,
(34.46)
Ceik1a + De − k1a = Eeika + Fe − ika ,
ik1Ceik1a − ik1De − ik1a = ikEeika − ikFe − ika
для шести неизвестных комплексных постоянных A, B, C, D, E и F. Так как урав-
нений только четыре, то их решение неоднозначно. Это и понятно, так как функ-
ция ψ может быть определена с точностью до постоянного множителя и, кроме
того, по физическому смыслу задачи из бесконечности справа налево не могут
двигаться микрочастицы, что еще не было учтено. В силу этого можно принять,
что A = 1 и F = 0, после чего уравнения (34.46) решаются однозначно и
( k 2 − k12 )[exp (ik1a ) − exp ( −ik1a )]
B= ,
( k − k1 ) 2 exp (ik1a ) − ( k + k1 ) 2 exp ( −ik1a )
− 4kk1
E= ,
( k − k1 ) exp (ik1a ) − ( k + k1 ) 2 exp ( −ik1a )
2

k + k1 + ( k1 − k ) B k − k + (k + k1 )B
C= , D= 1 .
2k1 2k1
Из этих формул следует, что для отраженной и преломленной волн де Бройля
2
2 4( k 2 − k1 ) sin 2 k1a
B = ,
4( k 2 + k12 ) 2 sin 2 k1a + 16k 2 k12 cos2 k1a
2
2 16k 2 k1
E =
4( k 2 + k12 ) 2 sin 2 k1a + 16k 2 k12 cos2 k1a
и, следовательно, наряду с отраженными от барьера частицами существуют про-
ходящие через барьер частицы вне зависимости от того, больше или меньше энер-
гия частицы энергетической высоты V0 барьера. Это совершенно новое явление
«просачивания» или диффузии через энергетический барьер микрочастицы, не
имеющее классического аналога и противоречащее классике.
Атом водорода. Атом водорода – это электрон в центральном кулоновском
поле электрически положительного заряда ядра. Классическим аналогом описа-
ния атома водорода является известная нам проблема двух тел, решенная Ньюто-
ном. В классическом случае движение тела характеризуется тремя законами Кеп-
лера об эллиптичности орбиты, постоянстве секторной скорости и соотношении
периодов обращения и больших полуосей орбит. Для микрочастицы все не так:
34. Микрочастица 281

нет орбиты, энергия и импульс квантованы и одновременно заведомо не имеют


определенных значений. Как оказывается, возможные значения энергии
me 4 1
En = ( n = 1, 2, 3,... ) (34.47)
2h 2 n 2
зависят от целого числа n.
С математической точки зрения отыскание квантовых значений энергии En –
необычайно эффектное решение сложной и трудной задачи о собственных значе-
ниях и функциях линейного дифференциального оператора.
Столь же эффектно подтверждение получаемых результатов наблюдениями
частот спектральных линий атома водорода. Напомним, что частота ω испускае-
мого атомом фотона (волны де Бройля) при переходе электрона с энергетического
уровня En на Em определяется соотношением
hω = En – Em (n < m),
что приводит к наблюдаемым сериям спектральных линий Лаймана
ω1m =E1 – Em /h (m = 2, 3, 4, ...),
Бальмера
ω2m = (E2 – Em)/h (m = 3, 4, 5, ...),
Фитца – Пашена
ω3m = (E3 – Em)/h (m = 4, 5, 6, ...)
и другими.
Дальнейшей целью является изложение постановки задачи и описание ре-
зультатов ее решения для атомов водорода или водородоподобного иона с заря-
дом ядра z и одним электроном.
В рассматриваемом случае потенциальная энергия равна
me 4 1
En = 2 2 ( n = 1, 2, 3, ... ),
2h n
а уравнение Шредингера целесообразно записать в сферических координатах
0 ≤ r < ∞, 0 ≤ ϑ ≤ π, 0 ≤ ϕ < 2π:
∂ψ h2
− ih =− ∆ψ + V ( r ) ψ =
∂t 2m
h 2  1 ∂ 1  1 ∂  ∂  1 ∂ 2  
=−  +   sin ϑ  +   ψ + V (r )ψ .
2m  r 2 ∂r ( r 2 ∂ ∂r ) r 2  sin ϑ ∂ϑ  ∂ϑ  sin 2 ϑ ∂ϕ2  
Поиск стационарных решений этого уравнения Шредингера приводит к зада-
че о собственных функциях и значениях E.
Отыскание непрерывных конечных при всех r, ϑ и ϕ (включая r = ∞) решений
этого уравнения довольно сложная, красиво решаемая задача. Ее решение – ре-
зультат труда многих выдающихся ученых – сейчас излагается в учебниках по
квантовой механике и математической физике. Основные результаты этого иссле-
дования состоят в следующем. При E > 0 спектр непрерывен и соответствующие
собственные функции не обращаются в ноль на бесконечности. Это соответствует
282 Ю.И. Неймарк. Математическое моделирование как наука и искусство

возможности неограниченного ухода микрочастицы от ядра атома. Напротив, при


E < 0 спектр дискретен и соответствующие собственные функции в бесконечно-
сти зануляются, что означает, что электрон остается на конечном расстоянии от
ядра. Дискретные собственные значения равны
z 2me4 − 2
En = − n ( n = 1, 2, 3, ... ).
2h 2
Каждому из этих собственных значений отвечает конечное число собственных
функций вида
ψnlm = Rnl ( r )Ylm (ϑ, ψ ) (l = 0, 1, 2, ..., n − 1; m = 0, ± 1, ..., ± l ) .
Как уже отмечалось, это полностью соответствует наблюдаемым спектрам
атома водорода.
Квантовый линейный осциллятор. В предыдущих лекциях мы уделили
значительное внимание классическому линейному гармоническому осциллятору,
описываемому уравнением
m&x& + kx = 0
и функцией Гамильтона
p x2 mω2 x 2  2 k
H= +  p x = mx& , ω =  .
2m 2  m
Соответствующий квантовый осциллятор описывается уравнением Шредин-
гера:
∂ψ h 2 ∂ 2 ψ m ω2 2
ih =− + x ψ (ψ = ψ( x, t )) ,
∂t 2m ∂x 2 2
отыскание стационарных решений которого с энергией E приводит к уравнению
h 2 d 2 ψ m ω2 2
− + x ψ = Eψ .
2m dx 2 2
Найти его собственные значения и функции непросто. Это непростое реше-
ние дает, что
 1
En = hω n +  (n = 0, 1, 2, ...)
 2
и соответствующие нормированные собственные функции равны
1  x  x2 
ψn ( x ) = H n   exp  − 2  ,
x0  x0   2 x0 
где
2
h ( −1) n y2 d ne− y
x0 = , H n ( y) = e .
mω 2 n n! π dy n
Первые три функции ψ0 , ψ1 и ψ2 изображены на рис. 34.5.
Согласно сказанному, значения энергии эквидистантно квантованы, и мини-
мально возможная энергия больше нуля и равна hω/2. Никак не похожи и графики
|ψn|2 (см. рис. 34.5) на график вероятности обнаружения в случайный момент вре-
34. Микрочастица 283

мени классического осциллятора вместе с координатой x. Этот последний график


изображен на рис. 34.6.
_
ψ0
_
Рис. 34.5. Виды первых трех функций ψ ψ2 _
ψ1
для стационарных решений уравнения
Шредингера для квантового линейного
осциллятора

Рис. 34.6. Плотность вероятности величины x


классического линейного осциллятора. Вертикальные
асимптоты соответствуют экстремальным возможным
значениям x (x = ±a, где a – амплитуда колебаний).
(Ср. с рис. 34.5)
x
Квантовое уравнение Ньютона. Движение микрочастицы описывается из-
менением ее функции состояния и ни в коей мере не напоминает движение по
траектории. Ведь если известно место частицы, то неопределенна ее скорость, т.е.
нет траектории. Вместе с тем, быстро летящая микрочастица оставляет в пузырь-
ковой камере след от своего движения. Что же представляет собой этот след?
Дело в том, что в этом случае величины дисперсий координаты и скорости
(импульса) настолько малы, что след «случайного блуждания» от образования од-
ной капельки к другой все же представляется нам траекторией, поскольку он дос-
таточно тонок. Ширина этой «траектории» гигантских размеров по сравнению с
атомом, но в нашем масштабе макромира она тонкая.
Согласимся с тем, что все время неопределенности положения и скорости
очень малы, но почему же движение в целом соответствует нашим классическим
представлениям? На этот вопрос в свое время ответил П. Эренфест, обнаружив,
что для среднего значения <x> координаты x имеет место аналог уравнения Нью-
тона, который можно назвать квантовым уравнением Ньютона:
d2 ∂V ∂V (< x >)
m < x >= − ≈− .
dx 2
∂x ∂x
Вывод его не очень сложен, содержится в учебниках по квантовой механике и
опирается только на изложенные вам ранее положения модели микрочастицы.
Для макротел <x> неотличимо от x, поскольку дисперсия x очень мала.
284 Ю.И. Неймарк. Математическое моделирование как наука и искусство

35. ПРОСТРАНСТВО И ВРЕМЯ


В предыдущих лекциях рассматривалось много разных математических мо-
делей. Почти во всех них фигурировали пространственные переменные и время.
Что это такое, не объяснялось, их смысл казался самоочевидным. И. Кант считал
представления о пространстве и времени врожденными. Но оказалось, что они все
же требуют пояснений и заслуживают особого внимания, и пришло время заду-
маться над тем, что за пространственные переменные и время стоят в великих ма-
тематических моделях механики и физики, а, следовательно, и во всех математи-
ческих моделях, которые на них основаны. Обратите внимание: вопрос не о том,
что такое пространство и время вообще, вопрос конкретен: что за переменные
стоят в математических моделях естествознания и техники? И будет поставлен
еще конкретнее: как связаны между собой эти переменные в разных инерциаль-
ных системах, движущихся относительно друг друга с постоянными скоростями?
Ньютон считал, что существует выделенная абсолютная система отсчета. В
ней координаты измеряются принятым масштабом, а время – абсолютными часа-
ми, что существуют абсолютное пространство и абсолютное время.
Окружающее нас пространство еще Евклид подверг математическому изуче-
нию, результатом которого была евклидова геометрия и наше евклидово про-
странство. Однако уже Гаусс усомнился, что наше пространство евклидово и хо-
тел измерить углы большого треугольника, образованного вершинами гор. Если
бы сумма углов этого треугольника отличалась от π, то это свидетельствовало бы
о неевклидовости нашего пространства. Появившиеся затем геометрии Лобачев-
ского и Римана подвели теоретическую базу под эти сомнения Гаусса, но измере-
ния в масштабах Земли не дали достоверных уклонений от евклидовости.
Сомнения о характере геометрии нашего пространства зародились сравни-
тельно давно, но что казалось бесспорным, так это то, что пространство – это про-
странство, а время – это время, они как бы существуют раздельно сами по себе и
никак не связаны друг с другом. И вот именно это оказалось неверным. Выясни-
лось это в начале двадцатого века. Об этом и будет речь дальше. Выяснилось, что
нужно говорить не о трехмерном пространстве и одномерном времени, а о едином
четырехмерном пространственно-временном мире.
Координатные системы, в которых справедливы законы Ньютона, называют
инерциальными. Инерциальные системы – это системы, движущиеся относитель-
но друг друга с постоянной скоростью. Если направить оси Ox и O'x' вдоль этой
скорости относительного движения систем Oxyz и O'x'y'z', то координаты и время
одной и той же точки в этих разных системах отсчета будут связаны соотноше-
ниями:
x' = x – υ t, y' = y, z' = z, t' = t, (35.1)
получившими название преобразований Галилея. Факт справедливости уравнений
Ньютона во всех инерциальных системах и, в частности, в системах Oxyz и Ox'y'z'
означает, что уравнения Ньютона инвариантны (сохраняют свой вид) при перехо-
де от переменных x, y, z, t к x', y', z', t', согласно (35.1). Действительно, уравнения
35. Пространство и время 285

m&x& = Fx , m&y& = Fy , m&z& = Fz (35.2)


после замены переменных, согласно (35.1), переходят в такие же уравнения для x',
y', z' и t'. Обоснованность одинаковости сил Fx , Fy и Fz в обеих координатных сис-
темах можно видеть в том, что это так для взаимодействий, зависящих от рас-
стояний или величин деформаций упругих тел. Итак, уравнения Ньютона и все,
вытекающее из них, т.е. все уравнения механических систем, инвариантны по от-
ношению к преобразованиям Галилея. Эта инвариантность есть следствие спра-
ведливости законов Ньютона во всех инерциальных системах координат, связан-
ных между собою преобразованиями Галилея.
Теперь от механики перейдем к электродинамике. Весь наш опыт и специ-
ально поставленные эксперименты свидетельствуют, что уравнения Максвелла
имеют место в инерциальных системах, т.е. они тоже должны быть инвариантны
относительно преобразований Галилея. Не будем трогать всю систему уравнений
Максвелла. Ограничимся одним из ее следствий – волновым уравнением для пло-
ской электромагнитной волны, распространяющейся вдоль оси Ox и электриче-
ским полем, направленным по оси Oy. Такое уравнение имеет вид:
∂2E y 2 ∂2E y
=c . (35.3)
∂t 2 ∂x 2
Это волновое уравнение, записанное в системе Oxyz, после преобразований
Галилея (35.1) должно перейти опять-таки в волновое уравнение. Во что должно
перейти Ey, мы не знаем и не будем задумываться. Ясно, что оператор
∂2 2 ∂
2
− c (35.4)
∂t 2 ∂x 2
должен перейти в оператор
∂2 2 ∂
2
− c . (35.5)
∂t ′2 ∂x ′2
Первый из них зануляется на функции Ey(x, t), второй – на неизвестной нам
функции E'y'(x', t').
Непосредственно находим:
∂ ∂ ∂x ′ ∂ ∂t ′ ∂ ∂2 ∂2
= ⋅ + ⋅ = , → ,
∂x ∂x ′ ∂x ∂t ′ ∂x ∂x ′ ∂x 2 ∂x ′2
∂ ∂ ∂ x′ ∂ ∂t' ∂ ∂
= + = −υ + ,
∂t ∂ x ′ ∂ t ∂ t ' ∂ t ∂ x′ ∂t ′
∂2 ∂ 2 ∂x ′ ∂ 2 ∂t ′ ∂ 2 ∂x ′ ∂ 2 ∂t ′
= − υ − υ + + =
∂t 2 ∂x ′2 ∂t ∂x ′∂t ′ ∂t ∂t∂x ′ ∂t ∂t ′2 ∂t
∂2 ∂2 ∂2
= υ2 − 2 υ + ,
∂x ′2 ∂x ′∂t ′ ∂t ′2
и поэтому оператор (35.4) переходит после замены переменных (35.1) – преобра-
зования Галилея – в оператор
286 Ю.И. Неймарк. Математическое моделирование как наука и искусство

∂2 ∂2 2 2 ∂
2
− 2υ − (c − υ ) 2 , (35.6)
∂t ′2 ∂x ′∂t ′ ∂x ′
отличный от волнового оператора (35.5).
С одной стороны, это неожиданно и означает, что либо неверны утверждения
о справедливости уравнений Ньютона и Максвелла в инерциальных системах, ли-
бо неверно преобразование Галилея, и тогда неверны уравнения Ньютона, либо,
наконец, неверны уравнения Максвелла. Какую из этих трех возможностей вы-
брать?
С другой стороны, то, что оператор (35.4) не перешел при преобразовании
Галилея в такой же оператор (35.5), довольно очевидно: ведь система O'x'y'z' дви-
жется со скоростью υ относительно системы Oxyz, и поэтому при таком переходе
скорость c распространения электромагнитных волн должна измениться, должна
измениться и форма волны. Убедимся в этом, найдя гармонические волны
ei(ω t' – kx'), зануляющие оператор (35.6):
 ∂2 ∂2 2 2 ∂  i ( wt ′− kx ′)
2
 2 − 2 υ + ( υ − c ) e =
 ∂t ′ ∂x ′∂t ′ ∂x ′2 

= [ − w 2 − 2υwk − ( υ2 − c 2 )k 2 ]e i ( wt ' − kx ') = 0 ,


откуда
(ω + υk)2 = c2k2
или
ω/k = –υ ± c.
Это означает, что в системе Ox'y'z' при υ < c в одну сторону волна распро-
страняется со скоростью c – υ, а в другую – со скоростью –c – υ.
Для выяснения, разная ли скорость распространения света в разных инерци-
альных системах и зависит ли она от движения источника света, проводились
специальные очень точные и основательные опыты. Знаменитый опыт Майкель-
сона – Марли показал, что скорость света во всех системах одинакова и равна
c ≈ 300 000 км/с. Это говорит о том, что преобразования Галилея неверные и над-
лежит найти преобразование, которое сохраняет вид волнового оператора. Такие
преобразования впервые были написаны Лоренцем и названы его именем, но он
не связывал их с общей проблемой пространства и времени.
Преобразования Лоренца должны заменить преобразования Галилея и могут
подсказать, как уточняются уравнения Ньютона. Эти уточнения очень маленькие
– и в механических наблюдениях, и экспериментах с υ << c себя не проявляли.
Столь же незначительны отличия преобразований Лоренца от преобразова-
ний Галилея. Но при скоростях, близких к скорости света, достижимых в совре-
менных ускорителях и наблюдаемых у космических частиц, не учитывать их уже
нельзя.
Напишем знаменитые уравнения Лоренца:
x − υt t − υx / c 2
x′ = , y = y′ , z = z′ , t′ = (35.7)
1 − υ2 / c 2 1 − υ2 / c 2
35. Пространство и время 287

и перейдем к их выводу. Он не очень сложен. Сложнее понять и осмыслить, что


из них следует. Некоторые простейшие следствия мы рассмотрим, а сейчас только
отметим, что одно и то же событие, происходящее в некоторой точке и какой-то
момент времени, имеет в разных инерциальных системах не только различные
координаты, но и времена. Два события, одновременные в одной инерциальной
системе, не одновременны в другой и различие в их временах зависит как от их
относительной скорости υ, так и удаленности r мест, в которых они происходят.
Действительно, пусть в одно и то же время t произошли события в точках x и
x + r. Это в одной системе отсчета. Назовем ее K. Тогда в другой K', движущейся
относительно K со скоростью υ, они произошли во времена
t − υx / c 2 t − υ( x + r ) / c 2
t1′ = и t2′ = ,
1 − υ2 / c 2 1 − υ2 / c 2
различающиеся на величину
υr
t1′ − t2′ = .
1 − υ2 / c 2
Мы выведем уравнения Лоренца (35.7) из свойств однородности и изотроп-
ности пространства, однородности времени и инвариантности волнового операто-
ра – постоянства скорости распространения электромагнитных волн – во всех
инерциальных системах. Как показал А. Пуанкаре, по отношению к преобразова-
ниям Лоренца инвариантно не только следующее из уравнений Максвелла волно-
вое уравнение, но и сами уравнения Максвелла.
Будем исходить из общего вида связи координат и времени x, t и x', t' одного
и того же события в разных инерциальных системах координат K и K', движущих-
ся относительно друг друга с постоянной скоростью υ: система K' относительно K
(ее начало координат) со скоростью υ, а система K относительно K' со скоростью
–υ. Движение их относительно друг друга происходит вдоль совпадающих осей
Ox и O'x' (рис. 35.1). В момент времени t = t' = 0 начала координат O и O' обеих
систем совпадают. Будем исходить из общего вида связей координат и времени
систем K и K', удовлетворяющего условиям однородности и изотропности про-
странства и однородности времени:
x' = ax + bt, y' = y, z' = z, t' = αx + βt, (35.8)
точнее, попробуем удовлетворить всем вышесформулированным условиям, исхо-
дя из такого вида преобразований, подбирая параметры a, b, α и β. Преобразова-
ние Галилея соответствует a = 1, b = –υ, α = 0, β = 1, и, как мы уже знаем, оно не
подходит, поскольку требованиям однородности и изотропности удовлетворяет, а
волновой оператор не сохраняет. Итак, нам надлежит найти значения четырех па-
раметров a, b, α и β.
y y'
K'
Рис. 35.1. Две инерциальные системы K и K', K
движущиеся относительно друг друга
O O'
с постоянной скоростью вдоль оси Ox,
совпадающей с O'x' x x'
z z'
288 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Начнем с требования сохранения волнового оператора. Повторяя уже знако-


мые вам вычисления, получим:
∂2 2 ∂
2
∂2 2 ∂
2
= a + 2 a α + α ,
∂x 2 ∂x ′2 ∂x ′∂t ′ ∂t ′2
∂2 2 ∂
2
∂2 2 ∂
2
= b + 2 b β + β ,
∂t 2 ∂x ′2 ∂x ′∂t ′ ∂t ′2
и поэтому при замене переменных (35.8) волновой оператор (35.4) переходит в
оператор
∂2 2 ∂
2
2 2 2 ∂
2
2 ∂2 2 2 2 ∂
2
− c = ( b − c a ) + ( 2 b β − 2 a αc ) + (β − c α ) .
∂t 2 ∂x 2 ∂x ′2 ∂x ′∂t ′ ∂t ′2
Преобразованное к новым переменным волновое уравнение, отвечающее опе-
ратору (35.4), будет совпадать с волновым уравнением, соответствующим опера-
тору (35.5), если их операторы различаются множителем, т.е. при выполнении ус-
ловий
b 2 − c 2 a 2 2(bβ − aαc 2 ) β 2 − c 2 α 2
= = ,
− c2 0 1
которые влекут два условия:
bβ – aαc2 = 0, c2a2 – b2 = c2(β2 – c2α2). (35.9)
Два условия на параметры a, b, α и β следуют из того, что начало координат
O' движется относительно O со скоростью υ, а O относительно O' − со скоростью
–υ. Точка O' имеет в системе K' координату x' = 0. Поэтому ax + bt = 0, где x – ее
координата в системе K спустя время t, т.е. скорость движения точки O' в системе
K равна υ = –b/a. Аналогично точка O в системе K' имеет координату x' = bt в мо-
мент времени t' = βt. Поэтому ее скорость в системе K' равна b/β, что ведет к еще
одному соотношению bβ = –υ.
Таким образом, к двум соотношениям (35.9) добавляются еще два:
–b/a = υ, b/β = –υ. (35.10)
Как оказывается, эти четыре соотношения зависимые и не позволяют найти
все четыре параметра. Но их все можно выразить через один, например a:

b = –aυ, β = a, α = − 2 . (35.11)
c
В соответствии с этими соотношениями (35.11) искомое преобразование
(35.8) записывается в виде:

x′ = ax – aυt, t ′ = − 2 x ′ + at . (35.12)
c
Смотря на (35.12), есть соблазн положить υ = 0 и найти, что a = 1. Это верно,
но только в том смысле, что при υ = 0 a = 1. А что будет при других υ ≠ 0?
Используем изотропность пространства и то, что переход от системы K' к K
должен иметь такой же вид (35.12), но с заменой υ на –υ. В соответствии с этим
разрешим уравнения (35.12) относительно x, t и найдем
35. Пространство и время 289

x′ + υ t ′ x ′υ/ c 2 + t ′
x= , t= . (35.13)
a (1 − υ 2 / c 2 ) a (1 − υ 2 / c 2 )
Преобразование (35.12) должно совпадать с (35.13), если в последнем υ заме-
нить на –υ, а x', t' заменить на x, t и обратно − x, t на x', t'. Одинаковость влечет ус-
ловия:
1 υ aυ υ/ c 2
a= , aυ = , = ,
a (1 − υ 2 / c 2 ) a (1 − υ 2 / c 2 ) c 2 a (1 − υ 2 / c 2 )
которые сводятся к одному
 υ2 
a 2 1 − 2  = 1 .
 c 
Отсюда
−1 / 2
 υ2 
a = ±1 − 2  .
 c 
Но мы уже знаем, что при υ = 0 a = 1. Поэтому a = (1 − υ 2 / c 2 ) −1 / 2 и преобра-
зование (35.8) оказывается имеющим вид уже написанных ранее преобразований
Лоренца (35.7).
Перепишем его и обратное ему, используя сокращенное обозначение
γ(υ2) = (1 – υ/c2)–1/2, в виде
 υ 
x' = γ(υ2)(x – υt), t ′ = γ ( υ2 ) t − 2 x  (35.14)
 c 
и
 υ 
x = γ(υ2)(x' +υt' ), t ′ = γ ( υ2 ) t + 2 x  . (35.15)
 c 
Напомним, что υ – скорость движения системы K' по отношению к K или, что
то же, –υ – скорость движения системы K по отношению к системе K'.
Еще раз обратим внимание, что из преобразований Лоренца следует, что одно
и то же событие – нечто происходящее в каком-то месте и в какое-то время – име-
ет в разных инерциальных системах отсчета не только разные координаты, что
нам привычно, но и разные времена. Действительно, пусть в системе отсчета K
событие произошло в точке x в момент t. Тогда, согласно (35.7), в системе K' оно
имело место в точке x' = γ(υ2)(x – υt) в момент t' = γ(υ2)(t –υx)/c2. Это означает, что
абсолютного времени, как и координат, нет. Каждая инерциальная система имеет
свой отсчет места и свои часы.
Теперь уже не столь неожиданно и понятно, что события, одновременные в
одной системе, не одновременны в другой. Понятие одновременности не абсо-
лютное, а относительное, так как в каждой системе отсчета свои часы. Эти часы
соотносятся друг с другом очень странно: часы системы K' по отношению к часам
системы K отстают, но и часы системы K, наблюдаемые в системе K', так же от-
стают. Этот вывод, естественный с точки зрения логики, учитывающей симмет-
рию систем K и K', совершенно неприемлем с точки зрения нашей привычной
оценки хода разных часов.
290 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Будем наблюдать из системы K часы системы K', находящиеся в точке x', в те-
чение времени τ по часам системы K, т.е. от момента t1 до t2, где t2 – t1 = τ. Отве-
чающие этим временам t1 и t2 показания часов системы K', которые находятся в
точке x', пусть t1′ и t2′ . Тогда, согласно второму из уравнений (35.15),
 υx ′   υx ′ 
t1 = γ ( υ2 )  t1′ + 2  , t2 = γ ( υ 2 )  t2 ′ + 2 
 c   c 
и, следовательно,
τ = t2 – t1 = γ (υ2) (t2′ − t1′ ) = γ ( υ2 ) τ′, (35.16)
т.е. часы системы K' в системе K идут медленнее в γ–1(υ2) раз. Аналогично часы в
системе K по часам системы K' также идут настолько же медленнее. Замедление
хода движущихся часов по отношению к неподвижным имеет прямые экспери-
ментальные подтверждения. Такое подтверждение дают измерения длительности
жизни коротко живущих микрочастиц, летящих с большими скоростями. Быстро
движущаяся частица в неподвижных часах живет дольше, и это удлинение време-
ни жизни согласуется с тем, которое следует из преобразований Лоренца, т.е.
больше в γ(υ2) раза. Время жизни летящей частицы – это время в часах коорди-
натной системы, движущейся вместе с частицей. Такое время называют собствен-
ным временем частицы. Из равноправия всех инерциальных систем собственное
время жизни частицы не зависит от ее скорости движения, оно во всех инерци-
альных системах одно и то же.
Некоторое подтверждение имеется и для часов, путешествующих на искусст-
венном спутнике, по отношению к земным часам путешествующие часы отстают.
Вместе с тем из этого подтвержденного экспериментом факта замедления
движущихся часов вытекает широко обсуждаемый в свое время парадокс близне-
цов. Он состоит в том, что из двух родившихся близнецов одного оставили на
Земле, а другого отправили на космическом корабле со скоростью, близкой к ско-
рости света. Тогда по возвращении на Землю, путешествующий близнец может
быть юношей, а оставшийся на Земле – стариком. Физики считают, что так и бу-
дет. Но парадокс в том, что можно то же самое рассуждение провести с точки
зрения путешествующего близнеца, по отношению к которому путешествовал
близнец, оставшийся на Земле, и поэтому он должен быть стариком, а близнец на
Земле – юношей. Этот парадокс разрешается тем, что полной симметрии между
близнецами нет: путешествующий близнец тормозил и, повернув обратно, разго-
нялся и что происходит при этом с его собственными часами, наша теория ответа
не дает. Близнец же на Земле ничего такого не делал.
Рассмотрим теперь другое явление сокращения размеров движущегося отрез-
ка. Пусть в системе K' вдоль оси O'x' расположен отрезок [ x1′ , x2′ ] длины l' = x2′ –
− x1′ . Длину l' он имеет в масштабе системы K'. Этот отрезок, назовем его L', дви-
жется со скоростью υ относительно системы K. Примем следующую естествен-
ную процедуру измерения его длины в системе K.
Засечем в системе K координаты x1 и x2 концов отрезка L' в какой-нибудь
один и тот же для обоих концов момент времени t в системе K. За его длину в сис-
теме K примем величину l = x2 – x1. Найдем соотношение между l и l′.
35. Пространство и время 291

Согласно первому соотношению (35.15) и второму (35.14), имеем:


x1 = γ(υ2)( x1′ + υ t1′ ), x2 = γ(υ2)( x2′ + υ t2′ ),
 υ   υ 
t1′ = γ ( υ 2 )  t − 2 x1  , t2′ = γ ( υ 2 )  t − 2 x 2  ,
 c   c 
откуда
l = x2 – x1 = γ(υ2) [ x2′ − x1′ + υ(t2′ − t1′ )] =
 υ2   υ2 
= γ ( υ 2 ) l ′ − γ ( υ 2 ) 2 ( x2 − x1 ) = γ ( υ 2 ) l ′ − γ ( υ 2 ) 2 l 
 c   c 
и поэтому
 υ2 
 1 + γ 2 2  l = γ ( υ 2 )l ′
 c 

или
l = γ–1(υ2) l'. (35.17)
Это последнее соотношение означает, что при измерении в системе K отрезка
длины l' системы K' происходит его уменьшение в γ–1(υ2) раз.
Предыдущие следствия из преобразований Лоренца поясняли нам особенно-
сти физического пространства и времени. Конечно, это одновременно и то про-
странство и время, в котором мы живем, но чтобы их обнаружить, мы должны
иметь дело со скоростями порядка скорости света или обладать способностью ре-
гистрировать ничтожные по величине эффекты.
Следующим неожиданным, но тоже для скоростей, много меньших скорости
света, едва заметным эффектом является неверность правила сложения перенос-
ной и относительной скоростей. В свое время мы вывели формулу разгона ракеты
и установили, что с неограниченным уменьшением ее массы она неограниченно
увеличивает свою скорость. Этот вывод следовал из того, что с каждым выбросом
массы dm со скоростью c относительно ракеты она получала приращение в скоро-
сти, равное c dm/m. Это было приращение скорости ракеты в системе отсчета, свя-
занной с ракетой. Из преобразований Лоренца следует, что в системе отсчета, свя-
занной с Землей, с которой она запущена, ракета такого приращения скорости не
получит, оно будет меньше, и за счет этого уменьшения скорость ракеты не мо-
жет превзойти скорость света, но может приблизиться к ней.
Итак, пусть система K' движется, как и ранее, относительно системы K со ско-
ростью υ, и в системе K' относительно нее движется точка со скоростью u'. Тогда
скорость u этой же точки относительно системы K будет υ + u'. Это по классиче-
ским представлениям о пространстве и времени. В механике скорость υ называет-
ся переносной, а u' – относительной, движение точки в системе K – абсолютным, а
движение этой же точки в системе K' – относительным. В этой терминологии аб-
солютная скорость равна сумме переносной и относительной. Посмотрим, что бу-
дет при наших новых воззрениях на пространство и время. Пусть движущаяся
точка M в системах K и K' находится в точках x и x' в моменты времени t и t'. Те-
перь t не обязано совпадать с t'. Значения x, t и x', t' связаны между собой преобра-
зованиями Лоренца (35.14) и (35.15). Первое из них дает переход от системы
292 Ю.И. Неймарк. Математическое моделирование как наука и искусство

K к K', а второе, наоборот, – от K' к K. Система K' движется относительно K со


скоростью υ, и точка M в системе K' движется со скоростью u' = dx'/dt'. Скорость
этой же точки M в системе K равна u = dx/dt. Нам надлежит найти связь между
этими скоростями u и u', зная, что x, t и x', t' связаны соотношениями (35.14) и
(35.15). Непосредственно имеем:
dx d {γ ( υ 2 )( x ′ + υt ′)} dx ′ + υdt ′ u′ + υ
u= = = = .
dt d {γ ( υ )(t ′ + υx ′/ c )} dt ′ + ( υ/ c )dx ′ 1 + υu ′ / c 2
2 2 2

Таким образом, действительно скорости υ и u' не складываются. Имеет место


более сложная зависимость
υ + u′
u= , (35.18)
1 + u ′υ/ c 2
которая при υ << c и u′ << c близка к простому сложению, но при υ = c и u' = c
u = c, а не 2c, и отличие весьма велико.
Можно заметить, что при υ < c и u' < c и поэтому любое число прибавок к
скорости ракеты скоростей, меньших скорости света, никогда не позволяет ей
превзойти скорость света.
Естественным следствием изменений представлений о пространстве и време-
ни является их объединение, необходимость их совместного рассмотрения. Ранее
были отдельно трехмерное пространство и одномерное время, теперь четырех-
мерное пространство пространства и времени. Точками этого четырехмерного
пространства являются события. В разных системах отсчета одно и то же событие
описывается по-разному в системе Kx, y, z, t, и в системе K'x', y', z', t', причем, мо-
гут отличаться друг от друга не только x и x', y и y', z и z', но и t и t'. Преобразова-
ния Лоренца представляют некоторый частный случай, когда оси систем K и K'
параллельны и движутся относительно друг друга вдоль оси Ox, совпадающей с
~ ~
O'x'. К этому частному случаю сводятся любые две системы K и K ′ , движущиеся
~
друг относительно друга с постоянной скоростью, так как переход от K к K, как и
~
от K ′ к K' – это некоторые переходы от одной пространственной системы к дру-
~ ~
гой, и переход от K к K ′ можно представить как последовательность переходов
~ ~
от K к K, от K к K' и от K' к K ′ (рис. 35.2).
~
~ K′
K Рис. 35.2. Последовательные переходы
от одной инерциальной системы к другой:
K K' ~ ~
системы K , K и K′, K' неподвижны
относительно друг друга; K и K′ движутся
относительно друг друга с постоянной
z z' скоростью

При преобразованиях координат, связанных с переходом от одной системы к


другой, неподвижной относительно нее, сохраняются расстояния
dr2 = dx2 + dy2 + dz2. (35.19)
Оказывается, аналогично этому в четырехмерном пространстве-времени сохраня-
ется величина
35. Пространство и время 293

ds2 = dx2 + dy2 + dz2 – c2dt2. (35.20)


Для того чтобы в этом убедиться, достаточно показать, что это имеет место
при преобразованиях Лоренца (35.15) от системы K к K', так как при преобразова-
~ ~
ниях от системы K к K и от K' к K ′ это очевидно имеет место. Непосредственно
используя (35.15), находим
dx 2 + dy 2 + dz 2 − c 2 dt 2 =
2
2   υ  
= [d ( γ ( υ )( x ′ + υ t ′))] + dy ′ + dz ′ − c d  γ ( υ 2 ) t ′ + 2 x ′   =
2 2 2 2

   c  
= γ 2 ( υ)( dx ′2 + 2υdx ′dt ′ + υ2 dt ′2 ) + dy ′2 + dz ′2 −
 2 υ υ2 
− c γ ( υ)  dt + 2 2 dt dx + 4 dx ′2  = dx ′2 + dy ′2 + dz ′2 − c 2 dt ′2 .
2 2
 ′ ′ ′
 c c 
Итак,
ds2 = ds' 2. (35.21)
Величину ds можно назвать расстоянием в четырехмерном пространстве со-
~
бытий. Преобразования, связанные с переходом от одной системы K к другой
~
K ′ , его сохраняют и являются в этом смысле аналогами движений в трехмерном
пространстве. Эту аналогию можно сделать явной, если время t заменить на iτ/c и,
соответственно, υ на –icυ. При этом квадратичная форма ds2 примет вид:
ds2 = dx2 + dy2 + dz2 + dτ2, (35.22)
а преобразование Лоренца окажется вида:
x + υr r − υx
x′ = , r′ = ,
1 + υ2 1 + υ2
или, полагая (1 + υ2)–1/2 = cos θ и соответственно υ(1 + υ2)–1/2 = sin θ в виде:
x' = x cos θ + τ sin θ, τ' = –x sin θ + τ cos θ, (35.23)
представляющем собою переход от системы Oxτ к системе Ox'τ', повернутой от-
носительно нее на угол θ (рис. 35.3).
τ
τ'
τ
x'
Рис. 35.3. Геометрическая интерпретация
x'
преобразования Лоренца τ'
θ
0 x x
Таким образом, переход от одной инерциальной системы к другой можно
представить как обычное преобразование в евклидовом пространстве от одной
ортогональной системы координат к другой.
В связи с инвариантностью ds2, выражаемой (35.21), мне хотелось бы сказать
несколько слов о причинности в новом пространственно-временном мире. Спро-
сим себя, какие события S1(x1, y1, z1, t1) и S2(x2, y2, z2, t2) в разных точках (x1, y1, z1, t1)
294 Ю.И. Неймарк. Математическое моделирование как наука и искусство

и (x2, y2, z2, t2) и в разные времена t1 и t2 могут быть причинно связаны, и какие –
нет? Согласно самому смыслу принципа причинности, событие S2 может быть
следствием события S1 только в случае t2 ≥ t1. При обратном неравенстве это не-
возможно. При переходе от одной инерциальной системы к другой времена t2 и t1
могут изменяться и может нарушаться неравенство t2 ≥ t1. Величина
ds2 = (x2 – x1)2 + (y2 – y1)2 + (z2 – z1)2 – c2(t2 – t1)2
при переходе от одной инерциальной системы к другой не меняется, поэтому, ес-
ли ds2 < 0, то t2 – t1 не может обратиться в нуль, и первоначальное неравенство
t2 > t1 сохраняется. Следовательно, наличие причинной связи между такими собы-
тиями может иметь место во всех системах отсчета. Этот случай характеризуется
тем, что время прохождения светом расстояния
r = [(x2 – x1)2 + (y2 – y1)2 + (z2 – z1)2]1/2
меньше t2 – t1 . Напротив, при ds2 > 0 это время больше, чем |t2 – t1|. При этом с пе-
реходом к другой системе отсчета t2 – t1 может сменить знак, т.е. такие события не
могут быть причинно связанными. Невозможность причинной связи между собы-
тиями, для которых ds2 > 0, следует еще и из того, что действие, устанавливающее
эту причинную связь, должно было бы распространяться быстрее скорости света.
Тем самым мы приходим к выводу, что дальнодействие противоречит соблюде-
нию принципа причинности во всех инерциальных системах. Уравнения Мак-
свелла устранили мгновенность кулоновского взаимодействия электрических за-
рядов, то же сделала современная теория гравитации и гравитационных волн с
ньютоновским взаимодействием масс. Ни то, ни другое не может осуществляться
быстрее скорости света.
Таким образом, принцип причинности сохраняется и в отсутствии абсолют-
ного времени.
Уравнения Максвелла инвариантны по отношению к преобразованиям Ло-
ренца и не инвариантны по отношению к преобразованиям Галилея. Уравнения
Ньютона, наоборот, инвариантны по отношению к преобразованиям Галилея и не
инвариантны по отношению к преобразованиям Лоренца. Различия преобразова-
ний Галилея и Лоренца порядка υ2/c2 и очень малы для скоростей, наблюдаемых
во времена Ньютона механических систем. Сегодня это уже не так. Наблюдаемые
космические частицы имеют скорости, близкие к скорости света c, так же уже
сравнимы со скоростью света скорости частиц современных мощных ускорите-
лей. Наблюдения за их движением обнаруживают расхождения с уравнениями
Ньютона. Уравнения Ньютона нужно подправить так, чтобы они оставались спра-
ведливыми и при больших скоростях υ. Выяснить, каковы эти поправки, можно,
исходя из требования их инвариантности по отношению к преобразованию Ло-
ренца. Опуская все рассуждения, подведем окончательный итог.
Уравнение
dp
=F,
dt
где p – количество движения или импульс, сохраняется, но сам импульс, ранее
равный m υ , теперь равен
35. Пространство и время 295

m0 υ
p= ,
1 − υ2 / c 2
где m0 –так называемая масса покоя. Полная энергия E частицы равна
m0 c 2
E= ,
1 − υ2 / c 2
а энергия покоя E0 и кинетическая энергия T соответственно равны
E0 = m0 c 2 , T = E − E0 ,
причем кинетическая энергия T
m0υ 2 3 υ 4
T = E − E0 = + m0 2 + ... ,
2 8 c
и при υ << c близка к ее классическому значению mυ2/2.
Таким образом, изменения, произошедшие с уравнением Ньютона, сводятся к
тому, что масса m заменяется на массу
m0  1 υ2 
m= = m0 1 + 2
+ ...  ,
1 − υ2 / c 2  2c 
зависящую от скорости и отличающуюся от прежней массы на величину порядка
υ2/c2. Механика Ньютона, уточненная применительно к большим скоростям дви-
жущихся тел, получила наименование релятивистской механики. Быстро движу-
щаяся частица со скоростью порядка скорости света названа релятивистской час-
тицей.
296 Ю.И. Неймарк. Математическое моделирование как наука и искусство

36. РАЗГОН РЕЛЯТИВИСТСКИХ ЧАСТИЦ В ЦИКЛОТРОНЕ


Циклотрон – устройство для получения пучков заряженных частиц с очень
большими скоростями, приближающимися к предельной скорости света. Идея
циклотрона очень проста. Заряженная частица в однородном постоянном магнит-
ном поле, имеющая начальную скорость, перпендикулярную к нему, движется по
окружности с частотой ω в классическом приближении, не зависящей от ее скоро-
сти. Независимость ее частоты вращения от скорости позволяет осуществить ре-
зонансный разгон частицы переменным электрическим полем постоянной часто-
ты ω. Реально разгон заряженной частицы производится не на всем ее пути, а
только при прохождении ею узкой щели с разностью напряжений Vsin ωt
(рис. 36.1). Пересекая щель в момент t, частица заряда e получает дополнительную
энергию eV sin ωt. Совершив пол-оборота за время π/ω, она снова пересекает щель
и снова получает добавок энергии, равный –eV sin (ωt + π) = eV sin ωt. Этот разгон
при eVsin ωt > 0 мог бы продолжаться до тех пор, пока излучение частицы и поте-
ри энергии при ее движении не сравняются с величиной подкачиваемой энергии и
не возникнет вращение с постоянной скоростью. Но этому мешает релятивист-
ский эффект увеличения массы частицы с ростом скорости и следующее из него
замедление угловой скорости. При этом условия резонанса нарушаются, резко па-
дает подкачка энергии и прекращается дальнейший разгон частицы.
H

V sin ωt Рис. 36.1. Принципиальная схема


циклотрона
e

Такова вкратце идея разгона частицы в циклотроне и проблема, возникающая


при ее реализации, если мы хотим достичь скоростей, приближающихся к скоро-
сти света.
Поиск пути преодоления этой трудности естественно сопроводить построе-
нием и исследованием математической модели циклотрона, сосредоточив свое
внимание только на механизме резонансного разгона заряженной частицы с уче-
том релятивистских эффектов.
Начнем с выяснения зависимости частоты вращения частицы от ее заряда e,
массы m и величины магнитного поля H. На движущуюся со скоростью υ пер-
пендикулярно магнитному полю заряженную частицу действует сила Лоренца,
равная по величине e υ H/c. Эта сила, перпендикулярная магнитному полю и ско-
рости движения частицы, не меняя величины ее скорости, создает центростреми-
тельное ускорение, соответствующее движению частицы по окружности некото-
рого радиуса R с частотой ν, так что
eυH
R ν 2 = υν =
mc
36. Разгон релятивистских частиц в циклотроне 297

или
eH
ν=. (36.1)
mc
Конечно, к такому же результату можно прийти непосредственно из уравне-
ния Ньютона с учетом зависимости массы от скорости υ
−1 2
d e  υ2 
( m υ ) = [ υ, H ], m = m0 1 − 2  , (36.2)
dt c  c 
предполагая, что начальная скорость υ ортогональна постоянному однородному
магнитному полю H . В формулах (36.1) и (36.2) масса m зависит от скорости.
Учитывая, что энергия E частицы равна mc2, соотношение (36.1) можно записать в
виде
eHc
ν= , (36.3)
E
явно обнаруживающем зависимость частоты ν от скорости движения υ. В класси-
ческом приближении, когда m постоянно, этой зависимости нет. Таким образом,
если мы хотим сохранить равенство ω = ν при изменении скорости частицы υ ,
необходимо соответствующим образом менять частоту ω или величину магнитно-
го поля H. Искусственное осуществление этих связей затруднительно, но, оказы-
вается, нелинейные эффекты резонансного разгона позволяют реализовать необ-
ходимую связь между ω и H автоматически. Эта возможность следует из матема-
тической модели, построение которой мы продолжим.
Пусть E и E – значения энергии одной и той же частицы после следующих
друг за другом проходах ею через щель, тогда
E = E − f ( E ) + eV sin ωt , (36.4)
где t – момент времени прохода частицей через щель, после которого ее энергия
равна E , f (E) – потери энергии частицы при движении между проходами через
щели, а ω (считаемая постоянной) – частота изменения напряжения в щели: пре-
небрежимо малой ширины. Далее напишем соотношение между временем t и
временем t следующего прохода через щель
~
E
t =t+π . (36.5)
eHc
Если бы от момента t до t энергия частицы оставалась постоянной, то в фор-
~
муле (36.5) E совпадало бы с E . Но при движении от щели к щели она несколько
уменьшает свою энергию, как уже было принято в формуле (36.4), на величину
f ( E ). Поэтому естественно приближенно принять, что
~
E = E –1/2 f ( E ).
Величины подкачки энергии при проходах щели в моменты времени t и t со-
ответственно будут eV sin ωt и –eV sin ω t = eV sin (ω t + π). Для осуществления ре-
зонансного разгона надо, чтобы для некоторого целого n > 0 имело место
ω t = ω t + ( 2n − 1) π . (36.6)
298 Ю.И. Неймарк. Математическое моделирование как наука и искусство

В простейшем случае n = 1, мы им ограничимся. Соотношение (36.6) означа-


ет, что фазы гармонически колеблющегося напряжения ϕ = ωt и ϕ = ω t + π в ще-
лях в моменты прохода через них частицы совпадают – различаются на целое
число 2π.
~
Из этого требования (36.6) при n = 1, согласно (36.5) и принятой величине E ,
следует, что
1 1
E − f ( E ) = eHc. (36.7)
2 ω
Условие (36.7) определяет энергию частицы E*, как корень уравнения (36.7).
Далее из (36.4) при E = E приходим к соотношению
f ( E ∗ ) = eV sin ωt , (36.8)
выполнение которого возможно только при
f ( E ∗ ) < eV . (36.9)
При выполнении условия (36.9) уравнение (36.8) имеет два решения:
0 < t1* < π 2 и π 2 < t2* = π − t1* < π . Найденным значениям E*, t1* и E*, t2* отвечают
стационарные движения заряженной частицы, при которых последовательные
значения энергии частицы E и E и, соответственно, фаз ϕ и ϕ совпадают и рав-
ны E* и ϕ1* или ϕ*2 (фазы совпадают, если различаются на целое число 2π). В этих
стационарных состояниях заряженная частица движется периодически с частотой
v = ω, т.е. имеет место резонанс.
Согласно уравнению (36.7), определяющему энергию E* частицы в стацио-
нарном движении, она растет с увеличением магнитного поля H, но только до тех
пор, пока выполняется условие существования стационарного режима (36.9), по-
скольку потери на движение частицы не могут в стационарном режиме превосхо-
дить максимально возможную ее подкачку со стороны электрического поля в ще-
ли.
Для того, чтобы стационарный режим и эта зависимость E* от H могли реали-
зоваться, стационарный режим должен быть устойчивым. Это условие не только
необходимое, но и достаточное при достаточно медленном квазистационарном
изменении H. Итак, мы пришли к необходимости исследовать устойчивость най-
денных стационарных движений.
Пусть dE и dt – малые возмущения стационарных значений E* и ϕ*, а dE и dt –
отвечающие им изменения значений E и t при следующем проходе частицей щели.
Согласно (36.4) и (36.5), находим, что
dE = dE − f ′( E ∗ ) dE + eVω cos ωt ∗ dt,
π  1 ∗  (36.10)
dt = dt +  dE − f ′( E ) dE  .
eHc  2 
Полагая d E = z dE и d t = z dt, приходим к характеристическому уравнению
36. Разгон релятивистских частиц в циклотроне 299

1 − f ′( E ∗ ) − z eVω cos ωt ∗
ξ=  1 ∗  π =0
1
 2− f ′( E )  eHc z 1 − z

или
  1  πVω 
z 2 +  − 2 + f ′ − 1 − f ′  cos ω t∗  z + 1 − f ′ = 0 , (36.11)
  2  Hc 
определяющему возможные значения z.
Условия устойчивости состоят в том, чтобы оба корня уравнения (36.11) бы-
ли по модулю меньше единицы. Для этого коэффициенты характеристического
уравнения (36.11) τ и v при первой и нулевой степенях z должны удовлетворять
неравенствам
v < 1, 1 – τ + v > 0, 1 + τ + v > 0.
Соответствующая подстановка приводит к неравенствам:
1 − f ′( E ∗ ) < 1 ,
 1  πVω
1 + 2 − f ′ + 1 − f ′  cos ω t∗+ 1 − f ′ > 0 ,
 2  Hc
 1  πVω
1 − 2 + f ′ − 1 − f ′  cos ω t∗+ 1 − f ′ > 0 .
 2  Hc
Первое и второе неравенства выполняются в силу положительности f ′ и ма-
лости f ′ и πωV/Hc, последнее неравенство приводит к условию
cos ωt* < 0,
которое определяет, какой их двух возможных стационарных режимов устойчив.
Этот устойчивый стационарный режим группирует частицы и позволяет, медлен-
но увеличивая H, наращивать их энергию. При приближении Eкр к критическому
предельному значению, определяемому уравнением f (Eкр) = eV, происходит на-
рушение устойчивости и срыв квазистационарного разгона.
Идея изложенного выше способа разгона релятивистских заряженных частиц
впервые была выдвинута В.И. Векслером в 1944 году, а изложенное теоретиче-
ское исследование принадлежит А.А. Андронову и Г.С. Горелику (1945 г.) [1]. Ос-
новной результат исследования они представили в виде резонансной кривой со
скосом и явлением гистерезиса, характерными для нелинейного резонанса.
300 Ю.И. Неймарк. Математическое моделирование как наука и искусство

37. МАТЕМАТИКА КАК ЯЗЫК,


КАК ОПЕРАЦИОННАЯ СИСТЕМА И МОДЕЛИ
В этой главе речь пойдет о том, что такое математика, как она устроена, и по-
чему так огромна и решающа ее роль в точном естествознании и точной науке. Но
все это уже после того, как вы познакомились со многими математическими мо-
делями и увидели, как с их помощью познается окружающий мир, подчас на ос-
нове очень простых моделей и простых методов их исследования.
Так что такое математика, точнее, что такое математика функционально, в
чем ее роль и значение? Ответ на этот вопрос уже был дан во введении: матема-
тика – это язык, по своему назначению и роли, т.е. функционально, во многом та-
кой же, как обычные языки: русский, английский, немецкий, французский и дру-
гие. Еще Галилей сказал: «Великая книга природы написана математическими
символами». Из этого следует, что только тот, кто знает и владеет этим символи-
ческим языком, может надеяться читать книгу природы и понимать окружающий
его мир: природу, технику и общество. Позднее эта же мысль весьма лаконично
была выражена великим физиком В. Гиббсом в его реплике: «Математика тоже
язык», и поэтому ее роль столь же велика в изучении окружающего мира, как и
обычных языков, в обыденной жизни. С этим нельзя не согласиться, в общем, это
так, но все же язык математики чем-то особенный, и вот об этой его особенности
и пойдет речь ниже.
Обычный язык – это словарь и звуковые, и графические способы кодирова-
ния слов, грамматика, всевозможные фразы и их наборы в виде описаний, сооб-
щений, приказаний, рассказов, инструкций, повестей, романов, ... Нечто похожее
есть и в математическом языке. Аналоги слов и грамматики, определяющей пра-
вила их сочетания, можно видеть в числах, векторах, матрицах, функциях и дей-
ствиях с ними: сложении, вычитании, умножении, делении, дифференцировании,
интегрировании, ..., а аналог словесных описаний – в математических моделях.
Аналогия словесных описаний с математическими моделями достаточно прямая и
очевидная, а вот действий и правил, и сочетания слов – не столь ясная. Здесь про-
является специфика математического языка, поскольку его «грамматика» – это не
только правила сочетания элементов – слов, но и правила преобразования одних
слов в другие.
Первую часть математики – элементы и действия с ними – естественно на-
звать операционной системой, вторую часть – математическими моделями.
Понять назначение и общие принципы построения операционной системы
можно, проследив историю ее становления и развития. Подчеркнем итоговую ло-
гику этого становления, а не фактическую конкретную историю, которая подчас
весьма путана и непоследовательна.
Началась операционная система с целых положительных чисел. Как они воз-
никли, теряется в далеком прошлом. Но римские и арабские целые числа уже хо-
рошо известны. Практические потребности уже тех давних времен привели к изо-
бретению действий с целыми числами: сложению, вычитанию, умножению и де-
лению. Они возникли как замена длительных и трудновыполнимых пересчетов
37. Математика как язык, как операционная система и модели 301

количеств материалов, товаров, денег, поступающих из разных мест в разное вре-


мя и в разные места. Эти операции с числами были не всегда выполнимы, и, что-
бы это устранить, придумали отрицательные и дробные числа, которым присвои-
ли определенный смысл. Так, если положительное число – это наличность, то от-
рицательное – это долг. С иррациональными числами произошла длительная за-
минка: греки не присваивали числа длине гипотенузы равнобедренного прямо-
угольного треугольника с единичными катетами, она не измерялась числом, что
греками своеобразно обосновывалось отсутствием у катета и гипотенузы общей
меры, т.е. отрезка, который бы укладывался в каждом из них целое число раз. Это,
непреодолимое для греческой мысли препятствие, в дальнейшем длительно игно-
рировалось, и лишь в прошлом веке было преодолено Г. Кантором, К. Вейерштас-
сом и Р. Дедекиндом. По существу, это было пополнение рациональных чисел
действительными в результате операции предельного перехода, как требование ее
замкнутости.
Возникновение комплексных чисел имело ту же причину: устранение нераз-
решимости квадратных уравнений, в связи с необходимостью извлекать квадрат-
ный корень из отрицательного числа.
Гамильтон нашел обобщение комплексных чисел и изобрел кватернионы.
Для кватернионов сохранялись все правила действия с действительными и ком-
плексными числами, кроме свойства коммутативности. Затем было доказано, что
это единственное обобщение такого рода, хотя подобных кватернионам гипер-
комлексных чисел в дальнейшем было придумано много.
Кватернион – это гиперкомплексное число вида
a + αi + βj + γk , (37.1)
где a, α, β, γ – обычные действительные числа; i, j, k – единичные числа новой
природы, некие символы или единичные элементы, для которых имеет место сле-
дующая таблица умножения:

1 i j k
1 1 i j k
i i –1 k –j
i j –k –1 i
k k j –i –1

Операции сложения, вычитания и умножения на действительное число для


кватернионов такие же, как для комплексных чисел, а умножение кватернионов
определяется приведенной таблицей. Из нее видно, что кватернионы, для которых
β = γ = 0 , или α = β = 0 , или α = γ = 0 – это обычные комплексные числа. Умно-
жение кватернионов не коммутативно. Деление кватернионов возможно в силу
того, что произведение кватерниона (37.1) и кватерниона a − α ⋅ i − β ⋅ j − γ ⋅ k –
действительное число, так что операция деления числа (37.1) на число
a1 + α1i + β1 j + γ1k после умножения числителя и знаменателя на сопряженный
кватернион a1 − α1 ⋅ i − β1 ⋅ j − γ1 ⋅ k сводится к делению его на действительное чис-
ло, что сводится к делению на него чисел a, α, β и γ .
302 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Кватернионы были использованы Дж.К. Максвеллом для записи придуман-


ных им уравнений электромагнитного поля. Привычную для нас векторную фор-
му написания уравнений Максвелла получили лишь после того, как кватернион-
ное исчисление породило понятие вектора и векторного исчисления. Произошло
это примерно так. Подобно тому, как в комплексном числе выделяется действи-
тельная и мнимая части, у кватерниона a + α ⋅ i + β ⋅ j + γ ⋅ k выделили действи-
тельную часть a и векторную часть α ⋅ i + β ⋅ j + γ ⋅ k и, далее, у произведения двух
векторов
i j k
(αi + βj+ γk) (α1i + β1j + γ1k) = –αα1 – ββ1 –γγ 1 + α β γ
α1 β1 γ1
действительную часть со знаком минус, назвали их скалярным произведением, а
векторную – векторным произведением. Это и привело к возникновению вектор-
ного исчисления с действиями сложения, вычитания, скалярного и векторного
произведений и, конечно, еще умножения и деления на действительное число.
Понятие вектора породило линейную алгебру, линейные преобразования векто-
ров, матрицы и матричное исчисление.
Напомним, что кватернионы – не единственные придуманные гиперком-
плексные числа, но они единственные в своем роде, где по сравнению с действи-
тельными и комплексными числами нарушена только коммутативность произве-
дения, ассоциативность и дистрибутивность сохранены.
Потребность описания процессов изменения привела к изобретению функций
и действий с ними, включая дифференцирование, интегрирование и операторные
преобразования, т.е. к возникновению математического и функционального ана-
лизов сначала функций только действительного переменного, затем многих пере-
менных и комплексного переменного. Операторы и преобразования стали вос-
приниматься, в свою очередь, как элементы, с которыми также возможны разные
действия.
На этом процесс расширения математической операционной системы не ос-
тановился, он продолжался и продолжается, но сказанного достаточно, чтобы
сформулировать основной стимул ее развития и предъявляемые к ней требования.
Стимул развития – это стремление описать все, что требуется и удается, а требо-
вания – это замкнутость действий и операций, их принципиальная выполнимость.
Замкнутость – это существенная особенность именно математического языка.
Эти принципы построения операционной системы – возможно более широкое
описание на основе натуральных чисел и действий с ними, и требование замкну-
тости вновь изобретенных операций – в некоторой мере дают ответ на недоумен-
ный вопрос А. Эйнштейна: «Как это может быть, что математика, являясь после
всего продуктом мышления людей, не зависимым от опыта, так замечательно
приспособлена к объектам действительности?».
Сказанным содержание математической операционной системы не ограничи-
вается: еще есть множества, действия и соотношения между ними. Действия – это
объединение, пересечение и дополнение. Соотношения – это принадлежность и
непринадлежность, включение и невключение. Отношения больше и меньше
37. Математика как язык, как операционная система и модели 303

имеются для действительных чисел и модулей чисел, функций и операторов. Ко-


нечно, для всех них имеются отношения равенства и тождественности.
Множества и действия с ними можно присоединить к описанной ранее опе-
рационной системе, а можно считать еще одной математической операционной
системой. Некоторое разделение все же желательно, так как позволяет обнару-
жить особенности каждой из них. Эти особенности и существенные различия есть
даже среди изоморфных операционных систем, не различимых с точки зрения
предшествующего их описания.
Две операционные системы Α и Β изоморфны, если между их элементами и
действиями возможно установление взаимно однозначных соответствий Τ и соот-
ветственно D таких, что для любого элемента (элементов) x∈Α и допустимого
действия f ∈ Α имеет место диаграмма коммутативности, где y = f x, η = gξ,
Tx = ξ, Ty = η, Df = g .
f
x y

D
T T
g
ξ η

Изоморфные системы в силу этой диаграммы коммутативности, казалось бы,


отличаются друг от друга только обозначениями. Но на самом деле это не так, по-
тому что в предыдущем изложении не учитывалось, как осуществляются дейст-
вия. А это, оказывается, очень важно. Действия можно задать неким абстрактным
соответствием в виде таблицы умножения, но это реально осуществимо только
для конечных чисел элементов, а их бесконечно много. Так что должна быть ка-
кая-то, возможно более простая, процедура реализации этого абстрактного соот-
ветствия.
Поясним сказанное на примере римской и арабской записей одних и тех же
целых чисел. Так, числа 156 и 267 в римской записи – это CLVI и соответственно
CCLXVII. Перемножить числа 156 и 267 может школьник младших классов, а пе-
ремножить числа в римской записи, CLVI и CCLXVII, очень трудно и практиче-
ски невозможно, если числа четырехзначные. Греки этому обучались в течение
многих лет.
Сказанное относится не только к операции умножения двух чисел, еще более
ярко это видно на операциях дифференцирования и интегрирования. Даже для
элементарных функций интегрирование не всегда выполнимо. Но эти операции
можно сделать очень простыми и всегда легко выполнимыми в операционной
системе, придуманной Хевисайдом. Продифференцировать или проинтегрировать
функцию f (t) в ней очень просто, и результаты, соответственно, pF(p) – f (0) и
F(p)/p, где F(p) – запись функции f (t) в системе Хевисайда, p – комплексное чис-
ло.
Операционная система Хевисайда изоморфна нашей привычной, и этот изо-
морфизм устанавливается известным преобразованием Лапласа. Правда, в ней
304 Ю.И. Неймарк. Математическое моделирование как наука и искусство

плохо с умножением: оно выполнимо очень сложно, а в привычной для нас сис-
теме – просто.
Осталось еще добавить, что операционных систем типа Хевисайда довольно
много. Совсем другая изоморфная операционная система, в которой почти все
действия, правда, приближенно, легко и быстро выполнимы, – это операционная
система современной ЭВМ с хорошим математическим обеспечением, памятью и
быстродействием.
Зачем же нам нужны другие изоморфные операционные системы, отличные
от привычной общематематической? Ответ можно сформулировать так. В ряде
случаев решить некоторую задачу в обычной математической операционной сис-
теме не удается, но если перевести ее в другую, ей изоморфную, то там решение
найти можно. Решив задачу в изоморфной системе, можно вернуться в исходную
систему и получить требуемое решение. Эта возможность – прямое следствие
диаграммы коммутативности. Действительно, допустим, действие f над элемен-
том x невыполнимо в операционной системе Α, но оно выполнимо в операцион-
ной системе Β. Согласно диаграмме коммутативности, действию f в изоморфной
системе отвечает действие g, и, как непосредственно видно из этой диаграммы,
y = f x = T −1η = T −1g ξ = T −1g T x ,
где все операции T, g и T –1 выполнимы, причем операция T соответствует пере-
ходу от исходной системы Α к используемой Β, а операция T –1 – возврату в ис-
ходную систему Α.
На этом краткое описание математических операционных систем закончим и
перейдем к аналогам фраз, описаний, рассказов и т.п. в математическом языке.
Этот аналог уже был указан – это математические модели, т.е. изоморфные ото-
бражения описаний каких-то реальных или мыслимых объектов с помощью мате-
матической операционной системы. Чтобы прояснить сказанное, определим ма-
тематическую модель абстрактно и формально, как некоторое множество элемен-
тов математической операционной системы и связей, устанавливаемых ее дейст-
виями и отношениями. В соответствии с этим определением, уравнение
x 2 + px + q = 0 – модель, соотношение y = ax + b – тоже модель, x – тоже модель.
Модель и dx / dt = z + x , модель и x < y. Но понятие модели имеет и содержатель-
ный смысл. Чтобы выяснить, в чем он состоит, заметим, что понятие изоморфиз-
ма имеет место и для моделей.
Две модели изоморфны, если между их элементами, действиями и отноше-
ниями между ними можно установить взаимнооднозначное соответствие, для ко-
торого справедлива диаграмма коммутативности. Речь может идти о моделях в
одной и той же операционной системе или разных.
Теперь осталось сказать о математической модели и математическом модели-
ровании самое главное, но, к сожалению не формализуемое: природа, как окру-
жающий нас мир, − тоже операционная система, так как ее удается с той или иной
полнотой представить в виде разнообразных элементов и связей между ними и
текущим временем, называемых законами природы и принципами ее устройства.
С этой точки зрения объекты природы – это ее природные модели, и они могут
быть изоморфны математическим моделям. Вернее, человечество создало матема-
37. Математика как язык, как операционная система и модели 305

тический язык так, чтобы это имело место. И как только удается построить изо-
морфную объекту природы математическую модель, изучая ее, мы постигаем и
природный объект. Неформальным в описанном является выделение в объектах
природы элементов, подчас выдумываемых и изобретаемых, и установление свя-
зей между ними и текущим временем, т.е. неформально то, как мы постигаем уст-
ройство мира и операционную систему природы и как мы постигаем изоморфную
ей математическую операционную систему, модели которой могут быть изучены,
исследованы и поняты. Поэтому наука в целом и математическое моделирование
как часть ее – это не только точная наука, но и неформализуемое искусство. В ис-
тории науки и отдельных исследованиях формализуемое и неформализуемое,
точная наука и искусство тесно переплетаются между собой и трудно отделимы
друг от друга. Но это разделение, например, было очень явным и четким, когда
М. Фарадей постиг электромагнитные явления, выдумав магнитные и электриче-
ские поля, а Дж.К. Максвелл построил соответствующую математическую модель
– знаменитые уравнения Максвелла. В механике были придуманы силы и матери-
альные точки, обладающие массой и находящиеся в каких-то местах, и имеющие
скорость движения, Ньютон построил математическую модель их движения –
уравнения Ньютона, затем Лагранж – уравнения Лагранжа для систем материаль-
ных точек с голономными идеальными связями между ними, но без необходимо-
сти знания вызываемых ими сил.
По-видимому, в основе не только нашего осознанного мышления, но и не-
осознанного постижения мира нашими органами чувств и мозгом лежит построе-
ние изоморфных моделей. Как устроены эти модели, как они строятся и познают-
ся – одна из важнейших и не раскрытых тайн природы. С помощью этого интуи-
тивного мышления человек осознанно придумывает еще более мощные, созна-
тельно обоснованные математические модели и необходимую для их построения
и исследования операционную систему.
306 Ю.И. Неймарк. Математическое моделирование как наука и искусство

38. ГЕОМЕТРИЧЕСКОЕ, ФИЗИЧЕСКОЕ, АНАЛОГОВОЕ,


МАТЕМАТИЧЕСКОЕ И СТАТИСТИЧЕСКОЕ
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ
Все перечисленные в заголовке виды моделирования основаны на изомор-
физмах. Геометрическое и физическое моделирование − на геометрическом и со-
ответственно физическом подобии, вызываемом изменением масштаба длины и
соответственно масштабов базовых физических величин, например длины, вре-
мени и массы. Аналоговое моделирование возможно в силу одинаковости видов
некоторых закономерностей для величин различной физической природы, напри-
мер, механической и электрической, процессов теплопроводности, диффузии и
образования электрического поля. Об изоморфизме реальных объектов и матема-
тических моделей уже говорилось. Имитационное моделирование исходит из то-
го, что неизвестная, подлежащая отысканию величина оказывается совпадающей
с математическим ожиданием специальным образом организованного случайного
процесса.
Геометрическое моделирование используется с глубокой древности: законы
геометрического подобия были известны уже грекам. Физическое моделирование
возникло более века тому назад из-за крупных катастроф с морскими судами и
затем стимулировало его еще и развитие авиации. Аналоговое моделирование,
точнее, лежащая в его основе одинаковость законов природы для объектов разной
физической природы, были ясны уже Дж. У. Рэлею (J. W. Rayleigh), в частности, в
виде аналогии между томсоновским электрическим колебательным контуром и
механическим гармоническим осциллятором. Именно эти аналогии и менее пол-
ные привели к возникновению теории колебаний как науки об общих закономер-
ностях эволюционных процессов в механике, физике, химии, биологии и науке об
обществе. Математическое моделирование в наше время стало ведущим и широко
используемым в немалой степени благодаря не только теоретическим успехам, но
и появлению универсальных быстродействующих вычислительных машин.
В некоторых типах задач успешно используется имитационное моделирова-
ние, называемое еще методом Монте-Карло или статистическим моделированием.
Всем этим видам моделирования посвящено значительное количество науч-
ной литературы. Здесь об этих видах идет речь лишь для того, чтобы показать их
общую основу – изоморфизм разных реальных объектов и процессов между собой
и представленными мысленно или записями на бумаге, или на том или ином но-
сителе информации. После сказанных общих слов далее поговорим несколько
подробнее о физическом и имитационном моделировании, а затем, отдельно, о
математическом моделировании как науке и искусстве.
Физическое моделирование [45]. Физическое моделирование не предпола-
гает фактического наличия математической модели, достаточно опереться на бо-
лее скромные сведения и понимание изучаемого объекта: надо знать, какие физи-
ческие величины полностью определяют поведение рассматриваемого объекта,
все и ни одного лишнего. Однако основывается оно на том, что имеется матема-
38. Геометрическое, физическое, аналоговое … моделирование 307

тическая модель и входящие в нее физические величины имеют размерность, а


математическая модель такова, что изменения всех базовых масштабов физиче-
ских величин ее не меняют – масштабы сокращаются. Это эквивалентно наблю-
даемой нами естественной независимости законов природы от принимаемых
масштабов измерения физических величин, что в принципе могло бы быть и не
так: в неевклидовых геометриях не имеют места привычные законы геометриче-
ского подобия.
Пусть определяющие физические величины f1 ,..., f m , а физическая размер-
ность величины fi есть Lαi S βi M γ i , где L, S и M – масштабы длины, времени и
массы. Эти данные запишем в виде таблицы:

L S M
f1 α1 β1 γ1
f2 α2 β2 γ2
… … … …
fm αm βm γm

Изменения масштабов L, S и M соответственно в K L , K S и K M раз преобразу-


ет каждую определяющую величину fi в величину
f i = K Lαi K Sβ i K Mγ i f i , i = 1, m . (38.1)
Новые физические определяющие величины f1 , ...., f m фактически отвечают
тому же самому объекту и определяются той же самой математической моделью.
Отсюда следует, что объект, характеризуемый величинами f1, …, fm, подобен объ-
екту, характеризуемому величинами f1 , ...., f m , тогда и только тогда, когда для
некоторых KL, KS и KM выполняется соотношение (38.1). Эти же формулы (38.1)
позволяют пересчитывать определяющие величины одного объекта в другой с та-
кими же определяющими величинами и одинаковыми математическими моделя-
ми, которые не обязательно знать. Кроме величин f1, …, fm, объект может описы-
ваться и другими величинами, но они должны определяться ими, и поэтому
опять-таки пересчитываться в соответствии с (38.1).
Найдем теперь условия физического подобия, т.е. выясним, когда существу-
ют такие KL, KS и KM, при которых имеют место формулы (38.1).
Формулы (38.1), логарифмируя, можно записать в виде:
fi
, i = 1, m .
αi ln K L + βi ln K S + γ i ln K M = ln (38.2)
fi
Система линейных уравнений (38.2) относительно ln K L , ln K S и ln K M име-
ет решение, если ранг матрицы
α1 β1 γ1
⋅ ⋅ ⋅ (38.3)
αm βm γm
равен рангу расширенной матрицы
308 Ю.И. Неймарк. Математическое моделирование как наука и искусство

f1
α1 β1 γ1 ln
f1
⋅ ⋅ ⋅ ⋅ . (38.4)
f
αm β m γm ln m
fm
Последнее будет иметь место, если из линейной зависимости строк матрицы
(38.3)
x1α 1+ ... + xm αm = 0,
x1β 1+ ... + xmβ m = 0, (38.5)
x1γ 1+ ... + xm γ m = 0,
где x12 + x22 + ... xm2 ≠ 0, следует выполнение соотношений
f1 f
x1 ln + ... + xm ln m = 0
f1 fm
или
f1x1 ⋅ ⋅ ⋅ f mxm = f1x1 ⋅ ⋅ ⋅ f mxm , (38.6)
где величины этого равенства справа и слева в силу (38.5) имеют нулевую раз-
мерность. Выполнение этих соотношений для любого решения x1, …, xm системы
(38.5) является, таким образом, необходимым и достаточным критерием физиче-
ского подобия. Ясно, что достаточно выполнения этих условий для независимых
решений x1, …, xm системы (38.5). Каждому независимому решению x1, …, xm от-
вечает свое условие подобия, и их столько, сколько независимых решений у сис-
темы (38.5). Таковы условия подобия. При их выполнении формулы пересчета на-
ходятся как решения относительно KL, KS и KM линейных уравнений (38.2). Эти
формулы пересчета неоднозначны с точностью до условий подобия, одинаковых
у объекта и его модели.
Перейдем к примерам.
П р и м е р 1 . Пусть предполагаемая к строительству стержневая статическая
определяемая конструкция сделана из стержней длин l1, l2 ,…, ln , сочлененных в
узловых точках, где она нагружена некоторыми силами F1, …, Fm, и нас интере-
суют усилия G1, …, Gn во всех стержнях с целью выяснения, достаточно ли они
прочны. Решить задачу мы хотим с помощью построения уменьшенной модели и
экспериментального определения сил в стержнях. Прежде всего, очевидно, что
конструкция, предполагаемая к строительству, и модель должны быть геометри-
чески подобны, так как в противном случае соотношения li /lj , i ≠ j, для них были
бы различными. По той же причине должна соблюдаться пропорциональность для
прилагаемых к конструкции усилий. При выполнении этих условий обосновано,
что определяющими являются характерный размер и приложенное усилие, на-
пример, l1 и F1. Для них таблица имеет вид:

L S M
x1 l1 1 0 0
x2 F1 1 –2 1
38. Геометрическое, физическое, аналоговое … моделирование 309

Для указанной модели уравнения (38.5) запишутся в виде:


x1 + x2 = 0, –2x2 = 0, x2 = 0,
они не имеют ненулевого решения. Поэтому физическое подобие имеет место
между любыми описанными конструкциями с пропорциональными внешними си-
лами, а усилия G1, …, Gn определяются через аналогичные усилия G1 , ..., Gn в мо-
дели по формуле
F
Gs = 1 Gs , s = 1, n. (38.7)
F1
П р и м е р 2 . Пусть теперь в такой же конструкции, не обязательно статиче-
ски определяемой, стержни упругие с коэффициентами упругости k1, …, kn. Из
таких же соображений следует необходимость геометрического подобия с моде-
лью и одинаковые соотношения между внешними усилиями и коэффициентами
упругости. Определяющими теперь будут характерные величины: размер l, внеш-
нее воздействие F и коэффициент упругой жесткости k, например, l1, F1, k1. Как и
ранее, составим таблицу

L S M
x1 l 1 0 0
x2 F 1 –2 1
x3 k 0 –2 1

и уравнения для отыскания критериев подобия:


x1 + x2 = 0, –2x2 – 2x3 = 0, x2 + x3 = 0.
Теперь эти уравнения имеют ненулевое решение x1 = l, x2 = –1, x3 = l, и ему
соответствует критерий подобия lF –1k. Для подобия эти величины у проектируе-
мой конструкции и модели должны быть одинаковыми, а пересчет усилий в
стержнях по-прежнему определяется формулой (38.7).
П р и м е р 3 . В качестве следующего примера возьмем маятник. Маятник
как механическая система определяется длиной l, массой m и ускорением силы
тяжести g. Этому соответствуют таблица

L S M
x1 L 1 0 0
x2 m 0 0 1
x3 g 1 –2 0

и уравнения:
x1 + x3 = 0, –2x3 = 0, x2 = 0,
не имеющие ненулевого решения, поэтому все маятники между собой подобны.
Этот вывод непосредственно следует из математической модели маятника

&& + lmg ⋅ sin ϕ = 0,
так как путем замены масштаба времени t → lmg/J τ это уравнение приводится
к виду
310 Ю.И. Неймарк. Математическое моделирование как наука и искусство

d 2ϕ
+ sin ϕ = 0.
dτ2
Это означает, что все маятники между собой физически подобны.
Допустим, мы хотим, пользуясь этим физическим подобием, найти период
колебаний T. Непосредственно это сделать нельзя, так как период T зависит не
только от величин l, m и g, но еще от амплитуды a колебания маятника, и в приве-
денную выше таблицу ее нужно ввести. После этого внесения появится еще одна
переменная, x4, и соответствующие уравнения запишутся в виде:
x1 + x3 + x4 = 0, –2x3 = 0, x2 = 0.
Теперь уже ненулевое решение есть: x1 = –1, x2 = 0, x3 = 0, x4 = 1 и ему отвеча-
ет критерий физического подобия a/l. При его выполнении соотношение между
периодами колебаний T и T определяется отношением одноразмерных с ними
величин lmg /J и l m g /J , т.е.

T = T ⋅ (lmg/J )1 / 2 ⋅ (l m g/J ) −1 / 2
или
T = (lmg/J )1 / 2 ⋅ f ( a / l ) ,
так как T ⋅(l m g /J ) −1 / 2 не имеет размерности и зависит только от отношения
a / l = a / l . Как известно, при a/l << 1, f (a/l) = 2π.
П р и м е р 4 . В качестве последнего примера определим критерий подобия
для стационарного течения вязкой жидкости в поле силы тяжести, когда ее тече-
ние определяется характерным размером l, скоростью υ, плотностью ρ, вязкостью
ν и ускорением силы тяжести g. При этих предположениях соответствующие таб-
лица и уравнения, определяющие критерий физического подобия, имеют вид:

L S M
x1 l 1 0 0
x2 υ 1 –1 0
x3 ρ –3 0 1
x4 ν 2 –1 0
x5 g 1 –2 0

x1 + x2 – 3x3 + 2x4 + x5 = 0, –x2 – x4 – 2x5 = 0, x3 = 0.


Уравнения для x1, …, x5 имеют два независимых решения: x1 = 1, x2 = 1, x4 = –1 и
x1 = –1, x2 = 2, x5 = –1, которым отвечают знаменитые числа Рейнольдса и Фроуда
lυ υ2
Re = и Fr = .
ν lg
Примером сравнительно недавнего сенсационного применения моделирова-
ния на основе размерностей физических величин и общих упрощенных представ-
лений о моделируемом явлении является определение засекреченной энергии
первого ядерного взрыва на основе открытой демонстрации его киносъемки.
38. Геометрическое, физическое, аналоговое … моделирование 311

Взрыв принимался точечным, а возникающая ударная волна – сферической. В


этих упрощенных представлениях радиус взрывной волны R является функцией
времени, зависящей от энергии взрыва E и начальной плотности окружающего
воздуха ρ. Соответствующая таблица размерностей энергии E, плотности ρ, вре-
мени t и радиуса R взрывной волны имеет вид:

E ρ t R
L 2 –3 0 1
M 1 1 0 0
T –2 0 1 0

Поиск безразмерной комбинации определяющих величин E, ρ и t приводит к


системе уравнений
2x – 3y = 0, x + y = 0, –2x + z = 0,
имеющей только нулевое решение x = y = z = 0 и поэтому все точечные взрывы со
сферической ударной волной подобны между собой.
В соответствии с этим, согласно приведенной выше таблице, находим, что
радиус R выражается через определяющие физические величины E, ρ и t форму-
лой вида
R = CE1 / 5ρ −1 / 5t 2 / 5 ,
где C – некоторая константа, которая может быть найдена по единичному кон-
кретному эксперименту или теоретическому расчету, обнаруживших, что C = 1.
Теперь найденная формула позволяет найти энергию ядерного взрыва E, если из-
вестен радиус ударной волны при каком-нибудь t. Но можно найти E и более на-
дежно, используя серию значений времени t и соответствующих значений R. Ло-
гарифмируя найденную формулу зависимости R от E, ρ и t и учитывая, что C = 1,
находим, что
5 1 E
ln R = ln + ln t .
2 2 ρ
Согласно этому, график зависимости 5 / 2 ⋅ ln R от ln t изображается прямой,
отсекающей на оси ординат отрезок длины 1 / 2 ⋅ ln E / ρ . На эту прямую должны
лечь данные кинофильма ядерного взрыва и, исходя из этого, она может быть
найдена.
Имитационное моделирование. Краткий рассказ об имитационном модели-
ровании начнем с исторического примера отыскания числа π путем случайных
бросаний иголки на разграфленный на одинаковые полосы лист бумаги. Этой за-
бавой в прошлом увлекались и известные ученые, кидая иголку тысячи раз: чем
больше раз кинешь, тем точнее найдешь число π.
Под случайным бросанием понималось, что иголка, попадая на лист бумаги,
после остановки располагается относительно параллельных линий, нанесенных на
бумагу так, что ближайшее расстояние x ее центра и угол ϕ с ними – независимые
случайные величины с постоянными плотностями вероятностей 1/a, где 2a – ши-
рина полос, и, соответственно, 1/π. Иголка длины 2a будет пересекаться с одной
из линий, если
312 Ю.И. Неймарк. Математическое моделирование как наука и искусство

a cos ϕ ≥ x. (38.8)
В соответствии с принятыми обозначениями, вероятность пересечения игол-
ки с одной из линий равна (рис. 38.1)
1
∫∫ aπ dxdϕ, (38.9)
D
где D – область, определяемая неравенствами 0 ≤ x ≤ a, − π / 2 ≤ ϕ ≤ π / 2 и (38.8).
Интеграл (38.9) легко находится и равен 2/π.

Рис. 38.1. Пересечение иглы


x a с одной из линий

Пусть теперь иголка случайно брошена N раз и пересеклась с одной из линий


n раз. Согласно закону больших чисел, частота пересечения n/N стремится к най-
денной вероятности 2/π, так что приближенно и тем точнее, чем больше число
бросаний N,
2N
π≈ .
n
Известное неравенство Чебышева позволяет оценить вероятность того, что
ошибка будет не больше некоторого малого ε. Согласно этому неравенству,
 n n  Dn / N
P  − M > ε  < , (38.10)
N M  ε2
где Mn/N и Dn/N − соответственно математическое ожидание и дисперсия частоты
пересечений n/N. Частота
n 1
= ( ξ1 + ... + ξ N ), (38.11)
N N
где ξi = 1, если в i-м бросании иголка пересеклась с одной из линий, и ξi = 0 − в
противном случае. Случайные величины ξi независимы, и для каждой из них ве-
роятность быть единицей равна p = 2/π. Далее, согласно (38.10) и (38.11), непо-
средственно находим, что
 n  p(1 − p )
P  − p > ε  < , (38.12)
N  Nε 2
т.е. вероятность отклонения частоты n/N от величины p больше, чем на ε, не более
чем p(1 − p ) /( Nε2 ) , и стремится к нулю при N → ∞.
Таким образом, π приближенно и со сколь угодно большой точностью можно
найти путем случайных бросаний иголки. Но этих бросаний нужно довольно мно-
го. Так, чтобы найти три точных знака π, т.е. при ε < 10–3, с вероятностью 0,99
38. Геометрическое, физическое, аналоговое … моделирование 313

нужно бросить иголку примерно 108 раз. Конечно, сегодня таким способом вы-
числять число π по меньшей мере неразумно. Но есть примеры, где это не только
возможно, но, пожалуй, и единственно приемлемо. Этот пример – вычисление
многомерных определенных интегралов от функций многих переменных, напри-
мер десяти, вида

∫ f ( x1 ,..., xn ) dx1 ⋅ ⋅ ⋅ dxn (38.13)


D

по ограниченной области D, определяемой некоторыми неравенствами, позво-


ляющими выяснить, лежит ли точка (x1 , …, xn) в этой области или нет.
Пусть a1 ≤ x1 ≤ b1 ,..., an ≤ xn ≤ bn и A ≤ f ( x1,..., xn ) ≤ B . Первые n неравенств и
неравенство A ≤ z ≤ B определяют (n + 1)-мерный параллелепипед Π в (n + 1)-
мерном пространстве Rn+1 переменных x1 , …, xn и z. Величина интеграла есть не
что иное, как (n + 1)-мерный объем области
0 ≤ z ≤ f (x1, …, xn), (x1, …, xn) ∈ D (38.14)
в пространстве Rn+1. Назовем ее D . Область D лежит внутри параллелепипеда Π.
Обозначим объемы областей D и Π через V и V. V – это интересующее нас зна-
чение интеграла (38.13), а V равно (B–A)Π(bi – ai). Отношение V / V не что иное,
как вероятность попадания случайной точки M(x1, …, xn, z) в область D , если она
имеет постоянную плотность вероятности в параллелепипеде Π, равную
{(B– A)Π(bi – ai)}–1. Это означает, что величину V / V можно найти путем незави-
симых случайных «бросаний» точки M точно так же, как это имеет место с броса-
нием иголки для определения числа π. Конечно, «бросаний» нужно достаточно
много. Но что замечательно: необходимое число «бросаний» не зависит от раз-
мерности n интеграла. Осуществить же случайное бросание можно с помощью
датчиков случайных чисел, и при каждом «бросании» непосредственно определя-
ется, в соответствии с заданием области D неравенствами (38.14), когда «брошен-
ная» точка попала в область D .
314 Ю.И. Неймарк. Математическое моделирование как наука и искусство

39. ОБЩАЯ СХЕМА


МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ
Математическое моделирование включает решение двух трудоемких задач:
составление математической модели и ее исследование. Эти задачи очень разные,
требующие различных знаний, навыков и интуиции, но, несмотря на это, они тес-
но взаимосвязаны, поскольку при составлении модели следует учитывать трудно-
сти и возможности ее исследования, а при исследовании может обнаружиться не-
обходимость корректировки построенной модели. Кроме того, при исследовании
необходимо понимать, что учтено и что не учтено в модели, т.е. на какие вопросы
она может дать ответы, а на какие фактически не может.
Математические модели, которые ранее рассматривались в этой книге, можно
назвать простыми. Простыми по написанию, простыми для исследования, хотя и
не всегда простыми с точки зрения получаемых результатов. Результаты исследо-
вания моделируемого объекта могли быть неожиданными и требующими объяс-
нения. Модели просты за счет того, что они учитывают только некоторые сторо-
ны объекта, не стремясь к всесторонней и полной адекватности с реальным объ-
ектом, и поэтому, естественно, могут объяснить только то, что в ней учтено и за-
ложено, и зачастую только качественно, а количественно подчас весьма прибли-
женно. Несмотря на это, а может быть, благодаря этому, роль простых моделей в
науке очень велика, поскольку они ведут к пониманию существа происходящих
процессов − пониманию, очень важному для ученого, инженера, конструктора и
изобретателя. Но это необходимое понимание не всегда достаточно, и во многих
случаях нужны более точные количественные данные. Это требует дополнитель-
ного уточнения и усложнения модели, что, как правило, влечет значительно более
сложные численные исследования. Эта вычислительная сторона математического
моделирования, несмотря на ее важность, в этой книге фактически не затронута, в
ней идет речь о том, как этих вычислений избежать, если это возможно и допус-
тимо.
Построенные модели и их исследование могут требовать не только достаточ-
ных знаний, но и определенного искусства. Это искусство в некотором смысле
лежит вне науки, поскольку является результатом индивидуального опыта и обу-
чения показами на примерах. Искусству тоже можно учиться. Ведь учат сочинять
стихи, музыку, рисовать, играть на скрипке, танцевать. Следует признать, что со-
временное традиционное изложение математики, теоретической и отчасти при-
кладной, не способствует выработке этого искусства, и в результате лишь отдель-
ные, одаренные от природы люди, могут вовремя преодолеть барьер математиче-
ского формализма. Более успешно он преодолевается в научных школах, благода-
ря примерам, общению, беседам, обсуждениям и показам. Как, возможно, вы уже
догадались и вспомнили, что именно эту цель облегчения взятия барьера, разде-
ляющего теоретическую математику и прикладное математическое моделирова-
ние, ставит перед собой эта книга.
Итак, пусть перед вами стоит задача построения и исследования модели, т.е.
задача математического моделирования. С чего следует начать? Прежде всего не
39. Общая схема математического моделирования 315

жалейте времени на то, чтобы осмыслить, уточнить и конкретизировать постав-


ленную перед вами задачу, посмотреть на нее с разных точек зрения. Нужно воз-
можно точнее и полнее ответить на вопрос, что вы хотите узнать, на какие вопро-
сы ответить, и какой объект следует для этого рассматривать, что в нем обяза-
тельно надо учесть, а чем можно или, может быть, нужно пренебречь? Этот важ-
нейший этап математического моделирования можно назвать исходной постанов-
кой задачи и определением объекта исследования. Не думайте, что в дальнейшем
вам не придется к нему вернуться. Очень может быть, что придется, и чуть ли ни
тогда, когда вы будете считать задачу решенной.
Затем вы можете приступить ко второму этапу, состоящему в словесном или
мысленном описании объекта, повелевающих и управляющих им законов приро-
ды. После этого снова подумайте, нельзя ли чем-то пренебречь или, наоборот,
что-то еще нужно все-таки учесть. В итоге вы завершите мысленное или словес-
ное описание объекта исследования и выяснение законов природы, которые опре-
деляют его поведение и свойства. Далее такое описание следует изоморфно ото-
бразить в математическую модель, стараясь это сделать возможно проще и удоб-
нее для последующего исследования. При этом не следует упускать возможностей
упрощений или декомпозиций, ведущих к расчленению задачи исследования на
последовательные этапы. В результате вы приходите к первоначальной матема-
тической модели.
Теперь следует подумать о том, как ее изучить и исследовать. Возможно, что
это обдумывание приведет вас к некоторым изменениям модели, способствую-
щим простоте, удобству и экономичности ее исследования. Далее нужно провести
исследование и сделать выводы о свойствах объекта, его поведении и возможных
в нем явлениях и сопоставить с тем, что вы знаете об объекте. Если что-то не сов-
падает, вызывает сомнение или не вполне устраивает, – вернитесь к одному из
предшествующих этапов или, может быть, даже к исходной постановке задачи.
Если вас все устраивает, можно переходить к формулировке выводов и рекомен-
даций. Конечно, то, что было сказано, – это общая схема, и вовсе не обязательно
буквально ей следовать.
В заключение этого краткого и общего описания сложного и многообразного
математического моделирования, которое иллюстрировалось много раз, перечис-
лим основные его этапы, а затем приведем некоторые, также общие, полезные при
моделировании соображения:
1. Постановка задачи и определение объекта исследования.
2. Идеализация и упрощение объекта.
3. Мысленно-словесное описание объекта и определяющих его поведение и
свойства законов природы.
4. Дальнейшие упрощения и, наоборот, учет чего-то нового.
5. Составление первоначальной математической модели.
6. Внесение корректив в математическую модель.
7. Выбор и реализация методов исследования математической модели.
8. Сопоставление результатов исследования модели с тем, что известно об
объекте.
9. Выводы и рекомендации.
316 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Отметим, что от каждого из этапов возможны возвраты к любому предыду-


щему.
А теперь некоторые полезные общие соображения:
1. Чем проще модель, тем меньше возможность ошибочных выводов.
2. Модель должна быть простой, но не проще, чем это возможно.
3. Пренебрегать можно чем угодно, нужно только знать, как это повлияет на
решение.
4. Модель должна быть грубой, малые возможные и допустимые поправки не
должны кардинально и существенно менять ее поведение.
5. Модель и расчет не следует делать точнее исходных данных. Выводы не
должны существенно меняться в пределах ошибок исходных данных и ошибок
счета. Если этого не удается достичь за счет модификаций модели, необходимы
более точные исходные данные.
6. При анализе результатов исследования модели важны не только конкрет-
ные численные результаты, но и понимание, почему и как все происходит, как все
это зависит от параметров. Во всяком случае, к этому следует стремиться, хотя
в некоторых случаях это удается далеко не сразу.
40. Модели вибропогружения 317

40. МОДЕЛИ ВИБРОПОГРУЖЕНИЯ


Как происходит вибропогружение 18-метрового тонкого металлического
шпунта в мерзлый грунт, я видел сам, а создатель этого чуда, инженер Д.Д. Бар-
кан, чиркнув карандашом поперек шпунта, показал мне, как это происходит:
шпунт вибрировал и погружался (рис. 40.1). Причину погружения шпунта Баркан
видел в наблюдаемом им экспериментально явлении разжижения грунта под
влиянием вибраций. Проблема, которая его «заела», состояла в том, что вибрато-
ры очень быстро выходили из строя, и их, поломанных и негодных, лежала невда-
леке громадная куча. Это было на строительстве плотины Горьковской ГЭС зи-
мой 1961 года. Прислали меня от ГИФТИ (Горьковский исследовательский физи-
ко-технический институт), чтобы помочь в беде, что напрямую я сделать, естест-
венно, не мог, но по возвращении домой вскоре сообразил, в чем причина чудес-
ного погружения шпунта в мерзлый грунт, как в воду. Она была в усреднении сил
сопротивления погружению шпунта под влиянием его высокочастотных – 50 герц
– вибраций. На этой основе были построены модели, о которых рассказывается
ниже, и найдены зависимости скорости погружения от ее параметров. Эти резуль-
таты были использованы в создании последующих, еще более эффективных кон-
струкциях систем вибропогружения, где, в частности, вибраторы уже так быстро
не ломались.

Рис. 40.1. Осциллограмма вибропогружения


шпунта, полученная движением карандаша
слева направо поперек него

Я позволю себе кратко воспроизвести, как осмысливалось это необычное яв-


ление и как сформировалась приемлемая математическая модель, результаты ис-
следования которой можно было положить в основу инженерного конструирова-
ния.
Сначала я прочитал работы Д.Д. Баркана о разжижении грунта под влиянием
вибраций и использовании этого явления для вибропогружения шпунта, свай и
другого. Изложенное подкреплялось описанием экспериментов по погружению
тяжелого шарика в вибрирующий грунт, но они не очень согласовывались с тео-
ретическими соображениями и данными экспериментов по реальным вибропог-
ружениям шпунтов и свай. Кроме того, мне казалось очевидным, что это разжи-
жение не может происходить в промерзшем грунте, а шпунт его преодолевал
весьма успешно.
Первая идея была в том, что шпунт погружается в грунт, как змея, в силу бе-
гущих вдоль него продольных волн. Но эту идею пришлось отвергнуть, так как
вследствие очень большой скорости распространения бегущих волн вдоль шпунта
и небольшой его длины он практически двигался, как целое. Тогда я принял са-
318 Ю.И. Неймарк. Математическое моделирование как наука и искусство

мую естественную модель, что с боков шпунт испытывает сухое кулоновское


трение, а своим торцом трамбует и раздвигает грунт. Эта модель представлена
схематически на рис. 40.2, а соответствующая математическая модель имеет вид
m &x& = P + F cos ωt − Fбок − Fлоб , (40.1)
где F cos ωt – гармоническая сила вибратора, действующая на шпунт; P – вес
шпунта вместе с вибратором; Fбок и Fлоб – силы бокового и лобового сопротивле-
ний; x – перемещение шпунта, отсчитываемое вниз.

P+F cosωt

Рис. 40.2. Упрощенная модель шпунта


с вибратором, погружаемого в грунт,
с учетом лишь бокового и лобового
сопротивлений, описанных формулами
(40.2) и (40.3)

x
y

Грунт с боков от шпунта принимался неподвижным, и тогда


Fбок = Q sign( x& ) . (40.2)
Уровень грунта под торцом шпунта имеет координату y , и ее увеличение
требует некоторого усилия R . Если x – координата нижнего торца шпунта, y –
уровень продавливаемого им грунта, то
 R при x = y и x& > 0 ;
Fлоб =  (40.3)
0 при x < y либо x = y и x& ≤ 0,
причем
 x& при x = y и x& > 0 ;
y& =  (40.4)
0 при x < y либо x = y и x& ≤ 0.
Сегодня решение уравнений (40.1)–(40.4) на ЭВМ не представляло бы за-
труднений, но в то время это была сложная, трудоемкая вычислительная задача.
Но оказалось возможным приближенно аналитически найти ее решение, предпо-
лагая, согласно запомнившейся мне осциллограмме движения шпунта, показан-
ной Барканом, что
x = a cos ωt + vt , (40.5)
где a – амплитуда его колебаний, ω – частота, а v – скорость погружения. При-
нимая это предположение и интегрируя уравнение (40.1) по периоду (с учетом,
что имеет место (40.5)), непосредственно находим, что
40. Модели вибропогружения 319
2π / ω 2π / ω 2π / ω

∫ m&x& ⋅ dt = P
ω
− ∫ Fбок dt − ∫ Fлоб =
0 0 0 (40.6)
2π  2π   2π 
= P +  t1 − t0 + t1 − t0 −  Q +  t0 + − t3  R = 0.
ω  ω  ω 
Смысл моментов времени t0 , t1 и t3 указан на осциллограмме движения шпун-
та (40.5), представленной на рис. 40.3.
t1

Рис. 40.3. Экспериментально полученный


t3
график колебаний сваи с указанием t0
определенных моментов времени t0, t1, t3
и t0+2π/ω
t0+2π/ω
Они находятся из очевидных уравнений, и при этом приближенно соотношение
(40.6) принимает вид
2π 2v 2v
P − 2 Q − 2 R = 0,
ω aω aω
откуда
π aω
v= P. (40.7)
Q+R
Этот «удивительный» результат можно трактовать как то, что под влиянием
вибраций силы Fбок и Fлоб усредняются и оказываются эквивалентными силе вяз-
кого трения с коэффициентом (Q + R ) /( πaω). Этот коэффициент вязкого трения
убывает с ростом амплитуды колебаний a и частоты ω. Очень грубо, принимая,
что F >> Q + R , амплитуда a = F /( Mω2 ) и тогда коэффициент вязкого трения
Q + R (Q + R ) M ω
h=
= . (40.8)
π aω πF
Таким образом, действительно, при вибропогружении силы сопротивления
грунта подобны вязкому трению, но это не оттого, что грунт якобы разжижается,
разжижение не требуется.
Рассматриваемая модель весьма проста, она хорошо объясняет суть явления
вибропогружения, но она не дает хороших совпадений с экспериментом. Дело в
том, что грунт обладает еще упругостью, как с боков от шпунта, так и в его торце.
Эта упругость проявляется в виде некоторых, ярко или неярко выраженных, резо-
нансных явлениях: шпунт в грунте обладает некоторой собственной частотой, он
подобен осциллятору. Более полная модель, учитывающая упругость грунта, изо-
бражена на рис. 40.4.
Теперь уже модель описывается тремя переменными x, y и z: x – положение
шпунта, y – смещение бокового грунта, z – смещение донышка ямки в грунте. Как
и прежде, проскальзывание шпунта и продавливание грунта происходит при си-
320 Ю.И. Неймарк. Математическое моделирование как наука и искусство

лах Q и, соответственно R, но при этом боковинка и донышко грунта имеют упру-


гость kб и k л соответственно. Математическая модель теперь состоит, как и ра-
нее, из уравнения (40.1) для x, уравнений для y и z и формул, определяющих силы
Fбок и Fлоб ,
 x& при k б y < Q,
y& = 
0 при k б y = Q;
 x& при k л ( x − z ) = R и x& ≥ 0,
z& =  (40.9)
0 при k л ( x − z ) < R;
k ( x − z ) при x > z,
Fбок = kб y , Fлоб =  л
0 при x ≤ z.
Едва ли сегодня имеет смысл исследовать эту модель (40.9) приближенно тем
же, что и ранее, очень простым методом. Формулы получаются громоздкие и не
всегда приемлемые. Просчет же на ЭВМ легко и быстро осуществим.

P + F cos ω t

Рис. 40.4. Улучшенная модель, описанная уравнениями (40.9),


вибропогружаемого шпунта с упрощенным учетом упругих
свойств грунта под действием боковых и фронтальных воздей-
y ствий; масса грунта не учитывается

Существенно новым является другая зависимость амплитуды колебаний


шпунта от частоты и возможность ее существенного возрастания при приближе-
нии частоты к резонансной частоте колебаний шпунта. В этой уточненной модели
при вибрациях сил сопротивления погружению в вязкое трение эффект перехода
остается тем же самым, а с ростом амплитуды «вязкое трение», как и ранее,
уменьшается, так что выгодно работать в режиме резонанса. Вот, пожалуй, и все.
Может быть, следует отметить, что дальнейшее совершенствование этого метода
вибропогружения привело к переходу от центробежных вибраторов – генераторов
силы Fсos ωt – к виброударным механизмам, которые в некотором отношении
оказались предпочтительнее. Простейшая модель виброударника была рассмот-
рена методом точечных отображений [12, 25], а изложенное опубликовано в [33].
40. Модели вибропогружения 321

Более полное математическое исследование описанных моделей вибропогруже-


ния также методом точечных отображений содержится в [6]. Позднее близкие за-
дачи рассматривались И.И. Блехманом [13].
Можно еще отметить, что рассматривались и более полные модели с учетом
вязкости грунта и его массы. Но чего-то существенно нового, кроме очевидного,
это для приложений и понимания не давало.
322 Ю.И. Неймарк. Математическое моделирование как наука и искусство

41. ОСНОВНАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ


СОВРЕМЕННОЙ НАУКИ И ТЕОРИЯ КОЛЕБАНИЙ
Настоящая книга – это лекции автора, читаемые им студентам младших
(2–3) курсов, магистрантам, аспирантам и по другим поводам, обработанные, как
единое целое, о математических моделях и моделировании. Но по мере прибли-
жения к переднему краю науки, к тому, что сделано в ХХ веке, последователь-
ность и цельность изложения уступает место фрагментарности и, компенсируя
ее, впервые делаются ссылки на литературу. Эта глава не лишена этого недостат-
ка: она, по существу, − переработанное изложение докладов автора 1998 и 2001
годов на международных конференциях, посвященных памяти Я.З. Цыпкина и
его и моего учителя А.А. Андронова, как ученых, имеющих мировую извест-
ность. Оба доклада тематически связаны между собой и настоящей книгой: в ос-
нове теории колебаний лежит математическая модель «динамическая система»,
которая и есть основная модель современной науки и основная модель настоя-
щей книги. Александр Александрович Андронов, ученик Л.И. Мандельштама,
признанный в мире создатель новой науки – теории нелинейных колебаний, и
поэтому естественно связать изложение содержания, роли и места теории коле-
баний в науке именно с ним.
Динамическая система как основная математическая модель современ-
ной науки. Научное понимание мира человечеству пришло с небес. Невозможно
представить себе другие объекты, нежели Солнце, Луна и планеты на фоне вели-
чественного звездного ночного или дневного неба, одновременно столь привле-
кающие внимание, значительные, загадочные и, вместе с тем, обладающие ярки-
ми простыми закономерностями. Не погода, приходящая тоже с небес, а именно
Солнце, Луна, планеты и звезды, потому что капризы погоды неуловимы, а то, что
предсказуемо, тесно связано с Солнцем и звездами, т.к. обнаруживается неизмен-
ная причинная связь. Птолемей, Коперник, Галилей, Ньютон – вот привычные ве-
хи в истории познания неба и, наконец, Лаплас, перенесший причинную обуслов-
ленность небесных явлений на явления земные, провозгласивший причинную
обусловленность и предсказуемость всех явлений мира и его изменений, всего,
что в нем происходит. И это сделал тот самый Лаплас, который разрабатывал тео-
рию вероятностей и ввел в эту науку самую известную случайную величину с
распределением, носящим его имя.
Детерминизм Лапласа основывался на потрясающих воображение успехах
астрономии и механистической трактовке мира, и повседневно наблюдаемая слу-
чайность его не поколебала. Это потом все явления мира разделили на предска-
зуемые и непредсказуемые, случайные, резко противопоставив их друг другу. А
сегодня принцип детерминизма имеет всеобщий смысл, в расширенном понима-
нии он справедлив и для марковских случайных процессов, статистической физи-
ки и квантовой механики. Он лежит в основе нашего понимания мира и воплощен
в модели динамической системы, включающей описание, называемое состоянием,
и однозначный оператор его прогнозирования. Состояние может не быть непо-
41. Основная математическая модель современной науки и теория колебаний 323

средственно наблюдаемым и измеряемым, но оно как-то связано с наблюдаемыми


и измеряемыми величинами.
Следующая историческая веха – Анри Пуанкаре. Будущее следует за настоя-
щим и им определяется. Этот принцип детерминизма реализуется в описаниях
природных явлений дифференциальными уравнениями. До Пуанкаре усилия ис-
следователей были направлены на получение их решений: аналитических, при-
ближенных и численных. Пуанкаре стал изучать всю совокупность решений в их
геометрической интерпретации в фазовом пространстве. Это повлекло новую то-
пологическую точку зрения на совокупность всех решений, как на разбиение фа-
зового пространства на фазовые траектории, и привело к качественной теории
дифференциальных уравнений и теории динамических систем. Фазовый и бифур-
кационный портреты динамической системы позволили составить полное качест-
венное представление о динамике, свойствах и явлениях в изучаемом объекте, ко-
торые могут в нем происходить с изменением времени и параметров.
Построение математических моделей эволюционных процессов в виде дина-
мических систем – это проблема отыскания, изобретения самодостаточного опи-
сания – состояния – и нахождение оператора его изменения со временем. В оты-
скании этого самодостаточного описания человечество проявило громадную изо-
бретательность. В механике состояние – это положения и скорости всех матери-
альных точек, в электродинамике – придуманные М. Фарадеем фантастические
электрические и магнитные поля, в квантовой физике – знаменитая функция ψ,
для случайных марковских процессов и описываемых ими физических явлений –
плотность вероятностей. Состояние конструируется человеком как самодостаточ-
ное описание, по которому возможен прогноз такого же описания. Изучения био-
логических и общественных явлений, возможно, приведут к совершенно неожи-
данным конструкциям состояния.
Для систем управления состояние – не только самодостаточное описание для
прогноза, но и полная информация для организации управления. Понятия управ-
ляемости и наблюдаемости исходят из состояния, его управляемости и его на-
блюдаемости.
Изучению динамической системы как математической модели уже более ста
лет. С одной стороны, результаты этого исследования огромны, и мы очень много
узнали, а с другой, – и сегодня достаточно полное изучение конкретной много-
мерной системы – очень трудная и часто неразрешимая задача. Регулярный успех
достигнут только для размерности системы n ≤ 2; для n = 3 успех возможен лишь
благодаря новой вычислительной технике, а при n ≥ 4 – это сделать трудно и час-
то невозможно.
До последнего времени существовала пропасть между известными, конкрет-
ными системами, в подавляющем большинстве с простой структурой фазового
портрета и простыми движениями, и теоретически открытыми в работах
А. Пуанкаре и Д. Биркгофа сложными структурами и движениями, рекуррентными
и устойчивыми по Пуассону, непериодическими и нерекуррентными. Устойчивые
по Пуассону – это те, которые мы сегодня называем хаотическими и стохастиче-
скими, и странными аттракторами. Новое, что принесли 60–80 годы ХХ века, со-
стоит не в открытии новых движений и странных аттракторов, а в осмыслении и
наглядном показе, как эти сложные движения возникают в динамических систе-
324 Ю.И. Неймарк. Математическое моделирование как наука и искусство

мах, описываемых простыми по виду дифференциальными уравнениями, и как и


почему эти движения, несмотря на соблюдение теоремы о единственности реше-
ния дифференциальных уравнений, оказываются непредсказуемыми и случайны-
ми.
Мне представляется, что первым ударом по устоявшимся ограниченным
представлениям о поведении динамических систем, ударом, послужившим спус-
ковым крючком, были работы начала 60-х годов XX века математика С. Смейла.
До него представления о диссипативных динамических системах в значительной
мере ограничивались тем, что наблюдалось у грубых двумерных систем [2−4].
Смейл показал, что в многомерном случае, n > 2 , существуют грубые динамиче-
ские системы с очень сложными движениями; с бесконечным числом периодиче-
ских движений; в пространстве динамических систем могут быть области негру-
бых систем и, следовательно, негрубость не есть необщность [46].
Эти неожиданные факты в короткое время вызвали бум, который в 70–80 го-
дах вовлек в свой вихрь новых людей, в основном физиков и механиков, не
знающих ни классической теории динамических систем Пуанкаре – Биркгофа, ни
исследований геодезических линий (траекторий свободного движения материаль-
ной точки) на поверхности отрицательной кривизны, начатых еще Ж. Адамаром,
ни символической динамики, ни более поздних работ по теории нелинейных ко-
лебаний и исследованию конкретных систем. Им казалось, что все происходит
впервые, для них это так и было.
Если говорить о произвольных динамических системах, то несомненно, что
среди них очень много и, возможно, подавляющее большинство таких, которые
мы никогда не сможем изучить. Но скорей всего, что это и не очень нужно. То,
что является общим и частным с формально математической точки зрения про-
странства динамических систем, не всегда совпадает с тем, что интересно и
встречается в реальных системах. Мне кажется, что хорошим примером этого
различия может служить вопрос об общности и частоте встречаемости устойчи-
вых равновесий. Однажды А.А. Андронов сказал мне, увлекающемуся простран-
ством коэффициентов полиномов, что с точки зрения этого пространства при
больших размерностях устойчивость – очень редкая вещь. Я с этим согласился, но
на предложение этим заняться никак не откликнулся. Позднее этот вопрос увлек
других исследователей, показавших, что это действительно так. Вместе с тем мне
представляется, что это не имеет никакого отношения к частоте встречаемости
устойчивых равновесий в природе, и особенно технике. Все дело в том, как вы-
брано пространство параметров, в котором выделяется область устойчивости, ка-
кие параметры выбирает природа, и какие конструирует человек. Вхождение
варьируемых параметров определяется физической структурой системы. В свое
время были интересные и отчасти забытые работы И.И. Гальперина по выделению
структурных схем линейных систем управления, устойчивых при любых значени-
ях параметров, устойчивых в силу своей структуры. Сегодня упорно во всем мире
ищутся системы управления, малочувствительные к изменениям своих парамет-
ров, грубые – по терминологии Андронова – Понтрягина, робастные – по-
английски. Мне кажется, что в этом вопросе представляет интерес отыскание сис-
тем, робастных по своей структуре.
41. Основная математическая модель современной науки и теория колебаний 325

Поведение нашего мира, по-видимому, существенно отличается от изучае-


мых нами динамических систем с компактным фазовым пространством. Свойство
повторяемости, имеющее место у установившихся движений динамических сис-
тем, не присуще нашему миру. В нем, скорее всего, все происходит наново. Эк-
клезиаст был не прав, говоря, что все, что было – и будет. Прав был Демокрит. Но
на ограниченных промежутках времени в ограниченных масштабах упрощающая
идеализация, принимаемая теорией динамических систем, вполне приемлема.
По-видимому, самая простая, эффективная и практически значимая класси-
фикация движений динамических систем – это разделение их на устойчивые и не-
устойчивые, на устойчивые и неустойчивые по Ляпунову и орбитно устойчивые и
неустойчивые. Различие между устойчивостью по Ляпунову и орбитной устойчи-
востью весьма значительно. Устойчивость по Ляпунову – это близость законов
изменения состояния во времени для невозмущенного и возмущенного движений.
Орбитная устойчивость – это неограниченное пребывание возмущенного движе-
ния в малой окрестности невозмущенного. Законы изменения состояний возму-
щенного и невозмущенного движений при этом могут значительно различаться.
Из сказанного следует, что из устойчивости по Ляпунову всегда следует орбитная
устойчивость, а обратное не имеет места.
Простые установившиеся движения динамических систем – это устойчивые
состояния равновесия и периодические движения, сложные – устойчивые по Пу-
ассону, отличные от простых. Они обладают ослабленным свойством периодич-
ности, состоящим в повторяемости со временем с любой степенью точности лю-
бого из пройденных ранее состояний, они орбитно устойчивы, но вообще неус-
тойчивы по Ляпунову.
Устойчивость и неустойчивость по Ляпунову в общем случае с точки зрения
значений показателей Ляпунова – это экспоненциальная устойчивость или неус-
тойчивость. Предполагая эту общность, сложные движения – это орбитно устой-
чивые движения, экспоненциально неустойчивые по Ляпунову, т.е. такие, от ко-
торых почти всякое возмущенное движение локально экспоненциально удаляется,
а в целом все время блуждает по некоторой области – аттрактору. Однако устой-
чивое по Пуассону и экспоненциально устойчивое или асимптотически устойчи-
вое движение обязательно просто периодическое.
Почти все остальные движения асимптотически приближаются к простым
или сложным установившимся движениям, состояниям равновесия, периодиче-
ским движениям и движениям, устойчивым по Пуассону.
В дополнение к сказанному я хотел бы кратко ответить на вопросы предска-
зуемости и непредсказуемости движений динамических систем и механизма воз-
никновения непривычных, сложных, непредсказуемых и случайных движений.
Они уже затрагивались ранее при рассмотрении стохастического осциллятора –
«часов наоборот». Ниже о том же, но в более общем плане.
В отсутствие неизвестных возмущений и погрешностей счета все движения
предсказуемы. Фактическая непредсказуемость возникает, с одной стороны, от
наличия неустранимых случайных или неизвестных возмущений, а с другой –
столь же неизбежных погрешностей вычислений. Различие между этими двумя
факторами состоит в неповторяемости первого и повторяемости второго при ис-
пользовании идентичных цифровых вычислительных средств. Однако результи-
326 Ю.И. Неймарк. Математическое моделирование как наука и искусство

рующее действие этих неустранимых факторов погрешностей может быть суще-


ственно разным.
Возможно, что с уменьшением неизбежных погрешностей неограниченно
растет и достижимая точность прогноза для всех t > 0 . В этом случае мы склонны
считать, что имеет место предсказуемость. Но возможен и совершенно другой
случай, когда, сколь бы ни были малы неизбежные погрешности, ошибка прогно-
зирования может быть не меньше некоторой конечной величины, которая может
существенно превосходить допустимую. В этом случае мы вынуждены признать,
что имеет место непредсказуемость. Именно это имеет место для сложных дви-
жений в силу их экспоненциальной неустойчивости по Ляпунову.
Динамическую систему можно рассматривать и с привычной для специали-
стов по теории управления точки зрения, как звено с входом и выходом, однако
при этом следует считать, что в звене могут автономно происходить динамиче-
ские процессы, которые возмущаются входным случайным воздействием. При
таком подходе в зависимости от этих автономных движений звено может быть
преобразователем, усилителем или генератором стохастичности [28]. Преобразо-
ватель стохастичности – это то, что хорошо известно и настойчиво изучалось.
Усилитель и генератор стохастичности – нечто совершенно неожиданное, ранее
никак не учитываемое.
Дисперсия выхода усилителя стохастичности может быть намного большей
дисперсии входного воздействия, и даже с локальным коэффициентом усиления,
стремящимся к бесконечности при уменьшении случайного входа. При этом сто-
хастические свойства выхода, по-прежнему, как и в случае преобразователя сто-
хастичности, определяются исчезающе малым случайным входом, но выход неог-
раниченно уменьшается вместе с входом. Для генератора стохастичности при
сколь угодной малости случайного входа дисперсия выхода остается больше не-
которой конечной величины, а его статистическое описание не зависит от входа.
Оно полностью определяется самой невозмущенной системой, ее детерминиро-
ванным описанием.
Наконец, о механизме возникновения сложных, устойчивых по Пуассону,
движений усилителей и генераторов стохастичности. В свое время рождение тео-
рии автоколебаний было неразрывно связано с открытием Андроновым связи ме-
жду ними и предельными циклами Пуанкаре. В какой-то мере это повторилось и
со сложными движениями, но теперь благодаря не введенным и изучаемым Пуан-
каре предельным циклам, а открытым им гомоклиническим и гетероклиническим
кривым [41], открытым в связи с безнадежно и длительно изучаемой им ограни-
ченной проблемой трех тел. Гомоклинические и гетероклинические фазовые кри-
вые или движения динамической системы – это двоякоасимптотические движения
при t → ∞ и t → –∞, стремящиеся к одному и тому же или, соответственно, раз-
ным неустойчивым седловым периодическим движениям. Вот эти, естественно и
общим образом возникающие гомоклинические и гетероклинические кривые
(движения), асимптотические, казалось бы, к несущественным неустойчивым
седловым периодическим движениям, как выяснилось, могут порождать сложные,
орбитно устойчивые и неустойчивые по Ляпунову движения [22–25, 28].
О сложности этих движений писал уже А. Пуанкаре, но он, по-видимому, не
подозревал, что они могут порождать сложные установившиеся движения. Слож-
41. Основная математическая модель современной науки и теория колебаний 327

ные движения, как оказалось, могут порождать двоякоасимптотические движения


не только к периодическим движениям, но и состояниям равновесия, или к тем и
другим (будем называть их также гомоклиническими и гетероклиническими).
Широко известно, что устойчивое периодическое движение может родиться
от теряющего устойчивость состояния равновесия (бифуркация Андронова). Ана-
логично, сложное движение, орбитно устойчивое и неустойчивое по Ляпунову,
может родиться от замкнутых контуров, составленных из гомоклинических и ге-
тероклинических кривых.
Выше речь шла об описании и поведении изолированной системы, не под-
верженной влиянию внешних воздействий, ее еще называют автономной. Только
в этом случае состояние и его изменение определяются самой системой. В неизо-
лированной системе, подверженной внешним по отношению к системе воздейст-
виям, это уже не так: изменение состояния зависит не только от самого состояния,
но и внешних воздействий. Динамическую систему с внешним воздействием на-
зывают еще автоматом, с которым мы встречаемся при описании игр, целесооб-
разного поведения и распознавания (персептрон). Автомат предполагает наличие
выхода, определяемого его состоянием, либо состоянием и внешним воздействи-
ем. Это сближает понятие автомата со звеном с входом и выходом, а в случае его
линейности – с коэффициентом передачи и амплитудно-фазовой частотной харак-
теристикой. Если внутреннее устройство звена нам неизвестно, а можно регист-
рировать только его вход и выход, то такое звено называют еще черным ящиком.
Неизолированная, неавтономная система, безусловно, более общая, чем изолиро-
ванная и автономная, но несмотря на это, именно изолированная, автономная сис-
тема остается основной моделью, поскольку она описывает базовые основопола-
гающие законы природы, и поскольку путем расширения рассматриваемого объ-
екта всегда, как мы думаем, можно достичь его изолированности и автономности.
С этой точки зрения неавтономность есть результат выделения некоторой части в
изолированной автономной системе.
А.А. Андронов и теория колебаний как наука об эволюционных процес-
сах и явлениях. Александр Александрович Андронов создал новую науку – тео-
рию нелинейных колебаний, всемирно известную научную школу и оставил уче-
ников, продолживших его дело [37]. Теория колебаний сегодня – это широкая
всеобъемлющая наука об эволюционных процессах в природе, технике и общест-
ве, в механике, физике, астрономии, химии, биологии, и во всем, что нас окружа-
ет, и в нас самих. Буквально и в восприятии многих людей название «Теория ко-
лебаний» не адекватно тому, что я сказал. Но так распорядилась история: назва-
ние пришло от колебаний маятника, механического и электрического осциллято-
ров, и история же определила мощь и значимость теории колебаний как науки
всеобъемлющей, воплощающей в себе великую идею изоморфизма и единства
природы и мира.
Механика – теоретическая и прикладная – включает в себя и теорию колеба-
ний, и теорию устойчивости, и отчасти даже теорию управления. Во всяком слу-
чае, эти разделы имеются в четырехтомнике «Механика в СССР за 50 лет» и в
программах традиционных съездов по механике. Более того, основоположник со-
временной теории устойчивости А.М. Ляпунов был академиком по отделению ме-
ханики. Лагранж, создавший теорию малых колебаний, основывался на механике.
328 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Знаменитый трактат Рэлея, от которого, по нашим представлениям, ведет свое на-


чало наука о колебаниях, назывался «Теория звука», т.е. относился к механике.
Известная книга Уитткера «Аналитическая механика» включает не только теорию
колебаний и теорию устойчивости, но и теорию динамических систем. Знамени-
тый труд Пуанкаре, основополагающий в теории динамических систем, называет-
ся «Новые методы небесной механики». Широко известные инженерные книги по
теории колебаний Ден Гартога и С.П. Тимошенко рассказывают о колебаниях ме-
ханических систем. Если этим ограничиться, то создается впечатление, что теория
колебаний целиком относится к механике. Однако сказанное говорит лишь об ог-
ромной роли механики в возникновении и становлении теории колебаний. Уже в
лекциях Л.И. Мандельштама 1930−31 и 1931−32 учебных годов, прочитанных на
физфаке МГУ и изданных в 1955 году, теория колебаний предстает как самостоя-
тельная наука. В них идет речь о колебаниях не только в механике, но и во многих
разделах физики. Благодаря успешным исследованиям школы Мандельштама, в
1931 году состоялась первая Всероссийская конференция по теории колебаний.
Именно на этой конференции А.А. Андронов выступает с широким и обстоятель-
ным докладом о математических проблемах теории колебаний. Следующей ре-
шающей вехой в становлении теории колебаний как самостоятельной науки явля-
ется книга А.А. Андронова, А.А. Витта и С.Э. Хайкина «Теория колебаний», вы-
шедшая в 1937 году. Следует отметить и замечательную книгу Г.С. Горелика «Ко-
лебания и волны», написанную в 1950 году. Первая книга заложила основы тео-
рии нелинейных колебаний, вторая еще более расширила охват теорией колеба-
ний разнообразных физических явлений.
Значительный вклад в становление теории колебаний как самостоятельной
науки внесла и школа Крылова – Боголюбова – Митропольского. Именно она ини-
циировала и организовала длительную традиционную серию международных
конференций и симпозиумов по теории нелинейных колебаний с разделами «Ана-
литические и качественные методы исследования и их приложения» и проводила
весьма длительную серию научных школ по этой тематике. В более поздний пе-
риод с 1972 года, когда уже самостоятельность теории колебаний как науки не
вызывала сомнений, следует отметить научные школы, организуемые в г. Горь-
ком (Нижнем Новгороде): Научно-исследовательский радиофизический институт
(НИРФИ), затем Институт прикладной физики (ИПФ РАН), а также конференции,
проводимые Научно-исследовательским институтом прикладной математики и
кибернетики (НИИ ПМК). Имевший место на них бум, вызванный «открытием»
хаотических и стохастических колебаний, охватил всю страну. Теорию колебаний
стали ассоциировать с нелинейной физикой, нелинейной динамикой и синергети-
кой. Теория колебаний стала наукой об общих закономерностях эволюционных
процессов в механике, физике, радиотехнике, радиофизике, гидродинамике, тео-
рии управления, химии, биологии, науке об обществе и т.д. Одновременно теория
колебаний обрела прочную математическую опору в качественной теории диффе-
ренциальных уравнений и теории динамических систем, не только используя их,
но и существенно определяя их проблематику и направления исследований.
Из сказанного видно, сколь многообразны связи теории колебаний с другими
науками, и что другие науки – не только объект приложений ее методов, но и не-
иссякаемый плодотворный источник новых вопросов, задач и проблем.
41. Основная математическая модель современной науки и теория колебаний 329

Ядром теории колебаний являются математические модели законов природы


и происходящих в ней процессов, включая технику и общество. В основе этих
моделей лежит понятие состояния и оператора его изменения. Состояние изобре-
тается, оператор открывается. Фарадей изобрел электрические и магнитные поля
– состояние, Максвелл написал уравнения, определяющие оператор.
В зарождении и развитии каждой науки основную роль играют так или иначе
установленные факты, методы изучения и общее понимание. В теории колебаний
факты – это накопленные знания математических моделей и характера протекания
описываемых ими процессов и сопровождающих их явлений; методы – способы
изучения этих математических моделей в виде обычных дифференциальных
уравнений или уравнений в частных производных, или в виде динамических сис-
тем того или иного вида; общее понимание – это прежде всего наглядные пред-
ставления о возможных эволюционных процессах, в частности представления о
фазовом пространстве, состояниях равновесия и периодических движениях, авто-
колебаниях, хаосе и странном аттракторе, волнах, волновых и модовых взаимо-
действиях, дисперсии, резонансе, синхронизации, бифуркациях и бифуркацион-
ном портрете, локальной и глобальной устойчивости, области притяжения, мяг-
ком и жестком возбуждениях, гистерезисе, принципе суперпозиции, скользящих
движениях и разрывах и т.д.
Основные типы эволюционных процессов можно разделить на:
1) порядок, синхронизацию и предсказуемость на основе асимптотической
устойчивости по Ляпунову;
2) хаос, непредсказуемость и стохастичность на основе экспоненциальной
неустойчивости при орбитной и глобальной устойчивости;
3) гомеостаз, реализацию цели или программы и самоорганизацию на основе
направленных обратных связей и управления.
В этом кратком перечислении преодоленные в ХХ веке многовековые заблу-
ждения, огромные новые знания, научное мировоззрение и понимание эволюци-
онных процессов в природе, технике и обществе. В этом не только вчера и сего-
дня теории колебаний, но и предвидимое завтра. Одно из важнейших различий
вчера и сегодня – это то, что вчера теория колебаний в основном изучила и освои-
ла простейшие установившиеся движения – состояния равновесия и периодиче-
ские движения, хотя неявно сложные движения проявляли себя в статистической
термодинамике и физике, турбулентности жидкостей, газов и плазмы, а сегодня
стало возможным все это рассматривать с единых позиций, как проявление все
той же динамической системы. Кроме того, это еще и изучение процессов, осно-
ванных на направленных связях и управлении, изучение выходящего за рамки
бурно развивающейся теории автоматического регулирования. Важно это не
только для понимания природы, человека, общества, но и их эволюции, создания
интеллектуальных машин.
Многие очень крупные открытия в науке совершаются дважды: первый раз
абстрактно-теоретически, отдельными людьми, и это открытие никого не волнует
и не трогает, его не замечают, и второй раз практически жизненно, когда оно ов-
ладевает многими умами и потрясает людей, открывая им что-то ранее неведомое,
неожиданное и очень важное. В теории колебаний так было с открытием автоко-
лебаний и с открытием хаотических и стохастических колебаний.
330 Ю.И. Неймарк. Математическое моделирование как наука и искусство

У крупных открытий есть и третья фаза, когда они становятся общеизвест-


ными и как бы «исчезают». Так произошло с великим открытием, что Земля – шар
и ничем не поддерживается, что Земля вращается вокруг Солнца, что две массы
или два заряда взаимодействуют друг с другом, хотя между ними пустота. Так
произошло и с автоколебаниями, происходит сейчас с хаотическим и стохастиче-
ским движениями, так произошло даже со специальной теорией относительности:
она уже никого не удивляет, и студенты воспринимают ее как должное и даже
обычное.
Первый раз устойчивые предельные циклы открыл Анри Пуанкаре. Пуанкаре
− по типу мышления великий геометр − изобразил решения дифференциальных
уравнений в виде кривых в пространстве их переменных, и именно поэтому есте-
ственно и легко обнаружил предельные циклы. Они были естественны потому,
что в некоторых общих ситуациях замыкание кривой было неизбежным, и эту не-
избежность, во всяком случае на плоскости, Пуанкаре сделал очевидной, благода-
ря введению секущего отрезка и функции последования на нем (рис. 41.1). Была
очевидна не только неизбежность замыкания кривой, т.е. периодичность решения
дифференциального уравнения, но и возможность его устойчивости. И именно эта
естественность и простота до примитивности способствовали тому, что никто на
это не обратил особого внимания, и никому не пришло в голову, что это интерес-
но, очень важно и несет открытие человечеству.
u f
u
u

u = f (u)

u u u* u
Рис. 41.1. Секущий отрезок, функция последования и диаграмма Ламерея;
u* – неподвижная точка, отвечающая устойчивому предельному циклу

Второй раз, спустя значительное время, устойчивые предельные циклы в виде


автоколебаний реальных систем открыл А.А. Андронов [5]. Открыл не как абст-
рактные устойчивые замкнутые кривые, а как практически жизненно важные яв-
ления в механике, электричестве, астрономии, химии и биологии; как явления в
природе и технике: в далеких звездах цефеидах, охватывающей весь мир радио-
передаче, звучании музыкальных инструментов, шимми автомобиля и флаттере
крыла самолета, могущих их разрушить, в вибрации инструмента при механиче-
ской обработке, препятствующей ее точности, и многом, многом другом.
Это второе открытие вызвало революцию во взглядах инженеров и ученых.
Подчас оно воспринималось с недоверием, с большим трудом, и нередко активно
отвергалось, как это, например, имело место в химии с известной реакцией Бело-
усова, хотя эта реакция демонстрировалась в прозрачной колбе с химическим рас-
твором, периодически меняющим свой цвет. Даже в механике, где, казалось бы,
все достаточно просто, наблюдалось длительное неприятие и, например, шимми
автомобиля трактовалось как резонанс с воздействием неровностей дороги, а виб-
41. Основная математическая модель современной науки и теория колебаний 331

рации при точении трактовались как тот же резонанс, вызванный отрывами


стружки, и т.п. Признание автоколебаний было без помех, пожалуй, только в за-
рождающейся радиотехнике, но там податься было некуда, на них все основано.
А.А. Андронов не просто указал на идентичность предельных циклов А. Пу-
анкаре и автоколебаний в реальных объектах. Он нашел их, изучил во многих ре-
альных конкретных системах, обнаружил и исследовал явления захвата и затяги-
вания – сегодня синхронизации – при периодическом воздействии на автоколеба-
тельную систему и при взаимодействии ее мод, опираясь сначала на метод малого
параметра А. Пуанкаре, а затем в сильно нелинейных системах − на метод точеч-
ных отображений. Он изучил, как возникают и исчезают автоколебания при изме-
нении параметров (рис. 41.2–41.5) – это широко сейчас известная бифуркация ро-
ждения автоколебания – предельного цикла – из теряющего устойчивость равно-
весия и другие (от замкнутой сепаратрисы седла, при слиянии и исчезновении ус-
тойчивого и неустойчивого равновесий) [2–4].
u u
µ

u* u u
* *
u u
Автоколебание
Устойчивые
Автоколебание
равновесия Неустойчивые
равновесия
µ µ
Рис. 41.2. Бифуркация рождения автоколебания
Рис. 41.3. Жесткое возбуждение
(мягкое возбуждение) при изменении
автоколебаний
параметра µ. Диаграмма Ламерея
и бифуркационная диаграмма

µ
Рис. 41.4. Рождение автоколебания Рис. 41.5. Рождение автоколебания
от сепаратрисы седла при слиянии седла и узла

Эти открытия были сделаны применительно к гладким системам второго по-


рядка. Обобщение на многомерный случай и более общие системы (кусочно-
гладкие и сингулярно возмущенные) было делом последующих исследований, как
и использование новых возможностей вычислительной техники (рис. 41.6–41.8).
332 Ю.И. Неймарк. Математическое моделирование как наука и искусство

µ
Рис. 41.6. Новые бифуркации
автоколебания в многомерном случае
(удвоение периода, рождение тора)

Γ+

Γ_

Рис. 41.7. Новые возможные равновесия O Рис. 41.8. Разрывные автоколебания


в разрывных кусочно-гладких системах в предельной сингулярно
(в точке равновесия правые части возмущенной системе
дифференциальных уравнений в нуль
не обращаются)

Все это привело к тому, что вместо мифических механизмов возникновения


колебаний человечество научилось открывать истинные причины колебаний и
устранять их там, где они вредны и опасны, и вызывать, где нужны и полезны. В
современной технике обоих случаев очень много, и барьер неприятия автоколеба-
ний, возникающих как бы из ничего, был преодолен. До этого были понятны зату-
хающие и в идеализации незатухающие колебания маятника, грузика на пружин-
ке, упругой среды и т.д., понятны вынужденные колебания, вызываемые действи-
ем переменной силы или напряжения, было понятно и удивительное явление ре-
зонанса, но как могут возникать колебания «из ничего», без вызывающего их воз-
действия, было непонятно и неприемлемо, и этот психологический барьер был
преодолен, и сегодня автоколебания всем привычны и понятны.
Такова сравнительно простая и ясная история открытия автоколебаний и свя-
занных с ними понятий устойчивости, фазового портрета, бифуркаций, бифурка-
ционного портрета, синхронизации, грубости и других. Нечто похожее, но в
большем масштабе, в соответствии с увеличением числа вовлеченных в науку
людей и трудностью проблемы, произошло и с открытием сложных установив-
шихся движений: хаотических и стохастических. Но теперь число непосредствен-
ных участников огромно, все переплетено и запутано, а причина неприятия неод-
нозначна. Описать все это сколько-нибудь полно невозможно. История эта проти-
41. Основная математическая модель современной науки и теория колебаний 333

воречива: с одной стороны, движения как бы не принимались, а с другой, – на них


базируются статистическая термодинамика и физика, не отрицается и турбулент-
ность, так что дело не в непризнании, а непонимании, как детерминизм может по-
рождать непредсказуемость и случайность и связанную с ними сложность. Но и
это не совсем так: общее объяснение этому давали и Пуанкаре, и Крылов, и дру-
гие. Не было ясного приемлемого механизма, как это происходит – наверное, это
главное. С этой точки зрения, опять первый Пуанкаре.
Открытие Пуанкаре – это гомоклинические и гетероклинические кривые и
связанное с ними необычайно сложное и запутанное поведение соседних кривых,
которые Пуанкаре даже не пытался изобразить. Именно в этой непостижимой
сложности увидел Пуанкаре камень преткновения в ее решении, но он не придал
этому большого значения, точнее, не продолжил исследование. Почему так слу-
чилось, трудно сказать, возможно, не пришло время, отвлекли другие проблемы.
Гомоклинические и гетероклинические кривые уже не так просты, как пре-
дельные циклы, секущий отрезок и функция последования. Вместо секущего от-
резка Пуанкаре прибег к секущей плоскости и порождаемому на ней точечному
отображению T.
На рис. 41.9 седловое периодическое движение Γ и гомоклиническая к нему
кривая γ. На рис. 41.10 их сечение двумерной плоскостью, на которой O – седло-
вая неподвижная точка пересечения Γ с секущей, а точки …, M−1, M0, M1, ... – по-
следовательные точки пересечения секущей с гомоклинической кривой γ и одно-
временно часть точек пересечения инвариантных кривых S− и S+ седловой точ-
ки O. Сложность, о которой говорил Пуанкаре, – это поведение кривых S− и S+: ни
одна из них не пересекается сама с собой, но они пересекаются друг с другом в
бесконечном числе точек и неограниченно продолжаются. Как они это делают,
Пуанкаре описывать не стал.

_
S
Рис. 41.9. Седловое движение Γ S+ γ
и гомоклиническая кривая Пуанкаре γ

Можно заметить, что если выделить показанную на рис. 41.10 область D, то


области ..., σ−1, σ0, σ1, ... и области ..., ν−1, ν 0, ν 1, ..., при точечном отображении T
последовательно переходят друг в друга, образуя один поток входящих в область
D точек, и другой – выходящих из нее. Чтобы понять всю сложность происходя-
щего с ними внутри области D, укажем, что в области G (рис. 41.11), составленной
из окрестности ε(Γ) седловой замкнутой кривой Γ и окрестности ε(γ) гомоклини-
ческой кривой γ имеется бесчисленное множество разных седловых кривых. Если
окрестности ε(Γ) и ε(γ) достаточно малы, то всякой бесконечной в обе стороны
последовательности целых чисел вида
334 Ю.И. Неймарк. Математическое моделирование как наука и искусство

…, j−2, j−1, j0, j1, j−2, … (j−2 > N)


отвечает единственная седловая кривая, которая последовательно оборачивается
…, j−2 , j−1 , j0 , j1 , j−2 , … раз возле кривой Γ в ε(Γ), а между ними возвращается
в ε(Γ), проходя вдоль гомоклинической кривой γ в ее окрестности ε(γ) [22–24]. Из
этого следует, что, кроме гомоклинической кривой γ в G существует бесконечное
множество других гомоклинических кривых, возле каждой из которых есть, в
свою очередь, такие же кривые, и так до бесконечности.

σ−4 v4

σ−3 O v3
v σ2
σ1
v v2
σ−2
σ0
v S+
S−
D Рис. 41.10. Гомоклиническая структура
на секущей поверхности

σ−1 v1

Рис. 41.11. Окрестности гомоклинической


γ структуры

Теперь, глядя «сквозь магический кристалл», общий механизм образования


сложных движений можно представить в виде последовательно-параллельного
прохождения фазовых траекторий вблизи гомоклинических и гетероклинических
кривых [24]. При этом происходит сложное и тонкое их разделение, подобно то-
му, как это происходит с входным потоком областей ..., σ−2, σ−1, σ0, σ1, ... Если об-
ласть σi пересекается с v− j , то она выбрасывается наружу (вовне области D), как
точка областей ν−j+1, ... ,ν−1, ν0, ν1, ... Вариантов тут очень много, но механизм
один. Наглядно и схематически этот механизм похож на то, что происходит с го-
рошинами на доске Гальтона, если бы их снизу собирать и сыпать в верхнюю во-
ронку снова и снова.
Со сложными движениями столкнулся и Ж. Адамар, изучая геодезические
линии на поверхности отрицательной кривизны в динамической интерпретации
41. Основная математическая модель современной науки и теория колебаний 335

свободного движения по ней материальной точки. Это открытие было воспринято


математиками и привело к символической динамике и ее статистическому описа-
нию. Здесь можно обратить внимание на не выявленную в то время связь с дви-
жениями в гомоклинической структуре.
Сложные движения присутствуют и в теории центральных движений Д. Бирк-
гофа [23], но скорее это то, что может быть, а не как это может быть.
Все сказанное выше можно отнести к первому этапу открытия сложных дви-
жений. Второй этап массового повального увлечения сложными хаотическими и
стохастическими движениями детерминированных динамических систем вызван,
пожалуй, не столько новыми теоретическими открытиями этого первого этапа,
сколько реальной возможностью их получения и наблюдения во многих конкрет-
ных системах с помощью компьютера. Компьютер стал решающим доводом их
существования и реальности, это породило своеобразное компьютерное понима-
ние и толкование их происхождения и классификации. После сказанного хочу из-
ложить взгляды А.А. Андронова на сложные движения, относящиеся к первому
этапу.
А.А. Андронов знал о сложных центральных движениях Биркгофа и говорил
о них в опубликованном докладе первой Всероссийской конференции по колеба-
ниям в 1931 году. Он говорил об общей классификации движений динамических
систем, центральных движениях Биркгофа, включая рекуррентные и устойчивые
по Пуассону – сегодня хаотические и стохастические – и о том скромном месте,
которое занимают среди них автоколебания. Поставив ряд насущных проблем
теории колебаний, он не ставил задачу существенного расширения круга иссле-
дуемых движений. История показала, что это было бы несвоевременным, нужны
были другие, более мощные подходы и средства, чем те, которыми располагала
математика и наука в то время. Расширение этих исследований произошло много
позднее, в 60–80 годах XX века. Выступление А.А. Андронова относилось к тому
времени, когда основным освоенным инструментом исследования было сочетание
метода малого параметра Пуанкаре и теории устойчивости Ляпунова. В их рамках
сложные движения не обнаруживаются.
А.А. Андронова привлекала новая общая дисциплина – динамика машин, он
считал, что теория колебаний должна привести к ней и позволит ее создать. Он
оставил наброски содержания этой предполагаемой книги, которую ему не было
суждено написать. Машина, как он ее понимал, для того чтобы функционировать,
должна обладать свойством грубости, а ее рабочее движение должно быть асим-
птотически устойчиво по Ляпунову. С этих позиций единственные подлежащие
изучению установившиеся движения – это асимптотически устойчивые равнове-
сия и периодические движения. Возможно, именно поэтому в широко известной
книге «Теория колебаний» [2] в примечании к введению он написал: «Однако, по-
видимому, требование грубости системы запрещает все остальные рекуррентные
движения, кроме состояний равновесия и периодических». Заметьте – речь идет
не об устойчивых по Пуассону непериодических движениях, а только о рекур-
рентных. Рекуррентных – потому, что устойчивые по Пуассону он, по-видимому,
считал вообще не подходящими и не нужными для машин. Понятие же грубости –
еще до работы с Понтрягиным – понималось очень широко и имело несколько ас-
336 Ю.И. Неймарк. Математическое моделирование как наука и искусство

пектов: физическая реализуемость, математическая корректность модели, при-


ближенная вычислимость и даже общность.
Сказанное относится к 1930-м годам. Позднее, во второй половине 40-х го-
дов, А.А. Андронов проявил интерес к сложным движениям в конкретных систе-
мах. Его аспиранты Н.А. Фуфаев и А.С. Алексеев обнаружили и исследовали их в
электромагнитном прерывателе и регуляторе температуры с опережением. Даль-
ше эти исследования были продолжены его учениками и учениками учеников
[27]. Они внесли значительный и существенный вклад как в первый этап, так и во
второй – этап повального увлечения сложными хаотическими и стохастическими
движениями, которые сегодня обнаруживают всюду и о которых сейчас знают
все.
Следует отметить, что наиболее значительные результаты в общей теории
динамических систем были получены в 60-е годы ХХ века С. Смейлом, как он сам
пишет, под влиянием работ А.А. Андронова.
В заключение приведу шуточный пример двух крупнейших открытий ХХ ве-
ка в познании динамики эволюционных процессов. Представьте нашу жизнь в ви-
де скачущего по лестнице мячика сначала вверх, потом вниз. Вверх – потому, что
он молод и коэффициент k отскока больше единицы, вниз – потому, что повзрос-
лел и коэффициент отскока уже меньше единицы. На рис. 41.12 приведены диа-
граммы Ламерея для последовательных значений скоростей отскока от ступенек
лестницы. Подъем стохастичен, спуск – регулярен.

k>1 k<1

υn+1 υn+1

1 < k<√ 2 υn k< 1 υn

Рис. 41.12. Прыгающий по лестнице мячик с k > 1 и k < 1


42. Математическая модель как плодотворная идея научного исследования. D-разбиение 337

42. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ КАК ПЛОДОТВОРНАЯ


ИДЕЯ НАУЧНОГО ИССЛЕДОВАНИЯ. D-РАЗБИЕНИЕ
Поскольку эта книга о математических моделях, то естественно отметить и
обратить внимание на все аспекты и методы их использования. А они действи-
тельно широки и незаменимы, поскольку только с помощью модели можно найти
ответы на многие вопросы, если их удается сформулировать на математическом
языке. Этот ответ может следовать только из каких-то известных нам сведений, а
эти сведения, сформулированные на математическом языке, и есть математиче-
ская модель. Поэтому все внутриматематические исследования, как и исследова-
ния всех математически поставленных задач естествознания, техники и прочего –
это тоже математическое моделирование. Так, теория целых положительных чи-
сел – это изучение математической модели, состоящей из элементов a0, a1, a2, …,
связанных соотношениями
an + a0 = an, an+1 = an + a1, n = 0, 1, 2, ….
Среди давно сложившихся и широко используемых весьма эффективных
внутриматематических моделей можно указать на модели геометрий, топологий,
всевозможных групп, линейных и нелинейных уравнений, дифференциальных
уравнений. К ним относится, конечно, и основная математическая модель в на-
стоящей книге – динамическая система, которую можно трактовать и как полу-
группу, а при взаимной однозначности ее оператора, как одномерную группу Ли.
Пример того, как простые математические модели указывают путь решения очень
сложной и, казалось бы, неприступной проблемы, уже был – это распознавание
образов и персептрон. Там такими моделями были модели объекта, образа и рас-
познавания образов соответственно в виде точки многомерного пространства,
множества точек в нем и узнавания принадлежности нового объекта этому мно-
жеству. Теперь будет описан другой пример, в котором речь идет о проблеме ус-
тойчивости движения. Рассказ состоит из двух частей. В первой части речь идет о
том, как под влиянием настоятельных потребностей приложений сформировалась
эта простая модель, во второй – к каким новым научным результатам она привела.
Теория управления как наука – детище ΧΧ века, но зародилась она еще во
второй половине ΧΙΧ века в работах гениального физика Д.К. Максвелла (1868) и
выдающегося инженера И.А. Вышнеградского (1877). Появились они под давле-
нием острой практической потребности обеспечения устойчивости и стабилиза-
ции скорости вращения паровых машин – основного источника механической
энергии начавшейся промышленной революции. Создал паровую машину Д. Уатт
вместе с центробежным регулятором скорости вращения, и вот эти регуляторы
начали обнаруживать непокорный нрав: чем, казалось бы, лучше их делали и
большего хотели от них получить, тем хуже они работали, подчас приводя к ава-
риям. Возникшая инженерная проблема была достаточно масштабной: только в
Англии было порядка ста тысяч паровых машин, а затем к ним присоединились и
паровые турбины. Непокорный нрав регуляторов – неустойчивость – породил ма-
тематическую теорию устойчивости, начавшуюся с упомянутых работ Максвелла
338 Ю.И. Неймарк. Математическое моделирование как наука и искусство

и Вышнеградского, впитавшую затем идеи и методы великих А. Пуанкаре и


А.М. Ляпунова и разросшуюся вширь и вглубь в результате интенсивной деятель-
ности многих выдающихся исследователей разных стран.
Историю теории автоматического управления можно рассматривать, как ис-
торию разрешения конфликта между устойчивостью и качеством управления.
Именно этот конфликт проявился в центробежных регуляторах Уатта, именно он
привел к изодромному регулятору, релейным системам, адаптивному и робастно-
му управлениям. Выбор стратегии управления ограничивается требованием к ди-
намике реализующей ее системы, что влечет во многих случаях необходимость
предварительного теоретического исследования, важнейшим элементом которого
является определение условий устойчивости. Для линейных систем, во всяком
случае с формальной точки зрения, проблема устойчивости полностью решается
известными критериями Рауса и Гурвица, возникшими вскоре под влиянием ра-
бот Максвелла и Вышнеградского. Поначалу эти алгебраические критерии устой-
чивости Рауса и Гурвица казались исчерпывающими. Потом выяснилось, что они
не поддаются обобщению на не алгебраические уравнения и не вполне удовле-
творяют практическим потребностям, особенно в вопросах конструирования но-
вых систем управления, машин и устройств. Инженерам нужен был метод иссле-
дования устойчивости, позволяющий понять, в каких пределах они могут выби-
рать и менять параметры конструируемой системы, не нарушая ее устойчивости,
какой свободой они обладают для выполнения остальных требований. Именно
поэтому уже в первой половине ΧΧ века возникли новые критерии устойчивости,
среди которых широкую известность получили графические критерии Михайлова
и Найквиста. Отметим, что уже Вышнеградский получил критерий устойчивости
в виде алгебраического неравенства, представив его в виде области устойчивости
на плоскости двух параметров – неравномерности и специально введенного вяз-
кого трения. На этой диаграмме конфликт между устойчивостью и качеством ста-
билизации скорости вращения паровой машины получил наглядное геометриче-
ское воплощение: определяющие их величины должны находиться в некоторой
области D, вид которой таков, что уменьшение одного параметра требует увели-
чения другого. Из сказанного следует, что требовалась новая постановка матема-
тической задачи, более общая и адекватная потребностям приложений, чем вос-
принятая математиками проблема Рауса – Гурвица, состоящая в отыскании необ-
ходимых и достаточных условий, что все корни полинома лежат в левой полу-
плоскости (условий Re zv < 0 при всех v). Центральным моментом появления но-
вого подхода к описанному выше кругу задач, помимо ошеломляющей загадочно-
сти не вполне обоснованного, но верного критерия Найквиста, является недоуме-
ние по поводу того, как это может быть, что корни полинома найти нельзя, а ус-
ловия того, что они лежат на левой полуплоскости или внутри единичного круга –
можно. Выводы критериев Рауса, Гурвица, Найквиста, Михайлова и других, из-
вестные в середине 1940-х годов, ответа на этот естественный вопрос не давали.
Вместе с тем ответ на него прост и сразу вознаграждается [20, 27]. Дело в том, что
хотя корни действительно найти нельзя, легко установить, когда они выходят за
пределы левой полуплоскости или любой заданной области G комплексной плос-
кости (заметим, что сами по себе они исчезнуть или возникнуть при изменении
коэффициентов не могут, а могут только непрерывно перемещаться по плоскости
42. Математическая модель как плодотворная идея научного исследования. D-разбиение 339

комплексного переменного z). Для того чтобы установить, когда это имеет место,
достаточно располагать параметрическим уравнением границы области G в виде
z = f (ω), ω ∈ Ω. Имеется в виду, что z пробегает границу области G, когда дейст-
вительное переменное ω пробегает множество Ω. При этом корень характеристи-
ческого уравнения χ(z) = 0 при его изменении пересекает границу области G тогда
и только тогда, когда при некотором ω ∈ Ω
χ( f ( ω)) = 0. (42.1)
Пусть теперь система, у которой надлежит исследовать устойчивость равно-
весия по параметрам u, имеет характеристическое уравнение
χ(z, u) = 0, (42.2)
а устойчивость означает, что все корни этого уравнения лежат в области G ком-
плексной плоскости Z. Далее, пусть точка z принадлежит границе области G тогда
и только тогда, когда при некотором ω ∈ Ω
z = f (ω). (42.3)
Из этого следует, что граница области устойчивости состоит из точек, для кото-
рых
χ(f (ω), u) = 0, ω ∈ Ω. (42.4)
Множество точек Nω , удовлетворяющих условию (42.4), содержит все гра-
ничные точки области устойчивости, но может содержать и другие точки. Это
множество Nω в целом определяет разбиение пространства параметров u на облас-
ти D(j) с разными числами j корней уравнения (42.2) в области G. Назовем это
D-разбиением. В нем нас интересует только область устойчивости D(0). Оказыва-
ется, что для отыскания области D(0) полезно рассматривать все D-разбиение в
целом. В этом и состоит новая идея исследования устойчивости. В ее основе ле-
жит модель, определяемая условием (42.4), а моделью устойчивости является
принадлежность точки области D(0). Описанная модель не предполагает характе-
ристическое уравнение (42.2) полиномом по z. Это может быть любая функция, и
область G может быть не только левой полуплоскостью, а рассматриваемая сис-
тема может описываться обыкновенными дифференциальными уравнениями. Ее
возможности значительно шире.
Теперь последовательно используем эту математическую модель устойчиво-
сти для:
1) построения области устойчивости по комплексному параметру w;
2) обнаружения, что область устойчивости для полинома zn + a1zn−1 + a2zn−2 +
+ …+an по параметрам a1, a2, …, an односвязна и выпукла по каждому из них;
3) обоснования и обобщения известного критерия Найквиста;
4) построения области устойчивости по двум действительным параметрам
для ультрацентрифуги;
5) решения проблемы о мере робастной устойчивости.
Этим перечислением не ограничиваются полезные использования описанной
модели устойчивости [31]. Более того, понятие устойчивости может быть замене-
но другим с подобными общими свойствами.
340 Ю.И. Неймарк. Математическое моделирование как наука и искусство

1. Пусть ради простоты комплексный параметр w входит в характеристиче-


ское уравнение линейно, так, что оно может быть записано в виде
f ( z ) + wg ( z ) = 0. (42.5)
Граница области устойчивости D(0) входит в границу D-разбиения, которую
обозначим Nω . Она является отображением границы области Re z ≤ 0, т.е. мнимой
оси плоскости Z, для точек которой z = iω, −∞ < ω < ∞, и, следовательно, на плос-
кости W имеет место уравнение
f (iω)
w=− , −∞ < ω < ∞, (42.6)
g (iω)
при этом левая сторона мнимой оси отображается в левую же сторону кривой Nω,
определяемой уравнением (42.6). Заштрихуем эту левую сторону, считая, что кри-
вая Nω пробегается в направлении возрастания параметра ω, тогда при переходе
на комплексной плоскости W со штрихованной стороны кривой Nω на нештрихо-
ванную один корень уравнения (42.5) становится чисто мнимым и переходит с
левой полуплоскости Re zv < 0 на правую. Кривая Nω разбивает плоскость W на
какие-то области, среди которых могут быть и области устойчивости. Если из-
вестно число s корней слева от мнимой оси в какой-нибудь точке w*, то во всех
точках области, к которой она принадлежит, число корней s одно и то же. Более
того, если из точки w* мы перемещаемся по кривой γ в любую другую точку w ∗ ,
то в ней число s уменьшается на число пересечений кривой Nω со стороны штри-
ховки и увеличивается на число пересечений ее против штриховки. Области ус-
тойчивости D(0) отвечает s = 0. Остальные области с s > 0 обозначим через D(s).
С помощью этих обозначений сказанное иллюстрируется на рис. 42.1, где стрелка
на кривой Nω указывает направление ее пробегания, согласно (42.4), при росте ω,
а пересекающая ее стрелка − переход из одной области D(s) в другую, D(s + 1).
При этом s возрастает на единицу, при обратном переходе s убывает на единицу.
Вывод из сказанного состоит в том, что для отыскания области устойчивости D(0)
по комплексному параметру w достаточно построить кривую Nω и заштриховать
ее левую сторону и еще знать число корней уравнения (42.5) справа от мнимой
оси для какого-нибудь значения w = w*.

D(s + 1) Nω

Рис. 42.1. Иллюстрация к правилу


штриховки кривой Nω D-разбиения
D(s)

2. В качестве примера использования сказанного в п. 1 построим область ус-


тойчивости по параметру w для характеристического уравнения вида:
zn + a1zn−1a2zn−2 + …+an – wzm = 0, 0 ≤ m ≤ n, (42.7)
где a1 , a2 , …, an – заданные действительные числа, для которых уравнение (42.7)
при w = 0 имеет все корни слева от мнимой оси, т.е. точка w = 0 принадлежит об-
ласти устойчивости D(0). Кривая Nω описывается уравнением
42. Математическая модель как плодотворная идея научного исследования. D-разбиение 341

1 1
w= m
( z n + a1 z n −1 + ... + an ) z =iω = (iω − z1 ) ⋅ ⋅ ⋅ (iω − zn ) , (42.8)
(iω) (iω) m
где z1 , z2 , …, zn – корни уравнения (42.7) при w = 0. Все они лежат слева от мни-
мой оси. Из (42.8) непосредственно видно, что при изменении ω от −∞ до ∞ arg w
возрастает на величину πn, а | w | все время отличен от нуля и при ω = 0 обращает-
ся в бесконечность. Левая сторона и штриховка кривой Nω при этом все время об-
ращена в сторону точки w = 0, и всякий луч, выходящий из точки w = 0, пересека-
ет кривую Nω только со стороны штриховки. Поэтому областью устойчивости по
действительному параметру Re w или параметру am + Re w является единствен-
ный отрезок, содержащий точку w = 0. Из этого следует, что область устойчиво-
сти D(0) по параметрам a1, a2, …, an в пространстве этих параметров выпукла по
каждому из этих параметров, т.е. пересекается с любой прямой, параллельной
любой из осей Oas этого пространства по единственному отрезку, либо вообще с
ней не пересекается.
3. Знаменитый критерий Найквиста утверждает, что если разомкнутое линей-
ное звено с входом x и выходом y устойчиво, т.е. если с некоторого момента t0
x = 0, то выход y → 0 при t → ∞, то замкнутая система, получаемая из разомкну-
той, тоже устойчива, если точка w = 1 комплексной плоскости W лежит вне кри-
вой
w = K (iω), (42.9)
амплитудно-фазовой частотной характеристики разомкнутого звена. Этот крите-
рий оказался весьма удобным и применимым во многих случаях, но и несколько
загадочным, поскольку не имел убедительного и полного обоснования. С пози-
ций, изложенных выше, критерий Найквиста и его обобщения непосредственно
следуют из рассмотрения области устойчивости по комплексному параметру w
для характеристического уравнения замкнутой системы, которое может быть за-
писано в виде
P(z) – wQ(z) = 0, (42.10)
где P(z) и Q(z) – некоторые, не имеющие общих нулей, целые функции, опреде-
ляемые тем, что
P( z )
K ( z) =
Q ( z ).
Уравнение (42.10) при w = 1 является характеристическим для замкнутой
системы, а при w = ∞ – для разомкнутой. Граница области устойчивости Nω для
(42.10) определяется уравнением (42.9), а точка w = ∞ принадлежит области ус-
тойчивости, и поэтому, если точка w = 1 не отделена от точки w = ∞ кривой Nω , то
замкнутая система устойчива. Это и есть критерий Найквиста. Из приведенного
краткого рассуждения непосредственно следуют обобщения критерия Найквиста
на случай, когда точка w = 1 не охватывается или охватывается кривой Nω (42.9),
но так, что, выходя из нее и двигаясь к точке w = ∞, числа пересечений этой кри-
вой с разных сторон штриховки и нештриховки равны. Очевидно и обобщение на
случай, когда разомкнутое звено имеет известное число степеней неустойчивости,
т.е. известно число s корней справа от мнимой оси y уравнения (42.10) при
w = ∞.
342 Ю.И. Неймарк. Математическое моделирование как наука и искусство

4. Ультрацентрифуга – это очень быстро вращающееся тело, которое не мо-


жет быть жестко закреплено, потому что малейший дисбаланс приводит к гро-
мадным силам инерции. Закрепление должно быть мягким, самоцентрирующим-
ся, но тогда оно не обеспечивает устойчивого вращения центрифуги. Эту устой-
чивость можно обеспечить введением специальных демпфирующих возможные
колебания устройств. Как твердое тело, центрифуга имеет 4 степени свободы, две
поступательных и две вращательных и еще две степени свободы демпфера, по-
этому дифференциальные уравнения ее движения 12 порядка. Такова же степень
характеристического уравнения, от корней которого зависит устойчивость. Уст-
ранение неустойчивости надлежит реализовать за счет подбора двух параметров
демпфера – k и h. Двенадцатый порядок действительного характеристического
уравнения ввиду наличия круговой симметрии может быть уменьшен до шести,
но при этом характеристический полином будет уже комплексным. Это ком-
плексное характеристическое уравнение записывается в виде:
χ( z ) = ( k + ν z 2 + ε + h z )(P4 ( z ) − i P3 ( z ) ) + P2 ( z ) = 0,
где P3 и P4 – действительные полиномы степеней 3 и 4 соответственно.
Граница области устойчивости D(0) на плоскости параметров k, h определя-
ется, как и ранее, параметрическими уравнениями
( k − ω2 + ε + i h ω) (P4 (iω) − iP3 (iω) ) + P2 (iω) = 0,
которые могут быть разрешены относительно k и h и записаны в виде:
k = f ( ω), h = g ( ω), −∞ < ω < ∞, (42.11)
позволяющем быстро с помощью ЭВМ построить кривую Nω, нанести на ней
штриховку и выделить область устойчивости D(0). Одна из возможных картинок
граничной кривой Nω, определяемой уравнениями (42.11), представлена на
рис. 42.2. Из нее следует, что область устойчивости D(0) ограничена двумя участ-
ками этой кривой Nω: верхний отвечает высокочастотному нарушению устойчи-
вости, а нижний – низкочастотному, соответственно большим и малым значениям
частоты ω. Из этого же рис. 42.2 видно, что выбор и обеспечение нужных значе-
ний параметров довольно деликатен и без этой картинки едва ли возможен. Ведь
каждый неудачный выбор – это авария и разрушение центрифуги.
h

Рис. 42.2. D-разбиение и область


D(0)
устойчивости ультрацентрифуги
по параметрам k и h

k
5. Переходим к последнему пункту: робастной устойчивости и мере робаст-
ной устойчивости. Проблемы робастной устойчивости некоторое время бурно об-
42. Математическая модель как плодотворная идея научного исследования. D-разбиение 343

суждались и изучались. Робастная устойчивость – это когда устойчивость сохра-


няется при достаточно больших изменениях параметров. Как следует из преды-
дущего, эта проблема полностью решается, если речь идет об одном комплексном
параметре или двух действительных, когда построение области устойчивости D(0)
не вызывает больших затруднений. Но совсем иначе обстоит дело, когда парамет-
ров много, и наглядно представить область устойчивости очень трудно, если во-
обще возможно. В этой ситуации, естественно, возникает вопрос, когда область
простого вида лежит в области устойчивости (простые области – это шар, эллип-
соид, параллелепипед и др.), и более того, как сделать эту область возможно
большей. Эти вопросы привели к следующей общей математической задаче: най-
ти максимальное ρ = ρ*, при котором все функции комплексного переменного z
вида
χ( z ) = a1ϕ1 ( z ) + ... + an ϕ n ( z ), (42.12)
где
ρ = ( k1m | a1 − a1∗ |m + L + k nm | an − an∗ |m )1 / m ≤ ρ∗ , (42.13)
имеют корни только в заданной области G комплексной плоскости Z. Здесь ϕ1(z),
…, ϕn(z) – заданные функции z, a1* , …, an* – некоторые номинальные значения
действительных параметров a1 , …, an , при которых все корни функции (42.12)
лежат в области G, k1, …, kn – произвольные положительные числа и m ≥ 1. Заме-
тим, что при m = 2 и m = ∞ неравенство (42.13) определяет простые области – эл-
липсоид и параллелепипед.
Согласно принятой нами модели устойчивости, найти меру робастной устой-
чивости ρ* сравнительно просто: она равна минимуму величины ρ, определяемой
(42.13), по всем параметрам a1, …, an , лежащим на границе области устойчивости,
т.е. удовлетворяющим при каком-нибудь ω ∈ Ω условию
χ(z(ω), a1 , …, an) = 0,
где z(ω) − любая точка границы области G при подходящем ω ∈ Ω. Не будем ре-
шать эту задачу условной оптимизации, это не имеет отношения к основной теме
книги. Отметим, что ее решение возможно и не очень сложно [29]. Так, например,
для полинома или квазиполинома, записанного в виде
χ ( z ) = ∑ ( a j 2 s z s sh( τ j z ) + a j 2 s +1 z s ch ( τ j z )),
когда область G – левая полуплоскость, и полинома вида
χ ( z ) = ∑ a2 s ( z n − s + z − n + s ) + a2 s +1 ( z n − s − z − n + s ),
когда область G – единичный круг,
 | χ |m | χ 2 |m 
ρ∗ = min  2 1 m +1 + ,
ω∈Ω ( Φ ( γ )) m +1m +1
 1 2
(Φ 2 ( γ )) 
где Φk – векторы с компонентами ( k j ϕ kj ) r / 2 , γ = m ( m − 1) , ϕ kj = ∂χ k ∂α j .
344 Ю.И. Неймарк. Математическое моделирование как наука и искусство

43. ИДЕАЛИЗАЦИЯ, МАТЕМАТИЧЕСКАЯ КОРРЕКТНОСТЬ


И РЕАЛЬНОСТЬ
Эта тема или проблема необычайно широка и многообразна. С ней сталкива-
ется всякий, строящий и исследующий новую или частично новую модель, не
имеющую испытанных аналогов или прототипов. Последующее ограничивается
двумя конкретными примерами: центробежный фрикционный регулятор скорости
вращения и известная проблема парадокса Пенлеве. Их объединяет то, что в обо-
их случаях речь идет об идеализации реальных упругих тел и податливых связей
идеальными абсолютно твердыми и жесткими.
Фрикционный регулятор скорости вращения. На рис. 43.1 схематически
изображен очень простой фрикционный регулятор скорости вращения. По идее
своего устройства он должен ста-
билизировать скорость вращения
благодаря тому, что с ее ростом
ϑ возрастает сила трения об ограни-
чительное кольцо, а при ее убыва-
нии сила трения уменьшается.
nω Центробежная сила, прижи-
ω
мающая шарик к кольцу, равна
( nω) 2 r , и поэтому в весьма упро-
M щенных предположениях
J
& = M − k ( nω) 2 r ⋅ rn,
Jω (43.1)
где введенные обозначения ясны
из рисунка.
Из (43.1) непосредственно на-
ходим, что скорость вращения
имеет устойчивое равновесное
значение
Рис. 43.1. Схема фрикционного регулятора 1/ 2
 M 

скорости вращения ω = 2 3 . (43.2)
k r n 
Из (43.2) следует, что дифференциальная неравномерность равновесной ско-
рости вращения ω* по моменту M равна
dω∗ 1
= ∗ 2 3 (43.3)
dM 2ω kr n
и уменьшается с ростом коэффициента передачи шестеренок n. Описанный регу-
лятор, в частности, использовался при астрономических наблюдениях для ком-
пенсации вращения Земли, и при этом величина момента M зависела еще и от мо-
мента, необходимого для вращения астрономических приборов: рефракторов,
рефлекторов и др. Как видно из (43.3), требуемая точность вращения могла быть
43. Идеализация, математическая корректность и реальность 345

обеспечена за счет выбора достаточно большого n. Но при этом обнаружилось,


что центробежный регулятор может быть неустойчив и не выполняет своего на-
значения. Сегодня причину неустойчивости регулятора было бы естественно ис-
кать в падающей характеристике трения, т.е. в том, что коэффициент трения зави-
сит от скорости вращения, и что dk dω < 0 при скорости ω = ω*. Этот механизм
неустойчивости рассматривался ранее. Конечно, так может быть, но неустойчи-
вость, как оказалось, возможна и при dk dω ≥ 0 . Для того, чтобы понять ее про-
исхождение и устранить ее, необходимо учесть реальную податливость кольца,
изменение r с изменением давления шарика регулятора на ограничительное
кольцо. Это удивительно и интуитивно не чувствуется: причем здесь податли-
вость кольца; кажется, что можно считать его абсолютно жестким. Но это не так,
и выясняется только после учета податливости.
Учтем неабсолютную жесткость ограничения, налагаемого кольцом на дви-
жение шарика центробежного регулятора, зависимость момента сухого трения от
скорости и силу тяжести. В качестве обобщенных координат примем угол пово-
рота nϕ вертикальной штанги центробежного регулятора и угол ϑ отклонения ша-
рика от нее. Функция Лагранжа без учета сил трения, момента M (ϕ& ) и давления
кольца на шарик, но с учетом силы тяжести, записывается в виде:
1 1
L = {J 0 ϕ& 2 + J 1 (ϑ ) n 2 ϕ& 2 } + Bϑ& 2 − V (ϑ ), (43.4)
2 2
дополнительные обобщенные силы равны
Qϕ = M (ϕ& ) − k ( nϕ& ) N (ϑ) l sin ϑ,
Qϑ = −l N (ϑ),
где N(ϑ) – силы нормального давления кольца на шарик, остальные обозначения
очевидны.
Теперь непосредственно записываем нелинейные уравнения движения Ла-
гранжа в виде:
0 1 && + n 2 J ′ (ϑ) ϑ& ϕ& = M (ϕ& ) − k ( nϕ& )nl sin ϑ N (ϑ ),
{J + n 2 J (ϑ)}ϕ 1
(43.5)
Bϑ&& − 1 n 2 J ′ (ϑ)ϕ& 2 + V ′(ϑ) = −lN (ϑ ).
1
2
Из них интересующее нас равномерное вращение ϕ& = ω∗ , ϑ = ϑ∗ находится из
уравнений:
M ( ω∗ ) − k ( nω∗ )nl sin ϑ∗ N (ϑ∗ ) = 0,
1 2
− n 2 J1′(ϑ∗ ) ω∗ + V ′(ϑ∗ ) = −lN (ϑ∗ ). (43.6)
2
Пусть его решение ω*, ϑ* нам известно. Заметим, что из (43.6) можно найти
дифференциальную неравномерность регулирования
2
dω∗ l N '− 1 2 ⋅ ( n 2 J ′′ω∗ ) + V ′′
= 3 .
dm n J 1′ω∗k N ′ + (lN ′ − 1 2 ⋅ ( n 2 J ′′ω2 ) + V ′′)( k ′Nn 2 l sin ϑ∗ − M )
346 Ю.И. Неймарк. Математическое моделирование как наука и искусство

При N ′ → ∞ она неограниченно убывает с ростом n. В этом нет ничего нового.


Исследование устойчивости равномерного вращения приводит к линеаризован-
ным уравнениям ( ω = ω∗ + ξ , ϑ = ϑ∗ + η ):
( I 0 + n 2 J 1 )ξ& − M ′ξ + J 1′n 2 ω∗η& + k ′( n ω∗ ) n 2 Nl sin ϑ∗ξ = 0,
1 2
Bη && − J 1′′ ω∗ η − J 1n 2 ω∗ξ + lNη + V ′′ η = 0
2
и совершенно новым и неожиданным условиям устойчивости
n 2 k ′N ′l sin ϑ∗ − M ′ > 0,
 1 2 
( − M ′ + n 2 k ′N sin ϑ∗)  − n 2 ω∗ J 1′′ + lN ′ + V ′′  + n 2 ω∗ J 1 ' n N ' l sin ϑ∗ > 0, (43.7)
 2 

( − M ′ + n k ′Nl sin ϑ ) n J 1′ − l N ′ sin ϑ( I 0 + n 2 J ) k > 0,
2

из которых видно (последнее неравенство), что при N ′ → ∞ неизбежно наступает


неустойчивость. Таким образом, с одной стороны, учет даже ничтожно малой уп-
ругости по углу ϑ в ограничении кольцом приводит к неустойчивости, а с другой
стороны, неравенства (43.7) показывают, что если искусственно ввести не очень
большую жесткость в контакте шарика с кольцом, то можно добиться устойчиво-
сти центробежного регулятора.
Математическая некорректность модели (43.1) состоит в том, что сколь угод-
но малая податливость кольца ведет к резкому качественному изменению поведе-
ния модели. Эта некорректность модели обнаруживается не столь непосредствен-
но, как это имело место ранее, например, для модели Вольтерра «хищник –
жертва». Теперь некорректность связана с неочевидным увеличением размерно-
сти модели, переходом от дифференциальных уравнений первого порядка к
третьему. В случае модели «хищник – жертва» эта некорректность обнаружива-
лась в рамках исходной модели при малых изменениях правых частей дифферен-
циальных уравнений второго порядка. Вместе с тем, то, что фактически происхо-
дит с фрикционным регулятором при его неустойчивости из-за слишком большой
жесткости контакта с ограничивающим кольцом, дает некоторую подсказку, что
же еще следует учесть. Нарушение устойчивости ведет к прыганию шарика вдоль
кольца, прыганию, при котором шарик от него отделяется, и это подсказывает,
что нужно учесть еще одну степень его свободы по углу ϑ, что и было сделано.
Парадокс Пенлеве и автоколебания при кулоновском трении. В самом
конце ΧΙΧ века французский механик П. Пенлеве, читая парижским студентам
учебный курс о трении и стремясь к общей теории, обнаружил, что для некоторых
простых механических систем с трением уравнения движения, составляемые по
общим правилам механики, неразрешимы. Он опубликовал книгу о трении [42],
где привел и эти удивительные примеры, что через десять лет вызвало бурную
дискуссию с участием выдающихся ученых того времени: Р. Мизеса, Л. Прандтля,
Ф. Клейна, Г. Гамеля, Л. Лекорню и др. и, конечно, самого П. Пенлеве. Обнару-
женный П. Пенлеве казус получил название парадокса Пенлеве. Он и сегодня,
спустя сто лет, не имеет решения, позволяющего с уверенностью сказать, как по-
ведут себя очень простые механические системы с кулоновским трением. Невоз-
можность точного предсказания вызвана тем, что в системах с парадоксом Пенле-
43. Идеализация, математическая корректность и реальность 347

ве обнаруживается существенная зависимость их поведения от весьма непривыч-


ных в таких задачах малых и трудно определяемых параметров и закономерно-
стей [30, 35].
Последующее имеет целью ознакомление с существом парадокса Пенлеве и
обнаружение того, что он влечет неожиданную и неизвестную ранее возможность
возникновения неустойчивости и автоколебаний, несмотря на то, что характери-
стика трения не имеет падающего участка. Возникающие колебания в естествен-
ном предельном описании являются разрывными или, по существующей матема-
тической терминологии, контрастными структурами со скачками и всплесками,
которые с физической точки зрения можно назвать «внутренними» ударами. Раз-
рывные колебания в виде периодических контрастных структур возникают пото-
му, что математическая модель систем с парадоксом Пенлеве является сингулярно
возмущенной системой дифференциальных уравнений.
На рис. 43.2 приведены некоторые известные примеры механических систем с
парадоксом Пенлеве: система Пенлеве – Клейна о движении стержня между па-
раллельными направляющими L1 и L2 , из которых одна (L1) гладкая, а другая (L2)
шероховатая, под действием постоянной силы F0 – пример а); тормозная колодка,
прижимаемая с силой F0 к колесу, вращаемому моментом M – пример б); круг
(цилиндр), вращаемый моментом M и вжимаемый в угол силой F0 , одна из сторон
которого шероховатая, а другая гладкая – пример в).
L1
Fc
L1 N O R

υ a
Fc b N r Fc
L2 Ff ∆ α Ff M ω
r ω L2 α
N Ff
M N
а) б) в)

Рис. 43.2. Некоторые известные примеры механических систем с парадоксом Пенлеве

Уравнения движения во всех трех случаях приводятся к одному и тому же


виду:
V& = 1 − F , F =|N | sign υ, χ N − λ + F = 0, (43.1)
где υ – линейная либо угловая скорость, F и N – силы трения и нормального дав-
ления, χ и λ – параметры ( χ > 0, − 1 ≤ λ ≤ 1 ) [30].
Как динамическая система, уравнения (43.1) содержат одну фазовую пере-
менную υ. При заданном начальном условии υ = υ0 для получения их решения
υ(t), F(t), N(t) необходимо из двух последних уравнений (43.1) найти F. Но именно
это при χ < 1 невозможно: решения может не быть или их оказывается два. В слу-
чае χ < 1 уравнения
F =|N | sign υ, χN − λ + F = 0 (43.2)
348 Ю.И. Неймарк. Математическое моделирование как наука и искусство

при sign υ = sign λ имеют два решения, а в противном случае его нет. Это непо-
средственно видно, если на плоскости переменных N и F, рис.43.3, нанести гра-
фики функций, отвечающие уравнениям (43.2).
F
1′ 1
2
2
N
Рис. 43.3. Иллюстрация к парадоксу Пенлеве

1 1′
Здесь ломаные линии 1 и 1′ отвечают первому из уравнений (43.2) соответст-
венно при υ > 0 и υ < 0, а прямая 2 соответствует второму уравнению в (43.2) и
предполагает 0 < χ < 1, λ > 0. Согласно рис. 43.3, в этом случае при υ > 0 решений
два, а при υ < 0 их нет. При 0 < χ < 1 и λ < 0 ситуация аналогичная. В этой невоз-
можности найти нужное единственное решение системы (43.2) и состоит пара-
докс Пенлеве. Он указывает на то, что классическое описание (43.1) при 0 < χ < 1
дефектно.
Уже на упомянутой дискуссии было высказано мнение, что необходимо
учесть реальную упругость твердых тел. Различные способы такого учета приме-
нительно к задачам Пенлеве – Клейна (см. рис. 43.2,а) делались во многих работах,
они действительно избавляли от парадокса, но приводили к разным результатам.
В каком-то смысле они делались вслепую, без понимания истинной причины па-
радокса Пенлеве, хотя тот или иной способ учета упругости приводил к устране-
нию парадокса Пенлеве. А причина была, и ее выяснение требовало нового пони-
мания силового взаимодействия в случае сухого трения, более полной трактовки
закона Ньютона о действии и противодействии, требовало обнаружения направ-
ленности действия, понимания, что в законе Кулона нормальная сила N, вызы-
вающая силу трения F, имеет направленный характер от N к F и реализуется не за
счет силы N, а некоторого стороннего источника энергии. Понимание этого дава-
ло новую трактовку соотношениям (43.2) как замкнутого цикла направленных
воздействий от N к F (первое соотношение в (43.2)) и от F к N (второе соотноше-
ние в (43.2)). Этот направленный цикл взаимодействий изображен на рис. 43.4.
a) F= |N| sign υ
Рис. 43.4. Цикл мгновенных
N F направленных связей в системе
с парадоксом Пенлеве
б) N = χ−1(λ – F)

При χ < 1 он влечет парадокс Пенлеве, потому что в этом цикле взаимодейст-
вия мгновенные и его коэффициент усиления, равный 1/χ, при χ < 1 больше еди-
ницы. В реальной же системе парадоксальности нет при всех χ > 0, потому что
связи от N к F и от F к N не мгновенные в силу фактической вязкоупругой подат-
ливости твердых тел и связей между ними. Отметим, что этот же замкнутый цикл,
43. Идеализация, математическая корректность и реальность 349
вызывающий парадокс Пенлеве, используется в технике в так называемых систе-
мах самоторможения, когда тормозят не дополнительными силовыми воздейст-
виями, а за счет направленных связей этого цикла: сила трения вызывает нор-
мальное давление, оно увеличивает силу трения, в результате – быстрое само по
себе возникающее торможение и остановка. Торможение мгновенное, подобно
удару, если тормозится конструкция абсолютно жесткая.
Такое понимание парадокса Пенлеве позволяет предложить простейший спо-
соб учета вязкоупругих инерционных податливостей реальных твердых тел и свя-
зей между ними в виде временных релаксационных задержек, записав уравнения
(43.1) в виде:
υ& = 1 − F , τ1F& + F = N sign υ, τ 2 N& + N = χ −1 (λ − F ), (43.3)
где τ1 > 0 и τ 2 > 0 – малые временные задержки.
Введение этих задержек и запись сингулярных уравнений (43.1) в виде син-
гулярно возмущенных дифференциальных уравнений (43.3) устраняет парадокс
Пенлеве, но теперь вместо системы (43.1) первого порядка появляется система
третьего порядка, и ее изучение далеко не просто. Можно исследование упро-
стить, предполагая τ1 и τ2 стремящимися к нулю, поскольку они на самом деле
малы, но при этом, как оказывается, результат зависит от соотношения τ1 /τ2, и,
если его не фиксировать, то вообще никакого предельного поведения у системы
(43.3) нет.
Конечно, модель (43.3) не точна, она феноменологическая, и реальный харак-
тер задержек в некоторых случаях может быть сложнее, но все же это, пусть и
грубое, но уточнение парадоксальных уравнений (43.1), и оно позволяет понять,
что же может происходить в системе с парадоксом Пенлеве. Отметим, что неко-
торые модельные способы учета вязкоупругих свойств твердых тел приводят к
похожим уравнениям и результатам. Но перед этими конкретными способами
уточнения уравнений (43.1) у уравнений (43.3) есть определенное преимущество:
уравнения (43.3) более общие и содержат два существенных малых параметра τ1 и
τ2 , а модельные конструкции учитывают только один из них. Это, в частности,
объясняет, почему конкретные уточнения приводят к разным результатам.
Перейдем к исследованию сингулярно возмущенных уравнений (43.3), точ-
нее, к некоторым фрагментам этого исследования, позволяющим составить пред-
ставление о возможных, порождаемых ими, движениях и явлениях. Начнем с рас-
смотрения крайних частных случаев уравнений (43.3): τ1 = 0 и τ2 = 0. При этом
порядок уравнений (43.3) уменьшится. Исключая переменную F, запишем их для
возможности сравнения в одних и тех же фазовых переменных V и N :
v& = 1 − λ + χ N , τN& = − N [1 + χ −1sign( υ N )] + χ −1λ (43.4)
и соответственно
v& = 1 − N sign υ, τN& = − N [1 + χ −1sign( υ N )] + χ −1λ . (43.5)
При τ → 0 обе модели (43.4) и (43.5) переходят в парадоксальную модель
(43.1), отвечающую абсолютной жесткости твердых тел. Они не только содержат
одни и те же фазовые переменные υ и N, но и зависят от одних и тех же парамет-
ров χ и λ и испытывают бифуркации на одних и тех же линиях, и в силу этого
350 Ю.И. Неймарк. Математическое моделирование как наука и искусство

имеют одинаковые разбиения плоскости параметров на области с различными фа-


зовыми портретами, которые не всегда одинаковые. Плоскость параметров разби-
вается на шесть областей: A, B, C, D, E и G (рис. 43.5).
χ

E
G
D

A
C
B Рис. 43.5. Шесть областей в плоскости параметров

−1 1 λ

Первые три соответствуют парадоксальности (χ < 1), остальные не парадок-


сальны. Так, в области A фазовые портреты для моделей (43.4) и (43.5) показаны
на рис. 43.6 и 43.7.
В обоих случаях финальным является равноускоренный разгон Γ+. В первом
случае при τ → 0 финальному движению могут предшествовать один или два
удара, сопровождающиеся неограниченным значением силы N и конечным скач-
ком скорости v. При этом коэффициент скачка скорости v равен µ = ( χ − 1)( χ + 1) −1 .
Во втором случае возможны мгновенные остановки, т.е. удары с коэффициентом
µ = 0 . Наглядные представления об ударах можно получить, изобразив соответст-
вующие рис. 43.6,а и 43.7,а предельные фазовые портреты при τ → 0 (рис. 43.6,б
и 43.7,б).
На рис. 43.6,б точка M мгновенно переходит в точку M′, M′ в M′′, ... , и, нако-
нец, в M , после чего наступает равноускоренный разгон. На рис. 43.7,б анало-
гично точка M переходит в M′, M′ в M , а точка K переходит в K′, K′ в K = M . Из
послеударной точки M = K начинается равноускоренный разгон с нулевой на-
чальной скорости.

N M″″
N
M″′
A Γ+
Γ+
N+ M
v
v Γ−
M
N−
Γ− M″ M′

а) б)
Рис. 43.6. Фазовые портреты для модели (43.3) в области А
43. Идеализация, математическая корректность и реальность 351

N K″
A K′
Γ+
1 Γ+
Ν+
M=K Γ− v
v
–1 Γ− M
Ν−
M′
K M″

а) б)
Рис. 43.7. Фазовые портреты для модели (43.5) в области А

В области B фазовые портреты для моделей (43.4) и (43.5) изображены соот-


ветственно на рис. 43.8 и 43.9.
На каждом из них по два установившихся предельных движения: устойчивое
состояние равновесия O и равноускоренный разгон Γ+. Между устойчивыми со-
стояниями равновесия O есть существенное различие: в первом случае область
притяжения (см. рис. 43.8) при τ → 0 неограниченно уменьшается и исчезает, во
втором (см. рис. 43.9.) – сохраняется (она заштрихована). При τ → 0 возможны
удары с указанными ранее величинами коэффициента скачка скорости v и беско-
нечным значением N. Удары и предельные движения в виде устойчивого равнове-
сия возможны и в парадоксальной области C. В непарадоксальных областях D, E
и G ударов при τ → 0 не возникает, и предельные установившиеся движения
одинаковые и единственные. Подчеркнем, что в парадоксальном случае B имела
место неединственность предельного движения, и оно могло быть разным при
τ → 0 в разных моделях (43.4) и (43.5).
N N B
B
N+ Г+ Г+
N+

Г− v Г−
v
N− N−
O O
−1

Рис. 43.8. Фазовые портреты Рис. 43.9. Фазовые портреты


для модели (43.4) в области В для модели (43.5) в области В

Таковы особенности поведения упрощенных моделей систем с парадоксом


Пенлеве. Уточнение модели с учетом обоих временных задержек позволяет обна-
ружить большее разнообразие возможных движений и неожиданную возможность
автоколебаний, которые при τ → 0 могут принимать вид так называемых контра-
стных структур или неограниченно увеличивать свою частоту при сохранении ко-
нечности амплитуд колебаний сил N и F. Не вдаваясь в детали довольно сложного
352 Ю.И. Неймарк. Математическое моделирование как наука и искусство

и в значительной степени численного компьютерного исследования, кратко опи-


шем основные факты, причем сделаем это для модели (43.3) с учетом еще и вяз-
кого трения, т.е. для модели вида:
V& = 1 − F , τ F& + F =|N | sign V + hV , τ N& + N = χ −1 (λ − F ).
1 2 (43.6)
Хорошо известно, что сухое трение в механических системах может приво-
дить к неустойчивости и автоколебаниям, но для этого нужно, чтобы характери-
стика трения имела падающий участок. Как оказывается, последнее не обязатель-
но, когда механическая система с сухим трением парадоксальна по Пенлеве. В
парадоксальной системе неустойчивость и автоколебания возможны из-за нали-
чия в ней цикла направленных воздействий с подкачкой энергии, и эту его роль не
только не может нарушить добавок вязкого трения, но в некотором смысле ее
усиливает.
В изложении нового факта состоит цель дальнейшего. При малых, но конеч-
ных задержках τ1 и τ2 обнаруживается неустойчивость и рождение автоколебаний
в соответствии с бифуркацией Андронова. При τ1 и τ2 , стремящихся к нулю, авто-
колебания принимают вид контрастных структур, т.е. сопровождаются разрыв-
ными скачками скорости V («внутренние» удары), при которых силы F и N обра-
щаются в бесконечность.
Равновесия системы (43.6) определяются уравнениями:
λ − F = 0, χN − λ + F = 0, F =|N | sign V + hV . (43.7)
Из них следует, учитывая, что λ ≤ 1 , что равновесие имеется только при
h > 0 , χ > 1 − λ , V > 0 и для него
F ∗ = 1, N ∗ = χ −1 (λ − 1), V ∗ = h −1 [1 − χ −1 (1 − λ )]. (43.8)
Согласно (43.6), характеристическое уравнение имеет вид:
τ1τ 2 z 3 + ( τ1 + τ 2 ) z 2 + (1 + σ χ −1 + hτ 2 ) z + h = 0,
где σ = sign N ∗ < 0 , и единственное условие устойчивости состоит в выполнении
неравенства
( τ1 + τ 2 )(1 + σ χ −1 + hτ 2 ) − τ1τ 2 h > 0,
которое при исчезающих малых положительных τ1 и τ2 сводится к единственному
требованию: χ > 1. Таким образом, единственное равновесие (43.8) существует
при χ > 1 – λ, оно устойчиво при χ > 1, неустойчиво при χ < 1 и теряет устойчи-
вость через фокус.
Компьютерное исследование показывает, что при потере устойчивости рож-
дается устойчивое периодическое движение, возникают автоколебания. При
уменьшении τ1 и τ2 этот предельный цикл вытягивается, частично удаляясь в бес-
конечность, и приобретает вид контрастной структуры со скачками или всплеска-
ми (рис. 43.10,а, б). Описанное происходит в области параметров 1 > χ > 1 − λ ,
λ> 0, h > 0.
В другой области параметров, χ < 1 − λ , λ > 0 , h > 0 , при τ1 и τ2, стремящихся
к нулю, также возникают автоколебания в виде периодических контрастных
структур (рис. 43.10,в). Механизм их возникновения отличен от приведенного
43. Идеализация, математическая корректность и реальность 353

выше и состоит в наличии в рассматриваемой сингулярно возмущенной системе


(43.6) такой структуры фазового пространства, при которой
1) существуют, по крайней мере, два многообразия медленных движений, из
которых только одно устойчиво;
2) существует область начальных значений, при которых возможен уход фа-
зовой траектории в бесконечность при τ1 → 0 , τ 2 → 0 ;
3) существует особенность структуры, которая обеспечивает возврат фазовых
траекторий из бесконечности;
4) существует механизм срыва фазовой точки с устойчивого многообразия.
v v

t t

a) б)
v

t
в)

Рис. 43.10. Автоколебания в системе (43.6) при λ > 0, h > 0: а), б) 1 > χ > 1 – λ, в) χ < 1 − λ

В более простом случае, τ 2 = 0 , когда система (43.6) становится двумерной,


типичный пример возникновения автоколебаний типа контрастных структур в ре-
зультате выполнения условий 1)–4) приведен на рис. 43.11. Здесь Γ+ и Γ– – устой-
чивое и неустойчивое многообразия медленных движений, определяемые вырож-
денными, τ1 = τ 2 = 0 , уравнениями (43.6) при χ < 1 − λ , λ > 0 , h > 0 , KC – перио-
дическое движение типа контрастной структуры со всплесками при τ1 → 0 .
N

Γ+
v
KС Γ−
Рис. 43.11. Пример возникновения
автоколебаний типа контрастных
структур в случае τ2 = 0

При h = 0 периодических контрастных структур при стремлении τ1 и τ2 к ну-


лю не возникает, но при конечных τ1 и τ2 имеются автоколебания, которые при τ1
и τ2 , стремящихся к нулю, неограниченно увеличивают свою частоту. При этом
354 Ю.И. Неймарк. Математическое моделирование как наука и искусство

амплитуда колебаний скорости υ стремится к нулю, а амплитуды колебаний сил F


и N остаются конечными.
Итак, сухое кулоновское трение само по себе или в сочетании с вязким тре-
нием (h > 0) при наличии парадокса Пенлеве может вызвать автоколебания, кото-
рые в случае h > 0 при увеличении жесткости входящих в систему твердых тел и
связей между ними переходят в разнообразные периодические контрастные
структуры – разрывные периодические автоколебания. Их наличие обусловлено
замкнутым циклом направленных связей со сторонним источником энергии и по-
добно тому, что имеет место в релейных системах автоматического регулирова-
ния с реле, имеющим такую же характеристику, как кулоновское трение. Под-
черкнем, что средняя скорость автоколебаний всегда положительна, и внешняя
сила Fс и момент M совершают на каждом периоде определенную работу. Специ-
фика этих автоколебаний в том, что они могут быть близки к разрывным колеба-
ниям и иметь вид разнообразных контрастных структур со скачками и всплеска-
ми. Особенность систем с парадоксом Пенлеве еще и в том, что их поведение су-
щественно зависит от малых параметров и соотношений между ними. В рассмат-
риваемых моделях (43.3) и (43.6) малые параметры – это τ1 и τ2 , а соотношение
между ними – это отношение τ1/τ2 [46].
44. Динамическая интерпретация метода наименьших квадратов 355

44. ДИНАМИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ


МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ
И ГЛОБАЛЬНОЙ ПОИСКОВОЙ ОПТИМИЗАЦИИ
С АДАПТИВНОЙ МОДЕЛЬЮ
Основой для описания эволюционных процессов и явлений в природе и тех-
нике, построения их математических моделей и исследования является динамиче-
ская система. Все модели, о которых рассказывается в этой книге, – динамические
системы.
Последующее повествование имеет целью обратить внимание на возмож-
ность, естественность и целесообразность динамической трактовки некоторых
вычислительных, поисковых и алгоритмических процедур на примерах известно-
го и широко используемого метода наименьших квадратов (МНК) и глобальной
поисковой оптимизации с адаптивной стохастической моделью оптимизируемой
функции. Первый пример демонстрирует возрастание возможностей и эффектив-
ности приложений МНК в результате его динамического представления, второй –
широту понятия и возможностей описания в виде динамической системы.
Универсальная рекуррентная форма метода наименьших квадратов. Ме-
тод наименьших квадратов – это метод оценивания неизвестных параметров тео-
ретических моделей по косвенным измерениям. Авторами его считаются К. Гаусс
и А. Лежандр. Классический «метод уравнивания Гаусса» был установлен в 1795
году и успешно использован Гауссом в 1801 году для определения траектории ас-
тероида Церера. Первое изложение элементов метода и само название «метод наи-
меньших квадратов» даны в 1806 году Лежандром в работе, посвященной вычис-
лению орбит комет. Однако вероятностное обоснование метода в 1809–1810 годах
и глубокая разработка вычислительных проблем принадлежат Гауссу. Дальней-
шее развитие этот метод получил в работах многих известных математиков: Лап-
ласа, Чебышева, Неймана, Рао и др. Особенно большой вклад внесли А.А. Марков
и А.Н. Колмогоров, которым принадлежат строгое обоснование и установление
границ содержательной применимости МНК.
Главные достоинства решения задачи оценивания с использованием МНК
связаны с ее априорной разрешимостью и такими замечательными свойствами
получаемых оценок, как несмещенность, эффективность и состоятельность. Бла-
годаря этому МНК является одним из наиболее известных и многообразно ис-
пользуемых математических методов обработки наблюдений и эксперименталь-
ных данных. Он позволяет на основе приемлемых гипотез и математических мо-
делей определять неизвестные параметры и закономерности не только в задачах
прямой обработки данных, но и в задачах фильтрации, идентификации, распозна-
вания образов, сжатия описания (кодирования), автокорреляционного анализа и
др. Но существуют две трудности применения классического МНК. Первая связа-
на с обращением матрицы, подчас большой размерности, без уверенности в ее
корректности. Вторая трудность вызвана тем, что задача анализа данных, осуще-
ствляющая преобразование от «исходных данных» к «результату», обычно требу-
356 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ет многочисленных и многократных изменений в выборке данных и в принимае-


мых гипотезах в отношении изучаемых процессов и явлений. МНК в своей клас-
сической форме при любых изменениях используемых данных, принимаемых мо-
делей и гипотез требует полного повторения всех вычислений. Именно поэтому
уже в 1821 году Гаусс предложил рекуррентный вариант процедуры, позволяю-
щий корректировать ранее вычисленную оценку с учетом вновь поступивших до-
полнительных измерений без необходимости повторять все предшествующие вы-
числения, для случая, когда наблюдение представляется скаляром. В 1950 году
Плакетт обобщил эту идею на случай векторной величины. Рекуррентная форма
МНК получила очень широкое распространение, особенно в теории идентифика-
ции, адаптивного управления и современной теории фильтрации. Дальнейшее
расширение рекуррентной формы МНК для случая поиска единственного реше-
ния с минимальной нормой путем псевдообращения матрицы данных осуществ-
лено в работах А. Алберта. Универсальная рекуррентная форма МНК предложена
в работе [32]. В ней МНК рекуррентен не только в отношении добавляемых и
устраняемых данных, но и используемых моделей: базисных функций, отыски-
ваемых параметров и линейных ограничений на них.
В основе МНК лежит минимизация квадратичного функционала
2
N
m 
J ( a1 , a2 ,..., am ) = ∑  ∑ ai ϕi ( x j ) − b j  (44.1)
j =1  i =1 
при линейных ограничениях
m
Lk = ∑ cki ai − d k = 0 ( k = 1,2,..., l ) (44.2)
i =1
по искомым значениям параметров a1, a2, …, am . Здесь x1, b1; x2, b2; …; xN, bN – ис-
пользуемые данные. Гипотеза, положенная в основу применения МНК, состоит в
том, что при искомых значениях параметров a1, a2, …, am и лишенных погрешно-
стей используемых данных имеют место зависимости, зануляющие функционал J
и обращающие все Lk в нуль. Эти предположения, которые могут быть точными
или принимаемыми приближениями, определяются выбранными базисными
функциями ϕ1(x), ϕ2(x),…, ϕm(x) и линейными ограничениями (44.2) и вместе со-
ставляют модель, положенную в основу конкретного применения МНК.
Методами линейной алгебры и оптимизации (метод множителей Лагранжа
для условной оптимизации) можно найти в виде явных формул значения парамет-
ров, минимизирующие функционал (44.1) при условиях (44.2). Это МНК в своей
исходной классической нерекуррентной форме. О трудностях и неудобствах тако-
го прямого его использования сказано выше.
Преобразование, определяемое МНК, от входных данных и управляющих
команд исследователя к выходным результатам можно представить схематически,
как показано на рис. 44.1. Прямоугольник символизирует вычислительную проце-
дуру МНК; А, В и С – входы для данных, необходимых для вычислений (А – ис-
ходные данные, В – базисные функции, С – линейные ограничения), D – выход,
дающий значения искомых параметров и достигнутое значение минимизируемого
функционала J. Классическая форма МНК, как она описана выше, предполагает,
44. Динамическая интерпретация метода наименьших квадратов 357

что сначала поступают все входные данные, а затем выполняются вычисления и


выдаются требуемые выходные данные.

A MHK D

B C

Рис. 44.1. Представление универсального МНК


в виде преобразователя с входом и выходом

Универсальная рекуррентная форма МНК состоит в том, что все время на


входы А, В и С могут подаваться извне новые данные или исключаться старые,
выход D выдает соответствующие им значения искомых параметров и происходит
это не путем многократного повторения вычислительной процедуры МНК, а ре-
куррентно на основе вводимого состояния θ в виде совокупности пяти матриц, в
частности, содержащих значения параметров as и функционала J. При этом
θk+1 = T(uk+1) θ k,
ak+1 =f θ k+1. (44.3)
Здесь θk и θ k+1 – состояния на k-м и следующем k + 1-м тактах вычислений, ak+1 –
вектор искомых значений параметров на k + 1 шаге, uk+1 – вектор входа исполь-
зуемых данных и управляющих воздействий исследователя, поступающих после
k-го шага. Вектор uk+1 представляет собой одно из трех (шести, объединенных по-
парно), перечисляемых ниже возможных входных воздействий:
1) введение новых входных данных xj, bj или исключение старых;
2) введение новой функции ϕI (x) или исключение какой-то прежней с соот-
ветствующим введением нового параметра ai или исключением прежнего;
3) добавление нового линейного ограничения или исключение старого.
Реализация оператора управляемой динамической системы (44.3) не требует
обращения матриц, а только их сложения и умножения. Вместе с тем описание
этого оператора T(u) достаточно громоздко и поэтому не приводится.
Описанная универсальная рекуррентная форма и ее представление в виде
управляемой динамической системы придает МНК новые широкие возможности
практического использования и необходимую адаптивность к решаемой задаче. В
частности, не требуется обращения матриц, обходится проблема плохой обуслов-
ленности информационной матрицы, легко исключается ошибка начального при-
ближения, неизбежная при прежней частичной рекуррентности, значительно эф-
фективнее поиск подходящей модели, устранение ошибочных или случайно силь-
но уклоняющихся данных. Появляется возможность построения приспособленно-
го базиса и сжатия описания и кодирования, текущей обработки потоковых дан-
ных и др.
Поисковая глобальная оптимизация с адаптивной моделью [27]. Алго-
ритм поисковой глобальной оптимизации, минимизации функции Q(x) на множе-
стве X определяется правилами назначения следующей точки:
358 Ю.И. Неймарк. Математическое моделирование как наука и искусство
n−1 n−1 i i
xn = f (x1, Q1,…, x ,Q ), Q = Q(x ), (44.4)
и остановки поиска
n n
g(x1, Q1,…, x , Q ) > 0. (44.5)
После остановки в качестве «минимума» функции Q( x ) на X берется значе-
ние
n s
Qmin = min [Q1,…, Q ] = Q , (44.6)
s
в точке xmin = x . При этом функция Q(x) предполагается заданной в том смысле,
что для любого x ∈ X может быть найдено значение Q(x). Выбор следующей по-
сле x1, x2, …, x n точки xn+1 может опираться на разные соображения. Ниже будем
исходить из наибольшей вероятности того, чтобы в новой выбранной точке xn+1
вероятность неравенства
Qmin – Q(x) > η > 0 (44.7)
была максимальна. Для возможности такого выбора принимается стохастическая
модель функции Q(x), которая строится по уже известным значениям функции
Q(x) в точках x1, x2, …, xn. Согласно этой модели, вероятность того, что Q(x) < Q
равна
 Q −Qs 
P (Q ( x ) < Q x , Q ;...; x Q ) = ∑ C s ( x )ϕ 
1 1 n n
 .
 (44.8)
γ
 s ( x ) 
Функции ϕ(ξ), Cs(x) и γs(x) выбираются из доступных общих представлений о
функции Q(x). В соответствии с ними ϕ(ξ) – неубывающая функция ξ, меняющая-
ся от 0 до 1 при изменении ξ от −∞ до +∞, Cs(x) – функции x такие, что Cs(x) → 0
при возрастании расстояния ρs точки x от точки xs и Cs(xk) = δsk (символ Кронеке-
ра), γs(x) – возрастающие функции расстояния ρs, например Dsρs, где Ds – коэффи-
циент, оценивающий скорость изменения функции от точки x к точке xs. В качест-
ве конкретных видов функций ϕ(ξ) и Cs(x) можно, например, принять
 1 ξ
 n

−1
 e при ξ ≤ 0,
C s ( x ) = ρ −s 1  ∑ ρi− 1  , ϕ ( ξ) =  2 (44.9)
 i =1  1
1 − e −ξ при ξ ≥ 0.
 2
Подчеркнем, что стохастическая модель (44.8) вобрала в себя не только апри-
орные представления о функции Q(x), но и сведения, полученные о ней после n
шагов поиска. С каждым следующим шагом поиска эта модель уточняется. Имен-
но поэтому она названа адаптивной стохастической моделью оптимизируемой
функции. Следующая точка x n+1 находится как точка максимума вероятности не-
равенства (44.7), определяемой как максимум (44.8) при Q = Qmin − η . Поэтому
описанный метод оптимизации имеет практический смысл лишь, если задача мак-
симизации функции (44.8) много проще такой же задачи максимизации функции
Q(x), что может иметь место при значительных трудностях или больших необхо-
димых затратах для вычисления функции Q(x), когда эти вычисления требуется по
возможности сократить.
44. Динамическая интерпретация метода наименьших квадратов 359

Определение следующей точки поиска на каждом шаге требует задания вели-


чины η > 0 в неравенстве (44.7). Эту величину η можно рассматривать как управ-
ляющий параметр поиска. Интуитивно ясно, что в начале поиска надлежит стре-
миться к возможно более быстрому уточнению модели и лишь после этого оты-
скивать минимум, что в процессе поиска их следует целесообразно сочетать. В
начале поиска можно надеяться на значительное уменьшение значений Q, в даль-
нейшем они менее вероятны. Из этого следует, что вначале нужно выбирать боль-
шие значения η, а затем их уменьшать. Как можно предположить, при больших η
происходит уточнение модели, а при малых η небольшие уменьшения минимума.
Но все это не более, чем общие эвристические соображения, подкрепляемые экс-
периментами. Более обоснованный выбор η на каждом шаге можно сделать, если
располагать примерным графиком зависимости
P(Q(x) < Qmin – η)
от числа η. Эта вероятность убывает с η, и это убывание может быть медленным
или быстрым. При медленном убывании естественно увеличивать η до разумного
предела, при очень быстром убывании его следует выбирать меньшим, предпочи-
тая малый, но достижимый результат, несколько большему, но весьма мало веро-
ятному. Мне представляется, что здесь мы сталкиваемся именно с тем случаем,
когда природная интуиция человека и его опыт играют решающую роль, и едва ли
попытки уточнения теории, во всяком случае в рамках принятой модели и метода
поиска, могут быть реально полезны. Но мы уклонились от основной темы, и нам
надлежит описанный процесс поиска минимума привести к управляемой динами-
ческой системе, т.е. надлежит определить понятие состояния, пространства со-
стояний и указать оператор изменения состояния, который будет зависеть от
управляющей переменной η. Определение следующей точки поиска xn+1 требует
знания всей предшествующей последовательности значений x1, Q1; x2, Q2; …;
xn, Qn и отыскания максимума по x функции (44.8) при заданном Q = Qmin − η . На-
помним, что xmin – это значение xs, при котором Qs – максимум из всех известных
значений Q1, Q2, …, Qn. Тогда в качестве состояния следует принять всю последо-
вательность значений x1, Q1; …; xn, Qn. Пространство состояний – это множество
всевозможных таких последовательностей для всех n ≥ 1 с xI ∈ X и QI = Q(xi),
а оператор определяется тем, что xn+1 есть максимум функции (44.8) при
Q = Qmin − η , где η > 0 – задаваемая на каждом шаге управляющая переменная
[32].
360 Ю.И. Неймарк. Математическое моделирование как наука и искусство

45. ИГРОВАЯ МОДЕЛЬ ЧЕЛОВЕЧЕСКОГО ОБЩЕСТВА


Модель организации и функционирования современного общества
[38, 39]. Математические модели, которые рассматривались до сих пор, – это под-
час весьма упрощенные, но модели существующих или заведомо осуществимых
объектов и процессов. Когда речь шла о моделировании, предполагалось, что это
моделирование реальных объектов, но математические модели могут относиться
и к несуществующим объектам, воображаемым, гипотетическим и даже фанта-
стическим. В одних случаях осуществимость их не вызывает сомнения, в других –
это не так. Моделируя полет на Луну, можно понять, реализуем ли он и что для
этого требуется. Но могут быть модели, для которых реализация весьма пробле-
матична, даже если в принципе и возможна. Такая ситуация имеет место при мо-
делировании будущего устройства общества людей или возможных в будущем
попыток моделирования новых генетических конструкций живых организмов и
человека. Такое, назовем его фантастическим, моделирование тоже имеет право
на жизнь и, более того, интересно и может быть полезным.
Игровая модель человеческого общества, пожалуй, не только фантастическая
модель, но и непривычная, поскольку по необходимости ее построение опирается
не на точные знания и точные науки, а на общие гуманитарные и естественно-
научные соображения и доводы, но следующие из них выводы неожиданны и ин-
тересны и согласуются с некоторыми определяющими тенденциями, наблюдае-
мыми в современном обществе. Даже при математическом изучении общества
гуманитарные соображения неизбежны, и роль математики состоит в том, чтобы
помочь сделать их более четкими и отделить то, что принимается, от того, что из
этого следует, и вывести то, что нужно и интересно.
Дальнейшее представляет собой попытку постижения организации и функ-
ционирования современного общества, тенденций и перспектив его эволюции и
развития с позиций точной науки: математического моделирования, теории
управления и теории колебаний.
Математического моделирования, потому что мы хотим построить математи-
ческую модель и на ней основывать дальнейшие выводы. Общество и его дея-
тельность являются очень сложными, и в понимании их мы довольствуемся раз-
личными соображениями, и кажется, что точная наука здесь ничем помочь не мо-
жет, а уж математика и подавно. Но это не так в силу феномена простых матема-
тических моделей, которые описывают изучаемый объект в целом, отражая лишь
интересующие нас важнейшие его особенности и стороны.
Теории управления потому, что функционирование общества основано на це-
лесообразной синхронизации действий отдельных людей, создаваемой и поддер-
живаемой не без использования управления.
Теории колебаний потому, что она − всеобъемлющая наука об эволюционных
процессах, а функционирование общества – это эволюционный процесс.
Общество и составляющие его люди в своей организации и своем функцио-
нировании похожи на живой организм, состоящий из клеток. Сообщество клеток
обеспечивает жизнь всего организма, а жизнедеятельность клеток обеспечивается
45. Игровая модель человеческого общества 361

гомеостазом среды обитания клеток в организме. Нечто аналогичное имеет место


и в человеческом обществе. Для его жизни необходимо обеспечить соответст-
вующую среду, назовем ее базовым уровнем общества. По мере совершенствова-
ния многоклеточного живого организма, как необходимые условия жизни, поми-
мо гомеостаза среды, возникли еще гуморальные и нервные управления. В совре-
менном обществе они имеют аналог в организации жизни и действий людей, осу-
ществляемые государством и общественными организациями. В живом организме
все происходит как бы само собой, в силу законов природы, ее тенденций к само-
организации, еще недостаточно понятых нами. В человеческом обществе, в отли-
чие от дикой природы, многое организуется на сознательном уровне при целена-
правленном вмешательстве людей в свою жизнь. Отмеченная аналогия между жи-
вым организмом и человеческим обществом очевидна, но столь же, если не более,
разительны отличия. Общество по отношению к живому организму находится на
следующем уровне эволюции жизни, когда «клетка» становится мыслящей и при-
обретает возможность прямого воздействия на его организацию и деятельность.
Такого результативного, прямого и быстрого воздействия у клеток на организм
нет. Это существенное различие влечет гигантские ускорения эволюции жизни,
совершенствования и развития общества людей по сравнению с живым организ-
мом клеток.
Над тем, как функционирует человеческое общество, начали думать давно, но
только сейчас, как мне представляется, появилась необходимая научная база, и
проблема назрела. До каких-то пор смена и формирование общественных, соци-
альных и экономических структур происходили в основном подобно развитию
всего живого на Земле – эволюционно биологически, не без проб, ошибок, тупи-
ков и отбора. Вместе с тем, на этот процесс оказывали влияние традиции, верова-
ния, общие представления и естественно-научные взгляды. В изучении общества
со времен древней Греции наметились два подхода. Их можно обозначить «от че-
ловека» и «от государства». Восторжествовал государственный подход как в опи-
сании исторических событий, так и текущей жизни общества. В основе всего про-
исходящего и судеб общества ставились государство и власть, их интересы и це-
ли. Лишь в последнее время наметился перелом, и отчасти учитываются интересы
всех людей в целом. Все это довольно естественно, поскольку государство и
власть выполняли необходимую всему обществу жизнеобеспечивающую функ-
цию защиты от внешней агрессии, порабощения и истребления. Развитие матери-
альной производственной основы перешагнуло эти рамки и приняло характер
всеобщей научно-технической и информационной революции, и они в значитель-
ной мере определяют структуру современного общества. Представляется, что се-
годня нечто подобное возможно и в социально-экономической, и общественной
сферах. Если угодно, пришло время признать, что сегодня нет более важного и
интересного объекта научного изучения, чем человеческое общество. Изучения не
локальных вопросов экономичности, рентабельности, доходности и эффективно-
сти предприятий, производства, сельского хозяйства, оборота товаров и денег, что
само по себе тоже очень важно, а механизмов функционирования общества и об-
щих принципов его организации и управления.
Глобальная математическая модель и основанные на ней теории функциони-
рования, организации и управления обществом очень нужны и могли бы помочь
362 Ю.И. Неймарк. Математическое моделирование как наука и искусство

человечеству в преодолении угрожающих ему социальных, экологических, эко-


номических кризисов и катастроф, способствовать социальной революции, анало-
гичной промышленной и информационной. Но, как представляется, изменения не
произойдут сами собой, как это имело и имеет место для технической и информа-
ционной революций, и есть, по крайней мере, две причины этого. Одна причина –
отсутствие непосредственной заинтересованности тех, от кого это зависит, а вто-
рая – недостаточная компетентность тех, от кого это зависит. В сфере материаль-
ного производства, чтобы преуспеть, необходимо и то, и другое: и заинтересован-
ность, и умение, что совершенно не обязательно для власти.
Заинтересованность, если и может возникнуть, имеет весьма призрачные ос-
нования, не следующие из коренных интересов власти, компетентность и вовсе не
нужна, точнее, не нужна компетентность, необходимая для социальной револю-
ции. Чтобы стать сапожником, надо учиться, для обувной промышленности гото-
вятся кадры в специальных техникумах и институтах. Чтобы стать строителем,
тоже надо учиться. Чтобы стать врачом, нужно пройти пятилетний срок специ-
ального обучения, потом еще клиническую практику, и затем еще все время
учиться и учиться; чтобы стать старшим научным сотрудником, надо не только
окончить институт или университет, но и защитить кандидатскую, а то и доктор-
скую диссертации. После всего этого выдержать конкуренцию, требующую лич-
ной заинтересованности, позволяющей проявить необходимую активность.
А что нужно изучить, уметь и обязательно знать, чтобы стать членом думы,
правительства, областной или городской администрации? Таких жестких требо-
ваний нет. Их нет потому, что власть сама себе хозяйка, и никто ей не указ. И еще
потому, что для проникновения во власть нужны в первую очередь совсем другие
качества, чем те, благодаря которым люди совершили научно-техническую рево-
люцию, совершают информационную и могли бы совершить научную социально-
экономическую. Для того чтобы могла произойти основанная на знаниях и разуме
научная социально-экономическая революция, совершенно необходимы откры-
тость деятельности власти, наличие жесточайших критериев оценки делаемого
властью и наличие механизма отсечения некомпетентных действий, обмана и
туфты, постоянного притока во власть деятельных и талантливых людей.
Что же может привести к осуществлению этих требований? Мне представля-
ется, что только осознание неизбежности глубочайшего и жесткого кризиса, осоз-
нание наступления катастрофы, угрожающей существованию всех, в том числе и
власти, в сочетании с пониманием своих интересов и выгод не только в кратко-
временном, сиюминутном, но и долгосрочном плане, понимание единства всех
людей как вида и их судьбы и, наконец, понимание того, что нужно делать и к че-
му следует стремиться, чтобы избежать катастрофы.
Величайшим искушением всякой власти является силовое управление обще-
ством и миром. Однако управлять сверхсложным и, самое главное, активным объ-
ектом, каким является человеческое общество, силовыми и даже всесокрушаю-
щими методами невозможно, не разрушая его, не лишив его совершенно необхо-
димых качеств, способности к самоорганизации, ведущей к его эффективности и
процветанию. Силовое управление, в конечном счете, ведет к фактическому унич-
тожению человеческого общества. Властное управление должно быть не сило-
вым, а способствующим активности всех людей, наилучшему их использованию.
45. Игровая модель человеческого общества 363

Управление человеческим обществом не может быть полностью централизовано,


его основой должна быть его способность к самоорганизации, которой властное
управление должно способствовать и наличие чего должно обеспечить. Коллек-
тивный разум и деятельность людей не может заменить никакая централизован-
ная власть: он − основа жизни и эволюции общества. Многое из того, что сказано
выше в связи с желанием построить и обсудить глобальную математическую мо-
дель базового уровня человеческого общества, позволяющую понять принципы
его функционирования, организации и управления, бездоказательно и выражает
точку зрения автора. Она высказывается не для того, чтобы с ней обязательно со-
глашаться, и далеко не все, что высказано, будет использовано. Это, если угодно,
приглашение к обсуждению, к тому, чтобы задуматься.
Вместе с тем математическое рассмотрение предполагает наличие исходных
утверждений, которые должны быть приняты. Обычно это общепринятые пред-
ставления точной науки, и они как бы за кадром: они не обсуждаются, из них ис-
ходят, строя дальнейшую теорию. Теперь поступить так нельзя: формулировка
исходных положений для общества требует обсуждения и аргументации, они не
просты и не очевидны. В данном случае исходные положения – это игровое вос-
приятие жизни, стремления людей, составляющих общество, и то, что мы хо-
тим от него. Только после того, как все это будет обсуждено и принято, можно
перейти к выводам, которые можно назвать принципами организации и управле-
ния обществом.
Исходным положением будет то, что общество создается и существует для
человека, для всех людей, и поэтому должно соответствовать природе человека и
его стремлениям и желаниям, совместимым между собой и приемлемым для всех
людей. Это положение, естественно, нельзя доказать, его можно только аргумен-
тировать и не более, всегда может найтись человек, который скажет: «Нет, обще-
ство создано только для меня или нас, а государство – это я» или «мир и все люди
существуют только для моего народа, и все должны подчиняться и служить ему».
Такие точки зрения тоже имеют свои веские аргументы как в природе человека,
так и в том, что совершенствование жизни до сих пор осуществлялось через жест-
кую борьбу за существование. Это нельзя оспаривать, это так было, но на совре-
менном этапе развития жизни это уже не так. Этот механизм эволюции изжил се-
бя, его необходимо заменить, потому что он перестает служить в должной мере
цели прогресса жизни на Земле. Борьба за существование должна принять другие
формы. Так думают сейчас многие, но не все. В этих основах все же легче разо-
браться, чем в человеческом обществе. В этом и состоит возможная помощь точ-
ной науки: сложные и очень сложные вопросы она сводит к менее сложным и да-
же простым.
Для нас то, что общество в равной мере для всех людей и ради всех людей –
аксиома. Борьба за существование как механизм эволюции и совершенствования
жизни должна быть смягчена и заменена чем-то другим. Необходимость этой за-
мены вызвана тем, что период чисто физиологического и физического совершен-
ствования живого дополнился, если не сменился, периодом его интеллектуально-
го совершенствования. Интеллектуальное совершенствование открывает новые
возможности и пути эволюции и прогресса жизни. А борьба за существование в
условиях наличия высокого интеллекта ведет совсем не к тем последствиям, ко-
364 Ю.И. Неймарк. Математическое моделирование как наука и искусство

торые были бы желательны и способствовали бы совершенствованию жизни и ус-


пешной деятельности людей.
В формулировании исходных постулатов нет логики, но есть доводы и сооб-
ражения. От нежелательных последствий борьбы за существование живая приро-
да создавала защитные инстинкты. Человек это может и должен сделать созна-
тельно. Вначале он это делал на основе религиозных представлений и верований,
которые как бы спускались с небес, почитаемых и устрашающих. Сегодня это не-
обходимо сделать, опираясь на интеллект и естественные и точные науки.
Необходимая коррекция борьбы за существование – это превращение ее в
конкуренцию на основе стремления к достижению поставленной цели и в рамках
жестко соблюдаемых правил. Эту трансформацию борьбы за существование мож-
но назвать игрой. Игрой, где все имеют равные возможности, никто не нарушает
правил, и победители признательны побежденным, потому что без них не было
бы ни победы, ни ее радости, ни самой игры. Без побежденных игровой механизм
состязательного совершенствования человечества не работает.
Итак, игра вместо борьбы за существование, равенство прав и возможностей
всех людей и, наконец, все это ради людей. Таков итог предварительных сообра-
жений о постулатах, которые будут положены в основу дальнейших, уже логиче-
ских выводов.
Можно предвидеть и слышать веские возражения: «Все это так, но люди в
силу своей природы, инстинктов и эгоизма никогда это не будут соблюдать, даже
если и примут». К сожалению, это правда. Почти правда, поскольку все же воз-
можны два возражения: одно − в том, что природа наделила человека моралью и
этическими представлениями и нормами, душой, и второе − люди все же способ-
ны осознать, что прямолинейный эгоизм и стремление к сиюминутной выгоде не-
избежно приведут к кризису и катастрофе, что изменения и принятие ограниче-
ний в поведении, в конечном счете, просто выгоднее.
Изменению поведения людей может способствовать объяснение реально сло-
жившейся грозной ситуации и возможных путей ее преодоления. Вот именно
здесь точная наука, убедительность ее доводов и логики могут помочь. Конечно,
народы разных стран и разные люди находятся на разных стадиях способности
это понять, осмыслить и изменить свое поведение, и это не произойдет мгновен-
но, но это должно произойти; трудно поверить, что гигантские возможности са-
моорганизации природы дадут сбой. Более того, соответствующие тенденции, не-
сомненно, имеются в цивилизованных странах.
Кризис эволюции жизни [38]. Прежде всего, хочется пояснить, почему воз-
никла столь необычная тема и как следует понимать проблему человеческого об-
щества, социальных отношений и их истории.
Историю человеческого общества можно воспринимать как продолжение
эволюции жизни на Земле. Проблему эволюции общества людей – как задачу со-
ставления математических моделей, способных объяснить наблюдаемую реаль-
ность и подсказать возможные пути дальнейшего совершенствования.
Представляется, что человеческое общество настолько сложно и многообраз-
но, а адекватная математическая модель настолько сложна и необозрима, что та-
кой подход безнадежен. В какой-то мере это подтверждается, поскольку пока ни-
каких результатов на этом пути получить не удавалось: все, что написано об об-
45. Игровая модель человеческого общества 365

ществе людей и истории его развития, носит описательно-объяснительный гума-


нитарный характер.
Рассмотрение простых математических моделей достаточно сложных объек-
тов показало, что иногда с их помощью удается просто ответить на очень слож-
ные вопросы. Таковы модели кризисов сердца, двуногой ходьбы, инфекционных
заболеваний, игры в отгадывание, загадок Каспийского моря и др.
Грубое описание человеческого общества простой моделью «производители –
продукт – управленцы» было представлено в гл. 12. Эта модель отражает факт объ-
единения конкурирующих между собой людей в общество для более эффективно-
го производства и получения необходимого для жизни продукта. Изложению ре-
зультатов математического исследования этой модели и вытекающих из него вы-
водов предпошлем краткое общее обсуждение проблемы эволюции жизни.
Несомненно, что многое в жизни современного общества – отдельных людей,
групп, сообществ, стран и народов, а также всего человечества в целом, – унасле-
довано от предков. Поэтому, чтобы понять его сегодняшнюю жизнь и пытаться
прогнозировать и повлиять на его будущее, нужно осмыслить его прошлое, про-
слеживая прошлую эволюцию жизни на Земле от достаточно отдаленных времен.
Безусловно, зарождение и эволюция жизни таит в себе много загадочного и непо-
знанного. Но вместе с тем можно думать, что основные факторы этой эволюции
известны. Это наследственность, изменчивость и отбор − то, на что в итоге указал
Дарвин и развито в дарвинизме, и то, что удалось узнать о хромосомах и генах.
Как сегодня принято многими исследователями, биологическая наследственность
полностью определяется генами. Наследование поведения также носит генетиче-
ский характер, но лишь отчасти: громадную роль играют традиции, верование,
прижизненное обучение и индивидуальный опыт. Изменчивость, как представля-
ется, таинственна и далека от понимания, поскольку поверить в то, что она опре-
деляется только случайными мутациями генов, трудно. Трудно поверить, что
только случайность и отбор могут привести к наблюдаемому величайшему со-
вершенству и всеобъемлющему использованию возможностей природы. Конечно,
время эволюции непостижимо огромно – миллиарды лет. Но, по-видимому, еще
что-то нами не познано. Может быть, в основе лежит случайность, как некий ге-
нератор, но есть еще фильтр и какая-то направленность. Более того, если иметь в
виду не только биологическую эволюцию, но и социальную, то это так, и меха-
низмы фильтрации и направленности, хотя они не выделены и не изучены нами в
должной мере, безусловно, имеют место.
Отбор, как таковой, неизменен в том, что отбираются те, кто продолжил
жизнь. И до человека именно выжившие в решающей мере определяли эволю-
цию. Но для человечества это уже не так. Многое определяется накопленными и
освоенными человечеством знаниями, традициями, верованиями, моралью и т.д.
У животных значительную роль в ускорении эволюции играет половой отбор, у
человека – традиции, верования, знания, умения и т.п. Эволюция человечества как
бы раздвоилась: на биологическую и социальную, и они друг с другом не согла-
сованы. Они даже подчас антагонистичны. В какой-то мере можно говорить о
кризисе эволюционного совершенствования. По-видимому, достаточно обстоя-
тельно впервые на него обратил внимание К. Лоренц в своих «Восьми смертных
грехах человечества». Среди них можно выделить генетическое биологическое
366 Ю.И. Неймарк. Математическое моделирование как наука и искусство

вырождение и интеллектуальное оскудение, а также истощение природных ресур-


сов и непрекращающиеся вражду и войны.
До сих пор природа сама определяла ход эволюции и успешно решила про-
блему создания homo sapiens. Но в эволюции человечества она дает сбой: полез-
ные ранее инстинкты, и прежде всего агрессия, проявляются в войнах, нескончае-
мой вражде, которые едва ли способствуют разумной эволюции. Они заведомо не
помогают реализации наших чаяний о полноценной жизни, основанной не на
прямом истреблении, подавлении, неприязни и недоброжелательстве, а на добро-
те и сочувствии, интересной работе. Можно думать, что такая жизнь лишь плод
фантазии, и история коммунизма как бы это подтвердила. Но был не только ком-
мунизм, был еще один эксперимент, давший не менее ужасный результат в виде
фашизма. Эти эксперименты, по существу, – попытки реализации двух сторон
эволюции человека: биологической и интеллектуальной (ранее названной соци-
альной). Эти крайние эксперименты можно трактовать, как попытки природы уй-
ти от раздвоения, как некое указание, что человечество должно искать выход в
разумном согласовании. Нужно трансформировать инстинкт агрессии, нужно
умерить требования всеобщего благоденствия, потому что первое ведет к нечело-
веческой жизни, а второе – к всеобщей апатии и застою. Едва ли сама природа
может выпутаться из этого тупика. Точнее, она может из него выпутаться, ис-
пользуя новые возможности созданного ею человека, опираясь на его интеллект.
Успешность такого подхода уже отчасти апробирована: более 200 лет тому назад
интеллект небольшой группы людей создал конституцию и определил правила
жизни, которые привели к расцвету и ведущей роли современной Северной Аме-
рики. Для того чтобы это произошло, потребовалось уникальное сочетание благо-
приятных обстоятельств. Эти уникальные обстоятельства вряд ли вновь возник-
нут сами по себе. Более того, действия современной Америки едва ли способст-
вуют разрешению проблемы раздвоения эволюции, едва ли предотвращают угро-
зы, выявленные К. Лоренцем.
Что же нужно для решения проблемы согласования, для продолжения прием-
лемой дальнейшей эволюции жизни человечества? Скорее всего, нужен согласо-
ванный синтез, и ростки этого синтеза наблюдаются в современном мире – в под-
мене борьбы за существование игровым восприятием жизни, в замене смертель-
ной схватки игрой, которая дает удовлетворение и радость человеку, не истребля-
ет и не порабощает его, которая сохраняет и стимулирует активность человека без
того, чтобы истреблять врага или унижать, лишая интереса к жизни; игрой, кото-
рая своей увлекательностью обеспечит активность и эффективность деятельности
людей. Замена смертельной схватки игрой широко представлена в животном ми-
ре, и ростки ее наблюдаются в современном обществе.
После сказанного вернемся к обсуждению математической модели «произво-
дители – продукт – управленцы», даваемого ею объяснения кризиса эволюции жиз-
ни с появлением человека и естественно возникающей идеи игрового общества.
Ниже мы будем анализировать модель, которую будем называть расширенной,
потому что в ней будет учтен параметр m, и параметр µ будет считаться отличным
от единицы. Выпишем здесь уравнения рассматриваемой расширенной модели:
45. Игровая модель человеческого общества 367

x& = ( a − bx − ly + cz ) x,
(45.1)
y& = ( − dy − mx − ey + fz ) y,
 1 + ε1 y µx
F = g − hx − ky при z > 0, или z = 0 и F > 0,
&z =  1 + ε 2 y 1 + δz
0 при z = 0 и F ≤ 0.
В этой модели, в отличие от рассмотренной в гл. 12, имеется дополнительный
параметр m, учитывающий давление производителей на управленцев и возмож-
ность отличия от единицы параметра µ, характеризующего эффективность произ-
водителей. Рассмотрение этой модели в сопоставлении с реальной историей со-
держится в [39].
Как следует из результатов гл. 12 и уравнений (45.1), удалось обнаружить, что
с ростом уровня технологии g, помимо производителей x, возникает сначала про-
дукт z и затем управленцы y, и что возникновение управленцев происходит неза-
висимо от параметра ε1/ε2, характеризующего их полезность.
При низком уровне технологии, когда g < h, имеется единственное устойчи-
вое состояние равновесия x = x*, y = z = 0, т.е. в обществе существуют одни про-
изводители.
При среднем уровне технологии, когда h < g < h(1 + δd/f ) появляется накоп-
ленный продукт z = z*.
При высоком уровне технологии, когда g > h(1 + δd/f ), появляются еще и
управленцы. При этом устойчивое равновесие x = x*, y = y*, z = z* может стать не-
устойчивым и возникнут автоколебания. Это соответствует периодическому из-
менению всех переменных x, y и z, причем на некоторых участках z может обра-
щаться в нуль, что соответствует глубокому кризису. Из сказанного следует, что
возникновение управленцев не зависит от ε1 и ε2, т.е. они возникают просто пото-
му, что общество может их прокормить.
Следует отметить, что значимость второго вывода не легко сразу оценить, а с
ним, по-видимому, связана такая многовековая трагичность истории человечест-
ва, как проявление кризиса эволюции жизни с приходом человека.
До появления человека вожак стаи – это самый сильный, умный и полезный,
и как только появляется более достойный, он сменяет прежнего вожака. В челове-
ческом обществе с некоторых пор это не так. Согласно модели (12.1) это тоже не
так: управленцы – аналог вожака – могут быть не только полезными, но и вред-
ными, и это не мешает их появлению и не ведет к исчезновению, если, конечно,
уровень технологии g высок (g > h(1 + δd/f )).
Это, естественно, ведет к конфликту между управленцами и производителями
и, возможно, внутри самих управленцев. Конфликт не нашел отражения в модели,
но это наблюдается в течение всей истории человечества и ведет, как правило, к
действиям управленцев, способствующих их укреплению, а не отстранению.
Добиться этого удается одурачиванием общества и подавлением силой, ими-
тацией своей необходимости, присвоением властных полномочий и их злоупот-
реблением. При этом используются любые средства, вплоть до уничтожения кон-
курентов, активизации агрессии, раздоров, ненависти, войн, террора на нацио-
нальной, религиозной, классовой и других основах, придумыванием внешних и
внутренних врагов, территориальных и других претензий.
368 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Остановить этот процесс очень трудно, поскольку он охватывает весь мир и


сам себя поддерживает. В прошлом веке он привел к двум мировым сокруши-
тельным ужасным войнам, сегодня – к расцвету терроризма и гигантскому отста-
ванию социального совершенствования от фантастических успехов промышлен-
ной и информационной революций. Это, по существу, кризис эволюции жизни с
появлением человека. Многие видят выход, причем окончательный, в либерально-
демократическом обществе. К. Лоренц, напротив, увидел в этом обществе устра-
шающие восемь смертных грехов, могущих привести человечество к катастрофе.
Прежде чем продолжить обсуждение современных последствий дефекта ор-
ганизации общества, обратим внимание на решающую его роль в истории челове-
чества. Дело не только в конфликте и его локальных последствиях, а в извращен-
ном формировании общества и взглядов людей на него, в трансформации необхо-
димого управления в неограниченную власть, в выделении в обществе особой
главенствующей части, живущей своей привилегированной жизнью, использую-
щей народ для ее осуществления и лишь отчасти заботящейся о нем в плане своих
интересов и целей.
Причина кризиса обнаруживается моделью (45.1), но может ли эта модель
объяснить то, что предпринимает человечество для его преодоления. В целом нет,
отчасти да. Точнее, в той ее части, которая вызвана стремлением к материальному
благополучию и достатку. При этом деятельность людей должна быть направлена
на управление параметрами модели.
Управление, в частности, можно осуществить через давление производителей
на управленцев (член mxy во втором уравнении модели (45.1)). Увеличивая m,
можно устранить неприемлемых управленцев или принудить их повысить свою
эффективность. Этого же можно добиться, увеличивая h. Желание увеличить по-
требление производителями требует увеличения эффективности как производите-
лей (увеличение µ), так и управленцев (увеличение ε1/ε2). Сказанное следует из
условия
 δ( db + ma ) 
µg > h 1 + ,
 fb − mc 
отражающего наличие глобально устойчивого равновесия и надлежащей зависи-
мости m от ε1/ε2.
Таким образом, кризис – дефект объекта, описываемого моделью (45.1), –
может быть преодолен с появлением у общества возможности управления пара-
метрами модели и непосредственным воздействием, а также способностью этим
воспользоваться.
Эти возможности могут реализоваться в двух планах: описанным давлением
на управленцев, что требует соответствующих прав, и выборностью управленцев
при условиях достоверных сведений о них и зрелости общества.
Либерально-демократические общества по своей идее такие возможности
предоставляют. Отсутствие возможности эффективного управления приводит к
революционному пути его реализации.
Расширенная модель (45.1) описывает динамический процесс под многооб-
разным воздействием природы и людей. Это хаотическое случайное воздействие
45. Игровая модель человеческого общества 369

предсказуемо только на небольших участках времени и то далеко не всегда. Но,


наверное, можно говорить о его общих тенденциях.
Что включает в себя модель (12.1) и что из нее непосредственно следует, бы-
ло сказано. То же самое можно сказать и о расширенной модели (45.1), включаю-
щей элементы управления, охарактеризовать мотивы и цели управления и извест-
ные пути его реализации. Управленцы заинтересованы в эффективности произво-
дителей µ, совершенствовании технологии g, уменьшении доли производителей h
в производимом продукте и увеличении своей доли k. Производители, напротив,
заинтересованы в увеличении своей доли h и эффективности управления ε1/ε2 .
Реализация желаний управленцев ими исторически узурпирована: они власть.
Производители должны добиваться реализации своих желаний и ограничения же-
ланий управленцев. Это сделать можно через профсоюзы и другие общественные
организации, через оппозицию, через контроль за деятельностью управленцев,
опирающийся на независимые средства массовой информации и правоохрани-
тельные органы, выборность власти и досрочное ее отстранение. Ослабление
узурпации власти, коррупции и сговора возможно путем разумного разделения ее
полномочий.
Как уже отмечалось, либерально-демократическое общество позволяет реали-
зовать более или менее эффективное обоюдостороннее управление объектом –
моделью (45.1), но оно в недостаточной мере удовлетворяет многогранным по-
требностям человека. Более того, оно ведет к восьми смертным грехам человече-
ства, указанным К. Лоренцем. Кроме того, равновесное противостояние в либе-
рально-демократическом обществе склонно к потере устойчивости.
Что же можно предложить человечеству, удовлетворяющее его страстям, его
врожденным наклонностям и устремлениям? Что больше всего любит и ценит че-
ловек, что может удовлетворять его постоянно, что сделает возможным преодо-
леть кризис и создать устойчивую и одновременно морально и этически приемле-
мую организацию социальной жизни, обеспечить организацию общества, для ко-
торого либерально-демократическое общество – исходный плацдарм, общества,
которое сможет обуздать неумеренное потребление и расточительство, создать
жизненно необходимые соблюдения требований экологии и уважения ко всем
людям, победить необузданную тягу к власти и деньгам? Подсказка пришла не от
математики, а от великих провидцев человеческого духа и жизни.
Игровое восприятие жизни и игровая модель общества. Несомненно, все
любят играть, кто как и с кем, или с чем. Жизнь человека можно воспринимать и
описывать как игру, подчас комичную, трагичную, интересную, скучную, увлека-
тельную, постылую, или какую-нибудь другую, но почти всегда желанную. На-
верное, все помнят слова из арии Елецкого (опера «Пиковая дама»): «Что наша
жизнь – игра...». Этой фразой открывается по телевидению показ игры «Что, где,
когда?» в элитарном клубе, где каждый может зарабатывать большие деньги сво-
им интеллектом.
Известный писатель М. Пришвин написал: «Жизнь желанная – это игра, все,
кто может, играют, а кто не может – трудится в надежде когда-нибудь поиграть».
Природа наделила человека многими качествами, которые способствуют его
активному, подчас самозабвенному участию в игре: самолюбием, честолюбием,
желанием первенствовать и добиваться своего, и т.п. Победа в игре может вы-
370 Ю.И. Неймарк. Математическое моделирование как наука и искусство

звать незабываемые по приятности и привлекательности эмоции. Люди способны


многими годами истязать себя тренировками ради единого мига ощущения вос-
торга и торжества победы на Олимпийских играх или других состязаниях.
Еще А. Эйнштейн сказал: «Успех – это неустанный труд плюс умение отно-
ситься к жизни как к игре».
Так что игра не только желанна и любима, но она эффективна и способствует
успеху в жизни. Игра – приемлемая форма и образ жизни людей.
Все привыкли, что в игре кто-то выигрывает, а кто-то проигрывает. Все вы-
играть не могут. Это кажется бесспорным, но есть много игр, для которых это не
так. Прежде всего, не так для игр человека с природой, это не так и для социаль-
ных игр, т.е. игр человека в обществе.
Кроме того, все привыкли, что играя надо свои «карты» прятать, скрывать
свои намерения. Но оказывается, что и это не всегда так. Может быть, совсем на-
оборот, и выгодно показать свои «карты» и даже договориться с партнерами о со-
вместных действиях.
Дело в том, что игры понимаются гораздо шире, чем те, в которые мы ради
удовольствия играем между собой. Математика описывает игру, как простейшую
одноходовую, когда каждый игрок делает свой ход и каждый получает выигрыш,
зависящий от его хода и ходов остальных игроков. Сказанное можно наглядно
представить в виде таблицы, где в первой строке представлены все игроки
I1 , I 2 ,..., I n ; во второй – ходы, которые они могут сделать, и при этом каждый иг-
рок Is выбирает любой ход xs из своего множества Ωs разрешенных ему ходов; в
последней строке стоят получаемые в результате сделанных ходов выигрыши ка-
ждого из игроков: игрок Is, сделав ход xs ∈ Ωs , получает выигрыш f s ( x1 , x2 ,..., xn ).
Это простейшая одноходовая игра n лиц, но уже ее достаточно, чтобы продемон-
стрировать сказанное выше об играх. Для этого воспользуемся обсужденным ра-
нее примером Ю.Б. Гермейера. В придуманной им игре каждый игрок Is выбирает
любое число xs (s = 1, 2, …, n), n ≥ 3, заключенное между 0 и 1, и получает выиг-
рыш
f s ( x1 ,K, xn ) = xs + ∑ (1 − x j ). (45.2)
j≠s
Пусть каждый игрок знает только свою функцию выигрыша (45.2). Он видит,
что может максимально способствовать своему выигрышу, выбрав xs = 1. И так
поступают все, т.е. все выбирают x1 = x2 = … = xn = 1, и в результате этого выбора,
согласно (45.2), каждый получает выигрыш в одну единицу. Если же все игроки
рассекретят свои функции выигрыша и каждый о них узнает, то, немного поду-
мав, они могут сообразить, что выиграют значительно больше, если договорятся,
что все будут в «ущерб себе» выбирать xs = 0 (s = 1, 2, …, n). После этого выиг-
рыш каждого окажется равным n − 1 , т.е. больше прежнего, равного 1, поскольку
n ≥ 3 . Вместе с тем каждый игрок имеет искушение не выполнить договорен-
ность, выбрав вместо нуля единицу, и выиграть n вместо n − 1 . При этом все ос-
тальные игроки получат на единицу меньше, и, скорее всего, это приведет к раз-
валу договоренности, и все окажутся в убытке, получив 1 вместо n.
45. Игровая модель человеческого общества 371

Нетрудно догадаться, почему в этой игре все не так, как в привычных для нас
играх. В этой игре сумма всех выигрышей положительна, в то время как в при-
вычных играх она равна нулю, и выигрыш одних получается только за счет про-
игрыша других. При игре двух игроков с нулевой суммой выигрышей игра носит
антагонистический характер со всеми вытекающими отсюда следствиями. Но в
игре с природой, за счет природы, ее ресурсов и даров, сумма выигрышей всех с
ней играющих может быть положительной.
Теперь можно сформулировать игру, в которую мы играем, живя в обществе
и участвуя во всеобщей трудовой или иной деятельности.
Каждый человек Is по желанию или в силу тех или иных обстоятельств и со-
ображений выбирает из множества возможных игр O игру, в которую он намере-
вается играть. Выбрав игру Os, он одновременно выбирает множество своих воз-
можных действий Ωs и функцию выигрыша f s ( x1 ,..., xn ) . Игра состоит в последо-
вательном выборе каждым из игроков множества Ωs, действия xs и получении со-
ответствующего выигрыша f s ( x1 ,..., xn ) , зависящего как от его действия xs , так и
действий остальных игроков. Каждый игрок в течение своей жизни делает много
ходов и может менять игры, но последнее обычно происходит редко.
Обратим внимание, что действия, которые выбирает игрок Is из множества
Ωs, определяются не только множеством Ωs , но и реальными возможностями иг-
рока. Иными словами, выбираемое действие должно принадлежать некоторому
присущему данному игроку множеству ωs , определяемому всей его предысторией
и, в частности, предшествующей игрой и ее результатами. В принципе может ме-
няться со временем и функция выигрыша.
Принципы организации и управления обществом. Постараемся сформу-
лировать, чего каждый человек, живя в обществе, добивается и хочет, и чего хотят
люди от общества. Кажется, что сделать это очень трудно и даже невозможно:
людей очень много, и они все разные. Но не нужно входить в детали, ограничимся
тем, что является общим для всех или почти всех. Ведь мы хотим взять в основу и
обсудить простую модель, а не модель, достаточно адекватную обществу во всех
его проявлениях. Общим для всех людей является:
1) стремление к возможно большему удовлетворению своих потребностей;
2) желание объединиться в общество для более эффективного производства
продукта и большего удовлетворения своих потребностей, несмотря на естествен-
ную конкуренцию;
3) стремление отдельных людей к максимальному удовлетворению своих по-
требностей, что, в конечном счете, должно привести к возможно большему удов-
летворению потребностей всех членов общества, так, чтобы успех каждого одно-
временно был успехом всех.
Обсудим условия осуществимости принципов 1)–3) (стремлений людей и их
желаний) в рамках игровой модели общества, точнее, условия, необходимые для
их выполнения, и назовем их принципами организации и управления обществом.
Прежде всего, отметим, что равенство прав и возможностей всех людей об-
щества заложено в самой игровой модели. Некоторое неравенство все же имеется
в силу неодинаковости множеств ωs , но это неравенство столь же неизбежно, как
и различие данных, которые получает человек от природы, от того, каким он ро-
372 Ю.И. Неймарк. Математическое моделирование как наука и искусство

дился и как проявлял себя. Возможно, что общество должно как-то компенсиро-
вать это естественное неравенство, что и наблюдается.
Далее, согласно 1)–3), совершенно необходимо соблюдение правил игры, в
частности, только при их соблюдении имеет место равенство прав и возможно-
стей. Только при соблюдении этих правил игра привлекательна, желанна и может
быть эффективной. С современной точки зрения, соблюдение правил игры можно
трактовать как соблюдение прав и обязанностей каждого человека. Для соблюде-
ния этих прав и успешности игры, которая требует возможно большей информа-
ции о ней, необходима открытость функционирования общества и происходящих
в нем процессов принятия решений, от которых зависят функции выигрыша каж-
дого из игроков. Не будем детализировать, что и в какой мере нужно знать или
уметь прогнозировать. Для нас сейчас важно лишь то, что для этого необходима
открытость общества. Итак, открытость общества – это одна из необходимых га-
рантий соблюдения прав человека и возможности успешной игры всех людей.
Возможно, что эта многогранная и существенная роль открытости общества по-
служила тому, что Дж. Сорос выдвинул ее как основную характеристику желае-
мого общества и стремление к его созданию. И еще одно необходимое условие
вытекает из того, что чем шире множество допустимых ходов, тем шире возмож-
ности оптимизации выигрышей. Это требование максимально допустимой широ-
ты множеств Ωs допустимых действий можно трактовать как принцип минималь-
ности принуждения, минимальности ограничений действий людей. В результате
мы пришли к трем принципам организации и управления обществом: соблюдения
прав человека, открытость общества и минимальность принуждения.
Обсудим, как обеспечить выполнение привнесенной и сформулированной в
п. 3 цели общества. Ранее потребление и продукт могли трактоваться весьма ши-
роко. Теперь это только деньги, сами по себе или их эквивалент. Денежную часть
выигрыша fs обозначим f s . Введем еще фактический денежный выигрыш ϕ s ка-
ждого игрока. Ясно, что общий денежный выигрыш F всего общества равен
F = ∑ f s = ∑ ϕ s . Выигрыш каждого будет способствовать выигрышу всех ос-
тальных игроков и общему выигрышу, если принять, что f s = α s F , где α s > 0,
∑ α s = 1 , но при этом все игроки лишены возможности оценивать реальный эф-
фект своих действий. Кроме того, игроки теряют интерес к игре, так как выигрыш
игрока фактически не зависит от его действий. Этого можно было бы избежать,
приняв f s = β s ϕ s , где β s > 0, ∑ β s ϕ s = ∑ ϕ s , но при этом не выполняется способ-
ствование выигрыша каждого выигрышу всех.
Оба требования могут быть соблюдены, если принять, что
f s = αs F + βsϕs , (45.3)
где α s > 0, β s > 0 . При этом коэффициенты β s не должны быть слишком малыми,
а коэффициенты α s > 0 – слишком большими. Это необходимо для того, чтобы
изменения функции выигрыша, по которым игрок может судить об эффективно-
сти своих действий, в основном определялись функцией ϕs, точнее, позволяли по-
нять, как меняется ϕs .
45. Игровая модель человеческого общества 373

Цель общества (п. 3) предполагает еще максимизацию общего выигрыша F


через максимизацию всех индивидуальных выигрышей ϕs, т.е. максимум функции
F или близкая к нему величина F должна достигаться при оптимизации каждой
из функций ϕs по переменной x s . Можно заметить, что если каждая из функций ϕs
зависит только от x s , то из оптимизации всех ϕs по xs следует оптимизация обще-
го выигрыша F, как функции всех переменных x1 , x2 ,..., xn . Можно надеяться, что
нечто близкое будет и в том случае, когда в функции ϕs ведущей, самой сущест-
венной переменной является xs. Интересно заметить, что игры с выполнением та-
кого условия наиболее привлекательны.
Подведем итог тому, что мы узнали о принципах функционирования, органи-
зации и управления современным обществом. Принцип функционирования обще-
ства – это игра, принципы организации – это:
1.1) открытость, свободный доступ к информации о функционировании, про-
цессах и событиях, происходящих в обществе;
1.2) принцип наименьшего принуждения, минимальность ограничений в дей-
ствиях членов общества;
1.3) принцип прав человека, т.е. правил жизненных игр, обязательных и оди-
наковых для всех.
Управление обществом должно устанавливать правила игры, т.е. величины
выигрышей f s и множества допустимых действий Ωs , причем делать это так,
чтобы:
2.1) каждый из игроков был лично заинтересован в игре и выигрыше, распо-
лагал достаточной информацией и возможностью ее оптимизации;
2.2) общий выигрыш F способствовал всем индивидуальным выигрышам f s ;
2.3) оптимизация индивидуальных выигрышей была бы одновременно в дос-
таточной мере и оптимизацией общего выигрыша F.
Кроме того, управление обществом должно обеспечить соблюдение правил
установленной игры и способствовать их совершенствованию. Стремление людей
к совершенствованию потребления может осуществляться не только за счет более
целесообразных действий в играх, но и за счет создания новых игр и новых дейст-
вий. Новые игры и допустимые действия – это новые орудия труда, типы и спосо-
бы производства, добычи и обработки, новые технологии, производственные,
сельскохозяйственные и другие процессы, новые условия жизни и труда, способ-
ствующие более полному удовлетворению потребностей человека. Совершенст-
вование игр происходит на основе познавательной деятельности людей, благодаря
их любознательности и интеллекту, желанию понять, исследовать и улучшить.
Игра должна охватывать в должной мере и эти виды деятельности человека, что
ведет к большей привлекательности совместной игровой жизни и способствует
общему прогрессу.
Базой этих нововведений является познавательная, исследовательская и по-
исковая деятельность людей на основе преемственности знаний и умений, обес-
печиваемых воспитанием и образованием. Инстинкты и природа человека способ-
ствуют этим видам его деятельности, но не во все времена они пользовались под-
держкой общества и включались в денежный выигрыш. Общество в этом вопросе
374 Ю.И. Неймарк. Математическое моделирование как наука и искусство

проявляло явно недостаточное внимание к своей выгоде, что лишь отчасти ком-
пенсировалось царской милостью, меценатской и благотворительной деятельно-
стями. У этого недопонимания есть веское основание: отсутствие денежной оцен-
ки таких действий, отдаленность их эффекта и заинтересованность в них общест-
ва в целом, а не конкретных людей. Это привело к тому, что одним из важнейших
факторов стимуляции научных и технических исследований стали вооруженное
противостояние и конфликты. Неприемлемость этой ситуации очевидна, но ис-
править ее очень непросто. Агрессивность и стремление к главенствованию тоже
в природе человека, и еще недавно являлись, как представляется, основными ме-
ханизмами эволюции жизни на Земле. Вооруженные конфликты тоже игры, в ис-
торическом плане великие, но едва ли приемлемые в настоящем и будущем. С
точки зрения рассматриваемой игровой модели общества они противоречат его
цели, а включение игр с познавательными действиями (наука, техника, культура,
обучение и др.) для нее естественно, поскольку расширяет привлекательность игр,
соответствует врожденным устремлениям и склонностям многих людей и сущест-
венно, если не решающе, расширяет эффективность игр всех людей и общества в
целом.
Идеальная игра людей в обществе. Исходя из игровой модели обществен-
ной жизни людей, их стремлений, сформулированных в п. 1) и 2), и привнесенной
цели общества 3), мы пришли к необходимости соблюдения ряда общих принци-
пов. Нельзя сказать, что они неожиданны или новы. В той или иной мере они вы-
сказывались ранее и даже отчасти осуществляются в цивилизованных странах. Но
наряду с этими высказывались и реализовывались совершенно другие принципы.
В отношении выигрыша (45.2), (45.3) можно сказать, что он имеет место в любом
обществе. Общество с α s = 1 / n и β s = 0 можно назвать идеальным коммунисти-
ческим, а общество с α s = 0 и β s = 1 – диким капиталистическим.
В цивилизованном обществе прямой заработок – это слагаемое β s ϕ s в фор-
муле (45.3), а слагаемое α s F – это то, что член общества получает отчасти или
полностью в виде образования, медицинского, культурного, социального, право-
охранительного обеспечений и поддержек и других бесплатных услуг.
Новое, что мы узнали: каких принципов следует придерживаться, если при-
нять исходные постулаты, и из каких соображений определяются коэффициенты
α s и β s ; выполнение каких функций обеспечивается каждым из этих принципов
и в чем содержание каждого из них. В целом они призваны способствовать при-
влекательности и эффективности игр и соблюдению их правил.
В частности, были сформулированы требования к всеобщей игре (в том числе
и экономической) людей, составляющих общество. В своей полноте они едва ли
выполнимы, но это и не требуется, достаточно лишь некоторое приближенное их
соблюдение. Вместе с тем изучение игр, удовлетворяющих этим идеальным тре-
бованиям, представляет определенный интерес и позволяет сформулировать
принципы, на основе которых в обществе становятся возможными приближенная
организация и самоорганизация.
Напомним, что игра состоит в том, что каждый из игроков Is, s = 1, n , выби-
рает значение своей переменной x s и получает при этом выигрыш f s ( x1 ,K, xn ) .
45. Игровая модель человеческого общества 375

Естественной стратегией каждого из игроков является максимизация своего вы-


игрыша по доступной ему переменной xs. Назовем игру идеальной, если эта стра-
тегия максимизации личного выигрыша ведет к максимизации общего выигрыша
всех игроков. Это требование можно сформулировать таким образом, чтобы мак-
симум функции f s ( x1 ,..., xn ) по всем x s достигался в той же точке O ( x1* ,K , xn* ) ,
что и максимум функции F ( x1 ,..., xn ) = ∑s f s ( x1 ,K, xn ).
Будем считать, что каждый из игроков умеет увеличивать свою функцию вы-
игрыша по своей переменной xs, меняя ее в соответствии с уравнениями
∂f
x& s = ε s (t ) s , s = 1, n, ( ε s (t ) > 0) (45.4)
∂x s
или аналогичными с малыми задержками.
Условия успешности индивидуальных поисков наибольших выигрышей. Во-
прос, который решается ниже: когда стратегия (45.4) приводит к достижению
идеальной игры и когда точка O единственная?
Возьмем функцию V вида
2
1  ∂f 
V = ∑ ε s (t )  s  (45.5)
2 s  ∂x s 
и найдем ее производную по времени при изменении переменных xs согласно
(45.4):
2
1  ∂f  ∂2 fs
V& = ∑ ε& s (t )  s  + ∑ ξ s ξk , (45.6)
2 s  ∂x s  s ,k ∂x s ∂xk
где ξi = εi (t ) ∂f i ∂xi , i = 1, n .
Сходимость поисковой стратегии (45.4) к выполнению условия идеальной
игры может иметь место, если функция V стремится к нулю. Последнее будет вы-
полнено, если
t
lim ∫ δ(t )dt = −∞ , (45.7)
t →∞
0
где δ = V& /V . Это условие является необходимым и достаточным.
Из (45.5) и (45.6) видно, что для выполнения (45.7) естественно принять, что
квадратичная форма
∂2 fs
Φ = ∑ ξs ξk (45.8)
s ,k ∂x s ∂xk
определенно отрицательная, так что
Φ ≤ − χ ( ξ12 + ... + ξn 2 ), χ > 0 . (45.9)
Далее из (45.5), (45.6) и (45.9) непосредственно находим, что
δ(t ) ≤ A − B ,
где A < Σ ε& (t ) / ε(t ) , B ≤ −2χ min εs (t ), при 0 < ε ≤ ε s (t ) ≤ ε ≤ ∞ условие (45.7) вы-
полняется, поскольку
376 Ю.И. Неймарк. Математическое моделирование как наука и искусство

t t
ε s (t )  ε ε
∫ δ( τ)dτ < ∑ ln ε j (0) − 2χ ∫ min ε s (τ)dτ ≤ n max  ln ε , ln ε  − 2χεt .
0 0
Из последней оценки следует, что
V (t ) < V (0)e a −bt , a, b > 0 . (45.10)
Согласно (45.10), приход из любой точки области V ( x1 ,..., xn ) < c < ∞ в об-
ласть V ( x1 ,..., xn ) ≤ d , где d > 0 , совершается за время, не большее некоторого
T < ∞. Отсюда следует, что все точки области V(x1, ..., xn) < c < ∞ за конечное вре-
мя переходят в точки одной и той же области V(x1, ..., xn) ≤ d, они, в свою очередь,
при достаточно малом d > 0 переходят в единственную точку O ( x1* ,..., xn* ) , для ко-
торой
∂f1 ∂f 2 ∂f
= = ... = n = 0 , (45.11)
∂x1 ∂x2 ∂xn
и других таких точек в области V(x1 , ..., xn) < c нет. Поскольку c – любое конечное
положительное число, то других таких точек нет вообще. Точка O ( x1* ,..., xn* ) един-
ственная, и для нее, согласно (45.8),
∂2 fs
< 0, s = 1, n , (45.12)
∂x s2
и поэтому в ней имеет место максимум каждой из функций fs по переменной xs .
Итак, уравнения (45.11) имеют единственное решение – точку O ( x1* ,..., xn* ) , и
она же есть глобально устойчивое состояние равновесия поисковой стратегии,
описываемой системой уравнений (45.4). Кроме того, эта же точка является точ-
кой максимума всех выигрышей f s ( x1* ,..., xn* ) по соответствующей переменной xs .
Допустимость небольших временных задержек. Пусть стратегия (45.4) реа-
лизуется с некоторыми временными задержками, так что
∂f
x& s = us , Ts u& s + us = ε s s , (45.13)
∂x s
где ради простоты примем εs постоянными, большими ε > 0 . Для доказательства
сформулированного в заглавии утверждения достаточно взять в качестве исполь-
зуемой ранее функции V другую функцию вида

1  ∂f  
2 2
 ∂f  
V = ∑ ε s  s  + A  x s − ε s s   , (45.14)
2  s  ∂x s   ∂x s  
 
где A > 0 затем подбирается нужным образом.
Когда стратегия максимизации индивидуальных выигрышей приводит
к глобальному максимуму общего выигрыша? Ответ на этот вопрос сводится к
тому, чтобы установить, когда точка O ( x1* ,..., xn* ) , являющаяся единственным гло-
бально устойчивым равновесием системы (45.4) и одновременно единственной
точкой, в которой все выигрыши fs максимальны по переменной xs , будет еще и
45. Игровая модель человеческого общества 377

единственным глобальным максимумом функции общего выигрыша F = f1 +


+ ...+ fn .
Единственность максимума, и, следовательно, его глобальность, функции F
будет иметь место, если квадратичная форма
∂2F
Φ1 = ∑ ξ s ξk
∂x s ∂xk
является отрицательно определенной и справедлива оценка вида (45.9). Можно
заметить, что
∂2 fs ∂2 f p
Φ1 = ∑ ξ s ξk + ∑ ξ s ξk . (45.15)
s ,k ∂x s ∂xk s ,k , p ≠ s ∂x s ∂xk
Первая квадратичная форма этой суммы двух слагаемых определенно отри-
цательна в силу (45.9), ее главные квадратичные члены – это (∂ 2 f s / ∂x s2 )ξ2s и есте-
ственно предположить, что этот член и самый существенный – больший по вели-
чине, поскольку переменная ξs , скорее всего, самая существенная у выигрыша fs.
Аналогичный член второй квадратичной формы (45.15), (∂ 2 f s / ∂x s2 )ξ2s , выглядит
значительно внушительней, но он не более, чем суммарный результат жесткостей
влияния хода игрока Is на выигрыши всех остальных игроков, которых не так уж
много и которые могут усредняться. Сказанное – не более, чем довод для приня-
тия условия отрицательной определенности квадратичной формы Φ1 и оценки
Φ1 ≤ − χ1 ( ξ12 + ... + ξ2n ) , которая обеспечивает предполагаемую единственность и
глобальность максимума общего выигрыша F, а его совпадение с точкой
O ( x1* ,..., xn* ) будет при
∂F ∂f p
=∑ = 0, s = 1, n . (45.16)
∂x s p ≠ s ∂x s
Если трактовать ∂f p / ∂x s как жесткость влияния игрока Is на игрока Ip , то
сумма (45.16) – сумма всех жесткостей давления игрока Is на остальных игроков
Ip ( p ≠ s) . По сравнению с чем эта сумма жесткостей должна быть мала, чтобы
можно было ожидать близости максимума общего выигрыша к общему выигры-
шу в точке O( x1* , K , x n* ) ? Этот вопрос рассматривается в следующем разделе.
Основной принцип совместной идеальной игры в обществе. Оптималь-
ный общий выигрыш находится из уравнений
∂F ∂f s ∂f p
= +∑ = 0, s = 1, n , (45.17)
∂x s ∂x s p ≠ s ∂x s
т.е. добавочный член в уравнении (45.17) тем менее существенен, чем больше
∂ 2 f s ∂x s2 по сравнению с ∑ p ≠ s ∂f p ∂x s . Это следует из первого приближения для

изменения ds по отношению к x *s :
∂2 fs ∂f p
dx s + ∑ = 0, s = 1, n . (45.18)
p ≠ s ∂x s
2
∂x s
378 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Итоговый вывод о близости точки глобального максимума общего выигрыша


F к точке O ( x1* ,..., xn* ) максимума личных выигрышей можно сформулировать как
требование малости сумм жесткостей влияния хода каждого игрока на общий вы-
игрыш всех остальных игроков. Этого можно достичь за счет малости каждого из
влияний отдельно, а можно и за счет малости суммарного влияния, учитывая воз-
можность их компенсации. Сказанное можно сформулировать как некий принцип
поведения в общей идеальной экономической игре людей в обществе: с одной
стороны, каждый игрок должен стремиться к своему личному выигрышу, неук-
лонно его оптимизируя, а с другой – по возможности в целом не вредить и не спо-
собствовать выигрышам других. Как способствование, так и препятствование вы-
игрышам других, оказывается, уменьшает возможный общий выигрыш. Действи-
тельно, первое приближение общего выигрыша над суммой индивидуальных мак-
симизированных выигрышей, согласно (45.16), равно
−1 2 −1
∂F ∂F  ∂f p  ∂ 2 f s    ∂f p   ∂ 2 f s 
dF = ∑ dx s = ∑ − ∑    = − ∑ ∑   
 ∂x 2  > 0
s ∂x s  p ≠ s ∂x s  ∂x s2  
s ∂x s

s  p≠s ∂x 
s   s 
 
и всегда положительно, и тем больше, чем больше квадраты сумм жесткостей
влияния. Можно заметить, что это превышение, во всяком случае, в первом при-
ближении, тем меньше, чем «острее» максимумы личных выигрышей (больше по
величине вторая производная от fs по xs).
О целесообразной организации и самоорганизации экономических игр в
обществе. Под целесообразной организацией понимается близость к идеальной
игре. Как можно судить из предыдущего, оптимальное экономическое функцио-
нирование при идеальной игре требует от ее участников только умения и успеш-
ности в оптимизации своих личных выигрышей. Но оптимальная игра едва ли ре-
альна, да и кто должен ее организовывать и определять? Значительно реальнее
некоторое к ней приближение, достигаемое целесообразной стратегией самих
экономических игр и экономической политики. Основной принцип этой самоор-
ганизации, ведущей к близости экономической игры к оптимальной, состоит в
том, что каждый игрок должен возможно больше стремиться к своему личному
выигрышу и одновременно организовывать ее так, чтобы уменьшить суммарное
влияние на других игроков, достигаемое тем, что он сам, выбирая игру, стремится
максимально возможно избавиться от влияния остальных игроков. Такая самоор-
ганизация естественно предполагает весьма широкие возможности выбора игры,
удовлетворяющей этим требованиям, что, в частности, требует достаточно хоро-
шей информированности и понимания последствий своих действий.
Тривиальный случай идеальной игры – это когда каждая из функций выиг-
рыша fs зависит только от xs. Этого положения можно достичь путем объединения
игроков с сильными зависимостями в «одного», а можно путем организации
взаимоотношений, которые не допускают больших влияний друг на друга. Следу-
ет отметить и еще одну особенность идеальной игры: успешность оптимизации
выигрышей целиком зависит от личных действий каждого игрока, когда его про-
гнозы проще и надежней, и он может сосредоточиться только на эффективности
своих действий, используемых средств и технологий. Может показаться, что в
своей полной осуществимости идеальная игра как бы исключает конкуренцию, но
45. Игровая модель человеческого общества 379

это не так, потому что она присутствует, но не на уровне базовых игровых дейст-
вий, а в сопоставлении их результатов. Это отдельная важная тема.
Проблема включения управленцев и власти в общее игровое взаимодей-
ствие. Ранее определена функциональная структура низшего базового уровня
общества, как общества игрового, и основные принципы его организации и управ-
ления, следующие из требований эффективности игры и ее общей приемлемости.
Прежде чем перейти к теме этого раздела, позволим себе небольшое повторение.
Как уже отмечалось, общество и составляющие его люди в своей организации и
функционировании похожи на живой организм, состоящий из клеток. Сообщество
клеток обеспечивает жизнь всего организма, а жизнедеятельность клеток обеспе-
чивается гомеостазом среды их обитания. Нечто аналогичное имеет место и в че-
ловеческом обществе: для его жизни необходимо обеспечение соответствующей
среды, называемой базовым уровнем общества. Однако по мере совершенствова-
ния многоклеточного живого организма, как необходимое условие жизни, помимо
гомеостаза среды, возникли еще гуморальное и нервные управления. В обществе
их аналогом можно считать управление жизнью людей, осуществляемое государ-
ством и его властными и полномочными структурами. В живом организме все
происходит как бы само собой, в силу законов природы и тенденций ее самоорга-
низации. В человеческом обществе многое организуется при целенаправленном
вмешательстве людей. Теперь естественно возникает очень важный вопрос: где и
как пролегает граница в современном обществе между централизованным управ-
лением и тем, что можно назвать самоорганизацией, возникающей на основе ба-
зового уровня общества, между сознательным централизованным управлением и
тем, что можно назвать самоорганизацией, требующей лишь обеспечения базово-
го уровня? Кроме того, сама организация базового уровня требует наличия меха-
низмов формирования игр и соблюдения их правил. Как это делается, выходит
далеко за рамки рассматриваемой игровой модели, но сама проблема власти воз-
никает уже внутри нее, и с этих позиций можно сформулировать сущность про-
блемы и пути ее разрешения.
На наличие этой проблемы указывала и ранее рассмотренная математическая
модель «производители – продукт – управленцы», поскольку в ней управленцы
возникали не потому, что они нужны и полезны, а потому, что общество может их
содержать. В этом их трагическое сходство с паразитическими элементами обще-
ства. С позиций игровой модели проблема состоит в том, чтобы включить управ-
ленцев и оба вида власти в равноправное всеобщее игровое взаимодействие, в
общую для всех игру. Сам статус в обществе управленцев и власти как бы пре-
пятствует равноправию, и вместе с тем его необходимо соблюсти. В этом и состо-
ит, на мой взгляд, центральная проблема современного общества – проблема вла-
сти. Как это делается, математическая модель ответить не может, но она позволя-
ет ответить на вопрос, что для этого нужно сделать. А сделать нужно так, чтобы
ни один из управленцев или власти, выполняя свои функции, т.е. играя в одну из
игр, не имел возможностей за счет своих властных полномочий изменять правила
своей игры или позволять себе их не исполнять. Для этого нужно целенаправлен-
ное и полное разделение полномочий между отдельными исполнителями и струк-
турами управленческих и властных полномочий. Разделения, исключающего не
только непосредственную возможность использования власти в своих целях, но и
380 Ю.И. Неймарк. Математическое моделирование как наука и искусство

сговора. Организация власти, удовлетворяющая этим требованиям, автоматически


приведет к высокому профессиональному уровню и компетентности управленцев
и власти, так как только при их наличии они смогут успешно играть и выдержать
естественную общую конкуренцию. В какой-то мере именно в этом направлении
происходят изменения в цивилизованных обществах: разделение властей, откры-
тость намерений и действий, выборность и сменяемость.
Безусловно, рассмотренная выше игровая модель до примитивности проста
по сравнению с реальной жизнью людей на Земле с ее многообразными непости-
жимыми сложными взаимоотношениями как отдельных людей, так и их коллек-
тивов, стран и народов. Все это объять и адекватно отобразить в математической
модели невозможно. Да и не о такой модели идет речь. Речь идет только о модели
базового уровня общества, о фундаменте, на котором оно стоит, и среде, в кото-
рой функционирует. О среде, которая позволит и будет способствовать активной
и эффективной деятельности людей, деятельности желанной всеми, в целом почти
всеми приемлемой и почти всех устраивающей. Все остальное, что сверх базового
уровня и его обеспечения, создается как бы само собой активной деятельностью
людей и их способностью к самоорганизации. Все остальное люди создадут в
процессе участия во всеобщей игре, включая и помогающее им математическое
моделирование возможных сторон их деятельности и жизни.
К модели базового уровня не нужно предъявлять требования полноты и адек-
ватности реальному обществу людей. Нельзя, потому что сколько-нибудь полная
модель настолько сложна, что едва ли позволит сделать какие-то общие выводы.
От модели базового уровня нужно и можно требовать, чтобы конструируемый
уровень обеспечивал и порождал достойную жизнь людей на Земле с ее условия-
ми, окружающей природой и свойствами людей, был основой, обеспечивающей
эффективное, удовлетворяющее людей функционирование общества.
Принципы организации, функционирования и управления, сформулирован-
ные выше, – это лишь необходимые условия. Они будут достаточными, если эта
основа – базовый уровень – устойчив и самодостаточен.
Устойчивость требует приемлемости и желанности такого базового уровня
для подавляющего числа людей; возможности его реализовать и поддерживать,
фактической невозможности его дезорганизации и разрушения.
Самодостаточность можно видеть в том, что наличие базового уровня доста-
точно, для того чтобы в его рамках его поддерживать и соблюдать, т.е. когда фак-
торы устойчивости базового уровня в нем самом.
Я не думаю, что базовый уровень нужно и можно насильственно внедрить и
организовать, нет, напротив, я думаю, что он – тот, о котором шла речь выше –
будет организовываться сам по себе благодаря естественной деятельности людей,
и начало этой организации явно видно. Для ускорения и облегчения этого эволю-
ционного процесса, устранения ложных действий и тупиков совсем не лишним
является понимание существа его целей и перспектив. С точки зрения высказан-
ного основного постулата желанности и наибольшей эффективности игрового
восприятия жизни, устойчивость и самодостаточность должны иметь место. При
этом, по-видимому, самая трудная проблема человечества в осуществлении вклю-
чения всех видов власти в общую игру, а также наличие стран и народов с боль-
шим отставанием в развитии.
45. Игровая модель человеческого общества 381

Конечно, может быть, что все будет совсем не так, и то, что высказано – лишь
гипотеза, которой не суждено осуществиться. Именно поэтому в самом начале
рассматриваемая модель названа фантастической. Все же, пожалуй, еще нужно
несколько слов сказать об одной особенности процесса самоорганизации общест-
ва.
В человеческом обществе аналогом гуморальных и нервных управлений яв-
ляются осознанные властные управления, более или менее централизованные в
виде государства и его структур и институтов. Это управление, как в организме,
так и в обществе возникает в процессе их самоорганизации. Властные структуры
также необходимы не только для поддержания базового уровня, их полномочия
значительно шире и это обстоятельство приводит к проблеме организации допол-
нительных властных управленческих структур, проблеме включения их в общее
игровое взаимодействие. Это ставит вопрос о том, где и как пролегает граница
между властным управлением и тем, что можно назвать стихийной и естествен-
ной самоорганизацией, для которой требуется только обеспечение базового уров-
ня. Не отвечая на очень непростой вопрос о границе, отметим, что решение про-
блемы этой дополнительной власти также нужно видеть в надлежащем разделе-
нии властей, требовании открытости ее (власти) намерений и действий, ее пред-
сказуемости в пределах возможного, эффективной контролируемости, которые в
целом обеспечивают ее включение в общую игру.
382 Ю.И. Неймарк. Математическое моделирование как наука и искусство

46. СИНТЕЗ И ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ


КВАЗИИНВАРИАНТНОГО ЛИНЕЙНОГО
И НЕЛИНЕЙНОГО УПРАВЛЕНИЯ
Научные и технические открытия лишь иногда воспринимаются современни-
ками с пониманием и восторгом или одобрением. В современном политизирован-
ном и конкурирующем мире чаще всего они игнорируются и остаются без внима-
ния, с трудом пробивая себе дорогу. Ярким примером такого открытия может
служить идея инвариантного регулятора, высказанная Г.В. Щипановым в публи-
кации 1939 года [49], вызвавшая последующую бурную дискуссию. Идея состояла
в том, что регулятор должен не устранять возникшую ошибку, а предотвращать
ее, сделать объект управления невосприимчивым к внешним воздействиям, инва-
риантным по отношению к ним. С тех пор прошло более полувека, а дискуссия и
обсуждаемая проблема не получили завершения, хотя идея инвариантного управ-
ления время от времени привлекала исследователей, что нашло отражение в спра-
вочнике по теории автоматического регулирования, в обстоятельной книге о про-
блеме Г.В. Щипанова [50], в недавнем цикле работ В.А. Якубовича [51–53] и др.
Причину этого можно видеть в резолюции специально созданной академической
комиссии и последующих административных мерах. Работа Г.В. Щипанова была
оценена как целиком неверная и лженаучная. Г.В. Щипанов был уволен, а ИАТ
(Институт автоматики и телемеханики), издавший его работу, подвергся критике
[50]. Это была трагедия талантливого человека, специалиста по авиаприборам и
гироскопам, по книгам которого учились современники. Это была упущенная
возможность создания нового типа регуляторов и систем управления. Косвенно в
дальнейшем этому способствовала успешно развивающаяся теория оптимального
управления, которая, казалось бы, должна была указать лучшие системы, но ин-
вариантных управлений она обнаружить не могла, поскольку таких, о которых
думал Г.В. Щипанов, нет, а есть квазиинвариантные. Это практически одно и то
же, но среди квазиинвариантных управлений нет оптимального, и поэтому теори-
ей оптимального управления они не могли быть обнаружены. Это не значит, что
теория оптимизации не может быть полезна, а означает только то, что постановка
задач оптимизации должна быть существенно изменена. Решающими все же были
огульный характер критики без указания конкретной ошибки, непонимание и
восприятие математической реализации идеи Г.В. Щипанова как некоего парадок-
са и, конечно, устрашающие административные меры.
Познакомился с обсуждаемой проблемой я благодаря М.А. Айзерману, кото-
рый в конце 1940-х годов привез в г. Горький тяжелую кипу статей и документов
по этой проблеме и дискуссии, и с согласия, а может быть и по просьбе А.А. Анд-
ронова, вручил ее мне. Я заинтересовался проблемой, но не понял, а вскоре тяже-
ло заболел, забыл о ней и вспомнил лишь недавно, после того как совместно со
В.Н. Смирновой одолели широко известный парадокс Пенлеве в механике. Не-
смотря на различие задач, в них много общего. В обоих требуется настороженное
отношение к корректности идеализаций, математических выкладок и выводов; в
обоих проявляется неожиданная роль малых величин и параметров. В итоге ока-
46. Квазиинвариантное управление 383

залось, что обоснование Щипановым возможности идеального, инвариантного


регулятора не корректно и он не реализуем, но возможен квазиинвариантный ре-
гулятор. Практически это различие едва ли существенно и сегодня не так оше-
ломляюще ново. Известна нечувствительность скользящих движений релейных
систем автоматического регулирования [34], известны высокоточные регуляторы
с большим коэффициентом усиления обратной связи [21].
Содержание настоящей главы относится к изучению и синтезу квазиинвари-
антного управления (не только стабилизации, но и слежения) для произвольного
минимального фазового объекта, описываемого математической моделью вида
An ( p ) x = − Bm ( p )(u + ξ(t )),
(46.1)
C r ( p )u = Dq ( p )( x − f (t ) + η(t )) ,
где An ( p ) , Bm ( p ) , C r ( p ) и Dq ( p ) – действительные полиномы от p = d / dt сте-
пеней n, m, r, и q соответственно; ξ(t ) , η(t ) – ограниченные неизвестные возму-
щения в объекте и управлении; f (t) – заданная функция отслеживания (f (t) = 0 –
стабилизация); x и u – одномерные переменные объекта и управления. Зависи-
мости (46.1) имеют направленный характер: x определяется переменными u и
ξ(t ) первого уравнения; x, f (t) и η(t ) определяют u согласно второму уравнению.
Исследование модели (46.1) включает формулировку условий ее физической реа-
лизуемости, установление условий устойчивости, оценки ошибок управления и
слежения, выявления роли внутренних возмущений η(t ) и частичной нейтрализа-
ции внешнего возмущения ξ(t ) , что позволило сформулировать условия квазиин-
вариантности и возможности сколь угодно точного управления. Вместе с тем вы-
сокая точность управления, требующая малости оператора C r ( p ) = µ , может при-
вести к недопустимо большим значениям управления при тех или иных непред-
виденных, возможно и незначительных, нарушениях. Уйти от этого дефекта ква-
зиинвариантного точного управления можно за счет синтеза его с обычным
управлением в соответствующей нелинейной системе, используя возможности
обоих подходов к управлению: подходу, основанному на устранении возникшей
ошибки управления, и подходу, предотвращающему возникновение этой ошибки.
О физической реализуемости математической модели системы управле-
ния. Систему управления (46.1) назовем физически реализуемой, если она может
быть адекватно отображена реальной физической системой или в сочетании с вы-
числениями компьютера. Какими же при этом должны быть входящие в уравне-
ние (46.1) функции и операторы? В дальнейшем под физически реализуемыми
понимаются гладкие и кусочно-гладкие ограниченные функции с конечным чис-
лом разрывов. При этом разрывы предполагаются как идеализации быстрых и
очень быстрых гладких изменений. Относится это прежде всего к функциям ξ(t ) ,
η(t ) , затем к f (t ) и управлению u, к функции x (t ) и, возможно, к некоторым ее
производным. Требование физической реализуемости приводит к тому, что кор-
ректная математическая модель (46.1) должна удовлетворять некоторым дополни-
тельным условиям. О них и пойдет речь ниже.
Начнем с реализуемости направленного от ξ к x оператора
An ( p ) x = − Bm ( p )ξ(t ) . (46.2)
384 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Прямые вычисления Bm ( p )ξ(t ) требуют наличия m производных от ξ, а ξ может


не иметь ни одной. Как же вычислить x? Оказывается, что вычисление и реализа-
ция x возможна при m < n и невозможна при m > n . Общее решение уравнения
(46.2) складывается из общего решения однородного уравнения ( ξ = 0 ) и частного
решения неоднородного уравнения (46.2) при нулевых начальных условиях. Ради
простоты примем корни ( λ1 , λ 2 ,..., λ n ) полинома An ( p ) не кратными, запишем
~
решение неоднородного уравнения (46.2) в изображениях ~ x ( p ) и ξ( p ) и соответ-
ствующий оригинал
n
B ( p) ~ 1 ~
~
x ( p) = m ξ( p) = ∑ Cs ξ ( p ),
An ( p ) s =1 p − λs
t n
(46.3)
B (λ )
x (t ) = ∫ ∑ C s e λ s (t −τ)
ξ( τ)dτ, Cs = m' s .
0 s =1
An (λ s )
Напомним, что для этого требуется, чтобы m < n. Из соотношения
−1
Bm ( p ) n C s  n   n 
=∑ =  ∏ ( p − λ s )    ∑ C s  p n −1 −
 
An ( p ) s =1 p − λ s  s =1    s =1 
 n   n  
−  ∑ C s ∑ λ i  p n − 2 +  ∑ C s ∑ λ i λ j  p n −3 + ... 
  
 s =1 i ≠ s   s =1 i , j ≠ s  
∑s =1 Cs = 0, ∑s =1Cs λ s = 0, при m < n − 3
n n
следует, что при m < n − 1 при m < n − 2

∑s =1Cs λ2s = 0 и т.д.


n

Теперь согласно (46.3) вычислим производные x(t):


n  t

x& (t ) = ∑  C s ξ(t ) + ∫ C s λ s e λ s ( t − τ ) ξ( τ)dτ  ,
 
s =1  0 
∑s =1 Cs ≠ 0, и второй производной нет, т.к. ξ(t) не диффе-
n
причем при m = n − 1
ренцируема. При m ≤ n − 2 ∑s =1 Cs = 0, и имеется вторая производная
n

n  t

&x&(t ) = ∑  C s λ s ξ(t ) + ∫ C s λ2s e λ s ( t − τ ) ξ( τ)dτ  ,
 
s =1  0 
∑s =1Cs λ s ≠ 0,
n
у которой нет производной при m = n − 2, поскольку но она есть

∑s =1Cs λ s = 0 . Продолжая эти вычисления с уменьше-


n
при m ≤ n − 2, т.к. при этом
нием m, находим, что x(t) имеет n – m производных и не более, если ξ(t) не диф-
ференцируема. Если же ξ(t) имеет k > 0 производных, то x(t) при этом имеет
n – m + k производных. Отсюда следует, что при k > 0 можно находить x(t) и при
m ≥ n.
46. Квазиинвариантное управление 385

Применим полученные сведения к математической модели (46.1). Будем ис-


ходить из недифференцируемости ξ(t), η(t) и управления u, но удовлетворяющим
принятым условиям физической реализуемости. Это приводит к некоторым соот-
ношениям между величинами m, n, r и q, а именно, m ≤ n − 1 для физической реа-
лизуемости x и его производной. При требовании физической реализуемости l
производных от x m ≤ n − l. Далее, для регулятора при требовании физической
реализуемости управления u q ≤ l + r, где l = n − m − число производных, требуе-
мых от x или x − f. Подчеркнем, что это только необходимые требования к систе-
ме управления. Впереди еще требования устойчивости и малости ошибок стаби-
лизации и слежения.
Условия устойчивости. Требование устойчивости состоит в том, что при
ξ = η = f = 0 любые решения x уравнений (46.1) стремятся к нулю с ростом време-
ни t. Исключая из уравнений (46.1) управление, при ξ = η = f = 0 приходим к урав-
нению для x вида
[С r ( p ) An ( p ) + Bm ( p ) Dq ( p )] x = 0, (46.4)
и, следовательно, для устойчивости требуется, чтобы все корни полинома от p,
стоящего в (46.4) перед x, имели отрицательную действительную часть. Для даль-
нейшего требуется, чтобы это условие выполнялось при малости полинома Cr(p).
В простейшем случае r = 0, Cr(p) = µ, где µ − малое число, требование устойчиво-
сти состоит в надлежащем выборе знака числа µ и отрицательности действитель-
ных частей всех корней полиномов Bm(p) и Dq(p). Для полинома Bm(p) это имеет
место в силу минимальной фазовости объекта, а для Dq(p) − это требование к его
выбору. Степень произведения полиномов Bm(p) и Dq(p) должна быть не меньше
n − 1. Весьма привлекателен вариант минимальной степени q, когда q = n – 1 − m.
При этом требуемое число q производных от x не превосходит их числа, равного
n – m. Желание ослабить требование на функцию f возможно за счет увеличения r.
Вернемся к определению знака µ и определению корней полинома
µ An ( p ) + Bm ( p ) Dq ( p ), (46.5)
когда m + q = n − 1 и µ → 0. При µ → 0 (n − 1) корней полинома (46.5) степени
n стремятся к корням полиномов Bm(p) и Dq(p), а еще один корень λn должен
стремиться к −∞. Последнее достигается надлежащим выбором знака µ,
sgn µ = sgn{a n bm d q }, где an , bm , d q − старшие коэффициенты полиномов An(p),
Bm(p) и Dq(p). Значение действительного корня λn, который должен при µ → 0
стремиться к −∞, можно задать, выбирая µ из уравнения µ An (λ ) +
+ Bm (λ ) Dq (λ ) = 0, причем при λ → −∞ µ → 0, а знак µ совпадает с указанным
выше.
Рассмотренный случай r = 0 и q = n − 1 − m можно назвать простейшим и при-
влекательным, но он требует при слежении наличия q производных у функции
x – f (t). Как уже указывалось, преодолеть это ограничение можно, повышая сте-
пень r полинома Cr (p). При этом вместо q производных требуется q − r.
Ошибка стабилизации. В этом и следующем параграфах рассматривается
ошибка управления – стабилизации и слежения – в простейшем случае r = 0, со-
386 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ответственно Cr(p) = µ, при нулевых начальных условиях или спустя достаточное


время функционирования устойчивой системы управления. Из (46.1) при f (t ) = 0
и η(t ) = 0 в изображениях непосредственно находим, что
~
~ µBm ( p ) ξ ( p )
x ( p) = − . (46.6)
µ An ( p ) + Bm ( p ) Dq ( p )
Пусть λ1 , λ 2 ,..., λ n − корни знаменателя (46.6) и имеет место устойчивость, то-
гда (n − 1) корней, λ1 , λ 2 ,..., λ n −1 , имеют отрицательную действительную часть, а
λ n − большое отрицательное число, причем λ n → −∞ при µ → 0 . Ради простоты
ограничимся общим случаем не кратных корней. Тогда оригинал ~ x ( p ) представ-
ляется в виде
n t
x (t ) = µ ∑ K s ∫ e λ s ( t − τ ) ξ( τ) dτ,
s =1 0
где
Bm (λ s )
Ks = .
µ An′ (λ s ) ( Bm (λ s ) Dq (λ s ))′
Предполагая |ξ(t)| ≤ M и учитывая ограниченность всех коэффициентов K s λ−s1 не-
которой величиной C < ∞, непосредственно находим, что
x (t ) ≤ µK ⋅ M , (K < ∞ ) . (46.7)
Таким образом, ошибка стабилизации при исходных нулевых начальных ус-
ловиях и ограниченном возмущении ξ(t) неограниченно уменьшается с уменьше-
нием µ. Можно поинтересоваться, как ведет себя управление u и за счет чего ма-
ла ошибка стабилизации.
При нулевых начальных условиях x определяется возмущением ξ. Действи-
тельно, из (46.1) при f = η = 0 находим для изображений x и u, что
~ B ( p) ~ ~ 1
x ( p) = − m (u + ξ ), u~( p ) = Dq ( p ) ~
x, (46.8)
An ( p ) µ
откуда
~
~ µBm ( p ) ξ ( p )
x ( p) = − .
µAn ( p ) + Bm ( p ) Dq ( p )
Управление u также определяется возмущением ξ:
~ ~
~ Bm ( p ) Dq ( p ) ξ ( p ) ~ µAn ( p ) ξ ( p )
u ( p) = − = − ξ( p) + , (46.9)
µAn ( p ) + Dq ( p ) Bm ( p ) µAn ( p ) + Dq ( p ) Bm ( p )
причем так, что при µ → 0 u → −ξ, нейтрализуя, согласно (46.8), воздействие ξ на
x. Это справедливо в предположении, что последнее слагаемое в формуле (46.9)
мало, что может не соблюдаться в точках разрыва или очень больших производ-
ных от ξ. Нейтрализация возмущения ξ управлением u может нарушаться при
больших, не подавляемых малым µ, величинах производной от ξ. Обнаруживается
это, исходя из записи последнего слагаемого в (46.9) в виде:
46. Квазиинвариантное управление 387

µ An ( p ) ~
p ξ ( p ),
p (µ An ( p ) + Dq ( p ) Bm ( p ))
~
где первый множитель неограниченно уменьшается с µ → 0, а второй, pξ ( p ) ,
может при некоторых t иметь очень большие значения. Вместе с тем это не меша-
ет стремлению ошибки стабилизации x неограниченно уменьшаться вместе с
уменьшением µ при ограниченности ξ, поскольку весьма кратковременные скачки
производной от ξ(t) существенного влияния не оказывают, а вне скачков произ-
водная от ξ(t) ограничена.
Ошибка слежения. Рассмотрим теперь возможности отслеживания перемен-
ной x(t) квазиинвариантной системы (46.1) заданной функции f (t). В силу линей-
ности модели (46.1) x(t) представляется суперпозицией воздействий ξ ≠ 0, f = η = 0,
f ≠ 0, ξ = η = 0 и η ≠ 0, ξ = f = 0. Первый случай был рассмотрен, и при µ → 0 x → 0.
Нам надлежит рассмотреть второй. При нулевых начальных условиях в изобра-
жениях из (46.1) после исключения u~ находим, что
~
µ An ( p ) ~
x + Bm ( p ) Dq ( p )( ~
x− f)=0
или
~ ~
[µ An ( p ) + Bm ( p ) Dq ( p )]( ~
x − f ) = −µ An ( p ) f . (46.10)
Нас интересует, как ведет себя ошибка слежения x − f, изображение которой, со-
гласно (46.10), имеет вид
~ ~ µ An ( p )
x− f =− . (46.11)
µ An ( p ) + Bm ( p ) Dq ( p )
Возникшая ситуация аналогична той, которая была при нарушении стабили-
зации x возмущением ξ с управлением u в отношении компенсации управлением u
возмущения ξ. Достижение малости ошибки слежения x − f за счет малости µ тре-
бует ограниченности производной от f. Соответствующую оценку можно полу-
чить, записав (46.11) в виде
~ ~ µ An ( p ) ~
x− f =− pf ,
p(µ An ( p ) + Bm ( p ) Dq ( p ))
из чего следует, что
| x − f | < µK max | f ′(t ) |, K < ∞. (46.12)
Из полученной оценки (46.12) и ранее полученной (46.8) следует, что система
управления, описываемая (46.1), при ограниченности f ′(t ) и ξ(t) может сколь
угодно точно отслеживать переменной x заданную функцию f (t). Вместе с тем при
r = 0 физическая реализуемость управления u и устойчивость требуют, чтобы f (t)
имела q = n − 1 − m производных.
Влияние внутренних помех. Речь идет об учете помехи η(t) при ξ = f = 0, т.е.
при u = µ−1Dq(p)(x + η(t)). В этом случае согласно (46.1) x определяется уравнени-
ем
[µ An ( p ) + Bm ( p ) Dq ( p )] x = − Bm ( p ) Dq ( p )η.
Непосредственно видно, что малость µ не влечет уменьшения ошибки стабилиза-
ции. Требуется малость η. Величина η является реальным ограничением точности
388 Ю.И. Неймарк. Математическое моделирование как наука и искусство

стабилизации и слежения. Для реализации второго уравнения (46.1), определяю-


щего управление u, требуется измерение x. Погрешность этого измерения являет-
ся одной из возможных составляющих помехи η. Очевидно, что измерение x не
может быть менее точным, чем требуемая точность управления.
Компьютерный эксперимент и переменная (нелинейная) стратегия
управления. Ниже приводятся краткие описания компьютерных экспериментов,
проведенных И.С. Гельфер для двух объектов
&x& ± 1,5 x = −u − ξ(t ),
….
x − &x&& + 2 &x& + 3x& − 2 x = −u − ξ(t ).
В качестве конкретной их реализации можно указать маятник и двойной маятник,
управляемые перемещением точки опоры. У первого объекта n = 2, m = 0; у вто-
рого n = 4, m = 0. Для регулятора в обоих случаях r = 0 и, в соответствии с изло-
женным ранее, q = 1 и q = 3. Полиномы Dq (p) выбираем устойчивыми. Для перво-
го объекта
u = µ −1 ( x& + 2 x ) ,
для второго
u = µ −1 (&x&& + 6 &x& + 11x& + 6 x ).
Параметр µ и функции ξ(t), f (t), η(t) варьировались. В случаях стабилизации
(f (t) = 0) и слежения (f (t) ≠ 0) без учета внутренних помех η(t) = 0, как при глад-
ких, так и кусочно-гладких ξ(t) и f (t ) и нулевых начальных условиях, имело ме-
сто уменьшение ошибки управления xmax вместе с уменьшением µ в пределах от
0,1 до 0,0001 весьма близко к линейной зависимости от µ. Такие же эксперимен-
ты, но при учете внутренних помех, η(t) ≠ 0, обнаружили, что ошибка управления
уменьшается с убыванием µ лишь до некоторого предела, естественно, тем мень-
шего, чем меньше η(t). Сказанное относится к управлению при нулевых началь-
ных условиях. При ненулевых начальных условиях величина управления может
оказаться недопустимо большой. Обойти эту неприятность можно, меняя страте-
гию управления u в зависимости от величины x. Простейший, но не наилучший
вариант состоит в том, чтобы менять µ в зависимости от |x|,
0,001 при |x| ≤ 0,1,
µ=
 0,1 при |x| > 0,1
или
1 + 10 |x|
µ= .
1 + 1000 |x
В первом случае после переходного процесса, приводящего к | x | ≤ 0,1, все
происходило так же, как и в описанном выше эксперименте. Второй вариант пе-
ременной стратегии управления также не допускал больших значений и спустя
некоторое время приводил к малым значениям | x |. Опираясь на эти данные, мож-
но указать достаточно хороший вариант меняющегося управления, в котором для
уменьшения состояния (некоторого его функционала) используется оптимальное
по этому функционалу управление, а при допустимых | u |, требующих малости x,
точнее, малости Dq (p)(x – f ), используется квазиинвариантное управление.
46. Квазиинвариантное управление 389

Ошибался ли Щипанов? Почему идеальный регулятор Г.В. Щипанова вос-


принимается как парадокс? Как уже отмечалось, идеальный регулятор был при-
знан лженаучным, но вместе с тем конкретная ошибка не была указана. Рассуж-
дения Щипанова были очень просты. В простейшем случае, исключая из уравне-
ний (46.1) управление u, приходим к одному уравнению вида
Cr ( p ) An ( p ) + Bm ( p ) Dq ( p )] x = −Cr ( p ) Bm ( p )ξ , (46.13)
из которого при Cr (p) ≡ 0 следует, что при устойчивости полинома Bm(p)Dq(p)
x → 0 и влияние возмущения ξ устранено. Парадоксальность вывода в том, что
при x = 0 управление отсутствует, хотя на объект действует возмущение ξ. Сего-
дня было бы обращено внимание еще на то, что уравнение (46.13) при Cr(p) → 0
сингулярно возмущенное и устойчивости Bm (p)Dq (p) недостаточно. Нужно, чтобы
корни, стремящиеся к бесконечности при Cr (p) → 0, имели отрицательные дейст-
вительные части, еще лучше, чтобы действительные части их стремились к −∞.
Но сингулярно возмущенные дифференциальные уравнения были изучены значи-
тельно позже, а в то время о них ничего не знали. При Cr (p) = 0 управление исче-
зает, а при x = 0 и Cr (p) ≡ 0 u есть неопределенность вида 0/0, и математическая
модель некорректна. В рамках формальной математики эта неопределенность
может быть устранена, если принять, что
0 Dq ( p ) x
= lim .
0 Cr ( p )→0 C r ( p )
Но это возможно только для математической модели, а не для реальной системы
управления. При Cr (p) = 0 подправленная математическая модель неадекватна ре-
альной физической, и это приводит к тому, что инвариантный регулятор нереали-
зуем. Вместе с тем в рамках модели (46.1) реализуемы при η ≡ 0 квазиинвариант-
ные сколь угодно точные регуляторы. Значительно позднее было обнаружено, что
при некой дополнительной информации о помехе ξ, уже не в рамках модели
(46.1), можно реализовать инвариантное управление [51−53]. Таким образом,
формально математически, а именно этого придерживался Г.В. Щипанов, в синте-
зе «идеального регулятора», ошибки нет. Ошибка в неадекватности в одной един-
ственной точке математической модели и ее непосредственной физической реали-
зации. Неадекватность вызвана тем, что допускается умножение на нуль правой и
левой частей уравнения (46.13).
Конечно, Г.В. Щипанов опередил свое время, а дискуссия задержала разра-
ботку и исследование его идеи, но все же, уже из других соображений, кое-что
было реализовано в релейных системах и системах управления с большим коэф-
фициентом обратной связи, обеспечивающей высокую статическую точность.
Особенностью квазиинвариантной системы управления является также нали-
чие большого коэффициента усиления, поскольку малые значения ошибки управ-
ления должны привести к компенсации сравнительно большого внешнего возму-
щения ξ. В скользящем режиме релейной системы с бесконечным усилением она
нечувствительна к достаточно малым внешним возмущениям, а большой коэффи-
циент обратной связи обеспечивает высокую точность стабилизации.
390 Ю.И. Неймарк. Математическое моделирование как наука и искусство

Два подхода к проблеме управления и возможность их синтеза в нели-


нейной системе. Под управлением понимается стабилизация и слежение. Первым
исторически сложился подход к реализации управления на основе уменьшения
его ошибки. Для регуляторов прямого действия уменьшение ошибки управления
и обеспечение устойчивости были антагонистичны. В дальнейшем эта несовмес-
тимость уменьшалась введением непрямого регулирования, астатического, изо-
дромного и, наконец, на основе теории оптимального управления. Уже отмеча-
лось, что непосредственно оптимальное управление не могло обнаружить квази-
инвариантные управления, но это возможно при существенном изменении поста-
новки задачи, при учете новых факторов помех управления. Второй подход, пред-
ложенный Г.В. Щипановым, основан на компенсации внешних возмущений. Его
реализация требует больших коэффициентов усиления, что может приводить к
недопустимо большим значениям управляющих воздействий. Кроме того, боль-
шой коэффициент усиления требует точности измерения x, превосходящей точ-
ность управления, малости других помех, агрегированных в возмущении η(t), ко-
торые должны быть значительно меньше требуемой точности управления (мало-
сти x или |x – f |). В рамках линейных систем управления преодолеть эти неприят-
ности невозможно, но это возможно при нелинейной стратегии управления. Не-
линейная стратегия управления позволяет объединить и синтезировать возможно-
сти первого подхода с возможностями второго, когда, например, u заменяют на
a ⋅ th(bu ) . В некоторой мере в простейшем варианте это объединение уже имеет
разработанную математическую базу в теории абсолютной устойчивости.
Возможен и более изощренный путь устранения «аварийной ситуации» с
|u| > umax , убыстряющий ее ликвидацию и возврат к режиму точного управления с
|x |< ε, но при η = 0 или достаточно малом η. Он состоит в переходе к другому
управлению, осуществляемому как бы раздельно для решения однородного урав-
нения с ξ = 0 и решения с нулевыми начальными условиями при реальном ξ. Пер-
вое осуществляется классическими методами теории управления, второе – исход-
ное квазиинвариантное управление.
Следует отметить, что сказанное о модели (46.1) допускается для более обще-
го вида модели (46.1) и на модели с несколькими управляемыми переменными и
несколькими управлениями. Речь идет об обобщении условий физической реали-
зуемости, требований устойчивости и оценки ошибок управления. Возможно и
более широкое рассмотрение в плане объединения методов оптимизации по со-
стоянию с квазиинвариантным управлением, в синтезе надлежащей нелинейной
системы, что требует расширения и изменения постановки задачи управления
[17].
В заключение приведем примеры квазиинвариантного нелинейного управле-
ния в случае, когда Bm ( p ) и Dq ( p ) − гурвицевы полиномы, Cr ( p ) = µ . Допусти-
мые значения µ, при которых решение системы устойчиво, могут быть найдены
из D-разбиения по параметру µ характеристического полинома µAn ( p ) +
+ Bm ( p ) Dq ( p ) . Эти требования после переходного процесса обеспечивают в
дальнейшем малость ошибки управления | x |. Однако переходный процесс при за-
пуске или сбое не всегда реализуем, так как может потребовать слишком больших
46. Квазиинвариантное управление 391

значений управления u, в то время как для поддержания необходимой малости | x |


в установившемся процессе нужно, чтобы | u | был лишь не меньше max |ξ(t )| . Раз-
решить этот конфликт можно изменением коэффициента усиления |1/µ|, меняя µ в
зависимости от |Dq(p) x |, как это показано на рис. 46.1, где изменение µ происхо-
дит при достижении величиной |µ−1Dq (p)x | значения umax − максимально допусти-
мого значения | u |. При этом управление будет определяться из уравнения u =
= µ i−1 Dq ( p ) x, i = 1, 2, 3.
u
umax 1/µ1 1/µ2 1/µ3

0 Dq(p)x

Рис. 46.1. Изменение коэффициента усиления |1/µ| в зависимости от |Dq(p)x |

Ниже описанная возможность уменьшения максимального значения | u | ил-


люстрируется результатами компьютерных экспериментов для устойчивых и не-
устойчивых объектов. При этом обнаруживаются не только уменьшение допусти-
мой величины umax , но и ускорение переходного процесса возврата к требуемой
точности управления.
П р и м е р 1. В системе управления объектом вида (46.1)
A4 ( p ) = p 4 − p 3 + 2 p 2 + 3 p − 2, B0 ( p ) = 1,
D3 ( p ) = p 3 + 6 p 2 + 11 p + 6, f (t ) ≡ 0 , η(t ) ≡ 0 ,
ξ(t ) − произвольное ограниченное внешнее воздействие, |ξ(t )| < ξmax = 30 . Путем
численного построения кривой N ω = − D3 (iω) A4 (iω) определяем, что допусти-
мые значения µ, обеспечивающие устойчивость работы системы, лежат в интер-
вале 0 < µ < µ* ≈ 0,345 .
На рис. 46.2 приведены графики поведения x(t ) при воздействии ξ(t ) при
нулевых начальных условиях и линейном управлении u = µ −1D3 ( p ) x . График x(t )
при µ = 0,001 изображен сплошной кривой, а при µ = 0,01 − пунктирной. Как
видно, |x(t ) | тем меньше, чем меньше µ и чем быстрее меняется ξ(t ) . При этом
управление | u | в момент перехода ξ(t ) на средний, быстро меняющийся участок
достигает значений 102 при µ = 0,01 и 103 при µ = 0,001 . При описанном выше
кусочно-линейном управлении (см. рис. 46.1) при umax = 40 , µ1 = 0,001 и µ 2 = 0,1
система работает, | u | нигде не превосходит 40 и достигнута точность управления
порядка 10−3 .
392 Ю.И. Неймарк. Математическое моделирование как наука и искусство

ξ x
20 0,02

10 0
0
−0,02
−10
−0,04
−20
−30 −0,06
0 20 40 60 80 t 0 20 40 60 80 t
а) б)
Рис. 46.2. Воздействие ξ(t) (а) и поведение x(t) (б) для этого воздействия
при нулевых начальных условиях и линейном управлении

Зададим начальные условия x0 = 5, x& 0 = &x&0 = 2, &x&&0 = 1. При использовании


линейного управления со значением µ = 0,33 , близким к µ* , оказалось, что нельзя
добиться малости | x |. Точность управления порядка 10 −3 достигается при
µ = 0,001 , но при этом | u | достигает значений 105 . Проблема разрешается введе-
нием кусочно-линейного управления с umax = 200 и двумя участками с µ1 = 0,001 ,
µ 2 = 0,33 . График x(t ) представлен на рис. 46.3,а пунктирной кривой. Здесь и на
некоторых других рисунках сплошными линиями изображен график увеличенно-
го в 10 раз значения параметра µ . Сначала выбирается µ = µ 2 , что определяется
начальными условиями, и остается ему равным в течение некоторого времени за
исключением конечного числа мгновенных переключений на µ = µ1 (на графике
моменты переключений изображены точками). После переходного процесса уста-
навливается точность управления порядка 10 −3 при µ = µ1 .
На рис. 46.3,б приведены графики x(t ) и µ при кусочно-линейном управле-
нии с тремя участками, µ1 = 0,001, µ2 = 0,1, µ3 = 0,33. Видно, что добавление про-
межуточного участка с µ 2 = 0,1 делает переходный процесс более быстрым и
плавным.
x, µ x, µ

4 4

2
2

0
−1 0 2 4 6 8 t
0 2 4 6 8 t
а) б)
Рис. 46.3. Зависимости x(t) и µ(t) при кусочно-линейном управлении:
а) с двумя участками; б) с тремя участками
46. Квазиинвариантное управление 393

На рис. 46.4 представлено управление той же системой при нулевых началь-


ных условиях с umax = 80, двух участках управления с µ1 = 0,001 и µ 2 = 0,05 и
ξ(t ), испытывающем в некоторый момент времени скачок величины 3ξ max (гра-
фик ξ(t ) изображен сплошной тонкой кривой). Графики x(t ) (пунктирная кривая)
и µ (горизонтальные участки) приведены увеличенными в 100, а график ξ(t )
уменьшенным в 10 раз. В момент скачка µ переключается с µ1 на µ 2 и остается
равным µ 2 вплоть до окончания действия скачка, затем µ вновь переключается
на µ1 . Значение | x | при скачке возрастает до 0,1 , а потом постепенно убывает.
Точность управления после скачка вновь устанавливается порядка 10 −3 , как это
было до скачка. Отметим, что управление с использованием лишь одного участка
с µ1 = 0,001 осуществить не удается. При управлении с тремя участками
( µ1 = 0,001 , µ 2 = 0,01 , µ 3 = 0,05 ) несколько улучшается переходный процесс.
x, ξ, µ
4

−4

−8

28 30 32 34 36 38 40 42 t

Рис. 46.4. Зависимости x(t), ξ(t) и µ(t) при кусочно-линейном управлении с двумя участками

П р и м е р 2. Рассмотрим систему управления колебаниями маятника (обыч-


ного и перевернутого) с перемещающейся точкой опоры, описываемую диффе-
ренциальными уравнениями ( p 2 ± ω2 ) x = −u − ξ (знак «+» соответствует обычно-
му маятнику, «−» − перевернутому), где x − угол отклонения оси маятника от
вертикали, ω2 = g l , ξ(t ) = − ( f (t ) + mlS&&(t )) ml 2 , m − масса маятника, l − рас-
стояние от точки опоры, S (t ) − произвольное смещение точки опоры, f (t ) − про-
извольная внешняя сила, u = M ml 2 − управление с помощью момента M .
Управление возьмем в виде u = ( ap + b) x µ так, чтобы полином D1 ( p ) = ap + b
был гурвицев. При a = 1, b = 2, ω2 = 1,5 модель примет вид
( p 2 ± 1,5) x = −u − ξ, µu = ( p + 2) x .
Устойчивость полинома µ A2 ( p ) + D1 ( p ) для обычного маятника обеспечивается
при µ > 0 , а для перевернутого при 0 < µ < 1,3333...
При ограниченном внешнем воздействии | ξ(t ) |< ξ max = 10 , с umax = 30 и на-
чальными условиями x0 = 5, x& 0 = 2 осуществить управление системой с точно-
394 Ю.И. Неймарк. Математическое моделирование как наука и искусство

стью порядка 10−3 с помощью только одного участка не удается. Используем ку-
сочно-линейное управление вида, изображенного на рис. 46.1, с двумя участками
µ1 = 0,001 , µ 2 = 0,5 . Для перевернутого маятника графики x (t ) (пунктирная ли-
ния) и µ (горизонтальные участки) представлены на рис. 46.5,а. Сначала выбира-
ется участок µ = µ 2 , чтобы преодолеть начальные условия, а потом участок µ1 .
После переходного процесса x имеет малость порядка 10−3. При управлении с
тремя участками с µ1 = 0,001 , µ 2 = 0,1 и µ 3 = 0,5 (рис. 46.5,б) ускоряется переход-
ный процесс.
x, µ x, µ

4 4

2 2

0 0

−2 −2
0 1 2 3 4 t 0 1 2 3 4 t
а) б)
Рис. 46.5. Зависимости x(t) для перевернутого маятника
при кусочно-линейном управлении:
а) с двумя участками; б) с тремя участками

При нулевых начальных условиях и ξ(t ) , испытывающем скачок величины


3ξ max (вид ξ(t ) изображен тонкой линией на рис. 46.4) управление перевернутым
маятником с точностью порядка 10 −3 при umax = 30 осуществляется с помощью
двух участков с µ1 = 0,001 и µ 2 = 0,1. При увеличении же скачка ξ(t ) до 4ξ max и
до 5ξ max , чтобы осуществить требуемое управление, надо увеличить µ 2 соответ-
ственно до 0,5 и 0,9 .
На рис. 46.6 представлено кусочно-линейное управление обычным маятником
с точностью порядка 10 −3 при µ1 = 0,001 , µ 2 = 1 и более длительном выбросе по
времени ξ(t ) до 3ξ max .
x, ξ, µ
10

−10 Рис. 46.6. Кусочно-линейное управление


обычным маятником; обозначения кривых
−20 те же, что и на рис. 46.4
−30
28 32 36 40 t
46. Квазиинвариантное управление 395

Увеличение | x | до 12 происходит во время выброса ξ(t ) , по окончании дей-


ствия которого вновь устанавливается точность управления порядка 10 −3 . Значе-
ние µ при этом переключается с µ1 на µ 2 и вновь становится равным µ1 после
преодоления выброса ξ(t ) .
396 Ю.И. Неймарк. Математическое моделирование как наука и искусство

47. АБСТРАКТНАЯ И РЕАЛЬНАЯ


МАТЕМАТИЧЕСКИЕ ТЕОРИИ ДИНАМИЧЕСКИХ СИСТЕМ
В настоящее время динамическая система – одна из основных математиче-
ских моделей. Математическая теория динамических систем, которую разрабаты-
вали величайшие математики XIX и XX веков, очень сложна и обширна. Полное
изучение этой теории едва ли необходимо для прикладного пользователя, но оз-
накомиться с ее основами, безусловно, целесообразно. Краткое изложение совре-
менного состояния теории динамических систем является целью этой главы.
Ко времени рождения теории динамических систем господствующее положе-
ние в науке занимала идея детерминизма Лапласа: то, что происходит сегодня,
определяется тем, что было вчера, а то, что будет завтра, определяется тем, что
есть сегодня. Универсальной математической моделью, вытекающей из идеи де-
терминизма, стала динамическая система.
Теория динамических систем ведет свое начало от А. Пуанкаре, от его труда
«Новые методы небесной механики», появившегося в конце XIX века. Пуанкаре
создал классическую теорию динамических систем. Большой вклад в развитие
теории внес Д. Биркгоф, с появлением его книги «Динамические системы» эта
теория стала достоянием мировой науки. Биркгоф, в частности, ввел классифика-
цию всех возможных движений в такой системе. Свой след в развитии теории ди-
намических систем оставили такие величайшие математики, как Пуассон,
А.М. Ляпунов, С. Смейл и др. Исчерпывающим источником знаний о динамиче-
ских системах в России долгое время была книга В.В. Немыцкого и
В.В. Степанова «Качественная теория дифференциальных уравнений». Далее изу-
чение динамических систем широко распространилось как в теоретических, так и
в прикладных исследованиях. Однако в исследовании конкретных динамических
систем успех был достигнут только для размерности, не превышающей второй
порядок, который и был подытожен в работах А.А. Андронова с соавторами. Не-
которое продвижение в изучении динамических систем больших размерностей
все же можно отметить для систем третьего порядка благодаря методу точечных
отображений и существенным теоретическим исследованиям в трудах С. Смейла.
Цель исследования динамических систем состоит в определении вида фазо-
вых траекторий и их взаиморасположения, т.е. в построении фазового портрета
системы, а также в выяснении зависимости фазового портрета от параметров и в
изучении бифуркаций при их изменении. По-видимому, детальное описание фа-
зовых портретов столь разнообразно и огромно, что едва ли оно может быть пол-
ным, но можно выделить основные, самые важные характеристики фазового
портрета, к которым прежде всего относятся установившиеся движения. В клас-
сической теории это устойчивые состояния равновесия, периодические движения,
тороидальные образования, многообразия из устойчивых состояний равновесия.
Каковы особенности классической теории динамических систем? Классиче-
ская теория базируется на допущении возможности пренебречь очень малыми
воздействиями. Она основана на двух основных фактах: факте существования
решения и его единственности при заданных начальных условиях. Модель, отве-
47. Абстрактная и реальная математические теории динамических систем 397

чающую перечисленным выше условиям, естественно назвать абстрактной или


идеальной. Изучению таких абстрактных динамических систем посвящена клас-
сическая теория Пуанкаре – Биркгофа. Согласно этой теории существование ре-
шения и его единственность представляются достаточными для установления
взаимно-однозначного соответствия между фазовыми траекториями и реальными
движениями соответствующего объекта, т.е. в классической теории вычисленные
фазовые траектории представляют само движение системы. То, что фазовые
траектории вычислимы и физически реализуемы не вызывало сомнений. При этом
само собой подразумевалось, что ошибки счета, как и физические помехи, несу-
щественно малы. Такую трактовку и обоснование можно назвать абстрактными, а
классическую теорию – абстрактной теорией динамических систем.
Изучение конкретных динамических систем до появления компьютеров ве-
лось в основном аналитическими методами и ограничивалось системами неболь-
шой размерности. При этом получаемые результаты укладывались в рамки клас-
сической теории. Ситуация резко изменилась с появлением быстродействующих
ЭВМ и возможности наблюдать за поведением фазовых траекторий на дисплее
компьютера. Перед исследователями открылся сложный мир фазовых портретов и
весьма сложных движений. Появились отдельные примеры, теоретическое иссле-
дование которых было затруднено, некоторые конкретные системы с весьма
сложными фазовыми портретами не поддавались изучению. Требовались новые
подходы. Одновременно обнаруживались явления, которые не находили объясне-
ний. Самым удивительным среди них было обнаружение случайности в поведе-
нии фазовых траекторий, когда при одних и тех же начальных условиях могли
быть получены совершенно разные решения. Эта случайность обнаружилась и в
физическом эксперименте, и при счете на компьютере. Лежащее в основе абст-
рактной теории утверждение о единственности фазовой траектории с заданными
начальными условиями нарушалось, и это не находило объяснения. Возможность
сколь угодно точных вычислений всей полутраектории от заданного начального
условия и такой же ее физической реализуемости не вызывала сомнений, однако
признание абстрактной теорией однозначности, вычислимости и физической реа-
лизуемости траекторий приводило к противоречию реального эксперимента с
теорией. Остановимся чуть подробнее на результатах исследования особенностей
поведения некоторых фазовых траекторий при заданных начальных условиях: с
теоретической точки зрения, в плане реализуемости физического процесса и в
плане компьютерных вычислений.
1. Абстрактная теория динамических систем предполагает единственность
решения для заданных начальных условий. Эта единственность имеет место как
для динамических систем, определяемых обыкновенными дифференциальными
уравнениями, так и для систем в частных производных, а также для систем, за-
данных любыми другими способами.
2. Физический эксперимент показывает, что в некоторых случаях реализуе-
мые фазовые траектории с заданными начальными условиями отличаются друг от
друга случайным образом, причем различие траекторий может быть весьма зна-
чительным. Возможны случаи, когда малейшее изменение начальных условий
приводит к существенным изменениям соответствующих фазовых траекторий.
398 Ю.И. Неймарк. Математическое моделирование как наука и искусство

3. Компьютерный эксперимент по вычислению фазовых траекторий при за-


данных начальных условиях с использованием компьютеров или различных ме-
тодов счета может приводить к весьма различным траекториям, с некоторого вре-
мени ничего общего между собой не имеющим. В таких случаях малейшие изме-
нения начальных условий в пределах, учитываемых компьютером, приводят к
аналогичным результатам. Повторный счет на компьютере при одинаковых на-
чальных условиях и одном методе счета приводит к одной и той же траектории.
Эти особенности некоторых фазовых траекторий были восприняты многими
исследователями как возможность существования случайных, хаотических или
стохастических движений, что находится в явном противоречии с общеизвестной
теоремой о единственности решений дифференциальных уравнений и с самим
определением динамической системы. Более того, это мнение о наличии случай-
ности в детерминированных системах стало восприниматься как фантастическое
открытие, и этому открытию придавалось очень большое значение, а противоре-
чие с безусловно верной теорией игнорировалось. Возникшая вера в наличие слу-
чайных движений приняла догматический характер, и этому не помешали не
только теорема о единственности решения, но и реальный факт однозначности
решения при одинаковом способе счета на компьютере. Вместе с тем, безусловно,
весьма значительным был и факт наличия стохастичности при физической реали-
зации динамической системы, и в каком-то смысле именно он одержал победу над
теоретическими рассуждениями. После длительного отрицания возможности по-
строения различных траекторий при одних и тех же начальных условиях этот
факт был признан как некоторое новое понимание движения динамических сис-
тем и был введен новый тип движения, названный хаотическим. В системах вто-
рого порядка их не было обнаружено, но в системах третьего порядка и выше они
были. Необычайно сложные движения вызвали бум, их открывали всюду. Хаоти-
ческие движения и хаотические аттракторы получили признание, но их наличие и
природа не поддавались объяснению. Определения, что такое хаотический ат-
трактор, не существовало, и это не удивительно. Ясно, что такое положение тре-
бует выяснения истинных причин наблюдаемых явлений.
Истинная причина скрыта именно в базовом для классической теории допу-
щении возможности пренебрегать очень малыми воздействиями. Это допущение
верно для грубых систем, оно было естественным для систем первого и второго
порядка, которые на первых порах были основными объектами, поддающимися
изучению. Впрочем, требование вычислительной реализуемости может не выпол-
няться и для двумерных систем, о чем свидетельствует рис. 47.1,а, когда при вы-
боре точки М сколь угодно точные, но разные вычисления могут привести к раз-
ным решениям. Правда, этот простой пример реализуется на одномерном отрезке
фазовой траектории, и вероятность случайного выбора точки М равна нулю. Ана-
логичная картина в пространстве представлена на рис. 47.1,б.
47. Абстрактная и реальная математические теории динамических систем 399

а) б)
Рис. 47.1. Пример невыполнения требования вычислительной реализуемости:
а) для двумерных систем; б) для пространственных систем

В случае многомерной динамической системы такое поведение траекторий


может иметь место уже для некоторой области фазового пространства, когда
сколь угодно малые отклонения от теоретически принятой идеальной модели ди-
намической системы приводят к значительным изменениям решения за конечное
время. Это явление можно назвать сверхчувствительностью, и оно наблюдается
при экспоненциальной неустойчивости бесконечной фазовой траектории, отве-
чающей заданному начальному условию. В этом случае имеет место отклонение
порядка εe λt ( ε > 0) , и с ростом t это отклонение значительно при сколь угодно
малом ε. Этим свойством обладает любая экспоненциально неустойчивая фазовая
траектория, в том числе и такие траектории, которые не выходят за пределы неко-
торой ограниченной области. Подчеркнем, что сверхчувствительность относится
как к очень малым неучитываемым возмущениям, так и к погрешностям вычисле-
ний. Из сказанного следует, что экспоненциально неустойчивая фазовая траекто-
рия не может быть в целом найдена, т.е. в реальности следует признать факт
существования невычислимых и физически нереализуемых фазовых траекторий.
Означает ли это, что фазовая траектория случайна? Компьютер при неизменности
метода расчета все время выдает один и тот же результат, не демонстрируя ника-
кой случайности. Физический эксперимент, напротив, при достаточно длительном
эксперименте приводит к различным (случайным) результатам. Различия вызы-
ваются флуктуациями параметров физической системы и случайными отклоне-
ниями, происходящими в реальной системе. При этом при малых возмущениях
отклонения могут быть значительными в силу неустойчивости фазовой траекто-
рии. Таким образом, для асимптотически неустойчивых движений можно гово-
рить о случайности вычисляемых и физически реализуемых траекторий, но слу-
чайностей, порождаемых динамической системой, нет. Наблюдаемые случайно-
сти – следствие неучета малых, но существенных воздействий.
Почему же так разнятся реализации устойчивых и неустойчивых движений?
Прежде всего, заметим, что этих различий нет, если на реализуемую фазовую тра-
екторию нет даже очень малых неизвестных воздействий. При выполнении этого
условия состояние системы в точности соответствует фазовой траектории матема-
тической модели. Различие проявляется с появлением неизвестных воздействий,
когда устойчивость уменьшает их влияние, а неустойчивость увеличивает. При
400 Ю.И. Неймарк. Математическое моделирование как наука и искусство

этом уход от первоначальной фазовой траектории экспоненциально нарастает при


неустойчивости, а в случае устойчивости, напротив, экспоненциально убывает.
Экспоненциальный рост приводит к тому, что в значительной мере изменение со-
стояния определяется очень малыми неучитываемыми воздействиями. Таким об-
разом, при неустойчивости случайные возмущения могут вызвать изменение со-
стояния и отвечающую ему эволюцию фазовой траектории.
Неустойчивые фазовые траектории могут образовывать притягивающие
множества, и тогда можно наблюдать блуждание фазовой траектории в некоторой
ограниченной области. Притягивающее множество блужданий получило название
«странного аттрактора» (странного потому, что устойчивое множество состоит из
неустойчивых фазовых траекторий, которые могут пересекаться вследствие сколь
угодно малых неучитываемых случайных воздействий). В странном аттракторе
фазовая точка перемещается по области притяжения под управлением неучиты-
ваемых ничтожно малых случайных неуправляемых воздействий. При этом вы-
числяемая или физически реализуемая фазовая траектория не имеет определенно-
го вида, задаваемого начальными условиями. И хотя блуждающие движения не
вычислимы и физически не реализуемы по начальным условиям, в целом они об-
разуют устойчивые притягивающие множества и в этом смысле похожи на уста-
новившиеся устойчивые движения (состояния равновесия, периодические движе-
ния и др.). Подчеркну, что блуждание прекращается, как только фазовая точка
попадает в область притяжения устойчивой фазовой траектории. Если устойчи-
вость асимптотическая, то дальнейшее движение – это движение по асимптотиче-
ской траектории. Такое возможно, конечно, при достаточно малых возмущениях.
В противном случае, когда приход в область притяжения устойчивого движения
невозможен, блуждание не прекращается.
Возникает вопрос о вероятностном описании неустойчивых притягивающих
движений. Оказывается, что такое описание иногда возможно и в некоторых слу-
чаях легко реализуемо. При этом, естественно, предполагается отсутствие внеш-
них возмущений. Основываясь на изучении точечного отображения аттрактора
самого в себя, т.е. исходя из задания динамической системы в виде точечного
отображения, можно найти плотность вероятности для этих странных аттракто-
ров. В некоторых простейших случаях вычисление плотностей вероятностей дос-
таточно просто (см. гл. 18). Можно предположить, что блуждающие движения в
некоторых случаях подчиняются определенным статистическим законам, но пол-
ное изучение всех вариантов мне неизвестно.
Итак, с точки зрения реальной теории, не вдаваясь в детали, все движения в
аналитической системе можно разделить на переходные и установившиеся, ус-
тойчивые и неустойчивые и, как частный случай неустойчивого движения, дви-
жения, блуждающие при наличии притягивающего множества. В свою очередь
установившиеся движения делятся на регулярные и блуждающие: асимптотиче-
ски устойчивые фазовые траектории (регулярные движения) не выходят из конеч-
ной области устойчивого состояния равновесия или периодического движения, а
асимптотически неустойчивая траектория блуждает в некоторой ограниченной
области притягивающего множества (хаотического аттрактора).
После сказанного естественно возникает вопрос, каким образом Пуанкаре,
Биркгоф и их последователи проигнорировали возможность различных движений
47. Абстрактная и реальная математические теории динамических систем 401

из одного и того же начального состояния при неучете малых воздействий, не за-


метили существования невычислимых фазовых траекторий. Возможно, это связа-
но с господствовавшим в то время механистическим взглядом на природу, с тем,
что эти «странные» явления в изучаемых механических системах не проявили се-
бя. Известно высказывание английского физика лорда Кельвина, который сто лет
назад сказал, что «он не может понять ни одного явления до тех пор, пока не
представит себе его механическую модель» (Вольтер Б.В. В царстве неустойчиво-
сти // Знание – сила. 1993. №4. С. 113.). Хотя это не значит, что таких движений в
механических системах нет. Таких примеров не было, но сейчас они известны, и
один из них приведен в этой книге: осциллятор с отрицательным трением и огра-
ничительным торможением. С проявлением неустойчивых движений на практике
столкнулись химики, когда начали взрываться химические реакторы. «Предска-
зать, разглядеть сокрытую опасность неустойчивости далеко не всегда можно
«методом здравого смысла». В устойчивости есть некая соразмерность между
внешними воздействиями и реакцией системы. Сильное воздействие – активнее
реакция. Неустойчивая система не подчиняется такой соразмерности, она может
возбудиться от малейшей едва заметной причины» (там же, с. 115). Но не химики
создали и развивали теорию динамических систем, а математики в то время были
далеки от химии и химических реакторов.
Хочу подчеркнуть, что мир состоит как бы из двух частей: устойчивой и не-
устойчивой. Изменения, происходящие в устойчивом мире, соответствуют изме-
няющим его воздействиям. Эволюция устойчивого мира прогнозируема. Изучая
процессы, происходящие в том или ином объекте, мы пытаемся найти закономер-
ности его изменения, не сомневаясь, что такие закономерности существуют. Но
это не так, точнее, это не всегда так. Окружающий нас мир гораздо сложнее, чем
мы думаем. В некоторых случаях изменения происходят из-за очень малых слу-
чайных воздействий. В неустойчивом мире нет соответствия: очень малые воз-
действия могут приводить к громадным изменениям, эволюция неустойчивого
мира не прогнозируема. Существующая теория динамических систем относится в
основном к устойчивому миру. Неустойчивый мир ждет своего исследования, ко-
торое, безусловно, расширит наше понимание окружающего мира.
И в заключение подведем итог имеющимся представлениям о хаотических
движениях динамических систем. Так называемая стохастичность движений ди-
намической системы не соответствует ее природе, она есть результат неполноты
ее описания. Эта неполнота считалась несущественной в силу ее малости, воз-
можность сверхчувствительности не замечалась и не учитывалась. Но вместе с
тем блуждания, вызванные не учитываемыми воздействиями, действительно мо-
гут обладать статистическими закономерностями.
402 Ю.И. Неймарк. Математическое моделирование как наука и искусство

СПИСОК ЛИТЕРАТУРЫ
1. Андронов А.А., Горелик Г.С. О резонансных явлениях при движении реля-
тивистской частицы в циклотроне // ДАН СССР. 1945. Т. 11. С. 664.
2. Андронов А.А., Витт А.А., Хайкин С.Э. Теория колебаний. М.: Наука,
1981.
3. Андронов А.А., Леонтович Е.А., Гордон И.И., Майер А.Г. Качествен-
ная теория динамических систем второго порядка. М.: Наука, 1966.
4. Андронов А.А., Леонтович Е.А., Гордон И.И., Майер А.Г. Теория би-
фуркаций динамических систем на плоскости. М.: Наука, 1967.
5. Базыкин А.Д. Система Вольтерра и уравнение Михаэлиса – Менте // В кн.: Воп-
росы математической генетики. Новосибирск: Изд-во СО АН СССР, 1974.
С. 165–173.
6. Баталова З.С. Изучение вибропогружения шпунта при лобовом сопротивлении
грунта // Инж. журнал. Механика твердого тела. 1966. Сер. 2. С. 165–173.
7. Баталова З.С. О движениях ротора под влиянием внешней гармонической силы
// МТТ. 1967. №1.
8. Баталова З.С., Белякова Г.В., Бухалова Н.В. Периодические движения ма-
ятника с колеблющейся осью // МТТ. 1987. №6. С. 18–25.
9. Баталова З.С., Ежевская Н.А. О структуре фазового пространства уравнения
Дюффинга // Дифференциальные уравнения. 1989. Т. 25, №7. С. 1270–1271.
10. Баталова З.С., Белякова Г.В. Диаграммы устойчивости периодических дви-
жений маятника с колеблющейся осью // ПММ. 1988. Т. 52. Вып. 1. С. 55–63.
11. Бау тин Н.Н. Динамическая теория часов. М.: Наука, 1990. 190 с.
12. Беспалова Л.В. К теории виброударного механизма // Инж. журнал. ОТН. 1957.
№5.
13. Блехман И.И. Исследование процесса вибрационной забивки свай и шпунтов //
Инженерный сборник. 1954. Т. 19. С. 55–64.
14. Вольтера В. Математическая теория борьбы за существование. М.: Наука, 1976.
15. Гау зе Г.Ф., Витт А.А. О периодических колебаниях численности популяций;
математическая теория релаксационного взаимодействия между хищниками и
жертвами и ее применение к популяции двух простейших // Изв. АН СССР. Отд.
матем. и естеств. наук. Сер. VII. 1934. Т. 10. С. 1551–1559.
16. Гау зе Г.Ф. Исследования над борьбой за существование в смешанных популяци-
ях // Зоологический журнал. 1935. Т. 14, № 2. С. 243–270.
17. Гельфер И.С. Нелинейность как расширение возможностей квазиинвариантного
управления // Нелинейные колебания механических систем: Труды 8-й Всерос-
сийск. науч. конф., Н. Новгород, 22–26 сент. 2008. Н. Новгород, 2008. Т. 1. С. 132–
136.
18. Колосов Г.Е., Нежметдинова Д.В. Исследование установившихся колеба-
тельных процессов в хемостате // Автоматика и телемеханика. 2000. № 1.
19. Ланда П.С. Нелинейные колебания и волны. М.: Наука, Физматлит, 1997.
20. Неймарк Ю.И. Устойчивость линеаризованных систем (дискретных и непре-
рывных). Л.: ЛКВВИА, 1949. 140 с.
21. Мееров М.В. Синтез структур автоматического регулирования высокой точно-
сти. М.: Физматгиз, 1959.
22. Неймарк Ю.И. О движениях, близких к двоякоасимптотическому движению //
ДАН СССР. 1967. Т. 172, № 5. С.1021–1024.
Список литературы 403
23. Неймарк Ю.И. Структура движений динамической системы в окрестности го-
моклинической кривой // Пятая летняя математическая школа (Ужгород, июнь,
1967) / АН СССР. Киев, 1968. С. 400–435.
24. Неймарк Ю.И. Об одном классе динамических систем // Тр. Международ. сим-
поз. по нелинейным колебаниям / АН СССР. Киев, 1970. Т. 2. С. 363–376.
25. Неймарк Ю.И. Метод точечных отображений в теории нелинейных колебаний.
М.: Наука, 1972. 471 с.
26. Неймарк Ю.И., Баталова З.С., Васин Ю.Г., Брейдо М.Д. Распознавание
образов и медицинская диагностика. М.: Наука, 1972.
27. Неймарк Ю.И. Динамические системы и управляемые процессы. М.: Наука,
1978. 336 с.
28. Неймарк Ю.И., Ланда П.С. Стохастические и хаотические колебания. М.:
Наука, 1987.
29. Неймарк Ю.И. Робастная устойчивость линейных систем // ДАН СССР. 1991.
Т. 319, №3. С. 578–580.
30. Неймарк Ю.И., Смирнова В.Н. К столетию проблемы парадокса Пенлеве //
Вестник Нижегородского гос. ун-та. Сер. Математическое моделирование и опти-
мальное управление. 2001. Вып. 2. С. 7–33.
31. Неймарк Ю.И. Вопросы устойчивости в теории управления в работах научной
школы А.А. Андронова // Вестник Нижегородского гос. ун-та им. Н.И. Лобачев-
ского. 2001. Вып. 1(23). С. 168–197.
32. Неймарк Ю.И., Теклина Л.Г. Новые технологии применения метода наи-
меньших квадратов. Н. Новгород: Изд-во Нижегородского университета, 2003.
33. Неймарк Ю.И. Теория вибрационного погружения и вибровыдергивания // Ин-
женерный сборник. 1953. Т. 4. С. 13–48.
34. Неймарк Ю.И. О скользящем режиме и периодических движениях релейных
систем // Тр. ГИФТИ и радиофизического факультета ГГУ, сер. физ. Уч. зап. 1956.
Т. 30. С. 159–192.
35. Неймарк Ю.И., Смирнова В.Н. Идеализация, сингулярность и парадокс Пен-
леве. // Доклады РАН. 2002. Т. 386, № 6. С. 742–745.
36. Неймарк Ю.И., Коган Н.Я., Савельев В.П. Динамические модели теории
управления. М.: Наука, 1985.
37. Неймарк Ю.И. Создатель нелинейной динамики и физики. К 100-летию со дня
рождения академика А.А. Андронова // Вестник РАН. 2001. Т. 71, № 4. С. 231–236.
38. Неймарк Ю.И. Кризис эволюции жизни и коллективная игра людей // Нелиней-
ный мир, 2007. Т. 5, №1–2. С. 65–70.
39. Неймарк Ю.И., Левин А.Я. Играет ли бог в кости? // Прикладная нелинейная
динамика. 2009. №3. С. 98–136.
40. Пу анкаре А. Новые методы небесной механики. Избр. труды. Т. 1. М.: Наука,
1971.
41. Пу анкаре А. Избр. труды. Т. II. М.: Наука, 1972.
42. Пенлеве П. Лекции о механике. М.: Гостехиздат, 1954.
43. Рапопорт А.Н. Автоматные модели поисковой оптимизации и управления. Ки-
ров: ВятГТУ, 1999. 132 с.
44. Розенблат Ф. Принципы нейродинамики: персептрон и теория механизмов моз-
га. М.: Мир, 1965.
45. Седов Л.И. Методы подобия и размерности в механике. М.: Наука, 1972.
46. Смейл С. Структурно устойчивые гомеоморфизмы с бесконечным числом пе-
риодических точек // Тр. Международ. симпоз. по нелинейным колебаниям. Киев:
АН УССР, 1963. С. 365–366.
404 Ю.И. Неймарк. Математическое моделирование как наука и искусство

47. Цетлин М.Л. Исследование по теории автоматов и моделированию биологиче-


ских систем. М.: Наука, 1969.
48. Цетлин М.Л. Конечные автоматы и моделирование простейших форм поведения
// УМН. 1963. Т. 18, № 4. С. 5–33.
49. Щипанов Г.В. Теория и методы проектирования автоматических регуляторов //
Автоматика и телемеханика. 1939. № 1. С. 49–67.
50. Щипанов Г.В. и теория инвариантности / Сост. З.М. Лезина, В.И. Лезин. М.: Физ-
матлит, 2004. 428 с.
51. Яку бович В.А. Управляемые регуляторы в задачах инвариантности и отслежи-
вания // ДАН. 1955. Т. 343, № 2. С. 172–175.
52. Яку бович В.А. Синтез стабилизирующих регуляторов, обеспечивающих неза-
висимость выходной переменной системы управления от внешнего воздействия //
ДАН. 2001. Т. 380. № 1. С. 77–80.
53. Яку бович В.А., Проскуряков А.В. Задача об инвариантности систем управ-
ления. // ДАН. 2003. Т. 389, № 6. С. 742–746.
Неймарк Юрий Исаакович

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
КАК НАУКА И ИСКУССТВО

Учебник

Издание второе, исправленное и дополненное

Формат 60x84/8. Печать офсетная. Бумага офсетная.


Гарнитура «Таймс». Уч.-изд. л. 39,5. Усл. печ. л. 48,8.
Тираж 400 экз. Заказ 500
Издательство Нижегородского госуниверситета им. Н.И.Лобачевского
603950, Н. Новгород, пр. Гагарина, 23
Типография Нижегородского госуниверситета им. Н.И. Лобачевского
Лиц. № 18-0099 от 04.05.01 г.
603000, Н. Новгород, ул. Б. Покровская, 37

Вам также может понравиться