Методы обработки экспериментальных данных

Методы обработки
экспериментальных
данных
1
Введение
2
1.1. Введение
Окружающий нас мир насыщен информацией…
Ее НЕОБХОДИМО обрабатывать для принятия

управленческих решений.
Существует множество мат. пакетов: MatLab, Statistica,

Statgraphics…
НО ЕСТЬ проблема…. понимание и интерпретация
результатов!
НЕОБХОДИМО ЗНАТЬ И ПОНИМАТЬ КАК И ЧТО

ПРОИСХОДИТ ВНУТРИ МАТ. ПАКЕТОВ!
Области применения анализа
экспериментальных данных
Физика
Химия
Биология
Техника
Технологии
Гуманитарные науки
Прочая деятельность
1.2. Основные этапы анализа данных
1. Планирование и 4. Построение
сбор данных моделей и проверка
гипотез
2. Предварительное
исследование 3. Оценка неизвестной
данных величины
1.3. Структуры данных
Одномерные наборы данных (одна переменная) содержат
только один признак, зарегистрированный для каждой
элементарной единицы.
Двумерные наборы данных содержат информацию о двух

признаках для каждого из объектов. В дополнение к обобщению
свойств каждой из этих двух переменных, рассматриваемых как
отдельные наборы одномерных данных,
Наборы многомерных данных содержат информацию о трех

или более признаках для каждого объекта. В дополнение к
обобщению свойств каждой из этих переменных
(рассматриваемых как отдельные наборы одномерных данных)
и установлению зависимости между парами переменных (как
при анализе набора двумерных данных)
Количественные данные
Дискретные Непрерывные
Качественные данные
Порядковые Номинальные
Временные ряды
Источники данных
Первичные Вторичные
Планирование и сбор Поиск в Специальные

данных Internet издания и
журналы
Маркетинговые Социологические
исследования опросы
Покупка готовых
Проведение данных у
экспериментов специализирующихся
на производстве компаний
1.4. Что такое переменная?
Переменная (английский термин variable) — это то, что можно
измерять, контролировать или чем можно манипулировать в
исследованиях. Иными словами, переменная — это то, что
варьируется, изменяется, а не является постоянным (от
английского корня var).
ПРИМЕРЫ: анкетные данные, систолическое давление

пациентов, количество лейкоцитов в крови, цена акций, товаров,
услуг, потребление, инвестиции, доход, государственные закупки
товаров и услуг, инструмент государственного регулирования (в
экономике); рейтинг программ, доля зрителей, количество
посещений сайта (в рекламе); скорость, температура, объем,
масса в (физике) и т. д.
Так как значения переменных не постоянны, нужно научиться
описывать их изменчивость.
Для этого придуманы описательные или дескриптивные

статистики.
Минимум и максимум — это минимальное и максимальное

значения переменной.
Среднее — сумма значений переменной, деленная на n (число

значений переменной).
Дисперсия и стандартное отклонение — наиболее часто

используемые меры изменчивости переменной. Дисперсия
меняется от нуля до бесконечности. Крайнее значение 0 означает
отсутствие изменчивости, когда значения переменной постоянны.
Медиана разбивает выборку на две равные части. Половина значений
переменной лежит ниже медианы, половина — выше.
Медиана дает общее представление о том, где сосредоточены значения

переменной, иными словами, где находится ее центр. В некоторых
случаях, например при описании доходов населения, медиана более
удобна, чем среднее.
Мода представляет собой максимально часто встречающееся значение

переменной (иными словами, наиболее «модное" значение переменной),
например популярная передача на телевидении, модный цвет платья или
марка автомобиля и т. д.
А так же есть еще множество других статистик: квартили, коэффициент

асимметрии, эксцесс, коэффициент корреляции и др.
1.5. Основные законы распределения
случайных величин и их назначение
Законы распределения случайных величин

служат математическими моделями для
реальных объектов и явлений, что позволяет в
некоторых случаях применять их для расчетов
и анализа ситуации.
Нормальное распределение особенно часто используется при анализе данных.
Нормальное распределение дает хорошую модель для реальных явлений, в
которых:
1) имеется сильная тенденция данных группироваться вокруг центра;
2) положительные и отрицательные отклонения от центра равновероятны;
3) частота отклонений быстро падает, когда отклонения от центра становятся
большими.
( x m )2
1 
f ( x)  e 2 2
2 
Равномерное распределение полезно при описании
переменных, у которых каждое значение равновероятно,
иными словами, значения переменной равномерно
распределены в некоторой области.
 1
 , x  [ ,  ]
f ( x)     
0, x  [ ,  ]

Экспоненциальное распределение. Имеют место события, которые на обыденном
языке можно назвать редкими. Если T – время между наступлениями редких
событий, происходящих в среднем с интенсивностью λ, то величина имеет
экспоненциальное распределение с параметром λ (лямбда). Экспоненциальное
распределение часто используется для описания интервалов между
последовательными случайными событиями, например интервалов между
заходами на непопулярный сайт, так как эти посещения являются редкими
событиями.
f ( x )   e  x , x  0
Распределение Лапласа, или, как его еще называют, двойного
экспоненциального, используется, например, для описания
распределения ошибок в моделях регрессии.
1  x
f ( x )  e , (   x  )
2
Случайная величина h называется логарифмически нормальной, или
логнормальной, если ее натуральный логарифм (lnh) подчинен
нормальному закону распределения. Логнормальное распределение
используется, например, при моделировании таких переменных, как
доходы, возраст новобрачных или допустимое отклонение от стандарта
вредных веществ в продуктах питания. Итак, если величина x имеет
нормальное распределение, то величина y=ex имеет логнормальное
распределение.
(ln x  ln a ) 2
1 
f ( x)  e 2 2
2 x
Распределение Пуассона иногда называют распределением редких
событий. Примерами переменных, распределенных по закону Пуассона,
могут служить: число несчастных случаев, число дефектов в
производственном процессе и т д.
x 
e
f ( x) 
x!
1.6. Краткий обзор современных программных
средств для проведения анализа данных.
MATLAB – это высокопроизводительный язык для технических
расчетов. Он включает в себя вычисления, визуализацию и
программирование в удобной среде, где задачи и решения
выражаются в форме, близкой к математической. Типичное
использование MATLAB – это:
• математические вычисления
• создание алгоритмов
• моделирование
• анализ данных, исследования и визуализация
• научная и инженерная графика
• разработка приложений, включая создание графического
интерфейса
Mathcad – программное средство, среда для выполнения на

компьютере разнообразных математических и технических
расчетов, снабженная простым в освоении и в работе
графическим интерфейсом, которая предоставляет пользователю
инструменты для работы с формулами, числами, графиками и
текстами.
В среде Mathcad доступны более сотни операторов и логических
функций, предназначенных для численного и символьного
решения математических задач различной сложности и
применения этих функций для анализа данных.
STATISTICA – это универсальная интегрированная система,

предназначенная для статистического анализа и визуализации
данных, управления базами данных и разработки
пользовательских приложений, содержащая широкий набор
процедур анализа для применения в научных исследованиях,
технике, бизнесе, а также специальные методы добычи данных.
С помощью реализованных в системе STATISTICA мощных языков
программирования, снабженных специальными средствами
поддержки, легко создаются законченные пользовательские
решения и встраиваются в различные другие приложения или
вычислительные среды.
Deductor
Аналитическая платформа Deductor реализует практически все
современные подходы к анализу структурированной табличной
информации: хранилища данных (Data Warehouse), многомерный
анализ (OLAP), добыча данных (Data Mining), обнаружение знаний
в базах данных (Knowledge Discovery in Databases). Лучшим
способом изучить и понять целесообразность использования
современных технологий анализа - это испытать все на практике.
STATGRAPHICS – это универсальный пакет для анализа и визуализации
данных. Отличительной особенностью пакета является наличие такого
инструмента как StatAdvisor, который помогает пользователям
интерпретировать полученные результаты, обеспечивает возможность
объединения в одном окне нескольких текстовых и графических подокон.
StatAdvisor дает пользователям понятные разъяснения полученных
результатов, определяет, являются ли эти результаты существенными, и
обращает особое внимание на любые возможные ошибки в анализе.
Пользователи получают немедленную интерпретацию результатов в
процедурах, доступных в как основной системе, так и в четырех
специальных модулях, поставляемых по выбору: Quality Control (контроль
качества), Experimental Design (планирование эксперимента), Time-Series
Analysis (анализ временных рядов) и Advanced Multivariate Method
(анализ вариаций).
Вопросы ?
24
КЛАССИФИКАЦИЯ
В РАСПОЗНАВАНИИ
ОБРАЗОВ
25
Схема системы распознавания
Система распознавания образов состоит из нескольких подсистем:
Формирователь
информативных Класси- Решение
Объект Датчики
фикатор
признаков
(x , x )0 x2
1 2
Обучающая выборка и решающее
правило для случая двух G1  ( x , x ) 0
1 2
информативных признаков x1, x2 и
двух классов.
G2
( x , x )  0
1 2
x1
Байесовская теория принятия решений
при дискретных признаках
Одномерный вариант
Рассматриваем m классов (полную группу несовместных случайных событий) и

один дискретный информативный признак X.
По формуле Байеса вычисляем апостериорные вероятности для всех

рассматриваемых классов:
pxi | j P( j ) m
P( j | X  xi )  , pxi   pxi |l P(l ) j  1, m
pxi l 1
Выносим решение об истинности того класса (с номером ), для которого

апостериорная вероятность максимальная:

P (  | X  xi )  max P( j | X  xi ) , j  1, m 
Многомерный вариант
Для простоты считаем, что имеются два информативных признака X и Y.

X принимает возможные значения x1,…,xn1, Y принимает возможные значения y1,
…,yn2.
По формуле Байеса вычисляем апостериорные вероятности для всех
рассматриваемых классов:
p xi , y j | k P ( k )
P(k | [( X  xi )(Y  y j )])  P(k | xi , y j )  m
, k  1, m
 pxi , y j |l P(l )
l 1
Выносим решение об истинности того класса (с номером ), для которого

апостериорная вероятность максимальная:

P(  | xi , y j )  max P ( k | xi , y j ) , k  1, m 
Одномерный вариант
1
X  xi Решающее
устройство

m
Многомерный вариант
X  xi 1
Решающее
Y  yj устройство

m
при непрерывных признаках
Одномерны вариант: f ( x | i ), i  1, 2,
Апостериорные вероятности классов по формуле Байеса :
f ( x | i ) P (i )
P (i | x)  , i  1, 2
f ( x)
P ( j | x)
1 если P (1| x )  P (2| x )
P(1| x ) P( 2| x )
то принимается решение о 1-м классе, иначе о
2-м классе.
0 x
G1 c G2
при непрерывных признаках
Вероятность ошибки классификации при двух классах:
Pîø1   f ( x | 1) P(1)dx
G2
Pîø2   f ( x | 2) P( 2)dx
G1
f ( x|1) P (1) f ( x|2) P (2)
P ош.2 P ош.1
x
G1 c G2
Идеи классификации
Случай 1. Известны полностью условные плотности распределения вероятности
для признаков:
f ( x | 1), , f ( x | m)
x2
f ( x |i ) ( x1 , x2 )  0
f ( x|1) f ( x|2) ( x1 , x2 )  0
( x1 , x2 )  0
 
x
G1 c G2
x1
Одномерный случай Двумерный случай

Случай 2. Условные плотности распределения вероятности для
признаков известны не полностью, а с точностью до параметров:
 1  2
f ( x ,  | 1), f ( x ,  | 2)
Неизвестные параметры θ1 и θ2 доопределяются с помощью одного из
методов математической статистики, например с помощью метода
максимального правдоподобия, на основе обучающей выборки.
Дальнейшая классификация проводится, как и в случае 1.
По обучающей выборке доопределяются и априорные вероятности:

 n1  n2
P (1)  , P (2) 
n1  n2 n1  n2
Случай 3. Условные плотности распределения вероятности неизвестны, но
известна обучающая выборка. Здесь возможны два варианта.
Вариант 1. Восстанавливается решающая функция.
Вариант 2. По обучающей выборке восстанавливаются условные плотности

Случай 4. Число классов неизвестно и нет обучающей выборки. Вернее, нет
учителя, который мог бы измерения признаков разбить на группы, соответствующие
своим классам. Это самая сложная и распространенная на практике ситуация.
Приходится строить самообучающиеся системы классификации.
f ( x)
1) По количеству максимумов
определяем кол-во классов
2) Минимум позволяет разбить выборку
на две части – точка c0 (нулевое
приближение).
f ( x|1) P(1) f ( x|2) P(2)
x 3) Далее строится процедура
c последовательного (итерационного)
расчета порога c.
4) В итоге получаем случай 3.
Прямые методы восстановления
решающей функции
 1, если истинным является класс 1,

yi  
 1, если истинным является класс 2.
y
1
(x)
x
-1
НЕЙРОННЫЕ СЕТИ: еще один
подход к классификации
Идея взята из биологии:
•Клетка - элементарный процессор, способный
к простейшей обработке информации
•Нейрон - элемент клеточной структуры мозга
•Нейрон осуществляет прием и передачу
информации в виде импульсов нервной
активности
•Природа импульсов - электрохимическая
Интересные данные
Тело клетки имеет размер 3 - 100 микрон
Гигантский аксон кальмара имеет толщину 1 миллиметр и
длину несколько метров
Потенциал, превышающий 50 мВ изменяет проводимость
мембраны аксона
Общее число нейронов в ЦНС человека порядка
100.000.000.000
Каждая клетка связана в среднем с 10.000 других нейронов
Совокупность в объеме 1 мм*3 - независимая локальная сеть
Персептроны
1 ( x)
a1 a11 ( x)
1
 j (x) ( x, a) Пороговое
aj  устройство 1
sgn 
 M (x)
aM Блок
Преобразователи, обучения
предикаты, Усилители
нейроны
Формальный нейрон
Нелинейное преобразование
Маккалок - Питтс
Линейная
Сигмоидальная
Перцептрон Розенблата
Розенблат: нейронная сеть рассмотренной

архитектуры будет способна к воспроизведению любой
логической функции.
(неверное предположение)
Обучение сети
 Обучить нейронную сеть это значит, сообщить
ей, чего от нее добиваются.
 Показав ребенку изображение буквы и получив
неверный ответ, ему сообщается тот, который
хотят получить.
 Ребенок запоминает этот пример с верным
ответом и в его памяти происходят изменения в
нужном направлении.
Обучение перцептрона
Начальные значения весов
всех нейронов полагаются
случайными.
Сети предъявляется
входной образ xв
результате формируется
выходной образ.
STATISTICA Neural Networks
ВОПРОСЫ ?
48
ПЛАНИРОВАНИЕ
ЭКСПЕРИМЕНТА
49
Что такое планирование эксперимента
Целью планирования эксперимента

u1 является создание таких планов
Объект y вариации входных переменных,
um которые обеспечивают более быстрое
и точное построение модели объекта.
Выход объекта состоит из неизвестного сигнала

(функции от входов) и центрированной помехи
y  (u1 ,  , um )  h
Эксперименты в науке и промышленности
Экспериментальные методы широко используются как в науке,
так и в промышленности, однако нередко с весьма
различными целями.
Обычно основная цель научного исследования состоит в том,

чтобы показать статистическую значимость эффекта
воздействия определенного фактора на изучаемую зависимую
переменную.
В условиях промышленного эксперимента основная цель

обычно заключается в извлечении максимального количества
объективной информации о влиянии изучаемых факторов на
производственный процесс с помощью наименьшего числа
дорогостоящих наблюдений.
Общие идеи
Обычно любая машина или станок, используемый на

производстве, позволяет операторам изменять различные
настройки, влияя на качество производимого продукта.
Эксперименты позволяют инженеру, ответственному за
производство, улучшать настройки машины, а также
выяснить какие факторы вносят наиболее важный вклад в
качество продукции. Использование этой информации
позволяет улучшить настройки системы, достигнув
оптимального качества. Чтобы проиллюстрировать эти
рассуждения далее приводится несколько примеров.
Общие идеи
Пример 1: Производство красителей для ткани. Рассмотрим
эксперимент по производству некоторого красителя для ткани. В
этом случае качество производимой продукции описывается
насыщенностью, яркостью и стойкостью окрашенной ткани. Кроме
того, необходимо уточнить, что надо изменять для получения красок
различной насыщенности, яркости для удовлетворения
потребительского спроса. Другими словами, в этом эксперименте
нужно выявить факторы, наиболее заметно влияющие на яркость,
насыщенность и стойкость производимой краски. В примере
рассматривается 6 различных факторов, влияние которых
оценивается с помощью плана 2^6.
Результаты эксперимента показали, что имеется три наиболее
важных фактора: Полисульфидный индекс, Время и Температура.
Эту информацию теперь можно использовать для более тонкой
настройки аппаратуры, что бы улучшить качество красителя.
Общие идеи
Пример 2: Максимизация выхода химической реакции. Выход
продукта многих химических реакций зависит от времени и
температуры. К сожалению, эти функции не линейны и не
монотонны. Другими словами, нельзя сказать: “чем больше
продолжительность реакции, тем больше выход” и “чем выше
температура, тем больше выход”.
Формально цель эксперимента

заключается в том, чтобы найти
оптимальное положение на
поверхности выхода, образованной
двумя переменными: временем и
температурой.
Общие идеи
Пример 3: Улучшение поверхностной однородности при
производстве кремниевых кристаллов. Производство надежных
микропроцессоров требует высоко отлаженного производственного
процесса. Отметим, что в данном примере одинаково, если не
более важно, контролировать как изменчивость некоторых
производственных характеристик, так и их средние значения.
Например, средняя толщина поверхностного слоя поликремниевой
подложки производственный процесс может быть отрегулирован
превосходно, однако, если изменчивость этого параметра велика, то
микрочипы будут недостаточно надежными. Не существует
теоретической модели, которые позволяла бы инженеру
предсказать, как эти факторы влияют на однородность поверхности
кристаллов. Следовательно, для оптимизации производственного
процесса нужно систематизировано проводить эксперименты на
различных уровнях факторов.
Что такое планирование эксперимента
n A B C yi Взвешивание трех тел по традиционной
1 – – –
схеме ("+" означает, что тело положено на
y1
весы, "–" указывает на отсутствие тела на
2 + – – y2 весах).
3 – + – y3
4 – – + y4
 2 ( вес А)   2 ( y2  y1 )  2 2 ( y )
n A B C yi
Взвешивание трех тел с использованием
1 – – – y1
планирования эксперимента.
2 + – – y2
 y1  y2  y3  y4  4 ( y )
2
 2 (вес А)   2     2 ( y) 3 – + – y3
 2  4
y4 4 – – +
Видно, что при новой схеме взвешивания дисперсия веса объектов
получается вдвое меньше, чем при традиционном методе взвешивания, хотя
в обоих случаях выполнялось по четыре опыта.

Построение линейной статической модели
объекта
Считаем, что входами объекта являются u1,…,um, а выходом y.
Уравнение линейной статической модели объекта имеет вид:
m u2 2
 0 1
y   0    j (u j  u j )
j 1 u2
u20
u2
Необходимо на основе эксперимента (на основе u1 u1
нескольких измерений входов и выхода объекта) 4 3
вычислить коэффициенты модели. u1
u10
Экспериментальные точки для входных координат зададим в
вершинах гиперпрямоугольника.
Интервалы покачивания относительно базовой точки задаются

экспериментатором, и они определяют область изучения объекта.
объекта
С целью унификации процедур построения планов, исследования их свойств, расчета
параметров и исследования качества модели осуществляется переход от размерных
входных переменных u1,…,um к безразмерным x1,…,xm.
0
uj uj u2 2
xj  , j  1, m 1
u j u2
u20
Точки плана в вершинах прямоугольника в новых u2
координатах оказываются в вершинах квадрата с u1 u1 3
4
единичными координатами. Центр плана переходит в u1
начало координат. u10
x2
n xo x1 x2 yi 2 1 1
1 + + + y1 1 x1
В итоге получается план: 1
2 + – + yi
3 + + – y3
4 1 3
4 + – – y4
объекта
m

В новых безразмерных координатах x1,…,xm линейная y  0    j x j
модель также сохраняет линейный вид: j 1
j
0   0 ,  j   j u j , j  1, m  0  0 ,  j  , j  1, m
u j
n m
2 2
Параметры βi модели рассчитаем по I  y  ( yi  0    j x ji )  min
критерию наименьших квадратов : i 1 j 1
Предполагая, что измерения выхода некоррелированные и равноточные получаем

систему линейных алгебраических уравнений:
m
2 2
y  ( xk , x j ) j   y ( xk , y ), k  0, 1,  , m
j 0
n n
j 
( x j , y) ( x j , y)
 ( x k , x j )   x ki x ji , ( x k , y )   x ki yi
(xj, xj ) n i 1 i 1
Крутое восхождение по поверхности
отклика
В планировании эксперимента поверхностью отклика называют уравнение связи
выхода объекта с его входами.
В 1951 году Бокс и Уилсон предложили использовать последовательный "шаговый"

метод движения к экстремуму выхода объекта.
Коэффициенты αi линейной модели являются

u2 оценками составляющих градиента:
0
(u )
ai  ; i  1, m
U i
Далее движение осуществляется по поверхности
отклика в направлении оценки градиента
1 0 
u1 u  u  k , где k - величина шага.
Полный факторный эксперимент
Полным факторным экспериментом
называется эксперимент, в котором n x1 x2 x3 x4 yi
реализуются все возможные сочетания 21 1     y1
уровней факторов. Если число факторов 2     y2
равно m, а число уровней каждого фактора 3     y3
равно p. то имеем полный факторный 22 4     y4
эксперимент типа pm. 5     y5
6     y6
7     y7
При построении линейной модели объекта 23 8     y8
9     y9
используется полный факторный
10     y10
эксперимент типа 2 m. Условия 11     y11
эксперимента записываются в таблицы, в 12     y12
4
которых строки соответствуют различным 2 13     y13
опытам, а столбцы – значениям факторов. 14     y14
Такие таблицы называются матрицами 15     y15
планирования эксперимента. 16     y16
Полный факторный эксперимент
С использованием ортогонального плана первого порядка

можно определять не только коэффициенты βi, но и
коэффициенты βij перед факторами взаимодействия xixj (i≠j)
Например, при m=2 можно рассчитать и коэффициенты

модели:
 n x0 x1 x2 x1x2 yi
y  0  1x1  2 x2  12 x1 x2 1 + + + + y1
2 + – + – y2
3 + + – – y3
4 + – – + y4
Дробные реплики
При большом числе входов объекта полный факторный эксперимент 2m
содержит большое число экспериментов. Можно этот план разбивать на блоки
(дробные реплики) с сохранением ортогональности плана. При этом по
меньшему числу точек определяются (также независимо друг от друга) все
коэффициенты линейной модели.
n x1 x2 x3 X4=x1x2
1 + + + +
Чтобы получить дробную реплику, необходимо
2 – + + –
за основу взять полный факторный эксперимент
(например 23) и в качестве новой переменной 3 + – + –
взять один из столбцов (например x4), 4 – – + +
соответствующий фактору взаимодействия 5 + + – –
(например x4=x1x2). Для данного примера 6 – + – +
дробная реплика обозначается как 24-1. 7 + – – +
8 – – – –
Определяющий контраст (или определяющие контрасты, когда их несколько)

позволяет установить разрешающую способность дробной реплики.
Разрешающая способность будет максимальной, если линейные эффекты будут
смешаны с эффектами взаимодействия наибольшего возможного порядка.
Насыщенные планы. Симплекс
Иногда исследователь ставит цель получения линейного уравнения модели
по планам, содержащим минимум точек (количество точек равно числу
коэффициентов). Такие планы называют насыщенными.
Ортогональный план проводится в вершинах правильного симплекса.
Правильным симплексом называется выпуклая правильная фигура в
многомерном пространстве, число вершин которой превышает размерность
этого пространства на единицу.
x1 x2 x1 x2 x3
x1  3a a 
   1 1 1
 1   3a a    1 1  1
  0  2a    4
 1   1 1  1

1
 x
  1 1 1
3
x2
( 3a; a) ( 3a; a )
x 2 1 x
 3 x1
1 0 1 1
2 x2
3 (0;2a )
Эти планы центральные и ортогональные.
Насыщенные планы. Симплекс
Один из общих способов построения планов:
x1 x2 x3  xm
 a1 a2 a3  am 
 
  a1 a2 a3  am 
 0  2a2 a3  am 
 
 0 0  3a3  am 
      
 
 0 0 0   mam 
Насыщенные планы.
Планы Плаккета – Бермана
Плаккет и Берман в 1946 г. предложили способ построения насыщенных планов (с
единичными координатами) при m=11, 19, 23, 27, 31, 35, 39, 43, 47, 51, 55, 59, 63, 67,
71, ... .
Задаются базовые строки. Каждая следующая строка матрицы планирования

образуется из исходной циклическим сдвигом вправо. Получается матрица размером
m x m. Последняя (m+1) -я строка матрицы планирования состоит из минус единиц.
Пример базисных строк:
m n Строка
11 12 ++–+++–––+–
19 20 ++––+++–+–+––––++–
23 24 +++++–+–++––++––+–+––––
31 32 ––––+–+–+++–++–––+++++––++–+––+
35 36 –+–+++–––+++++–+++––+––––+–+–++––+–
Разбиение матрицы планирования на
блоки
При проведении эксперимента выход объекта дрейфует. Если этот
дрейф кусочно-постоянный, то его можно нейтрализовать, изменяя
порядок проведения эксперимента во времени. Для этого разбивают
матрицу планирования на блоки и последовательно реализуют (во
времени) эту матрицу: вначале один блок, затем другой и т. д.
В качестве примера рассмотрим ортогональный план 23 . Считаем,

что выход объекта имеет аддитивный дрейф на величину Δ1 (когда
проводятся эксперименты с номерами 1, 2, 3, 4) и на величину Δ2
(когда проводятся эксперименты № 5, 6, 7, 8). Этот дрейф приводит к
смещению на величину (4Δ1-4 Δ2)/8 параметра β3.
блоки
Пример эксперимента в котором выход объекта дрейфует.
n x1 x2 x3 xдр=x1x2x3 yi Номер блока
1 + + + + y1=y1ист+Δ1 1
2 – + + – y2=y2ист+Δ1 2
3 + – + – y3=y3ист+Δ1 2
4 – – + + y4=y4ист+Δ1 1
5 + + – – y5=y5ист+Δ2 2
6 – + – + y6=y6ист+Δ2 1
7 + – – + y7=y7ист+Δ2 1
8 – – – – y8=y8ист+Δ2 2
блоки
Для устранения этого недостатка изменим порядок проведения
эксперимента, разбив план на 2 блока.
n x1 x2 x3 xдр yi Номер блока
1 + + + + y1=y1ист+Δ1
2 – – + + y2=y2ист+Δ1 Блок 1
3 – + – + y3=y3ист+Δ1
4 + – – + y4=y4ист+Δ1
5 – + + – y5=y5ист+Δ2
6 + – + – y6=y6ист+Δ2 Блок 2
7 + + – – y7=y7ист+Δ2
8 – – – – y8=y8ист+Δ2
Обработка результатов эксперимента
1. Проверка однородности дисперсий. Если при реализации
ортогонального плана остается неизвестным, на самом ли деле дисперсии
выходов (ошибок измерения) одинаковы в каждой точке плана, то необходимо
в каждой точке плана осуществить несколько дополнительных измерений
выхода, найти оценку дисперсии (в каждой точке) и проверить гипотезу о
равенстве дисперсий.
Проверка однородности дисперсий производится с помощью различных
статистик. Простейшей из них является статистика Фишера, представляющая
собой отношение наибольшей из оценок к наименьшей:
2
 max
F  2
 min
n
Так же можно выполнить проверку с 2 2
использованием статистики Кочрена:
Gmax  max /   j
j 1
2. Проверка адекватности модели. Вычисляем остаточную сумму квадратов , делим
ее на число степеней свободы n-m-1 и получаем остаточную дисперсию (дисперсию
адекватности):
2 1 n
 2
ад   i i)
( y  y
n  m  1 i 1
На основе дополнительного эксперимента объема n0 в одной из точек плана (например
в центре плана) строим оценку для дисперсии выхода объекта. Число степеней
свободы для оценки n0 -1. По статистике Фишера проверяем гипотезу о равенстве
дисперсий, которая совпадает с гипотезой об адекватности модели.
2 2
F  ад /  y
Если статистика не превосходит порогового значения, то принимается гипотеза об
адекватности модели. В противоположном случае эта гипотеза отвергается. Надо
заново строить модель, например, усложняя ее за счет введения дополнительных
факторов, либо отказываться от линейной модели и переходить к квадратичной
модели.
3. Проверка значимости коэффициентов заключается в
проверке гипотезы H: bj = 0 для каждого j=1,…,m.
Вычисляется статистика Стьюдента:
j
t 
y / n
Если |t|<c, где с – пороговое значения из таблицы Стьюдента, то

принимается гипотеза о том, что коэффициент модели βj
незначимо отличается от нуля. В этом случае данный член
модели можно опустить, но после этого упрощения модели ее
надо проверить на адекватность.
4. Интерпретация модели. Производится качественное
сопоставление поведения полученной модели с реальными
процессами объекта. При этом привлекается информация от экспертов
(например технологов), детально изучивших объект. Знак
коэффициентов βj , линейной модели показывает характер влияния
входа объекта на выход. Знак "+" свидетельствует о том, что с
увеличением входа (фактора) растет величина выхода объекта и
наоборот. Величина коэффициентов βj – количественная мера этого
влияния.
Если характер связи между входами и выходом объекта на основе

построенной модели не соответствует реальным связям (на базе
информации от экспертов) в объекте, то такую модель надо
поставить под сомнение либо полностью отказаться от нее.
Ортогональное планирование второго
порядка
Построение планов второго порядка – задача в математическом отношении
значительно более сложная, чем в случае построения планов первого
порядка. Модель второго порядка при m=3 имеет вид:

y  0  1 x1   2 x2   3 x3  12 x1 x2   23 x2 x3  13 x1 x3  11 x12   22 x22  33 x33
Для вычисления коэффициентов модели второго порядка необходимо

варьировать переменные не менее чем на трех уровнях. Это вызывает
необходимость постановки большого числа опытов. Полный факторный
эксперимент содержит 3m точек.
m 1 2 3 4 5 6 7
m
3 3 9 27 81 243 729 2187
Композиционный план n0=1 5 9 15 25 43 77 143

порядка
В 1951 году Бокс и Уилсон предложили составлять композиционные планы. Число
точек плана равно величине n=n1+2m+n0 . Здесь n1– число точек полного факторного
эксперимента или дробной реплики 2m – число парных точек, расположенных на осях
координат; n0 – число опытов в центре плана.
x2 x3 Точки на осях координат называют звездными

* точками. Их количество равно удвоенному
*
  * числу факторов. Расстояние от центра плана
* * x1 * * x1 до звездной точки одинаково. Его обозначают
 *
буквой α и называют звездным плечом.
*
* x2
Композиционные планы имеют следующие положительные свойства:
1. Они могут быть получены в результате достройки планов первого порядка.
2. Дополнительные точки на осях координат и в центре плана не нарушают
ортогональности для столбцов, соответствующих факторам xj и эффектам
взаимодействия xixj .
порядка
Пример композиционного плана:
1 n 2
n x0 x1 x2 x1x2 x1 2 x2 2 x1’ x 2’ xl  xl2   xli  xl2  xl2
n i 1
1 + + + + + + ◊ ◊
2 + – + – + + ◊ ◊ С учетом новых переменных xl’
3 + + – – + + ◊ ◊ получаем следующее уравнение модели
4 + – – + + + ◊ ◊ (для случая m=2):
5 + α 0 0 α2 0 Δ □  2 2
y  0  1x1  2 x2  12 x1x2  11 ( x1  x1 )  22 ( x2  x2 ) 
6 + -α 0 0 α2 0 Δ □
2 2
7 + 0 α 0 0 α 2 □ Δ  0  11 x1  22 x2  1 x1  2 x2  12 x1x2  11 x1  22 x2 
8 + 0 -α 0 0 α2 □ Δ  0  1 x1   2 x2  12 x1 x2  11 x1   22 x2

9 + 0 0 0 0 0 □ □
Ротатабельное планирование
Если эта дисперсия одинакова на равном удалении от центра

плана, то такой план называется ротатабельным.
Ортогональный план первого порядка является

ротатабельным.
Построение ротатабельного плана второго порядка из

симплексных планов:
x2
x1
Метод случайного баланса
Часто влияние факторов на выходную координату объекта имеет затухающий
экспоненциальный вид:
y
В 1956 году Сатерзвайт предложил метод
100 % случайного баланса для отсеивания небольшого
80 %
числа значимых факторов на шумовом поле.
60 %
Метод базируется на постановке экспериментов
40 %
по плану, содержащему координаты точек,
20 %
выбранных случайным образом.
0
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Построение матрицы планирования осуществляют следующим образом. Все

факторы разбивают на группы. Затем для каждой группы строят матрицы
планирования, беря за основу полный факторный эксперимент или дробные
реплики. План проведения эксперимента образуется путем случайного смешивания
строк соответствующих базовых планов (для групп факторов). Полученный план
реализуется на объекте, и результаты анализируются с помощью диаграмм
рассеяния.
Метод случайного баланса
y
Пример: 29
28
n x1 x2 x1x2 y y1 27
26
3  2 0
1 + + + 24 27 25
2 – + – 27 27 24
  
x2
3 + – – 26 29
 
4 – – + 29 29 x1 x2 x1
Каждая из диаграмм содержит точки, соответствующие результатам эксперимента.

Эти точки разбиты на две группы. Одна из них соответствует тем опытам, когда
исследуемый фактор находился на нижнем уровне, вторая – тем опытам, когда
фактор находился на верхнем уровне. Для каждой из групп находятся оценки
медианы и вычисляется их разность (из оценки медианы правой группы вычитается
оценка медианы левой).
Разность между оценками медиан количественно оценивает линейное влияние

фактора на выход объекта.
ВОПРОСЫ ?
80
МЕТОДЫ
НЕПАРАМЕТРИЧЕСКОЙ
ОБРАБОТКИ
ИНФОРМАЦИИ
81
Оценивание функционалов
Необходимо по выборке x1,…,xn случайной величины X найти оценку
функционала

   ( x, f ( x ), )  f ( x )dx

Рассмотрим некоторые примеры функционалов:

m   xf ( x )dx  M { X } – математическое ожидание.


   ( x  m) 2 f ( x )dx  M {( X  m ) 2 } – дисперсия.
2


H ( X )    (log f ( x)) f ( x)dx – приведенная энтропия.

Оценивание функционалов
Схема построения оценки Фn следующая. Вначале строится оценка для
плотности вероятности fn(x), а затем она подставляется в функционал.
Основным свойством оценки Фn(x1,…,xn) является ее состоятельность. Оценка Фn
функционала Ф называется состоятельной, если:
p
 n   lim P{|  n   |  }  0
n 
Требование состоятельности определяет практическую пригодность оценок, ибо в

противоположном случае (при несостоятельности оценок) увеличение объема
исходной выборки не будет приближать оценку к "истинной" величине. По этой
причине свойство состоятельности должно проверяться в первую очередь.
Оценка Фn параметра Ф называется несмещенной, если:
M { n }  
Она является асимптотически несмещенной, если:
M { n } n 

Простейшие оценки функции
и плотности распределения вероятности
По упорядоченной независимой выборке x1,…,xn случайной величины X
построим оценку Fn(x) для функции распределения:
F ( x )  P{ X  x}
m  число исходов, благоприятствующих событию { X  x} 1 n
Fn ( x )   1( x  xi )
n  общее число опытов n i 1
1, z  0,
где 1(z) – единичная функция: 1( z )  
0, z  0.
Fn ( x )
1
1 1 n
1 n
n
1
1 n

1 n
1 n
0 n
x
x1 x2 x3 x4  xn2 xn1 xn
Так как плотность распределения f(x) связана с функцией распределения F(x)
через линейный оператор дифференцирования :
dF ( x )
f ( x) 
dx
Можно получить оценку для плотности распределения :
dFn ( x ) 1 n d 1 n
f n ( x)    1( x  xi )    ( x  xi )
dx n i 1 dx n i 1
Здесь δ(x-xi) – дельта-функция Дирака. Она имеет "игольчатый" ("гребенчатый") вид:
уходит до ∞ в точке xi , а при остальных значениях аргумента x равна нулю и обладает
свойствами:
xi  
1)  ( x  x )dx  1
xi  
i
- площадь под дельта функцией единичная.
селектирующее свойство дельта-функции позволяет
x 
i
легко выполнять интегрирование. Интеграл
2)  ( x )( x  xi )dx  ( xi )
x 
i
оказывается равным подынтегральному выражению,
стоящему перед дельта-функцией, в особой точке.
Первое свойство показывает, что, несмотря на экзотическое поведение дельта-
функции, площадь под ней единичная.
Второе селектирующее свойство дельта-функции позволяет легко выполнять

интегрирование. Интеграл оказывается равным подынтегральному выражению,
стоящему перед дельта-функцией, в особой точке.
f n ( x)

x
x1 x2 x3 x4  xn2 xn1 xn
Оценка плотности распределения является несмещенной, но несостоятельной. В явном
виде её использовать нельзя. Ею удобно пользоваться при вычислении оценок
моментов (математического ожидания, дисперсии и др.) для случайной величины или
для аналитической функции случайной величины. Получаемые оценки являются
состоятельными и часто несмещенными.
Многомерный случай:
 1 n p
Fn ( x )  Fn ( x1 ,  , x p )    1( x j  x ji )
n i 1 j 1
 1 n p
f n ( x )  f n ( x1 ,  , x p )     ( x j  x ji )
n i 1 j 1
Кратные измерения. При кратных измерениях значение x1 повторяется k1 раз, x2 – k2
раз,…, xm – km раз, при этом k1+…+km = n.
m k Fn ( x )
Fn ( x)   i 1( x  xi ) k m 1 k m
i 1 n 1 km2 n n
n
m ki
f n ( x)    ( x  xi ) k2
k3
i 1 n k1 n

n
0n x
x1 x2 x3  xm  2 xm 1 xm
Полиграммы
Повысим степень гладкости оценки fn(x) по сравнению с простейшей оценкой
функции плотности. Для этого надо повысить соответственно степень гладкости для
оценки функции распределения Fn(x). Если Fn(x) будет состоять из отрезков прямых,
то fn(x) будет состоять из прямоугольников. Такая кусочно-постоянная оценка
называется полиграммой первого порядка.
Fn (x) f n (x)
1
 
1 1 1
n 1
n 1 n 1
x x
x1 x2 x3  xn1 xn x1 x2 x3  xn1 xn
Она строится на выборочных интервалах, ограниченных выборочными значениями

упорядоченной выборки x1,…,xn. Площадь каждого прямоугольника равна 1/(n-1)
1 n 1 1  x  xi  1, z [0; 1),

f n ( x)   I 0
  I0 ( z)  
z [0; 1).
n  1 i 1 xi 1  xi  xi 1  xi  0,
Полиграммы
Для улучшения сглаживающих свойств оценки плотности построены полиграммы
более высоких порядков:
fn(x)
a 1 1
1 n1 1 n1 1 1
n 1 n 1 
n 1 n 1
x
x1 x2 x3 x4 x5 x6 x7 
fn(x)
б 2 2
n 1 n 1 2

n 1
x
x1 x2 x3 x4 x5 x6 x7 
fn(x)
в 3 3
n 1 n 1 
x
x1 x2 x3 x4 x5 x6 x7 
Метод "К ближайших соседей"
Считаем, что для одномерной случайной величины X имеется n независимых
наблюдений x1,…,xn. Зафиксируем некоторое целое положительное число kn: 1 ≤ kn ≤
n. Для каждой выбранной точки x существует интервал длительностью 2p(kn,n,x)
который охватывает kn ближайших к x точек выборки. Одна точка попадает на
границу интервала, а kn-1 точка – внутрь интервала. Оценкой плотности
распределения вероятности fn(x) служит частота (kn-1)/n попадания в интервал 2p,
приведенная к единичной величине интервала:
(4, n, x) (4, n, x)
kn  1
f n ( x)  xi 2 xi 1 xi x xi 1 xi 2 xi 3
n2( k n , n, x )
(5, n, x) (5, n, x)
xi 2 xi 1 xi x xi 1 xi 2 xi 3
x2
kn  1 V (8, n, x )
f n ( x)  R8
nV ( k n , n, x )
x1
Оценка Розенблатта – Парзена
Плотность распределения вероятности связана с функцией распределения через
оператор дифференцирования:
F ( x  h )  F ( x  h)
f ( x )  dF ( x ) / dx f ( x) 
2h
1 n 1 n
Fn ( x  h)   1( x  h  xi ) Fn ( x  h)   1( x  h  xi )
n i 1 n i 1
1 n 1 n
n
 1( x  h  xi )  1( x  h  xi )
n 1 n 1 1( x  h  xi )  1( x  h  xi )
f n ( x)  i 1 i 1
 
n i 1 h 2
2h
1( x  h  xi )  1( x  h  xi )  x  xi 
 I 
2  h 
1 n 1  x  xi 
0.5, | z | 1, f n ( x)   I  
I ( z)   n i 1 h  h 
0, 1 | z | .
Степень гладкости оценки плотности зависит от степени гладкости ядра. Заменим в
оценке fn(x) прямоугольное ядро I(z) на произвольное K(z) и получим:
1 n 1  x  xi 
fn ( x)   K  
n i 1 h  h 
Здесь h – коэффициент размытости ядра. Примеры треугольного, параболического и

кубического ядер приведены ниже:
1 K ( z)
1 | z |, | z | 1,
K ( z)   s1
 0, 1 | z |; z
1 0 1
0.75 (1  z 2 ), | z | 1, 1 K ( z)
K ( z)  
1 | z |; s 1
 0, z
1 0 1
1 K ( z)
(1  2 | z |)(1 | z |) 2 , | z |  1,
K ( z)   s1
1 | z | . z
 0, 1 0 1
1 n 1  x1  x1i  1  xm  xmi  1 n m 1  x j  x ji 

f n ( x1 , , xm )   K   K   K
n i 1 hx  hx  hx    
1 1 m  hxm  n i 1 j 1 hx  hx
j j 
Оценка условной плотности вероятности
Рассматриваем объект, имеющий случайный вход (либо
несколько входов) X и выход Y. Связь между случайными
величинами характеризуют условные характеристики, например,
условная плотность распределения вероятности f(x|y).
f ( y| x )  f ( x , y ) / f ( x )
1 n 1  x  xi  1  y  yi 
 K  K  
n i 1 hx  hx  hy  hy  n  x  xi  1  y  yi 
f n ( y| x )   N 
K  K  
1 n 1  x  xj   
i 1  hx  hy  hy 
 K 
n i 1 hx  hx 
 x  xi   x  xi  n
 x  xj 
K N    K    K  
 hx   hx  j 1  hx 
Оценка регрессии
Регрессией называют первый начальный условный момент

M {Y | x}   y f ( y | x )dy  ( x )

Это некоторая усредненная количественная зависимость между выходом и

входом объекта. Регрессия (4.7.1) удовлетворяет квадратичному критерию
I  M {(Y  y * ) 2 | x}  min
y*
Получим оценку регрессии:

 n
 x  xi   n
 x  xi  n
M {Y | x}  n ( x )   K N    y ( y  y i )dy   KN   yi   i ( x ) yi
i 1  h   i 1  h  i 1
 x  xi   x  xi  n  x  xj 
KN 
 h 
  K
 h 
  K    i ( x)
j 1  h 
Подбор оптимального параметра коэффициента размытости для оценки
регрессии. Перейдем от размерного параметра с к безразмерному β.
 x  xi 
K  
1  x  xi    
  c n 1/ 5
i ( x )  K N  
  
 n
 x  xj 
 K 
 

j 1 
При β=0 ядро K(·) не зависит от x.
 x  xi 
K   n (x)
 x  xi     3/ 4 1
i ( x )  K N    n  n  , i  1, n y4
    x  xj  3 /4 n
 K    y3
j 1    j 1
y5
y2
Оценка регрессии равна среднему арифметическому y1 , y6
выборочных значений выхода объекта для любых x. x
x1 x2 x3 x4 x5 x6
1 n
n ( x )   y i
n i 1
Возьмем теперь другое крайнее состояние для β: β=1. Оценка регрессии
проходит через экспериментальные точки и состоит из кусков линий,
соединяющих точки выборки.
n (x)
y4
y3
y5
y2 n (x)
y1 , y6
y4
x
x1 x2 x3 x4 x5 x6 y3
y5
y2
Оптимальный параметр β лежит y , y
1 6
в интервале [0; 1].
x
x1 x2 x3 x4 x5 x6
Рекуррентный расчет оценки регрессии. Для каждого
фиксированного x на основе использования рекуррентной
схемы расчета получаем алгоритм адаптивного сглаживания:
n ( x )  Bn / Dn
m
1  xl  xln 
Bn  Bn 1   K  yn
l 1 hx ( n )
 h (n) 
l  x l 
m 1  xl  xln 
Dn  Dn 1   K 
l 1 hxl ( n)
 hx ( n) 
 l 
q
hxl (n)  cxl n , q  1 /(m  4), n  1, 2,  , B0  D0  0
Инверсная модель. Для объекта с одним входом X и одним
выходом Y основной инверсной характеристикой является
регрессия

M { X | y}   xf ( x | y )dx

n  y  yi   y  yi   y  yi  n  y  yj 
f ( x | y )   K N  ( x  xi ), KN    K   K  
  h   h  j 1  hy

i 1
 hy   y   y  
и получаем оценку инверсной регрессии:

 n  y  yi 
M { X | y}   K N   xi
 h 
i 1  y 
Робастные оценки регрессии
В реальной ситуации исходные экспериментальные данные xi, yi могут
содержать аномальные измерения, называемые выбросами. Даже наличие
малого процента выбросов приводит к сильному искажению оценок. Поставим
задачу построения оценки регрессии, которая была бы более устойчивая
(малочувствительная, робастная (в переводе с английского "крепкая") к
выбросам по отношению к ранее построенной оценке:
n
 x  xi 
n ( x )   K N   yi
i 1  h 
Кроме математического ожидания случайной величины Y есть другая
характеристика среднего положения – медиана. Медиана – это среднее по
вероятности значение. Состоятельная оценка медианы представляет собой
среднее по номеру значение в упорядоченной выборке:

m2  y3
y1 y 2 y 3 y 4 y5
Запишем критериальную форму получения оценки:
n

I 2   | yi  m2 | min

i 1 m2
n 1
I 21   ( yi  m
 21 ) 2 0
 min
i 1 | yi  m
2 | m 21
dI 21 n 1
1
 2  ( y i  m
 1
2 ) 0
0
dm 2 i 1 | yi  m 2 |
1 n   0 1 n
 0 1 
m2   | yi  m2 |  | y j  m2 |  yi
i 1  j 1 
 l 1 n   l 1 n
 l 1 
m2   | yi  m2 |  | y j  m2 |  yi , l  0, 1, 2, 
i 1  j 1 
| m2l 1  m2l | 
Модульный критерий не является единственным для получения робастных
оценок. Более общий критерий имеет вид :
n
 ( x  xi ) 
I ( x )   F ( yi   ) K    min
i 1  h  
F (v) v 2 2 , | v | a;
Некоторые виды функций F(v): F (v )   2
v a 2 , a | v |
F(v) a 0 a
F ( v ) | v |
F(v)
v | v |, | v| a;
0 F (v )  
v a, a  | v|
a 0 a
F(v)
v 2 2 , | v | a;
F (v )   F (v)
v  a | v |  a 2
2 , a | v | F ( v ) | v| p ,1  p  2
a 0 a
0
v
Адаптивное управление при
априорной неопределенности
Адаптацией природа наделила все живое. Она представляет собой
приспособление к различным изменениям. Эти изменения происходят как
внутри живого организма, так и во внешней среде.
Свойством адаптации человек наделил и созданные им устройства.

Управление в этих устройствах осуществляется таким образом, чтобы как
можно быстрее и лучше нейтрализовать влияние непредвиденных изменений
или приспособиться к ним.
1
 
ИУ
u y
Объект
ИУ
2
Управляющее y
устройство

y*
ВОПРОСЫ ?
104
ДИСПЕРСИОННЫЙ
АНАЛИЗ
105
Постановка проблемы
Дисперсионный анализ является статистическим
методом анализа результатов наблюдений,
зависящих от различных одновременно действующих
факторов, с целью выбора наиболее значимых
факторов и оценки их влияния на исследуемый
процесс.
Методами дисперсионного анализа устанавливается

наличие влияния заданного фактора на изучаемый
процесс (на выходную переменную процесса) за счёт
статистической обработки наблюдаемой
совокупности выборочных данных.
Однофакторный дисперсионный анализ
Предположим, что анализируется влияние на
случайную величину X фактора A, изучаемого на k
уровнях (A1, A2,…, Ak). На каждом уровне Ai
проведены n наблюдений (xi1, xi2,…,xin) случайной
Номер Уровни фактора A
величины X. наблюдения
A1 A2 … Ai … Ak
Расположим
1 x11 x21 … xi1 … xk1
эксперимен-
2 x12 x22 … xi2 … xk2
тальные
…. … … … … … …
данные в
j x1j x2j … xij … xkj
виде таблицы
… … … … … … …
n x1n X2n … xin … xkn
Рассмотрим оценки различных дисперсий, возникающие при анализе
таблицы результатов наблюдений. Для оценки дисперсии,
характеризующей изменение данных на уровне Ai (по строкам таблицы),
имеем:
2 1 n
2 1  n
2 1 n  
2
Si   ( xij  xi )    xij    xij  .

n  1 j 1 n  1  j 1 n  j 1  
 
Из предпосылок дисперсионного анализа следует, что должно иметь место
равенство всех дисперсий. При выполнении этого условия находим оценку
дисперсии, характеризующей рассеяние значений xij вне влияния фактора
A, по формуле:
1 k
1 k n
1  k n
1 k  n  
2
S 0   Si 
2 2
 2
( xij  xi )   xij     xij  
2
k i 1 k ( n  1) i 1 j 1 k ( n  1)  i 1 j 1 n i 1  j 1  
 
Для упрощения вычислений приведем алгоритм их выполнения.
Вычисляем последовательно суммы:
k n 2
2 1 k
2 1  k

Q1    xij Q2   X i Q3    X i 
i 1 j 1 n i 1 kn  i 1 
2 Q1  Q2 Q2  Q3
S0  2
SA 
k (n  1) k 1
2 2
Сравниваем S A и S0 устанавливаем наличие влияния фактора A.
k (n  1) Q2  Q3
Если  F [k  1; k (n  1)] , то влияние A – значимо.
k  1 Q1  Q2
Двухфакторный дисперсионный анализ
Рассмотренный ранее однофакторный дисперси-
онный анализ обладает информативностью, не
большей, чем методы множественного сравнения
средних. Информативность дисперсионного анализа
возрастает при одновременном изучении влияния
нескольких факторов.
Рассмотрим случай, когда анализируется влияние

одновременно двух факторов A и B.
Пусть результаты эксперимента представлены
таблицей:
Уровни фактора A
B/А A1 A2 … Ai … Ak Σ
B1 x11 x21 … xi1 … xk1 X1’
B2 x12 x22 … xi2 … xk2 X2’
…. … … … … … … …
Bj x1j x2j … xij … xkj Xj’
… … … … … … … …
Bm x1n X2n … xin … xkn X m’
Σ X1 X2 … Xi … Xn
Дисперсионный анализ для двухфакторных таблиц
проводится в следующей последовательности.
Вычисляются суммы:
2 2
k m
1 k 2 1 m 2 1  k
 1  k 
Q3   X j
2
Q1    xij Q2   X i Q4    Xi     X / 
i 1 j 1 m i 1 k j 1 mk  i 1  mk  j 1 j 
Далее находятся оценки дисперсий:

2 Q1  Q4  Q2  Q3 2 Q2  Q4 2 Q3  Q4
S0  SA  SB 
(k  1)(m  1) k 1 m 1
2
SA
Если 2
 F ( f1 , f 2 ) , то влияние фактора A признается значимым.
S0
S B2
Если 2
 F ( f1 , f 2 ) , то влияние фактора B признается значимым.
S0
Приведенный анализ предполагает независимость факторов A и B. Если они
зависимы, то взаимодействие факторов C=AB также является фактором,
которому соответствует своя дисперсия. Для того чтобы выделить такое
взаимодействие, необходимы параллельные наблюдения в каждой клетке
таблицы, т.е. при каждом сочетании факторов A и B на уровнях Ai и Bj
соответственно необходимо не одно наблюдение, а серия наблюдений.
Для оценки влияния взаимодействия факторов AB вычисляем
дополнительную сумму: k m n
Q5   xijv
2
i 1 j 1 v 1
Далее анализ проводится, как и ранее, с той лишь разницей, что в клетках
таблицы вместо отдельных значений используется их средние значения.
Вычисляется оценка дисперсии и проверяется значимость взаимодействия
факторов:
2
2 Q5  nQ1 nS0
S AB   F ( f1 , f 2 ) f1  (k  1)(m  1) f 2  mk (n  1)
mk (n  1) 2
S AB
Планирование эксперимента при
дисперсионном анализе
Дисперсионный анализ тесно связан с соответствующим
планированием эксперимента. Удачно спланированный эксперимент,
выявляя все необходимые эффекты, оказывается всегда либо более
точным, либо менее трудоемким по сравнению с непродуманным
экспериментом.
Если на результат эксперимента действуют одновременно несколько
факторов, то наилучший эффект дает одновременный дисперсионный
анализ всех этих факторов (многофакторный анализ).
Методы дисперсионного анализа позволяют исследовать и такой

случай, когда некоторые сочетания уровней пропущены. Такой
эксперимент называется дробным факторным экспериментом (ДФЭ).
Планирование при ДФЭ приобретает особо важную роль, ибо
пропущенные сочетания уровней не так-то просто нейтрализовать.
Планирование эксперимента
при дисперсионном анализе
Такие способы планирования существуют и притом не
единственные; согласно Фишеру их называют латинскими
квадратами. Эти расположения приводятся в специальных
справочниках; для примера приведен один вид такого квадрата:
A1 A2 … Ak-1 Ak
B1 C1 C2 … Ck-1 Ck
B2 C2 C3 … Ck C1
… … … … … …
Bk-1 Ck-1 Ck … Ck-3 Ck-2
Bk Ck C1 … Ck-2 Ck-1
Схема расчетов для латинского квадрата очень k k
2
Q1    xij
похожа на обычный двухфакторный анализ: i 1 j 1
Находим сумму квадратов по столбцам, 1 k 2

Q2   X i
деленную на число наблюдений в столбце: k i 1
Находим сумму квадратов итогов по строкам, Q  1  k

X  2
3 j
деленную на число наблюдений в строке: k j  1
2
Находим квадрат общего итога, деленный на 1 k 
2
1  k 
Q4  2   X i   2   X j 
число всех наблюдений: k  i 1  k  j 1 
Находим сумму квадратов итогов по уровням 1 k 2

Q5   Y
фактора C, деленную на число уровней: k  1
Перейдем теперь к вычислению и оценке значимости дисперсий:
Q1  2Q4  Q2  Q3  Q5
S02 
( k  1)( k  2)
2 Q2  Q 4 2 Q  Q4
SA  , SB  3
k 1 k 1
2 2 2 2
S A  S0 2 S  S0 2
Если отличие будет значимым, то  A, B  B
k k
2 Q5  Q4
SC 
k 1
2 2
SC  S0 2
Если отличие будет значимым, то  C
k
ВОПРОСЫ ?
118
АНАЛИЗ ТРЕНДОВ
И ВРЕМЕННЫХ
РЯДОВ
119
Введение
Временные ряды отличаются от обычных данных об
одном временном срезе в том отношении, что в случае
временных рядов сама последовательность
наблюдений несет в себе важную информацию.
Теперь чтобы охарактеризовать совокупность данных в

целом, уже недостаточно знать лишь типичное
значение этих данных (среднее значение) или даже
изменчивость этой совокупности данных (дисперсия). В
этом случае желательно знать, что, скорее всего,
произойдет дальше. НУЖЕН ПРОГНОЗ!
Введение
ПРИМЕР. Чтобы составить бюджет на следующий
квартал, требуется достоверная оценка ожидаемого
объема продаж. Этот прогноз послужит основой для
прогнозирования других показателей бюджета
(возможно, с помощью регрессионного анализа).
Проанализировав временной ряд фактических
квартальных объемов продажи за последние несколько
лет, можно выдать прогноз, который будет
представлять собой наиболее достоверную оценку,
базирующуюся на общих тенденциях продаж, с учетом
любых сезонных колебаний спроса.
Анализ трендов и сезонности
Анализ трендов и сезонности представляет собой
непосредственный, интуитивный подход к оцениванию
четырех базовых компонентов помесячных или
поквартальных временных рядов: долгосрочный тренд
(тенденция), сезонность, циклическая вариация и
нерегулярный компонент.
Базовая модель временного ряда представляет числа
в этом ряде в виде произведения, получаемого путем
умножения перечисленных компонентов.
Данные = Тренд  Сезонность  Цикличность  Нерегулярность

Тренд и циклический компонент: скользящее
среднее
Скользящее среднее представляет собой новый ряд,

полученный путем усреднения соседних наблюдений
временного ряда и перехода к следующему периоду
времени – в итоге получается более гладкий ряд.
Скользящее среднее = Тренд  Цикличность

Сезонный индекс: среднее значение отношения к
скользящему среднему отражает сезонное
поведение
Чтобы выделить сезонное поведение, прежде всего,
следует получить отношение исходных значений к
скользящему среднему. Полученный результат будет
включать сезонный и нерегулярный компоненты,
поскольку скользящее среднее исключает из данных
тренд и циклический компонент.
Данные
 Сезонность  Нерегулярность =
Скользящее среднее
Затем, чтобы устранить нерегулярный компонент, надо
усреднить эти значения для каждого сезона. Сезонный
компонент проявляется, поскольку он присутствует
ежегодно, тогда как нерегулярный компонент, как
правило, удается усреднить.
 Данные 
Сезонный индекс = Среднее значение  
*
 скользящее среднее 
* - за соответствующий сезон
Поправка на сезон: деление ряда на сезонный индекс.
Поправка на сезонные колебания устраняет из
результатов измерения ожидаемый сезонный
компонент (путем деления ряда на сезонный индекс
для соответствующего периода), что позволяет нам
непосредственно сравнивать один квартал или месяц с
другим (после внесения поправки на сезон), выявляя
те или иные скрытые тенденции.
 Данные 
Значение с поправкой на сезон    
 Сезонный индекс 
 Тренд  Цикличность  Нерегулярн ость
Долгосрочный тренд и прогноз с поправкой на
сезонные колебания: линия регрессии
Когда временной ряд демонстрирует долгосрочную

линейную тенденцию к нарастанию или снижению, для
оценки этой тенденции и прогнозирования будущего
можно воспользоваться регрессионным анализом.
Прогноз: тренд с учетом сезонности
Чтобы прогнозировать будущее, надо учесть

сезонность в долгосрочном тренде, вернув ему
ожидаемую сезонную вариацию. Для этого достаточно
умножить значение тренда на значение сезонного
индекса для того периода времени, который вы
прогнозируете. Этот процесс является обратным по
отношению к внесению поправки на сезонные
колебания. Результирующий прогноз включает
долгосрочный тренд и сезонную вариацию.
Моделирование циклического поведения с
помощью ARIMA-процессов Бокса-Дженкинса
АRIМА-процессы Бокса-Дженкинса представляют собой
семейство линейных статистических моделей, основанных на
нормальном распределении, которые позволяют имитировать
поведение множества различных реальных временных рядов
путем комбинирования процессов авторегрессии, процессов
интегрирования и процессов скользящего среднего.
ARIMA - сокращение от Autoregressive Integrated Moving Average

Процесс случайного шума не обладает памятью:
отправная точка
Процесс случайного шума состоит Yt     t

из случайной выборки (независимых
наблюдений) из нормального
распределения с постоянным средним
и стандартным отклонением. Какие-
либо тенденции (тренды) в этом
случае отсутствуют, поскольку – по
причине независимости - наблюдения
не помнят о прошлом поведении ряда.
Процесс авторегрессии (AR) обладает памятью о своем
прошлом
Любое наблюдение процесса

авторегрессии (часть "AR" названия Yt    Yt 1  t
ARIMA) представляет собой линейную
функцию от предыдущего наблюдения
плюс случайный шум. Таким образом,
процесс авторегрессии помнит о
своем предыдущем состоянии и
использует эту информацию для
определения своего дальнейшего
поведения.
Процесс скользящего среднего (МА) имеет
ограниченную память
Любое наблюдение процесса скользящего

среднего состоит из константы, Yt    t   t 1
(долгосрочное среднее значение процесса),
плюс независимый случайный шум минус
часть предыдущего случайного шума.
Процесс скользящего среднего не помнит в
точности своего прошлого, но помнит
компонент случайного шума того состояния, в
котором он (процесс) находился. Таким
образом, его память ограничена одним шагом
в будущее; за пределами этого шага для
процесса все начинается заново.
Процесс авторегрессии и скользящего среднего
(ARMA) сочетает в себе AR и МА
Любое наблюдение процесса авторегрессии и

скользящего среднего состоит из линейной Yt    Yt 1  t   t 1
функции от предыдущего наблюдения плюс
независимый случайный шум минус
некоторая доля предыдущего случайного
шума. Процесс авторегрессии и скользящего
среднего запоминает как свое предыдущее
состояние, так и компонент случайного шума
предыдущего состояния. Таким образом, его
память сочетает в себе память процесса
авторегрессии с памятью процесса
скользящего среднего.
Чистый интегрированный (I) процесс помнит, где он
находился, и затем движется случайно
Каждое наблюдение чистого

Yt    Yt 1  t
интегрированного (I) процесса (pure
integrated (I) process), называемого
также случайным блужданием,
заключается в случайном шаге в
сторону от текущего наблюдения.
Этот процесс знает, где он находится,
но забыл, как он попал туда.
Процесс авторегрессионного интегрированного
скользящего среднего (ARIMA) помнит свои изменения
Yt  Yt 1     (Yt 1  Yt  2 )  t   t 1
Процесс состоит из линейной функции
предыдущего изменения плюс
независимый случайный шум минус
определенная доля предыдущего
случайного шума. Этот процесс знает,
где он находится, помнит, как он
попал в это состояние, и помнит даже
часть предыдущего шумового
компонента.
ВОПРОСЫ ?
137
ИДЕНТИФИКАЦИЯ
СТАТИЧЕСКИХ МОДЕЛЕЙ
ОБЪЕКТОВ
138
Общие понятия
Идентификация – это процесс построения моделей объектов различной
природы. Теория идентификации имеет в своем арсенале достаточно
эффективные методы и алгоритмы, на базе которых разработаны и широко
используются программные комплексы.
Процесс идентификации складывается из двух взаимосвязанных этапов:
идентификации структуры моделей и идентификации параметров в моделях
выбранной структуры. При построении структуры модели (или набора
конкурирующих либо взаимодополняющих структур) используется априорная
информация об объекте. Для каждого класса объектов формируются банки
структур с сопутствующей информацией.
Модели делятся на статические и динамические. Первые из них описывают

объекты в стационарных режимах их работы. Динамические модели
описывают переходные процессы в объектах, например, возникающие при
переходе с одного стационарного режима работы объекта на другой.
Постановка задачи подстройки
параметров нелинейных моделей
u Объект
*
  (u , a)  
Модель   (u , )
Считаем, что выход объекта состоит из полезного сигнала η(u, a) и

центрированной помехи ξ.
Сигнальная часть выхода представляет собой известную функцию от входа с
неизвестными параметрами a. В структуру функции η(u, a) . Все, что не
удается описать в объекте, относят к помехе.
Модель объекта берем в виде функции η(u, α). Основная задача теперь
сводится к расчету параметров α модели.
Алгоритмы расчета будем строить, используя критерий наименьших
квадратов и близкие к нему критерии, например наименьших модулей
невязок. В зависимости от свойств помехи критерий наименьших квадратов
приобретает различные формы – от простейшей до самой общей.
Критерий наименьших квадратов
Считаем, что в каждый момент времени ti (момент измерения входа и
выхода объекта) помехи ξi, являются центрированными случайными
величинами с дисперсиями σi2. Если дисперсии различны, то измерения
называются неравноточными.
Тогда критерий наименьших квадратов имеет вид:
n
1 *
I   2 ( i  i ) 2  min, i  (ui , )
i 1  i

При равноточных измерениях весовые коэффициенты 1/σi2, характеризующие

информативность измерений, одинаковы. Тогда критерий имеет вид:
1 n
I 2

 i i  min
( 
i 1
*
  ) 2

Критерий наименьших квадратов
Если все помехи ξi коррелированны, т. е:
 12 k12 k1n   1 
   
K     M {T },   , K 1  (cij )
 2  
k k 
 n1 n 2 n   n
то критерий наименьших квадратов базируется на элементах cij матрицы,
обратной корреляционной:
n n
I ( )   ( *i  i )cij ( *j   j )  min

i 1 j 1
Это общая форма критерия. Она включает в себя (при соответствующих

упрощениях) все предыдущие формы. Запишем критерий в матричной форме.
 1*   (u1 , )   1   1 
       
H *   , H ( )    
    ,    
 *  (u , )      
 n   n   n  n
I ( )  ( H *  H ( ))T K 1 ( H *  H ( ))  min


Метод наименьших квадратов
при линейной параметризации модели
Модель объекта задана в виде линейной комбинации известных
(базисных) функций φ1(u),…, φm(u):
 1   1 (u ) 
m    
(u, )    j (u ) j   (u )   (u ),
T T
   
 ,  ( u )    
j 1     (u ) 
 m  m 
  T (u1 )   T (u1 )   1 (u1 )  2 (u1 )   m (u1 ) 

     
H ( )                
 T   T    (u )  (u )   (u ) 
  ( u n )     ( u )
n   1 n 2 n m n 
Параметры α находим по критерию наименьших квадратов:
I ( )  ( H *   ) T K 1 ( H *   )  min

Метод наименьших квадратов
при линейной параметризации модели
Пример расчета параметров:
*

 (u ,  )  c D( u ,  )
(u , )  c D(u , )
*
1 (u , )  1   2 (u  u )
u
u1 u
Метод последовательной линеаризации
при подстройке параметров на основе критерия
наименьших квадратов
Построим итерационную процедуру расчета параметров α модели
в соответствии с критерием наименьших квадратов. Так как функционал квадратичный,
то первая стадия метода не реализуется и на каждой итерации используется только
линейная аппроксимация выхода модели по параметрам:
dH (  l ) l 1
H ( )  H (  ) 
l
  l 1     l
d
dH ( l ) l 1 T 1 * dH ( l ) l 1
I (  )  ( H  H (  ) 
l 1 * l
 ) K ( H  H (  ) 
l
 )  min
d d l 1

Необходимое условие минимума приводит к системе линейных алгебраических

уравнений:
 dH  T 1 dH  l 1  dH  T 1 *
     K ( H  H (  ))
l
  K
  d  d   d 
 l 1   l   l  l 1 , l  0, 1, 2, 
Робастные оценки параметров
Параметры модели (которые являются оценками параметров объекта),
полученные на основе критерия наименьших квадратов, сильно реагируют на
выбросы помех. Аномальные отклонения в измерениях очень редки, но
амплитуда их велика.
n
I 1 ( )   i   | min
| *

i 1
Так же существуют другие критерии вида:
n
I ( )   pi1( ei )  min, ei  *i  (ui , )

i 1
Примеры функции ψ(e): a б в
(e) (e) (e)
  0.8
e e e
0 0  0 
Простейший адаптивный алгоритм
подстройки параметров
Линейная параметризация модели: (u, )  T (u )
На каждой итерации, например n и n-1, параметры модели находим из условия
равенства выходов модели и объекта:
*n  T (un ) n , *n 1  T (un 1 ) n 1
Каждому уравнению в пространстве параметров соответствует своя линия
2 ||  n ||2  min
n
n ( *n  T (un ) n 1 )
n 1  n   n1  (un )   n 1  (*n  T (un ) n 1 )( T (un )) 
 (un )(un )
T
 n 1
n
n    a  T ( u n )
a 1 n   ( u n ) ( u n )
 n   n 1  n 1 (  n   n 1 ), n  1, 2, ... .
Простейший адаптивный алгоритм
подстройки параметров
Нелинейная модель: На каждом шаге линеаризуем модель и
приращения параметров отыскиваем из равенства выхода
модели и линеаризованной модели:
  (u n ,  n 1 )   (u n ,  n 1 )  n
*
n
T

В итоге получаем алгоритм перестройки параметров

нелинейной модели:
( *n  (un , n 1 ))
 n   n 1  T   (un , n 1 )
  (un , n 1 )  (un , n 1 )
ВОПРОСЫ ?
149
ИДЕНТИФИКАЦИЯ И
АДАПТИВНОЕ УПРАВЛЕНИЕ
ДИНАМИЧЕСКИМИ
ОБЪЕКТАМИ
150
Дискретные динамические модели
стохастических объектов
В динамическом режиме поведение объектов описывается различными
динамическими уравнениями: обыкновенными дифференциальными,
интегральными, интегродифференциальными уравнениями; уравнениями с
запаздываниями; уравнениями в частных производных и их дискретными
аналогами. С целью упрощения будем рассматривать наиболее простые
дискретные модели. Последние выбраны именно потому, что получаемые
алгоритмы идентификации и управления напрямую реализуемы на цифровой
вычислительной технике (мини-,микро-ЭВМ, микропроцессоры).
Дискретные модели привязаны к номерам дискретных моментов времени и

поэтому основным аргументом для входных u(t) и выходных x(t), y(t)
переменных является номер дискреты t = 0, 1, 2,…
Например:
x (t )  Ax (t  1)  Bu(t  1), t  1, 2, ..., x (0)  x0
x (t )  f ( x (t  1), u (t  1),(t  1), ), t  1, 2, ..., x (0)  x0

Считаем, что объект описывается дискретным уравнением:
x (t )  ax (t  1)  bu(t  1)  e(t )  ce(t  1), t  1, 2, ... .
Модель имеет вид:
  
y (t )  ax(t  1)  b u (t  1)  с ( x(t  1)  y (t  1))
e( t ) q c  (t )
u( t ) q b   x (t )
a q
Если объект имеет вид:
x (t )  ax (t  1)  b(u(t  1)  e(t  1))
То оптимальная модель имеет вид:
 
y (t )  ay (t  1)  b u(t  1), t  1, 2, ... .
e( t )
u( t )  q b  x (t )
a q
Подстройка параметров
с использованием функций чувствительности
Для примера рассмотрим модель:
  
y (t | (t ))  a (t ) x (t  1)  b (t )u(t  1)  c (t )[ x (t  1)  y (t  1 | (t ))]
  
Построим алгоритм расчета параметров: (t )  ( a (t ), b (t ), c (t ))
T
Линеаризуем модель относительно параметров α(t-1) , вычисленных в

предыдущий момент времени:
  
y (t | (t ))  y (t | (t  1))  a (t ) a (t )  b (t ) b (t )  c (t ) c (t )  y (t | (t  1))  T (t ) (t )
Здесь y(t|α(t-1)) – выход модели в момент времени t при значениях
параметров, полученных в предыдущий момент времени t-1
  
y (t | (t  1))  a (t  1) x (t  1)  b (t  1)u(t  1)  c (t  1)[ x (t  1)  y (t  1 | (t  1))]
ω(t) – вектор-столбец функций чувствительности выхода модели к

параметрам модели.
Подстройка параметров
с использованием функций чувствительности
Функции чувствительности удовлетворяют уравнениям чувствительности:

a (t )  c (t  1)a (t  1)  x (t  1), a (0)  0

b (t )   c (t  1)b (t  1)  u (t  1), b (0)  0

c (t )  c (t  1)c (t  1)  ( x(t  1)  y (t  1 (t  1))), c (0)  0
Каждое уравнение чувствительности получается дифференцированием
уравнения модели по соответствующему параметру.
Для расчета параметров α(t) можно использовать, например, простейший
адаптивный алгоритм:
(t )( x (t )  y (t ( (t  1))

(t )  (t  1) 
T (t )(t )
Применение простейшего адаптивного
алгоритма
Рассчитаем параметры линейных и нелинейных динамических моделей на
основе простейшего адаптивного алгоритма.
(t )( x (t )  y (t ( (t  1))
(t )  (t  1) 
T (t )(t )
Пример: Рассмотрим модель без обратной связи:
n m 

y (t )   ai x (t  i )   b j u (t  j )
i 1 j 1
Функциями чувствительности выхода модели к ее параметрам являются

измеренные значения выхода и входа объекта:
a i (t )  x (t  i ), i  1, n, b j (t )  u(t  j ), j  1, m

алгоритма
В каждый текущий момент времени t на основе измерений x(t);
x(t-1), u(t-1); x(t-2), u(t-2) параметры корректируем по простейшему
адаптивному алгоритму:
  x (t )  y (t | (t  1))
ai (t )  ai (t  1)  n m
x (t  i ); i  1, n
2 2
 ai
  ( t )   b (t )

j
i 1 j 1
  x (t )  y (t | (t  1))
b j (t )  b j (t  1)  n m
u(t  j ); j  1, m
2 2
 ai
  ( t )   b (t )

j
i 1 j 1
n m 

y (t | (t  1)   ai (t  1)x (t  i )   b j (t  1)u (t  j )
i 1 j 1
алгоритма
Рассмотрим нелинейную модель без обратной связи:
y (t )  f ( x (t  1), u (t  1), 1 ,  2 )
Получаем следующие выход модели и функции чувствительности:

y (t | (t  1)  f ( x (t  1), u (t  1), 1 (t  1),  2 (t  1))
 f ( x (t  1), u(t  1), 1 (t  1),  2 (t  1))

1 (t ) 
1
 f ( x (t  1), u (t  1), 1 (t  1),  2 (t  1))
 2 ( t ) 
 2
Алгоритм перестройки параметров:
x (t )  y (t | (t  1))
1 (t )  1 (t  1)  1 (t )
1 (t )   2 (t )
2 2
x (t )  y (t | (t  1))
 2 (t )   2 (t  1)   2 ( t )
1 (t )   2 (t )
2 2
Адаптивные системы обработки
информации
В адаптивных системах обработки информации и управления
происходит приспособление к изменяющимся условиям и
неизвестным характеристикам объекта.
 z  z
u Объект x x u Объект x x
управления управления
Регулятор
Синтезируемый
фиксированной
регулятор
структуры
 x*  x*
Блок перестройки
Блок перестройки
параметров
параметров модели
регулятора
Устройство управления Устройство управления

Постановка задачи адаптивного
управления
Рассматриваем адаптивную систему с идентификацией (АСИ). Синтезируем алгоритм
расчета управления (алгоритм работы устройства управления) u(t) в каждый текущий
момент времени t. Исходными экспериментальными данными о входе и выходе
объекта.
Необходимо рассчитать управляющее воздействие u(t) , обеспечивающее достижение
следующей цели: наименьшего уклонения выхода системы x от заданной траектории x*
в каждый текущий момент времени.
Считаем, что поведение объекта в динамическом режиме описывается разностным

уравнением:
x(t )  f ( x(t  1), u (t  1), a )   (t ), t  1, 2, 

Обозначим через y(k|α(t)) выход модели в момент времени k при значении вектора
параметров α(t), вычисленных в момент времени. Если шум – белый, то
y ( k | (t ))  f ( x ( k  1), u( k  1), (t ))

Примеры синтеза устройств управления
для простейших линейных систем
Пример 1. Считаем, что объект описывается уравнением:
x(t )  x(t  1)  u (t  1)  h(t  1) h(t )
Формируем модель объекта:
q
y (k | (t ))  x (k  1)  u( k  1)  (t ) u(t ) q u(t  1) 
x (t )
Находим параметры: x(t 1) q
(t )  x (t )  x (t  1)  u(t  1) Объект
x* (t  1)
Из локального квадратичного критерия оптимальности v (t )  
I (u )  ( y (t  1 | (t ))  x (t  1)) 
* 2 
min
u1 ( t )  u ( t )  u2 ( t )
(t )
q
Рассчитываем оптимальное управление:  

u1 (t ), если v(t )  u1 (t ),
q
Устройство x(t 1)
 управления
u (t )  v(t ), если u1 (t )  v(t )  u 2 (t ),
u (t ), если u (t )  v(t ).
 2 2
Примеры синтеза устройств управления
для простейших линейных систем
Пример 2. Объект описывается уравнением:
x (t )  a0  a1 x ( t  1)  a2 u(t  1)  e( t )
Модель объекта:
y ( k | (t ))   0 (t )  1 (t ) x ( k  1)   2 (t )u( k  1)
Параметры:
x (t )  y (t | (t  1))
 0 (t )   0 (t  1)    0 (t  1)   (t )
1  x (t  1)  u (t  1)
2 2
1 (t )  1 (t  1)   (t ) x (t  1)
 2 (t )   2 (t  1)  (t )u(t  1)
Находим управляющее воздействие :
v (t )   21 (t )( x * | t  1)   0 (t )  1 (t ) x (t ))
Синтез алгоритмов управления для
линейных систем
n m
Объект: x (t )  a0   ai x (t  i )   a n  j u (t  j )  e(t )
i 1 j 1
e(t )
u (t ) q x (t )
an1        
q a0 1 q
an2 a1
 
q q
an  m an
x* (t 1)
1
 n 1       
   1  
q 0 1
 n2 

q q
 n m n
Идентификатор
Алгоритмы адаптивного управления
для нелинейных систем
Объект описывается нелинейным разностным уравнением:
x (t )  f ( x (t  1), u(t  1), a, t  1)  e(t ), t  1, 2, ... .
e(t ) e(t )
u(t ) x (t )
u(t ) q f ()  x (t ) q  
a q
q
x* (t 1)

v(t ) x* (t 1)
f 1
() 
(t ) 
q q
Идентификатор

Управление динамическими системами
с чистыми запаздываниями
Рассматриваем объект, описываемый разностным уравнением:
x (t )  f ( x (t  1), u(t  1  ), a )  e(t ), t  1, 2, ....
Строим модель объекта:
y ( k | (t ))  f ( x ( k  1), u ( k  1  ), (t ))
Выход модели находим из критерия наименьших квадратов:

I (u )  ( y (t  1   | (t ))  x * (t  1  )) 2  min
u1  u ( t )  u2
Решение получается в форме

u1, если v(t )  u1,

u (t )  v(t ), если u1  v(t )  u2 ,
u , если u  v(t ),
 2 2
Управление динамическими системами
с чистыми запаздываниями
Пример: на примере гальванической ванны
x (t ), x* ,   5 одного из заводов при однопроцентном уровне
80 o помех приведены входная и выходная
переменные замкнутой системы управления, а
60 o
также кусочно-постоянный заданный
40 o температурный режим x*(t). В начальный момент
температура ванны равна 20 С. На первых
20 o
0 20 40 60 80 100 t двадцати тактах происходит основная
u(t ) [0;100] настройка параметров модели, хотя и далее
100 алгоритм коррекции параметров продолжает
непрерывно работать. Если в объекте
50
произойдут какие-либо изменения, то
идентификатор отследит их. После основной
коррекции параметров алгоритм управления
0
0 20 40 60 80 100 t обеспечивает перевод системы на новый
уровень стабилизации за минимальное время и
без перерегулирования.
ВОПРОСЫ ?
167

Методы обработки экспериментальных данных

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Методы обработки экспериментальных данных

Загружено:

Авторское право:

Доступные форматы

Методы обработки

Ее НЕОБХОДИМО обрабатывать для принятия

Существует множество мат. пакетов: MatLab, Statistica,

НЕОБХОДИМО ЗНАТЬ И ПОНИМАТЬ КАК И ЧТО

Двумерные наборы данных содержат информацию о двух

Наборы многомерных данных содержат информацию о трех

Планирование и сбор Поиск в Специальные

ПРИМЕРЫ: анкетные данные, систолическое давление

Для этого придуманы описательные или дескриптивные

Минимум и максимум — это минимальное и максимальное

Среднее — сумма значений переменной, деленная на n (число

Дисперсия и стандартное отклонение — наиболее часто

Медиана дает общее представление о том, где сосредоточены значения

Мода представляет собой максимально часто встречающееся значение

А так же есть еще множество других статистик: квартили, коэффициент

Законы распределения случайных величин

Mathcad – программное средство, среда для выполнения на

STATISTICA – это универсальная интегрированная система,

Рассматриваем m классов (полную группу несовместных случайных событий) и

По формуле Байеса вычисляем апостериорные вероятности для всех

Выносим решение об истинности того класса (с номером ), для которого

Для простоты считаем, что имеются два информативных признака X и Y.

Выносим решение об истинности того класса (с номером ), для которого

f ( x|1) P (1) f ( x|2) P (2)

Одномерный случай Двумерный случай

По обучающей выборке доопределяются и априорные вероятности:

Вариант 1. Восстанавливается решающая функция.

Вариант 2. По обучающей выборке восстанавливаются условные плотности

 1, если истинным является класс 1,

Розенблат: нейронная сеть рассмотренной

Целью планирования эксперимента

Выход объекта состоит из неизвестного сигнала

Обычно основная цель научного исследования состоит в том,

В условиях промышленного эксперимента основная цель

Обычно любая машина или станок, используемый на

Формально цель эксперимента

в обоих случаях выполнялось по четыре опыта.

Интервалы покачивания относительно базовой точки задаются

Предполагая, что измерения выхода некоррелированные и равноточные получаем

В 1951 году Бокс и Уилсон предложили использовать последовательный "шаговый"

Коэффициенты αi линейной модели являются

С использованием ортогонального плана первого порядка

Например, при m=2 можно рассчитать и коэффициенты

Определяющий контраст (или определяющие контрасты, когда их несколько)

Один из общих способов построения планов:

Задаются базовые строки. Каждая следующая строка матрицы планирования

Пример базисных строк:

В качестве примера рассмотрим ортогональный план 23 . Считаем,

Если |t|<c, где с – пороговое значения из таблицы Стьюдента, то

Если характер связи между входами и выходом объекта на основе

Для вычисления коэффициентов модели второго порядка необходимо

Композиционный план n0=1 5 9 15 25 43 77 143

x2 x3 Точки на осях координат называют звездными

8 + 0 -α 0 0 α2 □ Δ  0  1 x1   2 x2  12 x1 x2  11 x1   22 x2

Если эта дисперсия одинакова на равном удалении от центра

Ортогональный план первого порядка является

Построение ротатабельного плана второго порядка из

Построение матрицы планирования осуществляют следующим образом. Все

Каждая из диаграмм содержит точки, соответствующие результатам эксперимента.

Разность между оценками медиан количественно оценивает линейное влияние

Рассмотрим некоторые примеры функционалов:

Требование состоятельности определяет практическую пригодность оценок, ибо в

Оценка Фn параметра Ф называется несмещенной, если:

Второе селектирующее свойство дельта-функции позволяет легко выполнять