Вы находитесь на странице: 1из 50

ТЕМА 1.

 ДИСПЕРСИОННЫЙ 
АНАЛИЗ
(ОБОБЩЕННАЯ ПРОВЕРКА 
ГИПОТЕЗ)

Безруков А.В.
РЭУ им. Г.В. Плеханова
Кафедра статистики
к.э.н., доцент
Дисперсионный анализ (ANOVA; 
ANalysis Of VAriance), задает общую 
схему проверки статистических гипотез, 
основанную на тщательном изучении 
различных источников вариации в 
сложной ситуации.
ПРИМЕРЫ:
Пример 1. На производстве в целях сокращения 
расходов использовалось пять методов оптимизации 
производства, допустим, пять различных 
технологий. Процесс производства запускался 
десять раз с каждой из технологий и десять раз без 
технологий. Полученные данные представляют 
собой шесть списков значений объема продукции. 
Необходимо проверить гипотезу о том, 
действительно ли эти шесть списков объема 
продукции одинаковы, или различия между ними 
неслучайны. 
Проверку по t­критерию в данном случае использовать 
нельзя, поскольку речь идет о более чем двух выборках 
(по t­критерию сравниваются две средние).

 Вместо этого применяется однофакторный 
дисперсионный анализ, чтобы выяснить, есть ли 
какие­либо значимые (систематические, или 
неслучайные) различия между разными технологиями 
производства. Если такие различия имеются, то можно 
продолжить подробное их изучение; в противоположном 
случае можно сделать вывод, что фиксируемых 
систематических различий между технологиями нет.
Пример 2. 

Можно использовать комбинацию технологий. Таким 
образом, при наличии пяти техонлогий возможно 2^5 
= 32 комбинации (включение и отсутствие 
технологии), причем для каждой комбинации процесс 
необходимо будет запустить дважды. 

Это многоуровневый  (2­х) дисперсионный анализ 
с 5­ю факторами (технологиями) и двумя уровнями 
(используется, либо не используется). По полученному 
набору данных можно выяснить, а) влияет ли каждая 
технология на объем продукции; и б) существуют ли 
взаимодействия влияния технологий в комбинации.
Пример 3. 
Как часть маркетингового исследования, было проверено три вида 
средств массовой информации (газета, радио, телевидение) в 
сочетании с двумя видами рекламных объявлений (прямой метод 
и косвенный). Каждому испытуемому была продемонстрирована 
одна комбинация, после чего был подсчитан результат в баллах, 
отражающий эффективность рекламы. 

Это пример двухфакторного плана (факторы это «вид средства 
массовой информации» и «рекламное объявление»). 

Дисперсионный анализ в этом случае позволит выяснить:
 а) существенно ли различаются виды средств массовой 
информации по эффективности; и 
б) существует ли взаимосвязь между видом средства массовой 
информации и типом рекламного объявления. (элементы 
ковариационного анализа)
Для проверки каждой из гипотез в дисперсионном 
анализе используют F­тест, или проверку 
гипотез по F­критерию Фишера, который 
представляет собой отношение двух дисперсий. 

Числитель в этом отношении представляет собой 
вариацию, обусловленную конкретным 
интересующим нас эффектом, который мы 
проверяем; знаменатель — вариацию, 
обусловленную случайностью. Если F расчетное 
больше табличного, рассматриваемый эффект 
значим. 
Условиями для проведения дисперсионного 
анализа являются:
1. нормальность распределений;
2. равенство вариации.
ОДНОФАКТОРНЫЙ 
ДИСПЕРСИОННЫЙ АНАЛИЗ
Однофакторный дисперсионный анализ используют 
для проверки значимости различий между собой значений 
средних, характеризующих различные ситуации.
 
При первичном (разведывательном) анализе данных одним 
из наиболее эффективных методов является оценка 
блочных диаграмм, что позволяет сравнить сразу 
несколько распределений. 
Это позволяет увидеть структуру данных, определить 
возможные проблемы (если они есть), и проверить 
начальные условия, необходимые для проведения 
дисперсионного анализа (нормальность распределений и 
равенство вариации). Также используются гистограммы.
БЛОЧНАЯ ДИАГРАММА
(BOX AND WHISKERS PLOT)

Xmin Нижний  Медиан Верхний  Xmax


квартиль а квартиль

Вместо  абсолютного  минимума  и  максимума  на 


блочных  диаграммах  иногда  изображают  не 
являющиеся  «выбросами»  минимум  и  максимум,  а 
«выбросы»  (outliers)  отмечаются  за  пределами  «усов» 
другим обозначением.
ПРИМЕР БЛОЧНОЙ ДИАГРАММЫ
ПО 3­М ВЫБОРКАМ
95

90

85

80 Q3 box
Me box
75 bottom

70

65
Richter Vostok Subsonic
ВОПРОСЫ, КОТОРЫЕ 
ЦЕЛЕСООБРАЗНО ПРОЯСНИТЬ:
1. насколько разумными и обоснованными выглядят 
представленные на блочной диаграмме данные? (числа слишком 
большие/маленькие, устаревшие данные, выбросы (которые 
нужно изучить особо, поскольку они могут представлять 
ошибки;...и т.д)

2. Отличаются ли между собой центры блоков (медианы) в 
диаграмме? Диаграммы дают только первичную, неформальную, 
оценку; точный ответ позволяет дать только проведение 
дисперсионного анализа. Существуют ли какие­либо особенности в 
центрах блоков?

3. Постоянна ли (в разумных пределах) вариация, отраженная в 
разных блоках диаграммы? Это важно, поскольку дисперсионный 
анализ предполагает равенство дисперсий в генеральной 
совокупности. Если, например, некоторые блоки систематически 
шире (т. е. демонстрируют большую вариацию), то дисперсионный 
анализ может дать неверные результаты.
Исходные данные для однофакторного дисперсионного 
анализа представляют собой k независимых одномерных 
выборок, элементы которых измерены в одинаковых 
единицах:
 
Однофакторный дисперсионный анализ 
сравнивает два следующих источника 
вариации:
1) межгрупповая вариация (между выборками);

2) внутригрупповая вариация (внутри каждой 
выборки).
УСЛОВИЯ ДЛЯ КОРРЕКТНОГО 
ПРИМЕНЕНИЯ ОДНОФАКТОРНОГО 
ДИСПЕРСИОННОГО АНАЛИЗА:
1. Набор данных состоит из k случайных выборок, 
извлеченных из k генеральных совокупностей;
2. Каждая генеральная совокупность подчиняется 
нормальному закону распределения, и стандартные 
отклонения во всех генеральных совокупностях 
одинаковы, т. е. s1=s2=s3=...=sk
3. При этом нулевая гипотеза утверждает, что между 
генеральными совокупностями нет различий, а 
альтернативная гипотеза утверждает, что некоторые 
различия имеют место:

(все средние равны между собой);

       по крайней мере для одной пары генеральных 

совокупностей (не все средние равны между собой).
Общее (главное) среднее рассчитывается как 
средняя арифметическая взвешенная между 
средними значениями всех выборок:

(такой же результат дает и расчет средней 
между всеми значениями по всем выборкам, 
если исходные данные не были 
сгруппированы)
Межгрупповая (межвыборочная) дисперсия 
позволяет в данном случае получить оценку 
различий выборочных средних:

X 
k
2
i  X  ni
δ2 = i=1

k 1

, где число степеней свободы u1=k­1, означает, что 
измеряется вариация k средних; одна степень 
свободы вычитается, поскольку это оценка общего 
среднего, которая известна. 
Средняя из внутригрупповых дисперсий дает оценку вариации 
(или неоднородности) каждой из выборок, и показывает, насколько 
неоднородна каждая выборка. 
Средняя из внутригрупповых дисперсий рассчитывается по формуле:

; число степеней свободы u2=n­k

(Средняя из внутригрупповых дисперсий равна 0, если каждая 
выборка состоит из своих многократно повторенных средних, и тем 
больше, чем сильнее различаются числа в выборке. Квадратный 
корень из этого значения дает оценку стандартных отклонений для 
генеральных совокупностей. )

Число степеней свободы n­k означает, что измеряется вариация n 
значений относительно k выборочных средних; k вычитается, 
поскольку оценки этих выборочных средних известны.
F­критерий Фишера, или F­статистика, 
представляет собой отношение этих двух 
значений вариации и показывает меру 
различия выборочных средних (числитель) по 
отношению к общему уровню вариации 
выборок (знаменатель):
Таблица значений F­критерия (F­распределение Фишера­
Снедекора) содержит критические значения для 
распределения F­критерия для количества степеней 
свободы u1 и u2. 
Если значение Fрасч > Fтабл , то проверка значима, а нулевая 
гипотеза справедлива лишь в контролируемом числе 
случаев (процент значимости; например, 5%).

Замечание: F­тест определяет только наличие или 
отсутствие различий. Если F­тест фиксирует значимость 
различий, то затем проводится проверка наименьшего 
значимого различия для сравнения каждой пары 
выборок, чтобы определить, значимо ли они 
различаются между собой по t­критерию Стьюдента. 
Такое парное сравнение выборок по t­критерию Стьюдента 
основывается на следующих показателях:

1) средней разности между двумя сравниваемыми группами,
2) стандартной ошибке этой разницы 
 

, где n  и n  — размеры двух сравниваемых выборок, и


i j

3) количестве степеней свободы n­k.

Проверка по t­критерию проводится либо с помощью 
доверительного интервала (попадает ли в него значение 
«0» (ноль); т.е. разницы в средних отсутствуют), либо путем 
расчета значения t и сравнением с табличным.
Пример
Фирма закупает одинаковые электронные 
компоненты у трех разных поставщиков. Несмотря 
на утверждения, что такая организация позволяет 
устанавливать хорошие цены и обеспечивает 
короткое время доставки, необходима проверка, 
поскольку конструкция изделия может допускать 
ситуацию установки наихудших компонентов. 
Т.е., например, вопрос стоит так, будет ли лучше, 
если фирма заключит эксклюзивный контракт 
только с одним поставщиком, чтобы быстро 
получать высококачественные компоненты по 
повышенной цене?
Было проверено 20 случайно отобранных компонентов от каждого 
поставщика. В качестве подготовительной информации получен 
набор данных о случайно проверенных тех.контролем компонентах 
по каждому поставщику из последних поставок. Не все результаты 
измерений достаточно надежны. Качество оценивалось по балльной 
шкале от 0 до 100. Уровень качества выше 75 является достаточно 
приемлемым для включения в итоговое изделие. 
Получены следующие результаты: 
В среднем компания­поставщик «Subsonic» имеет самую 
высокую оценку качества (87,7), затем идет компания 
«Richter» (82,1) и, наконец, «Vostok» (80,7). 
Построенные блочные диаграммы выглядят следующим 
образом: 
АНАЛИЗ БЛОЧНОЙ 
ДИАГРАММЫ:
Блочная диаграмма показывает, что качество компонентов 
«Subsonic» в целом выше качества двух других поставщиков, 
хотя есть значительное перекрытие и компоненты высшего 
качества также поступают и от компании «Richter». (97)

Можно также сказать, что компонентов идеального качества в 
выборке нет (100); и что разные поставщики имеют схожую 
вариацию качества компонентов (размеры блоков).

Компания «Subsonic», таким образом, согласно предварительной 
оценке, имеет наивысшее качество продукции. Ставится вопрос, 
обусловлено ли это случайным отбором этих конкретных 
компонентов, т. е. останется ли этот поставщик в среднем 
наилучшим, если изучить выборки большего размера от всех 
поставщиков? 
Для выяснения этого используется дисперсионный анализ.
ОПРЕДЕЛЯЕМ ИСТОЧНИКИ 
ВАРИАЦИИ
Двумя источниками вариации будут являться: 
1) возможно различные уровни качества трех 
поставщиков;
2) возможно различные оценки качества разных 
компонентов, полученных от одного 
поставщика. 
 
F­тест будет основан на отношении величин этих 
источников вариации. 
ПРОВЕРКА НЕОБХОДИМЫХ 
ДОПУЩЕНИЙ

В данном примере имеются следующие допущения. 
Полученные данные представляют собой три 
случайные выборки. Более того, должно 
выполняться предположение, что для каждого 
поставщика распределение оценок качества является 
нормальным, и что все три поставщика имеют 
одинаковую вариацию оценок качества (стандартное 
отклонение генеральной совокупности). 
 
Анализ блочной диаграммы свидетельствует, что 
допущения относительно нормальных распределений 
и равенства вариации разумны и приблизительно 
удовлетворяются для имеющихся данных.
ФОРМУЛИРУЕМ ГИПОТЕЗЫ:
H0 (Нулевая гипотеза): все три поставщика 
имеют одинаковые характеристики качества; 
оценки качества производимых ими компонент 
имеют одинаковые распределния (одно и то же 
нормальное распределение, с одними и теми 
же средним и станд.отклонением)
 
H1 (Альтернативная гипотеза): некоторые 
поставщики различаются с точки зрения 
среднего уровня качества компонентов 
(различаются все три или качество двух 
одинаково, а третьего — выше или ниже)
Общий объем данных n = 18+21+19 = 58 
Общее среднее: 83,39 
Межгрупповая дисперсия = 269,08;
кол­во степеней свободы 1 = k­1 = 3­1 = 2

Средняя из внутригрупповых дисперсий = 45,63; 
кол­во степеней свободы 2 = n­k=58­3 = 55
 
F­критерий = 269,08 / 45,63 = 5,897.
 
Эта величина F означает, что межгрупповая вариация (обусловленная 
различиями поставщиков) в 5,897 раза больше внутригрупповой 
(обусловленной качеством компонентов каждого поставщика). Т.о., 
вариация между поставщиками в 5,897 раз больше, чем можно было бы 
ожидать, исходя только из вариации отдельных поставщиков. Чтобы 
выяснить, достаточно ли это много, необходимо сравнить полученное 
значение с табличным. 
Для числа степеней свободы 1 (для межгрупповой вариации)=2 и 
числа степеней свободы 2 (для внутригрупповой вариации)=55, и 
уровня значимости альфа = 5% Fтабл находится между 3,316 и 
3,150 (для числа степеней свободы 2 30 и 60 соответственно).

Для уровня значимости 1% значение по таблице находится между 
5,390 и 4,977. 
Таким образом, поставщики значимо различаются с точки зрения 
уровня качества компонентов (p < 0,05). 
 
Проверка на уровне 1% показывает, что различия между уровнями 
качества продукции разных поставщиков высоко значимы, более 
высоко, чем мы утверждали раньше (p < 0,01).
Поскольку результаты F­теста свидетельствуют о наличии 
значимых различий средних оценок качества продукции, можно 
сравнивать пары компаний.
ПАРНАЯ ПРОВЕРКА
«Richter» и «Vostok»:

Разность средних = 80,667 — 82,056 = – 1, 389. 
Стандартная ошибка = корень (45,63 * (1/21 + 1/18) = 2,170.
95% Доверительный интервал:
­1,389 — 1,96*2,17 = ­5,64 ; ­1,389 + 1.96*2.18 = 2.86

Значение t­критерия равно 1,389 / 2,170 = 0,640. (< 1,96 при 
уровне значимости 5%)
Т.о., компания «Vostok» имеет более низкую оценку качества, 
чем «Richter» на 1.389 пунктов, но эта разность не является 
статистически значимой.  С вероятностью 95% можно 
утверждать, что значение разности находится в пределах от 
­5,64 до 2,86. Ввиду того, что этот интервал включает 0, 
принимается нулевая гипотеза. 
ПАРНАЯ ПРОВЕРКА 
(ПРОДОЛЖЕНИЕ)
«Richter» и «Subsonic»:
разность средних = 5,628
станд.ошибка = 2,222
95% доверительный интервал – от 1,27 до 9,98
значение t­критерия = 2,533. 

«Vostok» и «Subsonic»:
разность средних = 7,017
станд. ошибка 2,139
95% доверительный интервал — от 2,82 до 11,21
t = 3,281

Таким образом, по результатам парного сравнения, поставщик 
«Subsonic» действительно имеет значимо более высокое 
качество продукции, чем «Richter» и «Vostok». 
Результат дисперсионного анализа позволил установить:

1. Есть значимые различия качества продукции поставщиков. 
F­тест свидетельствует, что средние значения уровней 
качества продукции этих трех поставщиков не одинаковы.

2. «Subsonic» имеет существенно более высокое качество  в 
сравнении с каждым из двух других поставщиков, на основе 
теста наименьшего значимого различия. 

3. Два других поставщика не имеют значимых различий с 
точки зрения среднего уровня качества продукции. 
Для того, чтобы любой из методов дисперсионного 
анализа можно было применить, данные должны 
состоять из нескольких выборок, представляющих 
результаты измерения в одних и тех же единицах, 
как и при обычном однофакторном дисперсионном 
анализе. 

Необходимо помнить, что таблица результатов 
дисперсионного анализа не раскрывает полностью 
всю картину; всегда необходимо смотреть на 
значения средних, чтобы понять, что действительно 
происходит.
КОВАРИАЦИОННЫЙ АНАЛИЗ 
(ANCOVA)
Существует  также ковариационный анализ (ANCOVA; 
Analysis Of COvariance), который объединяет 
регрессионный и дисперсионный анализ. Например, в 
дополнение к основным данным дисперсионного анализа 
может быть дополнительная важная количественная 
переменная. Вместо того, чтобы выполнять дисперсионный 
анализ, игнорируя эту дополнительную переменную, или 
выполнять регрессионный анализ, игнорируя группы, 
можно применить ковариационный анализ, который 
учитывает и то, и другое. 

Можно рассматривать ковариационный анализ либо с точки 
зрения отношений между отдельными регрессиями, 
построенными для каждой из выборок, либо с точки зрения 
дисперсионного анализа, который скорректирован с учетом 
различий, внесенных дополнительной переменной.
МНОГОМЕРНЫЙ 
ДИСПЕРСИОННЫЙ АНАЛИЗ 
(MANOVA)
Многомерный дисперсионный анализ (MANOVA, 
Multivariate ANalysis Of VAriance) используется, 
если имеется более одной количественной зависимой 
переменной, и необходимо оценить различия всех 
этих зависимых переменных между выборками. 

Если, например, имеется три количественных 
показателя готовой продукции (внешний вид, 
качество работы, уровень шума при работе), то 
можно применить многомерный дисперсионный 
анализ, чтобы посмотреть, значимо ли различаются 
эти величины под влиянием главного эффекта 
фактора смены (дневной, ночной, пересменки) и 
фактора поставщика.
ДВУХФАКТОРНЫЙ 
ДИСПЕРСИОННЫЙ АНАЛИЗ
Пусть от трех компаний поступают два вида 
компонент. Данные о результатах проверки 
качества изделий приведены в таблице:
Поставщик Richter Vostok Subsonic

Вид изделия
Turks 80 82 92

78 84 83

79 79 85

81 83 90

73 87 82
Barts 78 86 85

84 85 90

77 84 85

79 81 89

78 84 87
РЕЗУЛЬТАТЫ ПРОВЕРКИ
Дисперсионный анализ

Источник  P­
вариации SS df MS F Значение F критическое
6,53333 6,53333 0,72727
Выборка (A) 3 1 3 3 0,4022 4,259677
18,4675
Столбцы (B) 331,8 2 165,9 3 1,39E­05 3,402826
Взаимодействие  0,06666 0,03333 0,00371
(АxB) 7 2 3 1 0,996297 3,402826
8,98333
Внутри 215,6 24 3

Итого 554 29        
 Чтобы проанализировать эти результаты, 
сначала следует проверить, существует ли 
взаимодействие между факторами А (типами 
изделий) и В (поставщиками). Если эффект 
взаимодействия является значительным, 
дальнейший анализ ограничивается лишь 
оценкой этого эффекта. С другой стороны, 
если эффект взаимодействия незначителен, 
необходимо сосредоточиться на главных 
эффектах — потенциальных различиях 
между типами изделий (фактор А) и 
поставщиками (фактор В).
 Чтобы определить наличие эффекта взаимодействия 
при уровне значимости, равном 0,05, применяется 
следующее решающее правило: нулевая гипотеза об 
отсутствии эффекта взаимодействия отклоняется, 
если вычисленное значение F­статистики (см. 
таблицу Дисперсионный анализ, строку 
Взаимодействие столбец F на рис. 4), больше верхнего 
критического значения F­распределения (там же, 
столбец F­критическое). Поскольку F = 0,003 < FU = 
3,40, а р­значение равно 0,996, гипотеза Н0 не 
отклоняется. Следовательно, у нас недостаточно 
оснований утверждать, что факторы изделия и 
поставщика взаимодействуют друг с другом. 
Следовательно, необходимо проанализировать 
главные эффекты.
 При заданном уровне значимости, равном 0,05, в 
основе проверки разности между двумя изделиями 
(фактор А) лежит следующее решающее правило: 
нулевая гипотеза отклоняется, если вычисленное 
значение F­статистики больше верхнего 
критического значения F­распределения (см. 
таблицу Дисперсионный анализ, строку Выборка). 
Поскольку F = 0,72 < FU = 4,26, а р­значение равно 
0,40 и больше уровня значимости α = 0,05, гипотеза 
Н0 не отклоняется. Следовательно, у нас 
недостаточно оснований утверждать, что между 
качеством изделий разных видов существует 
значимая разница.
 При заданном уровне значимости, равном 0,05, в 
основе проверки разности между поставщиками 
(фактор В) лежит следующее решающее 
правило: нулевая гипотеза отклоняется, если 
вычисленное значение F­статистики больше 
верхнего критического значения F­
распределения (см. таблицу Дисперсионный 
анализ, строку Столбцы). Поскольку F = 18,47 > 
FU = 3,40, а р­значение равно 0,0000139 и меньше 
уровня значимости, гипотеза Н0 отклоняется. 
Следовательно, можно утверждать, что между 
качеством изделий, полученных от разных 
поставщиков, существует значимая разница.
ИНТЕРПРЕТАЦИЯ ЭФФЕКТОВ 
ВЗАИМОДЕЙСТВИЯ

 Чтобы лучше разобраться во взаимодействии факторов, следует 
построить график средних значений в ячейках (т.е. средних 
значений, соответствующих конкретным уровням факторов), как 
показано на рис (в качестве данных для построения графика 
использованы области «Среднее» из таблиц для каждого изделия). 
 Из графика средней прочности для каждой 
комбинации изделие–поставщик следует, что 
две линии, соответствующие разным 
изделиям, проходят почти параллельно друг 
другу. Это означает, что разности между 
средними величинами качества изделий 
практически одинаковы для всех трех 
поставщиков. Иначе говоря, между этими 
двумя факторами нет связи, что полностью 
подтверждается F­критерием.
 В случае значимого эффекта взаимодействия 
между факторами графики средних значений 
не параллельны, и разности между средними 
значениями неодинаковы. Наличие 
эффекта взаимодействия факторов 
усложняет анализ основных эффектов. 
 В данном примере, если бы мы получили 
статистически значимое взаимодействие 
факторов, невозможно было бы определить, 
существует ли статистически значимая разница 
между качеством изделий, полученных от 
разных поставщиков, поскольку для разных 
поставщиков эта разность неодинакова. 
 Аналогично невозможно определить, 
существует ли статистически значимая разница 
между качеством изделий, получаемых от 
каждого поставщика, поскольку для каждого 
вида изделия разность качества поставщиков 
неодинакова.
ПРИМЕРЫ ГРАФИКОВ СРЕДНИХ ДЛЯ 
РЕЗУЛЬТАТОВ ДВУХФАКТОРНОГО 
ДИСПЕРСИОННОГО АНАЛИЗА
(ВНИМАНИЕ! ГРАФИКИ САМИ ПО СЕБЕ НЕ ДАЮТ 
ИНФОРМАЦИЮ О ЗНАЧИМОСТИ ЭФФЕКТОВ, А ТОЛЬКО 
ВИЗУАЛЬНО ОТОБРАЖАЮТ РЕЗУЛЬТАТЫ РАСЧЕТОВ!)

1. 2. 
Фактор А значим Фактор А незначим
Фактор Б незначим Фактор Б незначим
Взаимодействие незначимо Взаимодействие незначимо
3. 4.
Фактор А незначим Нет значимых эффектов
Фактор Б значим (Факторы А и Б незначимы,
Взаимодействие незначимо взаимодействие отсутствует)
5.  6.
Фактор А незначим Все эффекты значимы
Фактор Б незначим (Значимы факторы А и Б,
Взаимодействие значимо эффект взаимодействия значим) 
СПАСИБО ЗА ВНИМАНИЕ!
 Вопросы?