Вы находитесь на странице: 1из 15

Задание 3А

Практическая работа№ 4
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Цель работы: 1) ознакомить с методом однофакторного


дисперсионного анализа; 2) овладеть практическими навыками анализа
технологических процессов методом однофакторного дисперсионного
анализа.
Рекомендуемая литература: [5, 7, 11].

Теоретические сведения

В производственной практике часто возникает следующая задача.


Аппаратчики, работая по сменам на одном и том же аппарате или агрегате,
производят хлебобулочные или кондитерские изделия с различными
качественными показателями. Необходимо выяснить, что является причиной
появления неудовлетворительных результатов: несовершенная конструкция
аппарата или агрегата, не позволяющая добиться хорошей
воспроизводимости, или неодинаковая работа аппаратчиков.
Аналогичная задача возникает, например, при выработке одного
ассортимента хлебобулочных или кондитерских изделий на нескольких
поточных линиях. Требуется установить, однотипны ли получаемые изделия
по своим показателям качества, т. е. оценить, существенно ли воздействует
фактор индивидуальности оборудования каждой поточной линии на
качественные показатели хлебобулочных или кондитерских изделий.
Рассмотренные и аналогичные задачи решают с применением
статистических методов дисперсионного анализа (одно- или
многофакторный дисперсионный анализ).
Проведение дисперсионного анализа возможно, если результаты
наблюдений являются независимыми случайными величинами,
подчиняющимися нормальному закону распределения с одинаковыми
дисперсиями.
Дисперсионный анализ основан на свойстве аддитивности дисперсии,
т. е. на том, что полная дисперсия интересующего показателя равна сумме
составляющих ее частных дисперсий.
Задача однофакторного дисперсионного анализа (ОДА) ставится
следующим образом. Пусть изучается влияние фактора х на технологический
процесс или некоторый показатель качества. В процессе эксперимента
фактор поддерживают на u уровнях. На каждом уровне фактора проводится
m дублирующих (параллельных) опытов. Результаты однофакторного
эксперимента из u ×m наблюдений представляют в виде матрицы наблюдений
(табл. 1).
Таблица 1
Матрица однофакторного эксперимента
Уровень Паралеллельный опыт
варьировани
1 2 ... l … m
я фактора x
1 y11 y12 … y1l … y1m
2 y21 y22 … y2l … y2m
. . . … . … .

. . . … . … .

. . . … . … .
j yj1 yj2 … yjl … yjm
. . . … . … …

. . . … . … …

. . . … . … …
u yu1 yu2 … yul … yum

В табл. 1 приняты следующие обозначения: j – порядковый номер


уровня варьирования фактора х(j=1,2,…,u); l– порядковый номер
параллельного опыта в серии на каждом j-ом уровне (l = 1, 2, ..., mj); yjl –
значение функции отклика, полученное в l-ом параллельном опыте на j-ом
уровне варьирования фактора.
При расположении наблюдений (см. табл. 1) их рассеяние между
столбцами обусловливается ошибкой воспроизводимости, а рассеяние между
строками – дополнительным действием изучаемого фактора.
Рассеяние отдельных наблюдений относительно общего среднего
обусловлено действием как случайных причин, так и влиянием фактора х.
Действие фактора случайности проявляется в рассеянии (с оценкой
дисперсии S2e ) наблюдений серий параллельных опытов yjl на каждом уровне
x, вокруг среднего арифметического y j, своей серии.
Влияние же фактора х (с оценкой дисперсии S2x) вызывает повышенное
рассеяние средних арифметических yj серий относительно общего среднего.
Таким образом имеем равенство
S20=S 2E + S 2x (1)
2 2
где S0 – оценка «общей» дисперсии; S E – оценка остаточной дисперсии;
S x – оценка дисперсий «между сериями».
2

При обработке результатов ОДА предварительно определяют:


суммы наблюдений по сериям
mj
Y j=∑ y jl ; (2)
l=1

сумму квадратов всех M = um наблюдений


u mj
Q1=∑ ∑ y 2jl (3)
j=1 l =1

сумму квадратов итогов по сериям, поделенных на число наблюдений в


серии,
u
1 2
Q 2= ∑ Y ; (4)
j=1 mj j

квадрат общего итога, поделенный на число всех наблюдений,


u
1
Q 3=
M (∑ ) j =1
Yj (5)
Затем определяют «общую» сумму квадратов отклонений отдельных
наблюдений yjl от общего среднего
S0 = Q1 –Q3 (6)
Она характеризует рассеяние наблюдений в результате действия обоих
факторов, как случайности ɛ, так и изучаемого х.
Сумму квадратов отклонений «внутри серий», т. е. сумму квадратов
разностей между отдельными наблюдениями yjl и средним yj
соответствующей j-й серии определяют по формуле
Se = Q1 – Q2 (7)
Она характеризует остаточное рассеяние случайных погрешностей
опытов, т. е. их воспроизводимость.
Сумму квадратов отклонений «между сериями» или рассеивание по
уровням фактора х, т. е. взвешенную с учетом числа т параллельных
наблюдений в каждой серии сумму квадратов разностей между средними y j
отдельных серий и общим средним по всей совокупности наблюдений
определяют по формуле
Sx = Q2 – Q3 (8)
Суммы квадратов отклонений (6) – (8), деленные на соответствующие
числа степеней свободы, дают три оценки дисперсий, входящих в выражение
(1):

оценка общей дисперсии S20 по всем um наблюдениям


2 S0
S0 = (9)
um−1

с числом степеней свободы f0 = um -1;


оценка дисперсии «внутри серий», или оценка остаточной дисперсии S2ɛ
, находят как среднее из выборочных дисперсий по каждой серии в
отдельности

S2ɛ = (10)
u( m−1)
с числом степеней свободы f ɛ =u(m−1)
оценка дисперсий «между сериями»
Sx 2
Sx= (11)
u−1
f
с числом степеней свободы x =u−1.
Числа степеней свободы должны удовлетворять соотношению f 0 = fɛ +
fx, которое используют для проверки.
Выполнение однофакторного дисперсионного анализа заключается в
сравнении оценки дисперсии, вызванной изучаемым фактором изменчивости
S2x, и оценки остаточной дисперсии S2ɛ , имеющей место уже после того, как
влияние фактора x было устранено (за счет разложения оценки общей
дисперсии S20 на независимые составляющие) и обусловленной
исключительно случайными причинами.
Для того чтобы влияние фактора х было признано существенным,
необходимо и достаточно, чтобы оценка дисперсии S2x значимо отличалась от
S2ɛ . Проверку нульгипотезы об однородности этих выборочных дисперсий
осуществляют с помощью критерия Фишера:
S 2x
F p= 2 (12)

Влияние фактора x на изучаемый процесс признают существенным,
если выполняется условие
Fp > Fт, (13)
где Fт – табличное значение критерия Фишера для принятого уровня
значимости p и числа степеней свободы f 1=f x =u−1 и f 2=f ɛ =u(m−1) (см. прил.
2).
Если же условие (13) не выполняется, то влияние фактора x на
изучаемый процесс можно признать несущественным. В этом случае все
результаты наблюдений принадлежат одной генеральной совокупности,
распределенной нормально.
Следует иметь в виду, что дисперсионный анализ наблюдений
эксперимента позволяет оценивать влияние фактора лишь в целом и что
выводы, полученные с его помощью, относятся только к данному
экспериментальному материалу при данной его систематизации. Так,
например, при изменении диапазона варьирования изучаемого фактора или
основной (базовой) точки оценка влияния последнего может измениться.

Пример
Основным сырьем макаронного производства является мука из твердой
и мягкой стекловидной пшеницы – крупка и полукрупка. К сожалению, из-за
недостаточного выращивания зерна пшеницы твердых сортов и,
соответственно, недостаточного производства макаронной муки из него,
главным образом, из-за экономических факторов допускается применение
пшеничной хлебопекарной муки общего помола, а в последнее время
пшеничной муки общего назначения для выработки макаронных изделий.
Вместе с тем, на аграрном рынке России в последнее время появилась
полукрупка, полученная по сокращенной схеме помола из зерна новых
сортов пшеницы Степь 3, Степь 5 и пр., которая так же может быть
использованы при производстве макаронных изделий.
В связи с этим возникла необходимость в изучении влияния различных
сортов муки на энергоемкость процесса замеса макаронного теста, который
является основным технологическим процессом и предопределяет качество
готовой продукции.
В качестве объекта исследования использовали макаронную
полукрупку, полученную по сокращенной схеме помола из зерна новых
сортов пшеницы Степь 3, Степь 5 урожая 2002 и 2003 г, в сравнении с
макаронной крупкой из твердой пшеницы (контроль 1) и хлебопекарной
мукой из мягкой пшеницы высшего сорта (контроль 2) (табл. 2).
В качестве независимой переменной х был принят сорт муки,
используемой для замеса теста. В ходе эксперимента фактор х варьировался
на u = 14 уровнях. В качестве функции отклика y, характеризующей
энергозатраты при замесе теста использовали удельную работу замеса теста
(кДж/кг). При каждом уровне варьирования фактора проводили m = 2
параллельных опыта.
Представлены значения удельной работы замеса теста в двух
параллельных опытах (m = 2) при всех уровнях (u = 14) варьирования
факторов (см. табл. 2).
В дальнейшем использованы следующие обозначения: порядковый
номер уровня варьирования фактора – j(j=1,2,…,u); порядковый номер
параллельного опыта в серии на каждом j-ом уровне – l(l=1,2,...,m).
Выполним статистическую обработку результатов эксперимента с
помощью однофакторного дисперсионного анализа. Предварительно по
формуле (2) рассчитываем сумму наблюдений по сериям Yj и квадрат
наблюдений в параллельных опытах y 2jl (см. табл. 2).
Сумма квадратов всех M = um наблюдений, рассчитанная по формуле
(3), составляет
u m
Q1=∑ ∑ y 2jl =452147,24.
j=1 l =1
Сумма квадратов итогов по сериям, поделенных на число наблюдений
в серии, определяем по формуле (4)
u
1 2
Q 2=∑ Y =452146,6 ,
j=1 m j
значения квадратов сумм наблюдений по сериям, поделенных на число
наблюдений в серии, представлены (см. табл. 2).
По формуле (5) определяем квадрат общего итога, поделенный на
число всех наблюдений,
u 2
1 1
Q 3=
M (∑ )
j =1
Yj =
14 ∙2
( 3523,8 )2=443470,23.

Далее по формулам (6) – (8) рассчитываем суммы S0, Sɛ и Sx.


S0 = Q1 – Q3 = 452147,24 – 443470,23 = 8677,01.
Sε = Q1 – Q2 = 452147,24 – 452146,6 = 0,64.
Sx = Q2 – Q3 = 452146,6 – 443470,23 = 4676,37.

Затем по формулам (9) – (11) определяем оценки дисперсий: общая


оценка дисперсии воспроизводимости S20 по всем um наблюдениям
2 S0 8677,01
S0 = = =321,37
um−1 28−1

с числом степеней свободы f 0=um−1=28−1=27 ;


остаточная оценка дисперсии воспроизводимости S2ε
Sε 0,64
S2ε = = =0,045
u( m−1) 14(2−1)

с числом степеней свободы f ε= u(m -1) =14(2 -1) =14;


оценка выборочной дисперсии рассеивания «между сериями» 2
2 Sx 8676,37
Sx= = =667,41
u−1 14−1

с числом степеней свободы f x = u - 1=14 - 1=13.


Для того чтобы влияние фактора х было признано существенным,
необходимо и достаточно, чтобы оценка дисперсии S2x значимо отличалась от
S2ε . Проверку нуль-гипотезы об однородности этих выборочных дисперсий
проводим с помощью критерия Фишера (12)
S 2x 667,41
F p= 2 = =14831,4.
S ε 0,045

Табличное значение критерия Фишера (см. прил. 2) для принятого


уровня значимости p = 5 % и числа степеней свободы числителя
f 1=f x =u−1=14−1=13 и знаменателя f 2=f ε=u ( m−1 )=14 ( 2−1 ) =14 составляет F т
=244,5.
Проверка условия (13) показала, что Fр > Fт, следовательно, при
доверительной вероятности 95 % влияние фактора х (вид муки) на
энергоемкость процесса замеса макаронного теста (удельную работу замеса
теста) следует признать существенным.

Задание 3Б
Вариант 7
Моделируются структурно-механические свойства кекса. В качестве
функции отклика y принята общая деформация мякиша кекса (ед. прибора); в
качестве независимых факторов x1 – количество порошкообразного яблочно-
паточного полуфабриката (%); x2 – влажность теста (%) (табл. 20 – 21).
Таблица 20 – Характеристики планирования

Параметр x1, % x2, %


Основной уровень 22,5 37,0
Интервал варьирования 12,4 2,1
Верхний уровень 34,9 39,1
Нижний уровень 10,1 34,9

Таблица 21 – Матрица планирования

№ опыта Х1 Х2 y1 y2
1 -1 -1 69,0 68,3
2 +1 -1 70,2 71,5
3 -1 +1 68,2 69,0
4 +1 +1 72,5 72,6

При обработке экспериментальных данных для каждой се- рии


параллельных опытов по формуле (10) определяем средние
арифметические значения функции отклика (табл. 7). Для первой серии
параллельных опытов
1
y 1= ( 69,0+68,3 )=68,65
2

Для второй серии параллельных опытов:


1
y 2= ( 70,2+71,5 )=70,85
2

Для третьей серии параллельных опытов:


1
y 3= ( 68,2+69,0 ) =68,6
2

Для четвертой серии параллельных опытов:


1
y 4 = ( 72,5+72,6 )=72,55
2

Таблица 7 – Результаты обработки матрицы планирования


№ опыта Х1 Х2 Х1Х yj Sj2 Sj vjp
2
1 -1 -1 +1 68,65 0,24 0,49 68,18
5
2 +1 -1 -1 70,85 0,84 0,91 71,24
5
3 -1 +1 -1 68,6 0,32 0,56 69
4 +1 +1 +1 72,55 0,00 0,07 72,06
5
Оценку дисперсий для каждой серии параллельных опытов вычисляем
по формуле (11). Для первой по четвертой серии соответственно:

1
S21= [ ( 69,0−68,65 )2 + ( 68,3−68,65 )2 ]=0,245
2−1

2 1
S2 =
2−1
[ ( 70,2−70,85 )2 + ( 71,5−70,85 )2 ] =0,845

1
S23= [ ( 68,2−68,6 )2 + ( 69,0−68,6 )2 ]=0,32
2−1

1
S24 = [ ( 72,5−72,55 )2+ (72,6−72,55 )2 ]=0,005
2−1

Ошибку каждого опыта определяем по формуле (12).

S1= √ S21= √0,245=0,49


S2= √ S22= √0,845=0,91
S3= √ S23 =√ 0,32=0,56
S4 =√ S 24 =√ 0,005=0,07

Чтобы проверить воспроизводимость опытов по формуле (13),


определяем расчетное значение критерия Кохрена:\
0,91
G p= =0,4
0,49+0,91+0,56 +0,07

Табличное значение критерия Кохрена при уровне значимости р = 0,05


и числе степеней свободы f = 2 – 1 = 1 (см. прил. 4) равно Gτ = 0,9065.
Сравнение расчетного и табличного значения критерия Кохрена показывает,
что условие Gр ˂ Gт, 0,4 ˂ 0,9065 (14) выполняется, следовательно, оценки
дисперсий однородны, а опыты являются воспроизводимыми.
По формуле (15) вычисляем оценку дисперсии воспроизводимости
эксперимента:
1
S2y = ( 0,49+ 0,91+ 0,56+0,07 )=0,5075
4

На основании результатов полного факторного эксперимента,


используя формулы (16 – 18), находим коэффициенты уравнения регрессии:

1
b 0= ( 68,65+70,85+68,6+72,55 ) =70,12
4

1
b 1= (−68,65+70,85−68,6+ 72,55 )=1,53
4

1
b 2= (−68,65−70,85+68,6+ 72,55 )=0,41
4

Значимость этих коэффициентов определяем по критерию Стьюдента.


Для этого по формуле (19) рассчитываем ошибку при нахождении
коэффициентов S2b = 0,1268. Затем по формуле (20) вычисляем для каждого
коэффициента расчетное значение критерия Стьюдента:
|70,12|
t bт = 0
=196,91;
√ 0,1268

|1,53|
t bт =
1
=4,29 ;
√ 0,1268

|0,41|
т t bт = 2
=1,15
√ 0,1268

Табличное значение критерия Стьюдента при уровне значимости р =


0,05 и числе степеней свободы f = N (k – 1)= 4 (2-1) = 4 (см. прил. 3) равно tт =
2,1318. Сравнение каждого расчетного значения критерия Стьюдента и
табличного показывает, что условие t p ≥ t т (21) для всех коэффициентов
выполняется. Это говорит о значимости раcсчитанных регрессионных
коэффициентов. Следовательно, уравнение регрессии можно представить в
следующем виде:
Y = 70,12 + 1,53 X 1+ 0,41 X 2

Для проверки адекватности уравнения регрессии вычисляем расчетные


значения функции отклика:

y 1p=70,12+1,53 (−1 ) +0,41 (−1 )=68,18

y 2p=70,12+1,53 ( +1 ) +0,41 (−1 )=71,24

y 3p=70,12+1,53 (−1 ) +0,41 ( +1 )=69


y 4p=70,12+1,53 ( +1 ) +0,41 ( +1 )=72,06

По формуле (23) вычисляем оценку дисперсии адекватности:

1
S2ад= [ ( 68,18−68,65 )2+ ( 71,24−70,85 )2 + ( 69−68,6 )2 +(72,06−72,55)2 ]=0,77
4−3

Расчетное значение критерия Фишера определяем по формуле (22):

0,77
F p= =1.5
0,5075

Табличное значение критерия Фишера при уровне значимости р = 0,05 и


числе степеней свободы числителя f1= N (k – 1) = 4 и знаменателя f2= 4–2–1 =
1 (см. прил. 3) равно Fт = 224,58. Сравнение расчетного и табличного
значения критерия Фишера показывает, что условие Fр < Fт, 1,5< 224,58
(24) выполняется, что говорит об адекватности полученного уравнения
регрессии.
ВЫВОД
Сравнение расчетного и табличного значения критерия Фишера
показывает, что условие Fр < Fт, (то есть 1,5< 224,58) выполняется, что
говорит об адекватности полученного уравнения регрессии.

Задание 3В. Ответить на контрольные вопросы

1. Что такое основной уровень и интервал варьирования фактора?


Основным, или нулевым, уровнем фактора называют его значение,
принятое за исходное в плане эксперимента. Сочетание основных уровней
принимают за исходную точку для построения плана эксперимента,
состоящего из экспериментальных точек, симметричных относительно
центра плана.
Интервалом варьирования фактора называют число (свое для каждого
фактора), прибавление которого к основному уровню дает верхний уровень
фактора, а вычитание – нижний.

2. Как проводят эксперимент согласно матрице планирования?


После выбора плана эксперимента, основных уровней и интервалов
варьирования факторов переходят к эксперименту в соответствии с
составленной ранее матрицей планирования.
Чтобы компенсировать влияние случайных погрешностей, каждый
опыт рекомендуется повторить k раз. Обычно число k параллельных опытов
принимают равным 2 – 5.
Для каждой серий параллельных опытов находят среднее
арифметическое значение функции отклика
k
1
ý j= ∑y
k i=1 ji

где k – число параллельных опытов, проведенных в одинаковых условиях; j


– номер опыта (j=1, 2, …, N); i – номер параллельного опыта (i=1, 2, …, k).
Затем вычисляют оценку дисперсии для каждой серии параллельных
опытов
k
1
S2j= ∑ ( y − ý j )2
k −1 i=1 ji

3. Как проверить воспроизводимость опытов при ПФЭ?


Для проверки воспроизводимости опытов находят отношение
наибольшей из оценок дисперсий к сумме всех оценок дисперсий
(расчетное значение критерия Кохрена):

max S2j
G p= N

∑ S2j
j=2

Табулированные значения критерия Кохрена Gт приведены в прил. 4.


Для нахождения Gт необходимо знать уровень значимости p, общее
количество оценок дисперсий N и число степеней свободы f, связанных с
каждой из них, причем f = k - 1.
При выполнении условия

Gр ≤ Gт,

опыты считаются воспроизводимыми, а оценки дисперсий – однородными.


4. Как установить значимость коэффициентов уравнения регрессии?
Чтобы установить, значим коэффициент или нет, необходимо прежде
всего вычислить оценку дисперсии, с которой он находится

2 S2y
S=
b
N

Следует отметить, что с помощью ПФЭ все коэффициенты


определяются с одинаковой погрешностью.
Значимость каждого коэффициента уравнения регрессии устанавливают с
помощью критерия Стьюдента, вычисляя его расчетное значение

|b|
t p= 2
√S b

где b – коэффициент уравнения регрессии, для которого


устанавливается значимость.
Каждое рассчитанное значение tр сравнивают с табличным значением
критерия Стьюдента tт (см. прил. 3), которое выбирают для заданного
уровня значимости p при числе степеней свободы f =N (k -1).
Если выполняется условие

t p≥ t т

то коэффициент считается значимым. В противном случае коэффициент


регрессии незначим, и соответствующий член можно исключить из
уравнения регрессии.

5. Как установить адекватность уравнения регрессии?

Получив уравнение регрессии, следует проверить его адекватность с


помощью критерия Фишера, который представляет собой отношение

max ⁡( S 2ад ; S2y )


F p=
min ⁡(S 2ад ; S 2y )
где S2ад оценка дисперсии адекватности, которая вычисляется как
N
2 1
Sад ∑ ( y эj − y pj )
N −B j=1

где y эj , y pj - экспериментальное и расчетное значения функции отклика,


полученные в j-том опыте; B – количество коэффициентов в уравнении
регрессии.
Уравнение регрессии адекватно описывает результаты эксперимента,
если выполняется условие

Fр < Fт,

где Fт – табличное значение критерия Фишера для принятого уровня


значимости p и числа степеней свободы f1 числителя и f 2 знаменателя.
Если гипотеза об адекватности отвергается, необходимо перейти к
более сложной форме и (если это возможно) провести эксперимент с
меньшим интервалом варьирования факторов.

6. С какой целью и как проводят рандомизацию опытов?


Чтобы в известной мере компенсировать систематические
погрешности эксперимента, используют прием, называемый
рандомизацией. Он заключается в том, что опыты проводят в случайной
последовательности, которая устанавливается с помощью таблицы
случайных чисел. Пусть, например, требуется рандомизировать во времени
6 опытов, обозначенных цифрами I, II, ..., VI. Поставим им в соответствие 6
последовательных чисел, взятых в любой строке или в любом столбце
таблицы случайных чисел. При этом повторяющиеся числа следует
отбросить. Могут быть получены следующие пары:

I – 60 IV - 15
II – 12 V - 34
III – 05 VI – 30

Расположив случайные числа в порядке возрастания (или убывания),


найдем искомую последовательность реализации опытов: III, II, IV, VI, V, I
(или I, V, VI, IV, II, III).

7. Как вычисляют коэффициенты уравнения регрессии?


На основании полного факторного эксперимента определяют
коэффициенты уравнения регрессии по формулам:
N
1
b 0= ∑ ý j
N j=1

N
1
b i= ∑ X ji ý j
N j =1

N
1
b lm= ∑ X ji X jm ý j
N j=1

8. Как выполняют построение матрицы планирования типа 2n?


Число опытов ПФЭ определяется выражением
N = 2n

где n – число факторов.


Для ПФЭ типа 22 уравнение регрессии имеет вид

y  b0  b1 X 1  b2 X 2  b12 X 1 X 2

Полный факторный эксперимент осуществляют с помощью матрицы


планирования, вид которой для двухфакторного ПФЭ типа 22 приведен в
табл. 1.

Таблица 1 – Матрица планирования

№ опыта X1 X2 X1X2 Функция отклика y


1 -1 -1 +1 y1
2 +1 -1 -1 y2
3 -1 +1 -1 y3
4 +1 +1 +1 y4