Академический Документы
Профессиональный Документы
Культура Документы
и планирования экспериментов 62
np
∑ x ij
j=1
xi = ,
np
np
где ∑ x ij – сумма всех значений в i-группе,
j=1
p np
∑ ∑ x ij
i =1 j=1
x= .
n
Построим схему однофакторного дисперсионного анализа (см. табли-
цу 3.1), попутно объясняя ее.
p np
( )
Q = ∑ ∑ x ij − x 2 .
i =1 j=1
k = n – 1.
kp = p – 1.
67 Планирование и организация эксперимента
Q = QA + QR.
Два параметра из этой суммы нам известны, так что найти недостаю-
щее QR будет несложно.
H 0 : s 2A = s 2R H1 : s 2A ≠ s 2R
s 2A
KF = < Fα ,
s 2R
то дисперсии считаются статистически неразличимыми, т.е. фактор А не ока-
зывает влияния на результат эксперимента. В противном случае – дисперсии
статистически различимы, и фактор А оказывает влияние на результат.
Замечание. В отличие от классического критерия согласия Фишера –
Снедекора, при проверке различия между межгрупповой и внутригрупповой
дисперсиями в числителе ВСЕГДА стоит межгрупповая дисперсия, даже ес-
ли она с математической точки зрения меньше внутригрупповой.
2
p np
∑∑ x ij Q
1. Общая p np i=1 j=1 n–1 s2 =
Q = ∑∑ x ij −
2 N −1
i j=1 n
2 2
2. По факторам А np q np
∑ x ij ∑∑ x ij QA
(между группа- p i=1 j=1 p–1 s 2A =
QA = ∑ j=1 − p −1
ми) np n
i =1
2
np
3. Остаточная ∑ x ij QR
p np p n–p s 2R =
(внутри групп) Q R = ∑∑ x ij − ∑
2 j=1 N−p
i j=1 i =1 np
4. Оценка влияния s 2A <
K F = 2 > Fα
фактора sR
5. Оценка влия- x база − x остальные значения <
ния отдель-
Kt =
2 > t α (n база + n остальные значения − 2 )
σ база σ остальные значения
2
ных значений +
фактора n база n остальные значения
q
∑ x ij
j=1
xi = ;
q
p
∑ x ij
i =1
xj = ;
p
3. общее среднее
p q
∑ ∑ x ij
i =1 j=1
x= .
pq
фактора А В1 В2 … Вq
А1 x11 x12 … x1q
А2 x21 x22 … x2q
… … … … …
Ар xp1 xp2 … xpq
Число
Оценка
Группировка Сумма квадратов степеней
дисперсии
свободы
p q
Q
∑ (x ij − x ) s2 =
2
1. Общая Q=∑ pq – 1
i =1 j=1 pq − 1
p
2. Между группами QA
Q A = q ∑ (x i − x ) s 2A =
2
p–1
фактора A i =1 p −1
q
QB
Q B = p∑ (x j − x )
3. Между группами 2
s 2B =
q–1
фактора B j=1 q −1
(p – 1)⋅ s 2 =
p q
QR
∑ (x ij − x i − x j + x )
4. Остаточная 2
QR = ∑
(внутри групп) i =1 j=1 ⋅(q – 1) R
(p − 1)(q − 1)
s 2A <
K FA = Fα (p − 1; (p − 1)(q − 1) ) и
5. Оценка влияния s 2R >
фактора s 2B <
K FB = 2 > Fα (q − 1; (p − 1)(q − 1) )
sR
6. Оценка x база − x остальные значения <
> t α (n база + n остальные значения − 2 )
влияния Kt =
2
отдельных σ база σ остальные значения
2
значений +
n база n остальные значения
фактора
n
∑ x ijk
k =1
x ij = ;
n
q
∑ x ij
j=1
xi = ;
q
p
∑ x ij
i =1
xj = ;
p
4. общее среднее
p q
∑ ∑ x ij
i =1 j=1
x= .
pq
Число
Оценка
Группировка Сумма квадратов степеней
дисперсии
свободы
p q n
Q
∑ ∑ (x ijk − x ) s2 =
2
1. Общая Q=∑ pqn – 1
i =1 j=1 k =1 pqn − 1
p
2. Между группами QA
Q A = qn ∑ (x i − x )
2
p–1 s 2A =
фактора A i =1 p −1
q
QB
Q B = pn ∑ (x j − x )
3. Между группами 2
s 2B =
q–1
фактора B j=1 q −1
Q AB
(p – 1)⋅ s 2AB =
p q
∑ (x ij − x i − x j + x )
2
4. Взаимодействие Q AB = n ∑ (p − 1)(q − 1)
i =1 j=1 ⋅(q – 1)
p q n Q
∑ ∑ (x ijk − x ij )
5. Остаточная 2
QR = ∑ pqn – pq s2 = R
(внутри групп) i =1 j=1 k =1
R pqn − pq
s 2A <
K FA = 2 > Fα (p − 1; pqn − pq ) ,
sR
6. Оценка влияния s 2B <
K FB = 2 > Fα (q − 1; pqn − pq ) и
фактора sR
s 2AB <
K FAB = 2 > Fα ((p − 1)(q − 1); pqn − pq )
sR
7. Оценка x база − x остальные значения <
> t α (n база + n остальные значения − 2 )
влияния Kt =
2
отдельных 2
σ база σ остальные значения
значений +
n база n остальные значения
фактора
Таблица 3.7 – Шкала Чеддока для оценки силы связи между случайными величинами
Количественная мера Качественная характеристика
тесноты связи, абсолютное значение силы связи
3 Статистические методы анализа данных
и планирования экспериментов 78
Y = kX + b,
m k m k
N ∑ ∑ n ij x i y j − ∑ n i x i ∑ n j y j
i =1 j =1 i =1 j =1
rxy = , (3.1)
2 2
m m k k
N∑ x i2 n i − ∑ n i x i ⋅ N ∑ y j n j − ∑ n jy j
2
i =1 j =1
i =1 j =1
Если же это сделать невозможно или каждая пара значений xiyj встре-
чается один раз, то формула (3.1) примет вид
81 Планирование и организация эксперимента
N N N
N ∑ x i y i − ∑ x i ∑ y i
rxy = i =1 i =1 i =1 , (3.2)
N N 2 N N 2
N ∑ x i2 − ∑ x i ⋅ N ∑ y i2 − ∑ y i
i =1 i =1 i =1 i =1
и Y, рисунок 3.1, а и б;
b. rxy = 0 – отсутствие линейной связи между случайными величинами
X и Y, рисунок 3.1, в;
c. − 1 < rxy < 1 – наличие либо нелинейной, либо статистической связи
ным.
6. rxx = ryy = 1 - поскольку это действие случайной величины самой на себя.
∆ = (rxy ) ⋅ 100 % .
2
H 0 : rxy = 0 ; H1 : rxy ≠ 0 .
r N−2
Kr = ,
2
1− r
*)
коэффициент детерминации можно определять по любому из представленных коэффициентов
корреляции. Принцип определения везде один и тот же. Поэтому мы лишь один раз приведем его
подробно. Далее – все по аналогии.
83 Планирование и организация эксперимента
K r ≥ t α (N − 2 )
2
s межгруп.по y
η yx = 2
.
s общ .по y
2
Определение общей дисперсии переменной Y s общ .по y производится по
формуле:
m
∑ (y j − y )
2
nj
2 j =1
s общ .по y = ,
N
k
∑ (y i − y )
2
ni
2 i =1
s межгруп.по y = ,
N
ми величинами X и Y;
b. η yx = 0 – отсутствие какой-либо связи между случайными вели-
чинами X и Y;
c. 0 < η yx < 1 – наличие статистической связи между случайными ве-
личинами X и Y.
2. η yx ≠ η xy .
H 0 : η yx = 0 ; H1 : η yx ≠ 0 .
η2yx ⋅ (N − m )
Kη =
(1 − η )(m − 1) ,
2
yx
K η ≥ Fα (m − 1; N − m )
q
R j.1, 2,K( j−1),( j+1),Kk = 1 − ,
q jj
H0 : R = 0 ; H1 : R ≠ 0 .
R 2 ⋅ (N − k )
KR =
(1 − R )(k − 1) ,
2
*)
Данное обозначение читается следующим образом: «коэффициент корреляции на случайную
величину J случайных величин 1, 2, …, К».
3 Статистические методы анализа данных
и планирования экспериментов 88
K R ≥ Fα (k − 1; N − k ) .
− q ij
rij.1,K, k = ,
q ii q jj
H 0 : rij.1,K, k = 0 ; H1 : rij.1,K, k ≠ 0 .
rij.1,K, k N − 2
K r.1 = ,
1 − rij2.1,K, k
*)
Данное обозначение следует читать как «взаимодействие между случайными величинами I и J
при исключении влияния остальных случайных величин»
89 Планирование и организация эксперимента
K r .1 ≥ t α ( N − k + 2 ) ,
n
6∑ (ri − s i )2
i =1
ρ =1−
n3 − n
n
∑ (ri − s i )
2
i =1
ρ =1− ,
1 3
6
( )
n − n − (Tr + Ts )
1 mr 3 1 ms 3
12 i =1
( ) 12 i =1
( )
где Tr = ∑ t r − t r , Ts = ∑ t s − t s – поправочные коэффициенты;
Tr = (
1 5 3
∑
12 r =1
)
tr − tr = [(
1 3
12
) ( ) ( ) ( ) (
2 − 2 + 33 − 3 + 2 3 − 2 + 2 3 − 2 + 4 3 − 4 = )]
1 18 + 24 + 60
= [3 ⋅ (8 − 2 ) + (27 − 3) + (64 − 4 )] = = 8,5;
12 12
93 Планирование и организация эксперимента
1 3 3
Ts = ∑
12 r =1
(
ts − ts =
1 3
12
) [( ) (
3 − 3 + 53 − 5 + 2 3 − 2 = ) ( )]
1 24 + 120 + 6
= [(27 − 3) + (125 − 5) + (8 − 2 )] = = 12,5.
12 12
n
∑ (ri − s i )
2
i =1 58 58
ρ =1− =1− =1− ≈ 0,87 .
6
(
1 3
)
n − n − (Tr + Ts ) (
1 3
6
)
14 − 14 − (8,5 − 12,5) 455 + 4
H0 : ρ = 0 ; H1 : ρ ≠ 0 .
ρ n−2
Kρ = ,
1 − ρ2
K ρ ≥ t α (n − 2 ) .
*)
Данный пример заимствован нами из [13].
95 Планирование и организация эксперимента
(4; 2); (4; 6); (4; 3); (4; 9); (4; 10); (4; 8); (4; 7); (4; 5).
Легко можно заметить, что образовалось всего две инверсии, они выде-
лены полужирным шрифтом. Таким образом, для второй позиции записыва-
ем значение статистики Кендалла К2 = 2.
Аналогично, можно подсчитать статистики Кендалла для инверсий на
четвертой, шестой, седьмой, восьмой и девятой позиций. Они составят, соот-
ветственно,
3 Статистические методы анализа данных
и планирования экспериментов 96
K4 = 2; K6 = 3; K7 = 3; K8 = 2; K9 = 1.
K = К2 + K4 + K6 + K7 + K8 + K9 = 13.
4K
τ =1− .
n (n − 1)
H0 : ρ = 0 ; H1 : ρ ≠ 0 .
Наблюдаемое значение критерия определяется по формуле:
9n (n − 1)
Kτ = τ ,
2(2n + 5)
K τ ≥ t 1−α ,
97 Планирование и организация эксперимента
4K 4 ⋅ 13
τ =1− =1− = 0,42 ;
n (n − 1) 10 ⋅ (10 − 1)
9n (n − 1) 9 ⋅ 10 ⋅ (10 − 1)
Kτ = τ = 0,42 ⋅ = 0,42 ⋅ 4,02 = 1,69 .
2(2n + 5) 2 ⋅ (2 ⋅ 10 + 5)
n m m(n + 1)
12∑ ∑ rij −
i =1 j=1 2 ,
W=
(
2 3
m n −n )
H0 : W = 0 ; H1 : W ≠ 0 .
K W = m(n − 1)W ,
K W ≥ χ α2 (n − 1),
99 Планирование и организация эксперимента
y = b0 + b1x.
y i = b1x i + b 0 + ε i ,
N N N
∑ y i = b1 ∑ x i + b 0 + ∑ ε i .
i =1 i =1 i =1
N N N
∑ y i − b1 ∑ x i − b 0 = ∑ ε i → min .
i =1 i =1 i =1
N N
∑ (y i −b1x i − b 0 ) = ∑ ε i2 = S(b 0 , b1 ) → min .
2
i =1 i =1
∂S(b 0 , b1 )
∂b =0
0
.
∂S(b 0 , b1 )
=0
∂b1
N N N N
∑ i 1 i
2 ( y − b x − b 0 ) ⋅ (− x i ) = 0 ∑ i i x y = b 1∑ i x 2
+ b 0 ∑ xi
i =1 i =1 i =1 i =1
N ⇒ N N
2∑ (y − b x − b ) ⋅ (− 1) = 0 ∑ y = b ∑ x + b N
i=1 i 1 i 0
i=1 i 1
i =1
i 0
N N N
N∑ x i yi − ∑ x i ∑ yi
i =1 i =1 i =1
b1 = 2
.
N
N
N ∑ x i2 − ∑ x i
i =1 i=1
*)
Советую Вам решить эту систему уравнений самостоятельно, получив описанные результаты.
3 Статистические методы анализа данных
и планирования экспериментов 102
b 0 = y − ax .
1 N
y= ∑ yi ,
N i=1
s 2A
KF = ≥ Fα (m − 1; N − m ) .
s 2R
(
C = XT ⋅ X )−1
.
b j−1
t j−1 = ,
s 2R ⋅ c jj
t α (N − m ) .
В случае, если
t j−1 ≥ t α (N − m ) ,