Академический Документы
Профессиональный Документы
Культура Документы
Servicio al
Ciudadano”
“UNIVERSIDAD
SAN LUIS
GONZAGA DE
ICA”
FACULTAD DE
CIENCIAS:
ESCUELA
ACADÉMICA
PROFESIONAL
ESTADÍSTICA
ASIGNATURA:
DISEÑO
EXPERIMENTAL
AVANZADO
TEMA: ANALISIS
DE VARIANZA DE
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
INTRODUCCION
Dentro del Tema de Prueba de hipótesis que acabamos de ver, se estudió la prueba de
hipótesis de comparación de 2 medias, a partir de las muestras de dos poblaciones
para conocer si existían diferencias reales entre ellas o se debía al azar.
Pues bien, hoy vamos a considerar problemas en que debemos decidir si las
diferencias observadas entre más de dos medias se pueden atribuir al azar o si existen
diferencias reales entre las medias de las poblaciones de las que se obtuvieron las
muestras.
Y esto se estudia cuando por ejemplo lo que queremos conocer sobre la base de los
datos muéstrales, si en realidad existe alguna diferencia. Por ejemplo:
Es así que cuando queremos hacer comparaciones entre dos, tres o más medias
muéstrales para determinar si provienen de poblaciones iguales utilizamos la técnica
de análisis de varianza. Esta técnica se realiza utilizando la distribución de
Nivel o tratamiento del factor: Es un valor o condición del factor bajo el cual se
observa la respuesta medible.
Dedicado a la Investigación de
Estadistas.
αβ
¿
¿
αγ
Donde αi , βj , γk son los efectos principales; ¿ son los efectos de
¿
βγ
¿
¿
¿
interacción de dos factores que tienen la misma interpretación que en el experimento
αβγ
de dos factores. El término ¿ recibe el nombre de efecto de interacción de tres
¿
¿
αβ
factores, un término que representa la no aditividad de las ¿ sobre los diferentes
¿
¿
niveles del factor C. Igual que antes, la suma de todos los efectos principales es cero y
la suma de cualquier subíndice de los efectos de interacción de dos y tres factores es
cero. En muchas situaciones experimentales estas interacciones de orden más alto
son significantes y sus cuadrados medios reflejan únicamente variación aleatoria, pero
el análisis se hará en forma general.
La filosofía general del análisis es la misma que la utiliza para los experimento de uno
y dos factores. La suma de cuadrados se particiona en ocho términos, cada uno
representa una fuente de variación de las cuales se obtienen estimaciones
independientes de σ 2 cuando todos los efectos principales y los efectos de
interacción son cero. Si los efectos de cualquier factor o interacción dados no son
todos cero, entonces el cuadrado medio estimará la variancia del error más una
componente debida al efecto sistemático en cuestión.
Factor A
A 1 A 2 A3 A4 A 5 A6
B1
B4
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
Factor B
C1
Factor C
C2
C3
Con i = 1, 2, · · · , a ; j = 1, 2, · · · , b ; k = 1, 2, · · · , c donde
( τβ )ij , ( τγ )ik , ( βγ ) jk , ( τβγ )ijk , : Son los efectos producidos por las
interacciones entre A × B, A × C, B × C y A × B × C, respectivamente
2
uijk N ( 0, σ ) independientes
∑¿
i
Parámetros a estimar:
B
A Total
1 2 … b
k=1, 2,…, c
1 y 11k y 12 k … y 1 bk y 1.k
2 y 21 k y 22 k …
y 2 bk . y 2.k .
. . .
. .
. . .
. .
. . .
a …
y abk y a .k
ya 1 k ya 2 k
B
A Total
1 2 … b
1 y 12. …
y 11. y1 b . y 1. .
2 y 22. …
y 21. . y2 b . . y 2.. .
. .
. . .
. .
. . .
UNIVERSIDAD SAN.LUIS GONZAGA .
y a 1. DE ICA-PERÚ y ab . y a ..
a y a 2. … 9
C
A Total
1 2 … c
1 y 1.2 . …
y 1.1 y 1.c . y 1...
2 y 2.2. …
y 2.1 . y 2.c . . y 2... .
. .
. . .
. .
. . .
. .
a
y a .1 …
y a .c . y a ...
y a .2.
C
B Total
1 2 … c
SCB= j − …
ac abc
∑ .. k y 2
y 2
SCC = k − …
ab abc
∑ y ij . y 2
2
SC ( AB ) = i , j − … −SCA−SCB
c abc
2
∑ y i ,k y 2
SC ( AC )= i , k − … −SCA −SCC
b abc
∑ y .ik y 2
2
SC ( BC )= j , k − … −SCB−SCC
a abc
2
y…
SC ( AB C )= ∑ y 2ijk − −SCA−SCB−SCC −SC ( AB )−SC ( AC ) −SC (BC )
i , j ,k abc
G . L A =a−1
G . LB =b−1
G . LC =c−1
G . L AB=(a−1)( b−1)
G . L AC =(a−1)(c−1)
G . LBC =(b−1)(c−1)
G . L ABC =(a−1)(b−1)(c−1)
G . LTOTAL=abc−1
SCA
CM A =
G. L A
SCB
CM B=
G. LB
UNIVERSIDAD SAN LUIS GONZAGA DE ICA-PERÚ
11
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
SCC
CM C =
G . LC
SC( AB)
CM AB =
G . L AB
SC( AC )
CM AC =
G . L AC
SC (BC)
CM BC =
G. LBC
SC ( ABC )
CM ABC =
G . L ABC
CMA
H 0 A ≅ τ 1=…=τ a=0 : F A = H 0 A F (a−1 );(a−1)(b−1)(c−1)
CMR
CMB
H 0 B ≅ β 1=…=β b=0: F B = H 0 B F( b−1) ;(a−1 )(b−1)(c−1)
CMR
CMC
H 0 C ≅ γ 1=…=γ c =0 : FC = H 0 C F ( c−1 );(a−1)(b −1 )(c−1 )
CMR
CM ( AB)
H 0( AB) ≅ ( τβ )ij =0 ; ∀i , j :F (AB )= H 0( AB) F( a−1)(b−1);(a−1)(b−1)(c−1 )
CMR
CM ( AC )
H 0( AC) ≅ ( τγ )ik =0 ; ∀ i ,k : F( AC)= H 0 (AC) F (a−1) (c−1);(a−1)(b−1)(c−1)
CMR
CM (BC )
H 0(BC ) ≅ ( βγ ) jk =0; ∀ j ,k : F(BC) = H 0(BC) F (b−1) (c−1);(a−1)(b−1)(c−1)
CMR
Efecto principal
A SSA a-1 2 S 21
S 1 ƒ1= 2
S
B SSB b-1
S 22 S
2
ƒ2= 22
C SSC c-1 S
interacción de dos S 23 2
factores S3
2
ƒ3 = 2
S4 S
AB SS(AB) (a-1)(b-1)
S 25 S 24
AC SS(AC) (a-1)(c-1) ƒ4 = 2
S
BC SS(BC) (b-1)(c-1) S 26
S 25
interacción de tres ƒ5 =
S
2 S2
factores
S26
ABC o SS(ABC) (a-1)(b-1)(c-1) ƒ6= 2
S
Error
Para el experimento de tres factores con una sola réplica se puede utilizar el análisis
de la tabla haciendo n=1 y utilizando la suma de cuadrados de la interacción ABC para
αβγ
SSE. En este caso se está asumiendo que los efectos de interacción ¿ son todos
¿
¿
iguales a cero de tal forma que
a b c
2
n ∑ ∑ ∑ ( αβγ )ijk
E
[ SS ( ABC )
]
( a−1 )( b−1 ) ( c−1 )
=σ 2+ i=1 j=1 k=1
( a−1 ) ( b−1 )( c−1 )
=σ 2 .
uijkl N ( 0, σ 2 ) independientes
y ijk representa la respuesta de la variable en el i-ésimo nivel del factor
1 ( τ ) , en el j-ésimo nivel del factor 2 ( β ) y en el k-ésimo nivel del
factor 3 ( γ )
τ i β j γ k : Son los efectos producidos por el nivel i-ésimo del factor A,
(∑ τ =0)
i
i , por el nivel j-ésimo del factor B, (∑ β =0 )
j
j y por el nivel k-
( τβ )ij , ( τγ )ik , ( βγ ) jk , ( τβγ )ijk , : Son los efectos producidos por las
interacciones entre A × B, A × C, B × C y A × B × C, respectivamente
B
A Total
1 2 … b
B
A Total
1 2 … b
C
A Total
1 2 … c
C
B Total
1 2 … c
Las sumas de los cuadrados se calculan sustituyendo los totales apropiados en las
siguientes fórmulas de cálculos:
2
2 y ….
SST = ∑ y − ijkl
i , j , k ,l abcn
∑ yi … y2 2
SCA= i − ….
bcn abcn
2
∑ y . j .. y 2
SCB= j − ….
acn abcn
∑ y .. k . y 2
2
SSC= k − ….
abn abcn
∑ y ij .. ∑ y2i … ∑ y 2. j .. y 2
2
SC ( AB ) = i , j − i − j + ….
cn bcn acn abcn
∑ y i .k . ∑ y i … ∑ y .. k . y2
2 2 2
SC ( AC )= i , k − i − k + ….
bn bcn abn abcn
2 2 2
∑ y . jk . ∑ y . j .. ∑ y.. k . y 2
SC ( BC )= j , k − j − k + ….
an acn abn abcn
G . L A =a−1
G . LB =b−1
G . LC =c−1
G . L AB=(a−1)( b−1)
G . L AC =(a−1)(c−1)
G . LBC =(b−1)(c−1)
G . L ABC =(a−1)(b−1)(c−1)
UNIVERSIDAD SAN LUIS GONZAGA DE ICA-PERÚ
18
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
SCA
CM A =
G. L A
SCB
CM B=
G. LB
S CC
CM C =
G . LC
SC( AB)
CM AB =
G . L AB
SC( AC )
CM AC =
G . L AC
SC (BC)
CM BC =
G. LBC
SC ( ABC )
CM ABC =
G . L ABC
SCE
CM ERROS =
G . LEROR
CMA
H 0 A ≅ τ 1=…=τ a=0 : F A = H 0 A F (a−1 ); abc(n−1)
CMR
CMB
H 0 B ≅ β 1=…=β b=0: F B = H 0 B F( b−1) ;abc (n−1)
CMR
CMC
H 0 C ≅ γ 1=…=γ c =0 : FC = H 0 C F ( c−1 ); abc (n−1)
CMR
CM ( AB)
H 0( AB) ≅ ( τβ )ij =0 ; ∀i , j :F (AB )= H 0( AB) F( a−1)(b−1); abc(n−1)
CMR
CM ( AC )
H 0( AC) ≅ ( τγ )ik =0 ; ∀ i ,k : F( AC)= H 0 (AC) F (a−1) (c−1);abc (n−1)
CMR
CM (BC )
H 0(BC ) ≅ ( βγ ) jk =0; ∀ j ,k : F(BC) = H 0(BC) F (b−1) (c−1);abc (n−1)
CMR
CM ( ABC )
H 0( ABC) ≅ ( τβγ )ijk=0 ; ∀i , j ,k : F( ABC )= H 0( ABC) F( a−1) (b−1 )( c−1 ) ;abc (n −1)
CMR
Efecto principal
S 21
ƒ1= 2
A SSA a-1 S
S 21 2
B SSB b-1 S
2
ƒ1= 22
S2 S
C SSC c-1
2
interacción de dos S3
S
2
3
ƒ1= 2
factores S
AB SS(AB) (a-1)(b-1) S 24 S 24
ƒ1= 2
AC SS(AC) (a-1)(c-1) S5
2 S
S 25
BC SS(BC) (b-1)(c-1) 2 ƒ1=
interacción de tres
S 6 S2
factores 2 S 26
S7 ƒ1 = 2
ABC SS(ABC) (a-1)(b-1)(c-1) S
2
S S 27
Error SSE abc(n-1) ƒ1= 2
S
Total SST abcn-1
PRESENTACION
(FACTOR B)
MOLIDO PELET
PROTEINA PROTEINA
SABORIZANTE
(FACTOR C) (FACTOR C)
(FACTOR A)
SOYA PESCADO SOYA PESCADO
6.42 6.6 6.84 7.16
6.35 6.68 6.93 7.21
ZANAHORIA
6.4 6.7 7.02 7.19
6.38 6.65 6.95 7.22
MITAZA 5.94 6.01 6.2 6.4
5.63 6.14 6.24 6.38
5.85 6 6.16 6.41
1) FORMA ANALITICA
PARAMETRO G.L
τi a-1 =2-1=1
βj b-1 =2-1=1
γk c-1 =2-1=1
( τβ )ij (a-1)(b-1) =(2-1)(2-1)=1
( τγ )ik (a-1)(c-1) =(2-1)(2-1)=1
( βγ ) jk (b-1)(c-1) =(2-1)(2-1)=1
( τβγ )ijk (a-1)(b-1)(c-1) =(2-1)(2-1)(2-1)=1
error Abc(n-1) =2x2x2(4-1)=24
TOTAL Abcn-1 =(2x2x2x4)-1=31
HALLANDO LAS COMBINACIONES:
B
A TOTAL
1 2
1 52.18 56.52 108.7
2 47.35 50.47 97.82 C B
TOTAL 99.53 106.99 206.52 1 2
1 48.71 52.63 101.34
2 50.82 54.36 105.18
C total 99.53 106.99 206.52
A TOTAL
1 2
1 53.29 55.41 108.7
2 48.05 49.77 97.82
TOTAL 101.34 105.18 206.52
CONTRASTES DE HIPÓTESIS:
HIPOTESIS “A”
HIPOTESIS “B”
HIPOTESIS “C”
HIPOTESIS “AB”
HIPOTESIS “AC”
HIPOTESIS “BC”
HIPOTESIS “ABC”
∑ y 2ij .. ∑ y2i … ∑ y 2. j ..
y2 52.18 2+56.522 +47.35 2+50.47 2 108.72 +97.822 99.53
SC ( AB ) = i , j − i − j + …. = − −
cn bcn acn abcn 8 16
∑ y 2. jk . ∑ y 2. j .. ∑ y..2k .
y 2…. 48.712 +52.632 +50.822 +54.362 99.532+106.99 2 10
j,k j k
SC ( BC )= − − + = − −
an acn abn abcn 8 16
TABLA DE ANOVA
Suma de
Media
Origen cuadrados g.l FCAL FTABLA
cuadrática
tipo III
saborizante 3,699 1 3,699 860,279 F( 2−1) ;2∗2∗2(4 −1 )=4.26
presentación 1,739 1 1,739 404,445 F( 2−1) ;2∗2∗2(4 −1 )=4.26
proteína ,461 1 ,461 107,163 F( 2−1) ;2∗2∗2(4 −1 )=4.26
saborizante *
,047 1 ,047 10,817 F( 2−1) (2−1) ;2∗2∗2 (4−1)=4.26
presentación
saborizante * proteína ,005 1 ,005 1,163 F( 2−1) (2−1) ;2∗2∗2 (4−1)=4.26
UNIVERSIDAD SAN LUIS GONZAGA DE ICA-PERÚ
23
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
presentación *
,005 1 ,005 1,049 F( 2−1) (2−1) ;2∗2∗2 (4−1)=4.26
proteína
saborizante *
presentación * ,003 1 ,003 ,654 F( 2−1) (2−1) (2−1 );2∗2∗2(4−1)=4.26
proteína
Error ,103 24 ,004
Total corregida 6,061 31
DISCUSIÓN:
FACTOR ABC COMO SU FCAL (0.654) < F TABLA (4.26) ENTONCES DECIMOS
ACEPTAMOS H0
CONCLUSIÓN:
CON UN NIVEL DE SIGNIFICACION DEL 5% PUEDES AFIRMAR QUE
SOLO EXISTE DIFERENCIA SIGNIFICATIVA ENTRE LOS
PORCENTAJES DE LOS FACTORES A,B y C, Y TAMBIEN EN LA
INTERACCION DEL FACTOR AB
Factores inter-sujetos
Etiqueta del
N
valor
1 zanahoria 16
saborizante
2 melaza 16
1 molido 16
presentacion
2 pelet 16
1 soya 16
proteina
2 pescado 16
a) PRUEBA DE HOMOGENIDAD
HIPOTESIS:
HO: LAS VARIANZAS DE LOS PORCENTAJES DE ENGORDAMIENTO
DE LOS POLLOSEN LAS 6 SEMANAS CON BALANCEADOS DE
DIFERENTES SABORIZANTES (ZANAHORIAY MELEZA),
PRESENTACIONES (MOLIDO Y PELET) Y PROTEÍNAS (SOYA Y
PESACADO) SON IGUALES
HI: : LAS VARIANZAS DE LOS PORCENTAJES DE ENGORDAMIENTO
DE LOS POLLOSEN LAS 6 SEMANAS CON BALANCEADOS DE
DIFERENTES SABORIZANTES (ZANAHORIAY MELEZA),
PRESENTACIONES (MOLIDO Y PELET) Y PROTEÍNAS (SOYA Y
PESACADO) SON DIFERENTES
3,295 7 24 ,013
DISCUSIÓN:
CONCLUSIÓN:
b) PRUEBA PARAMETRICA
ANALISIS DE VARIANZA DE TRES FACTORES
UNIVERSIDAD SAN LUIS GONZAGA DE ICA-PERÚ
26
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
HIPOTESIS “A”
DISCUSIÓN:
CONCLUSIÓN:
HIPOTESIS “B”
DISCUSIÓN:
CONCLUSIÓN:
HIPOTESIS “C”
DISCUSIÓN:
CONCLUSIÓN:
HIPOTESIS “AB”
UNIVERSIDAD SAN LUIS GONZAGA DE ICA-PERÚ
29
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
HO: NO HAY DIFERENCIA SIGNIFICATIVA ENTRE LOS PORCENTAJES
DE ENGORDAMIENTO POR EFECTO DE LA INTERACCION
(SABORIZANTES* PRESENTACIONES).
HI: SI HAY DIFERENCIA SIGNIFICATIVA ENTRE LOS PORCENTAJES DE
ENGORDAMIENTO POR EFECTO DE LA INTERACCION
(SABORIZANTES* PRESENTACIONES).
DISCUSIÓN:
HIPOTESIS “AC”
UNIVERSIDAD SAN LUIS GONZAGA DE ICA-PERÚ
30
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
HO: NO HAY DIFERENCIA SIGNIFICATIVA ENTRE LOS PORCENTAJES
DE ENGORDAMIENTO POR EFECTO DE LA INTERACCION
(SABORIZANTES*PROTEINA).
HI: SI HAY DIFERENCIA SIGNIFICATIVA ENTRE LOS PORCENTAJES DE
ENGORDAMIENTO POR EFECTO DE LA INTERACCION
(SABORIZANTES*PROTEINA).
DISCUSIÓN:
CONCLUSIÓN:
HIPOTESIS “BC”
UNIVERSIDAD SAN LUIS GONZAGA DE ICA-PERÚ
31
E.AP. ESTADISTICA
ANALISIS DE VARIANZA DE TRES FACTORES
HO: NO HAY DIFERENCIA SIGNIFICATIVA ENTRE LOS PORCENTAJES
DE ENGORDAMIENTO POR EFECTO DE LA INTERACCION
(PRESENTACIONES*PROTEINA).
HI: SI HAY DIFERENCIA SIGNIFICATIVA ENTRE LOS PORCENTAJES DE
ENGORDAMIENTO POR EFECTO DE LA INTERACCION
(PRESENTACIONES*PROTEINA).
DISCUSIÓN:
HIPOTESIS “ABC”
DISCUSIÓN:
Prueba de
kruskal- En estadística, la prueba de Kruskal-
Características:
Extensión de la prueba de la U de Mann-Whitney
Cuando se quiere comparar tres o mas poblaciones
Comparar los rangos promedios observados para las K muestras
Solo se necesita compararse el supuesto de normalidad
Permite decidir si se puede aceptarse las hipótesis de que k muestras
independientes proceden de la misma población o de poblaciones idénticas
con la misma mediana
VENTAJAS E INCONVENIENTES
Ventajas inconvenientes
Puede usarse para sustituir el anova si: Menos potencia menor sensibilidad para
Los datos son ordinales detectar diferencias entre los grupos
No hay normalidad
El tamaño de la muestra es No es fácil construir I.C
pequeña
1. planteamiento de hipótesis:
H 0=las k poblaciones tienen todas la mismadistribucion
H 0=las k poblaciones no tienen todasla mismadistribucion
2. Se ordenan las n observaciones me menor a mayor, y se les asignan rangos
desde 1 hasta n
3. Se obtienen las sumas de los rangos correspondientes a los elementos de
cada muestra Ri y el rango promedio
4. Calcular el estadístico de prueba:
k 2
12 ri
h= ∑
n ( n+1 ) i=1 ni
−3 ( n+1 )
ni=numero de observaciones en el grupo i
r i=rango de las observaciones por gr upo
ni=numero total de observaciones entre todoslos grupos
5. regla de decisión.
Si h es superior al valor crítico de ji-cuadrado; la hipótesis nula se rechaza
Ejercicio:
EN UN EXPERIMENTO PARA DETERMINAR CUAL DE LOS TRES DIFERENTES
SISTEMAS DE MISIL ES MAS RECOMENDABLE, SE MIDIÓ EL PROMEDIO DE
CONSUMO DEL PROPULSOR. UTILICE LA PRUEBA DE KRUSKAL-WALLIS Y EL
NIVEL DE SIGNIFICANCIA DE α =0.05 PARA PROBAR LA HIPÓTESIS DE QUE
LOS PROMEDIOS DE CONSUMO DEL PROPULSOR SON LOS MISMOS PARA LOS
TRES SISTEMAS DE MISIL:
Sistema de misil
1 2 3
18.4
23.2 19.1
24.0
19.8 17.3
16.7
18.1 17.3
22.8
17.6 19.7
19.8
20.2 18.9
18.9
17.8 18.8
19.3
FORMA ANALITICA
CONTRASTES DE HIPÓTESIS:
H 0 : μ 1=μ2=μ3
H 1 : μ1 ≠ μ 2 ≠ μ3
NIVEL DE SIGNIFICACION: α =0.05
2
REGION CRITICA: h> x 0.05=5.991 para v=3-1=2 G.L
RESOLCUION :
Sistema de misil
1 2 3
19 18 7
1 14.5 11
17 6 2.5
14.5 4 2.5
9.5 16 13
5 9.5
8
12
r 1=61.0 r 2=63.5 r 3=65.5
CONCLUSIÓN:
CON UN NIVEL DE SIGNIFICACIÓN DEL α =0.05 AFIRMAMOS QUE
DADO QUE H=1.66 NO CAE EN LA REGIÓN CRITICA H>5.991. SE TIENE
CONTRASTES DE HIPÓTESIS:
H 0 : μ 1=μ2=μ3
H 1 : μ1 ≠ μ 2 ≠ μ3
NIVEL DE SIGNIFICACION: α =0.05
Rangos
sistema a 5 12,20
sistema b 6 10,58
consumo
sistema c 8 8,19
Total 19
Estadísticos de contrastea,b
consumo
Chi-cuadrado 1,663
gl 2
Sig. asintót. ,435
a. Prueba de Kruskal-Wallis
b. Variable de agrupación:
sistema de misil
DISCUSIÓN:
SIG.: (0.435) > 0.05 SE CUMPLE H0 LOS RITMOS DE CONSUMO DE LOS
PROPULSORES SON IGUALES
CONCLUSIÓN:
CON UN NIVEL DE SIGNIFICACIÓN DEL α =0.05 PODEMOS AFIRMAR
QUE LOS RITMOS DE CONSUMO DE LOS PROPULSORES SON IGUALES
Bibliografía:
ANALISIS DE VARIANZA DE TRES FACTORES
WALPOLE MYERS/ PAG. 603 /9na edición/ año 2012
Lara Porras, A.M. (2000). “Diseño Estadístico de Experimentos,
Análisis de la Varianza y Temas Relacionados: Tratamiento
Informático mediante SPSS.” Proyecto Sur de Ediciones.
Diseño de Experimentos/curso 2011-2012_estadística.pdf