Вы находитесь на странице: 1из 24

1

Probabilidad y
Estadística
Inferencial
2

Análisis de varianza de un
factor(ANOVA de un
factor)
3

 El
análisis de la varianza o Anova (Analysis of
Variance) es uno de los test más usados para
comparar dos o más medias y determinar si
son o no iguales entre si.
 ANOVA permite comparar varias medias en
diversas situaciones sobre un asunto de
interés y muy ligado a la base del análisis
multivariante.
 Dado las múltiples situaciones en que se
plantea en este tipo de experimentos, los
realizados mediante la distribución normal o la
t – student resultan muy limitados.
4

 Para realizar el estudio de la ANOVA, se debe


seleccionar muestras aleatorias de tamaño n,
de k poblaciones.
 Las k poblaciones diferentes se clasifican con
base en un criterio único, como tratamientos o
grupos distintos.
 El término tratamiento se utiliza para designar
las diversas clasificaciones:
 Analistas

 Fertilizadores

 regiones del país


 Sectores industriales.
5

Suposiciones e hipótesis
del ANOVA de un solo
factor
6

 Se supone que las k poblaciones son


independientes y que están distribuidas en
forma normal con medias μ1, μ2,..., μk, y
varianza común σ2

 Sesupone que todas las poblaciones tienen la


misma varianza sin importar que sus medias
sean son iguales o no.
 Se trabaja bajo el supuesto de que existe
aleatoriedad.
 Sedesean obtener métodos adecuados para
probar las hipótesis:
H0: μ1 = μ2 = · · · = μk ,
H1 : Al menos dos de las medias no son iguales
7

Método Dentro
 Produce una estimación válida de la varianza
común desconocida de las poblaciones sin
importar si la hipótesis nula de las medias
poblacionales es cierta.
 Estose debe a que la variabilidad de los valores
de la muestra se determinan comparando cada
elemento de los datos con la media muestral.
 Esdecir cada valor obtenido de la población A
se compara con la media de la muestra A, cada
elemento obtenido de la población B se
compara con la media muestral B …
8

Ecuación para estimar la varianza


con el método Dentro
_

 ij
( x  x j ) 2

2 j i
s D c  n  1
Xij =i-enésimo elemento de los datos en el grupo j
Xj = media del grupo j

c = número de grupos
n = número de elementos de la muestra en cada grupo.
9

El doble signo de sumatoria indica que primero deben


sumarse los valores de la derecha y luego los valores de la
izquierda.
Pasos
1. Se encuentran las diferencias entre cada valor “x” y la
media de su grupo, se elevan al cuadrado y se suman.
2. Después se agregan estas sumas para cada grupo.
Este valor se llama suma de los cuadrados Dentro ( SCD)
3. Este valor se divide luego entre los grados de libertad.
Así se obtiene la estimación de la varianza desconocida de
la población.
Grados de libertad: C (n-1) si el número de observaciones
en cada grupo es igual.
10

Ejemplo
Se obtienen muestras de llenado de 4 paquetes de
espinacas congeladas, a partir de 3 contenedores. La
pregunta es si los pesos promedio de los paquetes son
iguales o diferentes entre los tres contenedores.
Seguidamente se ofrecen los pesos de las muestras
(onzas). Se trabaja con un nivel de significancia de 5%

Grupo 1 Grupo 2 Grupo


3
12,4 11,9 10,3
13,7 9,3 12,4
11,5 12,1 11,9
10,3 10,6 10,2
12,0 11,0 11,2 Media de cada grupo
Media global 11,4
11

Ho : 1  2  3
H 1: 1  2  3  almenos  una  media  es  disti nt a
2
   (12.4  12)2  (13.7  12)2  (11.5  12)2  (10.3  12)2  6.19
 x i _ x1
2
  x i _ x 2   (11.9  11)  (9.3  11)  (12.1  11)  (10.6  11)  5.07
2 2 2 2

2
  x i _ x 3  (10.3  11.2)  (12.4  11.2)  (11.9  11.2)  (10.2  11.2)  3.74
2 2 2 2

__

 ij x j
( x  ) 2

6.19  5.07  3.74 15


2 j i
   1.67
s D c  n  1 3(4  1) 9
Se le conoce como error cuadrático medio
12

Método Entre
Este método produce una estimación de la varianza solo si
la hipótesis nula es cierta.
PASOS.
1. Se debe estimar la media poblacional ( con la media de
todos los valores muestrales).
2. Se obtiene la diferencia entre la media de cada grupo y
la media poblacional estimada y estas diferencia se
elevan al cuadrado y se suman. Así se obtiene la suma
de los cuadrado entre (SCE).
3. 3. El valor obtenido anteriormente se divide entre los
grados de libertad.
13

Ecuación para estimar la varianza


de la distribución muestral de
medias
(La primera x es una media y la segunda x lleva los rayita porque es la

 
media global ) 2
n x j  x
j
s 2
E

c 1
s 2
E = Estimación del método entre de la varianza población común
_
Xj = media del grupo j
_ doble
Xj = media global (media de todos los valores) usada como estimación de
la µ
c = número de grupos
n= número de elementos de la muestra en cada grupo si el número de
observaciones es el mismo
14

En el ejemplo anterior.

4 (12.0 11.4)2  (11.0 11.4)2  (11.2 11.4) 2 


 
3 1
4(0.56)
 1.12
3 1
15

La estimación de la varianza poblacional calculada con el


método entre es 1,12

Una vez que se han usado los métodos DENTRO y ENTRE


para estimar la varianza desconocida de la población se
forma un cociente con estas dos estimaciones:

F s E

1.12
 0.6707
2
s D
1.67
16

Para buscar el valor critico en la tabla F, se deben tomar en


cuenta el nivel de significancia ( 5%) y los grados de libertad
del numerador (2) y del denominador (9)

2
s E

c 1

2horizontal
s
2
c( n  1) 9vertical
d

El valor critico F tablas = 4,26


El valor F calculado esta dentro de la región de aceptación,
se acepta por lo tanto la hipótesis nula que dice que todas
las medias aritméticas son iguales
17

Tabla ANOVA

Fuente de Suma de Coeficiente


GL Varianza
variación cuadrados F

Entre
2 0,56 1,12 0,6707
grupos
Dentro  
9 15 1,67
grupos
18
 Ejemplo No. 2
 El Director Administrativo de una gran empresa
industrial desea determinar si los tres programas de
capacitación distintos tienen efectos diferentes en los
niveles de productividad de los empleados.
 Se seleccionan aleatoriamente 14 empleados y se
asignan a uno de los tres programas.
 Al terminar la capacitación, cada empleado responde a
un examen para determinar su competencia. Se colocan
cuatro empleados al primer programa de capacitación, y
cinco en cada uno de los otros dos programas.
 Cada uno de estos tres grupos se trata de manera
independiente como muestras separadas.
 Se trabaja con un nivel de significancia de 1 %
19

Tratamientos

Programa 1 Programa Programa


2 3
85 80 82
72 84 80
83 81 85
80 78 90
82 88
Media 80 81 85

Media global= (85+72+83+…+90+88)÷14=82,14


20
Ejemplo No. 3
 Se quiere evaluar la eficacia de distintas dosis de un
fármaco contra la hipertensión arterial, comparándola
con la de una dieta sin sal.
Para ello se seleccionan al azar 25 hipertensos y se
distribuyen aleatoriamente en 5 grupos. Al primero de ellos
no se le suministra ningún tratamiento, al segundo una
dieta con un contenido pobre en sal, al tercero una dieta
sin sal, al cuarto el fármaco a una dosis determinada y al
quinto el mismo fármaco a otra dosis. Las presiones
arteriales sistólicas de los 25 sujetos al finalizar los
tratamientos son:
21
 Con α=0,05
 La tabla de ANOVA es:

Fuente de Suma de
GL Varianza F
variación cuadrados
Entre grupos 4 2010,64 502,66 11,24
Dentro grupos 20 894,4 44,72  
Total 24 2905,04    

 Como F0,05(4,20) =2,87y 11,24>2,87 rechazamos


la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.
22

Ejercicio
Los miembros de un equipo ciclista se
dividen al azar en tres grupos que entrenan
con métodos diferentes. El primer grupo
realiza largos recorridos a ritmo pausado, el
segundo grupo realiza series cortas de alta
intensidad y el tercero trabaja en el
gimnasio con pesas y se ejercita en el
pedaleo de alta frecuencia. Después de un
mes de entrenamiento se realiza un test de
rendimiento consistente en un recorrido
cronometrado de 9 Km. Los tiempos
empleados fueron los siguientes:
23

Método I Método II Método III

15 14 13

16 13 12

14 15 11

15 16 14

17 14 11
24
A un nivel de confianza del 95% ¿Puede
considerarse que los tres métodos producen
resultados equivalentes? O por el contrario
¿Hay algún método superior a los demás?

Вам также может понравиться