Вы находитесь на странице: 1из 10

Análisis de Varianza

1 © 2 01 8 Asturias Corporación Universitaria


Análisis de Varianza

Índice

1 Introducción ............................................................................................................................................................ 3
2 Conceptos Básicos ............................................................................................................................................. 3
2.1 Unidad Experimental............................................................................................................... 3
2.2 Tratamientos ................................................................................................................................ 3
2.3 Factor ............................................................................................................................................... 3
2.4 Nivel del factor ........................................................................................................................... 3
2.5 Replicación.................................................................................................................................... 4
2.6 Modelo Asociado a los Datos ............................................................................................ 4
2.7 Modelo de Efectos Fijos ....................................................................................................... 4
2.8 Modelo de Efectos Aleatorios ........................................................................................... 4
3 Análisis del Modelo de Efectos Fijos ....................................................................................................... 4
3.1 Análisis de Varianza de un Solo Factor ........................................................................ 5
3.2 Descomposición de las Sumas de Cuadrados Total........................................... 6
3.3 Análisis Estadístico: Diseño Completamente Aleatorizado (DCA) ................ 7
4 Resumen ................................................................................................................................................................ 10
5 Referencias Bibliográficas ........................................................................................................................... 10

02 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

Objetivos
 Objetivo 1: Aplicación de la estadística a un número de poblaciones objeto mayor
a dos.

 Objetivo 2: Aplicación de técnicas de descomposición de la variabilidad.

 Objetivo 3: Determinar la existencia o ausencia de diferencias entre las medias de


las poblaciones a través de la metodología del análisis de varianza.

1 Introducción
En las anteriores unidades de aprendizaje observamos los distintos métodos de
estimación en el caso que se tuvieran dos poblaciones. Esta inferencia basada tanto en
los intervalos de confianza como en las pruebas de hipótesis se limita al estudio de
máximo dos poblaciones.

Sin embargo en la mayoría de los estudios el número de poblaciones objeto es mayor


“Hasta ahora hemos visto la estadística a la cantidad mencionada. Esto hace necesario la aplicación de técnicas de
aplicada a un máximo de dos
descomposición de la variabilidad en función del interés que existe en sus diferencias.
poblaciones, no obstante en la mayoría
de estudios el número de poblaciones
Dicho esto es lógico pretender determinar la existencia o ausencia de diferencias entre
es mayor” las medias de las poblaciones a través de la metodología del análisis de varianza.

2 Conceptos Básicos

2.1 Unidad Experimental

Son los elementos sobre los cuales se hacen las mediciones y a los cuales un
tratamiento puede ser asignado.

2.2 Tratamientos

Son el conjunto de circunstancias creadas para el experimento en respuesta a la


hipótesis de investigación y son el centro de la misma.

2.3 Factor

Es una variable experimental que posee la cualidad de ser controlable y que se cree
influyente en la respuesta.

2.4 Nivel del factor

Es un valor específico de un factor.

03 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

2.5 Replicación

Es la repetición total o parcial de un experimento en dos o más conjuntos de


condiciones.

2.6 Modelo Asociado a los Datos

Para efectos didácticos y de eficacia a la hora de describir el modelo se presenta la


siguiente forma de modelo:
𝑖 = 1,2, … , 𝑎
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖 {
𝑗 = 1, 2, … , 𝑛

Donde 𝑦𝑖𝑗 es la 𝑖𝑗 − é𝑠𝑖𝑚𝑎 observación, 𝜇 es la media general asociada a todas las


observaciones del diseño, 𝜏𝑖 se considera el efecto del 𝑖 − é𝑠𝑖𝑚𝑜 tratamiento y 𝜀𝑖 un
componente de error aleatorio.

2.7 Modelo de Efectos Fijos

Es aquel en el cual los tratamientos son fijados de antemano para el estudio de interés.
“En el modelo de efectos fijos los
tratamientos son fijados de antemano
2.8 Modelo de Efectos Aleatorios
mientras que en el modelo de efectos
aleatorios los tratamientos son escogidos
Es aquel en el cual los tratamientos son escogidos de manera aleatoria para el estudio
de manera aleatoria”
de interés.

3 Análisis del Modelo de Efectos Fijos


Como notamos en la sección anterior, el análisis de varianza contiene sus bases en un
modelo de regresión donde la variable explicativa es de tipo dicótoma, es decir, esta
variable indica la pertenencia o no pertenencia de la observación al nivel del factor o
tratamiento.
Dicho esto, nuestro interés se centrará entonces no en la estimación de los parámetros del
“El interés se centra en la existencia de modelo, sino más bien, en la existencia de diferencias significativas entre estas
diferencias significativas entre estimaciones. Siendo el modelo de efectos fijos el más utilizado, su estudio nos permitirá la
estimaciones”
fácil compresión y aplicación de los siguientes conceptos.

2.1. Descripción de los Componentes del Modelo

Como hemos visto, estos modelos de análisis de varianza se utilizan con el interés de
evidenciar las diferencias entre niveles de un factor. Así, para un modelo de efectos fijos:
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖

Con 𝑖 = 1,2,3 y 𝑗 = 1,2, … , 𝑛 reescribimos el modelo como sigue:

𝑦𝑖 = 𝜇 + 𝜏1 𝑥𝑖1 + 𝜏2 𝑥𝑖2 + 𝜏3 𝑥𝑖3 + 𝜀𝑖

04 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

Donde las 𝑥′𝑠 se definen de la siguiente manera


1 𝑠𝑖 𝑒𝑙 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜 𝑗 𝑒𝑠𝑡á 𝑒𝑛 𝑒𝑙 𝑖 − é𝑠𝑖𝑚𝑜 𝑓𝑎𝑐𝑡𝑜𝑟,
𝑥𝑖𝑗 = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Ejemplo 1: Suponga que un investigador está interesado en el efecto del nivel de


formación académica en la inversión que hacen los integrantes cabezas de familia de
un hogar en productos tecnológicos. Veamos cómo queda evidenciado el modelo con
base en la siguiente tabla.

Nivel de formación

Bachillerato Pregrado Posgrado

𝑦11 𝑦21 𝑦31

𝑦12 𝑦22

𝑦12

Tabla 1: Tabla ejemplo 1

Entonces el modelo se puede escribir como:


𝑦11 = 𝜇 + 𝜏1 (1) + 𝜏2 (0) + 𝜏3 (0) + 𝜀11
𝑦12 = 𝜇 + 𝜏1 (1) + 𝜏2 (0) + 𝜏3 (0) + 𝜀12
𝑦13 = 𝜇 + 𝜏1 (1) + 𝜏2 (0) + 𝜏3 (0) + 𝜀13
𝑦21 = 𝜇 + 𝜏1 (0) + 𝜏2 (1) + 𝜏3 (0) + 𝜀21
𝑦22 = 𝜇 + 𝜏1 (0) + 𝜏2 (1) + 𝜏3 (0) + 𝜀22
𝑦31 = 𝜇 + 𝜏1 (0) + 𝜏2 (0) + 𝜏3 (1) + 𝜀31

Donde los unos y ceros son los valores de la variable dicótoma que indica la pertenecía o
no al nivel del factor de la observación.

3.1 Análisis de Varianza de un Solo Factor

El objetivo es comparar los efectos medios de los 𝑎 niveles de los tratamientos sobre las
“El objetivo del análisis de varianza de un
𝑛 observaciones de una variable, como se muestra en la siguiente tabla:
solo factor es comparar los efectos medios
de los α niveles de tratamientos sobre las n
observaciones de una variable”

05 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

Tratamiento
Observaciones Totales Medias
(Nivel)

𝑦11 𝑦12 ⋯ 𝑦1𝑛 𝑦1. 𝑦̅𝑖.


1
𝑦21 𝑦22 ⋯ 𝑦2𝑛 𝑦2. 𝑦̅𝑖.
2
⋮ ⋮ ⋱ ⋮ ⋮ ⋮

𝑦𝑖1 𝑦𝑖2 ⋯ 𝑦𝑖𝑛 𝑦𝑖. 𝑦̅𝑖.
𝑛
𝑦.. 𝑦̅..

Tabla 2: Tabla de diseño

Ahora se pueden definir las cantidades del arreglo correspondiente al diseño para la
elaboración de una ANAVA (Análisis de varianza), entonces veamos que:
𝑛

𝑦𝑖. = ∑ 𝑦𝑖𝑗
𝑗=1

Representa el total de las observaciones bajo el 𝑖 − é𝑠𝑖𝑚𝑜 tratamiento. Además se


definen como:
𝑦𝑖.
𝑦̅𝑖. =
𝑛

Que representa el promedio de las observaciones bajo el 𝑖 − é𝑠𝑖𝑚𝑜 tratamiento y


finalmente
𝑎 𝑛
𝑦..
𝑦.. = ∑ ∑ 𝑦𝑖𝑗 ; 𝑦̅.. =
𝑁
𝑖=1 𝑗=1

Donde 𝑦̅.. representa el gran promedio de todas las observaciones o la llamada media
general común a todos los datos en la muestra y 𝑁 = 𝑎𝑛.
El interés se centra entonces en probar la siguiente hipótesis
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛

𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 Para algún par (𝑖 ≠ 𝑗)

3.2 Descomposición de las Sumas de Cuadrados Total

El nombre de análisis de varianza, viene del origen etimológico de análisis, que es soltar
o descomponer las cosas para ver cómo funcionan.
Para un mejor entendimiento de cada componente de varianza se examinan por
separado, ya que esta se puede descomponer por tener grupos de observaciones
pertenecientes a cada tratamiento, lo que da lugar a las diferencias entre los tratamientos y
dentro de los tratamientos como veremos entonces la descomposición de la
variabilidad total queda como sigue.

06 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 + 𝑆𝑆𝐸𝑟𝑟𝑜𝑟

Donde 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 se le llama comúnmente sumas de cuadrados debido a los


tratamientos y a 𝑆𝑆𝐸𝑟𝑟𝑜𝑟 sumas de cuadrados debido al error. Además estas sumas se
definen como
𝑎 𝑛
2
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅.. )
𝑖=1 𝑗=1

Que se usa como medida de la variabilidad total de las observaciones.


𝑎 𝑛
2
𝑆𝑆𝐸𝑟𝑟𝑜𝑟 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. )
𝑖=1 𝑗=1

Que se usa como medida de la variabilidad debida a los errores y determina así mismo
la cantidad de información que no explica el modelo.
𝑎

𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 = 𝑛 ∑(𝑦̅𝑖. − 𝑦̅.. )2


𝑖=1

Que se usa como medida de la variabilidad debida a los tratamientos y determina así
mismo la cantidad de información que es explicada por el modelo.

3.3 Análisis Estadístico: Diseño Completamente Aleatorizado (DCA)

A continuación el proceso da un paso hacia la investigación de cómo se puede


efectivamente probar la hipótesis de interés 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑎 . Teniendo en cuenta
las propiedades distribucionales de las sumas de cuadrados, se construye el estadístico
de prueba con base en los datos de la Tabla ANAVA para la partición de sumas de
cuadrados.

07 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

Grados

De Suma de Cuadrados
Fuente de variación F calculado
libertad Cuadrados Medios

a-1 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝐹0


Entre los tratamientos 𝑀𝑆𝑇𝑡𝑜𝑠
N-a
𝑆𝑆𝐸 𝑀𝑆𝐸 =
Error (Dentro de los 𝑀𝑆𝐸
Tratamientos) 𝑆𝑆𝑇𝑜𝑡𝑎𝑙
Total

Tabla 3: Tabla ANAVA para el modelo con un factor del modelo de efectos fijos

Donde
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 =
𝑎−1

Y
𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑁−𝑎

Se les llama cuadrados medios. Ahora bajo el supuesto de que la hipótesis nula es
cierta, el cociente:
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 /(𝑎 − 1)
𝐹0 =
𝑆𝑆𝐸 /(𝑁 − 𝑎)

Se distribuye 𝐹 con 𝑎 − 1 y 𝑁 − 𝑎 grados de libertad y es el llamado estadístico de


prueba para la hipótesis de que no existen diferencias significativas en las medias de los
tratamientos. Esta es una prueba a una cola superior y la decisión es 𝐻0 deberá
rechazarse y concluirse que hay diferencias en las medias de los tratamientos si:

𝐹0 > 𝐹𝛼,𝑎−1,𝑁−𝑎

De manera alternativa como se mostró en la anterior unidad de aprendizaje podrá


utilizarse el criterio del 𝑃- valor para la toma de una decisión.
Nota: El cálculo de la tabla ANAVA y sus respectivos valores están programados en
paquetes de software estadísticos y muestran la partición relacionada en la Tabla 3. Se
recomienda que se estudien algunos de estos software y su salida ya que para
verdaderos estudios el cálculo a mano de estos se hace bastante tedioso y complicado.
Ejemplo 2: Se quiere determinar si cuatro temperaturas específicas de horneado
afectan la densidad de cierto tipo de ladrillo. Los datos del experimento se muestran en
la siguiente tabla.

08 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

Temperatura Densidad

21.8 21.9 21.7 21.6


100
21.7 21.4 21.5 21.4
125
21.9 21.8 21.8 21.6
150
21.9 21.7 21.8 21.4
175

Tabla 4: Tabla ejemplo 2

¿Afecta la temperatura de horneado la densidad del ladrillo?


Entonces reescribiendo las expresiones como sigue y haciendo los respectivos cálculos
tenemos que:
Suma de cuadrados total:
𝑎 𝑛
2
𝑦..2 346.92
𝑆𝑆𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = 7521.71 − = 0.884375
𝑁 16
𝑖=1 𝑗=1

Suma de cuadrados de los tratamientos


𝑎
𝑦𝑖2 𝑦..2 346.92
𝑆𝑆𝑇𝑡𝑜𝑠 = ∑ − = 7521.4125 − = 0.186875
𝑛 𝑁 16
𝑖=𝑎

Suma de cuadrados del error


𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝑇𝑡𝑜𝑠 = 0.2975

Luego podemos calcular la tabla ANAVA como sigue:

Grados Suma de Cuadrados


Fuente de variación F calculado
De libertad Cuadrados Medios

Temperaturas 3 0.186875 0.6229 𝐹0 = 2.51

Error 12 0.2975 0.02479

Total 15 0.484375

Tabla 5: Tabla ANAVA para el ejemplo 2

Ahora 𝑭𝟎 = 𝟐. 𝟓𝟏 < 𝟓. 𝟗𝟓 = 𝑭(𝟎.𝟎𝟏,𝟑,𝟏𝟐) luego la decisión es que no se puede rechazar 𝑯𝟎 en


favor de 𝑯𝟏.

09 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Análisis de Varianza

4 Resumen
 Es lógico pretender determinar la existencia o ausencia de diferencias entre las
medias de las poblaciones a través de la metodología del análisis de varianza.

 Los conceptos básicos involucrados en este estudio son: la unidad experimental,


los tratamientos, el factor, el nivel del factor, la replicación, el modelo asociados a
los datos, el modelo de efectos fijos y el modelo de efectos aleatorios.

 El análisis de varianza contiene sus bases en un modelo de regresión donde la


variable explicativa es de tipo dicótoma, es decir, esta variable indica la
pertenencia o no pertenecía de la observación al nivel del factor o tratamiento.

5 Referencias Bibliográficas
 Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A. S., y
otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz: Servicio de
Publicaciones de la Universidad de Cádiz.

 Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística Aplicada a la
Ingeniería. México: Limusa Wiley.

 Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.

010 ASTURIAS CORPORACIÓN UNIVERSITARIA 2018®


Not a Técnica preparada por Ast urias Corporación Universit aria . Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.

Вам также может понравиться