Вы находитесь на странице: 1из 22

FACULTAD

Ciencias empresariales CARRERA Pfs. ASIGNATURA TEMA : ADM Y Negocios Internacionales. : Estadsticas II : Anlisis de varianzas y diseo de experimento, tabla ANOVA y prueba de fishen para comparacin de medias. : : Wilber Carren Moroco.

DOCENTE ALUMNOS

2013

PRESENTACIN Tenemos el grato honor de presentarlos un trabajo en equipo sobre realizado por los alumnos de la UAP filial Juliaca de la carrera profesional: Administracin y Negocios Internacionales. Realizando una recopilacin de conocimientos e importantes para nuestra rea.ADM. El tema a tratar se titula ANLISIS DE VARIANZA

DEDICATORIA El presente trabajo de investigacin es dedicado especialmente todo lector que se complazca en leer. A nuestra Docente por su apoyo incondicional y la oportunidad, para as realizar este trabajo. A nuestros padres que han sabido brindarnos su apoyo moral y econmico para as ser buenos profesionales en el futuro administrativo.

AGRADECIMIENTO Agradecemos infinitamente a DIOS que nos da la fuerza, nos gua e ilumina nuestro camino para poder realizar bien nuestro presente trabajo. A nuestro apreciado Docente que gracias a l pudimos investigar mucho ms sobre lo que se refiere al tema.

Indice 1. Introduccin 2. Bases del anlisis de la varianza 3. Modelos de anlisis de la varianza 4. Contrates de hiptesis en un anlisis de la varianza de dos factores

5. Prueba de hiptesis con la razn F de Fisher

6.Caractersticas de la distribucin F
7.Determinacin de los grados de libertad 8.Uso de la tabla de F del anlisis de variancia (ANOVA) 9.Clculo de la razn F a partir de datos mustrales 10. comclusiones. 11.aportes del grupo. 12.Bibliografa

1. INTRODUCCIN El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos motivos: En primer lugar, y como se realizaran simultnea e independientemente varios contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico, para lo que, en la hiptesis . Si se realizan m contrastes independientes, la probabilidad nula, hay una probabilidad idad de que, en la hiptesis nula, ningn estadstico supere el valor )m, que para )m, por lo tanto, la probabilidad de que alguno lo supere es 1 - (1 - crtico es (1 - valores /m, aunque resulta un mtodo muy conservador., usando en su lugar m. Una primera solucin, denominada mtodo de Bonferroni, consiste en bajar el valor de prximos a 0 es aproximadamente igual a de uno. Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones, la hiptesis nula es que todas las muestras provienen de la misma poblacin y, sin embargo, para cada comparacin, la estimacin de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas. El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que esto: es un mtodo que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna manera, es la base del anlisis multivariante.

ANLISIS DE VARIANZA
2. BASES DEL ANLISIS DE LA VARIANZA

Supnganse k muestras aleatorias independientes, de tamao n, extradas de una nica poblacin normal. A partir de ellas existen dos maneras independientes de estimar la varianza de la poblacin 1) Una llamada varianza dentro de los grupos (ya que slo contribuye a ella la varianza dentro de las muestras), o varianza de error, o cuadrados medios2 y la media de k estimadores centrados es tambin un estimador centrado y ms eficiente que todos ellos). MSE es un cociente: al numerador se le llama suma de cuadrados del error y se representa por SSE y al denominador grados dedel error, y habitualmente representada por MSE (Mean Square Error) o MSW (Mean Square Within) que se calcula como la media de las k varianzas muestrales (cada varianza muestral es un estimador centrado de libertad por ser los trminos independientes de la suma de cuadrados. 2) Otra llamada varianza entre grupos (slo contribuye a ella la varianza entre las distintas muestras), o varianza de los tratamientos, o cuadrados medios de los tratamientos y representada por MSA o MSB (Mean Square Between). Se calcula a partir de la varianza de las medias muestrales y es tambin un cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le representa por SSA) y al denominador (k-1) grados de libertad. MSA y MSE, estiman la varianza poblacional en la hiptesis de que las k muestras provengan de la misma poblacin. La distribucin muestral del cociente de dos estimaciones independientes de la varianza de una poblacin normal es una F con los grados de libertad correspondientes al numerador y denominador respectivamente, por lo tanto se puede contrastar dicha hiptesis usando esa distribucin. Si en base a este contraste se rechaza la hiptesis de que MSE y MSA estimen la misma varianza, se puede rechazar la hiptesis de que las k medias provengan de una misma poblacin. Aceptando que las muestras provengan de poblaciones con la misma varianza, este rechazo implica que las medias poblacionales son distintas, de modo que con un nico contraste se contrasta la igualdad de k medias. Existe una tercera manera de estimar la varianza de la poblacin, aunque no es independiente de las anteriores. Si se consideran las kn observaciones como una nica muestra, su varianza muestral tambin es un estimador centrado de s 2: Se suele representar por MST, se le denomina varianza total o cuadrados medios totales, es tambin un cociente y al numerador se le llama suma de cuadrados total y se representa por SST, y el denominador (kn -1) grados de libertad. Los resultados de un anova se suelen representar en una tabla como la siguiente:
Fuente de variacin G.L. Entre grupos k-1 Tratamientos SS SSA MS SSA/(k-1) F MSA/MSE

Dentro Error Total

(n-1)k

SSE

SSE/k(n-1)

kn-1

SST

Y el cociente F se usa para realizar el contraste de la hiptesis de medias iguales. La regin crtica para dicho contraste es F > (k-1,(n-1)k)F Algunas propiedades Es fcil ver en la tabla anterior que GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 = GLtotal No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad, llamada identidad o propiedad aditiva de la suma de cuadrados: SST = SSA + SSE El anlisis de la varianza se puede realizar con tamaos muestrales iguales o distintos, sin embargo es recomendable iguales tamaos por dos motivos: La F es insensible a pequeas variaciones en la asuncin de igual varianza, si el tamao es igual. Igual tamao minimiza la probabilidad de error tipo II.

3. MODELOS DE ANLISIS DE LA VARIANZA


El anova permite distinguir dos modelos para la hiptesis alternativa: Modelo I o de efectos fijos en el que la H1 supone que las k muestras son muestras de k poblaciones distintas y fijas. Modelo II o de efectos aleatorios en el que se supone que las k muestras, se han seleccionado aleatoriamente de un conjunto de m>k poblaciones. Un ejemplo de modelo I de anova es que se asume que existen cinco poblaciones (sin tratamiento, con poca sal, sin sal, etc.) fijas, de las que se han extrado las muestras. Un ejemplo de modelo II sera: un investigador est interesado en determinar el contenido, y sus variaciones, de grasas en las clulas hepticas de cobayas; toma del animalario 5 cobayas al azar y les realiza, a cada una, 3 biopsias hepticas. La manera ms sencilla de distinguir entre ambos modelos es pensar que, si se repitiera el estudio un tiempo despus, en un modelo I las muestras seran iguales (no los individuos que las forman) es decir corresponderan a la misma situacin, mientras que en un modelo II las muestras seran distintas. Aunque las asunciones iniciales y los propsitos de ambos modelos son diferentes, los clculos y las pruebas de significacin son los mismos y slo difieren en la interpretacin y en algunas pruebas de hiptesis suplementarias. ANLISIS DE LA VARIANZA DE DOS FACTORES Es un diseo de anova que permite estudiar simultneamente los efectos de dos fuentes de variacin. En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no, diferencia en la evolucin segn el sexo. En un anova de dos vas se clasifica a los individuos de acuerdo a dos factores (o vas) para estudiar simultneamente sus efectos. En este ejemplo se haran cinco grupos de tratamiento para los hombres y otros cinco para las mujeres, en total diez grupos; en general, si el

primer factor tiene a niveles y el segundo tiene b, se tendrn ab muestras o unidades experimentales, cada una con n individuos o repeticiones. Una observacin individual se representa como: El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo factor y el tercero la observacin dentro de la muestra. Los factores pueden ser ambos de efectos fijos (se habla entonces de modelo I), de efectos aleatorios (modelo II) o uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El modelo matemtico de este anlisis es: modelo I modelo II modelo mixto ijk las desviaciones aleatorias alrededor de las medias, que tambin se asume que estn normalmente distribuidas, son independientes y tienen media 0 y varianza s 2.j o Bj el efecto del nivel j del 2 factor y donde m es la media global, a i o Ai el efecto del nivel i del 11 factor, A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo aade la de aditividad de los efectos de los factores. A los trminos (a b )ij, (AB)ij, (a B)ij, se les denomina interaccin entre ambos factores y representan el hecho de que el efecto de un determinado nivel de un factor sea diferente para cada nivel del otro factor. Para entender mejor este concepto de interaccin veamos un ejemplo sencillo sobre un anova de dos factores, cada uno con dos niveles: supngase un estudio para analizar el efecto de un somnfero teniendo en cuenta el sexo de los sujetos. Se eligen al azar dos grupos de hombres y otros dos de mujeres. A un grupo de hombres y otro de mujeres se les suministra un placebo y a los otros grupos el somnfero. Se mide el efecto por el tiempo que los sujetos tardan en dormirse desde el suministro de la pldora. Se trata de un anova de dos factores (sexo y frmaco) fijos, cada uno con dos niveles (hombre y mujer para el sexo y somnfero y placebo para el frmaco). Los dos tipos de resultados posibles se esquematizan en la figura

AB En la figura A se observa que las mujeres tardan ms en dormirse, tanto en el grupo tratado como en el grupo placebo (hay un efecto del sexo) y que lostratados con placebo tardan ms en dormirse que los tratados con somnfero en ambos sexos (hay un efecto del tratamiento). Ambos efectos son fcilmente observables.

Sin embargo en la figura B es difcil cuantificar el efecto del somnfero pues es distinto en ambos sexos y, simtricamente, es difcil cuantificar el efecto del sexo pues es distinto en ambos grupos de tratamiento. En este caso, se dice que existe interaccin. Podra, incluso, darse el caso de que se invirtieran los efectos de un factor para los distintos niveles del otro, es decir, que las mujeres se durmieran antes con el somnfero y los hombres antes con el placebo. La interaccin indica, por tanto, que los efectos de ambos factores no son aditivos: cuando se dan juntos, su efecto no es la suma de los efectos que tienen cuando estn por separado, por lo que, si en un determinado estudio se encuentra interaccin entre dos factores, no tiene sentido estimar los efectos de los factores por separado. A la interaccin positiva, es decir, cuando el efecto de los factores actuando juntos es mayor que la suma de efectos actuando por separado, en Biologa se le denomina sinergia o potenciacin y a la interaccin negativa inhibicin. En el ejemplo de la figura B, se dira que el ser mujer inhibe el efecto del somnfero, o que el ser hombre lo potencia (segn el sexo que se tome como referencia). 4. CONTRATES DE HIPTESIS EN UN ANLISIS DE LA VARIANZA DE DOS FACTORES Del mismo modo que se hizo en el anova de una va, para plantear los contrastes de hiptesis habr que calcular los valores esperados de los distintos cuadrados medios. Los resultados son: Modelo I
MS Valor esperado

MSA

MSB

MSAB

MSE

Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen como una F con los grados de libertad correspondientes y permiten contrastar, respectivamente, las hiptesis: no existe interaccin (MSAB/MSE)

no existe efecto del primer factor, es decir, diferencias entre niveles del primer factor (MSA/MSE)

no existe efecto del segundo factor (MSB/MSE)

10

Si se rechaza la primera hiptesis de no interaccin, no tiene sentido contrastar las siguientes. En este caso lo que est indicado es realizar un anlisis de una va entre las ab combinaciones de tratamientos para encontrar la mejor combinacin de los mismos.

5. PRUEBA DE HIPTESIS CON LA RAZN F DE FISHER


A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos valores, el anlisis de varianza emplea la razn de las estimaciones, dividiendo la estimacin intermediante entre la estimacin interna

Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico britnico, cuyas teoras estadsticas hicieron mucho ms precisos los experimentoscientficos. Sus proyectos estadsticos, primero utilizados en biologa, rpidamente cobraron importancia y fueron aplicados a la experimentacin agrcola, mdica e industrial. Fisher tambin contribuy a clarificar las funciones que desempean la mutacin y la seleccin natural en la gentica, particularmente en la poblacin humana. El valor estadstico de prueba resultante se debe comparar con un valor tabular de F, que indicar el valor mximo del valor estadstico de prueba que ocurra si H0 fuera verdadera, a un nivel de significacin seleccionado. Antes de proceder a efectuar este clculo, se debe considerar las caractersticas de la distribucin F

6. Caractersticas de la distribucin F
- Existe una distribucin F diferente para cada combinacin de tamao de muestra y nmero de muestras. Por tanto, existe una distribucin F que se aplica cuando se toman cinco muestras de seis observaciones cada una, al igual que una distribucin F diferente para cinco muestras de siete observaciones cada una. A propsito de esto, el nmero distribuciones de muestreo diferentes es tan grande que sera poco prctico hacer una extensa tabulacin de distribuciones. Por tanto, como se hizo en el caso de la distribucin t, solamente se tabulan los valores que ms comnmente se utilizan. En el caso de la distribucin F, los valores crticos para los niveles 0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones de tamaos de muestra y nmero de muestras.

La razn ms pequea es 0. La razn no puede ser negativa, ya que ambos trminos de la razn F estn elevados al cuadrado. Por otra parte, grandes diferencias entre los valores medios de la muestra, acompaadas de pequeas variancias muestrales pueden dar como resultado valores extremadamente grandes de la razn F.

11

- La forma de cada distribucin de muestreo terico F depende del nmero de grados de libertad que estn asociados a ella. Tanto el numerador como el denominador tienen grados de libertad relacionados.

7. DETERMINACIN DE LOS GRADOS DE LIBERTAD


Los grados de libertad para el numerador y el denominador de la razn F se basan en los clculos necesarios para derivar cada estimacin de la variancia de la poblacin. La estimacin intermediante de variancia (numerador) comprende la divisin de la suma de las diferencias elevadas al cuadrado entre el nmero de medias (muestras) menos uno, o bien, k - 1. As, k - 1 es el nmero de grados de libertad para el numerador. En forma semejante, el calcular cada variancia maestral, la suma de las diferencias elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se divide entre el nmero de observaciones de la muestra menos uno, o bien, n - 1. Por tanto, el promedio de las variancias mustrales se determina dividiendo la suma de las variancias de la muestra entre el nmero de muestras, o k. Los grados de libertad para el denominador sonentonces, k(n -l).

8. USO DE LA TABLA DE F DEL ANLISIS DE VARIANCIA (ANOVA)


En la tabla 5 se ilustra la estructura de una tabla de F para un nivel de significacin de 0,01 o 1% y 0,05 o 5%.

12

9. Clculo de la razn F a partir de datos mustrales

Para calcular F se debe seguir el siguiente procedimiento 1) Calcular la estimacin interna (Denominador)

2) Calcular la estimacin intermediante (Numerador)

Ejemplo ilustrativo Los pesos en kg por 1,7 m de estatura se ilustran en la siguiente tabla. La finalidad es determinar si existen diferencias reales entre las cuatro muestras. Emplear un nivel de significacin de 0,05

13

Solucin: Las hiptesis Nula y Alternativa son:

Calculando las medias aritmticas se obtiene:

14

Se llena la siguiente tabla para calcular las varianzas mustrales:

Remplazando los datos en la frmula de la varianza se obtienen las varianzas de las 4 muestras.

15

Calculando la estimacin interna de varianza se obtiene:

Para calcular la estimacin intermediante de varianza primero se calcular la varianza de las medias aritmticas

Se llena la siguiente tabla:

16

Se remplaza los datos de la tabla para calcular varianza de las medias aritmticas

Calculando la estimacin intermediante de varianza se obtiene:

Los clculos en Excel se muestran en la siguiente figura:

17

La grfica elaborada en Winstats y Paint se muestra en la siguiente figura:

18

Decisin:

19

10.CONCLUSIONES: El anlisis de varianza o ms conocido como anova, que consiste en hacer una prueba para determinar si tres o ms medias poblacionales son iguales o no que analiza son las varianzas mustrales, donde se utiliza con la distribucin F como estadstico de prueba que consiste en una prueba de hiptesis.

20

11. APORTE DEL GRUPO: En si es un mtodo q facilita y ayuda al interesado a realizar sus trabajos con mayor facilidad y utilizando los programas (tecnologa es ms satisfactorio para todos vinculados ala rama.)

21

12. REFERENCIA BIBLIOGRFICA:


SUREZ, Mario, (2012), Interaprendizaje de Probabilidades y Estadstica Inferencial con Excel, Winstats y Graph, Primera Edicin. Imprenta M & V, Ibarra, Ecuador. V. Abraira, A. Prez de Vargas Mtodos Multivariantes en Bioestadstica. Ed. Centro de Estudios Ramn Areces. 1996. Trabajo enviado por. Martnez Padilla Omar Autor: Mario Orlando Surez Ibujes

22

Вам также может понравиться