Вы находитесь на странице: 1из 46
CAPITUL Analisis de la varianza - rg any ree 2) 15.1, Comparacion de las medias 18.3. El contraste de Kruskal-Wallis de varias poblaciones 15.4, Andlisis de la varianza bifactorial: 15.2. Anélisis de la varianza de un factor ‘una observacién por celda, ‘Comparaciones miitiples entre medias bloques aleatorizados de subgrupos 15.5. Anélisis de la varianza bitactorial: Modelo poblacional on el caso dol andlisis ‘més de una observacién por celia de la varianza de un factor Introduccion En ias aplicaciones empresariales modemas del andlisis estadistico, hay algunas situaciones en las ‘que es necesario hacer comparaciones de procesos en mas de dos niveles. Por ejemplo, al director de Circuitos Integrados, S.A. le gustaria saber si con alguno de los cinco procesos existentes para ‘montar components es mayor la productividad por hora y menor el némero de componentes de- fectuosos. Los andlisis para responder a astas cuestiones se conocen con ol nombre general de iserto experimental. Un importante instrumento para organizar y analizar los datos de este experi ‘mento se llama andiisis de la varianza, que es el tema de este capitulo. El experimento también podria extenderse a un disefio que incluyera la cuestién de cual de cuatro fuentes de materias pri- mas aumenta mds la productividad en combinacién con los diferentes métodos de produccién. Esta cuestién podria responderse con un andlisis de la varianza de dos factores. Por poner otro ejemplo, el presidente de una empresa de coreales tiene interés en comparar las ventas semanales de cua- tro marcas diferentes en tres tiendes distintas. Una vez més, tenemos un disefio de un problema que se puede analizar utlizando el andlisis de la varianza. En ol Apartado 13.2, mostramos que también podian ulilizarse variables ficticias para analizar problemas de disefio experimental 15.1. Comparacion de las medias de varias poblaciones En los Apartados 10.1 y 10.2, vimos e6mo se contrasta la hipétesis de la igualdad de dos medias poblacio- nales. De hecho, presentamos dos contrastes, que eran adecuados dependiendo del mecanismo empleado para generar las observaciones muestrales. Coneretamente, nuestros contrastes partfan de observaciones 690 —_Estadistica para administracion y economia pareadas o de muestras aleatorias independientes. Esta distincién es importante y. para aclararla, nos deten= dremos a examinar un sencillo ejemplo. Supongamos que nuestro objetivo es comparar el consumo de combustible de dos tipos de automéviles: A y B. Podriamos seleccionar aleatoriamente diez. personas para gue recorrieran una determinada distancia con estos automéviles, asignando a cada una de ellas un automé- vil de cada tipo, de manera que cada una condujera tanto un automévil A como un automévil B. Las 20 cifras de consumo de combustible resultantes consistirén en die” parejas, cada una de las cuales correspon- de a un conductor. Este ¢s el disefto por parejas enlazadas y su atractivo reside en su capacidad para hacer tuna comparacién entre las cantidades que interesan (en este caso, el consumo de combustible de los dos tipos de automdvil), teniendo en cuenta al mismo tiempo la posible importancia de otro factor relevante (las. diferencias entre los conductores). Asf, si se observa la existencia de una diferencia significativa entre el comportamiento de los automéviles A y el de los B, tenemos alguna seguridad de que no se debe a diferen- cias de conducta de los automovilistas. Otro disefio seria tomar 20 conductores y asignar aleatoriamente diez a Jos automéviles A y diez a los automoviles B (aunque, en realidad, no es necesario hacer el mismo nimero de pruebas con cada tipo de automévil). Las 20 cifras de consumo de combustible resultantes consttuirfan un par de muestras aleatorias independientes de diez observaciones cada una sobre los automéviles A y B. En el Capitulo 10, analizamos los métodos adecuados para contrastar la hipétesis nula de la igualdad de tun par de medias poblacionales en estos dos tipos de disefio. En este capitulo, nuestro objetivo es extender estos métodos al desarrollo de contrastes de la igualdad de las medias de mas de dos poblaciones. Suponga- ‘mos, por ejemplo, que nuestro estudio incluyera un tercer tipo de automévil, el automévil C. La hipétesis nula de interés serfa en ese caso que la media poblacional del consumo de combustible de los tres tipos de automsviles es la misma. Mostramos cémo pueden realizarse contrastes de esas hipstesis, comenzando con ‘el caso en el que se toman muestras aleatorias independientes. Supongamos que se asigna aleatoriamente a siete de 20 conductores a automéviles A, siete a automéviles B y seis a automsviles C. Utilizando los datos de la Tabla 15.1, calculamos 146.3 ‘media muestra de los automéviles A = "= = 20.9 Tabla 15.1. Cifras de consumo de combustible de tres muestras aleatorias independientes ‘en kilémetros por ltro. ‘Automéviles A Automéviles B_ Automéviles C 22,2 24.6 22,7 199) 2, 21,9 20,3 2.0 23,2 214 235 24.1 21,2 236 22,1 210 2,1 20,3 25 _ Sumas 1463 162,4 1374 Anilisis dela varlanza 691 Naturalmente, estas medias muestrales no son todas iguales. Sin embargo, como siempre, cuando se ccontrastan hipstesis, interesa saber cual es la probabilidad de que esas diferencias surgieran por casualidad si la hip6tesis nula fuera realmente verdadera. Si se Iegara a la conclusién de que seria muy improbable que esas diferencias surgieran por casualidad, tendriamos razones para rechazar la hipstesis nula, Para aclarar las cuestiones que plantea este andlisis. consideremos la Figura 15.1, que representa dos conjuntos hipotéticos de datos. Las medias muestrales de la parte (a) de la figura son exactamente iguales ‘que las de ta parte (b). La diferencia fundamental se halla en que en la primera, las observaciones estén muy concentradas en torno a sus respectivas medias muestrales, mientras que en la segunda, la dispersion es mucho mayor. El examen visual de la parte (a) sugiere que los datos proceden, en realidad, de tres pobla- cones que tienen medias diferentes. En cambio, observando la parte (b), no nos sorprenderia mucho ente~ ramos de que estos datos proceden de una poblacién comin. Kdéemetos por iro ‘ulomévies Automivies Adortvies Automévies Auiombviles Aitombvles a 8 © ‘a 8 c @ ) Figura 15.1. Dos conjuntos de datos muestrales sobre el consumo de combustible de tres tips de automévil Esta ilustracicn sirve para seftalar la propia esencia del contraste de la igualdad de las medias poblacio- nales. El factor eritico es la variabitidad de los datos. Si la variabilidad en 1orno a las medias muestrales es pequefia en comparacién con la variabilidad entre las medias muestrales, como en la Figura 15.1(@), nos inclinamos a dudar de ta hipstesis nula de que las medias poblacionales son iguales. Si la variabilidad en tomo a las medias muestrales es grande en comparacién con la variabilidad entre ellas, como en la Figura 15.1(b), no hay pruebas contundentes para rechazar ta hipstesis nula, Si eso es asf, parece razonable esperar que el contraste se base en valoraciones de la variaciGn. Y asf es, en efecto, por lo que la ténica general cempleada se conoce con el nombre de andlisis de la varianza. Analisis de la varianza de un factor El problema presentado en el Apartado 15.1 puede tratarse de una forma bastante general. Supongamos que queremos comparar las medias de K poblaciones, que se supone que tienen todas ellas la misma varianza. Se toman muestras aleatorias independientes de 1, np, ... mg observaciones de estas poblaciones. Utiliza- mos el simbolo x, para representar la j-ésima observacion de ta i-¢sima poblacién. Entonces, utilizando el formato de la Tabla 15.1, podemos presentar los datos muestrales como en la Tabla 15 Estadistica para administracion y economia Tabla 15.2. Observaciones muestrales de muestras aleatorias independi wes de K poblaciones. Poblacion 1 2 “ x uy Xe Ma na Xin Aon Ben El método para contrastar la igualdad de medias poblacionales en este contexto se denomina andilisis de la varianza de un factor, término que resultari més claro cuando examinemos otros modelos de andlisis de la varianza, El modelo para un andlisis de la varianza de un factor ‘Supongamos que tenemos muestras aleatorias independientes de n,, m3... nx observaciones de K po- blaciones. Si las medias poblacionales $0n 11,12... ig, 1 andlisis de la varianza de un factor pretende ‘contrastar la hipétesis nula Apia edie Ay: # W Para al menos vn par py Hy En este apartado, presentamos un contraste de la hip6tesis nula de que las medias de K poblaciones son iguales, dadas muestras aleatorias independientes de esas poblaciones. El primer paso obvio es calcular las ‘medias muestrales de los k grupos de observaciones. Estas medias muestrales se representan por medio de i J. En términos formales, = 12 donde n, representa el nimero de observaciones muestrales del grupo i. En esta notacién, ya hemos obser- vado con los datos de la Tabla 15.1 que 5-209 %=B2 H= D9 Ahora bien, la hipétesis nula de interés especifica que las K poblaciones tienen una media comin. Un paso l6gico es, pues, estimar esa media comiin a partir de las observaciones muestrales. Esta es simple- mente la suma de todos los valores muestrales dividida por su niimero total. Sin representa el niimero total de observaciones muestrales, entonces as En nuestro ejemplo, n = 20. La media global de las observaciones muestrales puede expresarse entonces de la forma siguiente ids Analisis de la varlanza 698 donde el doble sumatorio indica que sumamos todas las observaciones de cada grupo y las de todos los grupos, es decir, sumamos todas las observaciones existentes. Una expresiGn equivalente es En el caso de los datos del consumo de combustible de la Tabla 15.1, la media global es gx QOD) + (723.2) + (622.9) 20 2,3 Si, en realidad, la media poblacional del consumo de combustible de los automSviles A, B y C es la misma, cestimamos que la media comiin es de 22,31 kilémetros por litro. ‘Como indicamos en el Apartado 15.1, el contraste de la igualdad de medias poblacionales se basa en ‘una comparacién de dos tipos de variabilidad de 1os miembros de la muestra. El primero es la variabilidad cn torno a las medias muestrales individuales dentro de los K grupos de observaciones. Es cémodo llamarla variabilidad dentro de los grupos. En segundo lugar, nos interesa la variabilidad entre las medias de los K grupos. Esta se Hama variabilidad entre los grupos. A continuacién, buscamos medidas, basadas en los datos muestrales, de estos dos tipos de variabilidad. Consideremos, en primer lugar, la variabilidad dentro de los grupos. Para medir la variabilidad en el primer grupo, calculamos la suma de los cuadrados de las desviaciones de las observaciones en tomo a su es decir, media muestral x) SC, = ¥ Gy - 4) Asimismo, en el caso del segundo grupo, cuya media muestral es &,, caleulamos SC, = ¥ (yy ~ 5) a y asf sucesivamente. Asf pues, 1a variabilidad total que existe dentro de los grupos, denominada SCD, es la ‘suma de las sumas de los cuadrados de los K grupos; es decir, SCD = SC, + SC) + + SCy 0 sea, scp= YY ay- a? En el caso de los datos sobre el consumo de combustible, tenemos que SC, = (22,2 — 20,97 + (19,9 ~ 20,9)? + --» + (20,3 ~ 20,9) = 3,76 96 SC, = (24,6 ~ 23,2) + (23,1 ~ 23,2) + + 23,5 - 23,277 SCy = (22,7 ~ 22.9)? + (21,9 ~ 22,9)? + +++ + 23.4 ~ 22,97 = 3.46, La suma de los cuadrados dentro de los grupos es, pues, SCD = SC, + SC, + SC, = 3,76 + 4,96 + 3,46 = 12,18 Estadistica para administracion y economia A continuacién, necesitamos una medida de la variabilidad que existe entre los grupos. Una medida l6gica se basa en las diferencias entre las medias individuales de los grupos y Ia media global. En realidad, al igual que antes, estas diferencias se elevan al cuadrado, por lo que @ — 27. - 3, Para calcular la suma total de los cuadrados enire los grupos, SCG. ponderamos cada diferencia al cuadrado por el numero de observaciones muestrales del grupo correspondiente (de manera que damos mas peso a las diferencias correspondientes a los grupos en los que hay més observaciones), por lo que SCG = ¥ naz - 9 Por tanto, en el caso de nuestros datos sobre el consumo de combustible, SCG = (7)(20,9 ~ 22,3)? + (7(23,2 — 22,3)? + (6)(22,9 ~ 22,3)? = 21,55 A menudo se calcula otra suma de los cuadrados. Esta es la suma de los cuadrados de las diferencias de todas tas observaciones muestrales en torno a su media global. Esta se denomina suma total de tos cuadra- dos y se expresa de la forma siguiente: stc=> 5 Gy - 3 De hecho, en el apéndice de este capitulo mostramos que la suma total de los cuadrados es la suma de los cuadrados dentro de los grupos y la suma de los cuadrados entre los grupos; es decir, STC = SCD + SCG Por tanto, en el caso de los datos sobre el consumo de combustible, tenemos que STC = 12,18 + 21,5 73 Descomposicién de la suma de los cuadrados en el andlisis de la varianza de un factor ‘mos las siguientes sumas de los cuadrados: entro de los grupos: SCD = ay % y= 3 asa | efits Tos grupos: SCG =" ni — 3 ~~ asa | tou: STC 5 z by 3? asa) ‘donde x, representa la j-ésima observacién muestral del i-ésimo grupo. Entonces, STC = SCD + SCG as) Analisis dela varlanza 695 La descomposici6n de la suma total de los cuadrados en la suma de dos componentes —Ias sumas de Jos cuadrados dentro de los grupos y entre los grupos— constituye la base del contraste de la igualdad de las medias poblacionales de los grupos basado en el anilisis de la varianza. Podemos considerar que esta descomposicion expresa la variabilidad total de todas las observaciones muestrales en torno a su media global como la suma de la variabilidad dentro de los grupos y la variabilidad entre los grupos. La Figura 15.2 lo muestra esquemsticamente. eee ed pe ‘Suma total de os cuadrados Suma de os cuacrados | nite los grupos | Figura 18.2. Descomposicién de la suma de los cuadrados en el analisis de la varianza de un factor. Nuestro contraste de la igualdad de las medias poblacionales se basa en el supuesto de que las K pobla- ciones tienen una varianza comin. Si la hipétesis nula de que las medias poblacionales son todas ellas iguales es verdadera, cada una de las sumas de los cuadrados, SCD y SCG, puede utilizarse como base para cestimar la varianza poblacional comiin. Para obtener estas estimaciones, hay que dividir las sumas de los ‘cuadrados por el niimero correspondiente de grados de libertad En primer lugar, en el apéndice del capitulo mostramos que se obtiene un estimador insesgado de la varianza poblacional si se divide SCD por (n ~ K). La estimacién resultante se denomina media de los cwadrados dentro de los grupos y se representa por medio de MCD, de manera que Mcp = SC “nak En el caso de nuestros datos, tenemos que 12.8 ICD = 5 = 0.71647 - 20-3 Si las medias poblacionales son iguales, se obtiene otro estimador insesgado de la varianza poblacional Uividiendo SCG por (K ~ 1), que también se muestra en el apéndice del capftulo. La cantidad resultante se lama media de los cwadrados entre los grupos y se representa por medio de MCG; por tanto, En el caso de nuestros datos sobre el consumo de combustible, 21,55 Me = 10.775 CG = SF = 10.77 Cuando las medias poblacionales no son iguales, 1a media de los cuadrados entre los grupos no constituye una estimacign insesgada de la varianza poblacional comiin, FI valor esperado de Ia variable aleatoria co- rrespondiente es mayor que Ia varianza poblacional comin, ya que también contiene informacién sobre los, cuadrados de las diferencias de las verdaderas medias poblacionales. Si la hipdtesis nula fuera verdadera, ahora tendriamos dos estimaciones insesgadas de la misma canti- dad, la varianza poblacional comiin. Serfa razonable esperar que estas estimaciones fueran muy parecidas. Cuanto mayor es la diferencia entre estas dos estimaciones, manteniéndose todo lo dems constante, mayor Estadistica para administracién y economia es nuestra sospecha de que la hipétesis nula no es verdadera. El contraste de la hipétesis nula se basa en el cociente entre las medias de los cuadrados (véase el apéndice del capitulo): MCG McD Si este cociente es cercano a 1, hay pocas razones para dudar de la hipdtesis nula de la igualdad de las medias poblacionales. Sin embargo, como ya hemos sefialado, si la variabilidad entre los grupos es grande en comparacién con la variabilidad dentro de los grupos, sospechamos que la hipstesis nula es falsa. Lo es cuando el cociente F tiene un valor muy superior a 1. En ese caso, se rechaza la hipétesis nula. Cabe deducir un contraste formal del hecho de que si Ia hipétesis nula de la igualdad de las medias poblacionales es verdadera, la variable aleatoria sigue una distribucién F (analizada en el Apartado 10.4) con (K ~ 1) grados de libertad en el numerador y(n — K) grados de libertad en el denominador, suponien- do que las distribuciones poblacionales son normales. Contraste de hipétesis basado en el andlisis de la varianza de un factor ‘Supongamos que tenemos muestras aleatorias independientes de n, na... ne observaciones de K po- | blaciones. Sea v6! tamaiio total de la muestra, de manera que | nant mgt tng Dofinimos las medias de los cuadrados ve la forma siguiente: ‘dentro de los grupos: MCD ass) entre los grupos: MCG = °- a6) ‘La hipétesis nula que se contrasta es que las K medias poblacionales son iguales: es decir, Foie = he Postulamos los siguientes supuestos adicionales: 41. Las varianzas poblacionales son iguales. Mi 2. Las distribuciones poblacionales son normales. La regla de decision de un contraste de nivel de significacion « es: x McG ‘echazar Hy $1 > Finn asa) donde Fx,» 08 ©! nimero para el que 4 PO pene > Fena-n) =o y la variable aleatora Fy.» sigue una distibucidn F con (K ~ 1) grados de Ibertad en el numerador_| y(n ~ K) grados de libertad en el denominador. il pvalr do esto contrast es 8 prado més belo de slgnitcacén que nos permitifa recnazar la hipétesis nula. 4 En el caso de los datos sobre e! consumo de combustible, observamos que MCG _ 10.775 MCD 0.71647 = 15,039 Andlisis de la vartarza_— 697 Los grados de libertad del numerador y del denominador son, respectivamente, (K~1)=2 y (n ~ K) = 17. Por tanto, para un contraste al nivel de significacién del 1 %, vemos que en la Tabla 9 del apéndice, Por tanto, estos datos nos permiten rechazar al nivel de significacién del 1% la hipétesis nula de que la media poblacional del consumo de combustible de los tres tipos de autom6vil es 1a misma. Es muy cémodo resumir los eélculos reatizados para hacer este contraste en una tabla del andiisis de la varianza de un factor. La forma general de la tabla se muestra en la Tabla 15.3. La Tabla 15.4 contiene el andlisis de la varianza correspondiente a los datos sobre el consumo de combustible, Obsérvese que en algunas exposiciones, la suma de los cuadrados dentro de los grupos se denomina suma de los cuadrados de los errores. Tabla 15.3. Formato general de la tabla del andlisis de la varianza de un factor. Fuente Sumadelos Grados Media delos_—_ Cociente de variacién cuadrados de libertad cuadrados F Entre | sca k-1 mco=So MCG Entre los grupos s a Dentro de los grupos scp n-K Total stc nl Tabla 15.4, Tabla del andlisis de la varianza de un factor correspondiente a los datos sobre el consumo de combustible. Fuente ‘Sumadelos Grados Mediade los Cociente de variacién cuadrados de libertad _cuadrados F Entre los grupos 21,55 2 10,78 15,05, Dentro los grupos 12,18 7 0.7165 Total 33,73 19 Dificultades para leer los anuncios de las revistas, (andlisis de la varianza de un factor) El indice fog se wiliza para medir la dificultad para leer un texto escrito: cuanto més alto es el valor del indice, més dificil es el nivel de lectura. Queremos saber si las tres revistas Scientific American, Fortune y New Yorker tienen un indice distinto de dificultad de lectura. Solucién. Se toman muestras aleatorias independientes de seis anuncios de Scientific American, Fortune y New Yorker, se miden los indices fog de los 18 anuncios y se anotan en la Tabla 15.5 (Shuptrine y McVicker, 1981). 698 Estadistica para administracin y economia Tabla 15.5. indice fog de la dificultad de lectura de tres revistas. Scientific American Fortune ‘New Yorker 15,75 12.63 927 11,55 11,46 8.2 11,16 10,77 B15 9,92 9,93 6,37 9,23 9,87 6,37 8,20 9,42 5.66 Basdndose en estos datos, se puede elaborar la tabla del andlisis de la varianza utilizando un pro- ‘grama estad{stico como Minitab. La Figura 15.3 contiene la salida del andlisis de la varianza. Para contrastar la hip6tesis nula de que las medias poblacionales de los indices fog son iguales, debemos ‘comparar el cociente F —F = 6,97— de la tabla del andlisis de la varianza con los valores tabulados de la distribucién F con (2, 15) grados de libertad, En la Tabla 9 del apéndice vemos que: Fras.o0 = 6,359 ‘One-way ANOVA: SCIENTIFIC AMERICAN, FORTUNE, NEW YORKER, Source or sw re Factor 2 48,53 24,26 6,97 0,007 Breor 15 32)22, 3,48 otal 17 100/75, © = 1,866 RGq= 40/17 8 R-Egiads) = 41,26 9 Andivideal 95% Cre For Mean Based on Pooled Stdev 6.0 80 300120 Pooled stDev = 1,866 Figura 15.3. Andlisis de Ia varianza de un factor de la dificultad de lectura de Scientific American, Fortune y New Yorker (salida Minitab). Por tanto, rechazamos 1a hipstesis mula de la igualdad de las medias poblacionales de los thdices fog de las tres revistas al nivel de significacién del 1 %. Obsérvese también que el p-valor calculado, como se ve en la Figura 15.3, es 0,007. Tenemos pruebas contundentes de que la dificultad de lectura 5 diferente: el indice més bajo corresponde a New Yorker. Obsérvese que la salida Minitab contiene tuna representacién gréfica de las medias de los subgrupos y sus intervalos de confianza. Fsta salida contiene una presentacién visual de las diferencias entre las medias de los subgrupos, sefialando en este caso que New Yorker se diferencia mucho de Scientific American y Fortune. 6 Andilisis dela varianza 699 Comparaciones multiples entre medias de subgrupos Una vez que hemos Hlegado a la conclusin de que las medias de los subgrupos son diferentes rechazando la hipstesis nula, serfa I6gico que nos preguntéramos qué medias de los subgrupos son diferentes. Por tanto, ‘nos gustarfa tener un intervalo minimo que pudiera utilizarse para decidir si dos medias de los subgrupos son diferentes en un sentido estadfstico. O, més concretamente, {podemos rechazar la hipétesis de que al- unas de las medias de los subgrupos no son diferentes de otras cuando hemos llegado a la conclusién de que al menos una de las medias de los subgrupos es diferente de otras? Se trata de una cuestién importante en el andlisis aplicado, pero que plantea algunas complicaciones mas, Si tenemos dos subgrupos, podemos utilizar los métodos de contraste de hipétesis desarrollados en el Capitulo 10 para calcular una diferencia minima significativa (DMS) entre dos medias muestrales que nos Jevaria a rechazar la hipétesis de que las medias poblacionales son iguales y, por tanto, tenemos prucbas para concluir que las medias poblacionales son diferentes. En esos casos, calcularfamos una estimacién ‘comiin de la varianza s, y la DMS resultante puede calcularse de la forma siguiente: DMS = thas, em om Aunque este método, basado en contrastes de hipétesis con una probabilidad de error a, funciona bien en el caso de dos subgrupos, no funciona bien cuando hay K subgrupos. En ese caso, el mimero de comparacio- nes pareadas se puede calcular utilizando la ecuacién de combinaciones desarrollada en el Capitulo 3: KI 21 cr « donde n, y n, son los tamaftos de las muestras de los subgrupos. Por tanto, la probabitidad de error a ya no se cumpliria Se han desarroliado algunos méiodos para ahordar la cuesttin de las comparacones mltipes, Consis- ten, en esencia, en desarrollar intervalos que son algo m4s amplios que los del caso de dos subgrupos. Estos imervalos se desarrollan utilizando el anélisis estadistico matemético avanzado que da intervalos con los niveles x correctos para muchos subgrupos. Aqui presentamos un método desarrollado por John Tukey, que utiliza una forma ampliada de la distribuci6n r de Student. En la Tabla 13 del apéndice se presentan los factores identificados como Q para diversos niimeros de subgrupos, grados de libertad y un nivel de 2 igual 0,01 y 0,05. Método de comparacién miitiple La diferencia minima significativa entre K subrupos se calcula de la siguiente manera’ DMs(K) = 0 a ‘siendo 5, - Med con e! factor ¢ seleccionado en la Tabla 13 para el nivel adecuado de z (0,01, 0,05), el numero de K ‘subgrupos y los grados de libertad de MCD. Para obtener el valor de @ en la Tabla 13, obsérvese que en esa tabla las columnas se basan en el niimero de subgrupos y las flas indican los grados de libertad del error. La DMS se puede utilizar para indicar qué medias de los subgrupos son diferentes y, por tanto, constituye un mecanismo de seleccién muy til que se puede utilizar para extender los resultados de los anélisis que hemos visto aqui. 700 Estadistica para administracion y economia PREIS > cacion ce tas comparaciones multiples En el Ejemplo 15.1, hemos comparado las dificultades para leer un texto escrito de tres revistas y los sgrados de libertad del error eran 15. Para = 0,05, el valor de q en la Tabla 13 es 3,673. Por tanto, la diferencia minima significativa es: 187 DMS(3) = 3,673 jis = 1619 siendo = 348 = 1.87 Utilizando este valor de 1,619 y las medias de los subgrupos de la Figura 15.3, podemos ver que la media del New Yorker es significativamente diferente de la media tanto de Scientific American como de Fortune, pero las dos tiltimas no son diferentes. Modelo poblacional en el caso del analisis de la varianza de un factor Es util observar el modelo del andlisis de la varianza de un factor desde una perspectiva diferente. Sea la variable aleatoria X, la j-¢sima observaciGn de a i-6sima poblacién y 1, 1a media de esta poblacién. En ese caso, X,, puede concebirse como la suma de dos partes: su media y una variable aleatoria ¢, de media 0. Por tanto, podemos escribir Xy= mt ey Ahora bien, como se toman muestras aleatorias independientes, las variables aleatorias ¢, no estarin corre- lacionadas entre sf. Ademés, dado nuestro supuesto de que las varianzas poblacionales son todas iguales, se deduce que las ¢, tienen todas ellas las mismas varianzas, Esta ecuacién puede verse como un modelo con pardmetros desconocidos 41, 43, + y- La hipétesis nula de interés es Ho: Hy = Ha = = Mg El supuesto afadido de la normalidad facilita el contraste de estos parémetros. El modelo puede expresarse de un modo algo distinto, Sea 1 la media global de las K° poblaciones combinadas y G, la diferencia entre la media poblacional del i-ésimo grupo y esta media global, de manera que Gau-n 0 mantG, Sustituyendo en la ecuacién original, tenemos que =HtG, +e, Por 1o que una observacién esté formada por la suma de una media global j1, un término especifico del ‘grupo G, y un error aleatorio ¢,. Entonces, nuestra hip6tesis nula es que cada media poblacional jes igual ue la media global, 0 sea, Ho: Gy = Gy = + = Gx La Figura 15.4 muestra este modelo poblacional y algunos de los supuestos. En el caso de los datos sobre el consumo de combustible, el consumo efectivo de combustible de cada tipo de automévil registrado € Analisis de la vartanza_ 701 ‘en una prucba cualquiera puede representarse por medio de una variable aleatoria que sigue una distribu- ién normal. Las medias poblacionales det consumo de combustible. 4 sl Jy. de los automdviles A, B y C, respectivamente, determinan los centros de estas distribuciones. Seytin nuestro supuesto, estas distr buciones poblacionales deben tener las mismas varianzas. La Figura 15.4 también muestra la media yu de las tres poblaciones combinadas y las diferencias G, entre las medias poblacionales individuales y la media global. Por iltimo, en el caso de los automéviles B, hemos mareado con un punto la i-¢sima observacién muestral. La variable aleatoria ¢, es, pues, la diferencia entre el valor observado y la media de la subpobla- cci6n i de la que procede. Figura 15.4. tlustracién del modelo poblacional en el caso del andlisis de la varianza de un factor. Ejercicios EJercicios basicos 18.1. Dada la siguiente tabla del andlisis de la varianza, caleu- Te las medias de los euadrados entre los grupos y dentro de los grupos. Calcule el cociente F y contraste Ia hips tesis de que las medias de los grupos son Fuente de ‘Suma de los variaci¢n cuadrados Entre los grupos 1.000 4 Dentro de tos grupos 150 1s Total 1.750 9 18.2, Dada la siguiente tabla del andlisis de la varianza, caleu- Je las medias de los cuadrados entre los grupos y dentro de los grupos. Calcule el cociente F y contraste la hips- tesis de que las medias de los grupos son iguales. Fuente de ‘Suma de los Grados variacion cuadrados __de libertad Enire fos grupos 379 3 Dentro de los grupos 798 16 Total 1.677 9 15.3. Dada la siguiente tabla del andlisis de la varianza, caleu- le las medias de los cuadrados entre los grupos y dentro de los grupos, Calcule el coviente F y contraste la hips- {esis de que las medias de los grupos son iguales. Fuente de ‘Sumadelos Grados variacién cuadrades de libertad Entre los grupos: 1.000) 2 Dentro de los grupos: 743 15 Total 1.743 0 Ejerciclos aplicados 15.4. Un fabricante de cereales tiene que elegir entre tres colo- res para las cajas de cereales: rojo, amarillo y azul. Para averiguar si el color influye en las ventas, se eligen 16 tiendas de tamafio parecido. Se envian cajas rojas a seis de estas tiendas, cajas amarillas a cinco y cajas azules a las cinco restantes, Después de unos dias, se comprueba cl ndémero de cajas vendidas en cada tienda, La tabla ad: junta muestra los resultados (en decenas de cajas) obte- nidos. 702 —_Estadistica para administracion y economia Rojo ‘Amarillo ‘Aza B 32 61 2 7 29 39 38 38 16 4 53 6 "4 ” 8 4 Calcule la suma de los cuadrados dentro de los gru ‘pos, entre los grupos y total b. Complete la tabla del andlisis de Ia varianza y con traste la hipstesis nula de que las medias poblaciona- les de los niveles de ventas de las cajas de los tres colores son iguales. 15.5. Un profesor tiene una clase de 23 estudiantes. Al co- mienzo de cada cuatrimestre, asigna a cada estudiante aleatoriamente a uno de los cuatro profesores ayudantes {que tiene: Sinchez, Hervés, Alareos o Blézquez. Anima 4 los estudiantes @ reunirse con su profesor ayudante asignado para que les explique la materia diffeil del cur so. Al final del cuatrimestre, se hace un examen. La ta- bla adjunta muestra las calificaciones obtenidas por los estudiantes que trabajan con estos profesores ayudantes. Sinchez __Hervis___Alaroos __Blazquez 2 78 30 9 6 93 68 0 88 » 59 6 16 7 15 ™ 6 88 2 85 81 68 63 ‘a. Calcule Ja suma de los cuadrados dentro de los gru- pos, entre los grupos y total . Complete la tabla del andlisis de la varianza y con: traste la hipétesis nula de la igualdad de las medias, poblacionales de las calificaciones de estos profeso: res ayudantes, 15.6. Tres proveedores suministran piezas en envios de 500 tunidades. Se han comprobado minuciosamente muestras aleatorias de seis envios de cada uno de los tes provee- dores y se ha anotado el nimero de piezas que no se ajustan a las normas, La tabla muestra este ndmero. Proveedor A Proveedor B__ Proveedor C 28 2 Ey 37 27 29 4 29 39 29 20 B 3 18 7 33 30 38 187. 158. ‘a. Elabore la tabla del andlisis de la varianza de estos datos. b. Contraste fa hipétesis nula de la igualdad de las me- dias poblacionales del nimero de piezas por envio de los tres proveedores que no se ajustan a las norms. ¢. Caleule la diferencia minima significativa ¢ indique qué subgrupos tienen medias diferentes Una empresa esté tratando de clegir entre tres tipos de ‘automdvil para su flota: nacionales, japoneses 0 euro- ‘peos. Se piden cinco automéviles de cada tipo y, después de recorrer 10,000 kilémetros con ellos, se calcula el ‘coste de explotacisn por kilimetro de cada uno. Se obtie- ‘nen Tos siguientes resultados en centavos por kilémetro. ‘Nacionales _Japoneses__Europeos 180) 20.1 193 156 156 134 Is 16.1 15,1 19.1 153 18,6 169) 154 16,1 fa. Elabore la tabla del andlisis de Ia varianza de estos datos b. Contraste fa hipttesis nula de que las medias pobla- ccionales de los costes de explotacién por kilémetro de los tes tipos de automeviles son iguales. ‘e. Calcule Ia diferencia minima significativa e indique qué subgrupos tienen medias diferentes. Se toman muestras aleatorias de siete estudiantes univer- sitarios de primer aflo, siete de segundo aio y siete de tercero que asisten a una clase de estadistica para los ne- gocios. La tabla adjunta muestra las calificaciones obte- ‘das en el examen final. Estudiantes de Estudiantes de Estudiantes de Primer ano segundo ato _terver aho 2 71 o 93 62 B 6 85 a7 ” 4 91 69 B 56 0 66, 8 3 1 87 a. Elabore la tabla del andlisis de la varianza. B. Contraste Ia hipstesis:nula de que las medias pobla- jonales de las calificaciones de los tres grupos son iguales, ‘¢ Calcule Ia diferencia minima significativa e indique ‘qué subgrupos tienen medias diferentes. Se pide a muestras de cuatro vendedores de cuatro regio- nes distintas que predigan los aumentos porcentuales del volumen de ventas de sus territorios en los proximos 12 ‘meses. La tabla adjunta muestra las predicciones, Oeste Norte Sur Exe 72 42 90 66 48 80 sa 58 58 72 50 10 46 16 ‘a, Elabore la tabla del andlisis de la varianza, b. Contraste Ia hipstesis mula de que las medias pobla- cionales de las cuatro predicciones det crecimiento de las ventas de las custro regiones son iguales. Se pide a muestras aleatorias independientes de seis profesores ayudantes, cuatro profesores asociaos y cinco profesores titulares, que estimen la cantidad de tiempo que dedicaron a sus responsabilidades docentes fuera del aula Ia semana pasada. La tabla adjunta mues- tra los resultados en horas, 15.10. ‘Ayudante —__Asociado Titular 7 15 1 2 R 7 u 15 6 1s 8 9 9 a im fa. Elahore fa tabla del andlisis de la varianza, b. Contraste la hip6tesis nula de que las medias pobla- cionales de los tiempos de los tres tipos de profeso~ res som iguales. Dos academias offecen cursos para prepararse para el examen de acceso a la universidad. Para comprobar la cficacia de sus cursos, se eligen 15 estudiantes. Cinco se asignan aleatoriamente a la academia A, cinco a la B y el resto no asiste a ningén curso. La tabla adjunta ‘muestra las calificaciones obtenidas en el examen, ex presadas en porcentajes. 1s. Academia A Academia B Academia C 9 74 72 ” 69 a 92 87 81 67 81 6 85 6 63 15.3. El contraste de Kruskal-Wallis 15.12. 18.13. 15.14. Andlisis de la varianza_ 708 ‘a, Elabore la tabla del andlisis de la varianza, b. Contraste la hipstesis nula de que las medias pobla- cionales de las calificaciones de los tres grupos son iguales, . Calcule la diferencia minima significativa e indique {qué subgrupos tienen medias diferentes. En el estudio del Ejemplo 15.1, se toman muestras aleatorias independientes de seis anuncios de True Confessions, People Weekly y Newsweek. La tabla ad- junta muestra los indices fog de estos anuncios. Con- traste Ia hipstesis nula de que las medias poblacionales de los indices fog de los anuncios de estas tes revistas son iguales y calcule la diferencia minima significativa ¢ indique qué subgrupos tienen medias diferentes. True Confessions People Weekly _ Newsweek 12.89 930 W021 12.69 8.50 9.66 tas 859 767 952 5. 9.12 4.88 7.04 312 En el modelo del andlisis de la varianza de un factor, ‘expresamos la j-ésima observacién del #-ésimo grupo de la forma siguiente: Nya Ht G+ ey donde 11 €5 la media global, G, es el efecto especitico del isimo grupo y fy €s el error aleatorio de la j-ésima dobservacién del i-ésimo grupo. Considere los datos del Ejemplo 15.1 a. Estime 1. b. Estime G, para cada una de las tres revistas €. Estime £3, el término de error correspondiente a 1a segunda observacisn (8,28) del New Yorker. Utilice el modelo del andlisis de 1a varianza de un fac- tor para examinar los datos del Ejercicio 15.12. 1. Estime pt. Db. Estime G, para cada una de las tres revistas. ¢. Estime 6,5. €l término de error correspondiente a la tercera observacién (11,15) de True Confessions. ‘Como ya hemos sefalado, el contraste del andlisis de la varianza de un factor del Apartado 15.2 generaliza al caso en el que hay varias poblaciones el contraste ¢ utilizado para comparar dos medias poblacionales cuando se dispone de muesiras aleatorias independientes. El contraste se basa en el supuesto de que las distribuciones poblacionales subyacentes son normales. En el Apartado 14.6, introdujimos el contraste de 704 Estadistica para administracién y economia Mann-Whitney, un contraste no paramétrico que es vélido para comparar las posiciones centrales de dos poblaciones basado en muestras aleatorias independientes, incluso cuando las distribuciones poblacionales no son normales. También es posible desarrollar una altemativa no paramétrica al contraste del andlisis de Ja varianza de un factor. Este contraste se conoce con el nombre de contraste de Kruskal-Wallis y se ‘emplea cuando un investigador tiene poderosas razones para sospechar que las distribuciones poblacionales subyacentes pueden ser muy diferentes de la normal. ‘Al igual que la mayorfa de los contrastes no paramétricos que ya hemos visto, el contraste de Kruskal- Wallis se basa en los puestos ocupados por las observaciones muestrales en las ordenaciones correspon- dientes. Mostraremos cémo se calcula el estadistico del contraste utilizando los datos sobre el consumo de combustible de la Tabla 15.1. Los valores muestrales se juntan y se ordenan en sentido ascendente, como en la Tabla 15.6, uilizando la media de los puestos contiguos en caso de empate, Tabla 15.6, Cifras de consumo de combustible (en kilimetros por litt) y puestos de tres muestras aleatorias independientes. Automéviles A Puesto _ Automéviles B_Puesto — Automéviles C__ Puesto 22,2 VW 24,6 20 22,7 12 199 1 231 B 219 7 20,3 25 22.0 8 14 214 6 25 165 19 21,2 5 236 18 22,1 95 21,0 4 22, 234 15 20.3 25 23,5 Suma de los puestos 32 76,8 El contraste se basa en las sumas de los puestos Rj, Roy . Ry de las K muestras. En el ejemplo del consumo de combustible, Ry) = 1015 Ry = 765 La hipétesis nula que debe contrastarse es que las tres medias poblacionales son iguales. Sospecharfamos. de esa hip6tesis si hubiera notables diferencias entre las medias de los puestos de las K muestras. De hecho, nuestro contraste se basa en el estadistico, donde m, son los tamatios muestrales de los K grupos yn es el ntimero total de observaciones muestrales. Sea W ie Re wa tat ant 1) omy ? La hipétesis nula serfa dudosa si el valor de W fuera alto. La base del contraste se deduce del hecho de que, a menos que los tamaiios de las muestras sean muy pequefios, la variable aleatoria correspondiente al esta- distico del contraste sigue, segin la hipstesis nula, una distribucién de la que es una buena aproximacién la distribucién 7 con (K ~ 1) grados de libertad. contraste de Kruskal-Wallis ‘Supongamos que tenemos musstras aleatorias independientes dem, n:,... nx observaciones de K po- blaciones. Sea 2 nen tm toting Andilisis dela varianza 708 ‘el numero total de observaciones muestrales. Sean Rj, Ry, .... Rx las sumas de los puestos de las K muestras cuando se juntan las observaciones muestrales y se ordenan en sentido ascendente. El con- traste de la hipdtesis nula, Ho, de la igualdad de |as medias poblacionales se basa en el estadistico nse Aaa ass) La regla de decisién de un contraste a nivel de signiicacién x es rechazar Hp si W> 22.» as) donde x.-1,..@8 el ndmero que es superado con la probabilidad x por una variable aleatoria 7? con (K ~ 1) gtados de libertad, Este método de contraste es aproximadamente valido, siempre que la muestra contenga al menos. Cinco observaciones de cada poblacién. En el caso de nuestros datos sobre el consumo de combustible, tenemos que 12 cosy 020) | 7 7 6 Aqui, tenemos (K — 1) = 2 grados de libertad, por lo que en el caso de un contraste al nivel de significa- ciGn det 1%, vemos en la Tabla 7 del apéndice que Boo = 9.210 Por tanto, la hipStesis nula de que las medias poblacionales det consumo de combustible de los tres tipos de automSviles son iguales puede rechazarse incluso al nivel de significacién del 1%, Naturalmente, también rechazamos esta hipétesis utilizando el contraste del andlisis de la varianza del Apartado 15.2. Sin embar- 20, aqui hemos sido capaces de rechazario sin imponer el supuesto de 1a normalidad de las distribuciones poblacionales. Importancia de las marcas (contraste de Kruskal-Wallis) Se ha realizado un estudio para averiguar si las mujeres de diferentes subgrupos profesionales dan diferentes niveles de importancia a las marcas cuando compran bebidas refrescantes. Solucién. Se pidié a muestras aleatorias independientes de 101 empleadas de oficina, 112 admi- nistrativas y 96 profesionales que valoraran en una escala de 1a 7 1a importancia que daban a la ‘marea cuando compraban bebidas refrescantes. El valor del estadfstico de Kruskal-Wallis de este es- tudio era 25,22. Contraste la hipstesis nula de que las medias poblacionales de las valoraciones de los tres subgrupos son iguales. El estadistico del contraste calculado es w= 25,22 Dado que hay K = 3 grupos, tenemos para un contraste al 1 % WB-1x™ Zoo ~ 9210 Por tanto, la hipétesis nula de que las medias poblacionales de las valoraciones de los tres subgrupos son iguales se rechaza claramente con los datos de esta muestra, incluso al nivel de significacién del 1%. Tenemos pruebas contundentes de que las mujeres de diferentes subgrupos profesionales dan diferentes niveles de importancia a las marcas. 706 Estadistica para administracion y economia Ejercicios EJercicios basicos 15.21. Basindose en los datos del Ejercicio 15.7, contraste la hipétesis nula de que las medias poblacionales de los ‘costes de explotacién por kikimetro de los tres tipos de aulomévil son iguales sin suponer que las distribucio- res poblacionales son normales. 15.15. Considere un problema con tres subgrupos en el que Ia ssuma de los puestos de cada uno de los subgrupos es igual a 45, 98 y 88 y el tamafo de los subgrupos es igual a 6, 6 y 7. Complete el contraste de Kruskal-Wa- Ilis y contraste la hiptesis nula de que los puestos de 18,22. Basndose en Jos datos del Ejercicio 15.8, realice un los subgrupos son iguales. ‘contraste no paramétrico de 1a hipétesis nula de la Fi ee cape ND ODUM anf tparopebel uy eo Seater eee ree: ee mee es scolds ities mole oui possi 15.23. Basindose en los datos del Ejercicio 15.9, utilice el Sat come a ges ada pe eee tes ssantianini nnula de la igualdad de las medias poblacionales de las la suma de os puestos de cada uno de los subgrupos es igual a 71, 8, 82 y 79 y el amano de los subgrupos es 18.24. Vuclva al Ejercici 15.10. Sin suponer que las distibu- igual a 5, 6, 6 y 7. Complete el contraste de Kruskal- clones poblacionales son normales, contraste la hipéte- Wallis y contraste la hipdtesis nula de que los puestos sis nula de que las medias poblacionales del tiempo que de los subgrupos son iguales. dedican los ayudantes, los asociados y los titulares a las responsabilidades docentes fuera del aula son iguales. Ejercicios aplicados 15.25, Baséndose en los datos del Ejercicio 15.11, realice el 15.18, Basdndose en los datos del Ejercicio 15.4, utilice e! contraste de Kruskal-Wallis de la hip6tesis nula de la contraste de Kruskal-Wallis de la hipdtesis nula de que igualdad de las medias poblacionales de las calificacio- las medias poblacionales de los niveles de ventas de las nes obtenidas en el examen de acceso a la universidad ceajas de los tres colores son iguales. por los estudiantes que no van a una academia y los que 15.19. Basindose en los datos del Ejercicio 15.5, realice un ee eee contraste de Kruskal-Wallis de la hipStesis nula de que 18.26. Se piden muestras aleatorias independientes de 101 es- las medias poblacionales de las calificaciones de los es tudiantes universitarios de primer aio, 112 de segundo tudiantes asignados a los cuatro profesores ayudantes ao y 96 de tercer afio que valoren en una escala de 1 a son iguales. 7 la importancia que conceden a la marea cuando com- 15.20, Baséndose en los datos del Ejercicio 15.6, realice un ppran un automévil. El valor del estadistico de Kruskal- ccontraste de la hipétesis nula de la igualdad de las me- ‘Wallis obsenido ex 0,15, dias poblacionales de! nero de piezas por envio de los {QUE hipstesis nula puede contrastarse utilizando tes proveedores que no se ajustan a las normas sin supo- festa informacién? ner que las distribuciones poblacionales son normales. b. Realice el contraste, 15.4. Analisis de la varianza bifactorial: una observacion por celda, bloques aleatorizados Aunque lo que nos interesa principalmente es el andlisis de un aspecto de un experimento, podemos sospe- char que hay un segundo factor que influye significativamente en el resultado. En los apartados anteriores de este capttulo, hemos analizado un experimento en el que el objetivo era comparar el consumo de com- bustible de tres tipos de automéviles. Hemos recogido datos de tres muestras aleatorias independientes de pruebas y los hemos analizado por medio de un andlisis de la varianza de un factor. Hemos supuesto que la variabilidad de los datos muestrales se debfa a dos causas: a la existencia de verdaderas diferencias de comportamiento entre los tres tipos de automdviles y a una variacién aleatoria. De hecho, podriamos Andlisis de la varianza_— 707 sospechar que parte de la variabilidad aleatoria observada se debe a las diferencias entre los habitos de los conductores. Si fuera posible aislar este tltimo factor, disminuiria la cantidad de variabilidad aleato- ria del experimento. Eso permitirfa, a su vez, detectar més ficilmente las diferencias de comportamiento enire los automéviles, En otras palabras, diseflando un experimento para tener en cuenta las diferencias entre las caracteristicas de los conductores, confiamos en conseguir un contraste més potente de la hips- tesis nula de que las medias poblacionales del consumo de combustible de todos los tipos de automéviles son iguales. De hecho, es bastante sencillo diseflar un experimento que pueda tener en cuenta la influencia de un segundo factor de este tipo. Supongamos, una vez mas, que tenemos tres tipos de automévil (por ejemplo, automviles , automéviles fy automéviles y) cuyo consumo de combustible queremos comparar. Exami- amos un experimento en el que se realizan seis pruebas con cada tipo de automsvil. Si se realizan estas pruebas utilizando seis conductores, cada uno de los cuales conduce un automévil de los tres tipos, es posi= ble, dado que cada tipo de automsvil sera probado por cada conductor, extraer de los resultados informa- cin sobre la variabilidad de los conductores, asf como informacién sobre las diferencias entre los tres tipos de automévil. La variable adicional —en este caso, los conductores— se denomina a veces variable de bloqueo. Se dice que este experiment esté organizado en bloques; en nuestro ejemplo, habria seis bloques, uno por cada conductor. Este tipo de disefio por bloques puede utilizarse para obtener informacién sobre dos factores simulté~ eamente, Supongamos, por ejemplo, que queremos comparar el consumo de combustible no solo de dife- rentes tipos de automévil sino también de diferentes tipos de conductores. En conereto, es posible que nos interese saber cémo influye la edad de los conductores en el consumo de combustible. Para eso, podemos subdividir los conductores en grupos de edad. Podriamos utilizar los seis grupos de edad siguientes (en aiios): 1. 25 ahos 0 menos, 5. 55-65. 6. Mas de 65. A continuacién, podemos organizar nuestro experimento de tal forma que un automévil de cada grupo sea ‘conducido por un conductor de cada grupo de edad. De esta forma, adems de contrastar la hipétesis de que las medias poblacionales del consumo de combustible de todos os tipos de automévil son iguales, pode~ ‘mos contrastar la hip6tesis de que las medias poblacionales del consumo de combustible de todos los gru- pos de edad son iguales. De hécho, independientemente de que cada uno de los seis conductores conduzea un automévil de cada 10 0 un conductor de cada uno de os seis grupos de edad conduzca un automsvil de cada tipo, el método para contrastar Ia igualdad de las medias poblacionales del consumo de combustible de los tipos de auto- méviles es el mismo. En este apartado, utilizamos el segundo disefto a modo de ilustracién La Tabla 15.7 contiene los resultados de un experimento realizado con tres tipos de automévil y con- ductores de seis grupos de edad. El objetivo principal es comparar los tipos de automévil y la variable de bloqueo es la edad de los conductores. Este tipo de disefo se Hlama disefio por bloques namos aleatoriamente un conductor del primer grupo de edad para conducir un automé\ del segundo grupo de edad para conducir un automévil a, y asf sucesivamente, Este procedi ccon cada grupo de edad y con cada tipo de automdvil. Si es posible, las pruebas deben reali un orden aleatorio, no bioque por bloque. ‘Supongamos que tenemos K grupos y que hay H bloques. Representaremos por medio de x, la observa- ién muestral correspondiente al i-ésimo grupo y el j-ésimo bloque. Por tanto, los datos muestrales pueden mostrarse como en la Tabla 15.8 torizados, L.a aleatoriedad se debe a que seleccio- a, un conductor jento se repite se siguiendo 708 —_Estadistica para administracion y economia Tabla 15.7. Observaciones muestrales sobre el consumo de combustible de tres tipos de automaviles conducides por conductores de seis clases. Tipo de automdvil Clase de conductores Automéviles 2 Automéviles B —Automéviles y Suma 1 25.1 239 26,0 75,0 2 247 237 254 BS a) 260 24 258 762 4 243 233 244 2.0 ‘ 239 23.6 42 nga 6 242 24,5 254 74,1 Suma 148.2 143.4 151.2 442.8 Tabla 15.8. Observacidn muestral sobre K grupos y H bloques. Grupo Bloque 12 K 1 un Xe 2 “2 in Xe H Aw tau xu Para desarrollar un contraste de la hipétesis de que las medias poblacionales de todos los K grupos son iguales, necesitamos las medias muestrales de estos grupos. Para representar la media del i-ésimo grupo, izamos la notacién ¥,, por lo que ‘También nos interesan las diferencias entre las medias de los bloques poblacionales. Por tanto, nece- sitamos las medias muestrales de los H bloques. Representamos por medio de x, la media muestral del J-6simo bloque, por lo que Analisis de la varianza_ 709 En el caso de los datos sobre el consumo de combustible de la Tabla 15.7, tenemos que Por tiltimo, necesitamos 1a media global de las observaciones mucstrales. Sin representa el mimero total de observaciones, entonces n= HK y la media muestral de las observaciones es Antes de preguntarnos cual es e! contraste adecuado de la hipétesis que nos interesa, es itil examinar el modelo poblacional en el que nos basamos implicitamente. Supongamos que la variable aleatoria X, co- rresponde a la observacién del i-ésimo grupo y el j-ésimo bloque. Entonces, se considera que este valor es Ja suma de los cuatro componentes siguientes. 1. Una media «global» j. 2. Un pardmetro G,, que es especttico del i-ésimo grupo y que mide la diferencia entre la media de ese grupo y la media global. 3. Un parémetro f,, que es especitico del -ésimo bloque y que mide la diferencia entre la media de ese logue y la media global 4. Una variabie aleatoria ¢,, que representa el error experimental, 0 sea, 1a parte de la observacién que no es explicada ni por la media global ni por la pertenencia a los grupos o los bloques. Podemos escribir, pues, H+ G +B +e, Se supone que el término de error ¢, satisface los supuestos habituales del modelo de regresiGn méltiple. En conereto, pues, se stipone que las varianzas son independientes e iguales. En tal caso, podemos formular la expresién anterior de la forma siguiente: Xy Ha Gi +B te, ‘A-continuacién, dados los datos muestrales, estimamos la media global j por medio de a media muestral global x, por lo que (xj — X) ¢s una estimacién del primer miembro, La diferencia G, entre 1a media pobla- ional del i-ésimo grupo y la media poblacional global se estima por medio de la correspondiente diferen- cia entre las medias muestrales, (x), ~ +). Asimismo, B, se estima por medio de (%,; — x). Por dhtimo, res- tando, estimamos el término de error: 70 Estadistica para administracién y economia “Tenemos, pues, considerando los miembros muestrales, que G9 -&- D+ yh - H+ 9 wy Para ilustrarlo, consideremos el consumo de combustible de un conductor del tercer grupo de edad con ‘un automévil a, Segiin la Tabla 15.7, xy = 26.0. EL término del primer miembro es 26,0 ~ 24,6 El efecto del grupo (automévil) es 24,7 ~ 24,6 = 0.1 Obsérvese que este término scré el mismo siempre que se conduzca el automévil 2. El efecto del bloque (conductor) es 4-246 8 Por ultimo, el término de error es Nyy oy. why +E = 26,0 — 24,7 — 25,4 + 24,6 = 0.5 Por tanto, tenemos para esta observacién 14=0,1 +08 +05 Podemos interpretar esta ecuacién de la forma siguiente: cuando un conductor del tercer grupo de edad probs el automévil x, consumié 1,4 kilémetros por litro més que la media de todos los automsviles y los conductores. Se estima que de esta cantidad 0,1 se debe al automovil, 0,8 al grupo de edad del conductor y el resto, 0,5, a otros factores, que atribuimos a la variabilidad aleatoria 0 a un error experimental ‘Ahora, si elevamos al cuadrado los dos miembros y sumamos para las n observaciones muestrales, pue- de demostrarse que el resultado es DY Gy -3) HHS 6K EG He E Y oy i. Ey +5? En esta ecuacién, la variabilidad muestral total de las observaciones en torno a su media global es la suma de las variabilidades que se deben a las diferencias entre los grupos, a las diferencias entre los bloques y al ‘error, respectivamente. Es en la descomposicion de estas sumas de los cuadrados en la que se basa el andli- sis de experimentos de este tipo. El andlisis se llama andlisis de la varianza bifactorial, ya que los datos se clasifican de dos formas, por grupos y por bloques. En la Figura 15.5, mostramos esta importante descomposicién de la suma de los cuadrados. Obsérvese que, a diferencia de la descomposicién de! andlisis de la varianza de un factor, la descomposicién de la suma total de los cuadrados de las observaciones muestrales en torno a su media global se divide aqut en ‘res componentes, que resumimos en las Ecuaciones 15.10 a 15.14; el componente extra se debe a nuestra ‘capacidad para extraer de 1os datos informaciGn sobre las diferencias entre los bloques. En el caso de los datos sobre el consumo de combustible de la Tabla 15.7, tenemos que sTC (25,1 ~ 24,6)? + (24,7 ~ 24,6)? +» + (25,4 ~ 24,6)? = 11,88 SCG = 6[(24,7 ~ 24,697 + (23,9 ~ 246)? + (25.2 ~ 24,67] = 5.16 SCB = 31(25,0 ~ 24,697 + (24,6 ~ 246)? + ~- + (24,7 ~ 24,6))] = 4.98 Andlisis de la vartanza 711 ‘Suma de los cuadrados | entre bloques ‘Sume total de los cuadrados ___Suma de os cuadrados | ca aot centre grupos | Suma de los cuadrados | 4 los ertores | Figura 15.5. Descomposicién de la suma de los cuadrados de un andlisis de la varianza bifactorial con una observacién por celda, por Io que, restando, scl = STC ~ SCG — SCB = 11,88 ~ 5,16 ~ 4,98 = 1,74 Descomposicién de la suma de los cuadrados del anélisis de la varlanza bifactorial ‘Supongamos que tenemos una muestra de observaciones y que x, 6s la observacién del -és ¥ 1j-6simo bloque. Supongamos que hay K grupos y H bloques, lo que hace un tolalde n= kH ‘observaciones. Sean las medias muestrales de los grupos (i = 1, 2s... K), las medias muestrales de os bloques £,(j = 1,2, .. AD y la media muestral global . Definimos las siguientes sumas de los cuadrados: KH tol: STC= EE Gy - 37 asa0) oral centre grupos: SCG = HS. Gi, — 87 as. miei entre blogues: SCB = K 5. (, — 8° as.12) mt KH error: SCR = SY (ry — ¥. — 8) + 3 (15.13) ur Entonces STC = SCG + SCB + SCE asa, ‘A partir de aqui, los contrastes relacionados con el andlisis de la varianza bifactorial se realizan de la misma forma que los contrastes relacionados con el andlisis de la varianza de un factor del Apartado 15.2. En primer lugar. obicnemos la media de los cuadrados dividiendo cada una de las sumas de los cuadrados por el niimero correspondiente de grados de libertad. En el caso de la suma total de los cuadrados, los grados de libertad son | menos que el mimero total de observaciones, es decir, (m ~ 1). En el caso de Ia suma de los cuadrados entre grupos, los grados de libertad son | menos que el niimero de grupos. 0 sea, (K = 1). Asimismo, en el caso de la suma de los cuadrados entre bloques, el ntimero de grados de libertad 712 Estadistica para administracin y economia es (H — 1). Por tanto, restando, los grados de libertad correspondientes a la suma de los cuadrados de los ‘errores son (n= 1)-(K- 1) -(H- en-K- H+ KH-K-H+1 =(K~ IH 1) La hipstesis nula de que las medias poblacionales de los grupos son iguales puede contrastarse entonces por medio del cociente entre la media de los cuadrados de los grupos y la media de los cuadrados de los errores, como muestra la Ecuacin 15.18. A menudo se incluye una variable de bloqueo en el andlisis sim- plemente para reducir la variabilidad que se debe al error experimental. Sin embargo, a veces también tiene interés la hipstesis de que las medias poblacionales de los bloques son iguales. Esta hipGtesis puede con- trastarse por medio del cociente entre 1a media de los cuadrados de los bloques y a media de los cuadrados de los errores de la EcuaciGn 15.19. Al igual que ocurte en el caso del anilisis de la varianza de un factor, la comparacién proviene de la probabitidad de una cola de la distribucién F. En el caso de los datos sobre el consumo de combustible, la media de los cuadrados es SCE (K = 1H 1) Para contrastar la hip6tesis nula de que las medias poblacionales del consumo de combustible de los tes tipos de automSviles son iguales, necesitamos Mo MCE 0,174 = 14,83 En el caso de un contraste al nivel de significacién del 1 %, vemos en la Tabla 9 del apéndice que Frese inary = F2,10,001 = 7,559 Contrastes de hipétesis basados en el anélisis de la varianza bifactorial ‘Supongamos que tenemos una obs tral Suponaames que tenemos un obsrvaién metal para cada combnacén grpo-boque en un dso ay Wt G+ B+ oy donde Ges el efecto del grupo y 8, es el del bloque. » Dramas siplentes meas do sumed, casas) as.16) (as.17) Analisis de la var ‘Suponemos que los términos de error , del modelo son independientes entre si y tienen la misma varianza. Suponemos, ademas, que estos errores siguen una distribucion normal. Entonces, la regla de decision de un contraste al nivel de significacién 2 de la hipdtesis nula, Hp, de que las K medias poblacionales de los grupos son iguales es . (15.18) La regia de decisién de un contraste al nivel de significaciin x de la hipdtesis nula, H, de que las H ‘medias poblacionales de los blogues son iguales es eee rechazar He «as.19) Adu, Fr 08 rndmero que es superado oon la probabilidad « por una variable aleaioria que sigue tuna distriblcién F con v, grados de libertad en el numerador y #, grados de libertad en el denominador. Por tanto, basdindose en estos datos, se rechaza claramente al nivel de significacién del 1 % la hipétesis de due las medias poblacionales del consumo de combustible de los tres tipos de automéviles son iguales En estc ejemplo, la hipétesis nula de la igualdad de las medias poblacionales de los bloques es Ia hipé- tesis de que las medias poblacionales del consumo de combustible de todos los grupos de edad son iguales. EI contraste se basa en MCB _ 0,996 MCE 0,174 = 5,724 En el caso de un contraste al 1%, vemos en la Tabla 9 del apéndice que Fa-ix~ nya = Fs,10,091 = 5,636 Por tanto, la hip6tesis nula de la igualdad de las medias poblacionales de los seis grupos de edad también se rechaza al nivel de significacién del 1 %. Una vez mis, es muy cémodo resumir los célculos en una tabla, La Tabla 15.9 muestra la organizacién general de la tabla del andlisis de la varianza bifactorial y la Figura 15.6 muestra este anilisis de la varianza basado en los datos sobre el consumo de combustible. El ntimero de grados de libertad depende del niimero de grupos y de bloques. Las medias de los cuadrados se obticnen dividiendo las sumas de los ‘cuadrados por sus grados de libertad correspondientes. La media de los cuadrados de los errores es el deno- minador en el célculo de los dos cocientes F en los que se basan nuestros contrastes. Tabla 15.9. Formato general de la tabla del andlisis de la varianza bifactorial Fuente de la ‘Suma de los Grados Media de los ete variacién cuadrados _de libertad cuadrados SCG Entre grupos scG -1 MCG Entre bloques scB H-1 MCB : c= 1H = 1) MC Error SCE (KH 1) MCE= ey Total sTC n-1 na Bstadistica para administracion y economia ‘Consumo de combustible de los automéviles. (andlisis de la varianza bifactorial) Queremos averiguar si existen pruebas contundentes para concluir que hay diferencias entre los niveles de consumo de combustible de diferentes automéviles conducidos por diferentes conduc- tores. Solucién. Los datos sobre el consumo de combustible de la Tabla 15.7 pueden analizarse uti- lizando el programa Minitab; la salida se muestra en la Figura 15.6, Esta figura también muestra Jas distintas sumas de los cuadrados y los cocientes F. El cociente F calculado del automévil de 14,83 da como resultado el rechazo de la hip6tesis nula de que no hay ninguna diferencia entre Jos automéviles, Asimismo, el cociente F calculado del conductor de 5,72 da como resultado el rechazo de la hipétesis nula de que no hay ninguna diferencia entre los conductores. Por consi- guiente, tanto el automévil como el conductor influyen significativamente en el consumo de combustible. ‘Two-way ANOVA: Mileage versus Car, river Source DF 3s ye eny. car 2 $16 2,880 14,83 0,001 Driver 5 4,98 0,996 5,720,009, Error 101,74 0,178 otal 171188 $= 0/4171 RSq = 85,95 8 R-Sgiads) = 75,10 ¥ Individual 95 * CIs For Mean Based on ne 24,00 24,60” 25,2028, Individuel 95 4 Cis For Mean Based on Pooled stbev Driver ees - 2 4 ‘ 5 ‘ 40 23,80 24,50 25,20 25,90 Figura 15.6. Resultados dol andlisis de la varianza bifactorial (Salida Minitab). Ejercicios Bjercicios basicos 15.27. Considere un andlisis de la varianza bifactorial con una ‘observacién por celda y bloques aleatorizados con los siguientes resultados: Puente de ‘Suma de los Grados variacién cuadrados de libertad ine grupos at 4 Entre bloques 348, s Error 50 20 1 1.129 29 Calcule las medias de los cuadrados y contraste las hipstesis nulas de que las medias entre grupos son iguales y de que las medias entre bloques son iguales. 18.28. Considere un andlisis de a varianza bifactorial con una observaciGn por celda y bloques aleatorizados con los siguientes resultados Puente de ‘Suma de los Grados variacién wuadrados __de libertad Entre grupos 380 6 Entre bloques 232 5 Error 387 30 Total 989) 41 Caleule las medias de los cuadrados y contraste las hipstesis nulas de que las medias entre grupos son iguales y de que las medias entre bloques son igual. 15.29, Considere un andlisis dela varianza bifactorial con una dobservaci6n por celda y bloques aleatorizados con los siguientes resultados: Fuente de ‘Suma de los Grados variacion euadrados de libertad tre grupos Br 3 Entre blogues 287 6 Error 360 18 Total 78. 21 Caleule las medias de los cuadrados y contraste las hipétesis nulas de que las medias enire grupos. son iguales y de que las medias entre bloques son iguales EJercicios aplicados 15,30, Se pide a cuatro analistas financieros que predigan el crecimiento que experimentaran los beneficios de cinco companas petroleras el proximo afi. La tabla adjunta muestra sus predicciones, expresadas en porcentaje 15.31. Analisis dela varianza 718 a. Elabore la tabla del andlisis de vial >, Contraste la hipétesis nula de que las medias pobla- cionales de las predicciones de los beneficios de to- das las compantas son iguales. la varianza bifacto- Analista Companta petrolera AB D 7 Sie gas: 2 9 9 8 3 2 0 9 0 4 110) 02 5 o 8 wo La tabla adjunta muestra los resultados (en quintales por acre) de un experimento agricola cuyo objetivo era vvalorar las diferencias de rendimiento de cuatro varie- dades diferentes de maiz, utiizando res fertilizantes distintos, Variedad Fenilizante ABO T a6 e8SOCSSC 2 2 9 BB 3 580 39 8. Elabore la tabla del an vial b, Contraste la hipstesis nula de que las medias pobla- jonales del rendimiento de las cuatro variedades de mate son iguales. €. Contraste la hipétesis nula de que las medias pobla- cionales del rendimiento de las tres marcas de fert- izante son iguales. isis de la varianza bifacto- Una empresa ha hecho un estudio de mercado de tres nuevos tipos de sopa en algunas tiendas durante un periodo de un afo. La tabla muestra las ventas (en mi- Tes de d6lares) de cada una de las tres sopas en cada trimestre del aio, Sopa A B c 7 a 7 6 2 68 68 76 3 9 67 Sa 4 2 00 716 1533. 15.34, 18.35, Estadistica para administracién y economia ‘4, Elabore la tabla del andlisis de la varianza bifacto- rial. bb. Contraste la hipStesis nula de que las medias pobla- clonales de las ventas de los tres tipos de sopas son iguales, Un fabricante de una bebida refrescante sin azticar uiere comparar la influencia en las ventas de las latas de tres colores distintos: rojo, amarillo y azul. Se selec: cionan cuatro regiones para realizar el estudio y se eli gen aleatoriamente tres supermercados en cada regién para vender en cada uno de ellos latas de uno de los colores. La tabla adjunta muestra las ventas (en dece nas de latas) realizadas al final del periodo del experi: mento. (Color de Ta lata Regidn Rojo Amarillo Azul Este a a) Sur 56 SHS Norte 9 63S Oeste a ae) 1. Elabore la tabla del andlisis de ta varianza, 'b. Contraste la hipétesis nula de que las medias pobla- cionales de las ventas de las latas de los tres colores son iguales. Un profesor de evonomfa tiene que elegir entre tres li bbros de texto. También tiene que elegir entre tres tipos de exémenes: tipo test, redacciones y una mezcla de los dos. Durante el afio, da clase a nueve grupos y asigna aleatoriamente a cada grupo una combinacién de libro de texto y tipo de examen. Al final del curso obtiene las evaluaciones realizadas por los estudiantes de cada gru- po. La tabla adjunta muestra estas evaluaciones. ibro de texto Examen A B Tipo test 485349 Redaceién 465043 Mezcla 465148 ‘ Elabore la tabla del andlisis de la varianza, 1b. Contraste la hipstesis nula de la igualdad de las me- dias poblacionales de las evaluaciones correspon- dientes a los tres libros de texto. . Contraste la hipétesis nula de la igualdad de las me- dias poblacionales de las evaluaciones correspon- dientes a los tes tipos de examenes. Hemos introducido para el andlisis de la varianza bifac: torial el modelo poblacional Ky n= G+ Bt oy Baséndose en los datos de! Ejercicio 15.33, obtenga las estimaciones muestrales de cada término del segundo 18.36. 1837. 15,38, ‘miembro de esta ecuacién para la combinacién regién ceste-tata roja Baséndose en los datos de! Ejercicio 15.34, obtenga las estimaciones muestrales de cada término del se- ‘gundo miembro de la ecuacién utilizada en el ejercicio anterior para la combinacién libro de texto C-examen tipo test Se pide a cuatro agencias inmobitiarias que valoren diez viviendas sitvadas en un determinado barrio. En la tabla se muestran los resultados de las valoraciones, cexpresadas en miles de détares Fuente de variacion ‘Suma de los cuadrados Entre agentes 268 Entre viviendas 1.152 Exor 2.392 ‘8, Complete la tabla del andlisis de 1a varianza. 'b. Contraste la hip6tesis nula de que las medias pobla- cionales de las valoraciones de estas cuatro agencias son iguales, Se evalian cuatro marcas de fertilizantes. Se utiliza cada ‘marca en seis parcelas de tierra de diferentes tipos. A. continuacién, se mide el aumento poreentual del rend ‘miento del mafz en las 24 combinaciones marca-tipo de tierra, La tabla adjunta resume los resultados obtenidos Fuente de variacion ‘Suma de Tos cuadrados hire ferilizantes 135.6 Entre tipos de tierra 817 Enor 113, ‘a, Complete la tabla del andlisis de 1a varianza, bb. Comtraste la hipotesis nula de que las medias pobla- cionales del aumento del rendimiento del mat son iguales con los cuatro ferilizantes. e. Contraste la hip6tesis nula de que las medias pobla- jonales del aumento del rendimiento del maiz son iguales en los seis tipos de tierra ‘Se proyectan con caricter experimental tres series de televisién a audiencias de cuatro regiones del pats: este, sur, norte y oeste, Basindose en la reaccién de kt audiencia, se obtiene una puntuacién de cada programa (en una escala de 0 a 100). Las sumas de los cuadrados entre los grupos (programas) y entre los bloques (regio- res) som SCG= 95.2 y SCB= 69,5 y la suma de Jos cuadrados de los errores es SCE = 79,3 Elabore la tabla del andlisis de ta varianza y contraste la hip6tesis nula de que las medias poblacionales de las Puntuaciones de las reacciones de la audiencia a los tues programas son iguales. Analisis dela varianza 717 1540, Suponga que en el anslisis de la varianza bitactorial contraste analizado en el Apartado 10.1 para contras- ‘con una observacién por celda, solo hay dos grupos. tar la igualdad de medias poblacionales, dada una Demuestre que en este caso el cociente F para con- ‘muestra de datos parcados. Por tanto, deduzca que trastar Ia igualdad de las medias poblacionales de los Jos dos contrastes Son equivalentes en este caso con- _erupos es exactamente el cuadrado del estadistico del crete, 15.5. Analisis de la varianza bifactorial: mas de una observacion por celda En la organizacién del anslisis de 1a varianza bifactorial del Apartado 15.4, podemos ver que los datos tabulados (como en las Tablas 15.7 y 15.8) se dividen en celdas y que cada celda se refiere a una combina- cién grupo-bloque. Asf, por ejemplo, los resultados obtenidos cuando un conductor del cuarto grupo de edad conduce un automévil f constituyen una tinica celda, Una caracterfstica del disefto analizado en el Apartado 15.4 es que cada celda contiene solamente una observacién muestral. Asi, por ejemplo, un con- ductor del cuarto grupo de edad solo prucba una vez un automévil f. En este apartado, consideramos la posibilidad de reproducir el experimento de manera que, por ejem- plo, los automéviles f sean conducidos por mas de un conductor del cuarto grupo de edad, Los datos resul- tantes de ese disefio implicarfan entonces més de una observacién por celda. La extensién de la muestra de esta forma tiene dos grandes ventajas. En primer lugar, cuando se dispone de mds datos muestrales, fas ‘estimaciones resultantes son més precisas, por lo que podemos distinguir mejor tas diferencias entre las medias poblacionales. En segundo lugar, un diseflo con més de una observacién por celda permite aislar ‘otra fuente més de variabilidad: la interaecién entre los grupos y los blogues. Se producen interacciones de ese tipo cuando las diferencias entre los efectos de los grupos no estin distribuidas uniformemente entre los bloques. Por ejemplo, es posible que los conductores que consiguen unas cifras de consumo de combustible mejores que la media logren mejores cifras cuando conducen un automévil « que cuando conducen un automévil . Por tanto, estas cifras mejores que la media no estn distribuidas de una manera uniforme entre todos los tipos de automsviles sino que son més manifiestas en unos tipos que en otros. Esta posibili- dad de interaccién entre los conductores y los automdviles puede tenerse en cuenta en un andlisis basado en més de una observacién por celda, Para ilustrar el tipo de datos que pueden analizarse, 1a Tabla 15.10 contiene los resultados det consumo de combustible de conductores de cinco grupos de edad con tres tipos de automéviles: automdviles X, automéviles Y y automéviles Z. Las tres observaciones de cada celda se refieren a pruebas independientes realizadas por conductores de un grupo de edad dado con automéviles de un determinado tipo. Tabla 15.10. Observaciones muestrales sobre el consumo de combustible de tres tipos de autom6viles conducidos por cinco clases de conductores; tres observaciones por celda, Tipo de automévil lase de conductor | __ Automéviles X ‘Automéviles Automéviles Z if 250 254 252 | 240 244 23.9 28 254 2 MS MS U5 1235 BS 238 25.0 3 261 263 262 | 246 249 249 25.9 4 1 244 244 | 239 240 23,8 23.6 5 240 236 241 | 244 244 24,1 25,2 718 Estadistica para administracion y economia Para representar las observaciones muestrales individuales, necesitamos un subindice triple, por lo que ‘xy Fepresenta la [-ésima observacin de la jj-ésima celda, es decir, la /-ésima observacién de la celda co- rrespondiente al i-6simo grupo y el j-ésimo bloque. Al igual que antes, K representa el nimero de grupos y Hl niimero de bloques. m representa el niimero de observaciones por Tabla 15.10, K = 3. Ida. Por tanto, en el ejemplo de la Sy m= 3, Esta notaci6n se muestra en la Tabla 15.11. Tabla 15.11. Observaciones muestrales sobre K grupos y H bloques; m observaciones por celda Grupo Bloque 1 2 K 1 ig Siam Sanaa Xam euetan2 "km 2 XyaXiaa "Siam Raaean "Sam 7 xan am a SunXun Sune Xt XxmXxira"* ¥Kthm Baséndonos en los resultados de un experimento de este tipo, podemos contrastar tres hipotesis nulas: ninguna diferencia entre las medias de los grupos, ninguna diferencia entre las medias de los bloques y rhinguna interaccién entre los grupos y los bloques. Para realizar estos contrastes, calculamos de nuevo varias medias muestrales, que se definen y se calculan de la forma siguiente: 1. Medias de los grupos La media de todas las observaciones muestrales del i-Gsimo grupo se representa por medio de ¥.. por lo que Basdndonos en la Tabla 15.10, tenemos que 25,0 + 25,4 + +++ + 23,6 + 24,1 = 24.86 15 = 240+ 244 + + 244 + 24 15 24.16 2. Medias de los bloques La media de todas las observaciones muestrales del -€simo bloque se representa por medio de Z por lo que km pp oe ; Km Anlisis de lavarianza 719 Baséndonos en la Tabla 15.10, tenemos que 25,0 + 25,4 + +--+ 25,8 + 25,4 =2 7 5,00 Gao SH USH + 250+ 254 9 fg = 20H 263 + +259 $255 _ 3 55 9 241+ 24d + ove + 23,6 + 23,5 ig 9 240 + 23,6 + --- + 25.2 + 25 9 3. Medias de las celdas Para comprobar la posibilidad de que haya interacciones entre los grupos y los bloques, es necesa- rio calcular a media muestral de cada celda, Sea X,, la media muestral de la (i/)-ésima celda, En ese 850, Ean Por tanto, baséndonos en los datos de la Tabla 15.10, tenemos que 250 + 25,4 + 25.2 _ fee : 25,2 i +248 + 24, yy = A EEE | og 3 243 Fy = 239 = 248 Hy = 23.9 ds, 25,2 Fyy = 25.7 yy = 2B,T Hyg. = 25,2 4. Media global : La media de todas las observaciones muestrales se representa por medio de ¥, por lo que yo dew ae KHm Enel caso de nuestros datos, esta cantidad se calcula més fécilmente hallando la media de las me- dias muestrales de los tres grupos, lo que Heva al resultado siguiente: 24,86 + 24.16 + 25.10 = 2471 720 Estadistica para administracion y economia Ahora bien, para comprender mejor el andlisis, ¢s til basarnos en el modelo poblacional supuesto. Sea X,z la variable aleatoria correspondiente a la /-ésima observaciGn de la i-¢sima celda. En ese caso, el mo- delo supuesto en nuestro andlisis es Xy = + G+ By + Ly + ey Los tres primeros términos del segundo miembro son exactamentc iguales que los de! modelo en el que no habja repeticiones. Representan, al igual que antes, una media global, un factor especifico del grupo y tun factor especifico del bloque. El término siguiente, Ly, representa el efecto de estar en la ji-ésima celda, dado que ya se tienen en cuenta el efecto global, el efecto del grupo y el efecto del bloque. Sino hubiera ninguna interaccidn entre los grupos y los bloques, este término seria 0, Su presencia en el modelo nos permite averiguar si hay interacciGn, Por Ghtimo, el término de error, ¢,. €8 una variable aleatoria que re- presenta el error experimental Reescribimos el modelo en forma de desviaciones con respecto a la media: Xiu W= G+ By Ly + en Se demuestra que la suma total de los cuadrados puede descomponerse en la suma de cuatro téeminos, «que representan la variabilidad que se debe a los grupos, aos bloques, a la interaccidn entre los grupos y Jos blogues y al error. En las Ecuaciones 15.20 a 15.25, se muestra la descomposicién en la que se basan los contrastes sin indicar en dotalle emo se obtienen. Andlisie de la varianza bifactorlal: varias observaciones por celda ‘Supongamos que tenemos una muestra de observaciones sobre i grupos y / bloques y m observacio- nes por celda. Sea x, la /-ésima observacion de la celda del i-ésimo grupo y el -simo bloque. Sea la ‘media muesiral global, las medias muestales de los grupos, x, las medias muestales do los Bo- ‘ques y i. las medias muestrales de las celdas. ‘A continuacién, definimos las siguientes sumas de los cuadrados y los grados de libertad corres- pondientes: ‘Suma de los cuadrados Grados de libertad: Total: ste = SEE Gy 3? Kim — 1 1520) TTT x Entre grupos: SCG = Hm YG. ~ as.21) Entre bloques: SCB = Km Sy ~ 3 45.22) Interacciones: sci= m3, E Gy. Se -¥ 4D = 1H = 1) (1523) am Error STE = DEE Gy ~ ¥P HK ~ 1) (1s24) em Entonces STC = SCG + SCB + ScI + SCE 15.25) Dividiendo las sumas de los cuadrados de los componentes por sus grados de libertad correspon- dientes, tenemos las medias de los cuadrados MCG, MCB, MCI y MCE. Los contrastes de las hipdtesis Analisis de la varianza_ 721 de que no hay efectos de los grupos, de los bloques y de la interaccién se basan en los respectivos cocientes F: ‘i MCG MCB MCI MCE MCE MCE " Los contrastos se realizan comparando estas cifras con las distribuciones F con los correspondientes ‘grads de libertad del numerador y el denominador. Su validez se basa en el supuesto de que los ay: 86 ‘comportan como una variable aleatoria de una distribucién normal. La Figura 15.7 muestra que la descomposicién de la suma total de los cuadrados de las observaciones muestrales en tomo a su media global es la suma de cuatro componentes. Se diferencia de la Figura 15.5 en que, cuando se replica el experimento, ahora podemos aislar la suma de los cuadrados de las interacciones. ‘Suma de los cuadrados enire grupos ‘Suma de jos cuadrados lenire bloques | ‘Suma total de los cuadrados ‘Suma de los cuacrados | {elas nteracciones ‘Suma de los cuadrados 0 los erroves Figura 15.7. Descomposicién de la suma de los cuadrados de un andlisis de la varianza bitactorial ‘con mas de una observacién por celda. Los célculos pueden resumirse, al igual que antes, en una tabla del andlisis de la varianza. La Tabla 15.12 muestra la forma general de 1a tabla cuando hay m observaciones por celda en un anélisis de la varianza bifactorial Tabla 15.12. Formato general de Ia tabla del andlisis de la varianza bifactorial con m observaciones pores - : fas de on a fa pacts CG coer UL tara Nandraioe’ —_culeme SCG MCG Ene grupos seo ka mco= 86 MG SCB MCB Ene bogus sce wt nice = Se sci scl Interaccién sci (-IMH- 1) MCl= ee MCE at ce Enor SCE KH(m — 1) MC KHim — 1) Total sTC 722 Estadistica para administracion y economia De hecho, existen {6rmulas més sencillas para calcular las distintas sumas de los cuadrados. No obsian- tc, los cAlculos aritméticos son bastante tediosos y deben realizarse por ordenador. No entraremos aqui en mis detalles sino que nos limitaremos a mostrar en la Figura 15.8 los resultados de los célculos basados en nuestros datos. En la préctica, los célculos del andlisis de la varianza normalmente se realizan utilizando un paquete estadistico como Minitab, por lo que raras veces la complejidad aritmética limita los andlisis préc- ticos. ‘Two-way ANOVA: Mileage versus Car. Oriver source or ss xs F P car 2 7,156 3,57800 92,53 0,000 Driver 4 13,148 3,28700 85,01 0,000 Interaction 8 6,604 0,82550 21,35 0,000 Error 301,160 9,03867 otal a 28060 S = 0/1966 RSG = 95,87 8 ReSaladj) = 93,94 8 Individual 95 ¥ Cie For Mean Based on Pooled stbev car 1 2 3 24,60 25,90 25,20 Indivival 958 cia For mean Pooled seDev peiver Mean ==-~ 1 25,0000 2 2415333 3 25/5667 ‘ 23/9667 5 24,4667 Figura 15.8. Analisis do la varianza de los datos sobre el consumo de combustible de la Tabla 15.10 {salida Minitab). Los grados de libertad de la Figura 15.8 se deducen det hecho de que en el caso de estos datos tene- mos que K=3 H=5S m=3 Las medias de los cuadrados se obtienen dividiendo las sumas de los cuadrados por los grados de libertad correspondientes. Por iltimo, los cocientes F se obtienen dividiendo, a su ve7, cada una de las tes primeras ‘medias de los cuadrados por la media de los cuadrados de los errores. Utilizando la Figura 15.8, podemos contrastar las tres hipstesis nulas de interés. En primer lugar, con- trastamos la hip6tesis nula de que no existe ninguna interacciGn entre los conductores y el tipo de auto- movil. Este contraste se basa en el cociente F caleulado, 21,35, y el p-valor de 0,000. Dado que los gra dos de libertad del numerador y del denominador son 8 y 30, respectivamente, vemos en la Tabla 9 del apéndive que Fasnoo1 = 3173 Andlisis de la varianza 723 La hipétesis nula de que no existe ninguna interaccién entre el tipo de automévil y el conductor se rechaza claramente al nivel de significacién del 1 %, ya que 21,35 es mayor que 3,173 ‘A continuacién, contrastamos la hip6tesis nula de que las medias poblacionales del consumo de com- bustible de los automéviles X, Y y Z son iguales. El contraste se basa en el cociente F calculado, 92,53 ‘Vemos en la Tabla 9 del apéndice que en el caso de un contraste al 1 % con 2 y 30 grados de libertad en el numerador y en el denominador, respectivamente, Fa,x0,001 = 5390 Por tanto, se rechaza abrumadoramente 1a hipétesis nula de Ia igualdad de las medias poblacionales del consumo de combustible de los tipos de automévil al nivel de significacién del 1 %. Por ultimo, contrastamos la hipdtesis nula de que las medias poblacionales del consumo de combustible de los cinco grupos de edad de los conductores son iguales. Vemos en la Figura 15.8 que el contraste se basa en el cociente F calculado, 85,01. Por tanto, los grados de libertad del numerador y del denominador son 4 y 30, respectivamente, por lo que en un contraste al nivel de significacién del 1%, F20,001 = 4.018 La hipétesis nula de la igualdad de las medias poblacionales del consumo de combustible de los grupos de edad de los conductores se rechaza claramente al nivel de significacién del 1%. ‘Nuestros datos permiten extraer claramente las tres conclusiones siguientes: 1. El consumo medio de combustible de los automdviles X, ¥ y Z no es ef mismo. 2. El consumo medio de combustible de los conductores de todos los grupos de edad no es el mismo. 3. Las diferencias entre los conductores no estén distribuidas uniformemente entre los tres tipos de automoviles sino que es probable que un conductor de un grupo de edad obtenga unos resultados relativamente mejores en un tipo de automévil que en otro en comparacién con otros conductores. En este apartado, hemos supuesto hasta ahora que todas las celdas tenfan el mismo niimero de observa- ciones. Sin embargo, esta restriccién no es necesaria y a veces puede ser incémoda para el investigador. De hecho, las f6rmulas para calcular las sumas de los cuadrados pueden modificarse para que las celdas no tengan todas ellas el mismo numero de observaciones. No nos interesa aquf entrar en los detalles técnicos del célculo de las sumas de los cuadrados. Generalmente, los investigadores disponen de paquetes estadisti- cos para realizarlo. Lo que nos interesa es el andlisis de los resultados. Nivel de satisfaccion de los trabajadores (analisis de la varianza bifactorial) Existe un estudio (Kim, 1980) en el que se comparan los niveles de satisfaccin de los trabajadores introvertidos y extrovertidos que realizan tareas estimulantes y no estimulantes. Para realizar este estudio, se utilizaron dos tipos de trabajadores y dos tipos de tareas, 1o que nos da cuatro combinacio- nes. Las medias muestrales de los niveles de satisfaccién declarados por los trabajadores de estas cuatro combinaciones fueron: Trabajador introvertido, tarea no estimulante (16 observaciones): 2,78 ‘Trabajador extrovertido, tarea no estimulante (15 observaciones): 1,85 ‘Trabajador introvertido, tarea estimulante (17 observaciones): 3,87 ‘Trabajador extrovertido, tarea estimulante (19 observaciones): 4,12 La tabla siguiente muestra las sumas de los cuadrados calculadas y los grados de libertad corres- pondientes, Complete la tabla del andlisis de la varianza y analice los resultados de este experiment 724 Estadistica para administracion y economia Fuente de Sumadelos Grados de variacion cuadrados libertad Tarea 62,04 1 ‘Tipo de trabajador 0,06 1 Interaccién 1,85 1 Error 23,31 63 Total 87,26 66 Solucién. Una vez més, las medias de los cuadrados se obtienen dividiendo las sumas de los cua- drados por sus grados de libertad correspondientes. Los cocientes F se deducen de la divisién de las, medias de los cuadrados de las tareas, de los tipos de trabajadores y de las interaceiones por la media de los cuadrados de los errores. Ahora podemos completar la tabla del andlisis de la varianza, Fuente de Suma de los Grados de Medias de 105 Gocientes F variacién, cuadrados libertad cuadrados Tarea 62,04 1 167,68 Tipo de trabajador 0,06 1 0.16 Interaccién 1,85 1 185 5.00 Error 23,31 63 0,37 Total 87,26 66 La tabla del andlisis de la varianza puede utilizarse para contrastar tres hipstesis nulas. En el caso de la hipotesis mula de 1a igualdad de las medias poblacionales de los niveles de satisfaccién con los dos tipos de tarea, el cociente F calculado es 167,68, Tenemos 1 grado de libertad en el numerador y 63 en el denominador, por lo que utilizando Minitab para un contraste al 1% Fgs,op1 = 7.055 Por tanto, se rechaza claramente la hip6tesis nula de la igualdad de las medias poblacionales de los niveles de satisfaccién con las tareas estimulantes y no estimulantes. Este resultado no es sorprenden- te. Seria ldgico esperar que los trabajadores estuvietan més satisfechos realizando tareas estimulantes, que realizando tareas no estimulantes, ‘A continuaciGn, contrastamos la hip6tesis nula de que las medias poblacionales de los niveles de satisfaccién de los trabajadores introvertidos y extrovertidos son iguales. En este caso, el cociente F calculado es 0,16. De nuevo, los grados de libertad son 1 y 63, por lo que en el caso de un contraste al 5%, Fgs,003 = 3,993, La hipétesis nula de 1a igualdad de los niveles medios de satisfaccién de los trabajadores introverti- dos y extrovertidos no puede rechazarse al nivel de significacién del 5%. En muchos estudios, cl término de interaccién no es en sf mismo muy importante. Se incluye en el andlisis principalmente para «absorber» parte de la variabilidad de los datos y poder detectar asf mis fécilmente las diferencias que pueda haber entre las medias poblacionales. Sin embargo, en este estudio la interaccién es muy interesante, La hipétesis nula de que no existe ninguna interaccién en- Andlisis dela varlanza 728 tre la tarea y el tipo de trabajador en la determinacidn de los niveles de satisfaccién de los trabajado- res se contrasta por mi del cociente F calculado de 5,00. De nuevo, los grados de libertad del numerador y del denominador son 1 y 63, respectivamente. Por tanto, la comparaciGn con los valores calculados de la distribuci6n F revela que la hipStesis mula de que no existe ninguna interacciGn pue- de rechazarse al nivel del 5 %, pero no al nivel de significacién del 1 %, Ejercicios Ejercicios basicos ISL. Considere un experimento en el que los factores de tra- tamiento son A y B y el factor A tiene cuatro niveles y €1B tiene tres niveles. La tabla del andlisis de la varian- ‘7a adjunta resume los resultados del experimento. Caleule las medias de los cuadrados y contraste las hipstesis nulas de que no hay ningun efecto de ninguno de los dos tratamientos y ningdn efecto de interaccién. Fuente de Suma de los Grados de variacign ‘cuadrados libertad ‘Grupos de tratamiento A 37 2 Grupos de tratamiento B 38 6 Interaccién 7 2 Error mm a4 Total 425 108 Fuente de ‘Suma delos Grados de variacién cuadrados, libertad Grupos de tratamienio A 7 3 Grupos de tratamiento B a 2 Interaccién 30 6 Eror 280 60 Total 464 u 15.42. Considere un experimento en el que los Factores de tra- tamiento son A y By el factor A tiene cinco niveles y el B tiene seis hiveles. La tabla del andlisis de la va- rianza adjunta resume los resultados del experimento, Ejerciclos aplicados 15.44. Suponga que analiza las puntuaciones dadas por los jueces en los saltos de esqur de las olimpiadas de in- vierno. Suponga que hay 22 participantes y nueve jue cos en la competicién de saltos de esqut masculinos. ‘Cada juez. punta a cada participante en siete pruebas. Las puntuaciones pueden analizarse, pues, en el marco de un andlisis de la varianza bifactorial con 198 celdas participante-juez, siete observaciones por celda. La ta- bla adjunta muestra las sumas de los cuadrads. Fuente de variaci6n ‘Suma de los cuadrados Fuente de ‘Sumadelos Grados de Entre participantes 364,50 variacién cuadrados libertad Entre jueces ost “Grupos de watamientp A %6 4 Interacci6n 494 Grupos de tratamiento B 5 5 Error 1,069.94 —— ae re ‘a. Complete fa tabla del andlisis de la varianza. Exror 300 o 'b. Realice los contrastes F correspondientes ¢ interpre- Total 536 119 te sus resultados. Caleule las medias de los cuadrados y contraste tas hipotesis nulas de que no hay ningén efecto de ninguno de los dos tratamientos y ningtin efecto de interaceién. 15.43, Considere un experimento en el que los factores de tra- tamiento son A y B y el factor A tiene tres niveles y el B tiene siete niveles. La tabla del andlisis de la varianza adjunta resume los resultados del experimento. Calcule la media de los cuadrados y contraste las hiipstesis nulas de que no hay ningén efecto de ninguno de los dos tratamientos y ningin efecto de interaecién. 15.45. Vuelva al Ejercicio 15.44, En la competicién de patin je anvstico panicipan doce parejas. Una vez més, hay rueve jueces y se puntéa a los pantcipantes en siete pruebas, Las Sumas de los cuadrados entre 1os grupos: (parejas de participantes) y entre los bloques (jueces) son SCG = 60,10 y SCB=1,65 mientras que Ta suma de los cuadrados de las interac- ciones y de los errores son SCI=335 y SCE =31,61 726 Estadistica para administracién y economia Analice estos resultados interprete verbalmente las ‘conclusiones. 15.46. Un psicélogo esté trabajando con tres tipos de tests de saptitud que pueden hacerse a las personas que soli ‘empleo. Una cuestién importante para estructurar cl proceso de realizar los tests es la posibilidad de que exista interaccién entre los que los que se someten a los tests y el tipo de test. Si no hubiera ninguna interac eign, solo seria necesario un tipo de test, Se realizan tres tests de cada tipo (A. B y ©) a los miembros de cada uno de los cuatro grupos de tipos de sujeto, Estos se distinguen por las valoraciones de malo, regular. bueno y excelente en las entrevistas preliminares. Las puntuaciones obtenidas se muestran en la tabla adjun Tipo de test Tipo de sujeto A B c Malo 65 68 62 69 71 67 75 75 78 Regular 74-79 76-«-72:«6 69 70 69 65 Bueno «G4_—-72:«6S-GS_73.:«75«7R 82 80 Excelente 83 8284 78 78 75 76 77 _75 18.47. 15.48, Blabore la tabla del andlisis de la varianza, bb. Contraste la hipstesis nula de que no existe ninguna Interacci6n entre el tipo de sujeto y el tipo de test. Se pide a muestras aleatorias de dos estudiantes univer- sitarios de primer ato, dos de segundo aio, dos de ter- cer alo y dos de cuatto ao de cuatro residencias uni- versitarias que valoren en una escala de 1 (mala) a 10 (excelente) la calidad del ambiente de Ia residen +a estudiar. La tabla muestra los resultados. Residencia Afi A B iS D Primerafo 7 5 8 6 9 & 9 9 Segundoaio 6 8 S 5 7 8B 8 YO Tewerato 5 4 7 6 6 77 8 Cuanowio 7 4 6 8 7 5 6 7 . Vuelva al Bie! interacciones que pueda haber se atrbuyen a un error aleatorio, Cuando se postula ese supuesto, el andlisis se realiza como siempre, con la salvedad de que ahora se suma lo que antes eran las sumas de los cuadrados de las imteracciones y de los errores para formar una nueva suma de los cuadrados de los ertores. También se su- rman los grados de libertad correspondientes. Si el su- puesto de fa ausencia de interacciones es correcto, este ‘enfoque tiene la ventaja de que aumentan los grados de libertad de los errores y, por tanto, los contrastes de la igualdad de las medias de los grupos y de los bloques son mas potentes. Suponga que para el estudio del Ejer- cicio 15.47 ahora postulamos el supuesto de que no hay interacciones entre la valoracién de la residencia y el afio de estudios del alumno, ‘a. Explique con sus propias palabras las implicaciones de este supuest, 1b, Dado este supuesto, elabore la nueva tabla del anli- sis de la varianza, . Contraste la hipstesis nula de que las medias pobla- cionales de las valoraciones de las cuatro residen- cias son iguales. 4. Contraste la hip6tesis nula de que las medias pobla- cionales de las valoraciones de los cuatro tipos de ‘estudiantes son iguales jo 15.31. Una vez realizado el experi ‘mento para comparar el rendimiento medio por acre de ‘cuatro variedades de maiz y tres marcas de fertlizamte, tun investigador agrario sugiri6 que podfa exi interaccidn entre la variedad y el fertilizante. Para com- probar esta posibitidad, se realizé otra serie de prue- bas, que dieron los rendimientos que se muestran en la tabla, Variedad “aA BC »D_ 0 873) 8 or 798 st Elabore la tabla del andlisis de la varianza. D. Contraste la hipétesis nula de que las medias pobla- cionales de las valoraciones de las cuatro residen- cias son iguales. ‘¢ Contraste la hipstesis nula de que las medias pobla- cionales de las valoraciones de los cuatro tipas de estudiantes son iguales 4d. Contraste la hipétesis nula de que no existe ninguna imteraccién entre el aflo de estudios y la valoracién de la residencia, En algunos experimentos con varias observaciones por celda, el analista esti dispuesto a suponer que no existe ninguna interaccién entre los grupos y los bloques. Las ‘a. (Qué implicaria una interacci6n entre la variedad y cl fertilizante? bb. Combine los datos de los dos conjuntos de pruebas y elubore una tabla del andlisis de la varianza, ¢. Contraste la hipsiesis nula de que las medias pobla- jomales del rendimiento de las cuatro variedades de ‘mafz son iguales. 4. Contraste fa hipdtesis nula de que las medias pobla- cionales del rendimiento de las tres marcas de terti- lizante son iguales, ‘€. Contraste la hipdtesis nula de que no existe ninguna jeraccién entre la variedad dle mafz y la marca del fenilizame, 1850, Vuelva al Bjercicio 15.33. Suponga que se afade al es tudio una segunda tienda para cada combinacién de re- agin y color de las latas y se obtienen los resultados que muestra la tabla adjunta. Combinando estos resi tados con los del Ejercicio 15.33, realice los céleulos, el andlisis de la varianza y analice sus resultados. Color de Ha Tata Regién Rojo Amarillo Azul Exe 350 Se Sur 4 Sl) 88 Norte 436050 Oeste 3849 at Andlisis dela varlanza 727 1S.SL, Una vez realizado el estudio del Ejercicio 15.34, el pro- {esor decidié repetirlo un aflo més tarde. La tabla mues- tra los resultados obtenidos. Combinando estos resulta- dos con los del Ejercicio 15.34, realice los célculos det andlisis de la varianza y analice sus resultados. Libro de texto B Tipo de west a7 SL 4 Redaccin 44 4640 Mercla 4, 349 Términos clave * andlisis de la varianza bifactorial: una observacién por celda, bloques aleatorizados ‘+ andlisis de la varianza bifactorial: varias observaciones por celda ‘ andlisis de ta varianza de un factor * contraste de Kruskal-Wallis ‘ descomposicisn de la suma de los cuadrados en el anilisis de la varianza bifactorial descomposicién de la suma de fos cuadrados en el andlisis de la varianza de un factor diserio de bloques aleatorizados interaccién. media de los cuadrados suma de los cuadrados tabla del andlisis de la varianza bifactorial tabla del andlisis de la varianza de un factor Ejercicios y aplicaciones del capitulo 15.52. Distinga detenidamente entre el andlisis de la varianza de un factor y el bifactorial. Ponga ejemplos distintos a los que se analizan en el libro y formule problemas em- presariales para los que podrfa ser adecuado cada uno. Explique detenidamente qué se entiende por efecto de interaccién en el andlisis de la varianza bifactorial con ifs de una observacitin por celda, Ponga un ejemplo de este efecto en problemas relacionados con el mundo de Ta empresa 1553. 15.84, Considere un estudio que pretende evaluar la facitidad de lectura de los mensajes de los informes financieros.. La eficacia del mensaje eserito se eval utilizando un procedimiento tradicional. Se entregan informes finan- cieros a muestras aleatorias independientes de personas de tres grupos: auditores, analistas financieros y res- ponsables de la concesiin de préstamas dé bancos co- 'merciales en periodo de formacién y se anotan las pun- tuaciones de los miembros de las muestras. La hipotesis nnula que se pretende contrastar es que las medias po- bilacionales de las puntuaciones de los tres grupos son idénticas. Contraste esta hipstesis, dada la informaci6n de la tabla adjunta 1558. Fuente de Sumade los Grados de variaci¢n ccuadrados libertad TEnire grupos 3.165 2 Dentro de grupos 120.802 1.005 Total 125.967 1.007 En un experimento realizado para evaluar las ayudas que reciben los alumnos de doctorado para que tengan éxito en sus entrevistas con los profesores que los su pervisan, se asignaron aleatoriamente entrevistadores uno de los tres tipos de entrevistas siguientes: con in- formacién sobre entrevistas anteriores, planteando ob- jetivos para la entrevista y grupo de control. En el caso del primer tipo de entrevista, Ios entrevistadores podfan cexaminar y discuti las reacciones de los estudiantes de doctorado a entrevistas anteriores. En el caso del se- ‘gundo tipo, se les animaba a fijar objetivos para la ‘uiente entrevista. En el caso del grupo de control, las fentrevistas se realizaron como siempre, sin conocer las centrevistas anteriores y sin fijar objetivos. Una vez ter- ‘minadas las entrevistas, se valoraron los niveles de s2- 728 158.56, 18.57. 15.58, Estadistica para administracion y economia tisfaccién de los estudiantes con las entrevistas. El ni- vel medio de satisfaceién de las 45 personas del grupo Aue realiz6 el primer tipo de entrevista era de 13,98. El de las 49 personas del grupo que realiz6 el segundo ti- po de entrevista era de 15,12, mientras que el de los 41 miembros del grupo de control era de 13,07. El cocien- te F calculado a partir de los datos era 4,12. a. Elabore la tabla completa del anslisis de la varianca, b. Contraste la hipotesis nula de que las medias pobla- cionales de los niveles de satisfaccion de los tres ti- ‘pos de entrevistas son iguales. En un estudio se clasifies a 134 abogados en cuatro grupos basdndose en la observacién y en una entrevis- la, Se considers que los 62 abogados del grupo A te- nfan un elevado nivel de estimulo y de apoyo y un ni vel medio de espiritu civico. Los 52 abogados del ‘grupo B tenfan un bajo nivel de estimulo, un nivel me- ddio de apoyo y un elevado nivel de espititu efvico. El grupo C contenia siete abogados que tenfan un nivel ‘medio de estimulo, un bajo nivel de apoyo y un bajo ni: vel de espiritu civico. Los 13 abogados del grupo D te- fan un bajo nivel en los tes aspectos. Se compararon Jos sueldos de estos cuatro grupos. Las medias muestra- les eran 7,87 en el caso del grupo A, 7.47 en el del grupo B, 5.14 en el del grupo C y 3,69 en el del grupo D. El cociente F calculado a partir de estos datos era 25,60, a, Elabore la tabla completa del andlisis de la varianya 1b. Contraste la hipstesis nula de que las medias pobla- jonales de los sueldos de los abogados de estos cuatro grupos eran iguales. En un estudio realizado para estimar los efectos del ‘consumo de tabaco en el riesgo para la salud, se clasii- ‘66 a los empleados en empleados fumadores, emplea dos que han dejado de fumar recientemente, empleados: ‘que dejaron de fumar hace tiempo y empleados que rhunca han fumado, Se tomaron muestras de 96, 34, 86 ¥y 206 miembros de estos grupos. Se observ que las ‘medias muestrales de las tasas mensuales medias de riesgo para la salud eran 2,15, 2.21, 1,47 y 1,69, res- pectivamente. El cociente F calculado a partir de estos datos era 2,56. 2, Elabore la tabla completa del andlisis de la varianza . Contraste fa hipdtesis nula de la igualdad de las me- dias poblacionales de las cuatro tasas de riesgo para la salud. En un pals, la publicidad sobre los precios del vino es sujeta a restricciones, Sin embargo, durante un tiempo, se suprimieron estas restricciones. Se recogieron datos sobre las ventas totales de vino en tes periods: duran te el periodo de restricciones de 1a publicidad, durante el periodo en el que se eliminaron las restricciones y ‘durante el periodo en que volvieron a establecerse. Lat tabla adjunta muestra las sumas de los cuadrados y los ‘grads de libertad. Suponiendo que se satisfacen los re- 15.59, 18.60. 15.61. 15.62. ‘quisitos habituales del andlisis de la varianza en con- ‘reto, que las observaciones muestrales son indepen- dientes entre si— contraste la hipStesis nula de ta igualdad de las medias poblacionales de las ventas de {estos tres periodos de tiempo, Fuente de ‘Suma delos Grados de variacion cuadrados libertad Enire grupos 11438,3028 2 Dentro de grupos 109.200,0000 1s Total 120.638,3028 0 Se toman muestras aleatorias independientes de los precios de venta de las viviendas de cuatro distritos. La tabla adjunta muestra los precios de venta (en miles de délares). Contraste ka hipdtesis nula de que las medias poblacionales de los precios de venta de los cuatro dis- Uritos son iguales. Distrito A Distrito B_ Distrito Distrito D B 5 7 6 63 39 86 7 89 sa 16 ry 15 70 78 67 0 80 1 Cc) Basindose en los datos del Ejercicio 15.59, utilice el contraste de Kruskal-Wallis para contrastar la hipdte- sis nula de que las medias poblacionales de los precios de venta de las viviendas de los cuatro distitos son iguales. Un estudio pretendia valorar los niveles de satistaccion ‘con los horarios de clases en una escala de | (muy insa- tisfecho) a 7 (muy satisfecho) de los profesores intert- nos, asociados y ayudantes. EI nivel medio de satisfac- cci6n de una muestra de 25 interinos era de 6,60; el de tuna muestra de 24 asociados era de 5,37; el de una muestra de 20 ayudantes era de 5,20. El cociente F cal culado a panir de estos datos era 6,62. ‘a, Elabore la tabla completa de! andlisis de la varianza, . Contraste la hipstesis nula de la igualdad de las me dias poblacionales de los niveles de satisfaccién de los tres grupos. CConsidere el andlisis de ta varianza de un factor. a, Demuestre que la suma de los cuadrados dentro de Jos grupos puede expresarse de la forma siguiente: sep= ¥ Fj b, Demuesire que ta sums de los cuadrados ent fos ‘grupos puede expresarse de la forma siguiente: SCG = ¥ na? « Demuestre que la suma toa de fos cuadrados pueds Considere ef andlisis de la varianza bifuctorial con una ‘observacisn por celda ‘a, Demuestre que Ia suma de los cuadrados entre los grupos puede expresarse de la forma siguiente: sco="S b, Demuestre que Ia suma de los cuadrados entre Jos Dloques puede expresarse de la forma siguiente: scp-K a 3 ni €. Demuestre que Ia suma total de los cuadrados puede cexpresarse de la forma siguient ste= § $g-aP aun 4, Demuestre que la suma de los cuadrados de los erro- res puede expresarse de la forma siguiente: sce = 5 Saud ie ES =a . Segtin una encuesta, os aficionados al fitbo! pueden dividirse en tres categorfas de gasto cuando van a un partido: alto, medio y bajo. Estos valores proceden de tuna muestra de 235 personas. La tabla adjunta muestra, Jas sumas de los cuadrados de estos niveles de gasto. Complete la tabla del andlisis de Ia varianza y contraste la hipotesis mula de que no existe ningun diferencia de ‘gasto entre los grupos de aficionados. Fuente de variacién ‘Suma de los euadrados Dentro de los grupos de aficionados 2.456 Entre los grupos de aficionados 1.345 Total 3.801 Se pide a tes agencias inmobilarias que valoren cinco Viviendas de un barrio. La tabla muestra los resultados en miles de dares. Elabore una tabla del andlisis de la vvarianza y contaste la hipétesis muta de que las medias poblacionales de las valoraciones de las tres agencias son iguales, Andlisis de la varianza 728 “Agencia Viviera A O&O T 210/218: 286 192 190198 183187185 270233237 242240237 3. Los estudiantes se clasifican en funcidn de tres grupos de renta de sus padres y de tres notas posibles en el examen de acceso a Ja universidad. Se elige aleator ‘mente un estudiante de cada una de las nueve combina- cones posibles y se anotan las calificaciones medias ‘obtenidas por los miembros de Ia muestra al final del segundo aflo. La tabla adjunta muestra los resultados. Grupo de renta Nota de acceso alauniversidad Alta Muy alta 37 Ala 34 Moderad: 29 ‘a, Elabore la tabla del andlisis de la varianza. >. Contraste la hipstesis nula de que las medias pobla- cionales de las cafificaciones medias de los estu- dlantes de los tres grupos de renta son iguales. . Contraste la hipstesis nula de que las medias pobla- cionales de las calificaciones medias de los tes gru- pos de notas de acceso a la universidad son iguales. 1. En el modelo del andlisis de la varianza bifactorial con tuna observacidn por celda, expresamos la observacién del i-ésimo grupo y del j-€simo bloque de la forma i uiente: X= wt G+ Bit ey ‘Vuelva al Ejercicio 15.65 y considere ta observacién sobre la agencia B y Ia vivienda 1 (x3, = 218), Estime 4. b. Estime e interprete G €. Estime e interprete B, 4. Estime #5, Vuelva al Ejercicio 15.66 y considere Ia observacién sobre el grupo de renta moderada y una nota alta en el ‘examen de acceso a la universidad (x3) = 3,5). Bstime p. Db, Estime e interprete Gs. ‘e. Estime ¢ interprete B;. 4. Estime e, Considere el anslisis de la varianza bifactorial con m ‘observaciones por celda, 15.71. En el estudio del Ejere 790 — Estadistica para administracion y economia f&, Demuestre que la suma de los cuadrados entre los grupos puede expresarse de la forma siguiente: Demuestre que la suma de los cuadrados entre los bloques puede expresarse de la forma siguiente: ‘¢. Demuestre que la suma de los cuadrados de los erro res puede expresarse de la forma siguiente: my ¥ i. SCE iia Demuestre que la suma de los cuadrados de las. interacciones puede expresarse de la forma si guiente: 15.70. Unos agentes de compra reciben informacién sobre un sistema de telefonta mévil y se les pide que valoren su calidad. La informacion que reciben es idéntica, salvo ppor dos factores: el precio y el pats de origen, En el ‘0 del precio, hay tres posibilidades: 150 $, 80 $ y nin: zgiin precio. En el caso del pais de origen, también hay tres posibilidades: Estados Unidos, Taiwén y ningiin pals. Agut se muestra parte de la tabla de! andlisis de la varianza de las valoraciones de la calidad realizadas por los agentes de compra. Complete fa tabla del andl sis de la varianza y realice un andlisis completo de es tos datos. ‘Suma de los ccuadrados Entre 10s precios 0.178 Entre los parses 42365 Interaccién 1,262 Exror 93.330 cio 15.70, también se da infor- ‘macidn a estudiantes de un méster de administraciGn de 18.72. empresas. Agui se muestra parte de la tabla del anlisis de la varianza de las valoraciones de la calidad realiza- das por los estudiantes. Complete ta tabla del anslisis de la varianza y realice un andlisis completo de estos datos. Fuente de Sumadelos Grados de variaci6n ccuadrados libertad Entre los precios 0.082 Enire los pases W319 Interaccisn 35 Error 70.414 45 Una vez realizado el estudio del Ejercicio 15.66, 1 in- vestigador decide tomar una segunda muestra aleatoria independiente de un estudiante de cada una de las nue- ve categorias renta-nota del examen de acceso & la ui- versidad. La tabla adjunta muestra las calificaciones medias obtenidas, (Grupo de renta Nota del examen de acceso ala universidad Alla Moderada May alta 39 37 Ala 32 36 Moderada 27 30 fa, Elabore la tabla del andlisis de ta varianza, bb. Contraste la hipétesis nula de que las medias pobla cionales de las calificaciones medias de los tres gru- pos de renta son iguales. ‘¢- Contraste la hipdtesis nula de que las medias pobla ionales de las calificaciones medias de los tres gr pos de notas del examen de acceso a la universidad son iguales. Contraste Ia hipstesis nula de que no existe ninguna interaccin entre el grupo de renta y la nota del exa- 15.73, Se realiza un experimento para contrastar los efectos {que producen en los rendimientos cinco variedades de maiz y cinco tipos de fertilizante. Se utilizan para cada combinacién variedad-fertilizante seis grificos y se anotan los rendimientos. La tabla adjunta muestra los resultados: 4. Contraste la hip6tesis nula de que las medias pobla cconales de los rendimientos de las cinco variedades ‘de mafz son iguales. >. Contraste la hipsitesis nula de que las medias pobla- cionales de los rendimientos de las cinco marcas le fenilizante son iguales. ‘e. Contraste la hipstesis nula de que no existe ninguna interaccion entre la variedad y el ferilizante Andlisis dela varianza 731 cas Variedad de maiz fertilizante ic 1 78-77-74 67 79 83 73 65 85 78 79 80 82 87 88 79 83 88 88 77 82 70 75 79 84 87 80 80 80 §2 83 74 81 EIR 16 73 75 62 1 74 77 63 g SBSERSE 87 80 83 80 89 93 87 88 86 nn 8488 88 82 77 69 78 90 85 85 80 74 76 83 88 79 75 80 92 88 82 78 82 84 80 89 94 85 86 83°72 77 86 90 82 89 SSRe 87 83 83 Baa ReSsseaes 88S Apéndice: calculos matematicos 1, Suma total de los cuadrados uP stc=¥ ¥ “EE wate 5 E yar + 5 Sq-oe2y Y wy - a eo x : = Y wy ah + Y mG -¥ | aia STC = SCD + SCG Nota: F (xy) =0 782 Estadistica para administracion y economia 2. Media de los cuadrados dentro de los grupos (MCD) Para cada subgrupo i: Sumando los valores de los k subgrupos: Andlisis de la varianza 783 3. Media de los cuadrados entre los grupos (MCG) Entonces 784 Estadistica para administracin y economia 4. Cociente entre las medias de los cuadrados Si Holy = MK es verdadera, entonces MCG —con (K — 1) grados de libertad— es un estimador de 0? y (K— MCG tha cs ‘Ademas, MCD con (n ~ K) grados de libertad ¢s un estimador de o* y, por tanto, n= K)MCD Por tanto, Bibliografia 1, Kim, J. S., 1980, Relationships of Personality of Perceptual and Behavioral Responses in Stimulating and Nonstimulating Tasks, Academy of Management Jounal, 23. pigs. 307-319. 2. Shuptrine, F. K. y D. D. MeVicker, 1981, Readability Levels of Magazine Advertisements, Journal of Advertising Research, 21 (5), pags. 45-50.

Вам также может понравиться