Вы находитесь на странице: 1из 16

Captulo 5

Comparacin de dos medias


El anlisis estadstico que se aborda en este captulo tiene como objetivo la
comparacin de dos poblaciones, ya sean dos mquinas, dos mtodos de trabajo,
dos catalizadores, dos proveedores o dos tipos de materia prima distintos. Dicha
comparacin se realiza a partir de datos muestrales.
Se trata de determinar si la diferencia que presentan las medias de las dos
muestras es indicativa de una diferencia en las medias poblacionales o si, por
el contrario, puede ser atribuida al azar.
Tal como veremos a continuacin, el anlisis empieza con un claro planteamien-
to del problema y sigue con el adecuado diseo de la recogida de datos. A
continuacin se realiza un anlisis exploratorio para detectar posibles valores
anmalos, constatar que no existe evidencia de incumplimiento de las hipte-
sis del mtodo, y tambin para obtener unas primeras conclusiones en torno al
objetivo del estudio.
Finalmente, se realiza el test estadstico (contraste de hiptesis) y se interpreta
el resultado obtenido.
55
56 CAPTULO 5. COMPARACIN DE DOS MEDIAS
5.1. Caso 1: Comparacin de dos productos en un
proceso de curtido de piel
5.1.1. Planteamiento del problema. Recogida de datos
Una industria dedicada al curtido de pieles utiliza normalmente una cierta so-
lucin ^, en la que se sumerge el cuero durante 4 horas en la fase nal de su
proceso de curtido. Aunque el producto ^ produce unos resultados satisfactorios,
se presenta la oportunidad de sustituirlo por otro producto B, considerablemente
ms barato. Se sospecha, sin embargo, que la nueva solucin puede afectar a
las caractersticas del cuero reduciendo su resistencia a la traccin.
Los responsables del proceso deciden cambiar, slo en el caso de constatar
experimentalmente que la nueva solucin no reduce la resistencia a la trac-
cin. Para ello, realizan unos experimentos con el n de analizar los resultados
obtenidos y tomar una decisin sobre este tema.
Para la realizacin del experimento se toman 20 porciones de cuero, todos
ellos de calidad y caractersticas lo ms parecidas posible, y aleatoriamente se
asignan 10 para ser tratados con el producto ^ y otras 10 con el B.
Para realizar la prueba se dispone de 20 recipientes, todos ellos idnticos, a 10
de los cuales se le asigna la solucin ^ y a otros 10 la B. Los trozos de cuero
se sumergen simultneamente y todos ellos se retiran al cabo de las 4 horas.
Posteriormente se dejan reposar durante 2 das (todos ellos en iguales condi-
ciones) y se procede a medir su resistencia a la traccin, aplicando una metodo-
loga perfectamente denida. Para evitar la inuencia de posibles derivas en el
proceso de medicin, ste se realiza tambin de manera aleatoria. Los valores
obtenidos (en unidades de escala del aparato de medida) son los que guran
en la tabla 5.1.
5.1.2. Anlisis exploratorio. Formalizacin del problema
Siempre conviene representar los datos grcamente. En la gura 5.1 se pre-
sentan los histogramas correspondientes a ambos conjuntos de datos. No se
observan valores anmalos, y ya se adivina que la diferencia de medias va a
5.1. CASO 1 57
c.ino co soi.cio / c.ino co soi.cio B
243
(2)
244
(1)
256
(3)
215
(4)
267
(5)
251
(6)
227
(9)
228
(7)
248
(11)
252
(8)
238
(12)
235
(10)
259
(14)
222
(13)
264
(16)
235
(15)
258
(17)
233
(19)
254
(18)
247
(20)
:
^
= 10 :
B
= 10
j
^
= 2514 j
B
= 2362

^
= 1242
B
= 1237
Cuadro 5.1: Datos obtenidos con los procesos de curtido.
resultar signicativa.
Para constatar que el orden en que se han realizado las mediciones no ha
afectado a la respuesta, pueden utilizarse diagramas en los que se coloque el
orden de obtencin en el eje horizontal y en el vertical el valor obtenido. La
gura 5.2 presenta dicho diagrama para cada una de las soluciones, sin que se
observe nada anormal.
Supongamos, como hiptesis de partida, que las resistencias a la traccin son
iguales, independientemente de la solucin utilizada. A esta hiptesis se la
denomina hiptesis nula (H
0
) y supondremos, asimismo, que en caso de no
cumplirse dicha hiptesis, las unidades curtidas con la solucin ^ tendran una
resistencia mayor que las que hayan utilizado la solucin B. Esta hiptesis, que
es la que consideramos que se cumple en el caso de no cumplirse la hiptesis
nula, se denomina hiptesis alternativa (H
1
). Podemos denotar el planteamiento
realizado de la forma:
H
0
: ,
^
= ,
B
H
1
: ,
^
,
B
58 CAPTULO 5. COMPARACIN DE DOS MEDIAS
Figura 5.1: Histogramas correspondientes a los datos obtenidos en las pruebas
de curtido.
Figura 5.2: Diagramas en secuencia temporal de los resultados obtenidos.
5.1.3. Resolucin
Es frecuente realizar la hiptesis de que las poblaciones de las cuales provienen
las muestras son normales, por tanto, podemos escribir:
j
^
(,
^
,
^
)
5.1. CASO 1 59
Y anlogamente para los valores obtenidos con la solucin B:
j
B
(,
B
,
B
)
Por tanto, las medias de los valores obtenidos se distribuirn de la forma:
j
^

,
^
,

^

:
^

j
B

,
B
,

B

:
B

y de acuerdo con lo visto en el captulo anterior:


j
^
j
B

,
^
,
B
,

2
^
:
^
+

2
B
:
B

Por tanto:
( j
^
j
B
) (,
^
,
B
)

2
^
:
^
+

2
B
:
B
(0, 1)
Pero no conocemos
2
^
ni
2
B
, sino que los estimamos a partir de sus respectivas
varianzas muestrales:
2
^
= 154,
2
B
= 153. Estos valores son tan parecidos que,
evidentemente, podremos suponer que las varianzas poblacionales son iguales.
En el caso de que las varianzas muestrales presentaran mayor diferencia, antes
de realizar esta suposicin se debera realizar el test de igualdad de varianzas,
utilizando la distribucin |-Snedecor.
Ejemplo 5.1a Se toman 2 muestras aleatorias simples de tamao : = 10 de sendas
poblaciones normales y se obtiene
2
^
= 154 y
2
B
= 218. Puede consi-
derarse que las varianzas poblacionales son iguales?
Hacemos:
| =

2
B

2
^
=
218
154
= 142
Comparando el valor obtenido con una distribucin | de Snedecor con 9
y 9 grados de libertad, se obtiene que el rea de la cola es mayor de 0.25
y, por tanto, nada se opone a suponer que
2
^
=
2
B
.
Ejemplo 5.1b Igual planteamiento que en el ejemplo anterior, pero ahora consideramos
que
2
^
= 154 y
2
B
= 163. En este caso se obtiene | = 1058 y el rea
de la cola resulta ser menor de 0.001, luego no podr trabajarse con la
hiptesis de igualdad de varianzas poblacionales.
60 CAPTULO 5. COMPARACIN DE DOS MEDIAS
En nuestro caso, calcularemos un estimador de la varianza poblacional nica,
que ser la media de las varianzas muestrales ponderada segn los grados de
libertad de cada muestra (si las muestras son del mismo tamao como en nuestro
caso, esto se convierte en una simple media aritmtica).
Con dicho estimador nico podemos escribir:
( j
^
j
B
) (,
^
,
B
)

1
:
^
+
1
:
B
i con :
^
+ :
B
2 grados de libertad.
En nuestro caso tenemos:
i
1
=
2514 2362
124

1
10
+
1
10
= 274
Si se cumpliera la hiptesis nula (recordemos, H
0
: ,
^
= ,
B
), el valor i
1
obtenido
pertenecera a una distribucin i-Student con 18 grados de libertad. Puede
considerarse que esto es as?
Una forma de determinar hasta qu punto es normal un valor en una distribucin
es a travs del rea de la cola que dene. Consultando las tablas (o con ayuda
de Matlab) observamos que P(i 274) = 0007, luego ste es un valor muy
poco probable en su distribucin de referencia.
Si las medias de ^ y B fueran iguales, se daran diferencias como la observada
o mayores, realizando una prueba como la que aqu se ha hecho, el 0.7 % de
las veces. Luego, en este caso, lo ms razonable ser considerar que las me-
dias poblacionales son distintas y diremos que la diferencia entre las medias
muestrales es estadsticamente signicativa.
5.2. Generalizacin del caso de la comparacin de
dos productos para el curtido: comparacin de
medias en diseos totalmente aleatorizados
La recogida de datos debe hacerse de forma que el nico factor que inuya de
forma distinta en ambas muestras sea aquel cuyo efecto se desea estudiar. Si
5.2. COMPARACIN DE MEDIAS EN DISEOS TOTALMENTE ALEATORIZADOS61
otros factores tambin afectaran de forma distinta, sera imposible distinguir si
las diferencias apreciadas (en el caso de que existieran) deberan ser atribuidas
al factor estudiado o a otros de los que accidentalmente hubieran podido inuir.
Debern distinguirse, por tanto, dos reglas bsicas al planicar la recogida de
datos:
Asegurarse de que todos los factores que puedan tener alguna inuencia
en la respuesta, inuyan exactamente igual en las dos muestras (excepto
aquel cuyo efecto se desea estudiar).
Aleatorizar todo lo que se pueda para protegerse de posibles sesgos in-
troducidos por factores no identicados.
As, en el ejemplo de la comparacin de soluciones ha sido necesario asegurarse
de que todos los factores que podan inuir en la respuesta (tipo de piel, tiempo
que est sumergida la solucin, tiempo y condiciones de secado, etc.) afectasen
exactamente igual a las unidades tratadas con ambas soluciones.
Una vez recogidos los datos es necesario constatar que nada se opone al cum-
plimiento de las hiptesis en las que se basa el mtodo a aplicar. stas son:
Normalidad de las 2 poblaciones. Una forma prctica de comprobarlo
sera realizando los histogramas de ambas muestras, pero en la prctica
difcilmente encontraremos evidencia de no normalidad de las poblaciones,
porque disponemos de muestras de tamaos pequeos.
En cualquier caso, sta es una hiptesis poco crtica, ya que lo que real-
mente se supone es que las medias se distribuyen segn una normal, lo
cual en general podr considerarse cierto por el teorema central del lmite.
Independencia de las poblaciones. Es una hiptesis que suponemos al
decir que
V( j
^
j
B
) =

2
^
:
^
+

2
B
:
B
El origen de los datos pone de maniesto si las poblaciones pueden
considerarse independientes o no.
Aleatoriedad de las muestras. sta es una hiptesis absolutamente crtica.
El objetivo es extraer conclusiones sobre las poblaciones a partir del
62 CAPTULO 5. COMPARACIN DE DOS MEDIAS
anlisis de las muestras y, por lo tanto, stas debern ser representativas.
La aleatoriedad garantiza la representatividad. La obtencin de muestras
verdaderamente aleatorias debe ser el objetivo del diseo de la recogida
de datos.
Igualdad de varianzas poblacionales. Si se trabaja con esta hiptesis es
necesario comprobar que nada se opone a su cumplimiento. Para ello se
puede aplicar el test de igualdad de varianzas tal como se ha presentado
anteriormente.
Un adecuado anlisis exploratorio de los datos tambin ayuda a constatar el
cumplimiento de las hiptesis anteriores, adems de identicar posibles valores
anmalos o extraer unas primeras conclusiones, tal como se ha visto en el ejemplo
anterior.
A continuacin, los clculos a desarrollar son los siguientes:
1. Calcular el estimador de la desviacin tpica poblacional nica (media de
las varianzas muestrales ponderada segn los grados de libertad de cada
muestra).
=

(:
^
1)
2
^
+ (:
B
1)
2
B
:
^
+ :
B
2
2. Calcular el valor de i
0
, el cual pertenecer a una distribucin i-Student
con :
^
+:
B
2 grados de libertad, si las medias poblacionales son iguales.
i
0
=
j
^
j
B

1
:
^
+
1
:
B
3. Comparar el valor de i
0
con su distribucin de referencia. Si la hiptesis
alternativa es del tipo H
1
: ,
^
,
B
, como en el caso que se ha planteado,
se determina la probabilidad que se presente un valor como el obtenido
o mayor, y a esta probabilidad se le denomina j-valor.
El j-valor obtenido es una informacin que ayuda a tomar la decisin ms
adecuada. En general, un j-valor pequeo aconseja rechazar la hiptesis de
igualdad de medias, aunque para tomar la decisin habr que considerar tambin
otro tipo de informacin: costes, riesgos que se corren en el caso de equivocarse,
etc.
5.3. CASO 2 63
5.3. Caso 2: comparacin de dos tratamientos su-
perciales para lentes
5.3.1. Planteamiento. Recogida de los datos
Cierta industria fabricante de lentes para gafas desea comparar dos tipos de
recubrimiento antirreectante. Los dos tipos tienen idntico aspecto y presta-
ciones, pero antes de decidirse por uno u otro desean comprobar si el tipo de
recubrimiento inuye en el deterioro que sufre la lente.
En un principio, piensan seleccionar al azar 20 personas que utilicen gafas y
asignar aleatoriamente gafas sometidas al tratamiento ^ a 10 de ellas y gafas
con el tratamiento B a las otras 10. Al cabo de seis meses se realizara un control
y, tras tomar medidas con el instrumento adecuado, se analizara la existencia
o no de diferencias estadsticamente signicativas.
Pero el mtodo planteado tiene un inconveniente. En el desgaste que sufre
la lente no slo inuye el recubrimiento supercial, sino tambin el trato que
recibe por parte del usuario. Si la recogida de los datos se lleva a cabo de la
forma antes planteada, se corre el riesgo de que, si algunas personas, por sus
hbitos o profesin, deteriorasen las lentes ms (o menos) de lo normal y no se
repartiesen equitativamente entre los tratamientos, podramos llegar a atribuir
a algn tratamiento un efecto que no le correspondiera, ya que en realidad lo
provocaran las personas.
La mejor forma de eliminar el efecto de las personas en el desgaste de las
lentes ser construyendo las gafas con una lente de cada tipo. Si alguien las
desgasta mucho lo har con ambos tratamientos, igual que si las desgasta poco.
Naturalmente, el mtodo de anlisis de los datos deber tener en cuenta la
forma en que se han recogido.
Supongamos que la prueba se ha realizado de esta forma (con 10 individuos) y
que al cabo de 6 meses se mide el desgaste y se obtienen los valores que se
indican en la tabla 5.2 (en unidades codicadas).
64 CAPTULO 5. COMPARACIN DE DOS MEDIAS
inivin.o / B B/
1 6.7 (I) 6.9 (D) 0.2
2 5.0 (I) 5.8 (D) 0.8
3 3.6 (D) 4.1 (I) 0.5
4 6.2 (I) 7.0 (D) 0.8
5 5.9 (D) 7.0 (I) 1.1
6 4.0 (D) 4.6 (I) 0.6
7 5.2 (D) 5.5 (I) 0.3
8 4.5 (I) 5.0 (D) 0.5
9 4.4 (D) 4.3 (I) -0.1
10 4.1(I) 4.8 (D) 0.7
Media 4.96 5.50 0.55
Cuadro 5.2: Resultados del estudio realizado para comparar el desgaste de dos
tipos de lentes. La letra entre parntesis indica la posicin (izquierda o derecha)
a que se ha asignado aleatoriamente cada lente.
5.3.2. Anlisis exploratario
Cuando los datos se han recogido de esta forma, una representacin grca muy
adecuada es la que se indica en la gura 5.3. Adems, por supuesto, se pueden
realizar los grcos que en cada caso se considere oportuno.
5.3.3. Resolucin
El anlisis de los datos no se realiza como en el caso anterior (ahora ya no
se cumplira la hiptesis de poblaciones independientes), sino que se analizan
las diferencias que se observan dentro de cada individuo entre un tratamiento
y otro.
Seguiremos suponiendo que los resultados de ambos tratamientos pertenecen a
sendas poblaciones normales, es decir:
j
^
(,
^
,
^
)
j
B
(,
B
,
B
)
y por tanto:
j
B^
(,
B
,
^
,
J
)
5.3. CASO 2 65
Figura 5.3: Representacin grca de los resultados obtenidos en el estudio de
comparacin del desgaste de dos tipos de lentes.
donde
J
es la desviacin tpica de las diferencias. Si las medias poblacionales
son iguales, j
B^
se distribuir segn una normal de media cero y una desvia-
cin tpica que puede estimarse mediante la desviacin tpica de las diferencias.

J
=

i
(J
i

J)
2
: 1
Obtenindose con nuestros datos,
J
= 0344, y la media de las diferencias se
distribuir de la forma:

J

0,

J

En nuestro caso tenemos que



J = 054. Podemos considerar que pertenece a
la distribucin anterior? Si as fuera tendramos que:

:
(0, 1)
66 CAPTULO 5. COMPARACIN DE DOS MEDIAS
O, al trabajar con un valor estimado de
J
:

:
i
:1
En nuestro caso tenemos que

J

:
= 497 y ste es un valor muy poco probable
en su distribucin de referencia (con un j-valor de 0.0008).
5.4. Generalizacin del caso de la comparacin de
dos tratamientos superciales de lentes: compa-
racin de medias en diseos en bloques alea-
torizados.
En muchos casos existe algn factor que inuye sobre la respuesta y no puede
asegurarse que afecte exactamente igual a los dos tratamientos. En el caso
anterior se trataba del efecto del individuo en el desgaste de sus lentes y
las diferencias se calculaban para cada individuo, es decir, dentro de bloques
homogneos.
En muchas otras circunstancias conviene disear la recogida de datos de esta
forma: tiempo, mquina o materia prima, pueden afectar a la respuesta y requerir
que se formen bloques para analizar los datos dentro de los mismos. Dentro de
cada bloque, el orden de recogida de los datos se aleatoriza, por eso se llaman
diseos en bloques aleatorizados.
Ejemplo 5.1 Se desea comparar el valor obtenido con un aparato electrnico para la
medida de la tensin arterial con un instrumento clsico de columna de
mercurio. Cmo deberan tomarse los datos?
Naturalmente, no sera un buen procedimiento elegir los grupos de perso-
nas, tomar la tensin con el aparato electrnico a un grupo, con el clsico
al otro y comparar. En la respuesta, adems del aparato inuye la perso-
na y, por tanto, lo correcto sera tomar la tensin a cada uno con los dos
instrumentos y analizar las diferencias por persona.
Ejemplo 5.2 Se desea comparar la cantidad de producto fabricado utilizando dos pro-
cedimientos de montaje distintos. Una unidad de medida que se considera
5.4. COMPARACIN DE MEDIAS EN DISEOS EN BLOQUES ALEATORIZADOS67
correcta es la produccin obtenida durante 4 horas. Se sabe que no hay
variaciones de productividad a lo largo del da, pero s puede haberlas de
un da para otro. Cmo tomar los datos?
Podran tomarse dos datos cada da, uno con cada procedimiento, corres-
pondientes a la produccin obtenida durante 4 horas seguidas (aleato-
rizando cada da qu procedimiento se hace primero). De esta forma, la
diferencia en produccin de un da para otro no afectara a las conclusio-
nes obtenidas.
Cuando los datos se han recogido de esta forma y considerando que el efecto
bloque afecta por igual a los dos tratamientos (efecto aditivo), su mtodo de
anlisis requiere el cumplimiento de las siguientes hiptesis:
Normalidad de las dos poblaciones. En realidad lo que se supone es la
normalidad de j
B
j
^
, aunque, como en el caso de los diseos totalmente
aleatorizados, sta es una hiptesis poco crtica, ya que siempre se podr
suponer que la diferencia media sigue una distribucin normal.
Independencia de las diferencias. O lo que es lo mismo, las diferencias
son una muestra aleatoria simple de la poblacin de diferencias. Si se ha
aleatorizado correctamente y la recogida de datos se ha llevado a cabo con
la meticulosidad requerida, en general se podr suponer el cumplimiento
de esta hiptesis.
El obligado anlisis exploratorio de los datos servir tambin para poner de
maniesto que no existen pruebas de incumplimiento de las hiptesis anteriores.
Adems del grco del tipo que se ha visto antes puede realizarse, por ejemplo,
un grco de las diferencias.
Una vez se tienen los datos, los clculos que se deben desarrollar son los
siguientes:
1. Calcular las diferencias dentro de cada bloque y tambin la media (

J) y
la desviacin tpica (
J
) de dichas diferencias.
2. Calcular el valor del estadstico de prueba.
i =

J

:
68 CAPTULO 5. COMPARACIN DE DOS MEDIAS
3. Comparar el valor del estadstico de prueba con su distribucin de refe-
rencia, que ser una i-Student con : 1 grados de libertad. Determinar
la probabilidad de que en dicha distribucin se presente un valor igual
que el obtenido o superior. Esta probabilidad ser el j-valor de la prueba.
Si el j-valor es bajo se rechazar la hiptesis de igualdad de medias y
diremos que la diferencia observada entre un tratamiento y otro es esta-
dsticamente signicativa.
5.5. Aleatorizacin y bloques: recapitulacin
En una prueba para la comparacin de dos tratamientos, puede considerarse
que en los datos obtenidos inuyen cuatro tipos de factores:
1. El factor cuyo efecto se desea estudiar.
2. Factores identicados que pueden inuir en la respuesta, pero que es
posible mantener constantes para los dos tratamientos.
3. Factores identicados que pueden inuir en la respuesta y que resulta
imposible mantener constantes para los dos tratamientos.
4. Otros factores, no identicados, que tambin pueden tener inuencia en
los resultados obtenidos.
Obviamente, el factor estudiado debe afectar a cada tratamiento.
Qu hacer con los factores identicados? No nos interesar que afecten de
forma distinta a cada tratamiento, por tanto, debern mantenerse exactamente
igual tanto en un tratamiento como en el otro.
Pero, y si no es posible mantenerlos constantes? En este caso ser necesario
hacer bloques, es decir, analizar las diferencias dentro de bloques homogneos
en los que estos factores afecten por igual.
En general, a medida que transcurre el tiempo, y cuanto mayor es el perodo
en el que se procede a la recogida de datos, mayor es la probabilidad de que
aparezcan variabilidades no deseadas. En estos casos, suele ser una buena idea
utilizar periodos de tiempo como bloques.
5.6. CONTRASTE DE HIPTESIS. FORMALIZACIN Y LIMITACIONES 69
Dentro de cada da (bloque) conviene aleatorizar para protegernos de la in-
uencia de posibles factores no identicados. Si stos existen, al aleatorizar,
se espera que su efecto se difumine entre los dos tratamientos y no altere las
conclusiones del anlisis.
La consigna de la recogida de datos podra ser Hacer bloques lo que se pueda
y aleatorizar el resto.
5.6. Contraste de hiptesis. Formalizacin y limita-
ciones
El procedimiento seguido en el anlisis de los datos para la comparacin de
medias puede resumirse en las siguientes etapas:
1. Formular las hiptesis nula (H
0
) y alternativa (H
1
).
2. A partir de los datos disponibles se calcula un valor relevante (estadstico
de prueba) mediante una determinada expresin.
3. Se compara el estadstico de prueba con su distribucin de referencia,
determinando la probabilidad (j-valor) de que un valor como el observado
(o mayor) sea debido al azar en el caso de que la hiptesis nula sea cierta.
4. Si el j-valor es pequeo se rechaza la hiptesis de igualdad de medias
y se dice que la diferencia obtenida es estadsticamente signicativa.
Este esquema de razonamiento, muy usado en estadstica, recibe el nombre
de contraste de hiptesis, ya que lo que hace es suponer que se cumple una
determinada hiptesis (H
0
) y contrastar si los datos de que se dispone son o no
coherentes con sta.
70 CAPTULO 5. COMPARACIN DE DOS MEDIAS
5.7. Un anlisis alternativo: intervalos de conanza
para la diferencia de medias
La comparacin de medias tambin se puede abordar aplicando el concepto de
intervalo de conanza. Un intervalo de conanza 1 para la media de la
poblacin se obtiene mediante una expresin del tipo:
j z
,2

:
Estimando
2
a partir de la varianza muestral, obtenemos:
j i
,2,

:
Si el cero est incluido en el intervalo de conanza 1 , cabe considerar que
ste no es un valor extrao para la diferencia de medias y, por tanto, no se
podr rechazar la hiptesis nula de igualdad de medias poblacionales con un
nivel de signicacin .