Вы находитесь на странице: 1из 36

Contraste de Hiptesis

2. CONTRASTE DE HIPTESIS

2.1. Introduccin
2.2. Contraste de una hiptesis estadstica
2.3. Test unilateral y bilateral
2.4. Test relacionados con una sola media (varianza conocida)
2.5. Relacin con la estimacin del intervalo de confianza
2.6. Test sobre una sola media (varianza desconocida)
2.7. Test sobre dos medias
2.7.1. Varianzas conocidas
2.7.2. Varianzas desconocidas
2.8. Pruebas relacionadas con varianzas
2.9. Test de Bondad de ajuste.
2.9.1 Aplicaciones
Prueba de Homogeneidad
Test de independencia

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 1


Contraste de Hiptesis
2. CONTRASTE DE HIPOTESIS

2.1. INTRODUCCIN

No siempre los problemas a los que se enfrenta el cientfico o el ingeniero, se refieren


slo a la estimacin de un parmetro de la poblacin, sino por el contrario, la formulacin de
un procedimiento de decisin basado en datos, que puede producir una conclusin acerca de
algn sistema cientfico. Se postula o conjetura algo acerca de un sistema. La conjetura se
puede exponer como una hiptesis estadstica. Los procedimientos que conducen a la
aceptacin o rechazo de hiptesis estadsticas, comprenden un rea muy importante de la
inferencia estadstica.

Una hiptesis estadstica es una afirmacin o conjetura acerca de una o ms


poblaciones. Es importante remarcar que las hiptesis son proposiciones sobre la poblacin en
estudio, nunca sobre la muestra.

Contrastar una hiptesis estadsticamente es tomar una decisin sobre si cierta


propiedad de una poblacin es compatible con lo observado en una muestra de dicha
poblacin.

La tcnica del contraste de hiptesis constituye una parte de la Inferencia Estadstica


que consiste en utilizar la informacin muestral para examinar la validez de afirmaciones
realizadas sobre una caracterstica poblacional.

Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a
no ser que se examine la poblacin entera. Como esto no es prctico, se elige una muestra
aleatoria de la poblacin que se estudia, y se utilizan los datos que contiene dicha muestra
para proporcionar evidencias que confirmen o no la hiptesis.

La evidencia de la muestra que es inconsistente con la hiptesis planteada, lleva al


rechazo de la misma; mientras que la evidencia que apoya a la hiptesis, conduce a su
aceptacin.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 2


Contraste de Hiptesis
Desde luego el diseo de un procedimiento de decisin, debe llevarse a cabo con la
idea de probabilidad de una conclusin equivocada. Es decir, la aceptacin de una
hiptesis implica tan slo que los datos de la muestra no proporcionan evidencia suficiente
para rechazarla. El rechazo de la hiptesis implica que la evidencia de la muestra la refuta.

Existen dos tipos de contrastes:

Contrastes paramtricos si la hiptesis concierne a parmetros poblacionales tales


como la media o la varianza.

Contrastes no paramtricos son los que afectan a cualidades de la distribucin, tales


como la bondad del ajuste, homogeneidad de poblaciones, independencia.

2.2. CONTRASTE DE UNA HIPTESIS ESTADSTICA

La estructura de la prueba de hiptesis (test de hiptesis) se formular utilizando el


trmino hiptesis nula.

Llamamos hiptesis nula, H0 , a la hiptesis que vamos a contrastar, H0 representa la


hiptesis que mantendremos mientras los datos no nos indiquen su falsedad.

El rechazo de Ho da como resultado la aceptacin de una hiptesis alternativa, que se


representa por H1.

Llamamos hiptesis alternativa, H1 , a la hiptesis que se aceptar si H0 se rechaza.

Una hiptesis nula referente a un parmetro de la poblacin, siempre ser establecida


en forma tal que especifique un valor exacto del parmetro; la hiptesis alternativa admite la
posibilidad de varios valores.

Las fases en un contraste de hiptesis son:

1) Definir la hiptesis a contrastar que llamaremos H0 en consecuencia H1.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 3


Contraste de Hiptesis
2) Definir una medida de discrepancia D que mida la diferencia entre los valores observados y
los esperados (de acuerdo con H0 ) estableciendo su distribucin.
3) Tomar una muestra y calcular D.
4) Concluir con una decisin: si la discrepancia D es muy grande, rechazaremos H0 ; en caso

contrario, aceptamos H0 .

Por tanto para realizar un contraste necesitamos una medida de discrepancia, y una ley
para juzgar cuando las discrepancias son demasiado grandes.

Al probar cualquier hiptesis estadstica, se presentan cuatro posibles situaciones que


determinan si la decisin es correcta o equivocada:

La hiptesis nula, es verdadera o falsa y se acepta o se rechaza. No se comete error


alguno si es verdadera y se acepta, o si es falsa y se rechaza. Sin embargo, se cometer error si
es verdadera y se rechaza o si es falsa y se acepta.

DECISIN
Se Acepta Se Rechaza
H 0 Es Verdadera Decisin correcta Error de tipo I
REALIDAD Decisin correcta
H 0 Es Falsa Error de tipo II

Decimos que se comete un error de tipo I cuando H0 es verdadera pero se rechaza, se

comete un error de tipo II cuando H0 es falsa pero se acepta.

Para definir qu valores de las discrepancias son grandes fijamos un valor que
denominaremos nivel de significacin. El valor es la probabilidad de cometer un error de

tipo I, y determina un valor dc de forma que: P(D > dc ) =

=P(error tipo I)=P(rechazar H 0 / H 0 es cierta)

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 4


Contraste de Hiptesis
La probabilidad de cometer error tipo II, representado por , es imposible calcularla a
no ser que tenga una hiptesis alternativa especfica:

=P(error tipo II)=P(aceptar H 0 / H 0 es falsa)

Al conjunto de reglas que lleva a aceptar o no una cierta hiptesis, es lo que se llama
"un test o contraste de hiptesis".

La potencia del contraste es la probabilidad de rechazar H0 , dada una alternativa


especfica verdadera:

1 = Potencia=P(rechazar H 0 / H 0 es falsa)

Un test muy potente es altamente capaz de detectar la falsedad de los datos.


Uno poco potente no detecta la falsedad de los datos.

En general, a todo nmero que, obtenido a partir de las observaciones de una muestra,
sirve para decidirse por H0 o H1 , se llama estadstico de contraste.

Pero para realizar un test de hiptesis, el investigador no slo debe fijar H0 y H1 , y el

estadstico de contraste, sino que tambin habr de decidir de antemano el valor del error
que est dispuesto a aceptar.

La figura siguiente muestra grficamente este mtodo. Si la discrepancia observada D


cae dentro de la regin de rechazo (probabilidad de rechazar y ser verdadera), rechazamos la
hiptesis H0, en caso contrario la aceptaremos.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 5


Contraste de Hiptesis
Definimos la regin de rechazo o regin crtica por D > dc es el conjunto de valores
del estadstico de contraste que
lleva a la decisin de rechazar la
hiptesis nula H0 y la regin de
aceptacin de H0 ser D dc

Consideraciones acerca de
.
1) Aceptar o rechazar la hiptesis
H0 puede depender del valor ,
Aceptacin <
dc >
Rechazo

siendo posible rechazar H0 con

= 0.05 y aceptar H0 con = 0.04

2) Dar slo el resultado del test no indica el grado de discrepancia. Se acostumbra a utilizar
niveles de significacin del 0.05 0.01.

Si, por ejemplo se elige un nivel de significacin del 0.05 entonces hay
aproximadamente 5 ocasiones de cada 100 en que se rechazara la hiptesis cuando debe ser
aceptada.

El nivel de significacin () se fija a priori independientemente del estadstico.

Un procedimiento para resolver estas consideraciones es utilizar el nivel crtico p de


un test, en vez del nivel de significacin ().

Se define el nivel crtico o p valor como el mnimo nivel de significacin para el que,
con los datos de una muestra concreta, se tendra que rechazar H0 .

=p P(D D n ) .

Es decir, la probabilidad de obtener una discrepancia mayor o igual que la observada


en la muestra. De esta forma, el valor de p no se fija a priori, sino que se determina en funcin
de la muestra.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 6


Contraste de Hiptesis

Como se evidencia en la figura siguiente, cuanto menor sea el valor crtico, menor es
la probabilidad de existir discrepancia como la observada, y menor es la certidumbre de H0.

Esto es; cuanto ms cercano a cero sea su valor con mayor confianza se rechazar H0. Puesto

que,=p P(D D n ) y Dn un valor fijo, si p es grande Dn es un valor pequeo, por tanto,

para un valor fijo de < p ser Dn < dc y aceptamos la hiptesis H0,

En general, cuanto ms prximo a 1 sea p con mayor evidencia se habr de aceptar


H0 .
A ttulo orientativo,
Si p>0.05 no existe suficiente evidencia para rechazar H0.
Si 0.01<p<0.05 existe incertidumbre entre rechazar o no rechazar H0.
Si p<0.01 en general deber ser rechazada la hiptesis H0,

Si se ha fijado de antemano un nivel de significacin , se acepta H0, si p>, y se


rechaza H0 si p<

El conjunto de valores posibles del estadstico de contraste, se divide en dos partes.


Una de ella conduce a concluir H0, y se llama regin de aceptacin; y la otra, lleva a
concluir H1, y se llama regin de rechazo o regin crtica (RC).

Al error de la primera RC que rechaza H0, se le llama nivel crtico nivel mnimo de
significacin.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 7


Contraste de Hiptesis
Los valores fuera de la regin de rechazo son los valores de la regin de aceptacin
R(H0). Estas regiones de aceptacin coinciden con los intervalos de confianza para los
parmetros sobre los que se plantea el contraste con los niveles de confianza de 1-
complemento de los de significacin .

2.3. TEST UNILATERAL Y BILATERAL

Un test de cualquier hiptesis estadstica, donde la alternativa es unilateral, tal como:


Ho : = o H 0 : = 0
bien recibe el nombre de test de una cola, ya que la regin crtica
H1: > o H1 : < 0
cae en la cola derecha de la distribucin del estadstico de prueba, o en la cola izquierda,
respectivamente.

Un test de cualquier hiptesis estadstica donde la alternativa es bilateral, tal como:


Ho : = o
recibe el nombre de test de dos colas, ya que la regin crtica se divide en dos
H1: o
partes, generalmente con iguales probabilidades en cada cola de la distribucin del estadstico
de prueba.

Para probar hiptesis en las cuales el estadstico de prueba es discreto, puede


escogerse la regin crtica arbitrariamente y luego determinar su tamao. Si es demasiado
grande, puede reducirse haciendo un ajuste en el valor crtico.

Un valor p es el nivel ms bajo (de significacin) en el cul el valor observado del


estadstico de prueba es significativo.

Los procedimientos para el test de hiptesis, pueden resumirse, supuesto que la


hiptesis es Ho : = o :

1. Establecer la hiptesis nula Ho de que = o .


2. Seleccionar una hiptesis alternativa apropiada H1 de una de las alternativas < o ,
> o o .
3. Elegir un nivel de significacin y el tamao de la muestra n.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 8


Contraste de Hiptesis
4. Seleccionar el estadstico de prueba apropiado, y establecer la regin crtica (si la
decisin se va a basar en un valor p, no es necesario establecer la regin crtica).
5. Calcular el valor del estadstico de prueba con los datos muestrales.
6. Decidir: rechazar Ho si el estadstico de prueba tiene un valor en la regin crtica (o
si el valor calculado de p es menor o igual que el nivel de significacin deseado );
de otra forma, no rechazar Ho .

2.4. TEST RELACIONADOS CON UNA SLA MEDIA (VARIANZA


CONOCIDA):

Presentamos los test de hiptesis acerca de una sola media de poblacin. Se deben, en
primer lugar, describir las suposiciones sobre las cuales se basa el experimento. El modelo
para la situacin fundamental se centra alrededor de un experimento X1, X 2 ,..., Xn que

representa una muestra aleatoria de una distribucin con media y varianza 2 .

Caso bilateral
Considrese primero la hiptesis:
Ho : = o
H1: o

El estadstico de prueba apropiado deber basarse en la variable aleatoria X . Ya


sabemos, segn el Teorema Central del Lmite, que, al margen de la distribucin de X, la
variable aleatoria X tiene una distribucin aproximadamente Normal con media y

desviacin tpica .
n

X
Conviene normalizar la v.a. =
X: Z N (0,1) .
/ n
Puede, entonces, determinarse una regin crtica con base en el promedio muestral
calculado, X .

(
P z < Z < z
2 2
) =P z

2
<
X
/ n

1 puede utilizarse para escribir una regin
< z =
2

crtica apropiada.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 9


Contraste de Hiptesis
Formalmente, la regin crtica se crea a partir de , la probabilidad de error tipo I.
H 0 : = 0
Contraste bilateral (2 colas)
H1 : 0

Hasta este momento, habr una regin crtica de dos colas para la prueba.

Se necesita una seal de evidencia de dos colas para respaldar H1 . As, dado un valor

calculado X , la prueba formal implica rechazar H0 si el estadstico de prueba calculado:

X 0
z= cae dentro de la regin crtica z < z z < z .
/ n 2 2

Si z < z < z no se rechaza Ho .


2 2

El rechazo de Ho implica la aceptacin de la hiptesis alternativa o .

Con esta definicin de la regin crtica, existir la probabilidad de rechazar Ho (al


caer en la regin crtica) cuando, en realidad = o .

O bien, calculando el p-valor=2P(Z>|z|) y comparndolo con :


p> se acepta la hiptesis nula, y por lo tanto = o

p< se rechaza la hiptesis nula, y por lo tanto o

Caso unilateral
Las pruebas de hiptesis unilaterales acerca de la media, comprenden el mismo estadstico
que el descrito para el caso bilateral. Aqu la regin crtica es de una sola cola de la
distribucin normal.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 10


Contraste de Hiptesis
H 0 : 0
Contraste unilateral (cola de la izquierda)
H1 : < 0

Para H1: < o , la regin crtica est dada por z < z , o bien, p-valor= P(Z < z) .

H 0 : < 0
Contraste unilateral (cola de la derecha)
H1 : 0

Para H1: > o , el rechazo (regin crtica) resulta cuando z < z , o bien, p-valor=

P(z < Z) .

2.1 Ejemplo:
Se supone que un topgrafo realiza como mnimo 42 mediciones diarias. Ante la duda
se hace una comprobacin observando las mediciones durante 10 das seleccionados al azar,
observndose una media de 40. Suponiendo normalidad con varianza 16 en la distribucin de
las mediciones diarias con un nivel de significacin de 0,05 la suposicin inicial. Realizar el
contraste para la media.

Solucin:
Estamos ante un caso de contraste unilateral para la media de una poblacin normal con
varianza conocida.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 11


Contraste de Hiptesis
H 0 : =
0 42
H1 : =
0 42 >

X
=
Sabemos que: Z N (0,1)
/ n

El valor del estadstico z bajo la hiptesis nula es:


X 0 40 42
=z = = -1.581138830
/ n 4 / 10

Para =0,05 en la N(0,1) tenemos que:

P ( Z < z ) = P ( Z < z0,05 ) = 0, 05 z0,05 = 1, 64

Como el valor de nuestro estadstico Z bajo la hiptesis nula cae dentro de la regin de
aceptacin (-1,64<-1,58), se ACEPTA que el topgrafo realiza como mnimo 42 mediciones
diarias.
WOLFRAMALPHA: z-test for population mean

O bien, calculamos el p-valor=P(Z<z)=P(Z<-1,581)=0,05693902 >

2.5. RELACIN CON LA ESTIMACIN DEL INTERVALO DE CONFIANZA:

El procedimiento de test de hiptesis a la inferencia estadstica, est muy relacionado


con la estimacin del intervalo de confianza. Para el caso de una sola media poblacional ,
conociendo 2 , la estructura de ambas pruebas de hiptesis y la estimacin del intervalo de
confianza, se basan en la variable aleatoria:

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 12


Contraste de Hiptesis

X
Z=
n

Resulta, entonces, que la prueba de Ho : = o en contraposicin con H1: o , en


un nivel de significacin , es equivalente a calcular un intervalo de confianza del (1 )%
de y rechazar H0 si o no est dentro del intervalo de confianza. Si o est dentro del
intervalo, no se rechaza la hiptesis.

La equivalencia es muy intuitiva: recordar que con un valor observado X , aceptar H0


con un nivel de significacin , implica que:

X 0
z /2 < < z /2 X z /2 < 0 < X + z /2
/ n n n

Los intervalos de confianza tienen la ventaja frente a los contrastes de hiptesis de que
siempre nos dan una idea de la zona en la que se va a encontrar el verdadero valor del
parmetro poblacional, mientras que en el caso de los test, cuando se rechaza una hiptesis
nula, no se conoce el valor del parmetro en cuestin. Todo lo que se sabe es que es ms
verosmil que el valor del parmetro sea mayor o menor que un valor concreto.

2.6. TEST SOBRE UNA SLA MEDIA (VARIANZA DESCONOCIDA):

La aplicacin de la t de Student tanto en intervalos de confianza como en test de


hiptesis, se desarrolla bajo las siguientes suposiciones: las v.a. X1,..., X n representan una

muestra aleatoria de una distribucin con y


2
desconocidos. Entonces la variable
X
aleatoria tiene una distribucin t de Student con n-1 grados de libertad.
S/ n

La estructura de la prueba es idntica que para el caso de conocida, con la salvedad


de que el valor de en el estadstico de prueba se reemplaza por la estimacin calculada S, y
la distribucin normal se reemplaza por una distribucin t.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 13


Contraste de Hiptesis
Caso bilateral
Ho : = o
Es decir, para la hiptesis bilateral: el rechazo de Ho , con un nivel de
H1: o
X 0
significacin , resulta cuando una estadstica t calculada: t = excede a t ,n 1 o es
S/ n 2

menor que t ,n 1 .
2

H 0 : = 0
Contraste bilateral (2 colas)
H1 : 0

O bien, calculando el p-valor=2P(tn-1>|t|) y comparndolo con :

p> se acepta la hiptesis nula, y por lo tanto = o

p< se rechaza la hiptesis nula, y por lo tanto o


Caso unilateral
H 0 : 0
Contraste unilateral (cola de la izquierda)
H1 : < 0

Para H1: < o , la regin crtica est dada por t < t ,n 1 o bien, p-valor=P(tn-1<t)

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 14


Contraste de Hiptesis
H 0 : < 0
Contraste unilateral (cola de la derecha)
H1 : 0

Para H1: > o , el rechazo resulta cuando t > t ,n 1 o bien, p-valor=P(tn-1>t)

Se conserva la equivalencia de la prueba t de Student de bilateral para una sola media,


y el clculo de un intervalo de confianza para , reemplazando por S.

Para muestras pequeas (n<30), con regularidad, es difcil detectar las desviaciones de
una distribucin normal.

2.2 Ejemplo:
Se hace un envo de latas de conserva, de las que se afirma que el peso medio es de 1000 g.
Examinada una muestra de 5 latas, se han obtenido los siguientes datos: media 998 g y
varianza muestral 19,6. Puede mantenerse la hiptesis de que =1000, con un nivel de
significacin =0,05? Obtener un intervalo de confianza al 95% para la media.

Solucin:
H 0 : =1000
Contrastamos la hiptesis
H1 : 1000

Datos:=
n 5;=
X 998 ; =
S2 19, 6; 1 =
0.95

X 0 998 1000
t= = =1,009511502
S/ n 4, 43 / 5

Buscaremos un valor t /2 tal que P ( t /2 < t n 1 < t /2 ) = 1 , siendo n-1 los grados

de confianza.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 15


Contraste de Hiptesis
DERIVE:
#1: NSOLVE(STUDENT(t, 4) = 0.975, t)
#2: t = 2.776445150
EXCEL: =INV.T(0,975;4) 2,77645086, o bien, =INV.T.2C(0,05;4)
SPSS: IDF. T(0.975,4) 2,77644511
Puesto que t = 1,0095<2,7764, podemos ACEPTAR que la media es 1000 g.

WOLFRAMALPHA:
t-interval xbar=998, s=4.43, n=5
Tenemos una muestra pequea (n=5) de varianza desconocida:

S S
I =
X t / 2,n 1 , X + t / 2,n 1
n n

Datos:=
n 5;=
X 998 ; =
S2 19, 6; 1 =
0.95; t 0,025;4
= 2, 776

4.43 4.43
I=0.25 = 998 2.776 ,998 + 2.776 =( 992.48,1003.51)
5 5
1000 ( 992.48,1003.51)
Obviamente se cumple que la media=

2.7. TEST SOBRE DOS MEDIAS


2.7.1. Varianzas conocidas

Los test referidos a dos medias representan un conjunto de herramientas analticas


muy importantes para cientficos e ingenieros.

Dos muestras aleatorias independientes de tamaos n1 y n2, respectivamente, se


obtienen de dos poblaciones con medias y varianzas respectivas 1, 2 y 21 , 22 . Se sabe que

X1 X 2 ( 1 2 )
la v.a. Z = tiene una distribucin N(0,1).
12 22
+
n1 n 2

X1 X 2 ( 1 2 )
Si 1 = 2 = , el estadstico anterior se reduce a: Z = .
1 1
+
n1 n 2

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 16


Contraste de Hiptesis
Estos dos estadsticos sirven como base para el desarrollo de los procedimientos de
prueba sobre dos medias.

La hiptesis nula sobre dos medias puede escribirse:


H 0 : 1 2 = d 0

La alternativa puede ser unilateral o bilateral. De nuevo, la distribucin utilizada es la

distribucin del estadstico de prueba H0. Se calculan los valores X1 y X 2 , para 1 y 2 , el


estadstico de prueba es:

X1 X 2 d 0
z=
12 22
+
n1 n 2

con una regin crtica de dos colas en el caso de una alternativa de dos lados. Es decir, el
rechazo de H0 en favor de H1 : 1 2 d 0 si z > z 2 z < z 2 . Las regiones crticas de
una cola se utilizan en el caso de las alternativas unilaterales.

2.3 Ejemplo

90 teodolitos son llevados a reparar a dos talleres distintos. 50 de ellos al taller A


donde los repararon en un tiempo medio de 150 das con una desviacin tpica de 30 das. Los
40 restantes al taller B, siendo reparados en un tiempo medio de 160 das con una desviacin
tpica de 25 das. Suponiendo que las varianzas son conocidas, se puede considerar que el
taller A es ms adecuado que el B para conseguir una reparacin ms rpida?

Solucin:
Queremos comparar las medias de dos poblaciones normales de varianzas conocidas.
H0 : A B H0 : A B 0
, luego
H1 : A > B H1 : A B > 0

XA XB 150 160
El estadstico de prueba es: = z sustituyendo los valores = 1.72 .
2
2
302 252
+
A B
+
nA nB 50 40

Estableciendo la hiptesis de la distribucin normal.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 17


Contraste de Hiptesis
Calculamos el p-valor = P(Z > -1,72)
DERIVE:
#1: 1-NORMAL(-1.72)
#2: 0.9572837792
EXCEL
=1-DISTR.NORM.ESTAND(-1,72) 0,95728378

WOLFRAMALPHA:
Probability -1.72<x normal distribution, mean=0, sd=1 0,957284
Se ACEPTA la hiptesis nula para cualquier valor de <0,95728378

2.7.2. Varianzas desconocidas


Lo ms frecuente es que se desconozcan las varianzas.

Si el cientfico est dispuesto a asumir que ambas distribuciones son normales, y que
1 = 2 = , puede utilizarse la prueba t combinada (prueba t de dos muestras). El estadstico
de prueba es:

X1 X 2 d 0 S12 (n1 1) + S22 (n 2 1)


t= , siendo S = 2

n1 1 + n 2 1
p
1 1
Sp +
n1 n 2

Se utiliza la distribucin t - Student con n1+n2-2 grados de libertad y la hiptesis


bilateral no se rechaza cuando:
t ,n1 + n 2 2
< t < t ,n1 + n 2 2
2 2

Las alternativas unilaterales sugieren regiones crticas unilaterales.

2.4 Ejemplo:
Se utilizan dos teodolitos para hacer ciertas determinaciones, pretendiendo averiguar si
la media de los errores cometidos con uno y otro es idntica para un nivel de significacin del
5%. Se hacen 20 determinaciones con el teodolito A y se obtiene una media de 0,4 errores y
una desviacin tpica de 0,2 y otras 20 determinaciones con el B obteniendo una media de 0,5
y una desviacin de 0,3. Suponemos que las variables error son normales y con la misma
varianza. Comparar los dos teodolitos.
Solucin:

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 18


Contraste de Hiptesis
Queremos comparar las medias de dos poblaciones normales de varianzas desconocidas pero
iguales y muestras pequeas.
H 0 : A = B H0 : A B = 0
, luego
H1 : A B H1 : A B 0

xA xB
El estadstico de prueba es: = t siendo
1 1
S +
nA nB

(n A 1)S2A + (n B 1)S2B 19 0.22 + 19 0.32


=S2 = = 0.065 con lo cual
(n A 1) + (n B 1) 19 + 19

xA xB 0.4 0.5
=t = = 1.24 y para =0.05, t
,n + n 2
= t 0.025,38 =2
1 1 1 1 2 1 2
S + 0.065 +
nA nB 20 20

DERIVE:
#1: NSOLVE(STUDENT(x, 38) = 0.975, x, Real)
#2: x = 2.024394161
EXCEL: =INV.T.2C(0,05;38) 2,02439415
Como 1.24 < 2 admitimos la hiptesis de igualdad de medias.

O bien, calculando el p-valor=2P(tn-1>|1.24|)=0.2226 > :

WOLFRAMALPHA: 2Probability X>1.24, tudentTdistribution degrees of freedom 38

2.8. PRUEBAS RELACIONADAS CON VARIANZAS


PUEBA PARA UNA MUESTRA
Sea X1, X2,,Xn una muestra aleatoria de una distribucin Normal con media desconocida
y varianza 2 desconocida.
Contemplamos primero el problema de probar la hiptesis nula Ho de que la varianza

poblacional 2 es igual a un valor especificado o2 .

H 0 : 2 = 02

Ahora, se nos plantean tres posibles hiptesis alternativas:


H 1 : 2 < 02 ; H 1 : 2 02 ; H 1 : 2 > 02

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 19


Contraste de Hiptesis
El estadstico apropiado sobre el que se basa la decisin es el estadstico chi-cuadrado
utilizado para determinar un intervalo de confianza para 2 . Por tanto, si suponemos que la
distribucin de la poblacin que est siendo muestreada es normal, el valor chi-cuadrado para
probar 2 = o2 est dado por:

(n 1)S2 (n 1)S2
n 1
2

2 02

donde n es el tamao de la muestra, S2 es la varianza muestral y o2 es el valor de 2 dado


por la hiptesis nula. Si Ho es verdadera, es un valor de la distribucin chi-cuadrado con n
-1 grados de libertad.

Caso bilateral
De aqu que, para una prueba de dos colas con un nivel de significacin , la regin crtica es
< 12 / 2 y > 2 / 2 .

H0 : = 0
Contraste bilateral (2 colas)
H1 : 0

( ( ) (
O bien, calculando el p-valor = 2 mn P n 1 < ,P n 1 >
2 2
) ) y comparndolo con :
p > se acepta la hiptesis nula, y por lo tanto 2 = o2 .

p < se rechaza la hiptesis nula, y por lo tanto 2 o2 .

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 20


Contraste de Hiptesis
Caso unilateral
H0 : 0
Contraste unilateral (cola de la izquierda)
H1 : < 0

Para la alternativa unilateral 2 < o2 , la regin crtica es < 1 .

( )
O bien, calculando el p-valor = P n 1 < y comparndolo con :
2

p > se acepta la hiptesis nula, y por lo tanto 0 .

p < se rechaza la hiptesis nula, y por lo tanto < 0 .

H0 : < 0
Contraste unilateral (cola de la derecha)
H1 : 0

Para la alternativa unilateral 2 > 02 , la regin crtica es > .

( )
O bien, calculando el p-valor = P n 1 > y comparndolo con :
2

p > se acepta la hiptesis nula, y por lo tanto 0 .

p < se rechaza la hiptesis nula, y por lo tanto > 0 .

Para probar una hiptesis acerca de una varianza poblacional, se procede siguiendo
los mismos 6 pasos bsicos indicados antes.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 21


Contraste de Hiptesis
2.5 Ejemplo:
Se desea contrastar si puede suponerse razonablemente que en un nuevo proceso de
fabricacin de filamentos la varianza del grosor es de 4 milmetros. Para ello se toma una
muestra de 28 filamentos que arroja una varianza muestral de 2 milmetro. Suponiendo la
variable normal, contrastar la hiptesis en los grosores de los filamentos a un nivel de
significacin de 0,05.
Solucin:
Se trata de realizar un contraste bilateral para la varianza poblacional con media desconocida
suponiendo normalidad.
H 0 : 2 =02 =4
H1 : 2 02 =4

(n 1)S2
Sabemos que: 2n 1
2

En nuestro caso
(n 1)S2 27 2
= = = 13,5
02 4

Por otro lado, los valores crticos para =0,05 y n=28


=
0.025,27 =
0.975,27
,n 1 1 ,n 1
2 2

2
27

0.975 =
14,57 0.025 =
43,19
Para = 0,05 P( 227 0.975,27
= ) 0.025 0.975,27
= 14,57

Para = 0,05 P( 227 0.025,27


= ) 0.975 0.025,27
= 43,19

siendo 13,5 menor que 14,57 RECHAZAMOS la hiptesis nula de que la varianza del grosor
de los filamentos es 4 milmetros.
EXCEL: = INV.CHICUAD(0,025;27) 14,75; INV.CHICUAD (0,975;27) 43,19
SPSS: IDF.CHISQ(0.025,27) 14,75; IDF.CHISQ(0.975,27) 43,19

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 22


Contraste de Hiptesis

( ( 2
) (
O bien, calculando el p-valor = 2 mn P n 1 < 13.5 ,P n 1 >=
13.5 ))
0.02865 <
2

WOLFRAMALPHA: 2Probability X<13.5, Chi Square Distribution degrees of freedom 27

Al rechazar la hiptesis nula, aceptamos la hiptesis alternativa de que la varianza no es


4; pero podemos plantearnos si es menor que 4 o mayor que 4.
Solucin:
Ahora se trata de realizar un contraste unilateral para la varianza poblacional con media
desconocida suponiendo normalidad.
H 0 : 2 < 02 =4
H1 : 2 02 =4

(n 1)S2 (n 1)S2 27 2
Sabemos que: 2
n 1 = = 13,5
2 02 4
El valor crtico para = 0,05 y n=28
,n 1 =
0.05,27

Para = 0,05 P( 227 0.05


= ) 0.95 =
0.05 40.11

EXCEL: = INV.CHICUAD(0,95;27) 40,11


SPSS: IDF.CHISQ(0.95,27) 40.11
WOLFRAMALPHA: Chi Square Distribution degrees of freedom 27
PERCENTIL 0.95 40.1133
siendo 13,5 menor que 40,11 ACEPTAMOS la hiptesis nula de que la varianza del grosor
de los filamentos es menor de 4 milmetros.

(
O bien, calculando el p-valor = P n 1 >
2
= )
13.5 0.98567 >

WOLFRAMALPHA: 2Probability X<13.5, Chi Square Distribution degrees of freedom 27

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 23


Contraste de Hiptesis
HOMOCEDASTICIDAD
PUEBA PARA DOS MUESTRAS
Considrese ahora el problema de probar la igualdad de varianzas 1 y 2 , de dos
2 2

poblaciones. Esto es, debe probarse la hiptesis nula Ho de que 1 = 2 en contraposicin


2 2

a una de las alternativas usuales 1 < 2 , 1 > 2 1 2 .


2 2 2 2 2 2

Para muestras aleatorias independientes de tamaos respectivos n1 y n2 , de las dos


s12
poblaciones, el valor f para probar 12 = 22 2 2
es la razn f = 2 donde s1 y s2 son las
s2
varianzas calculadas a partir de las dos muestras. Si las dos poblaciones tienen distribuciones
aproximadamente normales, y la hiptesis nula es verdadera, de acuerdo en resultados
obtenidos, la relacin f es un valor de la distribucin F de Snedecor con n1-1 y n2-1 grados de
libertad. Por tanto, las regiones crticas, con nivel de significacin correspondientes a las
alternativas unilaterales 1 < 2 y 1 > 2 son respectivamente, f < F1 ,n 1,n
2 2 2 2
1 2 1
y

f > F ,n1 1,n 2 1 .

Para la alternativa bilateral 1 2 , la regin crtica es f < F


2 2
y
1 ,n1 1,n 2 1
2

f > F .
,n1 1,n 2 1
2

2.6 Ejemplo:
Se pretende comparar dos mtodos de eliminacin de observaciones. Se seleccionan
una muestra de 50 series con observaciones aberrantes y a 25 de ellas se le aplica el mtodo A
y a las otras 25 el B. Los resultados obtenidos son los siguientes:
=
Mtodo A =
: x A 4,3; SA 1, 4

=
Mtodo B : x B 3,=
6; SB 1,1
Suponiendo la variable normal, contrastar la hiptesis de igualdad de medias a un nivel de
significacin = 0,05.
Solucin:
Debemos en primer lugar contrastar la hiptesis de igualdad de varianzas
H 0 : A2 =2B
H1 : 2A 2B

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 24


Contraste de Hiptesis
S2A
2
F , F
SB 1 2 ,n A 1,n B 1 2 ,n A 1,n B 1

S2A 1.42
= 1.62 ( F0.975,24,24 , F0.025,24,24 ) =
= ( 0.44, 2.27 )
S2B 1.12
DERIVE:
#1: NSOLVE(F_DISTRIBUTION(x, 24, 24) = 0.975, x, 0, 1)
#2: x = 0.4405911279
#3: NSOLVE(F_DISTRIBUTION(x, 24, 24) = 0.025, x, 0, 5)
#4: x = 2.269129557
EXCEL:
=INV.F(0,975;24;24) 0,44066972;=INV.F(0,025;24;24) 2,26927455
SPSS:
IDF.F(0.975,24,24) .44;IDF.F(0.025,24,24) 2.27
0,44 < 1,62 < 2,27 y por tanto aceptamos la hiptesis de varianzas iguales.

Contrastamos ahora la igualdad de medias de dos poblaciones normales de varianzas


desconocidas pero iguales y muestras pequeas.
H 0 : A = B
H1 : A B

X A XB
El estadstico de prueba es: = t siendo
1 1 ,n A + n B 2
S + 2

nA nB

(n A 1)S2A + (n B 1)S2B 24 1.42 + 24 1.12


=S2 = = 1.585 con lo cual
(n A 1) + (n B 1) 24 + 24

X A XB 4.3 3.6
= = 1.966 y para = 0,05, t0.025,48=2
1 1 1 1
S + 1.585 +
nA nB 25 25
DERIVE:
#1: NSOLVE(STUDENT(x, 48) = 0.975, x, Real)
#2: x = 2.010634765
SPSS: IDF.T(0.975,48) 2.01
EXCEL: =INV.T.2C(0,05;48) 2,01063472
Como 1.93 < 2 admitimos la hiptesis de igualdad de medias.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 25


Contraste de Hiptesis

2.9. TEST DE BONDAD DE AJUSTE.

Hasta ahora, hemos estudiado aspectos o planteamientos, de un problema que, de


forma general, trata de tomar decisiones sobre alguna caracterstica de la poblacin, a partir
del estudio de una muestra de dicha poblacin.

El problema que vamos a tratar es el de la conformidad de una distribucin


experimental y una distribucin terica; esto es, sustituir la distribucin experimental
(distribucin de la muestra de la poblacin), el histograma, o la distribucin de frecuencias,
por una distribucin terica conocida.
Se trata ahora de ajustar una distribucin experimental a una distribucin terica; es
decir, ver si de los resultados obtenidos en una muestra de una poblacin, podemos suponer
que la poblacin sigue una determinada distribucin.

Segn sea el histograma o la tabla de frecuencias de la muestra, hacemos una


hiptesis sobre la distribucin de la poblacin, que estudiaremos en un test de ajuste que
mide la bondad de ajuste.

Sea n el tamao de la muestra y agrupamos en k clases, y sea ni la frecuencia absoluta


observada de la clase i. A partir de la muestra estimamos los parmetros de la poblacin
terica, y una vez obtenidos stos, calculamos la probabilidad pi que le corresponde a cada
intervalo i. Las correspondientes frecuencias absolutas tericas (esperadas) sern npi.

Sean:
n = tamao de la muestra
k = nmero de clases
ni = frecuencia absoluta de la clase i
pi = probabilidad de cada clase segn la distribucin terica
npi = frecuencia absoluta de cada clase segn la distribucin terica

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 26


Contraste de Hiptesis
h = nmero de parmetros estimados a partir de la muestra
= nmero de grados de libertad

Las frecuencias observadas en la distribucin de una muestra, se emplean para poner a


prueba, la hiptesis de que la poblacin de la cual se ha obtenido la muestra, no difiere en
distribucin, de la de alguna distribucin conocida.

Si la hiptesis fuese cierta, las discrepancias entre las frecuencias absolutas


observadas ni y las frecuencias absolutas esperadas npi, no deben ser grandes.

Supuesta conocida la distribucin de Y. La hiptesis H0 tiene la forma: la poblacin X


de la cual se obtuvo la muestra tiene la misma distribucin que la poblacin Y, formulamos la
hiptesis alternativa H1 las poblaciones X e Y no tienen la misma distribucin.

Una medida de las discrepancias en este sentido, fue estudiada por Pearson
k
( n i np i ) 2
construyendo el siguiente estadstico: D= , y demostr que, para
i =1 np i

n 30 y np i 5 D 2k h 1 , esto es, la variable D sigue una distribucin ji-cuadrado con


= k - h - 1 grados de libertad.

Para aplicar correctamente el test, las frecuencias tericas de las diferentes clases
deben ser mayor o igual que cinco, por lo que en caso de que no lleguen, se agrupan
previamente.

La prueba de bondad (o chi-cuadrado) es una herramienta muy importante, debido


sobre todo a que muchos procedimientos estadsticos en la prctica dependen, en un sentido
terico, de la suposicin de que los datos recogidos surgen de un tipo de distribucin
especfica. La suposicin de normalidad se hace con bastante frecuencia.

( )
Fijado un nivel de significacin , buscamos un valor tal que P 2 =

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 27


Contraste de Hiptesis

D <

Si D < aceptamos la hiptesis H0 de conformidad con el ajuste, siendo las

diferencias n i np i debidas al azar.

Si D rechazamos la hiptesis H0 , las diferencias n i np i son significativas y


por tanto, las distribuciones son distintas.

En el caso de no fijar un valor concreto del valor de , buscaremos el p-valor


p = P(2 D)

Se define como el mnimo nivel de significacin para el que, con los datos de una muestra
concreta, se tendra que rechazar H0

Dp>

En general, cuanto ms prximo a 1 sea p con mayor evidencia se habr de aceptar H0 .


A ttulo orientativo,
Si p>0.05 no existe suficiente evidencia para rechazar H0.
Si 0.01<p<0.05 existe incertidumbre entre rechazar o no rechazar H0.
Si p<0.01 en general deber ser rechazada la hiptesis H0,

Si se ha fijado de antemano un nivel de significacin , se acepta H0, si p>, y se


rechaza H0 si p<

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 28


Contraste de Hiptesis

Observaciones acerca de D.

1 El valor D es ms grande a medida que la distribucin experimental se separa ms de la


terica.

2 El nmero de intervalos se pueden fijar libremente siempre y cuando se verifique np i 5 .

3 En general, D crece si crece el n de intervalos, aunque la distribucin terica se ajuste


bien. Puede darse el caso de rechazar H0 para un n de intervalos k, y aceptar para un n
menor de k intervalos.

2.7 Ejemplo:
De un experimento se ha obtenido la siguiente distribucin de frecuencias:
x <1 1a2 2a3 3a4 4a5 5a6 6a7 7a8 8a9 >9
ni 0 5 19 91 202 217 95 16 5 0

Ajustar a una distribucin normal con un nivel de significacin del 0.05.


Solucin:

ei 1 ei xi ni ni xi ni xi2 240
Histograma de frecuencias

<1 0
200

1-2 1.5 5 7.5 11.25


2-3 2.5 19 47.5 118.75 160

n
3-4 3.5 91 318.5 1114.75
120
4-5 4.5 202 909.0 4090.50
5-6 5.5 217 1193.5 6564.25 80

6-7 6.5 95 617.5 4013.75


40
7-8 7.5 16 120.0 900.00
8-9 8.5 5 42.5 361.25
0

>9 0 0 2 4 6 8 10

650 3256.0 17174.5

Utilizando las frmulas, ya conocidas:

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 29


Contraste de Hiptesis
2
3256 17174.5 3256
X= 5 =
2
= 133
. = 1153
.
650 650 650

650
S= = 1154
. ; resulta una distribucin estimada: N( 5 , 1.154 )
649

( n i npi )
2

e i1 e i ni pi = F(ei ) F(ei 1) ) npi npi

<3 24 0.0415386 27.00 0.333333


3-4 91 0.193093-0.0415386=0.1515544 98.51 0.572531
4-5 202 0.5-0.1515544=0.306907 199.49 0.031581
5-6 217 0.806907-0.5=0.306907 199.50 1.535087
6-7 95 0.958461-0.806907=0.151554 98.50 0.124365
>7 21 1-0.958461=0.041539 27.00 1.333333
sumatorio 650 1 650.00 D=3.930230

Quedan 6 intervalos y hemos calculado 2 parmetros (media y varianza) luego


= k - h - 1 = 6 2 1= 3 grados de libertad.
Para = 0,05 P(32 0.05
= ) 0.05 =
0.05 7.8147 siendo D = 3.9 menor que

0.05 aceptamos la hiptesis de ser el ajuste bueno.


EXCEL: = INV.CHICUAD.CD(0,05;3) 7,8147
O bien, utilizando el p-valor:
EXCEL: = DISTR.CHI(3.9,3) 0.2691 > 0,05 =
WOLFRAMALPHA: Probability 3.9<X, Chi Square Distribution degrees of freedom 3
0.26912275

2.8 Ejemplo:
Se puede admitir la distribucin uniforme de valores angulares en una triangulacin de primer
orden de un pas en la que se ha tomado una muestra de tamao 100 y se han obtenido los
siguientes resultados:
x < 40 40-50 50-60 60-70 >70
ni 16 22 20 19 23

Solucin:
Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 30
Contraste de Hiptesis
Segn la ley de la distribucin uniforme, la probabilidad terica de cada clase es igual a la
unidad dividida por el nmero de clase: 1/5=0,2
x < 40 40-50 50-60 60-70 >70
ni 16 22 20 19 23

pi 0,2 0,2 0,2 0,2 0,2


npi 20 20 20 20 20

( n i npi ) (16 20 ) ( 22 20 ) ( 20 20 ) (19 20 ) ( 23 20 )


2 2 2 2 2 2

20 20 20 20 20
npi

(n i npi ) 2 k
=D = 1,5
i =1 npi
Utilizando el p-valor:
DERIVE: 1 - CHI_SQUARE(1.5,4)= 0.8266414672> 0,05 =
EXCEL: = DISTR.CHI(1,5;4) 0,826641> 0,05 =
SPSS: 1 - CDF.CHISQ(1.5,4) .83> 0,05=
WOLFRAMALPHA: Probability 1.5<X, Chi Square Distribution degrees of freedom 4
0.826641
Aceptamos la hiptesis de ser el ajuste bueno. La diferencia entre la distribucin emprica y
la ley de la distribucin uniforme no es significativa.

Directamente con SPSS creamos la variable v1 y en datos>>ponderar casos


Reconoce la columna de frecuencias absolutas.
Escogemos analizar>>pruebas no paramtricas>>chi cuadrado
Observed Expected
N N Residual
35,0 16 20,0 -4,0
45,0 22 20,0 2,0
55,0 20 20,0 ,0
65,0 19 20,0 -1,0
75,0 23 20,0 3,0
Total 100
Test Statistics
V1
Chi-Square(a) 1,500
df 4
Asymp. Sig. ,827

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 31


Contraste de Hiptesis

Aplicaciones de la Prueba chi-cuadrado:

Test de independencia
Se trata de contrastar si dos variables CUALITATIVAS son independientes (es decir, si
existe relacin entre ellas), o no.

H0: X e Y son independientes


H1: X e Y no son independientes

Supongamos que de una poblacin se han observado dos caractersticas X e Y,


obtenindose una muestra bidimensional (x ,y ), (x ,y ),, (x ,y ). Se desea contrastar si X e
1 1 2 2 n n
Y son independientes o no.

Para ello, se divide el conjunto de los posibles valores de X en r clases disjuntas, A1, A2,, Ar
y los de Y en k clases disjuntas, B1, B2 ,, Bk, obteniendo k r clases con frecuencia nij, dando
lugar a una tabla de doble entrada (tabla de contingencia):

Muestra A1 A2 . Ar Total
B1 n11 n12 n1r n1.
B2 n21 n22 n2r n2.

nk1 nk2 nkr nk.


Bk
Total n.1 n.2 . n.r n

Buscamos las frecuencias esperadas de cada casilla (eij):

pij =P ( A j Bi ) =P ( A j ) P ( Bi ) =
n . j n i.

n n
n . j n i. n i. n . j
Sobre una muestra de tamao n, ser: eij = npij = n =
n n n
Al Igual que para el test de Bondad el estadstico de contraste
(O eij )
2
r k
D =
ij

=j 1 =i 1 eij

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 32


Contraste de Hiptesis
2
nn
n i. . j
k ij
En nuestro caso: D =
r
n
con (k-1)(r-1) grados de libertad
=j 1 =i 1
n i.n . j
n
2.9 Ejemplo:
Hemos preguntado a un grupo de 100 hombres y 100 mujeres si fumaban o no. Existen
diferencias significativas entre ambos sexos?

Hombres Mujeres TOTAL:

Fuma 25 35 60

No fuma 75 65 140

TOTAL: 100 100 200

Solucin:
Qu debera salir, si fueran independientes?

Hombres Mujeres TOTAL:

25 (30) 35(30) 60
Fuma

No fuma 75(70) 65(70) 140

TOTAL: 100 100 200

H : X e Y son independientes
o
H : X e Y no son independientes
1
Comparamos frecuencias observadas (O ) y esperadas (e )
i i

(O eij )
2
r k
D =
ij

=j 1 =i 1 eij

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 33


Contraste de Hiptesis

( 25 30 ) ( 35 30 ) ( 75 70 ) ( 65 70 )
2 2 2 2

D= + + + = 2,38
30 30 70 70
La idea es RECHAZAR la hiptesis, si los valores observados difieren demasiado de los
esperados.

Para ello, utilizamos la prueba de la chi-cuadrado con n=1 grado de libertad.

El nmero de grados de libertad es igual al nmero de frecuencias de casillas que se pueden


rellenar libremente conocidos los totales.

En general, ser el nmero de columnas menos 1 por el nmero de filas menos 1: (c-1)(f-1).
p valor = P( 2n =1 2.38) = 0,12289758

Utilizando el p-valor:
EXCEL: = DISTR.CHI(2,38;1) 0,1228975
SPSS: 1 - CDF.CHISQ(2,38,1) .12
WOLFRAMALPHA: Probability 2.38<X , Chi Square Distribution degrees of freedom 1
0.1228975482
Aceptamos la hiptesis de independencia para cualquier valor de inferior al p-valor.

Aplicaciones de la Prueba Chi-cuadrado:

Prueba de Homogeneidad
Consiste en comprobar si varias muestras de un carcter cualitativo proceden de la misma
poblacin o que las distribuciones de la variable observada es la misma en todas las
poblaciones
H0: m poblaciones homogneas
H1: al menos una poblacin es heterognea

Supongamos que se dispone de m muestras aleatorias simples de otras tantas poblaciones


cuyos tamaos son, respectivamente, n1, n2,, nm. Se desea contrastar si los datos (todos
juntos) provienen de la misma poblacin o, por el contrario, se trata de poblaciones
heterogneas con diferentes distribuciones.

Para ello, se divide el conjunto de los posibles valores de A en r clases disjuntas y nij,
representa el nmero de observaciones de la muestra i que pertenece a la clase Aj segn
vemos en una tabla de doble entrada (tabla de contingencia):

Muestra A1 A2 . Ar Total
1 n11 n12 n1r n1
2 n21 n22 n2r n2

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 34


Contraste de Hiptesis

m nm1 nm2 nmr nm
Total n.1 n.2 . n.r n

La hiptesis de que las m poblaciones son homogneas, se traduce en que cada conjunto Aj
debe tener una probabilidad terica pj, desconocida, pero que no vara de la poblacin i a la
poblacin i
n. j
e=
ij n i p=j n i
n

Al Igual que para el test de Bondad el estadstico de contraste

(O eij )
2
r m
D =
ij

=j 1 =i 1 eij
2
n i n. j
r m

n
n ij
En nuestro caso: D = con (m-1)(r-1) grados de libertad
=j 1 =i 1
n n
i .j

2.10 Ejemplo:
Queremos saber si las cuatro muestras obtenidas proceden de la misma poblacin con
probabilidad del 95%. Es decir, si la proporcin de aprobados y suspensos es homognea.

A B C D

Aprobados 56 60 62 59

No aprobados 44 40 38 41

Solucin:
H : p = p11 = p12 = p13 = p14
o
H : pij distinto de p para algn grupo
1

Se calculan las frecuencias esperadas

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 35


Contraste de Hiptesis
n .1 237
ei1 =n i p1 =n i =100 =59,25 5
n 400

Que coinciden para los cuatro grupos por ser el mismo tamao muestral ni = 100
n .2 163
ei2 =n i p 2 =n i =100 =40,75 5
n 400

Calculamos el valor del estadstico


2
n i n. j

n
n
( 56 59,25 ) ( 60 59,25 ) ( 62 59,25 )
ij 2 2 2

r m
D = = + + +
=j 1 =i 1
n i n. j 59,25 59,25 59,25
n
( 59 59,25) ( 44 40,75) ( 40 40,75) ( 38 40,75) ( 41 40,75)
2 2 2 2 2

+ + + + + =
59,25 40,75 40,75 40,75 40,75
= 0,7765784

Ajustamos a una distribucin de Pearson con 3 grados de libertad

En general, ser el nmero de columnas menos 1 por el nmero de filas menos 1: (c-1)(f-1).

p valor = P ( 2n =3 0,7765784 ) = 0,85506

Utilizando el p-valor:

DERIVE: 1 - CHI_SQUARE(0.7765784,3)= 0.8550605738


EXCEL: = DISTR.CHI(0.7765784;3) 0,8555061

SPSS: 1 - CDF.CHISQ(0.7765784,3) .86


WOLFRAMALPHA:
Probability 0.7765784<X, Chi Square Distribution degrees of freedom 3 0.8550605738

Por ser prximo a 1 ACEPTAMOS la hiptesis y las muestras proceden de la misma


poblacin.

Unidad Docente de Matemticas de la E.T.S.I.T.G.C. de la U.P.M. 36

Вам также может понравиться