Академический Документы
Профессиональный Документы
Культура Документы
0
y
1
.
Consideremos las hipotesis:
H
0
:
0
H
1
:
1
Un test para contrastar la hipotesis H
0
frente a H
1
consiste en dividir el espacio de muestras aleatorias
de tama no n en dos subconjuntos disjuntos, llamados region crtica o de rechazo y region de aceptacion,
de forma que si la muestra de tama no n extrada esta en la region crtica se rechaza H
0
, en favor de
H
1
, y si esta en la region de aceptacion, se acepta H
0
.
Observacion 1 Aceptar H
0
signica solo que no se ha obtenido, probabilsticamente, suciente evi-
dencia en contra.
Tipos de hipotesis en un contraste parametrico.
Se llaman hipotesis simples a las hipoteis en las que se ja un solo valor para el parametro; por ejemplo,
H
0
: =
0
o H
1
: =
1
.
Se llaman hipotesis compuestas a las hipotesis en las que se ja un conjunto de valores para el
parametro; por ejemplo, H
0
:
0
o H
1
:
1
, etc.
Pueden darse todo tipo de combinaciones: H
0
simple frente a H
1
simple, H
0
simple frente a H
1
compuesta, H
0
compuesta frente a H
1
simple, o H
0
compuesta frente a H
1
compuesta.
Las contrastes de la forma
H
0
:
0
frente a H
1
: >
0
o bien
H
0
:
0
frente a H
1
: <
0
se denominan contrastes de hipotesis unilaterales.
Las contrastes de la forma
H
0
: =
0
frente a H
1
: =
0
o bien
H
0
: [
1
,
2
] frente a H
1
: / [
1
,
2
]
Estadstica 87
se denominan contrastes de hipotesis bilaterales.
Antes de entrar con mas detalle en el metodo para realizar contrastes parametricos, vamos a desarrollar
un ejemplo, en el que se pueden observar los principales elementos de un contraste, las relaciones entre
ellos, y algunas propiedades de caracter general de los contrastes de hipotesis.
Ejemplo:
Supongamos que hemos recibido dos lotes de productos en los que la proporcion de defectuosos es
1
2
y
1
4
, pero no sabemos cual corresponde a cada uno. Queremos resolver el contraste:
H
0
: p =
1
4
H
1
: p =
1
2
Para decidir vamos a extraer una muestra aleatoria del lote (1) con 10 elementos. La variable X=
n umero de defectuosos entre los 10, suponiendo H
0
cierta, tiene distribucion B(10,
1
4
). Por el contrario,
si fuese falsa H
0
, X B(10,
1
2
). Las gracas de estas distribuciones son:
Luego observamos que en el caso p = 1/4, es muy probable que X sea menor o igual que 3, mientras
que si p = 1/2, es mas probable que sea mayor o igual que 4.
En efecto:
p =
1
4
p =
1
2
x
i
p(X x
i
) p(X > x
i
)
2 0.525593 0.945312
3 0.775875 0.828125
4 0.921873 0.623047
5 0.980273 0.376953
Podramos tomar como criterio decisorio que si X 3 se acepta H
0
y en caso contrario se rechaza.
Es decir, hemos dividido todas las muestras aleatorias de tama no 10 extradas del lote 1 en dos
Estadstica 88
grupos, aquellas para las que el n umero de defectuosos es menor o igual que 3 (region de aceptacion) y
aquellas para las que el n umero de elementos defectuosos es estrictamente mayor que 3 (region crtica
o de rechazo).
Cuales son las probabilidades de error de tipo I () y de tipo II ()?
= p(rechazar H
0
/H
0
cierta) = p(X > 3/X B(10, 1/4)) = 1 0.775875 = 0.224125
= p(aceptar H
0
/H
0
falsa) = p(X 3/X B(10, 1/2)) = 0.171875
La potencia del contraste es:
= p(rechazar H
0
/H
0
falsa) = p(X > 3/X B(10, 1/2)) = 1 = 0.828125
Que ocurre si modicamos el criterio decisorio (es decir, si variamos las regiones de aceptacion y de
rechazo)? Por ejemplo, vamos a aceptar si X 4 y a rechazar en otro caso. Entonces:
= p(rechazar H
0
/H
0
cierta) = p(X > 4/X B(10, 1/4)) = 1 0.921873 = 0.078127
= p(aceptar H
0
/H
0
falsa) = p(X 4/X B(10, 1/2)) = 0.376953
= p(rechazar H
0
/H
0
falsa) = p(X > 4/X B(10, 1/2)) = 1 = 0.623047
Por tanto, se observan los siguientes hechos, que ocurren en general en todo contraste:
(a) Disminuir supone aumentar y recprocamente.
(b) Si disminuye, lo hace la potencia.
Veamos ahora el efecto de aumentar el tama no de la muestra: vamos a tomar 20 elementos en la
muestra y a considerar Y= n umero de defectuosos entre los 20, que bajo la hipotesis nula tendra una
distribucion B(20, 1/4) y bajo la alternativa sera B(20, 1/2). Las regiones de aceptacion y rechazo se
jan de forma que los valores de resultantes sean aproximadamente los obtenidos en el caso n = 10.
Estadstica 89
p =
1
4
p =
1
2
x
i
p(X x
i
) p(X > x
i
)
6 0.785782 0.942341
7 0.898188 0.868412
8 0.959075 0.748278
Si aceptamos cuando Y 6, entonces = 0.214218 (similar al primer caso para n = 10) y =
0.057659, mucho menor, y si disminuimos tomando como criterio para aceptar que Y 8, =
0.040925 y = 0.251722, que tambien es menor que en el segundo caso para n = 10.
Luego se observa que para valores de similares, aumentar n disminuye , lo cual tambien es general
para los contrastes que vamos a considerar.
Nosotros nos vamos a centrar en contrastes (aunque haremos algunos otros casos, similares al ejemplo
anterior):
H
0
: =
0
H
1
: =
0
H
0
:
0
H
1
: <
0
H
0
:
0
H
1
: >
0
Para este tipo de contrastes se pueden observar en general, los aspectos se nalados en el ejemplo, y
ademas:
- los contrastes H
0
:
0
o H
0
:
0
, puede tratarse como equivalente a un contaste con
H
0
: =
0
, pues es el caso en el que el error de tipo I es (generalmente) mayor.
- en estos contrastes, hay un valor de para cada parametro especicado en la alternativa y es unico
solo cuando la hipotesis alternativa es simple.
Procedimiento para seleccionar la region de aceptacion y de rechazo en un contraste
parametrico.
El procedimiento consiste en considerar un estadstico T(X
1
, X
2
, . . . , X
n
, ) (es decir, que sea funcion
de la muestra y del parametro que se quiere contrastar), cuya distribucion bajo la hipotesis nula
sea conocida, y jado un nivel de signicacion , elegir la region crtica C de manera que p(T
C/H
0
cierta) = y el valor de sea peque no.
Estadstica 90
Muchas veces es posible elegir distintas regiones (o incluso distintos estadsticos) para realizar el
contraste; si se ja un valor de determinado, el mejor contraste sera aquel en el cual es mnimo,
para todos los posibles valores de en la hipotesis alternativa. Hay ocasiones en las que es posible
construir el mejor contraste posible para todos los valores de . En estas ocasiones el estadstico
utilizado esta relacionado con el estimador maximo verosmil del parametro.
Los estadsticos que vamos a utilizar para contrastar los parametros de distribuciones normales, bi-
nomiales, de Poisson y asintoticos (a partir del teorema central del lmite), van a ser de este tipo
y coinciden con los utilizados en la construccion de intervalos de conanza para dichos parametros.
(Tabla de intervalos).
Para estos contrastes, la region crtica tiene la forma siguiente:
Contraste
H
0
:
0
H
1
: <
0
Region crtica C = {T(X
1
, . . . , X
n
, ) <
}
Contraste
H
0
:
0
H
1
: >
0
Region crtica C = {T(X
1
, . . . , X
n
, ) >
1
}
Contraste
H
0
: =
0
H
1
: =
0
Region crtica C = {
/2
T(X
1
, . . . , X
n
, ), o T(X
1
, . . . , X
n
, )
1/2
}
Para otros parametros distintos de los que aparecen en la tabla de intervalos, la region crtica se
selecciona de forma que para jo, sea mnimo.
En el caso de un contraste bilateral, en concreto, se va a tener la siguiente equivalencia:
El resultado del contraste H
0
: =
0
frente a H
1
: =
0
con nivel de signicacion
es aceptar H
0
si y solamente si
0
pertenece al intervalo de conanza para de nivel
(1 ) 100%
Observacion 2 Algunas consideraciones a la hora de realizar un contraste:
(a) Como elegir la hipotesis nula y la hipotesis alternativa. Aunque esta es una cuestion algo subjetiva
(depende del n ultimo del estudio), rige el criterio de simplicidad: nunca se abandona una
hipotesis simple en favor de otra mas complicada, salvo que haya suciente evidencia en contra
(por ejemplo, que un proceso de fabricacion es bueno, frente a que otro posible alternativo sea
mejor).
Como norma, observar que siempre la igualdad corresponde a la hipotesis nula.
Estadstica 91
(b) La seleccion de un nivel de signicaci on es subjetiva, es decir, depende de lo convencidos que
estemos de la verdad de H
0
.
En general no se trabaja con niveles de signicaci on superiores a 0.1 y se consideran usuales 0.05
y 0.01.
Un problema que se puede presentar (en el ejemplo desarrollado antes ocurre) es que sea imposible
jar una region crtica para un determinado (esto ocurre generalmente para variables discretas).
Por estas razones, en lugar de jar un nivel a priori, la decision se toma en funcion del p-valor,
que se dene como:
Denicion 5 Se llama p-valor de un contraste al valor mas peque no del nivel de signicacion
con el que rechazaramos H
0
.
Esto se puede expresar tambien como la probabilidad, bajo la hipotesis nula, de obtener valores
del estadstico mas extremos que el observado (es decir, valores hacia la region de rechazo).
El p-valor indica el grado de evidencia sobre H
0
frente a H
1
conseguido con la muestra.
(c) Por ultimo, un contraste se llama estadsticamente signicativo cuando lleva al rechazo de la
hipotesis nula. Pero que un contraste sea estadsticamente signicativo, no signica que vaya a
existir una gran diferencia entre la hipotesis nula y el verdadero valor del parametro. Por ejemplo,
podra darse el caso de que H
0
: = 0.01, el contraste fuese signicativo (es decir, rechazasemos
H
0
a nivel 0.05), y el verdadero valor del parametro fuese = 0.011.