10 Tema-09

Estadstica 84
Tema 9: Contraste de hipotesis.

9.1 Introduccion.
El objetivo de este tema es proporcionar metodos que permiten decidir si una hipotesis estadstica
debe o no ser rechazada, en base a los resultados muestrales obtenidos. Para precisar los conceptos de
este tema, vamos a comenzar por denir hipotesis estadstica:
Denici on 1 Una hipotesis estadstica es una armacion relativa a la distribucion de probabilidades
de una o varias variables aleatorias.
En general las hipotesis se reeren a:
El valor de un (o varios) parametro de la distribucion. (Metodos de contraste parametrico).
La igualdad entre las distribuciones de dos o mas variables (Metodos de dise no).
La forma de la distribucion (normal, exponencial, etc). (Metodos no parametricos).
Denici on 2 Un procedimiento de contraste es un metodo para decidir probabilsticamente sobre la
validez o no de la hipotesis, frente a una hipotesis alternativa, a partir de los valores observados en
una muestra.
Vamos a dar ahora un ejemplo no matematico, para introducir facilmente los principales elementos
del contraste de hipotesis.
Ejemplo:
Supongamos un juicio en el que se trata de decidir la culpabilidad o inocencia de un acusado. La
hipotesis inicial (as lo marca la Constitucion) es que el acusado es inocente (estadsticamente, a esta
hipotesis se la denomina hipotesis nula y se representa por H
0
.)
Existe una hipotesis alternativa, que es la culpabilidad del acusado (llamada estadsticamente hipotesis
alternativa y denotada por H
1
.)
El juicio es el procedimiento en el cual se trata de probar la culpabilidad del acusado y la evidencia
debe ser muy fuerte para que se rechace la inocencia (H
0
) en favor de la culpabilidad (H
1
) (no es
suciente con pruebas circunstanciales).
Una vez que se toma una decision (veredicto), pueden estarse cometiendo dos tipos de errores distintos:
Condenar a un inocente (error de tipo I).
Estadstica 85
Absolver a un culpable (error de tipo II).
(naturalmente, tambien puede no estarse cometiendo ning un error).
De los dos errores se considera mas grave el primero y por esa razon, la evidencia para condenar debe
ser muy fuerte. En este sentido, la hipotesis de inocencia es una hipoteis primada, es decir, ambas
hipotesis no estan en igualdad de condiciones.
Estos mismo elementos se encuentran en un contraste estadstico e igualmente, aceptar H
0
solo supone
que no se ha encontrado suciente evidencia en contra. Por esa razon, se dice que la aceptacion de la
hipotesis alternativa es una decision fuerte (pues supone una gran evidencia en su favor).
9.2 Tipos de errores.
Aceptar H
0
Rechazar H
0
H
0
No error Error
cierta tipo I
H
0
Error No error
falsa tipo II
Denici on 3
Se denomina nivel de signicacion del contraste, y se denota por , a la probabilidad de cometer
un error de tipo I:
= p(Rechazar H
0
/H
0
cierta)
Se denomina a la probabilidad de cometer un error de tipo II (y no siempre esta denida, ya
que depende del verdadero valor de la hipotesis alternativa):
= p(Aceptar H
0
/H
0
falsa)
Se denomina potencia del contraste a:
= p(Rechazar H
0
/H
0
falsa)
9.3 Contrastes parametricos.
Nos vamos a centrar ahora en los contrastes parametricos, es decir, aquellos en los que las hipotesis
nula y alternativa se reeren al valor de un parametro (o parametros) de la distribucion (de tipo
conocido, por ejemplo normal, exponencial, etc) de una v.a.
Estadstica 86
Denicion 4 Sea X una v.a. de distribucion conocida que depende del valor de un parametro
desconocido, y sea el espacio de posibles valores del parametro, particionado en dos subconjuntos
0
y
1
.
Consideremos las hipotesis:
H
0
:
0
H
1
:
1
Un test para contrastar la hipotesis H
0
frente a H
1
consiste en dividir el espacio de muestras aleatorias
de tama no n en dos subconjuntos disjuntos, llamados region crtica o de rechazo y region de aceptacion,
de forma que si la muestra de tama no n extrada esta en la region crtica se rechaza H
0
, en favor de
H
1
, y si esta en la region de aceptacion, se acepta H
0
.
Observacion 1 Aceptar H
0
signica solo que no se ha obtenido, probabilsticamente, suciente evi-
dencia en contra.
Tipos de hipotesis en un contraste parametrico.
Se llaman hipotesis simples a las hipoteis en las que se ja un solo valor para el parametro; por ejemplo,
H
0
: =
0
o H
1
: =
1
.
Se llaman hipotesis compuestas a las hipotesis en las que se ja un conjunto de valores para el
parametro; por ejemplo, H
0
:
0
o H
1
:
1
, etc.
Pueden darse todo tipo de combinaciones: H
0
simple frente a H
1
simple, H
0
simple frente a H
1
compuesta, H
0
compuesta frente a H
1
simple, o H
0
compuesta frente a H
1
compuesta.
Las contrastes de la forma
H
0
:
0
frente a H
1
: >
0
o bien
H
0
:
0
frente a H
1
: <
0
se denominan contrastes de hipotesis unilaterales.
Las contrastes de la forma
H
0
: =
0
frente a H
1
: =
0
o bien
H
0
: [
1
,
2
] frente a H
1
: / [
1
,
2
]
Estadstica 87
se denominan contrastes de hipotesis bilaterales.
Antes de entrar con mas detalle en el metodo para realizar contrastes parametricos, vamos a desarrollar
un ejemplo, en el que se pueden observar los principales elementos de un contraste, las relaciones entre
ellos, y algunas propiedades de caracter general de los contrastes de hipotesis.
Ejemplo:
Supongamos que hemos recibido dos lotes de productos en los que la proporcion de defectuosos es
1
2
y
1
4
, pero no sabemos cual corresponde a cada uno. Queremos resolver el contraste:
H
0
: p =
1
4
H
1
: p =
1
2
Para decidir vamos a extraer una muestra aleatoria del lote (1) con 10 elementos. La variable X=
n umero de defectuosos entre los 10, suponiendo H
0
cierta, tiene distribucion B(10,
1
4
). Por el contrario,
si fuese falsa H
0
, X B(10,
1
2
). Las gracas de estas distribuciones son:
Luego observamos que en el caso p = 1/4, es muy probable que X sea menor o igual que 3, mientras
que si p = 1/2, es mas probable que sea mayor o igual que 4.
En efecto:
p =
1
4
p =
1
2
x
i
p(X x
i
) p(X > x
i
)
2 0.525593 0.945312
3 0.775875 0.828125
4 0.921873 0.623047
5 0.980273 0.376953
Podramos tomar como criterio decisorio que si X 3 se acepta H
0
y en caso contrario se rechaza.
Es decir, hemos dividido todas las muestras aleatorias de tama no 10 extradas del lote 1 en dos
Estadstica 88
grupos, aquellas para las que el n umero de defectuosos es menor o igual que 3 (region de aceptacion) y
aquellas para las que el n umero de elementos defectuosos es estrictamente mayor que 3 (region crtica
o de rechazo).
Cuales son las probabilidades de error de tipo I () y de tipo II ()?
= p(rechazar H
0
/H
0
cierta) = p(X > 3/X B(10, 1/4)) = 1 0.775875 = 0.224125
= p(aceptar H
0
/H
0
falsa) = p(X 3/X B(10, 1/2)) = 0.171875
La potencia del contraste es:
= p(rechazar H
0
/H
0
falsa) = p(X > 3/X B(10, 1/2)) = 1 = 0.828125
Que ocurre si modicamos el criterio decisorio (es decir, si variamos las regiones de aceptacion y de
rechazo)? Por ejemplo, vamos a aceptar si X 4 y a rechazar en otro caso. Entonces:
= p(rechazar H
0
/H
0
cierta) = p(X > 4/X B(10, 1/4)) = 1 0.921873 = 0.078127
= p(aceptar H
0
/H
0
falsa) = p(X 4/X B(10, 1/2)) = 0.376953
= p(rechazar H
0
/H
0
falsa) = p(X > 4/X B(10, 1/2)) = 1 = 0.623047
Por tanto, se observan los siguientes hechos, que ocurren en general en todo contraste:
(a) Disminuir supone aumentar y recprocamente.
(b) Si disminuye, lo hace la potencia.
Veamos ahora el efecto de aumentar el tama no de la muestra: vamos a tomar 20 elementos en la
muestra y a considerar Y= n umero de defectuosos entre los 20, que bajo la hipotesis nula tendra una
distribucion B(20, 1/4) y bajo la alternativa sera B(20, 1/2). Las regiones de aceptacion y rechazo se
jan de forma que los valores de resultantes sean aproximadamente los obtenidos en el caso n = 10.
Estadstica 89
p =
1
4
p =
1
2
x
i
p(X x
i
) p(X > x
i
)
6 0.785782 0.942341
7 0.898188 0.868412
8 0.959075 0.748278
Si aceptamos cuando Y 6, entonces = 0.214218 (similar al primer caso para n = 10) y =
0.057659, mucho menor, y si disminuimos tomando como criterio para aceptar que Y 8, =
0.040925 y = 0.251722, que tambien es menor que en el segundo caso para n = 10.
Luego se observa que para valores de similares, aumentar n disminuye , lo cual tambien es general
para los contrastes que vamos a considerar.
Nosotros nos vamos a centrar en contrastes (aunque haremos algunos otros casos, similares al ejemplo
anterior):
H
0
: =
0
H
1
: =
0
H
0
:
0
H
1
: <
0
H
0
:
0
H
1
: >
0
Para este tipo de contrastes se pueden observar en general, los aspectos se nalados en el ejemplo, y
ademas:
- los contrastes H
0
:
0
o H
0
:
0
, puede tratarse como equivalente a un contaste con
H
0
: =
0
, pues es el caso en el que el error de tipo I es (generalmente) mayor.
- en estos contrastes, hay un valor de para cada parametro especicado en la alternativa y es unico
solo cuando la hipotesis alternativa es simple.
Procedimiento para seleccionar la region de aceptacion y de rechazo en un contraste
parametrico.
El procedimiento consiste en considerar un estadstico T(X
1
, X
2
, . . . , X
n
, ) (es decir, que sea funcion
de la muestra y del parametro que se quiere contrastar), cuya distribucion bajo la hipotesis nula
sea conocida, y jado un nivel de signicacion , elegir la region crtica C de manera que p(T
C/H
0
cierta) = y el valor de sea peque no.
Estadstica 90
Muchas veces es posible elegir distintas regiones (o incluso distintos estadsticos) para realizar el
contraste; si se ja un valor de determinado, el mejor contraste sera aquel en el cual es mnimo,
para todos los posibles valores de en la hipotesis alternativa. Hay ocasiones en las que es posible
construir el mejor contraste posible para todos los valores de . En estas ocasiones el estadstico
utilizado esta relacionado con el estimador maximo verosmil del parametro.
Los estadsticos que vamos a utilizar para contrastar los parametros de distribuciones normales, bi-
nomiales, de Poisson y asintoticos (a partir del teorema central del lmite), van a ser de este tipo
y coinciden con los utilizados en la construccion de intervalos de conanza para dichos parametros.
(Tabla de intervalos).
Para estos contrastes, la region crtica tiene la forma siguiente:
Contraste
H
0
:
0
H
1
: <
0
Region crtica C = {T(X
1
, . . . , X
n
, ) <
}
Contraste
H
0
:
0
H
1
: >
0
Region crtica C = {T(X
1
, . . . , X
n
, ) >
1
}
Contraste
H
0
: =
0
H
1
: =
0
Region crtica C = {
/2
T(X
1
, . . . , X
n
, ), o T(X
1
, . . . , X
n
, )
1/2
}
Para otros parametros distintos de los que aparecen en la tabla de intervalos, la region crtica se
selecciona de forma que para jo, sea mnimo.
En el caso de un contraste bilateral, en concreto, se va a tener la siguiente equivalencia:
El resultado del contraste H
0
: =
0
frente a H
1
: =
0
con nivel de signicacion
es aceptar H
0
si y solamente si
0
pertenece al intervalo de conanza para de nivel
(1 ) 100%
Observacion 2 Algunas consideraciones a la hora de realizar un contraste:
(a) Como elegir la hipotesis nula y la hipotesis alternativa. Aunque esta es una cuestion algo subjetiva
(depende del n ultimo del estudio), rige el criterio de simplicidad: nunca se abandona una
hipotesis simple en favor de otra mas complicada, salvo que haya suciente evidencia en contra
(por ejemplo, que un proceso de fabricacion es bueno, frente a que otro posible alternativo sea
mejor).
Como norma, observar que siempre la igualdad corresponde a la hipotesis nula.
Estadstica 91
(b) La seleccion de un nivel de signicaci on es subjetiva, es decir, depende de lo convencidos que
estemos de la verdad de H
0
.
En general no se trabaja con niveles de signicaci on superiores a 0.1 y se consideran usuales 0.05
y 0.01.
Un problema que se puede presentar (en el ejemplo desarrollado antes ocurre) es que sea imposible
jar una region crtica para un determinado (esto ocurre generalmente para variables discretas).
Por estas razones, en lugar de jar un nivel a priori, la decision se toma en funcion del p-valor,
que se dene como:
Denicion 5 Se llama p-valor de un contraste al valor mas peque no del nivel de signicacion
con el que rechazaramos H
0
.
Esto se puede expresar tambien como la probabilidad, bajo la hipotesis nula, de obtener valores
del estadstico mas extremos que el observado (es decir, valores hacia la region de rechazo).
El p-valor indica el grado de evidencia sobre H
0
frente a H
1
conseguido con la muestra.
(c) Por ultimo, un contraste se llama estadsticamente signicativo cuando lleva al rechazo de la
hipotesis nula. Pero que un contraste sea estadsticamente signicativo, no signica que vaya a
existir una gran diferencia entre la hipotesis nula y el verdadero valor del parametro. Por ejemplo,
podra darse el caso de que H
0
: = 0.01, el contraste fuese signicativo (es decir, rechazasemos
H
0
a nivel 0.05), y el verdadero valor del parametro fuese = 0.011.

10 Tema-09

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

10 Tema-09

Загружено:

Авторское право:

Доступные форматы

Estadstica 84

Tema 9: Contraste de hipotesis.

Вам также может понравиться